**************************************************************************************************** 2 2 **************************************************************************************************** 2 2 **************************************************************************************************** 2 2 **************************************************************************************************** 2 2 **************************************************************************************************** 2 2 **************************************************************************************************** 2 2 loading annotations into memory... loading annotations into memory...loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... Done (t=1.78s) creating index... Done (t=1.79s) creating index... Done (t=1.79s) creating index... Done (t=1.82s) creating index... Done (t=1.83s) creating index... Done (t=1.83s) creating index... index created! index created! index created! index created! index created! index created! Filtered 1978 from ./data/mdetr_annotations/finetune_refcocog_train.json Filtered 1978 from ./data/mdetr_annotations/finetune_refcocog_train.json Filtered 1978 from ./data/mdetr_annotations/finetune_refcocog_train.json Filtered 1978 from ./data/mdetr_annotations/finetune_refcocog_train.json Filtered 1978 from ./data/mdetr_annotations/finetune_refcocog_train.json Filtered 1978 from ./data/mdetr_annotations/finetune_refcocog_train.json loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... Done (t=4.12s) creating index... Done (t=4.17s) creating index... Done (t=4.15s) creating index... Done (t=4.18s) creating index... Done (t=4.20s) creating index... Done (t=4.20s) creating index... index created! index created! index created! index created! index created! index created! **************************************************************************************************** 2 2 loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... **************************************************************************************************** 2 2 loading annotations into memory... Done (t=2.41s) creating index... index created! Filtered 1978 from ./data/mdetr_annotations/finetune_refcocog_train.json loading annotations into memory... Done (t=2.27s) creating index... index created! Filtered 1978 from ./data/mdetr_annotations/finetune_refcocog_train.json loading annotations into memory... Done (t=5.46s) creating index... index created! loading annotations into memory... Done (t=5.64s) creating index... index created! loading annotations into memory... Done (t=17.03s) creating index... Done (t=17.09s) creating index... Done (t=17.11s) creating index... Done (t=17.22s) creating index... Done (t=17.23s) creating index... Done (t=17.34s) creating index... index created! index created! index created! index created! index created! index created! loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... loading annotations into memory... Done (t=1.04s) creating index... Done (t=0.91s) creating index... Done (t=1.00s) creating index... Done (t=0.90s) creating index... Done (t=0.90s) creating index... Done (t=0.89s) creating index... index created! index created! index created! index created! index created! index created! Done (t=21.62s) creating index... index created! Done (t=22.56s) creating index... loading annotations into memory... index created! Done (t=1.40s) creating index... index created! loading annotations into memory... Done (t=1.45s) creating index... index created! normal_vcr 196438 normal_vcr 196438 normal_vcr 196438 normal_vcr 196438 normal_vcr 196438 normal_vcr 196438 normal_vcr 196438 normal_vcr 196438 normal_vcr 53816 normal_vcr 53816 normal_vcr 53816 normal_vcr 53816 normal_vcr 53816 normal_vcr 53816 normal_vcr 53816 normal_vcr 53816 normal_vcr 41179 #################### [, , , , , , , ] #################### #################### len = 78534 #################### #################### len = 148915 #################### #################### len = 77396 #################### #################### len = 18057 #################### #################### len = 157712 #################### #################### len = 196438 #################### #################### len = 53816 #################### #################### len = 41179 #################### normal_vcr 41179 #################### [, , , , , , , ] #################### #################### len = 78534 #################### #################### len = 148915 #################### #################### len = 77396 #################### #################### len = 18057 #################### #################### len = 157712 #################### #################### len = 196438 #################### #################### len = 53816 #################### #################### len = 41179 #################### all trainable parameters all trainable parameters model.embed_tokens.weight model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weightmodel.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weightmodel.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weightmodel.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weightmodel.layers.0.mlp.up_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.0.input_layernorm.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.0.post_attention_layernorm.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.1.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weightmodel.layers.1.self_attn.k_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weightmodel.layers.1.mlp.down_proj.weight model.layers.3.self_attn.q_proj.weight model.layers.1.mlp.up_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weightmodel.layers.1.input_layernorm.weight model.layers.3.mlp.gate_proj.weight model.layers.1.post_attention_layernorm.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weightmodel.layers.2.self_attn.q_proj.weight model.layers.3.post_attention_layernorm.weight model.layers.2.self_attn.k_proj.weight model.layers.4.self_attn.q_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weightmodel.layers.2.mlp.gate_proj.weight model.layers.4.mlp.up_proj.weight model.layers.2.mlp.down_proj.weightmodel.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.2.mlp.up_proj.weight model.layers.5.self_attn.q_proj.weight model.layers.2.input_layernorm.weightmodel.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.2.post_attention_layernorm.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.3.self_attn.q_proj.weight model.layers.5.mlp.up_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.5.input_layernorm.weight model.layers.3.self_attn.v_proj.weight model.layers.5.post_attention_layernorm.weight model.layers.3.self_attn.o_proj.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.3.mlp.down_proj.weightmodel.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weightmodel.layers.3.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weightmodel.layers.4.self_attn.q_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weightmodel.layers.4.self_attn.v_proj.weight model.layers.7.mlp.up_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.4.mlp.gate_proj.weight model.layers.8.self_attn.q_proj.weight model.layers.4.mlp.down_proj.weightmodel.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.4.mlp.up_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.4.input_layernorm.weightmodel.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.4.post_attention_layernorm.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weightmodel.layers.5.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.5.self_attn.v_proj.weightmodel.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.5.mlp.gate_proj.weightmodel.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weightmodel.layers.5.mlp.down_proj.weight model.layers.10.self_attn.q_proj.weight model.layers.5.mlp.up_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.5.input_layernorm.weightmodel.layers.10.self_attn.o_proj.weight model.layers.5.post_attention_layernorm.weightmodel.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.6.self_attn.q_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weightmodel.layers.6.self_attn.k_proj.weight model.layers.11.self_attn.q_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weightmodel.layers.6.self_attn.o_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weightmodel.layers.6.mlp.down_proj.weight model.layers.11.input_layernorm.weight model.layers.6.mlp.up_proj.weight model.layers.11.post_attention_layernorm.weight model.layers.6.input_layernorm.weightmodel.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.6.post_attention_layernorm.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.7.self_attn.q_proj.weightmodel.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.12.input_layernorm.weight model.layers.7.self_attn.v_proj.weight model.layers.12.post_attention_layernorm.weight model.layers.7.self_attn.o_proj.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.7.mlp.down_proj.weightmodel.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weightmodel.layers.7.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.8.self_attn.q_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weightmodel.layers.8.self_attn.v_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weightmodel.layers.8.self_attn.o_proj.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weightmodel.layers.8.mlp.gate_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weightmodel.layers.8.mlp.down_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.8.mlp.up_proj.weightmodel.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.8.input_layernorm.weightmodel.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.9.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.9.self_attn.o_proj.weightmodel.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.9.mlp.gate_proj.weight model.layers.16.post_attention_layernorm.weight model.layers.9.mlp.down_proj.weightmodel.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weightmodel.layers.9.mlp.up_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weightmodel.layers.9.input_layernorm.weight model.layers.17.mlp.down_proj.weightmodel.layers.9.post_attention_layernorm.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.17.post_attention_layernorm.weight model.layers.10.self_attn.k_proj.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weightmodel.layers.10.self_attn.v_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weightmodel.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weightmodel.layers.10.mlp.down_proj.weight model.layers.18.post_attention_layernorm.weight model.layers.10.mlp.up_proj.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.10.input_layernorm.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.10.post_attention_layernorm.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weightmodel.layers.11.self_attn.q_proj.weight model.layers.19.input_layernorm.weight model.layers.11.self_attn.k_proj.weight model.layers.19.post_attention_layernorm.weight model.layers.11.self_attn.v_proj.weight model.layers.20.self_attn.q_proj.weight model.layers.11.self_attn.o_proj.weightmodel.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weightmodel.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.11.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.11.input_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.11.post_attention_layernorm.weightmodel.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weightmodel.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.21.mlp.up_proj.weight model.layers.12.self_attn.o_proj.weightmodel.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.12.mlp.gate_proj.weightmodel.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weightmodel.layers.12.mlp.down_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.12.mlp.up_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.12.input_layernorm.weight model.layers.22.mlp.up_proj.weight model.layers.12.post_attention_layernorm.weightmodel.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weightmodel.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.13.self_attn.k_proj.weightmodel.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.13.mlp.gate_proj.weightmodel.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.13.mlp.down_proj.weight model.layers.24.self_attn.q_proj.weight model.layers.13.mlp.up_proj.weightmodel.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.13.input_layernorm.weight model.layers.24.mlp.gate_proj.weight model.layers.13.post_attention_layernorm.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.14.self_attn.q_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weightmodel.layers.14.self_attn.k_proj.weight model.layers.25.self_attn.q_proj.weightmodel.layers.14.self_attn.v_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.14.self_attn.o_proj.weightmodel.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.14.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.14.mlp.up_proj.weightmodel.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.14.input_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.14.post_attention_layernorm.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weightmodel.layers.15.self_attn.q_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.15.self_attn.k_proj.weightmodel.layers.26.mlp.down_proj.weight model.layers.15.self_attn.v_proj.weightmodel.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.15.self_attn.o_proj.weight model.layers.26.post_attention_layernorm.weight model.layers.15.mlp.gate_proj.weightmodel.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.15.mlp.down_proj.weightmodel.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weightmodel.layers.15.mlp.up_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.15.input_layernorm.weightmodel.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.15.post_attention_layernorm.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weightmodel.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weightmodel.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.16.mlp.down_proj.weightmodel.layers.28.mlp.up_proj.weight model.layers.16.mlp.up_proj.weightmodel.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.16.input_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.16.post_attention_layernorm.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.17.self_attn.q_proj.weight model.layers.29.mlp.gate_proj.weightmodel.layers.17.self_attn.k_proj.weight model.layers.29.mlp.down_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.29.mlp.up_proj.weight model.layers.17.self_attn.o_proj.weightmodel.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.17.mlp.gate_proj.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weightmodel.layers.17.mlp.down_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.17.mlp.up_proj.weightmodel.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weightmodel.layers.17.input_layernorm.weight model.layers.30.mlp.down_proj.weight model.layers.17.post_attention_layernorm.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.30.post_attention_layernorm.weight model.layers.18.self_attn.k_proj.weight model.layers.31.self_attn.q_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.18.self_attn.o_proj.weightmodel.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.18.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.18.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.layers.18.input_layernorm.weight model.norm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.layers.19.self_attn.v_proj.weightmodel.spi_module.mlvl_fuse.input_conv.0.bias model.layers.19.self_attn.o_proj.weightmodel.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.biasmodel.layers.19.mlp.gate_proj.weight model.spi_module.mlvl_fuse.input_conv.3.weight model.layers.19.mlp.down_proj.weightmodel.spi_module.mlvl_fuse.input_conv.3.bias model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.layers.19.post_attention_layernorm.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weightmodel.layers.20.self_attn.q_proj.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.layers.20.self_attn.o_proj.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.layers.20.mlp.up_proj.weightmodel.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.layers.20.input_layernorm.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.layers.20.post_attention_layernorm.weight model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.layers.21.self_attn.q_proj.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.layers.21.self_attn.k_proj.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.layers.21.self_attn.v_proj.weight model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.layers.21.self_attn.o_proj.weightmodel.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.biasmodel.layers.21.input_layernorm.weight model.spi_module.roi_align.pconvs.1.weight model.layers.21.post_attention_layernorm.weightmodel.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.layers.22.self_attn.q_proj.weightmodel.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.layers.22.self_attn.k_proj.weightmodel.spi_module.roi_align.pconvs.3.bias model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.layers.22.mlp.gate_proj.weightmodel.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.layers.22.mlp.down_proj.weight model.spi_module.roi_align.pos_embedd.3.weight model.layers.22.mlp.up_proj.weight model.spi_module.roi_align.pos_embedd.3.bias model.layers.22.input_layernorm.weight model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.layers.22.post_attention_layernorm.weight model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.layers.23.self_attn.q_proj.weightmodel.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weightmodel.mm_projector.weight model.mm_projector.bias model.layers.23.self_attn.o_proj.weight lm_head.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ normal_vcr 41179 #################### [, , , , , , , ] #################### #################### len = 78534 #################### #################### len = 148915 #################### #################### len = 77396 #################### #################### len = 18057 #################### #################### len = 157712 #################### #################### len = 196438 #################### #################### len = 53816 #################### #################### len = 41179 #################### normal_vcr 41179 #################### [, , , , , , , ] #################### #################### len = 78534 #################### #################### len = 148915 #################### #################### len = 77396 #################### #################### len = 18057 #################### #################### len = 157712 #################### #################### len = 196438 #################### #################### len = 53816 #################### #################### len = 41179 #################### all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ normal_vcr 41179 #################### [, , , , , , , ] #################### #################### len = 78534 #################### #################### len = 148915 #################### #################### len = 77396 #################### #################### len = 18057 #################### #################### len = 157712 #################### #################### len = 196438 #################### #################### len = 53816 #################### #################### len = 41179 #################### all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ normal_vcr 41179 #################### [, , , , , , , ] #################### #################### len = 78534 #################### #################### len = 148915 #################### #################### len = 77396 #################### #################### len = 18057 #################### #################### len = 157712 #################### #################### len = 196438 #################### #################### len = 53816 #################### #################### len = 41179 #################### all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ normal_vcr 41179 #################### [, , , , , , , ] #################### #################### len = 78534 #################### #################### len = 148915 #################### #################### len = 77396 #################### #################### len = 18057 #################### #################### len = 157712 #################### #################### len = 196438 #################### #################### len = 53816 #################### #################### len = 41179 #################### all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ normal_vcr 41179 #################### [, , , , , , , ] #################### #################### len = 78534 #################### #################### len = 148915 #################### #################### len = 77396 #################### #################### len = 18057 #################### #################### len = 157712 #################### #################### len = 196438 #################### #################### len = 53816 #################### #################### len = 41179 #################### all trainable parameters model.embed_tokens.weight model.layers.0.self_attn.q_proj.weight model.layers.0.self_attn.k_proj.weight model.layers.0.self_attn.v_proj.weight model.layers.0.self_attn.o_proj.weight model.layers.0.mlp.gate_proj.weight model.layers.0.mlp.down_proj.weight model.layers.0.mlp.up_proj.weight model.layers.0.input_layernorm.weight model.layers.0.post_attention_layernorm.weight model.layers.1.self_attn.q_proj.weight model.layers.1.self_attn.k_proj.weight model.layers.1.self_attn.v_proj.weight model.layers.1.self_attn.o_proj.weight model.layers.1.mlp.gate_proj.weight model.layers.1.mlp.down_proj.weight model.layers.1.mlp.up_proj.weight model.layers.1.input_layernorm.weight model.layers.1.post_attention_layernorm.weight model.layers.2.self_attn.q_proj.weight model.layers.2.self_attn.k_proj.weight model.layers.2.self_attn.v_proj.weight model.layers.2.self_attn.o_proj.weight model.layers.2.mlp.gate_proj.weight model.layers.2.mlp.down_proj.weight model.layers.2.mlp.up_proj.weight model.layers.2.input_layernorm.weight model.layers.2.post_attention_layernorm.weight model.layers.3.self_attn.q_proj.weight model.layers.3.self_attn.k_proj.weight model.layers.3.self_attn.v_proj.weight model.layers.3.self_attn.o_proj.weight model.layers.3.mlp.gate_proj.weight model.layers.3.mlp.down_proj.weight model.layers.3.mlp.up_proj.weight model.layers.3.input_layernorm.weight model.layers.3.post_attention_layernorm.weight model.layers.4.self_attn.q_proj.weight model.layers.4.self_attn.k_proj.weight model.layers.4.self_attn.v_proj.weight model.layers.4.self_attn.o_proj.weight model.layers.4.mlp.gate_proj.weight model.layers.4.mlp.down_proj.weight model.layers.4.mlp.up_proj.weight model.layers.4.input_layernorm.weight model.layers.4.post_attention_layernorm.weight model.layers.5.self_attn.q_proj.weight model.layers.5.self_attn.k_proj.weight model.layers.5.self_attn.v_proj.weight model.layers.5.self_attn.o_proj.weight model.layers.5.mlp.gate_proj.weight model.layers.5.mlp.down_proj.weight model.layers.5.mlp.up_proj.weight model.layers.5.input_layernorm.weight model.layers.5.post_attention_layernorm.weight model.layers.6.self_attn.q_proj.weight model.layers.6.self_attn.k_proj.weight model.layers.6.self_attn.v_proj.weight model.layers.6.self_attn.o_proj.weight model.layers.6.mlp.gate_proj.weight model.layers.6.mlp.down_proj.weight model.layers.6.mlp.up_proj.weight model.layers.6.input_layernorm.weight model.layers.6.post_attention_layernorm.weight model.layers.7.self_attn.q_proj.weight model.layers.7.self_attn.k_proj.weight model.layers.7.self_attn.v_proj.weight model.layers.7.self_attn.o_proj.weight model.layers.7.mlp.gate_proj.weight model.layers.7.mlp.down_proj.weight model.layers.7.mlp.up_proj.weight model.layers.7.input_layernorm.weight model.layers.7.post_attention_layernorm.weight model.layers.8.self_attn.q_proj.weight model.layers.8.self_attn.k_proj.weight model.layers.8.self_attn.v_proj.weight model.layers.8.self_attn.o_proj.weight model.layers.8.mlp.gate_proj.weight model.layers.8.mlp.down_proj.weight model.layers.8.mlp.up_proj.weight model.layers.8.input_layernorm.weight model.layers.8.post_attention_layernorm.weight model.layers.9.self_attn.q_proj.weight model.layers.9.self_attn.k_proj.weight model.layers.9.self_attn.v_proj.weight model.layers.9.self_attn.o_proj.weight model.layers.9.mlp.gate_proj.weight model.layers.9.mlp.down_proj.weight model.layers.9.mlp.up_proj.weight model.layers.9.input_layernorm.weight model.layers.9.post_attention_layernorm.weight model.layers.10.self_attn.q_proj.weight model.layers.10.self_attn.k_proj.weight model.layers.10.self_attn.v_proj.weight model.layers.10.self_attn.o_proj.weight model.layers.10.mlp.gate_proj.weight model.layers.10.mlp.down_proj.weight model.layers.10.mlp.up_proj.weight model.layers.10.input_layernorm.weight model.layers.10.post_attention_layernorm.weight model.layers.11.self_attn.q_proj.weight model.layers.11.self_attn.k_proj.weight model.layers.11.self_attn.v_proj.weight model.layers.11.self_attn.o_proj.weight model.layers.11.mlp.gate_proj.weight model.layers.11.mlp.down_proj.weight model.layers.11.mlp.up_proj.weight model.layers.11.input_layernorm.weight model.layers.11.post_attention_layernorm.weight model.layers.12.self_attn.q_proj.weight model.layers.12.self_attn.k_proj.weight model.layers.12.self_attn.v_proj.weight model.layers.12.self_attn.o_proj.weight model.layers.12.mlp.gate_proj.weight model.layers.12.mlp.down_proj.weight model.layers.12.mlp.up_proj.weight model.layers.12.input_layernorm.weight model.layers.12.post_attention_layernorm.weight model.layers.13.self_attn.q_proj.weight model.layers.13.self_attn.k_proj.weight model.layers.13.self_attn.v_proj.weight model.layers.13.self_attn.o_proj.weight model.layers.13.mlp.gate_proj.weight model.layers.13.mlp.down_proj.weight model.layers.13.mlp.up_proj.weight model.layers.13.input_layernorm.weight model.layers.13.post_attention_layernorm.weight model.layers.14.self_attn.q_proj.weight model.layers.14.self_attn.k_proj.weight model.layers.14.self_attn.v_proj.weight model.layers.14.self_attn.o_proj.weight model.layers.14.mlp.gate_proj.weight model.layers.14.mlp.down_proj.weight model.layers.14.mlp.up_proj.weight model.layers.14.input_layernorm.weight model.layers.14.post_attention_layernorm.weight model.layers.15.self_attn.q_proj.weight model.layers.15.self_attn.k_proj.weight model.layers.15.self_attn.v_proj.weight model.layers.15.self_attn.o_proj.weight model.layers.15.mlp.gate_proj.weight model.layers.15.mlp.down_proj.weight model.layers.15.mlp.up_proj.weight model.layers.15.input_layernorm.weight model.layers.15.post_attention_layernorm.weight model.layers.16.self_attn.q_proj.weight model.layers.16.self_attn.k_proj.weight model.layers.16.self_attn.v_proj.weight model.layers.16.self_attn.o_proj.weight model.layers.16.mlp.gate_proj.weight model.layers.16.mlp.down_proj.weight model.layers.16.mlp.up_proj.weight model.layers.16.input_layernorm.weight model.layers.16.post_attention_layernorm.weight model.layers.17.self_attn.q_proj.weight model.layers.17.self_attn.k_proj.weight model.layers.17.self_attn.v_proj.weight model.layers.17.self_attn.o_proj.weight model.layers.17.mlp.gate_proj.weight model.layers.17.mlp.down_proj.weight model.layers.17.mlp.up_proj.weight model.layers.17.input_layernorm.weight model.layers.17.post_attention_layernorm.weight model.layers.18.self_attn.q_proj.weight model.layers.18.self_attn.k_proj.weight model.layers.18.self_attn.v_proj.weight model.layers.18.self_attn.o_proj.weight model.layers.18.mlp.gate_proj.weight model.layers.18.mlp.down_proj.weight model.layers.18.mlp.up_proj.weight model.layers.18.input_layernorm.weight model.layers.18.post_attention_layernorm.weight model.layers.19.self_attn.q_proj.weight model.layers.19.self_attn.k_proj.weight model.layers.19.self_attn.v_proj.weight model.layers.19.self_attn.o_proj.weight model.layers.19.mlp.gate_proj.weight model.layers.19.mlp.down_proj.weight model.layers.19.mlp.up_proj.weight model.layers.19.input_layernorm.weight model.layers.19.post_attention_layernorm.weight model.layers.20.self_attn.q_proj.weight model.layers.20.self_attn.k_proj.weight model.layers.20.self_attn.v_proj.weight model.layers.20.self_attn.o_proj.weight model.layers.20.mlp.gate_proj.weight model.layers.20.mlp.down_proj.weight model.layers.20.mlp.up_proj.weight model.layers.20.input_layernorm.weight model.layers.20.post_attention_layernorm.weight model.layers.21.self_attn.q_proj.weight model.layers.21.self_attn.k_proj.weight model.layers.21.self_attn.v_proj.weight model.layers.21.self_attn.o_proj.weight model.layers.21.mlp.gate_proj.weight model.layers.21.mlp.down_proj.weight model.layers.21.mlp.up_proj.weight model.layers.21.input_layernorm.weight model.layers.21.post_attention_layernorm.weight model.layers.22.self_attn.q_proj.weight model.layers.22.self_attn.k_proj.weight model.layers.22.self_attn.v_proj.weight model.layers.22.self_attn.o_proj.weight model.layers.22.mlp.gate_proj.weight model.layers.22.mlp.down_proj.weight model.layers.22.mlp.up_proj.weight model.layers.22.input_layernorm.weight model.layers.22.post_attention_layernorm.weight model.layers.23.self_attn.q_proj.weight model.layers.23.self_attn.k_proj.weight model.layers.23.self_attn.v_proj.weight model.layers.23.self_attn.o_proj.weight model.layers.23.mlp.gate_proj.weight model.layers.23.mlp.down_proj.weight model.layers.23.mlp.up_proj.weight model.layers.23.input_layernorm.weight model.layers.23.post_attention_layernorm.weight model.layers.24.self_attn.q_proj.weight model.layers.24.self_attn.k_proj.weight model.layers.24.self_attn.v_proj.weight model.layers.24.self_attn.o_proj.weight model.layers.24.mlp.gate_proj.weight model.layers.24.mlp.down_proj.weight model.layers.24.mlp.up_proj.weight model.layers.24.input_layernorm.weight model.layers.24.post_attention_layernorm.weight model.layers.25.self_attn.q_proj.weight model.layers.25.self_attn.k_proj.weight model.layers.25.self_attn.v_proj.weight model.layers.25.self_attn.o_proj.weight model.layers.25.mlp.gate_proj.weight model.layers.25.mlp.down_proj.weight model.layers.25.mlp.up_proj.weight model.layers.25.input_layernorm.weight model.layers.25.post_attention_layernorm.weight model.layers.26.self_attn.q_proj.weight model.layers.26.self_attn.k_proj.weight model.layers.26.self_attn.v_proj.weight model.layers.26.self_attn.o_proj.weight model.layers.26.mlp.gate_proj.weight model.layers.26.mlp.down_proj.weight model.layers.26.mlp.up_proj.weight model.layers.26.input_layernorm.weight model.layers.26.post_attention_layernorm.weight model.layers.27.self_attn.q_proj.weight model.layers.27.self_attn.k_proj.weight model.layers.27.self_attn.v_proj.weight model.layers.27.self_attn.o_proj.weight model.layers.27.mlp.gate_proj.weight model.layers.27.mlp.down_proj.weight model.layers.27.mlp.up_proj.weight model.layers.27.input_layernorm.weight model.layers.27.post_attention_layernorm.weight model.layers.28.self_attn.q_proj.weight model.layers.28.self_attn.k_proj.weight model.layers.28.self_attn.v_proj.weight model.layers.28.self_attn.o_proj.weight model.layers.28.mlp.gate_proj.weight model.layers.28.mlp.down_proj.weight model.layers.28.mlp.up_proj.weight model.layers.28.input_layernorm.weight model.layers.28.post_attention_layernorm.weight model.layers.29.self_attn.q_proj.weight model.layers.29.self_attn.k_proj.weight model.layers.29.self_attn.v_proj.weight model.layers.29.self_attn.o_proj.weight model.layers.29.mlp.gate_proj.weight model.layers.29.mlp.down_proj.weight model.layers.29.mlp.up_proj.weight model.layers.29.input_layernorm.weight model.layers.29.post_attention_layernorm.weight model.layers.30.self_attn.q_proj.weight model.layers.30.self_attn.k_proj.weight model.layers.30.self_attn.v_proj.weight model.layers.30.self_attn.o_proj.weight model.layers.30.mlp.gate_proj.weight model.layers.30.mlp.down_proj.weight model.layers.30.mlp.up_proj.weight model.layers.30.input_layernorm.weight model.layers.30.post_attention_layernorm.weight model.layers.31.self_attn.q_proj.weight model.layers.31.self_attn.k_proj.weight model.layers.31.self_attn.v_proj.weight model.layers.31.self_attn.o_proj.weight model.layers.31.mlp.gate_proj.weight model.layers.31.mlp.down_proj.weight model.layers.31.mlp.up_proj.weight model.layers.31.input_layernorm.weight model.layers.31.post_attention_layernorm.weight model.norm.weight model.spi_module.mlvl_fuse.input_conv.0.weight model.spi_module.mlvl_fuse.input_conv.0.bias model.spi_module.mlvl_fuse.input_conv.1.weight model.spi_module.mlvl_fuse.input_conv.1.bias model.spi_module.mlvl_fuse.input_conv.2.weight model.spi_module.mlvl_fuse.input_conv.2.bias model.spi_module.mlvl_fuse.input_conv.3.weight model.spi_module.mlvl_fuse.input_conv.3.bias model.spi_module.mlvl_fuse.fuse_convs.0.conv.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.weight model.spi_module.mlvl_fuse.fuse_convs.0.gn.bias model.spi_module.mlvl_fuse.fuse_convs.1.conv.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.weight model.spi_module.mlvl_fuse.fuse_convs.1.gn.bias model.spi_module.mlvl_fuse.fuse_convs.2.conv.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.weight model.spi_module.mlvl_fuse.fuse_convs.2.gn.bias model.spi_module.mlvl_fuse.fuse_convs.3.conv.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.weight model.spi_module.mlvl_fuse.fuse_convs.3.gn.bias model.spi_module.mlvl_fuse.fuse_convs.4.conv.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.weight model.spi_module.mlvl_fuse.fuse_convs.4.gn.bias model.spi_module.roi_align.pconvs.0.weight model.spi_module.roi_align.pconvs.0.bias model.spi_module.roi_align.pconvs.1.weight model.spi_module.roi_align.pconvs.1.bias model.spi_module.roi_align.pconvs.2.weight model.spi_module.roi_align.pconvs.2.bias model.spi_module.roi_align.pconvs.3.weight model.spi_module.roi_align.pconvs.3.bias model.spi_module.roi_align.pos_embedd.0.weight model.spi_module.roi_align.pos_embedd.0.bias model.spi_module.roi_align.pos_embedd.2.weight model.spi_module.roi_align.pos_embedd.2.bias model.spi_module.roi_align.pos_embedd.3.weight model.spi_module.roi_align.pos_embedd.3.bias model.spi_module.roi_align.pos_embedd.5.weight model.spi_module.roi_align.pos_embedd.5.bias model.spi_module.roi_align.updims.weight model.spi_module.roi_align.updims.bias model.spi_module.roi_align.flatten_linear.weight model.spi_module.roi_align.flatten_linear.bias model.mm_projector.weight model.mm_projector.bias lm_head.weight resume ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ {'loss': 0.4495, 'learning_rate': 6.666666666666667e-09, 'epoch': 0.0} {'loss': 0.5365, 'learning_rate': 1.3333333333333334e-08, 'epoch': 0.0} {'loss': 0.6837, 'learning_rate': 2e-08, 'epoch': 0.0} {'loss': 0.3717, 'learning_rate': 2.6666666666666667e-08, 'epoch': 0.0} {'loss': 0.5782, 'learning_rate': 3.333333333333334e-08, 'epoch': 0.0} {'loss': 0.6063, 'learning_rate': 4e-08, 'epoch': 0.0} {'loss': 0.5213, 'learning_rate': 4.6666666666666674e-08, 'epoch': 0.0} {'loss': 0.4653, 'learning_rate': 5.3333333333333334e-08, 'epoch': 0.0} {'loss': 0.54, 'learning_rate': 6.000000000000001e-08, 'epoch': 0.0} {'loss': 0.4414, 'learning_rate': 6.666666666666668e-08, 'epoch': 0.0} {'loss': 0.3943, 'learning_rate': 7.333333333333334e-08, 'epoch': 0.0} {'loss': 0.4489, 'learning_rate': 8e-08, 'epoch': 0.0} {'loss': 0.3156, 'learning_rate': 8.666666666666668e-08, 'epoch': 0.0} {'loss': 0.5422, 'learning_rate': 9.333333333333335e-08, 'epoch': 0.0} {'loss': 0.4793, 'learning_rate': 1.0000000000000001e-07, 'epoch': 0.0} {'loss': 0.5718, 'learning_rate': 1.0666666666666667e-07, 'epoch': 0.0} {'loss': 0.3656, 'learning_rate': 1.1333333333333336e-07, 'epoch': 0.0} {'loss': 0.5067, 'learning_rate': 1.2000000000000002e-07, 'epoch': 0.0} {'loss': 0.6227, 'learning_rate': 1.2666666666666666e-07, 'epoch': 0.0} {'loss': 0.6041, 'learning_rate': 1.3333333333333336e-07, 'epoch': 0.0} {'loss': 0.4348, 'learning_rate': 1.4e-07, 'epoch': 0.0} {'loss': 0.5453, 'learning_rate': 1.4666666666666668e-07, 'epoch': 0.0} {'loss': 0.5423, 'learning_rate': 1.5333333333333333e-07, 'epoch': 0.0} {'loss': 0.6114, 'learning_rate': 1.6e-07, 'epoch': 0.0} {'loss': 0.4988, 'learning_rate': 1.6666666666666668e-07, 'epoch': 0.0} {'loss': 0.4661, 'learning_rate': 1.7333333333333335e-07, 'epoch': 0.0} {'loss': 0.3333, 'learning_rate': 1.8e-07, 'epoch': 0.0} {'loss': 0.5228, 'learning_rate': 1.866666666666667e-07, 'epoch': 0.0} {'loss': 0.5879, 'learning_rate': 1.9333333333333337e-07, 'epoch': 0.0} {'loss': 0.5268, 'learning_rate': 2.0000000000000002e-07, 'epoch': 0.0} {'loss': 0.4913, 'learning_rate': 2.066666666666667e-07, 'epoch': 0.0} {'loss': 0.5636, 'learning_rate': 2.1333333333333334e-07, 'epoch': 0.0} {'loss': 0.4269, 'learning_rate': 2.2e-07, 'epoch': 0.0} {'loss': 0.5924, 'learning_rate': 2.266666666666667e-07, 'epoch': 0.0} {'loss': 0.4327, 'learning_rate': 2.3333333333333336e-07, 'epoch': 0.0} {'loss': 0.2496, 'learning_rate': 2.4000000000000003e-07, 'epoch': 0.0} {'loss': 0.3254, 'learning_rate': 2.466666666666667e-07, 'epoch': 0.0} {'loss': 0.4477, 'learning_rate': 2.533333333333333e-07, 'epoch': 0.0} {'loss': 0.5845, 'learning_rate': 2.6e-07, 'epoch': 0.0} {'loss': 0.5499, 'learning_rate': 2.666666666666667e-07, 'epoch': 0.0} {'loss': 0.6177, 'learning_rate': 2.7333333333333335e-07, 'epoch': 0.0} {'loss': 0.485, 'learning_rate': 2.8e-07, 'epoch': 0.0} {'loss': 0.6091, 'learning_rate': 2.866666666666667e-07, 'epoch': 0.0} {'loss': 0.4963, 'learning_rate': 2.9333333333333337e-07, 'epoch': 0.0} {'loss': 0.6604, 'learning_rate': 3.0000000000000004e-07, 'epoch': 0.0} {'loss': 0.4202, 'learning_rate': 3.0666666666666666e-07, 'epoch': 0.0} {'loss': 0.4892, 'learning_rate': 3.1333333333333333e-07, 'epoch': 0.0} {'loss': 0.3401, 'learning_rate': 3.2e-07, 'epoch': 0.0} {'loss': 0.638, 'learning_rate': 3.266666666666667e-07, 'epoch': 0.0} {'loss': 0.5071, 'learning_rate': 3.3333333333333335e-07, 'epoch': 0.0} {'loss': 0.6161, 'learning_rate': 3.4000000000000003e-07, 'epoch': 0.0} {'loss': 0.3321, 'learning_rate': 3.466666666666667e-07, 'epoch': 0.0} {'loss': 0.5434, 'learning_rate': 3.533333333333334e-07, 'epoch': 0.0} {'loss': 0.7802, 'learning_rate': 3.6e-07, 'epoch': 0.0} {'loss': 0.6745, 'learning_rate': 3.666666666666667e-07, 'epoch': 0.0} {'loss': 0.3463, 'learning_rate': 3.733333333333334e-07, 'epoch': 0.0} {'loss': 0.4315, 'learning_rate': 3.8e-07, 'epoch': 0.0} {'loss': 0.4601, 'learning_rate': 3.8666666666666674e-07, 'epoch': 0.0} {'loss': 0.4558, 'learning_rate': 3.9333333333333336e-07, 'epoch': 0.0} {'loss': 0.5142, 'learning_rate': 4.0000000000000003e-07, 'epoch': 0.0} {'loss': 0.4773, 'learning_rate': 4.0666666666666666e-07, 'epoch': 0.0} {'loss': 0.3797, 'learning_rate': 4.133333333333334e-07, 'epoch': 0.0} {'loss': 0.2959, 'learning_rate': 4.2000000000000006e-07, 'epoch': 0.0} {'loss': 0.3858, 'learning_rate': 4.266666666666667e-07, 'epoch': 0.0} {'loss': 0.3862, 'learning_rate': 4.333333333333334e-07, 'epoch': 0.0} {'loss': 0.2677, 'learning_rate': 4.4e-07, 'epoch': 0.0} {'loss': 0.6614, 'learning_rate': 4.466666666666667e-07, 'epoch': 0.0} {'loss': 0.4532, 'learning_rate': 4.533333333333334e-07, 'epoch': 0.0} {'loss': 0.4629, 'learning_rate': 4.6000000000000004e-07, 'epoch': 0.0} {'loss': 0.6151, 'learning_rate': 4.666666666666667e-07, 'epoch': 0.0} {'loss': 0.477, 'learning_rate': 4.7333333333333334e-07, 'epoch': 0.0} {'loss': 0.5737, 'learning_rate': 4.800000000000001e-07, 'epoch': 0.0} {'loss': 0.4302, 'learning_rate': 4.866666666666666e-07, 'epoch': 0.0} {'loss': 0.3877, 'learning_rate': 4.933333333333334e-07, 'epoch': 0.0} {'loss': 0.4403, 'learning_rate': 5.000000000000001e-07, 'epoch': 0.0} {'loss': 0.7788, 'learning_rate': 5.066666666666667e-07, 'epoch': 0.0} {'loss': 0.5204, 'learning_rate': 5.133333333333334e-07, 'epoch': 0.0} {'loss': 0.8009, 'learning_rate': 5.2e-07, 'epoch': 0.0} {'loss': 0.3736, 'learning_rate': 5.266666666666667e-07, 'epoch': 0.0} {'loss': 0.436, 'learning_rate': 5.333333333333335e-07, 'epoch': 0.0} {'loss': 0.3948, 'learning_rate': 5.4e-07, 'epoch': 0.0} {'loss': 0.3081, 'learning_rate': 5.466666666666667e-07, 'epoch': 0.0} {'loss': 0.457, 'learning_rate': 5.533333333333334e-07, 'epoch': 0.0} {'loss': 0.4472, 'learning_rate': 5.6e-07, 'epoch': 0.0} {'loss': 0.5496, 'learning_rate': 5.666666666666667e-07, 'epoch': 0.0} {'loss': 0.2299, 'learning_rate': 5.733333333333334e-07, 'epoch': 0.0} {'loss': 0.4277, 'learning_rate': 5.800000000000001e-07, 'epoch': 0.0} {'loss': 0.3726, 'learning_rate': 5.866666666666667e-07, 'epoch': 0.0} {'loss': 0.4873, 'learning_rate': 5.933333333333334e-07, 'epoch': 0.0} {'loss': 0.4784, 'learning_rate': 6.000000000000001e-07, 'epoch': 0.0} {'loss': 0.343, 'learning_rate': 6.066666666666668e-07, 'epoch': 0.0} {'loss': 0.4259, 'learning_rate': 6.133333333333333e-07, 'epoch': 0.0} {'loss': 0.6286, 'learning_rate': 6.200000000000001e-07, 'epoch': 0.0} {'loss': 0.4029, 'learning_rate': 6.266666666666667e-07, 'epoch': 0.0} {'loss': 0.5555, 'learning_rate': 6.333333333333334e-07, 'epoch': 0.0} {'loss': 0.3642, 'learning_rate': 6.4e-07, 'epoch': 0.0} {'loss': 0.3767, 'learning_rate': 6.466666666666667e-07, 'epoch': 0.0} {'loss': 0.5129, 'learning_rate': 6.533333333333334e-07, 'epoch': 0.0} {'loss': 0.3708, 'learning_rate': 6.6e-07, 'epoch': 0.0} {'loss': 0.2362, 'learning_rate': 6.666666666666667e-07, 'epoch': 0.0} {'loss': 0.1232, 'learning_rate': 6.733333333333334e-07, 'epoch': 0.0} {'loss': 0.5125, 'learning_rate': 6.800000000000001e-07, 'epoch': 0.0} {'loss': 0.501, 'learning_rate': 6.866666666666667e-07, 'epoch': 0.0} {'loss': 0.4903, 'learning_rate': 6.933333333333334e-07, 'epoch': 0.0} {'loss': 0.4226, 'learning_rate': 7.000000000000001e-07, 'epoch': 0.0} {'loss': 0.3603, 'learning_rate': 7.066666666666667e-07, 'epoch': 0.0} {'loss': 0.5871, 'learning_rate': 7.133333333333334e-07, 'epoch': 0.0} {'loss': 0.3327, 'learning_rate': 7.2e-07, 'epoch': 0.0} {'loss': 0.5263, 'learning_rate': 7.266666666666668e-07, 'epoch': 0.0} {'loss': 0.3778, 'learning_rate': 7.333333333333334e-07, 'epoch': 0.0} {'loss': 0.3634, 'learning_rate': 7.4e-07, 'epoch': 0.0} {'loss': 0.5181, 'learning_rate': 7.466666666666668e-07, 'epoch': 0.0} {'loss': 0.4858, 'learning_rate': 7.533333333333335e-07, 'epoch': 0.0} {'loss': 0.3545, 'learning_rate': 7.6e-07, 'epoch': 0.0} {'loss': 0.4087, 'learning_rate': 7.666666666666667e-07, 'epoch': 0.0} {'loss': 0.4998, 'learning_rate': 7.733333333333335e-07, 'epoch': 0.0} {'loss': 0.6345, 'learning_rate': 7.8e-07, 'epoch': 0.0} {'loss': 0.3617, 'learning_rate': 7.866666666666667e-07, 'epoch': 0.0} {'loss': 0.5089, 'learning_rate': 7.933333333333335e-07, 'epoch': 0.0} {'loss': 0.5424, 'learning_rate': 8.000000000000001e-07, 'epoch': 0.0} {'loss': 0.7095, 'learning_rate': 8.066666666666667e-07, 'epoch': 0.0} {'loss': 0.2718, 'learning_rate': 8.133333333333333e-07, 'epoch': 0.0} {'loss': 0.4744, 'learning_rate': 8.200000000000001e-07, 'epoch': 0.0} {'loss': 0.4523, 'learning_rate': 8.266666666666668e-07, 'epoch': 0.0} {'loss': 0.6733, 'learning_rate': 8.333333333333333e-07, 'epoch': 0.0} {'loss': 0.311, 'learning_rate': 8.400000000000001e-07, 'epoch': 0.0} {'loss': 0.3201, 'learning_rate': 8.466666666666668e-07, 'epoch': 0.0} {'loss': 0.4721, 'learning_rate': 8.533333333333334e-07, 'epoch': 0.0} {'loss': 0.4151, 'learning_rate': 8.6e-07, 'epoch': 0.0} {'loss': 0.3904, 'learning_rate': 8.666666666666668e-07, 'epoch': 0.0} {'loss': 0.7322, 'learning_rate': 8.733333333333334e-07, 'epoch': 0.0} {'loss': 0.5129, 'learning_rate': 8.8e-07, 'epoch': 0.0} {'loss': 0.5591, 'learning_rate': 8.866666666666668e-07, 'epoch': 0.0} {'loss': 0.3308, 'learning_rate': 8.933333333333334e-07, 'epoch': 0.0} {'loss': 0.4591, 'learning_rate': 9.000000000000001e-07, 'epoch': 0.0} {'loss': 0.5946, 'learning_rate': 9.066666666666668e-07, 'epoch': 0.0} {'loss': 0.4679, 'learning_rate': 9.133333333333334e-07, 'epoch': 0.0} {'loss': 0.3943, 'learning_rate': 9.200000000000001e-07, 'epoch': 0.0} {'loss': 0.4573, 'learning_rate': 9.266666666666667e-07, 'epoch': 0.0} {'loss': 0.3672, 'learning_rate': 9.333333333333334e-07, 'epoch': 0.0} {'loss': 0.6171, 'learning_rate': 9.400000000000001e-07, 'epoch': 0.0} {'loss': 0.3498, 'learning_rate': 9.466666666666667e-07, 'epoch': 0.0} {'loss': 0.4301, 'learning_rate': 9.533333333333335e-07, 'epoch': 0.0} {'loss': 0.4745, 'learning_rate': 9.600000000000001e-07, 'epoch': 0.0} {'loss': 0.5245, 'learning_rate': 9.666666666666668e-07, 'epoch': 0.0} {'loss': 0.5245, 'learning_rate': 9.733333333333333e-07, 'epoch': 0.0} {'loss': 0.4849, 'learning_rate': 9.800000000000001e-07, 'epoch': 0.0} {'loss': 0.37, 'learning_rate': 9.866666666666668e-07, 'epoch': 0.0} {'loss': 0.6528, 'learning_rate': 9.933333333333333e-07, 'epoch': 0.0} {'loss': 0.5775, 'learning_rate': 1.0000000000000002e-06, 'epoch': 0.0} {'loss': 0.5856, 'learning_rate': 1.0066666666666668e-06, 'epoch': 0.0} {'loss': 0.5247, 'learning_rate': 1.0133333333333333e-06, 'epoch': 0.0} {'loss': 0.5685, 'learning_rate': 1.02e-06, 'epoch': 0.0} {'loss': 0.5744, 'learning_rate': 1.0266666666666669e-06, 'epoch': 0.0} {'loss': 0.4268, 'learning_rate': 1.0333333333333333e-06, 'epoch': 0.0} {'loss': 0.3893, 'learning_rate': 1.04e-06, 'epoch': 0.0} {'loss': 0.4691, 'learning_rate': 1.0466666666666669e-06, 'epoch': 0.0} {'loss': 0.4141, 'learning_rate': 1.0533333333333333e-06, 'epoch': 0.0} {'loss': 0.354, 'learning_rate': 1.06e-06, 'epoch': 0.0} {'loss': 0.5705, 'learning_rate': 1.066666666666667e-06, 'epoch': 0.0} {'loss': 0.3818, 'learning_rate': 1.0733333333333334e-06, 'epoch': 0.0} {'loss': 0.4327, 'learning_rate': 1.08e-06, 'epoch': 0.0} {'loss': 0.447, 'learning_rate': 1.0866666666666667e-06, 'epoch': 0.0} {'loss': 0.4225, 'learning_rate': 1.0933333333333334e-06, 'epoch': 0.0} {'loss': 0.4181, 'learning_rate': 1.1e-06, 'epoch': 0.0} {'loss': 0.6522, 'learning_rate': 1.1066666666666667e-06, 'epoch': 0.0} {'loss': 0.4715, 'learning_rate': 1.1133333333333334e-06, 'epoch': 0.0} {'loss': 0.2602, 'learning_rate': 1.12e-06, 'epoch': 0.0} {'loss': 0.4598, 'learning_rate': 1.1266666666666667e-06, 'epoch': 0.0} {'loss': 0.4026, 'learning_rate': 1.1333333333333334e-06, 'epoch': 0.0} {'loss': 0.3517, 'learning_rate': 1.14e-06, 'epoch': 0.0} {'loss': 0.5401, 'learning_rate': 1.1466666666666668e-06, 'epoch': 0.0} {'loss': 0.7589, 'learning_rate': 1.1533333333333334e-06, 'epoch': 0.0} {'loss': 0.4605, 'learning_rate': 1.1600000000000001e-06, 'epoch': 0.0} {'loss': 0.3956, 'learning_rate': 1.1666666666666668e-06, 'epoch': 0.0} {'loss': 0.2775, 'learning_rate': 1.1733333333333335e-06, 'epoch': 0.0} {'loss': 0.5367, 'learning_rate': 1.1800000000000001e-06, 'epoch': 0.0} {'loss': 0.3473, 'learning_rate': 1.1866666666666668e-06, 'epoch': 0.0} {'loss': 0.4321, 'learning_rate': 1.1933333333333335e-06, 'epoch': 0.0} {'loss': 0.3715, 'learning_rate': 1.2000000000000002e-06, 'epoch': 0.0} {'loss': 0.5677, 'learning_rate': 1.2066666666666668e-06, 'epoch': 0.0} {'loss': 0.5431, 'learning_rate': 1.2133333333333335e-06, 'epoch': 0.0} {'loss': 0.4256, 'learning_rate': 1.2200000000000002e-06, 'epoch': 0.0} {'loss': 0.4499, 'learning_rate': 1.2266666666666666e-06, 'epoch': 0.0} {'loss': 0.3618, 'learning_rate': 1.2333333333333335e-06, 'epoch': 0.0} {'loss': 0.5509, 'learning_rate': 1.2400000000000002e-06, 'epoch': 0.0} {'loss': 0.3366, 'learning_rate': 1.2466666666666667e-06, 'epoch': 0.0} {'loss': 0.4222, 'learning_rate': 1.2533333333333333e-06, 'epoch': 0.0} {'loss': 0.3571, 'learning_rate': 1.26e-06, 'epoch': 0.0} {'loss': 0.492, 'learning_rate': 1.2666666666666669e-06, 'epoch': 0.0} {'loss': 0.5048, 'learning_rate': 1.2733333333333334e-06, 'epoch': 0.0} {'loss': 0.5398, 'learning_rate': 1.28e-06, 'epoch': 0.0} {'loss': 0.4461, 'learning_rate': 1.286666666666667e-06, 'epoch': 0.0} {'loss': 0.4961, 'learning_rate': 1.2933333333333334e-06, 'epoch': 0.0} {'loss': 0.6303, 'learning_rate': 1.3e-06, 'epoch': 0.0} {'loss': 0.4198, 'learning_rate': 1.3066666666666667e-06, 'epoch': 0.0} {'loss': 0.3706, 'learning_rate': 1.3133333333333334e-06, 'epoch': 0.0} {'loss': 0.4147, 'learning_rate': 1.32e-06, 'epoch': 0.0} {'loss': 0.3584, 'learning_rate': 1.3266666666666667e-06, 'epoch': 0.0} {'loss': 0.3206, 'learning_rate': 1.3333333333333334e-06, 'epoch': 0.0} {'loss': 0.6546, 'learning_rate': 1.34e-06, 'epoch': 0.0} {'loss': 0.4659, 'learning_rate': 1.3466666666666668e-06, 'epoch': 0.0} {'loss': 0.4657, 'learning_rate': 1.3533333333333334e-06, 'epoch': 0.0} {'loss': 0.4779, 'learning_rate': 1.3600000000000001e-06, 'epoch': 0.0} {'loss': 0.4714, 'learning_rate': 1.3666666666666668e-06, 'epoch': 0.0} {'loss': 0.3461, 'learning_rate': 1.3733333333333335e-06, 'epoch': 0.0} {'loss': 0.4232, 'learning_rate': 1.3800000000000001e-06, 'epoch': 0.0} {'loss': 0.4634, 'learning_rate': 1.3866666666666668e-06, 'epoch': 0.0} {'loss': 0.4396, 'learning_rate': 1.3933333333333335e-06, 'epoch': 0.0} {'loss': 0.4378, 'learning_rate': 1.4000000000000001e-06, 'epoch': 0.0} {'loss': 0.5001, 'learning_rate': 1.4066666666666668e-06, 'epoch': 0.0} {'loss': 0.427, 'learning_rate': 1.4133333333333335e-06, 'epoch': 0.0} {'loss': 0.4563, 'learning_rate': 1.42e-06, 'epoch': 0.0} {'loss': 0.4228, 'learning_rate': 1.4266666666666668e-06, 'epoch': 0.0} {'loss': 0.5668, 'learning_rate': 1.4333333333333335e-06, 'epoch': 0.0} {'loss': 0.3402, 'learning_rate': 1.44e-06, 'epoch': 0.0} {'loss': 0.4219, 'learning_rate': 1.4466666666666669e-06, 'epoch': 0.0} {'loss': 0.457, 'learning_rate': 1.4533333333333335e-06, 'epoch': 0.0} {'loss': 0.3862, 'learning_rate': 1.46e-06, 'epoch': 0.0} {'loss': 0.5696, 'learning_rate': 1.4666666666666669e-06, 'epoch': 0.0} {'loss': 0.2969, 'learning_rate': 1.4733333333333336e-06, 'epoch': 0.0} {'loss': 0.2823, 'learning_rate': 1.48e-06, 'epoch': 0.0} {'loss': 0.5743, 'learning_rate': 1.486666666666667e-06, 'epoch': 0.0} {'loss': 0.4769, 'learning_rate': 1.4933333333333336e-06, 'epoch': 0.0} {'loss': 0.3317, 'learning_rate': 1.5e-06, 'epoch': 0.0} {'loss': 0.4267, 'learning_rate': 1.506666666666667e-06, 'epoch': 0.0} {'loss': 0.3548, 'learning_rate': 1.5133333333333334e-06, 'epoch': 0.0} {'loss': 0.5901, 'learning_rate': 1.52e-06, 'epoch': 0.0} {'loss': 0.2997, 'learning_rate': 1.526666666666667e-06, 'epoch': 0.0} {'loss': 0.5362, 'learning_rate': 1.5333333333333334e-06, 'epoch': 0.0} {'loss': 0.4643, 'learning_rate': 1.54e-06, 'epoch': 0.0} {'loss': 0.452, 'learning_rate': 1.546666666666667e-06, 'epoch': 0.0} {'loss': 0.3121, 'learning_rate': 1.5533333333333334e-06, 'epoch': 0.0} {'loss': 0.3905, 'learning_rate': 1.56e-06, 'epoch': 0.0} {'loss': 0.3117, 'learning_rate': 1.566666666666667e-06, 'epoch': 0.0} {'loss': 0.2619, 'learning_rate': 1.5733333333333334e-06, 'epoch': 0.0} {'loss': 0.4524, 'learning_rate': 1.5800000000000001e-06, 'epoch': 0.0} {'loss': 0.4294, 'learning_rate': 1.586666666666667e-06, 'epoch': 0.0} {'loss': 0.3724, 'learning_rate': 1.5933333333333335e-06, 'epoch': 0.0} {'loss': 0.3586, 'learning_rate': 1.6000000000000001e-06, 'epoch': 0.0} {'loss': 0.3363, 'learning_rate': 1.606666666666667e-06, 'epoch': 0.0} {'loss': 0.2887, 'learning_rate': 1.6133333333333335e-06, 'epoch': 0.01} {'loss': 0.4353, 'learning_rate': 1.6200000000000002e-06, 'epoch': 0.01} {'loss': 0.558, 'learning_rate': 1.6266666666666666e-06, 'epoch': 0.01} {'loss': 0.5381, 'learning_rate': 1.6333333333333335e-06, 'epoch': 0.01} {'loss': 0.461, 'learning_rate': 1.6400000000000002e-06, 'epoch': 0.01} {'loss': 0.3602, 'learning_rate': 1.6466666666666666e-06, 'epoch': 0.01} {'loss': 0.6303, 'learning_rate': 1.6533333333333335e-06, 'epoch': 0.01} {'loss': 0.4593, 'learning_rate': 1.6600000000000002e-06, 'epoch': 0.01} {'loss': 0.4159, 'learning_rate': 1.6666666666666667e-06, 'epoch': 0.01} {'loss': 0.3377, 'learning_rate': 1.6733333333333335e-06, 'epoch': 0.01} {'loss': 0.3213, 'learning_rate': 1.6800000000000002e-06, 'epoch': 0.01} {'loss': 0.4591, 'learning_rate': 1.6866666666666667e-06, 'epoch': 0.01} {'loss': 0.4939, 'learning_rate': 1.6933333333333336e-06, 'epoch': 0.01} {'loss': 0.5419, 'learning_rate': 1.7000000000000002e-06, 'epoch': 0.01} {'loss': 0.512, 'learning_rate': 1.7066666666666667e-06, 'epoch': 0.01} {'loss': 0.6806, 'learning_rate': 1.7133333333333336e-06, 'epoch': 0.01} {'loss': 0.5064, 'learning_rate': 1.72e-06, 'epoch': 0.01} {'loss': 0.3722, 'learning_rate': 1.7266666666666667e-06, 'epoch': 0.01} {'loss': 0.4318, 'learning_rate': 1.7333333333333336e-06, 'epoch': 0.01} {'loss': 0.4362, 'learning_rate': 1.74e-06, 'epoch': 0.01} {'loss': 0.3002, 'learning_rate': 1.7466666666666667e-06, 'epoch': 0.01} {'loss': 0.5751, 'learning_rate': 1.7533333333333336e-06, 'epoch': 0.01} {'loss': 0.4305, 'learning_rate': 1.76e-06, 'epoch': 0.01} {'loss': 0.5133, 'learning_rate': 1.7666666666666668e-06, 'epoch': 0.01} {'loss': 0.3779, 'learning_rate': 1.7733333333333336e-06, 'epoch': 0.01} {'loss': 0.3847, 'learning_rate': 1.7800000000000001e-06, 'epoch': 0.01} {'loss': 0.4882, 'learning_rate': 1.7866666666666668e-06, 'epoch': 0.01} {'loss': 0.5587, 'learning_rate': 1.7933333333333337e-06, 'epoch': 0.01} {'loss': 0.4445, 'learning_rate': 1.8000000000000001e-06, 'epoch': 0.01} {'loss': 0.3852, 'learning_rate': 1.8066666666666668e-06, 'epoch': 0.01} {'loss': 0.6045, 'learning_rate': 1.8133333333333337e-06, 'epoch': 0.01} {'loss': 0.6048, 'learning_rate': 1.8200000000000002e-06, 'epoch': 0.01} {'loss': 0.4058, 'learning_rate': 1.8266666666666668e-06, 'epoch': 0.01} {'loss': 0.3917, 'learning_rate': 1.8333333333333333e-06, 'epoch': 0.01} {'loss': 0.4081, 'learning_rate': 1.8400000000000002e-06, 'epoch': 0.01} {'loss': 0.2843, 'learning_rate': 1.8466666666666668e-06, 'epoch': 0.01} {'loss': 0.3943, 'learning_rate': 1.8533333333333333e-06, 'epoch': 0.01} {'loss': 0.5368, 'learning_rate': 1.8600000000000002e-06, 'epoch': 0.01} {'loss': 0.4789, 'learning_rate': 1.8666666666666669e-06, 'epoch': 0.01} {'loss': 0.505, 'learning_rate': 1.8733333333333333e-06, 'epoch': 0.01} {'loss': 0.3257, 'learning_rate': 1.8800000000000002e-06, 'epoch': 0.01} {'loss': 0.5235, 'learning_rate': 1.8866666666666669e-06, 'epoch': 0.01} {'loss': 0.4041, 'learning_rate': 1.8933333333333333e-06, 'epoch': 0.01} {'loss': 0.3195, 'learning_rate': 1.9000000000000002e-06, 'epoch': 0.01} {'loss': 0.5909, 'learning_rate': 1.906666666666667e-06, 'epoch': 0.01} {'loss': 0.3936, 'learning_rate': 1.9133333333333334e-06, 'epoch': 0.01} {'loss': 0.4026, 'learning_rate': 1.9200000000000003e-06, 'epoch': 0.01} {'loss': 0.3647, 'learning_rate': 1.926666666666667e-06, 'epoch': 0.01} {'loss': 0.304, 'learning_rate': 1.9333333333333336e-06, 'epoch': 0.01} {'loss': 0.4337, 'learning_rate': 1.94e-06, 'epoch': 0.01} {'loss': 0.4043, 'learning_rate': 1.9466666666666665e-06, 'epoch': 0.01} {'loss': 0.5006, 'learning_rate': 1.9533333333333334e-06, 'epoch': 0.01} {'loss': 0.4692, 'learning_rate': 1.9600000000000003e-06, 'epoch': 0.01} {'loss': 0.4764, 'learning_rate': 1.9666666666666668e-06, 'epoch': 0.01} {'loss': 0.6564, 'learning_rate': 1.9733333333333336e-06, 'epoch': 0.01} {'loss': 0.4072, 'learning_rate': 1.98e-06, 'epoch': 0.01} {'loss': 0.5373, 'learning_rate': 1.9866666666666666e-06, 'epoch': 0.01} {'loss': 0.3851, 'learning_rate': 1.9933333333333334e-06, 'epoch': 0.01} {'loss': 0.3826, 'learning_rate': 2.0000000000000003e-06, 'epoch': 0.01} {'loss': 0.5427, 'learning_rate': 2.006666666666667e-06, 'epoch': 0.01} {'loss': 0.4498, 'learning_rate': 2.0133333333333337e-06, 'epoch': 0.01} {'loss': 0.5951, 'learning_rate': 2.02e-06, 'epoch': 0.01} {'loss': 0.4428, 'learning_rate': 2.0266666666666666e-06, 'epoch': 0.01} {'loss': 0.8754, 'learning_rate': 2.0333333333333335e-06, 'epoch': 0.01} {'loss': 0.3219, 'learning_rate': 2.04e-06, 'epoch': 0.01} {'loss': 0.3795, 'learning_rate': 2.046666666666667e-06, 'epoch': 0.01} {'loss': 0.3925, 'learning_rate': 2.0533333333333337e-06, 'epoch': 0.01} {'loss': 0.3764, 'learning_rate': 2.06e-06, 'epoch': 0.01} {'loss': 0.3472, 'learning_rate': 2.0666666666666666e-06, 'epoch': 0.01} {'loss': 0.4204, 'learning_rate': 2.0733333333333335e-06, 'epoch': 0.01} {'loss': 0.4611, 'learning_rate': 2.08e-06, 'epoch': 0.01} {'loss': 0.5476, 'learning_rate': 2.086666666666667e-06, 'epoch': 0.01} {'loss': 0.3263, 'learning_rate': 2.0933333333333338e-06, 'epoch': 0.01} {'loss': 0.5351, 'learning_rate': 2.1000000000000002e-06, 'epoch': 0.01} {'loss': 0.4133, 'learning_rate': 2.1066666666666667e-06, 'epoch': 0.01} {'loss': 0.5293, 'learning_rate': 2.1133333333333336e-06, 'epoch': 0.01} {'loss': 0.516, 'learning_rate': 2.12e-06, 'epoch': 0.01} {'loss': 0.321, 'learning_rate': 2.126666666666667e-06, 'epoch': 0.01} {'loss': 0.4353, 'learning_rate': 2.133333333333334e-06, 'epoch': 0.01} {'loss': 0.3983, 'learning_rate': 2.1400000000000003e-06, 'epoch': 0.01} {'loss': 0.4465, 'learning_rate': 2.1466666666666667e-06, 'epoch': 0.01} {'loss': 0.417, 'learning_rate': 2.153333333333333e-06, 'epoch': 0.01} {'loss': 0.766, 'learning_rate': 2.16e-06, 'epoch': 0.01} {'loss': 0.5039, 'learning_rate': 2.166666666666667e-06, 'epoch': 0.01} {'loss': 0.3181, 'learning_rate': 2.1733333333333334e-06, 'epoch': 0.01} {'loss': 0.4286, 'learning_rate': 2.1800000000000003e-06, 'epoch': 0.01} {'loss': 0.3428, 'learning_rate': 2.1866666666666668e-06, 'epoch': 0.01} {'loss': 0.3656, 'learning_rate': 2.1933333333333332e-06, 'epoch': 0.01} {'loss': 0.4172, 'learning_rate': 2.2e-06, 'epoch': 0.01} {'loss': 0.3885, 'learning_rate': 2.206666666666667e-06, 'epoch': 0.01} {'loss': 0.4525, 'learning_rate': 2.2133333333333335e-06, 'epoch': 0.01} {'loss': 0.4972, 'learning_rate': 2.2200000000000003e-06, 'epoch': 0.01} {'loss': 0.484, 'learning_rate': 2.226666666666667e-06, 'epoch': 0.01} {'loss': 0.3105, 'learning_rate': 2.2333333333333333e-06, 'epoch': 0.01} {'loss': 0.5051, 'learning_rate': 2.24e-06, 'epoch': 0.01} {'loss': 0.408, 'learning_rate': 2.2466666666666666e-06, 'epoch': 0.01} {'loss': 0.4303, 'learning_rate': 2.2533333333333335e-06, 'epoch': 0.01} {'loss': 0.3839, 'learning_rate': 2.2600000000000004e-06, 'epoch': 0.01} {'loss': 0.3124, 'learning_rate': 2.266666666666667e-06, 'epoch': 0.01} {'loss': 0.1888, 'learning_rate': 2.2733333333333333e-06, 'epoch': 0.01} {'loss': 0.4117, 'learning_rate': 2.28e-06, 'epoch': 0.01} {'loss': 0.7696, 'learning_rate': 2.2866666666666667e-06, 'epoch': 0.01} {'loss': 0.4498, 'learning_rate': 2.2933333333333335e-06, 'epoch': 0.01} {'loss': 0.2168, 'learning_rate': 2.3000000000000004e-06, 'epoch': 0.01} {'loss': 0.6004, 'learning_rate': 2.306666666666667e-06, 'epoch': 0.01} {'loss': 0.4038, 'learning_rate': 2.3133333333333333e-06, 'epoch': 0.01} {'loss': 0.5252, 'learning_rate': 2.3200000000000002e-06, 'epoch': 0.01} {'loss': 0.4036, 'learning_rate': 2.3266666666666667e-06, 'epoch': 0.01} {'loss': 0.3975, 'learning_rate': 2.3333333333333336e-06, 'epoch': 0.01} {'loss': 0.4545, 'learning_rate': 2.3400000000000005e-06, 'epoch': 0.01} {'loss': 0.4649, 'learning_rate': 2.346666666666667e-06, 'epoch': 0.01} {'loss': 0.4264, 'learning_rate': 2.3533333333333334e-06, 'epoch': 0.01} {'loss': 0.4123, 'learning_rate': 2.3600000000000003e-06, 'epoch': 0.01} {'loss': 0.4132, 'learning_rate': 2.3666666666666667e-06, 'epoch': 0.01} {'loss': 0.4986, 'learning_rate': 2.3733333333333336e-06, 'epoch': 0.01} {'loss': 0.4152, 'learning_rate': 2.38e-06, 'epoch': 0.01} {'loss': 0.5122, 'learning_rate': 2.386666666666667e-06, 'epoch': 0.01} {'loss': 0.3226, 'learning_rate': 2.3933333333333334e-06, 'epoch': 0.01} {'loss': 0.6215, 'learning_rate': 2.4000000000000003e-06, 'epoch': 0.01} {'loss': 0.5261, 'learning_rate': 2.4066666666666668e-06, 'epoch': 0.01} {'loss': 0.734, 'learning_rate': 2.4133333333333337e-06, 'epoch': 0.01} {'loss': 0.4563, 'learning_rate': 2.42e-06, 'epoch': 0.01} {'loss': 0.5317, 'learning_rate': 2.426666666666667e-06, 'epoch': 0.01} {'loss': 0.6332, 'learning_rate': 2.4333333333333335e-06, 'epoch': 0.01} {'loss': 0.4549, 'learning_rate': 2.4400000000000004e-06, 'epoch': 0.01} {'loss': 0.5128, 'learning_rate': 2.446666666666667e-06, 'epoch': 0.01} {'loss': 0.3866, 'learning_rate': 2.4533333333333333e-06, 'epoch': 0.01} {'loss': 0.5057, 'learning_rate': 2.46e-06, 'epoch': 0.01} {'loss': 0.4972, 'learning_rate': 2.466666666666667e-06, 'epoch': 0.01} {'loss': 0.553, 'learning_rate': 2.4733333333333335e-06, 'epoch': 0.01} {'loss': 0.5962, 'learning_rate': 2.4800000000000004e-06, 'epoch': 0.01} {'loss': 0.3526, 'learning_rate': 2.486666666666667e-06, 'epoch': 0.01} {'loss': 0.5368, 'learning_rate': 2.4933333333333333e-06, 'epoch': 0.01} {'loss': 0.4541, 'learning_rate': 2.5e-06, 'epoch': 0.01} {'loss': 0.5824, 'learning_rate': 2.5066666666666667e-06, 'epoch': 0.01} {'loss': 0.4027, 'learning_rate': 2.5133333333333336e-06, 'epoch': 0.01} {'loss': 0.2903, 'learning_rate': 2.52e-06, 'epoch': 0.01} {'loss': 0.3067, 'learning_rate': 2.526666666666667e-06, 'epoch': 0.01} {'loss': 0.4513, 'learning_rate': 2.5333333333333338e-06, 'epoch': 0.01} {'loss': 0.443, 'learning_rate': 2.5400000000000002e-06, 'epoch': 0.01} {'loss': 0.5993, 'learning_rate': 2.5466666666666667e-06, 'epoch': 0.01} {'loss': 0.407, 'learning_rate': 2.5533333333333336e-06, 'epoch': 0.01} {'loss': 0.5315, 'learning_rate': 2.56e-06, 'epoch': 0.01} {'loss': 0.3298, 'learning_rate': 2.566666666666667e-06, 'epoch': 0.01} {'loss': 0.3877, 'learning_rate': 2.573333333333334e-06, 'epoch': 0.01} {'loss': 0.3536, 'learning_rate': 2.5800000000000003e-06, 'epoch': 0.01} {'loss': 0.3292, 'learning_rate': 2.5866666666666667e-06, 'epoch': 0.01} {'loss': 0.4964, 'learning_rate': 2.5933333333333336e-06, 'epoch': 0.01} {'loss': 0.5132, 'learning_rate': 2.6e-06, 'epoch': 0.01} {'loss': 0.3667, 'learning_rate': 2.606666666666667e-06, 'epoch': 0.01} {'loss': 0.4367, 'learning_rate': 2.6133333333333334e-06, 'epoch': 0.01} {'loss': 0.4929, 'learning_rate': 2.6200000000000003e-06, 'epoch': 0.01} {'loss': 0.3814, 'learning_rate': 2.6266666666666668e-06, 'epoch': 0.01} {'loss': 0.5444, 'learning_rate': 2.6333333333333332e-06, 'epoch': 0.01} {'loss': 0.3498, 'learning_rate': 2.64e-06, 'epoch': 0.01} {'loss': 0.3413, 'learning_rate': 2.646666666666667e-06, 'epoch': 0.01} {'loss': 0.3536, 'learning_rate': 2.6533333333333335e-06, 'epoch': 0.01} {'loss': 0.5411, 'learning_rate': 2.6600000000000004e-06, 'epoch': 0.01} {'loss': 0.2866, 'learning_rate': 2.666666666666667e-06, 'epoch': 0.01} {'loss': 0.2604, 'learning_rate': 2.6733333333333333e-06, 'epoch': 0.01} {'loss': 0.5531, 'learning_rate': 2.68e-06, 'epoch': 0.01} {'loss': 0.5349, 'learning_rate': 2.686666666666667e-06, 'epoch': 0.01} {'loss': 0.3266, 'learning_rate': 2.6933333333333335e-06, 'epoch': 0.01} {'loss': 0.4406, 'learning_rate': 2.7000000000000004e-06, 'epoch': 0.01} {'loss': 0.5305, 'learning_rate': 2.706666666666667e-06, 'epoch': 0.01} {'loss': 0.3309, 'learning_rate': 2.7133333333333333e-06, 'epoch': 0.01} {'loss': 0.6015, 'learning_rate': 2.7200000000000002e-06, 'epoch': 0.01} {'loss': 0.3283, 'learning_rate': 2.726666666666667e-06, 'epoch': 0.01} {'loss': 0.5156, 'learning_rate': 2.7333333333333336e-06, 'epoch': 0.01} {'loss': 0.3996, 'learning_rate': 2.7400000000000004e-06, 'epoch': 0.01} {'loss': 0.5405, 'learning_rate': 2.746666666666667e-06, 'epoch': 0.01} {'loss': 0.4179, 'learning_rate': 2.7533333333333334e-06, 'epoch': 0.01} {'loss': 0.4853, 'learning_rate': 2.7600000000000003e-06, 'epoch': 0.01} {'loss': 0.4078, 'learning_rate': 2.766666666666667e-06, 'epoch': 0.01} {'loss': 0.5253, 'learning_rate': 2.7733333333333336e-06, 'epoch': 0.01} {'loss': 0.5943, 'learning_rate': 2.7800000000000005e-06, 'epoch': 0.01} {'loss': 0.4243, 'learning_rate': 2.786666666666667e-06, 'epoch': 0.01} {'loss': 0.2888, 'learning_rate': 2.7933333333333334e-06, 'epoch': 0.01} {'loss': 0.5647, 'learning_rate': 2.8000000000000003e-06, 'epoch': 0.01} {'loss': 0.4105, 'learning_rate': 2.806666666666667e-06, 'epoch': 0.01} {'loss': 0.596, 'learning_rate': 2.8133333333333336e-06, 'epoch': 0.01} {'loss': 0.5767, 'learning_rate': 2.82e-06, 'epoch': 0.01} {'loss': 0.4621, 'learning_rate': 2.826666666666667e-06, 'epoch': 0.01} {'loss': 0.271, 'learning_rate': 2.8333333333333335e-06, 'epoch': 0.01} {'loss': 0.507, 'learning_rate': 2.84e-06, 'epoch': 0.01} {'loss': 0.4618, 'learning_rate': 2.8466666666666672e-06, 'epoch': 0.01} {'loss': 0.3763, 'learning_rate': 2.8533333333333337e-06, 'epoch': 0.01} {'loss': 0.5069, 'learning_rate': 2.86e-06, 'epoch': 0.01} {'loss': 0.498, 'learning_rate': 2.866666666666667e-06, 'epoch': 0.01} {'loss': 0.3928, 'learning_rate': 2.8733333333333335e-06, 'epoch': 0.01} {'loss': 0.4443, 'learning_rate': 2.88e-06, 'epoch': 0.01} {'loss': 0.438, 'learning_rate': 2.8866666666666673e-06, 'epoch': 0.01} {'loss': 0.4774, 'learning_rate': 2.8933333333333337e-06, 'epoch': 0.01} {'loss': 0.5972, 'learning_rate': 2.9e-06, 'epoch': 0.01} {'loss': 0.6818, 'learning_rate': 2.906666666666667e-06, 'epoch': 0.01} {'loss': 0.3718, 'learning_rate': 2.9133333333333335e-06, 'epoch': 0.01} {'loss': 0.4903, 'learning_rate': 2.92e-06, 'epoch': 0.01} {'loss': 0.3211, 'learning_rate': 2.9266666666666673e-06, 'epoch': 0.01} {'loss': 0.5333, 'learning_rate': 2.9333333333333338e-06, 'epoch': 0.01} {'loss': 0.536, 'learning_rate': 2.9400000000000002e-06, 'epoch': 0.01} {'loss': 0.4046, 'learning_rate': 2.946666666666667e-06, 'epoch': 0.01} {'loss': 0.3576, 'learning_rate': 2.9533333333333336e-06, 'epoch': 0.01} {'loss': 0.4152, 'learning_rate': 2.96e-06, 'epoch': 0.01} {'loss': 0.259, 'learning_rate': 2.9666666666666673e-06, 'epoch': 0.01} {'loss': 0.5062, 'learning_rate': 2.973333333333334e-06, 'epoch': 0.01} {'loss': 0.4263, 'learning_rate': 2.9800000000000003e-06, 'epoch': 0.01} {'loss': 0.539, 'learning_rate': 2.986666666666667e-06, 'epoch': 0.01} {'loss': 0.4997, 'learning_rate': 2.9933333333333336e-06, 'epoch': 0.01} {'loss': 0.1802, 'learning_rate': 3e-06, 'epoch': 0.01} {'loss': 0.3899, 'learning_rate': 3.0066666666666674e-06, 'epoch': 0.01} {'loss': 0.4099, 'learning_rate': 3.013333333333334e-06, 'epoch': 0.01} {'loss': 0.4715, 'learning_rate': 3.0200000000000003e-06, 'epoch': 0.01} {'loss': 0.3305, 'learning_rate': 3.0266666666666668e-06, 'epoch': 0.01} {'loss': 0.4306, 'learning_rate': 3.0333333333333337e-06, 'epoch': 0.01} {'loss': 0.6636, 'learning_rate': 3.04e-06, 'epoch': 0.01} {'loss': 0.4205, 'learning_rate': 3.0466666666666666e-06, 'epoch': 0.01} {'loss': 0.4476, 'learning_rate': 3.053333333333334e-06, 'epoch': 0.01} {'loss': 0.5907, 'learning_rate': 3.0600000000000003e-06, 'epoch': 0.01} {'loss': 0.6757, 'learning_rate': 3.066666666666667e-06, 'epoch': 0.01} {'loss': 0.5321, 'learning_rate': 3.0733333333333337e-06, 'epoch': 0.01} {'loss': 0.7795, 'learning_rate': 3.08e-06, 'epoch': 0.01} {'loss': 0.5701, 'learning_rate': 3.0866666666666666e-06, 'epoch': 0.01} {'loss': 0.4201, 'learning_rate': 3.093333333333334e-06, 'epoch': 0.01} {'loss': 0.3957, 'learning_rate': 3.1000000000000004e-06, 'epoch': 0.01} {'loss': 0.5488, 'learning_rate': 3.106666666666667e-06, 'epoch': 0.01} {'loss': 0.4601, 'learning_rate': 3.1133333333333337e-06, 'epoch': 0.01} {'loss': 0.4783, 'learning_rate': 3.12e-06, 'epoch': 0.01} {'loss': 0.5495, 'learning_rate': 3.1266666666666667e-06, 'epoch': 0.01} {'loss': 0.4841, 'learning_rate': 3.133333333333334e-06, 'epoch': 0.01} {'loss': 0.4006, 'learning_rate': 3.1400000000000004e-06, 'epoch': 0.01} {'loss': 0.3324, 'learning_rate': 3.146666666666667e-06, 'epoch': 0.01} {'loss': 0.4902, 'learning_rate': 3.1533333333333338e-06, 'epoch': 0.01} {'loss': 0.4073, 'learning_rate': 3.1600000000000002e-06, 'epoch': 0.01} {'loss': 0.3723, 'learning_rate': 3.1666666666666667e-06, 'epoch': 0.01} {'loss': 0.2802, 'learning_rate': 3.173333333333334e-06, 'epoch': 0.01} {'loss': 0.5724, 'learning_rate': 3.1800000000000005e-06, 'epoch': 0.01} {'loss': 0.4598, 'learning_rate': 3.186666666666667e-06, 'epoch': 0.01} {'loss': 0.4215, 'learning_rate': 3.193333333333334e-06, 'epoch': 0.01} {'loss': 0.482, 'learning_rate': 3.2000000000000003e-06, 'epoch': 0.01} {'loss': 0.52, 'learning_rate': 3.2066666666666667e-06, 'epoch': 0.01} {'loss': 0.4103, 'learning_rate': 3.213333333333334e-06, 'epoch': 0.01} {'loss': 0.5107, 'learning_rate': 3.2200000000000005e-06, 'epoch': 0.01} {'loss': 0.3661, 'learning_rate': 3.226666666666667e-06, 'epoch': 0.01} {'loss': 0.4024, 'learning_rate': 3.2333333333333334e-06, 'epoch': 0.01} {'loss': 0.5332, 'learning_rate': 3.2400000000000003e-06, 'epoch': 0.01} {'loss': 0.345, 'learning_rate': 3.2466666666666668e-06, 'epoch': 0.01} {'loss': 0.3487, 'learning_rate': 3.2533333333333332e-06, 'epoch': 0.01} {'loss': 0.421, 'learning_rate': 3.2600000000000006e-06, 'epoch': 0.01} {'loss': 0.3509, 'learning_rate': 3.266666666666667e-06, 'epoch': 0.01} {'loss': 0.354, 'learning_rate': 3.2733333333333335e-06, 'epoch': 0.01} {'loss': 0.4611, 'learning_rate': 3.2800000000000004e-06, 'epoch': 0.01} {'loss': 0.3163, 'learning_rate': 3.286666666666667e-06, 'epoch': 0.01} {'loss': 0.6545, 'learning_rate': 3.2933333333333333e-06, 'epoch': 0.01} {'loss': 0.5972, 'learning_rate': 3.3000000000000006e-06, 'epoch': 0.01} {'loss': 0.5087, 'learning_rate': 3.306666666666667e-06, 'epoch': 0.01} {'loss': 0.3289, 'learning_rate': 3.3133333333333335e-06, 'epoch': 0.01} {'loss': 0.3871, 'learning_rate': 3.3200000000000004e-06, 'epoch': 0.01} {'loss': 0.3438, 'learning_rate': 3.326666666666667e-06, 'epoch': 0.01} {'loss': 0.3446, 'learning_rate': 3.3333333333333333e-06, 'epoch': 0.01} {'loss': 0.4611, 'learning_rate': 3.3400000000000006e-06, 'epoch': 0.01} {'loss': 0.3622, 'learning_rate': 3.346666666666667e-06, 'epoch': 0.01} {'loss': 0.4508, 'learning_rate': 3.3533333333333336e-06, 'epoch': 0.01} {'loss': 0.3454, 'learning_rate': 3.3600000000000004e-06, 'epoch': 0.01} {'loss': 0.3799, 'learning_rate': 3.366666666666667e-06, 'epoch': 0.01} {'loss': 0.4601, 'learning_rate': 3.3733333333333334e-06, 'epoch': 0.01} {'loss': 0.4855, 'learning_rate': 3.3800000000000007e-06, 'epoch': 0.01} {'loss': 0.5099, 'learning_rate': 3.386666666666667e-06, 'epoch': 0.01} {'loss': 0.276, 'learning_rate': 3.3933333333333336e-06, 'epoch': 0.01} {'loss': 0.472, 'learning_rate': 3.4000000000000005e-06, 'epoch': 0.01} {'loss': 0.382, 'learning_rate': 3.406666666666667e-06, 'epoch': 0.01} {'loss': 0.4983, 'learning_rate': 3.4133333333333334e-06, 'epoch': 0.01} {'loss': 0.6184, 'learning_rate': 3.4200000000000007e-06, 'epoch': 0.01} {'loss': 0.409, 'learning_rate': 3.426666666666667e-06, 'epoch': 0.01} {'loss': 0.3773, 'learning_rate': 3.4333333333333336e-06, 'epoch': 0.01} {'loss': 0.5126, 'learning_rate': 3.44e-06, 'epoch': 0.01} {'loss': 0.4941, 'learning_rate': 3.446666666666667e-06, 'epoch': 0.01} {'loss': 0.5631, 'learning_rate': 3.4533333333333334e-06, 'epoch': 0.01} {'loss': 0.4543, 'learning_rate': 3.46e-06, 'epoch': 0.01} {'loss': 0.551, 'learning_rate': 3.4666666666666672e-06, 'epoch': 0.01} {'loss': 0.365, 'learning_rate': 3.4733333333333337e-06, 'epoch': 0.01} {'loss': 0.4045, 'learning_rate': 3.48e-06, 'epoch': 0.01} {'loss': 0.4176, 'learning_rate': 3.486666666666667e-06, 'epoch': 0.01} {'loss': 0.5646, 'learning_rate': 3.4933333333333335e-06, 'epoch': 0.01} {'loss': 0.6639, 'learning_rate': 3.5e-06, 'epoch': 0.01} {'loss': 0.4402, 'learning_rate': 3.5066666666666673e-06, 'epoch': 0.01} {'loss': 0.3119, 'learning_rate': 3.5133333333333337e-06, 'epoch': 0.01} {'loss': 0.3328, 'learning_rate': 3.52e-06, 'epoch': 0.01} {'loss': 0.4678, 'learning_rate': 3.526666666666667e-06, 'epoch': 0.01} {'loss': 0.5823, 'learning_rate': 3.5333333333333335e-06, 'epoch': 0.01} {'loss': 0.4254, 'learning_rate': 3.54e-06, 'epoch': 0.01} {'loss': 0.4187, 'learning_rate': 3.5466666666666673e-06, 'epoch': 0.01} {'loss': 0.3979, 'learning_rate': 3.5533333333333338e-06, 'epoch': 0.01} {'loss': 0.7653, 'learning_rate': 3.5600000000000002e-06, 'epoch': 0.01} {'loss': 0.4826, 'learning_rate': 3.566666666666667e-06, 'epoch': 0.01} {'loss': 0.7495, 'learning_rate': 3.5733333333333336e-06, 'epoch': 0.01} {'loss': 0.6721, 'learning_rate': 3.58e-06, 'epoch': 0.01} {'loss': 0.4903, 'learning_rate': 3.5866666666666673e-06, 'epoch': 0.01} {'loss': 0.3299, 'learning_rate': 3.593333333333334e-06, 'epoch': 0.01} {'loss': 0.3955, 'learning_rate': 3.6000000000000003e-06, 'epoch': 0.01} {'loss': 0.5318, 'learning_rate': 3.606666666666667e-06, 'epoch': 0.01} {'loss': 0.3214, 'learning_rate': 3.6133333333333336e-06, 'epoch': 0.01} {'loss': 0.6221, 'learning_rate': 3.62e-06, 'epoch': 0.01} {'loss': 0.3981, 'learning_rate': 3.6266666666666674e-06, 'epoch': 0.01} {'loss': 0.4441, 'learning_rate': 3.633333333333334e-06, 'epoch': 0.01} {'loss': 0.3969, 'learning_rate': 3.6400000000000003e-06, 'epoch': 0.01} {'loss': 0.4899, 'learning_rate': 3.6466666666666668e-06, 'epoch': 0.01} {'loss': 0.5604, 'learning_rate': 3.6533333333333336e-06, 'epoch': 0.01} {'loss': 0.414, 'learning_rate': 3.66e-06, 'epoch': 0.01} {'loss': 0.4546, 'learning_rate': 3.6666666666666666e-06, 'epoch': 0.01} {'loss': 0.5656, 'learning_rate': 3.673333333333334e-06, 'epoch': 0.01} {'loss': 0.5471, 'learning_rate': 3.6800000000000003e-06, 'epoch': 0.01} {'loss': 0.4687, 'learning_rate': 3.686666666666667e-06, 'epoch': 0.01} {'loss': 0.5515, 'learning_rate': 3.6933333333333337e-06, 'epoch': 0.01} {'loss': 0.555, 'learning_rate': 3.7e-06, 'epoch': 0.01} {'loss': 0.6057, 'learning_rate': 3.7066666666666666e-06, 'epoch': 0.01} {'loss': 0.3316, 'learning_rate': 3.713333333333334e-06, 'epoch': 0.01} {'loss': 0.451, 'learning_rate': 3.7200000000000004e-06, 'epoch': 0.01} {'loss': 0.5535, 'learning_rate': 3.726666666666667e-06, 'epoch': 0.01} {'loss': 0.2941, 'learning_rate': 3.7333333333333337e-06, 'epoch': 0.01} {'loss': 0.5203, 'learning_rate': 3.74e-06, 'epoch': 0.01} {'loss': 0.4486, 'learning_rate': 3.7466666666666667e-06, 'epoch': 0.01} {'loss': 0.7621, 'learning_rate': 3.753333333333334e-06, 'epoch': 0.01} {'loss': 0.4905, 'learning_rate': 3.7600000000000004e-06, 'epoch': 0.01} {'loss': 0.3151, 'learning_rate': 3.766666666666667e-06, 'epoch': 0.01} {'loss': 0.3931, 'learning_rate': 3.7733333333333338e-06, 'epoch': 0.01} {'loss': 0.4226, 'learning_rate': 3.7800000000000002e-06, 'epoch': 0.01} {'loss': 0.4276, 'learning_rate': 3.7866666666666667e-06, 'epoch': 0.01} {'loss': 0.4896, 'learning_rate': 3.793333333333334e-06, 'epoch': 0.01} {'loss': 0.3392, 'learning_rate': 3.8000000000000005e-06, 'epoch': 0.01} {'loss': 0.4373, 'learning_rate': 3.806666666666667e-06, 'epoch': 0.01} {'loss': 0.6529, 'learning_rate': 3.813333333333334e-06, 'epoch': 0.01} {'loss': 0.434, 'learning_rate': 3.820000000000001e-06, 'epoch': 0.01} {'loss': 0.3902, 'learning_rate': 3.826666666666667e-06, 'epoch': 0.01} {'loss': 0.502, 'learning_rate': 3.833333333333334e-06, 'epoch': 0.01} {'loss': 0.5192, 'learning_rate': 3.8400000000000005e-06, 'epoch': 0.01} {'loss': 0.3318, 'learning_rate': 3.8466666666666665e-06, 'epoch': 0.01} {'loss': 0.4317, 'learning_rate': 3.853333333333334e-06, 'epoch': 0.01} {'loss': 0.3338, 'learning_rate': 3.86e-06, 'epoch': 0.01} {'loss': 0.5251, 'learning_rate': 3.866666666666667e-06, 'epoch': 0.01} {'loss': 0.4588, 'learning_rate': 3.873333333333333e-06, 'epoch': 0.01} {'loss': 0.332, 'learning_rate': 3.88e-06, 'epoch': 0.01} {'loss': 0.2672, 'learning_rate': 3.886666666666667e-06, 'epoch': 0.01} {'loss': 0.4112, 'learning_rate': 3.893333333333333e-06, 'epoch': 0.01} {'loss': 0.4348, 'learning_rate': 3.900000000000001e-06, 'epoch': 0.01} {'loss': 0.4299, 'learning_rate': 3.906666666666667e-06, 'epoch': 0.01} {'loss': 0.4953, 'learning_rate': 3.913333333333334e-06, 'epoch': 0.01} {'loss': 0.3511, 'learning_rate': 3.920000000000001e-06, 'epoch': 0.01} {'loss': 0.3754, 'learning_rate': 3.926666666666667e-06, 'epoch': 0.01} {'loss': 0.4735, 'learning_rate': 3.9333333333333335e-06, 'epoch': 0.01} {'loss': 0.5173, 'learning_rate': 3.94e-06, 'epoch': 0.01} {'loss': 0.3647, 'learning_rate': 3.946666666666667e-06, 'epoch': 0.01} {'loss': 0.4635, 'learning_rate': 3.953333333333333e-06, 'epoch': 0.01} {'loss': 0.4425, 'learning_rate': 3.96e-06, 'epoch': 0.01} {'loss': 0.4108, 'learning_rate': 3.966666666666667e-06, 'epoch': 0.01} {'loss': 0.413, 'learning_rate': 3.973333333333333e-06, 'epoch': 0.01} {'loss': 0.3574, 'learning_rate': 3.980000000000001e-06, 'epoch': 0.01} {'loss': 0.5191, 'learning_rate': 3.986666666666667e-06, 'epoch': 0.01} {'loss': 0.2921, 'learning_rate': 3.993333333333334e-06, 'epoch': 0.01} {'loss': 0.4764, 'learning_rate': 4.000000000000001e-06, 'epoch': 0.01} {'loss': 0.4525, 'learning_rate': 4.006666666666667e-06, 'epoch': 0.01} {'loss': 0.7134, 'learning_rate': 4.013333333333334e-06, 'epoch': 0.01} {'loss': 0.47, 'learning_rate': 4.0200000000000005e-06, 'epoch': 0.01} {'loss': 0.3817, 'learning_rate': 4.026666666666667e-06, 'epoch': 0.01} {'loss': 0.5627, 'learning_rate': 4.033333333333333e-06, 'epoch': 0.01} {'loss': 0.5156, 'learning_rate': 4.04e-06, 'epoch': 0.01} {'loss': 0.5969, 'learning_rate': 4.046666666666667e-06, 'epoch': 0.01} {'loss': 0.3955, 'learning_rate': 4.053333333333333e-06, 'epoch': 0.01} {'loss': 0.3243, 'learning_rate': 4.060000000000001e-06, 'epoch': 0.01} {'loss': 0.3917, 'learning_rate': 4.066666666666667e-06, 'epoch': 0.01} {'loss': 0.5465, 'learning_rate': 4.073333333333334e-06, 'epoch': 0.01} {'loss': 0.4061, 'learning_rate': 4.08e-06, 'epoch': 0.01} {'loss': 0.3826, 'learning_rate': 4.086666666666667e-06, 'epoch': 0.01} {'loss': 0.4785, 'learning_rate': 4.093333333333334e-06, 'epoch': 0.01} {'loss': 0.3861, 'learning_rate': 4.1e-06, 'epoch': 0.01} {'loss': 0.3657, 'learning_rate': 4.1066666666666674e-06, 'epoch': 0.01} {'loss': 0.6439, 'learning_rate': 4.1133333333333335e-06, 'epoch': 0.01} {'loss': 0.2597, 'learning_rate': 4.12e-06, 'epoch': 0.01} {'loss': 0.6264, 'learning_rate': 4.126666666666667e-06, 'epoch': 0.01} {'loss': 0.2579, 'learning_rate': 4.133333333333333e-06, 'epoch': 0.01} {'loss': 0.4276, 'learning_rate': 4.14e-06, 'epoch': 0.01} {'loss': 0.43, 'learning_rate': 4.146666666666667e-06, 'epoch': 0.01} {'loss': 0.4513, 'learning_rate': 4.153333333333334e-06, 'epoch': 0.01} {'loss': 0.6046, 'learning_rate': 4.16e-06, 'epoch': 0.01} {'loss': 0.4533, 'learning_rate': 4.166666666666667e-06, 'epoch': 0.01} {'loss': 0.4538, 'learning_rate': 4.173333333333334e-06, 'epoch': 0.01} {'loss': 0.4893, 'learning_rate': 4.18e-06, 'epoch': 0.01} {'loss': 0.3797, 'learning_rate': 4.1866666666666675e-06, 'epoch': 0.01} {'loss': 0.5091, 'learning_rate': 4.1933333333333336e-06, 'epoch': 0.01} {'loss': 0.4794, 'learning_rate': 4.2000000000000004e-06, 'epoch': 0.01} {'loss': 0.2856, 'learning_rate': 4.206666666666667e-06, 'epoch': 0.01} {'loss': 0.4919, 'learning_rate': 4.213333333333333e-06, 'epoch': 0.01} {'loss': 0.6777, 'learning_rate': 4.22e-06, 'epoch': 0.01} {'loss': 0.2371, 'learning_rate': 4.226666666666667e-06, 'epoch': 0.01} {'loss': 0.5731, 'learning_rate': 4.233333333333334e-06, 'epoch': 0.01} {'loss': 0.5093, 'learning_rate': 4.24e-06, 'epoch': 0.01} {'loss': 0.5168, 'learning_rate': 4.246666666666667e-06, 'epoch': 0.01} {'loss': 0.3733, 'learning_rate': 4.253333333333334e-06, 'epoch': 0.01} {'loss': 0.5719, 'learning_rate': 4.26e-06, 'epoch': 0.01} {'loss': 0.4425, 'learning_rate': 4.266666666666668e-06, 'epoch': 0.01} {'loss': 0.3562, 'learning_rate': 4.273333333333334e-06, 'epoch': 0.01} {'loss': 0.3565, 'learning_rate': 4.2800000000000005e-06, 'epoch': 0.01} {'loss': 0.5683, 'learning_rate': 4.2866666666666666e-06, 'epoch': 0.01} {'loss': 0.4299, 'learning_rate': 4.2933333333333334e-06, 'epoch': 0.01} {'loss': 0.5189, 'learning_rate': 4.3e-06, 'epoch': 0.01} {'loss': 0.3944, 'learning_rate': 4.306666666666666e-06, 'epoch': 0.01} {'loss': 0.5021, 'learning_rate': 4.313333333333334e-06, 'epoch': 0.01} {'loss': 0.4536, 'learning_rate': 4.32e-06, 'epoch': 0.01} {'loss': 0.4224, 'learning_rate': 4.326666666666667e-06, 'epoch': 0.01} {'loss': 0.3794, 'learning_rate': 4.333333333333334e-06, 'epoch': 0.01} {'loss': 0.3917, 'learning_rate': 4.34e-06, 'epoch': 0.01} {'loss': 0.5487, 'learning_rate': 4.346666666666667e-06, 'epoch': 0.01} {'loss': 0.3321, 'learning_rate': 4.353333333333334e-06, 'epoch': 0.01} {'loss': 0.4843, 'learning_rate': 4.360000000000001e-06, 'epoch': 0.01} {'loss': 0.392, 'learning_rate': 4.366666666666667e-06, 'epoch': 0.01} {'loss': 0.3824, 'learning_rate': 4.3733333333333335e-06, 'epoch': 0.01} {'loss': 0.5014, 'learning_rate': 4.38e-06, 'epoch': 0.01} {'loss': 0.3744, 'learning_rate': 4.3866666666666665e-06, 'epoch': 0.01} {'loss': 0.2628, 'learning_rate': 4.393333333333334e-06, 'epoch': 0.01} {'loss': 0.6045, 'learning_rate': 4.4e-06, 'epoch': 0.01} {'loss': 0.5034, 'learning_rate': 4.406666666666667e-06, 'epoch': 0.01} {'loss': 0.5635, 'learning_rate': 4.413333333333334e-06, 'epoch': 0.01} {'loss': 0.464, 'learning_rate': 4.42e-06, 'epoch': 0.01} {'loss': 0.3793, 'learning_rate': 4.426666666666667e-06, 'epoch': 0.01} {'loss': 0.2603, 'learning_rate': 4.433333333333334e-06, 'epoch': 0.01} {'loss': 0.3898, 'learning_rate': 4.440000000000001e-06, 'epoch': 0.01} {'loss': 0.5153, 'learning_rate': 4.446666666666667e-06, 'epoch': 0.01} {'loss': 0.3818, 'learning_rate': 4.453333333333334e-06, 'epoch': 0.01} {'loss': 0.5509, 'learning_rate': 4.4600000000000005e-06, 'epoch': 0.01} {'loss': 0.5392, 'learning_rate': 4.4666666666666665e-06, 'epoch': 0.01} {'loss': 0.5217, 'learning_rate': 4.473333333333334e-06, 'epoch': 0.01} {'loss': 0.4107, 'learning_rate': 4.48e-06, 'epoch': 0.01} {'loss': 0.4965, 'learning_rate': 4.486666666666667e-06, 'epoch': 0.01} {'loss': 0.6352, 'learning_rate': 4.493333333333333e-06, 'epoch': 0.01} {'loss': 0.4229, 'learning_rate': 4.5e-06, 'epoch': 0.01} {'loss': 0.4888, 'learning_rate': 4.506666666666667e-06, 'epoch': 0.01} {'loss': 0.4203, 'learning_rate': 4.513333333333333e-06, 'epoch': 0.01} {'loss': 0.4256, 'learning_rate': 4.520000000000001e-06, 'epoch': 0.01} {'loss': 0.3732, 'learning_rate': 4.526666666666667e-06, 'epoch': 0.01} {'loss': 0.4087, 'learning_rate': 4.533333333333334e-06, 'epoch': 0.01} {'loss': 0.4385, 'learning_rate': 4.540000000000001e-06, 'epoch': 0.01} {'loss': 0.4277, 'learning_rate': 4.546666666666667e-06, 'epoch': 0.01} {'loss': 0.5516, 'learning_rate': 4.5533333333333335e-06, 'epoch': 0.01} {'loss': 0.6247, 'learning_rate': 4.56e-06, 'epoch': 0.01} {'loss': 0.6015, 'learning_rate': 4.566666666666667e-06, 'epoch': 0.01} {'loss': 0.5243, 'learning_rate': 4.573333333333333e-06, 'epoch': 0.01} {'loss': 0.4094, 'learning_rate': 4.58e-06, 'epoch': 0.01} {'loss': 0.3479, 'learning_rate': 4.586666666666667e-06, 'epoch': 0.01} {'loss': 0.5269, 'learning_rate': 4.593333333333333e-06, 'epoch': 0.01} {'loss': 0.4242, 'learning_rate': 4.600000000000001e-06, 'epoch': 0.01} {'loss': 0.4741, 'learning_rate': 4.606666666666667e-06, 'epoch': 0.01} {'loss': 0.41, 'learning_rate': 4.613333333333334e-06, 'epoch': 0.01} {'loss': 0.4958, 'learning_rate': 4.620000000000001e-06, 'epoch': 0.01} {'loss': 0.4376, 'learning_rate': 4.626666666666667e-06, 'epoch': 0.01} {'loss': 0.5322, 'learning_rate': 4.633333333333334e-06, 'epoch': 0.01} {'loss': 0.4866, 'learning_rate': 4.6400000000000005e-06, 'epoch': 0.01} {'loss': 0.5177, 'learning_rate': 4.646666666666667e-06, 'epoch': 0.01} {'loss': 0.5191, 'learning_rate': 4.653333333333333e-06, 'epoch': 0.01} {'loss': 0.4891, 'learning_rate': 4.66e-06, 'epoch': 0.01} {'loss': 0.2877, 'learning_rate': 4.666666666666667e-06, 'epoch': 0.01} {'loss': 0.3882, 'learning_rate': 4.673333333333333e-06, 'epoch': 0.01} {'loss': 0.5141, 'learning_rate': 4.680000000000001e-06, 'epoch': 0.01} {'loss': 0.4211, 'learning_rate': 4.686666666666667e-06, 'epoch': 0.01} {'loss': 0.5043, 'learning_rate': 4.693333333333334e-06, 'epoch': 0.01} {'loss': 0.4726, 'learning_rate': 4.7e-06, 'epoch': 0.01} {'loss': 0.5411, 'learning_rate': 4.706666666666667e-06, 'epoch': 0.01} {'loss': 0.5731, 'learning_rate': 4.713333333333334e-06, 'epoch': 0.01} {'loss': 0.4911, 'learning_rate': 4.7200000000000005e-06, 'epoch': 0.01} {'loss': 0.4722, 'learning_rate': 4.7266666666666674e-06, 'epoch': 0.01} {'loss': 0.4068, 'learning_rate': 4.7333333333333335e-06, 'epoch': 0.01} {'loss': 0.4495, 'learning_rate': 4.74e-06, 'epoch': 0.01} {'loss': 0.5126, 'learning_rate': 4.746666666666667e-06, 'epoch': 0.01} {'loss': 0.4273, 'learning_rate': 4.753333333333333e-06, 'epoch': 0.01} {'loss': 0.4416, 'learning_rate': 4.76e-06, 'epoch': 0.01} {'loss': 0.494, 'learning_rate': 4.766666666666667e-06, 'epoch': 0.01} {'loss': 0.3573, 'learning_rate': 4.773333333333334e-06, 'epoch': 0.01} {'loss': 0.4745, 'learning_rate': 4.78e-06, 'epoch': 0.01} {'loss': 0.4212, 'learning_rate': 4.786666666666667e-06, 'epoch': 0.01} {'loss': 0.4907, 'learning_rate': 4.793333333333334e-06, 'epoch': 0.01} {'loss': 0.4529, 'learning_rate': 4.800000000000001e-06, 'epoch': 0.01} {'loss': 0.5296, 'learning_rate': 4.8066666666666675e-06, 'epoch': 0.01} {'loss': 0.5809, 'learning_rate': 4.8133333333333336e-06, 'epoch': 0.01} {'loss': 0.3806, 'learning_rate': 4.8200000000000004e-06, 'epoch': 0.01} {'loss': 0.5414, 'learning_rate': 4.826666666666667e-06, 'epoch': 0.02} {'loss': 0.5595, 'learning_rate': 4.833333333333333e-06, 'epoch': 0.02} {'loss': 0.2654, 'learning_rate': 4.84e-06, 'epoch': 0.02} {'loss': 0.4102, 'learning_rate': 4.846666666666667e-06, 'epoch': 0.02} {'loss': 0.6036, 'learning_rate': 4.853333333333334e-06, 'epoch': 0.02} {'loss': 0.3649, 'learning_rate': 4.86e-06, 'epoch': 0.02} {'loss': 0.381, 'learning_rate': 4.866666666666667e-06, 'epoch': 0.02} {'loss': 0.4008, 'learning_rate': 4.873333333333334e-06, 'epoch': 0.02} {'loss': 0.4709, 'learning_rate': 4.880000000000001e-06, 'epoch': 0.02} {'loss': 0.6691, 'learning_rate': 4.886666666666668e-06, 'epoch': 0.02} {'loss': 0.5299, 'learning_rate': 4.893333333333334e-06, 'epoch': 0.02} {'loss': 0.3851, 'learning_rate': 4.9000000000000005e-06, 'epoch': 0.02} {'loss': 0.3627, 'learning_rate': 4.9066666666666666e-06, 'epoch': 0.02} {'loss': 0.6558, 'learning_rate': 4.9133333333333334e-06, 'epoch': 0.02} {'loss': 0.3347, 'learning_rate': 4.92e-06, 'epoch': 0.02} {'loss': 0.3999, 'learning_rate': 4.926666666666667e-06, 'epoch': 0.02} {'loss': 0.4099, 'learning_rate': 4.933333333333334e-06, 'epoch': 0.02} {'loss': 0.3684, 'learning_rate': 4.94e-06, 'epoch': 0.02} {'loss': 0.4605, 'learning_rate': 4.946666666666667e-06, 'epoch': 0.02} {'loss': 0.7341, 'learning_rate': 4.953333333333334e-06, 'epoch': 0.02} {'loss': 0.3895, 'learning_rate': 4.960000000000001e-06, 'epoch': 0.02} {'loss': 0.5279, 'learning_rate': 4.966666666666667e-06, 'epoch': 0.02} {'loss': 0.3849, 'learning_rate': 4.973333333333334e-06, 'epoch': 0.02} {'loss': 0.3498, 'learning_rate': 4.980000000000001e-06, 'epoch': 0.02} {'loss': 0.3328, 'learning_rate': 4.986666666666667e-06, 'epoch': 0.02} {'loss': 0.4759, 'learning_rate': 4.9933333333333335e-06, 'epoch': 0.02} {'loss': 0.4985, 'learning_rate': 5e-06, 'epoch': 0.02} {'loss': 0.524, 'learning_rate': 5.006666666666667e-06, 'epoch': 0.02} {'loss': 0.3788, 'learning_rate': 5.013333333333333e-06, 'epoch': 0.02} {'loss': 0.4554, 'learning_rate': 5.02e-06, 'epoch': 0.02} {'loss': 0.3119, 'learning_rate': 5.026666666666667e-06, 'epoch': 0.02} {'loss': 0.4264, 'learning_rate': 5.033333333333333e-06, 'epoch': 0.02} {'loss': 0.4794, 'learning_rate': 5.04e-06, 'epoch': 0.02} {'loss': 0.5925, 'learning_rate': 5.046666666666668e-06, 'epoch': 0.02} {'loss': 0.4449, 'learning_rate': 5.053333333333334e-06, 'epoch': 0.02} {'loss': 0.4325, 'learning_rate': 5.060000000000001e-06, 'epoch': 0.02} {'loss': 0.3298, 'learning_rate': 5.0666666666666676e-06, 'epoch': 0.02} {'loss': 0.583, 'learning_rate': 5.073333333333334e-06, 'epoch': 0.02} {'loss': 0.3985, 'learning_rate': 5.0800000000000005e-06, 'epoch': 0.02} {'loss': 0.4535, 'learning_rate': 5.086666666666667e-06, 'epoch': 0.02} {'loss': 0.4004, 'learning_rate': 5.093333333333333e-06, 'epoch': 0.02} {'loss': 0.4328, 'learning_rate': 5.1e-06, 'epoch': 0.02} {'loss': 0.4319, 'learning_rate': 5.106666666666667e-06, 'epoch': 0.02} {'loss': 0.5192, 'learning_rate': 5.113333333333333e-06, 'epoch': 0.02} {'loss': 0.4333, 'learning_rate': 5.12e-06, 'epoch': 0.02} {'loss': 0.4316, 'learning_rate': 5.126666666666668e-06, 'epoch': 0.02} {'loss': 0.3732, 'learning_rate': 5.133333333333334e-06, 'epoch': 0.02} {'loss': 0.5309, 'learning_rate': 5.140000000000001e-06, 'epoch': 0.02} {'loss': 0.5539, 'learning_rate': 5.146666666666668e-06, 'epoch': 0.02} {'loss': 0.3891, 'learning_rate': 5.153333333333334e-06, 'epoch': 0.02} {'loss': 0.4994, 'learning_rate': 5.1600000000000006e-06, 'epoch': 0.02} {'loss': 0.5753, 'learning_rate': 5.1666666666666675e-06, 'epoch': 0.02} {'loss': 0.4525, 'learning_rate': 5.1733333333333335e-06, 'epoch': 0.02} {'loss': 0.2262, 'learning_rate': 5.18e-06, 'epoch': 0.02} {'loss': 0.3916, 'learning_rate': 5.186666666666667e-06, 'epoch': 0.02} {'loss': 0.3913, 'learning_rate': 5.193333333333333e-06, 'epoch': 0.02} {'loss': 0.4084, 'learning_rate': 5.2e-06, 'epoch': 0.02} {'loss': 0.4403, 'learning_rate': 5.206666666666668e-06, 'epoch': 0.02} {'loss': 0.4453, 'learning_rate': 5.213333333333334e-06, 'epoch': 0.02} {'loss': 0.4436, 'learning_rate': 5.220000000000001e-06, 'epoch': 0.02} {'loss': 0.5806, 'learning_rate': 5.226666666666667e-06, 'epoch': 0.02} {'loss': 0.4998, 'learning_rate': 5.233333333333334e-06, 'epoch': 0.02} {'loss': 0.434, 'learning_rate': 5.240000000000001e-06, 'epoch': 0.02} {'loss': 0.4241, 'learning_rate': 5.246666666666667e-06, 'epoch': 0.02} {'loss': 0.3083, 'learning_rate': 5.2533333333333336e-06, 'epoch': 0.02} {'loss': 0.4015, 'learning_rate': 5.2600000000000005e-06, 'epoch': 0.02} {'loss': 0.51, 'learning_rate': 5.2666666666666665e-06, 'epoch': 0.02} {'loss': 0.4331, 'learning_rate': 5.273333333333333e-06, 'epoch': 0.02} {'loss': 0.3275, 'learning_rate': 5.28e-06, 'epoch': 0.02} {'loss': 0.5127, 'learning_rate': 5.286666666666666e-06, 'epoch': 0.02} {'loss': 0.3612, 'learning_rate': 5.293333333333334e-06, 'epoch': 0.02} {'loss': 0.5178, 'learning_rate': 5.300000000000001e-06, 'epoch': 0.02} {'loss': 0.3895, 'learning_rate': 5.306666666666667e-06, 'epoch': 0.02} {'loss': 0.4288, 'learning_rate': 5.313333333333334e-06, 'epoch': 0.02} {'loss': 0.4871, 'learning_rate': 5.320000000000001e-06, 'epoch': 0.02} {'loss': 0.5809, 'learning_rate': 5.326666666666667e-06, 'epoch': 0.02} {'loss': 0.3478, 'learning_rate': 5.333333333333334e-06, 'epoch': 0.02} {'loss': 0.457, 'learning_rate': 5.3400000000000005e-06, 'epoch': 0.02} {'loss': 0.494, 'learning_rate': 5.346666666666667e-06, 'epoch': 0.02} {'loss': 0.5789, 'learning_rate': 5.3533333333333335e-06, 'epoch': 0.02} {'loss': 0.3745, 'learning_rate': 5.36e-06, 'epoch': 0.02} {'loss': 0.353, 'learning_rate': 5.366666666666666e-06, 'epoch': 0.02} {'loss': 0.5416, 'learning_rate': 5.373333333333334e-06, 'epoch': 0.02} {'loss': 0.4114, 'learning_rate': 5.380000000000001e-06, 'epoch': 0.02} {'loss': 0.4525, 'learning_rate': 5.386666666666667e-06, 'epoch': 0.02} {'loss': 0.4126, 'learning_rate': 5.393333333333334e-06, 'epoch': 0.02} {'loss': 0.7096, 'learning_rate': 5.400000000000001e-06, 'epoch': 0.02} {'loss': 0.5982, 'learning_rate': 5.406666666666667e-06, 'epoch': 0.02} {'loss': 0.452, 'learning_rate': 5.413333333333334e-06, 'epoch': 0.02} {'loss': 0.5418, 'learning_rate': 5.420000000000001e-06, 'epoch': 0.02} {'loss': 0.6598, 'learning_rate': 5.426666666666667e-06, 'epoch': 0.02} {'loss': 0.4675, 'learning_rate': 5.4333333333333335e-06, 'epoch': 0.02} {'loss': 0.3288, 'learning_rate': 5.4400000000000004e-06, 'epoch': 0.02} {'loss': 0.7251, 'learning_rate': 5.4466666666666665e-06, 'epoch': 0.02} {'loss': 0.3719, 'learning_rate': 5.453333333333334e-06, 'epoch': 0.02} {'loss': 0.5784, 'learning_rate': 5.460000000000001e-06, 'epoch': 0.02} {'loss': 0.3628, 'learning_rate': 5.466666666666667e-06, 'epoch': 0.02} {'loss': 0.3842, 'learning_rate': 5.473333333333334e-06, 'epoch': 0.02} {'loss': 0.4854, 'learning_rate': 5.480000000000001e-06, 'epoch': 0.02} {'loss': 0.5163, 'learning_rate': 5.486666666666667e-06, 'epoch': 0.02} {'loss': 0.3159, 'learning_rate': 5.493333333333334e-06, 'epoch': 0.02} {'loss': 0.4179, 'learning_rate': 5.500000000000001e-06, 'epoch': 0.02} {'loss': 0.4197, 'learning_rate': 5.506666666666667e-06, 'epoch': 0.02} {'loss': 0.4849, 'learning_rate': 5.513333333333334e-06, 'epoch': 0.02} {'loss': 0.4421, 'learning_rate': 5.5200000000000005e-06, 'epoch': 0.02} {'loss': 0.3527, 'learning_rate': 5.5266666666666666e-06, 'epoch': 0.02} {'loss': 0.4183, 'learning_rate': 5.533333333333334e-06, 'epoch': 0.02} {'loss': 0.3174, 'learning_rate': 5.540000000000001e-06, 'epoch': 0.02} {'loss': 0.3949, 'learning_rate': 5.546666666666667e-06, 'epoch': 0.02} {'loss': 0.3545, 'learning_rate': 5.553333333333334e-06, 'epoch': 0.02} {'loss': 0.4305, 'learning_rate': 5.560000000000001e-06, 'epoch': 0.02} {'loss': 0.3561, 'learning_rate': 5.566666666666667e-06, 'epoch': 0.02} {'loss': 0.4403, 'learning_rate': 5.573333333333334e-06, 'epoch': 0.02} {'loss': 0.4495, 'learning_rate': 5.580000000000001e-06, 'epoch': 0.02} {'loss': 0.6136, 'learning_rate': 5.586666666666667e-06, 'epoch': 0.02} {'loss': 0.2194, 'learning_rate': 5.593333333333334e-06, 'epoch': 0.02} {'loss': 0.3084, 'learning_rate': 5.600000000000001e-06, 'epoch': 0.02} {'loss': 0.5073, 'learning_rate': 5.606666666666667e-06, 'epoch': 0.02} {'loss': 0.5219, 'learning_rate': 5.613333333333334e-06, 'epoch': 0.02} {'loss': 0.5033, 'learning_rate': 5.620000000000001e-06, 'epoch': 0.02} {'loss': 0.5771, 'learning_rate': 5.626666666666667e-06, 'epoch': 0.02} {'loss': 0.4117, 'learning_rate': 5.633333333333334e-06, 'epoch': 0.02} {'loss': 0.3509, 'learning_rate': 5.64e-06, 'epoch': 0.02} {'loss': 0.3994, 'learning_rate': 5.646666666666667e-06, 'epoch': 0.02} {'loss': 0.3212, 'learning_rate': 5.653333333333334e-06, 'epoch': 0.02} {'loss': 0.3717, 'learning_rate': 5.66e-06, 'epoch': 0.02} {'loss': 0.4739, 'learning_rate': 5.666666666666667e-06, 'epoch': 0.02} {'loss': 0.6889, 'learning_rate': 5.673333333333334e-06, 'epoch': 0.02} {'loss': 0.3579, 'learning_rate': 5.68e-06, 'epoch': 0.02} {'loss': 0.4597, 'learning_rate': 5.686666666666667e-06, 'epoch': 0.02} {'loss': 0.4484, 'learning_rate': 5.6933333333333344e-06, 'epoch': 0.02} {'loss': 0.535, 'learning_rate': 5.7e-06, 'epoch': 0.02} {'loss': 0.4393, 'learning_rate': 5.706666666666667e-06, 'epoch': 0.02} {'loss': 0.5424, 'learning_rate': 5.713333333333334e-06, 'epoch': 0.02} {'loss': 0.4466, 'learning_rate': 5.72e-06, 'epoch': 0.02} {'loss': 0.3757, 'learning_rate': 5.726666666666667e-06, 'epoch': 0.02} {'loss': 0.5671, 'learning_rate': 5.733333333333334e-06, 'epoch': 0.02} {'loss': 0.5124, 'learning_rate': 5.74e-06, 'epoch': 0.02} {'loss': 0.3108, 'learning_rate': 5.746666666666667e-06, 'epoch': 0.02} {'loss': 0.5512, 'learning_rate': 5.753333333333334e-06, 'epoch': 0.02} {'loss': 0.4877, 'learning_rate': 5.76e-06, 'epoch': 0.02} {'loss': 0.4639, 'learning_rate': 5.766666666666667e-06, 'epoch': 0.02} {'loss': 0.4356, 'learning_rate': 5.7733333333333345e-06, 'epoch': 0.02} {'loss': 0.5881, 'learning_rate': 5.78e-06, 'epoch': 0.02} {'loss': 0.3782, 'learning_rate': 5.7866666666666674e-06, 'epoch': 0.02} {'loss': 0.3862, 'learning_rate': 5.793333333333334e-06, 'epoch': 0.02} {'loss': 0.4243, 'learning_rate': 5.8e-06, 'epoch': 0.02} {'loss': 0.4715, 'learning_rate': 5.806666666666667e-06, 'epoch': 0.02} {'loss': 0.6682, 'learning_rate': 5.813333333333334e-06, 'epoch': 0.02} {'loss': 0.4527, 'learning_rate': 5.82e-06, 'epoch': 0.02} {'loss': 0.411, 'learning_rate': 5.826666666666667e-06, 'epoch': 0.02} {'loss': 0.4278, 'learning_rate': 5.833333333333334e-06, 'epoch': 0.02} {'loss': 0.5406, 'learning_rate': 5.84e-06, 'epoch': 0.02} {'loss': 0.59, 'learning_rate': 5.846666666666667e-06, 'epoch': 0.02} {'loss': 0.4403, 'learning_rate': 5.853333333333335e-06, 'epoch': 0.02} {'loss': 0.2451, 'learning_rate': 5.86e-06, 'epoch': 0.02} {'loss': 0.4574, 'learning_rate': 5.8666666666666675e-06, 'epoch': 0.02} {'loss': 0.6344, 'learning_rate': 5.873333333333334e-06, 'epoch': 0.02} {'loss': 0.5307, 'learning_rate': 5.8800000000000005e-06, 'epoch': 0.02} {'loss': 0.6954, 'learning_rate': 5.886666666666667e-06, 'epoch': 0.02} {'loss': 0.3953, 'learning_rate': 5.893333333333334e-06, 'epoch': 0.02} {'loss': 0.3921, 'learning_rate': 5.9e-06, 'epoch': 0.02} {'loss': 0.4396, 'learning_rate': 5.906666666666667e-06, 'epoch': 0.02} {'loss': 0.5976, 'learning_rate': 5.913333333333334e-06, 'epoch': 0.02} {'loss': 0.4299, 'learning_rate': 5.92e-06, 'epoch': 0.02} {'loss': 0.541, 'learning_rate': 5.926666666666667e-06, 'epoch': 0.02} {'loss': 0.4057, 'learning_rate': 5.933333333333335e-06, 'epoch': 0.02} {'loss': 0.4777, 'learning_rate': 5.94e-06, 'epoch': 0.02} {'loss': 0.381, 'learning_rate': 5.946666666666668e-06, 'epoch': 0.02} {'loss': 0.4804, 'learning_rate': 5.9533333333333345e-06, 'epoch': 0.02} {'loss': 0.3033, 'learning_rate': 5.9600000000000005e-06, 'epoch': 0.02} {'loss': 0.293, 'learning_rate': 5.966666666666667e-06, 'epoch': 0.02} {'loss': 0.4727, 'learning_rate': 5.973333333333334e-06, 'epoch': 0.02} {'loss': 0.4164, 'learning_rate': 5.98e-06, 'epoch': 0.02} {'loss': 0.5045, 'learning_rate': 5.986666666666667e-06, 'epoch': 0.02} {'loss': 0.544, 'learning_rate': 5.993333333333334e-06, 'epoch': 0.02} {'loss': 0.4858, 'learning_rate': 6e-06, 'epoch': 0.02} {'loss': 0.5824, 'learning_rate': 6.006666666666667e-06, 'epoch': 0.02} {'loss': 0.5834, 'learning_rate': 6.013333333333335e-06, 'epoch': 0.02} {'loss': 0.4035, 'learning_rate': 6.02e-06, 'epoch': 0.02} {'loss': 0.4132, 'learning_rate': 6.026666666666668e-06, 'epoch': 0.02} {'loss': 0.4579, 'learning_rate': 6.033333333333335e-06, 'epoch': 0.02} {'loss': 0.4855, 'learning_rate': 6.040000000000001e-06, 'epoch': 0.02} {'loss': 0.475, 'learning_rate': 6.0466666666666675e-06, 'epoch': 0.02} {'loss': 0.642, 'learning_rate': 6.0533333333333335e-06, 'epoch': 0.02} {'loss': 0.3571, 'learning_rate': 6.0600000000000004e-06, 'epoch': 0.02} {'loss': 0.5478, 'learning_rate': 6.066666666666667e-06, 'epoch': 0.02} {'loss': 0.3095, 'learning_rate': 6.073333333333333e-06, 'epoch': 0.02} {'loss': 0.568, 'learning_rate': 6.08e-06, 'epoch': 0.02} {'loss': 0.4576, 'learning_rate': 6.086666666666667e-06, 'epoch': 0.02} {'loss': 0.3931, 'learning_rate': 6.093333333333333e-06, 'epoch': 0.02} {'loss': 0.4409, 'learning_rate': 6.1e-06, 'epoch': 0.02} {'loss': 0.4192, 'learning_rate': 6.106666666666668e-06, 'epoch': 0.02} {'loss': 0.2974, 'learning_rate': 6.113333333333333e-06, 'epoch': 0.02} {'loss': 0.3915, 'learning_rate': 6.120000000000001e-06, 'epoch': 0.02} {'loss': 0.4303, 'learning_rate': 6.126666666666668e-06, 'epoch': 0.02} {'loss': 0.4651, 'learning_rate': 6.133333333333334e-06, 'epoch': 0.02} {'loss': 0.4073, 'learning_rate': 6.1400000000000005e-06, 'epoch': 0.02} {'loss': 0.5547, 'learning_rate': 6.146666666666667e-06, 'epoch': 0.02} {'loss': 0.4676, 'learning_rate': 6.1533333333333334e-06, 'epoch': 0.02} {'loss': 0.4613, 'learning_rate': 6.16e-06, 'epoch': 0.02} {'loss': 0.3519, 'learning_rate': 6.166666666666667e-06, 'epoch': 0.02} {'loss': 0.4628, 'learning_rate': 6.173333333333333e-06, 'epoch': 0.02} {'loss': 0.5065, 'learning_rate': 6.18e-06, 'epoch': 0.02} {'loss': 0.3784, 'learning_rate': 6.186666666666668e-06, 'epoch': 0.02} {'loss': 0.5709, 'learning_rate': 6.193333333333333e-06, 'epoch': 0.02} {'loss': 0.2603, 'learning_rate': 6.200000000000001e-06, 'epoch': 0.02} {'loss': 0.58, 'learning_rate': 6.206666666666668e-06, 'epoch': 0.02} {'loss': 0.5327, 'learning_rate': 6.213333333333334e-06, 'epoch': 0.02} {'loss': 0.414, 'learning_rate': 6.220000000000001e-06, 'epoch': 0.02} {'loss': 0.4045, 'learning_rate': 6.2266666666666675e-06, 'epoch': 0.02} {'loss': 0.4822, 'learning_rate': 6.2333333333333335e-06, 'epoch': 0.02} {'loss': 0.3579, 'learning_rate': 6.24e-06, 'epoch': 0.02} {'loss': 0.4266, 'learning_rate': 6.246666666666667e-06, 'epoch': 0.02} {'loss': 0.4614, 'learning_rate': 6.253333333333333e-06, 'epoch': 0.02} {'loss': 0.2557, 'learning_rate': 6.26e-06, 'epoch': 0.02} {'loss': 0.4458, 'learning_rate': 6.266666666666668e-06, 'epoch': 0.02} {'loss': 0.4617, 'learning_rate': 6.273333333333333e-06, 'epoch': 0.02} {'loss': 0.6606, 'learning_rate': 6.280000000000001e-06, 'epoch': 0.02} {'loss': 0.4581, 'learning_rate': 6.286666666666668e-06, 'epoch': 0.02} {'loss': 0.3506, 'learning_rate': 6.293333333333334e-06, 'epoch': 0.02} {'loss': 0.5693, 'learning_rate': 6.300000000000001e-06, 'epoch': 0.02} {'loss': 0.4496, 'learning_rate': 6.3066666666666676e-06, 'epoch': 0.02} {'loss': 0.3973, 'learning_rate': 6.313333333333334e-06, 'epoch': 0.02} {'loss': 0.4867, 'learning_rate': 6.3200000000000005e-06, 'epoch': 0.02} {'loss': 0.4463, 'learning_rate': 6.326666666666667e-06, 'epoch': 0.02} {'loss': 0.4972, 'learning_rate': 6.333333333333333e-06, 'epoch': 0.02} {'loss': 0.4276, 'learning_rate': 6.34e-06, 'epoch': 0.02} {'loss': 0.3162, 'learning_rate': 6.346666666666668e-06, 'epoch': 0.02} {'loss': 0.5678, 'learning_rate': 6.353333333333333e-06, 'epoch': 0.02} {'loss': 0.4916, 'learning_rate': 6.360000000000001e-06, 'epoch': 0.02} {'loss': 0.4292, 'learning_rate': 6.366666666666668e-06, 'epoch': 0.02} {'loss': 0.4079, 'learning_rate': 6.373333333333334e-06, 'epoch': 0.02} {'loss': 0.5867, 'learning_rate': 6.380000000000001e-06, 'epoch': 0.02} {'loss': 0.4113, 'learning_rate': 6.386666666666668e-06, 'epoch': 0.02} {'loss': 0.3338, 'learning_rate': 6.393333333333334e-06, 'epoch': 0.02} {'loss': 0.3415, 'learning_rate': 6.4000000000000006e-06, 'epoch': 0.02} {'loss': 0.4172, 'learning_rate': 6.4066666666666674e-06, 'epoch': 0.02} {'loss': 0.4311, 'learning_rate': 6.4133333333333335e-06, 'epoch': 0.02} {'loss': 0.4618, 'learning_rate': 6.42e-06, 'epoch': 0.02} {'loss': 0.5444, 'learning_rate': 6.426666666666668e-06, 'epoch': 0.02} {'loss': 0.3544, 'learning_rate': 6.433333333333333e-06, 'epoch': 0.02} {'loss': 0.4864, 'learning_rate': 6.440000000000001e-06, 'epoch': 0.02} {'loss': 0.6158, 'learning_rate': 6.446666666666668e-06, 'epoch': 0.02} {'loss': 0.371, 'learning_rate': 6.453333333333334e-06, 'epoch': 0.02} {'loss': 0.5185, 'learning_rate': 6.460000000000001e-06, 'epoch': 0.02} {'loss': 0.3811, 'learning_rate': 6.466666666666667e-06, 'epoch': 0.02} {'loss': 0.3638, 'learning_rate': 6.473333333333334e-06, 'epoch': 0.02} {'loss': 0.5038, 'learning_rate': 6.480000000000001e-06, 'epoch': 0.02} {'loss': 0.4353, 'learning_rate': 6.486666666666667e-06, 'epoch': 0.02} {'loss': 0.41, 'learning_rate': 6.4933333333333336e-06, 'epoch': 0.02} {'loss': 0.4804, 'learning_rate': 6.5000000000000004e-06, 'epoch': 0.02} {'loss': 0.4338, 'learning_rate': 6.5066666666666665e-06, 'epoch': 0.02} {'loss': 0.5948, 'learning_rate': 6.513333333333333e-06, 'epoch': 0.02} {'loss': 0.542, 'learning_rate': 6.520000000000001e-06, 'epoch': 0.02} {'loss': 0.5397, 'learning_rate': 6.526666666666666e-06, 'epoch': 0.02} {'loss': 0.3482, 'learning_rate': 6.533333333333334e-06, 'epoch': 0.02} {'loss': 0.4561, 'learning_rate': 6.540000000000001e-06, 'epoch': 0.02} {'loss': 0.4634, 'learning_rate': 6.546666666666667e-06, 'epoch': 0.02} {'loss': 0.5407, 'learning_rate': 6.553333333333334e-06, 'epoch': 0.02} {'loss': 0.3688, 'learning_rate': 6.560000000000001e-06, 'epoch': 0.02} {'loss': 0.494, 'learning_rate': 6.566666666666667e-06, 'epoch': 0.02} {'loss': 0.4176, 'learning_rate': 6.573333333333334e-06, 'epoch': 0.02} {'loss': 0.7357, 'learning_rate': 6.5800000000000005e-06, 'epoch': 0.02} {'loss': 0.3403, 'learning_rate': 6.5866666666666666e-06, 'epoch': 0.02} {'loss': 0.3927, 'learning_rate': 6.5933333333333335e-06, 'epoch': 0.02} {'loss': 0.4715, 'learning_rate': 6.600000000000001e-06, 'epoch': 0.02} {'loss': 0.4512, 'learning_rate': 6.606666666666666e-06, 'epoch': 0.02} {'loss': 0.3753, 'learning_rate': 6.613333333333334e-06, 'epoch': 0.02} {'loss': 0.4577, 'learning_rate': 6.620000000000001e-06, 'epoch': 0.02} {'loss': 0.4166, 'learning_rate': 6.626666666666667e-06, 'epoch': 0.02} {'loss': 0.3155, 'learning_rate': 6.633333333333334e-06, 'epoch': 0.02} {'loss': 0.3123, 'learning_rate': 6.640000000000001e-06, 'epoch': 0.02} {'loss': 0.4211, 'learning_rate': 6.646666666666667e-06, 'epoch': 0.02} {'loss': 0.4354, 'learning_rate': 6.653333333333334e-06, 'epoch': 0.02} {'loss': 0.5989, 'learning_rate': 6.660000000000001e-06, 'epoch': 0.02} {'loss': 0.5993, 'learning_rate': 6.666666666666667e-06, 'epoch': 0.02} {'loss': 0.4603, 'learning_rate': 6.6733333333333335e-06, 'epoch': 0.02} {'loss': 0.394, 'learning_rate': 6.680000000000001e-06, 'epoch': 0.02} {'loss': 0.4645, 'learning_rate': 6.6866666666666665e-06, 'epoch': 0.02} {'loss': 0.5712, 'learning_rate': 6.693333333333334e-06, 'epoch': 0.02} {'loss': 0.3357, 'learning_rate': 6.700000000000001e-06, 'epoch': 0.02} {'loss': 0.4516, 'learning_rate': 6.706666666666667e-06, 'epoch': 0.02} {'loss': 0.7134, 'learning_rate': 6.713333333333334e-06, 'epoch': 0.02} {'loss': 0.4141, 'learning_rate': 6.720000000000001e-06, 'epoch': 0.02} {'loss': 0.3466, 'learning_rate': 6.726666666666667e-06, 'epoch': 0.02} {'loss': 0.3588, 'learning_rate': 6.733333333333334e-06, 'epoch': 0.02} {'loss': 0.4942, 'learning_rate': 6.740000000000001e-06, 'epoch': 0.02} {'loss': 0.4693, 'learning_rate': 6.746666666666667e-06, 'epoch': 0.02} {'loss': 0.2967, 'learning_rate': 6.753333333333334e-06, 'epoch': 0.02} {'loss': 0.4181, 'learning_rate': 6.760000000000001e-06, 'epoch': 0.02} {'loss': 0.3328, 'learning_rate': 6.7666666666666665e-06, 'epoch': 0.02} {'loss': 0.3843, 'learning_rate': 6.773333333333334e-06, 'epoch': 0.02} {'loss': 0.2821, 'learning_rate': 6.780000000000001e-06, 'epoch': 0.02} {'loss': 0.3722, 'learning_rate': 6.786666666666667e-06, 'epoch': 0.02} {'loss': 0.4561, 'learning_rate': 6.793333333333334e-06, 'epoch': 0.02} {'loss': 0.3856, 'learning_rate': 6.800000000000001e-06, 'epoch': 0.02} {'loss': 0.3617, 'learning_rate': 6.806666666666667e-06, 'epoch': 0.02} {'loss': 0.4155, 'learning_rate': 6.813333333333334e-06, 'epoch': 0.02} {'loss': 0.5501, 'learning_rate': 6.820000000000001e-06, 'epoch': 0.02} {'loss': 0.3588, 'learning_rate': 6.826666666666667e-06, 'epoch': 0.02} {'loss': 0.4046, 'learning_rate': 6.833333333333334e-06, 'epoch': 0.02} {'loss': 0.5297, 'learning_rate': 6.8400000000000014e-06, 'epoch': 0.02} {'loss': 0.4303, 'learning_rate': 6.846666666666667e-06, 'epoch': 0.02} {'loss': 0.5486, 'learning_rate': 6.853333333333334e-06, 'epoch': 0.02} {'loss': 0.6125, 'learning_rate': 6.860000000000001e-06, 'epoch': 0.02} {'loss': 0.4037, 'learning_rate': 6.866666666666667e-06, 'epoch': 0.02} {'loss': 0.6209, 'learning_rate': 6.873333333333334e-06, 'epoch': 0.02} {'loss': 0.5021, 'learning_rate': 6.88e-06, 'epoch': 0.02} {'loss': 0.4666, 'learning_rate': 6.886666666666667e-06, 'epoch': 0.02} {'loss': 0.2622, 'learning_rate': 6.893333333333334e-06, 'epoch': 0.02} {'loss': 0.339, 'learning_rate': 6.9e-06, 'epoch': 0.02} {'loss': 0.58, 'learning_rate': 6.906666666666667e-06, 'epoch': 0.02} {'loss': 0.3256, 'learning_rate': 6.913333333333334e-06, 'epoch': 0.02} {'loss': 0.3809, 'learning_rate': 6.92e-06, 'epoch': 0.02} {'loss': 0.4182, 'learning_rate': 6.926666666666667e-06, 'epoch': 0.02} {'loss': 0.4363, 'learning_rate': 6.9333333333333344e-06, 'epoch': 0.02} {'loss': 0.4447, 'learning_rate': 6.9400000000000005e-06, 'epoch': 0.02} {'loss': 0.3859, 'learning_rate': 6.946666666666667e-06, 'epoch': 0.02} {'loss': 0.4273, 'learning_rate': 6.953333333333334e-06, 'epoch': 0.02} {'loss': 0.4461, 'learning_rate': 6.96e-06, 'epoch': 0.02} {'loss': 0.3968, 'learning_rate': 6.966666666666667e-06, 'epoch': 0.02} {'loss': 0.4552, 'learning_rate': 6.973333333333334e-06, 'epoch': 0.02} {'loss': 0.6094, 'learning_rate': 6.98e-06, 'epoch': 0.02} {'loss': 0.5286, 'learning_rate': 6.986666666666667e-06, 'epoch': 0.02} {'loss': 0.3455, 'learning_rate': 6.993333333333334e-06, 'epoch': 0.02} {'loss': 0.4863, 'learning_rate': 7e-06, 'epoch': 0.02} {'loss': 0.4701, 'learning_rate': 7.006666666666667e-06, 'epoch': 0.02} {'loss': 0.4328, 'learning_rate': 7.0133333333333345e-06, 'epoch': 0.02} {'loss': 0.4933, 'learning_rate': 7.0200000000000006e-06, 'epoch': 0.02} {'loss': 0.3378, 'learning_rate': 7.0266666666666674e-06, 'epoch': 0.02} {'loss': 0.3687, 'learning_rate': 7.033333333333334e-06, 'epoch': 0.02} {'loss': 0.6694, 'learning_rate': 7.04e-06, 'epoch': 0.02} {'loss': 0.5689, 'learning_rate': 7.046666666666667e-06, 'epoch': 0.02} {'loss': 0.3138, 'learning_rate': 7.053333333333334e-06, 'epoch': 0.02} {'loss': 0.5867, 'learning_rate': 7.06e-06, 'epoch': 0.02} {'loss': 0.2739, 'learning_rate': 7.066666666666667e-06, 'epoch': 0.02} {'loss': 0.4883, 'learning_rate': 7.073333333333334e-06, 'epoch': 0.02} {'loss': 0.3285, 'learning_rate': 7.08e-06, 'epoch': 0.02} {'loss': 0.4422, 'learning_rate': 7.086666666666667e-06, 'epoch': 0.02} {'loss': 0.4635, 'learning_rate': 7.093333333333335e-06, 'epoch': 0.02} {'loss': 0.4861, 'learning_rate': 7.100000000000001e-06, 'epoch': 0.02} {'loss': 0.4106, 'learning_rate': 7.1066666666666675e-06, 'epoch': 0.02} {'loss': 0.3296, 'learning_rate': 7.113333333333334e-06, 'epoch': 0.02} {'loss': 0.4716, 'learning_rate': 7.1200000000000004e-06, 'epoch': 0.02} {'loss': 0.5302, 'learning_rate': 7.126666666666667e-06, 'epoch': 0.02} {'loss': 0.5007, 'learning_rate': 7.133333333333334e-06, 'epoch': 0.02} {'loss': 0.3309, 'learning_rate': 7.14e-06, 'epoch': 0.02} {'loss': 0.335, 'learning_rate': 7.146666666666667e-06, 'epoch': 0.02} {'loss': 0.3356, 'learning_rate': 7.153333333333334e-06, 'epoch': 0.02} {'loss': 0.3969, 'learning_rate': 7.16e-06, 'epoch': 0.02} {'loss': 0.4011, 'learning_rate': 7.166666666666667e-06, 'epoch': 0.02} {'loss': 0.3503, 'learning_rate': 7.173333333333335e-06, 'epoch': 0.02} {'loss': 0.5607, 'learning_rate': 7.180000000000001e-06, 'epoch': 0.02} {'loss': 0.427, 'learning_rate': 7.186666666666668e-06, 'epoch': 0.02} {'loss': 0.6027, 'learning_rate': 7.1933333333333345e-06, 'epoch': 0.02} {'loss': 0.3549, 'learning_rate': 7.2000000000000005e-06, 'epoch': 0.02} {'loss': 0.4872, 'learning_rate': 7.206666666666667e-06, 'epoch': 0.02} {'loss': 0.2579, 'learning_rate': 7.213333333333334e-06, 'epoch': 0.02} {'loss': 0.5275, 'learning_rate': 7.22e-06, 'epoch': 0.02} {'loss': 0.3804, 'learning_rate': 7.226666666666667e-06, 'epoch': 0.02} {'loss': 0.3807, 'learning_rate': 7.233333333333334e-06, 'epoch': 0.02} {'loss': 0.4821, 'learning_rate': 7.24e-06, 'epoch': 0.02} {'loss': 0.418, 'learning_rate': 7.246666666666667e-06, 'epoch': 0.02} {'loss': 0.4345, 'learning_rate': 7.253333333333335e-06, 'epoch': 0.02} {'loss': 0.4596, 'learning_rate': 7.260000000000001e-06, 'epoch': 0.02} {'loss': 0.5418, 'learning_rate': 7.266666666666668e-06, 'epoch': 0.02} {'loss': 0.4505, 'learning_rate': 7.2733333333333346e-06, 'epoch': 0.02} {'loss': 0.4662, 'learning_rate': 7.280000000000001e-06, 'epoch': 0.02} {'loss': 0.3356, 'learning_rate': 7.2866666666666675e-06, 'epoch': 0.02} {'loss': 0.3645, 'learning_rate': 7.2933333333333335e-06, 'epoch': 0.02} {'loss': 0.5608, 'learning_rate': 7.3e-06, 'epoch': 0.02} {'loss': 0.2793, 'learning_rate': 7.306666666666667e-06, 'epoch': 0.02} {'loss': 0.4833, 'learning_rate': 7.313333333333333e-06, 'epoch': 0.02} {'loss': 0.3768, 'learning_rate': 7.32e-06, 'epoch': 0.02} {'loss': 0.3776, 'learning_rate': 7.326666666666667e-06, 'epoch': 0.02} {'loss': 0.5157, 'learning_rate': 7.333333333333333e-06, 'epoch': 0.02} {'loss': 0.4576, 'learning_rate': 7.340000000000001e-06, 'epoch': 0.02} {'loss': 0.3678, 'learning_rate': 7.346666666666668e-06, 'epoch': 0.02} {'loss': 0.3166, 'learning_rate': 7.353333333333334e-06, 'epoch': 0.02} {'loss': 0.4908, 'learning_rate': 7.360000000000001e-06, 'epoch': 0.02} {'loss': 0.281, 'learning_rate': 7.3666666666666676e-06, 'epoch': 0.02} {'loss': 0.3587, 'learning_rate': 7.373333333333334e-06, 'epoch': 0.02} {'loss': 0.4814, 'learning_rate': 7.3800000000000005e-06, 'epoch': 0.02} {'loss': 0.47, 'learning_rate': 7.386666666666667e-06, 'epoch': 0.02} {'loss': 0.4186, 'learning_rate': 7.393333333333333e-06, 'epoch': 0.02} {'loss': 0.4234, 'learning_rate': 7.4e-06, 'epoch': 0.02} {'loss': 0.5705, 'learning_rate': 7.406666666666667e-06, 'epoch': 0.02} {'loss': 0.5665, 'learning_rate': 7.413333333333333e-06, 'epoch': 0.02} {'loss': 0.4324, 'learning_rate': 7.420000000000001e-06, 'epoch': 0.02} {'loss': 0.4772, 'learning_rate': 7.426666666666668e-06, 'epoch': 0.02} {'loss': 0.4798, 'learning_rate': 7.433333333333334e-06, 'epoch': 0.02} {'loss': 0.3693, 'learning_rate': 7.440000000000001e-06, 'epoch': 0.02} {'loss': 0.5053, 'learning_rate': 7.446666666666668e-06, 'epoch': 0.02} {'loss': 0.5608, 'learning_rate': 7.453333333333334e-06, 'epoch': 0.02} {'loss': 0.4428, 'learning_rate': 7.4600000000000006e-06, 'epoch': 0.02} {'loss': 0.4951, 'learning_rate': 7.4666666666666675e-06, 'epoch': 0.02} {'loss': 0.4843, 'learning_rate': 7.4733333333333335e-06, 'epoch': 0.02} {'loss': 0.3694, 'learning_rate': 7.48e-06, 'epoch': 0.02} {'loss': 0.3644, 'learning_rate': 7.486666666666667e-06, 'epoch': 0.02} {'loss': 0.4099, 'learning_rate': 7.493333333333333e-06, 'epoch': 0.02} {'loss': 0.4964, 'learning_rate': 7.500000000000001e-06, 'epoch': 0.02} {'loss': 0.4833, 'learning_rate': 7.506666666666668e-06, 'epoch': 0.02} {'loss': 0.4465, 'learning_rate': 7.513333333333334e-06, 'epoch': 0.02} {'loss': 0.3423, 'learning_rate': 7.520000000000001e-06, 'epoch': 0.02} {'loss': 0.324, 'learning_rate': 7.526666666666668e-06, 'epoch': 0.02} {'loss': 0.4324, 'learning_rate': 7.533333333333334e-06, 'epoch': 0.02} {'loss': 0.3536, 'learning_rate': 7.540000000000001e-06, 'epoch': 0.02} {'loss': 0.5876, 'learning_rate': 7.5466666666666675e-06, 'epoch': 0.02} {'loss': 0.6039, 'learning_rate': 7.553333333333334e-06, 'epoch': 0.02} {'loss': 0.3798, 'learning_rate': 7.5600000000000005e-06, 'epoch': 0.02} {'loss': 0.5581, 'learning_rate': 7.566666666666667e-06, 'epoch': 0.02} {'loss': 0.4366, 'learning_rate': 7.573333333333333e-06, 'epoch': 0.02} {'loss': 0.4302, 'learning_rate': 7.58e-06, 'epoch': 0.02} {'loss': 0.4133, 'learning_rate': 7.586666666666668e-06, 'epoch': 0.02} {'loss': 0.5012, 'learning_rate': 7.593333333333334e-06, 'epoch': 0.02} {'loss': 0.613, 'learning_rate': 7.600000000000001e-06, 'epoch': 0.02} {'loss': 0.4424, 'learning_rate': 7.606666666666668e-06, 'epoch': 0.02} {'loss': 0.4448, 'learning_rate': 7.613333333333334e-06, 'epoch': 0.02} {'loss': 0.4103, 'learning_rate': 7.620000000000001e-06, 'epoch': 0.02} {'loss': 0.4483, 'learning_rate': 7.626666666666668e-06, 'epoch': 0.02} {'loss': 0.3384, 'learning_rate': 7.633333333333334e-06, 'epoch': 0.02} {'loss': 0.6091, 'learning_rate': 7.640000000000001e-06, 'epoch': 0.02} {'loss': 0.4184, 'learning_rate': 7.646666666666667e-06, 'epoch': 0.02} {'loss': 0.3967, 'learning_rate': 7.653333333333333e-06, 'epoch': 0.02} {'loss': 0.5397, 'learning_rate': 7.660000000000001e-06, 'epoch': 0.02} {'loss': 0.423, 'learning_rate': 7.666666666666667e-06, 'epoch': 0.02} {'loss': 0.5243, 'learning_rate': 7.673333333333333e-06, 'epoch': 0.02} {'loss': 0.5096, 'learning_rate': 7.680000000000001e-06, 'epoch': 0.02} {'loss': 0.2898, 'learning_rate': 7.686666666666667e-06, 'epoch': 0.02} {'loss': 0.4826, 'learning_rate': 7.693333333333333e-06, 'epoch': 0.02} {'loss': 0.3118, 'learning_rate': 7.7e-06, 'epoch': 0.02} {'loss': 0.5622, 'learning_rate': 7.706666666666669e-06, 'epoch': 0.02} {'loss': 0.4857, 'learning_rate': 7.713333333333335e-06, 'epoch': 0.02} {'loss': 0.4359, 'learning_rate': 7.72e-06, 'epoch': 0.02} {'loss': 0.56, 'learning_rate': 7.726666666666667e-06, 'epoch': 0.02} {'loss': 0.6104, 'learning_rate': 7.733333333333334e-06, 'epoch': 0.02} {'loss': 0.4773, 'learning_rate': 7.74e-06, 'epoch': 0.02} {'loss': 0.3469, 'learning_rate': 7.746666666666666e-06, 'epoch': 0.02} {'loss': 0.3568, 'learning_rate': 7.753333333333334e-06, 'epoch': 0.02} {'loss': 0.3938, 'learning_rate': 7.76e-06, 'epoch': 0.02} {'loss': 0.4248, 'learning_rate': 7.766666666666666e-06, 'epoch': 0.02} {'loss': 0.517, 'learning_rate': 7.773333333333334e-06, 'epoch': 0.02} {'loss': 0.5609, 'learning_rate': 7.78e-06, 'epoch': 0.02} {'loss': 0.2797, 'learning_rate': 7.786666666666666e-06, 'epoch': 0.02} {'loss': 0.5204, 'learning_rate': 7.793333333333334e-06, 'epoch': 0.02} {'loss': 0.4638, 'learning_rate': 7.800000000000002e-06, 'epoch': 0.02} {'loss': 0.4909, 'learning_rate': 7.806666666666668e-06, 'epoch': 0.02} {'loss': 0.407, 'learning_rate': 7.813333333333334e-06, 'epoch': 0.02} {'loss': 0.5606, 'learning_rate': 7.820000000000001e-06, 'epoch': 0.02} {'loss': 0.4452, 'learning_rate': 7.826666666666667e-06, 'epoch': 0.02} {'loss': 0.5625, 'learning_rate': 7.833333333333333e-06, 'epoch': 0.02} {'loss': 0.3379, 'learning_rate': 7.840000000000001e-06, 'epoch': 0.02} {'loss': 0.489, 'learning_rate': 7.846666666666667e-06, 'epoch': 0.02} {'loss': 0.4686, 'learning_rate': 7.853333333333333e-06, 'epoch': 0.02} {'loss': 0.3428, 'learning_rate': 7.860000000000001e-06, 'epoch': 0.02} {'loss': 0.3819, 'learning_rate': 7.866666666666667e-06, 'epoch': 0.02} {'loss': 0.528, 'learning_rate': 7.873333333333335e-06, 'epoch': 0.02} {'loss': 0.408, 'learning_rate': 7.88e-06, 'epoch': 0.02} {'loss': 0.5422, 'learning_rate': 7.886666666666667e-06, 'epoch': 0.02} {'loss': 0.3866, 'learning_rate': 7.893333333333335e-06, 'epoch': 0.02} {'loss': 0.4169, 'learning_rate': 7.9e-06, 'epoch': 0.02} {'loss': 0.2429, 'learning_rate': 7.906666666666667e-06, 'epoch': 0.02} {'loss': 0.5237, 'learning_rate': 7.913333333333334e-06, 'epoch': 0.02} {'loss': 0.6032, 'learning_rate': 7.92e-06, 'epoch': 0.02} {'loss': 0.3788, 'learning_rate': 7.926666666666666e-06, 'epoch': 0.02} {'loss': 0.4193, 'learning_rate': 7.933333333333334e-06, 'epoch': 0.02} {'loss': 0.292, 'learning_rate': 7.94e-06, 'epoch': 0.02} {'loss': 0.4161, 'learning_rate': 7.946666666666666e-06, 'epoch': 0.02} {'loss': 0.4256, 'learning_rate': 7.953333333333334e-06, 'epoch': 0.02} {'loss': 0.3843, 'learning_rate': 7.960000000000002e-06, 'epoch': 0.02} {'loss': 0.5179, 'learning_rate': 7.966666666666668e-06, 'epoch': 0.02} {'loss': 0.3411, 'learning_rate': 7.973333333333334e-06, 'epoch': 0.02} {'loss': 0.3354, 'learning_rate': 7.980000000000002e-06, 'epoch': 0.02} {'loss': 0.4182, 'learning_rate': 7.986666666666668e-06, 'epoch': 0.02} {'loss': 0.4752, 'learning_rate': 7.993333333333334e-06, 'epoch': 0.02} {'loss': 0.4755, 'learning_rate': 8.000000000000001e-06, 'epoch': 0.02} {'loss': 0.5575, 'learning_rate': 8.006666666666667e-06, 'epoch': 0.02} {'loss': 0.6065, 'learning_rate': 8.013333333333333e-06, 'epoch': 0.02} {'loss': 0.5181, 'learning_rate': 8.020000000000001e-06, 'epoch': 0.02} {'loss': 0.4165, 'learning_rate': 8.026666666666667e-06, 'epoch': 0.02} {'loss': 0.533, 'learning_rate': 8.033333333333335e-06, 'epoch': 0.02} {'loss': 0.4624, 'learning_rate': 8.040000000000001e-06, 'epoch': 0.02} {'loss': 0.3593, 'learning_rate': 8.046666666666667e-06, 'epoch': 0.03} {'loss': 0.4155, 'learning_rate': 8.053333333333335e-06, 'epoch': 0.03} {'loss': 0.4175, 'learning_rate': 8.06e-06, 'epoch': 0.03} {'loss': 0.5293, 'learning_rate': 8.066666666666667e-06, 'epoch': 0.03} {'loss': 0.4155, 'learning_rate': 8.073333333333335e-06, 'epoch': 0.03} {'loss': 0.596, 'learning_rate': 8.08e-06, 'epoch': 0.03} {'loss': 0.4177, 'learning_rate': 8.086666666666667e-06, 'epoch': 0.03} {'loss': 0.4565, 'learning_rate': 8.093333333333334e-06, 'epoch': 0.03} {'loss': 0.4546, 'learning_rate': 8.1e-06, 'epoch': 0.03} {'loss': 0.5296, 'learning_rate': 8.106666666666666e-06, 'epoch': 0.03} {'loss': 0.4426, 'learning_rate': 8.113333333333334e-06, 'epoch': 0.03} {'loss': 0.5124, 'learning_rate': 8.120000000000002e-06, 'epoch': 0.03} {'loss': 0.4357, 'learning_rate': 8.126666666666668e-06, 'epoch': 0.03} {'loss': 0.4099, 'learning_rate': 8.133333333333334e-06, 'epoch': 0.03} {'loss': 0.5079, 'learning_rate': 8.14e-06, 'epoch': 0.03} {'loss': 0.4464, 'learning_rate': 8.146666666666668e-06, 'epoch': 0.03} {'loss': 0.426, 'learning_rate': 8.153333333333334e-06, 'epoch': 0.03} {'loss': 0.2936, 'learning_rate': 8.16e-06, 'epoch': 0.03} {'loss': 0.5796, 'learning_rate': 8.166666666666668e-06, 'epoch': 0.03} {'loss': 0.5336, 'learning_rate': 8.173333333333334e-06, 'epoch': 0.03} {'loss': 0.3668, 'learning_rate': 8.18e-06, 'epoch': 0.03} {'loss': 0.4677, 'learning_rate': 8.186666666666667e-06, 'epoch': 0.03} {'loss': 0.3077, 'learning_rate': 8.193333333333335e-06, 'epoch': 0.03} {'loss': 0.5329, 'learning_rate': 8.2e-06, 'epoch': 0.03} {'loss': 0.5339, 'learning_rate': 8.206666666666667e-06, 'epoch': 0.03} {'loss': 0.366, 'learning_rate': 8.213333333333335e-06, 'epoch': 0.03} {'loss': 0.5209, 'learning_rate': 8.220000000000001e-06, 'epoch': 0.03} {'loss': 0.5587, 'learning_rate': 8.226666666666667e-06, 'epoch': 0.03} {'loss': 0.3248, 'learning_rate': 8.233333333333335e-06, 'epoch': 0.03} {'loss': 0.4886, 'learning_rate': 8.24e-06, 'epoch': 0.03} {'loss': 0.387, 'learning_rate': 8.246666666666667e-06, 'epoch': 0.03} {'loss': 0.38, 'learning_rate': 8.253333333333334e-06, 'epoch': 0.03} {'loss': 0.6924, 'learning_rate': 8.26e-06, 'epoch': 0.03} {'loss': 0.451, 'learning_rate': 8.266666666666667e-06, 'epoch': 0.03} {'loss': 0.5145, 'learning_rate': 8.273333333333334e-06, 'epoch': 0.03} {'loss': 0.4384, 'learning_rate': 8.28e-06, 'epoch': 0.03} {'loss': 0.6065, 'learning_rate': 8.286666666666668e-06, 'epoch': 0.03} {'loss': 0.4501, 'learning_rate': 8.293333333333334e-06, 'epoch': 0.03} {'loss': 0.539, 'learning_rate': 8.3e-06, 'epoch': 0.03} {'loss': 0.4581, 'learning_rate': 8.306666666666668e-06, 'epoch': 0.03} {'loss': 0.5052, 'learning_rate': 8.313333333333334e-06, 'epoch': 0.03} {'loss': 0.4512, 'learning_rate': 8.32e-06, 'epoch': 0.03} {'loss': 0.4147, 'learning_rate': 8.326666666666668e-06, 'epoch': 0.03} {'loss': 0.503, 'learning_rate': 8.333333333333334e-06, 'epoch': 0.03} {'loss': 0.5256, 'learning_rate': 8.34e-06, 'epoch': 0.03} {'loss': 0.6367, 'learning_rate': 8.346666666666668e-06, 'epoch': 0.03} {'loss': 0.3623, 'learning_rate': 8.353333333333335e-06, 'epoch': 0.03} {'loss': 0.3268, 'learning_rate': 8.36e-06, 'epoch': 0.03} {'loss': 0.3488, 'learning_rate': 8.366666666666667e-06, 'epoch': 0.03} {'loss': 0.4394, 'learning_rate': 8.373333333333335e-06, 'epoch': 0.03} {'loss': 0.3042, 'learning_rate': 8.380000000000001e-06, 'epoch': 0.03} {'loss': 0.489, 'learning_rate': 8.386666666666667e-06, 'epoch': 0.03} {'loss': 0.5596, 'learning_rate': 8.393333333333335e-06, 'epoch': 0.03} {'loss': 0.4611, 'learning_rate': 8.400000000000001e-06, 'epoch': 0.03} {'loss': 0.4269, 'learning_rate': 8.406666666666667e-06, 'epoch': 0.03} {'loss': 0.3567, 'learning_rate': 8.413333333333335e-06, 'epoch': 0.03} {'loss': 0.3265, 'learning_rate': 8.42e-06, 'epoch': 0.03} {'loss': 0.645, 'learning_rate': 8.426666666666667e-06, 'epoch': 0.03} {'loss': 0.635, 'learning_rate': 8.433333333333334e-06, 'epoch': 0.03} {'loss': 0.3126, 'learning_rate': 8.44e-06, 'epoch': 0.03} {'loss': 0.395, 'learning_rate': 8.446666666666668e-06, 'epoch': 0.03} {'loss': 0.4179, 'learning_rate': 8.453333333333334e-06, 'epoch': 0.03} {'loss': 0.4297, 'learning_rate': 8.46e-06, 'epoch': 0.03} {'loss': 0.4417, 'learning_rate': 8.466666666666668e-06, 'epoch': 0.03} {'loss': 0.5186, 'learning_rate': 8.473333333333334e-06, 'epoch': 0.03} {'loss': 0.4088, 'learning_rate': 8.48e-06, 'epoch': 0.03} {'loss': 0.3756, 'learning_rate': 8.486666666666668e-06, 'epoch': 0.03} {'loss': 0.4197, 'learning_rate': 8.493333333333334e-06, 'epoch': 0.03} {'loss': 0.5839, 'learning_rate': 8.5e-06, 'epoch': 0.03} {'loss': 0.3773, 'learning_rate': 8.506666666666668e-06, 'epoch': 0.03} {'loss': 0.414, 'learning_rate': 8.513333333333335e-06, 'epoch': 0.03} {'loss': 0.3429, 'learning_rate': 8.52e-06, 'epoch': 0.03} {'loss': 0.4194, 'learning_rate': 8.526666666666667e-06, 'epoch': 0.03} {'loss': 0.5509, 'learning_rate': 8.533333333333335e-06, 'epoch': 0.03} {'loss': 0.5144, 'learning_rate': 8.540000000000001e-06, 'epoch': 0.03} {'loss': 0.4928, 'learning_rate': 8.546666666666667e-06, 'epoch': 0.03} {'loss': 0.439, 'learning_rate': 8.553333333333333e-06, 'epoch': 0.03} {'loss': 0.4574, 'learning_rate': 8.560000000000001e-06, 'epoch': 0.03} {'loss': 0.2683, 'learning_rate': 8.566666666666667e-06, 'epoch': 0.03} {'loss': 0.4235, 'learning_rate': 8.573333333333333e-06, 'epoch': 0.03} {'loss': 0.5082, 'learning_rate': 8.580000000000001e-06, 'epoch': 0.03} {'loss': 0.3298, 'learning_rate': 8.586666666666667e-06, 'epoch': 0.03} {'loss': 0.4531, 'learning_rate': 8.593333333333333e-06, 'epoch': 0.03} {'loss': 0.3545, 'learning_rate': 8.6e-06, 'epoch': 0.03} {'loss': 0.403, 'learning_rate': 8.606666666666668e-06, 'epoch': 0.03} {'loss': 0.4899, 'learning_rate': 8.613333333333333e-06, 'epoch': 0.03} {'loss': 0.4996, 'learning_rate': 8.62e-06, 'epoch': 0.03} {'loss': 0.542, 'learning_rate': 8.626666666666668e-06, 'epoch': 0.03} {'loss': 0.48, 'learning_rate': 8.633333333333334e-06, 'epoch': 0.03} {'loss': 0.3956, 'learning_rate': 8.64e-06, 'epoch': 0.03} {'loss': 0.4956, 'learning_rate': 8.646666666666668e-06, 'epoch': 0.03} {'loss': 0.5524, 'learning_rate': 8.653333333333334e-06, 'epoch': 0.03} {'loss': 0.4415, 'learning_rate': 8.66e-06, 'epoch': 0.03} {'loss': 0.31, 'learning_rate': 8.666666666666668e-06, 'epoch': 0.03} {'loss': 0.491, 'learning_rate': 8.673333333333334e-06, 'epoch': 0.03} {'loss': 0.4371, 'learning_rate': 8.68e-06, 'epoch': 0.03} {'loss': 0.3477, 'learning_rate': 8.686666666666668e-06, 'epoch': 0.03} {'loss': 0.4279, 'learning_rate': 8.693333333333334e-06, 'epoch': 0.03} {'loss': 0.4765, 'learning_rate': 8.700000000000001e-06, 'epoch': 0.03} {'loss': 0.5519, 'learning_rate': 8.706666666666667e-06, 'epoch': 0.03} {'loss': 0.3793, 'learning_rate': 8.713333333333333e-06, 'epoch': 0.03} {'loss': 0.4345, 'learning_rate': 8.720000000000001e-06, 'epoch': 0.03} {'loss': 0.5531, 'learning_rate': 8.726666666666667e-06, 'epoch': 0.03} {'loss': 0.3356, 'learning_rate': 8.733333333333333e-06, 'epoch': 0.03} {'loss': 0.341, 'learning_rate': 8.740000000000001e-06, 'epoch': 0.03} {'loss': 0.2688, 'learning_rate': 8.746666666666667e-06, 'epoch': 0.03} {'loss': 0.3593, 'learning_rate': 8.753333333333333e-06, 'epoch': 0.03} {'loss': 0.443, 'learning_rate': 8.76e-06, 'epoch': 0.03} {'loss': 0.4447, 'learning_rate': 8.766666666666669e-06, 'epoch': 0.03} {'loss': 0.5529, 'learning_rate': 8.773333333333333e-06, 'epoch': 0.03} {'loss': 0.4997, 'learning_rate': 8.78e-06, 'epoch': 0.03} {'loss': 0.3472, 'learning_rate': 8.786666666666668e-06, 'epoch': 0.03} {'loss': 0.5948, 'learning_rate': 8.793333333333334e-06, 'epoch': 0.03} {'loss': 0.4523, 'learning_rate': 8.8e-06, 'epoch': 0.03} {'loss': 0.5346, 'learning_rate': 8.806666666666668e-06, 'epoch': 0.03} {'loss': 0.3948, 'learning_rate': 8.813333333333334e-06, 'epoch': 0.03} {'loss': 0.5728, 'learning_rate': 8.82e-06, 'epoch': 0.03} {'loss': 0.4011, 'learning_rate': 8.826666666666668e-06, 'epoch': 0.03} {'loss': 0.4016, 'learning_rate': 8.833333333333334e-06, 'epoch': 0.03} {'loss': 0.3084, 'learning_rate': 8.84e-06, 'epoch': 0.03} {'loss': 0.4821, 'learning_rate': 8.846666666666668e-06, 'epoch': 0.03} {'loss': 0.3957, 'learning_rate': 8.853333333333334e-06, 'epoch': 0.03} {'loss': 0.4263, 'learning_rate': 8.860000000000002e-06, 'epoch': 0.03} {'loss': 0.3944, 'learning_rate': 8.866666666666668e-06, 'epoch': 0.03} {'loss': 0.2996, 'learning_rate': 8.873333333333334e-06, 'epoch': 0.03} {'loss': 0.3794, 'learning_rate': 8.880000000000001e-06, 'epoch': 0.03} {'loss': 0.4198, 'learning_rate': 8.886666666666667e-06, 'epoch': 0.03} {'loss': 0.4751, 'learning_rate': 8.893333333333333e-06, 'epoch': 0.03} {'loss': 0.4769, 'learning_rate': 8.900000000000001e-06, 'epoch': 0.03} {'loss': 0.4657, 'learning_rate': 8.906666666666667e-06, 'epoch': 0.03} {'loss': 0.7607, 'learning_rate': 8.913333333333333e-06, 'epoch': 0.03} {'loss': 0.524, 'learning_rate': 8.920000000000001e-06, 'epoch': 0.03} {'loss': 0.2799, 'learning_rate': 8.926666666666669e-06, 'epoch': 0.03} {'loss': 0.4337, 'learning_rate': 8.933333333333333e-06, 'epoch': 0.03} {'loss': 0.3806, 'learning_rate': 8.94e-06, 'epoch': 0.03} {'loss': 0.5612, 'learning_rate': 8.946666666666669e-06, 'epoch': 0.03} {'loss': 0.5497, 'learning_rate': 8.953333333333335e-06, 'epoch': 0.03} {'loss': 0.409, 'learning_rate': 8.96e-06, 'epoch': 0.03} {'loss': 0.5699, 'learning_rate': 8.966666666666667e-06, 'epoch': 0.03} {'loss': 0.3691, 'learning_rate': 8.973333333333334e-06, 'epoch': 0.03} {'loss': 0.4377, 'learning_rate': 8.98e-06, 'epoch': 0.03} {'loss': 0.6667, 'learning_rate': 8.986666666666666e-06, 'epoch': 0.03} {'loss': 0.425, 'learning_rate': 8.993333333333334e-06, 'epoch': 0.03} {'loss': 0.524, 'learning_rate': 9e-06, 'epoch': 0.03} {'loss': 0.474, 'learning_rate': 9.006666666666666e-06, 'epoch': 0.03} {'loss': 0.4501, 'learning_rate': 9.013333333333334e-06, 'epoch': 0.03} {'loss': 0.3836, 'learning_rate': 9.020000000000002e-06, 'epoch': 0.03} {'loss': 0.4198, 'learning_rate': 9.026666666666666e-06, 'epoch': 0.03} {'loss': 0.3289, 'learning_rate': 9.033333333333334e-06, 'epoch': 0.03} {'loss': 0.3872, 'learning_rate': 9.040000000000002e-06, 'epoch': 0.03} {'loss': 0.4268, 'learning_rate': 9.046666666666668e-06, 'epoch': 0.03} {'loss': 0.4456, 'learning_rate': 9.053333333333334e-06, 'epoch': 0.03} {'loss': 0.434, 'learning_rate': 9.060000000000001e-06, 'epoch': 0.03} {'loss': 0.4593, 'learning_rate': 9.066666666666667e-06, 'epoch': 0.03} {'loss': 0.4166, 'learning_rate': 9.073333333333333e-06, 'epoch': 0.03} {'loss': 0.5962, 'learning_rate': 9.080000000000001e-06, 'epoch': 0.03} {'loss': 0.4616, 'learning_rate': 9.086666666666667e-06, 'epoch': 0.03} {'loss': 0.5872, 'learning_rate': 9.093333333333333e-06, 'epoch': 0.03} {'loss': 0.2472, 'learning_rate': 9.100000000000001e-06, 'epoch': 0.03} {'loss': 0.4909, 'learning_rate': 9.106666666666667e-06, 'epoch': 0.03} {'loss': 0.6546, 'learning_rate': 9.113333333333335e-06, 'epoch': 0.03} {'loss': 0.4492, 'learning_rate': 9.12e-06, 'epoch': 0.03} {'loss': 0.4043, 'learning_rate': 9.126666666666667e-06, 'epoch': 0.03} {'loss': 0.6251, 'learning_rate': 9.133333333333335e-06, 'epoch': 0.03} {'loss': 0.3176, 'learning_rate': 9.14e-06, 'epoch': 0.03} {'loss': 0.4486, 'learning_rate': 9.146666666666667e-06, 'epoch': 0.03} {'loss': 0.6821, 'learning_rate': 9.153333333333334e-06, 'epoch': 0.03} {'loss': 0.3552, 'learning_rate': 9.16e-06, 'epoch': 0.03} {'loss': 0.4027, 'learning_rate': 9.166666666666666e-06, 'epoch': 0.03} {'loss': 0.3667, 'learning_rate': 9.173333333333334e-06, 'epoch': 0.03} {'loss': 0.3776, 'learning_rate': 9.180000000000002e-06, 'epoch': 0.03} {'loss': 0.5215, 'learning_rate': 9.186666666666666e-06, 'epoch': 0.03} {'loss': 0.5438, 'learning_rate': 9.193333333333334e-06, 'epoch': 0.03} {'loss': 0.6383, 'learning_rate': 9.200000000000002e-06, 'epoch': 0.03} {'loss': 0.52, 'learning_rate': 9.206666666666668e-06, 'epoch': 0.03} {'loss': 0.3743, 'learning_rate': 9.213333333333334e-06, 'epoch': 0.03} {'loss': 0.4642, 'learning_rate': 9.220000000000002e-06, 'epoch': 0.03} {'loss': 0.5069, 'learning_rate': 9.226666666666668e-06, 'epoch': 0.03} {'loss': 0.4921, 'learning_rate': 9.233333333333334e-06, 'epoch': 0.03} {'loss': 0.5381, 'learning_rate': 9.240000000000001e-06, 'epoch': 0.03} {'loss': 0.4965, 'learning_rate': 9.246666666666667e-06, 'epoch': 0.03} {'loss': 0.6425, 'learning_rate': 9.253333333333333e-06, 'epoch': 0.03} {'loss': 0.4499, 'learning_rate': 9.260000000000001e-06, 'epoch': 0.03} {'loss': 0.2915, 'learning_rate': 9.266666666666667e-06, 'epoch': 0.03} {'loss': 0.5485, 'learning_rate': 9.273333333333335e-06, 'epoch': 0.03} {'loss': 0.455, 'learning_rate': 9.280000000000001e-06, 'epoch': 0.03} {'loss': 0.4926, 'learning_rate': 9.286666666666667e-06, 'epoch': 0.03} {'loss': 0.3677, 'learning_rate': 9.293333333333335e-06, 'epoch': 0.03} {'loss': 0.482, 'learning_rate': 9.3e-06, 'epoch': 0.03} {'loss': 0.3322, 'learning_rate': 9.306666666666667e-06, 'epoch': 0.03} {'loss': 0.4897, 'learning_rate': 9.313333333333335e-06, 'epoch': 0.03} {'loss': 0.3501, 'learning_rate': 9.32e-06, 'epoch': 0.03} {'loss': 0.6281, 'learning_rate': 9.326666666666667e-06, 'epoch': 0.03} {'loss': 0.2769, 'learning_rate': 9.333333333333334e-06, 'epoch': 0.03} {'loss': 0.3111, 'learning_rate': 9.340000000000002e-06, 'epoch': 0.03} {'loss': 0.4323, 'learning_rate': 9.346666666666666e-06, 'epoch': 0.03} {'loss': 0.4448, 'learning_rate': 9.353333333333334e-06, 'epoch': 0.03} {'loss': 0.414, 'learning_rate': 9.360000000000002e-06, 'epoch': 0.03} {'loss': 0.4289, 'learning_rate': 9.366666666666668e-06, 'epoch': 0.03} {'loss': 0.4481, 'learning_rate': 9.373333333333334e-06, 'epoch': 0.03} {'loss': 0.5095, 'learning_rate': 9.38e-06, 'epoch': 0.03} {'loss': 0.3449, 'learning_rate': 9.386666666666668e-06, 'epoch': 0.03} {'loss': 0.3265, 'learning_rate': 9.393333333333334e-06, 'epoch': 0.03} {'loss': 0.4153, 'learning_rate': 9.4e-06, 'epoch': 0.03} {'loss': 0.3473, 'learning_rate': 9.406666666666668e-06, 'epoch': 0.03} {'loss': 0.3755, 'learning_rate': 9.413333333333334e-06, 'epoch': 0.03} {'loss': 0.3889, 'learning_rate': 9.42e-06, 'epoch': 0.03} {'loss': 0.3612, 'learning_rate': 9.426666666666667e-06, 'epoch': 0.03} {'loss': 0.3782, 'learning_rate': 9.433333333333335e-06, 'epoch': 0.03} {'loss': 0.612, 'learning_rate': 9.440000000000001e-06, 'epoch': 0.03} {'loss': 0.481, 'learning_rate': 9.446666666666667e-06, 'epoch': 0.03} {'loss': 0.7286, 'learning_rate': 9.453333333333335e-06, 'epoch': 0.03} {'loss': 0.6936, 'learning_rate': 9.460000000000001e-06, 'epoch': 0.03} {'loss': 0.4271, 'learning_rate': 9.466666666666667e-06, 'epoch': 0.03} {'loss': 0.271, 'learning_rate': 9.473333333333335e-06, 'epoch': 0.03} {'loss': 0.4775, 'learning_rate': 9.48e-06, 'epoch': 0.03} {'loss': 0.4998, 'learning_rate': 9.486666666666667e-06, 'epoch': 0.03} {'loss': 0.454, 'learning_rate': 9.493333333333334e-06, 'epoch': 0.03} {'loss': 0.4375, 'learning_rate': 9.5e-06, 'epoch': 0.03} {'loss': 0.3595, 'learning_rate': 9.506666666666667e-06, 'epoch': 0.03} {'loss': 0.5811, 'learning_rate': 9.513333333333334e-06, 'epoch': 0.03} {'loss': 0.4748, 'learning_rate': 9.52e-06, 'epoch': 0.03} {'loss': 0.3792, 'learning_rate': 9.526666666666668e-06, 'epoch': 0.03} {'loss': 0.2631, 'learning_rate': 9.533333333333334e-06, 'epoch': 0.03} {'loss': 0.3152, 'learning_rate': 9.54e-06, 'epoch': 0.03} {'loss': 0.5787, 'learning_rate': 9.546666666666668e-06, 'epoch': 0.03} {'loss': 0.3922, 'learning_rate': 9.553333333333334e-06, 'epoch': 0.03} {'loss': 0.4724, 'learning_rate': 9.56e-06, 'epoch': 0.03} {'loss': 0.2628, 'learning_rate': 9.566666666666668e-06, 'epoch': 0.03} {'loss': 0.4638, 'learning_rate': 9.573333333333334e-06, 'epoch': 0.03} {'loss': 0.3913, 'learning_rate': 9.58e-06, 'epoch': 0.03} {'loss': 0.4822, 'learning_rate': 9.586666666666667e-06, 'epoch': 0.03} {'loss': 0.3434, 'learning_rate': 9.593333333333335e-06, 'epoch': 0.03} {'loss': 0.4747, 'learning_rate': 9.600000000000001e-06, 'epoch': 0.03} {'loss': 0.4095, 'learning_rate': 9.606666666666667e-06, 'epoch': 0.03} {'loss': 0.3852, 'learning_rate': 9.613333333333335e-06, 'epoch': 0.03} {'loss': 0.4658, 'learning_rate': 9.620000000000001e-06, 'epoch': 0.03} {'loss': 0.4658, 'learning_rate': 9.626666666666667e-06, 'epoch': 0.03} {'loss': 0.5821, 'learning_rate': 9.633333333333335e-06, 'epoch': 0.03} {'loss': 0.4346, 'learning_rate': 9.640000000000001e-06, 'epoch': 0.03} {'loss': 0.2948, 'learning_rate': 9.646666666666667e-06, 'epoch': 0.03} {'loss': 0.2573, 'learning_rate': 9.653333333333335e-06, 'epoch': 0.03} {'loss': 0.5369, 'learning_rate': 9.66e-06, 'epoch': 0.03} {'loss': 0.5162, 'learning_rate': 9.666666666666667e-06, 'epoch': 0.03} {'loss': 0.3815, 'learning_rate': 9.673333333333334e-06, 'epoch': 0.03} {'loss': 0.4018, 'learning_rate': 9.68e-06, 'epoch': 0.03} {'loss': 0.5996, 'learning_rate': 9.686666666666668e-06, 'epoch': 0.03} {'loss': 0.4322, 'learning_rate': 9.693333333333334e-06, 'epoch': 0.03} {'loss': 0.3616, 'learning_rate': 9.7e-06, 'epoch': 0.03} {'loss': 0.4732, 'learning_rate': 9.706666666666668e-06, 'epoch': 0.03} {'loss': 0.3458, 'learning_rate': 9.713333333333334e-06, 'epoch': 0.03} {'loss': 0.5339, 'learning_rate': 9.72e-06, 'epoch': 0.03} {'loss': 0.4734, 'learning_rate': 9.726666666666668e-06, 'epoch': 0.03} {'loss': 0.4086, 'learning_rate': 9.733333333333334e-06, 'epoch': 0.03} {'loss': 0.5013, 'learning_rate': 9.74e-06, 'epoch': 0.03} {'loss': 0.4414, 'learning_rate': 9.746666666666668e-06, 'epoch': 0.03} {'loss': 0.4087, 'learning_rate': 9.753333333333335e-06, 'epoch': 0.03} {'loss': 0.4412, 'learning_rate': 9.760000000000001e-06, 'epoch': 0.03} {'loss': 0.3349, 'learning_rate': 9.766666666666667e-06, 'epoch': 0.03} {'loss': 0.4495, 'learning_rate': 9.773333333333335e-06, 'epoch': 0.03} {'loss': 0.5116, 'learning_rate': 9.780000000000001e-06, 'epoch': 0.03} {'loss': 0.4507, 'learning_rate': 9.786666666666667e-06, 'epoch': 0.03} {'loss': 0.5765, 'learning_rate': 9.793333333333333e-06, 'epoch': 0.03} {'loss': 0.4234, 'learning_rate': 9.800000000000001e-06, 'epoch': 0.03} {'loss': 0.3444, 'learning_rate': 9.806666666666667e-06, 'epoch': 0.03} {'loss': 0.2802, 'learning_rate': 9.813333333333333e-06, 'epoch': 0.03} {'loss': 0.4718, 'learning_rate': 9.820000000000001e-06, 'epoch': 0.03} {'loss': 0.3764, 'learning_rate': 9.826666666666667e-06, 'epoch': 0.03} {'loss': 0.5096, 'learning_rate': 9.833333333333333e-06, 'epoch': 0.03} {'loss': 0.3243, 'learning_rate': 9.84e-06, 'epoch': 0.03} {'loss': 0.4894, 'learning_rate': 9.846666666666668e-06, 'epoch': 0.03} {'loss': 0.3067, 'learning_rate': 9.853333333333334e-06, 'epoch': 0.03} {'loss': 0.4587, 'learning_rate': 9.86e-06, 'epoch': 0.03} {'loss': 0.3344, 'learning_rate': 9.866666666666668e-06, 'epoch': 0.03} {'loss': 0.4819, 'learning_rate': 9.873333333333334e-06, 'epoch': 0.03} {'loss': 0.4862, 'learning_rate': 9.88e-06, 'epoch': 0.03} {'loss': 0.732, 'learning_rate': 9.886666666666668e-06, 'epoch': 0.03} {'loss': 0.4658, 'learning_rate': 9.893333333333334e-06, 'epoch': 0.03} {'loss': 0.5124, 'learning_rate': 9.9e-06, 'epoch': 0.03} {'loss': 0.4359, 'learning_rate': 9.906666666666668e-06, 'epoch': 0.03} {'loss': 0.529, 'learning_rate': 9.913333333333334e-06, 'epoch': 0.03} {'loss': 0.3734, 'learning_rate': 9.920000000000002e-06, 'epoch': 0.03} {'loss': 0.6552, 'learning_rate': 9.926666666666668e-06, 'epoch': 0.03} {'loss': 0.3565, 'learning_rate': 9.933333333333334e-06, 'epoch': 0.03} {'loss': 0.3787, 'learning_rate': 9.940000000000001e-06, 'epoch': 0.03} {'loss': 0.5737, 'learning_rate': 9.946666666666667e-06, 'epoch': 0.03} {'loss': 0.6678, 'learning_rate': 9.953333333333333e-06, 'epoch': 0.03} {'loss': 0.4537, 'learning_rate': 9.960000000000001e-06, 'epoch': 0.03} {'loss': 0.5404, 'learning_rate': 9.966666666666667e-06, 'epoch': 0.03} {'loss': 0.4711, 'learning_rate': 9.973333333333333e-06, 'epoch': 0.03} {'loss': 0.3823, 'learning_rate': 9.980000000000001e-06, 'epoch': 0.03} {'loss': 0.5365, 'learning_rate': 9.986666666666667e-06, 'epoch': 0.03} {'loss': 0.4577, 'learning_rate': 9.993333333333333e-06, 'epoch': 0.03} {'loss': 0.3286, 'learning_rate': 1e-05, 'epoch': 0.03} {'loss': 0.4294, 'learning_rate': 1.0006666666666667e-05, 'epoch': 0.03} {'loss': 0.4584, 'learning_rate': 1.0013333333333335e-05, 'epoch': 0.03} {'loss': 0.4434, 'learning_rate': 1.002e-05, 'epoch': 0.03} {'loss': 0.5659, 'learning_rate': 1.0026666666666667e-05, 'epoch': 0.03} {'loss': 0.6083, 'learning_rate': 1.0033333333333334e-05, 'epoch': 0.03} {'loss': 0.4314, 'learning_rate': 1.004e-05, 'epoch': 0.03} {'loss': 0.4115, 'learning_rate': 1.0046666666666666e-05, 'epoch': 0.03} {'loss': 0.551, 'learning_rate': 1.0053333333333334e-05, 'epoch': 0.03} {'loss': 0.4787, 'learning_rate': 1.006e-05, 'epoch': 0.03} {'loss': 0.5677, 'learning_rate': 1.0066666666666666e-05, 'epoch': 0.03} {'loss': 0.3953, 'learning_rate': 1.0073333333333336e-05, 'epoch': 0.03} {'loss': 0.4885, 'learning_rate': 1.008e-05, 'epoch': 0.03} {'loss': 0.5415, 'learning_rate': 1.0086666666666666e-05, 'epoch': 0.03} {'loss': 0.4431, 'learning_rate': 1.0093333333333336e-05, 'epoch': 0.03} {'loss': 0.3759, 'learning_rate': 1.0100000000000002e-05, 'epoch': 0.03} {'loss': 0.4135, 'learning_rate': 1.0106666666666668e-05, 'epoch': 0.03} {'loss': 0.3861, 'learning_rate': 1.0113333333333335e-05, 'epoch': 0.03} {'loss': 0.4671, 'learning_rate': 1.0120000000000001e-05, 'epoch': 0.03} {'loss': 0.502, 'learning_rate': 1.0126666666666667e-05, 'epoch': 0.03} {'loss': 0.516, 'learning_rate': 1.0133333333333335e-05, 'epoch': 0.03} {'loss': 0.3144, 'learning_rate': 1.0140000000000001e-05, 'epoch': 0.03} {'loss': 0.3507, 'learning_rate': 1.0146666666666667e-05, 'epoch': 0.03} {'loss': 0.4196, 'learning_rate': 1.0153333333333335e-05, 'epoch': 0.03} {'loss': 0.3662, 'learning_rate': 1.0160000000000001e-05, 'epoch': 0.03} {'loss': 0.4932, 'learning_rate': 1.0166666666666667e-05, 'epoch': 0.03} {'loss': 0.4022, 'learning_rate': 1.0173333333333335e-05, 'epoch': 0.03} {'loss': 0.4185, 'learning_rate': 1.018e-05, 'epoch': 0.03} {'loss': 0.5085, 'learning_rate': 1.0186666666666667e-05, 'epoch': 0.03} {'loss': 0.4585, 'learning_rate': 1.0193333333333335e-05, 'epoch': 0.03} {'loss': 0.4011, 'learning_rate': 1.02e-05, 'epoch': 0.03} {'loss': 0.3939, 'learning_rate': 1.0206666666666667e-05, 'epoch': 0.03} {'loss': 0.3081, 'learning_rate': 1.0213333333333334e-05, 'epoch': 0.03} {'loss': 0.4066, 'learning_rate': 1.022e-05, 'epoch': 0.03} {'loss': 0.5994, 'learning_rate': 1.0226666666666666e-05, 'epoch': 0.03} {'loss': 0.5435, 'learning_rate': 1.0233333333333336e-05, 'epoch': 0.03} {'loss': 0.4122, 'learning_rate': 1.024e-05, 'epoch': 0.03} {'loss': 0.4849, 'learning_rate': 1.0246666666666666e-05, 'epoch': 0.03} {'loss': 0.5025, 'learning_rate': 1.0253333333333336e-05, 'epoch': 0.03} {'loss': 0.4366, 'learning_rate': 1.0260000000000002e-05, 'epoch': 0.03} {'loss': 0.3468, 'learning_rate': 1.0266666666666668e-05, 'epoch': 0.03} {'loss': 0.5887, 'learning_rate': 1.0273333333333335e-05, 'epoch': 0.03} {'loss': 0.2751, 'learning_rate': 1.0280000000000002e-05, 'epoch': 0.03} {'loss': 0.4118, 'learning_rate': 1.0286666666666668e-05, 'epoch': 0.03} {'loss': 0.4439, 'learning_rate': 1.0293333333333335e-05, 'epoch': 0.03} {'loss': 0.3978, 'learning_rate': 1.0300000000000001e-05, 'epoch': 0.03} {'loss': 0.3553, 'learning_rate': 1.0306666666666667e-05, 'epoch': 0.03} {'loss': 0.341, 'learning_rate': 1.0313333333333335e-05, 'epoch': 0.03} {'loss': 0.4085, 'learning_rate': 1.0320000000000001e-05, 'epoch': 0.03} {'loss': 0.3555, 'learning_rate': 1.0326666666666667e-05, 'epoch': 0.03} {'loss': 0.7195, 'learning_rate': 1.0333333333333335e-05, 'epoch': 0.03} {'loss': 0.6156, 'learning_rate': 1.0340000000000001e-05, 'epoch': 0.03} {'loss': 0.6483, 'learning_rate': 1.0346666666666667e-05, 'epoch': 0.03} {'loss': 0.4454, 'learning_rate': 1.0353333333333335e-05, 'epoch': 0.03} {'loss': 0.4585, 'learning_rate': 1.036e-05, 'epoch': 0.03} {'loss': 0.4347, 'learning_rate': 1.0366666666666667e-05, 'epoch': 0.03} {'loss': 0.3718, 'learning_rate': 1.0373333333333335e-05, 'epoch': 0.03} {'loss': 0.5022, 'learning_rate': 1.038e-05, 'epoch': 0.03} {'loss': 0.4528, 'learning_rate': 1.0386666666666667e-05, 'epoch': 0.03} {'loss': 0.5241, 'learning_rate': 1.0393333333333336e-05, 'epoch': 0.03} {'loss': 0.3806, 'learning_rate': 1.04e-05, 'epoch': 0.03} {'loss': 0.8645, 'learning_rate': 1.0406666666666666e-05, 'epoch': 0.03} {'loss': 0.3891, 'learning_rate': 1.0413333333333336e-05, 'epoch': 0.03} {'loss': 0.308, 'learning_rate': 1.0420000000000002e-05, 'epoch': 0.03} {'loss': 0.5874, 'learning_rate': 1.0426666666666668e-05, 'epoch': 0.03} {'loss': 0.5577, 'learning_rate': 1.0433333333333332e-05, 'epoch': 0.03} {'loss': 0.6379, 'learning_rate': 1.0440000000000002e-05, 'epoch': 0.03} {'loss': 0.2314, 'learning_rate': 1.0446666666666668e-05, 'epoch': 0.03} {'loss': 0.4091, 'learning_rate': 1.0453333333333334e-05, 'epoch': 0.03} {'loss': 0.5213, 'learning_rate': 1.0460000000000001e-05, 'epoch': 0.03} {'loss': 0.4144, 'learning_rate': 1.0466666666666668e-05, 'epoch': 0.03} {'loss': 0.5491, 'learning_rate': 1.0473333333333334e-05, 'epoch': 0.03} {'loss': 0.5028, 'learning_rate': 1.0480000000000001e-05, 'epoch': 0.03} {'loss': 0.4156, 'learning_rate': 1.0486666666666667e-05, 'epoch': 0.03} {'loss': 0.4773, 'learning_rate': 1.0493333333333333e-05, 'epoch': 0.03} {'loss': 0.5244, 'learning_rate': 1.0500000000000001e-05, 'epoch': 0.03} {'loss': 0.5133, 'learning_rate': 1.0506666666666667e-05, 'epoch': 0.03} {'loss': 0.2317, 'learning_rate': 1.0513333333333333e-05, 'epoch': 0.03} {'loss': 0.3719, 'learning_rate': 1.0520000000000001e-05, 'epoch': 0.03} {'loss': 0.4257, 'learning_rate': 1.0526666666666667e-05, 'epoch': 0.03} {'loss': 0.2863, 'learning_rate': 1.0533333333333333e-05, 'epoch': 0.03} {'loss': 0.49, 'learning_rate': 1.054e-05, 'epoch': 0.03} {'loss': 0.4632, 'learning_rate': 1.0546666666666667e-05, 'epoch': 0.03} {'loss': 0.4677, 'learning_rate': 1.0553333333333333e-05, 'epoch': 0.03} {'loss': 0.3379, 'learning_rate': 1.056e-05, 'epoch': 0.03} {'loss': 0.4231, 'learning_rate': 1.0566666666666667e-05, 'epoch': 0.03} {'loss': 0.3553, 'learning_rate': 1.0573333333333333e-05, 'epoch': 0.03} {'loss': 0.4478, 'learning_rate': 1.0580000000000002e-05, 'epoch': 0.03} {'loss': 0.4578, 'learning_rate': 1.0586666666666668e-05, 'epoch': 0.03} {'loss': 0.4655, 'learning_rate': 1.0593333333333332e-05, 'epoch': 0.03} {'loss': 0.332, 'learning_rate': 1.0600000000000002e-05, 'epoch': 0.03} {'loss': 0.4867, 'learning_rate': 1.0606666666666668e-05, 'epoch': 0.03} {'loss': 0.4971, 'learning_rate': 1.0613333333333334e-05, 'epoch': 0.03} {'loss': 0.4758, 'learning_rate': 1.0620000000000002e-05, 'epoch': 0.03} {'loss': 0.5233, 'learning_rate': 1.0626666666666668e-05, 'epoch': 0.03} {'loss': 0.471, 'learning_rate': 1.0633333333333334e-05, 'epoch': 0.03} {'loss': 0.4981, 'learning_rate': 1.0640000000000001e-05, 'epoch': 0.03} {'loss': 0.2374, 'learning_rate': 1.0646666666666668e-05, 'epoch': 0.03} {'loss': 0.6022, 'learning_rate': 1.0653333333333334e-05, 'epoch': 0.03} {'loss': 0.3205, 'learning_rate': 1.0660000000000001e-05, 'epoch': 0.03} {'loss': 0.2918, 'learning_rate': 1.0666666666666667e-05, 'epoch': 0.03} {'loss': 0.5106, 'learning_rate': 1.0673333333333333e-05, 'epoch': 0.03} {'loss': 0.5425, 'learning_rate': 1.0680000000000001e-05, 'epoch': 0.03} {'loss': 0.3441, 'learning_rate': 1.0686666666666667e-05, 'epoch': 0.03} {'loss': 0.3293, 'learning_rate': 1.0693333333333333e-05, 'epoch': 0.03} {'loss': 0.4143, 'learning_rate': 1.0700000000000001e-05, 'epoch': 0.03} {'loss': 0.5379, 'learning_rate': 1.0706666666666667e-05, 'epoch': 0.03} {'loss': 0.5419, 'learning_rate': 1.0713333333333333e-05, 'epoch': 0.03} {'loss': 0.765, 'learning_rate': 1.072e-05, 'epoch': 0.03} {'loss': 0.4545, 'learning_rate': 1.0726666666666667e-05, 'epoch': 0.03} {'loss': 0.3724, 'learning_rate': 1.0733333333333333e-05, 'epoch': 0.03} {'loss': 0.4342, 'learning_rate': 1.0740000000000002e-05, 'epoch': 0.03} {'loss': 0.3631, 'learning_rate': 1.0746666666666668e-05, 'epoch': 0.03} {'loss': 0.4372, 'learning_rate': 1.0753333333333333e-05, 'epoch': 0.03} {'loss': 0.5205, 'learning_rate': 1.0760000000000002e-05, 'epoch': 0.03} {'loss': 0.4081, 'learning_rate': 1.0766666666666668e-05, 'epoch': 0.03} {'loss': 0.312, 'learning_rate': 1.0773333333333334e-05, 'epoch': 0.03} {'loss': 0.503, 'learning_rate': 1.0780000000000002e-05, 'epoch': 0.03} {'loss': 0.3044, 'learning_rate': 1.0786666666666668e-05, 'epoch': 0.03} {'loss': 0.3459, 'learning_rate': 1.0793333333333334e-05, 'epoch': 0.03} {'loss': 0.4556, 'learning_rate': 1.0800000000000002e-05, 'epoch': 0.03} {'loss': 0.3194, 'learning_rate': 1.0806666666666668e-05, 'epoch': 0.03} {'loss': 0.4693, 'learning_rate': 1.0813333333333334e-05, 'epoch': 0.03} {'loss': 0.4451, 'learning_rate': 1.0820000000000001e-05, 'epoch': 0.03} {'loss': 0.4758, 'learning_rate': 1.0826666666666667e-05, 'epoch': 0.03} {'loss': 0.5306, 'learning_rate': 1.0833333333333334e-05, 'epoch': 0.03} {'loss': 0.6109, 'learning_rate': 1.0840000000000001e-05, 'epoch': 0.03} {'loss': 0.4042, 'learning_rate': 1.0846666666666667e-05, 'epoch': 0.03} {'loss': 0.4904, 'learning_rate': 1.0853333333333333e-05, 'epoch': 0.03} {'loss': 0.3916, 'learning_rate': 1.0860000000000001e-05, 'epoch': 0.03} {'loss': 0.4391, 'learning_rate': 1.0866666666666667e-05, 'epoch': 0.03} {'loss': 0.3868, 'learning_rate': 1.0873333333333333e-05, 'epoch': 0.03} {'loss': 0.5284, 'learning_rate': 1.0880000000000001e-05, 'epoch': 0.03} {'loss': 0.5606, 'learning_rate': 1.0886666666666667e-05, 'epoch': 0.03} {'loss': 0.4325, 'learning_rate': 1.0893333333333333e-05, 'epoch': 0.03} {'loss': 0.5184, 'learning_rate': 1.0900000000000002e-05, 'epoch': 0.03} {'loss': 0.6483, 'learning_rate': 1.0906666666666668e-05, 'epoch': 0.03} {'loss': 0.4787, 'learning_rate': 1.0913333333333333e-05, 'epoch': 0.03} {'loss': 0.4673, 'learning_rate': 1.0920000000000002e-05, 'epoch': 0.03} {'loss': 0.3826, 'learning_rate': 1.0926666666666668e-05, 'epoch': 0.03} {'loss': 0.4681, 'learning_rate': 1.0933333333333334e-05, 'epoch': 0.03} {'loss': 0.3402, 'learning_rate': 1.0940000000000002e-05, 'epoch': 0.03} {'loss': 0.3169, 'learning_rate': 1.0946666666666668e-05, 'epoch': 0.03} {'loss': 0.3991, 'learning_rate': 1.0953333333333334e-05, 'epoch': 0.03} {'loss': 0.3647, 'learning_rate': 1.0960000000000002e-05, 'epoch': 0.03} {'loss': 0.4468, 'learning_rate': 1.0966666666666668e-05, 'epoch': 0.03} {'loss': 0.471, 'learning_rate': 1.0973333333333334e-05, 'epoch': 0.03} {'loss': 0.3503, 'learning_rate': 1.0980000000000002e-05, 'epoch': 0.03} {'loss': 0.4682, 'learning_rate': 1.0986666666666668e-05, 'epoch': 0.03} {'loss': 0.443, 'learning_rate': 1.0993333333333334e-05, 'epoch': 0.03} {'loss': 0.4547, 'learning_rate': 1.1000000000000001e-05, 'epoch': 0.03} {'loss': 0.4167, 'learning_rate': 1.1006666666666667e-05, 'epoch': 0.03} {'loss': 0.3942, 'learning_rate': 1.1013333333333333e-05, 'epoch': 0.03} {'loss': 0.5676, 'learning_rate': 1.1020000000000001e-05, 'epoch': 0.03} {'loss': 0.5878, 'learning_rate': 1.1026666666666667e-05, 'epoch': 0.03} {'loss': 0.4001, 'learning_rate': 1.1033333333333333e-05, 'epoch': 0.03} {'loss': 0.5025, 'learning_rate': 1.1040000000000001e-05, 'epoch': 0.03} {'loss': 0.6684, 'learning_rate': 1.1046666666666667e-05, 'epoch': 0.03} {'loss': 0.3671, 'learning_rate': 1.1053333333333333e-05, 'epoch': 0.03} {'loss': 0.4015, 'learning_rate': 1.1060000000000003e-05, 'epoch': 0.03} {'loss': 0.6589, 'learning_rate': 1.1066666666666669e-05, 'epoch': 0.03} {'loss': 0.5386, 'learning_rate': 1.1073333333333333e-05, 'epoch': 0.03} {'loss': 0.221, 'learning_rate': 1.1080000000000002e-05, 'epoch': 0.03} {'loss': 0.4416, 'learning_rate': 1.1086666666666668e-05, 'epoch': 0.03} {'loss': 0.4975, 'learning_rate': 1.1093333333333334e-05, 'epoch': 0.03} {'loss': 0.5077, 'learning_rate': 1.1100000000000002e-05, 'epoch': 0.03} {'loss': 0.4643, 'learning_rate': 1.1106666666666668e-05, 'epoch': 0.03} {'loss': 0.4057, 'learning_rate': 1.1113333333333334e-05, 'epoch': 0.03} {'loss': 0.3343, 'learning_rate': 1.1120000000000002e-05, 'epoch': 0.03} {'loss': 0.4665, 'learning_rate': 1.1126666666666668e-05, 'epoch': 0.03} {'loss': 0.3657, 'learning_rate': 1.1133333333333334e-05, 'epoch': 0.03} {'loss': 0.2997, 'learning_rate': 1.1140000000000002e-05, 'epoch': 0.03} {'loss': 0.5071, 'learning_rate': 1.1146666666666668e-05, 'epoch': 0.03} {'loss': 0.3576, 'learning_rate': 1.1153333333333334e-05, 'epoch': 0.03} {'loss': 0.3972, 'learning_rate': 1.1160000000000002e-05, 'epoch': 0.03} {'loss': 0.5749, 'learning_rate': 1.1166666666666668e-05, 'epoch': 0.03} {'loss': 0.4558, 'learning_rate': 1.1173333333333334e-05, 'epoch': 0.03} {'loss': 0.5179, 'learning_rate': 1.1180000000000001e-05, 'epoch': 0.03} {'loss': 0.5428, 'learning_rate': 1.1186666666666667e-05, 'epoch': 0.03} {'loss': 0.5587, 'learning_rate': 1.1193333333333333e-05, 'epoch': 0.03} {'loss': 0.6411, 'learning_rate': 1.1200000000000001e-05, 'epoch': 0.03} {'loss': 0.5124, 'learning_rate': 1.1206666666666667e-05, 'epoch': 0.03} {'loss': 0.5032, 'learning_rate': 1.1213333333333333e-05, 'epoch': 0.03} {'loss': 0.5203, 'learning_rate': 1.1220000000000003e-05, 'epoch': 0.03} {'loss': 0.4155, 'learning_rate': 1.1226666666666669e-05, 'epoch': 0.03} {'loss': 0.3738, 'learning_rate': 1.1233333333333333e-05, 'epoch': 0.03} {'loss': 0.6254, 'learning_rate': 1.1240000000000002e-05, 'epoch': 0.03} {'loss': 0.5955, 'learning_rate': 1.1246666666666669e-05, 'epoch': 0.03} {'loss': 0.4078, 'learning_rate': 1.1253333333333335e-05, 'epoch': 0.03} {'loss': 0.498, 'learning_rate': 1.126e-05, 'epoch': 0.04} {'loss': 0.404, 'learning_rate': 1.1266666666666668e-05, 'epoch': 0.04} {'loss': 0.4182, 'learning_rate': 1.1273333333333334e-05, 'epoch': 0.04} {'loss': 0.4785, 'learning_rate': 1.128e-05, 'epoch': 0.04} {'loss': 0.5576, 'learning_rate': 1.1286666666666668e-05, 'epoch': 0.04} {'loss': 0.4706, 'learning_rate': 1.1293333333333334e-05, 'epoch': 0.04} {'loss': 0.3858, 'learning_rate': 1.13e-05, 'epoch': 0.04} {'loss': 0.6262, 'learning_rate': 1.1306666666666668e-05, 'epoch': 0.04} {'loss': 0.3747, 'learning_rate': 1.1313333333333334e-05, 'epoch': 0.04} {'loss': 0.6914, 'learning_rate': 1.132e-05, 'epoch': 0.04} {'loss': 0.691, 'learning_rate': 1.1326666666666668e-05, 'epoch': 0.04} {'loss': 0.4182, 'learning_rate': 1.1333333333333334e-05, 'epoch': 0.04} {'loss': 0.4178, 'learning_rate': 1.134e-05, 'epoch': 0.04} {'loss': 0.4541, 'learning_rate': 1.1346666666666668e-05, 'epoch': 0.04} {'loss': 0.3484, 'learning_rate': 1.1353333333333334e-05, 'epoch': 0.04} {'loss': 0.2617, 'learning_rate': 1.136e-05, 'epoch': 0.04} {'loss': 0.5376, 'learning_rate': 1.1366666666666667e-05, 'epoch': 0.04} {'loss': 0.4613, 'learning_rate': 1.1373333333333333e-05, 'epoch': 0.04} {'loss': 0.5473, 'learning_rate': 1.138e-05, 'epoch': 0.04} {'loss': 0.4087, 'learning_rate': 1.1386666666666669e-05, 'epoch': 0.04} {'loss': 0.433, 'learning_rate': 1.1393333333333333e-05, 'epoch': 0.04} {'loss': 0.4283, 'learning_rate': 1.14e-05, 'epoch': 0.04} {'loss': 0.5306, 'learning_rate': 1.1406666666666669e-05, 'epoch': 0.04} {'loss': 0.4764, 'learning_rate': 1.1413333333333335e-05, 'epoch': 0.04} {'loss': 0.5321, 'learning_rate': 1.142e-05, 'epoch': 0.04} {'loss': 0.5248, 'learning_rate': 1.1426666666666669e-05, 'epoch': 0.04} {'loss': 0.3663, 'learning_rate': 1.1433333333333335e-05, 'epoch': 0.04} {'loss': 0.375, 'learning_rate': 1.144e-05, 'epoch': 0.04} {'loss': 0.3269, 'learning_rate': 1.1446666666666668e-05, 'epoch': 0.04} {'loss': 0.4205, 'learning_rate': 1.1453333333333334e-05, 'epoch': 0.04} {'loss': 0.5491, 'learning_rate': 1.146e-05, 'epoch': 0.04} {'loss': 0.6793, 'learning_rate': 1.1466666666666668e-05, 'epoch': 0.04} {'loss': 0.5773, 'learning_rate': 1.1473333333333334e-05, 'epoch': 0.04} {'loss': 0.4044, 'learning_rate': 1.148e-05, 'epoch': 0.04} {'loss': 0.5176, 'learning_rate': 1.1486666666666668e-05, 'epoch': 0.04} {'loss': 0.3446, 'learning_rate': 1.1493333333333334e-05, 'epoch': 0.04} {'loss': 0.3936, 'learning_rate': 1.15e-05, 'epoch': 0.04} {'loss': 0.4064, 'learning_rate': 1.1506666666666668e-05, 'epoch': 0.04} {'loss': 0.4666, 'learning_rate': 1.1513333333333334e-05, 'epoch': 0.04} {'loss': 0.61, 'learning_rate': 1.152e-05, 'epoch': 0.04} {'loss': 0.5358, 'learning_rate': 1.1526666666666668e-05, 'epoch': 0.04} {'loss': 0.4971, 'learning_rate': 1.1533333333333334e-05, 'epoch': 0.04} {'loss': 0.3839, 'learning_rate': 1.154e-05, 'epoch': 0.04} {'loss': 0.5497, 'learning_rate': 1.1546666666666669e-05, 'epoch': 0.04} {'loss': 0.4467, 'learning_rate': 1.1553333333333333e-05, 'epoch': 0.04} {'loss': 0.625, 'learning_rate': 1.156e-05, 'epoch': 0.04} {'loss': 0.6129, 'learning_rate': 1.1566666666666669e-05, 'epoch': 0.04} {'loss': 0.3679, 'learning_rate': 1.1573333333333335e-05, 'epoch': 0.04} {'loss': 0.6504, 'learning_rate': 1.1580000000000001e-05, 'epoch': 0.04} {'loss': 0.5158, 'learning_rate': 1.1586666666666669e-05, 'epoch': 0.04} {'loss': 0.4672, 'learning_rate': 1.1593333333333335e-05, 'epoch': 0.04} {'loss': 0.4729, 'learning_rate': 1.16e-05, 'epoch': 0.04} {'loss': 0.5468, 'learning_rate': 1.1606666666666668e-05, 'epoch': 0.04} {'loss': 0.4235, 'learning_rate': 1.1613333333333335e-05, 'epoch': 0.04} {'loss': 0.355, 'learning_rate': 1.162e-05, 'epoch': 0.04} {'loss': 0.4116, 'learning_rate': 1.1626666666666668e-05, 'epoch': 0.04} {'loss': 0.3547, 'learning_rate': 1.1633333333333334e-05, 'epoch': 0.04} {'loss': 0.5472, 'learning_rate': 1.164e-05, 'epoch': 0.04} {'loss': 0.4449, 'learning_rate': 1.1646666666666668e-05, 'epoch': 0.04} {'loss': 0.3189, 'learning_rate': 1.1653333333333334e-05, 'epoch': 0.04} {'loss': 0.6123, 'learning_rate': 1.166e-05, 'epoch': 0.04} {'loss': 0.3259, 'learning_rate': 1.1666666666666668e-05, 'epoch': 0.04} {'loss': 0.397, 'learning_rate': 1.1673333333333334e-05, 'epoch': 0.04} {'loss': 0.3828, 'learning_rate': 1.168e-05, 'epoch': 0.04} {'loss': 0.4639, 'learning_rate': 1.1686666666666668e-05, 'epoch': 0.04} {'loss': 0.471, 'learning_rate': 1.1693333333333334e-05, 'epoch': 0.04} {'loss': 0.4751, 'learning_rate': 1.17e-05, 'epoch': 0.04} {'loss': 0.4286, 'learning_rate': 1.170666666666667e-05, 'epoch': 0.04} {'loss': 0.4198, 'learning_rate': 1.1713333333333334e-05, 'epoch': 0.04} {'loss': 0.486, 'learning_rate': 1.172e-05, 'epoch': 0.04} {'loss': 0.3867, 'learning_rate': 1.1726666666666669e-05, 'epoch': 0.04} {'loss': 0.3775, 'learning_rate': 1.1733333333333335e-05, 'epoch': 0.04} {'loss': 0.474, 'learning_rate': 1.1740000000000001e-05, 'epoch': 0.04} {'loss': 0.4467, 'learning_rate': 1.1746666666666669e-05, 'epoch': 0.04} {'loss': 0.5221, 'learning_rate': 1.1753333333333335e-05, 'epoch': 0.04} {'loss': 0.402, 'learning_rate': 1.1760000000000001e-05, 'epoch': 0.04} {'loss': 0.4815, 'learning_rate': 1.1766666666666669e-05, 'epoch': 0.04} {'loss': 0.4452, 'learning_rate': 1.1773333333333335e-05, 'epoch': 0.04} {'loss': 0.4096, 'learning_rate': 1.178e-05, 'epoch': 0.04} {'loss': 0.4691, 'learning_rate': 1.1786666666666668e-05, 'epoch': 0.04} {'loss': 0.4669, 'learning_rate': 1.1793333333333334e-05, 'epoch': 0.04} {'loss': 0.5419, 'learning_rate': 1.18e-05, 'epoch': 0.04} {'loss': 0.4094, 'learning_rate': 1.1806666666666668e-05, 'epoch': 0.04} {'loss': 0.4554, 'learning_rate': 1.1813333333333334e-05, 'epoch': 0.04} {'loss': 0.4593, 'learning_rate': 1.182e-05, 'epoch': 0.04} {'loss': 0.3125, 'learning_rate': 1.1826666666666668e-05, 'epoch': 0.04} {'loss': 0.4217, 'learning_rate': 1.1833333333333334e-05, 'epoch': 0.04} {'loss': 0.4602, 'learning_rate': 1.184e-05, 'epoch': 0.04} {'loss': 0.569, 'learning_rate': 1.1846666666666668e-05, 'epoch': 0.04} {'loss': 0.4717, 'learning_rate': 1.1853333333333334e-05, 'epoch': 0.04} {'loss': 0.4689, 'learning_rate': 1.186e-05, 'epoch': 0.04} {'loss': 0.4485, 'learning_rate': 1.186666666666667e-05, 'epoch': 0.04} {'loss': 0.476, 'learning_rate': 1.1873333333333334e-05, 'epoch': 0.04} {'loss': 0.6354, 'learning_rate': 1.188e-05, 'epoch': 0.04} {'loss': 0.4092, 'learning_rate': 1.188666666666667e-05, 'epoch': 0.04} {'loss': 0.6233, 'learning_rate': 1.1893333333333335e-05, 'epoch': 0.04} {'loss': 0.4852, 'learning_rate': 1.1900000000000001e-05, 'epoch': 0.04} {'loss': 0.4684, 'learning_rate': 1.1906666666666669e-05, 'epoch': 0.04} {'loss': 0.4417, 'learning_rate': 1.1913333333333335e-05, 'epoch': 0.04} {'loss': 0.5543, 'learning_rate': 1.1920000000000001e-05, 'epoch': 0.04} {'loss': 0.4937, 'learning_rate': 1.1926666666666669e-05, 'epoch': 0.04} {'loss': 0.2622, 'learning_rate': 1.1933333333333335e-05, 'epoch': 0.04} {'loss': 0.3722, 'learning_rate': 1.1940000000000001e-05, 'epoch': 0.04} {'loss': 0.513, 'learning_rate': 1.1946666666666669e-05, 'epoch': 0.04} {'loss': 0.4256, 'learning_rate': 1.1953333333333335e-05, 'epoch': 0.04} {'loss': 0.4656, 'learning_rate': 1.196e-05, 'epoch': 0.04} {'loss': 0.3749, 'learning_rate': 1.1966666666666668e-05, 'epoch': 0.04} {'loss': 0.4548, 'learning_rate': 1.1973333333333334e-05, 'epoch': 0.04} {'loss': 0.4387, 'learning_rate': 1.198e-05, 'epoch': 0.04} {'loss': 0.448, 'learning_rate': 1.1986666666666668e-05, 'epoch': 0.04} {'loss': 0.4058, 'learning_rate': 1.1993333333333334e-05, 'epoch': 0.04} {'loss': 0.418, 'learning_rate': 1.2e-05, 'epoch': 0.04} {'loss': 0.4421, 'learning_rate': 1.2006666666666668e-05, 'epoch': 0.04} {'loss': 0.4566, 'learning_rate': 1.2013333333333334e-05, 'epoch': 0.04} {'loss': 0.5812, 'learning_rate': 1.202e-05, 'epoch': 0.04} {'loss': 0.3659, 'learning_rate': 1.202666666666667e-05, 'epoch': 0.04} {'loss': 0.4703, 'learning_rate': 1.2033333333333334e-05, 'epoch': 0.04} {'loss': 0.5026, 'learning_rate': 1.204e-05, 'epoch': 0.04} {'loss': 0.3152, 'learning_rate': 1.204666666666667e-05, 'epoch': 0.04} {'loss': 0.4527, 'learning_rate': 1.2053333333333335e-05, 'epoch': 0.04} {'loss': 0.2786, 'learning_rate': 1.2060000000000001e-05, 'epoch': 0.04} {'loss': 0.4466, 'learning_rate': 1.206666666666667e-05, 'epoch': 0.04} {'loss': 0.6091, 'learning_rate': 1.2073333333333335e-05, 'epoch': 0.04} {'loss': 0.4518, 'learning_rate': 1.2080000000000001e-05, 'epoch': 0.04} {'loss': 0.4068, 'learning_rate': 1.2086666666666667e-05, 'epoch': 0.04} {'loss': 0.4366, 'learning_rate': 1.2093333333333335e-05, 'epoch': 0.04} {'loss': 0.5164, 'learning_rate': 1.2100000000000001e-05, 'epoch': 0.04} {'loss': 0.3854, 'learning_rate': 1.2106666666666667e-05, 'epoch': 0.04} {'loss': 0.5673, 'learning_rate': 1.2113333333333335e-05, 'epoch': 0.04} {'loss': 0.4818, 'learning_rate': 1.2120000000000001e-05, 'epoch': 0.04} {'loss': 0.2176, 'learning_rate': 1.2126666666666667e-05, 'epoch': 0.04} {'loss': 0.4187, 'learning_rate': 1.2133333333333335e-05, 'epoch': 0.04} {'loss': 0.496, 'learning_rate': 1.214e-05, 'epoch': 0.04} {'loss': 0.3582, 'learning_rate': 1.2146666666666667e-05, 'epoch': 0.04} {'loss': 0.3686, 'learning_rate': 1.2153333333333334e-05, 'epoch': 0.04} {'loss': 0.6066, 'learning_rate': 1.216e-05, 'epoch': 0.04} {'loss': 0.5489, 'learning_rate': 1.2166666666666667e-05, 'epoch': 0.04} {'loss': 0.2399, 'learning_rate': 1.2173333333333334e-05, 'epoch': 0.04} {'loss': 0.4718, 'learning_rate': 1.218e-05, 'epoch': 0.04} {'loss': 0.5165, 'learning_rate': 1.2186666666666666e-05, 'epoch': 0.04} {'loss': 0.5876, 'learning_rate': 1.2193333333333334e-05, 'epoch': 0.04} {'loss': 0.4532, 'learning_rate': 1.22e-05, 'epoch': 0.04} {'loss': 0.6755, 'learning_rate': 1.2206666666666666e-05, 'epoch': 0.04} {'loss': 0.4343, 'learning_rate': 1.2213333333333336e-05, 'epoch': 0.04} {'loss': 0.352, 'learning_rate': 1.2220000000000002e-05, 'epoch': 0.04} {'loss': 0.4793, 'learning_rate': 1.2226666666666666e-05, 'epoch': 0.04} {'loss': 0.6574, 'learning_rate': 1.2233333333333335e-05, 'epoch': 0.04} {'loss': 0.4814, 'learning_rate': 1.2240000000000001e-05, 'epoch': 0.04} {'loss': 0.4784, 'learning_rate': 1.2246666666666667e-05, 'epoch': 0.04} {'loss': 0.4218, 'learning_rate': 1.2253333333333335e-05, 'epoch': 0.04} {'loss': 0.4518, 'learning_rate': 1.2260000000000001e-05, 'epoch': 0.04} {'loss': 0.4744, 'learning_rate': 1.2266666666666667e-05, 'epoch': 0.04} {'loss': 0.3128, 'learning_rate': 1.2273333333333335e-05, 'epoch': 0.04} {'loss': 0.3719, 'learning_rate': 1.2280000000000001e-05, 'epoch': 0.04} {'loss': 0.5899, 'learning_rate': 1.2286666666666667e-05, 'epoch': 0.04} {'loss': 0.3918, 'learning_rate': 1.2293333333333335e-05, 'epoch': 0.04} {'loss': 0.4633, 'learning_rate': 1.23e-05, 'epoch': 0.04} {'loss': 0.3331, 'learning_rate': 1.2306666666666667e-05, 'epoch': 0.04} {'loss': 0.2926, 'learning_rate': 1.2313333333333335e-05, 'epoch': 0.04} {'loss': 0.4998, 'learning_rate': 1.232e-05, 'epoch': 0.04} {'loss': 0.3994, 'learning_rate': 1.2326666666666667e-05, 'epoch': 0.04} {'loss': 0.4756, 'learning_rate': 1.2333333333333334e-05, 'epoch': 0.04} {'loss': 0.3078, 'learning_rate': 1.234e-05, 'epoch': 0.04} {'loss': 0.4115, 'learning_rate': 1.2346666666666666e-05, 'epoch': 0.04} {'loss': 0.498, 'learning_rate': 1.2353333333333334e-05, 'epoch': 0.04} {'loss': 0.4176, 'learning_rate': 1.236e-05, 'epoch': 0.04} {'loss': 0.4207, 'learning_rate': 1.2366666666666666e-05, 'epoch': 0.04} {'loss': 0.4188, 'learning_rate': 1.2373333333333336e-05, 'epoch': 0.04} {'loss': 0.4409, 'learning_rate': 1.2380000000000002e-05, 'epoch': 0.04} {'loss': 0.6467, 'learning_rate': 1.2386666666666666e-05, 'epoch': 0.04} {'loss': 0.4974, 'learning_rate': 1.2393333333333336e-05, 'epoch': 0.04} {'loss': 0.5151, 'learning_rate': 1.2400000000000002e-05, 'epoch': 0.04} {'loss': 0.4132, 'learning_rate': 1.2406666666666668e-05, 'epoch': 0.04} {'loss': 0.4211, 'learning_rate': 1.2413333333333335e-05, 'epoch': 0.04} {'loss': 0.3102, 'learning_rate': 1.2420000000000001e-05, 'epoch': 0.04} {'loss': 0.4992, 'learning_rate': 1.2426666666666667e-05, 'epoch': 0.04} {'loss': 0.4051, 'learning_rate': 1.2433333333333335e-05, 'epoch': 0.04} {'loss': 0.5142, 'learning_rate': 1.2440000000000001e-05, 'epoch': 0.04} {'loss': 0.4651, 'learning_rate': 1.2446666666666667e-05, 'epoch': 0.04} {'loss': 0.3953, 'learning_rate': 1.2453333333333335e-05, 'epoch': 0.04} {'loss': 0.5716, 'learning_rate': 1.2460000000000001e-05, 'epoch': 0.04} {'loss': 0.3858, 'learning_rate': 1.2466666666666667e-05, 'epoch': 0.04} {'loss': 0.4824, 'learning_rate': 1.2473333333333335e-05, 'epoch': 0.04} {'loss': 0.4042, 'learning_rate': 1.248e-05, 'epoch': 0.04} {'loss': 0.4543, 'learning_rate': 1.2486666666666667e-05, 'epoch': 0.04} {'loss': 0.3439, 'learning_rate': 1.2493333333333335e-05, 'epoch': 0.04} {'loss': 0.4089, 'learning_rate': 1.25e-05, 'epoch': 0.04} {'loss': 0.3968, 'learning_rate': 1.2506666666666667e-05, 'epoch': 0.04} {'loss': 0.6183, 'learning_rate': 1.2513333333333334e-05, 'epoch': 0.04} {'loss': 0.4615, 'learning_rate': 1.252e-05, 'epoch': 0.04} {'loss': 0.4802, 'learning_rate': 1.2526666666666666e-05, 'epoch': 0.04} {'loss': 0.5657, 'learning_rate': 1.2533333333333336e-05, 'epoch': 0.04} {'loss': 0.3917, 'learning_rate': 1.254e-05, 'epoch': 0.04} {'loss': 0.5715, 'learning_rate': 1.2546666666666666e-05, 'epoch': 0.04} {'loss': 0.344, 'learning_rate': 1.2553333333333336e-05, 'epoch': 0.04} {'loss': 0.2207, 'learning_rate': 1.2560000000000002e-05, 'epoch': 0.04} {'loss': 0.4776, 'learning_rate': 1.2566666666666668e-05, 'epoch': 0.04} {'loss': 0.5233, 'learning_rate': 1.2573333333333335e-05, 'epoch': 0.04} {'loss': 0.5511, 'learning_rate': 1.2580000000000002e-05, 'epoch': 0.04} {'loss': 0.488, 'learning_rate': 1.2586666666666668e-05, 'epoch': 0.04} {'loss': 0.4464, 'learning_rate': 1.2593333333333335e-05, 'epoch': 0.04} {'loss': 0.2821, 'learning_rate': 1.2600000000000001e-05, 'epoch': 0.04} {'loss': 0.5116, 'learning_rate': 1.2606666666666667e-05, 'epoch': 0.04} {'loss': 0.5089, 'learning_rate': 1.2613333333333335e-05, 'epoch': 0.04} {'loss': 0.4116, 'learning_rate': 1.2620000000000001e-05, 'epoch': 0.04} {'loss': 0.4663, 'learning_rate': 1.2626666666666667e-05, 'epoch': 0.04} {'loss': 0.4245, 'learning_rate': 1.2633333333333335e-05, 'epoch': 0.04} {'loss': 0.3912, 'learning_rate': 1.2640000000000001e-05, 'epoch': 0.04} {'loss': 0.502, 'learning_rate': 1.2646666666666667e-05, 'epoch': 0.04} {'loss': 0.5599, 'learning_rate': 1.2653333333333335e-05, 'epoch': 0.04} {'loss': 0.6246, 'learning_rate': 1.266e-05, 'epoch': 0.04} {'loss': 0.5302, 'learning_rate': 1.2666666666666667e-05, 'epoch': 0.04} {'loss': 0.3614, 'learning_rate': 1.2673333333333335e-05, 'epoch': 0.04} {'loss': 0.575, 'learning_rate': 1.268e-05, 'epoch': 0.04} {'loss': 0.4852, 'learning_rate': 1.2686666666666667e-05, 'epoch': 0.04} {'loss': 0.5659, 'learning_rate': 1.2693333333333336e-05, 'epoch': 0.04} {'loss': 0.2787, 'learning_rate': 1.27e-05, 'epoch': 0.04} {'loss': 0.3134, 'learning_rate': 1.2706666666666666e-05, 'epoch': 0.04} {'loss': 0.4387, 'learning_rate': 1.2713333333333336e-05, 'epoch': 0.04} {'loss': 0.3609, 'learning_rate': 1.2720000000000002e-05, 'epoch': 0.04} {'loss': 0.3869, 'learning_rate': 1.2726666666666668e-05, 'epoch': 0.04} {'loss': 0.2907, 'learning_rate': 1.2733333333333336e-05, 'epoch': 0.04} {'loss': 0.4755, 'learning_rate': 1.2740000000000002e-05, 'epoch': 0.04} {'loss': 0.6323, 'learning_rate': 1.2746666666666668e-05, 'epoch': 0.04} {'loss': 0.4004, 'learning_rate': 1.2753333333333335e-05, 'epoch': 0.04} {'loss': 0.3841, 'learning_rate': 1.2760000000000001e-05, 'epoch': 0.04} {'loss': 0.5494, 'learning_rate': 1.2766666666666668e-05, 'epoch': 0.04} {'loss': 0.402, 'learning_rate': 1.2773333333333335e-05, 'epoch': 0.04} {'loss': 0.6711, 'learning_rate': 1.2780000000000001e-05, 'epoch': 0.04} {'loss': 0.4616, 'learning_rate': 1.2786666666666667e-05, 'epoch': 0.04} {'loss': 0.7627, 'learning_rate': 1.2793333333333335e-05, 'epoch': 0.04} {'loss': 0.4341, 'learning_rate': 1.2800000000000001e-05, 'epoch': 0.04} {'loss': 0.6086, 'learning_rate': 1.2806666666666667e-05, 'epoch': 0.04} {'loss': 0.4198, 'learning_rate': 1.2813333333333335e-05, 'epoch': 0.04} {'loss': 0.456, 'learning_rate': 1.2820000000000001e-05, 'epoch': 0.04} {'loss': 0.4519, 'learning_rate': 1.2826666666666667e-05, 'epoch': 0.04} {'loss': 0.3848, 'learning_rate': 1.2833333333333335e-05, 'epoch': 0.04} {'loss': 0.5855, 'learning_rate': 1.284e-05, 'epoch': 0.04} {'loss': 0.4558, 'learning_rate': 1.2846666666666667e-05, 'epoch': 0.04} {'loss': 0.4787, 'learning_rate': 1.2853333333333336e-05, 'epoch': 0.04} {'loss': 0.4321, 'learning_rate': 1.286e-05, 'epoch': 0.04} {'loss': 0.3902, 'learning_rate': 1.2866666666666667e-05, 'epoch': 0.04} {'loss': 0.5571, 'learning_rate': 1.2873333333333336e-05, 'epoch': 0.04} {'loss': 0.3458, 'learning_rate': 1.2880000000000002e-05, 'epoch': 0.04} {'loss': 0.4088, 'learning_rate': 1.2886666666666668e-05, 'epoch': 0.04} {'loss': 0.6402, 'learning_rate': 1.2893333333333336e-05, 'epoch': 0.04} {'loss': 0.372, 'learning_rate': 1.2900000000000002e-05, 'epoch': 0.04} {'loss': 0.4429, 'learning_rate': 1.2906666666666668e-05, 'epoch': 0.04} {'loss': 0.4113, 'learning_rate': 1.2913333333333336e-05, 'epoch': 0.04} {'loss': 0.3881, 'learning_rate': 1.2920000000000002e-05, 'epoch': 0.04} {'loss': 0.6333, 'learning_rate': 1.2926666666666668e-05, 'epoch': 0.04} {'loss': 0.3889, 'learning_rate': 1.2933333333333334e-05, 'epoch': 0.04} {'loss': 0.4976, 'learning_rate': 1.2940000000000001e-05, 'epoch': 0.04} {'loss': 0.3696, 'learning_rate': 1.2946666666666668e-05, 'epoch': 0.04} {'loss': 0.4083, 'learning_rate': 1.2953333333333334e-05, 'epoch': 0.04} {'loss': 0.6582, 'learning_rate': 1.2960000000000001e-05, 'epoch': 0.04} {'loss': 0.5783, 'learning_rate': 1.2966666666666667e-05, 'epoch': 0.04} {'loss': 0.4592, 'learning_rate': 1.2973333333333333e-05, 'epoch': 0.04} {'loss': 0.5483, 'learning_rate': 1.2980000000000001e-05, 'epoch': 0.04} {'loss': 0.4637, 'learning_rate': 1.2986666666666667e-05, 'epoch': 0.04} {'loss': 0.4711, 'learning_rate': 1.2993333333333333e-05, 'epoch': 0.04} {'loss': 0.3716, 'learning_rate': 1.3000000000000001e-05, 'epoch': 0.04} {'loss': 0.519, 'learning_rate': 1.3006666666666667e-05, 'epoch': 0.04} {'loss': 0.5311, 'learning_rate': 1.3013333333333333e-05, 'epoch': 0.04} {'loss': 0.4197, 'learning_rate': 1.302e-05, 'epoch': 0.04} {'loss': 0.6224, 'learning_rate': 1.3026666666666667e-05, 'epoch': 0.04} {'loss': 0.4038, 'learning_rate': 1.3033333333333333e-05, 'epoch': 0.04} {'loss': 0.5691, 'learning_rate': 1.3040000000000002e-05, 'epoch': 0.04} {'loss': 0.2267, 'learning_rate': 1.3046666666666668e-05, 'epoch': 0.04} {'loss': 0.3727, 'learning_rate': 1.3053333333333333e-05, 'epoch': 0.04} {'loss': 0.465, 'learning_rate': 1.3060000000000002e-05, 'epoch': 0.04} {'loss': 0.43, 'learning_rate': 1.3066666666666668e-05, 'epoch': 0.04} {'loss': 0.4126, 'learning_rate': 1.3073333333333334e-05, 'epoch': 0.04} {'loss': 0.676, 'learning_rate': 1.3080000000000002e-05, 'epoch': 0.04} {'loss': 0.5267, 'learning_rate': 1.3086666666666668e-05, 'epoch': 0.04} {'loss': 0.3435, 'learning_rate': 1.3093333333333334e-05, 'epoch': 0.04} {'loss': 0.66, 'learning_rate': 1.3100000000000002e-05, 'epoch': 0.04} {'loss': 0.6515, 'learning_rate': 1.3106666666666668e-05, 'epoch': 0.04} {'loss': 0.3054, 'learning_rate': 1.3113333333333334e-05, 'epoch': 0.04} {'loss': 0.3351, 'learning_rate': 1.3120000000000001e-05, 'epoch': 0.04} {'loss': 0.5213, 'learning_rate': 1.3126666666666667e-05, 'epoch': 0.04} {'loss': 0.5045, 'learning_rate': 1.3133333333333334e-05, 'epoch': 0.04} {'loss': 0.4521, 'learning_rate': 1.3140000000000001e-05, 'epoch': 0.04} {'loss': 0.2504, 'learning_rate': 1.3146666666666667e-05, 'epoch': 0.04} {'loss': 0.5079, 'learning_rate': 1.3153333333333333e-05, 'epoch': 0.04} {'loss': 0.6287, 'learning_rate': 1.3160000000000001e-05, 'epoch': 0.04} {'loss': 0.352, 'learning_rate': 1.3166666666666667e-05, 'epoch': 0.04} {'loss': 0.4519, 'learning_rate': 1.3173333333333333e-05, 'epoch': 0.04} {'loss': 0.3051, 'learning_rate': 1.3180000000000001e-05, 'epoch': 0.04} {'loss': 0.5726, 'learning_rate': 1.3186666666666667e-05, 'epoch': 0.04} {'loss': 0.4223, 'learning_rate': 1.3193333333333333e-05, 'epoch': 0.04} {'loss': 0.4481, 'learning_rate': 1.3200000000000002e-05, 'epoch': 0.04} {'loss': 0.4121, 'learning_rate': 1.3206666666666668e-05, 'epoch': 0.04} {'loss': 0.4035, 'learning_rate': 1.3213333333333333e-05, 'epoch': 0.04} {'loss': 0.4825, 'learning_rate': 1.3220000000000002e-05, 'epoch': 0.04} {'loss': 0.4421, 'learning_rate': 1.3226666666666668e-05, 'epoch': 0.04} {'loss': 0.4843, 'learning_rate': 1.3233333333333334e-05, 'epoch': 0.04} {'loss': 0.5234, 'learning_rate': 1.3240000000000002e-05, 'epoch': 0.04} {'loss': 0.326, 'learning_rate': 1.3246666666666668e-05, 'epoch': 0.04} {'loss': 0.4289, 'learning_rate': 1.3253333333333334e-05, 'epoch': 0.04} {'loss': 0.4914, 'learning_rate': 1.3260000000000002e-05, 'epoch': 0.04} {'loss': 0.3504, 'learning_rate': 1.3266666666666668e-05, 'epoch': 0.04} {'loss': 0.4341, 'learning_rate': 1.3273333333333334e-05, 'epoch': 0.04} {'loss': 0.2977, 'learning_rate': 1.3280000000000002e-05, 'epoch': 0.04} {'loss': 0.562, 'learning_rate': 1.3286666666666668e-05, 'epoch': 0.04} {'loss': 0.3749, 'learning_rate': 1.3293333333333334e-05, 'epoch': 0.04} {'loss': 0.5604, 'learning_rate': 1.3300000000000001e-05, 'epoch': 0.04} {'loss': 0.4745, 'learning_rate': 1.3306666666666667e-05, 'epoch': 0.04} {'loss': 0.4041, 'learning_rate': 1.3313333333333333e-05, 'epoch': 0.04} {'loss': 0.409, 'learning_rate': 1.3320000000000001e-05, 'epoch': 0.04} {'loss': 0.4613, 'learning_rate': 1.3326666666666667e-05, 'epoch': 0.04} {'loss': 0.6171, 'learning_rate': 1.3333333333333333e-05, 'epoch': 0.04} {'loss': 0.2598, 'learning_rate': 1.3340000000000001e-05, 'epoch': 0.04} {'loss': 0.5711, 'learning_rate': 1.3346666666666667e-05, 'epoch': 0.04} {'loss': 0.4634, 'learning_rate': 1.3353333333333333e-05, 'epoch': 0.04} {'loss': 0.5224, 'learning_rate': 1.3360000000000003e-05, 'epoch': 0.04} {'loss': 0.3291, 'learning_rate': 1.3366666666666669e-05, 'epoch': 0.04} {'loss': 0.5923, 'learning_rate': 1.3373333333333333e-05, 'epoch': 0.04} {'loss': 0.4719, 'learning_rate': 1.3380000000000002e-05, 'epoch': 0.04} {'loss': 0.503, 'learning_rate': 1.3386666666666668e-05, 'epoch': 0.04} {'loss': 0.5362, 'learning_rate': 1.3393333333333334e-05, 'epoch': 0.04} {'loss': 0.524, 'learning_rate': 1.3400000000000002e-05, 'epoch': 0.04} {'loss': 0.5045, 'learning_rate': 1.3406666666666668e-05, 'epoch': 0.04} {'loss': 0.5541, 'learning_rate': 1.3413333333333334e-05, 'epoch': 0.04} {'loss': 0.6682, 'learning_rate': 1.3420000000000002e-05, 'epoch': 0.04} {'loss': 0.6006, 'learning_rate': 1.3426666666666668e-05, 'epoch': 0.04} {'loss': 0.4329, 'learning_rate': 1.3433333333333334e-05, 'epoch': 0.04} {'loss': 0.4958, 'learning_rate': 1.3440000000000002e-05, 'epoch': 0.04} {'loss': 0.3301, 'learning_rate': 1.3446666666666668e-05, 'epoch': 0.04} {'loss': 0.3631, 'learning_rate': 1.3453333333333334e-05, 'epoch': 0.04} {'loss': 0.2967, 'learning_rate': 1.3460000000000002e-05, 'epoch': 0.04} {'loss': 0.6042, 'learning_rate': 1.3466666666666668e-05, 'epoch': 0.04} {'loss': 0.5043, 'learning_rate': 1.3473333333333334e-05, 'epoch': 0.04} {'loss': 0.4112, 'learning_rate': 1.3480000000000001e-05, 'epoch': 0.04} {'loss': 0.743, 'learning_rate': 1.3486666666666667e-05, 'epoch': 0.04} {'loss': 0.3854, 'learning_rate': 1.3493333333333333e-05, 'epoch': 0.04} {'loss': 0.4141, 'learning_rate': 1.3500000000000001e-05, 'epoch': 0.04} {'loss': 0.335, 'learning_rate': 1.3506666666666667e-05, 'epoch': 0.04} {'loss': 0.4689, 'learning_rate': 1.3513333333333333e-05, 'epoch': 0.04} {'loss': 0.4469, 'learning_rate': 1.3520000000000003e-05, 'epoch': 0.04} {'loss': 0.6442, 'learning_rate': 1.3526666666666669e-05, 'epoch': 0.04} {'loss': 0.4151, 'learning_rate': 1.3533333333333333e-05, 'epoch': 0.04} {'loss': 0.4291, 'learning_rate': 1.3540000000000003e-05, 'epoch': 0.04} {'loss': 0.4425, 'learning_rate': 1.3546666666666669e-05, 'epoch': 0.04} {'loss': 0.5366, 'learning_rate': 1.3553333333333335e-05, 'epoch': 0.04} {'loss': 0.4406, 'learning_rate': 1.3560000000000002e-05, 'epoch': 0.04} {'loss': 0.5197, 'learning_rate': 1.3566666666666668e-05, 'epoch': 0.04} {'loss': 0.5289, 'learning_rate': 1.3573333333333334e-05, 'epoch': 0.04} {'loss': 0.5865, 'learning_rate': 1.3580000000000002e-05, 'epoch': 0.04} {'loss': 0.3321, 'learning_rate': 1.3586666666666668e-05, 'epoch': 0.04} {'loss': 0.3123, 'learning_rate': 1.3593333333333334e-05, 'epoch': 0.04} {'loss': 0.6024, 'learning_rate': 1.3600000000000002e-05, 'epoch': 0.04} {'loss': 0.4806, 'learning_rate': 1.3606666666666668e-05, 'epoch': 0.04} {'loss': 0.5084, 'learning_rate': 1.3613333333333334e-05, 'epoch': 0.04} {'loss': 0.2822, 'learning_rate': 1.3620000000000002e-05, 'epoch': 0.04} {'loss': 0.6817, 'learning_rate': 1.3626666666666668e-05, 'epoch': 0.04} {'loss': 0.4017, 'learning_rate': 1.3633333333333334e-05, 'epoch': 0.04} {'loss': 0.4137, 'learning_rate': 1.3640000000000002e-05, 'epoch': 0.04} {'loss': 0.3544, 'learning_rate': 1.3646666666666668e-05, 'epoch': 0.04} {'loss': 0.4145, 'learning_rate': 1.3653333333333334e-05, 'epoch': 0.04} {'loss': 0.5292, 'learning_rate': 1.3660000000000001e-05, 'epoch': 0.04} {'loss': 0.5299, 'learning_rate': 1.3666666666666667e-05, 'epoch': 0.04} {'loss': 0.3364, 'learning_rate': 1.3673333333333333e-05, 'epoch': 0.04} {'loss': 0.5239, 'learning_rate': 1.3680000000000003e-05, 'epoch': 0.04} {'loss': 0.5059, 'learning_rate': 1.3686666666666669e-05, 'epoch': 0.04} {'loss': 0.386, 'learning_rate': 1.3693333333333333e-05, 'epoch': 0.04} {'loss': 0.4885, 'learning_rate': 1.3700000000000003e-05, 'epoch': 0.04} {'loss': 0.2906, 'learning_rate': 1.3706666666666669e-05, 'epoch': 0.04} {'loss': 0.558, 'learning_rate': 1.3713333333333335e-05, 'epoch': 0.04} {'loss': 0.2424, 'learning_rate': 1.3720000000000002e-05, 'epoch': 0.04} {'loss': 0.4533, 'learning_rate': 1.3726666666666669e-05, 'epoch': 0.04} {'loss': 0.4358, 'learning_rate': 1.3733333333333335e-05, 'epoch': 0.04} {'loss': 0.4987, 'learning_rate': 1.3740000000000002e-05, 'epoch': 0.04} {'loss': 0.4996, 'learning_rate': 1.3746666666666668e-05, 'epoch': 0.04} {'loss': 0.3211, 'learning_rate': 1.3753333333333334e-05, 'epoch': 0.04} {'loss': 0.6673, 'learning_rate': 1.376e-05, 'epoch': 0.04} {'loss': 0.3596, 'learning_rate': 1.3766666666666668e-05, 'epoch': 0.04} {'loss': 0.314, 'learning_rate': 1.3773333333333334e-05, 'epoch': 0.04} {'loss': 0.5472, 'learning_rate': 1.378e-05, 'epoch': 0.04} {'loss': 0.631, 'learning_rate': 1.3786666666666668e-05, 'epoch': 0.04} {'loss': 0.4867, 'learning_rate': 1.3793333333333334e-05, 'epoch': 0.04} {'loss': 0.4773, 'learning_rate': 1.38e-05, 'epoch': 0.04} {'loss': 0.5461, 'learning_rate': 1.3806666666666668e-05, 'epoch': 0.04} {'loss': 0.3662, 'learning_rate': 1.3813333333333334e-05, 'epoch': 0.04} {'loss': 0.4276, 'learning_rate': 1.382e-05, 'epoch': 0.04} {'loss': 0.2867, 'learning_rate': 1.3826666666666668e-05, 'epoch': 0.04} {'loss': 0.5065, 'learning_rate': 1.3833333333333334e-05, 'epoch': 0.04} {'loss': 0.5175, 'learning_rate': 1.384e-05, 'epoch': 0.04} {'loss': 0.4984, 'learning_rate': 1.3846666666666669e-05, 'epoch': 0.04} {'loss': 0.5468, 'learning_rate': 1.3853333333333333e-05, 'epoch': 0.04} {'loss': 0.5654, 'learning_rate': 1.386e-05, 'epoch': 0.04} {'loss': 0.5107, 'learning_rate': 1.3866666666666669e-05, 'epoch': 0.04} {'loss': 0.5573, 'learning_rate': 1.3873333333333335e-05, 'epoch': 0.04} {'loss': 0.4034, 'learning_rate': 1.3880000000000001e-05, 'epoch': 0.04} {'loss': 0.3723, 'learning_rate': 1.3886666666666669e-05, 'epoch': 0.04} {'loss': 0.4874, 'learning_rate': 1.3893333333333335e-05, 'epoch': 0.04} {'loss': 0.5947, 'learning_rate': 1.39e-05, 'epoch': 0.04} {'loss': 0.5152, 'learning_rate': 1.3906666666666668e-05, 'epoch': 0.04} {'loss': 0.6195, 'learning_rate': 1.3913333333333335e-05, 'epoch': 0.04} {'loss': 0.4234, 'learning_rate': 1.392e-05, 'epoch': 0.04} {'loss': 0.496, 'learning_rate': 1.3926666666666668e-05, 'epoch': 0.04} {'loss': 0.3572, 'learning_rate': 1.3933333333333334e-05, 'epoch': 0.04} {'loss': 0.3638, 'learning_rate': 1.394e-05, 'epoch': 0.04} {'loss': 0.5062, 'learning_rate': 1.3946666666666668e-05, 'epoch': 0.04} {'loss': 0.3516, 'learning_rate': 1.3953333333333334e-05, 'epoch': 0.04} {'loss': 0.3207, 'learning_rate': 1.396e-05, 'epoch': 0.04} {'loss': 0.5994, 'learning_rate': 1.3966666666666668e-05, 'epoch': 0.04} {'loss': 0.363, 'learning_rate': 1.3973333333333334e-05, 'epoch': 0.04} {'loss': 0.4392, 'learning_rate': 1.398e-05, 'epoch': 0.04} {'loss': 0.4727, 'learning_rate': 1.3986666666666668e-05, 'epoch': 0.04} {'loss': 0.4699, 'learning_rate': 1.3993333333333334e-05, 'epoch': 0.04} {'loss': 0.4966, 'learning_rate': 1.4e-05, 'epoch': 0.04} {'loss': 0.5196, 'learning_rate': 1.400666666666667e-05, 'epoch': 0.04} {'loss': 0.4509, 'learning_rate': 1.4013333333333334e-05, 'epoch': 0.04} {'loss': 0.485, 'learning_rate': 1.402e-05, 'epoch': 0.04} {'loss': 0.5103, 'learning_rate': 1.4026666666666669e-05, 'epoch': 0.04} {'loss': 0.4074, 'learning_rate': 1.4033333333333335e-05, 'epoch': 0.04} {'loss': 0.4708, 'learning_rate': 1.4040000000000001e-05, 'epoch': 0.04} {'loss': 0.5888, 'learning_rate': 1.4046666666666669e-05, 'epoch': 0.04} {'loss': 0.686, 'learning_rate': 1.4053333333333335e-05, 'epoch': 0.04} {'loss': 0.58, 'learning_rate': 1.4060000000000001e-05, 'epoch': 0.04} {'loss': 0.6271, 'learning_rate': 1.4066666666666669e-05, 'epoch': 0.04} {'loss': 0.5166, 'learning_rate': 1.4073333333333335e-05, 'epoch': 0.04} {'loss': 0.4557, 'learning_rate': 1.408e-05, 'epoch': 0.04} {'loss': 0.4377, 'learning_rate': 1.4086666666666668e-05, 'epoch': 0.04} {'loss': 0.4057, 'learning_rate': 1.4093333333333334e-05, 'epoch': 0.04} {'loss': 0.5203, 'learning_rate': 1.41e-05, 'epoch': 0.04} {'loss': 0.6117, 'learning_rate': 1.4106666666666668e-05, 'epoch': 0.04} {'loss': 0.7596, 'learning_rate': 1.4113333333333334e-05, 'epoch': 0.04} {'loss': 0.3527, 'learning_rate': 1.412e-05, 'epoch': 0.04} {'loss': 0.374, 'learning_rate': 1.4126666666666668e-05, 'epoch': 0.04} {'loss': 0.4414, 'learning_rate': 1.4133333333333334e-05, 'epoch': 0.04} {'loss': 0.6103, 'learning_rate': 1.414e-05, 'epoch': 0.04} {'loss': 0.5995, 'learning_rate': 1.4146666666666668e-05, 'epoch': 0.04} {'loss': 0.3555, 'learning_rate': 1.4153333333333334e-05, 'epoch': 0.04} {'loss': 0.3846, 'learning_rate': 1.416e-05, 'epoch': 0.04} {'loss': 0.552, 'learning_rate': 1.416666666666667e-05, 'epoch': 0.04} {'loss': 0.5072, 'learning_rate': 1.4173333333333334e-05, 'epoch': 0.04} {'loss': 0.4982, 'learning_rate': 1.418e-05, 'epoch': 0.04} {'loss': 0.3929, 'learning_rate': 1.418666666666667e-05, 'epoch': 0.04} {'loss': 0.4348, 'learning_rate': 1.4193333333333335e-05, 'epoch': 0.04} {'loss': 0.2555, 'learning_rate': 1.4200000000000001e-05, 'epoch': 0.04} {'loss': 0.354, 'learning_rate': 1.4206666666666669e-05, 'epoch': 0.04} {'loss': 0.4102, 'learning_rate': 1.4213333333333335e-05, 'epoch': 0.04} {'loss': 0.5917, 'learning_rate': 1.4220000000000001e-05, 'epoch': 0.04} {'loss': 0.5739, 'learning_rate': 1.4226666666666669e-05, 'epoch': 0.04} {'loss': 0.3779, 'learning_rate': 1.4233333333333335e-05, 'epoch': 0.04} {'loss': 0.5899, 'learning_rate': 1.4240000000000001e-05, 'epoch': 0.04} {'loss': 0.3904, 'learning_rate': 1.4246666666666669e-05, 'epoch': 0.04} {'loss': 0.7055, 'learning_rate': 1.4253333333333335e-05, 'epoch': 0.04} {'loss': 0.4501, 'learning_rate': 1.426e-05, 'epoch': 0.04} {'loss': 0.383, 'learning_rate': 1.4266666666666668e-05, 'epoch': 0.04} {'loss': 0.4145, 'learning_rate': 1.4273333333333334e-05, 'epoch': 0.04} {'loss': 0.4551, 'learning_rate': 1.428e-05, 'epoch': 0.04} {'loss': 0.561, 'learning_rate': 1.4286666666666668e-05, 'epoch': 0.04} {'loss': 0.4632, 'learning_rate': 1.4293333333333334e-05, 'epoch': 0.04} {'loss': 0.5878, 'learning_rate': 1.43e-05, 'epoch': 0.04} {'loss': 0.4935, 'learning_rate': 1.4306666666666668e-05, 'epoch': 0.04} {'loss': 0.4367, 'learning_rate': 1.4313333333333334e-05, 'epoch': 0.04} {'loss': 0.5791, 'learning_rate': 1.432e-05, 'epoch': 0.04} {'loss': 0.4194, 'learning_rate': 1.432666666666667e-05, 'epoch': 0.04} {'loss': 0.4213, 'learning_rate': 1.4333333333333334e-05, 'epoch': 0.04} {'loss': 0.2902, 'learning_rate': 1.434e-05, 'epoch': 0.04} {'loss': 0.5278, 'learning_rate': 1.434666666666667e-05, 'epoch': 0.04} {'loss': 0.4801, 'learning_rate': 1.4353333333333335e-05, 'epoch': 0.04} {'loss': 0.4245, 'learning_rate': 1.4360000000000001e-05, 'epoch': 0.04} {'loss': 0.3608, 'learning_rate': 1.436666666666667e-05, 'epoch': 0.04} {'loss': 0.4622, 'learning_rate': 1.4373333333333335e-05, 'epoch': 0.04} {'loss': 0.5969, 'learning_rate': 1.4380000000000001e-05, 'epoch': 0.04} {'loss': 0.3811, 'learning_rate': 1.4386666666666669e-05, 'epoch': 0.04} {'loss': 0.4289, 'learning_rate': 1.4393333333333335e-05, 'epoch': 0.04} {'loss': 0.5956, 'learning_rate': 1.4400000000000001e-05, 'epoch': 0.04} {'loss': 0.5646, 'learning_rate': 1.4406666666666669e-05, 'epoch': 0.04} {'loss': 0.6975, 'learning_rate': 1.4413333333333335e-05, 'epoch': 0.04} {'loss': 0.4776, 'learning_rate': 1.4420000000000001e-05, 'epoch': 0.04} {'loss': 0.4485, 'learning_rate': 1.4426666666666669e-05, 'epoch': 0.04} {'loss': 0.4517, 'learning_rate': 1.4433333333333335e-05, 'epoch': 0.04} {'loss': 0.4596, 'learning_rate': 1.444e-05, 'epoch': 0.04} {'loss': 0.6046, 'learning_rate': 1.4446666666666668e-05, 'epoch': 0.04} {'loss': 0.3813, 'learning_rate': 1.4453333333333334e-05, 'epoch': 0.04} {'loss': 0.5361, 'learning_rate': 1.446e-05, 'epoch': 0.04} {'loss': 0.3834, 'learning_rate': 1.4466666666666668e-05, 'epoch': 0.04} {'loss': 0.4031, 'learning_rate': 1.4473333333333334e-05, 'epoch': 0.04} {'loss': 0.4612, 'learning_rate': 1.448e-05, 'epoch': 0.05} {'loss': 0.3335, 'learning_rate': 1.448666666666667e-05, 'epoch': 0.05} {'loss': 0.4375, 'learning_rate': 1.4493333333333334e-05, 'epoch': 0.05} {'loss': 0.5607, 'learning_rate': 1.45e-05, 'epoch': 0.05} {'loss': 0.4613, 'learning_rate': 1.450666666666667e-05, 'epoch': 0.05} {'loss': 0.4798, 'learning_rate': 1.4513333333333336e-05, 'epoch': 0.05} {'loss': 0.429, 'learning_rate': 1.4520000000000002e-05, 'epoch': 0.05} {'loss': 0.5887, 'learning_rate': 1.452666666666667e-05, 'epoch': 0.05} {'loss': 0.2721, 'learning_rate': 1.4533333333333335e-05, 'epoch': 0.05} {'loss': 0.5439, 'learning_rate': 1.4540000000000001e-05, 'epoch': 0.05} {'loss': 0.4667, 'learning_rate': 1.4546666666666669e-05, 'epoch': 0.05} {'loss': 0.3924, 'learning_rate': 1.4553333333333335e-05, 'epoch': 0.05} {'loss': 0.382, 'learning_rate': 1.4560000000000001e-05, 'epoch': 0.05} {'loss': 0.4391, 'learning_rate': 1.4566666666666669e-05, 'epoch': 0.05} {'loss': 0.5101, 'learning_rate': 1.4573333333333335e-05, 'epoch': 0.05} {'loss': 0.3551, 'learning_rate': 1.4580000000000001e-05, 'epoch': 0.05} {'loss': 0.4548, 'learning_rate': 1.4586666666666667e-05, 'epoch': 0.05} {'loss': 0.3098, 'learning_rate': 1.4593333333333335e-05, 'epoch': 0.05} {'loss': 0.5024, 'learning_rate': 1.46e-05, 'epoch': 0.05} {'loss': 0.4058, 'learning_rate': 1.4606666666666667e-05, 'epoch': 0.05} {'loss': 0.5372, 'learning_rate': 1.4613333333333335e-05, 'epoch': 0.05} {'loss': 0.38, 'learning_rate': 1.462e-05, 'epoch': 0.05} {'loss': 0.3816, 'learning_rate': 1.4626666666666667e-05, 'epoch': 0.05} {'loss': 0.4968, 'learning_rate': 1.4633333333333334e-05, 'epoch': 0.05} {'loss': 0.4802, 'learning_rate': 1.464e-05, 'epoch': 0.05} {'loss': 0.5549, 'learning_rate': 1.4646666666666666e-05, 'epoch': 0.05} {'loss': 0.2912, 'learning_rate': 1.4653333333333334e-05, 'epoch': 0.05} {'loss': 0.4218, 'learning_rate': 1.466e-05, 'epoch': 0.05} {'loss': 0.4247, 'learning_rate': 1.4666666666666666e-05, 'epoch': 0.05} {'loss': 0.4885, 'learning_rate': 1.4673333333333336e-05, 'epoch': 0.05} {'loss': 0.3094, 'learning_rate': 1.4680000000000002e-05, 'epoch': 0.05} {'loss': 0.389, 'learning_rate': 1.4686666666666666e-05, 'epoch': 0.05} {'loss': 0.3902, 'learning_rate': 1.4693333333333336e-05, 'epoch': 0.05} {'loss': 0.4292, 'learning_rate': 1.4700000000000002e-05, 'epoch': 0.05} {'loss': 0.5937, 'learning_rate': 1.4706666666666668e-05, 'epoch': 0.05} {'loss': 0.5519, 'learning_rate': 1.4713333333333335e-05, 'epoch': 0.05} {'loss': 0.4867, 'learning_rate': 1.4720000000000001e-05, 'epoch': 0.05} {'loss': 0.5411, 'learning_rate': 1.4726666666666667e-05, 'epoch': 0.05} {'loss': 0.5011, 'learning_rate': 1.4733333333333335e-05, 'epoch': 0.05} {'loss': 0.4749, 'learning_rate': 1.4740000000000001e-05, 'epoch': 0.05} {'loss': 0.3278, 'learning_rate': 1.4746666666666667e-05, 'epoch': 0.05} {'loss': 0.5815, 'learning_rate': 1.4753333333333335e-05, 'epoch': 0.05} {'loss': 0.3105, 'learning_rate': 1.4760000000000001e-05, 'epoch': 0.05} {'loss': 0.5292, 'learning_rate': 1.4766666666666667e-05, 'epoch': 0.05} {'loss': 0.5459, 'learning_rate': 1.4773333333333335e-05, 'epoch': 0.05} {'loss': 0.3501, 'learning_rate': 1.478e-05, 'epoch': 0.05} {'loss': 0.443, 'learning_rate': 1.4786666666666667e-05, 'epoch': 0.05} {'loss': 0.3972, 'learning_rate': 1.4793333333333335e-05, 'epoch': 0.05} {'loss': 0.4753, 'learning_rate': 1.48e-05, 'epoch': 0.05} {'loss': 0.5679, 'learning_rate': 1.4806666666666667e-05, 'epoch': 0.05} {'loss': 0.5331, 'learning_rate': 1.4813333333333334e-05, 'epoch': 0.05} {'loss': 0.3965, 'learning_rate': 1.482e-05, 'epoch': 0.05} {'loss': 0.29, 'learning_rate': 1.4826666666666666e-05, 'epoch': 0.05} {'loss': 0.5717, 'learning_rate': 1.4833333333333336e-05, 'epoch': 0.05} {'loss': 0.5825, 'learning_rate': 1.4840000000000002e-05, 'epoch': 0.05} {'loss': 0.4261, 'learning_rate': 1.4846666666666666e-05, 'epoch': 0.05} {'loss': 0.4206, 'learning_rate': 1.4853333333333336e-05, 'epoch': 0.05} {'loss': 0.3819, 'learning_rate': 1.4860000000000002e-05, 'epoch': 0.05} {'loss': 0.4101, 'learning_rate': 1.4866666666666668e-05, 'epoch': 0.05} {'loss': 0.5823, 'learning_rate': 1.4873333333333335e-05, 'epoch': 0.05} {'loss': 0.5002, 'learning_rate': 1.4880000000000002e-05, 'epoch': 0.05} {'loss': 0.2409, 'learning_rate': 1.4886666666666668e-05, 'epoch': 0.05} {'loss': 0.4447, 'learning_rate': 1.4893333333333335e-05, 'epoch': 0.05} {'loss': 0.4134, 'learning_rate': 1.4900000000000001e-05, 'epoch': 0.05} {'loss': 0.5246, 'learning_rate': 1.4906666666666667e-05, 'epoch': 0.05} {'loss': 0.3713, 'learning_rate': 1.4913333333333335e-05, 'epoch': 0.05} {'loss': 0.2905, 'learning_rate': 1.4920000000000001e-05, 'epoch': 0.05} {'loss': 0.4836, 'learning_rate': 1.4926666666666667e-05, 'epoch': 0.05} {'loss': 0.5517, 'learning_rate': 1.4933333333333335e-05, 'epoch': 0.05} {'loss': 0.5432, 'learning_rate': 1.4940000000000001e-05, 'epoch': 0.05} {'loss': 0.7181, 'learning_rate': 1.4946666666666667e-05, 'epoch': 0.05} {'loss': 0.5336, 'learning_rate': 1.4953333333333335e-05, 'epoch': 0.05} {'loss': 0.5811, 'learning_rate': 1.496e-05, 'epoch': 0.05} {'loss': 0.4532, 'learning_rate': 1.4966666666666667e-05, 'epoch': 0.05} {'loss': 0.6232, 'learning_rate': 1.4973333333333335e-05, 'epoch': 0.05} {'loss': 0.5628, 'learning_rate': 1.498e-05, 'epoch': 0.05} {'loss': 0.3989, 'learning_rate': 1.4986666666666667e-05, 'epoch': 0.05} {'loss': 0.3443, 'learning_rate': 1.4993333333333336e-05, 'epoch': 0.05} {'loss': 0.5228, 'learning_rate': 1.5000000000000002e-05, 'epoch': 0.05} {'loss': 0.3815, 'learning_rate': 1.5006666666666666e-05, 'epoch': 0.05} {'loss': 0.6802, 'learning_rate': 1.5013333333333336e-05, 'epoch': 0.05} {'loss': 0.4818, 'learning_rate': 1.5020000000000002e-05, 'epoch': 0.05} {'loss': 0.6601, 'learning_rate': 1.5026666666666668e-05, 'epoch': 0.05} {'loss': 0.4837, 'learning_rate': 1.5033333333333336e-05, 'epoch': 0.05} {'loss': 0.4893, 'learning_rate': 1.5040000000000002e-05, 'epoch': 0.05} {'loss': 0.6126, 'learning_rate': 1.5046666666666668e-05, 'epoch': 0.05} {'loss': 0.3856, 'learning_rate': 1.5053333333333335e-05, 'epoch': 0.05} {'loss': 0.3718, 'learning_rate': 1.5060000000000001e-05, 'epoch': 0.05} {'loss': 0.5288, 'learning_rate': 1.5066666666666668e-05, 'epoch': 0.05} {'loss': 0.4516, 'learning_rate': 1.5073333333333335e-05, 'epoch': 0.05} {'loss': 0.5132, 'learning_rate': 1.5080000000000001e-05, 'epoch': 0.05} {'loss': 0.4334, 'learning_rate': 1.5086666666666667e-05, 'epoch': 0.05} {'loss': 0.598, 'learning_rate': 1.5093333333333335e-05, 'epoch': 0.05} {'loss': 0.3255, 'learning_rate': 1.5100000000000001e-05, 'epoch': 0.05} {'loss': 0.4945, 'learning_rate': 1.5106666666666667e-05, 'epoch': 0.05} {'loss': 0.3445, 'learning_rate': 1.5113333333333335e-05, 'epoch': 0.05} {'loss': 0.4427, 'learning_rate': 1.5120000000000001e-05, 'epoch': 0.05} {'loss': 0.6482, 'learning_rate': 1.5126666666666667e-05, 'epoch': 0.05} {'loss': 0.4163, 'learning_rate': 1.5133333333333335e-05, 'epoch': 0.05} {'loss': 0.4457, 'learning_rate': 1.514e-05, 'epoch': 0.05} {'loss': 0.446, 'learning_rate': 1.5146666666666667e-05, 'epoch': 0.05} {'loss': 0.5444, 'learning_rate': 1.5153333333333336e-05, 'epoch': 0.05} {'loss': 0.4606, 'learning_rate': 1.516e-05, 'epoch': 0.05} {'loss': 0.3343, 'learning_rate': 1.5166666666666667e-05, 'epoch': 0.05} {'loss': 0.3906, 'learning_rate': 1.5173333333333336e-05, 'epoch': 0.05} {'loss': 0.5241, 'learning_rate': 1.5180000000000002e-05, 'epoch': 0.05} {'loss': 0.5344, 'learning_rate': 1.5186666666666668e-05, 'epoch': 0.05} {'loss': 0.4355, 'learning_rate': 1.5193333333333336e-05, 'epoch': 0.05} {'loss': 0.4232, 'learning_rate': 1.5200000000000002e-05, 'epoch': 0.05} {'loss': 0.5276, 'learning_rate': 1.5206666666666668e-05, 'epoch': 0.05} {'loss': 0.4116, 'learning_rate': 1.5213333333333336e-05, 'epoch': 0.05} {'loss': 0.6014, 'learning_rate': 1.5220000000000002e-05, 'epoch': 0.05} {'loss': 0.4416, 'learning_rate': 1.5226666666666668e-05, 'epoch': 0.05} {'loss': 0.5037, 'learning_rate': 1.5233333333333335e-05, 'epoch': 0.05} {'loss': 0.3841, 'learning_rate': 1.5240000000000001e-05, 'epoch': 0.05} {'loss': 0.5347, 'learning_rate': 1.5246666666666668e-05, 'epoch': 0.05} {'loss': 0.4265, 'learning_rate': 1.5253333333333335e-05, 'epoch': 0.05} {'loss': 0.4312, 'learning_rate': 1.5260000000000003e-05, 'epoch': 0.05} {'loss': 0.3513, 'learning_rate': 1.5266666666666667e-05, 'epoch': 0.05} {'loss': 0.3524, 'learning_rate': 1.5273333333333335e-05, 'epoch': 0.05} {'loss': 0.3007, 'learning_rate': 1.5280000000000003e-05, 'epoch': 0.05} {'loss': 0.5036, 'learning_rate': 1.5286666666666667e-05, 'epoch': 0.05} {'loss': 0.6353, 'learning_rate': 1.5293333333333335e-05, 'epoch': 0.05} {'loss': 0.3071, 'learning_rate': 1.5300000000000003e-05, 'epoch': 0.05} {'loss': 0.6184, 'learning_rate': 1.5306666666666667e-05, 'epoch': 0.05} {'loss': 0.5843, 'learning_rate': 1.5313333333333335e-05, 'epoch': 0.05} {'loss': 0.3713, 'learning_rate': 1.5320000000000002e-05, 'epoch': 0.05} {'loss': 0.5102, 'learning_rate': 1.5326666666666667e-05, 'epoch': 0.05} {'loss': 0.2904, 'learning_rate': 1.5333333333333334e-05, 'epoch': 0.05} {'loss': 0.3916, 'learning_rate': 1.5340000000000002e-05, 'epoch': 0.05} {'loss': 0.2716, 'learning_rate': 1.5346666666666667e-05, 'epoch': 0.05} {'loss': 0.3113, 'learning_rate': 1.5353333333333334e-05, 'epoch': 0.05} {'loss': 0.3753, 'learning_rate': 1.5360000000000002e-05, 'epoch': 0.05} {'loss': 0.4315, 'learning_rate': 1.5366666666666666e-05, 'epoch': 0.05} {'loss': 0.333, 'learning_rate': 1.5373333333333334e-05, 'epoch': 0.05} {'loss': 0.4054, 'learning_rate': 1.5380000000000002e-05, 'epoch': 0.05} {'loss': 0.5537, 'learning_rate': 1.5386666666666666e-05, 'epoch': 0.05} {'loss': 0.4057, 'learning_rate': 1.5393333333333337e-05, 'epoch': 0.05} {'loss': 0.4242, 'learning_rate': 1.54e-05, 'epoch': 0.05} {'loss': 0.2761, 'learning_rate': 1.5406666666666666e-05, 'epoch': 0.05} {'loss': 0.5326, 'learning_rate': 1.5413333333333337e-05, 'epoch': 0.05} {'loss': 0.4185, 'learning_rate': 1.542e-05, 'epoch': 0.05} {'loss': 0.3571, 'learning_rate': 1.542666666666667e-05, 'epoch': 0.05} {'loss': 0.3291, 'learning_rate': 1.5433333333333334e-05, 'epoch': 0.05} {'loss': 0.3381, 'learning_rate': 1.544e-05, 'epoch': 0.05} {'loss': 0.4458, 'learning_rate': 1.544666666666667e-05, 'epoch': 0.05} {'loss': 0.5236, 'learning_rate': 1.5453333333333333e-05, 'epoch': 0.05} {'loss': 0.4601, 'learning_rate': 1.546e-05, 'epoch': 0.05} {'loss': 0.7001, 'learning_rate': 1.546666666666667e-05, 'epoch': 0.05} {'loss': 0.5151, 'learning_rate': 1.5473333333333333e-05, 'epoch': 0.05} {'loss': 0.4305, 'learning_rate': 1.548e-05, 'epoch': 0.05} {'loss': 0.583, 'learning_rate': 1.548666666666667e-05, 'epoch': 0.05} {'loss': 0.4518, 'learning_rate': 1.5493333333333333e-05, 'epoch': 0.05} {'loss': 0.467, 'learning_rate': 1.55e-05, 'epoch': 0.05} {'loss': 0.4869, 'learning_rate': 1.550666666666667e-05, 'epoch': 0.05} {'loss': 0.5347, 'learning_rate': 1.5513333333333333e-05, 'epoch': 0.05} {'loss': 0.4019, 'learning_rate': 1.552e-05, 'epoch': 0.05} {'loss': 0.4848, 'learning_rate': 1.5526666666666668e-05, 'epoch': 0.05} {'loss': 0.5339, 'learning_rate': 1.5533333333333333e-05, 'epoch': 0.05} {'loss': 0.607, 'learning_rate': 1.554e-05, 'epoch': 0.05} {'loss': 0.4212, 'learning_rate': 1.5546666666666668e-05, 'epoch': 0.05} {'loss': 0.5502, 'learning_rate': 1.5553333333333332e-05, 'epoch': 0.05} {'loss': 0.4626, 'learning_rate': 1.556e-05, 'epoch': 0.05} {'loss': 0.3867, 'learning_rate': 1.5566666666666668e-05, 'epoch': 0.05} {'loss': 0.5322, 'learning_rate': 1.5573333333333332e-05, 'epoch': 0.05} {'loss': 0.5504, 'learning_rate': 1.5580000000000003e-05, 'epoch': 0.05} {'loss': 0.4345, 'learning_rate': 1.5586666666666668e-05, 'epoch': 0.05} {'loss': 0.4364, 'learning_rate': 1.5593333333333332e-05, 'epoch': 0.05} {'loss': 0.4594, 'learning_rate': 1.5600000000000003e-05, 'epoch': 0.05} {'loss': 0.3236, 'learning_rate': 1.5606666666666667e-05, 'epoch': 0.05} {'loss': 0.5041, 'learning_rate': 1.5613333333333335e-05, 'epoch': 0.05} {'loss': 0.5841, 'learning_rate': 1.5620000000000003e-05, 'epoch': 0.05} {'loss': 0.4951, 'learning_rate': 1.5626666666666667e-05, 'epoch': 0.05} {'loss': 0.4736, 'learning_rate': 1.5633333333333335e-05, 'epoch': 0.05} {'loss': 0.5498, 'learning_rate': 1.5640000000000003e-05, 'epoch': 0.05} {'loss': 0.6637, 'learning_rate': 1.5646666666666667e-05, 'epoch': 0.05} {'loss': 0.7491, 'learning_rate': 1.5653333333333335e-05, 'epoch': 0.05} {'loss': 0.4661, 'learning_rate': 1.5660000000000003e-05, 'epoch': 0.05} {'loss': 0.559, 'learning_rate': 1.5666666666666667e-05, 'epoch': 0.05} {'loss': 0.4846, 'learning_rate': 1.5673333333333335e-05, 'epoch': 0.05} {'loss': 0.4731, 'learning_rate': 1.5680000000000002e-05, 'epoch': 0.05} {'loss': 0.3585, 'learning_rate': 1.5686666666666667e-05, 'epoch': 0.05} {'loss': 0.5974, 'learning_rate': 1.5693333333333334e-05, 'epoch': 0.05} {'loss': 0.5218, 'learning_rate': 1.5700000000000002e-05, 'epoch': 0.05} {'loss': 0.5645, 'learning_rate': 1.5706666666666666e-05, 'epoch': 0.05} {'loss': 0.6077, 'learning_rate': 1.5713333333333334e-05, 'epoch': 0.05} {'loss': 0.2148, 'learning_rate': 1.5720000000000002e-05, 'epoch': 0.05} {'loss': 0.4274, 'learning_rate': 1.5726666666666666e-05, 'epoch': 0.05} {'loss': 0.4065, 'learning_rate': 1.5733333333333334e-05, 'epoch': 0.05} {'loss': 0.4491, 'learning_rate': 1.5740000000000002e-05, 'epoch': 0.05} {'loss': 0.5066, 'learning_rate': 1.574666666666667e-05, 'epoch': 0.05} {'loss': 0.5268, 'learning_rate': 1.5753333333333334e-05, 'epoch': 0.05} {'loss': 0.4584, 'learning_rate': 1.576e-05, 'epoch': 0.05} {'loss': 0.3893, 'learning_rate': 1.576666666666667e-05, 'epoch': 0.05} {'loss': 0.551, 'learning_rate': 1.5773333333333334e-05, 'epoch': 0.05} {'loss': 0.5417, 'learning_rate': 1.578e-05, 'epoch': 0.05} {'loss': 0.3725, 'learning_rate': 1.578666666666667e-05, 'epoch': 0.05} {'loss': 0.3899, 'learning_rate': 1.5793333333333333e-05, 'epoch': 0.05} {'loss': 0.4178, 'learning_rate': 1.58e-05, 'epoch': 0.05} {'loss': 0.428, 'learning_rate': 1.580666666666667e-05, 'epoch': 0.05} {'loss': 0.5669, 'learning_rate': 1.5813333333333333e-05, 'epoch': 0.05} {'loss': 0.4648, 'learning_rate': 1.582e-05, 'epoch': 0.05} {'loss': 0.5291, 'learning_rate': 1.582666666666667e-05, 'epoch': 0.05} {'loss': 0.3651, 'learning_rate': 1.5833333333333333e-05, 'epoch': 0.05} {'loss': 0.5002, 'learning_rate': 1.584e-05, 'epoch': 0.05} {'loss': 0.3697, 'learning_rate': 1.584666666666667e-05, 'epoch': 0.05} {'loss': 0.4384, 'learning_rate': 1.5853333333333333e-05, 'epoch': 0.05} {'loss': 0.3621, 'learning_rate': 1.586e-05, 'epoch': 0.05} {'loss': 0.5234, 'learning_rate': 1.586666666666667e-05, 'epoch': 0.05} {'loss': 0.4496, 'learning_rate': 1.5873333333333333e-05, 'epoch': 0.05} {'loss': 0.5931, 'learning_rate': 1.588e-05, 'epoch': 0.05} {'loss': 0.3959, 'learning_rate': 1.5886666666666668e-05, 'epoch': 0.05} {'loss': 0.5954, 'learning_rate': 1.5893333333333333e-05, 'epoch': 0.05} {'loss': 0.6217, 'learning_rate': 1.5900000000000004e-05, 'epoch': 0.05} {'loss': 0.5327, 'learning_rate': 1.5906666666666668e-05, 'epoch': 0.05} {'loss': 0.6593, 'learning_rate': 1.5913333333333332e-05, 'epoch': 0.05} {'loss': 0.4015, 'learning_rate': 1.5920000000000003e-05, 'epoch': 0.05} {'loss': 0.3383, 'learning_rate': 1.5926666666666668e-05, 'epoch': 0.05} {'loss': 0.4138, 'learning_rate': 1.5933333333333336e-05, 'epoch': 0.05} {'loss': 0.5855, 'learning_rate': 1.5940000000000003e-05, 'epoch': 0.05} {'loss': 0.6015, 'learning_rate': 1.5946666666666668e-05, 'epoch': 0.05} {'loss': 0.4065, 'learning_rate': 1.5953333333333335e-05, 'epoch': 0.05} {'loss': 0.363, 'learning_rate': 1.5960000000000003e-05, 'epoch': 0.05} {'loss': 0.5013, 'learning_rate': 1.5966666666666667e-05, 'epoch': 0.05} {'loss': 0.4419, 'learning_rate': 1.5973333333333335e-05, 'epoch': 0.05} {'loss': 0.5189, 'learning_rate': 1.5980000000000003e-05, 'epoch': 0.05} {'loss': 0.4481, 'learning_rate': 1.5986666666666667e-05, 'epoch': 0.05} {'loss': 0.6386, 'learning_rate': 1.5993333333333335e-05, 'epoch': 0.05} {'loss': 0.4217, 'learning_rate': 1.6000000000000003e-05, 'epoch': 0.05} {'loss': 0.577, 'learning_rate': 1.6006666666666667e-05, 'epoch': 0.05} {'loss': 0.5432, 'learning_rate': 1.6013333333333335e-05, 'epoch': 0.05} {'loss': 0.508, 'learning_rate': 1.6020000000000002e-05, 'epoch': 0.05} {'loss': 0.5308, 'learning_rate': 1.6026666666666667e-05, 'epoch': 0.05} {'loss': 0.5212, 'learning_rate': 1.6033333333333335e-05, 'epoch': 0.05} {'loss': 0.5571, 'learning_rate': 1.6040000000000002e-05, 'epoch': 0.05} {'loss': 0.4015, 'learning_rate': 1.6046666666666667e-05, 'epoch': 0.05} {'loss': 0.5424, 'learning_rate': 1.6053333333333334e-05, 'epoch': 0.05} {'loss': 0.6949, 'learning_rate': 1.6060000000000002e-05, 'epoch': 0.05} {'loss': 0.4402, 'learning_rate': 1.606666666666667e-05, 'epoch': 0.05} {'loss': 0.3551, 'learning_rate': 1.6073333333333334e-05, 'epoch': 0.05} {'loss': 0.4417, 'learning_rate': 1.6080000000000002e-05, 'epoch': 0.05} {'loss': 0.3753, 'learning_rate': 1.608666666666667e-05, 'epoch': 0.05} {'loss': 0.3749, 'learning_rate': 1.6093333333333334e-05, 'epoch': 0.05} {'loss': 0.5335, 'learning_rate': 1.6100000000000002e-05, 'epoch': 0.05} {'loss': 0.4104, 'learning_rate': 1.610666666666667e-05, 'epoch': 0.05} {'loss': 0.7085, 'learning_rate': 1.6113333333333334e-05, 'epoch': 0.05} {'loss': 0.4957, 'learning_rate': 1.612e-05, 'epoch': 0.05} {'loss': 0.4696, 'learning_rate': 1.612666666666667e-05, 'epoch': 0.05} {'loss': 0.4195, 'learning_rate': 1.6133333333333334e-05, 'epoch': 0.05} {'loss': 0.4931, 'learning_rate': 1.614e-05, 'epoch': 0.05} {'loss': 0.5457, 'learning_rate': 1.614666666666667e-05, 'epoch': 0.05} {'loss': 0.5533, 'learning_rate': 1.6153333333333333e-05, 'epoch': 0.05} {'loss': 0.5578, 'learning_rate': 1.616e-05, 'epoch': 0.05} {'loss': 0.3307, 'learning_rate': 1.616666666666667e-05, 'epoch': 0.05} {'loss': 0.505, 'learning_rate': 1.6173333333333333e-05, 'epoch': 0.05} {'loss': 0.4279, 'learning_rate': 1.618e-05, 'epoch': 0.05} {'loss': 0.4292, 'learning_rate': 1.618666666666667e-05, 'epoch': 0.05} {'loss': 0.4513, 'learning_rate': 1.6193333333333333e-05, 'epoch': 0.05} {'loss': 0.5827, 'learning_rate': 1.62e-05, 'epoch': 0.05} {'loss': 0.5574, 'learning_rate': 1.620666666666667e-05, 'epoch': 0.05} {'loss': 0.3987, 'learning_rate': 1.6213333333333333e-05, 'epoch': 0.05} {'loss': 0.4304, 'learning_rate': 1.6220000000000004e-05, 'epoch': 0.05} {'loss': 0.4986, 'learning_rate': 1.6226666666666668e-05, 'epoch': 0.05} {'loss': 0.5428, 'learning_rate': 1.6233333333333333e-05, 'epoch': 0.05} {'loss': 0.4018, 'learning_rate': 1.6240000000000004e-05, 'epoch': 0.05} {'loss': 0.5462, 'learning_rate': 1.6246666666666668e-05, 'epoch': 0.05} {'loss': 0.4796, 'learning_rate': 1.6253333333333336e-05, 'epoch': 0.05} {'loss': 0.3871, 'learning_rate': 1.626e-05, 'epoch': 0.05} {'loss': 0.6542, 'learning_rate': 1.6266666666666668e-05, 'epoch': 0.05} {'loss': 0.3913, 'learning_rate': 1.6273333333333336e-05, 'epoch': 0.05} {'loss': 0.3899, 'learning_rate': 1.628e-05, 'epoch': 0.05} {'loss': 0.693, 'learning_rate': 1.6286666666666668e-05, 'epoch': 0.05} {'loss': 0.4229, 'learning_rate': 1.6293333333333335e-05, 'epoch': 0.05} {'loss': 0.5617, 'learning_rate': 1.63e-05, 'epoch': 0.05} {'loss': 0.5392, 'learning_rate': 1.6306666666666668e-05, 'epoch': 0.05} {'loss': 0.3539, 'learning_rate': 1.6313333333333335e-05, 'epoch': 0.05} {'loss': 0.4316, 'learning_rate': 1.632e-05, 'epoch': 0.05} {'loss': 0.3863, 'learning_rate': 1.6326666666666667e-05, 'epoch': 0.05} {'loss': 0.5367, 'learning_rate': 1.6333333333333335e-05, 'epoch': 0.05} {'loss': 0.5336, 'learning_rate': 1.634e-05, 'epoch': 0.05} {'loss': 0.4298, 'learning_rate': 1.6346666666666667e-05, 'epoch': 0.05} {'loss': 0.52, 'learning_rate': 1.6353333333333335e-05, 'epoch': 0.05} {'loss': 0.4722, 'learning_rate': 1.636e-05, 'epoch': 0.05} {'loss': 0.4635, 'learning_rate': 1.6366666666666667e-05, 'epoch': 0.05} {'loss': 0.4637, 'learning_rate': 1.6373333333333335e-05, 'epoch': 0.05} {'loss': 0.4834, 'learning_rate': 1.638e-05, 'epoch': 0.05} {'loss': 0.3667, 'learning_rate': 1.638666666666667e-05, 'epoch': 0.05} {'loss': 0.5322, 'learning_rate': 1.6393333333333334e-05, 'epoch': 0.05} {'loss': 0.4181, 'learning_rate': 1.64e-05, 'epoch': 0.05} {'loss': 0.3187, 'learning_rate': 1.640666666666667e-05, 'epoch': 0.05} {'loss': 0.4194, 'learning_rate': 1.6413333333333334e-05, 'epoch': 0.05} {'loss': 0.6484, 'learning_rate': 1.6420000000000002e-05, 'epoch': 0.05} {'loss': 0.5227, 'learning_rate': 1.642666666666667e-05, 'epoch': 0.05} {'loss': 0.5169, 'learning_rate': 1.6433333333333334e-05, 'epoch': 0.05} {'loss': 0.3011, 'learning_rate': 1.6440000000000002e-05, 'epoch': 0.05} {'loss': 0.3198, 'learning_rate': 1.644666666666667e-05, 'epoch': 0.05} {'loss': 0.488, 'learning_rate': 1.6453333333333334e-05, 'epoch': 0.05} {'loss': 0.3484, 'learning_rate': 1.646e-05, 'epoch': 0.05} {'loss': 0.5152, 'learning_rate': 1.646666666666667e-05, 'epoch': 0.05} {'loss': 0.5929, 'learning_rate': 1.6473333333333334e-05, 'epoch': 0.05} {'loss': 0.5842, 'learning_rate': 1.648e-05, 'epoch': 0.05} {'loss': 0.5363, 'learning_rate': 1.648666666666667e-05, 'epoch': 0.05} {'loss': 0.5437, 'learning_rate': 1.6493333333333334e-05, 'epoch': 0.05} {'loss': 0.6786, 'learning_rate': 1.65e-05, 'epoch': 0.05} {'loss': 0.4, 'learning_rate': 1.650666666666667e-05, 'epoch': 0.05} {'loss': 0.5147, 'learning_rate': 1.6513333333333333e-05, 'epoch': 0.05} {'loss': 0.4544, 'learning_rate': 1.652e-05, 'epoch': 0.05} {'loss': 0.4312, 'learning_rate': 1.652666666666667e-05, 'epoch': 0.05} {'loss': 0.4006, 'learning_rate': 1.6533333333333333e-05, 'epoch': 0.05} {'loss': 0.4319, 'learning_rate': 1.654e-05, 'epoch': 0.05} {'loss': 0.5682, 'learning_rate': 1.654666666666667e-05, 'epoch': 0.05} {'loss': 0.4034, 'learning_rate': 1.6553333333333333e-05, 'epoch': 0.05} {'loss': 0.4869, 'learning_rate': 1.656e-05, 'epoch': 0.05} {'loss': 0.4693, 'learning_rate': 1.656666666666667e-05, 'epoch': 0.05} {'loss': 0.5633, 'learning_rate': 1.6573333333333336e-05, 'epoch': 0.05} {'loss': 0.4083, 'learning_rate': 1.658e-05, 'epoch': 0.05} {'loss': 0.5257, 'learning_rate': 1.6586666666666668e-05, 'epoch': 0.05} {'loss': 0.5099, 'learning_rate': 1.6593333333333336e-05, 'epoch': 0.05} {'loss': 0.6016, 'learning_rate': 1.66e-05, 'epoch': 0.05} {'loss': 0.3667, 'learning_rate': 1.6606666666666668e-05, 'epoch': 0.05} {'loss': 0.4519, 'learning_rate': 1.6613333333333336e-05, 'epoch': 0.05} {'loss': 0.4233, 'learning_rate': 1.662e-05, 'epoch': 0.05} {'loss': 0.5636, 'learning_rate': 1.6626666666666668e-05, 'epoch': 0.05} {'loss': 0.5394, 'learning_rate': 1.6633333333333336e-05, 'epoch': 0.05} {'loss': 0.6556, 'learning_rate': 1.664e-05, 'epoch': 0.05} {'loss': 0.3554, 'learning_rate': 1.6646666666666668e-05, 'epoch': 0.05} {'loss': 0.5646, 'learning_rate': 1.6653333333333335e-05, 'epoch': 0.05} {'loss': 0.5051, 'learning_rate': 1.666e-05, 'epoch': 0.05} {'loss': 0.4155, 'learning_rate': 1.6666666666666667e-05, 'epoch': 0.05} {'loss': 0.5673, 'learning_rate': 1.6673333333333335e-05, 'epoch': 0.05} {'loss': 0.4042, 'learning_rate': 1.668e-05, 'epoch': 0.05} {'loss': 0.3933, 'learning_rate': 1.6686666666666667e-05, 'epoch': 0.05} {'loss': 0.3347, 'learning_rate': 1.6693333333333335e-05, 'epoch': 0.05} {'loss': 0.5515, 'learning_rate': 1.67e-05, 'epoch': 0.05} {'loss': 0.5125, 'learning_rate': 1.670666666666667e-05, 'epoch': 0.05} {'loss': 0.5253, 'learning_rate': 1.6713333333333335e-05, 'epoch': 0.05} {'loss': 0.3457, 'learning_rate': 1.672e-05, 'epoch': 0.05} {'loss': 0.5077, 'learning_rate': 1.672666666666667e-05, 'epoch': 0.05} {'loss': 0.3947, 'learning_rate': 1.6733333333333335e-05, 'epoch': 0.05} {'loss': 0.3422, 'learning_rate': 1.6740000000000002e-05, 'epoch': 0.05} {'loss': 0.4972, 'learning_rate': 1.674666666666667e-05, 'epoch': 0.05} {'loss': 0.375, 'learning_rate': 1.6753333333333334e-05, 'epoch': 0.05} {'loss': 0.5215, 'learning_rate': 1.6760000000000002e-05, 'epoch': 0.05} {'loss': 0.5737, 'learning_rate': 1.676666666666667e-05, 'epoch': 0.05} {'loss': 0.3143, 'learning_rate': 1.6773333333333334e-05, 'epoch': 0.05} {'loss': 0.5802, 'learning_rate': 1.6780000000000002e-05, 'epoch': 0.05} {'loss': 0.5509, 'learning_rate': 1.678666666666667e-05, 'epoch': 0.05} {'loss': 0.6048, 'learning_rate': 1.6793333333333334e-05, 'epoch': 0.05} {'loss': 0.5013, 'learning_rate': 1.6800000000000002e-05, 'epoch': 0.05} {'loss': 0.6073, 'learning_rate': 1.680666666666667e-05, 'epoch': 0.05} {'loss': 0.1407, 'learning_rate': 1.6813333333333334e-05, 'epoch': 0.05} {'loss': 0.2778, 'learning_rate': 1.682e-05, 'epoch': 0.05} {'loss': 0.4466, 'learning_rate': 1.682666666666667e-05, 'epoch': 0.05} {'loss': 0.5366, 'learning_rate': 1.6833333333333334e-05, 'epoch': 0.05} {'loss': 0.4814, 'learning_rate': 1.684e-05, 'epoch': 0.05} {'loss': 0.4406, 'learning_rate': 1.684666666666667e-05, 'epoch': 0.05} {'loss': 0.6348, 'learning_rate': 1.6853333333333333e-05, 'epoch': 0.05} {'loss': 0.4357, 'learning_rate': 1.686e-05, 'epoch': 0.05} {'loss': 0.5604, 'learning_rate': 1.686666666666667e-05, 'epoch': 0.05} {'loss': 0.4552, 'learning_rate': 1.6873333333333333e-05, 'epoch': 0.05} {'loss': 0.5487, 'learning_rate': 1.688e-05, 'epoch': 0.05} {'loss': 0.6477, 'learning_rate': 1.688666666666667e-05, 'epoch': 0.05} {'loss': 0.4622, 'learning_rate': 1.6893333333333336e-05, 'epoch': 0.05} {'loss': 0.3259, 'learning_rate': 1.69e-05, 'epoch': 0.05} {'loss': 0.3013, 'learning_rate': 1.690666666666667e-05, 'epoch': 0.05} {'loss': 0.5599, 'learning_rate': 1.6913333333333336e-05, 'epoch': 0.05} {'loss': 0.4504, 'learning_rate': 1.692e-05, 'epoch': 0.05} {'loss': 0.5315, 'learning_rate': 1.692666666666667e-05, 'epoch': 0.05} {'loss': 0.5666, 'learning_rate': 1.6933333333333336e-05, 'epoch': 0.05} {'loss': 0.4612, 'learning_rate': 1.694e-05, 'epoch': 0.05} {'loss': 0.5236, 'learning_rate': 1.6946666666666668e-05, 'epoch': 0.05} {'loss': 0.5722, 'learning_rate': 1.6953333333333336e-05, 'epoch': 0.05} {'loss': 0.5256, 'learning_rate': 1.696e-05, 'epoch': 0.05} {'loss': 0.4853, 'learning_rate': 1.6966666666666668e-05, 'epoch': 0.05} {'loss': 0.3729, 'learning_rate': 1.6973333333333336e-05, 'epoch': 0.05} {'loss': 0.5897, 'learning_rate': 1.698e-05, 'epoch': 0.05} {'loss': 0.4273, 'learning_rate': 1.6986666666666668e-05, 'epoch': 0.05} {'loss': 0.4263, 'learning_rate': 1.6993333333333336e-05, 'epoch': 0.05} {'loss': 0.4819, 'learning_rate': 1.7e-05, 'epoch': 0.05} {'loss': 0.5994, 'learning_rate': 1.7006666666666668e-05, 'epoch': 0.05} {'loss': 0.562, 'learning_rate': 1.7013333333333335e-05, 'epoch': 0.05} {'loss': 0.5403, 'learning_rate': 1.702e-05, 'epoch': 0.05} {'loss': 0.3358, 'learning_rate': 1.702666666666667e-05, 'epoch': 0.05} {'loss': 0.4753, 'learning_rate': 1.7033333333333335e-05, 'epoch': 0.05} {'loss': 0.3683, 'learning_rate': 1.704e-05, 'epoch': 0.05} {'loss': 0.5893, 'learning_rate': 1.704666666666667e-05, 'epoch': 0.05} {'loss': 0.444, 'learning_rate': 1.7053333333333335e-05, 'epoch': 0.05} {'loss': 0.3503, 'learning_rate': 1.7060000000000003e-05, 'epoch': 0.05} {'loss': 0.5803, 'learning_rate': 1.706666666666667e-05, 'epoch': 0.05} {'loss': 0.3842, 'learning_rate': 1.7073333333333335e-05, 'epoch': 0.05} {'loss': 0.5062, 'learning_rate': 1.7080000000000002e-05, 'epoch': 0.05} {'loss': 0.5498, 'learning_rate': 1.7086666666666667e-05, 'epoch': 0.05} {'loss': 0.2884, 'learning_rate': 1.7093333333333335e-05, 'epoch': 0.05} {'loss': 0.7316, 'learning_rate': 1.7100000000000002e-05, 'epoch': 0.05} {'loss': 0.459, 'learning_rate': 1.7106666666666667e-05, 'epoch': 0.05} {'loss': 0.4469, 'learning_rate': 1.7113333333333334e-05, 'epoch': 0.05} {'loss': 0.5724, 'learning_rate': 1.7120000000000002e-05, 'epoch': 0.05} {'loss': 0.5115, 'learning_rate': 1.7126666666666666e-05, 'epoch': 0.05} {'loss': 0.5205, 'learning_rate': 1.7133333333333334e-05, 'epoch': 0.05} {'loss': 0.4024, 'learning_rate': 1.7140000000000002e-05, 'epoch': 0.05} {'loss': 0.5365, 'learning_rate': 1.7146666666666666e-05, 'epoch': 0.05} {'loss': 0.6061, 'learning_rate': 1.7153333333333334e-05, 'epoch': 0.05} {'loss': 0.3823, 'learning_rate': 1.7160000000000002e-05, 'epoch': 0.05} {'loss': 0.4437, 'learning_rate': 1.7166666666666666e-05, 'epoch': 0.05} {'loss': 0.4504, 'learning_rate': 1.7173333333333334e-05, 'epoch': 0.05} {'loss': 0.4388, 'learning_rate': 1.718e-05, 'epoch': 0.05} {'loss': 0.4695, 'learning_rate': 1.7186666666666666e-05, 'epoch': 0.05} {'loss': 0.6969, 'learning_rate': 1.7193333333333334e-05, 'epoch': 0.05} {'loss': 0.5627, 'learning_rate': 1.72e-05, 'epoch': 0.05} {'loss': 0.6095, 'learning_rate': 1.7206666666666666e-05, 'epoch': 0.05} {'loss': 0.43, 'learning_rate': 1.7213333333333337e-05, 'epoch': 0.05} {'loss': 0.5301, 'learning_rate': 1.722e-05, 'epoch': 0.05} {'loss': 0.5692, 'learning_rate': 1.7226666666666665e-05, 'epoch': 0.05} {'loss': 0.5061, 'learning_rate': 1.7233333333333337e-05, 'epoch': 0.05} {'loss': 0.6504, 'learning_rate': 1.724e-05, 'epoch': 0.05} {'loss': 0.557, 'learning_rate': 1.724666666666667e-05, 'epoch': 0.05} {'loss': 0.4708, 'learning_rate': 1.7253333333333336e-05, 'epoch': 0.05} {'loss': 0.5486, 'learning_rate': 1.726e-05, 'epoch': 0.05} {'loss': 0.6448, 'learning_rate': 1.726666666666667e-05, 'epoch': 0.05} {'loss': 0.5014, 'learning_rate': 1.7273333333333336e-05, 'epoch': 0.05} {'loss': 0.5375, 'learning_rate': 1.728e-05, 'epoch': 0.05} {'loss': 0.3694, 'learning_rate': 1.7286666666666668e-05, 'epoch': 0.05} {'loss': 0.4563, 'learning_rate': 1.7293333333333336e-05, 'epoch': 0.05} {'loss': 0.3965, 'learning_rate': 1.73e-05, 'epoch': 0.05} {'loss': 0.5119, 'learning_rate': 1.7306666666666668e-05, 'epoch': 0.05} {'loss': 0.4528, 'learning_rate': 1.7313333333333336e-05, 'epoch': 0.05} {'loss': 0.444, 'learning_rate': 1.732e-05, 'epoch': 0.05} {'loss': 0.4697, 'learning_rate': 1.7326666666666668e-05, 'epoch': 0.05} {'loss': 0.5164, 'learning_rate': 1.7333333333333336e-05, 'epoch': 0.05} {'loss': 0.3842, 'learning_rate': 1.734e-05, 'epoch': 0.05} {'loss': 0.3959, 'learning_rate': 1.7346666666666668e-05, 'epoch': 0.05} {'loss': 0.56, 'learning_rate': 1.7353333333333335e-05, 'epoch': 0.05} {'loss': 0.4325, 'learning_rate': 1.736e-05, 'epoch': 0.05} {'loss': 0.5265, 'learning_rate': 1.7366666666666668e-05, 'epoch': 0.05} {'loss': 0.4728, 'learning_rate': 1.7373333333333335e-05, 'epoch': 0.05} {'loss': 0.6242, 'learning_rate': 1.7380000000000003e-05, 'epoch': 0.05} {'loss': 0.7093, 'learning_rate': 1.7386666666666667e-05, 'epoch': 0.05} {'loss': 0.5763, 'learning_rate': 1.7393333333333335e-05, 'epoch': 0.05} {'loss': 0.4339, 'learning_rate': 1.7400000000000003e-05, 'epoch': 0.05} {'loss': 0.4557, 'learning_rate': 1.7406666666666667e-05, 'epoch': 0.05} {'loss': 0.4928, 'learning_rate': 1.7413333333333335e-05, 'epoch': 0.05} {'loss': 0.618, 'learning_rate': 1.7420000000000003e-05, 'epoch': 0.05} {'loss': 0.5164, 'learning_rate': 1.7426666666666667e-05, 'epoch': 0.05} {'loss': 0.5052, 'learning_rate': 1.7433333333333335e-05, 'epoch': 0.05} {'loss': 0.5023, 'learning_rate': 1.7440000000000002e-05, 'epoch': 0.05} {'loss': 0.5963, 'learning_rate': 1.7446666666666667e-05, 'epoch': 0.05} {'loss': 0.5555, 'learning_rate': 1.7453333333333335e-05, 'epoch': 0.05} {'loss': 0.3834, 'learning_rate': 1.7460000000000002e-05, 'epoch': 0.05} {'loss': 0.4451, 'learning_rate': 1.7466666666666667e-05, 'epoch': 0.05} {'loss': 0.5054, 'learning_rate': 1.7473333333333334e-05, 'epoch': 0.05} {'loss': 0.6068, 'learning_rate': 1.7480000000000002e-05, 'epoch': 0.05} {'loss': 0.54, 'learning_rate': 1.7486666666666666e-05, 'epoch': 0.05} {'loss': 0.6216, 'learning_rate': 1.7493333333333334e-05, 'epoch': 0.05} {'loss': 0.6048, 'learning_rate': 1.7500000000000002e-05, 'epoch': 0.05} {'loss': 0.6464, 'learning_rate': 1.7506666666666666e-05, 'epoch': 0.05} {'loss': 0.4801, 'learning_rate': 1.7513333333333334e-05, 'epoch': 0.05} {'loss': 0.4917, 'learning_rate': 1.752e-05, 'epoch': 0.05} {'loss': 0.2283, 'learning_rate': 1.7526666666666666e-05, 'epoch': 0.05} {'loss': 0.4084, 'learning_rate': 1.7533333333333337e-05, 'epoch': 0.05} {'loss': 0.4489, 'learning_rate': 1.754e-05, 'epoch': 0.05} {'loss': 0.4059, 'learning_rate': 1.7546666666666666e-05, 'epoch': 0.05} {'loss': 0.5116, 'learning_rate': 1.7553333333333337e-05, 'epoch': 0.05} {'loss': 0.4611, 'learning_rate': 1.756e-05, 'epoch': 0.05} {'loss': 0.5567, 'learning_rate': 1.756666666666667e-05, 'epoch': 0.05} {'loss': 0.5997, 'learning_rate': 1.7573333333333337e-05, 'epoch': 0.05} {'loss': 0.619, 'learning_rate': 1.758e-05, 'epoch': 0.05} {'loss': 0.6311, 'learning_rate': 1.758666666666667e-05, 'epoch': 0.05} {'loss': 0.5135, 'learning_rate': 1.7593333333333337e-05, 'epoch': 0.05} {'loss': 0.5888, 'learning_rate': 1.76e-05, 'epoch': 0.05} {'loss': 0.5309, 'learning_rate': 1.760666666666667e-05, 'epoch': 0.05} {'loss': 0.4055, 'learning_rate': 1.7613333333333336e-05, 'epoch': 0.05} {'loss': 0.4879, 'learning_rate': 1.762e-05, 'epoch': 0.05} {'loss': 0.4123, 'learning_rate': 1.762666666666667e-05, 'epoch': 0.05} {'loss': 0.6584, 'learning_rate': 1.7633333333333336e-05, 'epoch': 0.05} {'loss': 0.6001, 'learning_rate': 1.764e-05, 'epoch': 0.05} {'loss': 0.342, 'learning_rate': 1.7646666666666668e-05, 'epoch': 0.05} {'loss': 0.3494, 'learning_rate': 1.7653333333333336e-05, 'epoch': 0.05} {'loss': 0.5356, 'learning_rate': 1.766e-05, 'epoch': 0.05} {'loss': 0.3954, 'learning_rate': 1.7666666666666668e-05, 'epoch': 0.05} {'loss': 0.4533, 'learning_rate': 1.7673333333333336e-05, 'epoch': 0.05} {'loss': 0.5405, 'learning_rate': 1.768e-05, 'epoch': 0.05} {'loss': 0.6116, 'learning_rate': 1.7686666666666668e-05, 'epoch': 0.05} {'loss': 0.4506, 'learning_rate': 1.7693333333333336e-05, 'epoch': 0.06} {'loss': 0.553, 'learning_rate': 1.77e-05, 'epoch': 0.06} {'loss': 0.5831, 'learning_rate': 1.7706666666666668e-05, 'epoch': 0.06} {'loss': 0.61, 'learning_rate': 1.7713333333333335e-05, 'epoch': 0.06} {'loss': 0.4811, 'learning_rate': 1.7720000000000003e-05, 'epoch': 0.06} {'loss': 0.5647, 'learning_rate': 1.7726666666666667e-05, 'epoch': 0.06} {'loss': 0.5191, 'learning_rate': 1.7733333333333335e-05, 'epoch': 0.06} {'loss': 0.4419, 'learning_rate': 1.7740000000000003e-05, 'epoch': 0.06} {'loss': 0.6022, 'learning_rate': 1.7746666666666667e-05, 'epoch': 0.06} {'loss': 0.5551, 'learning_rate': 1.7753333333333335e-05, 'epoch': 0.06} {'loss': 0.5253, 'learning_rate': 1.7760000000000003e-05, 'epoch': 0.06} {'loss': 0.4461, 'learning_rate': 1.7766666666666667e-05, 'epoch': 0.06} {'loss': 0.5395, 'learning_rate': 1.7773333333333335e-05, 'epoch': 0.06} {'loss': 0.5053, 'learning_rate': 1.7780000000000003e-05, 'epoch': 0.06} {'loss': 0.3953, 'learning_rate': 1.7786666666666667e-05, 'epoch': 0.06} {'loss': 0.4787, 'learning_rate': 1.7793333333333335e-05, 'epoch': 0.06} {'loss': 0.4537, 'learning_rate': 1.7800000000000002e-05, 'epoch': 0.06} {'loss': 0.3605, 'learning_rate': 1.7806666666666667e-05, 'epoch': 0.06} {'loss': 0.5904, 'learning_rate': 1.7813333333333334e-05, 'epoch': 0.06} {'loss': 0.5686, 'learning_rate': 1.7820000000000002e-05, 'epoch': 0.06} {'loss': 0.4578, 'learning_rate': 1.7826666666666667e-05, 'epoch': 0.06} {'loss': 0.3914, 'learning_rate': 1.7833333333333334e-05, 'epoch': 0.06} {'loss': 0.2577, 'learning_rate': 1.7840000000000002e-05, 'epoch': 0.06} {'loss': 0.255, 'learning_rate': 1.7846666666666666e-05, 'epoch': 0.06} {'loss': 0.4522, 'learning_rate': 1.7853333333333337e-05, 'epoch': 0.06} {'loss': 0.4173, 'learning_rate': 1.7860000000000002e-05, 'epoch': 0.06} {'loss': 0.5686, 'learning_rate': 1.7866666666666666e-05, 'epoch': 0.06} {'loss': 0.4908, 'learning_rate': 1.7873333333333337e-05, 'epoch': 0.06} {'loss': 0.5797, 'learning_rate': 1.788e-05, 'epoch': 0.06} {'loss': 0.5039, 'learning_rate': 1.788666666666667e-05, 'epoch': 0.06} {'loss': 0.4846, 'learning_rate': 1.7893333333333337e-05, 'epoch': 0.06} {'loss': 0.4913, 'learning_rate': 1.79e-05, 'epoch': 0.06} {'loss': 0.4381, 'learning_rate': 1.790666666666667e-05, 'epoch': 0.06} {'loss': 0.7144, 'learning_rate': 1.7913333333333337e-05, 'epoch': 0.06} {'loss': 0.4344, 'learning_rate': 1.792e-05, 'epoch': 0.06} {'loss': 0.4849, 'learning_rate': 1.792666666666667e-05, 'epoch': 0.06} {'loss': 0.4295, 'learning_rate': 1.7933333333333333e-05, 'epoch': 0.06} {'loss': 0.291, 'learning_rate': 1.794e-05, 'epoch': 0.06} {'loss': 0.5831, 'learning_rate': 1.794666666666667e-05, 'epoch': 0.06} {'loss': 0.6376, 'learning_rate': 1.7953333333333333e-05, 'epoch': 0.06} {'loss': 0.4871, 'learning_rate': 1.796e-05, 'epoch': 0.06} {'loss': 0.4206, 'learning_rate': 1.796666666666667e-05, 'epoch': 0.06} {'loss': 0.4623, 'learning_rate': 1.7973333333333333e-05, 'epoch': 0.06} {'loss': 0.5744, 'learning_rate': 1.798e-05, 'epoch': 0.06} {'loss': 0.5167, 'learning_rate': 1.798666666666667e-05, 'epoch': 0.06} {'loss': 0.3013, 'learning_rate': 1.7993333333333333e-05, 'epoch': 0.06} {'loss': 0.2418, 'learning_rate': 1.8e-05, 'epoch': 0.06} {'loss': 0.3673, 'learning_rate': 1.8006666666666668e-05, 'epoch': 0.06} {'loss': 0.3672, 'learning_rate': 1.8013333333333333e-05, 'epoch': 0.06} {'loss': 0.4611, 'learning_rate': 1.802e-05, 'epoch': 0.06} {'loss': 0.4534, 'learning_rate': 1.8026666666666668e-05, 'epoch': 0.06} {'loss': 0.5591, 'learning_rate': 1.8033333333333332e-05, 'epoch': 0.06} {'loss': 0.5917, 'learning_rate': 1.8040000000000003e-05, 'epoch': 0.06} {'loss': 0.3901, 'learning_rate': 1.8046666666666668e-05, 'epoch': 0.06} {'loss': 0.5786, 'learning_rate': 1.8053333333333332e-05, 'epoch': 0.06} {'loss': 0.5481, 'learning_rate': 1.8060000000000003e-05, 'epoch': 0.06} {'loss': 0.3177, 'learning_rate': 1.8066666666666668e-05, 'epoch': 0.06} {'loss': 0.7101, 'learning_rate': 1.8073333333333335e-05, 'epoch': 0.06} {'loss': 0.475, 'learning_rate': 1.8080000000000003e-05, 'epoch': 0.06} {'loss': 0.4313, 'learning_rate': 1.8086666666666667e-05, 'epoch': 0.06} {'loss': 0.5049, 'learning_rate': 1.8093333333333335e-05, 'epoch': 0.06} {'loss': 0.592, 'learning_rate': 1.8100000000000003e-05, 'epoch': 0.06} {'loss': 0.4968, 'learning_rate': 1.8106666666666667e-05, 'epoch': 0.06} {'loss': 0.6316, 'learning_rate': 1.8113333333333335e-05, 'epoch': 0.06} {'loss': 0.4086, 'learning_rate': 1.8120000000000003e-05, 'epoch': 0.06} {'loss': 0.4214, 'learning_rate': 1.8126666666666667e-05, 'epoch': 0.06} {'loss': 0.4754, 'learning_rate': 1.8133333333333335e-05, 'epoch': 0.06} {'loss': 0.4215, 'learning_rate': 1.8140000000000003e-05, 'epoch': 0.06} {'loss': 0.4564, 'learning_rate': 1.8146666666666667e-05, 'epoch': 0.06} {'loss': 0.5015, 'learning_rate': 1.8153333333333335e-05, 'epoch': 0.06} {'loss': 0.4439, 'learning_rate': 1.8160000000000002e-05, 'epoch': 0.06} {'loss': 0.4675, 'learning_rate': 1.8166666666666667e-05, 'epoch': 0.06} {'loss': 0.5674, 'learning_rate': 1.8173333333333334e-05, 'epoch': 0.06} {'loss': 0.4132, 'learning_rate': 1.8180000000000002e-05, 'epoch': 0.06} {'loss': 0.5088, 'learning_rate': 1.8186666666666666e-05, 'epoch': 0.06} {'loss': 0.5711, 'learning_rate': 1.8193333333333334e-05, 'epoch': 0.06} {'loss': 0.5771, 'learning_rate': 1.8200000000000002e-05, 'epoch': 0.06} {'loss': 0.5859, 'learning_rate': 1.820666666666667e-05, 'epoch': 0.06} {'loss': 0.4068, 'learning_rate': 1.8213333333333334e-05, 'epoch': 0.06} {'loss': 0.5197, 'learning_rate': 1.8220000000000002e-05, 'epoch': 0.06} {'loss': 0.6115, 'learning_rate': 1.822666666666667e-05, 'epoch': 0.06} {'loss': 0.4954, 'learning_rate': 1.8233333333333334e-05, 'epoch': 0.06} {'loss': 0.5648, 'learning_rate': 1.824e-05, 'epoch': 0.06} {'loss': 0.5448, 'learning_rate': 1.824666666666667e-05, 'epoch': 0.06} {'loss': 0.5919, 'learning_rate': 1.8253333333333334e-05, 'epoch': 0.06} {'loss': 0.4984, 'learning_rate': 1.826e-05, 'epoch': 0.06} {'loss': 0.3678, 'learning_rate': 1.826666666666667e-05, 'epoch': 0.06} {'loss': 0.5321, 'learning_rate': 1.8273333333333333e-05, 'epoch': 0.06} {'loss': 0.4897, 'learning_rate': 1.828e-05, 'epoch': 0.06} {'loss': 0.6179, 'learning_rate': 1.828666666666667e-05, 'epoch': 0.06} {'loss': 0.6018, 'learning_rate': 1.8293333333333333e-05, 'epoch': 0.06} {'loss': 0.6026, 'learning_rate': 1.83e-05, 'epoch': 0.06} {'loss': 0.4806, 'learning_rate': 1.830666666666667e-05, 'epoch': 0.06} {'loss': 0.5109, 'learning_rate': 1.8313333333333333e-05, 'epoch': 0.06} {'loss': 0.6421, 'learning_rate': 1.832e-05, 'epoch': 0.06} {'loss': 0.4484, 'learning_rate': 1.832666666666667e-05, 'epoch': 0.06} {'loss': 0.4148, 'learning_rate': 1.8333333333333333e-05, 'epoch': 0.06} {'loss': 0.5459, 'learning_rate': 1.834e-05, 'epoch': 0.06} {'loss': 0.3763, 'learning_rate': 1.834666666666667e-05, 'epoch': 0.06} {'loss': 0.3578, 'learning_rate': 1.8353333333333333e-05, 'epoch': 0.06} {'loss': 0.3213, 'learning_rate': 1.8360000000000004e-05, 'epoch': 0.06} {'loss': 0.6816, 'learning_rate': 1.8366666666666668e-05, 'epoch': 0.06} {'loss': 0.4842, 'learning_rate': 1.8373333333333332e-05, 'epoch': 0.06} {'loss': 0.5178, 'learning_rate': 1.8380000000000004e-05, 'epoch': 0.06} {'loss': 0.4377, 'learning_rate': 1.8386666666666668e-05, 'epoch': 0.06} {'loss': 0.5966, 'learning_rate': 1.8393333333333336e-05, 'epoch': 0.06} {'loss': 0.6135, 'learning_rate': 1.8400000000000003e-05, 'epoch': 0.06} {'loss': 0.3855, 'learning_rate': 1.8406666666666668e-05, 'epoch': 0.06} {'loss': 0.4954, 'learning_rate': 1.8413333333333335e-05, 'epoch': 0.06} {'loss': 0.5015, 'learning_rate': 1.8420000000000003e-05, 'epoch': 0.06} {'loss': 0.3954, 'learning_rate': 1.8426666666666668e-05, 'epoch': 0.06} {'loss': 0.6149, 'learning_rate': 1.8433333333333335e-05, 'epoch': 0.06} {'loss': 0.4327, 'learning_rate': 1.8440000000000003e-05, 'epoch': 0.06} {'loss': 0.5561, 'learning_rate': 1.8446666666666667e-05, 'epoch': 0.06} {'loss': 0.4459, 'learning_rate': 1.8453333333333335e-05, 'epoch': 0.06} {'loss': 0.5777, 'learning_rate': 1.8460000000000003e-05, 'epoch': 0.06} {'loss': 0.4216, 'learning_rate': 1.8466666666666667e-05, 'epoch': 0.06} {'loss': 0.5078, 'learning_rate': 1.8473333333333335e-05, 'epoch': 0.06} {'loss': 0.3893, 'learning_rate': 1.8480000000000003e-05, 'epoch': 0.06} {'loss': 0.3988, 'learning_rate': 1.8486666666666667e-05, 'epoch': 0.06} {'loss': 0.597, 'learning_rate': 1.8493333333333335e-05, 'epoch': 0.06} {'loss': 0.5928, 'learning_rate': 1.8500000000000002e-05, 'epoch': 0.06} {'loss': 0.6367, 'learning_rate': 1.8506666666666667e-05, 'epoch': 0.06} {'loss': 0.4859, 'learning_rate': 1.8513333333333335e-05, 'epoch': 0.06} {'loss': 0.475, 'learning_rate': 1.8520000000000002e-05, 'epoch': 0.06} {'loss': 0.5435, 'learning_rate': 1.852666666666667e-05, 'epoch': 0.06} {'loss': 0.5365, 'learning_rate': 1.8533333333333334e-05, 'epoch': 0.06} {'loss': 0.451, 'learning_rate': 1.8540000000000002e-05, 'epoch': 0.06} {'loss': 0.6285, 'learning_rate': 1.854666666666667e-05, 'epoch': 0.06} {'loss': 0.5188, 'learning_rate': 1.8553333333333334e-05, 'epoch': 0.06} {'loss': 0.5495, 'learning_rate': 1.8560000000000002e-05, 'epoch': 0.06} {'loss': 0.6447, 'learning_rate': 1.856666666666667e-05, 'epoch': 0.06} {'loss': 0.6668, 'learning_rate': 1.8573333333333334e-05, 'epoch': 0.06} {'loss': 0.3592, 'learning_rate': 1.858e-05, 'epoch': 0.06} {'loss': 0.4343, 'learning_rate': 1.858666666666667e-05, 'epoch': 0.06} {'loss': 0.4802, 'learning_rate': 1.8593333333333334e-05, 'epoch': 0.06} {'loss': 0.5122, 'learning_rate': 1.86e-05, 'epoch': 0.06} {'loss': 0.5076, 'learning_rate': 1.860666666666667e-05, 'epoch': 0.06} {'loss': 0.5578, 'learning_rate': 1.8613333333333334e-05, 'epoch': 0.06} {'loss': 0.4931, 'learning_rate': 1.862e-05, 'epoch': 0.06} {'loss': 0.5016, 'learning_rate': 1.862666666666667e-05, 'epoch': 0.06} {'loss': 0.5935, 'learning_rate': 1.8633333333333333e-05, 'epoch': 0.06} {'loss': 0.479, 'learning_rate': 1.864e-05, 'epoch': 0.06} {'loss': 0.5273, 'learning_rate': 1.864666666666667e-05, 'epoch': 0.06} {'loss': 0.6735, 'learning_rate': 1.8653333333333333e-05, 'epoch': 0.06} {'loss': 0.6417, 'learning_rate': 1.866e-05, 'epoch': 0.06} {'loss': 0.6264, 'learning_rate': 1.866666666666667e-05, 'epoch': 0.06} {'loss': 0.4712, 'learning_rate': 1.8673333333333333e-05, 'epoch': 0.06} {'loss': 0.3969, 'learning_rate': 1.8680000000000004e-05, 'epoch': 0.06} {'loss': 0.3886, 'learning_rate': 1.868666666666667e-05, 'epoch': 0.06} {'loss': 0.5352, 'learning_rate': 1.8693333333333333e-05, 'epoch': 0.06} {'loss': 0.5837, 'learning_rate': 1.8700000000000004e-05, 'epoch': 0.06} {'loss': 0.3728, 'learning_rate': 1.8706666666666668e-05, 'epoch': 0.06} {'loss': 0.4368, 'learning_rate': 1.8713333333333336e-05, 'epoch': 0.06} {'loss': 0.508, 'learning_rate': 1.8720000000000004e-05, 'epoch': 0.06} {'loss': 0.4865, 'learning_rate': 1.8726666666666668e-05, 'epoch': 0.06} {'loss': 0.4826, 'learning_rate': 1.8733333333333336e-05, 'epoch': 0.06} {'loss': 0.631, 'learning_rate': 1.8740000000000004e-05, 'epoch': 0.06} {'loss': 0.5619, 'learning_rate': 1.8746666666666668e-05, 'epoch': 0.06} {'loss': 0.4095, 'learning_rate': 1.8753333333333336e-05, 'epoch': 0.06} {'loss': 0.5624, 'learning_rate': 1.876e-05, 'epoch': 0.06} {'loss': 0.5273, 'learning_rate': 1.8766666666666668e-05, 'epoch': 0.06} {'loss': 0.4386, 'learning_rate': 1.8773333333333335e-05, 'epoch': 0.06} {'loss': 0.4115, 'learning_rate': 1.878e-05, 'epoch': 0.06} {'loss': 0.5055, 'learning_rate': 1.8786666666666667e-05, 'epoch': 0.06} {'loss': 0.5578, 'learning_rate': 1.8793333333333335e-05, 'epoch': 0.06} {'loss': 0.5709, 'learning_rate': 1.88e-05, 'epoch': 0.06} {'loss': 0.5103, 'learning_rate': 1.8806666666666667e-05, 'epoch': 0.06} {'loss': 0.5093, 'learning_rate': 1.8813333333333335e-05, 'epoch': 0.06} {'loss': 0.5775, 'learning_rate': 1.882e-05, 'epoch': 0.06} {'loss': 0.4863, 'learning_rate': 1.8826666666666667e-05, 'epoch': 0.06} {'loss': 0.6353, 'learning_rate': 1.8833333333333335e-05, 'epoch': 0.06} {'loss': 0.4804, 'learning_rate': 1.884e-05, 'epoch': 0.06} {'loss': 0.6344, 'learning_rate': 1.884666666666667e-05, 'epoch': 0.06} {'loss': 0.5257, 'learning_rate': 1.8853333333333335e-05, 'epoch': 0.06} {'loss': 0.4522, 'learning_rate': 1.886e-05, 'epoch': 0.06} {'loss': 0.5397, 'learning_rate': 1.886666666666667e-05, 'epoch': 0.06} {'loss': 0.6441, 'learning_rate': 1.8873333333333334e-05, 'epoch': 0.06} {'loss': 0.4064, 'learning_rate': 1.8880000000000002e-05, 'epoch': 0.06} {'loss': 0.4155, 'learning_rate': 1.888666666666667e-05, 'epoch': 0.06} {'loss': 0.3557, 'learning_rate': 1.8893333333333334e-05, 'epoch': 0.06} {'loss': 0.5945, 'learning_rate': 1.8900000000000002e-05, 'epoch': 0.06} {'loss': 0.3921, 'learning_rate': 1.890666666666667e-05, 'epoch': 0.06} {'loss': 0.5036, 'learning_rate': 1.8913333333333334e-05, 'epoch': 0.06} {'loss': 0.422, 'learning_rate': 1.8920000000000002e-05, 'epoch': 0.06} {'loss': 0.5489, 'learning_rate': 1.892666666666667e-05, 'epoch': 0.06} {'loss': 0.497, 'learning_rate': 1.8933333333333334e-05, 'epoch': 0.06} {'loss': 0.4221, 'learning_rate': 1.894e-05, 'epoch': 0.06} {'loss': 0.5158, 'learning_rate': 1.894666666666667e-05, 'epoch': 0.06} {'loss': 0.4691, 'learning_rate': 1.8953333333333334e-05, 'epoch': 0.06} {'loss': 0.6543, 'learning_rate': 1.896e-05, 'epoch': 0.06} {'loss': 0.5492, 'learning_rate': 1.896666666666667e-05, 'epoch': 0.06} {'loss': 0.4005, 'learning_rate': 1.8973333333333334e-05, 'epoch': 0.06} {'loss': 0.4782, 'learning_rate': 1.898e-05, 'epoch': 0.06} {'loss': 0.5015, 'learning_rate': 1.898666666666667e-05, 'epoch': 0.06} {'loss': 0.4631, 'learning_rate': 1.8993333333333333e-05, 'epoch': 0.06} {'loss': 0.3943, 'learning_rate': 1.9e-05, 'epoch': 0.06} {'loss': 0.3571, 'learning_rate': 1.900666666666667e-05, 'epoch': 0.06} {'loss': 0.4755, 'learning_rate': 1.9013333333333333e-05, 'epoch': 0.06} {'loss': 0.57, 'learning_rate': 1.902e-05, 'epoch': 0.06} {'loss': 0.5383, 'learning_rate': 1.902666666666667e-05, 'epoch': 0.06} {'loss': 0.4927, 'learning_rate': 1.9033333333333336e-05, 'epoch': 0.06} {'loss': 0.6017, 'learning_rate': 1.904e-05, 'epoch': 0.06} {'loss': 0.3615, 'learning_rate': 1.904666666666667e-05, 'epoch': 0.06} {'loss': 0.4675, 'learning_rate': 1.9053333333333336e-05, 'epoch': 0.06} {'loss': 0.557, 'learning_rate': 1.906e-05, 'epoch': 0.06} {'loss': 0.5261, 'learning_rate': 1.9066666666666668e-05, 'epoch': 0.06} {'loss': 0.3741, 'learning_rate': 1.9073333333333336e-05, 'epoch': 0.06} {'loss': 0.416, 'learning_rate': 1.908e-05, 'epoch': 0.06} {'loss': 0.4611, 'learning_rate': 1.9086666666666668e-05, 'epoch': 0.06} {'loss': 0.472, 'learning_rate': 1.9093333333333336e-05, 'epoch': 0.06} {'loss': 0.5263, 'learning_rate': 1.91e-05, 'epoch': 0.06} {'loss': 0.3631, 'learning_rate': 1.9106666666666668e-05, 'epoch': 0.06} {'loss': 0.5569, 'learning_rate': 1.9113333333333336e-05, 'epoch': 0.06} {'loss': 0.5256, 'learning_rate': 1.912e-05, 'epoch': 0.06} {'loss': 0.3268, 'learning_rate': 1.9126666666666668e-05, 'epoch': 0.06} {'loss': 0.5314, 'learning_rate': 1.9133333333333335e-05, 'epoch': 0.06} {'loss': 0.6252, 'learning_rate': 1.914e-05, 'epoch': 0.06} {'loss': 0.4492, 'learning_rate': 1.9146666666666667e-05, 'epoch': 0.06} {'loss': 0.4817, 'learning_rate': 1.9153333333333335e-05, 'epoch': 0.06} {'loss': 0.4745, 'learning_rate': 1.916e-05, 'epoch': 0.06} {'loss': 0.4827, 'learning_rate': 1.916666666666667e-05, 'epoch': 0.06} {'loss': 0.4679, 'learning_rate': 1.9173333333333335e-05, 'epoch': 0.06} {'loss': 0.7516, 'learning_rate': 1.918e-05, 'epoch': 0.06} {'loss': 0.4554, 'learning_rate': 1.918666666666667e-05, 'epoch': 0.06} {'loss': 0.6646, 'learning_rate': 1.9193333333333335e-05, 'epoch': 0.06} {'loss': 0.4428, 'learning_rate': 1.9200000000000003e-05, 'epoch': 0.06} {'loss': 0.6723, 'learning_rate': 1.920666666666667e-05, 'epoch': 0.06} {'loss': 0.7014, 'learning_rate': 1.9213333333333335e-05, 'epoch': 0.06} {'loss': 0.4316, 'learning_rate': 1.9220000000000002e-05, 'epoch': 0.06} {'loss': 0.6147, 'learning_rate': 1.922666666666667e-05, 'epoch': 0.06} {'loss': 0.449, 'learning_rate': 1.9233333333333334e-05, 'epoch': 0.06} {'loss': 0.4463, 'learning_rate': 1.9240000000000002e-05, 'epoch': 0.06} {'loss': 0.5709, 'learning_rate': 1.924666666666667e-05, 'epoch': 0.06} {'loss': 0.4551, 'learning_rate': 1.9253333333333334e-05, 'epoch': 0.06} {'loss': 0.6608, 'learning_rate': 1.9260000000000002e-05, 'epoch': 0.06} {'loss': 0.4952, 'learning_rate': 1.926666666666667e-05, 'epoch': 0.06} {'loss': 0.6296, 'learning_rate': 1.9273333333333334e-05, 'epoch': 0.06} {'loss': 0.6026, 'learning_rate': 1.9280000000000002e-05, 'epoch': 0.06} {'loss': 0.4485, 'learning_rate': 1.928666666666667e-05, 'epoch': 0.06} {'loss': 0.5889, 'learning_rate': 1.9293333333333334e-05, 'epoch': 0.06} {'loss': 0.6923, 'learning_rate': 1.93e-05, 'epoch': 0.06} {'loss': 0.4653, 'learning_rate': 1.930666666666667e-05, 'epoch': 0.06} {'loss': 0.5787, 'learning_rate': 1.9313333333333334e-05, 'epoch': 0.06} {'loss': 0.6024, 'learning_rate': 1.932e-05, 'epoch': 0.06} {'loss': 0.3783, 'learning_rate': 1.932666666666667e-05, 'epoch': 0.06} {'loss': 0.4824, 'learning_rate': 1.9333333333333333e-05, 'epoch': 0.06} {'loss': 0.5328, 'learning_rate': 1.934e-05, 'epoch': 0.06} {'loss': 0.5151, 'learning_rate': 1.934666666666667e-05, 'epoch': 0.06} {'loss': 0.5626, 'learning_rate': 1.9353333333333337e-05, 'epoch': 0.06} {'loss': 0.3947, 'learning_rate': 1.936e-05, 'epoch': 0.06} {'loss': 0.3522, 'learning_rate': 1.936666666666667e-05, 'epoch': 0.06} {'loss': 0.4784, 'learning_rate': 1.9373333333333336e-05, 'epoch': 0.06} {'loss': 0.3709, 'learning_rate': 1.938e-05, 'epoch': 0.06} {'loss': 0.5563, 'learning_rate': 1.938666666666667e-05, 'epoch': 0.06} {'loss': 0.4443, 'learning_rate': 1.9393333333333336e-05, 'epoch': 0.06} {'loss': 0.5851, 'learning_rate': 1.94e-05, 'epoch': 0.06} {'loss': 0.4104, 'learning_rate': 1.940666666666667e-05, 'epoch': 0.06} {'loss': 0.3414, 'learning_rate': 1.9413333333333336e-05, 'epoch': 0.06} {'loss': 0.5211, 'learning_rate': 1.942e-05, 'epoch': 0.06} {'loss': 0.498, 'learning_rate': 1.9426666666666668e-05, 'epoch': 0.06} {'loss': 0.7525, 'learning_rate': 1.9433333333333336e-05, 'epoch': 0.06} {'loss': 0.3354, 'learning_rate': 1.944e-05, 'epoch': 0.06} {'loss': 0.3799, 'learning_rate': 1.9446666666666668e-05, 'epoch': 0.06} {'loss': 0.4336, 'learning_rate': 1.9453333333333336e-05, 'epoch': 0.06} {'loss': 0.6017, 'learning_rate': 1.946e-05, 'epoch': 0.06} {'loss': 0.5472, 'learning_rate': 1.9466666666666668e-05, 'epoch': 0.06} {'loss': 0.5404, 'learning_rate': 1.9473333333333335e-05, 'epoch': 0.06} {'loss': 0.3851, 'learning_rate': 1.948e-05, 'epoch': 0.06} {'loss': 0.506, 'learning_rate': 1.948666666666667e-05, 'epoch': 0.06} {'loss': 0.5608, 'learning_rate': 1.9493333333333335e-05, 'epoch': 0.06} {'loss': 0.5855, 'learning_rate': 1.95e-05, 'epoch': 0.06} {'loss': 0.4548, 'learning_rate': 1.950666666666667e-05, 'epoch': 0.06} {'loss': 0.6012, 'learning_rate': 1.9513333333333335e-05, 'epoch': 0.06} {'loss': 0.5519, 'learning_rate': 1.9520000000000003e-05, 'epoch': 0.06} {'loss': 0.5127, 'learning_rate': 1.952666666666667e-05, 'epoch': 0.06} {'loss': 0.4882, 'learning_rate': 1.9533333333333335e-05, 'epoch': 0.06} {'loss': 0.3603, 'learning_rate': 1.9540000000000003e-05, 'epoch': 0.06} {'loss': 0.3581, 'learning_rate': 1.954666666666667e-05, 'epoch': 0.06} {'loss': 0.4409, 'learning_rate': 1.9553333333333335e-05, 'epoch': 0.06} {'loss': 0.5134, 'learning_rate': 1.9560000000000002e-05, 'epoch': 0.06} {'loss': 0.2996, 'learning_rate': 1.956666666666667e-05, 'epoch': 0.06} {'loss': 0.5352, 'learning_rate': 1.9573333333333335e-05, 'epoch': 0.06} {'loss': 0.6262, 'learning_rate': 1.9580000000000002e-05, 'epoch': 0.06} {'loss': 0.4933, 'learning_rate': 1.9586666666666667e-05, 'epoch': 0.06} {'loss': 0.4527, 'learning_rate': 1.9593333333333334e-05, 'epoch': 0.06} {'loss': 0.5453, 'learning_rate': 1.9600000000000002e-05, 'epoch': 0.06} {'loss': 0.5314, 'learning_rate': 1.9606666666666666e-05, 'epoch': 0.06} {'loss': 0.6309, 'learning_rate': 1.9613333333333334e-05, 'epoch': 0.06} {'loss': 0.3304, 'learning_rate': 1.9620000000000002e-05, 'epoch': 0.06} {'loss': 0.4678, 'learning_rate': 1.9626666666666666e-05, 'epoch': 0.06} {'loss': 0.7, 'learning_rate': 1.9633333333333334e-05, 'epoch': 0.06} {'loss': 0.4799, 'learning_rate': 1.9640000000000002e-05, 'epoch': 0.06} {'loss': 0.3244, 'learning_rate': 1.9646666666666666e-05, 'epoch': 0.06} {'loss': 0.2989, 'learning_rate': 1.9653333333333334e-05, 'epoch': 0.06} {'loss': 0.5965, 'learning_rate': 1.966e-05, 'epoch': 0.06} {'loss': 0.5601, 'learning_rate': 1.9666666666666666e-05, 'epoch': 0.06} {'loss': 0.4135, 'learning_rate': 1.9673333333333337e-05, 'epoch': 0.06} {'loss': 0.4877, 'learning_rate': 1.968e-05, 'epoch': 0.06} {'loss': 0.5655, 'learning_rate': 1.9686666666666666e-05, 'epoch': 0.06} {'loss': 0.395, 'learning_rate': 1.9693333333333337e-05, 'epoch': 0.06} {'loss': 0.5006, 'learning_rate': 1.97e-05, 'epoch': 0.06} {'loss': 0.3963, 'learning_rate': 1.970666666666667e-05, 'epoch': 0.06} {'loss': 0.5363, 'learning_rate': 1.9713333333333337e-05, 'epoch': 0.06} {'loss': 0.5241, 'learning_rate': 1.972e-05, 'epoch': 0.06} {'loss': 0.4919, 'learning_rate': 1.972666666666667e-05, 'epoch': 0.06} {'loss': 0.5345, 'learning_rate': 1.9733333333333336e-05, 'epoch': 0.06} {'loss': 0.5047, 'learning_rate': 1.974e-05, 'epoch': 0.06} {'loss': 0.485, 'learning_rate': 1.974666666666667e-05, 'epoch': 0.06} {'loss': 0.5394, 'learning_rate': 1.9753333333333336e-05, 'epoch': 0.06} {'loss': 0.7643, 'learning_rate': 1.976e-05, 'epoch': 0.06} {'loss': 0.4097, 'learning_rate': 1.9766666666666668e-05, 'epoch': 0.06} {'loss': 0.4575, 'learning_rate': 1.9773333333333336e-05, 'epoch': 0.06} {'loss': 0.6304, 'learning_rate': 1.978e-05, 'epoch': 0.06} {'loss': 0.3768, 'learning_rate': 1.9786666666666668e-05, 'epoch': 0.06} {'loss': 0.5538, 'learning_rate': 1.9793333333333336e-05, 'epoch': 0.06} {'loss': 0.4912, 'learning_rate': 1.98e-05, 'epoch': 0.06} {'loss': 0.3793, 'learning_rate': 1.9806666666666668e-05, 'epoch': 0.06} {'loss': 0.714, 'learning_rate': 1.9813333333333336e-05, 'epoch': 0.06} {'loss': 0.3752, 'learning_rate': 1.982e-05, 'epoch': 0.06} {'loss': 0.5924, 'learning_rate': 1.9826666666666668e-05, 'epoch': 0.06} {'loss': 0.4061, 'learning_rate': 1.9833333333333335e-05, 'epoch': 0.06} {'loss': 0.5912, 'learning_rate': 1.9840000000000003e-05, 'epoch': 0.06} {'loss': 0.5262, 'learning_rate': 1.9846666666666668e-05, 'epoch': 0.06} {'loss': 0.3407, 'learning_rate': 1.9853333333333335e-05, 'epoch': 0.06} {'loss': 0.3923, 'learning_rate': 1.9860000000000003e-05, 'epoch': 0.06} {'loss': 0.528, 'learning_rate': 1.9866666666666667e-05, 'epoch': 0.06} {'loss': 0.5561, 'learning_rate': 1.9873333333333335e-05, 'epoch': 0.06} {'loss': 0.3374, 'learning_rate': 1.9880000000000003e-05, 'epoch': 0.06} {'loss': 0.5694, 'learning_rate': 1.9886666666666667e-05, 'epoch': 0.06} {'loss': 0.4635, 'learning_rate': 1.9893333333333335e-05, 'epoch': 0.06} {'loss': 0.4325, 'learning_rate': 1.9900000000000003e-05, 'epoch': 0.06} {'loss': 0.5684, 'learning_rate': 1.9906666666666667e-05, 'epoch': 0.06} {'loss': 0.4986, 'learning_rate': 1.9913333333333335e-05, 'epoch': 0.06} {'loss': 0.5991, 'learning_rate': 1.9920000000000002e-05, 'epoch': 0.06} {'loss': 0.4115, 'learning_rate': 1.9926666666666667e-05, 'epoch': 0.06} {'loss': 0.6308, 'learning_rate': 1.9933333333333334e-05, 'epoch': 0.06} {'loss': 0.5025, 'learning_rate': 1.9940000000000002e-05, 'epoch': 0.06} {'loss': 0.5192, 'learning_rate': 1.9946666666666667e-05, 'epoch': 0.06} {'loss': 0.5697, 'learning_rate': 1.9953333333333334e-05, 'epoch': 0.06} {'loss': 0.353, 'learning_rate': 1.9960000000000002e-05, 'epoch': 0.06} {'loss': 0.355, 'learning_rate': 1.9966666666666666e-05, 'epoch': 0.06} {'loss': 0.4976, 'learning_rate': 1.9973333333333334e-05, 'epoch': 0.06} {'loss': 0.4672, 'learning_rate': 1.9980000000000002e-05, 'epoch': 0.06} {'loss': 0.4798, 'learning_rate': 1.9986666666666666e-05, 'epoch': 0.06} {'loss': 0.537, 'learning_rate': 1.9993333333333337e-05, 'epoch': 0.06} {'loss': 0.5824, 'learning_rate': 2e-05, 'epoch': 0.06} {'loss': 0.5329, 'learning_rate': 1.9999999994355953e-05, 'epoch': 0.06} {'loss': 0.5758, 'learning_rate': 1.9999999977423805e-05, 'epoch': 0.06} {'loss': 0.6485, 'learning_rate': 1.9999999949203558e-05, 'epoch': 0.06} {'loss': 0.6765, 'learning_rate': 1.9999999909695217e-05, 'epoch': 0.06} {'loss': 0.5003, 'learning_rate': 1.9999999858898773e-05, 'epoch': 0.06} {'loss': 0.3803, 'learning_rate': 1.999999979681423e-05, 'epoch': 0.06} {'loss': 0.5913, 'learning_rate': 1.9999999723441593e-05, 'epoch': 0.06} {'loss': 0.5765, 'learning_rate': 1.9999999638780853e-05, 'epoch': 0.06} {'loss': 0.3175, 'learning_rate': 1.9999999542832017e-05, 'epoch': 0.06} {'loss': 0.5132, 'learning_rate': 1.9999999435595088e-05, 'epoch': 0.06} {'loss': 0.5035, 'learning_rate': 1.9999999317070055e-05, 'epoch': 0.06} {'loss': 0.4658, 'learning_rate': 1.9999999187256927e-05, 'epoch': 0.06} {'loss': 0.454, 'learning_rate': 1.99999990461557e-05, 'epoch': 0.06} {'loss': 0.479, 'learning_rate': 1.9999998893766377e-05, 'epoch': 0.06} {'loss': 0.591, 'learning_rate': 1.9999998730088956e-05, 'epoch': 0.06} {'loss': 0.4049, 'learning_rate': 1.999999855512344e-05, 'epoch': 0.06} {'loss': 0.4238, 'learning_rate': 1.9999998368869824e-05, 'epoch': 0.06} {'loss': 0.3892, 'learning_rate': 1.9999998171328114e-05, 'epoch': 0.06} {'loss': 0.5482, 'learning_rate': 1.9999997962498307e-05, 'epoch': 0.06} {'loss': 0.6081, 'learning_rate': 1.9999997742380404e-05, 'epoch': 0.06} {'loss': 0.4503, 'learning_rate': 1.9999997510974404e-05, 'epoch': 0.06} {'loss': 0.5463, 'learning_rate': 1.9999997268280312e-05, 'epoch': 0.06} {'loss': 0.5382, 'learning_rate': 1.999999701429812e-05, 'epoch': 0.06} {'loss': 0.533, 'learning_rate': 1.9999996749027834e-05, 'epoch': 0.06} {'loss': 0.4803, 'learning_rate': 1.9999996472469453e-05, 'epoch': 0.06} {'loss': 0.6076, 'learning_rate': 1.999999618462298e-05, 'epoch': 0.06} {'loss': 0.4033, 'learning_rate': 1.9999995885488414e-05, 'epoch': 0.06} {'loss': 0.5143, 'learning_rate': 1.999999557506575e-05, 'epoch': 0.06} {'loss': 0.4612, 'learning_rate': 1.9999995253354996e-05, 'epoch': 0.06} {'loss': 0.4413, 'learning_rate': 1.9999994920356146e-05, 'epoch': 0.06} {'loss': 0.6905, 'learning_rate': 1.9999994576069203e-05, 'epoch': 0.06} {'loss': 0.5118, 'learning_rate': 1.999999422049417e-05, 'epoch': 0.06} {'loss': 0.5105, 'learning_rate': 1.9999993853631045e-05, 'epoch': 0.06} {'loss': 0.5508, 'learning_rate': 1.999999347547983e-05, 'epoch': 0.06} {'loss': 0.4207, 'learning_rate': 1.999999308604052e-05, 'epoch': 0.06} {'loss': 0.5808, 'learning_rate': 1.999999268531312e-05, 'epoch': 0.06} {'loss': 0.4884, 'learning_rate': 1.9999992273297633e-05, 'epoch': 0.06} {'loss': 0.4789, 'learning_rate': 1.9999991849994053e-05, 'epoch': 0.06} {'loss': 0.483, 'learning_rate': 1.9999991415402386e-05, 'epoch': 0.06} {'loss': 0.6082, 'learning_rate': 1.999999096952263e-05, 'epoch': 0.06} {'loss': 0.4878, 'learning_rate': 1.9999990512354784e-05, 'epoch': 0.06} {'loss': 0.3914, 'learning_rate': 1.9999990043898852e-05, 'epoch': 0.06} {'loss': 0.529, 'learning_rate': 1.9999989564154834e-05, 'epoch': 0.06} {'loss': 0.4965, 'learning_rate': 1.9999989073122726e-05, 'epoch': 0.06} {'loss': 0.435, 'learning_rate': 1.9999988570802532e-05, 'epoch': 0.06} {'loss': 0.4602, 'learning_rate': 1.999998805719426e-05, 'epoch': 0.06} {'loss': 0.3147, 'learning_rate': 1.9999987532297896e-05, 'epoch': 0.06} {'loss': 0.4307, 'learning_rate': 1.9999986996113446e-05, 'epoch': 0.06} {'loss': 0.4233, 'learning_rate': 1.9999986448640918e-05, 'epoch': 0.06} {'loss': 0.5207, 'learning_rate': 1.9999985889880303e-05, 'epoch': 0.06} {'loss': 0.5406, 'learning_rate': 1.9999985319831605e-05, 'epoch': 0.06} {'loss': 0.6134, 'learning_rate': 1.9999984738494828e-05, 'epoch': 0.06} {'loss': 0.522, 'learning_rate': 1.9999984145869968e-05, 'epoch': 0.06} {'loss': 0.4902, 'learning_rate': 1.9999983541957028e-05, 'epoch': 0.06} {'loss': 0.5086, 'learning_rate': 1.999998292675601e-05, 'epoch': 0.06} {'loss': 0.4252, 'learning_rate': 1.999998230026691e-05, 'epoch': 0.06} {'loss': 0.4206, 'learning_rate': 1.9999981662489733e-05, 'epoch': 0.06} {'loss': 0.6253, 'learning_rate': 1.9999981013424476e-05, 'epoch': 0.06} {'loss': 0.6519, 'learning_rate': 1.9999980353071146e-05, 'epoch': 0.06} {'loss': 0.609, 'learning_rate': 1.9999979681429736e-05, 'epoch': 0.06} {'loss': 0.3944, 'learning_rate': 1.9999978998500254e-05, 'epoch': 0.06} {'loss': 0.5643, 'learning_rate': 1.9999978304282693e-05, 'epoch': 0.06} {'loss': 0.4516, 'learning_rate': 1.9999977598777062e-05, 'epoch': 0.06} {'loss': 0.3923, 'learning_rate': 1.999997688198336e-05, 'epoch': 0.06} {'loss': 0.5411, 'learning_rate': 1.9999976153901583e-05, 'epoch': 0.06} {'loss': 0.5479, 'learning_rate': 1.999997541453173e-05, 'epoch': 0.06} {'loss': 0.559, 'learning_rate': 1.999997466387381e-05, 'epoch': 0.06} {'loss': 0.5541, 'learning_rate': 1.9999973901927822e-05, 'epoch': 0.06} {'loss': 0.5669, 'learning_rate': 1.9999973128693762e-05, 'epoch': 0.06} {'loss': 0.4627, 'learning_rate': 1.9999972344171636e-05, 'epoch': 0.06} {'loss': 0.5134, 'learning_rate': 1.999997154836144e-05, 'epoch': 0.06} {'loss': 0.4575, 'learning_rate': 1.999997074126318e-05, 'epoch': 0.06} {'loss': 0.6278, 'learning_rate': 1.9999969922876853e-05, 'epoch': 0.06} {'loss': 0.4512, 'learning_rate': 1.9999969093202464e-05, 'epoch': 0.06} {'loss': 0.4381, 'learning_rate': 1.9999968252240012e-05, 'epoch': 0.06} {'loss': 0.5005, 'learning_rate': 1.9999967399989495e-05, 'epoch': 0.06} {'loss': 0.4575, 'learning_rate': 1.9999966536450918e-05, 'epoch': 0.06} {'loss': 0.4572, 'learning_rate': 1.999996566162428e-05, 'epoch': 0.06} {'loss': 0.4298, 'learning_rate': 1.999996477550958e-05, 'epoch': 0.06} {'loss': 0.3787, 'learning_rate': 1.9999963878106822e-05, 'epoch': 0.06} {'loss': 0.6461, 'learning_rate': 1.999996296941601e-05, 'epoch': 0.06} {'loss': 0.5255, 'learning_rate': 1.9999962049437137e-05, 'epoch': 0.06} {'loss': 0.4422, 'learning_rate': 1.9999961118170212e-05, 'epoch': 0.06} {'loss': 0.4241, 'learning_rate': 1.9999960175615228e-05, 'epoch': 0.06} {'loss': 0.7013, 'learning_rate': 1.9999959221772195e-05, 'epoch': 0.06} {'loss': 0.5221, 'learning_rate': 1.9999958256641107e-05, 'epoch': 0.06} {'loss': 0.474, 'learning_rate': 1.9999957280221973e-05, 'epoch': 0.06} {'loss': 0.5211, 'learning_rate': 1.9999956292514783e-05, 'epoch': 0.06} {'loss': 0.507, 'learning_rate': 1.9999955293519547e-05, 'epoch': 0.06} {'loss': 0.383, 'learning_rate': 1.999995428323626e-05, 'epoch': 0.06} {'loss': 0.3523, 'learning_rate': 1.999995326166493e-05, 'epoch': 0.06} {'loss': 0.4788, 'learning_rate': 1.9999952228805548e-05, 'epoch': 0.06} {'loss': 0.4517, 'learning_rate': 1.9999951184658127e-05, 'epoch': 0.06} {'loss': 0.4615, 'learning_rate': 1.999995012922266e-05, 'epoch': 0.06} {'loss': 0.3096, 'learning_rate': 1.9999949062499155e-05, 'epoch': 0.06} {'loss': 0.5166, 'learning_rate': 1.9999947984487604e-05, 'epoch': 0.06} {'loss': 0.5886, 'learning_rate': 1.9999946895188018e-05, 'epoch': 0.06} {'loss': 0.4649, 'learning_rate': 1.999994579460039e-05, 'epoch': 0.06} {'loss': 0.4418, 'learning_rate': 1.9999944682724725e-05, 'epoch': 0.06} {'loss': 0.3213, 'learning_rate': 1.9999943559561026e-05, 'epoch': 0.06} {'loss': 0.4549, 'learning_rate': 1.9999942425109288e-05, 'epoch': 0.06} {'loss': 0.5056, 'learning_rate': 1.999994127936952e-05, 'epoch': 0.06} {'loss': 0.6117, 'learning_rate': 1.999994012234172e-05, 'epoch': 0.06} {'loss': 0.3745, 'learning_rate': 1.999993895402589e-05, 'epoch': 0.06} {'loss': 0.6035, 'learning_rate': 1.999993777442203e-05, 'epoch': 0.06} {'loss': 0.4771, 'learning_rate': 1.999993658353014e-05, 'epoch': 0.06} {'loss': 0.4808, 'learning_rate': 1.9999935381350225e-05, 'epoch': 0.06} {'loss': 0.4426, 'learning_rate': 1.9999934167882284e-05, 'epoch': 0.06} {'loss': 0.4578, 'learning_rate': 1.9999932943126317e-05, 'epoch': 0.06} {'loss': 0.515, 'learning_rate': 1.999993170708233e-05, 'epoch': 0.06} {'loss': 0.4696, 'learning_rate': 1.999993045975032e-05, 'epoch': 0.06} {'loss': 0.497, 'learning_rate': 1.999992920113029e-05, 'epoch': 0.06} {'loss': 0.3469, 'learning_rate': 1.9999927931222244e-05, 'epoch': 0.06} {'loss': 0.468, 'learning_rate': 1.9999926650026178e-05, 'epoch': 0.06} {'loss': 0.3924, 'learning_rate': 1.9999925357542097e-05, 'epoch': 0.06} {'loss': 0.4623, 'learning_rate': 1.9999924053770004e-05, 'epoch': 0.06} {'loss': 0.4725, 'learning_rate': 1.99999227387099e-05, 'epoch': 0.06} {'loss': 0.4647, 'learning_rate': 1.9999921412361777e-05, 'epoch': 0.06} {'loss': 0.4817, 'learning_rate': 1.9999920074725653e-05, 'epoch': 0.06} {'loss': 0.5608, 'learning_rate': 1.9999918725801513e-05, 'epoch': 0.06} {'loss': 0.471, 'learning_rate': 1.9999917365589372e-05, 'epoch': 0.06} {'loss': 0.4424, 'learning_rate': 1.9999915994089223e-05, 'epoch': 0.06} {'loss': 0.5693, 'learning_rate': 1.9999914611301072e-05, 'epoch': 0.06} {'loss': 0.5462, 'learning_rate': 1.9999913217224917e-05, 'epoch': 0.06} {'loss': 0.6066, 'learning_rate': 1.9999911811860763e-05, 'epoch': 0.06} {'loss': 0.4931, 'learning_rate': 1.999991039520861e-05, 'epoch': 0.06} {'loss': 0.5038, 'learning_rate': 1.999990896726846e-05, 'epoch': 0.06} {'loss': 0.6081, 'learning_rate': 1.9999907528040313e-05, 'epoch': 0.06} {'loss': 0.4753, 'learning_rate': 1.9999906077524173e-05, 'epoch': 0.06} {'loss': 0.5292, 'learning_rate': 1.9999904615720042e-05, 'epoch': 0.06} {'loss': 0.5783, 'learning_rate': 1.999990314262792e-05, 'epoch': 0.06} {'loss': 0.3683, 'learning_rate': 1.9999901658247807e-05, 'epoch': 0.06} {'loss': 0.5915, 'learning_rate': 1.9999900162579705e-05, 'epoch': 0.06} {'loss': 0.6, 'learning_rate': 1.9999898655623623e-05, 'epoch': 0.06} {'loss': 0.4276, 'learning_rate': 1.9999897137379552e-05, 'epoch': 0.06} {'loss': 0.529, 'learning_rate': 1.99998956078475e-05, 'epoch': 0.06} {'loss': 0.4218, 'learning_rate': 1.9999894067027467e-05, 'epoch': 0.07} {'loss': 0.5125, 'learning_rate': 1.9999892514919456e-05, 'epoch': 0.07} {'loss': 0.52, 'learning_rate': 1.9999890951523468e-05, 'epoch': 0.07} {'loss': 0.5374, 'learning_rate': 1.9999889376839505e-05, 'epoch': 0.07} {'loss': 0.4821, 'learning_rate': 1.9999887790867567e-05, 'epoch': 0.07} {'loss': 0.661, 'learning_rate': 1.999988619360766e-05, 'epoch': 0.07} {'loss': 0.4995, 'learning_rate': 1.999988458505978e-05, 'epoch': 0.07} {'loss': 0.5146, 'learning_rate': 1.9999882965223932e-05, 'epoch': 0.07} {'loss': 0.5799, 'learning_rate': 1.999988133410012e-05, 'epoch': 0.07} {'loss': 0.3518, 'learning_rate': 1.9999879691688342e-05, 'epoch': 0.07} {'loss': 0.5308, 'learning_rate': 1.9999878037988602e-05, 'epoch': 0.07} {'loss': 0.6194, 'learning_rate': 1.99998763730009e-05, 'epoch': 0.07} {'loss': 0.3617, 'learning_rate': 1.999987469672524e-05, 'epoch': 0.07} {'loss': 0.3969, 'learning_rate': 1.9999873009161624e-05, 'epoch': 0.07} {'loss': 0.5747, 'learning_rate': 1.999987131031005e-05, 'epoch': 0.07} {'loss': 0.544, 'learning_rate': 1.999986960017053e-05, 'epoch': 0.07} {'loss': 0.5742, 'learning_rate': 1.9999867878743053e-05, 'epoch': 0.07} {'loss': 0.4344, 'learning_rate': 1.9999866146027628e-05, 'epoch': 0.07} {'loss': 0.4216, 'learning_rate': 1.9999864402024252e-05, 'epoch': 0.07} {'loss': 0.7564, 'learning_rate': 1.9999862646732936e-05, 'epoch': 0.07} {'loss': 0.6035, 'learning_rate': 1.9999860880153676e-05, 'epoch': 0.07} {'loss': 0.4387, 'learning_rate': 1.9999859102286468e-05, 'epoch': 0.07} {'loss': 0.5009, 'learning_rate': 1.999985731313133e-05, 'epoch': 0.07} {'loss': 0.4768, 'learning_rate': 1.9999855512688248e-05, 'epoch': 0.07} {'loss': 0.553, 'learning_rate': 1.9999853700957236e-05, 'epoch': 0.07} {'loss': 0.5712, 'learning_rate': 1.9999851877938287e-05, 'epoch': 0.07} {'loss': 0.2445, 'learning_rate': 1.9999850043631407e-05, 'epoch': 0.07} {'loss': 0.3659, 'learning_rate': 1.9999848198036597e-05, 'epoch': 0.07} {'loss': 0.3688, 'learning_rate': 1.999984634115386e-05, 'epoch': 0.07} {'loss': 0.4611, 'learning_rate': 1.9999844472983203e-05, 'epoch': 0.07} {'loss': 0.4109, 'learning_rate': 1.999984259352462e-05, 'epoch': 0.07} {'loss': 0.3876, 'learning_rate': 1.9999840702778114e-05, 'epoch': 0.07} {'loss': 0.5112, 'learning_rate': 1.9999838800743693e-05, 'epoch': 0.07} {'loss': 0.3829, 'learning_rate': 1.9999836887421355e-05, 'epoch': 0.07} {'loss': 0.4458, 'learning_rate': 1.99998349628111e-05, 'epoch': 0.07} {'loss': 0.4506, 'learning_rate': 1.9999833026912935e-05, 'epoch': 0.07} {'loss': 0.6915, 'learning_rate': 1.999983107972686e-05, 'epoch': 0.07} {'loss': 0.4348, 'learning_rate': 1.9999829121252875e-05, 'epoch': 0.07} {'loss': 0.6776, 'learning_rate': 1.9999827151490984e-05, 'epoch': 0.07} {'loss': 0.429, 'learning_rate': 1.9999825170441192e-05, 'epoch': 0.07} {'loss': 0.5152, 'learning_rate': 1.99998231781035e-05, 'epoch': 0.07} {'loss': 0.3932, 'learning_rate': 1.999982117447791e-05, 'epoch': 0.07} {'loss': 0.5803, 'learning_rate': 1.999981915956442e-05, 'epoch': 0.07} {'loss': 0.5452, 'learning_rate': 1.9999817133363038e-05, 'epoch': 0.07} {'loss': 0.5698, 'learning_rate': 1.999981509587376e-05, 'epoch': 0.07} {'loss': 0.6008, 'learning_rate': 1.99998130470966e-05, 'epoch': 0.07} {'loss': 0.357, 'learning_rate': 1.9999810987031547e-05, 'epoch': 0.07} {'loss': 0.3942, 'learning_rate': 1.9999808915678608e-05, 'epoch': 0.07} {'loss': 0.5231, 'learning_rate': 1.999980683303779e-05, 'epoch': 0.07} {'loss': 0.4685, 'learning_rate': 1.999980473910909e-05, 'epoch': 0.07} {'loss': 0.5411, 'learning_rate': 1.9999802633892512e-05, 'epoch': 0.07} {'loss': 0.6129, 'learning_rate': 1.9999800517388058e-05, 'epoch': 0.07} {'loss': 0.6218, 'learning_rate': 1.9999798389595734e-05, 'epoch': 0.07} {'loss': 0.4765, 'learning_rate': 1.9999796250515534e-05, 'epoch': 0.07} {'loss': 0.5207, 'learning_rate': 1.9999794100147468e-05, 'epoch': 0.07} {'loss': 0.427, 'learning_rate': 1.9999791938491536e-05, 'epoch': 0.07} {'loss': 0.5039, 'learning_rate': 1.9999789765547742e-05, 'epoch': 0.07} {'loss': 0.4621, 'learning_rate': 1.9999787581316085e-05, 'epoch': 0.07} {'loss': 0.6509, 'learning_rate': 1.9999785385796565e-05, 'epoch': 0.07} {'loss': 0.6863, 'learning_rate': 1.9999783178989197e-05, 'epoch': 0.07} {'loss': 0.4865, 'learning_rate': 1.9999780960893972e-05, 'epoch': 0.07} {'loss': 0.5453, 'learning_rate': 1.9999778731510895e-05, 'epoch': 0.07} {'loss': 0.5915, 'learning_rate': 1.999977649083997e-05, 'epoch': 0.07} {'loss': 0.3852, 'learning_rate': 1.9999774238881197e-05, 'epoch': 0.07} {'loss': 0.4968, 'learning_rate': 1.9999771975634587e-05, 'epoch': 0.07} {'loss': 0.4508, 'learning_rate': 1.9999769701100127e-05, 'epoch': 0.07} {'loss': 0.4753, 'learning_rate': 1.9999767415277836e-05, 'epoch': 0.07} {'loss': 0.4905, 'learning_rate': 1.9999765118167705e-05, 'epoch': 0.07} {'loss': 0.5432, 'learning_rate': 1.999976280976974e-05, 'epoch': 0.07} {'loss': 0.6294, 'learning_rate': 1.9999760490083944e-05, 'epoch': 0.07} {'loss': 0.4273, 'learning_rate': 1.9999758159110324e-05, 'epoch': 0.07} {'loss': 0.4777, 'learning_rate': 1.9999755816848875e-05, 'epoch': 0.07} {'loss': 0.5852, 'learning_rate': 1.9999753463299608e-05, 'epoch': 0.07} {'loss': 0.5776, 'learning_rate': 1.9999751098462515e-05, 'epoch': 0.07} {'loss': 0.3974, 'learning_rate': 1.9999748722337607e-05, 'epoch': 0.07} {'loss': 0.5184, 'learning_rate': 1.9999746334924888e-05, 'epoch': 0.07} {'loss': 0.5922, 'learning_rate': 1.9999743936224353e-05, 'epoch': 0.07} {'loss': 0.408, 'learning_rate': 1.999974152623601e-05, 'epoch': 0.07} {'loss': 0.4172, 'learning_rate': 1.9999739104959858e-05, 'epoch': 0.07} {'loss': 0.501, 'learning_rate': 1.99997366723959e-05, 'epoch': 0.07} {'loss': 0.5578, 'learning_rate': 1.9999734228544147e-05, 'epoch': 0.07} {'loss': 0.5713, 'learning_rate': 1.999973177340459e-05, 'epoch': 0.07} {'loss': 0.5497, 'learning_rate': 1.9999729306977246e-05, 'epoch': 0.07} {'loss': 0.6685, 'learning_rate': 1.99997268292621e-05, 'epoch': 0.07} {'loss': 0.5498, 'learning_rate': 1.999972434025917e-05, 'epoch': 0.07} {'loss': 0.4774, 'learning_rate': 1.9999721839968447e-05, 'epoch': 0.07} {'loss': 0.4045, 'learning_rate': 1.9999719328389943e-05, 'epoch': 0.07} {'loss': 0.4375, 'learning_rate': 1.9999716805523655e-05, 'epoch': 0.07} {'loss': 0.4948, 'learning_rate': 1.9999714271369593e-05, 'epoch': 0.07} {'loss': 0.5806, 'learning_rate': 1.9999711725927752e-05, 'epoch': 0.07} {'loss': 0.5068, 'learning_rate': 1.9999709169198137e-05, 'epoch': 0.07} {'loss': 0.711, 'learning_rate': 1.9999706601180758e-05, 'epoch': 0.07} {'loss': 0.553, 'learning_rate': 1.9999704021875607e-05, 'epoch': 0.07} {'loss': 0.4503, 'learning_rate': 1.999970143128269e-05, 'epoch': 0.07} {'loss': 0.4855, 'learning_rate': 1.9999698829402013e-05, 'epoch': 0.07} {'loss': 0.5319, 'learning_rate': 1.999969621623358e-05, 'epoch': 0.07} {'loss': 0.5722, 'learning_rate': 1.999969359177739e-05, 'epoch': 0.07} {'loss': 0.5678, 'learning_rate': 1.9999690956033443e-05, 'epoch': 0.07} {'loss': 0.5835, 'learning_rate': 1.999968830900175e-05, 'epoch': 0.07} {'loss': 0.4991, 'learning_rate': 1.999968565068231e-05, 'epoch': 0.07} {'loss': 0.53, 'learning_rate': 1.999968298107513e-05, 'epoch': 0.07} {'loss': 0.4802, 'learning_rate': 1.9999680300180206e-05, 'epoch': 0.07} {'loss': 0.4955, 'learning_rate': 1.9999677607997544e-05, 'epoch': 0.07} {'loss': 0.4119, 'learning_rate': 1.9999674904527148e-05, 'epoch': 0.07} {'loss': 0.4129, 'learning_rate': 1.9999672189769025e-05, 'epoch': 0.07} {'loss': 0.5156, 'learning_rate': 1.999966946372317e-05, 'epoch': 0.07} {'loss': 0.5932, 'learning_rate': 1.999966672638959e-05, 'epoch': 0.07} {'loss': 0.6394, 'learning_rate': 1.9999663977768288e-05, 'epoch': 0.07} {'loss': 0.5521, 'learning_rate': 1.9999661217859264e-05, 'epoch': 0.07} {'loss': 0.5467, 'learning_rate': 1.9999658446662526e-05, 'epoch': 0.07} {'loss': 0.5153, 'learning_rate': 1.9999655664178075e-05, 'epoch': 0.07} {'loss': 0.5356, 'learning_rate': 1.9999652870405913e-05, 'epoch': 0.07} {'loss': 0.4221, 'learning_rate': 1.9999650065346048e-05, 'epoch': 0.07} {'loss': 0.5695, 'learning_rate': 1.9999647248998477e-05, 'epoch': 0.07} {'loss': 0.4709, 'learning_rate': 1.9999644421363205e-05, 'epoch': 0.07} {'loss': 0.4515, 'learning_rate': 1.999964158244024e-05, 'epoch': 0.07} {'loss': 0.5612, 'learning_rate': 1.999963873222958e-05, 'epoch': 0.07} {'loss': 0.5028, 'learning_rate': 1.9999635870731225e-05, 'epoch': 0.07} {'loss': 0.6533, 'learning_rate': 1.9999632997945187e-05, 'epoch': 0.07} {'loss': 0.5187, 'learning_rate': 1.9999630113871463e-05, 'epoch': 0.07} {'loss': 0.5298, 'learning_rate': 1.999962721851006e-05, 'epoch': 0.07} {'loss': 0.4892, 'learning_rate': 1.9999624311860976e-05, 'epoch': 0.07} {'loss': 0.5292, 'learning_rate': 1.999962139392422e-05, 'epoch': 0.07} {'loss': 0.5344, 'learning_rate': 1.999961846469979e-05, 'epoch': 0.07} {'loss': 0.6001, 'learning_rate': 1.99996155241877e-05, 'epoch': 0.07} {'loss': 0.3469, 'learning_rate': 1.999961257238794e-05, 'epoch': 0.07} {'loss': 0.5139, 'learning_rate': 1.999960960930052e-05, 'epoch': 0.07} {'loss': 0.6186, 'learning_rate': 1.999960663492544e-05, 'epoch': 0.07} {'loss': 0.5383, 'learning_rate': 1.9999603649262706e-05, 'epoch': 0.07} {'loss': 0.5149, 'learning_rate': 1.999960065231232e-05, 'epoch': 0.07} {'loss': 0.515, 'learning_rate': 1.999959764407429e-05, 'epoch': 0.07} {'loss': 0.4913, 'learning_rate': 1.9999594624548618e-05, 'epoch': 0.07} {'loss': 0.3657, 'learning_rate': 1.99995915937353e-05, 'epoch': 0.07} {'loss': 0.5742, 'learning_rate': 1.9999588551634345e-05, 'epoch': 0.07} {'loss': 0.6055, 'learning_rate': 1.999958549824576e-05, 'epoch': 0.07} {'loss': 0.5885, 'learning_rate': 1.9999582433569537e-05, 'epoch': 0.07} {'loss': 0.453, 'learning_rate': 1.9999579357605692e-05, 'epoch': 0.07} {'loss': 0.4079, 'learning_rate': 1.9999576270354226e-05, 'epoch': 0.07} {'loss': 0.6625, 'learning_rate': 1.9999573171815135e-05, 'epoch': 0.07} {'loss': 0.4043, 'learning_rate': 1.999957006198843e-05, 'epoch': 0.07} {'loss': 0.5012, 'learning_rate': 1.9999566940874112e-05, 'epoch': 0.07} {'loss': 0.4631, 'learning_rate': 1.9999563808472185e-05, 'epoch': 0.07} {'loss': 0.5862, 'learning_rate': 1.999956066478265e-05, 'epoch': 0.07} {'loss': 0.5227, 'learning_rate': 1.9999557509805512e-05, 'epoch': 0.07} {'loss': 0.5722, 'learning_rate': 1.9999554343540776e-05, 'epoch': 0.07} {'loss': 0.4563, 'learning_rate': 1.9999551165988446e-05, 'epoch': 0.07} {'loss': 0.364, 'learning_rate': 1.9999547977148523e-05, 'epoch': 0.07} {'loss': 0.5116, 'learning_rate': 1.999954477702101e-05, 'epoch': 0.07} {'loss': 0.4823, 'learning_rate': 1.9999541565605914e-05, 'epoch': 0.07} {'loss': 0.3669, 'learning_rate': 1.9999538342903238e-05, 'epoch': 0.07} {'loss': 0.4077, 'learning_rate': 1.9999535108912983e-05, 'epoch': 0.07} {'loss': 0.558, 'learning_rate': 1.9999531863635158e-05, 'epoch': 0.07} {'loss': 0.4459, 'learning_rate': 1.999952860706976e-05, 'epoch': 0.07} {'loss': 0.3526, 'learning_rate': 1.9999525339216796e-05, 'epoch': 0.07} {'loss': 0.5161, 'learning_rate': 1.999952206007627e-05, 'epoch': 0.07} {'loss': 0.5427, 'learning_rate': 1.9999518769648186e-05, 'epoch': 0.07} {'loss': 0.5015, 'learning_rate': 1.9999515467932545e-05, 'epoch': 0.07} {'loss': 0.5173, 'learning_rate': 1.9999512154929353e-05, 'epoch': 0.07} {'loss': 0.4758, 'learning_rate': 1.9999508830638613e-05, 'epoch': 0.07} {'loss': 0.3566, 'learning_rate': 1.999950549506033e-05, 'epoch': 0.07} {'loss': 0.4449, 'learning_rate': 1.9999502148194505e-05, 'epoch': 0.07} {'loss': 0.7023, 'learning_rate': 1.9999498790041147e-05, 'epoch': 0.07} {'loss': 0.4662, 'learning_rate': 1.999949542060025e-05, 'epoch': 0.07} {'loss': 0.5162, 'learning_rate': 1.999949203987183e-05, 'epoch': 0.07} {'loss': 0.6534, 'learning_rate': 1.9999488647855885e-05, 'epoch': 0.07} {'loss': 0.4892, 'learning_rate': 1.9999485244552415e-05, 'epoch': 0.07} {'loss': 0.4737, 'learning_rate': 1.999948182996143e-05, 'epoch': 0.07} {'loss': 0.5188, 'learning_rate': 1.999947840408293e-05, 'epoch': 0.07} {'loss': 0.5646, 'learning_rate': 1.999947496691692e-05, 'epoch': 0.07} {'loss': 0.6213, 'learning_rate': 1.9999471518463407e-05, 'epoch': 0.07} {'loss': 0.5826, 'learning_rate': 1.9999468058722392e-05, 'epoch': 0.07} {'loss': 0.4464, 'learning_rate': 1.999946458769388e-05, 'epoch': 0.07} {'loss': 0.5451, 'learning_rate': 1.9999461105377872e-05, 'epoch': 0.07} {'loss': 0.3842, 'learning_rate': 1.999945761177437e-05, 'epoch': 0.07} {'loss': 0.579, 'learning_rate': 1.999945410688339e-05, 'epoch': 0.07} {'loss': 0.4349, 'learning_rate': 1.999945059070492e-05, 'epoch': 0.07} {'loss': 0.5952, 'learning_rate': 1.9999447063238977e-05, 'epoch': 0.07} {'loss': 0.4388, 'learning_rate': 1.9999443524485557e-05, 'epoch': 0.07} {'loss': 0.5341, 'learning_rate': 1.9999439974444667e-05, 'epoch': 0.07} {'loss': 0.4193, 'learning_rate': 1.9999436413116314e-05, 'epoch': 0.07} {'loss': 0.4791, 'learning_rate': 1.9999432840500495e-05, 'epoch': 0.07} {'loss': 0.5435, 'learning_rate': 1.999942925659722e-05, 'epoch': 0.07} {'loss': 0.5282, 'learning_rate': 1.9999425661406492e-05, 'epoch': 0.07} {'loss': 0.5379, 'learning_rate': 1.999942205492831e-05, 'epoch': 0.07} {'loss': 0.3093, 'learning_rate': 1.9999418437162682e-05, 'epoch': 0.07} {'loss': 0.7555, 'learning_rate': 1.9999414808109617e-05, 'epoch': 0.07} {'loss': 0.636, 'learning_rate': 1.9999411167769106e-05, 'epoch': 0.07} {'loss': 0.5072, 'learning_rate': 1.999940751614117e-05, 'epoch': 0.07} {'loss': 0.3875, 'learning_rate': 1.9999403853225797e-05, 'epoch': 0.07} {'loss': 0.5712, 'learning_rate': 1.9999400179023006e-05, 'epoch': 0.07} {'loss': 0.4542, 'learning_rate': 1.999939649353279e-05, 'epoch': 0.07} {'loss': 0.3996, 'learning_rate': 1.9999392796755154e-05, 'epoch': 0.07} {'loss': 0.6614, 'learning_rate': 1.999938908869011e-05, 'epoch': 0.07} {'loss': 0.7083, 'learning_rate': 1.9999385369337654e-05, 'epoch': 0.07} {'loss': 0.4857, 'learning_rate': 1.9999381638697796e-05, 'epoch': 0.07} {'loss': 0.3387, 'learning_rate': 1.9999377896770533e-05, 'epoch': 0.07} {'loss': 0.617, 'learning_rate': 1.9999374143555878e-05, 'epoch': 0.07} {'loss': 0.4726, 'learning_rate': 1.9999370379053832e-05, 'epoch': 0.07} {'loss': 0.3386, 'learning_rate': 1.9999366603264394e-05, 'epoch': 0.07} {'loss': 0.3668, 'learning_rate': 1.9999362816187575e-05, 'epoch': 0.07} {'loss': 0.3679, 'learning_rate': 1.9999359017823377e-05, 'epoch': 0.07} {'loss': 0.702, 'learning_rate': 1.99993552081718e-05, 'epoch': 0.07} {'loss': 0.4881, 'learning_rate': 1.9999351387232858e-05, 'epoch': 0.07} {'loss': 0.5557, 'learning_rate': 1.9999347555006547e-05, 'epoch': 0.07} {'loss': 0.539, 'learning_rate': 1.9999343711492874e-05, 'epoch': 0.07} {'loss': 0.4645, 'learning_rate': 1.9999339856691847e-05, 'epoch': 0.07} {'loss': 0.4751, 'learning_rate': 1.9999335990603462e-05, 'epoch': 0.07} {'loss': 0.3707, 'learning_rate': 1.9999332113227733e-05, 'epoch': 0.07} {'loss': 0.4642, 'learning_rate': 1.9999328224564657e-05, 'epoch': 0.07} {'loss': 0.4155, 'learning_rate': 1.999932432461424e-05, 'epoch': 0.07} {'loss': 0.2695, 'learning_rate': 1.9999320413376488e-05, 'epoch': 0.07} {'loss': 0.4819, 'learning_rate': 1.9999316490851402e-05, 'epoch': 0.07} {'loss': 0.4519, 'learning_rate': 1.9999312557038993e-05, 'epoch': 0.07} {'loss': 0.4415, 'learning_rate': 1.999930861193926e-05, 'epoch': 0.07} {'loss': 0.4743, 'learning_rate': 1.999930465555221e-05, 'epoch': 0.07} {'loss': 0.3142, 'learning_rate': 1.9999300687877845e-05, 'epoch': 0.07} {'loss': 0.4314, 'learning_rate': 1.9999296708916174e-05, 'epoch': 0.07} {'loss': 0.4532, 'learning_rate': 1.9999292718667193e-05, 'epoch': 0.07} {'loss': 0.5017, 'learning_rate': 1.9999288717130918e-05, 'epoch': 0.07} {'loss': 0.5668, 'learning_rate': 1.9999284704307343e-05, 'epoch': 0.07} {'loss': 0.4691, 'learning_rate': 1.999928068019648e-05, 'epoch': 0.07} {'loss': 0.3883, 'learning_rate': 1.999927664479833e-05, 'epoch': 0.07} {'loss': 0.4069, 'learning_rate': 1.9999272598112895e-05, 'epoch': 0.07} {'loss': 0.6245, 'learning_rate': 1.9999268540140187e-05, 'epoch': 0.07} {'loss': 0.487, 'learning_rate': 1.9999264470880203e-05, 'epoch': 0.07} {'loss': 0.3941, 'learning_rate': 1.9999260390332952e-05, 'epoch': 0.07} {'loss': 0.3667, 'learning_rate': 1.999925629849844e-05, 'epoch': 0.07} {'loss': 0.5433, 'learning_rate': 1.9999252195376666e-05, 'epoch': 0.07} {'loss': 0.237, 'learning_rate': 1.999924808096764e-05, 'epoch': 0.07} {'loss': 0.4041, 'learning_rate': 1.999924395527136e-05, 'epoch': 0.07} {'loss': 0.6589, 'learning_rate': 1.999923981828784e-05, 'epoch': 0.07} {'loss': 0.4463, 'learning_rate': 1.9999235670017077e-05, 'epoch': 0.07} {'loss': 0.3916, 'learning_rate': 1.9999231510459078e-05, 'epoch': 0.07} {'loss': 0.5231, 'learning_rate': 1.999922733961385e-05, 'epoch': 0.07} {'loss': 0.4438, 'learning_rate': 1.9999223157481395e-05, 'epoch': 0.07} {'loss': 0.4748, 'learning_rate': 1.999921896406172e-05, 'epoch': 0.07} {'loss': 0.5154, 'learning_rate': 1.9999214759354824e-05, 'epoch': 0.07} {'loss': 0.5963, 'learning_rate': 1.999921054336072e-05, 'epoch': 0.07} {'loss': 0.5125, 'learning_rate': 1.9999206316079407e-05, 'epoch': 0.07} {'loss': 0.5618, 'learning_rate': 1.999920207751089e-05, 'epoch': 0.07} {'loss': 0.5668, 'learning_rate': 1.9999197827655176e-05, 'epoch': 0.07} {'loss': 0.5333, 'learning_rate': 1.999919356651227e-05, 'epoch': 0.07} {'loss': 0.5086, 'learning_rate': 1.999918929408218e-05, 'epoch': 0.07} {'loss': 0.5797, 'learning_rate': 1.99991850103649e-05, 'epoch': 0.07} {'loss': 0.583, 'learning_rate': 1.9999180715360444e-05, 'epoch': 0.07} {'loss': 0.5662, 'learning_rate': 1.9999176409068813e-05, 'epoch': 0.07} {'loss': 0.4563, 'learning_rate': 1.9999172091490017e-05, 'epoch': 0.07} {'loss': 0.5043, 'learning_rate': 1.9999167762624054e-05, 'epoch': 0.07} {'loss': 0.5096, 'learning_rate': 1.9999163422470932e-05, 'epoch': 0.07} {'loss': 0.3989, 'learning_rate': 1.999915907103066e-05, 'epoch': 0.07} {'loss': 0.4535, 'learning_rate': 1.9999154708303236e-05, 'epoch': 0.07} {'loss': 0.4326, 'learning_rate': 1.9999150334288667e-05, 'epoch': 0.07} {'loss': 0.6052, 'learning_rate': 1.999914594898696e-05, 'epoch': 0.07} {'loss': 0.5878, 'learning_rate': 1.999914155239812e-05, 'epoch': 0.07} {'loss': 0.5404, 'learning_rate': 1.9999137144522148e-05, 'epoch': 0.07} {'loss': 0.4628, 'learning_rate': 1.999913272535905e-05, 'epoch': 0.07} {'loss': 0.5529, 'learning_rate': 1.9999128294908835e-05, 'epoch': 0.07} {'loss': 0.6187, 'learning_rate': 1.9999123853171506e-05, 'epoch': 0.07} {'loss': 0.5033, 'learning_rate': 1.9999119400147067e-05, 'epoch': 0.07} {'loss': 0.6049, 'learning_rate': 1.9999114935835524e-05, 'epoch': 0.07} {'loss': 0.4697, 'learning_rate': 1.999911046023688e-05, 'epoch': 0.07} {'loss': 0.4845, 'learning_rate': 1.9999105973351143e-05, 'epoch': 0.07} {'loss': 0.46, 'learning_rate': 1.9999101475178317e-05, 'epoch': 0.07} {'loss': 0.4672, 'learning_rate': 1.9999096965718406e-05, 'epoch': 0.07} {'loss': 0.5856, 'learning_rate': 1.9999092444971416e-05, 'epoch': 0.07} {'loss': 0.4466, 'learning_rate': 1.9999087912937353e-05, 'epoch': 0.07} {'loss': 0.3917, 'learning_rate': 1.999908336961622e-05, 'epoch': 0.07} {'loss': 0.3387, 'learning_rate': 1.9999078815008027e-05, 'epoch': 0.07} {'loss': 0.4868, 'learning_rate': 1.9999074249112768e-05, 'epoch': 0.07} {'loss': 0.6777, 'learning_rate': 1.9999069671930463e-05, 'epoch': 0.07} {'loss': 0.4674, 'learning_rate': 1.9999065083461105e-05, 'epoch': 0.07} {'loss': 0.5404, 'learning_rate': 1.9999060483704707e-05, 'epoch': 0.07} {'loss': 0.5256, 'learning_rate': 1.999905587266127e-05, 'epoch': 0.07} {'loss': 0.4094, 'learning_rate': 1.99990512503308e-05, 'epoch': 0.07} {'loss': 0.4327, 'learning_rate': 1.9999046616713303e-05, 'epoch': 0.07} {'loss': 0.3476, 'learning_rate': 1.9999041971808783e-05, 'epoch': 0.07} {'loss': 0.634, 'learning_rate': 1.9999037315617243e-05, 'epoch': 0.07} {'loss': 0.4395, 'learning_rate': 1.99990326481387e-05, 'epoch': 0.07} {'loss': 0.5747, 'learning_rate': 1.9999027969373145e-05, 'epoch': 0.07} {'loss': 0.498, 'learning_rate': 1.9999023279320586e-05, 'epoch': 0.07} {'loss': 0.6891, 'learning_rate': 1.9999018577981035e-05, 'epoch': 0.07} {'loss': 0.583, 'learning_rate': 1.9999013865354492e-05, 'epoch': 0.07} {'loss': 0.4726, 'learning_rate': 1.9999009141440967e-05, 'epoch': 0.07} {'loss': 0.5012, 'learning_rate': 1.9999004406240458e-05, 'epoch': 0.07} {'loss': 0.336, 'learning_rate': 1.9998999659752977e-05, 'epoch': 0.07} {'loss': 0.4501, 'learning_rate': 1.9998994901978524e-05, 'epoch': 0.07} {'loss': 0.49, 'learning_rate': 1.999899013291711e-05, 'epoch': 0.07} {'loss': 0.4719, 'learning_rate': 1.9998985352568735e-05, 'epoch': 0.07} {'loss': 0.6416, 'learning_rate': 1.999898056093341e-05, 'epoch': 0.07} {'loss': 0.5442, 'learning_rate': 1.9998975758011134e-05, 'epoch': 0.07} {'loss': 0.4087, 'learning_rate': 1.999897094380192e-05, 'epoch': 0.07} {'loss': 0.5211, 'learning_rate': 1.9998966118305766e-05, 'epoch': 0.07} {'loss': 0.4768, 'learning_rate': 1.999896128152268e-05, 'epoch': 0.07} {'loss': 0.6222, 'learning_rate': 1.999895643345267e-05, 'epoch': 0.07} {'loss': 0.4931, 'learning_rate': 1.999895157409574e-05, 'epoch': 0.07} {'loss': 0.7724, 'learning_rate': 1.9998946703451893e-05, 'epoch': 0.07} {'loss': 0.5821, 'learning_rate': 1.9998941821521136e-05, 'epoch': 0.07} {'loss': 0.5472, 'learning_rate': 1.9998936928303476e-05, 'epoch': 0.07} {'loss': 0.5314, 'learning_rate': 1.999893202379892e-05, 'epoch': 0.07} {'loss': 0.624, 'learning_rate': 1.9998927108007468e-05, 'epoch': 0.07} {'loss': 0.5063, 'learning_rate': 1.9998922180929134e-05, 'epoch': 0.07} {'loss': 0.4628, 'learning_rate': 1.9998917242563913e-05, 'epoch': 0.07} {'loss': 0.2738, 'learning_rate': 1.9998912292911815e-05, 'epoch': 0.07} {'loss': 0.6051, 'learning_rate': 1.999890733197285e-05, 'epoch': 0.07} {'loss': 0.542, 'learning_rate': 1.9998902359747017e-05, 'epoch': 0.07} {'loss': 0.5584, 'learning_rate': 1.9998897376234326e-05, 'epoch': 0.07} {'loss': 0.6776, 'learning_rate': 1.999889238143478e-05, 'epoch': 0.07} {'loss': 0.3393, 'learning_rate': 1.9998887375348387e-05, 'epoch': 0.07} {'loss': 0.5067, 'learning_rate': 1.9998882357975155e-05, 'epoch': 0.07} {'loss': 0.5398, 'learning_rate': 1.9998877329315083e-05, 'epoch': 0.07} {'loss': 0.346, 'learning_rate': 1.999887228936818e-05, 'epoch': 0.07} {'loss': 0.5445, 'learning_rate': 1.999886723813445e-05, 'epoch': 0.07} {'loss': 0.4171, 'learning_rate': 1.99988621756139e-05, 'epoch': 0.07} {'loss': 0.4889, 'learning_rate': 1.9998857101806538e-05, 'epoch': 0.07} {'loss': 0.4743, 'learning_rate': 1.9998852016712368e-05, 'epoch': 0.07} {'loss': 0.4629, 'learning_rate': 1.9998846920331396e-05, 'epoch': 0.07} {'loss': 0.519, 'learning_rate': 1.9998841812663624e-05, 'epoch': 0.07} {'loss': 0.5296, 'learning_rate': 1.9998836693709065e-05, 'epoch': 0.07} {'loss': 0.58, 'learning_rate': 1.9998831563467716e-05, 'epoch': 0.07} {'loss': 0.4406, 'learning_rate': 1.999882642193959e-05, 'epoch': 0.07} {'loss': 0.5853, 'learning_rate': 1.999882126912469e-05, 'epoch': 0.07} {'loss': 0.5648, 'learning_rate': 1.9998816105023025e-05, 'epoch': 0.07} {'loss': 0.4579, 'learning_rate': 1.9998810929634597e-05, 'epoch': 0.07} {'loss': 0.5214, 'learning_rate': 1.9998805742959408e-05, 'epoch': 0.07} {'loss': 0.3809, 'learning_rate': 1.999880054499747e-05, 'epoch': 0.07} {'loss': 0.5885, 'learning_rate': 1.9998795335748792e-05, 'epoch': 0.07} {'loss': 0.5319, 'learning_rate': 1.9998790115213372e-05, 'epoch': 0.07} {'loss': 0.6558, 'learning_rate': 1.9998784883391222e-05, 'epoch': 0.07} {'loss': 0.4205, 'learning_rate': 1.9998779640282344e-05, 'epoch': 0.07} {'loss': 0.4987, 'learning_rate': 1.9998774385886745e-05, 'epoch': 0.07} {'loss': 0.5413, 'learning_rate': 1.9998769120204432e-05, 'epoch': 0.07} {'loss': 0.506, 'learning_rate': 1.999876384323541e-05, 'epoch': 0.07} {'loss': 0.6144, 'learning_rate': 1.999875855497968e-05, 'epoch': 0.07} {'loss': 0.5066, 'learning_rate': 1.9998753255437256e-05, 'epoch': 0.07} {'loss': 0.6082, 'learning_rate': 1.9998747944608145e-05, 'epoch': 0.07} {'loss': 0.4424, 'learning_rate': 1.9998742622492343e-05, 'epoch': 0.07} {'loss': 0.545, 'learning_rate': 1.9998737289089868e-05, 'epoch': 0.07} {'loss': 0.4015, 'learning_rate': 1.9998731944400713e-05, 'epoch': 0.07} {'loss': 0.4807, 'learning_rate': 1.9998726588424895e-05, 'epoch': 0.07} {'loss': 0.6898, 'learning_rate': 1.9998721221162416e-05, 'epoch': 0.07} {'loss': 0.453, 'learning_rate': 1.999871584261328e-05, 'epoch': 0.07} {'loss': 0.4745, 'learning_rate': 1.9998710452777497e-05, 'epoch': 0.07} {'loss': 0.5061, 'learning_rate': 1.9998705051655074e-05, 'epoch': 0.07} {'loss': 0.6646, 'learning_rate': 1.999869963924601e-05, 'epoch': 0.07} {'loss': 0.6663, 'learning_rate': 1.9998694215550318e-05, 'epoch': 0.07} {'loss': 0.5522, 'learning_rate': 1.9998688780568e-05, 'epoch': 0.07} {'loss': 0.4582, 'learning_rate': 1.999868333429906e-05, 'epoch': 0.07} {'loss': 0.5336, 'learning_rate': 1.9998677876743515e-05, 'epoch': 0.07} {'loss': 0.5984, 'learning_rate': 1.999867240790136e-05, 'epoch': 0.07} {'loss': 0.6799, 'learning_rate': 1.9998666927772605e-05, 'epoch': 0.07} {'loss': 0.5756, 'learning_rate': 1.999866143635726e-05, 'epoch': 0.07} {'loss': 0.3402, 'learning_rate': 1.9998655933655323e-05, 'epoch': 0.07} {'loss': 0.4673, 'learning_rate': 1.9998650419666806e-05, 'epoch': 0.07} {'loss': 0.4857, 'learning_rate': 1.9998644894391717e-05, 'epoch': 0.07} {'loss': 0.3233, 'learning_rate': 1.999863935783006e-05, 'epoch': 0.07} {'loss': 0.5093, 'learning_rate': 1.9998633809981834e-05, 'epoch': 0.07} {'loss': 0.5195, 'learning_rate': 1.9998628250847058e-05, 'epoch': 0.07} {'loss': 0.5948, 'learning_rate': 1.999862268042573e-05, 'epoch': 0.07} {'loss': 0.5393, 'learning_rate': 1.9998617098717856e-05, 'epoch': 0.07} {'loss': 0.5224, 'learning_rate': 1.9998611505723446e-05, 'epoch': 0.07} {'loss': 0.5667, 'learning_rate': 1.9998605901442504e-05, 'epoch': 0.07} {'loss': 0.5709, 'learning_rate': 1.9998600285875038e-05, 'epoch': 0.07} {'loss': 0.5133, 'learning_rate': 1.9998594659021054e-05, 'epoch': 0.07} {'loss': 0.4897, 'learning_rate': 1.999858902088056e-05, 'epoch': 0.07} {'loss': 0.519, 'learning_rate': 1.999858337145356e-05, 'epoch': 0.07} {'loss': 0.5207, 'learning_rate': 1.9998577710740056e-05, 'epoch': 0.07} {'loss': 0.4825, 'learning_rate': 1.9998572038740064e-05, 'epoch': 0.07} {'loss': 0.6262, 'learning_rate': 1.999856635545358e-05, 'epoch': 0.07} {'loss': 0.5075, 'learning_rate': 1.999856066088062e-05, 'epoch': 0.07} {'loss': 0.5354, 'learning_rate': 1.9998554955021187e-05, 'epoch': 0.07} {'loss': 0.5649, 'learning_rate': 1.9998549237875284e-05, 'epoch': 0.07} {'loss': 0.4427, 'learning_rate': 1.9998543509442924e-05, 'epoch': 0.07} {'loss': 0.4014, 'learning_rate': 1.9998537769724107e-05, 'epoch': 0.07} {'loss': 0.6569, 'learning_rate': 1.999853201871884e-05, 'epoch': 0.07} {'loss': 0.434, 'learning_rate': 1.999852625642714e-05, 'epoch': 0.07} {'loss': 0.4464, 'learning_rate': 1.9998520482848997e-05, 'epoch': 0.07} {'loss': 0.4351, 'learning_rate': 1.999851469798443e-05, 'epoch': 0.07} {'loss': 0.5388, 'learning_rate': 1.9998508901833435e-05, 'epoch': 0.07} {'loss': 0.3372, 'learning_rate': 1.999850309439603e-05, 'epoch': 0.07} {'loss': 0.6625, 'learning_rate': 1.9998497275672216e-05, 'epoch': 0.07} {'loss': 0.5228, 'learning_rate': 1.9998491445662e-05, 'epoch': 0.07} {'loss': 0.6206, 'learning_rate': 1.9998485604365388e-05, 'epoch': 0.07} {'loss': 0.4165, 'learning_rate': 1.9998479751782386e-05, 'epoch': 0.07} {'loss': 0.4714, 'learning_rate': 1.9998473887913005e-05, 'epoch': 0.07} {'loss': 0.5604, 'learning_rate': 1.9998468012757245e-05, 'epoch': 0.07} {'loss': 0.6334, 'learning_rate': 1.9998462126315114e-05, 'epoch': 0.07} {'loss': 0.5148, 'learning_rate': 1.9998456228586625e-05, 'epoch': 0.07} {'loss': 0.4476, 'learning_rate': 1.9998450319571777e-05, 'epoch': 0.07} {'loss': 0.5617, 'learning_rate': 1.999844439927058e-05, 'epoch': 0.07} {'loss': 0.5572, 'learning_rate': 1.9998438467683044e-05, 'epoch': 0.07} {'loss': 0.368, 'learning_rate': 1.9998432524809172e-05, 'epoch': 0.07} {'loss': 0.3648, 'learning_rate': 1.999842657064897e-05, 'epoch': 0.07} {'loss': 0.3806, 'learning_rate': 1.999842060520244e-05, 'epoch': 0.07} {'loss': 0.5626, 'learning_rate': 1.99984146284696e-05, 'epoch': 0.07} {'loss': 0.4582, 'learning_rate': 1.9998408640450454e-05, 'epoch': 0.07} {'loss': 0.4962, 'learning_rate': 1.9998402641145e-05, 'epoch': 0.07} {'loss': 0.4466, 'learning_rate': 1.9998396630553254e-05, 'epoch': 0.07} {'loss': 0.5245, 'learning_rate': 1.9998390608675217e-05, 'epoch': 0.07} {'loss': 0.6064, 'learning_rate': 1.99983845755109e-05, 'epoch': 0.07} {'loss': 0.5158, 'learning_rate': 1.9998378531060308e-05, 'epoch': 0.07} {'loss': 0.472, 'learning_rate': 1.999837247532345e-05, 'epoch': 0.07} {'loss': 0.5688, 'learning_rate': 1.9998366408300328e-05, 'epoch': 0.07} {'loss': 0.4643, 'learning_rate': 1.999836032999095e-05, 'epoch': 0.07} {'loss': 0.4347, 'learning_rate': 1.999835424039533e-05, 'epoch': 0.07} {'loss': 0.5234, 'learning_rate': 1.9998348139513464e-05, 'epoch': 0.07} {'loss': 0.3814, 'learning_rate': 1.9998342027345364e-05, 'epoch': 0.07} {'loss': 0.5451, 'learning_rate': 1.999833590389104e-05, 'epoch': 0.07} {'loss': 0.5797, 'learning_rate': 1.9998329769150494e-05, 'epoch': 0.07} {'loss': 0.4924, 'learning_rate': 1.999832362312374e-05, 'epoch': 0.07} {'loss': 0.3785, 'learning_rate': 1.9998317465810775e-05, 'epoch': 0.07} {'loss': 0.6707, 'learning_rate': 1.999831129721161e-05, 'epoch': 0.07} {'loss': 0.6145, 'learning_rate': 1.9998305117326255e-05, 'epoch': 0.07} {'loss': 0.4824, 'learning_rate': 1.9998298926154714e-05, 'epoch': 0.07} {'loss': 0.4537, 'learning_rate': 1.9998292723696998e-05, 'epoch': 0.07} {'loss': 0.5902, 'learning_rate': 1.999828650995311e-05, 'epoch': 0.07} {'loss': 0.452, 'learning_rate': 1.9998280284923056e-05, 'epoch': 0.07} {'loss': 0.5112, 'learning_rate': 1.9998274048606844e-05, 'epoch': 0.07} {'loss': 0.3588, 'learning_rate': 1.999826780100448e-05, 'epoch': 0.07} {'loss': 0.7909, 'learning_rate': 1.999826154211598e-05, 'epoch': 0.07} {'loss': 0.5973, 'learning_rate': 1.999825527194134e-05, 'epoch': 0.07} {'loss': 0.5802, 'learning_rate': 1.9998248990480568e-05, 'epoch': 0.07} {'loss': 0.5507, 'learning_rate': 1.9998242697733676e-05, 'epoch': 0.07} {'loss': 0.3448, 'learning_rate': 1.999823639370067e-05, 'epoch': 0.07} {'loss': 0.496, 'learning_rate': 1.999823007838156e-05, 'epoch': 0.07} {'loss': 0.5336, 'learning_rate': 1.999822375177634e-05, 'epoch': 0.07} {'loss': 0.5458, 'learning_rate': 1.9998217413885036e-05, 'epoch': 0.07} {'loss': 0.4578, 'learning_rate': 1.9998211064707643e-05, 'epoch': 0.07} {'loss': 0.4959, 'learning_rate': 1.9998204704244167e-05, 'epoch': 0.07} {'loss': 0.6598, 'learning_rate': 1.9998198332494624e-05, 'epoch': 0.07} {'loss': 0.4838, 'learning_rate': 1.9998191949459014e-05, 'epoch': 0.07} {'loss': 0.4664, 'learning_rate': 1.9998185555137347e-05, 'epoch': 0.07} {'loss': 0.5191, 'learning_rate': 1.999817914952963e-05, 'epoch': 0.07} {'loss': 0.6203, 'learning_rate': 1.9998172732635874e-05, 'epoch': 0.07} {'loss': 0.4683, 'learning_rate': 1.9998166304456074e-05, 'epoch': 0.07} {'loss': 0.514, 'learning_rate': 1.999815986499025e-05, 'epoch': 0.07} {'loss': 0.5208, 'learning_rate': 1.9998153414238403e-05, 'epoch': 0.07} {'loss': 0.4354, 'learning_rate': 1.9998146952200544e-05, 'epoch': 0.07} {'loss': 0.565, 'learning_rate': 1.999814047887668e-05, 'epoch': 0.07} {'loss': 0.6505, 'learning_rate': 1.9998133994266814e-05, 'epoch': 0.07} {'loss': 0.5679, 'learning_rate': 1.9998127498370955e-05, 'epoch': 0.07} {'loss': 0.4383, 'learning_rate': 1.9998120991189114e-05, 'epoch': 0.07} {'loss': 0.4922, 'learning_rate': 1.9998114472721294e-05, 'epoch': 0.07} {'loss': 0.4159, 'learning_rate': 1.9998107942967502e-05, 'epoch': 0.07} {'loss': 0.598, 'learning_rate': 1.9998101401927752e-05, 'epoch': 0.07} {'loss': 0.5958, 'learning_rate': 1.9998094849602047e-05, 'epoch': 0.07} {'loss': 0.387, 'learning_rate': 1.999808828599039e-05, 'epoch': 0.07} {'loss': 0.5845, 'learning_rate': 1.999808171109279e-05, 'epoch': 0.07} {'loss': 0.6887, 'learning_rate': 1.9998075124909264e-05, 'epoch': 0.07} {'loss': 0.5311, 'learning_rate': 1.999806852743981e-05, 'epoch': 0.07} {'loss': 0.5222, 'learning_rate': 1.9998061918684437e-05, 'epoch': 0.07} {'loss': 0.5174, 'learning_rate': 1.9998055298643154e-05, 'epoch': 0.07} {'loss': 0.5339, 'learning_rate': 1.9998048667315966e-05, 'epoch': 0.07} {'loss': 0.5695, 'learning_rate': 1.9998042024702885e-05, 'epoch': 0.07} {'loss': 0.6826, 'learning_rate': 1.9998035370803916e-05, 'epoch': 0.07} {'loss': 0.505, 'learning_rate': 1.9998028705619063e-05, 'epoch': 0.07} {'loss': 0.2836, 'learning_rate': 1.999802202914834e-05, 'epoch': 0.07} {'loss': 0.4923, 'learning_rate': 1.999801534139175e-05, 'epoch': 0.07} {'loss': 0.5759, 'learning_rate': 1.99980086423493e-05, 'epoch': 0.07} {'loss': 0.6858, 'learning_rate': 1.9998001932021e-05, 'epoch': 0.07} {'loss': 0.692, 'learning_rate': 1.9997995210406857e-05, 'epoch': 0.07} {'loss': 0.488, 'learning_rate': 1.9997988477506883e-05, 'epoch': 0.07} {'loss': 0.3726, 'learning_rate': 1.9997981733321077e-05, 'epoch': 0.07} {'loss': 0.4819, 'learning_rate': 1.999797497784945e-05, 'epoch': 0.07} {'loss': 0.4684, 'learning_rate': 1.9997968211092015e-05, 'epoch': 0.07} {'loss': 0.6372, 'learning_rate': 1.9997961433048773e-05, 'epoch': 0.07} {'loss': 0.5988, 'learning_rate': 1.9997954643719732e-05, 'epoch': 0.07} {'loss': 0.5269, 'learning_rate': 1.9997947843104902e-05, 'epoch': 0.07} {'loss': 0.4592, 'learning_rate': 1.999794103120429e-05, 'epoch': 0.07} {'loss': 0.5691, 'learning_rate': 1.9997934208017905e-05, 'epoch': 0.07} {'loss': 0.4094, 'learning_rate': 1.9997927373545752e-05, 'epoch': 0.07} {'loss': 0.5985, 'learning_rate': 1.999792052778784e-05, 'epoch': 0.07} {'loss': 0.4602, 'learning_rate': 1.999791367074418e-05, 'epoch': 0.07} {'loss': 0.5061, 'learning_rate': 1.9997906802414775e-05, 'epoch': 0.07} {'loss': 0.5872, 'learning_rate': 1.9997899922799635e-05, 'epoch': 0.07} {'loss': 0.4802, 'learning_rate': 1.9997893031898764e-05, 'epoch': 0.07} {'loss': 0.4173, 'learning_rate': 1.9997886129712175e-05, 'epoch': 0.07} {'loss': 0.5068, 'learning_rate': 1.9997879216239874e-05, 'epoch': 0.07} {'loss': 0.5127, 'learning_rate': 1.999787229148187e-05, 'epoch': 0.07} {'loss': 0.6579, 'learning_rate': 1.9997865355438167e-05, 'epoch': 0.07} {'loss': 0.4169, 'learning_rate': 1.9997858408108777e-05, 'epoch': 0.07} {'loss': 0.6492, 'learning_rate': 1.9997851449493707e-05, 'epoch': 0.07} {'loss': 0.7274, 'learning_rate': 1.999784447959296e-05, 'epoch': 0.07} {'loss': 0.6503, 'learning_rate': 1.999783749840655e-05, 'epoch': 0.08} {'loss': 0.4249, 'learning_rate': 1.9997830505934483e-05, 'epoch': 0.08} {'loss': 0.5658, 'learning_rate': 1.9997823502176764e-05, 'epoch': 0.08} {'loss': 0.528, 'learning_rate': 1.9997816487133406e-05, 'epoch': 0.08} {'loss': 0.4111, 'learning_rate': 1.9997809460804414e-05, 'epoch': 0.08} {'loss': 0.468, 'learning_rate': 1.9997802423189796e-05, 'epoch': 0.08} {'loss': 0.48, 'learning_rate': 1.9997795374289558e-05, 'epoch': 0.08} {'loss': 0.3488, 'learning_rate': 1.9997788314103714e-05, 'epoch': 0.08} {'loss': 0.4978, 'learning_rate': 1.9997781242632267e-05, 'epoch': 0.08} {'loss': 0.5566, 'learning_rate': 1.9997774159875225e-05, 'epoch': 0.08} {'loss': 0.6347, 'learning_rate': 1.99977670658326e-05, 'epoch': 0.08} {'loss': 0.5819, 'learning_rate': 1.9997759960504393e-05, 'epoch': 0.08} {'loss': 0.729, 'learning_rate': 1.999775284389062e-05, 'epoch': 0.08} {'loss': 0.4264, 'learning_rate': 1.9997745715991282e-05, 'epoch': 0.08} {'loss': 0.4792, 'learning_rate': 1.999773857680639e-05, 'epoch': 0.08} {'loss': 0.5285, 'learning_rate': 1.9997731426335956e-05, 'epoch': 0.08} {'loss': 0.4552, 'learning_rate': 1.999772426457998e-05, 'epoch': 0.08} {'loss': 0.4915, 'learning_rate': 1.9997717091538478e-05, 'epoch': 0.08} {'loss': 0.6141, 'learning_rate': 1.9997709907211455e-05, 'epoch': 0.08} {'loss': 0.3504, 'learning_rate': 1.9997702711598913e-05, 'epoch': 0.08} {'loss': 0.5012, 'learning_rate': 1.999769550470087e-05, 'epoch': 0.08} {'loss': 0.6556, 'learning_rate': 1.999768828651733e-05, 'epoch': 0.08} {'loss': 0.3326, 'learning_rate': 1.9997681057048304e-05, 'epoch': 0.08} {'loss': 0.5396, 'learning_rate': 1.9997673816293792e-05, 'epoch': 0.08} {'loss': 0.7094, 'learning_rate': 1.999766656425381e-05, 'epoch': 0.08} {'loss': 0.5391, 'learning_rate': 1.999765930092836e-05, 'epoch': 0.08} {'loss': 0.493, 'learning_rate': 1.999765202631746e-05, 'epoch': 0.08} {'loss': 0.6283, 'learning_rate': 1.9997644740421108e-05, 'epoch': 0.08} {'loss': 0.6122, 'learning_rate': 1.999763744323932e-05, 'epoch': 0.08} {'loss': 0.375, 'learning_rate': 1.9997630134772095e-05, 'epoch': 0.08} {'loss': 0.6179, 'learning_rate': 1.9997622815019452e-05, 'epoch': 0.08} {'loss': 0.5252, 'learning_rate': 1.999761548398139e-05, 'epoch': 0.08} {'loss': 0.4034, 'learning_rate': 1.999760814165792e-05, 'epoch': 0.08} {'loss': 0.4647, 'learning_rate': 1.9997600788049056e-05, 'epoch': 0.08} {'loss': 0.4924, 'learning_rate': 1.9997593423154798e-05, 'epoch': 0.08} {'loss': 0.4897, 'learning_rate': 1.999758604697516e-05, 'epoch': 0.08} {'loss': 0.5691, 'learning_rate': 1.999757865951015e-05, 'epoch': 0.08} {'loss': 0.5682, 'learning_rate': 1.999757126075977e-05, 'epoch': 0.08} {'loss': 0.5498, 'learning_rate': 1.999756385072404e-05, 'epoch': 0.08} {'loss': 0.4209, 'learning_rate': 1.999755642940296e-05, 'epoch': 0.08} {'loss': 0.6377, 'learning_rate': 1.9997548996796535e-05, 'epoch': 0.08} {'loss': 0.4586, 'learning_rate': 1.9997541552904783e-05, 'epoch': 0.08} {'loss': 0.6214, 'learning_rate': 1.9997534097727703e-05, 'epoch': 0.08} {'loss': 0.4813, 'learning_rate': 1.999752663126531e-05, 'epoch': 0.08} {'loss': 0.599, 'learning_rate': 1.9997519153517615e-05, 'epoch': 0.08} {'loss': 0.4975, 'learning_rate': 1.9997511664484618e-05, 'epoch': 0.08} {'loss': 0.4392, 'learning_rate': 1.999750416416633e-05, 'epoch': 0.08} {'loss': 0.6242, 'learning_rate': 1.9997496652562763e-05, 'epoch': 0.08} {'loss': 0.565, 'learning_rate': 1.9997489129673923e-05, 'epoch': 0.08} {'loss': 0.4583, 'learning_rate': 1.9997481595499823e-05, 'epoch': 0.08} {'loss': 0.5315, 'learning_rate': 1.9997474050040462e-05, 'epoch': 0.08} {'loss': 0.6542, 'learning_rate': 1.9997466493295854e-05, 'epoch': 0.08} {'loss': 0.4155, 'learning_rate': 1.999745892526601e-05, 'epoch': 0.08} {'loss': 0.548, 'learning_rate': 1.9997451345950935e-05, 'epoch': 0.08} {'loss': 0.5151, 'learning_rate': 1.999744375535064e-05, 'epoch': 0.08} {'loss': 0.3882, 'learning_rate': 1.999743615346513e-05, 'epoch': 0.08} {'loss': 0.4695, 'learning_rate': 1.9997428540294415e-05, 'epoch': 0.08} {'loss': 0.5839, 'learning_rate': 1.9997420915838505e-05, 'epoch': 0.08} {'loss': 0.5919, 'learning_rate': 1.999741328009741e-05, 'epoch': 0.08} {'loss': 0.394, 'learning_rate': 1.9997405633071134e-05, 'epoch': 0.08} {'loss': 0.491, 'learning_rate': 1.999739797475969e-05, 'epoch': 0.08} {'loss': 0.455, 'learning_rate': 1.9997390305163083e-05, 'epoch': 0.08} {'loss': 0.5241, 'learning_rate': 1.9997382624281324e-05, 'epoch': 0.08} {'loss': 0.3583, 'learning_rate': 1.999737493211442e-05, 'epoch': 0.08} {'loss': 0.3834, 'learning_rate': 1.999736722866238e-05, 'epoch': 0.08} {'loss': 0.5249, 'learning_rate': 1.999735951392522e-05, 'epoch': 0.08} {'loss': 0.4519, 'learning_rate': 1.9997351787902938e-05, 'epoch': 0.08} {'loss': 0.5718, 'learning_rate': 1.9997344050595544e-05, 'epoch': 0.08} {'loss': 0.6188, 'learning_rate': 1.9997336302003056e-05, 'epoch': 0.08} {'loss': 0.571, 'learning_rate': 1.999732854212547e-05, 'epoch': 0.08} {'loss': 0.5969, 'learning_rate': 1.9997320770962806e-05, 'epoch': 0.08} {'loss': 0.545, 'learning_rate': 1.999731298851506e-05, 'epoch': 0.08} {'loss': 0.5274, 'learning_rate': 1.999730519478226e-05, 'epoch': 0.08} {'loss': 0.4278, 'learning_rate': 1.9997297389764397e-05, 'epoch': 0.08} {'loss': 0.458, 'learning_rate': 1.9997289573461484e-05, 'epoch': 0.08} {'loss': 0.457, 'learning_rate': 1.9997281745873538e-05, 'epoch': 0.08} {'loss': 0.5048, 'learning_rate': 1.999727390700056e-05, 'epoch': 0.08} {'loss': 0.5307, 'learning_rate': 1.9997266056842558e-05, 'epoch': 0.08} {'loss': 0.5806, 'learning_rate': 1.9997258195399548e-05, 'epoch': 0.08} {'loss': 0.7301, 'learning_rate': 1.9997250322671532e-05, 'epoch': 0.08} {'loss': 0.6599, 'learning_rate': 1.9997242438658523e-05, 'epoch': 0.08} {'loss': 0.59, 'learning_rate': 1.9997234543360528e-05, 'epoch': 0.08} {'loss': 0.5417, 'learning_rate': 1.9997226636777554e-05, 'epoch': 0.08} {'loss': 0.4467, 'learning_rate': 1.9997218718909614e-05, 'epoch': 0.08} {'loss': 0.5211, 'learning_rate': 1.9997210789756714e-05, 'epoch': 0.08} {'loss': 0.4435, 'learning_rate': 1.9997202849318867e-05, 'epoch': 0.08} {'loss': 0.439, 'learning_rate': 1.9997194897596073e-05, 'epoch': 0.08} {'loss': 0.4583, 'learning_rate': 1.9997186934588355e-05, 'epoch': 0.08} {'loss': 0.4412, 'learning_rate': 1.9997178960295708e-05, 'epoch': 0.08} {'loss': 0.4551, 'learning_rate': 1.9997170974718153e-05, 'epoch': 0.08} {'loss': 0.5126, 'learning_rate': 1.9997162977855687e-05, 'epoch': 0.08} {'loss': 0.3788, 'learning_rate': 1.999715496970833e-05, 'epoch': 0.08} {'loss': 0.4277, 'learning_rate': 1.999714695027608e-05, 'epoch': 0.08} {'loss': 0.4821, 'learning_rate': 1.9997138919558953e-05, 'epoch': 0.08} {'loss': 0.3748, 'learning_rate': 1.999713087755696e-05, 'epoch': 0.08} {'loss': 0.5876, 'learning_rate': 1.999712282427011e-05, 'epoch': 0.08} {'loss': 0.3676, 'learning_rate': 1.9997114759698406e-05, 'epoch': 0.08} {'loss': 0.5731, 'learning_rate': 1.9997106683841857e-05, 'epoch': 0.08} {'loss': 0.5551, 'learning_rate': 1.999709859670048e-05, 'epoch': 0.08} {'loss': 0.498, 'learning_rate': 1.999709049827428e-05, 'epoch': 0.08} {'loss': 0.4194, 'learning_rate': 1.9997082388563265e-05, 'epoch': 0.08} {'loss': 0.5072, 'learning_rate': 1.9997074267567446e-05, 'epoch': 0.08} {'loss': 0.425, 'learning_rate': 1.9997066135286827e-05, 'epoch': 0.08} {'loss': 0.5955, 'learning_rate': 1.9997057991721426e-05, 'epoch': 0.08} {'loss': 0.38, 'learning_rate': 1.9997049836871248e-05, 'epoch': 0.08} {'loss': 0.5037, 'learning_rate': 1.9997041670736298e-05, 'epoch': 0.08} {'loss': 0.5004, 'learning_rate': 1.999703349331659e-05, 'epoch': 0.08} {'loss': 0.5524, 'learning_rate': 1.9997025304612133e-05, 'epoch': 0.08} {'loss': 0.6126, 'learning_rate': 1.9997017104622936e-05, 'epoch': 0.08} {'loss': 0.5056, 'learning_rate': 1.9997008893349007e-05, 'epoch': 0.08} {'loss': 0.5235, 'learning_rate': 1.9997000670790357e-05, 'epoch': 0.08} {'loss': 0.4082, 'learning_rate': 1.9996992436946994e-05, 'epoch': 0.08} {'loss': 0.6189, 'learning_rate': 1.9996984191818927e-05, 'epoch': 0.08} {'loss': 0.6065, 'learning_rate': 1.9996975935406168e-05, 'epoch': 0.08} {'loss': 0.5238, 'learning_rate': 1.9996967667708718e-05, 'epoch': 0.08} {'loss': 0.4731, 'learning_rate': 1.9996959388726597e-05, 'epoch': 0.08} {'loss': 0.5927, 'learning_rate': 1.999695109845981e-05, 'epoch': 0.08} {'loss': 0.594, 'learning_rate': 1.9996942796908366e-05, 'epoch': 0.08} {'loss': 0.5376, 'learning_rate': 1.9996934484072273e-05, 'epoch': 0.08} {'loss': 0.5142, 'learning_rate': 1.9996926159951543e-05, 'epoch': 0.08} {'loss': 0.6801, 'learning_rate': 1.9996917824546186e-05, 'epoch': 0.08} {'loss': 0.4322, 'learning_rate': 1.999690947785621e-05, 'epoch': 0.08} {'loss': 0.6201, 'learning_rate': 1.999690111988162e-05, 'epoch': 0.08} {'loss': 0.5501, 'learning_rate': 1.999689275062243e-05, 'epoch': 0.08} {'loss': 0.5263, 'learning_rate': 1.9996884370078654e-05, 'epoch': 0.08} {'loss': 0.5554, 'learning_rate': 1.9996875978250294e-05, 'epoch': 0.08} {'loss': 0.5991, 'learning_rate': 1.999686757513736e-05, 'epoch': 0.08} {'loss': 0.4143, 'learning_rate': 1.9996859160739866e-05, 'epoch': 0.08} {'loss': 0.4864, 'learning_rate': 1.999685073505782e-05, 'epoch': 0.08} {'loss': 0.5534, 'learning_rate': 1.999684229809123e-05, 'epoch': 0.08} {'loss': 0.4689, 'learning_rate': 1.9996833849840104e-05, 'epoch': 0.08} {'loss': 0.5009, 'learning_rate': 1.9996825390304454e-05, 'epoch': 0.08} {'loss': 0.5677, 'learning_rate': 1.999681691948429e-05, 'epoch': 0.08} {'loss': 0.4254, 'learning_rate': 1.9996808437379614e-05, 'epoch': 0.08} {'loss': 0.4559, 'learning_rate': 1.999679994399045e-05, 'epoch': 0.08} {'loss': 0.636, 'learning_rate': 1.99967914393168e-05, 'epoch': 0.08} {'loss': 0.6705, 'learning_rate': 1.999678292335867e-05, 'epoch': 0.08} {'loss': 0.6298, 'learning_rate': 1.9996774396116076e-05, 'epoch': 0.08} {'loss': 0.5977, 'learning_rate': 1.9996765857589023e-05, 'epoch': 0.08} {'loss': 0.4799, 'learning_rate': 1.9996757307777523e-05, 'epoch': 0.08} {'loss': 0.5257, 'learning_rate': 1.9996748746681585e-05, 'epoch': 0.08} {'loss': 0.5739, 'learning_rate': 1.9996740174301217e-05, 'epoch': 0.08} {'loss': 0.6372, 'learning_rate': 1.9996731590636433e-05, 'epoch': 0.08} {'loss': 0.6924, 'learning_rate': 1.9996722995687238e-05, 'epoch': 0.08} {'loss': 0.4999, 'learning_rate': 1.9996714389453643e-05, 'epoch': 0.08} {'loss': 0.5356, 'learning_rate': 1.999670577193566e-05, 'epoch': 0.08} {'loss': 0.6406, 'learning_rate': 1.9996697143133297e-05, 'epoch': 0.08} {'loss': 0.462, 'learning_rate': 1.9996688503046564e-05, 'epoch': 0.08} {'loss': 0.5001, 'learning_rate': 1.999667985167547e-05, 'epoch': 0.08} {'loss': 0.3468, 'learning_rate': 1.9996671189020025e-05, 'epoch': 0.08} {'loss': 0.5943, 'learning_rate': 1.9996662515080244e-05, 'epoch': 0.08} {'loss': 0.6122, 'learning_rate': 1.9996653829856125e-05, 'epoch': 0.08} {'loss': 0.6501, 'learning_rate': 1.9996645133347686e-05, 'epoch': 0.08} {'loss': 0.4673, 'learning_rate': 1.999663642555494e-05, 'epoch': 0.08} {'loss': 0.548, 'learning_rate': 1.999662770647789e-05, 'epoch': 0.08} {'loss': 0.6086, 'learning_rate': 1.9996618976116547e-05, 'epoch': 0.08} {'loss': 0.4022, 'learning_rate': 1.9996610234470926e-05, 'epoch': 0.08} {'loss': 0.536, 'learning_rate': 1.999660148154103e-05, 'epoch': 0.08} {'loss': 0.4472, 'learning_rate': 1.999659271732687e-05, 'epoch': 0.08} {'loss': 0.6446, 'learning_rate': 1.999658394182846e-05, 'epoch': 0.08} {'loss': 0.3811, 'learning_rate': 1.999657515504581e-05, 'epoch': 0.08} {'loss': 0.6249, 'learning_rate': 1.999656635697892e-05, 'epoch': 0.08} {'loss': 0.5298, 'learning_rate': 1.9996557547627814e-05, 'epoch': 0.08} {'loss': 0.4427, 'learning_rate': 1.9996548726992494e-05, 'epoch': 0.08} {'loss': 0.4817, 'learning_rate': 1.9996539895072974e-05, 'epoch': 0.08} {'loss': 0.3877, 'learning_rate': 1.9996531051869257e-05, 'epoch': 0.08} {'loss': 0.576, 'learning_rate': 1.999652219738136e-05, 'epoch': 0.08} {'loss': 0.6843, 'learning_rate': 1.999651333160929e-05, 'epoch': 0.08} {'loss': 0.5233, 'learning_rate': 1.9996504454553057e-05, 'epoch': 0.08} {'loss': 0.5764, 'learning_rate': 1.999649556621267e-05, 'epoch': 0.08} {'loss': 0.3335, 'learning_rate': 1.9996486666588142e-05, 'epoch': 0.08} {'loss': 0.3964, 'learning_rate': 1.9996477755679483e-05, 'epoch': 0.08} {'loss': 0.4239, 'learning_rate': 1.9996468833486698e-05, 'epoch': 0.08} {'loss': 0.7176, 'learning_rate': 1.99964599000098e-05, 'epoch': 0.08} {'loss': 0.599, 'learning_rate': 1.9996450955248803e-05, 'epoch': 0.08} {'loss': 0.4994, 'learning_rate': 1.9996441999203717e-05, 'epoch': 0.08} {'loss': 0.4642, 'learning_rate': 1.9996433031874542e-05, 'epoch': 0.08} {'loss': 0.6204, 'learning_rate': 1.99964240532613e-05, 'epoch': 0.08} {'loss': 0.586, 'learning_rate': 1.9996415063363992e-05, 'epoch': 0.08} {'loss': 0.6305, 'learning_rate': 1.999640606218263e-05, 'epoch': 0.08} {'loss': 0.4702, 'learning_rate': 1.9996397049717235e-05, 'epoch': 0.08} {'loss': 0.5355, 'learning_rate': 1.9996388025967802e-05, 'epoch': 0.08} {'loss': 0.5301, 'learning_rate': 1.9996378990934352e-05, 'epoch': 0.08} {'loss': 0.4602, 'learning_rate': 1.9996369944616888e-05, 'epoch': 0.08} {'loss': 0.4336, 'learning_rate': 1.9996360887015424e-05, 'epoch': 0.08} {'loss': 0.6499, 'learning_rate': 1.9996351818129967e-05, 'epoch': 0.08} {'loss': 0.59, 'learning_rate': 1.9996342737960533e-05, 'epoch': 0.08} {'loss': 0.5517, 'learning_rate': 1.999633364650713e-05, 'epoch': 0.08} {'loss': 0.6564, 'learning_rate': 1.9996324543769768e-05, 'epoch': 0.08} {'loss': 0.4292, 'learning_rate': 1.9996315429748452e-05, 'epoch': 0.08} {'loss': 0.3531, 'learning_rate': 1.9996306304443198e-05, 'epoch': 0.08} {'loss': 0.4614, 'learning_rate': 1.9996297167854017e-05, 'epoch': 0.08} {'loss': 0.5631, 'learning_rate': 1.9996288019980915e-05, 'epoch': 0.08} {'loss': 0.5536, 'learning_rate': 1.9996278860823908e-05, 'epoch': 0.08} {'loss': 0.4872, 'learning_rate': 1.9996269690383e-05, 'epoch': 0.08} {'loss': 0.626, 'learning_rate': 1.9996260508658207e-05, 'epoch': 0.08} {'loss': 0.3712, 'learning_rate': 1.9996251315649534e-05, 'epoch': 0.08} {'loss': 0.4068, 'learning_rate': 1.9996242111356997e-05, 'epoch': 0.08} {'loss': 0.4816, 'learning_rate': 1.9996232895780602e-05, 'epoch': 0.08} {'loss': 0.4636, 'learning_rate': 1.999622366892036e-05, 'epoch': 0.08} {'loss': 0.4021, 'learning_rate': 1.9996214430776283e-05, 'epoch': 0.08} {'loss': 0.46, 'learning_rate': 1.999620518134838e-05, 'epoch': 0.08} {'loss': 0.4987, 'learning_rate': 1.9996195920636664e-05, 'epoch': 0.08} {'loss': 0.4791, 'learning_rate': 1.9996186648641143e-05, 'epoch': 0.08} {'loss': 0.5785, 'learning_rate': 1.9996177365361828e-05, 'epoch': 0.08} {'loss': 0.4937, 'learning_rate': 1.999616807079873e-05, 'epoch': 0.08} {'loss': 0.4221, 'learning_rate': 1.999615876495186e-05, 'epoch': 0.08} {'loss': 0.5777, 'learning_rate': 1.9996149447821224e-05, 'epoch': 0.08} {'loss': 0.4378, 'learning_rate': 1.999614011940684e-05, 'epoch': 0.08} {'loss': 0.4732, 'learning_rate': 1.999613077970871e-05, 'epoch': 0.08} {'loss': 0.8025, 'learning_rate': 1.9996121428726855e-05, 'epoch': 0.08} {'loss': 0.4433, 'learning_rate': 1.9996112066461277e-05, 'epoch': 0.08} {'loss': 0.5085, 'learning_rate': 1.999610269291199e-05, 'epoch': 0.08} {'loss': 0.5001, 'learning_rate': 1.9996093308079002e-05, 'epoch': 0.08} {'loss': 0.6399, 'learning_rate': 1.999608391196233e-05, 'epoch': 0.08} {'loss': 0.4833, 'learning_rate': 1.9996074504561974e-05, 'epoch': 0.08} {'loss': 0.4708, 'learning_rate': 1.999606508587795e-05, 'epoch': 0.08} {'loss': 0.4656, 'learning_rate': 1.9996055655910276e-05, 'epoch': 0.08} {'loss': 0.4674, 'learning_rate': 1.9996046214658954e-05, 'epoch': 0.08} {'loss': 0.3551, 'learning_rate': 1.9996036762123994e-05, 'epoch': 0.08} {'loss': 0.5945, 'learning_rate': 1.999602729830541e-05, 'epoch': 0.08} {'loss': 0.5526, 'learning_rate': 1.9996017823203213e-05, 'epoch': 0.08} {'loss': 0.5371, 'learning_rate': 1.9996008336817415e-05, 'epoch': 0.08} {'loss': 0.5687, 'learning_rate': 1.999599883914802e-05, 'epoch': 0.08} {'loss': 0.5676, 'learning_rate': 1.999598933019505e-05, 'epoch': 0.08} {'loss': 0.5623, 'learning_rate': 1.99959798099585e-05, 'epoch': 0.08} {'loss': 0.5338, 'learning_rate': 1.9995970278438396e-05, 'epoch': 0.08} {'loss': 0.4766, 'learning_rate': 1.9995960735634735e-05, 'epoch': 0.08} {'loss': 0.5364, 'learning_rate': 1.9995951181547545e-05, 'epoch': 0.08} {'loss': 0.522, 'learning_rate': 1.9995941616176823e-05, 'epoch': 0.08} {'loss': 0.4437, 'learning_rate': 1.9995932039522578e-05, 'epoch': 0.08} {'loss': 0.469, 'learning_rate': 1.999592245158483e-05, 'epoch': 0.08} {'loss': 0.6396, 'learning_rate': 1.9995912852363592e-05, 'epoch': 0.08} {'loss': 0.7043, 'learning_rate': 1.999590324185886e-05, 'epoch': 0.08} {'loss': 0.6205, 'learning_rate': 1.9995893620070662e-05, 'epoch': 0.08} {'loss': 0.7152, 'learning_rate': 1.9995883986999002e-05, 'epoch': 0.08} {'loss': 0.5097, 'learning_rate': 1.999587434264388e-05, 'epoch': 0.08} {'loss': 0.5382, 'learning_rate': 1.9995864687005328e-05, 'epoch': 0.08} {'loss': 0.5286, 'learning_rate': 1.999585502008334e-05, 'epoch': 0.08} {'loss': 0.5375, 'learning_rate': 1.999584534187793e-05, 'epoch': 0.08} {'loss': 0.6105, 'learning_rate': 1.9995835652389114e-05, 'epoch': 0.08} {'loss': 0.5977, 'learning_rate': 1.99958259516169e-05, 'epoch': 0.08} {'loss': 0.392, 'learning_rate': 1.99958162395613e-05, 'epoch': 0.08} {'loss': 0.6292, 'learning_rate': 1.999580651622232e-05, 'epoch': 0.08} {'loss': 0.6188, 'learning_rate': 1.9995796781599982e-05, 'epoch': 0.08} {'loss': 0.6059, 'learning_rate': 1.9995787035694287e-05, 'epoch': 0.08} {'loss': 0.4334, 'learning_rate': 1.999577727850525e-05, 'epoch': 0.08} {'loss': 0.572, 'learning_rate': 1.999576751003288e-05, 'epoch': 0.08} {'loss': 0.5951, 'learning_rate': 1.999575773027719e-05, 'epoch': 0.08} {'loss': 0.7246, 'learning_rate': 1.999574793923819e-05, 'epoch': 0.08} {'loss': 0.4293, 'learning_rate': 1.9995738136915893e-05, 'epoch': 0.08} {'loss': 0.4221, 'learning_rate': 1.9995728323310306e-05, 'epoch': 0.08} {'loss': 0.3317, 'learning_rate': 1.9995718498421445e-05, 'epoch': 0.08} {'loss': 0.5972, 'learning_rate': 1.9995708662249316e-05, 'epoch': 0.08} {'loss': 0.5692, 'learning_rate': 1.9995698814793935e-05, 'epoch': 0.08} {'loss': 0.5771, 'learning_rate': 1.999568895605531e-05, 'epoch': 0.08} {'loss': 0.5257, 'learning_rate': 1.999567908603345e-05, 'epoch': 0.08} {'loss': 0.47, 'learning_rate': 1.9995669204728372e-05, 'epoch': 0.08} {'loss': 0.6205, 'learning_rate': 1.9995659312140084e-05, 'epoch': 0.08} {'loss': 0.3717, 'learning_rate': 1.99956494082686e-05, 'epoch': 0.08} {'loss': 0.4523, 'learning_rate': 1.9995639493113924e-05, 'epoch': 0.08} {'loss': 0.6495, 'learning_rate': 1.999562956667607e-05, 'epoch': 0.08} {'loss': 0.5427, 'learning_rate': 1.9995619628955056e-05, 'epoch': 0.08} {'loss': 0.6721, 'learning_rate': 1.999560967995089e-05, 'epoch': 0.08} {'loss': 0.4555, 'learning_rate': 1.9995599719663576e-05, 'epoch': 0.08} {'loss': 0.5608, 'learning_rate': 1.9995589748093135e-05, 'epoch': 0.08} {'loss': 0.49, 'learning_rate': 1.999557976523957e-05, 'epoch': 0.08} {'loss': 0.4793, 'learning_rate': 1.99955697711029e-05, 'epoch': 0.08} {'loss': 0.5285, 'learning_rate': 1.999555976568313e-05, 'epoch': 0.08} {'loss': 0.5801, 'learning_rate': 1.999554974898027e-05, 'epoch': 0.08} {'loss': 0.4257, 'learning_rate': 1.999553972099434e-05, 'epoch': 0.08} {'loss': 0.5025, 'learning_rate': 1.9995529681725348e-05, 'epoch': 0.08} {'loss': 0.47, 'learning_rate': 1.9995519631173303e-05, 'epoch': 0.08} {'loss': 0.6645, 'learning_rate': 1.9995509569338213e-05, 'epoch': 0.08} {'loss': 0.5027, 'learning_rate': 1.9995499496220096e-05, 'epoch': 0.08} {'loss': 0.4004, 'learning_rate': 1.999548941181896e-05, 'epoch': 0.08} {'loss': 0.5701, 'learning_rate': 1.9995479316134818e-05, 'epoch': 0.08} {'loss': 0.6843, 'learning_rate': 1.9995469209167682e-05, 'epoch': 0.08} {'loss': 0.68, 'learning_rate': 1.999545909091756e-05, 'epoch': 0.08} {'loss': 0.5195, 'learning_rate': 1.9995448961384465e-05, 'epoch': 0.08} {'loss': 0.4177, 'learning_rate': 1.999543882056841e-05, 'epoch': 0.08} {'loss': 0.459, 'learning_rate': 1.9995428668469405e-05, 'epoch': 0.08} {'loss': 0.5409, 'learning_rate': 1.9995418505087462e-05, 'epoch': 0.08} {'loss': 0.5154, 'learning_rate': 1.9995408330422593e-05, 'epoch': 0.08} {'loss': 0.5012, 'learning_rate': 1.9995398144474808e-05, 'epoch': 0.08} {'loss': 0.4913, 'learning_rate': 1.9995387947244117e-05, 'epoch': 0.08} {'loss': 0.6505, 'learning_rate': 1.9995377738730534e-05, 'epoch': 0.08} {'loss': 0.5515, 'learning_rate': 1.9995367518934076e-05, 'epoch': 0.08} {'loss': 0.5271, 'learning_rate': 1.9995357287854742e-05, 'epoch': 0.08} {'loss': 0.4687, 'learning_rate': 1.9995347045492554e-05, 'epoch': 0.08} {'loss': 0.6132, 'learning_rate': 1.9995336791847517e-05, 'epoch': 0.08} {'loss': 0.3849, 'learning_rate': 1.999532652691965e-05, 'epoch': 0.08} {'loss': 0.5344, 'learning_rate': 1.9995316250708957e-05, 'epoch': 0.08} {'loss': 0.6438, 'learning_rate': 1.999530596321545e-05, 'epoch': 0.08} {'loss': 0.483, 'learning_rate': 1.999529566443915e-05, 'epoch': 0.08} {'loss': 0.5276, 'learning_rate': 1.9995285354380056e-05, 'epoch': 0.08} {'loss': 0.6266, 'learning_rate': 1.9995275033038188e-05, 'epoch': 0.08} {'loss': 0.6099, 'learning_rate': 1.9995264700413556e-05, 'epoch': 0.08} {'loss': 0.4745, 'learning_rate': 1.9995254356506168e-05, 'epoch': 0.08} {'loss': 0.363, 'learning_rate': 1.999524400131604e-05, 'epoch': 0.08} {'loss': 0.5396, 'learning_rate': 1.9995233634843183e-05, 'epoch': 0.08} {'loss': 0.4373, 'learning_rate': 1.999522325708761e-05, 'epoch': 0.08} {'loss': 0.5453, 'learning_rate': 1.9995212868049326e-05, 'epoch': 0.08} {'loss': 0.5695, 'learning_rate': 1.999520246772835e-05, 'epoch': 0.08} {'loss': 0.5211, 'learning_rate': 1.9995192056124687e-05, 'epoch': 0.08} {'loss': 0.4178, 'learning_rate': 1.9995181633238358e-05, 'epoch': 0.08} {'loss': 0.5895, 'learning_rate': 1.999517119906937e-05, 'epoch': 0.08} {'loss': 0.6485, 'learning_rate': 1.999516075361773e-05, 'epoch': 0.08} {'loss': 0.4599, 'learning_rate': 1.999515029688346e-05, 'epoch': 0.08} {'loss': 0.4771, 'learning_rate': 1.999513982886656e-05, 'epoch': 0.08} {'loss': 0.5097, 'learning_rate': 1.999512934956705e-05, 'epoch': 0.08} {'loss': 0.5549, 'learning_rate': 1.9995118858984938e-05, 'epoch': 0.08} {'loss': 0.5007, 'learning_rate': 1.999510835712024e-05, 'epoch': 0.08} {'loss': 0.5816, 'learning_rate': 1.9995097843972966e-05, 'epoch': 0.08} {'loss': 0.5445, 'learning_rate': 1.9995087319543124e-05, 'epoch': 0.08} {'loss': 0.4704, 'learning_rate': 1.9995076783830732e-05, 'epoch': 0.08} {'loss': 0.5853, 'learning_rate': 1.9995066236835797e-05, 'epoch': 0.08} {'loss': 0.414, 'learning_rate': 1.9995055678558336e-05, 'epoch': 0.08} {'loss': 0.4687, 'learning_rate': 1.9995045108998355e-05, 'epoch': 0.08} {'loss': 0.4299, 'learning_rate': 1.999503452815587e-05, 'epoch': 0.08} {'loss': 0.3687, 'learning_rate': 1.999502393603089e-05, 'epoch': 0.08} {'loss': 0.6158, 'learning_rate': 1.9995013332623428e-05, 'epoch': 0.08} {'loss': 0.4029, 'learning_rate': 1.9995002717933498e-05, 'epoch': 0.08} {'loss': 0.4991, 'learning_rate': 1.999499209196111e-05, 'epoch': 0.08} {'loss': 0.4552, 'learning_rate': 1.9994981454706275e-05, 'epoch': 0.08} {'loss': 0.5742, 'learning_rate': 1.999497080616901e-05, 'epoch': 0.08} {'loss': 0.4989, 'learning_rate': 1.9994960146349324e-05, 'epoch': 0.08} {'loss': 0.4661, 'learning_rate': 1.9994949475247227e-05, 'epoch': 0.08} {'loss': 0.5815, 'learning_rate': 1.9994938792862732e-05, 'epoch': 0.08} {'loss': 0.5384, 'learning_rate': 1.9994928099195853e-05, 'epoch': 0.08} {'loss': 0.5081, 'learning_rate': 1.99949173942466e-05, 'epoch': 0.08} {'loss': 0.4647, 'learning_rate': 1.9994906678014984e-05, 'epoch': 0.08} {'loss': 0.672, 'learning_rate': 1.9994895950501024e-05, 'epoch': 0.08} {'loss': 0.4857, 'learning_rate': 1.999488521170472e-05, 'epoch': 0.08} {'loss': 0.4337, 'learning_rate': 1.9994874461626098e-05, 'epoch': 0.08} {'loss': 0.4689, 'learning_rate': 1.9994863700265163e-05, 'epoch': 0.08} {'loss': 0.687, 'learning_rate': 1.9994852927621924e-05, 'epoch': 0.08} {'loss': 0.6965, 'learning_rate': 1.9994842143696397e-05, 'epoch': 0.08} {'loss': 0.6239, 'learning_rate': 1.9994831348488594e-05, 'epoch': 0.08} {'loss': 0.4116, 'learning_rate': 1.9994820541998526e-05, 'epoch': 0.08} {'loss': 0.3978, 'learning_rate': 1.999480972422621e-05, 'epoch': 0.08} {'loss': 0.5612, 'learning_rate': 1.9994798895171654e-05, 'epoch': 0.08} {'loss': 0.6036, 'learning_rate': 1.9994788054834867e-05, 'epoch': 0.08} {'loss': 0.5497, 'learning_rate': 1.9994777203215866e-05, 'epoch': 0.08} {'loss': 0.4855, 'learning_rate': 1.9994766340314664e-05, 'epoch': 0.08} {'loss': 0.5159, 'learning_rate': 1.999475546613127e-05, 'epoch': 0.08} {'loss': 0.5407, 'learning_rate': 1.99947445806657e-05, 'epoch': 0.08} {'loss': 0.396, 'learning_rate': 1.999473368391796e-05, 'epoch': 0.08} {'loss': 0.6071, 'learning_rate': 1.999472277588807e-05, 'epoch': 0.08} {'loss': 0.3762, 'learning_rate': 1.9994711856576034e-05, 'epoch': 0.08} {'loss': 0.5488, 'learning_rate': 1.9994700925981873e-05, 'epoch': 0.08} {'loss': 0.5449, 'learning_rate': 1.9994689984105596e-05, 'epoch': 0.08} {'loss': 0.5682, 'learning_rate': 1.9994679030947212e-05, 'epoch': 0.08} {'loss': 0.5597, 'learning_rate': 1.9994668066506736e-05, 'epoch': 0.08} {'loss': 0.4874, 'learning_rate': 1.999465709078418e-05, 'epoch': 0.08} {'loss': 0.5282, 'learning_rate': 1.9994646103779557e-05, 'epoch': 0.08} {'loss': 0.607, 'learning_rate': 1.999463510549288e-05, 'epoch': 0.08} {'loss': 0.5285, 'learning_rate': 1.999462409592416e-05, 'epoch': 0.08} {'loss': 0.54, 'learning_rate': 1.999461307507341e-05, 'epoch': 0.08} {'loss': 0.5555, 'learning_rate': 1.9994602042940642e-05, 'epoch': 0.08} {'loss': 0.3637, 'learning_rate': 1.999459099952587e-05, 'epoch': 0.08} {'loss': 0.5415, 'learning_rate': 1.9994579944829104e-05, 'epoch': 0.08} {'loss': 0.6168, 'learning_rate': 1.9994568878850357e-05, 'epoch': 0.08} {'loss': 0.3729, 'learning_rate': 1.9994557801589646e-05, 'epoch': 0.08} {'loss': 0.6365, 'learning_rate': 1.9994546713046977e-05, 'epoch': 0.08} {'loss': 0.451, 'learning_rate': 1.999453561322237e-05, 'epoch': 0.08} {'loss': 0.4054, 'learning_rate': 1.9994524502115827e-05, 'epoch': 0.08} {'loss': 0.5614, 'learning_rate': 1.9994513379727366e-05, 'epoch': 0.08} {'loss': 0.6105, 'learning_rate': 1.9994502246057005e-05, 'epoch': 0.08} {'loss': 0.5981, 'learning_rate': 1.9994491101104744e-05, 'epoch': 0.08} {'loss': 0.515, 'learning_rate': 1.9994479944870608e-05, 'epoch': 0.08} {'loss': 0.4671, 'learning_rate': 1.9994468777354606e-05, 'epoch': 0.08} {'loss': 0.5141, 'learning_rate': 1.9994457598556746e-05, 'epoch': 0.08} {'loss': 0.5363, 'learning_rate': 1.999444640847705e-05, 'epoch': 0.08} {'loss': 0.4261, 'learning_rate': 1.9994435207115516e-05, 'epoch': 0.08} {'loss': 0.4799, 'learning_rate': 1.999442399447217e-05, 'epoch': 0.08} {'loss': 0.5606, 'learning_rate': 1.999441277054702e-05, 'epoch': 0.08} {'loss': 0.4823, 'learning_rate': 1.999440153534008e-05, 'epoch': 0.08} {'loss': 0.6786, 'learning_rate': 1.9994390288851356e-05, 'epoch': 0.08} {'loss': 0.5284, 'learning_rate': 1.999437903108087e-05, 'epoch': 0.08} {'loss': 0.5925, 'learning_rate': 1.9994367762028626e-05, 'epoch': 0.08} {'loss': 0.6914, 'learning_rate': 1.9994356481694646e-05, 'epoch': 0.08} {'loss': 0.5535, 'learning_rate': 1.9994345190078936e-05, 'epoch': 0.08} {'loss': 0.603, 'learning_rate': 1.9994333887181512e-05, 'epoch': 0.08} {'loss': 0.4866, 'learning_rate': 1.9994322573002386e-05, 'epoch': 0.08} {'loss': 0.3065, 'learning_rate': 1.999431124754157e-05, 'epoch': 0.08} {'loss': 0.7062, 'learning_rate': 1.9994299910799075e-05, 'epoch': 0.08} {'loss': 0.5454, 'learning_rate': 1.9994288562774917e-05, 'epoch': 0.08} {'loss': 0.6343, 'learning_rate': 1.9994277203469108e-05, 'epoch': 0.08} {'loss': 0.5532, 'learning_rate': 1.999426583288166e-05, 'epoch': 0.08} {'loss': 0.5169, 'learning_rate': 1.9994254451012586e-05, 'epoch': 0.08} {'loss': 0.5343, 'learning_rate': 1.99942430578619e-05, 'epoch': 0.08} {'loss': 0.5803, 'learning_rate': 1.9994231653429615e-05, 'epoch': 0.08} {'loss': 0.5864, 'learning_rate': 1.999422023771574e-05, 'epoch': 0.08} {'loss': 0.4409, 'learning_rate': 1.9994208810720293e-05, 'epoch': 0.08} {'loss': 0.5692, 'learning_rate': 1.9994197372443288e-05, 'epoch': 0.08} {'loss': 0.5798, 'learning_rate': 1.999418592288473e-05, 'epoch': 0.08} {'loss': 0.5629, 'learning_rate': 1.999417446204464e-05, 'epoch': 0.08} {'loss': 0.6099, 'learning_rate': 1.9994162989923023e-05, 'epoch': 0.08} {'loss': 0.5129, 'learning_rate': 1.99941515065199e-05, 'epoch': 0.08} {'loss': 0.4715, 'learning_rate': 1.9994140011835278e-05, 'epoch': 0.08} {'loss': 0.6245, 'learning_rate': 1.9994128505869176e-05, 'epoch': 0.08} {'loss': 0.5037, 'learning_rate': 1.9994116988621602e-05, 'epoch': 0.08} {'loss': 0.4871, 'learning_rate': 1.999410546009257e-05, 'epoch': 0.08} {'loss': 0.5127, 'learning_rate': 1.9994093920282093e-05, 'epoch': 0.08} {'loss': 0.4129, 'learning_rate': 1.9994082369190182e-05, 'epoch': 0.08} {'loss': 0.444, 'learning_rate': 1.9994070806816853e-05, 'epoch': 0.08} {'loss': 0.4774, 'learning_rate': 1.9994059233162122e-05, 'epoch': 0.08} {'loss': 0.3984, 'learning_rate': 1.9994047648225997e-05, 'epoch': 0.08} {'loss': 0.4937, 'learning_rate': 1.999403605200849e-05, 'epoch': 0.08} {'loss': 0.6032, 'learning_rate': 1.999402444450962e-05, 'epoch': 0.08} {'loss': 0.7077, 'learning_rate': 1.9994012825729396e-05, 'epoch': 0.08} {'loss': 0.529, 'learning_rate': 1.9994001195667834e-05, 'epoch': 0.08} {'loss': 0.4759, 'learning_rate': 1.9993989554324943e-05, 'epoch': 0.08} {'loss': 0.6089, 'learning_rate': 1.9993977901700737e-05, 'epoch': 0.08} {'loss': 0.485, 'learning_rate': 1.9993966237795232e-05, 'epoch': 0.08} {'loss': 0.4453, 'learning_rate': 1.999395456260844e-05, 'epoch': 0.08} {'loss': 0.489, 'learning_rate': 1.9993942876140374e-05, 'epoch': 0.08} {'loss': 0.5814, 'learning_rate': 1.9993931178391048e-05, 'epoch': 0.08} {'loss': 0.6557, 'learning_rate': 1.999391946936047e-05, 'epoch': 0.08} {'loss': 0.5807, 'learning_rate': 1.999390774904866e-05, 'epoch': 0.08} {'loss': 0.504, 'learning_rate': 1.999389601745563e-05, 'epoch': 0.08} {'loss': 0.3478, 'learning_rate': 1.9993884274581388e-05, 'epoch': 0.08} {'loss': 0.5165, 'learning_rate': 1.9993872520425955e-05, 'epoch': 0.08} {'loss': 0.4385, 'learning_rate': 1.9993860754989335e-05, 'epoch': 0.08} {'loss': 0.6756, 'learning_rate': 1.999384897827155e-05, 'epoch': 0.08} {'loss': 0.5622, 'learning_rate': 1.9993837190272612e-05, 'epoch': 0.08} {'loss': 0.487, 'learning_rate': 1.999382539099253e-05, 'epoch': 0.08} {'loss': 0.4765, 'learning_rate': 1.999381358043132e-05, 'epoch': 0.08} {'loss': 0.4377, 'learning_rate': 1.9993801758588997e-05, 'epoch': 0.08} {'loss': 0.4816, 'learning_rate': 1.9993789925465567e-05, 'epoch': 0.08} {'loss': 0.5332, 'learning_rate': 1.999377808106105e-05, 'epoch': 0.08} {'loss': 0.5427, 'learning_rate': 1.999376622537546e-05, 'epoch': 0.08} {'loss': 0.5872, 'learning_rate': 1.9993754358408807e-05, 'epoch': 0.08} {'loss': 0.4216, 'learning_rate': 1.999374248016111e-05, 'epoch': 0.08} {'loss': 0.622, 'learning_rate': 1.999373059063237e-05, 'epoch': 0.08} {'loss': 0.424, 'learning_rate': 1.9993718689822613e-05, 'epoch': 0.08} {'loss': 0.457, 'learning_rate': 1.999370677773185e-05, 'epoch': 0.08} {'loss': 0.3699, 'learning_rate': 1.9993694854360092e-05, 'epoch': 0.08} {'loss': 0.4868, 'learning_rate': 1.999368291970735e-05, 'epoch': 0.08} {'loss': 0.6761, 'learning_rate': 1.9993670973773643e-05, 'epoch': 0.08} {'loss': 0.4692, 'learning_rate': 1.999365901655898e-05, 'epoch': 0.08} {'loss': 0.5421, 'learning_rate': 1.9993647048063377e-05, 'epoch': 0.08} {'loss': 0.4783, 'learning_rate': 1.9993635068286848e-05, 'epoch': 0.08} {'loss': 0.632, 'learning_rate': 1.9993623077229402e-05, 'epoch': 0.08} {'loss': 0.3914, 'learning_rate': 1.999361107489106e-05, 'epoch': 0.08} {'loss': 0.529, 'learning_rate': 1.9993599061271827e-05, 'epoch': 0.08} {'loss': 0.7029, 'learning_rate': 1.9993587036371726e-05, 'epoch': 0.08} {'loss': 0.5133, 'learning_rate': 1.9993575000190765e-05, 'epoch': 0.08} {'loss': 0.3891, 'learning_rate': 1.9993562952728955e-05, 'epoch': 0.08} {'loss': 0.5919, 'learning_rate': 1.9993550893986312e-05, 'epoch': 0.08} {'loss': 0.5224, 'learning_rate': 1.999353882396285e-05, 'epoch': 0.08} {'loss': 0.746, 'learning_rate': 1.999352674265859e-05, 'epoch': 0.08} {'loss': 0.547, 'learning_rate': 1.9993514650073534e-05, 'epoch': 0.08} {'loss': 0.6017, 'learning_rate': 1.99935025462077e-05, 'epoch': 0.08} {'loss': 0.6852, 'learning_rate': 1.9993490431061105e-05, 'epoch': 0.08} {'loss': 0.5657, 'learning_rate': 1.9993478304633757e-05, 'epoch': 0.08} {'loss': 0.5521, 'learning_rate': 1.9993466166925672e-05, 'epoch': 0.08} {'loss': 0.4508, 'learning_rate': 1.9993454017936863e-05, 'epoch': 0.08} {'loss': 0.4767, 'learning_rate': 1.9993441857667347e-05, 'epoch': 0.08} {'loss': 0.5118, 'learning_rate': 1.9993429686117135e-05, 'epoch': 0.08} {'loss': 0.6128, 'learning_rate': 1.9993417503286242e-05, 'epoch': 0.08} {'loss': 0.6233, 'learning_rate': 1.999340530917468e-05, 'epoch': 0.08} {'loss': 0.4692, 'learning_rate': 1.9993393103782463e-05, 'epoch': 0.08} {'loss': 0.4932, 'learning_rate': 1.999338088710961e-05, 'epoch': 0.08} {'loss': 0.6512, 'learning_rate': 1.9993368659156123e-05, 'epoch': 0.08} {'loss': 0.6315, 'learning_rate': 1.999335641992203e-05, 'epoch': 0.08} {'loss': 0.4953, 'learning_rate': 1.9993344169407332e-05, 'epoch': 0.08} {'loss': 0.548, 'learning_rate': 1.999333190761205e-05, 'epoch': 0.08} {'loss': 0.5305, 'learning_rate': 1.99933196345362e-05, 'epoch': 0.08} {'loss': 0.6616, 'learning_rate': 1.999330735017979e-05, 'epoch': 0.08} {'loss': 0.5435, 'learning_rate': 1.9993295054542837e-05, 'epoch': 0.08} {'loss': 0.55, 'learning_rate': 1.999328274762535e-05, 'epoch': 0.08} {'loss': 0.3248, 'learning_rate': 1.9993270429427353e-05, 'epoch': 0.08} {'loss': 0.5675, 'learning_rate': 1.9993258099948853e-05, 'epoch': 0.08} {'loss': 0.4435, 'learning_rate': 1.9993245759189864e-05, 'epoch': 0.08} {'loss': 0.7531, 'learning_rate': 1.9993233407150402e-05, 'epoch': 0.08} {'loss': 0.5931, 'learning_rate': 1.999322104383048e-05, 'epoch': 0.08} {'loss': 0.4787, 'learning_rate': 1.999320866923011e-05, 'epoch': 0.08} {'loss': 0.6492, 'learning_rate': 1.999319628334931e-05, 'epoch': 0.08} {'loss': 0.4623, 'learning_rate': 1.9993183886188086e-05, 'epoch': 0.08} {'loss': 0.5939, 'learning_rate': 1.999317147774646e-05, 'epoch': 0.08} {'loss': 0.6544, 'learning_rate': 1.999315905802445e-05, 'epoch': 0.08} {'loss': 0.5018, 'learning_rate': 1.9993146627022057e-05, 'epoch': 0.09} {'loss': 0.6219, 'learning_rate': 1.9993134184739302e-05, 'epoch': 0.09} {'loss': 0.5042, 'learning_rate': 1.9993121731176202e-05, 'epoch': 0.09} {'loss': 0.4948, 'learning_rate': 1.9993109266332764e-05, 'epoch': 0.09} {'loss': 0.471, 'learning_rate': 1.999309679020901e-05, 'epoch': 0.09} {'loss': 0.7019, 'learning_rate': 1.9993084302804947e-05, 'epoch': 0.09} {'loss': 0.6136, 'learning_rate': 1.9993071804120595e-05, 'epoch': 0.09} {'loss': 0.5546, 'learning_rate': 1.9993059294155963e-05, 'epoch': 0.09} {'loss': 0.4896, 'learning_rate': 1.999304677291107e-05, 'epoch': 0.09} {'loss': 0.4033, 'learning_rate': 1.9993034240385924e-05, 'epoch': 0.09} {'loss': 0.7105, 'learning_rate': 1.999302169658054e-05, 'epoch': 0.09} {'loss': 0.4994, 'learning_rate': 1.999300914149494e-05, 'epoch': 0.09} {'loss': 0.4724, 'learning_rate': 1.9992996575129133e-05, 'epoch': 0.09} {'loss': 0.373, 'learning_rate': 1.9992983997483132e-05, 'epoch': 0.09} {'loss': 0.6718, 'learning_rate': 1.999297140855695e-05, 'epoch': 0.09} {'loss': 0.4367, 'learning_rate': 1.9992958808350608e-05, 'epoch': 0.09} {'loss': 0.3966, 'learning_rate': 1.999294619686411e-05, 'epoch': 0.09} {'loss': 0.4941, 'learning_rate': 1.999293357409748e-05, 'epoch': 0.09} {'loss': 0.4794, 'learning_rate': 1.999292094005073e-05, 'epoch': 0.09} {'loss': 0.4357, 'learning_rate': 1.999290829472387e-05, 'epoch': 0.09} {'loss': 0.7724, 'learning_rate': 1.9992895638116915e-05, 'epoch': 0.09} {'loss': 0.5957, 'learning_rate': 1.999288297022988e-05, 'epoch': 0.09} {'loss': 0.4595, 'learning_rate': 1.999287029106279e-05, 'epoch': 0.09} {'loss': 0.405, 'learning_rate': 1.9992857600615642e-05, 'epoch': 0.09} {'loss': 0.2984, 'learning_rate': 1.9992844898888457e-05, 'epoch': 0.09} {'loss': 0.5733, 'learning_rate': 1.9992832185881252e-05, 'epoch': 0.09} {'loss': 0.4632, 'learning_rate': 1.9992819461594038e-05, 'epoch': 0.09} {'loss': 0.7006, 'learning_rate': 1.9992806726026836e-05, 'epoch': 0.09} {'loss': 0.5545, 'learning_rate': 1.999279397917965e-05, 'epoch': 0.09} {'loss': 0.5948, 'learning_rate': 1.9992781221052503e-05, 'epoch': 0.09} {'loss': 0.5772, 'learning_rate': 1.9992768451645406e-05, 'epoch': 0.09} {'loss': 0.5461, 'learning_rate': 1.9992755670958372e-05, 'epoch': 0.09} {'loss': 0.5087, 'learning_rate': 1.9992742878991416e-05, 'epoch': 0.09} {'loss': 0.4305, 'learning_rate': 1.999273007574456e-05, 'epoch': 0.09} {'loss': 0.5376, 'learning_rate': 1.9992717261217804e-05, 'epoch': 0.09} {'loss': 0.4037, 'learning_rate': 1.9992704435411174e-05, 'epoch': 0.09} {'loss': 0.6346, 'learning_rate': 1.999269159832468e-05, 'epoch': 0.09} {'loss': 0.4454, 'learning_rate': 1.9992678749958342e-05, 'epoch': 0.09} {'loss': 0.5177, 'learning_rate': 1.9992665890312164e-05, 'epoch': 0.09} {'loss': 0.4534, 'learning_rate': 1.999265301938617e-05, 'epoch': 0.09} {'loss': 0.4609, 'learning_rate': 1.999264013718037e-05, 'epoch': 0.09} {'loss': 0.7095, 'learning_rate': 1.9992627243694777e-05, 'epoch': 0.09} {'loss': 0.4577, 'learning_rate': 1.999261433892941e-05, 'epoch': 0.09} {'loss': 0.5439, 'learning_rate': 1.9992601422884284e-05, 'epoch': 0.09} {'loss': 0.5394, 'learning_rate': 1.9992588495559407e-05, 'epoch': 0.09} {'loss': 0.5569, 'learning_rate': 1.99925755569548e-05, 'epoch': 0.09} {'loss': 0.4853, 'learning_rate': 1.9992562607070473e-05, 'epoch': 0.09} {'loss': 0.5327, 'learning_rate': 1.9992549645906444e-05, 'epoch': 0.09} {'loss': 0.6312, 'learning_rate': 1.999253667346273e-05, 'epoch': 0.09} {'loss': 0.5136, 'learning_rate': 1.999252368973934e-05, 'epoch': 0.09} {'loss': 0.414, 'learning_rate': 1.999251069473629e-05, 'epoch': 0.09} {'loss': 0.5708, 'learning_rate': 1.9992497688453594e-05, 'epoch': 0.09} {'loss': 0.4567, 'learning_rate': 1.9992484670891272e-05, 'epoch': 0.09} {'loss': 0.4953, 'learning_rate': 1.9992471642049334e-05, 'epoch': 0.09} {'loss': 0.5879, 'learning_rate': 1.9992458601927796e-05, 'epoch': 0.09} {'loss': 0.6871, 'learning_rate': 1.999244555052667e-05, 'epoch': 0.09} {'loss': 0.5899, 'learning_rate': 1.9992432487845972e-05, 'epoch': 0.09} {'loss': 0.4311, 'learning_rate': 1.9992419413885723e-05, 'epoch': 0.09} {'loss': 0.4644, 'learning_rate': 1.999240632864593e-05, 'epoch': 0.09} {'loss': 0.4797, 'learning_rate': 1.999239323212661e-05, 'epoch': 0.09} {'loss': 0.4946, 'learning_rate': 1.999238012432778e-05, 'epoch': 0.09} {'loss': 0.4338, 'learning_rate': 1.999236700524945e-05, 'epoch': 0.09} {'loss': 0.425, 'learning_rate': 1.999235387489164e-05, 'epoch': 0.09} {'loss': 0.55, 'learning_rate': 1.9992340733254363e-05, 'epoch': 0.09} {'loss': 0.6476, 'learning_rate': 1.9992327580337633e-05, 'epoch': 0.09} {'loss': 0.5534, 'learning_rate': 1.9992314416141466e-05, 'epoch': 0.09} {'loss': 0.5286, 'learning_rate': 1.9992301240665873e-05, 'epoch': 0.09} {'loss': 0.6186, 'learning_rate': 1.9992288053910874e-05, 'epoch': 0.09} {'loss': 0.4531, 'learning_rate': 1.9992274855876483e-05, 'epoch': 0.09} {'loss': 0.3861, 'learning_rate': 1.999226164656271e-05, 'epoch': 0.09} {'loss': 0.3702, 'learning_rate': 1.999224842596958e-05, 'epoch': 0.09} {'loss': 0.4054, 'learning_rate': 1.99922351940971e-05, 'epoch': 0.09} {'loss': 0.6627, 'learning_rate': 1.999222195094528e-05, 'epoch': 0.09} {'loss': 0.5427, 'learning_rate': 1.999220869651415e-05, 'epoch': 0.09} {'loss': 0.457, 'learning_rate': 1.9992195430803713e-05, 'epoch': 0.09} {'loss': 0.5241, 'learning_rate': 1.9992182153813982e-05, 'epoch': 0.09} {'loss': 0.3778, 'learning_rate': 1.9992168865544985e-05, 'epoch': 0.09} {'loss': 0.5309, 'learning_rate': 1.9992155565996728e-05, 'epoch': 0.09} {'loss': 0.5807, 'learning_rate': 1.9992142255169224e-05, 'epoch': 0.09} {'loss': 0.5176, 'learning_rate': 1.9992128933062497e-05, 'epoch': 0.09} {'loss': 0.6132, 'learning_rate': 1.999211559967655e-05, 'epoch': 0.09} {'loss': 0.3782, 'learning_rate': 1.999210225501141e-05, 'epoch': 0.09} {'loss': 0.491, 'learning_rate': 1.9992088899067084e-05, 'epoch': 0.09} {'loss': 0.5895, 'learning_rate': 1.999207553184359e-05, 'epoch': 0.09} {'loss': 0.5758, 'learning_rate': 1.9992062153340943e-05, 'epoch': 0.09} {'loss': 0.509, 'learning_rate': 1.999204876355916e-05, 'epoch': 0.09} {'loss': 0.4987, 'learning_rate': 1.9992035362498253e-05, 'epoch': 0.09} {'loss': 0.4274, 'learning_rate': 1.9992021950158235e-05, 'epoch': 0.09} {'loss': 0.4787, 'learning_rate': 1.9992008526539125e-05, 'epoch': 0.09} {'loss': 0.432, 'learning_rate': 1.9991995091640942e-05, 'epoch': 0.09} {'loss': 0.5718, 'learning_rate': 1.9991981645463693e-05, 'epoch': 0.09} {'loss': 0.6065, 'learning_rate': 1.99919681880074e-05, 'epoch': 0.09} {'loss': 0.5603, 'learning_rate': 1.999195471927207e-05, 'epoch': 0.09} {'loss': 0.5547, 'learning_rate': 1.9991941239257727e-05, 'epoch': 0.09} {'loss': 0.5454, 'learning_rate': 1.9991927747964378e-05, 'epoch': 0.09} {'loss': 0.4996, 'learning_rate': 1.9991914245392044e-05, 'epoch': 0.09} {'loss': 0.4737, 'learning_rate': 1.9991900731540744e-05, 'epoch': 0.09} {'loss': 0.6415, 'learning_rate': 1.9991887206410486e-05, 'epoch': 0.09} {'loss': 0.4229, 'learning_rate': 1.9991873670001283e-05, 'epoch': 0.09} {'loss': 0.4838, 'learning_rate': 1.999186012231316e-05, 'epoch': 0.09} {'loss': 0.5933, 'learning_rate': 1.9991846563346122e-05, 'epoch': 0.09} {'loss': 0.5446, 'learning_rate': 1.9991832993100192e-05, 'epoch': 0.09} {'loss': 0.5578, 'learning_rate': 1.9991819411575385e-05, 'epoch': 0.09} {'loss': 0.5158, 'learning_rate': 1.999180581877171e-05, 'epoch': 0.09} {'loss': 0.6021, 'learning_rate': 1.9991792214689186e-05, 'epoch': 0.09} {'loss': 0.609, 'learning_rate': 1.9991778599327832e-05, 'epoch': 0.09} {'loss': 0.4178, 'learning_rate': 1.9991764972687658e-05, 'epoch': 0.09} {'loss': 0.5006, 'learning_rate': 1.999175133476868e-05, 'epoch': 0.09} {'loss': 0.6369, 'learning_rate': 1.999173768557092e-05, 'epoch': 0.09} {'loss': 0.6314, 'learning_rate': 1.999172402509438e-05, 'epoch': 0.09} {'loss': 0.5318, 'learning_rate': 1.999171035333909e-05, 'epoch': 0.09} {'loss': 0.7398, 'learning_rate': 1.999169667030506e-05, 'epoch': 0.09} {'loss': 0.5012, 'learning_rate': 1.99916829759923e-05, 'epoch': 0.09} {'loss': 0.5613, 'learning_rate': 1.999166927040083e-05, 'epoch': 0.09} {'loss': 0.492, 'learning_rate': 1.9991655553530668e-05, 'epoch': 0.09} {'loss': 0.4635, 'learning_rate': 1.9991641825381825e-05, 'epoch': 0.09} {'loss': 0.6756, 'learning_rate': 1.999162808595432e-05, 'epoch': 0.09} {'loss': 0.5348, 'learning_rate': 1.9991614335248165e-05, 'epoch': 0.09} {'loss': 0.6453, 'learning_rate': 1.9991600573263378e-05, 'epoch': 0.09} {'loss': 0.53, 'learning_rate': 1.9991586799999974e-05, 'epoch': 0.09} {'loss': 0.598, 'learning_rate': 1.999157301545797e-05, 'epoch': 0.09} {'loss': 0.4157, 'learning_rate': 1.999155921963738e-05, 'epoch': 0.09} {'loss': 0.4976, 'learning_rate': 1.9991545412538218e-05, 'epoch': 0.09} {'loss': 0.375, 'learning_rate': 1.9991531594160502e-05, 'epoch': 0.09} {'loss': 0.568, 'learning_rate': 1.9991517764504247e-05, 'epoch': 0.09} {'loss': 0.475, 'learning_rate': 1.9991503923569467e-05, 'epoch': 0.09} {'loss': 0.5402, 'learning_rate': 1.9991490071356182e-05, 'epoch': 0.09} {'loss': 0.4354, 'learning_rate': 1.9991476207864404e-05, 'epoch': 0.09} {'loss': 0.5905, 'learning_rate': 1.9991462333094147e-05, 'epoch': 0.09} {'loss': 0.5482, 'learning_rate': 1.9991448447045427e-05, 'epoch': 0.09} {'loss': 0.4119, 'learning_rate': 1.9991434549718267e-05, 'epoch': 0.09} {'loss': 0.5539, 'learning_rate': 1.9991420641112676e-05, 'epoch': 0.09} {'loss': 0.4601, 'learning_rate': 1.999140672122867e-05, 'epoch': 0.09} {'loss': 0.5213, 'learning_rate': 1.9991392790066263e-05, 'epoch': 0.09} {'loss': 0.4164, 'learning_rate': 1.9991378847625477e-05, 'epoch': 0.09} {'loss': 0.6346, 'learning_rate': 1.9991364893906325e-05, 'epoch': 0.09} {'loss': 0.4467, 'learning_rate': 1.9991350928908822e-05, 'epoch': 0.09} {'loss': 0.58, 'learning_rate': 1.999133695263298e-05, 'epoch': 0.09} {'loss': 0.5118, 'learning_rate': 1.9991322965078823e-05, 'epoch': 0.09} {'loss': 0.4027, 'learning_rate': 1.9991308966246358e-05, 'epoch': 0.09} {'loss': 0.5012, 'learning_rate': 1.999129495613561e-05, 'epoch': 0.09} {'loss': 0.3812, 'learning_rate': 1.9991280934746585e-05, 'epoch': 0.09} {'loss': 0.4305, 'learning_rate': 1.9991266902079304e-05, 'epoch': 0.09} {'loss': 0.492, 'learning_rate': 1.9991252858133787e-05, 'epoch': 0.09} {'loss': 0.5464, 'learning_rate': 1.9991238802910042e-05, 'epoch': 0.09} {'loss': 0.4469, 'learning_rate': 1.999122473640809e-05, 'epoch': 0.09} {'loss': 0.5435, 'learning_rate': 1.9991210658627944e-05, 'epoch': 0.09} {'loss': 0.5349, 'learning_rate': 1.999119656956962e-05, 'epoch': 0.09} {'loss': 0.3432, 'learning_rate': 1.999118246923314e-05, 'epoch': 0.09} {'loss': 0.329, 'learning_rate': 1.9991168357618508e-05, 'epoch': 0.09} {'loss': 0.4663, 'learning_rate': 1.9991154234725752e-05, 'epoch': 0.09} {'loss': 0.4567, 'learning_rate': 1.999114010055488e-05, 'epoch': 0.09} {'loss': 0.5498, 'learning_rate': 1.9991125955105916e-05, 'epoch': 0.09} {'loss': 0.6601, 'learning_rate': 1.9991111798378862e-05, 'epoch': 0.09} {'loss': 0.3742, 'learning_rate': 1.999109763037375e-05, 'epoch': 0.09} {'loss': 0.6133, 'learning_rate': 1.9991083451090584e-05, 'epoch': 0.09} {'loss': 0.3618, 'learning_rate': 1.999106926052939e-05, 'epoch': 0.09} {'loss': 0.5851, 'learning_rate': 1.9991055058690174e-05, 'epoch': 0.09} {'loss': 0.4552, 'learning_rate': 1.9991040845572955e-05, 'epoch': 0.09} {'loss': 0.7031, 'learning_rate': 1.9991026621177755e-05, 'epoch': 0.09} {'loss': 0.564, 'learning_rate': 1.9991012385504584e-05, 'epoch': 0.09} {'loss': 0.5915, 'learning_rate': 1.9990998138553462e-05, 'epoch': 0.09} {'loss': 0.643, 'learning_rate': 1.99909838803244e-05, 'epoch': 0.09} {'loss': 0.6025, 'learning_rate': 1.9990969610817417e-05, 'epoch': 0.09} {'loss': 0.5357, 'learning_rate': 1.9990955330032533e-05, 'epoch': 0.09} {'loss': 0.5291, 'learning_rate': 1.9990941037969757e-05, 'epoch': 0.09} {'loss': 0.4664, 'learning_rate': 1.999092673462911e-05, 'epoch': 0.09} {'loss': 0.5355, 'learning_rate': 1.9990912420010606e-05, 'epoch': 0.09} {'loss': 0.5631, 'learning_rate': 1.999089809411426e-05, 'epoch': 0.09} {'loss': 0.4617, 'learning_rate': 1.9990883756940092e-05, 'epoch': 0.09} {'loss': 0.5465, 'learning_rate': 1.9990869408488117e-05, 'epoch': 0.09} {'loss': 0.4477, 'learning_rate': 1.999085504875835e-05, 'epoch': 0.09} {'loss': 0.5209, 'learning_rate': 1.999084067775081e-05, 'epoch': 0.09} {'loss': 0.5505, 'learning_rate': 1.99908262954655e-05, 'epoch': 0.09} {'loss': 0.5571, 'learning_rate': 1.999081190190246e-05, 'epoch': 0.09} {'loss': 0.6957, 'learning_rate': 1.9990797497061685e-05, 'epoch': 0.09} {'loss': 0.5072, 'learning_rate': 1.9990783080943202e-05, 'epoch': 0.09} {'loss': 0.5981, 'learning_rate': 1.9990768653547025e-05, 'epoch': 0.09} {'loss': 0.5617, 'learning_rate': 1.999075421487317e-05, 'epoch': 0.09} {'loss': 0.5555, 'learning_rate': 1.9990739764921653e-05, 'epoch': 0.09} {'loss': 0.4922, 'learning_rate': 1.9990725303692493e-05, 'epoch': 0.09} {'loss': 0.536, 'learning_rate': 1.99907108311857e-05, 'epoch': 0.09} {'loss': 0.6266, 'learning_rate': 1.9990696347401294e-05, 'epoch': 0.09} {'loss': 0.5549, 'learning_rate': 1.9990681852339293e-05, 'epoch': 0.09} {'loss': 0.5601, 'learning_rate': 1.9990667345999713e-05, 'epoch': 0.09} {'loss': 0.5154, 'learning_rate': 1.999065282838257e-05, 'epoch': 0.09} {'loss': 0.5933, 'learning_rate': 1.9990638299487877e-05, 'epoch': 0.09} {'loss': 0.7204, 'learning_rate': 1.9990623759315656e-05, 'epoch': 0.09} {'loss': 0.5117, 'learning_rate': 1.9990609207865916e-05, 'epoch': 0.09} {'loss': 0.4031, 'learning_rate': 1.9990594645138682e-05, 'epoch': 0.09} {'loss': 0.571, 'learning_rate': 1.9990580071133966e-05, 'epoch': 0.09} {'loss': 0.606, 'learning_rate': 1.999056548585179e-05, 'epoch': 0.09} {'loss': 0.5706, 'learning_rate': 1.9990550889292154e-05, 'epoch': 0.09} {'loss': 0.5096, 'learning_rate': 1.9990536281455096e-05, 'epoch': 0.09} {'loss': 0.7527, 'learning_rate': 1.9990521662340617e-05, 'epoch': 0.09} {'loss': 0.4539, 'learning_rate': 1.999050703194874e-05, 'epoch': 0.09} {'loss': 0.7325, 'learning_rate': 1.999049239027948e-05, 'epoch': 0.09} {'loss': 0.4859, 'learning_rate': 1.9990477737332855e-05, 'epoch': 0.09} {'loss': 0.4453, 'learning_rate': 1.9990463073108877e-05, 'epoch': 0.09} {'loss': 0.6613, 'learning_rate': 1.999044839760757e-05, 'epoch': 0.09} {'loss': 0.5064, 'learning_rate': 1.9990433710828946e-05, 'epoch': 0.09} {'loss': 0.4084, 'learning_rate': 1.999041901277302e-05, 'epoch': 0.09} {'loss': 0.7738, 'learning_rate': 1.999040430343981e-05, 'epoch': 0.09} {'loss': 0.511, 'learning_rate': 1.9990389582829338e-05, 'epoch': 0.09} {'loss': 0.4591, 'learning_rate': 1.9990374850941614e-05, 'epoch': 0.09} {'loss': 0.6569, 'learning_rate': 1.9990360107776653e-05, 'epoch': 0.09} {'loss': 0.5759, 'learning_rate': 1.999034535333448e-05, 'epoch': 0.09} {'loss': 0.5711, 'learning_rate': 1.9990330587615103e-05, 'epoch': 0.09} {'loss': 0.2748, 'learning_rate': 1.9990315810618545e-05, 'epoch': 0.09} {'loss': 0.6109, 'learning_rate': 1.999030102234482e-05, 'epoch': 0.09} {'loss': 0.3882, 'learning_rate': 1.9990286222793944e-05, 'epoch': 0.09} {'loss': 0.5602, 'learning_rate': 1.9990271411965937e-05, 'epoch': 0.09} {'loss': 0.4267, 'learning_rate': 1.999025658986081e-05, 'epoch': 0.09} {'loss': 0.4629, 'learning_rate': 1.9990241756478585e-05, 'epoch': 0.09} {'loss': 0.3273, 'learning_rate': 1.9990226911819274e-05, 'epoch': 0.09} {'loss': 0.4551, 'learning_rate': 1.99902120558829e-05, 'epoch': 0.09} {'loss': 0.5009, 'learning_rate': 1.9990197188669476e-05, 'epoch': 0.09} {'loss': 0.6135, 'learning_rate': 1.9990182310179018e-05, 'epoch': 0.09} {'loss': 0.6378, 'learning_rate': 1.9990167420411542e-05, 'epoch': 0.09} {'loss': 0.4228, 'learning_rate': 1.999015251936707e-05, 'epoch': 0.09} {'loss': 0.5239, 'learning_rate': 1.9990137607045614e-05, 'epoch': 0.09} {'loss': 0.5198, 'learning_rate': 1.999012268344719e-05, 'epoch': 0.09} {'loss': 0.4681, 'learning_rate': 1.9990107748571824e-05, 'epoch': 0.09} {'loss': 0.535, 'learning_rate': 1.999009280241952e-05, 'epoch': 0.09} {'loss': 0.5497, 'learning_rate': 1.99900778449903e-05, 'epoch': 0.09} {'loss': 0.6227, 'learning_rate': 1.9990062876284186e-05, 'epoch': 0.09} {'loss': 0.5617, 'learning_rate': 1.999004789630119e-05, 'epoch': 0.09} {'loss': 0.5293, 'learning_rate': 1.999003290504133e-05, 'epoch': 0.09} {'loss': 0.4877, 'learning_rate': 1.999001790250462e-05, 'epoch': 0.09} {'loss': 0.6124, 'learning_rate': 1.999000288869108e-05, 'epoch': 0.09} {'loss': 0.46, 'learning_rate': 1.998998786360073e-05, 'epoch': 0.09} {'loss': 0.6326, 'learning_rate': 1.998997282723358e-05, 'epoch': 0.09} {'loss': 0.5582, 'learning_rate': 1.9989957779589652e-05, 'epoch': 0.09} {'loss': 0.5841, 'learning_rate': 1.998994272066896e-05, 'epoch': 0.09} {'loss': 0.3706, 'learning_rate': 1.9989927650471522e-05, 'epoch': 0.09} {'loss': 0.4658, 'learning_rate': 1.9989912568997356e-05, 'epoch': 0.09} {'loss': 0.5106, 'learning_rate': 1.998989747624648e-05, 'epoch': 0.09} {'loss': 0.3918, 'learning_rate': 1.9989882372218905e-05, 'epoch': 0.09} {'loss': 0.4553, 'learning_rate': 1.9989867256914657e-05, 'epoch': 0.09} {'loss': 0.3828, 'learning_rate': 1.9989852130333748e-05, 'epoch': 0.09} {'loss': 0.5583, 'learning_rate': 1.9989836992476193e-05, 'epoch': 0.09} {'loss': 0.4387, 'learning_rate': 1.9989821843342012e-05, 'epoch': 0.09} {'loss': 0.4744, 'learning_rate': 1.9989806682931223e-05, 'epoch': 0.09} {'loss': 0.4036, 'learning_rate': 1.9989791511243844e-05, 'epoch': 0.09} {'loss': 0.5433, 'learning_rate': 1.9989776328279888e-05, 'epoch': 0.09} {'loss': 0.5379, 'learning_rate': 1.9989761134039375e-05, 'epoch': 0.09} {'loss': 0.4814, 'learning_rate': 1.998974592852232e-05, 'epoch': 0.09} {'loss': 0.6991, 'learning_rate': 1.998973071172874e-05, 'epoch': 0.09} {'loss': 0.4398, 'learning_rate': 1.9989715483658656e-05, 'epoch': 0.09} {'loss': 0.4931, 'learning_rate': 1.9989700244312084e-05, 'epoch': 0.09} {'loss': 0.3859, 'learning_rate': 1.9989684993689037e-05, 'epoch': 0.09} {'loss': 0.4489, 'learning_rate': 1.9989669731789535e-05, 'epoch': 0.09} {'loss': 0.4985, 'learning_rate': 1.99896544586136e-05, 'epoch': 0.09} {'loss': 0.4851, 'learning_rate': 1.998963917416124e-05, 'epoch': 0.09} {'loss': 0.6407, 'learning_rate': 1.998962387843248e-05, 'epoch': 0.09} {'loss': 0.5899, 'learning_rate': 1.9989608571427333e-05, 'epoch': 0.09} {'loss': 0.779, 'learning_rate': 1.998959325314582e-05, 'epoch': 0.09} {'loss': 0.7286, 'learning_rate': 1.998957792358795e-05, 'epoch': 0.09} {'loss': 0.5721, 'learning_rate': 1.9989562582753753e-05, 'epoch': 0.09} {'loss': 0.6498, 'learning_rate': 1.9989547230643234e-05, 'epoch': 0.09} {'loss': 0.3498, 'learning_rate': 1.998953186725642e-05, 'epoch': 0.09} {'loss': 0.5776, 'learning_rate': 1.998951649259332e-05, 'epoch': 0.09} {'loss': 0.4169, 'learning_rate': 1.9989501106653955e-05, 'epoch': 0.09} {'loss': 0.4895, 'learning_rate': 1.998948570943835e-05, 'epoch': 0.09} {'loss': 0.5862, 'learning_rate': 1.9989470300946507e-05, 'epoch': 0.09} {'loss': 0.6091, 'learning_rate': 1.9989454881178455e-05, 'epoch': 0.09} {'loss': 0.5817, 'learning_rate': 1.9989439450134208e-05, 'epoch': 0.09} {'loss': 0.6709, 'learning_rate': 1.9989424007813785e-05, 'epoch': 0.09} {'loss': 0.5377, 'learning_rate': 1.99894085542172e-05, 'epoch': 0.09} {'loss': 0.4067, 'learning_rate': 1.9989393089344472e-05, 'epoch': 0.09} {'loss': 0.4727, 'learning_rate': 1.998937761319562e-05, 'epoch': 0.09} {'loss': 0.5645, 'learning_rate': 1.998936212577066e-05, 'epoch': 0.09} {'loss': 0.6393, 'learning_rate': 1.9989346627069612e-05, 'epoch': 0.09} {'loss': 0.48, 'learning_rate': 1.9989331117092486e-05, 'epoch': 0.09} {'loss': 0.5112, 'learning_rate': 1.998931559583931e-05, 'epoch': 0.09} {'loss': 0.534, 'learning_rate': 1.9989300063310094e-05, 'epoch': 0.09} {'loss': 0.6203, 'learning_rate': 1.9989284519504854e-05, 'epoch': 0.09} {'loss': 0.5187, 'learning_rate': 1.9989268964423617e-05, 'epoch': 0.09} {'loss': 0.741, 'learning_rate': 1.9989253398066393e-05, 'epoch': 0.09} {'loss': 0.3486, 'learning_rate': 1.9989237820433202e-05, 'epoch': 0.09} {'loss': 0.386, 'learning_rate': 1.998922223152406e-05, 'epoch': 0.09} {'loss': 0.5498, 'learning_rate': 1.9989206631338987e-05, 'epoch': 0.09} {'loss': 0.5546, 'learning_rate': 1.9989191019877997e-05, 'epoch': 0.09} {'loss': 0.369, 'learning_rate': 1.998917539714111e-05, 'epoch': 0.09} {'loss': 0.4184, 'learning_rate': 1.9989159763128346e-05, 'epoch': 0.09} {'loss': 0.4857, 'learning_rate': 1.9989144117839717e-05, 'epoch': 0.09} {'loss': 0.5268, 'learning_rate': 1.9989128461275245e-05, 'epoch': 0.09} {'loss': 0.4472, 'learning_rate': 1.998911279343495e-05, 'epoch': 0.09} {'loss': 0.5666, 'learning_rate': 1.998909711431884e-05, 'epoch': 0.09} {'loss': 0.5707, 'learning_rate': 1.9989081423926945e-05, 'epoch': 0.09} {'loss': 0.4984, 'learning_rate': 1.998906572225927e-05, 'epoch': 0.09} {'loss': 0.6238, 'learning_rate': 1.9989050009315846e-05, 'epoch': 0.09} {'loss': 0.4401, 'learning_rate': 1.9989034285096678e-05, 'epoch': 0.09} {'loss': 0.5175, 'learning_rate': 1.9989018549601794e-05, 'epoch': 0.09} {'loss': 0.7021, 'learning_rate': 1.9989002802831207e-05, 'epoch': 0.09} {'loss': 0.6309, 'learning_rate': 1.9988987044784935e-05, 'epoch': 0.09} {'loss': 0.5485, 'learning_rate': 1.9988971275462994e-05, 'epoch': 0.09} {'loss': 0.506, 'learning_rate': 1.9988955494865404e-05, 'epoch': 0.09} {'loss': 0.6258, 'learning_rate': 1.9988939702992187e-05, 'epoch': 0.09} {'loss': 0.5259, 'learning_rate': 1.9988923899843355e-05, 'epoch': 0.09} {'loss': 0.4578, 'learning_rate': 1.9988908085418925e-05, 'epoch': 0.09} {'loss': 0.4916, 'learning_rate': 1.998889225971892e-05, 'epoch': 0.09} {'loss': 0.8113, 'learning_rate': 1.998887642274335e-05, 'epoch': 0.09} {'loss': 0.3832, 'learning_rate': 1.9988860574492244e-05, 'epoch': 0.09} {'loss': 0.5917, 'learning_rate': 1.998884471496561e-05, 'epoch': 0.09} {'loss': 0.5906, 'learning_rate': 1.9988828844163475e-05, 'epoch': 0.09} {'loss': 0.3999, 'learning_rate': 1.9988812962085846e-05, 'epoch': 0.09} {'loss': 0.5585, 'learning_rate': 1.998879706873275e-05, 'epoch': 0.09} {'loss': 0.5623, 'learning_rate': 1.99887811641042e-05, 'epoch': 0.09} {'loss': 0.5086, 'learning_rate': 1.9988765248200215e-05, 'epoch': 0.09} {'loss': 0.5768, 'learning_rate': 1.9988749321020813e-05, 'epoch': 0.09} {'loss': 0.4331, 'learning_rate': 1.9988733382566016e-05, 'epoch': 0.09} {'loss': 0.6588, 'learning_rate': 1.9988717432835835e-05, 'epoch': 0.09} {'loss': 0.5386, 'learning_rate': 1.998870147183029e-05, 'epoch': 0.09} {'loss': 0.5406, 'learning_rate': 1.9988685499549406e-05, 'epoch': 0.09} {'loss': 0.4587, 'learning_rate': 1.9988669515993192e-05, 'epoch': 0.09} {'loss': 0.4939, 'learning_rate': 1.9988653521161668e-05, 'epoch': 0.09} {'loss': 0.5432, 'learning_rate': 1.9988637515054858e-05, 'epoch': 0.09} {'loss': 0.6097, 'learning_rate': 1.9988621497672773e-05, 'epoch': 0.09} {'loss': 0.5642, 'learning_rate': 1.9988605469015435e-05, 'epoch': 0.09} {'loss': 0.7116, 'learning_rate': 1.998858942908286e-05, 'epoch': 0.09} {'loss': 0.5368, 'learning_rate': 1.9988573377875065e-05, 'epoch': 0.09} {'loss': 0.5643, 'learning_rate': 1.9988557315392074e-05, 'epoch': 0.09} {'loss': 0.6417, 'learning_rate': 1.99885412416339e-05, 'epoch': 0.09} {'loss': 0.5322, 'learning_rate': 1.998852515660056e-05, 'epoch': 0.09} {'loss': 0.5055, 'learning_rate': 1.9988509060292078e-05, 'epoch': 0.09} {'loss': 0.4862, 'learning_rate': 1.9988492952708464e-05, 'epoch': 0.09} {'loss': 0.3496, 'learning_rate': 1.9988476833849745e-05, 'epoch': 0.09} {'loss': 0.5437, 'learning_rate': 1.9988460703715936e-05, 'epoch': 0.09} {'loss': 0.596, 'learning_rate': 1.998844456230705e-05, 'epoch': 0.09} {'loss': 0.5134, 'learning_rate': 1.9988428409623114e-05, 'epoch': 0.09} {'loss': 0.6513, 'learning_rate': 1.998841224566414e-05, 'epoch': 0.09} {'loss': 0.6334, 'learning_rate': 1.9988396070430145e-05, 'epoch': 0.09} {'loss': 0.544, 'learning_rate': 1.9988379883921153e-05, 'epoch': 0.09} {'loss': 0.6672, 'learning_rate': 1.9988363686137178e-05, 'epoch': 0.09} {'loss': 0.446, 'learning_rate': 1.998834747707824e-05, 'epoch': 0.09} {'loss': 0.5063, 'learning_rate': 1.9988331256744358e-05, 'epoch': 0.09} {'loss': 0.4865, 'learning_rate': 1.998831502513555e-05, 'epoch': 0.09} {'loss': 0.5501, 'learning_rate': 1.998829878225183e-05, 'epoch': 0.09} {'loss': 0.4466, 'learning_rate': 1.9988282528093225e-05, 'epoch': 0.09} {'loss': 0.558, 'learning_rate': 1.9988266262659747e-05, 'epoch': 0.09} {'loss': 0.4407, 'learning_rate': 1.9988249985951413e-05, 'epoch': 0.09} {'loss': 0.6133, 'learning_rate': 1.9988233697968247e-05, 'epoch': 0.09} {'loss': 0.4329, 'learning_rate': 1.9988217398710263e-05, 'epoch': 0.09} {'loss': 0.3994, 'learning_rate': 1.998820108817748e-05, 'epoch': 0.09} {'loss': 0.452, 'learning_rate': 1.998818476636992e-05, 'epoch': 0.09} {'loss': 0.5265, 'learning_rate': 1.9988168433287597e-05, 'epoch': 0.09} {'loss': 0.4946, 'learning_rate': 1.9988152088930533e-05, 'epoch': 0.09} {'loss': 0.3878, 'learning_rate': 1.9988135733298742e-05, 'epoch': 0.09} {'loss': 0.4869, 'learning_rate': 1.9988119366392248e-05, 'epoch': 0.09} {'loss': 0.6162, 'learning_rate': 1.9988102988211064e-05, 'epoch': 0.09} {'loss': 0.621, 'learning_rate': 1.998808659875521e-05, 'epoch': 0.09} {'loss': 0.5096, 'learning_rate': 1.998807019802471e-05, 'epoch': 0.09} {'loss': 0.5018, 'learning_rate': 1.9988053786019576e-05, 'epoch': 0.09} {'loss': 0.4285, 'learning_rate': 1.9988037362739827e-05, 'epoch': 0.09} {'loss': 0.473, 'learning_rate': 1.9988020928185484e-05, 'epoch': 0.09} {'loss': 0.4745, 'learning_rate': 1.9988004482356566e-05, 'epoch': 0.09} {'loss': 0.6666, 'learning_rate': 1.9987988025253087e-05, 'epoch': 0.09} {'loss': 0.6159, 'learning_rate': 1.9987971556875072e-05, 'epoch': 0.09} {'loss': 0.6203, 'learning_rate': 1.9987955077222536e-05, 'epoch': 0.09} {'loss': 0.4563, 'learning_rate': 1.9987938586295497e-05, 'epoch': 0.09} {'loss': 0.4177, 'learning_rate': 1.9987922084093975e-05, 'epoch': 0.09} {'loss': 0.7085, 'learning_rate': 1.9987905570617988e-05, 'epoch': 0.09} {'loss': 0.456, 'learning_rate': 1.9987889045867558e-05, 'epoch': 0.09} {'loss': 0.4319, 'learning_rate': 1.9987872509842696e-05, 'epoch': 0.09} {'loss': 0.5869, 'learning_rate': 1.998785596254343e-05, 'epoch': 0.09} {'loss': 0.5825, 'learning_rate': 1.9987839403969767e-05, 'epoch': 0.09} {'loss': 0.6573, 'learning_rate': 1.9987822834121738e-05, 'epoch': 0.09} {'loss': 0.4969, 'learning_rate': 1.9987806252999355e-05, 'epoch': 0.09} {'loss': 0.5487, 'learning_rate': 1.9987789660602637e-05, 'epoch': 0.09} {'loss': 0.5091, 'learning_rate': 1.9987773056931607e-05, 'epoch': 0.09} {'loss': 0.5248, 'learning_rate': 1.9987756441986276e-05, 'epoch': 0.09} {'loss': 0.4028, 'learning_rate': 1.9987739815766673e-05, 'epoch': 0.09} {'loss': 0.5802, 'learning_rate': 1.9987723178272803e-05, 'epoch': 0.09} {'loss': 0.6466, 'learning_rate': 1.9987706529504698e-05, 'epoch': 0.09} {'loss': 0.729, 'learning_rate': 1.998768986946237e-05, 'epoch': 0.09} {'loss': 0.6436, 'learning_rate': 1.9987673198145843e-05, 'epoch': 0.09} {'loss': 0.4174, 'learning_rate': 1.9987656515555126e-05, 'epoch': 0.09} {'loss': 0.8231, 'learning_rate': 1.9987639821690248e-05, 'epoch': 0.09} {'loss': 0.5153, 'learning_rate': 1.9987623116551223e-05, 'epoch': 0.09} {'loss': 0.3667, 'learning_rate': 1.9987606400138074e-05, 'epoch': 0.09} {'loss': 0.4156, 'learning_rate': 1.9987589672450812e-05, 'epoch': 0.09} {'loss': 0.6139, 'learning_rate': 1.998757293348946e-05, 'epoch': 0.09} {'loss': 0.3949, 'learning_rate': 1.998755618325404e-05, 'epoch': 0.09} {'loss': 0.4208, 'learning_rate': 1.9987539421744567e-05, 'epoch': 0.09} {'loss': 0.5385, 'learning_rate': 1.9987522648961064e-05, 'epoch': 0.09} {'loss': 0.6736, 'learning_rate': 1.9987505864903545e-05, 'epoch': 0.09} {'loss': 0.5093, 'learning_rate': 1.998748906957203e-05, 'epoch': 0.09} {'loss': 0.6145, 'learning_rate': 1.998747226296654e-05, 'epoch': 0.09} {'loss': 0.3801, 'learning_rate': 1.9987455445087094e-05, 'epoch': 0.09} {'loss': 0.4487, 'learning_rate': 1.998743861593371e-05, 'epoch': 0.09} {'loss': 0.5211, 'learning_rate': 1.9987421775506407e-05, 'epoch': 0.09} {'loss': 0.5448, 'learning_rate': 1.9987404923805204e-05, 'epoch': 0.09} {'loss': 0.6324, 'learning_rate': 1.9987388060830117e-05, 'epoch': 0.09} {'loss': 0.4721, 'learning_rate': 1.998737118658117e-05, 'epoch': 0.09} {'loss': 0.5145, 'learning_rate': 1.998735430105838e-05, 'epoch': 0.09} {'loss': 0.4936, 'learning_rate': 1.9987337404261767e-05, 'epoch': 0.09} {'loss': 0.6214, 'learning_rate': 1.998732049619135e-05, 'epoch': 0.09} {'loss': 0.5314, 'learning_rate': 1.9987303576847146e-05, 'epoch': 0.09} {'loss': 0.6834, 'learning_rate': 1.9987286646229177e-05, 'epoch': 0.09} {'loss': 0.4582, 'learning_rate': 1.9987269704337456e-05, 'epoch': 0.09} {'loss': 0.3765, 'learning_rate': 1.998725275117201e-05, 'epoch': 0.09} {'loss': 0.5587, 'learning_rate': 1.9987235786732854e-05, 'epoch': 0.09} {'loss': 0.6572, 'learning_rate': 1.998721881102001e-05, 'epoch': 0.09} {'loss': 0.6528, 'learning_rate': 1.9987201824033496e-05, 'epoch': 0.09} {'loss': 0.4938, 'learning_rate': 1.998718482577333e-05, 'epoch': 0.09} {'loss': 0.48, 'learning_rate': 1.9987167816239526e-05, 'epoch': 0.09} {'loss': 0.5068, 'learning_rate': 1.998715079543211e-05, 'epoch': 0.09} {'loss': 0.4331, 'learning_rate': 1.9987133763351104e-05, 'epoch': 0.09} {'loss': 0.6316, 'learning_rate': 1.9987116719996522e-05, 'epoch': 0.09} {'loss': 0.636, 'learning_rate': 1.9987099665368383e-05, 'epoch': 0.09} {'loss': 0.587, 'learning_rate': 1.998708259946671e-05, 'epoch': 0.09} {'loss': 0.5258, 'learning_rate': 1.9987065522291515e-05, 'epoch': 0.09} {'loss': 0.5735, 'learning_rate': 1.9987048433842827e-05, 'epoch': 0.09} {'loss': 0.4498, 'learning_rate': 1.998703133412066e-05, 'epoch': 0.09} {'loss': 0.5224, 'learning_rate': 1.998701422312503e-05, 'epoch': 0.09} {'loss': 0.5876, 'learning_rate': 1.9986997100855964e-05, 'epoch': 0.09} {'loss': 0.5304, 'learning_rate': 1.9986979967313475e-05, 'epoch': 0.09} {'loss': 0.5161, 'learning_rate': 1.9986962822497584e-05, 'epoch': 0.09} {'loss': 0.4939, 'learning_rate': 1.9986945666408314e-05, 'epoch': 0.09} {'loss': 0.4521, 'learning_rate': 1.998692849904568e-05, 'epoch': 0.09} {'loss': 0.4995, 'learning_rate': 1.9986911320409704e-05, 'epoch': 0.09} {'loss': 0.6971, 'learning_rate': 1.99868941305004e-05, 'epoch': 0.09} {'loss': 0.4851, 'learning_rate': 1.9986876929317795e-05, 'epoch': 0.09} {'loss': 0.463, 'learning_rate': 1.9986859716861908e-05, 'epoch': 0.09} {'loss': 0.5371, 'learning_rate': 1.998684249313275e-05, 'epoch': 0.09} {'loss': 0.5938, 'learning_rate': 1.9986825258130348e-05, 'epoch': 0.09} {'loss': 0.6549, 'learning_rate': 1.9986808011854722e-05, 'epoch': 0.09} {'loss': 0.5976, 'learning_rate': 1.9986790754305885e-05, 'epoch': 0.09} {'loss': 0.4926, 'learning_rate': 1.9986773485483862e-05, 'epoch': 0.09} {'loss': 0.6003, 'learning_rate': 1.998675620538867e-05, 'epoch': 0.09} {'loss': 0.4477, 'learning_rate': 1.9986738914020328e-05, 'epoch': 0.09} {'loss': 0.5849, 'learning_rate': 1.9986721611378858e-05, 'epoch': 0.09} {'loss': 0.5954, 'learning_rate': 1.998670429746428e-05, 'epoch': 0.09} {'loss': 0.3467, 'learning_rate': 1.9986686972276612e-05, 'epoch': 0.09} {'loss': 0.5097, 'learning_rate': 1.998666963581587e-05, 'epoch': 0.09} {'loss': 0.3952, 'learning_rate': 1.998665228808208e-05, 'epoch': 0.09} {'loss': 0.4804, 'learning_rate': 1.998663492907526e-05, 'epoch': 0.09} {'loss': 0.403, 'learning_rate': 1.9986617558795424e-05, 'epoch': 0.09} {'loss': 0.3976, 'learning_rate': 1.9986600177242602e-05, 'epoch': 0.09} {'loss': 0.4866, 'learning_rate': 1.9986582784416802e-05, 'epoch': 0.09} {'loss': 0.5955, 'learning_rate': 1.998656538031805e-05, 'epoch': 0.09} {'loss': 0.6595, 'learning_rate': 1.9986547964946365e-05, 'epoch': 0.09} {'loss': 0.4785, 'learning_rate': 1.998653053830177e-05, 'epoch': 0.09} {'loss': 0.5374, 'learning_rate': 1.9986513100384275e-05, 'epoch': 0.09} {'loss': 0.5858, 'learning_rate': 1.9986495651193907e-05, 'epoch': 0.09} {'loss': 0.482, 'learning_rate': 1.9986478190730687e-05, 'epoch': 0.09} {'loss': 0.3846, 'learning_rate': 1.998646071899463e-05, 'epoch': 0.09} {'loss': 0.7572, 'learning_rate': 1.998644323598576e-05, 'epoch': 0.09} {'loss': 0.5019, 'learning_rate': 1.9986425741704093e-05, 'epoch': 0.09} {'loss': 0.428, 'learning_rate': 1.9986408236149653e-05, 'epoch': 0.09} {'loss': 0.5114, 'learning_rate': 1.9986390719322454e-05, 'epoch': 0.09} {'loss': 0.6211, 'learning_rate': 1.9986373191222518e-05, 'epoch': 0.09} {'loss': 0.5652, 'learning_rate': 1.9986355651849867e-05, 'epoch': 0.09} {'loss': 0.4662, 'learning_rate': 1.9986338101204522e-05, 'epoch': 0.09} {'loss': 0.3209, 'learning_rate': 1.9986320539286498e-05, 'epoch': 0.09} {'loss': 0.5678, 'learning_rate': 1.9986302966095816e-05, 'epoch': 0.09} {'loss': 0.5812, 'learning_rate': 1.9986285381632498e-05, 'epoch': 0.09} {'loss': 0.714, 'learning_rate': 1.9986267785896564e-05, 'epoch': 0.09} {'loss': 0.5151, 'learning_rate': 1.998625017888803e-05, 'epoch': 0.09} {'loss': 0.4507, 'learning_rate': 1.9986232560606923e-05, 'epoch': 0.09} {'loss': 0.5708, 'learning_rate': 1.9986214931053252e-05, 'epoch': 0.09} {'loss': 0.5578, 'learning_rate': 1.998619729022705e-05, 'epoch': 0.09} {'loss': 0.4898, 'learning_rate': 1.9986179638128328e-05, 'epoch': 0.09} {'loss': 0.4335, 'learning_rate': 1.9986161974757105e-05, 'epoch': 0.09} {'loss': 0.5258, 'learning_rate': 1.9986144300113408e-05, 'epoch': 0.09} {'loss': 0.4226, 'learning_rate': 1.998612661419725e-05, 'epoch': 0.09} {'loss': 0.6116, 'learning_rate': 1.9986108917008657e-05, 'epoch': 0.09} {'loss': 0.3688, 'learning_rate': 1.9986091208547643e-05, 'epoch': 0.09} {'loss': 0.4949, 'learning_rate': 1.998607348881423e-05, 'epoch': 0.09} {'loss': 0.3997, 'learning_rate': 1.9986055757808443e-05, 'epoch': 0.09} {'loss': 0.4449, 'learning_rate': 1.9986038015530297e-05, 'epoch': 0.09} {'loss': 0.5768, 'learning_rate': 1.9986020261979812e-05, 'epoch': 0.09} {'loss': 0.6293, 'learning_rate': 1.998600249715701e-05, 'epoch': 0.09} {'loss': 0.5639, 'learning_rate': 1.9985984721061907e-05, 'epoch': 0.09} {'loss': 0.4683, 'learning_rate': 1.9985966933694533e-05, 'epoch': 0.09} {'loss': 0.5525, 'learning_rate': 1.9985949135054892e-05, 'epoch': 0.09} {'loss': 0.4724, 'learning_rate': 1.998593132514302e-05, 'epoch': 0.09} {'loss': 0.5785, 'learning_rate': 1.998591350395893e-05, 'epoch': 0.09} {'loss': 0.5654, 'learning_rate': 1.9985895671502642e-05, 'epoch': 0.09} {'loss': 0.587, 'learning_rate': 1.9985877827774174e-05, 'epoch': 0.09} {'loss': 0.4864, 'learning_rate': 1.998585997277355e-05, 'epoch': 0.09} {'loss': 0.4168, 'learning_rate': 1.998584210650079e-05, 'epoch': 0.09} {'loss': 0.5841, 'learning_rate': 1.9985824228955916e-05, 'epoch': 0.1} {'loss': 0.5029, 'learning_rate': 1.998580634013894e-05, 'epoch': 0.1} {'loss': 0.4776, 'learning_rate': 1.998578844004989e-05, 'epoch': 0.1} {'loss': 0.6063, 'learning_rate': 1.9985770528688783e-05, 'epoch': 0.1} {'loss': 0.7054, 'learning_rate': 1.998575260605564e-05, 'epoch': 0.1} {'loss': 0.5542, 'learning_rate': 1.998573467215048e-05, 'epoch': 0.1} {'loss': 0.3849, 'learning_rate': 1.9985716726973326e-05, 'epoch': 0.1} {'loss': 0.4456, 'learning_rate': 1.99856987705242e-05, 'epoch': 0.1} {'loss': 0.5337, 'learning_rate': 1.9985680802803116e-05, 'epoch': 0.1} {'loss': 0.5514, 'learning_rate': 1.9985662823810096e-05, 'epoch': 0.1} {'loss': 0.4971, 'learning_rate': 1.998564483354516e-05, 'epoch': 0.1} {'loss': 0.5323, 'learning_rate': 1.9985626832008336e-05, 'epoch': 0.1} {'loss': 0.7352, 'learning_rate': 1.9985608819199633e-05, 'epoch': 0.1} {'loss': 0.5882, 'learning_rate': 1.9985590795119077e-05, 'epoch': 0.1} {'loss': 0.3856, 'learning_rate': 1.998557275976669e-05, 'epoch': 0.1} {'loss': 0.3931, 'learning_rate': 1.9985554713142488e-05, 'epoch': 0.1} {'loss': 0.4323, 'learning_rate': 1.9985536655246496e-05, 'epoch': 0.1} {'loss': 0.5848, 'learning_rate': 1.9985518586078728e-05, 'epoch': 0.1} {'loss': 0.5954, 'learning_rate': 1.998550050563921e-05, 'epoch': 0.1} {'loss': 0.4236, 'learning_rate': 1.9985482413927967e-05, 'epoch': 0.1} {'loss': 0.4671, 'learning_rate': 1.9985464310945004e-05, 'epoch': 0.1} {'loss': 0.6006, 'learning_rate': 1.9985446196690357e-05, 'epoch': 0.1} {'loss': 0.6103, 'learning_rate': 1.9985428071164036e-05, 'epoch': 0.1} {'loss': 0.4845, 'learning_rate': 1.9985409934366067e-05, 'epoch': 0.1} {'loss': 0.4603, 'learning_rate': 1.998539178629647e-05, 'epoch': 0.1} {'loss': 0.6878, 'learning_rate': 1.9985373626955264e-05, 'epoch': 0.1} {'loss': 0.5001, 'learning_rate': 1.9985355456342467e-05, 'epoch': 0.1} {'loss': 0.6228, 'learning_rate': 1.9985337274458107e-05, 'epoch': 0.1} {'loss': 0.5606, 'learning_rate': 1.99853190813022e-05, 'epoch': 0.1} {'loss': 0.4729, 'learning_rate': 1.998530087687476e-05, 'epoch': 0.1} {'loss': 0.3401, 'learning_rate': 1.9985282661175823e-05, 'epoch': 0.1} {'loss': 0.6296, 'learning_rate': 1.9985264434205394e-05, 'epoch': 0.1} {'loss': 0.7627, 'learning_rate': 1.99852461959635e-05, 'epoch': 0.1} {'loss': 0.6549, 'learning_rate': 1.9985227946450167e-05, 'epoch': 0.1} {'loss': 0.5534, 'learning_rate': 1.9985209685665406e-05, 'epoch': 0.1} {'loss': 0.498, 'learning_rate': 1.9985191413609243e-05, 'epoch': 0.1} {'loss': 0.5188, 'learning_rate': 1.99851731302817e-05, 'epoch': 0.1} {'loss': 0.4813, 'learning_rate': 1.9985154835682798e-05, 'epoch': 0.1} {'loss': 0.6145, 'learning_rate': 1.9985136529812547e-05, 'epoch': 0.1} {'loss': 0.689, 'learning_rate': 1.998511821267098e-05, 'epoch': 0.1} {'loss': 0.5749, 'learning_rate': 1.998509988425811e-05, 'epoch': 0.1} {'loss': 0.5937, 'learning_rate': 1.9985081544573966e-05, 'epoch': 0.1} {'loss': 0.4993, 'learning_rate': 1.998506319361856e-05, 'epoch': 0.1} {'loss': 0.4611, 'learning_rate': 1.998504483139192e-05, 'epoch': 0.1} {'loss': 0.5755, 'learning_rate': 1.998502645789406e-05, 'epoch': 0.1} {'loss': 0.8128, 'learning_rate': 1.9985008073125006e-05, 'epoch': 0.1} {'loss': 0.4917, 'learning_rate': 1.9984989677084778e-05, 'epoch': 0.1} {'loss': 0.6467, 'learning_rate': 1.998497126977339e-05, 'epoch': 0.1} {'loss': 0.4878, 'learning_rate': 1.998495285119087e-05, 'epoch': 0.1} {'loss': 0.5186, 'learning_rate': 1.998493442133724e-05, 'epoch': 0.1} {'loss': 0.5817, 'learning_rate': 1.9984915980212514e-05, 'epoch': 0.1} {'loss': 0.4388, 'learning_rate': 1.9984897527816717e-05, 'epoch': 0.1} {'loss': 0.6206, 'learning_rate': 1.9984879064149872e-05, 'epoch': 0.1} {'loss': 0.5927, 'learning_rate': 1.9984860589211995e-05, 'epoch': 0.1} {'loss': 0.6306, 'learning_rate': 1.998484210300311e-05, 'epoch': 0.1} {'loss': 0.6103, 'learning_rate': 1.998482360552324e-05, 'epoch': 0.1} {'loss': 0.5958, 'learning_rate': 1.99848050967724e-05, 'epoch': 0.1} {'loss': 0.3659, 'learning_rate': 1.9984786576750613e-05, 'epoch': 0.1} {'loss': 0.5476, 'learning_rate': 1.9984768045457898e-05, 'epoch': 0.1} {'loss': 0.3383, 'learning_rate': 1.9984749502894282e-05, 'epoch': 0.1} {'loss': 0.5297, 'learning_rate': 1.9984730949059784e-05, 'epoch': 0.1} {'loss': 0.4892, 'learning_rate': 1.9984712383954422e-05, 'epoch': 0.1} {'loss': 0.4252, 'learning_rate': 1.9984693807578216e-05, 'epoch': 0.1} {'loss': 0.4607, 'learning_rate': 1.9984675219931194e-05, 'epoch': 0.1} {'loss': 0.5057, 'learning_rate': 1.998465662101337e-05, 'epoch': 0.1} {'loss': 0.4484, 'learning_rate': 1.9984638010824765e-05, 'epoch': 0.1} {'loss': 0.5204, 'learning_rate': 1.9984619389365407e-05, 'epoch': 0.1} {'loss': 0.5268, 'learning_rate': 1.998460075663531e-05, 'epoch': 0.1} {'loss': 0.6501, 'learning_rate': 1.9984582112634493e-05, 'epoch': 0.1} {'loss': 0.5251, 'learning_rate': 1.998456345736299e-05, 'epoch': 0.1} {'loss': 0.4024, 'learning_rate': 1.9984544790820807e-05, 'epoch': 0.1} {'loss': 0.4315, 'learning_rate': 1.9984526113007974e-05, 'epoch': 0.1} {'loss': 0.663, 'learning_rate': 1.9984507423924507e-05, 'epoch': 0.1} {'loss': 0.547, 'learning_rate': 1.9984488723570433e-05, 'epoch': 0.1} {'loss': 0.677, 'learning_rate': 1.9984470011945773e-05, 'epoch': 0.1} {'loss': 0.5904, 'learning_rate': 1.998445128905054e-05, 'epoch': 0.1} {'loss': 0.5317, 'learning_rate': 1.998443255488476e-05, 'epoch': 0.1} {'loss': 0.5992, 'learning_rate': 1.998441380944846e-05, 'epoch': 0.1} {'loss': 0.6553, 'learning_rate': 1.9984395052741646e-05, 'epoch': 0.1} {'loss': 0.4517, 'learning_rate': 1.9984376284764354e-05, 'epoch': 0.1} {'loss': 0.4541, 'learning_rate': 1.99843575055166e-05, 'epoch': 0.1} {'loss': 0.3096, 'learning_rate': 1.9984338714998405e-05, 'epoch': 0.1} {'loss': 0.4513, 'learning_rate': 1.9984319913209788e-05, 'epoch': 0.1} {'loss': 0.5249, 'learning_rate': 1.9984301100150777e-05, 'epoch': 0.1} {'loss': 0.549, 'learning_rate': 1.9984282275821384e-05, 'epoch': 0.1} {'loss': 0.6525, 'learning_rate': 1.9984263440221637e-05, 'epoch': 0.1} {'loss': 0.4615, 'learning_rate': 1.9984244593351555e-05, 'epoch': 0.1} {'loss': 0.4262, 'learning_rate': 1.9984225735211157e-05, 'epoch': 0.1} {'loss': 0.6091, 'learning_rate': 1.998420686580047e-05, 'epoch': 0.1} {'loss': 0.6815, 'learning_rate': 1.998418798511951e-05, 'epoch': 0.1} {'loss': 0.5755, 'learning_rate': 1.99841690931683e-05, 'epoch': 0.1} {'loss': 0.4244, 'learning_rate': 1.9984150189946865e-05, 'epoch': 0.1} {'loss': 0.4854, 'learning_rate': 1.998413127545522e-05, 'epoch': 0.1} {'loss': 0.4396, 'learning_rate': 1.9984112349693392e-05, 'epoch': 0.1} {'loss': 0.4887, 'learning_rate': 1.9984093412661396e-05, 'epoch': 0.1} {'loss': 0.5074, 'learning_rate': 1.998407446435926e-05, 'epoch': 0.1} {'loss': 0.7035, 'learning_rate': 1.9984055504787002e-05, 'epoch': 0.1} {'loss': 0.6079, 'learning_rate': 1.9984036533944642e-05, 'epoch': 0.1} {'loss': 0.4026, 'learning_rate': 1.9984017551832204e-05, 'epoch': 0.1} {'loss': 0.5922, 'learning_rate': 1.998399855844971e-05, 'epoch': 0.1} {'loss': 0.4842, 'learning_rate': 1.998397955379718e-05, 'epoch': 0.1} {'loss': 0.4917, 'learning_rate': 1.9983960537874637e-05, 'epoch': 0.1} {'loss': 0.5718, 'learning_rate': 1.99839415106821e-05, 'epoch': 0.1} {'loss': 0.5563, 'learning_rate': 1.998392247221959e-05, 'epoch': 0.1} {'loss': 0.6998, 'learning_rate': 1.998390342248713e-05, 'epoch': 0.1} {'loss': 0.6442, 'learning_rate': 1.998388436148474e-05, 'epoch': 0.1} {'loss': 0.4573, 'learning_rate': 1.998386528921245e-05, 'epoch': 0.1} {'loss': 0.5542, 'learning_rate': 1.998384620567027e-05, 'epoch': 0.1} {'loss': 0.495, 'learning_rate': 1.9983827110858226e-05, 'epoch': 0.1} {'loss': 0.4649, 'learning_rate': 1.998380800477634e-05, 'epoch': 0.1} {'loss': 0.4551, 'learning_rate': 1.9983788887424632e-05, 'epoch': 0.1} {'loss': 0.5114, 'learning_rate': 1.9983769758803128e-05, 'epoch': 0.1} {'loss': 0.4983, 'learning_rate': 1.9983750618911846e-05, 'epoch': 0.1} {'loss': 0.4658, 'learning_rate': 1.9983731467750805e-05, 'epoch': 0.1} {'loss': 0.4754, 'learning_rate': 1.9983712305320032e-05, 'epoch': 0.1} {'loss': 0.384, 'learning_rate': 1.9983693131619546e-05, 'epoch': 0.1} {'loss': 0.5279, 'learning_rate': 1.9983673946649368e-05, 'epoch': 0.1} {'loss': 0.4956, 'learning_rate': 1.998365475040952e-05, 'epoch': 0.1} {'loss': 0.6874, 'learning_rate': 1.9983635542900027e-05, 'epoch': 0.1} {'loss': 0.5871, 'learning_rate': 1.9983616324120905e-05, 'epoch': 0.1} {'loss': 0.6099, 'learning_rate': 1.9983597094072182e-05, 'epoch': 0.1} {'loss': 0.539, 'learning_rate': 1.9983577852753876e-05, 'epoch': 0.1} {'loss': 0.5198, 'learning_rate': 1.9983558600166006e-05, 'epoch': 0.1} {'loss': 0.649, 'learning_rate': 1.9983539336308597e-05, 'epoch': 0.1} {'loss': 0.4271, 'learning_rate': 1.998352006118167e-05, 'epoch': 0.1} {'loss': 0.6757, 'learning_rate': 1.998350077478525e-05, 'epoch': 0.1} {'loss': 0.5772, 'learning_rate': 1.998348147711936e-05, 'epoch': 0.1} {'loss': 0.5442, 'learning_rate': 1.9983462168184008e-05, 'epoch': 0.1} {'loss': 0.5648, 'learning_rate': 1.9983442847979233e-05, 'epoch': 0.1} {'loss': 0.4451, 'learning_rate': 1.9983423516505047e-05, 'epoch': 0.1} {'loss': 0.5805, 'learning_rate': 1.9983404173761474e-05, 'epoch': 0.1} {'loss': 0.7061, 'learning_rate': 1.9983384819748537e-05, 'epoch': 0.1} {'loss': 0.5023, 'learning_rate': 1.9983365454466258e-05, 'epoch': 0.1} {'loss': 0.5628, 'learning_rate': 1.9983346077914656e-05, 'epoch': 0.1} {'loss': 0.4641, 'learning_rate': 1.9983326690093754e-05, 'epoch': 0.1} {'loss': 0.5489, 'learning_rate': 1.9983307291003578e-05, 'epoch': 0.1} {'loss': 0.5229, 'learning_rate': 1.9983287880644143e-05, 'epoch': 0.1} {'loss': 0.5646, 'learning_rate': 1.9983268459015473e-05, 'epoch': 0.1} {'loss': 0.5088, 'learning_rate': 1.9983249026117596e-05, 'epoch': 0.1} {'loss': 0.5485, 'learning_rate': 1.998322958195053e-05, 'epoch': 0.1} {'loss': 0.5966, 'learning_rate': 1.998321012651429e-05, 'epoch': 0.1} {'loss': 0.3811, 'learning_rate': 1.9983190659808906e-05, 'epoch': 0.1} {'loss': 0.4126, 'learning_rate': 1.9983171181834402e-05, 'epoch': 0.1} {'loss': 0.5249, 'learning_rate': 1.9983151692590792e-05, 'epoch': 0.1} {'loss': 0.6189, 'learning_rate': 1.9983132192078107e-05, 'epoch': 0.1} {'loss': 0.386, 'learning_rate': 1.998311268029636e-05, 'epoch': 0.1} {'loss': 0.5674, 'learning_rate': 1.9983093157245578e-05, 'epoch': 0.1} {'loss': 0.6012, 'learning_rate': 1.998307362292578e-05, 'epoch': 0.1} {'loss': 0.6246, 'learning_rate': 1.9983054077336994e-05, 'epoch': 0.1} {'loss': 0.4705, 'learning_rate': 1.9983034520479237e-05, 'epoch': 0.1} {'loss': 0.5406, 'learning_rate': 1.9983014952352533e-05, 'epoch': 0.1} {'loss': 0.5234, 'learning_rate': 1.9982995372956902e-05, 'epoch': 0.1} {'loss': 0.4841, 'learning_rate': 1.998297578229237e-05, 'epoch': 0.1} {'loss': 0.6188, 'learning_rate': 1.9982956180358954e-05, 'epoch': 0.1} {'loss': 0.4655, 'learning_rate': 1.998293656715668e-05, 'epoch': 0.1} {'loss': 0.5568, 'learning_rate': 1.9982916942685568e-05, 'epoch': 0.1} {'loss': 0.4314, 'learning_rate': 1.9982897306945644e-05, 'epoch': 0.1} {'loss': 0.6707, 'learning_rate': 1.9982877659936927e-05, 'epoch': 0.1} {'loss': 0.3688, 'learning_rate': 1.9982858001659436e-05, 'epoch': 0.1} {'loss': 0.554, 'learning_rate': 1.9982838332113198e-05, 'epoch': 0.1} {'loss': 0.6482, 'learning_rate': 1.9982818651298236e-05, 'epoch': 0.1} {'loss': 0.5008, 'learning_rate': 1.9982798959214566e-05, 'epoch': 0.1} {'loss': 0.5045, 'learning_rate': 1.9982779255862216e-05, 'epoch': 0.1} {'loss': 0.467, 'learning_rate': 1.9982759541241208e-05, 'epoch': 0.1} {'loss': 0.4435, 'learning_rate': 1.998273981535156e-05, 'epoch': 0.1} {'loss': 0.4254, 'learning_rate': 1.99827200781933e-05, 'epoch': 0.1} {'loss': 0.499, 'learning_rate': 1.9982700329766444e-05, 'epoch': 0.1} {'loss': 0.5318, 'learning_rate': 1.9982680570071022e-05, 'epoch': 0.1} {'loss': 0.6399, 'learning_rate': 1.998266079910705e-05, 'epoch': 0.1} {'loss': 0.5661, 'learning_rate': 1.9982641016874553e-05, 'epoch': 0.1} {'loss': 0.5853, 'learning_rate': 1.998262122337355e-05, 'epoch': 0.1} {'loss': 0.5976, 'learning_rate': 1.998260141860407e-05, 'epoch': 0.1} {'loss': 0.4848, 'learning_rate': 1.9982581602566125e-05, 'epoch': 0.1} {'loss': 0.6165, 'learning_rate': 1.998256177525975e-05, 'epoch': 0.1} {'loss': 0.5378, 'learning_rate': 1.9982541936684957e-05, 'epoch': 0.1} {'loss': 0.4571, 'learning_rate': 1.9982522086841776e-05, 'epoch': 0.1} {'loss': 0.5009, 'learning_rate': 1.9982502225730224e-05, 'epoch': 0.1} {'loss': 0.5933, 'learning_rate': 1.9982482353350322e-05, 'epoch': 0.1} {'loss': 0.4679, 'learning_rate': 1.99824624697021e-05, 'epoch': 0.1} {'loss': 0.6013, 'learning_rate': 1.9982442574785576e-05, 'epoch': 0.1} {'loss': 0.4752, 'learning_rate': 1.998242266860077e-05, 'epoch': 0.1} {'loss': 0.5387, 'learning_rate': 1.998240275114771e-05, 'epoch': 0.1} {'loss': 0.4322, 'learning_rate': 1.998238282242641e-05, 'epoch': 0.1} {'loss': 0.6292, 'learning_rate': 1.9982362882436905e-05, 'epoch': 0.1} {'loss': 0.6176, 'learning_rate': 1.9982342931179208e-05, 'epoch': 0.1} {'loss': 0.6375, 'learning_rate': 1.9982322968653343e-05, 'epoch': 0.1} {'loss': 0.5127, 'learning_rate': 1.9982302994859335e-05, 'epoch': 0.1} {'loss': 0.5306, 'learning_rate': 1.9982283009797203e-05, 'epoch': 0.1} {'loss': 0.6049, 'learning_rate': 1.9982263013466972e-05, 'epoch': 0.1} {'loss': 0.4762, 'learning_rate': 1.9982243005868665e-05, 'epoch': 0.1} {'loss': 0.5804, 'learning_rate': 1.9982222987002306e-05, 'epoch': 0.1} {'loss': 0.5559, 'learning_rate': 1.9982202956867915e-05, 'epoch': 0.1} {'loss': 0.6045, 'learning_rate': 1.9982182915465512e-05, 'epoch': 0.1} {'loss': 0.649, 'learning_rate': 1.9982162862795125e-05, 'epoch': 0.1} {'loss': 0.4109, 'learning_rate': 1.9982142798856774e-05, 'epoch': 0.1} {'loss': 0.4866, 'learning_rate': 1.9982122723650482e-05, 'epoch': 0.1} {'loss': 0.6032, 'learning_rate': 1.998210263717627e-05, 'epoch': 0.1} {'loss': 0.4674, 'learning_rate': 1.9982082539434163e-05, 'epoch': 0.1} {'loss': 0.4683, 'learning_rate': 1.9982062430424186e-05, 'epoch': 0.1} {'loss': 0.5862, 'learning_rate': 1.9982042310146356e-05, 'epoch': 0.1} {'loss': 0.5284, 'learning_rate': 1.9982022178600698e-05, 'epoch': 0.1} {'loss': 0.4801, 'learning_rate': 1.9982002035787235e-05, 'epoch': 0.1} {'loss': 0.4431, 'learning_rate': 1.998198188170599e-05, 'epoch': 0.1} {'loss': 0.4928, 'learning_rate': 1.998196171635699e-05, 'epoch': 0.1} {'loss': 0.4846, 'learning_rate': 1.9981941539740248e-05, 'epoch': 0.1} {'loss': 0.665, 'learning_rate': 1.9981921351855792e-05, 'epoch': 0.1} {'loss': 0.4732, 'learning_rate': 1.9981901152703647e-05, 'epoch': 0.1} {'loss': 0.346, 'learning_rate': 1.9981880942283833e-05, 'epoch': 0.1} {'loss': 0.6259, 'learning_rate': 1.9981860720596376e-05, 'epoch': 0.1} {'loss': 0.4485, 'learning_rate': 1.9981840487641294e-05, 'epoch': 0.1} {'loss': 0.593, 'learning_rate': 1.998182024341861e-05, 'epoch': 0.1} {'loss': 0.5898, 'learning_rate': 1.9981799987928353e-05, 'epoch': 0.1} {'loss': 0.6793, 'learning_rate': 1.998177972117054e-05, 'epoch': 0.1} {'loss': 0.5878, 'learning_rate': 1.99817594431452e-05, 'epoch': 0.1} {'loss': 0.5645, 'learning_rate': 1.9981739153852346e-05, 'epoch': 0.1} {'loss': 0.5491, 'learning_rate': 1.998171885329201e-05, 'epoch': 0.1} {'loss': 0.4332, 'learning_rate': 1.998169854146421e-05, 'epoch': 0.1} {'loss': 0.6461, 'learning_rate': 1.998167821836897e-05, 'epoch': 0.1} {'loss': 0.5901, 'learning_rate': 1.9981657884006313e-05, 'epoch': 0.1} {'loss': 0.5663, 'learning_rate': 1.9981637538376265e-05, 'epoch': 0.1} {'loss': 0.6414, 'learning_rate': 1.9981617181478844e-05, 'epoch': 0.1} {'loss': 0.52, 'learning_rate': 1.9981596813314078e-05, 'epoch': 0.1} {'loss': 0.494, 'learning_rate': 1.9981576433881985e-05, 'epoch': 0.1} {'loss': 0.5626, 'learning_rate': 1.998155604318259e-05, 'epoch': 0.1} {'loss': 0.5082, 'learning_rate': 1.9981535641215916e-05, 'epoch': 0.1} {'loss': 0.3829, 'learning_rate': 1.998151522798199e-05, 'epoch': 0.1} {'loss': 0.5303, 'learning_rate': 1.998149480348083e-05, 'epoch': 0.1} {'loss': 0.667, 'learning_rate': 1.998147436771246e-05, 'epoch': 0.1} {'loss': 0.6362, 'learning_rate': 1.9981453920676902e-05, 'epoch': 0.1} {'loss': 0.6998, 'learning_rate': 1.9981433462374176e-05, 'epoch': 0.1} {'loss': 0.3883, 'learning_rate': 1.998141299280432e-05, 'epoch': 0.1} {'loss': 0.5315, 'learning_rate': 1.998139251196734e-05, 'epoch': 0.1} {'loss': 0.4711, 'learning_rate': 1.9981372019863266e-05, 'epoch': 0.1} {'loss': 0.4682, 'learning_rate': 1.9981351516492123e-05, 'epoch': 0.1} {'loss': 0.5815, 'learning_rate': 1.998133100185393e-05, 'epoch': 0.1} {'loss': 0.4505, 'learning_rate': 1.9981310475948716e-05, 'epoch': 0.1} {'loss': 0.4459, 'learning_rate': 1.99812899387765e-05, 'epoch': 0.1} {'loss': 0.5262, 'learning_rate': 1.9981269390337305e-05, 'epoch': 0.1} {'loss': 0.6168, 'learning_rate': 1.9981248830631156e-05, 'epoch': 0.1} {'loss': 0.4292, 'learning_rate': 1.998122825965807e-05, 'epoch': 0.1} {'loss': 0.6936, 'learning_rate': 1.998120767741808e-05, 'epoch': 0.1} {'loss': 0.5636, 'learning_rate': 1.9981187083911206e-05, 'epoch': 0.1} {'loss': 0.6006, 'learning_rate': 1.9981166479137463e-05, 'epoch': 0.1} {'loss': 0.5531, 'learning_rate': 1.9981145863096887e-05, 'epoch': 0.1} {'loss': 0.5967, 'learning_rate': 1.9981125235789492e-05, 'epoch': 0.1} {'loss': 0.5922, 'learning_rate': 1.998110459721531e-05, 'epoch': 0.1} {'loss': 0.4021, 'learning_rate': 1.998108394737435e-05, 'epoch': 0.1} {'loss': 0.4791, 'learning_rate': 1.998106328626665e-05, 'epoch': 0.1} {'loss': 0.4722, 'learning_rate': 1.9981042613892226e-05, 'epoch': 0.1} {'loss': 0.5776, 'learning_rate': 1.9981021930251107e-05, 'epoch': 0.1} {'loss': 0.5099, 'learning_rate': 1.9981001235343307e-05, 'epoch': 0.1} {'loss': 0.5269, 'learning_rate': 1.9980980529168857e-05, 'epoch': 0.1} {'loss': 0.4585, 'learning_rate': 1.9980959811727776e-05, 'epoch': 0.1} {'loss': 0.5599, 'learning_rate': 1.998093908302009e-05, 'epoch': 0.1} {'loss': 0.6587, 'learning_rate': 1.9980918343045823e-05, 'epoch': 0.1} {'loss': 0.5677, 'learning_rate': 1.9980897591805e-05, 'epoch': 0.1} {'loss': 0.4345, 'learning_rate': 1.9980876829297634e-05, 'epoch': 0.1} {'loss': 0.5075, 'learning_rate': 1.9980856055523762e-05, 'epoch': 0.1} {'loss': 0.5443, 'learning_rate': 1.99808352704834e-05, 'epoch': 0.1} {'loss': 0.3822, 'learning_rate': 1.998081447417657e-05, 'epoch': 0.1} {'loss': 0.5414, 'learning_rate': 1.9980793666603302e-05, 'epoch': 0.1} {'loss': 0.3679, 'learning_rate': 1.9980772847763615e-05, 'epoch': 0.1} {'loss': 0.5962, 'learning_rate': 1.9980752017657532e-05, 'epoch': 0.1} {'loss': 0.4145, 'learning_rate': 1.998073117628508e-05, 'epoch': 0.1} {'loss': 0.3936, 'learning_rate': 1.998071032364628e-05, 'epoch': 0.1} {'loss': 0.4577, 'learning_rate': 1.9980689459741155e-05, 'epoch': 0.1} {'loss': 0.5108, 'learning_rate': 1.9980668584569728e-05, 'epoch': 0.1} {'loss': 0.5657, 'learning_rate': 1.998064769813203e-05, 'epoch': 0.1} {'loss': 0.5713, 'learning_rate': 1.998062680042807e-05, 'epoch': 0.1} {'loss': 0.7971, 'learning_rate': 1.9980605891457887e-05, 'epoch': 0.1} {'loss': 0.6909, 'learning_rate': 1.99805849712215e-05, 'epoch': 0.1} {'loss': 0.5653, 'learning_rate': 1.998056403971892e-05, 'epoch': 0.1} {'loss': 0.3925, 'learning_rate': 1.998054309695019e-05, 'epoch': 0.1} {'loss': 0.5337, 'learning_rate': 1.9980522142915322e-05, 'epoch': 0.1} {'loss': 0.4859, 'learning_rate': 1.998050117761434e-05, 'epoch': 0.1} {'loss': 0.4925, 'learning_rate': 1.9980480201047276e-05, 'epoch': 0.1} {'loss': 0.6414, 'learning_rate': 1.998045921321414e-05, 'epoch': 0.1} {'loss': 0.5127, 'learning_rate': 1.9980438214114974e-05, 'epoch': 0.1} {'loss': 0.4707, 'learning_rate': 1.9980417203749783e-05, 'epoch': 0.1} {'loss': 0.5674, 'learning_rate': 1.99803961821186e-05, 'epoch': 0.1} {'loss': 0.6221, 'learning_rate': 1.9980375149221446e-05, 'epoch': 0.1} {'loss': 0.4118, 'learning_rate': 1.998035410505835e-05, 'epoch': 0.1} {'loss': 0.5856, 'learning_rate': 1.998033304962933e-05, 'epoch': 0.1} {'loss': 0.5399, 'learning_rate': 1.9980311982934412e-05, 'epoch': 0.1} {'loss': 0.5916, 'learning_rate': 1.998029090497362e-05, 'epoch': 0.1} {'loss': 0.4978, 'learning_rate': 1.998026981574698e-05, 'epoch': 0.1} {'loss': 0.518, 'learning_rate': 1.998024871525451e-05, 'epoch': 0.1} {'loss': 0.5654, 'learning_rate': 1.9980227603496236e-05, 'epoch': 0.1} {'loss': 0.6005, 'learning_rate': 1.9980206480472187e-05, 'epoch': 0.1} {'loss': 0.384, 'learning_rate': 1.998018534618238e-05, 'epoch': 0.1} {'loss': 0.5433, 'learning_rate': 1.9980164200626842e-05, 'epoch': 0.1} {'loss': 0.6302, 'learning_rate': 1.9980143043805596e-05, 'epoch': 0.1} {'loss': 0.4842, 'learning_rate': 1.9980121875718666e-05, 'epoch': 0.1} {'loss': 0.5602, 'learning_rate': 1.9980100696366076e-05, 'epoch': 0.1} {'loss': 0.7256, 'learning_rate': 1.9980079505747853e-05, 'epoch': 0.1} {'loss': 0.6224, 'learning_rate': 1.9980058303864014e-05, 'epoch': 0.1} {'loss': 0.5617, 'learning_rate': 1.998003709071459e-05, 'epoch': 0.1} {'loss': 0.5379, 'learning_rate': 1.99800158662996e-05, 'epoch': 0.1} {'loss': 0.7383, 'learning_rate': 1.9979994630619067e-05, 'epoch': 0.1} {'loss': 0.4323, 'learning_rate': 1.9979973383673024e-05, 'epoch': 0.1} {'loss': 0.509, 'learning_rate': 1.9979952125461487e-05, 'epoch': 0.1} {'loss': 0.5675, 'learning_rate': 1.9979930855984483e-05, 'epoch': 0.1} {'loss': 0.5097, 'learning_rate': 1.9979909575242032e-05, 'epoch': 0.1} {'loss': 0.4912, 'learning_rate': 1.9979888283234162e-05, 'epoch': 0.1} {'loss': 0.4495, 'learning_rate': 1.9979866979960896e-05, 'epoch': 0.1} {'loss': 0.5229, 'learning_rate': 1.9979845665422254e-05, 'epoch': 0.1} {'loss': 0.523, 'learning_rate': 1.997982433961827e-05, 'epoch': 0.1} {'loss': 0.7008, 'learning_rate': 1.997980300254896e-05, 'epoch': 0.1} {'loss': 0.5511, 'learning_rate': 1.997978165421435e-05, 'epoch': 0.1} {'loss': 0.4364, 'learning_rate': 1.9979760294614463e-05, 'epoch': 0.1} {'loss': 0.627, 'learning_rate': 1.9979738923749326e-05, 'epoch': 0.1} {'loss': 0.5286, 'learning_rate': 1.9979717541618963e-05, 'epoch': 0.1} {'loss': 0.4714, 'learning_rate': 1.9979696148223393e-05, 'epoch': 0.1} {'loss': 0.5072, 'learning_rate': 1.9979674743562648e-05, 'epoch': 0.1} {'loss': 0.3773, 'learning_rate': 1.9979653327636744e-05, 'epoch': 0.1} {'loss': 0.5146, 'learning_rate': 1.997963190044571e-05, 'epoch': 0.1} {'loss': 0.5095, 'learning_rate': 1.997961046198957e-05, 'epoch': 0.1} {'loss': 0.472, 'learning_rate': 1.9979589012268348e-05, 'epoch': 0.1} {'loss': 0.6154, 'learning_rate': 1.9979567551282067e-05, 'epoch': 0.1} {'loss': 0.646, 'learning_rate': 1.9979546079030752e-05, 'epoch': 0.1} {'loss': 0.406, 'learning_rate': 1.9979524595514425e-05, 'epoch': 0.1} {'loss': 0.5532, 'learning_rate': 1.9979503100733114e-05, 'epoch': 0.1} {'loss': 0.6394, 'learning_rate': 1.9979481594686842e-05, 'epoch': 0.1} {'loss': 0.5331, 'learning_rate': 1.9979460077375634e-05, 'epoch': 0.1} {'loss': 0.4571, 'learning_rate': 1.9979438548799512e-05, 'epoch': 0.1} {'loss': 0.5669, 'learning_rate': 1.9979417008958505e-05, 'epoch': 0.1} {'loss': 0.5144, 'learning_rate': 1.9979395457852628e-05, 'epoch': 0.1} {'loss': 0.5848, 'learning_rate': 1.9979373895481914e-05, 'epoch': 0.1} {'loss': 0.6667, 'learning_rate': 1.9979352321846383e-05, 'epoch': 0.1} {'loss': 0.6338, 'learning_rate': 1.9979330736946063e-05, 'epoch': 0.1} {'loss': 0.5308, 'learning_rate': 1.9979309140780977e-05, 'epoch': 0.1} {'loss': 0.579, 'learning_rate': 1.997928753335115e-05, 'epoch': 0.1} {'loss': 0.5209, 'learning_rate': 1.99792659146566e-05, 'epoch': 0.1} {'loss': 0.6471, 'learning_rate': 1.997924428469736e-05, 'epoch': 0.1} {'loss': 0.6652, 'learning_rate': 1.9979222643473448e-05, 'epoch': 0.1} {'loss': 0.5965, 'learning_rate': 1.9979200990984892e-05, 'epoch': 0.1} {'loss': 0.5232, 'learning_rate': 1.997917932723172e-05, 'epoch': 0.1} {'loss': 0.499, 'learning_rate': 1.997915765221395e-05, 'epoch': 0.1} {'loss': 0.4199, 'learning_rate': 1.9979135965931605e-05, 'epoch': 0.1} {'loss': 0.5775, 'learning_rate': 1.9979114268384715e-05, 'epoch': 0.1} {'loss': 0.6412, 'learning_rate': 1.9979092559573304e-05, 'epoch': 0.1} {'loss': 0.612, 'learning_rate': 1.9979070839497394e-05, 'epoch': 0.1} {'loss': 0.583, 'learning_rate': 1.997904910815701e-05, 'epoch': 0.1} {'loss': 0.5811, 'learning_rate': 1.9979027365552176e-05, 'epoch': 0.1} {'loss': 0.4759, 'learning_rate': 1.9979005611682922e-05, 'epoch': 0.1} {'loss': 0.5597, 'learning_rate': 1.9978983846549264e-05, 'epoch': 0.1} {'loss': 0.6653, 'learning_rate': 1.9978962070151234e-05, 'epoch': 0.1} {'loss': 0.5327, 'learning_rate': 1.997894028248885e-05, 'epoch': 0.1} {'loss': 0.4872, 'learning_rate': 1.9978918483562143e-05, 'epoch': 0.1} {'loss': 0.5314, 'learning_rate': 1.9978896673371134e-05, 'epoch': 0.1} {'loss': 0.5126, 'learning_rate': 1.997887485191585e-05, 'epoch': 0.1} {'loss': 0.5466, 'learning_rate': 1.9978853019196315e-05, 'epoch': 0.1} {'loss': 0.561, 'learning_rate': 1.9978831175212547e-05, 'epoch': 0.1} {'loss': 0.5216, 'learning_rate': 1.997880931996458e-05, 'epoch': 0.1} {'loss': 0.4579, 'learning_rate': 1.997878745345243e-05, 'epoch': 0.1} {'loss': 0.5206, 'learning_rate': 1.9978765575676134e-05, 'epoch': 0.1} {'loss': 0.4831, 'learning_rate': 1.9978743686635705e-05, 'epoch': 0.1} {'loss': 0.6583, 'learning_rate': 1.997872178633117e-05, 'epoch': 0.1} {'loss': 0.4547, 'learning_rate': 1.9978699874762556e-05, 'epoch': 0.1} {'loss': 0.5025, 'learning_rate': 1.9978677951929893e-05, 'epoch': 0.1} {'loss': 0.5079, 'learning_rate': 1.9978656017833193e-05, 'epoch': 0.1} {'loss': 0.499, 'learning_rate': 1.997863407247249e-05, 'epoch': 0.1} {'loss': 0.4606, 'learning_rate': 1.997861211584781e-05, 'epoch': 0.1} {'loss': 0.4509, 'learning_rate': 1.997859014795917e-05, 'epoch': 0.1} {'loss': 0.6559, 'learning_rate': 1.9978568168806603e-05, 'epoch': 0.1} {'loss': 0.5039, 'learning_rate': 1.997854617839013e-05, 'epoch': 0.1} {'loss': 0.6675, 'learning_rate': 1.9978524176709776e-05, 'epoch': 0.1} {'loss': 0.546, 'learning_rate': 1.9978502163765564e-05, 'epoch': 0.1} {'loss': 0.5217, 'learning_rate': 1.9978480139557518e-05, 'epoch': 0.1} {'loss': 0.5749, 'learning_rate': 1.997845810408567e-05, 'epoch': 0.1} {'loss': 0.648, 'learning_rate': 1.9978436057350036e-05, 'epoch': 0.1} {'loss': 0.5164, 'learning_rate': 1.997841399935065e-05, 'epoch': 0.1} {'loss': 0.6135, 'learning_rate': 1.997839193008753e-05, 'epoch': 0.1} {'loss': 0.3334, 'learning_rate': 1.99783698495607e-05, 'epoch': 0.1} {'loss': 0.4221, 'learning_rate': 1.9978347757770193e-05, 'epoch': 0.1} {'loss': 0.4717, 'learning_rate': 1.9978325654716024e-05, 'epoch': 0.1} {'loss': 0.4764, 'learning_rate': 1.9978303540398228e-05, 'epoch': 0.1} {'loss': 0.652, 'learning_rate': 1.997828141481682e-05, 'epoch': 0.1} {'loss': 0.5054, 'learning_rate': 1.9978259277971835e-05, 'epoch': 0.1} {'loss': 0.4655, 'learning_rate': 1.9978237129863286e-05, 'epoch': 0.1} {'loss': 0.5892, 'learning_rate': 1.997821497049121e-05, 'epoch': 0.1} {'loss': 0.4491, 'learning_rate': 1.9978192799855624e-05, 'epoch': 0.1} {'loss': 0.5692, 'learning_rate': 1.997817061795656e-05, 'epoch': 0.1} {'loss': 0.4571, 'learning_rate': 1.9978148424794032e-05, 'epoch': 0.1} {'loss': 0.5135, 'learning_rate': 1.9978126220368078e-05, 'epoch': 0.1} {'loss': 0.4941, 'learning_rate': 1.9978104004678714e-05, 'epoch': 0.1} {'loss': 0.6397, 'learning_rate': 1.9978081777725966e-05, 'epoch': 0.1} {'loss': 0.4583, 'learning_rate': 1.9978059539509866e-05, 'epoch': 0.1} {'loss': 0.7157, 'learning_rate': 1.997803729003043e-05, 'epoch': 0.1} {'loss': 0.4835, 'learning_rate': 1.997801502928769e-05, 'epoch': 0.1} {'loss': 0.3815, 'learning_rate': 1.9977992757281667e-05, 'epoch': 0.1} {'loss': 0.6307, 'learning_rate': 1.9977970474012386e-05, 'epoch': 0.1} {'loss': 0.4405, 'learning_rate': 1.9977948179479877e-05, 'epoch': 0.1} {'loss': 0.5168, 'learning_rate': 1.9977925873684157e-05, 'epoch': 0.1} {'loss': 0.5732, 'learning_rate': 1.997790355662526e-05, 'epoch': 0.1} {'loss': 0.4488, 'learning_rate': 1.9977881228303208e-05, 'epoch': 0.1} {'loss': 0.4715, 'learning_rate': 1.9977858888718026e-05, 'epoch': 0.1} {'loss': 0.6569, 'learning_rate': 1.9977836537869735e-05, 'epoch': 0.1} {'loss': 0.4579, 'learning_rate': 1.9977814175758366e-05, 'epoch': 0.1} {'loss': 0.6277, 'learning_rate': 1.9977791802383942e-05, 'epoch': 0.1} {'loss': 0.4547, 'learning_rate': 1.997776941774649e-05, 'epoch': 0.1} {'loss': 0.3412, 'learning_rate': 1.9977747021846032e-05, 'epoch': 0.1} {'loss': 0.4834, 'learning_rate': 1.9977724614682597e-05, 'epoch': 0.1} {'loss': 0.4718, 'learning_rate': 1.9977702196256205e-05, 'epoch': 0.1} {'loss': 0.489, 'learning_rate': 1.9977679766566887e-05, 'epoch': 0.1} {'loss': 0.4371, 'learning_rate': 1.9977657325614667e-05, 'epoch': 0.1} {'loss': 0.4271, 'learning_rate': 1.9977634873399565e-05, 'epoch': 0.1} {'loss': 0.5378, 'learning_rate': 1.997761240992161e-05, 'epoch': 0.1} {'loss': 0.541, 'learning_rate': 1.9977589935180833e-05, 'epoch': 0.1} {'loss': 0.6068, 'learning_rate': 1.9977567449177252e-05, 'epoch': 0.1} {'loss': 0.4644, 'learning_rate': 1.9977544951910893e-05, 'epoch': 0.1} {'loss': 0.4954, 'learning_rate': 1.9977522443381785e-05, 'epoch': 0.1} {'loss': 0.4504, 'learning_rate': 1.997749992358995e-05, 'epoch': 0.1} {'loss': 0.5596, 'learning_rate': 1.9977477392535417e-05, 'epoch': 0.1} {'loss': 0.4419, 'learning_rate': 1.997745485021821e-05, 'epoch': 0.1} {'loss': 0.4737, 'learning_rate': 1.9977432296638352e-05, 'epoch': 0.1} {'loss': 0.5257, 'learning_rate': 1.997740973179587e-05, 'epoch': 0.1} {'loss': 0.4612, 'learning_rate': 1.997738715569079e-05, 'epoch': 0.1} {'loss': 0.4977, 'learning_rate': 1.9977364568323137e-05, 'epoch': 0.1} {'loss': 0.6312, 'learning_rate': 1.997734196969294e-05, 'epoch': 0.1} {'loss': 0.6205, 'learning_rate': 1.9977319359800217e-05, 'epoch': 0.1} {'loss': 0.4761, 'learning_rate': 1.9977296738644997e-05, 'epoch': 0.1} {'loss': 0.5741, 'learning_rate': 1.9977274106227308e-05, 'epoch': 0.1} {'loss': 0.5282, 'learning_rate': 1.9977251462547174e-05, 'epoch': 0.1} {'loss': 0.4355, 'learning_rate': 1.997722880760462e-05, 'epoch': 0.1} {'loss': 0.5296, 'learning_rate': 1.997720614139967e-05, 'epoch': 0.1} {'loss': 0.4552, 'learning_rate': 1.9977183463932355e-05, 'epoch': 0.1} {'loss': 0.6155, 'learning_rate': 1.9977160775202696e-05, 'epoch': 0.1} {'loss': 0.6626, 'learning_rate': 1.997713807521072e-05, 'epoch': 0.1} {'loss': 0.6356, 'learning_rate': 1.997711536395645e-05, 'epoch': 0.1} {'loss': 0.5554, 'learning_rate': 1.9977092641439918e-05, 'epoch': 0.1} {'loss': 0.5987, 'learning_rate': 1.9977069907661144e-05, 'epoch': 0.1} {'loss': 0.6868, 'learning_rate': 1.9977047162620152e-05, 'epoch': 0.1} {'loss': 0.4934, 'learning_rate': 1.9977024406316976e-05, 'epoch': 0.1} {'loss': 0.5104, 'learning_rate': 1.9977001638751633e-05, 'epoch': 0.1} {'loss': 0.6697, 'learning_rate': 1.9976978859924157e-05, 'epoch': 0.1} {'loss': 0.6266, 'learning_rate': 1.9976956069834565e-05, 'epoch': 0.1} {'loss': 0.3842, 'learning_rate': 1.9976933268482887e-05, 'epoch': 0.1} {'loss': 0.4887, 'learning_rate': 1.997691045586915e-05, 'epoch': 0.1} {'loss': 0.3376, 'learning_rate': 1.997688763199338e-05, 'epoch': 0.1} {'loss': 0.493, 'learning_rate': 1.9976864796855596e-05, 'epoch': 0.1} {'loss': 0.4428, 'learning_rate': 1.997684195045583e-05, 'epoch': 0.1} {'loss': 0.5574, 'learning_rate': 1.997681909279411e-05, 'epoch': 0.1} {'loss': 0.6706, 'learning_rate': 1.9976796223870456e-05, 'epoch': 0.1} {'loss': 0.568, 'learning_rate': 1.9976773343684897e-05, 'epoch': 0.1} {'loss': 0.5302, 'learning_rate': 1.9976750452237458e-05, 'epoch': 0.1} {'loss': 0.4191, 'learning_rate': 1.9976727549528164e-05, 'epoch': 0.1} {'loss': 0.6255, 'learning_rate': 1.9976704635557042e-05, 'epoch': 0.1} {'loss': 0.5568, 'learning_rate': 1.997668171032412e-05, 'epoch': 0.1} {'loss': 0.4532, 'learning_rate': 1.997665877382942e-05, 'epoch': 0.1} {'loss': 0.6241, 'learning_rate': 1.9976635826072965e-05, 'epoch': 0.1} {'loss': 0.6423, 'learning_rate': 1.997661286705479e-05, 'epoch': 0.1} {'loss': 0.4964, 'learning_rate': 1.9976589896774917e-05, 'epoch': 0.1} {'loss': 0.5543, 'learning_rate': 1.9976566915233372e-05, 'epoch': 0.1} {'loss': 0.609, 'learning_rate': 1.9976543922430177e-05, 'epoch': 0.1} {'loss': 0.4456, 'learning_rate': 1.9976520918365358e-05, 'epoch': 0.1} {'loss': 0.6002, 'learning_rate': 1.9976497903038948e-05, 'epoch': 0.1} {'loss': 0.5718, 'learning_rate': 1.997647487645097e-05, 'epoch': 0.1} {'loss': 0.5193, 'learning_rate': 1.997645183860145e-05, 'epoch': 0.1} {'loss': 0.5223, 'learning_rate': 1.997642878949041e-05, 'epoch': 0.1} {'loss': 0.8199, 'learning_rate': 1.9976405729117878e-05, 'epoch': 0.1} {'loss': 0.4462, 'learning_rate': 1.9976382657483882e-05, 'epoch': 0.1} {'loss': 0.4399, 'learning_rate': 1.9976359574588447e-05, 'epoch': 0.1} {'loss': 0.5715, 'learning_rate': 1.99763364804316e-05, 'epoch': 0.1} {'loss': 0.6582, 'learning_rate': 1.9976313375013367e-05, 'epoch': 0.1} {'loss': 0.6536, 'learning_rate': 1.9976290258333773e-05, 'epoch': 0.1} {'loss': 0.4078, 'learning_rate': 1.9976267130392845e-05, 'epoch': 0.1} {'loss': 0.5462, 'learning_rate': 1.9976243991190607e-05, 'epoch': 0.1} {'loss': 0.4527, 'learning_rate': 1.9976220840727087e-05, 'epoch': 0.1} {'loss': 0.4783, 'learning_rate': 1.997619767900231e-05, 'epoch': 0.1} {'loss': 0.5265, 'learning_rate': 1.9976174506016303e-05, 'epoch': 0.1} {'loss': 0.5673, 'learning_rate': 1.9976151321769093e-05, 'epoch': 0.1} {'loss': 0.6177, 'learning_rate': 1.9976128126260703e-05, 'epoch': 0.1} {'loss': 0.3888, 'learning_rate': 1.9976104919491165e-05, 'epoch': 0.1} {'loss': 0.5621, 'learning_rate': 1.9976081701460498e-05, 'epoch': 0.1} {'loss': 0.4745, 'learning_rate': 1.9976058472168737e-05, 'epoch': 0.1} {'loss': 0.3104, 'learning_rate': 1.9976035231615897e-05, 'epoch': 0.1} {'loss': 0.4733, 'learning_rate': 1.997601197980201e-05, 'epoch': 0.1} {'loss': 0.4765, 'learning_rate': 1.9975988716727107e-05, 'epoch': 0.1} {'loss': 0.5141, 'learning_rate': 1.997596544239121e-05, 'epoch': 0.1} {'loss': 0.4301, 'learning_rate': 1.9975942156794345e-05, 'epoch': 0.1} {'loss': 0.4374, 'learning_rate': 1.9975918859936534e-05, 'epoch': 0.1} {'loss': 0.5833, 'learning_rate': 1.997589555181781e-05, 'epoch': 0.11} {'loss': 0.4822, 'learning_rate': 1.9975872232438197e-05, 'epoch': 0.11} {'loss': 0.3741, 'learning_rate': 1.997584890179772e-05, 'epoch': 0.11} {'loss': 0.5183, 'learning_rate': 1.997582555989641e-05, 'epoch': 0.11} {'loss': 0.6359, 'learning_rate': 1.9975802206734286e-05, 'epoch': 0.11} {'loss': 0.3316, 'learning_rate': 1.9975778842311378e-05, 'epoch': 0.11} {'loss': 0.6485, 'learning_rate': 1.9975755466627716e-05, 'epoch': 0.11} {'loss': 0.6103, 'learning_rate': 1.9975732079683324e-05, 'epoch': 0.11} {'loss': 0.4052, 'learning_rate': 1.9975708681478224e-05, 'epoch': 0.11} {'loss': 0.6286, 'learning_rate': 1.997568527201245e-05, 'epoch': 0.11} {'loss': 0.38, 'learning_rate': 1.9975661851286017e-05, 'epoch': 0.11} {'loss': 0.4999, 'learning_rate': 1.9975638419298967e-05, 'epoch': 0.11} {'loss': 0.6268, 'learning_rate': 1.9975614976051312e-05, 'epoch': 0.11} {'loss': 0.6, 'learning_rate': 1.9975591521543086e-05, 'epoch': 0.11} {'loss': 0.5047, 'learning_rate': 1.9975568055774316e-05, 'epoch': 0.11} {'loss': 0.4014, 'learning_rate': 1.9975544578745025e-05, 'epoch': 0.11} {'loss': 0.5283, 'learning_rate': 1.9975521090455244e-05, 'epoch': 0.11} {'loss': 0.6263, 'learning_rate': 1.9975497590904994e-05, 'epoch': 0.11} {'loss': 0.5774, 'learning_rate': 1.9975474080094305e-05, 'epoch': 0.11} {'loss': 0.4714, 'learning_rate': 1.99754505580232e-05, 'epoch': 0.11} {'loss': 0.4895, 'learning_rate': 1.997542702469171e-05, 'epoch': 0.11} {'loss': 0.7593, 'learning_rate': 1.9975403480099864e-05, 'epoch': 0.11} {'loss': 0.5665, 'learning_rate': 1.997537992424768e-05, 'epoch': 0.11} {'loss': 0.3411, 'learning_rate': 1.997535635713519e-05, 'epoch': 0.11} {'loss': 0.5199, 'learning_rate': 1.9975332778762416e-05, 'epoch': 0.11} {'loss': 0.472, 'learning_rate': 1.9975309189129392e-05, 'epoch': 0.11} {'loss': 0.6759, 'learning_rate': 1.9975285588236142e-05, 'epoch': 0.11} {'loss': 0.551, 'learning_rate': 1.9975261976082687e-05, 'epoch': 0.11} {'loss': 0.6205, 'learning_rate': 1.997523835266906e-05, 'epoch': 0.11} {'loss': 0.4822, 'learning_rate': 1.9975214717995287e-05, 'epoch': 0.11} {'loss': 0.572, 'learning_rate': 1.9975191072061393e-05, 'epoch': 0.11} {'loss': 0.6885, 'learning_rate': 1.9975167414867408e-05, 'epoch': 0.11} {'loss': 0.5637, 'learning_rate': 1.9975143746413353e-05, 'epoch': 0.11} {'loss': 0.4404, 'learning_rate': 1.9975120066699256e-05, 'epoch': 0.11} {'loss': 0.4585, 'learning_rate': 1.9975096375725147e-05, 'epoch': 0.11} {'loss': 0.4492, 'learning_rate': 1.997507267349105e-05, 'epoch': 0.11} {'loss': 0.3472, 'learning_rate': 1.9975048959996994e-05, 'epoch': 0.11} {'loss': 0.4429, 'learning_rate': 1.9975025235243004e-05, 'epoch': 0.11} {'loss': 0.5306, 'learning_rate': 1.9975001499229107e-05, 'epoch': 0.11} {'loss': 0.4786, 'learning_rate': 1.9974977751955333e-05, 'epoch': 0.11} {'loss': 0.5877, 'learning_rate': 1.9974953993421703e-05, 'epoch': 0.11} {'loss': 0.6867, 'learning_rate': 1.9974930223628248e-05, 'epoch': 0.11} {'loss': 0.5161, 'learning_rate': 1.9974906442574993e-05, 'epoch': 0.11} {'loss': 0.6197, 'learning_rate': 1.9974882650261964e-05, 'epoch': 0.11} {'loss': 0.5286, 'learning_rate': 1.997485884668919e-05, 'epoch': 0.11} {'loss': 0.5665, 'learning_rate': 1.9974835031856702e-05, 'epoch': 0.11} {'loss': 0.6454, 'learning_rate': 1.9974811205764517e-05, 'epoch': 0.11} {'loss': 0.616, 'learning_rate': 1.9974787368412666e-05, 'epoch': 0.11} {'loss': 0.3368, 'learning_rate': 1.9974763519801178e-05, 'epoch': 0.11} {'loss': 0.4499, 'learning_rate': 1.997473965993008e-05, 'epoch': 0.11} {'loss': 0.4331, 'learning_rate': 1.9974715788799396e-05, 'epoch': 0.11} {'loss': 0.5993, 'learning_rate': 1.997469190640916e-05, 'epoch': 0.11} {'loss': 0.4491, 'learning_rate': 1.997466801275939e-05, 'epoch': 0.11} {'loss': 0.4293, 'learning_rate': 1.9974644107850114e-05, 'epoch': 0.11} {'loss': 0.6766, 'learning_rate': 1.9974620191681365e-05, 'epoch': 0.11} {'loss': 0.4539, 'learning_rate': 1.9974596264253164e-05, 'epoch': 0.11} {'loss': 0.4815, 'learning_rate': 1.9974572325565543e-05, 'epoch': 0.11} {'loss': 0.4309, 'learning_rate': 1.9974548375618524e-05, 'epoch': 0.11} {'loss': 0.6115, 'learning_rate': 1.997452441441214e-05, 'epoch': 0.11} {'loss': 0.5253, 'learning_rate': 1.9974500441946413e-05, 'epoch': 0.11} {'loss': 0.3055, 'learning_rate': 1.997447645822137e-05, 'epoch': 0.11} {'loss': 0.453, 'learning_rate': 1.9974452463237042e-05, 'epoch': 0.11} {'loss': 0.485, 'learning_rate': 1.9974428456993455e-05, 'epoch': 0.11} {'loss': 0.3561, 'learning_rate': 1.997440443949063e-05, 'epoch': 0.11} {'loss': 0.5631, 'learning_rate': 1.9974380410728602e-05, 'epoch': 0.11} {'loss': 0.5085, 'learning_rate': 1.9974356370707398e-05, 'epoch': 0.11} {'loss': 0.4591, 'learning_rate': 1.9974332319427038e-05, 'epoch': 0.11} {'loss': 0.7533, 'learning_rate': 1.9974308256887557e-05, 'epoch': 0.11} {'loss': 0.5377, 'learning_rate': 1.9974284183088976e-05, 'epoch': 0.11} {'loss': 0.5319, 'learning_rate': 1.9974260098031328e-05, 'epoch': 0.11} {'loss': 0.6506, 'learning_rate': 1.9974236001714633e-05, 'epoch': 0.11} {'loss': 0.7239, 'learning_rate': 1.9974211894138926e-05, 'epoch': 0.11} {'loss': 0.4829, 'learning_rate': 1.9974187775304226e-05, 'epoch': 0.11} {'loss': 0.5867, 'learning_rate': 1.9974163645210568e-05, 'epoch': 0.11} {'loss': 0.692, 'learning_rate': 1.9974139503857978e-05, 'epoch': 0.11} {'loss': 0.5298, 'learning_rate': 1.9974115351246474e-05, 'epoch': 0.11} {'loss': 0.4403, 'learning_rate': 1.9974091187376096e-05, 'epoch': 0.11} {'loss': 0.5384, 'learning_rate': 1.9974067012246865e-05, 'epoch': 0.11} {'loss': 0.4089, 'learning_rate': 1.997404282585881e-05, 'epoch': 0.11} {'loss': 0.3509, 'learning_rate': 1.9974018628211955e-05, 'epoch': 0.11} {'loss': 0.4153, 'learning_rate': 1.997399441930633e-05, 'epoch': 0.11} {'loss': 0.3413, 'learning_rate': 1.9973970199141962e-05, 'epoch': 0.11} {'loss': 0.5741, 'learning_rate': 1.997394596771888e-05, 'epoch': 0.11} {'loss': 0.6733, 'learning_rate': 1.997392172503711e-05, 'epoch': 0.11} {'loss': 0.659, 'learning_rate': 1.9973897471096676e-05, 'epoch': 0.11} {'loss': 0.4968, 'learning_rate': 1.997387320589761e-05, 'epoch': 0.11} {'loss': 0.6359, 'learning_rate': 1.997384892943994e-05, 'epoch': 0.11} {'loss': 0.6953, 'learning_rate': 1.9973824641723688e-05, 'epoch': 0.11} {'loss': 0.5346, 'learning_rate': 1.9973800342748882e-05, 'epoch': 0.11} {'loss': 0.5389, 'learning_rate': 1.9973776032515558e-05, 'epoch': 0.11} {'loss': 0.5004, 'learning_rate': 1.9973751711023733e-05, 'epoch': 0.11} {'loss': 0.6132, 'learning_rate': 1.997372737827344e-05, 'epoch': 0.11} {'loss': 0.5164, 'learning_rate': 1.9973703034264705e-05, 'epoch': 0.11} {'loss': 0.4775, 'learning_rate': 1.997367867899756e-05, 'epoch': 0.11} {'loss': 0.4413, 'learning_rate': 1.9973654312472025e-05, 'epoch': 0.11} {'loss': 0.5131, 'learning_rate': 1.997362993468813e-05, 'epoch': 0.11} {'loss': 0.3961, 'learning_rate': 1.9973605545645904e-05, 'epoch': 0.11} {'loss': 0.4524, 'learning_rate': 1.9973581145345374e-05, 'epoch': 0.11} {'loss': 0.564, 'learning_rate': 1.9973556733786568e-05, 'epoch': 0.11} {'loss': 0.5414, 'learning_rate': 1.9973532310969514e-05, 'epoch': 0.11} {'loss': 0.5346, 'learning_rate': 1.9973507876894237e-05, 'epoch': 0.11} {'loss': 0.6096, 'learning_rate': 1.9973483431560767e-05, 'epoch': 0.11} {'loss': 0.4804, 'learning_rate': 1.9973458974969132e-05, 'epoch': 0.11} {'loss': 0.6754, 'learning_rate': 1.9973434507119355e-05, 'epoch': 0.11} {'loss': 0.5864, 'learning_rate': 1.997341002801147e-05, 'epoch': 0.11} {'loss': 0.5276, 'learning_rate': 1.99733855376455e-05, 'epoch': 0.11} {'loss': 0.443, 'learning_rate': 1.9973361036021473e-05, 'epoch': 0.11} {'loss': 0.4343, 'learning_rate': 1.997333652313942e-05, 'epoch': 0.11} {'loss': 0.5198, 'learning_rate': 1.9973311998999366e-05, 'epoch': 0.11} {'loss': 0.4428, 'learning_rate': 1.9973287463601337e-05, 'epoch': 0.11} {'loss': 0.494, 'learning_rate': 1.997326291694537e-05, 'epoch': 0.11} {'loss': 0.5854, 'learning_rate': 1.997323835903148e-05, 'epoch': 0.11} {'loss': 0.5802, 'learning_rate': 1.99732137898597e-05, 'epoch': 0.11} {'loss': 0.6572, 'learning_rate': 1.997318920943006e-05, 'epoch': 0.11} {'loss': 0.5013, 'learning_rate': 1.9973164617742587e-05, 'epoch': 0.11} {'loss': 0.5851, 'learning_rate': 1.9973140014797306e-05, 'epoch': 0.11} {'loss': 0.5092, 'learning_rate': 1.9973115400594245e-05, 'epoch': 0.11} {'loss': 0.4921, 'learning_rate': 1.9973090775133436e-05, 'epoch': 0.11} {'loss': 0.3215, 'learning_rate': 1.99730661384149e-05, 'epoch': 0.11} {'loss': 0.4701, 'learning_rate': 1.9973041490438675e-05, 'epoch': 0.11} {'loss': 0.5525, 'learning_rate': 1.9973016831204775e-05, 'epoch': 0.11} {'loss': 0.4732, 'learning_rate': 1.997299216071324e-05, 'epoch': 0.11} {'loss': 0.4481, 'learning_rate': 1.9972967478964094e-05, 'epoch': 0.11} {'loss': 0.6009, 'learning_rate': 1.997294278595736e-05, 'epoch': 0.11} {'loss': 0.4814, 'learning_rate': 1.9972918081693074e-05, 'epoch': 0.11} {'loss': 0.292, 'learning_rate': 1.997289336617126e-05, 'epoch': 0.11} {'loss': 0.6251, 'learning_rate': 1.9972868639391943e-05, 'epoch': 0.11} {'loss': 0.4114, 'learning_rate': 1.9972843901355156e-05, 'epoch': 0.11} {'loss': 0.4389, 'learning_rate': 1.9972819152060925e-05, 'epoch': 0.11} {'loss': 0.5574, 'learning_rate': 1.9972794391509277e-05, 'epoch': 0.11} {'loss': 0.5523, 'learning_rate': 1.997276961970024e-05, 'epoch': 0.11} {'loss': 0.5766, 'learning_rate': 1.9972744836633842e-05, 'epoch': 0.11} {'loss': 0.6719, 'learning_rate': 1.9972720042310113e-05, 'epoch': 0.11} {'loss': 0.4595, 'learning_rate': 1.997269523672908e-05, 'epoch': 0.11} {'loss': 0.6253, 'learning_rate': 1.9972670419890767e-05, 'epoch': 0.11} {'loss': 0.5119, 'learning_rate': 1.997264559179521e-05, 'epoch': 0.11} {'loss': 0.5456, 'learning_rate': 1.9972620752442427e-05, 'epoch': 0.11} {'loss': 0.7504, 'learning_rate': 1.9972595901832457e-05, 'epoch': 0.11} {'loss': 0.5946, 'learning_rate': 1.9972571039965318e-05, 'epoch': 0.11} {'loss': 0.5144, 'learning_rate': 1.9972546166841047e-05, 'epoch': 0.11} {'loss': 0.5199, 'learning_rate': 1.9972521282459663e-05, 'epoch': 0.11} {'loss': 0.5238, 'learning_rate': 1.9972496386821202e-05, 'epoch': 0.11} {'loss': 0.5238, 'learning_rate': 1.997247147992569e-05, 'epoch': 0.11} {'loss': 0.4081, 'learning_rate': 1.9972446561773153e-05, 'epoch': 0.11} {'loss': 0.727, 'learning_rate': 1.997242163236362e-05, 'epoch': 0.11} {'loss': 0.6612, 'learning_rate': 1.9972396691697118e-05, 'epoch': 0.11} {'loss': 0.618, 'learning_rate': 1.997237173977368e-05, 'epoch': 0.11} {'loss': 0.5151, 'learning_rate': 1.9972346776593326e-05, 'epoch': 0.11} {'loss': 0.5675, 'learning_rate': 1.997232180215609e-05, 'epoch': 0.11} {'loss': 0.38, 'learning_rate': 1.9972296816462e-05, 'epoch': 0.11} {'loss': 0.4911, 'learning_rate': 1.9972271819511084e-05, 'epoch': 0.11} {'loss': 0.4893, 'learning_rate': 1.9972246811303367e-05, 'epoch': 0.11} {'loss': 0.4857, 'learning_rate': 1.997222179183888e-05, 'epoch': 0.11} {'loss': 0.4624, 'learning_rate': 1.9972196761117658e-05, 'epoch': 0.11} {'loss': 0.6418, 'learning_rate': 1.9972171719139713e-05, 'epoch': 0.11} {'loss': 0.5952, 'learning_rate': 1.997214666590509e-05, 'epoch': 0.11} {'loss': 0.4273, 'learning_rate': 1.99721216014138e-05, 'epoch': 0.11} {'loss': 0.5553, 'learning_rate': 1.9972096525665886e-05, 'epoch': 0.11} {'loss': 0.536, 'learning_rate': 1.9972071438661374e-05, 'epoch': 0.11} {'loss': 0.5713, 'learning_rate': 1.9972046340400285e-05, 'epoch': 0.11} {'loss': 0.581, 'learning_rate': 1.9972021230882657e-05, 'epoch': 0.11} {'loss': 0.5187, 'learning_rate': 1.997199611010851e-05, 'epoch': 0.11} {'loss': 0.6598, 'learning_rate': 1.9971970978077878e-05, 'epoch': 0.11} {'loss': 0.6192, 'learning_rate': 1.9971945834790784e-05, 'epoch': 0.11} {'loss': 0.5409, 'learning_rate': 1.997192068024726e-05, 'epoch': 0.11} {'loss': 0.4021, 'learning_rate': 1.9971895514447338e-05, 'epoch': 0.11} {'loss': 0.5408, 'learning_rate': 1.9971870337391037e-05, 'epoch': 0.11} {'loss': 0.4297, 'learning_rate': 1.997184514907839e-05, 'epoch': 0.11} {'loss': 0.4587, 'learning_rate': 1.997181994950943e-05, 'epoch': 0.11} {'loss': 0.7246, 'learning_rate': 1.997179473868418e-05, 'epoch': 0.11} {'loss': 0.5178, 'learning_rate': 1.997176951660267e-05, 'epoch': 0.11} {'loss': 0.574, 'learning_rate': 1.997174428326493e-05, 'epoch': 0.11} {'loss': 0.498, 'learning_rate': 1.9971719038670983e-05, 'epoch': 0.11} {'loss': 0.5074, 'learning_rate': 1.997169378282086e-05, 'epoch': 0.11} {'loss': 0.4312, 'learning_rate': 1.9971668515714597e-05, 'epoch': 0.11} {'loss': 0.4932, 'learning_rate': 1.9971643237352216e-05, 'epoch': 0.11} {'loss': 0.5, 'learning_rate': 1.9971617947733743e-05, 'epoch': 0.11} {'loss': 0.5332, 'learning_rate': 1.9971592646859213e-05, 'epoch': 0.11} {'loss': 0.5515, 'learning_rate': 1.9971567334728647e-05, 'epoch': 0.11} {'loss': 0.6225, 'learning_rate': 1.9971542011342078e-05, 'epoch': 0.11} {'loss': 0.6691, 'learning_rate': 1.9971516676699535e-05, 'epoch': 0.11} {'loss': 0.558, 'learning_rate': 1.9971491330801046e-05, 'epoch': 0.11} {'loss': 0.4691, 'learning_rate': 1.997146597364664e-05, 'epoch': 0.11} {'loss': 0.5643, 'learning_rate': 1.9971440605236346e-05, 'epoch': 0.11} {'loss': 0.4332, 'learning_rate': 1.997141522557019e-05, 'epoch': 0.11} {'loss': 0.4627, 'learning_rate': 1.9971389834648204e-05, 'epoch': 0.11} {'loss': 0.6747, 'learning_rate': 1.9971364432470413e-05, 'epoch': 0.11} {'loss': 0.6395, 'learning_rate': 1.9971339019036852e-05, 'epoch': 0.11} {'loss': 0.4127, 'learning_rate': 1.997131359434754e-05, 'epoch': 0.11} {'loss': 0.5876, 'learning_rate': 1.9971288158402514e-05, 'epoch': 0.11} {'loss': 0.6657, 'learning_rate': 1.9971262711201798e-05, 'epoch': 0.11} {'loss': 0.4456, 'learning_rate': 1.9971237252745423e-05, 'epoch': 0.11} {'loss': 0.6286, 'learning_rate': 1.997121178303342e-05, 'epoch': 0.11} {'loss': 0.3062, 'learning_rate': 1.997118630206581e-05, 'epoch': 0.11} {'loss': 0.4941, 'learning_rate': 1.997116080984263e-05, 'epoch': 0.11} {'loss': 0.5288, 'learning_rate': 1.9971135306363907e-05, 'epoch': 0.11} {'loss': 0.5125, 'learning_rate': 1.9971109791629665e-05, 'epoch': 0.11} {'loss': 0.469, 'learning_rate': 1.9971084265639936e-05, 'epoch': 0.11} {'loss': 0.398, 'learning_rate': 1.9971058728394752e-05, 'epoch': 0.11} {'loss': 0.5531, 'learning_rate': 1.9971033179894137e-05, 'epoch': 0.11} {'loss': 0.525, 'learning_rate': 1.997100762013812e-05, 'epoch': 0.11} {'loss': 0.5321, 'learning_rate': 1.9970982049126735e-05, 'epoch': 0.11} {'loss': 0.4725, 'learning_rate': 1.997095646686001e-05, 'epoch': 0.11} {'loss': 0.6548, 'learning_rate': 1.9970930873337963e-05, 'epoch': 0.11} {'loss': 0.6472, 'learning_rate': 1.9970905268560635e-05, 'epoch': 0.11} {'loss': 0.4741, 'learning_rate': 1.997087965252805e-05, 'epoch': 0.11} {'loss': 0.4429, 'learning_rate': 1.997085402524024e-05, 'epoch': 0.11} {'loss': 0.4748, 'learning_rate': 1.997082838669723e-05, 'epoch': 0.11} {'loss': 0.5813, 'learning_rate': 1.9970802736899054e-05, 'epoch': 0.11} {'loss': 0.6482, 'learning_rate': 1.9970777075845735e-05, 'epoch': 0.11} {'loss': 0.379, 'learning_rate': 1.9970751403537302e-05, 'epoch': 0.11} {'loss': 0.4854, 'learning_rate': 1.997072571997379e-05, 'epoch': 0.11} {'loss': 0.474, 'learning_rate': 1.9970700025155227e-05, 'epoch': 0.11} {'loss': 0.4531, 'learning_rate': 1.9970674319081635e-05, 'epoch': 0.11} {'loss': 0.545, 'learning_rate': 1.9970648601753052e-05, 'epoch': 0.11} {'loss': 0.5203, 'learning_rate': 1.99706228731695e-05, 'epoch': 0.11} {'loss': 0.4342, 'learning_rate': 1.9970597133331012e-05, 'epoch': 0.11} {'loss': 0.4471, 'learning_rate': 1.9970571382237613e-05, 'epoch': 0.11} {'loss': 0.5775, 'learning_rate': 1.9970545619889337e-05, 'epoch': 0.11} {'loss': 0.4254, 'learning_rate': 1.9970519846286213e-05, 'epoch': 0.11} {'loss': 0.4572, 'learning_rate': 1.9970494061428264e-05, 'epoch': 0.11} {'loss': 0.4534, 'learning_rate': 1.9970468265315527e-05, 'epoch': 0.11} {'loss': 0.5097, 'learning_rate': 1.9970442457948023e-05, 'epoch': 0.11} {'loss': 0.4746, 'learning_rate': 1.9970416639325793e-05, 'epoch': 0.11} {'loss': 0.5234, 'learning_rate': 1.9970390809448852e-05, 'epoch': 0.11} {'loss': 0.6603, 'learning_rate': 1.9970364968317236e-05, 'epoch': 0.11} {'loss': 0.5829, 'learning_rate': 1.9970339115930978e-05, 'epoch': 0.11} {'loss': 0.4354, 'learning_rate': 1.9970313252290098e-05, 'epoch': 0.11} {'loss': 0.5944, 'learning_rate': 1.9970287377394634e-05, 'epoch': 0.11} {'loss': 0.4706, 'learning_rate': 1.997026149124461e-05, 'epoch': 0.11} {'loss': 0.5103, 'learning_rate': 1.9970235593840054e-05, 'epoch': 0.11} {'loss': 0.5674, 'learning_rate': 1.9970209685181003e-05, 'epoch': 0.11} {'loss': 0.5548, 'learning_rate': 1.997018376526748e-05, 'epoch': 0.11} {'loss': 0.6157, 'learning_rate': 1.9970157834099513e-05, 'epoch': 0.11} {'loss': 0.5695, 'learning_rate': 1.9970131891677135e-05, 'epoch': 0.11} {'loss': 0.5348, 'learning_rate': 1.9970105938000373e-05, 'epoch': 0.11} {'loss': 0.5197, 'learning_rate': 1.9970079973069257e-05, 'epoch': 0.11} {'loss': 0.538, 'learning_rate': 1.997005399688382e-05, 'epoch': 0.11} {'loss': 0.5946, 'learning_rate': 1.9970028009444085e-05, 'epoch': 0.11} {'loss': 0.7275, 'learning_rate': 1.9970002010750087e-05, 'epoch': 0.11} {'loss': 0.5539, 'learning_rate': 1.996997600080185e-05, 'epoch': 0.11} {'loss': 0.5084, 'learning_rate': 1.9969949979599405e-05, 'epoch': 0.11} {'loss': 0.5932, 'learning_rate': 1.9969923947142785e-05, 'epoch': 0.11} {'loss': 0.5399, 'learning_rate': 1.9969897903432018e-05, 'epoch': 0.11} {'loss': 0.5134, 'learning_rate': 1.9969871848467127e-05, 'epoch': 0.11} {'loss': 0.3565, 'learning_rate': 1.996984578224815e-05, 'epoch': 0.11} {'loss': 0.5151, 'learning_rate': 1.9969819704775114e-05, 'epoch': 0.11} {'loss': 0.3993, 'learning_rate': 1.9969793616048046e-05, 'epoch': 0.11} {'loss': 0.635, 'learning_rate': 1.9969767516066976e-05, 'epoch': 0.11} {'loss': 0.5611, 'learning_rate': 1.9969741404831935e-05, 'epoch': 0.11} {'loss': 0.5766, 'learning_rate': 1.9969715282342953e-05, 'epoch': 0.11} {'loss': 0.5247, 'learning_rate': 1.9969689148600055e-05, 'epoch': 0.11} {'loss': 0.5635, 'learning_rate': 1.9969663003603276e-05, 'epoch': 0.11} {'loss': 0.5462, 'learning_rate': 1.9969636847352646e-05, 'epoch': 0.11} {'loss': 0.5818, 'learning_rate': 1.9969610679848186e-05, 'epoch': 0.11} {'loss': 0.5069, 'learning_rate': 1.9969584501089935e-05, 'epoch': 0.11} {'loss': 0.5264, 'learning_rate': 1.996955831107792e-05, 'epoch': 0.11} {'loss': 0.4947, 'learning_rate': 1.9969532109812167e-05, 'epoch': 0.11} {'loss': 0.515, 'learning_rate': 1.996950589729271e-05, 'epoch': 0.11} {'loss': 0.7054, 'learning_rate': 1.9969479673519574e-05, 'epoch': 0.11} {'loss': 0.5225, 'learning_rate': 1.9969453438492793e-05, 'epoch': 0.11} {'loss': 0.6006, 'learning_rate': 1.9969427192212395e-05, 'epoch': 0.11} {'loss': 0.4122, 'learning_rate': 1.9969400934678406e-05, 'epoch': 0.11} {'loss': 0.4895, 'learning_rate': 1.9969374665890863e-05, 'epoch': 0.11} {'loss': 0.417, 'learning_rate': 1.9969348385849793e-05, 'epoch': 0.11} {'loss': 0.6618, 'learning_rate': 1.9969322094555222e-05, 'epoch': 0.11} {'loss': 0.5273, 'learning_rate': 1.996929579200718e-05, 'epoch': 0.11} {'loss': 0.454, 'learning_rate': 1.9969269478205705e-05, 'epoch': 0.11} {'loss': 0.4074, 'learning_rate': 1.9969243153150814e-05, 'epoch': 0.11} {'loss': 0.5133, 'learning_rate': 1.9969216816842544e-05, 'epoch': 0.11} {'loss': 0.4646, 'learning_rate': 1.9969190469280926e-05, 'epoch': 0.11} {'loss': 0.5277, 'learning_rate': 1.9969164110465988e-05, 'epoch': 0.11} {'loss': 0.6594, 'learning_rate': 1.996913774039776e-05, 'epoch': 0.11} {'loss': 0.4002, 'learning_rate': 1.996911135907627e-05, 'epoch': 0.11} {'loss': 0.6514, 'learning_rate': 1.996908496650155e-05, 'epoch': 0.11} {'loss': 0.3517, 'learning_rate': 1.996905856267363e-05, 'epoch': 0.11} {'loss': 0.6296, 'learning_rate': 1.9969032147592532e-05, 'epoch': 0.11} {'loss': 0.4881, 'learning_rate': 1.9969005721258297e-05, 'epoch': 0.11} {'loss': 0.6508, 'learning_rate': 1.9968979283670952e-05, 'epoch': 0.11} {'loss': 0.4892, 'learning_rate': 1.9968952834830523e-05, 'epoch': 0.11} {'loss': 0.584, 'learning_rate': 1.9968926374737045e-05, 'epoch': 0.11} {'loss': 0.5347, 'learning_rate': 1.996889990339054e-05, 'epoch': 0.11} {'loss': 0.5065, 'learning_rate': 1.9968873420791044e-05, 'epoch': 0.11} {'loss': 0.5305, 'learning_rate': 1.9968846926938587e-05, 'epoch': 0.11} {'loss': 0.373, 'learning_rate': 1.9968820421833195e-05, 'epoch': 0.11} {'loss': 0.5893, 'learning_rate': 1.9968793905474902e-05, 'epoch': 0.11} {'loss': 0.4829, 'learning_rate': 1.996876737786374e-05, 'epoch': 0.11} {'loss': 0.5455, 'learning_rate': 1.996874083899973e-05, 'epoch': 0.11} {'loss': 0.5408, 'learning_rate': 1.996871428888291e-05, 'epoch': 0.11} {'loss': 0.6278, 'learning_rate': 1.9968687727513304e-05, 'epoch': 0.11} {'loss': 0.6154, 'learning_rate': 1.9968661154890946e-05, 'epoch': 0.11} {'loss': 0.5173, 'learning_rate': 1.9968634571015867e-05, 'epoch': 0.11} {'loss': 0.5184, 'learning_rate': 1.99686079758881e-05, 'epoch': 0.11} {'loss': 0.5287, 'learning_rate': 1.996858136950766e-05, 'epoch': 0.11} {'loss': 0.5857, 'learning_rate': 1.9968554751874594e-05, 'epoch': 0.11} {'loss': 0.4859, 'learning_rate': 1.9968528122988923e-05, 'epoch': 0.11} {'loss': 0.7017, 'learning_rate': 1.996850148285068e-05, 'epoch': 0.11} {'loss': 0.3982, 'learning_rate': 1.9968474831459893e-05, 'epoch': 0.11} {'loss': 0.5379, 'learning_rate': 1.9968448168816595e-05, 'epoch': 0.11} {'loss': 0.6207, 'learning_rate': 1.9968421494920817e-05, 'epoch': 0.11} {'loss': 0.6053, 'learning_rate': 1.996839480977258e-05, 'epoch': 0.11} {'loss': 0.3917, 'learning_rate': 1.9968368113371927e-05, 'epoch': 0.11} {'loss': 0.4667, 'learning_rate': 1.996834140571888e-05, 'epoch': 0.11} {'loss': 0.5854, 'learning_rate': 1.9968314686813472e-05, 'epoch': 0.11} {'loss': 0.4053, 'learning_rate': 1.996828795665573e-05, 'epoch': 0.11} {'loss': 0.4848, 'learning_rate': 1.9968261215245688e-05, 'epoch': 0.11} {'loss': 0.5708, 'learning_rate': 1.9968234462583377e-05, 'epoch': 0.11} {'loss': 0.5262, 'learning_rate': 1.996820769866882e-05, 'epoch': 0.11} {'loss': 0.33, 'learning_rate': 1.9968180923502053e-05, 'epoch': 0.11} {'loss': 0.5605, 'learning_rate': 1.9968154137083108e-05, 'epoch': 0.11} {'loss': 0.6511, 'learning_rate': 1.996812733941201e-05, 'epoch': 0.11} {'loss': 0.5427, 'learning_rate': 1.9968100530488796e-05, 'epoch': 0.11} {'loss': 0.6938, 'learning_rate': 1.9968073710313487e-05, 'epoch': 0.11} {'loss': 0.5603, 'learning_rate': 1.996804687888612e-05, 'epoch': 0.11} {'loss': 0.5493, 'learning_rate': 1.9968020036206722e-05, 'epoch': 0.11} {'loss': 0.5214, 'learning_rate': 1.9967993182275327e-05, 'epoch': 0.11} {'loss': 0.6288, 'learning_rate': 1.9967966317091964e-05, 'epoch': 0.11} {'loss': 0.5302, 'learning_rate': 1.9967939440656662e-05, 'epoch': 0.11} {'loss': 0.5726, 'learning_rate': 1.996791255296945e-05, 'epoch': 0.11} {'loss': 0.6115, 'learning_rate': 1.9967885654030362e-05, 'epoch': 0.11} {'loss': 0.6082, 'learning_rate': 1.9967858743839426e-05, 'epoch': 0.11} {'loss': 0.4806, 'learning_rate': 1.9967831822396672e-05, 'epoch': 0.11} {'loss': 0.5856, 'learning_rate': 1.9967804889702133e-05, 'epoch': 0.11} {'loss': 0.5785, 'learning_rate': 1.9967777945755836e-05, 'epoch': 0.11} {'loss': 0.5231, 'learning_rate': 1.9967750990557813e-05, 'epoch': 0.11} {'loss': 0.4081, 'learning_rate': 1.9967724024108097e-05, 'epoch': 0.11} {'loss': 0.5606, 'learning_rate': 1.9967697046406716e-05, 'epoch': 0.11} {'loss': 0.3351, 'learning_rate': 1.99676700574537e-05, 'epoch': 0.11} {'loss': 0.3885, 'learning_rate': 1.996764305724908e-05, 'epoch': 0.11} {'loss': 0.4789, 'learning_rate': 1.9967616045792884e-05, 'epoch': 0.11} {'loss': 0.4027, 'learning_rate': 1.9967589023085146e-05, 'epoch': 0.11} {'loss': 0.5959, 'learning_rate': 1.9967561989125897e-05, 'epoch': 0.11} {'loss': 0.5097, 'learning_rate': 1.9967534943915164e-05, 'epoch': 0.11} {'loss': 0.575, 'learning_rate': 1.996750788745298e-05, 'epoch': 0.11} {'loss': 0.4581, 'learning_rate': 1.9967480819739377e-05, 'epoch': 0.11} {'loss': 0.4428, 'learning_rate': 1.996745374077438e-05, 'epoch': 0.11} {'loss': 0.6463, 'learning_rate': 1.9967426650558027e-05, 'epoch': 0.11} {'loss': 0.5403, 'learning_rate': 1.9967399549090343e-05, 'epoch': 0.11} {'loss': 0.4978, 'learning_rate': 1.996737243637136e-05, 'epoch': 0.11} {'loss': 0.565, 'learning_rate': 1.9967345312401107e-05, 'epoch': 0.11} {'loss': 0.4164, 'learning_rate': 1.996731817717962e-05, 'epoch': 0.11} {'loss': 0.5936, 'learning_rate': 1.9967291030706923e-05, 'epoch': 0.11} {'loss': 0.5459, 'learning_rate': 1.9967263872983055e-05, 'epoch': 0.11} {'loss': 0.4889, 'learning_rate': 1.996723670400804e-05, 'epoch': 0.11} {'loss': 0.4049, 'learning_rate': 1.9967209523781904e-05, 'epoch': 0.11} {'loss': 0.5057, 'learning_rate': 1.9967182332304688e-05, 'epoch': 0.11} {'loss': 0.6911, 'learning_rate': 1.9967155129576418e-05, 'epoch': 0.11} {'loss': 0.4536, 'learning_rate': 1.9967127915597128e-05, 'epoch': 0.11} {'loss': 0.4527, 'learning_rate': 1.9967100690366842e-05, 'epoch': 0.11} {'loss': 0.392, 'learning_rate': 1.9967073453885593e-05, 'epoch': 0.11} {'loss': 0.6071, 'learning_rate': 1.9967046206153416e-05, 'epoch': 0.11} {'loss': 0.6912, 'learning_rate': 1.9967018947170344e-05, 'epoch': 0.11} {'loss': 0.522, 'learning_rate': 1.9966991676936394e-05, 'epoch': 0.11} {'loss': 0.4666, 'learning_rate': 1.9966964395451614e-05, 'epoch': 0.11} {'loss': 0.5056, 'learning_rate': 1.996693710271602e-05, 'epoch': 0.11} {'loss': 0.7093, 'learning_rate': 1.996690979872965e-05, 'epoch': 0.11} {'loss': 0.5055, 'learning_rate': 1.996688248349254e-05, 'epoch': 0.11} {'loss': 0.4034, 'learning_rate': 1.9966855157004713e-05, 'epoch': 0.11} {'loss': 0.4516, 'learning_rate': 1.9966827819266198e-05, 'epoch': 0.11} {'loss': 0.5296, 'learning_rate': 1.9966800470277033e-05, 'epoch': 0.11} {'loss': 0.5548, 'learning_rate': 1.9966773110037243e-05, 'epoch': 0.11} {'loss': 0.6145, 'learning_rate': 1.996674573854686e-05, 'epoch': 0.11} {'loss': 0.4391, 'learning_rate': 1.996671835580592e-05, 'epoch': 0.11} {'loss': 0.493, 'learning_rate': 1.996669096181445e-05, 'epoch': 0.11} {'loss': 0.4746, 'learning_rate': 1.996666355657248e-05, 'epoch': 0.11} {'loss': 0.5153, 'learning_rate': 1.9966636140080044e-05, 'epoch': 0.11} {'loss': 0.6175, 'learning_rate': 1.9966608712337166e-05, 'epoch': 0.11} {'loss': 0.6641, 'learning_rate': 1.996658127334389e-05, 'epoch': 0.11} {'loss': 0.595, 'learning_rate': 1.9966553823100232e-05, 'epoch': 0.11} {'loss': 0.5445, 'learning_rate': 1.9966526361606233e-05, 'epoch': 0.11} {'loss': 0.5721, 'learning_rate': 1.996649888886192e-05, 'epoch': 0.11} {'loss': 0.48, 'learning_rate': 1.9966471404867326e-05, 'epoch': 0.11} {'loss': 0.5365, 'learning_rate': 1.996644390962248e-05, 'epoch': 0.11} {'loss': 0.5285, 'learning_rate': 1.9966416403127414e-05, 'epoch': 0.11} {'loss': 0.5425, 'learning_rate': 1.996638888538216e-05, 'epoch': 0.11} {'loss': 0.5504, 'learning_rate': 1.9966361356386747e-05, 'epoch': 0.11} {'loss': 0.5646, 'learning_rate': 1.9966333816141208e-05, 'epoch': 0.11} {'loss': 0.7093, 'learning_rate': 1.9966306264645573e-05, 'epoch': 0.11} {'loss': 0.6329, 'learning_rate': 1.9966278701899875e-05, 'epoch': 0.11} {'loss': 0.7606, 'learning_rate': 1.9966251127904138e-05, 'epoch': 0.11} {'loss': 0.5297, 'learning_rate': 1.9966223542658405e-05, 'epoch': 0.11} {'loss': 0.5104, 'learning_rate': 1.99661959461627e-05, 'epoch': 0.11} {'loss': 0.5965, 'learning_rate': 1.996616833841705e-05, 'epoch': 0.11} {'loss': 0.3885, 'learning_rate': 1.99661407194215e-05, 'epoch': 0.11} {'loss': 0.4571, 'learning_rate': 1.9966113089176063e-05, 'epoch': 0.11} {'loss': 0.5792, 'learning_rate': 1.9966085447680786e-05, 'epoch': 0.11} {'loss': 0.4903, 'learning_rate': 1.996605779493569e-05, 'epoch': 0.11} {'loss': 0.6308, 'learning_rate': 1.996603013094081e-05, 'epoch': 0.11} {'loss': 0.4253, 'learning_rate': 1.9966002455696177e-05, 'epoch': 0.11} {'loss': 0.4789, 'learning_rate': 1.9965974769201824e-05, 'epoch': 0.11} {'loss': 0.5525, 'learning_rate': 1.996594707145778e-05, 'epoch': 0.11} {'loss': 0.4937, 'learning_rate': 1.9965919362464077e-05, 'epoch': 0.11} {'loss': 0.5983, 'learning_rate': 1.9965891642220747e-05, 'epoch': 0.11} {'loss': 0.6027, 'learning_rate': 1.9965863910727816e-05, 'epoch': 0.11} {'loss': 0.4719, 'learning_rate': 1.9965836167985325e-05, 'epoch': 0.11} {'loss': 0.525, 'learning_rate': 1.99658084139933e-05, 'epoch': 0.11} {'loss': 0.6173, 'learning_rate': 1.996578064875177e-05, 'epoch': 0.11} {'loss': 0.5284, 'learning_rate': 1.996575287226077e-05, 'epoch': 0.11} {'loss': 0.3731, 'learning_rate': 1.9965725084520328e-05, 'epoch': 0.11} {'loss': 0.6077, 'learning_rate': 1.996569728553048e-05, 'epoch': 0.11} {'loss': 0.4937, 'learning_rate': 1.996566947529125e-05, 'epoch': 0.11} {'loss': 0.52, 'learning_rate': 1.9965641653802678e-05, 'epoch': 0.11} {'loss': 0.57, 'learning_rate': 1.9965613821064794e-05, 'epoch': 0.11} {'loss': 0.6423, 'learning_rate': 1.9965585977077624e-05, 'epoch': 0.11} {'loss': 0.4903, 'learning_rate': 1.9965558121841203e-05, 'epoch': 0.11} {'loss': 0.4348, 'learning_rate': 1.996553025535556e-05, 'epoch': 0.11} {'loss': 0.579, 'learning_rate': 1.996550237762073e-05, 'epoch': 0.11} {'loss': 0.7226, 'learning_rate': 1.9965474488636745e-05, 'epoch': 0.11} {'loss': 0.6492, 'learning_rate': 1.9965446588403634e-05, 'epoch': 0.11} {'loss': 0.5522, 'learning_rate': 1.9965418676921423e-05, 'epoch': 0.11} {'loss': 0.6289, 'learning_rate': 1.9965390754190153e-05, 'epoch': 0.11} {'loss': 0.6966, 'learning_rate': 1.9965362820209856e-05, 'epoch': 0.11} {'loss': 0.6262, 'learning_rate': 1.9965334874980552e-05, 'epoch': 0.11} {'loss': 0.5871, 'learning_rate': 1.9965306918502287e-05, 'epoch': 0.11} {'loss': 0.6847, 'learning_rate': 1.9965278950775083e-05, 'epoch': 0.11} {'loss': 0.71, 'learning_rate': 1.9965250971798973e-05, 'epoch': 0.11} {'loss': 0.6418, 'learning_rate': 1.9965222981573987e-05, 'epoch': 0.11} {'loss': 0.6455, 'learning_rate': 1.9965194980100163e-05, 'epoch': 0.11} {'loss': 0.5342, 'learning_rate': 1.996516696737753e-05, 'epoch': 0.11} {'loss': 0.5734, 'learning_rate': 1.9965138943406113e-05, 'epoch': 0.11} {'loss': 0.5085, 'learning_rate': 1.9965110908185955e-05, 'epoch': 0.11} {'loss': 0.5418, 'learning_rate': 1.9965082861717077e-05, 'epoch': 0.11} {'loss': 0.5238, 'learning_rate': 1.996505480399952e-05, 'epoch': 0.11} {'loss': 0.5342, 'learning_rate': 1.9965026735033305e-05, 'epoch': 0.11} {'loss': 0.6423, 'learning_rate': 1.996499865481848e-05, 'epoch': 0.11} {'loss': 0.3837, 'learning_rate': 1.9964970563355055e-05, 'epoch': 0.11} {'loss': 0.3541, 'learning_rate': 1.996494246064308e-05, 'epoch': 0.11} {'loss': 0.5143, 'learning_rate': 1.9964914346682577e-05, 'epoch': 0.11} {'loss': 0.506, 'learning_rate': 1.996488622147358e-05, 'epoch': 0.11} {'loss': 0.513, 'learning_rate': 1.9964858085016122e-05, 'epoch': 0.11} {'loss': 0.4916, 'learning_rate': 1.996482993731024e-05, 'epoch': 0.11} {'loss': 0.6539, 'learning_rate': 1.9964801778355955e-05, 'epoch': 0.11} {'loss': 0.5459, 'learning_rate': 1.99647736081533e-05, 'epoch': 0.11} {'loss': 0.5371, 'learning_rate': 1.9964745426702316e-05, 'epoch': 0.11} {'loss': 0.5065, 'learning_rate': 1.9964717234003025e-05, 'epoch': 0.11} {'loss': 0.6006, 'learning_rate': 1.9964689030055465e-05, 'epoch': 0.11} {'loss': 0.4513, 'learning_rate': 1.9964660814859667e-05, 'epoch': 0.11} {'loss': 0.6552, 'learning_rate': 1.996463258841566e-05, 'epoch': 0.11} {'loss': 0.706, 'learning_rate': 1.996460435072348e-05, 'epoch': 0.11} {'loss': 0.5377, 'learning_rate': 1.9964576101783158e-05, 'epoch': 0.11} {'loss': 0.5069, 'learning_rate': 1.996454784159472e-05, 'epoch': 0.11} {'loss': 0.5599, 'learning_rate': 1.9964519570158206e-05, 'epoch': 0.11} {'loss': 0.6363, 'learning_rate': 1.996449128747364e-05, 'epoch': 0.11} {'loss': 0.6333, 'learning_rate': 1.9964462993541063e-05, 'epoch': 0.11} {'loss': 0.6912, 'learning_rate': 1.99644346883605e-05, 'epoch': 0.11} {'loss': 0.4436, 'learning_rate': 1.9964406371931985e-05, 'epoch': 0.11} {'loss': 0.5615, 'learning_rate': 1.9964378044255552e-05, 'epoch': 0.11} {'loss': 0.467, 'learning_rate': 1.996434970533123e-05, 'epoch': 0.11} {'loss': 0.4638, 'learning_rate': 1.9964321355159047e-05, 'epoch': 0.11} {'loss': 0.3451, 'learning_rate': 1.9964292993739046e-05, 'epoch': 0.11} {'loss': 0.6488, 'learning_rate': 1.9964264621071248e-05, 'epoch': 0.11} {'loss': 0.6474, 'learning_rate': 1.9964236237155693e-05, 'epoch': 0.11} {'loss': 0.5148, 'learning_rate': 1.996420784199241e-05, 'epoch': 0.11} {'loss': 0.6364, 'learning_rate': 1.996417943558143e-05, 'epoch': 0.11} {'loss': 0.6845, 'learning_rate': 1.996415101792279e-05, 'epoch': 0.11} {'loss': 0.5405, 'learning_rate': 1.9964122589016514e-05, 'epoch': 0.11} {'loss': 0.5885, 'learning_rate': 1.996409414886264e-05, 'epoch': 0.11} {'loss': 0.4544, 'learning_rate': 1.9964065697461198e-05, 'epoch': 0.11} {'loss': 0.6028, 'learning_rate': 1.9964037234812222e-05, 'epoch': 0.11} {'loss': 0.5081, 'learning_rate': 1.996400876091574e-05, 'epoch': 0.11} {'loss': 0.5034, 'learning_rate': 1.996398027577179e-05, 'epoch': 0.11} {'loss': 0.5041, 'learning_rate': 1.99639517793804e-05, 'epoch': 0.11} {'loss': 0.5808, 'learning_rate': 1.99639232717416e-05, 'epoch': 0.11} {'loss': 0.4315, 'learning_rate': 1.996389475285543e-05, 'epoch': 0.11} {'loss': 0.6469, 'learning_rate': 1.9963866222721914e-05, 'epoch': 0.11} {'loss': 0.5956, 'learning_rate': 1.9963837681341093e-05, 'epoch': 0.11} {'loss': 0.5661, 'learning_rate': 1.996380912871299e-05, 'epoch': 0.11} {'loss': 0.4643, 'learning_rate': 1.996378056483764e-05, 'epoch': 0.11} {'loss': 0.4789, 'learning_rate': 1.9963751989715077e-05, 'epoch': 0.11} {'loss': 0.4499, 'learning_rate': 1.9963723403345336e-05, 'epoch': 0.11} {'loss': 0.511, 'learning_rate': 1.9963694805728443e-05, 'epoch': 0.11} {'loss': 0.601, 'learning_rate': 1.9963666196864433e-05, 'epoch': 0.11} {'loss': 0.4955, 'learning_rate': 1.9963637576753337e-05, 'epoch': 0.11} {'loss': 0.3516, 'learning_rate': 1.9963608945395195e-05, 'epoch': 0.11} {'loss': 0.599, 'learning_rate': 1.9963580302790028e-05, 'epoch': 0.11} {'loss': 0.4664, 'learning_rate': 1.9963551648937876e-05, 'epoch': 0.11} {'loss': 0.5477, 'learning_rate': 1.9963522983838766e-05, 'epoch': 0.11} {'loss': 0.5356, 'learning_rate': 1.9963494307492736e-05, 'epoch': 0.11} {'loss': 0.5106, 'learning_rate': 1.9963465619899813e-05, 'epoch': 0.11} {'loss': 0.6937, 'learning_rate': 1.9963436921060037e-05, 'epoch': 0.11} {'loss': 0.4168, 'learning_rate': 1.996340821097343e-05, 'epoch': 0.11} {'loss': 0.55, 'learning_rate': 1.996337948964003e-05, 'epoch': 0.11} {'loss': 0.5297, 'learning_rate': 1.996335075705987e-05, 'epoch': 0.11} {'loss': 0.5083, 'learning_rate': 1.9963322013232985e-05, 'epoch': 0.12} {'loss': 0.5465, 'learning_rate': 1.9963293258159403e-05, 'epoch': 0.12} {'loss': 0.3857, 'learning_rate': 1.9963264491839155e-05, 'epoch': 0.12} {'loss': 0.5002, 'learning_rate': 1.9963235714272277e-05, 'epoch': 0.12} {'loss': 0.5931, 'learning_rate': 1.99632069254588e-05, 'epoch': 0.12} {'loss': 0.596, 'learning_rate': 1.9963178125398758e-05, 'epoch': 0.12} {'loss': 0.5173, 'learning_rate': 1.9963149314092183e-05, 'epoch': 0.12} {'loss': 0.4612, 'learning_rate': 1.9963120491539105e-05, 'epoch': 0.12} {'loss': 0.4795, 'learning_rate': 1.9963091657739556e-05, 'epoch': 0.12} {'loss': 0.5622, 'learning_rate': 1.996306281269358e-05, 'epoch': 0.12} {'loss': 0.7377, 'learning_rate': 1.9963033956401193e-05, 'epoch': 0.12} {'loss': 0.6283, 'learning_rate': 1.996300508886244e-05, 'epoch': 0.12} {'loss': 0.6837, 'learning_rate': 1.9962976210077343e-05, 'epoch': 0.12} {'loss': 0.4602, 'learning_rate': 1.996294732004594e-05, 'epoch': 0.12} {'loss': 0.4267, 'learning_rate': 1.9962918418768272e-05, 'epoch': 0.12} {'loss': 0.5625, 'learning_rate': 1.9962889506244357e-05, 'epoch': 0.12} {'loss': 0.6674, 'learning_rate': 1.996286058247424e-05, 'epoch': 0.12} {'loss': 0.4929, 'learning_rate': 1.9962831647457944e-05, 'epoch': 0.12} {'loss': 0.686, 'learning_rate': 1.9962802701195504e-05, 'epoch': 0.12} {'loss': 0.4791, 'learning_rate': 1.996277374368696e-05, 'epoch': 0.12} {'loss': 0.5171, 'learning_rate': 1.9962744774932332e-05, 'epoch': 0.12} {'loss': 0.4192, 'learning_rate': 1.996271579493166e-05, 'epoch': 0.12} {'loss': 0.5752, 'learning_rate': 1.9962686803684982e-05, 'epoch': 0.12} {'loss': 0.6372, 'learning_rate': 1.996265780119232e-05, 'epoch': 0.12} {'loss': 0.5248, 'learning_rate': 1.9962628787453718e-05, 'epoch': 0.12} {'loss': 0.5631, 'learning_rate': 1.9962599762469198e-05, 'epoch': 0.12} {'loss': 0.6836, 'learning_rate': 1.99625707262388e-05, 'epoch': 0.12} {'loss': 0.6397, 'learning_rate': 1.996254167876255e-05, 'epoch': 0.12} {'loss': 0.4502, 'learning_rate': 1.9962512620040488e-05, 'epoch': 0.12} {'loss': 0.432, 'learning_rate': 1.9962483550072643e-05, 'epoch': 0.12} {'loss': 0.5254, 'learning_rate': 1.996245446885905e-05, 'epoch': 0.12} {'loss': 0.498, 'learning_rate': 1.9962425376399736e-05, 'epoch': 0.12} {'loss': 0.5766, 'learning_rate': 1.9962396272694742e-05, 'epoch': 0.12} {'loss': 0.6282, 'learning_rate': 1.9962367157744095e-05, 'epoch': 0.12} {'loss': 0.6975, 'learning_rate': 1.996233803154783e-05, 'epoch': 0.12} {'loss': 0.5142, 'learning_rate': 1.9962308894105986e-05, 'epoch': 0.12} {'loss': 0.4979, 'learning_rate': 1.996227974541858e-05, 'epoch': 0.12} {'loss': 0.5594, 'learning_rate': 1.996225058548566e-05, 'epoch': 0.12} {'loss': 0.4806, 'learning_rate': 1.996222141430725e-05, 'epoch': 0.12} {'loss': 0.5901, 'learning_rate': 1.996219223188339e-05, 'epoch': 0.12} {'loss': 0.5989, 'learning_rate': 1.9962163038214107e-05, 'epoch': 0.12} {'loss': 0.3701, 'learning_rate': 1.996213383329944e-05, 'epoch': 0.12} {'loss': 0.5836, 'learning_rate': 1.9962104617139414e-05, 'epoch': 0.12} {'loss': 0.3769, 'learning_rate': 1.996207538973407e-05, 'epoch': 0.12} {'loss': 0.5854, 'learning_rate': 1.9962046151083436e-05, 'epoch': 0.12} {'loss': 0.5068, 'learning_rate': 1.9962016901187545e-05, 'epoch': 0.12} {'loss': 0.6072, 'learning_rate': 1.996198764004643e-05, 'epoch': 0.12} {'loss': 0.6261, 'learning_rate': 1.9961958367660127e-05, 'epoch': 0.12} {'loss': 0.6297, 'learning_rate': 1.996192908402867e-05, 'epoch': 0.12} {'loss': 0.6525, 'learning_rate': 1.996189978915209e-05, 'epoch': 0.12} {'loss': 0.5585, 'learning_rate': 1.9961870483030412e-05, 'epoch': 0.12} {'loss': 0.4607, 'learning_rate': 1.996184116566368e-05, 'epoch': 0.12} {'loss': 0.5286, 'learning_rate': 1.9961811837051927e-05, 'epoch': 0.12} {'loss': 0.689, 'learning_rate': 1.996178249719518e-05, 'epoch': 0.12} {'loss': 0.5551, 'learning_rate': 1.9961753146093475e-05, 'epoch': 0.12} {'loss': 0.5368, 'learning_rate': 1.9961723783746845e-05, 'epoch': 0.12} {'loss': 0.5932, 'learning_rate': 1.9961694410155324e-05, 'epoch': 0.12} {'loss': 0.5484, 'learning_rate': 1.9961665025318946e-05, 'epoch': 0.12} {'loss': 0.699, 'learning_rate': 1.9961635629237742e-05, 'epoch': 0.12} {'loss': 0.5446, 'learning_rate': 1.996160622191174e-05, 'epoch': 0.12} {'loss': 0.3322, 'learning_rate': 1.9961576803340982e-05, 'epoch': 0.12} {'loss': 0.6622, 'learning_rate': 1.99615473735255e-05, 'epoch': 0.12} {'loss': 0.6763, 'learning_rate': 1.9961517932465326e-05, 'epoch': 0.12} {'loss': 0.6969, 'learning_rate': 1.996148848016049e-05, 'epoch': 0.12} {'loss': 0.6982, 'learning_rate': 1.9961459016611027e-05, 'epoch': 0.12} {'loss': 0.4666, 'learning_rate': 1.9961429541816975e-05, 'epoch': 0.12} {'loss': 0.4808, 'learning_rate': 1.996140005577836e-05, 'epoch': 0.12} {'loss': 0.6226, 'learning_rate': 1.9961370558495222e-05, 'epoch': 0.12} {'loss': 0.5779, 'learning_rate': 1.9961341049967585e-05, 'epoch': 0.12} {'loss': 0.3439, 'learning_rate': 1.9961311530195494e-05, 'epoch': 0.12} {'loss': 0.4714, 'learning_rate': 1.9961281999178973e-05, 'epoch': 0.12} {'loss': 0.3626, 'learning_rate': 1.996125245691806e-05, 'epoch': 0.12} {'loss': 0.4985, 'learning_rate': 1.9961222903412786e-05, 'epoch': 0.12} {'loss': 0.5528, 'learning_rate': 1.996119333866319e-05, 'epoch': 0.12} {'loss': 0.5792, 'learning_rate': 1.9961163762669296e-05, 'epoch': 0.12} {'loss': 0.3963, 'learning_rate': 1.9961134175431142e-05, 'epoch': 0.12} {'loss': 0.6301, 'learning_rate': 1.9961104576948766e-05, 'epoch': 0.12} {'loss': 0.5091, 'learning_rate': 1.9961074967222193e-05, 'epoch': 0.12} {'loss': 0.5077, 'learning_rate': 1.996104534625146e-05, 'epoch': 0.12} {'loss': 0.5116, 'learning_rate': 1.9961015714036603e-05, 'epoch': 0.12} {'loss': 0.47, 'learning_rate': 1.9960986070577654e-05, 'epoch': 0.12} {'loss': 0.5356, 'learning_rate': 1.9960956415874644e-05, 'epoch': 0.12} {'loss': 0.5532, 'learning_rate': 1.9960926749927615e-05, 'epoch': 0.12} {'loss': 0.4621, 'learning_rate': 1.996089707273659e-05, 'epoch': 0.12} {'loss': 0.6691, 'learning_rate': 1.9960867384301603e-05, 'epoch': 0.12} {'loss': 0.4891, 'learning_rate': 1.9960837684622692e-05, 'epoch': 0.12} {'loss': 0.5149, 'learning_rate': 1.996080797369989e-05, 'epoch': 0.12} {'loss': 0.5252, 'learning_rate': 1.9960778251533234e-05, 'epoch': 0.12} {'loss': 0.711, 'learning_rate': 1.9960748518122747e-05, 'epoch': 0.12} {'loss': 0.5135, 'learning_rate': 1.996071877346847e-05, 'epoch': 0.12} {'loss': 0.6867, 'learning_rate': 1.996068901757044e-05, 'epoch': 0.12} {'loss': 0.6056, 'learning_rate': 1.9960659250428684e-05, 'epoch': 0.12} {'loss': 0.5922, 'learning_rate': 1.9960629472043238e-05, 'epoch': 0.12} {'loss': 0.6482, 'learning_rate': 1.996059968241413e-05, 'epoch': 0.12} {'loss': 0.4456, 'learning_rate': 1.9960569881541407e-05, 'epoch': 0.12} {'loss': 0.4781, 'learning_rate': 1.9960540069425093e-05, 'epoch': 0.12} {'loss': 0.3647, 'learning_rate': 1.996051024606522e-05, 'epoch': 0.12} {'loss': 0.485, 'learning_rate': 1.9960480411461828e-05, 'epoch': 0.12} {'loss': 0.4611, 'learning_rate': 1.9960450565614947e-05, 'epoch': 0.12} {'loss': 0.5666, 'learning_rate': 1.996042070852461e-05, 'epoch': 0.12} {'loss': 0.5309, 'learning_rate': 1.9960390840190854e-05, 'epoch': 0.12} {'loss': 0.472, 'learning_rate': 1.9960360960613713e-05, 'epoch': 0.12} {'loss': 0.438, 'learning_rate': 1.9960331069793212e-05, 'epoch': 0.12} {'loss': 0.4499, 'learning_rate': 1.9960301167729395e-05, 'epoch': 0.12} {'loss': 0.6564, 'learning_rate': 1.9960271254422294e-05, 'epoch': 0.12} {'loss': 0.5947, 'learning_rate': 1.9960241329871938e-05, 'epoch': 0.12} {'loss': 0.5125, 'learning_rate': 1.9960211394078364e-05, 'epoch': 0.12} {'loss': 0.5091, 'learning_rate': 1.9960181447041605e-05, 'epoch': 0.12} {'loss': 0.4516, 'learning_rate': 1.9960151488761695e-05, 'epoch': 0.12} {'loss': 0.4795, 'learning_rate': 1.9960121519238667e-05, 'epoch': 0.12} {'loss': 0.4659, 'learning_rate': 1.996009153847256e-05, 'epoch': 0.12} {'loss': 0.6234, 'learning_rate': 1.99600615464634e-05, 'epoch': 0.12} {'loss': 0.6032, 'learning_rate': 1.9960031543211228e-05, 'epoch': 0.12} {'loss': 0.4456, 'learning_rate': 1.996000152871607e-05, 'epoch': 0.12} {'loss': 0.5325, 'learning_rate': 1.9959971502977965e-05, 'epoch': 0.12} {'loss': 0.474, 'learning_rate': 1.995994146599695e-05, 'epoch': 0.12} {'loss': 0.5255, 'learning_rate': 1.9959911417773053e-05, 'epoch': 0.12} {'loss': 0.7715, 'learning_rate': 1.9959881358306307e-05, 'epoch': 0.12} {'loss': 0.589, 'learning_rate': 1.9959851287596753e-05, 'epoch': 0.12} {'loss': 0.6356, 'learning_rate': 1.995982120564442e-05, 'epoch': 0.12} {'loss': 0.6711, 'learning_rate': 1.995979111244934e-05, 'epoch': 0.12} {'loss': 0.6611, 'learning_rate': 1.995976100801155e-05, 'epoch': 0.12} {'loss': 0.7101, 'learning_rate': 1.9959730892331087e-05, 'epoch': 0.12} {'loss': 0.4704, 'learning_rate': 1.995970076540798e-05, 'epoch': 0.12} {'loss': 0.5995, 'learning_rate': 1.9959670627242266e-05, 'epoch': 0.12} {'loss': 0.4536, 'learning_rate': 1.9959640477833976e-05, 'epoch': 0.12} {'loss': 0.5901, 'learning_rate': 1.9959610317183148e-05, 'epoch': 0.12} {'loss': 0.5834, 'learning_rate': 1.9959580145289813e-05, 'epoch': 0.12} {'loss': 0.5523, 'learning_rate': 1.9959549962154003e-05, 'epoch': 0.12} {'loss': 0.5687, 'learning_rate': 1.9959519767775755e-05, 'epoch': 0.12} {'loss': 0.696, 'learning_rate': 1.9959489562155107e-05, 'epoch': 0.12} {'loss': 0.4799, 'learning_rate': 1.995945934529209e-05, 'epoch': 0.12} {'loss': 0.4793, 'learning_rate': 1.9959429117186734e-05, 'epoch': 0.12} {'loss': 0.5815, 'learning_rate': 1.9959398877839077e-05, 'epoch': 0.12} {'loss': 0.4212, 'learning_rate': 1.995936862724915e-05, 'epoch': 0.12} {'loss': 0.4533, 'learning_rate': 1.9959338365416997e-05, 'epoch': 0.12} {'loss': 0.4862, 'learning_rate': 1.9959308092342636e-05, 'epoch': 0.12} {'loss': 0.5134, 'learning_rate': 1.9959277808026115e-05, 'epoch': 0.12} {'loss': 0.5661, 'learning_rate': 1.9959247512467465e-05, 'epoch': 0.12} {'loss': 0.4984, 'learning_rate': 1.9959217205666715e-05, 'epoch': 0.12} {'loss': 0.5382, 'learning_rate': 1.9959186887623903e-05, 'epoch': 0.12} {'loss': 0.5953, 'learning_rate': 1.9959156558339067e-05, 'epoch': 0.12} {'loss': 0.5024, 'learning_rate': 1.9959126217812233e-05, 'epoch': 0.12} {'loss': 0.4458, 'learning_rate': 1.995909586604344e-05, 'epoch': 0.12} {'loss': 0.4625, 'learning_rate': 1.995906550303272e-05, 'epoch': 0.12} {'loss': 0.5987, 'learning_rate': 1.995903512878011e-05, 'epoch': 0.12} {'loss': 0.4704, 'learning_rate': 1.9959004743285642e-05, 'epoch': 0.12} {'loss': 0.4451, 'learning_rate': 1.9958974346549353e-05, 'epoch': 0.12} {'loss': 0.4164, 'learning_rate': 1.9958943938571277e-05, 'epoch': 0.12} {'loss': 0.5619, 'learning_rate': 1.9958913519351447e-05, 'epoch': 0.12} {'loss': 0.5873, 'learning_rate': 1.9958883088889897e-05, 'epoch': 0.12} {'loss': 0.4898, 'learning_rate': 1.995885264718666e-05, 'epoch': 0.12} {'loss': 0.5421, 'learning_rate': 1.995882219424177e-05, 'epoch': 0.12} {'loss': 0.5642, 'learning_rate': 1.9958791730055266e-05, 'epoch': 0.12} {'loss': 0.5704, 'learning_rate': 1.995876125462718e-05, 'epoch': 0.12} {'loss': 0.4258, 'learning_rate': 1.9958730767957547e-05, 'epoch': 0.12} {'loss': 0.5491, 'learning_rate': 1.99587002700464e-05, 'epoch': 0.12} {'loss': 0.5275, 'learning_rate': 1.9958669760893774e-05, 'epoch': 0.12} {'loss': 0.5127, 'learning_rate': 1.9958639240499704e-05, 'epoch': 0.12} {'loss': 0.5553, 'learning_rate': 1.9958608708864226e-05, 'epoch': 0.12} {'loss': 0.612, 'learning_rate': 1.995857816598737e-05, 'epoch': 0.12} {'loss': 0.7403, 'learning_rate': 1.995854761186917e-05, 'epoch': 0.12} {'loss': 0.413, 'learning_rate': 1.995851704650967e-05, 'epoch': 0.12} {'loss': 0.4304, 'learning_rate': 1.9958486469908896e-05, 'epoch': 0.12} {'loss': 0.5645, 'learning_rate': 1.9958455882066883e-05, 'epoch': 0.12} {'loss': 0.4812, 'learning_rate': 1.9958425282983666e-05, 'epoch': 0.12} {'loss': 0.534, 'learning_rate': 1.9958394672659284e-05, 'epoch': 0.12} {'loss': 0.3987, 'learning_rate': 1.9958364051093766e-05, 'epoch': 0.12} {'loss': 0.6585, 'learning_rate': 1.9958333418287145e-05, 'epoch': 0.12} {'loss': 0.5525, 'learning_rate': 1.9958302774239465e-05, 'epoch': 0.12} {'loss': 0.4434, 'learning_rate': 1.9958272118950753e-05, 'epoch': 0.12} {'loss': 0.4646, 'learning_rate': 1.9958241452421046e-05, 'epoch': 0.12} {'loss': 0.466, 'learning_rate': 1.9958210774650376e-05, 'epoch': 0.12} {'loss': 0.525, 'learning_rate': 1.995818008563878e-05, 'epoch': 0.12} {'loss': 0.627, 'learning_rate': 1.9958149385386295e-05, 'epoch': 0.12} {'loss': 0.458, 'learning_rate': 1.995811867389295e-05, 'epoch': 0.12} {'loss': 0.5211, 'learning_rate': 1.9958087951158784e-05, 'epoch': 0.12} {'loss': 0.6737, 'learning_rate': 1.995805721718383e-05, 'epoch': 0.12} {'loss': 0.5038, 'learning_rate': 1.9958026471968122e-05, 'epoch': 0.12} {'loss': 0.4114, 'learning_rate': 1.99579957155117e-05, 'epoch': 0.12} {'loss': 0.562, 'learning_rate': 1.995796494781459e-05, 'epoch': 0.12} {'loss': 0.5831, 'learning_rate': 1.9957934168876832e-05, 'epoch': 0.12} {'loss': 0.6661, 'learning_rate': 1.995790337869846e-05, 'epoch': 0.12} {'loss': 0.5902, 'learning_rate': 1.9957872577279507e-05, 'epoch': 0.12} {'loss': 0.6102, 'learning_rate': 1.9957841764620012e-05, 'epoch': 0.12} {'loss': 0.5531, 'learning_rate': 1.9957810940720007e-05, 'epoch': 0.12} {'loss': 0.5233, 'learning_rate': 1.995778010557953e-05, 'epoch': 0.12} {'loss': 0.4857, 'learning_rate': 1.9957749259198605e-05, 'epoch': 0.12} {'loss': 0.6989, 'learning_rate': 1.995771840157728e-05, 'epoch': 0.12} {'loss': 0.5382, 'learning_rate': 1.9957687532715583e-05, 'epoch': 0.12} {'loss': 0.574, 'learning_rate': 1.995765665261355e-05, 'epoch': 0.12} {'loss': 0.5939, 'learning_rate': 1.995762576127122e-05, 'epoch': 0.12} {'loss': 0.63, 'learning_rate': 1.995759485868862e-05, 'epoch': 0.12} {'loss': 0.3983, 'learning_rate': 1.995756394486579e-05, 'epoch': 0.12} {'loss': 0.5013, 'learning_rate': 1.9957533019802763e-05, 'epoch': 0.12} {'loss': 0.5634, 'learning_rate': 1.9957502083499575e-05, 'epoch': 0.12} {'loss': 0.5395, 'learning_rate': 1.9957471135956263e-05, 'epoch': 0.12} {'loss': 0.4907, 'learning_rate': 1.9957440177172857e-05, 'epoch': 0.12} {'loss': 0.4992, 'learning_rate': 1.9957409207149396e-05, 'epoch': 0.12} {'loss': 0.4007, 'learning_rate': 1.9957378225885912e-05, 'epoch': 0.12} {'loss': 0.6562, 'learning_rate': 1.9957347233382444e-05, 'epoch': 0.12} {'loss': 0.5319, 'learning_rate': 1.995731622963902e-05, 'epoch': 0.12} {'loss': 0.4741, 'learning_rate': 1.9957285214655684e-05, 'epoch': 0.12} {'loss': 0.7243, 'learning_rate': 1.9957254188432464e-05, 'epoch': 0.12} {'loss': 0.4245, 'learning_rate': 1.9957223150969402e-05, 'epoch': 0.12} {'loss': 0.6315, 'learning_rate': 1.995719210226652e-05, 'epoch': 0.12} {'loss': 0.5604, 'learning_rate': 1.9957161042323867e-05, 'epoch': 0.12} {'loss': 0.5776, 'learning_rate': 1.995712997114147e-05, 'epoch': 0.12} {'loss': 0.4442, 'learning_rate': 1.995709888871937e-05, 'epoch': 0.12} {'loss': 0.5357, 'learning_rate': 1.99570677950576e-05, 'epoch': 0.12} {'loss': 0.584, 'learning_rate': 1.9957036690156188e-05, 'epoch': 0.12} {'loss': 0.6755, 'learning_rate': 1.995700557401518e-05, 'epoch': 0.12} {'loss': 0.3891, 'learning_rate': 1.9956974446634603e-05, 'epoch': 0.12} {'loss': 0.5871, 'learning_rate': 1.9956943308014498e-05, 'epoch': 0.12} {'loss': 0.4543, 'learning_rate': 1.9956912158154897e-05, 'epoch': 0.12} {'loss': 0.5202, 'learning_rate': 1.9956880997055835e-05, 'epoch': 0.12} {'loss': 0.5484, 'learning_rate': 1.9956849824717345e-05, 'epoch': 0.12} {'loss': 0.6792, 'learning_rate': 1.995681864113947e-05, 'epoch': 0.12} {'loss': 0.6262, 'learning_rate': 1.9956787446322236e-05, 'epoch': 0.12} {'loss': 0.5563, 'learning_rate': 1.995675624026568e-05, 'epoch': 0.12} {'loss': 0.4777, 'learning_rate': 1.9956725022969846e-05, 'epoch': 0.12} {'loss': 0.5399, 'learning_rate': 1.9956693794434762e-05, 'epoch': 0.12} {'loss': 0.4373, 'learning_rate': 1.995666255466046e-05, 'epoch': 0.12} {'loss': 0.4291, 'learning_rate': 1.9956631303646983e-05, 'epoch': 0.12} {'loss': 0.5651, 'learning_rate': 1.995660004139436e-05, 'epoch': 0.12} {'loss': 0.5689, 'learning_rate': 1.9956568767902632e-05, 'epoch': 0.12} {'loss': 0.5705, 'learning_rate': 1.9956537483171827e-05, 'epoch': 0.12} {'loss': 0.4274, 'learning_rate': 1.9956506187201987e-05, 'epoch': 0.12} {'loss': 0.5851, 'learning_rate': 1.9956474879993144e-05, 'epoch': 0.12} {'loss': 0.5615, 'learning_rate': 1.9956443561545336e-05, 'epoch': 0.12} {'loss': 0.5762, 'learning_rate': 1.9956412231858593e-05, 'epoch': 0.12} {'loss': 0.5315, 'learning_rate': 1.9956380890932957e-05, 'epoch': 0.12} {'loss': 0.5521, 'learning_rate': 1.995634953876846e-05, 'epoch': 0.12} {'loss': 0.5215, 'learning_rate': 1.9956318175365137e-05, 'epoch': 0.12} {'loss': 0.7351, 'learning_rate': 1.9956286800723022e-05, 'epoch': 0.12} {'loss': 0.4642, 'learning_rate': 1.9956255414842156e-05, 'epoch': 0.12} {'loss': 0.5627, 'learning_rate': 1.9956224017722568e-05, 'epoch': 0.12} {'loss': 0.4859, 'learning_rate': 1.99561926093643e-05, 'epoch': 0.12} {'loss': 0.5797, 'learning_rate': 1.995616118976738e-05, 'epoch': 0.12} {'loss': 0.4272, 'learning_rate': 1.995612975893185e-05, 'epoch': 0.12} {'loss': 0.4577, 'learning_rate': 1.995609831685774e-05, 'epoch': 0.12} {'loss': 0.5384, 'learning_rate': 1.995606686354509e-05, 'epoch': 0.12} {'loss': 0.5575, 'learning_rate': 1.9956035398993934e-05, 'epoch': 0.12} {'loss': 0.5591, 'learning_rate': 1.9956003923204308e-05, 'epoch': 0.12} {'loss': 0.7684, 'learning_rate': 1.9955972436176245e-05, 'epoch': 0.12} {'loss': 0.4507, 'learning_rate': 1.9955940937909783e-05, 'epoch': 0.12} {'loss': 0.4879, 'learning_rate': 1.9955909428404956e-05, 'epoch': 0.12} {'loss': 0.4799, 'learning_rate': 1.9955877907661804e-05, 'epoch': 0.12} {'loss': 0.5448, 'learning_rate': 1.9955846375680354e-05, 'epoch': 0.12} {'loss': 0.508, 'learning_rate': 1.9955814832460648e-05, 'epoch': 0.12} {'loss': 0.5609, 'learning_rate': 1.995578327800272e-05, 'epoch': 0.12} {'loss': 0.5375, 'learning_rate': 1.995575171230661e-05, 'epoch': 0.12} {'loss': 0.5252, 'learning_rate': 1.995572013537235e-05, 'epoch': 0.12} {'loss': 0.4704, 'learning_rate': 1.9955688547199967e-05, 'epoch': 0.12} {'loss': 0.56, 'learning_rate': 1.995565694778951e-05, 'epoch': 0.12} {'loss': 0.5688, 'learning_rate': 1.9955625337141008e-05, 'epoch': 0.12} {'loss': 0.4251, 'learning_rate': 1.9955593715254502e-05, 'epoch': 0.12} {'loss': 0.4922, 'learning_rate': 1.995556208213002e-05, 'epoch': 0.12} {'loss': 0.523, 'learning_rate': 1.9955530437767604e-05, 'epoch': 0.12} {'loss': 0.3911, 'learning_rate': 1.9955498782167283e-05, 'epoch': 0.12} {'loss': 0.5586, 'learning_rate': 1.99554671153291e-05, 'epoch': 0.12} {'loss': 0.5096, 'learning_rate': 1.995543543725309e-05, 'epoch': 0.12} {'loss': 0.565, 'learning_rate': 1.995540374793928e-05, 'epoch': 0.12} {'loss': 0.574, 'learning_rate': 1.9955372047387718e-05, 'epoch': 0.12} {'loss': 0.5081, 'learning_rate': 1.9955340335598433e-05, 'epoch': 0.12} {'loss': 0.5662, 'learning_rate': 1.9955308612571463e-05, 'epoch': 0.12} {'loss': 0.5669, 'learning_rate': 1.9955276878306836e-05, 'epoch': 0.12} {'loss': 0.6523, 'learning_rate': 1.9955245132804603e-05, 'epoch': 0.12} {'loss': 0.3687, 'learning_rate': 1.9955213376064787e-05, 'epoch': 0.12} {'loss': 0.4295, 'learning_rate': 1.995518160808743e-05, 'epoch': 0.12} {'loss': 0.5121, 'learning_rate': 1.9955149828872563e-05, 'epoch': 0.12} {'loss': 0.6206, 'learning_rate': 1.9955118038420226e-05, 'epoch': 0.12} {'loss': 0.5669, 'learning_rate': 1.9955086236730455e-05, 'epoch': 0.12} {'loss': 0.6466, 'learning_rate': 1.9955054423803285e-05, 'epoch': 0.12} {'loss': 0.5215, 'learning_rate': 1.995502259963875e-05, 'epoch': 0.12} {'loss': 0.5198, 'learning_rate': 1.995499076423689e-05, 'epoch': 0.12} {'loss': 0.5521, 'learning_rate': 1.9954958917597737e-05, 'epoch': 0.12} {'loss': 0.5723, 'learning_rate': 1.9954927059721327e-05, 'epoch': 0.12} {'loss': 0.5864, 'learning_rate': 1.9954895190607696e-05, 'epoch': 0.12} {'loss': 0.5088, 'learning_rate': 1.9954863310256886e-05, 'epoch': 0.12} {'loss': 0.4872, 'learning_rate': 1.9954831418668927e-05, 'epoch': 0.12} {'loss': 0.5425, 'learning_rate': 1.9954799515843856e-05, 'epoch': 0.12} {'loss': 0.4243, 'learning_rate': 1.9954767601781707e-05, 'epoch': 0.12} {'loss': 0.6286, 'learning_rate': 1.995473567648252e-05, 'epoch': 0.12} {'loss': 0.5599, 'learning_rate': 1.995470373994633e-05, 'epoch': 0.12} {'loss': 0.689, 'learning_rate': 1.9954671792173172e-05, 'epoch': 0.12} {'loss': 0.5197, 'learning_rate': 1.9954639833163085e-05, 'epoch': 0.12} {'loss': 0.3341, 'learning_rate': 1.99546078629161e-05, 'epoch': 0.12} {'loss': 0.5137, 'learning_rate': 1.9954575881432255e-05, 'epoch': 0.12} {'loss': 0.4282, 'learning_rate': 1.9954543888711587e-05, 'epoch': 0.12} {'loss': 0.5099, 'learning_rate': 1.9954511884754133e-05, 'epoch': 0.12} {'loss': 0.5061, 'learning_rate': 1.995447986955993e-05, 'epoch': 0.12} {'loss': 0.6436, 'learning_rate': 1.9954447843129008e-05, 'epoch': 0.12} {'loss': 0.5527, 'learning_rate': 1.9954415805461408e-05, 'epoch': 0.12} {'loss': 0.6072, 'learning_rate': 1.9954383756557167e-05, 'epoch': 0.12} {'loss': 0.5039, 'learning_rate': 1.995435169641632e-05, 'epoch': 0.12} {'loss': 0.5199, 'learning_rate': 1.9954319625038902e-05, 'epoch': 0.12} {'loss': 0.5961, 'learning_rate': 1.995428754242495e-05, 'epoch': 0.12} {'loss': 0.6052, 'learning_rate': 1.99542554485745e-05, 'epoch': 0.12} {'loss': 0.4109, 'learning_rate': 1.995422334348759e-05, 'epoch': 0.12} {'loss': 0.6205, 'learning_rate': 1.9954191227164253e-05, 'epoch': 0.12} {'loss': 0.4673, 'learning_rate': 1.9954159099604526e-05, 'epoch': 0.12} {'loss': 0.6154, 'learning_rate': 1.995412696080845e-05, 'epoch': 0.12} {'loss': 0.6291, 'learning_rate': 1.9954094810776054e-05, 'epoch': 0.12} {'loss': 0.5287, 'learning_rate': 1.995406264950738e-05, 'epoch': 0.12} {'loss': 0.4171, 'learning_rate': 1.995403047700246e-05, 'epoch': 0.12} {'loss': 0.6276, 'learning_rate': 1.9953998293261333e-05, 'epoch': 0.12} {'loss': 0.3913, 'learning_rate': 1.9953966098284038e-05, 'epoch': 0.12} {'loss': 0.4511, 'learning_rate': 1.9953933892070606e-05, 'epoch': 0.12} {'loss': 0.4359, 'learning_rate': 1.9953901674621073e-05, 'epoch': 0.12} {'loss': 0.5205, 'learning_rate': 1.9953869445935478e-05, 'epoch': 0.12} {'loss': 0.5594, 'learning_rate': 1.9953837206013862e-05, 'epoch': 0.12} {'loss': 0.7073, 'learning_rate': 1.9953804954856253e-05, 'epoch': 0.12} {'loss': 0.4796, 'learning_rate': 1.995377269246269e-05, 'epoch': 0.12} {'loss': 0.2968, 'learning_rate': 1.9953740418833213e-05, 'epoch': 0.12} {'loss': 0.5539, 'learning_rate': 1.9953708133967856e-05, 'epoch': 0.12} {'loss': 0.6551, 'learning_rate': 1.995367583786665e-05, 'epoch': 0.12} {'loss': 0.6423, 'learning_rate': 1.9953643530529646e-05, 'epoch': 0.12} {'loss': 0.5851, 'learning_rate': 1.9953611211956864e-05, 'epoch': 0.12} {'loss': 0.4462, 'learning_rate': 1.995357888214835e-05, 'epoch': 0.12} {'loss': 0.5691, 'learning_rate': 1.995354654110414e-05, 'epoch': 0.12} {'loss': 0.564, 'learning_rate': 1.9953514188824267e-05, 'epoch': 0.12} {'loss': 0.6391, 'learning_rate': 1.9953481825308767e-05, 'epoch': 0.12} {'loss': 0.4536, 'learning_rate': 1.9953449450557684e-05, 'epoch': 0.12} {'loss': 0.5323, 'learning_rate': 1.9953417064571044e-05, 'epoch': 0.12} {'loss': 0.4281, 'learning_rate': 1.995338466734889e-05, 'epoch': 0.12} {'loss': 0.4929, 'learning_rate': 1.995335225889126e-05, 'epoch': 0.12} {'loss': 0.5398, 'learning_rate': 1.9953319839198183e-05, 'epoch': 0.12} {'loss': 0.5681, 'learning_rate': 1.995328740826971e-05, 'epoch': 0.12} {'loss': 0.4055, 'learning_rate': 1.995325496610586e-05, 'epoch': 0.12} {'loss': 0.5819, 'learning_rate': 1.995322251270668e-05, 'epoch': 0.12} {'loss': 0.4271, 'learning_rate': 1.9953190048072203e-05, 'epoch': 0.12} {'loss': 0.5865, 'learning_rate': 1.995315757220247e-05, 'epoch': 0.12} {'loss': 0.6929, 'learning_rate': 1.9953125085097513e-05, 'epoch': 0.12} {'loss': 0.5472, 'learning_rate': 1.9953092586757373e-05, 'epoch': 0.12} {'loss': 0.6452, 'learning_rate': 1.995306007718208e-05, 'epoch': 0.12} {'loss': 0.5911, 'learning_rate': 1.9953027556371678e-05, 'epoch': 0.12} {'loss': 0.6772, 'learning_rate': 1.99529950243262e-05, 'epoch': 0.12} {'loss': 0.4248, 'learning_rate': 1.995296248104568e-05, 'epoch': 0.12} {'loss': 0.6805, 'learning_rate': 1.9952929926530163e-05, 'epoch': 0.12} {'loss': 0.4998, 'learning_rate': 1.9952897360779676e-05, 'epoch': 0.12} {'loss': 0.6503, 'learning_rate': 1.9952864783794265e-05, 'epoch': 0.12} {'loss': 0.6623, 'learning_rate': 1.9952832195573962e-05, 'epoch': 0.12} {'loss': 0.6738, 'learning_rate': 1.99527995961188e-05, 'epoch': 0.12} {'loss': 0.5054, 'learning_rate': 1.9952766985428824e-05, 'epoch': 0.12} {'loss': 0.6057, 'learning_rate': 1.9952734363504063e-05, 'epoch': 0.12} {'loss': 0.4291, 'learning_rate': 1.995270173034456e-05, 'epoch': 0.12} {'loss': 0.5849, 'learning_rate': 1.995266908595035e-05, 'epoch': 0.12} {'loss': 0.5099, 'learning_rate': 1.995263643032147e-05, 'epoch': 0.12} {'loss': 0.5697, 'learning_rate': 1.9952603763457952e-05, 'epoch': 0.12} {'loss': 0.5726, 'learning_rate': 1.9952571085359837e-05, 'epoch': 0.12} {'loss': 0.4788, 'learning_rate': 1.9952538396027164e-05, 'epoch': 0.12} {'loss': 0.4911, 'learning_rate': 1.995250569545997e-05, 'epoch': 0.12} {'loss': 0.4428, 'learning_rate': 1.9952472983658283e-05, 'epoch': 0.12} {'loss': 0.6911, 'learning_rate': 1.9952440260622153e-05, 'epoch': 0.12} {'loss': 0.5217, 'learning_rate': 1.9952407526351608e-05, 'epoch': 0.12} {'loss': 0.4579, 'learning_rate': 1.995237478084669e-05, 'epoch': 0.12} {'loss': 0.5743, 'learning_rate': 1.995234202410743e-05, 'epoch': 0.12} {'loss': 0.5751, 'learning_rate': 1.995230925613387e-05, 'epoch': 0.12} {'loss': 0.4306, 'learning_rate': 1.995227647692604e-05, 'epoch': 0.12} {'loss': 0.6727, 'learning_rate': 1.995224368648399e-05, 'epoch': 0.12} {'loss': 0.579, 'learning_rate': 1.9952210884807746e-05, 'epoch': 0.12} {'loss': 0.4296, 'learning_rate': 1.9952178071897347e-05, 'epoch': 0.12} {'loss': 0.6023, 'learning_rate': 1.9952145247752836e-05, 'epoch': 0.12} {'loss': 0.5764, 'learning_rate': 1.9952112412374244e-05, 'epoch': 0.12} {'loss': 0.4455, 'learning_rate': 1.9952079565761607e-05, 'epoch': 0.12} {'loss': 0.5413, 'learning_rate': 1.9952046707914966e-05, 'epoch': 0.12} {'loss': 0.4732, 'learning_rate': 1.9952013838834356e-05, 'epoch': 0.12} {'loss': 0.5765, 'learning_rate': 1.9951980958519813e-05, 'epoch': 0.12} {'loss': 0.5222, 'learning_rate': 1.995194806697138e-05, 'epoch': 0.12} {'loss': 0.5624, 'learning_rate': 1.995191516418909e-05, 'epoch': 0.12} {'loss': 0.5596, 'learning_rate': 1.995188225017298e-05, 'epoch': 0.12} {'loss': 0.4801, 'learning_rate': 1.9951849324923084e-05, 'epoch': 0.12} {'loss': 0.5787, 'learning_rate': 1.9951816388439448e-05, 'epoch': 0.12} {'loss': 0.4272, 'learning_rate': 1.9951783440722096e-05, 'epoch': 0.12} {'loss': 0.5752, 'learning_rate': 1.995175048177108e-05, 'epoch': 0.12} {'loss': 0.4995, 'learning_rate': 1.9951717511586427e-05, 'epoch': 0.12} {'loss': 0.5811, 'learning_rate': 1.9951684530168178e-05, 'epoch': 0.12} {'loss': 0.6976, 'learning_rate': 1.995165153751637e-05, 'epoch': 0.12} {'loss': 0.616, 'learning_rate': 1.9951618533631038e-05, 'epoch': 0.12} {'loss': 0.4666, 'learning_rate': 1.995158551851222e-05, 'epoch': 0.12} {'loss': 0.4183, 'learning_rate': 1.995155249215996e-05, 'epoch': 0.12} {'loss': 0.5955, 'learning_rate': 1.9951519454574284e-05, 'epoch': 0.12} {'loss': 0.5234, 'learning_rate': 1.995148640575524e-05, 'epoch': 0.12} {'loss': 0.6554, 'learning_rate': 1.9951453345702855e-05, 'epoch': 0.12} {'loss': 0.7338, 'learning_rate': 1.9951420274417175e-05, 'epoch': 0.12} {'loss': 0.6076, 'learning_rate': 1.9951387191898233e-05, 'epoch': 0.12} {'loss': 0.5096, 'learning_rate': 1.9951354098146068e-05, 'epoch': 0.12} {'loss': 0.6284, 'learning_rate': 1.9951320993160714e-05, 'epoch': 0.12} {'loss': 0.5593, 'learning_rate': 1.9951287876942214e-05, 'epoch': 0.12} {'loss': 0.6715, 'learning_rate': 1.9951254749490602e-05, 'epoch': 0.12} {'loss': 0.5312, 'learning_rate': 1.995122161080591e-05, 'epoch': 0.12} {'loss': 0.3899, 'learning_rate': 1.9951188460888187e-05, 'epoch': 0.12} {'loss': 0.6401, 'learning_rate': 1.9951155299737465e-05, 'epoch': 0.12} {'loss': 0.4437, 'learning_rate': 1.995112212735378e-05, 'epoch': 0.12} {'loss': 0.4081, 'learning_rate': 1.9951088943737167e-05, 'epoch': 0.12} {'loss': 0.4994, 'learning_rate': 1.995105574888767e-05, 'epoch': 0.12} {'loss': 0.6734, 'learning_rate': 1.9951022542805322e-05, 'epoch': 0.12} {'loss': 0.5762, 'learning_rate': 1.9950989325490163e-05, 'epoch': 0.12} {'loss': 0.4023, 'learning_rate': 1.995095609694223e-05, 'epoch': 0.12} {'loss': 0.7025, 'learning_rate': 1.995092285716156e-05, 'epoch': 0.12} {'loss': 0.5175, 'learning_rate': 1.9950889606148184e-05, 'epoch': 0.12} {'loss': 0.3856, 'learning_rate': 1.995085634390215e-05, 'epoch': 0.12} {'loss': 0.417, 'learning_rate': 1.9950823070423497e-05, 'epoch': 0.12} {'loss': 0.514, 'learning_rate': 1.995078978571225e-05, 'epoch': 0.12} {'loss': 0.48, 'learning_rate': 1.995075648976846e-05, 'epoch': 0.12} {'loss': 0.4389, 'learning_rate': 1.995072318259215e-05, 'epoch': 0.12} {'loss': 0.6126, 'learning_rate': 1.995068986418337e-05, 'epoch': 0.12} {'loss': 0.5802, 'learning_rate': 1.9950656534542152e-05, 'epoch': 0.12} {'loss': 0.5125, 'learning_rate': 1.995062319366854e-05, 'epoch': 0.12} {'loss': 0.3861, 'learning_rate': 1.995058984156256e-05, 'epoch': 0.12} {'loss': 0.5594, 'learning_rate': 1.995055647822426e-05, 'epoch': 0.12} {'loss': 0.4519, 'learning_rate': 1.9950523103653673e-05, 'epoch': 0.12} {'loss': 0.5769, 'learning_rate': 1.995048971785084e-05, 'epoch': 0.12} {'loss': 0.5419, 'learning_rate': 1.995045632081579e-05, 'epoch': 0.12} {'loss': 0.5211, 'learning_rate': 1.9950422912548572e-05, 'epoch': 0.12} {'loss': 0.5262, 'learning_rate': 1.9950389493049216e-05, 'epoch': 0.12} {'loss': 0.3633, 'learning_rate': 1.9950356062317767e-05, 'epoch': 0.12} {'loss': 0.5973, 'learning_rate': 1.9950322620354253e-05, 'epoch': 0.12} {'loss': 0.6994, 'learning_rate': 1.9950289167158717e-05, 'epoch': 0.12} {'loss': 0.4548, 'learning_rate': 1.99502557027312e-05, 'epoch': 0.12} {'loss': 0.622, 'learning_rate': 1.9950222227071733e-05, 'epoch': 0.12} {'loss': 0.5153, 'learning_rate': 1.9950188740180362e-05, 'epoch': 0.12} {'loss': 0.5549, 'learning_rate': 1.9950155242057118e-05, 'epoch': 0.12} {'loss': 0.5671, 'learning_rate': 1.995012173270204e-05, 'epoch': 0.12} {'loss': 0.711, 'learning_rate': 1.9950088212115167e-05, 'epoch': 0.12} {'loss': 0.547, 'learning_rate': 1.9950054680296532e-05, 'epoch': 0.12} {'loss': 0.4271, 'learning_rate': 1.9950021137246186e-05, 'epoch': 0.12} {'loss': 0.6337, 'learning_rate': 1.9949987582964153e-05, 'epoch': 0.12} {'loss': 0.4997, 'learning_rate': 1.9949954017450476e-05, 'epoch': 0.12} {'loss': 0.5356, 'learning_rate': 1.9949920440705193e-05, 'epoch': 0.12} {'loss': 0.4769, 'learning_rate': 1.9949886852728345e-05, 'epoch': 0.12} {'loss': 0.486, 'learning_rate': 1.9949853253519965e-05, 'epoch': 0.12} {'loss': 0.4537, 'learning_rate': 1.994981964308009e-05, 'epoch': 0.12} {'loss': 0.3366, 'learning_rate': 1.9949786021408763e-05, 'epoch': 0.12} {'loss': 0.5135, 'learning_rate': 1.9949752388506022e-05, 'epoch': 0.12} {'loss': 0.5972, 'learning_rate': 1.99497187443719e-05, 'epoch': 0.12} {'loss': 0.5427, 'learning_rate': 1.9949685089006438e-05, 'epoch': 0.12} {'loss': 0.6888, 'learning_rate': 1.994965142240967e-05, 'epoch': 0.12} {'loss': 0.5851, 'learning_rate': 1.9949617744581645e-05, 'epoch': 0.12} {'loss': 0.5085, 'learning_rate': 1.9949584055522385e-05, 'epoch': 0.12} {'loss': 0.673, 'learning_rate': 1.9949550355231943e-05, 'epoch': 0.12} {'loss': 0.5673, 'learning_rate': 1.994951664371035e-05, 'epoch': 0.12} {'loss': 0.5848, 'learning_rate': 1.9949482920957643e-05, 'epoch': 0.12} {'loss': 0.5819, 'learning_rate': 1.9949449186973863e-05, 'epoch': 0.12} {'loss': 0.5887, 'learning_rate': 1.9949415441759043e-05, 'epoch': 0.12} {'loss': 0.4995, 'learning_rate': 1.994938168531323e-05, 'epoch': 0.12} {'loss': 0.561, 'learning_rate': 1.9949347917636454e-05, 'epoch': 0.12} {'loss': 0.5543, 'learning_rate': 1.994931413872876e-05, 'epoch': 0.12} {'loss': 0.5399, 'learning_rate': 1.994928034859018e-05, 'epoch': 0.12} {'loss': 0.5604, 'learning_rate': 1.994924654722075e-05, 'epoch': 0.12} {'loss': 0.4558, 'learning_rate': 1.9949212734620516e-05, 'epoch': 0.12} {'loss': 0.5542, 'learning_rate': 1.9949178910789515e-05, 'epoch': 0.12} {'loss': 0.5969, 'learning_rate': 1.994914507572778e-05, 'epoch': 0.12} {'loss': 0.822, 'learning_rate': 1.9949111229435356e-05, 'epoch': 0.12} {'loss': 0.4227, 'learning_rate': 1.9949077371912274e-05, 'epoch': 0.12} {'loss': 0.6224, 'learning_rate': 1.9949043503158573e-05, 'epoch': 0.12} {'loss': 0.6738, 'learning_rate': 1.99490096231743e-05, 'epoch': 0.12} {'loss': 0.5784, 'learning_rate': 1.9948975731959483e-05, 'epoch': 0.12} {'loss': 0.4808, 'learning_rate': 1.9948941829514165e-05, 'epoch': 0.12} {'loss': 0.5017, 'learning_rate': 1.9948907915838386e-05, 'epoch': 0.12} {'loss': 0.5442, 'learning_rate': 1.9948873990932177e-05, 'epoch': 0.12} {'loss': 0.5459, 'learning_rate': 1.9948840054795585e-05, 'epoch': 0.12} {'loss': 0.5866, 'learning_rate': 1.994880610742864e-05, 'epoch': 0.12} {'loss': 0.4968, 'learning_rate': 1.994877214883139e-05, 'epoch': 0.12} {'loss': 0.593, 'learning_rate': 1.9948738179003867e-05, 'epoch': 0.12} {'loss': 0.632, 'learning_rate': 1.994870419794611e-05, 'epoch': 0.12} {'loss': 0.4801, 'learning_rate': 1.9948670205658155e-05, 'epoch': 0.12} {'loss': 0.5802, 'learning_rate': 1.9948636202140048e-05, 'epoch': 0.12} {'loss': 0.6654, 'learning_rate': 1.994860218739182e-05, 'epoch': 0.12} {'loss': 0.5746, 'learning_rate': 1.9948568161413512e-05, 'epoch': 0.12} {'loss': 0.4717, 'learning_rate': 1.994853412420516e-05, 'epoch': 0.12} {'loss': 0.6771, 'learning_rate': 1.9948500075766806e-05, 'epoch': 0.12} {'loss': 0.61, 'learning_rate': 1.9948466016098492e-05, 'epoch': 0.12} {'loss': 0.6026, 'learning_rate': 1.9948431945200246e-05, 'epoch': 0.12} {'loss': 0.3318, 'learning_rate': 1.9948397863072115e-05, 'epoch': 0.12} {'loss': 0.5249, 'learning_rate': 1.9948363769714132e-05, 'epoch': 0.12} {'loss': 0.4987, 'learning_rate': 1.994832966512634e-05, 'epoch': 0.12} {'loss': 0.6313, 'learning_rate': 1.9948295549308777e-05, 'epoch': 0.12} {'loss': 0.5167, 'learning_rate': 1.9948261422261476e-05, 'epoch': 0.12} {'loss': 0.5792, 'learning_rate': 1.9948227283984483e-05, 'epoch': 0.12} {'loss': 0.478, 'learning_rate': 1.994819313447783e-05, 'epoch': 0.12} {'loss': 0.4403, 'learning_rate': 1.9948158973741563e-05, 'epoch': 0.13} {'loss': 0.4261, 'learning_rate': 1.994812480177571e-05, 'epoch': 0.13} {'loss': 0.6557, 'learning_rate': 1.9948090618580324e-05, 'epoch': 0.13} {'loss': 0.5787, 'learning_rate': 1.994805642415543e-05, 'epoch': 0.13} {'loss': 0.6726, 'learning_rate': 1.9948022218501073e-05, 'epoch': 0.13} {'loss': 0.6404, 'learning_rate': 1.9947988001617294e-05, 'epoch': 0.13} {'loss': 0.6159, 'learning_rate': 1.9947953773504122e-05, 'epoch': 0.13} {'loss': 0.7033, 'learning_rate': 1.9947919534161607e-05, 'epoch': 0.13} {'loss': 0.7054, 'learning_rate': 1.994788528358978e-05, 'epoch': 0.13} {'loss': 0.4613, 'learning_rate': 1.994785102178868e-05, 'epoch': 0.13} {'loss': 0.6395, 'learning_rate': 1.9947816748758355e-05, 'epoch': 0.13} {'loss': 0.4768, 'learning_rate': 1.994778246449883e-05, 'epoch': 0.13} {'loss': 0.5983, 'learning_rate': 1.994774816901015e-05, 'epoch': 0.13} {'loss': 0.5978, 'learning_rate': 1.994771386229236e-05, 'epoch': 0.13} {'loss': 0.5909, 'learning_rate': 1.9947679544345488e-05, 'epoch': 0.13} {'loss': 0.4949, 'learning_rate': 1.994764521516958e-05, 'epoch': 0.13} {'loss': 0.5639, 'learning_rate': 1.994761087476467e-05, 'epoch': 0.13} {'loss': 0.6298, 'learning_rate': 1.9947576523130797e-05, 'epoch': 0.13} {'loss': 0.4095, 'learning_rate': 1.9947542160268005e-05, 'epoch': 0.13} {'loss': 0.6342, 'learning_rate': 1.994750778617633e-05, 'epoch': 0.13} {'loss': 0.3846, 'learning_rate': 1.994747340085581e-05, 'epoch': 0.13} {'loss': 0.4943, 'learning_rate': 1.9947439004306483e-05, 'epoch': 0.13} {'loss': 0.5948, 'learning_rate': 1.9947404596528387e-05, 'epoch': 0.13} {'loss': 0.564, 'learning_rate': 1.9947370177521564e-05, 'epoch': 0.13} {'loss': 0.5409, 'learning_rate': 1.9947335747286053e-05, 'epoch': 0.13} {'loss': 0.6161, 'learning_rate': 1.9947301305821893e-05, 'epoch': 0.13} {'loss': 0.3817, 'learning_rate': 1.994726685312912e-05, 'epoch': 0.13} {'loss': 0.5825, 'learning_rate': 1.9947232389207772e-05, 'epoch': 0.13} {'loss': 0.4403, 'learning_rate': 1.9947197914057895e-05, 'epoch': 0.13} {'loss': 0.6926, 'learning_rate': 1.994716342767952e-05, 'epoch': 0.13} {'loss': 0.5348, 'learning_rate': 1.9947128930072687e-05, 'epoch': 0.13} {'loss': 0.6819, 'learning_rate': 1.994709442123744e-05, 'epoch': 0.13} {'loss': 0.6323, 'learning_rate': 1.9947059901173815e-05, 'epoch': 0.13} {'loss': 0.5413, 'learning_rate': 1.994702536988185e-05, 'epoch': 0.13} {'loss': 0.5657, 'learning_rate': 1.9946990827361583e-05, 'epoch': 0.13} {'loss': 0.4419, 'learning_rate': 1.994695627361306e-05, 'epoch': 0.13} {'loss': 0.5756, 'learning_rate': 1.994692170863631e-05, 'epoch': 0.13} {'loss': 0.5338, 'learning_rate': 1.9946887132431377e-05, 'epoch': 0.13} {'loss': 0.764, 'learning_rate': 1.9946852544998304e-05, 'epoch': 0.13} {'loss': 0.629, 'learning_rate': 1.994681794633712e-05, 'epoch': 0.13} {'loss': 0.5696, 'learning_rate': 1.9946783336447874e-05, 'epoch': 0.13} {'loss': 0.5934, 'learning_rate': 1.99467487153306e-05, 'epoch': 0.13} {'loss': 0.5446, 'learning_rate': 1.994671408298534e-05, 'epoch': 0.13} {'loss': 0.6114, 'learning_rate': 1.994667943941213e-05, 'epoch': 0.13} {'loss': 0.4389, 'learning_rate': 1.994664478461101e-05, 'epoch': 0.13} {'loss': 0.5731, 'learning_rate': 1.9946610118582018e-05, 'epoch': 0.13} {'loss': 0.5934, 'learning_rate': 1.9946575441325197e-05, 'epoch': 0.13} {'loss': 0.4644, 'learning_rate': 1.9946540752840585e-05, 'epoch': 0.13} {'loss': 0.4868, 'learning_rate': 1.994650605312822e-05, 'epoch': 0.13} {'loss': 0.6067, 'learning_rate': 1.9946471342188138e-05, 'epoch': 0.13} {'loss': 0.5502, 'learning_rate': 1.9946436620020383e-05, 'epoch': 0.13} {'loss': 0.5756, 'learning_rate': 1.994640188662499e-05, 'epoch': 0.13} {'loss': 0.5271, 'learning_rate': 1.9946367142002003e-05, 'epoch': 0.13} {'loss': 0.6036, 'learning_rate': 1.9946332386151458e-05, 'epoch': 0.13} {'loss': 0.4373, 'learning_rate': 1.9946297619073394e-05, 'epoch': 0.13} {'loss': 0.6747, 'learning_rate': 1.9946262840767853e-05, 'epoch': 0.13} {'loss': 0.7084, 'learning_rate': 1.9946228051234874e-05, 'epoch': 0.13} {'loss': 0.4983, 'learning_rate': 1.9946193250474493e-05, 'epoch': 0.13} {'loss': 0.5133, 'learning_rate': 1.994615843848675e-05, 'epoch': 0.13} {'loss': 0.5943, 'learning_rate': 1.994612361527169e-05, 'epoch': 0.13} {'loss': 0.4917, 'learning_rate': 1.9946088780829343e-05, 'epoch': 0.13} {'loss': 0.4893, 'learning_rate': 1.9946053935159756e-05, 'epoch': 0.13} {'loss': 0.5284, 'learning_rate': 1.9946019078262965e-05, 'epoch': 0.13} {'loss': 0.716, 'learning_rate': 1.9945984210139006e-05, 'epoch': 0.13} {'loss': 0.4552, 'learning_rate': 1.9945949330787927e-05, 'epoch': 0.13} {'loss': 0.5809, 'learning_rate': 1.9945914440209758e-05, 'epoch': 0.13} {'loss': 0.7004, 'learning_rate': 1.9945879538404547e-05, 'epoch': 0.13} {'loss': 0.6297, 'learning_rate': 1.9945844625372328e-05, 'epoch': 0.13} {'loss': 0.5083, 'learning_rate': 1.994580970111314e-05, 'epoch': 0.13} {'loss': 0.6839, 'learning_rate': 1.994577476562703e-05, 'epoch': 0.13} {'loss': 0.5656, 'learning_rate': 1.9945739818914026e-05, 'epoch': 0.13} {'loss': 0.605, 'learning_rate': 1.9945704860974173e-05, 'epoch': 0.13} {'loss': 0.5233, 'learning_rate': 1.9945669891807512e-05, 'epoch': 0.13} {'loss': 0.5717, 'learning_rate': 1.994563491141408e-05, 'epoch': 0.13} {'loss': 0.4419, 'learning_rate': 1.994559991979392e-05, 'epoch': 0.13} {'loss': 0.4516, 'learning_rate': 1.9945564916947066e-05, 'epoch': 0.13} {'loss': 0.5925, 'learning_rate': 1.994552990287356e-05, 'epoch': 0.13} {'loss': 0.715, 'learning_rate': 1.9945494877573446e-05, 'epoch': 0.13} {'loss': 0.558, 'learning_rate': 1.9945459841046757e-05, 'epoch': 0.13} {'loss': 0.5751, 'learning_rate': 1.9945424793293534e-05, 'epoch': 0.13} {'loss': 0.5599, 'learning_rate': 1.9945389734313818e-05, 'epoch': 0.13} {'loss': 0.4427, 'learning_rate': 1.994535466410765e-05, 'epoch': 0.13} {'loss': 0.565, 'learning_rate': 1.9945319582675068e-05, 'epoch': 0.13} {'loss': 0.521, 'learning_rate': 1.994528449001611e-05, 'epoch': 0.13} {'loss': 0.4494, 'learning_rate': 1.9945249386130815e-05, 'epoch': 0.13} {'loss': 0.4794, 'learning_rate': 1.9945214271019225e-05, 'epoch': 0.13} {'loss': 0.4774, 'learning_rate': 1.9945179144681385e-05, 'epoch': 0.13} {'loss': 0.6015, 'learning_rate': 1.9945144007117323e-05, 'epoch': 0.13} {'loss': 0.5632, 'learning_rate': 1.9945108858327086e-05, 'epoch': 0.13} {'loss': 0.4429, 'learning_rate': 1.9945073698310712e-05, 'epoch': 0.13} {'loss': 0.5988, 'learning_rate': 1.9945038527068244e-05, 'epoch': 0.13} {'loss': 0.6044, 'learning_rate': 1.9945003344599713e-05, 'epoch': 0.13} {'loss': 0.4514, 'learning_rate': 1.994496815090517e-05, 'epoch': 0.13} {'loss': 0.4885, 'learning_rate': 1.9944932945984648e-05, 'epoch': 0.13} {'loss': 0.5995, 'learning_rate': 1.9944897729838185e-05, 'epoch': 0.13} {'loss': 0.2975, 'learning_rate': 1.9944862502465825e-05, 'epoch': 0.13} {'loss': 0.5371, 'learning_rate': 1.994482726386761e-05, 'epoch': 0.13} {'loss': 0.6951, 'learning_rate': 1.994479201404357e-05, 'epoch': 0.13} {'loss': 0.4504, 'learning_rate': 1.9944756752993752e-05, 'epoch': 0.13} {'loss': 0.5187, 'learning_rate': 1.9944721480718197e-05, 'epoch': 0.13} {'loss': 0.4681, 'learning_rate': 1.994468619721694e-05, 'epoch': 0.13} {'loss': 0.6911, 'learning_rate': 1.9944650902490026e-05, 'epoch': 0.13} {'loss': 0.4531, 'learning_rate': 1.994461559653749e-05, 'epoch': 0.13} {'loss': 0.5598, 'learning_rate': 1.9944580279359375e-05, 'epoch': 0.13} {'loss': 0.5188, 'learning_rate': 1.9944544950955723e-05, 'epoch': 0.13} {'loss': 0.5177, 'learning_rate': 1.9944509611326568e-05, 'epoch': 0.13} {'loss': 0.5599, 'learning_rate': 1.994447426047195e-05, 'epoch': 0.13} {'loss': 0.5546, 'learning_rate': 1.9944438898391915e-05, 'epoch': 0.13} {'loss': 0.5033, 'learning_rate': 1.9944403525086498e-05, 'epoch': 0.13} {'loss': 0.5959, 'learning_rate': 1.9944368140555743e-05, 'epoch': 0.13} {'loss': 0.5187, 'learning_rate': 1.9944332744799685e-05, 'epoch': 0.13} {'loss': 0.3866, 'learning_rate': 1.9944297337818366e-05, 'epoch': 0.13} {'loss': 0.6292, 'learning_rate': 1.994426191961183e-05, 'epoch': 0.13} {'loss': 0.6002, 'learning_rate': 1.9944226490180107e-05, 'epoch': 0.13} {'loss': 0.4367, 'learning_rate': 1.9944191049523248e-05, 'epoch': 0.13} {'loss': 0.5997, 'learning_rate': 1.994415559764129e-05, 'epoch': 0.13} {'loss': 0.5656, 'learning_rate': 1.9944120134534266e-05, 'epoch': 0.13} {'loss': 0.5685, 'learning_rate': 1.9944084660202223e-05, 'epoch': 0.13} {'loss': 0.493, 'learning_rate': 1.99440491746452e-05, 'epoch': 0.13} {'loss': 0.5269, 'learning_rate': 1.9944013677863235e-05, 'epoch': 0.13} {'loss': 0.4997, 'learning_rate': 1.994397816985637e-05, 'epoch': 0.13} {'loss': 0.5513, 'learning_rate': 1.9943942650624647e-05, 'epoch': 0.13} {'loss': 0.7645, 'learning_rate': 1.9943907120168103e-05, 'epoch': 0.13} {'loss': 0.615, 'learning_rate': 1.994387157848678e-05, 'epoch': 0.13} {'loss': 0.7288, 'learning_rate': 1.9943836025580712e-05, 'epoch': 0.13} {'loss': 0.3929, 'learning_rate': 1.9943800461449947e-05, 'epoch': 0.13} {'loss': 0.5988, 'learning_rate': 1.9943764886094524e-05, 'epoch': 0.13} {'loss': 0.6797, 'learning_rate': 1.994372929951448e-05, 'epoch': 0.13} {'loss': 0.5943, 'learning_rate': 1.9943693701709853e-05, 'epoch': 0.13} {'loss': 0.5922, 'learning_rate': 1.9943658092680694e-05, 'epoch': 0.13} {'loss': 0.4951, 'learning_rate': 1.994362247242703e-05, 'epoch': 0.13} {'loss': 0.6127, 'learning_rate': 1.9943586840948908e-05, 'epoch': 0.13} {'loss': 0.7605, 'learning_rate': 1.9943551198246366e-05, 'epoch': 0.13} {'loss': 0.4178, 'learning_rate': 1.994351554431945e-05, 'epoch': 0.13} {'loss': 0.5956, 'learning_rate': 1.9943479879168194e-05, 'epoch': 0.13} {'loss': 0.5643, 'learning_rate': 1.994344420279264e-05, 'epoch': 0.13} {'loss': 0.4667, 'learning_rate': 1.9943408515192826e-05, 'epoch': 0.13} {'loss': 0.7746, 'learning_rate': 1.9943372816368796e-05, 'epoch': 0.13} {'loss': 0.6665, 'learning_rate': 1.994333710632059e-05, 'epoch': 0.13} {'loss': 0.5219, 'learning_rate': 1.9943301385048247e-05, 'epoch': 0.13} {'loss': 0.5502, 'learning_rate': 1.9943265652551808e-05, 'epoch': 0.13} {'loss': 0.3846, 'learning_rate': 1.994322990883131e-05, 'epoch': 0.13} {'loss': 0.691, 'learning_rate': 1.9943194153886797e-05, 'epoch': 0.13} {'loss': 0.4736, 'learning_rate': 1.994315838771831e-05, 'epoch': 0.13} {'loss': 0.5619, 'learning_rate': 1.994312261032589e-05, 'epoch': 0.13} {'loss': 0.3955, 'learning_rate': 1.994308682170957e-05, 'epoch': 0.13} {'loss': 0.5718, 'learning_rate': 1.99430510218694e-05, 'epoch': 0.13} {'loss': 0.7537, 'learning_rate': 1.9943015210805416e-05, 'epoch': 0.13} {'loss': 0.5334, 'learning_rate': 1.9942979388517656e-05, 'epoch': 0.13} {'loss': 0.6321, 'learning_rate': 1.994294355500616e-05, 'epoch': 0.13} {'loss': 0.6206, 'learning_rate': 1.994290771027098e-05, 'epoch': 0.13} {'loss': 0.5315, 'learning_rate': 1.9942871854312144e-05, 'epoch': 0.13} {'loss': 0.5302, 'learning_rate': 1.9942835987129697e-05, 'epoch': 0.13} {'loss': 0.571, 'learning_rate': 1.9942800108723677e-05, 'epoch': 0.13} {'loss': 0.624, 'learning_rate': 1.9942764219094125e-05, 'epoch': 0.13} {'loss': 0.471, 'learning_rate': 1.9942728318241088e-05, 'epoch': 0.13} {'loss': 0.5671, 'learning_rate': 1.99426924061646e-05, 'epoch': 0.13} {'loss': 0.5954, 'learning_rate': 1.99426564828647e-05, 'epoch': 0.13} {'loss': 0.5796, 'learning_rate': 1.9942620548341435e-05, 'epoch': 0.13} {'loss': 0.5365, 'learning_rate': 1.994258460259484e-05, 'epoch': 0.13} {'loss': 0.6342, 'learning_rate': 1.9942548645624957e-05, 'epoch': 0.13} {'loss': 0.4979, 'learning_rate': 1.994251267743183e-05, 'epoch': 0.13} {'loss': 0.4903, 'learning_rate': 1.9942476698015493e-05, 'epoch': 0.13} {'loss': 0.5904, 'learning_rate': 1.994244070737599e-05, 'epoch': 0.13} {'loss': 0.5837, 'learning_rate': 1.9942404705513367e-05, 'epoch': 0.13} {'loss': 0.4635, 'learning_rate': 1.994236869242766e-05, 'epoch': 0.13} {'loss': 0.6169, 'learning_rate': 1.9942332668118906e-05, 'epoch': 0.13} {'loss': 0.4939, 'learning_rate': 1.994229663258715e-05, 'epoch': 0.13} {'loss': 0.5512, 'learning_rate': 1.9942260585832433e-05, 'epoch': 0.13} {'loss': 0.5293, 'learning_rate': 1.994222452785479e-05, 'epoch': 0.13} {'loss': 0.5565, 'learning_rate': 1.9942188458654267e-05, 'epoch': 0.13} {'loss': 0.6432, 'learning_rate': 1.9942152378230906e-05, 'epoch': 0.13} {'loss': 0.4961, 'learning_rate': 1.994211628658475e-05, 'epoch': 0.13} {'loss': 0.4539, 'learning_rate': 1.9942080183715827e-05, 'epoch': 0.13} {'loss': 0.5215, 'learning_rate': 1.994204406962419e-05, 'epoch': 0.13} {'loss': 0.5951, 'learning_rate': 1.9942007944309876e-05, 'epoch': 0.13} {'loss': 0.5277, 'learning_rate': 1.9941971807772927e-05, 'epoch': 0.13} {'loss': 0.6095, 'learning_rate': 1.9941935660013377e-05, 'epoch': 0.13} {'loss': 0.4269, 'learning_rate': 1.9941899501031278e-05, 'epoch': 0.13} {'loss': 0.577, 'learning_rate': 1.994186333082666e-05, 'epoch': 0.13} {'loss': 0.5267, 'learning_rate': 1.9941827149399576e-05, 'epoch': 0.13} {'loss': 0.5289, 'learning_rate': 1.9941790956750052e-05, 'epoch': 0.13} {'loss': 0.6657, 'learning_rate': 1.994175475287814e-05, 'epoch': 0.13} {'loss': 0.5593, 'learning_rate': 1.994171853778388e-05, 'epoch': 0.13} {'loss': 0.5612, 'learning_rate': 1.9941682311467306e-05, 'epoch': 0.13} {'loss': 0.4332, 'learning_rate': 1.9941646073928465e-05, 'epoch': 0.13} {'loss': 0.5504, 'learning_rate': 1.9941609825167395e-05, 'epoch': 0.13} {'loss': 0.4816, 'learning_rate': 1.994157356518414e-05, 'epoch': 0.13} {'loss': 0.5475, 'learning_rate': 1.9941537293978736e-05, 'epoch': 0.13} {'loss': 0.5208, 'learning_rate': 1.994150101155123e-05, 'epoch': 0.13} {'loss': 0.6456, 'learning_rate': 1.9941464717901657e-05, 'epoch': 0.13} {'loss': 0.5283, 'learning_rate': 1.9941428413030062e-05, 'epoch': 0.13} {'loss': 0.4891, 'learning_rate': 1.9941392096936483e-05, 'epoch': 0.13} {'loss': 0.5299, 'learning_rate': 1.9941355769620965e-05, 'epoch': 0.13} {'loss': 0.5123, 'learning_rate': 1.9941319431083548e-05, 'epoch': 0.13} {'loss': 0.4522, 'learning_rate': 1.994128308132427e-05, 'epoch': 0.13} {'loss': 0.62, 'learning_rate': 1.9941246720343175e-05, 'epoch': 0.13} {'loss': 0.5543, 'learning_rate': 1.99412103481403e-05, 'epoch': 0.13} {'loss': 0.5659, 'learning_rate': 1.994117396471569e-05, 'epoch': 0.13} {'loss': 0.7016, 'learning_rate': 1.9941137570069388e-05, 'epoch': 0.13} {'loss': 0.5199, 'learning_rate': 1.9941101164201427e-05, 'epoch': 0.13} {'loss': 0.5155, 'learning_rate': 1.9941064747111858e-05, 'epoch': 0.13} {'loss': 0.64, 'learning_rate': 1.9941028318800715e-05, 'epoch': 0.13} {'loss': 0.6431, 'learning_rate': 1.9940991879268043e-05, 'epoch': 0.13} {'loss': 0.4108, 'learning_rate': 1.9940955428513878e-05, 'epoch': 0.13} {'loss': 0.5208, 'learning_rate': 1.9940918966538268e-05, 'epoch': 0.13} {'loss': 0.457, 'learning_rate': 1.994088249334125e-05, 'epoch': 0.13} {'loss': 0.4739, 'learning_rate': 1.9940846008922865e-05, 'epoch': 0.13} {'loss': 0.5317, 'learning_rate': 1.9940809513283157e-05, 'epoch': 0.13} {'loss': 0.6541, 'learning_rate': 1.9940773006422167e-05, 'epoch': 0.13} {'loss': 0.5931, 'learning_rate': 1.9940736488339928e-05, 'epoch': 0.13} {'loss': 0.5417, 'learning_rate': 1.994069995903649e-05, 'epoch': 0.13} {'loss': 0.5852, 'learning_rate': 1.9940663418511897e-05, 'epoch': 0.13} {'loss': 0.4758, 'learning_rate': 1.994062686676618e-05, 'epoch': 0.13} {'loss': 0.6155, 'learning_rate': 1.9940590303799388e-05, 'epoch': 0.13} {'loss': 0.4263, 'learning_rate': 1.994055372961156e-05, 'epoch': 0.13} {'loss': 0.4208, 'learning_rate': 1.9940517144202734e-05, 'epoch': 0.13} {'loss': 0.4836, 'learning_rate': 1.994048054757296e-05, 'epoch': 0.13} {'loss': 0.5198, 'learning_rate': 1.9940443939722273e-05, 'epoch': 0.13} {'loss': 0.5865, 'learning_rate': 1.994040732065071e-05, 'epoch': 0.13} {'loss': 0.5852, 'learning_rate': 1.994037069035832e-05, 'epoch': 0.13} {'loss': 0.6081, 'learning_rate': 1.9940334048845143e-05, 'epoch': 0.13} {'loss': 0.4431, 'learning_rate': 1.9940297396111215e-05, 'epoch': 0.13} {'loss': 0.5618, 'learning_rate': 1.9940260732156587e-05, 'epoch': 0.13} {'loss': 0.5205, 'learning_rate': 1.9940224056981294e-05, 'epoch': 0.13} {'loss': 0.4904, 'learning_rate': 1.9940187370585375e-05, 'epoch': 0.13} {'loss': 0.5777, 'learning_rate': 1.9940150672968875e-05, 'epoch': 0.13} {'loss': 0.4516, 'learning_rate': 1.9940113964131838e-05, 'epoch': 0.13} {'loss': 0.6376, 'learning_rate': 1.99400772440743e-05, 'epoch': 0.13} {'loss': 0.5349, 'learning_rate': 1.994004051279631e-05, 'epoch': 0.13} {'loss': 0.4256, 'learning_rate': 1.99400037702979e-05, 'epoch': 0.13} {'loss': 0.4493, 'learning_rate': 1.9939967016579113e-05, 'epoch': 0.13} {'loss': 0.5373, 'learning_rate': 1.9939930251639998e-05, 'epoch': 0.13} {'loss': 0.4377, 'learning_rate': 1.993989347548059e-05, 'epoch': 0.13} {'loss': 0.5809, 'learning_rate': 1.9939856688100935e-05, 'epoch': 0.13} {'loss': 0.5566, 'learning_rate': 1.993981988950107e-05, 'epoch': 0.13} {'loss': 0.5685, 'learning_rate': 1.9939783079681035e-05, 'epoch': 0.13} {'loss': 0.5217, 'learning_rate': 1.993974625864088e-05, 'epoch': 0.13} {'loss': 0.5795, 'learning_rate': 1.993970942638064e-05, 'epoch': 0.13} {'loss': 0.424, 'learning_rate': 1.9939672582900358e-05, 'epoch': 0.13} {'loss': 0.4822, 'learning_rate': 1.9939635728200076e-05, 'epoch': 0.13} {'loss': 0.528, 'learning_rate': 1.9939598862279838e-05, 'epoch': 0.13} {'loss': 0.4813, 'learning_rate': 1.993956198513968e-05, 'epoch': 0.13} {'loss': 0.4372, 'learning_rate': 1.9939525096779646e-05, 'epoch': 0.13} {'loss': 0.447, 'learning_rate': 1.993948819719978e-05, 'epoch': 0.13} {'loss': 0.4942, 'learning_rate': 1.9939451286400122e-05, 'epoch': 0.13} {'loss': 0.6466, 'learning_rate': 1.9939414364380712e-05, 'epoch': 0.13} {'loss': 0.4178, 'learning_rate': 1.9939377431141594e-05, 'epoch': 0.13} {'loss': 0.5628, 'learning_rate': 1.993934048668281e-05, 'epoch': 0.13} {'loss': 0.6474, 'learning_rate': 1.9939303531004398e-05, 'epoch': 0.13} {'loss': 0.5612, 'learning_rate': 1.9939266564106404e-05, 'epoch': 0.13} {'loss': 0.5512, 'learning_rate': 1.9939229585988868e-05, 'epoch': 0.13} {'loss': 0.4942, 'learning_rate': 1.9939192596651833e-05, 'epoch': 0.13} {'loss': 0.4394, 'learning_rate': 1.9939155596095338e-05, 'epoch': 0.13} {'loss': 0.5821, 'learning_rate': 1.9939118584319427e-05, 'epoch': 0.13} {'loss': 0.6503, 'learning_rate': 1.993908156132414e-05, 'epoch': 0.13} {'loss': 0.6168, 'learning_rate': 1.993904452710952e-05, 'epoch': 0.13} {'loss': 0.4747, 'learning_rate': 1.9939007481675608e-05, 'epoch': 0.13} {'loss': 0.5471, 'learning_rate': 1.993897042502245e-05, 'epoch': 0.13} {'loss': 0.6387, 'learning_rate': 1.9938933357150084e-05, 'epoch': 0.13} {'loss': 0.5853, 'learning_rate': 1.993889627805855e-05, 'epoch': 0.13} {'loss': 0.4282, 'learning_rate': 1.9938859187747893e-05, 'epoch': 0.13} {'loss': 0.5632, 'learning_rate': 1.9938822086218152e-05, 'epoch': 0.13} {'loss': 0.6317, 'learning_rate': 1.9938784973469375e-05, 'epoch': 0.13} {'loss': 0.6179, 'learning_rate': 1.9938747849501596e-05, 'epoch': 0.13} {'loss': 0.4394, 'learning_rate': 1.993871071431486e-05, 'epoch': 0.13} {'loss': 0.5399, 'learning_rate': 1.9938673567909213e-05, 'epoch': 0.13} {'loss': 0.5347, 'learning_rate': 1.9938636410284692e-05, 'epoch': 0.13} {'loss': 0.599, 'learning_rate': 1.993859924144134e-05, 'epoch': 0.13} {'loss': 0.5869, 'learning_rate': 1.99385620613792e-05, 'epoch': 0.13} {'loss': 0.5458, 'learning_rate': 1.9938524870098313e-05, 'epoch': 0.13} {'loss': 0.498, 'learning_rate': 1.993848766759872e-05, 'epoch': 0.13} {'loss': 0.4811, 'learning_rate': 1.9938450453880466e-05, 'epoch': 0.13} {'loss': 0.3963, 'learning_rate': 1.993841322894359e-05, 'epoch': 0.13} {'loss': 0.7142, 'learning_rate': 1.9938375992788138e-05, 'epoch': 0.13} {'loss': 0.4798, 'learning_rate': 1.993833874541415e-05, 'epoch': 0.13} {'loss': 0.5109, 'learning_rate': 1.9938301486821664e-05, 'epoch': 0.13} {'loss': 0.5812, 'learning_rate': 1.993826421701073e-05, 'epoch': 0.13} {'loss': 0.5029, 'learning_rate': 1.993822693598138e-05, 'epoch': 0.13} {'loss': 0.601, 'learning_rate': 1.9938189643733664e-05, 'epoch': 0.13} {'loss': 0.5532, 'learning_rate': 1.993815234026762e-05, 'epoch': 0.13} {'loss': 0.6777, 'learning_rate': 1.9938115025583294e-05, 'epoch': 0.13} {'loss': 0.6431, 'learning_rate': 1.9938077699680726e-05, 'epoch': 0.13} {'loss': 0.5354, 'learning_rate': 1.9938040362559955e-05, 'epoch': 0.13} {'loss': 0.48, 'learning_rate': 1.993800301422103e-05, 'epoch': 0.13} {'loss': 0.4727, 'learning_rate': 1.9937965654663988e-05, 'epoch': 0.13} {'loss': 0.7075, 'learning_rate': 1.9937928283888873e-05, 'epoch': 0.13} {'loss': 0.5774, 'learning_rate': 1.9937890901895726e-05, 'epoch': 0.13} {'loss': 0.6072, 'learning_rate': 1.993785350868459e-05, 'epoch': 0.13} {'loss': 0.5534, 'learning_rate': 1.9937816104255507e-05, 'epoch': 0.13} {'loss': 0.6233, 'learning_rate': 1.993777868860852e-05, 'epoch': 0.13} {'loss': 0.6641, 'learning_rate': 1.993774126174367e-05, 'epoch': 0.13} {'loss': 0.5829, 'learning_rate': 1.9937703823661e-05, 'epoch': 0.13} {'loss': 0.6928, 'learning_rate': 1.993766637436055e-05, 'epoch': 0.13} {'loss': 0.6159, 'learning_rate': 1.993762891384237e-05, 'epoch': 0.13} {'loss': 0.6067, 'learning_rate': 1.993759144210649e-05, 'epoch': 0.13} {'loss': 0.5096, 'learning_rate': 1.9937553959152966e-05, 'epoch': 0.13} {'loss': 0.6113, 'learning_rate': 1.9937516464981827e-05, 'epoch': 0.13} {'loss': 0.6446, 'learning_rate': 1.9937478959593126e-05, 'epoch': 0.13} {'loss': 0.5661, 'learning_rate': 1.99374414429869e-05, 'epoch': 0.13} {'loss': 0.7859, 'learning_rate': 1.993740391516319e-05, 'epoch': 0.13} {'loss': 0.4143, 'learning_rate': 1.9937366376122043e-05, 'epoch': 0.13} {'loss': 0.58, 'learning_rate': 1.99373288258635e-05, 'epoch': 0.13} {'loss': 0.5853, 'learning_rate': 1.99372912643876e-05, 'epoch': 0.13} {'loss': 0.5704, 'learning_rate': 1.9937253691694387e-05, 'epoch': 0.13} {'loss': 0.4284, 'learning_rate': 1.993721610778391e-05, 'epoch': 0.13} {'loss': 0.5473, 'learning_rate': 1.9937178512656198e-05, 'epoch': 0.13} {'loss': 0.5361, 'learning_rate': 1.9937140906311307e-05, 'epoch': 0.13} {'loss': 0.5292, 'learning_rate': 1.993710328874927e-05, 'epoch': 0.13} {'loss': 0.5651, 'learning_rate': 1.9937065659970132e-05, 'epoch': 0.13} {'loss': 0.4332, 'learning_rate': 1.9937028019973937e-05, 'epoch': 0.13} {'loss': 0.5278, 'learning_rate': 1.9936990368760732e-05, 'epoch': 0.13} {'loss': 0.3871, 'learning_rate': 1.993695270633055e-05, 'epoch': 0.13} {'loss': 0.5077, 'learning_rate': 1.993691503268344e-05, 'epoch': 0.13} {'loss': 0.3483, 'learning_rate': 1.9936877347819442e-05, 'epoch': 0.13} {'loss': 0.5513, 'learning_rate': 1.99368396517386e-05, 'epoch': 0.13} {'loss': 0.494, 'learning_rate': 1.993680194444095e-05, 'epoch': 0.13} {'loss': 0.5349, 'learning_rate': 1.9936764225926547e-05, 'epoch': 0.13} {'loss': 0.4431, 'learning_rate': 1.9936726496195424e-05, 'epoch': 0.13} {'loss': 0.6108, 'learning_rate': 1.9936688755247626e-05, 'epoch': 0.13} {'loss': 0.3948, 'learning_rate': 1.9936651003083198e-05, 'epoch': 0.13} {'loss': 0.5617, 'learning_rate': 1.993661323970218e-05, 'epoch': 0.13} {'loss': 0.4189, 'learning_rate': 1.9936575465104612e-05, 'epoch': 0.13} {'loss': 0.5546, 'learning_rate': 1.9936537679290543e-05, 'epoch': 0.13} {'loss': 0.51, 'learning_rate': 1.9936499882260013e-05, 'epoch': 0.13} {'loss': 0.7103, 'learning_rate': 1.9936462074013062e-05, 'epoch': 0.13} {'loss': 0.498, 'learning_rate': 1.9936424254549735e-05, 'epoch': 0.13} {'loss': 0.7305, 'learning_rate': 1.9936386423870075e-05, 'epoch': 0.13} {'loss': 0.5945, 'learning_rate': 1.9936348581974124e-05, 'epoch': 0.13} {'loss': 0.4915, 'learning_rate': 1.9936310728861925e-05, 'epoch': 0.13} {'loss': 0.5234, 'learning_rate': 1.993627286453352e-05, 'epoch': 0.13} {'loss': 0.5353, 'learning_rate': 1.9936234988988954e-05, 'epoch': 0.13} {'loss': 0.5824, 'learning_rate': 1.9936197102228267e-05, 'epoch': 0.13} {'loss': 0.5765, 'learning_rate': 1.99361592042515e-05, 'epoch': 0.13} {'loss': 0.6865, 'learning_rate': 1.9936121295058707e-05, 'epoch': 0.13} {'loss': 0.5042, 'learning_rate': 1.9936083374649917e-05, 'epoch': 0.13} {'loss': 0.4538, 'learning_rate': 1.9936045443025177e-05, 'epoch': 0.13} {'loss': 0.536, 'learning_rate': 1.9936007500184532e-05, 'epoch': 0.13} {'loss': 0.5445, 'learning_rate': 1.9935969546128025e-05, 'epoch': 0.13} {'loss': 0.5282, 'learning_rate': 1.9935931580855698e-05, 'epoch': 0.13} {'loss': 0.5574, 'learning_rate': 1.9935893604367594e-05, 'epoch': 0.13} {'loss': 0.5269, 'learning_rate': 1.9935855616663754e-05, 'epoch': 0.13} {'loss': 0.619, 'learning_rate': 1.9935817617744225e-05, 'epoch': 0.13} {'loss': 0.5445, 'learning_rate': 1.9935779607609045e-05, 'epoch': 0.13} {'loss': 0.5452, 'learning_rate': 1.993574158625826e-05, 'epoch': 0.13} {'loss': 0.5656, 'learning_rate': 1.9935703553691913e-05, 'epoch': 0.13} {'loss': 0.604, 'learning_rate': 1.9935665509910043e-05, 'epoch': 0.13} {'loss': 0.5273, 'learning_rate': 1.99356274549127e-05, 'epoch': 0.13} {'loss': 0.6663, 'learning_rate': 1.993558938869992e-05, 'epoch': 0.13} {'loss': 0.3964, 'learning_rate': 1.993555131127175e-05, 'epoch': 0.13} {'loss': 0.4872, 'learning_rate': 1.9935513222628232e-05, 'epoch': 0.13} {'loss': 0.4633, 'learning_rate': 1.9935475122769407e-05, 'epoch': 0.13} {'loss': 0.6082, 'learning_rate': 1.9935437011695323e-05, 'epoch': 0.13} {'loss': 0.415, 'learning_rate': 1.9935398889406018e-05, 'epoch': 0.13} {'loss': 0.5299, 'learning_rate': 1.9935360755901536e-05, 'epoch': 0.13} {'loss': 0.4699, 'learning_rate': 1.993532261118192e-05, 'epoch': 0.13} {'loss': 0.5638, 'learning_rate': 1.993528445524722e-05, 'epoch': 0.13} {'loss': 0.6261, 'learning_rate': 1.993524628809747e-05, 'epoch': 0.13} {'loss': 0.5631, 'learning_rate': 1.9935208109732716e-05, 'epoch': 0.13} {'loss': 0.4091, 'learning_rate': 1.9935169920153e-05, 'epoch': 0.13} {'loss': 0.5579, 'learning_rate': 1.9935131719358366e-05, 'epoch': 0.13} {'loss': 0.5237, 'learning_rate': 1.9935093507348862e-05, 'epoch': 0.13} {'loss': 0.5839, 'learning_rate': 1.993505528412452e-05, 'epoch': 0.13} {'loss': 0.4916, 'learning_rate': 1.9935017049685395e-05, 'epoch': 0.13} {'loss': 0.5329, 'learning_rate': 1.9934978804031525e-05, 'epoch': 0.13} {'loss': 0.5794, 'learning_rate': 1.9934940547162952e-05, 'epoch': 0.13} {'loss': 0.4722, 'learning_rate': 1.9934902279079717e-05, 'epoch': 0.13} {'loss': 0.6155, 'learning_rate': 1.993486399978187e-05, 'epoch': 0.13} {'loss': 0.7203, 'learning_rate': 1.993482570926945e-05, 'epoch': 0.13} {'loss': 0.545, 'learning_rate': 1.99347874075425e-05, 'epoch': 0.13} {'loss': 0.4936, 'learning_rate': 1.993474909460107e-05, 'epoch': 0.13} {'loss': 0.6632, 'learning_rate': 1.9934710770445192e-05, 'epoch': 0.13} {'loss': 0.7047, 'learning_rate': 1.9934672435074917e-05, 'epoch': 0.13} {'loss': 0.6656, 'learning_rate': 1.9934634088490284e-05, 'epoch': 0.13} {'loss': 0.5484, 'learning_rate': 1.9934595730691336e-05, 'epoch': 0.13} {'loss': 0.5703, 'learning_rate': 1.993455736167812e-05, 'epoch': 0.13} {'loss': 0.6916, 'learning_rate': 1.9934518981450682e-05, 'epoch': 0.13} {'loss': 0.5069, 'learning_rate': 1.993448059000906e-05, 'epoch': 0.13} {'loss': 0.5472, 'learning_rate': 1.9934442187353295e-05, 'epoch': 0.13} {'loss': 0.5962, 'learning_rate': 1.9934403773483435e-05, 'epoch': 0.13} {'loss': 0.6048, 'learning_rate': 1.9934365348399526e-05, 'epoch': 0.13} {'loss': 0.4131, 'learning_rate': 1.9934326912101603e-05, 'epoch': 0.13} {'loss': 0.6336, 'learning_rate': 1.9934288464589718e-05, 'epoch': 0.13} {'loss': 0.3476, 'learning_rate': 1.9934250005863907e-05, 'epoch': 0.13} {'loss': 0.6439, 'learning_rate': 1.9934211535924217e-05, 'epoch': 0.13} {'loss': 0.6583, 'learning_rate': 1.9934173054770694e-05, 'epoch': 0.13} {'loss': 0.5277, 'learning_rate': 1.9934134562403374e-05, 'epoch': 0.13} {'loss': 0.458, 'learning_rate': 1.993409605882231e-05, 'epoch': 0.13} {'loss': 0.5273, 'learning_rate': 1.993405754402754e-05, 'epoch': 0.13} {'loss': 0.5593, 'learning_rate': 1.9934019018019106e-05, 'epoch': 0.13} {'loss': 0.5484, 'learning_rate': 1.9933980480797054e-05, 'epoch': 0.13} {'loss': 0.5837, 'learning_rate': 1.9933941932361428e-05, 'epoch': 0.13} {'loss': 0.5021, 'learning_rate': 1.9933903372712268e-05, 'epoch': 0.13} {'loss': 0.6102, 'learning_rate': 1.9933864801849622e-05, 'epoch': 0.13} {'loss': 0.571, 'learning_rate': 1.9933826219773533e-05, 'epoch': 0.13} {'loss': 0.5601, 'learning_rate': 1.9933787626484043e-05, 'epoch': 0.13} {'loss': 0.5376, 'learning_rate': 1.9933749021981195e-05, 'epoch': 0.13} {'loss': 0.5857, 'learning_rate': 1.9933710406265034e-05, 'epoch': 0.13} {'loss': 0.3933, 'learning_rate': 1.99336717793356e-05, 'epoch': 0.13} {'loss': 0.4557, 'learning_rate': 1.9933633141192944e-05, 'epoch': 0.13} {'loss': 0.5193, 'learning_rate': 1.9933594491837103e-05, 'epoch': 0.13} {'loss': 0.6683, 'learning_rate': 1.993355583126812e-05, 'epoch': 0.13} {'loss': 0.4338, 'learning_rate': 1.9933517159486046e-05, 'epoch': 0.13} {'loss': 0.4078, 'learning_rate': 1.993347847649092e-05, 'epoch': 0.13} {'loss': 0.5009, 'learning_rate': 1.993343978228278e-05, 'epoch': 0.13} {'loss': 0.3881, 'learning_rate': 1.993340107686168e-05, 'epoch': 0.13} {'loss': 0.4416, 'learning_rate': 1.9933362360227656e-05, 'epoch': 0.13} {'loss': 0.5015, 'learning_rate': 1.993332363238076e-05, 'epoch': 0.13} {'loss': 0.5359, 'learning_rate': 1.993328489332103e-05, 'epoch': 0.13} {'loss': 0.5429, 'learning_rate': 1.9933246143048506e-05, 'epoch': 0.13} {'loss': 0.5047, 'learning_rate': 1.9933207381563237e-05, 'epoch': 0.13} {'loss': 0.7524, 'learning_rate': 1.9933168608865267e-05, 'epoch': 0.13} {'loss': 0.7196, 'learning_rate': 1.9933129824954637e-05, 'epoch': 0.13} {'loss': 0.4429, 'learning_rate': 1.9933091029831395e-05, 'epoch': 0.13} {'loss': 0.4056, 'learning_rate': 1.993305222349558e-05, 'epoch': 0.13} {'loss': 0.5131, 'learning_rate': 1.9933013405947238e-05, 'epoch': 0.13} {'loss': 0.5601, 'learning_rate': 1.9932974577186413e-05, 'epoch': 0.13} {'loss': 0.5782, 'learning_rate': 1.993293573721315e-05, 'epoch': 0.13} {'loss': 0.4079, 'learning_rate': 1.993289688602749e-05, 'epoch': 0.13} {'loss': 0.5699, 'learning_rate': 1.9932858023629477e-05, 'epoch': 0.13} {'loss': 0.5501, 'learning_rate': 1.993281915001916e-05, 'epoch': 0.13} {'loss': 0.7231, 'learning_rate': 1.9932780265196575e-05, 'epoch': 0.13} {'loss': 0.7236, 'learning_rate': 1.993274136916177e-05, 'epoch': 0.13} {'loss': 0.5536, 'learning_rate': 1.9932702461914793e-05, 'epoch': 0.13} {'loss': 0.6102, 'learning_rate': 1.993266354345568e-05, 'epoch': 0.13} {'loss': 0.4313, 'learning_rate': 1.993262461378448e-05, 'epoch': 0.13} {'loss': 0.553, 'learning_rate': 1.9932585672901234e-05, 'epoch': 0.13} {'loss': 0.5437, 'learning_rate': 1.993254672080599e-05, 'epoch': 0.13} {'loss': 0.6712, 'learning_rate': 1.9932507757498788e-05, 'epoch': 0.13} {'loss': 0.5546, 'learning_rate': 1.9932468782979674e-05, 'epoch': 0.13} {'loss': 0.6209, 'learning_rate': 1.993242979724869e-05, 'epoch': 0.13} {'loss': 0.5307, 'learning_rate': 1.9932390800305882e-05, 'epoch': 0.13} {'loss': 0.5703, 'learning_rate': 1.9932351792151296e-05, 'epoch': 0.13} {'loss': 0.6134, 'learning_rate': 1.9932312772784968e-05, 'epoch': 0.13} {'loss': 0.5146, 'learning_rate': 1.9932273742206953e-05, 'epoch': 0.13} {'loss': 0.3205, 'learning_rate': 1.993223470041729e-05, 'epoch': 0.13} {'loss': 0.5141, 'learning_rate': 1.9932195647416018e-05, 'epoch': 0.13} {'loss': 0.6423, 'learning_rate': 1.993215658320319e-05, 'epoch': 0.13} {'loss': 0.3738, 'learning_rate': 1.9932117507778842e-05, 'epoch': 0.13} {'loss': 0.7329, 'learning_rate': 1.9932078421143025e-05, 'epoch': 0.13} {'loss': 0.5702, 'learning_rate': 1.993203932329578e-05, 'epoch': 0.13} {'loss': 0.4039, 'learning_rate': 1.993200021423715e-05, 'epoch': 0.13} {'loss': 0.5401, 'learning_rate': 1.9931961093967184e-05, 'epoch': 0.13} {'loss': 0.5358, 'learning_rate': 1.993192196248592e-05, 'epoch': 0.13} {'loss': 0.5844, 'learning_rate': 1.9931882819793403e-05, 'epoch': 0.13} {'loss': 0.6062, 'learning_rate': 1.9931843665889682e-05, 'epoch': 0.13} {'loss': 0.691, 'learning_rate': 1.9931804500774795e-05, 'epoch': 0.13} {'loss': 0.3017, 'learning_rate': 1.993176532444879e-05, 'epoch': 0.13} {'loss': 0.5769, 'learning_rate': 1.9931726136911714e-05, 'epoch': 0.13} {'loss': 0.4329, 'learning_rate': 1.9931686938163605e-05, 'epoch': 0.13} {'loss': 0.6673, 'learning_rate': 1.9931647728204507e-05, 'epoch': 0.13} {'loss': 0.5314, 'learning_rate': 1.9931608507034474e-05, 'epoch': 0.13} {'loss': 0.5135, 'learning_rate': 1.993156927465354e-05, 'epoch': 0.13} {'loss': 0.572, 'learning_rate': 1.993153003106175e-05, 'epoch': 0.13} {'loss': 0.4867, 'learning_rate': 1.9931490776259153e-05, 'epoch': 0.13} {'loss': 0.479, 'learning_rate': 1.9931451510245793e-05, 'epoch': 0.13} {'loss': 0.6332, 'learning_rate': 1.9931412233021718e-05, 'epoch': 0.13} {'loss': 0.6545, 'learning_rate': 1.993137294458696e-05, 'epoch': 0.13} {'loss': 0.7091, 'learning_rate': 1.993133364494157e-05, 'epoch': 0.13} {'loss': 0.5232, 'learning_rate': 1.9931294334085597e-05, 'epoch': 0.13} {'loss': 0.5878, 'learning_rate': 1.9931255012019076e-05, 'epoch': 0.13} {'loss': 0.5673, 'learning_rate': 1.993121567874206e-05, 'epoch': 0.13} {'loss': 0.4301, 'learning_rate': 1.993117633425459e-05, 'epoch': 0.13} {'loss': 0.6652, 'learning_rate': 1.993113697855671e-05, 'epoch': 0.13} {'loss': 0.4838, 'learning_rate': 1.9931097611648466e-05, 'epoch': 0.13} {'loss': 0.6661, 'learning_rate': 1.9931058233529902e-05, 'epoch': 0.13} {'loss': 0.5081, 'learning_rate': 1.993101884420106e-05, 'epoch': 0.13} {'loss': 0.6312, 'learning_rate': 1.9930979443661985e-05, 'epoch': 0.13} {'loss': 0.6087, 'learning_rate': 1.9930940031912724e-05, 'epoch': 0.13} {'loss': 0.5383, 'learning_rate': 1.993090060895332e-05, 'epoch': 0.13} {'loss': 0.4893, 'learning_rate': 1.9930861174783818e-05, 'epoch': 0.13} {'loss': 0.5923, 'learning_rate': 1.9930821729404262e-05, 'epoch': 0.13} {'loss': 0.4474, 'learning_rate': 1.9930782272814696e-05, 'epoch': 0.13} {'loss': 0.6293, 'learning_rate': 1.9930742805015167e-05, 'epoch': 0.13} {'loss': 0.4172, 'learning_rate': 1.9930703326005716e-05, 'epoch': 0.13} {'loss': 0.5646, 'learning_rate': 1.993066383578639e-05, 'epoch': 0.13} {'loss': 0.47, 'learning_rate': 1.993062433435723e-05, 'epoch': 0.13} {'loss': 0.5843, 'learning_rate': 1.9930584821718288e-05, 'epoch': 0.13} {'loss': 0.5342, 'learning_rate': 1.9930545297869603e-05, 'epoch': 0.13} {'loss': 0.5782, 'learning_rate': 1.993050576281122e-05, 'epoch': 0.13} {'loss': 0.5921, 'learning_rate': 1.9930466216543186e-05, 'epoch': 0.13} {'loss': 0.5492, 'learning_rate': 1.9930426659065544e-05, 'epoch': 0.13} {'loss': 0.4176, 'learning_rate': 1.9930387090378337e-05, 'epoch': 0.13} {'loss': 0.6044, 'learning_rate': 1.993034751048161e-05, 'epoch': 0.14} {'loss': 0.6163, 'learning_rate': 1.9930307919375413e-05, 'epoch': 0.14} {'loss': 0.5303, 'learning_rate': 1.993026831705978e-05, 'epoch': 0.14} {'loss': 0.4765, 'learning_rate': 1.993022870353477e-05, 'epoch': 0.14} {'loss': 0.5046, 'learning_rate': 1.9930189078800418e-05, 'epoch': 0.14} {'loss': 0.4497, 'learning_rate': 1.9930149442856768e-05, 'epoch': 0.14} {'loss': 0.6774, 'learning_rate': 1.9930109795703867e-05, 'epoch': 0.14} {'loss': 0.4955, 'learning_rate': 1.9930070137341766e-05, 'epoch': 0.14} {'loss': 0.4929, 'learning_rate': 1.99300304677705e-05, 'epoch': 0.14} {'loss': 0.6104, 'learning_rate': 1.9929990786990115e-05, 'epoch': 0.14} {'loss': 0.6343, 'learning_rate': 1.9929951095000667e-05, 'epoch': 0.14} {'loss': 0.4522, 'learning_rate': 1.9929911391802185e-05, 'epoch': 0.14} {'loss': 0.3928, 'learning_rate': 1.9929871677394726e-05, 'epoch': 0.14} {'loss': 0.6434, 'learning_rate': 1.9929831951778327e-05, 'epoch': 0.14} {'loss': 0.6129, 'learning_rate': 1.9929792214953037e-05, 'epoch': 0.14} {'loss': 0.4563, 'learning_rate': 1.99297524669189e-05, 'epoch': 0.14} {'loss': 0.4789, 'learning_rate': 1.9929712707675962e-05, 'epoch': 0.14} {'loss': 0.6393, 'learning_rate': 1.9929672937224263e-05, 'epoch': 0.14} {'loss': 0.4793, 'learning_rate': 1.9929633155563855e-05, 'epoch': 0.14} {'loss': 0.6122, 'learning_rate': 1.9929593362694775e-05, 'epoch': 0.14} {'loss': 0.433, 'learning_rate': 1.9929553558617078e-05, 'epoch': 0.14} {'loss': 0.5856, 'learning_rate': 1.99295137433308e-05, 'epoch': 0.14} {'loss': 0.6733, 'learning_rate': 1.992947391683599e-05, 'epoch': 0.14} {'loss': 0.4728, 'learning_rate': 1.9929434079132693e-05, 'epoch': 0.14} {'loss': 0.401, 'learning_rate': 1.9929394230220953e-05, 'epoch': 0.14} {'loss': 0.5253, 'learning_rate': 1.9929354370100814e-05, 'epoch': 0.14} {'loss': 0.3929, 'learning_rate': 1.992931449877232e-05, 'epoch': 0.14} {'loss': 0.5066, 'learning_rate': 1.9929274616235522e-05, 'epoch': 0.14} {'loss': 0.5327, 'learning_rate': 1.992923472249046e-05, 'epoch': 0.14} {'loss': 0.5466, 'learning_rate': 1.992919481753718e-05, 'epoch': 0.14} {'loss': 0.5445, 'learning_rate': 1.9929154901375725e-05, 'epoch': 0.14} {'loss': 0.3863, 'learning_rate': 1.9929114974006144e-05, 'epoch': 0.14} {'loss': 0.4918, 'learning_rate': 1.992907503542848e-05, 'epoch': 0.14} {'loss': 0.517, 'learning_rate': 1.9929035085642777e-05, 'epoch': 0.14} {'loss': 0.5389, 'learning_rate': 1.9928995124649085e-05, 'epoch': 0.14} {'loss': 0.449, 'learning_rate': 1.9928955152447444e-05, 'epoch': 0.14} {'loss': 0.6345, 'learning_rate': 1.99289151690379e-05, 'epoch': 0.14} {'loss': 0.5525, 'learning_rate': 1.99288751744205e-05, 'epoch': 0.14} {'loss': 0.5014, 'learning_rate': 1.9928835168595285e-05, 'epoch': 0.14} {'loss': 0.3779, 'learning_rate': 1.9928795151562307e-05, 'epoch': 0.14} {'loss': 0.6401, 'learning_rate': 1.9928755123321605e-05, 'epoch': 0.14} {'loss': 0.5769, 'learning_rate': 1.992871508387323e-05, 'epoch': 0.14} {'loss': 0.6841, 'learning_rate': 1.9928675033217216e-05, 'epoch': 0.14} {'loss': 0.5794, 'learning_rate': 1.9928634971353624e-05, 'epoch': 0.14} {'loss': 0.5777, 'learning_rate': 1.9928594898282487e-05, 'epoch': 0.14} {'loss': 0.52, 'learning_rate': 1.9928554814003855e-05, 'epoch': 0.14} {'loss': 0.635, 'learning_rate': 1.9928514718517774e-05, 'epoch': 0.14} {'loss': 0.5023, 'learning_rate': 1.9928474611824288e-05, 'epoch': 0.14} {'loss': 0.5174, 'learning_rate': 1.9928434493923438e-05, 'epoch': 0.14} {'loss': 0.5158, 'learning_rate': 1.9928394364815275e-05, 'epoch': 0.14} {'loss': 0.4846, 'learning_rate': 1.9928354224499846e-05, 'epoch': 0.14} {'loss': 0.4356, 'learning_rate': 1.992831407297719e-05, 'epoch': 0.14} {'loss': 0.499, 'learning_rate': 1.9928273910247358e-05, 'epoch': 0.14} {'loss': 0.5998, 'learning_rate': 1.9928233736310393e-05, 'epoch': 0.14} {'loss': 0.4753, 'learning_rate': 1.9928193551166335e-05, 'epoch': 0.14} {'loss': 0.6648, 'learning_rate': 1.992815335481524e-05, 'epoch': 0.14} {'loss': 0.5179, 'learning_rate': 1.9928113147257144e-05, 'epoch': 0.14} {'loss': 0.7185, 'learning_rate': 1.99280729284921e-05, 'epoch': 0.14} {'loss': 0.5972, 'learning_rate': 1.9928032698520147e-05, 'epoch': 0.14} {'loss': 0.6643, 'learning_rate': 1.992799245734133e-05, 'epoch': 0.14} {'loss': 0.6166, 'learning_rate': 1.99279522049557e-05, 'epoch': 0.14} {'loss': 0.503, 'learning_rate': 1.9927911941363303e-05, 'epoch': 0.14} {'loss': 0.5031, 'learning_rate': 1.992787166656418e-05, 'epoch': 0.14} {'loss': 0.7422, 'learning_rate': 1.9927831380558375e-05, 'epoch': 0.14} {'loss': 0.5607, 'learning_rate': 1.9927791083345936e-05, 'epoch': 0.14} {'loss': 0.4193, 'learning_rate': 1.9927750774926912e-05, 'epoch': 0.14} {'loss': 0.4866, 'learning_rate': 1.9927710455301344e-05, 'epoch': 0.14} {'loss': 0.625, 'learning_rate': 1.992767012446928e-05, 'epoch': 0.14} {'loss': 0.4035, 'learning_rate': 1.992762978243076e-05, 'epoch': 0.14} {'loss': 0.526, 'learning_rate': 1.9927589429185837e-05, 'epoch': 0.14} {'loss': 0.7395, 'learning_rate': 1.9927549064734553e-05, 'epoch': 0.14} {'loss': 0.612, 'learning_rate': 1.9927508689076953e-05, 'epoch': 0.14} {'loss': 0.6592, 'learning_rate': 1.9927468302213083e-05, 'epoch': 0.14} {'loss': 0.4363, 'learning_rate': 1.9927427904142994e-05, 'epoch': 0.14} {'loss': 0.5745, 'learning_rate': 1.992738749486672e-05, 'epoch': 0.14} {'loss': 0.4945, 'learning_rate': 1.9927347074384316e-05, 'epoch': 0.14} {'loss': 0.5625, 'learning_rate': 1.9927306642695825e-05, 'epoch': 0.14} {'loss': 0.5226, 'learning_rate': 1.9927266199801295e-05, 'epoch': 0.14} {'loss': 0.5336, 'learning_rate': 1.9927225745700766e-05, 'epoch': 0.14} {'loss': 0.428, 'learning_rate': 1.992718528039429e-05, 'epoch': 0.14} {'loss': 0.5504, 'learning_rate': 1.9927144803881905e-05, 'epoch': 0.14} {'loss': 0.4116, 'learning_rate': 1.9927104316163662e-05, 'epoch': 0.14} {'loss': 0.3503, 'learning_rate': 1.992706381723961e-05, 'epoch': 0.14} {'loss': 0.5844, 'learning_rate': 1.9927023307109786e-05, 'epoch': 0.14} {'loss': 0.4022, 'learning_rate': 1.9926982785774245e-05, 'epoch': 0.14} {'loss': 0.4919, 'learning_rate': 1.9926942253233024e-05, 'epoch': 0.14} {'loss': 0.6664, 'learning_rate': 1.9926901709486177e-05, 'epoch': 0.14} {'loss': 0.3093, 'learning_rate': 1.9926861154533742e-05, 'epoch': 0.14} {'loss': 0.6385, 'learning_rate': 1.9926820588375772e-05, 'epoch': 0.14} {'loss': 0.5553, 'learning_rate': 1.9926780011012305e-05, 'epoch': 0.14} {'loss': 0.6421, 'learning_rate': 1.9926739422443395e-05, 'epoch': 0.14} {'loss': 0.4503, 'learning_rate': 1.992669882266908e-05, 'epoch': 0.14} {'loss': 0.4639, 'learning_rate': 1.9926658211689412e-05, 'epoch': 0.14} {'loss': 0.4587, 'learning_rate': 1.9926617589504434e-05, 'epoch': 0.14} {'loss': 0.4228, 'learning_rate': 1.9926576956114193e-05, 'epoch': 0.14} {'loss': 0.5074, 'learning_rate': 1.9926536311518733e-05, 'epoch': 0.14} {'loss': 0.6537, 'learning_rate': 1.99264956557181e-05, 'epoch': 0.14} {'loss': 0.4189, 'learning_rate': 1.9926454988712344e-05, 'epoch': 0.14} {'loss': 0.5953, 'learning_rate': 1.9926414310501507e-05, 'epoch': 0.14} {'loss': 0.6987, 'learning_rate': 1.9926373621085634e-05, 'epoch': 0.14} {'loss': 0.6264, 'learning_rate': 1.9926332920464778e-05, 'epoch': 0.14} {'loss': 0.4228, 'learning_rate': 1.9926292208638974e-05, 'epoch': 0.14} {'loss': 0.604, 'learning_rate': 1.9926251485608277e-05, 'epoch': 0.14} {'loss': 0.6007, 'learning_rate': 1.992621075137273e-05, 'epoch': 0.14} {'loss': 0.5719, 'learning_rate': 1.992617000593238e-05, 'epoch': 0.14} {'loss': 0.594, 'learning_rate': 1.9926129249287266e-05, 'epoch': 0.14} {'loss': 0.5291, 'learning_rate': 1.992608848143744e-05, 'epoch': 0.14} {'loss': 0.4559, 'learning_rate': 1.9926047702382953e-05, 'epoch': 0.14} {'loss': 0.5555, 'learning_rate': 1.992600691212384e-05, 'epoch': 0.14} {'loss': 0.5093, 'learning_rate': 1.9925966110660154e-05, 'epoch': 0.14} {'loss': 0.6079, 'learning_rate': 1.992592529799194e-05, 'epoch': 0.14} {'loss': 0.5388, 'learning_rate': 1.9925884474119246e-05, 'epoch': 0.14} {'loss': 0.5308, 'learning_rate': 1.9925843639042116e-05, 'epoch': 0.14} {'loss': 0.5346, 'learning_rate': 1.9925802792760596e-05, 'epoch': 0.14} {'loss': 0.5177, 'learning_rate': 1.992576193527473e-05, 'epoch': 0.14} {'loss': 0.3999, 'learning_rate': 1.9925721066584568e-05, 'epoch': 0.14} {'loss': 0.5556, 'learning_rate': 1.9925680186690154e-05, 'epoch': 0.14} {'loss': 0.5368, 'learning_rate': 1.992563929559153e-05, 'epoch': 0.14} {'loss': 0.5173, 'learning_rate': 1.9925598393288753e-05, 'epoch': 0.14} {'loss': 0.624, 'learning_rate': 1.992555747978186e-05, 'epoch': 0.14} {'loss': 0.5383, 'learning_rate': 1.9925516555070904e-05, 'epoch': 0.14} {'loss': 0.4576, 'learning_rate': 1.992547561915592e-05, 'epoch': 0.14} {'loss': 0.5305, 'learning_rate': 1.9925434672036967e-05, 'epoch': 0.14} {'loss': 0.5342, 'learning_rate': 1.9925393713714083e-05, 'epoch': 0.14} {'loss': 0.7498, 'learning_rate': 1.9925352744187317e-05, 'epoch': 0.14} {'loss': 0.5536, 'learning_rate': 1.992531176345672e-05, 'epoch': 0.14} {'loss': 0.5392, 'learning_rate': 1.9925270771522327e-05, 'epoch': 0.14} {'loss': 0.5187, 'learning_rate': 1.9925229768384193e-05, 'epoch': 0.14} {'loss': 0.5222, 'learning_rate': 1.9925188754042364e-05, 'epoch': 0.14} {'loss': 0.7273, 'learning_rate': 1.9925147728496882e-05, 'epoch': 0.14} {'loss': 0.6415, 'learning_rate': 1.9925106691747796e-05, 'epoch': 0.14} {'loss': 0.4857, 'learning_rate': 1.9925065643795148e-05, 'epoch': 0.14} {'loss': 0.6243, 'learning_rate': 1.9925024584638995e-05, 'epoch': 0.14} {'loss': 0.6791, 'learning_rate': 1.9924983514279374e-05, 'epoch': 0.14} {'loss': 0.4722, 'learning_rate': 1.9924942432716333e-05, 'epoch': 0.14} {'loss': 0.5511, 'learning_rate': 1.992490133994992e-05, 'epoch': 0.14} {'loss': 0.4811, 'learning_rate': 1.9924860235980178e-05, 'epoch': 0.14} {'loss': 0.5282, 'learning_rate': 1.992481912080716e-05, 'epoch': 0.14} {'loss': 0.627, 'learning_rate': 1.9924777994430907e-05, 'epoch': 0.14} {'loss': 0.6172, 'learning_rate': 1.992473685685147e-05, 'epoch': 0.14} {'loss': 0.5731, 'learning_rate': 1.992469570806889e-05, 'epoch': 0.14} {'loss': 0.512, 'learning_rate': 1.9924654548083212e-05, 'epoch': 0.14} {'loss': 0.4839, 'learning_rate': 1.992461337689449e-05, 'epoch': 0.14} {'loss': 0.409, 'learning_rate': 1.992457219450277e-05, 'epoch': 0.14} {'loss': 0.5006, 'learning_rate': 1.992453100090809e-05, 'epoch': 0.14} {'loss': 0.6088, 'learning_rate': 1.99244897961105e-05, 'epoch': 0.14} {'loss': 0.6749, 'learning_rate': 1.9924448580110053e-05, 'epoch': 0.14} {'loss': 0.4904, 'learning_rate': 1.992440735290679e-05, 'epoch': 0.14} {'loss': 0.5997, 'learning_rate': 1.9924366114500757e-05, 'epoch': 0.14} {'loss': 0.4468, 'learning_rate': 1.9924324864892e-05, 'epoch': 0.14} {'loss': 0.5461, 'learning_rate': 1.9924283604080573e-05, 'epoch': 0.14} {'loss': 0.45, 'learning_rate': 1.9924242332066514e-05, 'epoch': 0.14} {'loss': 0.587, 'learning_rate': 1.992420104884987e-05, 'epoch': 0.14} {'loss': 0.5755, 'learning_rate': 1.9924159754430693e-05, 'epoch': 0.14} {'loss': 0.4264, 'learning_rate': 1.992411844880903e-05, 'epoch': 0.14} {'loss': 0.5001, 'learning_rate': 1.992407713198492e-05, 'epoch': 0.14} {'loss': 0.637, 'learning_rate': 1.992403580395841e-05, 'epoch': 0.14} {'loss': 0.5688, 'learning_rate': 1.9923994464729558e-05, 'epoch': 0.14} {'loss': 0.5277, 'learning_rate': 1.99239531142984e-05, 'epoch': 0.14} {'loss': 0.4117, 'learning_rate': 1.9923911752664987e-05, 'epoch': 0.14} {'loss': 0.4675, 'learning_rate': 1.992387037982937e-05, 'epoch': 0.14} {'loss': 0.4769, 'learning_rate': 1.992382899579158e-05, 'epoch': 0.14} {'loss': 0.5943, 'learning_rate': 1.9923787600551684e-05, 'epoch': 0.14} {'loss': 0.4699, 'learning_rate': 1.9923746194109712e-05, 'epoch': 0.14} {'loss': 0.6622, 'learning_rate': 1.992370477646572e-05, 'epoch': 0.14} {'loss': 0.555, 'learning_rate': 1.9923663347619752e-05, 'epoch': 0.14} {'loss': 0.5345, 'learning_rate': 1.9923621907571857e-05, 'epoch': 0.14} {'loss': 0.6465, 'learning_rate': 1.992358045632208e-05, 'epoch': 0.14} {'loss': 0.6275, 'learning_rate': 1.9923538993870463e-05, 'epoch': 0.14} {'loss': 0.5026, 'learning_rate': 1.9923497520217063e-05, 'epoch': 0.14} {'loss': 0.3927, 'learning_rate': 1.9923456035361917e-05, 'epoch': 0.14} {'loss': 0.4797, 'learning_rate': 1.992341453930508e-05, 'epoch': 0.14} {'loss': 0.5705, 'learning_rate': 1.9923373032046593e-05, 'epoch': 0.14} {'loss': 0.6787, 'learning_rate': 1.9923331513586506e-05, 'epoch': 0.14} {'loss': 0.4341, 'learning_rate': 1.9923289983924862e-05, 'epoch': 0.14} {'loss': 0.6194, 'learning_rate': 1.9923248443061712e-05, 'epoch': 0.14} {'loss': 0.5579, 'learning_rate': 1.9923206890997104e-05, 'epoch': 0.14} {'loss': 0.6288, 'learning_rate': 1.9923165327731078e-05, 'epoch': 0.14} {'loss': 0.583, 'learning_rate': 1.9923123753263688e-05, 'epoch': 0.14} {'loss': 0.5377, 'learning_rate': 1.992308216759498e-05, 'epoch': 0.14} {'loss': 0.6697, 'learning_rate': 1.9923040570724998e-05, 'epoch': 0.14} {'loss': 0.4114, 'learning_rate': 1.9922998962653785e-05, 'epoch': 0.14} {'loss': 0.5187, 'learning_rate': 1.9922957343381398e-05, 'epoch': 0.14} {'loss': 0.4268, 'learning_rate': 1.992291571290788e-05, 'epoch': 0.14} {'loss': 0.5321, 'learning_rate': 1.9922874071233276e-05, 'epoch': 0.14} {'loss': 0.4842, 'learning_rate': 1.9922832418357632e-05, 'epoch': 0.14} {'loss': 0.5638, 'learning_rate': 1.9922790754280997e-05, 'epoch': 0.14} {'loss': 0.5317, 'learning_rate': 1.9922749079003423e-05, 'epoch': 0.14} {'loss': 0.6323, 'learning_rate': 1.9922707392524948e-05, 'epoch': 0.14} {'loss': 0.4403, 'learning_rate': 1.9922665694845625e-05, 'epoch': 0.14} {'loss': 0.6598, 'learning_rate': 1.9922623985965498e-05, 'epoch': 0.14} {'loss': 0.6376, 'learning_rate': 1.9922582265884617e-05, 'epoch': 0.14} {'loss': 0.5057, 'learning_rate': 1.9922540534603026e-05, 'epoch': 0.14} {'loss': 0.4337, 'learning_rate': 1.9922498792120776e-05, 'epoch': 0.14} {'loss': 0.6437, 'learning_rate': 1.9922457038437908e-05, 'epoch': 0.14} {'loss': 0.5785, 'learning_rate': 1.9922415273554473e-05, 'epoch': 0.14} {'loss': 0.4719, 'learning_rate': 1.992237349747052e-05, 'epoch': 0.14} {'loss': 0.4879, 'learning_rate': 1.9922331710186096e-05, 'epoch': 0.14} {'loss': 0.478, 'learning_rate': 1.9922289911701244e-05, 'epoch': 0.14} {'loss': 0.4665, 'learning_rate': 1.9922248102016013e-05, 'epoch': 0.14} {'loss': 0.5312, 'learning_rate': 1.9922206281130452e-05, 'epoch': 0.14} {'loss': 0.686, 'learning_rate': 1.9922164449044605e-05, 'epoch': 0.14} {'loss': 0.5051, 'learning_rate': 1.9922122605758523e-05, 'epoch': 0.14} {'loss': 0.6838, 'learning_rate': 1.992208075127225e-05, 'epoch': 0.14} {'loss': 0.6479, 'learning_rate': 1.9922038885585835e-05, 'epoch': 0.14} {'loss': 0.676, 'learning_rate': 1.992199700869933e-05, 'epoch': 0.14} {'loss': 0.4796, 'learning_rate': 1.992195512061277e-05, 'epoch': 0.14} {'loss': 0.58, 'learning_rate': 1.992191322132621e-05, 'epoch': 0.14} {'loss': 0.5331, 'learning_rate': 1.99218713108397e-05, 'epoch': 0.14} {'loss': 0.4783, 'learning_rate': 1.992182938915328e-05, 'epoch': 0.14} {'loss': 0.4829, 'learning_rate': 1.9921787456267007e-05, 'epoch': 0.14} {'loss': 0.4756, 'learning_rate': 1.9921745512180917e-05, 'epoch': 0.14} {'loss': 0.4708, 'learning_rate': 1.9921703556895066e-05, 'epoch': 0.14} {'loss': 0.5616, 'learning_rate': 1.99216615904095e-05, 'epoch': 0.14} {'loss': 0.3837, 'learning_rate': 1.9921619612724262e-05, 'epoch': 0.14} {'loss': 0.5244, 'learning_rate': 1.99215776238394e-05, 'epoch': 0.14} {'loss': 0.3908, 'learning_rate': 1.9921535623754965e-05, 'epoch': 0.14} {'loss': 0.6201, 'learning_rate': 1.9921493612471008e-05, 'epoch': 0.14} {'loss': 0.592, 'learning_rate': 1.9921451589987567e-05, 'epoch': 0.14} {'loss': 0.5722, 'learning_rate': 1.9921409556304694e-05, 'epoch': 0.14} {'loss': 0.5984, 'learning_rate': 1.9921367511422436e-05, 'epoch': 0.14} {'loss': 0.5219, 'learning_rate': 1.992132545534084e-05, 'epoch': 0.14} {'loss': 0.5682, 'learning_rate': 1.9921283388059958e-05, 'epoch': 0.14} {'loss': 0.4088, 'learning_rate': 1.992124130957983e-05, 'epoch': 0.14} {'loss': 0.5764, 'learning_rate': 1.992119921990051e-05, 'epoch': 0.14} {'loss': 0.542, 'learning_rate': 1.992115711902204e-05, 'epoch': 0.14} {'loss': 0.4337, 'learning_rate': 1.992111500694447e-05, 'epoch': 0.14} {'loss': 0.423, 'learning_rate': 1.9921072883667852e-05, 'epoch': 0.14} {'loss': 0.5142, 'learning_rate': 1.9921030749192226e-05, 'epoch': 0.14} {'loss': 0.6304, 'learning_rate': 1.992098860351764e-05, 'epoch': 0.14} {'loss': 0.7322, 'learning_rate': 1.9920946446644153e-05, 'epoch': 0.14} {'loss': 0.5973, 'learning_rate': 1.9920904278571794e-05, 'epoch': 0.14} {'loss': 0.6316, 'learning_rate': 1.9920862099300627e-05, 'epoch': 0.14} {'loss': 0.5601, 'learning_rate': 1.9920819908830692e-05, 'epoch': 0.14} {'loss': 0.6303, 'learning_rate': 1.9920777707162035e-05, 'epoch': 0.14} {'loss': 0.4184, 'learning_rate': 1.992073549429471e-05, 'epoch': 0.14} {'loss': 0.6295, 'learning_rate': 1.992069327022876e-05, 'epoch': 0.14} {'loss': 0.6523, 'learning_rate': 1.9920651034964232e-05, 'epoch': 0.14} {'loss': 0.6294, 'learning_rate': 1.992060878850118e-05, 'epoch': 0.14} {'loss': 0.5701, 'learning_rate': 1.9920566530839645e-05, 'epoch': 0.14} {'loss': 0.4599, 'learning_rate': 1.9920524261979673e-05, 'epoch': 0.14} {'loss': 0.507, 'learning_rate': 1.9920481981921323e-05, 'epoch': 0.14} {'loss': 0.6487, 'learning_rate': 1.992043969066463e-05, 'epoch': 0.14} {'loss': 0.5394, 'learning_rate': 1.992039738820965e-05, 'epoch': 0.14} {'loss': 0.4042, 'learning_rate': 1.9920355074556423e-05, 'epoch': 0.14} {'loss': 0.4719, 'learning_rate': 1.9920312749705005e-05, 'epoch': 0.14} {'loss': 0.656, 'learning_rate': 1.992027041365544e-05, 'epoch': 0.14} {'loss': 0.4678, 'learning_rate': 1.9920228066407775e-05, 'epoch': 0.14} {'loss': 0.7609, 'learning_rate': 1.9920185707962062e-05, 'epoch': 0.14} {'loss': 0.6065, 'learning_rate': 1.9920143338318342e-05, 'epoch': 0.14} {'loss': 0.4366, 'learning_rate': 1.9920100957476668e-05, 'epoch': 0.14} {'loss': 0.6031, 'learning_rate': 1.992005856543709e-05, 'epoch': 0.14} {'loss': 0.4366, 'learning_rate': 1.9920016162199646e-05, 'epoch': 0.14} {'loss': 0.6011, 'learning_rate': 1.9919973747764394e-05, 'epoch': 0.14} {'loss': 0.4598, 'learning_rate': 1.9919931322131377e-05, 'epoch': 0.14} {'loss': 0.5417, 'learning_rate': 1.9919888885300645e-05, 'epoch': 0.14} {'loss': 0.4503, 'learning_rate': 1.9919846437272242e-05, 'epoch': 0.14} {'loss': 0.6264, 'learning_rate': 1.991980397804622e-05, 'epoch': 0.14} {'loss': 0.7745, 'learning_rate': 1.991976150762263e-05, 'epoch': 0.14} {'loss': 0.5349, 'learning_rate': 1.9919719026001513e-05, 'epoch': 0.14} {'loss': 0.5332, 'learning_rate': 1.9919676533182913e-05, 'epoch': 0.14} {'loss': 0.6453, 'learning_rate': 1.9919634029166893e-05, 'epoch': 0.14} {'loss': 0.7056, 'learning_rate': 1.991959151395349e-05, 'epoch': 0.14} {'loss': 0.5227, 'learning_rate': 1.9919548987542753e-05, 'epoch': 0.14} {'loss': 0.5313, 'learning_rate': 1.991950644993473e-05, 'epoch': 0.14} {'loss': 0.5331, 'learning_rate': 1.9919463901129476e-05, 'epoch': 0.14} {'loss': 0.5057, 'learning_rate': 1.9919421341127027e-05, 'epoch': 0.14} {'loss': 0.4588, 'learning_rate': 1.9919378769927444e-05, 'epoch': 0.14} {'loss': 0.3833, 'learning_rate': 1.9919336187530763e-05, 'epoch': 0.14} {'loss': 0.4654, 'learning_rate': 1.991929359393704e-05, 'epoch': 0.14} {'loss': 0.6685, 'learning_rate': 1.9919250989146323e-05, 'epoch': 0.14} {'loss': 0.6315, 'learning_rate': 1.9919208373158656e-05, 'epoch': 0.14} {'loss': 0.6482, 'learning_rate': 1.9919165745974088e-05, 'epoch': 0.14} {'loss': 0.5482, 'learning_rate': 1.991912310759267e-05, 'epoch': 0.14} {'loss': 0.4719, 'learning_rate': 1.9919080458014447e-05, 'epoch': 0.14} {'loss': 0.5525, 'learning_rate': 1.9919037797239466e-05, 'epoch': 0.14} {'loss': 0.6373, 'learning_rate': 1.991899512526778e-05, 'epoch': 0.14} {'loss': 0.4901, 'learning_rate': 1.9918952442099433e-05, 'epoch': 0.14} {'loss': 0.7071, 'learning_rate': 1.991890974773448e-05, 'epoch': 0.14} {'loss': 0.6225, 'learning_rate': 1.991886704217296e-05, 'epoch': 0.14} {'loss': 0.663, 'learning_rate': 1.9918824325414926e-05, 'epoch': 0.14} {'loss': 0.518, 'learning_rate': 1.9918781597460427e-05, 'epoch': 0.14} {'loss': 0.5406, 'learning_rate': 1.9918738858309504e-05, 'epoch': 0.14} {'loss': 0.6127, 'learning_rate': 1.9918696107962215e-05, 'epoch': 0.14} {'loss': 0.467, 'learning_rate': 1.9918653346418607e-05, 'epoch': 0.14} {'loss': 0.5468, 'learning_rate': 1.9918610573678722e-05, 'epoch': 0.14} {'loss': 0.5326, 'learning_rate': 1.9918567789742613e-05, 'epoch': 0.14} {'loss': 0.5319, 'learning_rate': 1.991852499461033e-05, 'epoch': 0.14} {'loss': 0.589, 'learning_rate': 1.9918482188281912e-05, 'epoch': 0.14} {'loss': 0.6766, 'learning_rate': 1.9918439370757416e-05, 'epoch': 0.14} {'loss': 0.6254, 'learning_rate': 1.991839654203689e-05, 'epoch': 0.14} {'loss': 0.484, 'learning_rate': 1.991835370212038e-05, 'epoch': 0.14} {'loss': 0.6394, 'learning_rate': 1.991831085100793e-05, 'epoch': 0.14} {'loss': 0.513, 'learning_rate': 1.99182679886996e-05, 'epoch': 0.14} {'loss': 0.5635, 'learning_rate': 1.9918225115195427e-05, 'epoch': 0.14} {'loss': 0.5208, 'learning_rate': 1.9918182230495465e-05, 'epoch': 0.14} {'loss': 0.3507, 'learning_rate': 1.991813933459976e-05, 'epoch': 0.14} {'loss': 0.4613, 'learning_rate': 1.9918096427508368e-05, 'epoch': 0.14} {'loss': 0.4163, 'learning_rate': 1.9918053509221324e-05, 'epoch': 0.14} {'loss': 0.5697, 'learning_rate': 1.9918010579738686e-05, 'epoch': 0.14} {'loss': 0.5927, 'learning_rate': 1.99179676390605e-05, 'epoch': 0.14} {'loss': 0.4907, 'learning_rate': 1.9917924687186815e-05, 'epoch': 0.14} {'loss': 0.5047, 'learning_rate': 1.9917881724117678e-05, 'epoch': 0.14} {'loss': 0.4414, 'learning_rate': 1.991783874985314e-05, 'epoch': 0.14} {'loss': 0.7606, 'learning_rate': 1.9917795764393246e-05, 'epoch': 0.14} {'loss': 0.7128, 'learning_rate': 1.991775276773805e-05, 'epoch': 0.14} {'loss': 0.4835, 'learning_rate': 1.9917709759887594e-05, 'epoch': 0.14} {'loss': 0.5639, 'learning_rate': 1.991766674084193e-05, 'epoch': 0.14} {'loss': 0.6328, 'learning_rate': 1.9917623710601107e-05, 'epoch': 0.14} {'loss': 0.4102, 'learning_rate': 1.9917580669165172e-05, 'epoch': 0.14} {'loss': 0.3651, 'learning_rate': 1.9917537616534176e-05, 'epoch': 0.14} {'loss': 0.3756, 'learning_rate': 1.9917494552708162e-05, 'epoch': 0.14} {'loss': 0.6116, 'learning_rate': 1.9917451477687188e-05, 'epoch': 0.14} {'loss': 0.6039, 'learning_rate': 1.9917408391471295e-05, 'epoch': 0.14} {'loss': 0.5659, 'learning_rate': 1.991736529406053e-05, 'epoch': 0.14} {'loss': 0.5976, 'learning_rate': 1.991732218545495e-05, 'epoch': 0.14} {'loss': 0.5305, 'learning_rate': 1.9917279065654597e-05, 'epoch': 0.14} {'loss': 0.5134, 'learning_rate': 1.991723593465952e-05, 'epoch': 0.14} {'loss': 0.6032, 'learning_rate': 1.9917192792469776e-05, 'epoch': 0.14} {'loss': 0.4679, 'learning_rate': 1.9917149639085403e-05, 'epoch': 0.14} {'loss': 0.6096, 'learning_rate': 1.991710647450645e-05, 'epoch': 0.14} {'loss': 0.4897, 'learning_rate': 1.9917063298732974e-05, 'epoch': 0.14} {'loss': 0.5115, 'learning_rate': 1.9917020111765022e-05, 'epoch': 0.14} {'loss': 0.7078, 'learning_rate': 1.9916976913602636e-05, 'epoch': 0.14} {'loss': 0.6551, 'learning_rate': 1.991693370424587e-05, 'epoch': 0.14} {'loss': 0.5939, 'learning_rate': 1.991689048369477e-05, 'epoch': 0.14} {'loss': 0.7026, 'learning_rate': 1.991684725194939e-05, 'epoch': 0.14} {'loss': 0.685, 'learning_rate': 1.991680400900977e-05, 'epoch': 0.14} {'loss': 0.5236, 'learning_rate': 1.991676075487597e-05, 'epoch': 0.14} {'loss': 0.6186, 'learning_rate': 1.991671748954803e-05, 'epoch': 0.14} {'loss': 0.501, 'learning_rate': 1.9916674213026002e-05, 'epoch': 0.14} {'loss': 0.4003, 'learning_rate': 1.9916630925309936e-05, 'epoch': 0.14} {'loss': 0.5945, 'learning_rate': 1.9916587626399875e-05, 'epoch': 0.14} {'loss': 0.4857, 'learning_rate': 1.9916544316295877e-05, 'epoch': 0.14} {'loss': 0.5647, 'learning_rate': 1.9916500994997983e-05, 'epoch': 0.14} {'loss': 0.6571, 'learning_rate': 1.9916457662506244e-05, 'epoch': 0.14} {'loss': 0.5945, 'learning_rate': 1.9916414318820717e-05, 'epoch': 0.14} {'loss': 0.4857, 'learning_rate': 1.9916370963941437e-05, 'epoch': 0.14} {'loss': 0.5025, 'learning_rate': 1.991632759786846e-05, 'epoch': 0.14} {'loss': 0.4902, 'learning_rate': 1.991628422060184e-05, 'epoch': 0.14} {'loss': 0.5576, 'learning_rate': 1.9916240832141617e-05, 'epoch': 0.14} {'loss': 0.3947, 'learning_rate': 1.9916197432487846e-05, 'epoch': 0.14} {'loss': 0.6171, 'learning_rate': 1.9916154021640572e-05, 'epoch': 0.14} {'loss': 0.4194, 'learning_rate': 1.9916110599599846e-05, 'epoch': 0.14} {'loss': 0.598, 'learning_rate': 1.9916067166365714e-05, 'epoch': 0.14} {'loss': 0.5613, 'learning_rate': 1.9916023721938233e-05, 'epoch': 0.14} {'loss': 0.473, 'learning_rate': 1.9915980266317444e-05, 'epoch': 0.14} {'loss': 0.4354, 'learning_rate': 1.99159367995034e-05, 'epoch': 0.14} {'loss': 0.4373, 'learning_rate': 1.991589332149615e-05, 'epoch': 0.14} {'loss': 0.5245, 'learning_rate': 1.991584983229574e-05, 'epoch': 0.14} {'loss': 0.4576, 'learning_rate': 1.991580633190222e-05, 'epoch': 0.14} {'loss': 0.5341, 'learning_rate': 1.9915762820315644e-05, 'epoch': 0.14} {'loss': 0.6849, 'learning_rate': 1.9915719297536052e-05, 'epoch': 0.14} {'loss': 0.6727, 'learning_rate': 1.9915675763563503e-05, 'epoch': 0.14} {'loss': 0.5916, 'learning_rate': 1.9915632218398037e-05, 'epoch': 0.14} {'loss': 0.6787, 'learning_rate': 1.991558866203971e-05, 'epoch': 0.14} {'loss': 0.6317, 'learning_rate': 1.9915545094488574e-05, 'epoch': 0.14} {'loss': 0.6277, 'learning_rate': 1.9915501515744665e-05, 'epoch': 0.14} {'loss': 0.492, 'learning_rate': 1.9915457925808046e-05, 'epoch': 0.14} {'loss': 0.5301, 'learning_rate': 1.991541432467876e-05, 'epoch': 0.14} {'loss': 0.489, 'learning_rate': 1.9915370712356857e-05, 'epoch': 0.14} {'loss': 0.6039, 'learning_rate': 1.991532708884238e-05, 'epoch': 0.14} {'loss': 0.7083, 'learning_rate': 1.991528345413539e-05, 'epoch': 0.14} {'loss': 0.4457, 'learning_rate': 1.991523980823593e-05, 'epoch': 0.14} {'loss': 0.6155, 'learning_rate': 1.991519615114405e-05, 'epoch': 0.14} {'loss': 0.5111, 'learning_rate': 1.9915152482859796e-05, 'epoch': 0.14} {'loss': 0.5809, 'learning_rate': 1.9915108803383222e-05, 'epoch': 0.14} {'loss': 0.585, 'learning_rate': 1.9915065112714376e-05, 'epoch': 0.14} {'loss': 0.478, 'learning_rate': 1.9915021410853306e-05, 'epoch': 0.14} {'loss': 0.6252, 'learning_rate': 1.9914977697800066e-05, 'epoch': 0.14} {'loss': 0.4893, 'learning_rate': 1.9914933973554697e-05, 'epoch': 0.14} {'loss': 0.5927, 'learning_rate': 1.9914890238117256e-05, 'epoch': 0.14} {'loss': 0.512, 'learning_rate': 1.9914846491487788e-05, 'epoch': 0.14} {'loss': 0.6751, 'learning_rate': 1.9914802733666342e-05, 'epoch': 0.14} {'loss': 0.3989, 'learning_rate': 1.9914758964652972e-05, 'epoch': 0.14} {'loss': 0.5361, 'learning_rate': 1.991471518444772e-05, 'epoch': 0.14} {'loss': 0.5141, 'learning_rate': 1.9914671393050645e-05, 'epoch': 0.14} {'loss': 0.4959, 'learning_rate': 1.9914627590461786e-05, 'epoch': 0.14} {'loss': 0.5361, 'learning_rate': 1.9914583776681204e-05, 'epoch': 0.14} {'loss': 0.5603, 'learning_rate': 1.991453995170894e-05, 'epoch': 0.14} {'loss': 0.5953, 'learning_rate': 1.9914496115545045e-05, 'epoch': 0.14} {'loss': 0.4294, 'learning_rate': 1.9914452268189567e-05, 'epoch': 0.14} {'loss': 0.5823, 'learning_rate': 1.9914408409642564e-05, 'epoch': 0.14} {'loss': 0.3571, 'learning_rate': 1.9914364539904074e-05, 'epoch': 0.14} {'loss': 0.5134, 'learning_rate': 1.991432065897415e-05, 'epoch': 0.14} {'loss': 0.718, 'learning_rate': 1.991427676685285e-05, 'epoch': 0.14} {'loss': 0.5546, 'learning_rate': 1.9914232863540214e-05, 'epoch': 0.14} {'loss': 0.4815, 'learning_rate': 1.991418894903629e-05, 'epoch': 0.14} {'loss': 0.5823, 'learning_rate': 1.9914145023341137e-05, 'epoch': 0.14} {'loss': 0.6729, 'learning_rate': 1.99141010864548e-05, 'epoch': 0.14} {'loss': 0.4703, 'learning_rate': 1.9914057138377325e-05, 'epoch': 0.14} {'loss': 0.509, 'learning_rate': 1.9914013179108767e-05, 'epoch': 0.14} {'loss': 0.4776, 'learning_rate': 1.991396920864917e-05, 'epoch': 0.14} {'loss': 0.6674, 'learning_rate': 1.991392522699859e-05, 'epoch': 0.14} {'loss': 0.6779, 'learning_rate': 1.991388123415707e-05, 'epoch': 0.14} {'loss': 0.4941, 'learning_rate': 1.991383723012467e-05, 'epoch': 0.14} {'loss': 0.6299, 'learning_rate': 1.991379321490143e-05, 'epoch': 0.14} {'loss': 0.502, 'learning_rate': 1.99137491884874e-05, 'epoch': 0.14} {'loss': 0.5309, 'learning_rate': 1.9913705150882635e-05, 'epoch': 0.14} {'loss': 0.5822, 'learning_rate': 1.991366110208718e-05, 'epoch': 0.14} {'loss': 0.7002, 'learning_rate': 1.9913617042101087e-05, 'epoch': 0.14} {'loss': 0.4379, 'learning_rate': 1.991357297092441e-05, 'epoch': 0.14} {'loss': 0.5731, 'learning_rate': 1.991352888855719e-05, 'epoch': 0.14} {'loss': 0.5212, 'learning_rate': 1.991348479499948e-05, 'epoch': 0.14} {'loss': 0.4511, 'learning_rate': 1.991344069025133e-05, 'epoch': 0.14} {'loss': 0.5148, 'learning_rate': 1.9913396574312794e-05, 'epoch': 0.14} {'loss': 0.5505, 'learning_rate': 1.991335244718392e-05, 'epoch': 0.14} {'loss': 0.5059, 'learning_rate': 1.9913308308864753e-05, 'epoch': 0.14} {'loss': 0.5179, 'learning_rate': 1.9913264159355347e-05, 'epoch': 0.14} {'loss': 0.558, 'learning_rate': 1.991321999865575e-05, 'epoch': 0.14} {'loss': 0.5117, 'learning_rate': 1.9913175826766013e-05, 'epoch': 0.14} {'loss': 0.437, 'learning_rate': 1.9913131643686187e-05, 'epoch': 0.14} {'loss': 0.5773, 'learning_rate': 1.991308744941632e-05, 'epoch': 0.14} {'loss': 0.4715, 'learning_rate': 1.991304324395646e-05, 'epoch': 0.14} {'loss': 0.6664, 'learning_rate': 1.991299902730666e-05, 'epoch': 0.14} {'loss': 0.4747, 'learning_rate': 1.9912954799466973e-05, 'epoch': 0.14} {'loss': 0.7603, 'learning_rate': 1.991291056043744e-05, 'epoch': 0.14} {'loss': 0.633, 'learning_rate': 1.991286631021812e-05, 'epoch': 0.14} {'loss': 0.5775, 'learning_rate': 1.9912822048809058e-05, 'epoch': 0.14} {'loss': 0.4406, 'learning_rate': 1.99127777762103e-05, 'epoch': 0.14} {'loss': 0.518, 'learning_rate': 1.9912733492421906e-05, 'epoch': 0.14} {'loss': 0.4569, 'learning_rate': 1.9912689197443922e-05, 'epoch': 0.14} {'loss': 0.5692, 'learning_rate': 1.9912644891276392e-05, 'epoch': 0.14} {'loss': 0.622, 'learning_rate': 1.9912600573919377e-05, 'epoch': 0.14} {'loss': 0.5556, 'learning_rate': 1.9912556245372915e-05, 'epoch': 0.14} {'loss': 0.5637, 'learning_rate': 1.9912511905637063e-05, 'epoch': 0.14} {'loss': 0.728, 'learning_rate': 1.9912467554711875e-05, 'epoch': 0.14} {'loss': 0.481, 'learning_rate': 1.9912423192597388e-05, 'epoch': 0.14} {'loss': 0.6933, 'learning_rate': 1.9912378819293668e-05, 'epoch': 0.14} {'loss': 0.5107, 'learning_rate': 1.9912334434800754e-05, 'epoch': 0.14} {'loss': 0.5665, 'learning_rate': 1.9912290039118697e-05, 'epoch': 0.14} {'loss': 0.6027, 'learning_rate': 1.9912245632247552e-05, 'epoch': 0.14} {'loss': 0.6995, 'learning_rate': 1.9912201214187366e-05, 'epoch': 0.14} {'loss': 0.5312, 'learning_rate': 1.991215678493819e-05, 'epoch': 0.14} {'loss': 0.4507, 'learning_rate': 1.9912112344500075e-05, 'epoch': 0.14} {'loss': 0.4634, 'learning_rate': 1.9912067892873068e-05, 'epoch': 0.14} {'loss': 0.4844, 'learning_rate': 1.9912023430057223e-05, 'epoch': 0.14} {'loss': 0.5401, 'learning_rate': 1.9911978956052588e-05, 'epoch': 0.14} {'loss': 0.6812, 'learning_rate': 1.9911934470859213e-05, 'epoch': 0.14} {'loss': 0.4422, 'learning_rate': 1.991188997447715e-05, 'epoch': 0.14} {'loss': 0.5634, 'learning_rate': 1.9911845466906446e-05, 'epoch': 0.14} {'loss': 0.5168, 'learning_rate': 1.9911800948147154e-05, 'epoch': 0.14} {'loss': 0.6522, 'learning_rate': 1.9911756418199327e-05, 'epoch': 0.14} {'loss': 0.5927, 'learning_rate': 1.9911711877063004e-05, 'epoch': 0.14} {'loss': 0.6676, 'learning_rate': 1.991166732473825e-05, 'epoch': 0.14} {'loss': 0.6466, 'learning_rate': 1.9911622761225106e-05, 'epoch': 0.14} {'loss': 0.3959, 'learning_rate': 1.9911578186523625e-05, 'epoch': 0.14} {'loss': 0.4917, 'learning_rate': 1.9911533600633856e-05, 'epoch': 0.14} {'loss': 0.6194, 'learning_rate': 1.9911489003555852e-05, 'epoch': 0.14} {'loss': 0.4718, 'learning_rate': 1.991144439528966e-05, 'epoch': 0.14} {'loss': 0.5181, 'learning_rate': 1.9911399775835333e-05, 'epoch': 0.14} {'loss': 0.567, 'learning_rate': 1.991135514519292e-05, 'epoch': 0.14} {'loss': 0.6675, 'learning_rate': 1.9911310503362472e-05, 'epoch': 0.14} {'loss': 0.6221, 'learning_rate': 1.991126585034404e-05, 'epoch': 0.14} {'loss': 0.6084, 'learning_rate': 1.9911221186137673e-05, 'epoch': 0.14} {'loss': 0.6425, 'learning_rate': 1.9911176510743423e-05, 'epoch': 0.14} {'loss': 0.5068, 'learning_rate': 1.9911131824161334e-05, 'epoch': 0.14} {'loss': 0.531, 'learning_rate': 1.991108712639147e-05, 'epoch': 0.14} {'loss': 0.5285, 'learning_rate': 1.9911042417433867e-05, 'epoch': 0.14} {'loss': 0.6017, 'learning_rate': 1.9910997697288582e-05, 'epoch': 0.14} {'loss': 0.5939, 'learning_rate': 1.991095296595567e-05, 'epoch': 0.14} {'loss': 0.493, 'learning_rate': 1.9910908223435173e-05, 'epoch': 0.14} {'loss': 0.5133, 'learning_rate': 1.9910863469727147e-05, 'epoch': 0.14} {'loss': 0.6691, 'learning_rate': 1.991081870483164e-05, 'epoch': 0.14} {'loss': 0.595, 'learning_rate': 1.9910773928748705e-05, 'epoch': 0.14} {'loss': 0.5567, 'learning_rate': 1.991072914147839e-05, 'epoch': 0.14} {'loss': 0.5566, 'learning_rate': 1.9910684343020742e-05, 'epoch': 0.14} {'loss': 0.4759, 'learning_rate': 1.9910639533375822e-05, 'epoch': 0.14} {'loss': 0.6228, 'learning_rate': 1.991059471254367e-05, 'epoch': 0.14} {'loss': 0.6613, 'learning_rate': 1.9910549880524345e-05, 'epoch': 0.14} {'loss': 0.515, 'learning_rate': 1.9910505037317892e-05, 'epoch': 0.14} {'loss': 0.7127, 'learning_rate': 1.9910460182924364e-05, 'epoch': 0.14} {'loss': 0.5204, 'learning_rate': 1.9910415317343814e-05, 'epoch': 0.14} {'loss': 0.4757, 'learning_rate': 1.9910370440576283e-05, 'epoch': 0.14} {'loss': 0.7337, 'learning_rate': 1.991032555262183e-05, 'epoch': 0.14} {'loss': 0.8213, 'learning_rate': 1.9910280653480508e-05, 'epoch': 0.14} {'loss': 0.5578, 'learning_rate': 1.9910235743152363e-05, 'epoch': 0.14} {'loss': 0.488, 'learning_rate': 1.991019082163744e-05, 'epoch': 0.14} {'loss': 0.5081, 'learning_rate': 1.99101458889358e-05, 'epoch': 0.14} {'loss': 0.5729, 'learning_rate': 1.991010094504749e-05, 'epoch': 0.14} {'loss': 0.6315, 'learning_rate': 1.9910055989972564e-05, 'epoch': 0.14} {'loss': 0.6485, 'learning_rate': 1.9910011023711065e-05, 'epoch': 0.14} {'loss': 0.5225, 'learning_rate': 1.990996604626305e-05, 'epoch': 0.15} {'loss': 0.6495, 'learning_rate': 1.990992105762857e-05, 'epoch': 0.15} {'loss': 0.6345, 'learning_rate': 1.990987605780767e-05, 'epoch': 0.15} {'loss': 0.4833, 'learning_rate': 1.9909831046800402e-05, 'epoch': 0.15} {'loss': 0.506, 'learning_rate': 1.9909786024606824e-05, 'epoch': 0.15} {'loss': 0.5702, 'learning_rate': 1.990974099122698e-05, 'epoch': 0.15} {'loss': 0.4673, 'learning_rate': 1.990969594666092e-05, 'epoch': 0.15} {'loss': 0.5804, 'learning_rate': 1.9909650890908705e-05, 'epoch': 0.15} {'loss': 0.6539, 'learning_rate': 1.990960582397037e-05, 'epoch': 0.15} {'loss': 0.5003, 'learning_rate': 1.9909560745845982e-05, 'epoch': 0.15} {'loss': 0.3956, 'learning_rate': 1.990951565653558e-05, 'epoch': 0.15} {'loss': 0.5494, 'learning_rate': 1.990947055603922e-05, 'epoch': 0.15} {'loss': 0.6551, 'learning_rate': 1.9909425444356955e-05, 'epoch': 0.15} {'loss': 0.6561, 'learning_rate': 1.990938032148883e-05, 'epoch': 0.15} {'loss': 0.532, 'learning_rate': 1.9909335187434898e-05, 'epoch': 0.15} {'loss': 0.6164, 'learning_rate': 1.9909290042195212e-05, 'epoch': 0.15} {'loss': 0.5127, 'learning_rate': 1.9909244885769823e-05, 'epoch': 0.15} {'loss': 0.5236, 'learning_rate': 1.990919971815878e-05, 'epoch': 0.15} {'loss': 0.6728, 'learning_rate': 1.9909154539362134e-05, 'epoch': 0.15} {'loss': 0.5138, 'learning_rate': 1.990910934937994e-05, 'epoch': 0.15} {'loss': 0.5525, 'learning_rate': 1.990906414821224e-05, 'epoch': 0.15} {'loss': 0.5966, 'learning_rate': 1.9909018935859095e-05, 'epoch': 0.15} {'loss': 0.5311, 'learning_rate': 1.9908973712320554e-05, 'epoch': 0.15} {'loss': 0.5578, 'learning_rate': 1.9908928477596663e-05, 'epoch': 0.15} {'loss': 0.468, 'learning_rate': 1.9908883231687474e-05, 'epoch': 0.15} {'loss': 0.4762, 'learning_rate': 1.9908837974593042e-05, 'epoch': 0.15} {'loss': 0.5225, 'learning_rate': 1.990879270631342e-05, 'epoch': 0.15} {'loss': 0.6808, 'learning_rate': 1.990874742684865e-05, 'epoch': 0.15} {'loss': 0.6998, 'learning_rate': 1.9908702136198788e-05, 'epoch': 0.15} {'loss': 0.5772, 'learning_rate': 1.990865683436389e-05, 'epoch': 0.15} {'loss': 0.6457, 'learning_rate': 1.9908611521344e-05, 'epoch': 0.15} {'loss': 0.4584, 'learning_rate': 1.990856619713917e-05, 'epoch': 0.15} {'loss': 0.5282, 'learning_rate': 1.990852086174946e-05, 'epoch': 0.15} {'loss': 0.5333, 'learning_rate': 1.9908475515174908e-05, 'epoch': 0.15} {'loss': 0.4973, 'learning_rate': 1.990843015741557e-05, 'epoch': 0.15} {'loss': 0.4047, 'learning_rate': 1.9908384788471502e-05, 'epoch': 0.15} {'loss': 0.5659, 'learning_rate': 1.9908339408342753e-05, 'epoch': 0.15} {'loss': 0.5867, 'learning_rate': 1.990829401702937e-05, 'epoch': 0.15} {'loss': 0.4724, 'learning_rate': 1.990824861453141e-05, 'epoch': 0.15} {'loss': 0.5119, 'learning_rate': 1.990820320084892e-05, 'epoch': 0.15} {'loss': 0.5721, 'learning_rate': 1.990815777598195e-05, 'epoch': 0.15} {'loss': 0.5867, 'learning_rate': 1.9908112339930557e-05, 'epoch': 0.15} {'loss': 0.5585, 'learning_rate': 1.9908066892694786e-05, 'epoch': 0.15} {'loss': 0.5525, 'learning_rate': 1.9908021434274697e-05, 'epoch': 0.15} {'loss': 0.7218, 'learning_rate': 1.990797596467033e-05, 'epoch': 0.15} {'loss': 0.4233, 'learning_rate': 1.9907930483881745e-05, 'epoch': 0.15} {'loss': 0.4569, 'learning_rate': 1.990788499190899e-05, 'epoch': 0.15} {'loss': 0.55, 'learning_rate': 1.9907839488752118e-05, 'epoch': 0.15} {'loss': 0.4765, 'learning_rate': 1.9907793974411182e-05, 'epoch': 0.15} {'loss': 0.5815, 'learning_rate': 1.990774844888623e-05, 'epoch': 0.15} {'loss': 0.5567, 'learning_rate': 1.990770291217731e-05, 'epoch': 0.15} {'loss': 0.4845, 'learning_rate': 1.9907657364284478e-05, 'epoch': 0.15} {'loss': 0.5929, 'learning_rate': 1.9907611805207784e-05, 'epoch': 0.15} {'loss': 0.4989, 'learning_rate': 1.9907566234947284e-05, 'epoch': 0.15} {'loss': 0.5077, 'learning_rate': 1.9907520653503022e-05, 'epoch': 0.15} {'loss': 0.5066, 'learning_rate': 1.9907475060875055e-05, 'epoch': 0.15} {'loss': 0.4089, 'learning_rate': 1.9907429457063435e-05, 'epoch': 0.15} {'loss': 0.6361, 'learning_rate': 1.9907383842068208e-05, 'epoch': 0.15} {'loss': 0.5323, 'learning_rate': 1.990733821588943e-05, 'epoch': 0.15} {'loss': 0.5643, 'learning_rate': 1.9907292578527152e-05, 'epoch': 0.15} {'loss': 0.5104, 'learning_rate': 1.9907246929981424e-05, 'epoch': 0.15} {'loss': 0.5126, 'learning_rate': 1.9907201270252297e-05, 'epoch': 0.15} {'loss': 0.5283, 'learning_rate': 1.9907155599339824e-05, 'epoch': 0.15} {'loss': 0.4608, 'learning_rate': 1.9907109917244056e-05, 'epoch': 0.15} {'loss': 0.5591, 'learning_rate': 1.9907064223965045e-05, 'epoch': 0.15} {'loss': 0.6731, 'learning_rate': 1.9907018519502844e-05, 'epoch': 0.15} {'loss': 0.5649, 'learning_rate': 1.99069728038575e-05, 'epoch': 0.15} {'loss': 0.5574, 'learning_rate': 1.990692707702907e-05, 'epoch': 0.15} {'loss': 0.3647, 'learning_rate': 1.9906881339017604e-05, 'epoch': 0.15} {'loss': 0.4647, 'learning_rate': 1.990683558982315e-05, 'epoch': 0.15} {'loss': 0.3632, 'learning_rate': 1.9906789829445765e-05, 'epoch': 0.15} {'loss': 0.6032, 'learning_rate': 1.9906744057885494e-05, 'epoch': 0.15} {'loss': 0.5198, 'learning_rate': 1.9906698275142398e-05, 'epoch': 0.15} {'loss': 0.5496, 'learning_rate': 1.9906652481216523e-05, 'epoch': 0.15} {'loss': 0.3464, 'learning_rate': 1.990660667610792e-05, 'epoch': 0.15} {'loss': 0.378, 'learning_rate': 1.990656085981664e-05, 'epoch': 0.15} {'loss': 0.5367, 'learning_rate': 1.9906515032342738e-05, 'epoch': 0.15} {'loss': 0.4984, 'learning_rate': 1.9906469193686262e-05, 'epoch': 0.15} {'loss': 0.7527, 'learning_rate': 1.990642334384727e-05, 'epoch': 0.15} {'loss': 0.5528, 'learning_rate': 1.990637748282581e-05, 'epoch': 0.15} {'loss': 0.4267, 'learning_rate': 1.990633161062193e-05, 'epoch': 0.15} {'loss': 0.5712, 'learning_rate': 1.9906285727235687e-05, 'epoch': 0.15} {'loss': 0.7166, 'learning_rate': 1.9906239832667132e-05, 'epoch': 0.15} {'loss': 0.4898, 'learning_rate': 1.9906193926916316e-05, 'epoch': 0.15} {'loss': 0.5972, 'learning_rate': 1.990614800998329e-05, 'epoch': 0.15} {'loss': 0.5477, 'learning_rate': 1.9906102081868107e-05, 'epoch': 0.15} {'loss': 0.5422, 'learning_rate': 1.990605614257082e-05, 'epoch': 0.15} {'loss': 0.4082, 'learning_rate': 1.9906010192091476e-05, 'epoch': 0.15} {'loss': 0.4603, 'learning_rate': 1.9905964230430133e-05, 'epoch': 0.15} {'loss': 0.454, 'learning_rate': 1.9905918257586837e-05, 'epoch': 0.15} {'loss': 0.4276, 'learning_rate': 1.9905872273561645e-05, 'epoch': 0.15} {'loss': 0.5234, 'learning_rate': 1.9905826278354606e-05, 'epoch': 0.15} {'loss': 0.4659, 'learning_rate': 1.9905780271965773e-05, 'epoch': 0.15} {'loss': 0.592, 'learning_rate': 1.99057342543952e-05, 'epoch': 0.15} {'loss': 0.5552, 'learning_rate': 1.9905688225642935e-05, 'epoch': 0.15} {'loss': 0.4457, 'learning_rate': 1.9905642185709032e-05, 'epoch': 0.15} {'loss': 0.6847, 'learning_rate': 1.9905596134593542e-05, 'epoch': 0.15} {'loss': 0.6372, 'learning_rate': 1.9905550072296516e-05, 'epoch': 0.15} {'loss': 0.6559, 'learning_rate': 1.990550399881801e-05, 'epoch': 0.15} {'loss': 0.4563, 'learning_rate': 1.9905457914158076e-05, 'epoch': 0.15} {'loss': 0.4113, 'learning_rate': 1.990541181831676e-05, 'epoch': 0.15} {'loss': 0.4891, 'learning_rate': 1.9905365711294117e-05, 'epoch': 0.15} {'loss': 0.4401, 'learning_rate': 1.9905319593090202e-05, 'epoch': 0.15} {'loss': 0.5333, 'learning_rate': 1.9905273463705063e-05, 'epoch': 0.15} {'loss': 0.53, 'learning_rate': 1.9905227323138757e-05, 'epoch': 0.15} {'loss': 0.4563, 'learning_rate': 1.9905181171391332e-05, 'epoch': 0.15} {'loss': 0.6073, 'learning_rate': 1.9905135008462838e-05, 'epoch': 0.15} {'loss': 0.654, 'learning_rate': 1.9905088834353332e-05, 'epoch': 0.15} {'loss': 0.6903, 'learning_rate': 1.9905042649062863e-05, 'epoch': 0.15} {'loss': 0.7005, 'learning_rate': 1.9904996452591485e-05, 'epoch': 0.15} {'loss': 0.5733, 'learning_rate': 1.9904950244939248e-05, 'epoch': 0.15} {'loss': 0.5917, 'learning_rate': 1.990490402610621e-05, 'epoch': 0.15} {'loss': 0.5947, 'learning_rate': 1.9904857796092415e-05, 'epoch': 0.15} {'loss': 0.575, 'learning_rate': 1.9904811554897924e-05, 'epoch': 0.15} {'loss': 0.7085, 'learning_rate': 1.9904765302522778e-05, 'epoch': 0.15} {'loss': 0.6305, 'learning_rate': 1.990471903896704e-05, 'epoch': 0.15} {'loss': 0.5825, 'learning_rate': 1.9904672764230753e-05, 'epoch': 0.15} {'loss': 0.643, 'learning_rate': 1.990462647831398e-05, 'epoch': 0.15} {'loss': 0.5171, 'learning_rate': 1.990458018121676e-05, 'epoch': 0.15} {'loss': 0.5003, 'learning_rate': 1.9904533872939158e-05, 'epoch': 0.15} {'loss': 0.5087, 'learning_rate': 1.990448755348122e-05, 'epoch': 0.15} {'loss': 0.6574, 'learning_rate': 1.9904441222843e-05, 'epoch': 0.15} {'loss': 0.4471, 'learning_rate': 1.9904394881024544e-05, 'epoch': 0.15} {'loss': 0.4212, 'learning_rate': 1.9904348528025912e-05, 'epoch': 0.15} {'loss': 0.5726, 'learning_rate': 1.9904302163847157e-05, 'epoch': 0.15} {'loss': 0.577, 'learning_rate': 1.9904255788488326e-05, 'epoch': 0.15} {'loss': 0.5863, 'learning_rate': 1.9904209401949476e-05, 'epoch': 0.15} {'loss': 0.8052, 'learning_rate': 1.9904163004230656e-05, 'epoch': 0.15} {'loss': 0.5356, 'learning_rate': 1.9904116595331915e-05, 'epoch': 0.15} {'loss': 0.5876, 'learning_rate': 1.9904070175253315e-05, 'epoch': 0.15} {'loss': 0.5585, 'learning_rate': 1.9904023743994897e-05, 'epoch': 0.15} {'loss': 0.44, 'learning_rate': 1.9903977301556724e-05, 'epoch': 0.15} {'loss': 0.726, 'learning_rate': 1.9903930847938845e-05, 'epoch': 0.15} {'loss': 0.6316, 'learning_rate': 1.9903884383141307e-05, 'epoch': 0.15} {'loss': 0.7218, 'learning_rate': 1.990383790716417e-05, 'epoch': 0.15} {'loss': 0.7216, 'learning_rate': 1.9903791420007487e-05, 'epoch': 0.15} {'loss': 0.5656, 'learning_rate': 1.99037449216713e-05, 'epoch': 0.15} {'loss': 0.4275, 'learning_rate': 1.990369841215567e-05, 'epoch': 0.15} {'loss': 0.4357, 'learning_rate': 1.990365189146065e-05, 'epoch': 0.15} {'loss': 0.3829, 'learning_rate': 1.9903605359586287e-05, 'epoch': 0.15} {'loss': 0.4618, 'learning_rate': 1.990355881653264e-05, 'epoch': 0.15} {'loss': 0.6577, 'learning_rate': 1.9903512262299757e-05, 'epoch': 0.15} {'loss': 0.5981, 'learning_rate': 1.990346569688769e-05, 'epoch': 0.15} {'loss': 0.4865, 'learning_rate': 1.9903419120296495e-05, 'epoch': 0.15} {'loss': 0.6634, 'learning_rate': 1.9903372532526226e-05, 'epoch': 0.15} {'loss': 0.4828, 'learning_rate': 1.990332593357693e-05, 'epoch': 0.15} {'loss': 0.6502, 'learning_rate': 1.990327932344866e-05, 'epoch': 0.15} {'loss': 0.5209, 'learning_rate': 1.9903232702141474e-05, 'epoch': 0.15} {'loss': 0.5052, 'learning_rate': 1.9903186069655424e-05, 'epoch': 0.15} {'loss': 0.5227, 'learning_rate': 1.9903139425990554e-05, 'epoch': 0.15} {'loss': 0.5536, 'learning_rate': 1.9903092771146927e-05, 'epoch': 0.15} {'loss': 0.3986, 'learning_rate': 1.990304610512459e-05, 'epoch': 0.15} {'loss': 0.5398, 'learning_rate': 1.9902999427923596e-05, 'epoch': 0.15} {'loss': 0.5338, 'learning_rate': 1.9902952739544e-05, 'epoch': 0.15} {'loss': 0.5338, 'learning_rate': 1.9902906039985856e-05, 'epoch': 0.15} {'loss': 0.7648, 'learning_rate': 1.9902859329249208e-05, 'epoch': 0.15} {'loss': 0.5636, 'learning_rate': 1.9902812607334117e-05, 'epoch': 0.15} {'loss': 0.5912, 'learning_rate': 1.9902765874240638e-05, 'epoch': 0.15} {'loss': 0.5429, 'learning_rate': 1.9902719129968814e-05, 'epoch': 0.15} {'loss': 0.6682, 'learning_rate': 1.9902672374518706e-05, 'epoch': 0.15} {'loss': 0.6205, 'learning_rate': 1.9902625607890366e-05, 'epoch': 0.15} {'loss': 0.743, 'learning_rate': 1.990257883008384e-05, 'epoch': 0.15} {'loss': 0.4149, 'learning_rate': 1.990253204109919e-05, 'epoch': 0.15} {'loss': 0.5591, 'learning_rate': 1.9902485240936462e-05, 'epoch': 0.15} {'loss': 0.458, 'learning_rate': 1.9902438429595712e-05, 'epoch': 0.15} {'loss': 0.4424, 'learning_rate': 1.990239160707699e-05, 'epoch': 0.15} {'loss': 0.562, 'learning_rate': 1.9902344773380354e-05, 'epoch': 0.15} {'loss': 0.58, 'learning_rate': 1.990229792850585e-05, 'epoch': 0.15} {'loss': 0.459, 'learning_rate': 1.9902251072453538e-05, 'epoch': 0.15} {'loss': 0.4052, 'learning_rate': 1.9902204205223467e-05, 'epoch': 0.15} {'loss': 0.4795, 'learning_rate': 1.990215732681569e-05, 'epoch': 0.15} {'loss': 0.5241, 'learning_rate': 1.990211043723026e-05, 'epoch': 0.15} {'loss': 0.5674, 'learning_rate': 1.990206353646723e-05, 'epoch': 0.15} {'loss': 0.5768, 'learning_rate': 1.9902016624526656e-05, 'epoch': 0.15} {'loss': 0.6783, 'learning_rate': 1.9901969701408585e-05, 'epoch': 0.15} {'loss': 0.5217, 'learning_rate': 1.9901922767113075e-05, 'epoch': 0.15} {'loss': 0.6191, 'learning_rate': 1.990187582164017e-05, 'epoch': 0.15} {'loss': 0.5452, 'learning_rate': 1.990182886498994e-05, 'epoch': 0.15} {'loss': 0.506, 'learning_rate': 1.9901781897162425e-05, 'epoch': 0.15} {'loss': 0.6647, 'learning_rate': 1.9901734918157683e-05, 'epoch': 0.15} {'loss': 0.5638, 'learning_rate': 1.9901687927975762e-05, 'epoch': 0.15} {'loss': 0.5591, 'learning_rate': 1.990164092661672e-05, 'epoch': 0.15} {'loss': 0.5547, 'learning_rate': 1.9901593914080606e-05, 'epoch': 0.15} {'loss': 0.5868, 'learning_rate': 1.9901546890367476e-05, 'epoch': 0.15} {'loss': 0.6624, 'learning_rate': 1.9901499855477384e-05, 'epoch': 0.15} {'loss': 0.6514, 'learning_rate': 1.990145280941038e-05, 'epoch': 0.15} {'loss': 0.3116, 'learning_rate': 1.990140575216652e-05, 'epoch': 0.15} {'loss': 0.6322, 'learning_rate': 1.9901358683745853e-05, 'epoch': 0.15} {'loss': 0.5603, 'learning_rate': 1.9901311604148437e-05, 'epoch': 0.15} {'loss': 0.5363, 'learning_rate': 1.9901264513374327e-05, 'epoch': 0.15} {'loss': 0.4533, 'learning_rate': 1.9901217411423562e-05, 'epoch': 0.15} {'loss': 0.5523, 'learning_rate': 1.990117029829621e-05, 'epoch': 0.15} {'loss': 0.4395, 'learning_rate': 1.9901123173992325e-05, 'epoch': 0.15} {'loss': 0.6436, 'learning_rate': 1.990107603851195e-05, 'epoch': 0.15} {'loss': 0.7032, 'learning_rate': 1.9901028891855144e-05, 'epoch': 0.15} {'loss': 0.5012, 'learning_rate': 1.990098173402196e-05, 'epoch': 0.15} {'loss': 0.4122, 'learning_rate': 1.9900934565012447e-05, 'epoch': 0.15} {'loss': 0.3707, 'learning_rate': 1.9900887384826664e-05, 'epoch': 0.15} {'loss': 0.5624, 'learning_rate': 1.9900840193464663e-05, 'epoch': 0.15} {'loss': 0.4793, 'learning_rate': 1.9900792990926497e-05, 'epoch': 0.15} {'loss': 0.6117, 'learning_rate': 1.9900745777212215e-05, 'epoch': 0.15} {'loss': 0.6236, 'learning_rate': 1.9900698552321876e-05, 'epoch': 0.15} {'loss': 0.4887, 'learning_rate': 1.990065131625553e-05, 'epoch': 0.15} {'loss': 0.5674, 'learning_rate': 1.990060406901323e-05, 'epoch': 0.15} {'loss': 0.6725, 'learning_rate': 1.990055681059503e-05, 'epoch': 0.15} {'loss': 0.6553, 'learning_rate': 1.990050954100099e-05, 'epoch': 0.15} {'loss': 0.5494, 'learning_rate': 1.990046226023115e-05, 'epoch': 0.15} {'loss': 0.5889, 'learning_rate': 1.9900414968285576e-05, 'epoch': 0.15} {'loss': 0.4601, 'learning_rate': 1.9900367665164314e-05, 'epoch': 0.15} {'loss': 0.6319, 'learning_rate': 1.9900320350867418e-05, 'epoch': 0.15} {'loss': 0.6253, 'learning_rate': 1.9900273025394945e-05, 'epoch': 0.15} {'loss': 0.7918, 'learning_rate': 1.990022568874695e-05, 'epoch': 0.15} {'loss': 0.463, 'learning_rate': 1.9900178340923476e-05, 'epoch': 0.15} {'loss': 0.6189, 'learning_rate': 1.9900130981924585e-05, 'epoch': 0.15} {'loss': 0.447, 'learning_rate': 1.990008361175033e-05, 'epoch': 0.15} {'loss': 0.5248, 'learning_rate': 1.9900036230400766e-05, 'epoch': 0.15} {'loss': 0.663, 'learning_rate': 1.9899988837875938e-05, 'epoch': 0.15} {'loss': 0.4609, 'learning_rate': 1.989994143417591e-05, 'epoch': 0.15} {'loss': 0.5529, 'learning_rate': 1.989989401930073e-05, 'epoch': 0.15} {'loss': 0.5664, 'learning_rate': 1.9899846593250453e-05, 'epoch': 0.15} {'loss': 0.5037, 'learning_rate': 1.9899799156025125e-05, 'epoch': 0.15} {'loss': 0.6382, 'learning_rate': 1.9899751707624814e-05, 'epoch': 0.15} {'loss': 0.5195, 'learning_rate': 1.9899704248049563e-05, 'epoch': 0.15} {'loss': 0.4841, 'learning_rate': 1.9899656777299427e-05, 'epoch': 0.15} {'loss': 0.342, 'learning_rate': 1.9899609295374463e-05, 'epoch': 0.15} {'loss': 0.5265, 'learning_rate': 1.9899561802274722e-05, 'epoch': 0.15} {'loss': 0.5924, 'learning_rate': 1.9899514298000258e-05, 'epoch': 0.15} {'loss': 0.5415, 'learning_rate': 1.9899466782551126e-05, 'epoch': 0.15} {'loss': 0.5406, 'learning_rate': 1.9899419255927376e-05, 'epoch': 0.15} {'loss': 0.592, 'learning_rate': 1.9899371718129066e-05, 'epoch': 0.15} {'loss': 0.5596, 'learning_rate': 1.9899324169156247e-05, 'epoch': 0.15} {'loss': 0.5007, 'learning_rate': 1.9899276609008973e-05, 'epoch': 0.15} {'loss': 0.4879, 'learning_rate': 1.9899229037687298e-05, 'epoch': 0.15} {'loss': 0.5307, 'learning_rate': 1.989918145519128e-05, 'epoch': 0.15} {'loss': 0.701, 'learning_rate': 1.9899133861520962e-05, 'epoch': 0.15} {'loss': 0.5435, 'learning_rate': 1.9899086256676407e-05, 'epoch': 0.15} {'loss': 0.5032, 'learning_rate': 1.989903864065767e-05, 'epoch': 0.15} {'loss': 0.659, 'learning_rate': 1.9898991013464797e-05, 'epoch': 0.15} {'loss': 0.5361, 'learning_rate': 1.9898943375097842e-05, 'epoch': 0.15} {'loss': 0.5669, 'learning_rate': 1.989889572555687e-05, 'epoch': 0.15} {'loss': 0.5993, 'learning_rate': 1.9898848064841922e-05, 'epoch': 0.15} {'loss': 0.6528, 'learning_rate': 1.9898800392953058e-05, 'epoch': 0.15} {'loss': 0.6014, 'learning_rate': 1.9898752709890333e-05, 'epoch': 0.15} {'loss': 0.475, 'learning_rate': 1.9898705015653796e-05, 'epoch': 0.15} {'loss': 0.529, 'learning_rate': 1.9898657310243502e-05, 'epoch': 0.15} {'loss': 0.5799, 'learning_rate': 1.9898609593659508e-05, 'epoch': 0.15} {'loss': 0.6603, 'learning_rate': 1.9898561865901866e-05, 'epoch': 0.15} {'loss': 0.4443, 'learning_rate': 1.9898514126970633e-05, 'epoch': 0.15} {'loss': 0.5483, 'learning_rate': 1.9898466376865856e-05, 'epoch': 0.15} {'loss': 0.3719, 'learning_rate': 1.9898418615587593e-05, 'epoch': 0.15} {'loss': 0.3758, 'learning_rate': 1.9898370843135898e-05, 'epoch': 0.15} {'loss': 0.6575, 'learning_rate': 1.9898323059510822e-05, 'epoch': 0.15} {'loss': 0.5817, 'learning_rate': 1.9898275264712426e-05, 'epoch': 0.15} {'loss': 0.5816, 'learning_rate': 1.9898227458740758e-05, 'epoch': 0.15} {'loss': 0.5016, 'learning_rate': 1.9898179641595875e-05, 'epoch': 0.15} {'loss': 0.6347, 'learning_rate': 1.9898131813277827e-05, 'epoch': 0.15} {'loss': 0.4749, 'learning_rate': 1.989808397378667e-05, 'epoch': 0.15} {'loss': 0.583, 'learning_rate': 1.989803612312246e-05, 'epoch': 0.15} {'loss': 0.5206, 'learning_rate': 1.9897988261285248e-05, 'epoch': 0.15} {'loss': 0.3989, 'learning_rate': 1.989794038827509e-05, 'epoch': 0.15} {'loss': 0.4406, 'learning_rate': 1.989789250409204e-05, 'epoch': 0.15} {'loss': 0.6317, 'learning_rate': 1.9897844608736153e-05, 'epoch': 0.15} {'loss': 0.5567, 'learning_rate': 1.9897796702207478e-05, 'epoch': 0.15} {'loss': 0.5666, 'learning_rate': 1.9897748784506075e-05, 'epoch': 0.15} {'loss': 0.6828, 'learning_rate': 1.9897700855631993e-05, 'epoch': 0.15} {'loss': 0.5541, 'learning_rate': 1.9897652915585292e-05, 'epoch': 0.15} {'loss': 0.6413, 'learning_rate': 1.9897604964366023e-05, 'epoch': 0.15} {'loss': 0.407, 'learning_rate': 1.989755700197424e-05, 'epoch': 0.15} {'loss': 0.4385, 'learning_rate': 1.9897509028409995e-05, 'epoch': 0.15} {'loss': 0.6491, 'learning_rate': 1.9897461043673348e-05, 'epoch': 0.15} {'loss': 0.5706, 'learning_rate': 1.9897413047764346e-05, 'epoch': 0.15} {'loss': 0.4596, 'learning_rate': 1.9897365040683048e-05, 'epoch': 0.15} {'loss': 0.5142, 'learning_rate': 1.989731702242951e-05, 'epoch': 0.15} {'loss': 0.4024, 'learning_rate': 1.989726899300378e-05, 'epoch': 0.15} {'loss': 0.3884, 'learning_rate': 1.9897220952405917e-05, 'epoch': 0.15} {'loss': 0.4368, 'learning_rate': 1.989717290063597e-05, 'epoch': 0.15} {'loss': 0.7679, 'learning_rate': 1.9897124837693998e-05, 'epoch': 0.15} {'loss': 0.7347, 'learning_rate': 1.9897076763580053e-05, 'epoch': 0.15} {'loss': 0.3454, 'learning_rate': 1.9897028678294195e-05, 'epoch': 0.15} {'loss': 0.6435, 'learning_rate': 1.989698058183647e-05, 'epoch': 0.15} {'loss': 0.5288, 'learning_rate': 1.9896932474206937e-05, 'epoch': 0.15} {'loss': 0.4638, 'learning_rate': 1.9896884355405652e-05, 'epoch': 0.15} {'loss': 0.5443, 'learning_rate': 1.9896836225432663e-05, 'epoch': 0.15} {'loss': 0.5865, 'learning_rate': 1.9896788084288028e-05, 'epoch': 0.15} {'loss': 0.5179, 'learning_rate': 1.9896739931971804e-05, 'epoch': 0.15} {'loss': 0.4422, 'learning_rate': 1.989669176848404e-05, 'epoch': 0.15} {'loss': 0.4605, 'learning_rate': 1.9896643593824794e-05, 'epoch': 0.15} {'loss': 0.5617, 'learning_rate': 1.989659540799412e-05, 'epoch': 0.15} {'loss': 0.5285, 'learning_rate': 1.989654721099207e-05, 'epoch': 0.15} {'loss': 0.6511, 'learning_rate': 1.9896499002818698e-05, 'epoch': 0.15} {'loss': 0.626, 'learning_rate': 1.9896450783474063e-05, 'epoch': 0.15} {'loss': 0.5615, 'learning_rate': 1.989640255295822e-05, 'epoch': 0.15} {'loss': 0.4516, 'learning_rate': 1.9896354311271214e-05, 'epoch': 0.15} {'loss': 0.5675, 'learning_rate': 1.989630605841311e-05, 'epoch': 0.15} {'loss': 0.6249, 'learning_rate': 1.989625779438396e-05, 'epoch': 0.15} {'loss': 0.661, 'learning_rate': 1.9896209519183813e-05, 'epoch': 0.15} {'loss': 0.5936, 'learning_rate': 1.9896161232812726e-05, 'epoch': 0.15} {'loss': 0.4401, 'learning_rate': 1.989611293527076e-05, 'epoch': 0.15} {'loss': 0.3398, 'learning_rate': 1.989606462655796e-05, 'epoch': 0.15} {'loss': 0.5402, 'learning_rate': 1.989601630667439e-05, 'epoch': 0.15} {'loss': 0.5283, 'learning_rate': 1.9895967975620098e-05, 'epoch': 0.15} {'loss': 0.6012, 'learning_rate': 1.9895919633395137e-05, 'epoch': 0.15} {'loss': 0.4722, 'learning_rate': 1.9895871279999562e-05, 'epoch': 0.15} {'loss': 0.5461, 'learning_rate': 1.9895822915433436e-05, 'epoch': 0.15} {'loss': 0.5574, 'learning_rate': 1.9895774539696803e-05, 'epoch': 0.15} {'loss': 0.4556, 'learning_rate': 1.989572615278973e-05, 'epoch': 0.15} {'loss': 0.4314, 'learning_rate': 1.989567775471226e-05, 'epoch': 0.15} {'loss': 0.531, 'learning_rate': 1.9895629345464447e-05, 'epoch': 0.15} {'loss': 0.4868, 'learning_rate': 1.9895580925046354e-05, 'epoch': 0.15} {'loss': 0.486, 'learning_rate': 1.989553249345803e-05, 'epoch': 0.15} {'loss': 0.4878, 'learning_rate': 1.9895484050699536e-05, 'epoch': 0.15} {'loss': 0.6488, 'learning_rate': 1.989543559677092e-05, 'epoch': 0.15} {'loss': 0.5179, 'learning_rate': 1.9895387131672234e-05, 'epoch': 0.15} {'loss': 0.6014, 'learning_rate': 1.9895338655403543e-05, 'epoch': 0.15} {'loss': 0.4663, 'learning_rate': 1.9895290167964894e-05, 'epoch': 0.15} {'loss': 0.5927, 'learning_rate': 1.9895241669356346e-05, 'epoch': 0.15} {'loss': 0.4489, 'learning_rate': 1.989519315957795e-05, 'epoch': 0.15} {'loss': 0.5606, 'learning_rate': 1.9895144638629763e-05, 'epoch': 0.15} {'loss': 0.6082, 'learning_rate': 1.989509610651184e-05, 'epoch': 0.15} {'loss': 0.593, 'learning_rate': 1.989504756322424e-05, 'epoch': 0.15} {'loss': 0.5299, 'learning_rate': 1.9894999008767003e-05, 'epoch': 0.15} {'loss': 0.5937, 'learning_rate': 1.98949504431402e-05, 'epoch': 0.15} {'loss': 0.5967, 'learning_rate': 1.9894901866343876e-05, 'epoch': 0.15} {'loss': 0.519, 'learning_rate': 1.9894853278378093e-05, 'epoch': 0.15} {'loss': 0.5496, 'learning_rate': 1.9894804679242902e-05, 'epoch': 0.15} {'loss': 0.5098, 'learning_rate': 1.9894756068938356e-05, 'epoch': 0.15} {'loss': 0.4531, 'learning_rate': 1.989470744746451e-05, 'epoch': 0.15} {'loss': 0.6216, 'learning_rate': 1.9894658814821426e-05, 'epoch': 0.15} {'loss': 0.5204, 'learning_rate': 1.9894610171009154e-05, 'epoch': 0.15} {'loss': 0.4196, 'learning_rate': 1.9894561516027746e-05, 'epoch': 0.15} {'loss': 0.5584, 'learning_rate': 1.989451284987726e-05, 'epoch': 0.15} {'loss': 0.6383, 'learning_rate': 1.9894464172557747e-05, 'epoch': 0.15} {'loss': 0.4855, 'learning_rate': 1.9894415484069268e-05, 'epoch': 0.15} {'loss': 0.623, 'learning_rate': 1.9894366784411877e-05, 'epoch': 0.15} {'loss': 0.66, 'learning_rate': 1.9894318073585628e-05, 'epoch': 0.15} {'loss': 0.5114, 'learning_rate': 1.9894269351590575e-05, 'epoch': 0.15} {'loss': 0.5281, 'learning_rate': 1.9894220618426773e-05, 'epoch': 0.15} {'loss': 0.5651, 'learning_rate': 1.989417187409428e-05, 'epoch': 0.15} {'loss': 0.6312, 'learning_rate': 1.989412311859314e-05, 'epoch': 0.15} {'loss': 0.4627, 'learning_rate': 1.989407435192342e-05, 'epoch': 0.15} {'loss': 0.4136, 'learning_rate': 1.9894025574085174e-05, 'epoch': 0.15} {'loss': 0.5401, 'learning_rate': 1.9893976785078454e-05, 'epoch': 0.15} {'loss': 0.556, 'learning_rate': 1.9893927984903318e-05, 'epoch': 0.15} {'loss': 0.511, 'learning_rate': 1.9893879173559814e-05, 'epoch': 0.15} {'loss': 0.4668, 'learning_rate': 1.9893830351048005e-05, 'epoch': 0.15} {'loss': 0.5279, 'learning_rate': 1.989378151736794e-05, 'epoch': 0.15} {'loss': 0.6412, 'learning_rate': 1.9893732672519677e-05, 'epoch': 0.15} {'loss': 0.581, 'learning_rate': 1.9893683816503277e-05, 'epoch': 0.15} {'loss': 0.6528, 'learning_rate': 1.9893634949318784e-05, 'epoch': 0.15} {'loss': 0.6153, 'learning_rate': 1.989358607096626e-05, 'epoch': 0.15} {'loss': 0.5949, 'learning_rate': 1.989353718144576e-05, 'epoch': 0.15} {'loss': 0.5179, 'learning_rate': 1.9893488280757336e-05, 'epoch': 0.15} {'loss': 0.662, 'learning_rate': 1.9893439368901048e-05, 'epoch': 0.15} {'loss': 0.6001, 'learning_rate': 1.9893390445876945e-05, 'epoch': 0.15} {'loss': 0.3749, 'learning_rate': 1.9893341511685085e-05, 'epoch': 0.15} {'loss': 0.4337, 'learning_rate': 1.9893292566325523e-05, 'epoch': 0.15} {'loss': 0.3998, 'learning_rate': 1.989324360979832e-05, 'epoch': 0.15} {'loss': 0.497, 'learning_rate': 1.9893194642103522e-05, 'epoch': 0.15} {'loss': 0.489, 'learning_rate': 1.9893145663241188e-05, 'epoch': 0.15} {'loss': 0.4741, 'learning_rate': 1.9893096673211375e-05, 'epoch': 0.15} {'loss': 0.5406, 'learning_rate': 1.9893047672014137e-05, 'epoch': 0.15} {'loss': 0.3533, 'learning_rate': 1.9892998659649532e-05, 'epoch': 0.15} {'loss': 0.4707, 'learning_rate': 1.9892949636117615e-05, 'epoch': 0.15} {'loss': 0.5262, 'learning_rate': 1.989290060141843e-05, 'epoch': 0.15} {'loss': 0.5329, 'learning_rate': 1.9892851555552047e-05, 'epoch': 0.15} {'loss': 0.5511, 'learning_rate': 1.9892802498518516e-05, 'epoch': 0.15} {'loss': 0.4241, 'learning_rate': 1.989275343031789e-05, 'epoch': 0.15} {'loss': 0.5703, 'learning_rate': 1.989270435095023e-05, 'epoch': 0.15} {'loss': 0.5056, 'learning_rate': 1.9892655260415584e-05, 'epoch': 0.15} {'loss': 0.4551, 'learning_rate': 1.9892606158714014e-05, 'epoch': 0.15} {'loss': 0.4272, 'learning_rate': 1.9892557045845573e-05, 'epoch': 0.15} {'loss': 0.5065, 'learning_rate': 1.9892507921810316e-05, 'epoch': 0.15} {'loss': 0.6265, 'learning_rate': 1.98924587866083e-05, 'epoch': 0.15} {'loss': 0.5433, 'learning_rate': 1.9892409640239575e-05, 'epoch': 0.15} {'loss': 0.6091, 'learning_rate': 1.9892360482704202e-05, 'epoch': 0.15} {'loss': 0.4537, 'learning_rate': 1.9892311314002238e-05, 'epoch': 0.15} {'loss': 0.6053, 'learning_rate': 1.9892262134133734e-05, 'epoch': 0.15} {'loss': 0.4882, 'learning_rate': 1.9892212943098747e-05, 'epoch': 0.15} {'loss': 0.6406, 'learning_rate': 1.989216374089733e-05, 'epoch': 0.15} {'loss': 0.5996, 'learning_rate': 1.9892114527529545e-05, 'epoch': 0.15} {'loss': 0.6134, 'learning_rate': 1.9892065302995442e-05, 'epoch': 0.15} {'loss': 0.587, 'learning_rate': 1.989201606729508e-05, 'epoch': 0.15} {'loss': 0.6274, 'learning_rate': 1.989196682042851e-05, 'epoch': 0.15} {'loss': 0.6115, 'learning_rate': 1.9891917562395794e-05, 'epoch': 0.15} {'loss': 0.4857, 'learning_rate': 1.989186829319698e-05, 'epoch': 0.15} {'loss': 0.5009, 'learning_rate': 1.9891819012832133e-05, 'epoch': 0.15} {'loss': 0.6314, 'learning_rate': 1.98917697213013e-05, 'epoch': 0.15} {'loss': 0.4759, 'learning_rate': 1.989172041860454e-05, 'epoch': 0.15} {'loss': 0.4235, 'learning_rate': 1.989167110474191e-05, 'epoch': 0.15} {'loss': 0.5869, 'learning_rate': 1.989162177971346e-05, 'epoch': 0.15} {'loss': 0.782, 'learning_rate': 1.9891572443519256e-05, 'epoch': 0.15} {'loss': 0.7322, 'learning_rate': 1.9891523096159348e-05, 'epoch': 0.15} {'loss': 0.4784, 'learning_rate': 1.9891473737633787e-05, 'epoch': 0.15} {'loss': 0.5619, 'learning_rate': 1.9891424367942635e-05, 'epoch': 0.15} {'loss': 0.5737, 'learning_rate': 1.989137498708594e-05, 'epoch': 0.15} {'loss': 0.6022, 'learning_rate': 1.989132559506377e-05, 'epoch': 0.15} {'loss': 0.681, 'learning_rate': 1.9891276191876176e-05, 'epoch': 0.15} {'loss': 0.4225, 'learning_rate': 1.989122677752321e-05, 'epoch': 0.15} {'loss': 0.5516, 'learning_rate': 1.9891177352004928e-05, 'epoch': 0.15} {'loss': 0.7902, 'learning_rate': 1.9891127915321388e-05, 'epoch': 0.15} {'loss': 0.4921, 'learning_rate': 1.9891078467472645e-05, 'epoch': 0.15} {'loss': 0.4828, 'learning_rate': 1.9891029008458758e-05, 'epoch': 0.15} {'loss': 0.6851, 'learning_rate': 1.989097953827978e-05, 'epoch': 0.15} {'loss': 0.5287, 'learning_rate': 1.9890930056935764e-05, 'epoch': 0.15} {'loss': 0.3752, 'learning_rate': 1.9890880564426772e-05, 'epoch': 0.15} {'loss': 0.5791, 'learning_rate': 1.9890831060752856e-05, 'epoch': 0.15} {'loss': 0.5287, 'learning_rate': 1.989078154591407e-05, 'epoch': 0.15} {'loss': 0.3675, 'learning_rate': 1.9890732019910475e-05, 'epoch': 0.15} {'loss': 0.5438, 'learning_rate': 1.9890682482742125e-05, 'epoch': 0.15} {'loss': 0.4194, 'learning_rate': 1.9890632934409075e-05, 'epoch': 0.15} {'loss': 0.7314, 'learning_rate': 1.9890583374911378e-05, 'epoch': 0.15} {'loss': 0.6598, 'learning_rate': 1.98905338042491e-05, 'epoch': 0.15} {'loss': 0.6113, 'learning_rate': 1.9890484222422278e-05, 'epoch': 0.15} {'loss': 0.5411, 'learning_rate': 1.989043462943099e-05, 'epoch': 0.15} {'loss': 0.5137, 'learning_rate': 1.989038502527528e-05, 'epoch': 0.15} {'loss': 0.5862, 'learning_rate': 1.9890335409955206e-05, 'epoch': 0.15} {'loss': 0.5244, 'learning_rate': 1.9890285783470823e-05, 'epoch': 0.15} {'loss': 0.6455, 'learning_rate': 1.9890236145822187e-05, 'epoch': 0.15} {'loss': 0.52, 'learning_rate': 1.9890186497009358e-05, 'epoch': 0.15} {'loss': 0.5198, 'learning_rate': 1.9890136837032388e-05, 'epoch': 0.15} {'loss': 0.4899, 'learning_rate': 1.9890087165891334e-05, 'epoch': 0.15} {'loss': 0.5188, 'learning_rate': 1.9890037483586253e-05, 'epoch': 0.15} {'loss': 0.5044, 'learning_rate': 1.9889987790117197e-05, 'epoch': 0.15} {'loss': 0.4267, 'learning_rate': 1.988993808548423e-05, 'epoch': 0.15} {'loss': 0.4307, 'learning_rate': 1.9889888369687402e-05, 'epoch': 0.15} {'loss': 0.6411, 'learning_rate': 1.9889838642726772e-05, 'epoch': 0.15} {'loss': 0.5931, 'learning_rate': 1.9889788904602393e-05, 'epoch': 0.15} {'loss': 0.5949, 'learning_rate': 1.9889739155314323e-05, 'epoch': 0.15} {'loss': 0.5951, 'learning_rate': 1.9889689394862616e-05, 'epoch': 0.15} {'loss': 0.5259, 'learning_rate': 1.9889639623247334e-05, 'epoch': 0.15} {'loss': 0.7655, 'learning_rate': 1.988958984046853e-05, 'epoch': 0.15} {'loss': 0.5892, 'learning_rate': 1.9889540046526255e-05, 'epoch': 0.15} {'loss': 0.4964, 'learning_rate': 1.9889490241420574e-05, 'epoch': 0.15} {'loss': 0.6289, 'learning_rate': 1.9889440425151538e-05, 'epoch': 0.15} {'loss': 0.6081, 'learning_rate': 1.9889390597719203e-05, 'epoch': 0.15} {'loss': 0.4838, 'learning_rate': 1.9889340759123628e-05, 'epoch': 0.15} {'loss': 0.3198, 'learning_rate': 1.9889290909364867e-05, 'epoch': 0.15} {'loss': 0.5865, 'learning_rate': 1.9889241048442978e-05, 'epoch': 0.15} {'loss': 0.6157, 'learning_rate': 1.9889191176358017e-05, 'epoch': 0.15} {'loss': 0.3944, 'learning_rate': 1.9889141293110037e-05, 'epoch': 0.15} {'loss': 0.6529, 'learning_rate': 1.9889091398699097e-05, 'epoch': 0.15} {'loss': 0.5593, 'learning_rate': 1.9889041493125256e-05, 'epoch': 0.15} {'loss': 0.5788, 'learning_rate': 1.9888991576388567e-05, 'epoch': 0.15} {'loss': 0.4736, 'learning_rate': 1.9888941648489086e-05, 'epoch': 0.15} {'loss': 0.5711, 'learning_rate': 1.9888891709426872e-05, 'epoch': 0.15} {'loss': 0.449, 'learning_rate': 1.9888841759201977e-05, 'epoch': 0.15} {'loss': 0.6137, 'learning_rate': 1.9888791797814462e-05, 'epoch': 0.15} {'loss': 0.5247, 'learning_rate': 1.988874182526438e-05, 'epoch': 0.15} {'loss': 0.5793, 'learning_rate': 1.988869184155179e-05, 'epoch': 0.15} {'loss': 0.4826, 'learning_rate': 1.988864184667675e-05, 'epoch': 0.15} {'loss': 0.4824, 'learning_rate': 1.9888591840639312e-05, 'epoch': 0.15} {'loss': 0.5077, 'learning_rate': 1.9888541823439532e-05, 'epoch': 0.15} {'loss': 0.6002, 'learning_rate': 1.988849179507747e-05, 'epoch': 0.15} {'loss': 0.56, 'learning_rate': 1.9888441755553182e-05, 'epoch': 0.15} {'loss': 0.7749, 'learning_rate': 1.988839170486672e-05, 'epoch': 0.15} {'loss': 0.4923, 'learning_rate': 1.9888341643018146e-05, 'epoch': 0.15} {'loss': 0.5477, 'learning_rate': 1.9888291570007518e-05, 'epoch': 0.15} {'loss': 0.599, 'learning_rate': 1.9888241485834886e-05, 'epoch': 0.15} {'loss': 0.5445, 'learning_rate': 1.988819139050031e-05, 'epoch': 0.15} {'loss': 0.4514, 'learning_rate': 1.9888141284003848e-05, 'epoch': 0.15} {'loss': 0.5768, 'learning_rate': 1.9888091166345554e-05, 'epoch': 0.15} {'loss': 0.5122, 'learning_rate': 1.9888041037525486e-05, 'epoch': 0.15} {'loss': 0.616, 'learning_rate': 1.9887990897543696e-05, 'epoch': 0.15} {'loss': 0.6087, 'learning_rate': 1.988794074640025e-05, 'epoch': 0.15} {'loss': 0.6098, 'learning_rate': 1.9887890584095197e-05, 'epoch': 0.15} {'loss': 0.4977, 'learning_rate': 1.9887840410628595e-05, 'epoch': 0.15} {'loss': 0.6202, 'learning_rate': 1.9887790226000502e-05, 'epoch': 0.15} {'loss': 0.582, 'learning_rate': 1.988774003021097e-05, 'epoch': 0.15} {'loss': 0.6386, 'learning_rate': 1.988768982326007e-05, 'epoch': 0.15} {'loss': 0.6998, 'learning_rate': 1.9887639605147838e-05, 'epoch': 0.15} {'loss': 0.5938, 'learning_rate': 1.9887589375874346e-05, 'epoch': 0.15} {'loss': 0.4825, 'learning_rate': 1.9887539135439646e-05, 'epoch': 0.15} {'loss': 0.4988, 'learning_rate': 1.9887488883843792e-05, 'epoch': 0.15} {'loss': 0.4562, 'learning_rate': 1.9887438621086847e-05, 'epoch': 0.15} {'loss': 0.4899, 'learning_rate': 1.988738834716886e-05, 'epoch': 0.15} {'loss': 0.6115, 'learning_rate': 1.9887338062089893e-05, 'epoch': 0.15} {'loss': 0.5499, 'learning_rate': 1.9887287765850002e-05, 'epoch': 0.15} {'loss': 0.5928, 'learning_rate': 1.9887237458449243e-05, 'epoch': 0.15} {'loss': 0.472, 'learning_rate': 1.9887187139887674e-05, 'epoch': 0.15} {'loss': 0.5129, 'learning_rate': 1.988713681016535e-05, 'epoch': 0.15} {'loss': 0.5028, 'learning_rate': 1.9887086469282328e-05, 'epoch': 0.15} {'loss': 0.4619, 'learning_rate': 1.9887036117238667e-05, 'epoch': 0.15} {'loss': 0.6021, 'learning_rate': 1.9886985754034422e-05, 'epoch': 0.15} {'loss': 0.6493, 'learning_rate': 1.988693537966965e-05, 'epoch': 0.16} {'loss': 0.6595, 'learning_rate': 1.988688499414441e-05, 'epoch': 0.16} {'loss': 0.4923, 'learning_rate': 1.9886834597458752e-05, 'epoch': 0.16} {'loss': 0.4891, 'learning_rate': 1.988678418961274e-05, 'epoch': 0.16} {'loss': 0.5105, 'learning_rate': 1.988673377060643e-05, 'epoch': 0.16} {'loss': 0.4467, 'learning_rate': 1.988668334043988e-05, 'epoch': 0.16} {'loss': 0.473, 'learning_rate': 1.988663289911314e-05, 'epoch': 0.16} {'loss': 0.6642, 'learning_rate': 1.988658244662627e-05, 'epoch': 0.16} {'loss': 0.5033, 'learning_rate': 1.988653198297933e-05, 'epoch': 0.16} {'loss': 0.4538, 'learning_rate': 1.988648150817238e-05, 'epoch': 0.16} {'loss': 0.5033, 'learning_rate': 1.988643102220547e-05, 'epoch': 0.16} {'loss': 0.5827, 'learning_rate': 1.9886380525078657e-05, 'epoch': 0.16} {'loss': 0.5631, 'learning_rate': 1.9886330016792003e-05, 'epoch': 0.16} {'loss': 0.357, 'learning_rate': 1.988627949734556e-05, 'epoch': 0.16} {'loss': 0.4176, 'learning_rate': 1.988622896673939e-05, 'epoch': 0.16} {'loss': 0.3609, 'learning_rate': 1.9886178424973546e-05, 'epoch': 0.16} {'loss': 0.4475, 'learning_rate': 1.9886127872048083e-05, 'epoch': 0.16} {'loss': 0.6585, 'learning_rate': 1.9886077307963066e-05, 'epoch': 0.16} {'loss': 0.7193, 'learning_rate': 1.988602673271855e-05, 'epoch': 0.16} {'loss': 0.6159, 'learning_rate': 1.9885976146314584e-05, 'epoch': 0.16} {'loss': 0.5636, 'learning_rate': 1.9885925548751234e-05, 'epoch': 0.16} {'loss': 0.6051, 'learning_rate': 1.9885874940028557e-05, 'epoch': 0.16} {'loss': 0.6114, 'learning_rate': 1.98858243201466e-05, 'epoch': 0.16} {'loss': 0.4859, 'learning_rate': 1.988577368910543e-05, 'epoch': 0.16} {'loss': 0.6803, 'learning_rate': 1.9885723046905105e-05, 'epoch': 0.16} {'loss': 0.535, 'learning_rate': 1.9885672393545675e-05, 'epoch': 0.16} {'loss': 0.4815, 'learning_rate': 1.98856217290272e-05, 'epoch': 0.16} {'loss': 0.6922, 'learning_rate': 1.988557105334974e-05, 'epoch': 0.16} {'loss': 0.4306, 'learning_rate': 1.9885520366513348e-05, 'epoch': 0.16} {'loss': 0.603, 'learning_rate': 1.9885469668518084e-05, 'epoch': 0.16} {'loss': 0.4063, 'learning_rate': 1.9885418959364007e-05, 'epoch': 0.16} {'loss': 0.5648, 'learning_rate': 1.988536823905117e-05, 'epoch': 0.16} {'loss': 0.5081, 'learning_rate': 1.9885317507579632e-05, 'epoch': 0.16} {'loss': 0.5189, 'learning_rate': 1.988526676494945e-05, 'epoch': 0.16} {'loss': 0.4115, 'learning_rate': 1.9885216011160683e-05, 'epoch': 0.16} {'loss': 0.5398, 'learning_rate': 1.9885165246213384e-05, 'epoch': 0.16} {'loss': 0.5781, 'learning_rate': 1.9885114470107614e-05, 'epoch': 0.16} {'loss': 0.3965, 'learning_rate': 1.9885063682843433e-05, 'epoch': 0.16} {'loss': 0.5778, 'learning_rate': 1.988501288442089e-05, 'epoch': 0.16} {'loss': 0.5603, 'learning_rate': 1.988496207484005e-05, 'epoch': 0.16} {'loss': 0.5715, 'learning_rate': 1.988491125410097e-05, 'epoch': 0.16} {'loss': 0.7178, 'learning_rate': 1.98848604222037e-05, 'epoch': 0.16} {'loss': 0.5507, 'learning_rate': 1.9884809579148303e-05, 'epoch': 0.16} {'loss': 0.5621, 'learning_rate': 1.9884758724934837e-05, 'epoch': 0.16} {'loss': 0.6675, 'learning_rate': 1.988470785956336e-05, 'epoch': 0.16} {'loss': 0.4825, 'learning_rate': 1.9884656983033922e-05, 'epoch': 0.16} {'loss': 0.3733, 'learning_rate': 1.988460609534659e-05, 'epoch': 0.16} {'loss': 0.6468, 'learning_rate': 1.9884555196501418e-05, 'epoch': 0.16} {'loss': 0.537, 'learning_rate': 1.9884504286498462e-05, 'epoch': 0.16} {'loss': 0.5645, 'learning_rate': 1.988445336533778e-05, 'epoch': 0.16} {'loss': 0.5105, 'learning_rate': 1.988440243301943e-05, 'epoch': 0.16} {'loss': 0.5316, 'learning_rate': 1.9884351489543466e-05, 'epoch': 0.16} {'loss': 0.6826, 'learning_rate': 1.9884300534909955e-05, 'epoch': 0.16} {'loss': 0.5217, 'learning_rate': 1.9884249569118946e-05, 'epoch': 0.16} {'loss': 0.696, 'learning_rate': 1.9884198592170498e-05, 'epoch': 0.16} {'loss': 0.5197, 'learning_rate': 1.9884147604064667e-05, 'epoch': 0.16} {'loss': 0.6775, 'learning_rate': 1.9884096604801515e-05, 'epoch': 0.16} {'loss': 0.7663, 'learning_rate': 1.98840455943811e-05, 'epoch': 0.16} {'loss': 0.6595, 'learning_rate': 1.988399457280347e-05, 'epoch': 0.16} {'loss': 0.5681, 'learning_rate': 1.9883943540068694e-05, 'epoch': 0.16} {'loss': 0.4095, 'learning_rate': 1.9883892496176826e-05, 'epoch': 0.16} {'loss': 0.6743, 'learning_rate': 1.9883841441127925e-05, 'epoch': 0.16} {'loss': 0.6558, 'learning_rate': 1.988379037492204e-05, 'epoch': 0.16} {'loss': 0.5145, 'learning_rate': 1.9883739297559243e-05, 'epoch': 0.16} {'loss': 0.6637, 'learning_rate': 1.9883688209039577e-05, 'epoch': 0.16} {'loss': 0.5458, 'learning_rate': 1.988363710936311e-05, 'epoch': 0.16} {'loss': 0.3798, 'learning_rate': 1.9883585998529895e-05, 'epoch': 0.16} {'loss': 0.5922, 'learning_rate': 1.988353487653999e-05, 'epoch': 0.16} {'loss': 0.5366, 'learning_rate': 1.9883483743393456e-05, 'epoch': 0.16} {'loss': 0.5837, 'learning_rate': 1.9883432599090348e-05, 'epoch': 0.16} {'loss': 0.3675, 'learning_rate': 1.9883381443630723e-05, 'epoch': 0.16} {'loss': 0.5778, 'learning_rate': 1.988333027701464e-05, 'epoch': 0.16} {'loss': 0.6396, 'learning_rate': 1.9883279099242157e-05, 'epoch': 0.16} {'loss': 0.588, 'learning_rate': 1.988322791031333e-05, 'epoch': 0.16} {'loss': 0.4917, 'learning_rate': 1.988317671022822e-05, 'epoch': 0.16} {'loss': 0.683, 'learning_rate': 1.988312549898688e-05, 'epoch': 0.16} {'loss': 0.6151, 'learning_rate': 1.988307427658937e-05, 'epoch': 0.16} {'loss': 0.7088, 'learning_rate': 1.9883023043035754e-05, 'epoch': 0.16} {'loss': 0.5468, 'learning_rate': 1.988297179832608e-05, 'epoch': 0.16} {'loss': 0.4303, 'learning_rate': 1.988292054246041e-05, 'epoch': 0.16} {'loss': 0.5165, 'learning_rate': 1.9882869275438805e-05, 'epoch': 0.16} {'loss': 0.5856, 'learning_rate': 1.988281799726132e-05, 'epoch': 0.16} {'loss': 0.5682, 'learning_rate': 1.988276670792801e-05, 'epoch': 0.16} {'loss': 0.577, 'learning_rate': 1.9882715407438937e-05, 'epoch': 0.16} {'loss': 0.6023, 'learning_rate': 1.9882664095794158e-05, 'epoch': 0.16} {'loss': 0.5567, 'learning_rate': 1.988261277299373e-05, 'epoch': 0.16} {'loss': 0.6413, 'learning_rate': 1.988256143903771e-05, 'epoch': 0.16} {'loss': 0.3773, 'learning_rate': 1.9882510093926158e-05, 'epoch': 0.16} {'loss': 0.6365, 'learning_rate': 1.988245873765913e-05, 'epoch': 0.16} {'loss': 0.5703, 'learning_rate': 1.9882407370236692e-05, 'epoch': 0.16} {'loss': 0.6822, 'learning_rate': 1.988235599165889e-05, 'epoch': 0.16} {'loss': 0.6397, 'learning_rate': 1.9882304601925785e-05, 'epoch': 0.16} {'loss': 0.5621, 'learning_rate': 1.988225320103744e-05, 'epoch': 0.16} {'loss': 0.5985, 'learning_rate': 1.988220178899391e-05, 'epoch': 0.16} {'loss': 0.4666, 'learning_rate': 1.9882150365795255e-05, 'epoch': 0.16} {'loss': 0.6425, 'learning_rate': 1.9882098931441534e-05, 'epoch': 0.16} {'loss': 0.5892, 'learning_rate': 1.9882047485932796e-05, 'epoch': 0.16} {'loss': 0.5244, 'learning_rate': 1.988199602926911e-05, 'epoch': 0.16} {'loss': 0.7066, 'learning_rate': 1.9881944561450524e-05, 'epoch': 0.16} {'loss': 0.5236, 'learning_rate': 1.9881893082477107e-05, 'epoch': 0.16} {'loss': 0.5394, 'learning_rate': 1.9881841592348912e-05, 'epoch': 0.16} {'loss': 0.5764, 'learning_rate': 1.9881790091066e-05, 'epoch': 0.16} {'loss': 0.5255, 'learning_rate': 1.9881738578628417e-05, 'epoch': 0.16} {'loss': 0.614, 'learning_rate': 1.9881687055036238e-05, 'epoch': 0.16} {'loss': 0.4713, 'learning_rate': 1.988163552028951e-05, 'epoch': 0.16} {'loss': 0.5271, 'learning_rate': 1.9881583974388294e-05, 'epoch': 0.16} {'loss': 0.439, 'learning_rate': 1.988153241733265e-05, 'epoch': 0.16} {'loss': 0.5725, 'learning_rate': 1.9881480849122633e-05, 'epoch': 0.16} {'loss': 0.6316, 'learning_rate': 1.9881429269758305e-05, 'epoch': 0.16} {'loss': 0.5442, 'learning_rate': 1.988137767923972e-05, 'epoch': 0.16} {'loss': 0.4615, 'learning_rate': 1.9881326077566944e-05, 'epoch': 0.16} {'loss': 0.6113, 'learning_rate': 1.9881274464740027e-05, 'epoch': 0.16} {'loss': 0.499, 'learning_rate': 1.9881222840759027e-05, 'epoch': 0.16} {'loss': 0.6418, 'learning_rate': 1.988117120562401e-05, 'epoch': 0.16} {'loss': 0.6556, 'learning_rate': 1.9881119559335026e-05, 'epoch': 0.16} {'loss': 0.503, 'learning_rate': 1.988106790189214e-05, 'epoch': 0.16} {'loss': 0.5593, 'learning_rate': 1.9881016233295403e-05, 'epoch': 0.16} {'loss': 0.5186, 'learning_rate': 1.9880964553544887e-05, 'epoch': 0.16} {'loss': 0.4766, 'learning_rate': 1.988091286264063e-05, 'epoch': 0.16} {'loss': 0.5792, 'learning_rate': 1.9880861160582706e-05, 'epoch': 0.16} {'loss': 0.4859, 'learning_rate': 1.9880809447371174e-05, 'epoch': 0.16} {'loss': 0.6479, 'learning_rate': 1.988075772300608e-05, 'epoch': 0.16} {'loss': 0.6197, 'learning_rate': 1.988070598748749e-05, 'epoch': 0.16} {'loss': 0.6798, 'learning_rate': 1.9880654240815463e-05, 'epoch': 0.16} {'loss': 0.525, 'learning_rate': 1.9880602482990058e-05, 'epoch': 0.16} {'loss': 0.6659, 'learning_rate': 1.988055071401133e-05, 'epoch': 0.16} {'loss': 0.5576, 'learning_rate': 1.988049893387934e-05, 'epoch': 0.16} {'loss': 0.544, 'learning_rate': 1.9880447142594143e-05, 'epoch': 0.16} {'loss': 0.4816, 'learning_rate': 1.98803953401558e-05, 'epoch': 0.16} {'loss': 0.5638, 'learning_rate': 1.9880343526564375e-05, 'epoch': 0.16} {'loss': 0.5492, 'learning_rate': 1.9880291701819915e-05, 'epoch': 0.16} {'loss': 0.6121, 'learning_rate': 1.9880239865922487e-05, 'epoch': 0.16} {'loss': 0.4456, 'learning_rate': 1.988018801887215e-05, 'epoch': 0.16} {'loss': 0.5225, 'learning_rate': 1.9880136160668955e-05, 'epoch': 0.16} {'loss': 0.5474, 'learning_rate': 1.9880084291312966e-05, 'epoch': 0.16} {'loss': 0.6173, 'learning_rate': 1.988003241080424e-05, 'epoch': 0.16} {'loss': 0.5106, 'learning_rate': 1.987998051914284e-05, 'epoch': 0.16} {'loss': 0.6464, 'learning_rate': 1.9879928616328815e-05, 'epoch': 0.16} {'loss': 0.3873, 'learning_rate': 1.9879876702362234e-05, 'epoch': 0.16} {'loss': 0.6452, 'learning_rate': 1.9879824777243146e-05, 'epoch': 0.16} {'loss': 0.587, 'learning_rate': 1.987977284097162e-05, 'epoch': 0.16} {'loss': 0.7271, 'learning_rate': 1.9879720893547707e-05, 'epoch': 0.16} {'loss': 0.7158, 'learning_rate': 1.987966893497147e-05, 'epoch': 0.16} {'loss': 0.6806, 'learning_rate': 1.987961696524296e-05, 'epoch': 0.16} {'loss': 0.5634, 'learning_rate': 1.9879564984362247e-05, 'epoch': 0.16} {'loss': 0.5973, 'learning_rate': 1.987951299232938e-05, 'epoch': 0.16} {'loss': 0.6304, 'learning_rate': 1.987946098914442e-05, 'epoch': 0.16} {'loss': 0.6143, 'learning_rate': 1.9879408974807434e-05, 'epoch': 0.16} {'loss': 0.6887, 'learning_rate': 1.987935694931847e-05, 'epoch': 0.16} {'loss': 0.6654, 'learning_rate': 1.987930491267759e-05, 'epoch': 0.16} {'loss': 0.4477, 'learning_rate': 1.987925286488485e-05, 'epoch': 0.16} {'loss': 0.5601, 'learning_rate': 1.987920080594032e-05, 'epoch': 0.16} {'loss': 0.4908, 'learning_rate': 1.9879148735844046e-05, 'epoch': 0.16} {'loss': 0.3482, 'learning_rate': 1.9879096654596094e-05, 'epoch': 0.16} {'loss': 0.4688, 'learning_rate': 1.987904456219652e-05, 'epoch': 0.16} {'loss': 0.627, 'learning_rate': 1.9878992458645378e-05, 'epoch': 0.16} {'loss': 0.7239, 'learning_rate': 1.987894034394274e-05, 'epoch': 0.16} {'loss': 0.6515, 'learning_rate': 1.9878888218088654e-05, 'epoch': 0.16} {'loss': 0.4706, 'learning_rate': 1.987883608108318e-05, 'epoch': 0.16} {'loss': 0.676, 'learning_rate': 1.987878393292638e-05, 'epoch': 0.16} {'loss': 0.5448, 'learning_rate': 1.9878731773618313e-05, 'epoch': 0.16} {'loss': 0.6786, 'learning_rate': 1.9878679603159032e-05, 'epoch': 0.16} {'loss': 0.4216, 'learning_rate': 1.9878627421548603e-05, 'epoch': 0.16} {'loss': 0.6404, 'learning_rate': 1.9878575228787083e-05, 'epoch': 0.16} {'loss': 0.4986, 'learning_rate': 1.9878523024874528e-05, 'epoch': 0.16} {'loss': 0.5919, 'learning_rate': 1.9878470809811e-05, 'epoch': 0.16} {'loss': 0.6748, 'learning_rate': 1.9878418583596558e-05, 'epoch': 0.16} {'loss': 0.4556, 'learning_rate': 1.987836634623126e-05, 'epoch': 0.16} {'loss': 0.4549, 'learning_rate': 1.9878314097715165e-05, 'epoch': 0.16} {'loss': 0.5904, 'learning_rate': 1.9878261838048326e-05, 'epoch': 0.16} {'loss': 0.4224, 'learning_rate': 1.9878209567230816e-05, 'epoch': 0.16} {'loss': 0.5147, 'learning_rate': 1.987815728526268e-05, 'epoch': 0.16} {'loss': 0.7226, 'learning_rate': 1.9878104992143985e-05, 'epoch': 0.16} {'loss': 0.6374, 'learning_rate': 1.987805268787479e-05, 'epoch': 0.16} {'loss': 0.6126, 'learning_rate': 1.9878000372455147e-05, 'epoch': 0.16} {'loss': 0.4209, 'learning_rate': 1.9877948045885126e-05, 'epoch': 0.16} {'loss': 0.5143, 'learning_rate': 1.9877895708164777e-05, 'epoch': 0.16} {'loss': 0.4219, 'learning_rate': 1.987784335929416e-05, 'epoch': 0.16} {'loss': 0.5333, 'learning_rate': 1.9877790999273337e-05, 'epoch': 0.16} {'loss': 0.4798, 'learning_rate': 1.987773862810237e-05, 'epoch': 0.16} {'loss': 0.744, 'learning_rate': 1.987768624578131e-05, 'epoch': 0.16} {'loss': 0.5621, 'learning_rate': 1.9877633852310225e-05, 'epoch': 0.16} {'loss': 0.6199, 'learning_rate': 1.9877581447689167e-05, 'epoch': 0.16} {'loss': 0.5119, 'learning_rate': 1.9877529031918197e-05, 'epoch': 0.16} {'loss': 0.5257, 'learning_rate': 1.9877476604997374e-05, 'epoch': 0.16} {'loss': 0.5353, 'learning_rate': 1.987742416692676e-05, 'epoch': 0.16} {'loss': 0.5406, 'learning_rate': 1.9877371717706416e-05, 'epoch': 0.16} {'loss': 0.5457, 'learning_rate': 1.9877319257336394e-05, 'epoch': 0.16} {'loss': 0.6271, 'learning_rate': 1.9877266785816755e-05, 'epoch': 0.16} {'loss': 0.6214, 'learning_rate': 1.9877214303147564e-05, 'epoch': 0.16} {'loss': 0.5332, 'learning_rate': 1.9877161809328875e-05, 'epoch': 0.16} {'loss': 0.6697, 'learning_rate': 1.9877109304360745e-05, 'epoch': 0.16} {'loss': 0.6572, 'learning_rate': 1.987705678824324e-05, 'epoch': 0.16} {'loss': 0.3923, 'learning_rate': 1.9877004260976415e-05, 'epoch': 0.16} {'loss': 0.4512, 'learning_rate': 1.9876951722560333e-05, 'epoch': 0.16} {'loss': 0.6465, 'learning_rate': 1.987689917299505e-05, 'epoch': 0.16} {'loss': 0.5664, 'learning_rate': 1.9876846612280624e-05, 'epoch': 0.16} {'loss': 0.5778, 'learning_rate': 1.987679404041712e-05, 'epoch': 0.16} {'loss': 0.5673, 'learning_rate': 1.9876741457404586e-05, 'epoch': 0.16} {'loss': 0.6983, 'learning_rate': 1.9876688863243097e-05, 'epoch': 0.16} {'loss': 0.4214, 'learning_rate': 1.9876636257932704e-05, 'epoch': 0.16} {'loss': 0.674, 'learning_rate': 1.9876583641473462e-05, 'epoch': 0.16} {'loss': 0.5698, 'learning_rate': 1.9876531013865438e-05, 'epoch': 0.16} {'loss': 0.4871, 'learning_rate': 1.9876478375108688e-05, 'epoch': 0.16} {'loss': 0.5844, 'learning_rate': 1.987642572520327e-05, 'epoch': 0.16} {'loss': 0.6271, 'learning_rate': 1.987637306414925e-05, 'epoch': 0.16} {'loss': 0.513, 'learning_rate': 1.9876320391946678e-05, 'epoch': 0.16} {'loss': 0.5456, 'learning_rate': 1.987626770859562e-05, 'epoch': 0.16} {'loss': 0.5288, 'learning_rate': 1.9876215014096135e-05, 'epoch': 0.16} {'loss': 0.5452, 'learning_rate': 1.987616230844828e-05, 'epoch': 0.16} {'loss': 0.5806, 'learning_rate': 1.987610959165212e-05, 'epoch': 0.16} {'loss': 0.5453, 'learning_rate': 1.9876056863707703e-05, 'epoch': 0.16} {'loss': 0.5836, 'learning_rate': 1.9876004124615103e-05, 'epoch': 0.16} {'loss': 0.4953, 'learning_rate': 1.987595137437437e-05, 'epoch': 0.16} {'loss': 0.5514, 'learning_rate': 1.9875898612985565e-05, 'epoch': 0.16} {'loss': 0.5611, 'learning_rate': 1.9875845840448747e-05, 'epoch': 0.16} {'loss': 0.5496, 'learning_rate': 1.987579305676398e-05, 'epoch': 0.16} {'loss': 0.5, 'learning_rate': 1.9875740261931318e-05, 'epoch': 0.16} {'loss': 0.5812, 'learning_rate': 1.9875687455950823e-05, 'epoch': 0.16} {'loss': 0.4386, 'learning_rate': 1.9875634638822555e-05, 'epoch': 0.16} {'loss': 0.5437, 'learning_rate': 1.9875581810546577e-05, 'epoch': 0.16} {'loss': 0.5762, 'learning_rate': 1.987552897112294e-05, 'epoch': 0.16} {'loss': 0.6222, 'learning_rate': 1.9875476120551712e-05, 'epoch': 0.16} {'loss': 0.6606, 'learning_rate': 1.9875423258832952e-05, 'epoch': 0.16} {'loss': 0.5811, 'learning_rate': 1.987537038596671e-05, 'epoch': 0.16} {'loss': 0.4613, 'learning_rate': 1.987531750195306e-05, 'epoch': 0.16} {'loss': 0.4711, 'learning_rate': 1.987526460679205e-05, 'epoch': 0.16} {'loss': 0.5455, 'learning_rate': 1.9875211700483744e-05, 'epoch': 0.16} {'loss': 0.5067, 'learning_rate': 1.98751587830282e-05, 'epoch': 0.16} {'loss': 0.5013, 'learning_rate': 1.9875105854425484e-05, 'epoch': 0.16} {'loss': 0.5976, 'learning_rate': 1.987505291467565e-05, 'epoch': 0.16} {'loss': 0.6653, 'learning_rate': 1.987499996377876e-05, 'epoch': 0.16} {'loss': 0.7546, 'learning_rate': 1.9874947001734873e-05, 'epoch': 0.16} {'loss': 0.6117, 'learning_rate': 1.9874894028544047e-05, 'epoch': 0.16} {'loss': 0.5557, 'learning_rate': 1.9874841044206345e-05, 'epoch': 0.16} {'loss': 0.4921, 'learning_rate': 1.987478804872182e-05, 'epoch': 0.16} {'loss': 0.4961, 'learning_rate': 1.987473504209054e-05, 'epoch': 0.16} {'loss': 0.3798, 'learning_rate': 1.9874682024312565e-05, 'epoch': 0.16} {'loss': 0.5506, 'learning_rate': 1.987462899538795e-05, 'epoch': 0.16} {'loss': 0.6097, 'learning_rate': 1.9874575955316758e-05, 'epoch': 0.16} {'loss': 0.5956, 'learning_rate': 1.9874522904099045e-05, 'epoch': 0.16} {'loss': 0.6375, 'learning_rate': 1.9874469841734874e-05, 'epoch': 0.16} {'loss': 0.5278, 'learning_rate': 1.98744167682243e-05, 'epoch': 0.16} {'loss': 0.5451, 'learning_rate': 1.9874363683567396e-05, 'epoch': 0.16} {'loss': 0.4112, 'learning_rate': 1.9874310587764207e-05, 'epoch': 0.16} {'loss': 0.6005, 'learning_rate': 1.98742574808148e-05, 'epoch': 0.16} {'loss': 0.5357, 'learning_rate': 1.9874204362719235e-05, 'epoch': 0.16} {'loss': 0.5882, 'learning_rate': 1.987415123347757e-05, 'epoch': 0.16} {'loss': 0.6031, 'learning_rate': 1.9874098093089867e-05, 'epoch': 0.16} {'loss': 0.6158, 'learning_rate': 1.9874044941556186e-05, 'epoch': 0.16} {'loss': 0.5811, 'learning_rate': 1.9873991778876585e-05, 'epoch': 0.16} {'loss': 0.6537, 'learning_rate': 1.9873938605051125e-05, 'epoch': 0.16} {'loss': 0.515, 'learning_rate': 1.9873885420079863e-05, 'epoch': 0.16} {'loss': 0.6102, 'learning_rate': 1.9873832223962867e-05, 'epoch': 0.16} {'loss': 0.6778, 'learning_rate': 1.9873779016700188e-05, 'epoch': 0.16} {'loss': 0.6421, 'learning_rate': 1.987372579829189e-05, 'epoch': 0.16} {'loss': 0.5233, 'learning_rate': 1.9873672568738035e-05, 'epoch': 0.16} {'loss': 0.5585, 'learning_rate': 1.987361932803868e-05, 'epoch': 0.16} {'loss': 0.5253, 'learning_rate': 1.987356607619389e-05, 'epoch': 0.16} {'loss': 0.4093, 'learning_rate': 1.9873512813203717e-05, 'epoch': 0.16} {'loss': 0.4342, 'learning_rate': 1.9873459539068224e-05, 'epoch': 0.16} {'loss': 0.5118, 'learning_rate': 1.9873406253787478e-05, 'epoch': 0.16} {'loss': 0.5295, 'learning_rate': 1.987335295736153e-05, 'epoch': 0.16} {'loss': 0.3734, 'learning_rate': 1.987329964979045e-05, 'epoch': 0.16} {'loss': 0.4729, 'learning_rate': 1.9873246331074287e-05, 'epoch': 0.16} {'loss': 0.6755, 'learning_rate': 1.9873193001213106e-05, 'epoch': 0.16} {'loss': 0.4992, 'learning_rate': 1.9873139660206967e-05, 'epoch': 0.16} {'loss': 0.6274, 'learning_rate': 1.9873086308055935e-05, 'epoch': 0.16} {'loss': 0.5108, 'learning_rate': 1.9873032944760063e-05, 'epoch': 0.16} {'loss': 0.6453, 'learning_rate': 1.9872979570319413e-05, 'epoch': 0.16} {'loss': 0.5056, 'learning_rate': 1.987292618473405e-05, 'epoch': 0.16} {'loss': 0.3832, 'learning_rate': 1.987287278800403e-05, 'epoch': 0.16} {'loss': 0.5193, 'learning_rate': 1.9872819380129412e-05, 'epoch': 0.16} {'loss': 0.6617, 'learning_rate': 1.987276596111026e-05, 'epoch': 0.16} {'loss': 0.4184, 'learning_rate': 1.987271253094663e-05, 'epoch': 0.16} {'loss': 0.5392, 'learning_rate': 1.9872659089638588e-05, 'epoch': 0.16} {'loss': 0.3685, 'learning_rate': 1.987260563718619e-05, 'epoch': 0.16} {'loss': 0.5402, 'learning_rate': 1.9872552173589498e-05, 'epoch': 0.16} {'loss': 0.6032, 'learning_rate': 1.987249869884857e-05, 'epoch': 0.16} {'loss': 0.5516, 'learning_rate': 1.9872445212963473e-05, 'epoch': 0.16} {'loss': 0.5994, 'learning_rate': 1.9872391715934258e-05, 'epoch': 0.16} {'loss': 0.5818, 'learning_rate': 1.987233820776099e-05, 'epoch': 0.16} {'loss': 0.5489, 'learning_rate': 1.9872284688443733e-05, 'epoch': 0.16} {'loss': 0.4008, 'learning_rate': 1.987223115798254e-05, 'epoch': 0.16} {'loss': 0.5673, 'learning_rate': 1.987217761637748e-05, 'epoch': 0.16} {'loss': 0.5925, 'learning_rate': 1.9872124063628605e-05, 'epoch': 0.16} {'loss': 0.5291, 'learning_rate': 1.987207049973598e-05, 'epoch': 0.16} {'loss': 0.5123, 'learning_rate': 1.9872016924699667e-05, 'epoch': 0.16} {'loss': 0.7035, 'learning_rate': 1.9871963338519724e-05, 'epoch': 0.16} {'loss': 0.5068, 'learning_rate': 1.9871909741196207e-05, 'epoch': 0.16} {'loss': 0.5384, 'learning_rate': 1.9871856132729187e-05, 'epoch': 0.16} {'loss': 0.5178, 'learning_rate': 1.9871802513118713e-05, 'epoch': 0.16} {'loss': 0.6359, 'learning_rate': 1.9871748882364853e-05, 'epoch': 0.16} {'loss': 0.4398, 'learning_rate': 1.9871695240467668e-05, 'epoch': 0.16} {'loss': 0.4045, 'learning_rate': 1.9871641587427215e-05, 'epoch': 0.16} {'loss': 0.6479, 'learning_rate': 1.9871587923243557e-05, 'epoch': 0.16} {'loss': 0.6162, 'learning_rate': 1.987153424791675e-05, 'epoch': 0.16} {'loss': 0.3117, 'learning_rate': 1.987148056144686e-05, 'epoch': 0.16} {'loss': 0.4486, 'learning_rate': 1.9871426863833946e-05, 'epoch': 0.16} {'loss': 0.4836, 'learning_rate': 1.987137315507807e-05, 'epoch': 0.16} {'loss': 0.5209, 'learning_rate': 1.9871319435179286e-05, 'epoch': 0.16} {'loss': 0.4924, 'learning_rate': 1.9871265704137664e-05, 'epoch': 0.16} {'loss': 0.412, 'learning_rate': 1.9871211961953255e-05, 'epoch': 0.16} {'loss': 0.6782, 'learning_rate': 1.9871158208626128e-05, 'epoch': 0.16} {'loss': 0.4432, 'learning_rate': 1.987110444415634e-05, 'epoch': 0.16} {'loss': 0.6054, 'learning_rate': 1.9871050668543956e-05, 'epoch': 0.16} {'loss': 0.7681, 'learning_rate': 1.9870996881789032e-05, 'epoch': 0.16} {'loss': 0.5757, 'learning_rate': 1.9870943083891624e-05, 'epoch': 0.16} {'loss': 0.6401, 'learning_rate': 1.9870889274851803e-05, 'epoch': 0.16} {'loss': 0.6685, 'learning_rate': 1.9870835454669622e-05, 'epoch': 0.16} {'loss': 0.5831, 'learning_rate': 1.9870781623345147e-05, 'epoch': 0.16} {'loss': 0.5772, 'learning_rate': 1.9870727780878437e-05, 'epoch': 0.16} {'loss': 0.6329, 'learning_rate': 1.9870673927269548e-05, 'epoch': 0.16} {'loss': 0.5492, 'learning_rate': 1.987062006251855e-05, 'epoch': 0.16} {'loss': 0.5953, 'learning_rate': 1.9870566186625498e-05, 'epoch': 0.16} {'loss': 0.5533, 'learning_rate': 1.9870512299590453e-05, 'epoch': 0.16} {'loss': 0.6635, 'learning_rate': 1.9870458401413475e-05, 'epoch': 0.16} {'loss': 0.3068, 'learning_rate': 1.987040449209463e-05, 'epoch': 0.16} {'loss': 0.4698, 'learning_rate': 1.9870350571633973e-05, 'epoch': 0.16} {'loss': 0.5913, 'learning_rate': 1.9870296640031567e-05, 'epoch': 0.16} {'loss': 0.6106, 'learning_rate': 1.9870242697287473e-05, 'epoch': 0.16} {'loss': 0.3999, 'learning_rate': 1.987018874340175e-05, 'epoch': 0.16} {'loss': 0.4633, 'learning_rate': 1.9870134778374467e-05, 'epoch': 0.16} {'loss': 0.6907, 'learning_rate': 1.9870080802205673e-05, 'epoch': 0.16} {'loss': 0.5681, 'learning_rate': 1.9870026814895435e-05, 'epoch': 0.16} {'loss': 0.5045, 'learning_rate': 1.9869972816443817e-05, 'epoch': 0.16} {'loss': 0.4856, 'learning_rate': 1.9869918806850873e-05, 'epoch': 0.16} {'loss': 0.5363, 'learning_rate': 1.986986478611667e-05, 'epoch': 0.16} {'loss': 0.563, 'learning_rate': 1.986981075424127e-05, 'epoch': 0.16} {'loss': 0.5936, 'learning_rate': 1.9869756711224723e-05, 'epoch': 0.16} {'loss': 0.5689, 'learning_rate': 1.98697026570671e-05, 'epoch': 0.16} {'loss': 0.4488, 'learning_rate': 1.9869648591768464e-05, 'epoch': 0.16} {'loss': 0.5601, 'learning_rate': 1.9869594515328866e-05, 'epoch': 0.16} {'loss': 0.5299, 'learning_rate': 1.9869540427748372e-05, 'epoch': 0.16} {'loss': 0.7023, 'learning_rate': 1.9869486329027047e-05, 'epoch': 0.16} {'loss': 0.519, 'learning_rate': 1.9869432219164948e-05, 'epoch': 0.16} {'loss': 0.7365, 'learning_rate': 1.9869378098162136e-05, 'epoch': 0.16} {'loss': 0.3249, 'learning_rate': 1.9869323966018673e-05, 'epoch': 0.16} {'loss': 0.5798, 'learning_rate': 1.986926982273462e-05, 'epoch': 0.16} {'loss': 0.4783, 'learning_rate': 1.986921566831004e-05, 'epoch': 0.16} {'loss': 0.6189, 'learning_rate': 1.986916150274499e-05, 'epoch': 0.16} {'loss': 0.4705, 'learning_rate': 1.9869107326039534e-05, 'epoch': 0.16} {'loss': 0.4838, 'learning_rate': 1.986905313819373e-05, 'epoch': 0.16} {'loss': 0.6608, 'learning_rate': 1.9868998939207645e-05, 'epoch': 0.16} {'loss': 0.4717, 'learning_rate': 1.9868944729081335e-05, 'epoch': 0.16} {'loss': 0.6755, 'learning_rate': 1.9868890507814868e-05, 'epoch': 0.16} {'loss': 0.4658, 'learning_rate': 1.9868836275408294e-05, 'epoch': 0.16} {'loss': 0.5226, 'learning_rate': 1.9868782031861686e-05, 'epoch': 0.16} {'loss': 0.4839, 'learning_rate': 1.9868727777175093e-05, 'epoch': 0.16} {'loss': 0.5951, 'learning_rate': 1.9868673511348587e-05, 'epoch': 0.16} {'loss': 0.5595, 'learning_rate': 1.9868619234382226e-05, 'epoch': 0.16} {'loss': 0.5452, 'learning_rate': 1.986856494627607e-05, 'epoch': 0.16} {'loss': 0.6278, 'learning_rate': 1.9868510647030178e-05, 'epoch': 0.16} {'loss': 0.5346, 'learning_rate': 1.9868456336644616e-05, 'epoch': 0.16} {'loss': 0.6911, 'learning_rate': 1.9868402015119446e-05, 'epoch': 0.16} {'loss': 0.4664, 'learning_rate': 1.9868347682454723e-05, 'epoch': 0.16} {'loss': 0.6459, 'learning_rate': 1.9868293338650513e-05, 'epoch': 0.16} {'loss': 0.617, 'learning_rate': 1.9868238983706875e-05, 'epoch': 0.16} {'loss': 0.7659, 'learning_rate': 1.9868184617623876e-05, 'epoch': 0.16} {'loss': 0.5262, 'learning_rate': 1.986813024040157e-05, 'epoch': 0.16} {'loss': 0.6965, 'learning_rate': 1.9868075852040022e-05, 'epoch': 0.16} {'loss': 0.5636, 'learning_rate': 1.9868021452539293e-05, 'epoch': 0.16} {'loss': 0.5469, 'learning_rate': 1.9867967041899443e-05, 'epoch': 0.16} {'loss': 0.5046, 'learning_rate': 1.9867912620120535e-05, 'epoch': 0.16} {'loss': 0.4668, 'learning_rate': 1.986785818720263e-05, 'epoch': 0.16} {'loss': 0.6863, 'learning_rate': 1.986780374314579e-05, 'epoch': 0.16} {'loss': 0.5759, 'learning_rate': 1.9867749287950077e-05, 'epoch': 0.16} {'loss': 0.5755, 'learning_rate': 1.986769482161555e-05, 'epoch': 0.16} {'loss': 0.5222, 'learning_rate': 1.9867640344142275e-05, 'epoch': 0.16} {'loss': 0.4059, 'learning_rate': 1.9867585855530306e-05, 'epoch': 0.16} {'loss': 0.5225, 'learning_rate': 1.9867531355779714e-05, 'epoch': 0.16} {'loss': 0.4763, 'learning_rate': 1.986747684489055e-05, 'epoch': 0.16} {'loss': 0.5389, 'learning_rate': 1.9867422322862887e-05, 'epoch': 0.16} {'loss': 0.5979, 'learning_rate': 1.9867367789696777e-05, 'epoch': 0.16} {'loss': 0.6306, 'learning_rate': 1.9867313245392286e-05, 'epoch': 0.16} {'loss': 0.6899, 'learning_rate': 1.9867258689949475e-05, 'epoch': 0.16} {'loss': 0.5636, 'learning_rate': 1.9867204123368403e-05, 'epoch': 0.16} {'loss': 0.462, 'learning_rate': 1.9867149545649137e-05, 'epoch': 0.16} {'loss': 0.6464, 'learning_rate': 1.9867094956791733e-05, 'epoch': 0.16} {'loss': 0.5937, 'learning_rate': 1.9867040356796255e-05, 'epoch': 0.16} {'loss': 0.5974, 'learning_rate': 1.9866985745662765e-05, 'epoch': 0.16} {'loss': 0.5448, 'learning_rate': 1.9866931123391327e-05, 'epoch': 0.16} {'loss': 0.6405, 'learning_rate': 1.9866876489981996e-05, 'epoch': 0.16} {'loss': 0.5964, 'learning_rate': 1.9866821845434842e-05, 'epoch': 0.16} {'loss': 0.4495, 'learning_rate': 1.986676718974992e-05, 'epoch': 0.16} {'loss': 0.6084, 'learning_rate': 1.9866712522927293e-05, 'epoch': 0.16} {'loss': 0.5389, 'learning_rate': 1.9866657844967027e-05, 'epoch': 0.16} {'loss': 0.6726, 'learning_rate': 1.986660315586918e-05, 'epoch': 0.16} {'loss': 0.6033, 'learning_rate': 1.986654845563381e-05, 'epoch': 0.16} {'loss': 0.5035, 'learning_rate': 1.9866493744260987e-05, 'epoch': 0.16} {'loss': 0.4635, 'learning_rate': 1.9866439021750766e-05, 'epoch': 0.16} {'loss': 0.4849, 'learning_rate': 1.9866384288103213e-05, 'epoch': 0.16} {'loss': 0.6093, 'learning_rate': 1.986632954331839e-05, 'epoch': 0.16} {'loss': 0.7686, 'learning_rate': 1.9866274787396355e-05, 'epoch': 0.16} {'loss': 0.6529, 'learning_rate': 1.9866220020337174e-05, 'epoch': 0.16} {'loss': 0.4533, 'learning_rate': 1.9866165242140906e-05, 'epoch': 0.16} {'loss': 0.4157, 'learning_rate': 1.986611045280761e-05, 'epoch': 0.16} {'loss': 0.6597, 'learning_rate': 1.9866055652337355e-05, 'epoch': 0.16} {'loss': 0.6439, 'learning_rate': 1.9866000840730198e-05, 'epoch': 0.16} {'loss': 0.5363, 'learning_rate': 1.9865946017986204e-05, 'epoch': 0.16} {'loss': 0.5131, 'learning_rate': 1.986589118410543e-05, 'epoch': 0.16} {'loss': 0.4272, 'learning_rate': 1.9865836339087943e-05, 'epoch': 0.16} {'loss': 0.5069, 'learning_rate': 1.9865781482933806e-05, 'epoch': 0.16} {'loss': 0.5373, 'learning_rate': 1.986572661564307e-05, 'epoch': 0.16} {'loss': 0.5634, 'learning_rate': 1.9865671737215813e-05, 'epoch': 0.16} {'loss': 0.6795, 'learning_rate': 1.9865616847652083e-05, 'epoch': 0.16} {'loss': 0.5952, 'learning_rate': 1.986556194695195e-05, 'epoch': 0.16} {'loss': 0.5466, 'learning_rate': 1.9865507035115473e-05, 'epoch': 0.16} {'loss': 0.6747, 'learning_rate': 1.9865452112142717e-05, 'epoch': 0.16} {'loss': 0.6924, 'learning_rate': 1.9865397178033738e-05, 'epoch': 0.16} {'loss': 0.6563, 'learning_rate': 1.9865342232788604e-05, 'epoch': 0.16} {'loss': 0.5512, 'learning_rate': 1.986528727640737e-05, 'epoch': 0.16} {'loss': 0.5906, 'learning_rate': 1.986523230889011e-05, 'epoch': 0.16} {'loss': 0.4598, 'learning_rate': 1.986517733023687e-05, 'epoch': 0.16} {'loss': 0.4488, 'learning_rate': 1.9865122340447726e-05, 'epoch': 0.16} {'loss': 0.586, 'learning_rate': 1.9865067339522735e-05, 'epoch': 0.16} {'loss': 0.5541, 'learning_rate': 1.9865012327461958e-05, 'epoch': 0.16} {'loss': 0.518, 'learning_rate': 1.986495730426546e-05, 'epoch': 0.16} {'loss': 0.5568, 'learning_rate': 1.98649022699333e-05, 'epoch': 0.16} {'loss': 0.5169, 'learning_rate': 1.986484722446554e-05, 'epoch': 0.16} {'loss': 0.5286, 'learning_rate': 1.986479216786224e-05, 'epoch': 0.16} {'loss': 0.5554, 'learning_rate': 1.986473710012347e-05, 'epoch': 0.16} {'loss': 0.4566, 'learning_rate': 1.986468202124929e-05, 'epoch': 0.16} {'loss': 0.4999, 'learning_rate': 1.9864626931239756e-05, 'epoch': 0.16} {'loss': 0.5394, 'learning_rate': 1.986457183009493e-05, 'epoch': 0.16} {'loss': 0.4239, 'learning_rate': 1.9864516717814886e-05, 'epoch': 0.16} {'loss': 0.4424, 'learning_rate': 1.9864461594399675e-05, 'epoch': 0.16} {'loss': 0.6202, 'learning_rate': 1.9864406459849365e-05, 'epoch': 0.16} {'loss': 0.5995, 'learning_rate': 1.9864351314164014e-05, 'epoch': 0.16} {'loss': 0.6772, 'learning_rate': 1.9864296157343686e-05, 'epoch': 0.16} {'loss': 0.4488, 'learning_rate': 1.9864240989388443e-05, 'epoch': 0.16} {'loss': 0.518, 'learning_rate': 1.986418581029835e-05, 'epoch': 0.16} {'loss': 0.4775, 'learning_rate': 1.986413062007346e-05, 'epoch': 0.16} {'loss': 0.5368, 'learning_rate': 1.986407541871385e-05, 'epoch': 0.16} {'loss': 0.5901, 'learning_rate': 1.9864020206219573e-05, 'epoch': 0.16} {'loss': 0.5295, 'learning_rate': 1.9863964982590694e-05, 'epoch': 0.16} {'loss': 0.4122, 'learning_rate': 1.9863909747827272e-05, 'epoch': 0.16} {'loss': 0.4907, 'learning_rate': 1.9863854501929372e-05, 'epoch': 0.16} {'loss': 0.7042, 'learning_rate': 1.9863799244897058e-05, 'epoch': 0.16} {'loss': 0.6453, 'learning_rate': 1.9863743976730387e-05, 'epoch': 0.16} {'loss': 0.6081, 'learning_rate': 1.9863688697429424e-05, 'epoch': 0.16} {'loss': 0.5168, 'learning_rate': 1.9863633406994233e-05, 'epoch': 0.16} {'loss': 0.5462, 'learning_rate': 1.986357810542488e-05, 'epoch': 0.16} {'loss': 0.5368, 'learning_rate': 1.986352279272142e-05, 'epoch': 0.16} {'loss': 0.5898, 'learning_rate': 1.9863467468883918e-05, 'epoch': 0.16} {'loss': 0.6292, 'learning_rate': 1.9863412133912432e-05, 'epoch': 0.16} {'loss': 0.5648, 'learning_rate': 1.9863356787807038e-05, 'epoch': 0.16} {'loss': 0.4803, 'learning_rate': 1.986330143056779e-05, 'epoch': 0.16} {'loss': 0.5429, 'learning_rate': 1.986324606219474e-05, 'epoch': 0.16} {'loss': 0.5083, 'learning_rate': 1.986319068268797e-05, 'epoch': 0.16} {'loss': 0.6265, 'learning_rate': 1.986313529204753e-05, 'epoch': 0.16} {'loss': 0.5809, 'learning_rate': 1.9863079890273487e-05, 'epoch': 0.16} {'loss': 0.6284, 'learning_rate': 1.98630244773659e-05, 'epoch': 0.16} {'loss': 0.5062, 'learning_rate': 1.9862969053324835e-05, 'epoch': 0.16} {'loss': 0.6154, 'learning_rate': 1.9862913618150355e-05, 'epoch': 0.16} {'loss': 0.5537, 'learning_rate': 1.986285817184252e-05, 'epoch': 0.16} {'loss': 0.4735, 'learning_rate': 1.9862802714401392e-05, 'epoch': 0.16} {'loss': 0.5222, 'learning_rate': 1.9862747245827038e-05, 'epoch': 0.16} {'loss': 0.5907, 'learning_rate': 1.9862691766119516e-05, 'epoch': 0.16} {'loss': 0.5071, 'learning_rate': 1.986263627527889e-05, 'epoch': 0.16} {'loss': 0.487, 'learning_rate': 1.9862580773305228e-05, 'epoch': 0.16} {'loss': 0.5072, 'learning_rate': 1.9862525260198584e-05, 'epoch': 0.16} {'loss': 0.6586, 'learning_rate': 1.9862469735959023e-05, 'epoch': 0.16} {'loss': 0.6815, 'learning_rate': 1.986241420058661e-05, 'epoch': 0.16} {'loss': 0.5284, 'learning_rate': 1.986235865408141e-05, 'epoch': 0.16} {'loss': 0.5991, 'learning_rate': 1.986230309644348e-05, 'epoch': 0.16} {'loss': 0.5619, 'learning_rate': 1.9862247527672882e-05, 'epoch': 0.16} {'loss': 0.6261, 'learning_rate': 1.9862191947769688e-05, 'epoch': 0.16} {'loss': 0.6733, 'learning_rate': 1.986213635673395e-05, 'epoch': 0.16} {'loss': 0.608, 'learning_rate': 1.9862080754565734e-05, 'epoch': 0.16} {'loss': 0.7352, 'learning_rate': 1.9862025141265108e-05, 'epoch': 0.16} {'loss': 0.5721, 'learning_rate': 1.9861969516832134e-05, 'epoch': 0.16} {'loss': 0.557, 'learning_rate': 1.9861913881266867e-05, 'epoch': 0.16} {'loss': 0.5175, 'learning_rate': 1.9861858234569375e-05, 'epoch': 0.16} {'loss': 0.6521, 'learning_rate': 1.986180257673972e-05, 'epoch': 0.16} {'loss': 0.508, 'learning_rate': 1.9861746907777965e-05, 'epoch': 0.16} {'loss': 0.4952, 'learning_rate': 1.9861691227684176e-05, 'epoch': 0.16} {'loss': 0.6256, 'learning_rate': 1.9861635536458412e-05, 'epoch': 0.16} {'loss': 0.3996, 'learning_rate': 1.9861579834100735e-05, 'epoch': 0.16} {'loss': 0.4319, 'learning_rate': 1.9861524120611212e-05, 'epoch': 0.16} {'loss': 0.5428, 'learning_rate': 1.9861468395989904e-05, 'epoch': 0.16} {'loss': 0.6168, 'learning_rate': 1.986141266023687e-05, 'epoch': 0.16} {'loss': 0.554, 'learning_rate': 1.9861356913352177e-05, 'epoch': 0.17} {'loss': 0.3338, 'learning_rate': 1.9861301155335887e-05, 'epoch': 0.17} {'loss': 0.5485, 'learning_rate': 1.9861245386188062e-05, 'epoch': 0.17} {'loss': 0.5425, 'learning_rate': 1.986118960590877e-05, 'epoch': 0.17} {'loss': 0.4282, 'learning_rate': 1.9861133814498072e-05, 'epoch': 0.17} {'loss': 0.6517, 'learning_rate': 1.9861078011956024e-05, 'epoch': 0.17} {'loss': 0.4496, 'learning_rate': 1.9861022198282693e-05, 'epoch': 0.17} {'loss': 0.5216, 'learning_rate': 1.9860966373478147e-05, 'epoch': 0.17} {'loss': 0.3482, 'learning_rate': 1.9860910537542445e-05, 'epoch': 0.17} {'loss': 0.4618, 'learning_rate': 1.9860854690475647e-05, 'epoch': 0.17} {'loss': 0.5781, 'learning_rate': 1.9860798832277822e-05, 'epoch': 0.17} {'loss': 0.4002, 'learning_rate': 1.986074296294903e-05, 'epoch': 0.17} {'loss': 0.4776, 'learning_rate': 1.9860687082489332e-05, 'epoch': 0.17} {'loss': 0.5495, 'learning_rate': 1.9860631190898796e-05, 'epoch': 0.17} {'loss': 0.4482, 'learning_rate': 1.986057528817748e-05, 'epoch': 0.17} {'loss': 0.7109, 'learning_rate': 1.9860519374325455e-05, 'epoch': 0.17} {'loss': 0.5675, 'learning_rate': 1.9860463449342772e-05, 'epoch': 0.17} {'loss': 0.5204, 'learning_rate': 1.9860407513229504e-05, 'epoch': 0.17} {'loss': 0.7437, 'learning_rate': 1.986035156598571e-05, 'epoch': 0.17} {'loss': 0.5733, 'learning_rate': 1.9860295607611455e-05, 'epoch': 0.17} {'loss': 0.5615, 'learning_rate': 1.9860239638106802e-05, 'epoch': 0.17} {'loss': 0.6596, 'learning_rate': 1.9860183657471812e-05, 'epoch': 0.17} {'loss': 0.4759, 'learning_rate': 1.986012766570655e-05, 'epoch': 0.17} {'loss': 0.5728, 'learning_rate': 1.986007166281108e-05, 'epoch': 0.17} {'loss': 0.538, 'learning_rate': 1.9860015648785463e-05, 'epoch': 0.17} {'loss': 0.4608, 'learning_rate': 1.9859959623629767e-05, 'epoch': 0.17} {'loss': 0.5852, 'learning_rate': 1.9859903587344044e-05, 'epoch': 0.17} {'loss': 0.5501, 'learning_rate': 1.985984753992837e-05, 'epoch': 0.17} {'loss': 0.4766, 'learning_rate': 1.98597914813828e-05, 'epoch': 0.17} {'loss': 0.5471, 'learning_rate': 1.9859735411707403e-05, 'epoch': 0.17} {'loss': 0.5385, 'learning_rate': 1.9859679330902238e-05, 'epoch': 0.17} {'loss': 0.5031, 'learning_rate': 1.9859623238967373e-05, 'epoch': 0.17} {'loss': 0.6107, 'learning_rate': 1.9859567135902864e-05, 'epoch': 0.17} {'loss': 0.6319, 'learning_rate': 1.9859511021708782e-05, 'epoch': 0.17} {'loss': 0.6301, 'learning_rate': 1.9859454896385186e-05, 'epoch': 0.17} {'loss': 0.4804, 'learning_rate': 1.985939875993214e-05, 'epoch': 0.17} {'loss': 0.5431, 'learning_rate': 1.9859342612349706e-05, 'epoch': 0.17} {'loss': 0.5911, 'learning_rate': 1.985928645363795e-05, 'epoch': 0.17} {'loss': 0.4722, 'learning_rate': 1.9859230283796935e-05, 'epoch': 0.17} {'loss': 0.5582, 'learning_rate': 1.9859174102826727e-05, 'epoch': 0.17} {'loss': 0.7273, 'learning_rate': 1.985911791072738e-05, 'epoch': 0.17} {'loss': 0.5031, 'learning_rate': 1.9859061707498965e-05, 'epoch': 0.17} {'loss': 0.4723, 'learning_rate': 1.9859005493141546e-05, 'epoch': 0.17} {'loss': 0.5148, 'learning_rate': 1.985894926765519e-05, 'epoch': 0.17} {'loss': 0.4752, 'learning_rate': 1.9858893031039944e-05, 'epoch': 0.17} {'loss': 0.5063, 'learning_rate': 1.985883678329589e-05, 'epoch': 0.17} {'loss': 0.6025, 'learning_rate': 1.985878052442308e-05, 'epoch': 0.17} {'loss': 0.6712, 'learning_rate': 1.9858724254421585e-05, 'epoch': 0.17} {'loss': 0.6236, 'learning_rate': 1.9858667973291465e-05, 'epoch': 0.17} {'loss': 0.4401, 'learning_rate': 1.985861168103278e-05, 'epoch': 0.17} {'loss': 0.6211, 'learning_rate': 1.98585553776456e-05, 'epoch': 0.17} {'loss': 0.5621, 'learning_rate': 1.9858499063129986e-05, 'epoch': 0.17} {'loss': 0.3824, 'learning_rate': 1.9858442737485998e-05, 'epoch': 0.17} {'loss': 0.4302, 'learning_rate': 1.9858386400713704e-05, 'epoch': 0.17} {'loss': 0.4302, 'learning_rate': 1.985833005281317e-05, 'epoch': 0.17} {'loss': 0.7356, 'learning_rate': 1.9858273693784452e-05, 'epoch': 0.17} {'loss': 0.5002, 'learning_rate': 1.985821732362762e-05, 'epoch': 0.17} {'loss': 0.5597, 'learning_rate': 1.9858160942342734e-05, 'epoch': 0.17} {'loss': 0.3875, 'learning_rate': 1.9858104549929856e-05, 'epoch': 0.17} {'loss': 0.544, 'learning_rate': 1.985804814638906e-05, 'epoch': 0.17} {'loss': 0.5846, 'learning_rate': 1.9857991731720396e-05, 'epoch': 0.17} {'loss': 0.6773, 'learning_rate': 1.9857935305923934e-05, 'epoch': 0.17} {'loss': 0.5813, 'learning_rate': 1.9857878868999742e-05, 'epoch': 0.17} {'loss': 0.4509, 'learning_rate': 1.9857822420947875e-05, 'epoch': 0.17} {'loss': 0.4353, 'learning_rate': 1.9857765961768404e-05, 'epoch': 0.17} {'loss': 0.5692, 'learning_rate': 1.9857709491461387e-05, 'epoch': 0.17} {'loss': 0.5005, 'learning_rate': 1.9857653010026894e-05, 'epoch': 0.17} {'loss': 0.5555, 'learning_rate': 1.985759651746498e-05, 'epoch': 0.17} {'loss': 0.5911, 'learning_rate': 1.985754001377572e-05, 'epoch': 0.17} {'loss': 0.5019, 'learning_rate': 1.985748349895917e-05, 'epoch': 0.17} {'loss': 0.5183, 'learning_rate': 1.9857426973015395e-05, 'epoch': 0.17} {'loss': 0.4508, 'learning_rate': 1.9857370435944458e-05, 'epoch': 0.17} {'loss': 0.5049, 'learning_rate': 1.9857313887746425e-05, 'epoch': 0.17} {'loss': 0.5584, 'learning_rate': 1.985725732842136e-05, 'epoch': 0.17} {'loss': 0.5981, 'learning_rate': 1.9857200757969327e-05, 'epoch': 0.17} {'loss': 0.5852, 'learning_rate': 1.9857144176390387e-05, 'epoch': 0.17} {'loss': 0.4116, 'learning_rate': 1.9857087583684605e-05, 'epoch': 0.17} {'loss': 0.5475, 'learning_rate': 1.9857030979852045e-05, 'epoch': 0.17} {'loss': 0.5662, 'learning_rate': 1.9856974364892773e-05, 'epoch': 0.17} {'loss': 0.4807, 'learning_rate': 1.9856917738806852e-05, 'epoch': 0.17} {'loss': 0.6428, 'learning_rate': 1.9856861101594344e-05, 'epoch': 0.17} {'loss': 0.5416, 'learning_rate': 1.9856804453255316e-05, 'epoch': 0.17} {'loss': 0.5621, 'learning_rate': 1.985674779378983e-05, 'epoch': 0.17} {'loss': 0.5559, 'learning_rate': 1.9856691123197945e-05, 'epoch': 0.17} {'loss': 0.5932, 'learning_rate': 1.9856634441479737e-05, 'epoch': 0.17} {'loss': 0.5082, 'learning_rate': 1.985657774863526e-05, 'epoch': 0.17} {'loss': 0.4701, 'learning_rate': 1.985652104466458e-05, 'epoch': 0.17} {'loss': 0.5598, 'learning_rate': 1.9856464329567764e-05, 'epoch': 0.17} {'loss': 0.753, 'learning_rate': 1.9856407603344873e-05, 'epoch': 0.17} {'loss': 0.5548, 'learning_rate': 1.9856350865995974e-05, 'epoch': 0.17} {'loss': 0.5181, 'learning_rate': 1.9856294117521124e-05, 'epoch': 0.17} {'loss': 0.5934, 'learning_rate': 1.9856237357920395e-05, 'epoch': 0.17} {'loss': 0.5785, 'learning_rate': 1.985618058719385e-05, 'epoch': 0.17} {'loss': 0.5394, 'learning_rate': 1.9856123805341553e-05, 'epoch': 0.17} {'loss': 0.6452, 'learning_rate': 1.985606701236356e-05, 'epoch': 0.17} {'loss': 0.5258, 'learning_rate': 1.9856010208259945e-05, 'epoch': 0.17} {'loss': 0.6645, 'learning_rate': 1.9855953393030768e-05, 'epoch': 0.17} {'loss': 0.7502, 'learning_rate': 1.9855896566676097e-05, 'epoch': 0.17} {'loss': 0.7303, 'learning_rate': 1.985583972919599e-05, 'epoch': 0.17} {'loss': 0.2992, 'learning_rate': 1.9855782880590514e-05, 'epoch': 0.17} {'loss': 0.4274, 'learning_rate': 1.9855726020859736e-05, 'epoch': 0.17} {'loss': 0.4235, 'learning_rate': 1.9855669150003716e-05, 'epoch': 0.17} {'loss': 0.4444, 'learning_rate': 1.985561226802252e-05, 'epoch': 0.17} {'loss': 0.6138, 'learning_rate': 1.985555537491621e-05, 'epoch': 0.17} {'loss': 0.5576, 'learning_rate': 1.985549847068485e-05, 'epoch': 0.17} {'loss': 0.6134, 'learning_rate': 1.985544155532851e-05, 'epoch': 0.17} {'loss': 0.6094, 'learning_rate': 1.985538462884725e-05, 'epoch': 0.17} {'loss': 0.6887, 'learning_rate': 1.9855327691241135e-05, 'epoch': 0.17} {'loss': 0.4601, 'learning_rate': 1.985527074251023e-05, 'epoch': 0.17} {'loss': 0.6031, 'learning_rate': 1.98552137826546e-05, 'epoch': 0.17} {'loss': 0.5207, 'learning_rate': 1.9855156811674305e-05, 'epoch': 0.17} {'loss': 0.4816, 'learning_rate': 1.985509982956941e-05, 'epoch': 0.17} {'loss': 0.6267, 'learning_rate': 1.9855042836339983e-05, 'epoch': 0.17} {'loss': 0.5898, 'learning_rate': 1.985498583198609e-05, 'epoch': 0.17} {'loss': 0.4833, 'learning_rate': 1.9854928816507786e-05, 'epoch': 0.17} {'loss': 0.5327, 'learning_rate': 1.9854871789905145e-05, 'epoch': 0.17} {'loss': 0.5458, 'learning_rate': 1.9854814752178227e-05, 'epoch': 0.17} {'loss': 0.5032, 'learning_rate': 1.98547577033271e-05, 'epoch': 0.17} {'loss': 0.7037, 'learning_rate': 1.985470064335182e-05, 'epoch': 0.17} {'loss': 0.536, 'learning_rate': 1.985464357225246e-05, 'epoch': 0.17} {'loss': 0.4452, 'learning_rate': 1.985458649002908e-05, 'epoch': 0.17} {'loss': 0.6523, 'learning_rate': 1.985452939668175e-05, 'epoch': 0.17} {'loss': 0.3176, 'learning_rate': 1.985447229221053e-05, 'epoch': 0.17} {'loss': 0.5648, 'learning_rate': 1.985441517661548e-05, 'epoch': 0.17} {'loss': 0.5799, 'learning_rate': 1.985435804989667e-05, 'epoch': 0.17} {'loss': 0.6158, 'learning_rate': 1.985430091205416e-05, 'epoch': 0.17} {'loss': 0.3772, 'learning_rate': 1.9854243763088026e-05, 'epoch': 0.17} {'loss': 0.5034, 'learning_rate': 1.9854186602998322e-05, 'epoch': 0.17} {'loss': 0.7317, 'learning_rate': 1.9854129431785117e-05, 'epoch': 0.17} {'loss': 0.5932, 'learning_rate': 1.985407224944847e-05, 'epoch': 0.17} {'loss': 0.7012, 'learning_rate': 1.9854015055988452e-05, 'epoch': 0.17} {'loss': 0.7178, 'learning_rate': 1.9853957851405124e-05, 'epoch': 0.17} {'loss': 0.529, 'learning_rate': 1.985390063569855e-05, 'epoch': 0.17} {'loss': 0.5432, 'learning_rate': 1.9853843408868794e-05, 'epoch': 0.17} {'loss': 0.7929, 'learning_rate': 1.985378617091593e-05, 'epoch': 0.17} {'loss': 0.5466, 'learning_rate': 1.9853728921840006e-05, 'epoch': 0.17} {'loss': 0.5627, 'learning_rate': 1.9853671661641105e-05, 'epoch': 0.17} {'loss': 0.5494, 'learning_rate': 1.9853614390319275e-05, 'epoch': 0.17} {'loss': 0.4697, 'learning_rate': 1.985355710787459e-05, 'epoch': 0.17} {'loss': 0.5316, 'learning_rate': 1.9853499814307114e-05, 'epoch': 0.17} {'loss': 0.6466, 'learning_rate': 1.9853442509616912e-05, 'epoch': 0.17} {'loss': 0.519, 'learning_rate': 1.9853385193804046e-05, 'epoch': 0.17} {'loss': 0.6555, 'learning_rate': 1.985332786686858e-05, 'epoch': 0.17} {'loss': 0.6917, 'learning_rate': 1.9853270528810583e-05, 'epoch': 0.17} {'loss': 0.5634, 'learning_rate': 1.9853213179630115e-05, 'epoch': 0.17} {'loss': 0.6195, 'learning_rate': 1.9853155819327243e-05, 'epoch': 0.17} {'loss': 0.6971, 'learning_rate': 1.9853098447902033e-05, 'epoch': 0.17} {'loss': 0.4795, 'learning_rate': 1.985304106535455e-05, 'epoch': 0.17} {'loss': 0.5885, 'learning_rate': 1.9852983671684853e-05, 'epoch': 0.17} {'loss': 0.4161, 'learning_rate': 1.9852926266893016e-05, 'epoch': 0.17} {'loss': 0.6531, 'learning_rate': 1.9852868850979098e-05, 'epoch': 0.17} {'loss': 0.5211, 'learning_rate': 1.9852811423943162e-05, 'epoch': 0.17} {'loss': 0.4258, 'learning_rate': 1.9852753985785274e-05, 'epoch': 0.17} {'loss': 0.4824, 'learning_rate': 1.9852696536505505e-05, 'epoch': 0.17} {'loss': 0.4232, 'learning_rate': 1.985263907610391e-05, 'epoch': 0.17} {'loss': 0.5367, 'learning_rate': 1.9852581604580566e-05, 'epoch': 0.17} {'loss': 0.5778, 'learning_rate': 1.9852524121935525e-05, 'epoch': 0.17} {'loss': 0.5393, 'learning_rate': 1.985246662816886e-05, 'epoch': 0.17} {'loss': 0.6615, 'learning_rate': 1.9852409123280636e-05, 'epoch': 0.17} {'loss': 0.5661, 'learning_rate': 1.9852351607270913e-05, 'epoch': 0.17} {'loss': 0.5139, 'learning_rate': 1.985229408013976e-05, 'epoch': 0.17} {'loss': 0.4205, 'learning_rate': 1.985223654188724e-05, 'epoch': 0.17} {'loss': 0.7846, 'learning_rate': 1.9852178992513417e-05, 'epoch': 0.17} {'loss': 0.5164, 'learning_rate': 1.9852121432018357e-05, 'epoch': 0.17} {'loss': 0.5556, 'learning_rate': 1.9852063860402127e-05, 'epoch': 0.17} {'loss': 0.6965, 'learning_rate': 1.985200627766479e-05, 'epoch': 0.17} {'loss': 0.3626, 'learning_rate': 1.985194868380641e-05, 'epoch': 0.17} {'loss': 0.6418, 'learning_rate': 1.9851891078827055e-05, 'epoch': 0.17} {'loss': 0.5397, 'learning_rate': 1.985183346272679e-05, 'epoch': 0.17} {'loss': 0.5205, 'learning_rate': 1.9851775835505673e-05, 'epoch': 0.17} {'loss': 0.5641, 'learning_rate': 1.985171819716378e-05, 'epoch': 0.17} {'loss': 0.4434, 'learning_rate': 1.9851660547701166e-05, 'epoch': 0.17} {'loss': 0.4418, 'learning_rate': 1.9851602887117904e-05, 'epoch': 0.17} {'loss': 0.3911, 'learning_rate': 1.9851545215414056e-05, 'epoch': 0.17} {'loss': 0.5549, 'learning_rate': 1.9851487532589685e-05, 'epoch': 0.17} {'loss': 0.5501, 'learning_rate': 1.9851429838644858e-05, 'epoch': 0.17} {'loss': 0.4869, 'learning_rate': 1.985137213357964e-05, 'epoch': 0.17} {'loss': 0.5618, 'learning_rate': 1.9851314417394095e-05, 'epoch': 0.17} {'loss': 0.6709, 'learning_rate': 1.9851256690088293e-05, 'epoch': 0.17} {'loss': 0.5102, 'learning_rate': 1.9851198951662294e-05, 'epoch': 0.17} {'loss': 0.3989, 'learning_rate': 1.9851141202116165e-05, 'epoch': 0.17} {'loss': 0.4902, 'learning_rate': 1.985108344144997e-05, 'epoch': 0.17} {'loss': 0.6345, 'learning_rate': 1.9851025669663776e-05, 'epoch': 0.17} {'loss': 0.4727, 'learning_rate': 1.9850967886757647e-05, 'epoch': 0.17} {'loss': 0.5488, 'learning_rate': 1.9850910092731646e-05, 'epoch': 0.17} {'loss': 0.6133, 'learning_rate': 1.9850852287585845e-05, 'epoch': 0.17} {'loss': 0.7465, 'learning_rate': 1.98507944713203e-05, 'epoch': 0.17} {'loss': 0.4005, 'learning_rate': 1.9850736643935085e-05, 'epoch': 0.17} {'loss': 0.5135, 'learning_rate': 1.9850678805430263e-05, 'epoch': 0.17} {'loss': 0.5181, 'learning_rate': 1.9850620955805893e-05, 'epoch': 0.17} {'loss': 0.6644, 'learning_rate': 1.985056309506205e-05, 'epoch': 0.17} {'loss': 0.5957, 'learning_rate': 1.985050522319879e-05, 'epoch': 0.17} {'loss': 0.4092, 'learning_rate': 1.9850447340216185e-05, 'epoch': 0.17} {'loss': 0.7434, 'learning_rate': 1.9850389446114295e-05, 'epoch': 0.17} {'loss': 0.712, 'learning_rate': 1.9850331540893194e-05, 'epoch': 0.17} {'loss': 0.5223, 'learning_rate': 1.985027362455294e-05, 'epoch': 0.17} {'loss': 0.6638, 'learning_rate': 1.9850215697093597e-05, 'epoch': 0.17} {'loss': 0.521, 'learning_rate': 1.9850157758515237e-05, 'epoch': 0.17} {'loss': 0.5653, 'learning_rate': 1.985009980881792e-05, 'epoch': 0.17} {'loss': 0.3992, 'learning_rate': 1.9850041848001713e-05, 'epoch': 0.17} {'loss': 0.5104, 'learning_rate': 1.9849983876066684e-05, 'epoch': 0.17} {'loss': 0.5728, 'learning_rate': 1.9849925893012894e-05, 'epoch': 0.17} {'loss': 0.5826, 'learning_rate': 1.984986789884041e-05, 'epoch': 0.17} {'loss': 0.5349, 'learning_rate': 1.9849809893549302e-05, 'epoch': 0.17} {'loss': 0.6757, 'learning_rate': 1.9849751877139632e-05, 'epoch': 0.17} {'loss': 0.6118, 'learning_rate': 1.9849693849611463e-05, 'epoch': 0.17} {'loss': 0.646, 'learning_rate': 1.984963581096486e-05, 'epoch': 0.17} {'loss': 0.4135, 'learning_rate': 1.9849577761199894e-05, 'epoch': 0.17} {'loss': 0.5688, 'learning_rate': 1.9849519700316628e-05, 'epoch': 0.17} {'loss': 0.611, 'learning_rate': 1.984946162831513e-05, 'epoch': 0.17} {'loss': 0.6262, 'learning_rate': 1.984940354519546e-05, 'epoch': 0.17} {'loss': 0.5413, 'learning_rate': 1.984934545095768e-05, 'epoch': 0.17} {'loss': 0.6021, 'learning_rate': 1.984928734560187e-05, 'epoch': 0.17} {'loss': 0.5645, 'learning_rate': 1.9849229229128086e-05, 'epoch': 0.17} {'loss': 0.5142, 'learning_rate': 1.9849171101536394e-05, 'epoch': 0.17} {'loss': 0.7033, 'learning_rate': 1.984911296282686e-05, 'epoch': 0.17} {'loss': 0.459, 'learning_rate': 1.9849054812999553e-05, 'epoch': 0.17} {'loss': 0.6326, 'learning_rate': 1.9848996652054536e-05, 'epoch': 0.17} {'loss': 0.6509, 'learning_rate': 1.984893847999187e-05, 'epoch': 0.17} {'loss': 0.5078, 'learning_rate': 1.984888029681163e-05, 'epoch': 0.17} {'loss': 0.6413, 'learning_rate': 1.9848822102513872e-05, 'epoch': 0.17} {'loss': 0.505, 'learning_rate': 1.9848763897098674e-05, 'epoch': 0.17} {'loss': 0.5356, 'learning_rate': 1.984870568056609e-05, 'epoch': 0.17} {'loss': 0.569, 'learning_rate': 1.984864745291619e-05, 'epoch': 0.17} {'loss': 0.4647, 'learning_rate': 1.984858921414904e-05, 'epoch': 0.17} {'loss': 0.4114, 'learning_rate': 1.9848530964264706e-05, 'epoch': 0.17} {'loss': 0.4749, 'learning_rate': 1.984847270326325e-05, 'epoch': 0.17} {'loss': 0.5482, 'learning_rate': 1.984841443114475e-05, 'epoch': 0.17} {'loss': 0.6387, 'learning_rate': 1.9848356147909257e-05, 'epoch': 0.17} {'loss': 0.6412, 'learning_rate': 1.9848297853556842e-05, 'epoch': 0.17} {'loss': 0.6039, 'learning_rate': 1.984823954808757e-05, 'epoch': 0.17} {'loss': 0.5367, 'learning_rate': 1.9848181231501513e-05, 'epoch': 0.17} {'loss': 0.6034, 'learning_rate': 1.984812290379873e-05, 'epoch': 0.17} {'loss': 0.605, 'learning_rate': 1.984806456497929e-05, 'epoch': 0.17} {'loss': 0.4212, 'learning_rate': 1.9848006215043254e-05, 'epoch': 0.17} {'loss': 0.535, 'learning_rate': 1.9847947853990695e-05, 'epoch': 0.17} {'loss': 0.5585, 'learning_rate': 1.9847889481821675e-05, 'epoch': 0.17} {'loss': 0.4479, 'learning_rate': 1.9847831098536262e-05, 'epoch': 0.17} {'loss': 0.502, 'learning_rate': 1.9847772704134515e-05, 'epoch': 0.17} {'loss': 0.5383, 'learning_rate': 1.984771429861651e-05, 'epoch': 0.17} {'loss': 0.7852, 'learning_rate': 1.984765588198231e-05, 'epoch': 0.17} {'loss': 0.6311, 'learning_rate': 1.9847597454231973e-05, 'epoch': 0.17} {'loss': 0.6009, 'learning_rate': 1.9847539015365577e-05, 'epoch': 0.17} {'loss': 0.5942, 'learning_rate': 1.9847480565383177e-05, 'epoch': 0.17} {'loss': 0.5494, 'learning_rate': 1.984742210428485e-05, 'epoch': 0.17} {'loss': 0.6151, 'learning_rate': 1.984736363207065e-05, 'epoch': 0.17} {'loss': 0.4732, 'learning_rate': 1.9847305148740652e-05, 'epoch': 0.17} {'loss': 0.4544, 'learning_rate': 1.9847246654294914e-05, 'epoch': 0.17} {'loss': 0.5064, 'learning_rate': 1.9847188148733513e-05, 'epoch': 0.17} {'loss': 0.8187, 'learning_rate': 1.984712963205651e-05, 'epoch': 0.17} {'loss': 0.5396, 'learning_rate': 1.9847071104263968e-05, 'epoch': 0.17} {'loss': 0.4316, 'learning_rate': 1.9847012565355953e-05, 'epoch': 0.17} {'loss': 0.4787, 'learning_rate': 1.9846954015332535e-05, 'epoch': 0.17} {'loss': 0.7099, 'learning_rate': 1.984689545419378e-05, 'epoch': 0.17} {'loss': 0.4642, 'learning_rate': 1.984683688193975e-05, 'epoch': 0.17} {'loss': 0.6462, 'learning_rate': 1.9846778298570516e-05, 'epoch': 0.17} {'loss': 0.431, 'learning_rate': 1.984671970408614e-05, 'epoch': 0.17} {'loss': 0.4135, 'learning_rate': 1.984666109848669e-05, 'epoch': 0.17} {'loss': 0.4914, 'learning_rate': 1.984660248177223e-05, 'epoch': 0.17} {'loss': 0.4879, 'learning_rate': 1.9846543853942833e-05, 'epoch': 0.17} {'loss': 0.4633, 'learning_rate': 1.9846485214998557e-05, 'epoch': 0.17} {'loss': 0.7055, 'learning_rate': 1.9846426564939474e-05, 'epoch': 0.17} {'loss': 0.6966, 'learning_rate': 1.9846367903765645e-05, 'epoch': 0.17} {'loss': 0.5772, 'learning_rate': 1.984630923147714e-05, 'epoch': 0.17} {'loss': 0.497, 'learning_rate': 1.9846250548074027e-05, 'epoch': 0.17} {'loss': 0.6365, 'learning_rate': 1.9846191853556367e-05, 'epoch': 0.17} {'loss': 0.5331, 'learning_rate': 1.9846133147924228e-05, 'epoch': 0.17} {'loss': 0.4578, 'learning_rate': 1.984607443117768e-05, 'epoch': 0.17} {'loss': 0.5401, 'learning_rate': 1.9846015703316783e-05, 'epoch': 0.17} {'loss': 0.674, 'learning_rate': 1.984595696434161e-05, 'epoch': 0.17} {'loss': 0.2766, 'learning_rate': 1.984589821425222e-05, 'epoch': 0.17} {'loss': 0.5067, 'learning_rate': 1.9845839453048686e-05, 'epoch': 0.17} {'loss': 0.6076, 'learning_rate': 1.984578068073107e-05, 'epoch': 0.17} {'loss': 0.549, 'learning_rate': 1.984572189729944e-05, 'epoch': 0.17} {'loss': 0.6676, 'learning_rate': 1.984566310275386e-05, 'epoch': 0.17} {'loss': 0.6487, 'learning_rate': 1.9845604297094404e-05, 'epoch': 0.17} {'loss': 0.5253, 'learning_rate': 1.984554548032113e-05, 'epoch': 0.17} {'loss': 0.566, 'learning_rate': 1.9845486652434104e-05, 'epoch': 0.17} {'loss': 0.5818, 'learning_rate': 1.9845427813433402e-05, 'epoch': 0.17} {'loss': 0.4272, 'learning_rate': 1.984536896331908e-05, 'epoch': 0.17} {'loss': 0.6955, 'learning_rate': 1.984531010209121e-05, 'epoch': 0.17} {'loss': 0.5179, 'learning_rate': 1.9845251229749857e-05, 'epoch': 0.17} {'loss': 0.5401, 'learning_rate': 1.9845192346295088e-05, 'epoch': 0.17} {'loss': 0.5025, 'learning_rate': 1.984513345172697e-05, 'epoch': 0.17} {'loss': 0.547, 'learning_rate': 1.9845074546045566e-05, 'epoch': 0.17} {'loss': 0.5827, 'learning_rate': 1.9845015629250946e-05, 'epoch': 0.17} {'loss': 0.5757, 'learning_rate': 1.9844956701343176e-05, 'epoch': 0.17} {'loss': 0.5788, 'learning_rate': 1.984489776232232e-05, 'epoch': 0.17} {'loss': 0.3335, 'learning_rate': 1.984483881218845e-05, 'epoch': 0.17} {'loss': 0.6748, 'learning_rate': 1.9844779850941624e-05, 'epoch': 0.17} {'loss': 0.5558, 'learning_rate': 1.9844720878581917e-05, 'epoch': 0.17} {'loss': 0.4945, 'learning_rate': 1.9844661895109395e-05, 'epoch': 0.17} {'loss': 0.6401, 'learning_rate': 1.9844602900524117e-05, 'epoch': 0.17} {'loss': 0.406, 'learning_rate': 1.9844543894826155e-05, 'epoch': 0.17} {'loss': 0.5687, 'learning_rate': 1.984448487801558e-05, 'epoch': 0.17} {'loss': 0.5768, 'learning_rate': 1.9844425850092448e-05, 'epoch': 0.17} {'loss': 0.5456, 'learning_rate': 1.9844366811056832e-05, 'epoch': 0.17} {'loss': 0.5968, 'learning_rate': 1.9844307760908797e-05, 'epoch': 0.17} {'loss': 0.4869, 'learning_rate': 1.9844248699648415e-05, 'epoch': 0.17} {'loss': 0.5809, 'learning_rate': 1.9844189627275743e-05, 'epoch': 0.17} {'loss': 0.3212, 'learning_rate': 1.9844130543790857e-05, 'epoch': 0.17} {'loss': 0.4185, 'learning_rate': 1.9844071449193816e-05, 'epoch': 0.17} {'loss': 0.5676, 'learning_rate': 1.9844012343484692e-05, 'epoch': 0.17} {'loss': 0.6561, 'learning_rate': 1.984395322666355e-05, 'epoch': 0.17} {'loss': 0.5586, 'learning_rate': 1.9843894098730457e-05, 'epoch': 0.17} {'loss': 0.6381, 'learning_rate': 1.984383495968548e-05, 'epoch': 0.17} {'loss': 0.5828, 'learning_rate': 1.9843775809528686e-05, 'epoch': 0.17} {'loss': 0.5466, 'learning_rate': 1.9843716648260137e-05, 'epoch': 0.17} {'loss': 0.5711, 'learning_rate': 1.9843657475879908e-05, 'epoch': 0.17} {'loss': 0.5416, 'learning_rate': 1.9843598292388057e-05, 'epoch': 0.17} {'loss': 0.6472, 'learning_rate': 1.9843539097784662e-05, 'epoch': 0.17} {'loss': 0.702, 'learning_rate': 1.9843479892069777e-05, 'epoch': 0.17} {'loss': 0.6498, 'learning_rate': 1.984342067524348e-05, 'epoch': 0.17} {'loss': 0.5732, 'learning_rate': 1.9843361447305828e-05, 'epoch': 0.17} {'loss': 0.58, 'learning_rate': 1.9843302208256893e-05, 'epoch': 0.17} {'loss': 0.6348, 'learning_rate': 1.9843242958096746e-05, 'epoch': 0.17} {'loss': 0.5436, 'learning_rate': 1.9843183696825447e-05, 'epoch': 0.17} {'loss': 0.5817, 'learning_rate': 1.9843124424443065e-05, 'epoch': 0.17} {'loss': 0.6378, 'learning_rate': 1.9843065140949668e-05, 'epoch': 0.17} {'loss': 0.5175, 'learning_rate': 1.9843005846345322e-05, 'epoch': 0.17} {'loss': 0.5433, 'learning_rate': 1.9842946540630093e-05, 'epoch': 0.17} {'loss': 0.4309, 'learning_rate': 1.9842887223804052e-05, 'epoch': 0.17} {'loss': 0.3771, 'learning_rate': 1.984282789586726e-05, 'epoch': 0.17} {'loss': 0.4439, 'learning_rate': 1.9842768556819786e-05, 'epoch': 0.17} {'loss': 0.5862, 'learning_rate': 1.98427092066617e-05, 'epoch': 0.17} {'loss': 0.5592, 'learning_rate': 1.984264984539307e-05, 'epoch': 0.17} {'loss': 0.6214, 'learning_rate': 1.9842590473013957e-05, 'epoch': 0.17} {'loss': 0.5817, 'learning_rate': 1.984253108952443e-05, 'epoch': 0.17} {'loss': 0.5233, 'learning_rate': 1.984247169492456e-05, 'epoch': 0.17} {'loss': 0.6395, 'learning_rate': 1.9842412289214407e-05, 'epoch': 0.17} {'loss': 0.5007, 'learning_rate': 1.9842352872394046e-05, 'epoch': 0.17} {'loss': 0.5074, 'learning_rate': 1.984229344446354e-05, 'epoch': 0.17} {'loss': 0.5349, 'learning_rate': 1.9842234005422953e-05, 'epoch': 0.17} {'loss': 0.5, 'learning_rate': 1.9842174555272357e-05, 'epoch': 0.17} {'loss': 0.4857, 'learning_rate': 1.984211509401182e-05, 'epoch': 0.17} {'loss': 0.6227, 'learning_rate': 1.98420556216414e-05, 'epoch': 0.17} {'loss': 0.5905, 'learning_rate': 1.984199613816118e-05, 'epoch': 0.17} {'loss': 0.5964, 'learning_rate': 1.984193664357121e-05, 'epoch': 0.17} {'loss': 0.4644, 'learning_rate': 1.984187713787157e-05, 'epoch': 0.17} {'loss': 0.6962, 'learning_rate': 1.984181762106232e-05, 'epoch': 0.17} {'loss': 0.4961, 'learning_rate': 1.984175809314353e-05, 'epoch': 0.17} {'loss': 0.4628, 'learning_rate': 1.9841698554115267e-05, 'epoch': 0.17} {'loss': 0.489, 'learning_rate': 1.98416390039776e-05, 'epoch': 0.17} {'loss': 0.6972, 'learning_rate': 1.984157944273059e-05, 'epoch': 0.17} {'loss': 0.6065, 'learning_rate': 1.9841519870374307e-05, 'epoch': 0.17} {'loss': 0.6518, 'learning_rate': 1.9841460286908823e-05, 'epoch': 0.17} {'loss': 0.7292, 'learning_rate': 1.98414006923342e-05, 'epoch': 0.17} {'loss': 0.5251, 'learning_rate': 1.9841341086650506e-05, 'epoch': 0.17} {'loss': 0.4594, 'learning_rate': 1.9841281469857813e-05, 'epoch': 0.17} {'loss': 0.4915, 'learning_rate': 1.984122184195618e-05, 'epoch': 0.17} {'loss': 0.5255, 'learning_rate': 1.9841162202945684e-05, 'epoch': 0.17} {'loss': 0.5745, 'learning_rate': 1.9841102552826384e-05, 'epoch': 0.17} {'loss': 0.5437, 'learning_rate': 1.9841042891598353e-05, 'epoch': 0.17} {'loss': 0.5879, 'learning_rate': 1.9840983219261653e-05, 'epoch': 0.17} {'loss': 0.3772, 'learning_rate': 1.9840923535816357e-05, 'epoch': 0.17} {'loss': 0.5887, 'learning_rate': 1.984086384126253e-05, 'epoch': 0.17} {'loss': 0.6008, 'learning_rate': 1.9840804135600236e-05, 'epoch': 0.17} {'loss': 0.723, 'learning_rate': 1.9840744418829547e-05, 'epoch': 0.17} {'loss': 0.4895, 'learning_rate': 1.984068469095053e-05, 'epoch': 0.17} {'loss': 0.5251, 'learning_rate': 1.984062495196325e-05, 'epoch': 0.17} {'loss': 0.5794, 'learning_rate': 1.9840565201867777e-05, 'epoch': 0.17} {'loss': 0.473, 'learning_rate': 1.9840505440664176e-05, 'epoch': 0.17} {'loss': 0.5464, 'learning_rate': 1.9840445668352513e-05, 'epoch': 0.17} {'loss': 0.6725, 'learning_rate': 1.9840385884932863e-05, 'epoch': 0.17} {'loss': 0.576, 'learning_rate': 1.9840326090405285e-05, 'epoch': 0.17} {'loss': 0.4343, 'learning_rate': 1.9840266284769852e-05, 'epoch': 0.17} {'loss': 0.7286, 'learning_rate': 1.984020646802663e-05, 'epoch': 0.17} {'loss': 0.4832, 'learning_rate': 1.9840146640175683e-05, 'epoch': 0.17} {'loss': 0.6325, 'learning_rate': 1.9840086801217086e-05, 'epoch': 0.17} {'loss': 0.4092, 'learning_rate': 1.98400269511509e-05, 'epoch': 0.17} {'loss': 0.6562, 'learning_rate': 1.9839967089977192e-05, 'epoch': 0.17} {'loss': 0.5836, 'learning_rate': 1.9839907217696035e-05, 'epoch': 0.17} {'loss': 0.4952, 'learning_rate': 1.9839847334307493e-05, 'epoch': 0.17} {'loss': 0.5992, 'learning_rate': 1.9839787439811636e-05, 'epoch': 0.17} {'loss': 0.5842, 'learning_rate': 1.983972753420853e-05, 'epoch': 0.17} {'loss': 0.4477, 'learning_rate': 1.9839667617498242e-05, 'epoch': 0.17} {'loss': 0.4826, 'learning_rate': 1.983960768968084e-05, 'epoch': 0.17} {'loss': 0.6243, 'learning_rate': 1.983954775075639e-05, 'epoch': 0.17} {'loss': 0.5015, 'learning_rate': 1.9839487800724968e-05, 'epoch': 0.17} {'loss': 0.6264, 'learning_rate': 1.983942783958663e-05, 'epoch': 0.17} {'loss': 0.6445, 'learning_rate': 1.983936786734145e-05, 'epoch': 0.17} {'loss': 0.4996, 'learning_rate': 1.9839307883989497e-05, 'epoch': 0.17} {'loss': 0.6275, 'learning_rate': 1.9839247889530837e-05, 'epoch': 0.17} {'loss': 0.5629, 'learning_rate': 1.983918788396553e-05, 'epoch': 0.17} {'loss': 0.5605, 'learning_rate': 1.983912786729366e-05, 'epoch': 0.17} {'loss': 0.5483, 'learning_rate': 1.983906783951528e-05, 'epoch': 0.17} {'loss': 0.6779, 'learning_rate': 1.9839007800630463e-05, 'epoch': 0.17} {'loss': 0.5113, 'learning_rate': 1.983894775063928e-05, 'epoch': 0.17} {'loss': 0.4992, 'learning_rate': 1.9838887689541796e-05, 'epoch': 0.17} {'loss': 0.3891, 'learning_rate': 1.9838827617338077e-05, 'epoch': 0.17} {'loss': 0.5577, 'learning_rate': 1.983876753402819e-05, 'epoch': 0.17} {'loss': 0.5856, 'learning_rate': 1.983870743961221e-05, 'epoch': 0.17} {'loss': 0.4625, 'learning_rate': 1.98386473340902e-05, 'epoch': 0.17} {'loss': 0.3157, 'learning_rate': 1.9838587217462226e-05, 'epoch': 0.17} {'loss': 0.5431, 'learning_rate': 1.983852708972836e-05, 'epoch': 0.17} {'loss': 0.5208, 'learning_rate': 1.9838466950888663e-05, 'epoch': 0.17} {'loss': 0.4819, 'learning_rate': 1.9838406800943214e-05, 'epoch': 0.17} {'loss': 0.4055, 'learning_rate': 1.9838346639892072e-05, 'epoch': 0.17} {'loss': 0.5859, 'learning_rate': 1.9838286467735305e-05, 'epoch': 0.17} {'loss': 0.4372, 'learning_rate': 1.9838226284472987e-05, 'epoch': 0.17} {'loss': 0.5838, 'learning_rate': 1.9838166090105183e-05, 'epoch': 0.17} {'loss': 0.5463, 'learning_rate': 1.9838105884631956e-05, 'epoch': 0.17} {'loss': 0.5382, 'learning_rate': 1.983804566805338e-05, 'epoch': 0.17} {'loss': 0.6209, 'learning_rate': 1.9837985440369523e-05, 'epoch': 0.17} {'loss': 0.4837, 'learning_rate': 1.9837925201580452e-05, 'epoch': 0.17} {'loss': 0.5446, 'learning_rate': 1.983786495168623e-05, 'epoch': 0.17} {'loss': 0.4454, 'learning_rate': 1.983780469068693e-05, 'epoch': 0.17} {'loss': 0.67, 'learning_rate': 1.983774441858262e-05, 'epoch': 0.17} {'loss': 0.4105, 'learning_rate': 1.983768413537337e-05, 'epoch': 0.17} {'loss': 0.4953, 'learning_rate': 1.9837623841059245e-05, 'epoch': 0.17} {'loss': 0.4676, 'learning_rate': 1.9837563535640312e-05, 'epoch': 0.17} {'loss': 0.6466, 'learning_rate': 1.9837503219116638e-05, 'epoch': 0.17} {'loss': 0.5905, 'learning_rate': 1.9837442891488298e-05, 'epoch': 0.17} {'loss': 0.5811, 'learning_rate': 1.9837382552755353e-05, 'epoch': 0.17} {'loss': 0.5797, 'learning_rate': 1.9837322202917873e-05, 'epoch': 0.17} {'loss': 0.4815, 'learning_rate': 1.9837261841975927e-05, 'epoch': 0.17} {'loss': 0.7326, 'learning_rate': 1.9837201469929583e-05, 'epoch': 0.17} {'loss': 0.4614, 'learning_rate': 1.9837141086778914e-05, 'epoch': 0.17} {'loss': 0.5791, 'learning_rate': 1.983708069252398e-05, 'epoch': 0.17} {'loss': 0.3876, 'learning_rate': 1.9837020287164848e-05, 'epoch': 0.17} {'loss': 0.6481, 'learning_rate': 1.9836959870701597e-05, 'epoch': 0.17} {'loss': 0.3943, 'learning_rate': 1.9836899443134286e-05, 'epoch': 0.17} {'loss': 0.461, 'learning_rate': 1.9836839004462986e-05, 'epoch': 0.17} {'loss': 0.5128, 'learning_rate': 1.9836778554687765e-05, 'epoch': 0.17} {'loss': 0.4677, 'learning_rate': 1.9836718093808694e-05, 'epoch': 0.17} {'loss': 0.5401, 'learning_rate': 1.9836657621825838e-05, 'epoch': 0.17} {'loss': 0.4854, 'learning_rate': 1.9836597138739268e-05, 'epoch': 0.17} {'loss': 0.7005, 'learning_rate': 1.9836536644549044e-05, 'epoch': 0.17} {'loss': 0.7135, 'learning_rate': 1.983647613925525e-05, 'epoch': 0.17} {'loss': 0.5587, 'learning_rate': 1.9836415622857936e-05, 'epoch': 0.17} {'loss': 0.6594, 'learning_rate': 1.9836355095357183e-05, 'epoch': 0.17} {'loss': 0.6203, 'learning_rate': 1.9836294556753054e-05, 'epoch': 0.17} {'loss': 0.6301, 'learning_rate': 1.983623400704562e-05, 'epoch': 0.17} {'loss': 0.6055, 'learning_rate': 1.983617344623495e-05, 'epoch': 0.17} {'loss': 0.5279, 'learning_rate': 1.983611287432111e-05, 'epoch': 0.17} {'loss': 0.6235, 'learning_rate': 1.9836052291304165e-05, 'epoch': 0.17} {'loss': 0.5239, 'learning_rate': 1.9835991697184193e-05, 'epoch': 0.17} {'loss': 0.4281, 'learning_rate': 1.983593109196125e-05, 'epoch': 0.17} {'loss': 0.4851, 'learning_rate': 1.9835870475635416e-05, 'epoch': 0.17} {'loss': 0.5796, 'learning_rate': 1.9835809848206757e-05, 'epoch': 0.17} {'loss': 0.6645, 'learning_rate': 1.9835749209675333e-05, 'epoch': 0.17} {'loss': 0.6879, 'learning_rate': 1.9835688560041225e-05, 'epoch': 0.17} {'loss': 0.5637, 'learning_rate': 1.983562789930449e-05, 'epoch': 0.17} {'loss': 0.6065, 'learning_rate': 1.9835567227465202e-05, 'epoch': 0.17} {'loss': 0.5694, 'learning_rate': 1.983550654452343e-05, 'epoch': 0.17} {'loss': 0.4771, 'learning_rate': 1.9835445850479243e-05, 'epoch': 0.17} {'loss': 0.5414, 'learning_rate': 1.9835385145332706e-05, 'epoch': 0.17} {'loss': 0.5263, 'learning_rate': 1.9835324429083888e-05, 'epoch': 0.17} {'loss': 0.5033, 'learning_rate': 1.983526370173286e-05, 'epoch': 0.17} {'loss': 0.4513, 'learning_rate': 1.9835202963279693e-05, 'epoch': 0.17} {'loss': 0.4463, 'learning_rate': 1.983514221372445e-05, 'epoch': 0.17} {'loss': 0.5644, 'learning_rate': 1.9835081453067197e-05, 'epoch': 0.17} {'loss': 0.4224, 'learning_rate': 1.9835020681308014e-05, 'epoch': 0.17} {'loss': 0.4797, 'learning_rate': 1.9834959898446956e-05, 'epoch': 0.17} {'loss': 0.4973, 'learning_rate': 1.9834899104484105e-05, 'epoch': 0.17} {'loss': 0.5407, 'learning_rate': 1.9834838299419522e-05, 'epoch': 0.17} {'loss': 0.6185, 'learning_rate': 1.9834777483253275e-05, 'epoch': 0.17} {'loss': 0.6957, 'learning_rate': 1.9834716655985434e-05, 'epoch': 0.17} {'loss': 0.5402, 'learning_rate': 1.9834655817616068e-05, 'epoch': 0.17} {'loss': 0.6786, 'learning_rate': 1.9834594968145247e-05, 'epoch': 0.17} {'loss': 0.522, 'learning_rate': 1.983453410757304e-05, 'epoch': 0.17} {'loss': 0.6266, 'learning_rate': 1.983447323589951e-05, 'epoch': 0.17} {'loss': 0.5609, 'learning_rate': 1.9834412353124733e-05, 'epoch': 0.17} {'loss': 0.4337, 'learning_rate': 1.9834351459248772e-05, 'epoch': 0.17} {'loss': 0.7364, 'learning_rate': 1.98342905542717e-05, 'epoch': 0.17} {'loss': 0.4812, 'learning_rate': 1.9834229638193583e-05, 'epoch': 0.17} {'loss': 0.6791, 'learning_rate': 1.9834168711014492e-05, 'epoch': 0.17} {'loss': 0.5493, 'learning_rate': 1.9834107772734493e-05, 'epoch': 0.17} {'loss': 0.6434, 'learning_rate': 1.983404682335366e-05, 'epoch': 0.17} {'loss': 0.5259, 'learning_rate': 1.9833985862872053e-05, 'epoch': 0.17} {'loss': 0.5238, 'learning_rate': 1.983392489128975e-05, 'epoch': 0.17} {'loss': 0.5301, 'learning_rate': 1.9833863908606817e-05, 'epoch': 0.17} {'loss': 0.6565, 'learning_rate': 1.9833802914823317e-05, 'epoch': 0.17} {'loss': 0.5698, 'learning_rate': 1.9833741909939325e-05, 'epoch': 0.17} {'loss': 0.3739, 'learning_rate': 1.9833680893954908e-05, 'epoch': 0.17} {'loss': 0.4424, 'learning_rate': 1.983361986687014e-05, 'epoch': 0.17} {'loss': 0.5958, 'learning_rate': 1.9833558828685076e-05, 'epoch': 0.17} {'loss': 0.5985, 'learning_rate': 1.9833497779399803e-05, 'epoch': 0.17} {'loss': 0.3689, 'learning_rate': 1.9833436719014377e-05, 'epoch': 0.17} {'loss': 0.6567, 'learning_rate': 1.983337564752887e-05, 'epoch': 0.17} {'loss': 0.7836, 'learning_rate': 1.9833314564943356e-05, 'epoch': 0.17} {'loss': 0.657, 'learning_rate': 1.9833253471257893e-05, 'epoch': 0.17} {'loss': 0.609, 'learning_rate': 1.9833192366472562e-05, 'epoch': 0.17} {'loss': 0.5576, 'learning_rate': 1.9833131250587426e-05, 'epoch': 0.18} {'loss': 0.4198, 'learning_rate': 1.983307012360255e-05, 'epoch': 0.18} {'loss': 0.5567, 'learning_rate': 1.9833008985518013e-05, 'epoch': 0.18} {'loss': 0.602, 'learning_rate': 1.9832947836333877e-05, 'epoch': 0.18} {'loss': 0.5545, 'learning_rate': 1.9832886676050215e-05, 'epoch': 0.18} {'loss': 0.5933, 'learning_rate': 1.983282550466709e-05, 'epoch': 0.18} {'loss': 0.5875, 'learning_rate': 1.9832764322184576e-05, 'epoch': 0.18} {'loss': 0.4781, 'learning_rate': 1.9832703128602745e-05, 'epoch': 0.18} {'loss': 0.4776, 'learning_rate': 1.9832641923921658e-05, 'epoch': 0.18} {'loss': 0.4344, 'learning_rate': 1.9832580708141383e-05, 'epoch': 0.18} {'loss': 0.5222, 'learning_rate': 1.9832519481262002e-05, 'epoch': 0.18} {'loss': 0.5713, 'learning_rate': 1.9832458243283575e-05, 'epoch': 0.18} {'loss': 0.5328, 'learning_rate': 1.9832396994206168e-05, 'epoch': 0.18} {'loss': 0.5447, 'learning_rate': 1.983233573402986e-05, 'epoch': 0.18} {'loss': 0.5468, 'learning_rate': 1.983227446275471e-05, 'epoch': 0.18} {'loss': 0.6407, 'learning_rate': 1.9832213180380794e-05, 'epoch': 0.18} {'loss': 0.7818, 'learning_rate': 1.983215188690818e-05, 'epoch': 0.18} {'loss': 0.5609, 'learning_rate': 1.9832090582336935e-05, 'epoch': 0.18} {'loss': 0.5791, 'learning_rate': 1.983202926666713e-05, 'epoch': 0.18} {'loss': 0.5069, 'learning_rate': 1.9831967939898833e-05, 'epoch': 0.18} {'loss': 0.5844, 'learning_rate': 1.9831906602032115e-05, 'epoch': 0.18} {'loss': 0.4982, 'learning_rate': 1.9831845253067043e-05, 'epoch': 0.18} {'loss': 0.4448, 'learning_rate': 1.9831783893003687e-05, 'epoch': 0.18} {'loss': 0.5184, 'learning_rate': 1.9831722521842117e-05, 'epoch': 0.18} {'loss': 0.712, 'learning_rate': 1.9831661139582402e-05, 'epoch': 0.18} {'loss': 0.5937, 'learning_rate': 1.983159974622461e-05, 'epoch': 0.18} {'loss': 0.4428, 'learning_rate': 1.983153834176881e-05, 'epoch': 0.18} {'loss': 0.6682, 'learning_rate': 1.9831476926215077e-05, 'epoch': 0.18} {'loss': 0.4854, 'learning_rate': 1.9831415499563477e-05, 'epoch': 0.18} {'loss': 0.5254, 'learning_rate': 1.983135406181407e-05, 'epoch': 0.18} {'loss': 0.5281, 'learning_rate': 1.983129261296694e-05, 'epoch': 0.18} {'loss': 0.5905, 'learning_rate': 1.9831231153022152e-05, 'epoch': 0.18} {'loss': 0.5875, 'learning_rate': 1.983116968197977e-05, 'epoch': 0.18} {'loss': 0.4776, 'learning_rate': 1.983110819983987e-05, 'epoch': 0.18} {'loss': 0.4788, 'learning_rate': 1.9831046706602514e-05, 'epoch': 0.18} {'loss': 0.6174, 'learning_rate': 1.983098520226778e-05, 'epoch': 0.18} {'loss': 0.7205, 'learning_rate': 1.9830923686835733e-05, 'epoch': 0.18} {'loss': 0.5247, 'learning_rate': 1.983086216030644e-05, 'epoch': 0.18} {'loss': 0.4746, 'learning_rate': 1.9830800622679974e-05, 'epoch': 0.18} {'loss': 0.4953, 'learning_rate': 1.98307390739564e-05, 'epoch': 0.18} {'loss': 0.5107, 'learning_rate': 1.9830677514135796e-05, 'epoch': 0.18} {'loss': 0.7002, 'learning_rate': 1.9830615943218225e-05, 'epoch': 0.18} {'loss': 0.4091, 'learning_rate': 1.9830554361203757e-05, 'epoch': 0.18} {'loss': 0.6087, 'learning_rate': 1.9830492768092466e-05, 'epoch': 0.18} {'loss': 0.5474, 'learning_rate': 1.9830431163884413e-05, 'epoch': 0.18} {'loss': 0.5371, 'learning_rate': 1.9830369548579676e-05, 'epoch': 0.18} {'loss': 0.6044, 'learning_rate': 1.983030792217832e-05, 'epoch': 0.18} {'loss': 0.5217, 'learning_rate': 1.9830246284680416e-05, 'epoch': 0.18} {'loss': 0.5121, 'learning_rate': 1.983018463608603e-05, 'epoch': 0.18} {'loss': 0.513, 'learning_rate': 1.983012297639524e-05, 'epoch': 0.18} {'loss': 0.3349, 'learning_rate': 1.9830061305608107e-05, 'epoch': 0.18} {'loss': 0.5975, 'learning_rate': 1.9829999623724707e-05, 'epoch': 0.18} {'loss': 0.6571, 'learning_rate': 1.9829937930745104e-05, 'epoch': 0.18} {'loss': 0.4243, 'learning_rate': 1.9829876226669373e-05, 'epoch': 0.18} {'loss': 0.5306, 'learning_rate': 1.982981451149758e-05, 'epoch': 0.18} {'loss': 0.552, 'learning_rate': 1.982975278522979e-05, 'epoch': 0.18} {'loss': 0.4052, 'learning_rate': 1.9829691047866086e-05, 'epoch': 0.18} {'loss': 0.4605, 'learning_rate': 1.9829629299406526e-05, 'epoch': 0.18} {'loss': 0.5777, 'learning_rate': 1.9829567539851188e-05, 'epoch': 0.18} {'loss': 0.6112, 'learning_rate': 1.9829505769200134e-05, 'epoch': 0.18} {'loss': 0.5894, 'learning_rate': 1.9829443987453437e-05, 'epoch': 0.18} {'loss': 0.488, 'learning_rate': 1.9829382194611167e-05, 'epoch': 0.18} {'loss': 0.596, 'learning_rate': 1.9829320390673396e-05, 'epoch': 0.18} {'loss': 0.4945, 'learning_rate': 1.9829258575640188e-05, 'epoch': 0.18} {'loss': 0.4841, 'learning_rate': 1.9829196749511617e-05, 'epoch': 0.18} {'loss': 0.6945, 'learning_rate': 1.982913491228775e-05, 'epoch': 0.18} {'loss': 0.543, 'learning_rate': 1.9829073063968666e-05, 'epoch': 0.18} {'loss': 0.668, 'learning_rate': 1.982901120455442e-05, 'epoch': 0.18} {'loss': 0.5466, 'learning_rate': 1.9828949334045095e-05, 'epoch': 0.18} {'loss': 0.6143, 'learning_rate': 1.9828887452440752e-05, 'epoch': 0.18} {'loss': 0.5945, 'learning_rate': 1.9828825559741466e-05, 'epoch': 0.18} {'loss': 0.4647, 'learning_rate': 1.9828763655947303e-05, 'epoch': 0.18} {'loss': 0.4535, 'learning_rate': 1.9828701741058336e-05, 'epoch': 0.18} {'loss': 0.5846, 'learning_rate': 1.982863981507463e-05, 'epoch': 0.18} {'loss': 0.4624, 'learning_rate': 1.9828577877996266e-05, 'epoch': 0.18} {'loss': 0.6031, 'learning_rate': 1.9828515929823302e-05, 'epoch': 0.18} {'loss': 0.4849, 'learning_rate': 1.9828453970555813e-05, 'epoch': 0.18} {'loss': 0.5999, 'learning_rate': 1.982839200019387e-05, 'epoch': 0.18} {'loss': 0.4253, 'learning_rate': 1.9828330018737538e-05, 'epoch': 0.18} {'loss': 0.5447, 'learning_rate': 1.982826802618689e-05, 'epoch': 0.18} {'loss': 0.4099, 'learning_rate': 1.9828206022542e-05, 'epoch': 0.18} {'loss': 0.542, 'learning_rate': 1.9828144007802933e-05, 'epoch': 0.18} {'loss': 0.6038, 'learning_rate': 1.982808198196976e-05, 'epoch': 0.18} {'loss': 0.6242, 'learning_rate': 1.9828019945042553e-05, 'epoch': 0.18} {'loss': 0.5512, 'learning_rate': 1.982795789702138e-05, 'epoch': 0.18} {'loss': 0.6157, 'learning_rate': 1.982789583790631e-05, 'epoch': 0.18} {'loss': 0.486, 'learning_rate': 1.9827833767697413e-05, 'epoch': 0.18} {'loss': 0.4228, 'learning_rate': 1.9827771686394762e-05, 'epoch': 0.18} {'loss': 0.5525, 'learning_rate': 1.9827709593998427e-05, 'epoch': 0.18} {'loss': 0.4374, 'learning_rate': 1.9827647490508474e-05, 'epoch': 0.18} {'loss': 0.5841, 'learning_rate': 1.9827585375924977e-05, 'epoch': 0.18} {'loss': 0.6433, 'learning_rate': 1.9827523250248006e-05, 'epoch': 0.18} {'loss': 0.7672, 'learning_rate': 1.982746111347763e-05, 'epoch': 0.18} {'loss': 0.4772, 'learning_rate': 1.982739896561392e-05, 'epoch': 0.18} {'loss': 0.6061, 'learning_rate': 1.9827336806656944e-05, 'epoch': 0.18} {'loss': 0.3813, 'learning_rate': 1.9827274636606773e-05, 'epoch': 0.18} {'loss': 0.4578, 'learning_rate': 1.9827212455463475e-05, 'epoch': 0.18} {'loss': 0.5831, 'learning_rate': 1.982715026322713e-05, 'epoch': 0.18} {'loss': 0.4843, 'learning_rate': 1.9827088059897795e-05, 'epoch': 0.18} {'loss': 0.6752, 'learning_rate': 1.982702584547555e-05, 'epoch': 0.18} {'loss': 0.6099, 'learning_rate': 1.982696361996046e-05, 'epoch': 0.18} {'loss': 0.6409, 'learning_rate': 1.9826901383352595e-05, 'epoch': 0.18} {'loss': 0.5573, 'learning_rate': 1.982683913565203e-05, 'epoch': 0.18} {'loss': 0.4468, 'learning_rate': 1.982677687685883e-05, 'epoch': 0.18} {'loss': 0.4859, 'learning_rate': 1.982671460697307e-05, 'epoch': 0.18} {'loss': 0.5405, 'learning_rate': 1.9826652325994816e-05, 'epoch': 0.18} {'loss': 0.5544, 'learning_rate': 1.9826590033924137e-05, 'epoch': 0.18} {'loss': 0.5127, 'learning_rate': 1.9826527730761112e-05, 'epoch': 0.18} {'loss': 0.7412, 'learning_rate': 1.9826465416505804e-05, 'epoch': 0.18} {'loss': 0.6423, 'learning_rate': 1.9826403091158284e-05, 'epoch': 0.18} {'loss': 0.3955, 'learning_rate': 1.9826340754718624e-05, 'epoch': 0.18} {'loss': 0.5683, 'learning_rate': 1.9826278407186895e-05, 'epoch': 0.18} {'loss': 0.7045, 'learning_rate': 1.9826216048563164e-05, 'epoch': 0.18} {'loss': 0.5645, 'learning_rate': 1.9826153678847503e-05, 'epoch': 0.18} {'loss': 0.4878, 'learning_rate': 1.982609129803999e-05, 'epoch': 0.18} {'loss': 0.5252, 'learning_rate': 1.982602890614068e-05, 'epoch': 0.18} {'loss': 0.4285, 'learning_rate': 1.9825966503149656e-05, 'epoch': 0.18} {'loss': 0.4899, 'learning_rate': 1.9825904089066985e-05, 'epoch': 0.18} {'loss': 0.6811, 'learning_rate': 1.9825841663892733e-05, 'epoch': 0.18} {'loss': 0.4801, 'learning_rate': 1.9825779227626977e-05, 'epoch': 0.18} {'loss': 0.4849, 'learning_rate': 1.9825716780269783e-05, 'epoch': 0.18} {'loss': 0.5438, 'learning_rate': 1.9825654321821227e-05, 'epoch': 0.18} {'loss': 0.491, 'learning_rate': 1.982559185228137e-05, 'epoch': 0.18} {'loss': 0.4303, 'learning_rate': 1.9825529371650293e-05, 'epoch': 0.18} {'loss': 0.6461, 'learning_rate': 1.982546687992806e-05, 'epoch': 0.18} {'loss': 0.4536, 'learning_rate': 1.9825404377114744e-05, 'epoch': 0.18} {'loss': 0.7414, 'learning_rate': 1.9825341863210416e-05, 'epoch': 0.18} {'loss': 0.658, 'learning_rate': 1.982527933821514e-05, 'epoch': 0.18} {'loss': 0.5612, 'learning_rate': 1.9825216802128998e-05, 'epoch': 0.18} {'loss': 0.6029, 'learning_rate': 1.9825154254952054e-05, 'epoch': 0.18} {'loss': 0.5124, 'learning_rate': 1.9825091696684375e-05, 'epoch': 0.18} {'loss': 0.6505, 'learning_rate': 1.982502912732604e-05, 'epoch': 0.18} {'loss': 0.7309, 'learning_rate': 1.9824966546877113e-05, 'epoch': 0.18} {'loss': 0.4839, 'learning_rate': 1.982490395533767e-05, 'epoch': 0.18} {'loss': 0.6411, 'learning_rate': 1.9824841352707774e-05, 'epoch': 0.18} {'loss': 0.5253, 'learning_rate': 1.9824778738987505e-05, 'epoch': 0.18} {'loss': 0.609, 'learning_rate': 1.9824716114176925e-05, 'epoch': 0.18} {'loss': 0.6518, 'learning_rate': 1.982465347827611e-05, 'epoch': 0.18} {'loss': 0.5121, 'learning_rate': 1.982459083128513e-05, 'epoch': 0.18} {'loss': 0.3268, 'learning_rate': 1.9824528173204055e-05, 'epoch': 0.18} {'loss': 0.6624, 'learning_rate': 1.982446550403296e-05, 'epoch': 0.18} {'loss': 0.4748, 'learning_rate': 1.9824402823771906e-05, 'epoch': 0.18} {'loss': 0.4994, 'learning_rate': 1.9824340132420972e-05, 'epoch': 0.18} {'loss': 0.6283, 'learning_rate': 1.982427742998023e-05, 'epoch': 0.18} {'loss': 0.5006, 'learning_rate': 1.9824214716449738e-05, 'epoch': 0.18} {'loss': 0.6504, 'learning_rate': 1.9824151991829582e-05, 'epoch': 0.18} {'loss': 0.449, 'learning_rate': 1.9824089256119824e-05, 'epoch': 0.18} {'loss': 0.4938, 'learning_rate': 1.9824026509320538e-05, 'epoch': 0.18} {'loss': 0.6247, 'learning_rate': 1.9823963751431795e-05, 'epoch': 0.18} {'loss': 0.6911, 'learning_rate': 1.9823900982453663e-05, 'epoch': 0.18} {'loss': 0.7167, 'learning_rate': 1.9823838202386216e-05, 'epoch': 0.18} {'loss': 0.4914, 'learning_rate': 1.9823775411229525e-05, 'epoch': 0.18} {'loss': 0.5793, 'learning_rate': 1.982371260898366e-05, 'epoch': 0.18} {'loss': 0.5837, 'learning_rate': 1.9823649795648688e-05, 'epoch': 0.18} {'loss': 0.4638, 'learning_rate': 1.9823586971224687e-05, 'epoch': 0.18} {'loss': 0.5007, 'learning_rate': 1.9823524135711724e-05, 'epoch': 0.18} {'loss': 0.641, 'learning_rate': 1.9823461289109866e-05, 'epoch': 0.18} {'loss': 0.6458, 'learning_rate': 1.982339843141919e-05, 'epoch': 0.18} {'loss': 0.7002, 'learning_rate': 1.9823335562639768e-05, 'epoch': 0.18} {'loss': 0.5331, 'learning_rate': 1.982327268277167e-05, 'epoch': 0.18} {'loss': 0.4394, 'learning_rate': 1.9823209791814962e-05, 'epoch': 0.18} {'loss': 0.6129, 'learning_rate': 1.982314688976972e-05, 'epoch': 0.18} {'loss': 0.6122, 'learning_rate': 1.982308397663601e-05, 'epoch': 0.18} {'loss': 0.6226, 'learning_rate': 1.9823021052413908e-05, 'epoch': 0.18} {'loss': 0.5612, 'learning_rate': 1.9822958117103482e-05, 'epoch': 0.18} {'loss': 0.4888, 'learning_rate': 1.9822895170704802e-05, 'epoch': 0.18} {'loss': 0.5605, 'learning_rate': 1.9822832213217946e-05, 'epoch': 0.18} {'loss': 0.4459, 'learning_rate': 1.9822769244642978e-05, 'epoch': 0.18} {'loss': 0.5933, 'learning_rate': 1.982270626497997e-05, 'epoch': 0.18} {'loss': 0.5783, 'learning_rate': 1.9822643274228997e-05, 'epoch': 0.18} {'loss': 0.5619, 'learning_rate': 1.9822580272390127e-05, 'epoch': 0.18} {'loss': 0.6186, 'learning_rate': 1.982251725946343e-05, 'epoch': 0.18} {'loss': 0.4827, 'learning_rate': 1.9822454235448982e-05, 'epoch': 0.18} {'loss': 0.5906, 'learning_rate': 1.982239120034685e-05, 'epoch': 0.18} {'loss': 0.5838, 'learning_rate': 1.9822328154157104e-05, 'epoch': 0.18} {'loss': 0.4771, 'learning_rate': 1.982226509687982e-05, 'epoch': 0.18} {'loss': 0.654, 'learning_rate': 1.9822202028515063e-05, 'epoch': 0.18} {'loss': 0.4741, 'learning_rate': 1.9822138949062913e-05, 'epoch': 0.18} {'loss': 0.6113, 'learning_rate': 1.982207585852343e-05, 'epoch': 0.18} {'loss': 0.6072, 'learning_rate': 1.9822012756896696e-05, 'epoch': 0.18} {'loss': 0.5938, 'learning_rate': 1.9821949644182778e-05, 'epoch': 0.18} {'loss': 0.4973, 'learning_rate': 1.982188652038174e-05, 'epoch': 0.18} {'loss': 0.696, 'learning_rate': 1.9821823385493663e-05, 'epoch': 0.18} {'loss': 0.7113, 'learning_rate': 1.9821760239518618e-05, 'epoch': 0.18} {'loss': 0.5731, 'learning_rate': 1.982169708245667e-05, 'epoch': 0.18} {'loss': 0.6279, 'learning_rate': 1.9821633914307896e-05, 'epoch': 0.18} {'loss': 0.5228, 'learning_rate': 1.9821570735072364e-05, 'epoch': 0.18} {'loss': 0.4575, 'learning_rate': 1.9821507544750144e-05, 'epoch': 0.18} {'loss': 0.6534, 'learning_rate': 1.9821444343341315e-05, 'epoch': 0.18} {'loss': 0.5831, 'learning_rate': 1.9821381130845937e-05, 'epoch': 0.18} {'loss': 0.4864, 'learning_rate': 1.9821317907264094e-05, 'epoch': 0.18} {'loss': 0.5893, 'learning_rate': 1.9821254672595843e-05, 'epoch': 0.18} {'loss': 0.6235, 'learning_rate': 1.982119142684127e-05, 'epoch': 0.18} {'loss': 0.6001, 'learning_rate': 1.9821128170000433e-05, 'epoch': 0.18} {'loss': 0.5561, 'learning_rate': 1.9821064902073416e-05, 'epoch': 0.18} {'loss': 0.761, 'learning_rate': 1.982100162306028e-05, 'epoch': 0.18} {'loss': 0.7524, 'learning_rate': 1.9820938332961105e-05, 'epoch': 0.18} {'loss': 0.6562, 'learning_rate': 1.9820875031775953e-05, 'epoch': 0.18} {'loss': 0.6152, 'learning_rate': 1.9820811719504905e-05, 'epoch': 0.18} {'loss': 0.7188, 'learning_rate': 1.9820748396148025e-05, 'epoch': 0.18} {'loss': 0.5439, 'learning_rate': 1.982068506170539e-05, 'epoch': 0.18} {'loss': 0.5016, 'learning_rate': 1.9820621716177065e-05, 'epoch': 0.18} {'loss': 0.5348, 'learning_rate': 1.9820558359563128e-05, 'epoch': 0.18} {'loss': 0.5112, 'learning_rate': 1.982049499186365e-05, 'epoch': 0.18} {'loss': 0.5985, 'learning_rate': 1.98204316130787e-05, 'epoch': 0.18} {'loss': 0.7151, 'learning_rate': 1.9820368223208347e-05, 'epoch': 0.18} {'loss': 0.6467, 'learning_rate': 1.9820304822252668e-05, 'epoch': 0.18} {'loss': 0.577, 'learning_rate': 1.982024141021173e-05, 'epoch': 0.18} {'loss': 0.5996, 'learning_rate': 1.982017798708561e-05, 'epoch': 0.18} {'loss': 0.5059, 'learning_rate': 1.9820114552874378e-05, 'epoch': 0.18} {'loss': 0.4697, 'learning_rate': 1.98200511075781e-05, 'epoch': 0.18} {'loss': 0.5869, 'learning_rate': 1.9819987651196854e-05, 'epoch': 0.18} {'loss': 0.36, 'learning_rate': 1.9819924183730705e-05, 'epoch': 0.18} {'loss': 0.5078, 'learning_rate': 1.9819860705179733e-05, 'epoch': 0.18} {'loss': 0.6412, 'learning_rate': 1.9819797215544008e-05, 'epoch': 0.18} {'loss': 0.6463, 'learning_rate': 1.9819733714823596e-05, 'epoch': 0.18} {'loss': 0.6151, 'learning_rate': 1.9819670203018572e-05, 'epoch': 0.18} {'loss': 0.527, 'learning_rate': 1.9819606680129007e-05, 'epoch': 0.18} {'loss': 0.5789, 'learning_rate': 1.9819543146154972e-05, 'epoch': 0.18} {'loss': 0.4041, 'learning_rate': 1.9819479601096546e-05, 'epoch': 0.18} {'loss': 0.7281, 'learning_rate': 1.9819416044953786e-05, 'epoch': 0.18} {'loss': 0.5634, 'learning_rate': 1.981935247772678e-05, 'epoch': 0.18} {'loss': 0.461, 'learning_rate': 1.9819288899415588e-05, 'epoch': 0.18} {'loss': 0.6562, 'learning_rate': 1.981922531002029e-05, 'epoch': 0.18} {'loss': 0.5626, 'learning_rate': 1.981916170954095e-05, 'epoch': 0.18} {'loss': 0.5248, 'learning_rate': 1.981909809797765e-05, 'epoch': 0.18} {'loss': 0.7513, 'learning_rate': 1.981903447533045e-05, 'epoch': 0.18} {'loss': 0.588, 'learning_rate': 1.9818970841599426e-05, 'epoch': 0.18} {'loss': 0.5736, 'learning_rate': 1.9818907196784653e-05, 'epoch': 0.18} {'loss': 0.8598, 'learning_rate': 1.98188435408862e-05, 'epoch': 0.18} {'loss': 0.5639, 'learning_rate': 1.9818779873904142e-05, 'epoch': 0.18} {'loss': 0.5755, 'learning_rate': 1.9818716195838545e-05, 'epoch': 0.18} {'loss': 0.7421, 'learning_rate': 1.9818652506689487e-05, 'epoch': 0.18} {'loss': 0.4594, 'learning_rate': 1.981858880645704e-05, 'epoch': 0.18} {'loss': 0.6556, 'learning_rate': 1.981852509514127e-05, 'epoch': 0.18} {'loss': 0.6115, 'learning_rate': 1.9818461372742253e-05, 'epoch': 0.18} {'loss': 0.6431, 'learning_rate': 1.981839763926006e-05, 'epoch': 0.18} {'loss': 0.5131, 'learning_rate': 1.9818333894694763e-05, 'epoch': 0.18} {'loss': 0.4933, 'learning_rate': 1.9818270139046432e-05, 'epoch': 0.18} {'loss': 0.5015, 'learning_rate': 1.9818206372315144e-05, 'epoch': 0.18} {'loss': 0.5276, 'learning_rate': 1.9818142594500968e-05, 'epoch': 0.18} {'loss': 0.429, 'learning_rate': 1.9818078805603975e-05, 'epoch': 0.18} {'loss': 0.61, 'learning_rate': 1.981801500562424e-05, 'epoch': 0.18} {'loss': 0.5695, 'learning_rate': 1.981795119456183e-05, 'epoch': 0.18} {'loss': 0.4906, 'learning_rate': 1.9817887372416826e-05, 'epoch': 0.18} {'loss': 0.6616, 'learning_rate': 1.9817823539189287e-05, 'epoch': 0.18} {'loss': 0.683, 'learning_rate': 1.9817759694879294e-05, 'epoch': 0.18} {'loss': 0.5623, 'learning_rate': 1.981769583948692e-05, 'epoch': 0.18} {'loss': 0.4975, 'learning_rate': 1.981763197301223e-05, 'epoch': 0.18} {'loss': 0.3089, 'learning_rate': 1.9817568095455305e-05, 'epoch': 0.18} {'loss': 0.6564, 'learning_rate': 1.981750420681621e-05, 'epoch': 0.18} {'loss': 0.4628, 'learning_rate': 1.9817440307095018e-05, 'epoch': 0.18} {'loss': 0.4589, 'learning_rate': 1.9817376396291807e-05, 'epoch': 0.18} {'loss': 0.4517, 'learning_rate': 1.981731247440664e-05, 'epoch': 0.18} {'loss': 0.5356, 'learning_rate': 1.9817248541439596e-05, 'epoch': 0.18} {'loss': 0.6696, 'learning_rate': 1.981718459739075e-05, 'epoch': 0.18} {'loss': 0.6817, 'learning_rate': 1.9817120642260162e-05, 'epoch': 0.18} {'loss': 0.5375, 'learning_rate': 1.9817056676047915e-05, 'epoch': 0.18} {'loss': 0.5733, 'learning_rate': 1.981699269875408e-05, 'epoch': 0.18} {'loss': 0.7053, 'learning_rate': 1.9816928710378723e-05, 'epoch': 0.18} {'loss': 0.5196, 'learning_rate': 1.9816864710921923e-05, 'epoch': 0.18} {'loss': 0.4987, 'learning_rate': 1.9816800700383748e-05, 'epoch': 0.18} {'loss': 0.6795, 'learning_rate': 1.9816736678764273e-05, 'epoch': 0.18} {'loss': 0.7122, 'learning_rate': 1.981667264606357e-05, 'epoch': 0.18} {'loss': 0.493, 'learning_rate': 1.9816608602281708e-05, 'epoch': 0.18} {'loss': 0.5983, 'learning_rate': 1.9816544547418762e-05, 'epoch': 0.18} {'loss': 0.569, 'learning_rate': 1.9816480481474802e-05, 'epoch': 0.18} {'loss': 0.5057, 'learning_rate': 1.9816416404449904e-05, 'epoch': 0.18} {'loss': 0.5636, 'learning_rate': 1.981635231634414e-05, 'epoch': 0.18} {'loss': 0.4831, 'learning_rate': 1.981628821715758e-05, 'epoch': 0.18} {'loss': 0.3967, 'learning_rate': 1.9816224106890297e-05, 'epoch': 0.18} {'loss': 0.6614, 'learning_rate': 1.9816159985542366e-05, 'epoch': 0.18} {'loss': 0.7213, 'learning_rate': 1.9816095853113852e-05, 'epoch': 0.18} {'loss': 0.6319, 'learning_rate': 1.9816031709604836e-05, 'epoch': 0.18} {'loss': 0.5312, 'learning_rate': 1.9815967555015385e-05, 'epoch': 0.18} {'loss': 0.7479, 'learning_rate': 1.9815903389345575e-05, 'epoch': 0.18} {'loss': 0.614, 'learning_rate': 1.9815839212595476e-05, 'epoch': 0.18} {'loss': 0.4735, 'learning_rate': 1.981577502476516e-05, 'epoch': 0.18} {'loss': 0.6723, 'learning_rate': 1.9815710825854702e-05, 'epoch': 0.18} {'loss': 0.4792, 'learning_rate': 1.981564661586417e-05, 'epoch': 0.18} {'loss': 0.6147, 'learning_rate': 1.9815582394793645e-05, 'epoch': 0.18} {'loss': 0.532, 'learning_rate': 1.981551816264319e-05, 'epoch': 0.18} {'loss': 0.5947, 'learning_rate': 1.981545391941288e-05, 'epoch': 0.18} {'loss': 0.4567, 'learning_rate': 1.9815389665102793e-05, 'epoch': 0.18} {'loss': 0.4247, 'learning_rate': 1.9815325399712996e-05, 'epoch': 0.18} {'loss': 0.6279, 'learning_rate': 1.9815261123243565e-05, 'epoch': 0.18} {'loss': 0.5937, 'learning_rate': 1.9815196835694566e-05, 'epoch': 0.18} {'loss': 0.5531, 'learning_rate': 1.981513253706608e-05, 'epoch': 0.18} {'loss': 0.5512, 'learning_rate': 1.9815068227358173e-05, 'epoch': 0.18} {'loss': 0.6689, 'learning_rate': 1.9815003906570924e-05, 'epoch': 0.18} {'loss': 0.7276, 'learning_rate': 1.98149395747044e-05, 'epoch': 0.18} {'loss': 0.5748, 'learning_rate': 1.9814875231758678e-05, 'epoch': 0.18} {'loss': 0.5564, 'learning_rate': 1.9814810877733825e-05, 'epoch': 0.18} {'loss': 0.6491, 'learning_rate': 1.9814746512629918e-05, 'epoch': 0.18} {'loss': 0.5599, 'learning_rate': 1.981468213644703e-05, 'epoch': 0.18} {'loss': 0.5117, 'learning_rate': 1.9814617749185227e-05, 'epoch': 0.18} {'loss': 0.4524, 'learning_rate': 1.981455335084459e-05, 'epoch': 0.18} {'loss': 0.6132, 'learning_rate': 1.9814488941425193e-05, 'epoch': 0.18} {'loss': 0.455, 'learning_rate': 1.98144245209271e-05, 'epoch': 0.18} {'loss': 0.481, 'learning_rate': 1.9814360089350387e-05, 'epoch': 0.18} {'loss': 0.4672, 'learning_rate': 1.981429564669513e-05, 'epoch': 0.18} {'loss': 0.574, 'learning_rate': 1.98142311929614e-05, 'epoch': 0.18} {'loss': 0.3547, 'learning_rate': 1.9814166728149265e-05, 'epoch': 0.18} {'loss': 0.5258, 'learning_rate': 1.9814102252258808e-05, 'epoch': 0.18} {'loss': 0.548, 'learning_rate': 1.9814037765290092e-05, 'epoch': 0.18} {'loss': 0.6386, 'learning_rate': 1.981397326724319e-05, 'epoch': 0.18} {'loss': 0.5938, 'learning_rate': 1.9813908758118186e-05, 'epoch': 0.18} {'loss': 0.6041, 'learning_rate': 1.9813844237915143e-05, 'epoch': 0.18} {'loss': 0.5446, 'learning_rate': 1.9813779706634135e-05, 'epoch': 0.18} {'loss': 0.4929, 'learning_rate': 1.9813715164275234e-05, 'epoch': 0.18} {'loss': 0.5328, 'learning_rate': 1.9813650610838518e-05, 'epoch': 0.18} {'loss': 0.6131, 'learning_rate': 1.9813586046324054e-05, 'epoch': 0.18} {'loss': 0.5797, 'learning_rate': 1.9813521470731916e-05, 'epoch': 0.18} {'loss': 0.6593, 'learning_rate': 1.9813456884062184e-05, 'epoch': 0.18} {'loss': 0.5649, 'learning_rate': 1.9813392286314924e-05, 'epoch': 0.18} {'loss': 0.5341, 'learning_rate': 1.9813327677490205e-05, 'epoch': 0.18} {'loss': 0.5922, 'learning_rate': 1.981326305758811e-05, 'epoch': 0.18} {'loss': 0.5196, 'learning_rate': 1.9813198426608706e-05, 'epoch': 0.18} {'loss': 0.5824, 'learning_rate': 1.981313378455207e-05, 'epoch': 0.18} {'loss': 0.5929, 'learning_rate': 1.9813069131418267e-05, 'epoch': 0.18} {'loss': 0.67, 'learning_rate': 1.9813004467207377e-05, 'epoch': 0.18} {'loss': 0.4995, 'learning_rate': 1.9812939791919473e-05, 'epoch': 0.18} {'loss': 0.4574, 'learning_rate': 1.981287510555462e-05, 'epoch': 0.18} {'loss': 0.5751, 'learning_rate': 1.98128104081129e-05, 'epoch': 0.18} {'loss': 0.4974, 'learning_rate': 1.981274569959439e-05, 'epoch': 0.18} {'loss': 0.7056, 'learning_rate': 1.9812680979999145e-05, 'epoch': 0.18} {'loss': 0.5511, 'learning_rate': 1.9812616249327256e-05, 'epoch': 0.18} {'loss': 0.5652, 'learning_rate': 1.9812551507578788e-05, 'epoch': 0.18} {'loss': 0.6021, 'learning_rate': 1.9812486754753816e-05, 'epoch': 0.18} {'loss': 0.3793, 'learning_rate': 1.9812421990852407e-05, 'epoch': 0.18} {'loss': 0.5069, 'learning_rate': 1.9812357215874643e-05, 'epoch': 0.18} {'loss': 0.5122, 'learning_rate': 1.9812292429820596e-05, 'epoch': 0.18} {'loss': 0.5762, 'learning_rate': 1.9812227632690335e-05, 'epoch': 0.18} {'loss': 0.6137, 'learning_rate': 1.9812162824483937e-05, 'epoch': 0.18} {'loss': 0.5522, 'learning_rate': 1.981209800520147e-05, 'epoch': 0.18} {'loss': 0.5927, 'learning_rate': 1.981203317484301e-05, 'epoch': 0.18} {'loss': 0.5995, 'learning_rate': 1.981196833340863e-05, 'epoch': 0.18} {'loss': 0.3832, 'learning_rate': 1.9811903480898403e-05, 'epoch': 0.18} {'loss': 0.7086, 'learning_rate': 1.9811838617312407e-05, 'epoch': 0.18} {'loss': 0.6819, 'learning_rate': 1.9811773742650707e-05, 'epoch': 0.18} {'loss': 0.5149, 'learning_rate': 1.9811708856913384e-05, 'epoch': 0.18} {'loss': 0.6228, 'learning_rate': 1.9811643960100505e-05, 'epoch': 0.18} {'loss': 0.4418, 'learning_rate': 1.9811579052212145e-05, 'epoch': 0.18} {'loss': 0.4645, 'learning_rate': 1.9811514133248383e-05, 'epoch': 0.18} {'loss': 0.3954, 'learning_rate': 1.981144920320928e-05, 'epoch': 0.18} {'loss': 0.5731, 'learning_rate': 1.9811384262094922e-05, 'epoch': 0.18} {'loss': 0.5011, 'learning_rate': 1.9811319309905377e-05, 'epoch': 0.18} {'loss': 0.5169, 'learning_rate': 1.9811254346640717e-05, 'epoch': 0.18} {'loss': 0.4635, 'learning_rate': 1.981118937230101e-05, 'epoch': 0.18} {'loss': 0.5949, 'learning_rate': 1.9811124386886344e-05, 'epoch': 0.18} {'loss': 0.6713, 'learning_rate': 1.9811059390396783e-05, 'epoch': 0.18} {'loss': 0.6065, 'learning_rate': 1.98109943828324e-05, 'epoch': 0.18} {'loss': 0.491, 'learning_rate': 1.981092936419327e-05, 'epoch': 0.18} {'loss': 0.4481, 'learning_rate': 1.9810864334479465e-05, 'epoch': 0.18} {'loss': 0.4959, 'learning_rate': 1.9810799293691064e-05, 'epoch': 0.18} {'loss': 0.477, 'learning_rate': 1.9810734241828133e-05, 'epoch': 0.18} {'loss': 0.4097, 'learning_rate': 1.9810669178890748e-05, 'epoch': 0.18} {'loss': 0.6493, 'learning_rate': 1.9810604104878987e-05, 'epoch': 0.18} {'loss': 0.5983, 'learning_rate': 1.9810539019792917e-05, 'epoch': 0.18} {'loss': 0.4448, 'learning_rate': 1.9810473923632612e-05, 'epoch': 0.18} {'loss': 0.7523, 'learning_rate': 1.9810408816398152e-05, 'epoch': 0.18} {'loss': 0.6787, 'learning_rate': 1.9810343698089603e-05, 'epoch': 0.18} {'loss': 0.5553, 'learning_rate': 1.981027856870704e-05, 'epoch': 0.18} {'loss': 0.6684, 'learning_rate': 1.9810213428250542e-05, 'epoch': 0.18} {'loss': 0.5352, 'learning_rate': 1.981014827672018e-05, 'epoch': 0.18} {'loss': 0.6477, 'learning_rate': 1.981008311411602e-05, 'epoch': 0.18} {'loss': 0.6332, 'learning_rate': 1.9810017940438145e-05, 'epoch': 0.18} {'loss': 0.5732, 'learning_rate': 1.9809952755686624e-05, 'epoch': 0.18} {'loss': 0.663, 'learning_rate': 1.980988755986153e-05, 'epoch': 0.18} {'loss': 0.6909, 'learning_rate': 1.980982235296294e-05, 'epoch': 0.18} {'loss': 0.6385, 'learning_rate': 1.9809757134990926e-05, 'epoch': 0.18} {'loss': 0.6866, 'learning_rate': 1.9809691905945566e-05, 'epoch': 0.18} {'loss': 0.5069, 'learning_rate': 1.9809626665826927e-05, 'epoch': 0.18} {'loss': 0.4336, 'learning_rate': 1.980956141463508e-05, 'epoch': 0.18} {'loss': 0.495, 'learning_rate': 1.9809496152370107e-05, 'epoch': 0.18} {'loss': 0.4888, 'learning_rate': 1.980943087903208e-05, 'epoch': 0.18} {'loss': 0.5775, 'learning_rate': 1.9809365594621067e-05, 'epoch': 0.18} {'loss': 0.5662, 'learning_rate': 1.980930029913715e-05, 'epoch': 0.18} {'loss': 0.5469, 'learning_rate': 1.9809234992580394e-05, 'epoch': 0.18} {'loss': 0.6357, 'learning_rate': 1.9809169674950877e-05, 'epoch': 0.18} {'loss': 0.7456, 'learning_rate': 1.980910434624868e-05, 'epoch': 0.18} {'loss': 0.5784, 'learning_rate': 1.9809039006473862e-05, 'epoch': 0.18} {'loss': 0.5069, 'learning_rate': 1.9808973655626506e-05, 'epoch': 0.18} {'loss': 0.4385, 'learning_rate': 1.9808908293706684e-05, 'epoch': 0.18} {'loss': 0.6018, 'learning_rate': 1.980884292071447e-05, 'epoch': 0.18} {'loss': 0.3596, 'learning_rate': 1.9808777536649938e-05, 'epoch': 0.18} {'loss': 0.5519, 'learning_rate': 1.980871214151316e-05, 'epoch': 0.18} {'loss': 0.6526, 'learning_rate': 1.9808646735304214e-05, 'epoch': 0.18} {'loss': 0.4517, 'learning_rate': 1.980858131802317e-05, 'epoch': 0.18} {'loss': 0.4855, 'learning_rate': 1.9808515889670102e-05, 'epoch': 0.18} {'loss': 0.4547, 'learning_rate': 1.9808450450245085e-05, 'epoch': 0.18} {'loss': 0.6768, 'learning_rate': 1.980838499974819e-05, 'epoch': 0.18} {'loss': 0.3743, 'learning_rate': 1.98083195381795e-05, 'epoch': 0.18} {'loss': 0.5909, 'learning_rate': 1.9808254065539075e-05, 'epoch': 0.18} {'loss': 0.5443, 'learning_rate': 1.9808188581827e-05, 'epoch': 0.18} {'loss': 0.5897, 'learning_rate': 1.9808123087043346e-05, 'epoch': 0.18} {'loss': 0.6592, 'learning_rate': 1.9808057581188184e-05, 'epoch': 0.18} {'loss': 0.4797, 'learning_rate': 1.9807992064261593e-05, 'epoch': 0.18} {'loss': 0.321, 'learning_rate': 1.980792653626364e-05, 'epoch': 0.18} {'loss': 0.549, 'learning_rate': 1.9807860997194407e-05, 'epoch': 0.18} {'loss': 0.5124, 'learning_rate': 1.980779544705396e-05, 'epoch': 0.18} {'loss': 0.6198, 'learning_rate': 1.980772988584238e-05, 'epoch': 0.18} {'loss': 0.5645, 'learning_rate': 1.9807664313559737e-05, 'epoch': 0.18} {'loss': 0.5189, 'learning_rate': 1.9807598730206105e-05, 'epoch': 0.18} {'loss': 0.5776, 'learning_rate': 1.9807533135781563e-05, 'epoch': 0.18} {'loss': 0.4039, 'learning_rate': 1.980746753028618e-05, 'epoch': 0.18} {'loss': 0.6232, 'learning_rate': 1.980740191372003e-05, 'epoch': 0.18} {'loss': 0.7043, 'learning_rate': 1.9807336286083183e-05, 'epoch': 0.18} {'loss': 0.5635, 'learning_rate': 1.9807270647375722e-05, 'epoch': 0.18} {'loss': 0.4804, 'learning_rate': 1.980720499759772e-05, 'epoch': 0.18} {'loss': 0.6012, 'learning_rate': 1.980713933674925e-05, 'epoch': 0.18} {'loss': 0.6674, 'learning_rate': 1.980707366483038e-05, 'epoch': 0.18} {'loss': 0.6201, 'learning_rate': 1.980700798184119e-05, 'epoch': 0.18} {'loss': 0.5146, 'learning_rate': 1.980694228778175e-05, 'epoch': 0.18} {'loss': 0.6021, 'learning_rate': 1.980687658265214e-05, 'epoch': 0.18} {'loss': 0.5801, 'learning_rate': 1.9806810866452433e-05, 'epoch': 0.18} {'loss': 0.4235, 'learning_rate': 1.98067451391827e-05, 'epoch': 0.18} {'loss': 0.5808, 'learning_rate': 1.9806679400843015e-05, 'epoch': 0.18} {'loss': 0.6026, 'learning_rate': 1.9806613651433456e-05, 'epoch': 0.18} {'loss': 0.5716, 'learning_rate': 1.9806547890954092e-05, 'epoch': 0.18} {'loss': 0.3923, 'learning_rate': 1.9806482119405003e-05, 'epoch': 0.18} {'loss': 0.6825, 'learning_rate': 1.980641633678626e-05, 'epoch': 0.18} {'loss': 0.4309, 'learning_rate': 1.9806350543097936e-05, 'epoch': 0.18} {'loss': 0.6155, 'learning_rate': 1.980628473834011e-05, 'epoch': 0.18} {'loss': 0.4829, 'learning_rate': 1.9806218922512852e-05, 'epoch': 0.18} {'loss': 0.5536, 'learning_rate': 1.9806153095616235e-05, 'epoch': 0.18} {'loss': 0.6008, 'learning_rate': 1.980608725765034e-05, 'epoch': 0.18} {'loss': 0.5439, 'learning_rate': 1.9806021408615233e-05, 'epoch': 0.18} {'loss': 0.3764, 'learning_rate': 1.9805955548510995e-05, 'epoch': 0.18} {'loss': 0.571, 'learning_rate': 1.98058896773377e-05, 'epoch': 0.18} {'loss': 0.5179, 'learning_rate': 1.9805823795095417e-05, 'epoch': 0.18} {'loss': 0.5441, 'learning_rate': 1.9805757901784224e-05, 'epoch': 0.18} {'loss': 0.544, 'learning_rate': 1.9805691997404194e-05, 'epoch': 0.18} {'loss': 0.5035, 'learning_rate': 1.9805626081955408e-05, 'epoch': 0.18} {'loss': 0.4742, 'learning_rate': 1.9805560155437928e-05, 'epoch': 0.18} {'loss': 0.4308, 'learning_rate': 1.9805494217851838e-05, 'epoch': 0.18} {'loss': 0.5278, 'learning_rate': 1.980542826919721e-05, 'epoch': 0.18} {'loss': 0.544, 'learning_rate': 1.9805362309474117e-05, 'epoch': 0.18} {'loss': 0.5791, 'learning_rate': 1.9805296338682635e-05, 'epoch': 0.18} {'loss': 0.4704, 'learning_rate': 1.9805230356822838e-05, 'epoch': 0.18} {'loss': 0.5344, 'learning_rate': 1.98051643638948e-05, 'epoch': 0.18} {'loss': 0.5859, 'learning_rate': 1.98050983598986e-05, 'epoch': 0.18} {'loss': 0.6338, 'learning_rate': 1.9805032344834304e-05, 'epoch': 0.18} {'loss': 0.5953, 'learning_rate': 1.980496631870199e-05, 'epoch': 0.18} {'loss': 0.3445, 'learning_rate': 1.9804900281501734e-05, 'epoch': 0.18} {'loss': 0.6957, 'learning_rate': 1.9804834233233616e-05, 'epoch': 0.18} {'loss': 0.6811, 'learning_rate': 1.9804768173897697e-05, 'epoch': 0.18} {'loss': 0.5088, 'learning_rate': 1.9804702103494066e-05, 'epoch': 0.18} {'loss': 0.5814, 'learning_rate': 1.9804636022022784e-05, 'epoch': 0.18} {'loss': 0.6552, 'learning_rate': 1.9804569929483936e-05, 'epoch': 0.18} {'loss': 0.61, 'learning_rate': 1.9804503825877593e-05, 'epoch': 0.18} {'loss': 0.5879, 'learning_rate': 1.980443771120383e-05, 'epoch': 0.18} {'loss': 0.6629, 'learning_rate': 1.980437158546272e-05, 'epoch': 0.18} {'loss': 0.6622, 'learning_rate': 1.9804305448654338e-05, 'epoch': 0.18} {'loss': 0.5491, 'learning_rate': 1.980423930077876e-05, 'epoch': 0.18} {'loss': 0.4609, 'learning_rate': 1.9804173141836062e-05, 'epoch': 0.18} {'loss': 0.6646, 'learning_rate': 1.9804106971826317e-05, 'epoch': 0.18} {'loss': 0.4581, 'learning_rate': 1.98040407907496e-05, 'epoch': 0.18} {'loss': 0.6829, 'learning_rate': 1.980397459860598e-05, 'epoch': 0.18} {'loss': 0.6133, 'learning_rate': 1.9803908395395543e-05, 'epoch': 0.18} {'loss': 0.587, 'learning_rate': 1.9803842181118355e-05, 'epoch': 0.18} {'loss': 0.5656, 'learning_rate': 1.980377595577449e-05, 'epoch': 0.18} {'loss': 0.4355, 'learning_rate': 1.980370971936403e-05, 'epoch': 0.18} {'loss': 0.6462, 'learning_rate': 1.9803643471887048e-05, 'epoch': 0.18} {'loss': 0.6912, 'learning_rate': 1.9803577213343613e-05, 'epoch': 0.18} {'loss': 0.693, 'learning_rate': 1.9803510943733805e-05, 'epoch': 0.18} {'loss': 0.5625, 'learning_rate': 1.9803444663057697e-05, 'epoch': 0.18} {'loss': 0.6219, 'learning_rate': 1.980337837131537e-05, 'epoch': 0.18} {'loss': 0.5169, 'learning_rate': 1.9803312068506886e-05, 'epoch': 0.18} {'loss': 0.5666, 'learning_rate': 1.980324575463233e-05, 'epoch': 0.18} {'loss': 0.7126, 'learning_rate': 1.980317942969177e-05, 'epoch': 0.18} {'loss': 0.5949, 'learning_rate': 1.9803113093685285e-05, 'epoch': 0.18} {'loss': 0.6316, 'learning_rate': 1.9803046746612952e-05, 'epoch': 0.18} {'loss': 0.518, 'learning_rate': 1.9802980388474845e-05, 'epoch': 0.18} {'loss': 0.5093, 'learning_rate': 1.9802914019271034e-05, 'epoch': 0.18} {'loss': 0.428, 'learning_rate': 1.98028476390016e-05, 'epoch': 0.18} {'loss': 0.7685, 'learning_rate': 1.9802781247666614e-05, 'epoch': 0.18} {'loss': 0.6878, 'learning_rate': 1.9802714845266153e-05, 'epoch': 0.18} {'loss': 0.4503, 'learning_rate': 1.9802648431800287e-05, 'epoch': 0.18} {'loss': 0.5951, 'learning_rate': 1.9802582007269098e-05, 'epoch': 0.18} {'loss': 0.6316, 'learning_rate': 1.9802515571672656e-05, 'epoch': 0.18} {'loss': 0.4516, 'learning_rate': 1.980244912501104e-05, 'epoch': 0.18} {'loss': 0.5974, 'learning_rate': 1.9802382667284322e-05, 'epoch': 0.19} {'loss': 0.5022, 'learning_rate': 1.9802316198492578e-05, 'epoch': 0.19} {'loss': 0.4741, 'learning_rate': 1.9802249718635884e-05, 'epoch': 0.19} {'loss': 0.7221, 'learning_rate': 1.9802183227714313e-05, 'epoch': 0.19} {'loss': 0.5838, 'learning_rate': 1.980211672572794e-05, 'epoch': 0.19} {'loss': 0.6764, 'learning_rate': 1.9802050212676845e-05, 'epoch': 0.19} {'loss': 0.5865, 'learning_rate': 1.9801983688561097e-05, 'epoch': 0.19} {'loss': 0.728, 'learning_rate': 1.9801917153380774e-05, 'epoch': 0.19} {'loss': 0.5081, 'learning_rate': 1.9801850607135948e-05, 'epoch': 0.19} {'loss': 0.4712, 'learning_rate': 1.9801784049826696e-05, 'epoch': 0.19} {'loss': 0.5899, 'learning_rate': 1.9801717481453097e-05, 'epoch': 0.19} {'loss': 0.5296, 'learning_rate': 1.9801650902015225e-05, 'epoch': 0.19} {'loss': 0.6392, 'learning_rate': 1.9801584311513148e-05, 'epoch': 0.19} {'loss': 0.4821, 'learning_rate': 1.980151770994695e-05, 'epoch': 0.19} {'loss': 0.531, 'learning_rate': 1.98014510973167e-05, 'epoch': 0.19} {'loss': 0.5417, 'learning_rate': 1.9801384473622477e-05, 'epoch': 0.19} {'loss': 0.6673, 'learning_rate': 1.980131783886435e-05, 'epoch': 0.19} {'loss': 0.6991, 'learning_rate': 1.9801251193042406e-05, 'epoch': 0.19} {'loss': 0.4624, 'learning_rate': 1.9801184536156706e-05, 'epoch': 0.19} {'loss': 0.6036, 'learning_rate': 1.980111786820734e-05, 'epoch': 0.19} {'loss': 0.4065, 'learning_rate': 1.9801051189194372e-05, 'epoch': 0.19} {'loss': 0.5466, 'learning_rate': 1.980098449911788e-05, 'epoch': 0.19} {'loss': 0.4773, 'learning_rate': 1.980091779797794e-05, 'epoch': 0.19} {'loss': 0.6246, 'learning_rate': 1.980085108577463e-05, 'epoch': 0.19} {'loss': 0.6414, 'learning_rate': 1.9800784362508022e-05, 'epoch': 0.19} {'loss': 0.6076, 'learning_rate': 1.980071762817819e-05, 'epoch': 0.19} {'loss': 0.3925, 'learning_rate': 1.9800650882785213e-05, 'epoch': 0.19} {'loss': 0.5247, 'learning_rate': 1.9800584126329165e-05, 'epoch': 0.19} {'loss': 0.4193, 'learning_rate': 1.9800517358810124e-05, 'epoch': 0.19} {'loss': 0.5676, 'learning_rate': 1.9800450580228158e-05, 'epoch': 0.19} {'loss': 0.7055, 'learning_rate': 1.980038379058335e-05, 'epoch': 0.19} {'loss': 0.5309, 'learning_rate': 1.9800316989875768e-05, 'epoch': 0.19} {'loss': 0.5549, 'learning_rate': 1.9800250178105497e-05, 'epoch': 0.19} {'loss': 0.56, 'learning_rate': 1.9800183355272605e-05, 'epoch': 0.19} {'loss': 0.6893, 'learning_rate': 1.980011652137717e-05, 'epoch': 0.19} {'loss': 0.6776, 'learning_rate': 1.9800049676419266e-05, 'epoch': 0.19} {'loss': 0.3938, 'learning_rate': 1.979998282039897e-05, 'epoch': 0.19} {'loss': 0.4382, 'learning_rate': 1.979991595331636e-05, 'epoch': 0.19} {'loss': 0.6677, 'learning_rate': 1.97998490751715e-05, 'epoch': 0.19} {'loss': 0.5777, 'learning_rate': 1.979978218596448e-05, 'epoch': 0.19} {'loss': 0.5024, 'learning_rate': 1.979971528569537e-05, 'epoch': 0.19} {'loss': 0.6459, 'learning_rate': 1.9799648374364243e-05, 'epoch': 0.19} {'loss': 0.3859, 'learning_rate': 1.9799581451971177e-05, 'epoch': 0.19} {'loss': 0.6018, 'learning_rate': 1.9799514518516247e-05, 'epoch': 0.19} {'loss': 0.6091, 'learning_rate': 1.9799447573999528e-05, 'epoch': 0.19} {'loss': 0.4671, 'learning_rate': 1.9799380618421097e-05, 'epoch': 0.19} {'loss': 0.5337, 'learning_rate': 1.9799313651781032e-05, 'epoch': 0.19} {'loss': 0.6127, 'learning_rate': 1.97992466740794e-05, 'epoch': 0.19} {'loss': 0.4472, 'learning_rate': 1.9799179685316283e-05, 'epoch': 0.19} {'loss': 0.5841, 'learning_rate': 1.9799112685491758e-05, 'epoch': 0.19} {'loss': 0.6112, 'learning_rate': 1.9799045674605897e-05, 'epoch': 0.19} {'loss': 0.6, 'learning_rate': 1.9798978652658775e-05, 'epoch': 0.19} {'loss': 0.4199, 'learning_rate': 1.979891161965047e-05, 'epoch': 0.19} {'loss': 0.4456, 'learning_rate': 1.979884457558106e-05, 'epoch': 0.19} {'loss': 0.4973, 'learning_rate': 1.9798777520450614e-05, 'epoch': 0.19} {'loss': 0.6299, 'learning_rate': 1.9798710454259214e-05, 'epoch': 0.19} {'loss': 0.4801, 'learning_rate': 1.9798643377006933e-05, 'epoch': 0.19} {'loss': 0.5997, 'learning_rate': 1.9798576288693845e-05, 'epoch': 0.19} {'loss': 0.5043, 'learning_rate': 1.979850918932003e-05, 'epoch': 0.19} {'loss': 0.523, 'learning_rate': 1.979844207888556e-05, 'epoch': 0.19} {'loss': 0.5369, 'learning_rate': 1.979837495739051e-05, 'epoch': 0.19} {'loss': 0.664, 'learning_rate': 1.979830782483496e-05, 'epoch': 0.19} {'loss': 0.5006, 'learning_rate': 1.9798240681218986e-05, 'epoch': 0.19} {'loss': 0.6277, 'learning_rate': 1.9798173526542662e-05, 'epoch': 0.19} {'loss': 0.6413, 'learning_rate': 1.979810636080606e-05, 'epoch': 0.19} {'loss': 0.4773, 'learning_rate': 1.979803918400926e-05, 'epoch': 0.19} {'loss': 0.5955, 'learning_rate': 1.9797971996152335e-05, 'epoch': 0.19} {'loss': 0.4048, 'learning_rate': 1.9797904797235365e-05, 'epoch': 0.19} {'loss': 0.5489, 'learning_rate': 1.9797837587258425e-05, 'epoch': 0.19} {'loss': 0.4512, 'learning_rate': 1.9797770366221586e-05, 'epoch': 0.19} {'loss': 0.5622, 'learning_rate': 1.9797703134124933e-05, 'epoch': 0.19} {'loss': 0.6951, 'learning_rate': 1.979763589096853e-05, 'epoch': 0.19} {'loss': 0.5866, 'learning_rate': 1.9797568636752462e-05, 'epoch': 0.19} {'loss': 0.5007, 'learning_rate': 1.9797501371476803e-05, 'epoch': 0.19} {'loss': 0.528, 'learning_rate': 1.9797434095141628e-05, 'epoch': 0.19} {'loss': 0.6587, 'learning_rate': 1.9797366807747012e-05, 'epoch': 0.19} {'loss': 0.5946, 'learning_rate': 1.9797299509293032e-05, 'epoch': 0.19} {'loss': 0.5173, 'learning_rate': 1.9797232199779763e-05, 'epoch': 0.19} {'loss': 0.4508, 'learning_rate': 1.9797164879207283e-05, 'epoch': 0.19} {'loss': 0.4934, 'learning_rate': 1.9797097547575666e-05, 'epoch': 0.19} {'loss': 0.8308, 'learning_rate': 1.9797030204884987e-05, 'epoch': 0.19} {'loss': 0.6043, 'learning_rate': 1.9796962851135327e-05, 'epoch': 0.19} {'loss': 0.5651, 'learning_rate': 1.9796895486326758e-05, 'epoch': 0.19} {'loss': 0.5944, 'learning_rate': 1.9796828110459357e-05, 'epoch': 0.19} {'loss': 0.5231, 'learning_rate': 1.9796760723533203e-05, 'epoch': 0.19} {'loss': 0.6388, 'learning_rate': 1.9796693325548366e-05, 'epoch': 0.19} {'loss': 0.5688, 'learning_rate': 1.9796625916504927e-05, 'epoch': 0.19} {'loss': 0.3073, 'learning_rate': 1.9796558496402955e-05, 'epoch': 0.19} {'loss': 0.38, 'learning_rate': 1.9796491065242535e-05, 'epoch': 0.19} {'loss': 0.5668, 'learning_rate': 1.9796423623023743e-05, 'epoch': 0.19} {'loss': 0.5171, 'learning_rate': 1.9796356169746645e-05, 'epoch': 0.19} {'loss': 0.5227, 'learning_rate': 1.9796288705411325e-05, 'epoch': 0.19} {'loss': 0.5607, 'learning_rate': 1.979622123001786e-05, 'epoch': 0.19} {'loss': 0.4529, 'learning_rate': 1.9796153743566324e-05, 'epoch': 0.19} {'loss': 0.5098, 'learning_rate': 1.9796086246056796e-05, 'epoch': 0.19} {'loss': 0.5966, 'learning_rate': 1.9796018737489345e-05, 'epoch': 0.19} {'loss': 0.6559, 'learning_rate': 1.9795951217864054e-05, 'epoch': 0.19} {'loss': 0.6336, 'learning_rate': 1.9795883687180996e-05, 'epoch': 0.19} {'loss': 0.4021, 'learning_rate': 1.9795816145440248e-05, 'epoch': 0.19} {'loss': 0.5954, 'learning_rate': 1.9795748592641884e-05, 'epoch': 0.19} {'loss': 0.6382, 'learning_rate': 1.9795681028785987e-05, 'epoch': 0.19} {'loss': 0.4596, 'learning_rate': 1.979561345387263e-05, 'epoch': 0.19} {'loss': 0.6468, 'learning_rate': 1.979554586790188e-05, 'epoch': 0.19} {'loss': 0.6055, 'learning_rate': 1.979547827087383e-05, 'epoch': 0.19} {'loss': 0.5762, 'learning_rate': 1.9795410662788544e-05, 'epoch': 0.19} {'loss': 0.6072, 'learning_rate': 1.97953430436461e-05, 'epoch': 0.19} {'loss': 0.6563, 'learning_rate': 1.9795275413446578e-05, 'epoch': 0.19} {'loss': 0.5601, 'learning_rate': 1.9795207772190053e-05, 'epoch': 0.19} {'loss': 0.6325, 'learning_rate': 1.9795140119876605e-05, 'epoch': 0.19} {'loss': 0.6455, 'learning_rate': 1.9795072456506303e-05, 'epoch': 0.19} {'loss': 0.506, 'learning_rate': 1.9795004782079226e-05, 'epoch': 0.19} {'loss': 0.5317, 'learning_rate': 1.979493709659545e-05, 'epoch': 0.19} {'loss': 0.553, 'learning_rate': 1.9794869400055055e-05, 'epoch': 0.19} {'loss': 0.5348, 'learning_rate': 1.9794801692458113e-05, 'epoch': 0.19} {'loss': 0.5126, 'learning_rate': 1.9794733973804705e-05, 'epoch': 0.19} {'loss': 0.6647, 'learning_rate': 1.9794666244094904e-05, 'epoch': 0.19} {'loss': 0.662, 'learning_rate': 1.9794598503328786e-05, 'epoch': 0.19} {'loss': 0.5844, 'learning_rate': 1.9794530751506432e-05, 'epoch': 0.19} {'loss': 0.5732, 'learning_rate': 1.9794462988627912e-05, 'epoch': 0.19} {'loss': 0.5228, 'learning_rate': 1.979439521469331e-05, 'epoch': 0.19} {'loss': 0.7265, 'learning_rate': 1.9794327429702692e-05, 'epoch': 0.19} {'loss': 0.5337, 'learning_rate': 1.9794259633656145e-05, 'epoch': 0.19} {'loss': 0.6287, 'learning_rate': 1.979419182655374e-05, 'epoch': 0.19} {'loss': 0.4883, 'learning_rate': 1.9794124008395553e-05, 'epoch': 0.19} {'loss': 0.3877, 'learning_rate': 1.979405617918167e-05, 'epoch': 0.19} {'loss': 0.6188, 'learning_rate': 1.979398833891215e-05, 'epoch': 0.19} {'loss': 0.5736, 'learning_rate': 1.9793920487587088e-05, 'epoch': 0.19} {'loss': 0.476, 'learning_rate': 1.9793852625206547e-05, 'epoch': 0.19} {'loss': 0.5218, 'learning_rate': 1.979378475177061e-05, 'epoch': 0.19} {'loss': 0.6919, 'learning_rate': 1.9793716867279353e-05, 'epoch': 0.19} {'loss': 0.516, 'learning_rate': 1.979364897173285e-05, 'epoch': 0.19} {'loss': 0.6214, 'learning_rate': 1.9793581065131183e-05, 'epoch': 0.19} {'loss': 0.5774, 'learning_rate': 1.9793513147474425e-05, 'epoch': 0.19} {'loss': 0.4086, 'learning_rate': 1.979344521876265e-05, 'epoch': 0.19} {'loss': 0.4574, 'learning_rate': 1.979337727899594e-05, 'epoch': 0.19} {'loss': 0.5683, 'learning_rate': 1.9793309328174367e-05, 'epoch': 0.19} {'loss': 0.6018, 'learning_rate': 1.9793241366298013e-05, 'epoch': 0.19} {'loss': 0.6597, 'learning_rate': 1.979317339336695e-05, 'epoch': 0.19} {'loss': 0.4502, 'learning_rate': 1.9793105409381258e-05, 'epoch': 0.19} {'loss': 0.4974, 'learning_rate': 1.9793037414341013e-05, 'epoch': 0.19} {'loss': 0.461, 'learning_rate': 1.9792969408246286e-05, 'epoch': 0.19} {'loss': 0.554, 'learning_rate': 1.9792901391097163e-05, 'epoch': 0.19} {'loss': 0.4648, 'learning_rate': 1.9792833362893717e-05, 'epoch': 0.19} {'loss': 0.4458, 'learning_rate': 1.9792765323636024e-05, 'epoch': 0.19} {'loss': 0.5348, 'learning_rate': 1.979269727332416e-05, 'epoch': 0.19} {'loss': 0.4572, 'learning_rate': 1.97926292119582e-05, 'epoch': 0.19} {'loss': 0.4283, 'learning_rate': 1.979256113953823e-05, 'epoch': 0.19} {'loss': 0.5477, 'learning_rate': 1.9792493056064316e-05, 'epoch': 0.19} {'loss': 0.4653, 'learning_rate': 1.979242496153654e-05, 'epoch': 0.19} {'loss': 0.4831, 'learning_rate': 1.979235685595498e-05, 'epoch': 0.19} {'loss': 0.5504, 'learning_rate': 1.979228873931971e-05, 'epoch': 0.19} {'loss': 0.4566, 'learning_rate': 1.9792220611630807e-05, 'epoch': 0.19} {'loss': 0.4666, 'learning_rate': 1.979215247288835e-05, 'epoch': 0.19} {'loss': 0.6826, 'learning_rate': 1.9792084323092416e-05, 'epoch': 0.19} {'loss': 0.5647, 'learning_rate': 1.979201616224308e-05, 'epoch': 0.19} {'loss': 0.5336, 'learning_rate': 1.979194799034042e-05, 'epoch': 0.19} {'loss': 0.5071, 'learning_rate': 1.9791879807384513e-05, 'epoch': 0.19} {'loss': 0.5828, 'learning_rate': 1.9791811613375435e-05, 'epoch': 0.19} {'loss': 0.5286, 'learning_rate': 1.9791743408313265e-05, 'epoch': 0.19} {'loss': 0.5894, 'learning_rate': 1.9791675192198078e-05, 'epoch': 0.19} {'loss': 0.5668, 'learning_rate': 1.979160696502995e-05, 'epoch': 0.19} {'loss': 0.5244, 'learning_rate': 1.9791538726808962e-05, 'epoch': 0.19} {'loss': 0.3898, 'learning_rate': 1.979147047753519e-05, 'epoch': 0.19} {'loss': 0.6754, 'learning_rate': 1.9791402217208705e-05, 'epoch': 0.19} {'loss': 0.549, 'learning_rate': 1.9791333945829595e-05, 'epoch': 0.19} {'loss': 0.6127, 'learning_rate': 1.9791265663397924e-05, 'epoch': 0.19} {'loss': 0.7365, 'learning_rate': 1.9791197369913782e-05, 'epoch': 0.19} {'loss': 0.5341, 'learning_rate': 1.9791129065377235e-05, 'epoch': 0.19} {'loss': 0.4329, 'learning_rate': 1.979106074978837e-05, 'epoch': 0.19} {'loss': 0.6152, 'learning_rate': 1.9790992423147254e-05, 'epoch': 0.19} {'loss': 0.5126, 'learning_rate': 1.9790924085453972e-05, 'epoch': 0.19} {'loss': 0.5776, 'learning_rate': 1.9790855736708597e-05, 'epoch': 0.19} {'loss': 0.6068, 'learning_rate': 1.979078737691121e-05, 'epoch': 0.19} {'loss': 0.4508, 'learning_rate': 1.9790719006061888e-05, 'epoch': 0.19} {'loss': 0.5285, 'learning_rate': 1.97906506241607e-05, 'epoch': 0.19} {'loss': 0.5278, 'learning_rate': 1.9790582231207737e-05, 'epoch': 0.19} {'loss': 0.7118, 'learning_rate': 1.979051382720306e-05, 'epoch': 0.19} {'loss': 0.6798, 'learning_rate': 1.979044541214676e-05, 'epoch': 0.19} {'loss': 0.5472, 'learning_rate': 1.9790376986038908e-05, 'epoch': 0.19} {'loss': 0.4441, 'learning_rate': 1.9790308548879584e-05, 'epoch': 0.19} {'loss': 0.4525, 'learning_rate': 1.979024010066886e-05, 'epoch': 0.19} {'loss': 0.5164, 'learning_rate': 1.9790171641406815e-05, 'epoch': 0.19} {'loss': 0.686, 'learning_rate': 1.9790103171093534e-05, 'epoch': 0.19} {'loss': 0.5962, 'learning_rate': 1.979003468972908e-05, 'epoch': 0.19} {'loss': 0.419, 'learning_rate': 1.9789966197313546e-05, 'epoch': 0.19} {'loss': 0.6779, 'learning_rate': 1.9789897693847e-05, 'epoch': 0.19} {'loss': 0.4415, 'learning_rate': 1.9789829179329517e-05, 'epoch': 0.19} {'loss': 0.6292, 'learning_rate': 1.9789760653761183e-05, 'epoch': 0.19} {'loss': 0.6323, 'learning_rate': 1.978969211714207e-05, 'epoch': 0.19} {'loss': 0.5839, 'learning_rate': 1.9789623569472255e-05, 'epoch': 0.19} {'loss': 0.5057, 'learning_rate': 1.9789555010751817e-05, 'epoch': 0.19} {'loss': 0.5978, 'learning_rate': 1.9789486440980835e-05, 'epoch': 0.19} {'loss': 0.5389, 'learning_rate': 1.978941786015938e-05, 'epoch': 0.19} {'loss': 0.5275, 'learning_rate': 1.9789349268287536e-05, 'epoch': 0.19} {'loss': 0.6492, 'learning_rate': 1.978928066536538e-05, 'epoch': 0.19} {'loss': 0.5757, 'learning_rate': 1.978921205139299e-05, 'epoch': 0.19} {'loss': 0.7297, 'learning_rate': 1.9789143426370434e-05, 'epoch': 0.19} {'loss': 0.6435, 'learning_rate': 1.97890747902978e-05, 'epoch': 0.19} {'loss': 0.5566, 'learning_rate': 1.978900614317516e-05, 'epoch': 0.19} {'loss': 0.6729, 'learning_rate': 1.9788937485002596e-05, 'epoch': 0.19} {'loss': 0.5951, 'learning_rate': 1.9788868815780185e-05, 'epoch': 0.19} {'loss': 0.7172, 'learning_rate': 1.9788800135507998e-05, 'epoch': 0.19} {'loss': 0.7687, 'learning_rate': 1.978873144418612e-05, 'epoch': 0.19} {'loss': 0.5786, 'learning_rate': 1.9788662741814625e-05, 'epoch': 0.19} {'loss': 0.5893, 'learning_rate': 1.9788594028393587e-05, 'epoch': 0.19} {'loss': 0.6721, 'learning_rate': 1.9788525303923093e-05, 'epoch': 0.19} {'loss': 0.4757, 'learning_rate': 1.9788456568403216e-05, 'epoch': 0.19} {'loss': 0.6567, 'learning_rate': 1.978838782183403e-05, 'epoch': 0.19} {'loss': 0.411, 'learning_rate': 1.9788319064215614e-05, 'epoch': 0.19} {'loss': 0.4634, 'learning_rate': 1.9788250295548052e-05, 'epoch': 0.19} {'loss': 0.662, 'learning_rate': 1.9788181515831412e-05, 'epoch': 0.19} {'loss': 0.7249, 'learning_rate': 1.978811272506578e-05, 'epoch': 0.19} {'loss': 0.72, 'learning_rate': 1.9788043923251227e-05, 'epoch': 0.19} {'loss': 0.6428, 'learning_rate': 1.9787975110387837e-05, 'epoch': 0.19} {'loss': 0.5172, 'learning_rate': 1.978790628647568e-05, 'epoch': 0.19} {'loss': 0.4388, 'learning_rate': 1.978783745151484e-05, 'epoch': 0.19} {'loss': 0.5281, 'learning_rate': 1.97877686055054e-05, 'epoch': 0.19} {'loss': 0.5354, 'learning_rate': 1.978769974844742e-05, 'epoch': 0.19} {'loss': 0.7099, 'learning_rate': 1.9787630880340992e-05, 'epoch': 0.19} {'loss': 0.5555, 'learning_rate': 1.9787562001186188e-05, 'epoch': 0.19} {'loss': 0.6697, 'learning_rate': 1.9787493110983092e-05, 'epoch': 0.19} {'loss': 0.5309, 'learning_rate': 1.9787424209731773e-05, 'epoch': 0.19} {'loss': 0.577, 'learning_rate': 1.9787355297432316e-05, 'epoch': 0.19} {'loss': 0.5775, 'learning_rate': 1.9787286374084797e-05, 'epoch': 0.19} {'loss': 0.5525, 'learning_rate': 1.978721743968929e-05, 'epoch': 0.19} {'loss': 0.5428, 'learning_rate': 1.9787148494245876e-05, 'epoch': 0.19} {'loss': 0.7988, 'learning_rate': 1.9787079537754633e-05, 'epoch': 0.19} {'loss': 0.5203, 'learning_rate': 1.978701057021564e-05, 'epoch': 0.19} {'loss': 0.5088, 'learning_rate': 1.9786941591628974e-05, 'epoch': 0.19} {'loss': 0.6766, 'learning_rate': 1.978687260199471e-05, 'epoch': 0.19} {'loss': 0.6301, 'learning_rate': 1.9786803601312924e-05, 'epoch': 0.19} {'loss': 0.599, 'learning_rate': 1.97867345895837e-05, 'epoch': 0.19} {'loss': 0.504, 'learning_rate': 1.978666556680712e-05, 'epoch': 0.19} {'loss': 0.3928, 'learning_rate': 1.9786596532983248e-05, 'epoch': 0.19} {'loss': 0.4275, 'learning_rate': 1.9786527488112173e-05, 'epoch': 0.19} {'loss': 0.6456, 'learning_rate': 1.978645843219397e-05, 'epoch': 0.19} {'loss': 0.3728, 'learning_rate': 1.9786389365228712e-05, 'epoch': 0.19} {'loss': 0.5519, 'learning_rate': 1.9786320287216484e-05, 'epoch': 0.19} {'loss': 0.4979, 'learning_rate': 1.978625119815736e-05, 'epoch': 0.19} {'loss': 0.4011, 'learning_rate': 1.9786182098051424e-05, 'epoch': 0.19} {'loss': 0.4667, 'learning_rate': 1.9786112986898747e-05, 'epoch': 0.19} {'loss': 0.502, 'learning_rate': 1.978604386469941e-05, 'epoch': 0.19} {'loss': 0.5549, 'learning_rate': 1.978597473145349e-05, 'epoch': 0.19} {'loss': 0.4443, 'learning_rate': 1.9785905587161064e-05, 'epoch': 0.19} {'loss': 0.7994, 'learning_rate': 1.9785836431822212e-05, 'epoch': 0.19} {'loss': 0.6027, 'learning_rate': 1.978576726543701e-05, 'epoch': 0.19} {'loss': 0.5884, 'learning_rate': 1.978569808800554e-05, 'epoch': 0.19} {'loss': 0.5204, 'learning_rate': 1.9785628899527878e-05, 'epoch': 0.19} {'loss': 0.5866, 'learning_rate': 1.97855597000041e-05, 'epoch': 0.19} {'loss': 0.527, 'learning_rate': 1.9785490489434287e-05, 'epoch': 0.19} {'loss': 0.6206, 'learning_rate': 1.9785421267818516e-05, 'epoch': 0.19} {'loss': 0.7231, 'learning_rate': 1.9785352035156866e-05, 'epoch': 0.19} {'loss': 0.4503, 'learning_rate': 1.978528279144941e-05, 'epoch': 0.19} {'loss': 0.7711, 'learning_rate': 1.9785213536696234e-05, 'epoch': 0.19} {'loss': 0.5612, 'learning_rate': 1.9785144270897415e-05, 'epoch': 0.19} {'loss': 0.4734, 'learning_rate': 1.9785074994053025e-05, 'epoch': 0.19} {'loss': 0.7337, 'learning_rate': 1.9785005706163147e-05, 'epoch': 0.19} {'loss': 0.6601, 'learning_rate': 1.978493640722786e-05, 'epoch': 0.19} {'loss': 0.6652, 'learning_rate': 1.9784867097247237e-05, 'epoch': 0.19} {'loss': 0.4818, 'learning_rate': 1.978479777622136e-05, 'epoch': 0.19} {'loss': 0.6185, 'learning_rate': 1.978472844415031e-05, 'epoch': 0.19} {'loss': 0.6042, 'learning_rate': 1.9784659101034163e-05, 'epoch': 0.19} {'loss': 0.5304, 'learning_rate': 1.9784589746872992e-05, 'epoch': 0.19} {'loss': 0.6678, 'learning_rate': 1.9784520381666884e-05, 'epoch': 0.19} {'loss': 0.5549, 'learning_rate': 1.978445100541591e-05, 'epoch': 0.19} {'loss': 0.6012, 'learning_rate': 1.9784381618120153e-05, 'epoch': 0.19} {'loss': 0.7921, 'learning_rate': 1.9784312219779692e-05, 'epoch': 0.19} {'loss': 0.6513, 'learning_rate': 1.97842428103946e-05, 'epoch': 0.19} {'loss': 0.6292, 'learning_rate': 1.978417338996496e-05, 'epoch': 0.19} {'loss': 0.5287, 'learning_rate': 1.9784103958490846e-05, 'epoch': 0.19} {'loss': 0.4555, 'learning_rate': 1.978403451597234e-05, 'epoch': 0.19} {'loss': 0.5889, 'learning_rate': 1.978396506240952e-05, 'epoch': 0.19} {'loss': 0.6303, 'learning_rate': 1.9783895597802466e-05, 'epoch': 0.19} {'loss': 0.701, 'learning_rate': 1.978382612215125e-05, 'epoch': 0.19} {'loss': 0.4491, 'learning_rate': 1.978375663545596e-05, 'epoch': 0.19} {'loss': 0.4897, 'learning_rate': 1.9783687137716664e-05, 'epoch': 0.19} {'loss': 0.4217, 'learning_rate': 1.978361762893345e-05, 'epoch': 0.19} {'loss': 0.5625, 'learning_rate': 1.978354810910639e-05, 'epoch': 0.19} {'loss': 0.3957, 'learning_rate': 1.9783478578235567e-05, 'epoch': 0.19} {'loss': 0.4861, 'learning_rate': 1.9783409036321056e-05, 'epoch': 0.19} {'loss': 0.624, 'learning_rate': 1.9783339483362933e-05, 'epoch': 0.19} {'loss': 0.5953, 'learning_rate': 1.9783269919361286e-05, 'epoch': 0.19} {'loss': 0.4783, 'learning_rate': 1.9783200344316183e-05, 'epoch': 0.19} {'loss': 0.4188, 'learning_rate': 1.9783130758227708e-05, 'epoch': 0.19} {'loss': 0.5838, 'learning_rate': 1.978306116109594e-05, 'epoch': 0.19} {'loss': 0.4503, 'learning_rate': 1.9782991552920955e-05, 'epoch': 0.19} {'loss': 0.6093, 'learning_rate': 1.9782921933702836e-05, 'epoch': 0.19} {'loss': 0.5005, 'learning_rate': 1.9782852303441654e-05, 'epoch': 0.19} {'loss': 0.4384, 'learning_rate': 1.9782782662137497e-05, 'epoch': 0.19} {'loss': 0.5473, 'learning_rate': 1.9782713009790435e-05, 'epoch': 0.19} {'loss': 0.5969, 'learning_rate': 1.978264334640055e-05, 'epoch': 0.19} {'loss': 0.5999, 'learning_rate': 1.9782573671967922e-05, 'epoch': 0.19} {'loss': 0.5627, 'learning_rate': 1.978250398649263e-05, 'epoch': 0.19} {'loss': 0.6629, 'learning_rate': 1.978243428997475e-05, 'epoch': 0.19} {'loss': 0.4976, 'learning_rate': 1.978236458241436e-05, 'epoch': 0.19} {'loss': 0.7124, 'learning_rate': 1.9782294863811544e-05, 'epoch': 0.19} {'loss': 0.4083, 'learning_rate': 1.9782225134166377e-05, 'epoch': 0.19} {'loss': 0.5911, 'learning_rate': 1.9782155393478936e-05, 'epoch': 0.19} {'loss': 0.6361, 'learning_rate': 1.97820856417493e-05, 'epoch': 0.19} {'loss': 0.4767, 'learning_rate': 1.9782015878977554e-05, 'epoch': 0.19} {'loss': 0.6004, 'learning_rate': 1.978194610516377e-05, 'epoch': 0.19} {'loss': 0.4795, 'learning_rate': 1.9781876320308025e-05, 'epoch': 0.19} {'loss': 0.6609, 'learning_rate': 1.978180652441041e-05, 'epoch': 0.19} {'loss': 0.5934, 'learning_rate': 1.978173671747099e-05, 'epoch': 0.19} {'loss': 0.4888, 'learning_rate': 1.978166689948985e-05, 'epoch': 0.19} {'loss': 0.4579, 'learning_rate': 1.978159707046707e-05, 'epoch': 0.19} {'loss': 0.6192, 'learning_rate': 1.9781527230402724e-05, 'epoch': 0.19} {'loss': 0.6391, 'learning_rate': 1.9781457379296894e-05, 'epoch': 0.19} {'loss': 0.677, 'learning_rate': 1.9781387517149665e-05, 'epoch': 0.19} {'loss': 0.6883, 'learning_rate': 1.97813176439611e-05, 'epoch': 0.19} {'loss': 0.4827, 'learning_rate': 1.9781247759731296e-05, 'epoch': 0.19} {'loss': 0.5778, 'learning_rate': 1.9781177864460318e-05, 'epoch': 0.19} {'loss': 0.6198, 'learning_rate': 1.9781107958148252e-05, 'epoch': 0.19} {'loss': 0.5089, 'learning_rate': 1.9781038040795173e-05, 'epoch': 0.19} {'loss': 0.5478, 'learning_rate': 1.9780968112401165e-05, 'epoch': 0.19} {'loss': 0.8106, 'learning_rate': 1.9780898172966303e-05, 'epoch': 0.19} {'loss': 0.4603, 'learning_rate': 1.9780828222490665e-05, 'epoch': 0.19} {'loss': 0.6709, 'learning_rate': 1.9780758260974335e-05, 'epoch': 0.19} {'loss': 0.4959, 'learning_rate': 1.9780688288417384e-05, 'epoch': 0.19} {'loss': 0.5955, 'learning_rate': 1.9780618304819898e-05, 'epoch': 0.19} {'loss': 0.4099, 'learning_rate': 1.9780548310181957e-05, 'epoch': 0.19} {'loss': 0.6463, 'learning_rate': 1.9780478304503633e-05, 'epoch': 0.19} {'loss': 0.6302, 'learning_rate': 1.978040828778501e-05, 'epoch': 0.19} {'loss': 0.6501, 'learning_rate': 1.9780338260026167e-05, 'epoch': 0.19} {'loss': 0.4705, 'learning_rate': 1.978026822122718e-05, 'epoch': 0.19} {'loss': 0.7445, 'learning_rate': 1.9780198171388134e-05, 'epoch': 0.19} {'loss': 0.6667, 'learning_rate': 1.97801281105091e-05, 'epoch': 0.19} {'loss': 0.5289, 'learning_rate': 1.9780058038590163e-05, 'epoch': 0.19} {'loss': 0.5135, 'learning_rate': 1.97799879556314e-05, 'epoch': 0.19} {'loss': 0.5838, 'learning_rate': 1.9779917861632888e-05, 'epoch': 0.19} {'loss': 0.427, 'learning_rate': 1.9779847756594713e-05, 'epoch': 0.19} {'loss': 0.5108, 'learning_rate': 1.9779777640516947e-05, 'epoch': 0.19} {'loss': 0.6487, 'learning_rate': 1.977970751339967e-05, 'epoch': 0.19} {'loss': 0.6508, 'learning_rate': 1.9779637375242962e-05, 'epoch': 0.19} {'loss': 0.631, 'learning_rate': 1.9779567226046906e-05, 'epoch': 0.19} {'loss': 0.5825, 'learning_rate': 1.9779497065811578e-05, 'epoch': 0.19} {'loss': 0.5037, 'learning_rate': 1.977942689453706e-05, 'epoch': 0.19} {'loss': 0.5862, 'learning_rate': 1.9779356712223424e-05, 'epoch': 0.19} {'loss': 0.4529, 'learning_rate': 1.9779286518870758e-05, 'epoch': 0.19} {'loss': 0.6609, 'learning_rate': 1.9779216314479134e-05, 'epoch': 0.19} {'loss': 0.5686, 'learning_rate': 1.9779146099048635e-05, 'epoch': 0.19} {'loss': 0.6712, 'learning_rate': 1.9779075872579342e-05, 'epoch': 0.19} {'loss': 0.5985, 'learning_rate': 1.977900563507133e-05, 'epoch': 0.19} {'loss': 0.5315, 'learning_rate': 1.9778935386524682e-05, 'epoch': 0.19} {'loss': 0.6402, 'learning_rate': 1.9778865126939473e-05, 'epoch': 0.19} {'loss': 0.574, 'learning_rate': 1.9778794856315783e-05, 'epoch': 0.19} {'loss': 0.5468, 'learning_rate': 1.9778724574653697e-05, 'epoch': 0.19} {'loss': 0.6767, 'learning_rate': 1.977865428195329e-05, 'epoch': 0.19} {'loss': 0.5613, 'learning_rate': 1.977858397821464e-05, 'epoch': 0.19} {'loss': 0.5029, 'learning_rate': 1.9778513663437827e-05, 'epoch': 0.19} {'loss': 0.481, 'learning_rate': 1.9778443337622936e-05, 'epoch': 0.19} {'loss': 0.6363, 'learning_rate': 1.977837300077004e-05, 'epoch': 0.19} {'loss': 0.5594, 'learning_rate': 1.977830265287922e-05, 'epoch': 0.19} {'loss': 0.5503, 'learning_rate': 1.9778232293950554e-05, 'epoch': 0.19} {'loss': 0.463, 'learning_rate': 1.977816192398413e-05, 'epoch': 0.19} {'loss': 0.4568, 'learning_rate': 1.977809154298001e-05, 'epoch': 0.19} {'loss': 0.5724, 'learning_rate': 1.977802115093829e-05, 'epoch': 0.19} {'loss': 0.6112, 'learning_rate': 1.9777950747859043e-05, 'epoch': 0.19} {'loss': 0.5069, 'learning_rate': 1.977788033374235e-05, 'epoch': 0.19} {'loss': 0.5743, 'learning_rate': 1.977780990858829e-05, 'epoch': 0.19} {'loss': 0.7117, 'learning_rate': 1.977773947239694e-05, 'epoch': 0.19} {'loss': 0.4255, 'learning_rate': 1.977766902516838e-05, 'epoch': 0.19} {'loss': 0.5065, 'learning_rate': 1.9777598566902695e-05, 'epoch': 0.19} {'loss': 0.4467, 'learning_rate': 1.9777528097599956e-05, 'epoch': 0.19} {'loss': 0.5445, 'learning_rate': 1.977745761726025e-05, 'epoch': 0.19} {'loss': 0.3827, 'learning_rate': 1.9777387125883654e-05, 'epoch': 0.19} {'loss': 0.4809, 'learning_rate': 1.9777316623470244e-05, 'epoch': 0.19} {'loss': 0.3959, 'learning_rate': 1.9777246110020107e-05, 'epoch': 0.19} {'loss': 0.4276, 'learning_rate': 1.9777175585533313e-05, 'epoch': 0.19} {'loss': 0.5295, 'learning_rate': 1.977710505000995e-05, 'epoch': 0.19} {'loss': 0.4708, 'learning_rate': 1.97770345034501e-05, 'epoch': 0.19} {'loss': 0.5139, 'learning_rate': 1.977696394585383e-05, 'epoch': 0.19} {'loss': 0.6403, 'learning_rate': 1.977689337722123e-05, 'epoch': 0.19} {'loss': 0.5418, 'learning_rate': 1.9776822797552376e-05, 'epoch': 0.19} {'loss': 0.451, 'learning_rate': 1.977675220684735e-05, 'epoch': 0.19} {'loss': 0.6612, 'learning_rate': 1.9776681605106224e-05, 'epoch': 0.19} {'loss': 0.5112, 'learning_rate': 1.9776610992329086e-05, 'epoch': 0.19} {'loss': 0.703, 'learning_rate': 1.9776540368516018e-05, 'epoch': 0.19} {'loss': 0.5856, 'learning_rate': 1.977646973366709e-05, 'epoch': 0.19} {'loss': 0.6715, 'learning_rate': 1.9776399087782388e-05, 'epoch': 0.19} {'loss': 0.5144, 'learning_rate': 1.977632843086199e-05, 'epoch': 0.19} {'loss': 0.6708, 'learning_rate': 1.977625776290598e-05, 'epoch': 0.19} {'loss': 0.5774, 'learning_rate': 1.977618708391443e-05, 'epoch': 0.19} {'loss': 0.6503, 'learning_rate': 1.9776116393887423e-05, 'epoch': 0.19} {'loss': 0.6559, 'learning_rate': 1.9776045692825044e-05, 'epoch': 0.19} {'loss': 0.749, 'learning_rate': 1.9775974980727364e-05, 'epoch': 0.19} {'loss': 0.5376, 'learning_rate': 1.977590425759447e-05, 'epoch': 0.19} {'loss': 0.4666, 'learning_rate': 1.9775833523426437e-05, 'epoch': 0.19} {'loss': 0.6057, 'learning_rate': 1.977576277822335e-05, 'epoch': 0.19} {'loss': 0.627, 'learning_rate': 1.977569202198528e-05, 'epoch': 0.19} {'loss': 0.5007, 'learning_rate': 1.977562125471232e-05, 'epoch': 0.19} {'loss': 0.507, 'learning_rate': 1.9775550476404537e-05, 'epoch': 0.19} {'loss': 0.5548, 'learning_rate': 1.977547968706202e-05, 'epoch': 0.19} {'loss': 0.565, 'learning_rate': 1.9775408886684842e-05, 'epoch': 0.19} {'loss': 0.581, 'learning_rate': 1.9775338075273088e-05, 'epoch': 0.19} {'loss': 0.6352, 'learning_rate': 1.9775267252826836e-05, 'epoch': 0.19} {'loss': 0.632, 'learning_rate': 1.9775196419346167e-05, 'epoch': 0.19} {'loss': 0.5811, 'learning_rate': 1.977512557483116e-05, 'epoch': 0.19} {'loss': 0.5093, 'learning_rate': 1.9775054719281894e-05, 'epoch': 0.19} {'loss': 0.5866, 'learning_rate': 1.9774983852698452e-05, 'epoch': 0.19} {'loss': 0.4867, 'learning_rate': 1.977491297508091e-05, 'epoch': 0.19} {'loss': 0.6195, 'learning_rate': 1.9774842086429352e-05, 'epoch': 0.19} {'loss': 0.39, 'learning_rate': 1.9774771186743853e-05, 'epoch': 0.19} {'loss': 0.4725, 'learning_rate': 1.9774700276024496e-05, 'epoch': 0.19} {'loss': 0.636, 'learning_rate': 1.9774629354271366e-05, 'epoch': 0.19} {'loss': 0.5983, 'learning_rate': 1.9774558421484534e-05, 'epoch': 0.19} {'loss': 0.5078, 'learning_rate': 1.9774487477664084e-05, 'epoch': 0.19} {'loss': 0.625, 'learning_rate': 1.97744165228101e-05, 'epoch': 0.19} {'loss': 0.5407, 'learning_rate': 1.9774345556922653e-05, 'epoch': 0.19} {'loss': 0.5096, 'learning_rate': 1.9774274580001833e-05, 'epoch': 0.19} {'loss': 0.5414, 'learning_rate': 1.9774203592047715e-05, 'epoch': 0.19} {'loss': 0.4887, 'learning_rate': 1.977413259306038e-05, 'epoch': 0.19} {'loss': 0.522, 'learning_rate': 1.9774061583039907e-05, 'epoch': 0.19} {'loss': 0.4929, 'learning_rate': 1.9773990561986377e-05, 'epoch': 0.19} {'loss': 0.6273, 'learning_rate': 1.977391952989987e-05, 'epoch': 0.19} {'loss': 0.4961, 'learning_rate': 1.9773848486780468e-05, 'epoch': 0.19} {'loss': 0.5966, 'learning_rate': 1.977377743262825e-05, 'epoch': 0.19} {'loss': 0.4908, 'learning_rate': 1.9773706367443292e-05, 'epoch': 0.19} {'loss': 0.5418, 'learning_rate': 1.977363529122568e-05, 'epoch': 0.19} {'loss': 0.4961, 'learning_rate': 1.9773564203975493e-05, 'epoch': 0.19} {'loss': 0.5205, 'learning_rate': 1.977349310569281e-05, 'epoch': 0.19} {'loss': 0.5726, 'learning_rate': 1.977342199637771e-05, 'epoch': 0.19} {'loss': 0.6346, 'learning_rate': 1.977335087603028e-05, 'epoch': 0.19} {'loss': 0.6315, 'learning_rate': 1.9773279744650593e-05, 'epoch': 0.19} {'loss': 0.4663, 'learning_rate': 1.977320860223873e-05, 'epoch': 0.19} {'loss': 0.6996, 'learning_rate': 1.9773137448794776e-05, 'epoch': 0.19} {'loss': 0.601, 'learning_rate': 1.9773066284318805e-05, 'epoch': 0.19} {'loss': 0.5661, 'learning_rate': 1.97729951088109e-05, 'epoch': 0.19} {'loss': 0.5367, 'learning_rate': 1.9772923922271145e-05, 'epoch': 0.19} {'loss': 0.5172, 'learning_rate': 1.9772852724699615e-05, 'epoch': 0.19} {'loss': 0.6452, 'learning_rate': 1.977278151609639e-05, 'epoch': 0.19} {'loss': 0.4243, 'learning_rate': 1.977271029646156e-05, 'epoch': 0.19} {'loss': 0.4991, 'learning_rate': 1.97726390657952e-05, 'epoch': 0.19} {'loss': 0.5215, 'learning_rate': 1.9772567824097383e-05, 'epoch': 0.19} {'loss': 0.548, 'learning_rate': 1.9772496571368195e-05, 'epoch': 0.19} {'loss': 0.578, 'learning_rate': 1.977242530760772e-05, 'epoch': 0.19} {'loss': 0.496, 'learning_rate': 1.9772354032816033e-05, 'epoch': 0.19} {'loss': 0.6363, 'learning_rate': 1.9772282746993214e-05, 'epoch': 0.19} {'loss': 0.5591, 'learning_rate': 1.977221145013935e-05, 'epoch': 0.19} {'loss': 0.5589, 'learning_rate': 1.9772140142254517e-05, 'epoch': 0.19} {'loss': 0.5581, 'learning_rate': 1.9772068823338795e-05, 'epoch': 0.19} {'loss': 0.5679, 'learning_rate': 1.9771997493392265e-05, 'epoch': 0.19} {'loss': 0.5776, 'learning_rate': 1.977192615241501e-05, 'epoch': 0.19} {'loss': 0.6298, 'learning_rate': 1.9771854800407108e-05, 'epoch': 0.19} {'loss': 0.4412, 'learning_rate': 1.977178343736864e-05, 'epoch': 0.19} {'loss': 0.7035, 'learning_rate': 1.9771712063299686e-05, 'epoch': 0.19} {'loss': 0.6993, 'learning_rate': 1.977164067820033e-05, 'epoch': 0.19} {'loss': 0.705, 'learning_rate': 1.9771569282070646e-05, 'epoch': 0.19} {'loss': 0.7004, 'learning_rate': 1.977149787491072e-05, 'epoch': 0.19} {'loss': 0.6714, 'learning_rate': 1.977142645672063e-05, 'epoch': 0.19} {'loss': 0.5412, 'learning_rate': 1.9771355027500458e-05, 'epoch': 0.19} {'loss': 0.6265, 'learning_rate': 1.9771283587250285e-05, 'epoch': 0.19} {'loss': 0.5337, 'learning_rate': 1.9771212135970192e-05, 'epoch': 0.19} {'loss': 0.5046, 'learning_rate': 1.9771140673660255e-05, 'epoch': 0.19} {'loss': 0.5823, 'learning_rate': 1.9771069200320564e-05, 'epoch': 0.19} {'loss': 0.4981, 'learning_rate': 1.977099771595119e-05, 'epoch': 0.19} {'loss': 0.5205, 'learning_rate': 1.977092622055222e-05, 'epoch': 0.19} {'loss': 0.5363, 'learning_rate': 1.9770854714123732e-05, 'epoch': 0.19} {'loss': 0.567, 'learning_rate': 1.97707831966658e-05, 'epoch': 0.19} {'loss': 0.4509, 'learning_rate': 1.9770711668178522e-05, 'epoch': 0.19} {'loss': 0.5693, 'learning_rate': 1.9770640128661963e-05, 'epoch': 0.19} {'loss': 0.4783, 'learning_rate': 1.9770568578116208e-05, 'epoch': 0.19} {'loss': 0.4762, 'learning_rate': 1.9770497016541342e-05, 'epoch': 0.19} {'loss': 0.6635, 'learning_rate': 1.9770425443937443e-05, 'epoch': 0.19} {'loss': 0.3759, 'learning_rate': 1.9770353860304593e-05, 'epoch': 0.19} {'loss': 0.5968, 'learning_rate': 1.9770282265642865e-05, 'epoch': 0.19} {'loss': 0.4086, 'learning_rate': 1.977021065995235e-05, 'epoch': 0.19} {'loss': 0.4974, 'learning_rate': 1.9770139043233126e-05, 'epoch': 0.19} {'loss': 0.5299, 'learning_rate': 1.9770067415485275e-05, 'epoch': 0.19} {'loss': 0.5593, 'learning_rate': 1.976999577670887e-05, 'epoch': 0.19} {'loss': 0.498, 'learning_rate': 1.9769924126904002e-05, 'epoch': 0.19} {'loss': 0.5685, 'learning_rate': 1.9769852466070745e-05, 'epoch': 0.19} {'loss': 0.6574, 'learning_rate': 1.9769780794209185e-05, 'epoch': 0.19} {'loss': 0.4272, 'learning_rate': 1.97697091113194e-05, 'epoch': 0.19} {'loss': 0.4918, 'learning_rate': 1.9769637417401467e-05, 'epoch': 0.19} {'loss': 0.8046, 'learning_rate': 1.9769565712455477e-05, 'epoch': 0.19} {'loss': 0.4823, 'learning_rate': 1.97694939964815e-05, 'epoch': 0.19} {'loss': 0.5052, 'learning_rate': 1.9769422269479627e-05, 'epoch': 0.19} {'loss': 0.5791, 'learning_rate': 1.9769350531449932e-05, 'epoch': 0.19} {'loss': 0.5414, 'learning_rate': 1.9769278782392492e-05, 'epoch': 0.19} {'loss': 0.6459, 'learning_rate': 1.97692070223074e-05, 'epoch': 0.19} {'loss': 0.4975, 'learning_rate': 1.976913525119473e-05, 'epoch': 0.19} {'loss': 0.5811, 'learning_rate': 1.9769063469054566e-05, 'epoch': 0.19} {'loss': 0.5411, 'learning_rate': 1.9768991675886984e-05, 'epoch': 0.2} {'loss': 0.4047, 'learning_rate': 1.976891987169207e-05, 'epoch': 0.2} {'loss': 0.5614, 'learning_rate': 1.9768848056469902e-05, 'epoch': 0.2} {'loss': 0.5079, 'learning_rate': 1.9768776230220564e-05, 'epoch': 0.2} {'loss': 0.5294, 'learning_rate': 1.9768704392944134e-05, 'epoch': 0.2} {'loss': 0.4753, 'learning_rate': 1.9768632544640694e-05, 'epoch': 0.2} {'loss': 0.6381, 'learning_rate': 1.9768560685310325e-05, 'epoch': 0.2} {'loss': 0.5229, 'learning_rate': 1.9768488814953112e-05, 'epoch': 0.2} {'loss': 0.4833, 'learning_rate': 1.976841693356913e-05, 'epoch': 0.2} {'loss': 0.5655, 'learning_rate': 1.9768345041158457e-05, 'epoch': 0.2} {'loss': 0.4252, 'learning_rate': 1.976827313772119e-05, 'epoch': 0.2} {'loss': 0.5996, 'learning_rate': 1.9768201223257394e-05, 'epoch': 0.2} {'loss': 0.5831, 'learning_rate': 1.976812929776716e-05, 'epoch': 0.2} {'loss': 0.4771, 'learning_rate': 1.9768057361250564e-05, 'epoch': 0.2} {'loss': 0.5251, 'learning_rate': 1.9767985413707687e-05, 'epoch': 0.2} {'loss': 0.5112, 'learning_rate': 1.9767913455138612e-05, 'epoch': 0.2} {'loss': 0.6157, 'learning_rate': 1.9767841485543422e-05, 'epoch': 0.2} {'loss': 0.6583, 'learning_rate': 1.9767769504922197e-05, 'epoch': 0.2} {'loss': 0.5145, 'learning_rate': 1.9767697513275016e-05, 'epoch': 0.2} {'loss': 0.5171, 'learning_rate': 1.9767625510601962e-05, 'epoch': 0.2} {'loss': 0.6437, 'learning_rate': 1.976755349690312e-05, 'epoch': 0.2} {'loss': 0.422, 'learning_rate': 1.976748147217856e-05, 'epoch': 0.2} {'loss': 0.6254, 'learning_rate': 1.9767409436428377e-05, 'epoch': 0.2} {'loss': 0.668, 'learning_rate': 1.9767337389652643e-05, 'epoch': 0.2} {'loss': 0.559, 'learning_rate': 1.9767265331851443e-05, 'epoch': 0.2} {'loss': 0.5469, 'learning_rate': 1.976719326302486e-05, 'epoch': 0.2} {'loss': 0.6099, 'learning_rate': 1.976712118317297e-05, 'epoch': 0.2} {'loss': 0.5736, 'learning_rate': 1.9767049092295857e-05, 'epoch': 0.2} {'loss': 0.4539, 'learning_rate': 1.9766976990393606e-05, 'epoch': 0.2} {'loss': 0.4544, 'learning_rate': 1.9766904877466295e-05, 'epoch': 0.2} {'loss': 0.4384, 'learning_rate': 1.9766832753514004e-05, 'epoch': 0.2} {'loss': 0.6508, 'learning_rate': 1.9766760618536817e-05, 'epoch': 0.2} {'loss': 0.4732, 'learning_rate': 1.9766688472534815e-05, 'epoch': 0.2} {'loss': 0.5136, 'learning_rate': 1.976661631550808e-05, 'epoch': 0.2} {'loss': 0.38, 'learning_rate': 1.9766544147456688e-05, 'epoch': 0.2} {'loss': 0.6472, 'learning_rate': 1.9766471968380726e-05, 'epoch': 0.2} {'loss': 0.5659, 'learning_rate': 1.9766399778280277e-05, 'epoch': 0.2} {'loss': 0.4792, 'learning_rate': 1.976632757715542e-05, 'epoch': 0.2} {'loss': 0.4249, 'learning_rate': 1.9766255365006234e-05, 'epoch': 0.2} {'loss': 0.4338, 'learning_rate': 1.97661831418328e-05, 'epoch': 0.2} {'loss': 0.5335, 'learning_rate': 1.976611090763521e-05, 'epoch': 0.2} {'loss': 0.6735, 'learning_rate': 1.9766038662413535e-05, 'epoch': 0.2} {'loss': 0.5291, 'learning_rate': 1.9765966406167857e-05, 'epoch': 0.2} {'loss': 0.4536, 'learning_rate': 1.9765894138898262e-05, 'epoch': 0.2} {'loss': 0.6068, 'learning_rate': 1.9765821860604828e-05, 'epoch': 0.2} {'loss': 0.6235, 'learning_rate': 1.976574957128764e-05, 'epoch': 0.2} {'loss': 0.5842, 'learning_rate': 1.9765677270946778e-05, 'epoch': 0.2} {'loss': 0.5934, 'learning_rate': 1.976560495958232e-05, 'epoch': 0.2} {'loss': 0.4962, 'learning_rate': 1.9765532637194355e-05, 'epoch': 0.2} {'loss': 0.462, 'learning_rate': 1.976546030378296e-05, 'epoch': 0.2} {'loss': 0.5688, 'learning_rate': 1.9765387959348215e-05, 'epoch': 0.2} {'loss': 0.5773, 'learning_rate': 1.97653156038902e-05, 'epoch': 0.2} {'loss': 0.6838, 'learning_rate': 1.976524323740901e-05, 'epoch': 0.2} {'loss': 0.6872, 'learning_rate': 1.9765170859904714e-05, 'epoch': 0.2} {'loss': 0.5858, 'learning_rate': 1.9765098471377395e-05, 'epoch': 0.2} {'loss': 0.3928, 'learning_rate': 1.976502607182714e-05, 'epoch': 0.2} {'loss': 0.5812, 'learning_rate': 1.9764953661254023e-05, 'epoch': 0.2} {'loss': 0.5715, 'learning_rate': 1.9764881239658132e-05, 'epoch': 0.2} {'loss': 0.6607, 'learning_rate': 1.9764808807039547e-05, 'epoch': 0.2} {'loss': 0.5993, 'learning_rate': 1.976473636339835e-05, 'epoch': 0.2} {'loss': 0.5195, 'learning_rate': 1.9764663908734625e-05, 'epoch': 0.2} {'loss': 0.5941, 'learning_rate': 1.976459144304845e-05, 'epoch': 0.2} {'loss': 0.4421, 'learning_rate': 1.9764518966339906e-05, 'epoch': 0.2} {'loss': 0.4974, 'learning_rate': 1.9764446478609078e-05, 'epoch': 0.2} {'loss': 0.583, 'learning_rate': 1.9764373979856048e-05, 'epoch': 0.2} {'loss': 0.4527, 'learning_rate': 1.9764301470080896e-05, 'epoch': 0.2} {'loss': 0.5021, 'learning_rate': 1.97642289492837e-05, 'epoch': 0.2} {'loss': 0.443, 'learning_rate': 1.976415641746455e-05, 'epoch': 0.2} {'loss': 0.4914, 'learning_rate': 1.9764083874623527e-05, 'epoch': 0.2} {'loss': 0.6412, 'learning_rate': 1.9764011320760707e-05, 'epoch': 0.2} {'loss': 0.6141, 'learning_rate': 1.9763938755876176e-05, 'epoch': 0.2} {'loss': 0.5594, 'learning_rate': 1.976386617997001e-05, 'epoch': 0.2} {'loss': 0.6235, 'learning_rate': 1.97637935930423e-05, 'epoch': 0.2} {'loss': 0.5829, 'learning_rate': 1.9763720995093124e-05, 'epoch': 0.2} {'loss': 0.4633, 'learning_rate': 1.9763648386122564e-05, 'epoch': 0.2} {'loss': 0.62, 'learning_rate': 1.97635757661307e-05, 'epoch': 0.2} {'loss': 0.6319, 'learning_rate': 1.9763503135117618e-05, 'epoch': 0.2} {'loss': 0.533, 'learning_rate': 1.9763430493083398e-05, 'epoch': 0.2} {'loss': 0.3755, 'learning_rate': 1.976335784002812e-05, 'epoch': 0.2} {'loss': 0.5736, 'learning_rate': 1.9763285175951864e-05, 'epoch': 0.2} {'loss': 0.5313, 'learning_rate': 1.976321250085472e-05, 'epoch': 0.2} {'loss': 0.5913, 'learning_rate': 1.9763139814736764e-05, 'epoch': 0.2} {'loss': 0.5477, 'learning_rate': 1.9763067117598077e-05, 'epoch': 0.2} {'loss': 0.5709, 'learning_rate': 1.976299440943875e-05, 'epoch': 0.2} {'loss': 0.5573, 'learning_rate': 1.9762921690258852e-05, 'epoch': 0.2} {'loss': 0.4706, 'learning_rate': 1.9762848960058477e-05, 'epoch': 0.2} {'loss': 0.6159, 'learning_rate': 1.9762776218837702e-05, 'epoch': 0.2} {'loss': 0.4389, 'learning_rate': 1.9762703466596608e-05, 'epoch': 0.2} {'loss': 0.5936, 'learning_rate': 1.976263070333528e-05, 'epoch': 0.2} {'loss': 0.5879, 'learning_rate': 1.9762557929053796e-05, 'epoch': 0.2} {'loss': 0.5639, 'learning_rate': 1.976248514375224e-05, 'epoch': 0.2} {'loss': 0.5731, 'learning_rate': 1.9762412347430694e-05, 'epoch': 0.2} {'loss': 0.6674, 'learning_rate': 1.9762339540089243e-05, 'epoch': 0.2} {'loss': 0.484, 'learning_rate': 1.9762266721727968e-05, 'epoch': 0.2} {'loss': 0.4964, 'learning_rate': 1.976219389234695e-05, 'epoch': 0.2} {'loss': 0.4858, 'learning_rate': 1.9762121051946267e-05, 'epoch': 0.2} {'loss': 0.5883, 'learning_rate': 1.976204820052601e-05, 'epoch': 0.2} {'loss': 0.5456, 'learning_rate': 1.9761975338086255e-05, 'epoch': 0.2} {'loss': 0.7127, 'learning_rate': 1.9761902464627086e-05, 'epoch': 0.2} {'loss': 0.6039, 'learning_rate': 1.9761829580148587e-05, 'epoch': 0.2} {'loss': 0.7056, 'learning_rate': 1.976175668465084e-05, 'epoch': 0.2} {'loss': 0.6694, 'learning_rate': 1.9761683778133923e-05, 'epoch': 0.2} {'loss': 0.7262, 'learning_rate': 1.976161086059792e-05, 'epoch': 0.2} {'loss': 0.5802, 'learning_rate': 1.9761537932042917e-05, 'epoch': 0.2} {'loss': 0.5883, 'learning_rate': 1.9761464992468994e-05, 'epoch': 0.2} {'loss': 0.5737, 'learning_rate': 1.9761392041876233e-05, 'epoch': 0.2} {'loss': 0.6779, 'learning_rate': 1.976131908026472e-05, 'epoch': 0.2} {'loss': 0.5384, 'learning_rate': 1.976124610763453e-05, 'epoch': 0.2} {'loss': 0.5499, 'learning_rate': 1.9761173123985748e-05, 'epoch': 0.2} {'loss': 0.5768, 'learning_rate': 1.976110012931846e-05, 'epoch': 0.2} {'loss': 0.5445, 'learning_rate': 1.976102712363275e-05, 'epoch': 0.2} {'loss': 0.4313, 'learning_rate': 1.9760954106928687e-05, 'epoch': 0.2} {'loss': 0.5705, 'learning_rate': 1.976088107920637e-05, 'epoch': 0.2} {'loss': 0.6814, 'learning_rate': 1.976080804046587e-05, 'epoch': 0.2} {'loss': 0.5758, 'learning_rate': 1.976073499070728e-05, 'epoch': 0.2} {'loss': 0.5742, 'learning_rate': 1.976066192993067e-05, 'epoch': 0.2} {'loss': 0.4962, 'learning_rate': 1.9760588858136135e-05, 'epoch': 0.2} {'loss': 0.6534, 'learning_rate': 1.9760515775323744e-05, 'epoch': 0.2} {'loss': 0.5556, 'learning_rate': 1.976044268149359e-05, 'epoch': 0.2} {'loss': 0.605, 'learning_rate': 1.9760369576645756e-05, 'epoch': 0.2} {'loss': 0.6741, 'learning_rate': 1.9760296460780316e-05, 'epoch': 0.2} {'loss': 0.6207, 'learning_rate': 1.976022333389736e-05, 'epoch': 0.2} {'loss': 0.5214, 'learning_rate': 1.9760150195996967e-05, 'epoch': 0.2} {'loss': 0.5084, 'learning_rate': 1.976007704707922e-05, 'epoch': 0.2} {'loss': 0.4644, 'learning_rate': 1.97600038871442e-05, 'epoch': 0.2} {'loss': 0.4213, 'learning_rate': 1.9759930716191994e-05, 'epoch': 0.2} {'loss': 0.4718, 'learning_rate': 1.9759857534222683e-05, 'epoch': 0.2} {'loss': 0.7088, 'learning_rate': 1.9759784341236347e-05, 'epoch': 0.2} {'loss': 0.5105, 'learning_rate': 1.975971113723307e-05, 'epoch': 0.2} {'loss': 0.5895, 'learning_rate': 1.9759637922212936e-05, 'epoch': 0.2} {'loss': 0.7003, 'learning_rate': 1.9759564696176028e-05, 'epoch': 0.2} {'loss': 0.5384, 'learning_rate': 1.9759491459122423e-05, 'epoch': 0.2} {'loss': 0.5773, 'learning_rate': 1.9759418211052216e-05, 'epoch': 0.2} {'loss': 0.5752, 'learning_rate': 1.9759344951965475e-05, 'epoch': 0.2} {'loss': 0.496, 'learning_rate': 1.975927168186229e-05, 'epoch': 0.2} {'loss': 0.7623, 'learning_rate': 1.9759198400742746e-05, 'epoch': 0.2} {'loss': 0.4781, 'learning_rate': 1.9759125108606917e-05, 'epoch': 0.2} {'loss': 0.5088, 'learning_rate': 1.97590518054549e-05, 'epoch': 0.2} {'loss': 0.8094, 'learning_rate': 1.975897849128676e-05, 'epoch': 0.2} {'loss': 0.5012, 'learning_rate': 1.9758905166102597e-05, 'epoch': 0.2} {'loss': 0.547, 'learning_rate': 1.975883182990248e-05, 'epoch': 0.2} {'loss': 0.6122, 'learning_rate': 1.97587584826865e-05, 'epoch': 0.2} {'loss': 0.5191, 'learning_rate': 1.975868512445474e-05, 'epoch': 0.2} {'loss': 0.6628, 'learning_rate': 1.9758611755207275e-05, 'epoch': 0.2} {'loss': 0.5724, 'learning_rate': 1.9758538374944197e-05, 'epoch': 0.2} {'loss': 0.439, 'learning_rate': 1.9758464983665584e-05, 'epoch': 0.2} {'loss': 0.4602, 'learning_rate': 1.9758391581371518e-05, 'epoch': 0.2} {'loss': 0.6352, 'learning_rate': 1.9758318168062087e-05, 'epoch': 0.2} {'loss': 0.6094, 'learning_rate': 1.9758244743737368e-05, 'epoch': 0.2} {'loss': 0.6054, 'learning_rate': 1.9758171308397446e-05, 'epoch': 0.2} {'loss': 0.7655, 'learning_rate': 1.9758097862042403e-05, 'epoch': 0.2} {'loss': 0.6527, 'learning_rate': 1.9758024404672323e-05, 'epoch': 0.2} {'loss': 0.5303, 'learning_rate': 1.9757950936287292e-05, 'epoch': 0.2} {'loss': 0.4865, 'learning_rate': 1.975787745688739e-05, 'epoch': 0.2} {'loss': 0.5533, 'learning_rate': 1.9757803966472698e-05, 'epoch': 0.2} {'loss': 0.5833, 'learning_rate': 1.97577304650433e-05, 'epoch': 0.2} {'loss': 0.6062, 'learning_rate': 1.9757656952599285e-05, 'epoch': 0.2} {'loss': 0.607, 'learning_rate': 1.9757583429140727e-05, 'epoch': 0.2} {'loss': 0.5837, 'learning_rate': 1.975750989466771e-05, 'epoch': 0.2} {'loss': 0.634, 'learning_rate': 1.9757436349180327e-05, 'epoch': 0.2} {'loss': 0.4989, 'learning_rate': 1.975736279267865e-05, 'epoch': 0.2} {'loss': 0.5752, 'learning_rate': 1.9757289225162765e-05, 'epoch': 0.2} {'loss': 0.5506, 'learning_rate': 1.9757215646632754e-05, 'epoch': 0.2} {'loss': 0.4854, 'learning_rate': 1.9757142057088705e-05, 'epoch': 0.2} {'loss': 0.5748, 'learning_rate': 1.9757068456530698e-05, 'epoch': 0.2} {'loss': 0.5136, 'learning_rate': 1.9756994844958815e-05, 'epoch': 0.2} {'loss': 0.5851, 'learning_rate': 1.975692122237314e-05, 'epoch': 0.2} {'loss': 0.5484, 'learning_rate': 1.9756847588773756e-05, 'epoch': 0.2} {'loss': 0.5259, 'learning_rate': 1.9756773944160748e-05, 'epoch': 0.2} {'loss': 0.6041, 'learning_rate': 1.9756700288534198e-05, 'epoch': 0.2} {'loss': 0.5537, 'learning_rate': 1.975662662189419e-05, 'epoch': 0.2} {'loss': 0.6047, 'learning_rate': 1.97565529442408e-05, 'epoch': 0.2} {'loss': 0.6347, 'learning_rate': 1.9756479255574122e-05, 'epoch': 0.2} {'loss': 0.5889, 'learning_rate': 1.975640555589423e-05, 'epoch': 0.2} {'loss': 0.3988, 'learning_rate': 1.9756331845201215e-05, 'epoch': 0.2} {'loss': 0.6643, 'learning_rate': 1.9756258123495155e-05, 'epoch': 0.2} {'loss': 0.5865, 'learning_rate': 1.9756184390776135e-05, 'epoch': 0.2} {'loss': 0.7019, 'learning_rate': 1.975611064704424e-05, 'epoch': 0.2} {'loss': 0.5264, 'learning_rate': 1.975603689229955e-05, 'epoch': 0.2} {'loss': 0.575, 'learning_rate': 1.975596312654215e-05, 'epoch': 0.2} {'loss': 0.477, 'learning_rate': 1.975588934977212e-05, 'epoch': 0.2} {'loss': 0.5237, 'learning_rate': 1.975581556198955e-05, 'epoch': 0.2} {'loss': 0.5811, 'learning_rate': 1.9755741763194517e-05, 'epoch': 0.2} {'loss': 0.5828, 'learning_rate': 1.9755667953387106e-05, 'epoch': 0.2} {'loss': 0.537, 'learning_rate': 1.9755594132567403e-05, 'epoch': 0.2} {'loss': 0.7202, 'learning_rate': 1.975552030073549e-05, 'epoch': 0.2} {'loss': 0.5142, 'learning_rate': 1.975544645789145e-05, 'epoch': 0.2} {'loss': 0.5323, 'learning_rate': 1.9755372604035364e-05, 'epoch': 0.2} {'loss': 0.7438, 'learning_rate': 1.9755298739167315e-05, 'epoch': 0.2} {'loss': 0.572, 'learning_rate': 1.9755224863287393e-05, 'epoch': 0.2} {'loss': 0.5074, 'learning_rate': 1.9755150976395675e-05, 'epoch': 0.2} {'loss': 0.4772, 'learning_rate': 1.9755077078492246e-05, 'epoch': 0.2} {'loss': 0.4932, 'learning_rate': 1.975500316957719e-05, 'epoch': 0.2} {'loss': 0.6313, 'learning_rate': 1.9754929249650593e-05, 'epoch': 0.2} {'loss': 0.5389, 'learning_rate': 1.9754855318712535e-05, 'epoch': 0.2} {'loss': 0.519, 'learning_rate': 1.97547813767631e-05, 'epoch': 0.2} {'loss': 0.551, 'learning_rate': 1.9754707423802373e-05, 'epoch': 0.2} {'loss': 0.5527, 'learning_rate': 1.9754633459830435e-05, 'epoch': 0.2} {'loss': 0.4924, 'learning_rate': 1.9754559484847368e-05, 'epoch': 0.2} {'loss': 0.4625, 'learning_rate': 1.9754485498853265e-05, 'epoch': 0.2} {'loss': 0.4165, 'learning_rate': 1.97544115018482e-05, 'epoch': 0.2} {'loss': 0.6406, 'learning_rate': 1.9754337493832256e-05, 'epoch': 0.2} {'loss': 0.422, 'learning_rate': 1.9754263474805522e-05, 'epoch': 0.2} {'loss': 0.6879, 'learning_rate': 1.975418944476808e-05, 'epoch': 0.2} {'loss': 0.5256, 'learning_rate': 1.9754115403720008e-05, 'epoch': 0.2} {'loss': 0.692, 'learning_rate': 1.97540413516614e-05, 'epoch': 0.2} {'loss': 0.675, 'learning_rate': 1.9753967288592335e-05, 'epoch': 0.2} {'loss': 0.6031, 'learning_rate': 1.975389321451289e-05, 'epoch': 0.2} {'loss': 0.6835, 'learning_rate': 1.975381912942316e-05, 'epoch': 0.2} {'loss': 0.5346, 'learning_rate': 1.975374503332322e-05, 'epoch': 0.2} {'loss': 0.6177, 'learning_rate': 1.975367092621316e-05, 'epoch': 0.2} {'loss': 0.4403, 'learning_rate': 1.9753596808093056e-05, 'epoch': 0.2} {'loss': 0.5892, 'learning_rate': 1.9753522678963e-05, 'epoch': 0.2} {'loss': 0.5577, 'learning_rate': 1.9753448538823066e-05, 'epoch': 0.2} {'loss': 0.3687, 'learning_rate': 1.9753374387673348e-05, 'epoch': 0.2} {'loss': 0.6476, 'learning_rate': 1.9753300225513926e-05, 'epoch': 0.2} {'loss': 0.4787, 'learning_rate': 1.9753226052344878e-05, 'epoch': 0.2} {'loss': 0.7183, 'learning_rate': 1.9753151868166296e-05, 'epoch': 0.2} {'loss': 0.6007, 'learning_rate': 1.9753077672978257e-05, 'epoch': 0.2} {'loss': 0.762, 'learning_rate': 1.975300346678085e-05, 'epoch': 0.2} {'loss': 0.5341, 'learning_rate': 1.9752929249574156e-05, 'epoch': 0.2} {'loss': 0.5142, 'learning_rate': 1.9752855021358263e-05, 'epoch': 0.2} {'loss': 0.627, 'learning_rate': 1.9752780782133246e-05, 'epoch': 0.2} {'loss': 0.3992, 'learning_rate': 1.9752706531899196e-05, 'epoch': 0.2} {'loss': 0.4662, 'learning_rate': 1.9752632270656197e-05, 'epoch': 0.2} {'loss': 0.5909, 'learning_rate': 1.975255799840433e-05, 'epoch': 0.2} {'loss': 0.7221, 'learning_rate': 1.975248371514368e-05, 'epoch': 0.2} {'loss': 0.6403, 'learning_rate': 1.975240942087433e-05, 'epoch': 0.2} {'loss': 0.5059, 'learning_rate': 1.9752335115596358e-05, 'epoch': 0.2} {'loss': 0.472, 'learning_rate': 1.9752260799309862e-05, 'epoch': 0.2} {'loss': 0.5485, 'learning_rate': 1.9752186472014916e-05, 'epoch': 0.2} {'loss': 0.4872, 'learning_rate': 1.9752112133711604e-05, 'epoch': 0.2} {'loss': 0.6268, 'learning_rate': 1.9752037784400015e-05, 'epoch': 0.2} {'loss': 0.4941, 'learning_rate': 1.975196342408023e-05, 'epoch': 0.2} {'loss': 0.6429, 'learning_rate': 1.9751889052752327e-05, 'epoch': 0.2} {'loss': 0.5453, 'learning_rate': 1.97518146704164e-05, 'epoch': 0.2} {'loss': 0.4689, 'learning_rate': 1.975174027707253e-05, 'epoch': 0.2} {'loss': 0.4895, 'learning_rate': 1.9751665872720797e-05, 'epoch': 0.2} {'loss': 0.6168, 'learning_rate': 1.975159145736129e-05, 'epoch': 0.2} {'loss': 0.5195, 'learning_rate': 1.9751517030994086e-05, 'epoch': 0.2} {'loss': 0.5669, 'learning_rate': 1.975144259361928e-05, 'epoch': 0.2} {'loss': 0.4865, 'learning_rate': 1.9751368145236946e-05, 'epoch': 0.2} {'loss': 0.5352, 'learning_rate': 1.975129368584717e-05, 'epoch': 0.2} {'loss': 0.5554, 'learning_rate': 1.975121921545004e-05, 'epoch': 0.2} {'loss': 0.59, 'learning_rate': 1.975114473404564e-05, 'epoch': 0.2} {'loss': 0.475, 'learning_rate': 1.9751070241634047e-05, 'epoch': 0.2} {'loss': 0.5191, 'learning_rate': 1.975099573821535e-05, 'epoch': 0.2} {'loss': 0.5473, 'learning_rate': 1.9750921223789637e-05, 'epoch': 0.2} {'loss': 0.6377, 'learning_rate': 1.9750846698356984e-05, 'epoch': 0.2} {'loss': 0.5609, 'learning_rate': 1.9750772161917484e-05, 'epoch': 0.2} {'loss': 0.6138, 'learning_rate': 1.9750697614471214e-05, 'epoch': 0.2} {'loss': 0.6664, 'learning_rate': 1.975062305601826e-05, 'epoch': 0.2} {'loss': 0.5336, 'learning_rate': 1.9750548486558708e-05, 'epoch': 0.2} {'loss': 0.6649, 'learning_rate': 1.9750473906092637e-05, 'epoch': 0.2} {'loss': 0.5814, 'learning_rate': 1.975039931462014e-05, 'epoch': 0.2} {'loss': 0.4494, 'learning_rate': 1.9750324712141292e-05, 'epoch': 0.2} {'loss': 0.5294, 'learning_rate': 1.9750250098656187e-05, 'epoch': 0.2} {'loss': 0.5369, 'learning_rate': 1.97501754741649e-05, 'epoch': 0.2} {'loss': 0.6218, 'learning_rate': 1.975010083866752e-05, 'epoch': 0.2} {'loss': 0.5542, 'learning_rate': 1.9750026192164132e-05, 'epoch': 0.2} {'loss': 0.612, 'learning_rate': 1.9749951534654818e-05, 'epoch': 0.2} {'loss': 0.4708, 'learning_rate': 1.974987686613966e-05, 'epoch': 0.2} {'loss': 0.5587, 'learning_rate': 1.9749802186618743e-05, 'epoch': 0.2} {'loss': 0.6662, 'learning_rate': 1.974972749609216e-05, 'epoch': 0.2} {'loss': 0.6408, 'learning_rate': 1.9749652794559985e-05, 'epoch': 0.2} {'loss': 0.5647, 'learning_rate': 1.9749578082022305e-05, 'epoch': 0.2} {'loss': 0.6185, 'learning_rate': 1.9749503358479206e-05, 'epoch': 0.2} {'loss': 0.4981, 'learning_rate': 1.9749428623930772e-05, 'epoch': 0.2} {'loss': 0.6005, 'learning_rate': 1.974935387837709e-05, 'epoch': 0.2} {'loss': 0.6168, 'learning_rate': 1.9749279121818235e-05, 'epoch': 0.2} {'loss': 0.5924, 'learning_rate': 1.9749204354254306e-05, 'epoch': 0.2} {'loss': 0.5193, 'learning_rate': 1.9749129575685373e-05, 'epoch': 0.2} {'loss': 0.6522, 'learning_rate': 1.9749054786111527e-05, 'epoch': 0.2} {'loss': 0.685, 'learning_rate': 1.9748979985532856e-05, 'epoch': 0.2} {'loss': 0.5592, 'learning_rate': 1.9748905173949437e-05, 'epoch': 0.2} {'loss': 0.535, 'learning_rate': 1.9748830351361357e-05, 'epoch': 0.2} {'loss': 0.6328, 'learning_rate': 1.9748755517768706e-05, 'epoch': 0.2} {'loss': 0.434, 'learning_rate': 1.974868067317156e-05, 'epoch': 0.2} {'loss': 0.5112, 'learning_rate': 1.9748605817570007e-05, 'epoch': 0.2} {'loss': 0.591, 'learning_rate': 1.974853095096413e-05, 'epoch': 0.2} {'loss': 0.62, 'learning_rate': 1.974845607335402e-05, 'epoch': 0.2} {'loss': 0.568, 'learning_rate': 1.9748381184739756e-05, 'epoch': 0.2} {'loss': 0.5659, 'learning_rate': 1.9748306285121422e-05, 'epoch': 0.2} {'loss': 0.7125, 'learning_rate': 1.9748231374499104e-05, 'epoch': 0.2} {'loss': 0.5523, 'learning_rate': 1.974815645287289e-05, 'epoch': 0.2} {'loss': 0.6679, 'learning_rate': 1.9748081520242855e-05, 'epoch': 0.2} {'loss': 0.6641, 'learning_rate': 1.9748006576609094e-05, 'epoch': 0.2} {'loss': 0.4925, 'learning_rate': 1.9747931621971685e-05, 'epoch': 0.2} {'loss': 0.6017, 'learning_rate': 1.9747856656330717e-05, 'epoch': 0.2} {'loss': 0.5897, 'learning_rate': 1.974778167968627e-05, 'epoch': 0.2} {'loss': 0.5242, 'learning_rate': 1.9747706692038434e-05, 'epoch': 0.2} {'loss': 0.6412, 'learning_rate': 1.9747631693387288e-05, 'epoch': 0.2} {'loss': 0.5224, 'learning_rate': 1.974755668373292e-05, 'epoch': 0.2} {'loss': 0.5062, 'learning_rate': 1.9747481663075418e-05, 'epoch': 0.2} {'loss': 0.6754, 'learning_rate': 1.9747406631414856e-05, 'epoch': 0.2} {'loss': 0.5148, 'learning_rate': 1.974733158875133e-05, 'epoch': 0.2} {'loss': 0.5194, 'learning_rate': 1.974725653508492e-05, 'epoch': 0.2} {'loss': 0.5045, 'learning_rate': 1.974718147041571e-05, 'epoch': 0.2} {'loss': 0.5616, 'learning_rate': 1.9747106394743783e-05, 'epoch': 0.2} {'loss': 0.5439, 'learning_rate': 1.974703130806923e-05, 'epoch': 0.2} {'loss': 0.5684, 'learning_rate': 1.974695621039213e-05, 'epoch': 0.2} {'loss': 0.5811, 'learning_rate': 1.974688110171257e-05, 'epoch': 0.2} {'loss': 0.5082, 'learning_rate': 1.974680598203064e-05, 'epoch': 0.2} {'loss': 0.6177, 'learning_rate': 1.9746730851346412e-05, 'epoch': 0.2} {'loss': 0.7795, 'learning_rate': 1.974665570965998e-05, 'epoch': 0.2} {'loss': 0.4627, 'learning_rate': 1.974658055697143e-05, 'epoch': 0.2} {'loss': 0.675, 'learning_rate': 1.974650539328084e-05, 'epoch': 0.2} {'loss': 0.6327, 'learning_rate': 1.9746430218588304e-05, 'epoch': 0.2} {'loss': 0.5118, 'learning_rate': 1.97463550328939e-05, 'epoch': 0.2} {'loss': 0.5518, 'learning_rate': 1.9746279836197712e-05, 'epoch': 0.2} {'loss': 0.4986, 'learning_rate': 1.974620462849983e-05, 'epoch': 0.2} {'loss': 0.546, 'learning_rate': 1.9746129409800333e-05, 'epoch': 0.2} {'loss': 0.6714, 'learning_rate': 1.974605418009931e-05, 'epoch': 0.2} {'loss': 0.4749, 'learning_rate': 1.974597893939685e-05, 'epoch': 0.2} {'loss': 0.4829, 'learning_rate': 1.9745903687693028e-05, 'epoch': 0.2} {'loss': 0.564, 'learning_rate': 1.9745828424987936e-05, 'epoch': 0.2} {'loss': 0.647, 'learning_rate': 1.9745753151281658e-05, 'epoch': 0.2} {'loss': 0.5895, 'learning_rate': 1.9745677866574275e-05, 'epoch': 0.2} {'loss': 0.584, 'learning_rate': 1.9745602570865876e-05, 'epoch': 0.2} {'loss': 0.5205, 'learning_rate': 1.9745527264156545e-05, 'epoch': 0.2} {'loss': 0.6076, 'learning_rate': 1.974545194644637e-05, 'epoch': 0.2} {'loss': 0.5052, 'learning_rate': 1.974537661773543e-05, 'epoch': 0.2} {'loss': 0.5486, 'learning_rate': 1.974530127802381e-05, 'epoch': 0.2} {'loss': 0.4986, 'learning_rate': 1.9745225927311603e-05, 'epoch': 0.2} {'loss': 0.5575, 'learning_rate': 1.9745150565598887e-05, 'epoch': 0.2} {'loss': 0.5264, 'learning_rate': 1.974507519288575e-05, 'epoch': 0.2} {'loss': 0.5851, 'learning_rate': 1.9744999809172274e-05, 'epoch': 0.2} {'loss': 0.5639, 'learning_rate': 1.9744924414458548e-05, 'epoch': 0.2} {'loss': 0.6023, 'learning_rate': 1.9744849008744658e-05, 'epoch': 0.2} {'loss': 0.6339, 'learning_rate': 1.974477359203068e-05, 'epoch': 0.2} {'loss': 0.6611, 'learning_rate': 1.974469816431671e-05, 'epoch': 0.2} {'loss': 0.6589, 'learning_rate': 1.974462272560283e-05, 'epoch': 0.2} {'loss': 0.4539, 'learning_rate': 1.974454727588912e-05, 'epoch': 0.2} {'loss': 0.6235, 'learning_rate': 1.9744471815175673e-05, 'epoch': 0.2} {'loss': 0.6862, 'learning_rate': 1.974439634346257e-05, 'epoch': 0.2} {'loss': 0.7067, 'learning_rate': 1.974432086074989e-05, 'epoch': 0.2} {'loss': 0.5803, 'learning_rate': 1.9744245367037736e-05, 'epoch': 0.2} {'loss': 0.5384, 'learning_rate': 1.9744169862326173e-05, 'epoch': 0.2} {'loss': 0.6061, 'learning_rate': 1.9744094346615297e-05, 'epoch': 0.2} {'loss': 0.5675, 'learning_rate': 1.9744018819905194e-05, 'epoch': 0.2} {'loss': 0.4494, 'learning_rate': 1.9743943282195945e-05, 'epoch': 0.2} {'loss': 0.568, 'learning_rate': 1.9743867733487637e-05, 'epoch': 0.2} {'loss': 0.48, 'learning_rate': 1.9743792173780356e-05, 'epoch': 0.2} {'loss': 0.4673, 'learning_rate': 1.9743716603074186e-05, 'epoch': 0.2} {'loss': 0.6506, 'learning_rate': 1.9743641021369212e-05, 'epoch': 0.2} {'loss': 0.5381, 'learning_rate': 1.9743565428665522e-05, 'epoch': 0.2} {'loss': 0.5696, 'learning_rate': 1.9743489824963197e-05, 'epoch': 0.2} {'loss': 0.4884, 'learning_rate': 1.9743414210262325e-05, 'epoch': 0.2} {'loss': 0.4362, 'learning_rate': 1.9743338584562992e-05, 'epoch': 0.2} {'loss': 0.5781, 'learning_rate': 1.974326294786528e-05, 'epoch': 0.2} {'loss': 0.4781, 'learning_rate': 1.974318730016928e-05, 'epoch': 0.2} {'loss': 0.4913, 'learning_rate': 1.9743111641475077e-05, 'epoch': 0.2} {'loss': 0.455, 'learning_rate': 1.974303597178275e-05, 'epoch': 0.2} {'loss': 0.5425, 'learning_rate': 1.974296029109239e-05, 'epoch': 0.2} {'loss': 0.573, 'learning_rate': 1.9742884599404078e-05, 'epoch': 0.2} {'loss': 0.6034, 'learning_rate': 1.9742808896717903e-05, 'epoch': 0.2} {'loss': 0.6578, 'learning_rate': 1.974273318303395e-05, 'epoch': 0.2} {'loss': 0.3849, 'learning_rate': 1.9742657458352305e-05, 'epoch': 0.2} {'loss': 0.5287, 'learning_rate': 1.9742581722673048e-05, 'epoch': 0.2} {'loss': 0.5048, 'learning_rate': 1.9742505975996275e-05, 'epoch': 0.2} {'loss': 0.5659, 'learning_rate': 1.974243021832206e-05, 'epoch': 0.2} {'loss': 0.5905, 'learning_rate': 1.9742354449650496e-05, 'epoch': 0.2} {'loss': 0.4489, 'learning_rate': 1.9742278669981667e-05, 'epoch': 0.2} {'loss': 0.7034, 'learning_rate': 1.9742202879315657e-05, 'epoch': 0.2} {'loss': 0.6494, 'learning_rate': 1.974212707765255e-05, 'epoch': 0.2} {'loss': 0.4039, 'learning_rate': 1.974205126499244e-05, 'epoch': 0.2} {'loss': 0.5537, 'learning_rate': 1.9741975441335404e-05, 'epoch': 0.2} {'loss': 0.5122, 'learning_rate': 1.9741899606681526e-05, 'epoch': 0.2} {'loss': 0.5243, 'learning_rate': 1.97418237610309e-05, 'epoch': 0.2} {'loss': 0.5255, 'learning_rate': 1.9741747904383606e-05, 'epoch': 0.2} {'loss': 0.5695, 'learning_rate': 1.9741672036739733e-05, 'epoch': 0.2} {'loss': 0.55, 'learning_rate': 1.9741596158099367e-05, 'epoch': 0.2} {'loss': 0.631, 'learning_rate': 1.974152026846259e-05, 'epoch': 0.2} {'loss': 0.5794, 'learning_rate': 1.9741444367829486e-05, 'epoch': 0.2} {'loss': 0.4691, 'learning_rate': 1.9741368456200144e-05, 'epoch': 0.2} {'loss': 0.5306, 'learning_rate': 1.974129253357465e-05, 'epoch': 0.2} {'loss': 0.6719, 'learning_rate': 1.974121659995309e-05, 'epoch': 0.2} {'loss': 0.4418, 'learning_rate': 1.974114065533555e-05, 'epoch': 0.2} {'loss': 0.5745, 'learning_rate': 1.974106469972211e-05, 'epoch': 0.2} {'loss': 0.6816, 'learning_rate': 1.9740988733112867e-05, 'epoch': 0.2} {'loss': 0.7211, 'learning_rate': 1.9740912755507895e-05, 'epoch': 0.2} {'loss': 0.5926, 'learning_rate': 1.9740836766907287e-05, 'epoch': 0.2} {'loss': 0.4996, 'learning_rate': 1.9740760767311124e-05, 'epoch': 0.2} {'loss': 0.8374, 'learning_rate': 1.9740684756719498e-05, 'epoch': 0.2} {'loss': 0.647, 'learning_rate': 1.974060873513249e-05, 'epoch': 0.2} {'loss': 0.734, 'learning_rate': 1.9740532702550186e-05, 'epoch': 0.2} {'loss': 0.5086, 'learning_rate': 1.9740456658972674e-05, 'epoch': 0.2} {'loss': 0.5379, 'learning_rate': 1.9740380604400034e-05, 'epoch': 0.2} {'loss': 0.5898, 'learning_rate': 1.9740304538832365e-05, 'epoch': 0.2} {'loss': 0.542, 'learning_rate': 1.9740228462269736e-05, 'epoch': 0.2} {'loss': 0.4982, 'learning_rate': 1.9740152374712248e-05, 'epoch': 0.2} {'loss': 0.6616, 'learning_rate': 1.9740076276159977e-05, 'epoch': 0.2} {'loss': 0.4619, 'learning_rate': 1.974000016661301e-05, 'epoch': 0.2} {'loss': 0.5231, 'learning_rate': 1.973992404607144e-05, 'epoch': 0.2} {'loss': 0.5087, 'learning_rate': 1.9739847914535343e-05, 'epoch': 0.2} {'loss': 0.5462, 'learning_rate': 1.9739771772004813e-05, 'epoch': 0.2} {'loss': 0.5842, 'learning_rate': 1.973969561847993e-05, 'epoch': 0.2} {'loss': 0.5202, 'learning_rate': 1.9739619453960784e-05, 'epoch': 0.2} {'loss': 0.6579, 'learning_rate': 1.9739543278447462e-05, 'epoch': 0.2} {'loss': 0.6094, 'learning_rate': 1.973946709194005e-05, 'epoch': 0.2} {'loss': 0.468, 'learning_rate': 1.9739390894438622e-05, 'epoch': 0.2} {'loss': 0.6654, 'learning_rate': 1.9739314685943284e-05, 'epoch': 0.2} {'loss': 0.5125, 'learning_rate': 1.9739238466454105e-05, 'epoch': 0.2} {'loss': 0.6515, 'learning_rate': 1.973916223597118e-05, 'epoch': 0.2} {'loss': 0.5509, 'learning_rate': 1.973908599449459e-05, 'epoch': 0.2} {'loss': 0.6462, 'learning_rate': 1.973900974202443e-05, 'epoch': 0.2} {'loss': 0.4814, 'learning_rate': 1.9738933478560773e-05, 'epoch': 0.2} {'loss': 0.4622, 'learning_rate': 1.9738857204103716e-05, 'epoch': 0.2} {'loss': 0.584, 'learning_rate': 1.973878091865334e-05, 'epoch': 0.2} {'loss': 0.7337, 'learning_rate': 1.9738704622209734e-05, 'epoch': 0.2} {'loss': 0.5326, 'learning_rate': 1.9738628314772982e-05, 'epoch': 0.2} {'loss': 0.6064, 'learning_rate': 1.973855199634317e-05, 'epoch': 0.2} {'loss': 0.499, 'learning_rate': 1.9738475666920386e-05, 'epoch': 0.2} {'loss': 0.5895, 'learning_rate': 1.973839932650471e-05, 'epoch': 0.2} {'loss': 0.5823, 'learning_rate': 1.973832297509624e-05, 'epoch': 0.2} {'loss': 0.4982, 'learning_rate': 1.9738246612695048e-05, 'epoch': 0.2} {'loss': 0.5767, 'learning_rate': 1.9738170239301232e-05, 'epoch': 0.2} {'loss': 0.6905, 'learning_rate': 1.9738093854914874e-05, 'epoch': 0.2} {'loss': 0.399, 'learning_rate': 1.9738017459536055e-05, 'epoch': 0.2} {'loss': 0.4701, 'learning_rate': 1.973794105316487e-05, 'epoch': 0.2} {'loss': 0.3659, 'learning_rate': 1.9737864635801403e-05, 'epoch': 0.2} {'loss': 0.4133, 'learning_rate': 1.9737788207445738e-05, 'epoch': 0.2} {'loss': 0.431, 'learning_rate': 1.9737711768097956e-05, 'epoch': 0.2} {'loss': 0.7625, 'learning_rate': 1.9737635317758154e-05, 'epoch': 0.2} {'loss': 0.5655, 'learning_rate': 1.9737558856426415e-05, 'epoch': 0.2} {'loss': 0.6291, 'learning_rate': 1.973748238410282e-05, 'epoch': 0.2} {'loss': 0.7212, 'learning_rate': 1.973740590078746e-05, 'epoch': 0.2} {'loss': 0.5035, 'learning_rate': 1.973732940648042e-05, 'epoch': 0.2} {'loss': 0.6187, 'learning_rate': 1.973725290118179e-05, 'epoch': 0.2} {'loss': 0.4721, 'learning_rate': 1.9737176384891648e-05, 'epoch': 0.2} {'loss': 0.44, 'learning_rate': 1.973709985761009e-05, 'epoch': 0.2} {'loss': 0.5069, 'learning_rate': 1.9737023319337195e-05, 'epoch': 0.2} {'loss': 0.4471, 'learning_rate': 1.973694677007305e-05, 'epoch': 0.2} {'loss': 0.5917, 'learning_rate': 1.9736870209817747e-05, 'epoch': 0.2} {'loss': 0.4043, 'learning_rate': 1.973679363857137e-05, 'epoch': 0.2} {'loss': 0.5666, 'learning_rate': 1.9736717056334007e-05, 'epoch': 0.2} {'loss': 0.6596, 'learning_rate': 1.9736640463105736e-05, 'epoch': 0.2} {'loss': 0.6218, 'learning_rate': 1.9736563858886654e-05, 'epoch': 0.2} {'loss': 0.3476, 'learning_rate': 1.9736487243676838e-05, 'epoch': 0.2} {'loss': 0.6183, 'learning_rate': 1.9736410617476384e-05, 'epoch': 0.2} {'loss': 0.4529, 'learning_rate': 1.9736333980285368e-05, 'epoch': 0.2} {'loss': 0.613, 'learning_rate': 1.9736257332103887e-05, 'epoch': 0.2} {'loss': 0.6708, 'learning_rate': 1.9736180672932024e-05, 'epoch': 0.2} {'loss': 0.677, 'learning_rate': 1.9736104002769862e-05, 'epoch': 0.2} {'loss': 0.4981, 'learning_rate': 1.973602732161749e-05, 'epoch': 0.2} {'loss': 0.4364, 'learning_rate': 1.9735950629474997e-05, 'epoch': 0.2} {'loss': 0.5309, 'learning_rate': 1.9735873926342463e-05, 'epoch': 0.2} {'loss': 0.6212, 'learning_rate': 1.9735797212219982e-05, 'epoch': 0.2} {'loss': 0.6171, 'learning_rate': 1.9735720487107638e-05, 'epoch': 0.2} {'loss': 0.549, 'learning_rate': 1.9735643751005515e-05, 'epoch': 0.2} {'loss': 0.7031, 'learning_rate': 1.9735567003913703e-05, 'epoch': 0.2} {'loss': 0.6159, 'learning_rate': 1.9735490245832286e-05, 'epoch': 0.2} {'loss': 0.657, 'learning_rate': 1.973541347676135e-05, 'epoch': 0.2} {'loss': 0.6362, 'learning_rate': 1.9735336696700983e-05, 'epoch': 0.2} {'loss': 0.547, 'learning_rate': 1.9735259905651278e-05, 'epoch': 0.2} {'loss': 0.561, 'learning_rate': 1.973518310361231e-05, 'epoch': 0.2} {'loss': 0.5294, 'learning_rate': 1.9735106290584176e-05, 'epoch': 0.2} {'loss': 0.5134, 'learning_rate': 1.9735029466566956e-05, 'epoch': 0.2} {'loss': 0.4624, 'learning_rate': 1.9734952631560737e-05, 'epoch': 0.2} {'loss': 0.6068, 'learning_rate': 1.973487578556561e-05, 'epoch': 0.2} {'loss': 0.5465, 'learning_rate': 1.9734798928581658e-05, 'epoch': 0.2} {'loss': 0.6139, 'learning_rate': 1.973472206060897e-05, 'epoch': 0.2} {'loss': 0.5697, 'learning_rate': 1.973464518164763e-05, 'epoch': 0.2} {'loss': 0.5378, 'learning_rate': 1.9734568291697732e-05, 'epoch': 0.2} {'loss': 0.6802, 'learning_rate': 1.9734491390759352e-05, 'epoch': 0.2} {'loss': 0.5532, 'learning_rate': 1.9734414478832587e-05, 'epoch': 0.2} {'loss': 0.6218, 'learning_rate': 1.9734337555917515e-05, 'epoch': 0.2} {'loss': 0.4822, 'learning_rate': 1.973426062201423e-05, 'epoch': 0.2} {'loss': 0.5268, 'learning_rate': 1.9734183677122812e-05, 'epoch': 0.2} {'loss': 0.5758, 'learning_rate': 1.9734106721243355e-05, 'epoch': 0.2} {'loss': 0.5881, 'learning_rate': 1.9734029754375942e-05, 'epoch': 0.2} {'loss': 0.6232, 'learning_rate': 1.973395277652066e-05, 'epoch': 0.2} {'loss': 0.568, 'learning_rate': 1.9733875787677597e-05, 'epoch': 0.2} {'loss': 0.6192, 'learning_rate': 1.9733798787846837e-05, 'epoch': 0.2} {'loss': 0.402, 'learning_rate': 1.973372177702847e-05, 'epoch': 0.2} {'loss': 0.5938, 'learning_rate': 1.9733644755222586e-05, 'epoch': 0.2} {'loss': 0.4522, 'learning_rate': 1.9733567722429264e-05, 'epoch': 0.2} {'loss': 0.5585, 'learning_rate': 1.9733490678648594e-05, 'epoch': 0.2} {'loss': 0.6061, 'learning_rate': 1.973341362388067e-05, 'epoch': 0.2} {'loss': 0.5001, 'learning_rate': 1.9733336558125565e-05, 'epoch': 0.2} {'loss': 0.5118, 'learning_rate': 1.9733259481383377e-05, 'epoch': 0.2} {'loss': 0.6164, 'learning_rate': 1.9733182393654192e-05, 'epoch': 0.2} {'loss': 0.3937, 'learning_rate': 1.973310529493809e-05, 'epoch': 0.21} {'loss': 0.6142, 'learning_rate': 1.973302818523517e-05, 'epoch': 0.21} {'loss': 0.4243, 'learning_rate': 1.9732951064545508e-05, 'epoch': 0.21} {'loss': 0.4671, 'learning_rate': 1.9732873932869198e-05, 'epoch': 0.21} {'loss': 0.6222, 'learning_rate': 1.9732796790206318e-05, 'epoch': 0.21} {'loss': 0.6783, 'learning_rate': 1.9732719636556966e-05, 'epoch': 0.21} {'loss': 0.5395, 'learning_rate': 1.9732642471921225e-05, 'epoch': 0.21} {'loss': 0.5085, 'learning_rate': 1.9732565296299175e-05, 'epoch': 0.21} {'loss': 0.6235, 'learning_rate': 1.9732488109690914e-05, 'epoch': 0.21} {'loss': 0.6282, 'learning_rate': 1.9732410912096528e-05, 'epoch': 0.21} {'loss': 0.5426, 'learning_rate': 1.9732333703516097e-05, 'epoch': 0.21} {'loss': 0.5717, 'learning_rate': 1.973225648394971e-05, 'epoch': 0.21} {'loss': 0.4444, 'learning_rate': 1.9732179253397458e-05, 'epoch': 0.21} {'loss': 0.4212, 'learning_rate': 1.9732102011859426e-05, 'epoch': 0.21} {'loss': 0.5741, 'learning_rate': 1.9732024759335705e-05, 'epoch': 0.21} {'loss': 0.5544, 'learning_rate': 1.9731947495826374e-05, 'epoch': 0.21} {'loss': 0.6178, 'learning_rate': 1.9731870221331526e-05, 'epoch': 0.21} {'loss': 0.7026, 'learning_rate': 1.9731792935851248e-05, 'epoch': 0.21} {'loss': 0.6033, 'learning_rate': 1.9731715639385626e-05, 'epoch': 0.21} {'loss': 0.6283, 'learning_rate': 1.973163833193475e-05, 'epoch': 0.21} {'loss': 0.6928, 'learning_rate': 1.9731561013498703e-05, 'epoch': 0.21} {'loss': 0.6005, 'learning_rate': 1.9731483684077573e-05, 'epoch': 0.21} {'loss': 0.5043, 'learning_rate': 1.973140634367145e-05, 'epoch': 0.21} {'loss': 0.4344, 'learning_rate': 1.9731328992280417e-05, 'epoch': 0.21} {'loss': 0.5406, 'learning_rate': 1.9731251629904567e-05, 'epoch': 0.21} {'loss': 0.629, 'learning_rate': 1.9731174256543983e-05, 'epoch': 0.21} {'loss': 0.5046, 'learning_rate': 1.9731096872198754e-05, 'epoch': 0.21} {'loss': 0.451, 'learning_rate': 1.9731019476868968e-05, 'epoch': 0.21} {'loss': 0.6853, 'learning_rate': 1.973094207055471e-05, 'epoch': 0.21} {'loss': 0.5427, 'learning_rate': 1.973086465325607e-05, 'epoch': 0.21} {'loss': 0.4878, 'learning_rate': 1.9730787224973135e-05, 'epoch': 0.21} {'loss': 0.6164, 'learning_rate': 1.973070978570599e-05, 'epoch': 0.21} {'loss': 0.6022, 'learning_rate': 1.9730632335454722e-05, 'epoch': 0.21} {'loss': 0.4112, 'learning_rate': 1.9730554874219426e-05, 'epoch': 0.21} {'loss': 0.496, 'learning_rate': 1.9730477402000177e-05, 'epoch': 0.21} {'loss': 0.6438, 'learning_rate': 1.9730399918797076e-05, 'epoch': 0.21} {'loss': 0.5595, 'learning_rate': 1.97303224246102e-05, 'epoch': 0.21} {'loss': 0.4294, 'learning_rate': 1.973024491943964e-05, 'epoch': 0.21} {'loss': 0.5401, 'learning_rate': 1.9730167403285487e-05, 'epoch': 0.21} {'loss': 0.6286, 'learning_rate': 1.9730089876147824e-05, 'epoch': 0.21} {'loss': 0.5202, 'learning_rate': 1.9730012338026738e-05, 'epoch': 0.21} {'loss': 0.6574, 'learning_rate': 1.972993478892232e-05, 'epoch': 0.21} {'loss': 0.6336, 'learning_rate': 1.9729857228834656e-05, 'epoch': 0.21} {'loss': 0.4153, 'learning_rate': 1.9729779657763833e-05, 'epoch': 0.21} {'loss': 0.6206, 'learning_rate': 1.9729702075709937e-05, 'epoch': 0.21} {'loss': 0.5642, 'learning_rate': 1.972962448267306e-05, 'epoch': 0.21} {'loss': 0.739, 'learning_rate': 1.9729546878653284e-05, 'epoch': 0.21} {'loss': 0.6795, 'learning_rate': 1.9729469263650704e-05, 'epoch': 0.21} {'loss': 0.5495, 'learning_rate': 1.97293916376654e-05, 'epoch': 0.21} {'loss': 0.6116, 'learning_rate': 1.9729314000697463e-05, 'epoch': 0.21} {'loss': 0.5904, 'learning_rate': 1.9729236352746982e-05, 'epoch': 0.21} {'loss': 0.5912, 'learning_rate': 1.9729158693814044e-05, 'epoch': 0.21} {'loss': 0.4227, 'learning_rate': 1.9729081023898735e-05, 'epoch': 0.21} {'loss': 0.5704, 'learning_rate': 1.9729003343001145e-05, 'epoch': 0.21} {'loss': 0.6309, 'learning_rate': 1.9728925651121357e-05, 'epoch': 0.21} {'loss': 0.7482, 'learning_rate': 1.9728847948259468e-05, 'epoch': 0.21} {'loss': 0.5834, 'learning_rate': 1.9728770234415553e-05, 'epoch': 0.21} {'loss': 0.7487, 'learning_rate': 1.972869250958971e-05, 'epoch': 0.21} {'loss': 0.5758, 'learning_rate': 1.972861477378202e-05, 'epoch': 0.21} {'loss': 0.566, 'learning_rate': 1.972853702699258e-05, 'epoch': 0.21} {'loss': 0.4956, 'learning_rate': 1.9728459269221464e-05, 'epoch': 0.21} {'loss': 0.6669, 'learning_rate': 1.972838150046877e-05, 'epoch': 0.21} {'loss': 0.6593, 'learning_rate': 1.972830372073459e-05, 'epoch': 0.21} {'loss': 0.482, 'learning_rate': 1.9728225930018995e-05, 'epoch': 0.21} {'loss': 0.568, 'learning_rate': 1.972814812832209e-05, 'epoch': 0.21} {'loss': 0.6861, 'learning_rate': 1.972807031564395e-05, 'epoch': 0.21} {'loss': 0.6112, 'learning_rate': 1.9727992491984674e-05, 'epoch': 0.21} {'loss': 0.5809, 'learning_rate': 1.972791465734434e-05, 'epoch': 0.21} {'loss': 0.6425, 'learning_rate': 1.9727836811723043e-05, 'epoch': 0.21} {'loss': 0.5468, 'learning_rate': 1.972775895512087e-05, 'epoch': 0.21} {'loss': 0.5251, 'learning_rate': 1.97276810875379e-05, 'epoch': 0.21} {'loss': 0.4293, 'learning_rate': 1.972760320897423e-05, 'epoch': 0.21} {'loss': 0.561, 'learning_rate': 1.972752531942995e-05, 'epoch': 0.21} {'loss': 0.5069, 'learning_rate': 1.972744741890514e-05, 'epoch': 0.21} {'loss': 0.7004, 'learning_rate': 1.9727369507399893e-05, 'epoch': 0.21} {'loss': 0.5678, 'learning_rate': 1.9727291584914297e-05, 'epoch': 0.21} {'loss': 0.6773, 'learning_rate': 1.9727213651448437e-05, 'epoch': 0.21} {'loss': 0.5896, 'learning_rate': 1.9727135707002404e-05, 'epoch': 0.21} {'loss': 0.7546, 'learning_rate': 1.9727057751576283e-05, 'epoch': 0.21} {'loss': 0.5964, 'learning_rate': 1.9726979785170162e-05, 'epoch': 0.21} {'loss': 0.392, 'learning_rate': 1.9726901807784133e-05, 'epoch': 0.21} {'loss': 0.4894, 'learning_rate': 1.972682381941828e-05, 'epoch': 0.21} {'loss': 0.5551, 'learning_rate': 1.9726745820072693e-05, 'epoch': 0.21} {'loss': 0.4019, 'learning_rate': 1.972666780974746e-05, 'epoch': 0.21} {'loss': 0.3996, 'learning_rate': 1.9726589788442667e-05, 'epoch': 0.21} {'loss': 0.4494, 'learning_rate': 1.9726511756158406e-05, 'epoch': 0.21} {'loss': 0.5683, 'learning_rate': 1.972643371289476e-05, 'epoch': 0.21} {'loss': 0.5917, 'learning_rate': 1.9726355658651822e-05, 'epoch': 0.21} {'loss': 0.6075, 'learning_rate': 1.972627759342968e-05, 'epoch': 0.21} {'loss': 0.5898, 'learning_rate': 1.9726199517228416e-05, 'epoch': 0.21} {'loss': 0.6688, 'learning_rate': 1.9726121430048122e-05, 'epoch': 0.21} {'loss': 0.5757, 'learning_rate': 1.9726043331888893e-05, 'epoch': 0.21} {'loss': 0.6077, 'learning_rate': 1.9725965222750805e-05, 'epoch': 0.21} {'loss': 0.442, 'learning_rate': 1.9725887102633954e-05, 'epoch': 0.21} {'loss': 0.4601, 'learning_rate': 1.9725808971538424e-05, 'epoch': 0.21} {'loss': 0.5701, 'learning_rate': 1.9725730829464303e-05, 'epoch': 0.21} {'loss': 0.6451, 'learning_rate': 1.9725652676411687e-05, 'epoch': 0.21} {'loss': 0.6137, 'learning_rate': 1.9725574512380657e-05, 'epoch': 0.21} {'loss': 0.6157, 'learning_rate': 1.97254963373713e-05, 'epoch': 0.21} {'loss': 0.6496, 'learning_rate': 1.972541815138371e-05, 'epoch': 0.21} {'loss': 0.6053, 'learning_rate': 1.972533995441797e-05, 'epoch': 0.21} {'loss': 0.6397, 'learning_rate': 1.972526174647417e-05, 'epoch': 0.21} {'loss': 0.4754, 'learning_rate': 1.9725183527552403e-05, 'epoch': 0.21} {'loss': 0.4426, 'learning_rate': 1.972510529765275e-05, 'epoch': 0.21} {'loss': 0.5127, 'learning_rate': 1.9725027056775303e-05, 'epoch': 0.21} {'loss': 0.4996, 'learning_rate': 1.972494880492015e-05, 'epoch': 0.21} {'loss': 0.7064, 'learning_rate': 1.9724870542087377e-05, 'epoch': 0.21} {'loss': 0.4369, 'learning_rate': 1.972479226827708e-05, 'epoch': 0.21} {'loss': 0.6477, 'learning_rate': 1.9724713983489335e-05, 'epoch': 0.21} {'loss': 0.5742, 'learning_rate': 1.9724635687724237e-05, 'epoch': 0.21} {'loss': 0.4711, 'learning_rate': 1.972455738098188e-05, 'epoch': 0.21} {'loss': 0.4295, 'learning_rate': 1.9724479063262346e-05, 'epoch': 0.21} {'loss': 0.5376, 'learning_rate': 1.9724400734565722e-05, 'epoch': 0.21} {'loss': 0.588, 'learning_rate': 1.97243223948921e-05, 'epoch': 0.21} {'loss': 0.5389, 'learning_rate': 1.9724244044241565e-05, 'epoch': 0.21} {'loss': 0.5871, 'learning_rate': 1.972416568261421e-05, 'epoch': 0.21} {'loss': 0.4988, 'learning_rate': 1.972408731001012e-05, 'epoch': 0.21} {'loss': 0.5548, 'learning_rate': 1.9724008926429386e-05, 'epoch': 0.21} {'loss': 0.56, 'learning_rate': 1.9723930531872094e-05, 'epoch': 0.21} {'loss': 0.6296, 'learning_rate': 1.9723852126338333e-05, 'epoch': 0.21} {'loss': 0.6689, 'learning_rate': 1.972377370982819e-05, 'epoch': 0.21} {'loss': 0.4424, 'learning_rate': 1.9723695282341762e-05, 'epoch': 0.21} {'loss': 0.3925, 'learning_rate': 1.9723616843879124e-05, 'epoch': 0.21} {'loss': 0.4678, 'learning_rate': 1.9723538394440376e-05, 'epoch': 0.21} {'loss': 0.6023, 'learning_rate': 1.9723459934025602e-05, 'epoch': 0.21} {'loss': 0.4917, 'learning_rate': 1.972338146263489e-05, 'epoch': 0.21} {'loss': 0.7691, 'learning_rate': 1.972330298026833e-05, 'epoch': 0.21} {'loss': 0.7145, 'learning_rate': 1.9723224486926007e-05, 'epoch': 0.21} {'loss': 0.4524, 'learning_rate': 1.9723145982608015e-05, 'epoch': 0.21} {'loss': 0.3934, 'learning_rate': 1.972306746731444e-05, 'epoch': 0.21} {'loss': 0.662, 'learning_rate': 1.972298894104537e-05, 'epoch': 0.21} {'loss': 0.6464, 'learning_rate': 1.9722910403800895e-05, 'epoch': 0.21} {'loss': 0.5225, 'learning_rate': 1.97228318555811e-05, 'epoch': 0.21} {'loss': 0.4252, 'learning_rate': 1.972275329638608e-05, 'epoch': 0.21} {'loss': 0.4771, 'learning_rate': 1.9722674726215924e-05, 'epoch': 0.21} {'loss': 0.4141, 'learning_rate': 1.972259614507071e-05, 'epoch': 0.21} {'loss': 0.4416, 'learning_rate': 1.9722517552950538e-05, 'epoch': 0.21} {'loss': 0.6456, 'learning_rate': 1.972243894985549e-05, 'epoch': 0.21} {'loss': 0.582, 'learning_rate': 1.972236033578566e-05, 'epoch': 0.21} {'loss': 0.5631, 'learning_rate': 1.9722281710741132e-05, 'epoch': 0.21} {'loss': 0.5582, 'learning_rate': 1.9722203074721995e-05, 'epoch': 0.21} {'loss': 0.5539, 'learning_rate': 1.9722124427728343e-05, 'epoch': 0.21} {'loss': 0.7606, 'learning_rate': 1.9722045769760258e-05, 'epoch': 0.21} {'loss': 0.5561, 'learning_rate': 1.9721967100817837e-05, 'epoch': 0.21} {'loss': 0.6188, 'learning_rate': 1.972188842090116e-05, 'epoch': 0.21} {'loss': 0.4252, 'learning_rate': 1.972180973001032e-05, 'epoch': 0.21} {'loss': 0.5662, 'learning_rate': 1.9721731028145407e-05, 'epoch': 0.21} {'loss': 0.5278, 'learning_rate': 1.9721652315306507e-05, 'epoch': 0.21} {'loss': 0.4775, 'learning_rate': 1.972157359149371e-05, 'epoch': 0.21} {'loss': 0.7755, 'learning_rate': 1.9721494856707105e-05, 'epoch': 0.21} {'loss': 0.4732, 'learning_rate': 1.9721416110946782e-05, 'epoch': 0.21} {'loss': 0.7393, 'learning_rate': 1.972133735421283e-05, 'epoch': 0.21} {'loss': 0.5214, 'learning_rate': 1.9721258586505334e-05, 'epoch': 0.21} {'loss': 0.5856, 'learning_rate': 1.9721179807824388e-05, 'epoch': 0.21} {'loss': 0.5484, 'learning_rate': 1.9721101018170076e-05, 'epoch': 0.21} {'loss': 0.5889, 'learning_rate': 1.9721022217542493e-05, 'epoch': 0.21} {'loss': 0.5139, 'learning_rate': 1.972094340594172e-05, 'epoch': 0.21} {'loss': 0.5502, 'learning_rate': 1.972086458336785e-05, 'epoch': 0.21} {'loss': 0.5341, 'learning_rate': 1.972078574982098e-05, 'epoch': 0.21} {'loss': 0.6294, 'learning_rate': 1.9720706905301186e-05, 'epoch': 0.21} {'loss': 0.6191, 'learning_rate': 1.972062804980856e-05, 'epoch': 0.21} {'loss': 0.5814, 'learning_rate': 1.9720549183343198e-05, 'epoch': 0.21} {'loss': 0.577, 'learning_rate': 1.9720470305905183e-05, 'epoch': 0.21} {'loss': 0.6464, 'learning_rate': 1.9720391417494605e-05, 'epoch': 0.21} {'loss': 0.5368, 'learning_rate': 1.9720312518111552e-05, 'epoch': 0.21} {'loss': 0.5336, 'learning_rate': 1.972023360775612e-05, 'epoch': 0.21} {'loss': 0.5105, 'learning_rate': 1.9720154686428384e-05, 'epoch': 0.21} {'loss': 0.3991, 'learning_rate': 1.972007575412845e-05, 'epoch': 0.21} {'loss': 0.7113, 'learning_rate': 1.9719996810856394e-05, 'epoch': 0.21} {'loss': 0.5343, 'learning_rate': 1.971991785661231e-05, 'epoch': 0.21} {'loss': 0.4872, 'learning_rate': 1.971983889139629e-05, 'epoch': 0.21} {'loss': 0.5426, 'learning_rate': 1.971975991520842e-05, 'epoch': 0.21} {'loss': 0.5272, 'learning_rate': 1.9719680928048785e-05, 'epoch': 0.21} {'loss': 0.5492, 'learning_rate': 1.9719601929917482e-05, 'epoch': 0.21} {'loss': 0.6476, 'learning_rate': 1.9719522920814596e-05, 'epoch': 0.21} {'loss': 0.5196, 'learning_rate': 1.9719443900740217e-05, 'epoch': 0.21} {'loss': 0.8558, 'learning_rate': 1.9719364869694434e-05, 'epoch': 0.21} {'loss': 0.5673, 'learning_rate': 1.9719285827677338e-05, 'epoch': 0.21} {'loss': 0.5361, 'learning_rate': 1.9719206774689014e-05, 'epoch': 0.21} {'loss': 0.5432, 'learning_rate': 1.9719127710729557e-05, 'epoch': 0.21} {'loss': 0.6262, 'learning_rate': 1.971904863579905e-05, 'epoch': 0.21} {'loss': 0.4551, 'learning_rate': 1.9718969549897585e-05, 'epoch': 0.21} {'loss': 0.4882, 'learning_rate': 1.9718890453025253e-05, 'epoch': 0.21} {'loss': 0.5393, 'learning_rate': 1.971881134518214e-05, 'epoch': 0.21} {'loss': 0.6533, 'learning_rate': 1.971873222636834e-05, 'epoch': 0.21} {'loss': 0.5732, 'learning_rate': 1.9718653096583934e-05, 'epoch': 0.21} {'loss': 0.5583, 'learning_rate': 1.971857395582902e-05, 'epoch': 0.21} {'loss': 0.4743, 'learning_rate': 1.9718494804103686e-05, 'epoch': 0.21} {'loss': 0.5812, 'learning_rate': 1.971841564140802e-05, 'epoch': 0.21} {'loss': 0.505, 'learning_rate': 1.9718336467742106e-05, 'epoch': 0.21} {'loss': 0.6163, 'learning_rate': 1.9718257283106044e-05, 'epoch': 0.21} {'loss': 0.6304, 'learning_rate': 1.9718178087499913e-05, 'epoch': 0.21} {'loss': 0.6866, 'learning_rate': 1.9718098880923807e-05, 'epoch': 0.21} {'loss': 0.5851, 'learning_rate': 1.971801966337782e-05, 'epoch': 0.21} {'loss': 0.4982, 'learning_rate': 1.9717940434862032e-05, 'epoch': 0.21} {'loss': 0.5325, 'learning_rate': 1.971786119537654e-05, 'epoch': 0.21} {'loss': 0.5218, 'learning_rate': 1.971778194492143e-05, 'epoch': 0.21} {'loss': 0.6324, 'learning_rate': 1.971770268349679e-05, 'epoch': 0.21} {'loss': 0.4866, 'learning_rate': 1.9717623411102713e-05, 'epoch': 0.21} {'loss': 0.4803, 'learning_rate': 1.9717544127739286e-05, 'epoch': 0.21} {'loss': 0.709, 'learning_rate': 1.97174648334066e-05, 'epoch': 0.21} {'loss': 0.5034, 'learning_rate': 1.9717385528104745e-05, 'epoch': 0.21} {'loss': 0.5203, 'learning_rate': 1.9717306211833807e-05, 'epoch': 0.21} {'loss': 0.7157, 'learning_rate': 1.9717226884593884e-05, 'epoch': 0.21} {'loss': 0.6358, 'learning_rate': 1.9717147546385057e-05, 'epoch': 0.21} {'loss': 0.55, 'learning_rate': 1.9717068197207417e-05, 'epoch': 0.21} {'loss': 0.6298, 'learning_rate': 1.9716988837061054e-05, 'epoch': 0.21} {'loss': 0.6966, 'learning_rate': 1.971690946594606e-05, 'epoch': 0.21} {'loss': 0.6178, 'learning_rate': 1.9716830083862522e-05, 'epoch': 0.21} {'loss': 0.7481, 'learning_rate': 1.971675069081053e-05, 'epoch': 0.21} {'loss': 0.4958, 'learning_rate': 1.9716671286790178e-05, 'epoch': 0.21} {'loss': 0.5323, 'learning_rate': 1.9716591871801548e-05, 'epoch': 0.21} {'loss': 0.5682, 'learning_rate': 1.9716512445844733e-05, 'epoch': 0.21} {'loss': 0.5478, 'learning_rate': 1.9716433008919823e-05, 'epoch': 0.21} {'loss': 0.5331, 'learning_rate': 1.971635356102691e-05, 'epoch': 0.21} {'loss': 0.5149, 'learning_rate': 1.9716274102166084e-05, 'epoch': 0.21} {'loss': 0.6078, 'learning_rate': 1.9716194632337427e-05, 'epoch': 0.21} {'loss': 0.4162, 'learning_rate': 1.971611515154104e-05, 'epoch': 0.21} {'loss': 0.7012, 'learning_rate': 1.9716035659777e-05, 'epoch': 0.21} {'loss': 0.6183, 'learning_rate': 1.9715956157045406e-05, 'epoch': 0.21} {'loss': 0.3906, 'learning_rate': 1.9715876643346345e-05, 'epoch': 0.21} {'loss': 0.574, 'learning_rate': 1.9715797118679908e-05, 'epoch': 0.21} {'loss': 0.5665, 'learning_rate': 1.971571758304618e-05, 'epoch': 0.21} {'loss': 0.7006, 'learning_rate': 1.9715638036445258e-05, 'epoch': 0.21} {'loss': 0.5471, 'learning_rate': 1.9715558478877226e-05, 'epoch': 0.21} {'loss': 0.5483, 'learning_rate': 1.971547891034218e-05, 'epoch': 0.21} {'loss': 0.4779, 'learning_rate': 1.9715399330840198e-05, 'epoch': 0.21} {'loss': 0.5577, 'learning_rate': 1.9715319740371383e-05, 'epoch': 0.21} {'loss': 0.5124, 'learning_rate': 1.971524013893582e-05, 'epoch': 0.21} {'loss': 0.6088, 'learning_rate': 1.9715160526533598e-05, 'epoch': 0.21} {'loss': 0.6311, 'learning_rate': 1.9715080903164807e-05, 'epoch': 0.21} {'loss': 0.498, 'learning_rate': 1.9715001268829534e-05, 'epoch': 0.21} {'loss': 0.7313, 'learning_rate': 1.9714921623527875e-05, 'epoch': 0.21} {'loss': 0.5104, 'learning_rate': 1.9714841967259918e-05, 'epoch': 0.21} {'loss': 0.5981, 'learning_rate': 1.971476230002575e-05, 'epoch': 0.21} {'loss': 0.7325, 'learning_rate': 1.971468262182546e-05, 'epoch': 0.21} {'loss': 0.7388, 'learning_rate': 1.9714602932659143e-05, 'epoch': 0.21} {'loss': 0.5321, 'learning_rate': 1.9714523232526887e-05, 'epoch': 0.21} {'loss': 0.5418, 'learning_rate': 1.971444352142878e-05, 'epoch': 0.21} {'loss': 0.5931, 'learning_rate': 1.971436379936492e-05, 'epoch': 0.21} {'loss': 0.5858, 'learning_rate': 1.9714284066335383e-05, 'epoch': 0.21} {'loss': 0.5659, 'learning_rate': 1.9714204322340268e-05, 'epoch': 0.21} {'loss': 0.6489, 'learning_rate': 1.9714124567379667e-05, 'epoch': 0.21} {'loss': 0.5454, 'learning_rate': 1.9714044801453666e-05, 'epoch': 0.21} {'loss': 0.5541, 'learning_rate': 1.9713965024562352e-05, 'epoch': 0.21} {'loss': 0.4198, 'learning_rate': 1.971388523670582e-05, 'epoch': 0.21} {'loss': 0.6151, 'learning_rate': 1.971380543788416e-05, 'epoch': 0.21} {'loss': 0.5754, 'learning_rate': 1.971372562809746e-05, 'epoch': 0.21} {'loss': 0.4978, 'learning_rate': 1.9713645807345808e-05, 'epoch': 0.21} {'loss': 0.6633, 'learning_rate': 1.9713565975629304e-05, 'epoch': 0.21} {'loss': 0.7221, 'learning_rate': 1.9713486132948027e-05, 'epoch': 0.21} {'loss': 0.4544, 'learning_rate': 1.9713406279302074e-05, 'epoch': 0.21} {'loss': 0.6571, 'learning_rate': 1.9713326414691526e-05, 'epoch': 0.21} {'loss': 0.4466, 'learning_rate': 1.9713246539116483e-05, 'epoch': 0.21} {'loss': 0.6974, 'learning_rate': 1.9713166652577032e-05, 'epoch': 0.21} {'loss': 0.4773, 'learning_rate': 1.9713086755073265e-05, 'epoch': 0.21} {'loss': 0.5335, 'learning_rate': 1.9713006846605266e-05, 'epoch': 0.21} {'loss': 0.6773, 'learning_rate': 1.9712926927173133e-05, 'epoch': 0.21} {'loss': 0.6308, 'learning_rate': 1.9712846996776952e-05, 'epoch': 0.21} {'loss': 0.6116, 'learning_rate': 1.9712767055416814e-05, 'epoch': 0.21} {'loss': 0.4498, 'learning_rate': 1.9712687103092803e-05, 'epoch': 0.21} {'loss': 0.6046, 'learning_rate': 1.971260713980502e-05, 'epoch': 0.21} {'loss': 0.5804, 'learning_rate': 1.9712527165553554e-05, 'epoch': 0.21} {'loss': 0.4435, 'learning_rate': 1.9712447180338485e-05, 'epoch': 0.21} {'loss': 0.6417, 'learning_rate': 1.9712367184159915e-05, 'epoch': 0.21} {'loss': 0.4896, 'learning_rate': 1.9712287177017928e-05, 'epoch': 0.21} {'loss': 0.5647, 'learning_rate': 1.9712207158912613e-05, 'epoch': 0.21} {'loss': 0.5465, 'learning_rate': 1.9712127129844067e-05, 'epoch': 0.21} {'loss': 0.5131, 'learning_rate': 1.9712047089812373e-05, 'epoch': 0.21} {'loss': 0.5991, 'learning_rate': 1.9711967038817626e-05, 'epoch': 0.21} {'loss': 0.5378, 'learning_rate': 1.9711886976859915e-05, 'epoch': 0.21} {'loss': 0.6395, 'learning_rate': 1.971180690393933e-05, 'epoch': 0.21} {'loss': 0.6104, 'learning_rate': 1.9711726820055962e-05, 'epoch': 0.21} {'loss': 0.4037, 'learning_rate': 1.9711646725209903e-05, 'epoch': 0.21} {'loss': 0.6016, 'learning_rate': 1.9711566619401238e-05, 'epoch': 0.21} {'loss': 0.5879, 'learning_rate': 1.9711486502630067e-05, 'epoch': 0.21} {'loss': 0.5172, 'learning_rate': 1.9711406374896466e-05, 'epoch': 0.21} {'loss': 0.4475, 'learning_rate': 1.971132623620054e-05, 'epoch': 0.21} {'loss': 0.5108, 'learning_rate': 1.9711246086542374e-05, 'epoch': 0.21} {'loss': 0.4696, 'learning_rate': 1.9711165925922055e-05, 'epoch': 0.21} {'loss': 0.4525, 'learning_rate': 1.9711085754339676e-05, 'epoch': 0.21} {'loss': 0.58, 'learning_rate': 1.971100557179533e-05, 'epoch': 0.21} {'loss': 0.4181, 'learning_rate': 1.97109253782891e-05, 'epoch': 0.21} {'loss': 0.5647, 'learning_rate': 1.971084517382109e-05, 'epoch': 0.21} {'loss': 0.6529, 'learning_rate': 1.971076495839138e-05, 'epoch': 0.21} {'loss': 0.6173, 'learning_rate': 1.971068473200006e-05, 'epoch': 0.21} {'loss': 0.4021, 'learning_rate': 1.9710604494647226e-05, 'epoch': 0.21} {'loss': 0.4755, 'learning_rate': 1.9710524246332962e-05, 'epoch': 0.21} {'loss': 0.5527, 'learning_rate': 1.9710443987057368e-05, 'epoch': 0.21} {'loss': 0.4444, 'learning_rate': 1.9710363716820526e-05, 'epoch': 0.21} {'loss': 0.6853, 'learning_rate': 1.971028343562253e-05, 'epoch': 0.21} {'loss': 0.5136, 'learning_rate': 1.9710203143463473e-05, 'epoch': 0.21} {'loss': 0.552, 'learning_rate': 1.9710122840343443e-05, 'epoch': 0.21} {'loss': 0.6852, 'learning_rate': 1.9710042526262526e-05, 'epoch': 0.21} {'loss': 0.5598, 'learning_rate': 1.970996220122082e-05, 'epoch': 0.21} {'loss': 0.5407, 'learning_rate': 1.9709881865218413e-05, 'epoch': 0.21} {'loss': 0.5952, 'learning_rate': 1.97098015182554e-05, 'epoch': 0.21} {'loss': 0.5923, 'learning_rate': 1.9709721160331864e-05, 'epoch': 0.21} {'loss': 0.5584, 'learning_rate': 1.97096407914479e-05, 'epoch': 0.21} {'loss': 0.5081, 'learning_rate': 1.9709560411603595e-05, 'epoch': 0.21} {'loss': 0.5131, 'learning_rate': 1.9709480020799043e-05, 'epoch': 0.21} {'loss': 0.5881, 'learning_rate': 1.9709399619034336e-05, 'epoch': 0.21} {'loss': 0.5016, 'learning_rate': 1.9709319206309565e-05, 'epoch': 0.21} {'loss': 0.4563, 'learning_rate': 1.9709238782624818e-05, 'epoch': 0.21} {'loss': 0.5484, 'learning_rate': 1.9709158347980186e-05, 'epoch': 0.21} {'loss': 0.5551, 'learning_rate': 1.970907790237576e-05, 'epoch': 0.21} {'loss': 0.6233, 'learning_rate': 1.9708997445811633e-05, 'epoch': 0.21} {'loss': 0.6797, 'learning_rate': 1.970891697828789e-05, 'epoch': 0.21} {'loss': 0.7341, 'learning_rate': 1.970883649980463e-05, 'epoch': 0.21} {'loss': 0.5061, 'learning_rate': 1.9708756010361937e-05, 'epoch': 0.21} {'loss': 0.4865, 'learning_rate': 1.9708675509959908e-05, 'epoch': 0.21} {'loss': 0.5603, 'learning_rate': 1.970859499859863e-05, 'epoch': 0.21} {'loss': 0.6664, 'learning_rate': 1.9708514476278194e-05, 'epoch': 0.21} {'loss': 0.5581, 'learning_rate': 1.970843394299869e-05, 'epoch': 0.21} {'loss': 0.6419, 'learning_rate': 1.970835339876021e-05, 'epoch': 0.21} {'loss': 0.4821, 'learning_rate': 1.970827284356285e-05, 'epoch': 0.21} {'loss': 0.7143, 'learning_rate': 1.970819227740669e-05, 'epoch': 0.21} {'loss': 0.5181, 'learning_rate': 1.9708111700291826e-05, 'epoch': 0.21} {'loss': 0.601, 'learning_rate': 1.9708031112218357e-05, 'epoch': 0.21} {'loss': 0.6292, 'learning_rate': 1.970795051318636e-05, 'epoch': 0.21} {'loss': 0.5327, 'learning_rate': 1.9707869903195938e-05, 'epoch': 0.21} {'loss': 0.57, 'learning_rate': 1.9707789282247175e-05, 'epoch': 0.21} {'loss': 0.5694, 'learning_rate': 1.9707708650340163e-05, 'epoch': 0.21} {'loss': 0.511, 'learning_rate': 1.9707628007474995e-05, 'epoch': 0.21} {'loss': 0.655, 'learning_rate': 1.970754735365176e-05, 'epoch': 0.21} {'loss': 0.6365, 'learning_rate': 1.9707466688870552e-05, 'epoch': 0.21} {'loss': 0.6179, 'learning_rate': 1.970738601313146e-05, 'epoch': 0.21} {'loss': 0.4061, 'learning_rate': 1.9707305326434572e-05, 'epoch': 0.21} {'loss': 0.5514, 'learning_rate': 1.9707224628779983e-05, 'epoch': 0.21} {'loss': 0.536, 'learning_rate': 1.9707143920167785e-05, 'epoch': 0.21} {'loss': 0.6223, 'learning_rate': 1.9707063200598068e-05, 'epoch': 0.21} {'loss': 0.4479, 'learning_rate': 1.970698247007092e-05, 'epoch': 0.21} {'loss': 0.4615, 'learning_rate': 1.9706901728586437e-05, 'epoch': 0.21} {'loss': 0.4826, 'learning_rate': 1.9706820976144706e-05, 'epoch': 0.21} {'loss': 0.622, 'learning_rate': 1.970674021274582e-05, 'epoch': 0.21} {'loss': 0.3165, 'learning_rate': 1.970665943838987e-05, 'epoch': 0.21} {'loss': 0.7897, 'learning_rate': 1.970657865307695e-05, 'epoch': 0.21} {'loss': 0.553, 'learning_rate': 1.970649785680715e-05, 'epoch': 0.21} {'loss': 0.626, 'learning_rate': 1.9706417049580553e-05, 'epoch': 0.21} {'loss': 0.4502, 'learning_rate': 1.970633623139726e-05, 'epoch': 0.21} {'loss': 0.5549, 'learning_rate': 1.9706255402257358e-05, 'epoch': 0.21} {'loss': 0.6437, 'learning_rate': 1.9706174562160944e-05, 'epoch': 0.21} {'loss': 0.569, 'learning_rate': 1.97060937111081e-05, 'epoch': 0.21} {'loss': 0.4093, 'learning_rate': 1.9706012849098925e-05, 'epoch': 0.21} {'loss': 0.4932, 'learning_rate': 1.9705931976133503e-05, 'epoch': 0.21} {'loss': 0.5026, 'learning_rate': 1.9705851092211933e-05, 'epoch': 0.21} {'loss': 0.6355, 'learning_rate': 1.97057701973343e-05, 'epoch': 0.21} {'loss': 0.5503, 'learning_rate': 1.9705689291500703e-05, 'epoch': 0.21} {'loss': 0.6543, 'learning_rate': 1.9705608374711226e-05, 'epoch': 0.21} {'loss': 0.5372, 'learning_rate': 1.970552744696596e-05, 'epoch': 0.21} {'loss': 0.4325, 'learning_rate': 1.9705446508265002e-05, 'epoch': 0.21} {'loss': 0.421, 'learning_rate': 1.9705365558608437e-05, 'epoch': 0.21} {'loss': 0.5331, 'learning_rate': 1.9705284597996366e-05, 'epoch': 0.21} {'loss': 0.5715, 'learning_rate': 1.970520362642887e-05, 'epoch': 0.21} {'loss': 0.4716, 'learning_rate': 1.9705122643906046e-05, 'epoch': 0.21} {'loss': 0.582, 'learning_rate': 1.970504165042798e-05, 'epoch': 0.21} {'loss': 0.5426, 'learning_rate': 1.9704960645994772e-05, 'epoch': 0.21} {'loss': 0.5632, 'learning_rate': 1.970487963060651e-05, 'epoch': 0.21} {'loss': 0.6969, 'learning_rate': 1.9704798604263282e-05, 'epoch': 0.21} {'loss': 0.5578, 'learning_rate': 1.970471756696518e-05, 'epoch': 0.21} {'loss': 0.5307, 'learning_rate': 1.97046365187123e-05, 'epoch': 0.21} {'loss': 0.6332, 'learning_rate': 1.970455545950473e-05, 'epoch': 0.21} {'loss': 0.5654, 'learning_rate': 1.9704474389342563e-05, 'epoch': 0.21} {'loss': 0.5194, 'learning_rate': 1.970439330822589e-05, 'epoch': 0.21} {'loss': 0.5019, 'learning_rate': 1.97043122161548e-05, 'epoch': 0.21} {'loss': 0.5959, 'learning_rate': 1.970423111312939e-05, 'epoch': 0.21} {'loss': 0.7062, 'learning_rate': 1.9704149999149745e-05, 'epoch': 0.21} {'loss': 0.4984, 'learning_rate': 1.970406887421596e-05, 'epoch': 0.21} {'loss': 0.5913, 'learning_rate': 1.970398773832813e-05, 'epoch': 0.21} {'loss': 0.5894, 'learning_rate': 1.9703906591486342e-05, 'epoch': 0.21} {'loss': 0.5577, 'learning_rate': 1.970382543369069e-05, 'epoch': 0.21} {'loss': 0.5551, 'learning_rate': 1.970374426494126e-05, 'epoch': 0.21} {'loss': 0.6063, 'learning_rate': 1.970366308523815e-05, 'epoch': 0.21} {'loss': 0.4907, 'learning_rate': 1.970358189458145e-05, 'epoch': 0.21} {'loss': 0.5404, 'learning_rate': 1.9703500692971253e-05, 'epoch': 0.21} {'loss': 0.4208, 'learning_rate': 1.9703419480407645e-05, 'epoch': 0.21} {'loss': 0.5631, 'learning_rate': 1.9703338256890726e-05, 'epoch': 0.21} {'loss': 0.6821, 'learning_rate': 1.970325702242058e-05, 'epoch': 0.21} {'loss': 0.532, 'learning_rate': 1.97031757769973e-05, 'epoch': 0.21} {'loss': 0.5201, 'learning_rate': 1.9703094520620986e-05, 'epoch': 0.21} {'loss': 0.4121, 'learning_rate': 1.970301325329172e-05, 'epoch': 0.21} {'loss': 0.4223, 'learning_rate': 1.97029319750096e-05, 'epoch': 0.21} {'loss': 0.6106, 'learning_rate': 1.970285068577471e-05, 'epoch': 0.21} {'loss': 0.7786, 'learning_rate': 1.970276938558715e-05, 'epoch': 0.21} {'loss': 0.5673, 'learning_rate': 1.9702688074447004e-05, 'epoch': 0.21} {'loss': 0.5498, 'learning_rate': 1.9702606752354376e-05, 'epoch': 0.21} {'loss': 0.6216, 'learning_rate': 1.9702525419309344e-05, 'epoch': 0.21} {'loss': 0.5813, 'learning_rate': 1.9702444075312007e-05, 'epoch': 0.21} {'loss': 0.6124, 'learning_rate': 1.9702362720362455e-05, 'epoch': 0.21} {'loss': 0.6144, 'learning_rate': 1.9702281354460782e-05, 'epoch': 0.21} {'loss': 0.3879, 'learning_rate': 1.970219997760708e-05, 'epoch': 0.21} {'loss': 0.6208, 'learning_rate': 1.9702118589801437e-05, 'epoch': 0.21} {'loss': 0.6819, 'learning_rate': 1.9702037191043944e-05, 'epoch': 0.21} {'loss': 0.4199, 'learning_rate': 1.97019557813347e-05, 'epoch': 0.21} {'loss': 0.7362, 'learning_rate': 1.9701874360673792e-05, 'epoch': 0.21} {'loss': 0.6631, 'learning_rate': 1.9701792929061315e-05, 'epoch': 0.21} {'loss': 0.7063, 'learning_rate': 1.9701711486497356e-05, 'epoch': 0.21} {'loss': 0.6253, 'learning_rate': 1.970163003298201e-05, 'epoch': 0.21} {'loss': 0.7017, 'learning_rate': 1.9701548568515367e-05, 'epoch': 0.21} {'loss': 0.5193, 'learning_rate': 1.970146709309752e-05, 'epoch': 0.21} {'loss': 0.5879, 'learning_rate': 1.9701385606728568e-05, 'epoch': 0.21} {'loss': 0.499, 'learning_rate': 1.970130410940859e-05, 'epoch': 0.21} {'loss': 0.5981, 'learning_rate': 1.9701222601137687e-05, 'epoch': 0.21} {'loss': 0.5382, 'learning_rate': 1.9701141081915945e-05, 'epoch': 0.21} {'loss': 0.6343, 'learning_rate': 1.9701059551743463e-05, 'epoch': 0.21} {'loss': 0.6398, 'learning_rate': 1.970097801062033e-05, 'epoch': 0.21} {'loss': 0.5356, 'learning_rate': 1.9700896458546635e-05, 'epoch': 0.21} {'loss': 0.7278, 'learning_rate': 1.9700814895522474e-05, 'epoch': 0.21} {'loss': 0.5163, 'learning_rate': 1.9700733321547936e-05, 'epoch': 0.21} {'loss': 0.4382, 'learning_rate': 1.9700651736623116e-05, 'epoch': 0.21} {'loss': 0.651, 'learning_rate': 1.9700570140748108e-05, 'epoch': 0.21} {'loss': 0.6734, 'learning_rate': 1.9700488533923e-05, 'epoch': 0.21} {'loss': 0.5805, 'learning_rate': 1.9700406916147883e-05, 'epoch': 0.21} {'loss': 0.4609, 'learning_rate': 1.970032528742285e-05, 'epoch': 0.21} {'loss': 0.6222, 'learning_rate': 1.9700243647747995e-05, 'epoch': 0.21} {'loss': 0.6455, 'learning_rate': 1.970016199712341e-05, 'epoch': 0.21} {'loss': 0.4605, 'learning_rate': 1.9700080335549188e-05, 'epoch': 0.21} {'loss': 0.5738, 'learning_rate': 1.969999866302542e-05, 'epoch': 0.21} {'loss': 0.7097, 'learning_rate': 1.9699916979552195e-05, 'epoch': 0.21} {'loss': 0.6412, 'learning_rate': 1.9699835285129613e-05, 'epoch': 0.21} {'loss': 0.4768, 'learning_rate': 1.9699753579757757e-05, 'epoch': 0.21} {'loss': 0.4856, 'learning_rate': 1.9699671863436724e-05, 'epoch': 0.21} {'loss': 0.5683, 'learning_rate': 1.9699590136166607e-05, 'epoch': 0.21} {'loss': 0.4581, 'learning_rate': 1.96995083979475e-05, 'epoch': 0.21} {'loss': 0.5342, 'learning_rate': 1.969942664877949e-05, 'epoch': 0.21} {'loss': 0.5292, 'learning_rate': 1.9699344888662672e-05, 'epoch': 0.21} {'loss': 0.4927, 'learning_rate': 1.9699263117597137e-05, 'epoch': 0.21} {'loss': 0.6012, 'learning_rate': 1.969918133558298e-05, 'epoch': 0.21} {'loss': 0.4367, 'learning_rate': 1.9699099542620287e-05, 'epoch': 0.21} {'loss': 0.6282, 'learning_rate': 1.9699017738709162e-05, 'epoch': 0.21} {'loss': 0.5672, 'learning_rate': 1.9698935923849685e-05, 'epoch': 0.21} {'loss': 0.5317, 'learning_rate': 1.9698854098041956e-05, 'epoch': 0.21} {'loss': 0.5568, 'learning_rate': 1.9698772261286064e-05, 'epoch': 0.21} {'loss': 0.7275, 'learning_rate': 1.9698690413582103e-05, 'epoch': 0.21} {'loss': 0.6034, 'learning_rate': 1.9698608554930166e-05, 'epoch': 0.21} {'loss': 0.3794, 'learning_rate': 1.9698526685330345e-05, 'epoch': 0.21} {'loss': 0.5131, 'learning_rate': 1.969844480478273e-05, 'epoch': 0.21} {'loss': 0.7354, 'learning_rate': 1.969836291328741e-05, 'epoch': 0.21} {'loss': 0.4629, 'learning_rate': 1.969828101084449e-05, 'epoch': 0.21} {'loss': 0.5982, 'learning_rate': 1.9698199097454052e-05, 'epoch': 0.21} {'loss': 0.5563, 'learning_rate': 1.969811717311619e-05, 'epoch': 0.21} {'loss': 0.5793, 'learning_rate': 1.9698035237831e-05, 'epoch': 0.21} {'loss': 0.3909, 'learning_rate': 1.969795329159857e-05, 'epoch': 0.21} {'loss': 0.5985, 'learning_rate': 1.9697871334419e-05, 'epoch': 0.21} {'loss': 0.5121, 'learning_rate': 1.9697789366292374e-05, 'epoch': 0.21} {'loss': 0.5333, 'learning_rate': 1.969770738721879e-05, 'epoch': 0.21} {'loss': 0.6004, 'learning_rate': 1.9697625397198338e-05, 'epoch': 0.21} {'loss': 0.5294, 'learning_rate': 1.9697543396231106e-05, 'epoch': 0.21} {'loss': 0.4857, 'learning_rate': 1.9697461384317197e-05, 'epoch': 0.21} {'loss': 0.6903, 'learning_rate': 1.9697379361456695e-05, 'epoch': 0.21} {'loss': 0.7082, 'learning_rate': 1.96972973276497e-05, 'epoch': 0.21} {'loss': 0.6389, 'learning_rate': 1.9697215282896295e-05, 'epoch': 0.21} {'loss': 0.5541, 'learning_rate': 1.969713322719658e-05, 'epoch': 0.21} {'loss': 0.661, 'learning_rate': 1.9697051160550647e-05, 'epoch': 0.21} {'loss': 0.485, 'learning_rate': 1.9696969082958586e-05, 'epoch': 0.21} {'loss': 0.5166, 'learning_rate': 1.969688699442049e-05, 'epoch': 0.21} {'loss': 0.514, 'learning_rate': 1.9696804894936457e-05, 'epoch': 0.21} {'loss': 0.7079, 'learning_rate': 1.9696722784506572e-05, 'epoch': 0.21} {'loss': 0.6361, 'learning_rate': 1.9696640663130927e-05, 'epoch': 0.21} {'loss': 0.6348, 'learning_rate': 1.9696558530809624e-05, 'epoch': 0.21} {'loss': 0.4472, 'learning_rate': 1.969647638754275e-05, 'epoch': 0.21} {'loss': 0.4126, 'learning_rate': 1.9696394233330394e-05, 'epoch': 0.21} {'loss': 0.5623, 'learning_rate': 1.9696312068172657e-05, 'epoch': 0.21} {'loss': 0.5897, 'learning_rate': 1.9696229892069624e-05, 'epoch': 0.21} {'loss': 0.5021, 'learning_rate': 1.9696147705021397e-05, 'epoch': 0.21} {'loss': 0.4588, 'learning_rate': 1.9696065507028058e-05, 'epoch': 0.21} {'loss': 0.5104, 'learning_rate': 1.9695983298089704e-05, 'epoch': 0.21} {'loss': 0.4809, 'learning_rate': 1.9695901078206435e-05, 'epoch': 0.21} {'loss': 0.5098, 'learning_rate': 1.969581884737833e-05, 'epoch': 0.21} {'loss': 0.5966, 'learning_rate': 1.9695736605605495e-05, 'epoch': 0.21} {'loss': 0.6292, 'learning_rate': 1.9695654352888013e-05, 'epoch': 0.21} {'loss': 0.4298, 'learning_rate': 1.969557208922598e-05, 'epoch': 0.21} {'loss': 0.6542, 'learning_rate': 1.9695489814619495e-05, 'epoch': 0.21} {'loss': 0.6005, 'learning_rate': 1.9695407529068644e-05, 'epoch': 0.21} {'loss': 0.4594, 'learning_rate': 1.969532523257352e-05, 'epoch': 0.21} {'loss': 0.5281, 'learning_rate': 1.969524292513422e-05, 'epoch': 0.21} {'loss': 0.5687, 'learning_rate': 1.969516060675083e-05, 'epoch': 0.21} {'loss': 0.5319, 'learning_rate': 1.969507827742345e-05, 'epoch': 0.21} {'loss': 0.5681, 'learning_rate': 1.969499593715217e-05, 'epoch': 0.21} {'loss': 0.539, 'learning_rate': 1.9694913585937083e-05, 'epoch': 0.21} {'loss': 0.5991, 'learning_rate': 1.9694831223778283e-05, 'epoch': 0.21} {'loss': 0.6954, 'learning_rate': 1.969474885067586e-05, 'epoch': 0.21} {'loss': 0.5033, 'learning_rate': 1.9694666466629912e-05, 'epoch': 0.21} {'loss': 0.6977, 'learning_rate': 1.9694584071640528e-05, 'epoch': 0.22} {'loss': 0.5879, 'learning_rate': 1.96945016657078e-05, 'epoch': 0.22} {'loss': 0.5661, 'learning_rate': 1.9694419248831823e-05, 'epoch': 0.22} {'loss': 0.4873, 'learning_rate': 1.9694336821012695e-05, 'epoch': 0.22} {'loss': 0.4035, 'learning_rate': 1.96942543822505e-05, 'epoch': 0.22} {'loss': 0.712, 'learning_rate': 1.9694171932545337e-05, 'epoch': 0.22} {'loss': 0.6838, 'learning_rate': 1.9694089471897296e-05, 'epoch': 0.22} {'loss': 0.5284, 'learning_rate': 1.969400700030647e-05, 'epoch': 0.22} {'loss': 0.5163, 'learning_rate': 1.969392451777296e-05, 'epoch': 0.22} {'loss': 0.4236, 'learning_rate': 1.9693842024296845e-05, 'epoch': 0.22} {'loss': 0.4473, 'learning_rate': 1.9693759519878227e-05, 'epoch': 0.22} {'loss': 0.645, 'learning_rate': 1.96936770045172e-05, 'epoch': 0.22} {'loss': 0.4909, 'learning_rate': 1.9693594478213857e-05, 'epoch': 0.22} {'loss': 0.4999, 'learning_rate': 1.9693511940968285e-05, 'epoch': 0.22} {'loss': 0.5544, 'learning_rate': 1.969342939278058e-05, 'epoch': 0.22} {'loss': 0.7594, 'learning_rate': 1.9693346833650846e-05, 'epoch': 0.22} {'loss': 0.5387, 'learning_rate': 1.969326426357916e-05, 'epoch': 0.22} {'loss': 0.5714, 'learning_rate': 1.969318168256562e-05, 'epoch': 0.22} {'loss': 0.6121, 'learning_rate': 1.9693099090610323e-05, 'epoch': 0.22} {'loss': 0.5253, 'learning_rate': 1.969301648771336e-05, 'epoch': 0.22} {'loss': 0.6172, 'learning_rate': 1.9692933873874828e-05, 'epoch': 0.22} {'loss': 0.6406, 'learning_rate': 1.9692851249094814e-05, 'epoch': 0.22} {'loss': 0.5239, 'learning_rate': 1.9692768613373415e-05, 'epoch': 0.22} {'loss': 0.6419, 'learning_rate': 1.969268596671072e-05, 'epoch': 0.22} {'loss': 0.4437, 'learning_rate': 1.969260330910683e-05, 'epoch': 0.22} {'loss': 0.6943, 'learning_rate': 1.9692520640561832e-05, 'epoch': 0.22} {'loss': 0.6107, 'learning_rate': 1.9692437961075823e-05, 'epoch': 0.22} {'loss': 0.5916, 'learning_rate': 1.9692355270648892e-05, 'epoch': 0.22} {'loss': 0.5322, 'learning_rate': 1.9692272569281138e-05, 'epoch': 0.22} {'loss': 0.5273, 'learning_rate': 1.969218985697265e-05, 'epoch': 0.22} {'loss': 0.5905, 'learning_rate': 1.969210713372352e-05, 'epoch': 0.22} {'loss': 0.6556, 'learning_rate': 1.9692024399533847e-05, 'epoch': 0.22} {'loss': 0.7206, 'learning_rate': 1.9691941654403722e-05, 'epoch': 0.22} {'loss': 0.5593, 'learning_rate': 1.9691858898333236e-05, 'epoch': 0.22} {'loss': 0.6057, 'learning_rate': 1.9691776131322485e-05, 'epoch': 0.22} {'loss': 0.6062, 'learning_rate': 1.9691693353371565e-05, 'epoch': 0.22} {'loss': 0.5927, 'learning_rate': 1.969161056448056e-05, 'epoch': 0.22} {'loss': 0.4459, 'learning_rate': 1.9691527764649574e-05, 'epoch': 0.22} {'loss': 0.4163, 'learning_rate': 1.9691444953878696e-05, 'epoch': 0.22} {'loss': 0.4909, 'learning_rate': 1.9691362132168018e-05, 'epoch': 0.22} {'loss': 0.5581, 'learning_rate': 1.9691279299517635e-05, 'epoch': 0.22} {'loss': 0.446, 'learning_rate': 1.9691196455927638e-05, 'epoch': 0.22} {'loss': 0.5236, 'learning_rate': 1.969111360139813e-05, 'epoch': 0.22} {'loss': 0.724, 'learning_rate': 1.969103073592919e-05, 'epoch': 0.22} {'loss': 0.7242, 'learning_rate': 1.9690947859520927e-05, 'epoch': 0.22} {'loss': 0.4401, 'learning_rate': 1.9690864972173422e-05, 'epoch': 0.22} {'loss': 0.5706, 'learning_rate': 1.969078207388677e-05, 'epoch': 0.22} {'loss': 0.5279, 'learning_rate': 1.9690699164661072e-05, 'epoch': 0.22} {'loss': 0.4579, 'learning_rate': 1.9690616244496417e-05, 'epoch': 0.22} {'loss': 0.6491, 'learning_rate': 1.96905333133929e-05, 'epoch': 0.22} {'loss': 0.6158, 'learning_rate': 1.9690450371350612e-05, 'epoch': 0.22} {'loss': 0.5665, 'learning_rate': 1.969036741836965e-05, 'epoch': 0.22} {'loss': 0.4567, 'learning_rate': 1.9690284454450103e-05, 'epoch': 0.22} {'loss': 0.4878, 'learning_rate': 1.969020147959207e-05, 'epoch': 0.22} {'loss': 0.6724, 'learning_rate': 1.9690118493795643e-05, 'epoch': 0.22} {'loss': 0.7007, 'learning_rate': 1.9690035497060914e-05, 'epoch': 0.22} {'loss': 0.6108, 'learning_rate': 1.9689952489387974e-05, 'epoch': 0.22} {'loss': 0.5078, 'learning_rate': 1.9689869470776922e-05, 'epoch': 0.22} {'loss': 0.6894, 'learning_rate': 1.9689786441227855e-05, 'epoch': 0.22} {'loss': 0.7305, 'learning_rate': 1.9689703400740856e-05, 'epoch': 0.22} {'loss': 0.6364, 'learning_rate': 1.9689620349316025e-05, 'epoch': 0.22} {'loss': 0.7386, 'learning_rate': 1.9689537286953458e-05, 'epoch': 0.22} {'loss': 0.6071, 'learning_rate': 1.9689454213653242e-05, 'epoch': 0.22} {'loss': 0.6454, 'learning_rate': 1.9689371129415476e-05, 'epoch': 0.22} {'loss': 0.5187, 'learning_rate': 1.968928803424026e-05, 'epoch': 0.22} {'loss': 0.4123, 'learning_rate': 1.968920492812767e-05, 'epoch': 0.22} {'loss': 0.5415, 'learning_rate': 1.9689121811077813e-05, 'epoch': 0.22} {'loss': 0.6085, 'learning_rate': 1.9689038683090782e-05, 'epoch': 0.22} {'loss': 0.6087, 'learning_rate': 1.968895554416667e-05, 'epoch': 0.22} {'loss': 0.7188, 'learning_rate': 1.9688872394305564e-05, 'epoch': 0.22} {'loss': 0.3552, 'learning_rate': 1.968878923350757e-05, 'epoch': 0.22} {'loss': 0.5907, 'learning_rate': 1.968870606177277e-05, 'epoch': 0.22} {'loss': 0.6156, 'learning_rate': 1.9688622879101266e-05, 'epoch': 0.22} {'loss': 0.642, 'learning_rate': 1.968853968549315e-05, 'epoch': 0.22} {'loss': 0.6447, 'learning_rate': 1.9688456480948512e-05, 'epoch': 0.22} {'loss': 0.4916, 'learning_rate': 1.968837326546745e-05, 'epoch': 0.22} {'loss': 0.64, 'learning_rate': 1.968829003905006e-05, 'epoch': 0.22} {'loss': 0.6525, 'learning_rate': 1.968820680169643e-05, 'epoch': 0.22} {'loss': 0.6496, 'learning_rate': 1.9688123553406657e-05, 'epoch': 0.22} {'loss': 0.536, 'learning_rate': 1.9688040294180836e-05, 'epoch': 0.22} {'loss': 0.5225, 'learning_rate': 1.9687957024019057e-05, 'epoch': 0.22} {'loss': 0.4346, 'learning_rate': 1.9687873742921422e-05, 'epoch': 0.22} {'loss': 0.5342, 'learning_rate': 1.9687790450888012e-05, 'epoch': 0.22} {'loss': 0.3954, 'learning_rate': 1.9687707147918936e-05, 'epoch': 0.22} {'loss': 0.637, 'learning_rate': 1.968762383401428e-05, 'epoch': 0.22} {'loss': 0.6526, 'learning_rate': 1.9687540509174134e-05, 'epoch': 0.22} {'loss': 0.5871, 'learning_rate': 1.96874571733986e-05, 'epoch': 0.22} {'loss': 0.6382, 'learning_rate': 1.968737382668777e-05, 'epoch': 0.22} {'loss': 0.4843, 'learning_rate': 1.9687290469041736e-05, 'epoch': 0.22} {'loss': 0.581, 'learning_rate': 1.9687207100460594e-05, 'epoch': 0.22} {'loss': 0.6702, 'learning_rate': 1.9687123720944435e-05, 'epoch': 0.22} {'loss': 0.5902, 'learning_rate': 1.9687040330493356e-05, 'epoch': 0.22} {'loss': 0.4969, 'learning_rate': 1.968695692910745e-05, 'epoch': 0.22} {'loss': 0.5575, 'learning_rate': 1.9686873516786814e-05, 'epoch': 0.22} {'loss': 0.5901, 'learning_rate': 1.968679009353154e-05, 'epoch': 0.22} {'loss': 0.4403, 'learning_rate': 1.968670665934172e-05, 'epoch': 0.22} {'loss': 0.5538, 'learning_rate': 1.9686623214217453e-05, 'epoch': 0.22} {'loss': 0.565, 'learning_rate': 1.9686539758158827e-05, 'epoch': 0.22} {'loss': 0.6671, 'learning_rate': 1.968645629116594e-05, 'epoch': 0.22} {'loss': 0.4772, 'learning_rate': 1.968637281323889e-05, 'epoch': 0.22} {'loss': 0.4622, 'learning_rate': 1.9686289324377764e-05, 'epoch': 0.22} {'loss': 0.495, 'learning_rate': 1.968620582458266e-05, 'epoch': 0.22} {'loss': 0.475, 'learning_rate': 1.9686122313853667e-05, 'epoch': 0.22} {'loss': 0.5345, 'learning_rate': 1.968603879219089e-05, 'epoch': 0.22} {'loss': 0.5273, 'learning_rate': 1.9685955259594417e-05, 'epoch': 0.22} {'loss': 0.5576, 'learning_rate': 1.9685871716064338e-05, 'epoch': 0.22} {'loss': 0.656, 'learning_rate': 1.968578816160075e-05, 'epoch': 0.22} {'loss': 0.547, 'learning_rate': 1.9685704596203755e-05, 'epoch': 0.22} {'loss': 0.5288, 'learning_rate': 1.968562101987344e-05, 'epoch': 0.22} {'loss': 0.6196, 'learning_rate': 1.96855374326099e-05, 'epoch': 0.22} {'loss': 0.5396, 'learning_rate': 1.968545383441323e-05, 'epoch': 0.22} {'loss': 0.6769, 'learning_rate': 1.968537022528352e-05, 'epoch': 0.22} {'loss': 0.4685, 'learning_rate': 1.9685286605220878e-05, 'epoch': 0.22} {'loss': 0.6176, 'learning_rate': 1.968520297422538e-05, 'epoch': 0.22} {'loss': 0.4701, 'learning_rate': 1.9685119332297135e-05, 'epoch': 0.22} {'loss': 0.4866, 'learning_rate': 1.968503567943623e-05, 'epoch': 0.22} {'loss': 0.5485, 'learning_rate': 1.9684952015642765e-05, 'epoch': 0.22} {'loss': 0.5363, 'learning_rate': 1.9684868340916827e-05, 'epoch': 0.22} {'loss': 0.6275, 'learning_rate': 1.9684784655258516e-05, 'epoch': 0.22} {'loss': 0.5673, 'learning_rate': 1.9684700958667924e-05, 'epoch': 0.22} {'loss': 0.4784, 'learning_rate': 1.9684617251145145e-05, 'epoch': 0.22} {'loss': 0.5499, 'learning_rate': 1.9684533532690277e-05, 'epoch': 0.22} {'loss': 0.6736, 'learning_rate': 1.9684449803303413e-05, 'epoch': 0.22} {'loss': 0.5867, 'learning_rate': 1.9684366062984643e-05, 'epoch': 0.22} {'loss': 0.6106, 'learning_rate': 1.9684282311734065e-05, 'epoch': 0.22} {'loss': 0.7043, 'learning_rate': 1.968419854955178e-05, 'epoch': 0.22} {'loss': 0.566, 'learning_rate': 1.968411477643787e-05, 'epoch': 0.22} {'loss': 0.6449, 'learning_rate': 1.968403099239244e-05, 'epoch': 0.22} {'loss': 0.6006, 'learning_rate': 1.968394719741558e-05, 'epoch': 0.22} {'loss': 0.5219, 'learning_rate': 1.968386339150738e-05, 'epoch': 0.22} {'loss': 0.5304, 'learning_rate': 1.9683779574667947e-05, 'epoch': 0.22} {'loss': 0.6444, 'learning_rate': 1.9683695746897365e-05, 'epoch': 0.22} {'loss': 0.5441, 'learning_rate': 1.968361190819573e-05, 'epoch': 0.22} {'loss': 0.496, 'learning_rate': 1.9683528058563142e-05, 'epoch': 0.22} {'loss': 0.5309, 'learning_rate': 1.968344419799969e-05, 'epoch': 0.22} {'loss': 0.5588, 'learning_rate': 1.968336032650547e-05, 'epoch': 0.22} {'loss': 0.5856, 'learning_rate': 1.968327644408058e-05, 'epoch': 0.22} {'loss': 0.7074, 'learning_rate': 1.968319255072511e-05, 'epoch': 0.22} {'loss': 0.4195, 'learning_rate': 1.968310864643916e-05, 'epoch': 0.22} {'loss': 0.6091, 'learning_rate': 1.9683024731222818e-05, 'epoch': 0.22} {'loss': 0.6738, 'learning_rate': 1.9682940805076187e-05, 'epoch': 0.22} {'loss': 0.6928, 'learning_rate': 1.9682856867999354e-05, 'epoch': 0.22} {'loss': 0.5224, 'learning_rate': 1.968277291999242e-05, 'epoch': 0.22} {'loss': 0.6558, 'learning_rate': 1.9682688961055475e-05, 'epoch': 0.22} {'loss': 0.5892, 'learning_rate': 1.9682604991188615e-05, 'epoch': 0.22} {'loss': 0.6332, 'learning_rate': 1.9682521010391933e-05, 'epoch': 0.22} {'loss': 0.6444, 'learning_rate': 1.9682437018665527e-05, 'epoch': 0.22} {'loss': 0.5433, 'learning_rate': 1.9682353016009493e-05, 'epoch': 0.22} {'loss': 0.5554, 'learning_rate': 1.968226900242392e-05, 'epoch': 0.22} {'loss': 0.7007, 'learning_rate': 1.9682184977908908e-05, 'epoch': 0.22} {'loss': 0.4877, 'learning_rate': 1.9682100942464554e-05, 'epoch': 0.22} {'loss': 0.5803, 'learning_rate': 1.9682016896090947e-05, 'epoch': 0.22} {'loss': 0.5946, 'learning_rate': 1.968193283878818e-05, 'epoch': 0.22} {'loss': 0.5155, 'learning_rate': 1.9681848770556355e-05, 'epoch': 0.22} {'loss': 0.5878, 'learning_rate': 1.9681764691395563e-05, 'epoch': 0.22} {'loss': 0.6322, 'learning_rate': 1.9681680601305904e-05, 'epoch': 0.22} {'loss': 0.533, 'learning_rate': 1.9681596500287465e-05, 'epoch': 0.22} {'loss': 0.5424, 'learning_rate': 1.968151238834034e-05, 'epoch': 0.22} {'loss': 0.5731, 'learning_rate': 1.9681428265464636e-05, 'epoch': 0.22} {'loss': 0.5117, 'learning_rate': 1.9681344131660438e-05, 'epoch': 0.22} {'loss': 0.4165, 'learning_rate': 1.9681259986927844e-05, 'epoch': 0.22} {'loss': 0.6132, 'learning_rate': 1.968117583126695e-05, 'epoch': 0.22} {'loss': 0.7092, 'learning_rate': 1.9681091664677845e-05, 'epoch': 0.22} {'loss': 0.7313, 'learning_rate': 1.968100748716063e-05, 'epoch': 0.22} {'loss': 0.5629, 'learning_rate': 1.96809232987154e-05, 'epoch': 0.22} {'loss': 0.6297, 'learning_rate': 1.968083909934225e-05, 'epoch': 0.22} {'loss': 0.6969, 'learning_rate': 1.968075488904127e-05, 'epoch': 0.22} {'loss': 0.5748, 'learning_rate': 1.9680670667812557e-05, 'epoch': 0.22} {'loss': 0.5237, 'learning_rate': 1.9680586435656212e-05, 'epoch': 0.22} {'loss': 0.6046, 'learning_rate': 1.9680502192572325e-05, 'epoch': 0.22} {'loss': 0.6798, 'learning_rate': 1.9680417938560992e-05, 'epoch': 0.22} {'loss': 0.5314, 'learning_rate': 1.9680333673622307e-05, 'epoch': 0.22} {'loss': 0.5299, 'learning_rate': 1.9680249397756364e-05, 'epoch': 0.22} {'loss': 0.445, 'learning_rate': 1.9680165110963264e-05, 'epoch': 0.22} {'loss': 0.6292, 'learning_rate': 1.96800808132431e-05, 'epoch': 0.22} {'loss': 0.6915, 'learning_rate': 1.967999650459596e-05, 'epoch': 0.22} {'loss': 0.7383, 'learning_rate': 1.9679912185021947e-05, 'epoch': 0.22} {'loss': 0.6945, 'learning_rate': 1.9679827854521154e-05, 'epoch': 0.22} {'loss': 0.4689, 'learning_rate': 1.9679743513093675e-05, 'epoch': 0.22} {'loss': 0.5915, 'learning_rate': 1.9679659160739608e-05, 'epoch': 0.22} {'loss': 0.3828, 'learning_rate': 1.9679574797459046e-05, 'epoch': 0.22} {'loss': 0.5656, 'learning_rate': 1.9679490423252084e-05, 'epoch': 0.22} {'loss': 0.4503, 'learning_rate': 1.9679406038118817e-05, 'epoch': 0.22} {'loss': 0.5544, 'learning_rate': 1.9679321642059343e-05, 'epoch': 0.22} {'loss': 0.5339, 'learning_rate': 1.9679237235073755e-05, 'epoch': 0.22} {'loss': 0.5227, 'learning_rate': 1.967915281716215e-05, 'epoch': 0.22} {'loss': 0.4856, 'learning_rate': 1.967906838832462e-05, 'epoch': 0.22} {'loss': 0.7405, 'learning_rate': 1.9678983948561263e-05, 'epoch': 0.22} {'loss': 0.63, 'learning_rate': 1.9678899497872176e-05, 'epoch': 0.22} {'loss': 0.5274, 'learning_rate': 1.967881503625745e-05, 'epoch': 0.22} {'loss': 0.7467, 'learning_rate': 1.967873056371718e-05, 'epoch': 0.22} {'loss': 0.4978, 'learning_rate': 1.9678646080251467e-05, 'epoch': 0.22} {'loss': 0.5442, 'learning_rate': 1.9678561585860402e-05, 'epoch': 0.22} {'loss': 0.7042, 'learning_rate': 1.967847708054408e-05, 'epoch': 0.22} {'loss': 0.6483, 'learning_rate': 1.96783925643026e-05, 'epoch': 0.22} {'loss': 0.5423, 'learning_rate': 1.9678308037136055e-05, 'epoch': 0.22} {'loss': 0.5887, 'learning_rate': 1.967822349904454e-05, 'epoch': 0.22} {'loss': 0.6104, 'learning_rate': 1.967813895002815e-05, 'epoch': 0.22} {'loss': 0.589, 'learning_rate': 1.967805439008698e-05, 'epoch': 0.22} {'loss': 0.6135, 'learning_rate': 1.967796981922113e-05, 'epoch': 0.22} {'loss': 0.4678, 'learning_rate': 1.9677885237430697e-05, 'epoch': 0.22} {'loss': 0.5671, 'learning_rate': 1.9677800644715767e-05, 'epoch': 0.22} {'loss': 0.4439, 'learning_rate': 1.967771604107644e-05, 'epoch': 0.22} {'loss': 0.5326, 'learning_rate': 1.967763142651281e-05, 'epoch': 0.22} {'loss': 0.5653, 'learning_rate': 1.967754680102498e-05, 'epoch': 0.22} {'loss': 0.5771, 'learning_rate': 1.9677462164613032e-05, 'epoch': 0.22} {'loss': 0.5161, 'learning_rate': 1.9677377517277074e-05, 'epoch': 0.22} {'loss': 0.5647, 'learning_rate': 1.96772928590172e-05, 'epoch': 0.22} {'loss': 0.5817, 'learning_rate': 1.9677208189833498e-05, 'epoch': 0.22} {'loss': 0.6282, 'learning_rate': 1.967712350972607e-05, 'epoch': 0.22} {'loss': 0.6493, 'learning_rate': 1.9677038818695008e-05, 'epoch': 0.22} {'loss': 0.7046, 'learning_rate': 1.967695411674041e-05, 'epoch': 0.22} {'loss': 0.6504, 'learning_rate': 1.9676869403862375e-05, 'epoch': 0.22} {'loss': 0.5275, 'learning_rate': 1.967678468006099e-05, 'epoch': 0.22} {'loss': 0.5458, 'learning_rate': 1.9676699945336354e-05, 'epoch': 0.22} {'loss': 0.4936, 'learning_rate': 1.9676615199688568e-05, 'epoch': 0.22} {'loss': 0.5819, 'learning_rate': 1.9676530443117723e-05, 'epoch': 0.22} {'loss': 0.5064, 'learning_rate': 1.9676445675623914e-05, 'epoch': 0.22} {'loss': 0.6268, 'learning_rate': 1.967636089720724e-05, 'epoch': 0.22} {'loss': 0.7092, 'learning_rate': 1.967627610786779e-05, 'epoch': 0.22} {'loss': 0.5131, 'learning_rate': 1.9676191307605668e-05, 'epoch': 0.22} {'loss': 0.6339, 'learning_rate': 1.9676106496420965e-05, 'epoch': 0.22} {'loss': 0.4877, 'learning_rate': 1.9676021674313778e-05, 'epoch': 0.22} {'loss': 0.5326, 'learning_rate': 1.9675936841284203e-05, 'epoch': 0.22} {'loss': 0.5362, 'learning_rate': 1.9675851997332335e-05, 'epoch': 0.22} {'loss': 0.5385, 'learning_rate': 1.967576714245827e-05, 'epoch': 0.22} {'loss': 0.4651, 'learning_rate': 1.9675682276662102e-05, 'epoch': 0.22} {'loss': 0.6478, 'learning_rate': 1.967559739994393e-05, 'epoch': 0.22} {'loss': 0.5535, 'learning_rate': 1.967551251230385e-05, 'epoch': 0.22} {'loss': 0.5735, 'learning_rate': 1.9675427613741952e-05, 'epoch': 0.22} {'loss': 0.6668, 'learning_rate': 1.967534270425834e-05, 'epoch': 0.22} {'loss': 0.5193, 'learning_rate': 1.9675257783853102e-05, 'epoch': 0.22} {'loss': 0.5464, 'learning_rate': 1.9675172852526343e-05, 'epoch': 0.22} {'loss': 0.5382, 'learning_rate': 1.967508791027815e-05, 'epoch': 0.22} {'loss': 0.5533, 'learning_rate': 1.9675002957108625e-05, 'epoch': 0.22} {'loss': 0.476, 'learning_rate': 1.9674917993017863e-05, 'epoch': 0.22} {'loss': 0.5468, 'learning_rate': 1.9674833018005956e-05, 'epoch': 0.22} {'loss': 0.5384, 'learning_rate': 1.9674748032073e-05, 'epoch': 0.22} {'loss': 0.5613, 'learning_rate': 1.9674663035219093e-05, 'epoch': 0.22} {'loss': 0.6525, 'learning_rate': 1.9674578027444335e-05, 'epoch': 0.22} {'loss': 0.7156, 'learning_rate': 1.9674493008748817e-05, 'epoch': 0.22} {'loss': 0.5328, 'learning_rate': 1.9674407979132636e-05, 'epoch': 0.22} {'loss': 0.6867, 'learning_rate': 1.9674322938595883e-05, 'epoch': 0.22} {'loss': 0.3964, 'learning_rate': 1.9674237887138666e-05, 'epoch': 0.22} {'loss': 0.6725, 'learning_rate': 1.9674152824761074e-05, 'epoch': 0.22} {'loss': 0.562, 'learning_rate': 1.9674067751463197e-05, 'epoch': 0.22} {'loss': 0.4688, 'learning_rate': 1.9673982667245145e-05, 'epoch': 0.22} {'loss': 0.7054, 'learning_rate': 1.9673897572106998e-05, 'epoch': 0.22} {'loss': 0.4517, 'learning_rate': 1.9673812466048865e-05, 'epoch': 0.22} {'loss': 0.5909, 'learning_rate': 1.9673727349070838e-05, 'epoch': 0.22} {'loss': 0.5191, 'learning_rate': 1.967364222117301e-05, 'epoch': 0.22} {'loss': 0.5223, 'learning_rate': 1.9673557082355482e-05, 'epoch': 0.22} {'loss': 0.4647, 'learning_rate': 1.9673471932618343e-05, 'epoch': 0.22} {'loss': 0.6353, 'learning_rate': 1.9673386771961697e-05, 'epoch': 0.22} {'loss': 0.6561, 'learning_rate': 1.9673301600385636e-05, 'epoch': 0.22} {'loss': 0.5937, 'learning_rate': 1.9673216417890258e-05, 'epoch': 0.22} {'loss': 0.6985, 'learning_rate': 1.967313122447566e-05, 'epoch': 0.22} {'loss': 0.5075, 'learning_rate': 1.9673046020141934e-05, 'epoch': 0.22} {'loss': 0.3601, 'learning_rate': 1.9672960804889175e-05, 'epoch': 0.22} {'loss': 0.6514, 'learning_rate': 1.9672875578717488e-05, 'epoch': 0.22} {'loss': 0.4835, 'learning_rate': 1.967279034162696e-05, 'epoch': 0.22} {'loss': 0.7147, 'learning_rate': 1.9672705093617696e-05, 'epoch': 0.22} {'loss': 0.6248, 'learning_rate': 1.967261983468978e-05, 'epoch': 0.22} {'loss': 0.7633, 'learning_rate': 1.9672534564843323e-05, 'epoch': 0.22} {'loss': 0.6458, 'learning_rate': 1.967244928407841e-05, 'epoch': 0.22} {'loss': 0.6747, 'learning_rate': 1.967236399239514e-05, 'epoch': 0.22} {'loss': 0.5045, 'learning_rate': 1.967227868979361e-05, 'epoch': 0.22} {'loss': 0.5893, 'learning_rate': 1.967219337627392e-05, 'epoch': 0.22} {'loss': 0.5196, 'learning_rate': 1.967210805183616e-05, 'epoch': 0.22} {'loss': 0.7482, 'learning_rate': 1.967202271648043e-05, 'epoch': 0.22} {'loss': 0.5376, 'learning_rate': 1.9671937370206827e-05, 'epoch': 0.22} {'loss': 0.5299, 'learning_rate': 1.9671852013015446e-05, 'epoch': 0.22} {'loss': 0.3904, 'learning_rate': 1.9671766644906384e-05, 'epoch': 0.22} {'loss': 0.63, 'learning_rate': 1.9671681265879734e-05, 'epoch': 0.22} {'loss': 0.5772, 'learning_rate': 1.9671595875935595e-05, 'epoch': 0.22} {'loss': 0.6076, 'learning_rate': 1.9671510475074065e-05, 'epoch': 0.22} {'loss': 0.5866, 'learning_rate': 1.9671425063295236e-05, 'epoch': 0.22} {'loss': 0.6515, 'learning_rate': 1.9671339640599213e-05, 'epoch': 0.22} {'loss': 0.5395, 'learning_rate': 1.967125420698608e-05, 'epoch': 0.22} {'loss': 0.6277, 'learning_rate': 1.9671168762455943e-05, 'epoch': 0.22} {'loss': 0.5362, 'learning_rate': 1.9671083307008897e-05, 'epoch': 0.22} {'loss': 0.5878, 'learning_rate': 1.9670997840645035e-05, 'epoch': 0.22} {'loss': 0.4415, 'learning_rate': 1.9670912363364457e-05, 'epoch': 0.22} {'loss': 0.5434, 'learning_rate': 1.9670826875167258e-05, 'epoch': 0.22} {'loss': 0.4887, 'learning_rate': 1.967074137605353e-05, 'epoch': 0.22} {'loss': 0.4866, 'learning_rate': 1.9670655866023377e-05, 'epoch': 0.22} {'loss': 0.7046, 'learning_rate': 1.9670570345076895e-05, 'epoch': 0.22} {'loss': 0.5492, 'learning_rate': 1.9670484813214178e-05, 'epoch': 0.22} {'loss': 0.4593, 'learning_rate': 1.9670399270435317e-05, 'epoch': 0.22} {'loss': 0.385, 'learning_rate': 1.9670313716740417e-05, 'epoch': 0.22} {'loss': 0.6484, 'learning_rate': 1.9670228152129574e-05, 'epoch': 0.22} {'loss': 0.4755, 'learning_rate': 1.967014257660288e-05, 'epoch': 0.22} {'loss': 0.6016, 'learning_rate': 1.9670056990160437e-05, 'epoch': 0.22} {'loss': 0.7228, 'learning_rate': 1.9669971392802334e-05, 'epoch': 0.22} {'loss': 0.5987, 'learning_rate': 1.9669885784528674e-05, 'epoch': 0.22} {'loss': 0.7954, 'learning_rate': 1.9669800165339553e-05, 'epoch': 0.22} {'loss': 0.6277, 'learning_rate': 1.9669714535235065e-05, 'epoch': 0.22} {'loss': 0.622, 'learning_rate': 1.966962889421531e-05, 'epoch': 0.22} {'loss': 0.5205, 'learning_rate': 1.966954324228038e-05, 'epoch': 0.22} {'loss': 0.635, 'learning_rate': 1.9669457579430375e-05, 'epoch': 0.22} {'loss': 0.602, 'learning_rate': 1.9669371905665394e-05, 'epoch': 0.22} {'loss': 0.58, 'learning_rate': 1.9669286220985526e-05, 'epoch': 0.22} {'loss': 0.5608, 'learning_rate': 1.9669200525390876e-05, 'epoch': 0.22} {'loss': 0.6289, 'learning_rate': 1.9669114818881536e-05, 'epoch': 0.22} {'loss': 0.5042, 'learning_rate': 1.9669029101457603e-05, 'epoch': 0.22} {'loss': 0.5731, 'learning_rate': 1.9668943373119177e-05, 'epoch': 0.22} {'loss': 0.5625, 'learning_rate': 1.9668857633866355e-05, 'epoch': 0.22} {'loss': 0.5683, 'learning_rate': 1.9668771883699226e-05, 'epoch': 0.22} {'loss': 0.4236, 'learning_rate': 1.9668686122617894e-05, 'epoch': 0.22} {'loss': 0.5051, 'learning_rate': 1.9668600350622455e-05, 'epoch': 0.22} {'loss': 0.5715, 'learning_rate': 1.9668514567713003e-05, 'epoch': 0.22} {'loss': 0.4292, 'learning_rate': 1.966842877388964e-05, 'epoch': 0.22} {'loss': 0.5729, 'learning_rate': 1.9668342969152453e-05, 'epoch': 0.22} {'loss': 0.5793, 'learning_rate': 1.9668257153501552e-05, 'epoch': 0.22} {'loss': 0.8185, 'learning_rate': 1.9668171326937025e-05, 'epoch': 0.22} {'loss': 0.6805, 'learning_rate': 1.966808548945897e-05, 'epoch': 0.22} {'loss': 0.5668, 'learning_rate': 1.9667999641067487e-05, 'epoch': 0.22} {'loss': 0.5389, 'learning_rate': 1.9667913781762666e-05, 'epoch': 0.22} {'loss': 0.4464, 'learning_rate': 1.9667827911544615e-05, 'epoch': 0.22} {'loss': 0.4755, 'learning_rate': 1.9667742030413422e-05, 'epoch': 0.22} {'loss': 0.6004, 'learning_rate': 1.9667656138369186e-05, 'epoch': 0.22} {'loss': 0.5646, 'learning_rate': 1.9667570235412007e-05, 'epoch': 0.22} {'loss': 0.5163, 'learning_rate': 1.9667484321541974e-05, 'epoch': 0.22} {'loss': 0.643, 'learning_rate': 1.9667398396759193e-05, 'epoch': 0.22} {'loss': 0.5478, 'learning_rate': 1.966731246106376e-05, 'epoch': 0.22} {'loss': 0.5885, 'learning_rate': 1.9667226514455765e-05, 'epoch': 0.22} {'loss': 0.4254, 'learning_rate': 1.9667140556935313e-05, 'epoch': 0.22} {'loss': 0.5691, 'learning_rate': 1.9667054588502497e-05, 'epoch': 0.22} {'loss': 0.5349, 'learning_rate': 1.9666968609157414e-05, 'epoch': 0.22} {'loss': 0.5026, 'learning_rate': 1.966688261890016e-05, 'epoch': 0.22} {'loss': 0.5942, 'learning_rate': 1.9666796617730837e-05, 'epoch': 0.22} {'loss': 0.7716, 'learning_rate': 1.966671060564954e-05, 'epoch': 0.22} {'loss': 0.4369, 'learning_rate': 1.966662458265636e-05, 'epoch': 0.22} {'loss': 0.3774, 'learning_rate': 1.9666538548751402e-05, 'epoch': 0.22} {'loss': 0.5968, 'learning_rate': 1.966645250393476e-05, 'epoch': 0.22} {'loss': 0.6022, 'learning_rate': 1.966636644820653e-05, 'epoch': 0.22} {'loss': 0.6206, 'learning_rate': 1.966628038156681e-05, 'epoch': 0.22} {'loss': 0.6638, 'learning_rate': 1.9666194304015702e-05, 'epoch': 0.22} {'loss': 0.5242, 'learning_rate': 1.9666108215553293e-05, 'epoch': 0.22} {'loss': 0.4534, 'learning_rate': 1.966602211617969e-05, 'epoch': 0.22} {'loss': 0.4302, 'learning_rate': 1.9665936005894986e-05, 'epoch': 0.22} {'loss': 0.5995, 'learning_rate': 1.9665849884699274e-05, 'epoch': 0.22} {'loss': 0.4826, 'learning_rate': 1.9665763752592663e-05, 'epoch': 0.22} {'loss': 0.5772, 'learning_rate': 1.9665677609575237e-05, 'epoch': 0.22} {'loss': 0.7332, 'learning_rate': 1.96655914556471e-05, 'epoch': 0.22} {'loss': 0.6513, 'learning_rate': 1.9665505290808346e-05, 'epoch': 0.22} {'loss': 0.626, 'learning_rate': 1.966541911505908e-05, 'epoch': 0.22} {'loss': 0.5199, 'learning_rate': 1.966533292839939e-05, 'epoch': 0.22} {'loss': 0.5963, 'learning_rate': 1.9665246730829377e-05, 'epoch': 0.22} {'loss': 0.6032, 'learning_rate': 1.9665160522349142e-05, 'epoch': 0.22} {'loss': 0.4999, 'learning_rate': 1.9665074302958774e-05, 'epoch': 0.22} {'loss': 0.5469, 'learning_rate': 1.9664988072658377e-05, 'epoch': 0.22} {'loss': 0.4965, 'learning_rate': 1.9664901831448047e-05, 'epoch': 0.22} {'loss': 0.4494, 'learning_rate': 1.966481557932788e-05, 'epoch': 0.22} {'loss': 0.546, 'learning_rate': 1.9664729316297973e-05, 'epoch': 0.22} {'loss': 0.529, 'learning_rate': 1.9664643042358426e-05, 'epoch': 0.22} {'loss': 0.619, 'learning_rate': 1.9664556757509335e-05, 'epoch': 0.22} {'loss': 0.8543, 'learning_rate': 1.9664470461750795e-05, 'epoch': 0.22} {'loss': 0.7057, 'learning_rate': 1.9664384155082907e-05, 'epoch': 0.22} {'loss': 0.488, 'learning_rate': 1.9664297837505767e-05, 'epoch': 0.22} {'loss': 0.5091, 'learning_rate': 1.9664211509019477e-05, 'epoch': 0.22} {'loss': 0.7871, 'learning_rate': 1.9664125169624123e-05, 'epoch': 0.22} {'loss': 0.5732, 'learning_rate': 1.9664038819319812e-05, 'epoch': 0.22} {'loss': 0.5941, 'learning_rate': 1.9663952458106638e-05, 'epoch': 0.22} {'loss': 0.602, 'learning_rate': 1.96638660859847e-05, 'epoch': 0.22} {'loss': 0.6178, 'learning_rate': 1.9663779702954095e-05, 'epoch': 0.22} {'loss': 0.562, 'learning_rate': 1.9663693309014923e-05, 'epoch': 0.22} {'loss': 0.6046, 'learning_rate': 1.9663606904167273e-05, 'epoch': 0.22} {'loss': 0.3662, 'learning_rate': 1.9663520488411253e-05, 'epoch': 0.22} {'loss': 0.6482, 'learning_rate': 1.9663434061746955e-05, 'epoch': 0.22} {'loss': 0.4849, 'learning_rate': 1.966334762417448e-05, 'epoch': 0.22} {'loss': 0.6653, 'learning_rate': 1.9663261175693917e-05, 'epoch': 0.22} {'loss': 0.5166, 'learning_rate': 1.9663174716305376e-05, 'epoch': 0.22} {'loss': 0.6434, 'learning_rate': 1.9663088246008944e-05, 'epoch': 0.22} {'loss': 0.6885, 'learning_rate': 1.9663001764804724e-05, 'epoch': 0.22} {'loss': 0.421, 'learning_rate': 1.9662915272692813e-05, 'epoch': 0.22} {'loss': 0.5436, 'learning_rate': 1.9662828769673307e-05, 'epoch': 0.22} {'loss': 0.6387, 'learning_rate': 1.9662742255746307e-05, 'epoch': 0.22} {'loss': 0.7001, 'learning_rate': 1.9662655730911907e-05, 'epoch': 0.22} {'loss': 0.5577, 'learning_rate': 1.9662569195170207e-05, 'epoch': 0.22} {'loss': 0.5746, 'learning_rate': 1.9662482648521304e-05, 'epoch': 0.22} {'loss': 0.3777, 'learning_rate': 1.9662396090965293e-05, 'epoch': 0.22} {'loss': 0.531, 'learning_rate': 1.9662309522502276e-05, 'epoch': 0.22} {'loss': 0.6295, 'learning_rate': 1.966222294313235e-05, 'epoch': 0.22} {'loss': 0.4408, 'learning_rate': 1.966213635285561e-05, 'epoch': 0.22} {'loss': 0.5209, 'learning_rate': 1.9662049751672155e-05, 'epoch': 0.22} {'loss': 0.643, 'learning_rate': 1.9661963139582086e-05, 'epoch': 0.22} {'loss': 0.6282, 'learning_rate': 1.9661876516585493e-05, 'epoch': 0.22} {'loss': 0.6355, 'learning_rate': 1.9661789882682482e-05, 'epoch': 0.22} {'loss': 0.6029, 'learning_rate': 1.966170323787315e-05, 'epoch': 0.22} {'loss': 0.6291, 'learning_rate': 1.9661616582157585e-05, 'epoch': 0.22} {'loss': 0.5457, 'learning_rate': 1.9661529915535897e-05, 'epoch': 0.22} {'loss': 0.5849, 'learning_rate': 1.966144323800818e-05, 'epoch': 0.22} {'loss': 0.4772, 'learning_rate': 1.966135654957453e-05, 'epoch': 0.22} {'loss': 0.5569, 'learning_rate': 1.9661269850235043e-05, 'epoch': 0.22} {'loss': 0.73, 'learning_rate': 1.9661183139989824e-05, 'epoch': 0.22} {'loss': 0.5526, 'learning_rate': 1.9661096418838964e-05, 'epoch': 0.22} {'loss': 0.5865, 'learning_rate': 1.966100968678256e-05, 'epoch': 0.22} {'loss': 0.651, 'learning_rate': 1.9660922943820716e-05, 'epoch': 0.22} {'loss': 0.6963, 'learning_rate': 1.9660836189953527e-05, 'epoch': 0.22} {'loss': 0.545, 'learning_rate': 1.9660749425181094e-05, 'epoch': 0.22} {'loss': 0.5534, 'learning_rate': 1.9660662649503508e-05, 'epoch': 0.22} {'loss': 0.586, 'learning_rate': 1.966057586292087e-05, 'epoch': 0.22} {'loss': 0.5369, 'learning_rate': 1.9660489065433284e-05, 'epoch': 0.22} {'loss': 0.5715, 'learning_rate': 1.966040225704084e-05, 'epoch': 0.22} {'loss': 0.4442, 'learning_rate': 1.966031543774364e-05, 'epoch': 0.22} {'loss': 0.5006, 'learning_rate': 1.966022860754178e-05, 'epoch': 0.22} {'loss': 0.5311, 'learning_rate': 1.9660141766435357e-05, 'epoch': 0.22} {'loss': 0.5928, 'learning_rate': 1.9660054914424473e-05, 'epoch': 0.22} {'loss': 0.546, 'learning_rate': 1.9659968051509223e-05, 'epoch': 0.22} {'loss': 0.652, 'learning_rate': 1.9659881177689707e-05, 'epoch': 0.22} {'loss': 0.6207, 'learning_rate': 1.965979429296602e-05, 'epoch': 0.22} {'loss': 0.5979, 'learning_rate': 1.9659707397338266e-05, 'epoch': 0.22} {'loss': 0.5828, 'learning_rate': 1.9659620490806538e-05, 'epoch': 0.22} {'loss': 0.5281, 'learning_rate': 1.965953357337093e-05, 'epoch': 0.22} {'loss': 0.5117, 'learning_rate': 1.9659446645031554e-05, 'epoch': 0.22} {'loss': 0.5313, 'learning_rate': 1.9659359705788494e-05, 'epoch': 0.22} {'loss': 0.6013, 'learning_rate': 1.9659272755641857e-05, 'epoch': 0.22} {'loss': 0.43, 'learning_rate': 1.9659185794591734e-05, 'epoch': 0.22} {'loss': 0.7095, 'learning_rate': 1.965909882263823e-05, 'epoch': 0.22} {'loss': 0.599, 'learning_rate': 1.9659011839781437e-05, 'epoch': 0.22} {'loss': 0.6491, 'learning_rate': 1.965892484602146e-05, 'epoch': 0.22} {'loss': 0.7624, 'learning_rate': 1.965883784135839e-05, 'epoch': 0.22} {'loss': 0.5268, 'learning_rate': 1.965875082579233e-05, 'epoch': 0.22} {'loss': 0.7148, 'learning_rate': 1.965866379932338e-05, 'epoch': 0.22} {'loss': 0.6025, 'learning_rate': 1.9658576761951635e-05, 'epoch': 0.22} {'loss': 0.5927, 'learning_rate': 1.965848971367719e-05, 'epoch': 0.22} {'loss': 0.6141, 'learning_rate': 1.9658402654500146e-05, 'epoch': 0.22} {'loss': 0.517, 'learning_rate': 1.9658315584420603e-05, 'epoch': 0.22} {'loss': 0.4259, 'learning_rate': 1.9658228503438665e-05, 'epoch': 0.22} {'loss': 0.7826, 'learning_rate': 1.9658141411554416e-05, 'epoch': 0.22} {'loss': 0.4666, 'learning_rate': 1.9658054308767963e-05, 'epoch': 0.22} {'loss': 0.7202, 'learning_rate': 1.9657967195079406e-05, 'epoch': 0.22} {'loss': 0.6199, 'learning_rate': 1.9657880070488837e-05, 'epoch': 0.22} {'loss': 0.4627, 'learning_rate': 1.965779293499636e-05, 'epoch': 0.22} {'loss': 0.659, 'learning_rate': 1.965770578860207e-05, 'epoch': 0.22} {'loss': 0.55, 'learning_rate': 1.965761863130607e-05, 'epoch': 0.22} {'loss': 0.6822, 'learning_rate': 1.965753146310845e-05, 'epoch': 0.22} {'loss': 0.5552, 'learning_rate': 1.965744428400932e-05, 'epoch': 0.22} {'loss': 0.7857, 'learning_rate': 1.965735709400877e-05, 'epoch': 0.22} {'loss': 0.5788, 'learning_rate': 1.9657269893106895e-05, 'epoch': 0.22} {'loss': 0.3866, 'learning_rate': 1.9657182681303805e-05, 'epoch': 0.22} {'loss': 0.6372, 'learning_rate': 1.9657095458599587e-05, 'epoch': 0.22} {'loss': 0.6254, 'learning_rate': 1.9657008224994347e-05, 'epoch': 0.22} {'loss': 0.4916, 'learning_rate': 1.9656920980488185e-05, 'epoch': 0.22} {'loss': 0.5575, 'learning_rate': 1.9656833725081187e-05, 'epoch': 0.22} {'loss': 0.6027, 'learning_rate': 1.9656746458773465e-05, 'epoch': 0.22} {'loss': 0.4805, 'learning_rate': 1.9656659181565113e-05, 'epoch': 0.22} {'loss': 0.5141, 'learning_rate': 1.965657189345623e-05, 'epoch': 0.22} {'loss': 0.6539, 'learning_rate': 1.9656484594446913e-05, 'epoch': 0.22} {'loss': 0.6792, 'learning_rate': 1.9656397284537258e-05, 'epoch': 0.22} {'loss': 0.533, 'learning_rate': 1.965630996372737e-05, 'epoch': 0.22} {'loss': 0.5141, 'learning_rate': 1.965622263201734e-05, 'epoch': 0.22} {'loss': 0.4861, 'learning_rate': 1.9656135289407277e-05, 'epoch': 0.22} {'loss': 0.5739, 'learning_rate': 1.965604793589727e-05, 'epoch': 0.22} {'loss': 0.6746, 'learning_rate': 1.965596057148742e-05, 'epoch': 0.22} {'loss': 0.5683, 'learning_rate': 1.9655873196177827e-05, 'epoch': 0.22} {'loss': 0.5243, 'learning_rate': 1.965578580996859e-05, 'epoch': 0.22} {'loss': 0.4505, 'learning_rate': 1.965569841285981e-05, 'epoch': 0.22} {'loss': 0.503, 'learning_rate': 1.9655611004851576e-05, 'epoch': 0.22} {'loss': 0.5452, 'learning_rate': 1.9655523585944e-05, 'epoch': 0.22} {'loss': 0.6626, 'learning_rate': 1.9655436156137175e-05, 'epoch': 0.22} {'loss': 0.6425, 'learning_rate': 1.965534871543119e-05, 'epoch': 0.22} {'loss': 0.7578, 'learning_rate': 1.9655261263826156e-05, 'epoch': 0.22} {'loss': 0.6033, 'learning_rate': 1.965517380132217e-05, 'epoch': 0.22} {'loss': 0.5237, 'learning_rate': 1.965508632791933e-05, 'epoch': 0.22} {'loss': 0.5821, 'learning_rate': 1.9654998843617733e-05, 'epoch': 0.22} {'loss': 0.3087, 'learning_rate': 1.9654911348417476e-05, 'epoch': 0.22} {'loss': 0.6503, 'learning_rate': 1.9654823842318663e-05, 'epoch': 0.22} {'loss': 0.6334, 'learning_rate': 1.9654736325321386e-05, 'epoch': 0.22} {'loss': 0.5223, 'learning_rate': 1.965464879742575e-05, 'epoch': 0.22} {'loss': 0.4876, 'learning_rate': 1.965456125863185e-05, 'epoch': 0.22} {'loss': 0.5951, 'learning_rate': 1.9654473708939786e-05, 'epoch': 0.22} {'loss': 0.5725, 'learning_rate': 1.965438614834966e-05, 'epoch': 0.22} {'loss': 0.5694, 'learning_rate': 1.9654298576861567e-05, 'epoch': 0.22} {'loss': 0.5684, 'learning_rate': 1.9654210994475603e-05, 'epoch': 0.22} {'loss': 0.6558, 'learning_rate': 1.9654123401191875e-05, 'epoch': 0.22} {'loss': 0.6126, 'learning_rate': 1.9654035797010476e-05, 'epoch': 0.22} {'loss': 0.6303, 'learning_rate': 1.9653948181931506e-05, 'epoch': 0.22} {'loss': 0.4627, 'learning_rate': 1.9653860555955065e-05, 'epoch': 0.22} {'loss': 0.492, 'learning_rate': 1.965377291908125e-05, 'epoch': 0.22} {'loss': 0.4564, 'learning_rate': 1.9653685271310162e-05, 'epoch': 0.22} {'loss': 0.6294, 'learning_rate': 1.9653597612641898e-05, 'epoch': 0.23} {'loss': 0.6735, 'learning_rate': 1.9653509943076562e-05, 'epoch': 0.23} {'loss': 0.593, 'learning_rate': 1.9653422262614245e-05, 'epoch': 0.23} {'loss': 0.4806, 'learning_rate': 1.965333457125505e-05, 'epoch': 0.23} {'loss': 0.4098, 'learning_rate': 1.9653246868999076e-05, 'epoch': 0.23} {'loss': 0.526, 'learning_rate': 1.9653159155846423e-05, 'epoch': 0.23} {'loss': 0.5601, 'learning_rate': 1.965307143179719e-05, 'epoch': 0.23} {'loss': 0.6089, 'learning_rate': 1.9652983696851475e-05, 'epoch': 0.23} {'loss': 0.5246, 'learning_rate': 1.9652895951009375e-05, 'epoch': 0.23} {'loss': 0.4127, 'learning_rate': 1.9652808194270992e-05, 'epoch': 0.23} {'loss': 0.6213, 'learning_rate': 1.965272042663642e-05, 'epoch': 0.23} {'loss': 0.7153, 'learning_rate': 1.965263264810577e-05, 'epoch': 0.23} {'loss': 0.6721, 'learning_rate': 1.9652544858679127e-05, 'epoch': 0.23} {'loss': 0.6252, 'learning_rate': 1.96524570583566e-05, 'epoch': 0.23} {'loss': 0.5261, 'learning_rate': 1.965236924713828e-05, 'epoch': 0.23} {'loss': 0.6125, 'learning_rate': 1.9652281425024277e-05, 'epoch': 0.23} {'loss': 0.4822, 'learning_rate': 1.965219359201468e-05, 'epoch': 0.23} {'loss': 0.6529, 'learning_rate': 1.9652105748109594e-05, 'epoch': 0.23} {'loss': 0.5541, 'learning_rate': 1.9652017893309116e-05, 'epoch': 0.23} {'loss': 0.5829, 'learning_rate': 1.965193002761334e-05, 'epoch': 0.23} {'loss': 0.4916, 'learning_rate': 1.9651842151022375e-05, 'epoch': 0.23} {'loss': 0.4276, 'learning_rate': 1.9651754263536315e-05, 'epoch': 0.23} {'loss': 0.4196, 'learning_rate': 1.9651666365155257e-05, 'epoch': 0.23} {'loss': 0.4832, 'learning_rate': 1.965157845587931e-05, 'epoch': 0.23} {'loss': 0.5277, 'learning_rate': 1.9651490535708558e-05, 'epoch': 0.23} {'loss': 0.4069, 'learning_rate': 1.9651402604643114e-05, 'epoch': 0.23} {'loss': 0.7439, 'learning_rate': 1.965131466268307e-05, 'epoch': 0.23} {'loss': 0.5082, 'learning_rate': 1.9651226709828525e-05, 'epoch': 0.23} {'loss': 0.6113, 'learning_rate': 1.9651138746079582e-05, 'epoch': 0.23} {'loss': 0.622, 'learning_rate': 1.9651050771436343e-05, 'epoch': 0.23} {'loss': 0.6529, 'learning_rate': 1.9650962785898895e-05, 'epoch': 0.23} {'loss': 0.6269, 'learning_rate': 1.965087478946735e-05, 'epoch': 0.23} {'loss': 0.4989, 'learning_rate': 1.96507867821418e-05, 'epoch': 0.23} {'loss': 0.4826, 'learning_rate': 1.965069876392235e-05, 'epoch': 0.23} {'loss': 0.4584, 'learning_rate': 1.9650610734809093e-05, 'epoch': 0.23} {'loss': 0.7346, 'learning_rate': 1.9650522694802134e-05, 'epoch': 0.23} {'loss': 0.6477, 'learning_rate': 1.9650434643901572e-05, 'epoch': 0.23} {'loss': 0.6155, 'learning_rate': 1.9650346582107502e-05, 'epoch': 0.23} {'loss': 0.5263, 'learning_rate': 1.9650258509420027e-05, 'epoch': 0.23} {'loss': 0.4844, 'learning_rate': 1.965017042583924e-05, 'epoch': 0.23} {'loss': 0.5514, 'learning_rate': 1.965008233136525e-05, 'epoch': 0.23} {'loss': 0.6213, 'learning_rate': 1.9649994225998152e-05, 'epoch': 0.23} {'loss': 0.5766, 'learning_rate': 1.9649906109738047e-05, 'epoch': 0.23} {'loss': 0.7028, 'learning_rate': 1.964981798258503e-05, 'epoch': 0.23} {'loss': 0.5889, 'learning_rate': 1.9649729844539206e-05, 'epoch': 0.23} {'loss': 0.3955, 'learning_rate': 1.964964169560067e-05, 'epoch': 0.23} {'loss': 0.5526, 'learning_rate': 1.9649553535769522e-05, 'epoch': 0.23} {'loss': 0.4141, 'learning_rate': 1.9649465365045867e-05, 'epoch': 0.23} {'loss': 0.4435, 'learning_rate': 1.9649377183429798e-05, 'epoch': 0.23} {'loss': 0.5948, 'learning_rate': 1.9649288990921418e-05, 'epoch': 0.23} {'loss': 0.4227, 'learning_rate': 1.9649200787520827e-05, 'epoch': 0.23} {'loss': 0.4768, 'learning_rate': 1.9649112573228118e-05, 'epoch': 0.23} {'loss': 0.617, 'learning_rate': 1.9649024348043402e-05, 'epoch': 0.23} {'loss': 0.4842, 'learning_rate': 1.964893611196677e-05, 'epoch': 0.23} {'loss': 0.5128, 'learning_rate': 1.9648847864998322e-05, 'epoch': 0.23} {'loss': 0.5326, 'learning_rate': 1.9648759607138165e-05, 'epoch': 0.23} {'loss': 0.5868, 'learning_rate': 1.9648671338386387e-05, 'epoch': 0.23} {'loss': 0.4906, 'learning_rate': 1.9648583058743097e-05, 'epoch': 0.23} {'loss': 0.5771, 'learning_rate': 1.964849476820839e-05, 'epoch': 0.23} {'loss': 0.5407, 'learning_rate': 1.9648406466782367e-05, 'epoch': 0.23} {'loss': 0.6222, 'learning_rate': 1.964831815446513e-05, 'epoch': 0.23} {'loss': 0.5308, 'learning_rate': 1.9648229831256774e-05, 'epoch': 0.23} {'loss': 0.4821, 'learning_rate': 1.96481414971574e-05, 'epoch': 0.23} {'loss': 0.5209, 'learning_rate': 1.9648053152167115e-05, 'epoch': 0.23} {'loss': 0.7195, 'learning_rate': 1.9647964796286008e-05, 'epoch': 0.23} {'loss': 0.7139, 'learning_rate': 1.9647876429514185e-05, 'epoch': 0.23} {'loss': 0.5255, 'learning_rate': 1.9647788051851744e-05, 'epoch': 0.23} {'loss': 0.57, 'learning_rate': 1.9647699663298784e-05, 'epoch': 0.23} {'loss': 0.3278, 'learning_rate': 1.9647611263855406e-05, 'epoch': 0.23} {'loss': 0.5188, 'learning_rate': 1.964752285352171e-05, 'epoch': 0.23} {'loss': 0.4928, 'learning_rate': 1.9647434432297797e-05, 'epoch': 0.23} {'loss': 0.4511, 'learning_rate': 1.964734600018376e-05, 'epoch': 0.23} {'loss': 0.4509, 'learning_rate': 1.9647257557179706e-05, 'epoch': 0.23} {'loss': 0.5741, 'learning_rate': 1.9647169103285736e-05, 'epoch': 0.23} {'loss': 0.4858, 'learning_rate': 1.9647080638501942e-05, 'epoch': 0.23} {'loss': 0.4104, 'learning_rate': 1.9646992162828435e-05, 'epoch': 0.23} {'loss': 0.6161, 'learning_rate': 1.96469036762653e-05, 'epoch': 0.23} {'loss': 0.5938, 'learning_rate': 1.9646815178812647e-05, 'epoch': 0.23} {'loss': 0.7025, 'learning_rate': 1.964672667047058e-05, 'epoch': 0.23} {'loss': 0.5365, 'learning_rate': 1.964663815123919e-05, 'epoch': 0.23} {'loss': 0.7122, 'learning_rate': 1.9646549621118577e-05, 'epoch': 0.23} {'loss': 0.6305, 'learning_rate': 1.9646461080108845e-05, 'epoch': 0.23} {'loss': 0.6008, 'learning_rate': 1.9646372528210094e-05, 'epoch': 0.23} {'loss': 0.5893, 'learning_rate': 1.9646283965422423e-05, 'epoch': 0.23} {'loss': 0.6071, 'learning_rate': 1.964619539174593e-05, 'epoch': 0.23} {'loss': 0.6641, 'learning_rate': 1.964610680718072e-05, 'epoch': 0.23} {'loss': 0.4186, 'learning_rate': 1.9646018211726887e-05, 'epoch': 0.23} {'loss': 0.5735, 'learning_rate': 1.9645929605384534e-05, 'epoch': 0.23} {'loss': 0.6569, 'learning_rate': 1.9645840988153763e-05, 'epoch': 0.23} {'loss': 0.7766, 'learning_rate': 1.9645752360034667e-05, 'epoch': 0.23} {'loss': 0.4277, 'learning_rate': 1.9645663721027356e-05, 'epoch': 0.23} {'loss': 0.5279, 'learning_rate': 1.964557507113192e-05, 'epoch': 0.23} {'loss': 0.4092, 'learning_rate': 1.9645486410348467e-05, 'epoch': 0.23} {'loss': 0.629, 'learning_rate': 1.9645397738677093e-05, 'epoch': 0.23} {'loss': 0.6156, 'learning_rate': 1.96453090561179e-05, 'epoch': 0.23} {'loss': 0.6234, 'learning_rate': 1.9645220362670988e-05, 'epoch': 0.23} {'loss': 0.6145, 'learning_rate': 1.9645131658336454e-05, 'epoch': 0.23} {'loss': 0.5281, 'learning_rate': 1.9645042943114402e-05, 'epoch': 0.23} {'loss': 0.5282, 'learning_rate': 1.964495421700493e-05, 'epoch': 0.23} {'loss': 0.476, 'learning_rate': 1.964486548000814e-05, 'epoch': 0.23} {'loss': 0.6385, 'learning_rate': 1.9644776732124132e-05, 'epoch': 0.23} {'loss': 0.6291, 'learning_rate': 1.9644687973353e-05, 'epoch': 0.23} {'loss': 0.5348, 'learning_rate': 1.9644599203694855e-05, 'epoch': 0.23} {'loss': 0.5704, 'learning_rate': 1.964451042314979e-05, 'epoch': 0.23} {'loss': 0.4793, 'learning_rate': 1.9644421631717902e-05, 'epoch': 0.23} {'loss': 0.4706, 'learning_rate': 1.96443328293993e-05, 'epoch': 0.23} {'loss': 0.5195, 'learning_rate': 1.964424401619408e-05, 'epoch': 0.23} {'loss': 0.5519, 'learning_rate': 1.9644155192102344e-05, 'epoch': 0.23} {'loss': 0.4993, 'learning_rate': 1.964406635712419e-05, 'epoch': 0.23} {'loss': 0.5013, 'learning_rate': 1.9643977511259713e-05, 'epoch': 0.23} {'loss': 0.4219, 'learning_rate': 1.9643888654509027e-05, 'epoch': 0.23} {'loss': 0.5284, 'learning_rate': 1.964379978687222e-05, 'epoch': 0.23} {'loss': 0.5059, 'learning_rate': 1.96437109083494e-05, 'epoch': 0.23} {'loss': 0.6581, 'learning_rate': 1.964362201894066e-05, 'epoch': 0.23} {'loss': 0.6204, 'learning_rate': 1.9643533118646107e-05, 'epoch': 0.23} {'loss': 0.6616, 'learning_rate': 1.964344420746584e-05, 'epoch': 0.23} {'loss': 0.7211, 'learning_rate': 1.9643355285399958e-05, 'epoch': 0.23} {'loss': 0.6941, 'learning_rate': 1.9643266352448562e-05, 'epoch': 0.23} {'loss': 0.579, 'learning_rate': 1.9643177408611752e-05, 'epoch': 0.23} {'loss': 0.6214, 'learning_rate': 1.9643088453889624e-05, 'epoch': 0.23} {'loss': 0.6508, 'learning_rate': 1.9642999488282292e-05, 'epoch': 0.23} {'loss': 0.5436, 'learning_rate': 1.9642910511789838e-05, 'epoch': 0.23} {'loss': 0.5735, 'learning_rate': 1.9642821524412377e-05, 'epoch': 0.23} {'loss': 0.7064, 'learning_rate': 1.964273252615e-05, 'epoch': 0.23} {'loss': 0.6318, 'learning_rate': 1.9642643517002814e-05, 'epoch': 0.23} {'loss': 0.678, 'learning_rate': 1.9642554496970918e-05, 'epoch': 0.23} {'loss': 0.558, 'learning_rate': 1.9642465466054412e-05, 'epoch': 0.23} {'loss': 0.6056, 'learning_rate': 1.9642376424253397e-05, 'epoch': 0.23} {'loss': 0.593, 'learning_rate': 1.964228737156797e-05, 'epoch': 0.23} {'loss': 0.5499, 'learning_rate': 1.9642198307998233e-05, 'epoch': 0.23} {'loss': 0.6078, 'learning_rate': 1.964210923354429e-05, 'epoch': 0.23} {'loss': 0.5178, 'learning_rate': 1.9642020148206236e-05, 'epoch': 0.23} {'loss': 0.6943, 'learning_rate': 1.964193105198418e-05, 'epoch': 0.23} {'loss': 0.5697, 'learning_rate': 1.9641841944878213e-05, 'epoch': 0.23} {'loss': 0.6032, 'learning_rate': 1.9641752826888445e-05, 'epoch': 0.23} {'loss': 0.4468, 'learning_rate': 1.9641663698014967e-05, 'epoch': 0.23} {'loss': 0.4451, 'learning_rate': 1.9641574558257885e-05, 'epoch': 0.23} {'loss': 0.5217, 'learning_rate': 1.96414854076173e-05, 'epoch': 0.23} {'loss': 0.6399, 'learning_rate': 1.964139624609331e-05, 'epoch': 0.23} {'loss': 0.5627, 'learning_rate': 1.964130707368602e-05, 'epoch': 0.23} {'loss': 0.4635, 'learning_rate': 1.9641217890395522e-05, 'epoch': 0.23} {'loss': 0.5798, 'learning_rate': 1.9641128696221927e-05, 'epoch': 0.23} {'loss': 0.6666, 'learning_rate': 1.9641039491165326e-05, 'epoch': 0.23} {'loss': 0.6764, 'learning_rate': 1.9640950275225833e-05, 'epoch': 0.23} {'loss': 0.597, 'learning_rate': 1.9640861048403535e-05, 'epoch': 0.23} {'loss': 0.5999, 'learning_rate': 1.9640771810698538e-05, 'epoch': 0.23} {'loss': 0.4504, 'learning_rate': 1.9640682562110943e-05, 'epoch': 0.23} {'loss': 0.608, 'learning_rate': 1.9640593302640854e-05, 'epoch': 0.23} {'loss': 0.507, 'learning_rate': 1.9640504032288364e-05, 'epoch': 0.23} {'loss': 0.4887, 'learning_rate': 1.964041475105358e-05, 'epoch': 0.23} {'loss': 0.4928, 'learning_rate': 1.9640325458936604e-05, 'epoch': 0.23} {'loss': 0.5997, 'learning_rate': 1.964023615593753e-05, 'epoch': 0.23} {'loss': 0.57, 'learning_rate': 1.9640146842056464e-05, 'epoch': 0.23} {'loss': 0.7205, 'learning_rate': 1.96400575172935e-05, 'epoch': 0.23} {'loss': 0.6564, 'learning_rate': 1.963996818164875e-05, 'epoch': 0.23} {'loss': 0.5304, 'learning_rate': 1.963987883512231e-05, 'epoch': 0.23} {'loss': 0.6145, 'learning_rate': 1.9639789477714278e-05, 'epoch': 0.23} {'loss': 0.5263, 'learning_rate': 1.963970010942476e-05, 'epoch': 0.23} {'loss': 0.6331, 'learning_rate': 1.9639610730253848e-05, 'epoch': 0.23} {'loss': 0.6568, 'learning_rate': 1.9639521340201647e-05, 'epoch': 0.23} {'loss': 0.5616, 'learning_rate': 1.9639431939268264e-05, 'epoch': 0.23} {'loss': 0.6125, 'learning_rate': 1.9639342527453794e-05, 'epoch': 0.23} {'loss': 0.6149, 'learning_rate': 1.9639253104758343e-05, 'epoch': 0.23} {'loss': 0.3602, 'learning_rate': 1.9639163671182004e-05, 'epoch': 0.23} {'loss': 0.627, 'learning_rate': 1.9639074226724884e-05, 'epoch': 0.23} {'loss': 0.7433, 'learning_rate': 1.9638984771387083e-05, 'epoch': 0.23} {'loss': 0.4276, 'learning_rate': 1.9638895305168697e-05, 'epoch': 0.23} {'loss': 0.556, 'learning_rate': 1.9638805828069834e-05, 'epoch': 0.23} {'loss': 0.6844, 'learning_rate': 1.9638716340090592e-05, 'epoch': 0.23} {'loss': 0.4934, 'learning_rate': 1.9638626841231073e-05, 'epoch': 0.23} {'loss': 0.641, 'learning_rate': 1.9638537331491375e-05, 'epoch': 0.23} {'loss': 0.6406, 'learning_rate': 1.9638447810871603e-05, 'epoch': 0.23} {'loss': 0.6285, 'learning_rate': 1.9638358279371856e-05, 'epoch': 0.23} {'loss': 0.5289, 'learning_rate': 1.9638268736992234e-05, 'epoch': 0.23} {'loss': 0.3755, 'learning_rate': 1.963817918373284e-05, 'epoch': 0.23} {'loss': 0.6062, 'learning_rate': 1.9638089619593777e-05, 'epoch': 0.23} {'loss': 0.499, 'learning_rate': 1.963800004457514e-05, 'epoch': 0.23} {'loss': 0.7287, 'learning_rate': 1.9637910458677036e-05, 'epoch': 0.23} {'loss': 0.5466, 'learning_rate': 1.9637820861899563e-05, 'epoch': 0.23} {'loss': 0.4702, 'learning_rate': 1.9637731254242822e-05, 'epoch': 0.23} {'loss': 0.5132, 'learning_rate': 1.9637641635706916e-05, 'epoch': 0.23} {'loss': 0.6118, 'learning_rate': 1.9637552006291946e-05, 'epoch': 0.23} {'loss': 0.6458, 'learning_rate': 1.9637462365998013e-05, 'epoch': 0.23} {'loss': 0.4564, 'learning_rate': 1.9637372714825215e-05, 'epoch': 0.23} {'loss': 0.6308, 'learning_rate': 1.963728305277366e-05, 'epoch': 0.23} {'loss': 0.3998, 'learning_rate': 1.963719337984344e-05, 'epoch': 0.23} {'loss': 0.5494, 'learning_rate': 1.9637103696034664e-05, 'epoch': 0.23} {'loss': 0.5961, 'learning_rate': 1.963701400134743e-05, 'epoch': 0.23} {'loss': 0.4059, 'learning_rate': 1.963692429578184e-05, 'epoch': 0.23} {'loss': 0.5975, 'learning_rate': 1.9636834579337994e-05, 'epoch': 0.23} {'loss': 0.6979, 'learning_rate': 1.9636744852015996e-05, 'epoch': 0.23} {'loss': 0.4291, 'learning_rate': 1.9636655113815944e-05, 'epoch': 0.23} {'loss': 0.6242, 'learning_rate': 1.9636565364737942e-05, 'epoch': 0.23} {'loss': 0.5679, 'learning_rate': 1.963647560478209e-05, 'epoch': 0.23} {'loss': 0.5635, 'learning_rate': 1.9636385833948487e-05, 'epoch': 0.23} {'loss': 0.6211, 'learning_rate': 1.963629605223724e-05, 'epoch': 0.23} {'loss': 0.5104, 'learning_rate': 1.9636206259648446e-05, 'epoch': 0.23} {'loss': 0.5862, 'learning_rate': 1.9636116456182208e-05, 'epoch': 0.23} {'loss': 0.474, 'learning_rate': 1.9636026641838627e-05, 'epoch': 0.23} {'loss': 0.6158, 'learning_rate': 1.9635936816617805e-05, 'epoch': 0.23} {'loss': 0.7126, 'learning_rate': 1.9635846980519843e-05, 'epoch': 0.23} {'loss': 0.6591, 'learning_rate': 1.963575713354484e-05, 'epoch': 0.23} {'loss': 0.4792, 'learning_rate': 1.96356672756929e-05, 'epoch': 0.23} {'loss': 0.4379, 'learning_rate': 1.9635577406964124e-05, 'epoch': 0.23} {'loss': 0.5814, 'learning_rate': 1.9635487527358613e-05, 'epoch': 0.23} {'loss': 0.725, 'learning_rate': 1.963539763687647e-05, 'epoch': 0.23} {'loss': 0.4503, 'learning_rate': 1.9635307735517794e-05, 'epoch': 0.23} {'loss': 0.5614, 'learning_rate': 1.963521782328269e-05, 'epoch': 0.23} {'loss': 0.499, 'learning_rate': 1.9635127900171256e-05, 'epoch': 0.23} {'loss': 0.605, 'learning_rate': 1.9635037966183593e-05, 'epoch': 0.23} {'loss': 0.5325, 'learning_rate': 1.9634948021319808e-05, 'epoch': 0.23} {'loss': 0.4236, 'learning_rate': 1.9634858065579997e-05, 'epoch': 0.23} {'loss': 0.6527, 'learning_rate': 1.963476809896426e-05, 'epoch': 0.23} {'loss': 0.571, 'learning_rate': 1.9634678121472707e-05, 'epoch': 0.23} {'loss': 0.4822, 'learning_rate': 1.963458813310543e-05, 'epoch': 0.23} {'loss': 0.5994, 'learning_rate': 1.9634498133862544e-05, 'epoch': 0.23} {'loss': 0.6508, 'learning_rate': 1.9634408123744132e-05, 'epoch': 0.23} {'loss': 0.5671, 'learning_rate': 1.963431810275031e-05, 'epoch': 0.23} {'loss': 0.4161, 'learning_rate': 1.9634228070881173e-05, 'epoch': 0.23} {'loss': 0.5883, 'learning_rate': 1.9634138028136825e-05, 'epoch': 0.23} {'loss': 0.6224, 'learning_rate': 1.963404797451737e-05, 'epoch': 0.23} {'loss': 0.5629, 'learning_rate': 1.9633957910022902e-05, 'epoch': 0.23} {'loss': 0.6275, 'learning_rate': 1.9633867834653532e-05, 'epoch': 0.23} {'loss': 0.4542, 'learning_rate': 1.9633777748409356e-05, 'epoch': 0.23} {'loss': 0.5672, 'learning_rate': 1.9633687651290473e-05, 'epoch': 0.23} {'loss': 0.3899, 'learning_rate': 1.9633597543296995e-05, 'epoch': 0.23} {'loss': 0.6698, 'learning_rate': 1.9633507424429013e-05, 'epoch': 0.23} {'loss': 0.6206, 'learning_rate': 1.9633417294686632e-05, 'epoch': 0.23} {'loss': 0.5947, 'learning_rate': 1.9633327154069958e-05, 'epoch': 0.23} {'loss': 0.6715, 'learning_rate': 1.9633237002579085e-05, 'epoch': 0.23} {'loss': 0.6453, 'learning_rate': 1.9633146840214125e-05, 'epoch': 0.23} {'loss': 0.4466, 'learning_rate': 1.963305666697517e-05, 'epoch': 0.23} {'loss': 0.546, 'learning_rate': 1.9632966482862326e-05, 'epoch': 0.23} {'loss': 0.6161, 'learning_rate': 1.9632876287875698e-05, 'epoch': 0.23} {'loss': 0.513, 'learning_rate': 1.963278608201538e-05, 'epoch': 0.23} {'loss': 0.539, 'learning_rate': 1.963269586528148e-05, 'epoch': 0.23} {'loss': 0.6996, 'learning_rate': 1.96326056376741e-05, 'epoch': 0.23} {'loss': 0.5569, 'learning_rate': 1.963251539919334e-05, 'epoch': 0.23} {'loss': 0.4708, 'learning_rate': 1.9632425149839302e-05, 'epoch': 0.23} {'loss': 0.4775, 'learning_rate': 1.9632334889612082e-05, 'epoch': 0.23} {'loss': 0.7051, 'learning_rate': 1.9632244618511795e-05, 'epoch': 0.23} {'loss': 0.5766, 'learning_rate': 1.963215433653853e-05, 'epoch': 0.23} {'loss': 0.5865, 'learning_rate': 1.9632064043692395e-05, 'epoch': 0.23} {'loss': 0.5411, 'learning_rate': 1.9631973739973492e-05, 'epoch': 0.23} {'loss': 0.5151, 'learning_rate': 1.9631883425381926e-05, 'epoch': 0.23} {'loss': 0.5709, 'learning_rate': 1.9631793099917794e-05, 'epoch': 0.23} {'loss': 0.6793, 'learning_rate': 1.9631702763581194e-05, 'epoch': 0.23} {'loss': 0.4605, 'learning_rate': 1.963161241637224e-05, 'epoch': 0.23} {'loss': 0.497, 'learning_rate': 1.9631522058291022e-05, 'epoch': 0.23} {'loss': 0.6413, 'learning_rate': 1.963143168933765e-05, 'epoch': 0.23} {'loss': 0.6819, 'learning_rate': 1.963134130951222e-05, 'epoch': 0.23} {'loss': 0.5903, 'learning_rate': 1.9631250918814842e-05, 'epoch': 0.23} {'loss': 0.6268, 'learning_rate': 1.963116051724561e-05, 'epoch': 0.23} {'loss': 0.4632, 'learning_rate': 1.9631070104804627e-05, 'epoch': 0.23} {'loss': 0.7278, 'learning_rate': 1.9630979681492e-05, 'epoch': 0.23} {'loss': 0.7857, 'learning_rate': 1.963088924730783e-05, 'epoch': 0.23} {'loss': 0.5782, 'learning_rate': 1.9630798802252212e-05, 'epoch': 0.23} {'loss': 0.3768, 'learning_rate': 1.963070834632526e-05, 'epoch': 0.23} {'loss': 0.5558, 'learning_rate': 1.9630617879527064e-05, 'epoch': 0.23} {'loss': 0.5086, 'learning_rate': 1.9630527401857738e-05, 'epoch': 0.23} {'loss': 0.6858, 'learning_rate': 1.963043691331737e-05, 'epoch': 0.23} {'loss': 0.5043, 'learning_rate': 1.963034641390608e-05, 'epoch': 0.23} {'loss': 0.655, 'learning_rate': 1.963025590362395e-05, 'epoch': 0.23} {'loss': 0.5179, 'learning_rate': 1.96301653824711e-05, 'epoch': 0.23} {'loss': 0.5093, 'learning_rate': 1.963007485044762e-05, 'epoch': 0.23} {'loss': 0.6438, 'learning_rate': 1.962998430755362e-05, 'epoch': 0.23} {'loss': 0.4809, 'learning_rate': 1.9629893753789196e-05, 'epoch': 0.23} {'loss': 0.602, 'learning_rate': 1.9629803189154456e-05, 'epoch': 0.23} {'loss': 0.6448, 'learning_rate': 1.9629712613649497e-05, 'epoch': 0.23} {'loss': 0.599, 'learning_rate': 1.9629622027274423e-05, 'epoch': 0.23} {'loss': 0.5907, 'learning_rate': 1.962953143002934e-05, 'epoch': 0.23} {'loss': 0.5615, 'learning_rate': 1.9629440821914346e-05, 'epoch': 0.23} {'loss': 0.5313, 'learning_rate': 1.9629350202929543e-05, 'epoch': 0.23} {'loss': 0.5441, 'learning_rate': 1.9629259573075034e-05, 'epoch': 0.23} {'loss': 0.5453, 'learning_rate': 1.9629168932350924e-05, 'epoch': 0.23} {'loss': 0.549, 'learning_rate': 1.9629078280757315e-05, 'epoch': 0.23} {'loss': 0.4777, 'learning_rate': 1.9628987618294304e-05, 'epoch': 0.23} {'loss': 0.5021, 'learning_rate': 1.9628896944962e-05, 'epoch': 0.23} {'loss': 0.5022, 'learning_rate': 1.96288062607605e-05, 'epoch': 0.23} {'loss': 0.6679, 'learning_rate': 1.9628715565689912e-05, 'epoch': 0.23} {'loss': 0.5596, 'learning_rate': 1.9628624859750333e-05, 'epoch': 0.23} {'loss': 0.5904, 'learning_rate': 1.9628534142941865e-05, 'epoch': 0.23} {'loss': 0.6133, 'learning_rate': 1.9628443415264615e-05, 'epoch': 0.23} {'loss': 0.59, 'learning_rate': 1.9628352676718686e-05, 'epoch': 0.23} {'loss': 0.7276, 'learning_rate': 1.9628261927304176e-05, 'epoch': 0.23} {'loss': 0.6518, 'learning_rate': 1.9628171167021186e-05, 'epoch': 0.23} {'loss': 0.4827, 'learning_rate': 1.9628080395869828e-05, 'epoch': 0.23} {'loss': 0.431, 'learning_rate': 1.962798961385019e-05, 'epoch': 0.23} {'loss': 0.5083, 'learning_rate': 1.9627898820962388e-05, 'epoch': 0.23} {'loss': 0.5798, 'learning_rate': 1.9627808017206516e-05, 'epoch': 0.23} {'loss': 0.5036, 'learning_rate': 1.9627717202582683e-05, 'epoch': 0.23} {'loss': 0.5281, 'learning_rate': 1.9627626377090987e-05, 'epoch': 0.23} {'loss': 0.459, 'learning_rate': 1.962753554073153e-05, 'epoch': 0.23} {'loss': 0.5949, 'learning_rate': 1.962744469350442e-05, 'epoch': 0.23} {'loss': 0.6012, 'learning_rate': 1.962735383540975e-05, 'epoch': 0.23} {'loss': 0.4056, 'learning_rate': 1.9627262966447632e-05, 'epoch': 0.23} {'loss': 0.6237, 'learning_rate': 1.9627172086618166e-05, 'epoch': 0.23} {'loss': 0.4291, 'learning_rate': 1.962708119592145e-05, 'epoch': 0.23} {'loss': 0.6291, 'learning_rate': 1.962699029435759e-05, 'epoch': 0.23} {'loss': 0.6389, 'learning_rate': 1.9626899381926692e-05, 'epoch': 0.23} {'loss': 0.6287, 'learning_rate': 1.9626808458628854e-05, 'epoch': 0.23} {'loss': 0.5738, 'learning_rate': 1.962671752446418e-05, 'epoch': 0.23} {'loss': 0.6866, 'learning_rate': 1.962662657943277e-05, 'epoch': 0.23} {'loss': 0.5029, 'learning_rate': 1.9626535623534734e-05, 'epoch': 0.23} {'loss': 0.5426, 'learning_rate': 1.9626444656770163e-05, 'epoch': 0.23} {'loss': 0.5201, 'learning_rate': 1.962635367913917e-05, 'epoch': 0.23} {'loss': 0.7056, 'learning_rate': 1.9626262690641854e-05, 'epoch': 0.23} {'loss': 0.4139, 'learning_rate': 1.962617169127832e-05, 'epoch': 0.23} {'loss': 0.5938, 'learning_rate': 1.9626080681048666e-05, 'epoch': 0.23} {'loss': 0.7101, 'learning_rate': 1.9625989659953e-05, 'epoch': 0.23} {'loss': 0.5336, 'learning_rate': 1.962589862799142e-05, 'epoch': 0.23} {'loss': 0.4091, 'learning_rate': 1.962580758516403e-05, 'epoch': 0.23} {'loss': 0.5027, 'learning_rate': 1.9625716531470936e-05, 'epoch': 0.23} {'loss': 0.5473, 'learning_rate': 1.9625625466912237e-05, 'epoch': 0.23} {'loss': 0.7256, 'learning_rate': 1.962553439148804e-05, 'epoch': 0.23} {'loss': 0.7808, 'learning_rate': 1.9625443305198444e-05, 'epoch': 0.23} {'loss': 0.5649, 'learning_rate': 1.962535220804355e-05, 'epoch': 0.23} {'loss': 0.6624, 'learning_rate': 1.9625261100023464e-05, 'epoch': 0.23} {'loss': 0.5411, 'learning_rate': 1.962516998113829e-05, 'epoch': 0.23} {'loss': 0.4489, 'learning_rate': 1.962507885138813e-05, 'epoch': 0.23} {'loss': 0.7091, 'learning_rate': 1.962498771077309e-05, 'epoch': 0.23} {'loss': 0.4515, 'learning_rate': 1.962489655929326e-05, 'epoch': 0.23} {'loss': 0.7187, 'learning_rate': 1.962480539694876e-05, 'epoch': 0.23} {'loss': 0.6263, 'learning_rate': 1.962471422373968e-05, 'epoch': 0.23} {'loss': 0.5145, 'learning_rate': 1.962462303966613e-05, 'epoch': 0.23} {'loss': 0.4404, 'learning_rate': 1.962453184472821e-05, 'epoch': 0.23} {'loss': 0.5746, 'learning_rate': 1.9624440638926026e-05, 'epoch': 0.23} {'loss': 0.5942, 'learning_rate': 1.9624349422259675e-05, 'epoch': 0.23} {'loss': 0.6542, 'learning_rate': 1.9624258194729266e-05, 'epoch': 0.23} {'loss': 0.6981, 'learning_rate': 1.96241669563349e-05, 'epoch': 0.23} {'loss': 0.4819, 'learning_rate': 1.9624075707076676e-05, 'epoch': 0.23} {'loss': 0.6705, 'learning_rate': 1.9623984446954705e-05, 'epoch': 0.23} {'loss': 0.5204, 'learning_rate': 1.9623893175969083e-05, 'epoch': 0.23} {'loss': 0.5754, 'learning_rate': 1.962380189411992e-05, 'epoch': 0.23} {'loss': 0.5156, 'learning_rate': 1.962371060140731e-05, 'epoch': 0.23} {'loss': 0.5831, 'learning_rate': 1.9623619297831365e-05, 'epoch': 0.23} {'loss': 0.4598, 'learning_rate': 1.962352798339218e-05, 'epoch': 0.23} {'loss': 0.5468, 'learning_rate': 1.962343665808986e-05, 'epoch': 0.23} {'loss': 0.5579, 'learning_rate': 1.9623345321924513e-05, 'epoch': 0.23} {'loss': 0.5567, 'learning_rate': 1.962325397489624e-05, 'epoch': 0.23} {'loss': 0.635, 'learning_rate': 1.9623162617005143e-05, 'epoch': 0.23} {'loss': 0.4037, 'learning_rate': 1.9623071248251326e-05, 'epoch': 0.23} {'loss': 0.5572, 'learning_rate': 1.9622979868634887e-05, 'epoch': 0.23} {'loss': 0.5395, 'learning_rate': 1.962288847815594e-05, 'epoch': 0.23} {'loss': 0.5578, 'learning_rate': 1.962279707681458e-05, 'epoch': 0.23} {'loss': 0.55, 'learning_rate': 1.962270566461091e-05, 'epoch': 0.23} {'loss': 0.5917, 'learning_rate': 1.9622614241545034e-05, 'epoch': 0.23} {'loss': 0.5401, 'learning_rate': 1.9622522807617056e-05, 'epoch': 0.23} {'loss': 0.5529, 'learning_rate': 1.9622431362827083e-05, 'epoch': 0.23} {'loss': 0.6026, 'learning_rate': 1.9622339907175214e-05, 'epoch': 0.23} {'loss': 0.6101, 'learning_rate': 1.9622248440661553e-05, 'epoch': 0.23} {'loss': 0.5952, 'learning_rate': 1.96221569632862e-05, 'epoch': 0.23} {'loss': 0.6665, 'learning_rate': 1.9622065475049264e-05, 'epoch': 0.23} {'loss': 0.4054, 'learning_rate': 1.962197397595085e-05, 'epoch': 0.23} {'loss': 0.6182, 'learning_rate': 1.9621882465991053e-05, 'epoch': 0.23} {'loss': 0.651, 'learning_rate': 1.962179094516998e-05, 'epoch': 0.23} {'loss': 0.4841, 'learning_rate': 1.9621699413487732e-05, 'epoch': 0.23} {'loss': 0.7081, 'learning_rate': 1.9621607870944417e-05, 'epoch': 0.23} {'loss': 0.5499, 'learning_rate': 1.962151631754014e-05, 'epoch': 0.23} {'loss': 0.3482, 'learning_rate': 1.9621424753275e-05, 'epoch': 0.23} {'loss': 0.5174, 'learning_rate': 1.96213331781491e-05, 'epoch': 0.23} {'loss': 0.5877, 'learning_rate': 1.962124159216254e-05, 'epoch': 0.23} {'loss': 0.5606, 'learning_rate': 1.962114999531543e-05, 'epoch': 0.23} {'loss': 0.663, 'learning_rate': 1.9621058387607873e-05, 'epoch': 0.23} {'loss': 0.5684, 'learning_rate': 1.962096676903997e-05, 'epoch': 0.23} {'loss': 0.3707, 'learning_rate': 1.9620875139611825e-05, 'epoch': 0.23} {'loss': 0.7238, 'learning_rate': 1.9620783499323544e-05, 'epoch': 0.23} {'loss': 0.5277, 'learning_rate': 1.9620691848175224e-05, 'epoch': 0.23} {'loss': 0.5386, 'learning_rate': 1.9620600186166972e-05, 'epoch': 0.23} {'loss': 0.6694, 'learning_rate': 1.9620508513298898e-05, 'epoch': 0.23} {'loss': 0.5288, 'learning_rate': 1.9620416829571095e-05, 'epoch': 0.23} {'loss': 0.7723, 'learning_rate': 1.962032513498367e-05, 'epoch': 0.23} {'loss': 0.5492, 'learning_rate': 1.962023342953673e-05, 'epoch': 0.23} {'loss': 0.5071, 'learning_rate': 1.9620141713230372e-05, 'epoch': 0.23} {'loss': 0.3382, 'learning_rate': 1.9620049986064704e-05, 'epoch': 0.23} {'loss': 0.5288, 'learning_rate': 1.9619958248039833e-05, 'epoch': 0.23} {'loss': 0.6395, 'learning_rate': 1.9619866499155854e-05, 'epoch': 0.23} {'loss': 0.4948, 'learning_rate': 1.9619774739412878e-05, 'epoch': 0.23} {'loss': 0.661, 'learning_rate': 1.9619682968811005e-05, 'epoch': 0.23} {'loss': 0.5698, 'learning_rate': 1.961959118735034e-05, 'epoch': 0.23} {'loss': 0.4105, 'learning_rate': 1.9619499395030984e-05, 'epoch': 0.23} {'loss': 0.769, 'learning_rate': 1.961940759185304e-05, 'epoch': 0.23} {'loss': 0.5655, 'learning_rate': 1.9619315777816618e-05, 'epoch': 0.23} {'loss': 0.5429, 'learning_rate': 1.9619223952921816e-05, 'epoch': 0.23} {'loss': 0.4908, 'learning_rate': 1.961913211716874e-05, 'epoch': 0.23} {'loss': 0.5939, 'learning_rate': 1.961904027055749e-05, 'epoch': 0.23} {'loss': 0.4537, 'learning_rate': 1.9618948413088177e-05, 'epoch': 0.23} {'loss': 0.6918, 'learning_rate': 1.96188565447609e-05, 'epoch': 0.23} {'loss': 0.4745, 'learning_rate': 1.9618764665575763e-05, 'epoch': 0.23} {'loss': 0.539, 'learning_rate': 1.961867277553287e-05, 'epoch': 0.23} {'loss': 0.5364, 'learning_rate': 1.9618580874632324e-05, 'epoch': 0.23} {'loss': 0.5114, 'learning_rate': 1.9618488962874226e-05, 'epoch': 0.23} {'loss': 0.6504, 'learning_rate': 1.9618397040258687e-05, 'epoch': 0.23} {'loss': 0.3319, 'learning_rate': 1.9618305106785805e-05, 'epoch': 0.23} {'loss': 0.6513, 'learning_rate': 1.9618213162455685e-05, 'epoch': 0.23} {'loss': 0.5693, 'learning_rate': 1.961812120726843e-05, 'epoch': 0.23} {'loss': 0.6308, 'learning_rate': 1.961802924122415e-05, 'epoch': 0.23} {'loss': 0.728, 'learning_rate': 1.961793726432294e-05, 'epoch': 0.23} {'loss': 0.7721, 'learning_rate': 1.9617845276564907e-05, 'epoch': 0.23} {'loss': 0.554, 'learning_rate': 1.961775327795016e-05, 'epoch': 0.23} {'loss': 0.5972, 'learning_rate': 1.9617661268478795e-05, 'epoch': 0.23} {'loss': 0.627, 'learning_rate': 1.961756924815092e-05, 'epoch': 0.23} {'loss': 0.3734, 'learning_rate': 1.961747721696664e-05, 'epoch': 0.23} {'loss': 0.5735, 'learning_rate': 1.9617385174926055e-05, 'epoch': 0.23} {'loss': 0.6926, 'learning_rate': 1.9617293122029272e-05, 'epoch': 0.23} {'loss': 0.5169, 'learning_rate': 1.9617201058276394e-05, 'epoch': 0.23} {'loss': 0.5973, 'learning_rate': 1.9617108983667524e-05, 'epoch': 0.23} {'loss': 0.6484, 'learning_rate': 1.961701689820277e-05, 'epoch': 0.23} {'loss': 0.5321, 'learning_rate': 1.9616924801882226e-05, 'epoch': 0.23} {'loss': 0.5602, 'learning_rate': 1.9616832694706004e-05, 'epoch': 0.23} {'loss': 0.5812, 'learning_rate': 1.961674057667421e-05, 'epoch': 0.23} {'loss': 0.6144, 'learning_rate': 1.9616648447786945e-05, 'epoch': 0.23} {'loss': 0.599, 'learning_rate': 1.961655630804431e-05, 'epoch': 0.23} {'loss': 0.4484, 'learning_rate': 1.9616464157446412e-05, 'epoch': 0.23} {'loss': 0.5335, 'learning_rate': 1.9616371995993355e-05, 'epoch': 0.23} {'loss': 0.8495, 'learning_rate': 1.9616279823685246e-05, 'epoch': 0.23} {'loss': 0.5227, 'learning_rate': 1.9616187640522183e-05, 'epoch': 0.23} {'loss': 0.7037, 'learning_rate': 1.961609544650427e-05, 'epoch': 0.23} {'loss': 0.5778, 'learning_rate': 1.9616003241631616e-05, 'epoch': 0.23} {'loss': 0.6052, 'learning_rate': 1.9615911025904324e-05, 'epoch': 0.23} {'loss': 0.586, 'learning_rate': 1.9615818799322497e-05, 'epoch': 0.23} {'loss': 0.4699, 'learning_rate': 1.9615726561886238e-05, 'epoch': 0.23} {'loss': 0.7369, 'learning_rate': 1.961563431359565e-05, 'epoch': 0.23} {'loss': 0.5269, 'learning_rate': 1.9615542054450846e-05, 'epoch': 0.23} {'loss': 0.5075, 'learning_rate': 1.9615449784451916e-05, 'epoch': 0.23} {'loss': 0.5411, 'learning_rate': 1.9615357503598974e-05, 'epoch': 0.23} {'loss': 0.5737, 'learning_rate': 1.9615265211892125e-05, 'epoch': 0.23} {'loss': 0.6124, 'learning_rate': 1.9615172909331467e-05, 'epoch': 0.23} {'loss': 0.4998, 'learning_rate': 1.9615080595917108e-05, 'epoch': 0.23} {'loss': 0.458, 'learning_rate': 1.961498827164915e-05, 'epoch': 0.23} {'loss': 0.5729, 'learning_rate': 1.96148959365277e-05, 'epoch': 0.23} {'loss': 0.4896, 'learning_rate': 1.9614803590552864e-05, 'epoch': 0.23} {'loss': 0.5171, 'learning_rate': 1.961471123372474e-05, 'epoch': 0.23} {'loss': 0.4002, 'learning_rate': 1.9614618866043432e-05, 'epoch': 0.23} {'loss': 0.5111, 'learning_rate': 1.9614526487509055e-05, 'epoch': 0.23} {'loss': 0.6582, 'learning_rate': 1.9614434098121702e-05, 'epoch': 0.23} {'loss': 0.5066, 'learning_rate': 1.961434169788148e-05, 'epoch': 0.23} {'loss': 0.7414, 'learning_rate': 1.9614249286788497e-05, 'epoch': 0.23} {'loss': 0.5766, 'learning_rate': 1.9614156864842854e-05, 'epoch': 0.23} {'loss': 0.5652, 'learning_rate': 1.9614064432044653e-05, 'epoch': 0.23} {'loss': 0.4926, 'learning_rate': 1.9613971988394004e-05, 'epoch': 0.23} {'loss': 0.6335, 'learning_rate': 1.961387953389101e-05, 'epoch': 0.23} {'loss': 0.4363, 'learning_rate': 1.961378706853577e-05, 'epoch': 0.23} {'loss': 0.5451, 'learning_rate': 1.9613694592328397e-05, 'epoch': 0.23} {'loss': 0.4845, 'learning_rate': 1.9613602105268987e-05, 'epoch': 0.23} {'loss': 0.4965, 'learning_rate': 1.9613509607357652e-05, 'epoch': 0.23} {'loss': 0.5468, 'learning_rate': 1.961341709859449e-05, 'epoch': 0.23} {'loss': 0.5903, 'learning_rate': 1.961332457897961e-05, 'epoch': 0.23} {'loss': 0.474, 'learning_rate': 1.9613232048513116e-05, 'epoch': 0.23} {'loss': 0.6677, 'learning_rate': 1.961313950719511e-05, 'epoch': 0.23} {'loss': 0.5246, 'learning_rate': 1.9613046955025697e-05, 'epoch': 0.23} {'loss': 0.6712, 'learning_rate': 1.961295439200498e-05, 'epoch': 0.23} {'loss': 0.6899, 'learning_rate': 1.9612861818133067e-05, 'epoch': 0.23} {'loss': 0.5461, 'learning_rate': 1.961276923341006e-05, 'epoch': 0.23} {'loss': 0.3808, 'learning_rate': 1.9612676637836067e-05, 'epoch': 0.23} {'loss': 0.6836, 'learning_rate': 1.961258403141119e-05, 'epoch': 0.23} {'loss': 0.5221, 'learning_rate': 1.961249141413553e-05, 'epoch': 0.23} {'loss': 0.5174, 'learning_rate': 1.9612398786009197e-05, 'epoch': 0.23} {'loss': 0.616, 'learning_rate': 1.9612306147032294e-05, 'epoch': 0.23} {'loss': 0.4462, 'learning_rate': 1.9612213497204925e-05, 'epoch': 0.23} {'loss': 0.4818, 'learning_rate': 1.9612120836527194e-05, 'epoch': 0.23} {'loss': 0.5611, 'learning_rate': 1.9612028164999207e-05, 'epoch': 0.23} {'loss': 0.7525, 'learning_rate': 1.961193548262107e-05, 'epoch': 0.23} {'loss': 0.3999, 'learning_rate': 1.9611842789392886e-05, 'epoch': 0.23} {'loss': 0.5958, 'learning_rate': 1.9611750085314755e-05, 'epoch': 0.23} {'loss': 0.6805, 'learning_rate': 1.961165737038679e-05, 'epoch': 0.23} {'loss': 0.6158, 'learning_rate': 1.961156464460909e-05, 'epoch': 0.23} {'loss': 0.4695, 'learning_rate': 1.961147190798176e-05, 'epoch': 0.23} {'loss': 0.5102, 'learning_rate': 1.9611379160504906e-05, 'epoch': 0.23} {'loss': 0.6801, 'learning_rate': 1.9611286402178634e-05, 'epoch': 0.23} {'loss': 0.5188, 'learning_rate': 1.9611193633003046e-05, 'epoch': 0.23} {'loss': 0.5759, 'learning_rate': 1.961110085297825e-05, 'epoch': 0.23} {'loss': 0.7288, 'learning_rate': 1.9611008062104345e-05, 'epoch': 0.23} {'loss': 0.4538, 'learning_rate': 1.9610915260381445e-05, 'epoch': 0.23} {'loss': 0.4799, 'learning_rate': 1.961082244780965e-05, 'epoch': 0.23} {'loss': 0.5109, 'learning_rate': 1.9610729624389057e-05, 'epoch': 0.23} {'loss': 0.751, 'learning_rate': 1.961063679011978e-05, 'epoch': 0.23} {'loss': 0.6211, 'learning_rate': 1.9610543945001925e-05, 'epoch': 0.23} {'loss': 0.5516, 'learning_rate': 1.961045108903559e-05, 'epoch': 0.23} {'loss': 0.7404, 'learning_rate': 1.9610358222220886e-05, 'epoch': 0.23} {'loss': 0.486, 'learning_rate': 1.9610265344557914e-05, 'epoch': 0.23} {'loss': 0.6003, 'learning_rate': 1.9610172456046778e-05, 'epoch': 0.23} {'loss': 0.5223, 'learning_rate': 1.9610079556687586e-05, 'epoch': 0.23} {'loss': 0.4683, 'learning_rate': 1.9609986646480443e-05, 'epoch': 0.24} {'loss': 0.6884, 'learning_rate': 1.960989372542545e-05, 'epoch': 0.24} {'loss': 0.5166, 'learning_rate': 1.9609800793522718e-05, 'epoch': 0.24} {'loss': 0.5359, 'learning_rate': 1.9609707850772346e-05, 'epoch': 0.24} {'loss': 0.6197, 'learning_rate': 1.960961489717444e-05, 'epoch': 0.24} {'loss': 0.5453, 'learning_rate': 1.9609521932729107e-05, 'epoch': 0.24} {'loss': 0.492, 'learning_rate': 1.960942895743645e-05, 'epoch': 0.24} {'loss': 0.553, 'learning_rate': 1.9609335971296578e-05, 'epoch': 0.24} {'loss': 0.4096, 'learning_rate': 1.9609242974309592e-05, 'epoch': 0.24} {'loss': 0.6802, 'learning_rate': 1.9609149966475597e-05, 'epoch': 0.24} {'loss': 0.6706, 'learning_rate': 1.96090569477947e-05, 'epoch': 0.24} {'loss': 0.5983, 'learning_rate': 1.9608963918267006e-05, 'epoch': 0.24} {'loss': 0.5513, 'learning_rate': 1.9608870877892613e-05, 'epoch': 0.24} {'loss': 0.5245, 'learning_rate': 1.960877782667164e-05, 'epoch': 0.24} {'loss': 0.4529, 'learning_rate': 1.960868476460418e-05, 'epoch': 0.24} {'loss': 0.5196, 'learning_rate': 1.9608591691690343e-05, 'epoch': 0.24} {'loss': 0.5976, 'learning_rate': 1.9608498607930232e-05, 'epoch': 0.24} {'loss': 0.5025, 'learning_rate': 1.9608405513323952e-05, 'epoch': 0.24} {'loss': 0.6227, 'learning_rate': 1.9608312407871612e-05, 'epoch': 0.24} {'loss': 0.6516, 'learning_rate': 1.9608219291573313e-05, 'epoch': 0.24} {'loss': 0.7305, 'learning_rate': 1.9608126164429164e-05, 'epoch': 0.24} {'loss': 0.5746, 'learning_rate': 1.9608033026439262e-05, 'epoch': 0.24} {'loss': 0.4818, 'learning_rate': 1.9607939877603724e-05, 'epoch': 0.24} {'loss': 0.5512, 'learning_rate': 1.9607846717922644e-05, 'epoch': 0.24} {'loss': 0.6309, 'learning_rate': 1.9607753547396137e-05, 'epoch': 0.24} {'loss': 0.6246, 'learning_rate': 1.9607660366024298e-05, 'epoch': 0.24} {'loss': 0.4671, 'learning_rate': 1.9607567173807242e-05, 'epoch': 0.24} {'loss': 0.6557, 'learning_rate': 1.9607473970745068e-05, 'epoch': 0.24} {'loss': 0.6262, 'learning_rate': 1.960738075683788e-05, 'epoch': 0.24} {'loss': 0.6297, 'learning_rate': 1.960728753208579e-05, 'epoch': 0.24} {'loss': 0.5203, 'learning_rate': 1.96071942964889e-05, 'epoch': 0.24} {'loss': 0.5512, 'learning_rate': 1.960710105004731e-05, 'epoch': 0.24} {'loss': 0.4905, 'learning_rate': 1.9607007792761134e-05, 'epoch': 0.24} {'loss': 0.6202, 'learning_rate': 1.9606914524630468e-05, 'epoch': 0.24} {'loss': 0.6552, 'learning_rate': 1.960682124565543e-05, 'epoch': 0.24} {'loss': 0.5857, 'learning_rate': 1.960672795583611e-05, 'epoch': 0.24} {'loss': 0.5844, 'learning_rate': 1.9606634655172625e-05, 'epoch': 0.24} {'loss': 0.5907, 'learning_rate': 1.9606541343665077e-05, 'epoch': 0.24} {'loss': 0.5871, 'learning_rate': 1.9606448021313565e-05, 'epoch': 0.24} {'loss': 0.4862, 'learning_rate': 1.9606354688118206e-05, 'epoch': 0.24} {'loss': 0.6235, 'learning_rate': 1.9606261344079097e-05, 'epoch': 0.24} {'loss': 0.7097, 'learning_rate': 1.9606167989196347e-05, 'epoch': 0.24} {'loss': 0.5608, 'learning_rate': 1.9606074623470057e-05, 'epoch': 0.24} {'loss': 0.5818, 'learning_rate': 1.960598124690034e-05, 'epoch': 0.24} {'loss': 0.4607, 'learning_rate': 1.9605887859487292e-05, 'epoch': 0.24} {'loss': 0.6521, 'learning_rate': 1.9605794461231027e-05, 'epoch': 0.24} {'loss': 0.5395, 'learning_rate': 1.9605701052131643e-05, 'epoch': 0.24} {'loss': 0.4333, 'learning_rate': 1.960560763218925e-05, 'epoch': 0.24} {'loss': 0.5978, 'learning_rate': 1.9605514201403956e-05, 'epoch': 0.24} {'loss': 0.4909, 'learning_rate': 1.960542075977586e-05, 'epoch': 0.24} {'loss': 0.7341, 'learning_rate': 1.9605327307305072e-05, 'epoch': 0.24} {'loss': 0.552, 'learning_rate': 1.9605233843991696e-05, 'epoch': 0.24} {'loss': 0.6088, 'learning_rate': 1.9605140369835834e-05, 'epoch': 0.24} {'loss': 0.5616, 'learning_rate': 1.96050468848376e-05, 'epoch': 0.24} {'loss': 0.5369, 'learning_rate': 1.9604953388997094e-05, 'epoch': 0.24} {'loss': 0.6506, 'learning_rate': 1.960485988231442e-05, 'epoch': 0.24} {'loss': 0.6268, 'learning_rate': 1.9604766364789683e-05, 'epoch': 0.24} {'loss': 0.6713, 'learning_rate': 1.9604672836422995e-05, 'epoch': 0.24} {'loss': 0.4824, 'learning_rate': 1.960457929721446e-05, 'epoch': 0.24} {'loss': 0.4949, 'learning_rate': 1.9604485747164175e-05, 'epoch': 0.24} {'loss': 0.4121, 'learning_rate': 1.960439218627226e-05, 'epoch': 0.24} {'loss': 0.5728, 'learning_rate': 1.9604298614538804e-05, 'epoch': 0.24} {'loss': 0.5345, 'learning_rate': 1.9604205031963928e-05, 'epoch': 0.24} {'loss': 0.5269, 'learning_rate': 1.9604111438547728e-05, 'epoch': 0.24} {'loss': 0.5304, 'learning_rate': 1.9604017834290313e-05, 'epoch': 0.24} {'loss': 0.4658, 'learning_rate': 1.9603924219191787e-05, 'epoch': 0.24} {'loss': 0.5412, 'learning_rate': 1.9603830593252256e-05, 'epoch': 0.24} {'loss': 0.5201, 'learning_rate': 1.960373695647183e-05, 'epoch': 0.24} {'loss': 0.5389, 'learning_rate': 1.960364330885061e-05, 'epoch': 0.24} {'loss': 0.4874, 'learning_rate': 1.96035496503887e-05, 'epoch': 0.24} {'loss': 0.428, 'learning_rate': 1.960345598108621e-05, 'epoch': 0.24} {'loss': 0.6848, 'learning_rate': 1.9603362300943246e-05, 'epoch': 0.24} {'loss': 0.591, 'learning_rate': 1.9603268609959913e-05, 'epoch': 0.24} {'loss': 0.6707, 'learning_rate': 1.9603174908136313e-05, 'epoch': 0.24} {'loss': 0.5838, 'learning_rate': 1.9603081195472558e-05, 'epoch': 0.24} {'loss': 0.652, 'learning_rate': 1.9602987471968747e-05, 'epoch': 0.24} {'loss': 0.5747, 'learning_rate': 1.9602893737624987e-05, 'epoch': 0.24} {'loss': 0.6018, 'learning_rate': 1.960279999244139e-05, 'epoch': 0.24} {'loss': 0.5308, 'learning_rate': 1.9602706236418057e-05, 'epoch': 0.24} {'loss': 0.5934, 'learning_rate': 1.9602612469555097e-05, 'epoch': 0.24} {'loss': 0.4999, 'learning_rate': 1.960251869185261e-05, 'epoch': 0.24} {'loss': 0.4867, 'learning_rate': 1.960242490331071e-05, 'epoch': 0.24} {'loss': 0.4523, 'learning_rate': 1.9602331103929494e-05, 'epoch': 0.24} {'loss': 0.3363, 'learning_rate': 1.9602237293709076e-05, 'epoch': 0.24} {'loss': 0.6291, 'learning_rate': 1.9602143472649552e-05, 'epoch': 0.24} {'loss': 0.7843, 'learning_rate': 1.960204964075104e-05, 'epoch': 0.24} {'loss': 0.6489, 'learning_rate': 1.9601955798013636e-05, 'epoch': 0.24} {'loss': 0.4367, 'learning_rate': 1.9601861944437453e-05, 'epoch': 0.24} {'loss': 0.6793, 'learning_rate': 1.9601768080022592e-05, 'epoch': 0.24} {'loss': 0.6222, 'learning_rate': 1.960167420476916e-05, 'epoch': 0.24} {'loss': 0.4945, 'learning_rate': 1.9601580318677265e-05, 'epoch': 0.24} {'loss': 0.5711, 'learning_rate': 1.960148642174701e-05, 'epoch': 0.24} {'loss': 0.5582, 'learning_rate': 1.9601392513978505e-05, 'epoch': 0.24} {'loss': 0.5031, 'learning_rate': 1.960129859537185e-05, 'epoch': 0.24} {'loss': 0.638, 'learning_rate': 1.9601204665927158e-05, 'epoch': 0.24} {'loss': 0.3785, 'learning_rate': 1.9601110725644532e-05, 'epoch': 0.24} {'loss': 0.5544, 'learning_rate': 1.9601016774524075e-05, 'epoch': 0.24} {'loss': 0.7951, 'learning_rate': 1.9600922812565897e-05, 'epoch': 0.24} {'loss': 0.5317, 'learning_rate': 1.9600828839770104e-05, 'epoch': 0.24} {'loss': 0.5406, 'learning_rate': 1.96007348561368e-05, 'epoch': 0.24} {'loss': 0.7462, 'learning_rate': 1.960064086166609e-05, 'epoch': 0.24} {'loss': 0.4761, 'learning_rate': 1.9600546856358084e-05, 'epoch': 0.24} {'loss': 0.6295, 'learning_rate': 1.9600452840212887e-05, 'epoch': 0.24} {'loss': 0.6303, 'learning_rate': 1.9600358813230605e-05, 'epoch': 0.24} {'loss': 0.6897, 'learning_rate': 1.960026477541134e-05, 'epoch': 0.24} {'loss': 0.562, 'learning_rate': 1.9600170726755204e-05, 'epoch': 0.24} {'loss': 0.4779, 'learning_rate': 1.96000766672623e-05, 'epoch': 0.24} {'loss': 0.5412, 'learning_rate': 1.9599982596932737e-05, 'epoch': 0.24} {'loss': 0.4967, 'learning_rate': 1.9599888515766617e-05, 'epoch': 0.24} {'loss': 0.5619, 'learning_rate': 1.959979442376405e-05, 'epoch': 0.24} {'loss': 0.4722, 'learning_rate': 1.959970032092514e-05, 'epoch': 0.24} {'loss': 0.5994, 'learning_rate': 1.9599606207249993e-05, 'epoch': 0.24} {'loss': 0.4609, 'learning_rate': 1.9599512082738714e-05, 'epoch': 0.24} {'loss': 0.5276, 'learning_rate': 1.9599417947391414e-05, 'epoch': 0.24} {'loss': 0.6813, 'learning_rate': 1.9599323801208197e-05, 'epoch': 0.24} {'loss': 0.6097, 'learning_rate': 1.959922964418917e-05, 'epoch': 0.24} {'loss': 0.7553, 'learning_rate': 1.9599135476334435e-05, 'epoch': 0.24} {'loss': 0.5837, 'learning_rate': 1.9599041297644103e-05, 'epoch': 0.24} {'loss': 0.6558, 'learning_rate': 1.9598947108118275e-05, 'epoch': 0.24} {'loss': 0.6119, 'learning_rate': 1.9598852907757066e-05, 'epoch': 0.24} {'loss': 0.4743, 'learning_rate': 1.9598758696560578e-05, 'epoch': 0.24} {'loss': 0.6145, 'learning_rate': 1.959866447452891e-05, 'epoch': 0.24} {'loss': 0.598, 'learning_rate': 1.9598570241662183e-05, 'epoch': 0.24} {'loss': 0.5799, 'learning_rate': 1.959847599796049e-05, 'epoch': 0.24} {'loss': 0.4901, 'learning_rate': 1.9598381743423945e-05, 'epoch': 0.24} {'loss': 0.5814, 'learning_rate': 1.9598287478052652e-05, 'epoch': 0.24} {'loss': 0.542, 'learning_rate': 1.9598193201846717e-05, 'epoch': 0.24} {'loss': 0.5042, 'learning_rate': 1.9598098914806248e-05, 'epoch': 0.24} {'loss': 0.4556, 'learning_rate': 1.9598004616931353e-05, 'epoch': 0.24} {'loss': 0.5098, 'learning_rate': 1.959791030822213e-05, 'epoch': 0.24} {'loss': 0.58, 'learning_rate': 1.9597815988678698e-05, 'epoch': 0.24} {'loss': 0.6972, 'learning_rate': 1.9597721658301153e-05, 'epoch': 0.24} {'loss': 0.6937, 'learning_rate': 1.9597627317089603e-05, 'epoch': 0.24} {'loss': 0.6684, 'learning_rate': 1.959753296504416e-05, 'epoch': 0.24} {'loss': 0.5558, 'learning_rate': 1.9597438602164928e-05, 'epoch': 0.24} {'loss': 0.5476, 'learning_rate': 1.9597344228452013e-05, 'epoch': 0.24} {'loss': 0.6877, 'learning_rate': 1.959724984390552e-05, 'epoch': 0.24} {'loss': 0.5989, 'learning_rate': 1.9597155448525558e-05, 'epoch': 0.24} {'loss': 0.6121, 'learning_rate': 1.9597061042312232e-05, 'epoch': 0.24} {'loss': 0.6415, 'learning_rate': 1.9596966625265647e-05, 'epoch': 0.24} {'loss': 0.5192, 'learning_rate': 1.9596872197385913e-05, 'epoch': 0.24} {'loss': 0.559, 'learning_rate': 1.9596777758673136e-05, 'epoch': 0.24} {'loss': 0.3914, 'learning_rate': 1.959668330912742e-05, 'epoch': 0.24} {'loss': 0.7058, 'learning_rate': 1.9596588848748875e-05, 'epoch': 0.24} {'loss': 0.7181, 'learning_rate': 1.9596494377537606e-05, 'epoch': 0.24} {'loss': 0.5371, 'learning_rate': 1.959639989549372e-05, 'epoch': 0.24} {'loss': 0.5839, 'learning_rate': 1.9596305402617322e-05, 'epoch': 0.24} {'loss': 0.5459, 'learning_rate': 1.9596210898908522e-05, 'epoch': 0.24} {'loss': 0.5757, 'learning_rate': 1.959611638436742e-05, 'epoch': 0.24} {'loss': 0.625, 'learning_rate': 1.959602185899413e-05, 'epoch': 0.24} {'loss': 0.5904, 'learning_rate': 1.9595927322788763e-05, 'epoch': 0.24} {'loss': 0.6882, 'learning_rate': 1.9595832775751412e-05, 'epoch': 0.24} {'loss': 0.5386, 'learning_rate': 1.959573821788219e-05, 'epoch': 0.24} {'loss': 0.6473, 'learning_rate': 1.9595643649181206e-05, 'epoch': 0.24} {'loss': 0.6229, 'learning_rate': 1.9595549069648565e-05, 'epoch': 0.24} {'loss': 0.6362, 'learning_rate': 1.9595454479284374e-05, 'epoch': 0.24} {'loss': 0.5382, 'learning_rate': 1.959535987808874e-05, 'epoch': 0.24} {'loss': 0.6165, 'learning_rate': 1.9595265266061766e-05, 'epoch': 0.24} {'loss': 0.4036, 'learning_rate': 1.9595170643203562e-05, 'epoch': 0.24} {'loss': 0.5021, 'learning_rate': 1.959507600951424e-05, 'epoch': 0.24} {'loss': 0.5194, 'learning_rate': 1.95949813649939e-05, 'epoch': 0.24} {'loss': 0.5787, 'learning_rate': 1.9594886709642647e-05, 'epoch': 0.24} {'loss': 0.682, 'learning_rate': 1.9594792043460595e-05, 'epoch': 0.24} {'loss': 0.4908, 'learning_rate': 1.9594697366447848e-05, 'epoch': 0.24} {'loss': 0.6475, 'learning_rate': 1.9594602678604507e-05, 'epoch': 0.24} {'loss': 0.5451, 'learning_rate': 1.959450797993069e-05, 'epoch': 0.24} {'loss': 0.3978, 'learning_rate': 1.9594413270426496e-05, 'epoch': 0.24} {'loss': 0.5663, 'learning_rate': 1.9594318550092035e-05, 'epoch': 0.24} {'loss': 0.5478, 'learning_rate': 1.959422381892741e-05, 'epoch': 0.24} {'loss': 0.7054, 'learning_rate': 1.959412907693273e-05, 'epoch': 0.24} {'loss': 0.7335, 'learning_rate': 1.959403432410811e-05, 'epoch': 0.24} {'loss': 0.5841, 'learning_rate': 1.9593939560453643e-05, 'epoch': 0.24} {'loss': 0.4971, 'learning_rate': 1.9593844785969443e-05, 'epoch': 0.24} {'loss': 0.5152, 'learning_rate': 1.959375000065562e-05, 'epoch': 0.24} {'loss': 0.6661, 'learning_rate': 1.9593655204512272e-05, 'epoch': 0.24} {'loss': 0.5404, 'learning_rate': 1.9593560397539514e-05, 'epoch': 0.24} {'loss': 0.5846, 'learning_rate': 1.9593465579737453e-05, 'epoch': 0.24} {'loss': 0.6092, 'learning_rate': 1.9593370751106194e-05, 'epoch': 0.24} {'loss': 0.5766, 'learning_rate': 1.9593275911645843e-05, 'epoch': 0.24} {'loss': 0.4733, 'learning_rate': 1.9593181061356504e-05, 'epoch': 0.24} {'loss': 0.5003, 'learning_rate': 1.959308620023829e-05, 'epoch': 0.24} {'loss': 0.7263, 'learning_rate': 1.9592991328291307e-05, 'epoch': 0.24} {'loss': 0.5904, 'learning_rate': 1.959289644551566e-05, 'epoch': 0.24} {'loss': 0.4853, 'learning_rate': 1.959280155191146e-05, 'epoch': 0.24} {'loss': 0.6072, 'learning_rate': 1.9592706647478805e-05, 'epoch': 0.24} {'loss': 0.4815, 'learning_rate': 1.9592611732217814e-05, 'epoch': 0.24} {'loss': 0.6522, 'learning_rate': 1.9592516806128584e-05, 'epoch': 0.24} {'loss': 0.6666, 'learning_rate': 1.9592421869211227e-05, 'epoch': 0.24} {'loss': 0.6155, 'learning_rate': 1.9592326921465856e-05, 'epoch': 0.24} {'loss': 0.489, 'learning_rate': 1.9592231962892567e-05, 'epoch': 0.24} {'loss': 0.7244, 'learning_rate': 1.9592136993491473e-05, 'epoch': 0.24} {'loss': 0.51, 'learning_rate': 1.959204201326268e-05, 'epoch': 0.24} {'loss': 0.5855, 'learning_rate': 1.9591947022206293e-05, 'epoch': 0.24} {'loss': 0.5143, 'learning_rate': 1.9591852020322428e-05, 'epoch': 0.24} {'loss': 0.6139, 'learning_rate': 1.9591757007611184e-05, 'epoch': 0.24} {'loss': 0.5366, 'learning_rate': 1.9591661984072667e-05, 'epoch': 0.24} {'loss': 0.6381, 'learning_rate': 1.959156694970699e-05, 'epoch': 0.24} {'loss': 0.417, 'learning_rate': 1.9591471904514258e-05, 'epoch': 0.24} {'loss': 0.6684, 'learning_rate': 1.9591376848494575e-05, 'epoch': 0.24} {'loss': 0.4217, 'learning_rate': 1.9591281781648056e-05, 'epoch': 0.24} {'loss': 0.5212, 'learning_rate': 1.95911867039748e-05, 'epoch': 0.24} {'loss': 0.4774, 'learning_rate': 1.959109161547492e-05, 'epoch': 0.24} {'loss': 0.6691, 'learning_rate': 1.959099651614852e-05, 'epoch': 0.24} {'loss': 0.5531, 'learning_rate': 1.959090140599571e-05, 'epoch': 0.24} {'loss': 0.4132, 'learning_rate': 1.9590806285016597e-05, 'epoch': 0.24} {'loss': 0.6789, 'learning_rate': 1.9590711153211284e-05, 'epoch': 0.24} {'loss': 0.5788, 'learning_rate': 1.9590616010579888e-05, 'epoch': 0.24} {'loss': 0.5427, 'learning_rate': 1.9590520857122505e-05, 'epoch': 0.24} {'loss': 0.6601, 'learning_rate': 1.959042569283925e-05, 'epoch': 0.24} {'loss': 0.5827, 'learning_rate': 1.9590330517730227e-05, 'epoch': 0.24} {'loss': 0.5381, 'learning_rate': 1.9590235331795545e-05, 'epoch': 0.24} {'loss': 0.6532, 'learning_rate': 1.959014013503531e-05, 'epoch': 0.24} {'loss': 0.4656, 'learning_rate': 1.9590044927449633e-05, 'epoch': 0.24} {'loss': 0.5534, 'learning_rate': 1.9589949709038616e-05, 'epoch': 0.24} {'loss': 0.6104, 'learning_rate': 1.9589854479802373e-05, 'epoch': 0.24} {'loss': 0.6468, 'learning_rate': 1.9589759239741e-05, 'epoch': 0.24} {'loss': 0.6177, 'learning_rate': 1.958966398885462e-05, 'epoch': 0.24} {'loss': 0.4779, 'learning_rate': 1.958956872714333e-05, 'epoch': 0.24} {'loss': 0.5461, 'learning_rate': 1.9589473454607244e-05, 'epoch': 0.24} {'loss': 0.5877, 'learning_rate': 1.9589378171246463e-05, 'epoch': 0.24} {'loss': 0.5535, 'learning_rate': 1.95892828770611e-05, 'epoch': 0.24} {'loss': 0.5078, 'learning_rate': 1.9589187572051256e-05, 'epoch': 0.24} {'loss': 0.5711, 'learning_rate': 1.9589092256217045e-05, 'epoch': 0.24} {'loss': 0.4274, 'learning_rate': 1.9588996929558572e-05, 'epoch': 0.24} {'loss': 0.5821, 'learning_rate': 1.9588901592075943e-05, 'epoch': 0.24} {'loss': 0.6667, 'learning_rate': 1.958880624376927e-05, 'epoch': 0.24} {'loss': 0.52, 'learning_rate': 1.9588710884638654e-05, 'epoch': 0.24} {'loss': 0.5515, 'learning_rate': 1.9588615514684214e-05, 'epoch': 0.24} {'loss': 0.7025, 'learning_rate': 1.9588520133906045e-05, 'epoch': 0.24} {'loss': 0.6244, 'learning_rate': 1.9588424742304265e-05, 'epoch': 0.24} {'loss': 0.5402, 'learning_rate': 1.958832933987897e-05, 'epoch': 0.24} {'loss': 0.5687, 'learning_rate': 1.9588233926630277e-05, 'epoch': 0.24} {'loss': 0.5811, 'learning_rate': 1.9588138502558295e-05, 'epoch': 0.24} {'loss': 0.4677, 'learning_rate': 1.9588043067663123e-05, 'epoch': 0.24} {'loss': 0.6173, 'learning_rate': 1.958794762194488e-05, 'epoch': 0.24} {'loss': 0.6669, 'learning_rate': 1.958785216540366e-05, 'epoch': 0.24} {'loss': 0.584, 'learning_rate': 1.9587756698039583e-05, 'epoch': 0.24} {'loss': 0.5927, 'learning_rate': 1.9587661219852747e-05, 'epoch': 0.24} {'loss': 0.4257, 'learning_rate': 1.958756573084327e-05, 'epoch': 0.24} {'loss': 0.5357, 'learning_rate': 1.958747023101125e-05, 'epoch': 0.24} {'loss': 0.5048, 'learning_rate': 1.9587374720356802e-05, 'epoch': 0.24} {'loss': 0.664, 'learning_rate': 1.9587279198880033e-05, 'epoch': 0.24} {'loss': 0.7055, 'learning_rate': 1.9587183666581046e-05, 'epoch': 0.24} {'loss': 0.3807, 'learning_rate': 1.9587088123459953e-05, 'epoch': 0.24} {'loss': 0.4764, 'learning_rate': 1.9586992569516858e-05, 'epoch': 0.24} {'loss': 0.5865, 'learning_rate': 1.9586897004751874e-05, 'epoch': 0.24} {'loss': 0.4216, 'learning_rate': 1.9586801429165106e-05, 'epoch': 0.24} {'loss': 0.4984, 'learning_rate': 1.9586705842756658e-05, 'epoch': 0.24} {'loss': 0.5895, 'learning_rate': 1.9586610245526646e-05, 'epoch': 0.24} {'loss': 0.6057, 'learning_rate': 1.9586514637475175e-05, 'epoch': 0.24} {'loss': 0.6519, 'learning_rate': 1.9586419018602353e-05, 'epoch': 0.24} {'loss': 0.498, 'learning_rate': 1.958632338890828e-05, 'epoch': 0.24} {'loss': 0.4318, 'learning_rate': 1.958622774839308e-05, 'epoch': 0.24} {'loss': 0.5323, 'learning_rate': 1.9586132097056846e-05, 'epoch': 0.24} {'loss': 0.4883, 'learning_rate': 1.9586036434899692e-05, 'epoch': 0.24} {'loss': 0.6427, 'learning_rate': 1.9585940761921726e-05, 'epoch': 0.24} {'loss': 0.4739, 'learning_rate': 1.958584507812306e-05, 'epoch': 0.24} {'loss': 0.6996, 'learning_rate': 1.958574938350379e-05, 'epoch': 0.24} {'loss': 0.6013, 'learning_rate': 1.958565367806404e-05, 'epoch': 0.24} {'loss': 0.5867, 'learning_rate': 1.9585557961803902e-05, 'epoch': 0.24} {'loss': 0.5422, 'learning_rate': 1.95854622347235e-05, 'epoch': 0.24} {'loss': 0.5627, 'learning_rate': 1.9585366496822927e-05, 'epoch': 0.24} {'loss': 0.5461, 'learning_rate': 1.95852707481023e-05, 'epoch': 0.24} {'loss': 0.685, 'learning_rate': 1.9585174988561726e-05, 'epoch': 0.24} {'loss': 0.7017, 'learning_rate': 1.958507921820131e-05, 'epoch': 0.24} {'loss': 0.5818, 'learning_rate': 1.9584983437021164e-05, 'epoch': 0.24} {'loss': 0.5537, 'learning_rate': 1.9584887645021394e-05, 'epoch': 0.24} {'loss': 0.5031, 'learning_rate': 1.958479184220211e-05, 'epoch': 0.24} {'loss': 0.7427, 'learning_rate': 1.9584696028563416e-05, 'epoch': 0.24} {'loss': 0.5034, 'learning_rate': 1.9584600204105425e-05, 'epoch': 0.24} {'loss': 0.6312, 'learning_rate': 1.958450436882824e-05, 'epoch': 0.24} {'loss': 0.4647, 'learning_rate': 1.9584408522731974e-05, 'epoch': 0.24} {'loss': 0.6033, 'learning_rate': 1.9584312665816737e-05, 'epoch': 0.24} {'loss': 0.5263, 'learning_rate': 1.958421679808263e-05, 'epoch': 0.24} {'loss': 0.5713, 'learning_rate': 1.9584120919529764e-05, 'epoch': 0.24} {'loss': 0.7249, 'learning_rate': 1.9584025030158248e-05, 'epoch': 0.24} {'loss': 0.6132, 'learning_rate': 1.958392912996819e-05, 'epoch': 0.24} {'loss': 0.5875, 'learning_rate': 1.95838332189597e-05, 'epoch': 0.24} {'loss': 0.5484, 'learning_rate': 1.9583737297132885e-05, 'epoch': 0.24} {'loss': 0.4949, 'learning_rate': 1.9583641364487854e-05, 'epoch': 0.24} {'loss': 0.5313, 'learning_rate': 1.958354542102471e-05, 'epoch': 0.24} {'loss': 0.557, 'learning_rate': 1.958344946674357e-05, 'epoch': 0.24} {'loss': 0.5278, 'learning_rate': 1.9583353501644534e-05, 'epoch': 0.24} {'loss': 0.5828, 'learning_rate': 1.9583257525727718e-05, 'epoch': 0.24} {'loss': 0.5925, 'learning_rate': 1.9583161538993227e-05, 'epoch': 0.24} {'loss': 0.6231, 'learning_rate': 1.9583065541441163e-05, 'epoch': 0.24} {'loss': 0.5457, 'learning_rate': 1.9582969533071648e-05, 'epoch': 0.24} {'loss': 0.5457, 'learning_rate': 1.958287351388478e-05, 'epoch': 0.24} {'loss': 0.6172, 'learning_rate': 1.9582777483880665e-05, 'epoch': 0.24} {'loss': 0.5574, 'learning_rate': 1.9582681443059424e-05, 'epoch': 0.24} {'loss': 0.7112, 'learning_rate': 1.9582585391421155e-05, 'epoch': 0.24} {'loss': 0.5666, 'learning_rate': 1.9582489328965968e-05, 'epoch': 0.24} {'loss': 0.5885, 'learning_rate': 1.9582393255693973e-05, 'epoch': 0.24} {'loss': 0.5592, 'learning_rate': 1.958229717160528e-05, 'epoch': 0.24} {'loss': 0.5259, 'learning_rate': 1.9582201076699992e-05, 'epoch': 0.24} {'loss': 0.5829, 'learning_rate': 1.9582104970978222e-05, 'epoch': 0.24} {'loss': 0.6166, 'learning_rate': 1.958200885444008e-05, 'epoch': 0.24} {'loss': 0.4457, 'learning_rate': 1.958191272708567e-05, 'epoch': 0.24} {'loss': 0.5641, 'learning_rate': 1.9581816588915106e-05, 'epoch': 0.24} {'loss': 0.5452, 'learning_rate': 1.958172043992849e-05, 'epoch': 0.24} {'loss': 0.7342, 'learning_rate': 1.9581624280125933e-05, 'epoch': 0.24} {'loss': 0.5574, 'learning_rate': 1.958152810950755e-05, 'epoch': 0.24} {'loss': 0.5872, 'learning_rate': 1.9581431928073438e-05, 'epoch': 0.24} {'loss': 0.7092, 'learning_rate': 1.9581335735823712e-05, 'epoch': 0.24} {'loss': 0.7205, 'learning_rate': 1.958123953275848e-05, 'epoch': 0.24} {'loss': 0.654, 'learning_rate': 1.958114331887785e-05, 'epoch': 0.24} {'loss': 0.5476, 'learning_rate': 1.9581047094181932e-05, 'epoch': 0.24} {'loss': 0.543, 'learning_rate': 1.9580950858670835e-05, 'epoch': 0.24} {'loss': 0.5278, 'learning_rate': 1.958085461234467e-05, 'epoch': 0.24} {'loss': 0.4925, 'learning_rate': 1.9580758355203537e-05, 'epoch': 0.24} {'loss': 0.6659, 'learning_rate': 1.9580662087247548e-05, 'epoch': 0.24} {'loss': 0.6811, 'learning_rate': 1.958056580847682e-05, 'epoch': 0.24} {'loss': 0.5854, 'learning_rate': 1.9580469518891443e-05, 'epoch': 0.24} {'loss': 0.6964, 'learning_rate': 1.958037321849155e-05, 'epoch': 0.24} {'loss': 0.5888, 'learning_rate': 1.958027690727723e-05, 'epoch': 0.24} {'loss': 0.6856, 'learning_rate': 1.9580180585248604e-05, 'epoch': 0.24} {'loss': 0.519, 'learning_rate': 1.9580084252405775e-05, 'epoch': 0.24} {'loss': 0.6118, 'learning_rate': 1.957998790874885e-05, 'epoch': 0.24} {'loss': 0.5641, 'learning_rate': 1.9579891554277945e-05, 'epoch': 0.24} {'loss': 0.4921, 'learning_rate': 1.9579795188993157e-05, 'epoch': 0.24} {'loss': 0.6071, 'learning_rate': 1.9579698812894605e-05, 'epoch': 0.24} {'loss': 0.4118, 'learning_rate': 1.9579602425982397e-05, 'epoch': 0.24} {'loss': 0.6107, 'learning_rate': 1.9579506028256637e-05, 'epoch': 0.24} {'loss': 0.5182, 'learning_rate': 1.957940961971744e-05, 'epoch': 0.24} {'loss': 0.6027, 'learning_rate': 1.9579313200364908e-05, 'epoch': 0.24} {'loss': 0.5185, 'learning_rate': 1.9579216770199152e-05, 'epoch': 0.24} {'loss': 0.7119, 'learning_rate': 1.9579120329220285e-05, 'epoch': 0.24} {'loss': 0.575, 'learning_rate': 1.957902387742841e-05, 'epoch': 0.24} {'loss': 0.6481, 'learning_rate': 1.957892741482364e-05, 'epoch': 0.24} {'loss': 0.4855, 'learning_rate': 1.957883094140608e-05, 'epoch': 0.24} {'loss': 0.4787, 'learning_rate': 1.9578734457175844e-05, 'epoch': 0.24} {'loss': 0.4619, 'learning_rate': 1.957863796213304e-05, 'epoch': 0.24} {'loss': 0.7058, 'learning_rate': 1.9578541456277775e-05, 'epoch': 0.24} {'loss': 0.7179, 'learning_rate': 1.9578444939610154e-05, 'epoch': 0.24} {'loss': 0.4051, 'learning_rate': 1.9578348412130294e-05, 'epoch': 0.24} {'loss': 0.6084, 'learning_rate': 1.9578251873838295e-05, 'epoch': 0.24} {'loss': 0.6192, 'learning_rate': 1.9578155324734277e-05, 'epoch': 0.24} {'loss': 0.6186, 'learning_rate': 1.957805876481834e-05, 'epoch': 0.24} {'loss': 0.5914, 'learning_rate': 1.9577962194090597e-05, 'epoch': 0.24} {'loss': 0.706, 'learning_rate': 1.9577865612551156e-05, 'epoch': 0.24} {'loss': 0.526, 'learning_rate': 1.9577769020200122e-05, 'epoch': 0.24} {'loss': 0.7122, 'learning_rate': 1.957767241703761e-05, 'epoch': 0.24} {'loss': 0.6304, 'learning_rate': 1.957757580306373e-05, 'epoch': 0.24} {'loss': 0.728, 'learning_rate': 1.9577479178278588e-05, 'epoch': 0.24} {'loss': 0.5735, 'learning_rate': 1.9577382542682294e-05, 'epoch': 0.24} {'loss': 0.6385, 'learning_rate': 1.9577285896274952e-05, 'epoch': 0.24} {'loss': 0.4881, 'learning_rate': 1.957718923905668e-05, 'epoch': 0.24} {'loss': 0.6985, 'learning_rate': 1.9577092571027577e-05, 'epoch': 0.24} {'loss': 0.6457, 'learning_rate': 1.957699589218776e-05, 'epoch': 0.24} {'loss': 0.7804, 'learning_rate': 1.9576899202537337e-05, 'epoch': 0.24} {'loss': 0.4837, 'learning_rate': 1.957680250207642e-05, 'epoch': 0.24} {'loss': 0.5279, 'learning_rate': 1.9576705790805107e-05, 'epoch': 0.24} {'loss': 0.5874, 'learning_rate': 1.9576609068723516e-05, 'epoch': 0.24} {'loss': 0.5265, 'learning_rate': 1.9576512335831756e-05, 'epoch': 0.24} {'loss': 0.6573, 'learning_rate': 1.9576415592129934e-05, 'epoch': 0.24} {'loss': 0.5904, 'learning_rate': 1.957631883761816e-05, 'epoch': 0.24} {'loss': 0.681, 'learning_rate': 1.9576222072296543e-05, 'epoch': 0.24} {'loss': 0.649, 'learning_rate': 1.9576125296165194e-05, 'epoch': 0.24} {'loss': 0.6997, 'learning_rate': 1.9576028509224217e-05, 'epoch': 0.24} {'loss': 0.4049, 'learning_rate': 1.9575931711473725e-05, 'epoch': 0.24} {'loss': 0.45, 'learning_rate': 1.957583490291383e-05, 'epoch': 0.24} {'loss': 0.6165, 'learning_rate': 1.957573808354464e-05, 'epoch': 0.24} {'loss': 0.6865, 'learning_rate': 1.957564125336626e-05, 'epoch': 0.24} {'loss': 0.5898, 'learning_rate': 1.9575544412378796e-05, 'epoch': 0.24} {'loss': 0.5695, 'learning_rate': 1.957544756058237e-05, 'epoch': 0.24} {'loss': 0.4081, 'learning_rate': 1.9575350697977082e-05, 'epoch': 0.24} {'loss': 0.4751, 'learning_rate': 1.9575253824563047e-05, 'epoch': 0.24} {'loss': 0.6715, 'learning_rate': 1.957515694034037e-05, 'epoch': 0.24} {'loss': 0.3343, 'learning_rate': 1.957506004530916e-05, 'epoch': 0.24} {'loss': 0.6069, 'learning_rate': 1.9574963139469528e-05, 'epoch': 0.24} {'loss': 0.5727, 'learning_rate': 1.9574866222821586e-05, 'epoch': 0.24} {'loss': 0.4804, 'learning_rate': 1.957476929536544e-05, 'epoch': 0.24} {'loss': 0.6717, 'learning_rate': 1.9574672357101197e-05, 'epoch': 0.24} {'loss': 0.5773, 'learning_rate': 1.9574575408028973e-05, 'epoch': 0.24} {'loss': 0.5789, 'learning_rate': 1.9574478448148873e-05, 'epoch': 0.24} {'loss': 0.7062, 'learning_rate': 1.9574381477461005e-05, 'epoch': 0.24} {'loss': 0.5209, 'learning_rate': 1.9574284495965488e-05, 'epoch': 0.24} {'loss': 0.4697, 'learning_rate': 1.9574187503662417e-05, 'epoch': 0.24} {'loss': 0.5004, 'learning_rate': 1.9574090500551913e-05, 'epoch': 0.24} {'loss': 0.6407, 'learning_rate': 1.957399348663408e-05, 'epoch': 0.24} {'loss': 0.5278, 'learning_rate': 1.9573896461909026e-05, 'epoch': 0.24} {'loss': 0.5788, 'learning_rate': 1.957379942637687e-05, 'epoch': 0.24} {'loss': 0.6293, 'learning_rate': 1.957370238003771e-05, 'epoch': 0.24} {'loss': 0.6138, 'learning_rate': 1.9573605322891662e-05, 'epoch': 0.24} {'loss': 0.5673, 'learning_rate': 1.9573508254938835e-05, 'epoch': 0.24} {'loss': 0.5607, 'learning_rate': 1.9573411176179338e-05, 'epoch': 0.24} {'loss': 0.5464, 'learning_rate': 1.957331408661328e-05, 'epoch': 0.24} {'loss': 0.6149, 'learning_rate': 1.9573216986240767e-05, 'epoch': 0.24} {'loss': 0.5363, 'learning_rate': 1.9573119875061917e-05, 'epoch': 0.24} {'loss': 0.651, 'learning_rate': 1.9573022753076835e-05, 'epoch': 0.24} {'loss': 0.5878, 'learning_rate': 1.9572925620285628e-05, 'epoch': 0.24} {'loss': 0.517, 'learning_rate': 1.9572828476688408e-05, 'epoch': 0.24} {'loss': 0.4687, 'learning_rate': 1.9572731322285287e-05, 'epoch': 0.24} {'loss': 0.6556, 'learning_rate': 1.9572634157076374e-05, 'epoch': 0.24} {'loss': 0.5246, 'learning_rate': 1.9572536981061777e-05, 'epoch': 0.24} {'loss': 0.5757, 'learning_rate': 1.95724397942416e-05, 'epoch': 0.24} {'loss': 0.4634, 'learning_rate': 1.9572342596615965e-05, 'epoch': 0.24} {'loss': 0.6635, 'learning_rate': 1.9572245388184976e-05, 'epoch': 0.24} {'loss': 0.6431, 'learning_rate': 1.9572148168948737e-05, 'epoch': 0.24} {'loss': 0.5676, 'learning_rate': 1.9572050938907367e-05, 'epoch': 0.24} {'loss': 0.534, 'learning_rate': 1.9571953698060973e-05, 'epoch': 0.24} {'loss': 0.5958, 'learning_rate': 1.957185644640966e-05, 'epoch': 0.24} {'loss': 0.6096, 'learning_rate': 1.9571759183953542e-05, 'epoch': 0.24} {'loss': 0.4016, 'learning_rate': 1.957166191069273e-05, 'epoch': 0.24} {'loss': 0.6147, 'learning_rate': 1.957156462662733e-05, 'epoch': 0.24} {'loss': 0.522, 'learning_rate': 1.9571467331757456e-05, 'epoch': 0.24} {'loss': 0.623, 'learning_rate': 1.9571370026083212e-05, 'epoch': 0.24} {'loss': 0.6719, 'learning_rate': 1.957127270960471e-05, 'epoch': 0.24} {'loss': 0.522, 'learning_rate': 1.9571175382322065e-05, 'epoch': 0.24} {'loss': 0.6123, 'learning_rate': 1.9571078044235384e-05, 'epoch': 0.24} {'loss': 0.5132, 'learning_rate': 1.957098069534477e-05, 'epoch': 0.24} {'loss': 0.5261, 'learning_rate': 1.9570883335650347e-05, 'epoch': 0.24} {'loss': 0.5045, 'learning_rate': 1.957078596515221e-05, 'epoch': 0.24} {'loss': 0.4364, 'learning_rate': 1.957068858385048e-05, 'epoch': 0.24} {'loss': 0.4985, 'learning_rate': 1.957059119174526e-05, 'epoch': 0.24} {'loss': 0.5867, 'learning_rate': 1.9570493788836664e-05, 'epoch': 0.24} {'loss': 0.5847, 'learning_rate': 1.9570396375124798e-05, 'epoch': 0.24} {'loss': 0.5436, 'learning_rate': 1.9570298950609775e-05, 'epoch': 0.24} {'loss': 0.491, 'learning_rate': 1.9570201515291708e-05, 'epoch': 0.24} {'loss': 0.5797, 'learning_rate': 1.9570104069170698e-05, 'epoch': 0.24} {'loss': 0.6397, 'learning_rate': 1.9570006612246863e-05, 'epoch': 0.24} {'loss': 0.5949, 'learning_rate': 1.956990914452031e-05, 'epoch': 0.24} {'loss': 0.634, 'learning_rate': 1.956981166599115e-05, 'epoch': 0.24} {'loss': 0.5743, 'learning_rate': 1.9569714176659494e-05, 'epoch': 0.24} {'loss': 0.6275, 'learning_rate': 1.9569616676525446e-05, 'epoch': 0.24} {'loss': 0.5456, 'learning_rate': 1.9569519165589125e-05, 'epoch': 0.24} {'loss': 0.5025, 'learning_rate': 1.956942164385063e-05, 'epoch': 0.24} {'loss': 0.4761, 'learning_rate': 1.9569324111310085e-05, 'epoch': 0.24} {'loss': 0.7697, 'learning_rate': 1.956922656796759e-05, 'epoch': 0.24} {'loss': 0.6023, 'learning_rate': 1.9569129013823257e-05, 'epoch': 0.24} {'loss': 0.5858, 'learning_rate': 1.95690314488772e-05, 'epoch': 0.24} {'loss': 0.5614, 'learning_rate': 1.9568933873129523e-05, 'epoch': 0.24} {'loss': 0.5626, 'learning_rate': 1.9568836286580343e-05, 'epoch': 0.24} {'loss': 0.4805, 'learning_rate': 1.9568738689229762e-05, 'epoch': 0.24} {'loss': 0.5725, 'learning_rate': 1.9568641081077895e-05, 'epoch': 0.24} {'loss': 0.7101, 'learning_rate': 1.9568543462124854e-05, 'epoch': 0.24} {'loss': 0.4707, 'learning_rate': 1.9568445832370746e-05, 'epoch': 0.24} {'loss': 0.4654, 'learning_rate': 1.956834819181568e-05, 'epoch': 0.24} {'loss': 0.6823, 'learning_rate': 1.9568250540459774e-05, 'epoch': 0.24} {'loss': 0.6515, 'learning_rate': 1.956815287830313e-05, 'epoch': 0.24} {'loss': 0.5997, 'learning_rate': 1.956805520534586e-05, 'epoch': 0.24} {'loss': 0.5477, 'learning_rate': 1.9567957521588075e-05, 'epoch': 0.24} {'loss': 0.558, 'learning_rate': 1.9567859827029885e-05, 'epoch': 0.24} {'loss': 0.6827, 'learning_rate': 1.95677621216714e-05, 'epoch': 0.24} {'loss': 0.5639, 'learning_rate': 1.9567664405512735e-05, 'epoch': 0.24} {'loss': 0.4491, 'learning_rate': 1.956756667855399e-05, 'epoch': 0.24} {'loss': 0.5772, 'learning_rate': 1.9567468940795288e-05, 'epoch': 0.24} {'loss': 0.589, 'learning_rate': 1.956737119223673e-05, 'epoch': 0.24} {'loss': 0.609, 'learning_rate': 1.9567273432878428e-05, 'epoch': 0.24} {'loss': 0.544, 'learning_rate': 1.9567175662720495e-05, 'epoch': 0.24} {'loss': 0.6411, 'learning_rate': 1.956707788176304e-05, 'epoch': 0.24} {'loss': 0.5751, 'learning_rate': 1.9566980090006174e-05, 'epoch': 0.24} {'loss': 0.4989, 'learning_rate': 1.9566882287450007e-05, 'epoch': 0.24} {'loss': 0.5566, 'learning_rate': 1.9566784474094647e-05, 'epoch': 0.24} {'loss': 0.5042, 'learning_rate': 1.9566686649940207e-05, 'epoch': 0.24} {'loss': 0.4057, 'learning_rate': 1.9566588814986798e-05, 'epoch': 0.24} {'loss': 0.6702, 'learning_rate': 1.956649096923453e-05, 'epoch': 0.24} {'loss': 0.5116, 'learning_rate': 1.956639311268351e-05, 'epoch': 0.24} {'loss': 0.4478, 'learning_rate': 1.9566295245333853e-05, 'epoch': 0.24} {'loss': 0.6366, 'learning_rate': 1.956619736718567e-05, 'epoch': 0.24} {'loss': 0.6054, 'learning_rate': 1.9566099478239064e-05, 'epoch': 0.24} {'loss': 0.5075, 'learning_rate': 1.9566001578494153e-05, 'epoch': 0.24} {'loss': 0.6612, 'learning_rate': 1.956590366795105e-05, 'epoch': 0.24} {'loss': 0.6287, 'learning_rate': 1.9565805746609855e-05, 'epoch': 0.24} {'loss': 0.4475, 'learning_rate': 1.9565707814470687e-05, 'epoch': 0.24} {'loss': 0.5217, 'learning_rate': 1.9565609871533652e-05, 'epoch': 0.24} {'loss': 0.6199, 'learning_rate': 1.9565511917798865e-05, 'epoch': 0.24} {'loss': 0.7443, 'learning_rate': 1.9565413953266433e-05, 'epoch': 0.24} {'loss': 0.6928, 'learning_rate': 1.9565315977936466e-05, 'epoch': 0.24} {'loss': 0.4371, 'learning_rate': 1.956521799180908e-05, 'epoch': 0.24} {'loss': 0.6762, 'learning_rate': 1.956511999488438e-05, 'epoch': 0.24} {'loss': 0.6079, 'learning_rate': 1.9565021987162477e-05, 'epoch': 0.24} {'loss': 0.4475, 'learning_rate': 1.9564923968643483e-05, 'epoch': 0.24} {'loss': 0.5499, 'learning_rate': 1.9564825939327508e-05, 'epoch': 0.24} {'loss': 0.554, 'learning_rate': 1.9564727899214662e-05, 'epoch': 0.24} {'loss': 0.5433, 'learning_rate': 1.9564629848305064e-05, 'epoch': 0.24} {'loss': 0.559, 'learning_rate': 1.956453178659881e-05, 'epoch': 0.24} {'loss': 0.5112, 'learning_rate': 1.9564433714096024e-05, 'epoch': 0.24} {'loss': 0.5669, 'learning_rate': 1.956433563079681e-05, 'epoch': 0.24} {'loss': 0.4322, 'learning_rate': 1.9564237536701278e-05, 'epoch': 0.24} {'loss': 0.5036, 'learning_rate': 1.9564139431809537e-05, 'epoch': 0.24} {'loss': 0.7191, 'learning_rate': 1.9564041316121708e-05, 'epoch': 0.24} {'loss': 0.4667, 'learning_rate': 1.9563943189637892e-05, 'epoch': 0.25} {'loss': 0.7466, 'learning_rate': 1.9563845052358207e-05, 'epoch': 0.25} {'loss': 0.6902, 'learning_rate': 1.9563746904282755e-05, 'epoch': 0.25} {'loss': 0.7817, 'learning_rate': 1.956364874541165e-05, 'epoch': 0.25} {'loss': 0.6424, 'learning_rate': 1.9563550575745008e-05, 'epoch': 0.25} {'loss': 0.6965, 'learning_rate': 1.9563452395282936e-05, 'epoch': 0.25} {'loss': 0.6306, 'learning_rate': 1.956335420402554e-05, 'epoch': 0.25} {'loss': 0.7262, 'learning_rate': 1.9563256001972942e-05, 'epoch': 0.25} {'loss': 0.6003, 'learning_rate': 1.9563157789125243e-05, 'epoch': 0.25} {'loss': 0.582, 'learning_rate': 1.9563059565482557e-05, 'epoch': 0.25} {'loss': 0.5445, 'learning_rate': 1.9562961331044995e-05, 'epoch': 0.25} {'loss': 0.5054, 'learning_rate': 1.956286308581267e-05, 'epoch': 0.25} {'loss': 0.6973, 'learning_rate': 1.9562764829785693e-05, 'epoch': 0.25} {'loss': 0.5576, 'learning_rate': 1.9562666562964167e-05, 'epoch': 0.25} {'loss': 0.6573, 'learning_rate': 1.9562568285348212e-05, 'epoch': 0.25} {'loss': 0.421, 'learning_rate': 1.9562469996937938e-05, 'epoch': 0.25} {'loss': 0.547, 'learning_rate': 1.956237169773345e-05, 'epoch': 0.25} {'loss': 0.6561, 'learning_rate': 1.9562273387734865e-05, 'epoch': 0.25} {'loss': 0.4911, 'learning_rate': 1.9562175066942293e-05, 'epoch': 0.25} {'loss': 0.5529, 'learning_rate': 1.956207673535584e-05, 'epoch': 0.25} {'loss': 0.724, 'learning_rate': 1.9561978392975623e-05, 'epoch': 0.25} {'loss': 0.4256, 'learning_rate': 1.956188003980175e-05, 'epoch': 0.25} {'loss': 0.5741, 'learning_rate': 1.9561781675834335e-05, 'epoch': 0.25} {'loss': 0.5997, 'learning_rate': 1.9561683301073483e-05, 'epoch': 0.25} {'loss': 0.6277, 'learning_rate': 1.956158491551931e-05, 'epoch': 0.25} {'loss': 0.478, 'learning_rate': 1.9561486519171925e-05, 'epoch': 0.25} {'loss': 0.711, 'learning_rate': 1.9561388112031443e-05, 'epoch': 0.25} {'loss': 0.6162, 'learning_rate': 1.9561289694097972e-05, 'epoch': 0.25} {'loss': 0.5584, 'learning_rate': 1.956119126537162e-05, 'epoch': 0.25} {'loss': 0.5582, 'learning_rate': 1.9561092825852502e-05, 'epoch': 0.25} {'loss': 0.6889, 'learning_rate': 1.956099437554073e-05, 'epoch': 0.25} {'loss': 0.4907, 'learning_rate': 1.9560895914436415e-05, 'epoch': 0.25} {'loss': 0.6539, 'learning_rate': 1.956079744253966e-05, 'epoch': 0.25} {'loss': 0.4729, 'learning_rate': 1.9560698959850585e-05, 'epoch': 0.25} {'loss': 0.5591, 'learning_rate': 1.9560600466369304e-05, 'epoch': 0.25} {'loss': 0.6804, 'learning_rate': 1.956050196209592e-05, 'epoch': 0.25} {'loss': 0.4727, 'learning_rate': 1.9560403447030543e-05, 'epoch': 0.25} {'loss': 0.6471, 'learning_rate': 1.9560304921173295e-05, 'epoch': 0.25} {'loss': 0.498, 'learning_rate': 1.9560206384524277e-05, 'epoch': 0.25} {'loss': 0.6724, 'learning_rate': 1.9560107837083605e-05, 'epoch': 0.25} {'loss': 0.4225, 'learning_rate': 1.956000927885139e-05, 'epoch': 0.25} {'loss': 0.573, 'learning_rate': 1.9559910709827745e-05, 'epoch': 0.25} {'loss': 0.5015, 'learning_rate': 1.9559812130012772e-05, 'epoch': 0.25} {'loss': 0.7043, 'learning_rate': 1.9559713539406594e-05, 'epoch': 0.25} {'loss': 0.682, 'learning_rate': 1.9559614938009314e-05, 'epoch': 0.25} {'loss': 0.4624, 'learning_rate': 1.9559516325821047e-05, 'epoch': 0.25} {'loss': 0.5239, 'learning_rate': 1.9559417702841906e-05, 'epoch': 0.25} {'loss': 0.6169, 'learning_rate': 1.9559319069072003e-05, 'epoch': 0.25} {'loss': 0.6005, 'learning_rate': 1.955922042451144e-05, 'epoch': 0.25} {'loss': 0.6269, 'learning_rate': 1.955912176916034e-05, 'epoch': 0.25} {'loss': 0.5963, 'learning_rate': 1.9559023103018807e-05, 'epoch': 0.25} {'loss': 0.5774, 'learning_rate': 1.9558924426086957e-05, 'epoch': 0.25} {'loss': 0.6993, 'learning_rate': 1.9558825738364897e-05, 'epoch': 0.25} {'loss': 0.4082, 'learning_rate': 1.9558727039852738e-05, 'epoch': 0.25} {'loss': 0.5839, 'learning_rate': 1.9558628330550595e-05, 'epoch': 0.25} {'loss': 0.5608, 'learning_rate': 1.955852961045858e-05, 'epoch': 0.25} {'loss': 0.6483, 'learning_rate': 1.95584308795768e-05, 'epoch': 0.25} {'loss': 0.6422, 'learning_rate': 1.9558332137905373e-05, 'epoch': 0.25} {'loss': 0.5809, 'learning_rate': 1.9558233385444408e-05, 'epoch': 0.25} {'loss': 0.4953, 'learning_rate': 1.955813462219401e-05, 'epoch': 0.25} {'loss': 0.6089, 'learning_rate': 1.9558035848154297e-05, 'epoch': 0.25} {'loss': 0.671, 'learning_rate': 1.9557937063325378e-05, 'epoch': 0.25} {'loss': 0.6159, 'learning_rate': 1.955783826770737e-05, 'epoch': 0.25} {'loss': 0.5731, 'learning_rate': 1.9557739461300378e-05, 'epoch': 0.25} {'loss': 0.544, 'learning_rate': 1.9557640644104514e-05, 'epoch': 0.25} {'loss': 0.6325, 'learning_rate': 1.9557541816119893e-05, 'epoch': 0.25} {'loss': 0.4983, 'learning_rate': 1.955744297734662e-05, 'epoch': 0.25} {'loss': 0.5279, 'learning_rate': 1.9557344127784817e-05, 'epoch': 0.25} {'loss': 0.6195, 'learning_rate': 1.955724526743459e-05, 'epoch': 0.25} {'loss': 0.5224, 'learning_rate': 1.955714639629605e-05, 'epoch': 0.25} {'loss': 0.581, 'learning_rate': 1.9557047514369307e-05, 'epoch': 0.25} {'loss': 0.5439, 'learning_rate': 1.9556948621654475e-05, 'epoch': 0.25} {'loss': 0.5795, 'learning_rate': 1.9556849718151666e-05, 'epoch': 0.25} {'loss': 0.5007, 'learning_rate': 1.9556750803860988e-05, 'epoch': 0.25} {'loss': 0.5891, 'learning_rate': 1.955665187878256e-05, 'epoch': 0.25} {'loss': 0.5811, 'learning_rate': 1.9556552942916488e-05, 'epoch': 0.25} {'loss': 0.5577, 'learning_rate': 1.9556453996262883e-05, 'epoch': 0.25} {'loss': 0.6745, 'learning_rate': 1.9556355038821863e-05, 'epoch': 0.25} {'loss': 0.4646, 'learning_rate': 1.9556256070593532e-05, 'epoch': 0.25} {'loss': 0.7235, 'learning_rate': 1.9556157091578004e-05, 'epoch': 0.25} {'loss': 0.6446, 'learning_rate': 1.9556058101775395e-05, 'epoch': 0.25} {'loss': 0.4834, 'learning_rate': 1.9555959101185812e-05, 'epoch': 0.25} {'loss': 0.5135, 'learning_rate': 1.955586008980937e-05, 'epoch': 0.25} {'loss': 0.5282, 'learning_rate': 1.9555761067646176e-05, 'epoch': 0.25} {'loss': 0.6003, 'learning_rate': 1.955566203469635e-05, 'epoch': 0.25} {'loss': 0.6893, 'learning_rate': 1.9555562990959992e-05, 'epoch': 0.25} {'loss': 0.6232, 'learning_rate': 1.9555463936437222e-05, 'epoch': 0.25} {'loss': 0.4395, 'learning_rate': 1.9555364871128152e-05, 'epoch': 0.25} {'loss': 0.4443, 'learning_rate': 1.9555265795032893e-05, 'epoch': 0.25} {'loss': 0.5672, 'learning_rate': 1.9555166708151554e-05, 'epoch': 0.25} {'loss': 0.6489, 'learning_rate': 1.955506761048425e-05, 'epoch': 0.25} {'loss': 0.4387, 'learning_rate': 1.9554968502031092e-05, 'epoch': 0.25} {'loss': 0.6049, 'learning_rate': 1.955486938279219e-05, 'epoch': 0.25} {'loss': 0.6556, 'learning_rate': 1.9554770252767658e-05, 'epoch': 0.25} {'loss': 0.5737, 'learning_rate': 1.9554671111957608e-05, 'epoch': 0.25} {'loss': 0.5154, 'learning_rate': 1.9554571960362152e-05, 'epoch': 0.25} {'loss': 0.5329, 'learning_rate': 1.95544727979814e-05, 'epoch': 0.25} {'loss': 0.5566, 'learning_rate': 1.9554373624815466e-05, 'epoch': 0.25} {'loss': 0.6042, 'learning_rate': 1.955427444086446e-05, 'epoch': 0.25} {'loss': 0.5652, 'learning_rate': 1.9554175246128494e-05, 'epoch': 0.25} {'loss': 0.4026, 'learning_rate': 1.9554076040607682e-05, 'epoch': 0.25} {'loss': 0.5054, 'learning_rate': 1.9553976824302134e-05, 'epoch': 0.25} {'loss': 0.5794, 'learning_rate': 1.9553877597211963e-05, 'epoch': 0.25} {'loss': 0.6657, 'learning_rate': 1.9553778359337284e-05, 'epoch': 0.25} {'loss': 0.6394, 'learning_rate': 1.9553679110678202e-05, 'epoch': 0.25} {'loss': 0.5973, 'learning_rate': 1.9553579851234835e-05, 'epoch': 0.25} {'loss': 0.4199, 'learning_rate': 1.9553480581007295e-05, 'epoch': 0.25} {'loss': 0.741, 'learning_rate': 1.9553381299995688e-05, 'epoch': 0.25} {'loss': 0.5072, 'learning_rate': 1.9553282008200135e-05, 'epoch': 0.25} {'loss': 0.4588, 'learning_rate': 1.9553182705620738e-05, 'epoch': 0.25} {'loss': 0.5395, 'learning_rate': 1.9553083392257618e-05, 'epoch': 0.25} {'loss': 0.6184, 'learning_rate': 1.9552984068110882e-05, 'epoch': 0.25} {'loss': 0.5724, 'learning_rate': 1.9552884733180643e-05, 'epoch': 0.25} {'loss': 0.4297, 'learning_rate': 1.9552785387467015e-05, 'epoch': 0.25} {'loss': 0.6944, 'learning_rate': 1.9552686030970108e-05, 'epoch': 0.25} {'loss': 0.4356, 'learning_rate': 1.9552586663690035e-05, 'epoch': 0.25} {'loss': 0.4866, 'learning_rate': 1.955248728562691e-05, 'epoch': 0.25} {'loss': 0.4266, 'learning_rate': 1.955238789678084e-05, 'epoch': 0.25} {'loss': 0.6863, 'learning_rate': 1.9552288497151944e-05, 'epoch': 0.25} {'loss': 0.4846, 'learning_rate': 1.9552189086740326e-05, 'epoch': 0.25} {'loss': 0.7332, 'learning_rate': 1.9552089665546105e-05, 'epoch': 0.25} {'loss': 0.6339, 'learning_rate': 1.9551990233569394e-05, 'epoch': 0.25} {'loss': 0.5613, 'learning_rate': 1.9551890790810303e-05, 'epoch': 0.25} {'loss': 0.4601, 'learning_rate': 1.955179133726894e-05, 'epoch': 0.25} {'loss': 0.5528, 'learning_rate': 1.9551691872945423e-05, 'epoch': 0.25} {'loss': 0.5487, 'learning_rate': 1.955159239783986e-05, 'epoch': 0.25} {'loss': 0.5483, 'learning_rate': 1.9551492911952367e-05, 'epoch': 0.25} {'loss': 0.3971, 'learning_rate': 1.9551393415283054e-05, 'epoch': 0.25} {'loss': 0.5244, 'learning_rate': 1.9551293907832035e-05, 'epoch': 0.25} {'loss': 0.6162, 'learning_rate': 1.955119438959942e-05, 'epoch': 0.25} {'loss': 0.569, 'learning_rate': 1.9551094860585325e-05, 'epoch': 0.25} {'loss': 0.7666, 'learning_rate': 1.9550995320789862e-05, 'epoch': 0.25} {'loss': 0.4897, 'learning_rate': 1.9550895770213136e-05, 'epoch': 0.25} {'loss': 0.7033, 'learning_rate': 1.9550796208855267e-05, 'epoch': 0.25} {'loss': 0.5605, 'learning_rate': 1.955069663671637e-05, 'epoch': 0.25} {'loss': 0.6619, 'learning_rate': 1.9550597053796544e-05, 'epoch': 0.25} {'loss': 0.5475, 'learning_rate': 1.9550497460095917e-05, 'epoch': 0.25} {'loss': 0.499, 'learning_rate': 1.955039785561459e-05, 'epoch': 0.25} {'loss': 0.5186, 'learning_rate': 1.9550298240352683e-05, 'epoch': 0.25} {'loss': 0.6843, 'learning_rate': 1.9550198614310302e-05, 'epoch': 0.25} {'loss': 0.4496, 'learning_rate': 1.9550098977487567e-05, 'epoch': 0.25} {'loss': 0.6167, 'learning_rate': 1.9549999329884586e-05, 'epoch': 0.25} {'loss': 0.6082, 'learning_rate': 1.9549899671501467e-05, 'epoch': 0.25} {'loss': 0.6084, 'learning_rate': 1.954980000233833e-05, 'epoch': 0.25} {'loss': 0.3887, 'learning_rate': 1.954970032239529e-05, 'epoch': 0.25} {'loss': 0.6361, 'learning_rate': 1.954960063167245e-05, 'epoch': 0.25} {'loss': 0.4667, 'learning_rate': 1.9549500930169922e-05, 'epoch': 0.25} {'loss': 0.6296, 'learning_rate': 1.954940121788783e-05, 'epoch': 0.25} {'loss': 0.6462, 'learning_rate': 1.9549301494826275e-05, 'epoch': 0.25} {'loss': 0.4414, 'learning_rate': 1.9549201760985376e-05, 'epoch': 0.25} {'loss': 0.7215, 'learning_rate': 1.954910201636525e-05, 'epoch': 0.25} {'loss': 0.5055, 'learning_rate': 1.9549002260965997e-05, 'epoch': 0.25} {'loss': 0.776, 'learning_rate': 1.9548902494787737e-05, 'epoch': 0.25} {'loss': 0.5364, 'learning_rate': 1.954880271783058e-05, 'epoch': 0.25} {'loss': 0.577, 'learning_rate': 1.9548702930094648e-05, 'epoch': 0.25} {'loss': 0.4074, 'learning_rate': 1.9548603131580042e-05, 'epoch': 0.25} {'loss': 0.4266, 'learning_rate': 1.9548503322286877e-05, 'epoch': 0.25} {'loss': 0.6458, 'learning_rate': 1.954840350221527e-05, 'epoch': 0.25} {'loss': 0.5447, 'learning_rate': 1.9548303671365326e-05, 'epoch': 0.25} {'loss': 0.552, 'learning_rate': 1.954820382973717e-05, 'epoch': 0.25} {'loss': 0.5756, 'learning_rate': 1.9548103977330902e-05, 'epoch': 0.25} {'loss': 0.6536, 'learning_rate': 1.9548004114146645e-05, 'epoch': 0.25} {'loss': 0.6601, 'learning_rate': 1.9547904240184504e-05, 'epoch': 0.25} {'loss': 0.5986, 'learning_rate': 1.9547804355444597e-05, 'epoch': 0.25} {'loss': 0.5534, 'learning_rate': 1.9547704459927032e-05, 'epoch': 0.25} {'loss': 0.5283, 'learning_rate': 1.9547604553631925e-05, 'epoch': 0.25} {'loss': 0.5175, 'learning_rate': 1.9547504636559388e-05, 'epoch': 0.25} {'loss': 0.5369, 'learning_rate': 1.9547404708709536e-05, 'epoch': 0.25} {'loss': 0.58, 'learning_rate': 1.9547304770082477e-05, 'epoch': 0.25} {'loss': 0.4661, 'learning_rate': 1.9547204820678326e-05, 'epoch': 0.25} {'loss': 0.6428, 'learning_rate': 1.9547104860497195e-05, 'epoch': 0.25} {'loss': 0.3244, 'learning_rate': 1.9547004889539204e-05, 'epoch': 0.25} {'loss': 0.5764, 'learning_rate': 1.9546904907804456e-05, 'epoch': 0.25} {'loss': 0.5791, 'learning_rate': 1.954680491529307e-05, 'epoch': 0.25} {'loss': 0.5429, 'learning_rate': 1.9546704912005153e-05, 'epoch': 0.25} {'loss': 0.5202, 'learning_rate': 1.9546604897940825e-05, 'epoch': 0.25} {'loss': 0.5708, 'learning_rate': 1.954650487310019e-05, 'epoch': 0.25} {'loss': 0.6366, 'learning_rate': 1.954640483748337e-05, 'epoch': 0.25} {'loss': 0.4903, 'learning_rate': 1.9546304791090477e-05, 'epoch': 0.25} {'loss': 0.477, 'learning_rate': 1.9546204733921618e-05, 'epoch': 0.25} {'loss': 0.5452, 'learning_rate': 1.954610466597691e-05, 'epoch': 0.25} {'loss': 0.51, 'learning_rate': 1.9546004587256463e-05, 'epoch': 0.25} {'loss': 0.6373, 'learning_rate': 1.9545904497760395e-05, 'epoch': 0.25} {'loss': 0.6828, 'learning_rate': 1.9545804397488814e-05, 'epoch': 0.25} {'loss': 0.6396, 'learning_rate': 1.954570428644184e-05, 'epoch': 0.25} {'loss': 0.5526, 'learning_rate': 1.9545604164619575e-05, 'epoch': 0.25} {'loss': 0.4647, 'learning_rate': 1.954550403202214e-05, 'epoch': 0.25} {'loss': 0.5787, 'learning_rate': 1.9545403888649647e-05, 'epoch': 0.25} {'loss': 0.4496, 'learning_rate': 1.9545303734502207e-05, 'epoch': 0.25} {'loss': 0.6156, 'learning_rate': 1.9545203569579935e-05, 'epoch': 0.25} {'loss': 0.5641, 'learning_rate': 1.954510339388294e-05, 'epoch': 0.25} {'loss': 0.5994, 'learning_rate': 1.9545003207411343e-05, 'epoch': 0.25} {'loss': 0.6888, 'learning_rate': 1.954490301016525e-05, 'epoch': 0.25} {'loss': 0.5588, 'learning_rate': 1.9544802802144777e-05, 'epoch': 0.25} {'loss': 0.6717, 'learning_rate': 1.954470258335004e-05, 'epoch': 0.25} {'loss': 0.6943, 'learning_rate': 1.9544602353781144e-05, 'epoch': 0.25} {'loss': 0.5599, 'learning_rate': 1.9544502113438208e-05, 'epoch': 0.25} {'loss': 0.4433, 'learning_rate': 1.9544401862321345e-05, 'epoch': 0.25} {'loss': 0.5094, 'learning_rate': 1.954430160043067e-05, 'epoch': 0.25} {'loss': 0.5169, 'learning_rate': 1.9544201327766288e-05, 'epoch': 0.25} {'loss': 0.4431, 'learning_rate': 1.954410104432832e-05, 'epoch': 0.25} {'loss': 0.6036, 'learning_rate': 1.9544000750116875e-05, 'epoch': 0.25} {'loss': 0.4902, 'learning_rate': 1.954390044513207e-05, 'epoch': 0.25} {'loss': 0.5926, 'learning_rate': 1.9543800129374017e-05, 'epoch': 0.25} {'loss': 0.4784, 'learning_rate': 1.954369980284283e-05, 'epoch': 0.25} {'loss': 0.4813, 'learning_rate': 1.9543599465538616e-05, 'epoch': 0.25} {'loss': 0.5698, 'learning_rate': 1.9543499117461495e-05, 'epoch': 0.25} {'loss': 0.587, 'learning_rate': 1.954339875861158e-05, 'epoch': 0.25} {'loss': 0.6043, 'learning_rate': 1.954329838898898e-05, 'epoch': 0.25} {'loss': 0.5957, 'learning_rate': 1.954319800859381e-05, 'epoch': 0.25} {'loss': 0.5748, 'learning_rate': 1.954309761742619e-05, 'epoch': 0.25} {'loss': 0.6305, 'learning_rate': 1.9542997215486223e-05, 'epoch': 0.25} {'loss': 0.6082, 'learning_rate': 1.9542896802774027e-05, 'epoch': 0.25} {'loss': 0.6477, 'learning_rate': 1.9542796379289717e-05, 'epoch': 0.25} {'loss': 0.6922, 'learning_rate': 1.95426959450334e-05, 'epoch': 0.25} {'loss': 0.5857, 'learning_rate': 1.95425955000052e-05, 'epoch': 0.25} {'loss': 0.6447, 'learning_rate': 1.954249504420522e-05, 'epoch': 0.25} {'loss': 0.4549, 'learning_rate': 1.9542394577633578e-05, 'epoch': 0.25} {'loss': 0.5948, 'learning_rate': 1.954229410029039e-05, 'epoch': 0.25} {'loss': 0.55, 'learning_rate': 1.9542193612175764e-05, 'epoch': 0.25} {'loss': 0.5017, 'learning_rate': 1.9542093113289818e-05, 'epoch': 0.25} {'loss': 0.648, 'learning_rate': 1.954199260363266e-05, 'epoch': 0.25} {'loss': 0.5913, 'learning_rate': 1.954189208320441e-05, 'epoch': 0.25} {'loss': 0.5213, 'learning_rate': 1.9541791552005177e-05, 'epoch': 0.25} {'loss': 0.4812, 'learning_rate': 1.9541691010035075e-05, 'epoch': 0.25} {'loss': 0.4781, 'learning_rate': 1.954159045729422e-05, 'epoch': 0.25} {'loss': 0.636, 'learning_rate': 1.9541489893782724e-05, 'epoch': 0.25} {'loss': 0.5642, 'learning_rate': 1.9541389319500698e-05, 'epoch': 0.25} {'loss': 0.5366, 'learning_rate': 1.954128873444826e-05, 'epoch': 0.25} {'loss': 0.6429, 'learning_rate': 1.954118813862552e-05, 'epoch': 0.25} {'loss': 0.6293, 'learning_rate': 1.9541087532032595e-05, 'epoch': 0.25} {'loss': 0.5697, 'learning_rate': 1.9540986914669595e-05, 'epoch': 0.25} {'loss': 0.6182, 'learning_rate': 1.9540886286536636e-05, 'epoch': 0.25} {'loss': 0.6283, 'learning_rate': 1.954078564763383e-05, 'epoch': 0.25} {'loss': 0.5954, 'learning_rate': 1.954068499796129e-05, 'epoch': 0.25} {'loss': 0.5261, 'learning_rate': 1.954058433751913e-05, 'epoch': 0.25} {'loss': 0.6124, 'learning_rate': 1.9540483666307467e-05, 'epoch': 0.25} {'loss': 0.6314, 'learning_rate': 1.954038298432641e-05, 'epoch': 0.25} {'loss': 0.6349, 'learning_rate': 1.9540282291576077e-05, 'epoch': 0.25} {'loss': 0.6499, 'learning_rate': 1.9540181588056582e-05, 'epoch': 0.25} {'loss': 0.4589, 'learning_rate': 1.9540080873768033e-05, 'epoch': 0.25} {'loss': 0.6392, 'learning_rate': 1.9539980148710543e-05, 'epoch': 0.25} {'loss': 0.452, 'learning_rate': 1.9539879412884236e-05, 'epoch': 0.25} {'loss': 0.6993, 'learning_rate': 1.9539778666289217e-05, 'epoch': 0.25} {'loss': 0.5713, 'learning_rate': 1.95396779089256e-05, 'epoch': 0.25} {'loss': 0.5165, 'learning_rate': 1.9539577140793504e-05, 'epoch': 0.25} {'loss': 0.5326, 'learning_rate': 1.9539476361893034e-05, 'epoch': 0.25} {'loss': 0.6668, 'learning_rate': 1.9539375572224315e-05, 'epoch': 0.25} {'loss': 0.5912, 'learning_rate': 1.9539274771787453e-05, 'epoch': 0.25} {'loss': 0.6269, 'learning_rate': 1.9539173960582563e-05, 'epoch': 0.25} {'loss': 0.5347, 'learning_rate': 1.9539073138609763e-05, 'epoch': 0.25} {'loss': 0.8192, 'learning_rate': 1.9538972305869158e-05, 'epoch': 0.25} {'loss': 0.47, 'learning_rate': 1.953887146236087e-05, 'epoch': 0.25} {'loss': 0.5736, 'learning_rate': 1.953877060808501e-05, 'epoch': 0.25} {'loss': 0.8374, 'learning_rate': 1.953866974304169e-05, 'epoch': 0.25} {'loss': 0.4145, 'learning_rate': 1.9538568867231026e-05, 'epoch': 0.25} {'loss': 0.4653, 'learning_rate': 1.9538467980653136e-05, 'epoch': 0.25} {'loss': 0.5394, 'learning_rate': 1.9538367083308125e-05, 'epoch': 0.25} {'loss': 0.5257, 'learning_rate': 1.9538266175196113e-05, 'epoch': 0.25} {'loss': 0.6418, 'learning_rate': 1.953816525631721e-05, 'epoch': 0.25} {'loss': 0.5196, 'learning_rate': 1.9538064326671534e-05, 'epoch': 0.25} {'loss': 0.477, 'learning_rate': 1.95379633862592e-05, 'epoch': 0.25} {'loss': 0.5542, 'learning_rate': 1.9537862435080317e-05, 'epoch': 0.25} {'loss': 0.676, 'learning_rate': 1.9537761473135e-05, 'epoch': 0.25} {'loss': 0.5477, 'learning_rate': 1.9537660500423364e-05, 'epoch': 0.25} {'loss': 0.5562, 'learning_rate': 1.9537559516945524e-05, 'epoch': 0.25} {'loss': 0.5898, 'learning_rate': 1.953745852270159e-05, 'epoch': 0.25} {'loss': 0.6884, 'learning_rate': 1.9537357517691683e-05, 'epoch': 0.25} {'loss': 0.3999, 'learning_rate': 1.9537256501915912e-05, 'epoch': 0.25} {'loss': 0.6667, 'learning_rate': 1.953715547537439e-05, 'epoch': 0.25} {'loss': 0.6618, 'learning_rate': 1.9537054438067233e-05, 'epoch': 0.25} {'loss': 0.7179, 'learning_rate': 1.9536953389994556e-05, 'epoch': 0.25} {'loss': 0.4846, 'learning_rate': 1.9536852331156477e-05, 'epoch': 0.25} {'loss': 0.5994, 'learning_rate': 1.9536751261553096e-05, 'epoch': 0.25} {'loss': 0.5144, 'learning_rate': 1.953665018118454e-05, 'epoch': 0.25} {'loss': 0.468, 'learning_rate': 1.9536549090050925e-05, 'epoch': 0.25} {'loss': 0.6175, 'learning_rate': 1.9536447988152353e-05, 'epoch': 0.25} {'loss': 0.516, 'learning_rate': 1.953634687548895e-05, 'epoch': 0.25} {'loss': 0.6649, 'learning_rate': 1.953624575206082e-05, 'epoch': 0.25} {'loss': 0.4802, 'learning_rate': 1.9536144617868083e-05, 'epoch': 0.25} {'loss': 0.6401, 'learning_rate': 1.9536043472910853e-05, 'epoch': 0.25} {'loss': 0.5982, 'learning_rate': 1.953594231718924e-05, 'epoch': 0.25} {'loss': 0.5106, 'learning_rate': 1.9535841150703366e-05, 'epoch': 0.25} {'loss': 0.5976, 'learning_rate': 1.953573997345334e-05, 'epoch': 0.25} {'loss': 0.4333, 'learning_rate': 1.9535638785439273e-05, 'epoch': 0.25} {'loss': 0.4865, 'learning_rate': 1.9535537586661285e-05, 'epoch': 0.25} {'loss': 0.5189, 'learning_rate': 1.953543637711949e-05, 'epoch': 0.25} {'loss': 0.5945, 'learning_rate': 1.9535335156814003e-05, 'epoch': 0.25} {'loss': 0.4299, 'learning_rate': 1.9535233925744933e-05, 'epoch': 0.25} {'loss': 0.505, 'learning_rate': 1.9535132683912396e-05, 'epoch': 0.25} {'loss': 0.5228, 'learning_rate': 1.9535031431316505e-05, 'epoch': 0.25} {'loss': 0.6913, 'learning_rate': 1.953493016795738e-05, 'epoch': 0.25} {'loss': 0.5671, 'learning_rate': 1.9534828893835134e-05, 'epoch': 0.25} {'loss': 0.5713, 'learning_rate': 1.9534727608949877e-05, 'epoch': 0.25} {'loss': 0.5471, 'learning_rate': 1.9534626313301724e-05, 'epoch': 0.25} {'loss': 0.5207, 'learning_rate': 1.9534525006890795e-05, 'epoch': 0.25} {'loss': 0.5733, 'learning_rate': 1.9534423689717198e-05, 'epoch': 0.25} {'loss': 0.4663, 'learning_rate': 1.953432236178105e-05, 'epoch': 0.25} {'loss': 0.5971, 'learning_rate': 1.9534221023082462e-05, 'epoch': 0.25} {'loss': 0.5551, 'learning_rate': 1.9534119673621557e-05, 'epoch': 0.25} {'loss': 0.5865, 'learning_rate': 1.9534018313398442e-05, 'epoch': 0.25} {'loss': 0.6064, 'learning_rate': 1.953391694241323e-05, 'epoch': 0.25} {'loss': 0.6585, 'learning_rate': 1.9533815560666043e-05, 'epoch': 0.25} {'loss': 0.5311, 'learning_rate': 1.9533714168156986e-05, 'epoch': 0.25} {'loss': 0.5585, 'learning_rate': 1.9533612764886186e-05, 'epoch': 0.25} {'loss': 0.574, 'learning_rate': 1.9533511350853748e-05, 'epoch': 0.25} {'loss': 0.5804, 'learning_rate': 1.9533409926059783e-05, 'epoch': 0.25} {'loss': 0.6662, 'learning_rate': 1.9533308490504413e-05, 'epoch': 0.25} {'loss': 0.3824, 'learning_rate': 1.9533207044187758e-05, 'epoch': 0.25} {'loss': 0.7334, 'learning_rate': 1.9533105587109915e-05, 'epoch': 0.25} {'loss': 0.6089, 'learning_rate': 1.9533004119271016e-05, 'epoch': 0.25} {'loss': 0.6341, 'learning_rate': 1.9532902640671164e-05, 'epoch': 0.25} {'loss': 0.502, 'learning_rate': 1.953280115131048e-05, 'epoch': 0.25} {'loss': 0.5907, 'learning_rate': 1.9532699651189075e-05, 'epoch': 0.25} {'loss': 0.5205, 'learning_rate': 1.9532598140307065e-05, 'epoch': 0.25} {'loss': 0.5959, 'learning_rate': 1.9532496618664563e-05, 'epoch': 0.25} {'loss': 0.5489, 'learning_rate': 1.9532395086261685e-05, 'epoch': 0.25} {'loss': 0.413, 'learning_rate': 1.953229354309855e-05, 'epoch': 0.25} {'loss': 0.6173, 'learning_rate': 1.9532191989175265e-05, 'epoch': 0.25} {'loss': 0.5765, 'learning_rate': 1.953209042449195e-05, 'epoch': 0.25} {'loss': 0.4458, 'learning_rate': 1.9531988849048712e-05, 'epoch': 0.25} {'loss': 0.6375, 'learning_rate': 1.9531887262845673e-05, 'epoch': 0.25} {'loss': 0.611, 'learning_rate': 1.953178566588295e-05, 'epoch': 0.25} {'loss': 0.7006, 'learning_rate': 1.953168405816065e-05, 'epoch': 0.25} {'loss': 0.5387, 'learning_rate': 1.9531582439678894e-05, 'epoch': 0.25} {'loss': 0.5614, 'learning_rate': 1.953148081043779e-05, 'epoch': 0.25} {'loss': 0.5201, 'learning_rate': 1.953137917043746e-05, 'epoch': 0.25} {'loss': 0.5145, 'learning_rate': 1.9531277519678014e-05, 'epoch': 0.25} {'loss': 0.5862, 'learning_rate': 1.953117585815957e-05, 'epoch': 0.25} {'loss': 0.6396, 'learning_rate': 1.953107418588224e-05, 'epoch': 0.25} {'loss': 0.4795, 'learning_rate': 1.9530972502846137e-05, 'epoch': 0.25} {'loss': 0.5052, 'learning_rate': 1.953087080905138e-05, 'epoch': 0.25} {'loss': 0.6272, 'learning_rate': 1.9530769104498083e-05, 'epoch': 0.25} {'loss': 0.6461, 'learning_rate': 1.953066738918636e-05, 'epoch': 0.25} {'loss': 0.6287, 'learning_rate': 1.9530565663116324e-05, 'epoch': 0.25} {'loss': 0.5631, 'learning_rate': 1.9530463926288093e-05, 'epoch': 0.25} {'loss': 0.5354, 'learning_rate': 1.953036217870178e-05, 'epoch': 0.25} {'loss': 0.5712, 'learning_rate': 1.9530260420357504e-05, 'epoch': 0.25} {'loss': 0.5335, 'learning_rate': 1.9530158651255373e-05, 'epoch': 0.25} {'loss': 0.5765, 'learning_rate': 1.9530056871395506e-05, 'epoch': 0.25} {'loss': 0.5496, 'learning_rate': 1.9529955080778017e-05, 'epoch': 0.25} {'loss': 0.5834, 'learning_rate': 1.9529853279403022e-05, 'epoch': 0.25} {'loss': 0.5969, 'learning_rate': 1.952975146727063e-05, 'epoch': 0.25} {'loss': 0.6144, 'learning_rate': 1.9529649644380966e-05, 'epoch': 0.25} {'loss': 0.5052, 'learning_rate': 1.9529547810734138e-05, 'epoch': 0.25} {'loss': 0.5411, 'learning_rate': 1.9529445966330263e-05, 'epoch': 0.25} {'loss': 0.4494, 'learning_rate': 1.9529344111169456e-05, 'epoch': 0.25} {'loss': 0.7192, 'learning_rate': 1.9529242245251828e-05, 'epoch': 0.25} {'loss': 0.5546, 'learning_rate': 1.9529140368577502e-05, 'epoch': 0.25} {'loss': 0.5482, 'learning_rate': 1.9529038481146586e-05, 'epoch': 0.25} {'loss': 0.5308, 'learning_rate': 1.9528936582959198e-05, 'epoch': 0.25} {'loss': 0.6321, 'learning_rate': 1.9528834674015454e-05, 'epoch': 0.25} {'loss': 0.4902, 'learning_rate': 1.9528732754315466e-05, 'epoch': 0.25} {'loss': 0.6096, 'learning_rate': 1.9528630823859352e-05, 'epoch': 0.25} {'loss': 0.5658, 'learning_rate': 1.9528528882647224e-05, 'epoch': 0.25} {'loss': 0.449, 'learning_rate': 1.95284269306792e-05, 'epoch': 0.25} {'loss': 0.4175, 'learning_rate': 1.9528324967955394e-05, 'epoch': 0.25} {'loss': 0.6726, 'learning_rate': 1.952822299447592e-05, 'epoch': 0.25} {'loss': 0.3959, 'learning_rate': 1.9528121010240894e-05, 'epoch': 0.25} {'loss': 0.5824, 'learning_rate': 1.9528019015250434e-05, 'epoch': 0.25} {'loss': 0.5984, 'learning_rate': 1.9527917009504648e-05, 'epoch': 0.25} {'loss': 0.564, 'learning_rate': 1.952781499300366e-05, 'epoch': 0.25} {'loss': 0.7161, 'learning_rate': 1.9527712965747582e-05, 'epoch': 0.25} {'loss': 0.5028, 'learning_rate': 1.9527610927736522e-05, 'epoch': 0.25} {'loss': 0.5241, 'learning_rate': 1.9527508878970603e-05, 'epoch': 0.25} {'loss': 0.4907, 'learning_rate': 1.9527406819449938e-05, 'epoch': 0.25} {'loss': 0.6461, 'learning_rate': 1.9527304749174644e-05, 'epoch': 0.25} {'loss': 0.4012, 'learning_rate': 1.9527202668144834e-05, 'epoch': 0.25} {'loss': 0.5787, 'learning_rate': 1.9527100576360626e-05, 'epoch': 0.25} {'loss': 0.5028, 'learning_rate': 1.952699847382213e-05, 'epoch': 0.25} {'loss': 0.549, 'learning_rate': 1.9526896360529464e-05, 'epoch': 0.25} {'loss': 0.5873, 'learning_rate': 1.9526794236482743e-05, 'epoch': 0.25} {'loss': 0.5254, 'learning_rate': 1.9526692101682086e-05, 'epoch': 0.25} {'loss': 0.7182, 'learning_rate': 1.9526589956127603e-05, 'epoch': 0.25} {'loss': 0.5977, 'learning_rate': 1.9526487799819413e-05, 'epoch': 0.25} {'loss': 0.5921, 'learning_rate': 1.952638563275763e-05, 'epoch': 0.25} {'loss': 0.4202, 'learning_rate': 1.9526283454942368e-05, 'epoch': 0.25} {'loss': 0.4331, 'learning_rate': 1.9526181266373746e-05, 'epoch': 0.25} {'loss': 0.6101, 'learning_rate': 1.9526079067051872e-05, 'epoch': 0.25} {'loss': 0.4445, 'learning_rate': 1.952597685697687e-05, 'epoch': 0.25} {'loss': 0.6201, 'learning_rate': 1.9525874636148853e-05, 'epoch': 0.25} {'loss': 0.4111, 'learning_rate': 1.9525772404567932e-05, 'epoch': 0.25} {'loss': 0.6306, 'learning_rate': 1.9525670162234226e-05, 'epoch': 0.25} {'loss': 0.683, 'learning_rate': 1.952556790914785e-05, 'epoch': 0.25} {'loss': 0.5801, 'learning_rate': 1.9525465645308916e-05, 'epoch': 0.25} {'loss': 0.5691, 'learning_rate': 1.9525363370717546e-05, 'epoch': 0.25} {'loss': 0.4812, 'learning_rate': 1.952526108537385e-05, 'epoch': 0.25} {'loss': 0.5278, 'learning_rate': 1.9525158789277947e-05, 'epoch': 0.25} {'loss': 0.5923, 'learning_rate': 1.9525056482429953e-05, 'epoch': 0.25} {'loss': 0.5713, 'learning_rate': 1.952495416482998e-05, 'epoch': 0.25} {'loss': 0.6072, 'learning_rate': 1.9524851836478144e-05, 'epoch': 0.25} {'loss': 0.5266, 'learning_rate': 1.952474949737456e-05, 'epoch': 0.25} {'loss': 0.7012, 'learning_rate': 1.9524647147519347e-05, 'epoch': 0.25} {'loss': 0.585, 'learning_rate': 1.9524544786912622e-05, 'epoch': 0.25} {'loss': 0.5912, 'learning_rate': 1.9524442415554493e-05, 'epoch': 0.25} {'loss': 0.4322, 'learning_rate': 1.952434003344508e-05, 'epoch': 0.25} {'loss': 0.5045, 'learning_rate': 1.95242376405845e-05, 'epoch': 0.25} {'loss': 0.5597, 'learning_rate': 1.9524135236972867e-05, 'epoch': 0.25} {'loss': 0.5444, 'learning_rate': 1.9524032822610293e-05, 'epoch': 0.25} {'loss': 0.7125, 'learning_rate': 1.95239303974969e-05, 'epoch': 0.25} {'loss': 0.6075, 'learning_rate': 1.9523827961632797e-05, 'epoch': 0.25} {'loss': 0.5966, 'learning_rate': 1.9523725515018105e-05, 'epoch': 0.25} {'loss': 0.647, 'learning_rate': 1.9523623057652942e-05, 'epoch': 0.25} {'loss': 0.6483, 'learning_rate': 1.9523520589537413e-05, 'epoch': 0.25} {'loss': 0.7453, 'learning_rate': 1.9523418110671644e-05, 'epoch': 0.25} {'loss': 0.637, 'learning_rate': 1.952331562105575e-05, 'epoch': 0.25} {'loss': 0.6716, 'learning_rate': 1.9523213120689837e-05, 'epoch': 0.25} {'loss': 0.5857, 'learning_rate': 1.9523110609574034e-05, 'epoch': 0.25} {'loss': 0.6423, 'learning_rate': 1.9523008087708443e-05, 'epoch': 0.25} {'loss': 0.4827, 'learning_rate': 1.9522905555093192e-05, 'epoch': 0.25} {'loss': 0.5358, 'learning_rate': 1.9522803011728388e-05, 'epoch': 0.25} {'loss': 0.4972, 'learning_rate': 1.9522700457614153e-05, 'epoch': 0.25} {'loss': 0.4375, 'learning_rate': 1.95225978927506e-05, 'epoch': 0.25} {'loss': 0.5877, 'learning_rate': 1.9522495317137844e-05, 'epoch': 0.25} {'loss': 0.618, 'learning_rate': 1.9522392730775998e-05, 'epoch': 0.25} {'loss': 0.4029, 'learning_rate': 1.9522290133665188e-05, 'epoch': 0.25} {'loss': 0.5654, 'learning_rate': 1.952218752580552e-05, 'epoch': 0.25} {'loss': 0.6434, 'learning_rate': 1.9522084907197108e-05, 'epoch': 0.25} {'loss': 0.5307, 'learning_rate': 1.9521982277840083e-05, 'epoch': 0.25} {'loss': 0.5988, 'learning_rate': 1.9521879637734544e-05, 'epoch': 0.25} {'loss': 0.4801, 'learning_rate': 1.9521776986880615e-05, 'epoch': 0.25} {'loss': 0.6464, 'learning_rate': 1.952167432527841e-05, 'epoch': 0.25} {'loss': 0.5998, 'learning_rate': 1.9521571652928046e-05, 'epoch': 0.25} {'loss': 0.74, 'learning_rate': 1.9521468969829636e-05, 'epoch': 0.25} {'loss': 0.5715, 'learning_rate': 1.9521366275983303e-05, 'epoch': 0.25} {'loss': 0.6846, 'learning_rate': 1.9521263571389152e-05, 'epoch': 0.25} {'loss': 0.5759, 'learning_rate': 1.952116085604731e-05, 'epoch': 0.25} {'loss': 0.5095, 'learning_rate': 1.9521058129957887e-05, 'epoch': 0.25} {'loss': 0.6754, 'learning_rate': 1.9520955393120996e-05, 'epoch': 0.25} {'loss': 0.5822, 'learning_rate': 1.9520852645536762e-05, 'epoch': 0.25} {'loss': 0.46, 'learning_rate': 1.9520749887205292e-05, 'epoch': 0.25} {'loss': 0.7552, 'learning_rate': 1.952064711812671e-05, 'epoch': 0.25} {'loss': 0.5883, 'learning_rate': 1.9520544338301125e-05, 'epoch': 0.25} {'loss': 0.6325, 'learning_rate': 1.9520441547728654e-05, 'epoch': 0.25} {'loss': 0.5935, 'learning_rate': 1.9520338746409418e-05, 'epoch': 0.25} {'loss': 0.7019, 'learning_rate': 1.952023593434353e-05, 'epoch': 0.25} {'loss': 0.383, 'learning_rate': 1.95201331115311e-05, 'epoch': 0.25} {'loss': 0.5539, 'learning_rate': 1.952003027797226e-05, 'epoch': 0.25} {'loss': 0.4448, 'learning_rate': 1.951992743366711e-05, 'epoch': 0.25} {'loss': 0.5718, 'learning_rate': 1.9519824578615773e-05, 'epoch': 0.25} {'loss': 0.5714, 'learning_rate': 1.9519721712818364e-05, 'epoch': 0.25} {'loss': 0.6492, 'learning_rate': 1.9519618836275e-05, 'epoch': 0.25} {'loss': 0.6901, 'learning_rate': 1.9519515948985796e-05, 'epoch': 0.25} {'loss': 0.4267, 'learning_rate': 1.9519413050950872e-05, 'epoch': 0.25} {'loss': 0.6013, 'learning_rate': 1.9519310142170335e-05, 'epoch': 0.25} {'loss': 0.5188, 'learning_rate': 1.9519207222644315e-05, 'epoch': 0.25} {'loss': 0.6902, 'learning_rate': 1.9519104292372912e-05, 'epoch': 0.25} {'loss': 0.5711, 'learning_rate': 1.9519001351356256e-05, 'epoch': 0.25} {'loss': 0.589, 'learning_rate': 1.9518898399594456e-05, 'epoch': 0.25} {'loss': 0.5882, 'learning_rate': 1.951879543708763e-05, 'epoch': 0.25} {'loss': 0.7572, 'learning_rate': 1.951869246383589e-05, 'epoch': 0.25} {'loss': 0.4669, 'learning_rate': 1.951858947983936e-05, 'epoch': 0.25} {'loss': 0.5015, 'learning_rate': 1.9518486485098152e-05, 'epoch': 0.25} {'loss': 0.6114, 'learning_rate': 1.9518383479612385e-05, 'epoch': 0.25} {'loss': 0.5797, 'learning_rate': 1.951828046338217e-05, 'epoch': 0.25} {'loss': 0.6063, 'learning_rate': 1.9518177436407627e-05, 'epoch': 0.25} {'loss': 0.5928, 'learning_rate': 1.951807439868887e-05, 'epoch': 0.25} {'loss': 0.4658, 'learning_rate': 1.9517971350226022e-05, 'epoch': 0.25} {'loss': 0.7009, 'learning_rate': 1.951786829101919e-05, 'epoch': 0.25} {'loss': 0.5846, 'learning_rate': 1.9517765221068497e-05, 'epoch': 0.25} {'loss': 0.468, 'learning_rate': 1.9517662140374055e-05, 'epoch': 0.25} {'loss': 0.6481, 'learning_rate': 1.9517559048935982e-05, 'epoch': 0.25} {'loss': 0.5271, 'learning_rate': 1.9517455946754395e-05, 'epoch': 0.25} {'loss': 0.5807, 'learning_rate': 1.951735283382941e-05, 'epoch': 0.25} {'loss': 0.4308, 'learning_rate': 1.9517249710161145e-05, 'epoch': 0.25} {'loss': 0.6285, 'learning_rate': 1.9517146575749713e-05, 'epoch': 0.25} {'loss': 0.4878, 'learning_rate': 1.9517043430595234e-05, 'epoch': 0.25} {'loss': 0.6529, 'learning_rate': 1.9516940274697825e-05, 'epoch': 0.25} {'loss': 0.6314, 'learning_rate': 1.9516837108057596e-05, 'epoch': 0.25} {'loss': 0.4487, 'learning_rate': 1.951673393067467e-05, 'epoch': 0.25} {'loss': 0.6063, 'learning_rate': 1.9516630742549157e-05, 'epoch': 0.25} {'loss': 0.6569, 'learning_rate': 1.951652754368118e-05, 'epoch': 0.25} {'loss': 0.7146, 'learning_rate': 1.9516424334070856e-05, 'epoch': 0.25} {'loss': 0.3874, 'learning_rate': 1.9516321113718295e-05, 'epoch': 0.25} {'loss': 0.4697, 'learning_rate': 1.951621788262362e-05, 'epoch': 0.25} {'loss': 0.6404, 'learning_rate': 1.951611464078694e-05, 'epoch': 0.25} {'loss': 0.4779, 'learning_rate': 1.951601138820838e-05, 'epoch': 0.25} {'loss': 0.6662, 'learning_rate': 1.951590812488805e-05, 'epoch': 0.25} {'loss': 0.4176, 'learning_rate': 1.9515804850826074e-05, 'epoch': 0.25} {'loss': 0.6182, 'learning_rate': 1.951570156602256e-05, 'epoch': 0.25} {'loss': 0.5114, 'learning_rate': 1.9515598270477628e-05, 'epoch': 0.25} {'loss': 0.5952, 'learning_rate': 1.9515494964191397e-05, 'epoch': 0.25} {'loss': 0.4383, 'learning_rate': 1.9515391647163978e-05, 'epoch': 0.25} {'loss': 0.4664, 'learning_rate': 1.9515288319395497e-05, 'epoch': 0.26} {'loss': 0.4675, 'learning_rate': 1.9515184980886063e-05, 'epoch': 0.26} {'loss': 0.6084, 'learning_rate': 1.9515081631635793e-05, 'epoch': 0.26} {'loss': 0.6369, 'learning_rate': 1.9514978271644803e-05, 'epoch': 0.26} {'loss': 0.7492, 'learning_rate': 1.9514874900913215e-05, 'epoch': 0.26} {'loss': 0.4421, 'learning_rate': 1.9514771519441145e-05, 'epoch': 0.26} {'loss': 0.5353, 'learning_rate': 1.9514668127228703e-05, 'epoch': 0.26} {'loss': 0.6698, 'learning_rate': 1.951456472427601e-05, 'epoch': 0.26} {'loss': 0.5359, 'learning_rate': 1.9514461310583184e-05, 'epoch': 0.26} {'loss': 0.5314, 'learning_rate': 1.9514357886150345e-05, 'epoch': 0.26} {'loss': 0.7106, 'learning_rate': 1.9514254450977598e-05, 'epoch': 0.26} {'loss': 0.6345, 'learning_rate': 1.951415100506507e-05, 'epoch': 0.26} {'loss': 0.6985, 'learning_rate': 1.9514047548412876e-05, 'epoch': 0.26} {'loss': 0.6494, 'learning_rate': 1.9513944081021127e-05, 'epoch': 0.26} {'loss': 0.5669, 'learning_rate': 1.951384060288995e-05, 'epoch': 0.26} {'loss': 0.5475, 'learning_rate': 1.9513737114019454e-05, 'epoch': 0.26} {'loss': 0.6269, 'learning_rate': 1.9513633614409757e-05, 'epoch': 0.26} {'loss': 0.6297, 'learning_rate': 1.9513530104060977e-05, 'epoch': 0.26} {'loss': 0.5567, 'learning_rate': 1.951342658297323e-05, 'epoch': 0.26} {'loss': 0.6263, 'learning_rate': 1.9513323051146632e-05, 'epoch': 0.26} {'loss': 0.5239, 'learning_rate': 1.9513219508581306e-05, 'epoch': 0.26} {'loss': 0.631, 'learning_rate': 1.951311595527736e-05, 'epoch': 0.26} {'loss': 0.5215, 'learning_rate': 1.9513012391234917e-05, 'epoch': 0.26} {'loss': 0.5543, 'learning_rate': 1.951290881645409e-05, 'epoch': 0.26} {'loss': 0.4072, 'learning_rate': 1.9512805230935003e-05, 'epoch': 0.26} {'loss': 0.6549, 'learning_rate': 1.9512701634677762e-05, 'epoch': 0.26} {'loss': 0.4953, 'learning_rate': 1.951259802768249e-05, 'epoch': 0.26} {'loss': 0.6222, 'learning_rate': 1.9512494409949307e-05, 'epoch': 0.26} {'loss': 0.6444, 'learning_rate': 1.951239078147833e-05, 'epoch': 0.26} {'loss': 0.5648, 'learning_rate': 1.9512287142269667e-05, 'epoch': 0.26} {'loss': 0.6176, 'learning_rate': 1.951218349232344e-05, 'epoch': 0.26} {'loss': 0.4737, 'learning_rate': 1.951207983163977e-05, 'epoch': 0.26} {'loss': 0.4742, 'learning_rate': 1.951197616021877e-05, 'epoch': 0.26} {'loss': 0.4955, 'learning_rate': 1.9511872478060552e-05, 'epoch': 0.26} {'loss': 0.6091, 'learning_rate': 1.951176878516525e-05, 'epoch': 0.26} {'loss': 0.5012, 'learning_rate': 1.951166508153296e-05, 'epoch': 0.26} {'loss': 0.5998, 'learning_rate': 1.951156136716381e-05, 'epoch': 0.26} {'loss': 0.5157, 'learning_rate': 1.951145764205792e-05, 'epoch': 0.26} {'loss': 0.5779, 'learning_rate': 1.9511353906215403e-05, 'epoch': 0.26} {'loss': 0.6605, 'learning_rate': 1.9511250159636373e-05, 'epoch': 0.26} {'loss': 0.616, 'learning_rate': 1.951114640232095e-05, 'epoch': 0.26} {'loss': 0.4937, 'learning_rate': 1.9511042634269253e-05, 'epoch': 0.26} {'loss': 0.5434, 'learning_rate': 1.95109388554814e-05, 'epoch': 0.26} {'loss': 0.5209, 'learning_rate': 1.9510835065957502e-05, 'epoch': 0.26} {'loss': 0.6211, 'learning_rate': 1.9510731265697682e-05, 'epoch': 0.26} {'loss': 0.5245, 'learning_rate': 1.951062745470205e-05, 'epoch': 0.26} {'loss': 0.5983, 'learning_rate': 1.9510523632970735e-05, 'epoch': 0.26} {'loss': 0.4755, 'learning_rate': 1.9510419800503843e-05, 'epoch': 0.26} {'loss': 0.6591, 'learning_rate': 1.95103159573015e-05, 'epoch': 0.26} {'loss': 0.443, 'learning_rate': 1.951021210336381e-05, 'epoch': 0.26} {'loss': 0.6541, 'learning_rate': 1.9510108238690906e-05, 'epoch': 0.26} {'loss': 0.6313, 'learning_rate': 1.9510004363282896e-05, 'epoch': 0.26} {'loss': 0.5796, 'learning_rate': 1.95099004771399e-05, 'epoch': 0.26} {'loss': 0.7015, 'learning_rate': 1.9509796580262038e-05, 'epoch': 0.26} {'loss': 0.5545, 'learning_rate': 1.950969267264942e-05, 'epoch': 0.26} {'loss': 0.5214, 'learning_rate': 1.950958875430217e-05, 'epoch': 0.26} {'loss': 0.6338, 'learning_rate': 1.95094848252204e-05, 'epoch': 0.26} {'loss': 0.58, 'learning_rate': 1.950938088540423e-05, 'epoch': 0.26} {'loss': 0.504, 'learning_rate': 1.9509276934853778e-05, 'epoch': 0.26} {'loss': 0.4917, 'learning_rate': 1.9509172973569163e-05, 'epoch': 0.26} {'loss': 0.4429, 'learning_rate': 1.9509069001550495e-05, 'epoch': 0.26} {'loss': 0.5937, 'learning_rate': 1.95089650187979e-05, 'epoch': 0.26} {'loss': 0.5605, 'learning_rate': 1.950886102531149e-05, 'epoch': 0.26} {'loss': 0.7644, 'learning_rate': 1.9508757021091386e-05, 'epoch': 0.26} {'loss': 0.4674, 'learning_rate': 1.9508653006137702e-05, 'epoch': 0.26} {'loss': 0.563, 'learning_rate': 1.950854898045056e-05, 'epoch': 0.26} {'loss': 0.5784, 'learning_rate': 1.950844494403007e-05, 'epoch': 0.26} {'loss': 0.6189, 'learning_rate': 1.9508340896876354e-05, 'epoch': 0.26} {'loss': 0.589, 'learning_rate': 1.950823683898953e-05, 'epoch': 0.26} {'loss': 0.6767, 'learning_rate': 1.9508132770369718e-05, 'epoch': 0.26} {'loss': 0.6073, 'learning_rate': 1.9508028691017027e-05, 'epoch': 0.26} {'loss': 0.5084, 'learning_rate': 1.9507924600931582e-05, 'epoch': 0.26} {'loss': 0.6874, 'learning_rate': 1.9507820500113498e-05, 'epoch': 0.26} {'loss': 0.3808, 'learning_rate': 1.9507716388562893e-05, 'epoch': 0.26} {'loss': 0.6131, 'learning_rate': 1.9507612266279886e-05, 'epoch': 0.26} {'loss': 0.6416, 'learning_rate': 1.950750813326459e-05, 'epoch': 0.26} {'loss': 0.7268, 'learning_rate': 1.9507403989517127e-05, 'epoch': 0.26} {'loss': 0.5521, 'learning_rate': 1.950729983503761e-05, 'epoch': 0.26} {'loss': 0.7486, 'learning_rate': 1.950719566982616e-05, 'epoch': 0.26} {'loss': 0.5432, 'learning_rate': 1.9507091493882896e-05, 'epoch': 0.26} {'loss': 0.4969, 'learning_rate': 1.9506987307207933e-05, 'epoch': 0.26} {'loss': 0.4481, 'learning_rate': 1.950688310980139e-05, 'epoch': 0.26} {'loss': 0.7165, 'learning_rate': 1.9506778901663385e-05, 'epoch': 0.26} {'loss': 0.6664, 'learning_rate': 1.9506674682794028e-05, 'epoch': 0.26} {'loss': 0.5992, 'learning_rate': 1.950657045319345e-05, 'epoch': 0.26} {'loss': 0.4827, 'learning_rate': 1.950646621286176e-05, 'epoch': 0.26} {'loss': 0.6802, 'learning_rate': 1.9506361961799074e-05, 'epoch': 0.26} {'loss': 0.472, 'learning_rate': 1.9506257700005516e-05, 'epoch': 0.26} {'loss': 0.5367, 'learning_rate': 1.95061534274812e-05, 'epoch': 0.26} {'loss': 0.6474, 'learning_rate': 1.950604914422624e-05, 'epoch': 0.26} {'loss': 0.7894, 'learning_rate': 1.950594485024077e-05, 'epoch': 0.26} {'loss': 0.4666, 'learning_rate': 1.9505840545524887e-05, 'epoch': 0.26} {'loss': 0.5484, 'learning_rate': 1.9505736230078716e-05, 'epoch': 0.26} {'loss': 0.5691, 'learning_rate': 1.9505631903902383e-05, 'epoch': 0.26} {'loss': 0.5138, 'learning_rate': 1.9505527566995993e-05, 'epoch': 0.26} {'loss': 0.6712, 'learning_rate': 1.9505423219359674e-05, 'epoch': 0.26} {'loss': 0.6934, 'learning_rate': 1.9505318860993538e-05, 'epoch': 0.26} {'loss': 0.6045, 'learning_rate': 1.9505214491897707e-05, 'epoch': 0.26} {'loss': 0.6189, 'learning_rate': 1.9505110112072293e-05, 'epoch': 0.26} {'loss': 0.5738, 'learning_rate': 1.9505005721517417e-05, 'epoch': 0.26} {'loss': 0.6973, 'learning_rate': 1.95049013202332e-05, 'epoch': 0.26} {'loss': 0.4701, 'learning_rate': 1.9504796908219754e-05, 'epoch': 0.26} {'loss': 0.6105, 'learning_rate': 1.9504692485477203e-05, 'epoch': 0.26} {'loss': 0.6698, 'learning_rate': 1.9504588052005658e-05, 'epoch': 0.26} {'loss': 0.5704, 'learning_rate': 1.9504483607805242e-05, 'epoch': 0.26} {'loss': 0.7145, 'learning_rate': 1.9504379152876072e-05, 'epoch': 0.26} {'loss': 0.7227, 'learning_rate': 1.9504274687218262e-05, 'epoch': 0.26} {'loss': 0.6081, 'learning_rate': 1.950417021083194e-05, 'epoch': 0.26} {'loss': 0.6793, 'learning_rate': 1.950406572371721e-05, 'epoch': 0.26} {'loss': 0.5704, 'learning_rate': 1.9503961225874202e-05, 'epoch': 0.26} {'loss': 0.7467, 'learning_rate': 1.9503856717303025e-05, 'epoch': 0.26} {'loss': 0.6265, 'learning_rate': 1.9503752198003804e-05, 'epoch': 0.26} {'loss': 0.6155, 'learning_rate': 1.9503647667976656e-05, 'epoch': 0.26} {'loss': 0.7001, 'learning_rate': 1.950354312722169e-05, 'epoch': 0.26} {'loss': 0.6183, 'learning_rate': 1.950343857573904e-05, 'epoch': 0.26} {'loss': 0.5223, 'learning_rate': 1.9503334013528807e-05, 'epoch': 0.26} {'loss': 0.7122, 'learning_rate': 1.950322944059112e-05, 'epoch': 0.26} {'loss': 0.6463, 'learning_rate': 1.9503124856926094e-05, 'epoch': 0.26} {'loss': 0.5926, 'learning_rate': 1.9503020262533848e-05, 'epoch': 0.26} {'loss': 0.583, 'learning_rate': 1.95029156574145e-05, 'epoch': 0.26} {'loss': 0.4138, 'learning_rate': 1.9502811041568165e-05, 'epoch': 0.26} {'loss': 0.3376, 'learning_rate': 1.9502706414994965e-05, 'epoch': 0.26} {'loss': 0.552, 'learning_rate': 1.9502601777695015e-05, 'epoch': 0.26} {'loss': 0.5548, 'learning_rate': 1.9502497129668435e-05, 'epoch': 0.26} {'loss': 0.5171, 'learning_rate': 1.9502392470915343e-05, 'epoch': 0.26} {'loss': 0.6416, 'learning_rate': 1.950228780143586e-05, 'epoch': 0.26} {'loss': 0.5726, 'learning_rate': 1.9502183121230094e-05, 'epoch': 0.26} {'loss': 0.5618, 'learning_rate': 1.9502078430298176e-05, 'epoch': 0.26} {'loss': 0.5093, 'learning_rate': 1.9501973728640215e-05, 'epoch': 0.26} {'loss': 0.451, 'learning_rate': 1.9501869016256333e-05, 'epoch': 0.26} {'loss': 0.7227, 'learning_rate': 1.9501764293146653e-05, 'epoch': 0.26} {'loss': 0.605, 'learning_rate': 1.9501659559311282e-05, 'epoch': 0.26} {'loss': 0.567, 'learning_rate': 1.9501554814750344e-05, 'epoch': 0.26} {'loss': 0.5294, 'learning_rate': 1.950145005946396e-05, 'epoch': 0.26} {'loss': 0.6582, 'learning_rate': 1.9501345293452246e-05, 'epoch': 0.26} {'loss': 0.4577, 'learning_rate': 1.9501240516715317e-05, 'epoch': 0.26} {'loss': 0.615, 'learning_rate': 1.9501135729253298e-05, 'epoch': 0.26} {'loss': 0.6485, 'learning_rate': 1.95010309310663e-05, 'epoch': 0.26} {'loss': 0.6471, 'learning_rate': 1.950092612215445e-05, 'epoch': 0.26} {'loss': 0.5461, 'learning_rate': 1.9500821302517857e-05, 'epoch': 0.26} {'loss': 0.7977, 'learning_rate': 1.950071647215664e-05, 'epoch': 0.26} {'loss': 0.5793, 'learning_rate': 1.9500611631070928e-05, 'epoch': 0.26} {'loss': 0.5442, 'learning_rate': 1.950050677926083e-05, 'epoch': 0.26} {'loss': 0.5182, 'learning_rate': 1.9500401916726462e-05, 'epoch': 0.26} {'loss': 0.6283, 'learning_rate': 1.950029704346795e-05, 'epoch': 0.26} {'loss': 0.7083, 'learning_rate': 1.9500192159485413e-05, 'epoch': 0.26} {'loss': 0.5202, 'learning_rate': 1.950008726477896e-05, 'epoch': 0.26} {'loss': 0.4436, 'learning_rate': 1.9499982359348717e-05, 'epoch': 0.26} {'loss': 0.633, 'learning_rate': 1.94998774431948e-05, 'epoch': 0.26} {'loss': 0.6552, 'learning_rate': 1.9499772516317328e-05, 'epoch': 0.26} {'loss': 0.4702, 'learning_rate': 1.949966757871642e-05, 'epoch': 0.26} {'loss': 0.5012, 'learning_rate': 1.9499562630392194e-05, 'epoch': 0.26} {'loss': 0.5996, 'learning_rate': 1.9499457671344766e-05, 'epoch': 0.26} {'loss': 0.6654, 'learning_rate': 1.949935270157426e-05, 'epoch': 0.26} {'loss': 0.4187, 'learning_rate': 1.9499247721080788e-05, 'epoch': 0.26} {'loss': 0.6315, 'learning_rate': 1.949914272986447e-05, 'epoch': 0.26} {'loss': 0.6583, 'learning_rate': 1.949903772792543e-05, 'epoch': 0.26} {'loss': 0.6498, 'learning_rate': 1.9498932715263784e-05, 'epoch': 0.26} {'loss': 0.616, 'learning_rate': 1.9498827691879646e-05, 'epoch': 0.26} {'loss': 0.5042, 'learning_rate': 1.9498722657773136e-05, 'epoch': 0.26} {'loss': 0.6264, 'learning_rate': 1.949861761294438e-05, 'epoch': 0.26} {'loss': 0.4969, 'learning_rate': 1.9498512557393486e-05, 'epoch': 0.26} {'loss': 0.5704, 'learning_rate': 1.9498407491120584e-05, 'epoch': 0.26} {'loss': 0.6256, 'learning_rate': 1.949830241412578e-05, 'epoch': 0.26} {'loss': 0.5221, 'learning_rate': 1.9498197326409202e-05, 'epoch': 0.26} {'loss': 0.5974, 'learning_rate': 1.9498092227970963e-05, 'epoch': 0.26} {'loss': 0.5184, 'learning_rate': 1.9497987118811187e-05, 'epoch': 0.26} {'loss': 0.7001, 'learning_rate': 1.9497881998929987e-05, 'epoch': 0.26} {'loss': 0.4723, 'learning_rate': 1.9497776868327484e-05, 'epoch': 0.26} {'loss': 0.5634, 'learning_rate': 1.94976717270038e-05, 'epoch': 0.26} {'loss': 0.6266, 'learning_rate': 1.9497566574959048e-05, 'epoch': 0.26} {'loss': 0.5742, 'learning_rate': 1.9497461412193348e-05, 'epoch': 0.26} {'loss': 0.5016, 'learning_rate': 1.9497356238706824e-05, 'epoch': 0.26} {'loss': 0.547, 'learning_rate': 1.9497251054499587e-05, 'epoch': 0.26} {'loss': 0.6981, 'learning_rate': 1.9497145859571766e-05, 'epoch': 0.26} {'loss': 0.5485, 'learning_rate': 1.9497040653923468e-05, 'epoch': 0.26} {'loss': 0.5192, 'learning_rate': 1.9496935437554817e-05, 'epoch': 0.26} {'loss': 0.5776, 'learning_rate': 1.9496830210465934e-05, 'epoch': 0.26} {'loss': 0.4818, 'learning_rate': 1.9496724972656934e-05, 'epoch': 0.26} {'loss': 0.6874, 'learning_rate': 1.9496619724127936e-05, 'epoch': 0.26} {'loss': 0.5549, 'learning_rate': 1.949651446487906e-05, 'epoch': 0.26} {'loss': 0.6294, 'learning_rate': 1.949640919491043e-05, 'epoch': 0.26} {'loss': 0.6515, 'learning_rate': 1.9496303914222155e-05, 'epoch': 0.26} {'loss': 0.485, 'learning_rate': 1.949619862281436e-05, 'epoch': 0.26} {'loss': 0.4372, 'learning_rate': 1.9496093320687164e-05, 'epoch': 0.26} {'loss': 0.4627, 'learning_rate': 1.9495988007840684e-05, 'epoch': 0.26} {'loss': 0.6341, 'learning_rate': 1.949588268427504e-05, 'epoch': 0.26} {'loss': 0.5372, 'learning_rate': 1.949577734999035e-05, 'epoch': 0.26} {'loss': 0.5312, 'learning_rate': 1.949567200498673e-05, 'epoch': 0.26} {'loss': 0.5487, 'learning_rate': 1.9495566649264304e-05, 'epoch': 0.26} {'loss': 0.5916, 'learning_rate': 1.949546128282319e-05, 'epoch': 0.26} {'loss': 0.6251, 'learning_rate': 1.9495355905663504e-05, 'epoch': 0.26} {'loss': 0.5307, 'learning_rate': 1.949525051778537e-05, 'epoch': 0.26} {'loss': 0.6157, 'learning_rate': 1.9495145119188898e-05, 'epoch': 0.26} {'loss': 0.4344, 'learning_rate': 1.9495039709874216e-05, 'epoch': 0.26} {'loss': 0.4843, 'learning_rate': 1.9494934289841442e-05, 'epoch': 0.26} {'loss': 0.5113, 'learning_rate': 1.949482885909069e-05, 'epoch': 0.26} {'loss': 0.5515, 'learning_rate': 1.949472341762208e-05, 'epoch': 0.26} {'loss': 0.4776, 'learning_rate': 1.9494617965435737e-05, 'epoch': 0.26} {'loss': 0.3822, 'learning_rate': 1.9494512502531773e-05, 'epoch': 0.26} {'loss': 0.3848, 'learning_rate': 1.9494407028910312e-05, 'epoch': 0.26} {'loss': 0.5658, 'learning_rate': 1.9494301544571468e-05, 'epoch': 0.26} {'loss': 0.5705, 'learning_rate': 1.9494196049515367e-05, 'epoch': 0.26} {'loss': 0.7559, 'learning_rate': 1.949409054374212e-05, 'epoch': 0.26} {'loss': 0.5236, 'learning_rate': 1.949398502725185e-05, 'epoch': 0.26} {'loss': 0.4525, 'learning_rate': 1.949387950004468e-05, 'epoch': 0.26} {'loss': 0.6342, 'learning_rate': 1.9493773962120722e-05, 'epoch': 0.26} {'loss': 0.4787, 'learning_rate': 1.9493668413480104e-05, 'epoch': 0.26} {'loss': 0.4617, 'learning_rate': 1.9493562854122933e-05, 'epoch': 0.26} {'loss': 0.4114, 'learning_rate': 1.949345728404934e-05, 'epoch': 0.26} {'loss': 0.5065, 'learning_rate': 1.9493351703259433e-05, 'epoch': 0.26} {'loss': 0.5852, 'learning_rate': 1.9493246111753344e-05, 'epoch': 0.26} {'loss': 0.6272, 'learning_rate': 1.949314050953118e-05, 'epoch': 0.26} {'loss': 0.6305, 'learning_rate': 1.949303489659307e-05, 'epoch': 0.26} {'loss': 0.6632, 'learning_rate': 1.9492929272939125e-05, 'epoch': 0.26} {'loss': 0.5852, 'learning_rate': 1.949282363856947e-05, 'epoch': 0.26} {'loss': 0.6095, 'learning_rate': 1.949271799348422e-05, 'epoch': 0.26} {'loss': 0.6522, 'learning_rate': 1.9492612337683498e-05, 'epoch': 0.26} {'loss': 0.4953, 'learning_rate': 1.9492506671167423e-05, 'epoch': 0.26} {'loss': 0.4827, 'learning_rate': 1.949240099393611e-05, 'epoch': 0.26} {'loss': 0.5192, 'learning_rate': 1.9492295305989683e-05, 'epoch': 0.26} {'loss': 0.5799, 'learning_rate': 1.9492189607328264e-05, 'epoch': 0.26} {'loss': 0.5631, 'learning_rate': 1.9492083897951963e-05, 'epoch': 0.26} {'loss': 0.6338, 'learning_rate': 1.9491978177860905e-05, 'epoch': 0.26} {'loss': 0.4488, 'learning_rate': 1.9491872447055206e-05, 'epoch': 0.26} {'loss': 0.5993, 'learning_rate': 1.949176670553499e-05, 'epoch': 0.26} {'loss': 0.5743, 'learning_rate': 1.949166095330038e-05, 'epoch': 0.26} {'loss': 0.667, 'learning_rate': 1.9491555190351483e-05, 'epoch': 0.26} {'loss': 0.6535, 'learning_rate': 1.9491449416688428e-05, 'epoch': 0.26} {'loss': 0.5401, 'learning_rate': 1.9491343632311327e-05, 'epoch': 0.26} {'loss': 0.6616, 'learning_rate': 1.949123783722031e-05, 'epoch': 0.26} {'loss': 0.6086, 'learning_rate': 1.9491132031415488e-05, 'epoch': 0.26} {'loss': 0.5134, 'learning_rate': 1.9491026214896983e-05, 'epoch': 0.26} {'loss': 0.5421, 'learning_rate': 1.9490920387664914e-05, 'epoch': 0.26} {'loss': 0.5403, 'learning_rate': 1.94908145497194e-05, 'epoch': 0.26} {'loss': 0.5955, 'learning_rate': 1.9490708701060563e-05, 'epoch': 0.26} {'loss': 0.5692, 'learning_rate': 1.9490602841688516e-05, 'epoch': 0.26} {'loss': 0.4687, 'learning_rate': 1.9490496971603384e-05, 'epoch': 0.26} {'loss': 0.7303, 'learning_rate': 1.949039109080529e-05, 'epoch': 0.26} {'loss': 0.5372, 'learning_rate': 1.9490285199294345e-05, 'epoch': 0.26} {'loss': 0.6032, 'learning_rate': 1.9490179297070675e-05, 'epoch': 0.26} {'loss': 0.5025, 'learning_rate': 1.94900733841344e-05, 'epoch': 0.26} {'loss': 0.6061, 'learning_rate': 1.948996746048563e-05, 'epoch': 0.26} {'loss': 0.3778, 'learning_rate': 1.9489861526124498e-05, 'epoch': 0.26} {'loss': 0.5532, 'learning_rate': 1.948975558105111e-05, 'epoch': 0.26} {'loss': 0.3619, 'learning_rate': 1.9489649625265598e-05, 'epoch': 0.26} {'loss': 0.6066, 'learning_rate': 1.9489543658768075e-05, 'epoch': 0.26} {'loss': 0.5864, 'learning_rate': 1.9489437681558662e-05, 'epoch': 0.26} {'loss': 0.6105, 'learning_rate': 1.9489331693637477e-05, 'epoch': 0.26} {'loss': 0.7041, 'learning_rate': 1.948922569500464e-05, 'epoch': 0.26} {'loss': 0.6121, 'learning_rate': 1.9489119685660274e-05, 'epoch': 0.26} {'loss': 0.5513, 'learning_rate': 1.9489013665604495e-05, 'epoch': 0.26} {'loss': 0.6046, 'learning_rate': 1.9488907634837426e-05, 'epoch': 0.26} {'loss': 0.5436, 'learning_rate': 1.9488801593359185e-05, 'epoch': 0.26} {'loss': 0.6246, 'learning_rate': 1.9488695541169887e-05, 'epoch': 0.26} {'loss': 0.5089, 'learning_rate': 1.948858947826966e-05, 'epoch': 0.26} {'loss': 0.6395, 'learning_rate': 1.9488483404658618e-05, 'epoch': 0.26} {'loss': 0.5937, 'learning_rate': 1.948837732033688e-05, 'epoch': 0.26} {'loss': 0.5231, 'learning_rate': 1.9488271225304572e-05, 'epoch': 0.26} {'loss': 0.5333, 'learning_rate': 1.948816511956181e-05, 'epoch': 0.26} {'loss': 0.5768, 'learning_rate': 1.9488059003108714e-05, 'epoch': 0.26} {'loss': 0.6889, 'learning_rate': 1.9487952875945403e-05, 'epoch': 0.26} {'loss': 0.6078, 'learning_rate': 1.9487846738071997e-05, 'epoch': 0.26} {'loss': 0.5293, 'learning_rate': 1.9487740589488618e-05, 'epoch': 0.26} {'loss': 0.4851, 'learning_rate': 1.9487634430195382e-05, 'epoch': 0.26} {'loss': 0.602, 'learning_rate': 1.948752826019241e-05, 'epoch': 0.26} {'loss': 0.5731, 'learning_rate': 1.948742207947982e-05, 'epoch': 0.26} {'loss': 0.5942, 'learning_rate': 1.9487315888057745e-05, 'epoch': 0.26} {'loss': 0.4766, 'learning_rate': 1.9487209685926288e-05, 'epoch': 0.26} {'loss': 0.6202, 'learning_rate': 1.9487103473085574e-05, 'epoch': 0.26} {'loss': 0.4841, 'learning_rate': 1.9486997249535727e-05, 'epoch': 0.26} {'loss': 0.6566, 'learning_rate': 1.9486891015276863e-05, 'epoch': 0.26} {'loss': 0.4363, 'learning_rate': 1.9486784770309103e-05, 'epoch': 0.26} {'loss': 0.4169, 'learning_rate': 1.9486678514632564e-05, 'epoch': 0.26} {'loss': 0.5664, 'learning_rate': 1.9486572248247373e-05, 'epoch': 0.26} {'loss': 0.4855, 'learning_rate': 1.9486465971153647e-05, 'epoch': 0.26} {'loss': 0.3601, 'learning_rate': 1.9486359683351502e-05, 'epoch': 0.26} {'loss': 0.7196, 'learning_rate': 1.948625338484106e-05, 'epoch': 0.26} {'loss': 0.6316, 'learning_rate': 1.9486147075622442e-05, 'epoch': 0.26} {'loss': 0.57, 'learning_rate': 1.948604075569577e-05, 'epoch': 0.26} {'loss': 0.6671, 'learning_rate': 1.9485934425061162e-05, 'epoch': 0.26} {'loss': 0.4933, 'learning_rate': 1.9485828083718736e-05, 'epoch': 0.26} {'loss': 0.7243, 'learning_rate': 1.9485721731668615e-05, 'epoch': 0.26} {'loss': 0.5963, 'learning_rate': 1.948561536891092e-05, 'epoch': 0.26} {'loss': 0.5376, 'learning_rate': 1.9485508995445764e-05, 'epoch': 0.26} {'loss': 0.7645, 'learning_rate': 1.9485402611273273e-05, 'epoch': 0.26} {'loss': 0.5493, 'learning_rate': 1.948529621639357e-05, 'epoch': 0.26} {'loss': 0.5481, 'learning_rate': 1.948518981080677e-05, 'epoch': 0.26} {'loss': 0.6339, 'learning_rate': 1.9485083394512992e-05, 'epoch': 0.26} {'loss': 0.5792, 'learning_rate': 1.948497696751236e-05, 'epoch': 0.26} {'loss': 0.5372, 'learning_rate': 1.9484870529804992e-05, 'epoch': 0.26} {'loss': 0.516, 'learning_rate': 1.948476408139101e-05, 'epoch': 0.26} {'loss': 0.6147, 'learning_rate': 1.9484657622270534e-05, 'epoch': 0.26} {'loss': 0.5469, 'learning_rate': 1.948455115244368e-05, 'epoch': 0.26} {'loss': 0.5631, 'learning_rate': 1.9484444671910572e-05, 'epoch': 0.26} {'loss': 0.6205, 'learning_rate': 1.9484338180671335e-05, 'epoch': 0.26} {'loss': 0.5547, 'learning_rate': 1.9484231678726078e-05, 'epoch': 0.26} {'loss': 0.531, 'learning_rate': 1.9484125166074928e-05, 'epoch': 0.26} {'loss': 0.483, 'learning_rate': 1.9484018642718007e-05, 'epoch': 0.26} {'loss': 0.5836, 'learning_rate': 1.9483912108655426e-05, 'epoch': 0.26} {'loss': 0.4675, 'learning_rate': 1.9483805563887317e-05, 'epoch': 0.26} {'loss': 0.6718, 'learning_rate': 1.9483699008413794e-05, 'epoch': 0.26} {'loss': 0.6494, 'learning_rate': 1.9483592442234976e-05, 'epoch': 0.26} {'loss': 0.5506, 'learning_rate': 1.948348586535099e-05, 'epoch': 0.26} {'loss': 0.5885, 'learning_rate': 1.9483379277761947e-05, 'epoch': 0.26} {'loss': 0.5837, 'learning_rate': 1.9483272679467974e-05, 'epoch': 0.26} {'loss': 0.7042, 'learning_rate': 1.9483166070469188e-05, 'epoch': 0.26} {'loss': 0.5623, 'learning_rate': 1.9483059450765714e-05, 'epoch': 0.26} {'loss': 0.5965, 'learning_rate': 1.948295282035767e-05, 'epoch': 0.26} {'loss': 0.5223, 'learning_rate': 1.948284617924517e-05, 'epoch': 0.26} {'loss': 0.5008, 'learning_rate': 1.9482739527428343e-05, 'epoch': 0.26} {'loss': 0.7057, 'learning_rate': 1.9482632864907307e-05, 'epoch': 0.26} {'loss': 0.5024, 'learning_rate': 1.9482526191682183e-05, 'epoch': 0.26} {'loss': 0.6195, 'learning_rate': 1.9482419507753087e-05, 'epoch': 0.26} {'loss': 0.6546, 'learning_rate': 1.9482312813120144e-05, 'epoch': 0.26} {'loss': 0.6765, 'learning_rate': 1.9482206107783473e-05, 'epoch': 0.26} {'loss': 0.4401, 'learning_rate': 1.9482099391743192e-05, 'epoch': 0.26} {'loss': 0.6388, 'learning_rate': 1.9481992664999427e-05, 'epoch': 0.26} {'loss': 0.423, 'learning_rate': 1.9481885927552295e-05, 'epoch': 0.26} {'loss': 0.6038, 'learning_rate': 1.9481779179401917e-05, 'epoch': 0.26} {'loss': 0.6409, 'learning_rate': 1.9481672420548413e-05, 'epoch': 0.26} {'loss': 0.6213, 'learning_rate': 1.9481565650991902e-05, 'epoch': 0.26} {'loss': 0.4972, 'learning_rate': 1.9481458870732507e-05, 'epoch': 0.26} {'loss': 0.5226, 'learning_rate': 1.948135207977035e-05, 'epoch': 0.26} {'loss': 0.6544, 'learning_rate': 1.9481245278105547e-05, 'epoch': 0.26} {'loss': 0.4935, 'learning_rate': 1.9481138465738223e-05, 'epoch': 0.26} {'loss': 0.6946, 'learning_rate': 1.9481031642668495e-05, 'epoch': 0.26} {'loss': 0.5381, 'learning_rate': 1.9480924808896486e-05, 'epoch': 0.26} {'loss': 0.6648, 'learning_rate': 1.9480817964422316e-05, 'epoch': 0.26} {'loss': 0.6354, 'learning_rate': 1.9480711109246106e-05, 'epoch': 0.26} {'loss': 0.5835, 'learning_rate': 1.9480604243367974e-05, 'epoch': 0.26} {'loss': 0.5629, 'learning_rate': 1.9480497366788044e-05, 'epoch': 0.26} {'loss': 0.6917, 'learning_rate': 1.9480390479506436e-05, 'epoch': 0.26} {'loss': 0.383, 'learning_rate': 1.948028358152327e-05, 'epoch': 0.26} {'loss': 0.5919, 'learning_rate': 1.9480176672838665e-05, 'epoch': 0.26} {'loss': 0.4745, 'learning_rate': 1.9480069753452742e-05, 'epoch': 0.26} {'loss': 0.7009, 'learning_rate': 1.9479962823365626e-05, 'epoch': 0.26} {'loss': 0.5495, 'learning_rate': 1.947985588257743e-05, 'epoch': 0.26} {'loss': 0.5578, 'learning_rate': 1.9479748931088286e-05, 'epoch': 0.26} {'loss': 0.5668, 'learning_rate': 1.9479641968898306e-05, 'epoch': 0.26} {'loss': 0.5908, 'learning_rate': 1.947953499600761e-05, 'epoch': 0.26} {'loss': 0.5841, 'learning_rate': 1.9479428012416322e-05, 'epoch': 0.26} {'loss': 0.6144, 'learning_rate': 1.9479321018124566e-05, 'epoch': 0.26} {'loss': 0.6755, 'learning_rate': 1.9479214013132456e-05, 'epoch': 0.26} {'loss': 0.3414, 'learning_rate': 1.9479106997440118e-05, 'epoch': 0.26} {'loss': 0.6605, 'learning_rate': 1.947899997104767e-05, 'epoch': 0.26} {'loss': 0.3799, 'learning_rate': 1.947889293395523e-05, 'epoch': 0.26} {'loss': 0.5294, 'learning_rate': 1.9478785886162928e-05, 'epoch': 0.26} {'loss': 0.5918, 'learning_rate': 1.9478678827670875e-05, 'epoch': 0.26} {'loss': 0.5188, 'learning_rate': 1.9478571758479197e-05, 'epoch': 0.26} {'loss': 0.6794, 'learning_rate': 1.947846467858802e-05, 'epoch': 0.26} {'loss': 0.4719, 'learning_rate': 1.947835758799745e-05, 'epoch': 0.26} {'loss': 0.6458, 'learning_rate': 1.947825048670762e-05, 'epoch': 0.26} {'loss': 0.5805, 'learning_rate': 1.947814337471865e-05, 'epoch': 0.26} {'loss': 0.5722, 'learning_rate': 1.9478036252030653e-05, 'epoch': 0.26} {'loss': 0.671, 'learning_rate': 1.947792911864376e-05, 'epoch': 0.26} {'loss': 0.5333, 'learning_rate': 1.9477821974558087e-05, 'epoch': 0.26} {'loss': 0.6326, 'learning_rate': 1.9477714819773753e-05, 'epoch': 0.26} {'loss': 0.638, 'learning_rate': 1.9477607654290885e-05, 'epoch': 0.26} {'loss': 0.5559, 'learning_rate': 1.9477500478109598e-05, 'epoch': 0.26} {'loss': 0.583, 'learning_rate': 1.9477393291230014e-05, 'epoch': 0.26} {'loss': 0.5966, 'learning_rate': 1.9477286093652258e-05, 'epoch': 0.26} {'loss': 0.5273, 'learning_rate': 1.9477178885376445e-05, 'epoch': 0.26} {'loss': 0.4955, 'learning_rate': 1.94770716664027e-05, 'epoch': 0.26} {'loss': 0.4953, 'learning_rate': 1.947696443673114e-05, 'epoch': 0.26} {'loss': 0.6075, 'learning_rate': 1.9476857196361897e-05, 'epoch': 0.26} {'loss': 0.5716, 'learning_rate': 1.9476749945295078e-05, 'epoch': 0.26} {'loss': 0.5594, 'learning_rate': 1.9476642683530812e-05, 'epoch': 0.26} {'loss': 0.5568, 'learning_rate': 1.947653541106922e-05, 'epoch': 0.26} {'loss': 0.6279, 'learning_rate': 1.9476428127910424e-05, 'epoch': 0.26} {'loss': 0.5962, 'learning_rate': 1.947632083405454e-05, 'epoch': 0.26} {'loss': 0.8145, 'learning_rate': 1.947621352950169e-05, 'epoch': 0.26} {'loss': 0.573, 'learning_rate': 1.9476106214251994e-05, 'epoch': 0.26} {'loss': 0.655, 'learning_rate': 1.9475998888305582e-05, 'epoch': 0.26} {'loss': 0.5902, 'learning_rate': 1.9475891551662567e-05, 'epoch': 0.26} {'loss': 0.5677, 'learning_rate': 1.9475784204323073e-05, 'epoch': 0.26} {'loss': 0.5979, 'learning_rate': 1.947567684628722e-05, 'epoch': 0.26} {'loss': 0.6567, 'learning_rate': 1.9475569477555128e-05, 'epoch': 0.26} {'loss': 0.5324, 'learning_rate': 1.9475462098126923e-05, 'epoch': 0.26} {'loss': 0.6244, 'learning_rate': 1.9475354708002725e-05, 'epoch': 0.26} {'loss': 0.5965, 'learning_rate': 1.947524730718265e-05, 'epoch': 0.26} {'loss': 0.651, 'learning_rate': 1.9475139895666824e-05, 'epoch': 0.26} {'loss': 0.6514, 'learning_rate': 1.9475032473455364e-05, 'epoch': 0.26} {'loss': 0.4848, 'learning_rate': 1.9474925040548396e-05, 'epoch': 0.26} {'loss': 0.6882, 'learning_rate': 1.947481759694604e-05, 'epoch': 0.26} {'loss': 0.6087, 'learning_rate': 1.9474710142648418e-05, 'epoch': 0.26} {'loss': 0.5804, 'learning_rate': 1.9474602677655645e-05, 'epoch': 0.26} {'loss': 0.6299, 'learning_rate': 1.947449520196785e-05, 'epoch': 0.26} {'loss': 0.6495, 'learning_rate': 1.9474387715585152e-05, 'epoch': 0.26} {'loss': 0.5411, 'learning_rate': 1.947428021850767e-05, 'epoch': 0.26} {'loss': 0.4636, 'learning_rate': 1.947417271073553e-05, 'epoch': 0.26} {'loss': 0.7154, 'learning_rate': 1.947406519226885e-05, 'epoch': 0.26} {'loss': 0.6157, 'learning_rate': 1.947395766310775e-05, 'epoch': 0.26} {'loss': 0.5575, 'learning_rate': 1.9473850123252357e-05, 'epoch': 0.26} {'loss': 0.6512, 'learning_rate': 1.9473742572702785e-05, 'epoch': 0.26} {'loss': 0.6529, 'learning_rate': 1.947363501145916e-05, 'epoch': 0.26} {'loss': 0.6404, 'learning_rate': 1.9473527439521605e-05, 'epoch': 0.26} {'loss': 0.5727, 'learning_rate': 1.9473419856890237e-05, 'epoch': 0.26} {'loss': 0.6693, 'learning_rate': 1.947331226356518e-05, 'epoch': 0.26} {'loss': 0.6239, 'learning_rate': 1.9473204659546554e-05, 'epoch': 0.26} {'loss': 0.5376, 'learning_rate': 1.9473097044834484e-05, 'epoch': 0.26} {'loss': 0.5891, 'learning_rate': 1.9472989419429087e-05, 'epoch': 0.26} {'loss': 0.4967, 'learning_rate': 1.9472881783330485e-05, 'epoch': 0.26} {'loss': 0.6312, 'learning_rate': 1.94727741365388e-05, 'epoch': 0.26} {'loss': 0.659, 'learning_rate': 1.9472666479054155e-05, 'epoch': 0.26} {'loss': 0.6511, 'learning_rate': 1.9472558810876677e-05, 'epoch': 0.26} {'loss': 0.6603, 'learning_rate': 1.9472451132006473e-05, 'epoch': 0.26} {'loss': 0.5386, 'learning_rate': 1.9472343442443676e-05, 'epoch': 0.26} {'loss': 0.5498, 'learning_rate': 1.9472235742188407e-05, 'epoch': 0.26} {'loss': 0.4917, 'learning_rate': 1.9472128031240784e-05, 'epoch': 0.26} {'loss': 0.5006, 'learning_rate': 1.9472020309600927e-05, 'epoch': 0.26} {'loss': 0.5326, 'learning_rate': 1.947191257726896e-05, 'epoch': 0.26} {'loss': 0.6454, 'learning_rate': 1.947180483424501e-05, 'epoch': 0.26} {'loss': 0.4941, 'learning_rate': 1.9471697080529188e-05, 'epoch': 0.26} {'loss': 0.4835, 'learning_rate': 1.9471589316121625e-05, 'epoch': 0.26} {'loss': 0.5519, 'learning_rate': 1.9471481541022437e-05, 'epoch': 0.26} {'loss': 0.6372, 'learning_rate': 1.9471373755231748e-05, 'epoch': 0.26} {'loss': 0.6951, 'learning_rate': 1.9471265958749676e-05, 'epoch': 0.26} {'loss': 0.5673, 'learning_rate': 1.947115815157635e-05, 'epoch': 0.26} {'loss': 0.5441, 'learning_rate': 1.9471050333711886e-05, 'epoch': 0.26} {'loss': 0.6893, 'learning_rate': 1.9470942505156408e-05, 'epoch': 0.26} {'loss': 0.6094, 'learning_rate': 1.9470834665910035e-05, 'epoch': 0.26} {'loss': 0.5992, 'learning_rate': 1.9470726815972894e-05, 'epoch': 0.26} {'loss': 0.6382, 'learning_rate': 1.94706189553451e-05, 'epoch': 0.26} {'loss': 0.477, 'learning_rate': 1.947051108402678e-05, 'epoch': 0.26} {'loss': 0.6611, 'learning_rate': 1.947040320201805e-05, 'epoch': 0.26} {'loss': 0.551, 'learning_rate': 1.947029530931904e-05, 'epoch': 0.26} {'loss': 0.6476, 'learning_rate': 1.9470187405929867e-05, 'epoch': 0.26} {'loss': 0.6723, 'learning_rate': 1.947007949185065e-05, 'epoch': 0.26} {'loss': 0.4857, 'learning_rate': 1.9469971567081517e-05, 'epoch': 0.26} {'loss': 0.5992, 'learning_rate': 1.946986363162259e-05, 'epoch': 0.26} {'loss': 0.4845, 'learning_rate': 1.9469755685473984e-05, 'epoch': 0.26} {'loss': 0.5911, 'learning_rate': 1.946964772863582e-05, 'epoch': 0.26} {'loss': 0.5054, 'learning_rate': 1.946953976110823e-05, 'epoch': 0.26} {'loss': 0.619, 'learning_rate': 1.946943178289133e-05, 'epoch': 0.26} {'loss': 0.6698, 'learning_rate': 1.9469323793985242e-05, 'epoch': 0.26} {'loss': 0.5582, 'learning_rate': 1.9469215794390088e-05, 'epoch': 0.26} {'loss': 0.7565, 'learning_rate': 1.946910778410599e-05, 'epoch': 0.26} {'loss': 0.5594, 'learning_rate': 1.946899976313307e-05, 'epoch': 0.26} {'loss': 0.5619, 'learning_rate': 1.9468891731471447e-05, 'epoch': 0.26} {'loss': 0.5276, 'learning_rate': 1.946878368912125e-05, 'epoch': 0.26} {'loss': 0.5469, 'learning_rate': 1.9468675636082597e-05, 'epoch': 0.26} {'loss': 0.5175, 'learning_rate': 1.9468567572355607e-05, 'epoch': 0.26} {'loss': 0.518, 'learning_rate': 1.9468459497940406e-05, 'epoch': 0.26} {'loss': 0.7664, 'learning_rate': 1.9468351412837114e-05, 'epoch': 0.26} {'loss': 0.5889, 'learning_rate': 1.9468243317045857e-05, 'epoch': 0.26} {'loss': 0.5972, 'learning_rate': 1.946813521056675e-05, 'epoch': 0.26} {'loss': 0.6117, 'learning_rate': 1.946802709339992e-05, 'epoch': 0.26} {'loss': 0.6291, 'learning_rate': 1.9467918965545487e-05, 'epoch': 0.26} {'loss': 0.6353, 'learning_rate': 1.9467810827003573e-05, 'epoch': 0.26} {'loss': 0.6152, 'learning_rate': 1.9467702677774303e-05, 'epoch': 0.26} {'loss': 0.6182, 'learning_rate': 1.9467594517857797e-05, 'epoch': 0.26} {'loss': 0.6427, 'learning_rate': 1.9467486347254175e-05, 'epoch': 0.26} {'loss': 0.6513, 'learning_rate': 1.9467378165963566e-05, 'epoch': 0.26} {'loss': 0.675, 'learning_rate': 1.9467269973986084e-05, 'epoch': 0.26} {'loss': 0.6653, 'learning_rate': 1.9467161771321855e-05, 'epoch': 0.26} {'loss': 0.4938, 'learning_rate': 1.9467053557970997e-05, 'epoch': 0.26} {'loss': 0.6333, 'learning_rate': 1.9466945333933644e-05, 'epoch': 0.26} {'loss': 0.7327, 'learning_rate': 1.9466837099209902e-05, 'epoch': 0.26} {'loss': 0.4766, 'learning_rate': 1.9466728853799905e-05, 'epoch': 0.26} {'loss': 0.6474, 'learning_rate': 1.946662059770377e-05, 'epoch': 0.26} {'loss': 0.5395, 'learning_rate': 1.946651233092162e-05, 'epoch': 0.26} {'loss': 0.6721, 'learning_rate': 1.9466404053453578e-05, 'epoch': 0.26} {'loss': 0.6954, 'learning_rate': 1.946629576529977e-05, 'epoch': 0.26} {'loss': 0.5502, 'learning_rate': 1.946618746646031e-05, 'epoch': 0.26} {'loss': 0.651, 'learning_rate': 1.9466079156935326e-05, 'epoch': 0.26} {'loss': 0.4343, 'learning_rate': 1.9465970836724937e-05, 'epoch': 0.26} {'loss': 0.6086, 'learning_rate': 1.9465862505829267e-05, 'epoch': 0.26} {'loss': 0.6319, 'learning_rate': 1.9465754164248437e-05, 'epoch': 0.26} {'loss': 0.6002, 'learning_rate': 1.9465645811982577e-05, 'epoch': 0.26} {'loss': 0.7187, 'learning_rate': 1.9465537449031796e-05, 'epoch': 0.26} {'loss': 0.5446, 'learning_rate': 1.9465429075396226e-05, 'epoch': 0.26} {'loss': 0.476, 'learning_rate': 1.9465320691075987e-05, 'epoch': 0.26} {'loss': 0.5122, 'learning_rate': 1.94652122960712e-05, 'epoch': 0.26} {'loss': 0.5162, 'learning_rate': 1.9465103890381985e-05, 'epoch': 0.26} {'loss': 0.6282, 'learning_rate': 1.9464995474008474e-05, 'epoch': 0.26} {'loss': 0.5008, 'learning_rate': 1.946488704695078e-05, 'epoch': 0.26} {'loss': 0.6488, 'learning_rate': 1.9464778609209027e-05, 'epoch': 0.26} {'loss': 0.6102, 'learning_rate': 1.946467016078334e-05, 'epoch': 0.26} {'loss': 0.6201, 'learning_rate': 1.946456170167384e-05, 'epoch': 0.26} {'loss': 0.5579, 'learning_rate': 1.946445323188065e-05, 'epoch': 0.26} {'loss': 0.7169, 'learning_rate': 1.9464344751403893e-05, 'epoch': 0.26} {'loss': 0.4091, 'learning_rate': 1.9464236260243688e-05, 'epoch': 0.26} {'loss': 0.5655, 'learning_rate': 1.946412775840016e-05, 'epoch': 0.27} {'loss': 0.5626, 'learning_rate': 1.9464019245873435e-05, 'epoch': 0.27} {'loss': 0.5584, 'learning_rate': 1.946391072266363e-05, 'epoch': 0.27} {'loss': 0.4246, 'learning_rate': 1.9463802188770868e-05, 'epoch': 0.27} {'loss': 0.4053, 'learning_rate': 1.9463693644195274e-05, 'epoch': 0.27} {'loss': 0.7167, 'learning_rate': 1.9463585088936972e-05, 'epoch': 0.27} {'loss': 0.499, 'learning_rate': 1.9463476522996077e-05, 'epoch': 0.27} {'loss': 0.4031, 'learning_rate': 1.946336794637272e-05, 'epoch': 0.27} {'loss': 0.7187, 'learning_rate': 1.946325935906702e-05, 'epoch': 0.27} {'loss': 0.5857, 'learning_rate': 1.9463150761079097e-05, 'epoch': 0.27} {'loss': 0.6136, 'learning_rate': 1.946304215240908e-05, 'epoch': 0.27} {'loss': 0.5954, 'learning_rate': 1.946293353305709e-05, 'epoch': 0.27} {'loss': 0.4261, 'learning_rate': 1.946282490302324e-05, 'epoch': 0.27} {'loss': 0.6734, 'learning_rate': 1.9462716262307665e-05, 'epoch': 0.27} {'loss': 0.7512, 'learning_rate': 1.946260761091048e-05, 'epoch': 0.27} {'loss': 0.5363, 'learning_rate': 1.9462498948831813e-05, 'epoch': 0.27} {'loss': 0.4528, 'learning_rate': 1.946239027607178e-05, 'epoch': 0.27} {'loss': 0.6547, 'learning_rate': 1.946228159263051e-05, 'epoch': 0.27} {'loss': 0.5241, 'learning_rate': 1.9462172898508127e-05, 'epoch': 0.27} {'loss': 0.5922, 'learning_rate': 1.9462064193704745e-05, 'epoch': 0.27} {'loss': 0.6156, 'learning_rate': 1.9461955478220495e-05, 'epoch': 0.27} {'loss': 0.537, 'learning_rate': 1.9461846752055495e-05, 'epoch': 0.27} {'loss': 0.7154, 'learning_rate': 1.946173801520987e-05, 'epoch': 0.27} {'loss': 0.4869, 'learning_rate': 1.9461629267683742e-05, 'epoch': 0.27} {'loss': 0.6143, 'learning_rate': 1.9461520509477238e-05, 'epoch': 0.27} {'loss': 0.5693, 'learning_rate': 1.9461411740590467e-05, 'epoch': 0.27} {'loss': 0.5698, 'learning_rate': 1.9461302961023567e-05, 'epoch': 0.27} {'loss': 0.61, 'learning_rate': 1.9461194170776655e-05, 'epoch': 0.27} {'loss': 0.6423, 'learning_rate': 1.9461085369849853e-05, 'epoch': 0.27} {'loss': 0.5795, 'learning_rate': 1.9460976558243288e-05, 'epoch': 0.27} {'loss': 0.5759, 'learning_rate': 1.9460867735957073e-05, 'epoch': 0.27} {'loss': 0.4912, 'learning_rate': 1.9460758902991342e-05, 'epoch': 0.27} {'loss': 0.3411, 'learning_rate': 1.9460650059346213e-05, 'epoch': 0.27} {'loss': 0.5767, 'learning_rate': 1.946054120502181e-05, 'epoch': 0.27} {'loss': 0.5605, 'learning_rate': 1.9460432340018254e-05, 'epoch': 0.27} {'loss': 0.5229, 'learning_rate': 1.9460323464335666e-05, 'epoch': 0.27} {'loss': 0.5199, 'learning_rate': 1.9460214577974174e-05, 'epoch': 0.27} {'loss': 0.6295, 'learning_rate': 1.94601056809339e-05, 'epoch': 0.27} {'loss': 0.6412, 'learning_rate': 1.9459996773214963e-05, 'epoch': 0.27} {'loss': 0.4335, 'learning_rate': 1.9459887854817493e-05, 'epoch': 0.27} {'loss': 0.5051, 'learning_rate': 1.9459778925741606e-05, 'epoch': 0.27} {'loss': 0.4087, 'learning_rate': 1.9459669985987426e-05, 'epoch': 0.27} {'loss': 0.5309, 'learning_rate': 1.9459561035555078e-05, 'epoch': 0.27} {'loss': 0.4645, 'learning_rate': 1.9459452074444683e-05, 'epoch': 0.27} {'loss': 0.6291, 'learning_rate': 1.945934310265637e-05, 'epoch': 0.27} {'loss': 0.6809, 'learning_rate': 1.9459234120190253e-05, 'epoch': 0.27} {'loss': 0.724, 'learning_rate': 1.9459125127046465e-05, 'epoch': 0.27} {'loss': 0.6194, 'learning_rate': 1.9459016123225115e-05, 'epoch': 0.27} {'loss': 0.5909, 'learning_rate': 1.9458907108726342e-05, 'epoch': 0.27} {'loss': 0.6242, 'learning_rate': 1.9458798083550258e-05, 'epoch': 0.27} {'loss': 0.5876, 'learning_rate': 1.9458689047696988e-05, 'epoch': 0.27} {'loss': 0.5395, 'learning_rate': 1.945858000116666e-05, 'epoch': 0.27} {'loss': 0.6036, 'learning_rate': 1.9458470943959393e-05, 'epoch': 0.27} {'loss': 0.728, 'learning_rate': 1.9458361876075308e-05, 'epoch': 0.27} {'loss': 0.5752, 'learning_rate': 1.9458252797514536e-05, 'epoch': 0.27} {'loss': 0.5431, 'learning_rate': 1.9458143708277194e-05, 'epoch': 0.27} {'loss': 0.4808, 'learning_rate': 1.9458034608363405e-05, 'epoch': 0.27} {'loss': 0.5488, 'learning_rate': 1.9457925497773295e-05, 'epoch': 0.27} {'loss': 0.627, 'learning_rate': 1.9457816376506984e-05, 'epoch': 0.27} {'loss': 0.6027, 'learning_rate': 1.9457707244564593e-05, 'epoch': 0.27} {'loss': 0.5572, 'learning_rate': 1.9457598101946256e-05, 'epoch': 0.27} {'loss': 0.595, 'learning_rate': 1.9457488948652085e-05, 'epoch': 0.27} {'loss': 0.6565, 'learning_rate': 1.945737978468221e-05, 'epoch': 0.27} {'loss': 0.4602, 'learning_rate': 1.945727061003675e-05, 'epoch': 0.27} {'loss': 0.5411, 'learning_rate': 1.945716142471583e-05, 'epoch': 0.27} {'loss': 0.56, 'learning_rate': 1.9457052228719573e-05, 'epoch': 0.27} {'loss': 0.6288, 'learning_rate': 1.9456943022048103e-05, 'epoch': 0.27} {'loss': 0.6588, 'learning_rate': 1.945683380470154e-05, 'epoch': 0.27} {'loss': 0.5857, 'learning_rate': 1.9456724576680016e-05, 'epoch': 0.27} {'loss': 0.5809, 'learning_rate': 1.9456615337983643e-05, 'epoch': 0.27} {'loss': 0.5583, 'learning_rate': 1.945650608861255e-05, 'epoch': 0.27} {'loss': 0.5527, 'learning_rate': 1.945639682856686e-05, 'epoch': 0.27} {'loss': 0.5028, 'learning_rate': 1.9456287557846697e-05, 'epoch': 0.27} {'loss': 0.653, 'learning_rate': 1.9456178276452186e-05, 'epoch': 0.27} {'loss': 0.5797, 'learning_rate': 1.9456068984383443e-05, 'epoch': 0.27} {'loss': 0.6395, 'learning_rate': 1.94559596816406e-05, 'epoch': 0.27} {'loss': 0.6461, 'learning_rate': 1.9455850368223777e-05, 'epoch': 0.27} {'loss': 0.6516, 'learning_rate': 1.9455741044133093e-05, 'epoch': 0.27} {'loss': 0.7339, 'learning_rate': 1.945563170936868e-05, 'epoch': 0.27} {'loss': 0.6992, 'learning_rate': 1.9455522363930654e-05, 'epoch': 0.27} {'loss': 0.4558, 'learning_rate': 1.9455413007819143e-05, 'epoch': 0.27} {'loss': 0.5613, 'learning_rate': 1.9455303641034265e-05, 'epoch': 0.27} {'loss': 0.5365, 'learning_rate': 1.945519426357615e-05, 'epoch': 0.27} {'loss': 0.5222, 'learning_rate': 1.9455084875444918e-05, 'epoch': 0.27} {'loss': 0.5681, 'learning_rate': 1.9454975476640694e-05, 'epoch': 0.27} {'loss': 0.4853, 'learning_rate': 1.9454866067163603e-05, 'epoch': 0.27} {'loss': 0.6162, 'learning_rate': 1.9454756647013762e-05, 'epoch': 0.27} {'loss': 0.6004, 'learning_rate': 1.94546472161913e-05, 'epoch': 0.27} {'loss': 0.5779, 'learning_rate': 1.945453777469634e-05, 'epoch': 0.27} {'loss': 0.5601, 'learning_rate': 1.9454428322529006e-05, 'epoch': 0.27} {'loss': 0.6007, 'learning_rate': 1.9454318859689416e-05, 'epoch': 0.27} {'loss': 0.6559, 'learning_rate': 1.94542093861777e-05, 'epoch': 0.27} {'loss': 0.4484, 'learning_rate': 1.945409990199398e-05, 'epoch': 0.27} {'loss': 0.5674, 'learning_rate': 1.945399040713838e-05, 'epoch': 0.27} {'loss': 0.4398, 'learning_rate': 1.945388090161102e-05, 'epoch': 0.27} {'loss': 0.7773, 'learning_rate': 1.945377138541203e-05, 'epoch': 0.27} {'loss': 0.5093, 'learning_rate': 1.9453661858541526e-05, 'epoch': 0.27} {'loss': 0.5464, 'learning_rate': 1.9453552320999637e-05, 'epoch': 0.27} {'loss': 0.5769, 'learning_rate': 1.945344277278648e-05, 'epoch': 0.27} {'loss': 0.5186, 'learning_rate': 1.945333321390219e-05, 'epoch': 0.27} {'loss': 0.5438, 'learning_rate': 1.9453223644346882e-05, 'epoch': 0.27} {'loss': 0.6055, 'learning_rate': 1.9453114064120686e-05, 'epoch': 0.27} {'loss': 0.6066, 'learning_rate': 1.9453004473223717e-05, 'epoch': 0.27} {'loss': 0.4802, 'learning_rate': 1.945289487165611e-05, 'epoch': 0.27} {'loss': 0.5431, 'learning_rate': 1.9452785259417976e-05, 'epoch': 0.27} {'loss': 0.781, 'learning_rate': 1.9452675636509447e-05, 'epoch': 0.27} {'loss': 0.6201, 'learning_rate': 1.9452566002930644e-05, 'epoch': 0.27} {'loss': 0.5419, 'learning_rate': 1.9452456358681692e-05, 'epoch': 0.27} {'loss': 0.5847, 'learning_rate': 1.945234670376271e-05, 'epoch': 0.27} {'loss': 0.57, 'learning_rate': 1.945223703817383e-05, 'epoch': 0.27} {'loss': 0.4298, 'learning_rate': 1.9452127361915173e-05, 'epoch': 0.27} {'loss': 0.6253, 'learning_rate': 1.945201767498686e-05, 'epoch': 0.27} {'loss': 0.6484, 'learning_rate': 1.945190797738902e-05, 'epoch': 0.27} {'loss': 0.5919, 'learning_rate': 1.9451798269121768e-05, 'epoch': 0.27} {'loss': 0.3933, 'learning_rate': 1.9451688550185236e-05, 'epoch': 0.27} {'loss': 0.6876, 'learning_rate': 1.9451578820579544e-05, 'epoch': 0.27} {'loss': 0.6623, 'learning_rate': 1.945146908030482e-05, 'epoch': 0.27} {'loss': 0.4933, 'learning_rate': 1.9451359329361178e-05, 'epoch': 0.27} {'loss': 0.6339, 'learning_rate': 1.9451249567748754e-05, 'epoch': 0.27} {'loss': 0.4883, 'learning_rate': 1.9451139795467666e-05, 'epoch': 0.27} {'loss': 0.7113, 'learning_rate': 1.945103001251804e-05, 'epoch': 0.27} {'loss': 0.5369, 'learning_rate': 1.945092021889999e-05, 'epoch': 0.27} {'loss': 0.6023, 'learning_rate': 1.9450810414613653e-05, 'epoch': 0.27} {'loss': 0.5409, 'learning_rate': 1.945070059965915e-05, 'epoch': 0.27} {'loss': 0.6362, 'learning_rate': 1.9450590774036602e-05, 'epoch': 0.27} {'loss': 0.6827, 'learning_rate': 1.9450480937746135e-05, 'epoch': 0.27} {'loss': 0.4948, 'learning_rate': 1.945037109078787e-05, 'epoch': 0.27} {'loss': 0.5663, 'learning_rate': 1.9450261233161935e-05, 'epoch': 0.27} {'loss': 0.6102, 'learning_rate': 1.9450151364868453e-05, 'epoch': 0.27} {'loss': 0.5489, 'learning_rate': 1.9450041485907546e-05, 'epoch': 0.27} {'loss': 0.6373, 'learning_rate': 1.944993159627934e-05, 'epoch': 0.27} {'loss': 0.7772, 'learning_rate': 1.9449821695983956e-05, 'epoch': 0.27} {'loss': 0.6442, 'learning_rate': 1.944971178502152e-05, 'epoch': 0.27} {'loss': 0.4976, 'learning_rate': 1.944960186339216e-05, 'epoch': 0.27} {'loss': 0.5954, 'learning_rate': 1.9449491931095993e-05, 'epoch': 0.27} {'loss': 0.6695, 'learning_rate': 1.9449381988133148e-05, 'epoch': 0.27} {'loss': 0.5901, 'learning_rate': 1.9449272034503745e-05, 'epoch': 0.27} {'loss': 0.6611, 'learning_rate': 1.9449162070207914e-05, 'epoch': 0.27} {'loss': 0.5676, 'learning_rate': 1.9449052095245774e-05, 'epoch': 0.27} {'loss': 0.4782, 'learning_rate': 1.9448942109617452e-05, 'epoch': 0.27} {'loss': 0.7036, 'learning_rate': 1.9448832113323074e-05, 'epoch': 0.27} {'loss': 0.7477, 'learning_rate': 1.9448722106362756e-05, 'epoch': 0.27} {'loss': 0.6357, 'learning_rate': 1.944861208873663e-05, 'epoch': 0.27} {'loss': 0.6126, 'learning_rate': 1.9448502060444817e-05, 'epoch': 0.27} {'loss': 0.6173, 'learning_rate': 1.944839202148744e-05, 'epoch': 0.27} {'loss': 0.5583, 'learning_rate': 1.944828197186463e-05, 'epoch': 0.27} {'loss': 0.556, 'learning_rate': 1.9448171911576504e-05, 'epoch': 0.27} {'loss': 0.5759, 'learning_rate': 1.9448061840623186e-05, 'epoch': 0.27} {'loss': 0.3803, 'learning_rate': 1.9447951759004808e-05, 'epoch': 0.27} {'loss': 0.5627, 'learning_rate': 1.9447841666721485e-05, 'epoch': 0.27} {'loss': 0.5045, 'learning_rate': 1.9447731563773347e-05, 'epoch': 0.27} {'loss': 0.6722, 'learning_rate': 1.9447621450160516e-05, 'epoch': 0.27} {'loss': 0.6591, 'learning_rate': 1.9447511325883116e-05, 'epoch': 0.27} {'loss': 0.6789, 'learning_rate': 1.9447401190941276e-05, 'epoch': 0.27} {'loss': 0.6085, 'learning_rate': 1.9447291045335116e-05, 'epoch': 0.27} {'loss': 0.7095, 'learning_rate': 1.9447180889064756e-05, 'epoch': 0.27} {'loss': 0.6738, 'learning_rate': 1.9447070722130326e-05, 'epoch': 0.27} {'loss': 0.6557, 'learning_rate': 1.9446960544531955e-05, 'epoch': 0.27} {'loss': 0.6727, 'learning_rate': 1.9446850356269757e-05, 'epoch': 0.27} {'loss': 0.7442, 'learning_rate': 1.9446740157343865e-05, 'epoch': 0.27} {'loss': 0.4667, 'learning_rate': 1.9446629947754398e-05, 'epoch': 0.27} {'loss': 0.4322, 'learning_rate': 1.944651972750148e-05, 'epoch': 0.27} {'loss': 0.5088, 'learning_rate': 1.944640949658524e-05, 'epoch': 0.27} {'loss': 0.5785, 'learning_rate': 1.94462992550058e-05, 'epoch': 0.27} {'loss': 0.5936, 'learning_rate': 1.9446189002763286e-05, 'epoch': 0.27} {'loss': 0.556, 'learning_rate': 1.9446078739857817e-05, 'epoch': 0.27} {'loss': 0.5554, 'learning_rate': 1.9445968466289522e-05, 'epoch': 0.27} {'loss': 0.5747, 'learning_rate': 1.9445858182058525e-05, 'epoch': 0.27} {'loss': 0.7528, 'learning_rate': 1.9445747887164953e-05, 'epoch': 0.27} {'loss': 0.527, 'learning_rate': 1.9445637581608926e-05, 'epoch': 0.27} {'loss': 0.6301, 'learning_rate': 1.944552726539057e-05, 'epoch': 0.27} {'loss': 0.5447, 'learning_rate': 1.9445416938510007e-05, 'epoch': 0.27} {'loss': 0.6311, 'learning_rate': 1.9445306600967374e-05, 'epoch': 0.27} {'loss': 0.5945, 'learning_rate': 1.9445196252762777e-05, 'epoch': 0.27} {'loss': 0.5439, 'learning_rate': 1.9445085893896353e-05, 'epoch': 0.27} {'loss': 0.5836, 'learning_rate': 1.944497552436822e-05, 'epoch': 0.27} {'loss': 0.5249, 'learning_rate': 1.944486514417851e-05, 'epoch': 0.27} {'loss': 0.4915, 'learning_rate': 1.944475475332734e-05, 'epoch': 0.27} {'loss': 0.6778, 'learning_rate': 1.9444644351814837e-05, 'epoch': 0.27} {'loss': 0.4714, 'learning_rate': 1.9444533939641133e-05, 'epoch': 0.27} {'loss': 0.5327, 'learning_rate': 1.944442351680634e-05, 'epoch': 0.27} {'loss': 0.7191, 'learning_rate': 1.944431308331059e-05, 'epoch': 0.27} {'loss': 0.4523, 'learning_rate': 1.9444202639154008e-05, 'epoch': 0.27} {'loss': 0.5904, 'learning_rate': 1.9444092184336715e-05, 'epoch': 0.27} {'loss': 0.5656, 'learning_rate': 1.944398171885884e-05, 'epoch': 0.27} {'loss': 0.4097, 'learning_rate': 1.9443871242720506e-05, 'epoch': 0.27} {'loss': 0.5855, 'learning_rate': 1.9443760755921834e-05, 'epoch': 0.27} {'loss': 0.4983, 'learning_rate': 1.9443650258462954e-05, 'epoch': 0.27} {'loss': 0.6566, 'learning_rate': 1.944353975034399e-05, 'epoch': 0.27} {'loss': 0.5906, 'learning_rate': 1.9443429231565062e-05, 'epoch': 0.27} {'loss': 0.6276, 'learning_rate': 1.94433187021263e-05, 'epoch': 0.27} {'loss': 0.6056, 'learning_rate': 1.9443208162027827e-05, 'epoch': 0.27} {'loss': 0.6365, 'learning_rate': 1.9443097611269768e-05, 'epoch': 0.27} {'loss': 0.5945, 'learning_rate': 1.9442987049852244e-05, 'epoch': 0.27} {'loss': 0.4111, 'learning_rate': 1.944287647777539e-05, 'epoch': 0.27} {'loss': 0.6241, 'learning_rate': 1.944276589503932e-05, 'epoch': 0.27} {'loss': 0.5733, 'learning_rate': 1.9442655301644163e-05, 'epoch': 0.27} {'loss': 0.5787, 'learning_rate': 1.9442544697590043e-05, 'epoch': 0.27} {'loss': 0.5886, 'learning_rate': 1.9442434082877087e-05, 'epoch': 0.27} {'loss': 0.732, 'learning_rate': 1.9442323457505417e-05, 'epoch': 0.27} {'loss': 0.5518, 'learning_rate': 1.944221282147516e-05, 'epoch': 0.27} {'loss': 0.5437, 'learning_rate': 1.944210217478644e-05, 'epoch': 0.27} {'loss': 0.5374, 'learning_rate': 1.9441991517439383e-05, 'epoch': 0.27} {'loss': 0.5497, 'learning_rate': 1.9441880849434112e-05, 'epoch': 0.27} {'loss': 0.5105, 'learning_rate': 1.944177017077076e-05, 'epoch': 0.27} {'loss': 0.6087, 'learning_rate': 1.9441659481449436e-05, 'epoch': 0.27} {'loss': 0.4876, 'learning_rate': 1.9441548781470274e-05, 'epoch': 0.27} {'loss': 0.5275, 'learning_rate': 1.9441438070833402e-05, 'epoch': 0.27} {'loss': 0.4302, 'learning_rate': 1.944132734953894e-05, 'epoch': 0.27} {'loss': 0.5356, 'learning_rate': 1.944121661758702e-05, 'epoch': 0.27} {'loss': 0.5038, 'learning_rate': 1.9441105874977756e-05, 'epoch': 0.27} {'loss': 0.5301, 'learning_rate': 1.9440995121711278e-05, 'epoch': 0.27} {'loss': 0.7197, 'learning_rate': 1.9440884357787718e-05, 'epoch': 0.27} {'loss': 0.5193, 'learning_rate': 1.944077358320719e-05, 'epoch': 0.27} {'loss': 0.5998, 'learning_rate': 1.9440662797969825e-05, 'epoch': 0.27} {'loss': 0.4431, 'learning_rate': 1.944055200207575e-05, 'epoch': 0.27} {'loss': 0.5913, 'learning_rate': 1.944044119552508e-05, 'epoch': 0.27} {'loss': 0.5634, 'learning_rate': 1.944033037831795e-05, 'epoch': 0.27} {'loss': 0.5823, 'learning_rate': 1.9440219550454484e-05, 'epoch': 0.27} {'loss': 0.5952, 'learning_rate': 1.9440108711934806e-05, 'epoch': 0.27} {'loss': 0.7024, 'learning_rate': 1.9439997862759038e-05, 'epoch': 0.27} {'loss': 0.6869, 'learning_rate': 1.9439887002927306e-05, 'epoch': 0.27} {'loss': 0.6743, 'learning_rate': 1.943977613243974e-05, 'epoch': 0.27} {'loss': 0.5663, 'learning_rate': 1.943966525129646e-05, 'epoch': 0.27} {'loss': 0.568, 'learning_rate': 1.9439554359497595e-05, 'epoch': 0.27} {'loss': 0.5204, 'learning_rate': 1.9439443457043267e-05, 'epoch': 0.27} {'loss': 0.6543, 'learning_rate': 1.94393325439336e-05, 'epoch': 0.27} {'loss': 0.5978, 'learning_rate': 1.9439221620168728e-05, 'epoch': 0.27} {'loss': 0.6935, 'learning_rate': 1.9439110685748766e-05, 'epoch': 0.27} {'loss': 0.6271, 'learning_rate': 1.943899974067384e-05, 'epoch': 0.27} {'loss': 0.5743, 'learning_rate': 1.9438888784944082e-05, 'epoch': 0.27} {'loss': 0.6056, 'learning_rate': 1.943877781855961e-05, 'epoch': 0.27} {'loss': 0.4303, 'learning_rate': 1.9438666841520556e-05, 'epoch': 0.27} {'loss': 0.779, 'learning_rate': 1.943855585382704e-05, 'epoch': 0.27} {'loss': 0.6564, 'learning_rate': 1.9438444855479194e-05, 'epoch': 0.27} {'loss': 0.566, 'learning_rate': 1.943833384647713e-05, 'epoch': 0.27} {'loss': 0.6178, 'learning_rate': 1.9438222826820986e-05, 'epoch': 0.27} {'loss': 0.7011, 'learning_rate': 1.9438111796510884e-05, 'epoch': 0.27} {'loss': 0.6698, 'learning_rate': 1.943800075554695e-05, 'epoch': 0.27} {'loss': 0.5219, 'learning_rate': 1.9437889703929308e-05, 'epoch': 0.27} {'loss': 0.438, 'learning_rate': 1.9437778641658078e-05, 'epoch': 0.27} {'loss': 0.4317, 'learning_rate': 1.9437667568733393e-05, 'epoch': 0.27} {'loss': 0.6772, 'learning_rate': 1.9437556485155378e-05, 'epoch': 0.27} {'loss': 0.5823, 'learning_rate': 1.9437445390924158e-05, 'epoch': 0.27} {'loss': 0.5862, 'learning_rate': 1.9437334286039852e-05, 'epoch': 0.27} {'loss': 0.4955, 'learning_rate': 1.9437223170502593e-05, 'epoch': 0.27} {'loss': 0.5472, 'learning_rate': 1.94371120443125e-05, 'epoch': 0.27} {'loss': 0.7647, 'learning_rate': 1.9437000907469707e-05, 'epoch': 0.27} {'loss': 0.4853, 'learning_rate': 1.9436889759974332e-05, 'epoch': 0.27} {'loss': 0.6634, 'learning_rate': 1.9436778601826504e-05, 'epoch': 0.27} {'loss': 0.5587, 'learning_rate': 1.9436667433026346e-05, 'epoch': 0.27} {'loss': 0.5, 'learning_rate': 1.9436556253573986e-05, 'epoch': 0.27} {'loss': 0.564, 'learning_rate': 1.9436445063469546e-05, 'epoch': 0.27} {'loss': 0.5948, 'learning_rate': 1.9436333862713156e-05, 'epoch': 0.27} {'loss': 0.5621, 'learning_rate': 1.943622265130494e-05, 'epoch': 0.27} {'loss': 0.5344, 'learning_rate': 1.9436111429245024e-05, 'epoch': 0.27} {'loss': 0.5647, 'learning_rate': 1.9436000196533533e-05, 'epoch': 0.27} {'loss': 0.4908, 'learning_rate': 1.943588895317059e-05, 'epoch': 0.27} {'loss': 0.666, 'learning_rate': 1.943577769915632e-05, 'epoch': 0.27} {'loss': 0.5935, 'learning_rate': 1.9435666434490857e-05, 'epoch': 0.27} {'loss': 0.5208, 'learning_rate': 1.9435555159174314e-05, 'epoch': 0.27} {'loss': 0.6755, 'learning_rate': 1.943544387320683e-05, 'epoch': 0.27} {'loss': 0.7199, 'learning_rate': 1.943533257658852e-05, 'epoch': 0.27} {'loss': 0.6083, 'learning_rate': 1.9435221269319517e-05, 'epoch': 0.27} {'loss': 0.524, 'learning_rate': 1.9435109951399943e-05, 'epoch': 0.27} {'loss': 0.553, 'learning_rate': 1.943499862282992e-05, 'epoch': 0.27} {'loss': 0.6368, 'learning_rate': 1.9434887283609582e-05, 'epoch': 0.27} {'loss': 0.6479, 'learning_rate': 1.943477593373905e-05, 'epoch': 0.27} {'loss': 0.6952, 'learning_rate': 1.9434664573218448e-05, 'epoch': 0.27} {'loss': 0.5607, 'learning_rate': 1.9434553202047905e-05, 'epoch': 0.27} {'loss': 0.4469, 'learning_rate': 1.9434441820227546e-05, 'epoch': 0.27} {'loss': 0.6749, 'learning_rate': 1.9434330427757496e-05, 'epoch': 0.27} {'loss': 0.7061, 'learning_rate': 1.943421902463788e-05, 'epoch': 0.27} {'loss': 0.5428, 'learning_rate': 1.9434107610868825e-05, 'epoch': 0.27} {'loss': 0.3933, 'learning_rate': 1.9433996186450454e-05, 'epoch': 0.27} {'loss': 0.538, 'learning_rate': 1.94338847513829e-05, 'epoch': 0.27} {'loss': 0.4651, 'learning_rate': 1.9433773305666282e-05, 'epoch': 0.27} {'loss': 0.4896, 'learning_rate': 1.9433661849300725e-05, 'epoch': 0.27} {'loss': 0.5057, 'learning_rate': 1.9433550382286365e-05, 'epoch': 0.27} {'loss': 0.5639, 'learning_rate': 1.943343890462331e-05, 'epoch': 0.27} {'loss': 0.4964, 'learning_rate': 1.9433327416311706e-05, 'epoch': 0.27} {'loss': 0.679, 'learning_rate': 1.9433215917351664e-05, 'epoch': 0.27} {'loss': 0.5353, 'learning_rate': 1.9433104407743317e-05, 'epoch': 0.27} {'loss': 0.5278, 'learning_rate': 1.943299288748679e-05, 'epoch': 0.27} {'loss': 0.7029, 'learning_rate': 1.9432881356582205e-05, 'epoch': 0.27} {'loss': 0.5829, 'learning_rate': 1.9432769815029694e-05, 'epoch': 0.27} {'loss': 0.5473, 'learning_rate': 1.9432658262829376e-05, 'epoch': 0.27} {'loss': 0.6267, 'learning_rate': 1.943254669998138e-05, 'epoch': 0.27} {'loss': 0.6182, 'learning_rate': 1.9432435126485837e-05, 'epoch': 0.27} {'loss': 0.7436, 'learning_rate': 1.9432323542342867e-05, 'epoch': 0.27} {'loss': 0.6818, 'learning_rate': 1.9432211947552594e-05, 'epoch': 0.27} {'loss': 0.5523, 'learning_rate': 1.9432100342115147e-05, 'epoch': 0.27} {'loss': 0.5144, 'learning_rate': 1.943198872603066e-05, 'epoch': 0.27} {'loss': 0.6218, 'learning_rate': 1.9431877099299244e-05, 'epoch': 0.27} {'loss': 0.5379, 'learning_rate': 1.9431765461921036e-05, 'epoch': 0.27} {'loss': 0.6417, 'learning_rate': 1.9431653813896155e-05, 'epoch': 0.27} {'loss': 0.7103, 'learning_rate': 1.943154215522473e-05, 'epoch': 0.27} {'loss': 0.6829, 'learning_rate': 1.943143048590689e-05, 'epoch': 0.27} {'loss': 0.5667, 'learning_rate': 1.943131880594276e-05, 'epoch': 0.27} {'loss': 0.5569, 'learning_rate': 1.943120711533246e-05, 'epoch': 0.27} {'loss': 0.4687, 'learning_rate': 1.9431095414076123e-05, 'epoch': 0.27} {'loss': 0.5343, 'learning_rate': 1.9430983702173875e-05, 'epoch': 0.27} {'loss': 0.5503, 'learning_rate': 1.9430871979625836e-05, 'epoch': 0.27} {'loss': 0.4543, 'learning_rate': 1.9430760246432138e-05, 'epoch': 0.27} {'loss': 0.6949, 'learning_rate': 1.9430648502592903e-05, 'epoch': 0.27} {'loss': 0.5761, 'learning_rate': 1.9430536748108266e-05, 'epoch': 0.27} {'loss': 0.5491, 'learning_rate': 1.943042498297834e-05, 'epoch': 0.27} {'loss': 0.5909, 'learning_rate': 1.9430313207203254e-05, 'epoch': 0.27} {'loss': 0.4559, 'learning_rate': 1.9430201420783144e-05, 'epoch': 0.27} {'loss': 0.5257, 'learning_rate': 1.943008962371813e-05, 'epoch': 0.27} {'loss': 0.5509, 'learning_rate': 1.9429977816008335e-05, 'epoch': 0.27} {'loss': 0.6333, 'learning_rate': 1.942986599765389e-05, 'epoch': 0.27} {'loss': 0.4906, 'learning_rate': 1.9429754168654918e-05, 'epoch': 0.27} {'loss': 0.5829, 'learning_rate': 1.9429642329011543e-05, 'epoch': 0.27} {'loss': 0.5161, 'learning_rate': 1.9429530478723902e-05, 'epoch': 0.27} {'loss': 0.5116, 'learning_rate': 1.942941861779211e-05, 'epoch': 0.27} {'loss': 0.8179, 'learning_rate': 1.94293067462163e-05, 'epoch': 0.27} {'loss': 0.6135, 'learning_rate': 1.9429194863996595e-05, 'epoch': 0.27} {'loss': 0.6687, 'learning_rate': 1.942908297113312e-05, 'epoch': 0.27} {'loss': 0.6056, 'learning_rate': 1.9428971067626006e-05, 'epoch': 0.27} {'loss': 0.6548, 'learning_rate': 1.9428859153475378e-05, 'epoch': 0.27} {'loss': 0.4792, 'learning_rate': 1.9428747228681356e-05, 'epoch': 0.27} {'loss': 0.5175, 'learning_rate': 1.9428635293244075e-05, 'epoch': 0.27} {'loss': 0.5822, 'learning_rate': 1.9428523347163658e-05, 'epoch': 0.27} {'loss': 0.5548, 'learning_rate': 1.942841139044023e-05, 'epoch': 0.27} {'loss': 0.4674, 'learning_rate': 1.9428299423073918e-05, 'epoch': 0.27} {'loss': 0.5543, 'learning_rate': 1.942818744506485e-05, 'epoch': 0.27} {'loss': 0.7059, 'learning_rate': 1.942807545641315e-05, 'epoch': 0.27} {'loss': 0.4861, 'learning_rate': 1.9427963457118945e-05, 'epoch': 0.27} {'loss': 0.4719, 'learning_rate': 1.9427851447182364e-05, 'epoch': 0.27} {'loss': 0.4933, 'learning_rate': 1.942773942660353e-05, 'epoch': 0.27} {'loss': 0.7479, 'learning_rate': 1.942762739538257e-05, 'epoch': 0.27} {'loss': 0.6009, 'learning_rate': 1.9427515353519613e-05, 'epoch': 0.27} {'loss': 0.6203, 'learning_rate': 1.9427403301014786e-05, 'epoch': 0.27} {'loss': 0.6476, 'learning_rate': 1.942729123786821e-05, 'epoch': 0.27} {'loss': 0.6617, 'learning_rate': 1.9427179164080018e-05, 'epoch': 0.27} {'loss': 0.5112, 'learning_rate': 1.942706707965033e-05, 'epoch': 0.27} {'loss': 0.6596, 'learning_rate': 1.9426954984579276e-05, 'epoch': 0.27} {'loss': 0.6853, 'learning_rate': 1.9426842878866986e-05, 'epoch': 0.27} {'loss': 0.5557, 'learning_rate': 1.942673076251358e-05, 'epoch': 0.27} {'loss': 0.6079, 'learning_rate': 1.942661863551919e-05, 'epoch': 0.27} {'loss': 0.5551, 'learning_rate': 1.9426506497883934e-05, 'epoch': 0.27} {'loss': 0.5592, 'learning_rate': 1.9426394349607948e-05, 'epoch': 0.27} {'loss': 0.5657, 'learning_rate': 1.942628219069136e-05, 'epoch': 0.27} {'loss': 0.6702, 'learning_rate': 1.9426170021134287e-05, 'epoch': 0.27} {'loss': 0.6663, 'learning_rate': 1.942605784093686e-05, 'epoch': 0.27} {'loss': 0.4868, 'learning_rate': 1.942594565009921e-05, 'epoch': 0.27} {'loss': 0.6455, 'learning_rate': 1.9425833448621456e-05, 'epoch': 0.27} {'loss': 0.5207, 'learning_rate': 1.9425721236503732e-05, 'epoch': 0.27} {'loss': 0.7126, 'learning_rate': 1.942560901374616e-05, 'epoch': 0.27} {'loss': 0.4853, 'learning_rate': 1.9425496780348867e-05, 'epoch': 0.27} {'loss': 0.5496, 'learning_rate': 1.942538453631198e-05, 'epoch': 0.27} {'loss': 0.6176, 'learning_rate': 1.9425272281635624e-05, 'epoch': 0.27} {'loss': 0.4455, 'learning_rate': 1.9425160016319932e-05, 'epoch': 0.27} {'loss': 0.6093, 'learning_rate': 1.9425047740365027e-05, 'epoch': 0.27} {'loss': 0.6906, 'learning_rate': 1.9424935453771034e-05, 'epoch': 0.27} {'loss': 0.4986, 'learning_rate': 1.942482315653808e-05, 'epoch': 0.27} {'loss': 0.5646, 'learning_rate': 1.9424710848666292e-05, 'epoch': 0.27} {'loss': 0.6323, 'learning_rate': 1.94245985301558e-05, 'epoch': 0.27} {'loss': 0.498, 'learning_rate': 1.9424486201006727e-05, 'epoch': 0.27} {'loss': 0.5775, 'learning_rate': 1.9424373861219203e-05, 'epoch': 0.27} {'loss': 0.8032, 'learning_rate': 1.9424261510793352e-05, 'epoch': 0.27} {'loss': 0.6718, 'learning_rate': 1.9424149149729303e-05, 'epoch': 0.27} {'loss': 0.6149, 'learning_rate': 1.9424036778027176e-05, 'epoch': 0.27} {'loss': 0.4763, 'learning_rate': 1.942392439568711e-05, 'epoch': 0.27} {'loss': 0.6087, 'learning_rate': 1.9423812002709223e-05, 'epoch': 0.27} {'loss': 0.6454, 'learning_rate': 1.9423699599093643e-05, 'epoch': 0.27} {'loss': 0.6072, 'learning_rate': 1.94235871848405e-05, 'epoch': 0.27} {'loss': 0.6298, 'learning_rate': 1.942347475994992e-05, 'epoch': 0.27} {'loss': 0.6398, 'learning_rate': 1.9423362324422032e-05, 'epoch': 0.27} {'loss': 0.6266, 'learning_rate': 1.9423249878256955e-05, 'epoch': 0.27} {'loss': 0.5526, 'learning_rate': 1.9423137421454817e-05, 'epoch': 0.27} {'loss': 0.6121, 'learning_rate': 1.9423024954015756e-05, 'epoch': 0.27} {'loss': 0.5579, 'learning_rate': 1.9422912475939888e-05, 'epoch': 0.27} {'loss': 0.5306, 'learning_rate': 1.9422799987227346e-05, 'epoch': 0.27} {'loss': 0.6303, 'learning_rate': 1.9422687487878252e-05, 'epoch': 0.27} {'loss': 0.5079, 'learning_rate': 1.9422574977892736e-05, 'epoch': 0.27} {'loss': 0.5225, 'learning_rate': 1.9422462457270925e-05, 'epoch': 0.27} {'loss': 0.5344, 'learning_rate': 1.9422349926012948e-05, 'epoch': 0.27} {'loss': 0.456, 'learning_rate': 1.9422237384118928e-05, 'epoch': 0.27} {'loss': 0.6024, 'learning_rate': 1.9422124831588993e-05, 'epoch': 0.27} {'loss': 0.5707, 'learning_rate': 1.942201226842327e-05, 'epoch': 0.27} {'loss': 0.4207, 'learning_rate': 1.942189969462189e-05, 'epoch': 0.27} {'loss': 0.5753, 'learning_rate': 1.9421787110184972e-05, 'epoch': 0.27} {'loss': 0.5467, 'learning_rate': 1.9421674515112654e-05, 'epoch': 0.27} {'loss': 0.576, 'learning_rate': 1.9421561909405052e-05, 'epoch': 0.27} {'loss': 0.6559, 'learning_rate': 1.94214492930623e-05, 'epoch': 0.27} {'loss': 0.4348, 'learning_rate': 1.9421336666084526e-05, 'epoch': 0.27} {'loss': 0.6655, 'learning_rate': 1.942122402847185e-05, 'epoch': 0.27} {'loss': 0.5662, 'learning_rate': 1.9421111380224406e-05, 'epoch': 0.27} {'loss': 0.5695, 'learning_rate': 1.9420998721342318e-05, 'epoch': 0.27} {'loss': 0.7122, 'learning_rate': 1.9420886051825715e-05, 'epoch': 0.27} {'loss': 0.5162, 'learning_rate': 1.942077337167472e-05, 'epoch': 0.27} {'loss': 0.7218, 'learning_rate': 1.9420660680889467e-05, 'epoch': 0.27} {'loss': 0.5146, 'learning_rate': 1.942054797947008e-05, 'epoch': 0.27} {'loss': 0.526, 'learning_rate': 1.9420435267416684e-05, 'epoch': 0.27} {'loss': 0.5066, 'learning_rate': 1.9420322544729407e-05, 'epoch': 0.27} {'loss': 0.61, 'learning_rate': 1.942020981140838e-05, 'epoch': 0.27} {'loss': 0.5829, 'learning_rate': 1.9420097067453725e-05, 'epoch': 0.27} {'loss': 0.5529, 'learning_rate': 1.941998431286557e-05, 'epoch': 0.27} {'loss': 0.4731, 'learning_rate': 1.9419871547644047e-05, 'epoch': 0.27} {'loss': 0.6381, 'learning_rate': 1.941975877178928e-05, 'epoch': 0.27} {'loss': 0.6258, 'learning_rate': 1.94196459853014e-05, 'epoch': 0.27} {'loss': 0.6051, 'learning_rate': 1.9419533188180525e-05, 'epoch': 0.27} {'loss': 0.6339, 'learning_rate': 1.941942038042679e-05, 'epoch': 0.27} {'loss': 0.557, 'learning_rate': 1.941930756204032e-05, 'epoch': 0.27} {'loss': 0.5061, 'learning_rate': 1.9419194733021244e-05, 'epoch': 0.27} {'loss': 0.5586, 'learning_rate': 1.9419081893369688e-05, 'epoch': 0.27} {'loss': 0.4418, 'learning_rate': 1.941896904308578e-05, 'epoch': 0.27} {'loss': 0.6413, 'learning_rate': 1.941885618216965e-05, 'epoch': 0.27} {'loss': 0.6549, 'learning_rate': 1.9418743310621417e-05, 'epoch': 0.27} {'loss': 0.4584, 'learning_rate': 1.9418630428441217e-05, 'epoch': 0.27} {'loss': 0.5746, 'learning_rate': 1.9418517535629172e-05, 'epoch': 0.27} {'loss': 0.5319, 'learning_rate': 1.9418404632185413e-05, 'epoch': 0.27} {'loss': 0.5974, 'learning_rate': 1.9418291718110066e-05, 'epoch': 0.27} {'loss': 0.5575, 'learning_rate': 1.941817879340326e-05, 'epoch': 0.27} {'loss': 0.5645, 'learning_rate': 1.941806585806512e-05, 'epoch': 0.27} {'loss': 0.5483, 'learning_rate': 1.9417952912095775e-05, 'epoch': 0.27} {'loss': 0.5655, 'learning_rate': 1.941783995549535e-05, 'epoch': 0.27} {'loss': 0.7175, 'learning_rate': 1.9417726988263975e-05, 'epoch': 0.27} {'loss': 0.4775, 'learning_rate': 1.941761401040178e-05, 'epoch': 0.27} {'loss': 0.6167, 'learning_rate': 1.9417501021908888e-05, 'epoch': 0.27} {'loss': 0.7161, 'learning_rate': 1.941738802278543e-05, 'epoch': 0.27} {'loss': 0.3771, 'learning_rate': 1.941727501303153e-05, 'epoch': 0.27} {'loss': 0.5113, 'learning_rate': 1.9417161992647314e-05, 'epoch': 0.27} {'loss': 0.4851, 'learning_rate': 1.941704896163292e-05, 'epoch': 0.27} {'loss': 0.4276, 'learning_rate': 1.9416935919988464e-05, 'epoch': 0.27} {'loss': 0.522, 'learning_rate': 1.9416822867714077e-05, 'epoch': 0.27} {'loss': 0.4387, 'learning_rate': 1.941670980480989e-05, 'epoch': 0.27} {'loss': 0.3809, 'learning_rate': 1.9416596731276028e-05, 'epoch': 0.27} {'loss': 0.4334, 'learning_rate': 1.9416483647112616e-05, 'epoch': 0.27} {'loss': 0.6749, 'learning_rate': 1.9416370552319787e-05, 'epoch': 0.27} {'loss': 0.4683, 'learning_rate': 1.9416257446897668e-05, 'epoch': 0.27} {'loss': 0.5903, 'learning_rate': 1.9416144330846386e-05, 'epoch': 0.27} {'loss': 0.6062, 'learning_rate': 1.941603120416606e-05, 'epoch': 0.27} {'loss': 0.567, 'learning_rate': 1.9415918066856833e-05, 'epoch': 0.27} {'loss': 0.5202, 'learning_rate': 1.941580491891882e-05, 'epoch': 0.27} {'loss': 0.6179, 'learning_rate': 1.941569176035216e-05, 'epoch': 0.27} {'loss': 0.6432, 'learning_rate': 1.9415578591156966e-05, 'epoch': 0.27} {'loss': 0.4877, 'learning_rate': 1.941546541133338e-05, 'epoch': 0.27} {'loss': 0.5725, 'learning_rate': 1.9415352220881523e-05, 'epoch': 0.27} {'loss': 0.6489, 'learning_rate': 1.9415239019801523e-05, 'epoch': 0.27} {'loss': 0.7, 'learning_rate': 1.941512580809351e-05, 'epoch': 0.27} {'loss': 0.5667, 'learning_rate': 1.9415012585757607e-05, 'epoch': 0.27} {'loss': 0.7054, 'learning_rate': 1.941489935279395e-05, 'epoch': 0.27} {'loss': 0.5558, 'learning_rate': 1.9414786109202656e-05, 'epoch': 0.27} {'loss': 0.551, 'learning_rate': 1.941467285498386e-05, 'epoch': 0.27} {'loss': 0.5886, 'learning_rate': 1.9414559590137693e-05, 'epoch': 0.27} {'loss': 0.5786, 'learning_rate': 1.941444631466428e-05, 'epoch': 0.27} {'loss': 0.5832, 'learning_rate': 1.941433302856374e-05, 'epoch': 0.27} {'loss': 0.4634, 'learning_rate': 1.9414219731836216e-05, 'epoch': 0.27} {'loss': 0.555, 'learning_rate': 1.941410642448182e-05, 'epoch': 0.27} {'loss': 0.7166, 'learning_rate': 1.9413993106500693e-05, 'epoch': 0.27} {'loss': 0.5815, 'learning_rate': 1.9413879777892958e-05, 'epoch': 0.27} {'loss': 0.6202, 'learning_rate': 1.941376643865874e-05, 'epoch': 0.27} {'loss': 0.6746, 'learning_rate': 1.9413653088798172e-05, 'epoch': 0.27} {'loss': 0.6618, 'learning_rate': 1.941353972831138e-05, 'epoch': 0.27} {'loss': 0.5918, 'learning_rate': 1.941342635719849e-05, 'epoch': 0.27} {'loss': 0.5869, 'learning_rate': 1.9413312975459634e-05, 'epoch': 0.27} {'loss': 0.4466, 'learning_rate': 1.9413199583094936e-05, 'epoch': 0.27} {'loss': 0.6097, 'learning_rate': 1.9413086180104525e-05, 'epoch': 0.27} {'loss': 0.5506, 'learning_rate': 1.9412972766488532e-05, 'epoch': 0.27} {'loss': 0.7277, 'learning_rate': 1.941285934224708e-05, 'epoch': 0.27} {'loss': 0.6029, 'learning_rate': 1.9412745907380302e-05, 'epoch': 0.27} {'loss': 0.5187, 'learning_rate': 1.9412632461888322e-05, 'epoch': 0.27} {'loss': 0.5783, 'learning_rate': 1.9412519005771272e-05, 'epoch': 0.27} {'loss': 0.7852, 'learning_rate': 1.9412405539029278e-05, 'epoch': 0.27} {'loss': 0.6444, 'learning_rate': 1.9412292061662466e-05, 'epoch': 0.27} {'loss': 0.6401, 'learning_rate': 1.9412178573670966e-05, 'epoch': 0.27} {'loss': 0.6962, 'learning_rate': 1.9412065075054906e-05, 'epoch': 0.27} {'loss': 0.5885, 'learning_rate': 1.9411951565814416e-05, 'epoch': 0.27} {'loss': 0.6454, 'learning_rate': 1.9411838045949623e-05, 'epoch': 0.27} {'loss': 0.642, 'learning_rate': 1.941172451546065e-05, 'epoch': 0.27} {'loss': 0.5808, 'learning_rate': 1.9411610974347637e-05, 'epoch': 0.27} {'loss': 0.5589, 'learning_rate': 1.9411497422610698e-05, 'epoch': 0.27} {'loss': 0.743, 'learning_rate': 1.9411383860249973e-05, 'epoch': 0.27} {'loss': 0.5546, 'learning_rate': 1.9411270287265586e-05, 'epoch': 0.27} {'loss': 0.6427, 'learning_rate': 1.941115670365766e-05, 'epoch': 0.27} {'loss': 0.6676, 'learning_rate': 1.941104310942633e-05, 'epoch': 0.27} {'loss': 0.5335, 'learning_rate': 1.941092950457172e-05, 'epoch': 0.27} {'loss': 0.5646, 'learning_rate': 1.9410815889093962e-05, 'epoch': 0.27} {'loss': 0.5866, 'learning_rate': 1.9410702262993182e-05, 'epoch': 0.27} {'loss': 0.5306, 'learning_rate': 1.9410588626269507e-05, 'epoch': 0.28} {'loss': 0.5756, 'learning_rate': 1.9410474978923067e-05, 'epoch': 0.28} {'loss': 0.8475, 'learning_rate': 1.9410361320953997e-05, 'epoch': 0.28} {'loss': 0.5071, 'learning_rate': 1.9410247652362412e-05, 'epoch': 0.28} {'loss': 0.6169, 'learning_rate': 1.9410133973148448e-05, 'epoch': 0.28} {'loss': 0.5662, 'learning_rate': 1.9410020283312233e-05, 'epoch': 0.28} {'loss': 0.4605, 'learning_rate': 1.9409906582853893e-05, 'epoch': 0.28} {'loss': 0.6238, 'learning_rate': 1.940979287177356e-05, 'epoch': 0.28} {'loss': 0.69, 'learning_rate': 1.9409679150071356e-05, 'epoch': 0.28} {'loss': 0.6549, 'learning_rate': 1.940956541774742e-05, 'epoch': 0.28} {'loss': 0.6254, 'learning_rate': 1.940945167480187e-05, 'epoch': 0.28} {'loss': 0.5937, 'learning_rate': 1.9409337921234838e-05, 'epoch': 0.28} {'loss': 0.6798, 'learning_rate': 1.9409224157046454e-05, 'epoch': 0.28} {'loss': 0.4516, 'learning_rate': 1.9409110382236846e-05, 'epoch': 0.28} {'loss': 0.7325, 'learning_rate': 1.940899659680614e-05, 'epoch': 0.28} {'loss': 0.4952, 'learning_rate': 1.9408882800754466e-05, 'epoch': 0.28} {'loss': 0.6502, 'learning_rate': 1.940876899408195e-05, 'epoch': 0.28} {'loss': 0.5188, 'learning_rate': 1.940865517678873e-05, 'epoch': 0.28} {'loss': 0.6645, 'learning_rate': 1.9408541348874922e-05, 'epoch': 0.28} {'loss': 0.5941, 'learning_rate': 1.940842751034066e-05, 'epoch': 0.28} {'loss': 0.7395, 'learning_rate': 1.9408313661186072e-05, 'epoch': 0.28} {'loss': 0.6889, 'learning_rate': 1.940819980141129e-05, 'epoch': 0.28} {'loss': 0.5535, 'learning_rate': 1.9408085931016437e-05, 'epoch': 0.28} {'loss': 0.5175, 'learning_rate': 1.9407972050001647e-05, 'epoch': 0.28} {'loss': 0.462, 'learning_rate': 1.9407858158367042e-05, 'epoch': 0.28} {'loss': 0.6211, 'learning_rate': 1.9407744256112755e-05, 'epoch': 0.28} {'loss': 0.5143, 'learning_rate': 1.940763034323892e-05, 'epoch': 0.28} {'loss': 0.6105, 'learning_rate': 1.940751641974565e-05, 'epoch': 0.28} {'loss': 0.6352, 'learning_rate': 1.9407402485633088e-05, 'epoch': 0.28} {'loss': 0.6124, 'learning_rate': 1.9407288540901356e-05, 'epoch': 0.28} {'loss': 0.5195, 'learning_rate': 1.9407174585550585e-05, 'epoch': 0.28} {'loss': 0.7274, 'learning_rate': 1.94070606195809e-05, 'epoch': 0.28} {'loss': 0.7527, 'learning_rate': 1.9406946642992436e-05, 'epoch': 0.28} {'loss': 0.4624, 'learning_rate': 1.9406832655785318e-05, 'epoch': 0.28} {'loss': 0.5105, 'learning_rate': 1.940671865795967e-05, 'epoch': 0.28} {'loss': 0.507, 'learning_rate': 1.940660464951563e-05, 'epoch': 0.28} {'loss': 0.5083, 'learning_rate': 1.940649063045332e-05, 'epoch': 0.28} {'loss': 0.5918, 'learning_rate': 1.9406376600772872e-05, 'epoch': 0.28} {'loss': 0.4264, 'learning_rate': 1.940626256047441e-05, 'epoch': 0.28} {'loss': 0.4916, 'learning_rate': 1.9406148509558075e-05, 'epoch': 0.28} {'loss': 0.6749, 'learning_rate': 1.940603444802398e-05, 'epoch': 0.28} {'loss': 0.6661, 'learning_rate': 1.940592037587226e-05, 'epoch': 0.28} {'loss': 0.7323, 'learning_rate': 1.9405806293103045e-05, 'epoch': 0.28} {'loss': 0.5379, 'learning_rate': 1.940569219971647e-05, 'epoch': 0.28} {'loss': 0.5997, 'learning_rate': 1.940557809571265e-05, 'epoch': 0.28} {'loss': 0.4251, 'learning_rate': 1.9405463981091725e-05, 'epoch': 0.28} {'loss': 0.4597, 'learning_rate': 1.9405349855853816e-05, 'epoch': 0.28} {'loss': 0.6172, 'learning_rate': 1.9405235719999057e-05, 'epoch': 0.28} {'loss': 0.612, 'learning_rate': 1.9405121573527573e-05, 'epoch': 0.28} {'loss': 0.5006, 'learning_rate': 1.9405007416439497e-05, 'epoch': 0.28} {'loss': 0.3879, 'learning_rate': 1.9404893248734957e-05, 'epoch': 0.28} {'loss': 0.5629, 'learning_rate': 1.9404779070414083e-05, 'epoch': 0.28} {'loss': 0.6276, 'learning_rate': 1.9404664881477e-05, 'epoch': 0.28} {'loss': 0.6649, 'learning_rate': 1.9404550681923834e-05, 'epoch': 0.28} {'loss': 0.6657, 'learning_rate': 1.9404436471754727e-05, 'epoch': 0.28} {'loss': 0.4649, 'learning_rate': 1.9404322250969794e-05, 'epoch': 0.28} {'loss': 0.4113, 'learning_rate': 1.940420801956917e-05, 'epoch': 0.28} {'loss': 0.5681, 'learning_rate': 1.9404093777552986e-05, 'epoch': 0.28} {'loss': 0.3793, 'learning_rate': 1.9403979524921366e-05, 'epoch': 0.28} {'loss': 0.6195, 'learning_rate': 1.940386526167444e-05, 'epoch': 0.28} {'loss': 0.5291, 'learning_rate': 1.9403750987812343e-05, 'epoch': 0.28} {'loss': 0.5341, 'learning_rate': 1.9403636703335197e-05, 'epoch': 0.28} {'loss': 0.6507, 'learning_rate': 1.9403522408243133e-05, 'epoch': 0.28} {'loss': 0.6282, 'learning_rate': 1.940340810253628e-05, 'epoch': 0.28} {'loss': 0.6385, 'learning_rate': 1.9403293786214767e-05, 'epoch': 0.28} {'loss': 0.5671, 'learning_rate': 1.9403179459278726e-05, 'epoch': 0.28} {'loss': 0.6337, 'learning_rate': 1.940306512172828e-05, 'epoch': 0.28} {'loss': 0.5615, 'learning_rate': 1.9402950773563566e-05, 'epoch': 0.28} {'loss': 0.4402, 'learning_rate': 1.9402836414784704e-05, 'epoch': 0.28} {'loss': 0.5727, 'learning_rate': 1.9402722045391828e-05, 'epoch': 0.28} {'loss': 0.5198, 'learning_rate': 1.940260766538507e-05, 'epoch': 0.28} {'loss': 0.5377, 'learning_rate': 1.9402493274764552e-05, 'epoch': 0.28} {'loss': 0.5899, 'learning_rate': 1.9402378873530414e-05, 'epoch': 0.28} {'loss': 0.4697, 'learning_rate': 1.9402264461682772e-05, 'epoch': 0.28} {'loss': 0.5509, 'learning_rate': 1.9402150039221764e-05, 'epoch': 0.28} {'loss': 0.4739, 'learning_rate': 1.9402035606147515e-05, 'epoch': 0.28} {'loss': 0.5719, 'learning_rate': 1.9401921162460152e-05, 'epoch': 0.28} {'loss': 0.6737, 'learning_rate': 1.9401806708159813e-05, 'epoch': 0.28} {'loss': 0.7957, 'learning_rate': 1.940169224324662e-05, 'epoch': 0.28} {'loss': 0.6031, 'learning_rate': 1.940157776772071e-05, 'epoch': 0.28} {'loss': 0.5539, 'learning_rate': 1.94014632815822e-05, 'epoch': 0.28} {'loss': 0.5717, 'learning_rate': 1.940134878483123e-05, 'epoch': 0.28} {'loss': 0.7052, 'learning_rate': 1.9401234277467922e-05, 'epoch': 0.28} {'loss': 0.5937, 'learning_rate': 1.9401119759492405e-05, 'epoch': 0.28} {'loss': 0.6125, 'learning_rate': 1.940100523090482e-05, 'epoch': 0.28} {'loss': 0.7307, 'learning_rate': 1.940089069170528e-05, 'epoch': 0.28} {'loss': 0.5113, 'learning_rate': 1.9400776141893926e-05, 'epoch': 0.28} {'loss': 0.6654, 'learning_rate': 1.940066158147088e-05, 'epoch': 0.28} {'loss': 0.7097, 'learning_rate': 1.940054701043628e-05, 'epoch': 0.28} {'loss': 0.6014, 'learning_rate': 1.940043242879025e-05, 'epoch': 0.28} {'loss': 0.671, 'learning_rate': 1.9400317836532914e-05, 'epoch': 0.28} {'loss': 0.6245, 'learning_rate': 1.940020323366441e-05, 'epoch': 0.28} {'loss': 0.3084, 'learning_rate': 1.9400088620184864e-05, 'epoch': 0.28} {'loss': 0.5253, 'learning_rate': 1.9399973996094402e-05, 'epoch': 0.28} {'loss': 0.6085, 'learning_rate': 1.939985936139316e-05, 'epoch': 0.28} {'loss': 0.5177, 'learning_rate': 1.9399744716081264e-05, 'epoch': 0.28} {'loss': 0.5211, 'learning_rate': 1.9399630060158847e-05, 'epoch': 0.28} {'loss': 0.6012, 'learning_rate': 1.939951539362603e-05, 'epoch': 0.28} {'loss': 0.574, 'learning_rate': 1.9399400716482947e-05, 'epoch': 0.28} {'loss': 0.5843, 'learning_rate': 1.9399286028729732e-05, 'epoch': 0.28} {'loss': 0.4897, 'learning_rate': 1.9399171330366508e-05, 'epoch': 0.28} {'loss': 0.6481, 'learning_rate': 1.9399056621393407e-05, 'epoch': 0.28} {'loss': 0.5841, 'learning_rate': 1.9398941901810558e-05, 'epoch': 0.28} {'loss': 0.5545, 'learning_rate': 1.9398827171618093e-05, 'epoch': 0.28} {'loss': 0.637, 'learning_rate': 1.9398712430816136e-05, 'epoch': 0.28} {'loss': 0.4657, 'learning_rate': 1.9398597679404825e-05, 'epoch': 0.28} {'loss': 0.6339, 'learning_rate': 1.9398482917384283e-05, 'epoch': 0.28} {'loss': 0.5995, 'learning_rate': 1.9398368144754637e-05, 'epoch': 0.28} {'loss': 0.5089, 'learning_rate': 1.9398253361516025e-05, 'epoch': 0.28} {'loss': 0.7026, 'learning_rate': 1.939813856766857e-05, 'epoch': 0.28} {'loss': 0.5916, 'learning_rate': 1.9398023763212402e-05, 'epoch': 0.28} {'loss': 0.5678, 'learning_rate': 1.9397908948147656e-05, 'epoch': 0.28} {'loss': 0.4861, 'learning_rate': 1.9397794122474455e-05, 'epoch': 0.28} {'loss': 0.6459, 'learning_rate': 1.9397679286192936e-05, 'epoch': 0.28} {'loss': 0.5247, 'learning_rate': 1.9397564439303216e-05, 'epoch': 0.28} {'loss': 0.6081, 'learning_rate': 1.939744958180544e-05, 'epoch': 0.28} {'loss': 0.5656, 'learning_rate': 1.9397334713699727e-05, 'epoch': 0.28} {'loss': 0.5435, 'learning_rate': 1.939721983498621e-05, 'epoch': 0.28} {'loss': 0.5157, 'learning_rate': 1.939710494566502e-05, 'epoch': 0.28} {'loss': 0.6442, 'learning_rate': 1.9396990045736286e-05, 'epoch': 0.28} {'loss': 0.5177, 'learning_rate': 1.9396875135200135e-05, 'epoch': 0.28} {'loss': 0.5754, 'learning_rate': 1.9396760214056702e-05, 'epoch': 0.28} {'loss': 0.618, 'learning_rate': 1.939664528230611e-05, 'epoch': 0.28} {'loss': 0.6127, 'learning_rate': 1.9396530339948496e-05, 'epoch': 0.28} {'loss': 0.639, 'learning_rate': 1.9396415386983984e-05, 'epoch': 0.28} {'loss': 0.4323, 'learning_rate': 1.9396300423412705e-05, 'epoch': 0.28} {'loss': 0.5687, 'learning_rate': 1.939618544923479e-05, 'epoch': 0.28} {'loss': 0.5568, 'learning_rate': 1.939607046445037e-05, 'epoch': 0.28} {'loss': 0.631, 'learning_rate': 1.9395955469059574e-05, 'epoch': 0.28} {'loss': 0.6584, 'learning_rate': 1.939584046306253e-05, 'epoch': 0.28} {'loss': 0.4752, 'learning_rate': 1.9395725446459367e-05, 'epoch': 0.28} {'loss': 0.5687, 'learning_rate': 1.9395610419250218e-05, 'epoch': 0.28} {'loss': 0.5595, 'learning_rate': 1.939549538143521e-05, 'epoch': 0.28} {'loss': 0.5233, 'learning_rate': 1.939538033301448e-05, 'epoch': 0.28} {'loss': 0.6604, 'learning_rate': 1.9395265273988143e-05, 'epoch': 0.28} {'loss': 0.5374, 'learning_rate': 1.9395150204356345e-05, 'epoch': 0.28} {'loss': 0.5727, 'learning_rate': 1.9395035124119206e-05, 'epoch': 0.28} {'loss': 0.4768, 'learning_rate': 1.939492003327686e-05, 'epoch': 0.28} {'loss': 0.7436, 'learning_rate': 1.9394804931829436e-05, 'epoch': 0.28} {'loss': 0.5195, 'learning_rate': 1.9394689819777063e-05, 'epoch': 0.28} {'loss': 0.6408, 'learning_rate': 1.9394574697119874e-05, 'epoch': 0.28} {'loss': 0.6598, 'learning_rate': 1.939445956385799e-05, 'epoch': 0.28} {'loss': 0.6309, 'learning_rate': 1.9394344419991555e-05, 'epoch': 0.28} {'loss': 0.644, 'learning_rate': 1.939422926552069e-05, 'epoch': 0.28} {'loss': 0.5538, 'learning_rate': 1.9394114100445524e-05, 'epoch': 0.28} {'loss': 0.6771, 'learning_rate': 1.939399892476619e-05, 'epoch': 0.28} {'loss': 0.4526, 'learning_rate': 1.939388373848282e-05, 'epoch': 0.28} {'loss': 0.4611, 'learning_rate': 1.9393768541595543e-05, 'epoch': 0.28} {'loss': 0.4904, 'learning_rate': 1.9393653334104484e-05, 'epoch': 0.28} {'loss': 0.6594, 'learning_rate': 1.9393538116009772e-05, 'epoch': 0.28} {'loss': 0.4488, 'learning_rate': 1.939342288731155e-05, 'epoch': 0.28} {'loss': 0.7806, 'learning_rate': 1.9393307648009937e-05, 'epoch': 0.28} {'loss': 0.5012, 'learning_rate': 1.9393192398105066e-05, 'epoch': 0.28} {'loss': 0.6264, 'learning_rate': 1.9393077137597066e-05, 'epoch': 0.28} {'loss': 0.6367, 'learning_rate': 1.939296186648607e-05, 'epoch': 0.28} {'loss': 0.5552, 'learning_rate': 1.9392846584772205e-05, 'epoch': 0.28} {'loss': 0.5799, 'learning_rate': 1.93927312924556e-05, 'epoch': 0.28} {'loss': 0.5933, 'learning_rate': 1.939261598953639e-05, 'epoch': 0.28} {'loss': 0.661, 'learning_rate': 1.9392500676014703e-05, 'epoch': 0.28} {'loss': 0.717, 'learning_rate': 1.939238535189067e-05, 'epoch': 0.28} {'loss': 0.5807, 'learning_rate': 1.9392270017164417e-05, 'epoch': 0.28} {'loss': 0.5653, 'learning_rate': 1.939215467183608e-05, 'epoch': 0.28} {'loss': 0.6872, 'learning_rate': 1.9392039315905783e-05, 'epoch': 0.28} {'loss': 0.5628, 'learning_rate': 1.9391923949373663e-05, 'epoch': 0.28} {'loss': 0.7101, 'learning_rate': 1.9391808572239845e-05, 'epoch': 0.28} {'loss': 0.6659, 'learning_rate': 1.939169318450446e-05, 'epoch': 0.28} {'loss': 0.5921, 'learning_rate': 1.9391577786167643e-05, 'epoch': 0.28} {'loss': 0.593, 'learning_rate': 1.9391462377229516e-05, 'epoch': 0.28} {'loss': 0.3781, 'learning_rate': 1.9391346957690217e-05, 'epoch': 0.28} {'loss': 0.5713, 'learning_rate': 1.9391231527549873e-05, 'epoch': 0.28} {'loss': 0.6967, 'learning_rate': 1.9391116086808614e-05, 'epoch': 0.28} {'loss': 0.6266, 'learning_rate': 1.9391000635466568e-05, 'epoch': 0.28} {'loss': 0.7266, 'learning_rate': 1.939088517352387e-05, 'epoch': 0.28} {'loss': 0.6314, 'learning_rate': 1.939076970098065e-05, 'epoch': 0.28} {'loss': 0.6807, 'learning_rate': 1.9390654217837035e-05, 'epoch': 0.28} {'loss': 0.5659, 'learning_rate': 1.939053872409316e-05, 'epoch': 0.28} {'loss': 0.7511, 'learning_rate': 1.9390423219749152e-05, 'epoch': 0.28} {'loss': 0.6074, 'learning_rate': 1.9390307704805137e-05, 'epoch': 0.28} {'loss': 0.4799, 'learning_rate': 1.9390192179261253e-05, 'epoch': 0.28} {'loss': 0.4302, 'learning_rate': 1.939007664311763e-05, 'epoch': 0.28} {'loss': 0.5018, 'learning_rate': 1.938996109637439e-05, 'epoch': 0.28} {'loss': 0.6644, 'learning_rate': 1.9389845539031674e-05, 'epoch': 0.28} {'loss': 0.6783, 'learning_rate': 1.938972997108961e-05, 'epoch': 0.28} {'loss': 0.5935, 'learning_rate': 1.9389614392548322e-05, 'epoch': 0.28} {'loss': 0.4843, 'learning_rate': 1.9389498803407948e-05, 'epoch': 0.28} {'loss': 0.5788, 'learning_rate': 1.9389383203668616e-05, 'epoch': 0.28} {'loss': 0.5061, 'learning_rate': 1.938926759333045e-05, 'epoch': 0.28} {'loss': 0.6269, 'learning_rate': 1.9389151972393593e-05, 'epoch': 0.28} {'loss': 0.6519, 'learning_rate': 1.9389036340858166e-05, 'epoch': 0.28} {'loss': 0.5899, 'learning_rate': 1.93889206987243e-05, 'epoch': 0.28} {'loss': 0.5607, 'learning_rate': 1.938880504599213e-05, 'epoch': 0.28} {'loss': 0.491, 'learning_rate': 1.9388689382661784e-05, 'epoch': 0.28} {'loss': 0.6354, 'learning_rate': 1.9388573708733394e-05, 'epoch': 0.28} {'loss': 0.432, 'learning_rate': 1.9388458024207095e-05, 'epoch': 0.28} {'loss': 0.561, 'learning_rate': 1.9388342329083003e-05, 'epoch': 0.28} {'loss': 0.4545, 'learning_rate': 1.9388226623361263e-05, 'epoch': 0.28} {'loss': 0.5393, 'learning_rate': 1.9388110907041998e-05, 'epoch': 0.28} {'loss': 0.5913, 'learning_rate': 1.9387995180125342e-05, 'epoch': 0.28} {'loss': 0.6077, 'learning_rate': 1.9387879442611422e-05, 'epoch': 0.28} {'loss': 0.4686, 'learning_rate': 1.9387763694500375e-05, 'epoch': 0.28} {'loss': 0.6854, 'learning_rate': 1.9387647935792326e-05, 'epoch': 0.28} {'loss': 0.4607, 'learning_rate': 1.938753216648741e-05, 'epoch': 0.28} {'loss': 0.4418, 'learning_rate': 1.9387416386585753e-05, 'epoch': 0.28} {'loss': 0.5617, 'learning_rate': 1.938730059608749e-05, 'epoch': 0.28} {'loss': 0.5576, 'learning_rate': 1.938718479499275e-05, 'epoch': 0.28} {'loss': 0.528, 'learning_rate': 1.9387068983301658e-05, 'epoch': 0.28} {'loss': 0.6303, 'learning_rate': 1.9386953161014354e-05, 'epoch': 0.28} {'loss': 0.5839, 'learning_rate': 1.938683732813097e-05, 'epoch': 0.28} {'loss': 0.7053, 'learning_rate': 1.938672148465162e-05, 'epoch': 0.28} {'loss': 0.606, 'learning_rate': 1.9386605630576455e-05, 'epoch': 0.28} {'loss': 0.5027, 'learning_rate': 1.9386489765905593e-05, 'epoch': 0.28} {'loss': 0.6021, 'learning_rate': 1.9386373890639173e-05, 'epoch': 0.28} {'loss': 0.5049, 'learning_rate': 1.938625800477732e-05, 'epoch': 0.28} {'loss': 0.5754, 'learning_rate': 1.9386142108320168e-05, 'epoch': 0.28} {'loss': 0.6717, 'learning_rate': 1.9386026201267844e-05, 'epoch': 0.28} {'loss': 0.6957, 'learning_rate': 1.9385910283620482e-05, 'epoch': 0.28} {'loss': 0.5648, 'learning_rate': 1.9385794355378213e-05, 'epoch': 0.28} {'loss': 0.7012, 'learning_rate': 1.9385678416541164e-05, 'epoch': 0.28} {'loss': 0.5298, 'learning_rate': 1.938556246710947e-05, 'epoch': 0.28} {'loss': 0.5932, 'learning_rate': 1.9385446507083262e-05, 'epoch': 0.28} {'loss': 0.6173, 'learning_rate': 1.9385330536462673e-05, 'epoch': 0.28} {'loss': 0.516, 'learning_rate': 1.9385214555247824e-05, 'epoch': 0.28} {'loss': 0.6641, 'learning_rate': 1.9385098563438855e-05, 'epoch': 0.28} {'loss': 0.4452, 'learning_rate': 1.9384982561035897e-05, 'epoch': 0.28} {'loss': 0.6573, 'learning_rate': 1.9384866548039074e-05, 'epoch': 0.28} {'loss': 0.6366, 'learning_rate': 1.9384750524448524e-05, 'epoch': 0.28} {'loss': 0.6307, 'learning_rate': 1.9384634490264374e-05, 'epoch': 0.28} {'loss': 0.5686, 'learning_rate': 1.9384518445486756e-05, 'epoch': 0.28} {'loss': 0.3748, 'learning_rate': 1.9384402390115805e-05, 'epoch': 0.28} {'loss': 0.5113, 'learning_rate': 1.9384286324151643e-05, 'epoch': 0.28} {'loss': 0.6008, 'learning_rate': 1.938417024759441e-05, 'epoch': 0.28} {'loss': 0.6283, 'learning_rate': 1.938405416044423e-05, 'epoch': 0.28} {'loss': 0.6211, 'learning_rate': 1.938393806270124e-05, 'epoch': 0.28} {'loss': 0.4635, 'learning_rate': 1.9383821954365567e-05, 'epoch': 0.28} {'loss': 0.784, 'learning_rate': 1.9383705835437343e-05, 'epoch': 0.28} {'loss': 0.6376, 'learning_rate': 1.93835897059167e-05, 'epoch': 0.28} {'loss': 0.6068, 'learning_rate': 1.9383473565803773e-05, 'epoch': 0.28} {'loss': 0.6204, 'learning_rate': 1.938335741509868e-05, 'epoch': 0.28} {'loss': 0.509, 'learning_rate': 1.9383241253801567e-05, 'epoch': 0.28} {'loss': 0.5238, 'learning_rate': 1.9383125081912558e-05, 'epoch': 0.28} {'loss': 0.472, 'learning_rate': 1.9383008899431783e-05, 'epoch': 0.28} {'loss': 0.6276, 'learning_rate': 1.938289270635938e-05, 'epoch': 0.28} {'loss': 0.7093, 'learning_rate': 1.938277650269547e-05, 'epoch': 0.28} {'loss': 0.472, 'learning_rate': 1.938266028844019e-05, 'epoch': 0.28} {'loss': 0.4516, 'learning_rate': 1.9382544063593675e-05, 'epoch': 0.28} {'loss': 0.5146, 'learning_rate': 1.938242782815605e-05, 'epoch': 0.28} {'loss': 0.5343, 'learning_rate': 1.9382311582127444e-05, 'epoch': 0.28} {'loss': 0.5706, 'learning_rate': 1.9382195325507997e-05, 'epoch': 0.28} {'loss': 0.5375, 'learning_rate': 1.9382079058297837e-05, 'epoch': 0.28} {'loss': 0.6215, 'learning_rate': 1.9381962780497087e-05, 'epoch': 0.28} {'loss': 0.6648, 'learning_rate': 1.9381846492105892e-05, 'epoch': 0.28} {'loss': 0.5747, 'learning_rate': 1.9381730193124372e-05, 'epoch': 0.28} {'loss': 0.5888, 'learning_rate': 1.9381613883552664e-05, 'epoch': 0.28} {'loss': 0.6139, 'learning_rate': 1.93814975633909e-05, 'epoch': 0.28} {'loss': 0.5484, 'learning_rate': 1.9381381232639203e-05, 'epoch': 0.28} {'loss': 0.571, 'learning_rate': 1.938126489129772e-05, 'epoch': 0.28} {'loss': 0.7002, 'learning_rate': 1.9381148539366567e-05, 'epoch': 0.28} {'loss': 0.7598, 'learning_rate': 1.938103217684588e-05, 'epoch': 0.28} {'loss': 0.4695, 'learning_rate': 1.9380915803735795e-05, 'epoch': 0.28} {'loss': 0.7319, 'learning_rate': 1.938079942003644e-05, 'epoch': 0.28} {'loss': 0.7129, 'learning_rate': 1.938068302574794e-05, 'epoch': 0.28} {'loss': 0.7009, 'learning_rate': 1.938056662087044e-05, 'epoch': 0.28} {'loss': 0.5427, 'learning_rate': 1.9380450205404062e-05, 'epoch': 0.28} {'loss': 0.7534, 'learning_rate': 1.9380333779348938e-05, 'epoch': 0.28} {'loss': 0.4461, 'learning_rate': 1.93802173427052e-05, 'epoch': 0.28} {'loss': 0.5843, 'learning_rate': 1.9380100895472984e-05, 'epoch': 0.28} {'loss': 0.7629, 'learning_rate': 1.9379984437652417e-05, 'epoch': 0.28} {'loss': 0.4824, 'learning_rate': 1.937986796924363e-05, 'epoch': 0.28} {'loss': 0.4974, 'learning_rate': 1.9379751490246755e-05, 'epoch': 0.28} {'loss': 0.5306, 'learning_rate': 1.9379635000661925e-05, 'epoch': 0.28} {'loss': 0.6117, 'learning_rate': 1.937951850048927e-05, 'epoch': 0.28} {'loss': 0.6735, 'learning_rate': 1.9379401989728924e-05, 'epoch': 0.28} {'loss': 0.6106, 'learning_rate': 1.937928546838102e-05, 'epoch': 0.28} {'loss': 0.5655, 'learning_rate': 1.937916893644568e-05, 'epoch': 0.28} {'loss': 0.6071, 'learning_rate': 1.9379052393923044e-05, 'epoch': 0.28} {'loss': 0.4383, 'learning_rate': 1.937893584081324e-05, 'epoch': 0.28} {'loss': 0.5851, 'learning_rate': 1.9378819277116404e-05, 'epoch': 0.28} {'loss': 0.686, 'learning_rate': 1.9378702702832663e-05, 'epoch': 0.28} {'loss': 0.6442, 'learning_rate': 1.9378586117962148e-05, 'epoch': 0.28} {'loss': 0.4926, 'learning_rate': 1.9378469522504995e-05, 'epoch': 0.28} {'loss': 0.6621, 'learning_rate': 1.9378352916461334e-05, 'epoch': 0.28} {'loss': 0.6585, 'learning_rate': 1.937823629983129e-05, 'epoch': 0.28} {'loss': 0.6746, 'learning_rate': 1.9378119672615008e-05, 'epoch': 0.28} {'loss': 0.5709, 'learning_rate': 1.9378003034812608e-05, 'epoch': 0.28} {'loss': 0.4935, 'learning_rate': 1.9377886386424228e-05, 'epoch': 0.28} {'loss': 0.6884, 'learning_rate': 1.937776972745e-05, 'epoch': 0.28} {'loss': 0.6393, 'learning_rate': 1.937765305789005e-05, 'epoch': 0.28} {'loss': 0.5178, 'learning_rate': 1.937753637774451e-05, 'epoch': 0.28} {'loss': 0.6527, 'learning_rate': 1.937741968701352e-05, 'epoch': 0.28} {'loss': 0.6994, 'learning_rate': 1.9377302985697205e-05, 'epoch': 0.28} {'loss': 0.6682, 'learning_rate': 1.9377186273795695e-05, 'epoch': 0.28} {'loss': 0.5451, 'learning_rate': 1.9377069551309127e-05, 'epoch': 0.28} {'loss': 0.58, 'learning_rate': 1.937695281823763e-05, 'epoch': 0.28} {'loss': 0.5465, 'learning_rate': 1.937683607458134e-05, 'epoch': 0.28} {'loss': 0.5144, 'learning_rate': 1.937671932034038e-05, 'epoch': 0.28} {'loss': 0.6576, 'learning_rate': 1.9376602555514892e-05, 'epoch': 0.28} {'loss': 0.4209, 'learning_rate': 1.9376485780105e-05, 'epoch': 0.28} {'loss': 0.5734, 'learning_rate': 1.9376368994110836e-05, 'epoch': 0.28} {'loss': 0.6466, 'learning_rate': 1.9376252197532537e-05, 'epoch': 0.28} {'loss': 0.5124, 'learning_rate': 1.9376135390370233e-05, 'epoch': 0.28} {'loss': 0.6866, 'learning_rate': 1.9376018572624055e-05, 'epoch': 0.28} {'loss': 0.5837, 'learning_rate': 1.9375901744294134e-05, 'epoch': 0.28} {'loss': 0.5717, 'learning_rate': 1.9375784905380603e-05, 'epoch': 0.28} {'loss': 0.4403, 'learning_rate': 1.9375668055883596e-05, 'epoch': 0.28} {'loss': 0.5848, 'learning_rate': 1.9375551195803237e-05, 'epoch': 0.28} {'loss': 0.5908, 'learning_rate': 1.937543432513967e-05, 'epoch': 0.28} {'loss': 0.5571, 'learning_rate': 1.9375317443893017e-05, 'epoch': 0.28} {'loss': 0.613, 'learning_rate': 1.937520055206341e-05, 'epoch': 0.28} {'loss': 0.4781, 'learning_rate': 1.937508364965099e-05, 'epoch': 0.28} {'loss': 0.477, 'learning_rate': 1.937496673665588e-05, 'epoch': 0.28} {'loss': 0.7082, 'learning_rate': 1.937484981307822e-05, 'epoch': 0.28} {'loss': 0.6804, 'learning_rate': 1.9374732878918134e-05, 'epoch': 0.28} {'loss': 0.6535, 'learning_rate': 1.9374615934175755e-05, 'epoch': 0.28} {'loss': 0.6655, 'learning_rate': 1.9374498978851223e-05, 'epoch': 0.28} {'loss': 0.632, 'learning_rate': 1.937438201294466e-05, 'epoch': 0.28} {'loss': 0.5589, 'learning_rate': 1.9374265036456203e-05, 'epoch': 0.28} {'loss': 0.4995, 'learning_rate': 1.9374148049385984e-05, 'epoch': 0.28} {'loss': 0.4944, 'learning_rate': 1.9374031051734136e-05, 'epoch': 0.28} {'loss': 0.5741, 'learning_rate': 1.9373914043500786e-05, 'epoch': 0.28} {'loss': 0.6479, 'learning_rate': 1.937379702468607e-05, 'epoch': 0.28} {'loss': 0.5241, 'learning_rate': 1.9373679995290123e-05, 'epoch': 0.28} {'loss': 0.7446, 'learning_rate': 1.937356295531307e-05, 'epoch': 0.28} {'loss': 0.5786, 'learning_rate': 1.9373445904755047e-05, 'epoch': 0.28} {'loss': 0.4884, 'learning_rate': 1.937332884361619e-05, 'epoch': 0.28} {'loss': 0.5313, 'learning_rate': 1.937321177189662e-05, 'epoch': 0.28} {'loss': 0.5093, 'learning_rate': 1.9373094689596485e-05, 'epoch': 0.28} {'loss': 0.6056, 'learning_rate': 1.9372977596715903e-05, 'epoch': 0.28} {'loss': 0.534, 'learning_rate': 1.9372860493255013e-05, 'epoch': 0.28} {'loss': 0.5335, 'learning_rate': 1.9372743379213946e-05, 'epoch': 0.28} {'loss': 0.6016, 'learning_rate': 1.9372626254592835e-05, 'epoch': 0.28} {'loss': 0.6158, 'learning_rate': 1.937250911939181e-05, 'epoch': 0.28} {'loss': 0.582, 'learning_rate': 1.9372391973611003e-05, 'epoch': 0.28} {'loss': 0.5573, 'learning_rate': 1.937227481725055e-05, 'epoch': 0.28} {'loss': 0.5679, 'learning_rate': 1.937215765031058e-05, 'epoch': 0.28} {'loss': 0.628, 'learning_rate': 1.9372040472791226e-05, 'epoch': 0.28} {'loss': 0.5776, 'learning_rate': 1.937192328469262e-05, 'epoch': 0.28} {'loss': 0.5562, 'learning_rate': 1.9371806086014898e-05, 'epoch': 0.28} {'loss': 0.5257, 'learning_rate': 1.9371688876758186e-05, 'epoch': 0.28} {'loss': 0.5444, 'learning_rate': 1.937157165692262e-05, 'epoch': 0.28} {'loss': 0.5612, 'learning_rate': 1.9371454426508333e-05, 'epoch': 0.28} {'loss': 0.5273, 'learning_rate': 1.9371337185515455e-05, 'epoch': 0.28} {'loss': 0.5226, 'learning_rate': 1.9371219933944122e-05, 'epoch': 0.28} {'loss': 0.666, 'learning_rate': 1.937110267179446e-05, 'epoch': 0.28} {'loss': 0.7481, 'learning_rate': 1.9370985399066604e-05, 'epoch': 0.28} {'loss': 0.5489, 'learning_rate': 1.937086811576069e-05, 'epoch': 0.28} {'loss': 0.6638, 'learning_rate': 1.9370750821876845e-05, 'epoch': 0.28} {'loss': 0.4535, 'learning_rate': 1.937063351741521e-05, 'epoch': 0.28} {'loss': 0.4839, 'learning_rate': 1.9370516202375908e-05, 'epoch': 0.28} {'loss': 0.6596, 'learning_rate': 1.9370398876759075e-05, 'epoch': 0.28} {'loss': 0.4698, 'learning_rate': 1.9370281540564844e-05, 'epoch': 0.28} {'loss': 0.6078, 'learning_rate': 1.9370164193793347e-05, 'epoch': 0.28} {'loss': 0.6824, 'learning_rate': 1.9370046836444715e-05, 'epoch': 0.28} {'loss': 0.5739, 'learning_rate': 1.9369929468519085e-05, 'epoch': 0.28} {'loss': 0.4498, 'learning_rate': 1.936981209001658e-05, 'epoch': 0.28} {'loss': 0.5074, 'learning_rate': 1.9369694700937347e-05, 'epoch': 0.28} {'loss': 0.5501, 'learning_rate': 1.9369577301281507e-05, 'epoch': 0.28} {'loss': 0.5247, 'learning_rate': 1.9369459891049197e-05, 'epoch': 0.28} {'loss': 0.5932, 'learning_rate': 1.9369342470240545e-05, 'epoch': 0.28} {'loss': 0.6275, 'learning_rate': 1.936922503885569e-05, 'epoch': 0.28} {'loss': 0.5834, 'learning_rate': 1.936910759689476e-05, 'epoch': 0.28} {'loss': 0.4305, 'learning_rate': 1.936899014435789e-05, 'epoch': 0.28} {'loss': 0.4652, 'learning_rate': 1.9368872681245215e-05, 'epoch': 0.28} {'loss': 0.5974, 'learning_rate': 1.936875520755686e-05, 'epoch': 0.28} {'loss': 0.596, 'learning_rate': 1.936863772329296e-05, 'epoch': 0.28} {'loss': 0.5208, 'learning_rate': 1.9368520228453657e-05, 'epoch': 0.28} {'loss': 0.5815, 'learning_rate': 1.936840272303907e-05, 'epoch': 0.28} {'loss': 0.6868, 'learning_rate': 1.936828520704934e-05, 'epoch': 0.28} {'loss': 0.4903, 'learning_rate': 1.9368167680484594e-05, 'epoch': 0.28} {'loss': 0.5163, 'learning_rate': 1.9368050143344973e-05, 'epoch': 0.28} {'loss': 0.3255, 'learning_rate': 1.9367932595630603e-05, 'epoch': 0.28} {'loss': 0.5047, 'learning_rate': 1.936781503734162e-05, 'epoch': 0.28} {'loss': 0.489, 'learning_rate': 1.9367697468478154e-05, 'epoch': 0.28} {'loss': 0.6391, 'learning_rate': 1.9367579889040337e-05, 'epoch': 0.28} {'loss': 0.6129, 'learning_rate': 1.9367462299028306e-05, 'epoch': 0.28} {'loss': 0.537, 'learning_rate': 1.936734469844219e-05, 'epoch': 0.28} {'loss': 0.4726, 'learning_rate': 1.9367227087282124e-05, 'epoch': 0.28} {'loss': 0.4927, 'learning_rate': 1.9367109465548238e-05, 'epoch': 0.28} {'loss': 0.6051, 'learning_rate': 1.936699183324067e-05, 'epoch': 0.28} {'loss': 0.5529, 'learning_rate': 1.9366874190359547e-05, 'epoch': 0.28} {'loss': 0.5894, 'learning_rate': 1.9366756536905005e-05, 'epoch': 0.28} {'loss': 0.5292, 'learning_rate': 1.9366638872877175e-05, 'epoch': 0.28} {'loss': 0.4427, 'learning_rate': 1.9366521198276192e-05, 'epoch': 0.28} {'loss': 0.5941, 'learning_rate': 1.936640351310219e-05, 'epoch': 0.28} {'loss': 0.6428, 'learning_rate': 1.9366285817355295e-05, 'epoch': 0.28} {'loss': 0.4729, 'learning_rate': 1.936616811103565e-05, 'epoch': 0.28} {'loss': 0.4994, 'learning_rate': 1.9366050394143374e-05, 'epoch': 0.28} {'loss': 0.664, 'learning_rate': 1.9365932666678614e-05, 'epoch': 0.28} {'loss': 0.6445, 'learning_rate': 1.9365814928641494e-05, 'epoch': 0.28} {'loss': 0.6092, 'learning_rate': 1.9365697180032152e-05, 'epoch': 0.28} {'loss': 0.45, 'learning_rate': 1.936557942085072e-05, 'epoch': 0.28} {'loss': 0.6006, 'learning_rate': 1.936546165109733e-05, 'epoch': 0.28} {'loss': 0.5185, 'learning_rate': 1.9365343870772113e-05, 'epoch': 0.28} {'loss': 0.4593, 'learning_rate': 1.93652260798752e-05, 'epoch': 0.28} {'loss': 0.5799, 'learning_rate': 1.9365108278406733e-05, 'epoch': 0.28} {'loss': 0.5349, 'learning_rate': 1.9364990466366838e-05, 'epoch': 0.28} {'loss': 0.594, 'learning_rate': 1.9364872643755653e-05, 'epoch': 0.28} {'loss': 0.7538, 'learning_rate': 1.9364754810573304e-05, 'epoch': 0.28} {'loss': 0.6048, 'learning_rate': 1.9364636966819926e-05, 'epoch': 0.28} {'loss': 0.399, 'learning_rate': 1.9364519112495658e-05, 'epoch': 0.28} {'loss': 0.6613, 'learning_rate': 1.9364401247600622e-05, 'epoch': 0.28} {'loss': 0.578, 'learning_rate': 1.936428337213496e-05, 'epoch': 0.28} {'loss': 0.5976, 'learning_rate': 1.9364165486098806e-05, 'epoch': 0.28} {'loss': 0.3915, 'learning_rate': 1.936404758949229e-05, 'epoch': 0.28} {'loss': 0.585, 'learning_rate': 1.9363929682315544e-05, 'epoch': 0.28} {'loss': 0.5024, 'learning_rate': 1.9363811764568702e-05, 'epoch': 0.28} {'loss': 0.6643, 'learning_rate': 1.9363693836251895e-05, 'epoch': 0.28} {'loss': 0.711, 'learning_rate': 1.936357589736526e-05, 'epoch': 0.28} {'loss': 0.6386, 'learning_rate': 1.936345794790893e-05, 'epoch': 0.28} {'loss': 0.5191, 'learning_rate': 1.9363339987883032e-05, 'epoch': 0.28} {'loss': 0.4936, 'learning_rate': 1.9363222017287707e-05, 'epoch': 0.28} {'loss': 0.6219, 'learning_rate': 1.9363104036123084e-05, 'epoch': 0.28} {'loss': 0.5686, 'learning_rate': 1.93629860443893e-05, 'epoch': 0.28} {'loss': 0.6948, 'learning_rate': 1.936286804208648e-05, 'epoch': 0.28} {'loss': 0.5243, 'learning_rate': 1.9362750029214766e-05, 'epoch': 0.28} {'loss': 0.5482, 'learning_rate': 1.9362632005774285e-05, 'epoch': 0.28} {'loss': 0.4976, 'learning_rate': 1.9362513971765174e-05, 'epoch': 0.28} {'loss': 0.6594, 'learning_rate': 1.9362395927187566e-05, 'epoch': 0.28} {'loss': 0.6537, 'learning_rate': 1.9362277872041595e-05, 'epoch': 0.28} {'loss': 0.4548, 'learning_rate': 1.936215980632739e-05, 'epoch': 0.28} {'loss': 0.6971, 'learning_rate': 1.9362041730045087e-05, 'epoch': 0.28} {'loss': 0.4236, 'learning_rate': 1.936192364319482e-05, 'epoch': 0.28} {'loss': 0.5124, 'learning_rate': 1.936180554577672e-05, 'epoch': 0.28} {'loss': 0.6301, 'learning_rate': 1.9361687437790923e-05, 'epoch': 0.28} {'loss': 0.5715, 'learning_rate': 1.936156931923756e-05, 'epoch': 0.28} {'loss': 0.5975, 'learning_rate': 1.9361451190116765e-05, 'epoch': 0.28} {'loss': 0.4684, 'learning_rate': 1.9361333050428673e-05, 'epoch': 0.28} {'loss': 0.5352, 'learning_rate': 1.9361214900173418e-05, 'epoch': 0.28} {'loss': 0.509, 'learning_rate': 1.936109673935113e-05, 'epoch': 0.28} {'loss': 0.663, 'learning_rate': 1.936097856796194e-05, 'epoch': 0.28} {'loss': 0.6164, 'learning_rate': 1.936086038600599e-05, 'epoch': 0.28} {'loss': 0.6557, 'learning_rate': 1.9360742193483407e-05, 'epoch': 0.28} {'loss': 0.391, 'learning_rate': 1.9360623990394326e-05, 'epoch': 0.28} {'loss': 0.5282, 'learning_rate': 1.936050577673888e-05, 'epoch': 0.28} {'loss': 0.4119, 'learning_rate': 1.9360387552517206e-05, 'epoch': 0.28} {'loss': 0.4811, 'learning_rate': 1.936026931772943e-05, 'epoch': 0.28} {'loss': 0.5846, 'learning_rate': 1.9360151072375693e-05, 'epoch': 0.28} {'loss': 0.5782, 'learning_rate': 1.9360032816456127e-05, 'epoch': 0.28} {'loss': 0.544, 'learning_rate': 1.9359914549970858e-05, 'epoch': 0.28} {'loss': 0.4813, 'learning_rate': 1.935979627292003e-05, 'epoch': 0.28} {'loss': 0.7318, 'learning_rate': 1.9359677985303772e-05, 'epoch': 0.28} {'loss': 0.6525, 'learning_rate': 1.9359559687122215e-05, 'epoch': 0.28} {'loss': 0.4862, 'learning_rate': 1.9359441378375498e-05, 'epoch': 0.28} {'loss': 0.6379, 'learning_rate': 1.935932305906375e-05, 'epoch': 0.28} {'loss': 0.6527, 'learning_rate': 1.9359204729187103e-05, 'epoch': 0.28} {'loss': 0.7092, 'learning_rate': 1.9359086388745697e-05, 'epoch': 0.28} {'loss': 0.424, 'learning_rate': 1.935896803773966e-05, 'epoch': 0.28} {'loss': 0.4408, 'learning_rate': 1.9358849676169128e-05, 'epoch': 0.28} {'loss': 0.7376, 'learning_rate': 1.9358731304034236e-05, 'epoch': 0.28} {'loss': 0.6123, 'learning_rate': 1.9358612921335115e-05, 'epoch': 0.28} {'loss': 0.4473, 'learning_rate': 1.93584945280719e-05, 'epoch': 0.28} {'loss': 0.5588, 'learning_rate': 1.9358376124244726e-05, 'epoch': 0.28} {'loss': 0.6311, 'learning_rate': 1.935825770985372e-05, 'epoch': 0.28} {'loss': 0.5265, 'learning_rate': 1.9358139284899024e-05, 'epoch': 0.28} {'loss': 0.6149, 'learning_rate': 1.9358020849380768e-05, 'epoch': 0.28} {'loss': 0.565, 'learning_rate': 1.935790240329909e-05, 'epoch': 0.28} {'loss': 0.5234, 'learning_rate': 1.9357783946654115e-05, 'epoch': 0.28} {'loss': 0.5932, 'learning_rate': 1.9357665479445978e-05, 'epoch': 0.28} {'loss': 0.5635, 'learning_rate': 1.9357547001674822e-05, 'epoch': 0.28} {'loss': 0.6589, 'learning_rate': 1.9357428513340776e-05, 'epoch': 0.28} {'loss': 0.6881, 'learning_rate': 1.9357310014443968e-05, 'epoch': 0.28} {'loss': 0.5146, 'learning_rate': 1.9357191504984536e-05, 'epoch': 0.28} {'loss': 0.7861, 'learning_rate': 1.9357072984962618e-05, 'epoch': 0.28} {'loss': 0.4713, 'learning_rate': 1.935695445437834e-05, 'epoch': 0.28} {'loss': 0.6133, 'learning_rate': 1.9356835913231845e-05, 'epoch': 0.28} {'loss': 0.5513, 'learning_rate': 1.9356717361523257e-05, 'epoch': 0.28} {'loss': 0.5905, 'learning_rate': 1.9356598799252718e-05, 'epoch': 0.28} {'loss': 0.5041, 'learning_rate': 1.9356480226420352e-05, 'epoch': 0.28} {'loss': 0.625, 'learning_rate': 1.9356361643026305e-05, 'epoch': 0.28} {'loss': 0.6558, 'learning_rate': 1.9356243049070703e-05, 'epoch': 0.28} {'loss': 0.4573, 'learning_rate': 1.935612444455368e-05, 'epoch': 0.28} {'loss': 0.6337, 'learning_rate': 1.9356005829475377e-05, 'epoch': 0.28} {'loss': 0.6072, 'learning_rate': 1.9355887203835917e-05, 'epoch': 0.28} {'loss': 0.5511, 'learning_rate': 1.935576856763544e-05, 'epoch': 0.28} {'loss': 0.729, 'learning_rate': 1.9355649920874083e-05, 'epoch': 0.28} {'loss': 0.4051, 'learning_rate': 1.9355531263551973e-05, 'epoch': 0.28} {'loss': 0.6083, 'learning_rate': 1.9355412595669246e-05, 'epoch': 0.28} {'loss': 0.404, 'learning_rate': 1.935529391722604e-05, 'epoch': 0.28} {'loss': 0.6075, 'learning_rate': 1.9355175228222486e-05, 'epoch': 0.28} {'loss': 0.5166, 'learning_rate': 1.9355056528658717e-05, 'epoch': 0.28} {'loss': 0.5674, 'learning_rate': 1.935493781853487e-05, 'epoch': 0.28} {'loss': 0.5304, 'learning_rate': 1.9354819097851077e-05, 'epoch': 0.28} {'loss': 0.6394, 'learning_rate': 1.9354700366607467e-05, 'epoch': 0.28} {'loss': 0.5281, 'learning_rate': 1.9354581624804185e-05, 'epoch': 0.28} {'loss': 0.5492, 'learning_rate': 1.9354462872441356e-05, 'epoch': 0.29} {'loss': 0.6197, 'learning_rate': 1.935434410951912e-05, 'epoch': 0.29} {'loss': 0.5601, 'learning_rate': 1.9354225336037608e-05, 'epoch': 0.29} {'loss': 0.5686, 'learning_rate': 1.9354106551996953e-05, 'epoch': 0.29} {'loss': 0.6618, 'learning_rate': 1.935398775739729e-05, 'epoch': 0.29} {'loss': 0.5255, 'learning_rate': 1.9353868952238756e-05, 'epoch': 0.29} {'loss': 0.4346, 'learning_rate': 1.935375013652148e-05, 'epoch': 0.29} {'loss': 0.6158, 'learning_rate': 1.93536313102456e-05, 'epoch': 0.29} {'loss': 0.5228, 'learning_rate': 1.9353512473411247e-05, 'epoch': 0.29} {'loss': 0.5744, 'learning_rate': 1.9353393626018562e-05, 'epoch': 0.29} {'loss': 0.5165, 'learning_rate': 1.935327476806767e-05, 'epoch': 0.29} {'loss': 0.6566, 'learning_rate': 1.935315589955871e-05, 'epoch': 0.29} {'loss': 0.5884, 'learning_rate': 1.9353037020491815e-05, 'epoch': 0.29} {'loss': 0.6125, 'learning_rate': 1.935291813086712e-05, 'epoch': 0.29} {'loss': 0.5436, 'learning_rate': 1.935279923068476e-05, 'epoch': 0.29} {'loss': 0.5854, 'learning_rate': 1.935268031994487e-05, 'epoch': 0.29} {'loss': 0.6308, 'learning_rate': 1.935256139864758e-05, 'epoch': 0.29} {'loss': 0.6143, 'learning_rate': 1.9352442466793026e-05, 'epoch': 0.29} {'loss': 0.5567, 'learning_rate': 1.9352323524381344e-05, 'epoch': 0.29} {'loss': 0.6089, 'learning_rate': 1.9352204571412667e-05, 'epoch': 0.29} {'loss': 0.5131, 'learning_rate': 1.935208560788713e-05, 'epoch': 0.29} {'loss': 0.5157, 'learning_rate': 1.9351966633804865e-05, 'epoch': 0.29} {'loss': 0.4953, 'learning_rate': 1.935184764916601e-05, 'epoch': 0.29} {'loss': 0.458, 'learning_rate': 1.93517286539707e-05, 'epoch': 0.29} {'loss': 0.5017, 'learning_rate': 1.9351609648219062e-05, 'epoch': 0.29} {'loss': 0.459, 'learning_rate': 1.9351490631911236e-05, 'epoch': 0.29} {'loss': 0.5676, 'learning_rate': 1.9351371605047357e-05, 'epoch': 0.29} {'loss': 0.6099, 'learning_rate': 1.9351252567627553e-05, 'epoch': 0.29} {'loss': 0.5841, 'learning_rate': 1.9351133519651964e-05, 'epoch': 0.29} {'loss': 0.594, 'learning_rate': 1.9351014461120728e-05, 'epoch': 0.29} {'loss': 0.6267, 'learning_rate': 1.935089539203397e-05, 'epoch': 0.29} {'loss': 0.6234, 'learning_rate': 1.9350776312391835e-05, 'epoch': 0.29} {'loss': 0.4997, 'learning_rate': 1.935065722219445e-05, 'epoch': 0.29} {'loss': 0.6587, 'learning_rate': 1.9350538121441947e-05, 'epoch': 0.29} {'loss': 0.539, 'learning_rate': 1.935041901013447e-05, 'epoch': 0.29} {'loss': 0.6107, 'learning_rate': 1.9350299888272146e-05, 'epoch': 0.29} {'loss': 0.5434, 'learning_rate': 1.9350180755855107e-05, 'epoch': 0.29} {'loss': 0.5927, 'learning_rate': 1.93500616128835e-05, 'epoch': 0.29} {'loss': 0.6386, 'learning_rate': 1.9349942459357444e-05, 'epoch': 0.29} {'loss': 0.5983, 'learning_rate': 1.9349823295277087e-05, 'epoch': 0.29} {'loss': 0.5084, 'learning_rate': 1.9349704120642553e-05, 'epoch': 0.29} {'loss': 0.5847, 'learning_rate': 1.9349584935453983e-05, 'epoch': 0.29} {'loss': 0.5492, 'learning_rate': 1.9349465739711507e-05, 'epoch': 0.29} {'loss': 0.5357, 'learning_rate': 1.9349346533415265e-05, 'epoch': 0.29} {'loss': 0.589, 'learning_rate': 1.934922731656539e-05, 'epoch': 0.29} {'loss': 0.7174, 'learning_rate': 1.934910808916201e-05, 'epoch': 0.29} {'loss': 0.4965, 'learning_rate': 1.9348988851205267e-05, 'epoch': 0.29} {'loss': 0.6637, 'learning_rate': 1.9348869602695295e-05, 'epoch': 0.29} {'loss': 0.4897, 'learning_rate': 1.9348750343632224e-05, 'epoch': 0.29} {'loss': 0.6548, 'learning_rate': 1.9348631074016197e-05, 'epoch': 0.29} {'loss': 0.5459, 'learning_rate': 1.934851179384734e-05, 'epoch': 0.29} {'loss': 0.6459, 'learning_rate': 1.934839250312579e-05, 'epoch': 0.29} {'loss': 0.6446, 'learning_rate': 1.934827320185168e-05, 'epoch': 0.29} {'loss': 0.6213, 'learning_rate': 1.9348153890025155e-05, 'epoch': 0.29} {'loss': 0.7535, 'learning_rate': 1.9348034567646338e-05, 'epoch': 0.29} {'loss': 0.5892, 'learning_rate': 1.9347915234715367e-05, 'epoch': 0.29} {'loss': 0.746, 'learning_rate': 1.9347795891232378e-05, 'epoch': 0.29} {'loss': 0.6098, 'learning_rate': 1.9347676537197503e-05, 'epoch': 0.29} {'loss': 0.663, 'learning_rate': 1.934755717261088e-05, 'epoch': 0.29} {'loss': 0.4346, 'learning_rate': 1.934743779747264e-05, 'epoch': 0.29} {'loss': 0.6053, 'learning_rate': 1.9347318411782922e-05, 'epoch': 0.29} {'loss': 0.628, 'learning_rate': 1.9347199015541863e-05, 'epoch': 0.29} {'loss': 0.5386, 'learning_rate': 1.9347079608749588e-05, 'epoch': 0.29} {'loss': 0.6097, 'learning_rate': 1.934696019140624e-05, 'epoch': 0.29} {'loss': 0.5969, 'learning_rate': 1.934684076351195e-05, 'epoch': 0.29} {'loss': 0.6489, 'learning_rate': 1.9346721325066857e-05, 'epoch': 0.29} {'loss': 0.5311, 'learning_rate': 1.934660187607109e-05, 'epoch': 0.29} {'loss': 0.5517, 'learning_rate': 1.9346482416524792e-05, 'epoch': 0.29} {'loss': 0.5133, 'learning_rate': 1.9346362946428087e-05, 'epoch': 0.29} {'loss': 0.4643, 'learning_rate': 1.934624346578112e-05, 'epoch': 0.29} {'loss': 0.4819, 'learning_rate': 1.9346123974584017e-05, 'epoch': 0.29} {'loss': 0.5588, 'learning_rate': 1.934600447283692e-05, 'epoch': 0.29} {'loss': 0.6416, 'learning_rate': 1.934588496053996e-05, 'epoch': 0.29} {'loss': 0.5654, 'learning_rate': 1.9345765437693272e-05, 'epoch': 0.29} {'loss': 0.6206, 'learning_rate': 1.9345645904296996e-05, 'epoch': 0.29} {'loss': 0.6048, 'learning_rate': 1.934552636035126e-05, 'epoch': 0.29} {'loss': 0.487, 'learning_rate': 1.93454068058562e-05, 'epoch': 0.29} {'loss': 0.4751, 'learning_rate': 1.9345287240811955e-05, 'epoch': 0.29} {'loss': 0.4138, 'learning_rate': 1.934516766521866e-05, 'epoch': 0.29} {'loss': 0.5215, 'learning_rate': 1.9345048079076445e-05, 'epoch': 0.29} {'loss': 0.6504, 'learning_rate': 1.934492848238545e-05, 'epoch': 0.29} {'loss': 0.7061, 'learning_rate': 1.9344808875145805e-05, 'epoch': 0.29} {'loss': 0.6575, 'learning_rate': 1.934468925735765e-05, 'epoch': 0.29} {'loss': 0.436, 'learning_rate': 1.9344569629021113e-05, 'epoch': 0.29} {'loss': 0.6956, 'learning_rate': 1.934444999013634e-05, 'epoch': 0.29} {'loss': 0.4555, 'learning_rate': 1.9344330340703457e-05, 'epoch': 0.29} {'loss': 0.4132, 'learning_rate': 1.9344210680722603e-05, 'epoch': 0.29} {'loss': 0.6849, 'learning_rate': 1.934409101019391e-05, 'epoch': 0.29} {'loss': 0.5621, 'learning_rate': 1.934397132911752e-05, 'epoch': 0.29} {'loss': 0.5504, 'learning_rate': 1.934385163749356e-05, 'epoch': 0.29} {'loss': 0.5462, 'learning_rate': 1.9343731935322167e-05, 'epoch': 0.29} {'loss': 0.5104, 'learning_rate': 1.9343612222603476e-05, 'epoch': 0.29} {'loss': 0.4332, 'learning_rate': 1.934349249933763e-05, 'epoch': 0.29} {'loss': 0.4971, 'learning_rate': 1.934337276552475e-05, 'epoch': 0.29} {'loss': 0.6358, 'learning_rate': 1.9343253021164985e-05, 'epoch': 0.29} {'loss': 0.47, 'learning_rate': 1.934313326625846e-05, 'epoch': 0.29} {'loss': 0.6205, 'learning_rate': 1.9343013500805316e-05, 'epoch': 0.29} {'loss': 0.6273, 'learning_rate': 1.9342893724805688e-05, 'epoch': 0.29} {'loss': 0.6497, 'learning_rate': 1.9342773938259707e-05, 'epoch': 0.29} {'loss': 0.5358, 'learning_rate': 1.934265414116751e-05, 'epoch': 0.29} {'loss': 0.5998, 'learning_rate': 1.9342534333529238e-05, 'epoch': 0.29} {'loss': 0.4431, 'learning_rate': 1.9342414515345018e-05, 'epoch': 0.29} {'loss': 0.6724, 'learning_rate': 1.934229468661499e-05, 'epoch': 0.29} {'loss': 0.4973, 'learning_rate': 1.9342174847339287e-05, 'epoch': 0.29} {'loss': 0.6761, 'learning_rate': 1.934205499751804e-05, 'epoch': 0.29} {'loss': 0.6111, 'learning_rate': 1.9341935137151396e-05, 'epoch': 0.29} {'loss': 0.5718, 'learning_rate': 1.9341815266239483e-05, 'epoch': 0.29} {'loss': 0.428, 'learning_rate': 1.9341695384782434e-05, 'epoch': 0.29} {'loss': 0.627, 'learning_rate': 1.934157549278039e-05, 'epoch': 0.29} {'loss': 0.4825, 'learning_rate': 1.934145559023348e-05, 'epoch': 0.29} {'loss': 0.6692, 'learning_rate': 1.9341335677141848e-05, 'epoch': 0.29} {'loss': 0.6238, 'learning_rate': 1.934121575350562e-05, 'epoch': 0.29} {'loss': 0.5315, 'learning_rate': 1.934109581932494e-05, 'epoch': 0.29} {'loss': 0.5422, 'learning_rate': 1.9340975874599938e-05, 'epoch': 0.29} {'loss': 0.4693, 'learning_rate': 1.9340855919330747e-05, 'epoch': 0.29} {'loss': 0.7395, 'learning_rate': 1.934073595351751e-05, 'epoch': 0.29} {'loss': 0.5134, 'learning_rate': 1.9340615977160356e-05, 'epoch': 0.29} {'loss': 0.6795, 'learning_rate': 1.9340495990259424e-05, 'epoch': 0.29} {'loss': 0.5136, 'learning_rate': 1.9340375992814846e-05, 'epoch': 0.29} {'loss': 0.6463, 'learning_rate': 1.934025598482676e-05, 'epoch': 0.29} {'loss': 0.5535, 'learning_rate': 1.9340135966295305e-05, 'epoch': 0.29} {'loss': 0.6629, 'learning_rate': 1.934001593722061e-05, 'epoch': 0.29} {'loss': 0.5271, 'learning_rate': 1.933989589760281e-05, 'epoch': 0.29} {'loss': 0.5878, 'learning_rate': 1.933977584744205e-05, 'epoch': 0.29} {'loss': 0.5386, 'learning_rate': 1.9339655786738456e-05, 'epoch': 0.29} {'loss': 0.6972, 'learning_rate': 1.9339535715492165e-05, 'epoch': 0.29} {'loss': 0.7293, 'learning_rate': 1.9339415633703316e-05, 'epoch': 0.29} {'loss': 0.5397, 'learning_rate': 1.9339295541372044e-05, 'epoch': 0.29} {'loss': 0.5586, 'learning_rate': 1.9339175438498482e-05, 'epoch': 0.29} {'loss': 0.6354, 'learning_rate': 1.9339055325082764e-05, 'epoch': 0.29} {'loss': 0.6751, 'learning_rate': 1.933893520112503e-05, 'epoch': 0.29} {'loss': 0.5555, 'learning_rate': 1.9338815066625416e-05, 'epoch': 0.29} {'loss': 0.6098, 'learning_rate': 1.9338694921584053e-05, 'epoch': 0.29} {'loss': 0.6053, 'learning_rate': 1.933857476600108e-05, 'epoch': 0.29} {'loss': 0.6262, 'learning_rate': 1.9338454599876636e-05, 'epoch': 0.29} {'loss': 0.538, 'learning_rate': 1.9338334423210848e-05, 'epoch': 0.29} {'loss': 0.5282, 'learning_rate': 1.9338214236003856e-05, 'epoch': 0.29} {'loss': 0.6693, 'learning_rate': 1.93380940382558e-05, 'epoch': 0.29} {'loss': 0.4728, 'learning_rate': 1.933797382996681e-05, 'epoch': 0.29} {'loss': 0.607, 'learning_rate': 1.933785361113702e-05, 'epoch': 0.29} {'loss': 0.5285, 'learning_rate': 1.9337733381766572e-05, 'epoch': 0.29} {'loss': 0.7356, 'learning_rate': 1.9337613141855594e-05, 'epoch': 0.29} {'loss': 0.4549, 'learning_rate': 1.9337492891404233e-05, 'epoch': 0.29} {'loss': 0.711, 'learning_rate': 1.9337372630412615e-05, 'epoch': 0.29} {'loss': 0.7726, 'learning_rate': 1.9337252358880878e-05, 'epoch': 0.29} {'loss': 0.5747, 'learning_rate': 1.9337132076809164e-05, 'epoch': 0.29} {'loss': 0.6498, 'learning_rate': 1.93370117841976e-05, 'epoch': 0.29} {'loss': 0.5478, 'learning_rate': 1.933689148104632e-05, 'epoch': 0.29} {'loss': 0.4953, 'learning_rate': 1.933677116735547e-05, 'epoch': 0.29} {'loss': 0.6773, 'learning_rate': 1.9336650843125178e-05, 'epoch': 0.29} {'loss': 0.6304, 'learning_rate': 1.9336530508355587e-05, 'epoch': 0.29} {'loss': 0.6311, 'learning_rate': 1.933641016304683e-05, 'epoch': 0.29} {'loss': 0.5406, 'learning_rate': 1.9336289807199034e-05, 'epoch': 0.29} {'loss': 0.5136, 'learning_rate': 1.9336169440812346e-05, 'epoch': 0.29} {'loss': 0.663, 'learning_rate': 1.9336049063886898e-05, 'epoch': 0.29} {'loss': 0.4176, 'learning_rate': 1.9335928676422825e-05, 'epoch': 0.29} {'loss': 0.5828, 'learning_rate': 1.9335808278420266e-05, 'epoch': 0.29} {'loss': 0.6613, 'learning_rate': 1.933568786987935e-05, 'epoch': 0.29} {'loss': 0.5068, 'learning_rate': 1.9335567450800226e-05, 'epoch': 0.29} {'loss': 0.5818, 'learning_rate': 1.9335447021183013e-05, 'epoch': 0.29} {'loss': 0.7723, 'learning_rate': 1.9335326581027863e-05, 'epoch': 0.29} {'loss': 0.6622, 'learning_rate': 1.93352061303349e-05, 'epoch': 0.29} {'loss': 0.4525, 'learning_rate': 1.9335085669104264e-05, 'epoch': 0.29} {'loss': 0.5328, 'learning_rate': 1.9334965197336093e-05, 'epoch': 0.29} {'loss': 0.6396, 'learning_rate': 1.933484471503052e-05, 'epoch': 0.29} {'loss': 0.5572, 'learning_rate': 1.9334724222187684e-05, 'epoch': 0.29} {'loss': 0.4569, 'learning_rate': 1.933460371880772e-05, 'epoch': 0.29} {'loss': 0.7224, 'learning_rate': 1.933448320489076e-05, 'epoch': 0.29} {'loss': 0.5955, 'learning_rate': 1.9334362680436947e-05, 'epoch': 0.29} {'loss': 0.4465, 'learning_rate': 1.9334242145446413e-05, 'epoch': 0.29} {'loss': 0.8008, 'learning_rate': 1.9334121599919294e-05, 'epoch': 0.29} {'loss': 0.495, 'learning_rate': 1.9334001043855725e-05, 'epoch': 0.29} {'loss': 0.7445, 'learning_rate': 1.9333880477255845e-05, 'epoch': 0.29} {'loss': 0.5883, 'learning_rate': 1.933375990011979e-05, 'epoch': 0.29} {'loss': 0.6094, 'learning_rate': 1.9333639312447693e-05, 'epoch': 0.29} {'loss': 0.5923, 'learning_rate': 1.9333518714239695e-05, 'epoch': 0.29} {'loss': 0.6741, 'learning_rate': 1.9333398105495926e-05, 'epoch': 0.29} {'loss': 0.4153, 'learning_rate': 1.933327748621653e-05, 'epoch': 0.29} {'loss': 0.598, 'learning_rate': 1.9333156856401633e-05, 'epoch': 0.29} {'loss': 0.6042, 'learning_rate': 1.933303621605138e-05, 'epoch': 0.29} {'loss': 0.4037, 'learning_rate': 1.9332915565165905e-05, 'epoch': 0.29} {'loss': 0.5944, 'learning_rate': 1.9332794903745336e-05, 'epoch': 0.29} {'loss': 0.5205, 'learning_rate': 1.9332674231789825e-05, 'epoch': 0.29} {'loss': 0.38, 'learning_rate': 1.9332553549299494e-05, 'epoch': 0.29} {'loss': 0.5333, 'learning_rate': 1.933243285627449e-05, 'epoch': 0.29} {'loss': 0.6972, 'learning_rate': 1.933231215271494e-05, 'epoch': 0.29} {'loss': 0.6807, 'learning_rate': 1.933219143862098e-05, 'epoch': 0.29} {'loss': 0.5798, 'learning_rate': 1.9332070713992757e-05, 'epoch': 0.29} {'loss': 0.6471, 'learning_rate': 1.93319499788304e-05, 'epoch': 0.29} {'loss': 0.4945, 'learning_rate': 1.9331829233134044e-05, 'epoch': 0.29} {'loss': 0.5177, 'learning_rate': 1.933170847690383e-05, 'epoch': 0.29} {'loss': 0.5966, 'learning_rate': 1.933158771013989e-05, 'epoch': 0.29} {'loss': 0.6815, 'learning_rate': 1.9331466932842362e-05, 'epoch': 0.29} {'loss': 0.5653, 'learning_rate': 1.933134614501138e-05, 'epoch': 0.29} {'loss': 0.5328, 'learning_rate': 1.9331225346647086e-05, 'epoch': 0.29} {'loss': 0.6004, 'learning_rate': 1.933110453774961e-05, 'epoch': 0.29} {'loss': 0.5091, 'learning_rate': 1.9330983718319093e-05, 'epoch': 0.29} {'loss': 0.5739, 'learning_rate': 1.933086288835567e-05, 'epoch': 0.29} {'loss': 0.5587, 'learning_rate': 1.933074204785948e-05, 'epoch': 0.29} {'loss': 0.4808, 'learning_rate': 1.933062119683065e-05, 'epoch': 0.29} {'loss': 0.5525, 'learning_rate': 1.9330500335269326e-05, 'epoch': 0.29} {'loss': 0.5997, 'learning_rate': 1.9330379463175647e-05, 'epoch': 0.29} {'loss': 0.4624, 'learning_rate': 1.9330258580549737e-05, 'epoch': 0.29} {'loss': 0.6565, 'learning_rate': 1.933013768739174e-05, 'epoch': 0.29} {'loss': 0.5298, 'learning_rate': 1.933001678370179e-05, 'epoch': 0.29} {'loss': 0.5927, 'learning_rate': 1.932989586948003e-05, 'epoch': 0.29} {'loss': 0.7081, 'learning_rate': 1.932977494472659e-05, 'epoch': 0.29} {'loss': 0.6241, 'learning_rate': 1.932965400944161e-05, 'epoch': 0.29} {'loss': 0.5417, 'learning_rate': 1.932953306362522e-05, 'epoch': 0.29} {'loss': 0.4937, 'learning_rate': 1.9329412107277564e-05, 'epoch': 0.29} {'loss': 0.6534, 'learning_rate': 1.9329291140398777e-05, 'epoch': 0.29} {'loss': 0.5563, 'learning_rate': 1.9329170162988993e-05, 'epoch': 0.29} {'loss': 0.7805, 'learning_rate': 1.9329049175048352e-05, 'epoch': 0.29} {'loss': 0.5415, 'learning_rate': 1.9328928176576985e-05, 'epoch': 0.29} {'loss': 0.6647, 'learning_rate': 1.9328807167575033e-05, 'epoch': 0.29} {'loss': 0.5396, 'learning_rate': 1.932868614804263e-05, 'epoch': 0.29} {'loss': 0.4373, 'learning_rate': 1.9328565117979917e-05, 'epoch': 0.29} {'loss': 0.5369, 'learning_rate': 1.932844407738703e-05, 'epoch': 0.29} {'loss': 0.5395, 'learning_rate': 1.9328323026264102e-05, 'epoch': 0.29} {'loss': 0.5269, 'learning_rate': 1.932820196461127e-05, 'epoch': 0.29} {'loss': 0.5165, 'learning_rate': 1.9328080892428673e-05, 'epoch': 0.29} {'loss': 0.7139, 'learning_rate': 1.9327959809716443e-05, 'epoch': 0.29} {'loss': 0.649, 'learning_rate': 1.9327838716474723e-05, 'epoch': 0.29} {'loss': 0.7342, 'learning_rate': 1.9327717612703645e-05, 'epoch': 0.29} {'loss': 0.5171, 'learning_rate': 1.9327596498403348e-05, 'epoch': 0.29} {'loss': 0.4729, 'learning_rate': 1.932747537357397e-05, 'epoch': 0.29} {'loss': 0.7074, 'learning_rate': 1.9327354238215648e-05, 'epoch': 0.29} {'loss': 0.6044, 'learning_rate': 1.9327233092328513e-05, 'epoch': 0.29} {'loss': 0.5905, 'learning_rate': 1.9327111935912707e-05, 'epoch': 0.29} {'loss': 0.6236, 'learning_rate': 1.9326990768968364e-05, 'epoch': 0.29} {'loss': 0.6318, 'learning_rate': 1.9326869591495624e-05, 'epoch': 0.29} {'loss': 0.7477, 'learning_rate': 1.932674840349462e-05, 'epoch': 0.29} {'loss': 0.3871, 'learning_rate': 1.932662720496549e-05, 'epoch': 0.29} {'loss': 0.6555, 'learning_rate': 1.9326505995908372e-05, 'epoch': 0.29} {'loss': 0.7363, 'learning_rate': 1.9326384776323404e-05, 'epoch': 0.29} {'loss': 0.7288, 'learning_rate': 1.932626354621072e-05, 'epoch': 0.29} {'loss': 0.6851, 'learning_rate': 1.9326142305570455e-05, 'epoch': 0.29} {'loss': 0.7299, 'learning_rate': 1.9326021054402756e-05, 'epoch': 0.29} {'loss': 0.5166, 'learning_rate': 1.932589979270775e-05, 'epoch': 0.29} {'loss': 0.5557, 'learning_rate': 1.932577852048557e-05, 'epoch': 0.29} {'loss': 0.4935, 'learning_rate': 1.9325657237736367e-05, 'epoch': 0.29} {'loss': 0.5268, 'learning_rate': 1.9325535944460268e-05, 'epoch': 0.29} {'loss': 0.5782, 'learning_rate': 1.9325414640657413e-05, 'epoch': 0.29} {'loss': 0.6217, 'learning_rate': 1.9325293326327937e-05, 'epoch': 0.29} {'loss': 0.6604, 'learning_rate': 1.9325172001471973e-05, 'epoch': 0.29} {'loss': 0.5392, 'learning_rate': 1.932505066608967e-05, 'epoch': 0.29} {'loss': 0.5683, 'learning_rate': 1.9324929320181156e-05, 'epoch': 0.29} {'loss': 0.5638, 'learning_rate': 1.932480796374657e-05, 'epoch': 0.29} {'loss': 0.5721, 'learning_rate': 1.932468659678605e-05, 'epoch': 0.29} {'loss': 0.5306, 'learning_rate': 1.9324565219299733e-05, 'epoch': 0.29} {'loss': 0.6313, 'learning_rate': 1.9324443831287755e-05, 'epoch': 0.29} {'loss': 0.5671, 'learning_rate': 1.9324322432750248e-05, 'epoch': 0.29} {'loss': 0.4648, 'learning_rate': 1.9324201023687357e-05, 'epoch': 0.29} {'loss': 0.4783, 'learning_rate': 1.932407960409922e-05, 'epoch': 0.29} {'loss': 0.4668, 'learning_rate': 1.9323958173985966e-05, 'epoch': 0.29} {'loss': 0.6605, 'learning_rate': 1.9323836733347737e-05, 'epoch': 0.29} {'loss': 0.5043, 'learning_rate': 1.9323715282184666e-05, 'epoch': 0.29} {'loss': 0.5766, 'learning_rate': 1.93235938204969e-05, 'epoch': 0.29} {'loss': 0.5214, 'learning_rate': 1.9323472348284565e-05, 'epoch': 0.29} {'loss': 0.7545, 'learning_rate': 1.9323350865547805e-05, 'epoch': 0.29} {'loss': 0.725, 'learning_rate': 1.9323229372286753e-05, 'epoch': 0.29} {'loss': 0.5796, 'learning_rate': 1.932310786850155e-05, 'epoch': 0.29} {'loss': 0.5705, 'learning_rate': 1.932298635419233e-05, 'epoch': 0.29} {'loss': 0.4362, 'learning_rate': 1.9322864829359228e-05, 'epoch': 0.29} {'loss': 0.6055, 'learning_rate': 1.932274329400239e-05, 'epoch': 0.29} {'loss': 0.6378, 'learning_rate': 1.9322621748121943e-05, 'epoch': 0.29} {'loss': 0.6112, 'learning_rate': 1.9322500191718034e-05, 'epoch': 0.29} {'loss': 0.5237, 'learning_rate': 1.932237862479079e-05, 'epoch': 0.29} {'loss': 0.6519, 'learning_rate': 1.9322257047340355e-05, 'epoch': 0.29} {'loss': 0.5656, 'learning_rate': 1.9322135459366867e-05, 'epoch': 0.29} {'loss': 0.4072, 'learning_rate': 1.9322013860870458e-05, 'epoch': 0.29} {'loss': 0.6204, 'learning_rate': 1.9321892251851268e-05, 'epoch': 0.29} {'loss': 0.5818, 'learning_rate': 1.9321770632309434e-05, 'epoch': 0.29} {'loss': 0.7241, 'learning_rate': 1.9321649002245097e-05, 'epoch': 0.29} {'loss': 0.6426, 'learning_rate': 1.9321527361658384e-05, 'epoch': 0.29} {'loss': 0.7714, 'learning_rate': 1.9321405710549442e-05, 'epoch': 0.29} {'loss': 0.6617, 'learning_rate': 1.932128404891841e-05, 'epoch': 0.29} {'loss': 0.5925, 'learning_rate': 1.932116237676542e-05, 'epoch': 0.29} {'loss': 0.5935, 'learning_rate': 1.9321040694090608e-05, 'epoch': 0.29} {'loss': 0.6852, 'learning_rate': 1.932091900089411e-05, 'epoch': 0.29} {'loss': 0.3438, 'learning_rate': 1.9320797297176073e-05, 'epoch': 0.29} {'loss': 0.4471, 'learning_rate': 1.9320675582936627e-05, 'epoch': 0.29} {'loss': 0.5839, 'learning_rate': 1.9320553858175907e-05, 'epoch': 0.29} {'loss': 0.5252, 'learning_rate': 1.9320432122894055e-05, 'epoch': 0.29} {'loss': 0.5526, 'learning_rate': 1.932031037709121e-05, 'epoch': 0.29} {'loss': 0.6013, 'learning_rate': 1.9320188620767505e-05, 'epoch': 0.29} {'loss': 0.5948, 'learning_rate': 1.932006685392308e-05, 'epoch': 0.29} {'loss': 0.8357, 'learning_rate': 1.9319945076558074e-05, 'epoch': 0.29} {'loss': 0.4946, 'learning_rate': 1.931982328867262e-05, 'epoch': 0.29} {'loss': 0.5596, 'learning_rate': 1.9319701490266854e-05, 'epoch': 0.29} {'loss': 0.5807, 'learning_rate': 1.9319579681340922e-05, 'epoch': 0.29} {'loss': 0.4963, 'learning_rate': 1.9319457861894956e-05, 'epoch': 0.29} {'loss': 0.5047, 'learning_rate': 1.9319336031929095e-05, 'epoch': 0.29} {'loss': 0.5988, 'learning_rate': 1.9319214191443478e-05, 'epoch': 0.29} {'loss': 0.5048, 'learning_rate': 1.9319092340438236e-05, 'epoch': 0.29} {'loss': 0.5846, 'learning_rate': 1.9318970478913513e-05, 'epoch': 0.29} {'loss': 0.5829, 'learning_rate': 1.9318848606869444e-05, 'epoch': 0.29} {'loss': 0.5563, 'learning_rate': 1.9318726724306164e-05, 'epoch': 0.29} {'loss': 0.5748, 'learning_rate': 1.931860483122382e-05, 'epoch': 0.29} {'loss': 0.6547, 'learning_rate': 1.9318482927622537e-05, 'epoch': 0.29} {'loss': 0.6488, 'learning_rate': 1.931836101350246e-05, 'epoch': 0.29} {'loss': 0.4598, 'learning_rate': 1.9318239088863725e-05, 'epoch': 0.29} {'loss': 0.6711, 'learning_rate': 1.931811715370647e-05, 'epoch': 0.29} {'loss': 0.6238, 'learning_rate': 1.9317995208030838e-05, 'epoch': 0.29} {'loss': 0.6888, 'learning_rate': 1.9317873251836956e-05, 'epoch': 0.29} {'loss': 0.5205, 'learning_rate': 1.9317751285124967e-05, 'epoch': 0.29} {'loss': 0.5433, 'learning_rate': 1.931762930789501e-05, 'epoch': 0.29} {'loss': 0.6887, 'learning_rate': 1.9317507320147224e-05, 'epoch': 0.29} {'loss': 0.5313, 'learning_rate': 1.931738532188174e-05, 'epoch': 0.29} {'loss': 0.6902, 'learning_rate': 1.9317263313098703e-05, 'epoch': 0.29} {'loss': 0.6043, 'learning_rate': 1.9317141293798244e-05, 'epoch': 0.29} {'loss': 0.56, 'learning_rate': 1.931701926398051e-05, 'epoch': 0.29} {'loss': 0.6412, 'learning_rate': 1.9316897223645626e-05, 'epoch': 0.29} {'loss': 0.6053, 'learning_rate': 1.9316775172793738e-05, 'epoch': 0.29} {'loss': 0.4358, 'learning_rate': 1.9316653111424984e-05, 'epoch': 0.29} {'loss': 0.4625, 'learning_rate': 1.93165310395395e-05, 'epoch': 0.29} {'loss': 0.4969, 'learning_rate': 1.9316408957137427e-05, 'epoch': 0.29} {'loss': 0.5452, 'learning_rate': 1.9316286864218895e-05, 'epoch': 0.29} {'loss': 0.707, 'learning_rate': 1.931616476078405e-05, 'epoch': 0.29} {'loss': 0.7261, 'learning_rate': 1.9316042646833025e-05, 'epoch': 0.29} {'loss': 0.5561, 'learning_rate': 1.931592052236596e-05, 'epoch': 0.29} {'loss': 0.5368, 'learning_rate': 1.931579838738299e-05, 'epoch': 0.29} {'loss': 0.6462, 'learning_rate': 1.931567624188426e-05, 'epoch': 0.29} {'loss': 0.5955, 'learning_rate': 1.9315554085869902e-05, 'epoch': 0.29} {'loss': 0.5229, 'learning_rate': 1.931543191934005e-05, 'epoch': 0.29} {'loss': 0.524, 'learning_rate': 1.9315309742294853e-05, 'epoch': 0.29} {'loss': 0.5824, 'learning_rate': 1.9315187554734436e-05, 'epoch': 0.29} {'loss': 0.4447, 'learning_rate': 1.931506535665895e-05, 'epoch': 0.29} {'loss': 0.6879, 'learning_rate': 1.931494314806852e-05, 'epoch': 0.29} {'loss': 0.5526, 'learning_rate': 1.9314820928963298e-05, 'epoch': 0.29} {'loss': 0.4583, 'learning_rate': 1.931469869934341e-05, 'epoch': 0.29} {'loss': 0.5732, 'learning_rate': 1.9314576459209e-05, 'epoch': 0.29} {'loss': 0.5286, 'learning_rate': 1.93144542085602e-05, 'epoch': 0.29} {'loss': 0.5479, 'learning_rate': 1.9314331947397157e-05, 'epoch': 0.29} {'loss': 0.5911, 'learning_rate': 1.9314209675720005e-05, 'epoch': 0.29} {'loss': 0.6116, 'learning_rate': 1.931408739352888e-05, 'epoch': 0.29} {'loss': 0.6027, 'learning_rate': 1.931396510082392e-05, 'epoch': 0.29} {'loss': 0.4951, 'learning_rate': 1.9313842797605267e-05, 'epoch': 0.29} {'loss': 0.5469, 'learning_rate': 1.9313720483873056e-05, 'epoch': 0.29} {'loss': 0.3867, 'learning_rate': 1.9313598159627423e-05, 'epoch': 0.29} {'loss': 0.5572, 'learning_rate': 1.931347582486851e-05, 'epoch': 0.29} {'loss': 0.5865, 'learning_rate': 1.9313353479596457e-05, 'epoch': 0.29} {'loss': 0.4736, 'learning_rate': 1.9313231123811397e-05, 'epoch': 0.29} {'loss': 0.4678, 'learning_rate': 1.931310875751347e-05, 'epoch': 0.29} {'loss': 0.5192, 'learning_rate': 1.9312986380702812e-05, 'epoch': 0.29} {'loss': 0.4521, 'learning_rate': 1.9312863993379568e-05, 'epoch': 0.29} {'loss': 0.507, 'learning_rate': 1.9312741595543865e-05, 'epoch': 0.29} {'loss': 0.6803, 'learning_rate': 1.9312619187195854e-05, 'epoch': 0.29} {'loss': 0.6289, 'learning_rate': 1.9312496768335666e-05, 'epoch': 0.29} {'loss': 0.6029, 'learning_rate': 1.9312374338963436e-05, 'epoch': 0.29} {'loss': 0.6204, 'learning_rate': 1.9312251899079308e-05, 'epoch': 0.29} {'loss': 0.5687, 'learning_rate': 1.931212944868342e-05, 'epoch': 0.29} {'loss': 0.5853, 'learning_rate': 1.9312006987775905e-05, 'epoch': 0.29} {'loss': 0.5701, 'learning_rate': 1.931188451635691e-05, 'epoch': 0.29} {'loss': 0.6372, 'learning_rate': 1.9311762034426563e-05, 'epoch': 0.29} {'loss': 0.4579, 'learning_rate': 1.931163954198501e-05, 'epoch': 0.29} {'loss': 0.4025, 'learning_rate': 1.931151703903239e-05, 'epoch': 0.29} {'loss': 0.6085, 'learning_rate': 1.9311394525568832e-05, 'epoch': 0.29} {'loss': 0.6183, 'learning_rate': 1.931127200159448e-05, 'epoch': 0.29} {'loss': 0.5673, 'learning_rate': 1.9311149467109474e-05, 'epoch': 0.29} {'loss': 0.5993, 'learning_rate': 1.9311026922113954e-05, 'epoch': 0.29} {'loss': 0.6349, 'learning_rate': 1.9310904366608053e-05, 'epoch': 0.29} {'loss': 0.7435, 'learning_rate': 1.9310781800591912e-05, 'epoch': 0.29} {'loss': 0.472, 'learning_rate': 1.931065922406567e-05, 'epoch': 0.29} {'loss': 0.5436, 'learning_rate': 1.931053663702946e-05, 'epoch': 0.29} {'loss': 0.753, 'learning_rate': 1.931041403948343e-05, 'epoch': 0.29} {'loss': 0.6151, 'learning_rate': 1.9310291431427706e-05, 'epoch': 0.29} {'loss': 0.556, 'learning_rate': 1.931016881286244e-05, 'epoch': 0.29} {'loss': 0.6207, 'learning_rate': 1.9310046183787764e-05, 'epoch': 0.29} {'loss': 0.6011, 'learning_rate': 1.930992354420381e-05, 'epoch': 0.29} {'loss': 0.5532, 'learning_rate': 1.930980089411073e-05, 'epoch': 0.29} {'loss': 0.6491, 'learning_rate': 1.930967823350865e-05, 'epoch': 0.29} {'loss': 0.5932, 'learning_rate': 1.9309555562397716e-05, 'epoch': 0.29} {'loss': 0.5975, 'learning_rate': 1.930943288077806e-05, 'epoch': 0.29} {'loss': 0.6125, 'learning_rate': 1.9309310188649832e-05, 'epoch': 0.29} {'loss': 0.4573, 'learning_rate': 1.930918748601316e-05, 'epoch': 0.29} {'loss': 0.4665, 'learning_rate': 1.9309064772868182e-05, 'epoch': 0.29} {'loss': 0.7621, 'learning_rate': 1.9308942049215042e-05, 'epoch': 0.29} {'loss': 0.5163, 'learning_rate': 1.9308819315053877e-05, 'epoch': 0.29} {'loss': 0.5972, 'learning_rate': 1.9308696570384827e-05, 'epoch': 0.29} {'loss': 0.5407, 'learning_rate': 1.930857381520803e-05, 'epoch': 0.29} {'loss': 0.7494, 'learning_rate': 1.9308451049523617e-05, 'epoch': 0.29} {'loss': 0.6184, 'learning_rate': 1.9308328273331734e-05, 'epoch': 0.29} {'loss': 0.4774, 'learning_rate': 1.930820548663252e-05, 'epoch': 0.29} {'loss': 0.5412, 'learning_rate': 1.9308082689426113e-05, 'epoch': 0.29} {'loss': 0.4843, 'learning_rate': 1.930795988171265e-05, 'epoch': 0.29} {'loss': 0.5609, 'learning_rate': 1.930783706349227e-05, 'epoch': 0.29} {'loss': 0.5604, 'learning_rate': 1.9307714234765115e-05, 'epoch': 0.29} {'loss': 0.6378, 'learning_rate': 1.9307591395531318e-05, 'epoch': 0.29} {'loss': 0.4449, 'learning_rate': 1.930746854579102e-05, 'epoch': 0.29} {'loss': 0.6125, 'learning_rate': 1.9307345685544358e-05, 'epoch': 0.29} {'loss': 0.5798, 'learning_rate': 1.9307222814791476e-05, 'epoch': 0.29} {'loss': 0.5299, 'learning_rate': 1.9307099933532508e-05, 'epoch': 0.29} {'loss': 0.5411, 'learning_rate': 1.9306977041767595e-05, 'epoch': 0.29} {'loss': 0.5761, 'learning_rate': 1.9306854139496874e-05, 'epoch': 0.29} {'loss': 0.6607, 'learning_rate': 1.9306731226720482e-05, 'epoch': 0.29} {'loss': 0.5936, 'learning_rate': 1.9306608303438563e-05, 'epoch': 0.29} {'loss': 0.6345, 'learning_rate': 1.9306485369651254e-05, 'epoch': 0.29} {'loss': 0.5665, 'learning_rate': 1.930636242535869e-05, 'epoch': 0.29} {'loss': 0.5745, 'learning_rate': 1.9306239470561014e-05, 'epoch': 0.29} {'loss': 0.5612, 'learning_rate': 1.9306116505258363e-05, 'epoch': 0.29} {'loss': 0.6495, 'learning_rate': 1.9305993529450875e-05, 'epoch': 0.29} {'loss': 0.5988, 'learning_rate': 1.930587054313869e-05, 'epoch': 0.29} {'loss': 0.6496, 'learning_rate': 1.930574754632195e-05, 'epoch': 0.29} {'loss': 0.657, 'learning_rate': 1.9305624539000786e-05, 'epoch': 0.29} {'loss': 0.4754, 'learning_rate': 1.9305501521175343e-05, 'epoch': 0.29} {'loss': 0.6199, 'learning_rate': 1.930537849284576e-05, 'epoch': 0.29} {'loss': 0.5127, 'learning_rate': 1.9305255454012174e-05, 'epoch': 0.29} {'loss': 0.6042, 'learning_rate': 1.9305132404674724e-05, 'epoch': 0.29} {'loss': 0.5182, 'learning_rate': 1.9305009344833547e-05, 'epoch': 0.29} {'loss': 0.6302, 'learning_rate': 1.9304886274488786e-05, 'epoch': 0.29} {'loss': 0.6974, 'learning_rate': 1.9304763193640575e-05, 'epoch': 0.29} {'loss': 0.5578, 'learning_rate': 1.930464010228906e-05, 'epoch': 0.29} {'loss': 0.5436, 'learning_rate': 1.9304517000434373e-05, 'epoch': 0.29} {'loss': 0.6216, 'learning_rate': 1.9304393888076656e-05, 'epoch': 0.29} {'loss': 0.5865, 'learning_rate': 1.9304270765216048e-05, 'epoch': 0.29} {'loss': 0.6031, 'learning_rate': 1.9304147631852686e-05, 'epoch': 0.29} {'loss': 0.759, 'learning_rate': 1.9304024487986712e-05, 'epoch': 0.29} {'loss': 0.5395, 'learning_rate': 1.930390133361826e-05, 'epoch': 0.29} {'loss': 0.3894, 'learning_rate': 1.930377816874748e-05, 'epoch': 0.29} {'loss': 0.5969, 'learning_rate': 1.9303654993374498e-05, 'epoch': 0.29} {'loss': 0.5809, 'learning_rate': 1.930353180749946e-05, 'epoch': 0.29} {'loss': 0.4926, 'learning_rate': 1.9303408611122505e-05, 'epoch': 0.29} {'loss': 0.5311, 'learning_rate': 1.930328540424377e-05, 'epoch': 0.29} {'loss': 0.477, 'learning_rate': 1.9303162186863394e-05, 'epoch': 0.29} {'loss': 0.7041, 'learning_rate': 1.9303038958981516e-05, 'epoch': 0.29} {'loss': 0.5389, 'learning_rate': 1.930291572059828e-05, 'epoch': 0.29} {'loss': 0.4684, 'learning_rate': 1.930279247171382e-05, 'epoch': 0.29} {'loss': 0.6375, 'learning_rate': 1.9302669212328276e-05, 'epoch': 0.29} {'loss': 0.5844, 'learning_rate': 1.9302545942441786e-05, 'epoch': 0.29} {'loss': 0.6637, 'learning_rate': 1.930242266205449e-05, 'epoch': 0.29} {'loss': 0.4914, 'learning_rate': 1.930229937116653e-05, 'epoch': 0.29} {'loss': 0.5721, 'learning_rate': 1.930217606977804e-05, 'epoch': 0.29} {'loss': 0.6133, 'learning_rate': 1.9302052757889165e-05, 'epoch': 0.29} {'loss': 0.4645, 'learning_rate': 1.930192943550004e-05, 'epoch': 0.29} {'loss': 0.4804, 'learning_rate': 1.9301806102610806e-05, 'epoch': 0.29} {'loss': 0.6127, 'learning_rate': 1.93016827592216e-05, 'epoch': 0.29} {'loss': 0.51, 'learning_rate': 1.930155940533257e-05, 'epoch': 0.29} {'loss': 0.5531, 'learning_rate': 1.930143604094384e-05, 'epoch': 0.29} {'loss': 0.5787, 'learning_rate': 1.930131266605556e-05, 'epoch': 0.29} {'loss': 0.4502, 'learning_rate': 1.9301189280667868e-05, 'epoch': 0.29} {'loss': 0.6804, 'learning_rate': 1.9301065884780898e-05, 'epoch': 0.29} {'loss': 0.567, 'learning_rate': 1.9300942478394798e-05, 'epoch': 0.29} {'loss': 0.4114, 'learning_rate': 1.9300819061509698e-05, 'epoch': 0.29} {'loss': 0.55, 'learning_rate': 1.9300695634125747e-05, 'epoch': 0.29} {'loss': 0.5923, 'learning_rate': 1.9300572196243076e-05, 'epoch': 0.29} {'loss': 0.4293, 'learning_rate': 1.930044874786183e-05, 'epoch': 0.29} {'loss': 0.6123, 'learning_rate': 1.9300325288982143e-05, 'epoch': 0.29} {'loss': 0.6104, 'learning_rate': 1.9300201819604162e-05, 'epoch': 0.29} {'loss': 0.5922, 'learning_rate': 1.9300078339728017e-05, 'epoch': 0.29} {'loss': 0.6284, 'learning_rate': 1.9299954849353854e-05, 'epoch': 0.29} {'loss': 0.6042, 'learning_rate': 1.929983134848181e-05, 'epoch': 0.29} {'loss': 0.5549, 'learning_rate': 1.9299707837112023e-05, 'epoch': 0.29} {'loss': 0.4836, 'learning_rate': 1.9299584315244636e-05, 'epoch': 0.29} {'loss': 0.5356, 'learning_rate': 1.9299460782879788e-05, 'epoch': 0.29} {'loss': 0.5997, 'learning_rate': 1.9299337240017615e-05, 'epoch': 0.29} {'loss': 0.6381, 'learning_rate': 1.929921368665826e-05, 'epoch': 0.29} {'loss': 0.5434, 'learning_rate': 1.929909012280186e-05, 'epoch': 0.29} {'loss': 0.6471, 'learning_rate': 1.9298966548448558e-05, 'epoch': 0.29} {'loss': 0.6405, 'learning_rate': 1.9298842963598488e-05, 'epoch': 0.29} {'loss': 0.5677, 'learning_rate': 1.9298719368251793e-05, 'epoch': 0.29} {'loss': 0.643, 'learning_rate': 1.9298595762408614e-05, 'epoch': 0.29} {'loss': 0.5492, 'learning_rate': 1.929847214606909e-05, 'epoch': 0.29} {'loss': 0.5098, 'learning_rate': 1.929834851923335e-05, 'epoch': 0.29} {'loss': 0.7567, 'learning_rate': 1.9298224881901553e-05, 'epoch': 0.29} {'loss': 0.5756, 'learning_rate': 1.9298101234073825e-05, 'epoch': 0.29} {'loss': 0.5256, 'learning_rate': 1.9297977575750308e-05, 'epoch': 0.29} {'loss': 0.4063, 'learning_rate': 1.9297853906931145e-05, 'epoch': 0.29} {'loss': 0.5537, 'learning_rate': 1.9297730227616468e-05, 'epoch': 0.29} {'loss': 0.6197, 'learning_rate': 1.9297606537806425e-05, 'epoch': 0.29} {'loss': 0.4923, 'learning_rate': 1.929748283750115e-05, 'epoch': 0.29} {'loss': 0.3799, 'learning_rate': 1.9297359126700788e-05, 'epoch': 0.29} {'loss': 0.7387, 'learning_rate': 1.9297235405405474e-05, 'epoch': 0.29} {'loss': 0.7076, 'learning_rate': 1.9297111673615347e-05, 'epoch': 0.29} {'loss': 0.5936, 'learning_rate': 1.929698793133055e-05, 'epoch': 0.29} {'loss': 0.6598, 'learning_rate': 1.9296864178551225e-05, 'epoch': 0.29} {'loss': 0.5313, 'learning_rate': 1.9296740415277507e-05, 'epoch': 0.29} {'loss': 0.6442, 'learning_rate': 1.9296616641509535e-05, 'epoch': 0.29} {'loss': 0.5893, 'learning_rate': 1.929649285724745e-05, 'epoch': 0.29} {'loss': 0.6203, 'learning_rate': 1.9296369062491393e-05, 'epoch': 0.29} {'loss': 0.5569, 'learning_rate': 1.9296245257241507e-05, 'epoch': 0.29} {'loss': 0.5703, 'learning_rate': 1.9296121441497923e-05, 'epoch': 0.29} {'loss': 0.4502, 'learning_rate': 1.9295997615260787e-05, 'epoch': 0.3} {'loss': 0.555, 'learning_rate': 1.9295873778530237e-05, 'epoch': 0.3} {'loss': 0.5191, 'learning_rate': 1.9295749931306416e-05, 'epoch': 0.3} {'loss': 0.4508, 'learning_rate': 1.9295626073589457e-05, 'epoch': 0.3} {'loss': 0.5382, 'learning_rate': 1.9295502205379507e-05, 'epoch': 0.3} {'loss': 0.5502, 'learning_rate': 1.92953783266767e-05, 'epoch': 0.3} {'loss': 0.4317, 'learning_rate': 1.929525443748118e-05, 'epoch': 0.3} {'loss': 0.6271, 'learning_rate': 1.9295130537793083e-05, 'epoch': 0.3} {'loss': 0.5179, 'learning_rate': 1.9295006627612553e-05, 'epoch': 0.3} {'loss': 0.4555, 'learning_rate': 1.929488270693973e-05, 'epoch': 0.3} {'loss': 0.562, 'learning_rate': 1.9294758775774748e-05, 'epoch': 0.3} {'loss': 0.7769, 'learning_rate': 1.9294634834117754e-05, 'epoch': 0.3} {'loss': 0.5793, 'learning_rate': 1.9294510881968886e-05, 'epoch': 0.3} {'loss': 0.5163, 'learning_rate': 1.9294386919328278e-05, 'epoch': 0.3} {'loss': 0.5948, 'learning_rate': 1.929426294619608e-05, 'epoch': 0.3} {'loss': 0.6284, 'learning_rate': 1.929413896257242e-05, 'epoch': 0.3} {'loss': 0.5974, 'learning_rate': 1.929401496845745e-05, 'epoch': 0.3} {'loss': 0.5446, 'learning_rate': 1.9293890963851304e-05, 'epoch': 0.3} {'loss': 0.6827, 'learning_rate': 1.929376694875412e-05, 'epoch': 0.3} {'loss': 0.5308, 'learning_rate': 1.929364292316604e-05, 'epoch': 0.3} {'loss': 0.4271, 'learning_rate': 1.9293518887087208e-05, 'epoch': 0.3} {'loss': 0.5122, 'learning_rate': 1.9293394840517757e-05, 'epoch': 0.3} {'loss': 0.4969, 'learning_rate': 1.929327078345783e-05, 'epoch': 0.3} {'loss': 0.5101, 'learning_rate': 1.929314671590757e-05, 'epoch': 0.3} {'loss': 0.658, 'learning_rate': 1.9293022637867112e-05, 'epoch': 0.3} {'loss': 0.4498, 'learning_rate': 1.92928985493366e-05, 'epoch': 0.3} {'loss': 0.5912, 'learning_rate': 1.9292774450316174e-05, 'epoch': 0.3} {'loss': 0.7695, 'learning_rate': 1.9292650340805972e-05, 'epoch': 0.3} {'loss': 0.5475, 'learning_rate': 1.9292526220806134e-05, 'epoch': 0.3} {'loss': 0.5612, 'learning_rate': 1.9292402090316803e-05, 'epoch': 0.3} {'loss': 0.4891, 'learning_rate': 1.9292277949338114e-05, 'epoch': 0.3} {'loss': 0.637, 'learning_rate': 1.9292153797870213e-05, 'epoch': 0.3} {'loss': 0.4613, 'learning_rate': 1.9292029635913235e-05, 'epoch': 0.3} {'loss': 0.4785, 'learning_rate': 1.9291905463467322e-05, 'epoch': 0.3} {'loss': 0.6342, 'learning_rate': 1.9291781280532618e-05, 'epoch': 0.3} {'loss': 0.5309, 'learning_rate': 1.929165708710926e-05, 'epoch': 0.3} {'loss': 0.5415, 'learning_rate': 1.9291532883197382e-05, 'epoch': 0.3} {'loss': 0.7513, 'learning_rate': 1.9291408668797135e-05, 'epoch': 0.3} {'loss': 0.634, 'learning_rate': 1.9291284443908655e-05, 'epoch': 0.3} {'loss': 0.5405, 'learning_rate': 1.929116020853208e-05, 'epoch': 0.3} {'loss': 0.4779, 'learning_rate': 1.9291035962667552e-05, 'epoch': 0.3} {'loss': 0.5974, 'learning_rate': 1.9290911706315213e-05, 'epoch': 0.3} {'loss': 0.5413, 'learning_rate': 1.9290787439475197e-05, 'epoch': 0.3} {'loss': 0.5013, 'learning_rate': 1.9290663162147653e-05, 'epoch': 0.3} {'loss': 0.4007, 'learning_rate': 1.9290538874332716e-05, 'epoch': 0.3} {'loss': 0.6449, 'learning_rate': 1.9290414576030528e-05, 'epoch': 0.3} {'loss': 0.7083, 'learning_rate': 1.9290290267241226e-05, 'epoch': 0.3} {'loss': 0.6694, 'learning_rate': 1.9290165947964958e-05, 'epoch': 0.3} {'loss': 0.5493, 'learning_rate': 1.9290041618201852e-05, 'epoch': 0.3} {'loss': 0.6483, 'learning_rate': 1.928991727795206e-05, 'epoch': 0.3} {'loss': 0.731, 'learning_rate': 1.9289792927215716e-05, 'epoch': 0.3} {'loss': 0.7038, 'learning_rate': 1.9289668565992964e-05, 'epoch': 0.3} {'loss': 0.5479, 'learning_rate': 1.9289544194283943e-05, 'epoch': 0.3} {'loss': 0.6217, 'learning_rate': 1.9289419812088793e-05, 'epoch': 0.3} {'loss': 0.6334, 'learning_rate': 1.9289295419407654e-05, 'epoch': 0.3} {'loss': 0.5832, 'learning_rate': 1.9289171016240663e-05, 'epoch': 0.3} {'loss': 0.6764, 'learning_rate': 1.928904660258797e-05, 'epoch': 0.3} {'loss': 0.5702, 'learning_rate': 1.928892217844971e-05, 'epoch': 0.3} {'loss': 0.5656, 'learning_rate': 1.928879774382602e-05, 'epoch': 0.3} {'loss': 0.4716, 'learning_rate': 1.9288673298717045e-05, 'epoch': 0.3} {'loss': 0.6055, 'learning_rate': 1.9288548843122923e-05, 'epoch': 0.3} {'loss': 0.6142, 'learning_rate': 1.9288424377043796e-05, 'epoch': 0.3} {'loss': 0.706, 'learning_rate': 1.9288299900479805e-05, 'epoch': 0.3} {'loss': 0.7596, 'learning_rate': 1.928817541343109e-05, 'epoch': 0.3} {'loss': 0.5188, 'learning_rate': 1.9288050915897792e-05, 'epoch': 0.3} {'loss': 0.5375, 'learning_rate': 1.9287926407880045e-05, 'epoch': 0.3} {'loss': 0.5982, 'learning_rate': 1.9287801889378003e-05, 'epoch': 0.3} {'loss': 0.5479, 'learning_rate': 1.9287677360391796e-05, 'epoch': 0.3} {'loss': 0.7252, 'learning_rate': 1.9287552820921568e-05, 'epoch': 0.3} {'loss': 0.5821, 'learning_rate': 1.9287428270967457e-05, 'epoch': 0.3} {'loss': 0.6053, 'learning_rate': 1.9287303710529606e-05, 'epoch': 0.3} {'loss': 0.5961, 'learning_rate': 1.9287179139608153e-05, 'epoch': 0.3} {'loss': 0.5747, 'learning_rate': 1.9287054558203245e-05, 'epoch': 0.3} {'loss': 0.5952, 'learning_rate': 1.9286929966315016e-05, 'epoch': 0.3} {'loss': 0.5708, 'learning_rate': 1.928680536394361e-05, 'epoch': 0.3} {'loss': 0.5987, 'learning_rate': 1.9286680751089168e-05, 'epoch': 0.3} {'loss': 0.688, 'learning_rate': 1.928655612775183e-05, 'epoch': 0.3} {'loss': 0.6108, 'learning_rate': 1.9286431493931732e-05, 'epoch': 0.3} {'loss': 0.6212, 'learning_rate': 1.928630684962902e-05, 'epoch': 0.3} {'loss': 0.5363, 'learning_rate': 1.9286182194843835e-05, 'epoch': 0.3} {'loss': 0.4864, 'learning_rate': 1.9286057529576316e-05, 'epoch': 0.3} {'loss': 0.5726, 'learning_rate': 1.92859328538266e-05, 'epoch': 0.3} {'loss': 0.7175, 'learning_rate': 1.9285808167594836e-05, 'epoch': 0.3} {'loss': 0.6291, 'learning_rate': 1.928568347088116e-05, 'epoch': 0.3} {'loss': 0.6161, 'learning_rate': 1.928555876368571e-05, 'epoch': 0.3} {'loss': 0.6233, 'learning_rate': 1.9285434046008634e-05, 'epoch': 0.3} {'loss': 0.5636, 'learning_rate': 1.9285309317850067e-05, 'epoch': 0.3} {'loss': 0.7089, 'learning_rate': 1.928518457921015e-05, 'epoch': 0.3} {'loss': 0.5649, 'learning_rate': 1.928505983008903e-05, 'epoch': 0.3} {'loss': 0.6599, 'learning_rate': 1.9284935070486837e-05, 'epoch': 0.3} {'loss': 0.4936, 'learning_rate': 1.9284810300403717e-05, 'epoch': 0.3} {'loss': 0.4962, 'learning_rate': 1.9284685519839818e-05, 'epoch': 0.3} {'loss': 0.5766, 'learning_rate': 1.928456072879527e-05, 'epoch': 0.3} {'loss': 0.5838, 'learning_rate': 1.928443592727022e-05, 'epoch': 0.3} {'loss': 0.6124, 'learning_rate': 1.928431111526481e-05, 'epoch': 0.3} {'loss': 0.4301, 'learning_rate': 1.9284186292779177e-05, 'epoch': 0.3} {'loss': 0.5993, 'learning_rate': 1.9284061459813462e-05, 'epoch': 0.3} {'loss': 0.7356, 'learning_rate': 1.9283936616367805e-05, 'epoch': 0.3} {'loss': 0.6064, 'learning_rate': 1.9283811762442352e-05, 'epoch': 0.3} {'loss': 0.5105, 'learning_rate': 1.928368689803724e-05, 'epoch': 0.3} {'loss': 0.6337, 'learning_rate': 1.928356202315261e-05, 'epoch': 0.3} {'loss': 0.487, 'learning_rate': 1.9283437137788605e-05, 'epoch': 0.3} {'loss': 0.5374, 'learning_rate': 1.9283312241945365e-05, 'epoch': 0.3} {'loss': 0.5762, 'learning_rate': 1.928318733562303e-05, 'epoch': 0.3} {'loss': 0.4501, 'learning_rate': 1.9283062418821744e-05, 'epoch': 0.3} {'loss': 0.7231, 'learning_rate': 1.928293749154164e-05, 'epoch': 0.3} {'loss': 0.6116, 'learning_rate': 1.9282812553782874e-05, 'epoch': 0.3} {'loss': 0.5399, 'learning_rate': 1.928268760554557e-05, 'epoch': 0.3} {'loss': 0.6473, 'learning_rate': 1.928256264682988e-05, 'epoch': 0.3} {'loss': 0.5883, 'learning_rate': 1.9282437677635938e-05, 'epoch': 0.3} {'loss': 0.5475, 'learning_rate': 1.9282312697963896e-05, 'epoch': 0.3} {'loss': 0.4814, 'learning_rate': 1.9282187707813885e-05, 'epoch': 0.3} {'loss': 0.5828, 'learning_rate': 1.9282062707186048e-05, 'epoch': 0.3} {'loss': 0.6259, 'learning_rate': 1.928193769608053e-05, 'epoch': 0.3} {'loss': 0.6285, 'learning_rate': 1.9281812674497464e-05, 'epoch': 0.3} {'loss': 0.56, 'learning_rate': 1.9281687642437e-05, 'epoch': 0.3} {'loss': 0.5496, 'learning_rate': 1.9281562599899275e-05, 'epoch': 0.3} {'loss': 0.7472, 'learning_rate': 1.9281437546884433e-05, 'epoch': 0.3} {'loss': 0.4466, 'learning_rate': 1.928131248339261e-05, 'epoch': 0.3} {'loss': 0.6725, 'learning_rate': 1.928118740942395e-05, 'epoch': 0.3} {'loss': 0.57, 'learning_rate': 1.9281062324978597e-05, 'epoch': 0.3} {'loss': 0.5717, 'learning_rate': 1.9280937230056688e-05, 'epoch': 0.3} {'loss': 0.6726, 'learning_rate': 1.9280812124658364e-05, 'epoch': 0.3} {'loss': 0.4861, 'learning_rate': 1.928068700878377e-05, 'epoch': 0.3} {'loss': 0.6573, 'learning_rate': 1.9280561882433046e-05, 'epoch': 0.3} {'loss': 0.5957, 'learning_rate': 1.928043674560633e-05, 'epoch': 0.3} {'loss': 0.4794, 'learning_rate': 1.9280311598303768e-05, 'epoch': 0.3} {'loss': 0.5219, 'learning_rate': 1.92801864405255e-05, 'epoch': 0.3} {'loss': 0.5115, 'learning_rate': 1.928006127227166e-05, 'epoch': 0.3} {'loss': 0.4603, 'learning_rate': 1.9279936093542402e-05, 'epoch': 0.3} {'loss': 0.5888, 'learning_rate': 1.927981090433786e-05, 'epoch': 0.3} {'loss': 0.5733, 'learning_rate': 1.9279685704658174e-05, 'epoch': 0.3} {'loss': 0.5574, 'learning_rate': 1.9279560494503487e-05, 'epoch': 0.3} {'loss': 0.6543, 'learning_rate': 1.9279435273873944e-05, 'epoch': 0.3} {'loss': 0.5082, 'learning_rate': 1.927931004276968e-05, 'epoch': 0.3} {'loss': 0.5835, 'learning_rate': 1.927918480119084e-05, 'epoch': 0.3} {'loss': 0.4969, 'learning_rate': 1.9279059549137563e-05, 'epoch': 0.3} {'loss': 0.4773, 'learning_rate': 1.9278934286609995e-05, 'epoch': 0.3} {'loss': 0.5189, 'learning_rate': 1.9278809013608276e-05, 'epoch': 0.3} {'loss': 0.4013, 'learning_rate': 1.9278683730132544e-05, 'epoch': 0.3} {'loss': 0.6144, 'learning_rate': 1.927855843618294e-05, 'epoch': 0.3} {'loss': 0.5167, 'learning_rate': 1.9278433131759612e-05, 'epoch': 0.3} {'loss': 0.7795, 'learning_rate': 1.9278307816862698e-05, 'epoch': 0.3} {'loss': 0.4968, 'learning_rate': 1.9278182491492337e-05, 'epoch': 0.3} {'loss': 0.5234, 'learning_rate': 1.9278057155648674e-05, 'epoch': 0.3} {'loss': 0.7971, 'learning_rate': 1.9277931809331845e-05, 'epoch': 0.3} {'loss': 0.445, 'learning_rate': 1.9277806452542e-05, 'epoch': 0.3} {'loss': 0.4652, 'learning_rate': 1.9277681085279272e-05, 'epoch': 0.3} {'loss': 0.6072, 'learning_rate': 1.9277555707543806e-05, 'epoch': 0.3} {'loss': 0.4512, 'learning_rate': 1.9277430319335746e-05, 'epoch': 0.3} {'loss': 0.4886, 'learning_rate': 1.927730492065523e-05, 'epoch': 0.3} {'loss': 0.5435, 'learning_rate': 1.92771795115024e-05, 'epoch': 0.3} {'loss': 0.653, 'learning_rate': 1.92770540918774e-05, 'epoch': 0.3} {'loss': 0.472, 'learning_rate': 1.927692866178037e-05, 'epoch': 0.3} {'loss': 0.5618, 'learning_rate': 1.927680322121145e-05, 'epoch': 0.3} {'loss': 0.6019, 'learning_rate': 1.9276677770170787e-05, 'epoch': 0.3} {'loss': 0.6109, 'learning_rate': 1.9276552308658514e-05, 'epoch': 0.3} {'loss': 0.5876, 'learning_rate': 1.9276426836674783e-05, 'epoch': 0.3} {'loss': 0.635, 'learning_rate': 1.9276301354219725e-05, 'epoch': 0.3} {'loss': 0.5843, 'learning_rate': 1.927617586129349e-05, 'epoch': 0.3} {'loss': 0.6089, 'learning_rate': 1.9276050357896218e-05, 'epoch': 0.3} {'loss': 0.7324, 'learning_rate': 1.9275924844028046e-05, 'epoch': 0.3} {'loss': 0.6948, 'learning_rate': 1.9275799319689116e-05, 'epoch': 0.3} {'loss': 0.6756, 'learning_rate': 1.927567378487958e-05, 'epoch': 0.3} {'loss': 0.7257, 'learning_rate': 1.9275548239599566e-05, 'epoch': 0.3} {'loss': 0.4704, 'learning_rate': 1.9275422683849223e-05, 'epoch': 0.3} {'loss': 0.7272, 'learning_rate': 1.9275297117628692e-05, 'epoch': 0.3} {'loss': 0.6316, 'learning_rate': 1.9275171540938115e-05, 'epoch': 0.3} {'loss': 0.6856, 'learning_rate': 1.9275045953777632e-05, 'epoch': 0.3} {'loss': 0.6051, 'learning_rate': 1.9274920356147385e-05, 'epoch': 0.3} {'loss': 0.5516, 'learning_rate': 1.927479474804752e-05, 'epoch': 0.3} {'loss': 0.4988, 'learning_rate': 1.9274669129478173e-05, 'epoch': 0.3} {'loss': 0.5027, 'learning_rate': 1.927454350043949e-05, 'epoch': 0.3} {'loss': 0.6794, 'learning_rate': 1.927441786093161e-05, 'epoch': 0.3} {'loss': 0.5205, 'learning_rate': 1.9274292210954674e-05, 'epoch': 0.3} {'loss': 0.4429, 'learning_rate': 1.9274166550508826e-05, 'epoch': 0.3} {'loss': 0.551, 'learning_rate': 1.927404087959421e-05, 'epoch': 0.3} {'loss': 0.6536, 'learning_rate': 1.9273915198210964e-05, 'epoch': 0.3} {'loss': 0.4991, 'learning_rate': 1.927378950635923e-05, 'epoch': 0.3} {'loss': 0.6524, 'learning_rate': 1.9273663804039154e-05, 'epoch': 0.3} {'loss': 0.6664, 'learning_rate': 1.9273538091250875e-05, 'epoch': 0.3} {'loss': 0.5937, 'learning_rate': 1.927341236799453e-05, 'epoch': 0.3} {'loss': 0.6214, 'learning_rate': 1.927328663427027e-05, 'epoch': 0.3} {'loss': 0.6314, 'learning_rate': 1.9273160890078234e-05, 'epoch': 0.3} {'loss': 0.7581, 'learning_rate': 1.927303513541856e-05, 'epoch': 0.3} {'loss': 0.6633, 'learning_rate': 1.9272909370291394e-05, 'epoch': 0.3} {'loss': 0.5128, 'learning_rate': 1.927278359469688e-05, 'epoch': 0.3} {'loss': 0.5819, 'learning_rate': 1.927265780863515e-05, 'epoch': 0.3} {'loss': 0.6759, 'learning_rate': 1.9272532012106354e-05, 'epoch': 0.3} {'loss': 0.7307, 'learning_rate': 1.9272406205110633e-05, 'epoch': 0.3} {'loss': 0.4404, 'learning_rate': 1.9272280387648132e-05, 'epoch': 0.3} {'loss': 0.6024, 'learning_rate': 1.9272154559718988e-05, 'epoch': 0.3} {'loss': 0.5236, 'learning_rate': 1.9272028721323345e-05, 'epoch': 0.3} {'loss': 0.6023, 'learning_rate': 1.927190287246134e-05, 'epoch': 0.3} {'loss': 0.6423, 'learning_rate': 1.9271777013133125e-05, 'epoch': 0.3} {'loss': 0.572, 'learning_rate': 1.9271651143338835e-05, 'epoch': 0.3} {'loss': 0.6822, 'learning_rate': 1.9271525263078613e-05, 'epoch': 0.3} {'loss': 0.616, 'learning_rate': 1.9271399372352608e-05, 'epoch': 0.3} {'loss': 0.6638, 'learning_rate': 1.927127347116095e-05, 'epoch': 0.3} {'loss': 0.5034, 'learning_rate': 1.927114755950379e-05, 'epoch': 0.3} {'loss': 0.6662, 'learning_rate': 1.9271021637381264e-05, 'epoch': 0.3} {'loss': 0.5428, 'learning_rate': 1.927089570479352e-05, 'epoch': 0.3} {'loss': 0.637, 'learning_rate': 1.9270769761740697e-05, 'epoch': 0.3} {'loss': 0.4884, 'learning_rate': 1.927064380822294e-05, 'epoch': 0.3} {'loss': 0.5576, 'learning_rate': 1.9270517844240386e-05, 'epoch': 0.3} {'loss': 0.5792, 'learning_rate': 1.927039186979318e-05, 'epoch': 0.3} {'loss': 0.5478, 'learning_rate': 1.927026588488147e-05, 'epoch': 0.3} {'loss': 0.5135, 'learning_rate': 1.9270139889505385e-05, 'epoch': 0.3} {'loss': 0.6696, 'learning_rate': 1.9270013883665078e-05, 'epoch': 0.3} {'loss': 0.5483, 'learning_rate': 1.926988786736069e-05, 'epoch': 0.3} {'loss': 0.6263, 'learning_rate': 1.926976184059236e-05, 'epoch': 0.3} {'loss': 0.788, 'learning_rate': 1.9269635803360232e-05, 'epoch': 0.3} {'loss': 0.482, 'learning_rate': 1.926950975566445e-05, 'epoch': 0.3} {'loss': 0.5932, 'learning_rate': 1.926938369750515e-05, 'epoch': 0.3} {'loss': 0.6748, 'learning_rate': 1.926925762888248e-05, 'epoch': 0.3} {'loss': 0.5609, 'learning_rate': 1.926913154979658e-05, 'epoch': 0.3} {'loss': 0.5734, 'learning_rate': 1.9269005460247595e-05, 'epoch': 0.3} {'loss': 0.5595, 'learning_rate': 1.9268879360235662e-05, 'epoch': 0.3} {'loss': 0.6161, 'learning_rate': 1.926875324976093e-05, 'epoch': 0.3} {'loss': 0.5763, 'learning_rate': 1.9268627128823538e-05, 'epoch': 0.3} {'loss': 0.5244, 'learning_rate': 1.9268500997423627e-05, 'epoch': 0.3} {'loss': 0.5878, 'learning_rate': 1.926837485556134e-05, 'epoch': 0.3} {'loss': 0.5198, 'learning_rate': 1.9268248703236823e-05, 'epoch': 0.3} {'loss': 0.5797, 'learning_rate': 1.9268122540450215e-05, 'epoch': 0.3} {'loss': 0.4848, 'learning_rate': 1.926799636720166e-05, 'epoch': 0.3} {'loss': 0.6769, 'learning_rate': 1.9267870183491294e-05, 'epoch': 0.3} {'loss': 0.6474, 'learning_rate': 1.9267743989319273e-05, 'epoch': 0.3} {'loss': 0.5564, 'learning_rate': 1.9267617784685727e-05, 'epoch': 0.3} {'loss': 0.6028, 'learning_rate': 1.9267491569590802e-05, 'epoch': 0.3} {'loss': 0.5489, 'learning_rate': 1.9267365344034645e-05, 'epoch': 0.3} {'loss': 0.6395, 'learning_rate': 1.926723910801739e-05, 'epoch': 0.3} {'loss': 0.5384, 'learning_rate': 1.9267112861539186e-05, 'epoch': 0.3} {'loss': 0.4614, 'learning_rate': 1.9266986604600177e-05, 'epoch': 0.3} {'loss': 0.6684, 'learning_rate': 1.9266860337200497e-05, 'epoch': 0.3} {'loss': 0.5522, 'learning_rate': 1.92667340593403e-05, 'epoch': 0.3} {'loss': 0.6333, 'learning_rate': 1.9266607771019715e-05, 'epoch': 0.3} {'loss': 0.7813, 'learning_rate': 1.9266481472238897e-05, 'epoch': 0.3} {'loss': 0.4358, 'learning_rate': 1.926635516299798e-05, 'epoch': 0.3} {'loss': 0.4818, 'learning_rate': 1.9266228843297114e-05, 'epoch': 0.3} {'loss': 0.643, 'learning_rate': 1.9266102513136436e-05, 'epoch': 0.3} {'loss': 0.7322, 'learning_rate': 1.926597617251609e-05, 'epoch': 0.3} {'loss': 0.403, 'learning_rate': 1.926584982143622e-05, 'epoch': 0.3} {'loss': 0.6645, 'learning_rate': 1.926572345989697e-05, 'epoch': 0.3} {'loss': 0.5106, 'learning_rate': 1.9265597087898475e-05, 'epoch': 0.3} {'loss': 0.6622, 'learning_rate': 1.9265470705440882e-05, 'epoch': 0.3} {'loss': 0.7222, 'learning_rate': 1.926534431252434e-05, 'epoch': 0.3} {'loss': 0.5584, 'learning_rate': 1.9265217909148983e-05, 'epoch': 0.3} {'loss': 0.5881, 'learning_rate': 1.9265091495314955e-05, 'epoch': 0.3} {'loss': 0.6217, 'learning_rate': 1.9264965071022405e-05, 'epoch': 0.3} {'loss': 0.4843, 'learning_rate': 1.926483863627147e-05, 'epoch': 0.3} {'loss': 0.5779, 'learning_rate': 1.9264712191062293e-05, 'epoch': 0.3} {'loss': 0.4143, 'learning_rate': 1.9264585735395015e-05, 'epoch': 0.3} {'loss': 0.5371, 'learning_rate': 1.9264459269269788e-05, 'epoch': 0.3} {'loss': 0.6569, 'learning_rate': 1.9264332792686743e-05, 'epoch': 0.3} {'loss': 0.5932, 'learning_rate': 1.926420630564603e-05, 'epoch': 0.3} {'loss': 0.623, 'learning_rate': 1.926407980814779e-05, 'epoch': 0.3} {'loss': 0.5636, 'learning_rate': 1.9263953300192165e-05, 'epoch': 0.3} {'loss': 0.6209, 'learning_rate': 1.92638267817793e-05, 'epoch': 0.3} {'loss': 0.6913, 'learning_rate': 1.926370025290933e-05, 'epoch': 0.3} {'loss': 0.7721, 'learning_rate': 1.926357371358241e-05, 'epoch': 0.3} {'loss': 0.5245, 'learning_rate': 1.9263447163798673e-05, 'epoch': 0.3} {'loss': 0.6004, 'learning_rate': 1.926332060355827e-05, 'epoch': 0.3} {'loss': 0.5961, 'learning_rate': 1.9263194032861337e-05, 'epoch': 0.3} {'loss': 0.5144, 'learning_rate': 1.926306745170802e-05, 'epoch': 0.3} {'loss': 0.4928, 'learning_rate': 1.9262940860098462e-05, 'epoch': 0.3} {'loss': 0.5106, 'learning_rate': 1.92628142580328e-05, 'epoch': 0.3} {'loss': 0.7471, 'learning_rate': 1.926268764551119e-05, 'epoch': 0.3} {'loss': 0.6487, 'learning_rate': 1.926256102253376e-05, 'epoch': 0.3} {'loss': 0.5455, 'learning_rate': 1.9262434389100664e-05, 'epoch': 0.3} {'loss': 0.4088, 'learning_rate': 1.926230774521204e-05, 'epoch': 0.3} {'loss': 0.472, 'learning_rate': 1.9262181090868032e-05, 'epoch': 0.3} {'loss': 0.5211, 'learning_rate': 1.9262054426068784e-05, 'epoch': 0.3} {'loss': 0.6658, 'learning_rate': 1.9261927750814436e-05, 'epoch': 0.3} {'loss': 0.5128, 'learning_rate': 1.9261801065105136e-05, 'epoch': 0.3} {'loss': 0.5564, 'learning_rate': 1.926167436894102e-05, 'epoch': 0.3} {'loss': 0.7259, 'learning_rate': 1.9261547662322235e-05, 'epoch': 0.3} {'loss': 0.6301, 'learning_rate': 1.9261420945248924e-05, 'epoch': 0.3} {'loss': 0.6598, 'learning_rate': 1.9261294217721235e-05, 'epoch': 0.3} {'loss': 0.5172, 'learning_rate': 1.92611674797393e-05, 'epoch': 0.3} {'loss': 0.6416, 'learning_rate': 1.926104073130327e-05, 'epoch': 0.3} {'loss': 0.5596, 'learning_rate': 1.9260913972413288e-05, 'epoch': 0.3} {'loss': 0.6412, 'learning_rate': 1.926078720306949e-05, 'epoch': 0.3} {'loss': 0.516, 'learning_rate': 1.9260660423272027e-05, 'epoch': 0.3} {'loss': 0.6157, 'learning_rate': 1.926053363302104e-05, 'epoch': 0.3} {'loss': 0.5571, 'learning_rate': 1.9260406832316674e-05, 'epoch': 0.3} {'loss': 0.669, 'learning_rate': 1.9260280021159067e-05, 'epoch': 0.3} {'loss': 0.6124, 'learning_rate': 1.9260153199548362e-05, 'epoch': 0.3} {'loss': 0.7614, 'learning_rate': 1.926002636748471e-05, 'epoch': 0.3} {'loss': 0.6259, 'learning_rate': 1.9259899524968248e-05, 'epoch': 0.3} {'loss': 0.5871, 'learning_rate': 1.9259772671999116e-05, 'epoch': 0.3} {'loss': 0.6758, 'learning_rate': 1.9259645808577466e-05, 'epoch': 0.3} {'loss': 0.6314, 'learning_rate': 1.9259518934703432e-05, 'epoch': 0.3} {'loss': 0.5473, 'learning_rate': 1.9259392050377168e-05, 'epoch': 0.3} {'loss': 0.7547, 'learning_rate': 1.925926515559881e-05, 'epoch': 0.3} {'loss': 0.5979, 'learning_rate': 1.92591382503685e-05, 'epoch': 0.3} {'loss': 0.4662, 'learning_rate': 1.925901133468638e-05, 'epoch': 0.3} {'loss': 0.5494, 'learning_rate': 1.9258884408552606e-05, 'epoch': 0.3} {'loss': 0.4954, 'learning_rate': 1.9258757471967305e-05, 'epoch': 0.3} {'loss': 0.5405, 'learning_rate': 1.925863052493063e-05, 'epoch': 0.3} {'loss': 0.6275, 'learning_rate': 1.925850356744272e-05, 'epoch': 0.3} {'loss': 0.5244, 'learning_rate': 1.9258376599503722e-05, 'epoch': 0.3} {'loss': 0.5162, 'learning_rate': 1.925824962111378e-05, 'epoch': 0.3} {'loss': 0.5228, 'learning_rate': 1.9258122632273027e-05, 'epoch': 0.3} {'loss': 0.4876, 'learning_rate': 1.925799563298162e-05, 'epoch': 0.3} {'loss': 0.6147, 'learning_rate': 1.9257868623239693e-05, 'epoch': 0.3} {'loss': 0.4587, 'learning_rate': 1.9257741603047396e-05, 'epoch': 0.3} {'loss': 0.8498, 'learning_rate': 1.925761457240487e-05, 'epoch': 0.3} {'loss': 0.6889, 'learning_rate': 1.9257487531312256e-05, 'epoch': 0.3} {'loss': 0.5479, 'learning_rate': 1.9257360479769697e-05, 'epoch': 0.3} {'loss': 0.4823, 'learning_rate': 1.925723341777734e-05, 'epoch': 0.3} {'loss': 0.4341, 'learning_rate': 1.9257106345335325e-05, 'epoch': 0.3} {'loss': 0.5749, 'learning_rate': 1.92569792624438e-05, 'epoch': 0.3} {'loss': 0.617, 'learning_rate': 1.9256852169102905e-05, 'epoch': 0.3} {'loss': 0.6986, 'learning_rate': 1.9256725065312786e-05, 'epoch': 0.3} {'loss': 0.6303, 'learning_rate': 1.925659795107358e-05, 'epoch': 0.3} {'loss': 0.5654, 'learning_rate': 1.9256470826385437e-05, 'epoch': 0.3} {'loss': 0.6378, 'learning_rate': 1.92563436912485e-05, 'epoch': 0.3} {'loss': 0.5662, 'learning_rate': 1.925621654566291e-05, 'epoch': 0.3} {'loss': 0.4906, 'learning_rate': 1.9256089389628813e-05, 'epoch': 0.3} {'loss': 0.6513, 'learning_rate': 1.925596222314635e-05, 'epoch': 0.3} {'loss': 0.5951, 'learning_rate': 1.9255835046215668e-05, 'epoch': 0.3} {'loss': 0.4879, 'learning_rate': 1.925570785883691e-05, 'epoch': 0.3} {'loss': 0.704, 'learning_rate': 1.925558066101021e-05, 'epoch': 0.3} {'loss': 0.593, 'learning_rate': 1.9255453452735722e-05, 'epoch': 0.3} {'loss': 0.6768, 'learning_rate': 1.925532623401359e-05, 'epoch': 0.3} {'loss': 0.5304, 'learning_rate': 1.9255199004843953e-05, 'epoch': 0.3} {'loss': 0.5583, 'learning_rate': 1.9255071765226958e-05, 'epoch': 0.3} {'loss': 0.4691, 'learning_rate': 1.9254944515162746e-05, 'epoch': 0.3} {'loss': 0.4814, 'learning_rate': 1.925481725465146e-05, 'epoch': 0.3} {'loss': 0.7554, 'learning_rate': 1.9254689983693247e-05, 'epoch': 0.3} {'loss': 0.549, 'learning_rate': 1.925456270228825e-05, 'epoch': 0.3} {'loss': 0.517, 'learning_rate': 1.9254435410436607e-05, 'epoch': 0.3} {'loss': 0.6963, 'learning_rate': 1.9254308108138472e-05, 'epoch': 0.3} {'loss': 0.6296, 'learning_rate': 1.9254180795393978e-05, 'epoch': 0.3} {'loss': 0.7557, 'learning_rate': 1.9254053472203274e-05, 'epoch': 0.3} {'loss': 0.3857, 'learning_rate': 1.9253926138566506e-05, 'epoch': 0.3} {'loss': 0.6611, 'learning_rate': 1.9253798794483812e-05, 'epoch': 0.3} {'loss': 0.5659, 'learning_rate': 1.9253671439955342e-05, 'epoch': 0.3} {'loss': 0.5365, 'learning_rate': 1.925354407498124e-05, 'epoch': 0.3} {'loss': 0.6374, 'learning_rate': 1.925341669956164e-05, 'epoch': 0.3} {'loss': 0.4119, 'learning_rate': 1.9253289313696694e-05, 'epoch': 0.3} {'loss': 0.395, 'learning_rate': 1.9253161917386546e-05, 'epoch': 0.3} {'loss': 0.7042, 'learning_rate': 1.9253034510631332e-05, 'epoch': 0.3} {'loss': 0.6793, 'learning_rate': 1.925290709343121e-05, 'epoch': 0.3} {'loss': 0.717, 'learning_rate': 1.9252779665786307e-05, 'epoch': 0.3} {'loss': 0.5682, 'learning_rate': 1.925265222769678e-05, 'epoch': 0.3} {'loss': 0.5852, 'learning_rate': 1.9252524779162767e-05, 'epoch': 0.3} {'loss': 0.5662, 'learning_rate': 1.9252397320184414e-05, 'epoch': 0.3} {'loss': 0.6555, 'learning_rate': 1.925226985076186e-05, 'epoch': 0.3} {'loss': 0.5841, 'learning_rate': 1.925214237089526e-05, 'epoch': 0.3} {'loss': 0.5724, 'learning_rate': 1.9252014880584745e-05, 'epoch': 0.3} {'loss': 0.5421, 'learning_rate': 1.9251887379830464e-05, 'epoch': 0.3} {'loss': 0.4913, 'learning_rate': 1.9251759868632564e-05, 'epoch': 0.3} {'loss': 0.4883, 'learning_rate': 1.925163234699119e-05, 'epoch': 0.3} {'loss': 0.469, 'learning_rate': 1.9251504814906473e-05, 'epoch': 0.3} {'loss': 0.4765, 'learning_rate': 1.9251377272378573e-05, 'epoch': 0.3} {'loss': 0.5626, 'learning_rate': 1.9251249719407624e-05, 'epoch': 0.3} {'loss': 0.6152, 'learning_rate': 1.9251122155993778e-05, 'epoch': 0.3} {'loss': 0.5415, 'learning_rate': 1.925099458213717e-05, 'epoch': 0.3} {'loss': 0.69, 'learning_rate': 1.925086699783795e-05, 'epoch': 0.3} {'loss': 0.5682, 'learning_rate': 1.9250739403096263e-05, 'epoch': 0.3} {'loss': 0.6545, 'learning_rate': 1.9250611797912245e-05, 'epoch': 0.3} {'loss': 0.5594, 'learning_rate': 1.9250484182286048e-05, 'epoch': 0.3} {'loss': 0.5536, 'learning_rate': 1.9250356556217813e-05, 'epoch': 0.3} {'loss': 0.5922, 'learning_rate': 1.9250228919707684e-05, 'epoch': 0.3} {'loss': 0.6394, 'learning_rate': 1.9250101272755807e-05, 'epoch': 0.3} {'loss': 0.4933, 'learning_rate': 1.924997361536232e-05, 'epoch': 0.3} {'loss': 0.5401, 'learning_rate': 1.9249845947527375e-05, 'epoch': 0.3} {'loss': 0.5518, 'learning_rate': 1.9249718269251115e-05, 'epoch': 0.3} {'loss': 0.8134, 'learning_rate': 1.924959058053368e-05, 'epoch': 0.3} {'loss': 0.6323, 'learning_rate': 1.924946288137522e-05, 'epoch': 0.3} {'loss': 0.588, 'learning_rate': 1.924933517177587e-05, 'epoch': 0.3} {'loss': 0.4926, 'learning_rate': 1.924920745173578e-05, 'epoch': 0.3} {'loss': 0.6855, 'learning_rate': 1.9249079721255095e-05, 'epoch': 0.3} {'loss': 0.5547, 'learning_rate': 1.924895198033396e-05, 'epoch': 0.3} {'loss': 0.5555, 'learning_rate': 1.9248824228972515e-05, 'epoch': 0.3} {'loss': 0.4621, 'learning_rate': 1.9248696467170905e-05, 'epoch': 0.3} {'loss': 0.6588, 'learning_rate': 1.9248568694929272e-05, 'epoch': 0.3} {'loss': 0.4707, 'learning_rate': 1.924844091224777e-05, 'epoch': 0.3} {'loss': 0.4682, 'learning_rate': 1.9248313119126533e-05, 'epoch': 0.3} {'loss': 0.479, 'learning_rate': 1.924818531556571e-05, 'epoch': 0.3} {'loss': 0.7983, 'learning_rate': 1.9248057501565446e-05, 'epoch': 0.3} {'loss': 0.5178, 'learning_rate': 1.9247929677125885e-05, 'epoch': 0.3} {'loss': 0.5902, 'learning_rate': 1.9247801842247165e-05, 'epoch': 0.3} {'loss': 0.6538, 'learning_rate': 1.924767399692944e-05, 'epoch': 0.3} {'loss': 0.5874, 'learning_rate': 1.9247546141172848e-05, 'epoch': 0.3} {'loss': 0.5193, 'learning_rate': 1.9247418274977534e-05, 'epoch': 0.3} {'loss': 0.5763, 'learning_rate': 1.9247290398343644e-05, 'epoch': 0.3} {'loss': 0.6169, 'learning_rate': 1.9247162511271323e-05, 'epoch': 0.3} {'loss': 0.6191, 'learning_rate': 1.924703461376071e-05, 'epoch': 0.3} {'loss': 0.5662, 'learning_rate': 1.9246906705811955e-05, 'epoch': 0.3} {'loss': 0.51, 'learning_rate': 1.9246778787425202e-05, 'epoch': 0.3} {'loss': 0.4624, 'learning_rate': 1.9246650858600595e-05, 'epoch': 0.3} {'loss': 0.519, 'learning_rate': 1.9246522919338275e-05, 'epoch': 0.3} {'loss': 0.5498, 'learning_rate': 1.924639496963839e-05, 'epoch': 0.3} {'loss': 0.6541, 'learning_rate': 1.9246267009501083e-05, 'epoch': 0.3} {'loss': 0.6381, 'learning_rate': 1.9246139038926502e-05, 'epoch': 0.3} {'loss': 0.5282, 'learning_rate': 1.9246011057914785e-05, 'epoch': 0.3} {'loss': 0.5751, 'learning_rate': 1.9245883066466077e-05, 'epoch': 0.3} {'loss': 0.5165, 'learning_rate': 1.9245755064580528e-05, 'epoch': 0.3} {'loss': 0.7769, 'learning_rate': 1.9245627052258282e-05, 'epoch': 0.3} {'loss': 0.6601, 'learning_rate': 1.924549902949948e-05, 'epoch': 0.3} {'loss': 0.6781, 'learning_rate': 1.9245370996304268e-05, 'epoch': 0.3} {'loss': 0.5395, 'learning_rate': 1.9245242952672787e-05, 'epoch': 0.3} {'loss': 0.6486, 'learning_rate': 1.9245114898605187e-05, 'epoch': 0.3} {'loss': 0.6543, 'learning_rate': 1.924498683410161e-05, 'epoch': 0.3} {'loss': 0.5292, 'learning_rate': 1.92448587591622e-05, 'epoch': 0.3} {'loss': 0.6666, 'learning_rate': 1.9244730673787107e-05, 'epoch': 0.3} {'loss': 0.6462, 'learning_rate': 1.9244602577976466e-05, 'epoch': 0.3} {'loss': 0.5824, 'learning_rate': 1.924447447173043e-05, 'epoch': 0.3} {'loss': 0.5684, 'learning_rate': 1.9244346355049134e-05, 'epoch': 0.3} {'loss': 0.5606, 'learning_rate': 1.9244218227932735e-05, 'epoch': 0.3} {'loss': 0.6858, 'learning_rate': 1.924409009038137e-05, 'epoch': 0.3} {'loss': 0.6186, 'learning_rate': 1.9243961942395187e-05, 'epoch': 0.3} {'loss': 0.5837, 'learning_rate': 1.9243833783974323e-05, 'epoch': 0.3} {'loss': 0.532, 'learning_rate': 1.9243705615118935e-05, 'epoch': 0.3} {'loss': 0.6315, 'learning_rate': 1.9243577435829158e-05, 'epoch': 0.3} {'loss': 0.6577, 'learning_rate': 1.9243449246105142e-05, 'epoch': 0.3} {'loss': 0.3459, 'learning_rate': 1.9243321045947024e-05, 'epoch': 0.3} {'loss': 0.7736, 'learning_rate': 1.924319283535496e-05, 'epoch': 0.3} {'loss': 0.6493, 'learning_rate': 1.9243064614329087e-05, 'epoch': 0.3} {'loss': 0.6119, 'learning_rate': 1.924293638286955e-05, 'epoch': 0.3} {'loss': 0.6721, 'learning_rate': 1.9242808140976498e-05, 'epoch': 0.3} {'loss': 0.4456, 'learning_rate': 1.9242679888650072e-05, 'epoch': 0.3} {'loss': 0.5182, 'learning_rate': 1.924255162589042e-05, 'epoch': 0.3} {'loss': 0.6346, 'learning_rate': 1.9242423352697682e-05, 'epoch': 0.3} {'loss': 0.6014, 'learning_rate': 1.9242295069072006e-05, 'epoch': 0.3} {'loss': 0.6548, 'learning_rate': 1.9242166775013538e-05, 'epoch': 0.3} {'loss': 0.5708, 'learning_rate': 1.924203847052242e-05, 'epoch': 0.3} {'loss': 0.5027, 'learning_rate': 1.9241910155598797e-05, 'epoch': 0.3} {'loss': 0.6402, 'learning_rate': 1.9241781830242817e-05, 'epoch': 0.3} {'loss': 0.6828, 'learning_rate': 1.924165349445462e-05, 'epoch': 0.3} {'loss': 0.6052, 'learning_rate': 1.9241525148234354e-05, 'epoch': 0.3} {'loss': 0.5893, 'learning_rate': 1.9241396791582167e-05, 'epoch': 0.3} {'loss': 0.6709, 'learning_rate': 1.92412684244982e-05, 'epoch': 0.3} {'loss': 0.5751, 'learning_rate': 1.9241140046982594e-05, 'epoch': 0.3} {'loss': 0.7228, 'learning_rate': 1.92410116590355e-05, 'epoch': 0.3} {'loss': 0.6115, 'learning_rate': 1.9240883260657063e-05, 'epoch': 0.3} {'loss': 0.5922, 'learning_rate': 1.9240754851847426e-05, 'epoch': 0.3} {'loss': 0.6358, 'learning_rate': 1.924062643260673e-05, 'epoch': 0.3} {'loss': 0.6029, 'learning_rate': 1.9240498002935126e-05, 'epoch': 0.3} {'loss': 0.6756, 'learning_rate': 1.9240369562832758e-05, 'epoch': 0.3} {'loss': 0.6067, 'learning_rate': 1.9240241112299772e-05, 'epoch': 0.3} {'loss': 0.5317, 'learning_rate': 1.9240112651336307e-05, 'epoch': 0.3} {'loss': 0.6229, 'learning_rate': 1.9239984179942512e-05, 'epoch': 0.3} {'loss': 0.587, 'learning_rate': 1.9239855698118533e-05, 'epoch': 0.3} {'loss': 0.4778, 'learning_rate': 1.9239727205864516e-05, 'epoch': 0.3} {'loss': 0.5191, 'learning_rate': 1.92395987031806e-05, 'epoch': 0.3} {'loss': 0.5251, 'learning_rate': 1.923947019006694e-05, 'epoch': 0.3} {'loss': 0.5629, 'learning_rate': 1.9239341666523666e-05, 'epoch': 0.3} {'loss': 0.5472, 'learning_rate': 1.9239213132550942e-05, 'epoch': 0.3} {'loss': 0.4695, 'learning_rate': 1.9239084588148897e-05, 'epoch': 0.3} {'loss': 0.6676, 'learning_rate': 1.9238956033317685e-05, 'epoch': 0.3} {'loss': 0.6649, 'learning_rate': 1.9238827468057447e-05, 'epoch': 0.3} {'loss': 0.6408, 'learning_rate': 1.923869889236833e-05, 'epoch': 0.3} {'loss': 0.6374, 'learning_rate': 1.9238570306250478e-05, 'epoch': 0.3} {'loss': 0.5583, 'learning_rate': 1.923844170970404e-05, 'epoch': 0.3} {'loss': 0.628, 'learning_rate': 1.9238313102729153e-05, 'epoch': 0.3} {'loss': 0.5241, 'learning_rate': 1.9238184485325973e-05, 'epoch': 0.3} {'loss': 0.5783, 'learning_rate': 1.9238055857494636e-05, 'epoch': 0.3} {'loss': 0.5426, 'learning_rate': 1.9237927219235293e-05, 'epoch': 0.3} {'loss': 0.5923, 'learning_rate': 1.9237798570548083e-05, 'epoch': 0.3} {'loss': 0.7073, 'learning_rate': 1.9237669911433156e-05, 'epoch': 0.3} {'loss': 0.502, 'learning_rate': 1.923754124189066e-05, 'epoch': 0.3} {'loss': 0.5567, 'learning_rate': 1.9237412561920735e-05, 'epoch': 0.3} {'loss': 0.4789, 'learning_rate': 1.9237283871523526e-05, 'epoch': 0.3} {'loss': 0.6602, 'learning_rate': 1.9237155170699178e-05, 'epoch': 0.3} {'loss': 0.5097, 'learning_rate': 1.9237026459447845e-05, 'epoch': 0.3} {'loss': 0.4984, 'learning_rate': 1.9236897737769662e-05, 'epoch': 0.3} {'loss': 0.5103, 'learning_rate': 1.9236769005664774e-05, 'epoch': 0.3} {'loss': 0.4681, 'learning_rate': 1.9236640263133337e-05, 'epoch': 0.3} {'loss': 0.4709, 'learning_rate': 1.9236511510175487e-05, 'epoch': 0.3} {'loss': 0.4947, 'learning_rate': 1.923638274679137e-05, 'epoch': 0.3} {'loss': 0.5327, 'learning_rate': 1.9236253972981135e-05, 'epoch': 0.3} {'loss': 0.4544, 'learning_rate': 1.9236125188744926e-05, 'epoch': 0.3} {'loss': 0.5152, 'learning_rate': 1.9235996394082888e-05, 'epoch': 0.3} {'loss': 0.5072, 'learning_rate': 1.9235867588995164e-05, 'epoch': 0.3} {'loss': 0.4692, 'learning_rate': 1.9235738773481905e-05, 'epoch': 0.3} {'loss': 0.5922, 'learning_rate': 1.9235609947543253e-05, 'epoch': 0.3} {'loss': 0.5225, 'learning_rate': 1.9235481111179353e-05, 'epoch': 0.3} {'loss': 0.4141, 'learning_rate': 1.923535226439035e-05, 'epoch': 0.3} {'loss': 0.5493, 'learning_rate': 1.923522340717639e-05, 'epoch': 0.3} {'loss': 0.6054, 'learning_rate': 1.923509453953762e-05, 'epoch': 0.3} {'loss': 0.6742, 'learning_rate': 1.9234965661474184e-05, 'epoch': 0.31} {'loss': 0.6464, 'learning_rate': 1.9234836772986228e-05, 'epoch': 0.31} {'loss': 0.4516, 'learning_rate': 1.9234707874073898e-05, 'epoch': 0.31} {'loss': 0.4465, 'learning_rate': 1.9234578964737337e-05, 'epoch': 0.31} {'loss': 0.5166, 'learning_rate': 1.9234450044976694e-05, 'epoch': 0.31} {'loss': 0.6018, 'learning_rate': 1.9234321114792115e-05, 'epoch': 0.31} {'loss': 0.6432, 'learning_rate': 1.9234192174183738e-05, 'epoch': 0.31} {'loss': 0.7062, 'learning_rate': 1.923406322315172e-05, 'epoch': 0.31} {'loss': 0.4885, 'learning_rate': 1.9233934261696198e-05, 'epoch': 0.31} {'loss': 0.609, 'learning_rate': 1.923380528981732e-05, 'epoch': 0.31} {'loss': 0.5858, 'learning_rate': 1.923367630751523e-05, 'epoch': 0.31} {'loss': 0.5951, 'learning_rate': 1.9233547314790074e-05, 'epoch': 0.31} {'loss': 0.5407, 'learning_rate': 1.9233418311642006e-05, 'epoch': 0.31} {'loss': 0.4241, 'learning_rate': 1.9233289298071156e-05, 'epoch': 0.31} {'loss': 0.5504, 'learning_rate': 1.9233160274077684e-05, 'epoch': 0.31} {'loss': 0.6642, 'learning_rate': 1.9233031239661727e-05, 'epoch': 0.31} {'loss': 0.6054, 'learning_rate': 1.9232902194823438e-05, 'epoch': 0.31} {'loss': 0.6403, 'learning_rate': 1.923277313956295e-05, 'epoch': 0.31} {'loss': 0.4703, 'learning_rate': 1.9232644073880426e-05, 'epoch': 0.31} {'loss': 0.5648, 'learning_rate': 1.9232514997775997e-05, 'epoch': 0.31} {'loss': 0.4813, 'learning_rate': 1.9232385911249816e-05, 'epoch': 0.31} {'loss': 0.5828, 'learning_rate': 1.9232256814302027e-05, 'epoch': 0.31} {'loss': 0.6332, 'learning_rate': 1.9232127706932772e-05, 'epoch': 0.31} {'loss': 0.6526, 'learning_rate': 1.9231998589142206e-05, 'epoch': 0.31} {'loss': 0.6321, 'learning_rate': 1.9231869460930464e-05, 'epoch': 0.31} {'loss': 0.548, 'learning_rate': 1.92317403222977e-05, 'epoch': 0.31} {'loss': 0.5535, 'learning_rate': 1.923161117324406e-05, 'epoch': 0.31} {'loss': 0.5816, 'learning_rate': 1.923148201376968e-05, 'epoch': 0.31} {'loss': 0.57, 'learning_rate': 1.9231352843874713e-05, 'epoch': 0.31} {'loss': 0.4651, 'learning_rate': 1.923122366355931e-05, 'epoch': 0.31} {'loss': 0.5748, 'learning_rate': 1.9231094472823603e-05, 'epoch': 0.31} {'loss': 0.731, 'learning_rate': 1.923096527166775e-05, 'epoch': 0.31} {'loss': 0.7885, 'learning_rate': 1.9230836060091893e-05, 'epoch': 0.31} {'loss': 0.6355, 'learning_rate': 1.9230706838096175e-05, 'epoch': 0.31} {'loss': 0.5388, 'learning_rate': 1.9230577605680744e-05, 'epoch': 0.31} {'loss': 0.5822, 'learning_rate': 1.923044836284575e-05, 'epoch': 0.31} {'loss': 0.7078, 'learning_rate': 1.9230319109591335e-05, 'epoch': 0.31} {'loss': 0.6649, 'learning_rate': 1.9230189845917643e-05, 'epoch': 0.31} {'loss': 0.748, 'learning_rate': 1.923006057182482e-05, 'epoch': 0.31} {'loss': 0.7154, 'learning_rate': 1.9229931287313015e-05, 'epoch': 0.31} {'loss': 0.7712, 'learning_rate': 1.9229801992382374e-05, 'epoch': 0.31} {'loss': 0.3731, 'learning_rate': 1.922967268703304e-05, 'epoch': 0.31} {'loss': 0.777, 'learning_rate': 1.922954337126516e-05, 'epoch': 0.31} {'loss': 0.4235, 'learning_rate': 1.9229414045078884e-05, 'epoch': 0.31} {'loss': 0.5566, 'learning_rate': 1.922928470847435e-05, 'epoch': 0.31} {'loss': 0.6133, 'learning_rate': 1.9229155361451712e-05, 'epoch': 0.31} {'loss': 0.5207, 'learning_rate': 1.9229026004011114e-05, 'epoch': 0.31} {'loss': 0.7347, 'learning_rate': 1.9228896636152698e-05, 'epoch': 0.31} {'loss': 0.5185, 'learning_rate': 1.9228767257876614e-05, 'epoch': 0.31} {'loss': 0.6112, 'learning_rate': 1.9228637869183003e-05, 'epoch': 0.31} {'loss': 0.507, 'learning_rate': 1.922850847007202e-05, 'epoch': 0.31} {'loss': 0.4526, 'learning_rate': 1.9228379060543804e-05, 'epoch': 0.31} {'loss': 0.4839, 'learning_rate': 1.9228249640598503e-05, 'epoch': 0.31} {'loss': 0.5574, 'learning_rate': 1.9228120210236262e-05, 'epoch': 0.31} {'loss': 0.6027, 'learning_rate': 1.9227990769457227e-05, 'epoch': 0.31} {'loss': 0.543, 'learning_rate': 1.922786131826155e-05, 'epoch': 0.31} {'loss': 0.5216, 'learning_rate': 1.9227731856649367e-05, 'epoch': 0.31} {'loss': 0.8119, 'learning_rate': 1.922760238462083e-05, 'epoch': 0.31} {'loss': 0.5073, 'learning_rate': 1.9227472902176085e-05, 'epoch': 0.31} {'loss': 0.5423, 'learning_rate': 1.922734340931528e-05, 'epoch': 0.31} {'loss': 0.511, 'learning_rate': 1.9227213906038557e-05, 'epoch': 0.31} {'loss': 0.5931, 'learning_rate': 1.9227084392346068e-05, 'epoch': 0.31} {'loss': 0.4447, 'learning_rate': 1.922695486823795e-05, 'epoch': 0.31} {'loss': 0.5795, 'learning_rate': 1.9226825333714358e-05, 'epoch': 0.31} {'loss': 0.5206, 'learning_rate': 1.9226695788775434e-05, 'epoch': 0.31} {'loss': 0.6561, 'learning_rate': 1.9226566233421325e-05, 'epoch': 0.31} {'loss': 0.6247, 'learning_rate': 1.9226436667652177e-05, 'epoch': 0.31} {'loss': 0.4082, 'learning_rate': 1.9226307091468135e-05, 'epoch': 0.31} {'loss': 0.5122, 'learning_rate': 1.922617750486935e-05, 'epoch': 0.31} {'loss': 0.421, 'learning_rate': 1.922604790785596e-05, 'epoch': 0.31} {'loss': 0.5299, 'learning_rate': 1.922591830042812e-05, 'epoch': 0.31} {'loss': 0.5916, 'learning_rate': 1.922578868258597e-05, 'epoch': 0.31} {'loss': 0.5069, 'learning_rate': 1.9225659054329665e-05, 'epoch': 0.31} {'loss': 0.7591, 'learning_rate': 1.922552941565934e-05, 'epoch': 0.31} {'loss': 0.575, 'learning_rate': 1.922539976657515e-05, 'epoch': 0.31} {'loss': 0.5546, 'learning_rate': 1.9225270107077235e-05, 'epoch': 0.31} {'loss': 0.5996, 'learning_rate': 1.9225140437165745e-05, 'epoch': 0.31} {'loss': 0.6156, 'learning_rate': 1.9225010756840825e-05, 'epoch': 0.31} {'loss': 0.6764, 'learning_rate': 1.922488106610262e-05, 'epoch': 0.31} {'loss': 0.5173, 'learning_rate': 1.9224751364951283e-05, 'epoch': 0.31} {'loss': 0.5433, 'learning_rate': 1.9224621653386958e-05, 'epoch': 0.31} {'loss': 0.5603, 'learning_rate': 1.9224491931409783e-05, 'epoch': 0.31} {'loss': 0.6003, 'learning_rate': 1.9224362199019913e-05, 'epoch': 0.31} {'loss': 0.584, 'learning_rate': 1.922423245621749e-05, 'epoch': 0.31} {'loss': 0.6345, 'learning_rate': 1.922410270300267e-05, 'epoch': 0.31} {'loss': 0.7011, 'learning_rate': 1.9223972939375586e-05, 'epoch': 0.31} {'loss': 0.6355, 'learning_rate': 1.922384316533639e-05, 'epoch': 0.31} {'loss': 0.4954, 'learning_rate': 1.922371338088523e-05, 'epoch': 0.31} {'loss': 0.5096, 'learning_rate': 1.9223583586022255e-05, 'epoch': 0.31} {'loss': 0.5873, 'learning_rate': 1.9223453780747603e-05, 'epoch': 0.31} {'loss': 0.5791, 'learning_rate': 1.9223323965061428e-05, 'epoch': 0.31} {'loss': 0.589, 'learning_rate': 1.9223194138963876e-05, 'epoch': 0.31} {'loss': 0.6423, 'learning_rate': 1.922306430245509e-05, 'epoch': 0.31} {'loss': 0.5332, 'learning_rate': 1.9222934455535215e-05, 'epoch': 0.31} {'loss': 0.5349, 'learning_rate': 1.9222804598204404e-05, 'epoch': 0.31} {'loss': 0.7041, 'learning_rate': 1.9222674730462803e-05, 'epoch': 0.31} {'loss': 0.6381, 'learning_rate': 1.9222544852310553e-05, 'epoch': 0.31} {'loss': 0.6295, 'learning_rate': 1.92224149637478e-05, 'epoch': 0.31} {'loss': 0.4852, 'learning_rate': 1.9222285064774703e-05, 'epoch': 0.31} {'loss': 0.5247, 'learning_rate': 1.9222155155391393e-05, 'epoch': 0.31} {'loss': 0.5582, 'learning_rate': 1.9222025235598028e-05, 'epoch': 0.31} {'loss': 0.7018, 'learning_rate': 1.9221895305394747e-05, 'epoch': 0.31} {'loss': 0.6632, 'learning_rate': 1.92217653647817e-05, 'epoch': 0.31} {'loss': 0.5662, 'learning_rate': 1.922163541375903e-05, 'epoch': 0.31} {'loss': 0.5184, 'learning_rate': 1.9221505452326892e-05, 'epoch': 0.31} {'loss': 0.7381, 'learning_rate': 1.922137548048543e-05, 'epoch': 0.31} {'loss': 0.5778, 'learning_rate': 1.9221245498234786e-05, 'epoch': 0.31} {'loss': 0.5682, 'learning_rate': 1.9221115505575107e-05, 'epoch': 0.31} {'loss': 0.6012, 'learning_rate': 1.9220985502506545e-05, 'epoch': 0.31} {'loss': 0.5901, 'learning_rate': 1.9220855489029242e-05, 'epoch': 0.31} {'loss': 0.5112, 'learning_rate': 1.9220725465143348e-05, 'epoch': 0.31} {'loss': 0.5593, 'learning_rate': 1.9220595430849007e-05, 'epoch': 0.31} {'loss': 0.6233, 'learning_rate': 1.922046538614637e-05, 'epoch': 0.31} {'loss': 0.5313, 'learning_rate': 1.922033533103558e-05, 'epoch': 0.31} {'loss': 0.5867, 'learning_rate': 1.9220205265516782e-05, 'epoch': 0.31} {'loss': 0.676, 'learning_rate': 1.9220075189590125e-05, 'epoch': 0.31} {'loss': 0.6577, 'learning_rate': 1.921994510325576e-05, 'epoch': 0.31} {'loss': 0.5885, 'learning_rate': 1.921981500651383e-05, 'epoch': 0.31} {'loss': 0.5987, 'learning_rate': 1.921968489936448e-05, 'epoch': 0.31} {'loss': 0.6809, 'learning_rate': 1.921955478180786e-05, 'epoch': 0.31} {'loss': 0.5649, 'learning_rate': 1.9219424653844115e-05, 'epoch': 0.31} {'loss': 0.7208, 'learning_rate': 1.9219294515473394e-05, 'epoch': 0.31} {'loss': 0.5555, 'learning_rate': 1.9219164366695842e-05, 'epoch': 0.31} {'loss': 0.6163, 'learning_rate': 1.9219034207511606e-05, 'epoch': 0.31} {'loss': 0.4698, 'learning_rate': 1.9218904037920832e-05, 'epoch': 0.31} {'loss': 0.5821, 'learning_rate': 1.9218773857923673e-05, 'epoch': 0.31} {'loss': 0.6039, 'learning_rate': 1.921864366752027e-05, 'epoch': 0.31} {'loss': 0.5853, 'learning_rate': 1.9218513466710768e-05, 'epoch': 0.31} {'loss': 0.6923, 'learning_rate': 1.921838325549532e-05, 'epoch': 0.31} {'loss': 0.5778, 'learning_rate': 1.921825303387407e-05, 'epoch': 0.31} {'loss': 0.4616, 'learning_rate': 1.9218122801847167e-05, 'epoch': 0.31} {'loss': 0.5935, 'learning_rate': 1.9217992559414754e-05, 'epoch': 0.31} {'loss': 0.7133, 'learning_rate': 1.921786230657698e-05, 'epoch': 0.31} {'loss': 0.4754, 'learning_rate': 1.9217732043333994e-05, 'epoch': 0.31} {'loss': 0.5738, 'learning_rate': 1.9217601769685937e-05, 'epoch': 0.31} {'loss': 0.7426, 'learning_rate': 1.9217471485632965e-05, 'epoch': 0.31} {'loss': 0.6184, 'learning_rate': 1.9217341191175216e-05, 'epoch': 0.31} {'loss': 0.5911, 'learning_rate': 1.9217210886312843e-05, 'epoch': 0.31} {'loss': 0.6106, 'learning_rate': 1.9217080571045996e-05, 'epoch': 0.31} {'loss': 0.7137, 'learning_rate': 1.9216950245374815e-05, 'epoch': 0.31} {'loss': 0.7935, 'learning_rate': 1.9216819909299448e-05, 'epoch': 0.31} {'loss': 0.4694, 'learning_rate': 1.921668956282005e-05, 'epoch': 0.31} {'loss': 0.5744, 'learning_rate': 1.9216559205936755e-05, 'epoch': 0.31} {'loss': 0.6443, 'learning_rate': 1.921642883864972e-05, 'epoch': 0.31} {'loss': 0.3536, 'learning_rate': 1.921629846095909e-05, 'epoch': 0.31} {'loss': 0.5502, 'learning_rate': 1.921616807286501e-05, 'epoch': 0.31} {'loss': 0.592, 'learning_rate': 1.921603767436763e-05, 'epoch': 0.31} {'loss': 0.4012, 'learning_rate': 1.9215907265467098e-05, 'epoch': 0.31} {'loss': 0.6705, 'learning_rate': 1.9215776846163557e-05, 'epoch': 0.31} {'loss': 0.5482, 'learning_rate': 1.9215646416457154e-05, 'epoch': 0.31} {'loss': 0.7044, 'learning_rate': 1.9215515976348045e-05, 'epoch': 0.31} {'loss': 0.5617, 'learning_rate': 1.9215385525836364e-05, 'epoch': 0.31} {'loss': 0.6147, 'learning_rate': 1.921525506492227e-05, 'epoch': 0.31} {'loss': 0.5094, 'learning_rate': 1.92151245936059e-05, 'epoch': 0.31} {'loss': 0.4787, 'learning_rate': 1.9214994111887413e-05, 'epoch': 0.31} {'loss': 0.5479, 'learning_rate': 1.9214863619766947e-05, 'epoch': 0.31} {'loss': 0.5716, 'learning_rate': 1.921473311724465e-05, 'epoch': 0.31} {'loss': 0.6206, 'learning_rate': 1.9214602604320677e-05, 'epoch': 0.31} {'loss': 0.6365, 'learning_rate': 1.9214472080995165e-05, 'epoch': 0.31} {'loss': 0.6536, 'learning_rate': 1.921434154726827e-05, 'epoch': 0.31} {'loss': 0.5893, 'learning_rate': 1.9214211003140134e-05, 'epoch': 0.31} {'loss': 0.7755, 'learning_rate': 1.9214080448610907e-05, 'epoch': 0.31} {'loss': 0.4736, 'learning_rate': 1.9213949883680732e-05, 'epoch': 0.31} {'loss': 0.5156, 'learning_rate': 1.9213819308349762e-05, 'epoch': 0.31} {'loss': 0.5258, 'learning_rate': 1.921368872261814e-05, 'epoch': 0.31} {'loss': 0.6189, 'learning_rate': 1.9213558126486017e-05, 'epoch': 0.31} {'loss': 0.5819, 'learning_rate': 1.921342751995354e-05, 'epoch': 0.31} {'loss': 0.4756, 'learning_rate': 1.9213296903020856e-05, 'epoch': 0.31} {'loss': 0.6251, 'learning_rate': 1.9213166275688107e-05, 'epoch': 0.31} {'loss': 0.5452, 'learning_rate': 1.921303563795545e-05, 'epoch': 0.31} {'loss': 0.4608, 'learning_rate': 1.921290498982303e-05, 'epoch': 0.31} {'loss': 0.6376, 'learning_rate': 1.9212774331290983e-05, 'epoch': 0.31} {'loss': 0.5799, 'learning_rate': 1.9212643662359474e-05, 'epoch': 0.31} {'loss': 0.6428, 'learning_rate': 1.9212512983028636e-05, 'epoch': 0.31} {'loss': 0.5166, 'learning_rate': 1.921238229329863e-05, 'epoch': 0.31} {'loss': 0.6663, 'learning_rate': 1.9212251593169592e-05, 'epoch': 0.31} {'loss': 0.5887, 'learning_rate': 1.921212088264167e-05, 'epoch': 0.31} {'loss': 0.4489, 'learning_rate': 1.9211990161715023e-05, 'epoch': 0.31} {'loss': 0.5679, 'learning_rate': 1.9211859430389786e-05, 'epoch': 0.31} {'loss': 0.6512, 'learning_rate': 1.9211728688666112e-05, 'epoch': 0.31} {'loss': 0.4734, 'learning_rate': 1.921159793654415e-05, 'epoch': 0.31} {'loss': 0.5799, 'learning_rate': 1.921146717402404e-05, 'epoch': 0.31} {'loss': 0.573, 'learning_rate': 1.9211336401105942e-05, 'epoch': 0.31} {'loss': 0.6931, 'learning_rate': 1.9211205617789992e-05, 'epoch': 0.31} {'loss': 0.6545, 'learning_rate': 1.9211074824076347e-05, 'epoch': 0.31} {'loss': 0.5809, 'learning_rate': 1.9210944019965146e-05, 'epoch': 0.31} {'loss': 0.6645, 'learning_rate': 1.9210813205456543e-05, 'epoch': 0.31} {'loss': 0.4681, 'learning_rate': 1.9210682380550683e-05, 'epoch': 0.31} {'loss': 0.5983, 'learning_rate': 1.9210551545247713e-05, 'epoch': 0.31} {'loss': 0.7119, 'learning_rate': 1.9210420699547784e-05, 'epoch': 0.31} {'loss': 0.6027, 'learning_rate': 1.921028984345104e-05, 'epoch': 0.31} {'loss': 0.4364, 'learning_rate': 1.921015897695763e-05, 'epoch': 0.31} {'loss': 0.5536, 'learning_rate': 1.92100281000677e-05, 'epoch': 0.31} {'loss': 0.3905, 'learning_rate': 1.9209897212781404e-05, 'epoch': 0.31} {'loss': 0.6635, 'learning_rate': 1.9209766315098883e-05, 'epoch': 0.31} {'loss': 0.538, 'learning_rate': 1.9209635407020286e-05, 'epoch': 0.31} {'loss': 0.5253, 'learning_rate': 1.9209504488545762e-05, 'epoch': 0.31} {'loss': 0.4291, 'learning_rate': 1.920937355967546e-05, 'epoch': 0.31} {'loss': 0.5446, 'learning_rate': 1.9209242620409527e-05, 'epoch': 0.31} {'loss': 0.5343, 'learning_rate': 1.920911167074811e-05, 'epoch': 0.31} {'loss': 0.588, 'learning_rate': 1.920898071069136e-05, 'epoch': 0.31} {'loss': 0.4746, 'learning_rate': 1.920884974023942e-05, 'epoch': 0.31} {'loss': 0.5553, 'learning_rate': 1.9208718759392434e-05, 'epoch': 0.31} {'loss': 0.3229, 'learning_rate': 1.920858776815056e-05, 'epoch': 0.31} {'loss': 0.5225, 'learning_rate': 1.920845676651394e-05, 'epoch': 0.31} {'loss': 0.5399, 'learning_rate': 1.9208325754482725e-05, 'epoch': 0.31} {'loss': 0.631, 'learning_rate': 1.9208194732057065e-05, 'epoch': 0.31} {'loss': 0.546, 'learning_rate': 1.9208063699237098e-05, 'epoch': 0.31} {'loss': 0.5092, 'learning_rate': 1.9207932656022983e-05, 'epoch': 0.31} {'loss': 0.6104, 'learning_rate': 1.920780160241486e-05, 'epoch': 0.31} {'loss': 0.6115, 'learning_rate': 1.920767053841288e-05, 'epoch': 0.31} {'loss': 0.5702, 'learning_rate': 1.9207539464017193e-05, 'epoch': 0.31} {'loss': 0.6108, 'learning_rate': 1.9207408379227943e-05, 'epoch': 0.31} {'loss': 0.6175, 'learning_rate': 1.9207277284045277e-05, 'epoch': 0.31} {'loss': 0.5586, 'learning_rate': 1.920714617846935e-05, 'epoch': 0.31} {'loss': 0.7572, 'learning_rate': 1.9207015062500307e-05, 'epoch': 0.31} {'loss': 0.5555, 'learning_rate': 1.920688393613829e-05, 'epoch': 0.31} {'loss': 0.528, 'learning_rate': 1.9206752799383454e-05, 'epoch': 0.31} {'loss': 0.5008, 'learning_rate': 1.9206621652235946e-05, 'epoch': 0.31} {'loss': 0.8413, 'learning_rate': 1.9206490494695914e-05, 'epoch': 0.31} {'loss': 0.6014, 'learning_rate': 1.92063593267635e-05, 'epoch': 0.31} {'loss': 0.5554, 'learning_rate': 1.920622814843886e-05, 'epoch': 0.31} {'loss': 0.6899, 'learning_rate': 1.920609695972214e-05, 'epoch': 0.31} {'loss': 0.525, 'learning_rate': 1.920596576061349e-05, 'epoch': 0.31} {'loss': 0.7336, 'learning_rate': 1.9205834551113047e-05, 'epoch': 0.31} {'loss': 0.4543, 'learning_rate': 1.920570333122097e-05, 'epoch': 0.31} {'loss': 0.5276, 'learning_rate': 1.9205572100937408e-05, 'epoch': 0.31} {'loss': 0.6448, 'learning_rate': 1.9205440860262504e-05, 'epoch': 0.31} {'loss': 0.6457, 'learning_rate': 1.9205309609196408e-05, 'epoch': 0.31} {'loss': 0.6275, 'learning_rate': 1.920517834773927e-05, 'epoch': 0.31} {'loss': 0.387, 'learning_rate': 1.920504707589123e-05, 'epoch': 0.31} {'loss': 0.5029, 'learning_rate': 1.9204915793652447e-05, 'epoch': 0.31} {'loss': 0.6274, 'learning_rate': 1.9204784501023064e-05, 'epoch': 0.31} {'loss': 0.4599, 'learning_rate': 1.9204653198003225e-05, 'epoch': 0.31} {'loss': 0.6047, 'learning_rate': 1.9204521884593088e-05, 'epoch': 0.31} {'loss': 0.5851, 'learning_rate': 1.9204390560792797e-05, 'epoch': 0.31} {'loss': 0.5237, 'learning_rate': 1.9204259226602496e-05, 'epoch': 0.31} {'loss': 0.7143, 'learning_rate': 1.920412788202234e-05, 'epoch': 0.31} {'loss': 0.4059, 'learning_rate': 1.9203996527052472e-05, 'epoch': 0.31} {'loss': 0.5978, 'learning_rate': 1.9203865161693042e-05, 'epoch': 0.31} {'loss': 0.4932, 'learning_rate': 1.9203733785944197e-05, 'epoch': 0.31} {'loss': 0.5362, 'learning_rate': 1.9203602399806086e-05, 'epoch': 0.31} {'loss': 0.5739, 'learning_rate': 1.9203471003278862e-05, 'epoch': 0.31} {'loss': 0.5753, 'learning_rate': 1.9203339596362667e-05, 'epoch': 0.31} {'loss': 0.5842, 'learning_rate': 1.9203208179057654e-05, 'epoch': 0.31} {'loss': 0.5403, 'learning_rate': 1.9203076751363964e-05, 'epoch': 0.31} {'loss': 0.4904, 'learning_rate': 1.9202945313281754e-05, 'epoch': 0.31} {'loss': 0.6758, 'learning_rate': 1.920281386481117e-05, 'epoch': 0.31} {'loss': 0.5889, 'learning_rate': 1.9202682405952357e-05, 'epoch': 0.31} {'loss': 0.5723, 'learning_rate': 1.9202550936705467e-05, 'epoch': 0.31} {'loss': 0.392, 'learning_rate': 1.9202419457070643e-05, 'epoch': 0.31} {'loss': 0.4431, 'learning_rate': 1.9202287967048045e-05, 'epoch': 0.31} {'loss': 0.4981, 'learning_rate': 1.9202156466637806e-05, 'epoch': 0.31} {'loss': 0.5702, 'learning_rate': 1.9202024955840085e-05, 'epoch': 0.31} {'loss': 0.4131, 'learning_rate': 1.920189343465503e-05, 'epoch': 0.31} {'loss': 0.6198, 'learning_rate': 1.9201761903082784e-05, 'epoch': 0.31} {'loss': 0.5709, 'learning_rate': 1.9201630361123496e-05, 'epoch': 0.31} {'loss': 0.4407, 'learning_rate': 1.9201498808777324e-05, 'epoch': 0.31} {'loss': 0.536, 'learning_rate': 1.9201367246044408e-05, 'epoch': 0.31} {'loss': 0.5669, 'learning_rate': 1.9201235672924895e-05, 'epoch': 0.31} {'loss': 0.622, 'learning_rate': 1.920110408941894e-05, 'epoch': 0.31} {'loss': 0.5709, 'learning_rate': 1.9200972495526686e-05, 'epoch': 0.31} {'loss': 0.5968, 'learning_rate': 1.920084089124828e-05, 'epoch': 0.31} {'loss': 0.5208, 'learning_rate': 1.920070927658388e-05, 'epoch': 0.31} {'loss': 0.6143, 'learning_rate': 1.920057765153363e-05, 'epoch': 0.31} {'loss': 0.6455, 'learning_rate': 1.9200446016097674e-05, 'epoch': 0.31} {'loss': 0.5365, 'learning_rate': 1.920031437027616e-05, 'epoch': 0.31} {'loss': 0.6486, 'learning_rate': 1.920018271406925e-05, 'epoch': 0.31} {'loss': 0.4775, 'learning_rate': 1.9200051047477076e-05, 'epoch': 0.31} {'loss': 0.6239, 'learning_rate': 1.9199919370499795e-05, 'epoch': 0.31} {'loss': 0.5669, 'learning_rate': 1.9199787683137557e-05, 'epoch': 0.31} {'loss': 0.6431, 'learning_rate': 1.9199655985390506e-05, 'epoch': 0.31} {'loss': 0.5119, 'learning_rate': 1.9199524277258794e-05, 'epoch': 0.31} {'loss': 0.6397, 'learning_rate': 1.919939255874257e-05, 'epoch': 0.31} {'loss': 0.507, 'learning_rate': 1.9199260829841978e-05, 'epoch': 0.31} {'loss': 0.6498, 'learning_rate': 1.919912909055717e-05, 'epoch': 0.31} {'loss': 0.5837, 'learning_rate': 1.9198997340888293e-05, 'epoch': 0.31} {'loss': 0.3805, 'learning_rate': 1.91988655808355e-05, 'epoch': 0.31} {'loss': 0.4276, 'learning_rate': 1.9198733810398938e-05, 'epoch': 0.31} {'loss': 0.5631, 'learning_rate': 1.9198602029578755e-05, 'epoch': 0.31} {'loss': 0.5792, 'learning_rate': 1.91984702383751e-05, 'epoch': 0.31} {'loss': 0.6784, 'learning_rate': 1.9198338436788114e-05, 'epoch': 0.31} {'loss': 0.5651, 'learning_rate': 1.919820662481796e-05, 'epoch': 0.31} {'loss': 0.7238, 'learning_rate': 1.9198074802464778e-05, 'epoch': 0.31} {'loss': 0.6311, 'learning_rate': 1.919794296972872e-05, 'epoch': 0.31} {'loss': 0.6456, 'learning_rate': 1.9197811126609932e-05, 'epoch': 0.31} {'loss': 0.6169, 'learning_rate': 1.9197679273108566e-05, 'epoch': 0.31} {'loss': 0.6183, 'learning_rate': 1.9197547409224767e-05, 'epoch': 0.31} {'loss': 0.6476, 'learning_rate': 1.9197415534958685e-05, 'epoch': 0.31} {'loss': 0.5376, 'learning_rate': 1.9197283650310474e-05, 'epoch': 0.31} {'loss': 0.5843, 'learning_rate': 1.9197151755280274e-05, 'epoch': 0.31} {'loss': 0.4689, 'learning_rate': 1.9197019849868242e-05, 'epoch': 0.31} {'loss': 0.686, 'learning_rate': 1.919688793407452e-05, 'epoch': 0.31} {'loss': 0.6182, 'learning_rate': 1.9196756007899265e-05, 'epoch': 0.31} {'loss': 0.5545, 'learning_rate': 1.9196624071342618e-05, 'epoch': 0.31} {'loss': 0.5642, 'learning_rate': 1.919649212440473e-05, 'epoch': 0.31} {'loss': 0.3631, 'learning_rate': 1.919636016708576e-05, 'epoch': 0.31} {'loss': 0.6793, 'learning_rate': 1.9196228199385838e-05, 'epoch': 0.31} {'loss': 0.4742, 'learning_rate': 1.9196096221305125e-05, 'epoch': 0.31} {'loss': 0.6271, 'learning_rate': 1.9195964232843772e-05, 'epoch': 0.31} {'loss': 0.6042, 'learning_rate': 1.919583223400192e-05, 'epoch': 0.31} {'loss': 0.6244, 'learning_rate': 1.919570022477972e-05, 'epoch': 0.31} {'loss': 0.5692, 'learning_rate': 1.919556820517733e-05, 'epoch': 0.31} {'loss': 0.7444, 'learning_rate': 1.9195436175194892e-05, 'epoch': 0.31} {'loss': 0.6413, 'learning_rate': 1.919530413483255e-05, 'epoch': 0.31} {'loss': 0.5141, 'learning_rate': 1.9195172084090462e-05, 'epoch': 0.31} {'loss': 0.5829, 'learning_rate': 1.919504002296877e-05, 'epoch': 0.31} {'loss': 0.6629, 'learning_rate': 1.919490795146763e-05, 'epoch': 0.31} {'loss': 0.7023, 'learning_rate': 1.9194775869587184e-05, 'epoch': 0.31} {'loss': 0.7244, 'learning_rate': 1.9194643777327586e-05, 'epoch': 0.31} {'loss': 0.4779, 'learning_rate': 1.9194511674688984e-05, 'epoch': 0.31} {'loss': 0.7638, 'learning_rate': 1.9194379561671525e-05, 'epoch': 0.31} {'loss': 0.7118, 'learning_rate': 1.919424743827536e-05, 'epoch': 0.31} {'loss': 0.7139, 'learning_rate': 1.919411530450064e-05, 'epoch': 0.31} {'loss': 0.5108, 'learning_rate': 1.919398316034751e-05, 'epoch': 0.31} {'loss': 0.5548, 'learning_rate': 1.9193851005816127e-05, 'epoch': 0.31} {'loss': 0.6773, 'learning_rate': 1.9193718840906627e-05, 'epoch': 0.31} {'loss': 0.4018, 'learning_rate': 1.919358666561917e-05, 'epoch': 0.31} {'loss': 0.5742, 'learning_rate': 1.9193454479953902e-05, 'epoch': 0.31} {'loss': 0.7356, 'learning_rate': 1.919332228391097e-05, 'epoch': 0.31} {'loss': 0.5324, 'learning_rate': 1.919319007749053e-05, 'epoch': 0.31} {'loss': 0.4851, 'learning_rate': 1.9193057860692722e-05, 'epoch': 0.31} {'loss': 0.6463, 'learning_rate': 1.9192925633517702e-05, 'epoch': 0.31} {'loss': 0.4331, 'learning_rate': 1.9192793395965617e-05, 'epoch': 0.31} {'loss': 0.5728, 'learning_rate': 1.919266114803662e-05, 'epoch': 0.31} {'loss': 0.5571, 'learning_rate': 1.9192528889730848e-05, 'epoch': 0.31} {'loss': 0.5386, 'learning_rate': 1.9192396621048462e-05, 'epoch': 0.31} {'loss': 0.3359, 'learning_rate': 1.9192264341989614e-05, 'epoch': 0.31} {'loss': 0.6881, 'learning_rate': 1.9192132052554443e-05, 'epoch': 0.31} {'loss': 0.5539, 'learning_rate': 1.9191999752743102e-05, 'epoch': 0.31} {'loss': 0.5154, 'learning_rate': 1.9191867442555743e-05, 'epoch': 0.31} {'loss': 0.5407, 'learning_rate': 1.919173512199251e-05, 'epoch': 0.31} {'loss': 0.607, 'learning_rate': 1.919160279105356e-05, 'epoch': 0.31} {'loss': 0.5792, 'learning_rate': 1.9191470449739037e-05, 'epoch': 0.31} {'loss': 0.5268, 'learning_rate': 1.9191338098049096e-05, 'epoch': 0.31} {'loss': 0.6503, 'learning_rate': 1.9191205735983876e-05, 'epoch': 0.31} {'loss': 0.5667, 'learning_rate': 1.9191073363543532e-05, 'epoch': 0.31} {'loss': 0.4589, 'learning_rate': 1.919094098072822e-05, 'epoch': 0.31} {'loss': 0.6813, 'learning_rate': 1.919080858753808e-05, 'epoch': 0.31} {'loss': 0.583, 'learning_rate': 1.9190676183973262e-05, 'epoch': 0.31} {'loss': 0.5897, 'learning_rate': 1.919054377003392e-05, 'epoch': 0.31} {'loss': 0.513, 'learning_rate': 1.9190411345720203e-05, 'epoch': 0.31} {'loss': 0.555, 'learning_rate': 1.919027891103226e-05, 'epoch': 0.31} {'loss': 0.5777, 'learning_rate': 1.919014646597024e-05, 'epoch': 0.31} {'loss': 0.58, 'learning_rate': 1.919001401053429e-05, 'epoch': 0.31} {'loss': 0.6181, 'learning_rate': 1.9189881544724563e-05, 'epoch': 0.31} {'loss': 0.627, 'learning_rate': 1.918974906854121e-05, 'epoch': 0.31} {'loss': 0.7357, 'learning_rate': 1.918961658198437e-05, 'epoch': 0.31} {'loss': 0.5746, 'learning_rate': 1.9189484085054206e-05, 'epoch': 0.31} {'loss': 0.6199, 'learning_rate': 1.9189351577750862e-05, 'epoch': 0.31} {'loss': 0.4067, 'learning_rate': 1.9189219060074485e-05, 'epoch': 0.31} {'loss': 0.5376, 'learning_rate': 1.918908653202523e-05, 'epoch': 0.31} {'loss': 0.6156, 'learning_rate': 1.918895399360324e-05, 'epoch': 0.31} {'loss': 0.4561, 'learning_rate': 1.9188821444808672e-05, 'epoch': 0.31} {'loss': 0.7031, 'learning_rate': 1.918868888564167e-05, 'epoch': 0.31} {'loss': 0.6295, 'learning_rate': 1.9188556316102387e-05, 'epoch': 0.31} {'loss': 0.3961, 'learning_rate': 1.918842373619097e-05, 'epoch': 0.31} {'loss': 0.4993, 'learning_rate': 1.918829114590757e-05, 'epoch': 0.31} {'loss': 0.5509, 'learning_rate': 1.918815854525234e-05, 'epoch': 0.31} {'loss': 0.607, 'learning_rate': 1.918802593422542e-05, 'epoch': 0.31} {'loss': 0.4924, 'learning_rate': 1.9187893312826968e-05, 'epoch': 0.31} {'loss': 0.6275, 'learning_rate': 1.9187760681057133e-05, 'epoch': 0.31} {'loss': 0.5031, 'learning_rate': 1.918762803891606e-05, 'epoch': 0.31} {'loss': 0.4453, 'learning_rate': 1.9187495386403906e-05, 'epoch': 0.31} {'loss': 0.5777, 'learning_rate': 1.9187362723520813e-05, 'epoch': 0.31} {'loss': 0.4857, 'learning_rate': 1.918723005026694e-05, 'epoch': 0.31} {'loss': 0.4956, 'learning_rate': 1.918709736664243e-05, 'epoch': 0.31} {'loss': 0.6262, 'learning_rate': 1.9186964672647433e-05, 'epoch': 0.31} {'loss': 0.5986, 'learning_rate': 1.9186831968282097e-05, 'epoch': 0.31} {'loss': 0.5593, 'learning_rate': 1.9186699253546578e-05, 'epoch': 0.31} {'loss': 0.507, 'learning_rate': 1.918656652844102e-05, 'epoch': 0.31} {'loss': 0.6496, 'learning_rate': 1.9186433792965577e-05, 'epoch': 0.31} {'loss': 0.6765, 'learning_rate': 1.9186301047120398e-05, 'epoch': 0.31} {'loss': 0.6274, 'learning_rate': 1.918616829090563e-05, 'epoch': 0.31} {'loss': 0.526, 'learning_rate': 1.9186035524321426e-05, 'epoch': 0.31} {'loss': 0.4582, 'learning_rate': 1.9185902747367934e-05, 'epoch': 0.31} {'loss': 0.5685, 'learning_rate': 1.9185769960045303e-05, 'epoch': 0.31} {'loss': 0.4413, 'learning_rate': 1.918563716235369e-05, 'epoch': 0.31} {'loss': 0.5272, 'learning_rate': 1.9185504354293237e-05, 'epoch': 0.31} {'loss': 0.4864, 'learning_rate': 1.9185371535864093e-05, 'epoch': 0.31} {'loss': 0.5538, 'learning_rate': 1.9185238707066412e-05, 'epoch': 0.31} {'loss': 0.5797, 'learning_rate': 1.9185105867900343e-05, 'epoch': 0.31} {'loss': 0.7079, 'learning_rate': 1.918497301836604e-05, 'epoch': 0.31} {'loss': 0.6138, 'learning_rate': 1.9184840158463648e-05, 'epoch': 0.31} {'loss': 0.6455, 'learning_rate': 1.9184707288193313e-05, 'epoch': 0.31} {'loss': 0.5429, 'learning_rate': 1.9184574407555196e-05, 'epoch': 0.31} {'loss': 0.5341, 'learning_rate': 1.918444151654944e-05, 'epoch': 0.31} {'loss': 0.5932, 'learning_rate': 1.9184308615176195e-05, 'epoch': 0.31} {'loss': 0.7855, 'learning_rate': 1.918417570343561e-05, 'epoch': 0.31} {'loss': 0.6276, 'learning_rate': 1.918404278132784e-05, 'epoch': 0.31} {'loss': 0.5322, 'learning_rate': 1.918390984885303e-05, 'epoch': 0.31} {'loss': 0.5834, 'learning_rate': 1.9183776906011335e-05, 'epoch': 0.31} {'loss': 0.635, 'learning_rate': 1.9183643952802898e-05, 'epoch': 0.31} {'loss': 0.5958, 'learning_rate': 1.918351098922788e-05, 'epoch': 0.31} {'loss': 0.7557, 'learning_rate': 1.9183378015286417e-05, 'epoch': 0.31} {'loss': 0.5381, 'learning_rate': 1.918324503097867e-05, 'epoch': 0.31} {'loss': 0.6471, 'learning_rate': 1.9183112036304786e-05, 'epoch': 0.31} {'loss': 0.4967, 'learning_rate': 1.9182979031264913e-05, 'epoch': 0.31} {'loss': 0.6063, 'learning_rate': 1.9182846015859202e-05, 'epoch': 0.31} {'loss': 0.4798, 'learning_rate': 1.9182712990087808e-05, 'epoch': 0.31} {'loss': 0.5277, 'learning_rate': 1.9182579953950874e-05, 'epoch': 0.31} {'loss': 0.6509, 'learning_rate': 1.9182446907448555e-05, 'epoch': 0.31} {'loss': 0.6034, 'learning_rate': 1.9182313850581e-05, 'epoch': 0.31} {'loss': 0.6026, 'learning_rate': 1.9182180783348358e-05, 'epoch': 0.31} {'loss': 0.7191, 'learning_rate': 1.9182047705750778e-05, 'epoch': 0.31} {'loss': 0.596, 'learning_rate': 1.9181914617788415e-05, 'epoch': 0.31} {'loss': 0.7613, 'learning_rate': 1.9181781519461415e-05, 'epoch': 0.31} {'loss': 0.5083, 'learning_rate': 1.918164841076993e-05, 'epoch': 0.31} {'loss': 0.6061, 'learning_rate': 1.9181515291714112e-05, 'epoch': 0.31} {'loss': 0.5886, 'learning_rate': 1.9181382162294108e-05, 'epoch': 0.31} {'loss': 0.6085, 'learning_rate': 1.9181249022510066e-05, 'epoch': 0.31} {'loss': 0.5319, 'learning_rate': 1.9181115872362142e-05, 'epoch': 0.31} {'loss': 0.5974, 'learning_rate': 1.9180982711850486e-05, 'epoch': 0.31} {'loss': 0.5336, 'learning_rate': 1.9180849540975246e-05, 'epoch': 0.31} {'loss': 0.5186, 'learning_rate': 1.918071635973657e-05, 'epoch': 0.31} {'loss': 0.5622, 'learning_rate': 1.918058316813461e-05, 'epoch': 0.31} {'loss': 0.7486, 'learning_rate': 1.9180449966169525e-05, 'epoch': 0.31} {'loss': 0.4326, 'learning_rate': 1.918031675384145e-05, 'epoch': 0.31} {'loss': 0.5838, 'learning_rate': 1.9180183531150546e-05, 'epoch': 0.31} {'loss': 0.592, 'learning_rate': 1.9180050298096962e-05, 'epoch': 0.31} {'loss': 0.525, 'learning_rate': 1.9179917054680844e-05, 'epoch': 0.31} {'loss': 0.6824, 'learning_rate': 1.9179783800902346e-05, 'epoch': 0.31} {'loss': 0.6669, 'learning_rate': 1.917965053676162e-05, 'epoch': 0.31} {'loss': 0.5602, 'learning_rate': 1.917951726225881e-05, 'epoch': 0.31} {'loss': 0.5278, 'learning_rate': 1.9179383977394074e-05, 'epoch': 0.31} {'loss': 0.5971, 'learning_rate': 1.917925068216756e-05, 'epoch': 0.31} {'loss': 0.4635, 'learning_rate': 1.9179117376579414e-05, 'epoch': 0.31} {'loss': 0.5275, 'learning_rate': 1.9178984060629792e-05, 'epoch': 0.31} {'loss': 0.5612, 'learning_rate': 1.917885073431884e-05, 'epoch': 0.31} {'loss': 0.509, 'learning_rate': 1.9178717397646715e-05, 'epoch': 0.31} {'loss': 0.565, 'learning_rate': 1.917858405061356e-05, 'epoch': 0.31} {'loss': 0.5641, 'learning_rate': 1.917845069321953e-05, 'epoch': 0.31} {'loss': 0.5351, 'learning_rate': 1.9178317325464775e-05, 'epoch': 0.31} {'loss': 0.6066, 'learning_rate': 1.9178183947349443e-05, 'epoch': 0.31} {'loss': 0.553, 'learning_rate': 1.9178050558873692e-05, 'epoch': 0.31} {'loss': 0.536, 'learning_rate': 1.917791716003766e-05, 'epoch': 0.31} {'loss': 0.5496, 'learning_rate': 1.917778375084151e-05, 'epoch': 0.31} {'loss': 0.5499, 'learning_rate': 1.9177650331285385e-05, 'epoch': 0.31} {'loss': 0.7152, 'learning_rate': 1.917751690136944e-05, 'epoch': 0.31} {'loss': 0.5588, 'learning_rate': 1.917738346109382e-05, 'epoch': 0.31} {'loss': 0.5908, 'learning_rate': 1.9177250010458682e-05, 'epoch': 0.31} {'loss': 0.4848, 'learning_rate': 1.9177116549464174e-05, 'epoch': 0.31} {'loss': 0.6079, 'learning_rate': 1.9176983078110447e-05, 'epoch': 0.31} {'loss': 0.4632, 'learning_rate': 1.917684959639765e-05, 'epoch': 0.31} {'loss': 0.6593, 'learning_rate': 1.9176716104325937e-05, 'epoch': 0.31} {'loss': 0.537, 'learning_rate': 1.9176582601895456e-05, 'epoch': 0.31} {'loss': 0.366, 'learning_rate': 1.9176449089106354e-05, 'epoch': 0.31} {'loss': 0.5524, 'learning_rate': 1.9176315565958788e-05, 'epoch': 0.31} {'loss': 0.5995, 'learning_rate': 1.917618203245291e-05, 'epoch': 0.31} {'loss': 0.6112, 'learning_rate': 1.9176048488588864e-05, 'epoch': 0.31} {'loss': 0.4949, 'learning_rate': 1.9175914934366803e-05, 'epoch': 0.31} {'loss': 0.5973, 'learning_rate': 1.917578136978688e-05, 'epoch': 0.31} {'loss': 0.481, 'learning_rate': 1.9175647794849248e-05, 'epoch': 0.31} {'loss': 0.5412, 'learning_rate': 1.9175514209554055e-05, 'epoch': 0.31} {'loss': 0.5277, 'learning_rate': 1.9175380613901445e-05, 'epoch': 0.31} {'loss': 0.4988, 'learning_rate': 1.917524700789158e-05, 'epoch': 0.31} {'loss': 0.4944, 'learning_rate': 1.9175113391524606e-05, 'epoch': 0.31} {'loss': 0.6321, 'learning_rate': 1.9174979764800672e-05, 'epoch': 0.31} {'loss': 0.5747, 'learning_rate': 1.9174846127719928e-05, 'epoch': 0.31} {'loss': 0.8167, 'learning_rate': 1.9174712480282532e-05, 'epoch': 0.31} {'loss': 0.4962, 'learning_rate': 1.9174578822488627e-05, 'epoch': 0.31} {'loss': 0.59, 'learning_rate': 1.917444515433837e-05, 'epoch': 0.31} {'loss': 0.6071, 'learning_rate': 1.917431147583191e-05, 'epoch': 0.31} {'loss': 0.5513, 'learning_rate': 1.917417778696939e-05, 'epoch': 0.31} {'loss': 0.5643, 'learning_rate': 1.9174044087750974e-05, 'epoch': 0.31} {'loss': 0.5806, 'learning_rate': 1.9173910378176806e-05, 'epoch': 0.31} {'loss': 0.6138, 'learning_rate': 1.9173776658247037e-05, 'epoch': 0.31} {'loss': 0.645, 'learning_rate': 1.9173642927961816e-05, 'epoch': 0.31} {'loss': 0.5155, 'learning_rate': 1.91735091873213e-05, 'epoch': 0.31} {'loss': 0.4706, 'learning_rate': 1.9173375436325635e-05, 'epoch': 0.31} {'loss': 0.4635, 'learning_rate': 1.9173241674974975e-05, 'epoch': 0.31} {'loss': 0.5756, 'learning_rate': 1.9173107903269467e-05, 'epoch': 0.31} {'loss': 0.805, 'learning_rate': 1.9172974121209266e-05, 'epoch': 0.31} {'loss': 0.7632, 'learning_rate': 1.917284032879452e-05, 'epoch': 0.31} {'loss': 0.5634, 'learning_rate': 1.9172706526025387e-05, 'epoch': 0.31} {'loss': 0.5498, 'learning_rate': 1.9172572712902007e-05, 'epoch': 0.31} {'loss': 0.5019, 'learning_rate': 1.9172438889424538e-05, 'epoch': 0.31} {'loss': 0.5357, 'learning_rate': 1.9172305055593134e-05, 'epoch': 0.31} {'loss': 0.6207, 'learning_rate': 1.9172171211407934e-05, 'epoch': 0.31} {'loss': 0.509, 'learning_rate': 1.91720373568691e-05, 'epoch': 0.31} {'loss': 0.4715, 'learning_rate': 1.9171903491976783e-05, 'epoch': 0.31} {'loss': 0.5967, 'learning_rate': 1.917176961673113e-05, 'epoch': 0.31} {'loss': 0.5466, 'learning_rate': 1.917163573113229e-05, 'epoch': 0.32} {'loss': 0.646, 'learning_rate': 1.9171501835180416e-05, 'epoch': 0.32} {'loss': 0.436, 'learning_rate': 1.9171367928875667e-05, 'epoch': 0.32} {'loss': 0.3889, 'learning_rate': 1.9171234012218183e-05, 'epoch': 0.32} {'loss': 0.5542, 'learning_rate': 1.9171100085208123e-05, 'epoch': 0.32} {'loss': 0.5959, 'learning_rate': 1.9170966147845634e-05, 'epoch': 0.32} {'loss': 0.5402, 'learning_rate': 1.9170832200130863e-05, 'epoch': 0.32} {'loss': 0.4583, 'learning_rate': 1.917069824206397e-05, 'epoch': 0.32} {'loss': 0.4518, 'learning_rate': 1.9170564273645107e-05, 'epoch': 0.32} {'loss': 0.7469, 'learning_rate': 1.9170430294874416e-05, 'epoch': 0.32} {'loss': 0.6116, 'learning_rate': 1.9170296305752054e-05, 'epoch': 0.32} {'loss': 0.7084, 'learning_rate': 1.9170162306278173e-05, 'epoch': 0.32} {'loss': 0.5084, 'learning_rate': 1.917002829645292e-05, 'epoch': 0.32} {'loss': 0.5588, 'learning_rate': 1.916989427627645e-05, 'epoch': 0.32} {'loss': 0.5942, 'learning_rate': 1.916976024574891e-05, 'epoch': 0.32} {'loss': 0.5557, 'learning_rate': 1.916962620487046e-05, 'epoch': 0.32} {'loss': 0.562, 'learning_rate': 1.916949215364124e-05, 'epoch': 0.32} {'loss': 0.5696, 'learning_rate': 1.9169358092061414e-05, 'epoch': 0.32} {'loss': 0.4292, 'learning_rate': 1.9169224020131122e-05, 'epoch': 0.32} {'loss': 0.4866, 'learning_rate': 1.916908993785052e-05, 'epoch': 0.32} {'loss': 0.5507, 'learning_rate': 1.9168955845219757e-05, 'epoch': 0.32} {'loss': 0.6274, 'learning_rate': 1.916882174223899e-05, 'epoch': 0.32} {'loss': 0.6471, 'learning_rate': 1.9168687628908366e-05, 'epoch': 0.32} {'loss': 0.5408, 'learning_rate': 1.9168553505228034e-05, 'epoch': 0.32} {'loss': 0.5636, 'learning_rate': 1.9168419371198152e-05, 'epoch': 0.32} {'loss': 0.6525, 'learning_rate': 1.9168285226818865e-05, 'epoch': 0.32} {'loss': 0.5288, 'learning_rate': 1.916815107209033e-05, 'epoch': 0.32} {'loss': 0.5615, 'learning_rate': 1.9168016907012696e-05, 'epoch': 0.32} {'loss': 0.4222, 'learning_rate': 1.9167882731586115e-05, 'epoch': 0.32} {'loss': 0.5937, 'learning_rate': 1.9167748545810732e-05, 'epoch': 0.32} {'loss': 0.6387, 'learning_rate': 1.916761434968671e-05, 'epoch': 0.32} {'loss': 0.5473, 'learning_rate': 1.9167480143214194e-05, 'epoch': 0.32} {'loss': 0.4023, 'learning_rate': 1.9167345926393336e-05, 'epoch': 0.32} {'loss': 0.5674, 'learning_rate': 1.9167211699224287e-05, 'epoch': 0.32} {'loss': 0.5692, 'learning_rate': 1.91670774617072e-05, 'epoch': 0.32} {'loss': 0.732, 'learning_rate': 1.9166943213842225e-05, 'epoch': 0.32} {'loss': 0.4243, 'learning_rate': 1.9166808955629516e-05, 'epoch': 0.32} {'loss': 0.4259, 'learning_rate': 1.9166674687069216e-05, 'epoch': 0.32} {'loss': 0.5493, 'learning_rate': 1.916654040816149e-05, 'epoch': 0.32} {'loss': 0.6217, 'learning_rate': 1.916640611890648e-05, 'epoch': 0.32} {'loss': 0.5829, 'learning_rate': 1.9166271819304345e-05, 'epoch': 0.32} {'loss': 0.6609, 'learning_rate': 1.916613750935523e-05, 'epoch': 0.32} {'loss': 0.6278, 'learning_rate': 1.916600318905929e-05, 'epoch': 0.32} {'loss': 0.6445, 'learning_rate': 1.9165868858416668e-05, 'epoch': 0.32} {'loss': 0.5974, 'learning_rate': 1.9165734517427533e-05, 'epoch': 0.32} {'loss': 0.5663, 'learning_rate': 1.916560016609202e-05, 'epoch': 0.32} {'loss': 0.443, 'learning_rate': 1.916546580441029e-05, 'epoch': 0.32} {'loss': 0.5836, 'learning_rate': 1.9165331432382492e-05, 'epoch': 0.32} {'loss': 0.5761, 'learning_rate': 1.9165197050008774e-05, 'epoch': 0.32} {'loss': 0.6185, 'learning_rate': 1.9165062657289297e-05, 'epoch': 0.32} {'loss': 0.6169, 'learning_rate': 1.9164928254224203e-05, 'epoch': 0.32} {'loss': 0.5699, 'learning_rate': 1.916479384081365e-05, 'epoch': 0.32} {'loss': 0.6008, 'learning_rate': 1.9164659417057787e-05, 'epoch': 0.32} {'loss': 0.6247, 'learning_rate': 1.9164524982956766e-05, 'epoch': 0.32} {'loss': 0.7872, 'learning_rate': 1.916439053851074e-05, 'epoch': 0.32} {'loss': 0.6751, 'learning_rate': 1.9164256083719857e-05, 'epoch': 0.32} {'loss': 0.4789, 'learning_rate': 1.9164121618584274e-05, 'epoch': 0.32} {'loss': 0.638, 'learning_rate': 1.9163987143104142e-05, 'epoch': 0.32} {'loss': 0.6267, 'learning_rate': 1.9163852657279607e-05, 'epoch': 0.32} {'loss': 0.6763, 'learning_rate': 1.9163718161110827e-05, 'epoch': 0.32} {'loss': 0.6531, 'learning_rate': 1.9163583654597952e-05, 'epoch': 0.32} {'loss': 0.6186, 'learning_rate': 1.9163449137741134e-05, 'epoch': 0.32} {'loss': 0.4917, 'learning_rate': 1.9163314610540523e-05, 'epoch': 0.32} {'loss': 0.4239, 'learning_rate': 1.916318007299627e-05, 'epoch': 0.32} {'loss': 0.4887, 'learning_rate': 1.9163045525108534e-05, 'epoch': 0.32} {'loss': 0.6724, 'learning_rate': 1.916291096687746e-05, 'epoch': 0.32} {'loss': 0.6902, 'learning_rate': 1.9162776398303203e-05, 'epoch': 0.32} {'loss': 0.4811, 'learning_rate': 1.9162641819385914e-05, 'epoch': 0.32} {'loss': 0.5149, 'learning_rate': 1.916250723012574e-05, 'epoch': 0.32} {'loss': 0.5432, 'learning_rate': 1.9162372630522844e-05, 'epoch': 0.32} {'loss': 0.5543, 'learning_rate': 1.916223802057737e-05, 'epoch': 0.32} {'loss': 0.4945, 'learning_rate': 1.916210340028947e-05, 'epoch': 0.32} {'loss': 0.5488, 'learning_rate': 1.9161968769659296e-05, 'epoch': 0.32} {'loss': 0.6303, 'learning_rate': 1.9161834128687005e-05, 'epoch': 0.32} {'loss': 0.5915, 'learning_rate': 1.9161699477372743e-05, 'epoch': 0.32} {'loss': 0.7531, 'learning_rate': 1.9161564815716667e-05, 'epoch': 0.32} {'loss': 0.6975, 'learning_rate': 1.916143014371892e-05, 'epoch': 0.32} {'loss': 0.448, 'learning_rate': 1.916129546137967e-05, 'epoch': 0.32} {'loss': 0.5338, 'learning_rate': 1.9161160768699055e-05, 'epoch': 0.32} {'loss': 0.6699, 'learning_rate': 1.916102606567723e-05, 'epoch': 0.32} {'loss': 0.4275, 'learning_rate': 1.916089135231435e-05, 'epoch': 0.32} {'loss': 0.596, 'learning_rate': 1.9160756628610568e-05, 'epoch': 0.32} {'loss': 0.6298, 'learning_rate': 1.916062189456603e-05, 'epoch': 0.32} {'loss': 0.6354, 'learning_rate': 1.916048715018089e-05, 'epoch': 0.32} {'loss': 0.6079, 'learning_rate': 1.9160352395455308e-05, 'epoch': 0.32} {'loss': 0.5333, 'learning_rate': 1.9160217630389427e-05, 'epoch': 0.32} {'loss': 0.7584, 'learning_rate': 1.9160082854983402e-05, 'epoch': 0.32} {'loss': 0.5462, 'learning_rate': 1.9159948069237385e-05, 'epoch': 0.32} {'loss': 0.5941, 'learning_rate': 1.9159813273151532e-05, 'epoch': 0.32} {'loss': 0.5466, 'learning_rate': 1.9159678466725988e-05, 'epoch': 0.32} {'loss': 0.6738, 'learning_rate': 1.915954364996091e-05, 'epoch': 0.32} {'loss': 0.4974, 'learning_rate': 1.915940882285645e-05, 'epoch': 0.32} {'loss': 0.5266, 'learning_rate': 1.9159273985412758e-05, 'epoch': 0.32} {'loss': 0.5504, 'learning_rate': 1.9159139137629987e-05, 'epoch': 0.32} {'loss': 0.5245, 'learning_rate': 1.9159004279508287e-05, 'epoch': 0.32} {'loss': 0.6069, 'learning_rate': 1.915886941104782e-05, 'epoch': 0.32} {'loss': 0.507, 'learning_rate': 1.9158734532248724e-05, 'epoch': 0.32} {'loss': 0.6145, 'learning_rate': 1.915859964311116e-05, 'epoch': 0.32} {'loss': 0.7196, 'learning_rate': 1.9158464743635284e-05, 'epoch': 0.32} {'loss': 0.6675, 'learning_rate': 1.9158329833821238e-05, 'epoch': 0.32} {'loss': 0.5665, 'learning_rate': 1.9158194913669178e-05, 'epoch': 0.32} {'loss': 0.6602, 'learning_rate': 1.915805998317926e-05, 'epoch': 0.32} {'loss': 0.5296, 'learning_rate': 1.9157925042351634e-05, 'epoch': 0.32} {'loss': 0.5075, 'learning_rate': 1.915779009118645e-05, 'epoch': 0.32} {'loss': 0.6084, 'learning_rate': 1.9157655129683863e-05, 'epoch': 0.32} {'loss': 0.5279, 'learning_rate': 1.9157520157844026e-05, 'epoch': 0.32} {'loss': 0.4714, 'learning_rate': 1.915738517566709e-05, 'epoch': 0.32} {'loss': 0.5406, 'learning_rate': 1.9157250183153206e-05, 'epoch': 0.32} {'loss': 0.5259, 'learning_rate': 1.915711518030253e-05, 'epoch': 0.32} {'loss': 0.6389, 'learning_rate': 1.915698016711521e-05, 'epoch': 0.32} {'loss': 0.5313, 'learning_rate': 1.91568451435914e-05, 'epoch': 0.32} {'loss': 0.5177, 'learning_rate': 1.9156710109731258e-05, 'epoch': 0.32} {'loss': 0.523, 'learning_rate': 1.9156575065534926e-05, 'epoch': 0.32} {'loss': 0.5554, 'learning_rate': 1.9156440011002563e-05, 'epoch': 0.32} {'loss': 0.5229, 'learning_rate': 1.9156304946134324e-05, 'epoch': 0.32} {'loss': 0.622, 'learning_rate': 1.9156169870930355e-05, 'epoch': 0.32} {'loss': 0.6823, 'learning_rate': 1.9156034785390813e-05, 'epoch': 0.32} {'loss': 0.5758, 'learning_rate': 1.9155899689515845e-05, 'epoch': 0.32} {'loss': 0.5555, 'learning_rate': 1.9155764583305612e-05, 'epoch': 0.32} {'loss': 0.4317, 'learning_rate': 1.9155629466760263e-05, 'epoch': 0.32} {'loss': 0.5553, 'learning_rate': 1.9155494339879942e-05, 'epoch': 0.32} {'loss': 0.524, 'learning_rate': 1.9155359202664817e-05, 'epoch': 0.32} {'loss': 0.6615, 'learning_rate': 1.9155224055115026e-05, 'epoch': 0.32} {'loss': 0.6812, 'learning_rate': 1.915508889723073e-05, 'epoch': 0.32} {'loss': 0.4506, 'learning_rate': 1.915495372901208e-05, 'epoch': 0.32} {'loss': 0.4972, 'learning_rate': 1.915481855045923e-05, 'epoch': 0.32} {'loss': 0.3976, 'learning_rate': 1.915468336157233e-05, 'epoch': 0.32} {'loss': 0.5531, 'learning_rate': 1.915454816235153e-05, 'epoch': 0.32} {'loss': 0.5113, 'learning_rate': 1.9154412952796988e-05, 'epoch': 0.32} {'loss': 0.4221, 'learning_rate': 1.9154277732908855e-05, 'epoch': 0.32} {'loss': 0.652, 'learning_rate': 1.9154142502687283e-05, 'epoch': 0.32} {'loss': 0.4777, 'learning_rate': 1.9154007262132427e-05, 'epoch': 0.32} {'loss': 0.5253, 'learning_rate': 1.9153872011244433e-05, 'epoch': 0.32} {'loss': 0.7259, 'learning_rate': 1.915373675002346e-05, 'epoch': 0.32} {'loss': 0.5518, 'learning_rate': 1.9153601478469662e-05, 'epoch': 0.32} {'loss': 0.6437, 'learning_rate': 1.9153466196583187e-05, 'epoch': 0.32} {'loss': 0.5362, 'learning_rate': 1.9153330904364183e-05, 'epoch': 0.32} {'loss': 0.6541, 'learning_rate': 1.9153195601812817e-05, 'epoch': 0.32} {'loss': 0.6716, 'learning_rate': 1.9153060288929232e-05, 'epoch': 0.32} {'loss': 0.511, 'learning_rate': 1.915292496571358e-05, 'epoch': 0.32} {'loss': 0.6524, 'learning_rate': 1.915278963216602e-05, 'epoch': 0.32} {'loss': 0.6501, 'learning_rate': 1.91526542882867e-05, 'epoch': 0.32} {'loss': 0.5138, 'learning_rate': 1.915251893407577e-05, 'epoch': 0.32} {'loss': 0.533, 'learning_rate': 1.9152383569533387e-05, 'epoch': 0.32} {'loss': 0.6357, 'learning_rate': 1.9152248194659705e-05, 'epoch': 0.32} {'loss': 0.6298, 'learning_rate': 1.9152112809454878e-05, 'epoch': 0.32} {'loss': 0.6154, 'learning_rate': 1.9151977413919054e-05, 'epoch': 0.32} {'loss': 0.5493, 'learning_rate': 1.9151842008052387e-05, 'epoch': 0.32} {'loss': 0.733, 'learning_rate': 1.915170659185503e-05, 'epoch': 0.32} {'loss': 0.6113, 'learning_rate': 1.9151571165327135e-05, 'epoch': 0.32} {'loss': 0.6294, 'learning_rate': 1.915143572846886e-05, 'epoch': 0.32} {'loss': 0.5562, 'learning_rate': 1.9151300281280357e-05, 'epoch': 0.32} {'loss': 0.6012, 'learning_rate': 1.915116482376177e-05, 'epoch': 0.32} {'loss': 0.5677, 'learning_rate': 1.915102935591326e-05, 'epoch': 0.32} {'loss': 0.4377, 'learning_rate': 1.915089387773498e-05, 'epoch': 0.32} {'loss': 0.4845, 'learning_rate': 1.9150758389227077e-05, 'epoch': 0.32} {'loss': 0.6427, 'learning_rate': 1.915062289038971e-05, 'epoch': 0.32} {'loss': 0.6032, 'learning_rate': 1.915048738122303e-05, 'epoch': 0.32} {'loss': 0.6552, 'learning_rate': 1.915035186172719e-05, 'epoch': 0.32} {'loss': 0.5032, 'learning_rate': 1.9150216331902344e-05, 'epoch': 0.32} {'loss': 0.783, 'learning_rate': 1.9150080791748645e-05, 'epoch': 0.32} {'loss': 0.7232, 'learning_rate': 1.914994524126624e-05, 'epoch': 0.32} {'loss': 0.6822, 'learning_rate': 1.914980968045529e-05, 'epoch': 0.32} {'loss': 0.6312, 'learning_rate': 1.9149674109315944e-05, 'epoch': 0.32} {'loss': 0.5789, 'learning_rate': 1.9149538527848355e-05, 'epoch': 0.32} {'loss': 0.4618, 'learning_rate': 1.914940293605268e-05, 'epoch': 0.32} {'loss': 0.7024, 'learning_rate': 1.9149267333929064e-05, 'epoch': 0.32} {'loss': 0.6279, 'learning_rate': 1.9149131721477668e-05, 'epoch': 0.32} {'loss': 0.6651, 'learning_rate': 1.9148996098698642e-05, 'epoch': 0.32} {'loss': 0.5902, 'learning_rate': 1.9148860465592137e-05, 'epoch': 0.32} {'loss': 0.6061, 'learning_rate': 1.9148724822158308e-05, 'epoch': 0.32} {'loss': 0.6286, 'learning_rate': 1.914858916839731e-05, 'epoch': 0.32} {'loss': 0.7079, 'learning_rate': 1.9148453504309298e-05, 'epoch': 0.32} {'loss': 0.6418, 'learning_rate': 1.914831782989442e-05, 'epoch': 0.32} {'loss': 0.6158, 'learning_rate': 1.9148182145152826e-05, 'epoch': 0.32} {'loss': 0.5711, 'learning_rate': 1.9148046450084678e-05, 'epoch': 0.32} {'loss': 0.4527, 'learning_rate': 1.9147910744690124e-05, 'epoch': 0.32} {'loss': 0.5939, 'learning_rate': 1.9147775028969318e-05, 'epoch': 0.32} {'loss': 0.5149, 'learning_rate': 1.9147639302922414e-05, 'epoch': 0.32} {'loss': 0.5269, 'learning_rate': 1.9147503566549565e-05, 'epoch': 0.32} {'loss': 0.4988, 'learning_rate': 1.9147367819850923e-05, 'epoch': 0.32} {'loss': 0.5267, 'learning_rate': 1.9147232062826646e-05, 'epoch': 0.32} {'loss': 0.3772, 'learning_rate': 1.914709629547688e-05, 'epoch': 0.32} {'loss': 0.5363, 'learning_rate': 1.9146960517801783e-05, 'epoch': 0.32} {'loss': 0.7091, 'learning_rate': 1.9146824729801504e-05, 'epoch': 0.32} {'loss': 0.5926, 'learning_rate': 1.9146688931476204e-05, 'epoch': 0.32} {'loss': 0.4966, 'learning_rate': 1.9146553122826027e-05, 'epoch': 0.32} {'loss': 0.5749, 'learning_rate': 1.9146417303851132e-05, 'epoch': 0.32} {'loss': 0.6848, 'learning_rate': 1.9146281474551674e-05, 'epoch': 0.32} {'loss': 0.5495, 'learning_rate': 1.91461456349278e-05, 'epoch': 0.32} {'loss': 0.6139, 'learning_rate': 1.914600978497967e-05, 'epoch': 0.32} {'loss': 0.5662, 'learning_rate': 1.914587392470743e-05, 'epoch': 0.32} {'loss': 0.5817, 'learning_rate': 1.914573805411124e-05, 'epoch': 0.32} {'loss': 0.6554, 'learning_rate': 1.9145602173191252e-05, 'epoch': 0.32} {'loss': 0.6098, 'learning_rate': 1.9145466281947617e-05, 'epoch': 0.32} {'loss': 0.5632, 'learning_rate': 1.914533038038049e-05, 'epoch': 0.32} {'loss': 0.4033, 'learning_rate': 1.914519446849002e-05, 'epoch': 0.32} {'loss': 0.4816, 'learning_rate': 1.9145058546276368e-05, 'epoch': 0.32} {'loss': 0.5333, 'learning_rate': 1.9144922613739684e-05, 'epoch': 0.32} {'loss': 0.534, 'learning_rate': 1.9144786670880125e-05, 'epoch': 0.32} {'loss': 0.6945, 'learning_rate': 1.9144650717697836e-05, 'epoch': 0.32} {'loss': 0.7462, 'learning_rate': 1.9144514754192974e-05, 'epoch': 0.32} {'loss': 0.6202, 'learning_rate': 1.9144378780365697e-05, 'epoch': 0.32} {'loss': 0.6542, 'learning_rate': 1.9144242796216155e-05, 'epoch': 0.32} {'loss': 0.6312, 'learning_rate': 1.9144106801744503e-05, 'epoch': 0.32} {'loss': 0.5037, 'learning_rate': 1.914397079695089e-05, 'epoch': 0.32} {'loss': 0.51, 'learning_rate': 1.9143834781835474e-05, 'epoch': 0.32} {'loss': 0.5963, 'learning_rate': 1.9143698756398408e-05, 'epoch': 0.32} {'loss': 0.6008, 'learning_rate': 1.9143562720639846e-05, 'epoch': 0.32} {'loss': 0.5554, 'learning_rate': 1.9143426674559937e-05, 'epoch': 0.32} {'loss': 0.6014, 'learning_rate': 1.914329061815884e-05, 'epoch': 0.32} {'loss': 0.5605, 'learning_rate': 1.9143154551436708e-05, 'epoch': 0.32} {'loss': 0.6518, 'learning_rate': 1.914301847439369e-05, 'epoch': 0.32} {'loss': 0.6437, 'learning_rate': 1.9142882387029943e-05, 'epoch': 0.32} {'loss': 0.5721, 'learning_rate': 1.9142746289345623e-05, 'epoch': 0.32} {'loss': 0.6461, 'learning_rate': 1.914261018134088e-05, 'epoch': 0.32} {'loss': 0.6443, 'learning_rate': 1.9142474063015867e-05, 'epoch': 0.32} {'loss': 0.4454, 'learning_rate': 1.914233793437074e-05, 'epoch': 0.32} {'loss': 0.5572, 'learning_rate': 1.9142201795405656e-05, 'epoch': 0.32} {'loss': 0.7099, 'learning_rate': 1.914206564612076e-05, 'epoch': 0.32} {'loss': 0.5254, 'learning_rate': 1.914192948651621e-05, 'epoch': 0.32} {'loss': 0.5579, 'learning_rate': 1.9141793316592162e-05, 'epoch': 0.32} {'loss': 0.5367, 'learning_rate': 1.914165713634877e-05, 'epoch': 0.32} {'loss': 0.55, 'learning_rate': 1.9141520945786182e-05, 'epoch': 0.32} {'loss': 0.5671, 'learning_rate': 1.9141384744904554e-05, 'epoch': 0.32} {'loss': 0.5781, 'learning_rate': 1.9141248533704042e-05, 'epoch': 0.32} {'loss': 0.5855, 'learning_rate': 1.9141112312184802e-05, 'epoch': 0.32} {'loss': 0.467, 'learning_rate': 1.914097608034698e-05, 'epoch': 0.32} {'loss': 0.6267, 'learning_rate': 1.9140839838190738e-05, 'epoch': 0.32} {'loss': 0.5598, 'learning_rate': 1.914070358571622e-05, 'epoch': 0.32} {'loss': 0.6422, 'learning_rate': 1.9140567322923594e-05, 'epoch': 0.32} {'loss': 0.5327, 'learning_rate': 1.9140431049813003e-05, 'epoch': 0.32} {'loss': 0.5431, 'learning_rate': 1.9140294766384603e-05, 'epoch': 0.32} {'loss': 0.6125, 'learning_rate': 1.9140158472638542e-05, 'epoch': 0.32} {'loss': 0.5751, 'learning_rate': 1.9140022168574986e-05, 'epoch': 0.32} {'loss': 0.4443, 'learning_rate': 1.9139885854194084e-05, 'epoch': 0.32} {'loss': 0.6938, 'learning_rate': 1.913974952949599e-05, 'epoch': 0.32} {'loss': 0.4684, 'learning_rate': 1.9139613194480856e-05, 'epoch': 0.32} {'loss': 0.5053, 'learning_rate': 1.9139476849148832e-05, 'epoch': 0.32} {'loss': 0.7292, 'learning_rate': 1.913934049350008e-05, 'epoch': 0.32} {'loss': 0.7472, 'learning_rate': 1.913920412753475e-05, 'epoch': 0.32} {'loss': 0.4608, 'learning_rate': 1.9139067751252997e-05, 'epoch': 0.32} {'loss': 0.4854, 'learning_rate': 1.9138931364654977e-05, 'epoch': 0.32} {'loss': 0.6082, 'learning_rate': 1.913879496774084e-05, 'epoch': 0.32} {'loss': 0.4714, 'learning_rate': 1.9138658560510736e-05, 'epoch': 0.32} {'loss': 0.5694, 'learning_rate': 1.913852214296483e-05, 'epoch': 0.32} {'loss': 0.4644, 'learning_rate': 1.9138385715103265e-05, 'epoch': 0.32} {'loss': 0.589, 'learning_rate': 1.9138249276926207e-05, 'epoch': 0.32} {'loss': 0.5469, 'learning_rate': 1.91381128284338e-05, 'epoch': 0.32} {'loss': 0.5246, 'learning_rate': 1.9137976369626198e-05, 'epoch': 0.32} {'loss': 0.4865, 'learning_rate': 1.913783990050356e-05, 'epoch': 0.32} {'loss': 0.6248, 'learning_rate': 1.913770342106604e-05, 'epoch': 0.32} {'loss': 0.5192, 'learning_rate': 1.9137566931313794e-05, 'epoch': 0.32} {'loss': 0.4483, 'learning_rate': 1.9137430431246967e-05, 'epoch': 0.32} {'loss': 0.6847, 'learning_rate': 1.913729392086572e-05, 'epoch': 0.32} {'loss': 0.5719, 'learning_rate': 1.913715740017021e-05, 'epoch': 0.32} {'loss': 0.5582, 'learning_rate': 1.913702086916058e-05, 'epoch': 0.32} {'loss': 0.7223, 'learning_rate': 1.9136884327836993e-05, 'epoch': 0.32} {'loss': 0.567, 'learning_rate': 1.9136747776199605e-05, 'epoch': 0.32} {'loss': 0.483, 'learning_rate': 1.913661121424856e-05, 'epoch': 0.32} {'loss': 0.666, 'learning_rate': 1.9136474641984022e-05, 'epoch': 0.32} {'loss': 0.6213, 'learning_rate': 1.9136338059406143e-05, 'epoch': 0.32} {'loss': 0.7401, 'learning_rate': 1.9136201466515072e-05, 'epoch': 0.32} {'loss': 0.6348, 'learning_rate': 1.9136064863310972e-05, 'epoch': 0.32} {'loss': 0.6226, 'learning_rate': 1.9135928249793988e-05, 'epoch': 0.32} {'loss': 0.4325, 'learning_rate': 1.9135791625964276e-05, 'epoch': 0.32} {'loss': 0.5873, 'learning_rate': 1.9135654991821996e-05, 'epoch': 0.32} {'loss': 0.5969, 'learning_rate': 1.9135518347367296e-05, 'epoch': 0.32} {'loss': 0.5521, 'learning_rate': 1.9135381692600336e-05, 'epoch': 0.32} {'loss': 0.5285, 'learning_rate': 1.913524502752127e-05, 'epoch': 0.32} {'loss': 0.6205, 'learning_rate': 1.9135108352130242e-05, 'epoch': 0.32} {'loss': 0.3832, 'learning_rate': 1.913497166642742e-05, 'epoch': 0.32} {'loss': 0.6363, 'learning_rate': 1.9134834970412947e-05, 'epoch': 0.32} {'loss': 0.6249, 'learning_rate': 1.9134698264086986e-05, 'epoch': 0.32} {'loss': 0.4181, 'learning_rate': 1.9134561547449687e-05, 'epoch': 0.32} {'loss': 0.5347, 'learning_rate': 1.9134424820501205e-05, 'epoch': 0.32} {'loss': 0.5812, 'learning_rate': 1.9134288083241693e-05, 'epoch': 0.32} {'loss': 0.5574, 'learning_rate': 1.913415133567131e-05, 'epoch': 0.32} {'loss': 0.5719, 'learning_rate': 1.9134014577790205e-05, 'epoch': 0.32} {'loss': 0.5833, 'learning_rate': 1.9133877809598537e-05, 'epoch': 0.32} {'loss': 0.6175, 'learning_rate': 1.913374103109645e-05, 'epoch': 0.32} {'loss': 0.6444, 'learning_rate': 1.9133604242284115e-05, 'epoch': 0.32} {'loss': 0.4793, 'learning_rate': 1.9133467443161674e-05, 'epoch': 0.32} {'loss': 0.5632, 'learning_rate': 1.9133330633729286e-05, 'epoch': 0.32} {'loss': 0.4942, 'learning_rate': 1.91331938139871e-05, 'epoch': 0.32} {'loss': 0.4864, 'learning_rate': 1.9133056983935282e-05, 'epoch': 0.32} {'loss': 0.5633, 'learning_rate': 1.9132920143573974e-05, 'epoch': 0.32} {'loss': 0.5842, 'learning_rate': 1.9132783292903337e-05, 'epoch': 0.32} {'loss': 0.4602, 'learning_rate': 1.9132646431923526e-05, 'epoch': 0.32} {'loss': 0.6368, 'learning_rate': 1.9132509560634697e-05, 'epoch': 0.32} {'loss': 0.5298, 'learning_rate': 1.9132372679036993e-05, 'epoch': 0.32} {'loss': 0.6603, 'learning_rate': 1.9132235787130583e-05, 'epoch': 0.32} {'loss': 0.5072, 'learning_rate': 1.9132098884915615e-05, 'epoch': 0.32} {'loss': 0.4158, 'learning_rate': 1.9131961972392244e-05, 'epoch': 0.32} {'loss': 0.5996, 'learning_rate': 1.9131825049560623e-05, 'epoch': 0.32} {'loss': 0.5548, 'learning_rate': 1.9131688116420907e-05, 'epoch': 0.32} {'loss': 0.6486, 'learning_rate': 1.913155117297325e-05, 'epoch': 0.32} {'loss': 0.568, 'learning_rate': 1.913141421921781e-05, 'epoch': 0.32} {'loss': 0.7085, 'learning_rate': 1.9131277255154745e-05, 'epoch': 0.32} {'loss': 0.4879, 'learning_rate': 1.91311402807842e-05, 'epoch': 0.32} {'loss': 0.7127, 'learning_rate': 1.9131003296106332e-05, 'epoch': 0.32} {'loss': 0.3691, 'learning_rate': 1.91308663011213e-05, 'epoch': 0.32} {'loss': 0.6001, 'learning_rate': 1.9130729295829254e-05, 'epoch': 0.32} {'loss': 0.648, 'learning_rate': 1.9130592280230355e-05, 'epoch': 0.32} {'loss': 0.433, 'learning_rate': 1.9130455254324752e-05, 'epoch': 0.32} {'loss': 0.5091, 'learning_rate': 1.9130318218112598e-05, 'epoch': 0.32} {'loss': 0.6025, 'learning_rate': 1.9130181171594055e-05, 'epoch': 0.32} {'loss': 0.5493, 'learning_rate': 1.9130044114769273e-05, 'epoch': 0.32} {'loss': 0.6043, 'learning_rate': 1.9129907047638404e-05, 'epoch': 0.32} {'loss': 0.6149, 'learning_rate': 1.912976997020161e-05, 'epoch': 0.32} {'loss': 0.5887, 'learning_rate': 1.912963288245904e-05, 'epoch': 0.32} {'loss': 0.6269, 'learning_rate': 1.9129495784410853e-05, 'epoch': 0.32} {'loss': 0.5366, 'learning_rate': 1.91293586760572e-05, 'epoch': 0.32} {'loss': 0.4502, 'learning_rate': 1.9129221557398234e-05, 'epoch': 0.32} {'loss': 0.6135, 'learning_rate': 1.9129084428434116e-05, 'epoch': 0.32} {'loss': 0.4835, 'learning_rate': 1.9128947289164998e-05, 'epoch': 0.32} {'loss': 0.6341, 'learning_rate': 1.9128810139591033e-05, 'epoch': 0.32} {'loss': 0.6603, 'learning_rate': 1.9128672979712377e-05, 'epoch': 0.32} {'loss': 0.3955, 'learning_rate': 1.9128535809529185e-05, 'epoch': 0.32} {'loss': 0.4187, 'learning_rate': 1.912839862904161e-05, 'epoch': 0.32} {'loss': 0.4739, 'learning_rate': 1.9128261438249813e-05, 'epoch': 0.32} {'loss': 0.3704, 'learning_rate': 1.9128124237153944e-05, 'epoch': 0.32} {'loss': 0.5227, 'learning_rate': 1.9127987025754157e-05, 'epoch': 0.32} {'loss': 0.6048, 'learning_rate': 1.912784980405061e-05, 'epoch': 0.32} {'loss': 0.6655, 'learning_rate': 1.9127712572043456e-05, 'epoch': 0.32} {'loss': 0.5602, 'learning_rate': 1.9127575329732848e-05, 'epoch': 0.32} {'loss': 0.3763, 'learning_rate': 1.9127438077118945e-05, 'epoch': 0.32} {'loss': 0.4888, 'learning_rate': 1.9127300814201902e-05, 'epoch': 0.32} {'loss': 0.6479, 'learning_rate': 1.912716354098187e-05, 'epoch': 0.32} {'loss': 0.573, 'learning_rate': 1.9127026257459004e-05, 'epoch': 0.32} {'loss': 0.5334, 'learning_rate': 1.9126888963633462e-05, 'epoch': 0.32} {'loss': 0.5295, 'learning_rate': 1.91267516595054e-05, 'epoch': 0.32} {'loss': 0.5259, 'learning_rate': 1.9126614345074967e-05, 'epoch': 0.32} {'loss': 0.6722, 'learning_rate': 1.9126477020342324e-05, 'epoch': 0.32} {'loss': 0.5589, 'learning_rate': 1.9126339685307625e-05, 'epoch': 0.32} {'loss': 0.6157, 'learning_rate': 1.9126202339971024e-05, 'epoch': 0.32} {'loss': 0.6662, 'learning_rate': 1.9126064984332676e-05, 'epoch': 0.32} {'loss': 0.6431, 'learning_rate': 1.9125927618392737e-05, 'epoch': 0.32} {'loss': 0.6975, 'learning_rate': 1.912579024215136e-05, 'epoch': 0.32} {'loss': 0.6804, 'learning_rate': 1.91256528556087e-05, 'epoch': 0.32} {'loss': 0.5102, 'learning_rate': 1.9125515458764912e-05, 'epoch': 0.32} {'loss': 0.6335, 'learning_rate': 1.9125378051620154e-05, 'epoch': 0.32} {'loss': 0.6197, 'learning_rate': 1.912524063417458e-05, 'epoch': 0.32} {'loss': 0.6842, 'learning_rate': 1.9125103206428342e-05, 'epoch': 0.32} {'loss': 0.5129, 'learning_rate': 1.9124965768381603e-05, 'epoch': 0.32} {'loss': 0.5612, 'learning_rate': 1.912482832003451e-05, 'epoch': 0.32} {'loss': 0.5674, 'learning_rate': 1.9124690861387218e-05, 'epoch': 0.32} {'loss': 0.4608, 'learning_rate': 1.912455339243989e-05, 'epoch': 0.32} {'loss': 0.6229, 'learning_rate': 1.9124415913192672e-05, 'epoch': 0.32} {'loss': 0.5292, 'learning_rate': 1.9124278423645726e-05, 'epoch': 0.32} {'loss': 0.4444, 'learning_rate': 1.9124140923799206e-05, 'epoch': 0.32} {'loss': 0.4596, 'learning_rate': 1.9124003413653266e-05, 'epoch': 0.32} {'loss': 0.6907, 'learning_rate': 1.9123865893208057e-05, 'epoch': 0.32} {'loss': 0.5255, 'learning_rate': 1.912372836246374e-05, 'epoch': 0.32} {'loss': 0.6674, 'learning_rate': 1.912359082142047e-05, 'epoch': 0.32} {'loss': 0.6188, 'learning_rate': 1.9123453270078402e-05, 'epoch': 0.32} {'loss': 0.603, 'learning_rate': 1.9123315708437687e-05, 'epoch': 0.32} {'loss': 0.6328, 'learning_rate': 1.912317813649849e-05, 'epoch': 0.32} {'loss': 0.4921, 'learning_rate': 1.912304055426095e-05, 'epoch': 0.32} {'loss': 0.6964, 'learning_rate': 1.912290296172524e-05, 'epoch': 0.32} {'loss': 0.5831, 'learning_rate': 1.9122765358891506e-05, 'epoch': 0.32} {'loss': 0.5844, 'learning_rate': 1.91226277457599e-05, 'epoch': 0.32} {'loss': 0.4923, 'learning_rate': 1.9122490122330583e-05, 'epoch': 0.32} {'loss': 0.4884, 'learning_rate': 1.9122352488603712e-05, 'epoch': 0.32} {'loss': 0.6354, 'learning_rate': 1.9122214844579438e-05, 'epoch': 0.32} {'loss': 0.5727, 'learning_rate': 1.912207719025792e-05, 'epoch': 0.32} {'loss': 0.6645, 'learning_rate': 1.9121939525639313e-05, 'epoch': 0.32} {'loss': 0.667, 'learning_rate': 1.9121801850723768e-05, 'epoch': 0.32} {'loss': 0.5754, 'learning_rate': 1.9121664165511446e-05, 'epoch': 0.32} {'loss': 0.5679, 'learning_rate': 1.9121526470002493e-05, 'epoch': 0.32} {'loss': 0.5976, 'learning_rate': 1.912138876419708e-05, 'epoch': 0.32} {'loss': 0.5806, 'learning_rate': 1.9121251048095346e-05, 'epoch': 0.32} {'loss': 0.5876, 'learning_rate': 1.9121113321697456e-05, 'epoch': 0.32} {'loss': 0.6081, 'learning_rate': 1.9120975585003566e-05, 'epoch': 0.32} {'loss': 0.5668, 'learning_rate': 1.9120837838013828e-05, 'epoch': 0.32} {'loss': 0.6127, 'learning_rate': 1.9120700080728398e-05, 'epoch': 0.32} {'loss': 0.5779, 'learning_rate': 1.9120562313147434e-05, 'epoch': 0.32} {'loss': 0.5578, 'learning_rate': 1.9120424535271087e-05, 'epoch': 0.32} {'loss': 0.4325, 'learning_rate': 1.9120286747099515e-05, 'epoch': 0.32} {'loss': 0.6279, 'learning_rate': 1.9120148948632874e-05, 'epoch': 0.32} {'loss': 0.4499, 'learning_rate': 1.912001113987132e-05, 'epoch': 0.32} {'loss': 0.665, 'learning_rate': 1.911987332081501e-05, 'epoch': 0.32} {'loss': 0.6085, 'learning_rate': 1.9119735491464093e-05, 'epoch': 0.32} {'loss': 0.5886, 'learning_rate': 1.9119597651818732e-05, 'epoch': 0.32} {'loss': 0.6876, 'learning_rate': 1.9119459801879078e-05, 'epoch': 0.32} {'loss': 0.3409, 'learning_rate': 1.9119321941645287e-05, 'epoch': 0.32} {'loss': 0.5531, 'learning_rate': 1.9119184071117518e-05, 'epoch': 0.32} {'loss': 0.5108, 'learning_rate': 1.911904619029592e-05, 'epoch': 0.32} {'loss': 0.6117, 'learning_rate': 1.9118908299180656e-05, 'epoch': 0.32} {'loss': 0.7364, 'learning_rate': 1.9118770397771878e-05, 'epoch': 0.32} {'loss': 0.6506, 'learning_rate': 1.9118632486069743e-05, 'epoch': 0.32} {'loss': 0.5146, 'learning_rate': 1.9118494564074402e-05, 'epoch': 0.32} {'loss': 0.5044, 'learning_rate': 1.911835663178602e-05, 'epoch': 0.32} {'loss': 0.7332, 'learning_rate': 1.9118218689204744e-05, 'epoch': 0.32} {'loss': 0.6351, 'learning_rate': 1.9118080736330736e-05, 'epoch': 0.32} {'loss': 0.5713, 'learning_rate': 1.9117942773164146e-05, 'epoch': 0.32} {'loss': 0.6475, 'learning_rate': 1.9117804799705133e-05, 'epoch': 0.32} {'loss': 0.5223, 'learning_rate': 1.9117666815953853e-05, 'epoch': 0.32} {'loss': 0.6922, 'learning_rate': 1.911752882191046e-05, 'epoch': 0.32} {'loss': 0.4558, 'learning_rate': 1.9117390817575114e-05, 'epoch': 0.32} {'loss': 0.7292, 'learning_rate': 1.911725280294796e-05, 'epoch': 0.32} {'loss': 0.7439, 'learning_rate': 1.911711477802917e-05, 'epoch': 0.32} {'loss': 0.4949, 'learning_rate': 1.9116976742818883e-05, 'epoch': 0.32} {'loss': 0.5662, 'learning_rate': 1.9116838697317272e-05, 'epoch': 0.32} {'loss': 0.5171, 'learning_rate': 1.9116700641524478e-05, 'epoch': 0.32} {'loss': 0.7823, 'learning_rate': 1.9116562575440664e-05, 'epoch': 0.32} {'loss': 0.6406, 'learning_rate': 1.9116424499065983e-05, 'epoch': 0.32} {'loss': 0.5891, 'learning_rate': 1.9116286412400593e-05, 'epoch': 0.32} {'loss': 0.5433, 'learning_rate': 1.911614831544465e-05, 'epoch': 0.32} {'loss': 0.5872, 'learning_rate': 1.911601020819831e-05, 'epoch': 0.32} {'loss': 0.5732, 'learning_rate': 1.9115872090661725e-05, 'epoch': 0.32} {'loss': 0.6088, 'learning_rate': 1.9115733962835054e-05, 'epoch': 0.32} {'loss': 0.63, 'learning_rate': 1.9115595824718457e-05, 'epoch': 0.32} {'loss': 0.7363, 'learning_rate': 1.911545767631208e-05, 'epoch': 0.32} {'loss': 0.6332, 'learning_rate': 1.911531951761609e-05, 'epoch': 0.32} {'loss': 0.8143, 'learning_rate': 1.9115181348630634e-05, 'epoch': 0.32} {'loss': 0.4993, 'learning_rate': 1.9115043169355873e-05, 'epoch': 0.32} {'loss': 0.609, 'learning_rate': 1.911490497979196e-05, 'epoch': 0.32} {'loss': 0.5866, 'learning_rate': 1.9114766779939057e-05, 'epoch': 0.32} {'loss': 0.5408, 'learning_rate': 1.911462856979731e-05, 'epoch': 0.32} {'loss': 0.5756, 'learning_rate': 1.9114490349366885e-05, 'epoch': 0.32} {'loss': 0.5935, 'learning_rate': 1.911435211864793e-05, 'epoch': 0.32} {'loss': 0.608, 'learning_rate': 1.9114213877640608e-05, 'epoch': 0.32} {'loss': 0.5341, 'learning_rate': 1.9114075626345068e-05, 'epoch': 0.32} {'loss': 0.6886, 'learning_rate': 1.9113937364761472e-05, 'epoch': 0.32} {'loss': 0.4158, 'learning_rate': 1.9113799092889974e-05, 'epoch': 0.32} {'loss': 0.4727, 'learning_rate': 1.9113660810730728e-05, 'epoch': 0.32} {'loss': 0.5301, 'learning_rate': 1.9113522518283895e-05, 'epoch': 0.32} {'loss': 0.5226, 'learning_rate': 1.9113384215549626e-05, 'epoch': 0.32} {'loss': 0.4969, 'learning_rate': 1.9113245902528078e-05, 'epoch': 0.32} {'loss': 0.6413, 'learning_rate': 1.9113107579219413e-05, 'epoch': 0.32} {'loss': 0.5485, 'learning_rate': 1.911296924562378e-05, 'epoch': 0.32} {'loss': 0.5414, 'learning_rate': 1.9112830901741335e-05, 'epoch': 0.32} {'loss': 0.5563, 'learning_rate': 1.9112692547572237e-05, 'epoch': 0.32} {'loss': 0.5837, 'learning_rate': 1.9112554183116646e-05, 'epoch': 0.32} {'loss': 0.5593, 'learning_rate': 1.911241580837471e-05, 'epoch': 0.32} {'loss': 0.5699, 'learning_rate': 1.9112277423346593e-05, 'epoch': 0.32} {'loss': 0.3771, 'learning_rate': 1.9112139028032447e-05, 'epoch': 0.32} {'loss': 0.5621, 'learning_rate': 1.9112000622432426e-05, 'epoch': 0.32} {'loss': 0.571, 'learning_rate': 1.9111862206546692e-05, 'epoch': 0.32} {'loss': 0.5065, 'learning_rate': 1.9111723780375396e-05, 'epoch': 0.32} {'loss': 0.6647, 'learning_rate': 1.9111585343918698e-05, 'epoch': 0.32} {'loss': 0.533, 'learning_rate': 1.9111446897176753e-05, 'epoch': 0.32} {'loss': 0.6265, 'learning_rate': 1.9111308440149717e-05, 'epoch': 0.32} {'loss': 0.4908, 'learning_rate': 1.9111169972837746e-05, 'epoch': 0.32} {'loss': 0.4512, 'learning_rate': 1.9111031495240996e-05, 'epoch': 0.32} {'loss': 0.5344, 'learning_rate': 1.9110893007359626e-05, 'epoch': 0.32} {'loss': 0.4998, 'learning_rate': 1.9110754509193786e-05, 'epoch': 0.32} {'loss': 0.4981, 'learning_rate': 1.911061600074364e-05, 'epoch': 0.32} {'loss': 0.5046, 'learning_rate': 1.9110477482009343e-05, 'epoch': 0.32} {'loss': 0.7182, 'learning_rate': 1.9110338952991046e-05, 'epoch': 0.32} {'loss': 0.7565, 'learning_rate': 1.9110200413688908e-05, 'epoch': 0.32} {'loss': 0.5333, 'learning_rate': 1.9110061864103086e-05, 'epoch': 0.32} {'loss': 0.5241, 'learning_rate': 1.910992330423374e-05, 'epoch': 0.32} {'loss': 0.6018, 'learning_rate': 1.910978473408102e-05, 'epoch': 0.32} {'loss': 0.6461, 'learning_rate': 1.910964615364509e-05, 'epoch': 0.32} {'loss': 0.5379, 'learning_rate': 1.9109507562926096e-05, 'epoch': 0.32} {'loss': 0.4997, 'learning_rate': 1.91093689619242e-05, 'epoch': 0.32} {'loss': 0.4388, 'learning_rate': 1.9109230350639563e-05, 'epoch': 0.32} {'loss': 0.6368, 'learning_rate': 1.9109091729072335e-05, 'epoch': 0.32} {'loss': 0.5446, 'learning_rate': 1.9108953097222676e-05, 'epoch': 0.32} {'loss': 0.4789, 'learning_rate': 1.9108814455090742e-05, 'epoch': 0.32} {'loss': 0.508, 'learning_rate': 1.9108675802676685e-05, 'epoch': 0.32} {'loss': 0.6122, 'learning_rate': 1.9108537139980664e-05, 'epoch': 0.32} {'loss': 0.6124, 'learning_rate': 1.910839846700284e-05, 'epoch': 0.32} {'loss': 0.577, 'learning_rate': 1.9108259783743366e-05, 'epoch': 0.32} {'loss': 0.6065, 'learning_rate': 1.9108121090202397e-05, 'epoch': 0.32} {'loss': 0.486, 'learning_rate': 1.9107982386380094e-05, 'epoch': 0.32} {'loss': 0.523, 'learning_rate': 1.910784367227661e-05, 'epoch': 0.32} {'loss': 0.5752, 'learning_rate': 1.9107704947892102e-05, 'epoch': 0.32} {'loss': 0.5556, 'learning_rate': 1.9107566213226724e-05, 'epoch': 0.32} {'loss': 0.581, 'learning_rate': 1.910742746828064e-05, 'epoch': 0.32} {'loss': 0.58, 'learning_rate': 1.9107288713054e-05, 'epoch': 0.32} {'loss': 0.3909, 'learning_rate': 1.9107149947546965e-05, 'epoch': 0.32} {'loss': 0.6364, 'learning_rate': 1.9107011171759686e-05, 'epoch': 0.32} {'loss': 0.4752, 'learning_rate': 1.9106872385692324e-05, 'epoch': 0.32} {'loss': 0.4872, 'learning_rate': 1.9106733589345038e-05, 'epoch': 0.32} {'loss': 0.6251, 'learning_rate': 1.9106594782717977e-05, 'epoch': 0.32} {'loss': 0.5523, 'learning_rate': 1.9106455965811304e-05, 'epoch': 0.32} {'loss': 0.5632, 'learning_rate': 1.9106317138625175e-05, 'epoch': 0.32} {'loss': 0.5133, 'learning_rate': 1.910617830115975e-05, 'epoch': 0.32} {'loss': 0.549, 'learning_rate': 1.910603945341517e-05, 'epoch': 0.32} {'loss': 0.5998, 'learning_rate': 1.9105900595391615e-05, 'epoch': 0.32} {'loss': 0.6498, 'learning_rate': 1.9105761727089222e-05, 'epoch': 0.33} {'loss': 0.6902, 'learning_rate': 1.910562284850816e-05, 'epoch': 0.33} {'loss': 0.4031, 'learning_rate': 1.910548395964858e-05, 'epoch': 0.33} {'loss': 0.5832, 'learning_rate': 1.9105345060510636e-05, 'epoch': 0.33} {'loss': 0.5315, 'learning_rate': 1.9105206151094494e-05, 'epoch': 0.33} {'loss': 0.581, 'learning_rate': 1.9105067231400305e-05, 'epoch': 0.33} {'loss': 0.7215, 'learning_rate': 1.910492830142822e-05, 'epoch': 0.33} {'loss': 0.5614, 'learning_rate': 1.910478936117841e-05, 'epoch': 0.33} {'loss': 0.6855, 'learning_rate': 1.9104650410651026e-05, 'epoch': 0.33} {'loss': 0.6113, 'learning_rate': 1.9104511449846215e-05, 'epoch': 0.33} {'loss': 0.5488, 'learning_rate': 1.9104372478764146e-05, 'epoch': 0.33} {'loss': 0.454, 'learning_rate': 1.9104233497404973e-05, 'epoch': 0.33} {'loss': 0.6087, 'learning_rate': 1.9104094505768847e-05, 'epoch': 0.33} {'loss': 0.5296, 'learning_rate': 1.9103955503855935e-05, 'epoch': 0.33} {'loss': 0.5531, 'learning_rate': 1.9103816491666385e-05, 'epoch': 0.33} {'loss': 0.5238, 'learning_rate': 1.910367746920036e-05, 'epoch': 0.33} {'loss': 0.4173, 'learning_rate': 1.910353843645801e-05, 'epoch': 0.33} {'loss': 0.6218, 'learning_rate': 1.91033993934395e-05, 'epoch': 0.33} {'loss': 0.5886, 'learning_rate': 1.9103260340144983e-05, 'epoch': 0.33} {'loss': 0.5933, 'learning_rate': 1.9103121276574615e-05, 'epoch': 0.33} {'loss': 0.5618, 'learning_rate': 1.9102982202728555e-05, 'epoch': 0.33} {'loss': 0.6546, 'learning_rate': 1.910284311860696e-05, 'epoch': 0.33} {'loss': 0.5144, 'learning_rate': 1.910270402420998e-05, 'epoch': 0.33} {'loss': 0.589, 'learning_rate': 1.9102564919537786e-05, 'epoch': 0.33} {'loss': 0.57, 'learning_rate': 1.9102425804590522e-05, 'epoch': 0.33} {'loss': 0.5774, 'learning_rate': 1.9102286679368352e-05, 'epoch': 0.33} {'loss': 0.5823, 'learning_rate': 1.9102147543871436e-05, 'epoch': 0.33} {'loss': 0.5828, 'learning_rate': 1.9102008398099918e-05, 'epoch': 0.33} {'loss': 0.6712, 'learning_rate': 1.910186924205397e-05, 'epoch': 0.33} {'loss': 0.484, 'learning_rate': 1.9101730075733737e-05, 'epoch': 0.33} {'loss': 0.5062, 'learning_rate': 1.9101590899139385e-05, 'epoch': 0.33} {'loss': 0.5136, 'learning_rate': 1.9101451712271065e-05, 'epoch': 0.33} {'loss': 0.4445, 'learning_rate': 1.9101312515128937e-05, 'epoch': 0.33} {'loss': 0.5343, 'learning_rate': 1.910117330771316e-05, 'epoch': 0.33} {'loss': 0.6401, 'learning_rate': 1.910103409002389e-05, 'epoch': 0.33} {'loss': 0.5061, 'learning_rate': 1.910089486206128e-05, 'epoch': 0.33} {'loss': 0.5631, 'learning_rate': 1.910075562382549e-05, 'epoch': 0.33} {'loss': 0.7204, 'learning_rate': 1.910061637531668e-05, 'epoch': 0.33} {'loss': 0.6843, 'learning_rate': 1.9100477116535005e-05, 'epoch': 0.33} {'loss': 0.6762, 'learning_rate': 1.910033784748062e-05, 'epoch': 0.33} {'loss': 0.5854, 'learning_rate': 1.9100198568153684e-05, 'epoch': 0.33} {'loss': 0.8269, 'learning_rate': 1.9100059278554352e-05, 'epoch': 0.33} {'loss': 0.5704, 'learning_rate': 1.9099919978682787e-05, 'epoch': 0.33} {'loss': 0.5192, 'learning_rate': 1.9099780668539143e-05, 'epoch': 0.33} {'loss': 0.5616, 'learning_rate': 1.9099641348123577e-05, 'epoch': 0.33} {'loss': 0.6681, 'learning_rate': 1.9099502017436246e-05, 'epoch': 0.33} {'loss': 0.5784, 'learning_rate': 1.9099362676477305e-05, 'epoch': 0.33} {'loss': 0.6519, 'learning_rate': 1.9099223325246918e-05, 'epoch': 0.33} {'loss': 0.5803, 'learning_rate': 1.9099083963745236e-05, 'epoch': 0.33} {'loss': 0.606, 'learning_rate': 1.9098944591972416e-05, 'epoch': 0.33} {'loss': 0.5758, 'learning_rate': 1.909880520992862e-05, 'epoch': 0.33} {'loss': 0.5984, 'learning_rate': 1.9098665817614007e-05, 'epoch': 0.33} {'loss': 0.554, 'learning_rate': 1.9098526415028727e-05, 'epoch': 0.33} {'loss': 0.589, 'learning_rate': 1.909838700217294e-05, 'epoch': 0.33} {'loss': 0.7194, 'learning_rate': 1.9098247579046805e-05, 'epoch': 0.33} {'loss': 0.6125, 'learning_rate': 1.9098108145650478e-05, 'epoch': 0.33} {'loss': 0.6465, 'learning_rate': 1.9097968701984117e-05, 'epoch': 0.33} {'loss': 0.4649, 'learning_rate': 1.909782924804788e-05, 'epoch': 0.33} {'loss': 0.5422, 'learning_rate': 1.9097689783841926e-05, 'epoch': 0.33} {'loss': 0.5266, 'learning_rate': 1.9097550309366405e-05, 'epoch': 0.33} {'loss': 0.7701, 'learning_rate': 1.9097410824621484e-05, 'epoch': 0.33} {'loss': 0.661, 'learning_rate': 1.9097271329607318e-05, 'epoch': 0.33} {'loss': 0.5633, 'learning_rate': 1.9097131824324057e-05, 'epoch': 0.33} {'loss': 0.6194, 'learning_rate': 1.9096992308771866e-05, 'epoch': 0.33} {'loss': 0.6814, 'learning_rate': 1.9096852782950902e-05, 'epoch': 0.33} {'loss': 0.5334, 'learning_rate': 1.909671324686132e-05, 'epoch': 0.33} {'loss': 0.6562, 'learning_rate': 1.909657370050328e-05, 'epoch': 0.33} {'loss': 0.576, 'learning_rate': 1.9096434143876937e-05, 'epoch': 0.33} {'loss': 0.6393, 'learning_rate': 1.9096294576982448e-05, 'epoch': 0.33} {'loss': 0.7846, 'learning_rate': 1.9096154999819974e-05, 'epoch': 0.33} {'loss': 0.5816, 'learning_rate': 1.9096015412389672e-05, 'epoch': 0.33} {'loss': 0.6158, 'learning_rate': 1.9095875814691694e-05, 'epoch': 0.33} {'loss': 0.7435, 'learning_rate': 1.9095736206726206e-05, 'epoch': 0.33} {'loss': 0.4691, 'learning_rate': 1.9095596588493358e-05, 'epoch': 0.33} {'loss': 0.5111, 'learning_rate': 1.9095456959993315e-05, 'epoch': 0.33} {'loss': 0.6769, 'learning_rate': 1.9095317321226227e-05, 'epoch': 0.33} {'loss': 0.6658, 'learning_rate': 1.909517767219226e-05, 'epoch': 0.33} {'loss': 0.588, 'learning_rate': 1.9095038012891564e-05, 'epoch': 0.33} {'loss': 0.5769, 'learning_rate': 1.9094898343324297e-05, 'epoch': 0.33} {'loss': 0.5467, 'learning_rate': 1.9094758663490622e-05, 'epoch': 0.33} {'loss': 0.655, 'learning_rate': 1.9094618973390694e-05, 'epoch': 0.33} {'loss': 0.6371, 'learning_rate': 1.909447927302467e-05, 'epoch': 0.33} {'loss': 0.6433, 'learning_rate': 1.909433956239271e-05, 'epoch': 0.33} {'loss': 0.5606, 'learning_rate': 1.9094199841494966e-05, 'epoch': 0.33} {'loss': 0.3849, 'learning_rate': 1.9094060110331606e-05, 'epoch': 0.33} {'loss': 0.6485, 'learning_rate': 1.9093920368902776e-05, 'epoch': 0.33} {'loss': 0.4931, 'learning_rate': 1.9093780617208638e-05, 'epoch': 0.33} {'loss': 0.7974, 'learning_rate': 1.9093640855249356e-05, 'epoch': 0.33} {'loss': 0.5791, 'learning_rate': 1.9093501083025077e-05, 'epoch': 0.33} {'loss': 0.7647, 'learning_rate': 1.909336130053597e-05, 'epoch': 0.33} {'loss': 0.5872, 'learning_rate': 1.9093221507782187e-05, 'epoch': 0.33} {'loss': 0.5497, 'learning_rate': 1.9093081704763884e-05, 'epoch': 0.33} {'loss': 0.454, 'learning_rate': 1.909294189148122e-05, 'epoch': 0.33} {'loss': 0.584, 'learning_rate': 1.9092802067934356e-05, 'epoch': 0.33} {'loss': 0.5696, 'learning_rate': 1.9092662234123448e-05, 'epoch': 0.33} {'loss': 0.6196, 'learning_rate': 1.909252239004865e-05, 'epoch': 0.33} {'loss': 0.4451, 'learning_rate': 1.9092382535710126e-05, 'epoch': 0.33} {'loss': 0.5134, 'learning_rate': 1.909224267110803e-05, 'epoch': 0.33} {'loss': 0.591, 'learning_rate': 1.9092102796242523e-05, 'epoch': 0.33} {'loss': 0.5603, 'learning_rate': 1.9091962911113757e-05, 'epoch': 0.33} {'loss': 0.5788, 'learning_rate': 1.9091823015721896e-05, 'epoch': 0.33} {'loss': 0.7352, 'learning_rate': 1.9091683110067096e-05, 'epoch': 0.33} {'loss': 0.553, 'learning_rate': 1.9091543194149516e-05, 'epoch': 0.33} {'loss': 0.5532, 'learning_rate': 1.9091403267969308e-05, 'epoch': 0.33} {'loss': 0.4198, 'learning_rate': 1.909126333152664e-05, 'epoch': 0.33} {'loss': 0.5799, 'learning_rate': 1.9091123384821658e-05, 'epoch': 0.33} {'loss': 0.492, 'learning_rate': 1.9090983427854533e-05, 'epoch': 0.33} {'loss': 0.5404, 'learning_rate': 1.9090843460625415e-05, 'epoch': 0.33} {'loss': 0.5162, 'learning_rate': 1.9090703483134462e-05, 'epoch': 0.33} {'loss': 0.512, 'learning_rate': 1.909056349538183e-05, 'epoch': 0.33} {'loss': 0.7343, 'learning_rate': 1.9090423497367686e-05, 'epoch': 0.33} {'loss': 0.5289, 'learning_rate': 1.909028348909218e-05, 'epoch': 0.33} {'loss': 0.6949, 'learning_rate': 1.9090143470555472e-05, 'epoch': 0.33} {'loss': 0.5255, 'learning_rate': 1.909000344175772e-05, 'epoch': 0.33} {'loss': 0.6594, 'learning_rate': 1.9089863402699088e-05, 'epoch': 0.33} {'loss': 0.6446, 'learning_rate': 1.9089723353379724e-05, 'epoch': 0.33} {'loss': 0.7086, 'learning_rate': 1.9089583293799793e-05, 'epoch': 0.33} {'loss': 0.6714, 'learning_rate': 1.908944322395945e-05, 'epoch': 0.33} {'loss': 0.5483, 'learning_rate': 1.908930314385885e-05, 'epoch': 0.33} {'loss': 0.6259, 'learning_rate': 1.9089163053498163e-05, 'epoch': 0.33} {'loss': 0.5904, 'learning_rate': 1.9089022952877534e-05, 'epoch': 0.33} {'loss': 0.53, 'learning_rate': 1.908888284199713e-05, 'epoch': 0.33} {'loss': 0.6993, 'learning_rate': 1.9088742720857104e-05, 'epoch': 0.33} {'loss': 0.5018, 'learning_rate': 1.9088602589457612e-05, 'epoch': 0.33} {'loss': 0.5945, 'learning_rate': 1.9088462447798822e-05, 'epoch': 0.33} {'loss': 0.619, 'learning_rate': 1.9088322295880882e-05, 'epoch': 0.33} {'loss': 0.6815, 'learning_rate': 1.9088182133703953e-05, 'epoch': 0.33} {'loss': 0.5644, 'learning_rate': 1.90880419612682e-05, 'epoch': 0.33} {'loss': 0.6083, 'learning_rate': 1.9087901778573773e-05, 'epoch': 0.33} {'loss': 0.5517, 'learning_rate': 1.9087761585620833e-05, 'epoch': 0.33} {'loss': 0.6846, 'learning_rate': 1.908762138240954e-05, 'epoch': 0.33} {'loss': 0.5268, 'learning_rate': 1.9087481168940048e-05, 'epoch': 0.33} {'loss': 0.621, 'learning_rate': 1.9087340945212518e-05, 'epoch': 0.33} {'loss': 0.5439, 'learning_rate': 1.9087200711227107e-05, 'epoch': 0.33} {'loss': 0.678, 'learning_rate': 1.9087060466983978e-05, 'epoch': 0.33} {'loss': 0.694, 'learning_rate': 1.9086920212483283e-05, 'epoch': 0.33} {'loss': 0.5352, 'learning_rate': 1.9086779947725182e-05, 'epoch': 0.33} {'loss': 0.69, 'learning_rate': 1.9086639672709838e-05, 'epoch': 0.33} {'loss': 0.5939, 'learning_rate': 1.9086499387437405e-05, 'epoch': 0.33} {'loss': 0.6493, 'learning_rate': 1.908635909190804e-05, 'epoch': 0.33} {'loss': 0.6098, 'learning_rate': 1.9086218786121903e-05, 'epoch': 0.33} {'loss': 0.5693, 'learning_rate': 1.9086078470079155e-05, 'epoch': 0.33} {'loss': 0.569, 'learning_rate': 1.908593814377995e-05, 'epoch': 0.33} {'loss': 0.4928, 'learning_rate': 1.9085797807224453e-05, 'epoch': 0.33} {'loss': 0.4989, 'learning_rate': 1.9085657460412817e-05, 'epoch': 0.33} {'loss': 0.5381, 'learning_rate': 1.9085517103345198e-05, 'epoch': 0.33} {'loss': 0.4527, 'learning_rate': 1.9085376736021757e-05, 'epoch': 0.33} {'loss': 0.6361, 'learning_rate': 1.908523635844266e-05, 'epoch': 0.33} {'loss': 0.7563, 'learning_rate': 1.9085095970608055e-05, 'epoch': 0.33} {'loss': 0.5745, 'learning_rate': 1.90849555725181e-05, 'epoch': 0.33} {'loss': 0.586, 'learning_rate': 1.9084815164172964e-05, 'epoch': 0.33} {'loss': 0.5536, 'learning_rate': 1.90846747455728e-05, 'epoch': 0.33} {'loss': 0.6077, 'learning_rate': 1.9084534316717758e-05, 'epoch': 0.33} {'loss': 0.6788, 'learning_rate': 1.9084393877608008e-05, 'epoch': 0.33} {'loss': 0.6147, 'learning_rate': 1.9084253428243708e-05, 'epoch': 0.33} {'loss': 0.4914, 'learning_rate': 1.908411296862501e-05, 'epoch': 0.33} {'loss': 0.409, 'learning_rate': 1.9083972498752077e-05, 'epoch': 0.33} {'loss': 0.6464, 'learning_rate': 1.9083832018625065e-05, 'epoch': 0.33} {'loss': 0.5788, 'learning_rate': 1.9083691528244136e-05, 'epoch': 0.33} {'loss': 0.4417, 'learning_rate': 1.9083551027609446e-05, 'epoch': 0.33} {'loss': 0.5228, 'learning_rate': 1.9083410516721155e-05, 'epoch': 0.33} {'loss': 0.3569, 'learning_rate': 1.9083269995579422e-05, 'epoch': 0.33} {'loss': 0.5161, 'learning_rate': 1.90831294641844e-05, 'epoch': 0.33} {'loss': 0.5131, 'learning_rate': 1.9082988922536255e-05, 'epoch': 0.33} {'loss': 0.686, 'learning_rate': 1.9082848370635144e-05, 'epoch': 0.33} {'loss': 0.5867, 'learning_rate': 1.908270780848122e-05, 'epoch': 0.33} {'loss': 0.6659, 'learning_rate': 1.908256723607465e-05, 'epoch': 0.33} {'loss': 0.6134, 'learning_rate': 1.9082426653415588e-05, 'epoch': 0.33} {'loss': 0.4897, 'learning_rate': 1.908228606050419e-05, 'epoch': 0.33} {'loss': 0.5294, 'learning_rate': 1.908214545734062e-05, 'epoch': 0.33} {'loss': 0.614, 'learning_rate': 1.9082004843925037e-05, 'epoch': 0.33} {'loss': 0.5392, 'learning_rate': 1.9081864220257595e-05, 'epoch': 0.33} {'loss': 0.4987, 'learning_rate': 1.908172358633846e-05, 'epoch': 0.33} {'loss': 0.6274, 'learning_rate': 1.908158294216778e-05, 'epoch': 0.33} {'loss': 0.4775, 'learning_rate': 1.9081442287745723e-05, 'epoch': 0.33} {'loss': 0.5091, 'learning_rate': 1.9081301623072444e-05, 'epoch': 0.33} {'loss': 0.5178, 'learning_rate': 1.9081160948148102e-05, 'epoch': 0.33} {'loss': 0.6028, 'learning_rate': 1.9081020262972858e-05, 'epoch': 0.33} {'loss': 0.7075, 'learning_rate': 1.9080879567546865e-05, 'epoch': 0.33} {'loss': 0.5136, 'learning_rate': 1.908073886187029e-05, 'epoch': 0.33} {'loss': 0.5315, 'learning_rate': 1.9080598145943285e-05, 'epoch': 0.33} {'loss': 0.3626, 'learning_rate': 1.9080457419766012e-05, 'epoch': 0.33} {'loss': 0.7051, 'learning_rate': 1.9080316683338627e-05, 'epoch': 0.33} {'loss': 0.6254, 'learning_rate': 1.9080175936661297e-05, 'epoch': 0.33} {'loss': 0.7158, 'learning_rate': 1.908003517973417e-05, 'epoch': 0.33} {'loss': 0.6141, 'learning_rate': 1.9079894412557413e-05, 'epoch': 0.33} {'loss': 0.5412, 'learning_rate': 1.907975363513118e-05, 'epoch': 0.33} {'loss': 0.5789, 'learning_rate': 1.9079612847455633e-05, 'epoch': 0.33} {'loss': 0.4648, 'learning_rate': 1.907947204953093e-05, 'epoch': 0.33} {'loss': 0.6938, 'learning_rate': 1.9079331241357227e-05, 'epoch': 0.33} {'loss': 0.513, 'learning_rate': 1.9079190422934685e-05, 'epoch': 0.33} {'loss': 0.5411, 'learning_rate': 1.9079049594263468e-05, 'epoch': 0.33} {'loss': 0.6047, 'learning_rate': 1.9078908755343728e-05, 'epoch': 0.33} {'loss': 0.6372, 'learning_rate': 1.9078767906175624e-05, 'epoch': 0.33} {'loss': 0.5565, 'learning_rate': 1.907862704675932e-05, 'epoch': 0.33} {'loss': 0.5622, 'learning_rate': 1.9078486177094974e-05, 'epoch': 0.33} {'loss': 0.7373, 'learning_rate': 1.9078345297182743e-05, 'epoch': 0.33} {'loss': 0.5296, 'learning_rate': 1.9078204407022784e-05, 'epoch': 0.33} {'loss': 0.5001, 'learning_rate': 1.907806350661526e-05, 'epoch': 0.33} {'loss': 0.4678, 'learning_rate': 1.907792259596033e-05, 'epoch': 0.33} {'loss': 0.5692, 'learning_rate': 1.9077781675058147e-05, 'epoch': 0.33} {'loss': 0.508, 'learning_rate': 1.907764074390888e-05, 'epoch': 0.33} {'loss': 0.5615, 'learning_rate': 1.907749980251268e-05, 'epoch': 0.33} {'loss': 0.5132, 'learning_rate': 1.9077358850869708e-05, 'epoch': 0.33} {'loss': 0.5399, 'learning_rate': 1.9077217888980127e-05, 'epoch': 0.33} {'loss': 0.6107, 'learning_rate': 1.9077076916844093e-05, 'epoch': 0.33} {'loss': 0.4378, 'learning_rate': 1.9076935934461763e-05, 'epoch': 0.33} {'loss': 0.4616, 'learning_rate': 1.90767949418333e-05, 'epoch': 0.33} {'loss': 0.5858, 'learning_rate': 1.907665393895886e-05, 'epoch': 0.33} {'loss': 0.5667, 'learning_rate': 1.9076512925838605e-05, 'epoch': 0.33} {'loss': 0.6884, 'learning_rate': 1.907637190247269e-05, 'epoch': 0.33} {'loss': 0.6243, 'learning_rate': 1.907623086886128e-05, 'epoch': 0.33} {'loss': 0.5471, 'learning_rate': 1.907608982500453e-05, 'epoch': 0.33} {'loss': 0.5641, 'learning_rate': 1.90759487709026e-05, 'epoch': 0.33} {'loss': 0.6456, 'learning_rate': 1.907580770655565e-05, 'epoch': 0.33} {'loss': 0.6535, 'learning_rate': 1.9075666631963843e-05, 'epoch': 0.33} {'loss': 0.4925, 'learning_rate': 1.907552554712733e-05, 'epoch': 0.33} {'loss': 0.498, 'learning_rate': 1.9075384452046275e-05, 'epoch': 0.33} {'loss': 0.7266, 'learning_rate': 1.907524334672084e-05, 'epoch': 0.33} {'loss': 0.6401, 'learning_rate': 1.9075102231151173e-05, 'epoch': 0.33} {'loss': 0.4533, 'learning_rate': 1.907496110533745e-05, 'epoch': 0.33} {'loss': 0.4866, 'learning_rate': 1.907481996927982e-05, 'epoch': 0.33} {'loss': 0.6645, 'learning_rate': 1.907467882297844e-05, 'epoch': 0.33} {'loss': 0.6119, 'learning_rate': 1.9074537666433474e-05, 'epoch': 0.33} {'loss': 0.7727, 'learning_rate': 1.907439649964508e-05, 'epoch': 0.33} {'loss': 0.5794, 'learning_rate': 1.907425532261342e-05, 'epoch': 0.33} {'loss': 0.6496, 'learning_rate': 1.9074114135338652e-05, 'epoch': 0.33} {'loss': 0.6303, 'learning_rate': 1.9073972937820934e-05, 'epoch': 0.33} {'loss': 0.5357, 'learning_rate': 1.9073831730060426e-05, 'epoch': 0.33} {'loss': 0.6419, 'learning_rate': 1.9073690512057288e-05, 'epoch': 0.33} {'loss': 0.4719, 'learning_rate': 1.9073549283811678e-05, 'epoch': 0.33} {'loss': 0.5892, 'learning_rate': 1.9073408045323755e-05, 'epoch': 0.33} {'loss': 0.4682, 'learning_rate': 1.907326679659368e-05, 'epoch': 0.33} {'loss': 0.347, 'learning_rate': 1.9073125537621614e-05, 'epoch': 0.33} {'loss': 0.5703, 'learning_rate': 1.9072984268407714e-05, 'epoch': 0.33} {'loss': 0.5889, 'learning_rate': 1.9072842988952138e-05, 'epoch': 0.33} {'loss': 0.3993, 'learning_rate': 1.907270169925505e-05, 'epoch': 0.33} {'loss': 0.5947, 'learning_rate': 1.9072560399316605e-05, 'epoch': 0.33} {'loss': 0.3899, 'learning_rate': 1.907241908913697e-05, 'epoch': 0.33} {'loss': 0.5756, 'learning_rate': 1.9072277768716292e-05, 'epoch': 0.33} {'loss': 0.599, 'learning_rate': 1.907213643805474e-05, 'epoch': 0.33} {'loss': 0.7536, 'learning_rate': 1.9071995097152473e-05, 'epoch': 0.33} {'loss': 0.6689, 'learning_rate': 1.9071853746009646e-05, 'epoch': 0.33} {'loss': 0.5678, 'learning_rate': 1.9071712384626425e-05, 'epoch': 0.33} {'loss': 0.5965, 'learning_rate': 1.907157101300296e-05, 'epoch': 0.33} {'loss': 0.6118, 'learning_rate': 1.9071429631139422e-05, 'epoch': 0.33} {'loss': 0.7042, 'learning_rate': 1.9071288239035963e-05, 'epoch': 0.33} {'loss': 0.4007, 'learning_rate': 1.9071146836692742e-05, 'epoch': 0.33} {'loss': 0.6705, 'learning_rate': 1.9071005424109926e-05, 'epoch': 0.33} {'loss': 0.5085, 'learning_rate': 1.9070864001287665e-05, 'epoch': 0.33} {'loss': 0.6953, 'learning_rate': 1.9070722568226124e-05, 'epoch': 0.33} {'loss': 0.44, 'learning_rate': 1.9070581124925465e-05, 'epoch': 0.33} {'loss': 0.569, 'learning_rate': 1.9070439671385842e-05, 'epoch': 0.33} {'loss': 0.4792, 'learning_rate': 1.9070298207607424e-05, 'epoch': 0.33} {'loss': 0.4505, 'learning_rate': 1.907015673359036e-05, 'epoch': 0.33} {'loss': 0.6635, 'learning_rate': 1.907001524933481e-05, 'epoch': 0.33} {'loss': 0.6151, 'learning_rate': 1.906987375484094e-05, 'epoch': 0.33} {'loss': 0.5513, 'learning_rate': 1.906973225010891e-05, 'epoch': 0.33} {'loss': 0.6144, 'learning_rate': 1.9069590735138872e-05, 'epoch': 0.33} {'loss': 0.5026, 'learning_rate': 1.9069449209930992e-05, 'epoch': 0.33} {'loss': 0.4667, 'learning_rate': 1.906930767448543e-05, 'epoch': 0.33} {'loss': 0.6153, 'learning_rate': 1.9069166128802345e-05, 'epoch': 0.33} {'loss': 0.657, 'learning_rate': 1.9069024572881893e-05, 'epoch': 0.33} {'loss': 0.6521, 'learning_rate': 1.906888300672424e-05, 'epoch': 0.33} {'loss': 0.473, 'learning_rate': 1.9068741430329544e-05, 'epoch': 0.33} {'loss': 0.617, 'learning_rate': 1.9068599843697958e-05, 'epoch': 0.33} {'loss': 0.6082, 'learning_rate': 1.906845824682965e-05, 'epoch': 0.33} {'loss': 0.4091, 'learning_rate': 1.9068316639724776e-05, 'epoch': 0.33} {'loss': 0.5429, 'learning_rate': 1.90681750223835e-05, 'epoch': 0.33} {'loss': 0.5362, 'learning_rate': 1.9068033394805975e-05, 'epoch': 0.33} {'loss': 0.4845, 'learning_rate': 1.906789175699237e-05, 'epoch': 0.33} {'loss': 0.5959, 'learning_rate': 1.9067750108942834e-05, 'epoch': 0.33} {'loss': 0.5613, 'learning_rate': 1.9067608450657536e-05, 'epoch': 0.33} {'loss': 0.5779, 'learning_rate': 1.906746678213663e-05, 'epoch': 0.33} {'loss': 0.7573, 'learning_rate': 1.9067325103380278e-05, 'epoch': 0.33} {'loss': 0.6123, 'learning_rate': 1.9067183414388643e-05, 'epoch': 0.33} {'loss': 0.5465, 'learning_rate': 1.9067041715161882e-05, 'epoch': 0.33} {'loss': 0.6152, 'learning_rate': 1.906690000570015e-05, 'epoch': 0.33} {'loss': 0.7649, 'learning_rate': 1.9066758286003616e-05, 'epoch': 0.33} {'loss': 0.5935, 'learning_rate': 1.9066616556072436e-05, 'epoch': 0.33} {'loss': 0.6019, 'learning_rate': 1.906647481590677e-05, 'epoch': 0.33} {'loss': 0.5737, 'learning_rate': 1.9066333065506778e-05, 'epoch': 0.33} {'loss': 0.6909, 'learning_rate': 1.9066191304872622e-05, 'epoch': 0.33} {'loss': 0.4776, 'learning_rate': 1.9066049534004455e-05, 'epoch': 0.33} {'loss': 0.4686, 'learning_rate': 1.9065907752902446e-05, 'epoch': 0.33} {'loss': 0.5503, 'learning_rate': 1.9065765961566747e-05, 'epoch': 0.33} {'loss': 0.5552, 'learning_rate': 1.9065624159997525e-05, 'epoch': 0.33} {'loss': 0.5745, 'learning_rate': 1.906548234819494e-05, 'epoch': 0.33} {'loss': 0.6827, 'learning_rate': 1.9065340526159145e-05, 'epoch': 0.33} {'loss': 0.5984, 'learning_rate': 1.9065198693890305e-05, 'epoch': 0.33} {'loss': 0.602, 'learning_rate': 1.9065056851388585e-05, 'epoch': 0.33} {'loss': 0.5735, 'learning_rate': 1.906491499865413e-05, 'epoch': 0.33} {'loss': 0.528, 'learning_rate': 1.906477313568712e-05, 'epoch': 0.33} {'loss': 0.6921, 'learning_rate': 1.90646312624877e-05, 'epoch': 0.33} {'loss': 0.5366, 'learning_rate': 1.9064489379056033e-05, 'epoch': 0.33} {'loss': 0.5265, 'learning_rate': 1.906434748539228e-05, 'epoch': 0.33} {'loss': 0.5114, 'learning_rate': 1.9064205581496605e-05, 'epoch': 0.33} {'loss': 0.5006, 'learning_rate': 1.906406366736917e-05, 'epoch': 0.33} {'loss': 0.3808, 'learning_rate': 1.906392174301012e-05, 'epoch': 0.33} {'loss': 0.6321, 'learning_rate': 1.9063779808419637e-05, 'epoch': 0.33} {'loss': 0.5244, 'learning_rate': 1.9063637863597865e-05, 'epoch': 0.33} {'loss': 0.6996, 'learning_rate': 1.9063495908544972e-05, 'epoch': 0.33} {'loss': 0.6303, 'learning_rate': 1.9063353943261114e-05, 'epoch': 0.33} {'loss': 0.5336, 'learning_rate': 1.9063211967746453e-05, 'epoch': 0.33} {'loss': 0.5625, 'learning_rate': 1.9063069982001145e-05, 'epoch': 0.33} {'loss': 0.6863, 'learning_rate': 1.906292798602536e-05, 'epoch': 0.33} {'loss': 0.622, 'learning_rate': 1.906278597981925e-05, 'epoch': 0.33} {'loss': 0.6355, 'learning_rate': 1.906264396338298e-05, 'epoch': 0.33} {'loss': 0.5937, 'learning_rate': 1.9062501936716706e-05, 'epoch': 0.33} {'loss': 0.533, 'learning_rate': 1.9062359899820593e-05, 'epoch': 0.33} {'loss': 0.4519, 'learning_rate': 1.9062217852694795e-05, 'epoch': 0.33} {'loss': 0.5703, 'learning_rate': 1.906207579533948e-05, 'epoch': 0.33} {'loss': 0.4488, 'learning_rate': 1.9061933727754806e-05, 'epoch': 0.33} {'loss': 0.7094, 'learning_rate': 1.9061791649940926e-05, 'epoch': 0.33} {'loss': 0.5016, 'learning_rate': 1.9061649561898013e-05, 'epoch': 0.33} {'loss': 0.5318, 'learning_rate': 1.9061507463626214e-05, 'epoch': 0.33} {'loss': 0.4497, 'learning_rate': 1.90613653551257e-05, 'epoch': 0.33} {'loss': 0.6081, 'learning_rate': 1.9061223236396632e-05, 'epoch': 0.33} {'loss': 0.4684, 'learning_rate': 1.9061081107439157e-05, 'epoch': 0.33} {'loss': 0.6501, 'learning_rate': 1.906093896825345e-05, 'epoch': 0.33} {'loss': 0.551, 'learning_rate': 1.9060796818839667e-05, 'epoch': 0.33} {'loss': 0.3972, 'learning_rate': 1.9060654659197966e-05, 'epoch': 0.33} {'loss': 0.5842, 'learning_rate': 1.9060512489328505e-05, 'epoch': 0.33} {'loss': 0.629, 'learning_rate': 1.9060370309231454e-05, 'epoch': 0.33} {'loss': 0.5816, 'learning_rate': 1.9060228118906964e-05, 'epoch': 0.33} {'loss': 0.6204, 'learning_rate': 1.90600859183552e-05, 'epoch': 0.33} {'loss': 0.5733, 'learning_rate': 1.9059943707576326e-05, 'epoch': 0.33} {'loss': 0.5921, 'learning_rate': 1.9059801486570493e-05, 'epoch': 0.33} {'loss': 0.6817, 'learning_rate': 1.905965925533787e-05, 'epoch': 0.33} {'loss': 0.5196, 'learning_rate': 1.9059517013878614e-05, 'epoch': 0.33} {'loss': 0.7548, 'learning_rate': 1.9059374762192885e-05, 'epoch': 0.33} {'loss': 0.6482, 'learning_rate': 1.9059232500280847e-05, 'epoch': 0.33} {'loss': 0.5505, 'learning_rate': 1.9059090228142654e-05, 'epoch': 0.33} {'loss': 0.7371, 'learning_rate': 1.9058947945778473e-05, 'epoch': 0.33} {'loss': 0.4872, 'learning_rate': 1.9058805653188463e-05, 'epoch': 0.33} {'loss': 0.5518, 'learning_rate': 1.9058663350372783e-05, 'epoch': 0.33} {'loss': 0.4423, 'learning_rate': 1.9058521037331593e-05, 'epoch': 0.33} {'loss': 0.5977, 'learning_rate': 1.9058378714065058e-05, 'epoch': 0.33} {'loss': 0.611, 'learning_rate': 1.9058236380573335e-05, 'epoch': 0.33} {'loss': 0.5078, 'learning_rate': 1.905809403685659e-05, 'epoch': 0.33} {'loss': 0.4152, 'learning_rate': 1.9057951682914973e-05, 'epoch': 0.33} {'loss': 0.5636, 'learning_rate': 1.9057809318748656e-05, 'epoch': 0.33} {'loss': 0.7356, 'learning_rate': 1.905766694435779e-05, 'epoch': 0.33} {'loss': 0.7646, 'learning_rate': 1.905752455974254e-05, 'epoch': 0.33} {'loss': 0.5631, 'learning_rate': 1.905738216490307e-05, 'epoch': 0.33} {'loss': 0.591, 'learning_rate': 1.905723975983954e-05, 'epoch': 0.33} {'loss': 0.6022, 'learning_rate': 1.9057097344552104e-05, 'epoch': 0.33} {'loss': 0.5929, 'learning_rate': 1.905695491904093e-05, 'epoch': 0.33} {'loss': 0.6494, 'learning_rate': 1.9056812483306174e-05, 'epoch': 0.33} {'loss': 0.4774, 'learning_rate': 1.9056670037348005e-05, 'epoch': 0.33} {'loss': 0.5748, 'learning_rate': 1.905652758116657e-05, 'epoch': 0.33} {'loss': 0.6239, 'learning_rate': 1.9056385114762043e-05, 'epoch': 0.33} {'loss': 0.6746, 'learning_rate': 1.9056242638134575e-05, 'epoch': 0.33} {'loss': 0.6047, 'learning_rate': 1.9056100151284335e-05, 'epoch': 0.33} {'loss': 0.6698, 'learning_rate': 1.9055957654211478e-05, 'epoch': 0.33} {'loss': 0.6924, 'learning_rate': 1.9055815146916166e-05, 'epoch': 0.33} {'loss': 0.6342, 'learning_rate': 1.9055672629398563e-05, 'epoch': 0.33} {'loss': 0.6729, 'learning_rate': 1.9055530101658827e-05, 'epoch': 0.33} {'loss': 0.5911, 'learning_rate': 1.9055387563697118e-05, 'epoch': 0.33} {'loss': 0.5803, 'learning_rate': 1.90552450155136e-05, 'epoch': 0.33} {'loss': 0.6046, 'learning_rate': 1.9055102457108434e-05, 'epoch': 0.33} {'loss': 0.5751, 'learning_rate': 1.9054959888481777e-05, 'epoch': 0.33} {'loss': 0.5339, 'learning_rate': 1.9054817309633794e-05, 'epoch': 0.33} {'loss': 0.5421, 'learning_rate': 1.905467472056464e-05, 'epoch': 0.33} {'loss': 0.6009, 'learning_rate': 1.9054532121274484e-05, 'epoch': 0.33} {'loss': 0.6136, 'learning_rate': 1.905438951176348e-05, 'epoch': 0.33} {'loss': 0.5331, 'learning_rate': 1.9054246892031793e-05, 'epoch': 0.33} {'loss': 0.4716, 'learning_rate': 1.9054104262079582e-05, 'epoch': 0.33} {'loss': 0.5528, 'learning_rate': 1.905396162190701e-05, 'epoch': 0.33} {'loss': 0.5375, 'learning_rate': 1.905381897151424e-05, 'epoch': 0.33} {'loss': 0.6208, 'learning_rate': 1.905367631090143e-05, 'epoch': 0.33} {'loss': 0.6355, 'learning_rate': 1.9053533640068734e-05, 'epoch': 0.33} {'loss': 0.5056, 'learning_rate': 1.9053390959016326e-05, 'epoch': 0.33} {'loss': 0.638, 'learning_rate': 1.905324826774436e-05, 'epoch': 0.33} {'loss': 0.6864, 'learning_rate': 1.9053105566253e-05, 'epoch': 0.33} {'loss': 0.6663, 'learning_rate': 1.9052962854542404e-05, 'epoch': 0.33} {'loss': 0.7061, 'learning_rate': 1.905282013261273e-05, 'epoch': 0.33} {'loss': 0.6427, 'learning_rate': 1.9052677400464152e-05, 'epoch': 0.33} {'loss': 0.5655, 'learning_rate': 1.9052534658096818e-05, 'epoch': 0.33} {'loss': 0.6855, 'learning_rate': 1.9052391905510892e-05, 'epoch': 0.33} {'loss': 0.5635, 'learning_rate': 1.905224914270654e-05, 'epoch': 0.33} {'loss': 0.5232, 'learning_rate': 1.9052106369683918e-05, 'epoch': 0.33} {'loss': 0.4971, 'learning_rate': 1.905196358644319e-05, 'epoch': 0.33} {'loss': 0.4961, 'learning_rate': 1.9051820792984518e-05, 'epoch': 0.33} {'loss': 0.6093, 'learning_rate': 1.9051677989308058e-05, 'epoch': 0.33} {'loss': 0.601, 'learning_rate': 1.905153517541398e-05, 'epoch': 0.33} {'loss': 0.5277, 'learning_rate': 1.9051392351302436e-05, 'epoch': 0.33} {'loss': 0.7101, 'learning_rate': 1.9051249516973592e-05, 'epoch': 0.33} {'loss': 0.7002, 'learning_rate': 1.905110667242761e-05, 'epoch': 0.33} {'loss': 0.5716, 'learning_rate': 1.9050963817664648e-05, 'epoch': 0.33} {'loss': 0.4597, 'learning_rate': 1.905082095268487e-05, 'epoch': 0.33} {'loss': 0.5802, 'learning_rate': 1.9050678077488434e-05, 'epoch': 0.33} {'loss': 0.6807, 'learning_rate': 1.9050535192075504e-05, 'epoch': 0.33} {'loss': 0.5583, 'learning_rate': 1.9050392296446246e-05, 'epoch': 0.33} {'loss': 0.5947, 'learning_rate': 1.905024939060081e-05, 'epoch': 0.33} {'loss': 0.64, 'learning_rate': 1.9050106474539366e-05, 'epoch': 0.33} {'loss': 0.5255, 'learning_rate': 1.9049963548262073e-05, 'epoch': 0.33} {'loss': 0.5986, 'learning_rate': 1.904982061176909e-05, 'epoch': 0.33} {'loss': 0.5724, 'learning_rate': 1.9049677665060585e-05, 'epoch': 0.33} {'loss': 0.5615, 'learning_rate': 1.904953470813671e-05, 'epoch': 0.33} {'loss': 0.463, 'learning_rate': 1.9049391740997632e-05, 'epoch': 0.33} {'loss': 0.6305, 'learning_rate': 1.9049248763643514e-05, 'epoch': 0.33} {'loss': 0.6408, 'learning_rate': 1.904910577607451e-05, 'epoch': 0.33} {'loss': 0.5534, 'learning_rate': 1.9048962778290792e-05, 'epoch': 0.33} {'loss': 0.5414, 'learning_rate': 1.9048819770292516e-05, 'epoch': 0.33} {'loss': 0.6163, 'learning_rate': 1.9048676752079836e-05, 'epoch': 0.33} {'loss': 0.4444, 'learning_rate': 1.9048533723652928e-05, 'epoch': 0.33} {'loss': 0.5935, 'learning_rate': 1.904839068501194e-05, 'epoch': 0.33} {'loss': 0.5488, 'learning_rate': 1.9048247636157045e-05, 'epoch': 0.33} {'loss': 0.6527, 'learning_rate': 1.9048104577088398e-05, 'epoch': 0.33} {'loss': 0.6111, 'learning_rate': 1.904796150780616e-05, 'epoch': 0.33} {'loss': 0.4094, 'learning_rate': 1.9047818428310494e-05, 'epoch': 0.33} {'loss': 0.5545, 'learning_rate': 1.9047675338601562e-05, 'epoch': 0.33} {'loss': 0.5229, 'learning_rate': 1.9047532238679523e-05, 'epoch': 0.33} {'loss': 0.5914, 'learning_rate': 1.9047389128544544e-05, 'epoch': 0.33} {'loss': 0.619, 'learning_rate': 1.904724600819678e-05, 'epoch': 0.33} {'loss': 0.7794, 'learning_rate': 1.9047102877636398e-05, 'epoch': 0.33} {'loss': 0.4786, 'learning_rate': 1.9046959736863556e-05, 'epoch': 0.33} {'loss': 0.7256, 'learning_rate': 1.9046816585878418e-05, 'epoch': 0.33} {'loss': 0.5252, 'learning_rate': 1.9046673424681145e-05, 'epoch': 0.33} {'loss': 0.6161, 'learning_rate': 1.9046530253271894e-05, 'epoch': 0.33} {'loss': 0.5999, 'learning_rate': 1.9046387071650834e-05, 'epoch': 0.33} {'loss': 0.5227, 'learning_rate': 1.9046243879818125e-05, 'epoch': 0.33} {'loss': 0.5811, 'learning_rate': 1.9046100677773925e-05, 'epoch': 0.33} {'loss': 0.5527, 'learning_rate': 1.9045957465518397e-05, 'epoch': 0.33} {'loss': 0.6367, 'learning_rate': 1.90458142430517e-05, 'epoch': 0.33} {'loss': 0.5571, 'learning_rate': 1.9045671010374006e-05, 'epoch': 0.33} {'loss': 0.7474, 'learning_rate': 1.9045527767485464e-05, 'epoch': 0.33} {'loss': 0.6569, 'learning_rate': 1.904538451438624e-05, 'epoch': 0.33} {'loss': 0.4933, 'learning_rate': 1.9045241251076504e-05, 'epoch': 0.33} {'loss': 0.5212, 'learning_rate': 1.9045097977556405e-05, 'epoch': 0.33} {'loss': 0.4948, 'learning_rate': 1.9044954693826113e-05, 'epoch': 0.33} {'loss': 0.5032, 'learning_rate': 1.9044811399885787e-05, 'epoch': 0.33} {'loss': 0.6497, 'learning_rate': 1.9044668095735587e-05, 'epoch': 0.33} {'loss': 0.593, 'learning_rate': 1.9044524781375676e-05, 'epoch': 0.33} {'loss': 0.5012, 'learning_rate': 1.904438145680622e-05, 'epoch': 0.33} {'loss': 0.4762, 'learning_rate': 1.904423812202737e-05, 'epoch': 0.33} {'loss': 0.7111, 'learning_rate': 1.9044094777039304e-05, 'epoch': 0.33} {'loss': 0.449, 'learning_rate': 1.904395142184217e-05, 'epoch': 0.33} {'loss': 0.4565, 'learning_rate': 1.9043808056436136e-05, 'epoch': 0.33} {'loss': 0.6434, 'learning_rate': 1.9043664680821363e-05, 'epoch': 0.33} {'loss': 0.5529, 'learning_rate': 1.904352129499801e-05, 'epoch': 0.33} {'loss': 0.6897, 'learning_rate': 1.9043377898966243e-05, 'epoch': 0.33} {'loss': 0.61, 'learning_rate': 1.9043234492726222e-05, 'epoch': 0.33} {'loss': 0.5863, 'learning_rate': 1.9043091076278108e-05, 'epoch': 0.33} {'loss': 0.6595, 'learning_rate': 1.9042947649622065e-05, 'epoch': 0.33} {'loss': 0.5892, 'learning_rate': 1.904280421275825e-05, 'epoch': 0.33} {'loss': 0.5542, 'learning_rate': 1.9042660765686834e-05, 'epoch': 0.33} {'loss': 0.548, 'learning_rate': 1.904251730840797e-05, 'epoch': 0.33} {'loss': 0.5962, 'learning_rate': 1.9042373840921823e-05, 'epoch': 0.33} {'loss': 0.5753, 'learning_rate': 1.904223036322856e-05, 'epoch': 0.33} {'loss': 0.6363, 'learning_rate': 1.9042086875328337e-05, 'epoch': 0.33} {'loss': 0.5333, 'learning_rate': 1.904194337722131e-05, 'epoch': 0.33} {'loss': 0.5369, 'learning_rate': 1.9041799868907656e-05, 'epoch': 0.33} {'loss': 0.5556, 'learning_rate': 1.904165635038753e-05, 'epoch': 0.33} {'loss': 0.5867, 'learning_rate': 1.904151282166109e-05, 'epoch': 0.33} {'loss': 0.6068, 'learning_rate': 1.90413692827285e-05, 'epoch': 0.33} {'loss': 0.579, 'learning_rate': 1.9041225733589925e-05, 'epoch': 0.33} {'loss': 0.6288, 'learning_rate': 1.9041082174245527e-05, 'epoch': 0.33} {'loss': 0.4854, 'learning_rate': 1.9040938604695466e-05, 'epoch': 0.33} {'loss': 0.7244, 'learning_rate': 1.9040795024939905e-05, 'epoch': 0.33} {'loss': 0.4672, 'learning_rate': 1.9040651434979003e-05, 'epoch': 0.33} {'loss': 0.5883, 'learning_rate': 1.9040507834812926e-05, 'epoch': 0.33} {'loss': 0.408, 'learning_rate': 1.9040364224441833e-05, 'epoch': 0.33} {'loss': 0.6616, 'learning_rate': 1.904022060386589e-05, 'epoch': 0.33} {'loss': 0.7454, 'learning_rate': 1.904007697308526e-05, 'epoch': 0.33} {'loss': 0.4792, 'learning_rate': 1.9039933332100098e-05, 'epoch': 0.33} {'loss': 0.5537, 'learning_rate': 1.9039789680910572e-05, 'epoch': 0.33} {'loss': 0.599, 'learning_rate': 1.903964601951684e-05, 'epoch': 0.33} {'loss': 0.6462, 'learning_rate': 1.903950234791907e-05, 'epoch': 0.33} {'loss': 0.6979, 'learning_rate': 1.9039358666117417e-05, 'epoch': 0.33} {'loss': 0.7022, 'learning_rate': 1.903921497411205e-05, 'epoch': 0.33} {'loss': 0.3662, 'learning_rate': 1.903907127190313e-05, 'epoch': 0.33} {'loss': 0.491, 'learning_rate': 1.903892755949081e-05, 'epoch': 0.33} {'loss': 0.5888, 'learning_rate': 1.9038783836875265e-05, 'epoch': 0.33} {'loss': 0.6326, 'learning_rate': 1.9038640104056653e-05, 'epoch': 0.33} {'loss': 0.5742, 'learning_rate': 1.9038496361035132e-05, 'epoch': 0.33} {'loss': 0.6327, 'learning_rate': 1.903835260781087e-05, 'epoch': 0.33} {'loss': 0.5478, 'learning_rate': 1.9038208844384027e-05, 'epoch': 0.33} {'loss': 0.5613, 'learning_rate': 1.903806507075476e-05, 'epoch': 0.33} {'loss': 0.4739, 'learning_rate': 1.903792128692324e-05, 'epoch': 0.33} {'loss': 0.4826, 'learning_rate': 1.9037777492889624e-05, 'epoch': 0.33} {'loss': 0.5993, 'learning_rate': 1.903763368865408e-05, 'epoch': 0.34} {'loss': 0.5411, 'learning_rate': 1.903748987421676e-05, 'epoch': 0.34} {'loss': 0.5138, 'learning_rate': 1.9037346049577835e-05, 'epoch': 0.34} {'loss': 0.4896, 'learning_rate': 1.9037202214737465e-05, 'epoch': 0.34} {'loss': 0.6008, 'learning_rate': 1.9037058369695813e-05, 'epoch': 0.34} {'loss': 0.5139, 'learning_rate': 1.903691451445304e-05, 'epoch': 0.34} {'loss': 0.5358, 'learning_rate': 1.9036770649009307e-05, 'epoch': 0.34} {'loss': 0.549, 'learning_rate': 1.9036626773364782e-05, 'epoch': 0.34} {'loss': 0.5814, 'learning_rate': 1.9036482887519622e-05, 'epoch': 0.34} {'loss': 0.4625, 'learning_rate': 1.903633899147399e-05, 'epoch': 0.34} {'loss': 0.4962, 'learning_rate': 1.9036195085228054e-05, 'epoch': 0.34} {'loss': 0.6993, 'learning_rate': 1.903605116878197e-05, 'epoch': 0.34} {'loss': 0.7318, 'learning_rate': 1.90359072421359e-05, 'epoch': 0.34} {'loss': 0.6128, 'learning_rate': 1.903576330529001e-05, 'epoch': 0.34} {'loss': 0.6478, 'learning_rate': 1.903561935824446e-05, 'epoch': 0.34} {'loss': 0.3273, 'learning_rate': 1.9035475400999413e-05, 'epoch': 0.34} {'loss': 0.4549, 'learning_rate': 1.903533143355504e-05, 'epoch': 0.34} {'loss': 0.5366, 'learning_rate': 1.903518745591149e-05, 'epoch': 0.34} {'loss': 0.6461, 'learning_rate': 1.9035043468068934e-05, 'epoch': 0.34} {'loss': 0.4998, 'learning_rate': 1.9034899470027527e-05, 'epoch': 0.34} {'loss': 0.4986, 'learning_rate': 1.903475546178744e-05, 'epoch': 0.34} {'loss': 0.4557, 'learning_rate': 1.9034611443348834e-05, 'epoch': 0.34} {'loss': 0.4344, 'learning_rate': 1.903446741471187e-05, 'epoch': 0.34} {'loss': 0.5814, 'learning_rate': 1.9034323375876706e-05, 'epoch': 0.34} {'loss': 0.5448, 'learning_rate': 1.9034179326843513e-05, 'epoch': 0.34} {'loss': 0.5262, 'learning_rate': 1.9034035267612447e-05, 'epoch': 0.34} {'loss': 0.649, 'learning_rate': 1.9033891198183673e-05, 'epoch': 0.34} {'loss': 0.7415, 'learning_rate': 1.9033747118557354e-05, 'epoch': 0.34} {'loss': 0.6405, 'learning_rate': 1.9033603028733653e-05, 'epoch': 0.34} {'loss': 0.559, 'learning_rate': 1.9033458928712733e-05, 'epoch': 0.34} {'loss': 0.5219, 'learning_rate': 1.903331481849475e-05, 'epoch': 0.34} {'loss': 0.5977, 'learning_rate': 1.903317069807988e-05, 'epoch': 0.34} {'loss': 0.5167, 'learning_rate': 1.9033026567468276e-05, 'epoch': 0.34} {'loss': 0.5992, 'learning_rate': 1.90328824266601e-05, 'epoch': 0.34} {'loss': 0.6517, 'learning_rate': 1.9032738275655518e-05, 'epoch': 0.34} {'loss': 0.7275, 'learning_rate': 1.9032594114454695e-05, 'epoch': 0.34} {'loss': 0.593, 'learning_rate': 1.9032449943057788e-05, 'epoch': 0.34} {'loss': 0.5517, 'learning_rate': 1.9032305761464965e-05, 'epoch': 0.34} {'loss': 0.6246, 'learning_rate': 1.9032161569676383e-05, 'epoch': 0.34} {'loss': 0.6804, 'learning_rate': 1.903201736769221e-05, 'epoch': 0.34} {'loss': 0.5015, 'learning_rate': 1.903187315551261e-05, 'epoch': 0.34} {'loss': 0.6631, 'learning_rate': 1.903172893313774e-05, 'epoch': 0.34} {'loss': 0.5866, 'learning_rate': 1.9031584700567763e-05, 'epoch': 0.34} {'loss': 0.5684, 'learning_rate': 1.9031440457802848e-05, 'epoch': 0.34} {'loss': 0.6567, 'learning_rate': 1.903129620484315e-05, 'epoch': 0.34} {'loss': 0.4967, 'learning_rate': 1.903115194168884e-05, 'epoch': 0.34} {'loss': 0.6407, 'learning_rate': 1.9031007668340075e-05, 'epoch': 0.34} {'loss': 0.4788, 'learning_rate': 1.9030863384797022e-05, 'epoch': 0.34} {'loss': 0.6847, 'learning_rate': 1.9030719091059836e-05, 'epoch': 0.34} {'loss': 0.601, 'learning_rate': 1.903057478712869e-05, 'epoch': 0.34} {'loss': 0.552, 'learning_rate': 1.9030430473003742e-05, 'epoch': 0.34} {'loss': 0.4414, 'learning_rate': 1.9030286148685153e-05, 'epoch': 0.34} {'loss': 0.7666, 'learning_rate': 1.903014181417309e-05, 'epoch': 0.34} {'loss': 0.5915, 'learning_rate': 1.9029997469467717e-05, 'epoch': 0.34} {'loss': 0.5144, 'learning_rate': 1.902985311456919e-05, 'epoch': 0.34} {'loss': 0.5431, 'learning_rate': 1.9029708749477676e-05, 'epoch': 0.34} {'loss': 0.4942, 'learning_rate': 1.9029564374193338e-05, 'epoch': 0.34} {'loss': 0.7138, 'learning_rate': 1.9029419988716338e-05, 'epoch': 0.34} {'loss': 0.6686, 'learning_rate': 1.902927559304684e-05, 'epoch': 0.34} {'loss': 0.7264, 'learning_rate': 1.902913118718501e-05, 'epoch': 0.34} {'loss': 0.7176, 'learning_rate': 1.9028986771131004e-05, 'epoch': 0.34} {'loss': 0.5788, 'learning_rate': 1.9028842344884994e-05, 'epoch': 0.34} {'loss': 0.5507, 'learning_rate': 1.9028697908447134e-05, 'epoch': 0.34} {'loss': 0.5349, 'learning_rate': 1.902855346181759e-05, 'epoch': 0.34} {'loss': 0.6019, 'learning_rate': 1.902840900499653e-05, 'epoch': 0.34} {'loss': 0.5269, 'learning_rate': 1.902826453798411e-05, 'epoch': 0.34} {'loss': 0.5579, 'learning_rate': 1.90281200607805e-05, 'epoch': 0.34} {'loss': 0.6141, 'learning_rate': 1.902797557338585e-05, 'epoch': 0.34} {'loss': 0.4829, 'learning_rate': 1.9027831075800344e-05, 'epoch': 0.34} {'loss': 0.4758, 'learning_rate': 1.9027686568024126e-05, 'epoch': 0.34} {'loss': 0.5925, 'learning_rate': 1.902754205005737e-05, 'epoch': 0.34} {'loss': 0.4684, 'learning_rate': 1.9027397521900233e-05, 'epoch': 0.34} {'loss': 0.4872, 'learning_rate': 1.9027252983552878e-05, 'epoch': 0.34} {'loss': 0.626, 'learning_rate': 1.902710843501548e-05, 'epoch': 0.34} {'loss': 0.5712, 'learning_rate': 1.9026963876288186e-05, 'epoch': 0.34} {'loss': 0.5813, 'learning_rate': 1.9026819307371168e-05, 'epoch': 0.34} {'loss': 0.6207, 'learning_rate': 1.9026674728264587e-05, 'epoch': 0.34} {'loss': 0.6424, 'learning_rate': 1.902653013896861e-05, 'epoch': 0.34} {'loss': 0.6284, 'learning_rate': 1.9026385539483396e-05, 'epoch': 0.34} {'loss': 0.6771, 'learning_rate': 1.9026240929809107e-05, 'epoch': 0.34} {'loss': 0.5298, 'learning_rate': 1.9026096309945906e-05, 'epoch': 0.34} {'loss': 0.5237, 'learning_rate': 1.9025951679893963e-05, 'epoch': 0.34} {'loss': 0.6823, 'learning_rate': 1.9025807039653433e-05, 'epoch': 0.34} {'loss': 0.6909, 'learning_rate': 1.902566238922449e-05, 'epoch': 0.34} {'loss': 0.6969, 'learning_rate': 1.9025517728607285e-05, 'epoch': 0.34} {'loss': 0.6746, 'learning_rate': 1.9025373057801988e-05, 'epoch': 0.34} {'loss': 0.4901, 'learning_rate': 1.902522837680876e-05, 'epoch': 0.34} {'loss': 0.5696, 'learning_rate': 1.902508368562777e-05, 'epoch': 0.34} {'loss': 0.5899, 'learning_rate': 1.902493898425917e-05, 'epoch': 0.34} {'loss': 0.3991, 'learning_rate': 1.9024794272703136e-05, 'epoch': 0.34} {'loss': 0.4367, 'learning_rate': 1.9024649550959822e-05, 'epoch': 0.34} {'loss': 0.5477, 'learning_rate': 1.9024504819029396e-05, 'epoch': 0.34} {'loss': 0.5576, 'learning_rate': 1.902436007691202e-05, 'epoch': 0.34} {'loss': 0.6038, 'learning_rate': 1.9024215324607858e-05, 'epoch': 0.34} {'loss': 0.5546, 'learning_rate': 1.9024070562117072e-05, 'epoch': 0.34} {'loss': 0.596, 'learning_rate': 1.9023925789439824e-05, 'epoch': 0.34} {'loss': 0.6047, 'learning_rate': 1.9023781006576283e-05, 'epoch': 0.34} {'loss': 0.6284, 'learning_rate': 1.9023636213526608e-05, 'epoch': 0.34} {'loss': 0.5388, 'learning_rate': 1.9023491410290966e-05, 'epoch': 0.34} {'loss': 0.5187, 'learning_rate': 1.9023346596869515e-05, 'epoch': 0.34} {'loss': 0.5643, 'learning_rate': 1.9023201773262422e-05, 'epoch': 0.34} {'loss': 0.4658, 'learning_rate': 1.9023056939469853e-05, 'epoch': 0.34} {'loss': 0.7411, 'learning_rate': 1.9022912095491967e-05, 'epoch': 0.34} {'loss': 0.6376, 'learning_rate': 1.9022767241328926e-05, 'epoch': 0.34} {'loss': 0.5833, 'learning_rate': 1.90226223769809e-05, 'epoch': 0.34} {'loss': 0.5269, 'learning_rate': 1.902247750244805e-05, 'epoch': 0.34} {'loss': 0.6537, 'learning_rate': 1.9022332617730534e-05, 'epoch': 0.34} {'loss': 0.5923, 'learning_rate': 1.9022187722828525e-05, 'epoch': 0.34} {'loss': 0.4565, 'learning_rate': 1.902204281774218e-05, 'epoch': 0.34} {'loss': 0.5882, 'learning_rate': 1.9021897902471664e-05, 'epoch': 0.34} {'loss': 0.5824, 'learning_rate': 1.902175297701714e-05, 'epoch': 0.34} {'loss': 0.5084, 'learning_rate': 1.9021608041378772e-05, 'epoch': 0.34} {'loss': 0.622, 'learning_rate': 1.9021463095556724e-05, 'epoch': 0.34} {'loss': 0.5572, 'learning_rate': 1.902131813955116e-05, 'epoch': 0.34} {'loss': 0.5958, 'learning_rate': 1.9021173173362246e-05, 'epoch': 0.34} {'loss': 0.5655, 'learning_rate': 1.9021028196990142e-05, 'epoch': 0.34} {'loss': 0.5396, 'learning_rate': 1.9020883210435012e-05, 'epoch': 0.34} {'loss': 0.7498, 'learning_rate': 1.902073821369702e-05, 'epoch': 0.34} {'loss': 0.5311, 'learning_rate': 1.902059320677633e-05, 'epoch': 0.34} {'loss': 0.5981, 'learning_rate': 1.9020448189673106e-05, 'epoch': 0.34} {'loss': 0.5491, 'learning_rate': 1.9020303162387512e-05, 'epoch': 0.34} {'loss': 0.4738, 'learning_rate': 1.9020158124919707e-05, 'epoch': 0.34} {'loss': 0.5509, 'learning_rate': 1.9020013077269862e-05, 'epoch': 0.34} {'loss': 0.6404, 'learning_rate': 1.9019868019438135e-05, 'epoch': 0.34} {'loss': 0.7126, 'learning_rate': 1.9019722951424697e-05, 'epoch': 0.34} {'loss': 0.4968, 'learning_rate': 1.9019577873229705e-05, 'epoch': 0.34} {'loss': 0.5169, 'learning_rate': 1.9019432784853323e-05, 'epoch': 0.34} {'loss': 0.553, 'learning_rate': 1.9019287686295717e-05, 'epoch': 0.34} {'loss': 0.6561, 'learning_rate': 1.901914257755705e-05, 'epoch': 0.34} {'loss': 0.6339, 'learning_rate': 1.9018997458637486e-05, 'epoch': 0.34} {'loss': 0.6367, 'learning_rate': 1.9018852329537193e-05, 'epoch': 0.34} {'loss': 0.5629, 'learning_rate': 1.9018707190256326e-05, 'epoch': 0.34} {'loss': 0.4595, 'learning_rate': 1.9018562040795055e-05, 'epoch': 0.34} {'loss': 0.635, 'learning_rate': 1.9018416881153543e-05, 'epoch': 0.34} {'loss': 0.624, 'learning_rate': 1.901827171133195e-05, 'epoch': 0.34} {'loss': 0.5062, 'learning_rate': 1.9018126531330447e-05, 'epoch': 0.34} {'loss': 0.5506, 'learning_rate': 1.9017981341149192e-05, 'epoch': 0.34} {'loss': 0.5451, 'learning_rate': 1.9017836140788356e-05, 'epoch': 0.34} {'loss': 0.5671, 'learning_rate': 1.901769093024809e-05, 'epoch': 0.34} {'loss': 0.734, 'learning_rate': 1.901754570952857e-05, 'epoch': 0.34} {'loss': 0.687, 'learning_rate': 1.901740047862996e-05, 'epoch': 0.34} {'loss': 0.4855, 'learning_rate': 1.901725523755241e-05, 'epoch': 0.34} {'loss': 0.4624, 'learning_rate': 1.90171099862961e-05, 'epoch': 0.34} {'loss': 0.6147, 'learning_rate': 1.9016964724861183e-05, 'epoch': 0.34} {'loss': 0.5026, 'learning_rate': 1.901681945324783e-05, 'epoch': 0.34} {'loss': 0.646, 'learning_rate': 1.9016674171456205e-05, 'epoch': 0.34} {'loss': 0.539, 'learning_rate': 1.9016528879486466e-05, 'epoch': 0.34} {'loss': 0.6278, 'learning_rate': 1.901638357733878e-05, 'epoch': 0.34} {'loss': 0.5797, 'learning_rate': 1.9016238265013312e-05, 'epoch': 0.34} {'loss': 0.5086, 'learning_rate': 1.901609294251023e-05, 'epoch': 0.34} {'loss': 0.7494, 'learning_rate': 1.901594760982969e-05, 'epoch': 0.34} {'loss': 0.6814, 'learning_rate': 1.901580226697186e-05, 'epoch': 0.34} {'loss': 0.7018, 'learning_rate': 1.9015656913936903e-05, 'epoch': 0.34} {'loss': 0.4219, 'learning_rate': 1.9015511550724984e-05, 'epoch': 0.34} {'loss': 0.5002, 'learning_rate': 1.9015366177336266e-05, 'epoch': 0.34} {'loss': 0.565, 'learning_rate': 1.9015220793770918e-05, 'epoch': 0.34} {'loss': 0.4818, 'learning_rate': 1.9015075400029092e-05, 'epoch': 0.34} {'loss': 0.4628, 'learning_rate': 1.9014929996110965e-05, 'epoch': 0.34} {'loss': 0.7335, 'learning_rate': 1.90147845820167e-05, 'epoch': 0.34} {'loss': 0.4812, 'learning_rate': 1.901463915774645e-05, 'epoch': 0.34} {'loss': 0.5674, 'learning_rate': 1.9014493723300393e-05, 'epoch': 0.34} {'loss': 0.6435, 'learning_rate': 1.901434827867868e-05, 'epoch': 0.34} {'loss': 0.5307, 'learning_rate': 1.9014202823881487e-05, 'epoch': 0.34} {'loss': 0.7793, 'learning_rate': 1.901405735890898e-05, 'epoch': 0.34} {'loss': 0.4558, 'learning_rate': 1.9013911883761303e-05, 'epoch': 0.34} {'loss': 0.622, 'learning_rate': 1.901376639843864e-05, 'epoch': 0.34} {'loss': 0.5261, 'learning_rate': 1.901362090294115e-05, 'epoch': 0.34} {'loss': 0.595, 'learning_rate': 1.901347539726899e-05, 'epoch': 0.34} {'loss': 0.6495, 'learning_rate': 1.9013329881422335e-05, 'epoch': 0.34} {'loss': 0.4804, 'learning_rate': 1.9013184355401346e-05, 'epoch': 0.34} {'loss': 0.6989, 'learning_rate': 1.9013038819206183e-05, 'epoch': 0.34} {'loss': 0.5261, 'learning_rate': 1.9012893272837013e-05, 'epoch': 0.34} {'loss': 0.7721, 'learning_rate': 1.9012747716294002e-05, 'epoch': 0.34} {'loss': 0.5991, 'learning_rate': 1.901260214957731e-05, 'epoch': 0.34} {'loss': 0.5436, 'learning_rate': 1.9012456572687108e-05, 'epoch': 0.34} {'loss': 0.5392, 'learning_rate': 1.9012310985623555e-05, 'epoch': 0.34} {'loss': 0.467, 'learning_rate': 1.9012165388386814e-05, 'epoch': 0.34} {'loss': 0.4712, 'learning_rate': 1.9012019780977055e-05, 'epoch': 0.34} {'loss': 0.618, 'learning_rate': 1.9011874163394437e-05, 'epoch': 0.34} {'loss': 0.4585, 'learning_rate': 1.901172853563913e-05, 'epoch': 0.34} {'loss': 0.5324, 'learning_rate': 1.901158289771129e-05, 'epoch': 0.34} {'loss': 0.6379, 'learning_rate': 1.9011437249611092e-05, 'epoch': 0.34} {'loss': 0.5825, 'learning_rate': 1.9011291591338692e-05, 'epoch': 0.34} {'loss': 0.6343, 'learning_rate': 1.901114592289426e-05, 'epoch': 0.34} {'loss': 0.6663, 'learning_rate': 1.9011000244277954e-05, 'epoch': 0.34} {'loss': 0.5729, 'learning_rate': 1.9010854555489945e-05, 'epoch': 0.34} {'loss': 0.5437, 'learning_rate': 1.901070885653039e-05, 'epoch': 0.34} {'loss': 0.6704, 'learning_rate': 1.9010563147399463e-05, 'epoch': 0.34} {'loss': 0.5581, 'learning_rate': 1.9010417428097323e-05, 'epoch': 0.34} {'loss': 0.6547, 'learning_rate': 1.9010271698624136e-05, 'epoch': 0.34} {'loss': 0.5672, 'learning_rate': 1.9010125958980062e-05, 'epoch': 0.34} {'loss': 0.5964, 'learning_rate': 1.9009980209165274e-05, 'epoch': 0.34} {'loss': 0.4072, 'learning_rate': 1.900983444917993e-05, 'epoch': 0.34} {'loss': 0.3901, 'learning_rate': 1.900968867902419e-05, 'epoch': 0.34} {'loss': 0.6723, 'learning_rate': 1.9009542898698233e-05, 'epoch': 0.34} {'loss': 0.6367, 'learning_rate': 1.900939710820221e-05, 'epoch': 0.34} {'loss': 0.5547, 'learning_rate': 1.9009251307536295e-05, 'epoch': 0.34} {'loss': 0.4583, 'learning_rate': 1.900910549670065e-05, 'epoch': 0.34} {'loss': 0.4526, 'learning_rate': 1.900895967569543e-05, 'epoch': 0.34} {'loss': 0.5525, 'learning_rate': 1.9008813844520816e-05, 'epoch': 0.34} {'loss': 0.5046, 'learning_rate': 1.900866800317696e-05, 'epoch': 0.34} {'loss': 0.5208, 'learning_rate': 1.900852215166403e-05, 'epoch': 0.34} {'loss': 0.5645, 'learning_rate': 1.9008376289982194e-05, 'epoch': 0.34} {'loss': 0.7115, 'learning_rate': 1.900823041813161e-05, 'epoch': 0.34} {'loss': 0.6308, 'learning_rate': 1.9008084536112453e-05, 'epoch': 0.34} {'loss': 0.6709, 'learning_rate': 1.9007938643924877e-05, 'epoch': 0.34} {'loss': 0.4439, 'learning_rate': 1.9007792741569054e-05, 'epoch': 0.34} {'loss': 0.6361, 'learning_rate': 1.9007646829045145e-05, 'epoch': 0.34} {'loss': 0.697, 'learning_rate': 1.9007500906353315e-05, 'epoch': 0.34} {'loss': 0.4413, 'learning_rate': 1.900735497349373e-05, 'epoch': 0.34} {'loss': 0.6509, 'learning_rate': 1.9007209030466557e-05, 'epoch': 0.34} {'loss': 0.4637, 'learning_rate': 1.900706307727195e-05, 'epoch': 0.34} {'loss': 0.6561, 'learning_rate': 1.9006917113910088e-05, 'epoch': 0.34} {'loss': 0.6399, 'learning_rate': 1.9006771140381128e-05, 'epoch': 0.34} {'loss': 0.5206, 'learning_rate': 1.9006625156685236e-05, 'epoch': 0.34} {'loss': 0.4516, 'learning_rate': 1.9006479162822576e-05, 'epoch': 0.34} {'loss': 0.5622, 'learning_rate': 1.9006333158793312e-05, 'epoch': 0.34} {'loss': 0.6818, 'learning_rate': 1.9006187144597613e-05, 'epoch': 0.34} {'loss': 0.5544, 'learning_rate': 1.9006041120235642e-05, 'epoch': 0.34} {'loss': 0.5759, 'learning_rate': 1.900589508570756e-05, 'epoch': 0.34} {'loss': 0.4841, 'learning_rate': 1.900574904101354e-05, 'epoch': 0.34} {'loss': 0.5383, 'learning_rate': 1.900560298615374e-05, 'epoch': 0.34} {'loss': 0.6411, 'learning_rate': 1.9005456921128326e-05, 'epoch': 0.34} {'loss': 0.5059, 'learning_rate': 1.9005310845937462e-05, 'epoch': 0.34} {'loss': 0.6962, 'learning_rate': 1.9005164760581313e-05, 'epoch': 0.34} {'loss': 0.6202, 'learning_rate': 1.9005018665060053e-05, 'epoch': 0.34} {'loss': 0.5359, 'learning_rate': 1.900487255937383e-05, 'epoch': 0.34} {'loss': 0.664, 'learning_rate': 1.9004726443522825e-05, 'epoch': 0.34} {'loss': 0.6025, 'learning_rate': 1.9004580317507193e-05, 'epoch': 0.34} {'loss': 0.6583, 'learning_rate': 1.90044341813271e-05, 'epoch': 0.34} {'loss': 0.5808, 'learning_rate': 1.900428803498272e-05, 'epoch': 0.34} {'loss': 0.4768, 'learning_rate': 1.9004141878474206e-05, 'epoch': 0.34} {'loss': 0.5267, 'learning_rate': 1.9003995711801728e-05, 'epoch': 0.34} {'loss': 0.6806, 'learning_rate': 1.9003849534965454e-05, 'epoch': 0.34} {'loss': 0.5496, 'learning_rate': 1.9003703347965543e-05, 'epoch': 0.34} {'loss': 0.5433, 'learning_rate': 1.9003557150802166e-05, 'epoch': 0.34} {'loss': 0.4486, 'learning_rate': 1.900341094347548e-05, 'epoch': 0.34} {'loss': 0.7453, 'learning_rate': 1.900326472598566e-05, 'epoch': 0.34} {'loss': 0.4865, 'learning_rate': 1.9003118498332868e-05, 'epoch': 0.34} {'loss': 0.5726, 'learning_rate': 1.900297226051726e-05, 'epoch': 0.34} {'loss': 0.5895, 'learning_rate': 1.9002826012539013e-05, 'epoch': 0.34} {'loss': 0.604, 'learning_rate': 1.9002679754398286e-05, 'epoch': 0.34} {'loss': 0.7555, 'learning_rate': 1.9002533486095247e-05, 'epoch': 0.34} {'loss': 0.6346, 'learning_rate': 1.900238720763006e-05, 'epoch': 0.34} {'loss': 0.515, 'learning_rate': 1.900224091900289e-05, 'epoch': 0.34} {'loss': 0.6088, 'learning_rate': 1.9002094620213898e-05, 'epoch': 0.34} {'loss': 0.4467, 'learning_rate': 1.9001948311263256e-05, 'epoch': 0.34} {'loss': 0.5365, 'learning_rate': 1.9001801992151125e-05, 'epoch': 0.34} {'loss': 0.5436, 'learning_rate': 1.9001655662877673e-05, 'epoch': 0.34} {'loss': 0.5791, 'learning_rate': 1.900150932344306e-05, 'epoch': 0.34} {'loss': 0.5908, 'learning_rate': 1.9001362973847457e-05, 'epoch': 0.34} {'loss': 0.6643, 'learning_rate': 1.9001216614091027e-05, 'epoch': 0.34} {'loss': 0.5415, 'learning_rate': 1.9001070244173935e-05, 'epoch': 0.34} {'loss': 0.6327, 'learning_rate': 1.9000923864096347e-05, 'epoch': 0.34} {'loss': 0.7087, 'learning_rate': 1.9000777473858427e-05, 'epoch': 0.34} {'loss': 0.5391, 'learning_rate': 1.900063107346034e-05, 'epoch': 0.34} {'loss': 0.5456, 'learning_rate': 1.9000484662902254e-05, 'epoch': 0.34} {'loss': 0.5333, 'learning_rate': 1.900033824218433e-05, 'epoch': 0.34} {'loss': 0.5358, 'learning_rate': 1.9000191811306738e-05, 'epoch': 0.34} {'loss': 0.4264, 'learning_rate': 1.900004537026964e-05, 'epoch': 0.34} {'loss': 0.541, 'learning_rate': 1.89998989190732e-05, 'epoch': 0.34} {'loss': 0.5286, 'learning_rate': 1.8999752457717586e-05, 'epoch': 0.34} {'loss': 0.6801, 'learning_rate': 1.8999605986202968e-05, 'epoch': 0.34} {'loss': 0.5112, 'learning_rate': 1.89994595045295e-05, 'epoch': 0.34} {'loss': 0.4556, 'learning_rate': 1.8999313012697354e-05, 'epoch': 0.34} {'loss': 0.6568, 'learning_rate': 1.89991665107067e-05, 'epoch': 0.34} {'loss': 0.6634, 'learning_rate': 1.8999019998557693e-05, 'epoch': 0.34} {'loss': 0.5202, 'learning_rate': 1.8998873476250507e-05, 'epoch': 0.34} {'loss': 0.614, 'learning_rate': 1.8998726943785302e-05, 'epoch': 0.34} {'loss': 0.5375, 'learning_rate': 1.8998580401162248e-05, 'epoch': 0.34} {'loss': 0.6669, 'learning_rate': 1.8998433848381506e-05, 'epoch': 0.34} {'loss': 0.525, 'learning_rate': 1.8998287285443244e-05, 'epoch': 0.34} {'loss': 0.4773, 'learning_rate': 1.8998140712347627e-05, 'epoch': 0.34} {'loss': 0.4737, 'learning_rate': 1.8997994129094818e-05, 'epoch': 0.34} {'loss': 0.4817, 'learning_rate': 1.8997847535684986e-05, 'epoch': 0.34} {'loss': 0.5581, 'learning_rate': 1.8997700932118294e-05, 'epoch': 0.34} {'loss': 0.6329, 'learning_rate': 1.899755431839491e-05, 'epoch': 0.34} {'loss': 0.5906, 'learning_rate': 1.8997407694515e-05, 'epoch': 0.34} {'loss': 0.5727, 'learning_rate': 1.8997261060478724e-05, 'epoch': 0.34} {'loss': 0.5882, 'learning_rate': 1.8997114416286254e-05, 'epoch': 0.34} {'loss': 0.3863, 'learning_rate': 1.899696776193775e-05, 'epoch': 0.34} {'loss': 0.5672, 'learning_rate': 1.8996821097433385e-05, 'epoch': 0.34} {'loss': 0.5172, 'learning_rate': 1.8996674422773313e-05, 'epoch': 0.34} {'loss': 0.4993, 'learning_rate': 1.8996527737957713e-05, 'epoch': 0.34} {'loss': 0.6449, 'learning_rate': 1.899638104298674e-05, 'epoch': 0.34} {'loss': 0.6836, 'learning_rate': 1.8996234337860564e-05, 'epoch': 0.34} {'loss': 0.6508, 'learning_rate': 1.899608762257935e-05, 'epoch': 0.34} {'loss': 0.6048, 'learning_rate': 1.8995940897143266e-05, 'epoch': 0.34} {'loss': 0.3899, 'learning_rate': 1.8995794161552475e-05, 'epoch': 0.34} {'loss': 0.4916, 'learning_rate': 1.8995647415807142e-05, 'epoch': 0.34} {'loss': 0.6593, 'learning_rate': 1.8995500659907433e-05, 'epoch': 0.34} {'loss': 0.6238, 'learning_rate': 1.8995353893853516e-05, 'epoch': 0.34} {'loss': 0.5953, 'learning_rate': 1.899520711764555e-05, 'epoch': 0.34} {'loss': 0.5999, 'learning_rate': 1.899506033128371e-05, 'epoch': 0.34} {'loss': 0.5781, 'learning_rate': 1.8994913534768158e-05, 'epoch': 0.34} {'loss': 0.6214, 'learning_rate': 1.8994766728099056e-05, 'epoch': 0.34} {'loss': 0.6891, 'learning_rate': 1.8994619911276576e-05, 'epoch': 0.34} {'loss': 0.5017, 'learning_rate': 1.8994473084300878e-05, 'epoch': 0.34} {'loss': 0.4307, 'learning_rate': 1.8994326247172132e-05, 'epoch': 0.34} {'loss': 0.6006, 'learning_rate': 1.8994179399890503e-05, 'epoch': 0.34} {'loss': 0.7087, 'learning_rate': 1.8994032542456155e-05, 'epoch': 0.34} {'loss': 0.6165, 'learning_rate': 1.8993885674869252e-05, 'epoch': 0.34} {'loss': 0.5547, 'learning_rate': 1.8993738797129965e-05, 'epoch': 0.34} {'loss': 0.6711, 'learning_rate': 1.8993591909238457e-05, 'epoch': 0.34} {'loss': 0.6311, 'learning_rate': 1.8993445011194892e-05, 'epoch': 0.34} {'loss': 0.6841, 'learning_rate': 1.899329810299944e-05, 'epoch': 0.34} {'loss': 0.5455, 'learning_rate': 1.8993151184652263e-05, 'epoch': 0.34} {'loss': 0.7187, 'learning_rate': 1.899300425615353e-05, 'epoch': 0.34} {'loss': 0.5565, 'learning_rate': 1.8992857317503403e-05, 'epoch': 0.34} {'loss': 0.4823, 'learning_rate': 1.8992710368702054e-05, 'epoch': 0.34} {'loss': 0.6197, 'learning_rate': 1.899256340974964e-05, 'epoch': 0.34} {'loss': 0.5347, 'learning_rate': 1.8992416440646338e-05, 'epoch': 0.34} {'loss': 0.5591, 'learning_rate': 1.8992269461392304e-05, 'epoch': 0.34} {'loss': 0.5958, 'learning_rate': 1.8992122471987708e-05, 'epoch': 0.34} {'loss': 0.5177, 'learning_rate': 1.8991975472432713e-05, 'epoch': 0.34} {'loss': 0.6383, 'learning_rate': 1.8991828462727492e-05, 'epoch': 0.34} {'loss': 0.4979, 'learning_rate': 1.8991681442872204e-05, 'epoch': 0.34} {'loss': 0.4044, 'learning_rate': 1.899153441286702e-05, 'epoch': 0.34} {'loss': 0.535, 'learning_rate': 1.8991387372712102e-05, 'epoch': 0.34} {'loss': 0.5014, 'learning_rate': 1.8991240322407616e-05, 'epoch': 0.34} {'loss': 0.5347, 'learning_rate': 1.899109326195373e-05, 'epoch': 0.34} {'loss': 0.5615, 'learning_rate': 1.8990946191350608e-05, 'epoch': 0.34} {'loss': 0.5379, 'learning_rate': 1.8990799110598422e-05, 'epoch': 0.34} {'loss': 0.7093, 'learning_rate': 1.8990652019697334e-05, 'epoch': 0.34} {'loss': 0.7151, 'learning_rate': 1.8990504918647504e-05, 'epoch': 0.34} {'loss': 0.6117, 'learning_rate': 1.8990357807449108e-05, 'epoch': 0.34} {'loss': 0.6747, 'learning_rate': 1.8990210686102305e-05, 'epoch': 0.34} {'loss': 0.5929, 'learning_rate': 1.8990063554607262e-05, 'epoch': 0.34} {'loss': 0.5603, 'learning_rate': 1.898991641296415e-05, 'epoch': 0.34} {'loss': 0.6262, 'learning_rate': 1.8989769261173134e-05, 'epoch': 0.34} {'loss': 0.599, 'learning_rate': 1.8989622099234374e-05, 'epoch': 0.34} {'loss': 0.6668, 'learning_rate': 1.8989474927148038e-05, 'epoch': 0.34} {'loss': 0.4798, 'learning_rate': 1.89893277449143e-05, 'epoch': 0.34} {'loss': 0.6792, 'learning_rate': 1.898918055253332e-05, 'epoch': 0.34} {'loss': 0.5297, 'learning_rate': 1.898903335000526e-05, 'epoch': 0.34} {'loss': 0.5337, 'learning_rate': 1.8988886137330294e-05, 'epoch': 0.34} {'loss': 0.5132, 'learning_rate': 1.8988738914508585e-05, 'epoch': 0.34} {'loss': 0.5742, 'learning_rate': 1.89885916815403e-05, 'epoch': 0.34} {'loss': 0.5025, 'learning_rate': 1.8988444438425598e-05, 'epoch': 0.34} {'loss': 0.4888, 'learning_rate': 1.8988297185164656e-05, 'epoch': 0.34} {'loss': 0.5473, 'learning_rate': 1.8988149921757638e-05, 'epoch': 0.34} {'loss': 0.5522, 'learning_rate': 1.8988002648204703e-05, 'epoch': 0.34} {'loss': 0.5866, 'learning_rate': 1.8987855364506024e-05, 'epoch': 0.34} {'loss': 0.6009, 'learning_rate': 1.898770807066177e-05, 'epoch': 0.34} {'loss': 0.5328, 'learning_rate': 1.8987560766672097e-05, 'epoch': 0.34} {'loss': 0.7286, 'learning_rate': 1.8987413452537177e-05, 'epoch': 0.34} {'loss': 0.6751, 'learning_rate': 1.8987266128257177e-05, 'epoch': 0.34} {'loss': 0.4314, 'learning_rate': 1.8987118793832264e-05, 'epoch': 0.34} {'loss': 0.5076, 'learning_rate': 1.8986971449262603e-05, 'epoch': 0.34} {'loss': 0.5511, 'learning_rate': 1.898682409454836e-05, 'epoch': 0.34} {'loss': 0.5543, 'learning_rate': 1.8986676729689702e-05, 'epoch': 0.34} {'loss': 0.5613, 'learning_rate': 1.8986529354686794e-05, 'epoch': 0.34} {'loss': 0.6298, 'learning_rate': 1.89863819695398e-05, 'epoch': 0.34} {'loss': 0.6125, 'learning_rate': 1.8986234574248895e-05, 'epoch': 0.34} {'loss': 0.5154, 'learning_rate': 1.8986087168814234e-05, 'epoch': 0.34} {'loss': 0.4197, 'learning_rate': 1.8985939753235992e-05, 'epoch': 0.34} {'loss': 0.4625, 'learning_rate': 1.8985792327514337e-05, 'epoch': 0.34} {'loss': 0.5402, 'learning_rate': 1.898564489164943e-05, 'epoch': 0.34} {'loss': 0.6126, 'learning_rate': 1.8985497445641433e-05, 'epoch': 0.34} {'loss': 0.5757, 'learning_rate': 1.8985349989490523e-05, 'epoch': 0.34} {'loss': 0.6353, 'learning_rate': 1.898520252319686e-05, 'epoch': 0.34} {'loss': 0.5577, 'learning_rate': 1.8985055046760612e-05, 'epoch': 0.34} {'loss': 0.611, 'learning_rate': 1.8984907560181947e-05, 'epoch': 0.34} {'loss': 0.6867, 'learning_rate': 1.898476006346103e-05, 'epoch': 0.34} {'loss': 0.5094, 'learning_rate': 1.8984612556598022e-05, 'epoch': 0.34} {'loss': 0.4425, 'learning_rate': 1.89844650395931e-05, 'epoch': 0.34} {'loss': 0.4886, 'learning_rate': 1.8984317512446422e-05, 'epoch': 0.34} {'loss': 0.5968, 'learning_rate': 1.8984169975158162e-05, 'epoch': 0.34} {'loss': 0.5344, 'learning_rate': 1.898402242772848e-05, 'epoch': 0.34} {'loss': 0.5488, 'learning_rate': 1.8983874870157545e-05, 'epoch': 0.34} {'loss': 0.5908, 'learning_rate': 1.8983727302445528e-05, 'epoch': 0.34} {'loss': 0.4661, 'learning_rate': 1.8983579724592585e-05, 'epoch': 0.34} {'loss': 0.5462, 'learning_rate': 1.8983432136598892e-05, 'epoch': 0.34} {'loss': 0.4516, 'learning_rate': 1.8983284538464612e-05, 'epoch': 0.34} {'loss': 0.5936, 'learning_rate': 1.8983136930189912e-05, 'epoch': 0.34} {'loss': 0.6011, 'learning_rate': 1.8982989311774956e-05, 'epoch': 0.34} {'loss': 0.6692, 'learning_rate': 1.898284168321992e-05, 'epoch': 0.34} {'loss': 0.8244, 'learning_rate': 1.8982694044524955e-05, 'epoch': 0.34} {'loss': 0.4236, 'learning_rate': 1.898254639569024e-05, 'epoch': 0.34} {'loss': 0.5948, 'learning_rate': 1.898239873671594e-05, 'epoch': 0.34} {'loss': 0.5391, 'learning_rate': 1.8982251067602223e-05, 'epoch': 0.34} {'loss': 0.5896, 'learning_rate': 1.898210338834925e-05, 'epoch': 0.34} {'loss': 0.5766, 'learning_rate': 1.8981955698957188e-05, 'epoch': 0.34} {'loss': 0.6712, 'learning_rate': 1.8981807999426207e-05, 'epoch': 0.34} {'loss': 0.6799, 'learning_rate': 1.8981660289756472e-05, 'epoch': 0.34} {'loss': 0.6362, 'learning_rate': 1.8981512569948152e-05, 'epoch': 0.34} {'loss': 0.6858, 'learning_rate': 1.898136484000141e-05, 'epoch': 0.34} {'loss': 0.6266, 'learning_rate': 1.8981217099916417e-05, 'epoch': 0.34} {'loss': 0.4992, 'learning_rate': 1.898106934969334e-05, 'epoch': 0.34} {'loss': 0.4958, 'learning_rate': 1.898092158933234e-05, 'epoch': 0.34} {'loss': 0.5628, 'learning_rate': 1.8980773818833586e-05, 'epoch': 0.34} {'loss': 0.6415, 'learning_rate': 1.898062603819725e-05, 'epoch': 0.34} {'loss': 0.509, 'learning_rate': 1.8980478247423493e-05, 'epoch': 0.34} {'loss': 0.7148, 'learning_rate': 1.8980330446512484e-05, 'epoch': 0.34} {'loss': 0.546, 'learning_rate': 1.898018263546439e-05, 'epoch': 0.34} {'loss': 0.6235, 'learning_rate': 1.8980034814279377e-05, 'epoch': 0.34} {'loss': 0.5761, 'learning_rate': 1.897988698295761e-05, 'epoch': 0.34} {'loss': 0.5544, 'learning_rate': 1.8979739141499263e-05, 'epoch': 0.34} {'loss': 0.5026, 'learning_rate': 1.8979591289904496e-05, 'epoch': 0.34} {'loss': 0.469, 'learning_rate': 1.897944342817348e-05, 'epoch': 0.34} {'loss': 0.6202, 'learning_rate': 1.8979295556306377e-05, 'epoch': 0.34} {'loss': 0.7199, 'learning_rate': 1.8979147674303354e-05, 'epoch': 0.34} {'loss': 0.5956, 'learning_rate': 1.8978999782164585e-05, 'epoch': 0.34} {'loss': 0.4913, 'learning_rate': 1.897885187989023e-05, 'epoch': 0.34} {'loss': 0.6125, 'learning_rate': 1.8978703967480463e-05, 'epoch': 0.34} {'loss': 0.4593, 'learning_rate': 1.8978556044935445e-05, 'epoch': 0.34} {'loss': 0.6509, 'learning_rate': 1.8978408112255345e-05, 'epoch': 0.34} {'loss': 0.7587, 'learning_rate': 1.8978260169440327e-05, 'epoch': 0.34} {'loss': 0.6139, 'learning_rate': 1.897811221649056e-05, 'epoch': 0.34} {'loss': 0.6587, 'learning_rate': 1.8977964253406215e-05, 'epoch': 0.34} {'loss': 0.7595, 'learning_rate': 1.8977816280187454e-05, 'epoch': 0.34} {'loss': 0.6541, 'learning_rate': 1.8977668296834445e-05, 'epoch': 0.34} {'loss': 0.8394, 'learning_rate': 1.8977520303347358e-05, 'epoch': 0.34} {'loss': 0.5441, 'learning_rate': 1.8977372299726355e-05, 'epoch': 0.34} {'loss': 0.7154, 'learning_rate': 1.897722428597161e-05, 'epoch': 0.34} {'loss': 0.6354, 'learning_rate': 1.897707626208328e-05, 'epoch': 0.34} {'loss': 0.6649, 'learning_rate': 1.8976928228061542e-05, 'epoch': 0.34} {'loss': 0.6716, 'learning_rate': 1.8976780183906556e-05, 'epoch': 0.34} {'loss': 0.5361, 'learning_rate': 1.8976632129618492e-05, 'epoch': 0.34} {'loss': 0.5939, 'learning_rate': 1.8976484065197522e-05, 'epoch': 0.34} {'loss': 0.4947, 'learning_rate': 1.8976335990643805e-05, 'epoch': 0.34} {'loss': 0.5826, 'learning_rate': 1.8976187905957513e-05, 'epoch': 0.34} {'loss': 0.6546, 'learning_rate': 1.897603981113881e-05, 'epoch': 0.34} {'loss': 0.9305, 'learning_rate': 1.8975891706187866e-05, 'epoch': 0.34} {'loss': 0.4371, 'learning_rate': 1.8975743591104845e-05, 'epoch': 0.34} {'loss': 0.5011, 'learning_rate': 1.897559546588992e-05, 'epoch': 0.34} {'loss': 0.509, 'learning_rate': 1.8975447330543254e-05, 'epoch': 0.34} {'loss': 0.5588, 'learning_rate': 1.897529918506501e-05, 'epoch': 0.34} {'loss': 0.4888, 'learning_rate': 1.8975151029455364e-05, 'epoch': 0.34} {'loss': 0.4281, 'learning_rate': 1.897500286371448e-05, 'epoch': 0.34} {'loss': 0.6769, 'learning_rate': 1.8974854687842525e-05, 'epoch': 0.34} {'loss': 0.5468, 'learning_rate': 1.8974706501839665e-05, 'epoch': 0.34} {'loss': 0.493, 'learning_rate': 1.8974558305706064e-05, 'epoch': 0.34} {'loss': 0.4387, 'learning_rate': 1.8974410099441898e-05, 'epoch': 0.34} {'loss': 0.5746, 'learning_rate': 1.8974261883047327e-05, 'epoch': 0.34} {'loss': 0.5917, 'learning_rate': 1.8974113656522522e-05, 'epoch': 0.34} {'loss': 0.4988, 'learning_rate': 1.8973965419867648e-05, 'epoch': 0.34} {'loss': 0.4385, 'learning_rate': 1.8973817173082873e-05, 'epoch': 0.34} {'loss': 0.5584, 'learning_rate': 1.897366891616837e-05, 'epoch': 0.34} {'loss': 0.7355, 'learning_rate': 1.8973520649124294e-05, 'epoch': 0.34} {'loss': 0.5624, 'learning_rate': 1.8973372371950826e-05, 'epoch': 0.34} {'loss': 0.4403, 'learning_rate': 1.8973224084648125e-05, 'epoch': 0.34} {'loss': 0.4699, 'learning_rate': 1.8973075787216356e-05, 'epoch': 0.34} {'loss': 0.537, 'learning_rate': 1.8972927479655693e-05, 'epoch': 0.34} {'loss': 0.6275, 'learning_rate': 1.8972779161966304e-05, 'epoch': 0.34} {'loss': 0.5879, 'learning_rate': 1.897263083414835e-05, 'epoch': 0.34} {'loss': 0.5398, 'learning_rate': 1.8972482496202006e-05, 'epoch': 0.34} {'loss': 0.5641, 'learning_rate': 1.8972334148127432e-05, 'epoch': 0.34} {'loss': 0.5293, 'learning_rate': 1.89721857899248e-05, 'epoch': 0.34} {'loss': 0.5917, 'learning_rate': 1.8972037421594277e-05, 'epoch': 0.34} {'loss': 0.6657, 'learning_rate': 1.8971889043136027e-05, 'epoch': 0.34} {'loss': 0.672, 'learning_rate': 1.8971740654550225e-05, 'epoch': 0.34} {'loss': 0.5079, 'learning_rate': 1.8971592255837033e-05, 'epoch': 0.34} {'loss': 0.6924, 'learning_rate': 1.8971443846996617e-05, 'epoch': 0.34} {'loss': 0.5555, 'learning_rate': 1.897129542802915e-05, 'epoch': 0.34} {'loss': 0.5721, 'learning_rate': 1.8971146998934792e-05, 'epoch': 0.34} {'loss': 0.4605, 'learning_rate': 1.8970998559713716e-05, 'epoch': 0.34} {'loss': 0.5448, 'learning_rate': 1.897085011036609e-05, 'epoch': 0.34} {'loss': 0.6658, 'learning_rate': 1.897070165089208e-05, 'epoch': 0.34} {'loss': 0.6963, 'learning_rate': 1.8970553181291853e-05, 'epoch': 0.34} {'loss': 0.6689, 'learning_rate': 1.897040470156558e-05, 'epoch': 0.34} {'loss': 0.6935, 'learning_rate': 1.8970256211713422e-05, 'epoch': 0.34} {'loss': 0.5792, 'learning_rate': 1.8970107711735554e-05, 'epoch': 0.34} {'loss': 0.7069, 'learning_rate': 1.896995920163214e-05, 'epoch': 0.34} {'loss': 0.6828, 'learning_rate': 1.8969810681403342e-05, 'epoch': 0.34} {'loss': 0.6992, 'learning_rate': 1.896966215104934e-05, 'epoch': 0.34} {'loss': 0.5971, 'learning_rate': 1.896951361057029e-05, 'epoch': 0.34} {'loss': 0.6256, 'learning_rate': 1.8969365059966368e-05, 'epoch': 0.34} {'loss': 0.6613, 'learning_rate': 1.8969216499237738e-05, 'epoch': 0.34} {'loss': 0.5239, 'learning_rate': 1.8969067928384567e-05, 'epoch': 0.34} {'loss': 0.6699, 'learning_rate': 1.8968919347407025e-05, 'epoch': 0.34} {'loss': 0.8229, 'learning_rate': 1.896877075630528e-05, 'epoch': 0.34} {'loss': 0.517, 'learning_rate': 1.8968622155079498e-05, 'epoch': 0.34} {'loss': 0.4852, 'learning_rate': 1.8968473543729845e-05, 'epoch': 0.34} {'loss': 0.5621, 'learning_rate': 1.896832492225649e-05, 'epoch': 0.34} {'loss': 0.5475, 'learning_rate': 1.8968176290659603e-05, 'epoch': 0.34} {'loss': 0.7579, 'learning_rate': 1.896802764893935e-05, 'epoch': 0.34} {'loss': 0.645, 'learning_rate': 1.8967878997095905e-05, 'epoch': 0.34} {'loss': 0.4973, 'learning_rate': 1.896773033512942e-05, 'epoch': 0.34} {'loss': 0.5566, 'learning_rate': 1.8967581663040077e-05, 'epoch': 0.34} {'loss': 0.748, 'learning_rate': 1.8967432980828044e-05, 'epoch': 0.34} {'loss': 0.4595, 'learning_rate': 1.8967284288493476e-05, 'epoch': 0.34} {'loss': 0.7425, 'learning_rate': 1.8967135586036556e-05, 'epoch': 0.34} {'loss': 0.6773, 'learning_rate': 1.8966986873457443e-05, 'epoch': 0.35} {'loss': 0.5687, 'learning_rate': 1.8966838150756306e-05, 'epoch': 0.35} {'loss': 0.7153, 'learning_rate': 1.8966689417933316e-05, 'epoch': 0.35} {'loss': 0.6473, 'learning_rate': 1.8966540674988634e-05, 'epoch': 0.35} {'loss': 0.5202, 'learning_rate': 1.8966391921922438e-05, 'epoch': 0.35} {'loss': 0.5348, 'learning_rate': 1.8966243158734888e-05, 'epoch': 0.35} {'loss': 0.5946, 'learning_rate': 1.8966094385426156e-05, 'epoch': 0.35} {'loss': 0.6752, 'learning_rate': 1.8965945601996406e-05, 'epoch': 0.35} {'loss': 0.6662, 'learning_rate': 1.896579680844581e-05, 'epoch': 0.35} {'loss': 0.4733, 'learning_rate': 1.8965648004774536e-05, 'epoch': 0.35} {'loss': 0.6652, 'learning_rate': 1.896549919098275e-05, 'epoch': 0.35} {'loss': 0.5386, 'learning_rate': 1.8965350367070618e-05, 'epoch': 0.35} {'loss': 0.5952, 'learning_rate': 1.896520153303831e-05, 'epoch': 0.35} {'loss': 0.6108, 'learning_rate': 1.8965052688885995e-05, 'epoch': 0.35} {'loss': 0.6163, 'learning_rate': 1.896490383461384e-05, 'epoch': 0.35} {'loss': 0.591, 'learning_rate': 1.8964754970222013e-05, 'epoch': 0.35} {'loss': 0.5807, 'learning_rate': 1.8964606095710682e-05, 'epoch': 0.35} {'loss': 0.6415, 'learning_rate': 1.8964457211080018e-05, 'epoch': 0.35} {'loss': 0.4671, 'learning_rate': 1.8964308316330186e-05, 'epoch': 0.35} {'loss': 0.4712, 'learning_rate': 1.896415941146135e-05, 'epoch': 0.35} {'loss': 0.5673, 'learning_rate': 1.896401049647369e-05, 'epoch': 0.35} {'loss': 0.5923, 'learning_rate': 1.8963861571367362e-05, 'epoch': 0.35} {'loss': 0.713, 'learning_rate': 1.896371263614254e-05, 'epoch': 0.35} {'loss': 0.555, 'learning_rate': 1.896356369079939e-05, 'epoch': 0.35} {'loss': 0.509, 'learning_rate': 1.896341473533808e-05, 'epoch': 0.35} {'loss': 0.5251, 'learning_rate': 1.896326576975878e-05, 'epoch': 0.35} {'loss': 0.5874, 'learning_rate': 1.896311679406166e-05, 'epoch': 0.35} {'loss': 0.5005, 'learning_rate': 1.8962967808246886e-05, 'epoch': 0.35} {'loss': 0.6148, 'learning_rate': 1.8962818812314622e-05, 'epoch': 0.35} {'loss': 0.6252, 'learning_rate': 1.8962669806265044e-05, 'epoch': 0.35} {'loss': 0.6777, 'learning_rate': 1.8962520790098315e-05, 'epoch': 0.35} {'loss': 0.5682, 'learning_rate': 1.89623717638146e-05, 'epoch': 0.35} {'loss': 0.6182, 'learning_rate': 1.8962222727414077e-05, 'epoch': 0.35} {'loss': 0.5954, 'learning_rate': 1.8962073680896903e-05, 'epoch': 0.35} {'loss': 0.6526, 'learning_rate': 1.8961924624263256e-05, 'epoch': 0.35} {'loss': 0.6471, 'learning_rate': 1.89617755575133e-05, 'epoch': 0.35} {'loss': 0.5953, 'learning_rate': 1.8961626480647205e-05, 'epoch': 0.35} {'loss': 0.5864, 'learning_rate': 1.8961477393665137e-05, 'epoch': 0.35} {'loss': 0.4945, 'learning_rate': 1.8961328296567262e-05, 'epoch': 0.35} {'loss': 0.4534, 'learning_rate': 1.8961179189353754e-05, 'epoch': 0.35} {'loss': 0.4259, 'learning_rate': 1.896103007202478e-05, 'epoch': 0.35} {'loss': 0.434, 'learning_rate': 1.8960880944580506e-05, 'epoch': 0.35} {'loss': 0.5913, 'learning_rate': 1.89607318070211e-05, 'epoch': 0.35} {'loss': 0.3584, 'learning_rate': 1.896058265934673e-05, 'epoch': 0.35} {'loss': 0.663, 'learning_rate': 1.8960433501557572e-05, 'epoch': 0.35} {'loss': 0.5864, 'learning_rate': 1.8960284333653784e-05, 'epoch': 0.35} {'loss': 0.703, 'learning_rate': 1.8960135155635542e-05, 'epoch': 0.35} {'loss': 0.5475, 'learning_rate': 1.8959985967503008e-05, 'epoch': 0.35} {'loss': 0.5752, 'learning_rate': 1.8959836769256355e-05, 'epoch': 0.35} {'loss': 0.6516, 'learning_rate': 1.895968756089575e-05, 'epoch': 0.35} {'loss': 0.4207, 'learning_rate': 1.895953834242136e-05, 'epoch': 0.35} {'loss': 0.563, 'learning_rate': 1.8959389113833358e-05, 'epoch': 0.35} {'loss': 0.4612, 'learning_rate': 1.8959239875131906e-05, 'epoch': 0.35} {'loss': 0.4925, 'learning_rate': 1.895909062631718e-05, 'epoch': 0.35} {'loss': 0.5625, 'learning_rate': 1.8958941367389344e-05, 'epoch': 0.35} {'loss': 0.6003, 'learning_rate': 1.8958792098348565e-05, 'epoch': 0.35} {'loss': 0.4348, 'learning_rate': 1.8958642819195013e-05, 'epoch': 0.35} {'loss': 0.4671, 'learning_rate': 1.8958493529928856e-05, 'epoch': 0.35} {'loss': 0.7239, 'learning_rate': 1.8958344230550264e-05, 'epoch': 0.35} {'loss': 0.6613, 'learning_rate': 1.8958194921059406e-05, 'epoch': 0.35} {'loss': 0.5365, 'learning_rate': 1.895804560145645e-05, 'epoch': 0.35} {'loss': 0.5741, 'learning_rate': 1.8957896271741562e-05, 'epoch': 0.35} {'loss': 0.6381, 'learning_rate': 1.8957746931914914e-05, 'epoch': 0.35} {'loss': 0.6114, 'learning_rate': 1.895759758197667e-05, 'epoch': 0.35} {'loss': 0.5601, 'learning_rate': 1.8957448221927003e-05, 'epoch': 0.35} {'loss': 0.551, 'learning_rate': 1.8957298851766083e-05, 'epoch': 0.35} {'loss': 0.5374, 'learning_rate': 1.8957149471494072e-05, 'epoch': 0.35} {'loss': 0.6833, 'learning_rate': 1.8957000081111148e-05, 'epoch': 0.35} {'loss': 0.5153, 'learning_rate': 1.895685068061747e-05, 'epoch': 0.35} {'loss': 0.5984, 'learning_rate': 1.8956701270013213e-05, 'epoch': 0.35} {'loss': 0.5541, 'learning_rate': 1.8956551849298544e-05, 'epoch': 0.35} {'loss': 0.6127, 'learning_rate': 1.8956402418473628e-05, 'epoch': 0.35} {'loss': 0.651, 'learning_rate': 1.895625297753864e-05, 'epoch': 0.35} {'loss': 0.6419, 'learning_rate': 1.895610352649374e-05, 'epoch': 0.35} {'loss': 0.4193, 'learning_rate': 1.895595406533911e-05, 'epoch': 0.35} {'loss': 0.5986, 'learning_rate': 1.8955804594074902e-05, 'epoch': 0.35} {'loss': 0.5561, 'learning_rate': 1.89556551127013e-05, 'epoch': 0.35} {'loss': 0.4855, 'learning_rate': 1.8955505621218465e-05, 'epoch': 0.35} {'loss': 0.6994, 'learning_rate': 1.8955356119626566e-05, 'epoch': 0.35} {'loss': 0.7923, 'learning_rate': 1.8955206607925776e-05, 'epoch': 0.35} {'loss': 0.6169, 'learning_rate': 1.8955057086116257e-05, 'epoch': 0.35} {'loss': 0.6336, 'learning_rate': 1.8954907554198183e-05, 'epoch': 0.35} {'loss': 0.5918, 'learning_rate': 1.895475801217172e-05, 'epoch': 0.35} {'loss': 0.6525, 'learning_rate': 1.895460846003704e-05, 'epoch': 0.35} {'loss': 0.7196, 'learning_rate': 1.895445889779431e-05, 'epoch': 0.35} {'loss': 0.6871, 'learning_rate': 1.8954309325443696e-05, 'epoch': 0.35} {'loss': 0.6149, 'learning_rate': 1.8954159742985375e-05, 'epoch': 0.35} {'loss': 0.5168, 'learning_rate': 1.8954010150419505e-05, 'epoch': 0.35} {'loss': 0.5059, 'learning_rate': 1.895386054774626e-05, 'epoch': 0.35} {'loss': 0.6325, 'learning_rate': 1.895371093496581e-05, 'epoch': 0.35} {'loss': 0.6137, 'learning_rate': 1.8953561312078326e-05, 'epoch': 0.35} {'loss': 0.5968, 'learning_rate': 1.895341167908397e-05, 'epoch': 0.35} {'loss': 0.4135, 'learning_rate': 1.8953262035982918e-05, 'epoch': 0.35} {'loss': 0.6913, 'learning_rate': 1.8953112382775333e-05, 'epoch': 0.35} {'loss': 0.5936, 'learning_rate': 1.895296271946139e-05, 'epoch': 0.35} {'loss': 0.6292, 'learning_rate': 1.895281304604125e-05, 'epoch': 0.35} {'loss': 0.5258, 'learning_rate': 1.895266336251509e-05, 'epoch': 0.35} {'loss': 0.54, 'learning_rate': 1.8952513668883074e-05, 'epoch': 0.35} {'loss': 0.672, 'learning_rate': 1.8952363965145373e-05, 'epoch': 0.35} {'loss': 0.6776, 'learning_rate': 1.8952214251302156e-05, 'epoch': 0.35} {'loss': 0.662, 'learning_rate': 1.895206452735359e-05, 'epoch': 0.35} {'loss': 0.5253, 'learning_rate': 1.8951914793299846e-05, 'epoch': 0.35} {'loss': 0.5972, 'learning_rate': 1.8951765049141092e-05, 'epoch': 0.35} {'loss': 0.5861, 'learning_rate': 1.89516152948775e-05, 'epoch': 0.35} {'loss': 0.5466, 'learning_rate': 1.8951465530509234e-05, 'epoch': 0.35} {'loss': 0.628, 'learning_rate': 1.895131575603647e-05, 'epoch': 0.35} {'loss': 0.6238, 'learning_rate': 1.8951165971459367e-05, 'epoch': 0.35} {'loss': 0.5816, 'learning_rate': 1.89510161767781e-05, 'epoch': 0.35} {'loss': 0.4454, 'learning_rate': 1.895086637199284e-05, 'epoch': 0.35} {'loss': 0.4541, 'learning_rate': 1.8950716557103756e-05, 'epoch': 0.35} {'loss': 0.5079, 'learning_rate': 1.895056673211101e-05, 'epoch': 0.35} {'loss': 0.5832, 'learning_rate': 1.8950416897014777e-05, 'epoch': 0.35} {'loss': 0.5381, 'learning_rate': 1.8950267051815228e-05, 'epoch': 0.35} {'loss': 0.5223, 'learning_rate': 1.895011719651253e-05, 'epoch': 0.35} {'loss': 0.5801, 'learning_rate': 1.8949967331106852e-05, 'epoch': 0.35} {'loss': 0.6297, 'learning_rate': 1.894981745559836e-05, 'epoch': 0.35} {'loss': 0.4043, 'learning_rate': 1.8949667569987226e-05, 'epoch': 0.35} {'loss': 0.629, 'learning_rate': 1.894951767427362e-05, 'epoch': 0.35} {'loss': 0.6831, 'learning_rate': 1.8949367768457714e-05, 'epoch': 0.35} {'loss': 0.6281, 'learning_rate': 1.894921785253967e-05, 'epoch': 0.35} {'loss': 0.4961, 'learning_rate': 1.894906792651966e-05, 'epoch': 0.35} {'loss': 0.5104, 'learning_rate': 1.8948917990397855e-05, 'epoch': 0.35} {'loss': 0.666, 'learning_rate': 1.894876804417442e-05, 'epoch': 0.35} {'loss': 0.5478, 'learning_rate': 1.8948618087849534e-05, 'epoch': 0.35} {'loss': 0.6409, 'learning_rate': 1.8948468121423354e-05, 'epoch': 0.35} {'loss': 0.5068, 'learning_rate': 1.894831814489606e-05, 'epoch': 0.35} {'loss': 0.736, 'learning_rate': 1.8948168158267813e-05, 'epoch': 0.35} {'loss': 0.7152, 'learning_rate': 1.894801816153879e-05, 'epoch': 0.35} {'loss': 0.4332, 'learning_rate': 1.8947868154709153e-05, 'epoch': 0.35} {'loss': 0.5383, 'learning_rate': 1.8947718137779075e-05, 'epoch': 0.35} {'loss': 0.5883, 'learning_rate': 1.8947568110748725e-05, 'epoch': 0.35} {'loss': 0.6169, 'learning_rate': 1.894741807361827e-05, 'epoch': 0.35} {'loss': 0.6461, 'learning_rate': 1.8947268026387885e-05, 'epoch': 0.35} {'loss': 0.4837, 'learning_rate': 1.894711796905773e-05, 'epoch': 0.35} {'loss': 0.739, 'learning_rate': 1.8946967901627985e-05, 'epoch': 0.35} {'loss': 0.6059, 'learning_rate': 1.8946817824098815e-05, 'epoch': 0.35} {'loss': 0.5855, 'learning_rate': 1.8946667736470386e-05, 'epoch': 0.35} {'loss': 0.5386, 'learning_rate': 1.8946517638742872e-05, 'epoch': 0.35} {'loss': 0.5574, 'learning_rate': 1.8946367530916438e-05, 'epoch': 0.35} {'loss': 0.5701, 'learning_rate': 1.894621741299126e-05, 'epoch': 0.35} {'loss': 0.4956, 'learning_rate': 1.8946067284967502e-05, 'epoch': 0.35} {'loss': 0.5742, 'learning_rate': 1.8945917146845336e-05, 'epoch': 0.35} {'loss': 0.4853, 'learning_rate': 1.894576699862493e-05, 'epoch': 0.35} {'loss': 0.6803, 'learning_rate': 1.8945616840306456e-05, 'epoch': 0.35} {'loss': 0.6281, 'learning_rate': 1.894546667189008e-05, 'epoch': 0.35} {'loss': 0.4564, 'learning_rate': 1.8945316493375973e-05, 'epoch': 0.35} {'loss': 0.6023, 'learning_rate': 1.8945166304764308e-05, 'epoch': 0.35} {'loss': 0.5683, 'learning_rate': 1.8945016106055247e-05, 'epoch': 0.35} {'loss': 0.6496, 'learning_rate': 1.8944865897248963e-05, 'epoch': 0.35} {'loss': 0.6613, 'learning_rate': 1.8944715678345627e-05, 'epoch': 0.35} {'loss': 0.4406, 'learning_rate': 1.894456544934541e-05, 'epoch': 0.35} {'loss': 0.5203, 'learning_rate': 1.894441521024848e-05, 'epoch': 0.35} {'loss': 0.5577, 'learning_rate': 1.8944264961055006e-05, 'epoch': 0.35} {'loss': 0.5094, 'learning_rate': 1.8944114701765156e-05, 'epoch': 0.35} {'loss': 0.4909, 'learning_rate': 1.8943964432379103e-05, 'epoch': 0.35} {'loss': 0.5857, 'learning_rate': 1.8943814152897014e-05, 'epoch': 0.35} {'loss': 0.6738, 'learning_rate': 1.8943663863319058e-05, 'epoch': 0.35} {'loss': 0.5977, 'learning_rate': 1.8943513563645408e-05, 'epoch': 0.35} {'loss': 0.6187, 'learning_rate': 1.8943363253876233e-05, 'epoch': 0.35} {'loss': 0.5179, 'learning_rate': 1.89432129340117e-05, 'epoch': 0.35} {'loss': 0.5508, 'learning_rate': 1.894306260405198e-05, 'epoch': 0.35} {'loss': 0.5579, 'learning_rate': 1.8942912263997243e-05, 'epoch': 0.35} {'loss': 0.4328, 'learning_rate': 1.894276191384766e-05, 'epoch': 0.35} {'loss': 0.5642, 'learning_rate': 1.8942611553603395e-05, 'epoch': 0.35} {'loss': 0.531, 'learning_rate': 1.8942461183264628e-05, 'epoch': 0.35} {'loss': 0.5689, 'learning_rate': 1.894231080283152e-05, 'epoch': 0.35} {'loss': 0.7147, 'learning_rate': 1.894216041230424e-05, 'epoch': 0.35} {'loss': 0.4874, 'learning_rate': 1.894201001168297e-05, 'epoch': 0.35} {'loss': 0.7244, 'learning_rate': 1.8941859600967864e-05, 'epoch': 0.35} {'loss': 0.6091, 'learning_rate': 1.89417091801591e-05, 'epoch': 0.35} {'loss': 0.5964, 'learning_rate': 1.894155874925685e-05, 'epoch': 0.35} {'loss': 0.5634, 'learning_rate': 1.8941408308261276e-05, 'epoch': 0.35} {'loss': 0.7097, 'learning_rate': 1.894125785717256e-05, 'epoch': 0.35} {'loss': 0.7053, 'learning_rate': 1.8941107395990857e-05, 'epoch': 0.35} {'loss': 0.4782, 'learning_rate': 1.8940956924716345e-05, 'epoch': 0.35} {'loss': 0.6012, 'learning_rate': 1.894080644334919e-05, 'epoch': 0.35} {'loss': 0.6393, 'learning_rate': 1.894065595188957e-05, 'epoch': 0.35} {'loss': 0.6207, 'learning_rate': 1.894050545033765e-05, 'epoch': 0.35} {'loss': 0.6767, 'learning_rate': 1.8940354938693594e-05, 'epoch': 0.35} {'loss': 0.6066, 'learning_rate': 1.8940204416957582e-05, 'epoch': 0.35} {'loss': 0.6351, 'learning_rate': 1.894005388512978e-05, 'epoch': 0.35} {'loss': 0.69, 'learning_rate': 1.8939903343210354e-05, 'epoch': 0.35} {'loss': 0.5463, 'learning_rate': 1.8939752791199476e-05, 'epoch': 0.35} {'loss': 0.5846, 'learning_rate': 1.893960222909732e-05, 'epoch': 0.35} {'loss': 0.5541, 'learning_rate': 1.8939451656904052e-05, 'epoch': 0.35} {'loss': 0.608, 'learning_rate': 1.8939301074619845e-05, 'epoch': 0.35} {'loss': 0.5329, 'learning_rate': 1.8939150482244862e-05, 'epoch': 0.35} {'loss': 0.6927, 'learning_rate': 1.893899987977928e-05, 'epoch': 0.35} {'loss': 0.5907, 'learning_rate': 1.893884926722327e-05, 'epoch': 0.35} {'loss': 0.604, 'learning_rate': 1.8938698644577e-05, 'epoch': 0.35} {'loss': 0.5365, 'learning_rate': 1.8938548011840633e-05, 'epoch': 0.35} {'loss': 0.5859, 'learning_rate': 1.893839736901435e-05, 'epoch': 0.35} {'loss': 0.5818, 'learning_rate': 1.8938246716098313e-05, 'epoch': 0.35} {'loss': 0.5107, 'learning_rate': 1.8938096053092696e-05, 'epoch': 0.35} {'loss': 0.6543, 'learning_rate': 1.893794537999767e-05, 'epoch': 0.35} {'loss': 0.6156, 'learning_rate': 1.89377946968134e-05, 'epoch': 0.35} {'loss': 0.6683, 'learning_rate': 1.8937644003540063e-05, 'epoch': 0.35} {'loss': 0.5338, 'learning_rate': 1.893749330017782e-05, 'epoch': 0.35} {'loss': 0.6047, 'learning_rate': 1.8937342586726855e-05, 'epoch': 0.35} {'loss': 0.4028, 'learning_rate': 1.8937191863187327e-05, 'epoch': 0.35} {'loss': 0.5564, 'learning_rate': 1.8937041129559402e-05, 'epoch': 0.35} {'loss': 0.6397, 'learning_rate': 1.8936890385843265e-05, 'epoch': 0.35} {'loss': 0.5253, 'learning_rate': 1.8936739632039073e-05, 'epoch': 0.35} {'loss': 0.5677, 'learning_rate': 1.8936588868147003e-05, 'epoch': 0.35} {'loss': 0.6418, 'learning_rate': 1.8936438094167225e-05, 'epoch': 0.35} {'loss': 0.5054, 'learning_rate': 1.893628731009991e-05, 'epoch': 0.35} {'loss': 0.5852, 'learning_rate': 1.893613651594522e-05, 'epoch': 0.35} {'loss': 0.6049, 'learning_rate': 1.8935985711703332e-05, 'epoch': 0.35} {'loss': 0.7022, 'learning_rate': 1.8935834897374418e-05, 'epoch': 0.35} {'loss': 0.4388, 'learning_rate': 1.8935684072958646e-05, 'epoch': 0.35} {'loss': 0.6605, 'learning_rate': 1.8935533238456186e-05, 'epoch': 0.35} {'loss': 0.5879, 'learning_rate': 1.893538239386721e-05, 'epoch': 0.35} {'loss': 0.4191, 'learning_rate': 1.893523153919188e-05, 'epoch': 0.35} {'loss': 0.6693, 'learning_rate': 1.8935080674430373e-05, 'epoch': 0.35} {'loss': 0.5686, 'learning_rate': 1.8934929799582863e-05, 'epoch': 0.35} {'loss': 0.6371, 'learning_rate': 1.8934778914649517e-05, 'epoch': 0.35} {'loss': 0.5348, 'learning_rate': 1.8934628019630503e-05, 'epoch': 0.35} {'loss': 0.626, 'learning_rate': 1.8934477114525993e-05, 'epoch': 0.35} {'loss': 0.5972, 'learning_rate': 1.8934326199336157e-05, 'epoch': 0.35} {'loss': 0.6213, 'learning_rate': 1.8934175274061167e-05, 'epoch': 0.35} {'loss': 0.6909, 'learning_rate': 1.8934024338701192e-05, 'epoch': 0.35} {'loss': 0.4845, 'learning_rate': 1.89338733932564e-05, 'epoch': 0.35} {'loss': 0.5331, 'learning_rate': 1.8933722437726964e-05, 'epoch': 0.35} {'loss': 0.5761, 'learning_rate': 1.8933571472113056e-05, 'epoch': 0.35} {'loss': 0.5032, 'learning_rate': 1.8933420496414845e-05, 'epoch': 0.35} {'loss': 0.4445, 'learning_rate': 1.89332695106325e-05, 'epoch': 0.35} {'loss': 0.467, 'learning_rate': 1.893311851476619e-05, 'epoch': 0.35} {'loss': 0.533, 'learning_rate': 1.8932967508816093e-05, 'epoch': 0.35} {'loss': 0.6625, 'learning_rate': 1.8932816492782372e-05, 'epoch': 0.35} {'loss': 0.6363, 'learning_rate': 1.89326654666652e-05, 'epoch': 0.35} {'loss': 0.5474, 'learning_rate': 1.8932514430464746e-05, 'epoch': 0.35} {'loss': 0.4072, 'learning_rate': 1.893236338418118e-05, 'epoch': 0.35} {'loss': 0.5349, 'learning_rate': 1.8932212327814677e-05, 'epoch': 0.35} {'loss': 0.5449, 'learning_rate': 1.8932061261365407e-05, 'epoch': 0.35} {'loss': 0.4881, 'learning_rate': 1.8931910184833534e-05, 'epoch': 0.35} {'loss': 0.6417, 'learning_rate': 1.8931759098219235e-05, 'epoch': 0.35} {'loss': 0.5007, 'learning_rate': 1.8931608001522683e-05, 'epoch': 0.35} {'loss': 0.6098, 'learning_rate': 1.8931456894744036e-05, 'epoch': 0.35} {'loss': 0.4529, 'learning_rate': 1.8931305777883478e-05, 'epoch': 0.35} {'loss': 0.5573, 'learning_rate': 1.893115465094117e-05, 'epoch': 0.35} {'loss': 0.5905, 'learning_rate': 1.893100351391729e-05, 'epoch': 0.35} {'loss': 0.6904, 'learning_rate': 1.8930852366812003e-05, 'epoch': 0.35} {'loss': 0.541, 'learning_rate': 1.8930701209625483e-05, 'epoch': 0.35} {'loss': 0.7249, 'learning_rate': 1.89305500423579e-05, 'epoch': 0.35} {'loss': 0.5244, 'learning_rate': 1.8930398865009425e-05, 'epoch': 0.35} {'loss': 0.318, 'learning_rate': 1.8930247677580227e-05, 'epoch': 0.35} {'loss': 0.5703, 'learning_rate': 1.8930096480070478e-05, 'epoch': 0.35} {'loss': 0.5446, 'learning_rate': 1.8929945272480344e-05, 'epoch': 0.35} {'loss': 0.6607, 'learning_rate': 1.8929794054810004e-05, 'epoch': 0.35} {'loss': 0.5927, 'learning_rate': 1.8929642827059623e-05, 'epoch': 0.35} {'loss': 0.7613, 'learning_rate': 1.8929491589229377e-05, 'epoch': 0.35} {'loss': 0.6934, 'learning_rate': 1.8929340341319432e-05, 'epoch': 0.35} {'loss': 0.4473, 'learning_rate': 1.8929189083329958e-05, 'epoch': 0.35} {'loss': 0.5218, 'learning_rate': 1.8929037815261127e-05, 'epoch': 0.35} {'loss': 0.6358, 'learning_rate': 1.8928886537113112e-05, 'epoch': 0.35} {'loss': 0.5584, 'learning_rate': 1.8928735248886083e-05, 'epoch': 0.35} {'loss': 0.4918, 'learning_rate': 1.8928583950580205e-05, 'epoch': 0.35} {'loss': 0.694, 'learning_rate': 1.8928432642195655e-05, 'epoch': 0.35} {'loss': 0.7128, 'learning_rate': 1.8928281323732605e-05, 'epoch': 0.35} {'loss': 0.6141, 'learning_rate': 1.892812999519122e-05, 'epoch': 0.35} {'loss': 0.5214, 'learning_rate': 1.8927978656571676e-05, 'epoch': 0.35} {'loss': 0.4808, 'learning_rate': 1.892782730787414e-05, 'epoch': 0.35} {'loss': 0.5981, 'learning_rate': 1.8927675949098788e-05, 'epoch': 0.35} {'loss': 0.6622, 'learning_rate': 1.8927524580245786e-05, 'epoch': 0.35} {'loss': 0.6093, 'learning_rate': 1.8927373201315307e-05, 'epoch': 0.35} {'loss': 0.6797, 'learning_rate': 1.892722181230752e-05, 'epoch': 0.35} {'loss': 0.6942, 'learning_rate': 1.8927070413222596e-05, 'epoch': 0.35} {'loss': 0.5951, 'learning_rate': 1.892691900406071e-05, 'epoch': 0.35} {'loss': 0.5704, 'learning_rate': 1.892676758482203e-05, 'epoch': 0.35} {'loss': 0.5411, 'learning_rate': 1.8926616155506724e-05, 'epoch': 0.35} {'loss': 0.4143, 'learning_rate': 1.8926464716114966e-05, 'epoch': 0.35} {'loss': 0.7011, 'learning_rate': 1.8926313266646928e-05, 'epoch': 0.35} {'loss': 0.7158, 'learning_rate': 1.8926161807102783e-05, 'epoch': 0.35} {'loss': 0.6786, 'learning_rate': 1.8926010337482696e-05, 'epoch': 0.35} {'loss': 0.508, 'learning_rate': 1.892585885778684e-05, 'epoch': 0.35} {'loss': 0.4168, 'learning_rate': 1.892570736801539e-05, 'epoch': 0.35} {'loss': 0.756, 'learning_rate': 1.8925555868168507e-05, 'epoch': 0.35} {'loss': 0.6252, 'learning_rate': 1.8925404358246372e-05, 'epoch': 0.35} {'loss': 0.6347, 'learning_rate': 1.8925252838249153e-05, 'epoch': 0.35} {'loss': 0.8113, 'learning_rate': 1.892510130817702e-05, 'epoch': 0.35} {'loss': 0.6339, 'learning_rate': 1.8924949768030147e-05, 'epoch': 0.35} {'loss': 0.5682, 'learning_rate': 1.8924798217808698e-05, 'epoch': 0.35} {'loss': 0.4435, 'learning_rate': 1.8924646657512857e-05, 'epoch': 0.35} {'loss': 0.6343, 'learning_rate': 1.892449508714278e-05, 'epoch': 0.35} {'loss': 0.6239, 'learning_rate': 1.8924343506698652e-05, 'epoch': 0.35} {'loss': 0.6263, 'learning_rate': 1.892419191618063e-05, 'epoch': 0.35} {'loss': 0.6693, 'learning_rate': 1.8924040315588894e-05, 'epoch': 0.35} {'loss': 0.4535, 'learning_rate': 1.8923888704923615e-05, 'epoch': 0.35} {'loss': 0.6837, 'learning_rate': 1.8923737084184962e-05, 'epoch': 0.35} {'loss': 0.6685, 'learning_rate': 1.8923585453373106e-05, 'epoch': 0.35} {'loss': 0.7065, 'learning_rate': 1.8923433812488222e-05, 'epoch': 0.35} {'loss': 0.6957, 'learning_rate': 1.8923282161530477e-05, 'epoch': 0.35} {'loss': 0.5185, 'learning_rate': 1.892313050050004e-05, 'epoch': 0.35} {'loss': 0.5518, 'learning_rate': 1.8922978829397086e-05, 'epoch': 0.35} {'loss': 0.6735, 'learning_rate': 1.8922827148221792e-05, 'epoch': 0.35} {'loss': 0.6269, 'learning_rate': 1.8922675456974318e-05, 'epoch': 0.35} {'loss': 0.5597, 'learning_rate': 1.8922523755654836e-05, 'epoch': 0.35} {'loss': 0.5184, 'learning_rate': 1.892237204426353e-05, 'epoch': 0.35} {'loss': 0.5205, 'learning_rate': 1.8922220322800558e-05, 'epoch': 0.35} {'loss': 0.6166, 'learning_rate': 1.8922068591266096e-05, 'epoch': 0.35} {'loss': 0.4725, 'learning_rate': 1.8921916849660314e-05, 'epoch': 0.35} {'loss': 0.6374, 'learning_rate': 1.892176509798339e-05, 'epoch': 0.35} {'loss': 0.716, 'learning_rate': 1.8921613336235482e-05, 'epoch': 0.35} {'loss': 0.6585, 'learning_rate': 1.8921461564416774e-05, 'epoch': 0.35} {'loss': 0.509, 'learning_rate': 1.8921309782527434e-05, 'epoch': 0.35} {'loss': 0.5862, 'learning_rate': 1.8921157990567627e-05, 'epoch': 0.35} {'loss': 0.5808, 'learning_rate': 1.892100618853753e-05, 'epoch': 0.35} {'loss': 0.4969, 'learning_rate': 1.8920854376437313e-05, 'epoch': 0.35} {'loss': 0.6658, 'learning_rate': 1.892070255426715e-05, 'epoch': 0.35} {'loss': 0.7028, 'learning_rate': 1.892055072202721e-05, 'epoch': 0.35} {'loss': 0.5849, 'learning_rate': 1.8920398879717666e-05, 'epoch': 0.35} {'loss': 0.5404, 'learning_rate': 1.8920247027338684e-05, 'epoch': 0.35} {'loss': 0.7155, 'learning_rate': 1.8920095164890442e-05, 'epoch': 0.35} {'loss': 0.5026, 'learning_rate': 1.891994329237311e-05, 'epoch': 0.35} {'loss': 0.6105, 'learning_rate': 1.8919791409786856e-05, 'epoch': 0.35} {'loss': 0.6578, 'learning_rate': 1.8919639517131854e-05, 'epoch': 0.35} {'loss': 0.555, 'learning_rate': 1.8919487614408272e-05, 'epoch': 0.35} {'loss': 0.5535, 'learning_rate': 1.8919335701616292e-05, 'epoch': 0.35} {'loss': 0.6527, 'learning_rate': 1.8919183778756068e-05, 'epoch': 0.35} {'loss': 0.6454, 'learning_rate': 1.891903184582779e-05, 'epoch': 0.35} {'loss': 0.5569, 'learning_rate': 1.891887990283162e-05, 'epoch': 0.35} {'loss': 0.5102, 'learning_rate': 1.8918727949767726e-05, 'epoch': 0.35} {'loss': 0.5466, 'learning_rate': 1.891857598663629e-05, 'epoch': 0.35} {'loss': 0.6409, 'learning_rate': 1.8918424013437474e-05, 'epoch': 0.35} {'loss': 0.6896, 'learning_rate': 1.8918272030171454e-05, 'epoch': 0.35} {'loss': 0.6936, 'learning_rate': 1.89181200368384e-05, 'epoch': 0.35} {'loss': 0.7104, 'learning_rate': 1.891796803343849e-05, 'epoch': 0.35} {'loss': 0.6537, 'learning_rate': 1.8917816019971882e-05, 'epoch': 0.35} {'loss': 0.4265, 'learning_rate': 1.8917663996438757e-05, 'epoch': 0.35} {'loss': 0.4993, 'learning_rate': 1.8917511962839288e-05, 'epoch': 0.35} {'loss': 0.7512, 'learning_rate': 1.891735991917364e-05, 'epoch': 0.35} {'loss': 0.6179, 'learning_rate': 1.891720786544199e-05, 'epoch': 0.35} {'loss': 0.6358, 'learning_rate': 1.8917055801644513e-05, 'epoch': 0.35} {'loss': 0.6455, 'learning_rate': 1.891690372778137e-05, 'epoch': 0.35} {'loss': 0.6369, 'learning_rate': 1.891675164385274e-05, 'epoch': 0.35} {'loss': 0.6591, 'learning_rate': 1.8916599549858792e-05, 'epoch': 0.35} {'loss': 0.6001, 'learning_rate': 1.89164474457997e-05, 'epoch': 0.35} {'loss': 0.6273, 'learning_rate': 1.8916295331675632e-05, 'epoch': 0.35} {'loss': 0.664, 'learning_rate': 1.8916143207486766e-05, 'epoch': 0.35} {'loss': 0.6189, 'learning_rate': 1.8915991073233268e-05, 'epoch': 0.35} {'loss': 0.6613, 'learning_rate': 1.8915838928915307e-05, 'epoch': 0.35} {'loss': 0.5608, 'learning_rate': 1.8915686774533067e-05, 'epoch': 0.35} {'loss': 0.5961, 'learning_rate': 1.891553461008671e-05, 'epoch': 0.35} {'loss': 0.5593, 'learning_rate': 1.8915382435576406e-05, 'epoch': 0.35} {'loss': 0.6357, 'learning_rate': 1.8915230251002334e-05, 'epoch': 0.35} {'loss': 0.5616, 'learning_rate': 1.891507805636466e-05, 'epoch': 0.35} {'loss': 0.3384, 'learning_rate': 1.891492585166356e-05, 'epoch': 0.35} {'loss': 0.648, 'learning_rate': 1.8914773636899204e-05, 'epoch': 0.35} {'loss': 0.4697, 'learning_rate': 1.8914621412071762e-05, 'epoch': 0.35} {'loss': 0.6576, 'learning_rate': 1.891446917718141e-05, 'epoch': 0.35} {'loss': 0.3458, 'learning_rate': 1.8914316932228317e-05, 'epoch': 0.35} {'loss': 0.4377, 'learning_rate': 1.8914164677212654e-05, 'epoch': 0.35} {'loss': 0.5491, 'learning_rate': 1.8914012412134592e-05, 'epoch': 0.35} {'loss': 0.5612, 'learning_rate': 1.8913860136994307e-05, 'epoch': 0.35} {'loss': 0.545, 'learning_rate': 1.8913707851791972e-05, 'epoch': 0.35} {'loss': 0.6043, 'learning_rate': 1.8913555556527753e-05, 'epoch': 0.35} {'loss': 0.7405, 'learning_rate': 1.8913403251201826e-05, 'epoch': 0.35} {'loss': 0.547, 'learning_rate': 1.8913250935814364e-05, 'epoch': 0.35} {'loss': 0.5316, 'learning_rate': 1.891309861036553e-05, 'epoch': 0.35} {'loss': 0.4536, 'learning_rate': 1.891294627485551e-05, 'epoch': 0.35} {'loss': 0.6503, 'learning_rate': 1.891279392928446e-05, 'epoch': 0.35} {'loss': 0.538, 'learning_rate': 1.8912641573652567e-05, 'epoch': 0.35} {'loss': 0.5346, 'learning_rate': 1.8912489207959998e-05, 'epoch': 0.35} {'loss': 0.6166, 'learning_rate': 1.891233683220692e-05, 'epoch': 0.35} {'loss': 0.5527, 'learning_rate': 1.8912184446393507e-05, 'epoch': 0.35} {'loss': 0.7225, 'learning_rate': 1.8912032050519934e-05, 'epoch': 0.35} {'loss': 0.4685, 'learning_rate': 1.891187964458637e-05, 'epoch': 0.35} {'loss': 0.6398, 'learning_rate': 1.891172722859299e-05, 'epoch': 0.35} {'loss': 0.6192, 'learning_rate': 1.8911574802539966e-05, 'epoch': 0.35} {'loss': 0.643, 'learning_rate': 1.8911422366427466e-05, 'epoch': 0.35} {'loss': 0.6948, 'learning_rate': 1.8911269920255667e-05, 'epoch': 0.35} {'loss': 0.7054, 'learning_rate': 1.891111746402474e-05, 'epoch': 0.35} {'loss': 0.5009, 'learning_rate': 1.8910964997734854e-05, 'epoch': 0.35} {'loss': 0.5867, 'learning_rate': 1.8910812521386182e-05, 'epoch': 0.35} {'loss': 0.5268, 'learning_rate': 1.89106600349789e-05, 'epoch': 0.35} {'loss': 0.5315, 'learning_rate': 1.8910507538513174e-05, 'epoch': 0.35} {'loss': 0.5995, 'learning_rate': 1.891035503198918e-05, 'epoch': 0.35} {'loss': 0.7198, 'learning_rate': 1.891020251540709e-05, 'epoch': 0.35} {'loss': 0.6634, 'learning_rate': 1.891004998876708e-05, 'epoch': 0.35} {'loss': 0.5906, 'learning_rate': 1.8909897452069312e-05, 'epoch': 0.35} {'loss': 0.6979, 'learning_rate': 1.8909744905313964e-05, 'epoch': 0.35} {'loss': 0.556, 'learning_rate': 1.890959234850121e-05, 'epoch': 0.35} {'loss': 0.4405, 'learning_rate': 1.890943978163122e-05, 'epoch': 0.35} {'loss': 0.6718, 'learning_rate': 1.890928720470417e-05, 'epoch': 0.35} {'loss': 0.5422, 'learning_rate': 1.8909134617720225e-05, 'epoch': 0.35} {'loss': 0.5741, 'learning_rate': 1.8908982020679563e-05, 'epoch': 0.35} {'loss': 0.5657, 'learning_rate': 1.8908829413582356e-05, 'epoch': 0.35} {'loss': 0.4358, 'learning_rate': 1.890867679642877e-05, 'epoch': 0.35} {'loss': 0.5514, 'learning_rate': 1.8908524169218988e-05, 'epoch': 0.35} {'loss': 0.6136, 'learning_rate': 1.8908371531953168e-05, 'epoch': 0.35} {'loss': 0.6384, 'learning_rate': 1.89082188846315e-05, 'epoch': 0.35} {'loss': 0.5514, 'learning_rate': 1.8908066227254142e-05, 'epoch': 0.35} {'loss': 0.6063, 'learning_rate': 1.890791355982127e-05, 'epoch': 0.35} {'loss': 0.6289, 'learning_rate': 1.8907760882333058e-05, 'epoch': 0.35} {'loss': 0.4094, 'learning_rate': 1.890760819478968e-05, 'epoch': 0.35} {'loss': 0.6634, 'learning_rate': 1.8907455497191306e-05, 'epoch': 0.35} {'loss': 0.7162, 'learning_rate': 1.8907302789538106e-05, 'epoch': 0.35} {'loss': 0.4182, 'learning_rate': 1.8907150071830255e-05, 'epoch': 0.35} {'loss': 0.6321, 'learning_rate': 1.890699734406793e-05, 'epoch': 0.35} {'loss': 0.5886, 'learning_rate': 1.8906844606251296e-05, 'epoch': 0.35} {'loss': 0.391, 'learning_rate': 1.8906691858380528e-05, 'epoch': 0.35} {'loss': 0.6343, 'learning_rate': 1.8906539100455796e-05, 'epoch': 0.35} {'loss': 0.6404, 'learning_rate': 1.890638633247728e-05, 'epoch': 0.35} {'loss': 0.6639, 'learning_rate': 1.890623355444514e-05, 'epoch': 0.35} {'loss': 0.6805, 'learning_rate': 1.890608076635956e-05, 'epoch': 0.35} {'loss': 0.5694, 'learning_rate': 1.890592796822071e-05, 'epoch': 0.35} {'loss': 0.7031, 'learning_rate': 1.8905775160028762e-05, 'epoch': 0.35} {'loss': 0.6837, 'learning_rate': 1.8905622341783884e-05, 'epoch': 0.35} {'loss': 0.5079, 'learning_rate': 1.8905469513486256e-05, 'epoch': 0.35} {'loss': 0.5863, 'learning_rate': 1.8905316675136044e-05, 'epoch': 0.35} {'loss': 0.6333, 'learning_rate': 1.8905163826733422e-05, 'epoch': 0.35} {'loss': 0.5632, 'learning_rate': 1.890501096827856e-05, 'epoch': 0.35} {'loss': 0.5429, 'learning_rate': 1.8904858099771643e-05, 'epoch': 0.35} {'loss': 0.6343, 'learning_rate': 1.8904705221212828e-05, 'epoch': 0.35} {'loss': 0.5888, 'learning_rate': 1.8904552332602293e-05, 'epoch': 0.35} {'loss': 0.6353, 'learning_rate': 1.8904399433940216e-05, 'epoch': 0.35} {'loss': 0.5948, 'learning_rate': 1.8904246525226764e-05, 'epoch': 0.35} {'loss': 0.4528, 'learning_rate': 1.8904093606462107e-05, 'epoch': 0.35} {'loss': 0.5665, 'learning_rate': 1.8903940677646426e-05, 'epoch': 0.35} {'loss': 0.547, 'learning_rate': 1.890378773877989e-05, 'epoch': 0.35} {'loss': 0.651, 'learning_rate': 1.8903634789862668e-05, 'epoch': 0.35} {'loss': 0.475, 'learning_rate': 1.8903481830894938e-05, 'epoch': 0.35} {'loss': 0.5155, 'learning_rate': 1.890332886187687e-05, 'epoch': 0.35} {'loss': 0.7306, 'learning_rate': 1.8903175882808634e-05, 'epoch': 0.35} {'loss': 0.6577, 'learning_rate': 1.8903022893690407e-05, 'epoch': 0.35} {'loss': 0.5429, 'learning_rate': 1.8902869894522358e-05, 'epoch': 0.35} {'loss': 0.5454, 'learning_rate': 1.8902716885304666e-05, 'epoch': 0.35} {'loss': 0.7158, 'learning_rate': 1.8902563866037497e-05, 'epoch': 0.35} {'loss': 0.685, 'learning_rate': 1.8902410836721024e-05, 'epoch': 0.35} {'loss': 0.6358, 'learning_rate': 1.8902257797355426e-05, 'epoch': 0.35} {'loss': 0.6058, 'learning_rate': 1.8902104747940867e-05, 'epoch': 0.35} {'loss': 0.7216, 'learning_rate': 1.890195168847753e-05, 'epoch': 0.35} {'loss': 0.5671, 'learning_rate': 1.890179861896558e-05, 'epoch': 0.35} {'loss': 0.719, 'learning_rate': 1.8901645539405192e-05, 'epoch': 0.35} {'loss': 0.5905, 'learning_rate': 1.8901492449796538e-05, 'epoch': 0.35} {'loss': 0.5632, 'learning_rate': 1.8901339350139793e-05, 'epoch': 0.35} {'loss': 0.6109, 'learning_rate': 1.8901186240435126e-05, 'epoch': 0.35} {'loss': 0.5776, 'learning_rate': 1.8901033120682718e-05, 'epoch': 0.35} {'loss': 0.6203, 'learning_rate': 1.8900879990882733e-05, 'epoch': 0.35} {'loss': 0.5266, 'learning_rate': 1.8900726851035345e-05, 'epoch': 0.35} {'loss': 0.7096, 'learning_rate': 1.890057370114073e-05, 'epoch': 0.35} {'loss': 0.6753, 'learning_rate': 1.890042054119906e-05, 'epoch': 0.35} {'loss': 0.5713, 'learning_rate': 1.890026737121051e-05, 'epoch': 0.35} {'loss': 0.5938, 'learning_rate': 1.8900114191175252e-05, 'epoch': 0.35} {'loss': 0.6375, 'learning_rate': 1.8899961001093454e-05, 'epoch': 0.35} {'loss': 0.4754, 'learning_rate': 1.8899807800965293e-05, 'epoch': 0.35} {'loss': 0.5183, 'learning_rate': 1.889965459079094e-05, 'epoch': 0.35} {'loss': 0.5335, 'learning_rate': 1.8899501370570572e-05, 'epoch': 0.35} {'loss': 0.5684, 'learning_rate': 1.889934814030436e-05, 'epoch': 0.35} {'loss': 0.6347, 'learning_rate': 1.889919489999247e-05, 'epoch': 0.35} {'loss': 0.5201, 'learning_rate': 1.889904164963509e-05, 'epoch': 0.35} {'loss': 0.5722, 'learning_rate': 1.8898888389232378e-05, 'epoch': 0.35} {'loss': 0.6689, 'learning_rate': 1.8898735118784514e-05, 'epoch': 0.35} {'loss': 0.4888, 'learning_rate': 1.889858183829167e-05, 'epoch': 0.35} {'loss': 0.6095, 'learning_rate': 1.8898428547754023e-05, 'epoch': 0.35} {'loss': 0.6305, 'learning_rate': 1.889827524717174e-05, 'epoch': 0.35} {'loss': 0.808, 'learning_rate': 1.8898121936544992e-05, 'epoch': 0.35} {'loss': 0.721, 'learning_rate': 1.8897968615873963e-05, 'epoch': 0.35} {'loss': 0.6281, 'learning_rate': 1.8897815285158817e-05, 'epoch': 0.35} {'loss': 0.5029, 'learning_rate': 1.889766194439973e-05, 'epoch': 0.35} {'loss': 0.6397, 'learning_rate': 1.8897508593596873e-05, 'epoch': 0.35} {'loss': 0.6491, 'learning_rate': 1.889735523275042e-05, 'epoch': 0.35} {'loss': 0.6726, 'learning_rate': 1.889720186186055e-05, 'epoch': 0.35} {'loss': 0.6746, 'learning_rate': 1.8897048480927425e-05, 'epoch': 0.35} {'loss': 0.5012, 'learning_rate': 1.8896895089951228e-05, 'epoch': 0.35} {'loss': 0.58, 'learning_rate': 1.8896741688932127e-05, 'epoch': 0.35} {'loss': 0.4589, 'learning_rate': 1.8896588277870295e-05, 'epoch': 0.35} {'loss': 0.5948, 'learning_rate': 1.889643485676591e-05, 'epoch': 0.35} {'loss': 0.662, 'learning_rate': 1.889628142561914e-05, 'epoch': 0.35} {'loss': 0.5487, 'learning_rate': 1.8896127984430156e-05, 'epoch': 0.35} {'loss': 0.6665, 'learning_rate': 1.8895974533199138e-05, 'epoch': 0.35} {'loss': 0.7333, 'learning_rate': 1.889582107192626e-05, 'epoch': 0.35} {'loss': 0.5677, 'learning_rate': 1.889566760061169e-05, 'epoch': 0.35} {'loss': 0.5219, 'learning_rate': 1.88955141192556e-05, 'epoch': 0.35} {'loss': 0.5954, 'learning_rate': 1.8895360627858167e-05, 'epoch': 0.35} {'loss': 0.5504, 'learning_rate': 1.8895207126419567e-05, 'epoch': 0.35} {'loss': 0.5158, 'learning_rate': 1.8895053614939963e-05, 'epoch': 0.35} {'loss': 0.6208, 'learning_rate': 1.8894900093419543e-05, 'epoch': 0.35} {'loss': 0.6488, 'learning_rate': 1.8894746561858465e-05, 'epoch': 0.35} {'loss': 0.5527, 'learning_rate': 1.8894593020256916e-05, 'epoch': 0.35} {'loss': 0.6459, 'learning_rate': 1.889443946861506e-05, 'epoch': 0.35} {'loss': 0.6074, 'learning_rate': 1.889428590693307e-05, 'epoch': 0.35} {'loss': 0.6189, 'learning_rate': 1.8894132335211127e-05, 'epoch': 0.36} {'loss': 0.6033, 'learning_rate': 1.8893978753449395e-05, 'epoch': 0.36} {'loss': 0.6095, 'learning_rate': 1.8893825161648056e-05, 'epoch': 0.36} {'loss': 0.692, 'learning_rate': 1.889367155980728e-05, 'epoch': 0.36} {'loss': 0.6692, 'learning_rate': 1.8893517947927237e-05, 'epoch': 0.36} {'loss': 0.5748, 'learning_rate': 1.8893364326008107e-05, 'epoch': 0.36} {'loss': 0.6441, 'learning_rate': 1.889321069405006e-05, 'epoch': 0.36} {'loss': 0.5195, 'learning_rate': 1.8893057052053267e-05, 'epoch': 0.36} {'loss': 0.6586, 'learning_rate': 1.8892903400017904e-05, 'epoch': 0.36} {'loss': 0.4158, 'learning_rate': 1.8892749737944143e-05, 'epoch': 0.36} {'loss': 0.705, 'learning_rate': 1.889259606583216e-05, 'epoch': 0.36} {'loss': 0.5121, 'learning_rate': 1.8892442383682127e-05, 'epoch': 0.36} {'loss': 0.701, 'learning_rate': 1.889228869149422e-05, 'epoch': 0.36} {'loss': 0.6899, 'learning_rate': 1.8892134989268608e-05, 'epoch': 0.36} {'loss': 0.5898, 'learning_rate': 1.8891981277005465e-05, 'epoch': 0.36} {'loss': 0.6472, 'learning_rate': 1.8891827554704965e-05, 'epoch': 0.36} {'loss': 0.5429, 'learning_rate': 1.8891673822367287e-05, 'epoch': 0.36} {'loss': 0.5158, 'learning_rate': 1.8891520079992597e-05, 'epoch': 0.36} {'loss': 0.6099, 'learning_rate': 1.8891366327581072e-05, 'epoch': 0.36} {'loss': 0.6219, 'learning_rate': 1.8891212565132887e-05, 'epoch': 0.36} {'loss': 0.5302, 'learning_rate': 1.8891058792648212e-05, 'epoch': 0.36} {'loss': 0.674, 'learning_rate': 1.889090501012722e-05, 'epoch': 0.36} {'loss': 0.575, 'learning_rate': 1.889075121757009e-05, 'epoch': 0.36} {'loss': 0.6874, 'learning_rate': 1.8890597414976996e-05, 'epoch': 0.36} {'loss': 0.6625, 'learning_rate': 1.8890443602348103e-05, 'epoch': 0.36} {'loss': 0.4421, 'learning_rate': 1.889028977968359e-05, 'epoch': 0.36} {'loss': 0.4918, 'learning_rate': 1.889013594698363e-05, 'epoch': 0.36} {'loss': 0.5761, 'learning_rate': 1.8889982104248398e-05, 'epoch': 0.36} {'loss': 0.5494, 'learning_rate': 1.8889828251478068e-05, 'epoch': 0.36} {'loss': 0.5978, 'learning_rate': 1.8889674388672813e-05, 'epoch': 0.36} {'loss': 0.5352, 'learning_rate': 1.8889520515832803e-05, 'epoch': 0.36} {'loss': 0.6617, 'learning_rate': 1.8889366632958217e-05, 'epoch': 0.36} {'loss': 0.3863, 'learning_rate': 1.8889212740049225e-05, 'epoch': 0.36} {'loss': 0.6439, 'learning_rate': 1.8889058837106003e-05, 'epoch': 0.36} {'loss': 0.6073, 'learning_rate': 1.8888904924128723e-05, 'epoch': 0.36} {'loss': 0.6646, 'learning_rate': 1.8888751001117562e-05, 'epoch': 0.36} {'loss': 0.4946, 'learning_rate': 1.888859706807269e-05, 'epoch': 0.36} {'loss': 0.5827, 'learning_rate': 1.888844312499428e-05, 'epoch': 0.36} {'loss': 0.5322, 'learning_rate': 1.888828917188251e-05, 'epoch': 0.36} {'loss': 0.6684, 'learning_rate': 1.8888135208737553e-05, 'epoch': 0.36} {'loss': 0.4448, 'learning_rate': 1.888798123555958e-05, 'epoch': 0.36} {'loss': 0.7259, 'learning_rate': 1.8887827252348767e-05, 'epoch': 0.36} {'loss': 0.6778, 'learning_rate': 1.8887673259105286e-05, 'epoch': 0.36} {'loss': 0.788, 'learning_rate': 1.8887519255829314e-05, 'epoch': 0.36} {'loss': 0.6073, 'learning_rate': 1.8887365242521022e-05, 'epoch': 0.36} {'loss': 0.5448, 'learning_rate': 1.8887211219180584e-05, 'epoch': 0.36} {'loss': 0.5386, 'learning_rate': 1.8887057185808176e-05, 'epoch': 0.36} {'loss': 0.5892, 'learning_rate': 1.8886903142403967e-05, 'epoch': 0.36} {'loss': 0.5143, 'learning_rate': 1.8886749088968133e-05, 'epoch': 0.36} {'loss': 0.6534, 'learning_rate': 1.8886595025500855e-05, 'epoch': 0.36} {'loss': 0.46, 'learning_rate': 1.8886440952002297e-05, 'epoch': 0.36} {'loss': 0.8444, 'learning_rate': 1.888628686847264e-05, 'epoch': 0.36} {'loss': 0.5728, 'learning_rate': 1.8886132774912055e-05, 'epoch': 0.36} {'loss': 0.651, 'learning_rate': 1.8885978671320714e-05, 'epoch': 0.36} {'loss': 0.5927, 'learning_rate': 1.8885824557698792e-05, 'epoch': 0.36} {'loss': 0.5174, 'learning_rate': 1.8885670434046464e-05, 'epoch': 0.36} {'loss': 0.6312, 'learning_rate': 1.8885516300363905e-05, 'epoch': 0.36} {'loss': 0.5581, 'learning_rate': 1.888536215665129e-05, 'epoch': 0.36} {'loss': 0.6381, 'learning_rate': 1.8885208002908788e-05, 'epoch': 0.36} {'loss': 0.7082, 'learning_rate': 1.8885053839136572e-05, 'epoch': 0.36} {'loss': 0.5616, 'learning_rate': 1.8884899665334826e-05, 'epoch': 0.36} {'loss': 0.5383, 'learning_rate': 1.8884745481503714e-05, 'epoch': 0.36} {'loss': 0.529, 'learning_rate': 1.8884591287643418e-05, 'epoch': 0.36} {'loss': 0.6036, 'learning_rate': 1.8884437083754106e-05, 'epoch': 0.36} {'loss': 0.6839, 'learning_rate': 1.8884282869835954e-05, 'epoch': 0.36} {'loss': 0.4564, 'learning_rate': 1.8884128645889132e-05, 'epoch': 0.36} {'loss': 0.6608, 'learning_rate': 1.8883974411913823e-05, 'epoch': 0.36} {'loss': 0.531, 'learning_rate': 1.8883820167910196e-05, 'epoch': 0.36} {'loss': 0.5962, 'learning_rate': 1.8883665913878424e-05, 'epoch': 0.36} {'loss': 0.6255, 'learning_rate': 1.8883511649818683e-05, 'epoch': 0.36} {'loss': 0.6529, 'learning_rate': 1.8883357375731142e-05, 'epoch': 0.36} {'loss': 0.4619, 'learning_rate': 1.8883203091615985e-05, 'epoch': 0.36} {'loss': 0.5668, 'learning_rate': 1.888304879747338e-05, 'epoch': 0.36} {'loss': 0.6171, 'learning_rate': 1.8882894493303503e-05, 'epoch': 0.36} {'loss': 0.5141, 'learning_rate': 1.8882740179106527e-05, 'epoch': 0.36} {'loss': 0.672, 'learning_rate': 1.8882585854882625e-05, 'epoch': 0.36} {'loss': 0.6884, 'learning_rate': 1.8882431520631974e-05, 'epoch': 0.36} {'loss': 0.5595, 'learning_rate': 1.8882277176354747e-05, 'epoch': 0.36} {'loss': 0.717, 'learning_rate': 1.8882122822051117e-05, 'epoch': 0.36} {'loss': 0.5619, 'learning_rate': 1.888196845772126e-05, 'epoch': 0.36} {'loss': 0.6657, 'learning_rate': 1.888181408336535e-05, 'epoch': 0.36} {'loss': 0.6015, 'learning_rate': 1.888165969898356e-05, 'epoch': 0.36} {'loss': 0.5752, 'learning_rate': 1.8881505304576066e-05, 'epoch': 0.36} {'loss': 0.5819, 'learning_rate': 1.888135090014304e-05, 'epoch': 0.36} {'loss': 0.8291, 'learning_rate': 1.8881196485684657e-05, 'epoch': 0.36} {'loss': 0.4175, 'learning_rate': 1.8881042061201094e-05, 'epoch': 0.36} {'loss': 0.4622, 'learning_rate': 1.8880887626692527e-05, 'epoch': 0.36} {'loss': 0.5321, 'learning_rate': 1.888073318215912e-05, 'epoch': 0.36} {'loss': 0.7125, 'learning_rate': 1.8880578727601054e-05, 'epoch': 0.36} {'loss': 0.5712, 'learning_rate': 1.8880424263018508e-05, 'epoch': 0.36} {'loss': 0.6571, 'learning_rate': 1.888026978841165e-05, 'epoch': 0.36} {'loss': 0.5546, 'learning_rate': 1.8880115303780655e-05, 'epoch': 0.36} {'loss': 0.6174, 'learning_rate': 1.8879960809125698e-05, 'epoch': 0.36} {'loss': 0.5676, 'learning_rate': 1.8879806304446956e-05, 'epoch': 0.36} {'loss': 0.4449, 'learning_rate': 1.8879651789744603e-05, 'epoch': 0.36} {'loss': 0.5877, 'learning_rate': 1.8879497265018807e-05, 'epoch': 0.36} {'loss': 0.551, 'learning_rate': 1.887934273026975e-05, 'epoch': 0.36} {'loss': 0.6941, 'learning_rate': 1.88791881854976e-05, 'epoch': 0.36} {'loss': 0.5674, 'learning_rate': 1.887903363070254e-05, 'epoch': 0.36} {'loss': 0.5857, 'learning_rate': 1.8878879065884736e-05, 'epoch': 0.36} {'loss': 0.5241, 'learning_rate': 1.8878724491044368e-05, 'epoch': 0.36} {'loss': 0.5929, 'learning_rate': 1.8878569906181605e-05, 'epoch': 0.36} {'loss': 0.4906, 'learning_rate': 1.887841531129663e-05, 'epoch': 0.36} {'loss': 0.6412, 'learning_rate': 1.8878260706389607e-05, 'epoch': 0.36} {'loss': 0.6811, 'learning_rate': 1.8878106091460718e-05, 'epoch': 0.36} {'loss': 0.5598, 'learning_rate': 1.8877951466510135e-05, 'epoch': 0.36} {'loss': 0.4822, 'learning_rate': 1.8877796831538034e-05, 'epoch': 0.36} {'loss': 0.5647, 'learning_rate': 1.887764218654459e-05, 'epoch': 0.36} {'loss': 0.6039, 'learning_rate': 1.8877487531529974e-05, 'epoch': 0.36} {'loss': 0.5179, 'learning_rate': 1.8877332866494363e-05, 'epoch': 0.36} {'loss': 0.5044, 'learning_rate': 1.8877178191437933e-05, 'epoch': 0.36} {'loss': 0.6138, 'learning_rate': 1.8877023506360855e-05, 'epoch': 0.36} {'loss': 0.551, 'learning_rate': 1.8876868811263306e-05, 'epoch': 0.36} {'loss': 0.548, 'learning_rate': 1.8876714106145463e-05, 'epoch': 0.36} {'loss': 0.6212, 'learning_rate': 1.8876559391007494e-05, 'epoch': 0.36} {'loss': 0.5936, 'learning_rate': 1.8876404665849576e-05, 'epoch': 0.36} {'loss': 0.5694, 'learning_rate': 1.887624993067189e-05, 'epoch': 0.36} {'loss': 0.5969, 'learning_rate': 1.88760951854746e-05, 'epoch': 0.36} {'loss': 0.6617, 'learning_rate': 1.8875940430257893e-05, 'epoch': 0.36} {'loss': 0.6694, 'learning_rate': 1.8875785665021934e-05, 'epoch': 0.36} {'loss': 0.6076, 'learning_rate': 1.88756308897669e-05, 'epoch': 0.36} {'loss': 0.4406, 'learning_rate': 1.8875476104492966e-05, 'epoch': 0.36} {'loss': 0.6008, 'learning_rate': 1.8875321309200307e-05, 'epoch': 0.36} {'loss': 0.4606, 'learning_rate': 1.88751665038891e-05, 'epoch': 0.36} {'loss': 0.5615, 'learning_rate': 1.887501168855952e-05, 'epoch': 0.36} {'loss': 0.6988, 'learning_rate': 1.887485686321173e-05, 'epoch': 0.36} {'loss': 0.5881, 'learning_rate': 1.8874702027845923e-05, 'epoch': 0.36} {'loss': 0.6481, 'learning_rate': 1.8874547182462263e-05, 'epoch': 0.36} {'loss': 0.503, 'learning_rate': 1.8874392327060927e-05, 'epoch': 0.36} {'loss': 0.6267, 'learning_rate': 1.8874237461642088e-05, 'epoch': 0.36} {'loss': 0.4868, 'learning_rate': 1.8874082586205923e-05, 'epoch': 0.36} {'loss': 0.7478, 'learning_rate': 1.8873927700752607e-05, 'epoch': 0.36} {'loss': 0.5753, 'learning_rate': 1.8873772805282316e-05, 'epoch': 0.36} {'loss': 0.7056, 'learning_rate': 1.887361789979522e-05, 'epoch': 0.36} {'loss': 0.7303, 'learning_rate': 1.8873462984291496e-05, 'epoch': 0.36} {'loss': 0.6606, 'learning_rate': 1.8873308058771323e-05, 'epoch': 0.36} {'loss': 0.6899, 'learning_rate': 1.887315312323487e-05, 'epoch': 0.36} {'loss': 0.6062, 'learning_rate': 1.8872998177682316e-05, 'epoch': 0.36} {'loss': 0.5624, 'learning_rate': 1.8872843222113832e-05, 'epoch': 0.36} {'loss': 0.4638, 'learning_rate': 1.8872688256529597e-05, 'epoch': 0.36} {'loss': 0.4919, 'learning_rate': 1.8872533280929786e-05, 'epoch': 0.36} {'loss': 0.6079, 'learning_rate': 1.887237829531457e-05, 'epoch': 0.36} {'loss': 0.5998, 'learning_rate': 1.8872223299684124e-05, 'epoch': 0.36} {'loss': 0.5269, 'learning_rate': 1.8872068294038625e-05, 'epoch': 0.36} {'loss': 0.595, 'learning_rate': 1.8871913278378253e-05, 'epoch': 0.36} {'loss': 0.5947, 'learning_rate': 1.8871758252703175e-05, 'epoch': 0.36} {'loss': 0.5559, 'learning_rate': 1.887160321701357e-05, 'epoch': 0.36} {'loss': 0.4704, 'learning_rate': 1.887144817130961e-05, 'epoch': 0.36} {'loss': 0.6929, 'learning_rate': 1.8871293115591474e-05, 'epoch': 0.36} {'loss': 0.5023, 'learning_rate': 1.887113804985933e-05, 'epoch': 0.36} {'loss': 0.6757, 'learning_rate': 1.8870982974113365e-05, 'epoch': 0.36} {'loss': 0.6052, 'learning_rate': 1.8870827888353745e-05, 'epoch': 0.36} {'loss': 0.4681, 'learning_rate': 1.8870672792580644e-05, 'epoch': 0.36} {'loss': 0.6455, 'learning_rate': 1.8870517686794244e-05, 'epoch': 0.36} {'loss': 0.6227, 'learning_rate': 1.8870362570994712e-05, 'epoch': 0.36} {'loss': 0.6435, 'learning_rate': 1.8870207445182235e-05, 'epoch': 0.36} {'loss': 0.5944, 'learning_rate': 1.887005230935697e-05, 'epoch': 0.36} {'loss': 0.4171, 'learning_rate': 1.886989716351911e-05, 'epoch': 0.36} {'loss': 0.4686, 'learning_rate': 1.8869742007668824e-05, 'epoch': 0.36} {'loss': 0.7636, 'learning_rate': 1.886958684180628e-05, 'epoch': 0.36} {'loss': 0.4013, 'learning_rate': 1.8869431665931666e-05, 'epoch': 0.36} {'loss': 0.6008, 'learning_rate': 1.8869276480045145e-05, 'epoch': 0.36} {'loss': 0.502, 'learning_rate': 1.8869121284146902e-05, 'epoch': 0.36} {'loss': 0.5271, 'learning_rate': 1.88689660782371e-05, 'epoch': 0.36} {'loss': 0.3651, 'learning_rate': 1.886881086231593e-05, 'epoch': 0.36} {'loss': 0.566, 'learning_rate': 1.8868655636383556e-05, 'epoch': 0.36} {'loss': 0.6545, 'learning_rate': 1.8868500400440156e-05, 'epoch': 0.36} {'loss': 0.7667, 'learning_rate': 1.8868345154485904e-05, 'epoch': 0.36} {'loss': 0.5322, 'learning_rate': 1.8868189898520977e-05, 'epoch': 0.36} {'loss': 0.6212, 'learning_rate': 1.8868034632545553e-05, 'epoch': 0.36} {'loss': 0.7018, 'learning_rate': 1.8867879356559802e-05, 'epoch': 0.36} {'loss': 0.6616, 'learning_rate': 1.88677240705639e-05, 'epoch': 0.36} {'loss': 0.5802, 'learning_rate': 1.8867568774558024e-05, 'epoch': 0.36} {'loss': 0.671, 'learning_rate': 1.8867413468542354e-05, 'epoch': 0.36} {'loss': 0.5127, 'learning_rate': 1.8867258152517057e-05, 'epoch': 0.36} {'loss': 0.6589, 'learning_rate': 1.886710282648231e-05, 'epoch': 0.36} {'loss': 0.4859, 'learning_rate': 1.8866947490438293e-05, 'epoch': 0.36} {'loss': 0.5499, 'learning_rate': 1.8866792144385177e-05, 'epoch': 0.36} {'loss': 0.4657, 'learning_rate': 1.8866636788323137e-05, 'epoch': 0.36} {'loss': 0.4022, 'learning_rate': 1.8866481422252353e-05, 'epoch': 0.36} {'loss': 0.585, 'learning_rate': 1.8866326046172996e-05, 'epoch': 0.36} {'loss': 0.5233, 'learning_rate': 1.8866170660085244e-05, 'epoch': 0.36} {'loss': 0.677, 'learning_rate': 1.886601526398927e-05, 'epoch': 0.36} {'loss': 0.6812, 'learning_rate': 1.8865859857885255e-05, 'epoch': 0.36} {'loss': 0.4952, 'learning_rate': 1.8865704441773366e-05, 'epoch': 0.36} {'loss': 0.5489, 'learning_rate': 1.8865549015653784e-05, 'epoch': 0.36} {'loss': 0.5648, 'learning_rate': 1.886539357952668e-05, 'epoch': 0.36} {'loss': 0.7082, 'learning_rate': 1.8865238133392237e-05, 'epoch': 0.36} {'loss': 0.5323, 'learning_rate': 1.886508267725062e-05, 'epoch': 0.36} {'loss': 0.7257, 'learning_rate': 1.8864927211102017e-05, 'epoch': 0.36} {'loss': 0.6391, 'learning_rate': 1.8864771734946595e-05, 'epoch': 0.36} {'loss': 0.6833, 'learning_rate': 1.886461624878453e-05, 'epoch': 0.36} {'loss': 0.6323, 'learning_rate': 1.8864460752615997e-05, 'epoch': 0.36} {'loss': 0.5697, 'learning_rate': 1.886430524644118e-05, 'epoch': 0.36} {'loss': 0.5071, 'learning_rate': 1.886414973026024e-05, 'epoch': 0.36} {'loss': 0.5742, 'learning_rate': 1.8863994204073366e-05, 'epoch': 0.36} {'loss': 0.6017, 'learning_rate': 1.8863838667880727e-05, 'epoch': 0.36} {'loss': 0.6011, 'learning_rate': 1.8863683121682497e-05, 'epoch': 0.36} {'loss': 0.6087, 'learning_rate': 1.8863527565478857e-05, 'epoch': 0.36} {'loss': 0.6201, 'learning_rate': 1.886337199926998e-05, 'epoch': 0.36} {'loss': 0.5796, 'learning_rate': 1.886321642305604e-05, 'epoch': 0.36} {'loss': 0.5213, 'learning_rate': 1.8863060836837218e-05, 'epoch': 0.36} {'loss': 0.6963, 'learning_rate': 1.886290524061368e-05, 'epoch': 0.36} {'loss': 0.5752, 'learning_rate': 1.886274963438561e-05, 'epoch': 0.36} {'loss': 0.6552, 'learning_rate': 1.8862594018153178e-05, 'epoch': 0.36} {'loss': 0.605, 'learning_rate': 1.8862438391916566e-05, 'epoch': 0.36} {'loss': 0.6742, 'learning_rate': 1.8862282755675946e-05, 'epoch': 0.36} {'loss': 0.6527, 'learning_rate': 1.8862127109431497e-05, 'epoch': 0.36} {'loss': 0.6531, 'learning_rate': 1.8861971453183387e-05, 'epoch': 0.36} {'loss': 0.5554, 'learning_rate': 1.88618157869318e-05, 'epoch': 0.36} {'loss': 0.6233, 'learning_rate': 1.8861660110676906e-05, 'epoch': 0.36} {'loss': 0.5294, 'learning_rate': 1.8861504424418882e-05, 'epoch': 0.36} {'loss': 0.6376, 'learning_rate': 1.8861348728157907e-05, 'epoch': 0.36} {'loss': 0.585, 'learning_rate': 1.886119302189415e-05, 'epoch': 0.36} {'loss': 0.4129, 'learning_rate': 1.8861037305627796e-05, 'epoch': 0.36} {'loss': 0.4396, 'learning_rate': 1.8860881579359015e-05, 'epoch': 0.36} {'loss': 0.6404, 'learning_rate': 1.886072584308798e-05, 'epoch': 0.36} {'loss': 0.6249, 'learning_rate': 1.8860570096814875e-05, 'epoch': 0.36} {'loss': 0.3769, 'learning_rate': 1.8860414340539867e-05, 'epoch': 0.36} {'loss': 0.6676, 'learning_rate': 1.886025857426314e-05, 'epoch': 0.36} {'loss': 0.726, 'learning_rate': 1.8860102797984865e-05, 'epoch': 0.36} {'loss': 0.5269, 'learning_rate': 1.8859947011705217e-05, 'epoch': 0.36} {'loss': 0.6658, 'learning_rate': 1.8859791215424376e-05, 'epoch': 0.36} {'loss': 0.5099, 'learning_rate': 1.8859635409142515e-05, 'epoch': 0.36} {'loss': 0.4426, 'learning_rate': 1.8859479592859807e-05, 'epoch': 0.36} {'loss': 0.6761, 'learning_rate': 1.8859323766576436e-05, 'epoch': 0.36} {'loss': 0.5679, 'learning_rate': 1.885916793029257e-05, 'epoch': 0.36} {'loss': 0.6666, 'learning_rate': 1.885901208400839e-05, 'epoch': 0.36} {'loss': 0.6081, 'learning_rate': 1.885885622772407e-05, 'epoch': 0.36} {'loss': 0.5107, 'learning_rate': 1.8858700361439783e-05, 'epoch': 0.36} {'loss': 0.6261, 'learning_rate': 1.8858544485155708e-05, 'epoch': 0.36} {'loss': 0.6203, 'learning_rate': 1.8858388598872026e-05, 'epoch': 0.36} {'loss': 0.7141, 'learning_rate': 1.8858232702588903e-05, 'epoch': 0.36} {'loss': 0.6103, 'learning_rate': 1.8858076796306522e-05, 'epoch': 0.36} {'loss': 0.449, 'learning_rate': 1.8857920880025053e-05, 'epoch': 0.36} {'loss': 0.8548, 'learning_rate': 1.8857764953744678e-05, 'epoch': 0.36} {'loss': 0.7104, 'learning_rate': 1.8857609017465574e-05, 'epoch': 0.36} {'loss': 0.5472, 'learning_rate': 1.885745307118791e-05, 'epoch': 0.36} {'loss': 0.562, 'learning_rate': 1.885729711491187e-05, 'epoch': 0.36} {'loss': 0.6345, 'learning_rate': 1.8857141148637618e-05, 'epoch': 0.36} {'loss': 0.5527, 'learning_rate': 1.885698517236534e-05, 'epoch': 0.36} {'loss': 0.6807, 'learning_rate': 1.8856829186095217e-05, 'epoch': 0.36} {'loss': 0.5412, 'learning_rate': 1.8856673189827413e-05, 'epoch': 0.36} {'loss': 0.5905, 'learning_rate': 1.885651718356211e-05, 'epoch': 0.36} {'loss': 0.4247, 'learning_rate': 1.8856361167299484e-05, 'epoch': 0.36} {'loss': 0.506, 'learning_rate': 1.8856205141039708e-05, 'epoch': 0.36} {'loss': 0.5844, 'learning_rate': 1.8856049104782964e-05, 'epoch': 0.36} {'loss': 0.5797, 'learning_rate': 1.8855893058529422e-05, 'epoch': 0.36} {'loss': 0.5376, 'learning_rate': 1.8855737002279258e-05, 'epoch': 0.36} {'loss': 0.6531, 'learning_rate': 1.885558093603266e-05, 'epoch': 0.36} {'loss': 0.5701, 'learning_rate': 1.8855424859789787e-05, 'epoch': 0.36} {'loss': 0.6859, 'learning_rate': 1.8855268773550825e-05, 'epoch': 0.36} {'loss': 0.7188, 'learning_rate': 1.885511267731595e-05, 'epoch': 0.36} {'loss': 0.5441, 'learning_rate': 1.8854956571085335e-05, 'epoch': 0.36} {'loss': 0.5793, 'learning_rate': 1.885480045485916e-05, 'epoch': 0.36} {'loss': 0.4589, 'learning_rate': 1.8854644328637594e-05, 'epoch': 0.36} {'loss': 0.7229, 'learning_rate': 1.8854488192420825e-05, 'epoch': 0.36} {'loss': 0.5752, 'learning_rate': 1.885433204620902e-05, 'epoch': 0.36} {'loss': 0.5928, 'learning_rate': 1.8854175890002358e-05, 'epoch': 0.36} {'loss': 0.4751, 'learning_rate': 1.8854019723801015e-05, 'epoch': 0.36} {'loss': 0.4491, 'learning_rate': 1.8853863547605165e-05, 'epoch': 0.36} {'loss': 0.5816, 'learning_rate': 1.8853707361414987e-05, 'epoch': 0.36} {'loss': 0.7093, 'learning_rate': 1.885355116523066e-05, 'epoch': 0.36} {'loss': 0.5039, 'learning_rate': 1.8853394959052355e-05, 'epoch': 0.36} {'loss': 0.627, 'learning_rate': 1.8853238742880253e-05, 'epoch': 0.36} {'loss': 0.4918, 'learning_rate': 1.8853082516714524e-05, 'epoch': 0.36} {'loss': 0.6615, 'learning_rate': 1.8852926280555355e-05, 'epoch': 0.36} {'loss': 0.4325, 'learning_rate': 1.885277003440291e-05, 'epoch': 0.36} {'loss': 0.6185, 'learning_rate': 1.8852613778257374e-05, 'epoch': 0.36} {'loss': 0.7553, 'learning_rate': 1.8852457512118917e-05, 'epoch': 0.36} {'loss': 0.7052, 'learning_rate': 1.885230123598772e-05, 'epoch': 0.36} {'loss': 0.4078, 'learning_rate': 1.885214494986396e-05, 'epoch': 0.36} {'loss': 0.4423, 'learning_rate': 1.8851988653747814e-05, 'epoch': 0.36} {'loss': 0.5608, 'learning_rate': 1.885183234763945e-05, 'epoch': 0.36} {'loss': 0.5683, 'learning_rate': 1.8851676031539054e-05, 'epoch': 0.36} {'loss': 0.5278, 'learning_rate': 1.88515197054468e-05, 'epoch': 0.36} {'loss': 0.6514, 'learning_rate': 1.885136336936286e-05, 'epoch': 0.36} {'loss': 0.6791, 'learning_rate': 1.885120702328742e-05, 'epoch': 0.36} {'loss': 0.6488, 'learning_rate': 1.8851050667220642e-05, 'epoch': 0.36} {'loss': 0.6844, 'learning_rate': 1.8850894301162713e-05, 'epoch': 0.36} {'loss': 0.5892, 'learning_rate': 1.8850737925113813e-05, 'epoch': 0.36} {'loss': 0.8168, 'learning_rate': 1.885058153907411e-05, 'epoch': 0.36} {'loss': 0.5788, 'learning_rate': 1.8850425143043783e-05, 'epoch': 0.36} {'loss': 0.6004, 'learning_rate': 1.885026873702301e-05, 'epoch': 0.36} {'loss': 0.5347, 'learning_rate': 1.8850112321011965e-05, 'epoch': 0.36} {'loss': 0.5064, 'learning_rate': 1.8849955895010826e-05, 'epoch': 0.36} {'loss': 0.6674, 'learning_rate': 1.884979945901977e-05, 'epoch': 0.36} {'loss': 0.5841, 'learning_rate': 1.8849643013038972e-05, 'epoch': 0.36} {'loss': 0.5749, 'learning_rate': 1.8849486557068614e-05, 'epoch': 0.36} {'loss': 0.5866, 'learning_rate': 1.8849330091108868e-05, 'epoch': 0.36} {'loss': 0.4506, 'learning_rate': 1.8849173615159906e-05, 'epoch': 0.36} {'loss': 0.6429, 'learning_rate': 1.8849017129221915e-05, 'epoch': 0.36} {'loss': 0.5129, 'learning_rate': 1.884886063329506e-05, 'epoch': 0.36} {'loss': 0.6653, 'learning_rate': 1.884870412737953e-05, 'epoch': 0.36} {'loss': 0.4979, 'learning_rate': 1.8848547611475493e-05, 'epoch': 0.36} {'loss': 0.4875, 'learning_rate': 1.884839108558313e-05, 'epoch': 0.36} {'loss': 0.4771, 'learning_rate': 1.8848234549702614e-05, 'epoch': 0.36} {'loss': 0.6152, 'learning_rate': 1.884807800383413e-05, 'epoch': 0.36} {'loss': 0.6074, 'learning_rate': 1.884792144797784e-05, 'epoch': 0.36} {'loss': 0.4191, 'learning_rate': 1.8847764882133936e-05, 'epoch': 0.36} {'loss': 0.5954, 'learning_rate': 1.884760830630258e-05, 'epoch': 0.36} {'loss': 0.5788, 'learning_rate': 1.8847451720483963e-05, 'epoch': 0.36} {'loss': 0.6823, 'learning_rate': 1.8847295124678254e-05, 'epoch': 0.36} {'loss': 0.6635, 'learning_rate': 1.884713851888563e-05, 'epoch': 0.36} {'loss': 0.6423, 'learning_rate': 1.8846981903106273e-05, 'epoch': 0.36} {'loss': 0.5446, 'learning_rate': 1.884682527734035e-05, 'epoch': 0.36} {'loss': 0.6485, 'learning_rate': 1.8846668641588046e-05, 'epoch': 0.36} {'loss': 0.703, 'learning_rate': 1.8846511995849535e-05, 'epoch': 0.36} {'loss': 0.5833, 'learning_rate': 1.8846355340124996e-05, 'epoch': 0.36} {'loss': 0.4721, 'learning_rate': 1.8846198674414606e-05, 'epoch': 0.36} {'loss': 0.6247, 'learning_rate': 1.8846041998718534e-05, 'epoch': 0.36} {'loss': 0.5397, 'learning_rate': 1.8845885313036968e-05, 'epoch': 0.36} {'loss': 0.6994, 'learning_rate': 1.8845728617370075e-05, 'epoch': 0.36} {'loss': 0.7017, 'learning_rate': 1.884557191171804e-05, 'epoch': 0.36} {'loss': 0.6705, 'learning_rate': 1.8845415196081034e-05, 'epoch': 0.36} {'loss': 0.525, 'learning_rate': 1.884525847045924e-05, 'epoch': 0.36} {'loss': 0.4447, 'learning_rate': 1.8845101734852825e-05, 'epoch': 0.36} {'loss': 0.5317, 'learning_rate': 1.8844944989261977e-05, 'epoch': 0.36} {'loss': 0.5527, 'learning_rate': 1.8844788233686863e-05, 'epoch': 0.36} {'loss': 0.6286, 'learning_rate': 1.8844631468127673e-05, 'epoch': 0.36} {'loss': 0.5825, 'learning_rate': 1.8844474692584568e-05, 'epoch': 0.36} {'loss': 0.555, 'learning_rate': 1.8844317907057735e-05, 'epoch': 0.36} {'loss': 0.5718, 'learning_rate': 1.8844161111547353e-05, 'epoch': 0.36} {'loss': 0.4649, 'learning_rate': 1.8844004306053592e-05, 'epoch': 0.36} {'loss': 0.5115, 'learning_rate': 1.8843847490576634e-05, 'epoch': 0.36} {'loss': 0.5221, 'learning_rate': 1.8843690665116653e-05, 'epoch': 0.36} {'loss': 0.591, 'learning_rate': 1.8843533829673824e-05, 'epoch': 0.36} {'loss': 0.5224, 'learning_rate': 1.8843376984248328e-05, 'epoch': 0.36} {'loss': 0.5101, 'learning_rate': 1.8843220128840343e-05, 'epoch': 0.36} {'loss': 0.5598, 'learning_rate': 1.8843063263450043e-05, 'epoch': 0.36} {'loss': 0.5393, 'learning_rate': 1.8842906388077606e-05, 'epoch': 0.36} {'loss': 0.5581, 'learning_rate': 1.884274950272321e-05, 'epoch': 0.36} {'loss': 0.6257, 'learning_rate': 1.8842592607387028e-05, 'epoch': 0.36} {'loss': 0.363, 'learning_rate': 1.8842435702069245e-05, 'epoch': 0.36} {'loss': 0.5512, 'learning_rate': 1.8842278786770033e-05, 'epoch': 0.36} {'loss': 0.586, 'learning_rate': 1.8842121861489568e-05, 'epoch': 0.36} {'loss': 0.4499, 'learning_rate': 1.884196492622803e-05, 'epoch': 0.36} {'loss': 0.5202, 'learning_rate': 1.8841807980985596e-05, 'epoch': 0.36} {'loss': 0.6656, 'learning_rate': 1.8841651025762438e-05, 'epoch': 0.36} {'loss': 0.4612, 'learning_rate': 1.8841494060558742e-05, 'epoch': 0.36} {'loss': 0.4289, 'learning_rate': 1.8841337085374677e-05, 'epoch': 0.36} {'loss': 0.6319, 'learning_rate': 1.8841180100210425e-05, 'epoch': 0.36} {'loss': 0.6509, 'learning_rate': 1.884102310506616e-05, 'epoch': 0.36} {'loss': 0.5277, 'learning_rate': 1.8840866099942066e-05, 'epoch': 0.36} {'loss': 0.6607, 'learning_rate': 1.884070908483831e-05, 'epoch': 0.36} {'loss': 0.4564, 'learning_rate': 1.884055205975508e-05, 'epoch': 0.36} {'loss': 0.6029, 'learning_rate': 1.8840395024692545e-05, 'epoch': 0.36} {'loss': 0.7103, 'learning_rate': 1.8840237979650884e-05, 'epoch': 0.36} {'loss': 0.613, 'learning_rate': 1.8840080924630274e-05, 'epoch': 0.36} {'loss': 0.6647, 'learning_rate': 1.8839923859630897e-05, 'epoch': 0.36} {'loss': 0.5414, 'learning_rate': 1.8839766784652927e-05, 'epoch': 0.36} {'loss': 0.4802, 'learning_rate': 1.883960969969654e-05, 'epoch': 0.36} {'loss': 0.6082, 'learning_rate': 1.8839452604761914e-05, 'epoch': 0.36} {'loss': 0.4664, 'learning_rate': 1.8839295499849227e-05, 'epoch': 0.36} {'loss': 0.5257, 'learning_rate': 1.8839138384958658e-05, 'epoch': 0.36} {'loss': 0.5158, 'learning_rate': 1.8838981260090382e-05, 'epoch': 0.36} {'loss': 0.5916, 'learning_rate': 1.8838824125244574e-05, 'epoch': 0.36} {'loss': 0.6139, 'learning_rate': 1.883866698042142e-05, 'epoch': 0.36} {'loss': 0.5582, 'learning_rate': 1.8838509825621087e-05, 'epoch': 0.36} {'loss': 0.5145, 'learning_rate': 1.883835266084376e-05, 'epoch': 0.36} {'loss': 0.6462, 'learning_rate': 1.883819548608961e-05, 'epoch': 0.36} {'loss': 0.4251, 'learning_rate': 1.8838038301358817e-05, 'epoch': 0.36} {'loss': 0.6634, 'learning_rate': 1.8837881106651564e-05, 'epoch': 0.36} {'loss': 0.666, 'learning_rate': 1.8837723901968025e-05, 'epoch': 0.36} {'loss': 0.5023, 'learning_rate': 1.8837566687308372e-05, 'epoch': 0.36} {'loss': 0.4263, 'learning_rate': 1.883740946267279e-05, 'epoch': 0.36} {'loss': 0.5888, 'learning_rate': 1.883725222806145e-05, 'epoch': 0.36} {'loss': 0.5114, 'learning_rate': 1.8837094983474536e-05, 'epoch': 0.36} {'loss': 0.5012, 'learning_rate': 1.8836937728912218e-05, 'epoch': 0.36} {'loss': 0.5778, 'learning_rate': 1.883678046437468e-05, 'epoch': 0.36} {'loss': 0.5911, 'learning_rate': 1.8836623189862098e-05, 'epoch': 0.36} {'loss': 0.6161, 'learning_rate': 1.883646590537465e-05, 'epoch': 0.36} {'loss': 0.5746, 'learning_rate': 1.883630861091251e-05, 'epoch': 0.36} {'loss': 0.7011, 'learning_rate': 1.8836151306475857e-05, 'epoch': 0.36} {'loss': 0.617, 'learning_rate': 1.8835993992064874e-05, 'epoch': 0.36} {'loss': 0.4974, 'learning_rate': 1.8835836667679726e-05, 'epoch': 0.36} {'loss': 0.6281, 'learning_rate': 1.8835679333320606e-05, 'epoch': 0.36} {'loss': 0.4853, 'learning_rate': 1.883552198898768e-05, 'epoch': 0.36} {'loss': 0.4526, 'learning_rate': 1.883536463468113e-05, 'epoch': 0.36} {'loss': 0.6635, 'learning_rate': 1.8835207270401138e-05, 'epoch': 0.36} {'loss': 0.4387, 'learning_rate': 1.8835049896147874e-05, 'epoch': 0.36} {'loss': 0.5609, 'learning_rate': 1.8834892511921522e-05, 'epoch': 0.36} {'loss': 0.6911, 'learning_rate': 1.8834735117722252e-05, 'epoch': 0.36} {'loss': 0.5389, 'learning_rate': 1.8834577713550246e-05, 'epoch': 0.36} {'loss': 0.566, 'learning_rate': 1.8834420299405684e-05, 'epoch': 0.36} {'loss': 0.6634, 'learning_rate': 1.883426287528874e-05, 'epoch': 0.36} {'loss': 0.558, 'learning_rate': 1.8834105441199594e-05, 'epoch': 0.36} {'loss': 0.7263, 'learning_rate': 1.8833947997138422e-05, 'epoch': 0.36} {'loss': 0.5732, 'learning_rate': 1.8833790543105405e-05, 'epoch': 0.36} {'loss': 0.5751, 'learning_rate': 1.8833633079100716e-05, 'epoch': 0.36} {'loss': 0.48, 'learning_rate': 1.8833475605124532e-05, 'epoch': 0.36} {'loss': 0.5823, 'learning_rate': 1.883331812117704e-05, 'epoch': 0.36} {'loss': 0.646, 'learning_rate': 1.883316062725841e-05, 'epoch': 0.36} {'loss': 0.6925, 'learning_rate': 1.883300312336882e-05, 'epoch': 0.36} {'loss': 0.6125, 'learning_rate': 1.883284560950845e-05, 'epoch': 0.36} {'loss': 0.5537, 'learning_rate': 1.883268808567747e-05, 'epoch': 0.36} {'loss': 0.6833, 'learning_rate': 1.8832530551876075e-05, 'epoch': 0.36} {'loss': 0.575, 'learning_rate': 1.8832373008104427e-05, 'epoch': 0.36} {'loss': 0.5741, 'learning_rate': 1.8832215454362713e-05, 'epoch': 0.36} {'loss': 0.3405, 'learning_rate': 1.8832057890651107e-05, 'epoch': 0.36} {'loss': 0.4947, 'learning_rate': 1.8831900316969783e-05, 'epoch': 0.36} {'loss': 0.6163, 'learning_rate': 1.8831742733318923e-05, 'epoch': 0.36} {'loss': 0.4652, 'learning_rate': 1.8831585139698708e-05, 'epoch': 0.36} {'loss': 0.6695, 'learning_rate': 1.8831427536109312e-05, 'epoch': 0.36} {'loss': 0.5686, 'learning_rate': 1.8831269922550914e-05, 'epoch': 0.36} {'loss': 0.4995, 'learning_rate': 1.8831112299023694e-05, 'epoch': 0.36} {'loss': 0.5497, 'learning_rate': 1.8830954665527824e-05, 'epoch': 0.36} {'loss': 0.5067, 'learning_rate': 1.8830797022063485e-05, 'epoch': 0.36} {'loss': 0.717, 'learning_rate': 1.8830639368630855e-05, 'epoch': 0.36} {'loss': 0.5803, 'learning_rate': 1.8830481705230115e-05, 'epoch': 0.36} {'loss': 0.574, 'learning_rate': 1.883032403186144e-05, 'epoch': 0.36} {'loss': 0.5803, 'learning_rate': 1.8830166348525006e-05, 'epoch': 0.36} {'loss': 0.5177, 'learning_rate': 1.8830008655220998e-05, 'epoch': 0.36} {'loss': 0.5735, 'learning_rate': 1.8829850951949583e-05, 'epoch': 0.36} {'loss': 0.5529, 'learning_rate': 1.8829693238710952e-05, 'epoch': 0.36} {'loss': 0.5789, 'learning_rate': 1.8829535515505274e-05, 'epoch': 0.36} {'loss': 0.5467, 'learning_rate': 1.882937778233273e-05, 'epoch': 0.36} {'loss': 0.6501, 'learning_rate': 1.8829220039193492e-05, 'epoch': 0.36} {'loss': 0.6715, 'learning_rate': 1.8829062286087748e-05, 'epoch': 0.36} {'loss': 0.553, 'learning_rate': 1.882890452301567e-05, 'epoch': 0.36} {'loss': 0.635, 'learning_rate': 1.882874674997744e-05, 'epoch': 0.36} {'loss': 0.6183, 'learning_rate': 1.8828588966973235e-05, 'epoch': 0.36} {'loss': 0.4062, 'learning_rate': 1.8828431174003226e-05, 'epoch': 0.36} {'loss': 0.6671, 'learning_rate': 1.8828273371067604e-05, 'epoch': 0.36} {'loss': 0.5364, 'learning_rate': 1.8828115558166534e-05, 'epoch': 0.36} {'loss': 0.523, 'learning_rate': 1.8827957735300203e-05, 'epoch': 0.36} {'loss': 0.4601, 'learning_rate': 1.8827799902468787e-05, 'epoch': 0.36} {'loss': 0.6514, 'learning_rate': 1.8827642059672466e-05, 'epoch': 0.36} {'loss': 0.6348, 'learning_rate': 1.882748420691141e-05, 'epoch': 0.36} {'loss': 0.7468, 'learning_rate': 1.8827326344185807e-05, 'epoch': 0.36} {'loss': 0.6275, 'learning_rate': 1.882716847149583e-05, 'epoch': 0.36} {'loss': 0.6624, 'learning_rate': 1.8827010588841657e-05, 'epoch': 0.36} {'loss': 0.6476, 'learning_rate': 1.8826852696223467e-05, 'epoch': 0.36} {'loss': 0.6032, 'learning_rate': 1.8826694793641443e-05, 'epoch': 0.36} {'loss': 0.6888, 'learning_rate': 1.8826536881095756e-05, 'epoch': 0.36} {'loss': 0.5634, 'learning_rate': 1.882637895858659e-05, 'epoch': 0.36} {'loss': 0.6098, 'learning_rate': 1.8826221026114114e-05, 'epoch': 0.36} {'loss': 0.6233, 'learning_rate': 1.882606308367852e-05, 'epoch': 0.36} {'loss': 0.7266, 'learning_rate': 1.8825905131279975e-05, 'epoch': 0.36} {'loss': 0.6461, 'learning_rate': 1.8825747168918665e-05, 'epoch': 0.36} {'loss': 0.5861, 'learning_rate': 1.8825589196594763e-05, 'epoch': 0.36} {'loss': 0.6064, 'learning_rate': 1.882543121430845e-05, 'epoch': 0.36} {'loss': 0.7259, 'learning_rate': 1.88252732220599e-05, 'epoch': 0.36} {'loss': 0.7232, 'learning_rate': 1.8825115219849297e-05, 'epoch': 0.36} {'loss': 0.574, 'learning_rate': 1.8824957207676818e-05, 'epoch': 0.36} {'loss': 0.5944, 'learning_rate': 1.882479918554264e-05, 'epoch': 0.36} {'loss': 0.4767, 'learning_rate': 1.882464115344694e-05, 'epoch': 0.36} {'loss': 0.6426, 'learning_rate': 1.88244831113899e-05, 'epoch': 0.36} {'loss': 0.4354, 'learning_rate': 1.8824325059371694e-05, 'epoch': 0.36} {'loss': 0.6368, 'learning_rate': 1.8824166997392505e-05, 'epoch': 0.36} {'loss': 0.5279, 'learning_rate': 1.8824008925452508e-05, 'epoch': 0.36} {'loss': 0.6147, 'learning_rate': 1.8823850843551887e-05, 'epoch': 0.36} {'loss': 0.7459, 'learning_rate': 1.8823692751690812e-05, 'epoch': 0.36} {'loss': 0.6695, 'learning_rate': 1.8823534649869468e-05, 'epoch': 0.36} {'loss': 0.7726, 'learning_rate': 1.8823376538088028e-05, 'epoch': 0.36} {'loss': 0.6479, 'learning_rate': 1.882321841634668e-05, 'epoch': 0.36} {'loss': 0.5312, 'learning_rate': 1.882306028464559e-05, 'epoch': 0.36} {'loss': 0.7836, 'learning_rate': 1.882290214298495e-05, 'epoch': 0.36} {'loss': 0.6291, 'learning_rate': 1.8822743991364925e-05, 'epoch': 0.36} {'loss': 0.4368, 'learning_rate': 1.8822585829785704e-05, 'epoch': 0.36} {'loss': 0.6341, 'learning_rate': 1.882242765824746e-05, 'epoch': 0.36} {'loss': 0.4884, 'learning_rate': 1.8822269476750366e-05, 'epoch': 0.36} {'loss': 0.6612, 'learning_rate': 1.8822111285294612e-05, 'epoch': 0.36} {'loss': 0.5774, 'learning_rate': 1.8821953083880377e-05, 'epoch': 0.36} {'loss': 0.6124, 'learning_rate': 1.882179487250783e-05, 'epoch': 0.36} {'loss': 0.5793, 'learning_rate': 1.8821636651177152e-05, 'epoch': 0.36} {'loss': 0.661, 'learning_rate': 1.882147841988853e-05, 'epoch': 0.36} {'loss': 0.5881, 'learning_rate': 1.8821320178642132e-05, 'epoch': 0.36} {'loss': 0.6095, 'learning_rate': 1.882116192743814e-05, 'epoch': 0.36} {'loss': 0.5691, 'learning_rate': 1.8821003666276736e-05, 'epoch': 0.36} {'loss': 0.5776, 'learning_rate': 1.8820845395158093e-05, 'epoch': 0.36} {'loss': 0.6233, 'learning_rate': 1.8820687114082397e-05, 'epoch': 0.36} {'loss': 0.4905, 'learning_rate': 1.8820528823049823e-05, 'epoch': 0.36} {'loss': 0.4745, 'learning_rate': 1.8820370522060546e-05, 'epoch': 0.36} {'loss': 0.4545, 'learning_rate': 1.882021221111475e-05, 'epoch': 0.36} {'loss': 0.6612, 'learning_rate': 1.882005389021261e-05, 'epoch': 0.36} {'loss': 0.6569, 'learning_rate': 1.8819895559354306e-05, 'epoch': 0.36} {'loss': 0.5531, 'learning_rate': 1.881973721854002e-05, 'epoch': 0.36} {'loss': 0.5394, 'learning_rate': 1.8819578867769925e-05, 'epoch': 0.36} {'loss': 0.5852, 'learning_rate': 1.8819420507044205e-05, 'epoch': 0.36} {'loss': 0.5912, 'learning_rate': 1.8819262136363035e-05, 'epoch': 0.36} {'loss': 0.5311, 'learning_rate': 1.8819103755726593e-05, 'epoch': 0.36} {'loss': 0.644, 'learning_rate': 1.8818945365135063e-05, 'epoch': 0.36} {'loss': 0.553, 'learning_rate': 1.881878696458862e-05, 'epoch': 0.37} {'loss': 0.5622, 'learning_rate': 1.8818628554087442e-05, 'epoch': 0.37} {'loss': 0.5702, 'learning_rate': 1.8818470133631713e-05, 'epoch': 0.37} {'loss': 0.5804, 'learning_rate': 1.8818311703221606e-05, 'epoch': 0.37} {'loss': 0.5883, 'learning_rate': 1.8818153262857302e-05, 'epoch': 0.37} {'loss': 0.7237, 'learning_rate': 1.881799481253898e-05, 'epoch': 0.37} {'loss': 0.5774, 'learning_rate': 1.8817836352266816e-05, 'epoch': 0.37} {'loss': 0.4819, 'learning_rate': 1.8817677882040993e-05, 'epoch': 0.37} {'loss': 0.543, 'learning_rate': 1.881751940186169e-05, 'epoch': 0.37} {'loss': 0.5845, 'learning_rate': 1.881736091172908e-05, 'epoch': 0.37} {'loss': 0.5125, 'learning_rate': 1.8817202411643354e-05, 'epoch': 0.37} {'loss': 0.6047, 'learning_rate': 1.881704390160468e-05, 'epoch': 0.37} {'loss': 0.5399, 'learning_rate': 1.8816885381613237e-05, 'epoch': 0.37} {'loss': 0.6527, 'learning_rate': 1.8816726851669206e-05, 'epoch': 0.37} {'loss': 0.6599, 'learning_rate': 1.881656831177277e-05, 'epoch': 0.37} {'loss': 0.4931, 'learning_rate': 1.8816409761924106e-05, 'epoch': 0.37} {'loss': 0.5684, 'learning_rate': 1.881625120212339e-05, 'epoch': 0.37} {'loss': 0.7193, 'learning_rate': 1.8816092632370803e-05, 'epoch': 0.37} {'loss': 0.7961, 'learning_rate': 1.8815934052666523e-05, 'epoch': 0.37} {'loss': 0.4877, 'learning_rate': 1.8815775463010735e-05, 'epoch': 0.37} {'loss': 0.6381, 'learning_rate': 1.8815616863403608e-05, 'epoch': 0.37} {'loss': 0.6866, 'learning_rate': 1.881545825384533e-05, 'epoch': 0.37} {'loss': 0.5106, 'learning_rate': 1.881529963433607e-05, 'epoch': 0.37} {'loss': 0.5256, 'learning_rate': 1.8815141004876017e-05, 'epoch': 0.37} {'loss': 0.477, 'learning_rate': 1.8814982365465348e-05, 'epoch': 0.37} {'loss': 0.7052, 'learning_rate': 1.8814823716104237e-05, 'epoch': 0.37} {'loss': 0.5219, 'learning_rate': 1.8814665056792863e-05, 'epoch': 0.37} {'loss': 0.5262, 'learning_rate': 1.881450638753141e-05, 'epoch': 0.37} {'loss': 0.5507, 'learning_rate': 1.881434770832006e-05, 'epoch': 0.37} {'loss': 0.5605, 'learning_rate': 1.8814189019158988e-05, 'epoch': 0.37} {'loss': 0.513, 'learning_rate': 1.8814030320048365e-05, 'epoch': 0.37} {'loss': 0.6199, 'learning_rate': 1.8813871610988386e-05, 'epoch': 0.37} {'loss': 0.7489, 'learning_rate': 1.8813712891979218e-05, 'epoch': 0.37} {'loss': 0.6244, 'learning_rate': 1.8813554163021045e-05, 'epoch': 0.37} {'loss': 0.4627, 'learning_rate': 1.8813395424114043e-05, 'epoch': 0.37} {'loss': 0.7251, 'learning_rate': 1.8813236675258396e-05, 'epoch': 0.37} {'loss': 0.6408, 'learning_rate': 1.8813077916454282e-05, 'epoch': 0.37} {'loss': 0.5925, 'learning_rate': 1.8812919147701874e-05, 'epoch': 0.37} {'loss': 0.6918, 'learning_rate': 1.8812760369001363e-05, 'epoch': 0.37} {'loss': 0.6636, 'learning_rate': 1.8812601580352914e-05, 'epoch': 0.37} {'loss': 0.5567, 'learning_rate': 1.8812442781756717e-05, 'epoch': 0.37} {'loss': 0.5397, 'learning_rate': 1.8812283973212948e-05, 'epoch': 0.37} {'loss': 0.4871, 'learning_rate': 1.8812125154721787e-05, 'epoch': 0.37} {'loss': 0.6136, 'learning_rate': 1.881196632628341e-05, 'epoch': 0.37} {'loss': 0.6255, 'learning_rate': 1.8811807487898002e-05, 'epoch': 0.37} {'loss': 0.7843, 'learning_rate': 1.8811648639565735e-05, 'epoch': 0.37} {'loss': 0.678, 'learning_rate': 1.8811489781286796e-05, 'epoch': 0.37} {'loss': 0.6156, 'learning_rate': 1.8811330913061357e-05, 'epoch': 0.37} {'loss': 0.6131, 'learning_rate': 1.8811172034889606e-05, 'epoch': 0.37} {'loss': 0.443, 'learning_rate': 1.8811013146771713e-05, 'epoch': 0.37} {'loss': 0.7072, 'learning_rate': 1.8810854248707864e-05, 'epoch': 0.37} {'loss': 0.6101, 'learning_rate': 1.8810695340698236e-05, 'epoch': 0.37} {'loss': 0.533, 'learning_rate': 1.8810536422743008e-05, 'epoch': 0.37} {'loss': 0.6026, 'learning_rate': 1.881037749484236e-05, 'epoch': 0.37} {'loss': 0.4777, 'learning_rate': 1.881021855699647e-05, 'epoch': 0.37} {'loss': 0.6719, 'learning_rate': 1.881005960920552e-05, 'epoch': 0.37} {'loss': 0.7484, 'learning_rate': 1.8809900651469687e-05, 'epoch': 0.37} {'loss': 0.5587, 'learning_rate': 1.880974168378915e-05, 'epoch': 0.37} {'loss': 0.5898, 'learning_rate': 1.880958270616409e-05, 'epoch': 0.37} {'loss': 0.4818, 'learning_rate': 1.8809423718594688e-05, 'epoch': 0.37} {'loss': 0.5404, 'learning_rate': 1.880926472108112e-05, 'epoch': 0.37} {'loss': 0.6412, 'learning_rate': 1.880910571362357e-05, 'epoch': 0.37} {'loss': 0.6034, 'learning_rate': 1.8808946696222215e-05, 'epoch': 0.37} {'loss': 0.5212, 'learning_rate': 1.8808787668877232e-05, 'epoch': 0.37} {'loss': 0.4196, 'learning_rate': 1.8808628631588804e-05, 'epoch': 0.37} {'loss': 0.5672, 'learning_rate': 1.8808469584357107e-05, 'epoch': 0.37} {'loss': 0.6105, 'learning_rate': 1.8808310527182324e-05, 'epoch': 0.37} {'loss': 0.5899, 'learning_rate': 1.8808151460064637e-05, 'epoch': 0.37} {'loss': 0.6221, 'learning_rate': 1.8807992383004218e-05, 'epoch': 0.37} {'loss': 0.7275, 'learning_rate': 1.8807833296001254e-05, 'epoch': 0.37} {'loss': 0.6582, 'learning_rate': 1.8807674199055916e-05, 'epoch': 0.37} {'loss': 0.6638, 'learning_rate': 1.8807515092168393e-05, 'epoch': 0.37} {'loss': 0.6073, 'learning_rate': 1.8807355975338858e-05, 'epoch': 0.37} {'loss': 0.5732, 'learning_rate': 1.8807196848567494e-05, 'epoch': 0.37} {'loss': 0.5461, 'learning_rate': 1.8807037711854477e-05, 'epoch': 0.37} {'loss': 0.5775, 'learning_rate': 1.880687856519999e-05, 'epoch': 0.37} {'loss': 0.5479, 'learning_rate': 1.8806719408604214e-05, 'epoch': 0.37} {'loss': 0.6191, 'learning_rate': 1.8806560242067326e-05, 'epoch': 0.37} {'loss': 0.494, 'learning_rate': 1.8806401065589508e-05, 'epoch': 0.37} {'loss': 0.5774, 'learning_rate': 1.8806241879170934e-05, 'epoch': 0.37} {'loss': 0.3827, 'learning_rate': 1.880608268281179e-05, 'epoch': 0.37} {'loss': 0.6268, 'learning_rate': 1.880592347651225e-05, 'epoch': 0.37} {'loss': 0.5432, 'learning_rate': 1.88057642602725e-05, 'epoch': 0.37} {'loss': 0.611, 'learning_rate': 1.880560503409272e-05, 'epoch': 0.37} {'loss': 0.6647, 'learning_rate': 1.8805445797973078e-05, 'epoch': 0.37} {'loss': 0.5697, 'learning_rate': 1.8805286551913766e-05, 'epoch': 0.37} {'loss': 0.4861, 'learning_rate': 1.8805127295914963e-05, 'epoch': 0.37} {'loss': 0.5312, 'learning_rate': 1.880496802997684e-05, 'epoch': 0.37} {'loss': 0.6743, 'learning_rate': 1.8804808754099587e-05, 'epoch': 0.37} {'loss': 0.5307, 'learning_rate': 1.8804649468283375e-05, 'epoch': 0.37} {'loss': 0.6625, 'learning_rate': 1.8804490172528392e-05, 'epoch': 0.37} {'loss': 0.6693, 'learning_rate': 1.880433086683481e-05, 'epoch': 0.37} {'loss': 0.5527, 'learning_rate': 1.8804171551202817e-05, 'epoch': 0.37} {'loss': 0.6108, 'learning_rate': 1.8804012225632587e-05, 'epoch': 0.37} {'loss': 0.7851, 'learning_rate': 1.8803852890124302e-05, 'epoch': 0.37} {'loss': 0.5399, 'learning_rate': 1.880369354467814e-05, 'epoch': 0.37} {'loss': 0.5675, 'learning_rate': 1.8803534189294283e-05, 'epoch': 0.37} {'loss': 0.645, 'learning_rate': 1.8803374823972908e-05, 'epoch': 0.37} {'loss': 0.6782, 'learning_rate': 1.8803215448714197e-05, 'epoch': 0.37} {'loss': 0.6696, 'learning_rate': 1.8803056063518332e-05, 'epoch': 0.37} {'loss': 0.4363, 'learning_rate': 1.8802896668385487e-05, 'epoch': 0.37} {'loss': 0.6339, 'learning_rate': 1.8802737263315848e-05, 'epoch': 0.37} {'loss': 0.5615, 'learning_rate': 1.8802577848309594e-05, 'epoch': 0.37} {'loss': 0.6159, 'learning_rate': 1.8802418423366902e-05, 'epoch': 0.37} {'loss': 0.6233, 'learning_rate': 1.8802258988487954e-05, 'epoch': 0.37} {'loss': 0.5954, 'learning_rate': 1.8802099543672927e-05, 'epoch': 0.37} {'loss': 0.7268, 'learning_rate': 1.880194008892201e-05, 'epoch': 0.37} {'loss': 0.5957, 'learning_rate': 1.880178062423537e-05, 'epoch': 0.37} {'loss': 0.6631, 'learning_rate': 1.8801621149613195e-05, 'epoch': 0.37} {'loss': 0.6444, 'learning_rate': 1.8801461665055663e-05, 'epoch': 0.37} {'loss': 0.7308, 'learning_rate': 1.8801302170562957e-05, 'epoch': 0.37} {'loss': 0.5765, 'learning_rate': 1.880114266613525e-05, 'epoch': 0.37} {'loss': 0.6806, 'learning_rate': 1.880098315177273e-05, 'epoch': 0.37} {'loss': 0.6018, 'learning_rate': 1.8800823627475574e-05, 'epoch': 0.37} {'loss': 0.7318, 'learning_rate': 1.8800664093243958e-05, 'epoch': 0.37} {'loss': 0.6881, 'learning_rate': 1.8800504549078068e-05, 'epoch': 0.37} {'loss': 0.5001, 'learning_rate': 1.8800344994978084e-05, 'epoch': 0.37} {'loss': 0.5176, 'learning_rate': 1.8800185430944182e-05, 'epoch': 0.37} {'loss': 0.5795, 'learning_rate': 1.8800025856976543e-05, 'epoch': 0.37} {'loss': 0.6773, 'learning_rate': 1.8799866273075348e-05, 'epoch': 0.37} {'loss': 0.5551, 'learning_rate': 1.879970667924078e-05, 'epoch': 0.37} {'loss': 0.6173, 'learning_rate': 1.8799547075473014e-05, 'epoch': 0.37} {'loss': 0.467, 'learning_rate': 1.8799387461772235e-05, 'epoch': 0.37} {'loss': 0.6768, 'learning_rate': 1.8799227838138622e-05, 'epoch': 0.37} {'loss': 0.6191, 'learning_rate': 1.8799068204572348e-05, 'epoch': 0.37} {'loss': 0.4042, 'learning_rate': 1.8798908561073604e-05, 'epoch': 0.37} {'loss': 0.5237, 'learning_rate': 1.8798748907642564e-05, 'epoch': 0.37} {'loss': 0.6878, 'learning_rate': 1.879858924427941e-05, 'epoch': 0.37} {'loss': 0.6315, 'learning_rate': 1.8798429570984322e-05, 'epoch': 0.37} {'loss': 0.77, 'learning_rate': 1.879826988775748e-05, 'epoch': 0.37} {'loss': 0.5736, 'learning_rate': 1.8798110194599063e-05, 'epoch': 0.37} {'loss': 0.7189, 'learning_rate': 1.8797950491509257e-05, 'epoch': 0.37} {'loss': 0.5801, 'learning_rate': 1.8797790778488233e-05, 'epoch': 0.37} {'loss': 0.6902, 'learning_rate': 1.879763105553618e-05, 'epoch': 0.37} {'loss': 0.5443, 'learning_rate': 1.8797471322653272e-05, 'epoch': 0.37} {'loss': 0.4969, 'learning_rate': 1.879731157983969e-05, 'epoch': 0.37} {'loss': 0.58, 'learning_rate': 1.8797151827095617e-05, 'epoch': 0.37} {'loss': 0.2886, 'learning_rate': 1.8796992064421234e-05, 'epoch': 0.37} {'loss': 0.6174, 'learning_rate': 1.879683229181672e-05, 'epoch': 0.37} {'loss': 0.7559, 'learning_rate': 1.8796672509282255e-05, 'epoch': 0.37} {'loss': 0.5396, 'learning_rate': 1.879651271681802e-05, 'epoch': 0.37} {'loss': 0.4859, 'learning_rate': 1.8796352914424197e-05, 'epoch': 0.37} {'loss': 0.5407, 'learning_rate': 1.879619310210096e-05, 'epoch': 0.37} {'loss': 0.5365, 'learning_rate': 1.8796033279848496e-05, 'epoch': 0.37} {'loss': 0.5748, 'learning_rate': 1.879587344766698e-05, 'epoch': 0.37} {'loss': 0.6735, 'learning_rate': 1.87957136055566e-05, 'epoch': 0.37} {'loss': 0.8097, 'learning_rate': 1.8795553753517526e-05, 'epoch': 0.37} {'loss': 0.4744, 'learning_rate': 1.879539389154995e-05, 'epoch': 0.37} {'loss': 0.606, 'learning_rate': 1.8795234019654047e-05, 'epoch': 0.37} {'loss': 0.45, 'learning_rate': 1.8795074137829995e-05, 'epoch': 0.37} {'loss': 0.575, 'learning_rate': 1.8794914246077972e-05, 'epoch': 0.37} {'loss': 0.6828, 'learning_rate': 1.879475434439817e-05, 'epoch': 0.37} {'loss': 0.5816, 'learning_rate': 1.879459443279076e-05, 'epoch': 0.37} {'loss': 0.6968, 'learning_rate': 1.8794434511255928e-05, 'epoch': 0.37} {'loss': 0.8374, 'learning_rate': 1.879427457979385e-05, 'epoch': 0.37} {'loss': 0.4276, 'learning_rate': 1.879411463840471e-05, 'epoch': 0.37} {'loss': 0.534, 'learning_rate': 1.8793954687088682e-05, 'epoch': 0.37} {'loss': 0.7735, 'learning_rate': 1.8793794725845954e-05, 'epoch': 0.37} {'loss': 0.606, 'learning_rate': 1.8793634754676705e-05, 'epoch': 0.37} {'loss': 0.4752, 'learning_rate': 1.8793474773581114e-05, 'epoch': 0.37} {'loss': 0.6441, 'learning_rate': 1.879331478255936e-05, 'epoch': 0.37} {'loss': 0.6752, 'learning_rate': 1.8793154781611628e-05, 'epoch': 0.37} {'loss': 0.5091, 'learning_rate': 1.87929947707381e-05, 'epoch': 0.37} {'loss': 0.6351, 'learning_rate': 1.8792834749938947e-05, 'epoch': 0.37} {'loss': 0.5358, 'learning_rate': 1.879267471921436e-05, 'epoch': 0.37} {'loss': 0.7042, 'learning_rate': 1.879251467856451e-05, 'epoch': 0.37} {'loss': 0.7044, 'learning_rate': 1.8792354627989584e-05, 'epoch': 0.37} {'loss': 0.4457, 'learning_rate': 1.8792194567489767e-05, 'epoch': 0.37} {'loss': 0.6105, 'learning_rate': 1.8792034497065227e-05, 'epoch': 0.37} {'loss': 0.5802, 'learning_rate': 1.879187441671616e-05, 'epoch': 0.37} {'loss': 0.5356, 'learning_rate': 1.879171432644273e-05, 'epoch': 0.37} {'loss': 0.4922, 'learning_rate': 1.8791554226245132e-05, 'epoch': 0.37} {'loss': 0.4788, 'learning_rate': 1.879139411612354e-05, 'epoch': 0.37} {'loss': 0.5765, 'learning_rate': 1.8791233996078136e-05, 'epoch': 0.37} {'loss': 0.5675, 'learning_rate': 1.8791073866109098e-05, 'epoch': 0.37} {'loss': 0.4943, 'learning_rate': 1.8790913726216612e-05, 'epoch': 0.37} {'loss': 0.4925, 'learning_rate': 1.8790753576400857e-05, 'epoch': 0.37} {'loss': 0.6072, 'learning_rate': 1.8790593416662012e-05, 'epoch': 0.37} {'loss': 0.5396, 'learning_rate': 1.8790433247000255e-05, 'epoch': 0.37} {'loss': 0.574, 'learning_rate': 1.8790273067415774e-05, 'epoch': 0.37} {'loss': 0.3797, 'learning_rate': 1.8790112877908746e-05, 'epoch': 0.37} {'loss': 0.4199, 'learning_rate': 1.8789952678479354e-05, 'epoch': 0.37} {'loss': 0.6262, 'learning_rate': 1.8789792469127774e-05, 'epoch': 0.37} {'loss': 0.3782, 'learning_rate': 1.878963224985419e-05, 'epoch': 0.37} {'loss': 0.5077, 'learning_rate': 1.878947202065878e-05, 'epoch': 0.37} {'loss': 0.6519, 'learning_rate': 1.8789311781541732e-05, 'epoch': 0.37} {'loss': 0.6285, 'learning_rate': 1.878915153250322e-05, 'epoch': 0.37} {'loss': 0.6164, 'learning_rate': 1.878899127354343e-05, 'epoch': 0.37} {'loss': 0.4475, 'learning_rate': 1.8788831004662537e-05, 'epoch': 0.37} {'loss': 0.6896, 'learning_rate': 1.8788670725860723e-05, 'epoch': 0.37} {'loss': 0.5698, 'learning_rate': 1.8788510437138175e-05, 'epoch': 0.37} {'loss': 0.4784, 'learning_rate': 1.8788350138495072e-05, 'epoch': 0.37} {'loss': 0.6578, 'learning_rate': 1.878818982993159e-05, 'epoch': 0.37} {'loss': 0.5901, 'learning_rate': 1.8788029511447912e-05, 'epoch': 0.37} {'loss': 0.5804, 'learning_rate': 1.8787869183044222e-05, 'epoch': 0.37} {'loss': 0.5158, 'learning_rate': 1.8787708844720695e-05, 'epoch': 0.37} {'loss': 0.6173, 'learning_rate': 1.878754849647752e-05, 'epoch': 0.37} {'loss': 0.6876, 'learning_rate': 1.878738813831487e-05, 'epoch': 0.37} {'loss': 0.5494, 'learning_rate': 1.8787227770232933e-05, 'epoch': 0.37} {'loss': 0.4672, 'learning_rate': 1.8787067392231886e-05, 'epoch': 0.37} {'loss': 0.6178, 'learning_rate': 1.878690700431191e-05, 'epoch': 0.37} {'loss': 0.5994, 'learning_rate': 1.8786746606473188e-05, 'epoch': 0.37} {'loss': 0.5217, 'learning_rate': 1.87865861987159e-05, 'epoch': 0.37} {'loss': 0.5558, 'learning_rate': 1.8786425781040226e-05, 'epoch': 0.37} {'loss': 0.5983, 'learning_rate': 1.8786265353446348e-05, 'epoch': 0.37} {'loss': 0.5957, 'learning_rate': 1.8786104915934446e-05, 'epoch': 0.37} {'loss': 0.4491, 'learning_rate': 1.8785944468504707e-05, 'epoch': 0.37} {'loss': 0.534, 'learning_rate': 1.8785784011157303e-05, 'epoch': 0.37} {'loss': 0.6599, 'learning_rate': 1.878562354389242e-05, 'epoch': 0.37} {'loss': 0.4674, 'learning_rate': 1.878546306671024e-05, 'epoch': 0.37} {'loss': 0.6587, 'learning_rate': 1.878530257961094e-05, 'epoch': 0.37} {'loss': 0.6137, 'learning_rate': 1.8785142082594707e-05, 'epoch': 0.37} {'loss': 0.55, 'learning_rate': 1.878498157566172e-05, 'epoch': 0.37} {'loss': 0.679, 'learning_rate': 1.8784821058812158e-05, 'epoch': 0.37} {'loss': 0.6547, 'learning_rate': 1.8784660532046203e-05, 'epoch': 0.37} {'loss': 0.5882, 'learning_rate': 1.878449999536404e-05, 'epoch': 0.37} {'loss': 0.5406, 'learning_rate': 1.878433944876584e-05, 'epoch': 0.37} {'loss': 0.5331, 'learning_rate': 1.8784178892251796e-05, 'epoch': 0.37} {'loss': 0.6284, 'learning_rate': 1.8784018325822083e-05, 'epoch': 0.37} {'loss': 0.4428, 'learning_rate': 1.8783857749476887e-05, 'epoch': 0.37} {'loss': 0.4997, 'learning_rate': 1.8783697163216384e-05, 'epoch': 0.37} {'loss': 0.5537, 'learning_rate': 1.8783536567040754e-05, 'epoch': 0.37} {'loss': 0.488, 'learning_rate': 1.8783375960950187e-05, 'epoch': 0.37} {'loss': 0.5236, 'learning_rate': 1.8783215344944855e-05, 'epoch': 0.37} {'loss': 0.6133, 'learning_rate': 1.878305471902494e-05, 'epoch': 0.37} {'loss': 0.4755, 'learning_rate': 1.8782894083190632e-05, 'epoch': 0.37} {'loss': 0.4952, 'learning_rate': 1.8782733437442108e-05, 'epoch': 0.37} {'loss': 0.6544, 'learning_rate': 1.8782572781779544e-05, 'epoch': 0.37} {'loss': 0.5447, 'learning_rate': 1.8782412116203126e-05, 'epoch': 0.37} {'loss': 0.666, 'learning_rate': 1.8782251440713035e-05, 'epoch': 0.37} {'loss': 0.5142, 'learning_rate': 1.8782090755309454e-05, 'epoch': 0.37} {'loss': 0.6162, 'learning_rate': 1.8781930059992558e-05, 'epoch': 0.37} {'loss': 0.7381, 'learning_rate': 1.8781769354762537e-05, 'epoch': 0.37} {'loss': 0.5919, 'learning_rate': 1.8781608639619568e-05, 'epoch': 0.37} {'loss': 0.5341, 'learning_rate': 1.878144791456383e-05, 'epoch': 0.37} {'loss': 0.5491, 'learning_rate': 1.878128717959551e-05, 'epoch': 0.37} {'loss': 0.672, 'learning_rate': 1.8781126434714788e-05, 'epoch': 0.37} {'loss': 0.6639, 'learning_rate': 1.878096567992184e-05, 'epoch': 0.37} {'loss': 0.4951, 'learning_rate': 1.8780804915216852e-05, 'epoch': 0.37} {'loss': 0.528, 'learning_rate': 1.878064414060001e-05, 'epoch': 0.37} {'loss': 0.7246, 'learning_rate': 1.8780483356071483e-05, 'epoch': 0.37} {'loss': 0.571, 'learning_rate': 1.8780322561631464e-05, 'epoch': 0.37} {'loss': 0.6385, 'learning_rate': 1.878016175728013e-05, 'epoch': 0.37} {'loss': 0.5836, 'learning_rate': 1.8780000943017664e-05, 'epoch': 0.37} {'loss': 0.565, 'learning_rate': 1.8779840118844247e-05, 'epoch': 0.37} {'loss': 0.436, 'learning_rate': 1.8779679284760058e-05, 'epoch': 0.37} {'loss': 0.6006, 'learning_rate': 1.877951844076528e-05, 'epoch': 0.37} {'loss': 0.4924, 'learning_rate': 1.8779357586860097e-05, 'epoch': 0.37} {'loss': 0.6032, 'learning_rate': 1.8779196723044692e-05, 'epoch': 0.37} {'loss': 0.6631, 'learning_rate': 1.8779035849319238e-05, 'epoch': 0.37} {'loss': 0.5217, 'learning_rate': 1.8778874965683923e-05, 'epoch': 0.37} {'loss': 0.4258, 'learning_rate': 1.877871407213893e-05, 'epoch': 0.37} {'loss': 0.5196, 'learning_rate': 1.8778553168684434e-05, 'epoch': 0.37} {'loss': 0.5342, 'learning_rate': 1.8778392255320624e-05, 'epoch': 0.37} {'loss': 0.5104, 'learning_rate': 1.8778231332047677e-05, 'epoch': 0.37} {'loss': 0.7455, 'learning_rate': 1.8778070398865775e-05, 'epoch': 0.37} {'loss': 0.5319, 'learning_rate': 1.8777909455775103e-05, 'epoch': 0.37} {'loss': 0.4837, 'learning_rate': 1.877774850277584e-05, 'epoch': 0.37} {'loss': 0.5949, 'learning_rate': 1.8777587539868167e-05, 'epoch': 0.37} {'loss': 0.5316, 'learning_rate': 1.8777426567052266e-05, 'epoch': 0.37} {'loss': 0.5857, 'learning_rate': 1.8777265584328326e-05, 'epoch': 0.37} {'loss': 0.6781, 'learning_rate': 1.8777104591696516e-05, 'epoch': 0.37} {'loss': 0.5069, 'learning_rate': 1.8776943589157027e-05, 'epoch': 0.37} {'loss': 0.6491, 'learning_rate': 1.8776782576710033e-05, 'epoch': 0.37} {'loss': 0.7322, 'learning_rate': 1.8776621554355725e-05, 'epoch': 0.37} {'loss': 0.553, 'learning_rate': 1.877646052209428e-05, 'epoch': 0.37} {'loss': 0.6801, 'learning_rate': 1.8776299479925875e-05, 'epoch': 0.37} {'loss': 0.584, 'learning_rate': 1.8776138427850703e-05, 'epoch': 0.37} {'loss': 0.5056, 'learning_rate': 1.8775977365868937e-05, 'epoch': 0.37} {'loss': 0.7113, 'learning_rate': 1.8775816293980763e-05, 'epoch': 0.37} {'loss': 0.5158, 'learning_rate': 1.877565521218636e-05, 'epoch': 0.37} {'loss': 0.5434, 'learning_rate': 1.877549412048591e-05, 'epoch': 0.37} {'loss': 0.4311, 'learning_rate': 1.8775333018879595e-05, 'epoch': 0.37} {'loss': 0.5522, 'learning_rate': 1.87751719073676e-05, 'epoch': 0.37} {'loss': 0.7202, 'learning_rate': 1.8775010785950104e-05, 'epoch': 0.37} {'loss': 0.5573, 'learning_rate': 1.8774849654627288e-05, 'epoch': 0.37} {'loss': 0.5732, 'learning_rate': 1.8774688513399336e-05, 'epoch': 0.37} {'loss': 0.5508, 'learning_rate': 1.8774527362266432e-05, 'epoch': 0.37} {'loss': 0.5284, 'learning_rate': 1.8774366201228755e-05, 'epoch': 0.37} {'loss': 0.4784, 'learning_rate': 1.8774205030286484e-05, 'epoch': 0.37} {'loss': 0.5501, 'learning_rate': 1.8774043849439806e-05, 'epoch': 0.37} {'loss': 0.5536, 'learning_rate': 1.87738826586889e-05, 'epoch': 0.37} {'loss': 0.467, 'learning_rate': 1.8773721458033947e-05, 'epoch': 0.37} {'loss': 0.3746, 'learning_rate': 1.8773560247475136e-05, 'epoch': 0.37} {'loss': 0.6804, 'learning_rate': 1.877339902701264e-05, 'epoch': 0.37} {'loss': 0.6781, 'learning_rate': 1.8773237796646647e-05, 'epoch': 0.37} {'loss': 0.608, 'learning_rate': 1.8773076556377335e-05, 'epoch': 0.37} {'loss': 0.6382, 'learning_rate': 1.8772915306204886e-05, 'epoch': 0.37} {'loss': 0.4529, 'learning_rate': 1.8772754046129487e-05, 'epoch': 0.37} {'loss': 0.6341, 'learning_rate': 1.8772592776151314e-05, 'epoch': 0.37} {'loss': 0.6221, 'learning_rate': 1.8772431496270558e-05, 'epoch': 0.37} {'loss': 0.6918, 'learning_rate': 1.877227020648739e-05, 'epoch': 0.37} {'loss': 0.7112, 'learning_rate': 1.8772108906802e-05, 'epoch': 0.37} {'loss': 0.6654, 'learning_rate': 1.8771947597214563e-05, 'epoch': 0.37} {'loss': 0.6149, 'learning_rate': 1.8771786277725268e-05, 'epoch': 0.37} {'loss': 0.636, 'learning_rate': 1.8771624948334294e-05, 'epoch': 0.37} {'loss': 0.5632, 'learning_rate': 1.8771463609041826e-05, 'epoch': 0.37} {'loss': 0.6208, 'learning_rate': 1.8771302259848038e-05, 'epoch': 0.37} {'loss': 0.658, 'learning_rate': 1.877114090075312e-05, 'epoch': 0.37} {'loss': 0.6318, 'learning_rate': 1.877097953175725e-05, 'epoch': 0.37} {'loss': 0.5844, 'learning_rate': 1.8770818152860617e-05, 'epoch': 0.37} {'loss': 0.5813, 'learning_rate': 1.8770656764063396e-05, 'epoch': 0.37} {'loss': 0.6756, 'learning_rate': 1.877049536536577e-05, 'epoch': 0.37} {'loss': 0.6124, 'learning_rate': 1.8770333956767925e-05, 'epoch': 0.37} {'loss': 0.6463, 'learning_rate': 1.8770172538270036e-05, 'epoch': 0.37} {'loss': 0.5388, 'learning_rate': 1.8770011109872294e-05, 'epoch': 0.37} {'loss': 0.699, 'learning_rate': 1.876984967157488e-05, 'epoch': 0.37} {'loss': 0.5164, 'learning_rate': 1.8769688223377965e-05, 'epoch': 0.37} {'loss': 0.5956, 'learning_rate': 1.8769526765281747e-05, 'epoch': 0.37} {'loss': 0.6537, 'learning_rate': 1.8769365297286397e-05, 'epoch': 0.37} {'loss': 0.6104, 'learning_rate': 1.8769203819392102e-05, 'epoch': 0.37} {'loss': 0.6373, 'learning_rate': 1.8769042331599044e-05, 'epoch': 0.37} {'loss': 0.4869, 'learning_rate': 1.8768880833907404e-05, 'epoch': 0.37} {'loss': 0.6477, 'learning_rate': 1.8768719326317363e-05, 'epoch': 0.37} {'loss': 0.6264, 'learning_rate': 1.876855780882911e-05, 'epoch': 0.37} {'loss': 0.6899, 'learning_rate': 1.876839628144282e-05, 'epoch': 0.37} {'loss': 0.5572, 'learning_rate': 1.876823474415868e-05, 'epoch': 0.37} {'loss': 0.4503, 'learning_rate': 1.8768073196976865e-05, 'epoch': 0.37} {'loss': 0.421, 'learning_rate': 1.876791163989757e-05, 'epoch': 0.37} {'loss': 0.6171, 'learning_rate': 1.8767750072920965e-05, 'epoch': 0.37} {'loss': 0.6003, 'learning_rate': 1.8767588496047238e-05, 'epoch': 0.37} {'loss': 0.5806, 'learning_rate': 1.876742690927657e-05, 'epoch': 0.37} {'loss': 0.6267, 'learning_rate': 1.8767265312609147e-05, 'epoch': 0.37} {'loss': 0.669, 'learning_rate': 1.876710370604515e-05, 'epoch': 0.37} {'loss': 0.6783, 'learning_rate': 1.8766942089584755e-05, 'epoch': 0.37} {'loss': 0.6878, 'learning_rate': 1.8766780463228153e-05, 'epoch': 0.37} {'loss': 0.6947, 'learning_rate': 1.8766618826975522e-05, 'epoch': 0.37} {'loss': 0.6048, 'learning_rate': 1.8766457180827046e-05, 'epoch': 0.37} {'loss': 0.5666, 'learning_rate': 1.8766295524782908e-05, 'epoch': 0.37} {'loss': 0.6489, 'learning_rate': 1.8766133858843284e-05, 'epoch': 0.37} {'loss': 0.5229, 'learning_rate': 1.8765972183008366e-05, 'epoch': 0.37} {'loss': 0.4753, 'learning_rate': 1.8765810497278335e-05, 'epoch': 0.37} {'loss': 0.6396, 'learning_rate': 1.8765648801653364e-05, 'epoch': 0.37} {'loss': 0.6296, 'learning_rate': 1.8765487096133648e-05, 'epoch': 0.37} {'loss': 0.672, 'learning_rate': 1.876532538071936e-05, 'epoch': 0.37} {'loss': 0.5301, 'learning_rate': 1.8765163655410686e-05, 'epoch': 0.37} {'loss': 0.5999, 'learning_rate': 1.8765001920207815e-05, 'epoch': 0.37} {'loss': 0.5362, 'learning_rate': 1.876484017511092e-05, 'epoch': 0.37} {'loss': 0.5429, 'learning_rate': 1.8764678420120187e-05, 'epoch': 0.37} {'loss': 0.4484, 'learning_rate': 1.8764516655235797e-05, 'epoch': 0.37} {'loss': 0.4876, 'learning_rate': 1.8764354880457935e-05, 'epoch': 0.37} {'loss': 0.633, 'learning_rate': 1.876419309578679e-05, 'epoch': 0.37} {'loss': 0.4572, 'learning_rate': 1.8764031301222528e-05, 'epoch': 0.37} {'loss': 0.6032, 'learning_rate': 1.8763869496765345e-05, 'epoch': 0.37} {'loss': 0.6496, 'learning_rate': 1.8763707682415418e-05, 'epoch': 0.37} {'loss': 0.4089, 'learning_rate': 1.8763545858172935e-05, 'epoch': 0.37} {'loss': 0.6396, 'learning_rate': 1.8763384024038074e-05, 'epoch': 0.37} {'loss': 0.6488, 'learning_rate': 1.876322218001102e-05, 'epoch': 0.37} {'loss': 0.587, 'learning_rate': 1.876306032609195e-05, 'epoch': 0.37} {'loss': 0.5236, 'learning_rate': 1.8762898462281052e-05, 'epoch': 0.37} {'loss': 0.6476, 'learning_rate': 1.8762736588578513e-05, 'epoch': 0.37} {'loss': 0.6106, 'learning_rate': 1.876257470498451e-05, 'epoch': 0.37} {'loss': 0.3899, 'learning_rate': 1.8762412811499222e-05, 'epoch': 0.37} {'loss': 0.6802, 'learning_rate': 1.876225090812284e-05, 'epoch': 0.37} {'loss': 0.6383, 'learning_rate': 1.876208899485554e-05, 'epoch': 0.37} {'loss': 0.5912, 'learning_rate': 1.8761927071697508e-05, 'epoch': 0.37} {'loss': 0.5622, 'learning_rate': 1.8761765138648927e-05, 'epoch': 0.37} {'loss': 0.5411, 'learning_rate': 1.8761603195709983e-05, 'epoch': 0.37} {'loss': 0.6027, 'learning_rate': 1.8761441242880848e-05, 'epoch': 0.37} {'loss': 0.5407, 'learning_rate': 1.876127928016172e-05, 'epoch': 0.37} {'loss': 0.5528, 'learning_rate': 1.8761117307552766e-05, 'epoch': 0.37} {'loss': 0.5077, 'learning_rate': 1.876095532505418e-05, 'epoch': 0.37} {'loss': 0.5182, 'learning_rate': 1.876079333266614e-05, 'epoch': 0.37} {'loss': 0.5981, 'learning_rate': 1.8760631330388836e-05, 'epoch': 0.37} {'loss': 0.5523, 'learning_rate': 1.876046931822244e-05, 'epoch': 0.37} {'loss': 0.5839, 'learning_rate': 1.876030729616714e-05, 'epoch': 0.37} {'loss': 0.6935, 'learning_rate': 1.8760145264223122e-05, 'epoch': 0.37} {'loss': 0.465, 'learning_rate': 1.8759983222390564e-05, 'epoch': 0.37} {'loss': 0.5967, 'learning_rate': 1.875982117066965e-05, 'epoch': 0.37} {'loss': 0.6842, 'learning_rate': 1.8759659109060564e-05, 'epoch': 0.37} {'loss': 0.6828, 'learning_rate': 1.875949703756349e-05, 'epoch': 0.37} {'loss': 0.5695, 'learning_rate': 1.8759334956178606e-05, 'epoch': 0.37} {'loss': 0.5733, 'learning_rate': 1.87591728649061e-05, 'epoch': 0.37} {'loss': 0.578, 'learning_rate': 1.8759010763746154e-05, 'epoch': 0.37} {'loss': 0.6734, 'learning_rate': 1.8758848652698953e-05, 'epoch': 0.37} {'loss': 0.6907, 'learning_rate': 1.8758686531764674e-05, 'epoch': 0.37} {'loss': 0.5908, 'learning_rate': 1.8758524400943505e-05, 'epoch': 0.37} {'loss': 0.5848, 'learning_rate': 1.875836226023563e-05, 'epoch': 0.37} {'loss': 0.5362, 'learning_rate': 1.875820010964122e-05, 'epoch': 0.37} {'loss': 0.6463, 'learning_rate': 1.8758037949160476e-05, 'epoch': 0.37} {'loss': 0.6992, 'learning_rate': 1.875787577879357e-05, 'epoch': 0.37} {'loss': 0.5273, 'learning_rate': 1.875771359854069e-05, 'epoch': 0.37} {'loss': 0.5966, 'learning_rate': 1.8757551408402015e-05, 'epoch': 0.37} {'loss': 0.5011, 'learning_rate': 1.875738920837773e-05, 'epoch': 0.37} {'loss': 0.5507, 'learning_rate': 1.8757226998468017e-05, 'epoch': 0.37} {'loss': 0.5555, 'learning_rate': 1.875706477867306e-05, 'epoch': 0.37} {'loss': 0.6705, 'learning_rate': 1.8756902548993043e-05, 'epoch': 0.37} {'loss': 0.5228, 'learning_rate': 1.8756740309428148e-05, 'epoch': 0.37} {'loss': 0.5816, 'learning_rate': 1.875657805997856e-05, 'epoch': 0.37} {'loss': 0.574, 'learning_rate': 1.875641580064446e-05, 'epoch': 0.37} {'loss': 0.5657, 'learning_rate': 1.875625353142603e-05, 'epoch': 0.37} {'loss': 0.4636, 'learning_rate': 1.8756091252323455e-05, 'epoch': 0.37} {'loss': 0.5871, 'learning_rate': 1.8755928963336915e-05, 'epoch': 0.37} {'loss': 0.4978, 'learning_rate': 1.87557666644666e-05, 'epoch': 0.37} {'loss': 0.6386, 'learning_rate': 1.875560435571269e-05, 'epoch': 0.37} {'loss': 0.6584, 'learning_rate': 1.8755442037075366e-05, 'epoch': 0.37} {'loss': 0.3902, 'learning_rate': 1.8755279708554813e-05, 'epoch': 0.37} {'loss': 0.5786, 'learning_rate': 1.8755117370151215e-05, 'epoch': 0.37} {'loss': 0.5376, 'learning_rate': 1.8754955021864756e-05, 'epoch': 0.37} {'loss': 0.5432, 'learning_rate': 1.8754792663695617e-05, 'epoch': 0.37} {'loss': 0.5997, 'learning_rate': 1.8754630295643976e-05, 'epoch': 0.37} {'loss': 0.6084, 'learning_rate': 1.8754467917710028e-05, 'epoch': 0.37} {'loss': 0.6858, 'learning_rate': 1.875430552989395e-05, 'epoch': 0.37} {'loss': 0.5848, 'learning_rate': 1.8754143132195922e-05, 'epoch': 0.37} {'loss': 0.5412, 'learning_rate': 1.8753980724616133e-05, 'epoch': 0.37} {'loss': 0.6782, 'learning_rate': 1.8753818307154766e-05, 'epoch': 0.37} {'loss': 0.5028, 'learning_rate': 1.8753655879812004e-05, 'epoch': 0.37} {'loss': 0.6296, 'learning_rate': 1.875349344258803e-05, 'epoch': 0.37} {'loss': 0.5803, 'learning_rate': 1.875333099548302e-05, 'epoch': 0.37} {'loss': 0.5803, 'learning_rate': 1.875316853849717e-05, 'epoch': 0.37} {'loss': 0.5555, 'learning_rate': 1.8753006071630654e-05, 'epoch': 0.37} {'loss': 0.6089, 'learning_rate': 1.8752843594883655e-05, 'epoch': 0.37} {'loss': 0.64, 'learning_rate': 1.8752681108256366e-05, 'epoch': 0.37} {'loss': 0.514, 'learning_rate': 1.8752518611748963e-05, 'epoch': 0.37} {'loss': 0.6439, 'learning_rate': 1.8752356105361632e-05, 'epoch': 0.37} {'loss': 0.7628, 'learning_rate': 1.8752193589094553e-05, 'epoch': 0.37} {'loss': 0.673, 'learning_rate': 1.875203106294791e-05, 'epoch': 0.37} {'loss': 0.4314, 'learning_rate': 1.875186852692189e-05, 'epoch': 0.37} {'loss': 0.5777, 'learning_rate': 1.875170598101668e-05, 'epoch': 0.37} {'loss': 0.7079, 'learning_rate': 1.8751543425232453e-05, 'epoch': 0.37} {'loss': 0.5881, 'learning_rate': 1.8751380859569397e-05, 'epoch': 0.37} {'loss': 0.6192, 'learning_rate': 1.8751218284027698e-05, 'epoch': 0.37} {'loss': 0.666, 'learning_rate': 1.8751055698607538e-05, 'epoch': 0.37} {'loss': 0.5766, 'learning_rate': 1.8750893103309096e-05, 'epoch': 0.37} {'loss': 0.5825, 'learning_rate': 1.8750730498132567e-05, 'epoch': 0.37} {'loss': 0.514, 'learning_rate': 1.8750567883078122e-05, 'epoch': 0.37} {'loss': 0.5441, 'learning_rate': 1.875040525814595e-05, 'epoch': 0.37} {'loss': 0.4239, 'learning_rate': 1.8750242623336235e-05, 'epoch': 0.37} {'loss': 0.4852, 'learning_rate': 1.8750079978649163e-05, 'epoch': 0.37} {'loss': 0.6578, 'learning_rate': 1.874991732408491e-05, 'epoch': 0.37} {'loss': 0.5868, 'learning_rate': 1.8749754659643668e-05, 'epoch': 0.37} {'loss': 0.5223, 'learning_rate': 1.8749591985325614e-05, 'epoch': 0.37} {'loss': 0.616, 'learning_rate': 1.8749429301130936e-05, 'epoch': 0.37} {'loss': 0.4325, 'learning_rate': 1.8749266607059817e-05, 'epoch': 0.37} {'loss': 0.6599, 'learning_rate': 1.874910390311244e-05, 'epoch': 0.37} {'loss': 0.7469, 'learning_rate': 1.8748941189288985e-05, 'epoch': 0.37} {'loss': 0.6332, 'learning_rate': 1.8748778465589643e-05, 'epoch': 0.37} {'loss': 0.6688, 'learning_rate': 1.874861573201459e-05, 'epoch': 0.37} {'loss': 0.7139, 'learning_rate': 1.8748452988564015e-05, 'epoch': 0.37} {'loss': 0.6403, 'learning_rate': 1.87482902352381e-05, 'epoch': 0.37} {'loss': 0.7095, 'learning_rate': 1.874812747203703e-05, 'epoch': 0.37} {'loss': 0.6257, 'learning_rate': 1.8747964698960986e-05, 'epoch': 0.37} {'loss': 0.4131, 'learning_rate': 1.8747801916010157e-05, 'epoch': 0.37} {'loss': 0.612, 'learning_rate': 1.8747639123184716e-05, 'epoch': 0.37} {'loss': 0.5405, 'learning_rate': 1.874747632048486e-05, 'epoch': 0.37} {'loss': 0.6444, 'learning_rate': 1.8747313507910765e-05, 'epoch': 0.37} {'loss': 0.5145, 'learning_rate': 1.8747150685462618e-05, 'epoch': 0.37} {'loss': 0.5503, 'learning_rate': 1.87469878531406e-05, 'epoch': 0.37} {'loss': 0.4851, 'learning_rate': 1.8746825010944895e-05, 'epoch': 0.37} {'loss': 0.6051, 'learning_rate': 1.8746662158875687e-05, 'epoch': 0.37} {'loss': 0.6949, 'learning_rate': 1.8746499296933164e-05, 'epoch': 0.37} {'loss': 0.4747, 'learning_rate': 1.8746336425117504e-05, 'epoch': 0.37} {'loss': 0.5584, 'learning_rate': 1.8746173543428895e-05, 'epoch': 0.37} {'loss': 0.62, 'learning_rate': 1.874601065186752e-05, 'epoch': 0.37} {'loss': 0.6783, 'learning_rate': 1.874584775043356e-05, 'epoch': 0.37} {'loss': 0.7536, 'learning_rate': 1.8745684839127198e-05, 'epoch': 0.37} {'loss': 0.6911, 'learning_rate': 1.8745521917948625e-05, 'epoch': 0.37} {'loss': 0.6413, 'learning_rate': 1.8745358986898023e-05, 'epoch': 0.37} {'loss': 0.494, 'learning_rate': 1.874519604597557e-05, 'epoch': 0.37} {'loss': 0.5993, 'learning_rate': 1.8745033095181453e-05, 'epoch': 0.37} {'loss': 0.6905, 'learning_rate': 1.8744870134515858e-05, 'epoch': 0.37} {'loss': 0.5517, 'learning_rate': 1.8744707163978968e-05, 'epoch': 0.37} {'loss': 0.5819, 'learning_rate': 1.8744544183570966e-05, 'epoch': 0.37} {'loss': 0.5602, 'learning_rate': 1.8744381193292035e-05, 'epoch': 0.37} {'loss': 0.6788, 'learning_rate': 1.8744218193142362e-05, 'epoch': 0.37} {'loss': 0.4447, 'learning_rate': 1.874405518312213e-05, 'epoch': 0.37} {'loss': 0.6022, 'learning_rate': 1.8743892163231523e-05, 'epoch': 0.37} {'loss': 0.6113, 'learning_rate': 1.8743729133470723e-05, 'epoch': 0.37} {'loss': 0.6128, 'learning_rate': 1.8743566093839915e-05, 'epoch': 0.37} {'loss': 0.7878, 'learning_rate': 1.8743403044339287e-05, 'epoch': 0.37} {'loss': 0.6146, 'learning_rate': 1.8743239984969014e-05, 'epoch': 0.37} {'loss': 0.4706, 'learning_rate': 1.874307691572929e-05, 'epoch': 0.37} {'loss': 0.4522, 'learning_rate': 1.8742913836620292e-05, 'epoch': 0.37} {'loss': 0.7517, 'learning_rate': 1.874275074764221e-05, 'epoch': 0.37} {'loss': 0.7746, 'learning_rate': 1.8742587648795223e-05, 'epoch': 0.37} {'loss': 0.5477, 'learning_rate': 1.8742424540079514e-05, 'epoch': 0.37} {'loss': 0.6233, 'learning_rate': 1.8742261421495275e-05, 'epoch': 0.37} {'loss': 0.5027, 'learning_rate': 1.8742098293042686e-05, 'epoch': 0.37} {'loss': 0.5486, 'learning_rate': 1.8741935154721925e-05, 'epoch': 0.37} {'loss': 0.604, 'learning_rate': 1.8741772006533186e-05, 'epoch': 0.37} {'loss': 0.5213, 'learning_rate': 1.8741608848476646e-05, 'epoch': 0.37} {'loss': 0.6187, 'learning_rate': 1.8741445680552494e-05, 'epoch': 0.37} {'loss': 0.6331, 'learning_rate': 1.8741282502760912e-05, 'epoch': 0.38} {'loss': 0.6578, 'learning_rate': 1.8741119315102082e-05, 'epoch': 0.38} {'loss': 0.5489, 'learning_rate': 1.874095611757619e-05, 'epoch': 0.38} {'loss': 0.5957, 'learning_rate': 1.8740792910183424e-05, 'epoch': 0.38} {'loss': 0.5617, 'learning_rate': 1.8740629692923967e-05, 'epoch': 0.38} {'loss': 0.6878, 'learning_rate': 1.8740466465797995e-05, 'epoch': 0.38} {'loss': 0.5438, 'learning_rate': 1.8740303228805702e-05, 'epoch': 0.38} {'loss': 0.4197, 'learning_rate': 1.8740139981947268e-05, 'epoch': 0.38} {'loss': 0.5592, 'learning_rate': 1.873997672522288e-05, 'epoch': 0.38} {'loss': 0.5304, 'learning_rate': 1.8739813458632717e-05, 'epoch': 0.38} {'loss': 0.6231, 'learning_rate': 1.8739650182176966e-05, 'epoch': 0.38} {'loss': 0.5707, 'learning_rate': 1.8739486895855815e-05, 'epoch': 0.38} {'loss': 0.5611, 'learning_rate': 1.8739323599669445e-05, 'epoch': 0.38} {'loss': 0.4986, 'learning_rate': 1.8739160293618038e-05, 'epoch': 0.38} {'loss': 0.6735, 'learning_rate': 1.8738996977701783e-05, 'epoch': 0.38} {'loss': 0.5652, 'learning_rate': 1.873883365192086e-05, 'epoch': 0.38} {'loss': 0.603, 'learning_rate': 1.8738670316275457e-05, 'epoch': 0.38} {'loss': 0.5921, 'learning_rate': 1.873850697076576e-05, 'epoch': 0.38} {'loss': 0.488, 'learning_rate': 1.8738343615391944e-05, 'epoch': 0.38} {'loss': 0.4257, 'learning_rate': 1.8738180250154205e-05, 'epoch': 0.38} {'loss': 0.6696, 'learning_rate': 1.873801687505272e-05, 'epoch': 0.38} {'loss': 0.4635, 'learning_rate': 1.8737853490087673e-05, 'epoch': 0.38} {'loss': 0.6177, 'learning_rate': 1.8737690095259254e-05, 'epoch': 0.38} {'loss': 0.6422, 'learning_rate': 1.8737526690567645e-05, 'epoch': 0.38} {'loss': 0.6901, 'learning_rate': 1.873736327601303e-05, 'epoch': 0.38} {'loss': 0.4775, 'learning_rate': 1.873719985159559e-05, 'epoch': 0.38} {'loss': 0.5234, 'learning_rate': 1.8737036417315514e-05, 'epoch': 0.38} {'loss': 0.6869, 'learning_rate': 1.873687297317299e-05, 'epoch': 0.38} {'loss': 0.624, 'learning_rate': 1.8736709519168195e-05, 'epoch': 0.38} {'loss': 0.6418, 'learning_rate': 1.8736546055301312e-05, 'epoch': 0.38} {'loss': 0.6422, 'learning_rate': 1.8736382581572537e-05, 'epoch': 0.38} {'loss': 0.5225, 'learning_rate': 1.873621909798204e-05, 'epoch': 0.38} {'loss': 0.6576, 'learning_rate': 1.873605560453002e-05, 'epoch': 0.38} {'loss': 0.5737, 'learning_rate': 1.8735892101216652e-05, 'epoch': 0.38} {'loss': 0.6819, 'learning_rate': 1.873572858804212e-05, 'epoch': 0.38} {'loss': 0.5643, 'learning_rate': 1.8735565065006612e-05, 'epoch': 0.38} {'loss': 0.6366, 'learning_rate': 1.8735401532110315e-05, 'epoch': 0.38} {'loss': 0.4188, 'learning_rate': 1.8735237989353413e-05, 'epoch': 0.38} {'loss': 0.4763, 'learning_rate': 1.873507443673608e-05, 'epoch': 0.38} {'loss': 0.5866, 'learning_rate': 1.8734910874258517e-05, 'epoch': 0.38} {'loss': 0.4419, 'learning_rate': 1.8734747301920897e-05, 'epoch': 0.38} {'loss': 0.6246, 'learning_rate': 1.873458371972341e-05, 'epoch': 0.38} {'loss': 0.7027, 'learning_rate': 1.873442012766624e-05, 'epoch': 0.38} {'loss': 0.5795, 'learning_rate': 1.8734256525749567e-05, 'epoch': 0.38} {'loss': 0.6393, 'learning_rate': 1.873409291397358e-05, 'epoch': 0.38} {'loss': 0.5697, 'learning_rate': 1.8733929292338463e-05, 'epoch': 0.38} {'loss': 0.7396, 'learning_rate': 1.8733765660844403e-05, 'epoch': 0.38} {'loss': 0.6923, 'learning_rate': 1.873360201949158e-05, 'epoch': 0.38} {'loss': 0.5754, 'learning_rate': 1.8733438368280184e-05, 'epoch': 0.38} {'loss': 0.657, 'learning_rate': 1.8733274707210394e-05, 'epoch': 0.38} {'loss': 0.6067, 'learning_rate': 1.8733111036282397e-05, 'epoch': 0.38} {'loss': 0.5423, 'learning_rate': 1.873294735549638e-05, 'epoch': 0.38} {'loss': 0.4682, 'learning_rate': 1.8732783664852526e-05, 'epoch': 0.38} {'loss': 0.7453, 'learning_rate': 1.873261996435102e-05, 'epoch': 0.38} {'loss': 0.6053, 'learning_rate': 1.8732456253992045e-05, 'epoch': 0.38} {'loss': 0.492, 'learning_rate': 1.8732292533775787e-05, 'epoch': 0.38} {'loss': 0.547, 'learning_rate': 1.8732128803702438e-05, 'epoch': 0.38} {'loss': 0.6128, 'learning_rate': 1.873196506377217e-05, 'epoch': 0.38} {'loss': 0.6424, 'learning_rate': 1.873180131398517e-05, 'epoch': 0.38} {'loss': 0.6874, 'learning_rate': 1.8731637554341634e-05, 'epoch': 0.38} {'loss': 0.6296, 'learning_rate': 1.873147378484174e-05, 'epoch': 0.38} {'loss': 0.6259, 'learning_rate': 1.873131000548567e-05, 'epoch': 0.38} {'loss': 0.5449, 'learning_rate': 1.873114621627361e-05, 'epoch': 0.38} {'loss': 0.558, 'learning_rate': 1.8730982417205744e-05, 'epoch': 0.38} {'loss': 0.5572, 'learning_rate': 1.8730818608282267e-05, 'epoch': 0.38} {'loss': 0.6759, 'learning_rate': 1.873065478950335e-05, 'epoch': 0.38} {'loss': 0.6223, 'learning_rate': 1.8730490960869187e-05, 'epoch': 0.38} {'loss': 0.5136, 'learning_rate': 1.8730327122379957e-05, 'epoch': 0.38} {'loss': 0.5405, 'learning_rate': 1.8730163274035848e-05, 'epoch': 0.38} {'loss': 0.5729, 'learning_rate': 1.8729999415837045e-05, 'epoch': 0.38} {'loss': 0.6028, 'learning_rate': 1.8729835547783736e-05, 'epoch': 0.38} {'loss': 0.5474, 'learning_rate': 1.87296716698761e-05, 'epoch': 0.38} {'loss': 0.4922, 'learning_rate': 1.8729507782114326e-05, 'epoch': 0.38} {'loss': 0.5874, 'learning_rate': 1.8729343884498595e-05, 'epoch': 0.38} {'loss': 0.6628, 'learning_rate': 1.87291799770291e-05, 'epoch': 0.38} {'loss': 0.4269, 'learning_rate': 1.8729016059706014e-05, 'epoch': 0.38} {'loss': 0.6144, 'learning_rate': 1.8728852132529534e-05, 'epoch': 0.38} {'loss': 0.5525, 'learning_rate': 1.8728688195499835e-05, 'epoch': 0.38} {'loss': 0.5693, 'learning_rate': 1.872852424861711e-05, 'epoch': 0.38} {'loss': 0.4884, 'learning_rate': 1.8728360291881542e-05, 'epoch': 0.38} {'loss': 0.6548, 'learning_rate': 1.8728196325293314e-05, 'epoch': 0.38} {'loss': 0.6505, 'learning_rate': 1.8728032348852608e-05, 'epoch': 0.38} {'loss': 0.6312, 'learning_rate': 1.872786836255962e-05, 'epoch': 0.38} {'loss': 0.5961, 'learning_rate': 1.8727704366414525e-05, 'epoch': 0.38} {'loss': 0.6662, 'learning_rate': 1.8727540360417512e-05, 'epoch': 0.38} {'loss': 0.731, 'learning_rate': 1.8727376344568765e-05, 'epoch': 0.38} {'loss': 0.4024, 'learning_rate': 1.8727212318868472e-05, 'epoch': 0.38} {'loss': 0.6015, 'learning_rate': 1.872704828331681e-05, 'epoch': 0.38} {'loss': 0.4904, 'learning_rate': 1.8726884237913975e-05, 'epoch': 0.38} {'loss': 0.7355, 'learning_rate': 1.8726720182660144e-05, 'epoch': 0.38} {'loss': 0.6071, 'learning_rate': 1.872655611755551e-05, 'epoch': 0.38} {'loss': 0.6143, 'learning_rate': 1.872639204260025e-05, 'epoch': 0.38} {'loss': 0.6373, 'learning_rate': 1.8726227957794554e-05, 'epoch': 0.38} {'loss': 0.5856, 'learning_rate': 1.8726063863138603e-05, 'epoch': 0.38} {'loss': 0.6142, 'learning_rate': 1.8725899758632588e-05, 'epoch': 0.38} {'loss': 0.5981, 'learning_rate': 1.8725735644276694e-05, 'epoch': 0.38} {'loss': 0.5989, 'learning_rate': 1.87255715200711e-05, 'epoch': 0.38} {'loss': 0.7192, 'learning_rate': 1.8725407386015995e-05, 'epoch': 0.38} {'loss': 0.5849, 'learning_rate': 1.8725243242111567e-05, 'epoch': 0.38} {'loss': 0.5072, 'learning_rate': 1.8725079088358e-05, 'epoch': 0.38} {'loss': 0.6034, 'learning_rate': 1.8724914924755473e-05, 'epoch': 0.38} {'loss': 0.6772, 'learning_rate': 1.8724750751304178e-05, 'epoch': 0.38} {'loss': 0.6633, 'learning_rate': 1.8724586568004298e-05, 'epoch': 0.38} {'loss': 0.6696, 'learning_rate': 1.872442237485602e-05, 'epoch': 0.38} {'loss': 0.793, 'learning_rate': 1.8724258171859527e-05, 'epoch': 0.38} {'loss': 0.6698, 'learning_rate': 1.8724093959015002e-05, 'epoch': 0.38} {'loss': 0.5769, 'learning_rate': 1.872392973632264e-05, 'epoch': 0.38} {'loss': 0.6084, 'learning_rate': 1.872376550378262e-05, 'epoch': 0.38} {'loss': 0.5859, 'learning_rate': 1.8723601261395124e-05, 'epoch': 0.38} {'loss': 0.6247, 'learning_rate': 1.8723437009160342e-05, 'epoch': 0.38} {'loss': 0.6221, 'learning_rate': 1.872327274707846e-05, 'epoch': 0.38} {'loss': 0.5128, 'learning_rate': 1.872310847514966e-05, 'epoch': 0.38} {'loss': 0.5704, 'learning_rate': 1.8722944193374132e-05, 'epoch': 0.38} {'loss': 0.5666, 'learning_rate': 1.8722779901752054e-05, 'epoch': 0.38} {'loss': 0.6296, 'learning_rate': 1.872261560028362e-05, 'epoch': 0.38} {'loss': 0.6686, 'learning_rate': 1.8722451288969012e-05, 'epoch': 0.38} {'loss': 0.7211, 'learning_rate': 1.8722286967808414e-05, 'epoch': 0.38} {'loss': 0.6241, 'learning_rate': 1.8722122636802014e-05, 'epoch': 0.38} {'loss': 0.6616, 'learning_rate': 1.8721958295949995e-05, 'epoch': 0.38} {'loss': 0.5687, 'learning_rate': 1.8721793945252545e-05, 'epoch': 0.38} {'loss': 0.5186, 'learning_rate': 1.8721629584709845e-05, 'epoch': 0.38} {'loss': 0.4441, 'learning_rate': 1.8721465214322085e-05, 'epoch': 0.38} {'loss': 0.7605, 'learning_rate': 1.872130083408945e-05, 'epoch': 0.38} {'loss': 0.594, 'learning_rate': 1.8721136444012124e-05, 'epoch': 0.38} {'loss': 0.4355, 'learning_rate': 1.8720972044090297e-05, 'epoch': 0.38} {'loss': 0.6266, 'learning_rate': 1.8720807634324144e-05, 'epoch': 0.38} {'loss': 0.6695, 'learning_rate': 1.8720643214713863e-05, 'epoch': 0.38} {'loss': 0.6003, 'learning_rate': 1.8720478785259632e-05, 'epoch': 0.38} {'loss': 0.39, 'learning_rate': 1.8720314345961638e-05, 'epoch': 0.38} {'loss': 0.7671, 'learning_rate': 1.872014989682007e-05, 'epoch': 0.38} {'loss': 0.7175, 'learning_rate': 1.8719985437835107e-05, 'epoch': 0.38} {'loss': 0.5295, 'learning_rate': 1.8719820969006943e-05, 'epoch': 0.38} {'loss': 0.5822, 'learning_rate': 1.8719656490335758e-05, 'epoch': 0.38} {'loss': 0.6773, 'learning_rate': 1.8719492001821738e-05, 'epoch': 0.38} {'loss': 0.5635, 'learning_rate': 1.871932750346507e-05, 'epoch': 0.38} {'loss': 0.4857, 'learning_rate': 1.8719162995265937e-05, 'epoch': 0.38} {'loss': 0.5607, 'learning_rate': 1.871899847722453e-05, 'epoch': 0.38} {'loss': 0.519, 'learning_rate': 1.8718833949341034e-05, 'epoch': 0.38} {'loss': 0.3983, 'learning_rate': 1.8718669411615626e-05, 'epoch': 0.38} {'loss': 0.6637, 'learning_rate': 1.8718504864048502e-05, 'epoch': 0.38} {'loss': 0.7139, 'learning_rate': 1.8718340306639845e-05, 'epoch': 0.38} {'loss': 0.5254, 'learning_rate': 1.8718175739389837e-05, 'epoch': 0.38} {'loss': 0.5655, 'learning_rate': 1.8718011162298668e-05, 'epoch': 0.38} {'loss': 0.692, 'learning_rate': 1.871784657536652e-05, 'epoch': 0.38} {'loss': 0.5647, 'learning_rate': 1.8717681978593583e-05, 'epoch': 0.38} {'loss': 0.584, 'learning_rate': 1.8717517371980043e-05, 'epoch': 0.38} {'loss': 0.666, 'learning_rate': 1.871735275552608e-05, 'epoch': 0.38} {'loss': 0.6176, 'learning_rate': 1.8717188129231886e-05, 'epoch': 0.38} {'loss': 0.608, 'learning_rate': 1.8717023493097642e-05, 'epoch': 0.38} {'loss': 0.5934, 'learning_rate': 1.8716858847123534e-05, 'epoch': 0.38} {'loss': 0.5901, 'learning_rate': 1.8716694191309754e-05, 'epoch': 0.38} {'loss': 0.6482, 'learning_rate': 1.8716529525656482e-05, 'epoch': 0.38} {'loss': 0.6139, 'learning_rate': 1.8716364850163907e-05, 'epoch': 0.38} {'loss': 0.6797, 'learning_rate': 1.8716200164832214e-05, 'epoch': 0.38} {'loss': 0.5692, 'learning_rate': 1.8716035469661586e-05, 'epoch': 0.38} {'loss': 0.5417, 'learning_rate': 1.8715870764652213e-05, 'epoch': 0.38} {'loss': 0.5595, 'learning_rate': 1.8715706049804278e-05, 'epoch': 0.38} {'loss': 0.5812, 'learning_rate': 1.871554132511797e-05, 'epoch': 0.38} {'loss': 0.6261, 'learning_rate': 1.8715376590593473e-05, 'epoch': 0.38} {'loss': 0.4172, 'learning_rate': 1.8715211846230973e-05, 'epoch': 0.38} {'loss': 0.5077, 'learning_rate': 1.8715047092030656e-05, 'epoch': 0.38} {'loss': 0.5916, 'learning_rate': 1.8714882327992706e-05, 'epoch': 0.38} {'loss': 0.6278, 'learning_rate': 1.8714717554117315e-05, 'epoch': 0.38} {'loss': 0.4726, 'learning_rate': 1.8714552770404662e-05, 'epoch': 0.38} {'loss': 0.6559, 'learning_rate': 1.871438797685494e-05, 'epoch': 0.38} {'loss': 0.5466, 'learning_rate': 1.8714223173468323e-05, 'epoch': 0.38} {'loss': 0.6494, 'learning_rate': 1.8714058360245013e-05, 'epoch': 0.38} {'loss': 0.7409, 'learning_rate': 1.8713893537185183e-05, 'epoch': 0.38} {'loss': 0.5209, 'learning_rate': 1.871372870428903e-05, 'epoch': 0.38} {'loss': 0.673, 'learning_rate': 1.871356386155673e-05, 'epoch': 0.38} {'loss': 0.7274, 'learning_rate': 1.8713399008988473e-05, 'epoch': 0.38} {'loss': 0.6824, 'learning_rate': 1.8713234146584447e-05, 'epoch': 0.38} {'loss': 0.6462, 'learning_rate': 1.8713069274344838e-05, 'epoch': 0.38} {'loss': 0.6401, 'learning_rate': 1.8712904392269827e-05, 'epoch': 0.38} {'loss': 0.5705, 'learning_rate': 1.8712739500359605e-05, 'epoch': 0.38} {'loss': 0.4861, 'learning_rate': 1.871257459861436e-05, 'epoch': 0.38} {'loss': 0.6685, 'learning_rate': 1.8712409687034273e-05, 'epoch': 0.38} {'loss': 0.5598, 'learning_rate': 1.871224476561953e-05, 'epoch': 0.38} {'loss': 0.4981, 'learning_rate': 1.871207983437032e-05, 'epoch': 0.38} {'loss': 0.5165, 'learning_rate': 1.8711914893286833e-05, 'epoch': 0.38} {'loss': 0.4955, 'learning_rate': 1.8711749942369243e-05, 'epoch': 0.38} {'loss': 0.7522, 'learning_rate': 1.871158498161775e-05, 'epoch': 0.38} {'loss': 0.6112, 'learning_rate': 1.8711420011032533e-05, 'epoch': 0.38} {'loss': 0.4939, 'learning_rate': 1.871125503061378e-05, 'epoch': 0.38} {'loss': 0.5672, 'learning_rate': 1.8711090040361673e-05, 'epoch': 0.38} {'loss': 0.4251, 'learning_rate': 1.8710925040276406e-05, 'epoch': 0.38} {'loss': 0.5896, 'learning_rate': 1.8710760030358157e-05, 'epoch': 0.38} {'loss': 0.6203, 'learning_rate': 1.871059501060712e-05, 'epoch': 0.38} {'loss': 0.4928, 'learning_rate': 1.8710429981023475e-05, 'epoch': 0.38} {'loss': 0.6874, 'learning_rate': 1.8710264941607416e-05, 'epoch': 0.38} {'loss': 0.7048, 'learning_rate': 1.871009989235912e-05, 'epoch': 0.38} {'loss': 0.5486, 'learning_rate': 1.8709934833278777e-05, 'epoch': 0.38} {'loss': 0.4473, 'learning_rate': 1.8709769764366574e-05, 'epoch': 0.38} {'loss': 0.4611, 'learning_rate': 1.8709604685622697e-05, 'epoch': 0.38} {'loss': 0.7084, 'learning_rate': 1.8709439597047335e-05, 'epoch': 0.38} {'loss': 0.6474, 'learning_rate': 1.870927449864067e-05, 'epoch': 0.38} {'loss': 0.5433, 'learning_rate': 1.870910939040289e-05, 'epoch': 0.38} {'loss': 0.6192, 'learning_rate': 1.8708944272334184e-05, 'epoch': 0.38} {'loss': 0.5794, 'learning_rate': 1.8708779144434736e-05, 'epoch': 0.38} {'loss': 0.6813, 'learning_rate': 1.8708614006704727e-05, 'epoch': 0.38} {'loss': 0.5451, 'learning_rate': 1.8708448859144353e-05, 'epoch': 0.38} {'loss': 0.5749, 'learning_rate': 1.87082837017538e-05, 'epoch': 0.38} {'loss': 0.6102, 'learning_rate': 1.8708118534533244e-05, 'epoch': 0.38} {'loss': 0.5458, 'learning_rate': 1.870795335748288e-05, 'epoch': 0.38} {'loss': 0.5664, 'learning_rate': 1.8707788170602893e-05, 'epoch': 0.38} {'loss': 0.5495, 'learning_rate': 1.8707622973893465e-05, 'epoch': 0.38} {'loss': 0.4584, 'learning_rate': 1.8707457767354793e-05, 'epoch': 0.38} {'loss': 0.6295, 'learning_rate': 1.8707292550987056e-05, 'epoch': 0.38} {'loss': 0.442, 'learning_rate': 1.870712732479044e-05, 'epoch': 0.38} {'loss': 0.6615, 'learning_rate': 1.870696208876513e-05, 'epoch': 0.38} {'loss': 0.5953, 'learning_rate': 1.870679684291132e-05, 'epoch': 0.38} {'loss': 0.6166, 'learning_rate': 1.8706631587229192e-05, 'epoch': 0.38} {'loss': 0.6208, 'learning_rate': 1.870646632171893e-05, 'epoch': 0.38} {'loss': 0.4938, 'learning_rate': 1.8706301046380722e-05, 'epoch': 0.38} {'loss': 0.4762, 'learning_rate': 1.870613576121476e-05, 'epoch': 0.38} {'loss': 0.5835, 'learning_rate': 1.8705970466221223e-05, 'epoch': 0.38} {'loss': 0.5387, 'learning_rate': 1.8705805161400302e-05, 'epoch': 0.38} {'loss': 0.6762, 'learning_rate': 1.8705639846752182e-05, 'epoch': 0.38} {'loss': 0.7661, 'learning_rate': 1.8705474522277054e-05, 'epoch': 0.38} {'loss': 0.7158, 'learning_rate': 1.8705309187975097e-05, 'epoch': 0.38} {'loss': 0.5146, 'learning_rate': 1.87051438438465e-05, 'epoch': 0.38} {'loss': 0.5734, 'learning_rate': 1.8704978489891454e-05, 'epoch': 0.38} {'loss': 0.5057, 'learning_rate': 1.870481312611014e-05, 'epoch': 0.38} {'loss': 0.677, 'learning_rate': 1.8704647752502748e-05, 'epoch': 0.38} {'loss': 0.6015, 'learning_rate': 1.8704482369069464e-05, 'epoch': 0.38} {'loss': 0.5542, 'learning_rate': 1.8704316975810477e-05, 'epoch': 0.38} {'loss': 0.6128, 'learning_rate': 1.8704151572725968e-05, 'epoch': 0.38} {'loss': 0.7467, 'learning_rate': 1.8703986159816128e-05, 'epoch': 0.38} {'loss': 0.7079, 'learning_rate': 1.8703820737081145e-05, 'epoch': 0.38} {'loss': 0.5028, 'learning_rate': 1.87036553045212e-05, 'epoch': 0.38} {'loss': 0.6256, 'learning_rate': 1.8703489862136485e-05, 'epoch': 0.38} {'loss': 0.6099, 'learning_rate': 1.8703324409927185e-05, 'epoch': 0.38} {'loss': 0.4863, 'learning_rate': 1.8703158947893486e-05, 'epoch': 0.38} {'loss': 0.6871, 'learning_rate': 1.8702993476035577e-05, 'epoch': 0.38} {'loss': 0.4924, 'learning_rate': 1.8702827994353644e-05, 'epoch': 0.38} {'loss': 0.7046, 'learning_rate': 1.870266250284787e-05, 'epoch': 0.38} {'loss': 0.5577, 'learning_rate': 1.8702497001518447e-05, 'epoch': 0.38} {'loss': 0.6489, 'learning_rate': 1.870233149036556e-05, 'epoch': 0.38} {'loss': 0.5802, 'learning_rate': 1.8702165969389394e-05, 'epoch': 0.38} {'loss': 0.6128, 'learning_rate': 1.8702000438590138e-05, 'epoch': 0.38} {'loss': 0.6722, 'learning_rate': 1.870183489796798e-05, 'epoch': 0.38} {'loss': 0.5087, 'learning_rate': 1.8701669347523103e-05, 'epoch': 0.38} {'loss': 0.5486, 'learning_rate': 1.8701503787255696e-05, 'epoch': 0.38} {'loss': 0.8033, 'learning_rate': 1.8701338217165946e-05, 'epoch': 0.38} {'loss': 0.5544, 'learning_rate': 1.870117263725404e-05, 'epoch': 0.38} {'loss': 0.5601, 'learning_rate': 1.8701007047520166e-05, 'epoch': 0.38} {'loss': 0.5867, 'learning_rate': 1.870084144796451e-05, 'epoch': 0.38} {'loss': 0.6222, 'learning_rate': 1.8700675838587257e-05, 'epoch': 0.38} {'loss': 0.5627, 'learning_rate': 1.8700510219388593e-05, 'epoch': 0.38} {'loss': 0.79, 'learning_rate': 1.870034459036871e-05, 'epoch': 0.38} {'loss': 0.6542, 'learning_rate': 1.8700178951527794e-05, 'epoch': 0.38} {'loss': 0.566, 'learning_rate': 1.870001330286603e-05, 'epoch': 0.38} {'loss': 0.708, 'learning_rate': 1.8699847644383603e-05, 'epoch': 0.38} {'loss': 0.4559, 'learning_rate': 1.8699681976080705e-05, 'epoch': 0.38} {'loss': 0.6728, 'learning_rate': 1.8699516297957517e-05, 'epoch': 0.38} {'loss': 0.6321, 'learning_rate': 1.8699350610014232e-05, 'epoch': 0.38} {'loss': 0.5843, 'learning_rate': 1.8699184912251033e-05, 'epoch': 0.38} {'loss': 0.5175, 'learning_rate': 1.869901920466811e-05, 'epoch': 0.38} {'loss': 0.5707, 'learning_rate': 1.8698853487265647e-05, 'epoch': 0.38} {'loss': 0.6078, 'learning_rate': 1.8698687760043835e-05, 'epoch': 0.38} {'loss': 0.6002, 'learning_rate': 1.8698522023002858e-05, 'epoch': 0.38} {'loss': 0.5581, 'learning_rate': 1.8698356276142902e-05, 'epoch': 0.38} {'loss': 0.7067, 'learning_rate': 1.8698190519464154e-05, 'epoch': 0.38} {'loss': 0.6157, 'learning_rate': 1.8698024752966806e-05, 'epoch': 0.38} {'loss': 0.4809, 'learning_rate': 1.8697858976651043e-05, 'epoch': 0.38} {'loss': 0.5642, 'learning_rate': 1.869769319051705e-05, 'epoch': 0.38} {'loss': 0.4993, 'learning_rate': 1.8697527394565015e-05, 'epoch': 0.38} {'loss': 0.4499, 'learning_rate': 1.8697361588795124e-05, 'epoch': 0.38} {'loss': 0.5996, 'learning_rate': 1.869719577320757e-05, 'epoch': 0.38} {'loss': 0.6369, 'learning_rate': 1.8697029947802533e-05, 'epoch': 0.38} {'loss': 0.546, 'learning_rate': 1.86968641125802e-05, 'epoch': 0.38} {'loss': 0.6152, 'learning_rate': 1.8696698267540765e-05, 'epoch': 0.38} {'loss': 0.5192, 'learning_rate': 1.869653241268441e-05, 'epoch': 0.38} {'loss': 0.5557, 'learning_rate': 1.8696366548011323e-05, 'epoch': 0.38} {'loss': 0.5505, 'learning_rate': 1.8696200673521696e-05, 'epoch': 0.38} {'loss': 0.5474, 'learning_rate': 1.869603478921571e-05, 'epoch': 0.38} {'loss': 0.5492, 'learning_rate': 1.8695868895093553e-05, 'epoch': 0.38} {'loss': 0.513, 'learning_rate': 1.8695702991155414e-05, 'epoch': 0.38} {'loss': 0.6549, 'learning_rate': 1.869553707740148e-05, 'epoch': 0.38} {'loss': 0.671, 'learning_rate': 1.869537115383194e-05, 'epoch': 0.38} {'loss': 0.5947, 'learning_rate': 1.8695205220446976e-05, 'epoch': 0.38} {'loss': 0.5651, 'learning_rate': 1.8695039277246782e-05, 'epoch': 0.38} {'loss': 0.7058, 'learning_rate': 1.869487332423154e-05, 'epoch': 0.38} {'loss': 0.6116, 'learning_rate': 1.869470736140144e-05, 'epoch': 0.38} {'loss': 0.5203, 'learning_rate': 1.8694541388756668e-05, 'epoch': 0.38} {'loss': 0.7347, 'learning_rate': 1.8694375406297412e-05, 'epoch': 0.38} {'loss': 0.717, 'learning_rate': 1.869420941402386e-05, 'epoch': 0.38} {'loss': 0.3698, 'learning_rate': 1.86940434119362e-05, 'epoch': 0.38} {'loss': 0.5037, 'learning_rate': 1.8693877400034617e-05, 'epoch': 0.38} {'loss': 0.6551, 'learning_rate': 1.86937113783193e-05, 'epoch': 0.38} {'loss': 0.5359, 'learning_rate': 1.8693545346790437e-05, 'epoch': 0.38} {'loss': 0.5466, 'learning_rate': 1.8693379305448215e-05, 'epoch': 0.38} {'loss': 0.5369, 'learning_rate': 1.8693213254292818e-05, 'epoch': 0.38} {'loss': 0.6969, 'learning_rate': 1.8693047193324436e-05, 'epoch': 0.38} {'loss': 0.6848, 'learning_rate': 1.869288112254326e-05, 'epoch': 0.38} {'loss': 0.6101, 'learning_rate': 1.8692715041949472e-05, 'epoch': 0.38} {'loss': 0.683, 'learning_rate': 1.8692548951543263e-05, 'epoch': 0.38} {'loss': 0.5958, 'learning_rate': 1.869238285132482e-05, 'epoch': 0.38} {'loss': 0.5848, 'learning_rate': 1.869221674129433e-05, 'epoch': 0.38} {'loss': 0.5325, 'learning_rate': 1.8692050621451976e-05, 'epoch': 0.38} {'loss': 0.5396, 'learning_rate': 1.869188449179795e-05, 'epoch': 0.38} {'loss': 0.6739, 'learning_rate': 1.8691718352332443e-05, 'epoch': 0.38} {'loss': 0.7228, 'learning_rate': 1.869155220305564e-05, 'epoch': 0.38} {'loss': 0.7002, 'learning_rate': 1.8691386043967722e-05, 'epoch': 0.38} {'loss': 0.5504, 'learning_rate': 1.8691219875068888e-05, 'epoch': 0.38} {'loss': 0.5265, 'learning_rate': 1.8691053696359314e-05, 'epoch': 0.38} {'loss': 0.5935, 'learning_rate': 1.8690887507839195e-05, 'epoch': 0.38} {'loss': 0.5973, 'learning_rate': 1.8690721309508717e-05, 'epoch': 0.38} {'loss': 0.5973, 'learning_rate': 1.8690555101368065e-05, 'epoch': 0.38} {'loss': 0.7078, 'learning_rate': 1.869038888341743e-05, 'epoch': 0.38} {'loss': 0.6268, 'learning_rate': 1.8690222655657003e-05, 'epoch': 0.38} {'loss': 0.603, 'learning_rate': 1.869005641808696e-05, 'epoch': 0.38} {'loss': 0.6103, 'learning_rate': 1.8689890170707505e-05, 'epoch': 0.38} {'loss': 0.6275, 'learning_rate': 1.8689723913518807e-05, 'epoch': 0.38} {'loss': 0.6256, 'learning_rate': 1.868955764652107e-05, 'epoch': 0.38} {'loss': 0.4821, 'learning_rate': 1.868939136971447e-05, 'epoch': 0.38} {'loss': 0.5906, 'learning_rate': 1.86892250830992e-05, 'epoch': 0.38} {'loss': 0.6423, 'learning_rate': 1.868905878667545e-05, 'epoch': 0.38} {'loss': 0.6063, 'learning_rate': 1.86888924804434e-05, 'epoch': 0.38} {'loss': 0.6059, 'learning_rate': 1.8688726164403248e-05, 'epoch': 0.38} {'loss': 0.5766, 'learning_rate': 1.8688559838555175e-05, 'epoch': 0.38} {'loss': 0.6387, 'learning_rate': 1.868839350289937e-05, 'epoch': 0.38} {'loss': 0.6968, 'learning_rate': 1.868822715743602e-05, 'epoch': 0.38} {'loss': 0.6062, 'learning_rate': 1.8688060802165316e-05, 'epoch': 0.38} {'loss': 0.6206, 'learning_rate': 1.868789443708744e-05, 'epoch': 0.38} {'loss': 0.6398, 'learning_rate': 1.8687728062202587e-05, 'epoch': 0.38} {'loss': 0.7247, 'learning_rate': 1.8687561677510938e-05, 'epoch': 0.38} {'loss': 0.6423, 'learning_rate': 1.8687395283012684e-05, 'epoch': 0.38} {'loss': 0.6397, 'learning_rate': 1.8687228878708015e-05, 'epoch': 0.38} {'loss': 0.5374, 'learning_rate': 1.8687062464597113e-05, 'epoch': 0.38} {'loss': 0.5578, 'learning_rate': 1.8686896040680175e-05, 'epoch': 0.38} {'loss': 0.6295, 'learning_rate': 1.8686729606957377e-05, 'epoch': 0.38} {'loss': 0.5248, 'learning_rate': 1.8686563163428916e-05, 'epoch': 0.38} {'loss': 0.5142, 'learning_rate': 1.8686396710094977e-05, 'epoch': 0.38} {'loss': 0.4602, 'learning_rate': 1.868623024695575e-05, 'epoch': 0.38} {'loss': 0.5093, 'learning_rate': 1.868606377401142e-05, 'epoch': 0.38} {'loss': 0.6458, 'learning_rate': 1.868589729126217e-05, 'epoch': 0.38} {'loss': 0.6337, 'learning_rate': 1.8685730798708198e-05, 'epoch': 0.38} {'loss': 0.4954, 'learning_rate': 1.868556429634969e-05, 'epoch': 0.38} {'loss': 0.5316, 'learning_rate': 1.8685397784186827e-05, 'epoch': 0.38} {'loss': 0.5105, 'learning_rate': 1.8685231262219805e-05, 'epoch': 0.38} {'loss': 0.6117, 'learning_rate': 1.8685064730448806e-05, 'epoch': 0.38} {'loss': 0.5805, 'learning_rate': 1.8684898188874025e-05, 'epoch': 0.38} {'loss': 0.5227, 'learning_rate': 1.868473163749564e-05, 'epoch': 0.38} {'loss': 0.5639, 'learning_rate': 1.8684565076313845e-05, 'epoch': 0.38} {'loss': 0.5416, 'learning_rate': 1.868439850532883e-05, 'epoch': 0.38} {'loss': 0.6973, 'learning_rate': 1.868423192454078e-05, 'epoch': 0.38} {'loss': 0.6165, 'learning_rate': 1.8684065333949882e-05, 'epoch': 0.38} {'loss': 0.5214, 'learning_rate': 1.8683898733556326e-05, 'epoch': 0.38} {'loss': 0.4407, 'learning_rate': 1.8683732123360303e-05, 'epoch': 0.38} {'loss': 0.572, 'learning_rate': 1.8683565503361993e-05, 'epoch': 0.38} {'loss': 0.6372, 'learning_rate': 1.868339887356159e-05, 'epoch': 0.38} {'loss': 0.6231, 'learning_rate': 1.8683232233959284e-05, 'epoch': 0.38} {'loss': 0.6366, 'learning_rate': 1.8683065584555257e-05, 'epoch': 0.38} {'loss': 0.5847, 'learning_rate': 1.86828989253497e-05, 'epoch': 0.38} {'loss': 0.4815, 'learning_rate': 1.8682732256342803e-05, 'epoch': 0.38} {'loss': 0.5709, 'learning_rate': 1.8682565577534752e-05, 'epoch': 0.38} {'loss': 0.6338, 'learning_rate': 1.8682398888925734e-05, 'epoch': 0.38} {'loss': 0.6749, 'learning_rate': 1.8682232190515938e-05, 'epoch': 0.38} {'loss': 0.5642, 'learning_rate': 1.8682065482305557e-05, 'epoch': 0.38} {'loss': 0.6354, 'learning_rate': 1.868189876429477e-05, 'epoch': 0.38} {'loss': 0.7958, 'learning_rate': 1.8681732036483774e-05, 'epoch': 0.38} {'loss': 0.5919, 'learning_rate': 1.868156529887275e-05, 'epoch': 0.38} {'loss': 0.5851, 'learning_rate': 1.8681398551461893e-05, 'epoch': 0.38} {'loss': 0.6666, 'learning_rate': 1.8681231794251388e-05, 'epoch': 0.38} {'loss': 0.3858, 'learning_rate': 1.8681065027241424e-05, 'epoch': 0.38} {'loss': 0.6362, 'learning_rate': 1.8680898250432183e-05, 'epoch': 0.38} {'loss': 0.7787, 'learning_rate': 1.868073146382386e-05, 'epoch': 0.38} {'loss': 0.5294, 'learning_rate': 1.8680564667416646e-05, 'epoch': 0.38} {'loss': 0.5536, 'learning_rate': 1.8680397861210724e-05, 'epoch': 0.38} {'loss': 0.4164, 'learning_rate': 1.8680231045206283e-05, 'epoch': 0.38} {'loss': 0.678, 'learning_rate': 1.868006421940351e-05, 'epoch': 0.38} {'loss': 0.5799, 'learning_rate': 1.8679897383802598e-05, 'epoch': 0.38} {'loss': 0.5998, 'learning_rate': 1.867973053840373e-05, 'epoch': 0.38} {'loss': 0.581, 'learning_rate': 1.8679563683207097e-05, 'epoch': 0.38} {'loss': 0.485, 'learning_rate': 1.8679396818212887e-05, 'epoch': 0.38} {'loss': 0.6402, 'learning_rate': 1.867922994342129e-05, 'epoch': 0.38} {'loss': 0.6581, 'learning_rate': 1.867906305883249e-05, 'epoch': 0.38} {'loss': 0.5577, 'learning_rate': 1.8678896164446684e-05, 'epoch': 0.38} {'loss': 0.5903, 'learning_rate': 1.8678729260264047e-05, 'epoch': 0.38} {'loss': 0.7431, 'learning_rate': 1.867856234628478e-05, 'epoch': 0.38} {'loss': 0.6118, 'learning_rate': 1.8678395422509067e-05, 'epoch': 0.38} {'loss': 0.5333, 'learning_rate': 1.867822848893709e-05, 'epoch': 0.38} {'loss': 0.6053, 'learning_rate': 1.867806154556905e-05, 'epoch': 0.38} {'loss': 0.5043, 'learning_rate': 1.8677894592405126e-05, 'epoch': 0.38} {'loss': 0.6254, 'learning_rate': 1.8677727629445507e-05, 'epoch': 0.38} {'loss': 0.5678, 'learning_rate': 1.8677560656690386e-05, 'epoch': 0.38} {'loss': 0.5781, 'learning_rate': 1.867739367413995e-05, 'epoch': 0.38} {'loss': 0.5442, 'learning_rate': 1.8677226681794386e-05, 'epoch': 0.38} {'loss': 0.5711, 'learning_rate': 1.8677059679653883e-05, 'epoch': 0.38} {'loss': 0.6362, 'learning_rate': 1.867689266771863e-05, 'epoch': 0.38} {'loss': 0.5755, 'learning_rate': 1.8676725645988812e-05, 'epoch': 0.38} {'loss': 0.5996, 'learning_rate': 1.8676558614464624e-05, 'epoch': 0.38} {'loss': 0.5773, 'learning_rate': 1.867639157314625e-05, 'epoch': 0.38} {'loss': 0.5572, 'learning_rate': 1.8676224522033878e-05, 'epoch': 0.38} {'loss': 0.6639, 'learning_rate': 1.8676057461127702e-05, 'epoch': 0.38} {'loss': 0.6349, 'learning_rate': 1.8675890390427905e-05, 'epoch': 0.38} {'loss': 0.4909, 'learning_rate': 1.867572330993468e-05, 'epoch': 0.38} {'loss': 0.6242, 'learning_rate': 1.867555621964821e-05, 'epoch': 0.38} {'loss': 0.5198, 'learning_rate': 1.8675389119568686e-05, 'epoch': 0.38} {'loss': 0.637, 'learning_rate': 1.8675222009696302e-05, 'epoch': 0.38} {'loss': 0.5858, 'learning_rate': 1.8675054890031237e-05, 'epoch': 0.38} {'loss': 0.5583, 'learning_rate': 1.867488776057369e-05, 'epoch': 0.38} {'loss': 0.637, 'learning_rate': 1.867472062132384e-05, 'epoch': 0.38} {'loss': 0.61, 'learning_rate': 1.8674553472281882e-05, 'epoch': 0.38} {'loss': 0.5688, 'learning_rate': 1.8674386313448002e-05, 'epoch': 0.38} {'loss': 0.4398, 'learning_rate': 1.8674219144822387e-05, 'epoch': 0.38} {'loss': 0.5806, 'learning_rate': 1.867405196640523e-05, 'epoch': 0.38} {'loss': 0.6514, 'learning_rate': 1.867388477819672e-05, 'epoch': 0.38} {'loss': 0.6169, 'learning_rate': 1.867371758019704e-05, 'epoch': 0.38} {'loss': 0.6476, 'learning_rate': 1.8673550372406387e-05, 'epoch': 0.38} {'loss': 0.6134, 'learning_rate': 1.867338315482494e-05, 'epoch': 0.38} {'loss': 0.3652, 'learning_rate': 1.8673215927452895e-05, 'epoch': 0.38} {'loss': 0.6911, 'learning_rate': 1.867304869029044e-05, 'epoch': 0.38} {'loss': 0.5015, 'learning_rate': 1.867288144333776e-05, 'epoch': 0.38} {'loss': 0.4988, 'learning_rate': 1.8672714186595046e-05, 'epoch': 0.38} {'loss': 0.6995, 'learning_rate': 1.8672546920062485e-05, 'epoch': 0.38} {'loss': 0.7298, 'learning_rate': 1.8672379643740273e-05, 'epoch': 0.38} {'loss': 0.492, 'learning_rate': 1.867221235762859e-05, 'epoch': 0.38} {'loss': 0.4548, 'learning_rate': 1.8672045061727628e-05, 'epoch': 0.38} {'loss': 0.5896, 'learning_rate': 1.8671877756037577e-05, 'epoch': 0.38} {'loss': 0.3731, 'learning_rate': 1.8671710440558624e-05, 'epoch': 0.38} {'loss': 0.6085, 'learning_rate': 1.8671543115290962e-05, 'epoch': 0.38} {'loss': 0.6991, 'learning_rate': 1.8671375780234774e-05, 'epoch': 0.38} {'loss': 0.688, 'learning_rate': 1.8671208435390253e-05, 'epoch': 0.38} {'loss': 0.6757, 'learning_rate': 1.8671041080757585e-05, 'epoch': 0.38} {'loss': 0.6392, 'learning_rate': 1.867087371633696e-05, 'epoch': 0.38} {'loss': 0.6423, 'learning_rate': 1.867070634212857e-05, 'epoch': 0.38} {'loss': 0.6453, 'learning_rate': 1.86705389581326e-05, 'epoch': 0.38} {'loss': 0.6416, 'learning_rate': 1.867037156434924e-05, 'epoch': 0.38} {'loss': 0.3843, 'learning_rate': 1.8670204160778682e-05, 'epoch': 0.38} {'loss': 0.457, 'learning_rate': 1.867003674742111e-05, 'epoch': 0.38} {'loss': 0.43, 'learning_rate': 1.8669869324276715e-05, 'epoch': 0.38} {'loss': 0.6462, 'learning_rate': 1.8669701891345687e-05, 'epoch': 0.38} {'loss': 0.443, 'learning_rate': 1.8669534448628213e-05, 'epoch': 0.38} {'loss': 0.6265, 'learning_rate': 1.8669366996124486e-05, 'epoch': 0.38} {'loss': 0.6426, 'learning_rate': 1.866919953383469e-05, 'epoch': 0.38} {'loss': 0.5279, 'learning_rate': 1.8669032061759017e-05, 'epoch': 0.38} {'loss': 0.5582, 'learning_rate': 1.8668864579897653e-05, 'epoch': 0.38} {'loss': 0.4677, 'learning_rate': 1.8668697088250792e-05, 'epoch': 0.38} {'loss': 0.5418, 'learning_rate': 1.8668529586818617e-05, 'epoch': 0.38} {'loss': 0.6696, 'learning_rate': 1.8668362075601324e-05, 'epoch': 0.38} {'loss': 0.3935, 'learning_rate': 1.86681945545991e-05, 'epoch': 0.38} {'loss': 0.5343, 'learning_rate': 1.8668027023812128e-05, 'epoch': 0.38} {'loss': 0.5739, 'learning_rate': 1.8667859483240603e-05, 'epoch': 0.38} {'loss': 0.6431, 'learning_rate': 1.8667691932884717e-05, 'epoch': 0.38} {'loss': 0.4897, 'learning_rate': 1.866752437274465e-05, 'epoch': 0.38} {'loss': 0.7332, 'learning_rate': 1.86673568028206e-05, 'epoch': 0.38} {'loss': 0.5358, 'learning_rate': 1.866718922311275e-05, 'epoch': 0.38} {'loss': 0.5059, 'learning_rate': 1.8667021633621292e-05, 'epoch': 0.38} {'loss': 0.7066, 'learning_rate': 1.8666854034346413e-05, 'epoch': 0.38} {'loss': 0.5567, 'learning_rate': 1.8666686425288304e-05, 'epoch': 0.38} {'loss': 0.6537, 'learning_rate': 1.8666518806447158e-05, 'epoch': 0.38} {'loss': 0.3424, 'learning_rate': 1.8666351177823157e-05, 'epoch': 0.38} {'loss': 0.8254, 'learning_rate': 1.8666183539416494e-05, 'epoch': 0.38} {'loss': 0.5173, 'learning_rate': 1.8666015891227357e-05, 'epoch': 0.38} {'loss': 0.6589, 'learning_rate': 1.8665848233255938e-05, 'epoch': 0.38} {'loss': 0.4452, 'learning_rate': 1.8665680565502423e-05, 'epoch': 0.38} {'loss': 0.4715, 'learning_rate': 1.8665512887967003e-05, 'epoch': 0.38} {'loss': 0.4244, 'learning_rate': 1.866534520064987e-05, 'epoch': 0.38} {'loss': 0.5445, 'learning_rate': 1.8665177503551203e-05, 'epoch': 0.38} {'loss': 0.5027, 'learning_rate': 1.8665009796671204e-05, 'epoch': 0.38} {'loss': 0.666, 'learning_rate': 1.8664842080010054e-05, 'epoch': 0.38} {'loss': 0.498, 'learning_rate': 1.8664674353567947e-05, 'epoch': 0.38} {'loss': 0.6205, 'learning_rate': 1.866450661734507e-05, 'epoch': 0.38} {'loss': 0.521, 'learning_rate': 1.866433887134161e-05, 'epoch': 0.38} {'loss': 0.5759, 'learning_rate': 1.866417111555776e-05, 'epoch': 0.38} {'loss': 0.7067, 'learning_rate': 1.866400334999371e-05, 'epoch': 0.38} {'loss': 0.6359, 'learning_rate': 1.8663835574649647e-05, 'epoch': 0.38} {'loss': 0.4705, 'learning_rate': 1.866366778952576e-05, 'epoch': 0.38} {'loss': 0.5842, 'learning_rate': 1.8663499994622244e-05, 'epoch': 0.38} {'loss': 0.5936, 'learning_rate': 1.8663332189939277e-05, 'epoch': 0.38} {'loss': 0.545, 'learning_rate': 1.866316437547706e-05, 'epoch': 0.38} {'loss': 0.579, 'learning_rate': 1.8662996551235774e-05, 'epoch': 0.38} {'loss': 0.5965, 'learning_rate': 1.8662828717215617e-05, 'epoch': 0.38} {'loss': 0.6398, 'learning_rate': 1.866266087341677e-05, 'epoch': 0.38} {'loss': 0.5026, 'learning_rate': 1.866249301983943e-05, 'epoch': 0.38} {'loss': 0.6436, 'learning_rate': 1.866232515648378e-05, 'epoch': 0.38} {'loss': 0.6998, 'learning_rate': 1.8662157283350012e-05, 'epoch': 0.38} {'loss': 0.6115, 'learning_rate': 1.8661989400438317e-05, 'epoch': 0.38} {'loss': 0.5365, 'learning_rate': 1.866182150774888e-05, 'epoch': 0.38} {'loss': 0.5349, 'learning_rate': 1.8661653605281897e-05, 'epoch': 0.38} {'loss': 0.5348, 'learning_rate': 1.8661485693037553e-05, 'epoch': 0.38} {'loss': 0.5872, 'learning_rate': 1.866131777101604e-05, 'epoch': 0.39} {'loss': 0.5969, 'learning_rate': 1.8661149839217544e-05, 'epoch': 0.39} {'loss': 0.7165, 'learning_rate': 1.866098189764226e-05, 'epoch': 0.39} {'loss': 0.5798, 'learning_rate': 1.866081394629037e-05, 'epoch': 0.39} {'loss': 0.6464, 'learning_rate': 1.8660645985162068e-05, 'epoch': 0.39} {'loss': 0.5856, 'learning_rate': 1.866047801425755e-05, 'epoch': 0.39} {'loss': 0.6951, 'learning_rate': 1.866031003357699e-05, 'epoch': 0.39} {'loss': 0.6021, 'learning_rate': 1.8660142043120593e-05, 'epoch': 0.39} {'loss': 0.53, 'learning_rate': 1.865997404288854e-05, 'epoch': 0.39} {'loss': 0.6367, 'learning_rate': 1.8659806032881026e-05, 'epoch': 0.39} {'loss': 0.6604, 'learning_rate': 1.8659638013098237e-05, 'epoch': 0.39} {'loss': 0.5275, 'learning_rate': 1.8659469983540362e-05, 'epoch': 0.39} {'loss': 0.7495, 'learning_rate': 1.865930194420759e-05, 'epoch': 0.39} {'loss': 0.478, 'learning_rate': 1.8659133895100118e-05, 'epoch': 0.39} {'loss': 0.6121, 'learning_rate': 1.8658965836218125e-05, 'epoch': 0.39} {'loss': 0.7109, 'learning_rate': 1.865879776756181e-05, 'epoch': 0.39} {'loss': 0.579, 'learning_rate': 1.865862968913136e-05, 'epoch': 0.39} {'loss': 0.6832, 'learning_rate': 1.865846160092696e-05, 'epoch': 0.39} {'loss': 0.7297, 'learning_rate': 1.8658293502948802e-05, 'epoch': 0.39} {'loss': 0.6586, 'learning_rate': 1.865812539519708e-05, 'epoch': 0.39} {'loss': 0.7955, 'learning_rate': 1.865795727767198e-05, 'epoch': 0.39} {'loss': 0.6867, 'learning_rate': 1.8657789150373694e-05, 'epoch': 0.39} {'loss': 0.6082, 'learning_rate': 1.865762101330241e-05, 'epoch': 0.39} {'loss': 0.5255, 'learning_rate': 1.8657452866458317e-05, 'epoch': 0.39} {'loss': 0.5012, 'learning_rate': 1.8657284709841607e-05, 'epoch': 0.39} {'loss': 0.7416, 'learning_rate': 1.8657116543452468e-05, 'epoch': 0.39} {'loss': 0.5756, 'learning_rate': 1.8656948367291093e-05, 'epoch': 0.39} {'loss': 0.535, 'learning_rate': 1.8656780181357668e-05, 'epoch': 0.39} {'loss': 0.6312, 'learning_rate': 1.8656611985652383e-05, 'epoch': 0.39} {'loss': 0.4431, 'learning_rate': 1.865644378017543e-05, 'epoch': 0.39} {'loss': 0.5403, 'learning_rate': 1.8656275564927e-05, 'epoch': 0.39} {'loss': 0.6237, 'learning_rate': 1.8656107339907276e-05, 'epoch': 0.39} {'loss': 0.6287, 'learning_rate': 1.865593910511646e-05, 'epoch': 0.39} {'loss': 0.4594, 'learning_rate': 1.8655770860554727e-05, 'epoch': 0.39} {'loss': 0.7112, 'learning_rate': 1.865560260622228e-05, 'epoch': 0.39} {'loss': 0.5456, 'learning_rate': 1.86554343421193e-05, 'epoch': 0.39} {'loss': 0.6063, 'learning_rate': 1.8655266068245984e-05, 'epoch': 0.39} {'loss': 0.3782, 'learning_rate': 1.8655097784602518e-05, 'epoch': 0.39} {'loss': 0.3319, 'learning_rate': 1.865492949118909e-05, 'epoch': 0.39} {'loss': 0.6125, 'learning_rate': 1.8654761188005898e-05, 'epoch': 0.39} {'loss': 0.6013, 'learning_rate': 1.865459287505312e-05, 'epoch': 0.39} {'loss': 0.6788, 'learning_rate': 1.8654424552330955e-05, 'epoch': 0.39} {'loss': 0.6074, 'learning_rate': 1.8654256219839587e-05, 'epoch': 0.39} {'loss': 0.7035, 'learning_rate': 1.8654087877579218e-05, 'epoch': 0.39} {'loss': 0.6632, 'learning_rate': 1.865391952555002e-05, 'epoch': 0.39} {'loss': 0.3662, 'learning_rate': 1.8653751163752197e-05, 'epoch': 0.39} {'loss': 0.645, 'learning_rate': 1.8653582792185932e-05, 'epoch': 0.39} {'loss': 0.644, 'learning_rate': 1.8653414410851422e-05, 'epoch': 0.39} {'loss': 0.464, 'learning_rate': 1.865324601974885e-05, 'epoch': 0.39} {'loss': 0.6608, 'learning_rate': 1.865307761887841e-05, 'epoch': 0.39} {'loss': 0.7165, 'learning_rate': 1.8652909208240292e-05, 'epoch': 0.39} {'loss': 0.472, 'learning_rate': 1.865274078783468e-05, 'epoch': 0.39} {'loss': 0.5662, 'learning_rate': 1.865257235766177e-05, 'epoch': 0.39} {'loss': 0.6305, 'learning_rate': 1.8652403917721753e-05, 'epoch': 0.39} {'loss': 0.5887, 'learning_rate': 1.8652235468014817e-05, 'epoch': 0.39} {'loss': 0.5715, 'learning_rate': 1.8652067008541155e-05, 'epoch': 0.39} {'loss': 0.6339, 'learning_rate': 1.8651898539300952e-05, 'epoch': 0.39} {'loss': 0.5772, 'learning_rate': 1.8651730060294402e-05, 'epoch': 0.39} {'loss': 0.5486, 'learning_rate': 1.865156157152169e-05, 'epoch': 0.39} {'loss': 0.5641, 'learning_rate': 1.8651393072983015e-05, 'epoch': 0.39} {'loss': 0.5994, 'learning_rate': 1.865122456467856e-05, 'epoch': 0.39} {'loss': 0.5348, 'learning_rate': 1.865105604660852e-05, 'epoch': 0.39} {'loss': 0.66, 'learning_rate': 1.865088751877308e-05, 'epoch': 0.39} {'loss': 0.6997, 'learning_rate': 1.8650718981172432e-05, 'epoch': 0.39} {'loss': 0.5768, 'learning_rate': 1.8650550433806772e-05, 'epoch': 0.39} {'loss': 0.4377, 'learning_rate': 1.8650381876676283e-05, 'epoch': 0.39} {'loss': 0.5059, 'learning_rate': 1.8650213309781157e-05, 'epoch': 0.39} {'loss': 0.4477, 'learning_rate': 1.8650044733121584e-05, 'epoch': 0.39} {'loss': 0.5672, 'learning_rate': 1.8649876146697758e-05, 'epoch': 0.39} {'loss': 0.5039, 'learning_rate': 1.8649707550509865e-05, 'epoch': 0.39} {'loss': 0.5811, 'learning_rate': 1.86495389445581e-05, 'epoch': 0.39} {'loss': 0.6391, 'learning_rate': 1.8649370328842645e-05, 'epoch': 0.39} {'loss': 0.6739, 'learning_rate': 1.8649201703363698e-05, 'epoch': 0.39} {'loss': 0.5673, 'learning_rate': 1.864903306812145e-05, 'epoch': 0.39} {'loss': 0.5346, 'learning_rate': 1.8648864423116086e-05, 'epoch': 0.39} {'loss': 0.6392, 'learning_rate': 1.8648695768347797e-05, 'epoch': 0.39} {'loss': 0.6138, 'learning_rate': 1.864852710381678e-05, 'epoch': 0.39} {'loss': 0.6863, 'learning_rate': 1.8648358429523216e-05, 'epoch': 0.39} {'loss': 0.6305, 'learning_rate': 1.8648189745467302e-05, 'epoch': 0.39} {'loss': 0.5535, 'learning_rate': 1.8648021051649222e-05, 'epoch': 0.39} {'loss': 0.497, 'learning_rate': 1.864785234806918e-05, 'epoch': 0.39} {'loss': 0.6261, 'learning_rate': 1.864768363472735e-05, 'epoch': 0.39} {'loss': 0.4819, 'learning_rate': 1.8647514911623928e-05, 'epoch': 0.39} {'loss': 0.4796, 'learning_rate': 1.864734617875911e-05, 'epoch': 0.39} {'loss': 0.6532, 'learning_rate': 1.864717743613308e-05, 'epoch': 0.39} {'loss': 0.5705, 'learning_rate': 1.8647008683746037e-05, 'epoch': 0.39} {'loss': 0.6254, 'learning_rate': 1.8646839921598158e-05, 'epoch': 0.39} {'loss': 0.5008, 'learning_rate': 1.8646671149689647e-05, 'epoch': 0.39} {'loss': 0.688, 'learning_rate': 1.8646502368020685e-05, 'epoch': 0.39} {'loss': 0.6325, 'learning_rate': 1.8646333576591463e-05, 'epoch': 0.39} {'loss': 0.5106, 'learning_rate': 1.864616477540218e-05, 'epoch': 0.39} {'loss': 0.4789, 'learning_rate': 1.8645995964453022e-05, 'epoch': 0.39} {'loss': 0.4563, 'learning_rate': 1.8645827143744175e-05, 'epoch': 0.39} {'loss': 0.6105, 'learning_rate': 1.8645658313275835e-05, 'epoch': 0.39} {'loss': 0.579, 'learning_rate': 1.864548947304819e-05, 'epoch': 0.39} {'loss': 0.6569, 'learning_rate': 1.864532062306143e-05, 'epoch': 0.39} {'loss': 0.5262, 'learning_rate': 1.8645151763315746e-05, 'epoch': 0.39} {'loss': 0.5109, 'learning_rate': 1.8644982893811334e-05, 'epoch': 0.39} {'loss': 0.5778, 'learning_rate': 1.864481401454838e-05, 'epoch': 0.39} {'loss': 0.5644, 'learning_rate': 1.864464512552707e-05, 'epoch': 0.39} {'loss': 0.4377, 'learning_rate': 1.8644476226747605e-05, 'epoch': 0.39} {'loss': 0.5998, 'learning_rate': 1.864430731821017e-05, 'epoch': 0.39} {'loss': 0.5425, 'learning_rate': 1.864413839991495e-05, 'epoch': 0.39} {'loss': 0.4518, 'learning_rate': 1.8643969471862148e-05, 'epoch': 0.39} {'loss': 0.6246, 'learning_rate': 1.8643800534051945e-05, 'epoch': 0.39} {'loss': 0.6425, 'learning_rate': 1.8643631586484536e-05, 'epoch': 0.39} {'loss': 0.3985, 'learning_rate': 1.8643462629160106e-05, 'epoch': 0.39} {'loss': 0.5328, 'learning_rate': 1.8643293662078857e-05, 'epoch': 0.39} {'loss': 0.6103, 'learning_rate': 1.864312468524097e-05, 'epoch': 0.39} {'loss': 0.6261, 'learning_rate': 1.864295569864664e-05, 'epoch': 0.39} {'loss': 0.6033, 'learning_rate': 1.8642786702296056e-05, 'epoch': 0.39} {'loss': 0.5446, 'learning_rate': 1.8642617696189407e-05, 'epoch': 0.39} {'loss': 0.5851, 'learning_rate': 1.864244868032689e-05, 'epoch': 0.39} {'loss': 0.5298, 'learning_rate': 1.8642279654708687e-05, 'epoch': 0.39} {'loss': 0.6218, 'learning_rate': 1.8642110619335e-05, 'epoch': 0.39} {'loss': 0.4605, 'learning_rate': 1.8641941574206007e-05, 'epoch': 0.39} {'loss': 0.7411, 'learning_rate': 1.864177251932191e-05, 'epoch': 0.39} {'loss': 0.6389, 'learning_rate': 1.8641603454682894e-05, 'epoch': 0.39} {'loss': 0.7047, 'learning_rate': 1.864143438028915e-05, 'epoch': 0.39} {'loss': 0.5592, 'learning_rate': 1.864126529614087e-05, 'epoch': 0.39} {'loss': 0.5958, 'learning_rate': 1.8641096202238246e-05, 'epoch': 0.39} {'loss': 0.3604, 'learning_rate': 1.8640927098581466e-05, 'epoch': 0.39} {'loss': 0.6973, 'learning_rate': 1.8640757985170724e-05, 'epoch': 0.39} {'loss': 0.4662, 'learning_rate': 1.8640588862006206e-05, 'epoch': 0.39} {'loss': 0.5967, 'learning_rate': 1.864041972908811e-05, 'epoch': 0.39} {'loss': 0.6052, 'learning_rate': 1.8640250586416622e-05, 'epoch': 0.39} {'loss': 0.6869, 'learning_rate': 1.8640081433991933e-05, 'epoch': 0.39} {'loss': 0.548, 'learning_rate': 1.8639912271814235e-05, 'epoch': 0.39} {'loss': 0.6241, 'learning_rate': 1.8639743099883722e-05, 'epoch': 0.39} {'loss': 0.4914, 'learning_rate': 1.863957391820058e-05, 'epoch': 0.39} {'loss': 0.5259, 'learning_rate': 1.8639404726765003e-05, 'epoch': 0.39} {'loss': 0.5126, 'learning_rate': 1.8639235525577176e-05, 'epoch': 0.39} {'loss': 0.6548, 'learning_rate': 1.86390663146373e-05, 'epoch': 0.39} {'loss': 0.6187, 'learning_rate': 1.863889709394556e-05, 'epoch': 0.39} {'loss': 0.5103, 'learning_rate': 1.8638727863502146e-05, 'epoch': 0.39} {'loss': 0.5878, 'learning_rate': 1.8638558623307256e-05, 'epoch': 0.39} {'loss': 0.5821, 'learning_rate': 1.863838937336107e-05, 'epoch': 0.39} {'loss': 0.691, 'learning_rate': 1.863822011366379e-05, 'epoch': 0.39} {'loss': 0.6812, 'learning_rate': 1.8638050844215597e-05, 'epoch': 0.39} {'loss': 0.5763, 'learning_rate': 1.863788156501669e-05, 'epoch': 0.39} {'loss': 0.7884, 'learning_rate': 1.863771227606726e-05, 'epoch': 0.39} {'loss': 0.6473, 'learning_rate': 1.863754297736749e-05, 'epoch': 0.39} {'loss': 0.5426, 'learning_rate': 1.863737366891758e-05, 'epoch': 0.39} {'loss': 0.5849, 'learning_rate': 1.8637204350717718e-05, 'epoch': 0.39} {'loss': 0.6641, 'learning_rate': 1.8637035022768094e-05, 'epoch': 0.39} {'loss': 0.6828, 'learning_rate': 1.8636865685068896e-05, 'epoch': 0.39} {'loss': 0.6425, 'learning_rate': 1.8636696337620322e-05, 'epoch': 0.39} {'loss': 0.6333, 'learning_rate': 1.8636526980422562e-05, 'epoch': 0.39} {'loss': 0.6445, 'learning_rate': 1.8636357613475805e-05, 'epoch': 0.39} {'loss': 0.5078, 'learning_rate': 1.863618823678024e-05, 'epoch': 0.39} {'loss': 0.5226, 'learning_rate': 1.8636018850336062e-05, 'epoch': 0.39} {'loss': 0.7022, 'learning_rate': 1.863584945414346e-05, 'epoch': 0.39} {'loss': 0.5439, 'learning_rate': 1.863568004820263e-05, 'epoch': 0.39} {'loss': 0.5247, 'learning_rate': 1.8635510632513754e-05, 'epoch': 0.39} {'loss': 0.6453, 'learning_rate': 1.863534120707703e-05, 'epoch': 0.39} {'loss': 0.5955, 'learning_rate': 1.863517177189265e-05, 'epoch': 0.39} {'loss': 0.4591, 'learning_rate': 1.8635002326960805e-05, 'epoch': 0.39} {'loss': 0.5287, 'learning_rate': 1.8634832872281682e-05, 'epoch': 0.39} {'loss': 0.5956, 'learning_rate': 1.8634663407855473e-05, 'epoch': 0.39} {'loss': 0.6092, 'learning_rate': 1.863449393368237e-05, 'epoch': 0.39} {'loss': 0.6065, 'learning_rate': 1.863432444976257e-05, 'epoch': 0.39} {'loss': 0.6963, 'learning_rate': 1.863415495609626e-05, 'epoch': 0.39} {'loss': 0.4841, 'learning_rate': 1.8633985452683623e-05, 'epoch': 0.39} {'loss': 0.6193, 'learning_rate': 1.8633815939524865e-05, 'epoch': 0.39} {'loss': 0.5405, 'learning_rate': 1.863364641662017e-05, 'epoch': 0.39} {'loss': 0.6327, 'learning_rate': 1.8633476883969724e-05, 'epoch': 0.39} {'loss': 0.6545, 'learning_rate': 1.8633307341573733e-05, 'epoch': 0.39} {'loss': 0.4388, 'learning_rate': 1.8633137789432373e-05, 'epoch': 0.39} {'loss': 0.4584, 'learning_rate': 1.8632968227545845e-05, 'epoch': 0.39} {'loss': 0.5861, 'learning_rate': 1.863279865591434e-05, 'epoch': 0.39} {'loss': 0.5367, 'learning_rate': 1.8632629074538043e-05, 'epoch': 0.39} {'loss': 0.5139, 'learning_rate': 1.8632459483417152e-05, 'epoch': 0.39} {'loss': 0.6945, 'learning_rate': 1.8632289882551852e-05, 'epoch': 0.39} {'loss': 0.6256, 'learning_rate': 1.8632120271942342e-05, 'epoch': 0.39} {'loss': 0.5412, 'learning_rate': 1.863195065158881e-05, 'epoch': 0.39} {'loss': 0.6536, 'learning_rate': 1.8631781021491443e-05, 'epoch': 0.39} {'loss': 0.6807, 'learning_rate': 1.863161138165044e-05, 'epoch': 0.39} {'loss': 0.5189, 'learning_rate': 1.8631441732065987e-05, 'epoch': 0.39} {'loss': 0.6992, 'learning_rate': 1.863127207273828e-05, 'epoch': 0.39} {'loss': 0.5287, 'learning_rate': 1.8631102403667507e-05, 'epoch': 0.39} {'loss': 0.5932, 'learning_rate': 1.863093272485386e-05, 'epoch': 0.39} {'loss': 0.6394, 'learning_rate': 1.8630763036297534e-05, 'epoch': 0.39} {'loss': 0.6823, 'learning_rate': 1.8630593337998714e-05, 'epoch': 0.39} {'loss': 0.4189, 'learning_rate': 1.8630423629957597e-05, 'epoch': 0.39} {'loss': 0.6211, 'learning_rate': 1.8630253912174373e-05, 'epoch': 0.39} {'loss': 0.6501, 'learning_rate': 1.8630084184649235e-05, 'epoch': 0.39} {'loss': 0.4917, 'learning_rate': 1.862991444738237e-05, 'epoch': 0.39} {'loss': 0.4708, 'learning_rate': 1.8629744700373976e-05, 'epoch': 0.39} {'loss': 0.4112, 'learning_rate': 1.862957494362424e-05, 'epoch': 0.39} {'loss': 0.5524, 'learning_rate': 1.862940517713335e-05, 'epoch': 0.39} {'loss': 0.7122, 'learning_rate': 1.8629235400901507e-05, 'epoch': 0.39} {'loss': 0.5275, 'learning_rate': 1.86290656149289e-05, 'epoch': 0.39} {'loss': 0.6046, 'learning_rate': 1.8628895819215715e-05, 'epoch': 0.39} {'loss': 0.5777, 'learning_rate': 1.8628726013762152e-05, 'epoch': 0.39} {'loss': 0.4137, 'learning_rate': 1.862855619856839e-05, 'epoch': 0.39} {'loss': 0.6142, 'learning_rate': 1.8628386373634633e-05, 'epoch': 0.39} {'loss': 0.583, 'learning_rate': 1.8628216538961074e-05, 'epoch': 0.39} {'loss': 0.4678, 'learning_rate': 1.8628046694547892e-05, 'epoch': 0.39} {'loss': 0.5671, 'learning_rate': 1.862787684039529e-05, 'epoch': 0.39} {'loss': 0.6352, 'learning_rate': 1.8627706976503455e-05, 'epoch': 0.39} {'loss': 0.6482, 'learning_rate': 1.862753710287258e-05, 'epoch': 0.39} {'loss': 0.7288, 'learning_rate': 1.8627367219502856e-05, 'epoch': 0.39} {'loss': 0.7271, 'learning_rate': 1.862719732639447e-05, 'epoch': 0.39} {'loss': 0.4972, 'learning_rate': 1.8627027423547624e-05, 'epoch': 0.39} {'loss': 0.6489, 'learning_rate': 1.8626857510962507e-05, 'epoch': 0.39} {'loss': 0.5144, 'learning_rate': 1.8626687588639303e-05, 'epoch': 0.39} {'loss': 0.6414, 'learning_rate': 1.862651765657821e-05, 'epoch': 0.39} {'loss': 0.6942, 'learning_rate': 1.8626347714779422e-05, 'epoch': 0.39} {'loss': 0.5678, 'learning_rate': 1.8626177763243125e-05, 'epoch': 0.39} {'loss': 0.7406, 'learning_rate': 1.8626007801969514e-05, 'epoch': 0.39} {'loss': 0.6639, 'learning_rate': 1.862583783095878e-05, 'epoch': 0.39} {'loss': 0.5041, 'learning_rate': 1.8625667850211116e-05, 'epoch': 0.39} {'loss': 0.6246, 'learning_rate': 1.8625497859726717e-05, 'epoch': 0.39} {'loss': 0.5517, 'learning_rate': 1.8625327859505765e-05, 'epoch': 0.39} {'loss': 0.5417, 'learning_rate': 1.8625157849548464e-05, 'epoch': 0.39} {'loss': 0.5922, 'learning_rate': 1.8624987829854994e-05, 'epoch': 0.39} {'loss': 0.7532, 'learning_rate': 1.8624817800425554e-05, 'epoch': 0.39} {'loss': 0.5986, 'learning_rate': 1.862464776126034e-05, 'epoch': 0.39} {'loss': 0.6394, 'learning_rate': 1.8624477712359535e-05, 'epoch': 0.39} {'loss': 0.5083, 'learning_rate': 1.862430765372333e-05, 'epoch': 0.39} {'loss': 0.6438, 'learning_rate': 1.8624137585351928e-05, 'epoch': 0.39} {'loss': 0.5605, 'learning_rate': 1.8623967507245514e-05, 'epoch': 0.39} {'loss': 0.5349, 'learning_rate': 1.862379741940428e-05, 'epoch': 0.39} {'loss': 0.4767, 'learning_rate': 1.8623627321828416e-05, 'epoch': 0.39} {'loss': 0.7167, 'learning_rate': 1.8623457214518122e-05, 'epoch': 0.39} {'loss': 0.577, 'learning_rate': 1.862328709747358e-05, 'epoch': 0.39} {'loss': 0.6429, 'learning_rate': 1.862311697069499e-05, 'epoch': 0.39} {'loss': 0.6981, 'learning_rate': 1.8622946834182536e-05, 'epoch': 0.39} {'loss': 0.5142, 'learning_rate': 1.8622776687936417e-05, 'epoch': 0.39} {'loss': 0.5577, 'learning_rate': 1.8622606531956827e-05, 'epoch': 0.39} {'loss': 0.6762, 'learning_rate': 1.862243636624395e-05, 'epoch': 0.39} {'loss': 0.5926, 'learning_rate': 1.862226619079798e-05, 'epoch': 0.39} {'loss': 0.5787, 'learning_rate': 1.8622096005619113e-05, 'epoch': 0.39} {'loss': 0.6634, 'learning_rate': 1.8621925810707543e-05, 'epoch': 0.39} {'loss': 0.5366, 'learning_rate': 1.8621755606063453e-05, 'epoch': 0.39} {'loss': 0.4806, 'learning_rate': 1.862158539168704e-05, 'epoch': 0.39} {'loss': 0.6732, 'learning_rate': 1.86214151675785e-05, 'epoch': 0.39} {'loss': 0.5975, 'learning_rate': 1.8621244933738022e-05, 'epoch': 0.39} {'loss': 0.4484, 'learning_rate': 1.8621074690165795e-05, 'epoch': 0.39} {'loss': 0.6823, 'learning_rate': 1.8620904436862014e-05, 'epoch': 0.39} {'loss': 0.5766, 'learning_rate': 1.8620734173826874e-05, 'epoch': 0.39} {'loss': 0.6359, 'learning_rate': 1.8620563901060562e-05, 'epoch': 0.39} {'loss': 0.5766, 'learning_rate': 1.8620393618563275e-05, 'epoch': 0.39} {'loss': 0.4738, 'learning_rate': 1.86202233263352e-05, 'epoch': 0.39} {'loss': 0.5874, 'learning_rate': 1.8620053024376534e-05, 'epoch': 0.39} {'loss': 0.642, 'learning_rate': 1.8619882712687466e-05, 'epoch': 0.39} {'loss': 0.4498, 'learning_rate': 1.861971239126819e-05, 'epoch': 0.39} {'loss': 0.5542, 'learning_rate': 1.8619542060118897e-05, 'epoch': 0.39} {'loss': 0.4823, 'learning_rate': 1.8619371719239786e-05, 'epoch': 0.39} {'loss': 0.7328, 'learning_rate': 1.8619201368631038e-05, 'epoch': 0.39} {'loss': 0.5257, 'learning_rate': 1.861903100829285e-05, 'epoch': 0.39} {'loss': 0.7744, 'learning_rate': 1.8618860638225417e-05, 'epoch': 0.39} {'loss': 0.6836, 'learning_rate': 1.861869025842893e-05, 'epoch': 0.39} {'loss': 0.5754, 'learning_rate': 1.861851986890358e-05, 'epoch': 0.39} {'loss': 0.4452, 'learning_rate': 1.861834946964956e-05, 'epoch': 0.39} {'loss': 0.6403, 'learning_rate': 1.8618179060667058e-05, 'epoch': 0.39} {'loss': 0.3891, 'learning_rate': 1.8618008641956275e-05, 'epoch': 0.39} {'loss': 0.4868, 'learning_rate': 1.86178382135174e-05, 'epoch': 0.39} {'loss': 0.522, 'learning_rate': 1.8617667775350622e-05, 'epoch': 0.39} {'loss': 0.6624, 'learning_rate': 1.8617497327456135e-05, 'epoch': 0.39} {'loss': 0.5131, 'learning_rate': 1.8617326869834132e-05, 'epoch': 0.39} {'loss': 0.6483, 'learning_rate': 1.861715640248481e-05, 'epoch': 0.39} {'loss': 0.6211, 'learning_rate': 1.8616985925408354e-05, 'epoch': 0.39} {'loss': 0.5758, 'learning_rate': 1.861681543860496e-05, 'epoch': 0.39} {'loss': 0.5838, 'learning_rate': 1.861664494207482e-05, 'epoch': 0.39} {'loss': 0.6161, 'learning_rate': 1.8616474435818126e-05, 'epoch': 0.39} {'loss': 0.5993, 'learning_rate': 1.861630391983507e-05, 'epoch': 0.39} {'loss': 0.543, 'learning_rate': 1.8616133394125846e-05, 'epoch': 0.39} {'loss': 0.4831, 'learning_rate': 1.8615962858690647e-05, 'epoch': 0.39} {'loss': 0.6666, 'learning_rate': 1.8615792313529663e-05, 'epoch': 0.39} {'loss': 0.6843, 'learning_rate': 1.8615621758643087e-05, 'epoch': 0.39} {'loss': 0.5167, 'learning_rate': 1.8615451194031115e-05, 'epoch': 0.39} {'loss': 0.6914, 'learning_rate': 1.8615280619693936e-05, 'epoch': 0.39} {'loss': 0.4851, 'learning_rate': 1.8615110035631743e-05, 'epoch': 0.39} {'loss': 0.6413, 'learning_rate': 1.8614939441844732e-05, 'epoch': 0.39} {'loss': 0.6823, 'learning_rate': 1.8614768838333088e-05, 'epoch': 0.39} {'loss': 0.5123, 'learning_rate': 1.8614598225097008e-05, 'epoch': 0.39} {'loss': 0.5014, 'learning_rate': 1.8614427602136687e-05, 'epoch': 0.39} {'loss': 0.5507, 'learning_rate': 1.8614256969452317e-05, 'epoch': 0.39} {'loss': 0.5109, 'learning_rate': 1.8614086327044087e-05, 'epoch': 0.39} {'loss': 0.4872, 'learning_rate': 1.8613915674912192e-05, 'epoch': 0.39} {'loss': 0.7894, 'learning_rate': 1.861374501305682e-05, 'epoch': 0.39} {'loss': 0.3934, 'learning_rate': 1.8613574341478175e-05, 'epoch': 0.39} {'loss': 0.7378, 'learning_rate': 1.8613403660176437e-05, 'epoch': 0.39} {'loss': 0.5576, 'learning_rate': 1.8613232969151806e-05, 'epoch': 0.39} {'loss': 0.5643, 'learning_rate': 1.8613062268404472e-05, 'epoch': 0.39} {'loss': 0.6787, 'learning_rate': 1.8612891557934634e-05, 'epoch': 0.39} {'loss': 0.5969, 'learning_rate': 1.8612720837742473e-05, 'epoch': 0.39} {'loss': 0.4973, 'learning_rate': 1.861255010782819e-05, 'epoch': 0.39} {'loss': 0.6424, 'learning_rate': 1.8612379368191975e-05, 'epoch': 0.39} {'loss': 0.5574, 'learning_rate': 1.861220861883402e-05, 'epoch': 0.39} {'loss': 0.5185, 'learning_rate': 1.8612037859754523e-05, 'epoch': 0.39} {'loss': 0.5843, 'learning_rate': 1.861186709095367e-05, 'epoch': 0.39} {'loss': 0.5925, 'learning_rate': 1.8611696312431656e-05, 'epoch': 0.39} {'loss': 0.5253, 'learning_rate': 1.861152552418868e-05, 'epoch': 0.39} {'loss': 0.616, 'learning_rate': 1.8611354726224924e-05, 'epoch': 0.39} {'loss': 0.5742, 'learning_rate': 1.8611183918540586e-05, 'epoch': 0.39} {'loss': 0.4625, 'learning_rate': 1.8611013101135863e-05, 'epoch': 0.39} {'loss': 0.7351, 'learning_rate': 1.861084227401094e-05, 'epoch': 0.39} {'loss': 0.6327, 'learning_rate': 1.8610671437166015e-05, 'epoch': 0.39} {'loss': 0.5507, 'learning_rate': 1.8610500590601275e-05, 'epoch': 0.39} {'loss': 0.512, 'learning_rate': 1.8610329734316924e-05, 'epoch': 0.39} {'loss': 0.5649, 'learning_rate': 1.8610158868313144e-05, 'epoch': 0.39} {'loss': 0.51, 'learning_rate': 1.8609987992590132e-05, 'epoch': 0.39} {'loss': 0.6807, 'learning_rate': 1.8609817107148085e-05, 'epoch': 0.39} {'loss': 0.7584, 'learning_rate': 1.8609646211987188e-05, 'epoch': 0.39} {'loss': 0.528, 'learning_rate': 1.8609475307107638e-05, 'epoch': 0.39} {'loss': 0.686, 'learning_rate': 1.8609304392509626e-05, 'epoch': 0.39} {'loss': 0.7411, 'learning_rate': 1.860913346819335e-05, 'epoch': 0.39} {'loss': 0.5671, 'learning_rate': 1.8608962534158997e-05, 'epoch': 0.39} {'loss': 0.4845, 'learning_rate': 1.8608791590406765e-05, 'epoch': 0.39} {'loss': 0.5817, 'learning_rate': 1.860862063693684e-05, 'epoch': 0.39} {'loss': 0.5447, 'learning_rate': 1.8608449673749424e-05, 'epoch': 0.39} {'loss': 0.5897, 'learning_rate': 1.86082787008447e-05, 'epoch': 0.39} {'loss': 0.7263, 'learning_rate': 1.860810771822287e-05, 'epoch': 0.39} {'loss': 0.528, 'learning_rate': 1.8607936725884122e-05, 'epoch': 0.39} {'loss': 0.7913, 'learning_rate': 1.8607765723828653e-05, 'epoch': 0.39} {'loss': 0.5682, 'learning_rate': 1.860759471205665e-05, 'epoch': 0.39} {'loss': 0.5145, 'learning_rate': 1.860742369056831e-05, 'epoch': 0.39} {'loss': 0.6296, 'learning_rate': 1.8607252659363825e-05, 'epoch': 0.39} {'loss': 0.5837, 'learning_rate': 1.860708161844339e-05, 'epoch': 0.39} {'loss': 0.629, 'learning_rate': 1.8606910567807195e-05, 'epoch': 0.39} {'loss': 0.4644, 'learning_rate': 1.8606739507455436e-05, 'epoch': 0.39} {'loss': 0.5236, 'learning_rate': 1.8606568437388307e-05, 'epoch': 0.39} {'loss': 0.4336, 'learning_rate': 1.8606397357605994e-05, 'epoch': 0.39} {'loss': 0.5666, 'learning_rate': 1.86062262681087e-05, 'epoch': 0.39} {'loss': 0.6565, 'learning_rate': 1.8606055168896606e-05, 'epoch': 0.39} {'loss': 0.4986, 'learning_rate': 1.860588405996992e-05, 'epoch': 0.39} {'loss': 0.551, 'learning_rate': 1.8605712941328822e-05, 'epoch': 0.39} {'loss': 0.4627, 'learning_rate': 1.8605541812973514e-05, 'epoch': 0.39} {'loss': 0.3983, 'learning_rate': 1.860537067490418e-05, 'epoch': 0.39} {'loss': 0.6387, 'learning_rate': 1.8605199527121027e-05, 'epoch': 0.39} {'loss': 0.4222, 'learning_rate': 1.8605028369624235e-05, 'epoch': 0.39} {'loss': 0.5602, 'learning_rate': 1.8604857202414004e-05, 'epoch': 0.39} {'loss': 0.5776, 'learning_rate': 1.8604686025490525e-05, 'epoch': 0.39} {'loss': 0.5135, 'learning_rate': 1.860451483885399e-05, 'epoch': 0.39} {'loss': 0.6531, 'learning_rate': 1.8604343642504596e-05, 'epoch': 0.39} {'loss': 0.6086, 'learning_rate': 1.8604172436442532e-05, 'epoch': 0.39} {'loss': 0.7028, 'learning_rate': 1.8604001220667996e-05, 'epoch': 0.39} {'loss': 0.671, 'learning_rate': 1.860382999518118e-05, 'epoch': 0.39} {'loss': 0.5852, 'learning_rate': 1.860365875998227e-05, 'epoch': 0.39} {'loss': 0.614, 'learning_rate': 1.8603487515071476e-05, 'epoch': 0.39} {'loss': 0.5621, 'learning_rate': 1.8603316260448973e-05, 'epoch': 0.39} {'loss': 0.6277, 'learning_rate': 1.8603144996114963e-05, 'epoch': 0.39} {'loss': 0.6577, 'learning_rate': 1.860297372206964e-05, 'epoch': 0.39} {'loss': 0.4606, 'learning_rate': 1.860280243831319e-05, 'epoch': 0.39} {'loss': 0.5786, 'learning_rate': 1.8602631144845817e-05, 'epoch': 0.39} {'loss': 0.5513, 'learning_rate': 1.860245984166771e-05, 'epoch': 0.39} {'loss': 0.5991, 'learning_rate': 1.8602288528779054e-05, 'epoch': 0.39} {'loss': 0.4354, 'learning_rate': 1.860211720618006e-05, 'epoch': 0.39} {'loss': 0.5647, 'learning_rate': 1.8601945873870907e-05, 'epoch': 0.39} {'loss': 0.6852, 'learning_rate': 1.8601774531851792e-05, 'epoch': 0.39} {'loss': 0.7228, 'learning_rate': 1.8601603180122908e-05, 'epoch': 0.39} {'loss': 0.6182, 'learning_rate': 1.8601431818684455e-05, 'epoch': 0.39} {'loss': 0.5909, 'learning_rate': 1.860126044753662e-05, 'epoch': 0.39} {'loss': 0.5665, 'learning_rate': 1.8601089066679593e-05, 'epoch': 0.39} {'loss': 0.6168, 'learning_rate': 1.8600917676113574e-05, 'epoch': 0.39} {'loss': 0.5983, 'learning_rate': 1.8600746275838758e-05, 'epoch': 0.39} {'loss': 0.5731, 'learning_rate': 1.8600574865855332e-05, 'epoch': 0.39} {'loss': 0.6524, 'learning_rate': 1.8600403446163492e-05, 'epoch': 0.39} {'loss': 0.5363, 'learning_rate': 1.8600232016763432e-05, 'epoch': 0.39} {'loss': 0.5056, 'learning_rate': 1.8600060577655344e-05, 'epoch': 0.39} {'loss': 0.5855, 'learning_rate': 1.8599889128839428e-05, 'epoch': 0.39} {'loss': 0.5349, 'learning_rate': 1.8599717670315868e-05, 'epoch': 0.39} {'loss': 0.6691, 'learning_rate': 1.8599546202084863e-05, 'epoch': 0.39} {'loss': 0.7369, 'learning_rate': 1.859937472414661e-05, 'epoch': 0.39} {'loss': 0.5565, 'learning_rate': 1.859920323650129e-05, 'epoch': 0.39} {'loss': 0.4597, 'learning_rate': 1.8599031739149113e-05, 'epoch': 0.39} {'loss': 0.5898, 'learning_rate': 1.859886023209026e-05, 'epoch': 0.39} {'loss': 0.5879, 'learning_rate': 1.8598688715324927e-05, 'epoch': 0.39} {'loss': 0.5116, 'learning_rate': 1.8598517188853312e-05, 'epoch': 0.39} {'loss': 0.728, 'learning_rate': 1.8598345652675607e-05, 'epoch': 0.39} {'loss': 0.5459, 'learning_rate': 1.8598174106792003e-05, 'epoch': 0.39} {'loss': 0.536, 'learning_rate': 1.85980025512027e-05, 'epoch': 0.39} {'loss': 0.6428, 'learning_rate': 1.859783098590788e-05, 'epoch': 0.39} {'loss': 0.658, 'learning_rate': 1.8597659410907745e-05, 'epoch': 0.39} {'loss': 0.591, 'learning_rate': 1.8597487826202493e-05, 'epoch': 0.39} {'loss': 0.6384, 'learning_rate': 1.8597316231792307e-05, 'epoch': 0.39} {'loss': 0.6358, 'learning_rate': 1.859714462767739e-05, 'epoch': 0.39} {'loss': 0.5501, 'learning_rate': 1.8596973013857928e-05, 'epoch': 0.39} {'loss': 0.5826, 'learning_rate': 1.859680139033412e-05, 'epoch': 0.39} {'loss': 0.5007, 'learning_rate': 1.8596629757106156e-05, 'epoch': 0.39} {'loss': 0.5831, 'learning_rate': 1.8596458114174236e-05, 'epoch': 0.39} {'loss': 0.5262, 'learning_rate': 1.8596286461538544e-05, 'epoch': 0.39} {'loss': 0.5735, 'learning_rate': 1.8596114799199284e-05, 'epoch': 0.39} {'loss': 0.6116, 'learning_rate': 1.859594312715664e-05, 'epoch': 0.39} {'loss': 0.6379, 'learning_rate': 1.8595771445410818e-05, 'epoch': 0.39} {'loss': 0.5315, 'learning_rate': 1.8595599753962e-05, 'epoch': 0.39} {'loss': 0.5919, 'learning_rate': 1.859542805281038e-05, 'epoch': 0.39} {'loss': 0.6233, 'learning_rate': 1.8595256341956163e-05, 'epoch': 0.39} {'loss': 0.4765, 'learning_rate': 1.8595084621399535e-05, 'epoch': 0.39} {'loss': 0.6417, 'learning_rate': 1.859491289114069e-05, 'epoch': 0.39} {'loss': 0.5895, 'learning_rate': 1.859474115117982e-05, 'epoch': 0.39} {'loss': 0.6995, 'learning_rate': 1.859456940151713e-05, 'epoch': 0.39} {'loss': 0.6803, 'learning_rate': 1.85943976421528e-05, 'epoch': 0.39} {'loss': 0.5367, 'learning_rate': 1.8594225873087027e-05, 'epoch': 0.39} {'loss': 0.6029, 'learning_rate': 1.8594054094320005e-05, 'epoch': 0.39} {'loss': 0.5887, 'learning_rate': 1.8593882305851938e-05, 'epoch': 0.39} {'loss': 0.6071, 'learning_rate': 1.8593710507683005e-05, 'epoch': 0.39} {'loss': 0.546, 'learning_rate': 1.8593538699813415e-05, 'epoch': 0.39} {'loss': 0.5998, 'learning_rate': 1.859336688224335e-05, 'epoch': 0.39} {'loss': 0.3762, 'learning_rate': 1.8593195054973007e-05, 'epoch': 0.39} {'loss': 0.4456, 'learning_rate': 1.859302321800258e-05, 'epoch': 0.39} {'loss': 0.58, 'learning_rate': 1.8592851371332267e-05, 'epoch': 0.39} {'loss': 0.6419, 'learning_rate': 1.8592679514962254e-05, 'epoch': 0.39} {'loss': 0.5416, 'learning_rate': 1.8592507648892745e-05, 'epoch': 0.39} {'loss': 0.5627, 'learning_rate': 1.8592335773123926e-05, 'epoch': 0.39} {'loss': 0.5542, 'learning_rate': 1.8592163887655994e-05, 'epoch': 0.39} {'loss': 0.7101, 'learning_rate': 1.859199199248914e-05, 'epoch': 0.39} {'loss': 0.6387, 'learning_rate': 1.8591820087623568e-05, 'epoch': 0.39} {'loss': 0.4572, 'learning_rate': 1.859164817305946e-05, 'epoch': 0.39} {'loss': 0.6371, 'learning_rate': 1.8591476248797017e-05, 'epoch': 0.39} {'loss': 0.345, 'learning_rate': 1.859130431483643e-05, 'epoch': 0.39} {'loss': 0.5158, 'learning_rate': 1.8591132371177894e-05, 'epoch': 0.39} {'loss': 0.5079, 'learning_rate': 1.8590960417821603e-05, 'epoch': 0.39} {'loss': 0.7211, 'learning_rate': 1.8590788454767753e-05, 'epoch': 0.39} {'loss': 0.6591, 'learning_rate': 1.8590616482016535e-05, 'epoch': 0.39} {'loss': 0.5969, 'learning_rate': 1.8590444499568144e-05, 'epoch': 0.39} {'loss': 0.6766, 'learning_rate': 1.8590272507422775e-05, 'epoch': 0.39} {'loss': 0.6353, 'learning_rate': 1.8590100505580624e-05, 'epoch': 0.39} {'loss': 0.4713, 'learning_rate': 1.858992849404188e-05, 'epoch': 0.39} {'loss': 0.6248, 'learning_rate': 1.8589756472806743e-05, 'epoch': 0.39} {'loss': 0.569, 'learning_rate': 1.85895844418754e-05, 'epoch': 0.39} {'loss': 0.5433, 'learning_rate': 1.8589412401248053e-05, 'epoch': 0.39} {'loss': 0.4988, 'learning_rate': 1.8589240350924894e-05, 'epoch': 0.39} {'loss': 0.633, 'learning_rate': 1.8589068290906114e-05, 'epoch': 0.39} {'loss': 0.6692, 'learning_rate': 1.858889622119191e-05, 'epoch': 0.39} {'loss': 0.6418, 'learning_rate': 1.8588724141782473e-05, 'epoch': 0.39} {'loss': 0.4133, 'learning_rate': 1.8588552052678004e-05, 'epoch': 0.39} {'loss': 0.6543, 'learning_rate': 1.8588379953878692e-05, 'epoch': 0.39} {'loss': 0.7356, 'learning_rate': 1.8588207845384728e-05, 'epoch': 0.39} {'loss': 0.5414, 'learning_rate': 1.8588035727196313e-05, 'epoch': 0.39} {'loss': 0.6201, 'learning_rate': 1.858786359931364e-05, 'epoch': 0.39} {'loss': 0.6384, 'learning_rate': 1.8587691461736898e-05, 'epoch': 0.39} {'loss': 0.5195, 'learning_rate': 1.858751931446629e-05, 'epoch': 0.39} {'loss': 0.4865, 'learning_rate': 1.8587347157502e-05, 'epoch': 0.39} {'loss': 0.6039, 'learning_rate': 1.8587174990844237e-05, 'epoch': 0.39} {'loss': 0.449, 'learning_rate': 1.858700281449318e-05, 'epoch': 0.39} {'loss': 0.6583, 'learning_rate': 1.858683062844903e-05, 'epoch': 0.39} {'loss': 0.6281, 'learning_rate': 1.8586658432711983e-05, 'epoch': 0.39} {'loss': 0.6832, 'learning_rate': 1.858648622728223e-05, 'epoch': 0.39} {'loss': 0.5209, 'learning_rate': 1.8586314012159968e-05, 'epoch': 0.39} {'loss': 0.4932, 'learning_rate': 1.858614178734539e-05, 'epoch': 0.39} {'loss': 0.5068, 'learning_rate': 1.858596955283869e-05, 'epoch': 0.39} {'loss': 0.5006, 'learning_rate': 1.8585797308640062e-05, 'epoch': 0.39} {'loss': 0.7152, 'learning_rate': 1.8585625054749705e-05, 'epoch': 0.39} {'loss': 0.7189, 'learning_rate': 1.8585452791167806e-05, 'epoch': 0.39} {'loss': 0.5917, 'learning_rate': 1.8585280517894567e-05, 'epoch': 0.39} {'loss': 0.5749, 'learning_rate': 1.8585108234930176e-05, 'epoch': 0.39} {'loss': 0.4545, 'learning_rate': 1.858493594227483e-05, 'epoch': 0.39} {'loss': 0.6576, 'learning_rate': 1.8584763639928724e-05, 'epoch': 0.39} {'loss': 0.5968, 'learning_rate': 1.8584591327892055e-05, 'epoch': 0.39} {'loss': 0.6325, 'learning_rate': 1.8584419006165014e-05, 'epoch': 0.39} {'loss': 0.5924, 'learning_rate': 1.8584246674747794e-05, 'epoch': 0.39} {'loss': 0.5106, 'learning_rate': 1.8584074333640595e-05, 'epoch': 0.39} {'loss': 0.5835, 'learning_rate': 1.8583901982843607e-05, 'epoch': 0.39} {'loss': 0.6246, 'learning_rate': 1.8583729622357027e-05, 'epoch': 0.39} {'loss': 0.5064, 'learning_rate': 1.858355725218105e-05, 'epoch': 0.39} {'loss': 0.6796, 'learning_rate': 1.8583384872315863e-05, 'epoch': 0.39} {'loss': 0.468, 'learning_rate': 1.858321248276167e-05, 'epoch': 0.39} {'loss': 0.5029, 'learning_rate': 1.8583040083518666e-05, 'epoch': 0.39} {'loss': 0.5147, 'learning_rate': 1.8582867674587035e-05, 'epoch': 0.39} {'loss': 0.6045, 'learning_rate': 1.8582695255966984e-05, 'epoch': 0.39} {'loss': 0.6269, 'learning_rate': 1.85825228276587e-05, 'epoch': 0.39} {'loss': 0.6544, 'learning_rate': 1.858235038966238e-05, 'epoch': 0.39} {'loss': 0.5324, 'learning_rate': 1.8582177941978216e-05, 'epoch': 0.39} {'loss': 0.558, 'learning_rate': 1.8582005484606407e-05, 'epoch': 0.39} {'loss': 0.6335, 'learning_rate': 1.8581833017547147e-05, 'epoch': 0.39} {'loss': 0.7068, 'learning_rate': 1.858166054080063e-05, 'epoch': 0.39} {'loss': 0.6207, 'learning_rate': 1.8581488054367046e-05, 'epoch': 0.39} {'loss': 0.6582, 'learning_rate': 1.8581315558246597e-05, 'epoch': 0.39} {'loss': 0.4807, 'learning_rate': 1.8581143052439473e-05, 'epoch': 0.39} {'loss': 0.6937, 'learning_rate': 1.8580970536945873e-05, 'epoch': 0.39} {'loss': 0.6224, 'learning_rate': 1.8580798011765987e-05, 'epoch': 0.39} {'loss': 0.4745, 'learning_rate': 1.858062547690001e-05, 'epoch': 0.39} {'loss': 0.572, 'learning_rate': 1.8580452932348143e-05, 'epoch': 0.39} {'loss': 0.6244, 'learning_rate': 1.8580280378110572e-05, 'epoch': 0.39} {'loss': 0.7372, 'learning_rate': 1.85801078141875e-05, 'epoch': 0.39} {'loss': 0.4724, 'learning_rate': 1.8579935240579116e-05, 'epoch': 0.39} {'loss': 0.5203, 'learning_rate': 1.8579762657285614e-05, 'epoch': 0.39} {'loss': 0.5193, 'learning_rate': 1.8579590064307195e-05, 'epoch': 0.39} {'loss': 0.6429, 'learning_rate': 1.857941746164405e-05, 'epoch': 0.39} {'loss': 0.5687, 'learning_rate': 1.8579244849296372e-05, 'epoch': 0.4} {'loss': 0.6518, 'learning_rate': 1.857907222726436e-05, 'epoch': 0.4} {'loss': 0.5604, 'learning_rate': 1.8578899595548208e-05, 'epoch': 0.4} {'loss': 0.7014, 'learning_rate': 1.8578726954148107e-05, 'epoch': 0.4} {'loss': 0.5651, 'learning_rate': 1.8578554303064254e-05, 'epoch': 0.4} {'loss': 0.4582, 'learning_rate': 1.8578381642296847e-05, 'epoch': 0.4} {'loss': 0.6279, 'learning_rate': 1.8578208971846077e-05, 'epoch': 0.4} {'loss': 0.574, 'learning_rate': 1.857803629171214e-05, 'epoch': 0.4} {'loss': 0.5861, 'learning_rate': 1.8577863601895232e-05, 'epoch': 0.4} {'loss': 0.5056, 'learning_rate': 1.857769090239555e-05, 'epoch': 0.4} {'loss': 0.6723, 'learning_rate': 1.8577518193213283e-05, 'epoch': 0.4} {'loss': 0.4343, 'learning_rate': 1.8577345474348627e-05, 'epoch': 0.4} {'loss': 0.3618, 'learning_rate': 1.8577172745801782e-05, 'epoch': 0.4} {'loss': 0.7462, 'learning_rate': 1.8577000007572937e-05, 'epoch': 0.4} {'loss': 0.6175, 'learning_rate': 1.8576827259662292e-05, 'epoch': 0.4} {'loss': 0.6769, 'learning_rate': 1.857665450207004e-05, 'epoch': 0.4} {'loss': 0.6293, 'learning_rate': 1.8576481734796378e-05, 'epoch': 0.4} {'loss': 0.5147, 'learning_rate': 1.8576308957841495e-05, 'epoch': 0.4} {'loss': 0.588, 'learning_rate': 1.8576136171205594e-05, 'epoch': 0.4} {'loss': 0.4862, 'learning_rate': 1.8575963374888863e-05, 'epoch': 0.4} {'loss': 0.5463, 'learning_rate': 1.8575790568891504e-05, 'epoch': 0.4} {'loss': 0.6761, 'learning_rate': 1.8575617753213703e-05, 'epoch': 0.4} {'loss': 0.7753, 'learning_rate': 1.8575444927855664e-05, 'epoch': 0.4} {'loss': 0.5843, 'learning_rate': 1.8575272092817577e-05, 'epoch': 0.4} {'loss': 0.4215, 'learning_rate': 1.8575099248099638e-05, 'epoch': 0.4} {'loss': 0.6767, 'learning_rate': 1.8574926393702047e-05, 'epoch': 0.4} {'loss': 0.7182, 'learning_rate': 1.857475352962499e-05, 'epoch': 0.4} {'loss': 0.56, 'learning_rate': 1.8574580655868665e-05, 'epoch': 0.4} {'loss': 0.6549, 'learning_rate': 1.8574407772433274e-05, 'epoch': 0.4} {'loss': 0.6685, 'learning_rate': 1.8574234879319003e-05, 'epoch': 0.4} {'loss': 0.6957, 'learning_rate': 1.8574061976526056e-05, 'epoch': 0.4} {'loss': 0.5501, 'learning_rate': 1.857388906405462e-05, 'epoch': 0.4} {'loss': 0.6584, 'learning_rate': 1.8573716141904895e-05, 'epoch': 0.4} {'loss': 0.5252, 'learning_rate': 1.857354321007707e-05, 'epoch': 0.4} {'loss': 0.5264, 'learning_rate': 1.857337026857135e-05, 'epoch': 0.4} {'loss': 0.7041, 'learning_rate': 1.8573197317387926e-05, 'epoch': 0.4} {'loss': 0.5271, 'learning_rate': 1.857302435652699e-05, 'epoch': 0.4} {'loss': 0.5665, 'learning_rate': 1.8572851385988742e-05, 'epoch': 0.4} {'loss': 0.5424, 'learning_rate': 1.8572678405773375e-05, 'epoch': 0.4} {'loss': 0.6632, 'learning_rate': 1.8572505415881084e-05, 'epoch': 0.4} {'loss': 0.5381, 'learning_rate': 1.857233241631206e-05, 'epoch': 0.4} {'loss': 0.6048, 'learning_rate': 1.8572159407066507e-05, 'epoch': 0.4} {'loss': 0.5524, 'learning_rate': 1.8571986388144618e-05, 'epoch': 0.4} {'loss': 0.4374, 'learning_rate': 1.8571813359546583e-05, 'epoch': 0.4} {'loss': 0.5722, 'learning_rate': 1.85716403212726e-05, 'epoch': 0.4} {'loss': 0.5936, 'learning_rate': 1.8571467273322868e-05, 'epoch': 0.4} {'loss': 0.3952, 'learning_rate': 1.8571294215697577e-05, 'epoch': 0.4} {'loss': 0.3805, 'learning_rate': 1.8571121148396923e-05, 'epoch': 0.4} {'loss': 0.6419, 'learning_rate': 1.857094807142111e-05, 'epoch': 0.4} {'loss': 0.6433, 'learning_rate': 1.857077498477032e-05, 'epoch': 0.4} {'loss': 0.6363, 'learning_rate': 1.8570601888444758e-05, 'epoch': 0.4} {'loss': 0.6782, 'learning_rate': 1.8570428782444616e-05, 'epoch': 0.4} {'loss': 0.5862, 'learning_rate': 1.8570255666770087e-05, 'epoch': 0.4} {'loss': 0.5785, 'learning_rate': 1.8570082541421374e-05, 'epoch': 0.4} {'loss': 0.3494, 'learning_rate': 1.8569909406398664e-05, 'epoch': 0.4} {'loss': 0.6914, 'learning_rate': 1.8569736261702157e-05, 'epoch': 0.4} {'loss': 0.6279, 'learning_rate': 1.8569563107332046e-05, 'epoch': 0.4} {'loss': 0.4054, 'learning_rate': 1.8569389943288527e-05, 'epoch': 0.4} {'loss': 0.6637, 'learning_rate': 1.85692167695718e-05, 'epoch': 0.4} {'loss': 0.6535, 'learning_rate': 1.8569043586182055e-05, 'epoch': 0.4} {'loss': 0.7434, 'learning_rate': 1.856887039311949e-05, 'epoch': 0.4} {'loss': 0.6495, 'learning_rate': 1.8568697190384295e-05, 'epoch': 0.4} {'loss': 0.5666, 'learning_rate': 1.8568523977976675e-05, 'epoch': 0.4} {'loss': 0.5894, 'learning_rate': 1.856835075589682e-05, 'epoch': 0.4} {'loss': 0.5482, 'learning_rate': 1.8568177524144926e-05, 'epoch': 0.4} {'loss': 0.6028, 'learning_rate': 1.856800428272119e-05, 'epoch': 0.4} {'loss': 0.6805, 'learning_rate': 1.8567831031625805e-05, 'epoch': 0.4} {'loss': 0.438, 'learning_rate': 1.856765777085897e-05, 'epoch': 0.4} {'loss': 0.5296, 'learning_rate': 1.8567484500420876e-05, 'epoch': 0.4} {'loss': 0.4793, 'learning_rate': 1.8567311220311722e-05, 'epoch': 0.4} {'loss': 0.7243, 'learning_rate': 1.8567137930531705e-05, 'epoch': 0.4} {'loss': 0.4486, 'learning_rate': 1.8566964631081018e-05, 'epoch': 0.4} {'loss': 0.7317, 'learning_rate': 1.856679132195985e-05, 'epoch': 0.4} {'loss': 0.6581, 'learning_rate': 1.8566618003168413e-05, 'epoch': 0.4} {'loss': 0.6566, 'learning_rate': 1.856644467470689e-05, 'epoch': 0.4} {'loss': 0.6026, 'learning_rate': 1.856627133657548e-05, 'epoch': 0.4} {'loss': 0.5554, 'learning_rate': 1.8566097988774374e-05, 'epoch': 0.4} {'loss': 0.5591, 'learning_rate': 1.8565924631303776e-05, 'epoch': 0.4} {'loss': 0.6314, 'learning_rate': 1.856575126416388e-05, 'epoch': 0.4} {'loss': 0.4793, 'learning_rate': 1.8565577887354878e-05, 'epoch': 0.4} {'loss': 0.5545, 'learning_rate': 1.856540450087697e-05, 'epoch': 0.4} {'loss': 0.5754, 'learning_rate': 1.8565231104730346e-05, 'epoch': 0.4} {'loss': 0.6479, 'learning_rate': 1.8565057698915205e-05, 'epoch': 0.4} {'loss': 0.6931, 'learning_rate': 1.856488428343174e-05, 'epoch': 0.4} {'loss': 0.6483, 'learning_rate': 1.8564710858280155e-05, 'epoch': 0.4} {'loss': 0.4197, 'learning_rate': 1.8564537423460637e-05, 'epoch': 0.4} {'loss': 0.4923, 'learning_rate': 1.8564363978973382e-05, 'epoch': 0.4} {'loss': 0.5869, 'learning_rate': 1.8564190524818592e-05, 'epoch': 0.4} {'loss': 0.5585, 'learning_rate': 1.856401706099646e-05, 'epoch': 0.4} {'loss': 0.6659, 'learning_rate': 1.8563843587507183e-05, 'epoch': 0.4} {'loss': 0.5467, 'learning_rate': 1.8563670104350953e-05, 'epoch': 0.4} {'loss': 0.6391, 'learning_rate': 1.8563496611527964e-05, 'epoch': 0.4} {'loss': 0.7574, 'learning_rate': 1.856332310903842e-05, 'epoch': 0.4} {'loss': 0.5661, 'learning_rate': 1.856314959688251e-05, 'epoch': 0.4} {'loss': 0.5729, 'learning_rate': 1.8562976075060437e-05, 'epoch': 0.4} {'loss': 0.6115, 'learning_rate': 1.856280254357239e-05, 'epoch': 0.4} {'loss': 0.7066, 'learning_rate': 1.8562629002418567e-05, 'epoch': 0.4} {'loss': 0.6266, 'learning_rate': 1.8562455451599164e-05, 'epoch': 0.4} {'loss': 0.7077, 'learning_rate': 1.8562281891114376e-05, 'epoch': 0.4} {'loss': 0.6857, 'learning_rate': 1.8562108320964404e-05, 'epoch': 0.4} {'loss': 0.6584, 'learning_rate': 1.8561934741149437e-05, 'epoch': 0.4} {'loss': 0.6455, 'learning_rate': 1.856176115166967e-05, 'epoch': 0.4} {'loss': 0.5628, 'learning_rate': 1.8561587552525307e-05, 'epoch': 0.4} {'loss': 0.4868, 'learning_rate': 1.856141394371654e-05, 'epoch': 0.4} {'loss': 0.6802, 'learning_rate': 1.8561240325243566e-05, 'epoch': 0.4} {'loss': 0.6259, 'learning_rate': 1.8561066697106575e-05, 'epoch': 0.4} {'loss': 0.5468, 'learning_rate': 1.8560893059305772e-05, 'epoch': 0.4} {'loss': 0.635, 'learning_rate': 1.8560719411841346e-05, 'epoch': 0.4} {'loss': 0.6184, 'learning_rate': 1.8560545754713498e-05, 'epoch': 0.4} {'loss': 0.4742, 'learning_rate': 1.856037208792242e-05, 'epoch': 0.4} {'loss': 0.5877, 'learning_rate': 1.8560198411468308e-05, 'epoch': 0.4} {'loss': 0.5047, 'learning_rate': 1.8560024725351363e-05, 'epoch': 0.4} {'loss': 0.5787, 'learning_rate': 1.8559851029571774e-05, 'epoch': 0.4} {'loss': 0.6245, 'learning_rate': 1.8559677324129746e-05, 'epoch': 0.4} {'loss': 0.6396, 'learning_rate': 1.8559503609025467e-05, 'epoch': 0.4} {'loss': 0.4652, 'learning_rate': 1.8559329884259137e-05, 'epoch': 0.4} {'loss': 0.4145, 'learning_rate': 1.855915614983095e-05, 'epoch': 0.4} {'loss': 0.503, 'learning_rate': 1.8558982405741105e-05, 'epoch': 0.4} {'loss': 0.5377, 'learning_rate': 1.8558808651989792e-05, 'epoch': 0.4} {'loss': 0.4676, 'learning_rate': 1.8558634888577218e-05, 'epoch': 0.4} {'loss': 0.5985, 'learning_rate': 1.8558461115503566e-05, 'epoch': 0.4} {'loss': 0.6078, 'learning_rate': 1.8558287332769046e-05, 'epoch': 0.4} {'loss': 0.546, 'learning_rate': 1.8558113540373844e-05, 'epoch': 0.4} {'loss': 0.5792, 'learning_rate': 1.855793973831816e-05, 'epoch': 0.4} {'loss': 0.635, 'learning_rate': 1.8557765926602184e-05, 'epoch': 0.4} {'loss': 0.625, 'learning_rate': 1.8557592105226122e-05, 'epoch': 0.4} {'loss': 0.6975, 'learning_rate': 1.8557418274190168e-05, 'epoch': 0.4} {'loss': 0.7662, 'learning_rate': 1.8557244433494514e-05, 'epoch': 0.4} {'loss': 0.6076, 'learning_rate': 1.855707058313936e-05, 'epoch': 0.4} {'loss': 0.7064, 'learning_rate': 1.8556896723124896e-05, 'epoch': 0.4} {'loss': 0.7436, 'learning_rate': 1.8556722853451324e-05, 'epoch': 0.4} {'loss': 0.5015, 'learning_rate': 1.8556548974118842e-05, 'epoch': 0.4} {'loss': 0.4758, 'learning_rate': 1.8556375085127644e-05, 'epoch': 0.4} {'loss': 0.6786, 'learning_rate': 1.855620118647792e-05, 'epoch': 0.4} {'loss': 0.6905, 'learning_rate': 1.8556027278169876e-05, 'epoch': 0.4} {'loss': 0.5758, 'learning_rate': 1.8555853360203703e-05, 'epoch': 0.4} {'loss': 0.6328, 'learning_rate': 1.85556794325796e-05, 'epoch': 0.4} {'loss': 0.712, 'learning_rate': 1.855550549529776e-05, 'epoch': 0.4} {'loss': 0.5975, 'learning_rate': 1.8555331548358383e-05, 'epoch': 0.4} {'loss': 0.5645, 'learning_rate': 1.855515759176166e-05, 'epoch': 0.4} {'loss': 0.5489, 'learning_rate': 1.8554983625507795e-05, 'epoch': 0.4} {'loss': 0.7393, 'learning_rate': 1.8554809649596976e-05, 'epoch': 0.4} {'loss': 0.5468, 'learning_rate': 1.8554635664029408e-05, 'epoch': 0.4} {'loss': 0.6667, 'learning_rate': 1.8554461668805282e-05, 'epoch': 0.4} {'loss': 0.6777, 'learning_rate': 1.8554287663924794e-05, 'epoch': 0.4} {'loss': 0.6487, 'learning_rate': 1.8554113649388144e-05, 'epoch': 0.4} {'loss': 0.6613, 'learning_rate': 1.8553939625195525e-05, 'epoch': 0.4} {'loss': 0.501, 'learning_rate': 1.8553765591347134e-05, 'epoch': 0.4} {'loss': 0.4562, 'learning_rate': 1.855359154784317e-05, 'epoch': 0.4} {'loss': 0.6265, 'learning_rate': 1.8553417494683827e-05, 'epoch': 0.4} {'loss': 0.627, 'learning_rate': 1.85532434318693e-05, 'epoch': 0.4} {'loss': 0.7123, 'learning_rate': 1.8553069359399792e-05, 'epoch': 0.4} {'loss': 0.6486, 'learning_rate': 1.8552895277275493e-05, 'epoch': 0.4} {'loss': 0.59, 'learning_rate': 1.85527211854966e-05, 'epoch': 0.4} {'loss': 0.5159, 'learning_rate': 1.855254708406331e-05, 'epoch': 0.4} {'loss': 0.5338, 'learning_rate': 1.8552372972975825e-05, 'epoch': 0.4} {'loss': 0.6179, 'learning_rate': 1.855219885223434e-05, 'epoch': 0.4} {'loss': 0.6517, 'learning_rate': 1.855202472183904e-05, 'epoch': 0.4} {'loss': 0.5539, 'learning_rate': 1.8551850581790134e-05, 'epoch': 0.4} {'loss': 0.4875, 'learning_rate': 1.855167643208782e-05, 'epoch': 0.4} {'loss': 0.6634, 'learning_rate': 1.855150227273228e-05, 'epoch': 0.4} {'loss': 0.5427, 'learning_rate': 1.8551328103723728e-05, 'epoch': 0.4} {'loss': 0.5464, 'learning_rate': 1.855115392506235e-05, 'epoch': 0.4} {'loss': 0.5978, 'learning_rate': 1.8550979736748344e-05, 'epoch': 0.4} {'loss': 0.6109, 'learning_rate': 1.855080553878191e-05, 'epoch': 0.4} {'loss': 0.7265, 'learning_rate': 1.8550631331163238e-05, 'epoch': 0.4} {'loss': 0.7108, 'learning_rate': 1.8550457113892535e-05, 'epoch': 0.4} {'loss': 0.6848, 'learning_rate': 1.8550282886969987e-05, 'epoch': 0.4} {'loss': 0.5918, 'learning_rate': 1.85501086503958e-05, 'epoch': 0.4} {'loss': 0.7333, 'learning_rate': 1.8549934404170163e-05, 'epoch': 0.4} {'loss': 0.7489, 'learning_rate': 1.8549760148293277e-05, 'epoch': 0.4} {'loss': 0.5641, 'learning_rate': 1.854958588276534e-05, 'epoch': 0.4} {'loss': 0.5855, 'learning_rate': 1.8549411607586544e-05, 'epoch': 0.4} {'loss': 0.4914, 'learning_rate': 1.8549237322757086e-05, 'epoch': 0.4} {'loss': 0.6331, 'learning_rate': 1.854906302827717e-05, 'epoch': 0.4} {'loss': 0.6194, 'learning_rate': 1.8548888724146985e-05, 'epoch': 0.4} {'loss': 0.4484, 'learning_rate': 1.8548714410366727e-05, 'epoch': 0.4} {'loss': 0.6444, 'learning_rate': 1.85485400869366e-05, 'epoch': 0.4} {'loss': 0.6173, 'learning_rate': 1.8548365753856793e-05, 'epoch': 0.4} {'loss': 0.535, 'learning_rate': 1.854819141112751e-05, 'epoch': 0.4} {'loss': 0.4605, 'learning_rate': 1.8548017058748944e-05, 'epoch': 0.4} {'loss': 0.6018, 'learning_rate': 1.8547842696721293e-05, 'epoch': 0.4} {'loss': 0.6787, 'learning_rate': 1.854766832504475e-05, 'epoch': 0.4} {'loss': 0.6959, 'learning_rate': 1.8547493943719518e-05, 'epoch': 0.4} {'loss': 0.679, 'learning_rate': 1.854731955274579e-05, 'epoch': 0.4} {'loss': 0.474, 'learning_rate': 1.8547145152123764e-05, 'epoch': 0.4} {'loss': 0.5269, 'learning_rate': 1.8546970741853632e-05, 'epoch': 0.4} {'loss': 0.6112, 'learning_rate': 1.85467963219356e-05, 'epoch': 0.4} {'loss': 0.5044, 'learning_rate': 1.854662189236986e-05, 'epoch': 0.4} {'loss': 0.6224, 'learning_rate': 1.8546447453156607e-05, 'epoch': 0.4} {'loss': 0.569, 'learning_rate': 1.854627300429604e-05, 'epoch': 0.4} {'loss': 0.4836, 'learning_rate': 1.854609854578836e-05, 'epoch': 0.4} {'loss': 0.4739, 'learning_rate': 1.8545924077633755e-05, 'epoch': 0.4} {'loss': 0.626, 'learning_rate': 1.8545749599832428e-05, 'epoch': 0.4} {'loss': 0.6536, 'learning_rate': 1.8545575112384578e-05, 'epoch': 0.4} {'loss': 0.5889, 'learning_rate': 1.8545400615290395e-05, 'epoch': 0.4} {'loss': 0.603, 'learning_rate': 1.8545226108550082e-05, 'epoch': 0.4} {'loss': 0.5224, 'learning_rate': 1.854505159216383e-05, 'epoch': 0.4} {'loss': 0.6442, 'learning_rate': 1.8544877066131843e-05, 'epoch': 0.4} {'loss': 0.5478, 'learning_rate': 1.8544702530454316e-05, 'epoch': 0.4} {'loss': 0.6105, 'learning_rate': 1.854452798513144e-05, 'epoch': 0.4} {'loss': 0.3168, 'learning_rate': 1.854435343016342e-05, 'epoch': 0.4} {'loss': 0.5985, 'learning_rate': 1.8544178865550447e-05, 'epoch': 0.4} {'loss': 0.6844, 'learning_rate': 1.8544004291292725e-05, 'epoch': 0.4} {'loss': 0.7881, 'learning_rate': 1.8543829707390445e-05, 'epoch': 0.4} {'loss': 0.627, 'learning_rate': 1.8543655113843803e-05, 'epoch': 0.4} {'loss': 0.556, 'learning_rate': 1.8543480510653004e-05, 'epoch': 0.4} {'loss': 0.6703, 'learning_rate': 1.8543305897818237e-05, 'epoch': 0.4} {'loss': 0.5524, 'learning_rate': 1.8543131275339705e-05, 'epoch': 0.4} {'loss': 0.6574, 'learning_rate': 1.8542956643217597e-05, 'epoch': 0.4} {'loss': 0.6332, 'learning_rate': 1.8542782001452118e-05, 'epoch': 0.4} {'loss': 0.4075, 'learning_rate': 1.8542607350043464e-05, 'epoch': 0.4} {'loss': 0.4124, 'learning_rate': 1.854243268899183e-05, 'epoch': 0.4} {'loss': 0.6294, 'learning_rate': 1.8542258018297418e-05, 'epoch': 0.4} {'loss': 0.5039, 'learning_rate': 1.8542083337960413e-05, 'epoch': 0.4} {'loss': 0.5787, 'learning_rate': 1.8541908647981026e-05, 'epoch': 0.4} {'loss': 0.6408, 'learning_rate': 1.854173394835945e-05, 'epoch': 0.4} {'loss': 0.6267, 'learning_rate': 1.8541559239095873e-05, 'epoch': 0.4} {'loss': 0.6789, 'learning_rate': 1.8541384520190507e-05, 'epoch': 0.4} {'loss': 0.5658, 'learning_rate': 1.8541209791643538e-05, 'epoch': 0.4} {'loss': 0.6473, 'learning_rate': 1.854103505345517e-05, 'epoch': 0.4} {'loss': 0.4897, 'learning_rate': 1.8540860305625596e-05, 'epoch': 0.4} {'loss': 0.463, 'learning_rate': 1.8540685548155016e-05, 'epoch': 0.4} {'loss': 0.6927, 'learning_rate': 1.8540510781043623e-05, 'epoch': 0.4} {'loss': 0.5231, 'learning_rate': 1.8540336004291622e-05, 'epoch': 0.4} {'loss': 0.6157, 'learning_rate': 1.85401612178992e-05, 'epoch': 0.4} {'loss': 0.5565, 'learning_rate': 1.8539986421866566e-05, 'epoch': 0.4} {'loss': 0.4662, 'learning_rate': 1.853981161619391e-05, 'epoch': 0.4} {'loss': 0.6759, 'learning_rate': 1.853963680088143e-05, 'epoch': 0.4} {'loss': 0.5214, 'learning_rate': 1.853946197592932e-05, 'epoch': 0.4} {'loss': 0.5345, 'learning_rate': 1.8539287141337786e-05, 'epoch': 0.4} {'loss': 0.5387, 'learning_rate': 1.8539112297107018e-05, 'epoch': 0.4} {'loss': 0.5486, 'learning_rate': 1.8538937443237218e-05, 'epoch': 0.4} {'loss': 0.3929, 'learning_rate': 1.853876257972858e-05, 'epoch': 0.4} {'loss': 0.6364, 'learning_rate': 1.8538587706581305e-05, 'epoch': 0.4} {'loss': 0.5746, 'learning_rate': 1.8538412823795586e-05, 'epoch': 0.4} {'loss': 0.5116, 'learning_rate': 1.853823793137162e-05, 'epoch': 0.4} {'loss': 0.6287, 'learning_rate': 1.8538063029309613e-05, 'epoch': 0.4} {'loss': 0.5967, 'learning_rate': 1.8537888117609754e-05, 'epoch': 0.4} {'loss': 0.5191, 'learning_rate': 1.853771319627224e-05, 'epoch': 0.4} {'loss': 0.4557, 'learning_rate': 1.8537538265297276e-05, 'epoch': 0.4} {'loss': 0.6644, 'learning_rate': 1.853736332468505e-05, 'epoch': 0.4} {'loss': 0.5671, 'learning_rate': 1.8537188374435766e-05, 'epoch': 0.4} {'loss': 0.5851, 'learning_rate': 1.853701341454962e-05, 'epoch': 0.4} {'loss': 0.6678, 'learning_rate': 1.8536838445026813e-05, 'epoch': 0.4} {'loss': 0.587, 'learning_rate': 1.8536663465867535e-05, 'epoch': 0.4} {'loss': 0.7401, 'learning_rate': 1.8536488477071987e-05, 'epoch': 0.4} {'loss': 0.431, 'learning_rate': 1.8536313478640368e-05, 'epoch': 0.4} {'loss': 0.6578, 'learning_rate': 1.853613847057287e-05, 'epoch': 0.4} {'loss': 0.5285, 'learning_rate': 1.8535963452869705e-05, 'epoch': 0.4} {'loss': 0.4547, 'learning_rate': 1.853578842553105e-05, 'epoch': 0.4} {'loss': 0.4724, 'learning_rate': 1.8535613388557118e-05, 'epoch': 0.4} {'loss': 0.7566, 'learning_rate': 1.85354383419481e-05, 'epoch': 0.4} {'loss': 0.5703, 'learning_rate': 1.8535263285704197e-05, 'epoch': 0.4} {'loss': 0.5336, 'learning_rate': 1.8535088219825604e-05, 'epoch': 0.4} {'loss': 0.6023, 'learning_rate': 1.853491314431252e-05, 'epoch': 0.4} {'loss': 0.5497, 'learning_rate': 1.853473805916514e-05, 'epoch': 0.4} {'loss': 0.5262, 'learning_rate': 1.8534562964383663e-05, 'epoch': 0.4} {'loss': 0.5885, 'learning_rate': 1.8534387859968293e-05, 'epoch': 0.4} {'loss': 0.4922, 'learning_rate': 1.8534212745919218e-05, 'epoch': 0.4} {'loss': 0.6062, 'learning_rate': 1.8534037622236638e-05, 'epoch': 0.4} {'loss': 0.7643, 'learning_rate': 1.8533862488920754e-05, 'epoch': 0.4} {'loss': 0.5608, 'learning_rate': 1.8533687345971762e-05, 'epoch': 0.4} {'loss': 0.6336, 'learning_rate': 1.853351219338986e-05, 'epoch': 0.4} {'loss': 0.4407, 'learning_rate': 1.8533337031175246e-05, 'epoch': 0.4} {'loss': 0.4862, 'learning_rate': 1.8533161859328116e-05, 'epoch': 0.4} {'loss': 0.4755, 'learning_rate': 1.8532986677848672e-05, 'epoch': 0.4} {'loss': 0.6761, 'learning_rate': 1.8532811486737102e-05, 'epoch': 0.4} {'loss': 0.6406, 'learning_rate': 1.853263628599362e-05, 'epoch': 0.4} {'loss': 0.5184, 'learning_rate': 1.8532461075618408e-05, 'epoch': 0.4} {'loss': 0.5439, 'learning_rate': 1.8532285855611668e-05, 'epoch': 0.4} {'loss': 0.4958, 'learning_rate': 1.8532110625973603e-05, 'epoch': 0.4} {'loss': 0.6697, 'learning_rate': 1.853193538670441e-05, 'epoch': 0.4} {'loss': 0.5551, 'learning_rate': 1.853176013780428e-05, 'epoch': 0.4} {'loss': 0.4751, 'learning_rate': 1.8531584879273417e-05, 'epoch': 0.4} {'loss': 0.6887, 'learning_rate': 1.8531409611112016e-05, 'epoch': 0.4} {'loss': 0.7673, 'learning_rate': 1.8531234333320278e-05, 'epoch': 0.4} {'loss': 0.7025, 'learning_rate': 1.8531059045898395e-05, 'epoch': 0.4} {'loss': 0.6504, 'learning_rate': 1.8530883748846575e-05, 'epoch': 0.4} {'loss': 0.3834, 'learning_rate': 1.8530708442165002e-05, 'epoch': 0.4} {'loss': 0.5582, 'learning_rate': 1.8530533125853885e-05, 'epoch': 0.4} {'loss': 0.5423, 'learning_rate': 1.853035779991342e-05, 'epoch': 0.4} {'loss': 0.5632, 'learning_rate': 1.85301824643438e-05, 'epoch': 0.4} {'loss': 0.5164, 'learning_rate': 1.853000711914523e-05, 'epoch': 0.4} {'loss': 0.634, 'learning_rate': 1.8529831764317898e-05, 'epoch': 0.4} {'loss': 0.5816, 'learning_rate': 1.8529656399862014e-05, 'epoch': 0.4} {'loss': 0.5206, 'learning_rate': 1.8529481025777765e-05, 'epoch': 0.4} {'loss': 0.5419, 'learning_rate': 1.8529305642065356e-05, 'epoch': 0.4} {'loss': 0.5374, 'learning_rate': 1.852913024872498e-05, 'epoch': 0.4} {'loss': 0.4738, 'learning_rate': 1.8528954845756844e-05, 'epoch': 0.4} {'loss': 0.5935, 'learning_rate': 1.8528779433161137e-05, 'epoch': 0.4} {'loss': 0.6695, 'learning_rate': 1.8528604010938057e-05, 'epoch': 0.4} {'loss': 0.6704, 'learning_rate': 1.852842857908781e-05, 'epoch': 0.4} {'loss': 0.7442, 'learning_rate': 1.8528253137610584e-05, 'epoch': 0.4} {'loss': 0.5026, 'learning_rate': 1.8528077686506584e-05, 'epoch': 0.4} {'loss': 0.7113, 'learning_rate': 1.8527902225776007e-05, 'epoch': 0.4} {'loss': 0.6206, 'learning_rate': 1.852772675541905e-05, 'epoch': 0.4} {'loss': 0.6482, 'learning_rate': 1.852755127543591e-05, 'epoch': 0.4} {'loss': 0.703, 'learning_rate': 1.8527375785826787e-05, 'epoch': 0.4} {'loss': 0.7622, 'learning_rate': 1.8527200286591878e-05, 'epoch': 0.4} {'loss': 0.5, 'learning_rate': 1.852702477773138e-05, 'epoch': 0.4} {'loss': 0.5176, 'learning_rate': 1.8526849259245493e-05, 'epoch': 0.4} {'loss': 0.4879, 'learning_rate': 1.8526673731134414e-05, 'epoch': 0.4} {'loss': 0.5001, 'learning_rate': 1.8526498193398344e-05, 'epoch': 0.4} {'loss': 0.5577, 'learning_rate': 1.8526322646037476e-05, 'epoch': 0.4} {'loss': 0.6321, 'learning_rate': 1.8526147089052017e-05, 'epoch': 0.4} {'loss': 0.6066, 'learning_rate': 1.8525971522442155e-05, 'epoch': 0.4} {'loss': 0.6613, 'learning_rate': 1.8525795946208092e-05, 'epoch': 0.4} {'loss': 0.5775, 'learning_rate': 1.8525620360350027e-05, 'epoch': 0.4} {'loss': 0.5617, 'learning_rate': 1.852544476486816e-05, 'epoch': 0.4} {'loss': 0.6136, 'learning_rate': 1.8525269159762684e-05, 'epoch': 0.4} {'loss': 0.4532, 'learning_rate': 1.85250935450338e-05, 'epoch': 0.4} {'loss': 0.5043, 'learning_rate': 1.852491792068171e-05, 'epoch': 0.4} {'loss': 0.5704, 'learning_rate': 1.8524742286706606e-05, 'epoch': 0.4} {'loss': 0.6941, 'learning_rate': 1.852456664310869e-05, 'epoch': 0.4} {'loss': 0.5476, 'learning_rate': 1.852439098988816e-05, 'epoch': 0.4} {'loss': 0.6433, 'learning_rate': 1.852421532704521e-05, 'epoch': 0.4} {'loss': 0.6413, 'learning_rate': 1.8524039654580046e-05, 'epoch': 0.4} {'loss': 0.5324, 'learning_rate': 1.852386397249286e-05, 'epoch': 0.4} {'loss': 0.6072, 'learning_rate': 1.8523688280783854e-05, 'epoch': 0.4} {'loss': 0.6745, 'learning_rate': 1.8523512579453223e-05, 'epoch': 0.4} {'loss': 0.3322, 'learning_rate': 1.8523336868501168e-05, 'epoch': 0.4} {'loss': 0.5689, 'learning_rate': 1.852316114792789e-05, 'epoch': 0.4} {'loss': 0.5825, 'learning_rate': 1.8522985417733577e-05, 'epoch': 0.4} {'loss': 0.5361, 'learning_rate': 1.8522809677918435e-05, 'epoch': 0.4} {'loss': 0.6607, 'learning_rate': 1.8522633928482668e-05, 'epoch': 0.4} {'loss': 0.6078, 'learning_rate': 1.8522458169426464e-05, 'epoch': 0.4} {'loss': 0.6425, 'learning_rate': 1.8522282400750025e-05, 'epoch': 0.4} {'loss': 0.7043, 'learning_rate': 1.8522106622453552e-05, 'epoch': 0.4} {'loss': 0.4457, 'learning_rate': 1.8521930834537238e-05, 'epoch': 0.4} {'loss': 0.6167, 'learning_rate': 1.8521755037001282e-05, 'epoch': 0.4} {'loss': 0.5209, 'learning_rate': 1.8521579229845892e-05, 'epoch': 0.4} {'loss': 0.6203, 'learning_rate': 1.8521403413071256e-05, 'epoch': 0.4} {'loss': 0.5191, 'learning_rate': 1.8521227586677576e-05, 'epoch': 0.4} {'loss': 0.6392, 'learning_rate': 1.852105175066505e-05, 'epoch': 0.4} {'loss': 0.5663, 'learning_rate': 1.852087590503388e-05, 'epoch': 0.4} {'loss': 0.5915, 'learning_rate': 1.8520700049784257e-05, 'epoch': 0.4} {'loss': 0.6123, 'learning_rate': 1.852052418491639e-05, 'epoch': 0.4} {'loss': 0.6801, 'learning_rate': 1.8520348310430464e-05, 'epoch': 0.4} {'loss': 0.718, 'learning_rate': 1.8520172426326688e-05, 'epoch': 0.4} {'loss': 0.7148, 'learning_rate': 1.851999653260526e-05, 'epoch': 0.4} {'loss': 0.4328, 'learning_rate': 1.8519820629266374e-05, 'epoch': 0.4} {'loss': 0.4211, 'learning_rate': 1.851964471631023e-05, 'epoch': 0.4} {'loss': 0.7128, 'learning_rate': 1.8519468793737028e-05, 'epoch': 0.4} {'loss': 0.6611, 'learning_rate': 1.8519292861546967e-05, 'epoch': 0.4} {'loss': 0.5498, 'learning_rate': 1.8519116919740244e-05, 'epoch': 0.4} {'loss': 0.608, 'learning_rate': 1.8518940968317057e-05, 'epoch': 0.4} {'loss': 0.4791, 'learning_rate': 1.8518765007277603e-05, 'epoch': 0.4} {'loss': 0.4674, 'learning_rate': 1.851858903662209e-05, 'epoch': 0.4} {'loss': 0.5321, 'learning_rate': 1.85184130563507e-05, 'epoch': 0.4} {'loss': 0.5018, 'learning_rate': 1.8518237066463653e-05, 'epoch': 0.4} {'loss': 0.6697, 'learning_rate': 1.8518061066961127e-05, 'epoch': 0.4} {'loss': 0.5403, 'learning_rate': 1.8517885057843334e-05, 'epoch': 0.4} {'loss': 0.5881, 'learning_rate': 1.8517709039110468e-05, 'epoch': 0.4} {'loss': 0.6689, 'learning_rate': 1.851753301076273e-05, 'epoch': 0.4} {'loss': 0.4712, 'learning_rate': 1.8517356972800314e-05, 'epoch': 0.4} {'loss': 0.3823, 'learning_rate': 1.851718092522342e-05, 'epoch': 0.4} {'loss': 0.7243, 'learning_rate': 1.8517004868032253e-05, 'epoch': 0.4} {'loss': 0.4297, 'learning_rate': 1.8516828801227003e-05, 'epoch': 0.4} {'loss': 0.5932, 'learning_rate': 1.8516652724807876e-05, 'epoch': 0.4} {'loss': 0.5905, 'learning_rate': 1.8516476638775066e-05, 'epoch': 0.4} {'loss': 0.5537, 'learning_rate': 1.8516300543128772e-05, 'epoch': 0.4} {'loss': 0.505, 'learning_rate': 1.85161244378692e-05, 'epoch': 0.4} {'loss': 0.6575, 'learning_rate': 1.8515948322996537e-05, 'epoch': 0.4} {'loss': 0.6347, 'learning_rate': 1.851577219851099e-05, 'epoch': 0.4} {'loss': 0.6546, 'learning_rate': 1.8515596064412754e-05, 'epoch': 0.4} {'loss': 0.6733, 'learning_rate': 1.8515419920702033e-05, 'epoch': 0.4} {'loss': 0.4672, 'learning_rate': 1.851524376737902e-05, 'epoch': 0.4} {'loss': 0.5325, 'learning_rate': 1.8515067604443912e-05, 'epoch': 0.4} {'loss': 0.5053, 'learning_rate': 1.8514891431896916e-05, 'epoch': 0.4} {'loss': 0.6746, 'learning_rate': 1.851471524973823e-05, 'epoch': 0.4} {'loss': 0.6285, 'learning_rate': 1.8514539057968045e-05, 'epoch': 0.4} {'loss': 0.608, 'learning_rate': 1.8514362856586564e-05, 'epoch': 0.4} {'loss': 0.6434, 'learning_rate': 1.851418664559399e-05, 'epoch': 0.4} {'loss': 0.4597, 'learning_rate': 1.8514010424990514e-05, 'epoch': 0.4} {'loss': 0.5261, 'learning_rate': 1.8513834194776343e-05, 'epoch': 0.4} {'loss': 0.7465, 'learning_rate': 1.8513657954951668e-05, 'epoch': 0.4} {'loss': 0.528, 'learning_rate': 1.8513481705516696e-05, 'epoch': 0.4} {'loss': 0.6881, 'learning_rate': 1.851330544647162e-05, 'epoch': 0.4} {'loss': 0.6015, 'learning_rate': 1.851312917781664e-05, 'epoch': 0.4} {'loss': 0.6651, 'learning_rate': 1.851295289955196e-05, 'epoch': 0.4} {'loss': 0.6599, 'learning_rate': 1.8512776611677773e-05, 'epoch': 0.4} {'loss': 0.5748, 'learning_rate': 1.851260031419428e-05, 'epoch': 0.4} {'loss': 0.57, 'learning_rate': 1.8512424007101678e-05, 'epoch': 0.4} {'loss': 0.8026, 'learning_rate': 1.851224769040017e-05, 'epoch': 0.4} {'loss': 0.7071, 'learning_rate': 1.8512071364089952e-05, 'epoch': 0.4} {'loss': 0.6654, 'learning_rate': 1.8511895028171226e-05, 'epoch': 0.4} {'loss': 0.6185, 'learning_rate': 1.851171868264419e-05, 'epoch': 0.4} {'loss': 0.5827, 'learning_rate': 1.851154232750904e-05, 'epoch': 0.4} {'loss': 0.5541, 'learning_rate': 1.8511365962765977e-05, 'epoch': 0.4} {'loss': 0.6933, 'learning_rate': 1.85111895884152e-05, 'epoch': 0.4} {'loss': 0.4879, 'learning_rate': 1.851101320445691e-05, 'epoch': 0.4} {'loss': 0.5226, 'learning_rate': 1.8510836810891302e-05, 'epoch': 0.4} {'loss': 0.5665, 'learning_rate': 1.851066040771858e-05, 'epoch': 0.4} {'loss': 0.5949, 'learning_rate': 1.8510483994938942e-05, 'epoch': 0.4} {'loss': 0.5981, 'learning_rate': 1.8510307572552585e-05, 'epoch': 0.4} {'loss': 0.606, 'learning_rate': 1.8510131140559706e-05, 'epoch': 0.4} {'loss': 0.5456, 'learning_rate': 1.850995469896051e-05, 'epoch': 0.4} {'loss': 0.5986, 'learning_rate': 1.8509778247755196e-05, 'epoch': 0.4} {'loss': 0.4666, 'learning_rate': 1.8509601786943955e-05, 'epoch': 0.4} {'loss': 0.5678, 'learning_rate': 1.8509425316526994e-05, 'epoch': 0.4} {'loss': 0.572, 'learning_rate': 1.850924883650451e-05, 'epoch': 0.4} {'loss': 0.4737, 'learning_rate': 1.85090723468767e-05, 'epoch': 0.4} {'loss': 0.4472, 'learning_rate': 1.850889584764377e-05, 'epoch': 0.4} {'loss': 0.6226, 'learning_rate': 1.8508719338805915e-05, 'epoch': 0.4} {'loss': 0.4779, 'learning_rate': 1.8508542820363328e-05, 'epoch': 0.4} {'loss': 0.602, 'learning_rate': 1.8508366292316218e-05, 'epoch': 0.4} {'loss': 0.4739, 'learning_rate': 1.8508189754664777e-05, 'epoch': 0.4} {'loss': 0.6709, 'learning_rate': 1.8508013207409212e-05, 'epoch': 0.4} {'loss': 0.5932, 'learning_rate': 1.8507836650549717e-05, 'epoch': 0.4} {'loss': 0.6583, 'learning_rate': 1.8507660084086492e-05, 'epoch': 0.4} {'loss': 0.5217, 'learning_rate': 1.8507483508019735e-05, 'epoch': 0.4} {'loss': 0.5845, 'learning_rate': 1.850730692234965e-05, 'epoch': 0.4} {'loss': 0.6087, 'learning_rate': 1.850713032707643e-05, 'epoch': 0.4} {'loss': 0.5218, 'learning_rate': 1.850695372220028e-05, 'epoch': 0.4} {'loss': 0.5011, 'learning_rate': 1.8506777107721396e-05, 'epoch': 0.4} {'loss': 0.6828, 'learning_rate': 1.8506600483639977e-05, 'epoch': 0.4} {'loss': 0.5696, 'learning_rate': 1.8506423849956223e-05, 'epoch': 0.4} {'loss': 0.6588, 'learning_rate': 1.8506247206670338e-05, 'epoch': 0.4} {'loss': 0.5387, 'learning_rate': 1.8506070553782514e-05, 'epoch': 0.4} {'loss': 0.6971, 'learning_rate': 1.8505893891292956e-05, 'epoch': 0.4} {'loss': 0.635, 'learning_rate': 1.850571721920186e-05, 'epoch': 0.4} {'loss': 0.6346, 'learning_rate': 1.8505540537509426e-05, 'epoch': 0.4} {'loss': 0.6763, 'learning_rate': 1.8505363846215855e-05, 'epoch': 0.4} {'loss': 0.5748, 'learning_rate': 1.8505187145321345e-05, 'epoch': 0.4} {'loss': 0.6377, 'learning_rate': 1.8505010434826102e-05, 'epoch': 0.4} {'loss': 0.4958, 'learning_rate': 1.8504833714730314e-05, 'epoch': 0.4} {'loss': 0.6471, 'learning_rate': 1.8504656985034183e-05, 'epoch': 0.4} {'loss': 0.5471, 'learning_rate': 1.8504480245737916e-05, 'epoch': 0.4} {'loss': 0.5115, 'learning_rate': 1.8504303496841703e-05, 'epoch': 0.4} {'loss': 0.4999, 'learning_rate': 1.8504126738345754e-05, 'epoch': 0.4} {'loss': 0.5929, 'learning_rate': 1.8503949970250262e-05, 'epoch': 0.4} {'loss': 0.5816, 'learning_rate': 1.8503773192555427e-05, 'epoch': 0.4} {'loss': 0.7056, 'learning_rate': 1.850359640526145e-05, 'epoch': 0.4} {'loss': 0.5384, 'learning_rate': 1.8503419608368528e-05, 'epoch': 0.4} {'loss': 0.6632, 'learning_rate': 1.8503242801876863e-05, 'epoch': 0.4} {'loss': 0.57, 'learning_rate': 1.850306598578665e-05, 'epoch': 0.4} {'loss': 0.4833, 'learning_rate': 1.8502889160098102e-05, 'epoch': 0.4} {'loss': 0.6927, 'learning_rate': 1.85027123248114e-05, 'epoch': 0.4} {'loss': 0.4505, 'learning_rate': 1.8502535479926757e-05, 'epoch': 0.4} {'loss': 0.637, 'learning_rate': 1.8502358625444367e-05, 'epoch': 0.4} {'loss': 0.7403, 'learning_rate': 1.8502181761364433e-05, 'epoch': 0.4} {'loss': 0.5735, 'learning_rate': 1.8502004887687152e-05, 'epoch': 0.4} {'loss': 0.6283, 'learning_rate': 1.8501828004412723e-05, 'epoch': 0.4} {'loss': 0.6859, 'learning_rate': 1.8501651111541346e-05, 'epoch': 0.4} {'loss': 0.6614, 'learning_rate': 1.850147420907322e-05, 'epoch': 0.4} {'loss': 0.7204, 'learning_rate': 1.850129729700855e-05, 'epoch': 0.4} {'loss': 0.4959, 'learning_rate': 1.850112037534753e-05, 'epoch': 0.4} {'loss': 0.5139, 'learning_rate': 1.8500943444090364e-05, 'epoch': 0.4} {'loss': 0.5281, 'learning_rate': 1.8500766503237247e-05, 'epoch': 0.4} {'loss': 0.543, 'learning_rate': 1.8500589552788382e-05, 'epoch': 0.4} {'loss': 0.5384, 'learning_rate': 1.850041259274397e-05, 'epoch': 0.4} {'loss': 0.6111, 'learning_rate': 1.8500235623104204e-05, 'epoch': 0.4} {'loss': 0.7123, 'learning_rate': 1.850005864386929e-05, 'epoch': 0.4} {'loss': 0.7388, 'learning_rate': 1.8499881655039428e-05, 'epoch': 0.4} {'loss': 0.4135, 'learning_rate': 1.8499704656614814e-05, 'epoch': 0.4} {'loss': 0.6356, 'learning_rate': 1.8499527648595647e-05, 'epoch': 0.4} {'loss': 0.3832, 'learning_rate': 1.8499350630982135e-05, 'epoch': 0.4} {'loss': 0.6261, 'learning_rate': 1.8499173603774473e-05, 'epoch': 0.4} {'loss': 0.4983, 'learning_rate': 1.8498996566972853e-05, 'epoch': 0.4} {'loss': 0.4508, 'learning_rate': 1.8498819520577486e-05, 'epoch': 0.4} {'loss': 0.6638, 'learning_rate': 1.8498642464588574e-05, 'epoch': 0.4} {'loss': 0.6366, 'learning_rate': 1.84984653990063e-05, 'epoch': 0.4} {'loss': 0.4312, 'learning_rate': 1.8498288323830883e-05, 'epoch': 0.4} {'loss': 0.5136, 'learning_rate': 1.849811123906251e-05, 'epoch': 0.4} {'loss': 0.6895, 'learning_rate': 1.8497934144701387e-05, 'epoch': 0.4} {'loss': 0.5424, 'learning_rate': 1.8497757040747713e-05, 'epoch': 0.4} {'loss': 0.5292, 'learning_rate': 1.8497579927201685e-05, 'epoch': 0.4} {'loss': 0.5929, 'learning_rate': 1.8497402804063507e-05, 'epoch': 0.4} {'loss': 0.5434, 'learning_rate': 1.8497225671333375e-05, 'epoch': 0.4} {'loss': 0.5588, 'learning_rate': 1.8497048529011494e-05, 'epoch': 0.4} {'loss': 0.6731, 'learning_rate': 1.8496871377098058e-05, 'epoch': 0.4} {'loss': 0.6637, 'learning_rate': 1.8496694215593272e-05, 'epoch': 0.4} {'loss': 0.5792, 'learning_rate': 1.8496517044497336e-05, 'epoch': 0.4} {'loss': 0.5529, 'learning_rate': 1.8496339863810445e-05, 'epoch': 0.4} {'loss': 0.5391, 'learning_rate': 1.8496162673532804e-05, 'epoch': 0.4} {'loss': 0.7543, 'learning_rate': 1.8495985473664605e-05, 'epoch': 0.4} {'loss': 0.6923, 'learning_rate': 1.8495808264206058e-05, 'epoch': 0.4} {'loss': 0.5511, 'learning_rate': 1.849563104515736e-05, 'epoch': 0.4} {'loss': 0.5678, 'learning_rate': 1.849545381651871e-05, 'epoch': 0.4} {'loss': 0.698, 'learning_rate': 1.8495276578290308e-05, 'epoch': 0.4} {'loss': 0.6537, 'learning_rate': 1.8495099330472353e-05, 'epoch': 0.4} {'loss': 0.3525, 'learning_rate': 1.8494922073065047e-05, 'epoch': 0.4} {'loss': 0.6235, 'learning_rate': 1.849474480606859e-05, 'epoch': 0.41} {'loss': 0.4738, 'learning_rate': 1.849456752948318e-05, 'epoch': 0.41} {'loss': 0.6171, 'learning_rate': 1.849439024330902e-05, 'epoch': 0.41} {'loss': 0.5041, 'learning_rate': 1.8494212947546308e-05, 'epoch': 0.41} {'loss': 0.4927, 'learning_rate': 1.8494035642195246e-05, 'epoch': 0.41} {'loss': 0.713, 'learning_rate': 1.8493858327256032e-05, 'epoch': 0.41} {'loss': 0.6312, 'learning_rate': 1.8493681002728866e-05, 'epoch': 0.41} {'loss': 0.4424, 'learning_rate': 1.849350366861395e-05, 'epoch': 0.41} {'loss': 0.5795, 'learning_rate': 1.8493326324911483e-05, 'epoch': 0.41} {'loss': 0.5249, 'learning_rate': 1.8493148971621667e-05, 'epoch': 0.41} {'loss': 0.6324, 'learning_rate': 1.8492971608744698e-05, 'epoch': 0.41} {'loss': 0.5596, 'learning_rate': 1.8492794236280783e-05, 'epoch': 0.41} {'loss': 0.3932, 'learning_rate': 1.8492616854230115e-05, 'epoch': 0.41} {'loss': 0.5089, 'learning_rate': 1.84924394625929e-05, 'epoch': 0.41} {'loss': 0.5789, 'learning_rate': 1.8492262061369338e-05, 'epoch': 0.41} {'loss': 0.6437, 'learning_rate': 1.849208465055962e-05, 'epoch': 0.41} {'loss': 0.5094, 'learning_rate': 1.849190723016396e-05, 'epoch': 0.41} {'loss': 0.5629, 'learning_rate': 1.849172980018255e-05, 'epoch': 0.41} {'loss': 0.496, 'learning_rate': 1.849155236061559e-05, 'epoch': 0.41} {'loss': 0.6011, 'learning_rate': 1.849137491146328e-05, 'epoch': 0.41} {'loss': 0.7775, 'learning_rate': 1.8491197452725827e-05, 'epoch': 0.41} {'loss': 0.5931, 'learning_rate': 1.8491019984403424e-05, 'epoch': 0.41} {'loss': 0.6437, 'learning_rate': 1.8490842506496274e-05, 'epoch': 0.41} {'loss': 0.5166, 'learning_rate': 1.849066501900458e-05, 'epoch': 0.41} {'loss': 0.5815, 'learning_rate': 1.849048752192854e-05, 'epoch': 0.41} {'loss': 0.7733, 'learning_rate': 1.849031001526835e-05, 'epoch': 0.41} {'loss': 0.5008, 'learning_rate': 1.8490132499024215e-05, 'epoch': 0.41} {'loss': 0.595, 'learning_rate': 1.8489954973196338e-05, 'epoch': 0.41} {'loss': 0.7883, 'learning_rate': 1.8489777437784914e-05, 'epoch': 0.41} {'loss': 0.5852, 'learning_rate': 1.8489599892790145e-05, 'epoch': 0.41} {'loss': 0.6423, 'learning_rate': 1.8489422338212236e-05, 'epoch': 0.41} {'loss': 0.5704, 'learning_rate': 1.8489244774051382e-05, 'epoch': 0.41} {'loss': 0.5922, 'learning_rate': 1.8489067200307783e-05, 'epoch': 0.41} {'loss': 0.5356, 'learning_rate': 1.8488889616981643e-05, 'epoch': 0.41} {'loss': 0.5071, 'learning_rate': 1.848871202407316e-05, 'epoch': 0.41} {'loss': 0.7779, 'learning_rate': 1.848853442158254e-05, 'epoch': 0.41} {'loss': 0.4229, 'learning_rate': 1.848835680950997e-05, 'epoch': 0.41} {'loss': 0.5823, 'learning_rate': 1.8488179187855664e-05, 'epoch': 0.41} {'loss': 0.5811, 'learning_rate': 1.848800155661982e-05, 'epoch': 0.41} {'loss': 0.5777, 'learning_rate': 1.8487823915802633e-05, 'epoch': 0.41} {'loss': 0.531, 'learning_rate': 1.8487646265404308e-05, 'epoch': 0.41} {'loss': 0.5836, 'learning_rate': 1.8487468605425044e-05, 'epoch': 0.41} {'loss': 0.4518, 'learning_rate': 1.848729093586504e-05, 'epoch': 0.41} {'loss': 0.4387, 'learning_rate': 1.8487113256724502e-05, 'epoch': 0.41} {'loss': 0.6793, 'learning_rate': 1.8486935568003625e-05, 'epoch': 0.41} {'loss': 0.6412, 'learning_rate': 1.848675786970261e-05, 'epoch': 0.41} {'loss': 0.5853, 'learning_rate': 1.8486580161821662e-05, 'epoch': 0.41} {'loss': 0.563, 'learning_rate': 1.848640244436098e-05, 'epoch': 0.41} {'loss': 0.5876, 'learning_rate': 1.8486224717320763e-05, 'epoch': 0.41} {'loss': 0.4686, 'learning_rate': 1.848604698070121e-05, 'epoch': 0.41} {'loss': 0.6618, 'learning_rate': 1.8485869234502525e-05, 'epoch': 0.41} {'loss': 0.4945, 'learning_rate': 1.8485691478724906e-05, 'epoch': 0.41} {'loss': 0.5697, 'learning_rate': 1.8485513713368556e-05, 'epoch': 0.41} {'loss': 0.6686, 'learning_rate': 1.8485335938433674e-05, 'epoch': 0.41} {'loss': 0.5663, 'learning_rate': 1.8485158153920458e-05, 'epoch': 0.41} {'loss': 0.4677, 'learning_rate': 1.8484980359829115e-05, 'epoch': 0.41} {'loss': 0.5554, 'learning_rate': 1.8484802556159843e-05, 'epoch': 0.41} {'loss': 0.5151, 'learning_rate': 1.8484624742912843e-05, 'epoch': 0.41} {'loss': 0.6063, 'learning_rate': 1.8484446920088314e-05, 'epoch': 0.41} {'loss': 0.7606, 'learning_rate': 1.848426908768646e-05, 'epoch': 0.41} {'loss': 0.5651, 'learning_rate': 1.8484091245707477e-05, 'epoch': 0.41} {'loss': 0.5938, 'learning_rate': 1.8483913394151573e-05, 'epoch': 0.41} {'loss': 0.4125, 'learning_rate': 1.8483735533018938e-05, 'epoch': 0.41} {'loss': 0.6183, 'learning_rate': 1.8483557662309782e-05, 'epoch': 0.41} {'loss': 0.4673, 'learning_rate': 1.8483379782024303e-05, 'epoch': 0.41} {'loss': 0.5934, 'learning_rate': 1.8483201892162696e-05, 'epoch': 0.41} {'loss': 0.3778, 'learning_rate': 1.8483023992725174e-05, 'epoch': 0.41} {'loss': 0.6024, 'learning_rate': 1.848284608371193e-05, 'epoch': 0.41} {'loss': 0.6109, 'learning_rate': 1.848266816512316e-05, 'epoch': 0.41} {'loss': 0.5481, 'learning_rate': 1.8482490236959077e-05, 'epoch': 0.41} {'loss': 0.7058, 'learning_rate': 1.8482312299219874e-05, 'epoch': 0.41} {'loss': 0.6049, 'learning_rate': 1.848213435190575e-05, 'epoch': 0.41} {'loss': 0.5656, 'learning_rate': 1.8481956395016915e-05, 'epoch': 0.41} {'loss': 0.5837, 'learning_rate': 1.848177842855356e-05, 'epoch': 0.41} {'loss': 0.6089, 'learning_rate': 1.8481600452515893e-05, 'epoch': 0.41} {'loss': 0.6899, 'learning_rate': 1.848142246690411e-05, 'epoch': 0.41} {'loss': 0.5554, 'learning_rate': 1.8481244471718414e-05, 'epoch': 0.41} {'loss': 0.5879, 'learning_rate': 1.8481066466959007e-05, 'epoch': 0.41} {'loss': 0.5854, 'learning_rate': 1.8480888452626087e-05, 'epoch': 0.41} {'loss': 0.6174, 'learning_rate': 1.8480710428719856e-05, 'epoch': 0.41} {'loss': 0.3937, 'learning_rate': 1.8480532395240516e-05, 'epoch': 0.41} {'loss': 0.615, 'learning_rate': 1.8480354352188267e-05, 'epoch': 0.41} {'loss': 0.6013, 'learning_rate': 1.8480176299563313e-05, 'epoch': 0.41} {'loss': 0.6842, 'learning_rate': 1.8479998237365853e-05, 'epoch': 0.41} {'loss': 0.5366, 'learning_rate': 1.8479820165596087e-05, 'epoch': 0.41} {'loss': 0.654, 'learning_rate': 1.8479642084254215e-05, 'epoch': 0.41} {'loss': 0.6276, 'learning_rate': 1.847946399334044e-05, 'epoch': 0.41} {'loss': 0.7787, 'learning_rate': 1.847928589285496e-05, 'epoch': 0.41} {'loss': 0.6471, 'learning_rate': 1.8479107782797983e-05, 'epoch': 0.41} {'loss': 0.6626, 'learning_rate': 1.8478929663169704e-05, 'epoch': 0.41} {'loss': 0.5929, 'learning_rate': 1.8478751533970328e-05, 'epoch': 0.41} {'loss': 0.5086, 'learning_rate': 1.847857339520005e-05, 'epoch': 0.41} {'loss': 0.4703, 'learning_rate': 1.8478395246859078e-05, 'epoch': 0.41} {'loss': 0.5168, 'learning_rate': 1.8478217088947606e-05, 'epoch': 0.41} {'loss': 0.5961, 'learning_rate': 1.8478038921465844e-05, 'epoch': 0.41} {'loss': 0.4874, 'learning_rate': 1.8477860744413986e-05, 'epoch': 0.41} {'loss': 0.4433, 'learning_rate': 1.8477682557792234e-05, 'epoch': 0.41} {'loss': 0.6368, 'learning_rate': 1.8477504361600793e-05, 'epoch': 0.41} {'loss': 0.5533, 'learning_rate': 1.8477326155839857e-05, 'epoch': 0.41} {'loss': 0.7754, 'learning_rate': 1.8477147940509638e-05, 'epoch': 0.41} {'loss': 0.5611, 'learning_rate': 1.8476969715610325e-05, 'epoch': 0.41} {'loss': 0.5838, 'learning_rate': 1.8476791481142132e-05, 'epoch': 0.41} {'loss': 0.6098, 'learning_rate': 1.8476613237105248e-05, 'epoch': 0.41} {'loss': 0.5253, 'learning_rate': 1.8476434983499883e-05, 'epoch': 0.41} {'loss': 0.5828, 'learning_rate': 1.8476256720326235e-05, 'epoch': 0.41} {'loss': 0.4559, 'learning_rate': 1.84760784475845e-05, 'epoch': 0.41} {'loss': 0.4965, 'learning_rate': 1.847590016527489e-05, 'epoch': 0.41} {'loss': 0.5883, 'learning_rate': 1.8475721873397597e-05, 'epoch': 0.41} {'loss': 0.6093, 'learning_rate': 1.8475543571952825e-05, 'epoch': 0.41} {'loss': 0.5441, 'learning_rate': 1.8475365260940778e-05, 'epoch': 0.41} {'loss': 0.51, 'learning_rate': 1.8475186940361657e-05, 'epoch': 0.41} {'loss': 0.5218, 'learning_rate': 1.8475008610215658e-05, 'epoch': 0.41} {'loss': 0.6701, 'learning_rate': 1.8474830270502987e-05, 'epoch': 0.41} {'loss': 0.5776, 'learning_rate': 1.8474651921223845e-05, 'epoch': 0.41} {'loss': 0.7131, 'learning_rate': 1.8474473562378432e-05, 'epoch': 0.41} {'loss': 0.6099, 'learning_rate': 1.8474295193966947e-05, 'epoch': 0.41} {'loss': 0.5033, 'learning_rate': 1.8474116815989597e-05, 'epoch': 0.41} {'loss': 0.7096, 'learning_rate': 1.847393842844658e-05, 'epoch': 0.41} {'loss': 0.5196, 'learning_rate': 1.8473760031338098e-05, 'epoch': 0.41} {'loss': 0.557, 'learning_rate': 1.8473581624664352e-05, 'epoch': 0.41} {'loss': 0.3644, 'learning_rate': 1.847340320842555e-05, 'epoch': 0.41} {'loss': 0.5572, 'learning_rate': 1.847322478262188e-05, 'epoch': 0.41} {'loss': 0.4559, 'learning_rate': 1.847304634725355e-05, 'epoch': 0.41} {'loss': 0.7208, 'learning_rate': 1.8472867902320763e-05, 'epoch': 0.41} {'loss': 0.6438, 'learning_rate': 1.847268944782372e-05, 'epoch': 0.41} {'loss': 0.6707, 'learning_rate': 1.8472510983762622e-05, 'epoch': 0.41} {'loss': 0.6748, 'learning_rate': 1.847233251013767e-05, 'epoch': 0.41} {'loss': 0.5206, 'learning_rate': 1.8472154026949068e-05, 'epoch': 0.41} {'loss': 0.6957, 'learning_rate': 1.8471975534197012e-05, 'epoch': 0.41} {'loss': 0.6827, 'learning_rate': 1.8471797031881707e-05, 'epoch': 0.41} {'loss': 0.8266, 'learning_rate': 1.8471618520003356e-05, 'epoch': 0.41} {'loss': 0.6513, 'learning_rate': 1.847143999856216e-05, 'epoch': 0.41} {'loss': 0.6083, 'learning_rate': 1.8471261467558315e-05, 'epoch': 0.41} {'loss': 0.5963, 'learning_rate': 1.8471082926992028e-05, 'epoch': 0.41} {'loss': 0.6087, 'learning_rate': 1.84709043768635e-05, 'epoch': 0.41} {'loss': 0.6251, 'learning_rate': 1.847072581717293e-05, 'epoch': 0.41} {'loss': 0.6328, 'learning_rate': 1.8470547247920524e-05, 'epoch': 0.41} {'loss': 0.6577, 'learning_rate': 1.847036866910648e-05, 'epoch': 0.41} {'loss': 0.4566, 'learning_rate': 1.8470190080731e-05, 'epoch': 0.41} {'loss': 0.7194, 'learning_rate': 1.8470011482794287e-05, 'epoch': 0.41} {'loss': 0.5925, 'learning_rate': 1.8469832875296537e-05, 'epoch': 0.41} {'loss': 0.3929, 'learning_rate': 1.846965425823796e-05, 'epoch': 0.41} {'loss': 0.5613, 'learning_rate': 1.8469475631618755e-05, 'epoch': 0.41} {'loss': 0.6992, 'learning_rate': 1.8469296995439122e-05, 'epoch': 0.41} {'loss': 0.4194, 'learning_rate': 1.846911834969926e-05, 'epoch': 0.41} {'loss': 0.6251, 'learning_rate': 1.846893969439938e-05, 'epoch': 0.41} {'loss': 0.6185, 'learning_rate': 1.8468761029539673e-05, 'epoch': 0.41} {'loss': 0.6658, 'learning_rate': 1.8468582355120347e-05, 'epoch': 0.41} {'loss': 0.5842, 'learning_rate': 1.8468403671141598e-05, 'epoch': 0.41} {'loss': 0.6415, 'learning_rate': 1.8468224977603638e-05, 'epoch': 0.41} {'loss': 0.6612, 'learning_rate': 1.846804627450666e-05, 'epoch': 0.41} {'loss': 0.7898, 'learning_rate': 1.8467867561850865e-05, 'epoch': 0.41} {'loss': 0.6988, 'learning_rate': 1.846768883963646e-05, 'epoch': 0.41} {'loss': 0.5387, 'learning_rate': 1.8467510107863645e-05, 'epoch': 0.41} {'loss': 0.6246, 'learning_rate': 1.846733136653262e-05, 'epoch': 0.41} {'loss': 0.5059, 'learning_rate': 1.8467152615643587e-05, 'epoch': 0.41} {'loss': 0.5501, 'learning_rate': 1.8466973855196753e-05, 'epoch': 0.41} {'loss': 0.5605, 'learning_rate': 1.8466795085192314e-05, 'epoch': 0.41} {'loss': 0.5667, 'learning_rate': 1.846661630563047e-05, 'epoch': 0.41} {'loss': 0.6064, 'learning_rate': 1.846643751651143e-05, 'epoch': 0.41} {'loss': 0.4831, 'learning_rate': 1.8466258717835393e-05, 'epoch': 0.41} {'loss': 0.4627, 'learning_rate': 1.8466079909602555e-05, 'epoch': 0.41} {'loss': 0.5118, 'learning_rate': 1.8465901091813125e-05, 'epoch': 0.41} {'loss': 0.5744, 'learning_rate': 1.8465722264467303e-05, 'epoch': 0.41} {'loss': 0.5528, 'learning_rate': 1.846554342756529e-05, 'epoch': 0.41} {'loss': 0.7414, 'learning_rate': 1.846536458110729e-05, 'epoch': 0.41} {'loss': 0.509, 'learning_rate': 1.84651857250935e-05, 'epoch': 0.41} {'loss': 0.7038, 'learning_rate': 1.8465006859524125e-05, 'epoch': 0.41} {'loss': 0.5091, 'learning_rate': 1.846482798439937e-05, 'epoch': 0.41} {'loss': 0.5818, 'learning_rate': 1.8464649099719434e-05, 'epoch': 0.41} {'loss': 0.5138, 'learning_rate': 1.8464470205484515e-05, 'epoch': 0.41} {'loss': 0.8061, 'learning_rate': 1.846429130169482e-05, 'epoch': 0.41} {'loss': 0.6395, 'learning_rate': 1.8464112388350553e-05, 'epoch': 0.41} {'loss': 0.5464, 'learning_rate': 1.8463933465451907e-05, 'epoch': 0.41} {'loss': 0.561, 'learning_rate': 1.8463754532999096e-05, 'epoch': 0.41} {'loss': 0.6246, 'learning_rate': 1.8463575590992315e-05, 'epoch': 0.41} {'loss': 0.6501, 'learning_rate': 1.846339663943176e-05, 'epoch': 0.41} {'loss': 0.6833, 'learning_rate': 1.8463217678317648e-05, 'epoch': 0.41} {'loss': 0.5465, 'learning_rate': 1.8463038707650166e-05, 'epoch': 0.41} {'loss': 0.5948, 'learning_rate': 1.8462859727429524e-05, 'epoch': 0.41} {'loss': 0.5903, 'learning_rate': 1.8462680737655922e-05, 'epoch': 0.41} {'loss': 0.6089, 'learning_rate': 1.8462501738329564e-05, 'epoch': 0.41} {'loss': 0.3488, 'learning_rate': 1.8462322729450654e-05, 'epoch': 0.41} {'loss': 0.5939, 'learning_rate': 1.8462143711019383e-05, 'epoch': 0.41} {'loss': 0.6831, 'learning_rate': 1.846196468303597e-05, 'epoch': 0.41} {'loss': 0.6865, 'learning_rate': 1.8461785645500603e-05, 'epoch': 0.41} {'loss': 0.5639, 'learning_rate': 1.846160659841349e-05, 'epoch': 0.41} {'loss': 0.5194, 'learning_rate': 1.8461427541774833e-05, 'epoch': 0.41} {'loss': 0.656, 'learning_rate': 1.846124847558483e-05, 'epoch': 0.41} {'loss': 0.5731, 'learning_rate': 1.846106939984369e-05, 'epoch': 0.41} {'loss': 0.4369, 'learning_rate': 1.8460890314551608e-05, 'epoch': 0.41} {'loss': 0.5693, 'learning_rate': 1.8460711219708794e-05, 'epoch': 0.41} {'loss': 0.5662, 'learning_rate': 1.8460532115315443e-05, 'epoch': 0.41} {'loss': 0.53, 'learning_rate': 1.846035300137176e-05, 'epoch': 0.41} {'loss': 0.6299, 'learning_rate': 1.846017387787795e-05, 'epoch': 0.41} {'loss': 0.4499, 'learning_rate': 1.845999474483421e-05, 'epoch': 0.41} {'loss': 0.5241, 'learning_rate': 1.8459815602240744e-05, 'epoch': 0.41} {'loss': 0.597, 'learning_rate': 1.8459636450097757e-05, 'epoch': 0.41} {'loss': 0.6242, 'learning_rate': 1.845945728840545e-05, 'epoch': 0.41} {'loss': 0.6175, 'learning_rate': 1.8459278117164024e-05, 'epoch': 0.41} {'loss': 0.6754, 'learning_rate': 1.8459098936373678e-05, 'epoch': 0.41} {'loss': 0.6485, 'learning_rate': 1.845891974603462e-05, 'epoch': 0.41} {'loss': 0.5759, 'learning_rate': 1.845874054614705e-05, 'epoch': 0.41} {'loss': 0.527, 'learning_rate': 1.8458561336711175e-05, 'epoch': 0.41} {'loss': 0.6522, 'learning_rate': 1.845838211772719e-05, 'epoch': 0.41} {'loss': 0.5479, 'learning_rate': 1.8458202889195297e-05, 'epoch': 0.41} {'loss': 0.4287, 'learning_rate': 1.84580236511157e-05, 'epoch': 0.41} {'loss': 0.6158, 'learning_rate': 1.845784440348861e-05, 'epoch': 0.41} {'loss': 0.6197, 'learning_rate': 1.8457665146314214e-05, 'epoch': 0.41} {'loss': 0.6354, 'learning_rate': 1.8457485879592724e-05, 'epoch': 0.41} {'loss': 0.4623, 'learning_rate': 1.8457306603324343e-05, 'epoch': 0.41} {'loss': 0.5949, 'learning_rate': 1.8457127317509274e-05, 'epoch': 0.41} {'loss': 0.4774, 'learning_rate': 1.845694802214771e-05, 'epoch': 0.41} {'loss': 0.5606, 'learning_rate': 1.8456768717239864e-05, 'epoch': 0.41} {'loss': 0.6842, 'learning_rate': 1.8456589402785934e-05, 'epoch': 0.41} {'loss': 0.5818, 'learning_rate': 1.845641007878612e-05, 'epoch': 0.41} {'loss': 0.5961, 'learning_rate': 1.845623074524063e-05, 'epoch': 0.41} {'loss': 0.6715, 'learning_rate': 1.8456051402149665e-05, 'epoch': 0.41} {'loss': 0.4149, 'learning_rate': 1.8455872049513423e-05, 'epoch': 0.41} {'loss': 0.4799, 'learning_rate': 1.845569268733211e-05, 'epoch': 0.41} {'loss': 0.5523, 'learning_rate': 1.8455513315605925e-05, 'epoch': 0.41} {'loss': 0.5251, 'learning_rate': 1.8455333934335078e-05, 'epoch': 0.41} {'loss': 0.5755, 'learning_rate': 1.8455154543519765e-05, 'epoch': 0.41} {'loss': 0.5375, 'learning_rate': 1.845497514316019e-05, 'epoch': 0.41} {'loss': 0.6473, 'learning_rate': 1.8454795733256556e-05, 'epoch': 0.41} {'loss': 0.7819, 'learning_rate': 1.8454616313809066e-05, 'epoch': 0.41} {'loss': 0.4371, 'learning_rate': 1.845443688481792e-05, 'epoch': 0.41} {'loss': 0.6247, 'learning_rate': 1.8454257446283326e-05, 'epoch': 0.41} {'loss': 0.5735, 'learning_rate': 1.845407799820548e-05, 'epoch': 0.41} {'loss': 0.7019, 'learning_rate': 1.845389854058459e-05, 'epoch': 0.41} {'loss': 0.5107, 'learning_rate': 1.8453719073420854e-05, 'epoch': 0.41} {'loss': 0.6336, 'learning_rate': 1.8453539596714476e-05, 'epoch': 0.41} {'loss': 0.6247, 'learning_rate': 1.8453360110465662e-05, 'epoch': 0.41} {'loss': 0.4464, 'learning_rate': 1.845318061467461e-05, 'epoch': 0.41} {'loss': 0.5823, 'learning_rate': 1.8453001109341525e-05, 'epoch': 0.41} {'loss': 0.6843, 'learning_rate': 1.845282159446661e-05, 'epoch': 0.41} {'loss': 0.5804, 'learning_rate': 1.8452642070050064e-05, 'epoch': 0.41} {'loss': 0.5511, 'learning_rate': 1.8452462536092098e-05, 'epoch': 0.41} {'loss': 0.5857, 'learning_rate': 1.8452282992592903e-05, 'epoch': 0.41} {'loss': 0.5236, 'learning_rate': 1.8452103439552692e-05, 'epoch': 0.41} {'loss': 0.5839, 'learning_rate': 1.845192387697166e-05, 'epoch': 0.41} {'loss': 0.5318, 'learning_rate': 1.8451744304850016e-05, 'epoch': 0.41} {'loss': 0.6322, 'learning_rate': 1.845156472318796e-05, 'epoch': 0.41} {'loss': 0.6389, 'learning_rate': 1.845138513198569e-05, 'epoch': 0.41} {'loss': 0.5744, 'learning_rate': 1.8451205531243416e-05, 'epoch': 0.41} {'loss': 0.636, 'learning_rate': 1.845102592096134e-05, 'epoch': 0.41} {'loss': 0.5853, 'learning_rate': 1.8450846301139663e-05, 'epoch': 0.41} {'loss': 0.5796, 'learning_rate': 1.8450666671778584e-05, 'epoch': 0.41} {'loss': 0.6515, 'learning_rate': 1.8450487032878312e-05, 'epoch': 0.41} {'loss': 0.6253, 'learning_rate': 1.8450307384439047e-05, 'epoch': 0.41} {'loss': 0.7065, 'learning_rate': 1.845012772646099e-05, 'epoch': 0.41} {'loss': 0.7066, 'learning_rate': 1.8449948058944348e-05, 'epoch': 0.41} {'loss': 0.5874, 'learning_rate': 1.844976838188932e-05, 'epoch': 0.41} {'loss': 0.608, 'learning_rate': 1.8449588695296113e-05, 'epoch': 0.41} {'loss': 0.584, 'learning_rate': 1.8449408999164925e-05, 'epoch': 0.41} {'loss': 0.6051, 'learning_rate': 1.844922929349596e-05, 'epoch': 0.41} {'loss': 0.6838, 'learning_rate': 1.8449049578289423e-05, 'epoch': 0.41} {'loss': 0.6767, 'learning_rate': 1.8448869853545513e-05, 'epoch': 0.41} {'loss': 0.6164, 'learning_rate': 1.844869011926444e-05, 'epoch': 0.41} {'loss': 0.6371, 'learning_rate': 1.8448510375446397e-05, 'epoch': 0.41} {'loss': 0.5643, 'learning_rate': 1.8448330622091598e-05, 'epoch': 0.41} {'loss': 0.6254, 'learning_rate': 1.8448150859200237e-05, 'epoch': 0.41} {'loss': 0.7743, 'learning_rate': 1.844797108677252e-05, 'epoch': 0.41} {'loss': 0.6673, 'learning_rate': 1.8447791304808653e-05, 'epoch': 0.41} {'loss': 0.6148, 'learning_rate': 1.8447611513308833e-05, 'epoch': 0.41} {'loss': 0.6144, 'learning_rate': 1.844743171227327e-05, 'epoch': 0.41} {'loss': 0.5423, 'learning_rate': 1.8447251901702156e-05, 'epoch': 0.41} {'loss': 0.4449, 'learning_rate': 1.844707208159571e-05, 'epoch': 0.41} {'loss': 0.5271, 'learning_rate': 1.8446892251954117e-05, 'epoch': 0.41} {'loss': 0.6819, 'learning_rate': 1.8446712412777594e-05, 'epoch': 0.41} {'loss': 0.5959, 'learning_rate': 1.8446532564066336e-05, 'epoch': 0.41} {'loss': 0.6375, 'learning_rate': 1.8446352705820553e-05, 'epoch': 0.41} {'loss': 0.5156, 'learning_rate': 1.844617283804044e-05, 'epoch': 0.41} {'loss': 0.6503, 'learning_rate': 1.8445992960726206e-05, 'epoch': 0.41} {'loss': 0.5958, 'learning_rate': 1.8445813073878052e-05, 'epoch': 0.41} {'loss': 0.4666, 'learning_rate': 1.844563317749618e-05, 'epoch': 0.41} {'loss': 0.515, 'learning_rate': 1.8445453271580796e-05, 'epoch': 0.41} {'loss': 0.6824, 'learning_rate': 1.84452733561321e-05, 'epoch': 0.41} {'loss': 0.4754, 'learning_rate': 1.8445093431150295e-05, 'epoch': 0.41} {'loss': 0.4973, 'learning_rate': 1.844491349663559e-05, 'epoch': 0.41} {'loss': 0.6887, 'learning_rate': 1.8444733552588177e-05, 'epoch': 0.41} {'loss': 0.4448, 'learning_rate': 1.844455359900827e-05, 'epoch': 0.41} {'loss': 0.5903, 'learning_rate': 1.8444373635896065e-05, 'epoch': 0.41} {'loss': 0.6636, 'learning_rate': 1.844419366325177e-05, 'epoch': 0.41} {'loss': 0.5595, 'learning_rate': 1.8444013681075588e-05, 'epoch': 0.41} {'loss': 0.6371, 'learning_rate': 1.844383368936772e-05, 'epoch': 0.41} {'loss': 0.4559, 'learning_rate': 1.8443653688128366e-05, 'epoch': 0.41} {'loss': 0.5419, 'learning_rate': 1.8443473677357737e-05, 'epoch': 0.41} {'loss': 0.5511, 'learning_rate': 1.8443293657056025e-05, 'epoch': 0.41} {'loss': 0.5867, 'learning_rate': 1.8443113627223447e-05, 'epoch': 0.41} {'loss': 0.5934, 'learning_rate': 1.8442933587860194e-05, 'epoch': 0.41} {'loss': 0.5134, 'learning_rate': 1.844275353896648e-05, 'epoch': 0.41} {'loss': 0.4411, 'learning_rate': 1.8442573480542497e-05, 'epoch': 0.41} {'loss': 0.5166, 'learning_rate': 1.8442393412588457e-05, 'epoch': 0.41} {'loss': 0.6944, 'learning_rate': 1.844221333510456e-05, 'epoch': 0.41} {'loss': 0.8288, 'learning_rate': 1.8442033248091008e-05, 'epoch': 0.41} {'loss': 0.4887, 'learning_rate': 1.8441853151548006e-05, 'epoch': 0.41} {'loss': 0.6795, 'learning_rate': 1.844167304547576e-05, 'epoch': 0.41} {'loss': 0.5859, 'learning_rate': 1.8441492929874468e-05, 'epoch': 0.41} {'loss': 0.734, 'learning_rate': 1.8441312804744335e-05, 'epoch': 0.41} {'loss': 0.6747, 'learning_rate': 1.8441132670085565e-05, 'epoch': 0.41} {'loss': 0.725, 'learning_rate': 1.8440952525898363e-05, 'epoch': 0.41} {'loss': 0.5555, 'learning_rate': 1.844077237218293e-05, 'epoch': 0.41} {'loss': 0.6053, 'learning_rate': 1.844059220893947e-05, 'epoch': 0.41} {'loss': 0.5626, 'learning_rate': 1.8440412036168188e-05, 'epoch': 0.41} {'loss': 0.7333, 'learning_rate': 1.8440231853869284e-05, 'epoch': 0.41} {'loss': 0.5074, 'learning_rate': 1.8440051662042963e-05, 'epoch': 0.41} {'loss': 0.6033, 'learning_rate': 1.8439871460689433e-05, 'epoch': 0.41} {'loss': 0.5778, 'learning_rate': 1.843969124980889e-05, 'epoch': 0.41} {'loss': 0.5287, 'learning_rate': 1.8439511029401535e-05, 'epoch': 0.41} {'loss': 0.3781, 'learning_rate': 1.8439330799467585e-05, 'epoch': 0.41} {'loss': 0.8201, 'learning_rate': 1.8439150560007232e-05, 'epoch': 0.41} {'loss': 0.6114, 'learning_rate': 1.843897031102068e-05, 'epoch': 0.41} {'loss': 0.5175, 'learning_rate': 1.843879005250814e-05, 'epoch': 0.41} {'loss': 0.5652, 'learning_rate': 1.8438609784469808e-05, 'epoch': 0.41} {'loss': 0.4775, 'learning_rate': 1.8438429506905894e-05, 'epoch': 0.41} {'loss': 0.6848, 'learning_rate': 1.8438249219816593e-05, 'epoch': 0.41} {'loss': 0.5048, 'learning_rate': 1.8438068923202115e-05, 'epoch': 0.41} {'loss': 0.455, 'learning_rate': 1.8437888617062664e-05, 'epoch': 0.41} {'loss': 0.5518, 'learning_rate': 1.843770830139844e-05, 'epoch': 0.41} {'loss': 0.7312, 'learning_rate': 1.8437527976209644e-05, 'epoch': 0.41} {'loss': 0.4268, 'learning_rate': 1.8437347641496485e-05, 'epoch': 0.41} {'loss': 0.5704, 'learning_rate': 1.843716729725917e-05, 'epoch': 0.41} {'loss': 0.7357, 'learning_rate': 1.8436986943497892e-05, 'epoch': 0.41} {'loss': 0.5421, 'learning_rate': 1.8436806580212862e-05, 'epoch': 0.41} {'loss': 0.7781, 'learning_rate': 1.843662620740428e-05, 'epoch': 0.41} {'loss': 0.6168, 'learning_rate': 1.8436445825072356e-05, 'epoch': 0.41} {'loss': 0.4804, 'learning_rate': 1.8436265433217287e-05, 'epoch': 0.41} {'loss': 0.6474, 'learning_rate': 1.8436085031839274e-05, 'epoch': 0.41} {'loss': 0.6767, 'learning_rate': 1.843590462093853e-05, 'epoch': 0.41} {'loss': 0.7422, 'learning_rate': 1.8435724200515253e-05, 'epoch': 0.41} {'loss': 0.5704, 'learning_rate': 1.8435543770569648e-05, 'epoch': 0.41} {'loss': 0.4064, 'learning_rate': 1.8435363331101915e-05, 'epoch': 0.41} {'loss': 0.6475, 'learning_rate': 1.8435182882112265e-05, 'epoch': 0.41} {'loss': 0.5384, 'learning_rate': 1.8435002423600897e-05, 'epoch': 0.41} {'loss': 0.54, 'learning_rate': 1.843482195556801e-05, 'epoch': 0.41} {'loss': 0.724, 'learning_rate': 1.8434641478013818e-05, 'epoch': 0.41} {'loss': 0.7487, 'learning_rate': 1.8434460990938517e-05, 'epoch': 0.41} {'loss': 0.6781, 'learning_rate': 1.843428049434232e-05, 'epoch': 0.41} {'loss': 0.5279, 'learning_rate': 1.8434099988225416e-05, 'epoch': 0.41} {'loss': 0.4784, 'learning_rate': 1.843391947258802e-05, 'epoch': 0.41} {'loss': 0.6009, 'learning_rate': 1.8433738947430333e-05, 'epoch': 0.41} {'loss': 0.603, 'learning_rate': 1.8433558412752556e-05, 'epoch': 0.41} {'loss': 0.6391, 'learning_rate': 1.8433377868554898e-05, 'epoch': 0.41} {'loss': 0.7054, 'learning_rate': 1.8433197314837562e-05, 'epoch': 0.41} {'loss': 0.4236, 'learning_rate': 1.8433016751600745e-05, 'epoch': 0.41} {'loss': 0.7034, 'learning_rate': 1.843283617884466e-05, 'epoch': 0.41} {'loss': 0.6361, 'learning_rate': 1.8432655596569503e-05, 'epoch': 0.41} {'loss': 0.6783, 'learning_rate': 1.8432475004775482e-05, 'epoch': 0.41} {'loss': 0.4834, 'learning_rate': 1.8432294403462806e-05, 'epoch': 0.41} {'loss': 0.5848, 'learning_rate': 1.8432113792631665e-05, 'epoch': 0.41} {'loss': 0.5632, 'learning_rate': 1.8431933172282276e-05, 'epoch': 0.41} {'loss': 0.6357, 'learning_rate': 1.8431752542414835e-05, 'epoch': 0.41} {'loss': 0.5492, 'learning_rate': 1.843157190302955e-05, 'epoch': 0.41} {'loss': 0.6501, 'learning_rate': 1.8431391254126625e-05, 'epoch': 0.41} {'loss': 0.7056, 'learning_rate': 1.843121059570626e-05, 'epoch': 0.41} {'loss': 0.678, 'learning_rate': 1.843102992776866e-05, 'epoch': 0.41} {'loss': 0.6693, 'learning_rate': 1.8430849250314035e-05, 'epoch': 0.41} {'loss': 0.5849, 'learning_rate': 1.8430668563342584e-05, 'epoch': 0.41} {'loss': 0.5441, 'learning_rate': 1.843048786685451e-05, 'epoch': 0.41} {'loss': 0.5387, 'learning_rate': 1.843030716085002e-05, 'epoch': 0.41} {'loss': 0.5643, 'learning_rate': 1.8430126445329313e-05, 'epoch': 0.41} {'loss': 0.5671, 'learning_rate': 1.8429945720292598e-05, 'epoch': 0.41} {'loss': 0.6317, 'learning_rate': 1.8429764985740077e-05, 'epoch': 0.41} {'loss': 0.5517, 'learning_rate': 1.8429584241671954e-05, 'epoch': 0.41} {'loss': 0.603, 'learning_rate': 1.8429403488088433e-05, 'epoch': 0.41} {'loss': 0.6032, 'learning_rate': 1.8429222724989723e-05, 'epoch': 0.41} {'loss': 0.5407, 'learning_rate': 1.8429041952376017e-05, 'epoch': 0.41} {'loss': 0.6982, 'learning_rate': 1.8428861170247526e-05, 'epoch': 0.41} {'loss': 0.5176, 'learning_rate': 1.8428680378604456e-05, 'epoch': 0.41} {'loss': 0.659, 'learning_rate': 1.842849957744701e-05, 'epoch': 0.41} {'loss': 0.5249, 'learning_rate': 1.8428318766775387e-05, 'epoch': 0.41} {'loss': 0.4821, 'learning_rate': 1.8428137946589797e-05, 'epoch': 0.41} {'loss': 0.4325, 'learning_rate': 1.8427957116890445e-05, 'epoch': 0.41} {'loss': 0.5154, 'learning_rate': 1.8427776277677527e-05, 'epoch': 0.41} {'loss': 0.5744, 'learning_rate': 1.8427595428951256e-05, 'epoch': 0.41} {'loss': 0.5602, 'learning_rate': 1.842741457071183e-05, 'epoch': 0.41} {'loss': 0.392, 'learning_rate': 1.8427233702959455e-05, 'epoch': 0.41} {'loss': 0.4444, 'learning_rate': 1.8427052825694335e-05, 'epoch': 0.41} {'loss': 0.4914, 'learning_rate': 1.8426871938916678e-05, 'epoch': 0.41} {'loss': 0.6211, 'learning_rate': 1.8426691042626682e-05, 'epoch': 0.41} {'loss': 0.7292, 'learning_rate': 1.8426510136824557e-05, 'epoch': 0.41} {'loss': 0.6212, 'learning_rate': 1.8426329221510503e-05, 'epoch': 0.41} {'loss': 0.7946, 'learning_rate': 1.8426148296684726e-05, 'epoch': 0.41} {'loss': 0.4866, 'learning_rate': 1.842596736234743e-05, 'epoch': 0.41} {'loss': 0.7689, 'learning_rate': 1.842578641849882e-05, 'epoch': 0.41} {'loss': 0.529, 'learning_rate': 1.8425605465139096e-05, 'epoch': 0.41} {'loss': 0.5226, 'learning_rate': 1.842542450226847e-05, 'epoch': 0.41} {'loss': 0.5535, 'learning_rate': 1.8425243529887137e-05, 'epoch': 0.41} {'loss': 0.643, 'learning_rate': 1.842506254799531e-05, 'epoch': 0.41} {'loss': 0.6936, 'learning_rate': 1.8424881556593188e-05, 'epoch': 0.41} {'loss': 0.5406, 'learning_rate': 1.842470055568098e-05, 'epoch': 0.41} {'loss': 0.7733, 'learning_rate': 1.842451954525888e-05, 'epoch': 0.41} {'loss': 0.479, 'learning_rate': 1.8424338525327106e-05, 'epoch': 0.41} {'loss': 0.599, 'learning_rate': 1.8424157495885852e-05, 'epoch': 0.41} {'loss': 0.5729, 'learning_rate': 1.8423976456935328e-05, 'epoch': 0.41} {'loss': 0.436, 'learning_rate': 1.8423795408475734e-05, 'epoch': 0.41} {'loss': 0.545, 'learning_rate': 1.842361435050728e-05, 'epoch': 0.41} {'loss': 0.7102, 'learning_rate': 1.8423433283030165e-05, 'epoch': 0.41} {'loss': 0.4699, 'learning_rate': 1.84232522060446e-05, 'epoch': 0.41} {'loss': 0.5372, 'learning_rate': 1.842307111955078e-05, 'epoch': 0.41} {'loss': 0.7216, 'learning_rate': 1.8422890023548917e-05, 'epoch': 0.41} {'loss': 0.5304, 'learning_rate': 1.8422708918039212e-05, 'epoch': 0.41} {'loss': 0.5168, 'learning_rate': 1.8422527803021867e-05, 'epoch': 0.41} {'loss': 0.4331, 'learning_rate': 1.8422346678497095e-05, 'epoch': 0.41} {'loss': 0.6496, 'learning_rate': 1.8422165544465093e-05, 'epoch': 0.41} {'loss': 0.5183, 'learning_rate': 1.8421984400926068e-05, 'epoch': 0.41} {'loss': 0.5762, 'learning_rate': 1.8421803247880223e-05, 'epoch': 0.41} {'loss': 0.5692, 'learning_rate': 1.8421622085327765e-05, 'epoch': 0.41} {'loss': 0.5311, 'learning_rate': 1.8421440913268897e-05, 'epoch': 0.41} {'loss': 0.4557, 'learning_rate': 1.8421259731703825e-05, 'epoch': 0.41} {'loss': 0.789, 'learning_rate': 1.842107854063275e-05, 'epoch': 0.41} {'loss': 0.5926, 'learning_rate': 1.8420897340055878e-05, 'epoch': 0.41} {'loss': 0.5801, 'learning_rate': 1.8420716129973416e-05, 'epoch': 0.41} {'loss': 0.682, 'learning_rate': 1.8420534910385564e-05, 'epoch': 0.41} {'loss': 0.5717, 'learning_rate': 1.8420353681292532e-05, 'epoch': 0.41} {'loss': 0.6292, 'learning_rate': 1.8420172442694523e-05, 'epoch': 0.41} {'loss': 0.7348, 'learning_rate': 1.8419991194591737e-05, 'epoch': 0.41} {'loss': 0.4715, 'learning_rate': 1.8419809936984384e-05, 'epoch': 0.41} {'loss': 0.5978, 'learning_rate': 1.8419628669872668e-05, 'epoch': 0.41} {'loss': 0.5566, 'learning_rate': 1.841944739325679e-05, 'epoch': 0.41} {'loss': 0.6828, 'learning_rate': 1.8419266107136958e-05, 'epoch': 0.41} {'loss': 0.6006, 'learning_rate': 1.8419084811513377e-05, 'epoch': 0.41} {'loss': 0.6094, 'learning_rate': 1.8418903506386246e-05, 'epoch': 0.41} {'loss': 0.4843, 'learning_rate': 1.8418722191755778e-05, 'epoch': 0.41} {'loss': 0.7236, 'learning_rate': 1.8418540867622173e-05, 'epoch': 0.41} {'loss': 0.5001, 'learning_rate': 1.8418359533985634e-05, 'epoch': 0.41} {'loss': 0.7262, 'learning_rate': 1.841817819084637e-05, 'epoch': 0.41} {'loss': 0.5912, 'learning_rate': 1.841799683820458e-05, 'epoch': 0.41} {'loss': 0.4773, 'learning_rate': 1.8417815476060478e-05, 'epoch': 0.41} {'loss': 0.4855, 'learning_rate': 1.8417634104414257e-05, 'epoch': 0.41} {'loss': 0.5583, 'learning_rate': 1.8417452723266133e-05, 'epoch': 0.41} {'loss': 0.6527, 'learning_rate': 1.8417271332616304e-05, 'epoch': 0.41} {'loss': 0.5699, 'learning_rate': 1.841708993246497e-05, 'epoch': 0.41} {'loss': 0.5317, 'learning_rate': 1.8416908522812352e-05, 'epoch': 0.41} {'loss': 0.7011, 'learning_rate': 1.8416727103658642e-05, 'epoch': 0.41} {'loss': 0.6772, 'learning_rate': 1.8416545675004044e-05, 'epoch': 0.41} {'loss': 0.4867, 'learning_rate': 1.841636423684877e-05, 'epoch': 0.41} {'loss': 0.5638, 'learning_rate': 1.841618278919302e-05, 'epoch': 0.41} {'loss': 0.5888, 'learning_rate': 1.8416001332037e-05, 'epoch': 0.41} {'loss': 0.5103, 'learning_rate': 1.8415819865380914e-05, 'epoch': 0.41} {'loss': 0.6593, 'learning_rate': 1.841563838922497e-05, 'epoch': 0.41} {'loss': 0.6661, 'learning_rate': 1.8415456903569367e-05, 'epoch': 0.41} {'loss': 0.4962, 'learning_rate': 1.8415275408414315e-05, 'epoch': 0.41} {'loss': 0.7865, 'learning_rate': 1.8415093903760018e-05, 'epoch': 0.41} {'loss': 0.6247, 'learning_rate': 1.8414912389606677e-05, 'epoch': 0.41} {'loss': 0.5014, 'learning_rate': 1.8414730865954505e-05, 'epoch': 0.41} {'loss': 0.5654, 'learning_rate': 1.8414549332803702e-05, 'epoch': 0.41} {'loss': 0.5449, 'learning_rate': 1.841436779015447e-05, 'epoch': 0.41} {'loss': 0.4694, 'learning_rate': 1.8414186238007018e-05, 'epoch': 0.41} {'loss': 0.7382, 'learning_rate': 1.841400467636155e-05, 'epoch': 0.41} {'loss': 0.7637, 'learning_rate': 1.841382310521827e-05, 'epoch': 0.41} {'loss': 0.5401, 'learning_rate': 1.8413641524577382e-05, 'epoch': 0.41} {'loss': 0.8049, 'learning_rate': 1.8413459934439094e-05, 'epoch': 0.41} {'loss': 0.6328, 'learning_rate': 1.841327833480361e-05, 'epoch': 0.41} {'loss': 0.5006, 'learning_rate': 1.8413096725671135e-05, 'epoch': 0.41} {'loss': 0.6108, 'learning_rate': 1.8412915107041877e-05, 'epoch': 0.41} {'loss': 0.4473, 'learning_rate': 1.841273347891603e-05, 'epoch': 0.41} {'loss': 0.5702, 'learning_rate': 1.841255184129381e-05, 'epoch': 0.41} {'loss': 0.5125, 'learning_rate': 1.841237019417542e-05, 'epoch': 0.41} {'loss': 0.6929, 'learning_rate': 1.8412188537561064e-05, 'epoch': 0.41} {'loss': 0.5509, 'learning_rate': 1.8412006871450944e-05, 'epoch': 0.41} {'loss': 0.4229, 'learning_rate': 1.8411825195845273e-05, 'epoch': 0.41} {'loss': 0.6326, 'learning_rate': 1.8411643510744244e-05, 'epoch': 0.41} {'loss': 0.6661, 'learning_rate': 1.8411461816148074e-05, 'epoch': 0.41} {'loss': 0.5912, 'learning_rate': 1.8411280112056963e-05, 'epoch': 0.41} {'loss': 0.5969, 'learning_rate': 1.8411098398471114e-05, 'epoch': 0.41} {'loss': 0.5759, 'learning_rate': 1.8410916675390737e-05, 'epoch': 0.41} {'loss': 0.5294, 'learning_rate': 1.8410734942816032e-05, 'epoch': 0.41} {'loss': 0.5441, 'learning_rate': 1.841055320074721e-05, 'epoch': 0.41} {'loss': 0.6313, 'learning_rate': 1.841037144918447e-05, 'epoch': 0.41} {'loss': 0.6317, 'learning_rate': 1.8410189688128017e-05, 'epoch': 0.41} {'loss': 0.5652, 'learning_rate': 1.8410007917578063e-05, 'epoch': 0.41} {'loss': 0.6023, 'learning_rate': 1.840982613753481e-05, 'epoch': 0.41} {'loss': 0.5557, 'learning_rate': 1.840964434799846e-05, 'epoch': 0.41} {'loss': 0.5099, 'learning_rate': 1.8409462548969222e-05, 'epoch': 0.41} {'loss': 0.7363, 'learning_rate': 1.84092807404473e-05, 'epoch': 0.41} {'loss': 0.6208, 'learning_rate': 1.84090989224329e-05, 'epoch': 0.41} {'loss': 0.6456, 'learning_rate': 1.8408917094926222e-05, 'epoch': 0.41} {'loss': 0.425, 'learning_rate': 1.840873525792748e-05, 'epoch': 0.41} {'loss': 0.5356, 'learning_rate': 1.8408553411436876e-05, 'epoch': 0.41} {'loss': 0.6848, 'learning_rate': 1.840837155545461e-05, 'epoch': 0.41} {'loss': 0.5772, 'learning_rate': 1.8408189689980897e-05, 'epoch': 0.42} {'loss': 0.7633, 'learning_rate': 1.840800781501593e-05, 'epoch': 0.42} {'loss': 0.6387, 'learning_rate': 1.8407825930559925e-05, 'epoch': 0.42} {'loss': 0.4792, 'learning_rate': 1.840764403661308e-05, 'epoch': 0.42} {'loss': 0.6396, 'learning_rate': 1.8407462133175608e-05, 'epoch': 0.42} {'loss': 0.4948, 'learning_rate': 1.8407280220247707e-05, 'epoch': 0.42} {'loss': 0.554, 'learning_rate': 1.8407098297829588e-05, 'epoch': 0.42} {'loss': 0.6584, 'learning_rate': 1.840691636592145e-05, 'epoch': 0.42} {'loss': 0.5544, 'learning_rate': 1.840673442452351e-05, 'epoch': 0.42} {'loss': 0.6954, 'learning_rate': 1.8406552473635955e-05, 'epoch': 0.42} {'loss': 0.5114, 'learning_rate': 1.8406370513259006e-05, 'epoch': 0.42} {'loss': 0.4464, 'learning_rate': 1.8406188543392863e-05, 'epoch': 0.42} {'loss': 0.5708, 'learning_rate': 1.840600656403773e-05, 'epoch': 0.42} {'loss': 0.4534, 'learning_rate': 1.8405824575193815e-05, 'epoch': 0.42} {'loss': 0.4916, 'learning_rate': 1.8405642576861323e-05, 'epoch': 0.42} {'loss': 0.5343, 'learning_rate': 1.840546056904046e-05, 'epoch': 0.42} {'loss': 0.4818, 'learning_rate': 1.840527855173143e-05, 'epoch': 0.42} {'loss': 0.6591, 'learning_rate': 1.840509652493444e-05, 'epoch': 0.42} {'loss': 0.7226, 'learning_rate': 1.840491448864969e-05, 'epoch': 0.42} {'loss': 0.5451, 'learning_rate': 1.8404732442877395e-05, 'epoch': 0.42} {'loss': 0.5725, 'learning_rate': 1.840455038761775e-05, 'epoch': 0.42} {'loss': 0.6888, 'learning_rate': 1.840436832287097e-05, 'epoch': 0.42} {'loss': 0.5545, 'learning_rate': 1.8404186248637256e-05, 'epoch': 0.42} {'loss': 0.7033, 'learning_rate': 1.840400416491681e-05, 'epoch': 0.42} {'loss': 0.7021, 'learning_rate': 1.8403822071709845e-05, 'epoch': 0.42} {'loss': 0.3762, 'learning_rate': 1.840363996901656e-05, 'epoch': 0.42} {'loss': 0.4392, 'learning_rate': 1.8403457856837167e-05, 'epoch': 0.42} {'loss': 0.5685, 'learning_rate': 1.8403275735171867e-05, 'epoch': 0.42} {'loss': 0.6431, 'learning_rate': 1.8403093604020866e-05, 'epoch': 0.42} {'loss': 0.6041, 'learning_rate': 1.840291146338437e-05, 'epoch': 0.42} {'loss': 0.5353, 'learning_rate': 1.8402729313262588e-05, 'epoch': 0.42} {'loss': 0.4713, 'learning_rate': 1.8402547153655718e-05, 'epoch': 0.42} {'loss': 0.7211, 'learning_rate': 1.8402364984563973e-05, 'epoch': 0.42} {'loss': 0.5648, 'learning_rate': 1.8402182805987552e-05, 'epoch': 0.42} {'loss': 0.5932, 'learning_rate': 1.8402000617926667e-05, 'epoch': 0.42} {'loss': 0.5108, 'learning_rate': 1.840181842038152e-05, 'epoch': 0.42} {'loss': 0.5107, 'learning_rate': 1.8401636213352318e-05, 'epoch': 0.42} {'loss': 0.5968, 'learning_rate': 1.8401453996839267e-05, 'epoch': 0.42} {'loss': 0.5223, 'learning_rate': 1.840127177084257e-05, 'epoch': 0.42} {'loss': 0.7757, 'learning_rate': 1.840108953536244e-05, 'epoch': 0.42} {'loss': 0.6064, 'learning_rate': 1.8400907290399074e-05, 'epoch': 0.42} {'loss': 0.5366, 'learning_rate': 1.840072503595268e-05, 'epoch': 0.42} {'loss': 0.6131, 'learning_rate': 1.840054277202347e-05, 'epoch': 0.42} {'loss': 0.5644, 'learning_rate': 1.8400360498611638e-05, 'epoch': 0.42} {'loss': 0.5206, 'learning_rate': 1.84001782157174e-05, 'epoch': 0.42} {'loss': 0.7431, 'learning_rate': 1.839999592334096e-05, 'epoch': 0.42} {'loss': 0.5832, 'learning_rate': 1.8399813621482515e-05, 'epoch': 0.42} {'loss': 0.8316, 'learning_rate': 1.8399631310142287e-05, 'epoch': 0.42} {'loss': 0.484, 'learning_rate': 1.8399448989320462e-05, 'epoch': 0.42} {'loss': 0.8305, 'learning_rate': 1.8399266659017266e-05, 'epoch': 0.42} {'loss': 0.6305, 'learning_rate': 1.839908431923289e-05, 'epoch': 0.42} {'loss': 0.4284, 'learning_rate': 1.8398901969967545e-05, 'epoch': 0.42} {'loss': 0.5618, 'learning_rate': 1.8398719611221437e-05, 'epoch': 0.42} {'loss': 0.6133, 'learning_rate': 1.8398537242994774e-05, 'epoch': 0.42} {'loss': 0.5167, 'learning_rate': 1.8398354865287758e-05, 'epoch': 0.42} {'loss': 0.5615, 'learning_rate': 1.8398172478100594e-05, 'epoch': 0.42} {'loss': 0.6494, 'learning_rate': 1.8397990081433495e-05, 'epoch': 0.42} {'loss': 0.5311, 'learning_rate': 1.8397807675286657e-05, 'epoch': 0.42} {'loss': 0.5258, 'learning_rate': 1.8397625259660298e-05, 'epoch': 0.42} {'loss': 0.6992, 'learning_rate': 1.839744283455461e-05, 'epoch': 0.42} {'loss': 0.7396, 'learning_rate': 1.839726039996981e-05, 'epoch': 0.42} {'loss': 0.7811, 'learning_rate': 1.8397077955906098e-05, 'epoch': 0.42} {'loss': 0.4703, 'learning_rate': 1.8396895502363684e-05, 'epoch': 0.42} {'loss': 0.4798, 'learning_rate': 1.8396713039342768e-05, 'epoch': 0.42} {'loss': 0.4956, 'learning_rate': 1.8396530566843564e-05, 'epoch': 0.42} {'loss': 0.6296, 'learning_rate': 1.839634808486627e-05, 'epoch': 0.42} {'loss': 0.5533, 'learning_rate': 1.8396165593411096e-05, 'epoch': 0.42} {'loss': 0.6547, 'learning_rate': 1.839598309247825e-05, 'epoch': 0.42} {'loss': 0.4137, 'learning_rate': 1.8395800582067934e-05, 'epoch': 0.42} {'loss': 0.6235, 'learning_rate': 1.8395618062180356e-05, 'epoch': 0.42} {'loss': 0.5948, 'learning_rate': 1.839543553281572e-05, 'epoch': 0.42} {'loss': 0.6643, 'learning_rate': 1.8395252993974236e-05, 'epoch': 0.42} {'loss': 0.659, 'learning_rate': 1.8395070445656106e-05, 'epoch': 0.42} {'loss': 0.6027, 'learning_rate': 1.839488788786154e-05, 'epoch': 0.42} {'loss': 0.6785, 'learning_rate': 1.839470532059074e-05, 'epoch': 0.42} {'loss': 0.3956, 'learning_rate': 1.839452274384392e-05, 'epoch': 0.42} {'loss': 0.6949, 'learning_rate': 1.839434015762127e-05, 'epoch': 0.42} {'loss': 0.7269, 'learning_rate': 1.8394157561923012e-05, 'epoch': 0.42} {'loss': 0.604, 'learning_rate': 1.8393974956749348e-05, 'epoch': 0.42} {'loss': 0.6169, 'learning_rate': 1.839379234210048e-05, 'epoch': 0.42} {'loss': 0.5928, 'learning_rate': 1.8393609717976616e-05, 'epoch': 0.42} {'loss': 0.6442, 'learning_rate': 1.8393427084377963e-05, 'epoch': 0.42} {'loss': 0.6187, 'learning_rate': 1.839324444130473e-05, 'epoch': 0.42} {'loss': 0.6128, 'learning_rate': 1.8393061788757116e-05, 'epoch': 0.42} {'loss': 0.6067, 'learning_rate': 1.8392879126735333e-05, 'epoch': 0.42} {'loss': 0.8083, 'learning_rate': 1.8392696455239585e-05, 'epoch': 0.42} {'loss': 0.7038, 'learning_rate': 1.839251377427008e-05, 'epoch': 0.42} {'loss': 0.7336, 'learning_rate': 1.839233108382702e-05, 'epoch': 0.42} {'loss': 0.5383, 'learning_rate': 1.8392148383910617e-05, 'epoch': 0.42} {'loss': 0.6389, 'learning_rate': 1.839196567452107e-05, 'epoch': 0.42} {'loss': 0.5545, 'learning_rate': 1.8391782955658593e-05, 'epoch': 0.42} {'loss': 0.5779, 'learning_rate': 1.839160022732339e-05, 'epoch': 0.42} {'loss': 0.6036, 'learning_rate': 1.8391417489515663e-05, 'epoch': 0.42} {'loss': 0.6675, 'learning_rate': 1.8391234742235626e-05, 'epoch': 0.42} {'loss': 0.6558, 'learning_rate': 1.8391051985483478e-05, 'epoch': 0.42} {'loss': 0.6559, 'learning_rate': 1.8390869219259427e-05, 'epoch': 0.42} {'loss': 0.7672, 'learning_rate': 1.8390686443563682e-05, 'epoch': 0.42} {'loss': 0.5496, 'learning_rate': 1.8390503658396444e-05, 'epoch': 0.42} {'loss': 0.4695, 'learning_rate': 1.8390320863757925e-05, 'epoch': 0.42} {'loss': 0.6002, 'learning_rate': 1.839013805964833e-05, 'epoch': 0.42} {'loss': 0.4871, 'learning_rate': 1.8389955246067864e-05, 'epoch': 0.42} {'loss': 0.6053, 'learning_rate': 1.8389772423016732e-05, 'epoch': 0.42} {'loss': 0.5539, 'learning_rate': 1.8389589590495146e-05, 'epoch': 0.42} {'loss': 0.5503, 'learning_rate': 1.8389406748503307e-05, 'epoch': 0.42} {'loss': 0.4718, 'learning_rate': 1.8389223897041423e-05, 'epoch': 0.42} {'loss': 0.5333, 'learning_rate': 1.83890410361097e-05, 'epoch': 0.42} {'loss': 0.6836, 'learning_rate': 1.8388858165708347e-05, 'epoch': 0.42} {'loss': 0.6221, 'learning_rate': 1.8388675285837564e-05, 'epoch': 0.42} {'loss': 0.6216, 'learning_rate': 1.838849239649757e-05, 'epoch': 0.42} {'loss': 0.4738, 'learning_rate': 1.8388309497688553e-05, 'epoch': 0.42} {'loss': 0.4587, 'learning_rate': 1.8388126589410738e-05, 'epoch': 0.42} {'loss': 0.6823, 'learning_rate': 1.8387943671664318e-05, 'epoch': 0.42} {'loss': 0.5757, 'learning_rate': 1.8387760744449506e-05, 'epoch': 0.42} {'loss': 0.6048, 'learning_rate': 1.838757780776651e-05, 'epoch': 0.42} {'loss': 0.5107, 'learning_rate': 1.8387394861615527e-05, 'epoch': 0.42} {'loss': 0.5779, 'learning_rate': 1.8387211905996777e-05, 'epoch': 0.42} {'loss': 0.5947, 'learning_rate': 1.8387028940910458e-05, 'epoch': 0.42} {'loss': 0.6324, 'learning_rate': 1.8386845966356777e-05, 'epoch': 0.42} {'loss': 0.7779, 'learning_rate': 1.8386662982335938e-05, 'epoch': 0.42} {'loss': 0.5785, 'learning_rate': 1.8386479988848157e-05, 'epoch': 0.42} {'loss': 0.5764, 'learning_rate': 1.8386296985893634e-05, 'epoch': 0.42} {'loss': 0.5153, 'learning_rate': 1.8386113973472573e-05, 'epoch': 0.42} {'loss': 0.6694, 'learning_rate': 1.838593095158519e-05, 'epoch': 0.42} {'loss': 0.5321, 'learning_rate': 1.838574792023168e-05, 'epoch': 0.42} {'loss': 0.6263, 'learning_rate': 1.838556487941226e-05, 'epoch': 0.42} {'loss': 0.7059, 'learning_rate': 1.8385381829127128e-05, 'epoch': 0.42} {'loss': 0.468, 'learning_rate': 1.8385198769376495e-05, 'epoch': 0.42} {'loss': 0.534, 'learning_rate': 1.8385015700160567e-05, 'epoch': 0.42} {'loss': 0.6329, 'learning_rate': 1.838483262147955e-05, 'epoch': 0.42} {'loss': 0.4745, 'learning_rate': 1.8384649533333652e-05, 'epoch': 0.42} {'loss': 0.6751, 'learning_rate': 1.8384466435723083e-05, 'epoch': 0.42} {'loss': 0.5848, 'learning_rate': 1.838428332864804e-05, 'epoch': 0.42} {'loss': 0.6892, 'learning_rate': 1.838410021210874e-05, 'epoch': 0.42} {'loss': 0.5567, 'learning_rate': 1.8383917086105383e-05, 'epoch': 0.42} {'loss': 0.554, 'learning_rate': 1.838373395063818e-05, 'epoch': 0.42} {'loss': 0.6003, 'learning_rate': 1.8383550805707332e-05, 'epoch': 0.42} {'loss': 0.5035, 'learning_rate': 1.838336765131305e-05, 'epoch': 0.42} {'loss': 0.3624, 'learning_rate': 1.8383184487455542e-05, 'epoch': 0.42} {'loss': 0.5036, 'learning_rate': 1.8383001314135012e-05, 'epoch': 0.42} {'loss': 0.5943, 'learning_rate': 1.8382818131351668e-05, 'epoch': 0.42} {'loss': 0.6361, 'learning_rate': 1.8382634939105715e-05, 'epoch': 0.42} {'loss': 0.6558, 'learning_rate': 1.8382451737397365e-05, 'epoch': 0.42} {'loss': 0.6839, 'learning_rate': 1.8382268526226816e-05, 'epoch': 0.42} {'loss': 0.4848, 'learning_rate': 1.8382085305594285e-05, 'epoch': 0.42} {'loss': 0.6168, 'learning_rate': 1.838190207549997e-05, 'epoch': 0.42} {'loss': 0.5748, 'learning_rate': 1.8381718835944083e-05, 'epoch': 0.42} {'loss': 0.5582, 'learning_rate': 1.8381535586926828e-05, 'epoch': 0.42} {'loss': 0.6635, 'learning_rate': 1.838135232844841e-05, 'epoch': 0.42} {'loss': 0.5111, 'learning_rate': 1.8381169060509047e-05, 'epoch': 0.42} {'loss': 0.7037, 'learning_rate': 1.8380985783108934e-05, 'epoch': 0.42} {'loss': 0.4767, 'learning_rate': 1.838080249624828e-05, 'epoch': 0.42} {'loss': 0.6494, 'learning_rate': 1.8380619199927294e-05, 'epoch': 0.42} {'loss': 0.6857, 'learning_rate': 1.8380435894146184e-05, 'epoch': 0.42} {'loss': 0.6428, 'learning_rate': 1.8380252578905155e-05, 'epoch': 0.42} {'loss': 0.5315, 'learning_rate': 1.8380069254204412e-05, 'epoch': 0.42} {'loss': 0.6003, 'learning_rate': 1.837988592004417e-05, 'epoch': 0.42} {'loss': 0.5772, 'learning_rate': 1.8379702576424628e-05, 'epoch': 0.42} {'loss': 0.7494, 'learning_rate': 1.8379519223345994e-05, 'epoch': 0.42} {'loss': 0.5817, 'learning_rate': 1.8379335860808476e-05, 'epoch': 0.42} {'loss': 0.5632, 'learning_rate': 1.8379152488812282e-05, 'epoch': 0.42} {'loss': 0.5392, 'learning_rate': 1.8378969107357618e-05, 'epoch': 0.42} {'loss': 0.5965, 'learning_rate': 1.8378785716444692e-05, 'epoch': 0.42} {'loss': 0.4092, 'learning_rate': 1.8378602316073708e-05, 'epoch': 0.42} {'loss': 0.6487, 'learning_rate': 1.8378418906244876e-05, 'epoch': 0.42} {'loss': 0.7434, 'learning_rate': 1.8378235486958403e-05, 'epoch': 0.42} {'loss': 0.5651, 'learning_rate': 1.8378052058214496e-05, 'epoch': 0.42} {'loss': 0.5659, 'learning_rate': 1.837786862001336e-05, 'epoch': 0.42} {'loss': 0.6103, 'learning_rate': 1.8377685172355204e-05, 'epoch': 0.42} {'loss': 0.47, 'learning_rate': 1.8377501715240236e-05, 'epoch': 0.42} {'loss': 0.612, 'learning_rate': 1.837731824866866e-05, 'epoch': 0.42} {'loss': 0.7345, 'learning_rate': 1.8377134772640683e-05, 'epoch': 0.42} {'loss': 0.3843, 'learning_rate': 1.837695128715652e-05, 'epoch': 0.42} {'loss': 0.7155, 'learning_rate': 1.8376767792216366e-05, 'epoch': 0.42} {'loss': 0.678, 'learning_rate': 1.8376584287820436e-05, 'epoch': 0.42} {'loss': 0.5796, 'learning_rate': 1.8376400773968935e-05, 'epoch': 0.42} {'loss': 0.5802, 'learning_rate': 1.8376217250662072e-05, 'epoch': 0.42} {'loss': 0.6169, 'learning_rate': 1.837603371790005e-05, 'epoch': 0.42} {'loss': 0.5653, 'learning_rate': 1.8375850175683078e-05, 'epoch': 0.42} {'loss': 0.6018, 'learning_rate': 1.8375666624011366e-05, 'epoch': 0.42} {'loss': 0.567, 'learning_rate': 1.837548306288512e-05, 'epoch': 0.42} {'loss': 0.3934, 'learning_rate': 1.8375299492304545e-05, 'epoch': 0.42} {'loss': 0.6295, 'learning_rate': 1.837511591226985e-05, 'epoch': 0.42} {'loss': 0.5504, 'learning_rate': 1.837493232278124e-05, 'epoch': 0.42} {'loss': 0.4838, 'learning_rate': 1.8374748723838927e-05, 'epoch': 0.42} {'loss': 0.4535, 'learning_rate': 1.837456511544311e-05, 'epoch': 0.42} {'loss': 0.4855, 'learning_rate': 1.8374381497594007e-05, 'epoch': 0.42} {'loss': 0.4935, 'learning_rate': 1.8374197870291818e-05, 'epoch': 0.42} {'loss': 0.5751, 'learning_rate': 1.8374014233536754e-05, 'epoch': 0.42} {'loss': 0.558, 'learning_rate': 1.8373830587329012e-05, 'epoch': 0.42} {'loss': 0.6749, 'learning_rate': 1.8373646931668817e-05, 'epoch': 0.42} {'loss': 0.5313, 'learning_rate': 1.837346326655636e-05, 'epoch': 0.42} {'loss': 0.4986, 'learning_rate': 1.837327959199186e-05, 'epoch': 0.42} {'loss': 0.6059, 'learning_rate': 1.8373095907975523e-05, 'epoch': 0.42} {'loss': 0.6322, 'learning_rate': 1.8372912214507544e-05, 'epoch': 0.42} {'loss': 0.542, 'learning_rate': 1.837272851158815e-05, 'epoch': 0.42} {'loss': 0.7251, 'learning_rate': 1.8372544799217525e-05, 'epoch': 0.42} {'loss': 0.6869, 'learning_rate': 1.8372361077395898e-05, 'epoch': 0.42} {'loss': 0.5015, 'learning_rate': 1.8372177346123463e-05, 'epoch': 0.42} {'loss': 0.6707, 'learning_rate': 1.8371993605400435e-05, 'epoch': 0.42} {'loss': 0.537, 'learning_rate': 1.8371809855227016e-05, 'epoch': 0.42} {'loss': 0.6044, 'learning_rate': 1.8371626095603416e-05, 'epoch': 0.42} {'loss': 0.6869, 'learning_rate': 1.8371442326529846e-05, 'epoch': 0.42} {'loss': 0.4757, 'learning_rate': 1.83712585480065e-05, 'epoch': 0.42} {'loss': 0.6534, 'learning_rate': 1.8371074760033604e-05, 'epoch': 0.42} {'loss': 0.5435, 'learning_rate': 1.8370890962611355e-05, 'epoch': 0.42} {'loss': 0.426, 'learning_rate': 1.837070715573996e-05, 'epoch': 0.42} {'loss': 0.5358, 'learning_rate': 1.8370523339419627e-05, 'epoch': 0.42} {'loss': 0.7342, 'learning_rate': 1.8370339513650567e-05, 'epoch': 0.42} {'loss': 0.5267, 'learning_rate': 1.8370155678432987e-05, 'epoch': 0.42} {'loss': 0.5254, 'learning_rate': 1.836997183376709e-05, 'epoch': 0.42} {'loss': 0.5789, 'learning_rate': 1.8369787979653085e-05, 'epoch': 0.42} {'loss': 0.6119, 'learning_rate': 1.8369604116091183e-05, 'epoch': 0.42} {'loss': 0.6896, 'learning_rate': 1.8369420243081592e-05, 'epoch': 0.42} {'loss': 0.5155, 'learning_rate': 1.8369236360624513e-05, 'epoch': 0.42} {'loss': 0.4258, 'learning_rate': 1.836905246872016e-05, 'epoch': 0.42} {'loss': 0.5692, 'learning_rate': 1.836886856736874e-05, 'epoch': 0.42} {'loss': 0.5874, 'learning_rate': 1.8368684656570456e-05, 'epoch': 0.42} {'loss': 0.5139, 'learning_rate': 1.836850073632552e-05, 'epoch': 0.42} {'loss': 0.5973, 'learning_rate': 1.8368316806634133e-05, 'epoch': 0.42} {'loss': 0.5165, 'learning_rate': 1.8368132867496513e-05, 'epoch': 0.42} {'loss': 0.6093, 'learning_rate': 1.836794891891286e-05, 'epoch': 0.42} {'loss': 0.5272, 'learning_rate': 1.8367764960883386e-05, 'epoch': 0.42} {'loss': 0.649, 'learning_rate': 1.8367580993408296e-05, 'epoch': 0.42} {'loss': 0.6639, 'learning_rate': 1.83673970164878e-05, 'epoch': 0.42} {'loss': 0.4845, 'learning_rate': 1.83672130301221e-05, 'epoch': 0.42} {'loss': 0.6431, 'learning_rate': 1.836702903431141e-05, 'epoch': 0.42} {'loss': 0.4893, 'learning_rate': 1.8366845029055932e-05, 'epoch': 0.42} {'loss': 0.497, 'learning_rate': 1.836666101435588e-05, 'epoch': 0.42} {'loss': 0.5095, 'learning_rate': 1.836647699021146e-05, 'epoch': 0.42} {'loss': 0.7255, 'learning_rate': 1.8366292956622872e-05, 'epoch': 0.42} {'loss': 0.6275, 'learning_rate': 1.836610891359034e-05, 'epoch': 0.42} {'loss': 0.5696, 'learning_rate': 1.8365924861114052e-05, 'epoch': 0.42} {'loss': 0.4207, 'learning_rate': 1.836574079919423e-05, 'epoch': 0.42} {'loss': 0.4545, 'learning_rate': 1.8365556727831077e-05, 'epoch': 0.42} {'loss': 0.4019, 'learning_rate': 1.8365372647024804e-05, 'epoch': 0.42} {'loss': 0.4992, 'learning_rate': 1.8365188556775612e-05, 'epoch': 0.42} {'loss': 0.4206, 'learning_rate': 1.8365004457083717e-05, 'epoch': 0.42} {'loss': 0.7318, 'learning_rate': 1.836482034794932e-05, 'epoch': 0.42} {'loss': 0.6132, 'learning_rate': 1.836463622937263e-05, 'epoch': 0.42} {'loss': 0.6198, 'learning_rate': 1.836445210135386e-05, 'epoch': 0.42} {'loss': 0.6459, 'learning_rate': 1.8364267963893214e-05, 'epoch': 0.42} {'loss': 0.5612, 'learning_rate': 1.8364083816990894e-05, 'epoch': 0.42} {'loss': 0.6233, 'learning_rate': 1.836389966064712e-05, 'epoch': 0.42} {'loss': 0.5839, 'learning_rate': 1.8363715494862092e-05, 'epoch': 0.42} {'loss': 0.6212, 'learning_rate': 1.836353131963602e-05, 'epoch': 0.42} {'loss': 0.475, 'learning_rate': 1.836334713496911e-05, 'epoch': 0.42} {'loss': 0.4971, 'learning_rate': 1.8363162940861575e-05, 'epoch': 0.42} {'loss': 0.4649, 'learning_rate': 1.8362978737313615e-05, 'epoch': 0.42} {'loss': 0.582, 'learning_rate': 1.8362794524325446e-05, 'epoch': 0.42} {'loss': 0.5399, 'learning_rate': 1.8362610301897267e-05, 'epoch': 0.42} {'loss': 0.5749, 'learning_rate': 1.83624260700293e-05, 'epoch': 0.42} {'loss': 0.5693, 'learning_rate': 1.8362241828721735e-05, 'epoch': 0.42} {'loss': 0.4948, 'learning_rate': 1.8362057577974792e-05, 'epoch': 0.42} {'loss': 0.593, 'learning_rate': 1.836187331778868e-05, 'epoch': 0.42} {'loss': 0.6049, 'learning_rate': 1.83616890481636e-05, 'epoch': 0.42} {'loss': 0.6304, 'learning_rate': 1.836150476909976e-05, 'epoch': 0.42} {'loss': 0.6491, 'learning_rate': 1.8361320480597378e-05, 'epoch': 0.42} {'loss': 0.4464, 'learning_rate': 1.8361136182656653e-05, 'epoch': 0.42} {'loss': 0.7215, 'learning_rate': 1.836095187527779e-05, 'epoch': 0.42} {'loss': 0.566, 'learning_rate': 1.8360767558461008e-05, 'epoch': 0.42} {'loss': 0.5139, 'learning_rate': 1.836058323220651e-05, 'epoch': 0.42} {'loss': 0.4415, 'learning_rate': 1.8360398896514497e-05, 'epoch': 0.42} {'loss': 0.623, 'learning_rate': 1.8360214551385186e-05, 'epoch': 0.42} {'loss': 0.6611, 'learning_rate': 1.8360030196818784e-05, 'epoch': 0.42} {'loss': 0.6157, 'learning_rate': 1.8359845832815496e-05, 'epoch': 0.42} {'loss': 0.4036, 'learning_rate': 1.8359661459375535e-05, 'epoch': 0.42} {'loss': 0.7619, 'learning_rate': 1.8359477076499103e-05, 'epoch': 0.42} {'loss': 0.5992, 'learning_rate': 1.8359292684186415e-05, 'epoch': 0.42} {'loss': 0.7039, 'learning_rate': 1.835910828243767e-05, 'epoch': 0.42} {'loss': 0.6433, 'learning_rate': 1.8358923871253083e-05, 'epoch': 0.42} {'loss': 0.692, 'learning_rate': 1.8358739450632862e-05, 'epoch': 0.42} {'loss': 0.5524, 'learning_rate': 1.8358555020577213e-05, 'epoch': 0.42} {'loss': 0.6349, 'learning_rate': 1.835837058108634e-05, 'epoch': 0.42} {'loss': 0.4824, 'learning_rate': 1.8358186132160462e-05, 'epoch': 0.42} {'loss': 0.6265, 'learning_rate': 1.8358001673799784e-05, 'epoch': 0.42} {'loss': 0.5548, 'learning_rate': 1.8357817206004503e-05, 'epoch': 0.42} {'loss': 0.3941, 'learning_rate': 1.835763272877484e-05, 'epoch': 0.42} {'loss': 0.6546, 'learning_rate': 1.8357448242111e-05, 'epoch': 0.42} {'loss': 0.5609, 'learning_rate': 1.835726374601319e-05, 'epoch': 0.42} {'loss': 0.4576, 'learning_rate': 1.8357079240481615e-05, 'epoch': 0.42} {'loss': 0.6205, 'learning_rate': 1.835689472551649e-05, 'epoch': 0.42} {'loss': 0.5656, 'learning_rate': 1.835671020111802e-05, 'epoch': 0.42} {'loss': 0.7302, 'learning_rate': 1.835652566728641e-05, 'epoch': 0.42} {'loss': 0.6108, 'learning_rate': 1.8356341124021874e-05, 'epoch': 0.42} {'loss': 0.7295, 'learning_rate': 1.835615657132462e-05, 'epoch': 0.42} {'loss': 0.6091, 'learning_rate': 1.8355972009194853e-05, 'epoch': 0.42} {'loss': 0.5127, 'learning_rate': 1.835578743763278e-05, 'epoch': 0.42} {'loss': 0.6086, 'learning_rate': 1.8355602856638612e-05, 'epoch': 0.42} {'loss': 0.5204, 'learning_rate': 1.835541826621256e-05, 'epoch': 0.42} {'loss': 0.5678, 'learning_rate': 1.835523366635483e-05, 'epoch': 0.42} {'loss': 0.7577, 'learning_rate': 1.8355049057065626e-05, 'epoch': 0.42} {'loss': 0.4777, 'learning_rate': 1.8354864438345162e-05, 'epoch': 0.42} {'loss': 0.6664, 'learning_rate': 1.8354679810193646e-05, 'epoch': 0.42} {'loss': 0.6357, 'learning_rate': 1.8354495172611286e-05, 'epoch': 0.42} {'loss': 0.4818, 'learning_rate': 1.8354310525598288e-05, 'epoch': 0.42} {'loss': 0.672, 'learning_rate': 1.8354125869154865e-05, 'epoch': 0.42} {'loss': 0.7261, 'learning_rate': 1.835394120328122e-05, 'epoch': 0.42} {'loss': 0.685, 'learning_rate': 1.835375652797756e-05, 'epoch': 0.42} {'loss': 0.6707, 'learning_rate': 1.8353571843244102e-05, 'epoch': 0.42} {'loss': 0.3863, 'learning_rate': 1.835338714908105e-05, 'epoch': 0.42} {'loss': 0.7319, 'learning_rate': 1.835320244548861e-05, 'epoch': 0.42} {'loss': 0.5458, 'learning_rate': 1.8353017732466996e-05, 'epoch': 0.42} {'loss': 0.5178, 'learning_rate': 1.8352833010016414e-05, 'epoch': 0.42} {'loss': 0.5694, 'learning_rate': 1.8352648278137067e-05, 'epoch': 0.42} {'loss': 0.5545, 'learning_rate': 1.8352463536829173e-05, 'epoch': 0.42} {'loss': 0.5155, 'learning_rate': 1.8352278786092935e-05, 'epoch': 0.42} {'loss': 0.6817, 'learning_rate': 1.835209402592856e-05, 'epoch': 0.42} {'loss': 0.6344, 'learning_rate': 1.8351909256336264e-05, 'epoch': 0.42} {'loss': 0.6493, 'learning_rate': 1.8351724477316244e-05, 'epoch': 0.42} {'loss': 0.4937, 'learning_rate': 1.8351539688868717e-05, 'epoch': 0.42} {'loss': 0.507, 'learning_rate': 1.8351354890993892e-05, 'epoch': 0.42} {'loss': 0.5128, 'learning_rate': 1.8351170083691977e-05, 'epoch': 0.42} {'loss': 0.6392, 'learning_rate': 1.835098526696318e-05, 'epoch': 0.42} {'loss': 0.4751, 'learning_rate': 1.8350800440807703e-05, 'epoch': 0.42} {'loss': 0.6486, 'learning_rate': 1.835061560522576e-05, 'epoch': 0.42} {'loss': 0.6277, 'learning_rate': 1.8350430760217564e-05, 'epoch': 0.42} {'loss': 0.6866, 'learning_rate': 1.835024590578332e-05, 'epoch': 0.42} {'loss': 0.4673, 'learning_rate': 1.8350061041923234e-05, 'epoch': 0.42} {'loss': 0.6442, 'learning_rate': 1.8349876168637517e-05, 'epoch': 0.42} {'loss': 0.6323, 'learning_rate': 1.834969128592638e-05, 'epoch': 0.42} {'loss': 0.592, 'learning_rate': 1.8349506393790023e-05, 'epoch': 0.42} {'loss': 0.76, 'learning_rate': 1.834932149222867e-05, 'epoch': 0.42} {'loss': 0.6706, 'learning_rate': 1.8349136581242515e-05, 'epoch': 0.42} {'loss': 0.5332, 'learning_rate': 1.8348951660831774e-05, 'epoch': 0.42} {'loss': 0.5821, 'learning_rate': 1.8348766730996653e-05, 'epoch': 0.42} {'loss': 0.5942, 'learning_rate': 1.834858179173736e-05, 'epoch': 0.42} {'loss': 0.6459, 'learning_rate': 1.834839684305411e-05, 'epoch': 0.42} {'loss': 0.4417, 'learning_rate': 1.8348211884947106e-05, 'epoch': 0.42} {'loss': 0.6118, 'learning_rate': 1.834802691741656e-05, 'epoch': 0.42} {'loss': 0.6056, 'learning_rate': 1.8347841940462676e-05, 'epoch': 0.42} {'loss': 0.691, 'learning_rate': 1.8347656954085667e-05, 'epoch': 0.42} {'loss': 0.4272, 'learning_rate': 1.8347471958285742e-05, 'epoch': 0.42} {'loss': 0.5784, 'learning_rate': 1.8347286953063107e-05, 'epoch': 0.42} {'loss': 0.4731, 'learning_rate': 1.8347101938417972e-05, 'epoch': 0.42} {'loss': 0.6129, 'learning_rate': 1.8346916914350544e-05, 'epoch': 0.42} {'loss': 0.7219, 'learning_rate': 1.834673188086104e-05, 'epoch': 0.42} {'loss': 0.6078, 'learning_rate': 1.8346546837949658e-05, 'epoch': 0.42} {'loss': 0.5759, 'learning_rate': 1.8346361785616612e-05, 'epoch': 0.42} {'loss': 0.5707, 'learning_rate': 1.8346176723862114e-05, 'epoch': 0.42} {'loss': 0.5538, 'learning_rate': 1.834599165268637e-05, 'epoch': 0.42} {'loss': 0.3866, 'learning_rate': 1.8345806572089583e-05, 'epoch': 0.42} {'loss': 0.5368, 'learning_rate': 1.8345621482071973e-05, 'epoch': 0.42} {'loss': 0.4853, 'learning_rate': 1.834543638263374e-05, 'epoch': 0.42} {'loss': 0.5852, 'learning_rate': 1.8345251273775097e-05, 'epoch': 0.42} {'loss': 0.6725, 'learning_rate': 1.8345066155496254e-05, 'epoch': 0.42} {'loss': 0.5583, 'learning_rate': 1.8344881027797418e-05, 'epoch': 0.42} {'loss': 0.6639, 'learning_rate': 1.8344695890678794e-05, 'epoch': 0.42} {'loss': 0.4475, 'learning_rate': 1.83445107441406e-05, 'epoch': 0.42} {'loss': 0.6276, 'learning_rate': 1.8344325588183038e-05, 'epoch': 0.42} {'loss': 0.571, 'learning_rate': 1.834414042280632e-05, 'epoch': 0.42} {'loss': 0.6448, 'learning_rate': 1.8343955248010653e-05, 'epoch': 0.42} {'loss': 0.6318, 'learning_rate': 1.8343770063796248e-05, 'epoch': 0.42} {'loss': 0.5299, 'learning_rate': 1.8343584870163314e-05, 'epoch': 0.42} {'loss': 0.6371, 'learning_rate': 1.834339966711206e-05, 'epoch': 0.42} {'loss': 0.5061, 'learning_rate': 1.8343214454642687e-05, 'epoch': 0.42} {'loss': 0.589, 'learning_rate': 1.834302923275542e-05, 'epoch': 0.42} {'loss': 0.5915, 'learning_rate': 1.8342844001450456e-05, 'epoch': 0.42} {'loss': 0.464, 'learning_rate': 1.834265876072801e-05, 'epoch': 0.42} {'loss': 0.5527, 'learning_rate': 1.8342473510588285e-05, 'epoch': 0.42} {'loss': 0.6928, 'learning_rate': 1.8342288251031495e-05, 'epoch': 0.42} {'loss': 0.5065, 'learning_rate': 1.834210298205785e-05, 'epoch': 0.42} {'loss': 0.5764, 'learning_rate': 1.8341917703667557e-05, 'epoch': 0.42} {'loss': 0.5869, 'learning_rate': 1.8341732415860822e-05, 'epoch': 0.42} {'loss': 0.6829, 'learning_rate': 1.834154711863786e-05, 'epoch': 0.42} {'loss': 0.531, 'learning_rate': 1.8341361811998875e-05, 'epoch': 0.42} {'loss': 0.5535, 'learning_rate': 1.8341176495944083e-05, 'epoch': 0.42} {'loss': 0.7157, 'learning_rate': 1.8340991170473686e-05, 'epoch': 0.42} {'loss': 0.5716, 'learning_rate': 1.8340805835587895e-05, 'epoch': 0.42} {'loss': 0.6829, 'learning_rate': 1.8340620491286922e-05, 'epoch': 0.42} {'loss': 0.4117, 'learning_rate': 1.8340435137570972e-05, 'epoch': 0.42} {'loss': 0.6971, 'learning_rate': 1.834024977444026e-05, 'epoch': 0.42} {'loss': 0.6761, 'learning_rate': 1.834006440189499e-05, 'epoch': 0.42} {'loss': 0.3942, 'learning_rate': 1.8339879019935377e-05, 'epoch': 0.42} {'loss': 0.7058, 'learning_rate': 1.8339693628561623e-05, 'epoch': 0.42} {'loss': 0.5707, 'learning_rate': 1.833950822777394e-05, 'epoch': 0.42} {'loss': 0.5385, 'learning_rate': 1.833932281757254e-05, 'epoch': 0.42} {'loss': 0.5486, 'learning_rate': 1.833913739795763e-05, 'epoch': 0.42} {'loss': 0.5957, 'learning_rate': 1.833895196892942e-05, 'epoch': 0.42} {'loss': 0.5652, 'learning_rate': 1.8338766530488117e-05, 'epoch': 0.42} {'loss': 0.5486, 'learning_rate': 1.8338581082633935e-05, 'epoch': 0.42} {'loss': 0.6836, 'learning_rate': 1.8338395625367078e-05, 'epoch': 0.42} {'loss': 0.5759, 'learning_rate': 1.8338210158687758e-05, 'epoch': 0.42} {'loss': 0.5671, 'learning_rate': 1.8338024682596187e-05, 'epoch': 0.42} {'loss': 0.5799, 'learning_rate': 1.8337839197092572e-05, 'epoch': 0.42} {'loss': 0.4493, 'learning_rate': 1.8337653702177117e-05, 'epoch': 0.42} {'loss': 0.4903, 'learning_rate': 1.833746819785004e-05, 'epoch': 0.42} {'loss': 0.6654, 'learning_rate': 1.8337282684111546e-05, 'epoch': 0.42} {'loss': 0.5999, 'learning_rate': 1.8337097160961847e-05, 'epoch': 0.42} {'loss': 0.4631, 'learning_rate': 1.8336911628401147e-05, 'epoch': 0.42} {'loss': 0.725, 'learning_rate': 1.8336726086429664e-05, 'epoch': 0.42} {'loss': 0.4592, 'learning_rate': 1.83365405350476e-05, 'epoch': 0.42} {'loss': 0.6813, 'learning_rate': 1.8336354974255165e-05, 'epoch': 0.42} {'loss': 0.7441, 'learning_rate': 1.8336169404052576e-05, 'epoch': 0.42} {'loss': 0.5992, 'learning_rate': 1.8335983824440033e-05, 'epoch': 0.42} {'loss': 0.5987, 'learning_rate': 1.8335798235417747e-05, 'epoch': 0.42} {'loss': 0.5475, 'learning_rate': 1.8335612636985934e-05, 'epoch': 0.42} {'loss': 0.5883, 'learning_rate': 1.83354270291448e-05, 'epoch': 0.42} {'loss': 0.6512, 'learning_rate': 1.833524141189455e-05, 'epoch': 0.42} {'loss': 0.5898, 'learning_rate': 1.83350557852354e-05, 'epoch': 0.42} {'loss': 0.6595, 'learning_rate': 1.8334870149167558e-05, 'epoch': 0.42} {'loss': 0.6177, 'learning_rate': 1.833468450369123e-05, 'epoch': 0.42} {'loss': 0.5522, 'learning_rate': 1.833449884880663e-05, 'epoch': 0.42} {'loss': 0.6243, 'learning_rate': 1.8334313184513965e-05, 'epoch': 0.42} {'loss': 0.5476, 'learning_rate': 1.8334127510813443e-05, 'epoch': 0.42} {'loss': 0.6354, 'learning_rate': 1.833394182770528e-05, 'epoch': 0.42} {'loss': 0.4567, 'learning_rate': 1.833375613518968e-05, 'epoch': 0.42} {'loss': 0.5499, 'learning_rate': 1.8333570433266854e-05, 'epoch': 0.42} {'loss': 0.6695, 'learning_rate': 1.8333384721937012e-05, 'epoch': 0.42} {'loss': 0.5484, 'learning_rate': 1.8333199001200364e-05, 'epoch': 0.42} {'loss': 0.7947, 'learning_rate': 1.8333013271057117e-05, 'epoch': 0.42} {'loss': 0.5297, 'learning_rate': 1.833282753150748e-05, 'epoch': 0.42} {'loss': 0.607, 'learning_rate': 1.833264178255167e-05, 'epoch': 0.42} {'loss': 0.6244, 'learning_rate': 1.833245602418989e-05, 'epoch': 0.42} {'loss': 0.6347, 'learning_rate': 1.833227025642235e-05, 'epoch': 0.42} {'loss': 0.7364, 'learning_rate': 1.8332084479249266e-05, 'epoch': 0.42} {'loss': 0.4587, 'learning_rate': 1.833189869267084e-05, 'epoch': 0.42} {'loss': 0.5581, 'learning_rate': 1.8331712896687285e-05, 'epoch': 0.42} {'loss': 0.488, 'learning_rate': 1.833152709129881e-05, 'epoch': 0.42} {'loss': 0.652, 'learning_rate': 1.833134127650563e-05, 'epoch': 0.42} {'loss': 0.4737, 'learning_rate': 1.8331155452307942e-05, 'epoch': 0.42} {'loss': 0.6336, 'learning_rate': 1.833096961870597e-05, 'epoch': 0.42} {'loss': 0.6217, 'learning_rate': 1.8330783775699913e-05, 'epoch': 0.42} {'loss': 0.6374, 'learning_rate': 1.8330597923289987e-05, 'epoch': 0.42} {'loss': 0.5242, 'learning_rate': 1.83304120614764e-05, 'epoch': 0.42} {'loss': 0.4955, 'learning_rate': 1.8330226190259362e-05, 'epoch': 0.42} {'loss': 0.4952, 'learning_rate': 1.8330040309639086e-05, 'epoch': 0.42} {'loss': 0.5214, 'learning_rate': 1.8329854419615775e-05, 'epoch': 0.42} {'loss': 0.5087, 'learning_rate': 1.8329668520189642e-05, 'epoch': 0.42} {'loss': 0.6252, 'learning_rate': 1.83294826113609e-05, 'epoch': 0.42} {'loss': 0.6663, 'learning_rate': 1.8329296693129754e-05, 'epoch': 0.42} {'loss': 0.5928, 'learning_rate': 1.8329110765496415e-05, 'epoch': 0.42} {'loss': 0.6055, 'learning_rate': 1.8328924828461095e-05, 'epoch': 0.42} {'loss': 0.4279, 'learning_rate': 1.8328738882024004e-05, 'epoch': 0.42} {'loss': 0.457, 'learning_rate': 1.832855292618535e-05, 'epoch': 0.42} {'loss': 0.5642, 'learning_rate': 1.8328366960945342e-05, 'epoch': 0.42} {'loss': 0.615, 'learning_rate': 1.8328180986304192e-05, 'epoch': 0.42} {'loss': 0.5451, 'learning_rate': 1.8327995002262108e-05, 'epoch': 0.42} {'loss': 0.6952, 'learning_rate': 1.8327809008819303e-05, 'epoch': 0.42} {'loss': 0.6148, 'learning_rate': 1.8327623005975984e-05, 'epoch': 0.42} {'loss': 0.5948, 'learning_rate': 1.8327436993732364e-05, 'epoch': 0.42} {'loss': 0.538, 'learning_rate': 1.832725097208865e-05, 'epoch': 0.42} {'loss': 0.6175, 'learning_rate': 1.8327064941045054e-05, 'epoch': 0.42} {'loss': 0.6068, 'learning_rate': 1.8326878900601786e-05, 'epoch': 0.42} {'loss': 0.5626, 'learning_rate': 1.8326692850759052e-05, 'epoch': 0.42} {'loss': 0.5763, 'learning_rate': 1.8326506791517067e-05, 'epoch': 0.42} {'loss': 0.5907, 'learning_rate': 1.832632072287604e-05, 'epoch': 0.42} {'loss': 0.5971, 'learning_rate': 1.8326134644836178e-05, 'epoch': 0.42} {'loss': 0.5015, 'learning_rate': 1.8325948557397696e-05, 'epoch': 0.42} {'loss': 0.7526, 'learning_rate': 1.8325762460560798e-05, 'epoch': 0.42} {'loss': 0.5584, 'learning_rate': 1.83255763543257e-05, 'epoch': 0.42} {'loss': 0.6259, 'learning_rate': 1.832539023869261e-05, 'epoch': 0.42} {'loss': 0.4866, 'learning_rate': 1.8325204113661735e-05, 'epoch': 0.42} {'loss': 0.7035, 'learning_rate': 1.832501797923329e-05, 'epoch': 0.42} {'loss': 0.6637, 'learning_rate': 1.832483183540748e-05, 'epoch': 0.42} {'loss': 0.5616, 'learning_rate': 1.8324645682184524e-05, 'epoch': 0.42} {'loss': 0.4444, 'learning_rate': 1.8324459519564618e-05, 'epoch': 0.42} {'loss': 0.6411, 'learning_rate': 1.8324273347547985e-05, 'epoch': 0.42} {'loss': 0.772, 'learning_rate': 1.832408716613483e-05, 'epoch': 0.42} {'loss': 0.7033, 'learning_rate': 1.8323900975325363e-05, 'epoch': 0.42} {'loss': 0.6035, 'learning_rate': 1.8323714775119793e-05, 'epoch': 0.42} {'loss': 0.6081, 'learning_rate': 1.8323528565518334e-05, 'epoch': 0.42} {'loss': 0.7286, 'learning_rate': 1.8323342346521192e-05, 'epoch': 0.42} {'loss': 0.4296, 'learning_rate': 1.832315611812858e-05, 'epoch': 0.42} {'loss': 0.4562, 'learning_rate': 1.8322969880340708e-05, 'epoch': 0.42} {'loss': 0.5455, 'learning_rate': 1.8322783633157786e-05, 'epoch': 0.42} {'loss': 0.6885, 'learning_rate': 1.8322597376580025e-05, 'epoch': 0.42} {'loss': 0.5482, 'learning_rate': 1.8322411110607632e-05, 'epoch': 0.42} {'loss': 0.6224, 'learning_rate': 1.832222483524082e-05, 'epoch': 0.42} {'loss': 0.5763, 'learning_rate': 1.83220385504798e-05, 'epoch': 0.42} {'loss': 0.5153, 'learning_rate': 1.832185225632478e-05, 'epoch': 0.42} {'loss': 0.578, 'learning_rate': 1.832166595277597e-05, 'epoch': 0.42} {'loss': 0.585, 'learning_rate': 1.8321479639833584e-05, 'epoch': 0.42} {'loss': 0.5882, 'learning_rate': 1.832129331749783e-05, 'epoch': 0.42} {'loss': 0.5031, 'learning_rate': 1.8321106985768914e-05, 'epoch': 0.42} {'loss': 0.4525, 'learning_rate': 1.8320920644647056e-05, 'epoch': 0.42} {'loss': 0.5155, 'learning_rate': 1.8320734294132457e-05, 'epoch': 0.42} {'loss': 0.5411, 'learning_rate': 1.8320547934225333e-05, 'epoch': 0.42} {'loss': 0.5456, 'learning_rate': 1.832036156492589e-05, 'epoch': 0.42} {'loss': 0.597, 'learning_rate': 1.8320175186234345e-05, 'epoch': 0.42} {'loss': 0.6774, 'learning_rate': 1.8319988798150904e-05, 'epoch': 0.42} {'loss': 0.6448, 'learning_rate': 1.8319802400675775e-05, 'epoch': 0.42} {'loss': 0.4926, 'learning_rate': 1.8319615993809172e-05, 'epoch': 0.42} {'loss': 0.5196, 'learning_rate': 1.8319429577551308e-05, 'epoch': 0.42} {'loss': 0.7117, 'learning_rate': 1.8319243151902383e-05, 'epoch': 0.43} {'loss': 0.6014, 'learning_rate': 1.8319056716862616e-05, 'epoch': 0.43} {'loss': 0.5682, 'learning_rate': 1.831887027243222e-05, 'epoch': 0.43} {'loss': 0.524, 'learning_rate': 1.8318683818611402e-05, 'epoch': 0.43} {'loss': 0.4175, 'learning_rate': 1.831849735540037e-05, 'epoch': 0.43} {'loss': 0.5366, 'learning_rate': 1.8318310882799335e-05, 'epoch': 0.43} {'loss': 0.6311, 'learning_rate': 1.831812440080851e-05, 'epoch': 0.43} {'loss': 0.5807, 'learning_rate': 1.8317937909428102e-05, 'epoch': 0.43} {'loss': 0.4851, 'learning_rate': 1.831775140865833e-05, 'epoch': 0.43} {'loss': 0.6752, 'learning_rate': 1.8317564898499395e-05, 'epoch': 0.43} {'loss': 0.6245, 'learning_rate': 1.8317378378951507e-05, 'epoch': 0.43} {'loss': 0.5367, 'learning_rate': 1.8317191850014883e-05, 'epoch': 0.43} {'loss': 0.572, 'learning_rate': 1.8317005311689732e-05, 'epoch': 0.43} {'loss': 0.5913, 'learning_rate': 1.8316818763976264e-05, 'epoch': 0.43} {'loss': 0.6274, 'learning_rate': 1.8316632206874686e-05, 'epoch': 0.43} {'loss': 0.6191, 'learning_rate': 1.8316445640385215e-05, 'epoch': 0.43} {'loss': 0.4902, 'learning_rate': 1.8316259064508058e-05, 'epoch': 0.43} {'loss': 0.7082, 'learning_rate': 1.8316072479243424e-05, 'epoch': 0.43} {'loss': 0.744, 'learning_rate': 1.8315885884591527e-05, 'epoch': 0.43} {'loss': 0.6534, 'learning_rate': 1.8315699280552578e-05, 'epoch': 0.43} {'loss': 0.527, 'learning_rate': 1.8315512667126782e-05, 'epoch': 0.43} {'loss': 0.5485, 'learning_rate': 1.8315326044314357e-05, 'epoch': 0.43} {'loss': 0.5934, 'learning_rate': 1.831513941211551e-05, 'epoch': 0.43} {'loss': 0.6574, 'learning_rate': 1.8314952770530448e-05, 'epoch': 0.43} {'loss': 0.8154, 'learning_rate': 1.8314766119559388e-05, 'epoch': 0.43} {'loss': 0.5312, 'learning_rate': 1.8314579459202536e-05, 'epoch': 0.43} {'loss': 0.534, 'learning_rate': 1.8314392789460108e-05, 'epoch': 0.43} {'loss': 0.4756, 'learning_rate': 1.8314206110332307e-05, 'epoch': 0.43} {'loss': 0.5207, 'learning_rate': 1.8314019421819355e-05, 'epoch': 0.43} {'loss': 0.5867, 'learning_rate': 1.8313832723921453e-05, 'epoch': 0.43} {'loss': 0.6922, 'learning_rate': 1.8313646016638813e-05, 'epoch': 0.43} {'loss': 0.6236, 'learning_rate': 1.831345929997165e-05, 'epoch': 0.43} {'loss': 0.664, 'learning_rate': 1.831327257392017e-05, 'epoch': 0.43} {'loss': 0.5832, 'learning_rate': 1.8313085838484587e-05, 'epoch': 0.43} {'loss': 0.502, 'learning_rate': 1.8312899093665113e-05, 'epoch': 0.43} {'loss': 0.6626, 'learning_rate': 1.8312712339461957e-05, 'epoch': 0.43} {'loss': 0.542, 'learning_rate': 1.8312525575875325e-05, 'epoch': 0.43} {'loss': 0.5462, 'learning_rate': 1.8312338802905432e-05, 'epoch': 0.43} {'loss': 0.472, 'learning_rate': 1.8312152020552495e-05, 'epoch': 0.43} {'loss': 0.6459, 'learning_rate': 1.8311965228816716e-05, 'epoch': 0.43} {'loss': 0.5961, 'learning_rate': 1.831177842769831e-05, 'epoch': 0.43} {'loss': 0.5395, 'learning_rate': 1.8311591617197484e-05, 'epoch': 0.43} {'loss': 0.4041, 'learning_rate': 1.8311404797314454e-05, 'epoch': 0.43} {'loss': 0.7635, 'learning_rate': 1.8311217968049427e-05, 'epoch': 0.43} {'loss': 0.6254, 'learning_rate': 1.8311031129402615e-05, 'epoch': 0.43} {'loss': 0.6689, 'learning_rate': 1.8310844281374233e-05, 'epoch': 0.43} {'loss': 0.5289, 'learning_rate': 1.8310657423964483e-05, 'epoch': 0.43} {'loss': 0.6154, 'learning_rate': 1.8310470557173585e-05, 'epoch': 0.43} {'loss': 0.5518, 'learning_rate': 1.8310283681001743e-05, 'epoch': 0.43} {'loss': 0.7121, 'learning_rate': 1.831009679544917e-05, 'epoch': 0.43} {'loss': 0.6527, 'learning_rate': 1.830990990051608e-05, 'epoch': 0.43} {'loss': 0.644, 'learning_rate': 1.830972299620269e-05, 'epoch': 0.43} {'loss': 0.5739, 'learning_rate': 1.830953608250919e-05, 'epoch': 0.43} {'loss': 0.4901, 'learning_rate': 1.830934915943581e-05, 'epoch': 0.43} {'loss': 0.5768, 'learning_rate': 1.8309162226982756e-05, 'epoch': 0.43} {'loss': 0.645, 'learning_rate': 1.8308975285150235e-05, 'epoch': 0.43} {'loss': 0.5623, 'learning_rate': 1.8308788333938464e-05, 'epoch': 0.43} {'loss': 0.5817, 'learning_rate': 1.8308601373347646e-05, 'epoch': 0.43} {'loss': 0.7361, 'learning_rate': 1.8308414403378002e-05, 'epoch': 0.43} {'loss': 0.7062, 'learning_rate': 1.8308227424029734e-05, 'epoch': 0.43} {'loss': 0.7092, 'learning_rate': 1.830804043530306e-05, 'epoch': 0.43} {'loss': 0.5515, 'learning_rate': 1.8307853437198186e-05, 'epoch': 0.43} {'loss': 0.5328, 'learning_rate': 1.8307666429715326e-05, 'epoch': 0.43} {'loss': 0.4111, 'learning_rate': 1.8307479412854693e-05, 'epoch': 0.43} {'loss': 0.5038, 'learning_rate': 1.8307292386616494e-05, 'epoch': 0.43} {'loss': 0.5464, 'learning_rate': 1.830710535100094e-05, 'epoch': 0.43} {'loss': 0.629, 'learning_rate': 1.8306918306008245e-05, 'epoch': 0.43} {'loss': 0.5625, 'learning_rate': 1.8306731251638622e-05, 'epoch': 0.43} {'loss': 0.7087, 'learning_rate': 1.8306544187892276e-05, 'epoch': 0.43} {'loss': 0.6848, 'learning_rate': 1.830635711476942e-05, 'epoch': 0.43} {'loss': 0.537, 'learning_rate': 1.8306170032270264e-05, 'epoch': 0.43} {'loss': 0.5325, 'learning_rate': 1.8305982940395027e-05, 'epoch': 0.43} {'loss': 0.5387, 'learning_rate': 1.8305795839143913e-05, 'epoch': 0.43} {'loss': 0.6988, 'learning_rate': 1.8305608728517136e-05, 'epoch': 0.43} {'loss': 0.5994, 'learning_rate': 1.83054216085149e-05, 'epoch': 0.43} {'loss': 0.7037, 'learning_rate': 1.830523447913743e-05, 'epoch': 0.43} {'loss': 0.754, 'learning_rate': 1.8305047340384923e-05, 'epoch': 0.43} {'loss': 0.6978, 'learning_rate': 1.8304860192257602e-05, 'epoch': 0.43} {'loss': 0.4965, 'learning_rate': 1.830467303475567e-05, 'epoch': 0.43} {'loss': 0.5894, 'learning_rate': 1.8304485867879346e-05, 'epoch': 0.43} {'loss': 0.4966, 'learning_rate': 1.8304298691628834e-05, 'epoch': 0.43} {'loss': 0.7036, 'learning_rate': 1.8304111506004343e-05, 'epoch': 0.43} {'loss': 0.6279, 'learning_rate': 1.8303924311006095e-05, 'epoch': 0.43} {'loss': 0.646, 'learning_rate': 1.8303737106634292e-05, 'epoch': 0.43} {'loss': 0.6744, 'learning_rate': 1.8303549892889152e-05, 'epoch': 0.43} {'loss': 0.6987, 'learning_rate': 1.8303362669770884e-05, 'epoch': 0.43} {'loss': 0.5028, 'learning_rate': 1.8303175437279695e-05, 'epoch': 0.43} {'loss': 0.7367, 'learning_rate': 1.83029881954158e-05, 'epoch': 0.43} {'loss': 0.646, 'learning_rate': 1.8302800944179414e-05, 'epoch': 0.43} {'loss': 0.6753, 'learning_rate': 1.830261368357074e-05, 'epoch': 0.43} {'loss': 0.5398, 'learning_rate': 1.8302426413589997e-05, 'epoch': 0.43} {'loss': 0.3912, 'learning_rate': 1.830223913423739e-05, 'epoch': 0.43} {'loss': 0.585, 'learning_rate': 1.8302051845513138e-05, 'epoch': 0.43} {'loss': 0.5654, 'learning_rate': 1.8301864547417448e-05, 'epoch': 0.43} {'loss': 0.4466, 'learning_rate': 1.8301677239950527e-05, 'epoch': 0.43} {'loss': 0.6205, 'learning_rate': 1.8301489923112597e-05, 'epoch': 0.43} {'loss': 0.726, 'learning_rate': 1.830130259690386e-05, 'epoch': 0.43} {'loss': 0.5608, 'learning_rate': 1.8301115261324532e-05, 'epoch': 0.43} {'loss': 0.4443, 'learning_rate': 1.8300927916374822e-05, 'epoch': 0.43} {'loss': 0.5881, 'learning_rate': 1.8300740562054945e-05, 'epoch': 0.43} {'loss': 0.6697, 'learning_rate': 1.8300553198365108e-05, 'epoch': 0.43} {'loss': 0.5829, 'learning_rate': 1.8300365825305525e-05, 'epoch': 0.43} {'loss': 0.5774, 'learning_rate': 1.830017844287641e-05, 'epoch': 0.43} {'loss': 0.5362, 'learning_rate': 1.8299991051077967e-05, 'epoch': 0.43} {'loss': 0.681, 'learning_rate': 1.829980364991042e-05, 'epoch': 0.43} {'loss': 0.6313, 'learning_rate': 1.8299616239373964e-05, 'epoch': 0.43} {'loss': 0.582, 'learning_rate': 1.8299428819468828e-05, 'epoch': 0.43} {'loss': 0.6051, 'learning_rate': 1.8299241390195212e-05, 'epoch': 0.43} {'loss': 0.5279, 'learning_rate': 1.8299053951553327e-05, 'epoch': 0.43} {'loss': 0.6676, 'learning_rate': 1.829886650354339e-05, 'epoch': 0.43} {'loss': 0.6608, 'learning_rate': 1.8298679046165614e-05, 'epoch': 0.43} {'loss': 0.5915, 'learning_rate': 1.8298491579420202e-05, 'epoch': 0.43} {'loss': 0.541, 'learning_rate': 1.8298304103307376e-05, 'epoch': 0.43} {'loss': 0.6394, 'learning_rate': 1.829811661782734e-05, 'epoch': 0.43} {'loss': 0.616, 'learning_rate': 1.8297929122980313e-05, 'epoch': 0.43} {'loss': 0.6442, 'learning_rate': 1.8297741618766497e-05, 'epoch': 0.43} {'loss': 0.5527, 'learning_rate': 1.829755410518611e-05, 'epoch': 0.43} {'loss': 0.5375, 'learning_rate': 1.829736658223936e-05, 'epoch': 0.43} {'loss': 0.6069, 'learning_rate': 1.8297179049926464e-05, 'epoch': 0.43} {'loss': 0.6254, 'learning_rate': 1.829699150824763e-05, 'epoch': 0.43} {'loss': 0.4062, 'learning_rate': 1.8296803957203072e-05, 'epoch': 0.43} {'loss': 0.623, 'learning_rate': 1.8296616396792998e-05, 'epoch': 0.43} {'loss': 0.7373, 'learning_rate': 1.829642882701762e-05, 'epoch': 0.43} {'loss': 0.5961, 'learning_rate': 1.8296241247877153e-05, 'epoch': 0.43} {'loss': 0.655, 'learning_rate': 1.8296053659371806e-05, 'epoch': 0.43} {'loss': 0.6687, 'learning_rate': 1.8295866061501794e-05, 'epoch': 0.43} {'loss': 0.5549, 'learning_rate': 1.829567845426733e-05, 'epoch': 0.43} {'loss': 0.545, 'learning_rate': 1.8295490837668616e-05, 'epoch': 0.43} {'loss': 0.6274, 'learning_rate': 1.8295303211705872e-05, 'epoch': 0.43} {'loss': 0.7172, 'learning_rate': 1.8295115576379308e-05, 'epoch': 0.43} {'loss': 0.5351, 'learning_rate': 1.829492793168914e-05, 'epoch': 0.43} {'loss': 0.6174, 'learning_rate': 1.8294740277635573e-05, 'epoch': 0.43} {'loss': 0.6332, 'learning_rate': 1.8294552614218818e-05, 'epoch': 0.43} {'loss': 0.6033, 'learning_rate': 1.8294364941439096e-05, 'epoch': 0.43} {'loss': 0.5277, 'learning_rate': 1.829417725929661e-05, 'epoch': 0.43} {'loss': 0.6716, 'learning_rate': 1.8293989567791576e-05, 'epoch': 0.43} {'loss': 0.62, 'learning_rate': 1.8293801866924205e-05, 'epoch': 0.43} {'loss': 0.6998, 'learning_rate': 1.829361415669471e-05, 'epoch': 0.43} {'loss': 0.7489, 'learning_rate': 1.82934264371033e-05, 'epoch': 0.43} {'loss': 0.5852, 'learning_rate': 1.829323870815019e-05, 'epoch': 0.43} {'loss': 0.6406, 'learning_rate': 1.829305096983559e-05, 'epoch': 0.43} {'loss': 0.6815, 'learning_rate': 1.829286322215971e-05, 'epoch': 0.43} {'loss': 0.6792, 'learning_rate': 1.8292675465122766e-05, 'epoch': 0.43} {'loss': 0.5179, 'learning_rate': 1.829248769872497e-05, 'epoch': 0.43} {'loss': 0.682, 'learning_rate': 1.8292299922966532e-05, 'epoch': 0.43} {'loss': 0.6815, 'learning_rate': 1.8292112137847663e-05, 'epoch': 0.43} {'loss': 0.6616, 'learning_rate': 1.8291924343368575e-05, 'epoch': 0.43} {'loss': 0.668, 'learning_rate': 1.8291736539529482e-05, 'epoch': 0.43} {'loss': 0.6169, 'learning_rate': 1.8291548726330597e-05, 'epoch': 0.43} {'loss': 0.5404, 'learning_rate': 1.829136090377213e-05, 'epoch': 0.43} {'loss': 0.6688, 'learning_rate': 1.8291173071854294e-05, 'epoch': 0.43} {'loss': 0.5943, 'learning_rate': 1.8290985230577297e-05, 'epoch': 0.43} {'loss': 0.6279, 'learning_rate': 1.8290797379941354e-05, 'epoch': 0.43} {'loss': 0.5819, 'learning_rate': 1.829060951994668e-05, 'epoch': 0.43} {'loss': 0.6205, 'learning_rate': 1.8290421650593485e-05, 'epoch': 0.43} {'loss': 0.4699, 'learning_rate': 1.829023377188198e-05, 'epoch': 0.43} {'loss': 0.5825, 'learning_rate': 1.8290045883812374e-05, 'epoch': 0.43} {'loss': 0.6623, 'learning_rate': 1.8289857986384888e-05, 'epoch': 0.43} {'loss': 0.6719, 'learning_rate': 1.8289670079599725e-05, 'epoch': 0.43} {'loss': 0.629, 'learning_rate': 1.82894821634571e-05, 'epoch': 0.43} {'loss': 0.7072, 'learning_rate': 1.8289294237957228e-05, 'epoch': 0.43} {'loss': 0.5513, 'learning_rate': 1.828910630310032e-05, 'epoch': 0.43} {'loss': 0.6709, 'learning_rate': 1.8288918358886585e-05, 'epoch': 0.43} {'loss': 0.7534, 'learning_rate': 1.8288730405316238e-05, 'epoch': 0.43} {'loss': 0.5141, 'learning_rate': 1.8288542442389494e-05, 'epoch': 0.43} {'loss': 0.5727, 'learning_rate': 1.8288354470106555e-05, 'epoch': 0.43} {'loss': 0.6252, 'learning_rate': 1.8288166488467644e-05, 'epoch': 0.43} {'loss': 0.5514, 'learning_rate': 1.8287978497472968e-05, 'epoch': 0.43} {'loss': 0.5434, 'learning_rate': 1.8287790497122743e-05, 'epoch': 0.43} {'loss': 0.6003, 'learning_rate': 1.8287602487417174e-05, 'epoch': 0.43} {'loss': 0.6575, 'learning_rate': 1.8287414468356482e-05, 'epoch': 0.43} {'loss': 0.7275, 'learning_rate': 1.8287226439940874e-05, 'epoch': 0.43} {'loss': 0.5684, 'learning_rate': 1.8287038402170563e-05, 'epoch': 0.43} {'loss': 0.4868, 'learning_rate': 1.8286850355045758e-05, 'epoch': 0.43} {'loss': 0.4604, 'learning_rate': 1.8286662298566678e-05, 'epoch': 0.43} {'loss': 0.8134, 'learning_rate': 1.8286474232733535e-05, 'epoch': 0.43} {'loss': 0.5612, 'learning_rate': 1.8286286157546532e-05, 'epoch': 0.43} {'loss': 0.5528, 'learning_rate': 1.8286098073005894e-05, 'epoch': 0.43} {'loss': 0.5555, 'learning_rate': 1.8285909979111823e-05, 'epoch': 0.43} {'loss': 0.5319, 'learning_rate': 1.8285721875864533e-05, 'epoch': 0.43} {'loss': 0.6144, 'learning_rate': 1.828553376326424e-05, 'epoch': 0.43} {'loss': 0.5196, 'learning_rate': 1.828534564131116e-05, 'epoch': 0.43} {'loss': 0.5788, 'learning_rate': 1.8285157510005498e-05, 'epoch': 0.43} {'loss': 0.522, 'learning_rate': 1.8284969369347467e-05, 'epoch': 0.43} {'loss': 0.6381, 'learning_rate': 1.828478121933728e-05, 'epoch': 0.43} {'loss': 0.5632, 'learning_rate': 1.8284593059975152e-05, 'epoch': 0.43} {'loss': 0.6132, 'learning_rate': 1.8284404891261296e-05, 'epoch': 0.43} {'loss': 0.4672, 'learning_rate': 1.8284216713195918e-05, 'epoch': 0.43} {'loss': 0.6571, 'learning_rate': 1.828402852577924e-05, 'epoch': 0.43} {'loss': 0.6722, 'learning_rate': 1.828384032901146e-05, 'epoch': 0.43} {'loss': 0.4661, 'learning_rate': 1.8283652122892806e-05, 'epoch': 0.43} {'loss': 0.6032, 'learning_rate': 1.8283463907423487e-05, 'epoch': 0.43} {'loss': 0.5996, 'learning_rate': 1.8283275682603706e-05, 'epoch': 0.43} {'loss': 0.583, 'learning_rate': 1.8283087448433688e-05, 'epoch': 0.43} {'loss': 0.6115, 'learning_rate': 1.8282899204913633e-05, 'epoch': 0.43} {'loss': 0.5631, 'learning_rate': 1.8282710952043766e-05, 'epoch': 0.43} {'loss': 0.5442, 'learning_rate': 1.828252268982429e-05, 'epoch': 0.43} {'loss': 0.6587, 'learning_rate': 1.828233441825542e-05, 'epoch': 0.43} {'loss': 0.513, 'learning_rate': 1.8282146137337368e-05, 'epoch': 0.43} {'loss': 0.5549, 'learning_rate': 1.828195784707035e-05, 'epoch': 0.43} {'loss': 0.535, 'learning_rate': 1.828176954745458e-05, 'epoch': 0.43} {'loss': 0.6072, 'learning_rate': 1.8281581238490264e-05, 'epoch': 0.43} {'loss': 0.6358, 'learning_rate': 1.8281392920177616e-05, 'epoch': 0.43} {'loss': 0.5682, 'learning_rate': 1.828120459251685e-05, 'epoch': 0.43} {'loss': 0.4138, 'learning_rate': 1.828101625550818e-05, 'epoch': 0.43} {'loss': 0.7014, 'learning_rate': 1.828082790915182e-05, 'epoch': 0.43} {'loss': 0.5215, 'learning_rate': 1.828063955344798e-05, 'epoch': 0.43} {'loss': 0.5217, 'learning_rate': 1.8280451188396866e-05, 'epoch': 0.43} {'loss': 0.4728, 'learning_rate': 1.82802628139987e-05, 'epoch': 0.43} {'loss': 0.6586, 'learning_rate': 1.8280074430253696e-05, 'epoch': 0.43} {'loss': 0.6837, 'learning_rate': 1.827988603716206e-05, 'epoch': 0.43} {'loss': 0.5562, 'learning_rate': 1.8279697634724006e-05, 'epoch': 0.43} {'loss': 0.6919, 'learning_rate': 1.827950922293975e-05, 'epoch': 0.43} {'loss': 0.6879, 'learning_rate': 1.82793208018095e-05, 'epoch': 0.43} {'loss': 0.4624, 'learning_rate': 1.8279132371333474e-05, 'epoch': 0.43} {'loss': 0.4604, 'learning_rate': 1.827894393151188e-05, 'epoch': 0.43} {'loss': 0.6634, 'learning_rate': 1.8278755482344933e-05, 'epoch': 0.43} {'loss': 0.5614, 'learning_rate': 1.827856702383285e-05, 'epoch': 0.43} {'loss': 0.6534, 'learning_rate': 1.827837855597583e-05, 'epoch': 0.43} {'loss': 0.425, 'learning_rate': 1.8278190078774098e-05, 'epoch': 0.43} {'loss': 0.5632, 'learning_rate': 1.8278001592227865e-05, 'epoch': 0.43} {'loss': 0.5461, 'learning_rate': 1.827781309633734e-05, 'epoch': 0.43} {'loss': 0.73, 'learning_rate': 1.8277624591102743e-05, 'epoch': 0.43} {'loss': 0.6476, 'learning_rate': 1.827743607652428e-05, 'epoch': 0.43} {'loss': 0.6947, 'learning_rate': 1.8277247552602164e-05, 'epoch': 0.43} {'loss': 0.5814, 'learning_rate': 1.8277059019336613e-05, 'epoch': 0.43} {'loss': 0.6353, 'learning_rate': 1.827687047672783e-05, 'epoch': 0.43} {'loss': 0.5419, 'learning_rate': 1.827668192477604e-05, 'epoch': 0.43} {'loss': 0.6005, 'learning_rate': 1.8276493363481446e-05, 'epoch': 0.43} {'loss': 0.4976, 'learning_rate': 1.827630479284427e-05, 'epoch': 0.43} {'loss': 0.664, 'learning_rate': 1.8276116212864712e-05, 'epoch': 0.43} {'loss': 0.6188, 'learning_rate': 1.8275927623543e-05, 'epoch': 0.43} {'loss': 0.7212, 'learning_rate': 1.8275739024879335e-05, 'epoch': 0.43} {'loss': 0.6069, 'learning_rate': 1.8275550416873938e-05, 'epoch': 0.43} {'loss': 0.4947, 'learning_rate': 1.8275361799527018e-05, 'epoch': 0.43} {'loss': 0.6886, 'learning_rate': 1.8275173172838784e-05, 'epoch': 0.43} {'loss': 0.5445, 'learning_rate': 1.827498453680945e-05, 'epoch': 0.43} {'loss': 0.4267, 'learning_rate': 1.8274795891439242e-05, 'epoch': 0.43} {'loss': 0.5509, 'learning_rate': 1.827460723672836e-05, 'epoch': 0.43} {'loss': 0.654, 'learning_rate': 1.827441857267702e-05, 'epoch': 0.43} {'loss': 0.4907, 'learning_rate': 1.827422989928543e-05, 'epoch': 0.43} {'loss': 0.6355, 'learning_rate': 1.827404121655381e-05, 'epoch': 0.43} {'loss': 0.6083, 'learning_rate': 1.827385252448237e-05, 'epoch': 0.43} {'loss': 0.6704, 'learning_rate': 1.8273663823071327e-05, 'epoch': 0.43} {'loss': 0.4955, 'learning_rate': 1.8273475112320887e-05, 'epoch': 0.43} {'loss': 0.5229, 'learning_rate': 1.827328639223127e-05, 'epoch': 0.43} {'loss': 0.5601, 'learning_rate': 1.8273097662802686e-05, 'epoch': 0.43} {'loss': 0.5908, 'learning_rate': 1.8272908924035348e-05, 'epoch': 0.43} {'loss': 0.7062, 'learning_rate': 1.827272017592947e-05, 'epoch': 0.43} {'loss': 0.6222, 'learning_rate': 1.8272531418485264e-05, 'epoch': 0.43} {'loss': 0.6191, 'learning_rate': 1.8272342651702938e-05, 'epoch': 0.43} {'loss': 0.6015, 'learning_rate': 1.8272153875582714e-05, 'epoch': 0.43} {'loss': 0.672, 'learning_rate': 1.8271965090124802e-05, 'epoch': 0.43} {'loss': 0.6541, 'learning_rate': 1.8271776295329412e-05, 'epoch': 0.43} {'loss': 0.5316, 'learning_rate': 1.827158749119676e-05, 'epoch': 0.43} {'loss': 0.5046, 'learning_rate': 1.827139867772706e-05, 'epoch': 0.43} {'loss': 0.6462, 'learning_rate': 1.8271209854920525e-05, 'epoch': 0.43} {'loss': 0.6114, 'learning_rate': 1.8271021022777362e-05, 'epoch': 0.43} {'loss': 0.4608, 'learning_rate': 1.8270832181297792e-05, 'epoch': 0.43} {'loss': 0.7718, 'learning_rate': 1.8270643330482026e-05, 'epoch': 0.43} {'loss': 0.5198, 'learning_rate': 1.8270454470330275e-05, 'epoch': 0.43} {'loss': 0.7687, 'learning_rate': 1.8270265600842755e-05, 'epoch': 0.43} {'loss': 0.6306, 'learning_rate': 1.8270076722019677e-05, 'epoch': 0.43} {'loss': 0.7049, 'learning_rate': 1.8269887833861257e-05, 'epoch': 0.43} {'loss': 0.6838, 'learning_rate': 1.8269698936367703e-05, 'epoch': 0.43} {'loss': 0.5099, 'learning_rate': 1.8269510029539233e-05, 'epoch': 0.43} {'loss': 0.6392, 'learning_rate': 1.8269321113376057e-05, 'epoch': 0.43} {'loss': 0.7383, 'learning_rate': 1.8269132187878394e-05, 'epoch': 0.43} {'loss': 0.6988, 'learning_rate': 1.826894325304645e-05, 'epoch': 0.43} {'loss': 0.5494, 'learning_rate': 1.8268754308880442e-05, 'epoch': 0.43} {'loss': 0.749, 'learning_rate': 1.8268565355380582e-05, 'epoch': 0.43} {'loss': 0.5672, 'learning_rate': 1.8268376392547086e-05, 'epoch': 0.43} {'loss': 0.623, 'learning_rate': 1.8268187420380165e-05, 'epoch': 0.43} {'loss': 0.5143, 'learning_rate': 1.826799843888003e-05, 'epoch': 0.43} {'loss': 0.5965, 'learning_rate': 1.82678094480469e-05, 'epoch': 0.43} {'loss': 0.5746, 'learning_rate': 1.8267620447880986e-05, 'epoch': 0.43} {'loss': 0.6246, 'learning_rate': 1.82674314383825e-05, 'epoch': 0.43} {'loss': 0.5845, 'learning_rate': 1.8267242419551653e-05, 'epoch': 0.43} {'loss': 0.4989, 'learning_rate': 1.8267053391388664e-05, 'epoch': 0.43} {'loss': 0.4946, 'learning_rate': 1.8266864353893744e-05, 'epoch': 0.43} {'loss': 0.6192, 'learning_rate': 1.8266675307067103e-05, 'epoch': 0.43} {'loss': 0.5326, 'learning_rate': 1.826648625090896e-05, 'epoch': 0.43} {'loss': 0.6136, 'learning_rate': 1.8266297185419527e-05, 'epoch': 0.43} {'loss': 0.5449, 'learning_rate': 1.8266108110599016e-05, 'epoch': 0.43} {'loss': 0.4392, 'learning_rate': 1.826591902644764e-05, 'epoch': 0.43} {'loss': 0.5655, 'learning_rate': 1.826572993296561e-05, 'epoch': 0.43} {'loss': 0.5798, 'learning_rate': 1.826554083015315e-05, 'epoch': 0.43} {'loss': 0.5946, 'learning_rate': 1.8265351718010462e-05, 'epoch': 0.43} {'loss': 0.5567, 'learning_rate': 1.826516259653776e-05, 'epoch': 0.43} {'loss': 0.6462, 'learning_rate': 1.8264973465735267e-05, 'epoch': 0.43} {'loss': 0.6091, 'learning_rate': 1.826478432560319e-05, 'epoch': 0.43} {'loss': 0.5209, 'learning_rate': 1.8264595176141742e-05, 'epoch': 0.43} {'loss': 0.7045, 'learning_rate': 1.826440601735114e-05, 'epoch': 0.43} {'loss': 0.619, 'learning_rate': 1.826421684923159e-05, 'epoch': 0.43} {'loss': 0.5567, 'learning_rate': 1.826402767178331e-05, 'epoch': 0.43} {'loss': 0.6576, 'learning_rate': 1.826383848500652e-05, 'epoch': 0.43} {'loss': 0.473, 'learning_rate': 1.8263649288901427e-05, 'epoch': 0.43} {'loss': 0.5212, 'learning_rate': 1.8263460083468242e-05, 'epoch': 0.43} {'loss': 0.7367, 'learning_rate': 1.8263270868707185e-05, 'epoch': 0.43} {'loss': 0.7087, 'learning_rate': 1.8263081644618466e-05, 'epoch': 0.43} {'loss': 0.508, 'learning_rate': 1.8262892411202297e-05, 'epoch': 0.43} {'loss': 0.5455, 'learning_rate': 1.8262703168458894e-05, 'epoch': 0.43} {'loss': 0.5744, 'learning_rate': 1.826251391638847e-05, 'epoch': 0.43} {'loss': 0.5886, 'learning_rate': 1.826232465499124e-05, 'epoch': 0.43} {'loss': 0.528, 'learning_rate': 1.8262135384267418e-05, 'epoch': 0.43} {'loss': 0.5175, 'learning_rate': 1.8261946104217214e-05, 'epoch': 0.43} {'loss': 0.5628, 'learning_rate': 1.826175681484085e-05, 'epoch': 0.43} {'loss': 0.6126, 'learning_rate': 1.8261567516138525e-05, 'epoch': 0.43} {'loss': 0.6977, 'learning_rate': 1.8261378208110467e-05, 'epoch': 0.43} {'loss': 0.6001, 'learning_rate': 1.826118889075688e-05, 'epoch': 0.43} {'loss': 0.5585, 'learning_rate': 1.8260999564077984e-05, 'epoch': 0.43} {'loss': 0.5305, 'learning_rate': 1.826081022807399e-05, 'epoch': 0.43} {'loss': 0.7239, 'learning_rate': 1.8260620882745114e-05, 'epoch': 0.43} {'loss': 0.3749, 'learning_rate': 1.8260431528091565e-05, 'epoch': 0.43} {'loss': 0.5206, 'learning_rate': 1.826024216411356e-05, 'epoch': 0.43} {'loss': 0.5805, 'learning_rate': 1.8260052790811312e-05, 'epoch': 0.43} {'loss': 0.4817, 'learning_rate': 1.8259863408185038e-05, 'epoch': 0.43} {'loss': 0.6079, 'learning_rate': 1.8259674016234945e-05, 'epoch': 0.43} {'loss': 0.6225, 'learning_rate': 1.8259484614961254e-05, 'epoch': 0.43} {'loss': 0.647, 'learning_rate': 1.8259295204364174e-05, 'epoch': 0.43} {'loss': 0.5933, 'learning_rate': 1.825910578444392e-05, 'epoch': 0.43} {'loss': 0.5552, 'learning_rate': 1.8258916355200708e-05, 'epoch': 0.43} {'loss': 0.7135, 'learning_rate': 1.8258726916634745e-05, 'epoch': 0.43} {'loss': 0.6763, 'learning_rate': 1.8258537468746254e-05, 'epoch': 0.43} {'loss': 0.5135, 'learning_rate': 1.8258348011535446e-05, 'epoch': 0.43} {'loss': 0.5394, 'learning_rate': 1.825815854500253e-05, 'epoch': 0.43} {'loss': 0.5787, 'learning_rate': 1.8257969069147727e-05, 'epoch': 0.43} {'loss': 0.4351, 'learning_rate': 1.8257779583971242e-05, 'epoch': 0.43} {'loss': 0.5716, 'learning_rate': 1.82575900894733e-05, 'epoch': 0.43} {'loss': 0.6507, 'learning_rate': 1.8257400585654103e-05, 'epoch': 0.43} {'loss': 0.6106, 'learning_rate': 1.8257211072513876e-05, 'epoch': 0.43} {'loss': 0.4237, 'learning_rate': 1.8257021550052824e-05, 'epoch': 0.43} {'loss': 0.7789, 'learning_rate': 1.8256832018271167e-05, 'epoch': 0.43} {'loss': 0.6526, 'learning_rate': 1.8256642477169118e-05, 'epoch': 0.43} {'loss': 0.5719, 'learning_rate': 1.825645292674689e-05, 'epoch': 0.43} {'loss': 0.6169, 'learning_rate': 1.825626336700469e-05, 'epoch': 0.43} {'loss': 0.6907, 'learning_rate': 1.8256073797942745e-05, 'epoch': 0.43} {'loss': 0.5182, 'learning_rate': 1.8255884219561266e-05, 'epoch': 0.43} {'loss': 0.6161, 'learning_rate': 1.8255694631860455e-05, 'epoch': 0.43} {'loss': 0.6423, 'learning_rate': 1.825550503484054e-05, 'epoch': 0.43} {'loss': 0.5248, 'learning_rate': 1.825531542850173e-05, 'epoch': 0.43} {'loss': 0.6399, 'learning_rate': 1.8255125812844233e-05, 'epoch': 0.43} {'loss': 0.507, 'learning_rate': 1.8254936187868274e-05, 'epoch': 0.43} {'loss': 0.5434, 'learning_rate': 1.8254746553574062e-05, 'epoch': 0.43} {'loss': 0.463, 'learning_rate': 1.8254556909961806e-05, 'epoch': 0.43} {'loss': 0.5309, 'learning_rate': 1.825436725703173e-05, 'epoch': 0.43} {'loss': 0.4815, 'learning_rate': 1.825417759478404e-05, 'epoch': 0.43} {'loss': 0.6302, 'learning_rate': 1.8253987923218956e-05, 'epoch': 0.43} {'loss': 0.6098, 'learning_rate': 1.8253798242336688e-05, 'epoch': 0.43} {'loss': 0.5211, 'learning_rate': 1.825360855213745e-05, 'epoch': 0.43} {'loss': 0.4381, 'learning_rate': 1.8253418852621457e-05, 'epoch': 0.43} {'loss': 0.5053, 'learning_rate': 1.8253229143788928e-05, 'epoch': 0.43} {'loss': 0.6015, 'learning_rate': 1.825303942564007e-05, 'epoch': 0.43} {'loss': 0.5243, 'learning_rate': 1.8252849698175096e-05, 'epoch': 0.43} {'loss': 0.5076, 'learning_rate': 1.8252659961394227e-05, 'epoch': 0.43} {'loss': 0.5977, 'learning_rate': 1.8252470215297676e-05, 'epoch': 0.43} {'loss': 0.5267, 'learning_rate': 1.8252280459885656e-05, 'epoch': 0.43} {'loss': 0.6073, 'learning_rate': 1.8252090695158378e-05, 'epoch': 0.43} {'loss': 0.4268, 'learning_rate': 1.825190092111606e-05, 'epoch': 0.43} {'loss': 0.7528, 'learning_rate': 1.825171113775891e-05, 'epoch': 0.43} {'loss': 0.8531, 'learning_rate': 1.8251521345087156e-05, 'epoch': 0.43} {'loss': 0.6758, 'learning_rate': 1.8251331543101e-05, 'epoch': 0.43} {'loss': 0.506, 'learning_rate': 1.8251141731800658e-05, 'epoch': 0.43} {'loss': 0.5802, 'learning_rate': 1.8250951911186346e-05, 'epoch': 0.43} {'loss': 0.5517, 'learning_rate': 1.825076208125828e-05, 'epoch': 0.43} {'loss': 0.4727, 'learning_rate': 1.8250572242016674e-05, 'epoch': 0.43} {'loss': 0.6949, 'learning_rate': 1.8250382393461737e-05, 'epoch': 0.43} {'loss': 0.5644, 'learning_rate': 1.825019253559369e-05, 'epoch': 0.43} {'loss': 0.6751, 'learning_rate': 1.8250002668412742e-05, 'epoch': 0.43} {'loss': 0.5768, 'learning_rate': 1.8249812791919114e-05, 'epoch': 0.43} {'loss': 0.5648, 'learning_rate': 1.824962290611301e-05, 'epoch': 0.43} {'loss': 0.4275, 'learning_rate': 1.8249433010994656e-05, 'epoch': 0.43} {'loss': 0.4697, 'learning_rate': 1.824924310656426e-05, 'epoch': 0.43} {'loss': 0.5529, 'learning_rate': 1.8249053192822032e-05, 'epoch': 0.43} {'loss': 0.5357, 'learning_rate': 1.82488632697682e-05, 'epoch': 0.43} {'loss': 0.5638, 'learning_rate': 1.8248673337402964e-05, 'epoch': 0.43} {'loss': 0.5607, 'learning_rate': 1.8248483395726542e-05, 'epoch': 0.43} {'loss': 0.5335, 'learning_rate': 1.8248293444739155e-05, 'epoch': 0.43} {'loss': 0.6433, 'learning_rate': 1.8248103484441016e-05, 'epoch': 0.43} {'loss': 0.5658, 'learning_rate': 1.8247913514832332e-05, 'epoch': 0.43} {'loss': 0.5258, 'learning_rate': 1.8247723535913322e-05, 'epoch': 0.43} {'loss': 0.3944, 'learning_rate': 1.8247533547684204e-05, 'epoch': 0.43} {'loss': 0.6517, 'learning_rate': 1.8247343550145187e-05, 'epoch': 0.43} {'loss': 0.449, 'learning_rate': 1.824715354329649e-05, 'epoch': 0.43} {'loss': 0.5828, 'learning_rate': 1.824696352713832e-05, 'epoch': 0.43} {'loss': 0.7289, 'learning_rate': 1.8246773501670895e-05, 'epoch': 0.43} {'loss': 0.5534, 'learning_rate': 1.8246583466894436e-05, 'epoch': 0.43} {'loss': 0.543, 'learning_rate': 1.8246393422809153e-05, 'epoch': 0.43} {'loss': 0.535, 'learning_rate': 1.8246203369415256e-05, 'epoch': 0.43} {'loss': 0.5599, 'learning_rate': 1.8246013306712965e-05, 'epoch': 0.43} {'loss': 0.5884, 'learning_rate': 1.8245823234702493e-05, 'epoch': 0.43} {'loss': 0.5863, 'learning_rate': 1.8245633153384057e-05, 'epoch': 0.43} {'loss': 0.5888, 'learning_rate': 1.8245443062757864e-05, 'epoch': 0.43} {'loss': 0.5578, 'learning_rate': 1.8245252962824142e-05, 'epoch': 0.43} {'loss': 0.6291, 'learning_rate': 1.8245062853583092e-05, 'epoch': 0.43} {'loss': 0.6793, 'learning_rate': 1.8244872735034933e-05, 'epoch': 0.43} {'loss': 0.7285, 'learning_rate': 1.8244682607179884e-05, 'epoch': 0.43} {'loss': 0.4192, 'learning_rate': 1.824449247001815e-05, 'epoch': 0.43} {'loss': 0.5383, 'learning_rate': 1.8244302323549953e-05, 'epoch': 0.43} {'loss': 0.6139, 'learning_rate': 1.8244112167775512e-05, 'epoch': 0.43} {'loss': 0.5626, 'learning_rate': 1.8243922002695035e-05, 'epoch': 0.43} {'loss': 0.7175, 'learning_rate': 1.8243731828308733e-05, 'epoch': 0.43} {'loss': 0.59, 'learning_rate': 1.8243541644616828e-05, 'epoch': 0.43} {'loss': 0.5096, 'learning_rate': 1.8243351451619534e-05, 'epoch': 0.43} {'loss': 0.7792, 'learning_rate': 1.8243161249317062e-05, 'epoch': 0.43} {'loss': 0.6443, 'learning_rate': 1.8242971037709628e-05, 'epoch': 0.43} {'loss': 0.7724, 'learning_rate': 1.8242780816797445e-05, 'epoch': 0.43} {'loss': 0.7402, 'learning_rate': 1.8242590586580734e-05, 'epoch': 0.43} {'loss': 0.6459, 'learning_rate': 1.8242400347059702e-05, 'epoch': 0.43} {'loss': 0.6167, 'learning_rate': 1.8242210098234572e-05, 'epoch': 0.43} {'loss': 0.6875, 'learning_rate': 1.824201984010555e-05, 'epoch': 0.43} {'loss': 0.6454, 'learning_rate': 1.8241829572672855e-05, 'epoch': 0.43} {'loss': 0.8085, 'learning_rate': 1.8241639295936705e-05, 'epoch': 0.43} {'loss': 0.7337, 'learning_rate': 1.824144900989731e-05, 'epoch': 0.43} {'loss': 0.5633, 'learning_rate': 1.8241258714554886e-05, 'epoch': 0.43} {'loss': 0.4764, 'learning_rate': 1.8241068409909648e-05, 'epoch': 0.43} {'loss': 0.7098, 'learning_rate': 1.824087809596181e-05, 'epoch': 0.43} {'loss': 0.6332, 'learning_rate': 1.824068777271159e-05, 'epoch': 0.43} {'loss': 0.5416, 'learning_rate': 1.8240497440159198e-05, 'epoch': 0.43} {'loss': 0.7649, 'learning_rate': 1.8240307098304853e-05, 'epoch': 0.43} {'loss': 0.5672, 'learning_rate': 1.8240116747148768e-05, 'epoch': 0.43} {'loss': 0.5751, 'learning_rate': 1.8239926386691156e-05, 'epoch': 0.43} {'loss': 0.496, 'learning_rate': 1.8239736016932235e-05, 'epoch': 0.43} {'loss': 0.4557, 'learning_rate': 1.8239545637872222e-05, 'epoch': 0.43} {'loss': 0.717, 'learning_rate': 1.8239355249511326e-05, 'epoch': 0.43} {'loss': 0.5133, 'learning_rate': 1.8239164851849764e-05, 'epoch': 0.43} {'loss': 0.6308, 'learning_rate': 1.8238974444887753e-05, 'epoch': 0.43} {'loss': 0.5085, 'learning_rate': 1.8238784028625507e-05, 'epoch': 0.43} {'loss': 0.4432, 'learning_rate': 1.823859360306324e-05, 'epoch': 0.43} {'loss': 0.5304, 'learning_rate': 1.8238403168201166e-05, 'epoch': 0.43} {'loss': 0.6574, 'learning_rate': 1.8238212724039505e-05, 'epoch': 0.43} {'loss': 0.5601, 'learning_rate': 1.8238022270578465e-05, 'epoch': 0.43} {'loss': 0.3809, 'learning_rate': 1.8237831807818268e-05, 'epoch': 0.43} {'loss': 0.37, 'learning_rate': 1.823764133575912e-05, 'epoch': 0.43} {'loss': 0.5125, 'learning_rate': 1.8237450854401246e-05, 'epoch': 0.43} {'loss': 0.5891, 'learning_rate': 1.8237260363744855e-05, 'epoch': 0.43} {'loss': 0.5633, 'learning_rate': 1.8237069863790163e-05, 'epoch': 0.43} {'loss': 0.7025, 'learning_rate': 1.8236879354537384e-05, 'epoch': 0.43} {'loss': 0.5694, 'learning_rate': 1.8236688835986735e-05, 'epoch': 0.43} {'loss': 0.6861, 'learning_rate': 1.823649830813843e-05, 'epoch': 0.43} {'loss': 0.5481, 'learning_rate': 1.823630777099269e-05, 'epoch': 0.43} {'loss': 0.526, 'learning_rate': 1.823611722454972e-05, 'epoch': 0.43} {'loss': 0.5264, 'learning_rate': 1.823592666880974e-05, 'epoch': 0.43} {'loss': 0.5621, 'learning_rate': 1.823573610377297e-05, 'epoch': 0.43} {'loss': 0.5864, 'learning_rate': 1.8235545529439616e-05, 'epoch': 0.43} {'loss': 0.6244, 'learning_rate': 1.8235354945809897e-05, 'epoch': 0.43} {'loss': 0.6876, 'learning_rate': 1.8235164352884025e-05, 'epoch': 0.43} {'loss': 0.6749, 'learning_rate': 1.8234973750662225e-05, 'epoch': 0.43} {'loss': 0.7168, 'learning_rate': 1.82347831391447e-05, 'epoch': 0.43} {'loss': 0.5777, 'learning_rate': 1.8234592518331676e-05, 'epoch': 0.43} {'loss': 0.4542, 'learning_rate': 1.823440188822336e-05, 'epoch': 0.43} {'loss': 0.6402, 'learning_rate': 1.8234211248819966e-05, 'epoch': 0.43} {'loss': 0.4664, 'learning_rate': 1.823402060012172e-05, 'epoch': 0.43} {'loss': 0.5847, 'learning_rate': 1.8233829942128825e-05, 'epoch': 0.43} {'loss': 0.5531, 'learning_rate': 1.8233639274841505e-05, 'epoch': 0.43} {'loss': 0.508, 'learning_rate': 1.8233448598259972e-05, 'epoch': 0.43} {'loss': 0.4906, 'learning_rate': 1.8233257912384442e-05, 'epoch': 0.43} {'loss': 0.5297, 'learning_rate': 1.823306721721513e-05, 'epoch': 0.43} {'loss': 0.5603, 'learning_rate': 1.8232876512752246e-05, 'epoch': 0.43} {'loss': 0.5933, 'learning_rate': 1.8232685798996016e-05, 'epoch': 0.43} {'loss': 0.6661, 'learning_rate': 1.8232495075946646e-05, 'epoch': 0.43} {'loss': 0.6079, 'learning_rate': 1.8232304343604356e-05, 'epoch': 0.43} {'loss': 0.6599, 'learning_rate': 1.8232113601969358e-05, 'epoch': 0.43} {'loss': 0.4681, 'learning_rate': 1.8231922851041867e-05, 'epoch': 0.43} {'loss': 0.4681, 'learning_rate': 1.8231732090822106e-05, 'epoch': 0.43} {'loss': 0.6422, 'learning_rate': 1.8231541321310282e-05, 'epoch': 0.43} {'loss': 0.5902, 'learning_rate': 1.823135054250661e-05, 'epoch': 0.43} {'loss': 0.6046, 'learning_rate': 1.8231159754411314e-05, 'epoch': 0.43} {'loss': 0.4813, 'learning_rate': 1.82309689570246e-05, 'epoch': 0.43} {'loss': 0.5178, 'learning_rate': 1.823077815034669e-05, 'epoch': 0.43} {'loss': 0.3984, 'learning_rate': 1.8230587334377795e-05, 'epoch': 0.43} {'loss': 0.4102, 'learning_rate': 1.8230396509118135e-05, 'epoch': 0.43} {'loss': 0.5852, 'learning_rate': 1.823020567456792e-05, 'epoch': 0.43} {'loss': 0.6794, 'learning_rate': 1.8230014830727368e-05, 'epoch': 0.43} {'loss': 0.6411, 'learning_rate': 1.8229823977596692e-05, 'epoch': 0.43} {'loss': 0.6451, 'learning_rate': 1.822963311517611e-05, 'epoch': 0.43} {'loss': 0.4707, 'learning_rate': 1.822944224346584e-05, 'epoch': 0.43} {'loss': 0.523, 'learning_rate': 1.8229251362466094e-05, 'epoch': 0.43} {'loss': 0.5157, 'learning_rate': 1.822906047217709e-05, 'epoch': 0.43} {'loss': 0.5153, 'learning_rate': 1.8228869572599035e-05, 'epoch': 0.43} {'loss': 0.5083, 'learning_rate': 1.8228678663732155e-05, 'epoch': 0.43} {'loss': 0.6438, 'learning_rate': 1.8228487745576663e-05, 'epoch': 0.43} {'loss': 0.6396, 'learning_rate': 1.822829681813277e-05, 'epoch': 0.43} {'loss': 0.475, 'learning_rate': 1.82281058814007e-05, 'epoch': 0.44} {'loss': 0.6309, 'learning_rate': 1.8227914935380656e-05, 'epoch': 0.44} {'loss': 0.4421, 'learning_rate': 1.8227723980072866e-05, 'epoch': 0.44} {'loss': 0.6647, 'learning_rate': 1.822753301547754e-05, 'epoch': 0.44} {'loss': 0.6484, 'learning_rate': 1.822734204159489e-05, 'epoch': 0.44} {'loss': 0.7735, 'learning_rate': 1.8227151058425138e-05, 'epoch': 0.44} {'loss': 0.5106, 'learning_rate': 1.8226960065968495e-05, 'epoch': 0.44} {'loss': 0.4595, 'learning_rate': 1.822676906422518e-05, 'epoch': 0.44} {'loss': 0.6897, 'learning_rate': 1.8226578053195406e-05, 'epoch': 0.44} {'loss': 0.5952, 'learning_rate': 1.822638703287939e-05, 'epoch': 0.44} {'loss': 0.6059, 'learning_rate': 1.822619600327735e-05, 'epoch': 0.44} {'loss': 0.5349, 'learning_rate': 1.8226004964389497e-05, 'epoch': 0.44} {'loss': 0.6359, 'learning_rate': 1.8225813916216047e-05, 'epoch': 0.44} {'loss': 0.5955, 'learning_rate': 1.822562285875722e-05, 'epoch': 0.44} {'loss': 0.493, 'learning_rate': 1.822543179201323e-05, 'epoch': 0.44} {'loss': 0.6389, 'learning_rate': 1.8225240715984288e-05, 'epoch': 0.44} {'loss': 0.5555, 'learning_rate': 1.8225049630670615e-05, 'epoch': 0.44} {'loss': 0.5709, 'learning_rate': 1.822485853607242e-05, 'epoch': 0.44} {'loss': 0.5763, 'learning_rate': 1.8224667432189933e-05, 'epoch': 0.44} {'loss': 0.3734, 'learning_rate': 1.8224476319023358e-05, 'epoch': 0.44} {'loss': 0.4352, 'learning_rate': 1.822428519657291e-05, 'epoch': 0.44} {'loss': 0.559, 'learning_rate': 1.8224094064838808e-05, 'epoch': 0.44} {'loss': 0.4853, 'learning_rate': 1.822390292382127e-05, 'epoch': 0.44} {'loss': 0.5801, 'learning_rate': 1.822371177352051e-05, 'epoch': 0.44} {'loss': 0.5007, 'learning_rate': 1.8223520613936738e-05, 'epoch': 0.44} {'loss': 0.5579, 'learning_rate': 1.822332944507018e-05, 'epoch': 0.44} {'loss': 0.6342, 'learning_rate': 1.8223138266921046e-05, 'epoch': 0.44} {'loss': 0.7459, 'learning_rate': 1.822294707948955e-05, 'epoch': 0.44} {'loss': 0.5818, 'learning_rate': 1.8222755882775916e-05, 'epoch': 0.44} {'loss': 0.5799, 'learning_rate': 1.822256467678035e-05, 'epoch': 0.44} {'loss': 0.6151, 'learning_rate': 1.8222373461503072e-05, 'epoch': 0.44} {'loss': 0.6069, 'learning_rate': 1.8222182236944298e-05, 'epoch': 0.44} {'loss': 0.5798, 'learning_rate': 1.8221991003104245e-05, 'epoch': 0.44} {'loss': 0.6786, 'learning_rate': 1.8221799759983127e-05, 'epoch': 0.44} {'loss': 0.556, 'learning_rate': 1.822160850758116e-05, 'epoch': 0.44} {'loss': 0.5679, 'learning_rate': 1.822141724589856e-05, 'epoch': 0.44} {'loss': 0.5668, 'learning_rate': 1.8221225974935545e-05, 'epoch': 0.44} {'loss': 0.6136, 'learning_rate': 1.8221034694692327e-05, 'epoch': 0.44} {'loss': 0.5173, 'learning_rate': 1.8220843405169128e-05, 'epoch': 0.44} {'loss': 0.5562, 'learning_rate': 1.8220652106366158e-05, 'epoch': 0.44} {'loss': 0.5484, 'learning_rate': 1.8220460798283633e-05, 'epoch': 0.44} {'loss': 0.598, 'learning_rate': 1.8220269480921774e-05, 'epoch': 0.44} {'loss': 0.5816, 'learning_rate': 1.8220078154280792e-05, 'epoch': 0.44} {'loss': 0.5511, 'learning_rate': 1.8219886818360906e-05, 'epoch': 0.44} {'loss': 0.609, 'learning_rate': 1.821969547316233e-05, 'epoch': 0.44} {'loss': 0.487, 'learning_rate': 1.821950411868528e-05, 'epoch': 0.44} {'loss': 0.6733, 'learning_rate': 1.8219312754929976e-05, 'epoch': 0.44} {'loss': 0.5775, 'learning_rate': 1.8219121381896626e-05, 'epoch': 0.44} {'loss': 0.5419, 'learning_rate': 1.8218929999585457e-05, 'epoch': 0.44} {'loss': 0.5119, 'learning_rate': 1.8218738607996675e-05, 'epoch': 0.44} {'loss': 0.532, 'learning_rate': 1.82185472071305e-05, 'epoch': 0.44} {'loss': 0.5769, 'learning_rate': 1.8218355796987146e-05, 'epoch': 0.44} {'loss': 0.5815, 'learning_rate': 1.8218164377566836e-05, 'epoch': 0.44} {'loss': 0.5834, 'learning_rate': 1.8217972948869778e-05, 'epoch': 0.44} {'loss': 0.4862, 'learning_rate': 1.8217781510896194e-05, 'epoch': 0.44} {'loss': 0.6225, 'learning_rate': 1.8217590063646295e-05, 'epoch': 0.44} {'loss': 0.5277, 'learning_rate': 1.8217398607120298e-05, 'epoch': 0.44} {'loss': 0.634, 'learning_rate': 1.8217207141318423e-05, 'epoch': 0.44} {'loss': 0.5305, 'learning_rate': 1.8217015666240886e-05, 'epoch': 0.44} {'loss': 0.4484, 'learning_rate': 1.8216824181887895e-05, 'epoch': 0.44} {'loss': 0.4634, 'learning_rate': 1.8216632688259676e-05, 'epoch': 0.44} {'loss': 0.4932, 'learning_rate': 1.8216441185356443e-05, 'epoch': 0.44} {'loss': 0.7573, 'learning_rate': 1.8216249673178406e-05, 'epoch': 0.44} {'loss': 0.671, 'learning_rate': 1.8216058151725785e-05, 'epoch': 0.44} {'loss': 0.6213, 'learning_rate': 1.82158666209988e-05, 'epoch': 0.44} {'loss': 0.6077, 'learning_rate': 1.8215675080997662e-05, 'epoch': 0.44} {'loss': 0.5457, 'learning_rate': 1.821548353172259e-05, 'epoch': 0.44} {'loss': 0.6547, 'learning_rate': 1.8215291973173802e-05, 'epoch': 0.44} {'loss': 0.6078, 'learning_rate': 1.8215100405351508e-05, 'epoch': 0.44} {'loss': 0.6645, 'learning_rate': 1.8214908828255927e-05, 'epoch': 0.44} {'loss': 0.5721, 'learning_rate': 1.821471724188728e-05, 'epoch': 0.44} {'loss': 0.5344, 'learning_rate': 1.8214525646245778e-05, 'epoch': 0.44} {'loss': 0.5638, 'learning_rate': 1.8214334041331636e-05, 'epoch': 0.44} {'loss': 0.5916, 'learning_rate': 1.8214142427145075e-05, 'epoch': 0.44} {'loss': 0.707, 'learning_rate': 1.821395080368631e-05, 'epoch': 0.44} {'loss': 0.6999, 'learning_rate': 1.8213759170955555e-05, 'epoch': 0.44} {'loss': 0.5908, 'learning_rate': 1.8213567528953025e-05, 'epoch': 0.44} {'loss': 0.727, 'learning_rate': 1.8213375877678944e-05, 'epoch': 0.44} {'loss': 0.5932, 'learning_rate': 1.821318421713352e-05, 'epoch': 0.44} {'loss': 0.7089, 'learning_rate': 1.8212992547316974e-05, 'epoch': 0.44} {'loss': 0.6919, 'learning_rate': 1.8212800868229523e-05, 'epoch': 0.44} {'loss': 0.4395, 'learning_rate': 1.821260917987138e-05, 'epoch': 0.44} {'loss': 0.7155, 'learning_rate': 1.8212417482242764e-05, 'epoch': 0.44} {'loss': 0.7612, 'learning_rate': 1.821222577534389e-05, 'epoch': 0.44} {'loss': 0.5859, 'learning_rate': 1.8212034059174973e-05, 'epoch': 0.44} {'loss': 0.6689, 'learning_rate': 1.8211842333736235e-05, 'epoch': 0.44} {'loss': 0.5772, 'learning_rate': 1.8211650599027884e-05, 'epoch': 0.44} {'loss': 0.523, 'learning_rate': 1.8211458855050143e-05, 'epoch': 0.44} {'loss': 0.7314, 'learning_rate': 1.8211267101803226e-05, 'epoch': 0.44} {'loss': 0.5474, 'learning_rate': 1.821107533928735e-05, 'epoch': 0.44} {'loss': 0.5592, 'learning_rate': 1.821088356750273e-05, 'epoch': 0.44} {'loss': 0.4929, 'learning_rate': 1.8210691786449587e-05, 'epoch': 0.44} {'loss': 0.5219, 'learning_rate': 1.8210499996128132e-05, 'epoch': 0.44} {'loss': 0.6087, 'learning_rate': 1.8210308196538586e-05, 'epoch': 0.44} {'loss': 0.5974, 'learning_rate': 1.821011638768116e-05, 'epoch': 0.44} {'loss': 0.7358, 'learning_rate': 1.8209924569556076e-05, 'epoch': 0.44} {'loss': 0.6756, 'learning_rate': 1.820973274216355e-05, 'epoch': 0.44} {'loss': 0.5608, 'learning_rate': 1.8209540905503793e-05, 'epoch': 0.44} {'loss': 0.5859, 'learning_rate': 1.8209349059577027e-05, 'epoch': 0.44} {'loss': 0.556, 'learning_rate': 1.8209157204383467e-05, 'epoch': 0.44} {'loss': 0.7114, 'learning_rate': 1.820896533992333e-05, 'epoch': 0.44} {'loss': 0.6557, 'learning_rate': 1.820877346619683e-05, 'epoch': 0.44} {'loss': 0.5774, 'learning_rate': 1.820858158320419e-05, 'epoch': 0.44} {'loss': 0.6328, 'learning_rate': 1.8208389690945622e-05, 'epoch': 0.44} {'loss': 0.5855, 'learning_rate': 1.820819778942134e-05, 'epoch': 0.44} {'loss': 0.5938, 'learning_rate': 1.8208005878631565e-05, 'epoch': 0.44} {'loss': 0.6239, 'learning_rate': 1.820781395857651e-05, 'epoch': 0.44} {'loss': 0.5734, 'learning_rate': 1.8207622029256398e-05, 'epoch': 0.44} {'loss': 0.5629, 'learning_rate': 1.8207430090671438e-05, 'epoch': 0.44} {'loss': 0.727, 'learning_rate': 1.8207238142821852e-05, 'epoch': 0.44} {'loss': 0.6018, 'learning_rate': 1.8207046185707853e-05, 'epoch': 0.44} {'loss': 0.5106, 'learning_rate': 1.8206854219329662e-05, 'epoch': 0.44} {'loss': 0.7182, 'learning_rate': 1.8206662243687492e-05, 'epoch': 0.44} {'loss': 0.6173, 'learning_rate': 1.820647025878156e-05, 'epoch': 0.44} {'loss': 0.5254, 'learning_rate': 1.820627826461208e-05, 'epoch': 0.44} {'loss': 0.6299, 'learning_rate': 1.820608626117928e-05, 'epoch': 0.44} {'loss': 0.464, 'learning_rate': 1.8205894248483364e-05, 'epoch': 0.44} {'loss': 0.5932, 'learning_rate': 1.820570222652456e-05, 'epoch': 0.44} {'loss': 0.664, 'learning_rate': 1.8205510195303068e-05, 'epoch': 0.44} {'loss': 0.6893, 'learning_rate': 1.8205318154819123e-05, 'epoch': 0.44} {'loss': 0.341, 'learning_rate': 1.8205126105072933e-05, 'epoch': 0.44} {'loss': 0.5002, 'learning_rate': 1.8204934046064717e-05, 'epoch': 0.44} {'loss': 0.5747, 'learning_rate': 1.820474197779469e-05, 'epoch': 0.44} {'loss': 0.4877, 'learning_rate': 1.8204549900263068e-05, 'epoch': 0.44} {'loss': 0.4849, 'learning_rate': 1.8204357813470067e-05, 'epoch': 0.44} {'loss': 0.6623, 'learning_rate': 1.820416571741591e-05, 'epoch': 0.44} {'loss': 0.3508, 'learning_rate': 1.820397361210081e-05, 'epoch': 0.44} {'loss': 0.4488, 'learning_rate': 1.8203781497524983e-05, 'epoch': 0.44} {'loss': 0.6114, 'learning_rate': 1.8203589373688645e-05, 'epoch': 0.44} {'loss': 0.6028, 'learning_rate': 1.820339724059202e-05, 'epoch': 0.44} {'loss': 0.8469, 'learning_rate': 1.8203205098235313e-05, 'epoch': 0.44} {'loss': 0.6053, 'learning_rate': 1.820301294661875e-05, 'epoch': 0.44} {'loss': 0.5286, 'learning_rate': 1.8202820785742544e-05, 'epoch': 0.44} {'loss': 0.6126, 'learning_rate': 1.8202628615606915e-05, 'epoch': 0.44} {'loss': 0.6933, 'learning_rate': 1.8202436436212077e-05, 'epoch': 0.44} {'loss': 0.6564, 'learning_rate': 1.820224424755825e-05, 'epoch': 0.44} {'loss': 0.6395, 'learning_rate': 1.8202052049645646e-05, 'epoch': 0.44} {'loss': 0.6853, 'learning_rate': 1.8201859842474484e-05, 'epoch': 0.44} {'loss': 0.5981, 'learning_rate': 1.8201667626044987e-05, 'epoch': 0.44} {'loss': 0.5937, 'learning_rate': 1.8201475400357363e-05, 'epoch': 0.44} {'loss': 0.6762, 'learning_rate': 1.8201283165411835e-05, 'epoch': 0.44} {'loss': 0.651, 'learning_rate': 1.820109092120862e-05, 'epoch': 0.44} {'loss': 0.5838, 'learning_rate': 1.820089866774793e-05, 'epoch': 0.44} {'loss': 0.5822, 'learning_rate': 1.8200706405029983e-05, 'epoch': 0.44} {'loss': 0.5809, 'learning_rate': 1.8200514133055e-05, 'epoch': 0.44} {'loss': 0.3986, 'learning_rate': 1.8200321851823193e-05, 'epoch': 0.44} {'loss': 0.5318, 'learning_rate': 1.8200129561334783e-05, 'epoch': 0.44} {'loss': 0.4643, 'learning_rate': 1.819993726158999e-05, 'epoch': 0.44} {'loss': 0.487, 'learning_rate': 1.8199744952589026e-05, 'epoch': 0.44} {'loss': 0.4814, 'learning_rate': 1.8199552634332108e-05, 'epoch': 0.44} {'loss': 0.6662, 'learning_rate': 1.8199360306819455e-05, 'epoch': 0.44} {'loss': 0.5919, 'learning_rate': 1.819916797005128e-05, 'epoch': 0.44} {'loss': 0.5841, 'learning_rate': 1.8198975624027805e-05, 'epoch': 0.44} {'loss': 0.6496, 'learning_rate': 1.8198783268749246e-05, 'epoch': 0.44} {'loss': 0.5597, 'learning_rate': 1.819859090421582e-05, 'epoch': 0.44} {'loss': 0.5624, 'learning_rate': 1.819839853042775e-05, 'epoch': 0.44} {'loss': 0.5934, 'learning_rate': 1.8198206147385238e-05, 'epoch': 0.44} {'loss': 0.5399, 'learning_rate': 1.8198013755088513e-05, 'epoch': 0.44} {'loss': 0.5508, 'learning_rate': 1.819782135353779e-05, 'epoch': 0.44} {'loss': 0.648, 'learning_rate': 1.8197628942733288e-05, 'epoch': 0.44} {'loss': 0.5182, 'learning_rate': 1.8197436522675217e-05, 'epoch': 0.44} {'loss': 0.4688, 'learning_rate': 1.8197244093363803e-05, 'epoch': 0.44} {'loss': 0.5876, 'learning_rate': 1.819705165479926e-05, 'epoch': 0.44} {'loss': 0.6371, 'learning_rate': 1.8196859206981797e-05, 'epoch': 0.44} {'loss': 0.5215, 'learning_rate': 1.8196666749911646e-05, 'epoch': 0.44} {'loss': 0.62, 'learning_rate': 1.8196474283589012e-05, 'epoch': 0.44} {'loss': 0.4837, 'learning_rate': 1.819628180801412e-05, 'epoch': 0.44} {'loss': 0.5318, 'learning_rate': 1.8196089323187186e-05, 'epoch': 0.44} {'loss': 0.5898, 'learning_rate': 1.8195896829108424e-05, 'epoch': 0.44} {'loss': 0.5156, 'learning_rate': 1.8195704325778054e-05, 'epoch': 0.44} {'loss': 0.7242, 'learning_rate': 1.819551181319629e-05, 'epoch': 0.44} {'loss': 0.5525, 'learning_rate': 1.8195319291363352e-05, 'epoch': 0.44} {'loss': 0.5317, 'learning_rate': 1.819512676027946e-05, 'epoch': 0.44} {'loss': 0.5919, 'learning_rate': 1.8194934219944824e-05, 'epoch': 0.44} {'loss': 0.4937, 'learning_rate': 1.8194741670359668e-05, 'epoch': 0.44} {'loss': 0.3576, 'learning_rate': 1.8194549111524208e-05, 'epoch': 0.44} {'loss': 0.6625, 'learning_rate': 1.819435654343866e-05, 'epoch': 0.44} {'loss': 0.6253, 'learning_rate': 1.8194163966103237e-05, 'epoch': 0.44} {'loss': 0.6285, 'learning_rate': 1.8193971379518163e-05, 'epoch': 0.44} {'loss': 0.6613, 'learning_rate': 1.8193778783683656e-05, 'epoch': 0.44} {'loss': 0.6682, 'learning_rate': 1.8193586178599932e-05, 'epoch': 0.44} {'loss': 0.6336, 'learning_rate': 1.8193393564267205e-05, 'epoch': 0.44} {'loss': 0.5079, 'learning_rate': 1.8193200940685695e-05, 'epoch': 0.44} {'loss': 0.606, 'learning_rate': 1.819300830785562e-05, 'epoch': 0.44} {'loss': 0.6848, 'learning_rate': 1.8192815665777194e-05, 'epoch': 0.44} {'loss': 0.5981, 'learning_rate': 1.819262301445064e-05, 'epoch': 0.44} {'loss': 0.6882, 'learning_rate': 1.819243035387617e-05, 'epoch': 0.44} {'loss': 0.7027, 'learning_rate': 1.8192237684054003e-05, 'epoch': 0.44} {'loss': 0.5263, 'learning_rate': 1.8192045004984363e-05, 'epoch': 0.44} {'loss': 0.5864, 'learning_rate': 1.8191852316667458e-05, 'epoch': 0.44} {'loss': 0.5921, 'learning_rate': 1.819165961910351e-05, 'epoch': 0.44} {'loss': 0.541, 'learning_rate': 1.8191466912292733e-05, 'epoch': 0.44} {'loss': 0.6185, 'learning_rate': 1.8191274196235354e-05, 'epoch': 0.44} {'loss': 0.5839, 'learning_rate': 1.8191081470931583e-05, 'epoch': 0.44} {'loss': 0.5094, 'learning_rate': 1.8190888736381634e-05, 'epoch': 0.44} {'loss': 0.5933, 'learning_rate': 1.8190695992585732e-05, 'epoch': 0.44} {'loss': 0.4653, 'learning_rate': 1.8190503239544092e-05, 'epoch': 0.44} {'loss': 0.7041, 'learning_rate': 1.8190310477256928e-05, 'epoch': 0.44} {'loss': 0.5987, 'learning_rate': 1.8190117705724467e-05, 'epoch': 0.44} {'loss': 0.5197, 'learning_rate': 1.8189924924946916e-05, 'epoch': 0.44} {'loss': 0.5993, 'learning_rate': 1.81897321349245e-05, 'epoch': 0.44} {'loss': 0.5518, 'learning_rate': 1.818953933565743e-05, 'epoch': 0.44} {'loss': 0.5528, 'learning_rate': 1.818934652714593e-05, 'epoch': 0.44} {'loss': 0.5942, 'learning_rate': 1.8189153709390215e-05, 'epoch': 0.44} {'loss': 0.6236, 'learning_rate': 1.81889608823905e-05, 'epoch': 0.44} {'loss': 0.5517, 'learning_rate': 1.8188768046147006e-05, 'epoch': 0.44} {'loss': 0.7033, 'learning_rate': 1.8188575200659956e-05, 'epoch': 0.44} {'loss': 0.628, 'learning_rate': 1.8188382345929558e-05, 'epoch': 0.44} {'loss': 0.5382, 'learning_rate': 1.8188189481956028e-05, 'epoch': 0.44} {'loss': 0.6539, 'learning_rate': 1.8187996608739596e-05, 'epoch': 0.44} {'loss': 0.5705, 'learning_rate': 1.818780372628047e-05, 'epoch': 0.44} {'loss': 0.7053, 'learning_rate': 1.8187610834578872e-05, 'epoch': 0.44} {'loss': 0.6101, 'learning_rate': 1.818741793363502e-05, 'epoch': 0.44} {'loss': 0.5179, 'learning_rate': 1.8187225023449127e-05, 'epoch': 0.44} {'loss': 0.5547, 'learning_rate': 1.8187032104021414e-05, 'epoch': 0.44} {'loss': 0.719, 'learning_rate': 1.8186839175352097e-05, 'epoch': 0.44} {'loss': 0.6315, 'learning_rate': 1.81866462374414e-05, 'epoch': 0.44} {'loss': 0.6758, 'learning_rate': 1.8186453290289532e-05, 'epoch': 0.44} {'loss': 0.6315, 'learning_rate': 1.8186260333896718e-05, 'epoch': 0.44} {'loss': 0.5802, 'learning_rate': 1.818606736826317e-05, 'epoch': 0.44} {'loss': 0.6021, 'learning_rate': 1.818587439338911e-05, 'epoch': 0.44} {'loss': 0.8104, 'learning_rate': 1.8185681409274755e-05, 'epoch': 0.44} {'loss': 0.5197, 'learning_rate': 1.818548841592032e-05, 'epoch': 0.44} {'loss': 0.5685, 'learning_rate': 1.8185295413326027e-05, 'epoch': 0.44} {'loss': 0.5584, 'learning_rate': 1.8185102401492094e-05, 'epoch': 0.44} {'loss': 0.4067, 'learning_rate': 1.8184909380418733e-05, 'epoch': 0.44} {'loss': 0.6129, 'learning_rate': 1.8184716350106167e-05, 'epoch': 0.44} {'loss': 0.664, 'learning_rate': 1.8184523310554616e-05, 'epoch': 0.44} {'loss': 0.5677, 'learning_rate': 1.818433026176429e-05, 'epoch': 0.44} {'loss': 0.7004, 'learning_rate': 1.8184137203735414e-05, 'epoch': 0.44} {'loss': 0.7227, 'learning_rate': 1.81839441364682e-05, 'epoch': 0.44} {'loss': 0.6044, 'learning_rate': 1.818375105996287e-05, 'epoch': 0.44} {'loss': 0.5544, 'learning_rate': 1.8183557974219646e-05, 'epoch': 0.44} {'loss': 0.4813, 'learning_rate': 1.818336487923874e-05, 'epoch': 0.44} {'loss': 0.5041, 'learning_rate': 1.8183171775020367e-05, 'epoch': 0.44} {'loss': 0.5789, 'learning_rate': 1.818297866156475e-05, 'epoch': 0.44} {'loss': 0.6179, 'learning_rate': 1.818278553887211e-05, 'epoch': 0.44} {'loss': 0.4251, 'learning_rate': 1.8182592406942657e-05, 'epoch': 0.44} {'loss': 0.5743, 'learning_rate': 1.8182399265776616e-05, 'epoch': 0.44} {'loss': 0.5431, 'learning_rate': 1.8182206115374202e-05, 'epoch': 0.44} {'loss': 0.551, 'learning_rate': 1.8182012955735632e-05, 'epoch': 0.44} {'loss': 0.5428, 'learning_rate': 1.8181819786861127e-05, 'epoch': 0.44} {'loss': 0.5016, 'learning_rate': 1.81816266087509e-05, 'epoch': 0.44} {'loss': 0.6666, 'learning_rate': 1.8181433421405175e-05, 'epoch': 0.44} {'loss': 0.4596, 'learning_rate': 1.8181240224824165e-05, 'epoch': 0.44} {'loss': 0.654, 'learning_rate': 1.8181047019008096e-05, 'epoch': 0.44} {'loss': 0.6432, 'learning_rate': 1.8180853803957177e-05, 'epoch': 0.44} {'loss': 0.5209, 'learning_rate': 1.8180660579671626e-05, 'epoch': 0.44} {'loss': 0.4831, 'learning_rate': 1.818046734615167e-05, 'epoch': 0.44} {'loss': 0.4999, 'learning_rate': 1.818027410339752e-05, 'epoch': 0.44} {'loss': 0.6908, 'learning_rate': 1.8180080851409395e-05, 'epoch': 0.44} {'loss': 0.4535, 'learning_rate': 1.8179887590187516e-05, 'epoch': 0.44} {'loss': 0.4708, 'learning_rate': 1.8179694319732103e-05, 'epoch': 0.44} {'loss': 0.5601, 'learning_rate': 1.8179501040043364e-05, 'epoch': 0.44} {'loss': 0.5384, 'learning_rate': 1.817930775112153e-05, 'epoch': 0.44} {'loss': 0.5741, 'learning_rate': 1.8179114452966805e-05, 'epoch': 0.44} {'loss': 0.4981, 'learning_rate': 1.817892114557942e-05, 'epoch': 0.44} {'loss': 0.5143, 'learning_rate': 1.8178727828959588e-05, 'epoch': 0.44} {'loss': 0.6191, 'learning_rate': 1.8178534503107527e-05, 'epoch': 0.44} {'loss': 0.542, 'learning_rate': 1.8178341168023456e-05, 'epoch': 0.44} {'loss': 0.5629, 'learning_rate': 1.8178147823707594e-05, 'epoch': 0.44} {'loss': 0.7237, 'learning_rate': 1.8177954470160157e-05, 'epoch': 0.44} {'loss': 0.7449, 'learning_rate': 1.8177761107381366e-05, 'epoch': 0.44} {'loss': 0.7191, 'learning_rate': 1.8177567735371436e-05, 'epoch': 0.44} {'loss': 0.6665, 'learning_rate': 1.817737435413059e-05, 'epoch': 0.44} {'loss': 0.6172, 'learning_rate': 1.817718096365904e-05, 'epoch': 0.44} {'loss': 0.6979, 'learning_rate': 1.8176987563957006e-05, 'epoch': 0.44} {'loss': 0.5214, 'learning_rate': 1.8176794155024714e-05, 'epoch': 0.44} {'loss': 0.5554, 'learning_rate': 1.8176600736862372e-05, 'epoch': 0.44} {'loss': 0.4929, 'learning_rate': 1.8176407309470203e-05, 'epoch': 0.44} {'loss': 0.7275, 'learning_rate': 1.8176213872848424e-05, 'epoch': 0.44} {'loss': 0.5742, 'learning_rate': 1.8176020426997255e-05, 'epoch': 0.44} {'loss': 0.5836, 'learning_rate': 1.8175826971916918e-05, 'epoch': 0.44} {'loss': 0.816, 'learning_rate': 1.817563350760762e-05, 'epoch': 0.44} {'loss': 0.5137, 'learning_rate': 1.817544003406959e-05, 'epoch': 0.44} {'loss': 0.6465, 'learning_rate': 1.8175246551303046e-05, 'epoch': 0.44} {'loss': 0.512, 'learning_rate': 1.81750530593082e-05, 'epoch': 0.44} {'loss': 0.5153, 'learning_rate': 1.817485955808527e-05, 'epoch': 0.44} {'loss': 0.431, 'learning_rate': 1.8174666047634484e-05, 'epoch': 0.44} {'loss': 0.6131, 'learning_rate': 1.8174472527956053e-05, 'epoch': 0.44} {'loss': 0.507, 'learning_rate': 1.8174278999050197e-05, 'epoch': 0.44} {'loss': 0.6357, 'learning_rate': 1.8174085460917134e-05, 'epoch': 0.44} {'loss': 0.6685, 'learning_rate': 1.8173891913557083e-05, 'epoch': 0.44} {'loss': 0.55, 'learning_rate': 1.817369835697026e-05, 'epoch': 0.44} {'loss': 0.5639, 'learning_rate': 1.817350479115689e-05, 'epoch': 0.44} {'loss': 0.6738, 'learning_rate': 1.8173311216117185e-05, 'epoch': 0.44} {'loss': 0.7258, 'learning_rate': 1.8173117631851363e-05, 'epoch': 0.44} {'loss': 0.5551, 'learning_rate': 1.8172924038359648e-05, 'epoch': 0.44} {'loss': 0.4726, 'learning_rate': 1.8172730435642257e-05, 'epoch': 0.44} {'loss': 0.5693, 'learning_rate': 1.8172536823699406e-05, 'epoch': 0.44} {'loss': 0.5251, 'learning_rate': 1.8172343202531317e-05, 'epoch': 0.44} {'loss': 0.6095, 'learning_rate': 1.817214957213821e-05, 'epoch': 0.44} {'loss': 0.6149, 'learning_rate': 1.817195593252029e-05, 'epoch': 0.44} {'loss': 0.5398, 'learning_rate': 1.8171762283677796e-05, 'epoch': 0.44} {'loss': 0.6607, 'learning_rate': 1.8171568625610928e-05, 'epoch': 0.44} {'loss': 0.5115, 'learning_rate': 1.817137495831992e-05, 'epoch': 0.44} {'loss': 0.5699, 'learning_rate': 1.8171181281804976e-05, 'epoch': 0.44} {'loss': 0.548, 'learning_rate': 1.8170987596066328e-05, 'epoch': 0.44} {'loss': 0.6116, 'learning_rate': 1.8170793901104183e-05, 'epoch': 0.44} {'loss': 0.5393, 'learning_rate': 1.8170600196918774e-05, 'epoch': 0.44} {'loss': 0.5907, 'learning_rate': 1.8170406483510304e-05, 'epoch': 0.44} {'loss': 0.4961, 'learning_rate': 1.8170212760879004e-05, 'epoch': 0.44} {'loss': 0.5024, 'learning_rate': 1.8170019029025084e-05, 'epoch': 0.44} {'loss': 0.6122, 'learning_rate': 1.8169825287948764e-05, 'epoch': 0.44} {'loss': 0.5484, 'learning_rate': 1.8169631537650268e-05, 'epoch': 0.44} {'loss': 0.634, 'learning_rate': 1.8169437778129813e-05, 'epoch': 0.44} {'loss': 0.5928, 'learning_rate': 1.816924400938761e-05, 'epoch': 0.44} {'loss': 0.5937, 'learning_rate': 1.8169050231423894e-05, 'epoch': 0.44} {'loss': 0.5499, 'learning_rate': 1.8168856444238865e-05, 'epoch': 0.44} {'loss': 0.5894, 'learning_rate': 1.8168662647832757e-05, 'epoch': 0.44} {'loss': 0.4758, 'learning_rate': 1.8168468842205777e-05, 'epoch': 0.44} {'loss': 0.6269, 'learning_rate': 1.816827502735815e-05, 'epoch': 0.44} {'loss': 0.6906, 'learning_rate': 1.8168081203290094e-05, 'epoch': 0.44} {'loss': 0.5721, 'learning_rate': 1.8167887370001827e-05, 'epoch': 0.44} {'loss': 0.6102, 'learning_rate': 1.816769352749357e-05, 'epoch': 0.44} {'loss': 0.4294, 'learning_rate': 1.8167499675765537e-05, 'epoch': 0.44} {'loss': 0.5242, 'learning_rate': 1.8167305814817955e-05, 'epoch': 0.44} {'loss': 0.6095, 'learning_rate': 1.8167111944651036e-05, 'epoch': 0.44} {'loss': 0.5551, 'learning_rate': 1.8166918065265e-05, 'epoch': 0.44} {'loss': 0.6014, 'learning_rate': 1.8166724176660064e-05, 'epoch': 0.44} {'loss': 0.6146, 'learning_rate': 1.8166530278836455e-05, 'epoch': 0.44} {'loss': 0.5698, 'learning_rate': 1.8166336371794383e-05, 'epoch': 0.44} {'loss': 0.6408, 'learning_rate': 1.8166142455534072e-05, 'epoch': 0.44} {'loss': 0.6038, 'learning_rate': 1.8165948530055732e-05, 'epoch': 0.44} {'loss': 0.6959, 'learning_rate': 1.8165754595359596e-05, 'epoch': 0.44} {'loss': 0.525, 'learning_rate': 1.8165560651445875e-05, 'epoch': 0.44} {'loss': 0.6448, 'learning_rate': 1.816536669831479e-05, 'epoch': 0.44} {'loss': 0.5873, 'learning_rate': 1.8165172735966555e-05, 'epoch': 0.44} {'loss': 0.7425, 'learning_rate': 1.8164978764401393e-05, 'epoch': 0.44} {'loss': 0.5242, 'learning_rate': 1.8164784783619523e-05, 'epoch': 0.44} {'loss': 0.5512, 'learning_rate': 1.8164590793621165e-05, 'epoch': 0.44} {'loss': 0.6481, 'learning_rate': 1.8164396794406537e-05, 'epoch': 0.44} {'loss': 0.6403, 'learning_rate': 1.8164202785975855e-05, 'epoch': 0.44} {'loss': 0.6587, 'learning_rate': 1.8164008768329342e-05, 'epoch': 0.44} {'loss': 0.5295, 'learning_rate': 1.816381474146722e-05, 'epoch': 0.44} {'loss': 0.6957, 'learning_rate': 1.8163620705389697e-05, 'epoch': 0.44} {'loss': 0.6613, 'learning_rate': 1.8163426660096998e-05, 'epoch': 0.44} {'loss': 0.4984, 'learning_rate': 1.8163232605589346e-05, 'epoch': 0.44} {'loss': 0.4801, 'learning_rate': 1.816303854186696e-05, 'epoch': 0.44} {'loss': 0.5308, 'learning_rate': 1.816284446893005e-05, 'epoch': 0.44} {'loss': 0.5439, 'learning_rate': 1.8162650386778843e-05, 'epoch': 0.44} {'loss': 0.4755, 'learning_rate': 1.8162456295413556e-05, 'epoch': 0.44} {'loss': 0.5791, 'learning_rate': 1.8162262194834407e-05, 'epoch': 0.44} {'loss': 0.5623, 'learning_rate': 1.8162068085041616e-05, 'epoch': 0.44} {'loss': 0.6225, 'learning_rate': 1.81618739660354e-05, 'epoch': 0.44} {'loss': 0.608, 'learning_rate': 1.8161679837815987e-05, 'epoch': 0.44} {'loss': 0.5691, 'learning_rate': 1.8161485700383586e-05, 'epoch': 0.44} {'loss': 0.6591, 'learning_rate': 1.8161291553738418e-05, 'epoch': 0.44} {'loss': 0.6282, 'learning_rate': 1.8161097397880706e-05, 'epoch': 0.44} {'loss': 0.5078, 'learning_rate': 1.8160903232810664e-05, 'epoch': 0.44} {'loss': 0.5339, 'learning_rate': 1.8160709058528518e-05, 'epoch': 0.44} {'loss': 0.5019, 'learning_rate': 1.8160514875034483e-05, 'epoch': 0.44} {'loss': 0.4772, 'learning_rate': 1.8160320682328777e-05, 'epoch': 0.44} {'loss': 0.5022, 'learning_rate': 1.816012648041162e-05, 'epoch': 0.44} {'loss': 0.5303, 'learning_rate': 1.8159932269283232e-05, 'epoch': 0.44} {'loss': 0.5625, 'learning_rate': 1.8159738048943833e-05, 'epoch': 0.44} {'loss': 0.4882, 'learning_rate': 1.815954381939364e-05, 'epoch': 0.44} {'loss': 0.5371, 'learning_rate': 1.8159349580632874e-05, 'epoch': 0.44} {'loss': 0.58, 'learning_rate': 1.815915533266176e-05, 'epoch': 0.44} {'loss': 0.5536, 'learning_rate': 1.8158961075480502e-05, 'epoch': 0.44} {'loss': 0.6588, 'learning_rate': 1.815876680908933e-05, 'epoch': 0.44} {'loss': 0.5522, 'learning_rate': 1.8158572533488468e-05, 'epoch': 0.44} {'loss': 0.5199, 'learning_rate': 1.8158378248678125e-05, 'epoch': 0.44} {'loss': 0.5548, 'learning_rate': 1.8158183954658524e-05, 'epoch': 0.44} {'loss': 0.5506, 'learning_rate': 1.8157989651429883e-05, 'epoch': 0.44} {'loss': 0.5115, 'learning_rate': 1.815779533899243e-05, 'epoch': 0.44} {'loss': 0.5919, 'learning_rate': 1.815760101734637e-05, 'epoch': 0.44} {'loss': 0.6192, 'learning_rate': 1.8157406686491933e-05, 'epoch': 0.44} {'loss': 0.4785, 'learning_rate': 1.8157212346429332e-05, 'epoch': 0.44} {'loss': 0.6395, 'learning_rate': 1.8157017997158792e-05, 'epoch': 0.44} {'loss': 0.5225, 'learning_rate': 1.815682363868053e-05, 'epoch': 0.44} {'loss': 0.4599, 'learning_rate': 1.8156629270994765e-05, 'epoch': 0.44} {'loss': 0.7527, 'learning_rate': 1.8156434894101715e-05, 'epoch': 0.44} {'loss': 0.5763, 'learning_rate': 1.8156240508001603e-05, 'epoch': 0.44} {'loss': 0.5484, 'learning_rate': 1.8156046112694647e-05, 'epoch': 0.44} {'loss': 0.7496, 'learning_rate': 1.8155851708181065e-05, 'epoch': 0.44} {'loss': 0.6015, 'learning_rate': 1.8155657294461076e-05, 'epoch': 0.44} {'loss': 0.6143, 'learning_rate': 1.8155462871534902e-05, 'epoch': 0.44} {'loss': 0.5418, 'learning_rate': 1.815526843940276e-05, 'epoch': 0.44} {'loss': 0.6002, 'learning_rate': 1.8155073998064873e-05, 'epoch': 0.44} {'loss': 0.6258, 'learning_rate': 1.8154879547521457e-05, 'epoch': 0.44} {'loss': 0.4717, 'learning_rate': 1.815468508777273e-05, 'epoch': 0.44} {'loss': 0.4837, 'learning_rate': 1.815449061881892e-05, 'epoch': 0.44} {'loss': 0.5352, 'learning_rate': 1.815429614066024e-05, 'epoch': 0.44} {'loss': 0.5082, 'learning_rate': 1.8154101653296904e-05, 'epoch': 0.44} {'loss': 0.5251, 'learning_rate': 1.8153907156729144e-05, 'epoch': 0.44} {'loss': 0.669, 'learning_rate': 1.8153712650957168e-05, 'epoch': 0.44} {'loss': 0.6491, 'learning_rate': 1.8153518135981203e-05, 'epoch': 0.44} {'loss': 0.563, 'learning_rate': 1.815332361180147e-05, 'epoch': 0.44} {'loss': 0.5337, 'learning_rate': 1.815312907841818e-05, 'epoch': 0.44} {'loss': 0.7032, 'learning_rate': 1.8152934535831562e-05, 'epoch': 0.44} {'loss': 0.4365, 'learning_rate': 1.815273998404183e-05, 'epoch': 0.44} {'loss': 0.565, 'learning_rate': 1.8152545423049202e-05, 'epoch': 0.44} {'loss': 0.4428, 'learning_rate': 1.8152350852853902e-05, 'epoch': 0.44} {'loss': 0.4101, 'learning_rate': 1.815215627345615e-05, 'epoch': 0.44} {'loss': 0.6268, 'learning_rate': 1.8151961684856165e-05, 'epoch': 0.44} {'loss': 0.6937, 'learning_rate': 1.815176708705416e-05, 'epoch': 0.44} {'loss': 0.5385, 'learning_rate': 1.8151572480050364e-05, 'epoch': 0.44} {'loss': 0.686, 'learning_rate': 1.8151377863844994e-05, 'epoch': 0.44} {'loss': 0.6038, 'learning_rate': 1.8151183238438267e-05, 'epoch': 0.44} {'loss': 0.3249, 'learning_rate': 1.81509886038304e-05, 'epoch': 0.44} {'loss': 0.5834, 'learning_rate': 1.8150793960021623e-05, 'epoch': 0.44} {'loss': 0.5414, 'learning_rate': 1.8150599307012146e-05, 'epoch': 0.44} {'loss': 0.4357, 'learning_rate': 1.8150404644802194e-05, 'epoch': 0.44} {'loss': 0.5176, 'learning_rate': 1.8150209973391983e-05, 'epoch': 0.44} {'loss': 0.5673, 'learning_rate': 1.8150015292781738e-05, 'epoch': 0.44} {'loss': 0.6668, 'learning_rate': 1.8149820602971674e-05, 'epoch': 0.44} {'loss': 0.6053, 'learning_rate': 1.814962590396201e-05, 'epoch': 0.44} {'loss': 0.6649, 'learning_rate': 1.814943119575297e-05, 'epoch': 0.44} {'loss': 0.5207, 'learning_rate': 1.814923647834477e-05, 'epoch': 0.44} {'loss': 0.5649, 'learning_rate': 1.8149041751737635e-05, 'epoch': 0.44} {'loss': 0.5608, 'learning_rate': 1.8148847015931782e-05, 'epoch': 0.44} {'loss': 0.4479, 'learning_rate': 1.814865227092743e-05, 'epoch': 0.44} {'loss': 0.6673, 'learning_rate': 1.8148457516724796e-05, 'epoch': 0.44} {'loss': 0.6254, 'learning_rate': 1.8148262753324103e-05, 'epoch': 0.44} {'loss': 0.6759, 'learning_rate': 1.814806798072557e-05, 'epoch': 0.44} {'loss': 0.8055, 'learning_rate': 1.814787319892942e-05, 'epoch': 0.44} {'loss': 0.4854, 'learning_rate': 1.814767840793587e-05, 'epoch': 0.44} {'loss': 0.7081, 'learning_rate': 1.8147483607745142e-05, 'epoch': 0.44} {'loss': 0.5837, 'learning_rate': 1.8147288798357456e-05, 'epoch': 0.44} {'loss': 0.6422, 'learning_rate': 1.8147093979773024e-05, 'epoch': 0.44} {'loss': 0.5747, 'learning_rate': 1.8146899151992078e-05, 'epoch': 0.44} {'loss': 0.6496, 'learning_rate': 1.8146704315014827e-05, 'epoch': 0.44} {'loss': 0.5687, 'learning_rate': 1.81465094688415e-05, 'epoch': 0.44} {'loss': 0.4761, 'learning_rate': 1.814631461347231e-05, 'epoch': 0.44} {'loss': 0.6764, 'learning_rate': 1.814611974890748e-05, 'epoch': 0.44} {'loss': 0.7148, 'learning_rate': 1.8145924875147235e-05, 'epoch': 0.44} {'loss': 0.58, 'learning_rate': 1.8145729992191786e-05, 'epoch': 0.44} {'loss': 0.7694, 'learning_rate': 1.8145535100041357e-05, 'epoch': 0.44} {'loss': 0.5959, 'learning_rate': 1.8145340198696165e-05, 'epoch': 0.44} {'loss': 0.7628, 'learning_rate': 1.8145145288156438e-05, 'epoch': 0.44} {'loss': 0.6444, 'learning_rate': 1.8144950368422388e-05, 'epoch': 0.44} {'loss': 0.7087, 'learning_rate': 1.814475543949424e-05, 'epoch': 0.44} {'loss': 0.5218, 'learning_rate': 1.8144560501372208e-05, 'epoch': 0.44} {'loss': 0.6188, 'learning_rate': 1.814436555405652e-05, 'epoch': 0.44} {'loss': 0.5546, 'learning_rate': 1.8144170597547388e-05, 'epoch': 0.44} {'loss': 0.5814, 'learning_rate': 1.8143975631845036e-05, 'epoch': 0.44} {'loss': 0.7534, 'learning_rate': 1.8143780656949687e-05, 'epoch': 0.44} {'loss': 0.4967, 'learning_rate': 1.814358567286156e-05, 'epoch': 0.44} {'loss': 0.644, 'learning_rate': 1.814339067958087e-05, 'epoch': 0.44} {'loss': 0.6352, 'learning_rate': 1.814319567710784e-05, 'epoch': 0.44} {'loss': 0.6653, 'learning_rate': 1.8143000665442692e-05, 'epoch': 0.44} {'loss': 0.5843, 'learning_rate': 1.8142805644585644e-05, 'epoch': 0.44} {'loss': 0.6589, 'learning_rate': 1.814261061453692e-05, 'epoch': 0.44} {'loss': 0.4403, 'learning_rate': 1.8142415575296733e-05, 'epoch': 0.44} {'loss': 0.5281, 'learning_rate': 1.814222052686531e-05, 'epoch': 0.44} {'loss': 0.6057, 'learning_rate': 1.8142025469242868e-05, 'epoch': 0.44} {'loss': 0.6194, 'learning_rate': 1.8141830402429627e-05, 'epoch': 0.44} {'loss': 0.6292, 'learning_rate': 1.8141635326425805e-05, 'epoch': 0.44} {'loss': 0.671, 'learning_rate': 1.814144024123163e-05, 'epoch': 0.44} {'loss': 0.6665, 'learning_rate': 1.8141245146847312e-05, 'epoch': 0.44} {'loss': 0.6741, 'learning_rate': 1.8141050043273082e-05, 'epoch': 0.44} {'loss': 0.5739, 'learning_rate': 1.8140854930509147e-05, 'epoch': 0.44} {'loss': 0.6051, 'learning_rate': 1.8140659808555742e-05, 'epoch': 0.44} {'loss': 0.3903, 'learning_rate': 1.8140464677413077e-05, 'epoch': 0.44} {'loss': 0.4845, 'learning_rate': 1.8140269537081378e-05, 'epoch': 0.44} {'loss': 0.6895, 'learning_rate': 1.814007438756086e-05, 'epoch': 0.44} {'loss': 0.6621, 'learning_rate': 1.8139879228851746e-05, 'epoch': 0.44} {'loss': 0.4625, 'learning_rate': 1.8139684060954254e-05, 'epoch': 0.44} {'loss': 0.4633, 'learning_rate': 1.813948888386861e-05, 'epoch': 0.44} {'loss': 0.6597, 'learning_rate': 1.813929369759503e-05, 'epoch': 0.44} {'loss': 0.6325, 'learning_rate': 1.8139098502133733e-05, 'epoch': 0.44} {'loss': 0.3784, 'learning_rate': 1.8138903297484946e-05, 'epoch': 0.44} {'loss': 0.6372, 'learning_rate': 1.8138708083648883e-05, 'epoch': 0.44} {'loss': 0.5414, 'learning_rate': 1.8138512860625765e-05, 'epoch': 0.44} {'loss': 0.4723, 'learning_rate': 1.8138317628415812e-05, 'epoch': 0.44} {'loss': 0.4407, 'learning_rate': 1.813812238701925e-05, 'epoch': 0.44} {'loss': 0.5767, 'learning_rate': 1.813792713643629e-05, 'epoch': 0.44} {'loss': 0.6906, 'learning_rate': 1.8137731876667163e-05, 'epoch': 0.44} {'loss': 0.457, 'learning_rate': 1.8137536607712084e-05, 'epoch': 0.44} {'loss': 0.7868, 'learning_rate': 1.813734132957127e-05, 'epoch': 0.44} {'loss': 0.469, 'learning_rate': 1.8137146042244947e-05, 'epoch': 0.44} {'loss': 0.5299, 'learning_rate': 1.8136950745733335e-05, 'epoch': 0.44} {'loss': 0.5316, 'learning_rate': 1.8136755440036648e-05, 'epoch': 0.44} {'loss': 0.5491, 'learning_rate': 1.8136560125155117e-05, 'epoch': 0.44} {'loss': 0.5719, 'learning_rate': 1.8136364801088955e-05, 'epoch': 0.44} {'loss': 0.6209, 'learning_rate': 1.8136169467838383e-05, 'epoch': 0.44} {'loss': 0.6522, 'learning_rate': 1.8135974125403624e-05, 'epoch': 0.44} {'loss': 0.5223, 'learning_rate': 1.8135778773784896e-05, 'epoch': 0.44} {'loss': 0.5872, 'learning_rate': 1.8135583412982423e-05, 'epoch': 0.44} {'loss': 0.449, 'learning_rate': 1.8135388042996422e-05, 'epoch': 0.44} {'loss': 0.5339, 'learning_rate': 1.8135192663827114e-05, 'epoch': 0.44} {'loss': 0.4586, 'learning_rate': 1.8134997275474725e-05, 'epoch': 0.45} {'loss': 0.5569, 'learning_rate': 1.8134801877939466e-05, 'epoch': 0.45} {'loss': 0.603, 'learning_rate': 1.8134606471221566e-05, 'epoch': 0.45} {'loss': 0.7153, 'learning_rate': 1.8134411055321237e-05, 'epoch': 0.45} {'loss': 0.5281, 'learning_rate': 1.813421563023871e-05, 'epoch': 0.45} {'loss': 0.6715, 'learning_rate': 1.81340201959742e-05, 'epoch': 0.45} {'loss': 0.8043, 'learning_rate': 1.8133824752527928e-05, 'epoch': 0.45} {'loss': 0.6191, 'learning_rate': 1.813362929990011e-05, 'epoch': 0.45} {'loss': 0.5734, 'learning_rate': 1.8133433838090975e-05, 'epoch': 0.45} {'loss': 0.6054, 'learning_rate': 1.8133238367100737e-05, 'epoch': 0.45} {'loss': 0.5646, 'learning_rate': 1.8133042886929624e-05, 'epoch': 0.45} {'loss': 0.5344, 'learning_rate': 1.8132847397577847e-05, 'epoch': 0.45} {'loss': 0.6175, 'learning_rate': 1.8132651899045638e-05, 'epoch': 0.45} {'loss': 0.6608, 'learning_rate': 1.813245639133321e-05, 'epoch': 0.45} {'loss': 0.5577, 'learning_rate': 1.8132260874440782e-05, 'epoch': 0.45} {'loss': 0.5763, 'learning_rate': 1.8132065348368578e-05, 'epoch': 0.45} {'loss': 0.5102, 'learning_rate': 1.8131869813116817e-05, 'epoch': 0.45} {'loss': 0.5273, 'learning_rate': 1.8131674268685725e-05, 'epoch': 0.45} {'loss': 0.534, 'learning_rate': 1.8131478715075518e-05, 'epoch': 0.45} {'loss': 0.4694, 'learning_rate': 1.813128315228642e-05, 'epoch': 0.45} {'loss': 0.6426, 'learning_rate': 1.8131087580318648e-05, 'epoch': 0.45} {'loss': 0.6753, 'learning_rate': 1.8130891999172423e-05, 'epoch': 0.45} {'loss': 0.4985, 'learning_rate': 1.813069640884797e-05, 'epoch': 0.45} {'loss': 0.5362, 'learning_rate': 1.8130500809345502e-05, 'epoch': 0.45} {'loss': 0.547, 'learning_rate': 1.813030520066525e-05, 'epoch': 0.45} {'loss': 0.649, 'learning_rate': 1.8130109582807425e-05, 'epoch': 0.45} {'loss': 0.7394, 'learning_rate': 1.8129913955772255e-05, 'epoch': 0.45} {'loss': 0.4622, 'learning_rate': 1.812971831955996e-05, 'epoch': 0.45} {'loss': 0.5424, 'learning_rate': 1.8129522674170755e-05, 'epoch': 0.45} {'loss': 0.6318, 'learning_rate': 1.8129327019604862e-05, 'epoch': 0.45} {'loss': 0.5667, 'learning_rate': 1.8129131355862513e-05, 'epoch': 0.45} {'loss': 0.5228, 'learning_rate': 1.8128935682943916e-05, 'epoch': 0.45} {'loss': 0.6872, 'learning_rate': 1.8128740000849294e-05, 'epoch': 0.45} {'loss': 0.6397, 'learning_rate': 1.8128544309578875e-05, 'epoch': 0.45} {'loss': 0.6183, 'learning_rate': 1.8128348609132873e-05, 'epoch': 0.45} {'loss': 0.6622, 'learning_rate': 1.812815289951151e-05, 'epoch': 0.45} {'loss': 0.4133, 'learning_rate': 1.812795718071501e-05, 'epoch': 0.45} {'loss': 0.57, 'learning_rate': 1.8127761452743592e-05, 'epoch': 0.45} {'loss': 0.5858, 'learning_rate': 1.8127565715597476e-05, 'epoch': 0.45} {'loss': 0.5176, 'learning_rate': 1.8127369969276885e-05, 'epoch': 0.45} {'loss': 0.5704, 'learning_rate': 1.8127174213782036e-05, 'epoch': 0.45} {'loss': 0.5335, 'learning_rate': 1.8126978449113156e-05, 'epoch': 0.45} {'loss': 0.5372, 'learning_rate': 1.812678267527046e-05, 'epoch': 0.45} {'loss': 0.4083, 'learning_rate': 1.8126586892254175e-05, 'epoch': 0.45} {'loss': 0.6589, 'learning_rate': 1.8126391100064517e-05, 'epoch': 0.45} {'loss': 0.5326, 'learning_rate': 1.812619529870171e-05, 'epoch': 0.45} {'loss': 0.3183, 'learning_rate': 1.812599948816597e-05, 'epoch': 0.45} {'loss': 0.5625, 'learning_rate': 1.812580366845752e-05, 'epoch': 0.45} {'loss': 0.6174, 'learning_rate': 1.812560783957659e-05, 'epoch': 0.45} {'loss': 0.5655, 'learning_rate': 1.8125412001523393e-05, 'epoch': 0.45} {'loss': 0.6953, 'learning_rate': 1.8125216154298145e-05, 'epoch': 0.45} {'loss': 0.5866, 'learning_rate': 1.812502029790108e-05, 'epoch': 0.45} {'loss': 0.6652, 'learning_rate': 1.8124824432332408e-05, 'epoch': 0.45} {'loss': 0.6108, 'learning_rate': 1.8124628557592356e-05, 'epoch': 0.45} {'loss': 0.5051, 'learning_rate': 1.812443267368114e-05, 'epoch': 0.45} {'loss': 0.6337, 'learning_rate': 1.8124236780598988e-05, 'epoch': 0.45} {'loss': 0.482, 'learning_rate': 1.8124040878346116e-05, 'epoch': 0.45} {'loss': 0.699, 'learning_rate': 1.8123844966922747e-05, 'epoch': 0.45} {'loss': 0.5248, 'learning_rate': 1.8123649046329105e-05, 'epoch': 0.45} {'loss': 0.4678, 'learning_rate': 1.8123453116565403e-05, 'epoch': 0.45} {'loss': 0.7244, 'learning_rate': 1.812325717763187e-05, 'epoch': 0.45} {'loss': 0.5782, 'learning_rate': 1.8123061229528723e-05, 'epoch': 0.45} {'loss': 0.4945, 'learning_rate': 1.8122865272256186e-05, 'epoch': 0.45} {'loss': 0.6929, 'learning_rate': 1.8122669305814476e-05, 'epoch': 0.45} {'loss': 0.4737, 'learning_rate': 1.8122473330203822e-05, 'epoch': 0.45} {'loss': 0.4308, 'learning_rate': 1.8122277345424435e-05, 'epoch': 0.45} {'loss': 0.5339, 'learning_rate': 1.8122081351476547e-05, 'epoch': 0.45} {'loss': 0.6562, 'learning_rate': 1.8121885348360368e-05, 'epoch': 0.45} {'loss': 0.4856, 'learning_rate': 1.8121689336076127e-05, 'epoch': 0.45} {'loss': 0.4526, 'learning_rate': 1.8121493314624042e-05, 'epoch': 0.45} {'loss': 0.4655, 'learning_rate': 1.8121297284004337e-05, 'epoch': 0.45} {'loss': 0.46, 'learning_rate': 1.812110124421723e-05, 'epoch': 0.45} {'loss': 0.7052, 'learning_rate': 1.812090519526295e-05, 'epoch': 0.45} {'loss': 0.6591, 'learning_rate': 1.8120709137141704e-05, 'epoch': 0.45} {'loss': 0.5103, 'learning_rate': 1.8120513069853726e-05, 'epoch': 0.45} {'loss': 0.648, 'learning_rate': 1.812031699339923e-05, 'epoch': 0.45} {'loss': 0.6137, 'learning_rate': 1.8120120907778445e-05, 'epoch': 0.45} {'loss': 0.5351, 'learning_rate': 1.8119924812991586e-05, 'epoch': 0.45} {'loss': 0.6641, 'learning_rate': 1.811972870903887e-05, 'epoch': 0.45} {'loss': 0.6148, 'learning_rate': 1.8119532595920532e-05, 'epoch': 0.45} {'loss': 0.4965, 'learning_rate': 1.8119336473636785e-05, 'epoch': 0.45} {'loss': 0.5125, 'learning_rate': 1.8119140342187846e-05, 'epoch': 0.45} {'loss': 0.6165, 'learning_rate': 1.8118944201573944e-05, 'epoch': 0.45} {'loss': 0.5957, 'learning_rate': 1.81187480517953e-05, 'epoch': 0.45} {'loss': 0.5892, 'learning_rate': 1.8118551892852133e-05, 'epoch': 0.45} {'loss': 0.3727, 'learning_rate': 1.8118355724744662e-05, 'epoch': 0.45} {'loss': 0.4934, 'learning_rate': 1.811815954747311e-05, 'epoch': 0.45} {'loss': 0.4785, 'learning_rate': 1.8117963361037704e-05, 'epoch': 0.45} {'loss': 0.6298, 'learning_rate': 1.811776716543866e-05, 'epoch': 0.45} {'loss': 0.646, 'learning_rate': 1.8117570960676202e-05, 'epoch': 0.45} {'loss': 0.5591, 'learning_rate': 1.8117374746750547e-05, 'epoch': 0.45} {'loss': 0.4674, 'learning_rate': 1.8117178523661917e-05, 'epoch': 0.45} {'loss': 0.6025, 'learning_rate': 1.8116982291410542e-05, 'epoch': 0.45} {'loss': 0.6378, 'learning_rate': 1.8116786049996636e-05, 'epoch': 0.45} {'loss': 0.5728, 'learning_rate': 1.8116589799420417e-05, 'epoch': 0.45} {'loss': 0.6212, 'learning_rate': 1.811639353968212e-05, 'epoch': 0.45} {'loss': 0.6393, 'learning_rate': 1.8116197270781952e-05, 'epoch': 0.45} {'loss': 0.7235, 'learning_rate': 1.811600099272014e-05, 'epoch': 0.45} {'loss': 0.5992, 'learning_rate': 1.811580470549691e-05, 'epoch': 0.45} {'loss': 0.5882, 'learning_rate': 1.811560840911248e-05, 'epoch': 0.45} {'loss': 0.6342, 'learning_rate': 1.811541210356707e-05, 'epoch': 0.45} {'loss': 0.6221, 'learning_rate': 1.81152157888609e-05, 'epoch': 0.45} {'loss': 0.8189, 'learning_rate': 1.8115019464994197e-05, 'epoch': 0.45} {'loss': 0.5184, 'learning_rate': 1.811482313196718e-05, 'epoch': 0.45} {'loss': 0.6113, 'learning_rate': 1.811462678978007e-05, 'epoch': 0.45} {'loss': 0.6983, 'learning_rate': 1.8114430438433092e-05, 'epoch': 0.45} {'loss': 0.7394, 'learning_rate': 1.8114234077926465e-05, 'epoch': 0.45} {'loss': 0.5799, 'learning_rate': 1.8114037708260406e-05, 'epoch': 0.45} {'loss': 0.5441, 'learning_rate': 1.8113841329435143e-05, 'epoch': 0.45} {'loss': 0.4326, 'learning_rate': 1.81136449414509e-05, 'epoch': 0.45} {'loss': 0.5039, 'learning_rate': 1.811344854430789e-05, 'epoch': 0.45} {'loss': 0.5347, 'learning_rate': 1.8113252138006346e-05, 'epoch': 0.45} {'loss': 0.6189, 'learning_rate': 1.8113055722546478e-05, 'epoch': 0.45} {'loss': 0.7122, 'learning_rate': 1.8112859297928513e-05, 'epoch': 0.45} {'loss': 0.7398, 'learning_rate': 1.8112662864152675e-05, 'epoch': 0.45} {'loss': 0.5117, 'learning_rate': 1.811246642121918e-05, 'epoch': 0.45} {'loss': 0.5954, 'learning_rate': 1.8112269969128255e-05, 'epoch': 0.45} {'loss': 0.4896, 'learning_rate': 1.811207350788012e-05, 'epoch': 0.45} {'loss': 0.5971, 'learning_rate': 1.8111877037474996e-05, 'epoch': 0.45} {'loss': 0.6473, 'learning_rate': 1.8111680557913108e-05, 'epoch': 0.45} {'loss': 0.6889, 'learning_rate': 1.8111484069194668e-05, 'epoch': 0.45} {'loss': 0.6387, 'learning_rate': 1.811128757131991e-05, 'epoch': 0.45} {'loss': 0.5332, 'learning_rate': 1.8111091064289054e-05, 'epoch': 0.45} {'loss': 0.5545, 'learning_rate': 1.8110894548102315e-05, 'epoch': 0.45} {'loss': 0.5596, 'learning_rate': 1.8110698022759918e-05, 'epoch': 0.45} {'loss': 0.4798, 'learning_rate': 1.8110501488262085e-05, 'epoch': 0.45} {'loss': 0.5518, 'learning_rate': 1.8110304944609038e-05, 'epoch': 0.45} {'loss': 0.5779, 'learning_rate': 1.8110108391801e-05, 'epoch': 0.45} {'loss': 0.541, 'learning_rate': 1.810991182983819e-05, 'epoch': 0.45} {'loss': 0.5986, 'learning_rate': 1.8109715258720835e-05, 'epoch': 0.45} {'loss': 0.6114, 'learning_rate': 1.810951867844915e-05, 'epoch': 0.45} {'loss': 0.5971, 'learning_rate': 1.8109322089023362e-05, 'epoch': 0.45} {'loss': 0.6267, 'learning_rate': 1.8109125490443692e-05, 'epoch': 0.45} {'loss': 0.489, 'learning_rate': 1.8108928882710363e-05, 'epoch': 0.45} {'loss': 0.699, 'learning_rate': 1.8108732265823593e-05, 'epoch': 0.45} {'loss': 0.6917, 'learning_rate': 1.8108535639783606e-05, 'epoch': 0.45} {'loss': 0.5879, 'learning_rate': 1.8108339004590628e-05, 'epoch': 0.45} {'loss': 0.5362, 'learning_rate': 1.8108142360244873e-05, 'epoch': 0.45} {'loss': 0.7501, 'learning_rate': 1.8107945706746568e-05, 'epoch': 0.45} {'loss': 0.6763, 'learning_rate': 1.8107749044095932e-05, 'epoch': 0.45} {'loss': 0.7252, 'learning_rate': 1.8107552372293194e-05, 'epoch': 0.45} {'loss': 0.589, 'learning_rate': 1.8107355691338567e-05, 'epoch': 0.45} {'loss': 0.6962, 'learning_rate': 1.8107159001232277e-05, 'epoch': 0.45} {'loss': 0.5418, 'learning_rate': 1.8106962301974548e-05, 'epoch': 0.45} {'loss': 0.5434, 'learning_rate': 1.81067655935656e-05, 'epoch': 0.45} {'loss': 0.6471, 'learning_rate': 1.8106568876005655e-05, 'epoch': 0.45} {'loss': 0.5108, 'learning_rate': 1.8106372149294934e-05, 'epoch': 0.45} {'loss': 0.5704, 'learning_rate': 1.8106175413433666e-05, 'epoch': 0.45} {'loss': 0.6076, 'learning_rate': 1.810597866842206e-05, 'epoch': 0.45} {'loss': 0.5443, 'learning_rate': 1.8105781914260346e-05, 'epoch': 0.45} {'loss': 0.693, 'learning_rate': 1.8105585150948753e-05, 'epoch': 0.45} {'loss': 0.4815, 'learning_rate': 1.810538837848749e-05, 'epoch': 0.45} {'loss': 0.6974, 'learning_rate': 1.8105191596876782e-05, 'epoch': 0.45} {'loss': 0.5889, 'learning_rate': 1.810499480611686e-05, 'epoch': 0.45} {'loss': 0.4605, 'learning_rate': 1.8104798006207936e-05, 'epoch': 0.45} {'loss': 0.5626, 'learning_rate': 1.8104601197150238e-05, 'epoch': 0.45} {'loss': 0.6569, 'learning_rate': 1.8104404378943987e-05, 'epoch': 0.45} {'loss': 0.569, 'learning_rate': 1.8104207551589405e-05, 'epoch': 0.45} {'loss': 0.4553, 'learning_rate': 1.8104010715086714e-05, 'epoch': 0.45} {'loss': 0.6102, 'learning_rate': 1.8103813869436132e-05, 'epoch': 0.45} {'loss': 0.4346, 'learning_rate': 1.810361701463789e-05, 'epoch': 0.45} {'loss': 0.6506, 'learning_rate': 1.81034201506922e-05, 'epoch': 0.45} {'loss': 0.536, 'learning_rate': 1.8103223277599293e-05, 'epoch': 0.45} {'loss': 0.5935, 'learning_rate': 1.810302639535939e-05, 'epoch': 0.45} {'loss': 0.5263, 'learning_rate': 1.8102829503972706e-05, 'epoch': 0.45} {'loss': 0.4983, 'learning_rate': 1.8102632603439474e-05, 'epoch': 0.45} {'loss': 0.6596, 'learning_rate': 1.8102435693759907e-05, 'epoch': 0.45} {'loss': 0.536, 'learning_rate': 1.810223877493423e-05, 'epoch': 0.45} {'loss': 0.5258, 'learning_rate': 1.810204184696267e-05, 'epoch': 0.45} {'loss': 0.4491, 'learning_rate': 1.810184490984544e-05, 'epoch': 0.45} {'loss': 0.6073, 'learning_rate': 1.810164796358277e-05, 'epoch': 0.45} {'loss': 0.4931, 'learning_rate': 1.8101451008174883e-05, 'epoch': 0.45} {'loss': 0.3952, 'learning_rate': 1.8101254043621997e-05, 'epoch': 0.45} {'loss': 0.7323, 'learning_rate': 1.8101057069924333e-05, 'epoch': 0.45} {'loss': 0.6558, 'learning_rate': 1.810086008708212e-05, 'epoch': 0.45} {'loss': 0.5362, 'learning_rate': 1.8100663095095572e-05, 'epoch': 0.45} {'loss': 0.5873, 'learning_rate': 1.810046609396492e-05, 'epoch': 0.45} {'loss': 0.4178, 'learning_rate': 1.8100269083690378e-05, 'epoch': 0.45} {'loss': 0.6919, 'learning_rate': 1.8100072064272175e-05, 'epoch': 0.45} {'loss': 0.4667, 'learning_rate': 1.809987503571053e-05, 'epoch': 0.45} {'loss': 0.4268, 'learning_rate': 1.8099677998005666e-05, 'epoch': 0.45} {'loss': 0.5099, 'learning_rate': 1.809948095115781e-05, 'epoch': 0.45} {'loss': 0.5434, 'learning_rate': 1.8099283895167175e-05, 'epoch': 0.45} {'loss': 0.5309, 'learning_rate': 1.809908683003399e-05, 'epoch': 0.45} {'loss': 0.4613, 'learning_rate': 1.8098889755758476e-05, 'epoch': 0.45} {'loss': 0.5444, 'learning_rate': 1.8098692672340857e-05, 'epoch': 0.45} {'loss': 0.4494, 'learning_rate': 1.8098495579781356e-05, 'epoch': 0.45} {'loss': 0.5812, 'learning_rate': 1.809829847808019e-05, 'epoch': 0.45} {'loss': 0.783, 'learning_rate': 1.8098101367237587e-05, 'epoch': 0.45} {'loss': 0.6998, 'learning_rate': 1.8097904247253765e-05, 'epoch': 0.45} {'loss': 0.6801, 'learning_rate': 1.809770711812895e-05, 'epoch': 0.45} {'loss': 0.5445, 'learning_rate': 1.8097509979863362e-05, 'epoch': 0.45} {'loss': 0.6232, 'learning_rate': 1.8097312832457228e-05, 'epoch': 0.45} {'loss': 0.6993, 'learning_rate': 1.8097115675910765e-05, 'epoch': 0.45} {'loss': 0.5509, 'learning_rate': 1.8096918510224203e-05, 'epoch': 0.45} {'loss': 0.6434, 'learning_rate': 1.8096721335397752e-05, 'epoch': 0.45} {'loss': 0.4833, 'learning_rate': 1.809652415143165e-05, 'epoch': 0.45} {'loss': 0.7182, 'learning_rate': 1.8096326958326106e-05, 'epoch': 0.45} {'loss': 0.5588, 'learning_rate': 1.8096129756081352e-05, 'epoch': 0.45} {'loss': 0.5455, 'learning_rate': 1.8095932544697606e-05, 'epoch': 0.45} {'loss': 0.8121, 'learning_rate': 1.8095735324175094e-05, 'epoch': 0.45} {'loss': 0.5904, 'learning_rate': 1.809553809451403e-05, 'epoch': 0.45} {'loss': 0.4762, 'learning_rate': 1.8095340855714647e-05, 'epoch': 0.45} {'loss': 0.676, 'learning_rate': 1.8095143607777165e-05, 'epoch': 0.45} {'loss': 0.7076, 'learning_rate': 1.8094946350701802e-05, 'epoch': 0.45} {'loss': 0.4304, 'learning_rate': 1.8094749084488787e-05, 'epoch': 0.45} {'loss': 0.4602, 'learning_rate': 1.8094551809138337e-05, 'epoch': 0.45} {'loss': 0.5403, 'learning_rate': 1.8094354524650678e-05, 'epoch': 0.45} {'loss': 0.5465, 'learning_rate': 1.8094157231026033e-05, 'epoch': 0.45} {'loss': 0.4798, 'learning_rate': 1.809395992826462e-05, 'epoch': 0.45} {'loss': 0.4805, 'learning_rate': 1.809376261636667e-05, 'epoch': 0.45} {'loss': 0.4962, 'learning_rate': 1.80935652953324e-05, 'epoch': 0.45} {'loss': 0.6299, 'learning_rate': 1.8093367965162034e-05, 'epoch': 0.45} {'loss': 0.4532, 'learning_rate': 1.809317062585579e-05, 'epoch': 0.45} {'loss': 0.5718, 'learning_rate': 1.8092973277413902e-05, 'epoch': 0.45} {'loss': 0.5418, 'learning_rate': 1.8092775919836583e-05, 'epoch': 0.45} {'loss': 0.4979, 'learning_rate': 1.809257855312406e-05, 'epoch': 0.45} {'loss': 0.5563, 'learning_rate': 1.8092381177276553e-05, 'epoch': 0.45} {'loss': 0.7011, 'learning_rate': 1.809218379229429e-05, 'epoch': 0.45} {'loss': 0.6158, 'learning_rate': 1.8091986398177487e-05, 'epoch': 0.45} {'loss': 0.5856, 'learning_rate': 1.809178899492637e-05, 'epoch': 0.45} {'loss': 0.5906, 'learning_rate': 1.809159158254116e-05, 'epoch': 0.45} {'loss': 0.5467, 'learning_rate': 1.8091394161022086e-05, 'epoch': 0.45} {'loss': 0.4568, 'learning_rate': 1.8091196730369364e-05, 'epoch': 0.45} {'loss': 0.4595, 'learning_rate': 1.8090999290583222e-05, 'epoch': 0.45} {'loss': 0.6068, 'learning_rate': 1.809080184166388e-05, 'epoch': 0.45} {'loss': 0.6045, 'learning_rate': 1.809060438361156e-05, 'epoch': 0.45} {'loss': 0.4676, 'learning_rate': 1.8090406916426486e-05, 'epoch': 0.45} {'loss': 0.5182, 'learning_rate': 1.809020944010888e-05, 'epoch': 0.45} {'loss': 0.3135, 'learning_rate': 1.8090011954658967e-05, 'epoch': 0.45} {'loss': 0.5515, 'learning_rate': 1.808981446007697e-05, 'epoch': 0.45} {'loss': 0.4393, 'learning_rate': 1.808961695636311e-05, 'epoch': 0.45} {'loss': 0.4734, 'learning_rate': 1.8089419443517614e-05, 'epoch': 0.45} {'loss': 0.4826, 'learning_rate': 1.8089221921540696e-05, 'epoch': 0.45} {'loss': 0.5776, 'learning_rate': 1.8089024390432584e-05, 'epoch': 0.45} {'loss': 0.4687, 'learning_rate': 1.8088826850193508e-05, 'epoch': 0.45} {'loss': 0.591, 'learning_rate': 1.808862930082368e-05, 'epoch': 0.45} {'loss': 0.5786, 'learning_rate': 1.808843174232333e-05, 'epoch': 0.45} {'loss': 0.5951, 'learning_rate': 1.8088234174692682e-05, 'epoch': 0.45} {'loss': 0.6455, 'learning_rate': 1.8088036597931947e-05, 'epoch': 0.45} {'loss': 0.6735, 'learning_rate': 1.8087839012041363e-05, 'epoch': 0.45} {'loss': 0.5368, 'learning_rate': 1.8087641417021145e-05, 'epoch': 0.45} {'loss': 0.4289, 'learning_rate': 1.8087443812871516e-05, 'epoch': 0.45} {'loss': 0.6457, 'learning_rate': 1.8087246199592703e-05, 'epoch': 0.45} {'loss': 0.6147, 'learning_rate': 1.808704857718493e-05, 'epoch': 0.45} {'loss': 0.5708, 'learning_rate': 1.808685094564841e-05, 'epoch': 0.45} {'loss': 0.3562, 'learning_rate': 1.8086653304983376e-05, 'epoch': 0.45} {'loss': 0.556, 'learning_rate': 1.8086455655190048e-05, 'epoch': 0.45} {'loss': 0.4849, 'learning_rate': 1.8086257996268656e-05, 'epoch': 0.45} {'loss': 0.429, 'learning_rate': 1.808606032821941e-05, 'epoch': 0.45} {'loss': 0.5434, 'learning_rate': 1.808586265104254e-05, 'epoch': 0.45} {'loss': 0.6953, 'learning_rate': 1.8085664964738265e-05, 'epoch': 0.45} {'loss': 0.5787, 'learning_rate': 1.8085467269306815e-05, 'epoch': 0.45} {'loss': 0.5041, 'learning_rate': 1.8085269564748412e-05, 'epoch': 0.45} {'loss': 0.7417, 'learning_rate': 1.8085071851063274e-05, 'epoch': 0.45} {'loss': 0.6041, 'learning_rate': 1.808487412825163e-05, 'epoch': 0.45} {'loss': 0.5771, 'learning_rate': 1.80846763963137e-05, 'epoch': 0.45} {'loss': 0.571, 'learning_rate': 1.8084478655249705e-05, 'epoch': 0.45} {'loss': 0.6703, 'learning_rate': 1.8084280905059875e-05, 'epoch': 0.45} {'loss': 0.6524, 'learning_rate': 1.8084083145744428e-05, 'epoch': 0.45} {'loss': 0.6131, 'learning_rate': 1.8083885377303586e-05, 'epoch': 0.45} {'loss': 0.5335, 'learning_rate': 1.8083687599737577e-05, 'epoch': 0.45} {'loss': 0.5031, 'learning_rate': 1.8083489813046618e-05, 'epoch': 0.45} {'loss': 0.5632, 'learning_rate': 1.808329201723094e-05, 'epoch': 0.45} {'loss': 0.4898, 'learning_rate': 1.8083094212290763e-05, 'epoch': 0.45} {'loss': 0.7312, 'learning_rate': 1.8082896398226308e-05, 'epoch': 0.45} {'loss': 0.6261, 'learning_rate': 1.80826985750378e-05, 'epoch': 0.45} {'loss': 0.5218, 'learning_rate': 1.8082500742725463e-05, 'epoch': 0.45} {'loss': 0.4879, 'learning_rate': 1.808230290128952e-05, 'epoch': 0.45} {'loss': 0.4314, 'learning_rate': 1.8082105050730194e-05, 'epoch': 0.45} {'loss': 0.6777, 'learning_rate': 1.8081907191047708e-05, 'epoch': 0.45} {'loss': 0.6049, 'learning_rate': 1.808170932224228e-05, 'epoch': 0.45} {'loss': 0.5514, 'learning_rate': 1.8081511444314148e-05, 'epoch': 0.45} {'loss': 0.4007, 'learning_rate': 1.8081313557263523e-05, 'epoch': 0.45} {'loss': 0.6428, 'learning_rate': 1.808111566109063e-05, 'epoch': 0.45} {'loss': 0.6334, 'learning_rate': 1.8080917755795696e-05, 'epoch': 0.45} {'loss': 0.6339, 'learning_rate': 1.808071984137894e-05, 'epoch': 0.45} {'loss': 0.5357, 'learning_rate': 1.808052191784059e-05, 'epoch': 0.45} {'loss': 0.5952, 'learning_rate': 1.8080323985180867e-05, 'epoch': 0.45} {'loss': 0.6779, 'learning_rate': 1.8080126043399997e-05, 'epoch': 0.45} {'loss': 0.7244, 'learning_rate': 1.80799280924982e-05, 'epoch': 0.45} {'loss': 0.6679, 'learning_rate': 1.8079730132475697e-05, 'epoch': 0.45} {'loss': 0.6448, 'learning_rate': 1.807953216333272e-05, 'epoch': 0.45} {'loss': 0.5538, 'learning_rate': 1.8079334185069483e-05, 'epoch': 0.45} {'loss': 0.5056, 'learning_rate': 1.8079136197686217e-05, 'epoch': 0.45} {'loss': 0.5777, 'learning_rate': 1.8078938201183144e-05, 'epoch': 0.45} {'loss': 0.7147, 'learning_rate': 1.8078740195560483e-05, 'epoch': 0.45} {'loss': 0.5405, 'learning_rate': 1.807854218081846e-05, 'epoch': 0.45} {'loss': 0.4492, 'learning_rate': 1.8078344156957302e-05, 'epoch': 0.45} {'loss': 0.6238, 'learning_rate': 1.8078146123977226e-05, 'epoch': 0.45} {'loss': 0.5075, 'learning_rate': 1.8077948081878463e-05, 'epoch': 0.45} {'loss': 0.7264, 'learning_rate': 1.807775003066123e-05, 'epoch': 0.45} {'loss': 0.4794, 'learning_rate': 1.8077551970325756e-05, 'epoch': 0.45} {'loss': 0.717, 'learning_rate': 1.8077353900872258e-05, 'epoch': 0.45} {'loss': 0.5023, 'learning_rate': 1.8077155822300968e-05, 'epoch': 0.45} {'loss': 0.4467, 'learning_rate': 1.80769577346121e-05, 'epoch': 0.45} {'loss': 0.6352, 'learning_rate': 1.8076759637805886e-05, 'epoch': 0.45} {'loss': 0.5868, 'learning_rate': 1.8076561531882548e-05, 'epoch': 0.45} {'loss': 0.5554, 'learning_rate': 1.8076363416842305e-05, 'epoch': 0.45} {'loss': 0.6292, 'learning_rate': 1.8076165292685383e-05, 'epoch': 0.45} {'loss': 0.6024, 'learning_rate': 1.8075967159412008e-05, 'epoch': 0.45} {'loss': 0.5232, 'learning_rate': 1.80757690170224e-05, 'epoch': 0.45} {'loss': 0.579, 'learning_rate': 1.8075570865516787e-05, 'epoch': 0.45} {'loss': 0.5035, 'learning_rate': 1.8075372704895387e-05, 'epoch': 0.45} {'loss': 0.8438, 'learning_rate': 1.807517453515843e-05, 'epoch': 0.45} {'loss': 0.4967, 'learning_rate': 1.8074976356306134e-05, 'epoch': 0.45} {'loss': 0.5789, 'learning_rate': 1.8074778168338723e-05, 'epoch': 0.45} {'loss': 0.5559, 'learning_rate': 1.8074579971256428e-05, 'epoch': 0.45} {'loss': 0.6147, 'learning_rate': 1.8074381765059466e-05, 'epoch': 0.45} {'loss': 0.4406, 'learning_rate': 1.807418354974806e-05, 'epoch': 0.45} {'loss': 0.5891, 'learning_rate': 1.8073985325322437e-05, 'epoch': 0.45} {'loss': 0.6397, 'learning_rate': 1.8073787091782824e-05, 'epoch': 0.45} {'loss': 0.5593, 'learning_rate': 1.8073588849129438e-05, 'epoch': 0.45} {'loss': 0.6155, 'learning_rate': 1.8073390597362507e-05, 'epoch': 0.45} {'loss': 0.5364, 'learning_rate': 1.807319233648225e-05, 'epoch': 0.45} {'loss': 0.7674, 'learning_rate': 1.8072994066488893e-05, 'epoch': 0.45} {'loss': 0.5795, 'learning_rate': 1.8072795787382665e-05, 'epoch': 0.45} {'loss': 0.5089, 'learning_rate': 1.8072597499163786e-05, 'epoch': 0.45} {'loss': 0.5555, 'learning_rate': 1.8072399201832475e-05, 'epoch': 0.45} {'loss': 0.6018, 'learning_rate': 1.8072200895388963e-05, 'epoch': 0.45} {'loss': 0.6159, 'learning_rate': 1.807200257983347e-05, 'epoch': 0.45} {'loss': 0.7492, 'learning_rate': 1.8071804255166222e-05, 'epoch': 0.45} {'loss': 0.5669, 'learning_rate': 1.8071605921387443e-05, 'epoch': 0.45} {'loss': 0.6398, 'learning_rate': 1.8071407578497354e-05, 'epoch': 0.45} {'loss': 0.3993, 'learning_rate': 1.8071209226496182e-05, 'epoch': 0.45} {'loss': 0.6974, 'learning_rate': 1.8071010865384147e-05, 'epoch': 0.45} {'loss': 0.5384, 'learning_rate': 1.807081249516148e-05, 'epoch': 0.45} {'loss': 0.6123, 'learning_rate': 1.80706141158284e-05, 'epoch': 0.45} {'loss': 0.5997, 'learning_rate': 1.8070415727385125e-05, 'epoch': 0.45} {'loss': 0.5902, 'learning_rate': 1.807021732983189e-05, 'epoch': 0.45} {'loss': 0.5522, 'learning_rate': 1.8070018923168918e-05, 'epoch': 0.45} {'loss': 0.5369, 'learning_rate': 1.8069820507396424e-05, 'epoch': 0.45} {'loss': 0.6785, 'learning_rate': 1.8069622082514637e-05, 'epoch': 0.45} {'loss': 0.5776, 'learning_rate': 1.8069423648523783e-05, 'epoch': 0.45} {'loss': 0.5846, 'learning_rate': 1.8069225205424082e-05, 'epoch': 0.45} {'loss': 0.6474, 'learning_rate': 1.8069026753215765e-05, 'epoch': 0.45} {'loss': 0.4758, 'learning_rate': 1.806882829189905e-05, 'epoch': 0.45} {'loss': 0.5611, 'learning_rate': 1.8068629821474156e-05, 'epoch': 0.45} {'loss': 0.639, 'learning_rate': 1.806843134194132e-05, 'epoch': 0.45} {'loss': 0.5563, 'learning_rate': 1.8068232853300756e-05, 'epoch': 0.45} {'loss': 0.647, 'learning_rate': 1.806803435555269e-05, 'epoch': 0.45} {'loss': 0.483, 'learning_rate': 1.8067835848697353e-05, 'epoch': 0.45} {'loss': 0.5749, 'learning_rate': 1.806763733273496e-05, 'epoch': 0.45} {'loss': 0.685, 'learning_rate': 1.8067438807665736e-05, 'epoch': 0.45} {'loss': 0.6178, 'learning_rate': 1.806724027348991e-05, 'epoch': 0.45} {'loss': 0.5827, 'learning_rate': 1.8067041730207707e-05, 'epoch': 0.45} {'loss': 0.5153, 'learning_rate': 1.8066843177819343e-05, 'epoch': 0.45} {'loss': 0.548, 'learning_rate': 1.806664461632505e-05, 'epoch': 0.45} {'loss': 0.7444, 'learning_rate': 1.8066446045725047e-05, 'epoch': 0.45} {'loss': 0.562, 'learning_rate': 1.8066247466019562e-05, 'epoch': 0.45} {'loss': 0.5998, 'learning_rate': 1.806604887720882e-05, 'epoch': 0.45} {'loss': 0.5477, 'learning_rate': 1.8065850279293037e-05, 'epoch': 0.45} {'loss': 0.6436, 'learning_rate': 1.8065651672272447e-05, 'epoch': 0.45} {'loss': 0.7415, 'learning_rate': 1.806545305614727e-05, 'epoch': 0.45} {'loss': 0.4995, 'learning_rate': 1.8065254430917724e-05, 'epoch': 0.45} {'loss': 0.645, 'learning_rate': 1.8065055796584046e-05, 'epoch': 0.45} {'loss': 0.6038, 'learning_rate': 1.806485715314645e-05, 'epoch': 0.45} {'loss': 0.6596, 'learning_rate': 1.8064658500605164e-05, 'epoch': 0.45} {'loss': 0.6026, 'learning_rate': 1.806445983896042e-05, 'epoch': 0.45} {'loss': 0.6087, 'learning_rate': 1.8064261168212425e-05, 'epoch': 0.45} {'loss': 0.6406, 'learning_rate': 1.8064062488361414e-05, 'epoch': 0.45} {'loss': 0.5285, 'learning_rate': 1.8063863799407616e-05, 'epoch': 0.45} {'loss': 0.6739, 'learning_rate': 1.806366510135124e-05, 'epoch': 0.45} {'loss': 0.4594, 'learning_rate': 1.806346639419253e-05, 'epoch': 0.45} {'loss': 0.7266, 'learning_rate': 1.806326767793169e-05, 'epoch': 0.45} {'loss': 0.6561, 'learning_rate': 1.8063068952568962e-05, 'epoch': 0.45} {'loss': 0.6101, 'learning_rate': 1.8062870218104554e-05, 'epoch': 0.45} {'loss': 0.7423, 'learning_rate': 1.8062671474538706e-05, 'epoch': 0.45} {'loss': 0.5736, 'learning_rate': 1.806247272187163e-05, 'epoch': 0.45} {'loss': 0.5623, 'learning_rate': 1.806227396010356e-05, 'epoch': 0.45} {'loss': 0.594, 'learning_rate': 1.8062075189234712e-05, 'epoch': 0.45} {'loss': 0.584, 'learning_rate': 1.806187640926532e-05, 'epoch': 0.45} {'loss': 0.6095, 'learning_rate': 1.8061677620195593e-05, 'epoch': 0.45} {'loss': 0.6521, 'learning_rate': 1.8061478822025776e-05, 'epoch': 0.45} {'loss': 0.7432, 'learning_rate': 1.8061280014756074e-05, 'epoch': 0.45} {'loss': 0.6195, 'learning_rate': 1.8061081198386724e-05, 'epoch': 0.45} {'loss': 0.5213, 'learning_rate': 1.8060882372917943e-05, 'epoch': 0.45} {'loss': 0.5586, 'learning_rate': 1.8060683538349962e-05, 'epoch': 0.45} {'loss': 0.6324, 'learning_rate': 1.8060484694683e-05, 'epoch': 0.45} {'loss': 0.5094, 'learning_rate': 1.8060285841917284e-05, 'epoch': 0.45} {'loss': 0.6972, 'learning_rate': 1.8060086980053036e-05, 'epoch': 0.45} {'loss': 0.4708, 'learning_rate': 1.8059888109090488e-05, 'epoch': 0.45} {'loss': 0.6657, 'learning_rate': 1.8059689229029854e-05, 'epoch': 0.45} {'loss': 0.6054, 'learning_rate': 1.8059490339871365e-05, 'epoch': 0.45} {'loss': 0.5801, 'learning_rate': 1.8059291441615244e-05, 'epoch': 0.45} {'loss': 0.6052, 'learning_rate': 1.8059092534261714e-05, 'epoch': 0.45} {'loss': 0.5849, 'learning_rate': 1.8058893617811004e-05, 'epoch': 0.45} {'loss': 0.6141, 'learning_rate': 1.8058694692263335e-05, 'epoch': 0.45} {'loss': 0.5093, 'learning_rate': 1.8058495757618933e-05, 'epoch': 0.45} {'loss': 0.6069, 'learning_rate': 1.805829681387802e-05, 'epoch': 0.45} {'loss': 0.5069, 'learning_rate': 1.805809786104082e-05, 'epoch': 0.45} {'loss': 0.5039, 'learning_rate': 1.8057898899107564e-05, 'epoch': 0.45} {'loss': 0.5231, 'learning_rate': 1.8057699928078468e-05, 'epoch': 0.45} {'loss': 0.4966, 'learning_rate': 1.8057500947953766e-05, 'epoch': 0.45} {'loss': 0.5688, 'learning_rate': 1.8057301958733676e-05, 'epoch': 0.45} {'loss': 0.669, 'learning_rate': 1.8057102960418423e-05, 'epoch': 0.45} {'loss': 0.4086, 'learning_rate': 1.8056903953008232e-05, 'epoch': 0.45} {'loss': 0.4678, 'learning_rate': 1.805670493650333e-05, 'epoch': 0.45} {'loss': 0.5999, 'learning_rate': 1.805650591090394e-05, 'epoch': 0.45} {'loss': 0.4619, 'learning_rate': 1.8056306876210286e-05, 'epoch': 0.45} {'loss': 0.6049, 'learning_rate': 1.8056107832422595e-05, 'epoch': 0.45} {'loss': 0.7099, 'learning_rate': 1.805590877954109e-05, 'epoch': 0.45} {'loss': 0.5591, 'learning_rate': 1.8055709717565996e-05, 'epoch': 0.45} {'loss': 0.6419, 'learning_rate': 1.8055510646497535e-05, 'epoch': 0.45} {'loss': 0.5538, 'learning_rate': 1.805531156633594e-05, 'epoch': 0.45} {'loss': 0.7534, 'learning_rate': 1.8055112477081423e-05, 'epoch': 0.45} {'loss': 0.4469, 'learning_rate': 1.805491337873422e-05, 'epoch': 0.45} {'loss': 0.5953, 'learning_rate': 1.805471427129455e-05, 'epoch': 0.45} {'loss': 0.6789, 'learning_rate': 1.8054515154762642e-05, 'epoch': 0.45} {'loss': 0.639, 'learning_rate': 1.8054316029138714e-05, 'epoch': 0.45} {'loss': 0.459, 'learning_rate': 1.8054116894422998e-05, 'epoch': 0.45} {'loss': 0.5503, 'learning_rate': 1.8053917750615715e-05, 'epoch': 0.45} {'loss': 0.6047, 'learning_rate': 1.805371859771709e-05, 'epoch': 0.45} {'loss': 0.5976, 'learning_rate': 1.8053519435727346e-05, 'epoch': 0.45} {'loss': 0.5824, 'learning_rate': 1.8053320264646713e-05, 'epoch': 0.45} {'loss': 0.7069, 'learning_rate': 1.805312108447541e-05, 'epoch': 0.45} {'loss': 0.6073, 'learning_rate': 1.8052921895213667e-05, 'epoch': 0.45} {'loss': 0.5456, 'learning_rate': 1.8052722696861708e-05, 'epoch': 0.45} {'loss': 0.5865, 'learning_rate': 1.8052523489419753e-05, 'epoch': 0.45} {'loss': 0.5281, 'learning_rate': 1.8052324272888034e-05, 'epoch': 0.45} {'loss': 0.4405, 'learning_rate': 1.8052125047266767e-05, 'epoch': 0.45} {'loss': 0.5948, 'learning_rate': 1.8051925812556186e-05, 'epoch': 0.45} {'loss': 0.5318, 'learning_rate': 1.805172656875651e-05, 'epoch': 0.45} {'loss': 0.6237, 'learning_rate': 1.8051527315867966e-05, 'epoch': 0.45} {'loss': 0.6061, 'learning_rate': 1.8051328053890778e-05, 'epoch': 0.45} {'loss': 0.5501, 'learning_rate': 1.8051128782825174e-05, 'epoch': 0.45} {'loss': 0.5499, 'learning_rate': 1.8050929502671373e-05, 'epoch': 0.45} {'loss': 0.6118, 'learning_rate': 1.8050730213429608e-05, 'epoch': 0.45} {'loss': 0.6958, 'learning_rate': 1.80505309151001e-05, 'epoch': 0.45} {'loss': 0.7143, 'learning_rate': 1.805033160768307e-05, 'epoch': 0.45} {'loss': 0.3849, 'learning_rate': 1.8050132291178746e-05, 'epoch': 0.45} {'loss': 0.5584, 'learning_rate': 1.8049932965587357e-05, 'epoch': 0.45} {'loss': 0.4997, 'learning_rate': 1.804973363090912e-05, 'epoch': 0.45} {'loss': 0.6411, 'learning_rate': 1.8049534287144264e-05, 'epoch': 0.45} {'loss': 0.4791, 'learning_rate': 1.804933493429302e-05, 'epoch': 0.45} {'loss': 0.6057, 'learning_rate': 1.8049135572355604e-05, 'epoch': 0.45} {'loss': 0.6247, 'learning_rate': 1.8048936201332248e-05, 'epoch': 0.45} {'loss': 0.4907, 'learning_rate': 1.804873682122317e-05, 'epoch': 0.45} {'loss': 0.6373, 'learning_rate': 1.80485374320286e-05, 'epoch': 0.45} {'loss': 0.4774, 'learning_rate': 1.804833803374876e-05, 'epoch': 0.45} {'loss': 0.4081, 'learning_rate': 1.8048138626383878e-05, 'epoch': 0.45} {'loss': 0.7551, 'learning_rate': 1.804793920993418e-05, 'epoch': 0.45} {'loss': 0.435, 'learning_rate': 1.8047739784399885e-05, 'epoch': 0.45} {'loss': 0.8049, 'learning_rate': 1.8047540349781225e-05, 'epoch': 0.45} {'loss': 0.6225, 'learning_rate': 1.804734090607842e-05, 'epoch': 0.45} {'loss': 0.689, 'learning_rate': 1.80471414532917e-05, 'epoch': 0.45} {'loss': 0.5723, 'learning_rate': 1.8046941991421284e-05, 'epoch': 0.45} {'loss': 0.5653, 'learning_rate': 1.8046742520467403e-05, 'epoch': 0.45} {'loss': 0.6382, 'learning_rate': 1.8046543040430284e-05, 'epoch': 0.45} {'loss': 0.4629, 'learning_rate': 1.804634355131014e-05, 'epoch': 0.45} {'loss': 0.6518, 'learning_rate': 1.8046144053107208e-05, 'epoch': 0.45} {'loss': 0.628, 'learning_rate': 1.804594454582171e-05, 'epoch': 0.45} {'loss': 0.6508, 'learning_rate': 1.8045745029453872e-05, 'epoch': 0.45} {'loss': 0.5927, 'learning_rate': 1.8045545504003918e-05, 'epoch': 0.45} {'loss': 0.6674, 'learning_rate': 1.804534596947207e-05, 'epoch': 0.45} {'loss': 0.5566, 'learning_rate': 1.8045146425858554e-05, 'epoch': 0.45} {'loss': 0.4806, 'learning_rate': 1.8044946873163602e-05, 'epoch': 0.45} {'loss': 0.616, 'learning_rate': 1.8044747311387433e-05, 'epoch': 0.45} {'loss': 0.4625, 'learning_rate': 1.8044547740530275e-05, 'epoch': 0.45} {'loss': 0.581, 'learning_rate': 1.8044348160592352e-05, 'epoch': 0.45} {'loss': 0.5614, 'learning_rate': 1.8044148571573893e-05, 'epoch': 0.45} {'loss': 0.5754, 'learning_rate': 1.8043948973475115e-05, 'epoch': 0.45} {'loss': 0.5249, 'learning_rate': 1.804374936629625e-05, 'epoch': 0.45} {'loss': 0.7502, 'learning_rate': 1.8043549750037522e-05, 'epoch': 0.45} {'loss': 0.7145, 'learning_rate': 1.8043350124699154e-05, 'epoch': 0.45} {'loss': 0.607, 'learning_rate': 1.8043150490281373e-05, 'epoch': 0.45} {'loss': 0.5896, 'learning_rate': 1.8042950846784407e-05, 'epoch': 0.45} {'loss': 0.5914, 'learning_rate': 1.8042751194208475e-05, 'epoch': 0.45} {'loss': 0.5314, 'learning_rate': 1.8042551532553814e-05, 'epoch': 0.45} {'loss': 0.6554, 'learning_rate': 1.8042351861820636e-05, 'epoch': 0.45} {'loss': 0.5258, 'learning_rate': 1.8042152182009173e-05, 'epoch': 0.45} {'loss': 0.6097, 'learning_rate': 1.804195249311965e-05, 'epoch': 0.45} {'loss': 0.5305, 'learning_rate': 1.804175279515229e-05, 'epoch': 0.45} {'loss': 0.6122, 'learning_rate': 1.8041553088107322e-05, 'epoch': 0.45} {'loss': 0.7403, 'learning_rate': 1.804135337198497e-05, 'epoch': 0.45} {'loss': 0.5981, 'learning_rate': 1.8041153646785455e-05, 'epoch': 0.45} {'loss': 0.6142, 'learning_rate': 1.8040953912509015e-05, 'epoch': 0.45} {'loss': 0.7864, 'learning_rate': 1.804075416915586e-05, 'epoch': 0.45} {'loss': 0.6043, 'learning_rate': 1.8040554416726226e-05, 'epoch': 0.45} {'loss': 0.5421, 'learning_rate': 1.8040354655220332e-05, 'epoch': 0.45} {'loss': 0.5185, 'learning_rate': 1.804015488463841e-05, 'epoch': 0.45} {'loss': 0.7769, 'learning_rate': 1.803995510498068e-05, 'epoch': 0.45} {'loss': 0.5009, 'learning_rate': 1.803975531624737e-05, 'epoch': 0.45} {'loss': 0.5795, 'learning_rate': 1.8039555518438705e-05, 'epoch': 0.46} {'loss': 0.5573, 'learning_rate': 1.8039355711554912e-05, 'epoch': 0.46} {'loss': 0.5715, 'learning_rate': 1.803915589559621e-05, 'epoch': 0.46} {'loss': 0.4261, 'learning_rate': 1.803895607056284e-05, 'epoch': 0.46} {'loss': 0.5375, 'learning_rate': 1.8038756236455008e-05, 'epoch': 0.46} {'loss': 0.5704, 'learning_rate': 1.8038556393272952e-05, 'epoch': 0.46} {'loss': 0.6252, 'learning_rate': 1.8038356541016894e-05, 'epoch': 0.46} {'loss': 0.6878, 'learning_rate': 1.803815667968706e-05, 'epoch': 0.46} {'loss': 0.578, 'learning_rate': 1.8037956809283676e-05, 'epoch': 0.46} {'loss': 0.5764, 'learning_rate': 1.803775692980697e-05, 'epoch': 0.46} {'loss': 0.6109, 'learning_rate': 1.803755704125716e-05, 'epoch': 0.46} {'loss': 0.5775, 'learning_rate': 1.8037357143634477e-05, 'epoch': 0.46} {'loss': 0.5634, 'learning_rate': 1.8037157236939147e-05, 'epoch': 0.46} {'loss': 0.4622, 'learning_rate': 1.8036957321171396e-05, 'epoch': 0.46} {'loss': 0.6343, 'learning_rate': 1.8036757396331448e-05, 'epoch': 0.46} {'loss': 0.5626, 'learning_rate': 1.803655746241953e-05, 'epoch': 0.46} {'loss': 0.497, 'learning_rate': 1.8036357519435865e-05, 'epoch': 0.46} {'loss': 0.5306, 'learning_rate': 1.803615756738068e-05, 'epoch': 0.46} {'loss': 0.5794, 'learning_rate': 1.8035957606254203e-05, 'epoch': 0.46} {'loss': 0.6566, 'learning_rate': 1.8035757636056657e-05, 'epoch': 0.46} {'loss': 0.6065, 'learning_rate': 1.8035557656788273e-05, 'epoch': 0.46} {'loss': 0.5432, 'learning_rate': 1.803535766844927e-05, 'epoch': 0.46} {'loss': 0.6061, 'learning_rate': 1.8035157671039872e-05, 'epoch': 0.46} {'loss': 0.5471, 'learning_rate': 1.8034957664560314e-05, 'epoch': 0.46} {'loss': 0.8149, 'learning_rate': 1.8034757649010815e-05, 'epoch': 0.46} {'loss': 0.6243, 'learning_rate': 1.8034557624391598e-05, 'epoch': 0.46} {'loss': 0.5336, 'learning_rate': 1.8034357590702902e-05, 'epoch': 0.46} {'loss': 0.3287, 'learning_rate': 1.803415754794494e-05, 'epoch': 0.46} {'loss': 0.4822, 'learning_rate': 1.803395749611794e-05, 'epoch': 0.46} {'loss': 0.7004, 'learning_rate': 1.803375743522213e-05, 'epoch': 0.46} {'loss': 0.7024, 'learning_rate': 1.8033557365257736e-05, 'epoch': 0.46} {'loss': 0.663, 'learning_rate': 1.8033357286224987e-05, 'epoch': 0.46} {'loss': 0.5388, 'learning_rate': 1.8033157198124104e-05, 'epoch': 0.46} {'loss': 0.4759, 'learning_rate': 1.803295710095531e-05, 'epoch': 0.46} {'loss': 0.6799, 'learning_rate': 1.8032756994718838e-05, 'epoch': 0.46} {'loss': 0.5294, 'learning_rate': 1.803255687941491e-05, 'epoch': 0.46} {'loss': 0.4459, 'learning_rate': 1.8032356755043753e-05, 'epoch': 0.46} {'loss': 0.6233, 'learning_rate': 1.803215662160559e-05, 'epoch': 0.46} {'loss': 0.4897, 'learning_rate': 1.8031956479100655e-05, 'epoch': 0.46} {'loss': 0.3336, 'learning_rate': 1.8031756327529164e-05, 'epoch': 0.46} {'loss': 0.5825, 'learning_rate': 1.8031556166891347e-05, 'epoch': 0.46} {'loss': 0.4724, 'learning_rate': 1.8031355997187435e-05, 'epoch': 0.46} {'loss': 0.6809, 'learning_rate': 1.8031155818417648e-05, 'epoch': 0.46} {'loss': 0.4399, 'learning_rate': 1.803095563058221e-05, 'epoch': 0.46} {'loss': 0.4816, 'learning_rate': 1.8030755433681354e-05, 'epoch': 0.46} {'loss': 0.7509, 'learning_rate': 1.8030555227715297e-05, 'epoch': 0.46} {'loss': 0.636, 'learning_rate': 1.8030355012684277e-05, 'epoch': 0.46} {'loss': 0.6312, 'learning_rate': 1.803015478858851e-05, 'epoch': 0.46} {'loss': 0.4722, 'learning_rate': 1.8029954555428224e-05, 'epoch': 0.46} {'loss': 0.621, 'learning_rate': 1.8029754313203648e-05, 'epoch': 0.46} {'loss': 0.6171, 'learning_rate': 1.8029554061915003e-05, 'epoch': 0.46} {'loss': 0.626, 'learning_rate': 1.8029353801562527e-05, 'epoch': 0.46} {'loss': 0.6628, 'learning_rate': 1.8029153532146428e-05, 'epoch': 0.46} {'loss': 0.6566, 'learning_rate': 1.8028953253666945e-05, 'epoch': 0.46} {'loss': 0.6132, 'learning_rate': 1.80287529661243e-05, 'epoch': 0.46} {'loss': 0.6134, 'learning_rate': 1.8028552669518722e-05, 'epoch': 0.46} {'loss': 0.5921, 'learning_rate': 1.8028352363850433e-05, 'epoch': 0.46} {'loss': 0.5213, 'learning_rate': 1.802815204911966e-05, 'epoch': 0.46} {'loss': 0.5039, 'learning_rate': 1.8027951725326632e-05, 'epoch': 0.46} {'loss': 0.6529, 'learning_rate': 1.802775139247157e-05, 'epoch': 0.46} {'loss': 0.6177, 'learning_rate': 1.8027551050554707e-05, 'epoch': 0.46} {'loss': 0.7901, 'learning_rate': 1.8027350699576264e-05, 'epoch': 0.46} {'loss': 0.6239, 'learning_rate': 1.8027150339536466e-05, 'epoch': 0.46} {'loss': 0.552, 'learning_rate': 1.8026949970435543e-05, 'epoch': 0.46} {'loss': 0.6417, 'learning_rate': 1.8026749592273723e-05, 'epoch': 0.46} {'loss': 0.7062, 'learning_rate': 1.8026549205051225e-05, 'epoch': 0.46} {'loss': 0.5601, 'learning_rate': 1.802634880876828e-05, 'epoch': 0.46} {'loss': 0.5187, 'learning_rate': 1.8026148403425114e-05, 'epoch': 0.46} {'loss': 0.5558, 'learning_rate': 1.8025947989021956e-05, 'epoch': 0.46} {'loss': 0.6151, 'learning_rate': 1.8025747565559025e-05, 'epoch': 0.46} {'loss': 0.5459, 'learning_rate': 1.802554713303655e-05, 'epoch': 0.46} {'loss': 0.5789, 'learning_rate': 1.802534669145476e-05, 'epoch': 0.46} {'loss': 0.5424, 'learning_rate': 1.8025146240813883e-05, 'epoch': 0.46} {'loss': 0.6714, 'learning_rate': 1.8024945781114137e-05, 'epoch': 0.46} {'loss': 0.5622, 'learning_rate': 1.802474531235576e-05, 'epoch': 0.46} {'loss': 0.5126, 'learning_rate': 1.8024544834538968e-05, 'epoch': 0.46} {'loss': 0.7117, 'learning_rate': 1.8024344347663985e-05, 'epoch': 0.46} {'loss': 0.5984, 'learning_rate': 1.802414385173105e-05, 'epoch': 0.46} {'loss': 0.6413, 'learning_rate': 1.802394334674038e-05, 'epoch': 0.46} {'loss': 0.737, 'learning_rate': 1.8023742832692205e-05, 'epoch': 0.46} {'loss': 0.5588, 'learning_rate': 1.8023542309586747e-05, 'epoch': 0.46} {'loss': 0.5754, 'learning_rate': 1.802334177742424e-05, 'epoch': 0.46} {'loss': 0.5237, 'learning_rate': 1.8023141236204904e-05, 'epoch': 0.46} {'loss': 0.6372, 'learning_rate': 1.8022940685928967e-05, 'epoch': 0.46} {'loss': 0.7576, 'learning_rate': 1.8022740126596655e-05, 'epoch': 0.46} {'loss': 0.608, 'learning_rate': 1.8022539558208193e-05, 'epoch': 0.46} {'loss': 0.4608, 'learning_rate': 1.8022338980763813e-05, 'epoch': 0.46} {'loss': 0.4927, 'learning_rate': 1.8022138394263736e-05, 'epoch': 0.46} {'loss': 0.5713, 'learning_rate': 1.8021937798708192e-05, 'epoch': 0.46} {'loss': 0.5, 'learning_rate': 1.8021737194097405e-05, 'epoch': 0.46} {'loss': 0.6154, 'learning_rate': 1.8021536580431603e-05, 'epoch': 0.46} {'loss': 0.6066, 'learning_rate': 1.8021335957711008e-05, 'epoch': 0.46} {'loss': 0.7049, 'learning_rate': 1.8021135325935854e-05, 'epoch': 0.46} {'loss': 0.4944, 'learning_rate': 1.802093468510636e-05, 'epoch': 0.46} {'loss': 0.4904, 'learning_rate': 1.802073403522276e-05, 'epoch': 0.46} {'loss': 0.6236, 'learning_rate': 1.802053337628527e-05, 'epoch': 0.46} {'loss': 0.6017, 'learning_rate': 1.802033270829413e-05, 'epoch': 0.46} {'loss': 0.5358, 'learning_rate': 1.8020132031249554e-05, 'epoch': 0.46} {'loss': 0.6816, 'learning_rate': 1.801993134515178e-05, 'epoch': 0.46} {'loss': 0.626, 'learning_rate': 1.801973065000102e-05, 'epoch': 0.46} {'loss': 0.6009, 'learning_rate': 1.801952994579752e-05, 'epoch': 0.46} {'loss': 0.5975, 'learning_rate': 1.8019329232541486e-05, 'epoch': 0.46} {'loss': 0.5999, 'learning_rate': 1.801912851023316e-05, 'epoch': 0.46} {'loss': 0.671, 'learning_rate': 1.801892777887276e-05, 'epoch': 0.46} {'loss': 0.6594, 'learning_rate': 1.8018727038460518e-05, 'epoch': 0.46} {'loss': 0.4697, 'learning_rate': 1.8018526288996655e-05, 'epoch': 0.46} {'loss': 0.6727, 'learning_rate': 1.8018325530481405e-05, 'epoch': 0.46} {'loss': 0.3503, 'learning_rate': 1.8018124762914985e-05, 'epoch': 0.46} {'loss': 0.6174, 'learning_rate': 1.801792398629763e-05, 'epoch': 0.46} {'loss': 0.4618, 'learning_rate': 1.8017723200629564e-05, 'epoch': 0.46} {'loss': 0.6731, 'learning_rate': 1.801752240591101e-05, 'epoch': 0.46} {'loss': 0.5349, 'learning_rate': 1.8017321602142202e-05, 'epoch': 0.46} {'loss': 0.6118, 'learning_rate': 1.8017120789323358e-05, 'epoch': 0.46} {'loss': 0.4364, 'learning_rate': 1.8016919967454712e-05, 'epoch': 0.46} {'loss': 0.5286, 'learning_rate': 1.801671913653649e-05, 'epoch': 0.46} {'loss': 0.7588, 'learning_rate': 1.801651829656891e-05, 'epoch': 0.46} {'loss': 0.4646, 'learning_rate': 1.8016317447552208e-05, 'epoch': 0.46} {'loss': 0.6368, 'learning_rate': 1.801611658948661e-05, 'epoch': 0.46} {'loss': 0.5035, 'learning_rate': 1.801591572237234e-05, 'epoch': 0.46} {'loss': 0.5648, 'learning_rate': 1.8015714846209627e-05, 'epoch': 0.46} {'loss': 0.5803, 'learning_rate': 1.8015513960998695e-05, 'epoch': 0.46} {'loss': 0.584, 'learning_rate': 1.8015313066739768e-05, 'epoch': 0.46} {'loss': 0.6756, 'learning_rate': 1.801511216343308e-05, 'epoch': 0.46} {'loss': 0.5627, 'learning_rate': 1.8014911251078854e-05, 'epoch': 0.46} {'loss': 0.5674, 'learning_rate': 1.801471032967732e-05, 'epoch': 0.46} {'loss': 0.543, 'learning_rate': 1.8014509399228698e-05, 'epoch': 0.46} {'loss': 0.6623, 'learning_rate': 1.801430845973322e-05, 'epoch': 0.46} {'loss': 0.6427, 'learning_rate': 1.8014107511191116e-05, 'epoch': 0.46} {'loss': 0.5192, 'learning_rate': 1.8013906553602605e-05, 'epoch': 0.46} {'loss': 0.5626, 'learning_rate': 1.8013705586967917e-05, 'epoch': 0.46} {'loss': 0.4638, 'learning_rate': 1.801350461128728e-05, 'epoch': 0.46} {'loss': 0.5866, 'learning_rate': 1.8013303626560917e-05, 'epoch': 0.46} {'loss': 0.7192, 'learning_rate': 1.8013102632789063e-05, 'epoch': 0.46} {'loss': 0.5116, 'learning_rate': 1.801290162997194e-05, 'epoch': 0.46} {'loss': 0.6859, 'learning_rate': 1.8012700618109772e-05, 'epoch': 0.46} {'loss': 0.5035, 'learning_rate': 1.801249959720279e-05, 'epoch': 0.46} {'loss': 0.5247, 'learning_rate': 1.8012298567251217e-05, 'epoch': 0.46} {'loss': 0.5209, 'learning_rate': 1.8012097528255284e-05, 'epoch': 0.46} {'loss': 0.6111, 'learning_rate': 1.8011896480215218e-05, 'epoch': 0.46} {'loss': 0.5264, 'learning_rate': 1.8011695423131242e-05, 'epoch': 0.46} {'loss': 0.6208, 'learning_rate': 1.8011494357003586e-05, 'epoch': 0.46} {'loss': 0.7719, 'learning_rate': 1.801129328183248e-05, 'epoch': 0.46} {'loss': 0.6597, 'learning_rate': 1.8011092197618142e-05, 'epoch': 0.46} {'loss': 0.5413, 'learning_rate': 1.8010891104360804e-05, 'epoch': 0.46} {'loss': 0.486, 'learning_rate': 1.80106900020607e-05, 'epoch': 0.46} {'loss': 0.5923, 'learning_rate': 1.8010488890718045e-05, 'epoch': 0.46} {'loss': 0.387, 'learning_rate': 1.8010287770333074e-05, 'epoch': 0.46} {'loss': 0.6436, 'learning_rate': 1.801008664090601e-05, 'epoch': 0.46} {'loss': 0.5526, 'learning_rate': 1.800988550243708e-05, 'epoch': 0.46} {'loss': 0.5535, 'learning_rate': 1.8009684354926515e-05, 'epoch': 0.46} {'loss': 0.5117, 'learning_rate': 1.8009483198374535e-05, 'epoch': 0.46} {'loss': 0.3727, 'learning_rate': 1.8009282032781376e-05, 'epoch': 0.46} {'loss': 0.49, 'learning_rate': 1.8009080858147258e-05, 'epoch': 0.46} {'loss': 0.7264, 'learning_rate': 1.8008879674472413e-05, 'epoch': 0.46} {'loss': 0.6025, 'learning_rate': 1.8008678481757066e-05, 'epoch': 0.46} {'loss': 0.5148, 'learning_rate': 1.800847728000144e-05, 'epoch': 0.46} {'loss': 0.6453, 'learning_rate': 1.800827606920577e-05, 'epoch': 0.46} {'loss': 0.5451, 'learning_rate': 1.8008074849370277e-05, 'epoch': 0.46} {'loss': 0.6346, 'learning_rate': 1.8007873620495192e-05, 'epoch': 0.46} {'loss': 0.5862, 'learning_rate': 1.8007672382580737e-05, 'epoch': 0.46} {'loss': 0.6891, 'learning_rate': 1.8007471135627147e-05, 'epoch': 0.46} {'loss': 0.5012, 'learning_rate': 1.8007269879634644e-05, 'epoch': 0.46} {'loss': 0.4663, 'learning_rate': 1.8007068614603452e-05, 'epoch': 0.46} {'loss': 0.639, 'learning_rate': 1.8006867340533806e-05, 'epoch': 0.46} {'loss': 0.6224, 'learning_rate': 1.8006666057425932e-05, 'epoch': 0.46} {'loss': 0.6147, 'learning_rate': 1.800646476528005e-05, 'epoch': 0.46} {'loss': 0.5843, 'learning_rate': 1.8006263464096392e-05, 'epoch': 0.46} {'loss': 0.6149, 'learning_rate': 1.8006062153875186e-05, 'epoch': 0.46} {'loss': 0.5818, 'learning_rate': 1.8005860834616658e-05, 'epoch': 0.46} {'loss': 0.6589, 'learning_rate': 1.8005659506321036e-05, 'epoch': 0.46} {'loss': 0.435, 'learning_rate': 1.8005458168988546e-05, 'epoch': 0.46} {'loss': 0.6195, 'learning_rate': 1.8005256822619416e-05, 'epoch': 0.46} {'loss': 0.5611, 'learning_rate': 1.8005055467213872e-05, 'epoch': 0.46} {'loss': 0.5832, 'learning_rate': 1.8004854102772146e-05, 'epoch': 0.46} {'loss': 0.4958, 'learning_rate': 1.800465272929446e-05, 'epoch': 0.46} {'loss': 0.4776, 'learning_rate': 1.800445134678104e-05, 'epoch': 0.46} {'loss': 0.6123, 'learning_rate': 1.8004249955232126e-05, 'epoch': 0.46} {'loss': 0.5175, 'learning_rate': 1.8004048554647928e-05, 'epoch': 0.46} {'loss': 0.543, 'learning_rate': 1.8003847145028684e-05, 'epoch': 0.46} {'loss': 0.5392, 'learning_rate': 1.8003645726374616e-05, 'epoch': 0.46} {'loss': 0.6343, 'learning_rate': 1.8003444298685953e-05, 'epoch': 0.46} {'loss': 0.481, 'learning_rate': 1.800324286196293e-05, 'epoch': 0.46} {'loss': 0.4343, 'learning_rate': 1.8003041416205762e-05, 'epoch': 0.46} {'loss': 0.6111, 'learning_rate': 1.8002839961414684e-05, 'epoch': 0.46} {'loss': 0.7396, 'learning_rate': 1.800263849758992e-05, 'epoch': 0.46} {'loss': 0.5901, 'learning_rate': 1.8002437024731702e-05, 'epoch': 0.46} {'loss': 0.4408, 'learning_rate': 1.8002235542840252e-05, 'epoch': 0.46} {'loss': 0.6229, 'learning_rate': 1.80020340519158e-05, 'epoch': 0.46} {'loss': 0.562, 'learning_rate': 1.8001832551958573e-05, 'epoch': 0.46} {'loss': 0.5113, 'learning_rate': 1.8001631042968798e-05, 'epoch': 0.46} {'loss': 0.7559, 'learning_rate': 1.8001429524946707e-05, 'epoch': 0.46} {'loss': 0.4649, 'learning_rate': 1.8001227997892517e-05, 'epoch': 0.46} {'loss': 0.6307, 'learning_rate': 1.8001026461806466e-05, 'epoch': 0.46} {'loss': 0.5418, 'learning_rate': 1.800082491668878e-05, 'epoch': 0.46} {'loss': 0.6618, 'learning_rate': 1.800062336253968e-05, 'epoch': 0.46} {'loss': 0.4498, 'learning_rate': 1.80004217993594e-05, 'epoch': 0.46} {'loss': 0.4671, 'learning_rate': 1.8000220227148164e-05, 'epoch': 0.46} {'loss': 0.5775, 'learning_rate': 1.80000186459062e-05, 'epoch': 0.46} {'loss': 0.6602, 'learning_rate': 1.799981705563374e-05, 'epoch': 0.46} {'loss': 0.736, 'learning_rate': 1.7999615456331e-05, 'epoch': 0.46} {'loss': 0.6024, 'learning_rate': 1.7999413847998224e-05, 'epoch': 0.46} {'loss': 0.5822, 'learning_rate': 1.7999212230635628e-05, 'epoch': 0.46} {'loss': 0.7485, 'learning_rate': 1.799901060424344e-05, 'epoch': 0.46} {'loss': 0.5259, 'learning_rate': 1.7998808968821892e-05, 'epoch': 0.46} {'loss': 0.6712, 'learning_rate': 1.7998607324371213e-05, 'epoch': 0.46} {'loss': 0.7094, 'learning_rate': 1.799840567089162e-05, 'epoch': 0.46} {'loss': 0.6319, 'learning_rate': 1.7998204008383354e-05, 'epoch': 0.46} {'loss': 0.5349, 'learning_rate': 1.7998002336846634e-05, 'epoch': 0.46} {'loss': 0.7095, 'learning_rate': 1.799780065628169e-05, 'epoch': 0.46} {'loss': 0.5532, 'learning_rate': 1.799759896668875e-05, 'epoch': 0.46} {'loss': 0.77, 'learning_rate': 1.7997397268068045e-05, 'epoch': 0.46} {'loss': 0.6271, 'learning_rate': 1.7997195560419794e-05, 'epoch': 0.46} {'loss': 0.4288, 'learning_rate': 1.799699384374423e-05, 'epoch': 0.46} {'loss': 0.585, 'learning_rate': 1.7996792118041585e-05, 'epoch': 0.46} {'loss': 0.6389, 'learning_rate': 1.799659038331208e-05, 'epoch': 0.46} {'loss': 0.5767, 'learning_rate': 1.7996388639555947e-05, 'epoch': 0.46} {'loss': 0.8194, 'learning_rate': 1.799618688677341e-05, 'epoch': 0.46} {'loss': 0.4798, 'learning_rate': 1.79959851249647e-05, 'epoch': 0.46} {'loss': 0.4478, 'learning_rate': 1.799578335413004e-05, 'epoch': 0.46} {'loss': 0.5365, 'learning_rate': 1.7995581574269665e-05, 'epoch': 0.46} {'loss': 0.6208, 'learning_rate': 1.79953797853838e-05, 'epoch': 0.46} {'loss': 0.6785, 'learning_rate': 1.7995177987472664e-05, 'epoch': 0.46} {'loss': 0.5421, 'learning_rate': 1.7994976180536498e-05, 'epoch': 0.46} {'loss': 0.6105, 'learning_rate': 1.7994774364575525e-05, 'epoch': 0.46} {'loss': 0.648, 'learning_rate': 1.7994572539589968e-05, 'epoch': 0.46} {'loss': 0.6798, 'learning_rate': 1.799437070558006e-05, 'epoch': 0.46} {'loss': 0.5579, 'learning_rate': 1.799416886254603e-05, 'epoch': 0.46} {'loss': 0.6095, 'learning_rate': 1.7993967010488105e-05, 'epoch': 0.46} {'loss': 0.5353, 'learning_rate': 1.7993765149406506e-05, 'epoch': 0.46} {'loss': 0.7147, 'learning_rate': 1.7993563279301473e-05, 'epoch': 0.46} {'loss': 0.5226, 'learning_rate': 1.799336140017322e-05, 'epoch': 0.46} {'loss': 0.8396, 'learning_rate': 1.7993159512021984e-05, 'epoch': 0.46} {'loss': 0.4911, 'learning_rate': 1.7992957614847994e-05, 'epoch': 0.46} {'loss': 0.8173, 'learning_rate': 1.7992755708651472e-05, 'epoch': 0.46} {'loss': 0.6371, 'learning_rate': 1.799255379343265e-05, 'epoch': 0.46} {'loss': 0.5672, 'learning_rate': 1.7992351869191753e-05, 'epoch': 0.46} {'loss': 0.5437, 'learning_rate': 1.7992149935929012e-05, 'epoch': 0.46} {'loss': 0.5716, 'learning_rate': 1.7991947993644655e-05, 'epoch': 0.46} {'loss': 0.5708, 'learning_rate': 1.7991746042338903e-05, 'epoch': 0.46} {'loss': 0.4667, 'learning_rate': 1.7991544082011992e-05, 'epoch': 0.46} {'loss': 0.4297, 'learning_rate': 1.799134211266415e-05, 'epoch': 0.46} {'loss': 0.6451, 'learning_rate': 1.79911401342956e-05, 'epoch': 0.46} {'loss': 0.5303, 'learning_rate': 1.7990938146906574e-05, 'epoch': 0.46} {'loss': 0.5841, 'learning_rate': 1.79907361504973e-05, 'epoch': 0.46} {'loss': 0.5751, 'learning_rate': 1.7990534145068e-05, 'epoch': 0.46} {'loss': 0.6322, 'learning_rate': 1.7990332130618908e-05, 'epoch': 0.46} {'loss': 0.5598, 'learning_rate': 1.799013010715025e-05, 'epoch': 0.46} {'loss': 0.6266, 'learning_rate': 1.7989928074662256e-05, 'epoch': 0.46} {'loss': 0.5453, 'learning_rate': 1.798972603315515e-05, 'epoch': 0.46} {'loss': 0.6645, 'learning_rate': 1.7989523982629167e-05, 'epoch': 0.46} {'loss': 0.5976, 'learning_rate': 1.7989321923084527e-05, 'epoch': 0.46} {'loss': 0.5871, 'learning_rate': 1.7989119854521463e-05, 'epoch': 0.46} {'loss': 0.4065, 'learning_rate': 1.79889177769402e-05, 'epoch': 0.46} {'loss': 0.6473, 'learning_rate': 1.7988715690340973e-05, 'epoch': 0.46} {'loss': 0.6827, 'learning_rate': 1.7988513594724e-05, 'epoch': 0.46} {'loss': 0.4836, 'learning_rate': 1.7988311490089518e-05, 'epoch': 0.46} {'loss': 0.4381, 'learning_rate': 1.7988109376437748e-05, 'epoch': 0.46} {'loss': 0.5875, 'learning_rate': 1.7987907253768923e-05, 'epoch': 0.46} {'loss': 0.6044, 'learning_rate': 1.7987705122083273e-05, 'epoch': 0.46} {'loss': 0.5121, 'learning_rate': 1.7987502981381018e-05, 'epoch': 0.46} {'loss': 0.6051, 'learning_rate': 1.7987300831662392e-05, 'epoch': 0.46} {'loss': 0.6229, 'learning_rate': 1.7987098672927623e-05, 'epoch': 0.46} {'loss': 0.6566, 'learning_rate': 1.7986896505176936e-05, 'epoch': 0.46} {'loss': 0.6657, 'learning_rate': 1.7986694328410566e-05, 'epoch': 0.46} {'loss': 0.4334, 'learning_rate': 1.7986492142628737e-05, 'epoch': 0.46} {'loss': 0.5971, 'learning_rate': 1.798628994783167e-05, 'epoch': 0.46} {'loss': 0.6906, 'learning_rate': 1.7986087744019607e-05, 'epoch': 0.46} {'loss': 0.5192, 'learning_rate': 1.7985885531192768e-05, 'epoch': 0.46} {'loss': 0.566, 'learning_rate': 1.798568330935138e-05, 'epoch': 0.46} {'loss': 0.6073, 'learning_rate': 1.798548107849568e-05, 'epoch': 0.46} {'loss': 0.7485, 'learning_rate': 1.7985278838625886e-05, 'epoch': 0.46} {'loss': 0.5727, 'learning_rate': 1.7985076589742233e-05, 'epoch': 0.46} {'loss': 0.4904, 'learning_rate': 1.7984874331844944e-05, 'epoch': 0.46} {'loss': 0.5725, 'learning_rate': 1.798467206493425e-05, 'epoch': 0.46} {'loss': 0.5308, 'learning_rate': 1.7984469789010383e-05, 'epoch': 0.46} {'loss': 0.5644, 'learning_rate': 1.7984267504073565e-05, 'epoch': 0.46} {'loss': 0.4253, 'learning_rate': 1.798406521012403e-05, 'epoch': 0.46} {'loss': 0.523, 'learning_rate': 1.7983862907162002e-05, 'epoch': 0.46} {'loss': 0.6934, 'learning_rate': 1.798366059518771e-05, 'epoch': 0.46} {'loss': 0.7374, 'learning_rate': 1.7983458274201387e-05, 'epoch': 0.46} {'loss': 0.5506, 'learning_rate': 1.7983255944203254e-05, 'epoch': 0.46} {'loss': 0.7251, 'learning_rate': 1.7983053605193547e-05, 'epoch': 0.46} {'loss': 0.626, 'learning_rate': 1.7982851257172487e-05, 'epoch': 0.46} {'loss': 0.5607, 'learning_rate': 1.7982648900140308e-05, 'epoch': 0.46} {'loss': 0.5499, 'learning_rate': 1.7982446534097233e-05, 'epoch': 0.46} {'loss': 0.6281, 'learning_rate': 1.7982244159043496e-05, 'epoch': 0.46} {'loss': 0.5062, 'learning_rate': 1.798204177497932e-05, 'epoch': 0.46} {'loss': 0.4836, 'learning_rate': 1.798183938190494e-05, 'epoch': 0.46} {'loss': 0.6625, 'learning_rate': 1.7981636979820584e-05, 'epoch': 0.46} {'loss': 0.6607, 'learning_rate': 1.7981434568726476e-05, 'epoch': 0.46} {'loss': 0.591, 'learning_rate': 1.7981232148622845e-05, 'epoch': 0.46} {'loss': 0.5501, 'learning_rate': 1.798102971950992e-05, 'epoch': 0.46} {'loss': 0.5562, 'learning_rate': 1.798082728138793e-05, 'epoch': 0.46} {'loss': 0.5889, 'learning_rate': 1.7980624834257103e-05, 'epoch': 0.46} {'loss': 0.5699, 'learning_rate': 1.798042237811767e-05, 'epoch': 0.46} {'loss': 0.6001, 'learning_rate': 1.7980219912969857e-05, 'epoch': 0.46} {'loss': 0.6383, 'learning_rate': 1.7980017438813893e-05, 'epoch': 0.46} {'loss': 0.698, 'learning_rate': 1.7979814955650007e-05, 'epoch': 0.46} {'loss': 0.6092, 'learning_rate': 1.7979612463478427e-05, 'epoch': 0.46} {'loss': 0.3889, 'learning_rate': 1.7979409962299383e-05, 'epoch': 0.46} {'loss': 0.5349, 'learning_rate': 1.79792074521131e-05, 'epoch': 0.46} {'loss': 0.5536, 'learning_rate': 1.7979004932919814e-05, 'epoch': 0.46} {'loss': 0.7078, 'learning_rate': 1.7978802404719745e-05, 'epoch': 0.46} {'loss': 0.7017, 'learning_rate': 1.7978599867513128e-05, 'epoch': 0.46} {'loss': 0.6026, 'learning_rate': 1.7978397321300182e-05, 'epoch': 0.46} {'loss': 0.6318, 'learning_rate': 1.7978194766081148e-05, 'epoch': 0.46} {'loss': 0.5473, 'learning_rate': 1.797799220185625e-05, 'epoch': 0.46} {'loss': 0.4713, 'learning_rate': 1.7977789628625714e-05, 'epoch': 0.46} {'loss': 0.6361, 'learning_rate': 1.7977587046389772e-05, 'epoch': 0.46} {'loss': 0.5334, 'learning_rate': 1.797738445514865e-05, 'epoch': 0.46} {'loss': 0.6904, 'learning_rate': 1.797718185490258e-05, 'epoch': 0.46} {'loss': 0.5771, 'learning_rate': 1.7976979245651786e-05, 'epoch': 0.46} {'loss': 0.5413, 'learning_rate': 1.7976776627396502e-05, 'epoch': 0.46} {'loss': 0.5704, 'learning_rate': 1.797657400013695e-05, 'epoch': 0.46} {'loss': 0.5641, 'learning_rate': 1.7976371363873367e-05, 'epoch': 0.46} {'loss': 0.5489, 'learning_rate': 1.7976168718605973e-05, 'epoch': 0.46} {'loss': 0.6374, 'learning_rate': 1.7975966064335004e-05, 'epoch': 0.46} {'loss': 0.6576, 'learning_rate': 1.7975763401060685e-05, 'epoch': 0.46} {'loss': 0.5822, 'learning_rate': 1.7975560728783246e-05, 'epoch': 0.46} {'loss': 0.4911, 'learning_rate': 1.7975358047502918e-05, 'epoch': 0.46} {'loss': 0.5304, 'learning_rate': 1.7975155357219924e-05, 'epoch': 0.46} {'loss': 0.7475, 'learning_rate': 1.79749526579345e-05, 'epoch': 0.46} {'loss': 0.6227, 'learning_rate': 1.797474994964687e-05, 'epoch': 0.46} {'loss': 0.5489, 'learning_rate': 1.797454723235726e-05, 'epoch': 0.46} {'loss': 0.4892, 'learning_rate': 1.7974344506065905e-05, 'epoch': 0.46} {'loss': 0.5142, 'learning_rate': 1.7974141770773033e-05, 'epoch': 0.46} {'loss': 0.6537, 'learning_rate': 1.7973939026478867e-05, 'epoch': 0.46} {'loss': 0.4647, 'learning_rate': 1.7973736273183645e-05, 'epoch': 0.46} {'loss': 0.6398, 'learning_rate': 1.7973533510887587e-05, 'epoch': 0.46} {'loss': 0.6096, 'learning_rate': 1.797333073959093e-05, 'epoch': 0.46} {'loss': 0.5866, 'learning_rate': 1.7973127959293896e-05, 'epoch': 0.46} {'loss': 0.5277, 'learning_rate': 1.7972925169996718e-05, 'epoch': 0.46} {'loss': 0.5136, 'learning_rate': 1.797272237169962e-05, 'epoch': 0.46} {'loss': 0.5011, 'learning_rate': 1.797251956440284e-05, 'epoch': 0.46} {'loss': 0.5166, 'learning_rate': 1.7972316748106598e-05, 'epoch': 0.46} {'loss': 0.5382, 'learning_rate': 1.7972113922811126e-05, 'epoch': 0.46} {'loss': 0.6238, 'learning_rate': 1.7971911088516657e-05, 'epoch': 0.46} {'loss': 0.5667, 'learning_rate': 1.7971708245223412e-05, 'epoch': 0.46} {'loss': 0.5799, 'learning_rate': 1.7971505392931628e-05, 'epoch': 0.46} {'loss': 0.5361, 'learning_rate': 1.7971302531641528e-05, 'epoch': 0.46} {'loss': 0.6798, 'learning_rate': 1.7971099661353342e-05, 'epoch': 0.46} {'loss': 0.5679, 'learning_rate': 1.7970896782067302e-05, 'epoch': 0.46} {'loss': 0.5503, 'learning_rate': 1.7970693893783638e-05, 'epoch': 0.46} {'loss': 0.5523, 'learning_rate': 1.7970490996502573e-05, 'epoch': 0.46} {'loss': 0.6764, 'learning_rate': 1.797028809022434e-05, 'epoch': 0.46} {'loss': 0.6197, 'learning_rate': 1.7970085174949168e-05, 'epoch': 0.46} {'loss': 0.498, 'learning_rate': 1.7969882250677283e-05, 'epoch': 0.46} {'loss': 0.6243, 'learning_rate': 1.7969679317408918e-05, 'epoch': 0.46} {'loss': 0.6033, 'learning_rate': 1.79694763751443e-05, 'epoch': 0.46} {'loss': 0.5308, 'learning_rate': 1.796927342388366e-05, 'epoch': 0.46} {'loss': 0.4838, 'learning_rate': 1.7969070463627226e-05, 'epoch': 0.46} {'loss': 0.6656, 'learning_rate': 1.7968867494375225e-05, 'epoch': 0.46} {'loss': 0.6235, 'learning_rate': 1.796866451612789e-05, 'epoch': 0.46} {'loss': 0.6538, 'learning_rate': 1.7968461528885447e-05, 'epoch': 0.46} {'loss': 0.5531, 'learning_rate': 1.7968258532648125e-05, 'epoch': 0.46} {'loss': 0.6398, 'learning_rate': 1.7968055527416156e-05, 'epoch': 0.46} {'loss': 0.4793, 'learning_rate': 1.7967852513189768e-05, 'epoch': 0.46} {'loss': 0.5353, 'learning_rate': 1.7967649489969188e-05, 'epoch': 0.46} {'loss': 0.4571, 'learning_rate': 1.7967446457754646e-05, 'epoch': 0.46} {'loss': 0.522, 'learning_rate': 1.7967243416546372e-05, 'epoch': 0.46} {'loss': 0.6023, 'learning_rate': 1.7967040366344598e-05, 'epoch': 0.46} {'loss': 0.699, 'learning_rate': 1.7966837307149553e-05, 'epoch': 0.46} {'loss': 0.6302, 'learning_rate': 1.7966634238961457e-05, 'epoch': 0.46} {'loss': 0.6157, 'learning_rate': 1.7966431161780548e-05, 'epoch': 0.46} {'loss': 0.6774, 'learning_rate': 1.7966228075607056e-05, 'epoch': 0.46} {'loss': 0.432, 'learning_rate': 1.7966024980441205e-05, 'epoch': 0.46} {'loss': 0.6288, 'learning_rate': 1.7965821876283225e-05, 'epoch': 0.46} {'loss': 0.438, 'learning_rate': 1.796561876313335e-05, 'epoch': 0.46} {'loss': 0.5817, 'learning_rate': 1.7965415640991804e-05, 'epoch': 0.46} {'loss': 0.5376, 'learning_rate': 1.796521250985882e-05, 'epoch': 0.46} {'loss': 0.5901, 'learning_rate': 1.7965009369734624e-05, 'epoch': 0.46} {'loss': 0.5976, 'learning_rate': 1.796480622061945e-05, 'epoch': 0.46} {'loss': 0.5668, 'learning_rate': 1.796460306251352e-05, 'epoch': 0.46} {'loss': 0.5575, 'learning_rate': 1.796439989541707e-05, 'epoch': 0.46} {'loss': 0.517, 'learning_rate': 1.7964196719330325e-05, 'epoch': 0.46} {'loss': 0.4381, 'learning_rate': 1.796399353425352e-05, 'epoch': 0.46} {'loss': 0.6501, 'learning_rate': 1.7963790340186878e-05, 'epoch': 0.46} {'loss': 0.5622, 'learning_rate': 1.7963587137130636e-05, 'epoch': 0.46} {'loss': 0.5701, 'learning_rate': 1.7963383925085012e-05, 'epoch': 0.46} {'loss': 0.7042, 'learning_rate': 1.7963180704050245e-05, 'epoch': 0.46} {'loss': 0.4878, 'learning_rate': 1.796297747402656e-05, 'epoch': 0.46} {'loss': 0.5376, 'learning_rate': 1.796277423501419e-05, 'epoch': 0.46} {'loss': 0.685, 'learning_rate': 1.796257098701336e-05, 'epoch': 0.46} {'loss': 0.6713, 'learning_rate': 1.7962367730024303e-05, 'epoch': 0.46} {'loss': 0.5754, 'learning_rate': 1.7962164464047248e-05, 'epoch': 0.46} {'loss': 0.6183, 'learning_rate': 1.7961961189082418e-05, 'epoch': 0.46} {'loss': 0.6582, 'learning_rate': 1.7961757905130053e-05, 'epoch': 0.46} {'loss': 0.581, 'learning_rate': 1.7961554612190374e-05, 'epoch': 0.46} {'loss': 0.6993, 'learning_rate': 1.7961351310263615e-05, 'epoch': 0.46} {'loss': 0.5815, 'learning_rate': 1.7961147999350005e-05, 'epoch': 0.46} {'loss': 0.5474, 'learning_rate': 1.7960944679449772e-05, 'epoch': 0.46} {'loss': 0.5598, 'learning_rate': 1.7960741350563147e-05, 'epoch': 0.46} {'loss': 0.723, 'learning_rate': 1.796053801269036e-05, 'epoch': 0.46} {'loss': 0.4979, 'learning_rate': 1.796033466583164e-05, 'epoch': 0.46} {'loss': 0.575, 'learning_rate': 1.7960131309987214e-05, 'epoch': 0.46} {'loss': 0.6161, 'learning_rate': 1.795992794515731e-05, 'epoch': 0.46} {'loss': 0.4776, 'learning_rate': 1.7959724571342164e-05, 'epoch': 0.46} {'loss': 0.5137, 'learning_rate': 1.7959521188542003e-05, 'epoch': 0.46} {'loss': 0.6735, 'learning_rate': 1.7959317796757055e-05, 'epoch': 0.46} {'loss': 0.5966, 'learning_rate': 1.7959114395987554e-05, 'epoch': 0.46} {'loss': 0.5197, 'learning_rate': 1.7958910986233724e-05, 'epoch': 0.46} {'loss': 0.543, 'learning_rate': 1.7958707567495795e-05, 'epoch': 0.46} {'loss': 0.5129, 'learning_rate': 1.7958504139774e-05, 'epoch': 0.46} {'loss': 0.5834, 'learning_rate': 1.795830070306857e-05, 'epoch': 0.46} {'loss': 0.5759, 'learning_rate': 1.7958097257379728e-05, 'epoch': 0.46} {'loss': 0.5699, 'learning_rate': 1.795789380270771e-05, 'epoch': 0.46} {'loss': 0.5964, 'learning_rate': 1.7957690339052742e-05, 'epoch': 0.46} {'loss': 0.5125, 'learning_rate': 1.7957486866415057e-05, 'epoch': 0.46} {'loss': 0.6569, 'learning_rate': 1.795728338479488e-05, 'epoch': 0.46} {'loss': 0.4458, 'learning_rate': 1.7957079894192442e-05, 'epoch': 0.46} {'loss': 0.6565, 'learning_rate': 1.795687639460798e-05, 'epoch': 0.46} {'loss': 0.5478, 'learning_rate': 1.795667288604171e-05, 'epoch': 0.46} {'loss': 0.7438, 'learning_rate': 1.7956469368493873e-05, 'epoch': 0.46} {'loss': 0.595, 'learning_rate': 1.7956265841964696e-05, 'epoch': 0.46} {'loss': 0.6821, 'learning_rate': 1.7956062306454405e-05, 'epoch': 0.46} {'loss': 0.5639, 'learning_rate': 1.7955858761963233e-05, 'epoch': 0.46} {'loss': 0.6344, 'learning_rate': 1.7955655208491412e-05, 'epoch': 0.46} {'loss': 0.4761, 'learning_rate': 1.7955451646039165e-05, 'epoch': 0.46} {'loss': 0.7639, 'learning_rate': 1.795524807460673e-05, 'epoch': 0.46} {'loss': 0.5839, 'learning_rate': 1.7955044494194333e-05, 'epoch': 0.46} {'loss': 0.4205, 'learning_rate': 1.79548409048022e-05, 'epoch': 0.46} {'loss': 0.6465, 'learning_rate': 1.7954637306430568e-05, 'epoch': 0.46} {'loss': 0.5427, 'learning_rate': 1.795443369907966e-05, 'epoch': 0.46} {'loss': 0.4876, 'learning_rate': 1.7954230082749712e-05, 'epoch': 0.46} {'loss': 0.6537, 'learning_rate': 1.795402645744095e-05, 'epoch': 0.46} {'loss': 0.6541, 'learning_rate': 1.7953822823153602e-05, 'epoch': 0.46} {'loss': 0.5895, 'learning_rate': 1.79536191798879e-05, 'epoch': 0.46} {'loss': 0.4365, 'learning_rate': 1.7953415527644078e-05, 'epoch': 0.46} {'loss': 0.4372, 'learning_rate': 1.795321186642236e-05, 'epoch': 0.46} {'loss': 0.656, 'learning_rate': 1.795300819622298e-05, 'epoch': 0.46} {'loss': 0.4549, 'learning_rate': 1.7952804517046166e-05, 'epoch': 0.46} {'loss': 0.7024, 'learning_rate': 1.7952600828892146e-05, 'epoch': 0.46} {'loss': 0.6194, 'learning_rate': 1.795239713176115e-05, 'epoch': 0.46} {'loss': 0.5259, 'learning_rate': 1.7952193425653414e-05, 'epoch': 0.46} {'loss': 0.5658, 'learning_rate': 1.7951989710569163e-05, 'epoch': 0.46} {'loss': 0.3873, 'learning_rate': 1.7951785986508627e-05, 'epoch': 0.46} {'loss': 0.6027, 'learning_rate': 1.7951582253472038e-05, 'epoch': 0.46} {'loss': 0.6345, 'learning_rate': 1.7951378511459624e-05, 'epoch': 0.46} {'loss': 0.4517, 'learning_rate': 1.7951174760471612e-05, 'epoch': 0.46} {'loss': 0.5019, 'learning_rate': 1.795097100050824e-05, 'epoch': 0.46} {'loss': 0.6377, 'learning_rate': 1.7950767231569735e-05, 'epoch': 0.46} {'loss': 0.6668, 'learning_rate': 1.795056345365632e-05, 'epoch': 0.46} {'loss': 0.5415, 'learning_rate': 1.7950359666768237e-05, 'epoch': 0.46} {'loss': 0.5077, 'learning_rate': 1.7950155870905707e-05, 'epoch': 0.46} {'loss': 0.6682, 'learning_rate': 1.7949952066068964e-05, 'epoch': 0.46} {'loss': 0.6225, 'learning_rate': 1.7949748252258233e-05, 'epoch': 0.46} {'loss': 0.4942, 'learning_rate': 1.794954442947375e-05, 'epoch': 0.46} {'loss': 0.4655, 'learning_rate': 1.7949340597715745e-05, 'epoch': 0.46} {'loss': 0.6434, 'learning_rate': 1.7949136756984443e-05, 'epoch': 0.46} {'loss': 0.6071, 'learning_rate': 1.794893290728008e-05, 'epoch': 0.46} {'loss': 0.624, 'learning_rate': 1.7948729048602885e-05, 'epoch': 0.46} {'loss': 0.6071, 'learning_rate': 1.7948525180953083e-05, 'epoch': 0.46} {'loss': 0.632, 'learning_rate': 1.7948321304330908e-05, 'epoch': 0.46} {'loss': 0.5984, 'learning_rate': 1.7948117418736587e-05, 'epoch': 0.46} {'loss': 0.5462, 'learning_rate': 1.7947913524170358e-05, 'epoch': 0.46} {'loss': 0.5037, 'learning_rate': 1.7947709620632444e-05, 'epoch': 0.46} {'loss': 0.6658, 'learning_rate': 1.7947505708123075e-05, 'epoch': 0.46} {'loss': 0.5435, 'learning_rate': 1.7947301786642486e-05, 'epoch': 0.46} {'loss': 0.4742, 'learning_rate': 1.7947097856190906e-05, 'epoch': 0.46} {'loss': 0.5804, 'learning_rate': 1.794689391676856e-05, 'epoch': 0.46} {'loss': 0.5965, 'learning_rate': 1.7946689968375684e-05, 'epoch': 0.46} {'loss': 0.6261, 'learning_rate': 1.7946486011012506e-05, 'epoch': 0.46} {'loss': 0.3878, 'learning_rate': 1.7946282044679252e-05, 'epoch': 0.46} {'loss': 0.5876, 'learning_rate': 1.7946078069376163e-05, 'epoch': 0.46} {'loss': 0.6484, 'learning_rate': 1.794587408510346e-05, 'epoch': 0.46} {'loss': 0.7292, 'learning_rate': 1.7945670091861375e-05, 'epoch': 0.46} {'loss': 0.6297, 'learning_rate': 1.7945466089650143e-05, 'epoch': 0.46} {'loss': 0.693, 'learning_rate': 1.7945262078469988e-05, 'epoch': 0.46} {'loss': 0.6487, 'learning_rate': 1.7945058058321146e-05, 'epoch': 0.46} {'loss': 0.5553, 'learning_rate': 1.794485402920384e-05, 'epoch': 0.46} {'loss': 0.6832, 'learning_rate': 1.7944649991118305e-05, 'epoch': 0.46} {'loss': 0.7271, 'learning_rate': 1.7944445944064773e-05, 'epoch': 0.46} {'loss': 0.5842, 'learning_rate': 1.7944241888043473e-05, 'epoch': 0.46} {'loss': 0.4992, 'learning_rate': 1.794403782305463e-05, 'epoch': 0.46} {'loss': 0.525, 'learning_rate': 1.7943833749098486e-05, 'epoch': 0.46} {'loss': 0.6438, 'learning_rate': 1.794362966617526e-05, 'epoch': 0.46} {'loss': 0.555, 'learning_rate': 1.7943425574285187e-05, 'epoch': 0.46} {'loss': 0.6079, 'learning_rate': 1.79432214734285e-05, 'epoch': 0.46} {'loss': 0.6784, 'learning_rate': 1.794301736360542e-05, 'epoch': 0.46} {'loss': 0.4929, 'learning_rate': 1.7942813244816187e-05, 'epoch': 0.46} {'loss': 0.5411, 'learning_rate': 1.794260911706103e-05, 'epoch': 0.46} {'loss': 0.498, 'learning_rate': 1.7942404980340175e-05, 'epoch': 0.46} {'loss': 0.6446, 'learning_rate': 1.7942200834653855e-05, 'epoch': 0.47} {'loss': 0.5408, 'learning_rate': 1.7941996680002303e-05, 'epoch': 0.47} {'loss': 0.5962, 'learning_rate': 1.794179251638575e-05, 'epoch': 0.47} {'loss': 0.7279, 'learning_rate': 1.7941588343804417e-05, 'epoch': 0.47} {'loss': 0.564, 'learning_rate': 1.7941384162258543e-05, 'epoch': 0.47} {'loss': 0.4444, 'learning_rate': 1.7941179971748357e-05, 'epoch': 0.47} {'loss': 0.5255, 'learning_rate': 1.794097577227409e-05, 'epoch': 0.47} {'loss': 0.6102, 'learning_rate': 1.7940771563835965e-05, 'epoch': 0.47} {'loss': 0.5625, 'learning_rate': 1.7940567346434224e-05, 'epoch': 0.47} {'loss': 0.6403, 'learning_rate': 1.7940363120069096e-05, 'epoch': 0.47} {'loss': 0.6307, 'learning_rate': 1.7940158884740804e-05, 'epoch': 0.47} {'loss': 0.5782, 'learning_rate': 1.7939954640449586e-05, 'epoch': 0.47} {'loss': 0.5998, 'learning_rate': 1.7939750387195664e-05, 'epoch': 0.47} {'loss': 0.5162, 'learning_rate': 1.7939546124979273e-05, 'epoch': 0.47} {'loss': 0.6227, 'learning_rate': 1.7939341853800647e-05, 'epoch': 0.47} {'loss': 0.5097, 'learning_rate': 1.7939137573660016e-05, 'epoch': 0.47} {'loss': 0.5182, 'learning_rate': 1.7938933284557604e-05, 'epoch': 0.47} {'loss': 0.6318, 'learning_rate': 1.7938728986493647e-05, 'epoch': 0.47} {'loss': 0.6489, 'learning_rate': 1.7938524679468377e-05, 'epoch': 0.47} {'loss': 0.6382, 'learning_rate': 1.793832036348202e-05, 'epoch': 0.47} {'loss': 0.6866, 'learning_rate': 1.793811603853481e-05, 'epoch': 0.47} {'loss': 0.5039, 'learning_rate': 1.7937911704626976e-05, 'epoch': 0.47} {'loss': 0.3546, 'learning_rate': 1.793770736175875e-05, 'epoch': 0.47} {'loss': 0.5146, 'learning_rate': 1.793750300993036e-05, 'epoch': 0.47} {'loss': 0.564, 'learning_rate': 1.793729864914204e-05, 'epoch': 0.47} {'loss': 0.5995, 'learning_rate': 1.7937094279394016e-05, 'epoch': 0.47} {'loss': 0.7676, 'learning_rate': 1.7936889900686526e-05, 'epoch': 0.47} {'loss': 0.575, 'learning_rate': 1.7936685513019795e-05, 'epoch': 0.47} {'loss': 0.5448, 'learning_rate': 1.7936481116394055e-05, 'epoch': 0.47} {'loss': 0.8781, 'learning_rate': 1.793627671080954e-05, 'epoch': 0.47} {'loss': 0.6076, 'learning_rate': 1.7936072296266473e-05, 'epoch': 0.47} {'loss': 0.6496, 'learning_rate': 1.7935867872765092e-05, 'epoch': 0.47} {'loss': 0.6113, 'learning_rate': 1.7935663440305623e-05, 'epoch': 0.47} {'loss': 0.5259, 'learning_rate': 1.7935458998888302e-05, 'epoch': 0.47} {'loss': 0.511, 'learning_rate': 1.7935254548513358e-05, 'epoch': 0.47} {'loss': 0.538, 'learning_rate': 1.7935050089181016e-05, 'epoch': 0.47} {'loss': 0.6231, 'learning_rate': 1.793484562089151e-05, 'epoch': 0.47} {'loss': 0.6013, 'learning_rate': 1.793464114364508e-05, 'epoch': 0.47} {'loss': 0.4506, 'learning_rate': 1.7934436657441946e-05, 'epoch': 0.47} {'loss': 0.7359, 'learning_rate': 1.793423216228234e-05, 'epoch': 0.47} {'loss': 0.6989, 'learning_rate': 1.7934027658166493e-05, 'epoch': 0.47} {'loss': 0.5769, 'learning_rate': 1.793382314509464e-05, 'epoch': 0.47} {'loss': 0.6167, 'learning_rate': 1.7933618623067007e-05, 'epoch': 0.47} {'loss': 0.5182, 'learning_rate': 1.7933414092083833e-05, 'epoch': 0.47} {'loss': 0.5158, 'learning_rate': 1.793320955214534e-05, 'epoch': 0.47} {'loss': 0.5688, 'learning_rate': 1.793300500325176e-05, 'epoch': 0.47} {'loss': 0.4993, 'learning_rate': 1.7932800445403326e-05, 'epoch': 0.47} {'loss': 0.5317, 'learning_rate': 1.793259587860027e-05, 'epoch': 0.47} {'loss': 0.5986, 'learning_rate': 1.7932391302842824e-05, 'epoch': 0.47} {'loss': 0.6901, 'learning_rate': 1.793218671813121e-05, 'epoch': 0.47} {'loss': 0.7296, 'learning_rate': 1.7931982124465675e-05, 'epoch': 0.47} {'loss': 0.5741, 'learning_rate': 1.793177752184643e-05, 'epoch': 0.47} {'loss': 0.5258, 'learning_rate': 1.7931572910273724e-05, 'epoch': 0.47} {'loss': 0.627, 'learning_rate': 1.793136828974778e-05, 'epoch': 0.47} {'loss': 0.3446, 'learning_rate': 1.7931163660268827e-05, 'epoch': 0.47} {'loss': 0.6141, 'learning_rate': 1.79309590218371e-05, 'epoch': 0.47} {'loss': 0.4529, 'learning_rate': 1.7930754374452827e-05, 'epoch': 0.47} {'loss': 0.5937, 'learning_rate': 1.793054971811624e-05, 'epoch': 0.47} {'loss': 0.6405, 'learning_rate': 1.793034505282757e-05, 'epoch': 0.47} {'loss': 0.7257, 'learning_rate': 1.7930140378587053e-05, 'epoch': 0.47} {'loss': 0.6362, 'learning_rate': 1.7929935695394912e-05, 'epoch': 0.47} {'loss': 0.5717, 'learning_rate': 1.792973100325138e-05, 'epoch': 0.47} {'loss': 0.581, 'learning_rate': 1.7929526302156693e-05, 'epoch': 0.47} {'loss': 0.4896, 'learning_rate': 1.792932159211108e-05, 'epoch': 0.47} {'loss': 0.5973, 'learning_rate': 1.7929116873114763e-05, 'epoch': 0.47} {'loss': 0.5772, 'learning_rate': 1.7928912145167986e-05, 'epoch': 0.47} {'loss': 0.5481, 'learning_rate': 1.7928707408270977e-05, 'epoch': 0.47} {'loss': 0.5102, 'learning_rate': 1.7928502662423965e-05, 'epoch': 0.47} {'loss': 0.7328, 'learning_rate': 1.7928297907627178e-05, 'epoch': 0.47} {'loss': 0.5838, 'learning_rate': 1.792809314388085e-05, 'epoch': 0.47} {'loss': 0.5483, 'learning_rate': 1.7927888371185215e-05, 'epoch': 0.47} {'loss': 0.5429, 'learning_rate': 1.79276835895405e-05, 'epoch': 0.47} {'loss': 0.6583, 'learning_rate': 1.7927478798946938e-05, 'epoch': 0.47} {'loss': 0.696, 'learning_rate': 1.792727399940476e-05, 'epoch': 0.47} {'loss': 0.7156, 'learning_rate': 1.7927069190914198e-05, 'epoch': 0.47} {'loss': 0.5669, 'learning_rate': 1.792686437347548e-05, 'epoch': 0.47} {'loss': 0.6441, 'learning_rate': 1.792665954708884e-05, 'epoch': 0.47} {'loss': 0.5792, 'learning_rate': 1.792645471175451e-05, 'epoch': 0.47} {'loss': 0.6497, 'learning_rate': 1.792624986747272e-05, 'epoch': 0.47} {'loss': 0.5435, 'learning_rate': 1.79260450142437e-05, 'epoch': 0.47} {'loss': 0.5057, 'learning_rate': 1.7925840152067683e-05, 'epoch': 0.47} {'loss': 0.551, 'learning_rate': 1.79256352809449e-05, 'epoch': 0.47} {'loss': 0.5022, 'learning_rate': 1.792543040087558e-05, 'epoch': 0.47} {'loss': 0.531, 'learning_rate': 1.7925225511859958e-05, 'epoch': 0.47} {'loss': 0.4308, 'learning_rate': 1.7925020613898265e-05, 'epoch': 0.47} {'loss': 0.6152, 'learning_rate': 1.792481570699073e-05, 'epoch': 0.47} {'loss': 0.6199, 'learning_rate': 1.7924610791137584e-05, 'epoch': 0.47} {'loss': 0.5908, 'learning_rate': 1.7924405866339055e-05, 'epoch': 0.47} {'loss': 0.487, 'learning_rate': 1.7924200932595384e-05, 'epoch': 0.47} {'loss': 0.4734, 'learning_rate': 1.79239959899068e-05, 'epoch': 0.47} {'loss': 0.6012, 'learning_rate': 1.7923791038273527e-05, 'epoch': 0.47} {'loss': 0.5354, 'learning_rate': 1.79235860776958e-05, 'epoch': 0.47} {'loss': 0.5423, 'learning_rate': 1.7923381108173853e-05, 'epoch': 0.47} {'loss': 0.6516, 'learning_rate': 1.7923176129707913e-05, 'epoch': 0.47} {'loss': 0.7051, 'learning_rate': 1.7922971142298213e-05, 'epoch': 0.47} {'loss': 0.5692, 'learning_rate': 1.7922766145944987e-05, 'epoch': 0.47} {'loss': 0.7283, 'learning_rate': 1.7922561140648466e-05, 'epoch': 0.47} {'loss': 0.6552, 'learning_rate': 1.7922356126408882e-05, 'epoch': 0.47} {'loss': 0.6087, 'learning_rate': 1.792215110322646e-05, 'epoch': 0.47} {'loss': 0.508, 'learning_rate': 1.7921946071101438e-05, 'epoch': 0.47} {'loss': 0.5349, 'learning_rate': 1.7921741030034044e-05, 'epoch': 0.47} {'loss': 0.5822, 'learning_rate': 1.7921535980024513e-05, 'epoch': 0.47} {'loss': 0.5965, 'learning_rate': 1.792133092107307e-05, 'epoch': 0.47} {'loss': 0.5218, 'learning_rate': 1.7921125853179955e-05, 'epoch': 0.47} {'loss': 0.4148, 'learning_rate': 1.7920920776345393e-05, 'epoch': 0.47} {'loss': 0.625, 'learning_rate': 1.7920715690569618e-05, 'epoch': 0.47} {'loss': 0.5779, 'learning_rate': 1.792051059585286e-05, 'epoch': 0.47} {'loss': 0.6232, 'learning_rate': 1.7920305492195354e-05, 'epoch': 0.47} {'loss': 0.5665, 'learning_rate': 1.792010037959733e-05, 'epoch': 0.47} {'loss': 0.629, 'learning_rate': 1.7919895258059017e-05, 'epoch': 0.47} {'loss': 0.6889, 'learning_rate': 1.7919690127580648e-05, 'epoch': 0.47} {'loss': 0.6173, 'learning_rate': 1.7919484988162453e-05, 'epoch': 0.47} {'loss': 0.6269, 'learning_rate': 1.791927983980467e-05, 'epoch': 0.47} {'loss': 0.6483, 'learning_rate': 1.7919074682507522e-05, 'epoch': 0.47} {'loss': 0.4527, 'learning_rate': 1.7918869516271248e-05, 'epoch': 0.47} {'loss': 0.5115, 'learning_rate': 1.791866434109607e-05, 'epoch': 0.47} {'loss': 0.5181, 'learning_rate': 1.7918459156982235e-05, 'epoch': 0.47} {'loss': 0.6666, 'learning_rate': 1.7918253963929957e-05, 'epoch': 0.47} {'loss': 0.4603, 'learning_rate': 1.791804876193948e-05, 'epoch': 0.47} {'loss': 0.5303, 'learning_rate': 1.791784355101103e-05, 'epoch': 0.47} {'loss': 0.6769, 'learning_rate': 1.7917638331144844e-05, 'epoch': 0.47} {'loss': 0.6048, 'learning_rate': 1.791743310234115e-05, 'epoch': 0.47} {'loss': 0.5718, 'learning_rate': 1.7917227864600172e-05, 'epoch': 0.47} {'loss': 0.6305, 'learning_rate': 1.7917022617922155e-05, 'epoch': 0.47} {'loss': 0.4791, 'learning_rate': 1.7916817362307326e-05, 'epoch': 0.47} {'loss': 0.5301, 'learning_rate': 1.7916612097755913e-05, 'epoch': 0.47} {'loss': 0.7438, 'learning_rate': 1.791640682426815e-05, 'epoch': 0.47} {'loss': 0.754, 'learning_rate': 1.791620154184427e-05, 'epoch': 0.47} {'loss': 0.5394, 'learning_rate': 1.7915996250484507e-05, 'epoch': 0.47} {'loss': 0.5454, 'learning_rate': 1.7915790950189083e-05, 'epoch': 0.47} {'loss': 0.5982, 'learning_rate': 1.791558564095824e-05, 'epoch': 0.47} {'loss': 0.704, 'learning_rate': 1.7915380322792208e-05, 'epoch': 0.47} {'loss': 0.6905, 'learning_rate': 1.7915174995691214e-05, 'epoch': 0.47} {'loss': 0.4233, 'learning_rate': 1.7914969659655496e-05, 'epoch': 0.47} {'loss': 0.5712, 'learning_rate': 1.7914764314685278e-05, 'epoch': 0.47} {'loss': 0.6663, 'learning_rate': 1.7914558960780796e-05, 'epoch': 0.47} {'loss': 0.3847, 'learning_rate': 1.7914353597942286e-05, 'epoch': 0.47} {'loss': 0.6509, 'learning_rate': 1.791414822616997e-05, 'epoch': 0.47} {'loss': 0.5268, 'learning_rate': 1.7913942845464093e-05, 'epoch': 0.47} {'loss': 0.6433, 'learning_rate': 1.7913737455824874e-05, 'epoch': 0.47} {'loss': 0.5596, 'learning_rate': 1.791353205725255e-05, 'epoch': 0.47} {'loss': 0.5264, 'learning_rate': 1.7913326649747357e-05, 'epoch': 0.47} {'loss': 0.538, 'learning_rate': 1.791312123330952e-05, 'epoch': 0.47} {'loss': 0.6481, 'learning_rate': 1.7912915807939273e-05, 'epoch': 0.47} {'loss': 0.5556, 'learning_rate': 1.791271037363685e-05, 'epoch': 0.47} {'loss': 0.7426, 'learning_rate': 1.7912504930402486e-05, 'epoch': 0.47} {'loss': 0.4455, 'learning_rate': 1.7912299478236403e-05, 'epoch': 0.47} {'loss': 0.6563, 'learning_rate': 1.7912094017138842e-05, 'epoch': 0.47} {'loss': 0.5812, 'learning_rate': 1.791188854711003e-05, 'epoch': 0.47} {'loss': 0.6211, 'learning_rate': 1.7911683068150198e-05, 'epoch': 0.47} {'loss': 0.6877, 'learning_rate': 1.791147758025958e-05, 'epoch': 0.47} {'loss': 0.5175, 'learning_rate': 1.7911272083438413e-05, 'epoch': 0.47} {'loss': 0.5981, 'learning_rate': 1.791106657768692e-05, 'epoch': 0.47} {'loss': 0.803, 'learning_rate': 1.791086106300534e-05, 'epoch': 0.47} {'loss': 0.7203, 'learning_rate': 1.7910655539393903e-05, 'epoch': 0.47} {'loss': 0.3983, 'learning_rate': 1.7910450006852836e-05, 'epoch': 0.47} {'loss': 0.5157, 'learning_rate': 1.791024446538238e-05, 'epoch': 0.47} {'loss': 0.6117, 'learning_rate': 1.7910038914982757e-05, 'epoch': 0.47} {'loss': 0.7754, 'learning_rate': 1.7909833355654206e-05, 'epoch': 0.47} {'loss': 0.6358, 'learning_rate': 1.7909627787396958e-05, 'epoch': 0.47} {'loss': 0.6203, 'learning_rate': 1.7909422210211248e-05, 'epoch': 0.47} {'loss': 0.5319, 'learning_rate': 1.79092166240973e-05, 'epoch': 0.47} {'loss': 0.7186, 'learning_rate': 1.7909011029055352e-05, 'epoch': 0.47} {'loss': 0.5669, 'learning_rate': 1.790880542508563e-05, 'epoch': 0.47} {'loss': 0.5162, 'learning_rate': 1.7908599812188377e-05, 'epoch': 0.47} {'loss': 0.4705, 'learning_rate': 1.7908394190363817e-05, 'epoch': 0.47} {'loss': 0.6854, 'learning_rate': 1.7908188559612184e-05, 'epoch': 0.47} {'loss': 0.6149, 'learning_rate': 1.7907982919933705e-05, 'epoch': 0.47} {'loss': 0.606, 'learning_rate': 1.7907777271328623e-05, 'epoch': 0.47} {'loss': 0.6202, 'learning_rate': 1.7907571613797162e-05, 'epoch': 0.47} {'loss': 0.4603, 'learning_rate': 1.7907365947339556e-05, 'epoch': 0.47} {'loss': 0.7609, 'learning_rate': 1.790716027195604e-05, 'epoch': 0.47} {'loss': 0.5707, 'learning_rate': 1.790695458764684e-05, 'epoch': 0.47} {'loss': 0.5969, 'learning_rate': 1.7906748894412193e-05, 'epoch': 0.47} {'loss': 0.5421, 'learning_rate': 1.790654319225233e-05, 'epoch': 0.47} {'loss': 0.5842, 'learning_rate': 1.7906337481167484e-05, 'epoch': 0.47} {'loss': 0.67, 'learning_rate': 1.7906131761157887e-05, 'epoch': 0.47} {'loss': 0.7144, 'learning_rate': 1.7905926032223768e-05, 'epoch': 0.47} {'loss': 0.4966, 'learning_rate': 1.7905720294365364e-05, 'epoch': 0.47} {'loss': 0.6996, 'learning_rate': 1.7905514547582905e-05, 'epoch': 0.47} {'loss': 0.5187, 'learning_rate': 1.7905308791876623e-05, 'epoch': 0.47} {'loss': 0.5184, 'learning_rate': 1.790510302724675e-05, 'epoch': 0.47} {'loss': 0.502, 'learning_rate': 1.7904897253693524e-05, 'epoch': 0.47} {'loss': 0.5003, 'learning_rate': 1.7904691471217165e-05, 'epoch': 0.47} {'loss': 0.5613, 'learning_rate': 1.7904485679817917e-05, 'epoch': 0.47} {'loss': 0.5467, 'learning_rate': 1.7904279879496007e-05, 'epoch': 0.47} {'loss': 0.6799, 'learning_rate': 1.7904074070251668e-05, 'epoch': 0.47} {'loss': 0.6689, 'learning_rate': 1.790386825208513e-05, 'epoch': 0.47} {'loss': 0.4547, 'learning_rate': 1.790366242499663e-05, 'epoch': 0.47} {'loss': 0.6063, 'learning_rate': 1.7903456588986398e-05, 'epoch': 0.47} {'loss': 0.6814, 'learning_rate': 1.7903250744054664e-05, 'epoch': 0.47} {'loss': 0.622, 'learning_rate': 1.7903044890201668e-05, 'epoch': 0.47} {'loss': 0.6134, 'learning_rate': 1.790283902742763e-05, 'epoch': 0.47} {'loss': 0.473, 'learning_rate': 1.7902633155732795e-05, 'epoch': 0.47} {'loss': 0.661, 'learning_rate': 1.7902427275117386e-05, 'epoch': 0.47} {'loss': 0.589, 'learning_rate': 1.7902221385581643e-05, 'epoch': 0.47} {'loss': 0.6571, 'learning_rate': 1.7902015487125792e-05, 'epoch': 0.47} {'loss': 0.5067, 'learning_rate': 1.790180957975007e-05, 'epoch': 0.47} {'loss': 0.5323, 'learning_rate': 1.7901603663454707e-05, 'epoch': 0.47} {'loss': 0.7095, 'learning_rate': 1.7901397738239937e-05, 'epoch': 0.47} {'loss': 0.7397, 'learning_rate': 1.790119180410599e-05, 'epoch': 0.47} {'loss': 0.6053, 'learning_rate': 1.79009858610531e-05, 'epoch': 0.47} {'loss': 0.5728, 'learning_rate': 1.79007799090815e-05, 'epoch': 0.47} {'loss': 0.6472, 'learning_rate': 1.7900573948191424e-05, 'epoch': 0.47} {'loss': 0.5858, 'learning_rate': 1.79003679783831e-05, 'epoch': 0.47} {'loss': 0.7005, 'learning_rate': 1.7900161999656763e-05, 'epoch': 0.47} {'loss': 0.6339, 'learning_rate': 1.7899956012012646e-05, 'epoch': 0.47} {'loss': 0.5355, 'learning_rate': 1.789975001545098e-05, 'epoch': 0.47} {'loss': 0.6434, 'learning_rate': 1.7899544009971998e-05, 'epoch': 0.47} {'loss': 0.6334, 'learning_rate': 1.7899337995575934e-05, 'epoch': 0.47} {'loss': 0.6292, 'learning_rate': 1.789913197226302e-05, 'epoch': 0.47} {'loss': 0.5372, 'learning_rate': 1.7898925940033486e-05, 'epoch': 0.47} {'loss': 0.5749, 'learning_rate': 1.7898719898887566e-05, 'epoch': 0.47} {'loss': 0.5922, 'learning_rate': 1.7898513848825496e-05, 'epoch': 0.47} {'loss': 0.5494, 'learning_rate': 1.7898307789847507e-05, 'epoch': 0.47} {'loss': 0.5731, 'learning_rate': 1.7898101721953828e-05, 'epoch': 0.47} {'loss': 0.6647, 'learning_rate': 1.7897895645144694e-05, 'epoch': 0.47} {'loss': 0.3901, 'learning_rate': 1.7897689559420338e-05, 'epoch': 0.47} {'loss': 0.5424, 'learning_rate': 1.7897483464780994e-05, 'epoch': 0.47} {'loss': 0.6211, 'learning_rate': 1.7897277361226893e-05, 'epoch': 0.47} {'loss': 0.4973, 'learning_rate': 1.7897071248758265e-05, 'epoch': 0.47} {'loss': 0.5093, 'learning_rate': 1.7896865127375346e-05, 'epoch': 0.47} {'loss': 0.5346, 'learning_rate': 1.789665899707837e-05, 'epoch': 0.47} {'loss': 0.598, 'learning_rate': 1.7896452857867562e-05, 'epoch': 0.47} {'loss': 0.5027, 'learning_rate': 1.7896246709743166e-05, 'epoch': 0.47} {'loss': 0.6565, 'learning_rate': 1.789604055270541e-05, 'epoch': 0.47} {'loss': 0.5708, 'learning_rate': 1.789583438675452e-05, 'epoch': 0.47} {'loss': 0.6079, 'learning_rate': 1.789562821189074e-05, 'epoch': 0.47} {'loss': 0.4473, 'learning_rate': 1.7895422028114292e-05, 'epoch': 0.47} {'loss': 0.7117, 'learning_rate': 1.7895215835425417e-05, 'epoch': 0.47} {'loss': 0.5645, 'learning_rate': 1.789500963382434e-05, 'epoch': 0.47} {'loss': 0.5318, 'learning_rate': 1.7894803423311307e-05, 'epoch': 0.47} {'loss': 0.5672, 'learning_rate': 1.7894597203886538e-05, 'epoch': 0.47} {'loss': 0.4968, 'learning_rate': 1.789439097555027e-05, 'epoch': 0.47} {'loss': 0.5708, 'learning_rate': 1.7894184738302735e-05, 'epoch': 0.47} {'loss': 0.6551, 'learning_rate': 1.789397849214417e-05, 'epoch': 0.47} {'loss': 0.6023, 'learning_rate': 1.78937722370748e-05, 'epoch': 0.47} {'loss': 0.6777, 'learning_rate': 1.789356597309486e-05, 'epoch': 0.47} {'loss': 0.54, 'learning_rate': 1.7893359700204592e-05, 'epoch': 0.47} {'loss': 0.6481, 'learning_rate': 1.7893153418404218e-05, 'epoch': 0.47} {'loss': 0.6125, 'learning_rate': 1.7892947127693976e-05, 'epoch': 0.47} {'loss': 0.6139, 'learning_rate': 1.78927408280741e-05, 'epoch': 0.47} {'loss': 0.672, 'learning_rate': 1.7892534519544814e-05, 'epoch': 0.47} {'loss': 0.6492, 'learning_rate': 1.7892328202106362e-05, 'epoch': 0.47} {'loss': 0.5964, 'learning_rate': 1.789212187575897e-05, 'epoch': 0.47} {'loss': 0.5442, 'learning_rate': 1.7891915540502872e-05, 'epoch': 0.47} {'loss': 0.553, 'learning_rate': 1.789170919633831e-05, 'epoch': 0.47} {'loss': 0.6894, 'learning_rate': 1.78915028432655e-05, 'epoch': 0.47} {'loss': 0.4815, 'learning_rate': 1.7891296481284688e-05, 'epoch': 0.47} {'loss': 0.5016, 'learning_rate': 1.78910901103961e-05, 'epoch': 0.47} {'loss': 0.5398, 'learning_rate': 1.7890883730599976e-05, 'epoch': 0.47} {'loss': 0.4476, 'learning_rate': 1.7890677341896543e-05, 'epoch': 0.47} {'loss': 0.6571, 'learning_rate': 1.7890470944286033e-05, 'epoch': 0.47} {'loss': 0.7216, 'learning_rate': 1.7890264537768684e-05, 'epoch': 0.47} {'loss': 0.6883, 'learning_rate': 1.7890058122344726e-05, 'epoch': 0.47} {'loss': 0.6304, 'learning_rate': 1.7889851698014396e-05, 'epoch': 0.47} {'loss': 0.5508, 'learning_rate': 1.788964526477792e-05, 'epoch': 0.47} {'loss': 0.6105, 'learning_rate': 1.7889438822635538e-05, 'epoch': 0.47} {'loss': 0.6113, 'learning_rate': 1.7889232371587478e-05, 'epoch': 0.47} {'loss': 0.508, 'learning_rate': 1.7889025911633974e-05, 'epoch': 0.47} {'loss': 0.4275, 'learning_rate': 1.788881944277526e-05, 'epoch': 0.47} {'loss': 0.4719, 'learning_rate': 1.7888612965011572e-05, 'epoch': 0.47} {'loss': 0.5639, 'learning_rate': 1.788840647834314e-05, 'epoch': 0.47} {'loss': 0.6705, 'learning_rate': 1.788819998277019e-05, 'epoch': 0.47} {'loss': 0.5585, 'learning_rate': 1.7887993478292973e-05, 'epoch': 0.47} {'loss': 0.4934, 'learning_rate': 1.78877869649117e-05, 'epoch': 0.47} {'loss': 0.5072, 'learning_rate': 1.788758044262662e-05, 'epoch': 0.47} {'loss': 0.6155, 'learning_rate': 1.7887373911437965e-05, 'epoch': 0.47} {'loss': 0.7032, 'learning_rate': 1.7887167371345963e-05, 'epoch': 0.47} {'loss': 0.7709, 'learning_rate': 1.7886960822350848e-05, 'epoch': 0.47} {'loss': 0.7109, 'learning_rate': 1.7886754264452855e-05, 'epoch': 0.47} {'loss': 0.5745, 'learning_rate': 1.7886547697652217e-05, 'epoch': 0.47} {'loss': 0.7052, 'learning_rate': 1.7886341121949164e-05, 'epoch': 0.47} {'loss': 0.6638, 'learning_rate': 1.788613453734393e-05, 'epoch': 0.47} {'loss': 0.532, 'learning_rate': 1.7885927943836753e-05, 'epoch': 0.47} {'loss': 0.5459, 'learning_rate': 1.7885721341427863e-05, 'epoch': 0.47} {'loss': 0.6052, 'learning_rate': 1.788551473011749e-05, 'epoch': 0.47} {'loss': 0.4821, 'learning_rate': 1.7885308109905874e-05, 'epoch': 0.47} {'loss': 0.5461, 'learning_rate': 1.788510148079324e-05, 'epoch': 0.47} {'loss': 0.7507, 'learning_rate': 1.788489484277983e-05, 'epoch': 0.47} {'loss': 0.4643, 'learning_rate': 1.788468819586587e-05, 'epoch': 0.47} {'loss': 0.6267, 'learning_rate': 1.78844815400516e-05, 'epoch': 0.47} {'loss': 0.5389, 'learning_rate': 1.7884274875337247e-05, 'epoch': 0.47} {'loss': 0.5835, 'learning_rate': 1.788406820172305e-05, 'epoch': 0.47} {'loss': 0.6266, 'learning_rate': 1.7883861519209235e-05, 'epoch': 0.47} {'loss': 0.4757, 'learning_rate': 1.7883654827796043e-05, 'epoch': 0.47} {'loss': 0.628, 'learning_rate': 1.7883448127483704e-05, 'epoch': 0.47} {'loss': 0.6153, 'learning_rate': 1.788324141827245e-05, 'epoch': 0.47} {'loss': 0.5236, 'learning_rate': 1.7883034700162514e-05, 'epoch': 0.47} {'loss': 0.5558, 'learning_rate': 1.7882827973154132e-05, 'epoch': 0.47} {'loss': 0.6909, 'learning_rate': 1.7882621237247536e-05, 'epoch': 0.47} {'loss': 0.5171, 'learning_rate': 1.7882414492442958e-05, 'epoch': 0.47} {'loss': 0.5514, 'learning_rate': 1.7882207738740634e-05, 'epoch': 0.47} {'loss': 0.6103, 'learning_rate': 1.7882000976140798e-05, 'epoch': 0.47} {'loss': 0.6218, 'learning_rate': 1.7881794204643684e-05, 'epoch': 0.47} {'loss': 0.3981, 'learning_rate': 1.788158742424952e-05, 'epoch': 0.47} {'loss': 0.5947, 'learning_rate': 1.788138063495854e-05, 'epoch': 0.47} {'loss': 0.7099, 'learning_rate': 1.7881173836770984e-05, 'epoch': 0.47} {'loss': 0.5953, 'learning_rate': 1.788096702968708e-05, 'epoch': 0.47} {'loss': 0.6708, 'learning_rate': 1.7880760213707064e-05, 'epoch': 0.47} {'loss': 0.6067, 'learning_rate': 1.7880553388831167e-05, 'epoch': 0.47} {'loss': 0.5676, 'learning_rate': 1.788034655505962e-05, 'epoch': 0.47} {'loss': 0.612, 'learning_rate': 1.7880139712392668e-05, 'epoch': 0.47} {'loss': 0.7167, 'learning_rate': 1.787993286083053e-05, 'epoch': 0.47} {'loss': 0.5686, 'learning_rate': 1.787972600037345e-05, 'epoch': 0.47} {'loss': 0.5798, 'learning_rate': 1.7879519131021657e-05, 'epoch': 0.47} {'loss': 0.6281, 'learning_rate': 1.7879312252775383e-05, 'epoch': 0.47} {'loss': 0.6079, 'learning_rate': 1.7879105365634867e-05, 'epoch': 0.47} {'loss': 0.4499, 'learning_rate': 1.7878898469600338e-05, 'epoch': 0.47} {'loss': 0.4666, 'learning_rate': 1.787869156467203e-05, 'epoch': 0.47} {'loss': 0.5327, 'learning_rate': 1.787848465085018e-05, 'epoch': 0.47} {'loss': 0.5227, 'learning_rate': 1.787827772813502e-05, 'epoch': 0.47} {'loss': 0.6411, 'learning_rate': 1.7878070796526777e-05, 'epoch': 0.47} {'loss': 0.4841, 'learning_rate': 1.7877863856025692e-05, 'epoch': 0.47} {'loss': 0.6861, 'learning_rate': 1.7877656906632e-05, 'epoch': 0.47} {'loss': 0.5106, 'learning_rate': 1.787744994834593e-05, 'epoch': 0.47} {'loss': 0.5224, 'learning_rate': 1.7877242981167716e-05, 'epoch': 0.47} {'loss': 0.5136, 'learning_rate': 1.7877036005097594e-05, 'epoch': 0.47} {'loss': 0.4669, 'learning_rate': 1.7876829020135793e-05, 'epoch': 0.47} {'loss': 0.5464, 'learning_rate': 1.7876622026282553e-05, 'epoch': 0.47} {'loss': 0.5598, 'learning_rate': 1.7876415023538102e-05, 'epoch': 0.47} {'loss': 0.567, 'learning_rate': 1.7876208011902682e-05, 'epoch': 0.47} {'loss': 0.8117, 'learning_rate': 1.7876000991376516e-05, 'epoch': 0.47} {'loss': 0.6781, 'learning_rate': 1.787579396195984e-05, 'epoch': 0.47} {'loss': 0.4965, 'learning_rate': 1.7875586923652895e-05, 'epoch': 0.47} {'loss': 0.4769, 'learning_rate': 1.7875379876455908e-05, 'epoch': 0.47} {'loss': 0.7599, 'learning_rate': 1.7875172820369117e-05, 'epoch': 0.47} {'loss': 0.5915, 'learning_rate': 1.787496575539275e-05, 'epoch': 0.47} {'loss': 0.5381, 'learning_rate': 1.7874758681527045e-05, 'epoch': 0.47} {'loss': 0.6019, 'learning_rate': 1.7874551598772235e-05, 'epoch': 0.47} {'loss': 0.6513, 'learning_rate': 1.7874344507128552e-05, 'epoch': 0.47} {'loss': 0.5663, 'learning_rate': 1.7874137406596235e-05, 'epoch': 0.47} {'loss': 0.7307, 'learning_rate': 1.7873930297175513e-05, 'epoch': 0.47} {'loss': 0.7048, 'learning_rate': 1.7873723178866624e-05, 'epoch': 0.47} {'loss': 0.6501, 'learning_rate': 1.7873516051669794e-05, 'epoch': 0.47} {'loss': 0.4058, 'learning_rate': 1.7873308915585264e-05, 'epoch': 0.47} {'loss': 0.6243, 'learning_rate': 1.7873101770613265e-05, 'epoch': 0.47} {'loss': 0.5814, 'learning_rate': 1.787289461675403e-05, 'epoch': 0.47} {'loss': 0.5768, 'learning_rate': 1.7872687454007797e-05, 'epoch': 0.47} {'loss': 0.6281, 'learning_rate': 1.787248028237479e-05, 'epoch': 0.47} {'loss': 0.5003, 'learning_rate': 1.787227310185526e-05, 'epoch': 0.47} {'loss': 0.6729, 'learning_rate': 1.7872065912449423e-05, 'epoch': 0.47} {'loss': 0.529, 'learning_rate': 1.7871858714157523e-05, 'epoch': 0.47} {'loss': 0.6358, 'learning_rate': 1.787165150697979e-05, 'epoch': 0.47} {'loss': 0.5023, 'learning_rate': 1.787144429091646e-05, 'epoch': 0.47} {'loss': 0.5567, 'learning_rate': 1.7871237065967767e-05, 'epoch': 0.47} {'loss': 0.5902, 'learning_rate': 1.7871029832133948e-05, 'epoch': 0.47} {'loss': 0.5819, 'learning_rate': 1.7870822589415227e-05, 'epoch': 0.47} {'loss': 0.7244, 'learning_rate': 1.7870615337811846e-05, 'epoch': 0.47} {'loss': 0.4415, 'learning_rate': 1.7870408077324035e-05, 'epoch': 0.47} {'loss': 0.753, 'learning_rate': 1.7870200807952033e-05, 'epoch': 0.47} {'loss': 0.7573, 'learning_rate': 1.786999352969607e-05, 'epoch': 0.47} {'loss': 0.6468, 'learning_rate': 1.786978624255638e-05, 'epoch': 0.47} {'loss': 0.5686, 'learning_rate': 1.78695789465332e-05, 'epoch': 0.47} {'loss': 0.6357, 'learning_rate': 1.786937164162676e-05, 'epoch': 0.47} {'loss': 0.6436, 'learning_rate': 1.7869164327837295e-05, 'epoch': 0.47} {'loss': 0.5033, 'learning_rate': 1.786895700516504e-05, 'epoch': 0.47} {'loss': 0.5997, 'learning_rate': 1.786874967361023e-05, 'epoch': 0.47} {'loss': 0.5622, 'learning_rate': 1.78685423331731e-05, 'epoch': 0.47} {'loss': 0.5565, 'learning_rate': 1.786833498385388e-05, 'epoch': 0.47} {'loss': 0.4925, 'learning_rate': 1.7868127625652806e-05, 'epoch': 0.47} {'loss': 0.5054, 'learning_rate': 1.786792025857011e-05, 'epoch': 0.47} {'loss': 0.5213, 'learning_rate': 1.786771288260603e-05, 'epoch': 0.47} {'loss': 0.6733, 'learning_rate': 1.78675054977608e-05, 'epoch': 0.47} {'loss': 0.6652, 'learning_rate': 1.7867298104034652e-05, 'epoch': 0.47} {'loss': 0.6749, 'learning_rate': 1.7867090701427817e-05, 'epoch': 0.47} {'loss': 0.7123, 'learning_rate': 1.7866883289940537e-05, 'epoch': 0.47} {'loss': 0.6673, 'learning_rate': 1.7866675869573037e-05, 'epoch': 0.47} {'loss': 0.7049, 'learning_rate': 1.786646844032556e-05, 'epoch': 0.47} {'loss': 0.5178, 'learning_rate': 1.7866261002198334e-05, 'epoch': 0.47} {'loss': 0.5807, 'learning_rate': 1.7866053555191597e-05, 'epoch': 0.47} {'loss': 0.7397, 'learning_rate': 1.7865846099305577e-05, 'epoch': 0.47} {'loss': 0.7231, 'learning_rate': 1.7865638634540517e-05, 'epoch': 0.47} {'loss': 0.4662, 'learning_rate': 1.7865431160896644e-05, 'epoch': 0.47} {'loss': 0.472, 'learning_rate': 1.7865223678374196e-05, 'epoch': 0.47} {'loss': 0.5084, 'learning_rate': 1.786501618697341e-05, 'epoch': 0.47} {'loss': 0.5357, 'learning_rate': 1.7864808686694507e-05, 'epoch': 0.47} {'loss': 0.4916, 'learning_rate': 1.786460117753774e-05, 'epoch': 0.47} {'loss': 0.673, 'learning_rate': 1.7864393659503328e-05, 'epoch': 0.47} {'loss': 0.6524, 'learning_rate': 1.786418613259151e-05, 'epoch': 0.47} {'loss': 0.3896, 'learning_rate': 1.786397859680253e-05, 'epoch': 0.47} {'loss': 0.4274, 'learning_rate': 1.7863771052136603e-05, 'epoch': 0.47} {'loss': 0.6457, 'learning_rate': 1.7863563498593983e-05, 'epoch': 0.47} {'loss': 0.5324, 'learning_rate': 1.7863355936174887e-05, 'epoch': 0.47} {'loss': 0.5467, 'learning_rate': 1.7863148364879564e-05, 'epoch': 0.47} {'loss': 0.416, 'learning_rate': 1.7862940784708237e-05, 'epoch': 0.47} {'loss': 0.4985, 'learning_rate': 1.7862733195661146e-05, 'epoch': 0.47} {'loss': 0.6002, 'learning_rate': 1.7862525597738526e-05, 'epoch': 0.47} {'loss': 0.6168, 'learning_rate': 1.786231799094061e-05, 'epoch': 0.47} {'loss': 0.5631, 'learning_rate': 1.786211037526763e-05, 'epoch': 0.47} {'loss': 0.6036, 'learning_rate': 1.7861902750719824e-05, 'epoch': 0.47} {'loss': 0.647, 'learning_rate': 1.7861695117297422e-05, 'epoch': 0.47} {'loss': 0.609, 'learning_rate': 1.7861487475000667e-05, 'epoch': 0.47} {'loss': 0.5987, 'learning_rate': 1.786127982382978e-05, 'epoch': 0.47} {'loss': 0.5074, 'learning_rate': 1.786107216378501e-05, 'epoch': 0.47} {'loss': 0.7051, 'learning_rate': 1.7860864494866584e-05, 'epoch': 0.47} {'loss': 0.5492, 'learning_rate': 1.7860656817074733e-05, 'epoch': 0.47} {'loss': 0.5777, 'learning_rate': 1.7860449130409697e-05, 'epoch': 0.47} {'loss': 0.6568, 'learning_rate': 1.7860241434871707e-05, 'epoch': 0.47} {'loss': 0.7117, 'learning_rate': 1.7860033730461e-05, 'epoch': 0.47} {'loss': 0.6271, 'learning_rate': 1.785982601717781e-05, 'epoch': 0.47} {'loss': 0.4342, 'learning_rate': 1.7859618295022372e-05, 'epoch': 0.47} {'loss': 0.4503, 'learning_rate': 1.7859410563994917e-05, 'epoch': 0.47} {'loss': 0.5258, 'learning_rate': 1.7859202824095684e-05, 'epoch': 0.47} {'loss': 0.5188, 'learning_rate': 1.7858995075324905e-05, 'epoch': 0.47} {'loss': 0.6327, 'learning_rate': 1.7858787317682814e-05, 'epoch': 0.47} {'loss': 0.5717, 'learning_rate': 1.785857955116965e-05, 'epoch': 0.47} {'loss': 0.5825, 'learning_rate': 1.785837177578564e-05, 'epoch': 0.47} {'loss': 0.5758, 'learning_rate': 1.7858163991531022e-05, 'epoch': 0.47} {'loss': 0.6512, 'learning_rate': 1.7857956198406037e-05, 'epoch': 0.47} {'loss': 0.7202, 'learning_rate': 1.785774839641091e-05, 'epoch': 0.47} {'loss': 0.4725, 'learning_rate': 1.785754058554588e-05, 'epoch': 0.47} {'loss': 0.6162, 'learning_rate': 1.785733276581118e-05, 'epoch': 0.47} {'loss': 0.5756, 'learning_rate': 1.7857124937207043e-05, 'epoch': 0.47} {'loss': 0.6505, 'learning_rate': 1.785691709973371e-05, 'epoch': 0.47} {'loss': 0.6288, 'learning_rate': 1.785670925339141e-05, 'epoch': 0.47} {'loss': 0.4691, 'learning_rate': 1.785650139818038e-05, 'epoch': 0.47} {'loss': 0.6216, 'learning_rate': 1.785629353410085e-05, 'epoch': 0.47} {'loss': 0.543, 'learning_rate': 1.7856085661153064e-05, 'epoch': 0.47} {'loss': 0.6534, 'learning_rate': 1.785587777933725e-05, 'epoch': 0.47} {'loss': 0.376, 'learning_rate': 1.785566988865364e-05, 'epoch': 0.47} {'loss': 0.3658, 'learning_rate': 1.785546198910248e-05, 'epoch': 0.47} {'loss': 0.5269, 'learning_rate': 1.785525408068399e-05, 'epoch': 0.47} {'loss': 0.6828, 'learning_rate': 1.7855046163398415e-05, 'epoch': 0.47} {'loss': 0.5653, 'learning_rate': 1.7854838237245985e-05, 'epoch': 0.47} {'loss': 0.4476, 'learning_rate': 1.7854630302226938e-05, 'epoch': 0.47} {'loss': 0.6518, 'learning_rate': 1.7854422358341506e-05, 'epoch': 0.47} {'loss': 0.6458, 'learning_rate': 1.785421440558993e-05, 'epoch': 0.47} {'loss': 0.7518, 'learning_rate': 1.7854006443972433e-05, 'epoch': 0.47} {'loss': 0.551, 'learning_rate': 1.7853798473489255e-05, 'epoch': 0.47} {'loss': 0.6233, 'learning_rate': 1.7853590494140638e-05, 'epoch': 0.47} {'loss': 0.568, 'learning_rate': 1.7853382505926808e-05, 'epoch': 0.47} {'loss': 0.494, 'learning_rate': 1.7853174508848002e-05, 'epoch': 0.47} {'loss': 0.475, 'learning_rate': 1.7852966502904454e-05, 'epoch': 0.47} {'loss': 0.4596, 'learning_rate': 1.7852758488096405e-05, 'epoch': 0.47} {'loss': 0.4903, 'learning_rate': 1.785255046442408e-05, 'epoch': 0.47} {'loss': 0.6864, 'learning_rate': 1.785234243188772e-05, 'epoch': 0.47} {'loss': 0.6791, 'learning_rate': 1.785213439048756e-05, 'epoch': 0.47} {'loss': 0.6563, 'learning_rate': 1.785192634022383e-05, 'epoch': 0.47} {'loss': 0.5896, 'learning_rate': 1.7851718281096774e-05, 'epoch': 0.47} {'loss': 0.6551, 'learning_rate': 1.785151021310662e-05, 'epoch': 0.47} {'loss': 0.6282, 'learning_rate': 1.78513021362536e-05, 'epoch': 0.47} {'loss': 0.6633, 'learning_rate': 1.7851094050537953e-05, 'epoch': 0.47} {'loss': 0.7229, 'learning_rate': 1.7850885955959915e-05, 'epoch': 0.47} {'loss': 0.6484, 'learning_rate': 1.785067785251972e-05, 'epoch': 0.47} {'loss': 0.7057, 'learning_rate': 1.7850469740217603e-05, 'epoch': 0.47} {'loss': 0.5298, 'learning_rate': 1.78502616190538e-05, 'epoch': 0.47} {'loss': 0.4609, 'learning_rate': 1.785005348902854e-05, 'epoch': 0.47} {'loss': 0.7175, 'learning_rate': 1.7849845350142065e-05, 'epoch': 0.47} {'loss': 0.6294, 'learning_rate': 1.784963720239461e-05, 'epoch': 0.47} {'loss': 0.6455, 'learning_rate': 1.7849429045786405e-05, 'epoch': 0.47} {'loss': 0.5713, 'learning_rate': 1.7849220880317686e-05, 'epoch': 0.47} {'loss': 0.4509, 'learning_rate': 1.7849012705988688e-05, 'epoch': 0.47} {'loss': 0.6048, 'learning_rate': 1.784880452279965e-05, 'epoch': 0.47} {'loss': 0.6483, 'learning_rate': 1.7848596330750804e-05, 'epoch': 0.47} {'loss': 0.3773, 'learning_rate': 1.7848388129842386e-05, 'epoch': 0.47} {'loss': 0.5969, 'learning_rate': 1.784817992007463e-05, 'epoch': 0.47} {'loss': 0.6964, 'learning_rate': 1.7847971701447767e-05, 'epoch': 0.47} {'loss': 0.6496, 'learning_rate': 1.7847763473962043e-05, 'epoch': 0.47} {'loss': 0.4263, 'learning_rate': 1.784755523761768e-05, 'epoch': 0.47} {'loss': 0.5395, 'learning_rate': 1.7847346992414925e-05, 'epoch': 0.47} {'loss': 0.3984, 'learning_rate': 1.7847138738354003e-05, 'epoch': 0.47} {'loss': 0.5915, 'learning_rate': 1.7846930475435157e-05, 'epoch': 0.47} {'loss': 0.6237, 'learning_rate': 1.7846722203658616e-05, 'epoch': 0.47} {'loss': 0.5445, 'learning_rate': 1.784651392302462e-05, 'epoch': 0.47} {'loss': 0.6608, 'learning_rate': 1.78463056335334e-05, 'epoch': 0.47} {'loss': 0.8243, 'learning_rate': 1.7846097335185195e-05, 'epoch': 0.47} {'loss': 0.6254, 'learning_rate': 1.7845889027980234e-05, 'epoch': 0.47} {'loss': 0.7217, 'learning_rate': 1.784568071191876e-05, 'epoch': 0.47} {'loss': 0.5921, 'learning_rate': 1.7845472387001002e-05, 'epoch': 0.47} {'loss': 0.6104, 'learning_rate': 1.78452640532272e-05, 'epoch': 0.47} {'loss': 0.6434, 'learning_rate': 1.7845055710597586e-05, 'epoch': 0.47} {'loss': 0.4163, 'learning_rate': 1.7844847359112396e-05, 'epoch': 0.47} {'loss': 0.6344, 'learning_rate': 1.7844638998771865e-05, 'epoch': 0.47} {'loss': 0.5559, 'learning_rate': 1.784443062957623e-05, 'epoch': 0.47} {'loss': 0.6026, 'learning_rate': 1.784422225152572e-05, 'epoch': 0.47} {'loss': 0.5361, 'learning_rate': 1.784401386462058e-05, 'epoch': 0.47} {'loss': 0.5755, 'learning_rate': 1.7843805468861034e-05, 'epoch': 0.47} {'loss': 0.6234, 'learning_rate': 1.784359706424733e-05, 'epoch': 0.47} {'loss': 0.6161, 'learning_rate': 1.784338865077969e-05, 'epoch': 0.47} {'loss': 0.5264, 'learning_rate': 1.784318022845836e-05, 'epoch': 0.47} {'loss': 0.6191, 'learning_rate': 1.7842971797283567e-05, 'epoch': 0.47} {'loss': 0.3649, 'learning_rate': 1.7842763357255556e-05, 'epoch': 0.47} {'loss': 0.5693, 'learning_rate': 1.7842554908374553e-05, 'epoch': 0.48} {'loss': 0.6446, 'learning_rate': 1.7842346450640796e-05, 'epoch': 0.48} {'loss': 0.5755, 'learning_rate': 1.7842137984054524e-05, 'epoch': 0.48} {'loss': 0.8174, 'learning_rate': 1.784192950861597e-05, 'epoch': 0.48} {'loss': 0.4533, 'learning_rate': 1.7841721024325363e-05, 'epoch': 0.48} {'loss': 0.5272, 'learning_rate': 1.7841512531182948e-05, 'epoch': 0.48} {'loss': 0.5544, 'learning_rate': 1.7841304029188958e-05, 'epoch': 0.48} {'loss': 0.637, 'learning_rate': 1.7841095518343622e-05, 'epoch': 0.48} {'loss': 0.6758, 'learning_rate': 1.7840886998647185e-05, 'epoch': 0.48} {'loss': 0.5715, 'learning_rate': 1.7840678470099874e-05, 'epoch': 0.48} {'loss': 0.6479, 'learning_rate': 1.7840469932701932e-05, 'epoch': 0.48} {'loss': 0.5511, 'learning_rate': 1.7840261386453587e-05, 'epoch': 0.48} {'loss': 0.499, 'learning_rate': 1.784005283135508e-05, 'epoch': 0.48} {'loss': 0.6513, 'learning_rate': 1.7839844267406643e-05, 'epoch': 0.48} {'loss': 0.6741, 'learning_rate': 1.7839635694608515e-05, 'epoch': 0.48} {'loss': 0.5651, 'learning_rate': 1.7839427112960925e-05, 'epoch': 0.48} {'loss': 0.6105, 'learning_rate': 1.7839218522464114e-05, 'epoch': 0.48} {'loss': 0.6998, 'learning_rate': 1.7839009923118316e-05, 'epoch': 0.48} {'loss': 0.6599, 'learning_rate': 1.783880131492377e-05, 'epoch': 0.48} {'loss': 0.5042, 'learning_rate': 1.7838592697880705e-05, 'epoch': 0.48} {'loss': 0.5085, 'learning_rate': 1.7838384071989355e-05, 'epoch': 0.48} {'loss': 0.5659, 'learning_rate': 1.7838175437249967e-05, 'epoch': 0.48} {'loss': 0.4338, 'learning_rate': 1.7837966793662765e-05, 'epoch': 0.48} {'loss': 0.5614, 'learning_rate': 1.783775814122799e-05, 'epoch': 0.48} {'loss': 0.5899, 'learning_rate': 1.783754947994588e-05, 'epoch': 0.48} {'loss': 0.555, 'learning_rate': 1.7837340809816663e-05, 'epoch': 0.48} {'loss': 0.4612, 'learning_rate': 1.7837132130840576e-05, 'epoch': 0.48} {'loss': 0.7203, 'learning_rate': 1.7836923443017864e-05, 'epoch': 0.48} {'loss': 0.468, 'learning_rate': 1.783671474634875e-05, 'epoch': 0.48} {'loss': 0.6771, 'learning_rate': 1.783650604083348e-05, 'epoch': 0.48} {'loss': 0.4503, 'learning_rate': 1.7836297326472284e-05, 'epoch': 0.48} {'loss': 0.6992, 'learning_rate': 1.7836088603265397e-05, 'epoch': 0.48} {'loss': 0.6425, 'learning_rate': 1.7835879871213057e-05, 'epoch': 0.48} {'loss': 0.618, 'learning_rate': 1.7835671130315494e-05, 'epoch': 0.48} {'loss': 0.6206, 'learning_rate': 1.7835462380572952e-05, 'epoch': 0.48} {'loss': 0.6594, 'learning_rate': 1.7835253621985665e-05, 'epoch': 0.48} {'loss': 0.6215, 'learning_rate': 1.7835044854553866e-05, 'epoch': 0.48} {'loss': 0.5841, 'learning_rate': 1.783483607827779e-05, 'epoch': 0.48} {'loss': 0.5594, 'learning_rate': 1.783462729315767e-05, 'epoch': 0.48} {'loss': 0.7033, 'learning_rate': 1.783441849919375e-05, 'epoch': 0.48} {'loss': 0.6455, 'learning_rate': 1.783420969638626e-05, 'epoch': 0.48} {'loss': 0.5379, 'learning_rate': 1.783400088473544e-05, 'epoch': 0.48} {'loss': 0.5531, 'learning_rate': 1.783379206424152e-05, 'epoch': 0.48} {'loss': 0.651, 'learning_rate': 1.783358323490474e-05, 'epoch': 0.48} {'loss': 0.7319, 'learning_rate': 1.7833374396725333e-05, 'epoch': 0.48} {'loss': 0.6066, 'learning_rate': 1.7833165549703534e-05, 'epoch': 0.48} {'loss': 0.5546, 'learning_rate': 1.783295669383958e-05, 'epoch': 0.48} {'loss': 0.6266, 'learning_rate': 1.7832747829133713e-05, 'epoch': 0.48} {'loss': 0.6412, 'learning_rate': 1.7832538955586162e-05, 'epoch': 0.48} {'loss': 0.4516, 'learning_rate': 1.7832330073197163e-05, 'epoch': 0.48} {'loss': 0.5986, 'learning_rate': 1.7832121181966952e-05, 'epoch': 0.48} {'loss': 0.5647, 'learning_rate': 1.7831912281895764e-05, 'epoch': 0.48} {'loss': 0.6275, 'learning_rate': 1.783170337298384e-05, 'epoch': 0.48} {'loss': 0.4893, 'learning_rate': 1.7831494455231407e-05, 'epoch': 0.48} {'loss': 0.6191, 'learning_rate': 1.783128552863871e-05, 'epoch': 0.48} {'loss': 0.5835, 'learning_rate': 1.783107659320598e-05, 'epoch': 0.48} {'loss': 0.573, 'learning_rate': 1.783086764893345e-05, 'epoch': 0.48} {'loss': 0.647, 'learning_rate': 1.7830658695821364e-05, 'epoch': 0.48} {'loss': 0.5182, 'learning_rate': 1.783044973386995e-05, 'epoch': 0.48} {'loss': 0.7804, 'learning_rate': 1.7830240763079453e-05, 'epoch': 0.48} {'loss': 0.5636, 'learning_rate': 1.78300317834501e-05, 'epoch': 0.48} {'loss': 0.4669, 'learning_rate': 1.782982279498213e-05, 'epoch': 0.48} {'loss': 0.4987, 'learning_rate': 1.7829613797675777e-05, 'epoch': 0.48} {'loss': 0.6285, 'learning_rate': 1.782940479153128e-05, 'epoch': 0.48} {'loss': 0.5661, 'learning_rate': 1.7829195776548874e-05, 'epoch': 0.48} {'loss': 0.6909, 'learning_rate': 1.7828986752728795e-05, 'epoch': 0.48} {'loss': 0.6984, 'learning_rate': 1.782877772007128e-05, 'epoch': 0.48} {'loss': 0.4917, 'learning_rate': 1.7828568678576563e-05, 'epoch': 0.48} {'loss': 0.5339, 'learning_rate': 1.782835962824488e-05, 'epoch': 0.48} {'loss': 0.4979, 'learning_rate': 1.7828150569076466e-05, 'epoch': 0.48} {'loss': 0.6988, 'learning_rate': 1.782794150107156e-05, 'epoch': 0.48} {'loss': 0.605, 'learning_rate': 1.7827732424230397e-05, 'epoch': 0.48} {'loss': 0.6957, 'learning_rate': 1.7827523338553216e-05, 'epoch': 0.48} {'loss': 0.6857, 'learning_rate': 1.7827314244040244e-05, 'epoch': 0.48} {'loss': 0.5713, 'learning_rate': 1.7827105140691726e-05, 'epoch': 0.48} {'loss': 0.6417, 'learning_rate': 1.7826896028507893e-05, 'epoch': 0.48} {'loss': 0.4081, 'learning_rate': 1.7826686907488984e-05, 'epoch': 0.48} {'loss': 0.6406, 'learning_rate': 1.7826477777635233e-05, 'epoch': 0.48} {'loss': 0.5386, 'learning_rate': 1.7826268638946874e-05, 'epoch': 0.48} {'loss': 0.7206, 'learning_rate': 1.7826059491424152e-05, 'epoch': 0.48} {'loss': 0.5345, 'learning_rate': 1.7825850335067292e-05, 'epoch': 0.48} {'loss': 0.7225, 'learning_rate': 1.7825641169876537e-05, 'epoch': 0.48} {'loss': 0.6203, 'learning_rate': 1.782543199585212e-05, 'epoch': 0.48} {'loss': 0.6006, 'learning_rate': 1.782522281299428e-05, 'epoch': 0.48} {'loss': 0.5677, 'learning_rate': 1.7825013621303253e-05, 'epoch': 0.48} {'loss': 0.6527, 'learning_rate': 1.782480442077927e-05, 'epoch': 0.48} {'loss': 0.7043, 'learning_rate': 1.7824595211422576e-05, 'epoch': 0.48} {'loss': 0.5929, 'learning_rate': 1.7824385993233396e-05, 'epoch': 0.48} {'loss': 0.586, 'learning_rate': 1.7824176766211976e-05, 'epoch': 0.48} {'loss': 0.5392, 'learning_rate': 1.7823967530358547e-05, 'epoch': 0.48} {'loss': 0.6422, 'learning_rate': 1.7823758285673346e-05, 'epoch': 0.48} {'loss': 0.6768, 'learning_rate': 1.782354903215661e-05, 'epoch': 0.48} {'loss': 0.6977, 'learning_rate': 1.7823339769808573e-05, 'epoch': 0.48} {'loss': 0.6635, 'learning_rate': 1.7823130498629476e-05, 'epoch': 0.48} {'loss': 0.6044, 'learning_rate': 1.7822921218619552e-05, 'epoch': 0.48} {'loss': 0.5012, 'learning_rate': 1.7822711929779035e-05, 'epoch': 0.48} {'loss': 0.6403, 'learning_rate': 1.782250263210817e-05, 'epoch': 0.48} {'loss': 0.7395, 'learning_rate': 1.7822293325607178e-05, 'epoch': 0.48} {'loss': 0.4266, 'learning_rate': 1.7822084010276312e-05, 'epoch': 0.48} {'loss': 0.7976, 'learning_rate': 1.7821874686115795e-05, 'epoch': 0.48} {'loss': 0.6758, 'learning_rate': 1.782166535312587e-05, 'epoch': 0.48} {'loss': 0.5434, 'learning_rate': 1.7821456011306773e-05, 'epoch': 0.48} {'loss': 0.5296, 'learning_rate': 1.7821246660658743e-05, 'epoch': 0.48} {'loss': 0.5791, 'learning_rate': 1.7821037301182008e-05, 'epoch': 0.48} {'loss': 0.5999, 'learning_rate': 1.7820827932876814e-05, 'epoch': 0.48} {'loss': 0.5663, 'learning_rate': 1.7820618555743388e-05, 'epoch': 0.48} {'loss': 0.7629, 'learning_rate': 1.782040916978197e-05, 'epoch': 0.48} {'loss': 0.652, 'learning_rate': 1.78201997749928e-05, 'epoch': 0.48} {'loss': 0.5673, 'learning_rate': 1.7819990371376112e-05, 'epoch': 0.48} {'loss': 0.6026, 'learning_rate': 1.781978095893214e-05, 'epoch': 0.48} {'loss': 0.7373, 'learning_rate': 1.781957153766112e-05, 'epoch': 0.48} {'loss': 0.3512, 'learning_rate': 1.7819362107563295e-05, 'epoch': 0.48} {'loss': 0.7087, 'learning_rate': 1.7819152668638897e-05, 'epoch': 0.48} {'loss': 0.6547, 'learning_rate': 1.7818943220888162e-05, 'epoch': 0.48} {'loss': 0.4582, 'learning_rate': 1.7818733764311326e-05, 'epoch': 0.48} {'loss': 0.6444, 'learning_rate': 1.7818524298908625e-05, 'epoch': 0.48} {'loss': 0.629, 'learning_rate': 1.78183148246803e-05, 'epoch': 0.48} {'loss': 0.699, 'learning_rate': 1.7818105341626584e-05, 'epoch': 0.48} {'loss': 0.4849, 'learning_rate': 1.7817895849747712e-05, 'epoch': 0.48} {'loss': 0.4585, 'learning_rate': 1.781768634904392e-05, 'epoch': 0.48} {'loss': 0.5566, 'learning_rate': 1.781747683951545e-05, 'epoch': 0.48} {'loss': 0.6242, 'learning_rate': 1.7817267321162536e-05, 'epoch': 0.48} {'loss': 0.5773, 'learning_rate': 1.781705779398541e-05, 'epoch': 0.48} {'loss': 0.7756, 'learning_rate': 1.7816848257984318e-05, 'epoch': 0.48} {'loss': 0.7255, 'learning_rate': 1.7816638713159487e-05, 'epoch': 0.48} {'loss': 0.5165, 'learning_rate': 1.7816429159511158e-05, 'epoch': 0.48} {'loss': 0.384, 'learning_rate': 1.7816219597039565e-05, 'epoch': 0.48} {'loss': 0.5778, 'learning_rate': 1.7816010025744947e-05, 'epoch': 0.48} {'loss': 0.5517, 'learning_rate': 1.7815800445627543e-05, 'epoch': 0.48} {'loss': 0.5599, 'learning_rate': 1.7815590856687583e-05, 'epoch': 0.48} {'loss': 0.6793, 'learning_rate': 1.781538125892531e-05, 'epoch': 0.48} {'loss': 0.4681, 'learning_rate': 1.7815171652340953e-05, 'epoch': 0.48} {'loss': 0.706, 'learning_rate': 1.7814962036934757e-05, 'epoch': 0.48} {'loss': 0.6607, 'learning_rate': 1.7814752412706957e-05, 'epoch': 0.48} {'loss': 0.7599, 'learning_rate': 1.7814542779657787e-05, 'epoch': 0.48} {'loss': 0.5759, 'learning_rate': 1.781433313778748e-05, 'epoch': 0.48} {'loss': 0.4922, 'learning_rate': 1.781412348709628e-05, 'epoch': 0.48} {'loss': 0.7225, 'learning_rate': 1.7813913827584418e-05, 'epoch': 0.48} {'loss': 0.6098, 'learning_rate': 1.7813704159252138e-05, 'epoch': 0.48} {'loss': 0.557, 'learning_rate': 1.7813494482099666e-05, 'epoch': 0.48} {'loss': 0.3908, 'learning_rate': 1.7813284796127247e-05, 'epoch': 0.48} {'loss': 0.5943, 'learning_rate': 1.7813075101335114e-05, 'epoch': 0.48} {'loss': 0.6785, 'learning_rate': 1.781286539772351e-05, 'epoch': 0.48} {'loss': 0.6182, 'learning_rate': 1.781265568529266e-05, 'epoch': 0.48} {'loss': 0.5296, 'learning_rate': 1.7812445964042813e-05, 'epoch': 0.48} {'loss': 0.4628, 'learning_rate': 1.7812236233974197e-05, 'epoch': 0.48} {'loss': 0.6384, 'learning_rate': 1.781202649508705e-05, 'epoch': 0.48} {'loss': 0.6319, 'learning_rate': 1.7811816747381613e-05, 'epoch': 0.48} {'loss': 0.6112, 'learning_rate': 1.7811606990858122e-05, 'epoch': 0.48} {'loss': 0.6581, 'learning_rate': 1.7811397225516812e-05, 'epoch': 0.48} {'loss': 0.5835, 'learning_rate': 1.7811187451357916e-05, 'epoch': 0.48} {'loss': 0.6293, 'learning_rate': 1.7810977668381677e-05, 'epoch': 0.48} {'loss': 0.4874, 'learning_rate': 1.781076787658833e-05, 'epoch': 0.48} {'loss': 0.7137, 'learning_rate': 1.7810558075978114e-05, 'epoch': 0.48} {'loss': 0.6558, 'learning_rate': 1.781034826655126e-05, 'epoch': 0.48} {'loss': 0.5709, 'learning_rate': 1.7810138448308008e-05, 'epoch': 0.48} {'loss': 0.6251, 'learning_rate': 1.7809928621248594e-05, 'epoch': 0.48} {'loss': 0.5798, 'learning_rate': 1.7809718785373258e-05, 'epoch': 0.48} {'loss': 0.6729, 'learning_rate': 1.7809508940682233e-05, 'epoch': 0.48} {'loss': 0.6352, 'learning_rate': 1.7809299087175756e-05, 'epoch': 0.48} {'loss': 0.6272, 'learning_rate': 1.780908922485407e-05, 'epoch': 0.48} {'loss': 0.5734, 'learning_rate': 1.7808879353717402e-05, 'epoch': 0.48} {'loss': 0.4925, 'learning_rate': 1.7808669473765998e-05, 'epoch': 0.48} {'loss': 0.5643, 'learning_rate': 1.780845958500009e-05, 'epoch': 0.48} {'loss': 0.6807, 'learning_rate': 1.7808249687419916e-05, 'epoch': 0.48} {'loss': 0.7152, 'learning_rate': 1.7808039781025712e-05, 'epoch': 0.48} {'loss': 0.4686, 'learning_rate': 1.7807829865817714e-05, 'epoch': 0.48} {'loss': 0.696, 'learning_rate': 1.7807619941796165e-05, 'epoch': 0.48} {'loss': 0.6582, 'learning_rate': 1.7807410008961296e-05, 'epoch': 0.48} {'loss': 0.6983, 'learning_rate': 1.7807200067313344e-05, 'epoch': 0.48} {'loss': 0.6611, 'learning_rate': 1.780699011685255e-05, 'epoch': 0.48} {'loss': 0.5558, 'learning_rate': 1.780678015757915e-05, 'epoch': 0.48} {'loss': 0.3402, 'learning_rate': 1.7806570189493377e-05, 'epoch': 0.48} {'loss': 0.6615, 'learning_rate': 1.780636021259547e-05, 'epoch': 0.48} {'loss': 0.5299, 'learning_rate': 1.780615022688567e-05, 'epoch': 0.48} {'loss': 0.6356, 'learning_rate': 1.780594023236421e-05, 'epoch': 0.48} {'loss': 0.7141, 'learning_rate': 1.7805730229031326e-05, 'epoch': 0.48} {'loss': 0.5831, 'learning_rate': 1.7805520216887257e-05, 'epoch': 0.48} {'loss': 0.6497, 'learning_rate': 1.780531019593224e-05, 'epoch': 0.48} {'loss': 0.4316, 'learning_rate': 1.7805100166166516e-05, 'epoch': 0.48} {'loss': 0.6216, 'learning_rate': 1.7804890127590317e-05, 'epoch': 0.48} {'loss': 0.4513, 'learning_rate': 1.7804680080203877e-05, 'epoch': 0.48} {'loss': 0.6194, 'learning_rate': 1.7804470024007438e-05, 'epoch': 0.48} {'loss': 0.5537, 'learning_rate': 1.780425995900124e-05, 'epoch': 0.48} {'loss': 0.6197, 'learning_rate': 1.7804049885185515e-05, 'epoch': 0.48} {'loss': 0.5542, 'learning_rate': 1.78038398025605e-05, 'epoch': 0.48} {'loss': 0.6297, 'learning_rate': 1.7803629711126436e-05, 'epoch': 0.48} {'loss': 0.5263, 'learning_rate': 1.7803419610883558e-05, 'epoch': 0.48} {'loss': 0.5748, 'learning_rate': 1.78032095018321e-05, 'epoch': 0.48} {'loss': 0.5508, 'learning_rate': 1.7802999383972306e-05, 'epoch': 0.48} {'loss': 0.6155, 'learning_rate': 1.7802789257304406e-05, 'epoch': 0.48} {'loss': 0.6378, 'learning_rate': 1.780257912182864e-05, 'epoch': 0.48} {'loss': 0.6187, 'learning_rate': 1.780236897754525e-05, 'epoch': 0.48} {'loss': 0.558, 'learning_rate': 1.780215882445447e-05, 'epoch': 0.48} {'loss': 0.5645, 'learning_rate': 1.7801948662556535e-05, 'epoch': 0.48} {'loss': 0.5171, 'learning_rate': 1.780173849185168e-05, 'epoch': 0.48} {'loss': 0.475, 'learning_rate': 1.780152831234015e-05, 'epoch': 0.48} {'loss': 0.574, 'learning_rate': 1.7801318124022176e-05, 'epoch': 0.48} {'loss': 0.7209, 'learning_rate': 1.7801107926897997e-05, 'epoch': 0.48} {'loss': 0.457, 'learning_rate': 1.7800897720967854e-05, 'epoch': 0.48} {'loss': 0.5372, 'learning_rate': 1.7800687506231977e-05, 'epoch': 0.48} {'loss': 0.6149, 'learning_rate': 1.780047728269061e-05, 'epoch': 0.48} {'loss': 0.481, 'learning_rate': 1.7800267050343985e-05, 'epoch': 0.48} {'loss': 0.6323, 'learning_rate': 1.7800056809192342e-05, 'epoch': 0.48} {'loss': 0.6294, 'learning_rate': 1.779984655923592e-05, 'epoch': 0.48} {'loss': 0.5241, 'learning_rate': 1.7799636300474953e-05, 'epoch': 0.48} {'loss': 0.4635, 'learning_rate': 1.7799426032909682e-05, 'epoch': 0.48} {'loss': 0.5464, 'learning_rate': 1.7799215756540336e-05, 'epoch': 0.48} {'loss': 0.5677, 'learning_rate': 1.7799005471367164e-05, 'epoch': 0.48} {'loss': 0.5922, 'learning_rate': 1.7798795177390396e-05, 'epoch': 0.48} {'loss': 0.5765, 'learning_rate': 1.7798584874610276e-05, 'epoch': 0.48} {'loss': 0.5343, 'learning_rate': 1.779837456302703e-05, 'epoch': 0.48} {'loss': 0.5645, 'learning_rate': 1.7798164242640906e-05, 'epoch': 0.48} {'loss': 0.6409, 'learning_rate': 1.7797953913452134e-05, 'epoch': 0.48} {'loss': 0.4734, 'learning_rate': 1.779774357546096e-05, 'epoch': 0.48} {'loss': 0.6424, 'learning_rate': 1.779753322866761e-05, 'epoch': 0.48} {'loss': 0.6633, 'learning_rate': 1.7797322873072332e-05, 'epoch': 0.48} {'loss': 0.4444, 'learning_rate': 1.779711250867536e-05, 'epoch': 0.48} {'loss': 0.5899, 'learning_rate': 1.7796902135476924e-05, 'epoch': 0.48} {'loss': 0.5367, 'learning_rate': 1.7796691753477275e-05, 'epoch': 0.48} {'loss': 0.6134, 'learning_rate': 1.7796481362676644e-05, 'epoch': 0.48} {'loss': 0.4774, 'learning_rate': 1.7796270963075264e-05, 'epoch': 0.48} {'loss': 0.4844, 'learning_rate': 1.7796060554673377e-05, 'epoch': 0.48} {'loss': 0.6094, 'learning_rate': 1.779585013747122e-05, 'epoch': 0.48} {'loss': 0.5661, 'learning_rate': 1.7795639711469034e-05, 'epoch': 0.48} {'loss': 0.6231, 'learning_rate': 1.779542927666705e-05, 'epoch': 0.48} {'loss': 0.5031, 'learning_rate': 1.7795218833065514e-05, 'epoch': 0.48} {'loss': 0.6737, 'learning_rate': 1.7795008380664653e-05, 'epoch': 0.48} {'loss': 0.4472, 'learning_rate': 1.779479791946471e-05, 'epoch': 0.48} {'loss': 0.6048, 'learning_rate': 1.7794587449465926e-05, 'epoch': 0.48} {'loss': 0.6269, 'learning_rate': 1.779437697066853e-05, 'epoch': 0.48} {'loss': 0.6035, 'learning_rate': 1.7794166483072766e-05, 'epoch': 0.48} {'loss': 0.5894, 'learning_rate': 1.7793955986678874e-05, 'epoch': 0.48} {'loss': 0.5219, 'learning_rate': 1.7793745481487085e-05, 'epoch': 0.48} {'loss': 0.6401, 'learning_rate': 1.779353496749764e-05, 'epoch': 0.48} {'loss': 0.5175, 'learning_rate': 1.7793324444710776e-05, 'epoch': 0.48} {'loss': 0.5128, 'learning_rate': 1.7793113913126728e-05, 'epoch': 0.48} {'loss': 0.6151, 'learning_rate': 1.7792903372745737e-05, 'epoch': 0.48} {'loss': 0.5283, 'learning_rate': 1.7792692823568042e-05, 'epoch': 0.48} {'loss': 0.6588, 'learning_rate': 1.779248226559388e-05, 'epoch': 0.48} {'loss': 0.5001, 'learning_rate': 1.7792271698823486e-05, 'epoch': 0.48} {'loss': 0.67, 'learning_rate': 1.7792061123257096e-05, 'epoch': 0.48} {'loss': 0.5725, 'learning_rate': 1.7791850538894953e-05, 'epoch': 0.48} {'loss': 0.605, 'learning_rate': 1.7791639945737294e-05, 'epoch': 0.48} {'loss': 0.6807, 'learning_rate': 1.7791429343784354e-05, 'epoch': 0.48} {'loss': 0.4666, 'learning_rate': 1.779121873303637e-05, 'epoch': 0.48} {'loss': 0.6811, 'learning_rate': 1.7791008113493584e-05, 'epoch': 0.48} {'loss': 0.5629, 'learning_rate': 1.779079748515623e-05, 'epoch': 0.48} {'loss': 0.612, 'learning_rate': 1.779058684802455e-05, 'epoch': 0.48} {'loss': 0.6168, 'learning_rate': 1.7790376202098777e-05, 'epoch': 0.48} {'loss': 0.6772, 'learning_rate': 1.7790165547379147e-05, 'epoch': 0.48} {'loss': 0.5479, 'learning_rate': 1.7789954883865906e-05, 'epoch': 0.48} {'loss': 0.5298, 'learning_rate': 1.7789744211559286e-05, 'epoch': 0.48} {'loss': 0.586, 'learning_rate': 1.7789533530459526e-05, 'epoch': 0.48} {'loss': 0.7077, 'learning_rate': 1.7789322840566867e-05, 'epoch': 0.48} {'loss': 0.5701, 'learning_rate': 1.778911214188154e-05, 'epoch': 0.48} {'loss': 0.5192, 'learning_rate': 1.7788901434403786e-05, 'epoch': 0.48} {'loss': 0.5736, 'learning_rate': 1.7788690718133842e-05, 'epoch': 0.48} {'loss': 0.5239, 'learning_rate': 1.778847999307195e-05, 'epoch': 0.48} {'loss': 0.4838, 'learning_rate': 1.7788269259218346e-05, 'epoch': 0.48} {'loss': 0.5996, 'learning_rate': 1.7788058516573267e-05, 'epoch': 0.48} {'loss': 0.6754, 'learning_rate': 1.7787847765136948e-05, 'epoch': 0.48} {'loss': 0.6874, 'learning_rate': 1.7787637004909633e-05, 'epoch': 0.48} {'loss': 0.4433, 'learning_rate': 1.7787426235891557e-05, 'epoch': 0.48} {'loss': 0.5927, 'learning_rate': 1.7787215458082956e-05, 'epoch': 0.48} {'loss': 0.454, 'learning_rate': 1.778700467148407e-05, 'epoch': 0.48} {'loss': 0.6604, 'learning_rate': 1.7786793876095134e-05, 'epoch': 0.48} {'loss': 0.5497, 'learning_rate': 1.778658307191639e-05, 'epoch': 0.48} {'loss': 0.5705, 'learning_rate': 1.778637225894808e-05, 'epoch': 0.48} {'loss': 0.7052, 'learning_rate': 1.7786161437190427e-05, 'epoch': 0.48} {'loss': 0.6475, 'learning_rate': 1.7785950606643684e-05, 'epoch': 0.48} {'loss': 0.4147, 'learning_rate': 1.778573976730808e-05, 'epoch': 0.48} {'loss': 0.6414, 'learning_rate': 1.778552891918386e-05, 'epoch': 0.48} {'loss': 0.6966, 'learning_rate': 1.7785318062271257e-05, 'epoch': 0.48} {'loss': 0.6131, 'learning_rate': 1.778510719657051e-05, 'epoch': 0.48} {'loss': 0.5464, 'learning_rate': 1.7784896322081858e-05, 'epoch': 0.48} {'loss': 0.4544, 'learning_rate': 1.778468543880554e-05, 'epoch': 0.48} {'loss': 0.5737, 'learning_rate': 1.7784474546741788e-05, 'epoch': 0.48} {'loss': 0.7691, 'learning_rate': 1.7784263645890846e-05, 'epoch': 0.48} {'loss': 0.4121, 'learning_rate': 1.7784052736252954e-05, 'epoch': 0.48} {'loss': 0.6048, 'learning_rate': 1.7783841817828342e-05, 'epoch': 0.48} {'loss': 0.5401, 'learning_rate': 1.7783630890617254e-05, 'epoch': 0.48} {'loss': 0.5214, 'learning_rate': 1.7783419954619927e-05, 'epoch': 0.48} {'loss': 0.6843, 'learning_rate': 1.77832090098366e-05, 'epoch': 0.48} {'loss': 0.6083, 'learning_rate': 1.7782998056267508e-05, 'epoch': 0.48} {'loss': 0.535, 'learning_rate': 1.7782787093912897e-05, 'epoch': 0.48} {'loss': 0.6343, 'learning_rate': 1.7782576122772993e-05, 'epoch': 0.48} {'loss': 0.4828, 'learning_rate': 1.7782365142848043e-05, 'epoch': 0.48} {'loss': 0.4694, 'learning_rate': 1.7782154154138283e-05, 'epoch': 0.48} {'loss': 0.6373, 'learning_rate': 1.778194315664395e-05, 'epoch': 0.48} {'loss': 0.746, 'learning_rate': 1.7781732150365282e-05, 'epoch': 0.48} {'loss': 0.6452, 'learning_rate': 1.778152113530252e-05, 'epoch': 0.48} {'loss': 0.8067, 'learning_rate': 1.77813101114559e-05, 'epoch': 0.48} {'loss': 0.5754, 'learning_rate': 1.7781099078825657e-05, 'epoch': 0.48} {'loss': 0.5208, 'learning_rate': 1.7780888037412037e-05, 'epoch': 0.48} {'loss': 0.5192, 'learning_rate': 1.7780676987215275e-05, 'epoch': 0.48} {'loss': 0.6608, 'learning_rate': 1.7780465928235605e-05, 'epoch': 0.48} {'loss': 0.7046, 'learning_rate': 1.778025486047327e-05, 'epoch': 0.48} {'loss': 0.6354, 'learning_rate': 1.778004378392851e-05, 'epoch': 0.48} {'loss': 0.4936, 'learning_rate': 1.7779832698601556e-05, 'epoch': 0.48} {'loss': 0.6069, 'learning_rate': 1.7779621604492648e-05, 'epoch': 0.48} {'loss': 0.638, 'learning_rate': 1.777941050160203e-05, 'epoch': 0.48} {'loss': 0.6376, 'learning_rate': 1.7779199389929935e-05, 'epoch': 0.48} {'loss': 0.5131, 'learning_rate': 1.7778988269476608e-05, 'epoch': 0.48} {'loss': 0.8665, 'learning_rate': 1.7778777140242276e-05, 'epoch': 0.48} {'loss': 0.6627, 'learning_rate': 1.7778566002227188e-05, 'epoch': 0.48} {'loss': 0.6279, 'learning_rate': 1.7778354855431577e-05, 'epoch': 0.48} {'loss': 0.4526, 'learning_rate': 1.7778143699855683e-05, 'epoch': 0.48} {'loss': 0.3909, 'learning_rate': 1.7777932535499744e-05, 'epoch': 0.48} {'loss': 0.6359, 'learning_rate': 1.7777721362363997e-05, 'epoch': 0.48} {'loss': 0.4962, 'learning_rate': 1.777751018044868e-05, 'epoch': 0.48} {'loss': 0.4855, 'learning_rate': 1.7777298989754036e-05, 'epoch': 0.48} {'loss': 0.5486, 'learning_rate': 1.7777087790280297e-05, 'epoch': 0.48} {'loss': 0.5621, 'learning_rate': 1.777687658202771e-05, 'epoch': 0.48} {'loss': 0.8707, 'learning_rate': 1.7776665364996505e-05, 'epoch': 0.48} {'loss': 0.595, 'learning_rate': 1.7776454139186926e-05, 'epoch': 0.48} {'loss': 0.5936, 'learning_rate': 1.7776242904599206e-05, 'epoch': 0.48} {'loss': 0.5307, 'learning_rate': 1.7776031661233586e-05, 'epoch': 0.48} {'loss': 0.7141, 'learning_rate': 1.7775820409090308e-05, 'epoch': 0.48} {'loss': 0.5563, 'learning_rate': 1.7775609148169604e-05, 'epoch': 0.48} {'loss': 0.7048, 'learning_rate': 1.7775397878471715e-05, 'epoch': 0.48} {'loss': 0.5571, 'learning_rate': 1.7775186599996886e-05, 'epoch': 0.48} {'loss': 0.7406, 'learning_rate': 1.7774975312745347e-05, 'epoch': 0.48} {'loss': 0.5707, 'learning_rate': 1.777476401671734e-05, 'epoch': 0.48} {'loss': 0.6549, 'learning_rate': 1.77745527119131e-05, 'epoch': 0.48} {'loss': 0.5582, 'learning_rate': 1.7774341398332872e-05, 'epoch': 0.48} {'loss': 0.4725, 'learning_rate': 1.777413007597689e-05, 'epoch': 0.48} {'loss': 0.5972, 'learning_rate': 1.777391874484539e-05, 'epoch': 0.48} {'loss': 0.529, 'learning_rate': 1.7773707404938617e-05, 'epoch': 0.48} {'loss': 0.6262, 'learning_rate': 1.7773496056256805e-05, 'epoch': 0.48} {'loss': 0.5621, 'learning_rate': 1.7773284698800197e-05, 'epoch': 0.48} {'loss': 0.4907, 'learning_rate': 1.777307333256903e-05, 'epoch': 0.48} {'loss': 0.757, 'learning_rate': 1.7772861957563537e-05, 'epoch': 0.48} {'loss': 0.6484, 'learning_rate': 1.7772650573783964e-05, 'epoch': 0.48} {'loss': 0.6195, 'learning_rate': 1.7772439181230542e-05, 'epoch': 0.48} {'loss': 0.6152, 'learning_rate': 1.777222777990352e-05, 'epoch': 0.48} {'loss': 0.5799, 'learning_rate': 1.7772016369803125e-05, 'epoch': 0.48} {'loss': 0.661, 'learning_rate': 1.7771804950929604e-05, 'epoch': 0.48} {'loss': 0.6286, 'learning_rate': 1.7771593523283198e-05, 'epoch': 0.48} {'loss': 0.7307, 'learning_rate': 1.7771382086864135e-05, 'epoch': 0.48} {'loss': 0.7092, 'learning_rate': 1.777117064167266e-05, 'epoch': 0.48} {'loss': 0.5206, 'learning_rate': 1.777095918770901e-05, 'epoch': 0.48} {'loss': 0.6959, 'learning_rate': 1.777074772497343e-05, 'epoch': 0.48} {'loss': 0.6007, 'learning_rate': 1.7770536253466146e-05, 'epoch': 0.48} {'loss': 0.614, 'learning_rate': 1.777032477318741e-05, 'epoch': 0.48} {'loss': 0.6105, 'learning_rate': 1.7770113284137453e-05, 'epoch': 0.48} {'loss': 0.4814, 'learning_rate': 1.7769901786316518e-05, 'epoch': 0.48} {'loss': 0.5373, 'learning_rate': 1.7769690279724838e-05, 'epoch': 0.48} {'loss': 0.5395, 'learning_rate': 1.7769478764362657e-05, 'epoch': 0.48} {'loss': 0.6127, 'learning_rate': 1.7769267240230212e-05, 'epoch': 0.48} {'loss': 0.572, 'learning_rate': 1.7769055707327737e-05, 'epoch': 0.48} {'loss': 0.6557, 'learning_rate': 1.7768844165655482e-05, 'epoch': 0.48} {'loss': 0.5377, 'learning_rate': 1.7768632615213676e-05, 'epoch': 0.48} {'loss': 0.5331, 'learning_rate': 1.7768421056002564e-05, 'epoch': 0.48} {'loss': 0.5254, 'learning_rate': 1.7768209488022378e-05, 'epoch': 0.48} {'loss': 0.7043, 'learning_rate': 1.776799791127336e-05, 'epoch': 0.48} {'loss': 0.5269, 'learning_rate': 1.7767786325755754e-05, 'epoch': 0.48} {'loss': 0.6538, 'learning_rate': 1.7767574731469794e-05, 'epoch': 0.48} {'loss': 0.543, 'learning_rate': 1.7767363128415715e-05, 'epoch': 0.48} {'loss': 0.5343, 'learning_rate': 1.7767151516593764e-05, 'epoch': 0.48} {'loss': 0.6881, 'learning_rate': 1.7766939896004175e-05, 'epoch': 0.48} {'loss': 0.4241, 'learning_rate': 1.7766728266647185e-05, 'epoch': 0.48} {'loss': 0.6672, 'learning_rate': 1.7766516628523042e-05, 'epoch': 0.48} {'loss': 0.6176, 'learning_rate': 1.7766304981631972e-05, 'epoch': 0.48} {'loss': 0.5781, 'learning_rate': 1.7766093325974223e-05, 'epoch': 0.48} {'loss': 0.6427, 'learning_rate': 1.7765881661550032e-05, 'epoch': 0.48} {'loss': 0.616, 'learning_rate': 1.7765669988359636e-05, 'epoch': 0.48} {'loss': 0.5178, 'learning_rate': 1.7765458306403276e-05, 'epoch': 0.48} {'loss': 0.5315, 'learning_rate': 1.7765246615681188e-05, 'epoch': 0.48} {'loss': 0.5538, 'learning_rate': 1.7765034916193618e-05, 'epoch': 0.48} {'loss': 0.585, 'learning_rate': 1.7764823207940794e-05, 'epoch': 0.48} {'loss': 0.6755, 'learning_rate': 1.776461149092297e-05, 'epoch': 0.48} {'loss': 0.7192, 'learning_rate': 1.7764399765140368e-05, 'epoch': 0.48} {'loss': 0.488, 'learning_rate': 1.776418803059324e-05, 'epoch': 0.48} {'loss': 0.4495, 'learning_rate': 1.7763976287281818e-05, 'epoch': 0.48} {'loss': 0.5592, 'learning_rate': 1.7763764535206342e-05, 'epoch': 0.48} {'loss': 0.511, 'learning_rate': 1.7763552774367054e-05, 'epoch': 0.48} {'loss': 0.6312, 'learning_rate': 1.7763341004764193e-05, 'epoch': 0.48} {'loss': 0.7557, 'learning_rate': 1.7763129226397994e-05, 'epoch': 0.48} {'loss': 0.3118, 'learning_rate': 1.7762917439268697e-05, 'epoch': 0.48} {'loss': 0.5226, 'learning_rate': 1.7762705643376542e-05, 'epoch': 0.48} {'loss': 0.6237, 'learning_rate': 1.7762493838721774e-05, 'epoch': 0.48} {'loss': 0.3995, 'learning_rate': 1.776228202530462e-05, 'epoch': 0.48} {'loss': 0.6729, 'learning_rate': 1.776207020312533e-05, 'epoch': 0.48} {'loss': 0.7387, 'learning_rate': 1.7761858372184138e-05, 'epoch': 0.48} {'loss': 0.5287, 'learning_rate': 1.776164653248128e-05, 'epoch': 0.48} {'loss': 0.4317, 'learning_rate': 1.7761434684017003e-05, 'epoch': 0.48} {'loss': 0.408, 'learning_rate': 1.7761222826791542e-05, 'epoch': 0.48} {'loss': 0.7308, 'learning_rate': 1.7761010960805138e-05, 'epoch': 0.48} {'loss': 0.6067, 'learning_rate': 1.7760799086058024e-05, 'epoch': 0.48} {'loss': 0.6606, 'learning_rate': 1.7760587202550445e-05, 'epoch': 0.48} {'loss': 0.4527, 'learning_rate': 1.7760375310282638e-05, 'epoch': 0.48} {'loss': 0.5037, 'learning_rate': 1.7760163409254846e-05, 'epoch': 0.48} {'loss': 0.4456, 'learning_rate': 1.7759951499467304e-05, 'epoch': 0.48} {'loss': 0.6102, 'learning_rate': 1.775973958092025e-05, 'epoch': 0.48} {'loss': 0.6952, 'learning_rate': 1.7759527653613928e-05, 'epoch': 0.48} {'loss': 0.6359, 'learning_rate': 1.7759315717548578e-05, 'epoch': 0.48} {'loss': 0.5052, 'learning_rate': 1.775910377272443e-05, 'epoch': 0.48} {'loss': 0.4786, 'learning_rate': 1.7758891819141734e-05, 'epoch': 0.48} {'loss': 0.6566, 'learning_rate': 1.775867985680072e-05, 'epoch': 0.48} {'loss': 0.661, 'learning_rate': 1.7758467885701637e-05, 'epoch': 0.48} {'loss': 0.4732, 'learning_rate': 1.7758255905844714e-05, 'epoch': 0.48} {'loss': 0.7817, 'learning_rate': 1.7758043917230196e-05, 'epoch': 0.48} {'loss': 0.6372, 'learning_rate': 1.7757831919858322e-05, 'epoch': 0.48} {'loss': 0.6649, 'learning_rate': 1.7757619913729334e-05, 'epoch': 0.48} {'loss': 0.6685, 'learning_rate': 1.775740789884347e-05, 'epoch': 0.48} {'loss': 0.6148, 'learning_rate': 1.7757195875200963e-05, 'epoch': 0.48} {'loss': 0.6696, 'learning_rate': 1.7756983842802058e-05, 'epoch': 0.48} {'loss': 0.6316, 'learning_rate': 1.7756771801646994e-05, 'epoch': 0.48} {'loss': 0.6688, 'learning_rate': 1.7756559751736008e-05, 'epoch': 0.48} {'loss': 0.6227, 'learning_rate': 1.7756347693069344e-05, 'epoch': 0.48} {'loss': 0.5293, 'learning_rate': 1.7756135625647232e-05, 'epoch': 0.48} {'loss': 0.5833, 'learning_rate': 1.7755923549469924e-05, 'epoch': 0.48} {'loss': 0.5021, 'learning_rate': 1.775571146453765e-05, 'epoch': 0.48} {'loss': 0.6324, 'learning_rate': 1.7755499370850655e-05, 'epoch': 0.48} {'loss': 0.555, 'learning_rate': 1.7755287268409176e-05, 'epoch': 0.48} {'loss': 0.517, 'learning_rate': 1.775507515721345e-05, 'epoch': 0.48} {'loss': 0.5946, 'learning_rate': 1.775486303726372e-05, 'epoch': 0.48} {'loss': 0.493, 'learning_rate': 1.7754650908560226e-05, 'epoch': 0.48} {'loss': 0.638, 'learning_rate': 1.7754438771103204e-05, 'epoch': 0.48} {'loss': 0.5774, 'learning_rate': 1.7754226624892897e-05, 'epoch': 0.48} {'loss': 0.5222, 'learning_rate': 1.775401446992954e-05, 'epoch': 0.48} {'loss': 0.7081, 'learning_rate': 1.7753802306213376e-05, 'epoch': 0.48} {'loss': 0.6727, 'learning_rate': 1.7753590133744644e-05, 'epoch': 0.48} {'loss': 0.6289, 'learning_rate': 1.775337795252358e-05, 'epoch': 0.48} {'loss': 0.4021, 'learning_rate': 1.7753165762550432e-05, 'epoch': 0.48} {'loss': 0.5269, 'learning_rate': 1.7752953563825434e-05, 'epoch': 0.48} {'loss': 0.5434, 'learning_rate': 1.775274135634882e-05, 'epoch': 0.48} {'loss': 0.6928, 'learning_rate': 1.775252914012084e-05, 'epoch': 0.48} {'loss': 0.5077, 'learning_rate': 1.7752316915141728e-05, 'epoch': 0.48} {'loss': 0.6488, 'learning_rate': 1.7752104681411724e-05, 'epoch': 0.48} {'loss': 0.478, 'learning_rate': 1.7751892438931067e-05, 'epoch': 0.48} {'loss': 0.5851, 'learning_rate': 1.77516801877e-05, 'epoch': 0.48} {'loss': 0.4996, 'learning_rate': 1.7751467927718762e-05, 'epoch': 0.48} {'loss': 0.5555, 'learning_rate': 1.775125565898759e-05, 'epoch': 0.48} {'loss': 0.4468, 'learning_rate': 1.7751043381506717e-05, 'epoch': 0.48} {'loss': 0.6031, 'learning_rate': 1.7750831095276395e-05, 'epoch': 0.48} {'loss': 0.5326, 'learning_rate': 1.775061880029686e-05, 'epoch': 0.48} {'loss': 0.6458, 'learning_rate': 1.7750406496568347e-05, 'epoch': 0.48} {'loss': 0.6105, 'learning_rate': 1.77501941840911e-05, 'epoch': 0.48} {'loss': 0.5249, 'learning_rate': 1.7749981862865358e-05, 'epoch': 0.48} {'loss': 0.6684, 'learning_rate': 1.774976953289136e-05, 'epoch': 0.48} {'loss': 0.5949, 'learning_rate': 1.7749557194169346e-05, 'epoch': 0.48} {'loss': 0.6488, 'learning_rate': 1.7749344846699555e-05, 'epoch': 0.48} {'loss': 0.5469, 'learning_rate': 1.7749132490482228e-05, 'epoch': 0.48} {'loss': 0.4381, 'learning_rate': 1.7748920125517605e-05, 'epoch': 0.48} {'loss': 0.6015, 'learning_rate': 1.7748707751805923e-05, 'epoch': 0.48} {'loss': 0.647, 'learning_rate': 1.7748495369347423e-05, 'epoch': 0.48} {'loss': 0.6669, 'learning_rate': 1.774828297814235e-05, 'epoch': 0.48} {'loss': 0.5303, 'learning_rate': 1.7748070578190932e-05, 'epoch': 0.48} {'loss': 0.6398, 'learning_rate': 1.774785816949342e-05, 'epoch': 0.48} {'loss': 0.6742, 'learning_rate': 1.774764575205005e-05, 'epoch': 0.48} {'loss': 0.6467, 'learning_rate': 1.774743332586106e-05, 'epoch': 0.48} {'loss': 0.5853, 'learning_rate': 1.774722089092669e-05, 'epoch': 0.48} {'loss': 0.562, 'learning_rate': 1.774700844724718e-05, 'epoch': 0.48} {'loss': 0.6954, 'learning_rate': 1.7746795994822772e-05, 'epoch': 0.48} {'loss': 0.6509, 'learning_rate': 1.7746583533653702e-05, 'epoch': 0.48} {'loss': 0.5767, 'learning_rate': 1.7746371063740216e-05, 'epoch': 0.48} {'loss': 0.69, 'learning_rate': 1.7746158585082548e-05, 'epoch': 0.48} {'loss': 0.6233, 'learning_rate': 1.7745946097680942e-05, 'epoch': 0.48} {'loss': 0.4967, 'learning_rate': 1.7745733601535632e-05, 'epoch': 0.48} {'loss': 0.6277, 'learning_rate': 1.7745521096646868e-05, 'epoch': 0.48} {'loss': 0.5154, 'learning_rate': 1.7745308583014878e-05, 'epoch': 0.48} {'loss': 0.5852, 'learning_rate': 1.7745096060639908e-05, 'epoch': 0.48} {'loss': 0.7521, 'learning_rate': 1.77448835295222e-05, 'epoch': 0.48} {'loss': 0.6146, 'learning_rate': 1.774467098966199e-05, 'epoch': 0.48} {'loss': 0.6279, 'learning_rate': 1.7744458441059516e-05, 'epoch': 0.48} {'loss': 0.6957, 'learning_rate': 1.7744245883715025e-05, 'epoch': 0.48} {'loss': 0.4741, 'learning_rate': 1.774403331762875e-05, 'epoch': 0.48} {'loss': 0.3879, 'learning_rate': 1.7743820742800938e-05, 'epoch': 0.48} {'loss': 0.4827, 'learning_rate': 1.7743608159231826e-05, 'epoch': 0.48} {'loss': 0.7041, 'learning_rate': 1.774339556692165e-05, 'epoch': 0.48} {'loss': 0.5846, 'learning_rate': 1.774318296587065e-05, 'epoch': 0.48} {'loss': 0.6677, 'learning_rate': 1.7742970356079072e-05, 'epoch': 0.48} {'loss': 0.7052, 'learning_rate': 1.7742757737547154e-05, 'epoch': 0.48} {'loss': 0.5006, 'learning_rate': 1.7742545110275133e-05, 'epoch': 0.48} {'loss': 0.7124, 'learning_rate': 1.774233247426325e-05, 'epoch': 0.48} {'loss': 0.6451, 'learning_rate': 1.774211982951175e-05, 'epoch': 0.48} {'loss': 0.6564, 'learning_rate': 1.7741907176020866e-05, 'epoch': 0.48} {'loss': 0.5874, 'learning_rate': 1.774169451379084e-05, 'epoch': 0.48} {'loss': 0.5286, 'learning_rate': 1.7741481842821914e-05, 'epoch': 0.48} {'loss': 0.3824, 'learning_rate': 1.7741269163114328e-05, 'epoch': 0.48} {'loss': 0.5542, 'learning_rate': 1.774105647466832e-05, 'epoch': 0.49} {'loss': 0.7281, 'learning_rate': 1.774084377748413e-05, 'epoch': 0.49} {'loss': 0.6004, 'learning_rate': 1.7740631071562e-05, 'epoch': 0.49} {'loss': 0.6091, 'learning_rate': 1.774041835690217e-05, 'epoch': 0.49} {'loss': 0.5453, 'learning_rate': 1.7740205633504883e-05, 'epoch': 0.49} {'loss': 0.7515, 'learning_rate': 1.7739992901370373e-05, 'epoch': 0.49} {'loss': 0.3974, 'learning_rate': 1.7739780160498884e-05, 'epoch': 0.49} {'loss': 0.6111, 'learning_rate': 1.7739567410890653e-05, 'epoch': 0.49} {'loss': 0.4435, 'learning_rate': 1.773935465254592e-05, 'epoch': 0.49} {'loss': 0.6293, 'learning_rate': 1.7739141885464932e-05, 'epoch': 0.49} {'loss': 0.5882, 'learning_rate': 1.7738929109647924e-05, 'epoch': 0.49} {'loss': 0.645, 'learning_rate': 1.7738716325095132e-05, 'epoch': 0.49} {'loss': 0.6026, 'learning_rate': 1.7738503531806805e-05, 'epoch': 0.49} {'loss': 0.5882, 'learning_rate': 1.773829072978318e-05, 'epoch': 0.49} {'loss': 0.4849, 'learning_rate': 1.7738077919024492e-05, 'epoch': 0.49} {'loss': 0.6346, 'learning_rate': 1.773786509953099e-05, 'epoch': 0.49} {'loss': 0.7598, 'learning_rate': 1.7737652271302908e-05, 'epoch': 0.49} {'loss': 0.407, 'learning_rate': 1.7737439434340488e-05, 'epoch': 0.49} {'loss': 0.5417, 'learning_rate': 1.773722658864397e-05, 'epoch': 0.49} {'loss': 0.4981, 'learning_rate': 1.7737013734213592e-05, 'epoch': 0.49} {'loss': 0.8004, 'learning_rate': 1.77368008710496e-05, 'epoch': 0.49} {'loss': 0.7394, 'learning_rate': 1.773658799915223e-05, 'epoch': 0.49} {'loss': 0.7353, 'learning_rate': 1.7736375118521722e-05, 'epoch': 0.49} {'loss': 0.5176, 'learning_rate': 1.773616222915832e-05, 'epoch': 0.49} {'loss': 0.4711, 'learning_rate': 1.773594933106226e-05, 'epoch': 0.49} {'loss': 0.5725, 'learning_rate': 1.7735736424233787e-05, 'epoch': 0.49} {'loss': 0.3867, 'learning_rate': 1.7735523508673137e-05, 'epoch': 0.49} {'loss': 0.5315, 'learning_rate': 1.7735310584380553e-05, 'epoch': 0.49} {'loss': 0.6391, 'learning_rate': 1.7735097651356272e-05, 'epoch': 0.49} {'loss': 0.5582, 'learning_rate': 1.773488470960054e-05, 'epoch': 0.49} {'loss': 0.5358, 'learning_rate': 1.773467175911359e-05, 'epoch': 0.49} {'loss': 0.6976, 'learning_rate': 1.7734458799895668e-05, 'epoch': 0.49} {'loss': 0.448, 'learning_rate': 1.7734245831947013e-05, 'epoch': 0.49} {'loss': 0.648, 'learning_rate': 1.7734032855267863e-05, 'epoch': 0.49} {'loss': 0.5873, 'learning_rate': 1.7733819869858464e-05, 'epoch': 0.49} {'loss': 0.5466, 'learning_rate': 1.7733606875719052e-05, 'epoch': 0.49} {'loss': 0.7298, 'learning_rate': 1.7733393872849867e-05, 'epoch': 0.49} {'loss': 0.5896, 'learning_rate': 1.7733180861251154e-05, 'epoch': 0.49} {'loss': 0.6221, 'learning_rate': 1.7732967840923147e-05, 'epoch': 0.49} {'loss': 0.5851, 'learning_rate': 1.7732754811866092e-05, 'epoch': 0.49} {'loss': 0.571, 'learning_rate': 1.7732541774080228e-05, 'epoch': 0.49} {'loss': 0.6182, 'learning_rate': 1.7732328727565794e-05, 'epoch': 0.49} {'loss': 0.7119, 'learning_rate': 1.773211567232303e-05, 'epoch': 0.49} {'loss': 0.4937, 'learning_rate': 1.7731902608352176e-05, 'epoch': 0.49} {'loss': 0.5597, 'learning_rate': 1.7731689535653476e-05, 'epoch': 0.49} {'loss': 0.5873, 'learning_rate': 1.773147645422717e-05, 'epoch': 0.49} {'loss': 0.6583, 'learning_rate': 1.7731263364073497e-05, 'epoch': 0.49} {'loss': 0.6349, 'learning_rate': 1.7731050265192697e-05, 'epoch': 0.49} {'loss': 0.5714, 'learning_rate': 1.7730837157585012e-05, 'epoch': 0.49} {'loss': 0.587, 'learning_rate': 1.7730624041250682e-05, 'epoch': 0.49} {'loss': 0.5484, 'learning_rate': 1.7730410916189948e-05, 'epoch': 0.49} {'loss': 0.4798, 'learning_rate': 1.773019778240305e-05, 'epoch': 0.49} {'loss': 0.5313, 'learning_rate': 1.7729984639890224e-05, 'epoch': 0.49} {'loss': 0.5124, 'learning_rate': 1.772977148865172e-05, 'epoch': 0.49} {'loss': 0.3379, 'learning_rate': 1.7729558328687773e-05, 'epoch': 0.49} {'loss': 0.572, 'learning_rate': 1.7729345159998625e-05, 'epoch': 0.49} {'loss': 0.7177, 'learning_rate': 1.7729131982584515e-05, 'epoch': 0.49} {'loss': 0.4783, 'learning_rate': 1.7728918796445688e-05, 'epoch': 0.49} {'loss': 0.6623, 'learning_rate': 1.7728705601582378e-05, 'epoch': 0.49} {'loss': 0.5621, 'learning_rate': 1.772849239799483e-05, 'epoch': 0.49} {'loss': 0.7676, 'learning_rate': 1.772827918568328e-05, 'epoch': 0.49} {'loss': 0.4838, 'learning_rate': 1.772806596464798e-05, 'epoch': 0.49} {'loss': 0.5253, 'learning_rate': 1.772785273488916e-05, 'epoch': 0.49} {'loss': 0.7863, 'learning_rate': 1.772763949640706e-05, 'epoch': 0.49} {'loss': 0.7038, 'learning_rate': 1.7727426249201928e-05, 'epoch': 0.49} {'loss': 0.7001, 'learning_rate': 1.7727212993274e-05, 'epoch': 0.49} {'loss': 0.5496, 'learning_rate': 1.772699972862352e-05, 'epoch': 0.49} {'loss': 0.5414, 'learning_rate': 1.7726786455250725e-05, 'epoch': 0.49} {'loss': 0.7194, 'learning_rate': 1.7726573173155856e-05, 'epoch': 0.49} {'loss': 0.5001, 'learning_rate': 1.7726359882339156e-05, 'epoch': 0.49} {'loss': 0.5659, 'learning_rate': 1.7726146582800866e-05, 'epoch': 0.49} {'loss': 0.6451, 'learning_rate': 1.7725933274541226e-05, 'epoch': 0.49} {'loss': 0.8032, 'learning_rate': 1.7725719957560478e-05, 'epoch': 0.49} {'loss': 0.5326, 'learning_rate': 1.772550663185886e-05, 'epoch': 0.49} {'loss': 0.4875, 'learning_rate': 1.772529329743661e-05, 'epoch': 0.49} {'loss': 0.6785, 'learning_rate': 1.7725079954293976e-05, 'epoch': 0.49} {'loss': 0.5441, 'learning_rate': 1.7724866602431195e-05, 'epoch': 0.49} {'loss': 0.6341, 'learning_rate': 1.772465324184851e-05, 'epoch': 0.49} {'loss': 0.7353, 'learning_rate': 1.7724439872546158e-05, 'epoch': 0.49} {'loss': 0.4384, 'learning_rate': 1.7724226494524387e-05, 'epoch': 0.49} {'loss': 0.6102, 'learning_rate': 1.7724013107783432e-05, 'epoch': 0.49} {'loss': 0.5338, 'learning_rate': 1.772379971232353e-05, 'epoch': 0.49} {'loss': 0.418, 'learning_rate': 1.7723586308144927e-05, 'epoch': 0.49} {'loss': 0.6512, 'learning_rate': 1.772337289524787e-05, 'epoch': 0.49} {'loss': 0.602, 'learning_rate': 1.772315947363259e-05, 'epoch': 0.49} {'loss': 0.6751, 'learning_rate': 1.7722946043299333e-05, 'epoch': 0.49} {'loss': 0.532, 'learning_rate': 1.7722732604248337e-05, 'epoch': 0.49} {'loss': 0.6516, 'learning_rate': 1.7722519156479844e-05, 'epoch': 0.49} {'loss': 0.6687, 'learning_rate': 1.7722305699994098e-05, 'epoch': 0.49} {'loss': 0.628, 'learning_rate': 1.7722092234791335e-05, 'epoch': 0.49} {'loss': 0.564, 'learning_rate': 1.77218787608718e-05, 'epoch': 0.49} {'loss': 0.5898, 'learning_rate': 1.7721665278235728e-05, 'epoch': 0.49} {'loss': 0.4659, 'learning_rate': 1.7721451786883368e-05, 'epoch': 0.49} {'loss': 0.5793, 'learning_rate': 1.7721238286814958e-05, 'epoch': 0.49} {'loss': 0.4109, 'learning_rate': 1.7721024778030734e-05, 'epoch': 0.49} {'loss': 0.5784, 'learning_rate': 1.7720811260530948e-05, 'epoch': 0.49} {'loss': 0.6267, 'learning_rate': 1.772059773431583e-05, 'epoch': 0.49} {'loss': 0.506, 'learning_rate': 1.7720384199385627e-05, 'epoch': 0.49} {'loss': 0.5475, 'learning_rate': 1.7720170655740576e-05, 'epoch': 0.49} {'loss': 0.574, 'learning_rate': 1.771995710338092e-05, 'epoch': 0.49} {'loss': 0.4642, 'learning_rate': 1.7719743542306905e-05, 'epoch': 0.49} {'loss': 0.5653, 'learning_rate': 1.7719529972518762e-05, 'epoch': 0.49} {'loss': 0.503, 'learning_rate': 1.771931639401674e-05, 'epoch': 0.49} {'loss': 0.6709, 'learning_rate': 1.7719102806801078e-05, 'epoch': 0.49} {'loss': 0.5982, 'learning_rate': 1.7718889210872017e-05, 'epoch': 0.49} {'loss': 0.5831, 'learning_rate': 1.7718675606229797e-05, 'epoch': 0.49} {'loss': 0.5191, 'learning_rate': 1.771846199287466e-05, 'epoch': 0.49} {'loss': 0.5622, 'learning_rate': 1.7718248370806847e-05, 'epoch': 0.49} {'loss': 0.4897, 'learning_rate': 1.7718034740026603e-05, 'epoch': 0.49} {'loss': 0.7349, 'learning_rate': 1.7717821100534157e-05, 'epoch': 0.49} {'loss': 0.6804, 'learning_rate': 1.7717607452329767e-05, 'epoch': 0.49} {'loss': 0.518, 'learning_rate': 1.7717393795413663e-05, 'epoch': 0.49} {'loss': 0.498, 'learning_rate': 1.771718012978609e-05, 'epoch': 0.49} {'loss': 0.667, 'learning_rate': 1.7716966455447285e-05, 'epoch': 0.49} {'loss': 0.4571, 'learning_rate': 1.7716752772397494e-05, 'epoch': 0.49} {'loss': 0.4764, 'learning_rate': 1.7716539080636956e-05, 'epoch': 0.49} {'loss': 0.4505, 'learning_rate': 1.7716325380165914e-05, 'epoch': 0.49} {'loss': 0.5407, 'learning_rate': 1.7716111670984605e-05, 'epoch': 0.49} {'loss': 0.5939, 'learning_rate': 1.7715897953093276e-05, 'epoch': 0.49} {'loss': 0.5861, 'learning_rate': 1.7715684226492165e-05, 'epoch': 0.49} {'loss': 0.5443, 'learning_rate': 1.7715470491181516e-05, 'epoch': 0.49} {'loss': 0.5285, 'learning_rate': 1.7715256747161565e-05, 'epoch': 0.49} {'loss': 0.6382, 'learning_rate': 1.7715042994432557e-05, 'epoch': 0.49} {'loss': 0.4797, 'learning_rate': 1.7714829232994733e-05, 'epoch': 0.49} {'loss': 0.5729, 'learning_rate': 1.771461546284833e-05, 'epoch': 0.49} {'loss': 0.5112, 'learning_rate': 1.7714401683993596e-05, 'epoch': 0.49} {'loss': 0.5392, 'learning_rate': 1.7714187896430772e-05, 'epoch': 0.49} {'loss': 0.358, 'learning_rate': 1.7713974100160097e-05, 'epoch': 0.49} {'loss': 0.5279, 'learning_rate': 1.7713760295181807e-05, 'epoch': 0.49} {'loss': 0.7252, 'learning_rate': 1.771354648149615e-05, 'epoch': 0.49} {'loss': 0.592, 'learning_rate': 1.771333265910337e-05, 'epoch': 0.49} {'loss': 0.6111, 'learning_rate': 1.77131188280037e-05, 'epoch': 0.49} {'loss': 0.768, 'learning_rate': 1.7712904988197387e-05, 'epoch': 0.49} {'loss': 0.4769, 'learning_rate': 1.771269113968467e-05, 'epoch': 0.49} {'loss': 0.5866, 'learning_rate': 1.7712477282465793e-05, 'epoch': 0.49} {'loss': 0.6345, 'learning_rate': 1.7712263416540993e-05, 'epoch': 0.49} {'loss': 0.6742, 'learning_rate': 1.7712049541910517e-05, 'epoch': 0.49} {'loss': 0.5032, 'learning_rate': 1.7711835658574603e-05, 'epoch': 0.49} {'loss': 0.6257, 'learning_rate': 1.7711621766533493e-05, 'epoch': 0.49} {'loss': 0.396, 'learning_rate': 1.7711407865787426e-05, 'epoch': 0.49} {'loss': 0.6691, 'learning_rate': 1.771119395633665e-05, 'epoch': 0.49} {'loss': 0.6193, 'learning_rate': 1.77109800381814e-05, 'epoch': 0.49} {'loss': 0.5149, 'learning_rate': 1.771076611132192e-05, 'epoch': 0.49} {'loss': 0.716, 'learning_rate': 1.771055217575845e-05, 'epoch': 0.49} {'loss': 0.4745, 'learning_rate': 1.7710338231491234e-05, 'epoch': 0.49} {'loss': 0.5923, 'learning_rate': 1.7710124278520514e-05, 'epoch': 0.49} {'loss': 0.6345, 'learning_rate': 1.7709910316846527e-05, 'epoch': 0.49} {'loss': 0.5491, 'learning_rate': 1.770969634646952e-05, 'epoch': 0.49} {'loss': 0.5994, 'learning_rate': 1.770948236738973e-05, 'epoch': 0.49} {'loss': 0.72, 'learning_rate': 1.7709268379607403e-05, 'epoch': 0.49} {'loss': 0.5004, 'learning_rate': 1.7709054383122774e-05, 'epoch': 0.49} {'loss': 0.6132, 'learning_rate': 1.770884037793609e-05, 'epoch': 0.49} {'loss': 0.4062, 'learning_rate': 1.7708626364047594e-05, 'epoch': 0.49} {'loss': 0.6845, 'learning_rate': 1.7708412341457522e-05, 'epoch': 0.49} {'loss': 0.525, 'learning_rate': 1.7708198310166117e-05, 'epoch': 0.49} {'loss': 0.4508, 'learning_rate': 1.7707984270173627e-05, 'epoch': 0.49} {'loss': 0.462, 'learning_rate': 1.7707770221480282e-05, 'epoch': 0.49} {'loss': 0.4468, 'learning_rate': 1.7707556164086334e-05, 'epoch': 0.49} {'loss': 0.4889, 'learning_rate': 1.770734209799202e-05, 'epoch': 0.49} {'loss': 0.4218, 'learning_rate': 1.770712802319758e-05, 'epoch': 0.49} {'loss': 0.6016, 'learning_rate': 1.770691393970326e-05, 'epoch': 0.49} {'loss': 0.67, 'learning_rate': 1.77066998475093e-05, 'epoch': 0.49} {'loss': 0.5566, 'learning_rate': 1.7706485746615944e-05, 'epoch': 0.49} {'loss': 0.6915, 'learning_rate': 1.7706271637023428e-05, 'epoch': 0.49} {'loss': 0.6678, 'learning_rate': 1.7706057518731998e-05, 'epoch': 0.49} {'loss': 0.6727, 'learning_rate': 1.7705843391741893e-05, 'epoch': 0.49} {'loss': 0.5772, 'learning_rate': 1.770562925605336e-05, 'epoch': 0.49} {'loss': 0.4881, 'learning_rate': 1.770541511166663e-05, 'epoch': 0.49} {'loss': 0.5794, 'learning_rate': 1.7705200958581956e-05, 'epoch': 0.49} {'loss': 0.6359, 'learning_rate': 1.7704986796799576e-05, 'epoch': 0.49} {'loss': 0.3457, 'learning_rate': 1.770477262631973e-05, 'epoch': 0.49} {'loss': 0.7453, 'learning_rate': 1.770455844714266e-05, 'epoch': 0.49} {'loss': 0.6906, 'learning_rate': 1.770434425926861e-05, 'epoch': 0.49} {'loss': 0.366, 'learning_rate': 1.7704130062697817e-05, 'epoch': 0.49} {'loss': 0.6572, 'learning_rate': 1.770391585743053e-05, 'epoch': 0.49} {'loss': 0.4642, 'learning_rate': 1.7703701643466987e-05, 'epoch': 0.49} {'loss': 0.501, 'learning_rate': 1.7703487420807427e-05, 'epoch': 0.49} {'loss': 0.5841, 'learning_rate': 1.77032731894521e-05, 'epoch': 0.49} {'loss': 0.5649, 'learning_rate': 1.7703058949401234e-05, 'epoch': 0.49} {'loss': 0.4912, 'learning_rate': 1.7702844700655086e-05, 'epoch': 0.49} {'loss': 0.6215, 'learning_rate': 1.7702630443213887e-05, 'epoch': 0.49} {'loss': 0.6209, 'learning_rate': 1.7702416177077885e-05, 'epoch': 0.49} {'loss': 0.5428, 'learning_rate': 1.770220190224732e-05, 'epoch': 0.49} {'loss': 0.593, 'learning_rate': 1.7701987618722435e-05, 'epoch': 0.49} {'loss': 0.6804, 'learning_rate': 1.7701773326503466e-05, 'epoch': 0.49} {'loss': 0.7003, 'learning_rate': 1.7701559025590662e-05, 'epoch': 0.49} {'loss': 0.3279, 'learning_rate': 1.7701344715984265e-05, 'epoch': 0.49} {'loss': 0.5438, 'learning_rate': 1.770113039768451e-05, 'epoch': 0.49} {'loss': 0.4789, 'learning_rate': 1.7700916070691648e-05, 'epoch': 0.49} {'loss': 0.5056, 'learning_rate': 1.7700701735005912e-05, 'epoch': 0.49} {'loss': 0.7234, 'learning_rate': 1.770048739062755e-05, 'epoch': 0.49} {'loss': 0.6065, 'learning_rate': 1.77002730375568e-05, 'epoch': 0.49} {'loss': 0.5372, 'learning_rate': 1.770005867579391e-05, 'epoch': 0.49} {'loss': 0.6137, 'learning_rate': 1.7699844305339114e-05, 'epoch': 0.49} {'loss': 0.5981, 'learning_rate': 1.769962992619266e-05, 'epoch': 0.49} {'loss': 0.5303, 'learning_rate': 1.7699415538354788e-05, 'epoch': 0.49} {'loss': 0.6746, 'learning_rate': 1.7699201141825737e-05, 'epoch': 0.49} {'loss': 0.4448, 'learning_rate': 1.7698986736605756e-05, 'epoch': 0.49} {'loss': 0.4744, 'learning_rate': 1.7698772322695078e-05, 'epoch': 0.49} {'loss': 0.6418, 'learning_rate': 1.7698557900093957e-05, 'epoch': 0.49} {'loss': 0.541, 'learning_rate': 1.7698343468802623e-05, 'epoch': 0.49} {'loss': 0.5442, 'learning_rate': 1.7698129028821328e-05, 'epoch': 0.49} {'loss': 0.5636, 'learning_rate': 1.76979145801503e-05, 'epoch': 0.49} {'loss': 0.4676, 'learning_rate': 1.76977001227898e-05, 'epoch': 0.49} {'loss': 0.477, 'learning_rate': 1.7697485656740054e-05, 'epoch': 0.49} {'loss': 0.5585, 'learning_rate': 1.7697271182001314e-05, 'epoch': 0.49} {'loss': 0.6719, 'learning_rate': 1.7697056698573818e-05, 'epoch': 0.49} {'loss': 0.7103, 'learning_rate': 1.7696842206457807e-05, 'epoch': 0.49} {'loss': 0.5959, 'learning_rate': 1.7696627705653526e-05, 'epoch': 0.49} {'loss': 0.4871, 'learning_rate': 1.7696413196161217e-05, 'epoch': 0.49} {'loss': 0.6093, 'learning_rate': 1.769619867798112e-05, 'epoch': 0.49} {'loss': 0.414, 'learning_rate': 1.7695984151113477e-05, 'epoch': 0.49} {'loss': 0.5835, 'learning_rate': 1.769576961555853e-05, 'epoch': 0.49} {'loss': 0.6289, 'learning_rate': 1.769555507131653e-05, 'epoch': 0.49} {'loss': 0.6607, 'learning_rate': 1.7695340518387704e-05, 'epoch': 0.49} {'loss': 0.5072, 'learning_rate': 1.7695125956772304e-05, 'epoch': 0.49} {'loss': 0.4178, 'learning_rate': 1.769491138647057e-05, 'epoch': 0.49} {'loss': 0.6917, 'learning_rate': 1.7694696807482744e-05, 'epoch': 0.49} {'loss': 0.6404, 'learning_rate': 1.769448221980907e-05, 'epoch': 0.49} {'loss': 0.5727, 'learning_rate': 1.769426762344979e-05, 'epoch': 0.49} {'loss': 0.7272, 'learning_rate': 1.769405301840514e-05, 'epoch': 0.49} {'loss': 0.6089, 'learning_rate': 1.7693838404675375e-05, 'epoch': 0.49} {'loss': 0.4415, 'learning_rate': 1.7693623782260723e-05, 'epoch': 0.49} {'loss': 0.699, 'learning_rate': 1.7693409151161432e-05, 'epoch': 0.49} {'loss': 0.6874, 'learning_rate': 1.769319451137775e-05, 'epoch': 0.49} {'loss': 0.5545, 'learning_rate': 1.769297986290991e-05, 'epoch': 0.49} {'loss': 0.4924, 'learning_rate': 1.7692765205758162e-05, 'epoch': 0.49} {'loss': 0.4743, 'learning_rate': 1.7692550539922745e-05, 'epoch': 0.49} {'loss': 0.6679, 'learning_rate': 1.76923358654039e-05, 'epoch': 0.49} {'loss': 0.632, 'learning_rate': 1.769212118220187e-05, 'epoch': 0.49} {'loss': 0.51, 'learning_rate': 1.7691906490316896e-05, 'epoch': 0.49} {'loss': 0.7297, 'learning_rate': 1.7691691789749224e-05, 'epoch': 0.49} {'loss': 0.4999, 'learning_rate': 1.7691477080499096e-05, 'epoch': 0.49} {'loss': 0.5304, 'learning_rate': 1.769126236256675e-05, 'epoch': 0.49} {'loss': 0.4667, 'learning_rate': 1.7691047635952438e-05, 'epoch': 0.49} {'loss': 0.689, 'learning_rate': 1.7690832900656388e-05, 'epoch': 0.49} {'loss': 0.5903, 'learning_rate': 1.7690618156678854e-05, 'epoch': 0.49} {'loss': 0.5268, 'learning_rate': 1.7690403404020073e-05, 'epoch': 0.49} {'loss': 0.6436, 'learning_rate': 1.769018864268029e-05, 'epoch': 0.49} {'loss': 0.5903, 'learning_rate': 1.7689973872659747e-05, 'epoch': 0.49} {'loss': 0.5362, 'learning_rate': 1.7689759093958684e-05, 'epoch': 0.49} {'loss': 0.5216, 'learning_rate': 1.7689544306577345e-05, 'epoch': 0.49} {'loss': 0.6017, 'learning_rate': 1.7689329510515976e-05, 'epoch': 0.49} {'loss': 0.5594, 'learning_rate': 1.7689114705774812e-05, 'epoch': 0.49} {'loss': 0.5272, 'learning_rate': 1.7688899892354102e-05, 'epoch': 0.49} {'loss': 0.5581, 'learning_rate': 1.768868507025409e-05, 'epoch': 0.49} {'loss': 0.6239, 'learning_rate': 1.7688470239475008e-05, 'epoch': 0.49} {'loss': 0.7143, 'learning_rate': 1.7688255400017108e-05, 'epoch': 0.49} {'loss': 0.6391, 'learning_rate': 1.768804055188063e-05, 'epoch': 0.49} {'loss': 0.7454, 'learning_rate': 1.7687825695065816e-05, 'epoch': 0.49} {'loss': 0.6795, 'learning_rate': 1.7687610829572905e-05, 'epoch': 0.49} {'loss': 0.5905, 'learning_rate': 1.768739595540215e-05, 'epoch': 0.49} {'loss': 0.5177, 'learning_rate': 1.7687181072553783e-05, 'epoch': 0.49} {'loss': 0.5169, 'learning_rate': 1.768696618102805e-05, 'epoch': 0.49} {'loss': 0.6828, 'learning_rate': 1.7686751280825196e-05, 'epoch': 0.49} {'loss': 0.5993, 'learning_rate': 1.7686536371945458e-05, 'epoch': 0.49} {'loss': 0.4314, 'learning_rate': 1.7686321454389084e-05, 'epoch': 0.49} {'loss': 0.5624, 'learning_rate': 1.768610652815631e-05, 'epoch': 0.49} {'loss': 0.6132, 'learning_rate': 1.7685891593247394e-05, 'epoch': 0.49} {'loss': 0.635, 'learning_rate': 1.768567664966256e-05, 'epoch': 0.49} {'loss': 0.533, 'learning_rate': 1.768546169740206e-05, 'epoch': 0.49} {'loss': 0.5584, 'learning_rate': 1.7685246736466136e-05, 'epoch': 0.49} {'loss': 0.6682, 'learning_rate': 1.768503176685503e-05, 'epoch': 0.49} {'loss': 0.5715, 'learning_rate': 1.7684816788568983e-05, 'epoch': 0.49} {'loss': 0.4513, 'learning_rate': 1.768460180160824e-05, 'epoch': 0.49} {'loss': 0.6327, 'learning_rate': 1.7684386805973043e-05, 'epoch': 0.49} {'loss': 0.4547, 'learning_rate': 1.7684171801663636e-05, 'epoch': 0.49} {'loss': 0.6496, 'learning_rate': 1.768395678868026e-05, 'epoch': 0.49} {'loss': 0.5964, 'learning_rate': 1.7683741767023157e-05, 'epoch': 0.49} {'loss': 0.7187, 'learning_rate': 1.768352673669257e-05, 'epoch': 0.49} {'loss': 0.6017, 'learning_rate': 1.7683311697688744e-05, 'epoch': 0.49} {'loss': 0.6114, 'learning_rate': 1.768309665001192e-05, 'epoch': 0.49} {'loss': 0.6264, 'learning_rate': 1.7682881593662338e-05, 'epoch': 0.49} {'loss': 0.5966, 'learning_rate': 1.7682666528640245e-05, 'epoch': 0.49} {'loss': 0.5047, 'learning_rate': 1.7682451454945883e-05, 'epoch': 0.49} {'loss': 0.5603, 'learning_rate': 1.7682236372579497e-05, 'epoch': 0.49} {'loss': 0.5573, 'learning_rate': 1.7682021281541323e-05, 'epoch': 0.49} {'loss': 0.5413, 'learning_rate': 1.7681806181831608e-05, 'epoch': 0.49} {'loss': 0.6048, 'learning_rate': 1.7681591073450593e-05, 'epoch': 0.49} {'loss': 0.6269, 'learning_rate': 1.768137595639853e-05, 'epoch': 0.49} {'loss': 0.635, 'learning_rate': 1.7681160830675647e-05, 'epoch': 0.49} {'loss': 0.5151, 'learning_rate': 1.7680945696282196e-05, 'epoch': 0.49} {'loss': 0.5244, 'learning_rate': 1.7680730553218418e-05, 'epoch': 0.49} {'loss': 0.5865, 'learning_rate': 1.7680515401484556e-05, 'epoch': 0.49} {'loss': 0.578, 'learning_rate': 1.7680300241080855e-05, 'epoch': 0.49} {'loss': 0.5557, 'learning_rate': 1.768008507200755e-05, 'epoch': 0.49} {'loss': 0.5469, 'learning_rate': 1.7679869894264895e-05, 'epoch': 0.49} {'loss': 0.4766, 'learning_rate': 1.7679654707853125e-05, 'epoch': 0.49} {'loss': 0.628, 'learning_rate': 1.7679439512772485e-05, 'epoch': 0.49} {'loss': 0.8054, 'learning_rate': 1.7679224309023214e-05, 'epoch': 0.49} {'loss': 0.6398, 'learning_rate': 1.7679009096605567e-05, 'epoch': 0.49} {'loss': 0.6953, 'learning_rate': 1.7678793875519775e-05, 'epoch': 0.49} {'loss': 0.6406, 'learning_rate': 1.7678578645766085e-05, 'epoch': 0.49} {'loss': 0.4667, 'learning_rate': 1.767836340734474e-05, 'epoch': 0.49} {'loss': 0.6854, 'learning_rate': 1.767814816025598e-05, 'epoch': 0.49} {'loss': 0.494, 'learning_rate': 1.7677932904500053e-05, 'epoch': 0.49} {'loss': 0.668, 'learning_rate': 1.7677717640077203e-05, 'epoch': 0.49} {'loss': 0.3999, 'learning_rate': 1.7677502366987667e-05, 'epoch': 0.49} {'loss': 0.6812, 'learning_rate': 1.7677287085231693e-05, 'epoch': 0.49} {'loss': 0.6073, 'learning_rate': 1.767707179480952e-05, 'epoch': 0.49} {'loss': 0.4579, 'learning_rate': 1.767685649572139e-05, 'epoch': 0.49} {'loss': 0.6348, 'learning_rate': 1.7676641187967553e-05, 'epoch': 0.49} {'loss': 0.5235, 'learning_rate': 1.7676425871548243e-05, 'epoch': 0.49} {'loss': 0.6267, 'learning_rate': 1.7676210546463712e-05, 'epoch': 0.49} {'loss': 0.4887, 'learning_rate': 1.7675995212714196e-05, 'epoch': 0.49} {'loss': 0.4598, 'learning_rate': 1.7675779870299946e-05, 'epoch': 0.49} {'loss': 0.5579, 'learning_rate': 1.7675564519221197e-05, 'epoch': 0.49} {'loss': 0.5036, 'learning_rate': 1.7675349159478195e-05, 'epoch': 0.49} {'loss': 0.5416, 'learning_rate': 1.767513379107118e-05, 'epoch': 0.49} {'loss': 0.5202, 'learning_rate': 1.7674918414000406e-05, 'epoch': 0.49} {'loss': 0.6309, 'learning_rate': 1.7674703028266106e-05, 'epoch': 0.49} {'loss': 0.6754, 'learning_rate': 1.767448763386852e-05, 'epoch': 0.49} {'loss': 0.7154, 'learning_rate': 1.7674272230807904e-05, 'epoch': 0.49} {'loss': 0.6207, 'learning_rate': 1.7674056819084492e-05, 'epoch': 0.49} {'loss': 0.4744, 'learning_rate': 1.7673841398698526e-05, 'epoch': 0.49} {'loss': 0.5042, 'learning_rate': 1.7673625969650255e-05, 'epoch': 0.49} {'loss': 0.6945, 'learning_rate': 1.767341053193992e-05, 'epoch': 0.49} {'loss': 0.8481, 'learning_rate': 1.767319508556776e-05, 'epoch': 0.49} {'loss': 0.5051, 'learning_rate': 1.7672979630534027e-05, 'epoch': 0.49} {'loss': 0.4483, 'learning_rate': 1.7672764166838958e-05, 'epoch': 0.49} {'loss': 0.7054, 'learning_rate': 1.7672548694482797e-05, 'epoch': 0.49} {'loss': 0.6493, 'learning_rate': 1.7672333213465785e-05, 'epoch': 0.49} {'loss': 0.5135, 'learning_rate': 1.767211772378817e-05, 'epoch': 0.49} {'loss': 0.6055, 'learning_rate': 1.7671902225450194e-05, 'epoch': 0.49} {'loss': 0.634, 'learning_rate': 1.7671686718452096e-05, 'epoch': 0.49} {'loss': 0.6098, 'learning_rate': 1.7671471202794124e-05, 'epoch': 0.49} {'loss': 0.608, 'learning_rate': 1.7671255678476523e-05, 'epoch': 0.49} {'loss': 0.6452, 'learning_rate': 1.767104014549953e-05, 'epoch': 0.49} {'loss': 0.4848, 'learning_rate': 1.7670824603863387e-05, 'epoch': 0.49} {'loss': 0.6252, 'learning_rate': 1.7670609053568347e-05, 'epoch': 0.49} {'loss': 0.682, 'learning_rate': 1.7670393494614648e-05, 'epoch': 0.49} {'loss': 0.5824, 'learning_rate': 1.7670177927002533e-05, 'epoch': 0.49} {'loss': 0.5344, 'learning_rate': 1.7669962350732245e-05, 'epoch': 0.49} {'loss': 0.5417, 'learning_rate': 1.7669746765804026e-05, 'epoch': 0.49} {'loss': 0.6723, 'learning_rate': 1.7669531172218125e-05, 'epoch': 0.49} {'loss': 0.6655, 'learning_rate': 1.766931556997478e-05, 'epoch': 0.49} {'loss': 0.5389, 'learning_rate': 1.7669099959074238e-05, 'epoch': 0.49} {'loss': 0.6202, 'learning_rate': 1.7668884339516737e-05, 'epoch': 0.49} {'loss': 0.5821, 'learning_rate': 1.766866871130253e-05, 'epoch': 0.49} {'loss': 0.5848, 'learning_rate': 1.7668453074431848e-05, 'epoch': 0.49} {'loss': 0.5697, 'learning_rate': 1.766823742890494e-05, 'epoch': 0.49} {'loss': 0.7435, 'learning_rate': 1.7668021774722055e-05, 'epoch': 0.49} {'loss': 0.6924, 'learning_rate': 1.766780611188343e-05, 'epoch': 0.49} {'loss': 0.6124, 'learning_rate': 1.766759044038931e-05, 'epoch': 0.49} {'loss': 0.6517, 'learning_rate': 1.7667374760239936e-05, 'epoch': 0.49} {'loss': 0.5105, 'learning_rate': 1.7667159071435557e-05, 'epoch': 0.49} {'loss': 0.586, 'learning_rate': 1.7666943373976413e-05, 'epoch': 0.49} {'loss': 0.734, 'learning_rate': 1.766672766786275e-05, 'epoch': 0.49} {'loss': 0.4724, 'learning_rate': 1.7666511953094802e-05, 'epoch': 0.49} {'loss': 0.8135, 'learning_rate': 1.7666296229672827e-05, 'epoch': 0.49} {'loss': 0.4578, 'learning_rate': 1.766608049759706e-05, 'epoch': 0.49} {'loss': 0.63, 'learning_rate': 1.7665864756867745e-05, 'epoch': 0.49} {'loss': 0.6634, 'learning_rate': 1.7665649007485125e-05, 'epoch': 0.49} {'loss': 0.5309, 'learning_rate': 1.7665433249449443e-05, 'epoch': 0.49} {'loss': 0.4447, 'learning_rate': 1.766521748276095e-05, 'epoch': 0.49} {'loss': 0.5622, 'learning_rate': 1.7665001707419878e-05, 'epoch': 0.49} {'loss': 0.6832, 'learning_rate': 1.7664785923426482e-05, 'epoch': 0.49} {'loss': 0.5987, 'learning_rate': 1.7664570130781e-05, 'epoch': 0.49} {'loss': 0.678, 'learning_rate': 1.7664354329483674e-05, 'epoch': 0.49} {'loss': 0.6511, 'learning_rate': 1.766413851953475e-05, 'epoch': 0.49} {'loss': 0.5764, 'learning_rate': 1.766392270093447e-05, 'epoch': 0.49} {'loss': 0.7212, 'learning_rate': 1.766370687368308e-05, 'epoch': 0.49} {'loss': 0.7069, 'learning_rate': 1.7663491037780824e-05, 'epoch': 0.49} {'loss': 0.6769, 'learning_rate': 1.7663275193227937e-05, 'epoch': 0.49} {'loss': 0.5172, 'learning_rate': 1.7663059340024675e-05, 'epoch': 0.49} {'loss': 0.5945, 'learning_rate': 1.7662843478171275e-05, 'epoch': 0.49} {'loss': 0.4835, 'learning_rate': 1.7662627607667982e-05, 'epoch': 0.49} {'loss': 0.7032, 'learning_rate': 1.766241172851504e-05, 'epoch': 0.49} {'loss': 0.5446, 'learning_rate': 1.7662195840712694e-05, 'epoch': 0.49} {'loss': 0.6117, 'learning_rate': 1.766197994426118e-05, 'epoch': 0.49} {'loss': 0.521, 'learning_rate': 1.7661764039160755e-05, 'epoch': 0.49} {'loss': 0.3303, 'learning_rate': 1.766154812541165e-05, 'epoch': 0.49} {'loss': 0.5892, 'learning_rate': 1.7661332203014113e-05, 'epoch': 0.49} {'loss': 0.5888, 'learning_rate': 1.7661116271968395e-05, 'epoch': 0.49} {'loss': 0.6067, 'learning_rate': 1.766090033227473e-05, 'epoch': 0.49} {'loss': 0.6064, 'learning_rate': 1.7660684383933365e-05, 'epoch': 0.49} {'loss': 0.5897, 'learning_rate': 1.7660468426944545e-05, 'epoch': 0.49} {'loss': 0.6768, 'learning_rate': 1.7660252461308515e-05, 'epoch': 0.49} {'loss': 0.5682, 'learning_rate': 1.7660036487025512e-05, 'epoch': 0.49} {'loss': 0.6661, 'learning_rate': 1.7659820504095786e-05, 'epoch': 0.49} {'loss': 0.5795, 'learning_rate': 1.765960451251958e-05, 'epoch': 0.49} {'loss': 0.4869, 'learning_rate': 1.7659388512297137e-05, 'epoch': 0.49} {'loss': 0.6067, 'learning_rate': 1.76591725034287e-05, 'epoch': 0.49} {'loss': 0.7479, 'learning_rate': 1.7658956485914512e-05, 'epoch': 0.49} {'loss': 0.5621, 'learning_rate': 1.7658740459754824e-05, 'epoch': 0.49} {'loss': 0.571, 'learning_rate': 1.7658524424949873e-05, 'epoch': 0.49} {'loss': 0.4908, 'learning_rate': 1.76583083814999e-05, 'epoch': 0.49} {'loss': 0.4743, 'learning_rate': 1.7658092329405158e-05, 'epoch': 0.49} {'loss': 0.5313, 'learning_rate': 1.765787626866588e-05, 'epoch': 0.49} {'loss': 0.5047, 'learning_rate': 1.765766019928232e-05, 'epoch': 0.49} {'loss': 0.5861, 'learning_rate': 1.765744412125472e-05, 'epoch': 0.49} {'loss': 0.4744, 'learning_rate': 1.765722803458332e-05, 'epoch': 0.49} {'loss': 0.5397, 'learning_rate': 1.765701193926836e-05, 'epoch': 0.49} {'loss': 0.4923, 'learning_rate': 1.76567958353101e-05, 'epoch': 0.49} {'loss': 0.6834, 'learning_rate': 1.7656579722708764e-05, 'epoch': 0.49} {'loss': 0.4363, 'learning_rate': 1.765636360146461e-05, 'epoch': 0.49} {'loss': 0.5951, 'learning_rate': 1.7656147471577876e-05, 'epoch': 0.49} {'loss': 0.6443, 'learning_rate': 1.765593133304881e-05, 'epoch': 0.49} {'loss': 0.5721, 'learning_rate': 1.7655715185877652e-05, 'epoch': 0.49} {'loss': 0.5447, 'learning_rate': 1.7655499030064646e-05, 'epoch': 0.49} {'loss': 0.6235, 'learning_rate': 1.7655282865610038e-05, 'epoch': 0.49} {'loss': 0.5433, 'learning_rate': 1.765506669251407e-05, 'epoch': 0.49} {'loss': 0.5287, 'learning_rate': 1.765485051077699e-05, 'epoch': 0.49} {'loss': 0.5114, 'learning_rate': 1.765463432039904e-05, 'epoch': 0.49} {'loss': 0.5579, 'learning_rate': 1.7654418121380463e-05, 'epoch': 0.49} {'loss': 0.4677, 'learning_rate': 1.7654201913721502e-05, 'epoch': 0.49} {'loss': 0.742, 'learning_rate': 1.76539856974224e-05, 'epoch': 0.49} {'loss': 0.4411, 'learning_rate': 1.7653769472483406e-05, 'epoch': 0.49} {'loss': 0.6042, 'learning_rate': 1.7653553238904763e-05, 'epoch': 0.49} {'loss': 0.3547, 'learning_rate': 1.7653336996686712e-05, 'epoch': 0.49} {'loss': 0.6893, 'learning_rate': 1.7653120745829498e-05, 'epoch': 0.49} {'loss': 0.6534, 'learning_rate': 1.765290448633337e-05, 'epoch': 0.49} {'loss': 0.6599, 'learning_rate': 1.7652688218198566e-05, 'epoch': 0.49} {'loss': 0.434, 'learning_rate': 1.7652471941425335e-05, 'epoch': 0.49} {'loss': 0.5373, 'learning_rate': 1.7652255656013913e-05, 'epoch': 0.49} {'loss': 0.6896, 'learning_rate': 1.765203936196455e-05, 'epoch': 0.49} {'loss': 0.4475, 'learning_rate': 1.7651823059277492e-05, 'epoch': 0.49} {'loss': 0.4905, 'learning_rate': 1.765160674795298e-05, 'epoch': 0.49} {'loss': 0.6155, 'learning_rate': 1.765139042799126e-05, 'epoch': 0.49} {'loss': 0.6895, 'learning_rate': 1.7651174099392578e-05, 'epoch': 0.49} {'loss': 0.5539, 'learning_rate': 1.7650957762157173e-05, 'epoch': 0.49} {'loss': 0.6371, 'learning_rate': 1.7650741416285288e-05, 'epoch': 0.49} {'loss': 0.5065, 'learning_rate': 1.7650525061777174e-05, 'epoch': 0.49} {'loss': 0.7319, 'learning_rate': 1.765030869863307e-05, 'epoch': 0.49} {'loss': 0.4044, 'learning_rate': 1.7650092326853227e-05, 'epoch': 0.49} {'loss': 0.6621, 'learning_rate': 1.764987594643788e-05, 'epoch': 0.49} {'loss': 0.6038, 'learning_rate': 1.764965955738728e-05, 'epoch': 0.49} {'loss': 0.6596, 'learning_rate': 1.7649443159701667e-05, 'epoch': 0.49} {'loss': 0.4623, 'learning_rate': 1.764922675338129e-05, 'epoch': 0.49} {'loss': 0.6397, 'learning_rate': 1.7649010338426387e-05, 'epoch': 0.49} {'loss': 0.4796, 'learning_rate': 1.7648793914837207e-05, 'epoch': 0.49} {'loss': 0.5072, 'learning_rate': 1.7648577482613992e-05, 'epoch': 0.49} {'loss': 0.5797, 'learning_rate': 1.764836104175699e-05, 'epoch': 0.49} {'loss': 0.5305, 'learning_rate': 1.764814459226644e-05, 'epoch': 0.49} {'loss': 0.5943, 'learning_rate': 1.7647928134142596e-05, 'epoch': 0.49} {'loss': 0.6308, 'learning_rate': 1.764771166738569e-05, 'epoch': 0.49} {'loss': 0.6578, 'learning_rate': 1.7647495191995975e-05, 'epoch': 0.49} {'loss': 0.6294, 'learning_rate': 1.7647278707973688e-05, 'epoch': 0.49} {'loss': 0.5326, 'learning_rate': 1.764706221531908e-05, 'epoch': 0.49} {'loss': 0.4656, 'learning_rate': 1.764684571403239e-05, 'epoch': 0.49} {'loss': 0.5354, 'learning_rate': 1.7646629204113867e-05, 'epoch': 0.49} {'loss': 0.6931, 'learning_rate': 1.7646412685563755e-05, 'epoch': 0.49} {'loss': 0.723, 'learning_rate': 1.7646196158382296e-05, 'epoch': 0.49} {'loss': 0.6184, 'learning_rate': 1.7645979622569734e-05, 'epoch': 0.49} {'loss': 0.5712, 'learning_rate': 1.764576307812632e-05, 'epoch': 0.49} {'loss': 0.7205, 'learning_rate': 1.764554652505229e-05, 'epoch': 0.49} {'loss': 0.6116, 'learning_rate': 1.764532996334789e-05, 'epoch': 0.49} {'loss': 0.5618, 'learning_rate': 1.7645113393013367e-05, 'epoch': 0.49} {'loss': 0.6122, 'learning_rate': 1.764489681404897e-05, 'epoch': 0.49} {'loss': 0.704, 'learning_rate': 1.7644680226454932e-05, 'epoch': 0.49} {'loss': 0.6496, 'learning_rate': 1.764446363023151e-05, 'epoch': 0.49} {'loss': 0.6394, 'learning_rate': 1.7644247025378935e-05, 'epoch': 0.49} {'loss': 0.5722, 'learning_rate': 1.7644030411897463e-05, 'epoch': 0.49} {'loss': 0.5762, 'learning_rate': 1.764381378978733e-05, 'epoch': 0.49} {'loss': 0.6085, 'learning_rate': 1.764359715904879e-05, 'epoch': 0.49} {'loss': 0.5552, 'learning_rate': 1.764338051968208e-05, 'epoch': 0.49} {'loss': 0.5419, 'learning_rate': 1.7643163871687447e-05, 'epoch': 0.49} {'loss': 0.604, 'learning_rate': 1.7642947215065133e-05, 'epoch': 0.49} {'loss': 0.6245, 'learning_rate': 1.7642730549815386e-05, 'epoch': 0.49} {'loss': 0.6097, 'learning_rate': 1.7642513875938453e-05, 'epoch': 0.49} {'loss': 0.504, 'learning_rate': 1.7642297193434574e-05, 'epoch': 0.49} {'loss': 0.5186, 'learning_rate': 1.7642080502303996e-05, 'epoch': 0.49} {'loss': 0.5782, 'learning_rate': 1.764186380254696e-05, 'epoch': 0.49} {'loss': 0.5486, 'learning_rate': 1.7641647094163713e-05, 'epoch': 0.49} {'loss': 0.6558, 'learning_rate': 1.7641430377154497e-05, 'epoch': 0.49} {'loss': 0.6844, 'learning_rate': 1.764121365151956e-05, 'epoch': 0.49} {'loss': 0.5551, 'learning_rate': 1.764099691725915e-05, 'epoch': 0.49} {'loss': 0.6, 'learning_rate': 1.7640780174373503e-05, 'epoch': 0.49} {'loss': 0.7037, 'learning_rate': 1.7640563422862873e-05, 'epoch': 0.49} {'loss': 0.7098, 'learning_rate': 1.7640346662727496e-05, 'epoch': 0.49} {'loss': 0.6151, 'learning_rate': 1.7640129893967622e-05, 'epoch': 0.49} {'loss': 0.4699, 'learning_rate': 1.7639913116583493e-05, 'epoch': 0.49} {'loss': 0.5731, 'learning_rate': 1.763969633057536e-05, 'epoch': 0.49} {'loss': 0.5188, 'learning_rate': 1.7639479535943453e-05, 'epoch': 0.49} {'loss': 0.4926, 'learning_rate': 1.7639262732688034e-05, 'epoch': 0.49} {'loss': 0.7126, 'learning_rate': 1.763904592080934e-05, 'epoch': 0.49} {'loss': 0.5219, 'learning_rate': 1.763882910030761e-05, 'epoch': 0.49} {'loss': 0.559, 'learning_rate': 1.76386122711831e-05, 'epoch': 0.49} {'loss': 0.5979, 'learning_rate': 1.7638395433436046e-05, 'epoch': 0.49} {'loss': 0.6132, 'learning_rate': 1.7638178587066697e-05, 'epoch': 0.49} {'loss': 0.6923, 'learning_rate': 1.76379617320753e-05, 'epoch': 0.49} {'loss': 0.6254, 'learning_rate': 1.763774486846209e-05, 'epoch': 0.49} {'loss': 0.6802, 'learning_rate': 1.7637527996227324e-05, 'epoch': 0.49} {'loss': 0.5197, 'learning_rate': 1.763731111537124e-05, 'epoch': 0.5} {'loss': 0.7353, 'learning_rate': 1.763709422589408e-05, 'epoch': 0.5} {'loss': 0.7872, 'learning_rate': 1.7636877327796097e-05, 'epoch': 0.5} {'loss': 0.715, 'learning_rate': 1.763666042107753e-05, 'epoch': 0.5} {'loss': 0.4928, 'learning_rate': 1.763644350573863e-05, 'epoch': 0.5} {'loss': 0.4419, 'learning_rate': 1.7636226581779633e-05, 'epoch': 0.5} {'loss': 0.4906, 'learning_rate': 1.763600964920079e-05, 'epoch': 0.5} {'loss': 0.4045, 'learning_rate': 1.7635792708002345e-05, 'epoch': 0.5} {'loss': 0.6079, 'learning_rate': 1.763557575818454e-05, 'epoch': 0.5} {'loss': 0.5143, 'learning_rate': 1.763535879974762e-05, 'epoch': 0.5} {'loss': 0.4986, 'learning_rate': 1.7635141832691835e-05, 'epoch': 0.5} {'loss': 0.6058, 'learning_rate': 1.7634924857017428e-05, 'epoch': 0.5} {'loss': 0.657, 'learning_rate': 1.763470787272464e-05, 'epoch': 0.5} {'loss': 0.4641, 'learning_rate': 1.763449087981372e-05, 'epoch': 0.5} {'loss': 0.5054, 'learning_rate': 1.763427387828491e-05, 'epoch': 0.5} {'loss': 0.6769, 'learning_rate': 1.7634056868138454e-05, 'epoch': 0.5} {'loss': 0.5379, 'learning_rate': 1.7633839849374608e-05, 'epoch': 0.5} {'loss': 0.6345, 'learning_rate': 1.7633622821993603e-05, 'epoch': 0.5} {'loss': 0.6383, 'learning_rate': 1.763340578599569e-05, 'epoch': 0.5} {'loss': 0.6455, 'learning_rate': 1.7633188741381115e-05, 'epoch': 0.5} {'loss': 0.5416, 'learning_rate': 1.7632971688150115e-05, 'epoch': 0.5} {'loss': 0.772, 'learning_rate': 1.7632754626302947e-05, 'epoch': 0.5} {'loss': 0.5427, 'learning_rate': 1.763253755583985e-05, 'epoch': 0.5} {'loss': 0.5818, 'learning_rate': 1.763232047676107e-05, 'epoch': 0.5} {'loss': 0.6866, 'learning_rate': 1.763210338906685e-05, 'epoch': 0.5} {'loss': 0.7253, 'learning_rate': 1.7631886292757438e-05, 'epoch': 0.5} {'loss': 0.437, 'learning_rate': 1.7631669187833077e-05, 'epoch': 0.5} {'loss': 0.4515, 'learning_rate': 1.763145207429401e-05, 'epoch': 0.5} {'loss': 0.6562, 'learning_rate': 1.7631234952140488e-05, 'epoch': 0.5} {'loss': 0.5741, 'learning_rate': 1.7631017821372753e-05, 'epoch': 0.5} {'loss': 0.4613, 'learning_rate': 1.7630800681991048e-05, 'epoch': 0.5} {'loss': 0.7505, 'learning_rate': 1.763058353399562e-05, 'epoch': 0.5} {'loss': 0.6942, 'learning_rate': 1.7630366377386717e-05, 'epoch': 0.5} {'loss': 0.5513, 'learning_rate': 1.763014921216458e-05, 'epoch': 0.5} {'loss': 0.5692, 'learning_rate': 1.7629932038329457e-05, 'epoch': 0.5} {'loss': 0.4359, 'learning_rate': 1.762971485588159e-05, 'epoch': 0.5} {'loss': 0.5208, 'learning_rate': 1.762949766482123e-05, 'epoch': 0.5} {'loss': 0.5183, 'learning_rate': 1.762928046514861e-05, 'epoch': 0.5} {'loss': 0.5685, 'learning_rate': 1.7629063256863984e-05, 'epoch': 0.5} {'loss': 0.5252, 'learning_rate': 1.76288460399676e-05, 'epoch': 0.5} {'loss': 0.5114, 'learning_rate': 1.7628628814459698e-05, 'epoch': 0.5} {'loss': 0.5311, 'learning_rate': 1.7628411580340526e-05, 'epoch': 0.5} {'loss': 0.592, 'learning_rate': 1.762819433761033e-05, 'epoch': 0.5} {'loss': 0.6339, 'learning_rate': 1.762797708626935e-05, 'epoch': 0.5} {'loss': 0.6999, 'learning_rate': 1.7627759826317834e-05, 'epoch': 0.5} {'loss': 0.5834, 'learning_rate': 1.762754255775603e-05, 'epoch': 0.5} {'loss': 0.6419, 'learning_rate': 1.7627325280584178e-05, 'epoch': 0.5} {'loss': 0.6076, 'learning_rate': 1.762710799480253e-05, 'epoch': 0.5} {'loss': 0.6731, 'learning_rate': 1.7626890700411322e-05, 'epoch': 0.5} {'loss': 0.6176, 'learning_rate': 1.7626673397410808e-05, 'epoch': 0.5} {'loss': 0.5802, 'learning_rate': 1.762645608580123e-05, 'epoch': 0.5} {'loss': 0.5317, 'learning_rate': 1.7626238765582833e-05, 'epoch': 0.5} {'loss': 0.4119, 'learning_rate': 1.7626021436755864e-05, 'epoch': 0.5} {'loss': 0.7285, 'learning_rate': 1.7625804099320563e-05, 'epoch': 0.5} {'loss': 0.5637, 'learning_rate': 1.7625586753277186e-05, 'epoch': 0.5} {'loss': 0.7363, 'learning_rate': 1.7625369398625968e-05, 'epoch': 0.5} {'loss': 0.6421, 'learning_rate': 1.7625152035367153e-05, 'epoch': 0.5} {'loss': 0.6541, 'learning_rate': 1.7624934663500997e-05, 'epoch': 0.5} {'loss': 0.6365, 'learning_rate': 1.762471728302774e-05, 'epoch': 0.5} {'loss': 0.6005, 'learning_rate': 1.7624499893947623e-05, 'epoch': 0.5} {'loss': 0.7688, 'learning_rate': 1.76242824962609e-05, 'epoch': 0.5} {'loss': 0.4616, 'learning_rate': 1.762406508996781e-05, 'epoch': 0.5} {'loss': 0.4934, 'learning_rate': 1.76238476750686e-05, 'epoch': 0.5} {'loss': 0.7599, 'learning_rate': 1.7623630251563517e-05, 'epoch': 0.5} {'loss': 0.5934, 'learning_rate': 1.7623412819452803e-05, 'epoch': 0.5} {'loss': 0.5106, 'learning_rate': 1.762319537873671e-05, 'epoch': 0.5} {'loss': 0.5945, 'learning_rate': 1.7622977929415474e-05, 'epoch': 0.5} {'loss': 0.6186, 'learning_rate': 1.7622760471489347e-05, 'epoch': 0.5} {'loss': 0.5894, 'learning_rate': 1.7622543004958572e-05, 'epoch': 0.5} {'loss': 0.4755, 'learning_rate': 1.76223255298234e-05, 'epoch': 0.5} {'loss': 0.5734, 'learning_rate': 1.7622108046084068e-05, 'epoch': 0.5} {'loss': 0.6347, 'learning_rate': 1.7621890553740827e-05, 'epoch': 0.5} {'loss': 0.5322, 'learning_rate': 1.7621673052793917e-05, 'epoch': 0.5} {'loss': 0.4778, 'learning_rate': 1.7621455543243592e-05, 'epoch': 0.5} {'loss': 0.631, 'learning_rate': 1.762123802509009e-05, 'epoch': 0.5} {'loss': 0.7091, 'learning_rate': 1.762102049833366e-05, 'epoch': 0.5} {'loss': 0.6158, 'learning_rate': 1.7620802962974547e-05, 'epoch': 0.5} {'loss': 0.5822, 'learning_rate': 1.7620585419013e-05, 'epoch': 0.5} {'loss': 0.6613, 'learning_rate': 1.7620367866449258e-05, 'epoch': 0.5} {'loss': 0.5394, 'learning_rate': 1.762015030528357e-05, 'epoch': 0.5} {'loss': 0.7338, 'learning_rate': 1.7619932735516182e-05, 'epoch': 0.5} {'loss': 0.4497, 'learning_rate': 1.761971515714734e-05, 'epoch': 0.5} {'loss': 0.5174, 'learning_rate': 1.7619497570177286e-05, 'epoch': 0.5} {'loss': 0.607, 'learning_rate': 1.7619279974606272e-05, 'epoch': 0.5} {'loss': 0.4671, 'learning_rate': 1.7619062370434536e-05, 'epoch': 0.5} {'loss': 0.5269, 'learning_rate': 1.761884475766233e-05, 'epoch': 0.5} {'loss': 0.7219, 'learning_rate': 1.7618627136289897e-05, 'epoch': 0.5} {'loss': 0.5389, 'learning_rate': 1.761840950631748e-05, 'epoch': 0.5} {'loss': 0.4323, 'learning_rate': 1.7618191867745328e-05, 'epoch': 0.5} {'loss': 0.5065, 'learning_rate': 1.7617974220573687e-05, 'epoch': 0.5} {'loss': 0.6814, 'learning_rate': 1.7617756564802805e-05, 'epoch': 0.5} {'loss': 0.5614, 'learning_rate': 1.761753890043292e-05, 'epoch': 0.5} {'loss': 0.5765, 'learning_rate': 1.761732122746428e-05, 'epoch': 0.5} {'loss': 0.7018, 'learning_rate': 1.7617103545897138e-05, 'epoch': 0.5} {'loss': 0.6331, 'learning_rate': 1.761688585573173e-05, 'epoch': 0.5} {'loss': 0.6802, 'learning_rate': 1.761666815696831e-05, 'epoch': 0.5} {'loss': 0.4585, 'learning_rate': 1.761645044960712e-05, 'epoch': 0.5} {'loss': 0.6516, 'learning_rate': 1.7616232733648405e-05, 'epoch': 0.5} {'loss': 0.7155, 'learning_rate': 1.761601500909241e-05, 'epoch': 0.5} {'loss': 0.586, 'learning_rate': 1.7615797275939384e-05, 'epoch': 0.5} {'loss': 0.6426, 'learning_rate': 1.7615579534189572e-05, 'epoch': 0.5} {'loss': 0.55, 'learning_rate': 1.7615361783843216e-05, 'epoch': 0.5} {'loss': 0.5443, 'learning_rate': 1.7615144024900567e-05, 'epoch': 0.5} {'loss': 0.5948, 'learning_rate': 1.7614926257361868e-05, 'epoch': 0.5} {'loss': 0.7248, 'learning_rate': 1.7614708481227364e-05, 'epoch': 0.5} {'loss': 0.5048, 'learning_rate': 1.7614490696497305e-05, 'epoch': 0.5} {'loss': 0.652, 'learning_rate': 1.7614272903171928e-05, 'epoch': 0.5} {'loss': 0.6075, 'learning_rate': 1.761405510125149e-05, 'epoch': 0.5} {'loss': 0.4709, 'learning_rate': 1.7613837290736234e-05, 'epoch': 0.5} {'loss': 0.5659, 'learning_rate': 1.76136194716264e-05, 'epoch': 0.5} {'loss': 0.653, 'learning_rate': 1.7613401643922235e-05, 'epoch': 0.5} {'loss': 0.7158, 'learning_rate': 1.7613183807623994e-05, 'epoch': 0.5} {'loss': 0.5231, 'learning_rate': 1.7612965962731908e-05, 'epoch': 0.5} {'loss': 0.6389, 'learning_rate': 1.7612748109246237e-05, 'epoch': 0.5} {'loss': 0.7404, 'learning_rate': 1.7612530247167216e-05, 'epoch': 0.5} {'loss': 0.7198, 'learning_rate': 1.7612312376495103e-05, 'epoch': 0.5} {'loss': 0.6072, 'learning_rate': 1.7612094497230133e-05, 'epoch': 0.5} {'loss': 0.6449, 'learning_rate': 1.7611876609372552e-05, 'epoch': 0.5} {'loss': 0.681, 'learning_rate': 1.761165871292262e-05, 'epoch': 0.5} {'loss': 0.5432, 'learning_rate': 1.7611440807880562e-05, 'epoch': 0.5} {'loss': 0.6486, 'learning_rate': 1.7611222894246637e-05, 'epoch': 0.5} {'loss': 0.6525, 'learning_rate': 1.7611004972021094e-05, 'epoch': 0.5} {'loss': 0.6051, 'learning_rate': 1.7610787041204167e-05, 'epoch': 0.5} {'loss': 0.5391, 'learning_rate': 1.7610569101796114e-05, 'epoch': 0.5} {'loss': 0.6788, 'learning_rate': 1.761035115379717e-05, 'epoch': 0.5} {'loss': 0.6175, 'learning_rate': 1.7610133197207596e-05, 'epoch': 0.5} {'loss': 0.4706, 'learning_rate': 1.760991523202762e-05, 'epoch': 0.5} {'loss': 0.6452, 'learning_rate': 1.76096972582575e-05, 'epoch': 0.5} {'loss': 0.6271, 'learning_rate': 1.760947927589748e-05, 'epoch': 0.5} {'loss': 0.5038, 'learning_rate': 1.7609261284947803e-05, 'epoch': 0.5} {'loss': 0.6045, 'learning_rate': 1.760904328540872e-05, 'epoch': 0.5} {'loss': 0.4702, 'learning_rate': 1.760882527728047e-05, 'epoch': 0.5} {'loss': 0.622, 'learning_rate': 1.7608607260563305e-05, 'epoch': 0.5} {'loss': 0.5125, 'learning_rate': 1.7608389235257467e-05, 'epoch': 0.5} {'loss': 0.5721, 'learning_rate': 1.760817120136321e-05, 'epoch': 0.5} {'loss': 0.4629, 'learning_rate': 1.760795315888077e-05, 'epoch': 0.5} {'loss': 0.53, 'learning_rate': 1.7607735107810397e-05, 'epoch': 0.5} {'loss': 0.5741, 'learning_rate': 1.760751704815234e-05, 'epoch': 0.5} {'loss': 0.612, 'learning_rate': 1.760729897990684e-05, 'epoch': 0.5} {'loss': 0.604, 'learning_rate': 1.7607080903074153e-05, 'epoch': 0.5} {'loss': 0.6181, 'learning_rate': 1.7606862817654513e-05, 'epoch': 0.5} {'loss': 0.6761, 'learning_rate': 1.760664472364817e-05, 'epoch': 0.5} {'loss': 0.5654, 'learning_rate': 1.7606426621055374e-05, 'epoch': 0.5} {'loss': 0.4786, 'learning_rate': 1.7606208509876368e-05, 'epoch': 0.5} {'loss': 0.5582, 'learning_rate': 1.7605990390111398e-05, 'epoch': 0.5} {'loss': 0.6606, 'learning_rate': 1.7605772261760713e-05, 'epoch': 0.5} {'loss': 0.574, 'learning_rate': 1.760555412482456e-05, 'epoch': 0.5} {'loss': 0.5145, 'learning_rate': 1.7605335979303178e-05, 'epoch': 0.5} {'loss': 0.4983, 'learning_rate': 1.760511782519682e-05, 'epoch': 0.5} {'loss': 0.5629, 'learning_rate': 1.7604899662505727e-05, 'epoch': 0.5} {'loss': 0.5286, 'learning_rate': 1.7604681491230153e-05, 'epoch': 0.5} {'loss': 0.6217, 'learning_rate': 1.7604463311370337e-05, 'epoch': 0.5} {'loss': 0.5722, 'learning_rate': 1.760424512292653e-05, 'epoch': 0.5} {'loss': 0.4888, 'learning_rate': 1.7604026925898973e-05, 'epoch': 0.5} {'loss': 0.6706, 'learning_rate': 1.760380872028792e-05, 'epoch': 0.5} {'loss': 0.5262, 'learning_rate': 1.760359050609361e-05, 'epoch': 0.5} {'loss': 0.7132, 'learning_rate': 1.760337228331629e-05, 'epoch': 0.5} {'loss': 0.5097, 'learning_rate': 1.760315405195621e-05, 'epoch': 0.5} {'loss': 0.6583, 'learning_rate': 1.7602935812013616e-05, 'epoch': 0.5} {'loss': 0.5361, 'learning_rate': 1.7602717563488756e-05, 'epoch': 0.5} {'loss': 0.6428, 'learning_rate': 1.760249930638187e-05, 'epoch': 0.5} {'loss': 0.6372, 'learning_rate': 1.7602281040693208e-05, 'epoch': 0.5} {'loss': 0.6061, 'learning_rate': 1.760206276642302e-05, 'epoch': 0.5} {'loss': 0.7483, 'learning_rate': 1.7601844483571545e-05, 'epoch': 0.5} {'loss': 0.5453, 'learning_rate': 1.760162619213903e-05, 'epoch': 0.5} {'loss': 0.4902, 'learning_rate': 1.7601407892125732e-05, 'epoch': 0.5} {'loss': 0.4972, 'learning_rate': 1.7601189583531887e-05, 'epoch': 0.5} {'loss': 0.5094, 'learning_rate': 1.7600971266357744e-05, 'epoch': 0.5} {'loss': 0.5942, 'learning_rate': 1.760075294060355e-05, 'epoch': 0.5} {'loss': 0.5697, 'learning_rate': 1.760053460626955e-05, 'epoch': 0.5} {'loss': 0.7937, 'learning_rate': 1.7600316263355993e-05, 'epoch': 0.5} {'loss': 0.4923, 'learning_rate': 1.7600097911863124e-05, 'epoch': 0.5} {'loss': 0.6372, 'learning_rate': 1.7599879551791187e-05, 'epoch': 0.5} {'loss': 0.5466, 'learning_rate': 1.7599661183140436e-05, 'epoch': 0.5} {'loss': 0.6401, 'learning_rate': 1.7599442805911108e-05, 'epoch': 0.5} {'loss': 0.5756, 'learning_rate': 1.7599224420103458e-05, 'epoch': 0.5} {'loss': 0.519, 'learning_rate': 1.7599006025717728e-05, 'epoch': 0.5} {'loss': 0.7089, 'learning_rate': 1.7598787622754164e-05, 'epoch': 0.5} {'loss': 0.5754, 'learning_rate': 1.7598569211213015e-05, 'epoch': 0.5} {'loss': 0.4773, 'learning_rate': 1.7598350791094526e-05, 'epoch': 0.5} {'loss': 0.5537, 'learning_rate': 1.7598132362398944e-05, 'epoch': 0.5} {'loss': 0.4346, 'learning_rate': 1.7597913925126514e-05, 'epoch': 0.5} {'loss': 0.6956, 'learning_rate': 1.7597695479277485e-05, 'epoch': 0.5} {'loss': 0.6254, 'learning_rate': 1.7597477024852102e-05, 'epoch': 0.5} {'loss': 0.5226, 'learning_rate': 1.759725856185061e-05, 'epoch': 0.5} {'loss': 0.5576, 'learning_rate': 1.7597040090273262e-05, 'epoch': 0.5} {'loss': 0.5197, 'learning_rate': 1.7596821610120297e-05, 'epoch': 0.5} {'loss': 0.5991, 'learning_rate': 1.759660312139197e-05, 'epoch': 0.5} {'loss': 0.5848, 'learning_rate': 1.7596384624088518e-05, 'epoch': 0.5} {'loss': 0.7529, 'learning_rate': 1.7596166118210193e-05, 'epoch': 0.5} {'loss': 0.4589, 'learning_rate': 1.7595947603757242e-05, 'epoch': 0.5} {'loss': 0.6743, 'learning_rate': 1.759572908072991e-05, 'epoch': 0.5} {'loss': 0.644, 'learning_rate': 1.7595510549128446e-05, 'epoch': 0.5} {'loss': 0.4267, 'learning_rate': 1.7595292008953093e-05, 'epoch': 0.5} {'loss': 0.7126, 'learning_rate': 1.75950734602041e-05, 'epoch': 0.5} {'loss': 0.5562, 'learning_rate': 1.7594854902881713e-05, 'epoch': 0.5} {'loss': 0.4348, 'learning_rate': 1.759463633698618e-05, 'epoch': 0.5} {'loss': 0.5514, 'learning_rate': 1.7594417762517747e-05, 'epoch': 0.5} {'loss': 0.6728, 'learning_rate': 1.7594199179476658e-05, 'epoch': 0.5} {'loss': 0.6508, 'learning_rate': 1.7593980587863163e-05, 'epoch': 0.5} {'loss': 0.522, 'learning_rate': 1.759376198767751e-05, 'epoch': 0.5} {'loss': 0.5476, 'learning_rate': 1.7593543378919943e-05, 'epoch': 0.5} {'loss': 0.4804, 'learning_rate': 1.759332476159071e-05, 'epoch': 0.5} {'loss': 0.7004, 'learning_rate': 1.7593106135690056e-05, 'epoch': 0.5} {'loss': 0.763, 'learning_rate': 1.7592887501218228e-05, 'epoch': 0.5} {'loss': 0.7452, 'learning_rate': 1.7592668858175477e-05, 'epoch': 0.5} {'loss': 0.5152, 'learning_rate': 1.7592450206562043e-05, 'epoch': 0.5} {'loss': 0.5471, 'learning_rate': 1.7592231546378178e-05, 'epoch': 0.5} {'loss': 0.5638, 'learning_rate': 1.7592012877624128e-05, 'epoch': 0.5} {'loss': 0.6063, 'learning_rate': 1.759179420030014e-05, 'epoch': 0.5} {'loss': 0.5012, 'learning_rate': 1.7591575514406457e-05, 'epoch': 0.5} {'loss': 0.5332, 'learning_rate': 1.759135681994333e-05, 'epoch': 0.5} {'loss': 0.7091, 'learning_rate': 1.759113811691101e-05, 'epoch': 0.5} {'loss': 0.5692, 'learning_rate': 1.759091940530973e-05, 'epoch': 0.5} {'loss': 0.6323, 'learning_rate': 1.759070068513975e-05, 'epoch': 0.5} {'loss': 0.6174, 'learning_rate': 1.7590481956401315e-05, 'epoch': 0.5} {'loss': 0.5446, 'learning_rate': 1.7590263219094666e-05, 'epoch': 0.5} {'loss': 0.523, 'learning_rate': 1.7590044473220055e-05, 'epoch': 0.5} {'loss': 0.5768, 'learning_rate': 1.7589825718777723e-05, 'epoch': 0.5} {'loss': 0.6928, 'learning_rate': 1.7589606955767923e-05, 'epoch': 0.5} {'loss': 0.6905, 'learning_rate': 1.75893881841909e-05, 'epoch': 0.5} {'loss': 0.6149, 'learning_rate': 1.7589169404046902e-05, 'epoch': 0.5} {'loss': 0.4957, 'learning_rate': 1.7588950615336172e-05, 'epoch': 0.5} {'loss': 0.6142, 'learning_rate': 1.7588731818058964e-05, 'epoch': 0.5} {'loss': 0.504, 'learning_rate': 1.7588513012215518e-05, 'epoch': 0.5} {'loss': 0.6577, 'learning_rate': 1.7588294197806086e-05, 'epoch': 0.5} {'loss': 0.5949, 'learning_rate': 1.758807537483091e-05, 'epoch': 0.5} {'loss': 0.5513, 'learning_rate': 1.7587856543290244e-05, 'epoch': 0.5} {'loss': 0.7686, 'learning_rate': 1.758763770318433e-05, 'epoch': 0.5} {'loss': 0.6778, 'learning_rate': 1.7587418854513413e-05, 'epoch': 0.5} {'loss': 0.5452, 'learning_rate': 1.758719999727774e-05, 'epoch': 0.5} {'loss': 0.615, 'learning_rate': 1.7586981131477566e-05, 'epoch': 0.5} {'loss': 0.6337, 'learning_rate': 1.7586762257113133e-05, 'epoch': 0.5} {'loss': 0.6436, 'learning_rate': 1.7586543374184688e-05, 'epoch': 0.5} {'loss': 0.5528, 'learning_rate': 1.758632448269248e-05, 'epoch': 0.5} {'loss': 0.4106, 'learning_rate': 1.758610558263675e-05, 'epoch': 0.5} {'loss': 0.6114, 'learning_rate': 1.758588667401775e-05, 'epoch': 0.5} {'loss': 0.6274, 'learning_rate': 1.7585667756835725e-05, 'epoch': 0.5} {'loss': 0.5451, 'learning_rate': 1.7585448831090927e-05, 'epoch': 0.5} {'loss': 0.6578, 'learning_rate': 1.7585229896783602e-05, 'epoch': 0.5} {'loss': 0.5022, 'learning_rate': 1.7585010953913993e-05, 'epoch': 0.5} {'loss': 0.5362, 'learning_rate': 1.7584792002482345e-05, 'epoch': 0.5} {'loss': 0.5482, 'learning_rate': 1.758457304248891e-05, 'epoch': 0.5} {'loss': 0.6505, 'learning_rate': 1.758435407393394e-05, 'epoch': 0.5} {'loss': 0.5248, 'learning_rate': 1.758413509681767e-05, 'epoch': 0.5} {'loss': 0.6848, 'learning_rate': 1.7583916111140355e-05, 'epoch': 0.5} {'loss': 0.6474, 'learning_rate': 1.7583697116902243e-05, 'epoch': 0.5} {'loss': 0.5756, 'learning_rate': 1.758347811410358e-05, 'epoch': 0.5} {'loss': 0.6427, 'learning_rate': 1.758325910274461e-05, 'epoch': 0.5} {'loss': 0.4924, 'learning_rate': 1.7583040082825582e-05, 'epoch': 0.5} {'loss': 0.3643, 'learning_rate': 1.7582821054346743e-05, 'epoch': 0.5} {'loss': 0.5441, 'learning_rate': 1.7582602017308345e-05, 'epoch': 0.5} {'loss': 0.4977, 'learning_rate': 1.758238297171063e-05, 'epoch': 0.5} {'loss': 0.763, 'learning_rate': 1.7582163917553845e-05, 'epoch': 0.5} {'loss': 0.7438, 'learning_rate': 1.758194485483824e-05, 'epoch': 0.5} {'loss': 0.6326, 'learning_rate': 1.758172578356406e-05, 'epoch': 0.5} {'loss': 0.5749, 'learning_rate': 1.758150670373155e-05, 'epoch': 0.5} {'loss': 0.7046, 'learning_rate': 1.7581287615340964e-05, 'epoch': 0.5} {'loss': 0.6392, 'learning_rate': 1.758106851839255e-05, 'epoch': 0.5} {'loss': 0.5725, 'learning_rate': 1.7580849412886546e-05, 'epoch': 0.5} {'loss': 0.5113, 'learning_rate': 1.7580630298823206e-05, 'epoch': 0.5} {'loss': 0.4625, 'learning_rate': 1.7580411176202777e-05, 'epoch': 0.5} {'loss': 0.4724, 'learning_rate': 1.7580192045025503e-05, 'epoch': 0.5} {'loss': 0.4301, 'learning_rate': 1.7579972905291634e-05, 'epoch': 0.5} {'loss': 0.722, 'learning_rate': 1.7579753757001418e-05, 'epoch': 0.5} {'loss': 0.6505, 'learning_rate': 1.7579534600155098e-05, 'epoch': 0.5} {'loss': 0.5716, 'learning_rate': 1.7579315434752932e-05, 'epoch': 0.5} {'loss': 0.692, 'learning_rate': 1.7579096260795154e-05, 'epoch': 0.5} {'loss': 0.3405, 'learning_rate': 1.757887707828202e-05, 'epoch': 0.5} {'loss': 0.5305, 'learning_rate': 1.7578657887213775e-05, 'epoch': 0.5} {'loss': 0.5472, 'learning_rate': 1.7578438687590665e-05, 'epoch': 0.5} {'loss': 0.5786, 'learning_rate': 1.757821947941294e-05, 'epoch': 0.5} {'loss': 0.7345, 'learning_rate': 1.7578000262680845e-05, 'epoch': 0.5} {'loss': 0.4832, 'learning_rate': 1.757778103739463e-05, 'epoch': 0.5} {'loss': 0.5189, 'learning_rate': 1.757756180355454e-05, 'epoch': 0.5} {'loss': 0.5983, 'learning_rate': 1.7577342561160825e-05, 'epoch': 0.5} {'loss': 0.6437, 'learning_rate': 1.757712331021373e-05, 'epoch': 0.5} {'loss': 0.645, 'learning_rate': 1.7576904050713504e-05, 'epoch': 0.5} {'loss': 0.4457, 'learning_rate': 1.7576684782660395e-05, 'epoch': 0.5} {'loss': 0.57, 'learning_rate': 1.7576465506054648e-05, 'epoch': 0.5} {'loss': 0.5215, 'learning_rate': 1.7576246220896515e-05, 'epoch': 0.5} {'loss': 0.5223, 'learning_rate': 1.757602692718624e-05, 'epoch': 0.5} {'loss': 0.7164, 'learning_rate': 1.7575807624924067e-05, 'epoch': 0.5} {'loss': 0.6245, 'learning_rate': 1.757558831411025e-05, 'epoch': 0.5} {'loss': 0.6114, 'learning_rate': 1.7575368994745038e-05, 'epoch': 0.5} {'loss': 0.5417, 'learning_rate': 1.757514966682867e-05, 'epoch': 0.5} {'loss': 0.6421, 'learning_rate': 1.7574930330361405e-05, 'epoch': 0.5} {'loss': 0.6902, 'learning_rate': 1.7574710985343477e-05, 'epoch': 0.5} {'loss': 0.4945, 'learning_rate': 1.7574491631775144e-05, 'epoch': 0.5} {'loss': 0.7723, 'learning_rate': 1.7574272269656648e-05, 'epoch': 0.5} {'loss': 0.5864, 'learning_rate': 1.7574052898988244e-05, 'epoch': 0.5} {'loss': 0.5044, 'learning_rate': 1.757383351977017e-05, 'epoch': 0.5} {'loss': 0.4348, 'learning_rate': 1.7573614132002677e-05, 'epoch': 0.5} {'loss': 0.6392, 'learning_rate': 1.7573394735686018e-05, 'epoch': 0.5} {'loss': 0.6503, 'learning_rate': 1.7573175330820435e-05, 'epoch': 0.5} {'loss': 0.5682, 'learning_rate': 1.757295591740618e-05, 'epoch': 0.5} {'loss': 0.6812, 'learning_rate': 1.7572736495443493e-05, 'epoch': 0.5} {'loss': 0.5574, 'learning_rate': 1.757251706493263e-05, 'epoch': 0.5} {'loss': 0.5045, 'learning_rate': 1.7572297625873834e-05, 'epoch': 0.5} {'loss': 0.6713, 'learning_rate': 1.757207817826735e-05, 'epoch': 0.5} {'loss': 0.5708, 'learning_rate': 1.7571858722113435e-05, 'epoch': 0.5} {'loss': 0.5153, 'learning_rate': 1.757163925741233e-05, 'epoch': 0.5} {'loss': 0.6291, 'learning_rate': 1.7571419784164283e-05, 'epoch': 0.5} {'loss': 0.6646, 'learning_rate': 1.7571200302369544e-05, 'epoch': 0.5} {'loss': 0.6342, 'learning_rate': 1.757098081202836e-05, 'epoch': 0.5} {'loss': 0.492, 'learning_rate': 1.7570761313140977e-05, 'epoch': 0.5} {'loss': 0.6059, 'learning_rate': 1.7570541805707642e-05, 'epoch': 0.5} {'loss': 0.5373, 'learning_rate': 1.757032228972861e-05, 'epoch': 0.5} {'loss': 0.5524, 'learning_rate': 1.757010276520412e-05, 'epoch': 0.5} {'loss': 0.5573, 'learning_rate': 1.7569883232134424e-05, 'epoch': 0.5} {'loss': 0.6338, 'learning_rate': 1.756966369051977e-05, 'epoch': 0.5} {'loss': 0.6883, 'learning_rate': 1.7569444140360405e-05, 'epoch': 0.5} {'loss': 0.6612, 'learning_rate': 1.7569224581656576e-05, 'epoch': 0.5} {'loss': 0.4928, 'learning_rate': 1.7569005014408533e-05, 'epoch': 0.5} {'loss': 0.5446, 'learning_rate': 1.7568785438616522e-05, 'epoch': 0.5} {'loss': 0.7267, 'learning_rate': 1.7568565854280795e-05, 'epoch': 0.5} {'loss': 0.5863, 'learning_rate': 1.756834626140159e-05, 'epoch': 0.5} {'loss': 0.5649, 'learning_rate': 1.7568126659979165e-05, 'epoch': 0.5} {'loss': 0.6842, 'learning_rate': 1.7567907050013766e-05, 'epoch': 0.5} {'loss': 0.4429, 'learning_rate': 1.7567687431505637e-05, 'epoch': 0.5} {'loss': 0.6756, 'learning_rate': 1.7567467804455027e-05, 'epoch': 0.5} {'loss': 0.6284, 'learning_rate': 1.7567248168862186e-05, 'epoch': 0.5} {'loss': 0.6295, 'learning_rate': 1.756702852472736e-05, 'epoch': 0.5} {'loss': 0.525, 'learning_rate': 1.7566808872050795e-05, 'epoch': 0.5} {'loss': 0.6507, 'learning_rate': 1.7566589210832744e-05, 'epoch': 0.5} {'loss': 0.3892, 'learning_rate': 1.7566369541073456e-05, 'epoch': 0.5} {'loss': 0.6632, 'learning_rate': 1.7566149862773173e-05, 'epoch': 0.5} {'loss': 0.5339, 'learning_rate': 1.7565930175932148e-05, 'epoch': 0.5} {'loss': 0.5067, 'learning_rate': 1.756571048055062e-05, 'epoch': 0.5} {'loss': 0.5383, 'learning_rate': 1.756549077662885e-05, 'epoch': 0.5} {'loss': 0.7113, 'learning_rate': 1.756527106416708e-05, 'epoch': 0.5} {'loss': 0.5579, 'learning_rate': 1.756505134316555e-05, 'epoch': 0.5} {'loss': 0.6897, 'learning_rate': 1.756483161362452e-05, 'epoch': 0.5} {'loss': 0.7445, 'learning_rate': 1.7564611875544237e-05, 'epoch': 0.5} {'loss': 0.489, 'learning_rate': 1.7564392128924942e-05, 'epoch': 0.5} {'loss': 0.7228, 'learning_rate': 1.756417237376689e-05, 'epoch': 0.5} {'loss': 0.4653, 'learning_rate': 1.7563952610070322e-05, 'epoch': 0.5} {'loss': 0.4991, 'learning_rate': 1.756373283783549e-05, 'epoch': 0.5} {'loss': 0.4819, 'learning_rate': 1.7563513057062642e-05, 'epoch': 0.5} {'loss': 0.6634, 'learning_rate': 1.756329326775203e-05, 'epoch': 0.5} {'loss': 0.6074, 'learning_rate': 1.756307346990389e-05, 'epoch': 0.5} {'loss': 0.798, 'learning_rate': 1.7562853663518488e-05, 'epoch': 0.5} {'loss': 0.6308, 'learning_rate': 1.756263384859606e-05, 'epoch': 0.5} {'loss': 0.54, 'learning_rate': 1.756241402513685e-05, 'epoch': 0.5} {'loss': 0.621, 'learning_rate': 1.7562194193141116e-05, 'epoch': 0.5} {'loss': 0.5147, 'learning_rate': 1.7561974352609104e-05, 'epoch': 0.5} {'loss': 0.5761, 'learning_rate': 1.7561754503541063e-05, 'epoch': 0.5} {'loss': 0.506, 'learning_rate': 1.7561534645937237e-05, 'epoch': 0.5} {'loss': 0.4701, 'learning_rate': 1.7561314779797873e-05, 'epoch': 0.5} {'loss': 0.4826, 'learning_rate': 1.7561094905123226e-05, 'epoch': 0.5} {'loss': 0.495, 'learning_rate': 1.756087502191354e-05, 'epoch': 0.5} {'loss': 0.5032, 'learning_rate': 1.7560655130169065e-05, 'epoch': 0.5} {'loss': 0.4683, 'learning_rate': 1.7560435229890046e-05, 'epoch': 0.5} {'loss': 0.549, 'learning_rate': 1.7560215321076735e-05, 'epoch': 0.5} {'loss': 0.6691, 'learning_rate': 1.755999540372938e-05, 'epoch': 0.5} {'loss': 0.6101, 'learning_rate': 1.7559775477848222e-05, 'epoch': 0.5} {'loss': 0.6227, 'learning_rate': 1.755955554343352e-05, 'epoch': 0.5} {'loss': 0.8032, 'learning_rate': 1.7559335600485518e-05, 'epoch': 0.5} {'loss': 0.6582, 'learning_rate': 1.7559115649004458e-05, 'epoch': 0.5} {'loss': 0.7449, 'learning_rate': 1.7558895688990598e-05, 'epoch': 0.5} {'loss': 0.5246, 'learning_rate': 1.755867572044418e-05, 'epoch': 0.5} {'loss': 0.3871, 'learning_rate': 1.755845574336546e-05, 'epoch': 0.5} {'loss': 0.5628, 'learning_rate': 1.7558235757754675e-05, 'epoch': 0.5} {'loss': 0.7267, 'learning_rate': 1.7558015763612082e-05, 'epoch': 0.5} {'loss': 0.5123, 'learning_rate': 1.7557795760937926e-05, 'epoch': 0.5} {'loss': 0.4233, 'learning_rate': 1.7557575749732458e-05, 'epoch': 0.5} {'loss': 0.6472, 'learning_rate': 1.755735572999592e-05, 'epoch': 0.5} {'loss': 0.5868, 'learning_rate': 1.7557135701728562e-05, 'epoch': 0.5} {'loss': 0.5165, 'learning_rate': 1.755691566493064e-05, 'epoch': 0.5} {'loss': 0.6318, 'learning_rate': 1.7556695619602396e-05, 'epoch': 0.5} {'loss': 0.6161, 'learning_rate': 1.755647556574408e-05, 'epoch': 0.5} {'loss': 0.5743, 'learning_rate': 1.755625550335594e-05, 'epoch': 0.5} {'loss': 0.5428, 'learning_rate': 1.7556035432438223e-05, 'epoch': 0.5} {'loss': 0.6032, 'learning_rate': 1.755581535299118e-05, 'epoch': 0.5} {'loss': 0.5448, 'learning_rate': 1.755559526501506e-05, 'epoch': 0.5} {'loss': 0.6011, 'learning_rate': 1.7555375168510106e-05, 'epoch': 0.5} {'loss': 0.7442, 'learning_rate': 1.7555155063476572e-05, 'epoch': 0.5} {'loss': 0.6895, 'learning_rate': 1.7554934949914704e-05, 'epoch': 0.5} {'loss': 0.6709, 'learning_rate': 1.755471482782475e-05, 'epoch': 0.5} {'loss': 0.6496, 'learning_rate': 1.7554494697206964e-05, 'epoch': 0.5} {'loss': 0.5185, 'learning_rate': 1.7554274558061584e-05, 'epoch': 0.5} {'loss': 0.6677, 'learning_rate': 1.755405441038887e-05, 'epoch': 0.5} {'loss': 0.6168, 'learning_rate': 1.7553834254189062e-05, 'epoch': 0.5} {'loss': 0.5983, 'learning_rate': 1.7553614089462413e-05, 'epoch': 0.5} {'loss': 0.6807, 'learning_rate': 1.755339391620917e-05, 'epoch': 0.5} {'loss': 0.6906, 'learning_rate': 1.755317373442958e-05, 'epoch': 0.5} {'loss': 0.5439, 'learning_rate': 1.7552953544123893e-05, 'epoch': 0.5} {'loss': 0.5805, 'learning_rate': 1.755273334529236e-05, 'epoch': 0.5} {'loss': 0.4487, 'learning_rate': 1.7552513137935227e-05, 'epoch': 0.5} {'loss': 0.6643, 'learning_rate': 1.755229292205274e-05, 'epoch': 0.5} {'loss': 0.5008, 'learning_rate': 1.7552072697645152e-05, 'epoch': 0.5} {'loss': 0.4593, 'learning_rate': 1.755185246471271e-05, 'epoch': 0.5} {'loss': 0.6294, 'learning_rate': 1.7551632223255663e-05, 'epoch': 0.5} {'loss': 0.5191, 'learning_rate': 1.7551411973274263e-05, 'epoch': 0.5} {'loss': 0.551, 'learning_rate': 1.7551191714768747e-05, 'epoch': 0.5} {'loss': 0.5881, 'learning_rate': 1.7550971447739376e-05, 'epoch': 0.5} {'loss': 0.649, 'learning_rate': 1.7550751172186396e-05, 'epoch': 0.5} {'loss': 0.5143, 'learning_rate': 1.755053088811005e-05, 'epoch': 0.5} {'loss': 0.5036, 'learning_rate': 1.755031059551059e-05, 'epoch': 0.5} {'loss': 0.4582, 'learning_rate': 1.755009029438827e-05, 'epoch': 0.5} {'loss': 0.6804, 'learning_rate': 1.7549869984743328e-05, 'epoch': 0.5} {'loss': 0.6422, 'learning_rate': 1.7549649666576023e-05, 'epoch': 0.5} {'loss': 0.6012, 'learning_rate': 1.7549429339886598e-05, 'epoch': 0.5} {'loss': 0.5311, 'learning_rate': 1.75492090046753e-05, 'epoch': 0.5} {'loss': 0.6499, 'learning_rate': 1.7548988660942382e-05, 'epoch': 0.5} {'loss': 0.5917, 'learning_rate': 1.7548768308688093e-05, 'epoch': 0.5} {'loss': 0.607, 'learning_rate': 1.754854794791268e-05, 'epoch': 0.5} {'loss': 0.6422, 'learning_rate': 1.7548327578616392e-05, 'epoch': 0.5} {'loss': 0.6463, 'learning_rate': 1.7548107200799475e-05, 'epoch': 0.5} {'loss': 0.8329, 'learning_rate': 1.7547886814462183e-05, 'epoch': 0.5} {'loss': 0.517, 'learning_rate': 1.7547666419604762e-05, 'epoch': 0.5} {'loss': 0.6123, 'learning_rate': 1.7547446016227457e-05, 'epoch': 0.5} {'loss': 0.5978, 'learning_rate': 1.7547225604330525e-05, 'epoch': 0.5} {'loss': 0.6841, 'learning_rate': 1.7547005183914207e-05, 'epoch': 0.5} {'loss': 0.5407, 'learning_rate': 1.7546784754978757e-05, 'epoch': 0.5} {'loss': 0.6032, 'learning_rate': 1.7546564317524423e-05, 'epoch': 0.5} {'loss': 0.6078, 'learning_rate': 1.7546343871551454e-05, 'epoch': 0.5} {'loss': 0.5696, 'learning_rate': 1.7546123417060095e-05, 'epoch': 0.5} {'loss': 0.5931, 'learning_rate': 1.75459029540506e-05, 'epoch': 0.5} {'loss': 0.6978, 'learning_rate': 1.7545682482523212e-05, 'epoch': 0.5} {'loss': 0.602, 'learning_rate': 1.7545462002478184e-05, 'epoch': 0.5} {'loss': 0.5645, 'learning_rate': 1.7545241513915768e-05, 'epoch': 0.5} {'loss': 0.5372, 'learning_rate': 1.7545021016836206e-05, 'epoch': 0.5} {'loss': 0.5733, 'learning_rate': 1.754480051123975e-05, 'epoch': 0.5} {'loss': 0.7456, 'learning_rate': 1.754457999712665e-05, 'epoch': 0.5} {'loss': 0.5924, 'learning_rate': 1.7544359474497156e-05, 'epoch': 0.5} {'loss': 0.6554, 'learning_rate': 1.754413894335151e-05, 'epoch': 0.5} {'loss': 0.5172, 'learning_rate': 1.754391840368997e-05, 'epoch': 0.5} {'loss': 0.512, 'learning_rate': 1.7543697855512775e-05, 'epoch': 0.5} {'loss': 0.6621, 'learning_rate': 1.7543477298820186e-05, 'epoch': 0.5} {'loss': 0.5492, 'learning_rate': 1.7543256733612445e-05, 'epoch': 0.5} {'loss': 0.5487, 'learning_rate': 1.7543036159889798e-05, 'epoch': 0.5} {'loss': 0.6749, 'learning_rate': 1.7542815577652497e-05, 'epoch': 0.5} {'loss': 0.7054, 'learning_rate': 1.7542594986900795e-05, 'epoch': 0.5} {'loss': 0.5853, 'learning_rate': 1.7542374387634934e-05, 'epoch': 0.5} {'loss': 0.5636, 'learning_rate': 1.7542153779855172e-05, 'epoch': 0.5} {'loss': 0.668, 'learning_rate': 1.754193316356175e-05, 'epoch': 0.5} {'loss': 0.4677, 'learning_rate': 1.7541712538754918e-05, 'epoch': 0.5} {'loss': 0.3687, 'learning_rate': 1.7541491905434927e-05, 'epoch': 0.5} {'loss': 0.548, 'learning_rate': 1.7541271263602025e-05, 'epoch': 0.5} {'loss': 0.5077, 'learning_rate': 1.7541050613256465e-05, 'epoch': 0.5} {'loss': 0.679, 'learning_rate': 1.754082995439849e-05, 'epoch': 0.5} {'loss': 0.5305, 'learning_rate': 1.7540609287028353e-05, 'epoch': 0.5} {'loss': 0.4656, 'learning_rate': 1.7540388611146302e-05, 'epoch': 0.5} {'loss': 0.5701, 'learning_rate': 1.7540167926752586e-05, 'epoch': 0.5} {'loss': 0.6617, 'learning_rate': 1.7539947233847453e-05, 'epoch': 0.5} {'loss': 0.6004, 'learning_rate': 1.7539726532431153e-05, 'epoch': 0.5} {'loss': 0.5037, 'learning_rate': 1.753950582250394e-05, 'epoch': 0.5} {'loss': 0.5743, 'learning_rate': 1.7539285104066053e-05, 'epoch': 0.5} {'loss': 0.6974, 'learning_rate': 1.753906437711775e-05, 'epoch': 0.5} {'loss': 0.5875, 'learning_rate': 1.753884364165928e-05, 'epoch': 0.5} {'loss': 0.4933, 'learning_rate': 1.7538622897690883e-05, 'epoch': 0.5} {'loss': 0.4229, 'learning_rate': 1.7538402145212818e-05, 'epoch': 0.5} {'loss': 0.5756, 'learning_rate': 1.753818138422533e-05, 'epoch': 0.5} {'loss': 0.6447, 'learning_rate': 1.7537960614728667e-05, 'epoch': 0.5} {'loss': 0.5914, 'learning_rate': 1.753773983672308e-05, 'epoch': 0.5} {'loss': 0.3889, 'learning_rate': 1.753751905020882e-05, 'epoch': 0.5} {'loss': 0.5278, 'learning_rate': 1.7537298255186135e-05, 'epoch': 0.5} {'loss': 0.5985, 'learning_rate': 1.753707745165527e-05, 'epoch': 0.5} {'loss': 0.637, 'learning_rate': 1.753685663961648e-05, 'epoch': 0.5} {'loss': 0.6252, 'learning_rate': 1.753663581907001e-05, 'epoch': 0.5} {'loss': 0.4903, 'learning_rate': 1.7536414990016116e-05, 'epoch': 0.5} {'loss': 0.6136, 'learning_rate': 1.7536194152455038e-05, 'epoch': 0.5} {'loss': 0.5017, 'learning_rate': 1.7535973306387032e-05, 'epoch': 0.5} {'loss': 0.5866, 'learning_rate': 1.7535752451812346e-05, 'epoch': 0.5} {'loss': 0.5459, 'learning_rate': 1.7535531588731226e-05, 'epoch': 0.5} {'loss': 0.5021, 'learning_rate': 1.7535310717143926e-05, 'epoch': 0.5} {'loss': 0.7522, 'learning_rate': 1.7535089837050692e-05, 'epoch': 0.5} {'loss': 0.5832, 'learning_rate': 1.7534868948451773e-05, 'epoch': 0.5} {'loss': 0.6324, 'learning_rate': 1.7534648051347423e-05, 'epoch': 0.5} {'loss': 0.4441, 'learning_rate': 1.7534427145737883e-05, 'epoch': 0.5} {'loss': 0.6148, 'learning_rate': 1.753420623162341e-05, 'epoch': 0.5} {'loss': 0.621, 'learning_rate': 1.7533985309004254e-05, 'epoch': 0.5} {'loss': 0.4669, 'learning_rate': 1.753376437788066e-05, 'epoch': 0.5} {'loss': 0.6778, 'learning_rate': 1.7533543438252877e-05, 'epoch': 0.5} {'loss': 0.4461, 'learning_rate': 1.7533322490121155e-05, 'epoch': 0.5} {'loss': 0.5322, 'learning_rate': 1.7533101533485747e-05, 'epoch': 0.5} {'loss': 0.548, 'learning_rate': 1.7532880568346898e-05, 'epoch': 0.5} {'loss': 0.6268, 'learning_rate': 1.753265959470486e-05, 'epoch': 0.5} {'loss': 0.6224, 'learning_rate': 1.7532438612559884e-05, 'epoch': 0.5} {'loss': 0.5459, 'learning_rate': 1.7532217621912215e-05, 'epoch': 0.5} {'loss': 0.5835, 'learning_rate': 1.7531996622762102e-05, 'epoch': 0.5} {'loss': 0.6065, 'learning_rate': 1.7531775615109802e-05, 'epoch': 0.51} {'loss': 0.5082, 'learning_rate': 1.7531554598955555e-05, 'epoch': 0.51} {'loss': 0.6035, 'learning_rate': 1.7531333574299617e-05, 'epoch': 0.51} {'loss': 0.6386, 'learning_rate': 1.7531112541142237e-05, 'epoch': 0.51} {'loss': 0.7035, 'learning_rate': 1.7530891499483664e-05, 'epoch': 0.51} {'loss': 0.6385, 'learning_rate': 1.7530670449324144e-05, 'epoch': 0.51} {'loss': 0.5504, 'learning_rate': 1.753044939066393e-05, 'epoch': 0.51} {'loss': 0.5913, 'learning_rate': 1.7530228323503272e-05, 'epoch': 0.51} {'loss': 0.5648, 'learning_rate': 1.7530007247842412e-05, 'epoch': 0.51} {'loss': 0.4639, 'learning_rate': 1.7529786163681614e-05, 'epoch': 0.51} {'loss': 0.6728, 'learning_rate': 1.7529565071021114e-05, 'epoch': 0.51} {'loss': 0.5819, 'learning_rate': 1.7529343969861167e-05, 'epoch': 0.51} {'loss': 0.5557, 'learning_rate': 1.7529122860202024e-05, 'epoch': 0.51} {'loss': 0.6478, 'learning_rate': 1.7528901742043932e-05, 'epoch': 0.51} {'loss': 0.6252, 'learning_rate': 1.752868061538714e-05, 'epoch': 0.51} {'loss': 0.6309, 'learning_rate': 1.7528459480231904e-05, 'epoch': 0.51} {'loss': 0.6282, 'learning_rate': 1.7528238336578465e-05, 'epoch': 0.51} {'loss': 0.5598, 'learning_rate': 1.752801718442708e-05, 'epoch': 0.51} {'loss': 0.5258, 'learning_rate': 1.752779602377799e-05, 'epoch': 0.51} {'loss': 0.5082, 'learning_rate': 1.7527574854631456e-05, 'epoch': 0.51} {'loss': 0.4702, 'learning_rate': 1.7527353676987718e-05, 'epoch': 0.51} {'loss': 0.529, 'learning_rate': 1.752713249084703e-05, 'epoch': 0.51} {'loss': 0.4355, 'learning_rate': 1.7526911296209637e-05, 'epoch': 0.51} {'loss': 0.6157, 'learning_rate': 1.7526690093075797e-05, 'epoch': 0.51} {'loss': 0.6207, 'learning_rate': 1.7526468881445753e-05, 'epoch': 0.51} {'loss': 0.3983, 'learning_rate': 1.7526247661319757e-05, 'epoch': 0.51} {'loss': 0.6262, 'learning_rate': 1.752602643269806e-05, 'epoch': 0.51} {'loss': 0.4539, 'learning_rate': 1.7525805195580908e-05, 'epoch': 0.51} {'loss': 0.6234, 'learning_rate': 1.7525583949968556e-05, 'epoch': 0.51} {'loss': 0.4295, 'learning_rate': 1.752536269586125e-05, 'epoch': 0.51} {'loss': 0.5353, 'learning_rate': 1.7525141433259238e-05, 'epoch': 0.51} {'loss': 0.658, 'learning_rate': 1.7524920162162774e-05, 'epoch': 0.51} {'loss': 0.6771, 'learning_rate': 1.7524698882572108e-05, 'epoch': 0.51} {'loss': 0.4594, 'learning_rate': 1.7524477594487487e-05, 'epoch': 0.51} {'loss': 0.6336, 'learning_rate': 1.752425629790916e-05, 'epoch': 0.51} {'loss': 0.5187, 'learning_rate': 1.7524034992837377e-05, 'epoch': 0.51} {'loss': 0.5386, 'learning_rate': 1.7523813679272392e-05, 'epoch': 0.51} {'loss': 0.7694, 'learning_rate': 1.752359235721445e-05, 'epoch': 0.51} {'loss': 0.6648, 'learning_rate': 1.7523371026663804e-05, 'epoch': 0.51} {'loss': 0.5467, 'learning_rate': 1.7523149687620705e-05, 'epoch': 0.51} {'loss': 0.5857, 'learning_rate': 1.7522928340085396e-05, 'epoch': 0.51} {'loss': 0.7128, 'learning_rate': 1.7522706984058135e-05, 'epoch': 0.51} {'loss': 0.5301, 'learning_rate': 1.7522485619539165e-05, 'epoch': 0.51} {'loss': 0.5447, 'learning_rate': 1.7522264246528744e-05, 'epoch': 0.51} {'loss': 0.5007, 'learning_rate': 1.7522042865027113e-05, 'epoch': 0.51} {'loss': 0.4837, 'learning_rate': 1.752182147503453e-05, 'epoch': 0.51} {'loss': 0.6399, 'learning_rate': 1.7521600076551238e-05, 'epoch': 0.51} {'loss': 0.6724, 'learning_rate': 1.7521378669577493e-05, 'epoch': 0.51} {'loss': 0.4813, 'learning_rate': 1.7521157254113537e-05, 'epoch': 0.51} {'loss': 0.6369, 'learning_rate': 1.7520935830159627e-05, 'epoch': 0.51} {'loss': 0.5873, 'learning_rate': 1.752071439771601e-05, 'epoch': 0.51} {'loss': 0.6832, 'learning_rate': 1.7520492956782936e-05, 'epoch': 0.51} {'loss': 0.5728, 'learning_rate': 1.7520271507360656e-05, 'epoch': 0.51} {'loss': 0.5539, 'learning_rate': 1.752005004944942e-05, 'epoch': 0.51} {'loss': 0.5782, 'learning_rate': 1.751982858304948e-05, 'epoch': 0.51} {'loss': 0.5872, 'learning_rate': 1.751960710816108e-05, 'epoch': 0.51} {'loss': 0.4901, 'learning_rate': 1.7519385624784474e-05, 'epoch': 0.51} {'loss': 0.5201, 'learning_rate': 1.751916413291991e-05, 'epoch': 0.51} {'loss': 0.6042, 'learning_rate': 1.7518942632567645e-05, 'epoch': 0.51} {'loss': 0.6289, 'learning_rate': 1.7518721123727918e-05, 'epoch': 0.51} {'loss': 0.6827, 'learning_rate': 1.7518499606400986e-05, 'epoch': 0.51} {'loss': 0.6751, 'learning_rate': 1.75182780805871e-05, 'epoch': 0.51} {'loss': 0.5356, 'learning_rate': 1.7518056546286507e-05, 'epoch': 0.51} {'loss': 0.51, 'learning_rate': 1.7517835003499455e-05, 'epoch': 0.51} {'loss': 0.6794, 'learning_rate': 1.75176134522262e-05, 'epoch': 0.51} {'loss': 0.6713, 'learning_rate': 1.7517391892466986e-05, 'epoch': 0.51} {'loss': 0.4568, 'learning_rate': 1.7517170324222064e-05, 'epoch': 0.51} {'loss': 0.675, 'learning_rate': 1.7516948747491695e-05, 'epoch': 0.51} {'loss': 0.5493, 'learning_rate': 1.7516727162276112e-05, 'epoch': 0.51} {'loss': 0.5749, 'learning_rate': 1.7516505568575576e-05, 'epoch': 0.51} {'loss': 0.8086, 'learning_rate': 1.7516283966390336e-05, 'epoch': 0.51} {'loss': 0.6474, 'learning_rate': 1.751606235572064e-05, 'epoch': 0.51} {'loss': 0.7156, 'learning_rate': 1.751584073656674e-05, 'epoch': 0.51} {'loss': 0.5649, 'learning_rate': 1.751561910892888e-05, 'epoch': 0.51} {'loss': 0.6008, 'learning_rate': 1.7515397472807323e-05, 'epoch': 0.51} {'loss': 0.4605, 'learning_rate': 1.7515175828202307e-05, 'epoch': 0.51} {'loss': 0.5592, 'learning_rate': 1.7514954175114086e-05, 'epoch': 0.51} {'loss': 0.5461, 'learning_rate': 1.751473251354291e-05, 'epoch': 0.51} {'loss': 0.5925, 'learning_rate': 1.7514510843489033e-05, 'epoch': 0.51} {'loss': 0.6583, 'learning_rate': 1.75142891649527e-05, 'epoch': 0.51} {'loss': 0.4609, 'learning_rate': 1.7514067477934165e-05, 'epoch': 0.51} {'loss': 0.509, 'learning_rate': 1.7513845782433676e-05, 'epoch': 0.51} {'loss': 0.3544, 'learning_rate': 1.7513624078451484e-05, 'epoch': 0.51} {'loss': 0.5517, 'learning_rate': 1.751340236598784e-05, 'epoch': 0.51} {'loss': 0.7773, 'learning_rate': 1.751318064504299e-05, 'epoch': 0.51} {'loss': 0.4928, 'learning_rate': 1.751295891561719e-05, 'epoch': 0.51} {'loss': 0.3781, 'learning_rate': 1.7512737177710687e-05, 'epoch': 0.51} {'loss': 0.6832, 'learning_rate': 1.7512515431323735e-05, 'epoch': 0.51} {'loss': 0.6469, 'learning_rate': 1.751229367645658e-05, 'epoch': 0.51} {'loss': 0.5093, 'learning_rate': 1.7512071913109474e-05, 'epoch': 0.51} {'loss': 0.5695, 'learning_rate': 1.7511850141282667e-05, 'epoch': 0.51} {'loss': 0.6499, 'learning_rate': 1.751162836097641e-05, 'epoch': 0.51} {'loss': 0.4962, 'learning_rate': 1.7511406572190955e-05, 'epoch': 0.51} {'loss': 0.6677, 'learning_rate': 1.751118477492655e-05, 'epoch': 0.51} {'loss': 0.4855, 'learning_rate': 1.751096296918344e-05, 'epoch': 0.51} {'loss': 0.5754, 'learning_rate': 1.7510741154961886e-05, 'epoch': 0.51} {'loss': 0.495, 'learning_rate': 1.751051933226213e-05, 'epoch': 0.51} {'loss': 0.5544, 'learning_rate': 1.7510297501084433e-05, 'epoch': 0.51} {'loss': 0.5432, 'learning_rate': 1.7510075661429033e-05, 'epoch': 0.51} {'loss': 0.6034, 'learning_rate': 1.750985381329619e-05, 'epoch': 0.51} {'loss': 0.6083, 'learning_rate': 1.7509631956686144e-05, 'epoch': 0.51} {'loss': 0.703, 'learning_rate': 1.7509410091599152e-05, 'epoch': 0.51} {'loss': 0.5349, 'learning_rate': 1.7509188218035468e-05, 'epoch': 0.51} {'loss': 0.5616, 'learning_rate': 1.7508966335995336e-05, 'epoch': 0.51} {'loss': 0.7306, 'learning_rate': 1.750874444547901e-05, 'epoch': 0.51} {'loss': 0.5482, 'learning_rate': 1.750852254648674e-05, 'epoch': 0.51} {'loss': 0.6187, 'learning_rate': 1.7508300639018775e-05, 'epoch': 0.51} {'loss': 0.4647, 'learning_rate': 1.7508078723075363e-05, 'epoch': 0.51} {'loss': 0.7874, 'learning_rate': 1.7507856798656763e-05, 'epoch': 0.51} {'loss': 0.562, 'learning_rate': 1.7507634865763215e-05, 'epoch': 0.51} {'loss': 0.5048, 'learning_rate': 1.750741292439498e-05, 'epoch': 0.51} {'loss': 0.7245, 'learning_rate': 1.75071909745523e-05, 'epoch': 0.51} {'loss': 0.6117, 'learning_rate': 1.750696901623543e-05, 'epoch': 0.51} {'loss': 0.625, 'learning_rate': 1.750674704944462e-05, 'epoch': 0.51} {'loss': 0.6989, 'learning_rate': 1.7506525074180124e-05, 'epoch': 0.51} {'loss': 0.7754, 'learning_rate': 1.750630309044218e-05, 'epoch': 0.51} {'loss': 0.5596, 'learning_rate': 1.7506081098231054e-05, 'epoch': 0.51} {'loss': 0.4288, 'learning_rate': 1.750585909754699e-05, 'epoch': 0.51} {'loss': 0.5045, 'learning_rate': 1.750563708839023e-05, 'epoch': 0.51} {'loss': 0.627, 'learning_rate': 1.7505415070761042e-05, 'epoch': 0.51} {'loss': 0.5664, 'learning_rate': 1.7505193044659664e-05, 'epoch': 0.51} {'loss': 0.5878, 'learning_rate': 1.750497101008635e-05, 'epoch': 0.51} {'loss': 0.7208, 'learning_rate': 1.7504748967041354e-05, 'epoch': 0.51} {'loss': 0.5822, 'learning_rate': 1.750452691552492e-05, 'epoch': 0.51} {'loss': 0.6607, 'learning_rate': 1.7504304855537302e-05, 'epoch': 0.51} {'loss': 0.6332, 'learning_rate': 1.7504082787078754e-05, 'epoch': 0.51} {'loss': 0.5335, 'learning_rate': 1.7503860710149524e-05, 'epoch': 0.51} {'loss': 0.5918, 'learning_rate': 1.750363862474986e-05, 'epoch': 0.51} {'loss': 0.7745, 'learning_rate': 1.7503416530880013e-05, 'epoch': 0.51} {'loss': 0.647, 'learning_rate': 1.750319442854024e-05, 'epoch': 0.51} {'loss': 0.6037, 'learning_rate': 1.7502972317730785e-05, 'epoch': 0.51} {'loss': 0.6703, 'learning_rate': 1.75027501984519e-05, 'epoch': 0.51} {'loss': 0.5191, 'learning_rate': 1.7502528070703836e-05, 'epoch': 0.51} {'loss': 0.4688, 'learning_rate': 1.7502305934486846e-05, 'epoch': 0.51} {'loss': 0.6249, 'learning_rate': 1.7502083789801177e-05, 'epoch': 0.51} {'loss': 0.6422, 'learning_rate': 1.7501861636647083e-05, 'epoch': 0.51} {'loss': 0.5713, 'learning_rate': 1.7501639475024817e-05, 'epoch': 0.51} {'loss': 0.5904, 'learning_rate': 1.7501417304934624e-05, 'epoch': 0.51} {'loss': 0.7368, 'learning_rate': 1.7501195126376757e-05, 'epoch': 0.51} {'loss': 0.756, 'learning_rate': 1.750097293935147e-05, 'epoch': 0.51} {'loss': 0.4828, 'learning_rate': 1.7500750743859008e-05, 'epoch': 0.51} {'loss': 0.5358, 'learning_rate': 1.7500528539899627e-05, 'epoch': 0.51} {'loss': 0.4545, 'learning_rate': 1.750030632747357e-05, 'epoch': 0.51} {'loss': 0.4459, 'learning_rate': 1.75000841065811e-05, 'epoch': 0.51} {'loss': 0.6351, 'learning_rate': 1.7499861877222457e-05, 'epoch': 0.51} {'loss': 0.6023, 'learning_rate': 1.7499639639397902e-05, 'epoch': 0.51} {'loss': 0.589, 'learning_rate': 1.7499417393107673e-05, 'epoch': 0.51} {'loss': 0.4791, 'learning_rate': 1.749919513835203e-05, 'epoch': 0.51} {'loss': 0.529, 'learning_rate': 1.7498972875131225e-05, 'epoch': 0.51} {'loss': 0.4671, 'learning_rate': 1.7498750603445502e-05, 'epoch': 0.51} {'loss': 0.5579, 'learning_rate': 1.7498528323295114e-05, 'epoch': 0.51} {'loss': 0.6964, 'learning_rate': 1.7498306034680315e-05, 'epoch': 0.51} {'loss': 0.5776, 'learning_rate': 1.7498083737601357e-05, 'epoch': 0.51} {'loss': 0.6108, 'learning_rate': 1.7497861432058486e-05, 'epoch': 0.51} {'loss': 0.6634, 'learning_rate': 1.7497639118051958e-05, 'epoch': 0.51} {'loss': 0.4945, 'learning_rate': 1.7497416795582018e-05, 'epoch': 0.51} {'loss': 0.6665, 'learning_rate': 1.749719446464892e-05, 'epoch': 0.51} {'loss': 0.5859, 'learning_rate': 1.749697212525292e-05, 'epoch': 0.51} {'loss': 0.5964, 'learning_rate': 1.7496749777394258e-05, 'epoch': 0.51} {'loss': 0.5639, 'learning_rate': 1.749652742107319e-05, 'epoch': 0.51} {'loss': 0.3776, 'learning_rate': 1.7496305056289972e-05, 'epoch': 0.51} {'loss': 0.6931, 'learning_rate': 1.7496082683044852e-05, 'epoch': 0.51} {'loss': 0.6677, 'learning_rate': 1.749586030133808e-05, 'epoch': 0.51} {'loss': 0.6088, 'learning_rate': 1.7495637911169906e-05, 'epoch': 0.51} {'loss': 0.6078, 'learning_rate': 1.749541551254058e-05, 'epoch': 0.51} {'loss': 0.4636, 'learning_rate': 1.749519310545036e-05, 'epoch': 0.51} {'loss': 0.6061, 'learning_rate': 1.7494970689899488e-05, 'epoch': 0.51} {'loss': 0.4974, 'learning_rate': 1.749474826588822e-05, 'epoch': 0.51} {'loss': 0.5821, 'learning_rate': 1.7494525833416806e-05, 'epoch': 0.51} {'loss': 0.6196, 'learning_rate': 1.74943033924855e-05, 'epoch': 0.51} {'loss': 0.6753, 'learning_rate': 1.7494080943094548e-05, 'epoch': 0.51} {'loss': 0.4971, 'learning_rate': 1.7493858485244203e-05, 'epoch': 0.51} {'loss': 0.5653, 'learning_rate': 1.749363601893472e-05, 'epoch': 0.51} {'loss': 0.6308, 'learning_rate': 1.7493413544166346e-05, 'epoch': 0.51} {'loss': 0.5551, 'learning_rate': 1.7493191060939334e-05, 'epoch': 0.51} {'loss': 0.4891, 'learning_rate': 1.7492968569253933e-05, 'epoch': 0.51} {'loss': 0.6132, 'learning_rate': 1.7492746069110396e-05, 'epoch': 0.51} {'loss': 0.5248, 'learning_rate': 1.749252356050897e-05, 'epoch': 0.51} {'loss': 0.6248, 'learning_rate': 1.749230104344991e-05, 'epoch': 0.51} {'loss': 0.6088, 'learning_rate': 1.7492078517933472e-05, 'epoch': 0.51} {'loss': 0.6558, 'learning_rate': 1.74918559839599e-05, 'epoch': 0.51} {'loss': 0.497, 'learning_rate': 1.7491633441529446e-05, 'epoch': 0.51} {'loss': 0.5657, 'learning_rate': 1.7491410890642365e-05, 'epoch': 0.51} {'loss': 0.4773, 'learning_rate': 1.7491188331298902e-05, 'epoch': 0.51} {'loss': 0.6288, 'learning_rate': 1.7490965763499314e-05, 'epoch': 0.51} {'loss': 0.6029, 'learning_rate': 1.749074318724385e-05, 'epoch': 0.51} {'loss': 0.6494, 'learning_rate': 1.749052060253276e-05, 'epoch': 0.51} {'loss': 0.4723, 'learning_rate': 1.74902980093663e-05, 'epoch': 0.51} {'loss': 0.6071, 'learning_rate': 1.7490075407744712e-05, 'epoch': 0.51} {'loss': 0.6912, 'learning_rate': 1.7489852797668255e-05, 'epoch': 0.51} {'loss': 0.5802, 'learning_rate': 1.748963017913718e-05, 'epoch': 0.51} {'loss': 0.6446, 'learning_rate': 1.7489407552151737e-05, 'epoch': 0.51} {'loss': 0.5364, 'learning_rate': 1.748918491671218e-05, 'epoch': 0.51} {'loss': 0.7372, 'learning_rate': 1.7488962272818752e-05, 'epoch': 0.51} {'loss': 0.6069, 'learning_rate': 1.748873962047171e-05, 'epoch': 0.51} {'loss': 0.5368, 'learning_rate': 1.7488516959671308e-05, 'epoch': 0.51} {'loss': 0.5821, 'learning_rate': 1.7488294290417792e-05, 'epoch': 0.51} {'loss': 0.6224, 'learning_rate': 1.748807161271142e-05, 'epoch': 0.51} {'loss': 0.5326, 'learning_rate': 1.7487848926552434e-05, 'epoch': 0.51} {'loss': 0.6164, 'learning_rate': 1.7487626231941093e-05, 'epoch': 0.51} {'loss': 0.7731, 'learning_rate': 1.7487403528877648e-05, 'epoch': 0.51} {'loss': 0.5273, 'learning_rate': 1.7487180817362345e-05, 'epoch': 0.51} {'loss': 0.4219, 'learning_rate': 1.7486958097395435e-05, 'epoch': 0.51} {'loss': 0.5845, 'learning_rate': 1.748673536897718e-05, 'epoch': 0.51} {'loss': 0.4794, 'learning_rate': 1.7486512632107823e-05, 'epoch': 0.51} {'loss': 0.7316, 'learning_rate': 1.7486289886787614e-05, 'epoch': 0.51} {'loss': 0.5198, 'learning_rate': 1.748606713301681e-05, 'epoch': 0.51} {'loss': 0.5481, 'learning_rate': 1.7485844370795657e-05, 'epoch': 0.51} {'loss': 0.4468, 'learning_rate': 1.748562160012441e-05, 'epoch': 0.51} {'loss': 0.6766, 'learning_rate': 1.748539882100332e-05, 'epoch': 0.51} {'loss': 0.6968, 'learning_rate': 1.748517603343264e-05, 'epoch': 0.51} {'loss': 0.4275, 'learning_rate': 1.7484953237412616e-05, 'epoch': 0.51} {'loss': 0.4562, 'learning_rate': 1.7484730432943507e-05, 'epoch': 0.51} {'loss': 0.5871, 'learning_rate': 1.748450762002556e-05, 'epoch': 0.51} {'loss': 0.7004, 'learning_rate': 1.7484284798659025e-05, 'epoch': 0.51} {'loss': 0.5262, 'learning_rate': 1.7484061968844157e-05, 'epoch': 0.51} {'loss': 0.7386, 'learning_rate': 1.7483839130581205e-05, 'epoch': 0.51} {'loss': 0.3821, 'learning_rate': 1.7483616283870424e-05, 'epoch': 0.51} {'loss': 0.5484, 'learning_rate': 1.7483393428712062e-05, 'epoch': 0.51} {'loss': 0.5433, 'learning_rate': 1.7483170565106373e-05, 'epoch': 0.51} {'loss': 0.6232, 'learning_rate': 1.7482947693053606e-05, 'epoch': 0.51} {'loss': 0.7738, 'learning_rate': 1.748272481255401e-05, 'epoch': 0.51} {'loss': 0.7015, 'learning_rate': 1.7482501923607846e-05, 'epoch': 0.51} {'loss': 0.5909, 'learning_rate': 1.748227902621536e-05, 'epoch': 0.51} {'loss': 0.4467, 'learning_rate': 1.7482056120376802e-05, 'epoch': 0.51} {'loss': 0.7747, 'learning_rate': 1.7481833206092426e-05, 'epoch': 0.51} {'loss': 0.5183, 'learning_rate': 1.7481610283362485e-05, 'epoch': 0.51} {'loss': 0.5302, 'learning_rate': 1.7481387352187226e-05, 'epoch': 0.51} {'loss': 0.541, 'learning_rate': 1.7481164412566905e-05, 'epoch': 0.51} {'loss': 0.6835, 'learning_rate': 1.748094146450177e-05, 'epoch': 0.51} {'loss': 0.6297, 'learning_rate': 1.7480718507992075e-05, 'epoch': 0.51} {'loss': 0.8051, 'learning_rate': 1.7480495543038073e-05, 'epoch': 0.51} {'loss': 0.5004, 'learning_rate': 1.7480272569640014e-05, 'epoch': 0.51} {'loss': 0.6219, 'learning_rate': 1.748004958779815e-05, 'epoch': 0.51} {'loss': 0.4497, 'learning_rate': 1.747982659751273e-05, 'epoch': 0.51} {'loss': 0.6377, 'learning_rate': 1.747960359878401e-05, 'epoch': 0.51} {'loss': 0.6442, 'learning_rate': 1.747938059161224e-05, 'epoch': 0.51} {'loss': 0.4938, 'learning_rate': 1.747915757599767e-05, 'epoch': 0.51} {'loss': 0.6601, 'learning_rate': 1.7478934551940556e-05, 'epoch': 0.51} {'loss': 0.6971, 'learning_rate': 1.747871151944114e-05, 'epoch': 0.51} {'loss': 0.584, 'learning_rate': 1.747848847849969e-05, 'epoch': 0.51} {'loss': 0.4823, 'learning_rate': 1.7478265429116445e-05, 'epoch': 0.51} {'loss': 0.6346, 'learning_rate': 1.747804237129166e-05, 'epoch': 0.51} {'loss': 0.5583, 'learning_rate': 1.7477819305025586e-05, 'epoch': 0.51} {'loss': 0.7242, 'learning_rate': 1.747759623031848e-05, 'epoch': 0.51} {'loss': 0.5846, 'learning_rate': 1.7477373147170588e-05, 'epoch': 0.51} {'loss': 0.5885, 'learning_rate': 1.747715005558216e-05, 'epoch': 0.51} {'loss': 0.694, 'learning_rate': 1.7476926955553453e-05, 'epoch': 0.51} {'loss': 0.576, 'learning_rate': 1.747670384708472e-05, 'epoch': 0.51} {'loss': 0.5614, 'learning_rate': 1.7476480730176207e-05, 'epoch': 0.51} {'loss': 0.6258, 'learning_rate': 1.7476257604828172e-05, 'epoch': 0.51} {'loss': 0.459, 'learning_rate': 1.7476034471040863e-05, 'epoch': 0.51} {'loss': 0.6292, 'learning_rate': 1.747581132881453e-05, 'epoch': 0.51} {'loss': 0.6807, 'learning_rate': 1.7475588178149433e-05, 'epoch': 0.51} {'loss': 0.5957, 'learning_rate': 1.7475365019045813e-05, 'epoch': 0.51} {'loss': 0.5125, 'learning_rate': 1.747514185150393e-05, 'epoch': 0.51} {'loss': 0.5285, 'learning_rate': 1.7474918675524032e-05, 'epoch': 0.51} {'loss': 0.6059, 'learning_rate': 1.7474695491106373e-05, 'epoch': 0.51} {'loss': 0.6012, 'learning_rate': 1.7474472298251207e-05, 'epoch': 0.51} {'loss': 0.4724, 'learning_rate': 1.7474249096958777e-05, 'epoch': 0.51} {'loss': 0.6246, 'learning_rate': 1.7474025887229347e-05, 'epoch': 0.51} {'loss': 0.5255, 'learning_rate': 1.747380266906316e-05, 'epoch': 0.51} {'loss': 0.4464, 'learning_rate': 1.7473579442460468e-05, 'epoch': 0.51} {'loss': 0.5299, 'learning_rate': 1.747335620742153e-05, 'epoch': 0.51} {'loss': 0.4574, 'learning_rate': 1.7473132963946592e-05, 'epoch': 0.51} {'loss': 0.6006, 'learning_rate': 1.747290971203591e-05, 'epoch': 0.51} {'loss': 0.5356, 'learning_rate': 1.7472686451689736e-05, 'epoch': 0.51} {'loss': 0.4613, 'learning_rate': 1.7472463182908316e-05, 'epoch': 0.51} {'loss': 0.5951, 'learning_rate': 1.747223990569191e-05, 'epoch': 0.51} {'loss': 0.5652, 'learning_rate': 1.747201662004076e-05, 'epoch': 0.51} {'loss': 0.4492, 'learning_rate': 1.747179332595513e-05, 'epoch': 0.51} {'loss': 0.5842, 'learning_rate': 1.7471570023435262e-05, 'epoch': 0.51} {'loss': 0.6924, 'learning_rate': 1.7471346712481414e-05, 'epoch': 0.51} {'loss': 0.5493, 'learning_rate': 1.7471123393093838e-05, 'epoch': 0.51} {'loss': 0.5004, 'learning_rate': 1.747090006527278e-05, 'epoch': 0.51} {'loss': 0.5879, 'learning_rate': 1.74706767290185e-05, 'epoch': 0.51} {'loss': 0.6126, 'learning_rate': 1.747045338433125e-05, 'epoch': 0.51} {'loss': 0.5106, 'learning_rate': 1.747023003121127e-05, 'epoch': 0.51} {'loss': 0.6691, 'learning_rate': 1.7470006669658824e-05, 'epoch': 0.51} {'loss': 0.6986, 'learning_rate': 1.7469783299674165e-05, 'epoch': 0.51} {'loss': 0.6239, 'learning_rate': 1.7469559921257537e-05, 'epoch': 0.51} {'loss': 0.6039, 'learning_rate': 1.7469336534409198e-05, 'epoch': 0.51} {'loss': 0.6387, 'learning_rate': 1.7469113139129397e-05, 'epoch': 0.51} {'loss': 0.5534, 'learning_rate': 1.746888973541839e-05, 'epoch': 0.51} {'loss': 0.5507, 'learning_rate': 1.7468666323276424e-05, 'epoch': 0.51} {'loss': 0.64, 'learning_rate': 1.7468442902703756e-05, 'epoch': 0.51} {'loss': 0.6448, 'learning_rate': 1.7468219473700637e-05, 'epoch': 0.51} {'loss': 0.5678, 'learning_rate': 1.7467996036267313e-05, 'epoch': 0.51} {'loss': 0.4608, 'learning_rate': 1.7467772590404047e-05, 'epoch': 0.51} {'loss': 0.3619, 'learning_rate': 1.7467549136111085e-05, 'epoch': 0.51} {'loss': 0.6464, 'learning_rate': 1.746732567338868e-05, 'epoch': 0.51} {'loss': 0.5097, 'learning_rate': 1.746710220223708e-05, 'epoch': 0.51} {'loss': 0.3796, 'learning_rate': 1.7466878722656547e-05, 'epoch': 0.51} {'loss': 0.563, 'learning_rate': 1.7466655234647324e-05, 'epoch': 0.51} {'loss': 0.6036, 'learning_rate': 1.7466431738209672e-05, 'epoch': 0.51} {'loss': 0.3998, 'learning_rate': 1.7466208233343832e-05, 'epoch': 0.51} {'loss': 0.6141, 'learning_rate': 1.746598472005007e-05, 'epoch': 0.51} {'loss': 0.4553, 'learning_rate': 1.7465761198328622e-05, 'epoch': 0.51} {'loss': 0.4792, 'learning_rate': 1.7465537668179757e-05, 'epoch': 0.51} {'loss': 0.7, 'learning_rate': 1.7465314129603717e-05, 'epoch': 0.51} {'loss': 0.5312, 'learning_rate': 1.7465090582600756e-05, 'epoch': 0.51} {'loss': 0.5557, 'learning_rate': 1.746486702717113e-05, 'epoch': 0.51} {'loss': 0.6485, 'learning_rate': 1.7464643463315086e-05, 'epoch': 0.51} {'loss': 0.6323, 'learning_rate': 1.7464419891032877e-05, 'epoch': 0.51} {'loss': 0.6258, 'learning_rate': 1.746419631032476e-05, 'epoch': 0.51} {'loss': 0.5179, 'learning_rate': 1.7463972721190988e-05, 'epoch': 0.51} {'loss': 0.5578, 'learning_rate': 1.7463749123631805e-05, 'epoch': 0.51} {'loss': 0.4345, 'learning_rate': 1.746352551764747e-05, 'epoch': 0.51} {'loss': 0.5407, 'learning_rate': 1.7463301903238234e-05, 'epoch': 0.51} {'loss': 0.6076, 'learning_rate': 1.746307828040435e-05, 'epoch': 0.51} {'loss': 0.6614, 'learning_rate': 1.746285464914607e-05, 'epoch': 0.51} {'loss': 0.5685, 'learning_rate': 1.7462631009463648e-05, 'epoch': 0.51} {'loss': 0.6324, 'learning_rate': 1.7462407361357333e-05, 'epoch': 0.51} {'loss': 0.5614, 'learning_rate': 1.7462183704827375e-05, 'epoch': 0.51} {'loss': 0.6272, 'learning_rate': 1.7461960039874036e-05, 'epoch': 0.51} {'loss': 0.5845, 'learning_rate': 1.746173636649756e-05, 'epoch': 0.51} {'loss': 0.6076, 'learning_rate': 1.7461512684698204e-05, 'epoch': 0.51} {'loss': 0.4603, 'learning_rate': 1.746128899447622e-05, 'epoch': 0.51} {'loss': 0.6899, 'learning_rate': 1.746106529583186e-05, 'epoch': 0.51} {'loss': 0.7073, 'learning_rate': 1.746084158876537e-05, 'epoch': 0.51} {'loss': 0.5764, 'learning_rate': 1.7460617873277016e-05, 'epoch': 0.51} {'loss': 0.6532, 'learning_rate': 1.746039414936704e-05, 'epoch': 0.51} {'loss': 0.4305, 'learning_rate': 1.7460170417035696e-05, 'epoch': 0.51} {'loss': 0.653, 'learning_rate': 1.7459946676283243e-05, 'epoch': 0.51} {'loss': 0.5614, 'learning_rate': 1.7459722927109926e-05, 'epoch': 0.51} {'loss': 0.6198, 'learning_rate': 1.7459499169515997e-05, 'epoch': 0.51} {'loss': 0.5505, 'learning_rate': 1.7459275403501718e-05, 'epoch': 0.51} {'loss': 0.6387, 'learning_rate': 1.745905162906733e-05, 'epoch': 0.51} {'loss': 0.6285, 'learning_rate': 1.7458827846213094e-05, 'epoch': 0.51} {'loss': 0.6881, 'learning_rate': 1.7458604054939262e-05, 'epoch': 0.51} {'loss': 0.4671, 'learning_rate': 1.7458380255246078e-05, 'epoch': 0.51} {'loss': 0.571, 'learning_rate': 1.7458156447133807e-05, 'epoch': 0.51} {'loss': 0.4236, 'learning_rate': 1.7457932630602695e-05, 'epoch': 0.51} {'loss': 0.825, 'learning_rate': 1.745770880565299e-05, 'epoch': 0.51} {'loss': 0.4968, 'learning_rate': 1.7457484972284956e-05, 'epoch': 0.51} {'loss': 0.4783, 'learning_rate': 1.7457261130498835e-05, 'epoch': 0.51} {'loss': 0.4231, 'learning_rate': 1.7457037280294888e-05, 'epoch': 0.51} {'loss': 0.5237, 'learning_rate': 1.745681342167336e-05, 'epoch': 0.51} {'loss': 0.4685, 'learning_rate': 1.7456589554634512e-05, 'epoch': 0.51} {'loss': 0.5923, 'learning_rate': 1.7456365679178592e-05, 'epoch': 0.51} {'loss': 0.6394, 'learning_rate': 1.745614179530585e-05, 'epoch': 0.51} {'loss': 0.6006, 'learning_rate': 1.7455917903016543e-05, 'epoch': 0.51} {'loss': 0.6373, 'learning_rate': 1.7455694002310923e-05, 'epoch': 0.51} {'loss': 0.6322, 'learning_rate': 1.745547009318924e-05, 'epoch': 0.51} {'loss': 0.6176, 'learning_rate': 1.745524617565175e-05, 'epoch': 0.51} {'loss': 0.4869, 'learning_rate': 1.7455022249698708e-05, 'epoch': 0.51} {'loss': 0.5937, 'learning_rate': 1.7454798315330358e-05, 'epoch': 0.51} {'loss': 0.4037, 'learning_rate': 1.7454574372546963e-05, 'epoch': 0.51} {'loss': 0.5149, 'learning_rate': 1.745435042134877e-05, 'epoch': 0.51} {'loss': 0.5595, 'learning_rate': 1.745412646173603e-05, 'epoch': 0.51} {'loss': 0.6001, 'learning_rate': 1.7453902493709004e-05, 'epoch': 0.51} {'loss': 0.4164, 'learning_rate': 1.7453678517267935e-05, 'epoch': 0.51} {'loss': 0.6663, 'learning_rate': 1.7453454532413085e-05, 'epoch': 0.51} {'loss': 0.674, 'learning_rate': 1.7453230539144697e-05, 'epoch': 0.51} {'loss': 0.6291, 'learning_rate': 1.7453006537463032e-05, 'epoch': 0.51} {'loss': 0.4547, 'learning_rate': 1.7452782527368338e-05, 'epoch': 0.51} {'loss': 0.6742, 'learning_rate': 1.7452558508860872e-05, 'epoch': 0.51} {'loss': 0.442, 'learning_rate': 1.745233448194088e-05, 'epoch': 0.51} {'loss': 0.7248, 'learning_rate': 1.7452110446608627e-05, 'epoch': 0.51} {'loss': 0.4272, 'learning_rate': 1.7451886402864353e-05, 'epoch': 0.51} {'loss': 0.5105, 'learning_rate': 1.7451662350708317e-05, 'epoch': 0.51} {'loss': 0.6561, 'learning_rate': 1.7451438290140773e-05, 'epoch': 0.51} {'loss': 0.7115, 'learning_rate': 1.745121422116197e-05, 'epoch': 0.51} {'loss': 0.5873, 'learning_rate': 1.7450990143772163e-05, 'epoch': 0.51} {'loss': 0.5844, 'learning_rate': 1.7450766057971605e-05, 'epoch': 0.51} {'loss': 0.599, 'learning_rate': 1.745054196376055e-05, 'epoch': 0.51} {'loss': 0.5958, 'learning_rate': 1.745031786113925e-05, 'epoch': 0.51} {'loss': 0.5732, 'learning_rate': 1.7450093750107958e-05, 'epoch': 0.51} {'loss': 0.5076, 'learning_rate': 1.7449869630666928e-05, 'epoch': 0.51} {'loss': 0.5057, 'learning_rate': 1.744964550281641e-05, 'epoch': 0.51} {'loss': 0.5817, 'learning_rate': 1.7449421366556656e-05, 'epoch': 0.51} {'loss': 0.356, 'learning_rate': 1.7449197221887925e-05, 'epoch': 0.51} {'loss': 0.5199, 'learning_rate': 1.7448973068810468e-05, 'epoch': 0.51} {'loss': 0.6381, 'learning_rate': 1.7448748907324535e-05, 'epoch': 0.51} {'loss': 0.6525, 'learning_rate': 1.744852473743038e-05, 'epoch': 0.51} {'loss': 0.7587, 'learning_rate': 1.7448300559128258e-05, 'epoch': 0.51} {'loss': 0.5293, 'learning_rate': 1.7448076372418423e-05, 'epoch': 0.51} {'loss': 0.5433, 'learning_rate': 1.7447852177301124e-05, 'epoch': 0.51} {'loss': 0.5703, 'learning_rate': 1.744762797377662e-05, 'epoch': 0.51} {'loss': 0.5602, 'learning_rate': 1.7447403761845156e-05, 'epoch': 0.51} {'loss': 0.6003, 'learning_rate': 1.744717954150699e-05, 'epoch': 0.51} {'loss': 0.419, 'learning_rate': 1.7446955312762373e-05, 'epoch': 0.51} {'loss': 0.7068, 'learning_rate': 1.7446731075611563e-05, 'epoch': 0.51} {'loss': 0.6706, 'learning_rate': 1.744650683005481e-05, 'epoch': 0.51} {'loss': 0.6466, 'learning_rate': 1.7446282576092363e-05, 'epoch': 0.51} {'loss': 0.5995, 'learning_rate': 1.7446058313724484e-05, 'epoch': 0.51} {'loss': 0.7007, 'learning_rate': 1.7445834042951416e-05, 'epoch': 0.51} {'loss': 0.63, 'learning_rate': 1.744560976377342e-05, 'epoch': 0.51} {'loss': 0.5932, 'learning_rate': 1.7445385476190745e-05, 'epoch': 0.51} {'loss': 0.5499, 'learning_rate': 1.7445161180203648e-05, 'epoch': 0.51} {'loss': 0.5083, 'learning_rate': 1.7444936875812377e-05, 'epoch': 0.51} {'loss': 0.6071, 'learning_rate': 1.744471256301719e-05, 'epoch': 0.51} {'loss': 0.6956, 'learning_rate': 1.7444488241818334e-05, 'epoch': 0.51} {'loss': 0.5331, 'learning_rate': 1.744426391221607e-05, 'epoch': 0.51} {'loss': 0.5811, 'learning_rate': 1.744403957421065e-05, 'epoch': 0.51} {'loss': 0.4763, 'learning_rate': 1.744381522780232e-05, 'epoch': 0.51} {'loss': 0.5431, 'learning_rate': 1.7443590872991342e-05, 'epoch': 0.51} {'loss': 0.502, 'learning_rate': 1.7443366509777963e-05, 'epoch': 0.51} {'loss': 0.431, 'learning_rate': 1.744314213816244e-05, 'epoch': 0.51} {'loss': 0.4718, 'learning_rate': 1.7442917758145024e-05, 'epoch': 0.51} {'loss': 0.5061, 'learning_rate': 1.744269336972597e-05, 'epoch': 0.51} {'loss': 0.5242, 'learning_rate': 1.744246897290553e-05, 'epoch': 0.51} {'loss': 0.5269, 'learning_rate': 1.7442244567683955e-05, 'epoch': 0.51} {'loss': 0.566, 'learning_rate': 1.7442020154061505e-05, 'epoch': 0.51} {'loss': 0.7632, 'learning_rate': 1.744179573203843e-05, 'epoch': 0.51} {'loss': 0.5218, 'learning_rate': 1.744157130161498e-05, 'epoch': 0.51} {'loss': 0.7789, 'learning_rate': 1.744134686279141e-05, 'epoch': 0.51} {'loss': 0.6409, 'learning_rate': 1.7441122415567976e-05, 'epoch': 0.51} {'loss': 0.4639, 'learning_rate': 1.7440897959944932e-05, 'epoch': 0.51} {'loss': 0.4739, 'learning_rate': 1.7440673495922527e-05, 'epoch': 0.51} {'loss': 0.6347, 'learning_rate': 1.7440449023501014e-05, 'epoch': 0.51} {'loss': 0.5126, 'learning_rate': 1.7440224542680655e-05, 'epoch': 0.51} {'loss': 0.7278, 'learning_rate': 1.7440000053461693e-05, 'epoch': 0.51} {'loss': 0.57, 'learning_rate': 1.7439775555844386e-05, 'epoch': 0.51} {'loss': 0.6699, 'learning_rate': 1.743955104982899e-05, 'epoch': 0.51} {'loss': 0.6539, 'learning_rate': 1.7439326535415752e-05, 'epoch': 0.51} {'loss': 0.6305, 'learning_rate': 1.7439102012604934e-05, 'epoch': 0.51} {'loss': 0.7154, 'learning_rate': 1.743887748139678e-05, 'epoch': 0.51} {'loss': 0.4699, 'learning_rate': 1.7438652941791548e-05, 'epoch': 0.51} {'loss': 0.4764, 'learning_rate': 1.7438428393789492e-05, 'epoch': 0.51} {'loss': 0.6289, 'learning_rate': 1.7438203837390863e-05, 'epoch': 0.51} {'loss': 0.6168, 'learning_rate': 1.7437979272595918e-05, 'epoch': 0.51} {'loss': 0.5864, 'learning_rate': 1.743775469940491e-05, 'epoch': 0.51} {'loss': 0.4776, 'learning_rate': 1.7437530117818094e-05, 'epoch': 0.51} {'loss': 0.5554, 'learning_rate': 1.7437305527835717e-05, 'epoch': 0.51} {'loss': 0.5675, 'learning_rate': 1.7437080929458033e-05, 'epoch': 0.51} {'loss': 0.629, 'learning_rate': 1.7436856322685304e-05, 'epoch': 0.51} {'loss': 0.6045, 'learning_rate': 1.7436631707517778e-05, 'epoch': 0.51} {'loss': 0.6219, 'learning_rate': 1.7436407083955707e-05, 'epoch': 0.51} {'loss': 0.6305, 'learning_rate': 1.7436182451999347e-05, 'epoch': 0.51} {'loss': 0.6515, 'learning_rate': 1.7435957811648952e-05, 'epoch': 0.51} {'loss': 0.5019, 'learning_rate': 1.7435733162904775e-05, 'epoch': 0.51} {'loss': 0.7311, 'learning_rate': 1.7435508505767067e-05, 'epoch': 0.51} {'loss': 0.6057, 'learning_rate': 1.7435283840236083e-05, 'epoch': 0.51} {'loss': 0.4843, 'learning_rate': 1.743505916631208e-05, 'epoch': 0.51} {'loss': 0.5866, 'learning_rate': 1.7434834483995308e-05, 'epoch': 0.51} {'loss': 0.6041, 'learning_rate': 1.7434609793286022e-05, 'epoch': 0.51} {'loss': 0.6515, 'learning_rate': 1.743438509418448e-05, 'epoch': 0.51} {'loss': 0.6269, 'learning_rate': 1.7434160386690924e-05, 'epoch': 0.51} {'loss': 0.7053, 'learning_rate': 1.7433935670805616e-05, 'epoch': 0.51} {'loss': 0.5412, 'learning_rate': 1.743371094652881e-05, 'epoch': 0.51} {'loss': 0.5265, 'learning_rate': 1.743348621386076e-05, 'epoch': 0.51} {'loss': 0.6912, 'learning_rate': 1.743326147280171e-05, 'epoch': 0.51} {'loss': 0.4346, 'learning_rate': 1.743303672335193e-05, 'epoch': 0.51} {'loss': 0.4763, 'learning_rate': 1.7432811965511657e-05, 'epoch': 0.51} {'loss': 0.4149, 'learning_rate': 1.7432587199281158e-05, 'epoch': 0.51} {'loss': 0.6075, 'learning_rate': 1.743236242466068e-05, 'epoch': 0.51} {'loss': 0.4953, 'learning_rate': 1.743213764165048e-05, 'epoch': 0.51} {'loss': 0.6244, 'learning_rate': 1.7431912850250806e-05, 'epoch': 0.51} {'loss': 0.6597, 'learning_rate': 1.743168805046192e-05, 'epoch': 0.51} {'loss': 0.6689, 'learning_rate': 1.7431463242284067e-05, 'epoch': 0.51} {'loss': 0.4673, 'learning_rate': 1.743123842571751e-05, 'epoch': 0.51} {'loss': 0.5672, 'learning_rate': 1.7431013600762494e-05, 'epoch': 0.51} {'loss': 0.4159, 'learning_rate': 1.7430788767419277e-05, 'epoch': 0.51} {'loss': 0.7016, 'learning_rate': 1.7430563925688116e-05, 'epoch': 0.51} {'loss': 0.5769, 'learning_rate': 1.743033907556926e-05, 'epoch': 0.51} {'loss': 0.6014, 'learning_rate': 1.743011421706296e-05, 'epoch': 0.51} {'loss': 0.5081, 'learning_rate': 1.742988935016948e-05, 'epoch': 0.51} {'loss': 0.5906, 'learning_rate': 1.7429664474889064e-05, 'epoch': 0.51} {'loss': 0.469, 'learning_rate': 1.742943959122197e-05, 'epoch': 0.51} {'loss': 0.6535, 'learning_rate': 1.742921469916845e-05, 'epoch': 0.51} {'loss': 0.7034, 'learning_rate': 1.742898979872876e-05, 'epoch': 0.51} {'loss': 0.5798, 'learning_rate': 1.7428764889903155e-05, 'epoch': 0.51} {'loss': 0.5086, 'learning_rate': 1.742853997269189e-05, 'epoch': 0.51} {'loss': 0.5574, 'learning_rate': 1.742831504709521e-05, 'epoch': 0.51} {'loss': 0.6842, 'learning_rate': 1.742809011311338e-05, 'epoch': 0.51} {'loss': 0.6757, 'learning_rate': 1.7427865170746644e-05, 'epoch': 0.51} {'loss': 0.5526, 'learning_rate': 1.7427640219995265e-05, 'epoch': 0.51} {'loss': 0.5733, 'learning_rate': 1.742741526085949e-05, 'epoch': 0.51} {'loss': 0.538, 'learning_rate': 1.7427190293339572e-05, 'epoch': 0.51} {'loss': 0.5358, 'learning_rate': 1.7426965317435774e-05, 'epoch': 0.51} {'loss': 0.6601, 'learning_rate': 1.742674033314834e-05, 'epoch': 0.51} {'loss': 0.538, 'learning_rate': 1.7426515340477535e-05, 'epoch': 0.51} {'loss': 0.6378, 'learning_rate': 1.74262903394236e-05, 'epoch': 0.51} {'loss': 0.5327, 'learning_rate': 1.74260653299868e-05, 'epoch': 0.51} {'loss': 0.6242, 'learning_rate': 1.7425840312167384e-05, 'epoch': 0.51} {'loss': 0.5259, 'learning_rate': 1.7425615285965603e-05, 'epoch': 0.51} {'loss': 0.6347, 'learning_rate': 1.7425390251381717e-05, 'epoch': 0.51} {'loss': 0.6283, 'learning_rate': 1.742516520841598e-05, 'epoch': 0.51} {'loss': 0.4146, 'learning_rate': 1.7424940157068636e-05, 'epoch': 0.51} {'loss': 0.575, 'learning_rate': 1.7424715097339953e-05, 'epoch': 0.51} {'loss': 0.5501, 'learning_rate': 1.7424490029230177e-05, 'epoch': 0.51} {'loss': 0.4903, 'learning_rate': 1.7424264952739562e-05, 'epoch': 0.51} {'loss': 0.6574, 'learning_rate': 1.7424039867868363e-05, 'epoch': 0.52} {'loss': 0.6603, 'learning_rate': 1.7423814774616837e-05, 'epoch': 0.52} {'loss': 0.6382, 'learning_rate': 1.7423589672985234e-05, 'epoch': 0.52} {'loss': 0.6238, 'learning_rate': 1.7423364562973813e-05, 'epoch': 0.52} {'loss': 0.4668, 'learning_rate': 1.7423139444582823e-05, 'epoch': 0.52} {'loss': 0.5101, 'learning_rate': 1.742291431781252e-05, 'epoch': 0.52} {'loss': 0.5671, 'learning_rate': 1.7422689182663158e-05, 'epoch': 0.52} {'loss': 0.6518, 'learning_rate': 1.742246403913499e-05, 'epoch': 0.52} {'loss': 0.6123, 'learning_rate': 1.7422238887228274e-05, 'epoch': 0.52} {'loss': 0.8169, 'learning_rate': 1.7422013726943258e-05, 'epoch': 0.52} {'loss': 0.5956, 'learning_rate': 1.7421788558280205e-05, 'epoch': 0.52} {'loss': 0.6858, 'learning_rate': 1.742156338123936e-05, 'epoch': 0.52} {'loss': 0.5328, 'learning_rate': 1.7421338195820986e-05, 'epoch': 0.52} {'loss': 0.563, 'learning_rate': 1.742111300202533e-05, 'epoch': 0.52} {'loss': 0.4526, 'learning_rate': 1.742088779985265e-05, 'epoch': 0.52} {'loss': 0.602, 'learning_rate': 1.7420662589303193e-05, 'epoch': 0.52} {'loss': 0.6291, 'learning_rate': 1.7420437370377223e-05, 'epoch': 0.52} {'loss': 0.5353, 'learning_rate': 1.742021214307499e-05, 'epoch': 0.52} {'loss': 0.5442, 'learning_rate': 1.741998690739675e-05, 'epoch': 0.52} {'loss': 0.4469, 'learning_rate': 1.7419761663342752e-05, 'epoch': 0.52} {'loss': 0.7318, 'learning_rate': 1.741953641091326e-05, 'epoch': 0.52} {'loss': 0.6584, 'learning_rate': 1.7419311150108517e-05, 'epoch': 0.52} {'loss': 0.6187, 'learning_rate': 1.7419085880928786e-05, 'epoch': 0.52} {'loss': 0.5571, 'learning_rate': 1.7418860603374315e-05, 'epoch': 0.52} {'loss': 0.6108, 'learning_rate': 1.7418635317445362e-05, 'epoch': 0.52} {'loss': 0.4813, 'learning_rate': 1.741841002314218e-05, 'epoch': 0.52} {'loss': 0.6343, 'learning_rate': 1.7418184720465027e-05, 'epoch': 0.52} {'loss': 0.5402, 'learning_rate': 1.741795940941415e-05, 'epoch': 0.52} {'loss': 0.6916, 'learning_rate': 1.7417734089989808e-05, 'epoch': 0.52} {'loss': 0.6028, 'learning_rate': 1.7417508762192256e-05, 'epoch': 0.52} {'loss': 0.5017, 'learning_rate': 1.7417283426021747e-05, 'epoch': 0.52} {'loss': 0.4426, 'learning_rate': 1.7417058081478537e-05, 'epoch': 0.52} {'loss': 0.7445, 'learning_rate': 1.7416832728562877e-05, 'epoch': 0.52} {'loss': 0.6284, 'learning_rate': 1.7416607367275022e-05, 'epoch': 0.52} {'loss': 0.5944, 'learning_rate': 1.7416381997615232e-05, 'epoch': 0.52} {'loss': 0.6275, 'learning_rate': 1.7416156619583754e-05, 'epoch': 0.52} {'loss': 0.4704, 'learning_rate': 1.7415931233180844e-05, 'epoch': 0.52} {'loss': 0.6547, 'learning_rate': 1.7415705838406757e-05, 'epoch': 0.52} {'loss': 0.6224, 'learning_rate': 1.7415480435261752e-05, 'epoch': 0.52} {'loss': 0.6462, 'learning_rate': 1.7415255023746077e-05, 'epoch': 0.52} {'loss': 0.803, 'learning_rate': 1.741502960385999e-05, 'epoch': 0.52} {'loss': 0.3906, 'learning_rate': 1.7414804175603746e-05, 'epoch': 0.52} {'loss': 0.6096, 'learning_rate': 1.7414578738977595e-05, 'epoch': 0.52} {'loss': 0.6601, 'learning_rate': 1.74143532939818e-05, 'epoch': 0.52} {'loss': 0.5597, 'learning_rate': 1.7414127840616605e-05, 'epoch': 0.52} {'loss': 0.6084, 'learning_rate': 1.7413902378882274e-05, 'epoch': 0.52} {'loss': 0.5417, 'learning_rate': 1.7413676908779054e-05, 'epoch': 0.52} {'loss': 0.5423, 'learning_rate': 1.7413451430307202e-05, 'epoch': 0.52} {'loss': 0.7868, 'learning_rate': 1.7413225943466974e-05, 'epoch': 0.52} {'loss': 0.5312, 'learning_rate': 1.7413000448258622e-05, 'epoch': 0.52} {'loss': 0.5996, 'learning_rate': 1.7412774944682405e-05, 'epoch': 0.52} {'loss': 0.638, 'learning_rate': 1.7412549432738576e-05, 'epoch': 0.52} {'loss': 0.6244, 'learning_rate': 1.7412323912427383e-05, 'epoch': 0.52} {'loss': 0.5819, 'learning_rate': 1.7412098383749087e-05, 'epoch': 0.52} {'loss': 0.7209, 'learning_rate': 1.7411872846703945e-05, 'epoch': 0.52} {'loss': 0.6454, 'learning_rate': 1.7411647301292204e-05, 'epoch': 0.52} {'loss': 0.6481, 'learning_rate': 1.7411421747514126e-05, 'epoch': 0.52} {'loss': 0.627, 'learning_rate': 1.7411196185369958e-05, 'epoch': 0.52} {'loss': 0.5791, 'learning_rate': 1.7410970614859964e-05, 'epoch': 0.52} {'loss': 0.5956, 'learning_rate': 1.7410745035984388e-05, 'epoch': 0.52} {'loss': 0.5381, 'learning_rate': 1.7410519448743494e-05, 'epoch': 0.52} {'loss': 0.6777, 'learning_rate': 1.7410293853137533e-05, 'epoch': 0.52} {'loss': 0.5739, 'learning_rate': 1.7410068249166756e-05, 'epoch': 0.52} {'loss': 0.6676, 'learning_rate': 1.7409842636831424e-05, 'epoch': 0.52} {'loss': 0.5393, 'learning_rate': 1.7409617016131787e-05, 'epoch': 0.52} {'loss': 0.6487, 'learning_rate': 1.7409391387068102e-05, 'epoch': 0.52} {'loss': 0.6236, 'learning_rate': 1.7409165749640625e-05, 'epoch': 0.52} {'loss': 0.6745, 'learning_rate': 1.7408940103849605e-05, 'epoch': 0.52} {'loss': 0.795, 'learning_rate': 1.7408714449695304e-05, 'epoch': 0.52} {'loss': 0.6391, 'learning_rate': 1.7408488787177972e-05, 'epoch': 0.52} {'loss': 0.7276, 'learning_rate': 1.7408263116297867e-05, 'epoch': 0.52} {'loss': 0.5193, 'learning_rate': 1.7408037437055236e-05, 'epoch': 0.52} {'loss': 0.5619, 'learning_rate': 1.7407811749450343e-05, 'epoch': 0.52} {'loss': 0.6923, 'learning_rate': 1.740758605348344e-05, 'epoch': 0.52} {'loss': 0.4344, 'learning_rate': 1.740736034915478e-05, 'epoch': 0.52} {'loss': 0.575, 'learning_rate': 1.7407134636464617e-05, 'epoch': 0.52} {'loss': 0.4371, 'learning_rate': 1.740690891541321e-05, 'epoch': 0.52} {'loss': 0.6748, 'learning_rate': 1.740668318600081e-05, 'epoch': 0.52} {'loss': 0.6278, 'learning_rate': 1.7406457448227673e-05, 'epoch': 0.52} {'loss': 0.6354, 'learning_rate': 1.7406231702094057e-05, 'epoch': 0.52} {'loss': 0.5642, 'learning_rate': 1.740600594760021e-05, 'epoch': 0.52} {'loss': 0.5699, 'learning_rate': 1.7405780184746394e-05, 'epoch': 0.52} {'loss': 0.5875, 'learning_rate': 1.7405554413532858e-05, 'epoch': 0.52} {'loss': 0.7532, 'learning_rate': 1.740532863395986e-05, 'epoch': 0.52} {'loss': 0.6289, 'learning_rate': 1.7405102846027654e-05, 'epoch': 0.52} {'loss': 0.5774, 'learning_rate': 1.7404877049736494e-05, 'epoch': 0.52} {'loss': 0.5168, 'learning_rate': 1.7404651245086634e-05, 'epoch': 0.52} {'loss': 0.5333, 'learning_rate': 1.7404425432078334e-05, 'epoch': 0.52} {'loss': 0.574, 'learning_rate': 1.740419961071185e-05, 'epoch': 0.52} {'loss': 0.5352, 'learning_rate': 1.7403973780987424e-05, 'epoch': 0.52} {'loss': 0.5355, 'learning_rate': 1.7403747942905326e-05, 'epoch': 0.52} {'loss': 0.6078, 'learning_rate': 1.7403522096465798e-05, 'epoch': 0.52} {'loss': 0.691, 'learning_rate': 1.7403296241669107e-05, 'epoch': 0.52} {'loss': 0.7041, 'learning_rate': 1.74030703785155e-05, 'epoch': 0.52} {'loss': 0.6694, 'learning_rate': 1.7402844507005237e-05, 'epoch': 0.52} {'loss': 0.572, 'learning_rate': 1.7402618627138567e-05, 'epoch': 0.52} {'loss': 0.4948, 'learning_rate': 1.7402392738915754e-05, 'epoch': 0.52} {'loss': 0.6907, 'learning_rate': 1.740216684233704e-05, 'epoch': 0.52} {'loss': 0.5919, 'learning_rate': 1.740194093740269e-05, 'epoch': 0.52} {'loss': 0.4954, 'learning_rate': 1.7401715024112955e-05, 'epoch': 0.52} {'loss': 0.5056, 'learning_rate': 1.7401489102468092e-05, 'epoch': 0.52} {'loss': 0.6506, 'learning_rate': 1.7401263172468357e-05, 'epoch': 0.52} {'loss': 0.5716, 'learning_rate': 1.7401037234114e-05, 'epoch': 0.52} {'loss': 0.7272, 'learning_rate': 1.740081128740528e-05, 'epoch': 0.52} {'loss': 0.5729, 'learning_rate': 1.7400585332342453e-05, 'epoch': 0.52} {'loss': 0.6989, 'learning_rate': 1.740035936892577e-05, 'epoch': 0.52} {'loss': 0.7375, 'learning_rate': 1.7400133397155494e-05, 'epoch': 0.52} {'loss': 0.5688, 'learning_rate': 1.7399907417031872e-05, 'epoch': 0.52} {'loss': 0.7163, 'learning_rate': 1.739968142855516e-05, 'epoch': 0.52} {'loss': 0.5781, 'learning_rate': 1.7399455431725617e-05, 'epoch': 0.52} {'loss': 0.6621, 'learning_rate': 1.7399229426543492e-05, 'epoch': 0.52} {'loss': 0.6609, 'learning_rate': 1.739900341300905e-05, 'epoch': 0.52} {'loss': 0.6977, 'learning_rate': 1.7398777391122536e-05, 'epoch': 0.52} {'loss': 0.7056, 'learning_rate': 1.739855136088421e-05, 'epoch': 0.52} {'loss': 0.6076, 'learning_rate': 1.7398325322294326e-05, 'epoch': 0.52} {'loss': 0.6861, 'learning_rate': 1.739809927535314e-05, 'epoch': 0.52} {'loss': 0.6575, 'learning_rate': 1.7397873220060906e-05, 'epoch': 0.52} {'loss': 0.7118, 'learning_rate': 1.739764715641788e-05, 'epoch': 0.52} {'loss': 0.543, 'learning_rate': 1.7397421084424317e-05, 'epoch': 0.52} {'loss': 0.6142, 'learning_rate': 1.7397195004080476e-05, 'epoch': 0.52} {'loss': 0.464, 'learning_rate': 1.7396968915386604e-05, 'epoch': 0.52} {'loss': 0.612, 'learning_rate': 1.7396742818342963e-05, 'epoch': 0.52} {'loss': 0.4658, 'learning_rate': 1.7396516712949806e-05, 'epoch': 0.52} {'loss': 0.6901, 'learning_rate': 1.7396290599207388e-05, 'epoch': 0.52} {'loss': 0.4655, 'learning_rate': 1.7396064477115962e-05, 'epoch': 0.52} {'loss': 0.5314, 'learning_rate': 1.7395838346675787e-05, 'epoch': 0.52} {'loss': 0.7299, 'learning_rate': 1.7395612207887116e-05, 'epoch': 0.52} {'loss': 0.4634, 'learning_rate': 1.7395386060750207e-05, 'epoch': 0.52} {'loss': 0.5462, 'learning_rate': 1.739515990526531e-05, 'epoch': 0.52} {'loss': 0.6107, 'learning_rate': 1.7394933741432688e-05, 'epoch': 0.52} {'loss': 0.5968, 'learning_rate': 1.739470756925259e-05, 'epoch': 0.52} {'loss': 0.6546, 'learning_rate': 1.7394481388725275e-05, 'epoch': 0.52} {'loss': 0.5298, 'learning_rate': 1.7394255199850994e-05, 'epoch': 0.52} {'loss': 0.6693, 'learning_rate': 1.739402900263001e-05, 'epoch': 0.52} {'loss': 0.4829, 'learning_rate': 1.7393802797062565e-05, 'epoch': 0.52} {'loss': 0.5373, 'learning_rate': 1.739357658314893e-05, 'epoch': 0.52} {'loss': 0.4901, 'learning_rate': 1.739335036088935e-05, 'epoch': 0.52} {'loss': 0.6322, 'learning_rate': 1.7393124130284083e-05, 'epoch': 0.52} {'loss': 0.5579, 'learning_rate': 1.7392897891333386e-05, 'epoch': 0.52} {'loss': 0.5504, 'learning_rate': 1.739267164403751e-05, 'epoch': 0.52} {'loss': 0.5574, 'learning_rate': 1.739244538839672e-05, 'epoch': 0.52} {'loss': 0.4461, 'learning_rate': 1.7392219124411262e-05, 'epoch': 0.52} {'loss': 0.6745, 'learning_rate': 1.739199285208139e-05, 'epoch': 0.52} {'loss': 0.6707, 'learning_rate': 1.7391766571407368e-05, 'epoch': 0.52} {'loss': 0.6901, 'learning_rate': 1.7391540282389445e-05, 'epoch': 0.52} {'loss': 0.5543, 'learning_rate': 1.739131398502788e-05, 'epoch': 0.52} {'loss': 0.5344, 'learning_rate': 1.7391087679322926e-05, 'epoch': 0.52} {'loss': 0.5932, 'learning_rate': 1.739086136527484e-05, 'epoch': 0.52} {'loss': 0.6752, 'learning_rate': 1.739063504288388e-05, 'epoch': 0.52} {'loss': 0.5342, 'learning_rate': 1.7390408712150293e-05, 'epoch': 0.52} {'loss': 0.5244, 'learning_rate': 1.7390182373074343e-05, 'epoch': 0.52} {'loss': 0.6472, 'learning_rate': 1.7389956025656283e-05, 'epoch': 0.52} {'loss': 0.463, 'learning_rate': 1.7389729669896365e-05, 'epoch': 0.52} {'loss': 0.6033, 'learning_rate': 1.7389503305794847e-05, 'epoch': 0.52} {'loss': 0.7173, 'learning_rate': 1.738927693335199e-05, 'epoch': 0.52} {'loss': 0.6581, 'learning_rate': 1.738905055256804e-05, 'epoch': 0.52} {'loss': 0.6604, 'learning_rate': 1.738882416344326e-05, 'epoch': 0.52} {'loss': 0.5095, 'learning_rate': 1.7388597765977898e-05, 'epoch': 0.52} {'loss': 0.5332, 'learning_rate': 1.738837136017222e-05, 'epoch': 0.52} {'loss': 0.4766, 'learning_rate': 1.738814494602647e-05, 'epoch': 0.52} {'loss': 0.6198, 'learning_rate': 1.7387918523540913e-05, 'epoch': 0.52} {'loss': 0.5684, 'learning_rate': 1.73876920927158e-05, 'epoch': 0.52} {'loss': 0.5144, 'learning_rate': 1.738746565355139e-05, 'epoch': 0.52} {'loss': 0.3556, 'learning_rate': 1.7387239206047936e-05, 'epoch': 0.52} {'loss': 0.6449, 'learning_rate': 1.7387012750205688e-05, 'epoch': 0.52} {'loss': 0.7279, 'learning_rate': 1.7386786286024913e-05, 'epoch': 0.52} {'loss': 0.7527, 'learning_rate': 1.738655981350586e-05, 'epoch': 0.52} {'loss': 0.7343, 'learning_rate': 1.738633333264878e-05, 'epoch': 0.52} {'loss': 0.5104, 'learning_rate': 1.7386106843453937e-05, 'epoch': 0.52} {'loss': 0.597, 'learning_rate': 1.738588034592159e-05, 'epoch': 0.52} {'loss': 0.5943, 'learning_rate': 1.7385653840051983e-05, 'epoch': 0.52} {'loss': 0.5906, 'learning_rate': 1.7385427325845377e-05, 'epoch': 0.52} {'loss': 0.5529, 'learning_rate': 1.738520080330203e-05, 'epoch': 0.52} {'loss': 0.6294, 'learning_rate': 1.7384974272422194e-05, 'epoch': 0.52} {'loss': 0.5959, 'learning_rate': 1.7384747733206127e-05, 'epoch': 0.52} {'loss': 0.4409, 'learning_rate': 1.7384521185654084e-05, 'epoch': 0.52} {'loss': 0.6971, 'learning_rate': 1.7384294629766322e-05, 'epoch': 0.52} {'loss': 0.6027, 'learning_rate': 1.7384068065543095e-05, 'epoch': 0.52} {'loss': 0.6379, 'learning_rate': 1.7383841492984658e-05, 'epoch': 0.52} {'loss': 0.4636, 'learning_rate': 1.738361491209127e-05, 'epoch': 0.52} {'loss': 0.5032, 'learning_rate': 1.7383388322863183e-05, 'epoch': 0.52} {'loss': 0.5398, 'learning_rate': 1.738316172530066e-05, 'epoch': 0.52} {'loss': 0.465, 'learning_rate': 1.7382935119403942e-05, 'epoch': 0.52} {'loss': 0.5452, 'learning_rate': 1.73827085051733e-05, 'epoch': 0.52} {'loss': 0.5764, 'learning_rate': 1.738248188260898e-05, 'epoch': 0.52} {'loss': 0.6483, 'learning_rate': 1.7382255251711248e-05, 'epoch': 0.52} {'loss': 0.6585, 'learning_rate': 1.738202861248035e-05, 'epoch': 0.52} {'loss': 0.4084, 'learning_rate': 1.7381801964916545e-05, 'epoch': 0.52} {'loss': 0.6707, 'learning_rate': 1.738157530902009e-05, 'epoch': 0.52} {'loss': 0.4047, 'learning_rate': 1.738134864479124e-05, 'epoch': 0.52} {'loss': 0.5485, 'learning_rate': 1.7381121972230254e-05, 'epoch': 0.52} {'loss': 0.4194, 'learning_rate': 1.738089529133738e-05, 'epoch': 0.52} {'loss': 0.655, 'learning_rate': 1.738066860211288e-05, 'epoch': 0.52} {'loss': 0.5653, 'learning_rate': 1.738044190455701e-05, 'epoch': 0.52} {'loss': 0.5447, 'learning_rate': 1.7380215198670024e-05, 'epoch': 0.52} {'loss': 0.4587, 'learning_rate': 1.737998848445218e-05, 'epoch': 0.52} {'loss': 0.5683, 'learning_rate': 1.737976176190373e-05, 'epoch': 0.52} {'loss': 0.6148, 'learning_rate': 1.737953503102493e-05, 'epoch': 0.52} {'loss': 0.502, 'learning_rate': 1.7379308291816044e-05, 'epoch': 0.52} {'loss': 0.6718, 'learning_rate': 1.737908154427732e-05, 'epoch': 0.52} {'loss': 0.6477, 'learning_rate': 1.7378854788409016e-05, 'epoch': 0.52} {'loss': 0.539, 'learning_rate': 1.737862802421139e-05, 'epoch': 0.52} {'loss': 0.5496, 'learning_rate': 1.7378401251684692e-05, 'epoch': 0.52} {'loss': 0.6263, 'learning_rate': 1.7378174470829184e-05, 'epoch': 0.52} {'loss': 0.6241, 'learning_rate': 1.737794768164512e-05, 'epoch': 0.52} {'loss': 0.6856, 'learning_rate': 1.7377720884132756e-05, 'epoch': 0.52} {'loss': 0.3963, 'learning_rate': 1.737749407829235e-05, 'epoch': 0.52} {'loss': 0.6159, 'learning_rate': 1.737726726412415e-05, 'epoch': 0.52} {'loss': 0.596, 'learning_rate': 1.7377040441628423e-05, 'epoch': 0.52} {'loss': 0.6129, 'learning_rate': 1.737681361080542e-05, 'epoch': 0.52} {'loss': 0.4401, 'learning_rate': 1.7376586771655398e-05, 'epoch': 0.52} {'loss': 0.3567, 'learning_rate': 1.737635992417861e-05, 'epoch': 0.52} {'loss': 0.6287, 'learning_rate': 1.7376133068375317e-05, 'epoch': 0.52} {'loss': 0.6137, 'learning_rate': 1.737590620424577e-05, 'epoch': 0.52} {'loss': 0.5939, 'learning_rate': 1.737567933179023e-05, 'epoch': 0.52} {'loss': 0.4959, 'learning_rate': 1.7375452451008946e-05, 'epoch': 0.52} {'loss': 0.4503, 'learning_rate': 1.7375225561902183e-05, 'epoch': 0.52} {'loss': 0.5434, 'learning_rate': 1.7374998664470188e-05, 'epoch': 0.52} {'loss': 0.4847, 'learning_rate': 1.7374771758713227e-05, 'epoch': 0.52} {'loss': 0.5371, 'learning_rate': 1.7374544844631553e-05, 'epoch': 0.52} {'loss': 0.5727, 'learning_rate': 1.7374317922225414e-05, 'epoch': 0.52} {'loss': 0.5969, 'learning_rate': 1.7374090991495073e-05, 'epoch': 0.52} {'loss': 0.6404, 'learning_rate': 1.7373864052440787e-05, 'epoch': 0.52} {'loss': 0.6186, 'learning_rate': 1.7373637105062813e-05, 'epoch': 0.52} {'loss': 0.6116, 'learning_rate': 1.73734101493614e-05, 'epoch': 0.52} {'loss': 0.627, 'learning_rate': 1.7373183185336814e-05, 'epoch': 0.52} {'loss': 0.6381, 'learning_rate': 1.7372956212989302e-05, 'epoch': 0.52} {'loss': 0.5723, 'learning_rate': 1.7372729232319128e-05, 'epoch': 0.52} {'loss': 0.5949, 'learning_rate': 1.7372502243326544e-05, 'epoch': 0.52} {'loss': 0.492, 'learning_rate': 1.7372275246011807e-05, 'epoch': 0.52} {'loss': 0.5379, 'learning_rate': 1.737204824037517e-05, 'epoch': 0.52} {'loss': 0.5825, 'learning_rate': 1.7371821226416897e-05, 'epoch': 0.52} {'loss': 0.5184, 'learning_rate': 1.7371594204137236e-05, 'epoch': 0.52} {'loss': 0.7407, 'learning_rate': 1.737136717353645e-05, 'epoch': 0.52} {'loss': 0.5711, 'learning_rate': 1.737114013461479e-05, 'epoch': 0.52} {'loss': 0.5116, 'learning_rate': 1.7370913087372515e-05, 'epoch': 0.52} {'loss': 0.6496, 'learning_rate': 1.737068603180988e-05, 'epoch': 0.52} {'loss': 0.6582, 'learning_rate': 1.7370458967927145e-05, 'epoch': 0.52} {'loss': 0.4936, 'learning_rate': 1.7370231895724558e-05, 'epoch': 0.52} {'loss': 0.5503, 'learning_rate': 1.7370004815202387e-05, 'epoch': 0.52} {'loss': 0.6284, 'learning_rate': 1.7369777726360878e-05, 'epoch': 0.52} {'loss': 0.4077, 'learning_rate': 1.7369550629200292e-05, 'epoch': 0.52} {'loss': 0.6515, 'learning_rate': 1.7369323523720884e-05, 'epoch': 0.52} {'loss': 0.6668, 'learning_rate': 1.736909640992291e-05, 'epoch': 0.52} {'loss': 0.628, 'learning_rate': 1.7368869287806634e-05, 'epoch': 0.52} {'loss': 0.7024, 'learning_rate': 1.73686421573723e-05, 'epoch': 0.52} {'loss': 0.4618, 'learning_rate': 1.7368415018620172e-05, 'epoch': 0.52} {'loss': 0.4807, 'learning_rate': 1.7368187871550504e-05, 'epoch': 0.52} {'loss': 0.5898, 'learning_rate': 1.7367960716163553e-05, 'epoch': 0.52} {'loss': 0.5293, 'learning_rate': 1.7367733552459574e-05, 'epoch': 0.52} {'loss': 0.6363, 'learning_rate': 1.736750638043883e-05, 'epoch': 0.52} {'loss': 0.7208, 'learning_rate': 1.7367279200101567e-05, 'epoch': 0.52} {'loss': 0.5427, 'learning_rate': 1.736705201144805e-05, 'epoch': 0.52} {'loss': 0.3983, 'learning_rate': 1.736682481447853e-05, 'epoch': 0.52} {'loss': 0.5526, 'learning_rate': 1.7366597609193264e-05, 'epoch': 0.52} {'loss': 0.5676, 'learning_rate': 1.7366370395592516e-05, 'epoch': 0.52} {'loss': 0.527, 'learning_rate': 1.736614317367653e-05, 'epoch': 0.52} {'loss': 0.518, 'learning_rate': 1.7365915943445575e-05, 'epoch': 0.52} {'loss': 0.6421, 'learning_rate': 1.7365688704899896e-05, 'epoch': 0.52} {'loss': 0.576, 'learning_rate': 1.736546145803976e-05, 'epoch': 0.52} {'loss': 0.5216, 'learning_rate': 1.7365234202865418e-05, 'epoch': 0.52} {'loss': 0.4521, 'learning_rate': 1.7365006939377123e-05, 'epoch': 0.52} {'loss': 0.4871, 'learning_rate': 1.736477966757514e-05, 'epoch': 0.52} {'loss': 0.6887, 'learning_rate': 1.736455238745972e-05, 'epoch': 0.52} {'loss': 0.6719, 'learning_rate': 1.7364325099031122e-05, 'epoch': 0.52} {'loss': 0.6674, 'learning_rate': 1.7364097802289598e-05, 'epoch': 0.52} {'loss': 0.5062, 'learning_rate': 1.7363870497235407e-05, 'epoch': 0.52} {'loss': 0.4641, 'learning_rate': 1.736364318386881e-05, 'epoch': 0.52} {'loss': 0.592, 'learning_rate': 1.736341586219006e-05, 'epoch': 0.52} {'loss': 0.666, 'learning_rate': 1.7363188532199414e-05, 'epoch': 0.52} {'loss': 0.5121, 'learning_rate': 1.7362961193897127e-05, 'epoch': 0.52} {'loss': 0.7187, 'learning_rate': 1.7362733847283458e-05, 'epoch': 0.52} {'loss': 0.6403, 'learning_rate': 1.736250649235866e-05, 'epoch': 0.52} {'loss': 0.4972, 'learning_rate': 1.7362279129122997e-05, 'epoch': 0.52} {'loss': 0.5178, 'learning_rate': 1.7362051757576717e-05, 'epoch': 0.52} {'loss': 0.8265, 'learning_rate': 1.736182437772008e-05, 'epoch': 0.52} {'loss': 0.575, 'learning_rate': 1.7361596989553345e-05, 'epoch': 0.52} {'loss': 0.7043, 'learning_rate': 1.7361369593076767e-05, 'epoch': 0.52} {'loss': 0.6768, 'learning_rate': 1.73611421882906e-05, 'epoch': 0.52} {'loss': 0.5341, 'learning_rate': 1.7360914775195107e-05, 'epoch': 0.52} {'loss': 0.61, 'learning_rate': 1.7360687353790543e-05, 'epoch': 0.52} {'loss': 0.5804, 'learning_rate': 1.7360459924077155e-05, 'epoch': 0.52} {'loss': 0.7334, 'learning_rate': 1.7360232486055214e-05, 'epoch': 0.52} {'loss': 0.4311, 'learning_rate': 1.7360005039724964e-05, 'epoch': 0.52} {'loss': 0.6677, 'learning_rate': 1.7359777585086673e-05, 'epoch': 0.52} {'loss': 0.4971, 'learning_rate': 1.735955012214059e-05, 'epoch': 0.52} {'loss': 0.5916, 'learning_rate': 1.7359322650886976e-05, 'epoch': 0.52} {'loss': 0.6056, 'learning_rate': 1.735909517132609e-05, 'epoch': 0.52} {'loss': 0.5442, 'learning_rate': 1.7358867683458177e-05, 'epoch': 0.52} {'loss': 0.5914, 'learning_rate': 1.7358640187283504e-05, 'epoch': 0.52} {'loss': 0.5256, 'learning_rate': 1.7358412682802328e-05, 'epoch': 0.52} {'loss': 0.6656, 'learning_rate': 1.7358185170014903e-05, 'epoch': 0.52} {'loss': 0.5655, 'learning_rate': 1.7357957648921483e-05, 'epoch': 0.52} {'loss': 0.6139, 'learning_rate': 1.7357730119522333e-05, 'epoch': 0.52} {'loss': 0.8133, 'learning_rate': 1.7357502581817702e-05, 'epoch': 0.52} {'loss': 0.4983, 'learning_rate': 1.735727503580785e-05, 'epoch': 0.52} {'loss': 0.6963, 'learning_rate': 1.735704748149303e-05, 'epoch': 0.52} {'loss': 0.5724, 'learning_rate': 1.735681991887351e-05, 'epoch': 0.52} {'loss': 0.4877, 'learning_rate': 1.7356592347949534e-05, 'epoch': 0.52} {'loss': 0.6057, 'learning_rate': 1.7356364768721367e-05, 'epoch': 0.52} {'loss': 0.6477, 'learning_rate': 1.7356137181189257e-05, 'epoch': 0.52} {'loss': 0.5785, 'learning_rate': 1.7355909585353474e-05, 'epoch': 0.52} {'loss': 0.4723, 'learning_rate': 1.7355681981214264e-05, 'epoch': 0.52} {'loss': 0.6066, 'learning_rate': 1.7355454368771888e-05, 'epoch': 0.52} {'loss': 0.6253, 'learning_rate': 1.7355226748026607e-05, 'epoch': 0.52} {'loss': 0.5102, 'learning_rate': 1.735499911897867e-05, 'epoch': 0.52} {'loss': 0.6433, 'learning_rate': 1.7354771481628337e-05, 'epoch': 0.52} {'loss': 0.5858, 'learning_rate': 1.7354543835975866e-05, 'epoch': 0.52} {'loss': 0.4244, 'learning_rate': 1.7354316182021513e-05, 'epoch': 0.52} {'loss': 0.5603, 'learning_rate': 1.7354088519765536e-05, 'epoch': 0.52} {'loss': 0.6009, 'learning_rate': 1.7353860849208193e-05, 'epoch': 0.52} {'loss': 0.7422, 'learning_rate': 1.735363317034974e-05, 'epoch': 0.52} {'loss': 0.6108, 'learning_rate': 1.7353405483190432e-05, 'epoch': 0.52} {'loss': 0.6663, 'learning_rate': 1.7353177787730526e-05, 'epoch': 0.52} {'loss': 0.5192, 'learning_rate': 1.7352950083970284e-05, 'epoch': 0.52} {'loss': 0.7383, 'learning_rate': 1.7352722371909955e-05, 'epoch': 0.52} {'loss': 0.4591, 'learning_rate': 1.7352494651549805e-05, 'epoch': 0.52} {'loss': 0.631, 'learning_rate': 1.7352266922890084e-05, 'epoch': 0.52} {'loss': 0.6806, 'learning_rate': 1.7352039185931053e-05, 'epoch': 0.52} {'loss': 0.4412, 'learning_rate': 1.735181144067297e-05, 'epoch': 0.52} {'loss': 0.5116, 'learning_rate': 1.7351583687116083e-05, 'epoch': 0.52} {'loss': 0.6138, 'learning_rate': 1.7351355925260663e-05, 'epoch': 0.52} {'loss': 0.5864, 'learning_rate': 1.7351128155106956e-05, 'epoch': 0.52} {'loss': 0.4913, 'learning_rate': 1.7350900376655223e-05, 'epoch': 0.52} {'loss': 0.486, 'learning_rate': 1.7350672589905725e-05, 'epoch': 0.52} {'loss': 0.5282, 'learning_rate': 1.7350444794858716e-05, 'epoch': 0.52} {'loss': 0.5061, 'learning_rate': 1.735021699151445e-05, 'epoch': 0.52} {'loss': 0.5724, 'learning_rate': 1.7349989179873184e-05, 'epoch': 0.52} {'loss': 0.5942, 'learning_rate': 1.734976135993518e-05, 'epoch': 0.52} {'loss': 0.527, 'learning_rate': 1.734953353170069e-05, 'epoch': 0.52} {'loss': 0.6025, 'learning_rate': 1.7349305695169986e-05, 'epoch': 0.52} {'loss': 0.5158, 'learning_rate': 1.7349077850343305e-05, 'epoch': 0.52} {'loss': 0.5364, 'learning_rate': 1.734884999722091e-05, 'epoch': 0.52} {'loss': 0.602, 'learning_rate': 1.7348622135803063e-05, 'epoch': 0.52} {'loss': 0.5268, 'learning_rate': 1.7348394266090022e-05, 'epoch': 0.52} {'loss': 0.6063, 'learning_rate': 1.7348166388082037e-05, 'epoch': 0.52} {'loss': 0.6742, 'learning_rate': 1.7347938501779375e-05, 'epoch': 0.52} {'loss': 0.4234, 'learning_rate': 1.734771060718228e-05, 'epoch': 0.52} {'loss': 0.5185, 'learning_rate': 1.734748270429102e-05, 'epoch': 0.52} {'loss': 0.6396, 'learning_rate': 1.7347254793105853e-05, 'epoch': 0.52} {'loss': 0.5421, 'learning_rate': 1.734702687362703e-05, 'epoch': 0.52} {'loss': 0.6561, 'learning_rate': 1.7346798945854807e-05, 'epoch': 0.52} {'loss': 0.4316, 'learning_rate': 1.7346571009789453e-05, 'epoch': 0.52} {'loss': 0.5525, 'learning_rate': 1.734634306543121e-05, 'epoch': 0.52} {'loss': 0.4101, 'learning_rate': 1.7346115112780347e-05, 'epoch': 0.52} {'loss': 0.6817, 'learning_rate': 1.7345887151837114e-05, 'epoch': 0.52} {'loss': 0.4788, 'learning_rate': 1.7345659182601774e-05, 'epoch': 0.52} {'loss': 0.4856, 'learning_rate': 1.7345431205074577e-05, 'epoch': 0.52} {'loss': 0.5577, 'learning_rate': 1.734520321925579e-05, 'epoch': 0.52} {'loss': 0.5454, 'learning_rate': 1.7344975225145666e-05, 'epoch': 0.52} {'loss': 0.4981, 'learning_rate': 1.734474722274446e-05, 'epoch': 0.52} {'loss': 0.5183, 'learning_rate': 1.734451921205243e-05, 'epoch': 0.52} {'loss': 0.5836, 'learning_rate': 1.7344291193069835e-05, 'epoch': 0.52} {'loss': 0.6182, 'learning_rate': 1.7344063165796932e-05, 'epoch': 0.52} {'loss': 0.5682, 'learning_rate': 1.7343835130233976e-05, 'epoch': 0.52} {'loss': 0.5447, 'learning_rate': 1.734360708638123e-05, 'epoch': 0.52} {'loss': 0.7016, 'learning_rate': 1.7343379034238945e-05, 'epoch': 0.52} {'loss': 0.5549, 'learning_rate': 1.7343150973807383e-05, 'epoch': 0.52} {'loss': 0.5371, 'learning_rate': 1.7342922905086803e-05, 'epoch': 0.52} {'loss': 0.6252, 'learning_rate': 1.7342694828077454e-05, 'epoch': 0.52} {'loss': 0.4838, 'learning_rate': 1.7342466742779603e-05, 'epoch': 0.52} {'loss': 0.8151, 'learning_rate': 1.73422386491935e-05, 'epoch': 0.52} {'loss': 0.6371, 'learning_rate': 1.734201054731941e-05, 'epoch': 0.52} {'loss': 0.5142, 'learning_rate': 1.734178243715758e-05, 'epoch': 0.52} {'loss': 0.5612, 'learning_rate': 1.734155431870828e-05, 'epoch': 0.52} {'loss': 0.6988, 'learning_rate': 1.7341326191971758e-05, 'epoch': 0.52} {'loss': 0.5616, 'learning_rate': 1.7341098056948275e-05, 'epoch': 0.52} {'loss': 0.4149, 'learning_rate': 1.7340869913638086e-05, 'epoch': 0.52} {'loss': 0.5873, 'learning_rate': 1.7340641762041458e-05, 'epoch': 0.52} {'loss': 0.688, 'learning_rate': 1.7340413602158636e-05, 'epoch': 0.52} {'loss': 0.5317, 'learning_rate': 1.7340185433989883e-05, 'epoch': 0.52} {'loss': 0.5973, 'learning_rate': 1.7339957257535457e-05, 'epoch': 0.52} {'loss': 0.789, 'learning_rate': 1.7339729072795613e-05, 'epoch': 0.52} {'loss': 0.7125, 'learning_rate': 1.7339500879770614e-05, 'epoch': 0.52} {'loss': 0.5903, 'learning_rate': 1.733927267846071e-05, 'epoch': 0.52} {'loss': 0.6746, 'learning_rate': 1.7339044468866165e-05, 'epoch': 0.52} {'loss': 0.5822, 'learning_rate': 1.7338816250987237e-05, 'epoch': 0.52} {'loss': 0.4428, 'learning_rate': 1.733858802482418e-05, 'epoch': 0.52} {'loss': 0.5541, 'learning_rate': 1.733835979037725e-05, 'epoch': 0.52} {'loss': 0.672, 'learning_rate': 1.733813154764671e-05, 'epoch': 0.52} {'loss': 0.6674, 'learning_rate': 1.7337903296632812e-05, 'epoch': 0.52} {'loss': 0.541, 'learning_rate': 1.733767503733582e-05, 'epoch': 0.52} {'loss': 0.4643, 'learning_rate': 1.7337446769755987e-05, 'epoch': 0.52} {'loss': 0.4934, 'learning_rate': 1.7337218493893568e-05, 'epoch': 0.52} {'loss': 0.4437, 'learning_rate': 1.733699020974883e-05, 'epoch': 0.52} {'loss': 0.5118, 'learning_rate': 1.733676191732202e-05, 'epoch': 0.52} {'loss': 0.7314, 'learning_rate': 1.733653361661341e-05, 'epoch': 0.52} {'loss': 0.6177, 'learning_rate': 1.733630530762324e-05, 'epoch': 0.52} {'loss': 0.6686, 'learning_rate': 1.733607699035178e-05, 'epoch': 0.52} {'loss': 0.7198, 'learning_rate': 1.7335848664799283e-05, 'epoch': 0.52} {'loss': 0.4501, 'learning_rate': 1.7335620330966007e-05, 'epoch': 0.52} {'loss': 0.5564, 'learning_rate': 1.733539198885221e-05, 'epoch': 0.52} {'loss': 0.6232, 'learning_rate': 1.7335163638458153e-05, 'epoch': 0.52} {'loss': 0.5961, 'learning_rate': 1.733493527978409e-05, 'epoch': 0.52} {'loss': 0.6186, 'learning_rate': 1.733470691283028e-05, 'epoch': 0.52} {'loss': 0.5785, 'learning_rate': 1.7334478537596983e-05, 'epoch': 0.52} {'loss': 0.7421, 'learning_rate': 1.733425015408445e-05, 'epoch': 0.52} {'loss': 0.7466, 'learning_rate': 1.7334021762292943e-05, 'epoch': 0.52} {'loss': 0.5604, 'learning_rate': 1.7333793362222724e-05, 'epoch': 0.52} {'loss': 0.7077, 'learning_rate': 1.7333564953874045e-05, 'epoch': 0.52} {'loss': 0.5099, 'learning_rate': 1.7333336537247165e-05, 'epoch': 0.52} {'loss': 0.5242, 'learning_rate': 1.7333108112342346e-05, 'epoch': 0.52} {'loss': 0.6707, 'learning_rate': 1.7332879679159837e-05, 'epoch': 0.52} {'loss': 0.5643, 'learning_rate': 1.7332651237699905e-05, 'epoch': 0.52} {'loss': 0.735, 'learning_rate': 1.73324227879628e-05, 'epoch': 0.52} {'loss': 0.5292, 'learning_rate': 1.733219432994879e-05, 'epoch': 0.52} {'loss': 0.6564, 'learning_rate': 1.7331965863658124e-05, 'epoch': 0.52} {'loss': 0.3088, 'learning_rate': 1.7331737389091062e-05, 'epoch': 0.52} {'loss': 0.5017, 'learning_rate': 1.7331508906247865e-05, 'epoch': 0.52} {'loss': 0.5854, 'learning_rate': 1.7331280415128787e-05, 'epoch': 0.52} {'loss': 0.5271, 'learning_rate': 1.7331051915734085e-05, 'epoch': 0.52} {'loss': 0.7522, 'learning_rate': 1.7330823408064024e-05, 'epoch': 0.52} {'loss': 0.7908, 'learning_rate': 1.7330594892118858e-05, 'epoch': 0.52} {'loss': 0.5664, 'learning_rate': 1.733036636789884e-05, 'epoch': 0.52} {'loss': 0.6513, 'learning_rate': 1.7330137835404235e-05, 'epoch': 0.52} {'loss': 0.7902, 'learning_rate': 1.7329909294635294e-05, 'epoch': 0.52} {'loss': 0.4561, 'learning_rate': 1.7329680745592285e-05, 'epoch': 0.52} {'loss': 0.479, 'learning_rate': 1.7329452188275457e-05, 'epoch': 0.52} {'loss': 0.533, 'learning_rate': 1.7329223622685073e-05, 'epoch': 0.52} {'loss': 0.5972, 'learning_rate': 1.7328995048821386e-05, 'epoch': 0.52} {'loss': 0.5778, 'learning_rate': 1.732876646668466e-05, 'epoch': 0.52} {'loss': 0.6502, 'learning_rate': 1.732853787627515e-05, 'epoch': 0.52} {'loss': 0.7086, 'learning_rate': 1.7328309277593116e-05, 'epoch': 0.52} {'loss': 0.6406, 'learning_rate': 1.732808067063881e-05, 'epoch': 0.52} {'loss': 0.5607, 'learning_rate': 1.7327852055412498e-05, 'epoch': 0.52} {'loss': 0.4286, 'learning_rate': 1.7327623431914435e-05, 'epoch': 0.52} {'loss': 0.5556, 'learning_rate': 1.7327394800144876e-05, 'epoch': 0.52} {'loss': 0.6251, 'learning_rate': 1.7327166160104083e-05, 'epoch': 0.52} {'loss': 0.6532, 'learning_rate': 1.7326937511792312e-05, 'epoch': 0.52} {'loss': 0.6493, 'learning_rate': 1.732670885520982e-05, 'epoch': 0.52} {'loss': 0.6771, 'learning_rate': 1.732648019035687e-05, 'epoch': 0.52} {'loss': 0.5402, 'learning_rate': 1.732625151723372e-05, 'epoch': 0.52} {'loss': 0.5369, 'learning_rate': 1.732602283584062e-05, 'epoch': 0.52} {'loss': 0.6702, 'learning_rate': 1.7325794146177835e-05, 'epoch': 0.52} {'loss': 0.4882, 'learning_rate': 1.732556544824562e-05, 'epoch': 0.52} {'loss': 0.5968, 'learning_rate': 1.7325336742044237e-05, 'epoch': 0.52} {'loss': 0.4553, 'learning_rate': 1.732510802757394e-05, 'epoch': 0.52} {'loss': 0.5428, 'learning_rate': 1.732487930483499e-05, 'epoch': 0.52} {'loss': 0.5852, 'learning_rate': 1.7324650573827644e-05, 'epoch': 0.52} {'loss': 0.642, 'learning_rate': 1.7324421834552158e-05, 'epoch': 0.52} {'loss': 0.6427, 'learning_rate': 1.7324193087008797e-05, 'epoch': 0.52} {'loss': 0.4576, 'learning_rate': 1.732396433119781e-05, 'epoch': 0.52} {'loss': 0.4422, 'learning_rate': 1.7323735567119465e-05, 'epoch': 0.52} {'loss': 0.6387, 'learning_rate': 1.7323506794774014e-05, 'epoch': 0.52} {'loss': 0.6169, 'learning_rate': 1.7323278014161714e-05, 'epoch': 0.52} {'loss': 0.4469, 'learning_rate': 1.7323049225282826e-05, 'epoch': 0.52} {'loss': 0.5738, 'learning_rate': 1.732282042813761e-05, 'epoch': 0.52} {'loss': 0.6945, 'learning_rate': 1.732259162272632e-05, 'epoch': 0.52} {'loss': 0.6124, 'learning_rate': 1.7322362809049216e-05, 'epoch': 0.52} {'loss': 0.568, 'learning_rate': 1.732213398710656e-05, 'epoch': 0.52} {'loss': 0.6815, 'learning_rate': 1.7321905156898604e-05, 'epoch': 0.52} {'loss': 0.5572, 'learning_rate': 1.7321676318425612e-05, 'epoch': 0.52} {'loss': 0.7679, 'learning_rate': 1.732144747168784e-05, 'epoch': 0.52} {'loss': 0.6204, 'learning_rate': 1.732121861668554e-05, 'epoch': 0.52} {'loss': 0.5271, 'learning_rate': 1.7320989753418983e-05, 'epoch': 0.52} {'loss': 0.5991, 'learning_rate': 1.732076088188842e-05, 'epoch': 0.52} {'loss': 0.4421, 'learning_rate': 1.7320532002094108e-05, 'epoch': 0.52} {'loss': 0.5838, 'learning_rate': 1.732030311403631e-05, 'epoch': 0.52} {'loss': 0.6044, 'learning_rate': 1.732007421771528e-05, 'epoch': 0.52} {'loss': 0.6264, 'learning_rate': 1.7319845313131275e-05, 'epoch': 0.52} {'loss': 0.5627, 'learning_rate': 1.7319616400284562e-05, 'epoch': 0.52} {'loss': 0.5419, 'learning_rate': 1.731938747917539e-05, 'epoch': 0.52} {'loss': 0.6472, 'learning_rate': 1.7319158549804024e-05, 'epoch': 0.52} {'loss': 0.4938, 'learning_rate': 1.7318929612170722e-05, 'epoch': 0.52} {'loss': 0.5466, 'learning_rate': 1.7318700666275734e-05, 'epoch': 0.52} {'loss': 0.4261, 'learning_rate': 1.731847171211933e-05, 'epoch': 0.52} {'loss': 0.56, 'learning_rate': 1.7318242749701758e-05, 'epoch': 0.52} {'loss': 0.7025, 'learning_rate': 1.7318013779023288e-05, 'epoch': 0.52} {'loss': 0.6774, 'learning_rate': 1.7317784800084166e-05, 'epoch': 0.52} {'loss': 0.7561, 'learning_rate': 1.731755581288466e-05, 'epoch': 0.52} {'loss': 0.4681, 'learning_rate': 1.731732681742502e-05, 'epoch': 0.52} {'loss': 0.5657, 'learning_rate': 1.7317097813705513e-05, 'epoch': 0.52} {'loss': 0.6988, 'learning_rate': 1.7316868801726398e-05, 'epoch': 0.52} {'loss': 0.3987, 'learning_rate': 1.7316639781487925e-05, 'epoch': 0.52} {'loss': 0.722, 'learning_rate': 1.731641075299036e-05, 'epoch': 0.52} {'loss': 0.5686, 'learning_rate': 1.7316181716233954e-05, 'epoch': 0.52} {'loss': 0.7041, 'learning_rate': 1.731595267121897e-05, 'epoch': 0.52} {'loss': 0.4808, 'learning_rate': 1.7315723617945674e-05, 'epoch': 0.52} {'loss': 0.59, 'learning_rate': 1.731549455641431e-05, 'epoch': 0.52} {'loss': 0.5683, 'learning_rate': 1.731526548662515e-05, 'epoch': 0.52} {'loss': 0.6553, 'learning_rate': 1.731503640857844e-05, 'epoch': 0.52} {'loss': 0.5437, 'learning_rate': 1.731480732227445e-05, 'epoch': 0.52} {'loss': 0.5542, 'learning_rate': 1.731457822771343e-05, 'epoch': 0.53} {'loss': 0.6405, 'learning_rate': 1.731434912489564e-05, 'epoch': 0.53} {'loss': 0.5996, 'learning_rate': 1.7314120013821344e-05, 'epoch': 0.53} {'loss': 0.6595, 'learning_rate': 1.7313890894490797e-05, 'epoch': 0.53} {'loss': 0.5938, 'learning_rate': 1.731366176690426e-05, 'epoch': 0.53} {'loss': 0.6194, 'learning_rate': 1.7313432631061985e-05, 'epoch': 0.53} {'loss': 0.6129, 'learning_rate': 1.731320348696424e-05, 'epoch': 0.53} {'loss': 0.4458, 'learning_rate': 1.7312974334611276e-05, 'epoch': 0.53} {'loss': 0.6215, 'learning_rate': 1.7312745174003357e-05, 'epoch': 0.53} {'loss': 0.526, 'learning_rate': 1.7312516005140736e-05, 'epoch': 0.53} {'loss': 0.3422, 'learning_rate': 1.7312286828023677e-05, 'epoch': 0.53} {'loss': 0.5407, 'learning_rate': 1.7312057642652437e-05, 'epoch': 0.53} {'loss': 0.6034, 'learning_rate': 1.7311828449027272e-05, 'epoch': 0.53} {'loss': 0.5318, 'learning_rate': 1.731159924714845e-05, 'epoch': 0.53} {'loss': 0.6601, 'learning_rate': 1.7311370037016213e-05, 'epoch': 0.53} {'loss': 0.6842, 'learning_rate': 1.7311140818630835e-05, 'epoch': 0.53} {'loss': 0.5636, 'learning_rate': 1.7310911591992568e-05, 'epoch': 0.53} {'loss': 0.4379, 'learning_rate': 1.731068235710167e-05, 'epoch': 0.53} {'loss': 0.7142, 'learning_rate': 1.7310453113958408e-05, 'epoch': 0.53} {'loss': 0.5195, 'learning_rate': 1.731022386256303e-05, 'epoch': 0.53} {'loss': 0.6637, 'learning_rate': 1.7309994602915798e-05, 'epoch': 0.53} {'loss': 0.4758, 'learning_rate': 1.7309765335016976e-05, 'epoch': 0.53} {'loss': 0.6962, 'learning_rate': 1.7309536058866817e-05, 'epoch': 0.53} {'loss': 0.5668, 'learning_rate': 1.7309306774465585e-05, 'epoch': 0.53} {'loss': 0.6252, 'learning_rate': 1.7309077481813534e-05, 'epoch': 0.53} {'loss': 0.6219, 'learning_rate': 1.730884818091092e-05, 'epoch': 0.53} {'loss': 0.557, 'learning_rate': 1.730861887175801e-05, 'epoch': 0.53} {'loss': 0.6014, 'learning_rate': 1.730838955435506e-05, 'epoch': 0.53} {'loss': 0.6193, 'learning_rate': 1.7308160228702323e-05, 'epoch': 0.53} {'loss': 0.5827, 'learning_rate': 1.730793089480007e-05, 'epoch': 0.53} {'loss': 0.7262, 'learning_rate': 1.7307701552648547e-05, 'epoch': 0.53} {'loss': 0.594, 'learning_rate': 1.7307472202248022e-05, 'epoch': 0.53} {'loss': 0.5924, 'learning_rate': 1.7307242843598744e-05, 'epoch': 0.53} {'loss': 0.6269, 'learning_rate': 1.7307013476700986e-05, 'epoch': 0.53} {'loss': 0.6747, 'learning_rate': 1.7306784101554996e-05, 'epoch': 0.53} {'loss': 0.7026, 'learning_rate': 1.7306554718161037e-05, 'epoch': 0.53} {'loss': 0.6712, 'learning_rate': 1.730632532651937e-05, 'epoch': 0.53} {'loss': 0.6482, 'learning_rate': 1.7306095926630243e-05, 'epoch': 0.53} {'loss': 0.5171, 'learning_rate': 1.730586651849393e-05, 'epoch': 0.53} {'loss': 0.6194, 'learning_rate': 1.730563710211068e-05, 'epoch': 0.53} {'loss': 0.7319, 'learning_rate': 1.7305407677480757e-05, 'epoch': 0.53} {'loss': 0.506, 'learning_rate': 1.7305178244604418e-05, 'epoch': 0.53} {'loss': 0.5226, 'learning_rate': 1.730494880348192e-05, 'epoch': 0.53} {'loss': 0.5954, 'learning_rate': 1.7304719354113524e-05, 'epoch': 0.53} {'loss': 0.5424, 'learning_rate': 1.730448989649949e-05, 'epoch': 0.53} {'loss': 0.7255, 'learning_rate': 1.7304260430640075e-05, 'epoch': 0.53} {'loss': 0.4917, 'learning_rate': 1.730403095653554e-05, 'epoch': 0.53} {'loss': 0.6436, 'learning_rate': 1.7303801474186142e-05, 'epoch': 0.53} {'loss': 0.54, 'learning_rate': 1.7303571983592143e-05, 'epoch': 0.53} {'loss': 0.5367, 'learning_rate': 1.7303342484753797e-05, 'epoch': 0.53} {'loss': 0.5908, 'learning_rate': 1.7303112977671367e-05, 'epoch': 0.53} {'loss': 0.5208, 'learning_rate': 1.730288346234511e-05, 'epoch': 0.53} {'loss': 0.5278, 'learning_rate': 1.730265393877529e-05, 'epoch': 0.53} {'loss': 0.536, 'learning_rate': 1.730242440696216e-05, 'epoch': 0.53} {'loss': 0.635, 'learning_rate': 1.7302194866905982e-05, 'epoch': 0.53} {'loss': 0.6283, 'learning_rate': 1.7301965318607017e-05, 'epoch': 0.53} {'loss': 0.4045, 'learning_rate': 1.7301735762065517e-05, 'epoch': 0.53} {'loss': 0.5993, 'learning_rate': 1.730150619728175e-05, 'epoch': 0.53} {'loss': 0.6184, 'learning_rate': 1.7301276624255968e-05, 'epoch': 0.53} {'loss': 0.5321, 'learning_rate': 1.730104704298843e-05, 'epoch': 0.53} {'loss': 0.7358, 'learning_rate': 1.7300817453479406e-05, 'epoch': 0.53} {'loss': 0.5025, 'learning_rate': 1.7300587855729146e-05, 'epoch': 0.53} {'loss': 0.5518, 'learning_rate': 1.7300358249737906e-05, 'epoch': 0.53} {'loss': 0.6127, 'learning_rate': 1.730012863550595e-05, 'epoch': 0.53} {'loss': 0.4324, 'learning_rate': 1.729989901303354e-05, 'epoch': 0.53} {'loss': 0.5946, 'learning_rate': 1.7299669382320933e-05, 'epoch': 0.53} {'loss': 0.6818, 'learning_rate': 1.7299439743368385e-05, 'epoch': 0.53} {'loss': 0.5379, 'learning_rate': 1.729921009617616e-05, 'epoch': 0.53} {'loss': 0.5917, 'learning_rate': 1.7298980440744507e-05, 'epoch': 0.53} {'loss': 0.5965, 'learning_rate': 1.7298750777073702e-05, 'epoch': 0.53} {'loss': 0.5661, 'learning_rate': 1.7298521105163993e-05, 'epoch': 0.53} {'loss': 0.7459, 'learning_rate': 1.729829142501564e-05, 'epoch': 0.53} {'loss': 0.5793, 'learning_rate': 1.7298061736628904e-05, 'epoch': 0.53} {'loss': 0.4142, 'learning_rate': 1.7297832040004045e-05, 'epoch': 0.53} {'loss': 0.5343, 'learning_rate': 1.7297602335141322e-05, 'epoch': 0.53} {'loss': 0.6738, 'learning_rate': 1.729737262204099e-05, 'epoch': 0.53} {'loss': 0.4155, 'learning_rate': 1.7297142900703315e-05, 'epoch': 0.53} {'loss': 0.6778, 'learning_rate': 1.7296913171128556e-05, 'epoch': 0.53} {'loss': 0.5848, 'learning_rate': 1.7296683433316967e-05, 'epoch': 0.53} {'loss': 0.5996, 'learning_rate': 1.729645368726881e-05, 'epoch': 0.53} {'loss': 0.6292, 'learning_rate': 1.7296223932984343e-05, 'epoch': 0.53} {'loss': 0.6008, 'learning_rate': 1.7295994170463824e-05, 'epoch': 0.53} {'loss': 0.4541, 'learning_rate': 1.729576439970752e-05, 'epoch': 0.53} {'loss': 0.4889, 'learning_rate': 1.7295534620715685e-05, 'epoch': 0.53} {'loss': 0.6607, 'learning_rate': 1.7295304833488577e-05, 'epoch': 0.53} {'loss': 0.6413, 'learning_rate': 1.7295075038026458e-05, 'epoch': 0.53} {'loss': 0.518, 'learning_rate': 1.7294845234329587e-05, 'epoch': 0.53} {'loss': 0.5881, 'learning_rate': 1.729461542239822e-05, 'epoch': 0.53} {'loss': 0.73, 'learning_rate': 1.7294385602232623e-05, 'epoch': 0.53} {'loss': 0.7366, 'learning_rate': 1.729415577383305e-05, 'epoch': 0.53} {'loss': 0.5535, 'learning_rate': 1.729392593719976e-05, 'epoch': 0.53} {'loss': 0.7639, 'learning_rate': 1.7293696092333018e-05, 'epoch': 0.53} {'loss': 0.5084, 'learning_rate': 1.729346623923308e-05, 'epoch': 0.53} {'loss': 0.5087, 'learning_rate': 1.7293236377900203e-05, 'epoch': 0.53} {'loss': 0.5318, 'learning_rate': 1.7293006508334648e-05, 'epoch': 0.53} {'loss': 0.5088, 'learning_rate': 1.729277663053668e-05, 'epoch': 0.53} {'loss': 0.6363, 'learning_rate': 1.729254674450655e-05, 'epoch': 0.53} {'loss': 0.6639, 'learning_rate': 1.7292316850244524e-05, 'epoch': 0.53} {'loss': 0.5929, 'learning_rate': 1.729208694775086e-05, 'epoch': 0.53} {'loss': 0.7035, 'learning_rate': 1.7291857037025814e-05, 'epoch': 0.53} {'loss': 0.5036, 'learning_rate': 1.729162711806965e-05, 'epoch': 0.53} {'loss': 0.6526, 'learning_rate': 1.7291397190882622e-05, 'epoch': 0.53} {'loss': 0.5776, 'learning_rate': 1.7291167255465e-05, 'epoch': 0.53} {'loss': 0.6934, 'learning_rate': 1.729093731181703e-05, 'epoch': 0.53} {'loss': 0.5472, 'learning_rate': 1.729070735993898e-05, 'epoch': 0.53} {'loss': 0.7491, 'learning_rate': 1.729047739983111e-05, 'epoch': 0.53} {'loss': 0.6234, 'learning_rate': 1.7290247431493675e-05, 'epoch': 0.53} {'loss': 0.6392, 'learning_rate': 1.7290017454926934e-05, 'epoch': 0.53} {'loss': 0.4759, 'learning_rate': 1.7289787470131153e-05, 'epoch': 0.53} {'loss': 0.4512, 'learning_rate': 1.728955747710659e-05, 'epoch': 0.53} {'loss': 0.5132, 'learning_rate': 1.7289327475853502e-05, 'epoch': 0.53} {'loss': 0.5571, 'learning_rate': 1.7289097466372148e-05, 'epoch': 0.53} {'loss': 0.403, 'learning_rate': 1.7288867448662787e-05, 'epoch': 0.53} {'loss': 0.6094, 'learning_rate': 1.7288637422725684e-05, 'epoch': 0.53} {'loss': 0.5872, 'learning_rate': 1.7288407388561095e-05, 'epoch': 0.53} {'loss': 0.5694, 'learning_rate': 1.728817734616928e-05, 'epoch': 0.53} {'loss': 0.7915, 'learning_rate': 1.7287947295550496e-05, 'epoch': 0.53} {'loss': 0.6251, 'learning_rate': 1.7287717236705007e-05, 'epoch': 0.53} {'loss': 0.6357, 'learning_rate': 1.7287487169633074e-05, 'epoch': 0.53} {'loss': 0.5857, 'learning_rate': 1.728725709433495e-05, 'epoch': 0.53} {'loss': 0.5569, 'learning_rate': 1.7287027010810898e-05, 'epoch': 0.53} {'loss': 0.6277, 'learning_rate': 1.7286796919061184e-05, 'epoch': 0.53} {'loss': 0.7838, 'learning_rate': 1.7286566819086056e-05, 'epoch': 0.53} {'loss': 0.6802, 'learning_rate': 1.7286336710885783e-05, 'epoch': 0.53} {'loss': 0.6539, 'learning_rate': 1.7286106594460618e-05, 'epoch': 0.53} {'loss': 0.6003, 'learning_rate': 1.7285876469810827e-05, 'epoch': 0.53} {'loss': 0.5377, 'learning_rate': 1.7285646336936664e-05, 'epoch': 0.53} {'loss': 0.6584, 'learning_rate': 1.7285416195838398e-05, 'epoch': 0.53} {'loss': 0.5237, 'learning_rate': 1.7285186046516278e-05, 'epoch': 0.53} {'loss': 0.6066, 'learning_rate': 1.7284955888970567e-05, 'epoch': 0.53} {'loss': 0.4809, 'learning_rate': 1.7284725723201527e-05, 'epoch': 0.53} {'loss': 0.7025, 'learning_rate': 1.728449554920942e-05, 'epoch': 0.53} {'loss': 0.4234, 'learning_rate': 1.7284265366994498e-05, 'epoch': 0.53} {'loss': 0.6264, 'learning_rate': 1.728403517655703e-05, 'epoch': 0.53} {'loss': 0.5102, 'learning_rate': 1.728380497789727e-05, 'epoch': 0.53} {'loss': 0.6593, 'learning_rate': 1.7283574771015478e-05, 'epoch': 0.53} {'loss': 0.6337, 'learning_rate': 1.7283344555911912e-05, 'epoch': 0.53} {'loss': 0.5632, 'learning_rate': 1.7283114332586842e-05, 'epoch': 0.53} {'loss': 0.611, 'learning_rate': 1.7282884101040517e-05, 'epoch': 0.53} {'loss': 0.5466, 'learning_rate': 1.72826538612732e-05, 'epoch': 0.53} {'loss': 0.594, 'learning_rate': 1.7282423613285154e-05, 'epoch': 0.53} {'loss': 0.4802, 'learning_rate': 1.7282193357076635e-05, 'epoch': 0.53} {'loss': 0.5072, 'learning_rate': 1.7281963092647905e-05, 'epoch': 0.53} {'loss': 0.5228, 'learning_rate': 1.7281732819999225e-05, 'epoch': 0.53} {'loss': 0.5207, 'learning_rate': 1.728150253913085e-05, 'epoch': 0.53} {'loss': 0.6356, 'learning_rate': 1.7281272250043045e-05, 'epoch': 0.53} {'loss': 0.6124, 'learning_rate': 1.7281041952736067e-05, 'epoch': 0.53} {'loss': 0.4901, 'learning_rate': 1.728081164721018e-05, 'epoch': 0.53} {'loss': 0.5628, 'learning_rate': 1.728058133346564e-05, 'epoch': 0.53} {'loss': 0.5052, 'learning_rate': 1.7280351011502708e-05, 'epoch': 0.53} {'loss': 0.6154, 'learning_rate': 1.7280120681321643e-05, 'epoch': 0.53} {'loss': 0.6123, 'learning_rate': 1.7279890342922708e-05, 'epoch': 0.53} {'loss': 0.614, 'learning_rate': 1.727965999630616e-05, 'epoch': 0.53} {'loss': 0.459, 'learning_rate': 1.727942964147226e-05, 'epoch': 0.53} {'loss': 0.654, 'learning_rate': 1.7279199278421267e-05, 'epoch': 0.53} {'loss': 0.7056, 'learning_rate': 1.7278968907153446e-05, 'epoch': 0.53} {'loss': 0.5388, 'learning_rate': 1.727873852766905e-05, 'epoch': 0.53} {'loss': 0.6709, 'learning_rate': 1.727850813996834e-05, 'epoch': 0.53} {'loss': 0.4868, 'learning_rate': 1.7278277744051583e-05, 'epoch': 0.53} {'loss': 0.8246, 'learning_rate': 1.7278047339919036e-05, 'epoch': 0.53} {'loss': 0.5083, 'learning_rate': 1.7277816927570954e-05, 'epoch': 0.53} {'loss': 0.5152, 'learning_rate': 1.7277586507007604e-05, 'epoch': 0.53} {'loss': 0.6372, 'learning_rate': 1.7277356078229237e-05, 'epoch': 0.53} {'loss': 0.4535, 'learning_rate': 1.727712564123612e-05, 'epoch': 0.53} {'loss': 0.7803, 'learning_rate': 1.7276895196028517e-05, 'epoch': 0.53} {'loss': 0.4903, 'learning_rate': 1.727666474260668e-05, 'epoch': 0.53} {'loss': 0.6829, 'learning_rate': 1.727643428097087e-05, 'epoch': 0.53} {'loss': 0.7271, 'learning_rate': 1.7276203811121353e-05, 'epoch': 0.53} {'loss': 0.5877, 'learning_rate': 1.7275973333058384e-05, 'epoch': 0.53} {'loss': 0.5706, 'learning_rate': 1.7275742846782225e-05, 'epoch': 0.53} {'loss': 0.6618, 'learning_rate': 1.7275512352293136e-05, 'epoch': 0.53} {'loss': 0.627, 'learning_rate': 1.7275281849591375e-05, 'epoch': 0.53} {'loss': 0.5402, 'learning_rate': 1.7275051338677206e-05, 'epoch': 0.53} {'loss': 0.526, 'learning_rate': 1.727482081955089e-05, 'epoch': 0.53} {'loss': 0.675, 'learning_rate': 1.7274590292212677e-05, 'epoch': 0.53} {'loss': 0.6562, 'learning_rate': 1.7274359756662843e-05, 'epoch': 0.53} {'loss': 0.6833, 'learning_rate': 1.7274129212901637e-05, 'epoch': 0.53} {'loss': 0.6675, 'learning_rate': 1.727389866092932e-05, 'epoch': 0.53} {'loss': 0.5181, 'learning_rate': 1.727366810074616e-05, 'epoch': 0.53} {'loss': 0.5912, 'learning_rate': 1.727343753235241e-05, 'epoch': 0.53} {'loss': 0.5844, 'learning_rate': 1.7273206955748327e-05, 'epoch': 0.53} {'loss': 0.6333, 'learning_rate': 1.7272976370934183e-05, 'epoch': 0.53} {'loss': 0.5129, 'learning_rate': 1.727274577791023e-05, 'epoch': 0.53} {'loss': 0.5596, 'learning_rate': 1.7272515176676726e-05, 'epoch': 0.53} {'loss': 0.4562, 'learning_rate': 1.727228456723394e-05, 'epoch': 0.53} {'loss': 0.5521, 'learning_rate': 1.7272053949582127e-05, 'epoch': 0.53} {'loss': 0.534, 'learning_rate': 1.7271823323721545e-05, 'epoch': 0.53} {'loss': 0.5735, 'learning_rate': 1.727159268965246e-05, 'epoch': 0.53} {'loss': 0.6271, 'learning_rate': 1.7271362047375127e-05, 'epoch': 0.53} {'loss': 0.3857, 'learning_rate': 1.727113139688981e-05, 'epoch': 0.53} {'loss': 0.5426, 'learning_rate': 1.7270900738196773e-05, 'epoch': 0.53} {'loss': 0.6413, 'learning_rate': 1.7270670071296266e-05, 'epoch': 0.53} {'loss': 0.6148, 'learning_rate': 1.7270439396188558e-05, 'epoch': 0.53} {'loss': 0.4365, 'learning_rate': 1.7270208712873904e-05, 'epoch': 0.53} {'loss': 0.4932, 'learning_rate': 1.7269978021352568e-05, 'epoch': 0.53} {'loss': 0.6486, 'learning_rate': 1.7269747321624807e-05, 'epoch': 0.53} {'loss': 0.4963, 'learning_rate': 1.726951661369089e-05, 'epoch': 0.53} {'loss': 0.4683, 'learning_rate': 1.7269285897551066e-05, 'epoch': 0.53} {'loss': 0.5498, 'learning_rate': 1.72690551732056e-05, 'epoch': 0.53} {'loss': 0.5601, 'learning_rate': 1.7268824440654758e-05, 'epoch': 0.53} {'loss': 0.4356, 'learning_rate': 1.726859369989879e-05, 'epoch': 0.53} {'loss': 0.5596, 'learning_rate': 1.7268362950937966e-05, 'epoch': 0.53} {'loss': 0.5384, 'learning_rate': 1.726813219377254e-05, 'epoch': 0.53} {'loss': 0.7531, 'learning_rate': 1.7267901428402773e-05, 'epoch': 0.53} {'loss': 0.6385, 'learning_rate': 1.7267670654828932e-05, 'epoch': 0.53} {'loss': 0.6565, 'learning_rate': 1.7267439873051272e-05, 'epoch': 0.53} {'loss': 0.6519, 'learning_rate': 1.726720908307005e-05, 'epoch': 0.53} {'loss': 0.4894, 'learning_rate': 1.7266978284885534e-05, 'epoch': 0.53} {'loss': 0.6283, 'learning_rate': 1.7266747478497982e-05, 'epoch': 0.53} {'loss': 0.5854, 'learning_rate': 1.726651666390765e-05, 'epoch': 0.53} {'loss': 0.6428, 'learning_rate': 1.726628584111481e-05, 'epoch': 0.53} {'loss': 0.5306, 'learning_rate': 1.726605501011971e-05, 'epoch': 0.53} {'loss': 0.63, 'learning_rate': 1.7265824170922615e-05, 'epoch': 0.53} {'loss': 0.4651, 'learning_rate': 1.7265593323523787e-05, 'epoch': 0.53} {'loss': 0.6699, 'learning_rate': 1.726536246792349e-05, 'epoch': 0.53} {'loss': 0.653, 'learning_rate': 1.7265131604121974e-05, 'epoch': 0.53} {'loss': 0.6499, 'learning_rate': 1.7264900732119506e-05, 'epoch': 0.53} {'loss': 0.5505, 'learning_rate': 1.726466985191635e-05, 'epoch': 0.53} {'loss': 0.5431, 'learning_rate': 1.7264438963512762e-05, 'epoch': 0.53} {'loss': 0.6489, 'learning_rate': 1.7264208066909004e-05, 'epoch': 0.53} {'loss': 0.6822, 'learning_rate': 1.7263977162105338e-05, 'epoch': 0.53} {'loss': 0.5636, 'learning_rate': 1.7263746249102017e-05, 'epoch': 0.53} {'loss': 0.505, 'learning_rate': 1.7263515327899315e-05, 'epoch': 0.53} {'loss': 0.5344, 'learning_rate': 1.7263284398497483e-05, 'epoch': 0.53} {'loss': 0.582, 'learning_rate': 1.7263053460896785e-05, 'epoch': 0.53} {'loss': 0.5193, 'learning_rate': 1.7262822515097476e-05, 'epoch': 0.53} {'loss': 0.6763, 'learning_rate': 1.7262591561099827e-05, 'epoch': 0.53} {'loss': 0.4337, 'learning_rate': 1.726236059890409e-05, 'epoch': 0.53} {'loss': 0.4385, 'learning_rate': 1.726212962851053e-05, 'epoch': 0.53} {'loss': 0.6078, 'learning_rate': 1.7261898649919408e-05, 'epoch': 0.53} {'loss': 0.6664, 'learning_rate': 1.7261667663130982e-05, 'epoch': 0.53} {'loss': 0.5489, 'learning_rate': 1.7261436668145514e-05, 'epoch': 0.53} {'loss': 0.513, 'learning_rate': 1.7261205664963263e-05, 'epoch': 0.53} {'loss': 0.5979, 'learning_rate': 1.7260974653584495e-05, 'epoch': 0.53} {'loss': 0.6969, 'learning_rate': 1.7260743634009463e-05, 'epoch': 0.53} {'loss': 0.5266, 'learning_rate': 1.726051260623844e-05, 'epoch': 0.53} {'loss': 0.461, 'learning_rate': 1.726028157027167e-05, 'epoch': 0.53} {'loss': 0.5092, 'learning_rate': 1.7260050526109427e-05, 'epoch': 0.53} {'loss': 0.7819, 'learning_rate': 1.7259819473751967e-05, 'epoch': 0.53} {'loss': 0.6291, 'learning_rate': 1.7259588413199552e-05, 'epoch': 0.53} {'loss': 0.6976, 'learning_rate': 1.725935734445244e-05, 'epoch': 0.53} {'loss': 0.6589, 'learning_rate': 1.7259126267510897e-05, 'epoch': 0.53} {'loss': 0.6536, 'learning_rate': 1.725889518237518e-05, 'epoch': 0.53} {'loss': 0.4325, 'learning_rate': 1.7258664089045548e-05, 'epoch': 0.53} {'loss': 0.5837, 'learning_rate': 1.725843298752227e-05, 'epoch': 0.53} {'loss': 0.6694, 'learning_rate': 1.7258201877805596e-05, 'epoch': 0.53} {'loss': 0.4762, 'learning_rate': 1.7257970759895796e-05, 'epoch': 0.53} {'loss': 0.6881, 'learning_rate': 1.7257739633793124e-05, 'epoch': 0.53} {'loss': 0.6914, 'learning_rate': 1.7257508499497847e-05, 'epoch': 0.53} {'loss': 0.6449, 'learning_rate': 1.725727735701022e-05, 'epoch': 0.53} {'loss': 0.4618, 'learning_rate': 1.7257046206330507e-05, 'epoch': 0.53} {'loss': 0.6874, 'learning_rate': 1.725681504745897e-05, 'epoch': 0.53} {'loss': 0.4361, 'learning_rate': 1.725658388039587e-05, 'epoch': 0.53} {'loss': 0.5728, 'learning_rate': 1.725635270514147e-05, 'epoch': 0.53} {'loss': 0.5402, 'learning_rate': 1.7256121521696018e-05, 'epoch': 0.53} {'loss': 0.4715, 'learning_rate': 1.7255890330059793e-05, 'epoch': 0.53} {'loss': 0.4051, 'learning_rate': 1.7255659130233043e-05, 'epoch': 0.53} {'loss': 0.5008, 'learning_rate': 1.7255427922216033e-05, 'epoch': 0.53} {'loss': 0.5441, 'learning_rate': 1.725519670600903e-05, 'epoch': 0.53} {'loss': 0.5717, 'learning_rate': 1.7254965481612286e-05, 'epoch': 0.53} {'loss': 0.5677, 'learning_rate': 1.7254734249026066e-05, 'epoch': 0.53} {'loss': 0.4164, 'learning_rate': 1.725450300825063e-05, 'epoch': 0.53} {'loss': 0.5429, 'learning_rate': 1.725427175928624e-05, 'epoch': 0.53} {'loss': 0.6909, 'learning_rate': 1.7254040502133156e-05, 'epoch': 0.53} {'loss': 0.5928, 'learning_rate': 1.725380923679164e-05, 'epoch': 0.53} {'loss': 0.5202, 'learning_rate': 1.7253577963261955e-05, 'epoch': 0.53} {'loss': 0.5799, 'learning_rate': 1.7253346681544355e-05, 'epoch': 0.53} {'loss': 0.6402, 'learning_rate': 1.725311539163911e-05, 'epoch': 0.53} {'loss': 0.5305, 'learning_rate': 1.7252884093546476e-05, 'epoch': 0.53} {'loss': 0.5996, 'learning_rate': 1.7252652787266716e-05, 'epoch': 0.53} {'loss': 0.667, 'learning_rate': 1.7252421472800088e-05, 'epoch': 0.53} {'loss': 0.499, 'learning_rate': 1.7252190150146856e-05, 'epoch': 0.53} {'loss': 0.4275, 'learning_rate': 1.725195881930728e-05, 'epoch': 0.53} {'loss': 0.7058, 'learning_rate': 1.7251727480281623e-05, 'epoch': 0.53} {'loss': 0.6773, 'learning_rate': 1.725149613307014e-05, 'epoch': 0.53} {'loss': 0.5786, 'learning_rate': 1.7251264777673106e-05, 'epoch': 0.53} {'loss': 0.6732, 'learning_rate': 1.7251033414090764e-05, 'epoch': 0.53} {'loss': 0.679, 'learning_rate': 1.725080204232339e-05, 'epoch': 0.53} {'loss': 0.5305, 'learning_rate': 1.7250570662371235e-05, 'epoch': 0.53} {'loss': 0.5305, 'learning_rate': 1.7250339274234567e-05, 'epoch': 0.53} {'loss': 0.5463, 'learning_rate': 1.7250107877913646e-05, 'epoch': 0.53} {'loss': 0.6828, 'learning_rate': 1.724987647340873e-05, 'epoch': 0.53} {'loss': 0.6867, 'learning_rate': 1.724964506072008e-05, 'epoch': 0.53} {'loss': 0.666, 'learning_rate': 1.7249413639847963e-05, 'epoch': 0.53} {'loss': 0.4974, 'learning_rate': 1.7249182210792638e-05, 'epoch': 0.53} {'loss': 0.6649, 'learning_rate': 1.724895077355436e-05, 'epoch': 0.53} {'loss': 0.6616, 'learning_rate': 1.7248719328133393e-05, 'epoch': 0.53} {'loss': 0.5152, 'learning_rate': 1.7248487874530005e-05, 'epoch': 0.53} {'loss': 0.5613, 'learning_rate': 1.7248256412744453e-05, 'epoch': 0.53} {'loss': 0.5655, 'learning_rate': 1.7248024942777e-05, 'epoch': 0.53} {'loss': 0.6613, 'learning_rate': 1.7247793464627897e-05, 'epoch': 0.53} {'loss': 0.6438, 'learning_rate': 1.7247561978297417e-05, 'epoch': 0.53} {'loss': 0.6105, 'learning_rate': 1.724733048378582e-05, 'epoch': 0.53} {'loss': 0.5309, 'learning_rate': 1.7247098981093364e-05, 'epoch': 0.53} {'loss': 0.6677, 'learning_rate': 1.724686747022031e-05, 'epoch': 0.53} {'loss': 0.5579, 'learning_rate': 1.7246635951166925e-05, 'epoch': 0.53} {'loss': 0.6758, 'learning_rate': 1.724640442393346e-05, 'epoch': 0.53} {'loss': 0.7615, 'learning_rate': 1.724617288852019e-05, 'epoch': 0.53} {'loss': 0.6243, 'learning_rate': 1.724594134492736e-05, 'epoch': 0.53} {'loss': 0.5353, 'learning_rate': 1.7245709793155243e-05, 'epoch': 0.53} {'loss': 0.5677, 'learning_rate': 1.72454782332041e-05, 'epoch': 0.53} {'loss': 0.6789, 'learning_rate': 1.7245246665074188e-05, 'epoch': 0.53} {'loss': 0.6391, 'learning_rate': 1.724501508876577e-05, 'epoch': 0.53} {'loss': 0.4992, 'learning_rate': 1.7244783504279108e-05, 'epoch': 0.53} {'loss': 0.7053, 'learning_rate': 1.7244551911614463e-05, 'epoch': 0.53} {'loss': 0.536, 'learning_rate': 1.7244320310772097e-05, 'epoch': 0.53} {'loss': 0.6887, 'learning_rate': 1.7244088701752272e-05, 'epoch': 0.53} {'loss': 0.4657, 'learning_rate': 1.7243857084555245e-05, 'epoch': 0.53} {'loss': 0.7344, 'learning_rate': 1.7243625459181284e-05, 'epoch': 0.53} {'loss': 0.5268, 'learning_rate': 1.7243393825630646e-05, 'epoch': 0.53} {'loss': 0.6965, 'learning_rate': 1.7243162183903596e-05, 'epoch': 0.53} {'loss': 0.679, 'learning_rate': 1.724293053400039e-05, 'epoch': 0.53} {'loss': 0.6572, 'learning_rate': 1.7242698875921292e-05, 'epoch': 0.53} {'loss': 0.4594, 'learning_rate': 1.7242467209666566e-05, 'epoch': 0.53} {'loss': 0.514, 'learning_rate': 1.7242235535236472e-05, 'epoch': 0.53} {'loss': 0.5253, 'learning_rate': 1.7242003852631273e-05, 'epoch': 0.53} {'loss': 0.4907, 'learning_rate': 1.7241772161851227e-05, 'epoch': 0.53} {'loss': 0.5134, 'learning_rate': 1.7241540462896598e-05, 'epoch': 0.53} {'loss': 0.724, 'learning_rate': 1.7241308755767647e-05, 'epoch': 0.53} {'loss': 0.6279, 'learning_rate': 1.7241077040464635e-05, 'epoch': 0.53} {'loss': 0.4905, 'learning_rate': 1.7240845316987822e-05, 'epoch': 0.53} {'loss': 0.6523, 'learning_rate': 1.7240613585337474e-05, 'epoch': 0.53} {'loss': 0.602, 'learning_rate': 1.7240381845513848e-05, 'epoch': 0.53} {'loss': 0.6754, 'learning_rate': 1.724015009751721e-05, 'epoch': 0.53} {'loss': 0.5504, 'learning_rate': 1.7239918341347817e-05, 'epoch': 0.53} {'loss': 0.6443, 'learning_rate': 1.7239686577005934e-05, 'epoch': 0.53} {'loss': 0.6272, 'learning_rate': 1.7239454804491823e-05, 'epoch': 0.53} {'loss': 0.5314, 'learning_rate': 1.723922302380574e-05, 'epoch': 0.53} {'loss': 0.7005, 'learning_rate': 1.7238991234947957e-05, 'epoch': 0.53} {'loss': 0.46, 'learning_rate': 1.7238759437918723e-05, 'epoch': 0.53} {'loss': 0.6485, 'learning_rate': 1.7238527632718312e-05, 'epoch': 0.53} {'loss': 0.6436, 'learning_rate': 1.7238295819346978e-05, 'epoch': 0.53} {'loss': 0.574, 'learning_rate': 1.7238063997804984e-05, 'epoch': 0.53} {'loss': 0.5475, 'learning_rate': 1.723783216809259e-05, 'epoch': 0.53} {'loss': 0.5702, 'learning_rate': 1.723760033021006e-05, 'epoch': 0.53} {'loss': 0.6416, 'learning_rate': 1.723736848415766e-05, 'epoch': 0.53} {'loss': 0.5855, 'learning_rate': 1.723713662993564e-05, 'epoch': 0.53} {'loss': 0.5404, 'learning_rate': 1.7236904767544277e-05, 'epoch': 0.53} {'loss': 0.6316, 'learning_rate': 1.723667289698382e-05, 'epoch': 0.53} {'loss': 0.5907, 'learning_rate': 1.7236441018254538e-05, 'epoch': 0.53} {'loss': 0.6498, 'learning_rate': 1.7236209131356684e-05, 'epoch': 0.53} {'loss': 0.5286, 'learning_rate': 1.723597723629053e-05, 'epoch': 0.53} {'loss': 0.5887, 'learning_rate': 1.7235745333056338e-05, 'epoch': 0.53} {'loss': 0.6064, 'learning_rate': 1.723551342165436e-05, 'epoch': 0.53} {'loss': 0.5952, 'learning_rate': 1.7235281502084863e-05, 'epoch': 0.53} {'loss': 0.7072, 'learning_rate': 1.7235049574348113e-05, 'epoch': 0.53} {'loss': 0.532, 'learning_rate': 1.7234817638444365e-05, 'epoch': 0.53} {'loss': 0.665, 'learning_rate': 1.7234585694373885e-05, 'epoch': 0.53} {'loss': 0.515, 'learning_rate': 1.7234353742136933e-05, 'epoch': 0.53} {'loss': 0.5321, 'learning_rate': 1.723412178173377e-05, 'epoch': 0.53} {'loss': 0.665, 'learning_rate': 1.7233889813164658e-05, 'epoch': 0.53} {'loss': 0.5842, 'learning_rate': 1.7233657836429863e-05, 'epoch': 0.53} {'loss': 0.6158, 'learning_rate': 1.7233425851529647e-05, 'epoch': 0.53} {'loss': 0.5819, 'learning_rate': 1.723319385846426e-05, 'epoch': 0.53} {'loss': 0.5939, 'learning_rate': 1.723296185723398e-05, 'epoch': 0.53} {'loss': 0.672, 'learning_rate': 1.723272984783906e-05, 'epoch': 0.53} {'loss': 0.5966, 'learning_rate': 1.723249783027976e-05, 'epoch': 0.53} {'loss': 0.4976, 'learning_rate': 1.7232265804556348e-05, 'epoch': 0.53} {'loss': 0.6169, 'learning_rate': 1.7232033770669082e-05, 'epoch': 0.53} {'loss': 0.5737, 'learning_rate': 1.723180172861823e-05, 'epoch': 0.53} {'loss': 0.5774, 'learning_rate': 1.723156967840404e-05, 'epoch': 0.53} {'loss': 0.5686, 'learning_rate': 1.723133762002679e-05, 'epoch': 0.53} {'loss': 0.587, 'learning_rate': 1.7231105553486732e-05, 'epoch': 0.53} {'loss': 0.5164, 'learning_rate': 1.723087347878413e-05, 'epoch': 0.53} {'loss': 0.5656, 'learning_rate': 1.723064139591925e-05, 'epoch': 0.53} {'loss': 0.6803, 'learning_rate': 1.7230409304892347e-05, 'epoch': 0.53} {'loss': 0.4242, 'learning_rate': 1.723017720570369e-05, 'epoch': 0.53} {'loss': 0.7174, 'learning_rate': 1.7229945098353538e-05, 'epoch': 0.53} {'loss': 0.5322, 'learning_rate': 1.722971298284215e-05, 'epoch': 0.53} {'loss': 0.7182, 'learning_rate': 1.7229480859169795e-05, 'epoch': 0.53} {'loss': 0.6702, 'learning_rate': 1.7229248727336728e-05, 'epoch': 0.53} {'loss': 0.4341, 'learning_rate': 1.722901658734321e-05, 'epoch': 0.53} {'loss': 0.6374, 'learning_rate': 1.7228784439189514e-05, 'epoch': 0.53} {'loss': 0.6129, 'learning_rate': 1.722855228287589e-05, 'epoch': 0.53} {'loss': 0.5367, 'learning_rate': 1.722832011840261e-05, 'epoch': 0.53} {'loss': 0.5136, 'learning_rate': 1.7228087945769928e-05, 'epoch': 0.53} {'loss': 0.6338, 'learning_rate': 1.722785576497811e-05, 'epoch': 0.53} {'loss': 0.5934, 'learning_rate': 1.7227623576027416e-05, 'epoch': 0.53} {'loss': 0.6322, 'learning_rate': 1.722739137891811e-05, 'epoch': 0.53} {'loss': 0.6964, 'learning_rate': 1.7227159173650453e-05, 'epoch': 0.53} {'loss': 0.6025, 'learning_rate': 1.722692696022471e-05, 'epoch': 0.53} {'loss': 0.5254, 'learning_rate': 1.722669473864114e-05, 'epoch': 0.53} {'loss': 0.4256, 'learning_rate': 1.7226462508900005e-05, 'epoch': 0.53} {'loss': 0.4052, 'learning_rate': 1.7226230271001568e-05, 'epoch': 0.53} {'loss': 0.6197, 'learning_rate': 1.7225998024946088e-05, 'epoch': 0.53} {'loss': 0.6788, 'learning_rate': 1.7225765770733837e-05, 'epoch': 0.53} {'loss': 0.5662, 'learning_rate': 1.7225533508365065e-05, 'epoch': 0.53} {'loss': 0.6392, 'learning_rate': 1.722530123784004e-05, 'epoch': 0.53} {'loss': 0.6307, 'learning_rate': 1.7225068959159026e-05, 'epoch': 0.53} {'loss': 0.6321, 'learning_rate': 1.722483667232228e-05, 'epoch': 0.53} {'loss': 0.6268, 'learning_rate': 1.7224604377330073e-05, 'epoch': 0.53} {'loss': 0.6365, 'learning_rate': 1.722437207418266e-05, 'epoch': 0.53} {'loss': 0.5305, 'learning_rate': 1.7224139762880302e-05, 'epoch': 0.53} {'loss': 0.6838, 'learning_rate': 1.7223907443423264e-05, 'epoch': 0.53} {'loss': 0.6636, 'learning_rate': 1.722367511581181e-05, 'epoch': 0.53} {'loss': 0.7256, 'learning_rate': 1.7223442780046197e-05, 'epoch': 0.53} {'loss': 0.6329, 'learning_rate': 1.7223210436126692e-05, 'epoch': 0.53} {'loss': 0.6955, 'learning_rate': 1.722297808405356e-05, 'epoch': 0.53} {'loss': 0.572, 'learning_rate': 1.7222745723827055e-05, 'epoch': 0.53} {'loss': 0.6979, 'learning_rate': 1.7222513355447444e-05, 'epoch': 0.53} {'loss': 0.6006, 'learning_rate': 1.7222280978914993e-05, 'epoch': 0.53} {'loss': 0.5849, 'learning_rate': 1.7222048594229957e-05, 'epoch': 0.53} {'loss': 0.5891, 'learning_rate': 1.7221816201392602e-05, 'epoch': 0.53} {'loss': 0.5833, 'learning_rate': 1.722158380040319e-05, 'epoch': 0.53} {'loss': 0.5804, 'learning_rate': 1.722135139126198e-05, 'epoch': 0.53} {'loss': 0.5177, 'learning_rate': 1.722111897396924e-05, 'epoch': 0.53} {'loss': 0.7789, 'learning_rate': 1.722088654852523e-05, 'epoch': 0.53} {'loss': 0.4935, 'learning_rate': 1.7220654114930208e-05, 'epoch': 0.53} {'loss': 0.413, 'learning_rate': 1.7220421673184445e-05, 'epoch': 0.53} {'loss': 0.699, 'learning_rate': 1.72201892232882e-05, 'epoch': 0.53} {'loss': 0.6692, 'learning_rate': 1.7219956765241736e-05, 'epoch': 0.53} {'loss': 0.6772, 'learning_rate': 1.7219724299045307e-05, 'epoch': 0.53} {'loss': 0.7249, 'learning_rate': 1.7219491824699184e-05, 'epoch': 0.53} {'loss': 0.6166, 'learning_rate': 1.7219259342203632e-05, 'epoch': 0.53} {'loss': 0.7083, 'learning_rate': 1.7219026851558905e-05, 'epoch': 0.53} {'loss': 0.4558, 'learning_rate': 1.721879435276527e-05, 'epoch': 0.53} {'loss': 0.5716, 'learning_rate': 1.7218561845822993e-05, 'epoch': 0.53} {'loss': 0.735, 'learning_rate': 1.7218329330732325e-05, 'epoch': 0.53} {'loss': 0.5498, 'learning_rate': 1.721809680749354e-05, 'epoch': 0.53} {'loss': 0.6191, 'learning_rate': 1.7217864276106898e-05, 'epoch': 0.53} {'loss': 0.7445, 'learning_rate': 1.721763173657266e-05, 'epoch': 0.53} {'loss': 0.6344, 'learning_rate': 1.7217399188891084e-05, 'epoch': 0.53} {'loss': 0.464, 'learning_rate': 1.7217166633062435e-05, 'epoch': 0.53} {'loss': 0.6708, 'learning_rate': 1.7216934069086983e-05, 'epoch': 0.53} {'loss': 0.6043, 'learning_rate': 1.7216701496964984e-05, 'epoch': 0.53} {'loss': 0.5158, 'learning_rate': 1.72164689166967e-05, 'epoch': 0.53} {'loss': 0.7917, 'learning_rate': 1.7216236328282396e-05, 'epoch': 0.53} {'loss': 0.6054, 'learning_rate': 1.721600373172233e-05, 'epoch': 0.53} {'loss': 0.7998, 'learning_rate': 1.7215771127016774e-05, 'epoch': 0.53} {'loss': 0.5977, 'learning_rate': 1.721553851416598e-05, 'epoch': 0.53} {'loss': 0.4685, 'learning_rate': 1.7215305893170217e-05, 'epoch': 0.53} {'loss': 0.5496, 'learning_rate': 1.721507326402974e-05, 'epoch': 0.53} {'loss': 0.5427, 'learning_rate': 1.7214840626744824e-05, 'epoch': 0.53} {'loss': 0.6748, 'learning_rate': 1.7214607981315725e-05, 'epoch': 0.53} {'loss': 0.7675, 'learning_rate': 1.7214375327742703e-05, 'epoch': 0.53} {'loss': 0.5396, 'learning_rate': 1.7214142666026025e-05, 'epoch': 0.53} {'loss': 0.6789, 'learning_rate': 1.7213909996165948e-05, 'epoch': 0.53} {'loss': 0.6381, 'learning_rate': 1.721367731816274e-05, 'epoch': 0.53} {'loss': 0.3405, 'learning_rate': 1.7213444632016663e-05, 'epoch': 0.53} {'loss': 0.4672, 'learning_rate': 1.721321193772798e-05, 'epoch': 0.53} {'loss': 0.484, 'learning_rate': 1.721297923529695e-05, 'epoch': 0.53} {'loss': 0.4691, 'learning_rate': 1.721274652472384e-05, 'epoch': 0.53} {'loss': 0.5958, 'learning_rate': 1.721251380600891e-05, 'epoch': 0.53} {'loss': 0.7276, 'learning_rate': 1.7212281079152423e-05, 'epoch': 0.53} {'loss': 0.5208, 'learning_rate': 1.721204834415464e-05, 'epoch': 0.53} {'loss': 0.4286, 'learning_rate': 1.721181560101583e-05, 'epoch': 0.53} {'loss': 0.6164, 'learning_rate': 1.721158284973625e-05, 'epoch': 0.53} {'loss': 0.5058, 'learning_rate': 1.7211350090316164e-05, 'epoch': 0.53} {'loss': 0.5666, 'learning_rate': 1.7211117322755835e-05, 'epoch': 0.53} {'loss': 0.4907, 'learning_rate': 1.7210884547055525e-05, 'epoch': 0.53} {'loss': 0.5528, 'learning_rate': 1.7210651763215497e-05, 'epoch': 0.53} {'loss': 0.5743, 'learning_rate': 1.7210418971236017e-05, 'epoch': 0.53} {'loss': 0.4341, 'learning_rate': 1.7210186171117347e-05, 'epoch': 0.53} {'loss': 0.4235, 'learning_rate': 1.7209953362859744e-05, 'epoch': 0.53} {'loss': 0.6919, 'learning_rate': 1.7209720546463472e-05, 'epoch': 0.53} {'loss': 0.6972, 'learning_rate': 1.7209487721928803e-05, 'epoch': 0.53} {'loss': 0.7704, 'learning_rate': 1.720925488925599e-05, 'epoch': 0.53} {'loss': 0.6313, 'learning_rate': 1.72090220484453e-05, 'epoch': 0.53} {'loss': 0.451, 'learning_rate': 1.7208789199496995e-05, 'epoch': 0.53} {'loss': 0.6279, 'learning_rate': 1.7208556342411337e-05, 'epoch': 0.53} {'loss': 0.4653, 'learning_rate': 1.720832347718859e-05, 'epoch': 0.53} {'loss': 0.5235, 'learning_rate': 1.7208090603829014e-05, 'epoch': 0.53} {'loss': 0.5723, 'learning_rate': 1.7207857722332876e-05, 'epoch': 0.53} {'loss': 0.5219, 'learning_rate': 1.7207624832700442e-05, 'epoch': 0.53} {'loss': 0.5306, 'learning_rate': 1.7207391934931964e-05, 'epoch': 0.53} {'loss': 0.6148, 'learning_rate': 1.7207159029027712e-05, 'epoch': 0.53} {'loss': 0.4204, 'learning_rate': 1.720692611498795e-05, 'epoch': 0.53} {'loss': 0.4036, 'learning_rate': 1.720669319281294e-05, 'epoch': 0.53} {'loss': 0.6704, 'learning_rate': 1.720646026250294e-05, 'epoch': 0.53} {'loss': 0.5662, 'learning_rate': 1.720622732405822e-05, 'epoch': 0.53} {'loss': 0.4706, 'learning_rate': 1.7205994377479038e-05, 'epoch': 0.53} {'loss': 0.5759, 'learning_rate': 1.7205761422765657e-05, 'epoch': 0.53} {'loss': 0.6073, 'learning_rate': 1.7205528459918345e-05, 'epoch': 0.53} {'loss': 0.4953, 'learning_rate': 1.720529548893736e-05, 'epoch': 0.53} {'loss': 0.5613, 'learning_rate': 1.7205062509822966e-05, 'epoch': 0.53} {'loss': 0.5599, 'learning_rate': 1.720482952257543e-05, 'epoch': 0.53} {'loss': 0.6807, 'learning_rate': 1.7204596527195008e-05, 'epoch': 0.53} {'loss': 0.5933, 'learning_rate': 1.7204363523681965e-05, 'epoch': 0.53} {'loss': 0.6839, 'learning_rate': 1.720413051203657e-05, 'epoch': 0.53} {'loss': 0.777, 'learning_rate': 1.7203897492259077e-05, 'epoch': 0.53} {'loss': 0.6866, 'learning_rate': 1.7203664464349758e-05, 'epoch': 0.53} {'loss': 0.5855, 'learning_rate': 1.720343142830887e-05, 'epoch': 0.53} {'loss': 0.7577, 'learning_rate': 1.7203198384136678e-05, 'epoch': 0.53} {'loss': 0.5878, 'learning_rate': 1.720296533183344e-05, 'epoch': 0.54} {'loss': 0.6183, 'learning_rate': 1.720273227139943e-05, 'epoch': 0.54} {'loss': 0.6547, 'learning_rate': 1.7202499202834905e-05, 'epoch': 0.54} {'loss': 0.6513, 'learning_rate': 1.7202266126140123e-05, 'epoch': 0.54} {'loss': 0.5459, 'learning_rate': 1.7202033041315356e-05, 'epoch': 0.54} {'loss': 0.589, 'learning_rate': 1.7201799948360862e-05, 'epoch': 0.54} {'loss': 0.6088, 'learning_rate': 1.7201566847276905e-05, 'epoch': 0.54} {'loss': 0.5699, 'learning_rate': 1.720133373806375e-05, 'epoch': 0.54} {'loss': 0.4636, 'learning_rate': 1.7201100620721658e-05, 'epoch': 0.54} {'loss': 0.6197, 'learning_rate': 1.720086749525089e-05, 'epoch': 0.54} {'loss': 0.7217, 'learning_rate': 1.7200634361651717e-05, 'epoch': 0.54} {'loss': 0.5827, 'learning_rate': 1.7200401219924395e-05, 'epoch': 0.54} {'loss': 0.622, 'learning_rate': 1.720016807006919e-05, 'epoch': 0.54} {'loss': 0.6086, 'learning_rate': 1.719993491208636e-05, 'epoch': 0.54} {'loss': 0.7601, 'learning_rate': 1.7199701745976177e-05, 'epoch': 0.54} {'loss': 0.5504, 'learning_rate': 1.7199468571738897e-05, 'epoch': 0.54} {'loss': 0.5104, 'learning_rate': 1.719923538937479e-05, 'epoch': 0.54} {'loss': 0.5977, 'learning_rate': 1.7199002198884113e-05, 'epoch': 0.54} {'loss': 0.5237, 'learning_rate': 1.719876900026713e-05, 'epoch': 0.54} {'loss': 0.5532, 'learning_rate': 1.7198535793524108e-05, 'epoch': 0.54} {'loss': 0.4997, 'learning_rate': 1.7198302578655304e-05, 'epoch': 0.54} {'loss': 0.6619, 'learning_rate': 1.719806935566099e-05, 'epoch': 0.54} {'loss': 0.5329, 'learning_rate': 1.7197836124541424e-05, 'epoch': 0.54} {'loss': 0.581, 'learning_rate': 1.7197602885296866e-05, 'epoch': 0.54} {'loss': 0.5921, 'learning_rate': 1.7197369637927585e-05, 'epoch': 0.54} {'loss': 0.5735, 'learning_rate': 1.7197136382433844e-05, 'epoch': 0.54} {'loss': 0.5897, 'learning_rate': 1.7196903118815903e-05, 'epoch': 0.54} {'loss': 0.6645, 'learning_rate': 1.7196669847074024e-05, 'epoch': 0.54} {'loss': 0.4875, 'learning_rate': 1.719643656720848e-05, 'epoch': 0.54} {'loss': 0.5702, 'learning_rate': 1.7196203279219523e-05, 'epoch': 0.54} {'loss': 0.531, 'learning_rate': 1.7195969983107423e-05, 'epoch': 0.54} {'loss': 0.4854, 'learning_rate': 1.719573667887244e-05, 'epoch': 0.54} {'loss': 0.5249, 'learning_rate': 1.7195503366514836e-05, 'epoch': 0.54} {'loss': 0.6193, 'learning_rate': 1.719527004603488e-05, 'epoch': 0.54} {'loss': 0.6509, 'learning_rate': 1.7195036717432833e-05, 'epoch': 0.54} {'loss': 0.7165, 'learning_rate': 1.7194803380708958e-05, 'epoch': 0.54} {'loss': 0.5487, 'learning_rate': 1.7194570035863515e-05, 'epoch': 0.54} {'loss': 0.6964, 'learning_rate': 1.7194336682896774e-05, 'epoch': 0.54} {'loss': 0.5398, 'learning_rate': 1.7194103321808996e-05, 'epoch': 0.54} {'loss': 0.5112, 'learning_rate': 1.719386995260044e-05, 'epoch': 0.54} {'loss': 0.5722, 'learning_rate': 1.7193636575271373e-05, 'epoch': 0.54} {'loss': 0.6143, 'learning_rate': 1.719340318982206e-05, 'epoch': 0.54} {'loss': 0.5331, 'learning_rate': 1.719316979625276e-05, 'epoch': 0.54} {'loss': 0.6617, 'learning_rate': 1.719293639456374e-05, 'epoch': 0.54} {'loss': 0.5993, 'learning_rate': 1.7192702984755264e-05, 'epoch': 0.54} {'loss': 0.6396, 'learning_rate': 1.7192469566827594e-05, 'epoch': 0.54} {'loss': 0.6871, 'learning_rate': 1.7192236140780992e-05, 'epoch': 0.54} {'loss': 0.6078, 'learning_rate': 1.7192002706615728e-05, 'epoch': 0.54} {'loss': 0.5816, 'learning_rate': 1.7191769264332053e-05, 'epoch': 0.54} {'loss': 0.7217, 'learning_rate': 1.7191535813930244e-05, 'epoch': 0.54} {'loss': 0.638, 'learning_rate': 1.7191302355410554e-05, 'epoch': 0.54} {'loss': 0.6279, 'learning_rate': 1.719106888877326e-05, 'epoch': 0.54} {'loss': 0.7614, 'learning_rate': 1.7190835414018606e-05, 'epoch': 0.54} {'loss': 0.607, 'learning_rate': 1.719060193114687e-05, 'epoch': 0.54} {'loss': 0.5562, 'learning_rate': 1.7190368440158313e-05, 'epoch': 0.54} {'loss': 0.4701, 'learning_rate': 1.7190134941053197e-05, 'epoch': 0.54} {'loss': 0.5679, 'learning_rate': 1.7189901433831785e-05, 'epoch': 0.54} {'loss': 0.6445, 'learning_rate': 1.718966791849434e-05, 'epoch': 0.54} {'loss': 0.6095, 'learning_rate': 1.718943439504113e-05, 'epoch': 0.54} {'loss': 0.474, 'learning_rate': 1.7189200863472415e-05, 'epoch': 0.54} {'loss': 0.4698, 'learning_rate': 1.718896732378846e-05, 'epoch': 0.54} {'loss': 0.6312, 'learning_rate': 1.7188733775989526e-05, 'epoch': 0.54} {'loss': 0.5413, 'learning_rate': 1.718850022007588e-05, 'epoch': 0.54} {'loss': 0.5314, 'learning_rate': 1.7188266656047783e-05, 'epoch': 0.54} {'loss': 0.4567, 'learning_rate': 1.71880330839055e-05, 'epoch': 0.54} {'loss': 0.5678, 'learning_rate': 1.7187799503649296e-05, 'epoch': 0.54} {'loss': 0.7678, 'learning_rate': 1.718756591527943e-05, 'epoch': 0.54} {'loss': 0.6717, 'learning_rate': 1.7187332318796172e-05, 'epoch': 0.54} {'loss': 0.4889, 'learning_rate': 1.7187098714199785e-05, 'epoch': 0.54} {'loss': 0.5208, 'learning_rate': 1.7186865101490523e-05, 'epoch': 0.54} {'loss': 0.5716, 'learning_rate': 1.7186631480668664e-05, 'epoch': 0.54} {'loss': 0.6534, 'learning_rate': 1.7186397851734458e-05, 'epoch': 0.54} {'loss': 0.6976, 'learning_rate': 1.718616421468818e-05, 'epoch': 0.54} {'loss': 0.7053, 'learning_rate': 1.718593056953009e-05, 'epoch': 0.54} {'loss': 0.7187, 'learning_rate': 1.718569691626045e-05, 'epoch': 0.54} {'loss': 0.5154, 'learning_rate': 1.718546325487952e-05, 'epoch': 0.54} {'loss': 0.6666, 'learning_rate': 1.7185229585387575e-05, 'epoch': 0.54} {'loss': 0.5199, 'learning_rate': 1.7184995907784866e-05, 'epoch': 0.54} {'loss': 0.5447, 'learning_rate': 1.718476222207167e-05, 'epoch': 0.54} {'loss': 0.5667, 'learning_rate': 1.718452852824824e-05, 'epoch': 0.54} {'loss': 0.6595, 'learning_rate': 1.718429482631484e-05, 'epoch': 0.54} {'loss': 0.5483, 'learning_rate': 1.7184061116271742e-05, 'epoch': 0.54} {'loss': 0.5506, 'learning_rate': 1.7183827398119204e-05, 'epoch': 0.54} {'loss': 0.6473, 'learning_rate': 1.718359367185749e-05, 'epoch': 0.54} {'loss': 0.5375, 'learning_rate': 1.7183359937486864e-05, 'epoch': 0.54} {'loss': 0.471, 'learning_rate': 1.7183126195007594e-05, 'epoch': 0.54} {'loss': 0.6333, 'learning_rate': 1.7182892444419938e-05, 'epoch': 0.54} {'loss': 0.6103, 'learning_rate': 1.718265868572416e-05, 'epoch': 0.54} {'loss': 0.635, 'learning_rate': 1.718242491892053e-05, 'epoch': 0.54} {'loss': 0.6805, 'learning_rate': 1.7182191144009304e-05, 'epoch': 0.54} {'loss': 0.4641, 'learning_rate': 1.7181957360990756e-05, 'epoch': 0.54} {'loss': 0.6515, 'learning_rate': 1.718172356986514e-05, 'epoch': 0.54} {'loss': 0.6963, 'learning_rate': 1.7181489770632728e-05, 'epoch': 0.54} {'loss': 0.5439, 'learning_rate': 1.7181255963293774e-05, 'epoch': 0.54} {'loss': 0.5871, 'learning_rate': 1.718102214784855e-05, 'epoch': 0.54} {'loss': 0.4939, 'learning_rate': 1.7180788324297318e-05, 'epoch': 0.54} {'loss': 0.6628, 'learning_rate': 1.718055449264034e-05, 'epoch': 0.54} {'loss': 0.5388, 'learning_rate': 1.718032065287788e-05, 'epoch': 0.54} {'loss': 0.5446, 'learning_rate': 1.7180086805010206e-05, 'epoch': 0.54} {'loss': 0.6431, 'learning_rate': 1.717985294903758e-05, 'epoch': 0.54} {'loss': 0.5787, 'learning_rate': 1.7179619084960263e-05, 'epoch': 0.54} {'loss': 0.5243, 'learning_rate': 1.7179385212778524e-05, 'epoch': 0.54} {'loss': 0.7166, 'learning_rate': 1.717915133249262e-05, 'epoch': 0.54} {'loss': 0.5629, 'learning_rate': 1.7178917444102822e-05, 'epoch': 0.54} {'loss': 0.6479, 'learning_rate': 1.7178683547609395e-05, 'epoch': 0.54} {'loss': 0.6095, 'learning_rate': 1.7178449643012596e-05, 'epoch': 0.54} {'loss': 0.5641, 'learning_rate': 1.717821573031269e-05, 'epoch': 0.54} {'loss': 0.5422, 'learning_rate': 1.717798180950995e-05, 'epoch': 0.54} {'loss': 0.4314, 'learning_rate': 1.7177747880604626e-05, 'epoch': 0.54} {'loss': 0.6339, 'learning_rate': 1.7177513943596992e-05, 'epoch': 0.54} {'loss': 0.7046, 'learning_rate': 1.7177279998487312e-05, 'epoch': 0.54} {'loss': 0.5921, 'learning_rate': 1.7177046045275843e-05, 'epoch': 0.54} {'loss': 0.6873, 'learning_rate': 1.717681208396286e-05, 'epoch': 0.54} {'loss': 0.5687, 'learning_rate': 1.7176578114548616e-05, 'epoch': 0.54} {'loss': 0.4132, 'learning_rate': 1.7176344137033384e-05, 'epoch': 0.54} {'loss': 0.4763, 'learning_rate': 1.717611015141742e-05, 'epoch': 0.54} {'loss': 0.5694, 'learning_rate': 1.7175876157700994e-05, 'epoch': 0.54} {'loss': 0.4345, 'learning_rate': 1.717564215588437e-05, 'epoch': 0.54} {'loss': 0.4609, 'learning_rate': 1.717540814596781e-05, 'epoch': 0.54} {'loss': 0.7224, 'learning_rate': 1.7175174127951577e-05, 'epoch': 0.54} {'loss': 0.5567, 'learning_rate': 1.717494010183594e-05, 'epoch': 0.54} {'loss': 0.4094, 'learning_rate': 1.7174706067621154e-05, 'epoch': 0.54} {'loss': 0.5881, 'learning_rate': 1.7174472025307494e-05, 'epoch': 0.54} {'loss': 0.6199, 'learning_rate': 1.7174237974895217e-05, 'epoch': 0.54} {'loss': 0.6232, 'learning_rate': 1.7174003916384593e-05, 'epoch': 0.54} {'loss': 0.6508, 'learning_rate': 1.7173769849775877e-05, 'epoch': 0.54} {'loss': 0.6748, 'learning_rate': 1.7173535775069346e-05, 'epoch': 0.54} {'loss': 0.6061, 'learning_rate': 1.717330169226525e-05, 'epoch': 0.54} {'loss': 0.553, 'learning_rate': 1.7173067601363868e-05, 'epoch': 0.54} {'loss': 0.8034, 'learning_rate': 1.717283350236545e-05, 'epoch': 0.54} {'loss': 0.6345, 'learning_rate': 1.7172599395270272e-05, 'epoch': 0.54} {'loss': 0.4163, 'learning_rate': 1.717236528007859e-05, 'epoch': 0.54} {'loss': 0.4509, 'learning_rate': 1.717213115679067e-05, 'epoch': 0.54} {'loss': 0.5937, 'learning_rate': 1.717189702540678e-05, 'epoch': 0.54} {'loss': 0.6478, 'learning_rate': 1.7171662885927185e-05, 'epoch': 0.54} {'loss': 0.7374, 'learning_rate': 1.717142873835214e-05, 'epoch': 0.54} {'loss': 0.537, 'learning_rate': 1.7171194582681923e-05, 'epoch': 0.54} {'loss': 0.5724, 'learning_rate': 1.7170960418916786e-05, 'epoch': 0.54} {'loss': 0.6195, 'learning_rate': 1.7170726247057003e-05, 'epoch': 0.54} {'loss': 0.5731, 'learning_rate': 1.7170492067102827e-05, 'epoch': 0.54} {'loss': 0.4381, 'learning_rate': 1.7170257879054533e-05, 'epoch': 0.54} {'loss': 0.5501, 'learning_rate': 1.717002368291238e-05, 'epoch': 0.54} {'loss': 0.62, 'learning_rate': 1.7169789478676634e-05, 'epoch': 0.54} {'loss': 0.7128, 'learning_rate': 1.7169555266347558e-05, 'epoch': 0.54} {'loss': 0.518, 'learning_rate': 1.716932104592542e-05, 'epoch': 0.54} {'loss': 0.5621, 'learning_rate': 1.716908681741048e-05, 'epoch': 0.54} {'loss': 0.5139, 'learning_rate': 1.7168852580803007e-05, 'epoch': 0.54} {'loss': 0.6165, 'learning_rate': 1.716861833610326e-05, 'epoch': 0.54} {'loss': 0.6146, 'learning_rate': 1.7168384083311507e-05, 'epoch': 0.54} {'loss': 0.4562, 'learning_rate': 1.7168149822428012e-05, 'epoch': 0.54} {'loss': 0.6037, 'learning_rate': 1.716791555345304e-05, 'epoch': 0.54} {'loss': 0.7159, 'learning_rate': 1.716768127638685e-05, 'epoch': 0.54} {'loss': 0.6584, 'learning_rate': 1.7167446991229712e-05, 'epoch': 0.54} {'loss': 0.3604, 'learning_rate': 1.716721269798189e-05, 'epoch': 0.54} {'loss': 0.6731, 'learning_rate': 1.716697839664365e-05, 'epoch': 0.54} {'loss': 0.739, 'learning_rate': 1.716674408721525e-05, 'epoch': 0.54} {'loss': 0.6295, 'learning_rate': 1.7166509769696962e-05, 'epoch': 0.54} {'loss': 0.5538, 'learning_rate': 1.7166275444089047e-05, 'epoch': 0.54} {'loss': 0.6368, 'learning_rate': 1.7166041110391768e-05, 'epoch': 0.54} {'loss': 0.5903, 'learning_rate': 1.716580676860539e-05, 'epoch': 0.54} {'loss': 0.5937, 'learning_rate': 1.7165572418730186e-05, 'epoch': 0.54} {'loss': 0.598, 'learning_rate': 1.716533806076641e-05, 'epoch': 0.54} {'loss': 0.495, 'learning_rate': 1.7165103694714327e-05, 'epoch': 0.54} {'loss': 0.6062, 'learning_rate': 1.7164869320574206e-05, 'epoch': 0.54} {'loss': 0.5409, 'learning_rate': 1.7164634938346312e-05, 'epoch': 0.54} {'loss': 0.7339, 'learning_rate': 1.7164400548030904e-05, 'epoch': 0.54} {'loss': 0.3713, 'learning_rate': 1.7164166149628253e-05, 'epoch': 0.54} {'loss': 0.4766, 'learning_rate': 1.716393174313862e-05, 'epoch': 0.54} {'loss': 0.5736, 'learning_rate': 1.716369732856227e-05, 'epoch': 0.54} {'loss': 0.5234, 'learning_rate': 1.7163462905899466e-05, 'epoch': 0.54} {'loss': 0.6528, 'learning_rate': 1.7163228475150476e-05, 'epoch': 0.54} {'loss': 0.5675, 'learning_rate': 1.7162994036315567e-05, 'epoch': 0.54} {'loss': 0.5189, 'learning_rate': 1.7162759589394994e-05, 'epoch': 0.54} {'loss': 0.6336, 'learning_rate': 1.716252513438903e-05, 'epoch': 0.54} {'loss': 0.5702, 'learning_rate': 1.7162290671297937e-05, 'epoch': 0.54} {'loss': 0.6312, 'learning_rate': 1.7162056200121982e-05, 'epoch': 0.54} {'loss': 0.6323, 'learning_rate': 1.7161821720861423e-05, 'epoch': 0.54} {'loss': 0.5533, 'learning_rate': 1.716158723351653e-05, 'epoch': 0.54} {'loss': 0.4171, 'learning_rate': 1.716135273808757e-05, 'epoch': 0.54} {'loss': 0.532, 'learning_rate': 1.7161118234574804e-05, 'epoch': 0.54} {'loss': 0.5965, 'learning_rate': 1.7160883722978498e-05, 'epoch': 0.54} {'loss': 0.6577, 'learning_rate': 1.7160649203298912e-05, 'epoch': 0.54} {'loss': 0.5752, 'learning_rate': 1.7160414675536315e-05, 'epoch': 0.54} {'loss': 0.5978, 'learning_rate': 1.7160180139690974e-05, 'epoch': 0.54} {'loss': 0.497, 'learning_rate': 1.715994559576315e-05, 'epoch': 0.54} {'loss': 0.5604, 'learning_rate': 1.7159711043753112e-05, 'epoch': 0.54} {'loss': 0.6318, 'learning_rate': 1.715947648366112e-05, 'epoch': 0.54} {'loss': 0.6769, 'learning_rate': 1.715924191548744e-05, 'epoch': 0.54} {'loss': 0.6001, 'learning_rate': 1.7159007339232334e-05, 'epoch': 0.54} {'loss': 0.6263, 'learning_rate': 1.7158772754896074e-05, 'epoch': 0.54} {'loss': 0.4475, 'learning_rate': 1.715853816247892e-05, 'epoch': 0.54} {'loss': 0.519, 'learning_rate': 1.715830356198114e-05, 'epoch': 0.54} {'loss': 0.6365, 'learning_rate': 1.7158068953402992e-05, 'epoch': 0.54} {'loss': 0.5193, 'learning_rate': 1.7157834336744748e-05, 'epoch': 0.54} {'loss': 0.4771, 'learning_rate': 1.715759971200667e-05, 'epoch': 0.54} {'loss': 0.562, 'learning_rate': 1.715736507918902e-05, 'epoch': 0.54} {'loss': 0.6085, 'learning_rate': 1.715713043829207e-05, 'epoch': 0.54} {'loss': 0.5604, 'learning_rate': 1.715689578931608e-05, 'epoch': 0.54} {'loss': 0.6488, 'learning_rate': 1.7156661132261313e-05, 'epoch': 0.54} {'loss': 0.6676, 'learning_rate': 1.7156426467128037e-05, 'epoch': 0.54} {'loss': 0.6564, 'learning_rate': 1.715619179391652e-05, 'epoch': 0.54} {'loss': 0.843, 'learning_rate': 1.715595711262702e-05, 'epoch': 0.54} {'loss': 0.4995, 'learning_rate': 1.7155722423259805e-05, 'epoch': 0.54} {'loss': 0.6052, 'learning_rate': 1.715548772581514e-05, 'epoch': 0.54} {'loss': 0.6151, 'learning_rate': 1.7155253020293293e-05, 'epoch': 0.54} {'loss': 0.5815, 'learning_rate': 1.7155018306694523e-05, 'epoch': 0.54} {'loss': 0.4308, 'learning_rate': 1.7154783585019098e-05, 'epoch': 0.54} {'loss': 0.568, 'learning_rate': 1.7154548855267284e-05, 'epoch': 0.54} {'loss': 0.6552, 'learning_rate': 1.7154314117439347e-05, 'epoch': 0.54} {'loss': 0.5881, 'learning_rate': 1.7154079371535547e-05, 'epoch': 0.54} {'loss': 0.6577, 'learning_rate': 1.7153844617556152e-05, 'epoch': 0.54} {'loss': 0.5204, 'learning_rate': 1.7153609855501426e-05, 'epoch': 0.54} {'loss': 0.737, 'learning_rate': 1.7153375085371637e-05, 'epoch': 0.54} {'loss': 0.603, 'learning_rate': 1.7153140307167045e-05, 'epoch': 0.54} {'loss': 0.6595, 'learning_rate': 1.7152905520887922e-05, 'epoch': 0.54} {'loss': 0.5455, 'learning_rate': 1.7152670726534525e-05, 'epoch': 0.54} {'loss': 0.5735, 'learning_rate': 1.7152435924107126e-05, 'epoch': 0.54} {'loss': 0.6849, 'learning_rate': 1.7152201113605988e-05, 'epoch': 0.54} {'loss': 0.6217, 'learning_rate': 1.715196629503137e-05, 'epoch': 0.54} {'loss': 0.5899, 'learning_rate': 1.7151731468383547e-05, 'epoch': 0.54} {'loss': 0.6016, 'learning_rate': 1.7151496633662775e-05, 'epoch': 0.54} {'loss': 0.5743, 'learning_rate': 1.7151261790869323e-05, 'epoch': 0.54} {'loss': 0.5273, 'learning_rate': 1.7151026940003456e-05, 'epoch': 0.54} {'loss': 0.606, 'learning_rate': 1.7150792081065444e-05, 'epoch': 0.54} {'loss': 0.6504, 'learning_rate': 1.7150557214055546e-05, 'epoch': 0.54} {'loss': 0.6274, 'learning_rate': 1.7150322338974028e-05, 'epoch': 0.54} {'loss': 0.6856, 'learning_rate': 1.7150087455821153e-05, 'epoch': 0.54} {'loss': 0.6097, 'learning_rate': 1.7149852564597192e-05, 'epoch': 0.54} {'loss': 0.4043, 'learning_rate': 1.7149617665302404e-05, 'epoch': 0.54} {'loss': 0.6383, 'learning_rate': 1.7149382757937065e-05, 'epoch': 0.54} {'loss': 0.6466, 'learning_rate': 1.7149147842501423e-05, 'epoch': 0.54} {'loss': 0.7816, 'learning_rate': 1.7148912918995756e-05, 'epoch': 0.54} {'loss': 0.6163, 'learning_rate': 1.7148677987420328e-05, 'epoch': 0.54} {'loss': 0.6675, 'learning_rate': 1.71484430477754e-05, 'epoch': 0.54} {'loss': 0.5556, 'learning_rate': 1.714820810006124e-05, 'epoch': 0.54} {'loss': 0.6087, 'learning_rate': 1.7147973144278112e-05, 'epoch': 0.54} {'loss': 0.6986, 'learning_rate': 1.714773818042628e-05, 'epoch': 0.54} {'loss': 0.6368, 'learning_rate': 1.7147503208506013e-05, 'epoch': 0.54} {'loss': 0.5761, 'learning_rate': 1.7147268228517573e-05, 'epoch': 0.54} {'loss': 0.688, 'learning_rate': 1.7147033240461226e-05, 'epoch': 0.54} {'loss': 0.6541, 'learning_rate': 1.7146798244337236e-05, 'epoch': 0.54} {'loss': 0.5916, 'learning_rate': 1.7146563240145873e-05, 'epoch': 0.54} {'loss': 0.4696, 'learning_rate': 1.71463282278874e-05, 'epoch': 0.54} {'loss': 0.4997, 'learning_rate': 1.714609320756208e-05, 'epoch': 0.54} {'loss': 0.641, 'learning_rate': 1.7145858179170175e-05, 'epoch': 0.54} {'loss': 0.5419, 'learning_rate': 1.714562314271196e-05, 'epoch': 0.54} {'loss': 0.6896, 'learning_rate': 1.7145388098187694e-05, 'epoch': 0.54} {'loss': 0.5762, 'learning_rate': 1.714515304559764e-05, 'epoch': 0.54} {'loss': 0.6724, 'learning_rate': 1.7144917984942077e-05, 'epoch': 0.54} {'loss': 0.6672, 'learning_rate': 1.7144682916221254e-05, 'epoch': 0.54} {'loss': 0.724, 'learning_rate': 1.714444783943544e-05, 'epoch': 0.54} {'loss': 0.7418, 'learning_rate': 1.7144212754584905e-05, 'epoch': 0.54} {'loss': 0.6219, 'learning_rate': 1.714397766166991e-05, 'epoch': 0.54} {'loss': 0.6068, 'learning_rate': 1.714374256069073e-05, 'epoch': 0.54} {'loss': 0.6134, 'learning_rate': 1.7143507451647615e-05, 'epoch': 0.54} {'loss': 0.5726, 'learning_rate': 1.7143272334540845e-05, 'epoch': 0.54} {'loss': 0.5355, 'learning_rate': 1.7143037209370678e-05, 'epoch': 0.54} {'loss': 0.5173, 'learning_rate': 1.7142802076137376e-05, 'epoch': 0.54} {'loss': 0.5845, 'learning_rate': 1.7142566934841212e-05, 'epoch': 0.54} {'loss': 0.5487, 'learning_rate': 1.7142331785482446e-05, 'epoch': 0.54} {'loss': 0.6898, 'learning_rate': 1.7142096628061346e-05, 'epoch': 0.54} {'loss': 0.6077, 'learning_rate': 1.7141861462578177e-05, 'epoch': 0.54} {'loss': 0.5874, 'learning_rate': 1.7141626289033205e-05, 'epoch': 0.54} {'loss': 0.4745, 'learning_rate': 1.7141391107426695e-05, 'epoch': 0.54} {'loss': 0.645, 'learning_rate': 1.7141155917758912e-05, 'epoch': 0.54} {'loss': 0.7068, 'learning_rate': 1.7140920720030127e-05, 'epoch': 0.54} {'loss': 0.6756, 'learning_rate': 1.7140685514240596e-05, 'epoch': 0.54} {'loss': 0.498, 'learning_rate': 1.7140450300390588e-05, 'epoch': 0.54} {'loss': 0.5951, 'learning_rate': 1.7140215078480367e-05, 'epoch': 0.54} {'loss': 0.5521, 'learning_rate': 1.7139979848510208e-05, 'epoch': 0.54} {'loss': 0.5284, 'learning_rate': 1.7139744610480364e-05, 'epoch': 0.54} {'loss': 0.7414, 'learning_rate': 1.713950936439111e-05, 'epoch': 0.54} {'loss': 0.5526, 'learning_rate': 1.7139274110242703e-05, 'epoch': 0.54} {'loss': 0.5675, 'learning_rate': 1.7139038848035418e-05, 'epoch': 0.54} {'loss': 0.6118, 'learning_rate': 1.7138803577769512e-05, 'epoch': 0.54} {'loss': 0.633, 'learning_rate': 1.7138568299445254e-05, 'epoch': 0.54} {'loss': 0.6726, 'learning_rate': 1.713833301306291e-05, 'epoch': 0.54} {'loss': 0.458, 'learning_rate': 1.713809771862275e-05, 'epoch': 0.54} {'loss': 0.4906, 'learning_rate': 1.713786241612503e-05, 'epoch': 0.54} {'loss': 0.5344, 'learning_rate': 1.7137627105570023e-05, 'epoch': 0.54} {'loss': 0.466, 'learning_rate': 1.713739178695799e-05, 'epoch': 0.54} {'loss': 0.603, 'learning_rate': 1.7137156460289205e-05, 'epoch': 0.54} {'loss': 0.6378, 'learning_rate': 1.713692112556392e-05, 'epoch': 0.54} {'loss': 0.6112, 'learning_rate': 1.7136685782782412e-05, 'epoch': 0.54} {'loss': 0.5667, 'learning_rate': 1.7136450431944944e-05, 'epoch': 0.54} {'loss': 0.4493, 'learning_rate': 1.713621507305178e-05, 'epoch': 0.54} {'loss': 0.6004, 'learning_rate': 1.713597970610318e-05, 'epoch': 0.54} {'loss': 0.6221, 'learning_rate': 1.7135744331099422e-05, 'epoch': 0.54} {'loss': 0.5991, 'learning_rate': 1.7135508948040763e-05, 'epoch': 0.54} {'loss': 0.6166, 'learning_rate': 1.7135273556927474e-05, 'epoch': 0.54} {'loss': 0.6841, 'learning_rate': 1.7135038157759817e-05, 'epoch': 0.54} {'loss': 0.69, 'learning_rate': 1.713480275053806e-05, 'epoch': 0.54} {'loss': 0.6026, 'learning_rate': 1.7134567335262464e-05, 'epoch': 0.54} {'loss': 0.713, 'learning_rate': 1.71343319119333e-05, 'epoch': 0.54} {'loss': 0.6029, 'learning_rate': 1.7134096480550832e-05, 'epoch': 0.54} {'loss': 0.6877, 'learning_rate': 1.7133861041115327e-05, 'epoch': 0.54} {'loss': 0.7544, 'learning_rate': 1.713362559362705e-05, 'epoch': 0.54} {'loss': 0.4647, 'learning_rate': 1.7133390138086262e-05, 'epoch': 0.54} {'loss': 0.5002, 'learning_rate': 1.7133154674493235e-05, 'epoch': 0.54} {'loss': 0.5587, 'learning_rate': 1.7132919202848235e-05, 'epoch': 0.54} {'loss': 0.4682, 'learning_rate': 1.7132683723151522e-05, 'epoch': 0.54} {'loss': 0.5178, 'learning_rate': 1.7132448235403365e-05, 'epoch': 0.54} {'loss': 0.6429, 'learning_rate': 1.7132212739604034e-05, 'epoch': 0.54} {'loss': 0.753, 'learning_rate': 1.713197723575379e-05, 'epoch': 0.54} {'loss': 0.5148, 'learning_rate': 1.71317417238529e-05, 'epoch': 0.54} {'loss': 0.5754, 'learning_rate': 1.713150620390163e-05, 'epoch': 0.54} {'loss': 0.5999, 'learning_rate': 1.7131270675900245e-05, 'epoch': 0.54} {'loss': 0.6876, 'learning_rate': 1.7131035139849007e-05, 'epoch': 0.54} {'loss': 0.5936, 'learning_rate': 1.713079959574819e-05, 'epoch': 0.54} {'loss': 0.7675, 'learning_rate': 1.7130564043598063e-05, 'epoch': 0.54} {'loss': 0.5716, 'learning_rate': 1.7130328483398875e-05, 'epoch': 0.54} {'loss': 0.5806, 'learning_rate': 1.7130092915150905e-05, 'epoch': 0.54} {'loss': 0.5826, 'learning_rate': 1.712985733885442e-05, 'epoch': 0.54} {'loss': 0.5283, 'learning_rate': 1.712962175450968e-05, 'epoch': 0.54} {'loss': 0.6008, 'learning_rate': 1.712938616211695e-05, 'epoch': 0.54} {'loss': 0.7301, 'learning_rate': 1.71291505616765e-05, 'epoch': 0.54} {'loss': 0.5483, 'learning_rate': 1.7128914953188594e-05, 'epoch': 0.54} {'loss': 0.5995, 'learning_rate': 1.71286793366535e-05, 'epoch': 0.54} {'loss': 0.5447, 'learning_rate': 1.7128443712071482e-05, 'epoch': 0.54} {'loss': 0.5622, 'learning_rate': 1.712820807944281e-05, 'epoch': 0.54} {'loss': 0.4732, 'learning_rate': 1.712797243876774e-05, 'epoch': 0.54} {'loss': 0.554, 'learning_rate': 1.7127736790046546e-05, 'epoch': 0.54} {'loss': 0.5405, 'learning_rate': 1.7127501133279497e-05, 'epoch': 0.54} {'loss': 0.635, 'learning_rate': 1.7127265468466854e-05, 'epoch': 0.54} {'loss': 0.545, 'learning_rate': 1.712702979560888e-05, 'epoch': 0.54} {'loss': 0.5435, 'learning_rate': 1.7126794114705846e-05, 'epoch': 0.54} {'loss': 0.5657, 'learning_rate': 1.7126558425758016e-05, 'epoch': 0.54} {'loss': 0.7241, 'learning_rate': 1.712632272876566e-05, 'epoch': 0.54} {'loss': 0.5901, 'learning_rate': 1.7126087023729038e-05, 'epoch': 0.54} {'loss': 0.7886, 'learning_rate': 1.712585131064842e-05, 'epoch': 0.54} {'loss': 0.4319, 'learning_rate': 1.712561558952407e-05, 'epoch': 0.54} {'loss': 0.4041, 'learning_rate': 1.7125379860356253e-05, 'epoch': 0.54} {'loss': 0.5446, 'learning_rate': 1.712514412314524e-05, 'epoch': 0.54} {'loss': 0.5073, 'learning_rate': 1.7124908377891292e-05, 'epoch': 0.54} {'loss': 0.6394, 'learning_rate': 1.712467262459468e-05, 'epoch': 0.54} {'loss': 0.5748, 'learning_rate': 1.7124436863255668e-05, 'epoch': 0.54} {'loss': 0.7085, 'learning_rate': 1.712420109387452e-05, 'epoch': 0.54} {'loss': 0.64, 'learning_rate': 1.7123965316451504e-05, 'epoch': 0.54} {'loss': 0.3784, 'learning_rate': 1.7123729530986882e-05, 'epoch': 0.54} {'loss': 0.6896, 'learning_rate': 1.712349373748093e-05, 'epoch': 0.54} {'loss': 0.5707, 'learning_rate': 1.7123257935933905e-05, 'epoch': 0.54} {'loss': 0.7814, 'learning_rate': 1.7123022126346076e-05, 'epoch': 0.54} {'loss': 0.7266, 'learning_rate': 1.7122786308717712e-05, 'epoch': 0.54} {'loss': 0.5985, 'learning_rate': 1.7122550483049074e-05, 'epoch': 0.54} {'loss': 0.616, 'learning_rate': 1.7122314649340433e-05, 'epoch': 0.54} {'loss': 0.5415, 'learning_rate': 1.712207880759205e-05, 'epoch': 0.54} {'loss': 0.5544, 'learning_rate': 1.7121842957804197e-05, 'epoch': 0.54} {'loss': 0.5407, 'learning_rate': 1.712160709997714e-05, 'epoch': 0.54} {'loss': 0.4234, 'learning_rate': 1.7121371234111137e-05, 'epoch': 0.54} {'loss': 0.6498, 'learning_rate': 1.7121135360206463e-05, 'epoch': 0.54} {'loss': 0.5912, 'learning_rate': 1.7120899478263382e-05, 'epoch': 0.54} {'loss': 0.4191, 'learning_rate': 1.712066358828216e-05, 'epoch': 0.54} {'loss': 0.4427, 'learning_rate': 1.7120427690263063e-05, 'epoch': 0.54} {'loss': 0.6832, 'learning_rate': 1.7120191784206353e-05, 'epoch': 0.54} {'loss': 0.6459, 'learning_rate': 1.7119955870112304e-05, 'epoch': 0.54} {'loss': 0.6794, 'learning_rate': 1.711971994798118e-05, 'epoch': 0.54} {'loss': 0.65, 'learning_rate': 1.7119484017813242e-05, 'epoch': 0.54} {'loss': 0.4922, 'learning_rate': 1.7119248079608763e-05, 'epoch': 0.54} {'loss': 0.5146, 'learning_rate': 1.7119012133368003e-05, 'epoch': 0.54} {'loss': 0.5671, 'learning_rate': 1.711877617909124e-05, 'epoch': 0.54} {'loss': 0.5526, 'learning_rate': 1.7118540216778728e-05, 'epoch': 0.54} {'loss': 0.7056, 'learning_rate': 1.7118304246430737e-05, 'epoch': 0.54} {'loss': 0.4406, 'learning_rate': 1.7118068268047534e-05, 'epoch': 0.54} {'loss': 0.5067, 'learning_rate': 1.7117832281629386e-05, 'epoch': 0.54} {'loss': 0.5686, 'learning_rate': 1.7117596287176556e-05, 'epoch': 0.54} {'loss': 0.5281, 'learning_rate': 1.711736028468932e-05, 'epoch': 0.54} {'loss': 0.4918, 'learning_rate': 1.711712427416793e-05, 'epoch': 0.54} {'loss': 0.594, 'learning_rate': 1.7116888255612666e-05, 'epoch': 0.54} {'loss': 0.4887, 'learning_rate': 1.7116652229023787e-05, 'epoch': 0.54} {'loss': 0.5948, 'learning_rate': 1.711641619440156e-05, 'epoch': 0.54} {'loss': 0.4856, 'learning_rate': 1.7116180151746253e-05, 'epoch': 0.54} {'loss': 0.6473, 'learning_rate': 1.711594410105813e-05, 'epoch': 0.54} {'loss': 0.7836, 'learning_rate': 1.7115708042337463e-05, 'epoch': 0.54} {'loss': 0.5356, 'learning_rate': 1.711547197558451e-05, 'epoch': 0.54} {'loss': 0.6008, 'learning_rate': 1.7115235900799543e-05, 'epoch': 0.54} {'loss': 0.5005, 'learning_rate': 1.7114999817982833e-05, 'epoch': 0.54} {'loss': 0.6953, 'learning_rate': 1.7114763727134637e-05, 'epoch': 0.54} {'loss': 0.7215, 'learning_rate': 1.7114527628255227e-05, 'epoch': 0.54} {'loss': 0.5755, 'learning_rate': 1.7114291521344868e-05, 'epoch': 0.54} {'loss': 0.604, 'learning_rate': 1.7114055406403826e-05, 'epoch': 0.54} {'loss': 0.6227, 'learning_rate': 1.7113819283432366e-05, 'epoch': 0.54} {'loss': 0.5944, 'learning_rate': 1.711358315243076e-05, 'epoch': 0.54} {'loss': 0.5481, 'learning_rate': 1.711334701339927e-05, 'epoch': 0.54} {'loss': 0.5365, 'learning_rate': 1.7113110866338164e-05, 'epoch': 0.54} {'loss': 0.5009, 'learning_rate': 1.711287471124771e-05, 'epoch': 0.54} {'loss': 0.5562, 'learning_rate': 1.7112638548128173e-05, 'epoch': 0.54} {'loss': 0.5308, 'learning_rate': 1.7112402376979817e-05, 'epoch': 0.54} {'loss': 0.4292, 'learning_rate': 1.7112166197802914e-05, 'epoch': 0.54} {'loss': 0.51, 'learning_rate': 1.7111930010597727e-05, 'epoch': 0.54} {'loss': 0.7728, 'learning_rate': 1.711169381536452e-05, 'epoch': 0.54} {'loss': 0.5082, 'learning_rate': 1.7111457612103568e-05, 'epoch': 0.54} {'loss': 0.5721, 'learning_rate': 1.711122140081513e-05, 'epoch': 0.54} {'loss': 0.5852, 'learning_rate': 1.7110985181499477e-05, 'epoch': 0.54} {'loss': 0.531, 'learning_rate': 1.7110748954156872e-05, 'epoch': 0.54} {'loss': 0.596, 'learning_rate': 1.7110512718787586e-05, 'epoch': 0.54} {'loss': 0.5823, 'learning_rate': 1.711027647539188e-05, 'epoch': 0.54} {'loss': 0.5019, 'learning_rate': 1.7110040223970026e-05, 'epoch': 0.54} {'loss': 0.5388, 'learning_rate': 1.710980396452229e-05, 'epoch': 0.54} {'loss': 0.598, 'learning_rate': 1.7109567697048934e-05, 'epoch': 0.54} {'loss': 0.6454, 'learning_rate': 1.710933142155023e-05, 'epoch': 0.54} {'loss': 0.6359, 'learning_rate': 1.7109095138026443e-05, 'epoch': 0.54} {'loss': 0.4685, 'learning_rate': 1.710885884647784e-05, 'epoch': 0.54} {'loss': 0.4614, 'learning_rate': 1.7108622546904686e-05, 'epoch': 0.54} {'loss': 0.5609, 'learning_rate': 1.7108386239307247e-05, 'epoch': 0.54} {'loss': 0.5832, 'learning_rate': 1.7108149923685794e-05, 'epoch': 0.54} {'loss': 0.5547, 'learning_rate': 1.710791360004059e-05, 'epoch': 0.54} {'loss': 0.6295, 'learning_rate': 1.7107677268371902e-05, 'epoch': 0.54} {'loss': 0.5721, 'learning_rate': 1.7107440928680002e-05, 'epoch': 0.54} {'loss': 0.4948, 'learning_rate': 1.7107204580965152e-05, 'epoch': 0.54} {'loss': 0.5116, 'learning_rate': 1.710696822522762e-05, 'epoch': 0.54} {'loss': 0.6689, 'learning_rate': 1.7106731861467668e-05, 'epoch': 0.54} {'loss': 0.5547, 'learning_rate': 1.7106495489685572e-05, 'epoch': 0.54} {'loss': 0.5297, 'learning_rate': 1.710625910988159e-05, 'epoch': 0.54} {'loss': 0.5138, 'learning_rate': 1.7106022722055996e-05, 'epoch': 0.54} {'loss': 0.5834, 'learning_rate': 1.710578632620905e-05, 'epoch': 0.54} {'loss': 0.5761, 'learning_rate': 1.710554992234103e-05, 'epoch': 0.54} {'loss': 0.6878, 'learning_rate': 1.7105313510452187e-05, 'epoch': 0.54} {'loss': 0.6444, 'learning_rate': 1.7105077090542798e-05, 'epoch': 0.54} {'loss': 0.6125, 'learning_rate': 1.7104840662613128e-05, 'epoch': 0.54} {'loss': 0.617, 'learning_rate': 1.7104604226663445e-05, 'epoch': 0.54} {'loss': 0.7091, 'learning_rate': 1.7104367782694017e-05, 'epoch': 0.54} {'loss': 0.7042, 'learning_rate': 1.7104131330705104e-05, 'epoch': 0.54} {'loss': 0.5453, 'learning_rate': 1.7103894870696982e-05, 'epoch': 0.54} {'loss': 0.7298, 'learning_rate': 1.710365840266991e-05, 'epoch': 0.54} {'loss': 0.5491, 'learning_rate': 1.710342192662416e-05, 'epoch': 0.54} {'loss': 0.584, 'learning_rate': 1.710318544256e-05, 'epoch': 0.54} {'loss': 0.6228, 'learning_rate': 1.7102948950477693e-05, 'epoch': 0.54} {'loss': 0.3957, 'learning_rate': 1.7102712450377505e-05, 'epoch': 0.54} {'loss': 0.7413, 'learning_rate': 1.7102475942259707e-05, 'epoch': 0.54} {'loss': 0.7198, 'learning_rate': 1.7102239426124563e-05, 'epoch': 0.54} {'loss': 0.4721, 'learning_rate': 1.7102002901972343e-05, 'epoch': 0.54} {'loss': 0.4209, 'learning_rate': 1.7101766369803312e-05, 'epoch': 0.54} {'loss': 0.5725, 'learning_rate': 1.7101529829617738e-05, 'epoch': 0.54} {'loss': 0.6398, 'learning_rate': 1.7101293281415884e-05, 'epoch': 0.54} {'loss': 0.5151, 'learning_rate': 1.7101056725198023e-05, 'epoch': 0.54} {'loss': 0.5783, 'learning_rate': 1.710082016096442e-05, 'epoch': 0.54} {'loss': 0.5076, 'learning_rate': 1.710058358871534e-05, 'epoch': 0.54} {'loss': 0.4603, 'learning_rate': 1.710034700845105e-05, 'epoch': 0.54} {'loss': 0.6013, 'learning_rate': 1.710011042017182e-05, 'epoch': 0.54} {'loss': 0.4198, 'learning_rate': 1.7099873823877914e-05, 'epoch': 0.54} {'loss': 0.6147, 'learning_rate': 1.70996372195696e-05, 'epoch': 0.54} {'loss': 0.6118, 'learning_rate': 1.709940060724715e-05, 'epoch': 0.54} {'loss': 0.5714, 'learning_rate': 1.7099163986910822e-05, 'epoch': 0.54} {'loss': 0.4996, 'learning_rate': 1.7098927358560892e-05, 'epoch': 0.54} {'loss': 0.5977, 'learning_rate': 1.7098690722197623e-05, 'epoch': 0.54} {'loss': 0.6671, 'learning_rate': 1.7098454077821277e-05, 'epoch': 0.54} {'loss': 0.5916, 'learning_rate': 1.7098217425432128e-05, 'epoch': 0.54} {'loss': 0.5028, 'learning_rate': 1.7097980765030444e-05, 'epoch': 0.54} {'loss': 0.4747, 'learning_rate': 1.7097744096616485e-05, 'epoch': 0.54} {'loss': 0.5816, 'learning_rate': 1.7097507420190527e-05, 'epoch': 0.54} {'loss': 0.6491, 'learning_rate': 1.7097270735752833e-05, 'epoch': 0.54} {'loss': 0.6045, 'learning_rate': 1.7097034043303667e-05, 'epoch': 0.54} {'loss': 0.635, 'learning_rate': 1.70967973428433e-05, 'epoch': 0.54} {'loss': 0.6167, 'learning_rate': 1.7096560634372e-05, 'epoch': 0.54} {'loss': 0.5991, 'learning_rate': 1.709632391789003e-05, 'epoch': 0.54} {'loss': 0.5707, 'learning_rate': 1.709608719339766e-05, 'epoch': 0.54} {'loss': 0.5505, 'learning_rate': 1.7095850460895157e-05, 'epoch': 0.54} {'loss': 0.641, 'learning_rate': 1.709561372038279e-05, 'epoch': 0.54} {'loss': 0.7486, 'learning_rate': 1.7095376971860823e-05, 'epoch': 0.54} {'loss': 0.7037, 'learning_rate': 1.7095140215329525e-05, 'epoch': 0.54} {'loss': 0.6712, 'learning_rate': 1.7094903450789165e-05, 'epoch': 0.54} {'loss': 0.641, 'learning_rate': 1.7094666678240007e-05, 'epoch': 0.54} {'loss': 0.6363, 'learning_rate': 1.7094429897682315e-05, 'epoch': 0.54} {'loss': 0.4114, 'learning_rate': 1.7094193109116367e-05, 'epoch': 0.54} {'loss': 0.7411, 'learning_rate': 1.709395631254242e-05, 'epoch': 0.54} {'loss': 0.657, 'learning_rate': 1.7093719507960746e-05, 'epoch': 0.54} {'loss': 0.448, 'learning_rate': 1.7093482695371612e-05, 'epoch': 0.54} {'loss': 0.5716, 'learning_rate': 1.7093245874775286e-05, 'epoch': 0.54} {'loss': 0.6078, 'learning_rate': 1.7093009046172032e-05, 'epoch': 0.54} {'loss': 0.5998, 'learning_rate': 1.7092772209562124e-05, 'epoch': 0.54} {'loss': 0.5027, 'learning_rate': 1.709253536494582e-05, 'epoch': 0.54} {'loss': 0.5777, 'learning_rate': 1.7092298512323396e-05, 'epoch': 0.54} {'loss': 0.6402, 'learning_rate': 1.709206165169511e-05, 'epoch': 0.54} {'loss': 0.5441, 'learning_rate': 1.7091824783061238e-05, 'epoch': 0.54} {'loss': 0.664, 'learning_rate': 1.7091587906422048e-05, 'epoch': 0.54} {'loss': 0.4247, 'learning_rate': 1.70913510217778e-05, 'epoch': 0.54} {'loss': 0.5559, 'learning_rate': 1.7091114129128765e-05, 'epoch': 0.54} {'loss': 0.5783, 'learning_rate': 1.7090877228475214e-05, 'epoch': 0.54} {'loss': 0.6272, 'learning_rate': 1.7090640319817406e-05, 'epoch': 0.54} {'loss': 0.6741, 'learning_rate': 1.7090403403155617e-05, 'epoch': 0.54} {'loss': 0.6051, 'learning_rate': 1.7090166478490113e-05, 'epoch': 0.54} {'loss': 0.425, 'learning_rate': 1.7089929545821153e-05, 'epoch': 0.54} {'loss': 0.6423, 'learning_rate': 1.7089692605149016e-05, 'epoch': 0.55} {'loss': 0.5106, 'learning_rate': 1.708945565647396e-05, 'epoch': 0.55} {'loss': 0.5191, 'learning_rate': 1.708921869979626e-05, 'epoch': 0.55} {'loss': 0.6415, 'learning_rate': 1.7088981735116178e-05, 'epoch': 0.55} {'loss': 0.6833, 'learning_rate': 1.7088744762433985e-05, 'epoch': 0.55} {'loss': 0.643, 'learning_rate': 1.708850778174995e-05, 'epoch': 0.55} {'loss': 0.5137, 'learning_rate': 1.7088270793064333e-05, 'epoch': 0.55} {'loss': 0.5358, 'learning_rate': 1.7088033796377406e-05, 'epoch': 0.55} {'loss': 0.4523, 'learning_rate': 1.708779679168944e-05, 'epoch': 0.55} {'loss': 0.6979, 'learning_rate': 1.7087559779000698e-05, 'epoch': 0.55} {'loss': 0.6269, 'learning_rate': 1.7087322758311445e-05, 'epoch': 0.55} {'loss': 0.5571, 'learning_rate': 1.7087085729621956e-05, 'epoch': 0.55} {'loss': 0.5088, 'learning_rate': 1.70868486929325e-05, 'epoch': 0.55} {'loss': 0.7292, 'learning_rate': 1.708661164824333e-05, 'epoch': 0.55} {'loss': 0.6754, 'learning_rate': 1.708637459555473e-05, 'epoch': 0.55} {'loss': 0.7225, 'learning_rate': 1.7086137534866954e-05, 'epoch': 0.55} {'loss': 0.6084, 'learning_rate': 1.708590046618028e-05, 'epoch': 0.55} {'loss': 0.6677, 'learning_rate': 1.7085663389494972e-05, 'epoch': 0.55} {'loss': 0.5923, 'learning_rate': 1.7085426304811296e-05, 'epoch': 0.55} {'loss': 0.6773, 'learning_rate': 1.7085189212129525e-05, 'epoch': 0.55} {'loss': 0.4101, 'learning_rate': 1.708495211144992e-05, 'epoch': 0.55} {'loss': 0.6156, 'learning_rate': 1.7084715002772752e-05, 'epoch': 0.55} {'loss': 0.5009, 'learning_rate': 1.708447788609829e-05, 'epoch': 0.55} {'loss': 0.5669, 'learning_rate': 1.7084240761426794e-05, 'epoch': 0.55} {'loss': 0.7603, 'learning_rate': 1.708400362875854e-05, 'epoch': 0.55} {'loss': 0.6749, 'learning_rate': 1.7083766488093792e-05, 'epoch': 0.55} {'loss': 0.5007, 'learning_rate': 1.708352933943282e-05, 'epoch': 0.55} {'loss': 0.5487, 'learning_rate': 1.708329218277589e-05, 'epoch': 0.55} {'loss': 0.6079, 'learning_rate': 1.7083055018123272e-05, 'epoch': 0.55} {'loss': 0.661, 'learning_rate': 1.708281784547523e-05, 'epoch': 0.55} {'loss': 0.5876, 'learning_rate': 1.7082580664832034e-05, 'epoch': 0.55} {'loss': 0.6312, 'learning_rate': 1.708234347619395e-05, 'epoch': 0.55} {'loss': 0.5014, 'learning_rate': 1.708210627956125e-05, 'epoch': 0.55} {'loss': 0.6642, 'learning_rate': 1.7081869074934194e-05, 'epoch': 0.55} {'loss': 0.5943, 'learning_rate': 1.7081631862313056e-05, 'epoch': 0.55} {'loss': 0.5932, 'learning_rate': 1.7081394641698103e-05, 'epoch': 0.55} {'loss': 0.5519, 'learning_rate': 1.7081157413089604e-05, 'epoch': 0.55} {'loss': 0.6717, 'learning_rate': 1.7080920176487825e-05, 'epoch': 0.55} {'loss': 0.6499, 'learning_rate': 1.708068293189303e-05, 'epoch': 0.55} {'loss': 0.5559, 'learning_rate': 1.7080445679305492e-05, 'epoch': 0.55} {'loss': 0.5665, 'learning_rate': 1.7080208418725477e-05, 'epoch': 0.55} {'loss': 0.6286, 'learning_rate': 1.7079971150153253e-05, 'epoch': 0.55} {'loss': 0.5304, 'learning_rate': 1.707973387358909e-05, 'epoch': 0.55} {'loss': 0.5793, 'learning_rate': 1.707949658903325e-05, 'epoch': 0.55} {'loss': 0.5056, 'learning_rate': 1.707925929648601e-05, 'epoch': 0.55} {'loss': 0.6075, 'learning_rate': 1.7079021995947625e-05, 'epoch': 0.55} {'loss': 0.574, 'learning_rate': 1.7078784687418377e-05, 'epoch': 0.55} {'loss': 0.5203, 'learning_rate': 1.7078547370898524e-05, 'epoch': 0.55} {'loss': 0.6874, 'learning_rate': 1.7078310046388338e-05, 'epoch': 0.55} {'loss': 0.3717, 'learning_rate': 1.7078072713888084e-05, 'epoch': 0.55} {'loss': 0.4315, 'learning_rate': 1.7077835373398036e-05, 'epoch': 0.55} {'loss': 0.5688, 'learning_rate': 1.7077598024918454e-05, 'epoch': 0.55} {'loss': 0.5151, 'learning_rate': 1.707736066844961e-05, 'epoch': 0.55} {'loss': 0.593, 'learning_rate': 1.7077123303991776e-05, 'epoch': 0.55} {'loss': 0.6147, 'learning_rate': 1.707688593154521e-05, 'epoch': 0.55} {'loss': 0.4996, 'learning_rate': 1.707664855111019e-05, 'epoch': 0.55} {'loss': 0.4918, 'learning_rate': 1.7076411162686974e-05, 'epoch': 0.55} {'loss': 0.6606, 'learning_rate': 1.7076173766275837e-05, 'epoch': 0.55} {'loss': 0.6094, 'learning_rate': 1.707593636187705e-05, 'epoch': 0.55} {'loss': 0.5634, 'learning_rate': 1.7075698949490874e-05, 'epoch': 0.55} {'loss': 0.626, 'learning_rate': 1.7075461529117578e-05, 'epoch': 0.55} {'loss': 0.4612, 'learning_rate': 1.7075224100757433e-05, 'epoch': 0.55} {'loss': 0.6995, 'learning_rate': 1.7074986664410706e-05, 'epoch': 0.55} {'loss': 0.5976, 'learning_rate': 1.707474922007766e-05, 'epoch': 0.55} {'loss': 0.4036, 'learning_rate': 1.7074511767758572e-05, 'epoch': 0.55} {'loss': 0.4455, 'learning_rate': 1.7074274307453704e-05, 'epoch': 0.55} {'loss': 0.6392, 'learning_rate': 1.7074036839163325e-05, 'epoch': 0.55} {'loss': 0.5168, 'learning_rate': 1.7073799362887705e-05, 'epoch': 0.55} {'loss': 0.4426, 'learning_rate': 1.707356187862711e-05, 'epoch': 0.55} {'loss': 0.5759, 'learning_rate': 1.7073324386381808e-05, 'epoch': 0.55} {'loss': 0.6182, 'learning_rate': 1.707308688615207e-05, 'epoch': 0.55} {'loss': 0.5026, 'learning_rate': 1.7072849377938157e-05, 'epoch': 0.55} {'loss': 0.5224, 'learning_rate': 1.7072611861740346e-05, 'epoch': 0.55} {'loss': 0.6769, 'learning_rate': 1.70723743375589e-05, 'epoch': 0.55} {'loss': 0.5771, 'learning_rate': 1.707213680539409e-05, 'epoch': 0.55} {'loss': 0.5109, 'learning_rate': 1.707189926524618e-05, 'epoch': 0.55} {'loss': 0.6617, 'learning_rate': 1.707166171711544e-05, 'epoch': 0.55} {'loss': 0.5093, 'learning_rate': 1.7071424161002142e-05, 'epoch': 0.55} {'loss': 0.6311, 'learning_rate': 1.707118659690655e-05, 'epoch': 0.55} {'loss': 0.561, 'learning_rate': 1.707094902482893e-05, 'epoch': 0.55} {'loss': 0.536, 'learning_rate': 1.7070711444769556e-05, 'epoch': 0.55} {'loss': 0.5904, 'learning_rate': 1.7070473856728694e-05, 'epoch': 0.55} {'loss': 0.7459, 'learning_rate': 1.707023626070661e-05, 'epoch': 0.55} {'loss': 0.6348, 'learning_rate': 1.7069998656703575e-05, 'epoch': 0.55} {'loss': 0.6814, 'learning_rate': 1.7069761044719854e-05, 'epoch': 0.55} {'loss': 0.5313, 'learning_rate': 1.7069523424755716e-05, 'epoch': 0.55} {'loss': 0.577, 'learning_rate': 1.7069285796811434e-05, 'epoch': 0.55} {'loss': 0.459, 'learning_rate': 1.706904816088727e-05, 'epoch': 0.55} {'loss': 0.599, 'learning_rate': 1.7068810516983495e-05, 'epoch': 0.55} {'loss': 0.5884, 'learning_rate': 1.7068572865100378e-05, 'epoch': 0.55} {'loss': 0.6175, 'learning_rate': 1.7068335205238187e-05, 'epoch': 0.55} {'loss': 0.6495, 'learning_rate': 1.706809753739719e-05, 'epoch': 0.55} {'loss': 0.632, 'learning_rate': 1.7067859861577652e-05, 'epoch': 0.55} {'loss': 0.5152, 'learning_rate': 1.7067622177779845e-05, 'epoch': 0.55} {'loss': 0.5294, 'learning_rate': 1.706738448600404e-05, 'epoch': 0.55} {'loss': 0.5748, 'learning_rate': 1.70671467862505e-05, 'epoch': 0.55} {'loss': 0.5312, 'learning_rate': 1.7066909078519492e-05, 'epoch': 0.55} {'loss': 0.4572, 'learning_rate': 1.706667136281129e-05, 'epoch': 0.55} {'loss': 0.6834, 'learning_rate': 1.7066433639126163e-05, 'epoch': 0.55} {'loss': 0.4578, 'learning_rate': 1.7066195907464373e-05, 'epoch': 0.55} {'loss': 0.5736, 'learning_rate': 1.706595816782619e-05, 'epoch': 0.55} {'loss': 0.6046, 'learning_rate': 1.7065720420211883e-05, 'epoch': 0.55} {'loss': 0.6633, 'learning_rate': 1.7065482664621727e-05, 'epoch': 0.55} {'loss': 0.4833, 'learning_rate': 1.706524490105598e-05, 'epoch': 0.55} {'loss': 0.5191, 'learning_rate': 1.7065007129514915e-05, 'epoch': 0.55} {'loss': 0.4617, 'learning_rate': 1.7064769349998803e-05, 'epoch': 0.55} {'loss': 0.5162, 'learning_rate': 1.706453156250791e-05, 'epoch': 0.55} {'loss': 0.5701, 'learning_rate': 1.7064293767042503e-05, 'epoch': 0.55} {'loss': 0.6303, 'learning_rate': 1.706405596360285e-05, 'epoch': 0.55} {'loss': 0.6669, 'learning_rate': 1.7063818152189222e-05, 'epoch': 0.55} {'loss': 0.5931, 'learning_rate': 1.7063580332801887e-05, 'epoch': 0.55} {'loss': 0.6187, 'learning_rate': 1.7063342505441115e-05, 'epoch': 0.55} {'loss': 0.5299, 'learning_rate': 1.7063104670107172e-05, 'epoch': 0.55} {'loss': 0.5588, 'learning_rate': 1.7062866826800324e-05, 'epoch': 0.55} {'loss': 0.6104, 'learning_rate': 1.7062628975520844e-05, 'epoch': 0.55} {'loss': 0.6986, 'learning_rate': 1.7062391116269e-05, 'epoch': 0.55} {'loss': 0.4242, 'learning_rate': 1.7062153249045056e-05, 'epoch': 0.55} {'loss': 0.645, 'learning_rate': 1.706191537384929e-05, 'epoch': 0.55} {'loss': 0.6082, 'learning_rate': 1.7061677490681958e-05, 'epoch': 0.55} {'loss': 0.5226, 'learning_rate': 1.706143959954334e-05, 'epoch': 0.55} {'loss': 0.5886, 'learning_rate': 1.7061201700433697e-05, 'epoch': 0.55} {'loss': 0.5153, 'learning_rate': 1.70609637933533e-05, 'epoch': 0.55} {'loss': 0.5393, 'learning_rate': 1.7060725878302415e-05, 'epoch': 0.55} {'loss': 0.5345, 'learning_rate': 1.7060487955281317e-05, 'epoch': 0.55} {'loss': 0.4436, 'learning_rate': 1.706025002429027e-05, 'epoch': 0.55} {'loss': 0.5796, 'learning_rate': 1.7060012085329542e-05, 'epoch': 0.55} {'loss': 0.6213, 'learning_rate': 1.7059774138399405e-05, 'epoch': 0.55} {'loss': 0.6437, 'learning_rate': 1.7059536183500123e-05, 'epoch': 0.55} {'loss': 0.549, 'learning_rate': 1.705929822063197e-05, 'epoch': 0.55} {'loss': 0.5899, 'learning_rate': 1.7059060249795208e-05, 'epoch': 0.55} {'loss': 0.5591, 'learning_rate': 1.7058822270990113e-05, 'epoch': 0.55} {'loss': 0.5257, 'learning_rate': 1.7058584284216948e-05, 'epoch': 0.55} {'loss': 0.5798, 'learning_rate': 1.7058346289475985e-05, 'epoch': 0.55} {'loss': 0.7617, 'learning_rate': 1.7058108286767487e-05, 'epoch': 0.55} {'loss': 0.4779, 'learning_rate': 1.7057870276091734e-05, 'epoch': 0.55} {'loss': 0.5481, 'learning_rate': 1.705763225744898e-05, 'epoch': 0.55} {'loss': 0.5674, 'learning_rate': 1.7057394230839504e-05, 'epoch': 0.55} {'loss': 0.7284, 'learning_rate': 1.7057156196263574e-05, 'epoch': 0.55} {'loss': 0.5221, 'learning_rate': 1.705691815372146e-05, 'epoch': 0.55} {'loss': 0.6694, 'learning_rate': 1.705668010321342e-05, 'epoch': 0.55} {'loss': 0.5392, 'learning_rate': 1.7056442044739735e-05, 'epoch': 0.55} {'loss': 0.4999, 'learning_rate': 1.7056203978300665e-05, 'epoch': 0.55} {'loss': 0.6166, 'learning_rate': 1.7055965903896483e-05, 'epoch': 0.55} {'loss': 0.7118, 'learning_rate': 1.7055727821527458e-05, 'epoch': 0.55} {'loss': 0.5454, 'learning_rate': 1.705548973119386e-05, 'epoch': 0.55} {'loss': 0.7592, 'learning_rate': 1.7055251632895956e-05, 'epoch': 0.55} {'loss': 0.5889, 'learning_rate': 1.705501352663401e-05, 'epoch': 0.55} {'loss': 0.4447, 'learning_rate': 1.7054775412408297e-05, 'epoch': 0.55} {'loss': 0.5717, 'learning_rate': 1.7054537290219087e-05, 'epoch': 0.55} {'loss': 0.4736, 'learning_rate': 1.7054299160066643e-05, 'epoch': 0.55} {'loss': 0.468, 'learning_rate': 1.7054061021951235e-05, 'epoch': 0.55} {'loss': 0.6719, 'learning_rate': 1.7053822875873138e-05, 'epoch': 0.55} {'loss': 0.5478, 'learning_rate': 1.7053584721832616e-05, 'epoch': 0.55} {'loss': 0.6061, 'learning_rate': 1.7053346559829934e-05, 'epoch': 0.55} {'loss': 0.7398, 'learning_rate': 1.705310838986537e-05, 'epoch': 0.55} {'loss': 0.6139, 'learning_rate': 1.7052870211939185e-05, 'epoch': 0.55} {'loss': 0.6157, 'learning_rate': 1.705263202605165e-05, 'epoch': 0.55} {'loss': 0.5945, 'learning_rate': 1.7052393832203037e-05, 'epoch': 0.55} {'loss': 0.5659, 'learning_rate': 1.705215563039361e-05, 'epoch': 0.55} {'loss': 0.6038, 'learning_rate': 1.705191742062364e-05, 'epoch': 0.55} {'loss': 0.6465, 'learning_rate': 1.7051679202893397e-05, 'epoch': 0.55} {'loss': 0.5334, 'learning_rate': 1.705144097720315e-05, 'epoch': 0.55} {'loss': 0.71, 'learning_rate': 1.7051202743553167e-05, 'epoch': 0.55} {'loss': 0.6521, 'learning_rate': 1.705096450194372e-05, 'epoch': 0.55} {'loss': 0.5569, 'learning_rate': 1.705072625237507e-05, 'epoch': 0.55} {'loss': 0.5456, 'learning_rate': 1.7050487994847494e-05, 'epoch': 0.55} {'loss': 0.6251, 'learning_rate': 1.7050249729361255e-05, 'epoch': 0.55} {'loss': 0.5474, 'learning_rate': 1.7050011455916627e-05, 'epoch': 0.55} {'loss': 0.7243, 'learning_rate': 1.7049773174513873e-05, 'epoch': 0.55} {'loss': 0.6811, 'learning_rate': 1.7049534885153268e-05, 'epoch': 0.55} {'loss': 0.5129, 'learning_rate': 1.704929658783508e-05, 'epoch': 0.55} {'loss': 0.6573, 'learning_rate': 1.7049058282559574e-05, 'epoch': 0.55} {'loss': 0.5505, 'learning_rate': 1.7048819969327026e-05, 'epoch': 0.55} {'loss': 0.6397, 'learning_rate': 1.7048581648137698e-05, 'epoch': 0.55} {'loss': 0.5746, 'learning_rate': 1.704834331899186e-05, 'epoch': 0.55} {'loss': 0.6665, 'learning_rate': 1.7048104981889782e-05, 'epoch': 0.55} {'loss': 0.5052, 'learning_rate': 1.7047866636831737e-05, 'epoch': 0.55} {'loss': 0.6756, 'learning_rate': 1.704762828381799e-05, 'epoch': 0.55} {'loss': 0.5857, 'learning_rate': 1.7047389922848812e-05, 'epoch': 0.55} {'loss': 0.6202, 'learning_rate': 1.7047151553924468e-05, 'epoch': 0.55} {'loss': 0.6682, 'learning_rate': 1.704691317704523e-05, 'epoch': 0.55} {'loss': 0.4968, 'learning_rate': 1.7046674792211372e-05, 'epoch': 0.55} {'loss': 0.6549, 'learning_rate': 1.7046436399423155e-05, 'epoch': 0.55} {'loss': 0.5877, 'learning_rate': 1.704619799868085e-05, 'epoch': 0.55} {'loss': 0.4449, 'learning_rate': 1.7045959589984726e-05, 'epoch': 0.55} {'loss': 0.5401, 'learning_rate': 1.704572117333506e-05, 'epoch': 0.55} {'loss': 0.6736, 'learning_rate': 1.7045482748732106e-05, 'epoch': 0.55} {'loss': 0.5667, 'learning_rate': 1.704524431617615e-05, 'epoch': 0.55} {'loss': 0.5755, 'learning_rate': 1.7045005875667446e-05, 'epoch': 0.55} {'loss': 0.7188, 'learning_rate': 1.7044767427206274e-05, 'epoch': 0.55} {'loss': 0.4389, 'learning_rate': 1.70445289707929e-05, 'epoch': 0.55} {'loss': 0.7951, 'learning_rate': 1.7044290506427587e-05, 'epoch': 0.55} {'loss': 0.5021, 'learning_rate': 1.7044052034110613e-05, 'epoch': 0.55} {'loss': 0.6034, 'learning_rate': 1.7043813553842247e-05, 'epoch': 0.55} {'loss': 0.6398, 'learning_rate': 1.704357506562275e-05, 'epoch': 0.55} {'loss': 0.622, 'learning_rate': 1.70433365694524e-05, 'epoch': 0.55} {'loss': 0.738, 'learning_rate': 1.704309806533146e-05, 'epoch': 0.55} {'loss': 0.5874, 'learning_rate': 1.70428595532602e-05, 'epoch': 0.55} {'loss': 0.709, 'learning_rate': 1.7042621033238893e-05, 'epoch': 0.55} {'loss': 0.6189, 'learning_rate': 1.7042382505267806e-05, 'epoch': 0.55} {'loss': 0.5983, 'learning_rate': 1.7042143969347207e-05, 'epoch': 0.55} {'loss': 0.71, 'learning_rate': 1.704190542547737e-05, 'epoch': 0.55} {'loss': 0.6354, 'learning_rate': 1.7041666873658557e-05, 'epoch': 0.55} {'loss': 0.4356, 'learning_rate': 1.7041428313891043e-05, 'epoch': 0.55} {'loss': 0.6388, 'learning_rate': 1.7041189746175093e-05, 'epoch': 0.55} {'loss': 0.7087, 'learning_rate': 1.7040951170510982e-05, 'epoch': 0.55} {'loss': 0.6662, 'learning_rate': 1.7040712586898975e-05, 'epoch': 0.55} {'loss': 0.6596, 'learning_rate': 1.7040473995339343e-05, 'epoch': 0.55} {'loss': 0.5589, 'learning_rate': 1.7040235395832353e-05, 'epoch': 0.55} {'loss': 0.579, 'learning_rate': 1.7039996788378276e-05, 'epoch': 0.55} {'loss': 0.5916, 'learning_rate': 1.7039758172977383e-05, 'epoch': 0.55} {'loss': 0.6957, 'learning_rate': 1.7039519549629942e-05, 'epoch': 0.55} {'loss': 0.6152, 'learning_rate': 1.703928091833622e-05, 'epoch': 0.55} {'loss': 0.451, 'learning_rate': 1.703904227909649e-05, 'epoch': 0.55} {'loss': 0.5296, 'learning_rate': 1.703880363191102e-05, 'epoch': 0.55} {'loss': 0.5343, 'learning_rate': 1.7038564976780076e-05, 'epoch': 0.55} {'loss': 0.4714, 'learning_rate': 1.703832631370393e-05, 'epoch': 0.55} {'loss': 0.5859, 'learning_rate': 1.7038087642682857e-05, 'epoch': 0.55} {'loss': 0.6186, 'learning_rate': 1.7037848963717122e-05, 'epoch': 0.55} {'loss': 0.54, 'learning_rate': 1.7037610276806988e-05, 'epoch': 0.55} {'loss': 0.6723, 'learning_rate': 1.7037371581952734e-05, 'epoch': 0.55} {'loss': 0.5139, 'learning_rate': 1.7037132879154626e-05, 'epoch': 0.55} {'loss': 0.4426, 'learning_rate': 1.7036894168412935e-05, 'epoch': 0.55} {'loss': 0.5509, 'learning_rate': 1.7036655449727924e-05, 'epoch': 0.55} {'loss': 0.7782, 'learning_rate': 1.7036416723099866e-05, 'epoch': 0.55} {'loss': 0.5036, 'learning_rate': 1.7036177988529037e-05, 'epoch': 0.55} {'loss': 0.4876, 'learning_rate': 1.70359392460157e-05, 'epoch': 0.55} {'loss': 0.5345, 'learning_rate': 1.7035700495560123e-05, 'epoch': 0.55} {'loss': 0.6652, 'learning_rate': 1.703546173716258e-05, 'epoch': 0.55} {'loss': 0.6297, 'learning_rate': 1.7035222970823336e-05, 'epoch': 0.55} {'loss': 0.4869, 'learning_rate': 1.7034984196542667e-05, 'epoch': 0.55} {'loss': 0.4092, 'learning_rate': 1.7034745414320834e-05, 'epoch': 0.55} {'loss': 0.5231, 'learning_rate': 1.7034506624158115e-05, 'epoch': 0.55} {'loss': 0.7295, 'learning_rate': 1.7034267826054774e-05, 'epoch': 0.55} {'loss': 0.6128, 'learning_rate': 1.703402902001108e-05, 'epoch': 0.55} {'loss': 0.5649, 'learning_rate': 1.703379020602731e-05, 'epoch': 0.55} {'loss': 0.6071, 'learning_rate': 1.7033551384103724e-05, 'epoch': 0.55} {'loss': 0.7094, 'learning_rate': 1.7033312554240598e-05, 'epoch': 0.55} {'loss': 0.5798, 'learning_rate': 1.70330737164382e-05, 'epoch': 0.55} {'loss': 0.5222, 'learning_rate': 1.70328348706968e-05, 'epoch': 0.55} {'loss': 0.6692, 'learning_rate': 1.7032596017016664e-05, 'epoch': 0.55} {'loss': 0.5216, 'learning_rate': 1.7032357155398066e-05, 'epoch': 0.55} {'loss': 0.6031, 'learning_rate': 1.703211828584127e-05, 'epoch': 0.55} {'loss': 0.5023, 'learning_rate': 1.7031879408346555e-05, 'epoch': 0.55} {'loss': 0.6555, 'learning_rate': 1.7031640522914185e-05, 'epoch': 0.55} {'loss': 0.6191, 'learning_rate': 1.7031401629544428e-05, 'epoch': 0.55} {'loss': 0.518, 'learning_rate': 1.703116272823756e-05, 'epoch': 0.55} {'loss': 0.5435, 'learning_rate': 1.703092381899384e-05, 'epoch': 0.55} {'loss': 0.5896, 'learning_rate': 1.7030684901813545e-05, 'epoch': 0.55} {'loss': 0.6847, 'learning_rate': 1.7030445976696946e-05, 'epoch': 0.55} {'loss': 0.5286, 'learning_rate': 1.703020704364431e-05, 'epoch': 0.55} {'loss': 0.5804, 'learning_rate': 1.7029968102655908e-05, 'epoch': 0.55} {'loss': 0.7845, 'learning_rate': 1.7029729153732008e-05, 'epoch': 0.55} {'loss': 0.6312, 'learning_rate': 1.702949019687288e-05, 'epoch': 0.55} {'loss': 0.4889, 'learning_rate': 1.7029251232078793e-05, 'epoch': 0.55} {'loss': 0.5301, 'learning_rate': 1.7029012259350018e-05, 'epoch': 0.55} {'loss': 0.3991, 'learning_rate': 1.7028773278686824e-05, 'epoch': 0.55} {'loss': 0.5581, 'learning_rate': 1.7028534290089487e-05, 'epoch': 0.55} {'loss': 0.6187, 'learning_rate': 1.702829529355827e-05, 'epoch': 0.55} {'loss': 0.6315, 'learning_rate': 1.702805628909344e-05, 'epoch': 0.55} {'loss': 0.5311, 'learning_rate': 1.7027817276695272e-05, 'epoch': 0.55} {'loss': 0.4894, 'learning_rate': 1.7027578256364038e-05, 'epoch': 0.55} {'loss': 0.6503, 'learning_rate': 1.7027339228099998e-05, 'epoch': 0.55} {'loss': 0.6655, 'learning_rate': 1.7027100191903434e-05, 'epoch': 0.55} {'loss': 0.6332, 'learning_rate': 1.702686114777461e-05, 'epoch': 0.55} {'loss': 0.7244, 'learning_rate': 1.7026622095713795e-05, 'epoch': 0.55} {'loss': 0.5905, 'learning_rate': 1.702638303572126e-05, 'epoch': 0.55} {'loss': 0.5853, 'learning_rate': 1.7026143967797274e-05, 'epoch': 0.55} {'loss': 0.5405, 'learning_rate': 1.702590489194211e-05, 'epoch': 0.55} {'loss': 0.5692, 'learning_rate': 1.7025665808156032e-05, 'epoch': 0.55} {'loss': 0.4319, 'learning_rate': 1.7025426716439314e-05, 'epoch': 0.55} {'loss': 0.6669, 'learning_rate': 1.7025187616792223e-05, 'epoch': 0.55} {'loss': 0.655, 'learning_rate': 1.7024948509215037e-05, 'epoch': 0.55} {'loss': 0.68, 'learning_rate': 1.7024709393708017e-05, 'epoch': 0.55} {'loss': 0.7105, 'learning_rate': 1.7024470270271433e-05, 'epoch': 0.55} {'loss': 0.7087, 'learning_rate': 1.7024231138905563e-05, 'epoch': 0.55} {'loss': 0.4649, 'learning_rate': 1.7023991999610666e-05, 'epoch': 0.55} {'loss': 0.5724, 'learning_rate': 1.7023752852387022e-05, 'epoch': 0.55} {'loss': 0.4075, 'learning_rate': 1.7023513697234896e-05, 'epoch': 0.55} {'loss': 0.5981, 'learning_rate': 1.7023274534154558e-05, 'epoch': 0.55} {'loss': 0.7349, 'learning_rate': 1.702303536314628e-05, 'epoch': 0.55} {'loss': 0.5981, 'learning_rate': 1.702279618421033e-05, 'epoch': 0.55} {'loss': 0.7432, 'learning_rate': 1.702255699734698e-05, 'epoch': 0.55} {'loss': 0.5211, 'learning_rate': 1.7022317802556495e-05, 'epoch': 0.55} {'loss': 0.525, 'learning_rate': 1.702207859983915e-05, 'epoch': 0.55} {'loss': 0.5558, 'learning_rate': 1.702183938919521e-05, 'epoch': 0.55} {'loss': 0.6088, 'learning_rate': 1.7021600170624955e-05, 'epoch': 0.55} {'loss': 0.5688, 'learning_rate': 1.7021360944128646e-05, 'epoch': 0.55} {'loss': 0.6648, 'learning_rate': 1.7021121709706558e-05, 'epoch': 0.55} {'loss': 0.597, 'learning_rate': 1.7020882467358952e-05, 'epoch': 0.55} {'loss': 0.5043, 'learning_rate': 1.702064321708611e-05, 'epoch': 0.55} {'loss': 0.4995, 'learning_rate': 1.7020403958888295e-05, 'epoch': 0.55} {'loss': 0.6883, 'learning_rate': 1.7020164692765783e-05, 'epoch': 0.55} {'loss': 0.5983, 'learning_rate': 1.7019925418718836e-05, 'epoch': 0.55} {'loss': 0.5106, 'learning_rate': 1.7019686136747727e-05, 'epoch': 0.55} {'loss': 0.3965, 'learning_rate': 1.701944684685273e-05, 'epoch': 0.55} {'loss': 0.4543, 'learning_rate': 1.7019207549034112e-05, 'epoch': 0.55} {'loss': 0.4283, 'learning_rate': 1.7018968243292142e-05, 'epoch': 0.55} {'loss': 0.683, 'learning_rate': 1.701872892962709e-05, 'epoch': 0.55} {'loss': 0.4424, 'learning_rate': 1.7018489608039233e-05, 'epoch': 0.55} {'loss': 0.5342, 'learning_rate': 1.701825027852883e-05, 'epoch': 0.55} {'loss': 0.442, 'learning_rate': 1.7018010941096162e-05, 'epoch': 0.55} {'loss': 0.5745, 'learning_rate': 1.701777159574149e-05, 'epoch': 0.55} {'loss': 0.6158, 'learning_rate': 1.701753224246509e-05, 'epoch': 0.55} {'loss': 0.7253, 'learning_rate': 1.7017292881267233e-05, 'epoch': 0.55} {'loss': 0.7427, 'learning_rate': 1.7017053512148183e-05, 'epoch': 0.55} {'loss': 0.5885, 'learning_rate': 1.7016814135108217e-05, 'epoch': 0.55} {'loss': 0.6437, 'learning_rate': 1.7016574750147602e-05, 'epoch': 0.55} {'loss': 0.6519, 'learning_rate': 1.7016335357266606e-05, 'epoch': 0.55} {'loss': 0.6254, 'learning_rate': 1.7016095956465505e-05, 'epoch': 0.55} {'loss': 0.5403, 'learning_rate': 1.7015856547744562e-05, 'epoch': 0.55} {'loss': 0.6105, 'learning_rate': 1.7015617131104054e-05, 'epoch': 0.55} {'loss': 0.5079, 'learning_rate': 1.7015377706544246e-05, 'epoch': 0.55} {'loss': 0.6709, 'learning_rate': 1.701513827406541e-05, 'epoch': 0.55} {'loss': 0.6406, 'learning_rate': 1.701489883366782e-05, 'epoch': 0.55} {'loss': 0.8111, 'learning_rate': 1.7014659385351743e-05, 'epoch': 0.55} {'loss': 0.4269, 'learning_rate': 1.7014419929117446e-05, 'epoch': 0.55} {'loss': 0.4981, 'learning_rate': 1.7014180464965207e-05, 'epoch': 0.55} {'loss': 0.6629, 'learning_rate': 1.701394099289529e-05, 'epoch': 0.55} {'loss': 0.6266, 'learning_rate': 1.7013701512907966e-05, 'epoch': 0.55} {'loss': 0.6578, 'learning_rate': 1.701346202500351e-05, 'epoch': 0.55} {'loss': 0.4906, 'learning_rate': 1.7013222529182186e-05, 'epoch': 0.55} {'loss': 0.5123, 'learning_rate': 1.7012983025444268e-05, 'epoch': 0.55} {'loss': 0.7188, 'learning_rate': 1.7012743513790028e-05, 'epoch': 0.55} {'loss': 0.5279, 'learning_rate': 1.7012503994219733e-05, 'epoch': 0.55} {'loss': 0.5705, 'learning_rate': 1.701226446673365e-05, 'epoch': 0.55} {'loss': 0.4424, 'learning_rate': 1.701202493133206e-05, 'epoch': 0.55} {'loss': 0.6075, 'learning_rate': 1.7011785388015227e-05, 'epoch': 0.55} {'loss': 0.6331, 'learning_rate': 1.701154583678342e-05, 'epoch': 0.55} {'loss': 0.5747, 'learning_rate': 1.701130627763691e-05, 'epoch': 0.55} {'loss': 0.6697, 'learning_rate': 1.701106671057597e-05, 'epoch': 0.55} {'loss': 0.7708, 'learning_rate': 1.7010827135600868e-05, 'epoch': 0.55} {'loss': 0.5979, 'learning_rate': 1.7010587552711875e-05, 'epoch': 0.55} {'loss': 0.5593, 'learning_rate': 1.701034796190926e-05, 'epoch': 0.55} {'loss': 0.4689, 'learning_rate': 1.7010108363193298e-05, 'epoch': 0.55} {'loss': 0.574, 'learning_rate': 1.7009868756564255e-05, 'epoch': 0.55} {'loss': 0.5988, 'learning_rate': 1.7009629142022407e-05, 'epoch': 0.55} {'loss': 0.7347, 'learning_rate': 1.7009389519568018e-05, 'epoch': 0.55} {'loss': 0.5557, 'learning_rate': 1.700914988920136e-05, 'epoch': 0.55} {'loss': 0.6797, 'learning_rate': 1.7008910250922706e-05, 'epoch': 0.55} {'loss': 0.4784, 'learning_rate': 1.7008670604732325e-05, 'epoch': 0.55} {'loss': 0.5981, 'learning_rate': 1.7008430950630488e-05, 'epoch': 0.55} {'loss': 0.7224, 'learning_rate': 1.7008191288617464e-05, 'epoch': 0.55} {'loss': 0.6102, 'learning_rate': 1.7007951618693525e-05, 'epoch': 0.55} {'loss': 0.6444, 'learning_rate': 1.7007711940858943e-05, 'epoch': 0.55} {'loss': 0.7644, 'learning_rate': 1.7007472255113984e-05, 'epoch': 0.55} {'loss': 0.5575, 'learning_rate': 1.7007232561458923e-05, 'epoch': 0.55} {'loss': 0.5478, 'learning_rate': 1.7006992859894028e-05, 'epoch': 0.55} {'loss': 0.5, 'learning_rate': 1.700675315041957e-05, 'epoch': 0.55} {'loss': 0.5605, 'learning_rate': 1.7006513433035822e-05, 'epoch': 0.55} {'loss': 0.5732, 'learning_rate': 1.7006273707743054e-05, 'epoch': 0.55} {'loss': 0.6214, 'learning_rate': 1.7006033974541533e-05, 'epoch': 0.55} {'loss': 0.5771, 'learning_rate': 1.700579423343153e-05, 'epoch': 0.55} {'loss': 0.6089, 'learning_rate': 1.700555448441332e-05, 'epoch': 0.55} {'loss': 0.5442, 'learning_rate': 1.700531472748717e-05, 'epoch': 0.55} {'loss': 0.5796, 'learning_rate': 1.7005074962653354e-05, 'epoch': 0.55} {'loss': 0.568, 'learning_rate': 1.700483518991214e-05, 'epoch': 0.55} {'loss': 0.4426, 'learning_rate': 1.70045954092638e-05, 'epoch': 0.55} {'loss': 0.6069, 'learning_rate': 1.70043556207086e-05, 'epoch': 0.55} {'loss': 0.6969, 'learning_rate': 1.7004115824246815e-05, 'epoch': 0.55} {'loss': 0.7188, 'learning_rate': 1.7003876019878717e-05, 'epoch': 0.55} {'loss': 0.5605, 'learning_rate': 1.7003636207604573e-05, 'epoch': 0.55} {'loss': 0.3864, 'learning_rate': 1.7003396387424657e-05, 'epoch': 0.55} {'loss': 0.8035, 'learning_rate': 1.700315655933924e-05, 'epoch': 0.55} {'loss': 0.5457, 'learning_rate': 1.700291672334859e-05, 'epoch': 0.55} {'loss': 0.4602, 'learning_rate': 1.7002676879452974e-05, 'epoch': 0.55} {'loss': 0.6897, 'learning_rate': 1.7002437027652674e-05, 'epoch': 0.55} {'loss': 0.6097, 'learning_rate': 1.7002197167947948e-05, 'epoch': 0.55} {'loss': 0.6014, 'learning_rate': 1.700195730033908e-05, 'epoch': 0.55} {'loss': 0.6646, 'learning_rate': 1.700171742482633e-05, 'epoch': 0.55} {'loss': 0.5424, 'learning_rate': 1.7001477541409972e-05, 'epoch': 0.55} {'loss': 0.6091, 'learning_rate': 1.7001237650090276e-05, 'epoch': 0.55} {'loss': 0.6942, 'learning_rate': 1.7000997750867515e-05, 'epoch': 0.55} {'loss': 0.4893, 'learning_rate': 1.700075784374196e-05, 'epoch': 0.55} {'loss': 0.5644, 'learning_rate': 1.700051792871388e-05, 'epoch': 0.55} {'loss': 0.5583, 'learning_rate': 1.7000278005783548e-05, 'epoch': 0.55} {'loss': 0.4662, 'learning_rate': 1.7000038074951232e-05, 'epoch': 0.55} {'loss': 0.4465, 'learning_rate': 1.6999798136217203e-05, 'epoch': 0.55} {'loss': 0.4243, 'learning_rate': 1.6999558189581736e-05, 'epoch': 0.55} {'loss': 0.7428, 'learning_rate': 1.6999318235045095e-05, 'epoch': 0.55} {'loss': 0.6431, 'learning_rate': 1.6999078272607557e-05, 'epoch': 0.55} {'loss': 0.6996, 'learning_rate': 1.699883830226939e-05, 'epoch': 0.55} {'loss': 0.5323, 'learning_rate': 1.6998598324030866e-05, 'epoch': 0.55} {'loss': 0.5393, 'learning_rate': 1.6998358337892256e-05, 'epoch': 0.55} {'loss': 0.7146, 'learning_rate': 1.6998118343853826e-05, 'epoch': 0.55} {'loss': 0.5198, 'learning_rate': 1.6997878341915856e-05, 'epoch': 0.55} {'loss': 0.4721, 'learning_rate': 1.6997638332078608e-05, 'epoch': 0.55} {'loss': 0.5178, 'learning_rate': 1.6997398314342365e-05, 'epoch': 0.55} {'loss': 0.5607, 'learning_rate': 1.6997158288707384e-05, 'epoch': 0.55} {'loss': 0.6795, 'learning_rate': 1.699691825517394e-05, 'epoch': 0.55} {'loss': 0.437, 'learning_rate': 1.699667821374231e-05, 'epoch': 0.55} {'loss': 0.4675, 'learning_rate': 1.6996438164412757e-05, 'epoch': 0.55} {'loss': 0.5137, 'learning_rate': 1.6996198107185558e-05, 'epoch': 0.55} {'loss': 0.6092, 'learning_rate': 1.699595804206098e-05, 'epoch': 0.55} {'loss': 0.5454, 'learning_rate': 1.69957179690393e-05, 'epoch': 0.55} {'loss': 0.5883, 'learning_rate': 1.6995477888120778e-05, 'epoch': 0.55} {'loss': 0.4628, 'learning_rate': 1.6995237799305698e-05, 'epoch': 0.55} {'loss': 0.6627, 'learning_rate': 1.699499770259432e-05, 'epoch': 0.55} {'loss': 0.6359, 'learning_rate': 1.6994757597986922e-05, 'epoch': 0.55} {'loss': 0.4819, 'learning_rate': 1.699451748548377e-05, 'epoch': 0.55} {'loss': 0.4889, 'learning_rate': 1.6994277365085144e-05, 'epoch': 0.55} {'loss': 0.3815, 'learning_rate': 1.6994037236791304e-05, 'epoch': 0.55} {'loss': 0.4932, 'learning_rate': 1.6993797100602525e-05, 'epoch': 0.55} {'loss': 0.6933, 'learning_rate': 1.6993556956519083e-05, 'epoch': 0.55} {'loss': 0.5495, 'learning_rate': 1.6993316804541244e-05, 'epoch': 0.55} {'loss': 0.6034, 'learning_rate': 1.699307664466928e-05, 'epoch': 0.55} {'loss': 0.655, 'learning_rate': 1.699283647690346e-05, 'epoch': 0.55} {'loss': 0.6588, 'learning_rate': 1.699259630124406e-05, 'epoch': 0.55} {'loss': 0.5965, 'learning_rate': 1.6992356117691345e-05, 'epoch': 0.55} {'loss': 0.4752, 'learning_rate': 1.6992115926245595e-05, 'epoch': 0.55} {'loss': 0.5129, 'learning_rate': 1.699187572690707e-05, 'epoch': 0.55} {'loss': 0.5511, 'learning_rate': 1.6991635519676052e-05, 'epoch': 0.55} {'loss': 0.5703, 'learning_rate': 1.6991395304552805e-05, 'epoch': 0.55} {'loss': 0.5345, 'learning_rate': 1.6991155081537602e-05, 'epoch': 0.55} {'loss': 0.4337, 'learning_rate': 1.699091485063071e-05, 'epoch': 0.55} {'loss': 0.5749, 'learning_rate': 1.699067461183241e-05, 'epoch': 0.55} {'loss': 0.5215, 'learning_rate': 1.699043436514297e-05, 'epoch': 0.55} {'loss': 0.5772, 'learning_rate': 1.6990194110562654e-05, 'epoch': 0.55} {'loss': 0.4765, 'learning_rate': 1.698995384809174e-05, 'epoch': 0.55} {'loss': 0.6063, 'learning_rate': 1.6989713577730497e-05, 'epoch': 0.55} {'loss': 0.6225, 'learning_rate': 1.6989473299479198e-05, 'epoch': 0.55} {'loss': 0.6959, 'learning_rate': 1.698923301333811e-05, 'epoch': 0.55} {'loss': 0.6933, 'learning_rate': 1.698899271930751e-05, 'epoch': 0.55} {'loss': 0.6075, 'learning_rate': 1.6988752417387663e-05, 'epoch': 0.55} {'loss': 0.4568, 'learning_rate': 1.6988512107578844e-05, 'epoch': 0.55} {'loss': 0.7263, 'learning_rate': 1.6988271789881326e-05, 'epoch': 0.55} {'loss': 0.5491, 'learning_rate': 1.6988031464295373e-05, 'epoch': 0.55} {'loss': 0.7124, 'learning_rate': 1.6987791130821266e-05, 'epoch': 0.55} {'loss': 0.4141, 'learning_rate': 1.698755078945927e-05, 'epoch': 0.55} {'loss': 0.4664, 'learning_rate': 1.698731044020966e-05, 'epoch': 0.55} {'loss': 0.5334, 'learning_rate': 1.6987070083072702e-05, 'epoch': 0.55} {'loss': 0.4624, 'learning_rate': 1.6986829718048675e-05, 'epoch': 0.55} {'loss': 0.7627, 'learning_rate': 1.6986589345137843e-05, 'epoch': 0.55} {'loss': 0.7514, 'learning_rate': 1.6986348964340476e-05, 'epoch': 0.55} {'loss': 0.629, 'learning_rate': 1.6986108575656857e-05, 'epoch': 0.55} {'loss': 0.3943, 'learning_rate': 1.6985868179087246e-05, 'epoch': 0.55} {'loss': 0.6571, 'learning_rate': 1.698562777463192e-05, 'epoch': 0.55} {'loss': 0.5456, 'learning_rate': 1.698538736229115e-05, 'epoch': 0.55} {'loss': 0.6943, 'learning_rate': 1.69851469420652e-05, 'epoch': 0.55} {'loss': 0.6843, 'learning_rate': 1.698490651395435e-05, 'epoch': 0.55} {'loss': 0.7422, 'learning_rate': 1.698466607795887e-05, 'epoch': 0.55} {'loss': 0.5851, 'learning_rate': 1.698442563407903e-05, 'epoch': 0.55} {'loss': 0.5224, 'learning_rate': 1.6984185182315102e-05, 'epoch': 0.55} {'loss': 0.6808, 'learning_rate': 1.6983944722667357e-05, 'epoch': 0.55} {'loss': 0.4653, 'learning_rate': 1.6983704255136067e-05, 'epoch': 0.55} {'loss': 0.519, 'learning_rate': 1.6983463779721502e-05, 'epoch': 0.55} {'loss': 0.5065, 'learning_rate': 1.6983223296423933e-05, 'epoch': 0.55} {'loss': 0.4828, 'learning_rate': 1.6982982805243632e-05, 'epoch': 0.55} {'loss': 0.4813, 'learning_rate': 1.6982742306180876e-05, 'epoch': 0.55} {'loss': 0.603, 'learning_rate': 1.698250179923593e-05, 'epoch': 0.55} {'loss': 0.6595, 'learning_rate': 1.6982261284409064e-05, 'epoch': 0.55} {'loss': 0.5842, 'learning_rate': 1.6982020761700553e-05, 'epoch': 0.55} {'loss': 0.6495, 'learning_rate': 1.6981780231110672e-05, 'epoch': 0.55} {'loss': 0.5281, 'learning_rate': 1.6981539692639688e-05, 'epoch': 0.55} {'loss': 0.5431, 'learning_rate': 1.6981299146287872e-05, 'epoch': 0.55} {'loss': 0.5529, 'learning_rate': 1.69810585920555e-05, 'epoch': 0.55} {'loss': 0.5274, 'learning_rate': 1.6980818029942836e-05, 'epoch': 0.55} {'loss': 0.5843, 'learning_rate': 1.6980577459950158e-05, 'epoch': 0.55} {'loss': 0.6503, 'learning_rate': 1.6980336882077732e-05, 'epoch': 0.55} {'loss': 0.5135, 'learning_rate': 1.698009629632584e-05, 'epoch': 0.55} {'loss': 0.5585, 'learning_rate': 1.6979855702694742e-05, 'epoch': 0.55} {'loss': 0.6478, 'learning_rate': 1.6979615101184713e-05, 'epoch': 0.55} {'loss': 0.555, 'learning_rate': 1.697937449179603e-05, 'epoch': 0.55} {'loss': 0.5819, 'learning_rate': 1.6979133874528956e-05, 'epoch': 0.55} {'loss': 0.6796, 'learning_rate': 1.6978893249383767e-05, 'epoch': 0.55} {'loss': 0.4434, 'learning_rate': 1.6978652616360742e-05, 'epoch': 0.55} {'loss': 0.4857, 'learning_rate': 1.6978411975460137e-05, 'epoch': 0.55} {'loss': 0.6958, 'learning_rate': 1.6978171326682234e-05, 'epoch': 0.55} {'loss': 0.5618, 'learning_rate': 1.6977930670027304e-05, 'epoch': 0.55} {'loss': 0.6075, 'learning_rate': 1.6977690005495615e-05, 'epoch': 0.55} {'loss': 0.5302, 'learning_rate': 1.6977449333087445e-05, 'epoch': 0.55} {'loss': 0.6401, 'learning_rate': 1.6977208652803057e-05, 'epoch': 0.55} {'loss': 0.453, 'learning_rate': 1.697696796464273e-05, 'epoch': 0.55} {'loss': 0.6829, 'learning_rate': 1.697672726860673e-05, 'epoch': 0.55} {'loss': 0.6825, 'learning_rate': 1.6976486564695335e-05, 'epoch': 0.55} {'loss': 0.4453, 'learning_rate': 1.6976245852908813e-05, 'epoch': 0.55} {'loss': 0.5486, 'learning_rate': 1.6976005133247432e-05, 'epoch': 0.55} {'loss': 0.7411, 'learning_rate': 1.697576440571147e-05, 'epoch': 0.55} {'loss': 0.6612, 'learning_rate': 1.69755236703012e-05, 'epoch': 0.55} {'loss': 0.6096, 'learning_rate': 1.6975282927016887e-05, 'epoch': 0.55} {'loss': 0.561, 'learning_rate': 1.6975042175858806e-05, 'epoch': 0.55} {'loss': 0.6631, 'learning_rate': 1.6974801416827232e-05, 'epoch': 0.55} {'loss': 0.5764, 'learning_rate': 1.697456064992243e-05, 'epoch': 0.55} {'loss': 0.6283, 'learning_rate': 1.6974319875144676e-05, 'epoch': 0.56} {'loss': 0.5664, 'learning_rate': 1.697407909249424e-05, 'epoch': 0.56} {'loss': 0.635, 'learning_rate': 1.6973838301971393e-05, 'epoch': 0.56} {'loss': 0.5173, 'learning_rate': 1.6973597503576416e-05, 'epoch': 0.56} {'loss': 0.4994, 'learning_rate': 1.697335669730957e-05, 'epoch': 0.56} {'loss': 0.6507, 'learning_rate': 1.6973115883171126e-05, 'epoch': 0.56} {'loss': 0.6443, 'learning_rate': 1.6972875061161366e-05, 'epoch': 0.56} {'loss': 0.5764, 'learning_rate': 1.697263423128055e-05, 'epoch': 0.56} {'loss': 0.4957, 'learning_rate': 1.697239339352896e-05, 'epoch': 0.56} {'loss': 0.6854, 'learning_rate': 1.6972152547906865e-05, 'epoch': 0.56} {'loss': 0.5794, 'learning_rate': 1.6971911694414533e-05, 'epoch': 0.56} {'loss': 0.6287, 'learning_rate': 1.697167083305224e-05, 'epoch': 0.56} {'loss': 0.5957, 'learning_rate': 1.6971429963820255e-05, 'epoch': 0.56} {'loss': 0.6524, 'learning_rate': 1.697118908671885e-05, 'epoch': 0.56} {'loss': 0.6374, 'learning_rate': 1.69709482017483e-05, 'epoch': 0.56} {'loss': 0.6339, 'learning_rate': 1.6970707308908876e-05, 'epoch': 0.56} {'loss': 0.5865, 'learning_rate': 1.697046640820085e-05, 'epoch': 0.56} {'loss': 0.6645, 'learning_rate': 1.6970225499624492e-05, 'epoch': 0.56} {'loss': 0.543, 'learning_rate': 1.696998458318007e-05, 'epoch': 0.56} {'loss': 0.5994, 'learning_rate': 1.6969743658867867e-05, 'epoch': 0.56} {'loss': 0.726, 'learning_rate': 1.6969502726688145e-05, 'epoch': 0.56} {'loss': 0.524, 'learning_rate': 1.6969261786641182e-05, 'epoch': 0.56} {'loss': 0.5692, 'learning_rate': 1.6969020838727245e-05, 'epoch': 0.56} {'loss': 0.5329, 'learning_rate': 1.696877988294661e-05, 'epoch': 0.56} {'loss': 0.577, 'learning_rate': 1.6968538919299548e-05, 'epoch': 0.56} {'loss': 0.6836, 'learning_rate': 1.6968297947786334e-05, 'epoch': 0.56} {'loss': 0.5306, 'learning_rate': 1.6968056968407233e-05, 'epoch': 0.56} {'loss': 0.6072, 'learning_rate': 1.696781598116252e-05, 'epoch': 0.56} {'loss': 0.5347, 'learning_rate': 1.696757498605247e-05, 'epoch': 0.56} {'loss': 0.6569, 'learning_rate': 1.696733398307735e-05, 'epoch': 0.56} {'loss': 0.5975, 'learning_rate': 1.6967092972237438e-05, 'epoch': 0.56} {'loss': 0.5166, 'learning_rate': 1.6966851953533003e-05, 'epoch': 0.56} {'loss': 0.5541, 'learning_rate': 1.6966610926964314e-05, 'epoch': 0.56} {'loss': 0.6128, 'learning_rate': 1.696636989253165e-05, 'epoch': 0.56} {'loss': 0.7202, 'learning_rate': 1.6966128850235274e-05, 'epoch': 0.56} {'loss': 0.5715, 'learning_rate': 1.6965887800075468e-05, 'epoch': 0.56} {'loss': 0.5167, 'learning_rate': 1.6965646742052495e-05, 'epoch': 0.56} {'loss': 0.6722, 'learning_rate': 1.6965405676166634e-05, 'epoch': 0.56} {'loss': 0.6446, 'learning_rate': 1.6965164602418153e-05, 'epoch': 0.56} {'loss': 0.57, 'learning_rate': 1.696492352080733e-05, 'epoch': 0.56} {'loss': 0.6118, 'learning_rate': 1.6964682431334426e-05, 'epoch': 0.56} {'loss': 0.6016, 'learning_rate': 1.6964441333999726e-05, 'epoch': 0.56} {'loss': 0.6176, 'learning_rate': 1.6964200228803493e-05, 'epoch': 0.56} {'loss': 0.5872, 'learning_rate': 1.6963959115746002e-05, 'epoch': 0.56} {'loss': 0.7081, 'learning_rate': 1.6963717994827526e-05, 'epoch': 0.56} {'loss': 0.5155, 'learning_rate': 1.6963476866048338e-05, 'epoch': 0.56} {'loss': 0.5073, 'learning_rate': 1.696323572940871e-05, 'epoch': 0.56} {'loss': 0.587, 'learning_rate': 1.696299458490891e-05, 'epoch': 0.56} {'loss': 0.653, 'learning_rate': 1.6962753432549214e-05, 'epoch': 0.56} {'loss': 0.6343, 'learning_rate': 1.6962512272329893e-05, 'epoch': 0.56} {'loss': 0.5808, 'learning_rate': 1.696227110425122e-05, 'epoch': 0.56} {'loss': 0.4264, 'learning_rate': 1.6962029928313467e-05, 'epoch': 0.56} {'loss': 0.5227, 'learning_rate': 1.6961788744516903e-05, 'epoch': 0.56} {'loss': 0.6999, 'learning_rate': 1.696154755286181e-05, 'epoch': 0.56} {'loss': 0.501, 'learning_rate': 1.6961306353348447e-05, 'epoch': 0.56} {'loss': 0.5565, 'learning_rate': 1.6961065145977096e-05, 'epoch': 0.56} {'loss': 0.3476, 'learning_rate': 1.6960823930748024e-05, 'epoch': 0.56} {'loss': 0.5054, 'learning_rate': 1.6960582707661508e-05, 'epoch': 0.56} {'loss': 0.587, 'learning_rate': 1.6960341476717817e-05, 'epoch': 0.56} {'loss': 0.5778, 'learning_rate': 1.6960100237917224e-05, 'epoch': 0.56} {'loss': 0.6148, 'learning_rate': 1.6959858991260004e-05, 'epoch': 0.56} {'loss': 0.5512, 'learning_rate': 1.6959617736746424e-05, 'epoch': 0.56} {'loss': 0.7643, 'learning_rate': 1.6959376474376757e-05, 'epoch': 0.56} {'loss': 0.7354, 'learning_rate': 1.695913520415128e-05, 'epoch': 0.56} {'loss': 0.5536, 'learning_rate': 1.695889392607026e-05, 'epoch': 0.56} {'loss': 0.5325, 'learning_rate': 1.6958652640133975e-05, 'epoch': 0.56} {'loss': 0.6119, 'learning_rate': 1.6958411346342692e-05, 'epoch': 0.56} {'loss': 0.4768, 'learning_rate': 1.695817004469669e-05, 'epoch': 0.56} {'loss': 0.6099, 'learning_rate': 1.6957928735196232e-05, 'epoch': 0.56} {'loss': 0.6811, 'learning_rate': 1.6957687417841597e-05, 'epoch': 0.56} {'loss': 0.4549, 'learning_rate': 1.695744609263306e-05, 'epoch': 0.56} {'loss': 0.632, 'learning_rate': 1.6957204759570885e-05, 'epoch': 0.56} {'loss': 0.4915, 'learning_rate': 1.695696341865535e-05, 'epoch': 0.56} {'loss': 0.5681, 'learning_rate': 1.6956722069886727e-05, 'epoch': 0.56} {'loss': 0.7164, 'learning_rate': 1.6956480713265287e-05, 'epoch': 0.56} {'loss': 0.5463, 'learning_rate': 1.6956239348791304e-05, 'epoch': 0.56} {'loss': 0.3497, 'learning_rate': 1.6955997976465047e-05, 'epoch': 0.56} {'loss': 0.5968, 'learning_rate': 1.6955756596286794e-05, 'epoch': 0.56} {'loss': 0.5127, 'learning_rate': 1.6955515208256814e-05, 'epoch': 0.56} {'loss': 0.5561, 'learning_rate': 1.6955273812375377e-05, 'epoch': 0.56} {'loss': 0.6904, 'learning_rate': 1.6955032408642762e-05, 'epoch': 0.56} {'loss': 0.648, 'learning_rate': 1.6954790997059238e-05, 'epoch': 0.56} {'loss': 0.6192, 'learning_rate': 1.6954549577625075e-05, 'epoch': 0.56} {'loss': 0.6532, 'learning_rate': 1.6954308150340552e-05, 'epoch': 0.56} {'loss': 0.6448, 'learning_rate': 1.695406671520593e-05, 'epoch': 0.56} {'loss': 0.6003, 'learning_rate': 1.6953825272221497e-05, 'epoch': 0.56} {'loss': 0.5699, 'learning_rate': 1.6953583821387514e-05, 'epoch': 0.56} {'loss': 0.5586, 'learning_rate': 1.6953342362704255e-05, 'epoch': 0.56} {'loss': 0.6048, 'learning_rate': 1.6953100896172e-05, 'epoch': 0.56} {'loss': 0.5346, 'learning_rate': 1.6952859421791013e-05, 'epoch': 0.56} {'loss': 0.5179, 'learning_rate': 1.695261793956157e-05, 'epoch': 0.56} {'loss': 0.601, 'learning_rate': 1.6952376449483944e-05, 'epoch': 0.56} {'loss': 0.5126, 'learning_rate': 1.6952134951558408e-05, 'epoch': 0.56} {'loss': 0.5376, 'learning_rate': 1.695189344578523e-05, 'epoch': 0.56} {'loss': 0.5999, 'learning_rate': 1.695165193216469e-05, 'epoch': 0.56} {'loss': 0.5662, 'learning_rate': 1.6951410410697056e-05, 'epoch': 0.56} {'loss': 0.6055, 'learning_rate': 1.6951168881382604e-05, 'epoch': 0.56} {'loss': 0.5599, 'learning_rate': 1.69509273442216e-05, 'epoch': 0.56} {'loss': 0.6151, 'learning_rate': 1.695068579921432e-05, 'epoch': 0.56} {'loss': 0.5708, 'learning_rate': 1.695044424636104e-05, 'epoch': 0.56} {'loss': 0.4633, 'learning_rate': 1.6950202685662032e-05, 'epoch': 0.56} {'loss': 0.6473, 'learning_rate': 1.694996111711756e-05, 'epoch': 0.56} {'loss': 0.5972, 'learning_rate': 1.694971954072791e-05, 'epoch': 0.56} {'loss': 0.4196, 'learning_rate': 1.6949477956493346e-05, 'epoch': 0.56} {'loss': 0.6791, 'learning_rate': 1.6949236364414145e-05, 'epoch': 0.56} {'loss': 0.5593, 'learning_rate': 1.6948994764490576e-05, 'epoch': 0.56} {'loss': 0.7435, 'learning_rate': 1.6948753156722912e-05, 'epoch': 0.56} {'loss': 0.3795, 'learning_rate': 1.694851154111143e-05, 'epoch': 0.56} {'loss': 0.4769, 'learning_rate': 1.6948269917656396e-05, 'epoch': 0.56} {'loss': 0.6494, 'learning_rate': 1.694802828635809e-05, 'epoch': 0.56} {'loss': 0.7434, 'learning_rate': 1.694778664721678e-05, 'epoch': 0.56} {'loss': 0.6124, 'learning_rate': 1.694754500023274e-05, 'epoch': 0.56} {'loss': 0.658, 'learning_rate': 1.694730334540624e-05, 'epoch': 0.56} {'loss': 0.6022, 'learning_rate': 1.694706168273756e-05, 'epoch': 0.56} {'loss': 0.5966, 'learning_rate': 1.6946820012226964e-05, 'epoch': 0.56} {'loss': 0.551, 'learning_rate': 1.6946578333874734e-05, 'epoch': 0.56} {'loss': 0.6437, 'learning_rate': 1.6946336647681137e-05, 'epoch': 0.56} {'loss': 0.5636, 'learning_rate': 1.6946094953646444e-05, 'epoch': 0.56} {'loss': 0.6424, 'learning_rate': 1.6945853251770933e-05, 'epoch': 0.56} {'loss': 0.5469, 'learning_rate': 1.6945611542054875e-05, 'epoch': 0.56} {'loss': 0.6367, 'learning_rate': 1.6945369824498538e-05, 'epoch': 0.56} {'loss': 0.5353, 'learning_rate': 1.6945128099102202e-05, 'epoch': 0.56} {'loss': 0.6874, 'learning_rate': 1.694488636586614e-05, 'epoch': 0.56} {'loss': 0.6221, 'learning_rate': 1.694464462479062e-05, 'epoch': 0.56} {'loss': 0.4783, 'learning_rate': 1.6944402875875915e-05, 'epoch': 0.56} {'loss': 0.7046, 'learning_rate': 1.69441611191223e-05, 'epoch': 0.56} {'loss': 0.6168, 'learning_rate': 1.694391935453005e-05, 'epoch': 0.56} {'loss': 0.5562, 'learning_rate': 1.6943677582099434e-05, 'epoch': 0.56} {'loss': 0.6137, 'learning_rate': 1.6943435801830726e-05, 'epoch': 0.56} {'loss': 0.5912, 'learning_rate': 1.69431940137242e-05, 'epoch': 0.56} {'loss': 0.619, 'learning_rate': 1.6942952217780125e-05, 'epoch': 0.56} {'loss': 0.5122, 'learning_rate': 1.694271041399878e-05, 'epoch': 0.56} {'loss': 0.3424, 'learning_rate': 1.694246860238044e-05, 'epoch': 0.56} {'loss': 0.4974, 'learning_rate': 1.6942226782925367e-05, 'epoch': 0.56} {'loss': 0.5863, 'learning_rate': 1.694198495563384e-05, 'epoch': 0.56} {'loss': 0.7837, 'learning_rate': 1.6941743120506132e-05, 'epoch': 0.56} {'loss': 0.5352, 'learning_rate': 1.6941501277542522e-05, 'epoch': 0.56} {'loss': 0.7176, 'learning_rate': 1.694125942674327e-05, 'epoch': 0.56} {'loss': 0.5282, 'learning_rate': 1.694101756810866e-05, 'epoch': 0.56} {'loss': 0.6202, 'learning_rate': 1.694077570163896e-05, 'epoch': 0.56} {'loss': 0.673, 'learning_rate': 1.6940533827334446e-05, 'epoch': 0.56} {'loss': 0.4239, 'learning_rate': 1.6940291945195385e-05, 'epoch': 0.56} {'loss': 0.6208, 'learning_rate': 1.6940050055222056e-05, 'epoch': 0.56} {'loss': 0.5655, 'learning_rate': 1.693980815741473e-05, 'epoch': 0.56} {'loss': 0.5242, 'learning_rate': 1.693956625177368e-05, 'epoch': 0.56} {'loss': 0.6261, 'learning_rate': 1.693932433829918e-05, 'epoch': 0.56} {'loss': 0.5821, 'learning_rate': 1.69390824169915e-05, 'epoch': 0.56} {'loss': 0.5525, 'learning_rate': 1.693884048785092e-05, 'epoch': 0.56} {'loss': 0.6151, 'learning_rate': 1.6938598550877708e-05, 'epoch': 0.56} {'loss': 0.6364, 'learning_rate': 1.6938356606072135e-05, 'epoch': 0.56} {'loss': 0.5522, 'learning_rate': 1.6938114653434478e-05, 'epoch': 0.56} {'loss': 0.4168, 'learning_rate': 1.6937872692965006e-05, 'epoch': 0.56} {'loss': 0.5226, 'learning_rate': 1.6937630724664e-05, 'epoch': 0.56} {'loss': 0.6627, 'learning_rate': 1.6937388748531725e-05, 'epoch': 0.56} {'loss': 0.4936, 'learning_rate': 1.693714676456846e-05, 'epoch': 0.56} {'loss': 0.7161, 'learning_rate': 1.693690477277447e-05, 'epoch': 0.56} {'loss': 0.6192, 'learning_rate': 1.693666277315004e-05, 'epoch': 0.56} {'loss': 0.7307, 'learning_rate': 1.6936420765695434e-05, 'epoch': 0.56} {'loss': 0.5955, 'learning_rate': 1.693617875041093e-05, 'epoch': 0.56} {'loss': 0.6676, 'learning_rate': 1.6935936727296797e-05, 'epoch': 0.56} {'loss': 0.7035, 'learning_rate': 1.693569469635331e-05, 'epoch': 0.56} {'loss': 0.6313, 'learning_rate': 1.6935452657580743e-05, 'epoch': 0.56} {'loss': 0.5814, 'learning_rate': 1.6935210610979367e-05, 'epoch': 0.56} {'loss': 0.5819, 'learning_rate': 1.693496855654946e-05, 'epoch': 0.56} {'loss': 0.6811, 'learning_rate': 1.693472649429129e-05, 'epoch': 0.56} {'loss': 0.5385, 'learning_rate': 1.6934484424205137e-05, 'epoch': 0.56} {'loss': 0.4699, 'learning_rate': 1.6934242346291266e-05, 'epoch': 0.56} {'loss': 0.4793, 'learning_rate': 1.693400026054995e-05, 'epoch': 0.56} {'loss': 0.5632, 'learning_rate': 1.6933758166981472e-05, 'epoch': 0.56} {'loss': 0.6498, 'learning_rate': 1.69335160655861e-05, 'epoch': 0.56} {'loss': 0.6579, 'learning_rate': 1.6933273956364103e-05, 'epoch': 0.56} {'loss': 0.5812, 'learning_rate': 1.6933031839315762e-05, 'epoch': 0.56} {'loss': 0.4889, 'learning_rate': 1.6932789714441345e-05, 'epoch': 0.56} {'loss': 0.5932, 'learning_rate': 1.6932547581741127e-05, 'epoch': 0.56} {'loss': 0.6676, 'learning_rate': 1.693230544121538e-05, 'epoch': 0.56} {'loss': 0.617, 'learning_rate': 1.6932063292864378e-05, 'epoch': 0.56} {'loss': 0.5891, 'learning_rate': 1.6931821136688397e-05, 'epoch': 0.56} {'loss': 0.5425, 'learning_rate': 1.6931578972687705e-05, 'epoch': 0.56} {'loss': 0.5723, 'learning_rate': 1.693133680086258e-05, 'epoch': 0.56} {'loss': 0.5365, 'learning_rate': 1.6931094621213294e-05, 'epoch': 0.56} {'loss': 0.5104, 'learning_rate': 1.693085243374012e-05, 'epoch': 0.56} {'loss': 0.5223, 'learning_rate': 1.693061023844333e-05, 'epoch': 0.56} {'loss': 0.6219, 'learning_rate': 1.69303680353232e-05, 'epoch': 0.56} {'loss': 0.6073, 'learning_rate': 1.6930125824380007e-05, 'epoch': 0.56} {'loss': 0.7046, 'learning_rate': 1.6929883605614014e-05, 'epoch': 0.56} {'loss': 0.4355, 'learning_rate': 1.6929641379025502e-05, 'epoch': 0.56} {'loss': 0.6813, 'learning_rate': 1.6929399144614743e-05, 'epoch': 0.56} {'loss': 0.5704, 'learning_rate': 1.692915690238201e-05, 'epoch': 0.56} {'loss': 0.6049, 'learning_rate': 1.6928914652327576e-05, 'epoch': 0.56} {'loss': 0.5775, 'learning_rate': 1.6928672394451717e-05, 'epoch': 0.56} {'loss': 0.6038, 'learning_rate': 1.69284301287547e-05, 'epoch': 0.56} {'loss': 0.5122, 'learning_rate': 1.6928187855236803e-05, 'epoch': 0.56} {'loss': 0.4808, 'learning_rate': 1.6927945573898304e-05, 'epoch': 0.56} {'loss': 0.685, 'learning_rate': 1.692770328473947e-05, 'epoch': 0.56} {'loss': 0.4975, 'learning_rate': 1.6927460987760574e-05, 'epoch': 0.56} {'loss': 0.556, 'learning_rate': 1.6927218682961895e-05, 'epoch': 0.56} {'loss': 0.71, 'learning_rate': 1.6926976370343703e-05, 'epoch': 0.56} {'loss': 0.6693, 'learning_rate': 1.692673404990627e-05, 'epoch': 0.56} {'loss': 0.4989, 'learning_rate': 1.6926491721649872e-05, 'epoch': 0.56} {'loss': 0.6971, 'learning_rate': 1.6926249385574786e-05, 'epoch': 0.56} {'loss': 0.633, 'learning_rate': 1.6926007041681278e-05, 'epoch': 0.56} {'loss': 0.48, 'learning_rate': 1.692576468996962e-05, 'epoch': 0.56} {'loss': 0.6126, 'learning_rate': 1.6925522330440098e-05, 'epoch': 0.56} {'loss': 0.5533, 'learning_rate': 1.6925279963092976e-05, 'epoch': 0.56} {'loss': 0.7424, 'learning_rate': 1.692503758792853e-05, 'epoch': 0.56} {'loss': 0.7225, 'learning_rate': 1.6924795204947032e-05, 'epoch': 0.56} {'loss': 0.4756, 'learning_rate': 1.692455281414876e-05, 'epoch': 0.56} {'loss': 0.4864, 'learning_rate': 1.692431041553398e-05, 'epoch': 0.56} {'loss': 0.5631, 'learning_rate': 1.6924068009102974e-05, 'epoch': 0.56} {'loss': 0.5948, 'learning_rate': 1.6923825594856013e-05, 'epoch': 0.56} {'loss': 0.664, 'learning_rate': 1.6923583172793368e-05, 'epoch': 0.56} {'loss': 0.6451, 'learning_rate': 1.6923340742915312e-05, 'epoch': 0.56} {'loss': 0.6386, 'learning_rate': 1.6923098305222124e-05, 'epoch': 0.56} {'loss': 0.6977, 'learning_rate': 1.692285585971407e-05, 'epoch': 0.56} {'loss': 0.7115, 'learning_rate': 1.6922613406391434e-05, 'epoch': 0.56} {'loss': 0.5795, 'learning_rate': 1.692237094525448e-05, 'epoch': 0.56} {'loss': 0.5426, 'learning_rate': 1.6922128476303487e-05, 'epoch': 0.56} {'loss': 0.6084, 'learning_rate': 1.6921885999538726e-05, 'epoch': 0.56} {'loss': 0.5578, 'learning_rate': 1.6921643514960472e-05, 'epoch': 0.56} {'loss': 0.4943, 'learning_rate': 1.6921401022569003e-05, 'epoch': 0.56} {'loss': 0.655, 'learning_rate': 1.6921158522364583e-05, 'epoch': 0.56} {'loss': 0.6199, 'learning_rate': 1.6920916014347494e-05, 'epoch': 0.56} {'loss': 0.4852, 'learning_rate': 1.6920673498518007e-05, 'epoch': 0.56} {'loss': 0.7847, 'learning_rate': 1.6920430974876393e-05, 'epoch': 0.56} {'loss': 0.7692, 'learning_rate': 1.692018844342293e-05, 'epoch': 0.56} {'loss': 0.5002, 'learning_rate': 1.691994590415789e-05, 'epoch': 0.56} {'loss': 0.6021, 'learning_rate': 1.6919703357081547e-05, 'epoch': 0.56} {'loss': 0.7539, 'learning_rate': 1.6919460802194178e-05, 'epoch': 0.56} {'loss': 0.5772, 'learning_rate': 1.691921823949605e-05, 'epoch': 0.56} {'loss': 0.5562, 'learning_rate': 1.691897566898744e-05, 'epoch': 0.56} {'loss': 0.5332, 'learning_rate': 1.691873309066862e-05, 'epoch': 0.56} {'loss': 0.5979, 'learning_rate': 1.691849050453987e-05, 'epoch': 0.56} {'loss': 0.5564, 'learning_rate': 1.691824791060146e-05, 'epoch': 0.56} {'loss': 0.4866, 'learning_rate': 1.691800530885366e-05, 'epoch': 0.56} {'loss': 0.4392, 'learning_rate': 1.6917762699296752e-05, 'epoch': 0.56} {'loss': 0.6409, 'learning_rate': 1.6917520081931003e-05, 'epoch': 0.56} {'loss': 0.5865, 'learning_rate': 1.691727745675669e-05, 'epoch': 0.56} {'loss': 0.6169, 'learning_rate': 1.6917034823774087e-05, 'epoch': 0.56} {'loss': 0.5625, 'learning_rate': 1.6916792182983462e-05, 'epoch': 0.56} {'loss': 0.679, 'learning_rate': 1.69165495343851e-05, 'epoch': 0.56} {'loss': 0.7457, 'learning_rate': 1.6916306877979268e-05, 'epoch': 0.56} {'loss': 0.6792, 'learning_rate': 1.691606421376624e-05, 'epoch': 0.56} {'loss': 0.5726, 'learning_rate': 1.691582154174629e-05, 'epoch': 0.56} {'loss': 0.6271, 'learning_rate': 1.691557886191969e-05, 'epoch': 0.56} {'loss': 0.6968, 'learning_rate': 1.691533617428672e-05, 'epoch': 0.56} {'loss': 0.4883, 'learning_rate': 1.691509347884765e-05, 'epoch': 0.56} {'loss': 0.5512, 'learning_rate': 1.6914850775602753e-05, 'epoch': 0.56} {'loss': 0.6823, 'learning_rate': 1.6914608064552307e-05, 'epoch': 0.56} {'loss': 0.6564, 'learning_rate': 1.691436534569658e-05, 'epoch': 0.56} {'loss': 0.6482, 'learning_rate': 1.6914122619035854e-05, 'epoch': 0.56} {'loss': 0.5116, 'learning_rate': 1.6913879884570395e-05, 'epoch': 0.56} {'loss': 0.654, 'learning_rate': 1.691363714230048e-05, 'epoch': 0.56} {'loss': 0.6527, 'learning_rate': 1.6913394392226385e-05, 'epoch': 0.56} {'loss': 0.6245, 'learning_rate': 1.691315163434838e-05, 'epoch': 0.56} {'loss': 0.5918, 'learning_rate': 1.6912908868666745e-05, 'epoch': 0.56} {'loss': 0.6705, 'learning_rate': 1.6912666095181748e-05, 'epoch': 0.56} {'loss': 0.4885, 'learning_rate': 1.6912423313893663e-05, 'epoch': 0.56} {'loss': 0.4574, 'learning_rate': 1.6912180524802772e-05, 'epoch': 0.56} {'loss': 0.5107, 'learning_rate': 1.691193772790934e-05, 'epoch': 0.56} {'loss': 0.7033, 'learning_rate': 1.6911694923213647e-05, 'epoch': 0.56} {'loss': 0.5978, 'learning_rate': 1.6911452110715962e-05, 'epoch': 0.56} {'loss': 0.448, 'learning_rate': 1.6911209290416565e-05, 'epoch': 0.56} {'loss': 0.7463, 'learning_rate': 1.6910966462315724e-05, 'epoch': 0.56} {'loss': 0.5568, 'learning_rate': 1.6910723626413716e-05, 'epoch': 0.56} {'loss': 0.6359, 'learning_rate': 1.6910480782710816e-05, 'epoch': 0.56} {'loss': 0.5554, 'learning_rate': 1.69102379312073e-05, 'epoch': 0.56} {'loss': 0.7974, 'learning_rate': 1.6909995071903433e-05, 'epoch': 0.56} {'loss': 0.6076, 'learning_rate': 1.6909752204799503e-05, 'epoch': 0.56} {'loss': 0.7545, 'learning_rate': 1.690950932989577e-05, 'epoch': 0.56} {'loss': 0.6219, 'learning_rate': 1.690926644719252e-05, 'epoch': 0.56} {'loss': 0.5914, 'learning_rate': 1.6909023556690022e-05, 'epoch': 0.56} {'loss': 0.5027, 'learning_rate': 1.6908780658388547e-05, 'epoch': 0.56} {'loss': 0.5783, 'learning_rate': 1.6908537752288375e-05, 'epoch': 0.56} {'loss': 0.6515, 'learning_rate': 1.6908294838389775e-05, 'epoch': 0.56} {'loss': 0.6093, 'learning_rate': 1.6908051916693026e-05, 'epoch': 0.56} {'loss': 0.6797, 'learning_rate': 1.69078089871984e-05, 'epoch': 0.56} {'loss': 0.5445, 'learning_rate': 1.690756604990617e-05, 'epoch': 0.56} {'loss': 0.6261, 'learning_rate': 1.690732310481661e-05, 'epoch': 0.56} {'loss': 0.5689, 'learning_rate': 1.6907080151929997e-05, 'epoch': 0.56} {'loss': 0.6248, 'learning_rate': 1.690683719124661e-05, 'epoch': 0.56} {'loss': 0.5129, 'learning_rate': 1.690659422276671e-05, 'epoch': 0.56} {'loss': 0.7181, 'learning_rate': 1.6906351246490576e-05, 'epoch': 0.56} {'loss': 0.6638, 'learning_rate': 1.6906108262418494e-05, 'epoch': 0.56} {'loss': 0.6268, 'learning_rate': 1.6905865270550724e-05, 'epoch': 0.56} {'loss': 0.7012, 'learning_rate': 1.6905622270887547e-05, 'epoch': 0.56} {'loss': 0.5749, 'learning_rate': 1.690537926342923e-05, 'epoch': 0.56} {'loss': 0.4694, 'learning_rate': 1.6905136248176056e-05, 'epoch': 0.56} {'loss': 0.5808, 'learning_rate': 1.69048932251283e-05, 'epoch': 0.56} {'loss': 0.7386, 'learning_rate': 1.6904650194286228e-05, 'epoch': 0.56} {'loss': 0.6221, 'learning_rate': 1.6904407155650123e-05, 'epoch': 0.56} {'loss': 0.6322, 'learning_rate': 1.690416410922025e-05, 'epoch': 0.56} {'loss': 0.5985, 'learning_rate': 1.6903921054996894e-05, 'epoch': 0.56} {'loss': 0.6106, 'learning_rate': 1.690367799298032e-05, 'epoch': 0.56} {'loss': 0.4989, 'learning_rate': 1.690343492317081e-05, 'epoch': 0.56} {'loss': 0.8096, 'learning_rate': 1.690319184556863e-05, 'epoch': 0.56} {'loss': 0.4938, 'learning_rate': 1.6902948760174064e-05, 'epoch': 0.56} {'loss': 0.7061, 'learning_rate': 1.6902705666987377e-05, 'epoch': 0.56} {'loss': 0.6355, 'learning_rate': 1.690246256600885e-05, 'epoch': 0.56} {'loss': 0.553, 'learning_rate': 1.6902219457238757e-05, 'epoch': 0.56} {'loss': 0.5229, 'learning_rate': 1.690197634067737e-05, 'epoch': 0.56} {'loss': 0.4457, 'learning_rate': 1.690173321632496e-05, 'epoch': 0.56} {'loss': 0.5146, 'learning_rate': 1.690149008418181e-05, 'epoch': 0.56} {'loss': 0.6672, 'learning_rate': 1.6901246944248192e-05, 'epoch': 0.56} {'loss': 0.5982, 'learning_rate': 1.6901003796524374e-05, 'epoch': 0.56} {'loss': 0.5396, 'learning_rate': 1.6900760641010638e-05, 'epoch': 0.56} {'loss': 0.6658, 'learning_rate': 1.690051747770725e-05, 'epoch': 0.56} {'loss': 0.6278, 'learning_rate': 1.6900274306614496e-05, 'epoch': 0.56} {'loss': 0.4862, 'learning_rate': 1.6900031127732642e-05, 'epoch': 0.56} {'loss': 0.6072, 'learning_rate': 1.6899787941061968e-05, 'epoch': 0.56} {'loss': 0.5476, 'learning_rate': 1.689954474660274e-05, 'epoch': 0.56} {'loss': 0.7232, 'learning_rate': 1.6899301544355243e-05, 'epoch': 0.56} {'loss': 0.6166, 'learning_rate': 1.689905833431974e-05, 'epoch': 0.56} {'loss': 0.5901, 'learning_rate': 1.689881511649652e-05, 'epoch': 0.56} {'loss': 0.542, 'learning_rate': 1.6898571890885847e-05, 'epoch': 0.56} {'loss': 0.5094, 'learning_rate': 1.6898328657487994e-05, 'epoch': 0.56} {'loss': 0.6349, 'learning_rate': 1.6898085416303245e-05, 'epoch': 0.56} {'loss': 0.5232, 'learning_rate': 1.6897842167331865e-05, 'epoch': 0.56} {'loss': 0.574, 'learning_rate': 1.6897598910574137e-05, 'epoch': 0.56} {'loss': 0.4856, 'learning_rate': 1.689735564603033e-05, 'epoch': 0.56} {'loss': 0.6008, 'learning_rate': 1.689711237370072e-05, 'epoch': 0.56} {'loss': 0.7567, 'learning_rate': 1.689686909358558e-05, 'epoch': 0.56} {'loss': 0.6303, 'learning_rate': 1.6896625805685188e-05, 'epoch': 0.56} {'loss': 0.6871, 'learning_rate': 1.689638250999982e-05, 'epoch': 0.56} {'loss': 0.622, 'learning_rate': 1.689613920652974e-05, 'epoch': 0.56} {'loss': 0.4691, 'learning_rate': 1.6895895895275236e-05, 'epoch': 0.56} {'loss': 0.7091, 'learning_rate': 1.6895652576236575e-05, 'epoch': 0.56} {'loss': 0.6374, 'learning_rate': 1.689540924941403e-05, 'epoch': 0.56} {'loss': 0.7987, 'learning_rate': 1.6895165914807887e-05, 'epoch': 0.56} {'loss': 0.7447, 'learning_rate': 1.6894922572418408e-05, 'epoch': 0.56} {'loss': 0.5782, 'learning_rate': 1.6894679222245872e-05, 'epoch': 0.56} {'loss': 0.5186, 'learning_rate': 1.6894435864290554e-05, 'epoch': 0.56} {'loss': 0.4526, 'learning_rate': 1.6894192498552734e-05, 'epoch': 0.56} {'loss': 0.5711, 'learning_rate': 1.689394912503268e-05, 'epoch': 0.56} {'loss': 0.6938, 'learning_rate': 1.6893705743730663e-05, 'epoch': 0.56} {'loss': 0.5361, 'learning_rate': 1.689346235464697e-05, 'epoch': 0.56} {'loss': 0.3451, 'learning_rate': 1.6893218957781863e-05, 'epoch': 0.56} {'loss': 0.6788, 'learning_rate': 1.6892975553135626e-05, 'epoch': 0.56} {'loss': 0.5969, 'learning_rate': 1.6892732140708526e-05, 'epoch': 0.56} {'loss': 0.603, 'learning_rate': 1.6892488720500847e-05, 'epoch': 0.56} {'loss': 0.5911, 'learning_rate': 1.6892245292512857e-05, 'epoch': 0.56} {'loss': 0.6172, 'learning_rate': 1.6892001856744834e-05, 'epoch': 0.56} {'loss': 0.6676, 'learning_rate': 1.6891758413197052e-05, 'epoch': 0.56} {'loss': 0.5497, 'learning_rate': 1.6891514961869782e-05, 'epoch': 0.56} {'loss': 0.6326, 'learning_rate': 1.6891271502763303e-05, 'epoch': 0.56} {'loss': 0.564, 'learning_rate': 1.689102803587789e-05, 'epoch': 0.56} {'loss': 0.566, 'learning_rate': 1.689078456121382e-05, 'epoch': 0.56} {'loss': 0.511, 'learning_rate': 1.689054107877136e-05, 'epoch': 0.56} {'loss': 0.5545, 'learning_rate': 1.689029758855079e-05, 'epoch': 0.56} {'loss': 0.6854, 'learning_rate': 1.6890054090552386e-05, 'epoch': 0.56} {'loss': 0.5506, 'learning_rate': 1.688981058477642e-05, 'epoch': 0.56} {'loss': 0.5994, 'learning_rate': 1.6889567071223167e-05, 'epoch': 0.56} {'loss': 0.5815, 'learning_rate': 1.6889323549892906e-05, 'epoch': 0.56} {'loss': 0.6756, 'learning_rate': 1.6889080020785903e-05, 'epoch': 0.56} {'loss': 0.5756, 'learning_rate': 1.6888836483902444e-05, 'epoch': 0.56} {'loss': 0.4697, 'learning_rate': 1.6888592939242795e-05, 'epoch': 0.56} {'loss': 0.6756, 'learning_rate': 1.6888349386807238e-05, 'epoch': 0.56} {'loss': 0.7231, 'learning_rate': 1.6888105826596043e-05, 'epoch': 0.56} {'loss': 0.6704, 'learning_rate': 1.6887862258609487e-05, 'epoch': 0.56} {'loss': 0.6222, 'learning_rate': 1.6887618682847845e-05, 'epoch': 0.56} {'loss': 0.6509, 'learning_rate': 1.688737509931139e-05, 'epoch': 0.56} {'loss': 0.5601, 'learning_rate': 1.6887131508000395e-05, 'epoch': 0.56} {'loss': 0.7658, 'learning_rate': 1.6886887908915142e-05, 'epoch': 0.56} {'loss': 0.4755, 'learning_rate': 1.6886644302055902e-05, 'epoch': 0.56} {'loss': 0.5677, 'learning_rate': 1.688640068742295e-05, 'epoch': 0.56} {'loss': 0.548, 'learning_rate': 1.688615706501656e-05, 'epoch': 0.56} {'loss': 0.424, 'learning_rate': 1.6885913434837007e-05, 'epoch': 0.56} {'loss': 0.5662, 'learning_rate': 1.688566979688457e-05, 'epoch': 0.56} {'loss': 0.6697, 'learning_rate': 1.6885426151159518e-05, 'epoch': 0.56} {'loss': 0.5921, 'learning_rate': 1.6885182497662132e-05, 'epoch': 0.56} {'loss': 0.5888, 'learning_rate': 1.6884938836392684e-05, 'epoch': 0.56} {'loss': 0.4699, 'learning_rate': 1.688469516735145e-05, 'epoch': 0.56} {'loss': 0.5603, 'learning_rate': 1.68844514905387e-05, 'epoch': 0.56} {'loss': 0.5063, 'learning_rate': 1.6884207805954718e-05, 'epoch': 0.56} {'loss': 0.456, 'learning_rate': 1.6883964113599774e-05, 'epoch': 0.56} {'loss': 0.6798, 'learning_rate': 1.6883720413474143e-05, 'epoch': 0.56} {'loss': 0.5911, 'learning_rate': 1.68834767055781e-05, 'epoch': 0.56} {'loss': 0.7308, 'learning_rate': 1.688323298991192e-05, 'epoch': 0.56} {'loss': 0.6595, 'learning_rate': 1.688298926647588e-05, 'epoch': 0.56} {'loss': 0.7579, 'learning_rate': 1.6882745535270257e-05, 'epoch': 0.56} {'loss': 0.5973, 'learning_rate': 1.6882501796295317e-05, 'epoch': 0.56} {'loss': 0.5243, 'learning_rate': 1.6882258049551344e-05, 'epoch': 0.56} {'loss': 0.6796, 'learning_rate': 1.6882014295038608e-05, 'epoch': 0.56} {'loss': 0.6083, 'learning_rate': 1.688177053275739e-05, 'epoch': 0.56} {'loss': 0.5459, 'learning_rate': 1.6881526762707963e-05, 'epoch': 0.56} {'loss': 0.5526, 'learning_rate': 1.6881282984890596e-05, 'epoch': 0.56} {'loss': 0.559, 'learning_rate': 1.6881039199305575e-05, 'epoch': 0.56} {'loss': 0.5956, 'learning_rate': 1.6880795405953163e-05, 'epoch': 0.56} {'loss': 0.5523, 'learning_rate': 1.6880551604833642e-05, 'epoch': 0.56} {'loss': 0.6948, 'learning_rate': 1.6880307795947293e-05, 'epoch': 0.56} {'loss': 0.5739, 'learning_rate': 1.688006397929438e-05, 'epoch': 0.56} {'loss': 0.4736, 'learning_rate': 1.6879820154875186e-05, 'epoch': 0.56} {'loss': 0.6202, 'learning_rate': 1.6879576322689982e-05, 'epoch': 0.56} {'loss': 0.6326, 'learning_rate': 1.6879332482739042e-05, 'epoch': 0.56} {'loss': 0.6918, 'learning_rate': 1.6879088635022643e-05, 'epoch': 0.56} {'loss': 0.5911, 'learning_rate': 1.6878844779541066e-05, 'epoch': 0.56} {'loss': 0.6819, 'learning_rate': 1.687860091629458e-05, 'epoch': 0.56} {'loss': 0.6715, 'learning_rate': 1.687835704528346e-05, 'epoch': 0.56} {'loss': 0.536, 'learning_rate': 1.687811316650798e-05, 'epoch': 0.56} {'loss': 0.6363, 'learning_rate': 1.6877869279968423e-05, 'epoch': 0.56} {'loss': 0.5547, 'learning_rate': 1.687762538566506e-05, 'epoch': 0.56} {'loss': 0.3973, 'learning_rate': 1.687738148359816e-05, 'epoch': 0.56} {'loss': 0.6238, 'learning_rate': 1.687713757376801e-05, 'epoch': 0.56} {'loss': 0.5938, 'learning_rate': 1.6876893656174878e-05, 'epoch': 0.56} {'loss': 0.5006, 'learning_rate': 1.687664973081904e-05, 'epoch': 0.56} {'loss': 0.4864, 'learning_rate': 1.6876405797700773e-05, 'epoch': 0.56} {'loss': 0.529, 'learning_rate': 1.687616185682035e-05, 'epoch': 0.56} {'loss': 0.4379, 'learning_rate': 1.687591790817805e-05, 'epoch': 0.56} {'loss': 0.3999, 'learning_rate': 1.6875673951774142e-05, 'epoch': 0.56} {'loss': 0.6102, 'learning_rate': 1.6875429987608907e-05, 'epoch': 0.56} {'loss': 0.5138, 'learning_rate': 1.6875186015682624e-05, 'epoch': 0.56} {'loss': 0.5826, 'learning_rate': 1.6874942035995558e-05, 'epoch': 0.56} {'loss': 0.6441, 'learning_rate': 1.687469804854799e-05, 'epoch': 0.56} {'loss': 0.5563, 'learning_rate': 1.6874454053340196e-05, 'epoch': 0.56} {'loss': 0.7102, 'learning_rate': 1.6874210050372452e-05, 'epoch': 0.56} {'loss': 0.4717, 'learning_rate': 1.687396603964503e-05, 'epoch': 0.56} {'loss': 0.6288, 'learning_rate': 1.687372202115821e-05, 'epoch': 0.56} {'loss': 0.5758, 'learning_rate': 1.6873477994912263e-05, 'epoch': 0.56} {'loss': 0.5433, 'learning_rate': 1.6873233960907467e-05, 'epoch': 0.56} {'loss': 0.6747, 'learning_rate': 1.6872989919144097e-05, 'epoch': 0.56} {'loss': 0.6225, 'learning_rate': 1.687274586962243e-05, 'epoch': 0.56} {'loss': 0.4658, 'learning_rate': 1.6872501812342738e-05, 'epoch': 0.56} {'loss': 0.5059, 'learning_rate': 1.6872257747305297e-05, 'epoch': 0.56} {'loss': 0.5816, 'learning_rate': 1.6872013674510387e-05, 'epoch': 0.56} {'loss': 0.6528, 'learning_rate': 1.6871769593958275e-05, 'epoch': 0.56} {'loss': 0.4507, 'learning_rate': 1.6871525505649248e-05, 'epoch': 0.56} {'loss': 0.6633, 'learning_rate': 1.687128140958357e-05, 'epoch': 0.56} {'loss': 0.5029, 'learning_rate': 1.6871037305761526e-05, 'epoch': 0.56} {'loss': 0.4589, 'learning_rate': 1.687079319418339e-05, 'epoch': 0.56} {'loss': 0.4223, 'learning_rate': 1.6870549074849426e-05, 'epoch': 0.56} {'loss': 0.6499, 'learning_rate': 1.6870304947759924e-05, 'epoch': 0.56} {'loss': 0.6219, 'learning_rate': 1.6870060812915155e-05, 'epoch': 0.56} {'loss': 0.5339, 'learning_rate': 1.6869816670315392e-05, 'epoch': 0.56} {'loss': 0.5198, 'learning_rate': 1.6869572519960914e-05, 'epoch': 0.56} {'loss': 0.4828, 'learning_rate': 1.6869328361851995e-05, 'epoch': 0.56} {'loss': 0.607, 'learning_rate': 1.6869084195988906e-05, 'epoch': 0.56} {'loss': 0.6137, 'learning_rate': 1.6868840022371932e-05, 'epoch': 0.56} {'loss': 0.6069, 'learning_rate': 1.6868595841001344e-05, 'epoch': 0.56} {'loss': 0.4885, 'learning_rate': 1.6868351651877415e-05, 'epoch': 0.56} {'loss': 0.7087, 'learning_rate': 1.6868107455000425e-05, 'epoch': 0.56} {'loss': 0.5306, 'learning_rate': 1.6867863250370647e-05, 'epoch': 0.56} {'loss': 0.5799, 'learning_rate': 1.6867619037988357e-05, 'epoch': 0.56} {'loss': 0.7928, 'learning_rate': 1.686737481785383e-05, 'epoch': 0.56} {'loss': 0.4416, 'learning_rate': 1.6867130589967344e-05, 'epoch': 0.56} {'loss': 0.4612, 'learning_rate': 1.6866886354329174e-05, 'epoch': 0.56} {'loss': 0.7426, 'learning_rate': 1.6866642110939592e-05, 'epoch': 0.56} {'loss': 0.7092, 'learning_rate': 1.686639785979888e-05, 'epoch': 0.56} {'loss': 0.4526, 'learning_rate': 1.686615360090731e-05, 'epoch': 0.56} {'loss': 0.4912, 'learning_rate': 1.686590933426516e-05, 'epoch': 0.56} {'loss': 0.6381, 'learning_rate': 1.68656650598727e-05, 'epoch': 0.56} {'loss': 0.6022, 'learning_rate': 1.686542077773021e-05, 'epoch': 0.56} {'loss': 0.5488, 'learning_rate': 1.6865176487837967e-05, 'epoch': 0.56} {'loss': 0.5058, 'learning_rate': 1.6864932190196247e-05, 'epoch': 0.56} {'loss': 0.6273, 'learning_rate': 1.6864687884805324e-05, 'epoch': 0.56} {'loss': 0.6117, 'learning_rate': 1.686444357166547e-05, 'epoch': 0.56} {'loss': 0.4675, 'learning_rate': 1.6864199250776966e-05, 'epoch': 0.56} {'loss': 0.5641, 'learning_rate': 1.6863954922140088e-05, 'epoch': 0.56} {'loss': 0.5487, 'learning_rate': 1.6863710585755108e-05, 'epoch': 0.56} {'loss': 0.4272, 'learning_rate': 1.6863466241622303e-05, 'epoch': 0.56} {'loss': 0.5069, 'learning_rate': 1.6863221889741953e-05, 'epoch': 0.56} {'loss': 0.673, 'learning_rate': 1.686297753011433e-05, 'epoch': 0.56} {'loss': 0.4353, 'learning_rate': 1.686273316273971e-05, 'epoch': 0.56} {'loss': 0.6259, 'learning_rate': 1.6862488787618367e-05, 'epoch': 0.56} {'loss': 0.5842, 'learning_rate': 1.686224440475058e-05, 'epoch': 0.56} {'loss': 0.6415, 'learning_rate': 1.6862000014136626e-05, 'epoch': 0.56} {'loss': 0.6386, 'learning_rate': 1.686175561577678e-05, 'epoch': 0.56} {'loss': 0.5067, 'learning_rate': 1.686151120967131e-05, 'epoch': 0.56} {'loss': 0.6582, 'learning_rate': 1.6861266795820506e-05, 'epoch': 0.56} {'loss': 0.5499, 'learning_rate': 1.6861022374224635e-05, 'epoch': 0.56} {'loss': 0.4856, 'learning_rate': 1.6860777944883972e-05, 'epoch': 0.56} {'loss': 0.5516, 'learning_rate': 1.68605335077988e-05, 'epoch': 0.56} {'loss': 0.6989, 'learning_rate': 1.6860289062969383e-05, 'epoch': 0.56} {'loss': 0.4936, 'learning_rate': 1.686004461039601e-05, 'epoch': 0.56} {'loss': 0.6245, 'learning_rate': 1.685980015007895e-05, 'epoch': 0.56} {'loss': 0.5582, 'learning_rate': 1.6859555682018475e-05, 'epoch': 0.56} {'loss': 0.5313, 'learning_rate': 1.6859311206214873e-05, 'epoch': 0.56} {'loss': 0.471, 'learning_rate': 1.685906672266841e-05, 'epoch': 0.56} {'loss': 0.4833, 'learning_rate': 1.6858822231379368e-05, 'epoch': 0.56} {'loss': 0.6497, 'learning_rate': 1.6858577732348015e-05, 'epoch': 0.56} {'loss': 0.6453, 'learning_rate': 1.6858333225574633e-05, 'epoch': 0.56} {'loss': 0.5556, 'learning_rate': 1.6858088711059498e-05, 'epoch': 0.56} {'loss': 0.6639, 'learning_rate': 1.6857844188802882e-05, 'epoch': 0.56} {'loss': 0.6671, 'learning_rate': 1.6857599658805072e-05, 'epoch': 0.56} {'loss': 0.7623, 'learning_rate': 1.685735512106633e-05, 'epoch': 0.57} {'loss': 0.5783, 'learning_rate': 1.685711057558694e-05, 'epoch': 0.57} {'loss': 0.609, 'learning_rate': 1.6856866022367174e-05, 'epoch': 0.57} {'loss': 0.6706, 'learning_rate': 1.685662146140731e-05, 'epoch': 0.57} {'loss': 0.5825, 'learning_rate': 1.6856376892707628e-05, 'epoch': 0.57} {'loss': 0.5026, 'learning_rate': 1.6856132316268398e-05, 'epoch': 0.57} {'loss': 0.5235, 'learning_rate': 1.68558877320899e-05, 'epoch': 0.57} {'loss': 0.4293, 'learning_rate': 1.6855643140172402e-05, 'epoch': 0.57} {'loss': 0.6068, 'learning_rate': 1.6855398540516192e-05, 'epoch': 0.57} {'loss': 0.6747, 'learning_rate': 1.6855153933121543e-05, 'epoch': 0.57} {'loss': 0.6368, 'learning_rate': 1.6854909317988723e-05, 'epoch': 0.57} {'loss': 0.5514, 'learning_rate': 1.6854664695118016e-05, 'epoch': 0.57} {'loss': 0.6968, 'learning_rate': 1.6854420064509698e-05, 'epoch': 0.57} {'loss': 0.5597, 'learning_rate': 1.685417542616404e-05, 'epoch': 0.57} {'loss': 0.5594, 'learning_rate': 1.6853930780081325e-05, 'epoch': 0.57} {'loss': 0.5646, 'learning_rate': 1.6853686126261824e-05, 'epoch': 0.57} {'loss': 0.6467, 'learning_rate': 1.6853441464705815e-05, 'epoch': 0.57} {'loss': 0.5497, 'learning_rate': 1.6853196795413572e-05, 'epoch': 0.57} {'loss': 0.6633, 'learning_rate': 1.6852952118385375e-05, 'epoch': 0.57} {'loss': 0.6213, 'learning_rate': 1.6852707433621497e-05, 'epoch': 0.57} {'loss': 0.5927, 'learning_rate': 1.6852462741122215e-05, 'epoch': 0.57} {'loss': 0.6718, 'learning_rate': 1.6852218040887805e-05, 'epoch': 0.57} {'loss': 0.702, 'learning_rate': 1.6851973332918548e-05, 'epoch': 0.57} {'loss': 0.5581, 'learning_rate': 1.6851728617214714e-05, 'epoch': 0.57} {'loss': 0.5927, 'learning_rate': 1.6851483893776575e-05, 'epoch': 0.57} {'loss': 0.6355, 'learning_rate': 1.6851239162604422e-05, 'epoch': 0.57} {'loss': 0.6127, 'learning_rate': 1.685099442369852e-05, 'epoch': 0.57} {'loss': 0.5108, 'learning_rate': 1.685074967705915e-05, 'epoch': 0.57} {'loss': 0.6473, 'learning_rate': 1.6850504922686584e-05, 'epoch': 0.57} {'loss': 0.5458, 'learning_rate': 1.68502601605811e-05, 'epoch': 0.57} {'loss': 0.6557, 'learning_rate': 1.6850015390742974e-05, 'epoch': 0.57} {'loss': 0.5896, 'learning_rate': 1.6849770613172487e-05, 'epoch': 0.57} {'loss': 0.6969, 'learning_rate': 1.6849525827869908e-05, 'epoch': 0.57} {'loss': 0.6581, 'learning_rate': 1.6849281034835517e-05, 'epoch': 0.57} {'loss': 0.5225, 'learning_rate': 1.6849036234069592e-05, 'epoch': 0.57} {'loss': 0.4875, 'learning_rate': 1.6848791425572408e-05, 'epoch': 0.57} {'loss': 0.497, 'learning_rate': 1.6848546609344242e-05, 'epoch': 0.57} {'loss': 0.6567, 'learning_rate': 1.6848301785385366e-05, 'epoch': 0.57} {'loss': 0.5451, 'learning_rate': 1.684805695369606e-05, 'epoch': 0.57} {'loss': 0.4414, 'learning_rate': 1.68478121142766e-05, 'epoch': 0.57} {'loss': 0.307, 'learning_rate': 1.6847567267127264e-05, 'epoch': 0.57} {'loss': 0.5379, 'learning_rate': 1.6847322412248327e-05, 'epoch': 0.57} {'loss': 0.6482, 'learning_rate': 1.6847077549640063e-05, 'epoch': 0.57} {'loss': 0.4441, 'learning_rate': 1.684683267930275e-05, 'epoch': 0.57} {'loss': 0.5529, 'learning_rate': 1.6846587801236668e-05, 'epoch': 0.57} {'loss': 0.4816, 'learning_rate': 1.6846342915442086e-05, 'epoch': 0.57} {'loss': 0.472, 'learning_rate': 1.6846098021919287e-05, 'epoch': 0.57} {'loss': 0.5749, 'learning_rate': 1.6845853120668546e-05, 'epoch': 0.57} {'loss': 0.4654, 'learning_rate': 1.6845608211690137e-05, 'epoch': 0.57} {'loss': 0.6759, 'learning_rate': 1.6845363294984342e-05, 'epoch': 0.57} {'loss': 0.723, 'learning_rate': 1.6845118370551427e-05, 'epoch': 0.57} {'loss': 0.4794, 'learning_rate': 1.684487343839168e-05, 'epoch': 0.57} {'loss': 0.5784, 'learning_rate': 1.6844628498505372e-05, 'epoch': 0.57} {'loss': 0.5098, 'learning_rate': 1.6844383550892778e-05, 'epoch': 0.57} {'loss': 0.5813, 'learning_rate': 1.684413859555418e-05, 'epoch': 0.57} {'loss': 0.6379, 'learning_rate': 1.6843893632489846e-05, 'epoch': 0.57} {'loss': 0.6876, 'learning_rate': 1.6843648661700062e-05, 'epoch': 0.57} {'loss': 0.5422, 'learning_rate': 1.6843403683185096e-05, 'epoch': 0.57} {'loss': 0.6118, 'learning_rate': 1.684315869694523e-05, 'epoch': 0.57} {'loss': 0.6785, 'learning_rate': 1.684291370298074e-05, 'epoch': 0.57} {'loss': 0.4607, 'learning_rate': 1.6842668701291902e-05, 'epoch': 0.57} {'loss': 0.6314, 'learning_rate': 1.6842423691878994e-05, 'epoch': 0.57} {'loss': 0.7099, 'learning_rate': 1.6842178674742288e-05, 'epoch': 0.57} {'loss': 0.6027, 'learning_rate': 1.6841933649882064e-05, 'epoch': 0.57} {'loss': 0.653, 'learning_rate': 1.6841688617298597e-05, 'epoch': 0.57} {'loss': 0.4351, 'learning_rate': 1.6841443576992164e-05, 'epoch': 0.57} {'loss': 0.4534, 'learning_rate': 1.6841198528963045e-05, 'epoch': 0.57} {'loss': 0.6557, 'learning_rate': 1.6840953473211512e-05, 'epoch': 0.57} {'loss': 0.5499, 'learning_rate': 1.684070840973784e-05, 'epoch': 0.57} {'loss': 0.6406, 'learning_rate': 1.6840463338542316e-05, 'epoch': 0.57} {'loss': 0.6295, 'learning_rate': 1.6840218259625208e-05, 'epoch': 0.57} {'loss': 0.578, 'learning_rate': 1.6839973172986792e-05, 'epoch': 0.57} {'loss': 0.61, 'learning_rate': 1.6839728078627345e-05, 'epoch': 0.57} {'loss': 0.6552, 'learning_rate': 1.683948297654715e-05, 'epoch': 0.57} {'loss': 0.6375, 'learning_rate': 1.6839237866746478e-05, 'epoch': 0.57} {'loss': 0.6901, 'learning_rate': 1.6838992749225606e-05, 'epoch': 0.57} {'loss': 0.5295, 'learning_rate': 1.6838747623984812e-05, 'epoch': 0.57} {'loss': 0.6185, 'learning_rate': 1.6838502491024373e-05, 'epoch': 0.57} {'loss': 0.7296, 'learning_rate': 1.6838257350344564e-05, 'epoch': 0.57} {'loss': 0.7405, 'learning_rate': 1.6838012201945665e-05, 'epoch': 0.57} {'loss': 0.5893, 'learning_rate': 1.6837767045827948e-05, 'epoch': 0.57} {'loss': 0.7139, 'learning_rate': 1.6837521881991695e-05, 'epoch': 0.57} {'loss': 0.6597, 'learning_rate': 1.6837276710437175e-05, 'epoch': 0.57} {'loss': 0.5268, 'learning_rate': 1.6837031531164674e-05, 'epoch': 0.57} {'loss': 0.4254, 'learning_rate': 1.6836786344174463e-05, 'epoch': 0.57} {'loss': 0.6228, 'learning_rate': 1.6836541149466823e-05, 'epoch': 0.57} {'loss': 0.5256, 'learning_rate': 1.6836295947042025e-05, 'epoch': 0.57} {'loss': 0.6502, 'learning_rate': 1.683605073690035e-05, 'epoch': 0.57} {'loss': 0.5317, 'learning_rate': 1.6835805519042074e-05, 'epoch': 0.57} {'loss': 0.592, 'learning_rate': 1.6835560293467472e-05, 'epoch': 0.57} {'loss': 0.6025, 'learning_rate': 1.6835315060176824e-05, 'epoch': 0.57} {'loss': 0.6189, 'learning_rate': 1.68350698191704e-05, 'epoch': 0.57} {'loss': 0.727, 'learning_rate': 1.683482457044849e-05, 'epoch': 0.57} {'loss': 0.5704, 'learning_rate': 1.683457931401136e-05, 'epoch': 0.57} {'loss': 0.5969, 'learning_rate': 1.683433404985929e-05, 'epoch': 0.57} {'loss': 0.373, 'learning_rate': 1.683408877799255e-05, 'epoch': 0.57} {'loss': 0.6594, 'learning_rate': 1.683384349841143e-05, 'epoch': 0.57} {'loss': 0.5007, 'learning_rate': 1.68335982111162e-05, 'epoch': 0.57} {'loss': 0.6227, 'learning_rate': 1.6833352916107135e-05, 'epoch': 0.57} {'loss': 0.522, 'learning_rate': 1.6833107613384515e-05, 'epoch': 0.57} {'loss': 0.5779, 'learning_rate': 1.6832862302948617e-05, 'epoch': 0.57} {'loss': 0.582, 'learning_rate': 1.6832616984799714e-05, 'epoch': 0.57} {'loss': 0.6595, 'learning_rate': 1.6832371658938086e-05, 'epoch': 0.57} {'loss': 0.5779, 'learning_rate': 1.6832126325364012e-05, 'epoch': 0.57} {'loss': 0.5553, 'learning_rate': 1.6831880984077768e-05, 'epoch': 0.57} {'loss': 0.6053, 'learning_rate': 1.6831635635079628e-05, 'epoch': 0.57} {'loss': 0.5899, 'learning_rate': 1.6831390278369865e-05, 'epoch': 0.57} {'loss': 0.5405, 'learning_rate': 1.6831144913948766e-05, 'epoch': 0.57} {'loss': 0.4314, 'learning_rate': 1.6830899541816604e-05, 'epoch': 0.57} {'loss': 0.5383, 'learning_rate': 1.6830654161973654e-05, 'epoch': 0.57} {'loss': 0.5496, 'learning_rate': 1.6830408774420193e-05, 'epoch': 0.57} {'loss': 0.6843, 'learning_rate': 1.6830163379156503e-05, 'epoch': 0.57} {'loss': 0.5561, 'learning_rate': 1.6829917976182855e-05, 'epoch': 0.57} {'loss': 0.6652, 'learning_rate': 1.682967256549953e-05, 'epoch': 0.57} {'loss': 0.6916, 'learning_rate': 1.6829427147106803e-05, 'epoch': 0.57} {'loss': 0.5862, 'learning_rate': 1.6829181721004947e-05, 'epoch': 0.57} {'loss': 0.4505, 'learning_rate': 1.6828936287194252e-05, 'epoch': 0.57} {'loss': 0.6196, 'learning_rate': 1.6828690845674977e-05, 'epoch': 0.57} {'loss': 0.6306, 'learning_rate': 1.6828445396447418e-05, 'epoch': 0.57} {'loss': 0.6625, 'learning_rate': 1.6828199939511835e-05, 'epoch': 0.57} {'loss': 0.7194, 'learning_rate': 1.6827954474868517e-05, 'epoch': 0.57} {'loss': 0.6906, 'learning_rate': 1.6827709002517734e-05, 'epoch': 0.57} {'loss': 0.5721, 'learning_rate': 1.6827463522459768e-05, 'epoch': 0.57} {'loss': 0.6234, 'learning_rate': 1.6827218034694893e-05, 'epoch': 0.57} {'loss': 0.6647, 'learning_rate': 1.6826972539223387e-05, 'epoch': 0.57} {'loss': 0.6261, 'learning_rate': 1.6826727036045528e-05, 'epoch': 0.57} {'loss': 0.6077, 'learning_rate': 1.6826481525161593e-05, 'epoch': 0.57} {'loss': 0.6613, 'learning_rate': 1.6826236006571858e-05, 'epoch': 0.57} {'loss': 0.5972, 'learning_rate': 1.68259904802766e-05, 'epoch': 0.57} {'loss': 0.4929, 'learning_rate': 1.6825744946276095e-05, 'epoch': 0.57} {'loss': 0.5103, 'learning_rate': 1.6825499404570624e-05, 'epoch': 0.57} {'loss': 0.6266, 'learning_rate': 1.682525385516046e-05, 'epoch': 0.57} {'loss': 0.4645, 'learning_rate': 1.6825008298045884e-05, 'epoch': 0.57} {'loss': 0.521, 'learning_rate': 1.682476273322717e-05, 'epoch': 0.57} {'loss': 0.4917, 'learning_rate': 1.6824517160704598e-05, 'epoch': 0.57} {'loss': 0.4756, 'learning_rate': 1.6824271580478446e-05, 'epoch': 0.57} {'loss': 0.6631, 'learning_rate': 1.6824025992548988e-05, 'epoch': 0.57} {'loss': 0.5391, 'learning_rate': 1.68237803969165e-05, 'epoch': 0.57} {'loss': 0.6487, 'learning_rate': 1.682353479358126e-05, 'epoch': 0.57} {'loss': 0.7193, 'learning_rate': 1.6823289182543554e-05, 'epoch': 0.57} {'loss': 0.5775, 'learning_rate': 1.6823043563803648e-05, 'epoch': 0.57} {'loss': 0.5796, 'learning_rate': 1.682279793736182e-05, 'epoch': 0.57} {'loss': 0.5608, 'learning_rate': 1.6822552303218357e-05, 'epoch': 0.57} {'loss': 0.5855, 'learning_rate': 1.6822306661373526e-05, 'epoch': 0.57} {'loss': 0.5246, 'learning_rate': 1.682206101182761e-05, 'epoch': 0.57} {'loss': 0.4544, 'learning_rate': 1.682181535458088e-05, 'epoch': 0.57} {'loss': 0.6708, 'learning_rate': 1.6821569689633623e-05, 'epoch': 0.57} {'loss': 0.5853, 'learning_rate': 1.6821324016986107e-05, 'epoch': 0.57} {'loss': 0.6549, 'learning_rate': 1.6821078336638615e-05, 'epoch': 0.57} {'loss': 0.5872, 'learning_rate': 1.6820832648591424e-05, 'epoch': 0.57} {'loss': 0.5683, 'learning_rate': 1.682058695284481e-05, 'epoch': 0.57} {'loss': 0.6333, 'learning_rate': 1.6820341249399047e-05, 'epoch': 0.57} {'loss': 0.5872, 'learning_rate': 1.6820095538254416e-05, 'epoch': 0.57} {'loss': 0.7683, 'learning_rate': 1.6819849819411195e-05, 'epoch': 0.57} {'loss': 0.5577, 'learning_rate': 1.6819604092869663e-05, 'epoch': 0.57} {'loss': 0.3498, 'learning_rate': 1.6819358358630093e-05, 'epoch': 0.57} {'loss': 0.6854, 'learning_rate': 1.681911261669276e-05, 'epoch': 0.57} {'loss': 0.6536, 'learning_rate': 1.681886686705795e-05, 'epoch': 0.57} {'loss': 0.4639, 'learning_rate': 1.6818621109725938e-05, 'epoch': 0.57} {'loss': 0.4419, 'learning_rate': 1.6818375344696995e-05, 'epoch': 0.57} {'loss': 0.6382, 'learning_rate': 1.6818129571971405e-05, 'epoch': 0.57} {'loss': 0.6777, 'learning_rate': 1.6817883791549444e-05, 'epoch': 0.57} {'loss': 0.5285, 'learning_rate': 1.681763800343139e-05, 'epoch': 0.57} {'loss': 0.4657, 'learning_rate': 1.6817392207617517e-05, 'epoch': 0.57} {'loss': 0.4664, 'learning_rate': 1.6817146404108104e-05, 'epoch': 0.57} {'loss': 0.6122, 'learning_rate': 1.6816900592903427e-05, 'epoch': 0.57} {'loss': 0.5425, 'learning_rate': 1.6816654774003768e-05, 'epoch': 0.57} {'loss': 0.5383, 'learning_rate': 1.6816408947409403e-05, 'epoch': 0.57} {'loss': 0.6228, 'learning_rate': 1.681616311312061e-05, 'epoch': 0.57} {'loss': 0.454, 'learning_rate': 1.6815917271137658e-05, 'epoch': 0.57} {'loss': 0.5922, 'learning_rate': 1.6815671421460836e-05, 'epoch': 0.57} {'loss': 0.6212, 'learning_rate': 1.681542556409042e-05, 'epoch': 0.57} {'loss': 0.5116, 'learning_rate': 1.681517969902668e-05, 'epoch': 0.57} {'loss': 0.5591, 'learning_rate': 1.68149338262699e-05, 'epoch': 0.57} {'loss': 0.5951, 'learning_rate': 1.6814687945820355e-05, 'epoch': 0.57} {'loss': 0.65, 'learning_rate': 1.6814442057678323e-05, 'epoch': 0.57} {'loss': 0.4477, 'learning_rate': 1.681419616184408e-05, 'epoch': 0.57} {'loss': 0.6092, 'learning_rate': 1.681395025831791e-05, 'epoch': 0.57} {'loss': 0.6742, 'learning_rate': 1.6813704347100084e-05, 'epoch': 0.57} {'loss': 0.592, 'learning_rate': 1.681345842819088e-05, 'epoch': 0.57} {'loss': 0.5465, 'learning_rate': 1.6813212501590577e-05, 'epoch': 0.57} {'loss': 0.6064, 'learning_rate': 1.6812966567299453e-05, 'epoch': 0.57} {'loss': 0.7004, 'learning_rate': 1.6812720625317784e-05, 'epoch': 0.57} {'loss': 0.6024, 'learning_rate': 1.6812474675645853e-05, 'epoch': 0.57} {'loss': 0.4638, 'learning_rate': 1.681222871828393e-05, 'epoch': 0.57} {'loss': 0.8014, 'learning_rate': 1.68119827532323e-05, 'epoch': 0.57} {'loss': 0.6976, 'learning_rate': 1.6811736780491234e-05, 'epoch': 0.57} {'loss': 0.4685, 'learning_rate': 1.681149080006101e-05, 'epoch': 0.57} {'loss': 0.745, 'learning_rate': 1.6811244811941913e-05, 'epoch': 0.57} {'loss': 0.6151, 'learning_rate': 1.6810998816134212e-05, 'epoch': 0.57} {'loss': 0.6571, 'learning_rate': 1.6810752812638192e-05, 'epoch': 0.57} {'loss': 0.5499, 'learning_rate': 1.6810506801454126e-05, 'epoch': 0.57} {'loss': 0.6554, 'learning_rate': 1.681026078258229e-05, 'epoch': 0.57} {'loss': 0.5986, 'learning_rate': 1.681001475602297e-05, 'epoch': 0.57} {'loss': 0.6616, 'learning_rate': 1.6809768721776434e-05, 'epoch': 0.57} {'loss': 0.5975, 'learning_rate': 1.6809522679842964e-05, 'epoch': 0.57} {'loss': 0.5739, 'learning_rate': 1.680927663022284e-05, 'epoch': 0.57} {'loss': 0.4625, 'learning_rate': 1.6809030572916334e-05, 'epoch': 0.57} {'loss': 0.6073, 'learning_rate': 1.680878450792373e-05, 'epoch': 0.57} {'loss': 0.6743, 'learning_rate': 1.6808538435245306e-05, 'epoch': 0.57} {'loss': 0.7633, 'learning_rate': 1.6808292354881334e-05, 'epoch': 0.57} {'loss': 0.5311, 'learning_rate': 1.6808046266832094e-05, 'epoch': 0.57} {'loss': 0.6725, 'learning_rate': 1.6807800171097865e-05, 'epoch': 0.57} {'loss': 0.594, 'learning_rate': 1.6807554067678924e-05, 'epoch': 0.57} {'loss': 0.5252, 'learning_rate': 1.680730795657555e-05, 'epoch': 0.57} {'loss': 0.5797, 'learning_rate': 1.680706183778802e-05, 'epoch': 0.57} {'loss': 0.4915, 'learning_rate': 1.6806815711316606e-05, 'epoch': 0.57} {'loss': 0.6689, 'learning_rate': 1.6806569577161597e-05, 'epoch': 0.57} {'loss': 0.4109, 'learning_rate': 1.6806323435323264e-05, 'epoch': 0.57} {'loss': 0.5925, 'learning_rate': 1.6806077285801885e-05, 'epoch': 0.57} {'loss': 0.5942, 'learning_rate': 1.680583112859774e-05, 'epoch': 0.57} {'loss': 0.781, 'learning_rate': 1.680558496371111e-05, 'epoch': 0.57} {'loss': 0.4592, 'learning_rate': 1.680533879114226e-05, 'epoch': 0.57} {'loss': 0.7052, 'learning_rate': 1.6805092610891486e-05, 'epoch': 0.57} {'loss': 0.6838, 'learning_rate': 1.680484642295905e-05, 'epoch': 0.57} {'loss': 0.6834, 'learning_rate': 1.6804600227345237e-05, 'epoch': 0.57} {'loss': 0.5094, 'learning_rate': 1.6804354024050327e-05, 'epoch': 0.57} {'loss': 0.4598, 'learning_rate': 1.6804107813074597e-05, 'epoch': 0.57} {'loss': 0.5813, 'learning_rate': 1.6803861594418317e-05, 'epoch': 0.57} {'loss': 0.6306, 'learning_rate': 1.6803615368081773e-05, 'epoch': 0.57} {'loss': 0.7207, 'learning_rate': 1.6803369134065242e-05, 'epoch': 0.57} {'loss': 0.4909, 'learning_rate': 1.6803122892369002e-05, 'epoch': 0.57} {'loss': 0.4139, 'learning_rate': 1.6802876642993328e-05, 'epoch': 0.57} {'loss': 0.4769, 'learning_rate': 1.68026303859385e-05, 'epoch': 0.57} {'loss': 0.582, 'learning_rate': 1.6802384121204797e-05, 'epoch': 0.57} {'loss': 0.7351, 'learning_rate': 1.6802137848792493e-05, 'epoch': 0.57} {'loss': 0.7131, 'learning_rate': 1.6801891568701873e-05, 'epoch': 0.57} {'loss': 0.3982, 'learning_rate': 1.680164528093321e-05, 'epoch': 0.57} {'loss': 0.5135, 'learning_rate': 1.680139898548678e-05, 'epoch': 0.57} {'loss': 0.5953, 'learning_rate': 1.6801152682362867e-05, 'epoch': 0.57} {'loss': 0.5559, 'learning_rate': 1.6800906371561746e-05, 'epoch': 0.57} {'loss': 0.5101, 'learning_rate': 1.680066005308369e-05, 'epoch': 0.57} {'loss': 0.7021, 'learning_rate': 1.6800413726928986e-05, 'epoch': 0.57} {'loss': 0.6337, 'learning_rate': 1.680016739309791e-05, 'epoch': 0.57} {'loss': 0.5183, 'learning_rate': 1.6799921051590736e-05, 'epoch': 0.57} {'loss': 0.5179, 'learning_rate': 1.6799674702407743e-05, 'epoch': 0.57} {'loss': 0.6278, 'learning_rate': 1.6799428345549212e-05, 'epoch': 0.57} {'loss': 0.7315, 'learning_rate': 1.6799181981015417e-05, 'epoch': 0.57} {'loss': 0.6361, 'learning_rate': 1.679893560880664e-05, 'epoch': 0.57} {'loss': 0.4955, 'learning_rate': 1.679868922892316e-05, 'epoch': 0.57} {'loss': 0.6766, 'learning_rate': 1.679844284136525e-05, 'epoch': 0.57} {'loss': 0.7523, 'learning_rate': 1.6798196446133192e-05, 'epoch': 0.57} {'loss': 0.6097, 'learning_rate': 1.6797950043227263e-05, 'epoch': 0.57} {'loss': 0.5138, 'learning_rate': 1.679770363264774e-05, 'epoch': 0.57} {'loss': 0.5963, 'learning_rate': 1.67974572143949e-05, 'epoch': 0.57} {'loss': 0.489, 'learning_rate': 1.6797210788469028e-05, 'epoch': 0.57} {'loss': 0.7191, 'learning_rate': 1.6796964354870396e-05, 'epoch': 0.57} {'loss': 0.475, 'learning_rate': 1.6796717913599282e-05, 'epoch': 0.57} {'loss': 0.5669, 'learning_rate': 1.6796471464655968e-05, 'epoch': 0.57} {'loss': 0.6872, 'learning_rate': 1.679622500804073e-05, 'epoch': 0.57} {'loss': 0.5698, 'learning_rate': 1.6795978543753847e-05, 'epoch': 0.57} {'loss': 0.5359, 'learning_rate': 1.6795732071795593e-05, 'epoch': 0.57} {'loss': 0.5397, 'learning_rate': 1.679548559216625e-05, 'epoch': 0.57} {'loss': 0.7046, 'learning_rate': 1.6795239104866102e-05, 'epoch': 0.57} {'loss': 0.5433, 'learning_rate': 1.6794992609895414e-05, 'epoch': 0.57} {'loss': 0.4157, 'learning_rate': 1.6794746107254476e-05, 'epoch': 0.57} {'loss': 0.5011, 'learning_rate': 1.679449959694356e-05, 'epoch': 0.57} {'loss': 0.5041, 'learning_rate': 1.6794253078962947e-05, 'epoch': 0.57} {'loss': 0.554, 'learning_rate': 1.6794006553312914e-05, 'epoch': 0.57} {'loss': 0.4019, 'learning_rate': 1.679376001999374e-05, 'epoch': 0.57} {'loss': 0.5067, 'learning_rate': 1.6793513479005704e-05, 'epoch': 0.57} {'loss': 0.6709, 'learning_rate': 1.679326693034908e-05, 'epoch': 0.57} {'loss': 0.4498, 'learning_rate': 1.679302037402415e-05, 'epoch': 0.57} {'loss': 0.3878, 'learning_rate': 1.6792773810031193e-05, 'epoch': 0.57} {'loss': 0.4827, 'learning_rate': 1.6792527238370487e-05, 'epoch': 0.57} {'loss': 0.6091, 'learning_rate': 1.6792280659042303e-05, 'epoch': 0.57} {'loss': 0.5623, 'learning_rate': 1.6792034072046936e-05, 'epoch': 0.57} {'loss': 0.5861, 'learning_rate': 1.6791787477384647e-05, 'epoch': 0.57} {'loss': 0.5406, 'learning_rate': 1.6791540875055724e-05, 'epoch': 0.57} {'loss': 0.6237, 'learning_rate': 1.679129426506044e-05, 'epoch': 0.57} {'loss': 0.4277, 'learning_rate': 1.6791047647399077e-05, 'epoch': 0.57} {'loss': 0.4864, 'learning_rate': 1.6790801022071918e-05, 'epoch': 0.57} {'loss': 0.5366, 'learning_rate': 1.679055438907923e-05, 'epoch': 0.57} {'loss': 0.6577, 'learning_rate': 1.6790307748421297e-05, 'epoch': 0.57} {'loss': 0.5149, 'learning_rate': 1.6790061100098404e-05, 'epoch': 0.57} {'loss': 0.6164, 'learning_rate': 1.6789814444110817e-05, 'epoch': 0.57} {'loss': 0.5058, 'learning_rate': 1.6789567780458823e-05, 'epoch': 0.57} {'loss': 0.6487, 'learning_rate': 1.6789321109142695e-05, 'epoch': 0.57} {'loss': 0.5398, 'learning_rate': 1.6789074430162718e-05, 'epoch': 0.57} {'loss': 0.5573, 'learning_rate': 1.6788827743519166e-05, 'epoch': 0.57} {'loss': 0.565, 'learning_rate': 1.6788581049212318e-05, 'epoch': 0.57} {'loss': 0.5348, 'learning_rate': 1.6788334347242454e-05, 'epoch': 0.57} {'loss': 0.558, 'learning_rate': 1.6788087637609852e-05, 'epoch': 0.57} {'loss': 0.5816, 'learning_rate': 1.6787840920314787e-05, 'epoch': 0.57} {'loss': 0.4153, 'learning_rate': 1.6787594195357543e-05, 'epoch': 0.57} {'loss': 0.4973, 'learning_rate': 1.6787347462738398e-05, 'epoch': 0.57} {'loss': 0.6828, 'learning_rate': 1.6787100722457624e-05, 'epoch': 0.57} {'loss': 0.6968, 'learning_rate': 1.6786853974515504e-05, 'epoch': 0.57} {'loss': 0.6811, 'learning_rate': 1.678660721891232e-05, 'epoch': 0.57} {'loss': 0.5829, 'learning_rate': 1.6786360455648343e-05, 'epoch': 0.57} {'loss': 0.518, 'learning_rate': 1.6786113684723858e-05, 'epoch': 0.57} {'loss': 0.7353, 'learning_rate': 1.6785866906139142e-05, 'epoch': 0.57} {'loss': 0.6517, 'learning_rate': 1.6785620119894466e-05, 'epoch': 0.57} {'loss': 0.538, 'learning_rate': 1.6785373325990123e-05, 'epoch': 0.57} {'loss': 0.5573, 'learning_rate': 1.6785126524426383e-05, 'epoch': 0.57} {'loss': 0.4869, 'learning_rate': 1.6784879715203523e-05, 'epoch': 0.57} {'loss': 0.4376, 'learning_rate': 1.6784632898321825e-05, 'epoch': 0.57} {'loss': 0.5294, 'learning_rate': 1.6784386073781567e-05, 'epoch': 0.57} {'loss': 0.5094, 'learning_rate': 1.6784139241583023e-05, 'epoch': 0.57} {'loss': 0.5276, 'learning_rate': 1.6783892401726482e-05, 'epoch': 0.57} {'loss': 0.6974, 'learning_rate': 1.6783645554212214e-05, 'epoch': 0.57} {'loss': 0.6508, 'learning_rate': 1.67833986990405e-05, 'epoch': 0.57} {'loss': 0.6566, 'learning_rate': 1.678315183621162e-05, 'epoch': 0.57} {'loss': 0.5733, 'learning_rate': 1.6782904965725847e-05, 'epoch': 0.57} {'loss': 0.7531, 'learning_rate': 1.6782658087583467e-05, 'epoch': 0.57} {'loss': 0.6314, 'learning_rate': 1.6782411201784756e-05, 'epoch': 0.57} {'loss': 0.6769, 'learning_rate': 1.6782164308329993e-05, 'epoch': 0.57} {'loss': 0.5116, 'learning_rate': 1.6781917407219457e-05, 'epoch': 0.57} {'loss': 0.5511, 'learning_rate': 1.6781670498453424e-05, 'epoch': 0.57} {'loss': 0.6827, 'learning_rate': 1.6781423582032176e-05, 'epoch': 0.57} {'loss': 0.5227, 'learning_rate': 1.6781176657955992e-05, 'epoch': 0.57} {'loss': 0.6033, 'learning_rate': 1.6780929726225144e-05, 'epoch': 0.57} {'loss': 0.4218, 'learning_rate': 1.6780682786839917e-05, 'epoch': 0.57} {'loss': 0.4323, 'learning_rate': 1.6780435839800592e-05, 'epoch': 0.57} {'loss': 0.5913, 'learning_rate': 1.678018888510744e-05, 'epoch': 0.57} {'loss': 0.5219, 'learning_rate': 1.6779941922760746e-05, 'epoch': 0.57} {'loss': 0.5616, 'learning_rate': 1.677969495276079e-05, 'epoch': 0.57} {'loss': 0.6189, 'learning_rate': 1.677944797510784e-05, 'epoch': 0.57} {'loss': 0.6948, 'learning_rate': 1.677920098980219e-05, 'epoch': 0.57} {'loss': 0.6075, 'learning_rate': 1.677895399684411e-05, 'epoch': 0.57} {'loss': 0.5039, 'learning_rate': 1.6778706996233876e-05, 'epoch': 0.57} {'loss': 0.6142, 'learning_rate': 1.6778459987971776e-05, 'epoch': 0.57} {'loss': 0.5566, 'learning_rate': 1.6778212972058077e-05, 'epoch': 0.57} {'loss': 0.4668, 'learning_rate': 1.677796594849307e-05, 'epoch': 0.57} {'loss': 0.5703, 'learning_rate': 1.677771891727703e-05, 'epoch': 0.57} {'loss': 0.5727, 'learning_rate': 1.677747187841023e-05, 'epoch': 0.57} {'loss': 0.5809, 'learning_rate': 1.6777224831892953e-05, 'epoch': 0.57} {'loss': 0.547, 'learning_rate': 1.677697777772548e-05, 'epoch': 0.57} {'loss': 0.5566, 'learning_rate': 1.6776730715908087e-05, 'epoch': 0.57} {'loss': 0.479, 'learning_rate': 1.6776483646441052e-05, 'epoch': 0.57} {'loss': 0.5805, 'learning_rate': 1.6776236569324656e-05, 'epoch': 0.57} {'loss': 0.6324, 'learning_rate': 1.6775989484559177e-05, 'epoch': 0.57} {'loss': 0.5742, 'learning_rate': 1.6775742392144895e-05, 'epoch': 0.57} {'loss': 0.6328, 'learning_rate': 1.677549529208209e-05, 'epoch': 0.57} {'loss': 0.604, 'learning_rate': 1.677524818437104e-05, 'epoch': 0.57} {'loss': 0.5429, 'learning_rate': 1.677500106901202e-05, 'epoch': 0.57} {'loss': 0.4639, 'learning_rate': 1.6774753946005314e-05, 'epoch': 0.57} {'loss': 0.5209, 'learning_rate': 1.6774506815351198e-05, 'epoch': 0.57} {'loss': 0.5163, 'learning_rate': 1.6774259677049953e-05, 'epoch': 0.57} {'loss': 0.6423, 'learning_rate': 1.6774012531101854e-05, 'epoch': 0.57} {'loss': 0.5783, 'learning_rate': 1.677376537750719e-05, 'epoch': 0.57} {'loss': 0.5125, 'learning_rate': 1.6773518216266228e-05, 'epoch': 0.57} {'loss': 0.5227, 'learning_rate': 1.677327104737925e-05, 'epoch': 0.57} {'loss': 0.4718, 'learning_rate': 1.6773023870846543e-05, 'epoch': 0.57} {'loss': 0.5143, 'learning_rate': 1.6772776686668374e-05, 'epoch': 0.57} {'loss': 0.6701, 'learning_rate': 1.6772529494845032e-05, 'epoch': 0.57} {'loss': 0.5692, 'learning_rate': 1.677228229537679e-05, 'epoch': 0.57} {'loss': 0.5265, 'learning_rate': 1.677203508826393e-05, 'epoch': 0.57} {'loss': 0.4539, 'learning_rate': 1.677178787350673e-05, 'epoch': 0.57} {'loss': 0.5074, 'learning_rate': 1.677154065110547e-05, 'epoch': 0.57} {'loss': 0.707, 'learning_rate': 1.6771293421060428e-05, 'epoch': 0.57} {'loss': 0.634, 'learning_rate': 1.677104618337188e-05, 'epoch': 0.57} {'loss': 0.7072, 'learning_rate': 1.6770798938040115e-05, 'epoch': 0.57} {'loss': 0.4981, 'learning_rate': 1.6770551685065402e-05, 'epoch': 0.57} {'loss': 0.6343, 'learning_rate': 1.6770304424448022e-05, 'epoch': 0.57} {'loss': 0.4866, 'learning_rate': 1.6770057156188254e-05, 'epoch': 0.57} {'loss': 0.5638, 'learning_rate': 1.6769809880286385e-05, 'epoch': 0.57} {'loss': 0.5887, 'learning_rate': 1.6769562596742686e-05, 'epoch': 0.57} {'loss': 0.6337, 'learning_rate': 1.6769315305557435e-05, 'epoch': 0.57} {'loss': 0.4367, 'learning_rate': 1.6769068006730918e-05, 'epoch': 0.57} {'loss': 0.4058, 'learning_rate': 1.6768820700263407e-05, 'epoch': 0.57} {'loss': 0.6307, 'learning_rate': 1.6768573386155185e-05, 'epoch': 0.57} {'loss': 0.5151, 'learning_rate': 1.6768326064406537e-05, 'epoch': 0.57} {'loss': 0.4142, 'learning_rate': 1.676807873501773e-05, 'epoch': 0.57} {'loss': 0.5477, 'learning_rate': 1.6767831397989046e-05, 'epoch': 0.57} {'loss': 0.6912, 'learning_rate': 1.6767584053320773e-05, 'epoch': 0.57} {'loss': 0.6524, 'learning_rate': 1.6767336701013184e-05, 'epoch': 0.57} {'loss': 0.6733, 'learning_rate': 1.6767089341066558e-05, 'epoch': 0.57} {'loss': 0.5701, 'learning_rate': 1.6766841973481172e-05, 'epoch': 0.57} {'loss': 0.5909, 'learning_rate': 1.6766594598257314e-05, 'epoch': 0.57} {'loss': 0.6709, 'learning_rate': 1.676634721539525e-05, 'epoch': 0.57} {'loss': 0.5008, 'learning_rate': 1.6766099824895273e-05, 'epoch': 0.57} {'loss': 0.5366, 'learning_rate': 1.6765852426757656e-05, 'epoch': 0.57} {'loss': 0.4156, 'learning_rate': 1.6765605020982674e-05, 'epoch': 0.57} {'loss': 0.6919, 'learning_rate': 1.6765357607570614e-05, 'epoch': 0.57} {'loss': 0.5207, 'learning_rate': 1.6765110186521748e-05, 'epoch': 0.57} {'loss': 0.5697, 'learning_rate': 1.6764862757836362e-05, 'epoch': 0.57} {'loss': 0.4593, 'learning_rate': 1.6764615321514733e-05, 'epoch': 0.57} {'loss': 0.7101, 'learning_rate': 1.6764367877557136e-05, 'epoch': 0.57} {'loss': 0.6936, 'learning_rate': 1.6764120425963856e-05, 'epoch': 0.57} {'loss': 0.4375, 'learning_rate': 1.676387296673517e-05, 'epoch': 0.57} {'loss': 0.502, 'learning_rate': 1.6763625499871362e-05, 'epoch': 0.57} {'loss': 0.496, 'learning_rate': 1.6763378025372702e-05, 'epoch': 0.57} {'loss': 0.5682, 'learning_rate': 1.6763130543239476e-05, 'epoch': 0.57} {'loss': 0.5266, 'learning_rate': 1.6762883053471962e-05, 'epoch': 0.57} {'loss': 0.517, 'learning_rate': 1.676263555607044e-05, 'epoch': 0.57} {'loss': 0.4665, 'learning_rate': 1.6762388051035183e-05, 'epoch': 0.57} {'loss': 0.4762, 'learning_rate': 1.676214053836648e-05, 'epoch': 0.57} {'loss': 0.5362, 'learning_rate': 1.6761893018064604e-05, 'epoch': 0.57} {'loss': 0.6514, 'learning_rate': 1.676164549012984e-05, 'epoch': 0.57} {'loss': 0.6727, 'learning_rate': 1.6761397954562462e-05, 'epoch': 0.57} {'loss': 0.6167, 'learning_rate': 1.676115041136275e-05, 'epoch': 0.57} {'loss': 0.6268, 'learning_rate': 1.6760902860530986e-05, 'epoch': 0.57} {'loss': 0.483, 'learning_rate': 1.6760655302067454e-05, 'epoch': 0.57} {'loss': 0.695, 'learning_rate': 1.676040773597242e-05, 'epoch': 0.57} {'loss': 0.5804, 'learning_rate': 1.6760160162246173e-05, 'epoch': 0.57} {'loss': 0.6917, 'learning_rate': 1.6759912580888993e-05, 'epoch': 0.57} {'loss': 0.5594, 'learning_rate': 1.6759664991901155e-05, 'epoch': 0.57} {'loss': 0.5937, 'learning_rate': 1.6759417395282942e-05, 'epoch': 0.57} {'loss': 0.5227, 'learning_rate': 1.675916979103463e-05, 'epoch': 0.57} {'loss': 0.7053, 'learning_rate': 1.67589221791565e-05, 'epoch': 0.57} {'loss': 0.4056, 'learning_rate': 1.675867455964884e-05, 'epoch': 0.57} {'loss': 0.5393, 'learning_rate': 1.6758426932511914e-05, 'epoch': 0.57} {'loss': 0.5348, 'learning_rate': 1.675817929774601e-05, 'epoch': 0.57} {'loss': 0.5469, 'learning_rate': 1.675793165535141e-05, 'epoch': 0.57} {'loss': 0.5377, 'learning_rate': 1.6757684005328386e-05, 'epoch': 0.57} {'loss': 0.5667, 'learning_rate': 1.6757436347677225e-05, 'epoch': 0.57} {'loss': 0.5414, 'learning_rate': 1.6757188682398203e-05, 'epoch': 0.57} {'loss': 0.7086, 'learning_rate': 1.6756941009491598e-05, 'epoch': 0.57} {'loss': 0.5941, 'learning_rate': 1.6756693328957692e-05, 'epoch': 0.57} {'loss': 0.579, 'learning_rate': 1.6756445640796766e-05, 'epoch': 0.57} {'loss': 0.5507, 'learning_rate': 1.6756197945009095e-05, 'epoch': 0.57} {'loss': 0.5582, 'learning_rate': 1.6755950241594962e-05, 'epoch': 0.57} {'loss': 0.6163, 'learning_rate': 1.6755702530554646e-05, 'epoch': 0.57} {'loss': 0.6201, 'learning_rate': 1.675545481188843e-05, 'epoch': 0.57} {'loss': 0.4714, 'learning_rate': 1.6755207085596587e-05, 'epoch': 0.57} {'loss': 0.436, 'learning_rate': 1.67549593516794e-05, 'epoch': 0.57} {'loss': 0.7463, 'learning_rate': 1.675471161013715e-05, 'epoch': 0.57} {'loss': 0.5136, 'learning_rate': 1.6754463860970108e-05, 'epoch': 0.57} {'loss': 0.6674, 'learning_rate': 1.6754216104178568e-05, 'epoch': 0.57} {'loss': 0.6285, 'learning_rate': 1.67539683397628e-05, 'epoch': 0.57} {'loss': 0.6266, 'learning_rate': 1.6753720567723087e-05, 'epoch': 0.57} {'loss': 0.5167, 'learning_rate': 1.675347278805971e-05, 'epoch': 0.57} {'loss': 0.6454, 'learning_rate': 1.6753225000772944e-05, 'epoch': 0.57} {'loss': 0.7381, 'learning_rate': 1.6752977205863068e-05, 'epoch': 0.57} {'loss': 0.6186, 'learning_rate': 1.675272940333037e-05, 'epoch': 0.57} {'loss': 0.6351, 'learning_rate': 1.675248159317512e-05, 'epoch': 0.57} {'loss': 0.4182, 'learning_rate': 1.6752233775397605e-05, 'epoch': 0.57} {'loss': 0.5253, 'learning_rate': 1.6751985949998103e-05, 'epoch': 0.57} {'loss': 0.6668, 'learning_rate': 1.675173811697689e-05, 'epoch': 0.57} {'loss': 0.5809, 'learning_rate': 1.6751490276334246e-05, 'epoch': 0.57} {'loss': 0.6904, 'learning_rate': 1.675124242807046e-05, 'epoch': 0.57} {'loss': 0.556, 'learning_rate': 1.6750994572185802e-05, 'epoch': 0.57} {'loss': 0.5368, 'learning_rate': 1.675074670868056e-05, 'epoch': 0.57} {'loss': 0.5319, 'learning_rate': 1.6750498837555e-05, 'epoch': 0.57} {'loss': 0.5055, 'learning_rate': 1.675025095880942e-05, 'epoch': 0.57} {'loss': 0.5859, 'learning_rate': 1.675000307244408e-05, 'epoch': 0.57} {'loss': 0.7114, 'learning_rate': 1.6749755178459275e-05, 'epoch': 0.57} {'loss': 0.6004, 'learning_rate': 1.674950727685528e-05, 'epoch': 0.57} {'loss': 0.6818, 'learning_rate': 1.6749259367632374e-05, 'epoch': 0.57} {'loss': 0.5752, 'learning_rate': 1.674901145079084e-05, 'epoch': 0.57} {'loss': 0.6417, 'learning_rate': 1.6748763526330956e-05, 'epoch': 0.57} {'loss': 0.719, 'learning_rate': 1.6748515594252998e-05, 'epoch': 0.57} {'loss': 0.6054, 'learning_rate': 1.674826765455725e-05, 'epoch': 0.57} {'loss': 0.7063, 'learning_rate': 1.674801970724399e-05, 'epoch': 0.57} {'loss': 0.6013, 'learning_rate': 1.67477717523135e-05, 'epoch': 0.57} {'loss': 0.6393, 'learning_rate': 1.674752378976606e-05, 'epoch': 0.57} {'loss': 0.5611, 'learning_rate': 1.6747275819601948e-05, 'epoch': 0.57} {'loss': 0.4634, 'learning_rate': 1.6747027841821446e-05, 'epoch': 0.57} {'loss': 0.4116, 'learning_rate': 1.6746779856424828e-05, 'epoch': 0.57} {'loss': 0.4665, 'learning_rate': 1.6746531863412384e-05, 'epoch': 0.57} {'loss': 0.6328, 'learning_rate': 1.6746283862784385e-05, 'epoch': 0.57} {'loss': 0.7214, 'learning_rate': 1.6746035854541113e-05, 'epoch': 0.57} {'loss': 0.4674, 'learning_rate': 1.6745787838682855e-05, 'epoch': 0.57} {'loss': 0.5202, 'learning_rate': 1.6745539815209883e-05, 'epoch': 0.57} {'loss': 0.5672, 'learning_rate': 1.6745291784122478e-05, 'epoch': 0.57} {'loss': 0.5974, 'learning_rate': 1.674504374542092e-05, 'epoch': 0.57} {'loss': 0.6348, 'learning_rate': 1.6744795699105493e-05, 'epoch': 0.57} {'loss': 0.6543, 'learning_rate': 1.6744547645176472e-05, 'epoch': 0.57} {'loss': 0.5566, 'learning_rate': 1.674429958363414e-05, 'epoch': 0.57} {'loss': 0.4851, 'learning_rate': 1.6744051514478776e-05, 'epoch': 0.57} {'loss': 0.5855, 'learning_rate': 1.674380343771066e-05, 'epoch': 0.57} {'loss': 0.6078, 'learning_rate': 1.6743555353330074e-05, 'epoch': 0.57} {'loss': 0.4337, 'learning_rate': 1.6743307261337296e-05, 'epoch': 0.57} {'loss': 0.4119, 'learning_rate': 1.6743059161732603e-05, 'epoch': 0.57} {'loss': 0.6259, 'learning_rate': 1.6742811054516286e-05, 'epoch': 0.57} {'loss': 0.5519, 'learning_rate': 1.674256293968861e-05, 'epoch': 0.57} {'loss': 0.6305, 'learning_rate': 1.674231481724987e-05, 'epoch': 0.57} {'loss': 0.6057, 'learning_rate': 1.674206668720033e-05, 'epoch': 0.57} {'loss': 0.6934, 'learning_rate': 1.6741818549540284e-05, 'epoch': 0.57} {'loss': 0.62, 'learning_rate': 1.6741570404270005e-05, 'epoch': 0.57} {'loss': 0.5529, 'learning_rate': 1.6741322251389775e-05, 'epoch': 0.57} {'loss': 0.5917, 'learning_rate': 1.6741074090899876e-05, 'epoch': 0.57} {'loss': 0.6034, 'learning_rate': 1.6740825922800586e-05, 'epoch': 0.57} {'loss': 0.6856, 'learning_rate': 1.6740577747092184e-05, 'epoch': 0.57} {'loss': 0.5569, 'learning_rate': 1.674032956377495e-05, 'epoch': 0.57} {'loss': 0.6128, 'learning_rate': 1.6740081372849172e-05, 'epoch': 0.57} {'loss': 0.668, 'learning_rate': 1.6739833174315117e-05, 'epoch': 0.57} {'loss': 0.5488, 'learning_rate': 1.6739584968173073e-05, 'epoch': 0.57} {'loss': 0.697, 'learning_rate': 1.673933675442332e-05, 'epoch': 0.57} {'loss': 0.6854, 'learning_rate': 1.673908853306614e-05, 'epoch': 0.57} {'loss': 0.6872, 'learning_rate': 1.6738840304101805e-05, 'epoch': 0.57} {'loss': 0.6288, 'learning_rate': 1.6738592067530607e-05, 'epoch': 0.57} {'loss': 0.7421, 'learning_rate': 1.6738343823352816e-05, 'epoch': 0.58} {'loss': 0.5163, 'learning_rate': 1.6738095571568717e-05, 'epoch': 0.58} {'loss': 0.5486, 'learning_rate': 1.6737847312178593e-05, 'epoch': 0.58} {'loss': 0.5406, 'learning_rate': 1.6737599045182714e-05, 'epoch': 0.58} {'loss': 0.5976, 'learning_rate': 1.673735077058137e-05, 'epoch': 0.58} {'loss': 0.6065, 'learning_rate': 1.6737102488374838e-05, 'epoch': 0.58} {'loss': 0.4661, 'learning_rate': 1.67368541985634e-05, 'epoch': 0.58} {'loss': 0.7406, 'learning_rate': 1.6736605901147336e-05, 'epoch': 0.58} {'loss': 0.5107, 'learning_rate': 1.673635759612692e-05, 'epoch': 0.58} {'loss': 0.5821, 'learning_rate': 1.673610928350244e-05, 'epoch': 0.58} {'loss': 0.6448, 'learning_rate': 1.6735860963274176e-05, 'epoch': 0.58} {'loss': 0.4703, 'learning_rate': 1.67356126354424e-05, 'epoch': 0.58} {'loss': 0.6195, 'learning_rate': 1.6735364300007402e-05, 'epoch': 0.58} {'loss': 0.4676, 'learning_rate': 1.6735115956969458e-05, 'epoch': 0.58} {'loss': 0.7794, 'learning_rate': 1.6734867606328848e-05, 'epoch': 0.58} {'loss': 0.4438, 'learning_rate': 1.6734619248085856e-05, 'epoch': 0.58} {'loss': 0.582, 'learning_rate': 1.6734370882240754e-05, 'epoch': 0.58} {'loss': 0.5551, 'learning_rate': 1.6734122508793833e-05, 'epoch': 0.58} {'loss': 0.7193, 'learning_rate': 1.6733874127745367e-05, 'epoch': 0.58} {'loss': 0.7509, 'learning_rate': 1.6733625739095637e-05, 'epoch': 0.58} {'loss': 0.5494, 'learning_rate': 1.6733377342844925e-05, 'epoch': 0.58} {'loss': 0.6139, 'learning_rate': 1.673312893899351e-05, 'epoch': 0.58} {'loss': 0.5244, 'learning_rate': 1.673288052754167e-05, 'epoch': 0.58} {'loss': 0.508, 'learning_rate': 1.673263210848969e-05, 'epoch': 0.58} {'loss': 0.612, 'learning_rate': 1.673238368183785e-05, 'epoch': 0.58} {'loss': 0.5295, 'learning_rate': 1.6732135247586427e-05, 'epoch': 0.58} {'loss': 0.5813, 'learning_rate': 1.6731886805735707e-05, 'epoch': 0.58} {'loss': 0.592, 'learning_rate': 1.6731638356285966e-05, 'epoch': 0.58} {'loss': 0.5236, 'learning_rate': 1.6731389899237482e-05, 'epoch': 0.58} {'loss': 0.5366, 'learning_rate': 1.673114143459054e-05, 'epoch': 0.58} {'loss': 0.7099, 'learning_rate': 1.6730892962345418e-05, 'epoch': 0.58} {'loss': 0.6007, 'learning_rate': 1.6730644482502404e-05, 'epoch': 0.58} {'loss': 0.5216, 'learning_rate': 1.6730395995061765e-05, 'epoch': 0.58} {'loss': 0.6348, 'learning_rate': 1.6730147500023792e-05, 'epoch': 0.58} {'loss': 0.5811, 'learning_rate': 1.672989899738876e-05, 'epoch': 0.58} {'loss': 0.4989, 'learning_rate': 1.6729650487156956e-05, 'epoch': 0.58} {'loss': 0.5354, 'learning_rate': 1.6729401969328654e-05, 'epoch': 0.58} {'loss': 0.5671, 'learning_rate': 1.6729153443904137e-05, 'epoch': 0.58} {'loss': 0.6752, 'learning_rate': 1.6728904910883686e-05, 'epoch': 0.58} {'loss': 0.5081, 'learning_rate': 1.672865637026758e-05, 'epoch': 0.58} {'loss': 0.6003, 'learning_rate': 1.67284078220561e-05, 'epoch': 0.58} {'loss': 0.5536, 'learning_rate': 1.6728159266249528e-05, 'epoch': 0.58} {'loss': 0.7098, 'learning_rate': 1.6727910702848143e-05, 'epoch': 0.58} {'loss': 0.4572, 'learning_rate': 1.6727662131852227e-05, 'epoch': 0.58} {'loss': 0.724, 'learning_rate': 1.672741355326206e-05, 'epoch': 0.58} {'loss': 0.5873, 'learning_rate': 1.6727164967077922e-05, 'epoch': 0.58} {'loss': 0.4543, 'learning_rate': 1.6726916373300093e-05, 'epoch': 0.58} {'loss': 0.5351, 'learning_rate': 1.6726667771928857e-05, 'epoch': 0.58} {'loss': 0.7613, 'learning_rate': 1.672641916296449e-05, 'epoch': 0.58} {'loss': 0.4801, 'learning_rate': 1.6726170546407273e-05, 'epoch': 0.58} {'loss': 0.5609, 'learning_rate': 1.6725921922257492e-05, 'epoch': 0.58} {'loss': 0.6978, 'learning_rate': 1.6725673290515422e-05, 'epoch': 0.58} {'loss': 0.5737, 'learning_rate': 1.672542465118135e-05, 'epoch': 0.58} {'loss': 0.4249, 'learning_rate': 1.672517600425555e-05, 'epoch': 0.58} {'loss': 0.6412, 'learning_rate': 1.67249273497383e-05, 'epoch': 0.58} {'loss': 0.5349, 'learning_rate': 1.672467868762989e-05, 'epoch': 0.58} {'loss': 0.7055, 'learning_rate': 1.67244300179306e-05, 'epoch': 0.58} {'loss': 0.4741, 'learning_rate': 1.6724181340640703e-05, 'epoch': 0.58} {'loss': 0.5916, 'learning_rate': 1.6723932655760485e-05, 'epoch': 0.58} {'loss': 0.446, 'learning_rate': 1.6723683963290226e-05, 'epoch': 0.58} {'loss': 0.79, 'learning_rate': 1.6723435263230205e-05, 'epoch': 0.58} {'loss': 0.511, 'learning_rate': 1.6723186555580705e-05, 'epoch': 0.58} {'loss': 0.545, 'learning_rate': 1.6722937840342007e-05, 'epoch': 0.58} {'loss': 0.6113, 'learning_rate': 1.6722689117514388e-05, 'epoch': 0.58} {'loss': 0.4039, 'learning_rate': 1.6722440387098133e-05, 'epoch': 0.58} {'loss': 0.6549, 'learning_rate': 1.6722191649093524e-05, 'epoch': 0.58} {'loss': 0.6099, 'learning_rate': 1.6721942903500834e-05, 'epoch': 0.58} {'loss': 0.4496, 'learning_rate': 1.672169415032035e-05, 'epoch': 0.58} {'loss': 0.6514, 'learning_rate': 1.6721445389552352e-05, 'epoch': 0.58} {'loss': 0.6181, 'learning_rate': 1.672119662119712e-05, 'epoch': 0.58} {'loss': 0.6171, 'learning_rate': 1.6720947845254937e-05, 'epoch': 0.58} {'loss': 0.4873, 'learning_rate': 1.672069906172608e-05, 'epoch': 0.58} {'loss': 0.5051, 'learning_rate': 1.672045027061083e-05, 'epoch': 0.58} {'loss': 0.6694, 'learning_rate': 1.6720201471909474e-05, 'epoch': 0.58} {'loss': 0.6894, 'learning_rate': 1.6719952665622286e-05, 'epoch': 0.58} {'loss': 0.6365, 'learning_rate': 1.671970385174955e-05, 'epoch': 0.58} {'loss': 0.5534, 'learning_rate': 1.6719455030291543e-05, 'epoch': 0.58} {'loss': 0.7701, 'learning_rate': 1.6719206201248554e-05, 'epoch': 0.58} {'loss': 0.5301, 'learning_rate': 1.671895736462086e-05, 'epoch': 0.58} {'loss': 0.6309, 'learning_rate': 1.6718708520408733e-05, 'epoch': 0.58} {'loss': 0.4979, 'learning_rate': 1.6718459668612467e-05, 'epoch': 0.58} {'loss': 0.5704, 'learning_rate': 1.6718210809232336e-05, 'epoch': 0.58} {'loss': 0.5542, 'learning_rate': 1.6717961942268627e-05, 'epoch': 0.58} {'loss': 0.5246, 'learning_rate': 1.6717713067721612e-05, 'epoch': 0.58} {'loss': 0.5716, 'learning_rate': 1.6717464185591575e-05, 'epoch': 0.58} {'loss': 0.6415, 'learning_rate': 1.67172152958788e-05, 'epoch': 0.58} {'loss': 0.5419, 'learning_rate': 1.6716966398583567e-05, 'epoch': 0.58} {'loss': 0.4937, 'learning_rate': 1.6716717493706155e-05, 'epoch': 0.58} {'loss': 0.624, 'learning_rate': 1.6716468581246847e-05, 'epoch': 0.58} {'loss': 0.5288, 'learning_rate': 1.6716219661205926e-05, 'epoch': 0.58} {'loss': 0.6641, 'learning_rate': 1.6715970733583667e-05, 'epoch': 0.58} {'loss': 0.5257, 'learning_rate': 1.6715721798380355e-05, 'epoch': 0.58} {'loss': 0.679, 'learning_rate': 1.671547285559627e-05, 'epoch': 0.58} {'loss': 0.5883, 'learning_rate': 1.6715223905231692e-05, 'epoch': 0.58} {'loss': 0.5275, 'learning_rate': 1.6714974947286904e-05, 'epoch': 0.58} {'loss': 0.5893, 'learning_rate': 1.6714725981762187e-05, 'epoch': 0.58} {'loss': 0.6981, 'learning_rate': 1.6714477008657816e-05, 'epoch': 0.58} {'loss': 0.6086, 'learning_rate': 1.6714228027974083e-05, 'epoch': 0.58} {'loss': 0.5867, 'learning_rate': 1.6713979039711265e-05, 'epoch': 0.58} {'loss': 0.6933, 'learning_rate': 1.671373004386964e-05, 'epoch': 0.58} {'loss': 0.5093, 'learning_rate': 1.6713481040449486e-05, 'epoch': 0.58} {'loss': 0.6044, 'learning_rate': 1.671323202945109e-05, 'epoch': 0.58} {'loss': 0.7376, 'learning_rate': 1.6712983010874735e-05, 'epoch': 0.58} {'loss': 0.77, 'learning_rate': 1.6712733984720694e-05, 'epoch': 0.58} {'loss': 0.6748, 'learning_rate': 1.671248495098926e-05, 'epoch': 0.58} {'loss': 0.5559, 'learning_rate': 1.67122359096807e-05, 'epoch': 0.58} {'loss': 0.5129, 'learning_rate': 1.6711986860795305e-05, 'epoch': 0.58} {'loss': 0.5932, 'learning_rate': 1.671173780433335e-05, 'epoch': 0.58} {'loss': 0.6043, 'learning_rate': 1.6711488740295125e-05, 'epoch': 0.58} {'loss': 0.5316, 'learning_rate': 1.6711239668680904e-05, 'epoch': 0.58} {'loss': 0.6518, 'learning_rate': 1.6710990589490966e-05, 'epoch': 0.58} {'loss': 0.5648, 'learning_rate': 1.67107415027256e-05, 'epoch': 0.58} {'loss': 0.7204, 'learning_rate': 1.671049240838508e-05, 'epoch': 0.58} {'loss': 0.7462, 'learning_rate': 1.6710243306469692e-05, 'epoch': 0.58} {'loss': 0.4378, 'learning_rate': 1.6709994196979712e-05, 'epoch': 0.58} {'loss': 0.6224, 'learning_rate': 1.6709745079915427e-05, 'epoch': 0.58} {'loss': 0.673, 'learning_rate': 1.6709495955277117e-05, 'epoch': 0.58} {'loss': 0.6057, 'learning_rate': 1.670924682306506e-05, 'epoch': 0.58} {'loss': 0.6951, 'learning_rate': 1.6708997683279538e-05, 'epoch': 0.58} {'loss': 0.5507, 'learning_rate': 1.670874853592084e-05, 'epoch': 0.58} {'loss': 0.561, 'learning_rate': 1.670849938098923e-05, 'epoch': 0.58} {'loss': 0.5509, 'learning_rate': 1.6708250218485007e-05, 'epoch': 0.58} {'loss': 0.5553, 'learning_rate': 1.6708001048408444e-05, 'epoch': 0.58} {'loss': 0.6221, 'learning_rate': 1.6707751870759823e-05, 'epoch': 0.58} {'loss': 0.4816, 'learning_rate': 1.6707502685539425e-05, 'epoch': 0.58} {'loss': 0.5222, 'learning_rate': 1.6707253492747532e-05, 'epoch': 0.58} {'loss': 0.7109, 'learning_rate': 1.670700429238443e-05, 'epoch': 0.58} {'loss': 0.487, 'learning_rate': 1.670675508445039e-05, 'epoch': 0.58} {'loss': 0.4915, 'learning_rate': 1.67065058689457e-05, 'epoch': 0.58} {'loss': 0.638, 'learning_rate': 1.670625664587064e-05, 'epoch': 0.58} {'loss': 0.6587, 'learning_rate': 1.6706007415225493e-05, 'epoch': 0.58} {'loss': 0.6569, 'learning_rate': 1.6705758177010537e-05, 'epoch': 0.58} {'loss': 0.552, 'learning_rate': 1.6705508931226057e-05, 'epoch': 0.58} {'loss': 0.6072, 'learning_rate': 1.670525967787233e-05, 'epoch': 0.58} {'loss': 0.5126, 'learning_rate': 1.670501041694964e-05, 'epoch': 0.58} {'loss': 0.6548, 'learning_rate': 1.6704761148458272e-05, 'epoch': 0.58} {'loss': 0.6039, 'learning_rate': 1.67045118723985e-05, 'epoch': 0.58} {'loss': 0.5964, 'learning_rate': 1.670426258877061e-05, 'epoch': 0.58} {'loss': 0.5763, 'learning_rate': 1.6704013297574885e-05, 'epoch': 0.58} {'loss': 0.555, 'learning_rate': 1.6703763998811598e-05, 'epoch': 0.58} {'loss': 0.7234, 'learning_rate': 1.670351469248104e-05, 'epoch': 0.58} {'loss': 0.6386, 'learning_rate': 1.670326537858349e-05, 'epoch': 0.58} {'loss': 0.5131, 'learning_rate': 1.670301605711923e-05, 'epoch': 0.58} {'loss': 0.5242, 'learning_rate': 1.6702766728088534e-05, 'epoch': 0.58} {'loss': 0.6744, 'learning_rate': 1.670251739149169e-05, 'epoch': 0.58} {'loss': 0.5686, 'learning_rate': 1.670226804732898e-05, 'epoch': 0.58} {'loss': 0.5155, 'learning_rate': 1.670201869560068e-05, 'epoch': 0.58} {'loss': 0.6463, 'learning_rate': 1.670176933630708e-05, 'epoch': 0.58} {'loss': 0.7039, 'learning_rate': 1.6701519969448457e-05, 'epoch': 0.58} {'loss': 0.5863, 'learning_rate': 1.670127059502509e-05, 'epoch': 0.58} {'loss': 0.4533, 'learning_rate': 1.6701021213037262e-05, 'epoch': 0.58} {'loss': 0.5788, 'learning_rate': 1.6700771823485257e-05, 'epoch': 0.58} {'loss': 0.5278, 'learning_rate': 1.6700522426369356e-05, 'epoch': 0.58} {'loss': 0.5184, 'learning_rate': 1.670027302168984e-05, 'epoch': 0.58} {'loss': 0.5921, 'learning_rate': 1.6700023609446984e-05, 'epoch': 0.58} {'loss': 0.7346, 'learning_rate': 1.6699774189641083e-05, 'epoch': 0.58} {'loss': 0.588, 'learning_rate': 1.6699524762272404e-05, 'epoch': 0.58} {'loss': 0.6721, 'learning_rate': 1.669927532734124e-05, 'epoch': 0.58} {'loss': 0.6929, 'learning_rate': 1.6699025884847868e-05, 'epoch': 0.58} {'loss': 0.563, 'learning_rate': 1.6698776434792567e-05, 'epoch': 0.58} {'loss': 0.5394, 'learning_rate': 1.6698526977175623e-05, 'epoch': 0.58} {'loss': 0.5466, 'learning_rate': 1.6698277511997315e-05, 'epoch': 0.58} {'loss': 0.5539, 'learning_rate': 1.669802803925793e-05, 'epoch': 0.58} {'loss': 0.6633, 'learning_rate': 1.6697778558957738e-05, 'epoch': 0.58} {'loss': 0.525, 'learning_rate': 1.6697529071097032e-05, 'epoch': 0.58} {'loss': 0.6574, 'learning_rate': 1.669727957567609e-05, 'epoch': 0.58} {'loss': 0.463, 'learning_rate': 1.6697030072695185e-05, 'epoch': 0.58} {'loss': 0.6896, 'learning_rate': 1.6696780562154616e-05, 'epoch': 0.58} {'loss': 0.512, 'learning_rate': 1.669653104405465e-05, 'epoch': 0.58} {'loss': 0.6067, 'learning_rate': 1.6696281518395578e-05, 'epoch': 0.58} {'loss': 0.5823, 'learning_rate': 1.669603198517767e-05, 'epoch': 0.58} {'loss': 0.6561, 'learning_rate': 1.6695782444401224e-05, 'epoch': 0.58} {'loss': 0.5773, 'learning_rate': 1.669553289606651e-05, 'epoch': 0.58} {'loss': 0.5905, 'learning_rate': 1.669528334017381e-05, 'epoch': 0.58} {'loss': 0.6532, 'learning_rate': 1.669503377672341e-05, 'epoch': 0.58} {'loss': 0.4735, 'learning_rate': 1.669478420571559e-05, 'epoch': 0.58} {'loss': 0.3811, 'learning_rate': 1.669453462715063e-05, 'epoch': 0.58} {'loss': 0.5925, 'learning_rate': 1.669428504102882e-05, 'epoch': 0.58} {'loss': 0.6939, 'learning_rate': 1.6694035447350428e-05, 'epoch': 0.58} {'loss': 0.6488, 'learning_rate': 1.6693785846115744e-05, 'epoch': 0.58} {'loss': 0.6874, 'learning_rate': 1.669353623732505e-05, 'epoch': 0.58} {'loss': 0.5304, 'learning_rate': 1.6693286620978627e-05, 'epoch': 0.58} {'loss': 0.7223, 'learning_rate': 1.6693036997076756e-05, 'epoch': 0.58} {'loss': 0.6139, 'learning_rate': 1.6692787365619717e-05, 'epoch': 0.58} {'loss': 0.4388, 'learning_rate': 1.6692537726607794e-05, 'epoch': 0.58} {'loss': 0.5884, 'learning_rate': 1.6692288080041273e-05, 'epoch': 0.58} {'loss': 0.6048, 'learning_rate': 1.6692038425920424e-05, 'epoch': 0.58} {'loss': 0.5679, 'learning_rate': 1.669178876424554e-05, 'epoch': 0.58} {'loss': 0.462, 'learning_rate': 1.66915390950169e-05, 'epoch': 0.58} {'loss': 0.7378, 'learning_rate': 1.6691289418234787e-05, 'epoch': 0.58} {'loss': 0.6567, 'learning_rate': 1.6691039733899476e-05, 'epoch': 0.58} {'loss': 0.6397, 'learning_rate': 1.6690790042011254e-05, 'epoch': 0.58} {'loss': 0.5332, 'learning_rate': 1.6690540342570405e-05, 'epoch': 0.58} {'loss': 0.469, 'learning_rate': 1.6690290635577207e-05, 'epoch': 0.58} {'loss': 0.541, 'learning_rate': 1.669004092103194e-05, 'epoch': 0.58} {'loss': 0.6652, 'learning_rate': 1.6689791198934893e-05, 'epoch': 0.58} {'loss': 0.5984, 'learning_rate': 1.668954146928634e-05, 'epoch': 0.58} {'loss': 0.5219, 'learning_rate': 1.6689291732086573e-05, 'epoch': 0.58} {'loss': 0.5292, 'learning_rate': 1.6689041987335862e-05, 'epoch': 0.58} {'loss': 0.5446, 'learning_rate': 1.6688792235034496e-05, 'epoch': 0.58} {'loss': 0.6275, 'learning_rate': 1.668854247518276e-05, 'epoch': 0.58} {'loss': 0.5664, 'learning_rate': 1.6688292707780926e-05, 'epoch': 0.58} {'loss': 0.6941, 'learning_rate': 1.668804293282928e-05, 'epoch': 0.58} {'loss': 0.487, 'learning_rate': 1.6687793150328108e-05, 'epoch': 0.58} {'loss': 0.6397, 'learning_rate': 1.6687543360277692e-05, 'epoch': 0.58} {'loss': 0.6178, 'learning_rate': 1.6687293562678308e-05, 'epoch': 0.58} {'loss': 0.569, 'learning_rate': 1.6687043757530244e-05, 'epoch': 0.58} {'loss': 0.67, 'learning_rate': 1.6686793944833775e-05, 'epoch': 0.58} {'loss': 0.5929, 'learning_rate': 1.668654412458919e-05, 'epoch': 0.58} {'loss': 0.6691, 'learning_rate': 1.6686294296796767e-05, 'epoch': 0.58} {'loss': 0.5326, 'learning_rate': 1.668604446145679e-05, 'epoch': 0.58} {'loss': 0.5659, 'learning_rate': 1.668579461856954e-05, 'epoch': 0.58} {'loss': 0.5826, 'learning_rate': 1.66855447681353e-05, 'epoch': 0.58} {'loss': 0.5603, 'learning_rate': 1.6685294910154352e-05, 'epoch': 0.58} {'loss': 0.4727, 'learning_rate': 1.6685045044626974e-05, 'epoch': 0.58} {'loss': 0.5903, 'learning_rate': 1.6684795171553455e-05, 'epoch': 0.58} {'loss': 0.5926, 'learning_rate': 1.6684545290934068e-05, 'epoch': 0.58} {'loss': 0.7913, 'learning_rate': 1.6684295402769105e-05, 'epoch': 0.58} {'loss': 0.5547, 'learning_rate': 1.6684045507058843e-05, 'epoch': 0.58} {'loss': 0.5819, 'learning_rate': 1.6683795603803565e-05, 'epoch': 0.58} {'loss': 0.5957, 'learning_rate': 1.668354569300355e-05, 'epoch': 0.58} {'loss': 0.576, 'learning_rate': 1.6683295774659084e-05, 'epoch': 0.58} {'loss': 0.6973, 'learning_rate': 1.668304584877045e-05, 'epoch': 0.58} {'loss': 0.6966, 'learning_rate': 1.6682795915337927e-05, 'epoch': 0.58} {'loss': 0.6918, 'learning_rate': 1.6682545974361797e-05, 'epoch': 0.58} {'loss': 0.4676, 'learning_rate': 1.668229602584235e-05, 'epoch': 0.58} {'loss': 0.6306, 'learning_rate': 1.668204606977985e-05, 'epoch': 0.58} {'loss': 0.7047, 'learning_rate': 1.66817961061746e-05, 'epoch': 0.58} {'loss': 0.5232, 'learning_rate': 1.668154613502687e-05, 'epoch': 0.58} {'loss': 0.4539, 'learning_rate': 1.6681296156336944e-05, 'epoch': 0.58} {'loss': 0.6118, 'learning_rate': 1.6681046170105105e-05, 'epoch': 0.58} {'loss': 0.6519, 'learning_rate': 1.6680796176331636e-05, 'epoch': 0.58} {'loss': 0.5592, 'learning_rate': 1.6680546175016817e-05, 'epoch': 0.58} {'loss': 0.5883, 'learning_rate': 1.6680296166160935e-05, 'epoch': 0.58} {'loss': 0.4206, 'learning_rate': 1.6680046149764267e-05, 'epoch': 0.58} {'loss': 0.5929, 'learning_rate': 1.6679796125827095e-05, 'epoch': 0.58} {'loss': 0.5695, 'learning_rate': 1.6679546094349707e-05, 'epoch': 0.58} {'loss': 0.4618, 'learning_rate': 1.667929605533238e-05, 'epoch': 0.58} {'loss': 0.5051, 'learning_rate': 1.66790460087754e-05, 'epoch': 0.58} {'loss': 0.5774, 'learning_rate': 1.6678795954679044e-05, 'epoch': 0.58} {'loss': 0.6779, 'learning_rate': 1.6678545893043597e-05, 'epoch': 0.58} {'loss': 0.6047, 'learning_rate': 1.6678295823869343e-05, 'epoch': 0.58} {'loss': 0.5813, 'learning_rate': 1.6678045747156563e-05, 'epoch': 0.58} {'loss': 0.5549, 'learning_rate': 1.667779566290554e-05, 'epoch': 0.58} {'loss': 0.5419, 'learning_rate': 1.6677545571116556e-05, 'epoch': 0.58} {'loss': 0.5424, 'learning_rate': 1.667729547178989e-05, 'epoch': 0.58} {'loss': 0.558, 'learning_rate': 1.667704536492583e-05, 'epoch': 0.58} {'loss': 0.4468, 'learning_rate': 1.6676795250524654e-05, 'epoch': 0.58} {'loss': 0.5733, 'learning_rate': 1.6676545128586647e-05, 'epoch': 0.58} {'loss': 0.4821, 'learning_rate': 1.6676294999112087e-05, 'epoch': 0.58} {'loss': 0.6817, 'learning_rate': 1.6676044862101265e-05, 'epoch': 0.58} {'loss': 0.5718, 'learning_rate': 1.6675794717554455e-05, 'epoch': 0.58} {'loss': 0.4839, 'learning_rate': 1.667554456547194e-05, 'epoch': 0.58} {'loss': 0.5135, 'learning_rate': 1.6675294405854007e-05, 'epoch': 0.58} {'loss': 0.5496, 'learning_rate': 1.6675044238700934e-05, 'epoch': 0.58} {'loss': 0.6869, 'learning_rate': 1.667479406401301e-05, 'epoch': 0.58} {'loss': 0.5528, 'learning_rate': 1.667454388179051e-05, 'epoch': 0.58} {'loss': 0.4256, 'learning_rate': 1.667429369203372e-05, 'epoch': 0.58} {'loss': 0.6827, 'learning_rate': 1.6674043494742916e-05, 'epoch': 0.58} {'loss': 0.6947, 'learning_rate': 1.6673793289918392e-05, 'epoch': 0.58} {'loss': 0.6682, 'learning_rate': 1.6673543077560425e-05, 'epoch': 0.58} {'loss': 0.5384, 'learning_rate': 1.6673292857669296e-05, 'epoch': 0.58} {'loss': 0.5222, 'learning_rate': 1.6673042630245286e-05, 'epoch': 0.58} {'loss': 0.6551, 'learning_rate': 1.6672792395288683e-05, 'epoch': 0.58} {'loss': 0.6465, 'learning_rate': 1.667254215279976e-05, 'epoch': 0.58} {'loss': 0.5675, 'learning_rate': 1.6672291902778813e-05, 'epoch': 0.58} {'loss': 0.6113, 'learning_rate': 1.6672041645226112e-05, 'epoch': 0.58} {'loss': 0.5134, 'learning_rate': 1.667179138014195e-05, 'epoch': 0.58} {'loss': 0.3659, 'learning_rate': 1.66715411075266e-05, 'epoch': 0.58} {'loss': 0.5821, 'learning_rate': 1.667129082738035e-05, 'epoch': 0.58} {'loss': 0.6381, 'learning_rate': 1.667104053970348e-05, 'epoch': 0.58} {'loss': 0.5232, 'learning_rate': 1.6670790244496276e-05, 'epoch': 0.58} {'loss': 0.5809, 'learning_rate': 1.667053994175902e-05, 'epoch': 0.58} {'loss': 0.7096, 'learning_rate': 1.667028963149199e-05, 'epoch': 0.58} {'loss': 0.2589, 'learning_rate': 1.667003931369547e-05, 'epoch': 0.58} {'loss': 0.7486, 'learning_rate': 1.6669788988369747e-05, 'epoch': 0.58} {'loss': 0.5211, 'learning_rate': 1.6669538655515096e-05, 'epoch': 0.58} {'loss': 0.5405, 'learning_rate': 1.666928831513181e-05, 'epoch': 0.58} {'loss': 0.516, 'learning_rate': 1.666903796722016e-05, 'epoch': 0.58} {'loss': 0.7058, 'learning_rate': 1.666878761178044e-05, 'epoch': 0.58} {'loss': 0.6663, 'learning_rate': 1.6668537248812922e-05, 'epoch': 0.58} {'loss': 0.6051, 'learning_rate': 1.66682868783179e-05, 'epoch': 0.58} {'loss': 0.5286, 'learning_rate': 1.6668036500295642e-05, 'epoch': 0.58} {'loss': 0.6678, 'learning_rate': 1.6667786114746444e-05, 'epoch': 0.58} {'loss': 0.5189, 'learning_rate': 1.6667535721670582e-05, 'epoch': 0.58} {'loss': 0.6046, 'learning_rate': 1.666728532106834e-05, 'epoch': 0.58} {'loss': 0.4543, 'learning_rate': 1.6667034912940003e-05, 'epoch': 0.58} {'loss': 0.3903, 'learning_rate': 1.6666784497285848e-05, 'epoch': 0.58} {'loss': 0.6797, 'learning_rate': 1.666653407410616e-05, 'epoch': 0.58} {'loss': 0.6046, 'learning_rate': 1.666628364340123e-05, 'epoch': 0.58} {'loss': 0.5626, 'learning_rate': 1.6666033205171325e-05, 'epoch': 0.58} {'loss': 0.5687, 'learning_rate': 1.666578275941674e-05, 'epoch': 0.58} {'loss': 0.4976, 'learning_rate': 1.6665532306137754e-05, 'epoch': 0.58} {'loss': 0.7237, 'learning_rate': 1.666528184533465e-05, 'epoch': 0.58} {'loss': 0.5815, 'learning_rate': 1.666503137700771e-05, 'epoch': 0.58} {'loss': 0.5164, 'learning_rate': 1.6664780901157213e-05, 'epoch': 0.58} {'loss': 0.4965, 'learning_rate': 1.666453041778345e-05, 'epoch': 0.58} {'loss': 0.4938, 'learning_rate': 1.66642799268867e-05, 'epoch': 0.58} {'loss': 0.7339, 'learning_rate': 1.666402942846724e-05, 'epoch': 0.58} {'loss': 0.54, 'learning_rate': 1.6663778922525363e-05, 'epoch': 0.58} {'loss': 0.4955, 'learning_rate': 1.6663528409061345e-05, 'epoch': 0.58} {'loss': 0.6315, 'learning_rate': 1.6663277888075472e-05, 'epoch': 0.58} {'loss': 0.5405, 'learning_rate': 1.6663027359568024e-05, 'epoch': 0.58} {'loss': 0.7082, 'learning_rate': 1.6662776823539286e-05, 'epoch': 0.58} {'loss': 0.7223, 'learning_rate': 1.666252627998954e-05, 'epoch': 0.58} {'loss': 0.5656, 'learning_rate': 1.6662275728919068e-05, 'epoch': 0.58} {'loss': 0.6816, 'learning_rate': 1.6662025170328154e-05, 'epoch': 0.58} {'loss': 0.5448, 'learning_rate': 1.666177460421708e-05, 'epoch': 0.58} {'loss': 0.6204, 'learning_rate': 1.6661524030586128e-05, 'epoch': 0.58} {'loss': 0.5625, 'learning_rate': 1.6661273449435586e-05, 'epoch': 0.58} {'loss': 0.4928, 'learning_rate': 1.666102286076573e-05, 'epoch': 0.58} {'loss': 0.6128, 'learning_rate': 1.6660772264576848e-05, 'epoch': 0.58} {'loss': 0.539, 'learning_rate': 1.666052166086922e-05, 'epoch': 0.58} {'loss': 0.496, 'learning_rate': 1.6660271049643125e-05, 'epoch': 0.58} {'loss': 0.57, 'learning_rate': 1.6660020430898855e-05, 'epoch': 0.58} {'loss': 0.6098, 'learning_rate': 1.6659769804636686e-05, 'epoch': 0.58} {'loss': 0.6981, 'learning_rate': 1.6659519170856907e-05, 'epoch': 0.58} {'loss': 0.5515, 'learning_rate': 1.6659268529559795e-05, 'epoch': 0.58} {'loss': 0.58, 'learning_rate': 1.6659017880745635e-05, 'epoch': 0.58} {'loss': 0.6252, 'learning_rate': 1.6658767224414712e-05, 'epoch': 0.58} {'loss': 0.6535, 'learning_rate': 1.6658516560567303e-05, 'epoch': 0.58} {'loss': 0.5206, 'learning_rate': 1.66582658892037e-05, 'epoch': 0.58} {'loss': 0.4357, 'learning_rate': 1.6658015210324176e-05, 'epoch': 0.58} {'loss': 0.5594, 'learning_rate': 1.665776452392902e-05, 'epoch': 0.58} {'loss': 0.5716, 'learning_rate': 1.665751383001852e-05, 'epoch': 0.58} {'loss': 0.5998, 'learning_rate': 1.6657263128592943e-05, 'epoch': 0.58} {'loss': 0.542, 'learning_rate': 1.665701241965259e-05, 'epoch': 0.58} {'loss': 0.6372, 'learning_rate': 1.6656761703197733e-05, 'epoch': 0.58} {'loss': 0.6332, 'learning_rate': 1.6656510979228654e-05, 'epoch': 0.58} {'loss': 0.5477, 'learning_rate': 1.6656260247745647e-05, 'epoch': 0.58} {'loss': 0.582, 'learning_rate': 1.6656009508748983e-05, 'epoch': 0.58} {'loss': 0.4979, 'learning_rate': 1.6655758762238955e-05, 'epoch': 0.58} {'loss': 0.6347, 'learning_rate': 1.6655508008215835e-05, 'epoch': 0.58} {'loss': 0.59, 'learning_rate': 1.6655257246679913e-05, 'epoch': 0.58} {'loss': 0.6538, 'learning_rate': 1.6655006477631476e-05, 'epoch': 0.58} {'loss': 0.7123, 'learning_rate': 1.66547557010708e-05, 'epoch': 0.58} {'loss': 0.6149, 'learning_rate': 1.6654504916998166e-05, 'epoch': 0.58} {'loss': 0.6323, 'learning_rate': 1.6654254125413865e-05, 'epoch': 0.58} {'loss': 0.5707, 'learning_rate': 1.6654003326318174e-05, 'epoch': 0.58} {'loss': 0.6288, 'learning_rate': 1.665375251971138e-05, 'epoch': 0.58} {'loss': 0.4663, 'learning_rate': 1.6653501705593768e-05, 'epoch': 0.58} {'loss': 0.645, 'learning_rate': 1.6653250883965615e-05, 'epoch': 0.58} {'loss': 0.4655, 'learning_rate': 1.6653000054827204e-05, 'epoch': 0.58} {'loss': 0.605, 'learning_rate': 1.6652749218178822e-05, 'epoch': 0.58} {'loss': 0.5137, 'learning_rate': 1.6652498374020755e-05, 'epoch': 0.58} {'loss': 0.6354, 'learning_rate': 1.6652247522353284e-05, 'epoch': 0.58} {'loss': 0.7699, 'learning_rate': 1.6651996663176682e-05, 'epoch': 0.58} {'loss': 0.6717, 'learning_rate': 1.665174579649125e-05, 'epoch': 0.58} {'loss': 0.6443, 'learning_rate': 1.6651494922297254e-05, 'epoch': 0.58} {'loss': 0.5759, 'learning_rate': 1.665124404059499e-05, 'epoch': 0.58} {'loss': 0.5244, 'learning_rate': 1.6650993151384735e-05, 'epoch': 0.58} {'loss': 0.5095, 'learning_rate': 1.6650742254666772e-05, 'epoch': 0.58} {'loss': 0.569, 'learning_rate': 1.6650491350441387e-05, 'epoch': 0.58} {'loss': 0.6413, 'learning_rate': 1.665024043870886e-05, 'epoch': 0.58} {'loss': 0.7063, 'learning_rate': 1.6649989519469482e-05, 'epoch': 0.58} {'loss': 0.5747, 'learning_rate': 1.6649738592723527e-05, 'epoch': 0.58} {'loss': 0.588, 'learning_rate': 1.664948765847128e-05, 'epoch': 0.58} {'loss': 0.6834, 'learning_rate': 1.6649236716713027e-05, 'epoch': 0.58} {'loss': 0.6203, 'learning_rate': 1.664898576744905e-05, 'epoch': 0.58} {'loss': 0.5779, 'learning_rate': 1.6648734810679633e-05, 'epoch': 0.58} {'loss': 0.6511, 'learning_rate': 1.664848384640506e-05, 'epoch': 0.58} {'loss': 0.4875, 'learning_rate': 1.6648232874625613e-05, 'epoch': 0.58} {'loss': 0.5111, 'learning_rate': 1.6647981895341573e-05, 'epoch': 0.58} {'loss': 0.6827, 'learning_rate': 1.6647730908553223e-05, 'epoch': 0.58} {'loss': 0.4933, 'learning_rate': 1.6647479914260853e-05, 'epoch': 0.58} {'loss': 0.6191, 'learning_rate': 1.664722891246474e-05, 'epoch': 0.58} {'loss': 0.5154, 'learning_rate': 1.6646977903165172e-05, 'epoch': 0.58} {'loss': 0.593, 'learning_rate': 1.664672688636243e-05, 'epoch': 0.58} {'loss': 0.6334, 'learning_rate': 1.6646475862056797e-05, 'epoch': 0.58} {'loss': 0.6128, 'learning_rate': 1.6646224830248555e-05, 'epoch': 0.58} {'loss': 0.3876, 'learning_rate': 1.664597379093799e-05, 'epoch': 0.58} {'loss': 0.5324, 'learning_rate': 1.6645722744125382e-05, 'epoch': 0.58} {'loss': 0.708, 'learning_rate': 1.664547168981102e-05, 'epoch': 0.58} {'loss': 0.7089, 'learning_rate': 1.6645220627995183e-05, 'epoch': 0.58} {'loss': 0.6727, 'learning_rate': 1.664496955867816e-05, 'epoch': 0.58} {'loss': 0.4409, 'learning_rate': 1.664471848186022e-05, 'epoch': 0.58} {'loss': 0.4379, 'learning_rate': 1.6644467397541662e-05, 'epoch': 0.58} {'loss': 0.5871, 'learning_rate': 1.6644216305722766e-05, 'epoch': 0.58} {'loss': 0.6107, 'learning_rate': 1.6643965206403812e-05, 'epoch': 0.58} {'loss': 0.7008, 'learning_rate': 1.6643714099585084e-05, 'epoch': 0.58} {'loss': 0.5411, 'learning_rate': 1.6643462985266868e-05, 'epoch': 0.58} {'loss': 0.6466, 'learning_rate': 1.6643211863449442e-05, 'epoch': 0.58} {'loss': 0.6492, 'learning_rate': 1.6642960734133095e-05, 'epoch': 0.58} {'loss': 0.5814, 'learning_rate': 1.6642709597318107e-05, 'epoch': 0.58} {'loss': 0.6393, 'learning_rate': 1.6642458453004767e-05, 'epoch': 0.58} {'loss': 0.6351, 'learning_rate': 1.664220730119335e-05, 'epoch': 0.58} {'loss': 0.6904, 'learning_rate': 1.6641956141884145e-05, 'epoch': 0.58} {'loss': 0.4479, 'learning_rate': 1.6641704975077435e-05, 'epoch': 0.58} {'loss': 0.6172, 'learning_rate': 1.6641453800773505e-05, 'epoch': 0.58} {'loss': 0.5022, 'learning_rate': 1.6641202618972638e-05, 'epoch': 0.58} {'loss': 0.4795, 'learning_rate': 1.664095142967511e-05, 'epoch': 0.58} {'loss': 0.6465, 'learning_rate': 1.6640700232881214e-05, 'epoch': 0.58} {'loss': 0.6333, 'learning_rate': 1.664044902859123e-05, 'epoch': 0.58} {'loss': 0.672, 'learning_rate': 1.664019781680544e-05, 'epoch': 0.58} {'loss': 0.6225, 'learning_rate': 1.663994659752413e-05, 'epoch': 0.58} {'loss': 0.6843, 'learning_rate': 1.6639695370747584e-05, 'epoch': 0.58} {'loss': 0.3486, 'learning_rate': 1.6639444136476085e-05, 'epoch': 0.58} {'loss': 0.647, 'learning_rate': 1.6639192894709918e-05, 'epoch': 0.58} {'loss': 0.7016, 'learning_rate': 1.663894164544936e-05, 'epoch': 0.58} {'loss': 0.6631, 'learning_rate': 1.6638690388694705e-05, 'epoch': 0.58} {'loss': 0.4292, 'learning_rate': 1.6638439124446226e-05, 'epoch': 0.58} {'loss': 0.6366, 'learning_rate': 1.6638187852704213e-05, 'epoch': 0.58} {'loss': 0.654, 'learning_rate': 1.663793657346895e-05, 'epoch': 0.58} {'loss': 0.5958, 'learning_rate': 1.6637685286740718e-05, 'epoch': 0.58} {'loss': 0.5394, 'learning_rate': 1.6637433992519802e-05, 'epoch': 0.58} {'loss': 0.6248, 'learning_rate': 1.6637182690806483e-05, 'epoch': 0.58} {'loss': 0.4395, 'learning_rate': 1.6636931381601046e-05, 'epoch': 0.58} {'loss': 0.7211, 'learning_rate': 1.663668006490378e-05, 'epoch': 0.58} {'loss': 0.583, 'learning_rate': 1.663642874071496e-05, 'epoch': 0.58} {'loss': 0.6417, 'learning_rate': 1.6636177409034875e-05, 'epoch': 0.58} {'loss': 0.6665, 'learning_rate': 1.663592606986381e-05, 'epoch': 0.58} {'loss': 0.7318, 'learning_rate': 1.6635674723202046e-05, 'epoch': 0.58} {'loss': 0.5153, 'learning_rate': 1.6635423369049863e-05, 'epoch': 0.58} {'loss': 0.6615, 'learning_rate': 1.6635172007407553e-05, 'epoch': 0.58} {'loss': 0.4117, 'learning_rate': 1.6634920638275393e-05, 'epoch': 0.58} {'loss': 0.5456, 'learning_rate': 1.6634669261653672e-05, 'epoch': 0.58} {'loss': 0.4074, 'learning_rate': 1.663441787754267e-05, 'epoch': 0.58} {'loss': 0.606, 'learning_rate': 1.663416648594267e-05, 'epoch': 0.58} {'loss': 0.617, 'learning_rate': 1.663391508685396e-05, 'epoch': 0.58} {'loss': 0.511, 'learning_rate': 1.663366368027682e-05, 'epoch': 0.58} {'loss': 0.7079, 'learning_rate': 1.6633412266211534e-05, 'epoch': 0.58} {'loss': 0.5676, 'learning_rate': 1.6633160844658388e-05, 'epoch': 0.58} {'loss': 0.4662, 'learning_rate': 1.6632909415617664e-05, 'epoch': 0.58} {'loss': 0.4768, 'learning_rate': 1.663265797908965e-05, 'epoch': 0.58} {'loss': 0.6654, 'learning_rate': 1.6632406535074623e-05, 'epoch': 0.58} {'loss': 0.4825, 'learning_rate': 1.663215508357287e-05, 'epoch': 0.58} {'loss': 0.6203, 'learning_rate': 1.6631903624584678e-05, 'epoch': 0.58} {'loss': 0.6156, 'learning_rate': 1.6631652158110325e-05, 'epoch': 0.58} {'loss': 0.6942, 'learning_rate': 1.6631400684150102e-05, 'epoch': 0.58} {'loss': 0.6762, 'learning_rate': 1.6631149202704283e-05, 'epoch': 0.58} {'loss': 0.4728, 'learning_rate': 1.6630897713773162e-05, 'epoch': 0.58} {'loss': 0.537, 'learning_rate': 1.6630646217357015e-05, 'epoch': 0.58} {'loss': 0.6768, 'learning_rate': 1.6630394713456132e-05, 'epoch': 0.58} {'loss': 0.5693, 'learning_rate': 1.663014320207079e-05, 'epoch': 0.58} {'loss': 0.637, 'learning_rate': 1.662989168320128e-05, 'epoch': 0.58} {'loss': 0.5538, 'learning_rate': 1.6629640156847886e-05, 'epoch': 0.58} {'loss': 0.4905, 'learning_rate': 1.6629388623010884e-05, 'epoch': 0.58} {'loss': 0.3215, 'learning_rate': 1.662913708169057e-05, 'epoch': 0.58} {'loss': 0.5999, 'learning_rate': 1.6628885532887213e-05, 'epoch': 0.58} {'loss': 0.6171, 'learning_rate': 1.662863397660111e-05, 'epoch': 0.58} {'loss': 0.627, 'learning_rate': 1.6628382412832534e-05, 'epoch': 0.58} {'loss': 0.5208, 'learning_rate': 1.6628130841581778e-05, 'epoch': 0.58} {'loss': 0.5868, 'learning_rate': 1.6627879262849126e-05, 'epoch': 0.58} {'loss': 0.6176, 'learning_rate': 1.6627627676634852e-05, 'epoch': 0.58} {'loss': 0.6593, 'learning_rate': 1.662737608293925e-05, 'epoch': 0.58} {'loss': 0.4824, 'learning_rate': 1.66271244817626e-05, 'epoch': 0.58} {'loss': 0.4771, 'learning_rate': 1.662687287310519e-05, 'epoch': 0.58} {'loss': 0.6534, 'learning_rate': 1.6626621256967297e-05, 'epoch': 0.58} {'loss': 0.6563, 'learning_rate': 1.662636963334921e-05, 'epoch': 0.58} {'loss': 0.582, 'learning_rate': 1.662611800225121e-05, 'epoch': 0.58} {'loss': 0.579, 'learning_rate': 1.6625866363673586e-05, 'epoch': 0.58} {'loss': 0.6318, 'learning_rate': 1.6625614717616617e-05, 'epoch': 0.58} {'loss': 0.516, 'learning_rate': 1.6625363064080588e-05, 'epoch': 0.58} {'loss': 0.4096, 'learning_rate': 1.6625111403065786e-05, 'epoch': 0.58} {'loss': 0.5438, 'learning_rate': 1.6624859734572493e-05, 'epoch': 0.58} {'loss': 0.5255, 'learning_rate': 1.662460805860099e-05, 'epoch': 0.58} {'loss': 0.4454, 'learning_rate': 1.6624356375151566e-05, 'epoch': 0.58} {'loss': 0.6535, 'learning_rate': 1.6624104684224507e-05, 'epoch': 0.58} {'loss': 0.5327, 'learning_rate': 1.662385298582009e-05, 'epoch': 0.58} {'loss': 0.4558, 'learning_rate': 1.6623601279938603e-05, 'epoch': 0.58} {'loss': 0.7062, 'learning_rate': 1.662334956658033e-05, 'epoch': 0.58} {'loss': 0.5282, 'learning_rate': 1.6623097845745554e-05, 'epoch': 0.58} {'loss': 0.6452, 'learning_rate': 1.6622846117434557e-05, 'epoch': 0.58} {'loss': 0.5615, 'learning_rate': 1.662259438164763e-05, 'epoch': 0.58} {'loss': 0.5454, 'learning_rate': 1.6622342638385053e-05, 'epoch': 0.58} {'loss': 0.4894, 'learning_rate': 1.662209088764711e-05, 'epoch': 0.58} {'loss': 0.8468, 'learning_rate': 1.662183912943409e-05, 'epoch': 0.58} {'loss': 0.6143, 'learning_rate': 1.6621587363746266e-05, 'epoch': 0.58} {'loss': 0.5839, 'learning_rate': 1.6621335590583933e-05, 'epoch': 0.58} {'loss': 0.5409, 'learning_rate': 1.6621083809947367e-05, 'epoch': 0.58} {'loss': 0.7482, 'learning_rate': 1.662083202183686e-05, 'epoch': 0.58} {'loss': 0.6675, 'learning_rate': 1.6620580226252695e-05, 'epoch': 0.58} {'loss': 0.5051, 'learning_rate': 1.6620328423195147e-05, 'epoch': 0.58} {'loss': 0.546, 'learning_rate': 1.6620076612664512e-05, 'epoch': 0.58} {'loss': 0.5974, 'learning_rate': 1.661982479466107e-05, 'epoch': 0.58} {'loss': 0.5822, 'learning_rate': 1.6619572969185103e-05, 'epoch': 0.58} {'loss': 0.6502, 'learning_rate': 1.6619321136236894e-05, 'epoch': 0.58} {'loss': 0.66, 'learning_rate': 1.6619069295816733e-05, 'epoch': 0.58} {'loss': 0.6274, 'learning_rate': 1.66188174479249e-05, 'epoch': 0.58} {'loss': 0.6946, 'learning_rate': 1.6618565592561683e-05, 'epoch': 0.58} {'loss': 0.5869, 'learning_rate': 1.6618313729727367e-05, 'epoch': 0.58} {'loss': 0.637, 'learning_rate': 1.661806185942223e-05, 'epoch': 0.58} {'loss': 0.499, 'learning_rate': 1.6617809981646557e-05, 'epoch': 0.58} {'loss': 0.6529, 'learning_rate': 1.661755809640064e-05, 'epoch': 0.59} {'loss': 0.5453, 'learning_rate': 1.6617306203684753e-05, 'epoch': 0.59} {'loss': 0.5993, 'learning_rate': 1.661705430349919e-05, 'epoch': 0.59} {'loss': 0.5455, 'learning_rate': 1.6616802395844228e-05, 'epoch': 0.59} {'loss': 0.6437, 'learning_rate': 1.6616550480720155e-05, 'epoch': 0.59} {'loss': 0.7103, 'learning_rate': 1.6616298558127255e-05, 'epoch': 0.59} {'loss': 0.6013, 'learning_rate': 1.661604662806581e-05, 'epoch': 0.59} {'loss': 0.6196, 'learning_rate': 1.661579469053611e-05, 'epoch': 0.59} {'loss': 0.6009, 'learning_rate': 1.6615542745538436e-05, 'epoch': 0.59} {'loss': 0.5814, 'learning_rate': 1.661529079307307e-05, 'epoch': 0.59} {'loss': 0.54, 'learning_rate': 1.66150388331403e-05, 'epoch': 0.59} {'loss': 0.6287, 'learning_rate': 1.6614786865740406e-05, 'epoch': 0.59} {'loss': 0.4591, 'learning_rate': 1.661453489087368e-05, 'epoch': 0.59} {'loss': 0.6702, 'learning_rate': 1.66142829085404e-05, 'epoch': 0.59} {'loss': 0.5082, 'learning_rate': 1.661403091874085e-05, 'epoch': 0.59} {'loss': 0.588, 'learning_rate': 1.661377892147532e-05, 'epoch': 0.59} {'loss': 0.5162, 'learning_rate': 1.6613526916744088e-05, 'epoch': 0.59} {'loss': 0.5828, 'learning_rate': 1.6613274904547444e-05, 'epoch': 0.59} {'loss': 0.6529, 'learning_rate': 1.661302288488567e-05, 'epoch': 0.59} {'loss': 0.5276, 'learning_rate': 1.6612770857759053e-05, 'epoch': 0.59} {'loss': 0.4639, 'learning_rate': 1.6612518823167875e-05, 'epoch': 0.59} {'loss': 0.5199, 'learning_rate': 1.6612266781112416e-05, 'epoch': 0.59} {'loss': 0.4159, 'learning_rate': 1.661201473159297e-05, 'epoch': 0.59} {'loss': 0.6522, 'learning_rate': 1.661176267460981e-05, 'epoch': 0.59} {'loss': 0.4575, 'learning_rate': 1.6611510610163235e-05, 'epoch': 0.59} {'loss': 0.543, 'learning_rate': 1.661125853825352e-05, 'epoch': 0.59} {'loss': 0.6948, 'learning_rate': 1.661100645888095e-05, 'epoch': 0.59} {'loss': 0.6226, 'learning_rate': 1.661075437204581e-05, 'epoch': 0.59} {'loss': 0.6322, 'learning_rate': 1.6610502277748387e-05, 'epoch': 0.59} {'loss': 0.5877, 'learning_rate': 1.6610250175988963e-05, 'epoch': 0.59} {'loss': 0.6254, 'learning_rate': 1.6609998066767822e-05, 'epoch': 0.59} {'loss': 0.4823, 'learning_rate': 1.6609745950085253e-05, 'epoch': 0.59} {'loss': 0.5838, 'learning_rate': 1.6609493825941534e-05, 'epoch': 0.59} {'loss': 0.5212, 'learning_rate': 1.6609241694336958e-05, 'epoch': 0.59} {'loss': 0.7501, 'learning_rate': 1.66089895552718e-05, 'epoch': 0.59} {'loss': 0.4918, 'learning_rate': 1.6608737408746357e-05, 'epoch': 0.59} {'loss': 0.679, 'learning_rate': 1.66084852547609e-05, 'epoch': 0.59} {'loss': 0.5849, 'learning_rate': 1.660823309331572e-05, 'epoch': 0.59} {'loss': 0.5167, 'learning_rate': 1.6607980924411104e-05, 'epoch': 0.59} {'loss': 0.6339, 'learning_rate': 1.6607728748047332e-05, 'epoch': 0.59} {'loss': 0.4563, 'learning_rate': 1.6607476564224693e-05, 'epoch': 0.59} {'loss': 0.5106, 'learning_rate': 1.660722437294347e-05, 'epoch': 0.59} {'loss': 0.4978, 'learning_rate': 1.6606972174203942e-05, 'epoch': 0.59} {'loss': 0.4944, 'learning_rate': 1.6606719968006403e-05, 'epoch': 0.59} {'loss': 0.5771, 'learning_rate': 1.660646775435113e-05, 'epoch': 0.59} {'loss': 0.4695, 'learning_rate': 1.6606215533238416e-05, 'epoch': 0.59} {'loss': 0.6366, 'learning_rate': 1.6605963304668537e-05, 'epoch': 0.59} {'loss': 0.4491, 'learning_rate': 1.6605711068641784e-05, 'epoch': 0.59} {'loss': 0.5375, 'learning_rate': 1.6605458825158437e-05, 'epoch': 0.59} {'loss': 0.5687, 'learning_rate': 1.6605206574218785e-05, 'epoch': 0.59} {'loss': 0.5635, 'learning_rate': 1.660495431582311e-05, 'epoch': 0.59} {'loss': 0.4806, 'learning_rate': 1.66047020499717e-05, 'epoch': 0.59} {'loss': 0.5676, 'learning_rate': 1.6604449776664835e-05, 'epoch': 0.59} {'loss': 0.4005, 'learning_rate': 1.6604197495902803e-05, 'epoch': 0.59} {'loss': 0.6062, 'learning_rate': 1.6603945207685884e-05, 'epoch': 0.59} {'loss': 0.5714, 'learning_rate': 1.660369291201437e-05, 'epoch': 0.59} {'loss': 0.5038, 'learning_rate': 1.6603440608888544e-05, 'epoch': 0.59} {'loss': 0.4523, 'learning_rate': 1.6603188298308688e-05, 'epoch': 0.59} {'loss': 0.6198, 'learning_rate': 1.6602935980275088e-05, 'epoch': 0.59} {'loss': 0.3331, 'learning_rate': 1.6602683654788028e-05, 'epoch': 0.59} {'loss': 0.6949, 'learning_rate': 1.660243132184779e-05, 'epoch': 0.59} {'loss': 0.626, 'learning_rate': 1.660217898145467e-05, 'epoch': 0.59} {'loss': 0.6229, 'learning_rate': 1.660192663360894e-05, 'epoch': 0.59} {'loss': 0.635, 'learning_rate': 1.6601674278310896e-05, 'epoch': 0.59} {'loss': 0.519, 'learning_rate': 1.6601421915560814e-05, 'epoch': 0.59} {'loss': 0.3739, 'learning_rate': 1.660116954535898e-05, 'epoch': 0.59} {'loss': 0.7739, 'learning_rate': 1.660091716770568e-05, 'epoch': 0.59} {'loss': 0.4843, 'learning_rate': 1.6600664782601204e-05, 'epoch': 0.59} {'loss': 0.6195, 'learning_rate': 1.6600412390045832e-05, 'epoch': 0.59} {'loss': 0.5182, 'learning_rate': 1.6600159990039846e-05, 'epoch': 0.59} {'loss': 0.5074, 'learning_rate': 1.6599907582583538e-05, 'epoch': 0.59} {'loss': 0.6142, 'learning_rate': 1.6599655167677185e-05, 'epoch': 0.59} {'loss': 0.6209, 'learning_rate': 1.6599402745321083e-05, 'epoch': 0.59} {'loss': 0.5452, 'learning_rate': 1.6599150315515506e-05, 'epoch': 0.59} {'loss': 0.6109, 'learning_rate': 1.6598897878260744e-05, 'epoch': 0.59} {'loss': 0.6609, 'learning_rate': 1.659864543355708e-05, 'epoch': 0.59} {'loss': 0.6089, 'learning_rate': 1.6598392981404802e-05, 'epoch': 0.59} {'loss': 0.6242, 'learning_rate': 1.659814052180419e-05, 'epoch': 0.59} {'loss': 0.5758, 'learning_rate': 1.6597888054755536e-05, 'epoch': 0.59} {'loss': 0.6697, 'learning_rate': 1.659763558025912e-05, 'epoch': 0.59} {'loss': 0.5588, 'learning_rate': 1.6597383098315228e-05, 'epoch': 0.59} {'loss': 0.6401, 'learning_rate': 1.6597130608924145e-05, 'epoch': 0.59} {'loss': 0.6417, 'learning_rate': 1.6596878112086152e-05, 'epoch': 0.59} {'loss': 0.524, 'learning_rate': 1.659662560780154e-05, 'epoch': 0.59} {'loss': 0.6209, 'learning_rate': 1.6596373096070598e-05, 'epoch': 0.59} {'loss': 0.4894, 'learning_rate': 1.6596120576893598e-05, 'epoch': 0.59} {'loss': 0.575, 'learning_rate': 1.6595868050270833e-05, 'epoch': 0.59} {'loss': 0.4699, 'learning_rate': 1.659561551620259e-05, 'epoch': 0.59} {'loss': 0.6535, 'learning_rate': 1.659536297468915e-05, 'epoch': 0.59} {'loss': 0.5962, 'learning_rate': 1.65951104257308e-05, 'epoch': 0.59} {'loss': 0.6378, 'learning_rate': 1.6594857869327825e-05, 'epoch': 0.59} {'loss': 0.7026, 'learning_rate': 1.659460530548051e-05, 'epoch': 0.59} {'loss': 0.6543, 'learning_rate': 1.6594352734189138e-05, 'epoch': 0.59} {'loss': 0.6031, 'learning_rate': 1.6594100155453996e-05, 'epoch': 0.59} {'loss': 0.6233, 'learning_rate': 1.659384756927537e-05, 'epoch': 0.59} {'loss': 0.5407, 'learning_rate': 1.659359497565354e-05, 'epoch': 0.59} {'loss': 0.516, 'learning_rate': 1.65933423745888e-05, 'epoch': 0.59} {'loss': 0.5559, 'learning_rate': 1.6593089766081428e-05, 'epoch': 0.59} {'loss': 0.6587, 'learning_rate': 1.659283715013171e-05, 'epoch': 0.59} {'loss': 0.5811, 'learning_rate': 1.6592584526739934e-05, 'epoch': 0.59} {'loss': 0.6217, 'learning_rate': 1.6592331895906384e-05, 'epoch': 0.59} {'loss': 0.5487, 'learning_rate': 1.6592079257631345e-05, 'epoch': 0.59} {'loss': 0.5681, 'learning_rate': 1.65918266119151e-05, 'epoch': 0.59} {'loss': 0.5574, 'learning_rate': 1.659157395875794e-05, 'epoch': 0.59} {'loss': 0.547, 'learning_rate': 1.6591321298160147e-05, 'epoch': 0.59} {'loss': 0.6693, 'learning_rate': 1.6591068630122e-05, 'epoch': 0.59} {'loss': 0.4592, 'learning_rate': 1.6590815954643792e-05, 'epoch': 0.59} {'loss': 0.6648, 'learning_rate': 1.6590563271725807e-05, 'epoch': 0.59} {'loss': 0.5823, 'learning_rate': 1.659031058136833e-05, 'epoch': 0.59} {'loss': 0.4702, 'learning_rate': 1.6590057883571643e-05, 'epoch': 0.59} {'loss': 0.5135, 'learning_rate': 1.6589805178336037e-05, 'epoch': 0.59} {'loss': 0.4811, 'learning_rate': 1.6589552465661794e-05, 'epoch': 0.59} {'loss': 0.6148, 'learning_rate': 1.6589299745549196e-05, 'epoch': 0.59} {'loss': 0.5822, 'learning_rate': 1.6589047017998537e-05, 'epoch': 0.59} {'loss': 0.7424, 'learning_rate': 1.6588794283010092e-05, 'epoch': 0.59} {'loss': 0.6425, 'learning_rate': 1.6588541540584153e-05, 'epoch': 0.59} {'loss': 0.4614, 'learning_rate': 1.6588288790721003e-05, 'epoch': 0.59} {'loss': 0.526, 'learning_rate': 1.6588036033420928e-05, 'epoch': 0.59} {'loss': 0.656, 'learning_rate': 1.6587783268684212e-05, 'epoch': 0.59} {'loss': 0.5483, 'learning_rate': 1.6587530496511143e-05, 'epoch': 0.59} {'loss': 0.563, 'learning_rate': 1.6587277716902005e-05, 'epoch': 0.59} {'loss': 0.5747, 'learning_rate': 1.6587024929857084e-05, 'epoch': 0.59} {'loss': 0.4856, 'learning_rate': 1.658677213537666e-05, 'epoch': 0.59} {'loss': 0.5063, 'learning_rate': 1.6586519333461025e-05, 'epoch': 0.59} {'loss': 0.5653, 'learning_rate': 1.6586266524110463e-05, 'epoch': 0.59} {'loss': 0.5718, 'learning_rate': 1.6586013707325256e-05, 'epoch': 0.59} {'loss': 0.693, 'learning_rate': 1.6585760883105695e-05, 'epoch': 0.59} {'loss': 0.6463, 'learning_rate': 1.6585508051452065e-05, 'epoch': 0.59} {'loss': 0.6731, 'learning_rate': 1.6585255212364643e-05, 'epoch': 0.59} {'loss': 0.5641, 'learning_rate': 1.658500236584372e-05, 'epoch': 0.59} {'loss': 0.5408, 'learning_rate': 1.6584749511889587e-05, 'epoch': 0.59} {'loss': 0.626, 'learning_rate': 1.658449665050252e-05, 'epoch': 0.59} {'loss': 0.5229, 'learning_rate': 1.658424378168281e-05, 'epoch': 0.59} {'loss': 0.6261, 'learning_rate': 1.658399090543074e-05, 'epoch': 0.59} {'loss': 0.7372, 'learning_rate': 1.6583738021746598e-05, 'epoch': 0.59} {'loss': 0.7323, 'learning_rate': 1.6583485130630665e-05, 'epoch': 0.59} {'loss': 0.5588, 'learning_rate': 1.6583232232083228e-05, 'epoch': 0.59} {'loss': 0.5237, 'learning_rate': 1.6582979326104577e-05, 'epoch': 0.59} {'loss': 0.6191, 'learning_rate': 1.658272641269499e-05, 'epoch': 0.59} {'loss': 0.5867, 'learning_rate': 1.6582473491854762e-05, 'epoch': 0.59} {'loss': 0.649, 'learning_rate': 1.658222056358417e-05, 'epoch': 0.59} {'loss': 0.6068, 'learning_rate': 1.6581967627883506e-05, 'epoch': 0.59} {'loss': 0.6707, 'learning_rate': 1.6581714684753048e-05, 'epoch': 0.59} {'loss': 0.5764, 'learning_rate': 1.658146173419309e-05, 'epoch': 0.59} {'loss': 0.6196, 'learning_rate': 1.6581208776203908e-05, 'epoch': 0.59} {'loss': 0.6112, 'learning_rate': 1.6580955810785795e-05, 'epoch': 0.59} {'loss': 0.5977, 'learning_rate': 1.6580702837939036e-05, 'epoch': 0.59} {'loss': 0.6038, 'learning_rate': 1.658044985766391e-05, 'epoch': 0.59} {'loss': 0.6716, 'learning_rate': 1.6580196869960713e-05, 'epoch': 0.59} {'loss': 0.6213, 'learning_rate': 1.6579943874829724e-05, 'epoch': 0.59} {'loss': 0.6345, 'learning_rate': 1.6579690872271228e-05, 'epoch': 0.59} {'loss': 0.7024, 'learning_rate': 1.6579437862285514e-05, 'epoch': 0.59} {'loss': 0.6024, 'learning_rate': 1.6579184844872866e-05, 'epoch': 0.59} {'loss': 0.4143, 'learning_rate': 1.6578931820033565e-05, 'epoch': 0.59} {'loss': 0.6525, 'learning_rate': 1.6578678787767906e-05, 'epoch': 0.59} {'loss': 0.6837, 'learning_rate': 1.6578425748076167e-05, 'epoch': 0.59} {'loss': 0.5422, 'learning_rate': 1.6578172700958636e-05, 'epoch': 0.59} {'loss': 0.6263, 'learning_rate': 1.65779196464156e-05, 'epoch': 0.59} {'loss': 0.5614, 'learning_rate': 1.657766658444734e-05, 'epoch': 0.59} {'loss': 0.7574, 'learning_rate': 1.657741351505415e-05, 'epoch': 0.59} {'loss': 0.6394, 'learning_rate': 1.657716043823631e-05, 'epoch': 0.59} {'loss': 0.6167, 'learning_rate': 1.6576907353994106e-05, 'epoch': 0.59} {'loss': 0.6134, 'learning_rate': 1.6576654262327822e-05, 'epoch': 0.59} {'loss': 0.6706, 'learning_rate': 1.657640116323775e-05, 'epoch': 0.59} {'loss': 0.5313, 'learning_rate': 1.657614805672417e-05, 'epoch': 0.59} {'loss': 0.5435, 'learning_rate': 1.657589494278737e-05, 'epoch': 0.59} {'loss': 0.6371, 'learning_rate': 1.6575641821427632e-05, 'epoch': 0.59} {'loss': 0.4836, 'learning_rate': 1.6575388692645246e-05, 'epoch': 0.59} {'loss': 0.5409, 'learning_rate': 1.65751355564405e-05, 'epoch': 0.59} {'loss': 0.5846, 'learning_rate': 1.6574882412813674e-05, 'epoch': 0.59} {'loss': 0.4921, 'learning_rate': 1.6574629261765058e-05, 'epoch': 0.59} {'loss': 0.5366, 'learning_rate': 1.6574376103294932e-05, 'epoch': 0.59} {'loss': 0.5583, 'learning_rate': 1.6574122937403588e-05, 'epoch': 0.59} {'loss': 0.4895, 'learning_rate': 1.6573869764091307e-05, 'epoch': 0.59} {'loss': 0.4832, 'learning_rate': 1.6573616583358378e-05, 'epoch': 0.59} {'loss': 0.5797, 'learning_rate': 1.6573363395205087e-05, 'epoch': 0.59} {'loss': 0.5212, 'learning_rate': 1.657311019963172e-05, 'epoch': 0.59} {'loss': 0.6538, 'learning_rate': 1.6572856996638557e-05, 'epoch': 0.59} {'loss': 0.7008, 'learning_rate': 1.6572603786225895e-05, 'epoch': 0.59} {'loss': 0.5853, 'learning_rate': 1.6572350568394006e-05, 'epoch': 0.59} {'loss': 0.6027, 'learning_rate': 1.6572097343143186e-05, 'epoch': 0.59} {'loss': 0.6917, 'learning_rate': 1.657184411047372e-05, 'epoch': 0.59} {'loss': 0.683, 'learning_rate': 1.657159087038589e-05, 'epoch': 0.59} {'loss': 0.6625, 'learning_rate': 1.6571337622879982e-05, 'epoch': 0.59} {'loss': 0.6037, 'learning_rate': 1.6571084367956287e-05, 'epoch': 0.59} {'loss': 0.5704, 'learning_rate': 1.6570831105615083e-05, 'epoch': 0.59} {'loss': 0.6149, 'learning_rate': 1.6570577835856663e-05, 'epoch': 0.59} {'loss': 0.6726, 'learning_rate': 1.657032455868131e-05, 'epoch': 0.59} {'loss': 0.617, 'learning_rate': 1.6570071274089308e-05, 'epoch': 0.59} {'loss': 0.6144, 'learning_rate': 1.6569817982080948e-05, 'epoch': 0.59} {'loss': 0.4376, 'learning_rate': 1.656956468265651e-05, 'epoch': 0.59} {'loss': 0.5706, 'learning_rate': 1.6569311375816285e-05, 'epoch': 0.59} {'loss': 0.6677, 'learning_rate': 1.6569058061560554e-05, 'epoch': 0.59} {'loss': 0.5464, 'learning_rate': 1.656880473988961e-05, 'epoch': 0.59} {'loss': 0.5685, 'learning_rate': 1.656855141080373e-05, 'epoch': 0.59} {'loss': 0.5633, 'learning_rate': 1.6568298074303207e-05, 'epoch': 0.59} {'loss': 0.6245, 'learning_rate': 1.6568044730388323e-05, 'epoch': 0.59} {'loss': 0.7328, 'learning_rate': 1.6567791379059366e-05, 'epoch': 0.59} {'loss': 0.6084, 'learning_rate': 1.656753802031662e-05, 'epoch': 0.59} {'loss': 0.6011, 'learning_rate': 1.6567284654160377e-05, 'epoch': 0.59} {'loss': 0.5832, 'learning_rate': 1.6567031280590913e-05, 'epoch': 0.59} {'loss': 0.584, 'learning_rate': 1.6566777899608522e-05, 'epoch': 0.59} {'loss': 0.5093, 'learning_rate': 1.6566524511213488e-05, 'epoch': 0.59} {'loss': 0.5469, 'learning_rate': 1.6566271115406096e-05, 'epoch': 0.59} {'loss': 0.5533, 'learning_rate': 1.6566017712186634e-05, 'epoch': 0.59} {'loss': 0.7738, 'learning_rate': 1.6565764301555382e-05, 'epoch': 0.59} {'loss': 0.7009, 'learning_rate': 1.6565510883512637e-05, 'epoch': 0.59} {'loss': 0.6815, 'learning_rate': 1.656525745805867e-05, 'epoch': 0.59} {'loss': 0.6352, 'learning_rate': 1.656500402519378e-05, 'epoch': 0.59} {'loss': 0.6628, 'learning_rate': 1.6564750584918254e-05, 'epoch': 0.59} {'loss': 0.495, 'learning_rate': 1.656449713723237e-05, 'epoch': 0.59} {'loss': 0.7213, 'learning_rate': 1.6564243682136413e-05, 'epoch': 0.59} {'loss': 0.6059, 'learning_rate': 1.6563990219630678e-05, 'epoch': 0.59} {'loss': 0.5402, 'learning_rate': 1.6563736749715445e-05, 'epoch': 0.59} {'loss': 0.6522, 'learning_rate': 1.6563483272390998e-05, 'epoch': 0.59} {'loss': 0.3519, 'learning_rate': 1.6563229787657632e-05, 'epoch': 0.59} {'loss': 0.4779, 'learning_rate': 1.6562976295515624e-05, 'epoch': 0.59} {'loss': 0.6308, 'learning_rate': 1.6562722795965263e-05, 'epoch': 0.59} {'loss': 0.5964, 'learning_rate': 1.656246928900684e-05, 'epoch': 0.59} {'loss': 0.6898, 'learning_rate': 1.6562215774640632e-05, 'epoch': 0.59} {'loss': 0.674, 'learning_rate': 1.6561962252866936e-05, 'epoch': 0.59} {'loss': 0.5471, 'learning_rate': 1.6561708723686027e-05, 'epoch': 0.59} {'loss': 0.6165, 'learning_rate': 1.65614551870982e-05, 'epoch': 0.59} {'loss': 0.7154, 'learning_rate': 1.6561201643103734e-05, 'epoch': 0.59} {'loss': 0.5594, 'learning_rate': 1.6560948091702925e-05, 'epoch': 0.59} {'loss': 0.7561, 'learning_rate': 1.656069453289605e-05, 'epoch': 0.59} {'loss': 0.6452, 'learning_rate': 1.6560440966683396e-05, 'epoch': 0.59} {'loss': 0.6271, 'learning_rate': 1.6560187393065255e-05, 'epoch': 0.59} {'loss': 0.6992, 'learning_rate': 1.6559933812041912e-05, 'epoch': 0.59} {'loss': 0.6286, 'learning_rate': 1.6559680223613644e-05, 'epoch': 0.59} {'loss': 0.4759, 'learning_rate': 1.655942662778075e-05, 'epoch': 0.59} {'loss': 0.5731, 'learning_rate': 1.655917302454351e-05, 'epoch': 0.59} {'loss': 0.8375, 'learning_rate': 1.655891941390221e-05, 'epoch': 0.59} {'loss': 0.559, 'learning_rate': 1.655866579585714e-05, 'epoch': 0.59} {'loss': 0.6729, 'learning_rate': 1.655841217040858e-05, 'epoch': 0.59} {'loss': 0.4781, 'learning_rate': 1.6558158537556817e-05, 'epoch': 0.59} {'loss': 0.5438, 'learning_rate': 1.6557904897302147e-05, 'epoch': 0.59} {'loss': 0.5839, 'learning_rate': 1.6557651249644843e-05, 'epoch': 0.59} {'loss': 0.5296, 'learning_rate': 1.6557397594585203e-05, 'epoch': 0.59} {'loss': 0.7182, 'learning_rate': 1.6557143932123504e-05, 'epoch': 0.59} {'loss': 0.4388, 'learning_rate': 1.655689026226004e-05, 'epoch': 0.59} {'loss': 0.6517, 'learning_rate': 1.6556636584995094e-05, 'epoch': 0.59} {'loss': 0.6496, 'learning_rate': 1.655638290032895e-05, 'epoch': 0.59} {'loss': 0.6275, 'learning_rate': 1.6556129208261896e-05, 'epoch': 0.59} {'loss': 0.5882, 'learning_rate': 1.655587550879422e-05, 'epoch': 0.59} {'loss': 0.6575, 'learning_rate': 1.655562180192621e-05, 'epoch': 0.59} {'loss': 0.496, 'learning_rate': 1.6555368087658142e-05, 'epoch': 0.59} {'loss': 0.6441, 'learning_rate': 1.6555114365990314e-05, 'epoch': 0.59} {'loss': 0.5745, 'learning_rate': 1.655486063692301e-05, 'epoch': 0.59} {'loss': 0.5448, 'learning_rate': 1.655460690045651e-05, 'epoch': 0.59} {'loss': 0.5402, 'learning_rate': 1.6554353156591113e-05, 'epoch': 0.59} {'loss': 0.4723, 'learning_rate': 1.6554099405327094e-05, 'epoch': 0.59} {'loss': 0.656, 'learning_rate': 1.6553845646664743e-05, 'epoch': 0.59} {'loss': 0.5666, 'learning_rate': 1.655359188060434e-05, 'epoch': 0.59} {'loss': 0.6048, 'learning_rate': 1.655333810714619e-05, 'epoch': 0.59} {'loss': 0.5168, 'learning_rate': 1.655308432629056e-05, 'epoch': 0.59} {'loss': 0.5931, 'learning_rate': 1.6552830538037744e-05, 'epoch': 0.59} {'loss': 0.5358, 'learning_rate': 1.655257674238803e-05, 'epoch': 0.59} {'loss': 0.5577, 'learning_rate': 1.6552322939341704e-05, 'epoch': 0.59} {'loss': 0.6285, 'learning_rate': 1.655206912889905e-05, 'epoch': 0.59} {'loss': 0.5103, 'learning_rate': 1.6551815311060355e-05, 'epoch': 0.59} {'loss': 0.4859, 'learning_rate': 1.6551561485825907e-05, 'epoch': 0.59} {'loss': 0.5714, 'learning_rate': 1.655130765319599e-05, 'epoch': 0.59} {'loss': 0.5903, 'learning_rate': 1.6551053813170897e-05, 'epoch': 0.59} {'loss': 0.5719, 'learning_rate': 1.6550799965750908e-05, 'epoch': 0.59} {'loss': 0.63, 'learning_rate': 1.655054611093631e-05, 'epoch': 0.59} {'loss': 0.5079, 'learning_rate': 1.655029224872739e-05, 'epoch': 0.59} {'loss': 0.4113, 'learning_rate': 1.655003837912444e-05, 'epoch': 0.59} {'loss': 0.5275, 'learning_rate': 1.6549784502127743e-05, 'epoch': 0.59} {'loss': 0.4213, 'learning_rate': 1.654953061773758e-05, 'epoch': 0.59} {'loss': 0.554, 'learning_rate': 1.6549276725954245e-05, 'epoch': 0.59} {'loss': 0.7451, 'learning_rate': 1.654902282677802e-05, 'epoch': 0.59} {'loss': 0.5035, 'learning_rate': 1.6548768920209197e-05, 'epoch': 0.59} {'loss': 0.5477, 'learning_rate': 1.6548515006248057e-05, 'epoch': 0.59} {'loss': 0.6119, 'learning_rate': 1.654826108489489e-05, 'epoch': 0.59} {'loss': 0.6668, 'learning_rate': 1.654800715614998e-05, 'epoch': 0.59} {'loss': 0.8052, 'learning_rate': 1.6547753220013612e-05, 'epoch': 0.59} {'loss': 0.4931, 'learning_rate': 1.654749927648608e-05, 'epoch': 0.59} {'loss': 0.5161, 'learning_rate': 1.6547245325567667e-05, 'epoch': 0.59} {'loss': 0.7401, 'learning_rate': 1.6546991367258657e-05, 'epoch': 0.59} {'loss': 0.6177, 'learning_rate': 1.654673740155934e-05, 'epoch': 0.59} {'loss': 0.5404, 'learning_rate': 1.654648342847e-05, 'epoch': 0.59} {'loss': 0.5828, 'learning_rate': 1.654622944799093e-05, 'epoch': 0.59} {'loss': 0.4729, 'learning_rate': 1.6545975460122404e-05, 'epoch': 0.59} {'loss': 0.5152, 'learning_rate': 1.654572146486472e-05, 'epoch': 0.59} {'loss': 0.3729, 'learning_rate': 1.654546746221816e-05, 'epoch': 0.59} {'loss': 0.6119, 'learning_rate': 1.6545213452183014e-05, 'epoch': 0.59} {'loss': 0.7463, 'learning_rate': 1.6544959434759565e-05, 'epoch': 0.59} {'loss': 0.5834, 'learning_rate': 1.65447054099481e-05, 'epoch': 0.59} {'loss': 0.5912, 'learning_rate': 1.654445137774891e-05, 'epoch': 0.59} {'loss': 0.6285, 'learning_rate': 1.654419733816228e-05, 'epoch': 0.59} {'loss': 0.6753, 'learning_rate': 1.6543943291188494e-05, 'epoch': 0.59} {'loss': 0.5536, 'learning_rate': 1.654368923682784e-05, 'epoch': 0.59} {'loss': 0.729, 'learning_rate': 1.6543435175080603e-05, 'epoch': 0.59} {'loss': 0.566, 'learning_rate': 1.6543181105947077e-05, 'epoch': 0.59} {'loss': 0.607, 'learning_rate': 1.6542927029427542e-05, 'epoch': 0.59} {'loss': 0.6967, 'learning_rate': 1.6542672945522286e-05, 'epoch': 0.59} {'loss': 0.4695, 'learning_rate': 1.6542418854231598e-05, 'epoch': 0.59} {'loss': 0.6858, 'learning_rate': 1.6542164755555758e-05, 'epoch': 0.59} {'loss': 0.6976, 'learning_rate': 1.6541910649495064e-05, 'epoch': 0.59} {'loss': 0.6319, 'learning_rate': 1.654165653604979e-05, 'epoch': 0.59} {'loss': 0.4644, 'learning_rate': 1.6541402415220236e-05, 'epoch': 0.59} {'loss': 0.628, 'learning_rate': 1.654114828700668e-05, 'epoch': 0.59} {'loss': 0.4495, 'learning_rate': 1.6540894151409412e-05, 'epoch': 0.59} {'loss': 0.5899, 'learning_rate': 1.6540640008428718e-05, 'epoch': 0.59} {'loss': 0.5957, 'learning_rate': 1.6540385858064888e-05, 'epoch': 0.59} {'loss': 0.5296, 'learning_rate': 1.6540131700318204e-05, 'epoch': 0.59} {'loss': 0.6528, 'learning_rate': 1.6539877535188953e-05, 'epoch': 0.59} {'loss': 0.4625, 'learning_rate': 1.6539623362677424e-05, 'epoch': 0.59} {'loss': 0.7135, 'learning_rate': 1.6539369182783908e-05, 'epoch': 0.59} {'loss': 0.5551, 'learning_rate': 1.6539114995508682e-05, 'epoch': 0.59} {'loss': 0.5519, 'learning_rate': 1.6538860800852043e-05, 'epoch': 0.59} {'loss': 0.6449, 'learning_rate': 1.6538606598814273e-05, 'epoch': 0.59} {'loss': 0.5539, 'learning_rate': 1.6538352389395655e-05, 'epoch': 0.59} {'loss': 0.3999, 'learning_rate': 1.6538098172596486e-05, 'epoch': 0.59} {'loss': 0.69, 'learning_rate': 1.653784394841705e-05, 'epoch': 0.59} {'loss': 0.5823, 'learning_rate': 1.6537589716857623e-05, 'epoch': 0.59} {'loss': 0.4472, 'learning_rate': 1.6537335477918504e-05, 'epoch': 0.59} {'loss': 0.446, 'learning_rate': 1.653708123159998e-05, 'epoch': 0.59} {'loss': 0.5647, 'learning_rate': 1.6536826977902328e-05, 'epoch': 0.59} {'loss': 0.5782, 'learning_rate': 1.6536572716825843e-05, 'epoch': 0.59} {'loss': 0.6321, 'learning_rate': 1.6536318448370814e-05, 'epoch': 0.59} {'loss': 0.6063, 'learning_rate': 1.6536064172537522e-05, 'epoch': 0.59} {'loss': 0.6794, 'learning_rate': 1.6535809889326254e-05, 'epoch': 0.59} {'loss': 0.54, 'learning_rate': 1.6535555598737306e-05, 'epoch': 0.59} {'loss': 0.6046, 'learning_rate': 1.6535301300770954e-05, 'epoch': 0.59} {'loss': 0.5983, 'learning_rate': 1.653504699542749e-05, 'epoch': 0.59} {'loss': 0.6865, 'learning_rate': 1.65347926827072e-05, 'epoch': 0.59} {'loss': 0.5211, 'learning_rate': 1.6534538362610373e-05, 'epoch': 0.59} {'loss': 0.626, 'learning_rate': 1.6534284035137296e-05, 'epoch': 0.59} {'loss': 0.6958, 'learning_rate': 1.653402970028825e-05, 'epoch': 0.59} {'loss': 0.6959, 'learning_rate': 1.6533775358063533e-05, 'epoch': 0.59} {'loss': 0.6033, 'learning_rate': 1.6533521008463425e-05, 'epoch': 0.59} {'loss': 0.7118, 'learning_rate': 1.6533266651488212e-05, 'epoch': 0.59} {'loss': 0.596, 'learning_rate': 1.653301228713818e-05, 'epoch': 0.59} {'loss': 0.4275, 'learning_rate': 1.6532757915413627e-05, 'epoch': 0.59} {'loss': 0.6498, 'learning_rate': 1.6532503536314828e-05, 'epoch': 0.59} {'loss': 0.6739, 'learning_rate': 1.6532249149842075e-05, 'epoch': 0.59} {'loss': 0.6736, 'learning_rate': 1.6531994755995656e-05, 'epoch': 0.59} {'loss': 0.6223, 'learning_rate': 1.653174035477586e-05, 'epoch': 0.59} {'loss': 0.5936, 'learning_rate': 1.6531485946182963e-05, 'epoch': 0.59} {'loss': 0.4368, 'learning_rate': 1.6531231530217268e-05, 'epoch': 0.59} {'loss': 0.5993, 'learning_rate': 1.653097710687905e-05, 'epoch': 0.59} {'loss': 0.4982, 'learning_rate': 1.65307226761686e-05, 'epoch': 0.59} {'loss': 0.6602, 'learning_rate': 1.6530468238086212e-05, 'epoch': 0.59} {'loss': 0.6591, 'learning_rate': 1.6530213792632163e-05, 'epoch': 0.59} {'loss': 0.4934, 'learning_rate': 1.6529959339806746e-05, 'epoch': 0.59} {'loss': 0.5654, 'learning_rate': 1.6529704879610244e-05, 'epoch': 0.59} {'loss': 0.8399, 'learning_rate': 1.652945041204295e-05, 'epoch': 0.59} {'loss': 0.6936, 'learning_rate': 1.6529195937105144e-05, 'epoch': 0.59} {'loss': 0.5441, 'learning_rate': 1.652894145479712e-05, 'epoch': 0.59} {'loss': 0.5885, 'learning_rate': 1.6528686965119164e-05, 'epoch': 0.59} {'loss': 0.7451, 'learning_rate': 1.652843246807156e-05, 'epoch': 0.59} {'loss': 0.7117, 'learning_rate': 1.65281779636546e-05, 'epoch': 0.59} {'loss': 0.4286, 'learning_rate': 1.6527923451868565e-05, 'epoch': 0.59} {'loss': 0.6114, 'learning_rate': 1.652766893271375e-05, 'epoch': 0.59} {'loss': 0.5429, 'learning_rate': 1.652741440619043e-05, 'epoch': 0.59} {'loss': 0.5961, 'learning_rate': 1.6527159872298904e-05, 'epoch': 0.59} {'loss': 0.6117, 'learning_rate': 1.652690533103946e-05, 'epoch': 0.59} {'loss': 0.5966, 'learning_rate': 1.652665078241238e-05, 'epoch': 0.59} {'loss': 0.4953, 'learning_rate': 1.652639622641795e-05, 'epoch': 0.59} {'loss': 0.5489, 'learning_rate': 1.652614166305646e-05, 'epoch': 0.59} {'loss': 0.4985, 'learning_rate': 1.6525887092328195e-05, 'epoch': 0.59} {'loss': 0.433, 'learning_rate': 1.652563251423345e-05, 'epoch': 0.59} {'loss': 0.5446, 'learning_rate': 1.65253779287725e-05, 'epoch': 0.59} {'loss': 0.5784, 'learning_rate': 1.6525123335945642e-05, 'epoch': 0.59} {'loss': 0.6412, 'learning_rate': 1.6524868735753164e-05, 'epoch': 0.59} {'loss': 0.566, 'learning_rate': 1.6524614128195346e-05, 'epoch': 0.59} {'loss': 0.6115, 'learning_rate': 1.652435951327248e-05, 'epoch': 0.59} {'loss': 0.418, 'learning_rate': 1.6524104890984854e-05, 'epoch': 0.59} {'loss': 0.5911, 'learning_rate': 1.6523850261332754e-05, 'epoch': 0.59} {'loss': 0.5151, 'learning_rate': 1.6523595624316467e-05, 'epoch': 0.59} {'loss': 0.4552, 'learning_rate': 1.6523340979936283e-05, 'epoch': 0.59} {'loss': 0.5874, 'learning_rate': 1.6523086328192483e-05, 'epoch': 0.59} {'loss': 0.5429, 'learning_rate': 1.652283166908536e-05, 'epoch': 0.59} {'loss': 0.4388, 'learning_rate': 1.6522577002615204e-05, 'epoch': 0.59} {'loss': 0.4975, 'learning_rate': 1.65223223287823e-05, 'epoch': 0.59} {'loss': 0.4891, 'learning_rate': 1.652206764758693e-05, 'epoch': 0.59} {'loss': 0.4618, 'learning_rate': 1.6521812959029386e-05, 'epoch': 0.59} {'loss': 0.7424, 'learning_rate': 1.6521558263109958e-05, 'epoch': 0.59} {'loss': 0.4657, 'learning_rate': 1.652130355982893e-05, 'epoch': 0.59} {'loss': 0.6989, 'learning_rate': 1.652104884918659e-05, 'epoch': 0.59} {'loss': 0.3203, 'learning_rate': 1.6520794131183225e-05, 'epoch': 0.59} {'loss': 0.5593, 'learning_rate': 1.6520539405819125e-05, 'epoch': 0.59} {'loss': 0.5884, 'learning_rate': 1.6520284673094574e-05, 'epoch': 0.59} {'loss': 0.6282, 'learning_rate': 1.652002993300986e-05, 'epoch': 0.59} {'loss': 0.5927, 'learning_rate': 1.6519775185565277e-05, 'epoch': 0.59} {'loss': 0.6951, 'learning_rate': 1.6519520430761104e-05, 'epoch': 0.59} {'loss': 0.5801, 'learning_rate': 1.6519265668597634e-05, 'epoch': 0.59} {'loss': 0.5684, 'learning_rate': 1.6519010899075153e-05, 'epoch': 0.59} {'loss': 0.5561, 'learning_rate': 1.6518756122193947e-05, 'epoch': 0.59} {'loss': 0.4975, 'learning_rate': 1.6518501337954305e-05, 'epoch': 0.59} {'loss': 0.644, 'learning_rate': 1.6518246546356515e-05, 'epoch': 0.59} {'loss': 0.6392, 'learning_rate': 1.651799174740086e-05, 'epoch': 0.59} {'loss': 0.5397, 'learning_rate': 1.651773694108764e-05, 'epoch': 0.59} {'loss': 0.6535, 'learning_rate': 1.651748212741713e-05, 'epoch': 0.59} {'loss': 0.6288, 'learning_rate': 1.6517227306389624e-05, 'epoch': 0.59} {'loss': 0.4776, 'learning_rate': 1.6516972478005403e-05, 'epoch': 0.59} {'loss': 0.6239, 'learning_rate': 1.6516717642264762e-05, 'epoch': 0.59} {'loss': 0.6428, 'learning_rate': 1.6516462799167986e-05, 'epoch': 0.59} {'loss': 0.4828, 'learning_rate': 1.6516207948715365e-05, 'epoch': 0.59} {'loss': 0.5665, 'learning_rate': 1.6515953090907185e-05, 'epoch': 0.59} {'loss': 0.6168, 'learning_rate': 1.651569822574373e-05, 'epoch': 0.59} {'loss': 0.7064, 'learning_rate': 1.6515443353225287e-05, 'epoch': 0.59} {'loss': 0.6251, 'learning_rate': 1.6515188473352153e-05, 'epoch': 0.59} {'loss': 0.5695, 'learning_rate': 1.6514933586124608e-05, 'epoch': 0.59} {'loss': 0.4553, 'learning_rate': 1.6514678691542943e-05, 'epoch': 0.59} {'loss': 0.496, 'learning_rate': 1.6514423789607442e-05, 'epoch': 0.59} {'loss': 0.5406, 'learning_rate': 1.65141688803184e-05, 'epoch': 0.59} {'loss': 0.5126, 'learning_rate': 1.6513913963676096e-05, 'epoch': 0.59} {'loss': 0.5815, 'learning_rate': 1.6513659039680822e-05, 'epoch': 0.59} {'loss': 0.6099, 'learning_rate': 1.651340410833287e-05, 'epoch': 0.59} {'loss': 0.6724, 'learning_rate': 1.6513149169632517e-05, 'epoch': 0.59} {'loss': 0.6255, 'learning_rate': 1.651289422358006e-05, 'epoch': 0.59} {'loss': 0.5182, 'learning_rate': 1.6512639270175787e-05, 'epoch': 0.59} {'loss': 0.5847, 'learning_rate': 1.6512384309419978e-05, 'epoch': 0.59} {'loss': 0.562, 'learning_rate': 1.6512129341312926e-05, 'epoch': 0.59} {'loss': 0.4873, 'learning_rate': 1.6511874365854922e-05, 'epoch': 0.59} {'loss': 0.4531, 'learning_rate': 1.651161938304625e-05, 'epoch': 0.59} {'loss': 0.6122, 'learning_rate': 1.6511364392887194e-05, 'epoch': 0.59} {'loss': 0.647, 'learning_rate': 1.6511109395378046e-05, 'epoch': 0.59} {'loss': 0.6797, 'learning_rate': 1.6510854390519095e-05, 'epoch': 0.59} {'loss': 0.3664, 'learning_rate': 1.6510599378310628e-05, 'epoch': 0.59} {'loss': 0.6089, 'learning_rate': 1.651034435875293e-05, 'epoch': 0.59} {'loss': 0.7091, 'learning_rate': 1.65100893318463e-05, 'epoch': 0.59} {'loss': 0.5962, 'learning_rate': 1.6509834297591005e-05, 'epoch': 0.59} {'loss': 0.6069, 'learning_rate': 1.650957925598735e-05, 'epoch': 0.59} {'loss': 0.5823, 'learning_rate': 1.650932420703562e-05, 'epoch': 0.59} {'loss': 0.529, 'learning_rate': 1.65090691507361e-05, 'epoch': 0.59} {'loss': 0.5862, 'learning_rate': 1.6508814087089077e-05, 'epoch': 0.59} {'loss': 0.5112, 'learning_rate': 1.650855901609484e-05, 'epoch': 0.59} {'loss': 0.6938, 'learning_rate': 1.650830393775368e-05, 'epoch': 0.59} {'loss': 0.6497, 'learning_rate': 1.650804885206588e-05, 'epoch': 0.59} {'loss': 0.6372, 'learning_rate': 1.6507793759031732e-05, 'epoch': 0.59} {'loss': 0.6379, 'learning_rate': 1.650753865865152e-05, 'epoch': 0.59} {'loss': 0.6212, 'learning_rate': 1.6507283550925537e-05, 'epoch': 0.59} {'loss': 0.6512, 'learning_rate': 1.650702843585407e-05, 'epoch': 0.59} {'loss': 0.6534, 'learning_rate': 1.6506773313437402e-05, 'epoch': 0.59} {'loss': 0.5378, 'learning_rate': 1.6506518183675826e-05, 'epoch': 0.59} {'loss': 0.5721, 'learning_rate': 1.6506263046569624e-05, 'epoch': 0.59} {'loss': 0.664, 'learning_rate': 1.6506007902119095e-05, 'epoch': 0.59} {'loss': 0.304, 'learning_rate': 1.6505752750324515e-05, 'epoch': 0.59} {'loss': 0.5535, 'learning_rate': 1.6505497591186183e-05, 'epoch': 0.59} {'loss': 0.6158, 'learning_rate': 1.6505242424704374e-05, 'epoch': 0.59} {'loss': 0.5805, 'learning_rate': 1.650498725087939e-05, 'epoch': 0.59} {'loss': 0.4883, 'learning_rate': 1.6504732069711505e-05, 'epoch': 0.59} {'loss': 0.4996, 'learning_rate': 1.650447688120102e-05, 'epoch': 0.59} {'loss': 0.573, 'learning_rate': 1.6504221685348216e-05, 'epoch': 0.59} {'loss': 0.4806, 'learning_rate': 1.6503966482153383e-05, 'epoch': 0.59} {'loss': 0.5939, 'learning_rate': 1.6503711271616808e-05, 'epoch': 0.59} {'loss': 0.579, 'learning_rate': 1.650345605373878e-05, 'epoch': 0.59} {'loss': 0.6509, 'learning_rate': 1.6503200828519587e-05, 'epoch': 0.59} {'loss': 0.6158, 'learning_rate': 1.6502945595959518e-05, 'epoch': 0.59} {'loss': 0.6444, 'learning_rate': 1.6502690356058858e-05, 'epoch': 0.59} {'loss': 0.629, 'learning_rate': 1.6502435108817895e-05, 'epoch': 0.59} {'loss': 0.4607, 'learning_rate': 1.6502179854236924e-05, 'epoch': 0.59} {'loss': 0.7973, 'learning_rate': 1.6501924592316226e-05, 'epoch': 0.59} {'loss': 0.6348, 'learning_rate': 1.650166932305609e-05, 'epoch': 0.59} {'loss': 0.5906, 'learning_rate': 1.650141404645681e-05, 'epoch': 0.59} {'loss': 0.5729, 'learning_rate': 1.650115876251867e-05, 'epoch': 0.59} {'loss': 0.5521, 'learning_rate': 1.650090347124195e-05, 'epoch': 0.59} {'loss': 0.5193, 'learning_rate': 1.6500648172626955e-05, 'epoch': 0.59} {'loss': 0.6877, 'learning_rate': 1.650039286667396e-05, 'epoch': 0.59} {'loss': 0.6591, 'learning_rate': 1.6500137553383256e-05, 'epoch': 0.59} {'loss': 0.5347, 'learning_rate': 1.649988223275514e-05, 'epoch': 0.59} {'loss': 0.5224, 'learning_rate': 1.6499626904789886e-05, 'epoch': 0.59} {'loss': 0.4554, 'learning_rate': 1.649937156948779e-05, 'epoch': 0.59} {'loss': 0.6253, 'learning_rate': 1.6499116226849145e-05, 'epoch': 0.59} {'loss': 0.6039, 'learning_rate': 1.649886087687423e-05, 'epoch': 0.59} {'loss': 0.4743, 'learning_rate': 1.6498605519563334e-05, 'epoch': 0.59} {'loss': 0.7144, 'learning_rate': 1.649835015491675e-05, 'epoch': 0.59} {'loss': 0.6157, 'learning_rate': 1.6498094782934763e-05, 'epoch': 0.59} {'loss': 0.42, 'learning_rate': 1.6497839403617667e-05, 'epoch': 0.59} {'loss': 0.6325, 'learning_rate': 1.6497584016965744e-05, 'epoch': 0.59} {'loss': 0.4922, 'learning_rate': 1.6497328622979284e-05, 'epoch': 0.59} {'loss': 0.5886, 'learning_rate': 1.6497073221658576e-05, 'epoch': 0.59} {'loss': 0.6199, 'learning_rate': 1.6496817813003904e-05, 'epoch': 0.59} {'loss': 0.6623, 'learning_rate': 1.6496562397015564e-05, 'epoch': 0.59} {'loss': 0.6512, 'learning_rate': 1.6496306973693843e-05, 'epoch': 0.59} {'loss': 0.4916, 'learning_rate': 1.649605154303902e-05, 'epoch': 0.59} {'loss': 0.5982, 'learning_rate': 1.6495796105051396e-05, 'epoch': 0.59} {'loss': 0.5341, 'learning_rate': 1.649554065973125e-05, 'epoch': 0.59} {'loss': 0.4865, 'learning_rate': 1.6495285207078875e-05, 'epoch': 0.6} {'loss': 0.7442, 'learning_rate': 1.649502974709456e-05, 'epoch': 0.6} {'loss': 0.4917, 'learning_rate': 1.6494774279778586e-05, 'epoch': 0.6} {'loss': 0.5198, 'learning_rate': 1.6494518805131253e-05, 'epoch': 0.6} {'loss': 0.6942, 'learning_rate': 1.649426332315284e-05, 'epoch': 0.6} {'loss': 0.7703, 'learning_rate': 1.649400783384364e-05, 'epoch': 0.6} {'loss': 0.5579, 'learning_rate': 1.6493752337203938e-05, 'epoch': 0.6} {'loss': 0.5181, 'learning_rate': 1.6493496833234025e-05, 'epoch': 0.6} {'loss': 0.5598, 'learning_rate': 1.649324132193419e-05, 'epoch': 0.6} {'loss': 0.6527, 'learning_rate': 1.6492985803304717e-05, 'epoch': 0.6} {'loss': 0.7177, 'learning_rate': 1.6492730277345903e-05, 'epoch': 0.6} {'loss': 0.7913, 'learning_rate': 1.6492474744058028e-05, 'epoch': 0.6} {'loss': 0.675, 'learning_rate': 1.6492219203441386e-05, 'epoch': 0.6} {'loss': 0.4819, 'learning_rate': 1.6491963655496263e-05, 'epoch': 0.6} {'loss': 0.5532, 'learning_rate': 1.6491708100222943e-05, 'epoch': 0.6} {'loss': 0.6325, 'learning_rate': 1.649145253762172e-05, 'epoch': 0.6} {'loss': 0.499, 'learning_rate': 1.6491196967692883e-05, 'epoch': 0.6} {'loss': 0.5221, 'learning_rate': 1.649094139043672e-05, 'epoch': 0.6} {'loss': 0.5765, 'learning_rate': 1.6490685805853522e-05, 'epoch': 0.6} {'loss': 0.5087, 'learning_rate': 1.6490430213943568e-05, 'epoch': 0.6} {'loss': 0.6754, 'learning_rate': 1.6490174614707154e-05, 'epoch': 0.6} {'loss': 0.6461, 'learning_rate': 1.6489919008144565e-05, 'epoch': 0.6} {'loss': 0.4258, 'learning_rate': 1.6489663394256098e-05, 'epoch': 0.6} {'loss': 0.7353, 'learning_rate': 1.6489407773042028e-05, 'epoch': 0.6} {'loss': 0.4616, 'learning_rate': 1.6489152144502655e-05, 'epoch': 0.6} {'loss': 0.5863, 'learning_rate': 1.648889650863826e-05, 'epoch': 0.6} {'loss': 0.8285, 'learning_rate': 1.6488640865449137e-05, 'epoch': 0.6} {'loss': 0.4794, 'learning_rate': 1.6488385214935574e-05, 'epoch': 0.6} {'loss': 0.6063, 'learning_rate': 1.6488129557097854e-05, 'epoch': 0.6} {'loss': 0.8035, 'learning_rate': 1.6487873891936273e-05, 'epoch': 0.6} {'loss': 0.5201, 'learning_rate': 1.6487618219451112e-05, 'epoch': 0.6} {'loss': 0.7264, 'learning_rate': 1.6487362539642665e-05, 'epoch': 0.6} {'loss': 0.6922, 'learning_rate': 1.6487106852511224e-05, 'epoch': 0.6} {'loss': 0.7169, 'learning_rate': 1.648685115805707e-05, 'epoch': 0.6} {'loss': 0.623, 'learning_rate': 1.6486595456280493e-05, 'epoch': 0.6} {'loss': 0.5975, 'learning_rate': 1.6486339747181785e-05, 'epoch': 0.6} {'loss': 0.5323, 'learning_rate': 1.6486084030761232e-05, 'epoch': 0.6} {'loss': 0.5134, 'learning_rate': 1.6485828307019124e-05, 'epoch': 0.6} {'loss': 0.6834, 'learning_rate': 1.6485572575955747e-05, 'epoch': 0.6} {'loss': 0.4853, 'learning_rate': 1.6485316837571396e-05, 'epoch': 0.6} {'loss': 0.5668, 'learning_rate': 1.6485061091866353e-05, 'epoch': 0.6} {'loss': 0.4812, 'learning_rate': 1.648480533884091e-05, 'epoch': 0.6} {'loss': 0.648, 'learning_rate': 1.6484549578495353e-05, 'epoch': 0.6} {'loss': 0.6787, 'learning_rate': 1.6484293810829975e-05, 'epoch': 0.6} {'loss': 0.5974, 'learning_rate': 1.648403803584506e-05, 'epoch': 0.6} {'loss': 0.4455, 'learning_rate': 1.64837822535409e-05, 'epoch': 0.6} {'loss': 0.6261, 'learning_rate': 1.6483526463917784e-05, 'epoch': 0.6} {'loss': 0.6832, 'learning_rate': 1.6483270666975996e-05, 'epoch': 0.6} {'loss': 0.6371, 'learning_rate': 1.6483014862715833e-05, 'epoch': 0.6} {'loss': 0.5274, 'learning_rate': 1.6482759051137577e-05, 'epoch': 0.6} {'loss': 0.3979, 'learning_rate': 1.648250323224152e-05, 'epoch': 0.6} {'loss': 0.459, 'learning_rate': 1.648224740602795e-05, 'epoch': 0.6} {'loss': 0.5874, 'learning_rate': 1.6481991572497153e-05, 'epoch': 0.6} {'loss': 0.6158, 'learning_rate': 1.648173573164942e-05, 'epoch': 0.6} {'loss': 0.5952, 'learning_rate': 1.6481479883485038e-05, 'epoch': 0.6} {'loss': 0.5702, 'learning_rate': 1.64812240280043e-05, 'epoch': 0.6} {'loss': 0.6157, 'learning_rate': 1.6480968165207498e-05, 'epoch': 0.6} {'loss': 0.697, 'learning_rate': 1.6480712295094904e-05, 'epoch': 0.6} {'loss': 0.4381, 'learning_rate': 1.648045641766683e-05, 'epoch': 0.6} {'loss': 0.5283, 'learning_rate': 1.6480200532923544e-05, 'epoch': 0.6} {'loss': 0.5895, 'learning_rate': 1.647994464086535e-05, 'epoch': 0.6} {'loss': 0.6719, 'learning_rate': 1.6479688741492525e-05, 'epoch': 0.6} {'loss': 0.5797, 'learning_rate': 1.6479432834805367e-05, 'epoch': 0.6} {'loss': 0.4596, 'learning_rate': 1.6479176920804164e-05, 'epoch': 0.6} {'loss': 0.5302, 'learning_rate': 1.6478920999489195e-05, 'epoch': 0.6} {'loss': 0.7252, 'learning_rate': 1.6478665070860763e-05, 'epoch': 0.6} {'loss': 0.6759, 'learning_rate': 1.6478409134919148e-05, 'epoch': 0.6} {'loss': 0.7694, 'learning_rate': 1.6478153191664642e-05, 'epoch': 0.6} {'loss': 0.5097, 'learning_rate': 1.6477897241097532e-05, 'epoch': 0.6} {'loss': 0.4615, 'learning_rate': 1.6477641283218105e-05, 'epoch': 0.6} {'loss': 0.522, 'learning_rate': 1.6477385318026656e-05, 'epoch': 0.6} {'loss': 0.5476, 'learning_rate': 1.647712934552347e-05, 'epoch': 0.6} {'loss': 0.6157, 'learning_rate': 1.6476873365708837e-05, 'epoch': 0.6} {'loss': 0.6677, 'learning_rate': 1.6476617378583043e-05, 'epoch': 0.6} {'loss': 0.4938, 'learning_rate': 1.6476361384146383e-05, 'epoch': 0.6} {'loss': 0.5378, 'learning_rate': 1.647610538239914e-05, 'epoch': 0.6} {'loss': 0.5237, 'learning_rate': 1.647584937334161e-05, 'epoch': 0.6} {'loss': 0.6512, 'learning_rate': 1.647559335697407e-05, 'epoch': 0.6} {'loss': 0.7202, 'learning_rate': 1.6475337333296822e-05, 'epoch': 0.6} {'loss': 0.544, 'learning_rate': 1.6475081302310147e-05, 'epoch': 0.6} {'loss': 0.6088, 'learning_rate': 1.647482526401434e-05, 'epoch': 0.6} {'loss': 0.5778, 'learning_rate': 1.6474569218409683e-05, 'epoch': 0.6} {'loss': 0.5601, 'learning_rate': 1.6474313165496473e-05, 'epoch': 0.6} {'loss': 0.5079, 'learning_rate': 1.647405710527499e-05, 'epoch': 0.6} {'loss': 0.4749, 'learning_rate': 1.6473801037745527e-05, 'epoch': 0.6} {'loss': 0.6519, 'learning_rate': 1.647354496290838e-05, 'epoch': 0.6} {'loss': 0.6731, 'learning_rate': 1.6473288880763826e-05, 'epoch': 0.6} {'loss': 0.3796, 'learning_rate': 1.647303279131216e-05, 'epoch': 0.6} {'loss': 0.6607, 'learning_rate': 1.647277669455367e-05, 'epoch': 0.6} {'loss': 0.5478, 'learning_rate': 1.647252059048865e-05, 'epoch': 0.6} {'loss': 0.5859, 'learning_rate': 1.6472264479117383e-05, 'epoch': 0.6} {'loss': 0.6236, 'learning_rate': 1.6472008360440162e-05, 'epoch': 0.6} {'loss': 0.5743, 'learning_rate': 1.6471752234457272e-05, 'epoch': 0.6} {'loss': 0.7174, 'learning_rate': 1.6471496101169004e-05, 'epoch': 0.6} {'loss': 0.7228, 'learning_rate': 1.647123996057565e-05, 'epoch': 0.6} {'loss': 0.6845, 'learning_rate': 1.6470983812677493e-05, 'epoch': 0.6} {'loss': 0.5974, 'learning_rate': 1.647072765747483e-05, 'epoch': 0.6} {'loss': 0.4393, 'learning_rate': 1.6470471494967943e-05, 'epoch': 0.6} {'loss': 0.5995, 'learning_rate': 1.6470215325157125e-05, 'epoch': 0.6} {'loss': 0.4989, 'learning_rate': 1.6469959148042668e-05, 'epoch': 0.6} {'loss': 0.5777, 'learning_rate': 1.6469702963624852e-05, 'epoch': 0.6} {'loss': 0.5641, 'learning_rate': 1.6469446771903972e-05, 'epoch': 0.6} {'loss': 0.61, 'learning_rate': 1.646919057288032e-05, 'epoch': 0.6} {'loss': 0.7151, 'learning_rate': 1.646893436655418e-05, 'epoch': 0.6} {'loss': 0.405, 'learning_rate': 1.6468678152925843e-05, 'epoch': 0.6} {'loss': 0.4238, 'learning_rate': 1.64684219319956e-05, 'epoch': 0.6} {'loss': 0.6739, 'learning_rate': 1.6468165703763738e-05, 'epoch': 0.6} {'loss': 0.6191, 'learning_rate': 1.6467909468230547e-05, 'epoch': 0.6} {'loss': 0.5522, 'learning_rate': 1.6467653225396314e-05, 'epoch': 0.6} {'loss': 0.4932, 'learning_rate': 1.646739697526133e-05, 'epoch': 0.6} {'loss': 0.606, 'learning_rate': 1.6467140717825887e-05, 'epoch': 0.6} {'loss': 0.5626, 'learning_rate': 1.6466884453090273e-05, 'epoch': 0.6} {'loss': 0.4919, 'learning_rate': 1.6466628181054772e-05, 'epoch': 0.6} {'loss': 0.6682, 'learning_rate': 1.646637190171968e-05, 'epoch': 0.6} {'loss': 0.5981, 'learning_rate': 1.6466115615085286e-05, 'epoch': 0.6} {'loss': 0.7446, 'learning_rate': 1.6465859321151873e-05, 'epoch': 0.6} {'loss': 0.5315, 'learning_rate': 1.6465603019919737e-05, 'epoch': 0.6} {'loss': 0.6293, 'learning_rate': 1.6465346711389164e-05, 'epoch': 0.6} {'loss': 0.7219, 'learning_rate': 1.6465090395560445e-05, 'epoch': 0.6} {'loss': 0.6479, 'learning_rate': 1.646483407243387e-05, 'epoch': 0.6} {'loss': 0.626, 'learning_rate': 1.646457774200972e-05, 'epoch': 0.6} {'loss': 0.7387, 'learning_rate': 1.6464321404288295e-05, 'epoch': 0.6} {'loss': 0.471, 'learning_rate': 1.646406505926988e-05, 'epoch': 0.6} {'loss': 0.6386, 'learning_rate': 1.6463808706954767e-05, 'epoch': 0.6} {'loss': 0.5994, 'learning_rate': 1.6463552347343243e-05, 'epoch': 0.6} {'loss': 0.7703, 'learning_rate': 1.6463295980435593e-05, 'epoch': 0.6} {'loss': 0.5438, 'learning_rate': 1.6463039606232114e-05, 'epoch': 0.6} {'loss': 0.6612, 'learning_rate': 1.6462783224733092e-05, 'epoch': 0.6} {'loss': 0.7057, 'learning_rate': 1.6462526835938816e-05, 'epoch': 0.6} {'loss': 0.6836, 'learning_rate': 1.646227043984958e-05, 'epoch': 0.6} {'loss': 0.5524, 'learning_rate': 1.6462014036465667e-05, 'epoch': 0.6} {'loss': 0.4459, 'learning_rate': 1.6461757625787367e-05, 'epoch': 0.6} {'loss': 0.5345, 'learning_rate': 1.646150120781497e-05, 'epoch': 0.6} {'loss': 0.5926, 'learning_rate': 1.646124478254877e-05, 'epoch': 0.6} {'loss': 0.4824, 'learning_rate': 1.6460988349989055e-05, 'epoch': 0.6} {'loss': 0.7853, 'learning_rate': 1.646073191013611e-05, 'epoch': 0.6} {'loss': 0.6281, 'learning_rate': 1.646047546299023e-05, 'epoch': 0.6} {'loss': 0.4325, 'learning_rate': 1.64602190085517e-05, 'epoch': 0.6} {'loss': 0.6474, 'learning_rate': 1.6459962546820806e-05, 'epoch': 0.6} {'loss': 0.4315, 'learning_rate': 1.645970607779785e-05, 'epoch': 0.6} {'loss': 0.5585, 'learning_rate': 1.645944960148311e-05, 'epoch': 0.6} {'loss': 0.4959, 'learning_rate': 1.6459193117876883e-05, 'epoch': 0.6} {'loss': 0.6152, 'learning_rate': 1.6458936626979454e-05, 'epoch': 0.6} {'loss': 0.555, 'learning_rate': 1.6458680128791113e-05, 'epoch': 0.6} {'loss': 0.5478, 'learning_rate': 1.645842362331215e-05, 'epoch': 0.6} {'loss': 0.587, 'learning_rate': 1.645816711054286e-05, 'epoch': 0.6} {'loss': 0.6571, 'learning_rate': 1.6457910590483518e-05, 'epoch': 0.6} {'loss': 0.6896, 'learning_rate': 1.6457654063134428e-05, 'epoch': 0.6} {'loss': 0.5227, 'learning_rate': 1.6457397528495875e-05, 'epoch': 0.6} {'loss': 0.5862, 'learning_rate': 1.645714098656815e-05, 'epoch': 0.6} {'loss': 0.6067, 'learning_rate': 1.6456884437351538e-05, 'epoch': 0.6} {'loss': 0.6277, 'learning_rate': 1.645662788084633e-05, 'epoch': 0.6} {'loss': 0.5207, 'learning_rate': 1.645637131705282e-05, 'epoch': 0.6} {'loss': 0.5632, 'learning_rate': 1.6456114745971293e-05, 'epoch': 0.6} {'loss': 0.5589, 'learning_rate': 1.645585816760204e-05, 'epoch': 0.6} {'loss': 0.6102, 'learning_rate': 1.645560158194535e-05, 'epoch': 0.6} {'loss': 0.5616, 'learning_rate': 1.6455344989001516e-05, 'epoch': 0.6} {'loss': 0.4851, 'learning_rate': 1.645508838877082e-05, 'epoch': 0.6} {'loss': 0.5161, 'learning_rate': 1.6454831781253563e-05, 'epoch': 0.6} {'loss': 0.5074, 'learning_rate': 1.6454575166450023e-05, 'epoch': 0.6} {'loss': 0.6447, 'learning_rate': 1.6454318544360498e-05, 'epoch': 0.6} {'loss': 0.6722, 'learning_rate': 1.6454061914985277e-05, 'epoch': 0.6} {'loss': 0.6154, 'learning_rate': 1.6453805278324644e-05, 'epoch': 0.6} {'loss': 0.6137, 'learning_rate': 1.6453548634378894e-05, 'epoch': 0.6} {'loss': 0.5768, 'learning_rate': 1.6453291983148312e-05, 'epoch': 0.6} {'loss': 0.3769, 'learning_rate': 1.6453035324633192e-05, 'epoch': 0.6} {'loss': 0.6499, 'learning_rate': 1.645277865883382e-05, 'epoch': 0.6} {'loss': 0.6207, 'learning_rate': 1.6452521985750492e-05, 'epoch': 0.6} {'loss': 0.6298, 'learning_rate': 1.645226530538349e-05, 'epoch': 0.6} {'loss': 0.6284, 'learning_rate': 1.645200861773311e-05, 'epoch': 0.6} {'loss': 0.6227, 'learning_rate': 1.645175192279964e-05, 'epoch': 0.6} {'loss': 0.5543, 'learning_rate': 1.6451495220583368e-05, 'epoch': 0.6} {'loss': 0.5569, 'learning_rate': 1.6451238511084583e-05, 'epoch': 0.6} {'loss': 0.5307, 'learning_rate': 1.6450981794303578e-05, 'epoch': 0.6} {'loss': 0.5225, 'learning_rate': 1.645072507024064e-05, 'epoch': 0.6} {'loss': 0.6936, 'learning_rate': 1.6450468338896063e-05, 'epoch': 0.6} {'loss': 0.5644, 'learning_rate': 1.645021160027013e-05, 'epoch': 0.6} {'loss': 0.5258, 'learning_rate': 1.6449954854363137e-05, 'epoch': 0.6} {'loss': 0.6281, 'learning_rate': 1.6449698101175372e-05, 'epoch': 0.6} {'loss': 0.5907, 'learning_rate': 1.6449441340707122e-05, 'epoch': 0.6} {'loss': 0.6098, 'learning_rate': 1.644918457295868e-05, 'epoch': 0.6} {'loss': 0.5642, 'learning_rate': 1.6448927797930334e-05, 'epoch': 0.6} {'loss': 0.5984, 'learning_rate': 1.644867101562238e-05, 'epoch': 0.6} {'loss': 0.6419, 'learning_rate': 1.6448414226035097e-05, 'epoch': 0.6} {'loss': 0.5724, 'learning_rate': 1.6448157429168784e-05, 'epoch': 0.6} {'loss': 0.6757, 'learning_rate': 1.6447900625023723e-05, 'epoch': 0.6} {'loss': 0.6737, 'learning_rate': 1.6447643813600214e-05, 'epoch': 0.6} {'loss': 0.4155, 'learning_rate': 1.6447386994898536e-05, 'epoch': 0.6} {'loss': 0.539, 'learning_rate': 1.6447130168918986e-05, 'epoch': 0.6} {'loss': 0.6841, 'learning_rate': 1.6446873335661853e-05, 'epoch': 0.6} {'loss': 0.6011, 'learning_rate': 1.6446616495127424e-05, 'epoch': 0.6} {'loss': 0.5927, 'learning_rate': 1.6446359647315995e-05, 'epoch': 0.6} {'loss': 0.485, 'learning_rate': 1.6446102792227846e-05, 'epoch': 0.6} {'loss': 0.5943, 'learning_rate': 1.6445845929863277e-05, 'epoch': 0.6} {'loss': 0.5591, 'learning_rate': 1.6445589060222573e-05, 'epoch': 0.6} {'loss': 0.5466, 'learning_rate': 1.6445332183306025e-05, 'epoch': 0.6} {'loss': 0.4671, 'learning_rate': 1.644507529911392e-05, 'epoch': 0.6} {'loss': 0.5125, 'learning_rate': 1.6444818407646554e-05, 'epoch': 0.6} {'loss': 0.5415, 'learning_rate': 1.644456150890421e-05, 'epoch': 0.6} {'loss': 0.6618, 'learning_rate': 1.6444304602887188e-05, 'epoch': 0.6} {'loss': 0.5618, 'learning_rate': 1.6444047689595762e-05, 'epoch': 0.6} {'loss': 0.5655, 'learning_rate': 1.6443790769030238e-05, 'epoch': 0.6} {'loss': 0.6296, 'learning_rate': 1.64435338411909e-05, 'epoch': 0.6} {'loss': 0.4461, 'learning_rate': 1.6443276906078035e-05, 'epoch': 0.6} {'loss': 0.6478, 'learning_rate': 1.6443019963691936e-05, 'epoch': 0.6} {'loss': 0.5193, 'learning_rate': 1.6442763014032893e-05, 'epoch': 0.6} {'loss': 0.6318, 'learning_rate': 1.6442506057101195e-05, 'epoch': 0.6} {'loss': 0.5577, 'learning_rate': 1.6442249092897133e-05, 'epoch': 0.6} {'loss': 0.5105, 'learning_rate': 1.6441992121420998e-05, 'epoch': 0.6} {'loss': 0.5422, 'learning_rate': 1.644173514267308e-05, 'epoch': 0.6} {'loss': 0.5888, 'learning_rate': 1.6441478156653663e-05, 'epoch': 0.6} {'loss': 0.5476, 'learning_rate': 1.644122116336305e-05, 'epoch': 0.6} {'loss': 0.4746, 'learning_rate': 1.6440964162801517e-05, 'epoch': 0.6} {'loss': 0.5928, 'learning_rate': 1.644070715496936e-05, 'epoch': 0.6} {'loss': 0.4615, 'learning_rate': 1.6440450139866874e-05, 'epoch': 0.6} {'loss': 0.5136, 'learning_rate': 1.644019311749434e-05, 'epoch': 0.6} {'loss': 0.5847, 'learning_rate': 1.643993608785205e-05, 'epoch': 0.6} {'loss': 0.726, 'learning_rate': 1.6439679050940304e-05, 'epoch': 0.6} {'loss': 0.658, 'learning_rate': 1.643942200675938e-05, 'epoch': 0.6} {'loss': 0.5387, 'learning_rate': 1.6439164955309577e-05, 'epoch': 0.6} {'loss': 0.3445, 'learning_rate': 1.643890789659118e-05, 'epoch': 0.6} {'loss': 0.6225, 'learning_rate': 1.6438650830604478e-05, 'epoch': 0.6} {'loss': 0.7216, 'learning_rate': 1.6438393757349765e-05, 'epoch': 0.6} {'loss': 0.7411, 'learning_rate': 1.643813667682733e-05, 'epoch': 0.6} {'loss': 0.6416, 'learning_rate': 1.6437879589037462e-05, 'epoch': 0.6} {'loss': 0.5797, 'learning_rate': 1.6437622493980453e-05, 'epoch': 0.6} {'loss': 0.6049, 'learning_rate': 1.643736539165659e-05, 'epoch': 0.6} {'loss': 0.5643, 'learning_rate': 1.643710828206617e-05, 'epoch': 0.6} {'loss': 0.6597, 'learning_rate': 1.6436851165209478e-05, 'epoch': 0.6} {'loss': 0.5323, 'learning_rate': 1.6436594041086805e-05, 'epoch': 0.6} {'loss': 0.5116, 'learning_rate': 1.643633690969844e-05, 'epoch': 0.6} {'loss': 0.6078, 'learning_rate': 1.6436079771044672e-05, 'epoch': 0.6} {'loss': 0.6728, 'learning_rate': 1.64358226251258e-05, 'epoch': 0.6} {'loss': 0.5743, 'learning_rate': 1.64355654719421e-05, 'epoch': 0.6} {'loss': 0.4905, 'learning_rate': 1.643530831149388e-05, 'epoch': 0.6} {'loss': 0.5081, 'learning_rate': 1.643505114378141e-05, 'epoch': 0.6} {'loss': 0.3635, 'learning_rate': 1.6434793968804997e-05, 'epoch': 0.6} {'loss': 0.6785, 'learning_rate': 1.6434536786564924e-05, 'epoch': 0.6} {'loss': 0.4984, 'learning_rate': 1.6434279597061485e-05, 'epoch': 0.6} {'loss': 0.7115, 'learning_rate': 1.6434022400294966e-05, 'epoch': 0.6} {'loss': 0.6027, 'learning_rate': 1.6433765196265658e-05, 'epoch': 0.6} {'loss': 0.4417, 'learning_rate': 1.6433507984973855e-05, 'epoch': 0.6} {'loss': 0.4955, 'learning_rate': 1.6433250766419843e-05, 'epoch': 0.6} {'loss': 0.7022, 'learning_rate': 1.6432993540603916e-05, 'epoch': 0.6} {'loss': 0.5929, 'learning_rate': 1.643273630752636e-05, 'epoch': 0.6} {'loss': 0.5497, 'learning_rate': 1.643247906718747e-05, 'epoch': 0.6} {'loss': 0.561, 'learning_rate': 1.6432221819587537e-05, 'epoch': 0.6} {'loss': 0.753, 'learning_rate': 1.6431964564726847e-05, 'epoch': 0.6} {'loss': 0.5644, 'learning_rate': 1.6431707302605688e-05, 'epoch': 0.6} {'loss': 0.6282, 'learning_rate': 1.643145003322436e-05, 'epoch': 0.6} {'loss': 0.6548, 'learning_rate': 1.643119275658314e-05, 'epoch': 0.6} {'loss': 0.4112, 'learning_rate': 1.6430935472682333e-05, 'epoch': 0.6} {'loss': 0.5061, 'learning_rate': 1.643067818152222e-05, 'epoch': 0.6} {'loss': 0.5428, 'learning_rate': 1.64304208831031e-05, 'epoch': 0.6} {'loss': 0.6815, 'learning_rate': 1.643016357742525e-05, 'epoch': 0.6} {'loss': 0.5804, 'learning_rate': 1.642990626448897e-05, 'epoch': 0.6} {'loss': 0.5064, 'learning_rate': 1.6429648944294553e-05, 'epoch': 0.6} {'loss': 0.548, 'learning_rate': 1.6429391616842282e-05, 'epoch': 0.6} {'loss': 0.552, 'learning_rate': 1.6429134282132446e-05, 'epoch': 0.6} {'loss': 0.5849, 'learning_rate': 1.6428876940165347e-05, 'epoch': 0.6} {'loss': 0.558, 'learning_rate': 1.6428619590941263e-05, 'epoch': 0.6} {'loss': 0.6439, 'learning_rate': 1.6428362234460495e-05, 'epoch': 0.6} {'loss': 0.7187, 'learning_rate': 1.6428104870723324e-05, 'epoch': 0.6} {'loss': 0.4765, 'learning_rate': 1.6427847499730046e-05, 'epoch': 0.6} {'loss': 0.5774, 'learning_rate': 1.642759012148095e-05, 'epoch': 0.6} {'loss': 0.5137, 'learning_rate': 1.642733273597633e-05, 'epoch': 0.6} {'loss': 0.5623, 'learning_rate': 1.6427075343216472e-05, 'epoch': 0.6} {'loss': 0.4895, 'learning_rate': 1.642681794320167e-05, 'epoch': 0.6} {'loss': 0.69, 'learning_rate': 1.6426560535932206e-05, 'epoch': 0.6} {'loss': 0.4587, 'learning_rate': 1.6426303121408384e-05, 'epoch': 0.6} {'loss': 0.4999, 'learning_rate': 1.6426045699630486e-05, 'epoch': 0.6} {'loss': 0.3962, 'learning_rate': 1.6425788270598805e-05, 'epoch': 0.6} {'loss': 0.5997, 'learning_rate': 1.642553083431363e-05, 'epoch': 0.6} {'loss': 0.4761, 'learning_rate': 1.642527339077525e-05, 'epoch': 0.6} {'loss': 0.5914, 'learning_rate': 1.642501593998396e-05, 'epoch': 0.6} {'loss': 0.4837, 'learning_rate': 1.642475848194005e-05, 'epoch': 0.6} {'loss': 0.6412, 'learning_rate': 1.642450101664381e-05, 'epoch': 0.6} {'loss': 0.604, 'learning_rate': 1.642424354409553e-05, 'epoch': 0.6} {'loss': 0.6862, 'learning_rate': 1.64239860642955e-05, 'epoch': 0.6} {'loss': 0.6274, 'learning_rate': 1.642372857724401e-05, 'epoch': 0.6} {'loss': 0.5769, 'learning_rate': 1.642347108294135e-05, 'epoch': 0.6} {'loss': 0.6045, 'learning_rate': 1.6423213581387817e-05, 'epoch': 0.6} {'loss': 0.3924, 'learning_rate': 1.6422956072583695e-05, 'epoch': 0.6} {'loss': 0.4491, 'learning_rate': 1.642269855652928e-05, 'epoch': 0.6} {'loss': 0.6291, 'learning_rate': 1.6422441033224857e-05, 'epoch': 0.6} {'loss': 0.655, 'learning_rate': 1.642218350267072e-05, 'epoch': 0.6} {'loss': 0.7331, 'learning_rate': 1.6421925964867158e-05, 'epoch': 0.6} {'loss': 0.726, 'learning_rate': 1.6421668419814463e-05, 'epoch': 0.6} {'loss': 0.5515, 'learning_rate': 1.6421410867512926e-05, 'epoch': 0.6} {'loss': 0.4917, 'learning_rate': 1.642115330796284e-05, 'epoch': 0.6} {'loss': 0.6709, 'learning_rate': 1.6420895741164485e-05, 'epoch': 0.6} {'loss': 0.6356, 'learning_rate': 1.6420638167118168e-05, 'epoch': 0.6} {'loss': 0.5907, 'learning_rate': 1.6420380585824166e-05, 'epoch': 0.6} {'loss': 0.7328, 'learning_rate': 1.6420122997282778e-05, 'epoch': 0.6} {'loss': 0.6229, 'learning_rate': 1.6419865401494294e-05, 'epoch': 0.6} {'loss': 0.5218, 'learning_rate': 1.6419607798459e-05, 'epoch': 0.6} {'loss': 0.6464, 'learning_rate': 1.641935018817719e-05, 'epoch': 0.6} {'loss': 0.5926, 'learning_rate': 1.6419092570649154e-05, 'epoch': 0.6} {'loss': 0.6837, 'learning_rate': 1.6418834945875183e-05, 'epoch': 0.6} {'loss': 0.7324, 'learning_rate': 1.641857731385557e-05, 'epoch': 0.6} {'loss': 0.5052, 'learning_rate': 1.64183196745906e-05, 'epoch': 0.6} {'loss': 0.4531, 'learning_rate': 1.641806202808057e-05, 'epoch': 0.6} {'loss': 0.5832, 'learning_rate': 1.641780437432577e-05, 'epoch': 0.6} {'loss': 0.7309, 'learning_rate': 1.6417546713326485e-05, 'epoch': 0.6} {'loss': 0.4961, 'learning_rate': 1.6417289045083013e-05, 'epoch': 0.6} {'loss': 0.6068, 'learning_rate': 1.641703136959564e-05, 'epoch': 0.6} {'loss': 0.5182, 'learning_rate': 1.641677368686466e-05, 'epoch': 0.6} {'loss': 0.6055, 'learning_rate': 1.6416515996890364e-05, 'epoch': 0.6} {'loss': 0.6388, 'learning_rate': 1.641625829967304e-05, 'epoch': 0.6} {'loss': 0.7502, 'learning_rate': 1.6416000595212983e-05, 'epoch': 0.6} {'loss': 0.5744, 'learning_rate': 1.641574288351048e-05, 'epoch': 0.6} {'loss': 0.6011, 'learning_rate': 1.641548516456582e-05, 'epoch': 0.6} {'loss': 0.5213, 'learning_rate': 1.6415227438379302e-05, 'epoch': 0.6} {'loss': 0.614, 'learning_rate': 1.641496970495121e-05, 'epoch': 0.6} {'loss': 0.668, 'learning_rate': 1.6414711964281837e-05, 'epoch': 0.6} {'loss': 0.5044, 'learning_rate': 1.641445421637147e-05, 'epoch': 0.6} {'loss': 0.6547, 'learning_rate': 1.6414196461220412e-05, 'epoch': 0.6} {'loss': 0.4767, 'learning_rate': 1.641393869882894e-05, 'epoch': 0.6} {'loss': 0.7272, 'learning_rate': 1.6413680929197356e-05, 'epoch': 0.6} {'loss': 0.4172, 'learning_rate': 1.641342315232594e-05, 'epoch': 0.6} {'loss': 0.6929, 'learning_rate': 1.6413165368214992e-05, 'epoch': 0.6} {'loss': 0.5226, 'learning_rate': 1.6412907576864798e-05, 'epoch': 0.6} {'loss': 0.7567, 'learning_rate': 1.6412649778275654e-05, 'epoch': 0.6} {'loss': 0.573, 'learning_rate': 1.641239197244784e-05, 'epoch': 0.6} {'loss': 0.492, 'learning_rate': 1.6412134159381664e-05, 'epoch': 0.6} {'loss': 0.5282, 'learning_rate': 1.6411876339077405e-05, 'epoch': 0.6} {'loss': 0.5992, 'learning_rate': 1.6411618511535357e-05, 'epoch': 0.6} {'loss': 0.4055, 'learning_rate': 1.6411360676755812e-05, 'epoch': 0.6} {'loss': 0.5817, 'learning_rate': 1.6411102834739055e-05, 'epoch': 0.6} {'loss': 0.7522, 'learning_rate': 1.6410844985485388e-05, 'epoch': 0.6} {'loss': 0.4926, 'learning_rate': 1.6410587128995094e-05, 'epoch': 0.6} {'loss': 0.5359, 'learning_rate': 1.6410329265268466e-05, 'epoch': 0.6} {'loss': 0.4281, 'learning_rate': 1.641007139430579e-05, 'epoch': 0.6} {'loss': 0.4172, 'learning_rate': 1.6409813516107372e-05, 'epoch': 0.6} {'loss': 0.5243, 'learning_rate': 1.640955563067349e-05, 'epoch': 0.6} {'loss': 0.5804, 'learning_rate': 1.6409297738004436e-05, 'epoch': 0.6} {'loss': 0.5368, 'learning_rate': 1.6409039838100505e-05, 'epoch': 0.6} {'loss': 0.5291, 'learning_rate': 1.6408781930961985e-05, 'epoch': 0.6} {'loss': 0.4865, 'learning_rate': 1.640852401658917e-05, 'epoch': 0.6} {'loss': 0.6637, 'learning_rate': 1.640826609498235e-05, 'epoch': 0.6} {'loss': 0.687, 'learning_rate': 1.6408008166141818e-05, 'epoch': 0.6} {'loss': 0.5274, 'learning_rate': 1.6407750230067863e-05, 'epoch': 0.6} {'loss': 0.5185, 'learning_rate': 1.6407492286760775e-05, 'epoch': 0.6} {'loss': 0.5946, 'learning_rate': 1.640723433622085e-05, 'epoch': 0.6} {'loss': 0.7335, 'learning_rate': 1.640697637844837e-05, 'epoch': 0.6} {'loss': 0.6274, 'learning_rate': 1.6406718413443635e-05, 'epoch': 0.6} {'loss': 0.6021, 'learning_rate': 1.6406460441206933e-05, 'epoch': 0.6} {'loss': 0.4897, 'learning_rate': 1.6406202461738555e-05, 'epoch': 0.6} {'loss': 0.6487, 'learning_rate': 1.6405944475038796e-05, 'epoch': 0.6} {'loss': 0.7525, 'learning_rate': 1.640568648110794e-05, 'epoch': 0.6} {'loss': 0.5976, 'learning_rate': 1.6405428479946283e-05, 'epoch': 0.6} {'loss': 0.5754, 'learning_rate': 1.6405170471554116e-05, 'epoch': 0.6} {'loss': 0.6607, 'learning_rate': 1.640491245593173e-05, 'epoch': 0.6} {'loss': 0.59, 'learning_rate': 1.6404654433079414e-05, 'epoch': 0.6} {'loss': 0.5804, 'learning_rate': 1.640439640299746e-05, 'epoch': 0.6} {'loss': 0.4801, 'learning_rate': 1.6404138365686165e-05, 'epoch': 0.6} {'loss': 0.5781, 'learning_rate': 1.6403880321145812e-05, 'epoch': 0.6} {'loss': 0.5919, 'learning_rate': 1.6403622269376694e-05, 'epoch': 0.6} {'loss': 0.5688, 'learning_rate': 1.6403364210379106e-05, 'epoch': 0.6} {'loss': 0.4127, 'learning_rate': 1.6403106144153337e-05, 'epoch': 0.6} {'loss': 0.5388, 'learning_rate': 1.640284807069968e-05, 'epoch': 0.6} {'loss': 0.6512, 'learning_rate': 1.640258999001843e-05, 'epoch': 0.6} {'loss': 0.6225, 'learning_rate': 1.6402331902109864e-05, 'epoch': 0.6} {'loss': 0.4763, 'learning_rate': 1.640207380697429e-05, 'epoch': 0.6} {'loss': 0.5424, 'learning_rate': 1.640181570461199e-05, 'epoch': 0.6} {'loss': 0.7727, 'learning_rate': 1.6401557595023256e-05, 'epoch': 0.6} {'loss': 0.4637, 'learning_rate': 1.640129947820838e-05, 'epoch': 0.6} {'loss': 0.5492, 'learning_rate': 1.6401041354167657e-05, 'epoch': 0.6} {'loss': 0.5356, 'learning_rate': 1.6400783222901373e-05, 'epoch': 0.6} {'loss': 0.406, 'learning_rate': 1.6400525084409823e-05, 'epoch': 0.6} {'loss': 0.6959, 'learning_rate': 1.64002669386933e-05, 'epoch': 0.6} {'loss': 0.5973, 'learning_rate': 1.640000878575209e-05, 'epoch': 0.6} {'loss': 0.6027, 'learning_rate': 1.6399750625586485e-05, 'epoch': 0.6} {'loss': 0.6282, 'learning_rate': 1.639949245819678e-05, 'epoch': 0.6} {'loss': 0.5259, 'learning_rate': 1.6399234283583266e-05, 'epoch': 0.6} {'loss': 0.547, 'learning_rate': 1.6398976101746232e-05, 'epoch': 0.6} {'loss': 0.5707, 'learning_rate': 1.6398717912685972e-05, 'epoch': 0.6} {'loss': 0.6134, 'learning_rate': 1.6398459716402777e-05, 'epoch': 0.6} {'loss': 0.3373, 'learning_rate': 1.6398201512896936e-05, 'epoch': 0.6} {'loss': 0.5037, 'learning_rate': 1.6397943302168743e-05, 'epoch': 0.6} {'loss': 0.5921, 'learning_rate': 1.639768508421849e-05, 'epoch': 0.6} {'loss': 0.6539, 'learning_rate': 1.6397426859046464e-05, 'epoch': 0.6} {'loss': 0.5522, 'learning_rate': 1.639716862665296e-05, 'epoch': 0.6} {'loss': 0.5571, 'learning_rate': 1.639691038703827e-05, 'epoch': 0.6} {'loss': 0.457, 'learning_rate': 1.6396652140202686e-05, 'epoch': 0.6} {'loss': 0.6865, 'learning_rate': 1.6396393886146498e-05, 'epoch': 0.6} {'loss': 0.5768, 'learning_rate': 1.6396135624869994e-05, 'epoch': 0.6} {'loss': 0.5713, 'learning_rate': 1.6395877356373473e-05, 'epoch': 0.6} {'loss': 0.5236, 'learning_rate': 1.6395619080657223e-05, 'epoch': 0.6} {'loss': 0.6062, 'learning_rate': 1.6395360797721535e-05, 'epoch': 0.6} {'loss': 0.3429, 'learning_rate': 1.63951025075667e-05, 'epoch': 0.6} {'loss': 0.5345, 'learning_rate': 1.639484421019301e-05, 'epoch': 0.6} {'loss': 0.6241, 'learning_rate': 1.6394585905600755e-05, 'epoch': 0.6} {'loss': 0.6786, 'learning_rate': 1.6394327593790232e-05, 'epoch': 0.6} {'loss': 0.4661, 'learning_rate': 1.6394069274761724e-05, 'epoch': 0.6} {'loss': 0.5511, 'learning_rate': 1.639381094851553e-05, 'epoch': 0.6} {'loss': 0.5466, 'learning_rate': 1.6393552615051945e-05, 'epoch': 0.6} {'loss': 0.6617, 'learning_rate': 1.639329427437125e-05, 'epoch': 0.6} {'loss': 0.7022, 'learning_rate': 1.639303592647374e-05, 'epoch': 0.6} {'loss': 0.6892, 'learning_rate': 1.639277757135971e-05, 'epoch': 0.6} {'loss': 0.5637, 'learning_rate': 1.639251920902945e-05, 'epoch': 0.6} {'loss': 0.3933, 'learning_rate': 1.639226083948325e-05, 'epoch': 0.6} {'loss': 0.7454, 'learning_rate': 1.6392002462721404e-05, 'epoch': 0.6} {'loss': 0.7569, 'learning_rate': 1.6391744078744206e-05, 'epoch': 0.6} {'loss': 0.579, 'learning_rate': 1.639148568755194e-05, 'epoch': 0.6} {'loss': 0.5861, 'learning_rate': 1.6391227289144902e-05, 'epoch': 0.6} {'loss': 0.6558, 'learning_rate': 1.6390968883523386e-05, 'epoch': 0.6} {'loss': 0.54, 'learning_rate': 1.639071047068768e-05, 'epoch': 0.6} {'loss': 0.5908, 'learning_rate': 1.6390452050638076e-05, 'epoch': 0.6} {'loss': 0.3976, 'learning_rate': 1.6390193623374872e-05, 'epoch': 0.6} {'loss': 0.7196, 'learning_rate': 1.638993518889835e-05, 'epoch': 0.6} {'loss': 0.6254, 'learning_rate': 1.6389676747208808e-05, 'epoch': 0.6} {'loss': 0.6518, 'learning_rate': 1.6389418298306534e-05, 'epoch': 0.6} {'loss': 0.7177, 'learning_rate': 1.6389159842191822e-05, 'epoch': 0.6} {'loss': 0.6015, 'learning_rate': 1.6388901378864967e-05, 'epoch': 0.6} {'loss': 0.7205, 'learning_rate': 1.638864290832625e-05, 'epoch': 0.6} {'loss': 0.6664, 'learning_rate': 1.6388384430575975e-05, 'epoch': 0.6} {'loss': 0.7319, 'learning_rate': 1.638812594561443e-05, 'epoch': 0.6} {'loss': 0.6437, 'learning_rate': 1.6387867453441906e-05, 'epoch': 0.6} {'loss': 0.6216, 'learning_rate': 1.638760895405869e-05, 'epoch': 0.6} {'loss': 0.4415, 'learning_rate': 1.638735044746508e-05, 'epoch': 0.6} {'loss': 0.671, 'learning_rate': 1.6387091933661368e-05, 'epoch': 0.6} {'loss': 0.5038, 'learning_rate': 1.6386833412647842e-05, 'epoch': 0.6} {'loss': 0.6446, 'learning_rate': 1.63865748844248e-05, 'epoch': 0.6} {'loss': 0.5374, 'learning_rate': 1.6386316348992522e-05, 'epoch': 0.6} {'loss': 0.5653, 'learning_rate': 1.638605780635131e-05, 'epoch': 0.6} {'loss': 0.4624, 'learning_rate': 1.6385799256501457e-05, 'epoch': 0.6} {'loss': 0.5757, 'learning_rate': 1.6385540699443243e-05, 'epoch': 0.6} {'loss': 0.5752, 'learning_rate': 1.6385282135176973e-05, 'epoch': 0.6} {'loss': 0.5995, 'learning_rate': 1.6385023563702933e-05, 'epoch': 0.6} {'loss': 0.578, 'learning_rate': 1.638476498502142e-05, 'epoch': 0.6} {'loss': 0.5817, 'learning_rate': 1.6384506399132714e-05, 'epoch': 0.6} {'loss': 0.4525, 'learning_rate': 1.638424780603712e-05, 'epoch': 0.6} {'loss': 0.5552, 'learning_rate': 1.638398920573492e-05, 'epoch': 0.6} {'loss': 0.6683, 'learning_rate': 1.6383730598226413e-05, 'epoch': 0.6} {'loss': 0.4673, 'learning_rate': 1.6383471983511884e-05, 'epoch': 0.6} {'loss': 0.4821, 'learning_rate': 1.638321336159163e-05, 'epoch': 0.6} {'loss': 0.5753, 'learning_rate': 1.6382954732465947e-05, 'epoch': 0.6} {'loss': 0.5718, 'learning_rate': 1.638269609613512e-05, 'epoch': 0.6} {'loss': 0.6436, 'learning_rate': 1.6382437452599443e-05, 'epoch': 0.6} {'loss': 0.5162, 'learning_rate': 1.6382178801859203e-05, 'epoch': 0.6} {'loss': 0.6624, 'learning_rate': 1.63819201439147e-05, 'epoch': 0.6} {'loss': 0.751, 'learning_rate': 1.6381661478766223e-05, 'epoch': 0.6} {'loss': 0.5174, 'learning_rate': 1.6381402806414066e-05, 'epoch': 0.6} {'loss': 0.5728, 'learning_rate': 1.6381144126858514e-05, 'epoch': 0.6} {'loss': 0.5434, 'learning_rate': 1.6380885440099868e-05, 'epoch': 0.6} {'loss': 0.4779, 'learning_rate': 1.6380626746138416e-05, 'epoch': 0.6} {'loss': 0.7128, 'learning_rate': 1.6380368044974443e-05, 'epoch': 0.6} {'loss': 0.6936, 'learning_rate': 1.6380109336608254e-05, 'epoch': 0.6} {'loss': 0.5533, 'learning_rate': 1.637985062104013e-05, 'epoch': 0.6} {'loss': 0.5049, 'learning_rate': 1.6379591898270374e-05, 'epoch': 0.6} {'loss': 0.6405, 'learning_rate': 1.6379333168299268e-05, 'epoch': 0.6} {'loss': 0.5473, 'learning_rate': 1.6379074431127108e-05, 'epoch': 0.6} {'loss': 0.6603, 'learning_rate': 1.637881568675419e-05, 'epoch': 0.6} {'loss': 0.4247, 'learning_rate': 1.6378556935180795e-05, 'epoch': 0.6} {'loss': 0.7522, 'learning_rate': 1.637829817640723e-05, 'epoch': 0.6} {'loss': 0.6855, 'learning_rate': 1.6378039410433773e-05, 'epoch': 0.6} {'loss': 0.4016, 'learning_rate': 1.6377780637260724e-05, 'epoch': 0.6} {'loss': 0.6561, 'learning_rate': 1.6377521856888373e-05, 'epoch': 0.6} {'loss': 0.4963, 'learning_rate': 1.6377263069317014e-05, 'epoch': 0.6} {'loss': 0.5854, 'learning_rate': 1.637700427454694e-05, 'epoch': 0.6} {'loss': 0.644, 'learning_rate': 1.6376745472578436e-05, 'epoch': 0.6} {'loss': 0.3934, 'learning_rate': 1.63764866634118e-05, 'epoch': 0.6} {'loss': 0.5235, 'learning_rate': 1.6376227847047324e-05, 'epoch': 0.6} {'loss': 0.6688, 'learning_rate': 1.6375969023485302e-05, 'epoch': 0.6} {'loss': 0.6425, 'learning_rate': 1.637571019272602e-05, 'epoch': 0.6} {'loss': 0.7092, 'learning_rate': 1.6375451354769777e-05, 'epoch': 0.6} {'loss': 0.609, 'learning_rate': 1.6375192509616858e-05, 'epoch': 0.6} {'loss': 0.4964, 'learning_rate': 1.6374933657267557e-05, 'epoch': 0.6} {'loss': 0.4906, 'learning_rate': 1.6374674797722172e-05, 'epoch': 0.6} {'loss': 0.6666, 'learning_rate': 1.637441593098099e-05, 'epoch': 0.6} {'loss': 0.6047, 'learning_rate': 1.6374157057044307e-05, 'epoch': 0.6} {'loss': 0.5828, 'learning_rate': 1.637389817591241e-05, 'epoch': 0.6} {'loss': 0.7032, 'learning_rate': 1.6373639287585597e-05, 'epoch': 0.6} {'loss': 0.5967, 'learning_rate': 1.637338039206415e-05, 'epoch': 0.6} {'loss': 0.5399, 'learning_rate': 1.6373121489348377e-05, 'epoch': 0.6} {'loss': 0.5271, 'learning_rate': 1.637286257943856e-05, 'epoch': 0.6} {'loss': 0.7361, 'learning_rate': 1.6372603662334992e-05, 'epoch': 0.6} {'loss': 0.588, 'learning_rate': 1.6372344738037963e-05, 'epoch': 0.6} {'loss': 0.6243, 'learning_rate': 1.6372085806547772e-05, 'epoch': 0.6} {'loss': 0.4873, 'learning_rate': 1.6371826867864705e-05, 'epoch': 0.6} {'loss': 0.5431, 'learning_rate': 1.6371567921989062e-05, 'epoch': 0.6} {'loss': 0.5449, 'learning_rate': 1.6371308968921126e-05, 'epoch': 0.6} {'loss': 0.546, 'learning_rate': 1.6371050008661196e-05, 'epoch': 0.61} {'loss': 0.5656, 'learning_rate': 1.6370791041209564e-05, 'epoch': 0.61} {'loss': 0.6927, 'learning_rate': 1.6370532066566516e-05, 'epoch': 0.61} {'loss': 0.6075, 'learning_rate': 1.637027308473235e-05, 'epoch': 0.61} {'loss': 0.5731, 'learning_rate': 1.637001409570736e-05, 'epoch': 0.61} {'loss': 0.6381, 'learning_rate': 1.636975509949183e-05, 'epoch': 0.61} {'loss': 0.5536, 'learning_rate': 1.6369496096086064e-05, 'epoch': 0.61} {'loss': 0.6663, 'learning_rate': 1.636923708549034e-05, 'epoch': 0.61} {'loss': 0.6341, 'learning_rate': 1.6368978067704965e-05, 'epoch': 0.61} {'loss': 0.6509, 'learning_rate': 1.6368719042730227e-05, 'epoch': 0.61} {'loss': 0.6323, 'learning_rate': 1.636846001056641e-05, 'epoch': 0.61} {'loss': 0.4858, 'learning_rate': 1.6368200971213815e-05, 'epoch': 0.61} {'loss': 0.5444, 'learning_rate': 1.636794192467273e-05, 'epoch': 0.61} {'loss': 0.5851, 'learning_rate': 1.6367682870943454e-05, 'epoch': 0.61} {'loss': 0.5068, 'learning_rate': 1.6367423810026272e-05, 'epoch': 0.61} {'loss': 0.5399, 'learning_rate': 1.636716474192148e-05, 'epoch': 0.61} {'loss': 0.5314, 'learning_rate': 1.6366905666629367e-05, 'epoch': 0.61} {'loss': 0.6601, 'learning_rate': 1.6366646584150234e-05, 'epoch': 0.61} {'loss': 0.4847, 'learning_rate': 1.6366387494484364e-05, 'epoch': 0.61} {'loss': 0.5647, 'learning_rate': 1.6366128397632057e-05, 'epoch': 0.61} {'loss': 0.6907, 'learning_rate': 1.6365869293593597e-05, 'epoch': 0.61} {'loss': 0.6168, 'learning_rate': 1.6365610182369282e-05, 'epoch': 0.61} {'loss': 0.5686, 'learning_rate': 1.6365351063959404e-05, 'epoch': 0.61} {'loss': 0.7232, 'learning_rate': 1.6365091938364253e-05, 'epoch': 0.61} {'loss': 0.5094, 'learning_rate': 1.636483280558413e-05, 'epoch': 0.61} {'loss': 0.7979, 'learning_rate': 1.6364573665619315e-05, 'epoch': 0.61} {'loss': 0.4987, 'learning_rate': 1.636431451847011e-05, 'epoch': 0.61} {'loss': 0.5544, 'learning_rate': 1.6364055364136803e-05, 'epoch': 0.61} {'loss': 0.5253, 'learning_rate': 1.6363796202619686e-05, 'epoch': 0.61} {'loss': 0.3978, 'learning_rate': 1.6363537033919056e-05, 'epoch': 0.61} {'loss': 0.5007, 'learning_rate': 1.6363277858035197e-05, 'epoch': 0.61} {'loss': 0.585, 'learning_rate': 1.6363018674968414e-05, 'epoch': 0.61} {'loss': 0.6085, 'learning_rate': 1.636275948471899e-05, 'epoch': 0.61} {'loss': 0.5535, 'learning_rate': 1.636250028728722e-05, 'epoch': 0.61} {'loss': 0.5689, 'learning_rate': 1.63622410826734e-05, 'epoch': 0.61} {'loss': 0.5426, 'learning_rate': 1.6361981870877817e-05, 'epoch': 0.61} {'loss': 0.6503, 'learning_rate': 1.6361722651900768e-05, 'epoch': 0.61} {'loss': 0.5906, 'learning_rate': 1.6361463425742542e-05, 'epoch': 0.61} {'loss': 0.6944, 'learning_rate': 1.6361204192403435e-05, 'epoch': 0.61} {'loss': 0.6005, 'learning_rate': 1.6360944951883735e-05, 'epoch': 0.61} {'loss': 0.5429, 'learning_rate': 1.636068570418374e-05, 'epoch': 0.61} {'loss': 0.4253, 'learning_rate': 1.6360426449303742e-05, 'epoch': 0.61} {'loss': 0.5323, 'learning_rate': 1.636016718724403e-05, 'epoch': 0.61} {'loss': 0.5861, 'learning_rate': 1.6359907918004898e-05, 'epoch': 0.61} {'loss': 0.6603, 'learning_rate': 1.6359648641586644e-05, 'epoch': 0.61} {'loss': 0.3615, 'learning_rate': 1.635938935798955e-05, 'epoch': 0.61} {'loss': 0.6636, 'learning_rate': 1.6359130067213917e-05, 'epoch': 0.61} {'loss': 0.745, 'learning_rate': 1.6358870769260037e-05, 'epoch': 0.61} {'loss': 0.5015, 'learning_rate': 1.63586114641282e-05, 'epoch': 0.61} {'loss': 0.6256, 'learning_rate': 1.63583521518187e-05, 'epoch': 0.61} {'loss': 0.6013, 'learning_rate': 1.635809283233183e-05, 'epoch': 0.61} {'loss': 0.6537, 'learning_rate': 1.635783350566788e-05, 'epoch': 0.61} {'loss': 0.6148, 'learning_rate': 1.6357574171827145e-05, 'epoch': 0.61} {'loss': 0.6343, 'learning_rate': 1.635731483080992e-05, 'epoch': 0.61} {'loss': 0.7414, 'learning_rate': 1.6357055482616493e-05, 'epoch': 0.61} {'loss': 0.5294, 'learning_rate': 1.6356796127247162e-05, 'epoch': 0.61} {'loss': 0.54, 'learning_rate': 1.6356536764702216e-05, 'epoch': 0.61} {'loss': 0.6563, 'learning_rate': 1.6356277394981948e-05, 'epoch': 0.61} {'loss': 0.5311, 'learning_rate': 1.6356018018086654e-05, 'epoch': 0.61} {'loss': 0.5963, 'learning_rate': 1.635575863401662e-05, 'epoch': 0.61} {'loss': 0.6461, 'learning_rate': 1.6355499242772145e-05, 'epoch': 0.61} {'loss': 0.7346, 'learning_rate': 1.635523984435352e-05, 'epoch': 0.61} {'loss': 0.5337, 'learning_rate': 1.6354980438761038e-05, 'epoch': 0.61} {'loss': 0.6535, 'learning_rate': 1.6354721025994992e-05, 'epoch': 0.61} {'loss': 0.4611, 'learning_rate': 1.6354461606055676e-05, 'epoch': 0.61} {'loss': 0.5686, 'learning_rate': 1.6354202178943376e-05, 'epoch': 0.61} {'loss': 0.513, 'learning_rate': 1.6353942744658395e-05, 'epoch': 0.61} {'loss': 0.5152, 'learning_rate': 1.635368330320102e-05, 'epoch': 0.61} {'loss': 0.618, 'learning_rate': 1.6353423854571545e-05, 'epoch': 0.61} {'loss': 0.5539, 'learning_rate': 1.635316439877026e-05, 'epoch': 0.61} {'loss': 0.7315, 'learning_rate': 1.635290493579746e-05, 'epoch': 0.61} {'loss': 0.7149, 'learning_rate': 1.6352645465653442e-05, 'epoch': 0.61} {'loss': 0.4746, 'learning_rate': 1.6352385988338492e-05, 'epoch': 0.61} {'loss': 0.5831, 'learning_rate': 1.6352126503852907e-05, 'epoch': 0.61} {'loss': 0.5516, 'learning_rate': 1.635186701219698e-05, 'epoch': 0.61} {'loss': 0.5065, 'learning_rate': 1.6351607513371003e-05, 'epoch': 0.61} {'loss': 0.4956, 'learning_rate': 1.635134800737527e-05, 'epoch': 0.61} {'loss': 0.5513, 'learning_rate': 1.635108849421007e-05, 'epoch': 0.61} {'loss': 0.7292, 'learning_rate': 1.6350828973875704e-05, 'epoch': 0.61} {'loss': 0.6956, 'learning_rate': 1.6350569446372456e-05, 'epoch': 0.61} {'loss': 0.4916, 'learning_rate': 1.6350309911700622e-05, 'epoch': 0.61} {'loss': 0.6175, 'learning_rate': 1.6350050369860495e-05, 'epoch': 0.61} {'loss': 0.5115, 'learning_rate': 1.6349790820852375e-05, 'epoch': 0.61} {'loss': 0.6746, 'learning_rate': 1.634953126467654e-05, 'epoch': 0.61} {'loss': 0.6302, 'learning_rate': 1.6349271701333296e-05, 'epoch': 0.61} {'loss': 0.5444, 'learning_rate': 1.634901213082293e-05, 'epoch': 0.61} {'loss': 0.5641, 'learning_rate': 1.6348752553145736e-05, 'epoch': 0.61} {'loss': 0.6226, 'learning_rate': 1.634849296830201e-05, 'epoch': 0.61} {'loss': 0.7965, 'learning_rate': 1.6348233376292043e-05, 'epoch': 0.61} {'loss': 0.6055, 'learning_rate': 1.6347973777116127e-05, 'epoch': 0.61} {'loss': 0.4787, 'learning_rate': 1.6347714170774555e-05, 'epoch': 0.61} {'loss': 0.6961, 'learning_rate': 1.634745455726762e-05, 'epoch': 0.61} {'loss': 0.5935, 'learning_rate': 1.6347194936595618e-05, 'epoch': 0.61} {'loss': 0.6938, 'learning_rate': 1.634693530875884e-05, 'epoch': 0.61} {'loss': 0.6267, 'learning_rate': 1.6346675673757578e-05, 'epoch': 0.61} {'loss': 0.6351, 'learning_rate': 1.6346416031592127e-05, 'epoch': 0.61} {'loss': 0.4936, 'learning_rate': 1.6346156382262777e-05, 'epoch': 0.61} {'loss': 0.3492, 'learning_rate': 1.6345896725769825e-05, 'epoch': 0.61} {'loss': 0.6718, 'learning_rate': 1.6345637062113562e-05, 'epoch': 0.61} {'loss': 0.4512, 'learning_rate': 1.6345377391294278e-05, 'epoch': 0.61} {'loss': 0.6022, 'learning_rate': 1.6345117713312276e-05, 'epoch': 0.61} {'loss': 0.5534, 'learning_rate': 1.634485802816784e-05, 'epoch': 0.61} {'loss': 0.7108, 'learning_rate': 1.6344598335861263e-05, 'epoch': 0.61} {'loss': 0.6314, 'learning_rate': 1.6344338636392844e-05, 'epoch': 0.61} {'loss': 0.545, 'learning_rate': 1.6344078929762873e-05, 'epoch': 0.61} {'loss': 0.4005, 'learning_rate': 1.6343819215971643e-05, 'epoch': 0.61} {'loss': 0.7, 'learning_rate': 1.6343559495019446e-05, 'epoch': 0.61} {'loss': 0.5095, 'learning_rate': 1.634329976690658e-05, 'epoch': 0.61} {'loss': 0.8441, 'learning_rate': 1.6343040031633332e-05, 'epoch': 0.61} {'loss': 0.5839, 'learning_rate': 1.6342780289199997e-05, 'epoch': 0.61} {'loss': 0.5283, 'learning_rate': 1.634252053960687e-05, 'epoch': 0.61} {'loss': 0.5593, 'learning_rate': 1.634226078285424e-05, 'epoch': 0.61} {'loss': 0.4245, 'learning_rate': 1.634200101894241e-05, 'epoch': 0.61} {'loss': 0.6756, 'learning_rate': 1.6341741247871665e-05, 'epoch': 0.61} {'loss': 0.5327, 'learning_rate': 1.63414814696423e-05, 'epoch': 0.61} {'loss': 0.6867, 'learning_rate': 1.6341221684254607e-05, 'epoch': 0.61} {'loss': 0.4001, 'learning_rate': 1.634096189170888e-05, 'epoch': 0.61} {'loss': 0.6206, 'learning_rate': 1.6340702092005413e-05, 'epoch': 0.61} {'loss': 0.4516, 'learning_rate': 1.6340442285144502e-05, 'epoch': 0.61} {'loss': 0.5812, 'learning_rate': 1.6340182471126434e-05, 'epoch': 0.61} {'loss': 0.4516, 'learning_rate': 1.633992264995151e-05, 'epoch': 0.61} {'loss': 0.5096, 'learning_rate': 1.6339662821620016e-05, 'epoch': 0.61} {'loss': 0.5315, 'learning_rate': 1.6339402986132247e-05, 'epoch': 0.61} {'loss': 0.5631, 'learning_rate': 1.63391431434885e-05, 'epoch': 0.61} {'loss': 0.6463, 'learning_rate': 1.6338883293689065e-05, 'epoch': 0.61} {'loss': 0.6513, 'learning_rate': 1.6338623436734236e-05, 'epoch': 0.61} {'loss': 0.4873, 'learning_rate': 1.6338363572624306e-05, 'epoch': 0.61} {'loss': 0.493, 'learning_rate': 1.6338103701359567e-05, 'epoch': 0.61} {'loss': 0.5315, 'learning_rate': 1.6337843822940317e-05, 'epoch': 0.61} {'loss': 0.6951, 'learning_rate': 1.6337583937366844e-05, 'epoch': 0.61} {'loss': 0.592, 'learning_rate': 1.633732404463945e-05, 'epoch': 0.61} {'loss': 0.6817, 'learning_rate': 1.6337064144758413e-05, 'epoch': 0.61} {'loss': 0.5664, 'learning_rate': 1.6336804237724045e-05, 'epoch': 0.61} {'loss': 0.5835, 'learning_rate': 1.6336544323536623e-05, 'epoch': 0.61} {'loss': 0.7703, 'learning_rate': 1.6336284402196452e-05, 'epoch': 0.61} {'loss': 0.6805, 'learning_rate': 1.633602447370382e-05, 'epoch': 0.61} {'loss': 0.6583, 'learning_rate': 1.6335764538059016e-05, 'epoch': 0.61} {'loss': 0.6635, 'learning_rate': 1.6335504595262345e-05, 'epoch': 0.61} {'loss': 0.5717, 'learning_rate': 1.633524464531409e-05, 'epoch': 0.61} {'loss': 0.536, 'learning_rate': 1.633498468821455e-05, 'epoch': 0.61} {'loss': 0.5225, 'learning_rate': 1.6334724723964017e-05, 'epoch': 0.61} {'loss': 0.5496, 'learning_rate': 1.6334464752562786e-05, 'epoch': 0.61} {'loss': 0.675, 'learning_rate': 1.633420477401115e-05, 'epoch': 0.61} {'loss': 0.5345, 'learning_rate': 1.6333944788309396e-05, 'epoch': 0.61} {'loss': 0.7343, 'learning_rate': 1.6333684795457825e-05, 'epoch': 0.61} {'loss': 0.5113, 'learning_rate': 1.633342479545673e-05, 'epoch': 0.61} {'loss': 0.4464, 'learning_rate': 1.63331647883064e-05, 'epoch': 0.61} {'loss': 0.6278, 'learning_rate': 1.6332904774007135e-05, 'epoch': 0.61} {'loss': 0.6544, 'learning_rate': 1.633264475255922e-05, 'epoch': 0.61} {'loss': 0.6185, 'learning_rate': 1.633238472396296e-05, 'epoch': 0.61} {'loss': 0.3649, 'learning_rate': 1.6332124688218635e-05, 'epoch': 0.61} {'loss': 0.5535, 'learning_rate': 1.633186464532655e-05, 'epoch': 0.61} {'loss': 0.7507, 'learning_rate': 1.633160459528699e-05, 'epoch': 0.61} {'loss': 0.5925, 'learning_rate': 1.6331344538100253e-05, 'epoch': 0.61} {'loss': 0.4683, 'learning_rate': 1.6331084473766635e-05, 'epoch': 0.61} {'loss': 0.6009, 'learning_rate': 1.6330824402286425e-05, 'epoch': 0.61} {'loss': 0.5365, 'learning_rate': 1.6330564323659916e-05, 'epoch': 0.61} {'loss': 0.4977, 'learning_rate': 1.6330304237887407e-05, 'epoch': 0.61} {'loss': 0.4407, 'learning_rate': 1.6330044144969186e-05, 'epoch': 0.61} {'loss': 0.5718, 'learning_rate': 1.632978404490555e-05, 'epoch': 0.61} {'loss': 0.5776, 'learning_rate': 1.6329523937696792e-05, 'epoch': 0.61} {'loss': 0.5836, 'learning_rate': 1.6329263823343203e-05, 'epoch': 0.61} {'loss': 0.4453, 'learning_rate': 1.632900370184508e-05, 'epoch': 0.61} {'loss': 0.5734, 'learning_rate': 1.6328743573202716e-05, 'epoch': 0.61} {'loss': 0.6001, 'learning_rate': 1.63284834374164e-05, 'epoch': 0.61} {'loss': 0.4929, 'learning_rate': 1.6328223294486437e-05, 'epoch': 0.61} {'loss': 0.6258, 'learning_rate': 1.632796314441311e-05, 'epoch': 0.61} {'loss': 0.4489, 'learning_rate': 1.6327702987196712e-05, 'epoch': 0.61} {'loss': 0.5756, 'learning_rate': 1.6327442822837546e-05, 'epoch': 0.61} {'loss': 0.7141, 'learning_rate': 1.6327182651335898e-05, 'epoch': 0.61} {'loss': 0.4955, 'learning_rate': 1.632692247269206e-05, 'epoch': 0.61} {'loss': 0.618, 'learning_rate': 1.6326662286906336e-05, 'epoch': 0.61} {'loss': 0.4418, 'learning_rate': 1.6326402093979012e-05, 'epoch': 0.61} {'loss': 0.4298, 'learning_rate': 1.632614189391038e-05, 'epoch': 0.61} {'loss': 0.6386, 'learning_rate': 1.632588168670074e-05, 'epoch': 0.61} {'loss': 0.5976, 'learning_rate': 1.6325621472350382e-05, 'epoch': 0.61} {'loss': 0.7236, 'learning_rate': 1.63253612508596e-05, 'epoch': 0.61} {'loss': 0.59, 'learning_rate': 1.6325101022228686e-05, 'epoch': 0.61} {'loss': 0.4588, 'learning_rate': 1.6324840786457938e-05, 'epoch': 0.61} {'loss': 0.5734, 'learning_rate': 1.6324580543547647e-05, 'epoch': 0.61} {'loss': 0.5434, 'learning_rate': 1.6324320293498106e-05, 'epoch': 0.61} {'loss': 0.4391, 'learning_rate': 1.632406003630961e-05, 'epoch': 0.61} {'loss': 0.6589, 'learning_rate': 1.6323799771982455e-05, 'epoch': 0.61} {'loss': 0.6581, 'learning_rate': 1.6323539500516933e-05, 'epoch': 0.61} {'loss': 0.4881, 'learning_rate': 1.6323279221913334e-05, 'epoch': 0.61} {'loss': 0.4853, 'learning_rate': 1.6323018936171956e-05, 'epoch': 0.61} {'loss': 0.6222, 'learning_rate': 1.6322758643293094e-05, 'epoch': 0.61} {'loss': 0.4822, 'learning_rate': 1.632249834327704e-05, 'epoch': 0.61} {'loss': 0.558, 'learning_rate': 1.6322238036124087e-05, 'epoch': 0.61} {'loss': 0.5657, 'learning_rate': 1.6321977721834526e-05, 'epoch': 0.61} {'loss': 0.4658, 'learning_rate': 1.6321717400408656e-05, 'epoch': 0.61} {'loss': 0.4934, 'learning_rate': 1.632145707184677e-05, 'epoch': 0.61} {'loss': 0.5305, 'learning_rate': 1.6321196736149163e-05, 'epoch': 0.61} {'loss': 0.5978, 'learning_rate': 1.6320936393316124e-05, 'epoch': 0.61} {'loss': 0.4952, 'learning_rate': 1.632067604334795e-05, 'epoch': 0.61} {'loss': 0.5682, 'learning_rate': 1.632041568624494e-05, 'epoch': 0.61} {'loss': 0.4808, 'learning_rate': 1.6320155322007375e-05, 'epoch': 0.61} {'loss': 0.6098, 'learning_rate': 1.631989495063556e-05, 'epoch': 0.61} {'loss': 0.6847, 'learning_rate': 1.6319634572129785e-05, 'epoch': 0.61} {'loss': 0.5074, 'learning_rate': 1.6319374186490347e-05, 'epoch': 0.61} {'loss': 0.6097, 'learning_rate': 1.6319113793717532e-05, 'epoch': 0.61} {'loss': 0.3865, 'learning_rate': 1.6318853393811643e-05, 'epoch': 0.61} {'loss': 0.5115, 'learning_rate': 1.631859298677297e-05, 'epoch': 0.61} {'loss': 0.7744, 'learning_rate': 1.6318332572601804e-05, 'epoch': 0.61} {'loss': 0.5603, 'learning_rate': 1.6318072151298444e-05, 'epoch': 0.61} {'loss': 0.509, 'learning_rate': 1.6317811722863184e-05, 'epoch': 0.61} {'loss': 0.6719, 'learning_rate': 1.6317551287296314e-05, 'epoch': 0.61} {'loss': 0.6377, 'learning_rate': 1.631729084459813e-05, 'epoch': 0.61} {'loss': 0.6079, 'learning_rate': 1.6317030394768926e-05, 'epoch': 0.61} {'loss': 0.6237, 'learning_rate': 1.6316769937808995e-05, 'epoch': 0.61} {'loss': 0.3315, 'learning_rate': 1.6316509473718632e-05, 'epoch': 0.61} {'loss': 0.474, 'learning_rate': 1.6316249002498136e-05, 'epoch': 0.61} {'loss': 0.5596, 'learning_rate': 1.6315988524147787e-05, 'epoch': 0.61} {'loss': 0.4772, 'learning_rate': 1.6315728038667895e-05, 'epoch': 0.61} {'loss': 0.5734, 'learning_rate': 1.6315467546058746e-05, 'epoch': 0.61} {'loss': 0.5747, 'learning_rate': 1.6315207046320632e-05, 'epoch': 0.61} {'loss': 0.5687, 'learning_rate': 1.6314946539453852e-05, 'epoch': 0.61} {'loss': 0.5345, 'learning_rate': 1.6314686025458697e-05, 'epoch': 0.61} {'loss': 0.6097, 'learning_rate': 1.6314425504335464e-05, 'epoch': 0.61} {'loss': 0.6989, 'learning_rate': 1.6314164976084446e-05, 'epoch': 0.61} {'loss': 0.5133, 'learning_rate': 1.6313904440705934e-05, 'epoch': 0.61} {'loss': 0.681, 'learning_rate': 1.6313643898200226e-05, 'epoch': 0.61} {'loss': 0.5944, 'learning_rate': 1.6313383348567613e-05, 'epoch': 0.61} {'loss': 0.5467, 'learning_rate': 1.6313122791808393e-05, 'epoch': 0.61} {'loss': 0.4737, 'learning_rate': 1.6312862227922855e-05, 'epoch': 0.61} {'loss': 0.6977, 'learning_rate': 1.63126016569113e-05, 'epoch': 0.61} {'loss': 0.5826, 'learning_rate': 1.6312341078774015e-05, 'epoch': 0.61} {'loss': 0.5848, 'learning_rate': 1.63120804935113e-05, 'epoch': 0.61} {'loss': 0.5692, 'learning_rate': 1.6311819901123445e-05, 'epoch': 0.61} {'loss': 0.6137, 'learning_rate': 1.6311559301610742e-05, 'epoch': 0.61} {'loss': 0.6389, 'learning_rate': 1.6311298694973493e-05, 'epoch': 0.61} {'loss': 0.5825, 'learning_rate': 1.631103808121199e-05, 'epoch': 0.61} {'loss': 0.5028, 'learning_rate': 1.631077746032652e-05, 'epoch': 0.61} {'loss': 0.5808, 'learning_rate': 1.6310516832317386e-05, 'epoch': 0.61} {'loss': 0.4772, 'learning_rate': 1.6310256197184874e-05, 'epoch': 0.61} {'loss': 0.6254, 'learning_rate': 1.6309995554929286e-05, 'epoch': 0.61} {'loss': 0.4613, 'learning_rate': 1.630973490555091e-05, 'epoch': 0.61} {'loss': 0.579, 'learning_rate': 1.6309474249050047e-05, 'epoch': 0.61} {'loss': 0.6079, 'learning_rate': 1.6309213585426986e-05, 'epoch': 0.61} {'loss': 0.6683, 'learning_rate': 1.6308952914682024e-05, 'epoch': 0.61} {'loss': 0.5, 'learning_rate': 1.630869223681545e-05, 'epoch': 0.61} {'loss': 0.4024, 'learning_rate': 1.6308431551827565e-05, 'epoch': 0.61} {'loss': 0.5909, 'learning_rate': 1.630817085971866e-05, 'epoch': 0.61} {'loss': 0.5547, 'learning_rate': 1.630791016048903e-05, 'epoch': 0.61} {'loss': 0.5348, 'learning_rate': 1.6307649454138968e-05, 'epoch': 0.61} {'loss': 0.6255, 'learning_rate': 1.630738874066877e-05, 'epoch': 0.61} {'loss': 0.5269, 'learning_rate': 1.630712802007873e-05, 'epoch': 0.61} {'loss': 0.7238, 'learning_rate': 1.630686729236914e-05, 'epoch': 0.61} {'loss': 0.5924, 'learning_rate': 1.63066065575403e-05, 'epoch': 0.61} {'loss': 0.594, 'learning_rate': 1.6306345815592494e-05, 'epoch': 0.61} {'loss': 0.6572, 'learning_rate': 1.6306085066526027e-05, 'epoch': 0.61} {'loss': 0.6726, 'learning_rate': 1.630582431034119e-05, 'epoch': 0.61} {'loss': 0.6313, 'learning_rate': 1.6305563547038276e-05, 'epoch': 0.61} {'loss': 0.6505, 'learning_rate': 1.6305302776617577e-05, 'epoch': 0.61} {'loss': 0.4813, 'learning_rate': 1.6305041999079393e-05, 'epoch': 0.61} {'loss': 0.6197, 'learning_rate': 1.6304781214424014e-05, 'epoch': 0.61} {'loss': 0.7288, 'learning_rate': 1.630452042265174e-05, 'epoch': 0.61} {'loss': 0.6133, 'learning_rate': 1.6304259623762855e-05, 'epoch': 0.61} {'loss': 0.5629, 'learning_rate': 1.6303998817757662e-05, 'epoch': 0.61} {'loss': 0.4858, 'learning_rate': 1.6303738004636453e-05, 'epoch': 0.61} {'loss': 0.679, 'learning_rate': 1.6303477184399524e-05, 'epoch': 0.61} {'loss': 0.5785, 'learning_rate': 1.630321635704717e-05, 'epoch': 0.61} {'loss': 0.723, 'learning_rate': 1.6302955522579677e-05, 'epoch': 0.61} {'loss': 0.4546, 'learning_rate': 1.6302694680997348e-05, 'epoch': 0.61} {'loss': 0.5214, 'learning_rate': 1.6302433832300478e-05, 'epoch': 0.61} {'loss': 0.6596, 'learning_rate': 1.6302172976489358e-05, 'epoch': 0.61} {'loss': 0.4906, 'learning_rate': 1.630191211356428e-05, 'epoch': 0.61} {'loss': 0.5283, 'learning_rate': 1.6301651243525546e-05, 'epoch': 0.61} {'loss': 0.5673, 'learning_rate': 1.630139036637344e-05, 'epoch': 0.61} {'loss': 0.4936, 'learning_rate': 1.6301129482108268e-05, 'epoch': 0.61} {'loss': 0.5656, 'learning_rate': 1.630086859073032e-05, 'epoch': 0.61} {'loss': 0.6577, 'learning_rate': 1.6300607692239885e-05, 'epoch': 0.61} {'loss': 0.3853, 'learning_rate': 1.6300346786637265e-05, 'epoch': 0.61} {'loss': 0.5891, 'learning_rate': 1.630008587392275e-05, 'epoch': 0.61} {'loss': 0.4246, 'learning_rate': 1.6299824954096636e-05, 'epoch': 0.61} {'loss': 0.6435, 'learning_rate': 1.629956402715922e-05, 'epoch': 0.61} {'loss': 0.579, 'learning_rate': 1.629930309311079e-05, 'epoch': 0.61} {'loss': 0.5638, 'learning_rate': 1.629904215195165e-05, 'epoch': 0.61} {'loss': 0.6774, 'learning_rate': 1.6298781203682085e-05, 'epoch': 0.61} {'loss': 0.5845, 'learning_rate': 1.6298520248302394e-05, 'epoch': 0.61} {'loss': 0.5337, 'learning_rate': 1.629825928581287e-05, 'epoch': 0.61} {'loss': 0.5689, 'learning_rate': 1.6297998316213815e-05, 'epoch': 0.61} {'loss': 0.5761, 'learning_rate': 1.6297737339505513e-05, 'epoch': 0.61} {'loss': 0.5219, 'learning_rate': 1.6297476355688263e-05, 'epoch': 0.61} {'loss': 0.6572, 'learning_rate': 1.629721536476236e-05, 'epoch': 0.61} {'loss': 0.6336, 'learning_rate': 1.62969543667281e-05, 'epoch': 0.61} {'loss': 0.6559, 'learning_rate': 1.6296693361585775e-05, 'epoch': 0.61} {'loss': 0.5828, 'learning_rate': 1.629643234933568e-05, 'epoch': 0.61} {'loss': 0.4745, 'learning_rate': 1.629617132997811e-05, 'epoch': 0.61} {'loss': 0.5628, 'learning_rate': 1.6295910303513357e-05, 'epoch': 0.61} {'loss': 0.5252, 'learning_rate': 1.6295649269941724e-05, 'epoch': 0.61} {'loss': 0.5506, 'learning_rate': 1.62953882292635e-05, 'epoch': 0.61} {'loss': 0.6067, 'learning_rate': 1.6295127181478977e-05, 'epoch': 0.61} {'loss': 0.6593, 'learning_rate': 1.6294866126588453e-05, 'epoch': 0.61} {'loss': 0.5785, 'learning_rate': 1.629460506459222e-05, 'epoch': 0.61} {'loss': 0.5663, 'learning_rate': 1.629434399549058e-05, 'epoch': 0.61} {'loss': 0.5154, 'learning_rate': 1.629408291928382e-05, 'epoch': 0.61} {'loss': 0.675, 'learning_rate': 1.6293821835972236e-05, 'epoch': 0.61} {'loss': 0.613, 'learning_rate': 1.6293560745556127e-05, 'epoch': 0.61} {'loss': 0.6614, 'learning_rate': 1.6293299648035783e-05, 'epoch': 0.61} {'loss': 0.5061, 'learning_rate': 1.6293038543411502e-05, 'epoch': 0.61} {'loss': 0.4953, 'learning_rate': 1.6292777431683573e-05, 'epoch': 0.61} {'loss': 0.4396, 'learning_rate': 1.6292516312852294e-05, 'epoch': 0.61} {'loss': 0.7254, 'learning_rate': 1.6292255186917966e-05, 'epoch': 0.61} {'loss': 0.554, 'learning_rate': 1.629199405388088e-05, 'epoch': 0.61} {'loss': 0.4391, 'learning_rate': 1.629173291374132e-05, 'epoch': 0.61} {'loss': 0.6192, 'learning_rate': 1.6291471766499598e-05, 'epoch': 0.61} {'loss': 0.6522, 'learning_rate': 1.6291210612155998e-05, 'epoch': 0.61} {'loss': 0.6362, 'learning_rate': 1.6290949450710816e-05, 'epoch': 0.61} {'loss': 0.675, 'learning_rate': 1.6290688282164354e-05, 'epoch': 0.61} {'loss': 0.682, 'learning_rate': 1.6290427106516897e-05, 'epoch': 0.61} {'loss': 0.6752, 'learning_rate': 1.6290165923768745e-05, 'epoch': 0.61} {'loss': 0.5575, 'learning_rate': 1.628990473392019e-05, 'epoch': 0.61} {'loss': 0.5594, 'learning_rate': 1.628964353697153e-05, 'epoch': 0.61} {'loss': 0.6188, 'learning_rate': 1.628938233292306e-05, 'epoch': 0.61} {'loss': 0.6979, 'learning_rate': 1.628912112177507e-05, 'epoch': 0.61} {'loss': 0.5493, 'learning_rate': 1.628885990352786e-05, 'epoch': 0.61} {'loss': 0.6134, 'learning_rate': 1.6288598678181723e-05, 'epoch': 0.61} {'loss': 0.434, 'learning_rate': 1.6288337445736956e-05, 'epoch': 0.61} {'loss': 0.5804, 'learning_rate': 1.628807620619385e-05, 'epoch': 0.61} {'loss': 0.5834, 'learning_rate': 1.62878149595527e-05, 'epoch': 0.61} {'loss': 0.4907, 'learning_rate': 1.6287553705813803e-05, 'epoch': 0.61} {'loss': 0.5798, 'learning_rate': 1.6287292444977453e-05, 'epoch': 0.61} {'loss': 0.667, 'learning_rate': 1.6287031177043947e-05, 'epoch': 0.61} {'loss': 0.5523, 'learning_rate': 1.6286769902013578e-05, 'epoch': 0.61} {'loss': 0.5155, 'learning_rate': 1.6286508619886642e-05, 'epoch': 0.61} {'loss': 0.4377, 'learning_rate': 1.6286247330663433e-05, 'epoch': 0.61} {'loss': 0.4957, 'learning_rate': 1.6285986034344246e-05, 'epoch': 0.61} {'loss': 0.6218, 'learning_rate': 1.6285724730929377e-05, 'epoch': 0.61} {'loss': 0.5509, 'learning_rate': 1.628546342041912e-05, 'epoch': 0.61} {'loss': 0.5966, 'learning_rate': 1.6285202102813767e-05, 'epoch': 0.61} {'loss': 0.4649, 'learning_rate': 1.6284940778113617e-05, 'epoch': 0.61} {'loss': 0.6548, 'learning_rate': 1.6284679446318966e-05, 'epoch': 0.61} {'loss': 0.4412, 'learning_rate': 1.6284418107430106e-05, 'epoch': 0.61} {'loss': 0.661, 'learning_rate': 1.628415676144733e-05, 'epoch': 0.61} {'loss': 0.6127, 'learning_rate': 1.6283895408370943e-05, 'epoch': 0.61} {'loss': 0.5224, 'learning_rate': 1.6283634048201227e-05, 'epoch': 0.61} {'loss': 0.5905, 'learning_rate': 1.6283372680938484e-05, 'epoch': 0.61} {'loss': 0.5865, 'learning_rate': 1.628311130658301e-05, 'epoch': 0.61} {'loss': 0.5377, 'learning_rate': 1.6282849925135097e-05, 'epoch': 0.61} {'loss': 0.6133, 'learning_rate': 1.628258853659504e-05, 'epoch': 0.61} {'loss': 0.5694, 'learning_rate': 1.628232714096314e-05, 'epoch': 0.61} {'loss': 0.6647, 'learning_rate': 1.6282065738239682e-05, 'epoch': 0.61} {'loss': 0.6916, 'learning_rate': 1.628180432842497e-05, 'epoch': 0.61} {'loss': 0.7109, 'learning_rate': 1.628154291151929e-05, 'epoch': 0.61} {'loss': 0.6285, 'learning_rate': 1.628128148752295e-05, 'epoch': 0.61} {'loss': 0.5203, 'learning_rate': 1.6281020056436233e-05, 'epoch': 0.61} {'loss': 0.6383, 'learning_rate': 1.628075861825944e-05, 'epoch': 0.61} {'loss': 0.4644, 'learning_rate': 1.6280497172992865e-05, 'epoch': 0.61} {'loss': 0.6203, 'learning_rate': 1.62802357206368e-05, 'epoch': 0.61} {'loss': 0.5174, 'learning_rate': 1.6279974261191546e-05, 'epoch': 0.61} {'loss': 0.6504, 'learning_rate': 1.6279712794657396e-05, 'epoch': 0.61} {'loss': 0.681, 'learning_rate': 1.6279451321034643e-05, 'epoch': 0.61} {'loss': 0.4231, 'learning_rate': 1.6279189840323584e-05, 'epoch': 0.61} {'loss': 0.5155, 'learning_rate': 1.6278928352524515e-05, 'epoch': 0.61} {'loss': 0.6559, 'learning_rate': 1.6278666857637726e-05, 'epoch': 0.61} {'loss': 0.5253, 'learning_rate': 1.6278405355663517e-05, 'epoch': 0.61} {'loss': 0.5744, 'learning_rate': 1.6278143846602187e-05, 'epoch': 0.61} {'loss': 0.6556, 'learning_rate': 1.6277882330454024e-05, 'epoch': 0.61} {'loss': 0.4802, 'learning_rate': 1.6277620807219322e-05, 'epoch': 0.61} {'loss': 0.4903, 'learning_rate': 1.6277359276898383e-05, 'epoch': 0.61} {'loss': 0.6078, 'learning_rate': 1.6277097739491502e-05, 'epoch': 0.61} {'loss': 0.6676, 'learning_rate': 1.6276836194998966e-05, 'epoch': 0.61} {'loss': 0.6437, 'learning_rate': 1.627657464342108e-05, 'epoch': 0.61} {'loss': 0.4298, 'learning_rate': 1.627631308475813e-05, 'epoch': 0.61} {'loss': 0.5787, 'learning_rate': 1.627605151901042e-05, 'epoch': 0.61} {'loss': 0.5171, 'learning_rate': 1.627578994617824e-05, 'epoch': 0.61} {'loss': 0.5131, 'learning_rate': 1.6275528366261885e-05, 'epoch': 0.61} {'loss': 0.5991, 'learning_rate': 1.627526677926165e-05, 'epoch': 0.61} {'loss': 0.6249, 'learning_rate': 1.6275005185177838e-05, 'epoch': 0.61} {'loss': 0.5, 'learning_rate': 1.6274743584010734e-05, 'epoch': 0.61} {'loss': 0.7274, 'learning_rate': 1.627448197576064e-05, 'epoch': 0.61} {'loss': 0.5935, 'learning_rate': 1.627422036042785e-05, 'epoch': 0.61} {'loss': 0.6021, 'learning_rate': 1.6273958738012653e-05, 'epoch': 0.61} {'loss': 0.5618, 'learning_rate': 1.6273697108515354e-05, 'epoch': 0.61} {'loss': 0.6437, 'learning_rate': 1.6273435471936246e-05, 'epoch': 0.61} {'loss': 0.6476, 'learning_rate': 1.6273173828275618e-05, 'epoch': 0.61} {'loss': 0.5861, 'learning_rate': 1.627291217753377e-05, 'epoch': 0.61} {'loss': 0.628, 'learning_rate': 1.6272650519711e-05, 'epoch': 0.61} {'loss': 0.5405, 'learning_rate': 1.6272388854807596e-05, 'epoch': 0.61} {'loss': 0.5912, 'learning_rate': 1.6272127182823863e-05, 'epoch': 0.61} {'loss': 0.6371, 'learning_rate': 1.6271865503760086e-05, 'epoch': 0.61} {'loss': 0.4541, 'learning_rate': 1.627160381761657e-05, 'epoch': 0.61} {'loss': 0.5645, 'learning_rate': 1.6271342124393605e-05, 'epoch': 0.61} {'loss': 0.5463, 'learning_rate': 1.627108042409148e-05, 'epoch': 0.61} {'loss': 0.3659, 'learning_rate': 1.6270818716710507e-05, 'epoch': 0.61} {'loss': 0.7305, 'learning_rate': 1.6270557002250965e-05, 'epoch': 0.61} {'loss': 0.6188, 'learning_rate': 1.627029528071316e-05, 'epoch': 0.61} {'loss': 0.402, 'learning_rate': 1.6270033552097385e-05, 'epoch': 0.61} {'loss': 0.7457, 'learning_rate': 1.6269771816403936e-05, 'epoch': 0.61} {'loss': 0.6119, 'learning_rate': 1.6269510073633104e-05, 'epoch': 0.61} {'loss': 0.5036, 'learning_rate': 1.626924832378519e-05, 'epoch': 0.61} {'loss': 0.8111, 'learning_rate': 1.6268986566860484e-05, 'epoch': 0.61} {'loss': 0.472, 'learning_rate': 1.6268724802859282e-05, 'epoch': 0.61} {'loss': 0.6716, 'learning_rate': 1.6268463031781886e-05, 'epoch': 0.61} {'loss': 0.4148, 'learning_rate': 1.6268201253628587e-05, 'epoch': 0.61} {'loss': 0.6349, 'learning_rate': 1.626793946839968e-05, 'epoch': 0.61} {'loss': 0.6419, 'learning_rate': 1.6267677676095458e-05, 'epoch': 0.61} {'loss': 0.7256, 'learning_rate': 1.6267415876716225e-05, 'epoch': 0.61} {'loss': 0.4811, 'learning_rate': 1.626715407026227e-05, 'epoch': 0.61} {'loss': 0.6152, 'learning_rate': 1.6266892256733887e-05, 'epoch': 0.61} {'loss': 0.4844, 'learning_rate': 1.6266630436131376e-05, 'epoch': 0.61} {'loss': 0.6042, 'learning_rate': 1.626636860845503e-05, 'epoch': 0.61} {'loss': 0.6047, 'learning_rate': 1.626610677370515e-05, 'epoch': 0.61} {'loss': 0.5043, 'learning_rate': 1.6265844931882023e-05, 'epoch': 0.61} {'loss': 0.6614, 'learning_rate': 1.6265583082985948e-05, 'epoch': 0.61} {'loss': 0.5729, 'learning_rate': 1.6265321227017223e-05, 'epoch': 0.61} {'loss': 0.6999, 'learning_rate': 1.626505936397614e-05, 'epoch': 0.61} {'loss': 0.6385, 'learning_rate': 1.6264797493862996e-05, 'epoch': 0.61} {'loss': 0.549, 'learning_rate': 1.626453561667809e-05, 'epoch': 0.61} {'loss': 0.5671, 'learning_rate': 1.626427373242171e-05, 'epoch': 0.61} {'loss': 0.5812, 'learning_rate': 1.6264011841094164e-05, 'epoch': 0.61} {'loss': 0.5643, 'learning_rate': 1.6263749942695732e-05, 'epoch': 0.61} {'loss': 0.5192, 'learning_rate': 1.626348803722672e-05, 'epoch': 0.61} {'loss': 0.4717, 'learning_rate': 1.6263226124687422e-05, 'epoch': 0.61} {'loss': 0.5161, 'learning_rate': 1.626296420507813e-05, 'epoch': 0.61} {'loss': 0.6373, 'learning_rate': 1.6262702278399145e-05, 'epoch': 0.61} {'loss': 0.7005, 'learning_rate': 1.6262440344650762e-05, 'epoch': 0.61} {'loss': 0.6628, 'learning_rate': 1.6262178403833273e-05, 'epoch': 0.61} {'loss': 0.5402, 'learning_rate': 1.6261916455946975e-05, 'epoch': 0.61} {'loss': 0.6141, 'learning_rate': 1.626165450099216e-05, 'epoch': 0.61} {'loss': 0.6972, 'learning_rate': 1.6261392538969132e-05, 'epoch': 0.61} {'loss': 0.6501, 'learning_rate': 1.626113056987818e-05, 'epoch': 0.61} {'loss': 0.4605, 'learning_rate': 1.6260868593719604e-05, 'epoch': 0.61} {'loss': 0.429, 'learning_rate': 1.62606066104937e-05, 'epoch': 0.61} {'loss': 0.6359, 'learning_rate': 1.6260344620200757e-05, 'epoch': 0.61} {'loss': 0.4686, 'learning_rate': 1.626008262284108e-05, 'epoch': 0.61} {'loss': 0.6136, 'learning_rate': 1.6259820618414958e-05, 'epoch': 0.61} {'loss': 0.7368, 'learning_rate': 1.625955860692269e-05, 'epoch': 0.61} {'loss': 0.5486, 'learning_rate': 1.6259296588364567e-05, 'epoch': 0.61} {'loss': 0.508, 'learning_rate': 1.6259034562740895e-05, 'epoch': 0.61} {'loss': 0.665, 'learning_rate': 1.6258772530051955e-05, 'epoch': 0.61} {'loss': 0.5325, 'learning_rate': 1.6258510490298056e-05, 'epoch': 0.61} {'loss': 0.6766, 'learning_rate': 1.6258248443479486e-05, 'epoch': 0.61} {'loss': 0.4303, 'learning_rate': 1.625798638959655e-05, 'epoch': 0.61} {'loss': 0.5332, 'learning_rate': 1.625772432864953e-05, 'epoch': 0.61} {'loss': 0.6348, 'learning_rate': 1.625746226063873e-05, 'epoch': 0.61} {'loss': 0.4783, 'learning_rate': 1.625720018556445e-05, 'epoch': 0.61} {'loss': 0.4481, 'learning_rate': 1.6256938103426976e-05, 'epoch': 0.61} {'loss': 0.5717, 'learning_rate': 1.625667601422661e-05, 'epoch': 0.61} {'loss': 0.4444, 'learning_rate': 1.6256413917963647e-05, 'epoch': 0.61} {'loss': 0.6936, 'learning_rate': 1.6256151814638387e-05, 'epoch': 0.61} {'loss': 0.5614, 'learning_rate': 1.6255889704251115e-05, 'epoch': 0.61} {'loss': 0.6072, 'learning_rate': 1.6255627586802133e-05, 'epoch': 0.61} {'loss': 0.6118, 'learning_rate': 1.625536546229174e-05, 'epoch': 0.61} {'loss': 0.6608, 'learning_rate': 1.6255103330720227e-05, 'epoch': 0.61} {'loss': 0.4891, 'learning_rate': 1.6254841192087893e-05, 'epoch': 0.61} {'loss': 0.6199, 'learning_rate': 1.6254579046395035e-05, 'epoch': 0.61} {'loss': 0.6335, 'learning_rate': 1.6254316893641943e-05, 'epoch': 0.61} {'loss': 0.5281, 'learning_rate': 1.6254054733828917e-05, 'epoch': 0.61} {'loss': 0.7487, 'learning_rate': 1.6253792566956253e-05, 'epoch': 0.61} {'loss': 0.6161, 'learning_rate': 1.6253530393024245e-05, 'epoch': 0.61} {'loss': 0.5814, 'learning_rate': 1.6253268212033192e-05, 'epoch': 0.61} {'loss': 0.6651, 'learning_rate': 1.6253006023983387e-05, 'epoch': 0.61} {'loss': 0.5117, 'learning_rate': 1.625274382887513e-05, 'epoch': 0.61} {'loss': 0.4833, 'learning_rate': 1.6252481626708712e-05, 'epoch': 0.61} {'loss': 0.5847, 'learning_rate': 1.6252219417484432e-05, 'epoch': 0.61} {'loss': 0.7122, 'learning_rate': 1.6251957201202585e-05, 'epoch': 0.61} {'loss': 0.6318, 'learning_rate': 1.6251694977863467e-05, 'epoch': 0.61} {'loss': 0.4322, 'learning_rate': 1.6251432747467374e-05, 'epoch': 0.61} {'loss': 0.5532, 'learning_rate': 1.6251170510014603e-05, 'epoch': 0.61} {'loss': 0.5498, 'learning_rate': 1.625090826550545e-05, 'epoch': 0.61} {'loss': 0.6804, 'learning_rate': 1.6250646013940206e-05, 'epoch': 0.61} {'loss': 0.6486, 'learning_rate': 1.6250383755319177e-05, 'epoch': 0.61} {'loss': 0.3657, 'learning_rate': 1.6250121489642648e-05, 'epoch': 0.61} {'loss': 0.3041, 'learning_rate': 1.6249859216910924e-05, 'epoch': 0.61} {'loss': 0.6016, 'learning_rate': 1.6249596937124297e-05, 'epoch': 0.61} {'loss': 0.6177, 'learning_rate': 1.624933465028306e-05, 'epoch': 0.61} {'loss': 0.5112, 'learning_rate': 1.6249072356387517e-05, 'epoch': 0.61} {'loss': 0.536, 'learning_rate': 1.624881005543796e-05, 'epoch': 0.61} {'loss': 0.635, 'learning_rate': 1.624854774743468e-05, 'epoch': 0.61} {'loss': 0.6072, 'learning_rate': 1.624828543237798e-05, 'epoch': 0.61} {'loss': 0.4689, 'learning_rate': 1.6248023110268156e-05, 'epoch': 0.61} {'loss': 0.5296, 'learning_rate': 1.62477607811055e-05, 'epoch': 0.61} {'loss': 0.6125, 'learning_rate': 1.6247498444890314e-05, 'epoch': 0.61} {'loss': 0.6068, 'learning_rate': 1.6247236101622884e-05, 'epoch': 0.61} {'loss': 0.6121, 'learning_rate': 1.6246973751303518e-05, 'epoch': 0.61} {'loss': 0.7, 'learning_rate': 1.62467113939325e-05, 'epoch': 0.61} {'loss': 0.5187, 'learning_rate': 1.6246449029510135e-05, 'epoch': 0.61} {'loss': 0.5097, 'learning_rate': 1.624618665803672e-05, 'epoch': 0.61} {'loss': 0.6061, 'learning_rate': 1.6245924279512547e-05, 'epoch': 0.61} {'loss': 0.5681, 'learning_rate': 1.624566189393791e-05, 'epoch': 0.61} {'loss': 0.6232, 'learning_rate': 1.6245399501313115e-05, 'epoch': 0.62} {'loss': 0.5024, 'learning_rate': 1.6245137101638447e-05, 'epoch': 0.62} {'loss': 0.5892, 'learning_rate': 1.6244874694914205e-05, 'epoch': 0.62} {'loss': 0.4591, 'learning_rate': 1.6244612281140687e-05, 'epoch': 0.62} {'loss': 0.5626, 'learning_rate': 1.6244349860318195e-05, 'epoch': 0.62} {'loss': 0.5713, 'learning_rate': 1.6244087432447013e-05, 'epoch': 0.62} {'loss': 0.5882, 'learning_rate': 1.624382499752745e-05, 'epoch': 0.62} {'loss': 0.5873, 'learning_rate': 1.624356255555979e-05, 'epoch': 0.62} {'loss': 0.6107, 'learning_rate': 1.6243300106544338e-05, 'epoch': 0.62} {'loss': 0.6292, 'learning_rate': 1.624303765048139e-05, 'epoch': 0.62} {'loss': 0.4851, 'learning_rate': 1.6242775187371235e-05, 'epoch': 0.62} {'loss': 0.56, 'learning_rate': 1.6242512717214176e-05, 'epoch': 0.62} {'loss': 0.6788, 'learning_rate': 1.6242250240010508e-05, 'epoch': 0.62} {'loss': 0.5555, 'learning_rate': 1.624198775576052e-05, 'epoch': 0.62} {'loss': 0.4708, 'learning_rate': 1.6241725264464522e-05, 'epoch': 0.62} {'loss': 0.5229, 'learning_rate': 1.6241462766122805e-05, 'epoch': 0.62} {'loss': 0.4478, 'learning_rate': 1.6241200260735657e-05, 'epoch': 0.62} {'loss': 0.5036, 'learning_rate': 1.6240937748303383e-05, 'epoch': 0.62} {'loss': 0.5179, 'learning_rate': 1.6240675228826276e-05, 'epoch': 0.62} {'loss': 0.5634, 'learning_rate': 1.6240412702304636e-05, 'epoch': 0.62} {'loss': 0.5379, 'learning_rate': 1.624015016873876e-05, 'epoch': 0.62} {'loss': 0.501, 'learning_rate': 1.6239887628128932e-05, 'epoch': 0.62} {'loss': 0.7477, 'learning_rate': 1.6239625080475463e-05, 'epoch': 0.62} {'loss': 0.6165, 'learning_rate': 1.623936252577864e-05, 'epoch': 0.62} {'loss': 0.565, 'learning_rate': 1.623909996403877e-05, 'epoch': 0.62} {'loss': 0.4996, 'learning_rate': 1.6238837395256136e-05, 'epoch': 0.62} {'loss': 0.4179, 'learning_rate': 1.6238574819431043e-05, 'epoch': 0.62} {'loss': 0.527, 'learning_rate': 1.6238312236563786e-05, 'epoch': 0.62} {'loss': 0.7142, 'learning_rate': 1.6238049646654663e-05, 'epoch': 0.62} {'loss': 0.5224, 'learning_rate': 1.6237787049703965e-05, 'epoch': 0.62} {'loss': 0.4768, 'learning_rate': 1.6237524445711993e-05, 'epoch': 0.62} {'loss': 0.5519, 'learning_rate': 1.623726183467904e-05, 'epoch': 0.62} {'loss': 0.672, 'learning_rate': 1.6236999216605408e-05, 'epoch': 0.62} {'loss': 0.4788, 'learning_rate': 1.6236736591491386e-05, 'epoch': 0.62} {'loss': 0.5769, 'learning_rate': 1.6236473959337277e-05, 'epoch': 0.62} {'loss': 0.6855, 'learning_rate': 1.6236211320143372e-05, 'epoch': 0.62} {'loss': 0.5997, 'learning_rate': 1.6235948673909973e-05, 'epoch': 0.62} {'loss': 0.6457, 'learning_rate': 1.6235686020637374e-05, 'epoch': 0.62} {'loss': 0.6073, 'learning_rate': 1.623542336032587e-05, 'epoch': 0.62} {'loss': 0.6081, 'learning_rate': 1.6235160692975758e-05, 'epoch': 0.62} {'loss': 0.6338, 'learning_rate': 1.6234898018587336e-05, 'epoch': 0.62} {'loss': 0.615, 'learning_rate': 1.6234635337160903e-05, 'epoch': 0.62} {'loss': 0.6609, 'learning_rate': 1.623437264869675e-05, 'epoch': 0.62} {'loss': 0.5894, 'learning_rate': 1.6234109953195173e-05, 'epoch': 0.62} {'loss': 0.6649, 'learning_rate': 1.6233847250656472e-05, 'epoch': 0.62} {'loss': 0.399, 'learning_rate': 1.6233584541080943e-05, 'epoch': 0.62} {'loss': 0.581, 'learning_rate': 1.6233321824468887e-05, 'epoch': 0.62} {'loss': 0.4147, 'learning_rate': 1.623305910082059e-05, 'epoch': 0.62} {'loss': 0.538, 'learning_rate': 1.623279637013636e-05, 'epoch': 0.62} {'loss': 0.6079, 'learning_rate': 1.6232533632416484e-05, 'epoch': 0.62} {'loss': 0.5905, 'learning_rate': 1.6232270887661267e-05, 'epoch': 0.62} {'loss': 0.5368, 'learning_rate': 1.6232008135870995e-05, 'epoch': 0.62} {'loss': 0.7241, 'learning_rate': 1.6231745377045975e-05, 'epoch': 0.62} {'loss': 0.4917, 'learning_rate': 1.62314826111865e-05, 'epoch': 0.62} {'loss': 0.6395, 'learning_rate': 1.623121983829286e-05, 'epoch': 0.62} {'loss': 0.5459, 'learning_rate': 1.6230957058365364e-05, 'epoch': 0.62} {'loss': 0.5432, 'learning_rate': 1.6230694271404302e-05, 'epoch': 0.62} {'loss': 0.5823, 'learning_rate': 1.623043147740997e-05, 'epoch': 0.62} {'loss': 0.6254, 'learning_rate': 1.6230168676382664e-05, 'epoch': 0.62} {'loss': 0.7519, 'learning_rate': 1.6229905868322686e-05, 'epoch': 0.62} {'loss': 0.7494, 'learning_rate': 1.6229643053230328e-05, 'epoch': 0.62} {'loss': 0.5937, 'learning_rate': 1.622938023110588e-05, 'epoch': 0.62} {'loss': 0.5221, 'learning_rate': 1.6229117401949656e-05, 'epoch': 0.62} {'loss': 0.4342, 'learning_rate': 1.622885456576194e-05, 'epoch': 0.62} {'loss': 0.6246, 'learning_rate': 1.6228591722543032e-05, 'epoch': 0.62} {'loss': 0.54, 'learning_rate': 1.622832887229323e-05, 'epoch': 0.62} {'loss': 0.6026, 'learning_rate': 1.6228066015012824e-05, 'epoch': 0.62} {'loss': 0.5162, 'learning_rate': 1.622780315070212e-05, 'epoch': 0.62} {'loss': 0.48, 'learning_rate': 1.6227540279361406e-05, 'epoch': 0.62} {'loss': 0.7556, 'learning_rate': 1.6227277400990988e-05, 'epoch': 0.62} {'loss': 0.5282, 'learning_rate': 1.6227014515591155e-05, 'epoch': 0.62} {'loss': 0.4279, 'learning_rate': 1.6226751623162208e-05, 'epoch': 0.62} {'loss': 0.607, 'learning_rate': 1.6226488723704444e-05, 'epoch': 0.62} {'loss': 0.5601, 'learning_rate': 1.6226225817218156e-05, 'epoch': 0.62} {'loss': 0.6302, 'learning_rate': 1.6225962903703645e-05, 'epoch': 0.62} {'loss': 0.5272, 'learning_rate': 1.6225699983161205e-05, 'epoch': 0.62} {'loss': 0.3379, 'learning_rate': 1.622543705559113e-05, 'epoch': 0.62} {'loss': 0.4593, 'learning_rate': 1.6225174120993724e-05, 'epoch': 0.62} {'loss': 0.6818, 'learning_rate': 1.622491117936928e-05, 'epoch': 0.62} {'loss': 0.6203, 'learning_rate': 1.6224648230718095e-05, 'epoch': 0.62} {'loss': 0.5462, 'learning_rate': 1.6224385275040467e-05, 'epoch': 0.62} {'loss': 0.7499, 'learning_rate': 1.622412231233669e-05, 'epoch': 0.62} {'loss': 0.6804, 'learning_rate': 1.6223859342607063e-05, 'epoch': 0.62} {'loss': 0.5843, 'learning_rate': 1.622359636585188e-05, 'epoch': 0.62} {'loss': 0.4558, 'learning_rate': 1.6223333382071444e-05, 'epoch': 0.62} {'loss': 0.6516, 'learning_rate': 1.6223070391266045e-05, 'epoch': 0.62} {'loss': 0.5751, 'learning_rate': 1.6222807393435985e-05, 'epoch': 0.62} {'loss': 0.4953, 'learning_rate': 1.6222544388581558e-05, 'epoch': 0.62} {'loss': 0.7016, 'learning_rate': 1.6222281376703063e-05, 'epoch': 0.62} {'loss': 0.5636, 'learning_rate': 1.6222018357800792e-05, 'epoch': 0.62} {'loss': 0.5593, 'learning_rate': 1.622175533187505e-05, 'epoch': 0.62} {'loss': 0.5579, 'learning_rate': 1.6221492298926125e-05, 'epoch': 0.62} {'loss': 0.5157, 'learning_rate': 1.6221229258954322e-05, 'epoch': 0.62} {'loss': 0.573, 'learning_rate': 1.622096621195993e-05, 'epoch': 0.62} {'loss': 0.6299, 'learning_rate': 1.6220703157943252e-05, 'epoch': 0.62} {'loss': 0.603, 'learning_rate': 1.6220440096904585e-05, 'epoch': 0.62} {'loss': 0.4891, 'learning_rate': 1.622017702884422e-05, 'epoch': 0.62} {'loss': 0.6325, 'learning_rate': 1.6219913953762462e-05, 'epoch': 0.62} {'loss': 0.6239, 'learning_rate': 1.6219650871659603e-05, 'epoch': 0.62} {'loss': 0.4681, 'learning_rate': 1.621938778253594e-05, 'epoch': 0.62} {'loss': 0.6036, 'learning_rate': 1.621912468639177e-05, 'epoch': 0.62} {'loss': 0.5051, 'learning_rate': 1.6218861583227394e-05, 'epoch': 0.62} {'loss': 0.5607, 'learning_rate': 1.6218598473043102e-05, 'epoch': 0.62} {'loss': 0.5358, 'learning_rate': 1.6218335355839198e-05, 'epoch': 0.62} {'loss': 0.5782, 'learning_rate': 1.6218072231615972e-05, 'epoch': 0.62} {'loss': 0.424, 'learning_rate': 1.621780910037373e-05, 'epoch': 0.62} {'loss': 0.6068, 'learning_rate': 1.6217545962112756e-05, 'epoch': 0.62} {'loss': 0.6306, 'learning_rate': 1.6217282816833365e-05, 'epoch': 0.62} {'loss': 0.5854, 'learning_rate': 1.621701966453584e-05, 'epoch': 0.62} {'loss': 0.6036, 'learning_rate': 1.621675650522048e-05, 'epoch': 0.62} {'loss': 0.4877, 'learning_rate': 1.6216493338887583e-05, 'epoch': 0.62} {'loss': 0.485, 'learning_rate': 1.621623016553745e-05, 'epoch': 0.62} {'loss': 0.5448, 'learning_rate': 1.6215966985170376e-05, 'epoch': 0.62} {'loss': 0.583, 'learning_rate': 1.6215703797786654e-05, 'epoch': 0.62} {'loss': 0.5837, 'learning_rate': 1.6215440603386586e-05, 'epoch': 0.62} {'loss': 0.5541, 'learning_rate': 1.621517740197047e-05, 'epoch': 0.62} {'loss': 0.84, 'learning_rate': 1.6214914193538597e-05, 'epoch': 0.62} {'loss': 0.6107, 'learning_rate': 1.6214650978091268e-05, 'epoch': 0.62} {'loss': 0.6798, 'learning_rate': 1.621438775562878e-05, 'epoch': 0.62} {'loss': 0.6199, 'learning_rate': 1.6214124526151432e-05, 'epoch': 0.62} {'loss': 0.5532, 'learning_rate': 1.621386128965952e-05, 'epoch': 0.62} {'loss': 0.6434, 'learning_rate': 1.621359804615334e-05, 'epoch': 0.62} {'loss': 0.6116, 'learning_rate': 1.6213334795633185e-05, 'epoch': 0.62} {'loss': 0.5795, 'learning_rate': 1.621307153809936e-05, 'epoch': 0.62} {'loss': 0.5727, 'learning_rate': 1.6212808273552157e-05, 'epoch': 0.62} {'loss': 0.3826, 'learning_rate': 1.6212545001991877e-05, 'epoch': 0.62} {'loss': 0.5548, 'learning_rate': 1.621228172341881e-05, 'epoch': 0.62} {'loss': 0.6281, 'learning_rate': 1.6212018437833264e-05, 'epoch': 0.62} {'loss': 0.5042, 'learning_rate': 1.6211755145235528e-05, 'epoch': 0.62} {'loss': 0.6646, 'learning_rate': 1.62114918456259e-05, 'epoch': 0.62} {'loss': 0.6714, 'learning_rate': 1.6211228539004684e-05, 'epoch': 0.62} {'loss': 0.4627, 'learning_rate': 1.621096522537217e-05, 'epoch': 0.62} {'loss': 0.5705, 'learning_rate': 1.6210701904728657e-05, 'epoch': 0.62} {'loss': 0.6106, 'learning_rate': 1.621043857707444e-05, 'epoch': 0.62} {'loss': 0.4123, 'learning_rate': 1.621017524240982e-05, 'epoch': 0.62} {'loss': 0.6071, 'learning_rate': 1.6209911900735096e-05, 'epoch': 0.62} {'loss': 0.5906, 'learning_rate': 1.6209648552050558e-05, 'epoch': 0.62} {'loss': 0.668, 'learning_rate': 1.620938519635651e-05, 'epoch': 0.62} {'loss': 0.5073, 'learning_rate': 1.6209121833653246e-05, 'epoch': 0.62} {'loss': 0.5757, 'learning_rate': 1.6208858463941065e-05, 'epoch': 0.62} {'loss': 0.6587, 'learning_rate': 1.6208595087220266e-05, 'epoch': 0.62} {'loss': 0.4644, 'learning_rate': 1.620833170349114e-05, 'epoch': 0.62} {'loss': 0.3966, 'learning_rate': 1.6208068312753987e-05, 'epoch': 0.62} {'loss': 0.591, 'learning_rate': 1.620780491500911e-05, 'epoch': 0.62} {'loss': 0.6423, 'learning_rate': 1.62075415102568e-05, 'epoch': 0.62} {'loss': 0.6522, 'learning_rate': 1.6207278098497355e-05, 'epoch': 0.62} {'loss': 0.5352, 'learning_rate': 1.620701467973107e-05, 'epoch': 0.62} {'loss': 0.5978, 'learning_rate': 1.6206751253958253e-05, 'epoch': 0.62} {'loss': 0.588, 'learning_rate': 1.620648782117919e-05, 'epoch': 0.62} {'loss': 0.543, 'learning_rate': 1.6206224381394182e-05, 'epoch': 0.62} {'loss': 0.6291, 'learning_rate': 1.6205960934603527e-05, 'epoch': 0.62} {'loss': 0.6755, 'learning_rate': 1.6205697480807524e-05, 'epoch': 0.62} {'loss': 0.5921, 'learning_rate': 1.6205434020006466e-05, 'epoch': 0.62} {'loss': 0.6042, 'learning_rate': 1.6205170552200656e-05, 'epoch': 0.62} {'loss': 0.5477, 'learning_rate': 1.6204907077390385e-05, 'epoch': 0.62} {'loss': 0.3319, 'learning_rate': 1.6204643595575955e-05, 'epoch': 0.62} {'loss': 0.6322, 'learning_rate': 1.6204380106757663e-05, 'epoch': 0.62} {'loss': 0.6186, 'learning_rate': 1.6204116610935808e-05, 'epoch': 0.62} {'loss': 0.5195, 'learning_rate': 1.620385310811068e-05, 'epoch': 0.62} {'loss': 0.5283, 'learning_rate': 1.6203589598282588e-05, 'epoch': 0.62} {'loss': 0.6886, 'learning_rate': 1.620332608145182e-05, 'epoch': 0.62} {'loss': 0.5667, 'learning_rate': 1.6203062557618672e-05, 'epoch': 0.62} {'loss': 0.5796, 'learning_rate': 1.620279902678345e-05, 'epoch': 0.62} {'loss': 0.4404, 'learning_rate': 1.620253548894645e-05, 'epoch': 0.62} {'loss': 0.5982, 'learning_rate': 1.6202271944107964e-05, 'epoch': 0.62} {'loss': 0.616, 'learning_rate': 1.620200839226829e-05, 'epoch': 0.62} {'loss': 0.7031, 'learning_rate': 1.6201744833427736e-05, 'epoch': 0.62} {'loss': 0.597, 'learning_rate': 1.6201481267586584e-05, 'epoch': 0.62} {'loss': 0.6099, 'learning_rate': 1.620121769474514e-05, 'epoch': 0.62} {'loss': 0.6147, 'learning_rate': 1.62009541149037e-05, 'epoch': 0.62} {'loss': 0.6003, 'learning_rate': 1.6200690528062564e-05, 'epoch': 0.62} {'loss': 0.4166, 'learning_rate': 1.6200426934222026e-05, 'epoch': 0.62} {'loss': 0.6789, 'learning_rate': 1.6200163333382386e-05, 'epoch': 0.62} {'loss': 0.6146, 'learning_rate': 1.619989972554394e-05, 'epoch': 0.62} {'loss': 0.6454, 'learning_rate': 1.6199636110706988e-05, 'epoch': 0.62} {'loss': 0.6275, 'learning_rate': 1.6199372488871824e-05, 'epoch': 0.62} {'loss': 0.6101, 'learning_rate': 1.619910886003875e-05, 'epoch': 0.62} {'loss': 0.5392, 'learning_rate': 1.6198845224208057e-05, 'epoch': 0.62} {'loss': 0.6619, 'learning_rate': 1.619858158138005e-05, 'epoch': 0.62} {'loss': 0.5832, 'learning_rate': 1.6198317931555018e-05, 'epoch': 0.62} {'loss': 0.6348, 'learning_rate': 1.6198054274733267e-05, 'epoch': 0.62} {'loss': 0.5508, 'learning_rate': 1.6197790610915092e-05, 'epoch': 0.62} {'loss': 0.5656, 'learning_rate': 1.619752694010079e-05, 'epoch': 0.62} {'loss': 0.5513, 'learning_rate': 1.6197263262290658e-05, 'epoch': 0.62} {'loss': 0.6416, 'learning_rate': 1.6196999577484995e-05, 'epoch': 0.62} {'loss': 0.6089, 'learning_rate': 1.6196735885684093e-05, 'epoch': 0.62} {'loss': 0.7778, 'learning_rate': 1.6196472186888262e-05, 'epoch': 0.62} {'loss': 0.5413, 'learning_rate': 1.6196208481097788e-05, 'epoch': 0.62} {'loss': 0.5167, 'learning_rate': 1.6195944768312974e-05, 'epoch': 0.62} {'loss': 0.497, 'learning_rate': 1.6195681048534117e-05, 'epoch': 0.62} {'loss': 0.6415, 'learning_rate': 1.6195417321761512e-05, 'epoch': 0.62} {'loss': 0.568, 'learning_rate': 1.619515358799546e-05, 'epoch': 0.62} {'loss': 0.498, 'learning_rate': 1.619488984723626e-05, 'epoch': 0.62} {'loss': 0.5404, 'learning_rate': 1.6194626099484203e-05, 'epoch': 0.62} {'loss': 0.665, 'learning_rate': 1.6194362344739592e-05, 'epoch': 0.62} {'loss': 0.5457, 'learning_rate': 1.6194098583002728e-05, 'epoch': 0.62} {'loss': 0.6074, 'learning_rate': 1.61938348142739e-05, 'epoch': 0.62} {'loss': 0.6375, 'learning_rate': 1.6193571038553414e-05, 'epoch': 0.62} {'loss': 0.5374, 'learning_rate': 1.619330725584156e-05, 'epoch': 0.62} {'loss': 0.6933, 'learning_rate': 1.6193043466138646e-05, 'epoch': 0.62} {'loss': 0.6624, 'learning_rate': 1.6192779669444956e-05, 'epoch': 0.62} {'loss': 0.5897, 'learning_rate': 1.61925158657608e-05, 'epoch': 0.62} {'loss': 0.6898, 'learning_rate': 1.619225205508647e-05, 'epoch': 0.62} {'loss': 0.6284, 'learning_rate': 1.6191988237422265e-05, 'epoch': 0.62} {'loss': 0.5123, 'learning_rate': 1.6191724412768485e-05, 'epoch': 0.62} {'loss': 0.6597, 'learning_rate': 1.6191460581125422e-05, 'epoch': 0.62} {'loss': 0.6041, 'learning_rate': 1.619119674249338e-05, 'epoch': 0.62} {'loss': 0.5138, 'learning_rate': 1.6190932896872652e-05, 'epoch': 0.62} {'loss': 0.4917, 'learning_rate': 1.619066904426354e-05, 'epoch': 0.62} {'loss': 0.6513, 'learning_rate': 1.619040518466634e-05, 'epoch': 0.62} {'loss': 0.6065, 'learning_rate': 1.6190141318081344e-05, 'epoch': 0.62} {'loss': 0.6844, 'learning_rate': 1.618987744450886e-05, 'epoch': 0.62} {'loss': 0.5603, 'learning_rate': 1.6189613563949184e-05, 'epoch': 0.62} {'loss': 0.5932, 'learning_rate': 1.6189349676402607e-05, 'epoch': 0.62} {'loss': 0.5107, 'learning_rate': 1.6189085781869435e-05, 'epoch': 0.62} {'loss': 0.5465, 'learning_rate': 1.618882188034996e-05, 'epoch': 0.62} {'loss': 0.706, 'learning_rate': 1.618855797184448e-05, 'epoch': 0.62} {'loss': 0.6593, 'learning_rate': 1.6188294056353298e-05, 'epoch': 0.62} {'loss': 0.6828, 'learning_rate': 1.6188030133876705e-05, 'epoch': 0.62} {'loss': 0.4637, 'learning_rate': 1.6187766204415008e-05, 'epoch': 0.62} {'loss': 0.5412, 'learning_rate': 1.6187502267968498e-05, 'epoch': 0.62} {'loss': 0.6891, 'learning_rate': 1.6187238324537472e-05, 'epoch': 0.62} {'loss': 0.6389, 'learning_rate': 1.618697437412223e-05, 'epoch': 0.62} {'loss': 0.6241, 'learning_rate': 1.6186710416723076e-05, 'epoch': 0.62} {'loss': 0.5633, 'learning_rate': 1.6186446452340297e-05, 'epoch': 0.62} {'loss': 0.652, 'learning_rate': 1.6186182480974196e-05, 'epoch': 0.62} {'loss': 0.6407, 'learning_rate': 1.6185918502625075e-05, 'epoch': 0.62} {'loss': 0.7398, 'learning_rate': 1.6185654517293227e-05, 'epoch': 0.62} {'loss': 0.4619, 'learning_rate': 1.618539052497895e-05, 'epoch': 0.62} {'loss': 0.6017, 'learning_rate': 1.6185126525682545e-05, 'epoch': 0.62} {'loss': 0.5833, 'learning_rate': 1.6184862519404307e-05, 'epoch': 0.62} {'loss': 0.5695, 'learning_rate': 1.6184598506144536e-05, 'epoch': 0.62} {'loss': 0.5848, 'learning_rate': 1.618433448590353e-05, 'epoch': 0.62} {'loss': 0.5561, 'learning_rate': 1.6184070458681586e-05, 'epoch': 0.62} {'loss': 0.6177, 'learning_rate': 1.6183806424479003e-05, 'epoch': 0.62} {'loss': 0.6161, 'learning_rate': 1.6183542383296076e-05, 'epoch': 0.62} {'loss': 0.4826, 'learning_rate': 1.6183278335133107e-05, 'epoch': 0.62} {'loss': 0.6669, 'learning_rate': 1.6183014279990396e-05, 'epoch': 0.62} {'loss': 0.4749, 'learning_rate': 1.618275021786823e-05, 'epoch': 0.62} {'loss': 0.6212, 'learning_rate': 1.6182486148766922e-05, 'epoch': 0.62} {'loss': 0.6212, 'learning_rate': 1.618222207268676e-05, 'epoch': 0.62} {'loss': 0.5236, 'learning_rate': 1.6181957989628045e-05, 'epoch': 0.62} {'loss': 0.6264, 'learning_rate': 1.6181693899591073e-05, 'epoch': 0.62} {'loss': 0.67, 'learning_rate': 1.618142980257615e-05, 'epoch': 0.62} {'loss': 0.6182, 'learning_rate': 1.6181165698583563e-05, 'epoch': 0.62} {'loss': 0.6614, 'learning_rate': 1.6180901587613616e-05, 'epoch': 0.62} {'loss': 0.5649, 'learning_rate': 1.6180637469666603e-05, 'epoch': 0.62} {'loss': 0.4664, 'learning_rate': 1.618037334474283e-05, 'epoch': 0.62} {'loss': 0.4524, 'learning_rate': 1.618010921284259e-05, 'epoch': 0.62} {'loss': 0.7279, 'learning_rate': 1.6179845073966183e-05, 'epoch': 0.62} {'loss': 0.6998, 'learning_rate': 1.6179580928113904e-05, 'epoch': 0.62} {'loss': 0.4328, 'learning_rate': 1.6179316775286055e-05, 'epoch': 0.62} {'loss': 0.7587, 'learning_rate': 1.6179052615482933e-05, 'epoch': 0.62} {'loss': 0.4867, 'learning_rate': 1.6178788448704834e-05, 'epoch': 0.62} {'loss': 0.636, 'learning_rate': 1.6178524274952058e-05, 'epoch': 0.62} {'loss': 0.6403, 'learning_rate': 1.6178260094224902e-05, 'epoch': 0.62} {'loss': 0.5, 'learning_rate': 1.6177995906523666e-05, 'epoch': 0.62} {'loss': 0.5675, 'learning_rate': 1.6177731711848648e-05, 'epoch': 0.62} {'loss': 0.5577, 'learning_rate': 1.6177467510200147e-05, 'epoch': 0.62} {'loss': 0.5504, 'learning_rate': 1.617720330157846e-05, 'epoch': 0.62} {'loss': 0.5802, 'learning_rate': 1.617693908598388e-05, 'epoch': 0.62} {'loss': 0.5182, 'learning_rate': 1.6176674863416715e-05, 'epoch': 0.62} {'loss': 0.5777, 'learning_rate': 1.617641063387726e-05, 'epoch': 0.62} {'loss': 0.5154, 'learning_rate': 1.6176146397365807e-05, 'epoch': 0.62} {'loss': 0.5534, 'learning_rate': 1.617588215388266e-05, 'epoch': 0.62} {'loss': 0.6364, 'learning_rate': 1.617561790342812e-05, 'epoch': 0.62} {'loss': 0.5516, 'learning_rate': 1.617535364600248e-05, 'epoch': 0.62} {'loss': 0.5469, 'learning_rate': 1.617508938160604e-05, 'epoch': 0.62} {'loss': 0.6333, 'learning_rate': 1.6174825110239097e-05, 'epoch': 0.62} {'loss': 0.7353, 'learning_rate': 1.617456083190195e-05, 'epoch': 0.62} {'loss': 0.5904, 'learning_rate': 1.6174296546594902e-05, 'epoch': 0.62} {'loss': 0.6778, 'learning_rate': 1.6174032254318243e-05, 'epoch': 0.62} {'loss': 0.6702, 'learning_rate': 1.6173767955072278e-05, 'epoch': 0.62} {'loss': 0.5589, 'learning_rate': 1.6173503648857302e-05, 'epoch': 0.62} {'loss': 0.5547, 'learning_rate': 1.6173239335673617e-05, 'epoch': 0.62} {'loss': 0.4275, 'learning_rate': 1.6172975015521514e-05, 'epoch': 0.62} {'loss': 0.6496, 'learning_rate': 1.6172710688401297e-05, 'epoch': 0.62} {'loss': 0.4034, 'learning_rate': 1.6172446354313266e-05, 'epoch': 0.62} {'loss': 0.6714, 'learning_rate': 1.6172182013257717e-05, 'epoch': 0.62} {'loss': 0.5711, 'learning_rate': 1.6171917665234947e-05, 'epoch': 0.62} {'loss': 0.5955, 'learning_rate': 1.6171653310245256e-05, 'epoch': 0.62} {'loss': 0.737, 'learning_rate': 1.6171388948288942e-05, 'epoch': 0.62} {'loss': 0.4914, 'learning_rate': 1.61711245793663e-05, 'epoch': 0.62} {'loss': 0.7796, 'learning_rate': 1.6170860203477638e-05, 'epoch': 0.62} {'loss': 0.6327, 'learning_rate': 1.6170595820623246e-05, 'epoch': 0.62} {'loss': 0.5831, 'learning_rate': 1.617033143080342e-05, 'epoch': 0.62} {'loss': 0.5812, 'learning_rate': 1.6170067034018472e-05, 'epoch': 0.62} {'loss': 0.5484, 'learning_rate': 1.6169802630268682e-05, 'epoch': 0.62} {'loss': 0.7332, 'learning_rate': 1.6169538219554364e-05, 'epoch': 0.62} {'loss': 0.5415, 'learning_rate': 1.6169273801875812e-05, 'epoch': 0.62} {'loss': 0.5957, 'learning_rate': 1.6169009377233318e-05, 'epoch': 0.62} {'loss': 0.5598, 'learning_rate': 1.616874494562719e-05, 'epoch': 0.62} {'loss': 0.5391, 'learning_rate': 1.616848050705772e-05, 'epoch': 0.62} {'loss': 0.6245, 'learning_rate': 1.6168216061525206e-05, 'epoch': 0.62} {'loss': 0.5645, 'learning_rate': 1.616795160902995e-05, 'epoch': 0.62} {'loss': 0.5253, 'learning_rate': 1.616768714957225e-05, 'epoch': 0.62} {'loss': 0.7158, 'learning_rate': 1.6167422683152408e-05, 'epoch': 0.62} {'loss': 0.7028, 'learning_rate': 1.6167158209770713e-05, 'epoch': 0.62} {'loss': 0.636, 'learning_rate': 1.6166893729427474e-05, 'epoch': 0.62} {'loss': 0.5673, 'learning_rate': 1.616662924212298e-05, 'epoch': 0.62} {'loss': 0.5734, 'learning_rate': 1.6166364747857535e-05, 'epoch': 0.62} {'loss': 0.5317, 'learning_rate': 1.616610024663144e-05, 'epoch': 0.62} {'loss': 0.7203, 'learning_rate': 1.616583573844499e-05, 'epoch': 0.62} {'loss': 0.6267, 'learning_rate': 1.616557122329848e-05, 'epoch': 0.62} {'loss': 0.5714, 'learning_rate': 1.6165306701192216e-05, 'epoch': 0.62} {'loss': 0.5646, 'learning_rate': 1.6165042172126494e-05, 'epoch': 0.62} {'loss': 0.5326, 'learning_rate': 1.6164777636101606e-05, 'epoch': 0.62} {'loss': 0.6755, 'learning_rate': 1.6164513093117862e-05, 'epoch': 0.62} {'loss': 0.4945, 'learning_rate': 1.6164248543175552e-05, 'epoch': 0.62} {'loss': 0.5034, 'learning_rate': 1.616398398627498e-05, 'epoch': 0.62} {'loss': 0.6473, 'learning_rate': 1.6163719422416443e-05, 'epoch': 0.62} {'loss': 0.4754, 'learning_rate': 1.6163454851600236e-05, 'epoch': 0.62} {'loss': 0.5719, 'learning_rate': 1.616319027382666e-05, 'epoch': 0.62} {'loss': 0.6583, 'learning_rate': 1.6162925689096016e-05, 'epoch': 0.62} {'loss': 0.4983, 'learning_rate': 1.61626610974086e-05, 'epoch': 0.62} {'loss': 0.546, 'learning_rate': 1.616239649876471e-05, 'epoch': 0.62} {'loss': 0.6261, 'learning_rate': 1.616213189316465e-05, 'epoch': 0.62} {'loss': 0.4903, 'learning_rate': 1.6161867280608712e-05, 'epoch': 0.62} {'loss': 0.6392, 'learning_rate': 1.61616026610972e-05, 'epoch': 0.62} {'loss': 0.5119, 'learning_rate': 1.6161338034630408e-05, 'epoch': 0.62} {'loss': 0.6262, 'learning_rate': 1.616107340120864e-05, 'epoch': 0.62} {'loss': 0.7106, 'learning_rate': 1.6160808760832188e-05, 'epoch': 0.62} {'loss': 0.6045, 'learning_rate': 1.6160544113501354e-05, 'epoch': 0.62} {'loss': 0.4248, 'learning_rate': 1.616027945921644e-05, 'epoch': 0.62} {'loss': 0.6201, 'learning_rate': 1.616001479797774e-05, 'epoch': 0.62} {'loss': 0.6685, 'learning_rate': 1.615975012978556e-05, 'epoch': 0.62} {'loss': 0.5478, 'learning_rate': 1.6159485454640187e-05, 'epoch': 0.62} {'loss': 0.5088, 'learning_rate': 1.615922077254193e-05, 'epoch': 0.62} {'loss': 0.5515, 'learning_rate': 1.615895608349108e-05, 'epoch': 0.62} {'loss': 0.7392, 'learning_rate': 1.6158691387487945e-05, 'epoch': 0.62} {'loss': 0.6345, 'learning_rate': 1.6158426684532812e-05, 'epoch': 0.62} {'loss': 0.5966, 'learning_rate': 1.615816197462599e-05, 'epoch': 0.62} {'loss': 0.6877, 'learning_rate': 1.6157897257767777e-05, 'epoch': 0.62} {'loss': 0.4309, 'learning_rate': 1.6157632533958464e-05, 'epoch': 0.62} {'loss': 0.5398, 'learning_rate': 1.6157367803198357e-05, 'epoch': 0.62} {'loss': 0.6697, 'learning_rate': 1.6157103065487752e-05, 'epoch': 0.62} {'loss': 0.4814, 'learning_rate': 1.615683832082695e-05, 'epoch': 0.62} {'loss': 0.5655, 'learning_rate': 1.6156573569216247e-05, 'epoch': 0.62} {'loss': 0.6833, 'learning_rate': 1.6156308810655943e-05, 'epoch': 0.62} {'loss': 0.6428, 'learning_rate': 1.6156044045146337e-05, 'epoch': 0.62} {'loss': 0.6867, 'learning_rate': 1.615577927268773e-05, 'epoch': 0.62} {'loss': 0.4999, 'learning_rate': 1.6155514493280414e-05, 'epoch': 0.62} {'loss': 0.6265, 'learning_rate': 1.6155249706924697e-05, 'epoch': 0.62} {'loss': 0.5818, 'learning_rate': 1.6154984913620874e-05, 'epoch': 0.62} {'loss': 0.6421, 'learning_rate': 1.615472011336924e-05, 'epoch': 0.62} {'loss': 0.6939, 'learning_rate': 1.61544553061701e-05, 'epoch': 0.62} {'loss': 0.4521, 'learning_rate': 1.615419049202375e-05, 'epoch': 0.62} {'loss': 0.6544, 'learning_rate': 1.615392567093049e-05, 'epoch': 0.62} {'loss': 0.8791, 'learning_rate': 1.6153660842890615e-05, 'epoch': 0.62} {'loss': 0.5928, 'learning_rate': 1.615339600790443e-05, 'epoch': 0.62} {'loss': 0.5211, 'learning_rate': 1.6153131165972228e-05, 'epoch': 0.62} {'loss': 0.6887, 'learning_rate': 1.6152866317094315e-05, 'epoch': 0.62} {'loss': 0.5808, 'learning_rate': 1.6152601461270983e-05, 'epoch': 0.62} {'loss': 0.6196, 'learning_rate': 1.6152336598502533e-05, 'epoch': 0.62} {'loss': 0.629, 'learning_rate': 1.6152071728789267e-05, 'epoch': 0.62} {'loss': 0.6868, 'learning_rate': 1.6151806852131482e-05, 'epoch': 0.62} {'loss': 0.6325, 'learning_rate': 1.6151541968529478e-05, 'epoch': 0.62} {'loss': 0.415, 'learning_rate': 1.6151277077983548e-05, 'epoch': 0.62} {'loss': 0.5122, 'learning_rate': 1.6151012180494e-05, 'epoch': 0.62} {'loss': 0.7613, 'learning_rate': 1.615074727606113e-05, 'epoch': 0.62} {'loss': 0.4286, 'learning_rate': 1.6150482364685232e-05, 'epoch': 0.62} {'loss': 0.6944, 'learning_rate': 1.6150217446366614e-05, 'epoch': 0.62} {'loss': 0.5919, 'learning_rate': 1.6149952521105564e-05, 'epoch': 0.62} {'loss': 0.7305, 'learning_rate': 1.6149687588902394e-05, 'epoch': 0.62} {'loss': 0.6833, 'learning_rate': 1.614942264975739e-05, 'epoch': 0.62} {'loss': 0.6189, 'learning_rate': 1.6149157703670863e-05, 'epoch': 0.62} {'loss': 0.5022, 'learning_rate': 1.61488927506431e-05, 'epoch': 0.62} {'loss': 0.5429, 'learning_rate': 1.6148627790674408e-05, 'epoch': 0.62} {'loss': 0.6591, 'learning_rate': 1.6148362823765087e-05, 'epoch': 0.62} {'loss': 0.52, 'learning_rate': 1.614809784991543e-05, 'epoch': 0.62} {'loss': 0.5408, 'learning_rate': 1.6147832869125744e-05, 'epoch': 0.62} {'loss': 0.7229, 'learning_rate': 1.6147567881396323e-05, 'epoch': 0.62} {'loss': 0.5246, 'learning_rate': 1.6147302886727465e-05, 'epoch': 0.62} {'loss': 0.6314, 'learning_rate': 1.614703788511947e-05, 'epoch': 0.62} {'loss': 0.5959, 'learning_rate': 1.6146772876572638e-05, 'epoch': 0.62} {'loss': 0.7179, 'learning_rate': 1.614650786108727e-05, 'epoch': 0.62} {'loss': 0.5163, 'learning_rate': 1.6146242838663665e-05, 'epoch': 0.62} {'loss': 0.6973, 'learning_rate': 1.614597780930212e-05, 'epoch': 0.62} {'loss': 0.5197, 'learning_rate': 1.614571277300293e-05, 'epoch': 0.62} {'loss': 0.5474, 'learning_rate': 1.6145447729766404e-05, 'epoch': 0.62} {'loss': 0.539, 'learning_rate': 1.6145182679592836e-05, 'epoch': 0.62} {'loss': 0.5646, 'learning_rate': 1.6144917622482522e-05, 'epoch': 0.62} {'loss': 0.4235, 'learning_rate': 1.6144652558435768e-05, 'epoch': 0.62} {'loss': 0.6314, 'learning_rate': 1.6144387487452867e-05, 'epoch': 0.62} {'loss': 0.6122, 'learning_rate': 1.614412240953412e-05, 'epoch': 0.62} {'loss': 0.5058, 'learning_rate': 1.6143857324679833e-05, 'epoch': 0.62} {'loss': 0.7034, 'learning_rate': 1.6143592232890297e-05, 'epoch': 0.62} {'loss': 0.3986, 'learning_rate': 1.6143327134165813e-05, 'epoch': 0.62} {'loss': 0.5921, 'learning_rate': 1.6143062028506678e-05, 'epoch': 0.62} {'loss': 0.5171, 'learning_rate': 1.6142796915913195e-05, 'epoch': 0.62} {'loss': 0.5685, 'learning_rate': 1.6142531796385664e-05, 'epoch': 0.62} {'loss': 0.6133, 'learning_rate': 1.6142266669924382e-05, 'epoch': 0.62} {'loss': 0.5644, 'learning_rate': 1.614200153652965e-05, 'epoch': 0.62} {'loss': 0.5007, 'learning_rate': 1.6141736396201765e-05, 'epoch': 0.62} {'loss': 0.5033, 'learning_rate': 1.6141471248941027e-05, 'epoch': 0.62} {'loss': 0.4136, 'learning_rate': 1.614120609474774e-05, 'epoch': 0.62} {'loss': 0.484, 'learning_rate': 1.6140940933622194e-05, 'epoch': 0.62} {'loss': 0.6324, 'learning_rate': 1.6140675765564696e-05, 'epoch': 0.62} {'loss': 0.5357, 'learning_rate': 1.6140410590575545e-05, 'epoch': 0.62} {'loss': 0.6921, 'learning_rate': 1.614014540865503e-05, 'epoch': 0.62} {'loss': 0.6259, 'learning_rate': 1.6139880219803464e-05, 'epoch': 0.62} {'loss': 0.7481, 'learning_rate': 1.613961502402114e-05, 'epoch': 0.62} {'loss': 0.4317, 'learning_rate': 1.6139349821308357e-05, 'epoch': 0.62} {'loss': 0.575, 'learning_rate': 1.613908461166542e-05, 'epoch': 0.62} {'loss': 0.7308, 'learning_rate': 1.6138819395092624e-05, 'epoch': 0.62} {'loss': 0.599, 'learning_rate': 1.6138554171590263e-05, 'epoch': 0.62} {'loss': 0.5789, 'learning_rate': 1.6138288941158645e-05, 'epoch': 0.62} {'loss': 0.5366, 'learning_rate': 1.6138023703798063e-05, 'epoch': 0.62} {'loss': 0.5659, 'learning_rate': 1.6137758459508823e-05, 'epoch': 0.62} {'loss': 0.6745, 'learning_rate': 1.613749320829122e-05, 'epoch': 0.62} {'loss': 0.612, 'learning_rate': 1.6137227950145554e-05, 'epoch': 0.62} {'loss': 0.7372, 'learning_rate': 1.613696268507212e-05, 'epoch': 0.62} {'loss': 0.6971, 'learning_rate': 1.613669741307123e-05, 'epoch': 0.62} {'loss': 0.5396, 'learning_rate': 1.6136432134143172e-05, 'epoch': 0.62} {'loss': 0.6441, 'learning_rate': 1.6136166848288247e-05, 'epoch': 0.62} {'loss': 0.5353, 'learning_rate': 1.613590155550676e-05, 'epoch': 0.62} {'loss': 0.4889, 'learning_rate': 1.6135636255799007e-05, 'epoch': 0.62} {'loss': 0.6373, 'learning_rate': 1.6135370949165282e-05, 'epoch': 0.62} {'loss': 0.5932, 'learning_rate': 1.6135105635605895e-05, 'epoch': 0.62} {'loss': 0.8421, 'learning_rate': 1.613484031512114e-05, 'epoch': 0.62} {'loss': 0.698, 'learning_rate': 1.6134574987711315e-05, 'epoch': 0.62} {'loss': 0.4952, 'learning_rate': 1.6134309653376723e-05, 'epoch': 0.62} {'loss': 0.7821, 'learning_rate': 1.613404431211766e-05, 'epoch': 0.62} {'loss': 0.7346, 'learning_rate': 1.613377896393443e-05, 'epoch': 0.62} {'loss': 0.4257, 'learning_rate': 1.6133513608827326e-05, 'epoch': 0.62} {'loss': 0.5572, 'learning_rate': 1.6133248246796657e-05, 'epoch': 0.62} {'loss': 0.4943, 'learning_rate': 1.613298287784271e-05, 'epoch': 0.62} {'loss': 0.7214, 'learning_rate': 1.6132717501965798e-05, 'epoch': 0.62} {'loss': 0.535, 'learning_rate': 1.613245211916621e-05, 'epoch': 0.62} {'loss': 0.5715, 'learning_rate': 1.6132186729444252e-05, 'epoch': 0.62} {'loss': 0.5517, 'learning_rate': 1.613192133280022e-05, 'epoch': 0.62} {'loss': 0.5604, 'learning_rate': 1.6131655929234415e-05, 'epoch': 0.62} {'loss': 0.5205, 'learning_rate': 1.613139051874714e-05, 'epoch': 0.62} {'loss': 0.5829, 'learning_rate': 1.6131125101338687e-05, 'epoch': 0.62} {'loss': 0.4199, 'learning_rate': 1.613085967700936e-05, 'epoch': 0.62} {'loss': 0.5766, 'learning_rate': 1.613059424575946e-05, 'epoch': 0.62} {'loss': 0.5501, 'learning_rate': 1.6130328807589283e-05, 'epoch': 0.62} {'loss': 0.578, 'learning_rate': 1.6130063362499133e-05, 'epoch': 0.62} {'loss': 0.7049, 'learning_rate': 1.6129797910489306e-05, 'epoch': 0.62} {'loss': 0.5535, 'learning_rate': 1.61295324515601e-05, 'epoch': 0.62} {'loss': 0.6314, 'learning_rate': 1.612926698571182e-05, 'epoch': 0.62} {'loss': 0.4326, 'learning_rate': 1.6129001512944766e-05, 'epoch': 0.62} {'loss': 0.4138, 'learning_rate': 1.612873603325923e-05, 'epoch': 0.62} {'loss': 0.5541, 'learning_rate': 1.6128470546655516e-05, 'epoch': 0.62} {'loss': 0.5913, 'learning_rate': 1.6128205053133926e-05, 'epoch': 0.62} {'loss': 0.5404, 'learning_rate': 1.612793955269476e-05, 'epoch': 0.62} {'loss': 0.6064, 'learning_rate': 1.6127674045338313e-05, 'epoch': 0.62} {'loss': 0.8468, 'learning_rate': 1.6127408531064887e-05, 'epoch': 0.62} {'loss': 0.4911, 'learning_rate': 1.6127143009874782e-05, 'epoch': 0.62} {'loss': 0.6097, 'learning_rate': 1.61268774817683e-05, 'epoch': 0.62} {'loss': 0.528, 'learning_rate': 1.6126611946745733e-05, 'epoch': 0.62} {'loss': 0.6419, 'learning_rate': 1.612634640480739e-05, 'epoch': 0.62} {'loss': 0.4422, 'learning_rate': 1.6126080855953566e-05, 'epoch': 0.62} {'loss': 0.6889, 'learning_rate': 1.6125815300184565e-05, 'epoch': 0.62} {'loss': 0.455, 'learning_rate': 1.612554973750068e-05, 'epoch': 0.62} {'loss': 0.4176, 'learning_rate': 1.6125284167902214e-05, 'epoch': 0.62} {'loss': 0.5816, 'learning_rate': 1.612501859138947e-05, 'epoch': 0.62} {'loss': 0.5058, 'learning_rate': 1.612475300796274e-05, 'epoch': 0.62} {'loss': 0.6577, 'learning_rate': 1.6124487417622333e-05, 'epoch': 0.62} {'loss': 0.5528, 'learning_rate': 1.612422182036854e-05, 'epoch': 0.62} {'loss': 0.5569, 'learning_rate': 1.612395621620167e-05, 'epoch': 0.62} {'loss': 0.6495, 'learning_rate': 1.6123690605122017e-05, 'epoch': 0.62} {'loss': 0.465, 'learning_rate': 1.6123424987129877e-05, 'epoch': 0.62} {'loss': 0.6728, 'learning_rate': 1.6123159362225562e-05, 'epoch': 0.62} {'loss': 0.6541, 'learning_rate': 1.612289373040936e-05, 'epoch': 0.62} {'loss': 0.7075, 'learning_rate': 1.6122628091681573e-05, 'epoch': 0.62} {'loss': 0.5629, 'learning_rate': 1.6122362446042508e-05, 'epoch': 0.62} {'loss': 0.6964, 'learning_rate': 1.6122096793492457e-05, 'epoch': 0.62} {'loss': 0.6471, 'learning_rate': 1.6121831134031726e-05, 'epoch': 0.62} {'loss': 0.5071, 'learning_rate': 1.6121565467660608e-05, 'epoch': 0.62} {'loss': 0.6396, 'learning_rate': 1.612129979437941e-05, 'epoch': 0.62} {'loss': 0.6451, 'learning_rate': 1.6121034114188427e-05, 'epoch': 0.62} {'loss': 0.4017, 'learning_rate': 1.612076842708796e-05, 'epoch': 0.62} {'loss': 0.5747, 'learning_rate': 1.6120502733078306e-05, 'epoch': 0.62} {'loss': 0.4686, 'learning_rate': 1.6120237032159774e-05, 'epoch': 0.62} {'loss': 0.6545, 'learning_rate': 1.6119971324332658e-05, 'epoch': 0.62} {'loss': 0.6123, 'learning_rate': 1.6119705609597253e-05, 'epoch': 0.62} {'loss': 0.5291, 'learning_rate': 1.6119439887953868e-05, 'epoch': 0.62} {'loss': 0.632, 'learning_rate': 1.61191741594028e-05, 'epoch': 0.62} {'loss': 0.5752, 'learning_rate': 1.6118908423944345e-05, 'epoch': 0.62} {'loss': 0.6833, 'learning_rate': 1.611864268157881e-05, 'epoch': 0.62} {'loss': 0.4595, 'learning_rate': 1.6118376932306484e-05, 'epoch': 0.62} {'loss': 0.584, 'learning_rate': 1.611811117612768e-05, 'epoch': 0.62} {'loss': 0.6699, 'learning_rate': 1.611784541304269e-05, 'epoch': 0.63} {'loss': 0.6682, 'learning_rate': 1.6117579643051817e-05, 'epoch': 0.63} {'loss': 0.6196, 'learning_rate': 1.611731386615536e-05, 'epoch': 0.63} {'loss': 0.6894, 'learning_rate': 1.6117048082353618e-05, 'epoch': 0.63} {'loss': 0.4634, 'learning_rate': 1.611678229164689e-05, 'epoch': 0.63} {'loss': 0.4898, 'learning_rate': 1.611651649403548e-05, 'epoch': 0.63} {'loss': 0.7196, 'learning_rate': 1.6116250689519686e-05, 'epoch': 0.63} {'loss': 0.4863, 'learning_rate': 1.6115984878099808e-05, 'epoch': 0.63} {'loss': 0.5924, 'learning_rate': 1.6115719059776146e-05, 'epoch': 0.63} {'loss': 0.5835, 'learning_rate': 1.6115453234549e-05, 'epoch': 0.63} {'loss': 0.6351, 'learning_rate': 1.6115187402418667e-05, 'epoch': 0.63} {'loss': 0.6874, 'learning_rate': 1.6114921563385453e-05, 'epoch': 0.63} {'loss': 0.6302, 'learning_rate': 1.611465571744966e-05, 'epoch': 0.63} {'loss': 0.5351, 'learning_rate': 1.611438986461158e-05, 'epoch': 0.63} {'loss': 0.4798, 'learning_rate': 1.611412400487151e-05, 'epoch': 0.63} {'loss': 0.637, 'learning_rate': 1.6113858138229767e-05, 'epoch': 0.63} {'loss': 0.5698, 'learning_rate': 1.611359226468663e-05, 'epoch': 0.63} {'loss': 0.5297, 'learning_rate': 1.611332638424242e-05, 'epoch': 0.63} {'loss': 0.5697, 'learning_rate': 1.6113060496897422e-05, 'epoch': 0.63} {'loss': 0.5807, 'learning_rate': 1.611279460265194e-05, 'epoch': 0.63} {'loss': 0.5, 'learning_rate': 1.6112528701506282e-05, 'epoch': 0.63} {'loss': 0.5781, 'learning_rate': 1.6112262793460733e-05, 'epoch': 0.63} {'loss': 0.6648, 'learning_rate': 1.6111996878515607e-05, 'epoch': 0.63} {'loss': 0.5581, 'learning_rate': 1.61117309566712e-05, 'epoch': 0.63} {'loss': 0.6233, 'learning_rate': 1.6111465027927805e-05, 'epoch': 0.63} {'loss': 0.4949, 'learning_rate': 1.6111199092285734e-05, 'epoch': 0.63} {'loss': 0.5693, 'learning_rate': 1.611093314974528e-05, 'epoch': 0.63} {'loss': 0.5541, 'learning_rate': 1.611066720030674e-05, 'epoch': 0.63} {'loss': 0.5912, 'learning_rate': 1.6110401243970422e-05, 'epoch': 0.63} {'loss': 0.6733, 'learning_rate': 1.6110135280736625e-05, 'epoch': 0.63} {'loss': 0.6511, 'learning_rate': 1.6109869310605645e-05, 'epoch': 0.63} {'loss': 0.6798, 'learning_rate': 1.6109603333577784e-05, 'epoch': 0.63} {'loss': 0.6274, 'learning_rate': 1.6109337349653344e-05, 'epoch': 0.63} {'loss': 0.5665, 'learning_rate': 1.610907135883262e-05, 'epoch': 0.63} {'loss': 0.5871, 'learning_rate': 1.610880536111592e-05, 'epoch': 0.63} {'loss': 0.6119, 'learning_rate': 1.610853935650354e-05, 'epoch': 0.63} {'loss': 0.597, 'learning_rate': 1.610827334499578e-05, 'epoch': 0.63} {'loss': 0.5767, 'learning_rate': 1.610800732659294e-05, 'epoch': 0.63} {'loss': 0.6464, 'learning_rate': 1.6107741301295322e-05, 'epoch': 0.63} {'loss': 0.6124, 'learning_rate': 1.6107475269103224e-05, 'epoch': 0.63} {'loss': 0.7017, 'learning_rate': 1.6107209230016952e-05, 'epoch': 0.63} {'loss': 0.4931, 'learning_rate': 1.61069431840368e-05, 'epoch': 0.63} {'loss': 0.5881, 'learning_rate': 1.6106677131163072e-05, 'epoch': 0.63} {'loss': 0.4611, 'learning_rate': 1.6106411071396064e-05, 'epoch': 0.63} {'loss': 0.6633, 'learning_rate': 1.610614500473608e-05, 'epoch': 0.63} {'loss': 0.6807, 'learning_rate': 1.610587893118342e-05, 'epoch': 0.63} {'loss': 0.5644, 'learning_rate': 1.610561285073838e-05, 'epoch': 0.63} {'loss': 0.5938, 'learning_rate': 1.610534676340127e-05, 'epoch': 0.63} {'loss': 0.6586, 'learning_rate': 1.610508066917238e-05, 'epoch': 0.63} {'loss': 0.6625, 'learning_rate': 1.6104814568052018e-05, 'epoch': 0.63} {'loss': 0.6168, 'learning_rate': 1.610454846004048e-05, 'epoch': 0.63} {'loss': 0.5442, 'learning_rate': 1.610428234513807e-05, 'epoch': 0.63} {'loss': 0.7032, 'learning_rate': 1.610401622334508e-05, 'epoch': 0.63} {'loss': 0.4764, 'learning_rate': 1.610375009466182e-05, 'epoch': 0.63} {'loss': 0.5302, 'learning_rate': 1.610348395908859e-05, 'epoch': 0.63} {'loss': 0.5152, 'learning_rate': 1.6103217816625683e-05, 'epoch': 0.63} {'loss': 0.5295, 'learning_rate': 1.6102951667273404e-05, 'epoch': 0.63} {'loss': 0.5675, 'learning_rate': 1.6102685511032053e-05, 'epoch': 0.63} {'loss': 0.6178, 'learning_rate': 1.6102419347901933e-05, 'epoch': 0.63} {'loss': 0.5842, 'learning_rate': 1.610215317788334e-05, 'epoch': 0.63} {'loss': 0.4516, 'learning_rate': 1.610188700097658e-05, 'epoch': 0.63} {'loss': 0.7772, 'learning_rate': 1.6101620817181944e-05, 'epoch': 0.63} {'loss': 0.6053, 'learning_rate': 1.6101354626499743e-05, 'epoch': 0.63} {'loss': 0.457, 'learning_rate': 1.610108842893027e-05, 'epoch': 0.63} {'loss': 0.5357, 'learning_rate': 1.6100822224473828e-05, 'epoch': 0.63} {'loss': 0.4961, 'learning_rate': 1.6100556013130718e-05, 'epoch': 0.63} {'loss': 0.4445, 'learning_rate': 1.610028979490124e-05, 'epoch': 0.63} {'loss': 0.6513, 'learning_rate': 1.6100023569785695e-05, 'epoch': 0.63} {'loss': 0.4676, 'learning_rate': 1.6099757337784387e-05, 'epoch': 0.63} {'loss': 0.5489, 'learning_rate': 1.6099491098897608e-05, 'epoch': 0.63} {'loss': 0.6201, 'learning_rate': 1.6099224853125668e-05, 'epoch': 0.63} {'loss': 0.5233, 'learning_rate': 1.609895860046886e-05, 'epoch': 0.63} {'loss': 0.5305, 'learning_rate': 1.6098692340927492e-05, 'epoch': 0.63} {'loss': 0.5621, 'learning_rate': 1.6098426074501853e-05, 'epoch': 0.63} {'loss': 0.5855, 'learning_rate': 1.6098159801192255e-05, 'epoch': 0.63} {'loss': 0.6518, 'learning_rate': 1.6097893520998993e-05, 'epoch': 0.63} {'loss': 0.5067, 'learning_rate': 1.609762723392237e-05, 'epoch': 0.63} {'loss': 0.6008, 'learning_rate': 1.6097360939962684e-05, 'epoch': 0.63} {'loss': 0.5505, 'learning_rate': 1.6097094639120236e-05, 'epoch': 0.63} {'loss': 0.8106, 'learning_rate': 1.609682833139533e-05, 'epoch': 0.63} {'loss': 0.6303, 'learning_rate': 1.6096562016788265e-05, 'epoch': 0.63} {'loss': 0.6752, 'learning_rate': 1.6096295695299334e-05, 'epoch': 0.63} {'loss': 0.6666, 'learning_rate': 1.6096029366928854e-05, 'epoch': 0.63} {'loss': 0.5704, 'learning_rate': 1.609576303167711e-05, 'epoch': 0.63} {'loss': 0.4528, 'learning_rate': 1.609549668954441e-05, 'epoch': 0.63} {'loss': 0.5827, 'learning_rate': 1.6095230340531053e-05, 'epoch': 0.63} {'loss': 0.511, 'learning_rate': 1.6094963984637342e-05, 'epoch': 0.63} {'loss': 0.4622, 'learning_rate': 1.6094697621863572e-05, 'epoch': 0.63} {'loss': 0.6427, 'learning_rate': 1.609443125221005e-05, 'epoch': 0.63} {'loss': 0.5862, 'learning_rate': 1.6094164875677075e-05, 'epoch': 0.63} {'loss': 0.4829, 'learning_rate': 1.6093898492264944e-05, 'epoch': 0.63} {'loss': 0.5723, 'learning_rate': 1.6093632101973963e-05, 'epoch': 0.63} {'loss': 0.5657, 'learning_rate': 1.6093365704804428e-05, 'epoch': 0.63} {'loss': 0.6171, 'learning_rate': 1.6093099300756643e-05, 'epoch': 0.63} {'loss': 0.6073, 'learning_rate': 1.6092832889830907e-05, 'epoch': 0.63} {'loss': 0.5676, 'learning_rate': 1.6092566472027524e-05, 'epoch': 0.63} {'loss': 0.563, 'learning_rate': 1.609230004734679e-05, 'epoch': 0.63} {'loss': 0.6375, 'learning_rate': 1.6092033615789003e-05, 'epoch': 0.63} {'loss': 0.6034, 'learning_rate': 1.6091767177354473e-05, 'epoch': 0.63} {'loss': 0.6481, 'learning_rate': 1.6091500732043498e-05, 'epoch': 0.63} {'loss': 0.4439, 'learning_rate': 1.6091234279856375e-05, 'epoch': 0.63} {'loss': 0.4795, 'learning_rate': 1.6090967820793407e-05, 'epoch': 0.63} {'loss': 0.5507, 'learning_rate': 1.6090701354854893e-05, 'epoch': 0.63} {'loss': 0.7426, 'learning_rate': 1.6090434882041135e-05, 'epoch': 0.63} {'loss': 0.5539, 'learning_rate': 1.6090168402352437e-05, 'epoch': 0.63} {'loss': 0.7114, 'learning_rate': 1.6089901915789098e-05, 'epoch': 0.63} {'loss': 0.6677, 'learning_rate': 1.6089635422351415e-05, 'epoch': 0.63} {'loss': 0.6425, 'learning_rate': 1.608936892203969e-05, 'epoch': 0.63} {'loss': 0.631, 'learning_rate': 1.6089102414854227e-05, 'epoch': 0.63} {'loss': 0.5889, 'learning_rate': 1.6088835900795328e-05, 'epoch': 0.63} {'loss': 0.6106, 'learning_rate': 1.6088569379863288e-05, 'epoch': 0.63} {'loss': 0.6126, 'learning_rate': 1.6088302852058413e-05, 'epoch': 0.63} {'loss': 0.3986, 'learning_rate': 1.6088036317381003e-05, 'epoch': 0.63} {'loss': 0.6024, 'learning_rate': 1.608776977583135e-05, 'epoch': 0.63} {'loss': 0.8211, 'learning_rate': 1.608750322740977e-05, 'epoch': 0.63} {'loss': 0.661, 'learning_rate': 1.6087236672116557e-05, 'epoch': 0.63} {'loss': 0.6778, 'learning_rate': 1.6086970109952007e-05, 'epoch': 0.63} {'loss': 0.6611, 'learning_rate': 1.6086703540916427e-05, 'epoch': 0.63} {'loss': 0.6722, 'learning_rate': 1.6086436965010116e-05, 'epoch': 0.63} {'loss': 0.4872, 'learning_rate': 1.6086170382233375e-05, 'epoch': 0.63} {'loss': 0.5974, 'learning_rate': 1.6085903792586502e-05, 'epoch': 0.63} {'loss': 0.6061, 'learning_rate': 1.6085637196069806e-05, 'epoch': 0.63} {'loss': 0.7003, 'learning_rate': 1.6085370592683585e-05, 'epoch': 0.63} {'loss': 0.6003, 'learning_rate': 1.6085103982428133e-05, 'epoch': 0.63} {'loss': 0.5063, 'learning_rate': 1.6084837365303755e-05, 'epoch': 0.63} {'loss': 0.597, 'learning_rate': 1.6084570741310753e-05, 'epoch': 0.63} {'loss': 0.6758, 'learning_rate': 1.608430411044943e-05, 'epoch': 0.63} {'loss': 0.5103, 'learning_rate': 1.6084037472720084e-05, 'epoch': 0.63} {'loss': 0.4902, 'learning_rate': 1.6083770828123016e-05, 'epoch': 0.63} {'loss': 0.5385, 'learning_rate': 1.608350417665853e-05, 'epoch': 0.63} {'loss': 0.8031, 'learning_rate': 1.608323751832692e-05, 'epoch': 0.63} {'loss': 0.776, 'learning_rate': 1.6082970853128494e-05, 'epoch': 0.63} {'loss': 0.6164, 'learning_rate': 1.608270418106355e-05, 'epoch': 0.63} {'loss': 0.6707, 'learning_rate': 1.608243750213239e-05, 'epoch': 0.63} {'loss': 0.7541, 'learning_rate': 1.6082170816335316e-05, 'epoch': 0.63} {'loss': 0.6796, 'learning_rate': 1.6081904123672628e-05, 'epoch': 0.63} {'loss': 0.6237, 'learning_rate': 1.6081637424144626e-05, 'epoch': 0.63} {'loss': 0.5161, 'learning_rate': 1.6081370717751612e-05, 'epoch': 0.63} {'loss': 0.5337, 'learning_rate': 1.6081104004493884e-05, 'epoch': 0.63} {'loss': 0.6384, 'learning_rate': 1.6080837284371747e-05, 'epoch': 0.63} {'loss': 0.5483, 'learning_rate': 1.6080570557385506e-05, 'epoch': 0.63} {'loss': 0.4154, 'learning_rate': 1.608030382353545e-05, 'epoch': 0.63} {'loss': 0.718, 'learning_rate': 1.6080037082821892e-05, 'epoch': 0.63} {'loss': 0.7194, 'learning_rate': 1.6079770335245127e-05, 'epoch': 0.63} {'loss': 0.666, 'learning_rate': 1.6079503580805456e-05, 'epoch': 0.63} {'loss': 0.5922, 'learning_rate': 1.6079236819503186e-05, 'epoch': 0.63} {'loss': 0.5232, 'learning_rate': 1.607897005133861e-05, 'epoch': 0.63} {'loss': 0.4912, 'learning_rate': 1.6078703276312035e-05, 'epoch': 0.63} {'loss': 0.6518, 'learning_rate': 1.6078436494423753e-05, 'epoch': 0.63} {'loss': 0.4448, 'learning_rate': 1.6078169705674082e-05, 'epoch': 0.63} {'loss': 0.5788, 'learning_rate': 1.6077902910063304e-05, 'epoch': 0.63} {'loss': 0.6267, 'learning_rate': 1.6077636107591733e-05, 'epoch': 0.63} {'loss': 0.4212, 'learning_rate': 1.6077369298259672e-05, 'epoch': 0.63} {'loss': 0.4735, 'learning_rate': 1.607710248206741e-05, 'epoch': 0.63} {'loss': 0.5809, 'learning_rate': 1.607683565901526e-05, 'epoch': 0.63} {'loss': 0.5929, 'learning_rate': 1.6076568829103513e-05, 'epoch': 0.63} {'loss': 0.5001, 'learning_rate': 1.6076301992332478e-05, 'epoch': 0.63} {'loss': 0.6035, 'learning_rate': 1.607603514870245e-05, 'epoch': 0.63} {'loss': 0.5411, 'learning_rate': 1.607576829821374e-05, 'epoch': 0.63} {'loss': 0.5663, 'learning_rate': 1.6075501440866637e-05, 'epoch': 0.63} {'loss': 0.6982, 'learning_rate': 1.607523457666145e-05, 'epoch': 0.63} {'loss': 0.6436, 'learning_rate': 1.6074967705598483e-05, 'epoch': 0.63} {'loss': 0.5555, 'learning_rate': 1.6074700827678028e-05, 'epoch': 0.63} {'loss': 0.7969, 'learning_rate': 1.607443394290039e-05, 'epoch': 0.63} {'loss': 0.6626, 'learning_rate': 1.6074167051265872e-05, 'epoch': 0.63} {'loss': 0.6175, 'learning_rate': 1.6073900152774778e-05, 'epoch': 0.63} {'loss': 0.5966, 'learning_rate': 1.6073633247427402e-05, 'epoch': 0.63} {'loss': 0.5155, 'learning_rate': 1.607336633522405e-05, 'epoch': 0.63} {'loss': 0.5575, 'learning_rate': 1.607309941616502e-05, 'epoch': 0.63} {'loss': 0.649, 'learning_rate': 1.607283249025062e-05, 'epoch': 0.63} {'loss': 0.551, 'learning_rate': 1.6072565557481145e-05, 'epoch': 0.63} {'loss': 0.6359, 'learning_rate': 1.6072298617856897e-05, 'epoch': 0.63} {'loss': 0.5234, 'learning_rate': 1.607203167137818e-05, 'epoch': 0.63} {'loss': 0.6436, 'learning_rate': 1.6071764718045295e-05, 'epoch': 0.63} {'loss': 0.6347, 'learning_rate': 1.607149775785854e-05, 'epoch': 0.63} {'loss': 0.5884, 'learning_rate': 1.607123079081822e-05, 'epoch': 0.63} {'loss': 0.5769, 'learning_rate': 1.6070963816924634e-05, 'epoch': 0.63} {'loss': 0.4077, 'learning_rate': 1.6070696836178085e-05, 'epoch': 0.63} {'loss': 0.6003, 'learning_rate': 1.6070429848578874e-05, 'epoch': 0.63} {'loss': 0.6169, 'learning_rate': 1.6070162854127302e-05, 'epoch': 0.63} {'loss': 0.4647, 'learning_rate': 1.606989585282367e-05, 'epoch': 0.63} {'loss': 0.7045, 'learning_rate': 1.6069628844668278e-05, 'epoch': 0.63} {'loss': 0.3922, 'learning_rate': 1.6069361829661435e-05, 'epoch': 0.63} {'loss': 0.5613, 'learning_rate': 1.606909480780343e-05, 'epoch': 0.63} {'loss': 0.5127, 'learning_rate': 1.6068827779094574e-05, 'epoch': 0.63} {'loss': 0.7191, 'learning_rate': 1.6068560743535165e-05, 'epoch': 0.63} {'loss': 0.629, 'learning_rate': 1.6068293701125506e-05, 'epoch': 0.63} {'loss': 0.6637, 'learning_rate': 1.6068026651865894e-05, 'epoch': 0.63} {'loss': 0.4901, 'learning_rate': 1.606775959575664e-05, 'epoch': 0.63} {'loss': 0.7406, 'learning_rate': 1.606749253279803e-05, 'epoch': 0.63} {'loss': 0.5916, 'learning_rate': 1.6067225462990383e-05, 'epoch': 0.63} {'loss': 0.6673, 'learning_rate': 1.606695838633399e-05, 'epoch': 0.63} {'loss': 0.4687, 'learning_rate': 1.6066691302829154e-05, 'epoch': 0.63} {'loss': 0.7038, 'learning_rate': 1.6066424212476177e-05, 'epoch': 0.63} {'loss': 0.6031, 'learning_rate': 1.606615711527536e-05, 'epoch': 0.63} {'loss': 0.7009, 'learning_rate': 1.606589001122701e-05, 'epoch': 0.63} {'loss': 0.5445, 'learning_rate': 1.6065622900331416e-05, 'epoch': 0.63} {'loss': 0.4631, 'learning_rate': 1.6065355782588892e-05, 'epoch': 0.63} {'loss': 0.7241, 'learning_rate': 1.6065088657999734e-05, 'epoch': 0.63} {'loss': 0.5847, 'learning_rate': 1.6064821526564242e-05, 'epoch': 0.63} {'loss': 0.4921, 'learning_rate': 1.606455438828272e-05, 'epoch': 0.63} {'loss': 0.6913, 'learning_rate': 1.6064287243155474e-05, 'epoch': 0.63} {'loss': 0.3505, 'learning_rate': 1.6064020091182797e-05, 'epoch': 0.63} {'loss': 0.581, 'learning_rate': 1.6063752932364997e-05, 'epoch': 0.63} {'loss': 0.6396, 'learning_rate': 1.606348576670237e-05, 'epoch': 0.63} {'loss': 0.5488, 'learning_rate': 1.6063218594195223e-05, 'epoch': 0.63} {'loss': 0.5332, 'learning_rate': 1.6062951414843854e-05, 'epoch': 0.63} {'loss': 0.5933, 'learning_rate': 1.6062684228648562e-05, 'epoch': 0.63} {'loss': 0.5989, 'learning_rate': 1.606241703560966e-05, 'epoch': 0.63} {'loss': 0.7654, 'learning_rate': 1.6062149835727437e-05, 'epoch': 0.63} {'loss': 0.5884, 'learning_rate': 1.6061882629002198e-05, 'epoch': 0.63} {'loss': 0.5145, 'learning_rate': 1.606161541543425e-05, 'epoch': 0.63} {'loss': 0.6511, 'learning_rate': 1.606134819502389e-05, 'epoch': 0.63} {'loss': 0.5344, 'learning_rate': 1.606108096777142e-05, 'epoch': 0.63} {'loss': 0.6702, 'learning_rate': 1.6060813733677143e-05, 'epoch': 0.63} {'loss': 0.52, 'learning_rate': 1.6060546492741358e-05, 'epoch': 0.63} {'loss': 0.513, 'learning_rate': 1.606027924496437e-05, 'epoch': 0.63} {'loss': 0.3882, 'learning_rate': 1.606001199034648e-05, 'epoch': 0.63} {'loss': 0.4496, 'learning_rate': 1.6059744728887987e-05, 'epoch': 0.63} {'loss': 0.6185, 'learning_rate': 1.6059477460589196e-05, 'epoch': 0.63} {'loss': 0.6299, 'learning_rate': 1.6059210185450408e-05, 'epoch': 0.63} {'loss': 0.6109, 'learning_rate': 1.605894290347192e-05, 'epoch': 0.63} {'loss': 0.639, 'learning_rate': 1.605867561465404e-05, 'epoch': 0.63} {'loss': 0.5587, 'learning_rate': 1.6058408318997067e-05, 'epoch': 0.63} {'loss': 0.4989, 'learning_rate': 1.6058141016501303e-05, 'epoch': 0.63} {'loss': 0.7319, 'learning_rate': 1.6057873707167052e-05, 'epoch': 0.63} {'loss': 0.5947, 'learning_rate': 1.605760639099461e-05, 'epoch': 0.63} {'loss': 0.6283, 'learning_rate': 1.6057339067984287e-05, 'epoch': 0.63} {'loss': 0.6619, 'learning_rate': 1.6057071738136375e-05, 'epoch': 0.63} {'loss': 0.6287, 'learning_rate': 1.6056804401451183e-05, 'epoch': 0.63} {'loss': 0.7882, 'learning_rate': 1.605653705792901e-05, 'epoch': 0.63} {'loss': 0.4813, 'learning_rate': 1.6056269707570158e-05, 'epoch': 0.63} {'loss': 0.6501, 'learning_rate': 1.605600235037493e-05, 'epoch': 0.63} {'loss': 0.6215, 'learning_rate': 1.605573498634363e-05, 'epoch': 0.63} {'loss': 0.5873, 'learning_rate': 1.605546761547655e-05, 'epoch': 0.63} {'loss': 0.6535, 'learning_rate': 1.6055200237774005e-05, 'epoch': 0.63} {'loss': 0.5909, 'learning_rate': 1.6054932853236286e-05, 'epoch': 0.63} {'loss': 0.485, 'learning_rate': 1.6054665461863703e-05, 'epoch': 0.63} {'loss': 0.6264, 'learning_rate': 1.605439806365655e-05, 'epoch': 0.63} {'loss': 0.4694, 'learning_rate': 1.605413065861514e-05, 'epoch': 0.63} {'loss': 0.5161, 'learning_rate': 1.6053863246739757e-05, 'epoch': 0.63} {'loss': 0.72, 'learning_rate': 1.605359582803072e-05, 'epoch': 0.63} {'loss': 0.614, 'learning_rate': 1.6053328402488323e-05, 'epoch': 0.63} {'loss': 0.724, 'learning_rate': 1.605306097011287e-05, 'epoch': 0.63} {'loss': 0.6648, 'learning_rate': 1.6052793530904663e-05, 'epoch': 0.63} {'loss': 0.6427, 'learning_rate': 1.6052526084864e-05, 'epoch': 0.63} {'loss': 0.6667, 'learning_rate': 1.6052258631991188e-05, 'epoch': 0.63} {'loss': 0.5264, 'learning_rate': 1.605199117228653e-05, 'epoch': 0.63} {'loss': 0.5928, 'learning_rate': 1.6051723705750322e-05, 'epoch': 0.63} {'loss': 0.471, 'learning_rate': 1.6051456232382866e-05, 'epoch': 0.63} {'loss': 0.6273, 'learning_rate': 1.605118875218447e-05, 'epoch': 0.63} {'loss': 0.3839, 'learning_rate': 1.605092126515543e-05, 'epoch': 0.63} {'loss': 0.5542, 'learning_rate': 1.6050653771296055e-05, 'epoch': 0.63} {'loss': 0.5655, 'learning_rate': 1.605038627060664e-05, 'epoch': 0.63} {'loss': 0.528, 'learning_rate': 1.605011876308749e-05, 'epoch': 0.63} {'loss': 0.6303, 'learning_rate': 1.6049851248738905e-05, 'epoch': 0.63} {'loss': 0.674, 'learning_rate': 1.604958372756119e-05, 'epoch': 0.63} {'loss': 0.5642, 'learning_rate': 1.6049316199554643e-05, 'epoch': 0.63} {'loss': 0.6173, 'learning_rate': 1.6049048664719568e-05, 'epoch': 0.63} {'loss': 0.6515, 'learning_rate': 1.6048781123056268e-05, 'epoch': 0.63} {'loss': 0.4461, 'learning_rate': 1.604851357456505e-05, 'epoch': 0.63} {'loss': 0.6603, 'learning_rate': 1.6048246019246204e-05, 'epoch': 0.63} {'loss': 0.5448, 'learning_rate': 1.604797845710004e-05, 'epoch': 0.63} {'loss': 0.6288, 'learning_rate': 1.604771088812686e-05, 'epoch': 0.63} {'loss': 0.5668, 'learning_rate': 1.6047443312326963e-05, 'epoch': 0.63} {'loss': 0.6894, 'learning_rate': 1.6047175729700652e-05, 'epoch': 0.63} {'loss': 0.6276, 'learning_rate': 1.6046908140248228e-05, 'epoch': 0.63} {'loss': 0.5721, 'learning_rate': 1.6046640543969996e-05, 'epoch': 0.63} {'loss': 0.4098, 'learning_rate': 1.6046372940866257e-05, 'epoch': 0.63} {'loss': 0.4529, 'learning_rate': 1.6046105330937313e-05, 'epoch': 0.63} {'loss': 0.7164, 'learning_rate': 1.6045837714183466e-05, 'epoch': 0.63} {'loss': 0.6209, 'learning_rate': 1.604557009060502e-05, 'epoch': 0.63} {'loss': 0.456, 'learning_rate': 1.604530246020227e-05, 'epoch': 0.63} {'loss': 0.5533, 'learning_rate': 1.6045034822975527e-05, 'epoch': 0.63} {'loss': 0.6144, 'learning_rate': 1.6044767178925087e-05, 'epoch': 0.63} {'loss': 0.689, 'learning_rate': 1.6044499528051255e-05, 'epoch': 0.63} {'loss': 0.5738, 'learning_rate': 1.6044231870354332e-05, 'epoch': 0.63} {'loss': 0.742, 'learning_rate': 1.6043964205834623e-05, 'epoch': 0.63} {'loss': 0.5758, 'learning_rate': 1.6043696534492426e-05, 'epoch': 0.63} {'loss': 0.5351, 'learning_rate': 1.6043428856328046e-05, 'epoch': 0.63} {'loss': 0.51, 'learning_rate': 1.604316117134178e-05, 'epoch': 0.63} {'loss': 0.6352, 'learning_rate': 1.604289347953394e-05, 'epoch': 0.63} {'loss': 0.5041, 'learning_rate': 1.6042625780904817e-05, 'epoch': 0.63} {'loss': 0.5432, 'learning_rate': 1.604235807545472e-05, 'epoch': 0.63} {'loss': 0.5216, 'learning_rate': 1.6042090363183953e-05, 'epoch': 0.63} {'loss': 0.5827, 'learning_rate': 1.6041822644092814e-05, 'epoch': 0.63} {'loss': 0.6177, 'learning_rate': 1.6041554918181604e-05, 'epoch': 0.63} {'loss': 0.5967, 'learning_rate': 1.6041287185450626e-05, 'epoch': 0.63} {'loss': 0.556, 'learning_rate': 1.6041019445900186e-05, 'epoch': 0.63} {'loss': 0.4445, 'learning_rate': 1.6040751699530582e-05, 'epoch': 0.63} {'loss': 0.6358, 'learning_rate': 1.6040483946342123e-05, 'epoch': 0.63} {'loss': 0.6255, 'learning_rate': 1.6040216186335102e-05, 'epoch': 0.63} {'loss': 0.611, 'learning_rate': 1.6039948419509825e-05, 'epoch': 0.63} {'loss': 0.4347, 'learning_rate': 1.6039680645866597e-05, 'epoch': 0.63} {'loss': 0.5198, 'learning_rate': 1.6039412865405716e-05, 'epoch': 0.63} {'loss': 0.5752, 'learning_rate': 1.603914507812749e-05, 'epoch': 0.63} {'loss': 0.4502, 'learning_rate': 1.603887728403221e-05, 'epoch': 0.63} {'loss': 0.5652, 'learning_rate': 1.6038609483120194e-05, 'epoch': 0.63} {'loss': 0.6374, 'learning_rate': 1.6038341675391733e-05, 'epoch': 0.63} {'loss': 0.5278, 'learning_rate': 1.6038073860847134e-05, 'epoch': 0.63} {'loss': 0.5229, 'learning_rate': 1.6037806039486698e-05, 'epoch': 0.63} {'loss': 0.7008, 'learning_rate': 1.6037538211310723e-05, 'epoch': 0.63} {'loss': 0.7275, 'learning_rate': 1.603727037631952e-05, 'epoch': 0.63} {'loss': 0.61, 'learning_rate': 1.6037002534513387e-05, 'epoch': 0.63} {'loss': 0.719, 'learning_rate': 1.603673468589262e-05, 'epoch': 0.63} {'loss': 0.6588, 'learning_rate': 1.6036466830457534e-05, 'epoch': 0.63} {'loss': 0.5597, 'learning_rate': 1.6036198968208422e-05, 'epoch': 0.63} {'loss': 0.4201, 'learning_rate': 1.603593109914559e-05, 'epoch': 0.63} {'loss': 0.5851, 'learning_rate': 1.603566322326934e-05, 'epoch': 0.63} {'loss': 0.6641, 'learning_rate': 1.603539534057997e-05, 'epoch': 0.63} {'loss': 0.5156, 'learning_rate': 1.603512745107779e-05, 'epoch': 0.63} {'loss': 0.4818, 'learning_rate': 1.60348595547631e-05, 'epoch': 0.63} {'loss': 0.586, 'learning_rate': 1.6034591651636198e-05, 'epoch': 0.63} {'loss': 0.5994, 'learning_rate': 1.603432374169739e-05, 'epoch': 0.63} {'loss': 0.6888, 'learning_rate': 1.603405582494698e-05, 'epoch': 0.63} {'loss': 0.6311, 'learning_rate': 1.6033787901385266e-05, 'epoch': 0.63} {'loss': 0.6074, 'learning_rate': 1.6033519971012553e-05, 'epoch': 0.63} {'loss': 0.7029, 'learning_rate': 1.6033252033829144e-05, 'epoch': 0.63} {'loss': 0.5528, 'learning_rate': 1.603298408983534e-05, 'epoch': 0.63} {'loss': 0.6247, 'learning_rate': 1.6032716139031446e-05, 'epoch': 0.63} {'loss': 0.4981, 'learning_rate': 1.6032448181417764e-05, 'epoch': 0.63} {'loss': 0.6652, 'learning_rate': 1.6032180216994592e-05, 'epoch': 0.63} {'loss': 0.5173, 'learning_rate': 1.6031912245762237e-05, 'epoch': 0.63} {'loss': 0.6529, 'learning_rate': 1.6031644267720997e-05, 'epoch': 0.63} {'loss': 0.4821, 'learning_rate': 1.6031376282871184e-05, 'epoch': 0.63} {'loss': 0.7338, 'learning_rate': 1.6031108291213087e-05, 'epoch': 0.63} {'loss': 0.7211, 'learning_rate': 1.603084029274702e-05, 'epoch': 0.63} {'loss': 0.6148, 'learning_rate': 1.603057228747328e-05, 'epoch': 0.63} {'loss': 0.563, 'learning_rate': 1.603030427539217e-05, 'epoch': 0.63} {'loss': 0.4704, 'learning_rate': 1.6030036256503995e-05, 'epoch': 0.63} {'loss': 0.513, 'learning_rate': 1.6029768230809054e-05, 'epoch': 0.63} {'loss': 0.49, 'learning_rate': 1.602950019830765e-05, 'epoch': 0.63} {'loss': 0.6569, 'learning_rate': 1.602923215900009e-05, 'epoch': 0.63} {'loss': 0.4256, 'learning_rate': 1.6028964112886673e-05, 'epoch': 0.63} {'loss': 0.4482, 'learning_rate': 1.6028696059967704e-05, 'epoch': 0.63} {'loss': 0.6866, 'learning_rate': 1.602842800024348e-05, 'epoch': 0.63} {'loss': 0.5072, 'learning_rate': 1.6028159933714306e-05, 'epoch': 0.63} {'loss': 0.5288, 'learning_rate': 1.6027891860380487e-05, 'epoch': 0.63} {'loss': 0.5102, 'learning_rate': 1.6027623780242324e-05, 'epoch': 0.63} {'loss': 0.4854, 'learning_rate': 1.6027355693300122e-05, 'epoch': 0.63} {'loss': 0.5588, 'learning_rate': 1.602708759955418e-05, 'epoch': 0.63} {'loss': 0.4742, 'learning_rate': 1.6026819499004805e-05, 'epoch': 0.63} {'loss': 0.4885, 'learning_rate': 1.6026551391652293e-05, 'epoch': 0.63} {'loss': 0.4544, 'learning_rate': 1.602628327749695e-05, 'epoch': 0.63} {'loss': 0.5567, 'learning_rate': 1.6026015156539085e-05, 'epoch': 0.63} {'loss': 0.5223, 'learning_rate': 1.6025747028778988e-05, 'epoch': 0.63} {'loss': 0.764, 'learning_rate': 1.6025478894216973e-05, 'epoch': 0.63} {'loss': 0.648, 'learning_rate': 1.6025210752853337e-05, 'epoch': 0.63} {'loss': 0.4401, 'learning_rate': 1.6024942604688382e-05, 'epoch': 0.63} {'loss': 0.5355, 'learning_rate': 1.6024674449722414e-05, 'epoch': 0.63} {'loss': 0.5478, 'learning_rate': 1.6024406287955737e-05, 'epoch': 0.63} {'loss': 0.7332, 'learning_rate': 1.6024138119388645e-05, 'epoch': 0.63} {'loss': 0.5665, 'learning_rate': 1.6023869944021448e-05, 'epoch': 0.63} {'loss': 0.6794, 'learning_rate': 1.602360176185445e-05, 'epoch': 0.63} {'loss': 0.5644, 'learning_rate': 1.6023333572887952e-05, 'epoch': 0.63} {'loss': 0.5191, 'learning_rate': 1.6023065377122253e-05, 'epoch': 0.63} {'loss': 0.8187, 'learning_rate': 1.6022797174557658e-05, 'epoch': 0.63} {'loss': 0.444, 'learning_rate': 1.602252896519447e-05, 'epoch': 0.63} {'loss': 0.7136, 'learning_rate': 1.6022260749032995e-05, 'epoch': 0.63} {'loss': 0.6242, 'learning_rate': 1.602199252607353e-05, 'epoch': 0.63} {'loss': 0.674, 'learning_rate': 1.6021724296316382e-05, 'epoch': 0.63} {'loss': 0.6276, 'learning_rate': 1.6021456059761856e-05, 'epoch': 0.63} {'loss': 0.6697, 'learning_rate': 1.6021187816410242e-05, 'epoch': 0.63} {'loss': 0.536, 'learning_rate': 1.602091956626186e-05, 'epoch': 0.63} {'loss': 0.6678, 'learning_rate': 1.6020651309317005e-05, 'epoch': 0.63} {'loss': 0.6276, 'learning_rate': 1.6020383045575973e-05, 'epoch': 0.63} {'loss': 0.5972, 'learning_rate': 1.6020114775039078e-05, 'epoch': 0.63} {'loss': 0.669, 'learning_rate': 1.6019846497706617e-05, 'epoch': 0.63} {'loss': 0.4702, 'learning_rate': 1.6019578213578895e-05, 'epoch': 0.63} {'loss': 0.7366, 'learning_rate': 1.6019309922656214e-05, 'epoch': 0.63} {'loss': 0.6852, 'learning_rate': 1.6019041624938875e-05, 'epoch': 0.63} {'loss': 0.5628, 'learning_rate': 1.6018773320427183e-05, 'epoch': 0.63} {'loss': 0.6933, 'learning_rate': 1.601850500912144e-05, 'epoch': 0.63} {'loss': 0.6455, 'learning_rate': 1.601823669102195e-05, 'epoch': 0.63} {'loss': 0.6102, 'learning_rate': 1.6017968366129016e-05, 'epoch': 0.63} {'loss': 0.7269, 'learning_rate': 1.601770003444294e-05, 'epoch': 0.63} {'loss': 0.5196, 'learning_rate': 1.6017431695964023e-05, 'epoch': 0.63} {'loss': 0.652, 'learning_rate': 1.601716335069257e-05, 'epoch': 0.63} {'loss': 0.6044, 'learning_rate': 1.6016894998628886e-05, 'epoch': 0.63} {'loss': 0.7228, 'learning_rate': 1.601662663977327e-05, 'epoch': 0.63} {'loss': 0.5988, 'learning_rate': 1.6016358274126028e-05, 'epoch': 0.63} {'loss': 0.5374, 'learning_rate': 1.601608990168746e-05, 'epoch': 0.63} {'loss': 0.6375, 'learning_rate': 1.601582152245787e-05, 'epoch': 0.63} {'loss': 0.5032, 'learning_rate': 1.6015553136437568e-05, 'epoch': 0.63} {'loss': 0.5884, 'learning_rate': 1.6015284743626845e-05, 'epoch': 0.63} {'loss': 0.5542, 'learning_rate': 1.6015016344026008e-05, 'epoch': 0.63} {'loss': 0.6866, 'learning_rate': 1.6014747937635365e-05, 'epoch': 0.63} {'loss': 0.6854, 'learning_rate': 1.601447952445521e-05, 'epoch': 0.63} {'loss': 0.567, 'learning_rate': 1.6014211104485858e-05, 'epoch': 0.63} {'loss': 0.4986, 'learning_rate': 1.60139426777276e-05, 'epoch': 0.63} {'loss': 0.7085, 'learning_rate': 1.6013674244180748e-05, 'epoch': 0.63} {'loss': 0.5404, 'learning_rate': 1.6013405803845602e-05, 'epoch': 0.63} {'loss': 0.6891, 'learning_rate': 1.601313735672246e-05, 'epoch': 0.63} {'loss': 0.5192, 'learning_rate': 1.6012868902811632e-05, 'epoch': 0.63} {'loss': 0.6982, 'learning_rate': 1.6012600442113417e-05, 'epoch': 0.63} {'loss': 0.6031, 'learning_rate': 1.601233197462812e-05, 'epoch': 0.63} {'loss': 0.5182, 'learning_rate': 1.6012063500356044e-05, 'epoch': 0.63} {'loss': 0.5537, 'learning_rate': 1.6011795019297492e-05, 'epoch': 0.63} {'loss': 0.6173, 'learning_rate': 1.6011526531452766e-05, 'epoch': 0.63} {'loss': 0.5474, 'learning_rate': 1.601125803682217e-05, 'epoch': 0.63} {'loss': 0.7013, 'learning_rate': 1.6010989535406005e-05, 'epoch': 0.63} {'loss': 0.5872, 'learning_rate': 1.6010721027204577e-05, 'epoch': 0.63} {'loss': 0.5855, 'learning_rate': 1.6010452512218188e-05, 'epoch': 0.63} {'loss': 0.4775, 'learning_rate': 1.601018399044714e-05, 'epoch': 0.63} {'loss': 0.5643, 'learning_rate': 1.600991546189174e-05, 'epoch': 0.63} {'loss': 0.5245, 'learning_rate': 1.6009646926552288e-05, 'epoch': 0.63} {'loss': 0.4778, 'learning_rate': 1.6009378384429087e-05, 'epoch': 0.63} {'loss': 0.5658, 'learning_rate': 1.6009109835522437e-05, 'epoch': 0.63} {'loss': 0.7846, 'learning_rate': 1.600884127983265e-05, 'epoch': 0.63} {'loss': 0.597, 'learning_rate': 1.600857271736002e-05, 'epoch': 0.63} {'loss': 0.6542, 'learning_rate': 1.6008304148104858e-05, 'epoch': 0.63} {'loss': 0.5736, 'learning_rate': 1.6008035572067457e-05, 'epoch': 0.63} {'loss': 0.4741, 'learning_rate': 1.600776698924813e-05, 'epoch': 0.63} {'loss': 0.622, 'learning_rate': 1.6007498399647173e-05, 'epoch': 0.63} {'loss': 0.5756, 'learning_rate': 1.60072298032649e-05, 'epoch': 0.63} {'loss': 0.5536, 'learning_rate': 1.6006961200101604e-05, 'epoch': 0.63} {'loss': 0.529, 'learning_rate': 1.6006692590157587e-05, 'epoch': 0.63} {'loss': 0.7238, 'learning_rate': 1.600642397343316e-05, 'epoch': 0.63} {'loss': 0.4722, 'learning_rate': 1.600615534992862e-05, 'epoch': 0.63} {'loss': 0.7231, 'learning_rate': 1.6005886719644275e-05, 'epoch': 0.63} {'loss': 0.5868, 'learning_rate': 1.6005618082580424e-05, 'epoch': 0.63} {'loss': 0.6402, 'learning_rate': 1.6005349438737376e-05, 'epoch': 0.63} {'loss': 0.6987, 'learning_rate': 1.6005080788115428e-05, 'epoch': 0.63} {'loss': 0.4556, 'learning_rate': 1.6004812130714882e-05, 'epoch': 0.63} {'loss': 0.6337, 'learning_rate': 1.600454346653605e-05, 'epoch': 0.63} {'loss': 0.7128, 'learning_rate': 1.600427479557923e-05, 'epoch': 0.63} {'loss': 0.6106, 'learning_rate': 1.6004006117844727e-05, 'epoch': 0.63} {'loss': 0.5522, 'learning_rate': 1.600373743333284e-05, 'epoch': 0.63} {'loss': 0.4847, 'learning_rate': 1.6003468742043873e-05, 'epoch': 0.63} {'loss': 0.7003, 'learning_rate': 1.6003200043978133e-05, 'epoch': 0.63} {'loss': 0.5615, 'learning_rate': 1.6002931339135923e-05, 'epoch': 0.63} {'loss': 0.6804, 'learning_rate': 1.6002662627517543e-05, 'epoch': 0.63} {'loss': 0.4636, 'learning_rate': 1.60023939091233e-05, 'epoch': 0.63} {'loss': 0.5962, 'learning_rate': 1.6002125183953498e-05, 'epoch': 0.63} {'loss': 0.6662, 'learning_rate': 1.6001856452008436e-05, 'epoch': 0.63} {'loss': 0.5125, 'learning_rate': 1.6001587713288417e-05, 'epoch': 0.63} {'loss': 0.4282, 'learning_rate': 1.600131896779375e-05, 'epoch': 0.63} {'loss': 0.4532, 'learning_rate': 1.6001050215524733e-05, 'epoch': 0.63} {'loss': 0.6157, 'learning_rate': 1.6000781456481674e-05, 'epoch': 0.63} {'loss': 0.5691, 'learning_rate': 1.600051269066487e-05, 'epoch': 0.63} {'loss': 0.6941, 'learning_rate': 1.6000243918074628e-05, 'epoch': 0.63} {'loss': 0.5754, 'learning_rate': 1.5999975138711258e-05, 'epoch': 0.63} {'loss': 0.6041, 'learning_rate': 1.599970635257505e-05, 'epoch': 0.63} {'loss': 0.4996, 'learning_rate': 1.5999437559666316e-05, 'epoch': 0.63} {'loss': 0.6702, 'learning_rate': 1.599916875998536e-05, 'epoch': 0.63} {'loss': 0.4718, 'learning_rate': 1.5998899953532484e-05, 'epoch': 0.63} {'loss': 0.5811, 'learning_rate': 1.599863114030799e-05, 'epoch': 0.63} {'loss': 0.5503, 'learning_rate': 1.5998362320312182e-05, 'epoch': 0.63} {'loss': 0.6813, 'learning_rate': 1.5998093493545362e-05, 'epoch': 0.63} {'loss': 0.628, 'learning_rate': 1.5997824660007836e-05, 'epoch': 0.63} {'loss': 0.5845, 'learning_rate': 1.5997555819699907e-05, 'epoch': 0.63} {'loss': 0.6004, 'learning_rate': 1.5997286972621874e-05, 'epoch': 0.63} {'loss': 0.4566, 'learning_rate': 1.5997018118774052e-05, 'epoch': 0.63} {'loss': 0.5894, 'learning_rate': 1.599674925815673e-05, 'epoch': 0.63} {'loss': 0.5483, 'learning_rate': 1.599648039077022e-05, 'epoch': 0.63} {'loss': 0.5921, 'learning_rate': 1.5996211516614825e-05, 'epoch': 0.63} {'loss': 0.5238, 'learning_rate': 1.599594263569085e-05, 'epoch': 0.63} {'loss': 0.6125, 'learning_rate': 1.5995673747998593e-05, 'epoch': 0.63} {'loss': 0.4855, 'learning_rate': 1.599540485353836e-05, 'epoch': 0.63} {'loss': 0.6275, 'learning_rate': 1.5995135952310457e-05, 'epoch': 0.63} {'loss': 0.6498, 'learning_rate': 1.5994867044315183e-05, 'epoch': 0.63} {'loss': 0.6332, 'learning_rate': 1.5994598129552844e-05, 'epoch': 0.63} {'loss': 0.5456, 'learning_rate': 1.5994329208023746e-05, 'epoch': 0.63} {'loss': 0.5471, 'learning_rate': 1.599406027972819e-05, 'epoch': 0.63} {'loss': 0.5497, 'learning_rate': 1.599379134466648e-05, 'epoch': 0.63} {'loss': 0.6407, 'learning_rate': 1.5993522402838918e-05, 'epoch': 0.63} {'loss': 0.528, 'learning_rate': 1.599325345424581e-05, 'epoch': 0.63} {'loss': 0.6556, 'learning_rate': 1.5992984498887455e-05, 'epoch': 0.63} {'loss': 0.7576, 'learning_rate': 1.5992715536764163e-05, 'epoch': 0.63} {'loss': 0.4481, 'learning_rate': 1.5992446567876237e-05, 'epoch': 0.63} {'loss': 0.6262, 'learning_rate': 1.5992177592223976e-05, 'epoch': 0.63} {'loss': 0.6356, 'learning_rate': 1.5991908609807686e-05, 'epoch': 0.63} {'loss': 0.5704, 'learning_rate': 1.599163962062767e-05, 'epoch': 0.63} {'loss': 0.4916, 'learning_rate': 1.5991370624684232e-05, 'epoch': 0.63} {'loss': 0.6113, 'learning_rate': 1.599110162197768e-05, 'epoch': 0.63} {'loss': 0.5474, 'learning_rate': 1.5990832612508308e-05, 'epoch': 0.63} {'loss': 0.5006, 'learning_rate': 1.5990563596276427e-05, 'epoch': 0.63} {'loss': 0.6482, 'learning_rate': 1.599029457328234e-05, 'epoch': 0.63} {'loss': 0.6628, 'learning_rate': 1.5990025543526347e-05, 'epoch': 0.63} {'loss': 0.6017, 'learning_rate': 1.598975650700876e-05, 'epoch': 0.63} {'loss': 0.6152, 'learning_rate': 1.598948746372987e-05, 'epoch': 0.63} {'loss': 0.4765, 'learning_rate': 1.598921841368999e-05, 'epoch': 0.63} {'loss': 0.6068, 'learning_rate': 1.5988949356889424e-05, 'epoch': 0.64} {'loss': 0.5789, 'learning_rate': 1.598868029332847e-05, 'epoch': 0.64} {'loss': 0.6468, 'learning_rate': 1.5988411223007435e-05, 'epoch': 0.64} {'loss': 0.5369, 'learning_rate': 1.5988142145926625e-05, 'epoch': 0.64} {'loss': 0.7621, 'learning_rate': 1.598787306208634e-05, 'epoch': 0.64} {'loss': 0.5055, 'learning_rate': 1.5987603971486882e-05, 'epoch': 0.64} {'loss': 0.5666, 'learning_rate': 1.598733487412856e-05, 'epoch': 0.64} {'loss': 0.715, 'learning_rate': 1.5987065770011675e-05, 'epoch': 0.64} {'loss': 0.6024, 'learning_rate': 1.5986796659136533e-05, 'epoch': 0.64} {'loss': 0.7756, 'learning_rate': 1.5986527541503434e-05, 'epoch': 0.64} {'loss': 0.5984, 'learning_rate': 1.5986258417112686e-05, 'epoch': 0.64} {'loss': 0.5612, 'learning_rate': 1.5985989285964587e-05, 'epoch': 0.64} {'loss': 0.6443, 'learning_rate': 1.5985720148059448e-05, 'epoch': 0.64} {'loss': 0.6041, 'learning_rate': 1.598545100339757e-05, 'epoch': 0.64} {'loss': 0.5294, 'learning_rate': 1.598518185197925e-05, 'epoch': 0.64} {'loss': 0.5251, 'learning_rate': 1.5984912693804802e-05, 'epoch': 0.64} {'loss': 0.6217, 'learning_rate': 1.5984643528874525e-05, 'epoch': 0.64} {'loss': 0.541, 'learning_rate': 1.5984374357188723e-05, 'epoch': 0.64} {'loss': 0.7846, 'learning_rate': 1.59841051787477e-05, 'epoch': 0.64} {'loss': 0.4937, 'learning_rate': 1.5983835993551765e-05, 'epoch': 0.64} {'loss': 0.6463, 'learning_rate': 1.598356680160121e-05, 'epoch': 0.64} {'loss': 0.6917, 'learning_rate': 1.598329760289635e-05, 'epoch': 0.64} {'loss': 0.6306, 'learning_rate': 1.5983028397437484e-05, 'epoch': 0.64} {'loss': 0.6004, 'learning_rate': 1.5982759185224916e-05, 'epoch': 0.64} {'loss': 0.6262, 'learning_rate': 1.598248996625895e-05, 'epoch': 0.64} {'loss': 0.543, 'learning_rate': 1.5982220740539895e-05, 'epoch': 0.64} {'loss': 0.6758, 'learning_rate': 1.5981951508068044e-05, 'epoch': 0.64} {'loss': 0.4543, 'learning_rate': 1.598168226884371e-05, 'epoch': 0.64} {'loss': 0.5589, 'learning_rate': 1.5981413022867197e-05, 'epoch': 0.64} {'loss': 0.6804, 'learning_rate': 1.59811437701388e-05, 'epoch': 0.64} {'loss': 0.4482, 'learning_rate': 1.5980874510658834e-05, 'epoch': 0.64} {'loss': 0.7505, 'learning_rate': 1.5980605244427597e-05, 'epoch': 0.64} {'loss': 0.5753, 'learning_rate': 1.5980335971445393e-05, 'epoch': 0.64} {'loss': 0.6058, 'learning_rate': 1.5980066691712526e-05, 'epoch': 0.64} {'loss': 0.6481, 'learning_rate': 1.5979797405229304e-05, 'epoch': 0.64} {'loss': 0.5946, 'learning_rate': 1.5979528111996026e-05, 'epoch': 0.64} {'loss': 0.6526, 'learning_rate': 1.5979258812012997e-05, 'epoch': 0.64} {'loss': 0.5309, 'learning_rate': 1.597898950528052e-05, 'epoch': 0.64} {'loss': 0.5691, 'learning_rate': 1.597872019179891e-05, 'epoch': 0.64} {'loss': 0.6484, 'learning_rate': 1.5978450871568455e-05, 'epoch': 0.64} {'loss': 0.5495, 'learning_rate': 1.5978181544589463e-05, 'epoch': 0.64} {'loss': 0.6974, 'learning_rate': 1.5977912210862246e-05, 'epoch': 0.64} {'loss': 0.3592, 'learning_rate': 1.59776428703871e-05, 'epoch': 0.64} {'loss': 0.5277, 'learning_rate': 1.5977373523164333e-05, 'epoch': 0.64} {'loss': 0.5016, 'learning_rate': 1.5977104169194246e-05, 'epoch': 0.64} {'loss': 0.5726, 'learning_rate': 1.5976834808477145e-05, 'epoch': 0.64} {'loss': 0.5391, 'learning_rate': 1.5976565441013338e-05, 'epoch': 0.64} {'loss': 0.575, 'learning_rate': 1.5976296066803124e-05, 'epoch': 0.64} {'loss': 0.5295, 'learning_rate': 1.5976026685846804e-05, 'epoch': 0.64} {'loss': 0.5549, 'learning_rate': 1.597575729814469e-05, 'epoch': 0.64} {'loss': 0.5554, 'learning_rate': 1.597548790369708e-05, 'epoch': 0.64} {'loss': 0.5583, 'learning_rate': 1.5975218502504287e-05, 'epoch': 0.64} {'loss': 0.4992, 'learning_rate': 1.59749490945666e-05, 'epoch': 0.64} {'loss': 0.4922, 'learning_rate': 1.5974679679884338e-05, 'epoch': 0.64} {'loss': 0.5293, 'learning_rate': 1.5974410258457794e-05, 'epoch': 0.64} {'loss': 0.6887, 'learning_rate': 1.597414083028728e-05, 'epoch': 0.64} {'loss': 0.6177, 'learning_rate': 1.5973871395373096e-05, 'epoch': 0.64} {'loss': 0.5341, 'learning_rate': 1.5973601953715546e-05, 'epoch': 0.64} {'loss': 0.7264, 'learning_rate': 1.597333250531494e-05, 'epoch': 0.64} {'loss': 0.5124, 'learning_rate': 1.597306305017157e-05, 'epoch': 0.64} {'loss': 0.5141, 'learning_rate': 1.5972793588285752e-05, 'epoch': 0.64} {'loss': 0.5125, 'learning_rate': 1.5972524119657785e-05, 'epoch': 0.64} {'loss': 0.4914, 'learning_rate': 1.5972254644287978e-05, 'epoch': 0.64} {'loss': 0.5608, 'learning_rate': 1.5971985162176626e-05, 'epoch': 0.64} {'loss': 0.4911, 'learning_rate': 1.5971715673324043e-05, 'epoch': 0.64} {'loss': 0.588, 'learning_rate': 1.5971446177730525e-05, 'epoch': 0.64} {'loss': 0.5722, 'learning_rate': 1.597117667539638e-05, 'epoch': 0.64} {'loss': 0.5926, 'learning_rate': 1.597090716632191e-05, 'epoch': 0.64} {'loss': 0.5304, 'learning_rate': 1.5970637650507426e-05, 'epoch': 0.64} {'loss': 0.3978, 'learning_rate': 1.5970368127953225e-05, 'epoch': 0.64} {'loss': 0.3904, 'learning_rate': 1.5970098598659613e-05, 'epoch': 0.64} {'loss': 0.5206, 'learning_rate': 1.5969829062626896e-05, 'epoch': 0.64} {'loss': 0.4913, 'learning_rate': 1.5969559519855377e-05, 'epoch': 0.64} {'loss': 0.4993, 'learning_rate': 1.5969289970345362e-05, 'epoch': 0.64} {'loss': 0.6963, 'learning_rate': 1.596902041409715e-05, 'epoch': 0.64} {'loss': 0.63, 'learning_rate': 1.5968750851111054e-05, 'epoch': 0.64} {'loss': 0.6213, 'learning_rate': 1.596848128138737e-05, 'epoch': 0.64} {'loss': 0.6001, 'learning_rate': 1.5968211704926403e-05, 'epoch': 0.64} {'loss': 0.6419, 'learning_rate': 1.5967942121728465e-05, 'epoch': 0.64} {'loss': 0.5679, 'learning_rate': 1.596767253179385e-05, 'epoch': 0.64} {'loss': 0.613, 'learning_rate': 1.596740293512287e-05, 'epoch': 0.64} {'loss': 0.6492, 'learning_rate': 1.596713333171583e-05, 'epoch': 0.64} {'loss': 0.5971, 'learning_rate': 1.596686372157303e-05, 'epoch': 0.64} {'loss': 0.5087, 'learning_rate': 1.5966594104694774e-05, 'epoch': 0.64} {'loss': 0.7034, 'learning_rate': 1.5966324481081367e-05, 'epoch': 0.64} {'loss': 0.5685, 'learning_rate': 1.5966054850733116e-05, 'epoch': 0.64} {'loss': 0.6947, 'learning_rate': 1.5965785213650323e-05, 'epoch': 0.64} {'loss': 0.5767, 'learning_rate': 1.5965515569833293e-05, 'epoch': 0.64} {'loss': 0.3744, 'learning_rate': 1.5965245919282327e-05, 'epoch': 0.64} {'loss': 0.7295, 'learning_rate': 1.5964976261997738e-05, 'epoch': 0.64} {'loss': 0.3495, 'learning_rate': 1.5964706597979822e-05, 'epoch': 0.64} {'loss': 0.3659, 'learning_rate': 1.596443692722889e-05, 'epoch': 0.64} {'loss': 0.5524, 'learning_rate': 1.5964167249745237e-05, 'epoch': 0.64} {'loss': 0.7138, 'learning_rate': 1.5963897565529177e-05, 'epoch': 0.64} {'loss': 0.4917, 'learning_rate': 1.596362787458101e-05, 'epoch': 0.64} {'loss': 0.8482, 'learning_rate': 1.5963358176901044e-05, 'epoch': 0.64} {'loss': 0.6208, 'learning_rate': 1.5963088472489578e-05, 'epoch': 0.64} {'loss': 0.517, 'learning_rate': 1.596281876134692e-05, 'epoch': 0.64} {'loss': 0.4964, 'learning_rate': 1.5962549043473372e-05, 'epoch': 0.64} {'loss': 0.6067, 'learning_rate': 1.596227931886924e-05, 'epoch': 0.64} {'loss': 0.5811, 'learning_rate': 1.596200958753483e-05, 'epoch': 0.64} {'loss': 0.5616, 'learning_rate': 1.5961739849470444e-05, 'epoch': 0.64} {'loss': 0.7512, 'learning_rate': 1.5961470104676387e-05, 'epoch': 0.64} {'loss': 0.7334, 'learning_rate': 1.596120035315296e-05, 'epoch': 0.64} {'loss': 0.527, 'learning_rate': 1.596093059490048e-05, 'epoch': 0.64} {'loss': 0.719, 'learning_rate': 1.5960660829919238e-05, 'epoch': 0.64} {'loss': 0.5229, 'learning_rate': 1.5960391058209543e-05, 'epoch': 0.64} {'loss': 0.6052, 'learning_rate': 1.59601212797717e-05, 'epoch': 0.64} {'loss': 0.4426, 'learning_rate': 1.5959851494606016e-05, 'epoch': 0.64} {'loss': 0.5729, 'learning_rate': 1.595958170271279e-05, 'epoch': 0.64} {'loss': 0.7445, 'learning_rate': 1.595931190409233e-05, 'epoch': 0.64} {'loss': 0.5865, 'learning_rate': 1.5959042098744942e-05, 'epoch': 0.64} {'loss': 0.6401, 'learning_rate': 1.5958772286670926e-05, 'epoch': 0.64} {'loss': 0.618, 'learning_rate': 1.5958502467870594e-05, 'epoch': 0.64} {'loss': 0.6368, 'learning_rate': 1.595823264234424e-05, 'epoch': 0.64} {'loss': 0.5772, 'learning_rate': 1.5957962810092178e-05, 'epoch': 0.64} {'loss': 0.5673, 'learning_rate': 1.5957692971114705e-05, 'epoch': 0.64} {'loss': 0.5897, 'learning_rate': 1.5957423125412136e-05, 'epoch': 0.64} {'loss': 0.4569, 'learning_rate': 1.595715327298476e-05, 'epoch': 0.64} {'loss': 0.6904, 'learning_rate': 1.5956883413832898e-05, 'epoch': 0.64} {'loss': 0.5356, 'learning_rate': 1.5956613547956846e-05, 'epoch': 0.64} {'loss': 0.667, 'learning_rate': 1.5956343675356912e-05, 'epoch': 0.64} {'loss': 0.641, 'learning_rate': 1.5956073796033396e-05, 'epoch': 0.64} {'loss': 0.7741, 'learning_rate': 1.5955803909986603e-05, 'epoch': 0.64} {'loss': 0.5023, 'learning_rate': 1.5955534017216842e-05, 'epoch': 0.64} {'loss': 0.5232, 'learning_rate': 1.5955264117724414e-05, 'epoch': 0.64} {'loss': 0.5485, 'learning_rate': 1.5954994211509632e-05, 'epoch': 0.64} {'loss': 0.6027, 'learning_rate': 1.595472429857279e-05, 'epoch': 0.64} {'loss': 0.5815, 'learning_rate': 1.5954454378914194e-05, 'epoch': 0.64} {'loss': 0.4919, 'learning_rate': 1.5954184452534152e-05, 'epoch': 0.64} {'loss': 0.5549, 'learning_rate': 1.5953914519432968e-05, 'epoch': 0.64} {'loss': 0.5674, 'learning_rate': 1.595364457961095e-05, 'epoch': 0.64} {'loss': 0.5645, 'learning_rate': 1.5953374633068394e-05, 'epoch': 0.64} {'loss': 0.5455, 'learning_rate': 1.5953104679805617e-05, 'epoch': 0.64} {'loss': 0.5058, 'learning_rate': 1.595283471982291e-05, 'epoch': 0.64} {'loss': 0.6788, 'learning_rate': 1.5952564753120587e-05, 'epoch': 0.64} {'loss': 0.6169, 'learning_rate': 1.5952294779698954e-05, 'epoch': 0.64} {'loss': 0.6674, 'learning_rate': 1.5952024799558307e-05, 'epoch': 0.64} {'loss': 0.454, 'learning_rate': 1.5951754812698957e-05, 'epoch': 0.64} {'loss': 0.5272, 'learning_rate': 1.595148481912121e-05, 'epoch': 0.64} {'loss': 0.6208, 'learning_rate': 1.595121481882537e-05, 'epoch': 0.64} {'loss': 0.5077, 'learning_rate': 1.5950944811811735e-05, 'epoch': 0.64} {'loss': 0.5298, 'learning_rate': 1.5950674798080618e-05, 'epoch': 0.64} {'loss': 0.555, 'learning_rate': 1.595040477763232e-05, 'epoch': 0.64} {'loss': 0.5968, 'learning_rate': 1.5950134750467147e-05, 'epoch': 0.64} {'loss': 0.7145, 'learning_rate': 1.59498647165854e-05, 'epoch': 0.64} {'loss': 0.649, 'learning_rate': 1.594959467598739e-05, 'epoch': 0.64} {'loss': 0.5589, 'learning_rate': 1.594932462867342e-05, 'epoch': 0.64} {'loss': 0.7343, 'learning_rate': 1.594905457464379e-05, 'epoch': 0.64} {'loss': 0.5381, 'learning_rate': 1.594878451389881e-05, 'epoch': 0.64} {'loss': 0.6942, 'learning_rate': 1.594851444643879e-05, 'epoch': 0.64} {'loss': 0.5078, 'learning_rate': 1.5948244372264022e-05, 'epoch': 0.64} {'loss': 0.6274, 'learning_rate': 1.5947974291374817e-05, 'epoch': 0.64} {'loss': 0.6736, 'learning_rate': 1.5947704203771483e-05, 'epoch': 0.64} {'loss': 0.5859, 'learning_rate': 1.5947434109454318e-05, 'epoch': 0.64} {'loss': 0.629, 'learning_rate': 1.5947164008423634e-05, 'epoch': 0.64} {'loss': 0.3684, 'learning_rate': 1.5946893900679734e-05, 'epoch': 0.64} {'loss': 0.674, 'learning_rate': 1.5946623786222917e-05, 'epoch': 0.64} {'loss': 0.5615, 'learning_rate': 1.5946353665053497e-05, 'epoch': 0.64} {'loss': 0.4531, 'learning_rate': 1.594608353717177e-05, 'epoch': 0.64} {'loss': 0.6431, 'learning_rate': 1.594581340257805e-05, 'epoch': 0.64} {'loss': 0.6052, 'learning_rate': 1.5945543261272635e-05, 'epoch': 0.64} {'loss': 0.5753, 'learning_rate': 1.594527311325583e-05, 'epoch': 0.64} {'loss': 0.5923, 'learning_rate': 1.5945002958527948e-05, 'epoch': 0.64} {'loss': 0.5478, 'learning_rate': 1.5944732797089283e-05, 'epoch': 0.64} {'loss': 0.5623, 'learning_rate': 1.5944462628940146e-05, 'epoch': 0.64} {'loss': 0.6784, 'learning_rate': 1.5944192454080845e-05, 'epoch': 0.64} {'loss': 0.5974, 'learning_rate': 1.5943922272511677e-05, 'epoch': 0.64} {'loss': 0.5755, 'learning_rate': 1.594365208423295e-05, 'epoch': 0.64} {'loss': 0.5266, 'learning_rate': 1.5943381889244975e-05, 'epoch': 0.64} {'loss': 0.6905, 'learning_rate': 1.5943111687548048e-05, 'epoch': 0.64} {'loss': 0.4906, 'learning_rate': 1.594284147914248e-05, 'epoch': 0.64} {'loss': 0.5105, 'learning_rate': 1.5942571264028575e-05, 'epoch': 0.64} {'loss': 0.6009, 'learning_rate': 1.5942301042206633e-05, 'epoch': 0.64} {'loss': 0.3802, 'learning_rate': 1.5942030813676966e-05, 'epoch': 0.64} {'loss': 0.4941, 'learning_rate': 1.5941760578439875e-05, 'epoch': 0.64} {'loss': 0.6477, 'learning_rate': 1.5941490336495665e-05, 'epoch': 0.64} {'loss': 0.5494, 'learning_rate': 1.5941220087844646e-05, 'epoch': 0.64} {'loss': 0.5667, 'learning_rate': 1.5940949832487117e-05, 'epoch': 0.64} {'loss': 0.5437, 'learning_rate': 1.5940679570423385e-05, 'epoch': 0.64} {'loss': 0.557, 'learning_rate': 1.5940409301653757e-05, 'epoch': 0.64} {'loss': 0.4997, 'learning_rate': 1.5940139026178532e-05, 'epoch': 0.64} {'loss': 0.6092, 'learning_rate': 1.5939868743998025e-05, 'epoch': 0.64} {'loss': 0.6219, 'learning_rate': 1.5939598455112534e-05, 'epoch': 0.64} {'loss': 0.5313, 'learning_rate': 1.5939328159522367e-05, 'epoch': 0.64} {'loss': 0.6461, 'learning_rate': 1.5939057857227826e-05, 'epoch': 0.64} {'loss': 0.6529, 'learning_rate': 1.593878754822922e-05, 'epoch': 0.64} {'loss': 0.4762, 'learning_rate': 1.593851723252685e-05, 'epoch': 0.64} {'loss': 0.6554, 'learning_rate': 1.5938246910121023e-05, 'epoch': 0.64} {'loss': 0.5325, 'learning_rate': 1.593797658101205e-05, 'epoch': 0.64} {'loss': 0.5469, 'learning_rate': 1.5937706245200224e-05, 'epoch': 0.64} {'loss': 0.4654, 'learning_rate': 1.593743590268586e-05, 'epoch': 0.64} {'loss': 0.4581, 'learning_rate': 1.593716555346926e-05, 'epoch': 0.64} {'loss': 0.5032, 'learning_rate': 1.593689519755073e-05, 'epoch': 0.64} {'loss': 0.3981, 'learning_rate': 1.593662483493057e-05, 'epoch': 0.64} {'loss': 0.4853, 'learning_rate': 1.593635446560909e-05, 'epoch': 0.64} {'loss': 0.5211, 'learning_rate': 1.5936084089586597e-05, 'epoch': 0.64} {'loss': 0.5752, 'learning_rate': 1.5935813706863394e-05, 'epoch': 0.64} {'loss': 0.6198, 'learning_rate': 1.5935543317439784e-05, 'epoch': 0.64} {'loss': 0.6297, 'learning_rate': 1.593527292131608e-05, 'epoch': 0.64} {'loss': 0.4951, 'learning_rate': 1.593500251849257e-05, 'epoch': 0.64} {'loss': 0.6421, 'learning_rate': 1.5934732108969582e-05, 'epoch': 0.64} {'loss': 0.6412, 'learning_rate': 1.5934461692747405e-05, 'epoch': 0.64} {'loss': 0.5554, 'learning_rate': 1.5934191269826353e-05, 'epoch': 0.64} {'loss': 0.5951, 'learning_rate': 1.5933920840206724e-05, 'epoch': 0.64} {'loss': 0.4609, 'learning_rate': 1.5933650403888826e-05, 'epoch': 0.64} {'loss': 0.6329, 'learning_rate': 1.5933379960872967e-05, 'epoch': 0.64} {'loss': 0.4823, 'learning_rate': 1.593310951115945e-05, 'epoch': 0.64} {'loss': 0.6278, 'learning_rate': 1.593283905474858e-05, 'epoch': 0.64} {'loss': 0.5873, 'learning_rate': 1.593256859164066e-05, 'epoch': 0.64} {'loss': 0.5773, 'learning_rate': 1.5932298121836004e-05, 'epoch': 0.64} {'loss': 0.6228, 'learning_rate': 1.593202764533491e-05, 'epoch': 0.64} {'loss': 0.573, 'learning_rate': 1.5931757162137686e-05, 'epoch': 0.64} {'loss': 0.6129, 'learning_rate': 1.5931486672244632e-05, 'epoch': 0.64} {'loss': 0.6853, 'learning_rate': 1.5931216175656057e-05, 'epoch': 0.64} {'loss': 0.591, 'learning_rate': 1.593094567237227e-05, 'epoch': 0.64} {'loss': 0.5497, 'learning_rate': 1.593067516239357e-05, 'epoch': 0.64} {'loss': 0.652, 'learning_rate': 1.593040464572027e-05, 'epoch': 0.64} {'loss': 0.6806, 'learning_rate': 1.593013412235267e-05, 'epoch': 0.64} {'loss': 0.5227, 'learning_rate': 1.5929863592291075e-05, 'epoch': 0.64} {'loss': 0.6596, 'learning_rate': 1.592959305553579e-05, 'epoch': 0.64} {'loss': 0.5979, 'learning_rate': 1.5929322512087125e-05, 'epoch': 0.64} {'loss': 0.448, 'learning_rate': 1.592905196194538e-05, 'epoch': 0.64} {'loss': 0.5341, 'learning_rate': 1.592878140511086e-05, 'epoch': 0.64} {'loss': 0.5401, 'learning_rate': 1.592851084158388e-05, 'epoch': 0.64} {'loss': 0.5236, 'learning_rate': 1.5928240271364735e-05, 'epoch': 0.64} {'loss': 0.4633, 'learning_rate': 1.5927969694453737e-05, 'epoch': 0.64} {'loss': 0.651, 'learning_rate': 1.5927699110851185e-05, 'epoch': 0.64} {'loss': 0.6715, 'learning_rate': 1.592742852055739e-05, 'epoch': 0.64} {'loss': 0.6623, 'learning_rate': 1.5927157923572655e-05, 'epoch': 0.64} {'loss': 0.4947, 'learning_rate': 1.5926887319897283e-05, 'epoch': 0.64} {'loss': 0.6423, 'learning_rate': 1.5926616709531583e-05, 'epoch': 0.64} {'loss': 0.5725, 'learning_rate': 1.592634609247586e-05, 'epoch': 0.64} {'loss': 0.6369, 'learning_rate': 1.5926075468730423e-05, 'epoch': 0.64} {'loss': 0.5057, 'learning_rate': 1.5925804838295572e-05, 'epoch': 0.64} {'loss': 0.7161, 'learning_rate': 1.5925534201171614e-05, 'epoch': 0.64} {'loss': 0.6895, 'learning_rate': 1.5925263557358854e-05, 'epoch': 0.64} {'loss': 0.6441, 'learning_rate': 1.5924992906857596e-05, 'epoch': 0.64} {'loss': 0.6222, 'learning_rate': 1.592472224966815e-05, 'epoch': 0.64} {'loss': 0.5891, 'learning_rate': 1.5924451585790818e-05, 'epoch': 0.64} {'loss': 0.3991, 'learning_rate': 1.5924180915225907e-05, 'epoch': 0.64} {'loss': 0.596, 'learning_rate': 1.5923910237973723e-05, 'epoch': 0.64} {'loss': 0.6424, 'learning_rate': 1.5923639554034572e-05, 'epoch': 0.64} {'loss': 0.6238, 'learning_rate': 1.592336886340876e-05, 'epoch': 0.64} {'loss': 0.5481, 'learning_rate': 1.5923098166096586e-05, 'epoch': 0.64} {'loss': 0.645, 'learning_rate': 1.5922827462098364e-05, 'epoch': 0.64} {'loss': 0.4122, 'learning_rate': 1.592255675141439e-05, 'epoch': 0.64} {'loss': 0.5624, 'learning_rate': 1.5922286034044985e-05, 'epoch': 0.64} {'loss': 0.5761, 'learning_rate': 1.592201530999044e-05, 'epoch': 0.64} {'loss': 0.5242, 'learning_rate': 1.5921744579251068e-05, 'epoch': 0.64} {'loss': 0.4924, 'learning_rate': 1.592147384182717e-05, 'epoch': 0.64} {'loss': 0.6063, 'learning_rate': 1.5921203097719055e-05, 'epoch': 0.64} {'loss': 0.5616, 'learning_rate': 1.5920932346927026e-05, 'epoch': 0.64} {'loss': 0.6605, 'learning_rate': 1.5920661589451395e-05, 'epoch': 0.64} {'loss': 0.7141, 'learning_rate': 1.5920390825292458e-05, 'epoch': 0.64} {'loss': 0.4374, 'learning_rate': 1.5920120054450525e-05, 'epoch': 0.64} {'loss': 0.7685, 'learning_rate': 1.5919849276925906e-05, 'epoch': 0.64} {'loss': 0.7091, 'learning_rate': 1.5919578492718902e-05, 'epoch': 0.64} {'loss': 0.2986, 'learning_rate': 1.591930770182982e-05, 'epoch': 0.64} {'loss': 0.6499, 'learning_rate': 1.5919036904258964e-05, 'epoch': 0.64} {'loss': 0.5212, 'learning_rate': 1.591876610000664e-05, 'epoch': 0.64} {'loss': 0.5344, 'learning_rate': 1.5918495289073158e-05, 'epoch': 0.64} {'loss': 0.6283, 'learning_rate': 1.5918224471458818e-05, 'epoch': 0.64} {'loss': 0.5099, 'learning_rate': 1.5917953647163926e-05, 'epoch': 0.64} {'loss': 0.315, 'learning_rate': 1.5917682816188794e-05, 'epoch': 0.64} {'loss': 0.5589, 'learning_rate': 1.591741197853372e-05, 'epoch': 0.64} {'loss': 0.5455, 'learning_rate': 1.5917141134199014e-05, 'epoch': 0.64} {'loss': 0.5741, 'learning_rate': 1.5916870283184983e-05, 'epoch': 0.64} {'loss': 0.4721, 'learning_rate': 1.5916599425491924e-05, 'epoch': 0.64} {'loss': 0.5041, 'learning_rate': 1.591632856112016e-05, 'epoch': 0.64} {'loss': 0.5844, 'learning_rate': 1.5916057690069977e-05, 'epoch': 0.64} {'loss': 0.5545, 'learning_rate': 1.5915786812341692e-05, 'epoch': 0.64} {'loss': 0.5466, 'learning_rate': 1.591551592793561e-05, 'epoch': 0.64} {'loss': 0.5966, 'learning_rate': 1.5915245036852035e-05, 'epoch': 0.64} {'loss': 0.4904, 'learning_rate': 1.5914974139091275e-05, 'epoch': 0.64} {'loss': 0.4765, 'learning_rate': 1.5914703234653632e-05, 'epoch': 0.64} {'loss': 0.4974, 'learning_rate': 1.5914432323539412e-05, 'epoch': 0.64} {'loss': 0.5428, 'learning_rate': 1.5914161405748925e-05, 'epoch': 0.64} {'loss': 0.5347, 'learning_rate': 1.5913890481282474e-05, 'epoch': 0.64} {'loss': 0.6038, 'learning_rate': 1.5913619550140366e-05, 'epoch': 0.64} {'loss': 0.4699, 'learning_rate': 1.5913348612322903e-05, 'epoch': 0.64} {'loss': 0.5543, 'learning_rate': 1.5913077667830397e-05, 'epoch': 0.64} {'loss': 0.5458, 'learning_rate': 1.591280671666315e-05, 'epoch': 0.64} {'loss': 0.4847, 'learning_rate': 1.591253575882147e-05, 'epoch': 0.64} {'loss': 0.6134, 'learning_rate': 1.591226479430566e-05, 'epoch': 0.64} {'loss': 0.632, 'learning_rate': 1.5911993823116027e-05, 'epoch': 0.64} {'loss': 0.3934, 'learning_rate': 1.5911722845252876e-05, 'epoch': 0.64} {'loss': 0.5816, 'learning_rate': 1.5911451860716515e-05, 'epoch': 0.64} {'loss': 0.579, 'learning_rate': 1.591118086950725e-05, 'epoch': 0.64} {'loss': 0.5262, 'learning_rate': 1.5910909871625385e-05, 'epoch': 0.64} {'loss': 0.7704, 'learning_rate': 1.5910638867071226e-05, 'epoch': 0.64} {'loss': 0.4581, 'learning_rate': 1.591036785584508e-05, 'epoch': 0.64} {'loss': 0.4491, 'learning_rate': 1.5910096837947256e-05, 'epoch': 0.64} {'loss': 0.5417, 'learning_rate': 1.590982581337805e-05, 'epoch': 0.64} {'loss': 0.6845, 'learning_rate': 1.590955478213778e-05, 'epoch': 0.64} {'loss': 0.5295, 'learning_rate': 1.5909283744226746e-05, 'epoch': 0.64} {'loss': 0.3855, 'learning_rate': 1.5909012699645253e-05, 'epoch': 0.64} {'loss': 0.529, 'learning_rate': 1.590874164839361e-05, 'epoch': 0.64} {'loss': 0.5398, 'learning_rate': 1.590847059047212e-05, 'epoch': 0.64} {'loss': 0.467, 'learning_rate': 1.5908199525881088e-05, 'epoch': 0.64} {'loss': 0.5938, 'learning_rate': 1.5907928454620825e-05, 'epoch': 0.64} {'loss': 0.7342, 'learning_rate': 1.5907657376691634e-05, 'epoch': 0.64} {'loss': 0.5475, 'learning_rate': 1.590738629209382e-05, 'epoch': 0.64} {'loss': 0.5729, 'learning_rate': 1.590711520082769e-05, 'epoch': 0.64} {'loss': 0.6663, 'learning_rate': 1.590684410289355e-05, 'epoch': 0.64} {'loss': 0.6308, 'learning_rate': 1.5906572998291708e-05, 'epoch': 0.64} {'loss': 0.4447, 'learning_rate': 1.5906301887022467e-05, 'epoch': 0.64} {'loss': 0.4999, 'learning_rate': 1.5906030769086135e-05, 'epoch': 0.64} {'loss': 0.5444, 'learning_rate': 1.5905759644483016e-05, 'epoch': 0.64} {'loss': 0.5792, 'learning_rate': 1.590548851321342e-05, 'epoch': 0.64} {'loss': 0.5065, 'learning_rate': 1.590521737527765e-05, 'epoch': 0.64} {'loss': 0.6848, 'learning_rate': 1.590494623067601e-05, 'epoch': 0.64} {'loss': 0.5028, 'learning_rate': 1.5904675079408812e-05, 'epoch': 0.64} {'loss': 0.5288, 'learning_rate': 1.5904403921476357e-05, 'epoch': 0.64} {'loss': 0.5805, 'learning_rate': 1.590413275687895e-05, 'epoch': 0.64} {'loss': 0.6037, 'learning_rate': 1.5903861585616904e-05, 'epoch': 0.64} {'loss': 0.5597, 'learning_rate': 1.5903590407690517e-05, 'epoch': 0.64} {'loss': 0.6562, 'learning_rate': 1.5903319223100102e-05, 'epoch': 0.64} {'loss': 0.5704, 'learning_rate': 1.5903048031845963e-05, 'epoch': 0.64} {'loss': 0.5892, 'learning_rate': 1.5902776833928406e-05, 'epoch': 0.64} {'loss': 0.4944, 'learning_rate': 1.5902505629347732e-05, 'epoch': 0.64} {'loss': 0.5996, 'learning_rate': 1.5902234418104253e-05, 'epoch': 0.64} {'loss': 0.5782, 'learning_rate': 1.5901963200198277e-05, 'epoch': 0.64} {'loss': 0.5809, 'learning_rate': 1.5901691975630102e-05, 'epoch': 0.64} {'loss': 0.4818, 'learning_rate': 1.5901420744400043e-05, 'epoch': 0.64} {'loss': 0.7557, 'learning_rate': 1.5901149506508403e-05, 'epoch': 0.64} {'loss': 0.59, 'learning_rate': 1.590087826195548e-05, 'epoch': 0.64} {'loss': 0.5484, 'learning_rate': 1.5900607010741595e-05, 'epoch': 0.64} {'loss': 0.7346, 'learning_rate': 1.590033575286704e-05, 'epoch': 0.64} {'loss': 0.5061, 'learning_rate': 1.5900064488332138e-05, 'epoch': 0.64} {'loss': 0.7202, 'learning_rate': 1.5899793217137175e-05, 'epoch': 0.64} {'loss': 0.5774, 'learning_rate': 1.5899521939282472e-05, 'epoch': 0.64} {'loss': 0.6523, 'learning_rate': 1.589925065476833e-05, 'epoch': 0.64} {'loss': 0.4454, 'learning_rate': 1.5898979363595056e-05, 'epoch': 0.64} {'loss': 0.5177, 'learning_rate': 1.5898708065762956e-05, 'epoch': 0.64} {'loss': 0.5059, 'learning_rate': 1.5898436761272337e-05, 'epoch': 0.64} {'loss': 0.5354, 'learning_rate': 1.5898165450123504e-05, 'epoch': 0.64} {'loss': 0.7106, 'learning_rate': 1.5897894132316764e-05, 'epoch': 0.64} {'loss': 0.6175, 'learning_rate': 1.589762280785242e-05, 'epoch': 0.64} {'loss': 0.615, 'learning_rate': 1.5897351476730787e-05, 'epoch': 0.64} {'loss': 0.6782, 'learning_rate': 1.5897080138952163e-05, 'epoch': 0.64} {'loss': 0.7578, 'learning_rate': 1.5896808794516856e-05, 'epoch': 0.64} {'loss': 0.5702, 'learning_rate': 1.5896537443425174e-05, 'epoch': 0.64} {'loss': 0.6839, 'learning_rate': 1.5896266085677423e-05, 'epoch': 0.64} {'loss': 0.5194, 'learning_rate': 1.589599472127391e-05, 'epoch': 0.64} {'loss': 0.5531, 'learning_rate': 1.5895723350214934e-05, 'epoch': 0.64} {'loss': 0.6238, 'learning_rate': 1.5895451972500814e-05, 'epoch': 0.64} {'loss': 0.7243, 'learning_rate': 1.5895180588131847e-05, 'epoch': 0.64} {'loss': 0.4913, 'learning_rate': 1.5894909197108345e-05, 'epoch': 0.64} {'loss': 0.4824, 'learning_rate': 1.5894637799430607e-05, 'epoch': 0.64} {'loss': 0.5392, 'learning_rate': 1.5894366395098947e-05, 'epoch': 0.64} {'loss': 0.4527, 'learning_rate': 1.5894094984113667e-05, 'epoch': 0.64} {'loss': 0.543, 'learning_rate': 1.5893823566475072e-05, 'epoch': 0.64} {'loss': 0.4151, 'learning_rate': 1.5893552142183474e-05, 'epoch': 0.64} {'loss': 0.5662, 'learning_rate': 1.5893280711239177e-05, 'epoch': 0.64} {'loss': 0.6187, 'learning_rate': 1.5893009273642487e-05, 'epoch': 0.64} {'loss': 0.6245, 'learning_rate': 1.589273782939371e-05, 'epoch': 0.64} {'loss': 0.5328, 'learning_rate': 1.589246637849315e-05, 'epoch': 0.64} {'loss': 0.6693, 'learning_rate': 1.589219492094112e-05, 'epoch': 0.64} {'loss': 0.5552, 'learning_rate': 1.5891923456737918e-05, 'epoch': 0.64} {'loss': 0.7107, 'learning_rate': 1.5891651985883855e-05, 'epoch': 0.64} {'loss': 0.5979, 'learning_rate': 1.5891380508379238e-05, 'epoch': 0.64} {'loss': 0.5114, 'learning_rate': 1.5891109024224376e-05, 'epoch': 0.64} {'loss': 0.6779, 'learning_rate': 1.589083753341957e-05, 'epoch': 0.64} {'loss': 0.4093, 'learning_rate': 1.5890566035965128e-05, 'epoch': 0.64} {'loss': 0.6472, 'learning_rate': 1.5890294531861355e-05, 'epoch': 0.64} {'loss': 0.5783, 'learning_rate': 1.5890023021108564e-05, 'epoch': 0.64} {'loss': 0.6287, 'learning_rate': 1.5889751503707052e-05, 'epoch': 0.64} {'loss': 0.6224, 'learning_rate': 1.5889479979657138e-05, 'epoch': 0.64} {'loss': 0.8026, 'learning_rate': 1.5889208448959116e-05, 'epoch': 0.64} {'loss': 0.4768, 'learning_rate': 1.58889369116133e-05, 'epoch': 0.64} {'loss': 0.5947, 'learning_rate': 1.588866536761999e-05, 'epoch': 0.64} {'loss': 0.3978, 'learning_rate': 1.58883938169795e-05, 'epoch': 0.64} {'loss': 0.6806, 'learning_rate': 1.588812225969213e-05, 'epoch': 0.64} {'loss': 0.5779, 'learning_rate': 1.588785069575819e-05, 'epoch': 0.64} {'loss': 0.6684, 'learning_rate': 1.588757912517799e-05, 'epoch': 0.64} {'loss': 0.4896, 'learning_rate': 1.588730754795183e-05, 'epoch': 0.64} {'loss': 0.5186, 'learning_rate': 1.588703596408002e-05, 'epoch': 0.64} {'loss': 0.7415, 'learning_rate': 1.5886764373562865e-05, 'epoch': 0.64} {'loss': 0.5358, 'learning_rate': 1.588649277640067e-05, 'epoch': 0.64} {'loss': 0.6392, 'learning_rate': 1.588622117259375e-05, 'epoch': 0.64} {'loss': 0.6091, 'learning_rate': 1.58859495621424e-05, 'epoch': 0.64} {'loss': 0.3822, 'learning_rate': 1.5885677945046938e-05, 'epoch': 0.64} {'loss': 0.5979, 'learning_rate': 1.5885406321307663e-05, 'epoch': 0.64} {'loss': 0.6037, 'learning_rate': 1.5885134690924878e-05, 'epoch': 0.64} {'loss': 0.5444, 'learning_rate': 1.5884863053898902e-05, 'epoch': 0.64} {'loss': 0.5254, 'learning_rate': 1.5884591410230032e-05, 'epoch': 0.64} {'loss': 0.5116, 'learning_rate': 1.5884319759918575e-05, 'epoch': 0.64} {'loss': 0.4555, 'learning_rate': 1.5884048102964844e-05, 'epoch': 0.64} {'loss': 0.494, 'learning_rate': 1.5883776439369142e-05, 'epoch': 0.64} {'loss': 0.6984, 'learning_rate': 1.5883504769131773e-05, 'epoch': 0.64} {'loss': 0.4423, 'learning_rate': 1.5883233092253043e-05, 'epoch': 0.64} {'loss': 0.6286, 'learning_rate': 1.5882961408733265e-05, 'epoch': 0.64} {'loss': 0.6079, 'learning_rate': 1.588268971857274e-05, 'epoch': 0.64} {'loss': 0.4963, 'learning_rate': 1.588241802177178e-05, 'epoch': 0.64} {'loss': 0.6484, 'learning_rate': 1.588214631833069e-05, 'epoch': 0.64} {'loss': 0.4898, 'learning_rate': 1.588187460824977e-05, 'epoch': 0.64} {'loss': 0.7117, 'learning_rate': 1.5881602891529336e-05, 'epoch': 0.64} {'loss': 0.672, 'learning_rate': 1.5881331168169692e-05, 'epoch': 0.64} {'loss': 0.7315, 'learning_rate': 1.588105943817114e-05, 'epoch': 0.64} {'loss': 0.6572, 'learning_rate': 1.588078770153399e-05, 'epoch': 0.64} {'loss': 0.6217, 'learning_rate': 1.588051595825855e-05, 'epoch': 0.64} {'loss': 0.6333, 'learning_rate': 1.5880244208345126e-05, 'epoch': 0.64} {'loss': 0.6823, 'learning_rate': 1.5879972451794022e-05, 'epoch': 0.64} {'loss': 0.5324, 'learning_rate': 1.587970068860555e-05, 'epoch': 0.64} {'loss': 0.5556, 'learning_rate': 1.5879428918780018e-05, 'epoch': 0.64} {'loss': 0.6061, 'learning_rate': 1.587915714231772e-05, 'epoch': 0.64} {'loss': 0.6246, 'learning_rate': 1.587888535921898e-05, 'epoch': 0.64} {'loss': 0.5326, 'learning_rate': 1.5878613569484092e-05, 'epoch': 0.64} {'loss': 0.6182, 'learning_rate': 1.5878341773113367e-05, 'epoch': 0.64} {'loss': 0.4517, 'learning_rate': 1.587806997010711e-05, 'epoch': 0.64} {'loss': 0.5538, 'learning_rate': 1.5877798160465635e-05, 'epoch': 0.64} {'loss': 0.5929, 'learning_rate': 1.587752634418924e-05, 'epoch': 0.64} {'loss': 0.4566, 'learning_rate': 1.5877254521278237e-05, 'epoch': 0.64} {'loss': 0.5601, 'learning_rate': 1.587698269173293e-05, 'epoch': 0.64} {'loss': 0.4783, 'learning_rate': 1.587671085555363e-05, 'epoch': 0.64} {'loss': 0.4867, 'learning_rate': 1.5876439012740635e-05, 'epoch': 0.64} {'loss': 0.5285, 'learning_rate': 1.5876167163294263e-05, 'epoch': 0.64} {'loss': 0.5134, 'learning_rate': 1.5875895307214816e-05, 'epoch': 0.64} {'loss': 0.7248, 'learning_rate': 1.5875623444502596e-05, 'epoch': 0.64} {'loss': 0.6719, 'learning_rate': 1.587535157515792e-05, 'epoch': 0.64} {'loss': 0.4844, 'learning_rate': 1.5875079699181085e-05, 'epoch': 0.64} {'loss': 0.5536, 'learning_rate': 1.58748078165724e-05, 'epoch': 0.64} {'loss': 0.4457, 'learning_rate': 1.587453592733218e-05, 'epoch': 0.64} {'loss': 0.7088, 'learning_rate': 1.5874264031460724e-05, 'epoch': 0.64} {'loss': 0.5502, 'learning_rate': 1.587399212895834e-05, 'epoch': 0.64} {'loss': 0.5775, 'learning_rate': 1.5873720219825336e-05, 'epoch': 0.64} {'loss': 0.4676, 'learning_rate': 1.587344830406202e-05, 'epoch': 0.64} {'loss': 0.6142, 'learning_rate': 1.58731763816687e-05, 'epoch': 0.64} {'loss': 0.5944, 'learning_rate': 1.5872904452645675e-05, 'epoch': 0.64} {'loss': 0.5548, 'learning_rate': 1.587263251699326e-05, 'epoch': 0.64} {'loss': 0.5949, 'learning_rate': 1.5872360574711758e-05, 'epoch': 0.64} {'loss': 0.6218, 'learning_rate': 1.5872088625801484e-05, 'epoch': 0.64} {'loss': 0.6868, 'learning_rate': 1.587181667026273e-05, 'epoch': 0.64} {'loss': 0.5375, 'learning_rate': 1.5871544708095816e-05, 'epoch': 0.64} {'loss': 0.5413, 'learning_rate': 1.5871272739301048e-05, 'epoch': 0.64} {'loss': 0.5268, 'learning_rate': 1.5871000763878724e-05, 'epoch': 0.64} {'loss': 0.6203, 'learning_rate': 1.5870728781829158e-05, 'epoch': 0.64} {'loss': 0.638, 'learning_rate': 1.587045679315266e-05, 'epoch': 0.64} {'loss': 0.5167, 'learning_rate': 1.5870184797849524e-05, 'epoch': 0.64} {'loss': 0.6711, 'learning_rate': 1.586991279592007e-05, 'epoch': 0.64} {'loss': 0.5256, 'learning_rate': 1.5869640787364603e-05, 'epoch': 0.64} {'loss': 0.6538, 'learning_rate': 1.5869368772183427e-05, 'epoch': 0.64} {'loss': 0.5267, 'learning_rate': 1.5869096750376848e-05, 'epoch': 0.64} {'loss': 0.41, 'learning_rate': 1.5868824721945177e-05, 'epoch': 0.64} {'loss': 0.6357, 'learning_rate': 1.5868552686888715e-05, 'epoch': 0.64} {'loss': 0.4512, 'learning_rate': 1.5868280645207775e-05, 'epoch': 0.64} {'loss': 0.5399, 'learning_rate': 1.586800859690266e-05, 'epoch': 0.64} {'loss': 0.6036, 'learning_rate': 1.5867736541973685e-05, 'epoch': 0.64} {'loss': 0.476, 'learning_rate': 1.5867464480421145e-05, 'epoch': 0.64} {'loss': 0.4227, 'learning_rate': 1.5867192412245356e-05, 'epoch': 0.64} {'loss': 0.4922, 'learning_rate': 1.5866920337446624e-05, 'epoch': 0.64} {'loss': 0.4906, 'learning_rate': 1.586664825602525e-05, 'epoch': 0.64} {'loss': 0.6013, 'learning_rate': 1.586637616798155e-05, 'epoch': 0.64} {'loss': 0.6092, 'learning_rate': 1.5866104073315826e-05, 'epoch': 0.64} {'loss': 0.5802, 'learning_rate': 1.5865831972028388e-05, 'epoch': 0.64} {'loss': 0.5224, 'learning_rate': 1.5865559864119537e-05, 'epoch': 0.64} {'loss': 0.4409, 'learning_rate': 1.5865287749589586e-05, 'epoch': 0.64} {'loss': 0.3279, 'learning_rate': 1.586501562843884e-05, 'epoch': 0.64} {'loss': 0.5425, 'learning_rate': 1.5864743500667604e-05, 'epoch': 0.64} {'loss': 0.6958, 'learning_rate': 1.5864471366276194e-05, 'epoch': 0.64} {'loss': 0.5353, 'learning_rate': 1.5864199225264906e-05, 'epoch': 0.64} {'loss': 0.459, 'learning_rate': 1.5863927077634056e-05, 'epoch': 0.64} {'loss': 0.6217, 'learning_rate': 1.5863654923383944e-05, 'epoch': 0.64} {'loss': 0.5331, 'learning_rate': 1.5863382762514884e-05, 'epoch': 0.64} {'loss': 0.5802, 'learning_rate': 1.586311059502718e-05, 'epoch': 0.64} {'loss': 0.4967, 'learning_rate': 1.5862838420921135e-05, 'epoch': 0.64} {'loss': 0.5136, 'learning_rate': 1.5862566240197063e-05, 'epoch': 0.64} {'loss': 0.6523, 'learning_rate': 1.586229405285527e-05, 'epoch': 0.64} {'loss': 0.551, 'learning_rate': 1.5862021858896056e-05, 'epoch': 0.64} {'loss': 0.6155, 'learning_rate': 1.5861749658319738e-05, 'epoch': 0.64} {'loss': 0.6312, 'learning_rate': 1.5861477451126618e-05, 'epoch': 0.64} {'loss': 0.6288, 'learning_rate': 1.5861205237317006e-05, 'epoch': 0.64} {'loss': 0.4866, 'learning_rate': 1.586093301689121e-05, 'epoch': 0.64} {'loss': 0.6498, 'learning_rate': 1.5860660789849532e-05, 'epoch': 0.64} {'loss': 0.6531, 'learning_rate': 1.586038855619228e-05, 'epoch': 0.64} {'loss': 0.6237, 'learning_rate': 1.5860116315919767e-05, 'epoch': 0.64} {'loss': 0.6287, 'learning_rate': 1.5859844069032298e-05, 'epoch': 0.64} {'loss': 0.5988, 'learning_rate': 1.5859571815530176e-05, 'epoch': 0.64} {'loss': 0.6035, 'learning_rate': 1.5859299555413713e-05, 'epoch': 0.64} {'loss': 0.5931, 'learning_rate': 1.5859027288683217e-05, 'epoch': 0.64} {'loss': 0.5807, 'learning_rate': 1.5858755015338992e-05, 'epoch': 0.64} {'loss': 0.566, 'learning_rate': 1.5858482735381345e-05, 'epoch': 0.64} {'loss': 0.4937, 'learning_rate': 1.5858210448810586e-05, 'epoch': 0.65} {'loss': 0.395, 'learning_rate': 1.5857938155627027e-05, 'epoch': 0.65} {'loss': 0.6359, 'learning_rate': 1.5857665855830963e-05, 'epoch': 0.65} {'loss': 0.6274, 'learning_rate': 1.585739354942271e-05, 'epoch': 0.65} {'loss': 0.5623, 'learning_rate': 1.5857121236402574e-05, 'epoch': 0.65} {'loss': 0.5585, 'learning_rate': 1.5856848916770862e-05, 'epoch': 0.65} {'loss': 0.5802, 'learning_rate': 1.585657659052788e-05, 'epoch': 0.65} {'loss': 0.5933, 'learning_rate': 1.5856304257673935e-05, 'epoch': 0.65} {'loss': 0.4586, 'learning_rate': 1.5856031918209343e-05, 'epoch': 0.65} {'loss': 0.6884, 'learning_rate': 1.5855759572134397e-05, 'epoch': 0.65} {'loss': 0.5057, 'learning_rate': 1.5855487219449413e-05, 'epoch': 0.65} {'loss': 0.4837, 'learning_rate': 1.5855214860154702e-05, 'epoch': 0.65} {'loss': 0.6042, 'learning_rate': 1.5854942494250563e-05, 'epoch': 0.65} {'loss': 0.5862, 'learning_rate': 1.585467012173731e-05, 'epoch': 0.65} {'loss': 0.4006, 'learning_rate': 1.585439774261525e-05, 'epoch': 0.65} {'loss': 0.5749, 'learning_rate': 1.585412535688468e-05, 'epoch': 0.65} {'loss': 0.5389, 'learning_rate': 1.585385296454592e-05, 'epoch': 0.65} {'loss': 0.4784, 'learning_rate': 1.5853580565599276e-05, 'epoch': 0.65} {'loss': 0.5332, 'learning_rate': 1.585330816004505e-05, 'epoch': 0.65} {'loss': 0.6219, 'learning_rate': 1.585303574788355e-05, 'epoch': 0.65} {'loss': 0.4482, 'learning_rate': 1.585276332911509e-05, 'epoch': 0.65} {'loss': 0.5398, 'learning_rate': 1.585249090373997e-05, 'epoch': 0.65} {'loss': 0.6049, 'learning_rate': 1.5852218471758503e-05, 'epoch': 0.65} {'loss': 0.5705, 'learning_rate': 1.585194603317099e-05, 'epoch': 0.65} {'loss': 0.5604, 'learning_rate': 1.5851673587977748e-05, 'epoch': 0.65} {'loss': 0.5837, 'learning_rate': 1.5851401136179077e-05, 'epoch': 0.65} {'loss': 0.7348, 'learning_rate': 1.5851128677775288e-05, 'epoch': 0.65} {'loss': 0.5853, 'learning_rate': 1.5850856212766684e-05, 'epoch': 0.65} {'loss': 0.5925, 'learning_rate': 1.585058374115358e-05, 'epoch': 0.65} {'loss': 0.4844, 'learning_rate': 1.5850311262936276e-05, 'epoch': 0.65} {'loss': 0.5135, 'learning_rate': 1.5850038778115084e-05, 'epoch': 0.65} {'loss': 0.6672, 'learning_rate': 1.5849766286690314e-05, 'epoch': 0.65} {'loss': 0.5764, 'learning_rate': 1.5849493788662266e-05, 'epoch': 0.65} {'loss': 0.6303, 'learning_rate': 1.5849221284031253e-05, 'epoch': 0.65} {'loss': 0.6028, 'learning_rate': 1.5848948772797582e-05, 'epoch': 0.65} {'loss': 0.534, 'learning_rate': 1.584867625496156e-05, 'epoch': 0.65} {'loss': 0.6485, 'learning_rate': 1.5848403730523495e-05, 'epoch': 0.65} {'loss': 0.6094, 'learning_rate': 1.5848131199483692e-05, 'epoch': 0.65} {'loss': 0.4715, 'learning_rate': 1.5847858661842464e-05, 'epoch': 0.65} {'loss': 0.6862, 'learning_rate': 1.5847586117600115e-05, 'epoch': 0.65} {'loss': 0.5955, 'learning_rate': 1.5847313566756954e-05, 'epoch': 0.65} {'loss': 0.6293, 'learning_rate': 1.5847041009313288e-05, 'epoch': 0.65} {'loss': 0.5586, 'learning_rate': 1.584676844526942e-05, 'epoch': 0.65} {'loss': 0.6903, 'learning_rate': 1.5846495874625663e-05, 'epoch': 0.65} {'loss': 0.5996, 'learning_rate': 1.5846223297382328e-05, 'epoch': 0.65} {'loss': 0.5659, 'learning_rate': 1.5845950713539715e-05, 'epoch': 0.65} {'loss': 0.6869, 'learning_rate': 1.584567812309814e-05, 'epoch': 0.65} {'loss': 0.6535, 'learning_rate': 1.5845405526057902e-05, 'epoch': 0.65} {'loss': 0.6044, 'learning_rate': 1.5845132922419313e-05, 'epoch': 0.65} {'loss': 0.5897, 'learning_rate': 1.5844860312182682e-05, 'epoch': 0.65} {'loss': 0.5315, 'learning_rate': 1.584458769534831e-05, 'epoch': 0.65} {'loss': 0.6289, 'learning_rate': 1.5844315071916517e-05, 'epoch': 0.65} {'loss': 0.4434, 'learning_rate': 1.5844042441887603e-05, 'epoch': 0.65} {'loss': 0.6198, 'learning_rate': 1.5843769805261874e-05, 'epoch': 0.65} {'loss': 0.5401, 'learning_rate': 1.584349716203964e-05, 'epoch': 0.65} {'loss': 0.7183, 'learning_rate': 1.584322451222121e-05, 'epoch': 0.65} {'loss': 0.63, 'learning_rate': 1.584295185580689e-05, 'epoch': 0.65} {'loss': 0.5135, 'learning_rate': 1.5842679192796987e-05, 'epoch': 0.65} {'loss': 0.643, 'learning_rate': 1.5842406523191813e-05, 'epoch': 0.65} {'loss': 0.6228, 'learning_rate': 1.5842133846991672e-05, 'epoch': 0.65} {'loss': 0.5556, 'learning_rate': 1.584186116419687e-05, 'epoch': 0.65} {'loss': 0.5395, 'learning_rate': 1.5841588474807722e-05, 'epoch': 0.65} {'loss': 0.7329, 'learning_rate': 1.584131577882453e-05, 'epoch': 0.65} {'loss': 0.6263, 'learning_rate': 1.5841043076247603e-05, 'epoch': 0.65} {'loss': 0.4963, 'learning_rate': 1.5840770367077253e-05, 'epoch': 0.65} {'loss': 0.6089, 'learning_rate': 1.5840497651313778e-05, 'epoch': 0.65} {'loss': 0.6836, 'learning_rate': 1.5840224928957493e-05, 'epoch': 0.65} {'loss': 0.5744, 'learning_rate': 1.5839952200008703e-05, 'epoch': 0.65} {'loss': 0.6055, 'learning_rate': 1.583967946446772e-05, 'epoch': 0.65} {'loss': 0.5348, 'learning_rate': 1.583940672233485e-05, 'epoch': 0.65} {'loss': 0.6991, 'learning_rate': 1.5839133973610402e-05, 'epoch': 0.65} {'loss': 0.6911, 'learning_rate': 1.5838861218294677e-05, 'epoch': 0.65} {'loss': 0.4417, 'learning_rate': 1.583858845638799e-05, 'epoch': 0.65} {'loss': 0.5586, 'learning_rate': 1.5838315687890647e-05, 'epoch': 0.65} {'loss': 0.5984, 'learning_rate': 1.5838042912802956e-05, 'epoch': 0.65} {'loss': 0.6011, 'learning_rate': 1.5837770131125227e-05, 'epoch': 0.65} {'loss': 0.4731, 'learning_rate': 1.5837497342857765e-05, 'epoch': 0.65} {'loss': 0.3857, 'learning_rate': 1.5837224548000874e-05, 'epoch': 0.65} {'loss': 0.4643, 'learning_rate': 1.583695174655487e-05, 'epoch': 0.65} {'loss': 0.5964, 'learning_rate': 1.5836678938520058e-05, 'epoch': 0.65} {'loss': 0.6604, 'learning_rate': 1.5836406123896745e-05, 'epoch': 0.65} {'loss': 0.5665, 'learning_rate': 1.583613330268524e-05, 'epoch': 0.65} {'loss': 0.5665, 'learning_rate': 1.5835860474885846e-05, 'epoch': 0.65} {'loss': 0.5797, 'learning_rate': 1.583558764049888e-05, 'epoch': 0.65} {'loss': 0.7114, 'learning_rate': 1.5835314799524644e-05, 'epoch': 0.65} {'loss': 0.5769, 'learning_rate': 1.5835041951963445e-05, 'epoch': 0.65} {'loss': 0.7031, 'learning_rate': 1.5834769097815597e-05, 'epoch': 0.65} {'loss': 0.5595, 'learning_rate': 1.58344962370814e-05, 'epoch': 0.65} {'loss': 0.4251, 'learning_rate': 1.583422336976117e-05, 'epoch': 0.65} {'loss': 0.3674, 'learning_rate': 1.583395049585521e-05, 'epoch': 0.65} {'loss': 0.4675, 'learning_rate': 1.583367761536383e-05, 'epoch': 0.65} {'loss': 0.559, 'learning_rate': 1.5833404728287335e-05, 'epoch': 0.65} {'loss': 0.5206, 'learning_rate': 1.5833131834626033e-05, 'epoch': 0.65} {'loss': 0.6718, 'learning_rate': 1.583285893438024e-05, 'epoch': 0.65} {'loss': 0.7548, 'learning_rate': 1.5832586027550255e-05, 'epoch': 0.65} {'loss': 0.4706, 'learning_rate': 1.5832313114136392e-05, 'epoch': 0.65} {'loss': 0.5701, 'learning_rate': 1.5832040194138955e-05, 'epoch': 0.65} {'loss': 0.629, 'learning_rate': 1.5831767267558253e-05, 'epoch': 0.65} {'loss': 0.3941, 'learning_rate': 1.5831494334394597e-05, 'epoch': 0.65} {'loss': 0.4804, 'learning_rate': 1.583122139464829e-05, 'epoch': 0.65} {'loss': 0.5448, 'learning_rate': 1.5830948448319644e-05, 'epoch': 0.65} {'loss': 0.6533, 'learning_rate': 1.5830675495408967e-05, 'epoch': 0.65} {'loss': 0.5203, 'learning_rate': 1.5830402535916566e-05, 'epoch': 0.65} {'loss': 0.5358, 'learning_rate': 1.583012956984275e-05, 'epoch': 0.65} {'loss': 0.5369, 'learning_rate': 1.5829856597187825e-05, 'epoch': 0.65} {'loss': 0.5393, 'learning_rate': 1.58295836179521e-05, 'epoch': 0.65} {'loss': 0.7597, 'learning_rate': 1.5829310632135886e-05, 'epoch': 0.65} {'loss': 0.5845, 'learning_rate': 1.5829037639739487e-05, 'epoch': 0.65} {'loss': 0.5915, 'learning_rate': 1.582876464076321e-05, 'epoch': 0.65} {'loss': 0.6725, 'learning_rate': 1.582849163520737e-05, 'epoch': 0.65} {'loss': 0.8135, 'learning_rate': 1.582821862307227e-05, 'epoch': 0.65} {'loss': 0.6462, 'learning_rate': 1.5827945604358222e-05, 'epoch': 0.65} {'loss': 0.4848, 'learning_rate': 1.5827672579065527e-05, 'epoch': 0.65} {'loss': 0.512, 'learning_rate': 1.5827399547194503e-05, 'epoch': 0.65} {'loss': 0.5757, 'learning_rate': 1.5827126508745448e-05, 'epoch': 0.65} {'loss': 0.5298, 'learning_rate': 1.5826853463718677e-05, 'epoch': 0.65} {'loss': 0.4745, 'learning_rate': 1.58265804121145e-05, 'epoch': 0.65} {'loss': 0.6138, 'learning_rate': 1.582630735393322e-05, 'epoch': 0.65} {'loss': 0.6437, 'learning_rate': 1.5826034289175144e-05, 'epoch': 0.65} {'loss': 0.5465, 'learning_rate': 1.5825761217840584e-05, 'epoch': 0.65} {'loss': 0.6342, 'learning_rate': 1.582548813992985e-05, 'epoch': 0.65} {'loss': 0.4574, 'learning_rate': 1.5825215055443246e-05, 'epoch': 0.65} {'loss': 0.4427, 'learning_rate': 1.5824941964381082e-05, 'epoch': 0.65} {'loss': 0.5137, 'learning_rate': 1.5824668866743665e-05, 'epoch': 0.65} {'loss': 0.5642, 'learning_rate': 1.5824395762531307e-05, 'epoch': 0.65} {'loss': 0.4971, 'learning_rate': 1.582412265174431e-05, 'epoch': 0.65} {'loss': 0.5448, 'learning_rate': 1.582384953438299e-05, 'epoch': 0.65} {'loss': 0.603, 'learning_rate': 1.582357641044765e-05, 'epoch': 0.65} {'loss': 0.6118, 'learning_rate': 1.58233032799386e-05, 'epoch': 0.65} {'loss': 0.6299, 'learning_rate': 1.5823030142856145e-05, 'epoch': 0.65} {'loss': 0.5087, 'learning_rate': 1.58227569992006e-05, 'epoch': 0.65} {'loss': 0.5286, 'learning_rate': 1.5822483848972266e-05, 'epoch': 0.65} {'loss': 0.7121, 'learning_rate': 1.582221069217146e-05, 'epoch': 0.65} {'loss': 0.6481, 'learning_rate': 1.582193752879848e-05, 'epoch': 0.65} {'loss': 0.6167, 'learning_rate': 1.5821664358853643e-05, 'epoch': 0.65} {'loss': 0.5687, 'learning_rate': 1.5821391182337255e-05, 'epoch': 0.65} {'loss': 0.5256, 'learning_rate': 1.582111799924962e-05, 'epoch': 0.65} {'loss': 0.587, 'learning_rate': 1.582084480959105e-05, 'epoch': 0.65} {'loss': 0.6394, 'learning_rate': 1.5820571613361856e-05, 'epoch': 0.65} {'loss': 0.6932, 'learning_rate': 1.582029841056234e-05, 'epoch': 0.65} {'loss': 0.649, 'learning_rate': 1.5820025201192818e-05, 'epoch': 0.65} {'loss': 0.7235, 'learning_rate': 1.581975198525359e-05, 'epoch': 0.65} {'loss': 0.584, 'learning_rate': 1.581947876274497e-05, 'epoch': 0.65} {'loss': 0.4593, 'learning_rate': 1.5819205533667263e-05, 'epoch': 0.65} {'loss': 0.6193, 'learning_rate': 1.5818932298020783e-05, 'epoch': 0.65} {'loss': 0.5307, 'learning_rate': 1.5818659055805833e-05, 'epoch': 0.65} {'loss': 0.6495, 'learning_rate': 1.5818385807022726e-05, 'epoch': 0.65} {'loss': 0.6226, 'learning_rate': 1.5818112551671765e-05, 'epoch': 0.65} {'loss': 0.6668, 'learning_rate': 1.5817839289753264e-05, 'epoch': 0.65} {'loss': 0.527, 'learning_rate': 1.5817566021267526e-05, 'epoch': 0.65} {'loss': 0.362, 'learning_rate': 1.5817292746214864e-05, 'epoch': 0.65} {'loss': 0.4917, 'learning_rate': 1.5817019464595586e-05, 'epoch': 0.65} {'loss': 0.6211, 'learning_rate': 1.5816746176409993e-05, 'epoch': 0.65} {'loss': 0.6311, 'learning_rate': 1.5816472881658407e-05, 'epoch': 0.65} {'loss': 0.6406, 'learning_rate': 1.5816199580341124e-05, 'epoch': 0.65} {'loss': 0.622, 'learning_rate': 1.581592627245846e-05, 'epoch': 0.65} {'loss': 0.5792, 'learning_rate': 1.581565295801072e-05, 'epoch': 0.65} {'loss': 0.5046, 'learning_rate': 1.581537963699822e-05, 'epoch': 0.65} {'loss': 0.4982, 'learning_rate': 1.5815106309421254e-05, 'epoch': 0.65} {'loss': 0.5716, 'learning_rate': 1.5814832975280143e-05, 'epoch': 0.65} {'loss': 0.5696, 'learning_rate': 1.5814559634575187e-05, 'epoch': 0.65} {'loss': 0.705, 'learning_rate': 1.5814286287306705e-05, 'epoch': 0.65} {'loss': 0.601, 'learning_rate': 1.5814012933474995e-05, 'epoch': 0.65} {'loss': 0.5112, 'learning_rate': 1.5813739573080372e-05, 'epoch': 0.65} {'loss': 0.622, 'learning_rate': 1.5813466206123144e-05, 'epoch': 0.65} {'loss': 0.6415, 'learning_rate': 1.5813192832603613e-05, 'epoch': 0.65} {'loss': 0.6224, 'learning_rate': 1.5812919452522098e-05, 'epoch': 0.65} {'loss': 0.711, 'learning_rate': 1.58126460658789e-05, 'epoch': 0.65} {'loss': 0.452, 'learning_rate': 1.581237267267433e-05, 'epoch': 0.65} {'loss': 0.655, 'learning_rate': 1.5812099272908694e-05, 'epoch': 0.65} {'loss': 0.6885, 'learning_rate': 1.5811825866582307e-05, 'epoch': 0.65} {'loss': 0.4569, 'learning_rate': 1.5811552453695473e-05, 'epoch': 0.65} {'loss': 0.6368, 'learning_rate': 1.58112790342485e-05, 'epoch': 0.65} {'loss': 0.5629, 'learning_rate': 1.58110056082417e-05, 'epoch': 0.65} {'loss': 0.5224, 'learning_rate': 1.5810732175675377e-05, 'epoch': 0.65} {'loss': 0.6182, 'learning_rate': 1.5810458736549845e-05, 'epoch': 0.65} {'loss': 0.5652, 'learning_rate': 1.5810185290865407e-05, 'epoch': 0.65} {'loss': 0.8194, 'learning_rate': 1.5809911838622377e-05, 'epoch': 0.65} {'loss': 0.5188, 'learning_rate': 1.5809638379821062e-05, 'epoch': 0.65} {'loss': 0.4845, 'learning_rate': 1.580936491446177e-05, 'epoch': 0.65} {'loss': 0.5784, 'learning_rate': 1.5809091442544807e-05, 'epoch': 0.65} {'loss': 0.5692, 'learning_rate': 1.5808817964070488e-05, 'epoch': 0.65} {'loss': 0.5663, 'learning_rate': 1.5808544479039114e-05, 'epoch': 0.65} {'loss': 0.5042, 'learning_rate': 1.5808270987451e-05, 'epoch': 0.65} {'loss': 0.4418, 'learning_rate': 1.5807997489306455e-05, 'epoch': 0.65} {'loss': 0.5096, 'learning_rate': 1.580772398460578e-05, 'epoch': 0.65} {'loss': 0.5349, 'learning_rate': 1.5807450473349293e-05, 'epoch': 0.65} {'loss': 0.7172, 'learning_rate': 1.5807176955537296e-05, 'epoch': 0.65} {'loss': 0.5393, 'learning_rate': 1.58069034311701e-05, 'epoch': 0.65} {'loss': 0.6761, 'learning_rate': 1.580662990024802e-05, 'epoch': 0.65} {'loss': 0.5214, 'learning_rate': 1.5806356362771355e-05, 'epoch': 0.65} {'loss': 0.624, 'learning_rate': 1.580608281874042e-05, 'epoch': 0.65} {'loss': 0.5068, 'learning_rate': 1.5805809268155515e-05, 'epoch': 0.65} {'loss': 0.4787, 'learning_rate': 1.580553571101696e-05, 'epoch': 0.65} {'loss': 0.4997, 'learning_rate': 1.580526214732506e-05, 'epoch': 0.65} {'loss': 0.493, 'learning_rate': 1.5804988577080124e-05, 'epoch': 0.65} {'loss': 0.4937, 'learning_rate': 1.5804715000282457e-05, 'epoch': 0.65} {'loss': 0.5837, 'learning_rate': 1.580444141693237e-05, 'epoch': 0.65} {'loss': 0.5987, 'learning_rate': 1.5804167827030176e-05, 'epoch': 0.65} {'loss': 0.6574, 'learning_rate': 1.5803894230576178e-05, 'epoch': 0.65} {'loss': 0.6396, 'learning_rate': 1.580362062757069e-05, 'epoch': 0.65} {'loss': 0.5272, 'learning_rate': 1.5803347018014013e-05, 'epoch': 0.65} {'loss': 0.3256, 'learning_rate': 1.5803073401906465e-05, 'epoch': 0.65} {'loss': 0.4553, 'learning_rate': 1.5802799779248344e-05, 'epoch': 0.65} {'loss': 0.5564, 'learning_rate': 1.580252615003997e-05, 'epoch': 0.65} {'loss': 0.5809, 'learning_rate': 1.580225251428165e-05, 'epoch': 0.65} {'loss': 0.7084, 'learning_rate': 1.5801978871973685e-05, 'epoch': 0.65} {'loss': 0.7237, 'learning_rate': 1.5801705223116395e-05, 'epoch': 0.65} {'loss': 0.4993, 'learning_rate': 1.580143156771008e-05, 'epoch': 0.65} {'loss': 0.6881, 'learning_rate': 1.580115790575505e-05, 'epoch': 0.65} {'loss': 0.4092, 'learning_rate': 1.580088423725162e-05, 'epoch': 0.65} {'loss': 0.5461, 'learning_rate': 1.580061056220009e-05, 'epoch': 0.65} {'loss': 0.4755, 'learning_rate': 1.580033688060078e-05, 'epoch': 0.65} {'loss': 0.5162, 'learning_rate': 1.5800063192453987e-05, 'epoch': 0.65} {'loss': 0.5335, 'learning_rate': 1.5799789497760027e-05, 'epoch': 0.65} {'loss': 0.5338, 'learning_rate': 1.5799515796519207e-05, 'epoch': 0.65} {'loss': 0.6754, 'learning_rate': 1.579924208873184e-05, 'epoch': 0.65} {'loss': 0.5234, 'learning_rate': 1.5798968374398227e-05, 'epoch': 0.65} {'loss': 0.6409, 'learning_rate': 1.5798694653518684e-05, 'epoch': 0.65} {'loss': 0.6316, 'learning_rate': 1.5798420926093518e-05, 'epoch': 0.65} {'loss': 0.4312, 'learning_rate': 1.5798147192123033e-05, 'epoch': 0.65} {'loss': 0.5583, 'learning_rate': 1.5797873451607548e-05, 'epoch': 0.65} {'loss': 0.6882, 'learning_rate': 1.5797599704547365e-05, 'epoch': 0.65} {'loss': 0.5625, 'learning_rate': 1.5797325950942792e-05, 'epoch': 0.65} {'loss': 0.6258, 'learning_rate': 1.579705219079414e-05, 'epoch': 0.65} {'loss': 0.4879, 'learning_rate': 1.5796778424101723e-05, 'epoch': 0.65} {'loss': 0.5044, 'learning_rate': 1.5796504650865844e-05, 'epoch': 0.65} {'loss': 0.6441, 'learning_rate': 1.579623087108681e-05, 'epoch': 0.65} {'loss': 0.4927, 'learning_rate': 1.5795957084764933e-05, 'epoch': 0.65} {'loss': 0.5731, 'learning_rate': 1.579568329190053e-05, 'epoch': 0.65} {'loss': 0.6326, 'learning_rate': 1.5795409492493896e-05, 'epoch': 0.65} {'loss': 0.6969, 'learning_rate': 1.579513568654535e-05, 'epoch': 0.65} {'loss': 0.5356, 'learning_rate': 1.5794861874055192e-05, 'epoch': 0.65} {'loss': 0.7926, 'learning_rate': 1.5794588055023745e-05, 'epoch': 0.65} {'loss': 0.7882, 'learning_rate': 1.5794314229451305e-05, 'epoch': 0.65} {'loss': 0.5815, 'learning_rate': 1.579404039733819e-05, 'epoch': 0.65} {'loss': 0.6271, 'learning_rate': 1.5793766558684702e-05, 'epoch': 0.65} {'loss': 0.6767, 'learning_rate': 1.5793492713491154e-05, 'epoch': 0.65} {'loss': 0.6998, 'learning_rate': 1.5793218861757855e-05, 'epoch': 0.65} {'loss': 0.5453, 'learning_rate': 1.5792945003485113e-05, 'epoch': 0.65} {'loss': 0.6641, 'learning_rate': 1.579267113867324e-05, 'epoch': 0.65} {'loss': 0.6939, 'learning_rate': 1.5792397267322534e-05, 'epoch': 0.65} {'loss': 0.575, 'learning_rate': 1.5792123389433322e-05, 'epoch': 0.65} {'loss': 0.5888, 'learning_rate': 1.57918495050059e-05, 'epoch': 0.65} {'loss': 0.6735, 'learning_rate': 1.5791575614040585e-05, 'epoch': 0.65} {'loss': 0.5353, 'learning_rate': 1.5791301716537678e-05, 'epoch': 0.65} {'loss': 0.7057, 'learning_rate': 1.5791027812497495e-05, 'epoch': 0.65} {'loss': 0.5425, 'learning_rate': 1.5790753901920343e-05, 'epoch': 0.65} {'loss': 0.6959, 'learning_rate': 1.579047998480653e-05, 'epoch': 0.65} {'loss': 0.534, 'learning_rate': 1.5790206061156368e-05, 'epoch': 0.65} {'loss': 0.5381, 'learning_rate': 1.5789932130970162e-05, 'epoch': 0.65} {'loss': 0.7326, 'learning_rate': 1.5789658194248227e-05, 'epoch': 0.65} {'loss': 0.4286, 'learning_rate': 1.5789384250990866e-05, 'epoch': 0.65} {'loss': 0.5263, 'learning_rate': 1.5789110301198392e-05, 'epoch': 0.65} {'loss': 0.5559, 'learning_rate': 1.5788836344871113e-05, 'epoch': 0.65} {'loss': 0.4232, 'learning_rate': 1.5788562382009338e-05, 'epoch': 0.65} {'loss': 0.5948, 'learning_rate': 1.5788288412613377e-05, 'epoch': 0.65} {'loss': 0.6699, 'learning_rate': 1.578801443668354e-05, 'epoch': 0.65} {'loss': 0.5584, 'learning_rate': 1.5787740454220135e-05, 'epoch': 0.65} {'loss': 0.4595, 'learning_rate': 1.5787466465223473e-05, 'epoch': 0.65} {'loss': 0.6734, 'learning_rate': 1.578719246969386e-05, 'epoch': 0.65} {'loss': 0.3858, 'learning_rate': 1.5786918467631605e-05, 'epoch': 0.65} {'loss': 0.5125, 'learning_rate': 1.5786644459037023e-05, 'epoch': 0.65} {'loss': 0.6307, 'learning_rate': 1.578637044391042e-05, 'epoch': 0.65} {'loss': 0.6694, 'learning_rate': 1.5786096422252104e-05, 'epoch': 0.65} {'loss': 0.4599, 'learning_rate': 1.5785822394062384e-05, 'epoch': 0.65} {'loss': 0.5937, 'learning_rate': 1.5785548359341572e-05, 'epoch': 0.65} {'loss': 0.5232, 'learning_rate': 1.5785274318089977e-05, 'epoch': 0.65} {'loss': 0.4566, 'learning_rate': 1.5785000270307907e-05, 'epoch': 0.65} {'loss': 0.6407, 'learning_rate': 1.578472621599567e-05, 'epoch': 0.65} {'loss': 0.6209, 'learning_rate': 1.578445215515358e-05, 'epoch': 0.65} {'loss': 0.7191, 'learning_rate': 1.578417808778194e-05, 'epoch': 0.65} {'loss': 0.6624, 'learning_rate': 1.5783904013881065e-05, 'epoch': 0.65} {'loss': 0.6004, 'learning_rate': 1.5783629933451265e-05, 'epoch': 0.65} {'loss': 0.609, 'learning_rate': 1.5783355846492844e-05, 'epoch': 0.65} {'loss': 0.6302, 'learning_rate': 1.5783081753006113e-05, 'epoch': 0.65} {'loss': 0.4676, 'learning_rate': 1.5782807652991384e-05, 'epoch': 0.65} {'loss': 0.5896, 'learning_rate': 1.5782533546448964e-05, 'epoch': 0.65} {'loss': 0.5274, 'learning_rate': 1.578225943337916e-05, 'epoch': 0.65} {'loss': 0.4147, 'learning_rate': 1.578198531378229e-05, 'epoch': 0.65} {'loss': 0.7133, 'learning_rate': 1.5781711187658654e-05, 'epoch': 0.65} {'loss': 0.5011, 'learning_rate': 1.5781437055008568e-05, 'epoch': 0.65} {'loss': 0.6252, 'learning_rate': 1.578116291583234e-05, 'epoch': 0.65} {'loss': 0.4796, 'learning_rate': 1.5780888770130278e-05, 'epoch': 0.65} {'loss': 0.7084, 'learning_rate': 1.578061461790269e-05, 'epoch': 0.65} {'loss': 0.532, 'learning_rate': 1.5780340459149887e-05, 'epoch': 0.65} {'loss': 0.5444, 'learning_rate': 1.578006629387218e-05, 'epoch': 0.65} {'loss': 0.5984, 'learning_rate': 1.5779792122069878e-05, 'epoch': 0.65} {'loss': 0.4045, 'learning_rate': 1.5779517943743286e-05, 'epoch': 0.65} {'loss': 0.4825, 'learning_rate': 1.5779243758892722e-05, 'epoch': 0.65} {'loss': 0.5582, 'learning_rate': 1.577896956751849e-05, 'epoch': 0.65} {'loss': 0.5991, 'learning_rate': 1.5778695369620897e-05, 'epoch': 0.65} {'loss': 0.4502, 'learning_rate': 1.5778421165200256e-05, 'epoch': 0.65} {'loss': 0.5981, 'learning_rate': 1.577814695425688e-05, 'epoch': 0.65} {'loss': 0.6421, 'learning_rate': 1.5777872736791074e-05, 'epoch': 0.65} {'loss': 0.6199, 'learning_rate': 1.5777598512803146e-05, 'epoch': 0.65} {'loss': 0.657, 'learning_rate': 1.5777324282293413e-05, 'epoch': 0.65} {'loss': 0.5539, 'learning_rate': 1.5777050045262173e-05, 'epoch': 0.65} {'loss': 0.5563, 'learning_rate': 1.5776775801709745e-05, 'epoch': 0.65} {'loss': 0.6208, 'learning_rate': 1.5776501551636438e-05, 'epoch': 0.65} {'loss': 0.5242, 'learning_rate': 1.5776227295042555e-05, 'epoch': 0.65} {'loss': 0.7697, 'learning_rate': 1.5775953031928413e-05, 'epoch': 0.65} {'loss': 0.5006, 'learning_rate': 1.5775678762294316e-05, 'epoch': 0.65} {'loss': 0.5589, 'learning_rate': 1.5775404486140576e-05, 'epoch': 0.65} {'loss': 0.6536, 'learning_rate': 1.5775130203467505e-05, 'epoch': 0.65} {'loss': 0.5651, 'learning_rate': 1.5774855914275407e-05, 'epoch': 0.65} {'loss': 0.4324, 'learning_rate': 1.5774581618564598e-05, 'epoch': 0.65} {'loss': 0.4937, 'learning_rate': 1.5774307316335382e-05, 'epoch': 0.65} {'loss': 0.4834, 'learning_rate': 1.5774033007588072e-05, 'epoch': 0.65} {'loss': 0.613, 'learning_rate': 1.577375869232298e-05, 'epoch': 0.65} {'loss': 0.4562, 'learning_rate': 1.5773484370540408e-05, 'epoch': 0.65} {'loss': 0.5623, 'learning_rate': 1.577321004224067e-05, 'epoch': 0.65} {'loss': 0.425, 'learning_rate': 1.5772935707424074e-05, 'epoch': 0.65} {'loss': 0.3765, 'learning_rate': 1.577266136609094e-05, 'epoch': 0.65} {'loss': 0.4048, 'learning_rate': 1.577238701824156e-05, 'epoch': 0.65} {'loss': 0.5392, 'learning_rate': 1.5772112663876256e-05, 'epoch': 0.65} {'loss': 0.4992, 'learning_rate': 1.5771838302995335e-05, 'epoch': 0.65} {'loss': 0.5423, 'learning_rate': 1.5771563935599104e-05, 'epoch': 0.65} {'loss': 0.5502, 'learning_rate': 1.5771289561687875e-05, 'epoch': 0.65} {'loss': 0.5999, 'learning_rate': 1.577101518126196e-05, 'epoch': 0.65} {'loss': 0.6423, 'learning_rate': 1.5770740794321668e-05, 'epoch': 0.65} {'loss': 0.6126, 'learning_rate': 1.5770466400867302e-05, 'epoch': 0.65} {'loss': 0.5592, 'learning_rate': 1.5770192000899178e-05, 'epoch': 0.65} {'loss': 0.4629, 'learning_rate': 1.5769917594417608e-05, 'epoch': 0.65} {'loss': 0.5154, 'learning_rate': 1.5769643181422893e-05, 'epoch': 0.65} {'loss': 0.4924, 'learning_rate': 1.5769368761915353e-05, 'epoch': 0.65} {'loss': 0.5569, 'learning_rate': 1.576909433589529e-05, 'epoch': 0.65} {'loss': 0.4478, 'learning_rate': 1.5768819903363016e-05, 'epoch': 0.65} {'loss': 0.5377, 'learning_rate': 1.5768545464318843e-05, 'epoch': 0.65} {'loss': 0.5814, 'learning_rate': 1.5768271018763078e-05, 'epoch': 0.65} {'loss': 0.6297, 'learning_rate': 1.576799656669603e-05, 'epoch': 0.65} {'loss': 0.7863, 'learning_rate': 1.5767722108118015e-05, 'epoch': 0.65} {'loss': 0.7384, 'learning_rate': 1.5767447643029337e-05, 'epoch': 0.65} {'loss': 0.4461, 'learning_rate': 1.5767173171430307e-05, 'epoch': 0.65} {'loss': 0.5729, 'learning_rate': 1.5766898693321232e-05, 'epoch': 0.65} {'loss': 0.5408, 'learning_rate': 1.576662420870243e-05, 'epoch': 0.65} {'loss': 0.6566, 'learning_rate': 1.5766349717574203e-05, 'epoch': 0.65} {'loss': 0.4613, 'learning_rate': 1.5766075219936865e-05, 'epoch': 0.65} {'loss': 0.5246, 'learning_rate': 1.5765800715790726e-05, 'epoch': 0.65} {'loss': 0.5874, 'learning_rate': 1.576552620513609e-05, 'epoch': 0.65} {'loss': 0.5654, 'learning_rate': 1.5765251687973274e-05, 'epoch': 0.65} {'loss': 0.4697, 'learning_rate': 1.5764977164302585e-05, 'epoch': 0.65} {'loss': 0.614, 'learning_rate': 1.5764702634124332e-05, 'epoch': 0.65} {'loss': 0.4795, 'learning_rate': 1.576442809743883e-05, 'epoch': 0.65} {'loss': 0.7072, 'learning_rate': 1.576415355424638e-05, 'epoch': 0.65} {'loss': 0.5462, 'learning_rate': 1.5763879004547296e-05, 'epoch': 0.65} {'loss': 0.6687, 'learning_rate': 1.5763604448341895e-05, 'epoch': 0.65} {'loss': 0.4637, 'learning_rate': 1.5763329885630475e-05, 'epoch': 0.65} {'loss': 0.7047, 'learning_rate': 1.576305531641335e-05, 'epoch': 0.65} {'loss': 0.8234, 'learning_rate': 1.5762780740690837e-05, 'epoch': 0.65} {'loss': 0.6017, 'learning_rate': 1.576250615846324e-05, 'epoch': 0.65} {'loss': 0.5589, 'learning_rate': 1.5762231569730865e-05, 'epoch': 0.65} {'loss': 0.5971, 'learning_rate': 1.576195697449403e-05, 'epoch': 0.65} {'loss': 0.6371, 'learning_rate': 1.576168237275304e-05, 'epoch': 0.65} {'loss': 0.6555, 'learning_rate': 1.5761407764508205e-05, 'epoch': 0.65} {'loss': 0.5931, 'learning_rate': 1.5761133149759837e-05, 'epoch': 0.65} {'loss': 0.4865, 'learning_rate': 1.5760858528508246e-05, 'epoch': 0.65} {'loss': 0.5738, 'learning_rate': 1.576058390075374e-05, 'epoch': 0.65} {'loss': 0.7192, 'learning_rate': 1.5760309266496633e-05, 'epoch': 0.65} {'loss': 0.525, 'learning_rate': 1.576003462573723e-05, 'epoch': 0.65} {'loss': 0.597, 'learning_rate': 1.5759759978475844e-05, 'epoch': 0.65} {'loss': 0.5296, 'learning_rate': 1.5759485324712783e-05, 'epoch': 0.65} {'loss': 0.6879, 'learning_rate': 1.575921066444836e-05, 'epoch': 0.65} {'loss': 0.5353, 'learning_rate': 1.575893599768288e-05, 'epoch': 0.65} {'loss': 0.6382, 'learning_rate': 1.575866132441666e-05, 'epoch': 0.65} {'loss': 0.6459, 'learning_rate': 1.5758386644650006e-05, 'epoch': 0.65} {'loss': 0.533, 'learning_rate': 1.5758111958383225e-05, 'epoch': 0.65} {'loss': 0.4843, 'learning_rate': 1.5757837265616635e-05, 'epoch': 0.65} {'loss': 0.4046, 'learning_rate': 1.575756256635054e-05, 'epoch': 0.65} {'loss': 0.6651, 'learning_rate': 1.575728786058525e-05, 'epoch': 0.65} {'loss': 0.4589, 'learning_rate': 1.5757013148321077e-05, 'epoch': 0.65} {'loss': 0.6134, 'learning_rate': 1.5756738429558334e-05, 'epoch': 0.65} {'loss': 0.5654, 'learning_rate': 1.5756463704297328e-05, 'epoch': 0.65} {'loss': 0.6388, 'learning_rate': 1.5756188972538365e-05, 'epoch': 0.65} {'loss': 0.6617, 'learning_rate': 1.5755914234281762e-05, 'epoch': 0.65} {'loss': 0.5329, 'learning_rate': 1.5755639489527827e-05, 'epoch': 0.65} {'loss': 0.546, 'learning_rate': 1.5755364738276864e-05, 'epoch': 0.65} {'loss': 0.6212, 'learning_rate': 1.5755089980529196e-05, 'epoch': 0.65} {'loss': 0.6126, 'learning_rate': 1.5754815216285124e-05, 'epoch': 0.65} {'loss': 0.5278, 'learning_rate': 1.575454044554496e-05, 'epoch': 0.65} {'loss': 0.5894, 'learning_rate': 1.5754265668309013e-05, 'epoch': 0.65} {'loss': 0.6473, 'learning_rate': 1.575399088457759e-05, 'epoch': 0.65} {'loss': 0.5697, 'learning_rate': 1.5753716094351012e-05, 'epoch': 0.65} {'loss': 0.491, 'learning_rate': 1.5753441297629583e-05, 'epoch': 0.65} {'loss': 0.4609, 'learning_rate': 1.5753166494413606e-05, 'epoch': 0.65} {'loss': 0.6092, 'learning_rate': 1.57528916847034e-05, 'epoch': 0.65} {'loss': 0.5577, 'learning_rate': 1.575261686849928e-05, 'epoch': 0.65} {'loss': 0.5139, 'learning_rate': 1.5752342045801545e-05, 'epoch': 0.65} {'loss': 0.6032, 'learning_rate': 1.5752067216610507e-05, 'epoch': 0.65} {'loss': 0.5675, 'learning_rate': 1.5751792380926483e-05, 'epoch': 0.65} {'loss': 0.6163, 'learning_rate': 1.5751517538749776e-05, 'epoch': 0.65} {'loss': 0.5577, 'learning_rate': 1.57512426900807e-05, 'epoch': 0.65} {'loss': 0.5731, 'learning_rate': 1.5750967834919565e-05, 'epoch': 0.65} {'loss': 0.4888, 'learning_rate': 1.5750692973266684e-05, 'epoch': 0.65} {'loss': 0.7861, 'learning_rate': 1.5750418105122362e-05, 'epoch': 0.65} {'loss': 0.4121, 'learning_rate': 1.575014323048691e-05, 'epoch': 0.65} {'loss': 0.5555, 'learning_rate': 1.5749868349360642e-05, 'epoch': 0.65} {'loss': 0.6117, 'learning_rate': 1.5749593461743863e-05, 'epoch': 0.65} {'loss': 0.5423, 'learning_rate': 1.5749318567636888e-05, 'epoch': 0.65} {'loss': 0.7166, 'learning_rate': 1.574904366704003e-05, 'epoch': 0.65} {'loss': 0.5494, 'learning_rate': 1.5748768759953586e-05, 'epoch': 0.65} {'loss': 0.5648, 'learning_rate': 1.5748493846377883e-05, 'epoch': 0.65} {'loss': 0.6159, 'learning_rate': 1.574821892631322e-05, 'epoch': 0.65} {'loss': 0.394, 'learning_rate': 1.5747943999759913e-05, 'epoch': 0.65} {'loss': 0.4792, 'learning_rate': 1.5747669066718268e-05, 'epoch': 0.65} {'loss': 0.5522, 'learning_rate': 1.57473941271886e-05, 'epoch': 0.65} {'loss': 0.7011, 'learning_rate': 1.5747119181171212e-05, 'epoch': 0.65} {'loss': 0.5701, 'learning_rate': 1.5746844228666424e-05, 'epoch': 0.65} {'loss': 0.5228, 'learning_rate': 1.574656926967454e-05, 'epoch': 0.65} {'loss': 0.5593, 'learning_rate': 1.5746294304195876e-05, 'epoch': 0.65} {'loss': 0.8333, 'learning_rate': 1.574601933223073e-05, 'epoch': 0.65} {'loss': 0.5918, 'learning_rate': 1.574574435377943e-05, 'epoch': 0.65} {'loss': 0.5312, 'learning_rate': 1.574546936884227e-05, 'epoch': 0.65} {'loss': 0.6523, 'learning_rate': 1.5745194377419572e-05, 'epoch': 0.65} {'loss': 0.5585, 'learning_rate': 1.574491937951164e-05, 'epoch': 0.65} {'loss': 0.5962, 'learning_rate': 1.574464437511879e-05, 'epoch': 0.65} {'loss': 0.6775, 'learning_rate': 1.5744369364241325e-05, 'epoch': 0.65} {'loss': 0.4889, 'learning_rate': 1.5744094346879556e-05, 'epoch': 0.65} {'loss': 0.6843, 'learning_rate': 1.57438193230338e-05, 'epoch': 0.65} {'loss': 0.4745, 'learning_rate': 1.5743544292704367e-05, 'epoch': 0.65} {'loss': 0.5604, 'learning_rate': 1.5743269255891568e-05, 'epoch': 0.65} {'loss': 0.5858, 'learning_rate': 1.5742994212595704e-05, 'epoch': 0.65} {'loss': 0.524, 'learning_rate': 1.5742719162817093e-05, 'epoch': 0.65} {'loss': 0.5976, 'learning_rate': 1.574244410655604e-05, 'epoch': 0.65} {'loss': 0.6926, 'learning_rate': 1.5742169043812866e-05, 'epoch': 0.65} {'loss': 0.5191, 'learning_rate': 1.5741893974587873e-05, 'epoch': 0.65} {'loss': 0.5592, 'learning_rate': 1.5741618898881373e-05, 'epoch': 0.65} {'loss': 0.643, 'learning_rate': 1.5741343816693676e-05, 'epoch': 0.65} {'loss': 0.5851, 'learning_rate': 1.5741068728025096e-05, 'epoch': 0.65} {'loss': 0.8097, 'learning_rate': 1.5740793632875938e-05, 'epoch': 0.65} {'loss': 0.3832, 'learning_rate': 1.5740518531246517e-05, 'epoch': 0.65} {'loss': 0.4506, 'learning_rate': 1.5740243423137145e-05, 'epoch': 0.65} {'loss': 0.5295, 'learning_rate': 1.5739968308548127e-05, 'epoch': 0.65} {'loss': 0.4691, 'learning_rate': 1.5739693187479777e-05, 'epoch': 0.65} {'loss': 0.5886, 'learning_rate': 1.5739418059932402e-05, 'epoch': 0.65} {'loss': 0.6832, 'learning_rate': 1.5739142925906322e-05, 'epoch': 0.65} {'loss': 0.4545, 'learning_rate': 1.5738867785401833e-05, 'epoch': 0.65} {'loss': 0.372, 'learning_rate': 1.573859263841926e-05, 'epoch': 0.65} {'loss': 0.4446, 'learning_rate': 1.5738317484958907e-05, 'epoch': 0.65} {'loss': 0.5702, 'learning_rate': 1.573804232502108e-05, 'epoch': 0.65} {'loss': 0.5788, 'learning_rate': 1.5737767158606093e-05, 'epoch': 0.65} {'loss': 0.4971, 'learning_rate': 1.5737491985714265e-05, 'epoch': 0.65} {'loss': 0.726, 'learning_rate': 1.5737216806345895e-05, 'epoch': 0.65} {'loss': 0.6026, 'learning_rate': 1.57369416205013e-05, 'epoch': 0.65} {'loss': 0.5106, 'learning_rate': 1.5736666428180788e-05, 'epoch': 0.65} {'loss': 0.6148, 'learning_rate': 1.573639122938467e-05, 'epoch': 0.65} {'loss': 0.5355, 'learning_rate': 1.573611602411326e-05, 'epoch': 0.65} {'loss': 0.7093, 'learning_rate': 1.5735840812366862e-05, 'epoch': 0.65} {'loss': 0.4776, 'learning_rate': 1.5735565594145792e-05, 'epoch': 0.65} {'loss': 0.5907, 'learning_rate': 1.573529036945036e-05, 'epoch': 0.65} {'loss': 0.6918, 'learning_rate': 1.5735015138280875e-05, 'epoch': 0.65} {'loss': 0.5312, 'learning_rate': 1.5734739900637648e-05, 'epoch': 0.65} {'loss': 0.5679, 'learning_rate': 1.5734464656520992e-05, 'epoch': 0.65} {'loss': 0.525, 'learning_rate': 1.5734189405931215e-05, 'epoch': 0.65} {'loss': 0.6722, 'learning_rate': 1.573391414886863e-05, 'epoch': 0.65} {'loss': 0.4921, 'learning_rate': 1.5733638885333543e-05, 'epoch': 0.65} {'loss': 0.5796, 'learning_rate': 1.5733363615326268e-05, 'epoch': 0.65} {'loss': 0.6016, 'learning_rate': 1.573308833884712e-05, 'epoch': 0.65} {'loss': 0.4961, 'learning_rate': 1.57328130558964e-05, 'epoch': 0.65} {'loss': 0.567, 'learning_rate': 1.573253776647443e-05, 'epoch': 0.65} {'loss': 0.5376, 'learning_rate': 1.5732262470581508e-05, 'epoch': 0.65} {'loss': 0.6229, 'learning_rate': 1.5731987168217954e-05, 'epoch': 0.65} {'loss': 0.4761, 'learning_rate': 1.573171185938408e-05, 'epoch': 0.65} {'loss': 0.6872, 'learning_rate': 1.573143654408019e-05, 'epoch': 0.65} {'loss': 0.7274, 'learning_rate': 1.5731161222306602e-05, 'epoch': 0.65} {'loss': 0.5399, 'learning_rate': 1.573088589406362e-05, 'epoch': 0.65} {'loss': 0.4862, 'learning_rate': 1.5730610559351555e-05, 'epoch': 0.65} {'loss': 0.5472, 'learning_rate': 1.5730335218170723e-05, 'epoch': 0.65} {'loss': 0.7905, 'learning_rate': 1.5730059870521433e-05, 'epoch': 0.65} {'loss': 0.5932, 'learning_rate': 1.5729784516403993e-05, 'epoch': 0.65} {'loss': 0.5597, 'learning_rate': 1.5729509155818718e-05, 'epoch': 0.65} {'loss': 0.503, 'learning_rate': 1.572923378876592e-05, 'epoch': 0.65} {'loss': 0.4645, 'learning_rate': 1.57289584152459e-05, 'epoch': 0.65} {'loss': 0.5462, 'learning_rate': 1.5728683035258977e-05, 'epoch': 0.65} {'loss': 0.5818, 'learning_rate': 1.5728407648805458e-05, 'epoch': 0.65} {'loss': 0.4437, 'learning_rate': 1.5728132255885662e-05, 'epoch': 0.65} {'loss': 0.4723, 'learning_rate': 1.572785685649989e-05, 'epoch': 0.65} {'loss': 0.5598, 'learning_rate': 1.572758145064846e-05, 'epoch': 0.65} {'loss': 0.4886, 'learning_rate': 1.5727306038331677e-05, 'epoch': 0.65} {'loss': 0.5405, 'learning_rate': 1.5727030619549855e-05, 'epoch': 0.65} {'loss': 0.5384, 'learning_rate': 1.5726755194303304e-05, 'epoch': 0.65} {'loss': 0.4372, 'learning_rate': 1.5726479762592336e-05, 'epoch': 0.65} {'loss': 0.5692, 'learning_rate': 1.5726204324417264e-05, 'epoch': 0.66} {'loss': 0.6346, 'learning_rate': 1.5725928879778392e-05, 'epoch': 0.66} {'loss': 0.5976, 'learning_rate': 1.572565342867603e-05, 'epoch': 0.66} {'loss': 0.5657, 'learning_rate': 1.5725377971110505e-05, 'epoch': 0.66} {'loss': 0.6685, 'learning_rate': 1.5725102507082113e-05, 'epoch': 0.66} {'loss': 0.5059, 'learning_rate': 1.572482703659117e-05, 'epoch': 0.66} {'loss': 0.6638, 'learning_rate': 1.5724551559637983e-05, 'epoch': 0.66} {'loss': 0.6663, 'learning_rate': 1.5724276076222867e-05, 'epoch': 0.66} {'loss': 0.6099, 'learning_rate': 1.572400058634613e-05, 'epoch': 0.66} {'loss': 0.6825, 'learning_rate': 1.5723725090008088e-05, 'epoch': 0.66} {'loss': 0.5019, 'learning_rate': 1.5723449587209047e-05, 'epoch': 0.66} {'loss': 0.5057, 'learning_rate': 1.5723174077949323e-05, 'epoch': 0.66} {'loss': 0.6905, 'learning_rate': 1.572289856222922e-05, 'epoch': 0.66} {'loss': 0.4753, 'learning_rate': 1.5722623040049053e-05, 'epoch': 0.66} {'loss': 0.6794, 'learning_rate': 1.5722347511409134e-05, 'epoch': 0.66} {'loss': 0.6513, 'learning_rate': 1.5722071976309772e-05, 'epoch': 0.66} {'loss': 0.6588, 'learning_rate': 1.5721796434751283e-05, 'epoch': 0.66} {'loss': 0.611, 'learning_rate': 1.5721520886733968e-05, 'epoch': 0.66} {'loss': 0.6532, 'learning_rate': 1.5721245332258144e-05, 'epoch': 0.66} {'loss': 0.4895, 'learning_rate': 1.5720969771324125e-05, 'epoch': 0.66} {'loss': 0.6373, 'learning_rate': 1.5720694203932222e-05, 'epoch': 0.66} {'loss': 0.5859, 'learning_rate': 1.5720418630082736e-05, 'epoch': 0.66} {'loss': 0.6598, 'learning_rate': 1.572014304977599e-05, 'epoch': 0.66} {'loss': 0.5532, 'learning_rate': 1.571986746301229e-05, 'epoch': 0.66} {'loss': 0.5017, 'learning_rate': 1.5719591869791943e-05, 'epoch': 0.66} {'loss': 0.5859, 'learning_rate': 1.5719316270115267e-05, 'epoch': 0.66} {'loss': 0.4985, 'learning_rate': 1.571904066398257e-05, 'epoch': 0.66} {'loss': 0.5725, 'learning_rate': 1.5718765051394168e-05, 'epoch': 0.66} {'loss': 0.5159, 'learning_rate': 1.5718489432350362e-05, 'epoch': 0.66} {'loss': 0.5291, 'learning_rate': 1.5718213806851473e-05, 'epoch': 0.66} {'loss': 0.6275, 'learning_rate': 1.5717938174897804e-05, 'epoch': 0.66} {'loss': 0.6089, 'learning_rate': 1.5717662536489676e-05, 'epoch': 0.66} {'loss': 0.6041, 'learning_rate': 1.571738689162739e-05, 'epoch': 0.66} {'loss': 0.6009, 'learning_rate': 1.571711124031126e-05, 'epoch': 0.66} {'loss': 0.551, 'learning_rate': 1.57168355825416e-05, 'epoch': 0.66} {'loss': 0.6097, 'learning_rate': 1.571655991831872e-05, 'epoch': 0.66} {'loss': 0.6193, 'learning_rate': 1.5716284247642933e-05, 'epoch': 0.66} {'loss': 0.6683, 'learning_rate': 1.5716008570514544e-05, 'epoch': 0.66} {'loss': 0.6585, 'learning_rate': 1.571573288693387e-05, 'epoch': 0.66} {'loss': 0.6427, 'learning_rate': 1.5715457196901223e-05, 'epoch': 0.66} {'loss': 0.5548, 'learning_rate': 1.571518150041691e-05, 'epoch': 0.66} {'loss': 0.5393, 'learning_rate': 1.571490579748124e-05, 'epoch': 0.66} {'loss': 0.5799, 'learning_rate': 1.5714630088094532e-05, 'epoch': 0.66} {'loss': 0.5694, 'learning_rate': 1.5714354372257096e-05, 'epoch': 0.66} {'loss': 0.4688, 'learning_rate': 1.5714078649969237e-05, 'epoch': 0.66} {'loss': 0.3451, 'learning_rate': 1.5713802921231272e-05, 'epoch': 0.66} {'loss': 0.5297, 'learning_rate': 1.5713527186043508e-05, 'epoch': 0.66} {'loss': 0.5426, 'learning_rate': 1.5713251444406258e-05, 'epoch': 0.66} {'loss': 0.5535, 'learning_rate': 1.5712975696319835e-05, 'epoch': 0.66} {'loss': 0.511, 'learning_rate': 1.571269994178455e-05, 'epoch': 0.66} {'loss': 0.7562, 'learning_rate': 1.571242418080071e-05, 'epoch': 0.66} {'loss': 0.5874, 'learning_rate': 1.571214841336863e-05, 'epoch': 0.66} {'loss': 0.6845, 'learning_rate': 1.571187263948862e-05, 'epoch': 0.66} {'loss': 0.4392, 'learning_rate': 1.571159685916099e-05, 'epoch': 0.66} {'loss': 0.6429, 'learning_rate': 1.5711321072386057e-05, 'epoch': 0.66} {'loss': 0.6649, 'learning_rate': 1.571104527916413e-05, 'epoch': 0.66} {'loss': 0.5595, 'learning_rate': 1.5710769479495516e-05, 'epoch': 0.66} {'loss': 0.6588, 'learning_rate': 1.571049367338053e-05, 'epoch': 0.66} {'loss': 0.4643, 'learning_rate': 1.571021786081948e-05, 'epoch': 0.66} {'loss': 0.4931, 'learning_rate': 1.5709942041812682e-05, 'epoch': 0.66} {'loss': 0.5363, 'learning_rate': 1.5709666216360445e-05, 'epoch': 0.66} {'loss': 0.5594, 'learning_rate': 1.5709390384463083e-05, 'epoch': 0.66} {'loss': 0.6427, 'learning_rate': 1.57091145461209e-05, 'epoch': 0.66} {'loss': 0.6591, 'learning_rate': 1.5708838701334215e-05, 'epoch': 0.66} {'loss': 0.6672, 'learning_rate': 1.570856285010334e-05, 'epoch': 0.66} {'loss': 0.6043, 'learning_rate': 1.570828699242858e-05, 'epoch': 0.66} {'loss': 0.4189, 'learning_rate': 1.570801112831025e-05, 'epoch': 0.66} {'loss': 0.4728, 'learning_rate': 1.570773525774866e-05, 'epoch': 0.66} {'loss': 0.6257, 'learning_rate': 1.5707459380744125e-05, 'epoch': 0.66} {'loss': 0.6608, 'learning_rate': 1.570718349729695e-05, 'epoch': 0.66} {'loss': 0.5709, 'learning_rate': 1.570690760740745e-05, 'epoch': 0.66} {'loss': 0.4917, 'learning_rate': 1.570663171107594e-05, 'epoch': 0.66} {'loss': 0.6142, 'learning_rate': 1.5706355808302724e-05, 'epoch': 0.66} {'loss': 0.4984, 'learning_rate': 1.5706079899088124e-05, 'epoch': 0.66} {'loss': 0.6988, 'learning_rate': 1.5705803983432438e-05, 'epoch': 0.66} {'loss': 0.7627, 'learning_rate': 1.5705528061335987e-05, 'epoch': 0.66} {'loss': 0.5859, 'learning_rate': 1.5705252132799078e-05, 'epoch': 0.66} {'loss': 0.6183, 'learning_rate': 1.5704976197822025e-05, 'epoch': 0.66} {'loss': 0.7485, 'learning_rate': 1.5704700256405142e-05, 'epoch': 0.66} {'loss': 0.6282, 'learning_rate': 1.5704424308548733e-05, 'epoch': 0.66} {'loss': 0.5967, 'learning_rate': 1.5704148354253118e-05, 'epoch': 0.66} {'loss': 0.5282, 'learning_rate': 1.57038723935186e-05, 'epoch': 0.66} {'loss': 0.5551, 'learning_rate': 1.5703596426345495e-05, 'epoch': 0.66} {'loss': 0.6606, 'learning_rate': 1.5703320452734113e-05, 'epoch': 0.66} {'loss': 0.3923, 'learning_rate': 1.5703044472684773e-05, 'epoch': 0.66} {'loss': 0.4454, 'learning_rate': 1.5702768486197776e-05, 'epoch': 0.66} {'loss': 0.5764, 'learning_rate': 1.5702492493273437e-05, 'epoch': 0.66} {'loss': 0.508, 'learning_rate': 1.570221649391207e-05, 'epoch': 0.66} {'loss': 0.583, 'learning_rate': 1.5701940488113983e-05, 'epoch': 0.66} {'loss': 0.5636, 'learning_rate': 1.5701664475879492e-05, 'epoch': 0.66} {'loss': 0.5415, 'learning_rate': 1.5701388457208902e-05, 'epoch': 0.66} {'loss': 0.6032, 'learning_rate': 1.5701112432102536e-05, 'epoch': 0.66} {'loss': 0.4896, 'learning_rate': 1.5700836400560694e-05, 'epoch': 0.66} {'loss': 0.5393, 'learning_rate': 1.570056036258369e-05, 'epoch': 0.66} {'loss': 0.5663, 'learning_rate': 1.570028431817184e-05, 'epoch': 0.66} {'loss': 0.6244, 'learning_rate': 1.5700008267325452e-05, 'epoch': 0.66} {'loss': 0.5407, 'learning_rate': 1.5699732210044837e-05, 'epoch': 0.66} {'loss': 0.5106, 'learning_rate': 1.569945614633031e-05, 'epoch': 0.66} {'loss': 0.4806, 'learning_rate': 1.569918007618218e-05, 'epoch': 0.66} {'loss': 0.5095, 'learning_rate': 1.569890399960076e-05, 'epoch': 0.66} {'loss': 0.5889, 'learning_rate': 1.5698627916586363e-05, 'epoch': 0.66} {'loss': 0.5815, 'learning_rate': 1.5698351827139296e-05, 'epoch': 0.66} {'loss': 0.6695, 'learning_rate': 1.569807573125987e-05, 'epoch': 0.66} {'loss': 0.6959, 'learning_rate': 1.5697799628948406e-05, 'epoch': 0.66} {'loss': 0.5128, 'learning_rate': 1.569752352020521e-05, 'epoch': 0.66} {'loss': 0.5968, 'learning_rate': 1.569724740503059e-05, 'epoch': 0.66} {'loss': 0.5498, 'learning_rate': 1.569697128342486e-05, 'epoch': 0.66} {'loss': 0.6742, 'learning_rate': 1.5696695155388338e-05, 'epoch': 0.66} {'loss': 0.4188, 'learning_rate': 1.5696419020921324e-05, 'epoch': 0.66} {'loss': 0.7112, 'learning_rate': 1.569614288002414e-05, 'epoch': 0.66} {'loss': 0.6176, 'learning_rate': 1.5695866732697096e-05, 'epoch': 0.66} {'loss': 0.6387, 'learning_rate': 1.56955905789405e-05, 'epoch': 0.66} {'loss': 0.5724, 'learning_rate': 1.569531441875466e-05, 'epoch': 0.66} {'loss': 0.572, 'learning_rate': 1.5695038252139898e-05, 'epoch': 0.66} {'loss': 0.5264, 'learning_rate': 1.5694762079096523e-05, 'epoch': 0.66} {'loss': 0.48, 'learning_rate': 1.569448589962484e-05, 'epoch': 0.66} {'loss': 0.6433, 'learning_rate': 1.5694209713725168e-05, 'epoch': 0.66} {'loss': 0.6048, 'learning_rate': 1.5693933521397815e-05, 'epoch': 0.66} {'loss': 0.4394, 'learning_rate': 1.5693657322643094e-05, 'epoch': 0.66} {'loss': 0.4138, 'learning_rate': 1.5693381117461314e-05, 'epoch': 0.66} {'loss': 0.3671, 'learning_rate': 1.5693104905852794e-05, 'epoch': 0.66} {'loss': 0.6401, 'learning_rate': 1.5692828687817838e-05, 'epoch': 0.66} {'loss': 0.5217, 'learning_rate': 1.569255246335676e-05, 'epoch': 0.66} {'loss': 0.501, 'learning_rate': 1.5692276232469876e-05, 'epoch': 0.66} {'loss': 0.5339, 'learning_rate': 1.5691999995157494e-05, 'epoch': 0.66} {'loss': 0.4736, 'learning_rate': 1.5691723751419926e-05, 'epoch': 0.66} {'loss': 0.6014, 'learning_rate': 1.5691447501257485e-05, 'epoch': 0.66} {'loss': 0.5401, 'learning_rate': 1.569117124467048e-05, 'epoch': 0.66} {'loss': 0.638, 'learning_rate': 1.5690894981659225e-05, 'epoch': 0.66} {'loss': 0.5516, 'learning_rate': 1.5690618712224033e-05, 'epoch': 0.66} {'loss': 0.6443, 'learning_rate': 1.5690342436365214e-05, 'epoch': 0.66} {'loss': 0.5065, 'learning_rate': 1.569006615408308e-05, 'epoch': 0.66} {'loss': 0.5873, 'learning_rate': 1.5689789865377943e-05, 'epoch': 0.66} {'loss': 0.5807, 'learning_rate': 1.5689513570250117e-05, 'epoch': 0.66} {'loss': 0.6111, 'learning_rate': 1.568923726869991e-05, 'epoch': 0.66} {'loss': 0.7381, 'learning_rate': 1.5688960960727638e-05, 'epoch': 0.66} {'loss': 0.5668, 'learning_rate': 1.568868464633361e-05, 'epoch': 0.66} {'loss': 0.5923, 'learning_rate': 1.568840832551814e-05, 'epoch': 0.66} {'loss': 0.6568, 'learning_rate': 1.5688131998281537e-05, 'epoch': 0.66} {'loss': 0.5606, 'learning_rate': 1.5687855664624114e-05, 'epoch': 0.66} {'loss': 0.7622, 'learning_rate': 1.5687579324546184e-05, 'epoch': 0.66} {'loss': 0.5777, 'learning_rate': 1.5687302978048057e-05, 'epoch': 0.66} {'loss': 0.5423, 'learning_rate': 1.568702662513005e-05, 'epoch': 0.66} {'loss': 0.608, 'learning_rate': 1.568675026579247e-05, 'epoch': 0.66} {'loss': 0.7177, 'learning_rate': 1.5686473900035633e-05, 'epoch': 0.66} {'loss': 0.7104, 'learning_rate': 1.5686197527859844e-05, 'epoch': 0.66} {'loss': 0.6659, 'learning_rate': 1.568592114926542e-05, 'epoch': 0.66} {'loss': 0.5451, 'learning_rate': 1.5685644764252673e-05, 'epoch': 0.66} {'loss': 0.5875, 'learning_rate': 1.5685368372821917e-05, 'epoch': 0.66} {'loss': 0.6442, 'learning_rate': 1.5685091974973458e-05, 'epoch': 0.66} {'loss': 0.6418, 'learning_rate': 1.568481557070761e-05, 'epoch': 0.66} {'loss': 0.5003, 'learning_rate': 1.568453916002469e-05, 'epoch': 0.66} {'loss': 0.5991, 'learning_rate': 1.5684262742925003e-05, 'epoch': 0.66} {'loss': 0.4709, 'learning_rate': 1.5683986319408866e-05, 'epoch': 0.66} {'loss': 0.7497, 'learning_rate': 1.5683709889476587e-05, 'epoch': 0.66} {'loss': 0.4867, 'learning_rate': 1.5683433453128484e-05, 'epoch': 0.66} {'loss': 0.6631, 'learning_rate': 1.5683157010364863e-05, 'epoch': 0.66} {'loss': 0.6067, 'learning_rate': 1.5682880561186037e-05, 'epoch': 0.66} {'loss': 0.6318, 'learning_rate': 1.5682604105592322e-05, 'epoch': 0.66} {'loss': 0.6263, 'learning_rate': 1.5682327643584027e-05, 'epoch': 0.66} {'loss': 0.5959, 'learning_rate': 1.5682051175161466e-05, 'epoch': 0.66} {'loss': 0.7003, 'learning_rate': 1.568177470032495e-05, 'epoch': 0.66} {'loss': 0.6266, 'learning_rate': 1.5681498219074786e-05, 'epoch': 0.66} {'loss': 0.6357, 'learning_rate': 1.5681221731411292e-05, 'epoch': 0.66} {'loss': 0.5192, 'learning_rate': 1.5680945237334784e-05, 'epoch': 0.66} {'loss': 0.7143, 'learning_rate': 1.5680668736845568e-05, 'epoch': 0.66} {'loss': 0.4973, 'learning_rate': 1.5680392229943954e-05, 'epoch': 0.66} {'loss': 0.6252, 'learning_rate': 1.5680115716630257e-05, 'epoch': 0.66} {'loss': 0.5783, 'learning_rate': 1.5679839196904794e-05, 'epoch': 0.66} {'loss': 0.3922, 'learning_rate': 1.567956267076787e-05, 'epoch': 0.66} {'loss': 0.5718, 'learning_rate': 1.5679286138219798e-05, 'epoch': 0.66} {'loss': 0.5393, 'learning_rate': 1.5679009599260894e-05, 'epoch': 0.66} {'loss': 0.5755, 'learning_rate': 1.5678733053891468e-05, 'epoch': 0.66} {'loss': 0.5055, 'learning_rate': 1.5678456502111833e-05, 'epoch': 0.66} {'loss': 0.6705, 'learning_rate': 1.56781799439223e-05, 'epoch': 0.66} {'loss': 0.5298, 'learning_rate': 1.567790337932318e-05, 'epoch': 0.66} {'loss': 0.6082, 'learning_rate': 1.5677626808314785e-05, 'epoch': 0.66} {'loss': 0.6671, 'learning_rate': 1.5677350230897434e-05, 'epoch': 0.66} {'loss': 0.6331, 'learning_rate': 1.5677073647071432e-05, 'epoch': 0.66} {'loss': 0.6971, 'learning_rate': 1.5676797056837094e-05, 'epoch': 0.66} {'loss': 0.5033, 'learning_rate': 1.567652046019473e-05, 'epoch': 0.66} {'loss': 0.5966, 'learning_rate': 1.5676243857144656e-05, 'epoch': 0.66} {'loss': 0.656, 'learning_rate': 1.567596724768718e-05, 'epoch': 0.66} {'loss': 0.6665, 'learning_rate': 1.5675690631822616e-05, 'epoch': 0.66} {'loss': 0.6147, 'learning_rate': 1.5675414009551276e-05, 'epoch': 0.66} {'loss': 0.5665, 'learning_rate': 1.5675137380873477e-05, 'epoch': 0.66} {'loss': 0.6062, 'learning_rate': 1.5674860745789523e-05, 'epoch': 0.66} {'loss': 0.6863, 'learning_rate': 1.5674584104299734e-05, 'epoch': 0.66} {'loss': 0.479, 'learning_rate': 1.5674307456404418e-05, 'epoch': 0.66} {'loss': 0.5654, 'learning_rate': 1.5674030802103882e-05, 'epoch': 0.66} {'loss': 0.5916, 'learning_rate': 1.567375414139845e-05, 'epoch': 0.66} {'loss': 0.5852, 'learning_rate': 1.5673477474288427e-05, 'epoch': 0.66} {'loss': 0.7018, 'learning_rate': 1.5673200800774128e-05, 'epoch': 0.66} {'loss': 0.7177, 'learning_rate': 1.5672924120855863e-05, 'epoch': 0.66} {'loss': 0.536, 'learning_rate': 1.5672647434533945e-05, 'epoch': 0.66} {'loss': 0.6656, 'learning_rate': 1.5672370741808687e-05, 'epoch': 0.66} {'loss': 0.4867, 'learning_rate': 1.56720940426804e-05, 'epoch': 0.66} {'loss': 0.6176, 'learning_rate': 1.56718173371494e-05, 'epoch': 0.66} {'loss': 0.485, 'learning_rate': 1.5671540625215994e-05, 'epoch': 0.66} {'loss': 0.5681, 'learning_rate': 1.56712639068805e-05, 'epoch': 0.66} {'loss': 0.654, 'learning_rate': 1.5670987182143228e-05, 'epoch': 0.66} {'loss': 0.6269, 'learning_rate': 1.5670710451004488e-05, 'epoch': 0.66} {'loss': 0.5419, 'learning_rate': 1.567043371346459e-05, 'epoch': 0.66} {'loss': 0.4317, 'learning_rate': 1.5670156969523856e-05, 'epoch': 0.66} {'loss': 0.6013, 'learning_rate': 1.566988021918259e-05, 'epoch': 0.66} {'loss': 0.568, 'learning_rate': 1.5669603462441112e-05, 'epoch': 0.66} {'loss': 0.6084, 'learning_rate': 1.5669326699299726e-05, 'epoch': 0.66} {'loss': 0.5908, 'learning_rate': 1.566904992975875e-05, 'epoch': 0.66} {'loss': 0.571, 'learning_rate': 1.5668773153818494e-05, 'epoch': 0.66} {'loss': 0.6568, 'learning_rate': 1.566849637147927e-05, 'epoch': 0.66} {'loss': 0.5969, 'learning_rate': 1.5668219582741394e-05, 'epoch': 0.66} {'loss': 0.6233, 'learning_rate': 1.566794278760517e-05, 'epoch': 0.66} {'loss': 0.5996, 'learning_rate': 1.5667665986070922e-05, 'epoch': 0.66} {'loss': 0.6619, 'learning_rate': 1.5667389178138955e-05, 'epoch': 0.66} {'loss': 0.4877, 'learning_rate': 1.5667112363809586e-05, 'epoch': 0.66} {'loss': 0.4256, 'learning_rate': 1.5666835543083126e-05, 'epoch': 0.66} {'loss': 0.4763, 'learning_rate': 1.566655871595988e-05, 'epoch': 0.66} {'loss': 0.5508, 'learning_rate': 1.5666281882440172e-05, 'epoch': 0.66} {'loss': 0.4212, 'learning_rate': 1.5666005042524306e-05, 'epoch': 0.66} {'loss': 0.5565, 'learning_rate': 1.56657281962126e-05, 'epoch': 0.66} {'loss': 0.563, 'learning_rate': 1.5665451343505362e-05, 'epoch': 0.66} {'loss': 0.4213, 'learning_rate': 1.566517448440291e-05, 'epoch': 0.66} {'loss': 0.5246, 'learning_rate': 1.566489761890555e-05, 'epoch': 0.66} {'loss': 0.5153, 'learning_rate': 1.56646207470136e-05, 'epoch': 0.66} {'loss': 0.5555, 'learning_rate': 1.5664343868727368e-05, 'epoch': 0.66} {'loss': 0.5055, 'learning_rate': 1.566406698404717e-05, 'epoch': 0.66} {'loss': 0.4966, 'learning_rate': 1.5663790092973318e-05, 'epoch': 0.66} {'loss': 0.6412, 'learning_rate': 1.5663513195506123e-05, 'epoch': 0.66} {'loss': 0.7532, 'learning_rate': 1.56632362916459e-05, 'epoch': 0.66} {'loss': 0.5457, 'learning_rate': 1.566295938139296e-05, 'epoch': 0.66} {'loss': 0.4646, 'learning_rate': 1.566268246474761e-05, 'epoch': 0.66} {'loss': 0.5075, 'learning_rate': 1.566240554171018e-05, 'epoch': 0.66} {'loss': 0.5437, 'learning_rate': 1.566212861228096e-05, 'epoch': 0.66} {'loss': 0.4532, 'learning_rate': 1.5661851676460277e-05, 'epoch': 0.66} {'loss': 0.4881, 'learning_rate': 1.5661574734248445e-05, 'epoch': 0.66} {'loss': 0.6236, 'learning_rate': 1.5661297785645766e-05, 'epoch': 0.66} {'loss': 0.5068, 'learning_rate': 1.566102083065256e-05, 'epoch': 0.66} {'loss': 0.4782, 'learning_rate': 1.5660743869269136e-05, 'epoch': 0.66} {'loss': 0.5062, 'learning_rate': 1.566046690149581e-05, 'epoch': 0.66} {'loss': 0.6509, 'learning_rate': 1.5660189927332897e-05, 'epoch': 0.66} {'loss': 0.5647, 'learning_rate': 1.56599129467807e-05, 'epoch': 0.66} {'loss': 0.563, 'learning_rate': 1.5659635959839542e-05, 'epoch': 0.66} {'loss': 0.6517, 'learning_rate': 1.565935896650973e-05, 'epoch': 0.66} {'loss': 0.5629, 'learning_rate': 1.565908196679158e-05, 'epoch': 0.66} {'loss': 0.5473, 'learning_rate': 1.5658804960685396e-05, 'epoch': 0.66} {'loss': 0.6464, 'learning_rate': 1.5658527948191503e-05, 'epoch': 0.66} {'loss': 0.5577, 'learning_rate': 1.5658250929310206e-05, 'epoch': 0.66} {'loss': 0.6279, 'learning_rate': 1.565797390404182e-05, 'epoch': 0.66} {'loss': 0.5415, 'learning_rate': 1.5657696872386656e-05, 'epoch': 0.66} {'loss': 0.593, 'learning_rate': 1.565741983434503e-05, 'epoch': 0.66} {'loss': 0.5966, 'learning_rate': 1.5657142789917252e-05, 'epoch': 0.66} {'loss': 0.6084, 'learning_rate': 1.5656865739103636e-05, 'epoch': 0.66} {'loss': 0.5971, 'learning_rate': 1.5656588681904493e-05, 'epoch': 0.66} {'loss': 0.4927, 'learning_rate': 1.5656311618320138e-05, 'epoch': 0.66} {'loss': 0.4678, 'learning_rate': 1.5656034548350882e-05, 'epoch': 0.66} {'loss': 0.638, 'learning_rate': 1.565575747199704e-05, 'epoch': 0.66} {'loss': 0.6094, 'learning_rate': 1.5655480389258922e-05, 'epoch': 0.66} {'loss': 0.4457, 'learning_rate': 1.5655203300136842e-05, 'epoch': 0.66} {'loss': 0.7096, 'learning_rate': 1.5654926204631115e-05, 'epoch': 0.66} {'loss': 0.6978, 'learning_rate': 1.565464910274205e-05, 'epoch': 0.66} {'loss': 0.4863, 'learning_rate': 1.5654371994469963e-05, 'epoch': 0.66} {'loss': 0.6156, 'learning_rate': 1.5654094879815162e-05, 'epoch': 0.66} {'loss': 0.5377, 'learning_rate': 1.5653817758777964e-05, 'epoch': 0.66} {'loss': 0.6063, 'learning_rate': 1.5653540631358682e-05, 'epoch': 0.66} {'loss': 0.52, 'learning_rate': 1.565326349755763e-05, 'epoch': 0.66} {'loss': 0.5832, 'learning_rate': 1.5652986357375116e-05, 'epoch': 0.66} {'loss': 0.471, 'learning_rate': 1.5652709210811455e-05, 'epoch': 0.66} {'loss': 0.7459, 'learning_rate': 1.565243205786696e-05, 'epoch': 0.66} {'loss': 0.4648, 'learning_rate': 1.5652154898541946e-05, 'epoch': 0.66} {'loss': 0.5246, 'learning_rate': 1.5651877732836723e-05, 'epoch': 0.66} {'loss': 0.6606, 'learning_rate': 1.5651600560751604e-05, 'epoch': 0.66} {'loss': 0.6135, 'learning_rate': 1.56513233822869e-05, 'epoch': 0.66} {'loss': 0.4782, 'learning_rate': 1.565104619744293e-05, 'epoch': 0.66} {'loss': 0.4659, 'learning_rate': 1.5650769006220005e-05, 'epoch': 0.66} {'loss': 0.6812, 'learning_rate': 1.5650491808618435e-05, 'epoch': 0.66} {'loss': 0.6469, 'learning_rate': 1.565021460463853e-05, 'epoch': 0.66} {'loss': 0.6158, 'learning_rate': 1.5649937394280615e-05, 'epoch': 0.66} {'loss': 0.5311, 'learning_rate': 1.564966017754499e-05, 'epoch': 0.66} {'loss': 0.5356, 'learning_rate': 1.5649382954431972e-05, 'epoch': 0.66} {'loss': 0.4958, 'learning_rate': 1.564910572494188e-05, 'epoch': 0.66} {'loss': 0.6302, 'learning_rate': 1.5648828489075016e-05, 'epoch': 0.66} {'loss': 0.6515, 'learning_rate': 1.5648551246831703e-05, 'epoch': 0.66} {'loss': 0.6001, 'learning_rate': 1.564827399821225e-05, 'epoch': 0.66} {'loss': 0.6489, 'learning_rate': 1.5647996743216966e-05, 'epoch': 0.66} {'loss': 0.579, 'learning_rate': 1.5647719481846172e-05, 'epoch': 0.66} {'loss': 0.6102, 'learning_rate': 1.564744221410017e-05, 'epoch': 0.66} {'loss': 0.5874, 'learning_rate': 1.564716493997929e-05, 'epoch': 0.66} {'loss': 0.5749, 'learning_rate': 1.5646887659483826e-05, 'epoch': 0.66} {'loss': 0.5003, 'learning_rate': 1.56466103726141e-05, 'epoch': 0.66} {'loss': 0.4118, 'learning_rate': 1.564633307937043e-05, 'epoch': 0.66} {'loss': 0.7337, 'learning_rate': 1.564605577975312e-05, 'epoch': 0.66} {'loss': 0.6392, 'learning_rate': 1.5645778473762487e-05, 'epoch': 0.66} {'loss': 0.6146, 'learning_rate': 1.5645501161398842e-05, 'epoch': 0.66} {'loss': 0.5378, 'learning_rate': 1.56452238426625e-05, 'epoch': 0.66} {'loss': 0.5797, 'learning_rate': 1.564494651755378e-05, 'epoch': 0.66} {'loss': 0.4788, 'learning_rate': 1.5644669186072984e-05, 'epoch': 0.66} {'loss': 0.6144, 'learning_rate': 1.5644391848220427e-05, 'epoch': 0.66} {'loss': 0.5081, 'learning_rate': 1.5644114503996428e-05, 'epoch': 0.66} {'loss': 0.5239, 'learning_rate': 1.5643837153401298e-05, 'epoch': 0.66} {'loss': 0.6521, 'learning_rate': 1.5643559796435348e-05, 'epoch': 0.66} {'loss': 0.6521, 'learning_rate': 1.5643282433098894e-05, 'epoch': 0.66} {'loss': 0.5107, 'learning_rate': 1.5643005063392243e-05, 'epoch': 0.66} {'loss': 0.5506, 'learning_rate': 1.5642727687315716e-05, 'epoch': 0.66} {'loss': 0.3509, 'learning_rate': 1.5642450304869622e-05, 'epoch': 0.66} {'loss': 0.5133, 'learning_rate': 1.5642172916054275e-05, 'epoch': 0.66} {'loss': 0.5629, 'learning_rate': 1.564189552086998e-05, 'epoch': 0.66} {'loss': 0.5245, 'learning_rate': 1.5641618119317068e-05, 'epoch': 0.66} {'loss': 0.5753, 'learning_rate': 1.564134071139584e-05, 'epoch': 0.66} {'loss': 0.6515, 'learning_rate': 1.564106329710661e-05, 'epoch': 0.66} {'loss': 0.559, 'learning_rate': 1.564078587644969e-05, 'epoch': 0.66} {'loss': 0.5814, 'learning_rate': 1.5640508449425398e-05, 'epoch': 0.66} {'loss': 0.5621, 'learning_rate': 1.5640231016034044e-05, 'epoch': 0.66} {'loss': 0.5998, 'learning_rate': 1.5639953576275942e-05, 'epoch': 0.66} {'loss': 0.55, 'learning_rate': 1.5639676130151403e-05, 'epoch': 0.66} {'loss': 0.4363, 'learning_rate': 1.5639398677660743e-05, 'epoch': 0.66} {'loss': 0.4614, 'learning_rate': 1.5639121218804275e-05, 'epoch': 0.66} {'loss': 0.4782, 'learning_rate': 1.563884375358231e-05, 'epoch': 0.66} {'loss': 0.5287, 'learning_rate': 1.5638566281995164e-05, 'epoch': 0.66} {'loss': 0.5252, 'learning_rate': 1.5638288804043148e-05, 'epoch': 0.66} {'loss': 0.5432, 'learning_rate': 1.5638011319726577e-05, 'epoch': 0.66} {'loss': 0.7131, 'learning_rate': 1.5637733829045764e-05, 'epoch': 0.66} {'loss': 0.576, 'learning_rate': 1.5637456332001022e-05, 'epoch': 0.66} {'loss': 0.4673, 'learning_rate': 1.5637178828592664e-05, 'epoch': 0.66} {'loss': 0.6878, 'learning_rate': 1.5636901318820998e-05, 'epoch': 0.66} {'loss': 0.5682, 'learning_rate': 1.563662380268635e-05, 'epoch': 0.66} {'loss': 0.5846, 'learning_rate': 1.563634628018902e-05, 'epoch': 0.66} {'loss': 0.6697, 'learning_rate': 1.5636068751329324e-05, 'epoch': 0.66} {'loss': 0.7459, 'learning_rate': 1.5635791216107584e-05, 'epoch': 0.66} {'loss': 0.5342, 'learning_rate': 1.563551367452411e-05, 'epoch': 0.66} {'loss': 0.6448, 'learning_rate': 1.5635236126579205e-05, 'epoch': 0.66} {'loss': 0.4594, 'learning_rate': 1.5634958572273193e-05, 'epoch': 0.66} {'loss': 0.6628, 'learning_rate': 1.5634681011606384e-05, 'epoch': 0.66} {'loss': 0.6897, 'learning_rate': 1.5634403444579095e-05, 'epoch': 0.66} {'loss': 0.394, 'learning_rate': 1.5634125871191633e-05, 'epoch': 0.66} {'loss': 0.5821, 'learning_rate': 1.5633848291444315e-05, 'epoch': 0.66} {'loss': 0.6696, 'learning_rate': 1.5633570705337454e-05, 'epoch': 0.66} {'loss': 0.5174, 'learning_rate': 1.563329311287136e-05, 'epoch': 0.66} {'loss': 0.4821, 'learning_rate': 1.5633015514046354e-05, 'epoch': 0.66} {'loss': 0.5654, 'learning_rate': 1.5632737908862742e-05, 'epoch': 0.66} {'loss': 0.6143, 'learning_rate': 1.563246029732084e-05, 'epoch': 0.66} {'loss': 0.3561, 'learning_rate': 1.563218267942096e-05, 'epoch': 0.66} {'loss': 0.5815, 'learning_rate': 1.563190505516342e-05, 'epoch': 0.66} {'loss': 0.6246, 'learning_rate': 1.5631627424548527e-05, 'epoch': 0.66} {'loss': 0.5478, 'learning_rate': 1.56313497875766e-05, 'epoch': 0.66} {'loss': 0.6269, 'learning_rate': 1.563107214424795e-05, 'epoch': 0.66} {'loss': 0.7023, 'learning_rate': 1.563079449456289e-05, 'epoch': 0.66} {'loss': 0.586, 'learning_rate': 1.563051683852173e-05, 'epoch': 0.66} {'loss': 0.5968, 'learning_rate': 1.5630239176124792e-05, 'epoch': 0.66} {'loss': 0.5215, 'learning_rate': 1.562996150737238e-05, 'epoch': 0.66} {'loss': 0.6441, 'learning_rate': 1.5629683832264817e-05, 'epoch': 0.66} {'loss': 0.5242, 'learning_rate': 1.5629406150802408e-05, 'epoch': 0.66} {'loss': 0.6105, 'learning_rate': 1.5629128462985474e-05, 'epoch': 0.66} {'loss': 0.3946, 'learning_rate': 1.5628850768814322e-05, 'epoch': 0.66} {'loss': 0.6749, 'learning_rate': 1.5628573068289264e-05, 'epoch': 0.66} {'loss': 0.589, 'learning_rate': 1.5628295361410622e-05, 'epoch': 0.66} {'loss': 0.6974, 'learning_rate': 1.5628017648178705e-05, 'epoch': 0.66} {'loss': 0.5194, 'learning_rate': 1.5627739928593824e-05, 'epoch': 0.66} {'loss': 0.7608, 'learning_rate': 1.5627462202656297e-05, 'epoch': 0.66} {'loss': 0.4065, 'learning_rate': 1.5627184470366433e-05, 'epoch': 0.66} {'loss': 0.6833, 'learning_rate': 1.5626906731724547e-05, 'epoch': 0.66} {'loss': 0.4225, 'learning_rate': 1.5626628986730958e-05, 'epoch': 0.66} {'loss': 0.5566, 'learning_rate': 1.562635123538597e-05, 'epoch': 0.66} {'loss': 0.5437, 'learning_rate': 1.5626073477689905e-05, 'epoch': 0.66} {'loss': 0.6101, 'learning_rate': 1.562579571364307e-05, 'epoch': 0.66} {'loss': 0.4606, 'learning_rate': 1.562551794324578e-05, 'epoch': 0.66} {'loss': 0.519, 'learning_rate': 1.5625240166498356e-05, 'epoch': 0.66} {'loss': 0.5864, 'learning_rate': 1.56249623834011e-05, 'epoch': 0.66} {'loss': 0.5728, 'learning_rate': 1.5624684593954335e-05, 'epoch': 0.66} {'loss': 0.4423, 'learning_rate': 1.5624406798158366e-05, 'epoch': 0.66} {'loss': 0.6416, 'learning_rate': 1.562412899601352e-05, 'epoch': 0.66} {'loss': 0.3342, 'learning_rate': 1.562385118752009e-05, 'epoch': 0.66} {'loss': 0.6396, 'learning_rate': 1.562357337267841e-05, 'epoch': 0.66} {'loss': 0.4879, 'learning_rate': 1.5623295551488783e-05, 'epoch': 0.66} {'loss': 0.5685, 'learning_rate': 1.5623017723951527e-05, 'epoch': 0.66} {'loss': 0.603, 'learning_rate': 1.5622739890066946e-05, 'epoch': 0.66} {'loss': 0.5761, 'learning_rate': 1.5622462049835367e-05, 'epoch': 0.66} {'loss': 0.6595, 'learning_rate': 1.5622184203257096e-05, 'epoch': 0.66} {'loss': 0.6416, 'learning_rate': 1.562190635033245e-05, 'epoch': 0.66} {'loss': 0.5938, 'learning_rate': 1.5621628491061737e-05, 'epoch': 0.66} {'loss': 0.5247, 'learning_rate': 1.5621350625445275e-05, 'epoch': 0.66} {'loss': 0.5026, 'learning_rate': 1.5621072753483378e-05, 'epoch': 0.66} {'loss': 0.5647, 'learning_rate': 1.562079487517636e-05, 'epoch': 0.66} {'loss': 0.657, 'learning_rate': 1.562051699052453e-05, 'epoch': 0.66} {'loss': 0.8475, 'learning_rate': 1.562023909952821e-05, 'epoch': 0.66} {'loss': 0.5529, 'learning_rate': 1.561996120218771e-05, 'epoch': 0.66} {'loss': 0.608, 'learning_rate': 1.5619683298503337e-05, 'epoch': 0.66} {'loss': 0.5798, 'learning_rate': 1.561940538847541e-05, 'epoch': 0.66} {'loss': 0.6486, 'learning_rate': 1.5619127472104247e-05, 'epoch': 0.66} {'loss': 0.5755, 'learning_rate': 1.5618849549390155e-05, 'epoch': 0.66} {'loss': 0.5731, 'learning_rate': 1.561857162033345e-05, 'epoch': 0.66} {'loss': 0.5329, 'learning_rate': 1.5618293684934446e-05, 'epoch': 0.66} {'loss': 0.6369, 'learning_rate': 1.561801574319346e-05, 'epoch': 0.66} {'loss': 0.6021, 'learning_rate': 1.56177377951108e-05, 'epoch': 0.66} {'loss': 0.6073, 'learning_rate': 1.5617459840686782e-05, 'epoch': 0.66} {'loss': 0.5596, 'learning_rate': 1.561718187992172e-05, 'epoch': 0.66} {'loss': 0.4171, 'learning_rate': 1.561690391281593e-05, 'epoch': 0.66} {'loss': 0.5323, 'learning_rate': 1.561662593936972e-05, 'epoch': 0.66} {'loss': 0.4651, 'learning_rate': 1.5616347959583412e-05, 'epoch': 0.66} {'loss': 0.4885, 'learning_rate': 1.561606997345731e-05, 'epoch': 0.66} {'loss': 0.5441, 'learning_rate': 1.5615791980991736e-05, 'epoch': 0.66} {'loss': 0.7056, 'learning_rate': 1.5615513982187e-05, 'epoch': 0.66} {'loss': 0.4938, 'learning_rate': 1.5615235977043416e-05, 'epoch': 0.66} {'loss': 0.562, 'learning_rate': 1.5614957965561298e-05, 'epoch': 0.66} {'loss': 0.6449, 'learning_rate': 1.5614679947740964e-05, 'epoch': 0.66} {'loss': 0.6785, 'learning_rate': 1.561440192358272e-05, 'epoch': 0.66} {'loss': 0.679, 'learning_rate': 1.5614123893086884e-05, 'epoch': 0.66} {'loss': 0.7069, 'learning_rate': 1.561384585625377e-05, 'epoch': 0.66} {'loss': 0.6759, 'learning_rate': 1.5613567813083696e-05, 'epoch': 0.66} {'loss': 0.709, 'learning_rate': 1.5613289763576968e-05, 'epoch': 0.66} {'loss': 0.5922, 'learning_rate': 1.56130117077339e-05, 'epoch': 0.66} {'loss': 0.5889, 'learning_rate': 1.5612733645554815e-05, 'epoch': 0.66} {'loss': 0.4584, 'learning_rate': 1.5612455577040017e-05, 'epoch': 0.66} {'loss': 0.5811, 'learning_rate': 1.5612177502189825e-05, 'epoch': 0.66} {'loss': 0.5547, 'learning_rate': 1.5611899421004553e-05, 'epoch': 0.66} {'loss': 0.6585, 'learning_rate': 1.5611621333484514e-05, 'epoch': 0.66} {'loss': 0.5489, 'learning_rate': 1.561134323963002e-05, 'epoch': 0.66} {'loss': 0.6094, 'learning_rate': 1.5611065139441387e-05, 'epoch': 0.66} {'loss': 0.453, 'learning_rate': 1.5610787032918927e-05, 'epoch': 0.66} {'loss': 0.7184, 'learning_rate': 1.5610508920062957e-05, 'epoch': 0.66} {'loss': 0.6297, 'learning_rate': 1.5610230800873786e-05, 'epoch': 0.66} {'loss': 0.6175, 'learning_rate': 1.5609952675351736e-05, 'epoch': 0.66} {'loss': 0.611, 'learning_rate': 1.5609674543497115e-05, 'epoch': 0.66} {'loss': 0.6108, 'learning_rate': 1.5609396405310238e-05, 'epoch': 0.66} {'loss': 0.3822, 'learning_rate': 1.560911826079142e-05, 'epoch': 0.66} {'loss': 0.6956, 'learning_rate': 1.560884010994097e-05, 'epoch': 0.66} {'loss': 0.5764, 'learning_rate': 1.5608561952759212e-05, 'epoch': 0.66} {'loss': 0.6843, 'learning_rate': 1.560828378924645e-05, 'epoch': 0.66} {'loss': 0.5695, 'learning_rate': 1.5608005619403004e-05, 'epoch': 0.66} {'loss': 0.7227, 'learning_rate': 1.5607727443229187e-05, 'epoch': 0.66} {'loss': 0.6126, 'learning_rate': 1.560744926072531e-05, 'epoch': 0.66} {'loss': 0.6097, 'learning_rate': 1.5607171071891687e-05, 'epoch': 0.66} {'loss': 0.5827, 'learning_rate': 1.5606892876728638e-05, 'epoch': 0.66} {'loss': 0.5765, 'learning_rate': 1.560661467523647e-05, 'epoch': 0.66} {'loss': 0.5705, 'learning_rate': 1.5606336467415503e-05, 'epoch': 0.66} {'loss': 0.5277, 'learning_rate': 1.5606058253266048e-05, 'epoch': 0.66} {'loss': 0.5705, 'learning_rate': 1.560578003278842e-05, 'epoch': 0.66} {'loss': 0.714, 'learning_rate': 1.5605501805982926e-05, 'epoch': 0.66} {'loss': 0.5295, 'learning_rate': 1.5605223572849894e-05, 'epoch': 0.66} {'loss': 0.6122, 'learning_rate': 1.5604945333389624e-05, 'epoch': 0.66} {'loss': 0.6329, 'learning_rate': 1.560466708760244e-05, 'epoch': 0.66} {'loss': 0.6062, 'learning_rate': 1.5604388835488654e-05, 'epoch': 0.66} {'loss': 0.6413, 'learning_rate': 1.5604110577048577e-05, 'epoch': 0.66} {'loss': 0.5455, 'learning_rate': 1.5603832312282527e-05, 'epoch': 0.66} {'loss': 0.4771, 'learning_rate': 1.5603554041190814e-05, 'epoch': 0.66} {'loss': 0.5759, 'learning_rate': 1.5603275763773754e-05, 'epoch': 0.66} {'loss': 0.6113, 'learning_rate': 1.5602997480031662e-05, 'epoch': 0.66} {'loss': 0.5678, 'learning_rate': 1.560271918996485e-05, 'epoch': 0.66} {'loss': 0.5473, 'learning_rate': 1.5602440893573634e-05, 'epoch': 0.66} {'loss': 0.6155, 'learning_rate': 1.5602162590858326e-05, 'epoch': 0.66} {'loss': 0.5495, 'learning_rate': 1.5601884281819242e-05, 'epoch': 0.66} {'loss': 0.5673, 'learning_rate': 1.5601605966456702e-05, 'epoch': 0.66} {'loss': 0.6505, 'learning_rate': 1.5601327644771007e-05, 'epoch': 0.66} {'loss': 0.4863, 'learning_rate': 1.560104931676248e-05, 'epoch': 0.66} {'loss': 0.6827, 'learning_rate': 1.5600770982431438e-05, 'epoch': 0.66} {'loss': 0.4945, 'learning_rate': 1.560049264177818e-05, 'epoch': 0.66} {'loss': 0.6258, 'learning_rate': 1.560021429480304e-05, 'epoch': 0.66} {'loss': 0.6788, 'learning_rate': 1.559993594150632e-05, 'epoch': 0.66} {'loss': 0.5993, 'learning_rate': 1.559965758188834e-05, 'epoch': 0.66} {'loss': 0.6002, 'learning_rate': 1.5599379215949408e-05, 'epoch': 0.66} {'loss': 0.4258, 'learning_rate': 1.559910084368984e-05, 'epoch': 0.66} {'loss': 0.4141, 'learning_rate': 1.5598822465109956e-05, 'epoch': 0.66} {'loss': 0.4638, 'learning_rate': 1.5598544080210066e-05, 'epoch': 0.66} {'loss': 0.5556, 'learning_rate': 1.559826568899048e-05, 'epoch': 0.66} {'loss': 0.4348, 'learning_rate': 1.559798729145152e-05, 'epoch': 0.66} {'loss': 0.6206, 'learning_rate': 1.55977088875935e-05, 'epoch': 0.66} {'loss': 0.5993, 'learning_rate': 1.5597430477416727e-05, 'epoch': 0.66} {'loss': 0.5801, 'learning_rate': 1.559715206092152e-05, 'epoch': 0.66} {'loss': 0.6599, 'learning_rate': 1.559687363810819e-05, 'epoch': 0.66} {'loss': 0.5102, 'learning_rate': 1.559659520897706e-05, 'epoch': 0.66} {'loss': 0.5229, 'learning_rate': 1.5596316773528433e-05, 'epoch': 0.66} {'loss': 0.602, 'learning_rate': 1.559603833176263e-05, 'epoch': 0.66} {'loss': 0.649, 'learning_rate': 1.5595759883679965e-05, 'epoch': 0.66} {'loss': 0.6181, 'learning_rate': 1.559548142928075e-05, 'epoch': 0.66} {'loss': 0.531, 'learning_rate': 1.55952029685653e-05, 'epoch': 0.66} {'loss': 0.6118, 'learning_rate': 1.559492450153393e-05, 'epoch': 0.66} {'loss': 0.7327, 'learning_rate': 1.5594646028186957e-05, 'epoch': 0.66} {'loss': 0.5216, 'learning_rate': 1.559436754852469e-05, 'epoch': 0.66} {'loss': 0.6454, 'learning_rate': 1.5594089062547447e-05, 'epoch': 0.66} {'loss': 0.531, 'learning_rate': 1.559381057025554e-05, 'epoch': 0.66} {'loss': 0.6088, 'learning_rate': 1.5593532071649284e-05, 'epoch': 0.66} {'loss': 0.4673, 'learning_rate': 1.5593253566728996e-05, 'epoch': 0.66} {'loss': 0.4568, 'learning_rate': 1.5592975055494986e-05, 'epoch': 0.66} {'loss': 0.6041, 'learning_rate': 1.5592696537947572e-05, 'epoch': 0.66} {'loss': 0.5494, 'learning_rate': 1.559241801408707e-05, 'epoch': 0.67} {'loss': 0.6433, 'learning_rate': 1.5592139483913788e-05, 'epoch': 0.67} {'loss': 0.5652, 'learning_rate': 1.5591860947428045e-05, 'epoch': 0.67} {'loss': 0.6495, 'learning_rate': 1.5591582404630152e-05, 'epoch': 0.67} {'loss': 0.4363, 'learning_rate': 1.5591303855520427e-05, 'epoch': 0.67} {'loss': 0.5663, 'learning_rate': 1.5591025300099184e-05, 'epoch': 0.67} {'loss': 0.5464, 'learning_rate': 1.5590746738366737e-05, 'epoch': 0.67} {'loss': 0.6433, 'learning_rate': 1.55904681703234e-05, 'epoch': 0.67} {'loss': 0.6575, 'learning_rate': 1.5590189595969487e-05, 'epoch': 0.67} {'loss': 0.648, 'learning_rate': 1.5589911015305314e-05, 'epoch': 0.67} {'loss': 0.4901, 'learning_rate': 1.5589632428331193e-05, 'epoch': 0.67} {'loss': 0.6914, 'learning_rate': 1.558935383504744e-05, 'epoch': 0.67} {'loss': 0.6151, 'learning_rate': 1.558907523545437e-05, 'epoch': 0.67} {'loss': 0.5874, 'learning_rate': 1.5588796629552296e-05, 'epoch': 0.67} {'loss': 0.4898, 'learning_rate': 1.5588518017341533e-05, 'epoch': 0.67} {'loss': 0.4165, 'learning_rate': 1.5588239398822398e-05, 'epoch': 0.67} {'loss': 0.5171, 'learning_rate': 1.5587960773995205e-05, 'epoch': 0.67} {'loss': 0.6164, 'learning_rate': 1.5587682142860262e-05, 'epoch': 0.67} {'loss': 0.6163, 'learning_rate': 1.558740350541789e-05, 'epoch': 0.67} {'loss': 0.6296, 'learning_rate': 1.55871248616684e-05, 'epoch': 0.67} {'loss': 0.5288, 'learning_rate': 1.558684621161211e-05, 'epoch': 0.67} {'loss': 0.6588, 'learning_rate': 1.5586567555249335e-05, 'epoch': 0.67} {'loss': 0.6149, 'learning_rate': 1.5586288892580386e-05, 'epoch': 0.67} {'loss': 0.4731, 'learning_rate': 1.558601022360558e-05, 'epoch': 0.67} {'loss': 0.4747, 'learning_rate': 1.558573154832523e-05, 'epoch': 0.67} {'loss': 0.5474, 'learning_rate': 1.5585452866739654e-05, 'epoch': 0.67} {'loss': 0.3858, 'learning_rate': 1.5585174178849157e-05, 'epoch': 0.67} {'loss': 0.5351, 'learning_rate': 1.558489548465407e-05, 'epoch': 0.67} {'loss': 0.6153, 'learning_rate': 1.558461678415469e-05, 'epoch': 0.67} {'loss': 0.5437, 'learning_rate': 1.5584338077351343e-05, 'epoch': 0.67} {'loss': 0.5401, 'learning_rate': 1.558405936424434e-05, 'epoch': 0.67} {'loss': 0.6562, 'learning_rate': 1.5583780644833996e-05, 'epoch': 0.67} {'loss': 0.6588, 'learning_rate': 1.558350191912062e-05, 'epoch': 0.67} {'loss': 0.4624, 'learning_rate': 1.5583223187104543e-05, 'epoch': 0.67} {'loss': 0.4145, 'learning_rate': 1.558294444878606e-05, 'epoch': 0.67} {'loss': 0.4931, 'learning_rate': 1.55826657041655e-05, 'epoch': 0.67} {'loss': 0.5849, 'learning_rate': 1.5582386953243168e-05, 'epoch': 0.67} {'loss': 0.5057, 'learning_rate': 1.5582108196019382e-05, 'epoch': 0.67} {'loss': 0.6212, 'learning_rate': 1.558182943249446e-05, 'epoch': 0.67} {'loss': 0.644, 'learning_rate': 1.5581550662668715e-05, 'epoch': 0.67} {'loss': 0.589, 'learning_rate': 1.5581271886542457e-05, 'epoch': 0.67} {'loss': 0.5954, 'learning_rate': 1.5580993104116005e-05, 'epoch': 0.67} {'loss': 0.6447, 'learning_rate': 1.5580714315389675e-05, 'epoch': 0.67} {'loss': 0.4679, 'learning_rate': 1.5580435520363778e-05, 'epoch': 0.67} {'loss': 0.5453, 'learning_rate': 1.5580156719038635e-05, 'epoch': 0.67} {'loss': 0.5794, 'learning_rate': 1.557987791141455e-05, 'epoch': 0.67} {'loss': 0.517, 'learning_rate': 1.557959909749185e-05, 'epoch': 0.67} {'loss': 0.5707, 'learning_rate': 1.5579320277270838e-05, 'epoch': 0.67} {'loss': 0.6184, 'learning_rate': 1.557904145075184e-05, 'epoch': 0.67} {'loss': 0.5765, 'learning_rate': 1.5578762617935157e-05, 'epoch': 0.67} {'loss': 0.5247, 'learning_rate': 1.557848377882112e-05, 'epoch': 0.67} {'loss': 0.5508, 'learning_rate': 1.5578204933410027e-05, 'epoch': 0.67} {'loss': 0.6297, 'learning_rate': 1.557792608170221e-05, 'epoch': 0.67} {'loss': 0.524, 'learning_rate': 1.5577647223697973e-05, 'epoch': 0.67} {'loss': 0.5391, 'learning_rate': 1.5577368359397628e-05, 'epoch': 0.67} {'loss': 0.5833, 'learning_rate': 1.55770894888015e-05, 'epoch': 0.67} {'loss': 0.5543, 'learning_rate': 1.5576810611909896e-05, 'epoch': 0.67} {'loss': 0.422, 'learning_rate': 1.5576531728723133e-05, 'epoch': 0.67} {'loss': 0.5667, 'learning_rate': 1.557625283924153e-05, 'epoch': 0.67} {'loss': 0.62, 'learning_rate': 1.5575973943465396e-05, 'epoch': 0.67} {'loss': 0.6387, 'learning_rate': 1.5575695041395046e-05, 'epoch': 0.67} {'loss': 0.54, 'learning_rate': 1.5575416133030797e-05, 'epoch': 0.67} {'loss': 0.573, 'learning_rate': 1.557513721837296e-05, 'epoch': 0.67} {'loss': 0.552, 'learning_rate': 1.557485829742186e-05, 'epoch': 0.67} {'loss': 0.6767, 'learning_rate': 1.5574579370177803e-05, 'epoch': 0.67} {'loss': 0.4746, 'learning_rate': 1.5574300436641104e-05, 'epoch': 0.67} {'loss': 0.7049, 'learning_rate': 1.5574021496812082e-05, 'epoch': 0.67} {'loss': 0.6264, 'learning_rate': 1.5573742550691045e-05, 'epoch': 0.67} {'loss': 0.6501, 'learning_rate': 1.557346359827832e-05, 'epoch': 0.67} {'loss': 0.627, 'learning_rate': 1.5573184639574207e-05, 'epoch': 0.67} {'loss': 0.4789, 'learning_rate': 1.557290567457903e-05, 'epoch': 0.67} {'loss': 0.6741, 'learning_rate': 1.5572626703293105e-05, 'epoch': 0.67} {'loss': 0.6941, 'learning_rate': 1.5572347725716747e-05, 'epoch': 0.67} {'loss': 0.6114, 'learning_rate': 1.557206874185026e-05, 'epoch': 0.67} {'loss': 0.673, 'learning_rate': 1.5571789751693974e-05, 'epoch': 0.67} {'loss': 0.6306, 'learning_rate': 1.5571510755248195e-05, 'epoch': 0.67} {'loss': 0.6039, 'learning_rate': 1.5571231752513238e-05, 'epoch': 0.67} {'loss': 0.6518, 'learning_rate': 1.557095274348942e-05, 'epoch': 0.67} {'loss': 0.6945, 'learning_rate': 1.5570673728177056e-05, 'epoch': 0.67} {'loss': 0.6713, 'learning_rate': 1.5570394706576463e-05, 'epoch': 0.67} {'loss': 0.5912, 'learning_rate': 1.557011567868795e-05, 'epoch': 0.67} {'loss': 0.5856, 'learning_rate': 1.5569836644511838e-05, 'epoch': 0.67} {'loss': 0.7062, 'learning_rate': 1.556955760404844e-05, 'epoch': 0.67} {'loss': 0.4879, 'learning_rate': 1.556927855729807e-05, 'epoch': 0.67} {'loss': 0.5248, 'learning_rate': 1.556899950426104e-05, 'epoch': 0.67} {'loss': 0.6598, 'learning_rate': 1.5568720444937673e-05, 'epoch': 0.67} {'loss': 0.5708, 'learning_rate': 1.556844137932828e-05, 'epoch': 0.67} {'loss': 0.5657, 'learning_rate': 1.5568162307433174e-05, 'epoch': 0.67} {'loss': 0.4377, 'learning_rate': 1.556788322925267e-05, 'epoch': 0.67} {'loss': 0.5985, 'learning_rate': 1.5567604144787086e-05, 'epoch': 0.67} {'loss': 0.3871, 'learning_rate': 1.5567325054036735e-05, 'epoch': 0.67} {'loss': 0.6123, 'learning_rate': 1.5567045957001932e-05, 'epoch': 0.67} {'loss': 0.5521, 'learning_rate': 1.5566766853682995e-05, 'epoch': 0.67} {'loss': 0.5839, 'learning_rate': 1.5566487744080238e-05, 'epoch': 0.67} {'loss': 0.8352, 'learning_rate': 1.556620862819397e-05, 'epoch': 0.67} {'loss': 0.4391, 'learning_rate': 1.5565929506024515e-05, 'epoch': 0.67} {'loss': 0.6453, 'learning_rate': 1.5565650377572182e-05, 'epoch': 0.67} {'loss': 0.5331, 'learning_rate': 1.5565371242837288e-05, 'epoch': 0.67} {'loss': 0.666, 'learning_rate': 1.556509210182015e-05, 'epoch': 0.67} {'loss': 0.6385, 'learning_rate': 1.556481295452108e-05, 'epoch': 0.67} {'loss': 0.5645, 'learning_rate': 1.5564533800940393e-05, 'epoch': 0.67} {'loss': 0.6706, 'learning_rate': 1.5564254641078408e-05, 'epoch': 0.67} {'loss': 0.5608, 'learning_rate': 1.5563975474935436e-05, 'epoch': 0.67} {'loss': 0.5164, 'learning_rate': 1.5563696302511793e-05, 'epoch': 0.67} {'loss': 0.5919, 'learning_rate': 1.5563417123807798e-05, 'epoch': 0.67} {'loss': 0.4072, 'learning_rate': 1.556313793882376e-05, 'epoch': 0.67} {'loss': 0.4965, 'learning_rate': 1.556285874756e-05, 'epoch': 0.67} {'loss': 0.661, 'learning_rate': 1.5562579550016828e-05, 'epoch': 0.67} {'loss': 0.5158, 'learning_rate': 1.5562300346194565e-05, 'epoch': 0.67} {'loss': 0.7504, 'learning_rate': 1.5562021136093517e-05, 'epoch': 0.67} {'loss': 0.5592, 'learning_rate': 1.5561741919714008e-05, 'epoch': 0.67} {'loss': 0.5637, 'learning_rate': 1.5561462697056348e-05, 'epoch': 0.67} {'loss': 0.7198, 'learning_rate': 1.556118346812086e-05, 'epoch': 0.67} {'loss': 0.5615, 'learning_rate': 1.5560904232907846e-05, 'epoch': 0.67} {'loss': 0.3711, 'learning_rate': 1.556062499141763e-05, 'epoch': 0.67} {'loss': 0.6095, 'learning_rate': 1.556034574365053e-05, 'epoch': 0.67} {'loss': 0.547, 'learning_rate': 1.5560066489606854e-05, 'epoch': 0.67} {'loss': 0.4593, 'learning_rate': 1.555978722928692e-05, 'epoch': 0.67} {'loss': 0.5741, 'learning_rate': 1.5559507962691042e-05, 'epoch': 0.67} {'loss': 0.5564, 'learning_rate': 1.5559228689819544e-05, 'epoch': 0.67} {'loss': 0.6993, 'learning_rate': 1.5558949410672725e-05, 'epoch': 0.67} {'loss': 0.5609, 'learning_rate': 1.5558670125250913e-05, 'epoch': 0.67} {'loss': 0.6135, 'learning_rate': 1.555839083355442e-05, 'epoch': 0.67} {'loss': 0.51, 'learning_rate': 1.555811153558356e-05, 'epoch': 0.67} {'loss': 0.7357, 'learning_rate': 1.5557832231338646e-05, 'epoch': 0.67} {'loss': 0.7312, 'learning_rate': 1.555755292082e-05, 'epoch': 0.67} {'loss': 0.5553, 'learning_rate': 1.5557273604027936e-05, 'epoch': 0.67} {'loss': 0.4221, 'learning_rate': 1.5556994280962764e-05, 'epoch': 0.67} {'loss': 0.5641, 'learning_rate': 1.55567149516248e-05, 'epoch': 0.67} {'loss': 0.7899, 'learning_rate': 1.5556435616014365e-05, 'epoch': 0.67} {'loss': 0.5636, 'learning_rate': 1.555615627413177e-05, 'epoch': 0.67} {'loss': 0.4863, 'learning_rate': 1.5555876925977328e-05, 'epoch': 0.67} {'loss': 0.6428, 'learning_rate': 1.555559757155136e-05, 'epoch': 0.67} {'loss': 0.5978, 'learning_rate': 1.5555318210854177e-05, 'epoch': 0.67} {'loss': 0.644, 'learning_rate': 1.5555038843886098e-05, 'epoch': 0.67} {'loss': 0.7533, 'learning_rate': 1.5554759470647437e-05, 'epoch': 0.67} {'loss': 0.7437, 'learning_rate': 1.555448009113851e-05, 'epoch': 0.67} {'loss': 0.6395, 'learning_rate': 1.5554200705359627e-05, 'epoch': 0.67} {'loss': 0.6072, 'learning_rate': 1.5553921313311112e-05, 'epoch': 0.67} {'loss': 0.4934, 'learning_rate': 1.5553641914993272e-05, 'epoch': 0.67} {'loss': 0.5117, 'learning_rate': 1.555336251040643e-05, 'epoch': 0.67} {'loss': 0.6583, 'learning_rate': 1.5553083099550893e-05, 'epoch': 0.67} {'loss': 0.5522, 'learning_rate': 1.5552803682426988e-05, 'epoch': 0.67} {'loss': 0.5734, 'learning_rate': 1.5552524259035018e-05, 'epoch': 0.67} {'loss': 0.5207, 'learning_rate': 1.5552244829375306e-05, 'epoch': 0.67} {'loss': 0.564, 'learning_rate': 1.5551965393448166e-05, 'epoch': 0.67} {'loss': 0.6023, 'learning_rate': 1.555168595125391e-05, 'epoch': 0.67} {'loss': 0.6207, 'learning_rate': 1.555140650279286e-05, 'epoch': 0.67} {'loss': 0.6969, 'learning_rate': 1.5551127048065323e-05, 'epoch': 0.67} {'loss': 0.548, 'learning_rate': 1.5550847587071626e-05, 'epoch': 0.67} {'loss': 0.5664, 'learning_rate': 1.5550568119812074e-05, 'epoch': 0.67} {'loss': 0.4661, 'learning_rate': 1.5550288646286985e-05, 'epoch': 0.67} {'loss': 0.451, 'learning_rate': 1.5550009166496675e-05, 'epoch': 0.67} {'loss': 0.5934, 'learning_rate': 1.5549729680441462e-05, 'epoch': 0.67} {'loss': 0.5544, 'learning_rate': 1.5549450188121658e-05, 'epoch': 0.67} {'loss': 0.589, 'learning_rate': 1.554917068953758e-05, 'epoch': 0.67} {'loss': 0.6591, 'learning_rate': 1.5548891184689545e-05, 'epoch': 0.67} {'loss': 0.7328, 'learning_rate': 1.5548611673577868e-05, 'epoch': 0.67} {'loss': 0.5532, 'learning_rate': 1.5548332156202863e-05, 'epoch': 0.67} {'loss': 0.5992, 'learning_rate': 1.5548052632564842e-05, 'epoch': 0.67} {'loss': 0.5395, 'learning_rate': 1.5547773102664127e-05, 'epoch': 0.67} {'loss': 0.658, 'learning_rate': 1.554749356650103e-05, 'epoch': 0.67} {'loss': 0.5485, 'learning_rate': 1.5547214024075872e-05, 'epoch': 0.67} {'loss': 0.6786, 'learning_rate': 1.5546934475388963e-05, 'epoch': 0.67} {'loss': 0.5619, 'learning_rate': 1.5546654920440616e-05, 'epoch': 0.67} {'loss': 0.5188, 'learning_rate': 1.5546375359231154e-05, 'epoch': 0.67} {'loss': 0.5124, 'learning_rate': 1.5546095791760886e-05, 'epoch': 0.67} {'loss': 0.7133, 'learning_rate': 1.5545816218030133e-05, 'epoch': 0.67} {'loss': 0.6093, 'learning_rate': 1.5545536638039206e-05, 'epoch': 0.67} {'loss': 0.5951, 'learning_rate': 1.5545257051788422e-05, 'epoch': 0.67} {'loss': 0.6081, 'learning_rate': 1.5544977459278098e-05, 'epoch': 0.67} {'loss': 0.6195, 'learning_rate': 1.5544697860508553e-05, 'epoch': 0.67} {'loss': 0.5083, 'learning_rate': 1.5544418255480094e-05, 'epoch': 0.67} {'loss': 0.4734, 'learning_rate': 1.5544138644193042e-05, 'epoch': 0.67} {'loss': 0.4666, 'learning_rate': 1.5543859026647714e-05, 'epoch': 0.67} {'loss': 0.4145, 'learning_rate': 1.554357940284442e-05, 'epoch': 0.67} {'loss': 0.579, 'learning_rate': 1.5543299772783484e-05, 'epoch': 0.67} {'loss': 0.7226, 'learning_rate': 1.5543020136465212e-05, 'epoch': 0.67} {'loss': 0.7128, 'learning_rate': 1.5542740493889925e-05, 'epoch': 0.67} {'loss': 0.542, 'learning_rate': 1.5542460845057937e-05, 'epoch': 0.67} {'loss': 0.5913, 'learning_rate': 1.5542181189969568e-05, 'epoch': 0.67} {'loss': 0.528, 'learning_rate': 1.5541901528625128e-05, 'epoch': 0.67} {'loss': 0.558, 'learning_rate': 1.5541621861024937e-05, 'epoch': 0.67} {'loss': 0.6162, 'learning_rate': 1.5541342187169305e-05, 'epoch': 0.67} {'loss': 0.5395, 'learning_rate': 1.5541062507058553e-05, 'epoch': 0.67} {'loss': 0.6231, 'learning_rate': 1.5540782820692997e-05, 'epoch': 0.67} {'loss': 0.3932, 'learning_rate': 1.554050312807295e-05, 'epoch': 0.67} {'loss': 0.5641, 'learning_rate': 1.554022342919873e-05, 'epoch': 0.67} {'loss': 0.4507, 'learning_rate': 1.5539943724070646e-05, 'epoch': 0.67} {'loss': 0.5056, 'learning_rate': 1.5539664012689026e-05, 'epoch': 0.67} {'loss': 0.5285, 'learning_rate': 1.5539384295054175e-05, 'epoch': 0.67} {'loss': 0.5501, 'learning_rate': 1.553910457116641e-05, 'epoch': 0.67} {'loss': 0.6226, 'learning_rate': 1.5538824841026054e-05, 'epoch': 0.67} {'loss': 0.5941, 'learning_rate': 1.5538545104633414e-05, 'epoch': 0.67} {'loss': 0.5286, 'learning_rate': 1.5538265361988814e-05, 'epoch': 0.67} {'loss': 0.4707, 'learning_rate': 1.5537985613092562e-05, 'epoch': 0.67} {'loss': 0.585, 'learning_rate': 1.553770585794498e-05, 'epoch': 0.67} {'loss': 0.5258, 'learning_rate': 1.5537426096546376e-05, 'epoch': 0.67} {'loss': 0.4635, 'learning_rate': 1.5537146328897076e-05, 'epoch': 0.67} {'loss': 0.4977, 'learning_rate': 1.553686655499739e-05, 'epoch': 0.67} {'loss': 0.528, 'learning_rate': 1.5536586774847635e-05, 'epoch': 0.67} {'loss': 0.5503, 'learning_rate': 1.5536306988448125e-05, 'epoch': 0.67} {'loss': 0.4732, 'learning_rate': 1.5536027195799176e-05, 'epoch': 0.67} {'loss': 0.6752, 'learning_rate': 1.553574739690111e-05, 'epoch': 0.67} {'loss': 0.6488, 'learning_rate': 1.5535467591754232e-05, 'epoch': 0.67} {'loss': 0.5493, 'learning_rate': 1.553518778035887e-05, 'epoch': 0.67} {'loss': 0.5945, 'learning_rate': 1.553490796271533e-05, 'epoch': 0.67} {'loss': 0.5387, 'learning_rate': 1.5534628138823928e-05, 'epoch': 0.67} {'loss': 0.5815, 'learning_rate': 1.553434830868499e-05, 'epoch': 0.67} {'loss': 0.4973, 'learning_rate': 1.553406847229882e-05, 'epoch': 0.67} {'loss': 0.6194, 'learning_rate': 1.5533788629665737e-05, 'epoch': 0.67} {'loss': 0.5817, 'learning_rate': 1.5533508780786065e-05, 'epoch': 0.67} {'loss': 0.52, 'learning_rate': 1.553322892566011e-05, 'epoch': 0.67} {'loss': 0.5353, 'learning_rate': 1.5532949064288194e-05, 'epoch': 0.67} {'loss': 0.6271, 'learning_rate': 1.5532669196670628e-05, 'epoch': 0.67} {'loss': 0.5577, 'learning_rate': 1.5532389322807736e-05, 'epoch': 0.67} {'loss': 0.5624, 'learning_rate': 1.5532109442699823e-05, 'epoch': 0.67} {'loss': 0.4183, 'learning_rate': 1.553182955634721e-05, 'epoch': 0.67} {'loss': 0.6787, 'learning_rate': 1.5531549663750216e-05, 'epoch': 0.67} {'loss': 0.5086, 'learning_rate': 1.5531269764909153e-05, 'epoch': 0.67} {'loss': 0.6635, 'learning_rate': 1.5530989859824338e-05, 'epoch': 0.67} {'loss': 0.5183, 'learning_rate': 1.553070994849609e-05, 'epoch': 0.67} {'loss': 0.5025, 'learning_rate': 1.553043003092472e-05, 'epoch': 0.67} {'loss': 0.4709, 'learning_rate': 1.5530150107110547e-05, 'epoch': 0.67} {'loss': 0.5792, 'learning_rate': 1.5529870177053887e-05, 'epoch': 0.67} {'loss': 0.4479, 'learning_rate': 1.552959024075505e-05, 'epoch': 0.67} {'loss': 0.6315, 'learning_rate': 1.5529310298214362e-05, 'epoch': 0.67} {'loss': 0.5457, 'learning_rate': 1.5529030349432135e-05, 'epoch': 0.67} {'loss': 0.4877, 'learning_rate': 1.5528750394408684e-05, 'epoch': 0.67} {'loss': 0.7314, 'learning_rate': 1.552847043314432e-05, 'epoch': 0.67} {'loss': 0.4358, 'learning_rate': 1.552819046563937e-05, 'epoch': 0.67} {'loss': 0.5783, 'learning_rate': 1.552791049189414e-05, 'epoch': 0.67} {'loss': 0.4514, 'learning_rate': 1.5527630511908955e-05, 'epoch': 0.67} {'loss': 0.7041, 'learning_rate': 1.552735052568412e-05, 'epoch': 0.67} {'loss': 0.7716, 'learning_rate': 1.552707053321996e-05, 'epoch': 0.67} {'loss': 0.4683, 'learning_rate': 1.552679053451679e-05, 'epoch': 0.67} {'loss': 0.5092, 'learning_rate': 1.5526510529574924e-05, 'epoch': 0.67} {'loss': 0.7101, 'learning_rate': 1.552623051839468e-05, 'epoch': 0.67} {'loss': 0.7394, 'learning_rate': 1.552595050097637e-05, 'epoch': 0.67} {'loss': 0.7304, 'learning_rate': 1.5525670477320312e-05, 'epoch': 0.67} {'loss': 0.7335, 'learning_rate': 1.5525390447426826e-05, 'epoch': 0.67} {'loss': 0.5162, 'learning_rate': 1.5525110411296223e-05, 'epoch': 0.67} {'loss': 0.5665, 'learning_rate': 1.552483036892882e-05, 'epoch': 0.67} {'loss': 0.6426, 'learning_rate': 1.5524550320324937e-05, 'epoch': 0.67} {'loss': 0.6603, 'learning_rate': 1.5524270265484884e-05, 'epoch': 0.67} {'loss': 0.6531, 'learning_rate': 1.5523990204408984e-05, 'epoch': 0.67} {'loss': 0.6499, 'learning_rate': 1.5523710137097547e-05, 'epoch': 0.67} {'loss': 0.5917, 'learning_rate': 1.552343006355089e-05, 'epoch': 0.67} {'loss': 0.4436, 'learning_rate': 1.552314998376933e-05, 'epoch': 0.67} {'loss': 0.609, 'learning_rate': 1.5522869897753187e-05, 'epoch': 0.67} {'loss': 0.6391, 'learning_rate': 1.5522589805502775e-05, 'epoch': 0.67} {'loss': 0.65, 'learning_rate': 1.5522309707018408e-05, 'epoch': 0.67} {'loss': 0.5803, 'learning_rate': 1.5522029602300403e-05, 'epoch': 0.67} {'loss': 0.7528, 'learning_rate': 1.5521749491349076e-05, 'epoch': 0.67} {'loss': 0.6589, 'learning_rate': 1.5521469374164745e-05, 'epoch': 0.67} {'loss': 0.5243, 'learning_rate': 1.5521189250747725e-05, 'epoch': 0.67} {'loss': 0.6342, 'learning_rate': 1.5520909121098332e-05, 'epoch': 0.67} {'loss': 0.5966, 'learning_rate': 1.5520628985216884e-05, 'epoch': 0.67} {'loss': 0.5797, 'learning_rate': 1.5520348843103693e-05, 'epoch': 0.67} {'loss': 0.5697, 'learning_rate': 1.552006869475908e-05, 'epoch': 0.67} {'loss': 0.5256, 'learning_rate': 1.5519788540183357e-05, 'epoch': 0.67} {'loss': 0.6454, 'learning_rate': 1.5519508379376843e-05, 'epoch': 0.67} {'loss': 0.6324, 'learning_rate': 1.5519228212339856e-05, 'epoch': 0.67} {'loss': 0.7621, 'learning_rate': 1.551894803907271e-05, 'epoch': 0.67} {'loss': 0.536, 'learning_rate': 1.551866785957572e-05, 'epoch': 0.67} {'loss': 0.6988, 'learning_rate': 1.5518387673849202e-05, 'epoch': 0.67} {'loss': 0.4866, 'learning_rate': 1.5518107481893475e-05, 'epoch': 0.67} {'loss': 0.6603, 'learning_rate': 1.5517827283708854e-05, 'epoch': 0.67} {'loss': 0.6798, 'learning_rate': 1.551754707929565e-05, 'epoch': 0.67} {'loss': 0.5855, 'learning_rate': 1.551726686865419e-05, 'epoch': 0.67} {'loss': 0.5901, 'learning_rate': 1.5516986651784784e-05, 'epoch': 0.67} {'loss': 0.511, 'learning_rate': 1.551670642868775e-05, 'epoch': 0.67} {'loss': 0.6328, 'learning_rate': 1.5516426199363404e-05, 'epoch': 0.67} {'loss': 0.5508, 'learning_rate': 1.551614596381206e-05, 'epoch': 0.67} {'loss': 0.5346, 'learning_rate': 1.5515865722034035e-05, 'epoch': 0.67} {'loss': 0.3834, 'learning_rate': 1.551558547402965e-05, 'epoch': 0.67} {'loss': 0.5415, 'learning_rate': 1.5515305219799216e-05, 'epoch': 0.67} {'loss': 0.7687, 'learning_rate': 1.551502495934305e-05, 'epoch': 0.67} {'loss': 0.5673, 'learning_rate': 1.5514744692661473e-05, 'epoch': 0.67} {'loss': 0.5361, 'learning_rate': 1.5514464419754794e-05, 'epoch': 0.67} {'loss': 0.587, 'learning_rate': 1.5514184140623333e-05, 'epoch': 0.67} {'loss': 0.6037, 'learning_rate': 1.551390385526741e-05, 'epoch': 0.67} {'loss': 0.5394, 'learning_rate': 1.5513623563687338e-05, 'epoch': 0.67} {'loss': 0.5228, 'learning_rate': 1.551334326588343e-05, 'epoch': 0.67} {'loss': 0.5584, 'learning_rate': 1.551306296185601e-05, 'epoch': 0.67} {'loss': 0.6239, 'learning_rate': 1.551278265160539e-05, 'epoch': 0.67} {'loss': 0.6449, 'learning_rate': 1.5512502335131882e-05, 'epoch': 0.67} {'loss': 0.7218, 'learning_rate': 1.5512222012435813e-05, 'epoch': 0.67} {'loss': 0.5319, 'learning_rate': 1.5511941683517487e-05, 'epoch': 0.67} {'loss': 0.6353, 'learning_rate': 1.551166134837723e-05, 'epoch': 0.67} {'loss': 0.7411, 'learning_rate': 1.5511381007015357e-05, 'epoch': 0.67} {'loss': 0.5882, 'learning_rate': 1.551110065943218e-05, 'epoch': 0.67} {'loss': 0.5036, 'learning_rate': 1.5510820305628022e-05, 'epoch': 0.67} {'loss': 0.6126, 'learning_rate': 1.5510539945603195e-05, 'epoch': 0.67} {'loss': 0.6277, 'learning_rate': 1.5510259579358014e-05, 'epoch': 0.67} {'loss': 0.577, 'learning_rate': 1.55099792068928e-05, 'epoch': 0.67} {'loss': 0.5363, 'learning_rate': 1.5509698828207866e-05, 'epoch': 0.67} {'loss': 0.5941, 'learning_rate': 1.5509418443303533e-05, 'epoch': 0.67} {'loss': 0.4375, 'learning_rate': 1.550913805218011e-05, 'epoch': 0.67} {'loss': 0.5715, 'learning_rate': 1.5508857654837918e-05, 'epoch': 0.67} {'loss': 0.5485, 'learning_rate': 1.5508577251277273e-05, 'epoch': 0.67} {'loss': 0.582, 'learning_rate': 1.5508296841498496e-05, 'epoch': 0.67} {'loss': 0.4566, 'learning_rate': 1.5508016425501893e-05, 'epoch': 0.67} {'loss': 0.5668, 'learning_rate': 1.550773600328779e-05, 'epoch': 0.67} {'loss': 0.5814, 'learning_rate': 1.55074555748565e-05, 'epoch': 0.67} {'loss': 0.5966, 'learning_rate': 1.5507175140208345e-05, 'epoch': 0.67} {'loss': 0.5957, 'learning_rate': 1.5506894699343635e-05, 'epoch': 0.67} {'loss': 0.6391, 'learning_rate': 1.550661425226268e-05, 'epoch': 0.67} {'loss': 0.4814, 'learning_rate': 1.550633379896581e-05, 'epoch': 0.67} {'loss': 0.5052, 'learning_rate': 1.5506053339453338e-05, 'epoch': 0.67} {'loss': 0.5652, 'learning_rate': 1.5505772873725574e-05, 'epoch': 0.67} {'loss': 0.572, 'learning_rate': 1.5505492401782846e-05, 'epoch': 0.67} {'loss': 0.6486, 'learning_rate': 1.550521192362546e-05, 'epoch': 0.67} {'loss': 0.584, 'learning_rate': 1.5504931439253735e-05, 'epoch': 0.67} {'loss': 0.3526, 'learning_rate': 1.550465094866799e-05, 'epoch': 0.67} {'loss': 0.5107, 'learning_rate': 1.5504370451868545e-05, 'epoch': 0.67} {'loss': 0.4376, 'learning_rate': 1.550408994885571e-05, 'epoch': 0.67} {'loss': 0.5582, 'learning_rate': 1.5503809439629802e-05, 'epoch': 0.67} {'loss': 0.4718, 'learning_rate': 1.550352892419114e-05, 'epoch': 0.67} {'loss': 0.5778, 'learning_rate': 1.550324840254004e-05, 'epoch': 0.67} {'loss': 0.4968, 'learning_rate': 1.5502967874676823e-05, 'epoch': 0.67} {'loss': 0.5596, 'learning_rate': 1.55026873406018e-05, 'epoch': 0.67} {'loss': 0.6008, 'learning_rate': 1.5502406800315288e-05, 'epoch': 0.67} {'loss': 0.6576, 'learning_rate': 1.5502126253817603e-05, 'epoch': 0.67} {'loss': 0.5867, 'learning_rate': 1.550184570110907e-05, 'epoch': 0.67} {'loss': 0.6615, 'learning_rate': 1.5501565142189993e-05, 'epoch': 0.67} {'loss': 0.5281, 'learning_rate': 1.55012845770607e-05, 'epoch': 0.67} {'loss': 0.5758, 'learning_rate': 1.55010040057215e-05, 'epoch': 0.67} {'loss': 0.6912, 'learning_rate': 1.5500723428172714e-05, 'epoch': 0.67} {'loss': 0.6824, 'learning_rate': 1.550044284441466e-05, 'epoch': 0.67} {'loss': 0.5894, 'learning_rate': 1.5500162254447648e-05, 'epoch': 0.67} {'loss': 0.5198, 'learning_rate': 1.5499881658271996e-05, 'epoch': 0.67} {'loss': 0.5733, 'learning_rate': 1.5499601055888026e-05, 'epoch': 0.67} {'loss': 0.5275, 'learning_rate': 1.5499320447296057e-05, 'epoch': 0.67} {'loss': 0.4246, 'learning_rate': 1.5499039832496397e-05, 'epoch': 0.67} {'loss': 0.5392, 'learning_rate': 1.5498759211489364e-05, 'epoch': 0.67} {'loss': 0.5856, 'learning_rate': 1.549847858427528e-05, 'epoch': 0.67} {'loss': 0.5845, 'learning_rate': 1.5498197950854462e-05, 'epoch': 0.67} {'loss': 0.5933, 'learning_rate': 1.549791731122722e-05, 'epoch': 0.67} {'loss': 0.42, 'learning_rate': 1.5497636665393878e-05, 'epoch': 0.67} {'loss': 0.6169, 'learning_rate': 1.5497356013354746e-05, 'epoch': 0.67} {'loss': 0.4038, 'learning_rate': 1.5497075355110146e-05, 'epoch': 0.67} {'loss': 0.613, 'learning_rate': 1.5496794690660396e-05, 'epoch': 0.67} {'loss': 0.5103, 'learning_rate': 1.549651402000581e-05, 'epoch': 0.67} {'loss': 0.6725, 'learning_rate': 1.5496233343146697e-05, 'epoch': 0.67} {'loss': 0.5519, 'learning_rate': 1.549595266008339e-05, 'epoch': 0.67} {'loss': 0.3934, 'learning_rate': 1.5495671970816196e-05, 'epoch': 0.67} {'loss': 0.6045, 'learning_rate': 1.549539127534543e-05, 'epoch': 0.67} {'loss': 0.5127, 'learning_rate': 1.5495110573671418e-05, 'epoch': 0.67} {'loss': 0.6501, 'learning_rate': 1.5494829865794465e-05, 'epoch': 0.67} {'loss': 0.8645, 'learning_rate': 1.5494549151714896e-05, 'epoch': 0.67} {'loss': 0.4936, 'learning_rate': 1.5494268431433027e-05, 'epoch': 0.67} {'loss': 0.6826, 'learning_rate': 1.5493987704949173e-05, 'epoch': 0.67} {'loss': 0.705, 'learning_rate': 1.5493706972263655e-05, 'epoch': 0.67} {'loss': 0.5216, 'learning_rate': 1.5493426233376782e-05, 'epoch': 0.67} {'loss': 0.3941, 'learning_rate': 1.5493145488288875e-05, 'epoch': 0.67} {'loss': 0.5379, 'learning_rate': 1.5492864737000254e-05, 'epoch': 0.67} {'loss': 0.6673, 'learning_rate': 1.5492583979511233e-05, 'epoch': 0.67} {'loss': 0.5391, 'learning_rate': 1.5492303215822127e-05, 'epoch': 0.67} {'loss': 0.5899, 'learning_rate': 1.549202244593326e-05, 'epoch': 0.67} {'loss': 0.6361, 'learning_rate': 1.549174166984494e-05, 'epoch': 0.67} {'loss': 0.6018, 'learning_rate': 1.5491460887557487e-05, 'epoch': 0.67} {'loss': 0.5867, 'learning_rate': 1.549118009907122e-05, 'epoch': 0.67} {'loss': 0.6153, 'learning_rate': 1.549089930438645e-05, 'epoch': 0.67} {'loss': 0.5805, 'learning_rate': 1.549061850350351e-05, 'epoch': 0.67} {'loss': 0.5843, 'learning_rate': 1.5490337696422697e-05, 'epoch': 0.67} {'loss': 0.5411, 'learning_rate': 1.5490056883144343e-05, 'epoch': 0.67} {'loss': 0.5693, 'learning_rate': 1.5489776063668752e-05, 'epoch': 0.67} {'loss': 0.7445, 'learning_rate': 1.548949523799625e-05, 'epoch': 0.67} {'loss': 0.6636, 'learning_rate': 1.5489214406127154e-05, 'epoch': 0.67} {'loss': 0.7239, 'learning_rate': 1.5488933568061776e-05, 'epoch': 0.67} {'loss': 0.6461, 'learning_rate': 1.548865272380044e-05, 'epoch': 0.67} {'loss': 0.7128, 'learning_rate': 1.5488371873343454e-05, 'epoch': 0.67} {'loss': 0.3677, 'learning_rate': 1.5488091016691144e-05, 'epoch': 0.67} {'loss': 0.6908, 'learning_rate': 1.548781015384382e-05, 'epoch': 0.67} {'loss': 0.7125, 'learning_rate': 1.5487529284801804e-05, 'epoch': 0.67} {'loss': 0.4567, 'learning_rate': 1.548724840956541e-05, 'epoch': 0.67} {'loss': 0.5302, 'learning_rate': 1.5486967528134952e-05, 'epoch': 0.67} {'loss': 0.6286, 'learning_rate': 1.5486686640510757e-05, 'epoch': 0.67} {'loss': 0.5284, 'learning_rate': 1.5486405746693135e-05, 'epoch': 0.67} {'loss': 0.5254, 'learning_rate': 1.54861248466824e-05, 'epoch': 0.67} {'loss': 0.6113, 'learning_rate': 1.5485843940478877e-05, 'epoch': 0.67} {'loss': 0.7189, 'learning_rate': 1.548556302808288e-05, 'epoch': 0.67} {'loss': 0.5178, 'learning_rate': 1.5485282109494722e-05, 'epoch': 0.67} {'loss': 0.5431, 'learning_rate': 1.548500118471473e-05, 'epoch': 0.67} {'loss': 0.5047, 'learning_rate': 1.548472025374321e-05, 'epoch': 0.67} {'loss': 0.6338, 'learning_rate': 1.5484439316580485e-05, 'epoch': 0.67} {'loss': 0.6889, 'learning_rate': 1.548415837322687e-05, 'epoch': 0.67} {'loss': 0.573, 'learning_rate': 1.548387742368268e-05, 'epoch': 0.67} {'loss': 0.6915, 'learning_rate': 1.5483596467948242e-05, 'epoch': 0.67} {'loss': 0.5806, 'learning_rate': 1.548331550602386e-05, 'epoch': 0.67} {'loss': 0.5528, 'learning_rate': 1.548303453790986e-05, 'epoch': 0.67} {'loss': 0.6989, 'learning_rate': 1.548275356360656e-05, 'epoch': 0.67} {'loss': 0.6778, 'learning_rate': 1.548247258311427e-05, 'epoch': 0.67} {'loss': 0.6291, 'learning_rate': 1.548219159643331e-05, 'epoch': 0.67} {'loss': 0.4367, 'learning_rate': 1.5481910603564e-05, 'epoch': 0.67} {'loss': 0.703, 'learning_rate': 1.5481629604506652e-05, 'epoch': 0.67} {'loss': 0.4605, 'learning_rate': 1.5481348599261595e-05, 'epoch': 0.67} {'loss': 0.6599, 'learning_rate': 1.5481067587829132e-05, 'epoch': 0.67} {'loss': 0.6326, 'learning_rate': 1.5480786570209584e-05, 'epoch': 0.67} {'loss': 0.4195, 'learning_rate': 1.5480505546403274e-05, 'epoch': 0.67} {'loss': 0.6516, 'learning_rate': 1.5480224516410513e-05, 'epoch': 0.67} {'loss': 0.6799, 'learning_rate': 1.5479943480231623e-05, 'epoch': 0.67} {'loss': 0.5432, 'learning_rate': 1.547966243786692e-05, 'epoch': 0.67} {'loss': 0.4351, 'learning_rate': 1.5479381389316713e-05, 'epoch': 0.67} {'loss': 0.4856, 'learning_rate': 1.5479100334581333e-05, 'epoch': 0.67} {'loss': 0.6006, 'learning_rate': 1.547881927366109e-05, 'epoch': 0.67} {'loss': 0.5083, 'learning_rate': 1.54785382065563e-05, 'epoch': 0.67} {'loss': 0.5789, 'learning_rate': 1.547825713326728e-05, 'epoch': 0.67} {'loss': 0.5888, 'learning_rate': 1.5477976053794355e-05, 'epoch': 0.67} {'loss': 0.6561, 'learning_rate': 1.547769496813783e-05, 'epoch': 0.67} {'loss': 0.5403, 'learning_rate': 1.5477413876298038e-05, 'epoch': 0.67} {'loss': 0.5879, 'learning_rate': 1.547713277827528e-05, 'epoch': 0.67} {'loss': 0.6319, 'learning_rate': 1.5476851674069883e-05, 'epoch': 0.67} {'loss': 0.6108, 'learning_rate': 1.5476570563682166e-05, 'epoch': 0.67} {'loss': 0.6739, 'learning_rate': 1.5476289447112436e-05, 'epoch': 0.67} {'loss': 0.58, 'learning_rate': 1.547600832436102e-05, 'epoch': 0.67} {'loss': 0.626, 'learning_rate': 1.547572719542823e-05, 'epoch': 0.67} {'loss': 0.4939, 'learning_rate': 1.5475446060314384e-05, 'epoch': 0.67} {'loss': 0.6806, 'learning_rate': 1.54751649190198e-05, 'epoch': 0.67} {'loss': 0.5717, 'learning_rate': 1.54748837715448e-05, 'epoch': 0.67} {'loss': 0.7922, 'learning_rate': 1.5474602617889696e-05, 'epoch': 0.67} {'loss': 0.5489, 'learning_rate': 1.5474321458054807e-05, 'epoch': 0.67} {'loss': 0.6024, 'learning_rate': 1.5474040292040447e-05, 'epoch': 0.67} {'loss': 0.5531, 'learning_rate': 1.547375911984694e-05, 'epoch': 0.67} {'loss': 0.7103, 'learning_rate': 1.54734779414746e-05, 'epoch': 0.67} {'loss': 0.5026, 'learning_rate': 1.547319675692374e-05, 'epoch': 0.67} {'loss': 0.5885, 'learning_rate': 1.5472915566194688e-05, 'epoch': 0.67} {'loss': 0.5843, 'learning_rate': 1.5472634369287752e-05, 'epoch': 0.67} {'loss': 0.6038, 'learning_rate': 1.5472353166203252e-05, 'epoch': 0.67} {'loss': 0.6435, 'learning_rate': 1.5472071956941504e-05, 'epoch': 0.67} {'loss': 0.5634, 'learning_rate': 1.547179074150283e-05, 'epoch': 0.67} {'loss': 0.4641, 'learning_rate': 1.5471509519887543e-05, 'epoch': 0.67} {'loss': 0.5564, 'learning_rate': 1.5471228292095966e-05, 'epoch': 0.67} {'loss': 0.7396, 'learning_rate': 1.5470947058128408e-05, 'epoch': 0.67} {'loss': 0.5467, 'learning_rate': 1.5470665817985194e-05, 'epoch': 0.67} {'loss': 0.6737, 'learning_rate': 1.5470384571666635e-05, 'epoch': 0.67} {'loss': 0.4939, 'learning_rate': 1.5470103319173054e-05, 'epoch': 0.67} {'loss': 0.5798, 'learning_rate': 1.5469822060504772e-05, 'epoch': 0.67} {'loss': 0.5964, 'learning_rate': 1.5469540795662094e-05, 'epoch': 0.67} {'loss': 0.583, 'learning_rate': 1.546925952464535e-05, 'epoch': 0.67} {'loss': 0.5408, 'learning_rate': 1.5468978247454848e-05, 'epoch': 0.67} {'loss': 0.5189, 'learning_rate': 1.546869696409091e-05, 'epoch': 0.67} {'loss': 0.6901, 'learning_rate': 1.546841567455385e-05, 'epoch': 0.67} {'loss': 0.703, 'learning_rate': 1.546813437884399e-05, 'epoch': 0.67} {'loss': 0.4449, 'learning_rate': 1.546785307696165e-05, 'epoch': 0.67} {'loss': 0.6584, 'learning_rate': 1.5467571768907143e-05, 'epoch': 0.67} {'loss': 0.3951, 'learning_rate': 1.5467290454680787e-05, 'epoch': 0.67} {'loss': 0.6298, 'learning_rate': 1.54670091342829e-05, 'epoch': 0.67} {'loss': 0.5951, 'learning_rate': 1.5466727807713796e-05, 'epoch': 0.67} {'loss': 0.6356, 'learning_rate': 1.5466446474973797e-05, 'epoch': 0.67} {'loss': 0.597, 'learning_rate': 1.5466165136063224e-05, 'epoch': 0.67} {'loss': 0.6087, 'learning_rate': 1.5465883790982382e-05, 'epoch': 0.67} {'loss': 0.6047, 'learning_rate': 1.5465602439731603e-05, 'epoch': 0.67} {'loss': 0.5543, 'learning_rate': 1.5465321082311196e-05, 'epoch': 0.67} {'loss': 0.4539, 'learning_rate': 1.546503971872148e-05, 'epoch': 0.67} {'loss': 0.6267, 'learning_rate': 1.5464758348962775e-05, 'epoch': 0.67} {'loss': 0.7292, 'learning_rate': 1.5464476973035395e-05, 'epoch': 0.67} {'loss': 0.5493, 'learning_rate': 1.546419559093966e-05, 'epoch': 0.67} {'loss': 0.6091, 'learning_rate': 1.5463914202675886e-05, 'epoch': 0.67} {'loss': 0.5332, 'learning_rate': 1.5463632808244398e-05, 'epoch': 0.67} {'loss': 0.5543, 'learning_rate': 1.5463351407645503e-05, 'epoch': 0.67} {'loss': 0.6414, 'learning_rate': 1.5463070000879524e-05, 'epoch': 0.67} {'loss': 0.6097, 'learning_rate': 1.5462788587946776e-05, 'epoch': 0.67} {'loss': 0.4992, 'learning_rate': 1.546250716884758e-05, 'epoch': 0.67} {'loss': 0.6387, 'learning_rate': 1.5462225743582253e-05, 'epoch': 0.67} {'loss': 0.5677, 'learning_rate': 1.5461944312151108e-05, 'epoch': 0.67} {'loss': 0.6102, 'learning_rate': 1.546166287455447e-05, 'epoch': 0.67} {'loss': 0.5383, 'learning_rate': 1.546138143079265e-05, 'epoch': 0.67} {'loss': 0.6367, 'learning_rate': 1.5461099980865973e-05, 'epoch': 0.67} {'loss': 0.4046, 'learning_rate': 1.546081852477475e-05, 'epoch': 0.67} {'loss': 0.602, 'learning_rate': 1.5460537062519305e-05, 'epoch': 0.67} {'loss': 0.6134, 'learning_rate': 1.546025559409995e-05, 'epoch': 0.67} {'loss': 0.5957, 'learning_rate': 1.5459974119517003e-05, 'epoch': 0.67} {'loss': 0.5004, 'learning_rate': 1.5459692638770783e-05, 'epoch': 0.67} {'loss': 0.6037, 'learning_rate': 1.5459411151861613e-05, 'epoch': 0.67} {'loss': 0.6547, 'learning_rate': 1.54591296587898e-05, 'epoch': 0.67} {'loss': 0.6368, 'learning_rate': 1.545884815955567e-05, 'epoch': 0.67} {'loss': 0.5123, 'learning_rate': 1.5458566654159542e-05, 'epoch': 0.67} {'loss': 0.7533, 'learning_rate': 1.5458285142601727e-05, 'epoch': 0.67} {'loss': 0.6259, 'learning_rate': 1.5458003624882546e-05, 'epoch': 0.67} {'loss': 0.3734, 'learning_rate': 1.5457722101002316e-05, 'epoch': 0.67} {'loss': 0.5031, 'learning_rate': 1.5457440570961354e-05, 'epoch': 0.68} {'loss': 0.5822, 'learning_rate': 1.5457159034759982e-05, 'epoch': 0.68} {'loss': 0.3704, 'learning_rate': 1.5456877492398516e-05, 'epoch': 0.68} {'loss': 0.5963, 'learning_rate': 1.5456595943877273e-05, 'epoch': 0.68} {'loss': 0.6939, 'learning_rate': 1.545631438919657e-05, 'epoch': 0.68} {'loss': 0.542, 'learning_rate': 1.5456032828356728e-05, 'epoch': 0.68} {'loss': 0.5725, 'learning_rate': 1.5455751261358058e-05, 'epoch': 0.68} {'loss': 0.5586, 'learning_rate': 1.5455469688200883e-05, 'epoch': 0.68} {'loss': 0.7223, 'learning_rate': 1.545518810888552e-05, 'epoch': 0.68} {'loss': 0.6269, 'learning_rate': 1.5454906523412293e-05, 'epoch': 0.68} {'loss': 0.5638, 'learning_rate': 1.5454624931781506e-05, 'epoch': 0.68} {'loss': 0.5511, 'learning_rate': 1.545434333399349e-05, 'epoch': 0.68} {'loss': 0.4109, 'learning_rate': 1.5454061730048554e-05, 'epoch': 0.68} {'loss': 0.5865, 'learning_rate': 1.545378011994702e-05, 'epoch': 0.68} {'loss': 0.3868, 'learning_rate': 1.5453498503689208e-05, 'epoch': 0.68} {'loss': 0.5843, 'learning_rate': 1.545321688127543e-05, 'epoch': 0.68} {'loss': 0.5494, 'learning_rate': 1.545293525270601e-05, 'epoch': 0.68} {'loss': 0.6815, 'learning_rate': 1.5452653617981262e-05, 'epoch': 0.68} {'loss': 0.5467, 'learning_rate': 1.5452371977101502e-05, 'epoch': 0.68} {'loss': 0.534, 'learning_rate': 1.5452090330067052e-05, 'epoch': 0.68} {'loss': 0.6348, 'learning_rate': 1.5451808676878233e-05, 'epoch': 0.68} {'loss': 0.6843, 'learning_rate': 1.5451527017535354e-05, 'epoch': 0.68} {'loss': 0.5253, 'learning_rate': 1.5451245352038743e-05, 'epoch': 0.68} {'loss': 0.4489, 'learning_rate': 1.5450963680388705e-05, 'epoch': 0.68} {'loss': 0.6408, 'learning_rate': 1.545068200258557e-05, 'epoch': 0.68} {'loss': 0.6753, 'learning_rate': 1.5450400318629655e-05, 'epoch': 0.68} {'loss': 0.5362, 'learning_rate': 1.5450118628521268e-05, 'epoch': 0.68} {'loss': 0.4885, 'learning_rate': 1.544983693226074e-05, 'epoch': 0.68} {'loss': 0.6563, 'learning_rate': 1.5449555229848376e-05, 'epoch': 0.68} {'loss': 0.5741, 'learning_rate': 1.5449273521284504e-05, 'epoch': 0.68} {'loss': 0.5016, 'learning_rate': 1.5448991806569437e-05, 'epoch': 0.68} {'loss': 0.5221, 'learning_rate': 1.5448710085703496e-05, 'epoch': 0.68} {'loss': 0.4449, 'learning_rate': 1.5448428358686994e-05, 'epoch': 0.68} {'loss': 0.5913, 'learning_rate': 1.5448146625520257e-05, 'epoch': 0.68} {'loss': 0.4056, 'learning_rate': 1.5447864886203593e-05, 'epoch': 0.68} {'loss': 0.5544, 'learning_rate': 1.5447583140737327e-05, 'epoch': 0.68} {'loss': 0.5365, 'learning_rate': 1.544730138912178e-05, 'epoch': 0.68} {'loss': 0.5282, 'learning_rate': 1.5447019631357263e-05, 'epoch': 0.68} {'loss': 0.7115, 'learning_rate': 1.5446737867444094e-05, 'epoch': 0.68} {'loss': 0.5601, 'learning_rate': 1.5446456097382597e-05, 'epoch': 0.68} {'loss': 0.4272, 'learning_rate': 1.5446174321173088e-05, 'epoch': 0.68} {'loss': 0.6389, 'learning_rate': 1.544589253881588e-05, 'epoch': 0.68} {'loss': 0.5132, 'learning_rate': 1.5445610750311296e-05, 'epoch': 0.68} {'loss': 0.6773, 'learning_rate': 1.5445328955659653e-05, 'epoch': 0.68} {'loss': 0.353, 'learning_rate': 1.544504715486127e-05, 'epoch': 0.68} {'loss': 0.6597, 'learning_rate': 1.5444765347916465e-05, 'epoch': 0.68} {'loss': 0.4591, 'learning_rate': 1.5444483534825555e-05, 'epoch': 0.68} {'loss': 0.6405, 'learning_rate': 1.5444201715588856e-05, 'epoch': 0.68} {'loss': 0.4029, 'learning_rate': 1.5443919890206693e-05, 'epoch': 0.68} {'loss': 0.5592, 'learning_rate': 1.5443638058679376e-05, 'epoch': 0.68} {'loss': 0.4306, 'learning_rate': 1.5443356221007225e-05, 'epoch': 0.68} {'loss': 0.561, 'learning_rate': 1.5443074377190565e-05, 'epoch': 0.68} {'loss': 0.4979, 'learning_rate': 1.5442792527229707e-05, 'epoch': 0.68} {'loss': 0.5254, 'learning_rate': 1.544251067112497e-05, 'epoch': 0.68} {'loss': 0.525, 'learning_rate': 1.5442228808876674e-05, 'epoch': 0.68} {'loss': 0.6075, 'learning_rate': 1.5441946940485135e-05, 'epoch': 0.68} {'loss': 0.4561, 'learning_rate': 1.5441665065950676e-05, 'epoch': 0.68} {'loss': 0.6914, 'learning_rate': 1.5441383185273608e-05, 'epoch': 0.68} {'loss': 0.5966, 'learning_rate': 1.5441101298454258e-05, 'epoch': 0.68} {'loss': 0.6053, 'learning_rate': 1.5440819405492936e-05, 'epoch': 0.68} {'loss': 0.3883, 'learning_rate': 1.5440537506389964e-05, 'epoch': 0.68} {'loss': 0.4803, 'learning_rate': 1.5440255601145658e-05, 'epoch': 0.68} {'loss': 0.5589, 'learning_rate': 1.5439973689760343e-05, 'epoch': 0.68} {'loss': 0.5285, 'learning_rate': 1.543969177223433e-05, 'epoch': 0.68} {'loss': 0.4553, 'learning_rate': 1.5439409848567938e-05, 'epoch': 0.68} {'loss': 0.553, 'learning_rate': 1.5439127918761486e-05, 'epoch': 0.68} {'loss': 0.261, 'learning_rate': 1.5438845982815295e-05, 'epoch': 0.68} {'loss': 0.3799, 'learning_rate': 1.543856404072968e-05, 'epoch': 0.68} {'loss': 0.62, 'learning_rate': 1.543828209250496e-05, 'epoch': 0.68} {'loss': 0.5638, 'learning_rate': 1.5438000138141455e-05, 'epoch': 0.68} {'loss': 0.5183, 'learning_rate': 1.543771817763948e-05, 'epoch': 0.68} {'loss': 0.6399, 'learning_rate': 1.5437436210999357e-05, 'epoch': 0.68} {'loss': 0.7198, 'learning_rate': 1.5437154238221402e-05, 'epoch': 0.68} {'loss': 0.556, 'learning_rate': 1.543687225930593e-05, 'epoch': 0.68} {'loss': 0.6106, 'learning_rate': 1.543659027425327e-05, 'epoch': 0.68} {'loss': 0.4632, 'learning_rate': 1.5436308283063732e-05, 'epoch': 0.68} {'loss': 0.5237, 'learning_rate': 1.5436026285737634e-05, 'epoch': 0.68} {'loss': 0.6129, 'learning_rate': 1.5435744282275294e-05, 'epoch': 0.68} {'loss': 0.5386, 'learning_rate': 1.5435462272677034e-05, 'epoch': 0.68} {'loss': 0.5133, 'learning_rate': 1.543518025694317e-05, 'epoch': 0.68} {'loss': 0.559, 'learning_rate': 1.5434898235074026e-05, 'epoch': 0.68} {'loss': 0.6384, 'learning_rate': 1.543461620706991e-05, 'epoch': 0.68} {'loss': 0.591, 'learning_rate': 1.5434334172931146e-05, 'epoch': 0.68} {'loss': 0.5013, 'learning_rate': 1.5434052132658052e-05, 'epoch': 0.68} {'loss': 0.6432, 'learning_rate': 1.543377008625095e-05, 'epoch': 0.68} {'loss': 0.5749, 'learning_rate': 1.543348803371015e-05, 'epoch': 0.68} {'loss': 0.5899, 'learning_rate': 1.5433205975035977e-05, 'epoch': 0.68} {'loss': 0.3908, 'learning_rate': 1.5432923910228746e-05, 'epoch': 0.68} {'loss': 0.5184, 'learning_rate': 1.5432641839288783e-05, 'epoch': 0.68} {'loss': 0.5274, 'learning_rate': 1.5432359762216397e-05, 'epoch': 0.68} {'loss': 0.4736, 'learning_rate': 1.543207767901191e-05, 'epoch': 0.68} {'loss': 0.503, 'learning_rate': 1.543179558967564e-05, 'epoch': 0.68} {'loss': 0.6249, 'learning_rate': 1.5431513494207907e-05, 'epoch': 0.68} {'loss': 0.5877, 'learning_rate': 1.5431231392609024e-05, 'epoch': 0.68} {'loss': 0.561, 'learning_rate': 1.5430949284879314e-05, 'epoch': 0.68} {'loss': 0.5168, 'learning_rate': 1.54306671710191e-05, 'epoch': 0.68} {'loss': 0.6233, 'learning_rate': 1.5430385051028693e-05, 'epoch': 0.68} {'loss': 0.5721, 'learning_rate': 1.5430102924908413e-05, 'epoch': 0.68} {'loss': 0.5999, 'learning_rate': 1.542982079265858e-05, 'epoch': 0.68} {'loss': 0.5637, 'learning_rate': 1.5429538654279513e-05, 'epoch': 0.68} {'loss': 0.5651, 'learning_rate': 1.5429256509771527e-05, 'epoch': 0.68} {'loss': 0.5008, 'learning_rate': 1.5428974359134946e-05, 'epoch': 0.68} {'loss': 0.4449, 'learning_rate': 1.5428692202370084e-05, 'epoch': 0.68} {'loss': 0.5905, 'learning_rate': 1.5428410039477258e-05, 'epoch': 0.68} {'loss': 0.626, 'learning_rate': 1.542812787045679e-05, 'epoch': 0.68} {'loss': 0.5528, 'learning_rate': 1.5427845695309002e-05, 'epoch': 0.68} {'loss': 0.5411, 'learning_rate': 1.5427563514034206e-05, 'epoch': 0.68} {'loss': 0.6062, 'learning_rate': 1.542728132663272e-05, 'epoch': 0.68} {'loss': 0.5607, 'learning_rate': 1.5426999133104872e-05, 'epoch': 0.68} {'loss': 0.6498, 'learning_rate': 1.542671693345097e-05, 'epoch': 0.68} {'loss': 0.6686, 'learning_rate': 1.5426434727671336e-05, 'epoch': 0.68} {'loss': 0.4038, 'learning_rate': 1.542615251576629e-05, 'epoch': 0.68} {'loss': 0.6014, 'learning_rate': 1.542587029773615e-05, 'epoch': 0.68} {'loss': 0.668, 'learning_rate': 1.542558807358123e-05, 'epoch': 0.68} {'loss': 0.415, 'learning_rate': 1.5425305843301855e-05, 'epoch': 0.68} {'loss': 0.6478, 'learning_rate': 1.5425023606898343e-05, 'epoch': 0.68} {'loss': 0.7424, 'learning_rate': 1.5424741364371013e-05, 'epoch': 0.68} {'loss': 0.7117, 'learning_rate': 1.542445911572018e-05, 'epoch': 0.68} {'loss': 0.5616, 'learning_rate': 1.5424176860946163e-05, 'epoch': 0.68} {'loss': 0.5235, 'learning_rate': 1.542389460004928e-05, 'epoch': 0.68} {'loss': 0.4776, 'learning_rate': 1.5423612333029853e-05, 'epoch': 0.68} {'loss': 0.6109, 'learning_rate': 1.5423330059888198e-05, 'epoch': 0.68} {'loss': 0.4609, 'learning_rate': 1.542304778062464e-05, 'epoch': 0.68} {'loss': 0.543, 'learning_rate': 1.5422765495239488e-05, 'epoch': 0.68} {'loss': 0.5408, 'learning_rate': 1.5422483203733064e-05, 'epoch': 0.68} {'loss': 0.6163, 'learning_rate': 1.542220090610569e-05, 'epoch': 0.68} {'loss': 0.628, 'learning_rate': 1.542191860235768e-05, 'epoch': 0.68} {'loss': 0.4638, 'learning_rate': 1.5421636292489357e-05, 'epoch': 0.68} {'loss': 0.4267, 'learning_rate': 1.5421353976501038e-05, 'epoch': 0.68} {'loss': 0.6138, 'learning_rate': 1.5421071654393038e-05, 'epoch': 0.68} {'loss': 0.6149, 'learning_rate': 1.5420789326165682e-05, 'epoch': 0.68} {'loss': 0.5772, 'learning_rate': 1.5420506991819283e-05, 'epoch': 0.68} {'loss': 0.6188, 'learning_rate': 1.5420224651354165e-05, 'epoch': 0.68} {'loss': 0.3821, 'learning_rate': 1.5419942304770643e-05, 'epoch': 0.68} {'loss': 0.4579, 'learning_rate': 1.5419659952069036e-05, 'epoch': 0.68} {'loss': 0.5615, 'learning_rate': 1.5419377593249666e-05, 'epoch': 0.68} {'loss': 0.6184, 'learning_rate': 1.5419095228312844e-05, 'epoch': 0.68} {'loss': 0.49, 'learning_rate': 1.5418812857258896e-05, 'epoch': 0.68} {'loss': 0.5449, 'learning_rate': 1.5418530480088144e-05, 'epoch': 0.68} {'loss': 0.6028, 'learning_rate': 1.54182480968009e-05, 'epoch': 0.68} {'loss': 0.5294, 'learning_rate': 1.541796570739748e-05, 'epoch': 0.68} {'loss': 0.5893, 'learning_rate': 1.541768331187821e-05, 'epoch': 0.68} {'loss': 0.6321, 'learning_rate': 1.5417400910243403e-05, 'epoch': 0.68} {'loss': 0.6967, 'learning_rate': 1.5417118502493383e-05, 'epoch': 0.68} {'loss': 0.56, 'learning_rate': 1.5416836088628465e-05, 'epoch': 0.68} {'loss': 0.6651, 'learning_rate': 1.541655366864897e-05, 'epoch': 0.68} {'loss': 0.5901, 'learning_rate': 1.5416271242555217e-05, 'epoch': 0.68} {'loss': 0.6319, 'learning_rate': 1.5415988810347523e-05, 'epoch': 0.68} {'loss': 0.713, 'learning_rate': 1.5415706372026207e-05, 'epoch': 0.68} {'loss': 0.7187, 'learning_rate': 1.5415423927591586e-05, 'epoch': 0.68} {'loss': 0.5886, 'learning_rate': 1.5415141477043985e-05, 'epoch': 0.68} {'loss': 0.6049, 'learning_rate': 1.5414859020383717e-05, 'epoch': 0.68} {'loss': 0.5136, 'learning_rate': 1.5414576557611104e-05, 'epoch': 0.68} {'loss': 0.5472, 'learning_rate': 1.541429408872646e-05, 'epoch': 0.68} {'loss': 0.5576, 'learning_rate': 1.541401161373011e-05, 'epoch': 0.68} {'loss': 0.4734, 'learning_rate': 1.541372913262237e-05, 'epoch': 0.68} {'loss': 0.4685, 'learning_rate': 1.5413446645403564e-05, 'epoch': 0.68} {'loss': 0.6353, 'learning_rate': 1.5413164152074003e-05, 'epoch': 0.68} {'loss': 0.6319, 'learning_rate': 1.5412881652634008e-05, 'epoch': 0.68} {'loss': 0.4812, 'learning_rate': 1.5412599147083896e-05, 'epoch': 0.68} {'loss': 0.707, 'learning_rate': 1.5412316635423997e-05, 'epoch': 0.68} {'loss': 0.4713, 'learning_rate': 1.541203411765461e-05, 'epoch': 0.68} {'loss': 0.4624, 'learning_rate': 1.5411751593776076e-05, 'epoch': 0.68} {'loss': 0.7077, 'learning_rate': 1.54114690637887e-05, 'epoch': 0.68} {'loss': 0.5612, 'learning_rate': 1.5411186527692806e-05, 'epoch': 0.68} {'loss': 0.504, 'learning_rate': 1.541090398548871e-05, 'epoch': 0.68} {'loss': 0.5694, 'learning_rate': 1.5410621437176732e-05, 'epoch': 0.68} {'loss': 0.6798, 'learning_rate': 1.541033888275719e-05, 'epoch': 0.68} {'loss': 0.4195, 'learning_rate': 1.5410056322230408e-05, 'epoch': 0.68} {'loss': 0.4086, 'learning_rate': 1.54097737555967e-05, 'epoch': 0.68} {'loss': 0.6708, 'learning_rate': 1.5409491182856383e-05, 'epoch': 0.68} {'loss': 0.5639, 'learning_rate': 1.540920860400978e-05, 'epoch': 0.68} {'loss': 0.7021, 'learning_rate': 1.5408926019057213e-05, 'epoch': 0.68} {'loss': 0.4799, 'learning_rate': 1.5408643427998993e-05, 'epoch': 0.68} {'loss': 0.5536, 'learning_rate': 1.540836083083544e-05, 'epoch': 0.68} {'loss': 0.4591, 'learning_rate': 1.5408078227566886e-05, 'epoch': 0.68} {'loss': 0.5072, 'learning_rate': 1.5407795618193632e-05, 'epoch': 0.68} {'loss': 0.5201, 'learning_rate': 1.5407513002716008e-05, 'epoch': 0.68} {'loss': 0.6217, 'learning_rate': 1.540723038113433e-05, 'epoch': 0.68} {'loss': 0.6792, 'learning_rate': 1.5406947753448917e-05, 'epoch': 0.68} {'loss': 0.6057, 'learning_rate': 1.5406665119660087e-05, 'epoch': 0.68} {'loss': 0.4569, 'learning_rate': 1.540638247976816e-05, 'epoch': 0.68} {'loss': 0.5367, 'learning_rate': 1.5406099833773458e-05, 'epoch': 0.68} {'loss': 0.64, 'learning_rate': 1.5405817181676296e-05, 'epoch': 0.68} {'loss': 0.6913, 'learning_rate': 1.5405534523476993e-05, 'epoch': 0.68} {'loss': 0.608, 'learning_rate': 1.540525185917587e-05, 'epoch': 0.68} {'loss': 0.7045, 'learning_rate': 1.5404969188773247e-05, 'epoch': 0.68} {'loss': 0.6454, 'learning_rate': 1.5404686512269443e-05, 'epoch': 0.68} {'loss': 0.616, 'learning_rate': 1.540440382966477e-05, 'epoch': 0.68} {'loss': 0.595, 'learning_rate': 1.540412114095956e-05, 'epoch': 0.68} {'loss': 0.5987, 'learning_rate': 1.5403838446154117e-05, 'epoch': 0.68} {'loss': 0.5752, 'learning_rate': 1.5403555745248775e-05, 'epoch': 0.68} {'loss': 0.4864, 'learning_rate': 1.540327303824384e-05, 'epoch': 0.68} {'loss': 0.4086, 'learning_rate': 1.5402990325139642e-05, 'epoch': 0.68} {'loss': 0.6187, 'learning_rate': 1.5402707605936494e-05, 'epoch': 0.68} {'loss': 0.5995, 'learning_rate': 1.5402424880634716e-05, 'epoch': 0.68} {'loss': 0.6292, 'learning_rate': 1.540214214923463e-05, 'epoch': 0.68} {'loss': 0.5017, 'learning_rate': 1.540185941173655e-05, 'epoch': 0.68} {'loss': 0.5311, 'learning_rate': 1.5401576668140798e-05, 'epoch': 0.68} {'loss': 0.4637, 'learning_rate': 1.540129391844769e-05, 'epoch': 0.68} {'loss': 0.4984, 'learning_rate': 1.5401011162657553e-05, 'epoch': 0.68} {'loss': 0.6166, 'learning_rate': 1.54007284007707e-05, 'epoch': 0.68} {'loss': 0.6482, 'learning_rate': 1.540044563278745e-05, 'epoch': 0.68} {'loss': 0.7315, 'learning_rate': 1.540016285870813e-05, 'epoch': 0.68} {'loss': 0.6965, 'learning_rate': 1.539988007853305e-05, 'epoch': 0.68} {'loss': 0.6136, 'learning_rate': 1.5399597292262528e-05, 'epoch': 0.68} {'loss': 0.7208, 'learning_rate': 1.5399314499896892e-05, 'epoch': 0.68} {'loss': 0.476, 'learning_rate': 1.5399031701436455e-05, 'epoch': 0.68} {'loss': 0.5238, 'learning_rate': 1.5398748896881538e-05, 'epoch': 0.68} {'loss': 0.7009, 'learning_rate': 1.539846608623246e-05, 'epoch': 0.68} {'loss': 0.5946, 'learning_rate': 1.539818326948954e-05, 'epoch': 0.68} {'loss': 0.5509, 'learning_rate': 1.5397900446653098e-05, 'epoch': 0.68} {'loss': 0.5262, 'learning_rate': 1.5397617617723452e-05, 'epoch': 0.68} {'loss': 0.5607, 'learning_rate': 1.5397334782700922e-05, 'epoch': 0.68} {'loss': 0.6096, 'learning_rate': 1.539705194158583e-05, 'epoch': 0.68} {'loss': 0.5381, 'learning_rate': 1.539676909437849e-05, 'epoch': 0.68} {'loss': 0.5523, 'learning_rate': 1.5396486241079223e-05, 'epoch': 0.68} {'loss': 0.5115, 'learning_rate': 1.5396203381688355e-05, 'epoch': 0.68} {'loss': 0.5376, 'learning_rate': 1.53959205162062e-05, 'epoch': 0.68} {'loss': 0.6368, 'learning_rate': 1.539563764463307e-05, 'epoch': 0.68} {'loss': 0.6214, 'learning_rate': 1.539535476696929e-05, 'epoch': 0.68} {'loss': 0.4174, 'learning_rate': 1.5395071883215184e-05, 'epoch': 0.68} {'loss': 0.4529, 'learning_rate': 1.539478899337107e-05, 'epoch': 0.68} {'loss': 0.5545, 'learning_rate': 1.5394506097437262e-05, 'epoch': 0.68} {'loss': 0.6021, 'learning_rate': 1.5394223195414084e-05, 'epoch': 0.68} {'loss': 0.6006, 'learning_rate': 1.539394028730185e-05, 'epoch': 0.68} {'loss': 0.5057, 'learning_rate': 1.5393657373100887e-05, 'epoch': 0.68} {'loss': 0.5209, 'learning_rate': 1.539337445281151e-05, 'epoch': 0.68} {'loss': 0.626, 'learning_rate': 1.5393091526434042e-05, 'epoch': 0.68} {'loss': 0.5669, 'learning_rate': 1.5392808593968794e-05, 'epoch': 0.68} {'loss': 0.5003, 'learning_rate': 1.539252565541609e-05, 'epoch': 0.68} {'loss': 0.6951, 'learning_rate': 1.5392242710776256e-05, 'epoch': 0.68} {'loss': 0.5189, 'learning_rate': 1.53919597600496e-05, 'epoch': 0.68} {'loss': 0.4949, 'learning_rate': 1.539167680323645e-05, 'epoch': 0.68} {'loss': 0.7187, 'learning_rate': 1.539139384033712e-05, 'epoch': 0.68} {'loss': 0.604, 'learning_rate': 1.539111087135193e-05, 'epoch': 0.68} {'loss': 0.7051, 'learning_rate': 1.5390827896281204e-05, 'epoch': 0.68} {'loss': 0.6224, 'learning_rate': 1.5390544915125257e-05, 'epoch': 0.68} {'loss': 0.6596, 'learning_rate': 1.539026192788441e-05, 'epoch': 0.68} {'loss': 0.6523, 'learning_rate': 1.5389978934558986e-05, 'epoch': 0.68} {'loss': 0.681, 'learning_rate': 1.5389695935149296e-05, 'epoch': 0.68} {'loss': 0.7436, 'learning_rate': 1.5389412929655666e-05, 'epoch': 0.68} {'loss': 0.6528, 'learning_rate': 1.5389129918078412e-05, 'epoch': 0.68} {'loss': 0.3869, 'learning_rate': 1.5388846900417856e-05, 'epoch': 0.68} {'loss': 0.703, 'learning_rate': 1.538856387667432e-05, 'epoch': 0.68} {'loss': 0.4949, 'learning_rate': 1.5388280846848116e-05, 'epoch': 0.68} {'loss': 0.6185, 'learning_rate': 1.5387997810939566e-05, 'epoch': 0.68} {'loss': 0.5702, 'learning_rate': 1.5387714768948995e-05, 'epoch': 0.68} {'loss': 0.6337, 'learning_rate': 1.5387431720876716e-05, 'epoch': 0.68} {'loss': 0.8223, 'learning_rate': 1.5387148666723053e-05, 'epoch': 0.68} {'loss': 0.5244, 'learning_rate': 1.5386865606488324e-05, 'epoch': 0.68} {'loss': 0.699, 'learning_rate': 1.5386582540172846e-05, 'epoch': 0.68} {'loss': 0.6809, 'learning_rate': 1.5386299467776943e-05, 'epoch': 0.68} {'loss': 0.5837, 'learning_rate': 1.538601638930093e-05, 'epoch': 0.68} {'loss': 0.4828, 'learning_rate': 1.5385733304745132e-05, 'epoch': 0.68} {'loss': 0.6363, 'learning_rate': 1.538545021410986e-05, 'epoch': 0.68} {'loss': 0.6267, 'learning_rate': 1.5385167117395442e-05, 'epoch': 0.68} {'loss': 0.5603, 'learning_rate': 1.5384884014602196e-05, 'epoch': 0.68} {'loss': 0.501, 'learning_rate': 1.5384600905730435e-05, 'epoch': 0.68} {'loss': 0.6385, 'learning_rate': 1.5384317790780487e-05, 'epoch': 0.68} {'loss': 0.534, 'learning_rate': 1.5384034669752668e-05, 'epoch': 0.68} {'loss': 0.7181, 'learning_rate': 1.5383751542647296e-05, 'epoch': 0.68} {'loss': 0.6263, 'learning_rate': 1.5383468409464694e-05, 'epoch': 0.68} {'loss': 0.5913, 'learning_rate': 1.5383185270205178e-05, 'epoch': 0.68} {'loss': 0.7367, 'learning_rate': 1.5382902124869072e-05, 'epoch': 0.68} {'loss': 0.4943, 'learning_rate': 1.538261897345669e-05, 'epoch': 0.68} {'loss': 0.713, 'learning_rate': 1.5382335815968355e-05, 'epoch': 0.68} {'loss': 0.5277, 'learning_rate': 1.538205265240439e-05, 'epoch': 0.68} {'loss': 0.6949, 'learning_rate': 1.538176948276511e-05, 'epoch': 0.68} {'loss': 0.6443, 'learning_rate': 1.5381486307050836e-05, 'epoch': 0.68} {'loss': 0.4337, 'learning_rate': 1.5381203125261884e-05, 'epoch': 0.68} {'loss': 0.5243, 'learning_rate': 1.538091993739858e-05, 'epoch': 0.68} {'loss': 0.6831, 'learning_rate': 1.538063674346124e-05, 'epoch': 0.68} {'loss': 0.5418, 'learning_rate': 1.538035354345018e-05, 'epoch': 0.68} {'loss': 0.5612, 'learning_rate': 1.538007033736573e-05, 'epoch': 0.68} {'loss': 0.4019, 'learning_rate': 1.53797871252082e-05, 'epoch': 0.68} {'loss': 0.6187, 'learning_rate': 1.5379503906977915e-05, 'epoch': 0.68} {'loss': 0.6218, 'learning_rate': 1.5379220682675194e-05, 'epoch': 0.68} {'loss': 0.6355, 'learning_rate': 1.5378937452300355e-05, 'epoch': 0.68} {'loss': 0.597, 'learning_rate': 1.5378654215853715e-05, 'epoch': 0.68} {'loss': 0.6185, 'learning_rate': 1.5378370973335605e-05, 'epoch': 0.68} {'loss': 0.5333, 'learning_rate': 1.537808772474633e-05, 'epoch': 0.68} {'loss': 0.5808, 'learning_rate': 1.537780447008622e-05, 'epoch': 0.68} {'loss': 0.7042, 'learning_rate': 1.5377521209355588e-05, 'epoch': 0.68} {'loss': 0.708, 'learning_rate': 1.537723794255476e-05, 'epoch': 0.68} {'loss': 0.4588, 'learning_rate': 1.537695466968405e-05, 'epoch': 0.68} {'loss': 0.7501, 'learning_rate': 1.537667139074378e-05, 'epoch': 0.68} {'loss': 0.5904, 'learning_rate': 1.5376388105734274e-05, 'epoch': 0.68} {'loss': 0.6907, 'learning_rate': 1.537610481465585e-05, 'epoch': 0.68} {'loss': 0.5899, 'learning_rate': 1.5375821517508823e-05, 'epoch': 0.68} {'loss': 0.7025, 'learning_rate': 1.5375538214293514e-05, 'epoch': 0.68} {'loss': 0.5092, 'learning_rate': 1.5375254905010248e-05, 'epoch': 0.68} {'loss': 0.5812, 'learning_rate': 1.537497158965934e-05, 'epoch': 0.68} {'loss': 0.6271, 'learning_rate': 1.5374688268241112e-05, 'epoch': 0.68} {'loss': 0.5273, 'learning_rate': 1.5374404940755883e-05, 'epoch': 0.68} {'loss': 0.5186, 'learning_rate': 1.537412160720397e-05, 'epoch': 0.68} {'loss': 0.665, 'learning_rate': 1.53738382675857e-05, 'epoch': 0.68} {'loss': 0.435, 'learning_rate': 1.5373554921901382e-05, 'epoch': 0.68} {'loss': 0.5735, 'learning_rate': 1.537327157015135e-05, 'epoch': 0.68} {'loss': 0.5299, 'learning_rate': 1.5372988212335914e-05, 'epoch': 0.68} {'loss': 0.5128, 'learning_rate': 1.5372704848455394e-05, 'epoch': 0.68} {'loss': 0.348, 'learning_rate': 1.537242147851011e-05, 'epoch': 0.68} {'loss': 0.6557, 'learning_rate': 1.5372138102500387e-05, 'epoch': 0.68} {'loss': 0.6253, 'learning_rate': 1.537185472042654e-05, 'epoch': 0.68} {'loss': 0.6471, 'learning_rate': 1.5371571332288895e-05, 'epoch': 0.68} {'loss': 0.5289, 'learning_rate': 1.5371287938087763e-05, 'epoch': 0.68} {'loss': 0.8211, 'learning_rate': 1.5371004537823468e-05, 'epoch': 0.68} {'loss': 0.6751, 'learning_rate': 1.537072113149633e-05, 'epoch': 0.68} {'loss': 0.6498, 'learning_rate': 1.537043771910667e-05, 'epoch': 0.68} {'loss': 0.6607, 'learning_rate': 1.537015430065481e-05, 'epoch': 0.68} {'loss': 0.6621, 'learning_rate': 1.5369870876141063e-05, 'epoch': 0.68} {'loss': 0.568, 'learning_rate': 1.5369587445565755e-05, 'epoch': 0.68} {'loss': 0.5652, 'learning_rate': 1.5369304008929204e-05, 'epoch': 0.68} {'loss': 0.5046, 'learning_rate': 1.536902056623173e-05, 'epoch': 0.68} {'loss': 0.6518, 'learning_rate': 1.536873711747365e-05, 'epoch': 0.68} {'loss': 0.655, 'learning_rate': 1.536845366265529e-05, 'epoch': 0.68} {'loss': 0.6228, 'learning_rate': 1.5368170201776964e-05, 'epoch': 0.68} {'loss': 0.6787, 'learning_rate': 1.5367886734839e-05, 'epoch': 0.68} {'loss': 0.5656, 'learning_rate': 1.5367603261841706e-05, 'epoch': 0.68} {'loss': 0.6313, 'learning_rate': 1.536731978278541e-05, 'epoch': 0.68} {'loss': 0.6544, 'learning_rate': 1.5367036297670433e-05, 'epoch': 0.68} {'loss': 0.5601, 'learning_rate': 1.5366752806497093e-05, 'epoch': 0.68} {'loss': 0.4846, 'learning_rate': 1.5366469309265706e-05, 'epoch': 0.68} {'loss': 0.5319, 'learning_rate': 1.5366185805976597e-05, 'epoch': 0.68} {'loss': 0.7297, 'learning_rate': 1.5365902296630088e-05, 'epoch': 0.68} {'loss': 0.5885, 'learning_rate': 1.5365618781226493e-05, 'epoch': 0.68} {'loss': 0.6137, 'learning_rate': 1.5365335259766132e-05, 'epoch': 0.68} {'loss': 0.6663, 'learning_rate': 1.5365051732249333e-05, 'epoch': 0.68} {'loss': 0.5828, 'learning_rate': 1.5364768198676404e-05, 'epoch': 0.68} {'loss': 0.681, 'learning_rate': 1.5364484659047677e-05, 'epoch': 0.68} {'loss': 0.5627, 'learning_rate': 1.5364201113363468e-05, 'epoch': 0.68} {'loss': 0.4607, 'learning_rate': 1.5363917561624095e-05, 'epoch': 0.68} {'loss': 0.5921, 'learning_rate': 1.5363634003829876e-05, 'epoch': 0.68} {'loss': 0.4609, 'learning_rate': 1.5363350439981137e-05, 'epoch': 0.68} {'loss': 0.4953, 'learning_rate': 1.5363066870078195e-05, 'epoch': 0.68} {'loss': 0.5612, 'learning_rate': 1.5362783294121367e-05, 'epoch': 0.68} {'loss': 0.7098, 'learning_rate': 1.536249971211098e-05, 'epoch': 0.68} {'loss': 0.6034, 'learning_rate': 1.536221612404735e-05, 'epoch': 0.68} {'loss': 0.781, 'learning_rate': 1.5361932529930795e-05, 'epoch': 0.68} {'loss': 0.5272, 'learning_rate': 1.5361648929761642e-05, 'epoch': 0.68} {'loss': 0.6237, 'learning_rate': 1.536136532354021e-05, 'epoch': 0.68} {'loss': 0.5667, 'learning_rate': 1.536108171126681e-05, 'epoch': 0.68} {'loss': 0.719, 'learning_rate': 1.5360798092941766e-05, 'epoch': 0.68} {'loss': 0.5107, 'learning_rate': 1.5360514468565404e-05, 'epoch': 0.68} {'loss': 0.5546, 'learning_rate': 1.5360230838138042e-05, 'epoch': 0.68} {'loss': 0.631, 'learning_rate': 1.5359947201659995e-05, 'epoch': 0.68} {'loss': 0.7113, 'learning_rate': 1.535966355913159e-05, 'epoch': 0.68} {'loss': 0.588, 'learning_rate': 1.5359379910553144e-05, 'epoch': 0.68} {'loss': 0.5973, 'learning_rate': 1.5359096255924973e-05, 'epoch': 0.68} {'loss': 0.5836, 'learning_rate': 1.5358812595247405e-05, 'epoch': 0.68} {'loss': 0.7197, 'learning_rate': 1.5358528928520758e-05, 'epoch': 0.68} {'loss': 0.4618, 'learning_rate': 1.5358245255745347e-05, 'epoch': 0.68} {'loss': 0.5694, 'learning_rate': 1.5357961576921497e-05, 'epoch': 0.68} {'loss': 0.5337, 'learning_rate': 1.535767789204953e-05, 'epoch': 0.68} {'loss': 0.6097, 'learning_rate': 1.5357394201129762e-05, 'epoch': 0.68} {'loss': 0.5863, 'learning_rate': 1.5357110504162514e-05, 'epoch': 0.68} {'loss': 0.5708, 'learning_rate': 1.5356826801148108e-05, 'epoch': 0.68} {'loss': 0.6479, 'learning_rate': 1.5356543092086863e-05, 'epoch': 0.68} {'loss': 0.5776, 'learning_rate': 1.5356259376979096e-05, 'epoch': 0.68} {'loss': 0.3881, 'learning_rate': 1.5355975655825134e-05, 'epoch': 0.68} {'loss': 0.5918, 'learning_rate': 1.5355691928625295e-05, 'epoch': 0.68} {'loss': 0.4981, 'learning_rate': 1.5355408195379897e-05, 'epoch': 0.68} {'loss': 0.6205, 'learning_rate': 1.535512445608926e-05, 'epoch': 0.68} {'loss': 0.7418, 'learning_rate': 1.5354840710753708e-05, 'epoch': 0.68} {'loss': 0.4686, 'learning_rate': 1.5354556959373558e-05, 'epoch': 0.68} {'loss': 0.5257, 'learning_rate': 1.5354273201949134e-05, 'epoch': 0.68} {'loss': 0.4804, 'learning_rate': 1.5353989438480746e-05, 'epoch': 0.68} {'loss': 0.3852, 'learning_rate': 1.535370566896873e-05, 'epoch': 0.68} {'loss': 0.6303, 'learning_rate': 1.5353421893413397e-05, 'epoch': 0.68} {'loss': 0.6534, 'learning_rate': 1.535313811181507e-05, 'epoch': 0.68} {'loss': 0.5387, 'learning_rate': 1.5352854324174065e-05, 'epoch': 0.68} {'loss': 0.4835, 'learning_rate': 1.5352570530490705e-05, 'epoch': 0.68} {'loss': 0.4662, 'learning_rate': 1.5352286730765312e-05, 'epoch': 0.68} {'loss': 0.5051, 'learning_rate': 1.53520029249982e-05, 'epoch': 0.68} {'loss': 0.5969, 'learning_rate': 1.5351719113189703e-05, 'epoch': 0.68} {'loss': 0.5992, 'learning_rate': 1.535143529534013e-05, 'epoch': 0.68} {'loss': 0.5222, 'learning_rate': 1.5351151471449803e-05, 'epoch': 0.68} {'loss': 0.6626, 'learning_rate': 1.5350867641519043e-05, 'epoch': 0.68} {'loss': 0.4942, 'learning_rate': 1.535058380554817e-05, 'epoch': 0.68} {'loss': 0.6226, 'learning_rate': 1.5350299963537506e-05, 'epoch': 0.68} {'loss': 0.6687, 'learning_rate': 1.5350016115487373e-05, 'epoch': 0.68} {'loss': 0.5186, 'learning_rate': 1.534973226139809e-05, 'epoch': 0.68} {'loss': 0.6378, 'learning_rate': 1.534944840126997e-05, 'epoch': 0.68} {'loss': 0.6347, 'learning_rate': 1.5349164535103344e-05, 'epoch': 0.68} {'loss': 0.6419, 'learning_rate': 1.534888066289853e-05, 'epoch': 0.68} {'loss': 0.5305, 'learning_rate': 1.5348596784655845e-05, 'epoch': 0.68} {'loss': 0.5228, 'learning_rate': 1.5348312900375612e-05, 'epoch': 0.68} {'loss': 0.6091, 'learning_rate': 1.534802901005815e-05, 'epoch': 0.68} {'loss': 0.5151, 'learning_rate': 1.5347745113703784e-05, 'epoch': 0.68} {'loss': 0.5553, 'learning_rate': 1.5347461211312828e-05, 'epoch': 0.68} {'loss': 0.4994, 'learning_rate': 1.5347177302885604e-05, 'epoch': 0.68} {'loss': 0.7093, 'learning_rate': 1.5346893388422436e-05, 'epoch': 0.68} {'loss': 0.5475, 'learning_rate': 1.5346609467923637e-05, 'epoch': 0.68} {'loss': 0.5989, 'learning_rate': 1.534632554138954e-05, 'epoch': 0.68} {'loss': 0.5108, 'learning_rate': 1.534604160882045e-05, 'epoch': 0.68} {'loss': 0.5455, 'learning_rate': 1.53457576702167e-05, 'epoch': 0.68} {'loss': 0.6112, 'learning_rate': 1.5345473725578604e-05, 'epoch': 0.68} {'loss': 0.6386, 'learning_rate': 1.534518977490649e-05, 'epoch': 0.68} {'loss': 0.4882, 'learning_rate': 1.5344905818200667e-05, 'epoch': 0.68} {'loss': 0.4043, 'learning_rate': 1.5344621855461467e-05, 'epoch': 0.68} {'loss': 0.5681, 'learning_rate': 1.5344337886689203e-05, 'epoch': 0.68} {'loss': 0.6492, 'learning_rate': 1.5344053911884194e-05, 'epoch': 0.68} {'loss': 0.5334, 'learning_rate': 1.5343769931046773e-05, 'epoch': 0.68} {'loss': 0.6371, 'learning_rate': 1.5343485944177247e-05, 'epoch': 0.68} {'loss': 0.7506, 'learning_rate': 1.5343201951275942e-05, 'epoch': 0.68} {'loss': 0.6276, 'learning_rate': 1.5342917952343176e-05, 'epoch': 0.68} {'loss': 0.6132, 'learning_rate': 1.534263394737927e-05, 'epoch': 0.68} {'loss': 0.5541, 'learning_rate': 1.5342349936384553e-05, 'epoch': 0.68} {'loss': 0.6692, 'learning_rate': 1.5342065919359333e-05, 'epoch': 0.68} {'loss': 0.4904, 'learning_rate': 1.534178189630394e-05, 'epoch': 0.68} {'loss': 0.4375, 'learning_rate': 1.5341497867218688e-05, 'epoch': 0.68} {'loss': 0.5371, 'learning_rate': 1.5341213832103904e-05, 'epoch': 0.68} {'loss': 0.6775, 'learning_rate': 1.53409297909599e-05, 'epoch': 0.68} {'loss': 0.4405, 'learning_rate': 1.5340645743787007e-05, 'epoch': 0.68} {'loss': 0.5262, 'learning_rate': 1.5340361690585538e-05, 'epoch': 0.68} {'loss': 0.5992, 'learning_rate': 1.5340077631355817e-05, 'epoch': 0.68} {'loss': 0.6109, 'learning_rate': 1.5339793566098166e-05, 'epoch': 0.68} {'loss': 0.7383, 'learning_rate': 1.53395094948129e-05, 'epoch': 0.68} {'loss': 0.6401, 'learning_rate': 1.5339225417500346e-05, 'epoch': 0.68} {'loss': 0.524, 'learning_rate': 1.533894133416082e-05, 'epoch': 0.68} {'loss': 0.6365, 'learning_rate': 1.5338657244794644e-05, 'epoch': 0.68} {'loss': 0.653, 'learning_rate': 1.5338373149402143e-05, 'epoch': 0.68} {'loss': 0.4459, 'learning_rate': 1.533808904798363e-05, 'epoch': 0.68} {'loss': 0.3693, 'learning_rate': 1.533780494053943e-05, 'epoch': 0.68} {'loss': 0.6317, 'learning_rate': 1.533752082706986e-05, 'epoch': 0.68} {'loss': 0.5901, 'learning_rate': 1.533723670757525e-05, 'epoch': 0.68} {'loss': 0.6845, 'learning_rate': 1.533695258205591e-05, 'epoch': 0.68} {'loss': 0.4185, 'learning_rate': 1.533666845051217e-05, 'epoch': 0.68} {'loss': 0.6424, 'learning_rate': 1.5336384312944343e-05, 'epoch': 0.68} {'loss': 0.711, 'learning_rate': 1.5336100169352756e-05, 'epoch': 0.68} {'loss': 0.6275, 'learning_rate': 1.533581601973772e-05, 'epoch': 0.68} {'loss': 0.5339, 'learning_rate': 1.5335531864099567e-05, 'epoch': 0.68} {'loss': 0.5378, 'learning_rate': 1.5335247702438613e-05, 'epoch': 0.68} {'loss': 0.5247, 'learning_rate': 1.533496353475518e-05, 'epoch': 0.68} {'loss': 0.5502, 'learning_rate': 1.5334679361049586e-05, 'epoch': 0.68} {'loss': 0.611, 'learning_rate': 1.5334395181322154e-05, 'epoch': 0.68} {'loss': 0.5199, 'learning_rate': 1.5334110995573202e-05, 'epoch': 0.68} {'loss': 0.5927, 'learning_rate': 1.5333826803803055e-05, 'epoch': 0.68} {'loss': 0.5805, 'learning_rate': 1.533354260601203e-05, 'epoch': 0.68} {'loss': 0.4374, 'learning_rate': 1.5333258402200452e-05, 'epoch': 0.68} {'loss': 0.5283, 'learning_rate': 1.5332974192368642e-05, 'epoch': 0.68} {'loss': 0.7352, 'learning_rate': 1.5332689976516915e-05, 'epoch': 0.68} {'loss': 0.6058, 'learning_rate': 1.5332405754645593e-05, 'epoch': 0.68} {'loss': 0.6844, 'learning_rate': 1.5332121526755003e-05, 'epoch': 0.68} {'loss': 0.6302, 'learning_rate': 1.533183729284546e-05, 'epoch': 0.68} {'loss': 0.8377, 'learning_rate': 1.5331553052917284e-05, 'epoch': 0.68} {'loss': 0.4871, 'learning_rate': 1.5331268806970802e-05, 'epoch': 0.68} {'loss': 0.6331, 'learning_rate': 1.533098455500633e-05, 'epoch': 0.68} {'loss': 0.49, 'learning_rate': 1.5330700297024187e-05, 'epoch': 0.68} {'loss': 0.5505, 'learning_rate': 1.5330416033024702e-05, 'epoch': 0.68} {'loss': 0.6106, 'learning_rate': 1.533013176300819e-05, 'epoch': 0.68} {'loss': 0.5991, 'learning_rate': 1.532984748697497e-05, 'epoch': 0.68} {'loss': 0.6345, 'learning_rate': 1.532956320492537e-05, 'epoch': 0.68} {'loss': 0.6045, 'learning_rate': 1.5329278916859703e-05, 'epoch': 0.68} {'loss': 0.5919, 'learning_rate': 1.5328994622778297e-05, 'epoch': 0.68} {'loss': 0.569, 'learning_rate': 1.5328710322681465e-05, 'epoch': 0.68} {'loss': 0.6959, 'learning_rate': 1.5328426016569538e-05, 'epoch': 0.68} {'loss': 0.5229, 'learning_rate': 1.5328141704442827e-05, 'epoch': 0.68} {'loss': 0.7568, 'learning_rate': 1.5327857386301656e-05, 'epoch': 0.68} {'loss': 0.5251, 'learning_rate': 1.532757306214635e-05, 'epoch': 0.68} {'loss': 0.5556, 'learning_rate': 1.532728873197723e-05, 'epoch': 0.68} {'loss': 0.6246, 'learning_rate': 1.5327004395794608e-05, 'epoch': 0.68} {'loss': 0.7584, 'learning_rate': 1.5326720053598813e-05, 'epoch': 0.68} {'loss': 0.6295, 'learning_rate': 1.5326435705390165e-05, 'epoch': 0.68} {'loss': 0.5413, 'learning_rate': 1.5326151351168982e-05, 'epoch': 0.68} {'loss': 0.5317, 'learning_rate': 1.532586699093559e-05, 'epoch': 0.68} {'loss': 0.5511, 'learning_rate': 1.5325582624690304e-05, 'epoch': 0.68} {'loss': 0.6234, 'learning_rate': 1.5325298252433452e-05, 'epoch': 0.68} {'loss': 0.7713, 'learning_rate': 1.5325013874165346e-05, 'epoch': 0.68} {'loss': 0.5053, 'learning_rate': 1.5324729489886315e-05, 'epoch': 0.68} {'loss': 0.5939, 'learning_rate': 1.5324445099596673e-05, 'epoch': 0.68} {'loss': 0.4388, 'learning_rate': 1.532416070329675e-05, 'epoch': 0.68} {'loss': 0.7973, 'learning_rate': 1.532387630098686e-05, 'epoch': 0.68} {'loss': 0.6369, 'learning_rate': 1.5323591892667327e-05, 'epoch': 0.68} {'loss': 0.6382, 'learning_rate': 1.532330747833847e-05, 'epoch': 0.68} {'loss': 0.532, 'learning_rate': 1.532302305800061e-05, 'epoch': 0.68} {'loss': 0.6122, 'learning_rate': 1.5322738631654067e-05, 'epoch': 0.68} {'loss': 0.6847, 'learning_rate': 1.532245419929917e-05, 'epoch': 0.68} {'loss': 0.6179, 'learning_rate': 1.532216976093623e-05, 'epoch': 0.68} {'loss': 0.5005, 'learning_rate': 1.5321885316565576e-05, 'epoch': 0.68} {'loss': 0.5756, 'learning_rate': 1.5321600866187526e-05, 'epoch': 0.68} {'loss': 0.5893, 'learning_rate': 1.53213164098024e-05, 'epoch': 0.68} {'loss': 0.6852, 'learning_rate': 1.5321031947410515e-05, 'epoch': 0.68} {'loss': 0.5456, 'learning_rate': 1.5320747479012198e-05, 'epoch': 0.69} {'loss': 0.5818, 'learning_rate': 1.532046300460777e-05, 'epoch': 0.69} {'loss': 0.7588, 'learning_rate': 1.5320178524197553e-05, 'epoch': 0.69} {'loss': 0.534, 'learning_rate': 1.5319894037781863e-05, 'epoch': 0.69} {'loss': 0.6014, 'learning_rate': 1.531960954536103e-05, 'epoch': 0.69} {'loss': 0.759, 'learning_rate': 1.5319325046935362e-05, 'epoch': 0.69} {'loss': 0.6481, 'learning_rate': 1.5319040542505192e-05, 'epoch': 0.69} {'loss': 0.6996, 'learning_rate': 1.531875603207084e-05, 'epoch': 0.69} {'loss': 0.4716, 'learning_rate': 1.5318471515632614e-05, 'epoch': 0.69} {'loss': 0.4934, 'learning_rate': 1.5318186993190854e-05, 'epoch': 0.69} {'loss': 0.4932, 'learning_rate': 1.531790246474587e-05, 'epoch': 0.69} {'loss': 0.4449, 'learning_rate': 1.5317617930297984e-05, 'epoch': 0.69} {'loss': 0.5254, 'learning_rate': 1.5317333389847514e-05, 'epoch': 0.69} {'loss': 0.5821, 'learning_rate': 1.5317048843394792e-05, 'epoch': 0.69} {'loss': 0.6065, 'learning_rate': 1.5316764290940134e-05, 'epoch': 0.69} {'loss': 0.5871, 'learning_rate': 1.5316479732483854e-05, 'epoch': 0.69} {'loss': 0.572, 'learning_rate': 1.5316195168026285e-05, 'epoch': 0.69} {'loss': 0.7152, 'learning_rate': 1.531591059756774e-05, 'epoch': 0.69} {'loss': 0.7194, 'learning_rate': 1.5315626021108543e-05, 'epoch': 0.69} {'loss': 0.6259, 'learning_rate': 1.5315341438649016e-05, 'epoch': 0.69} {'loss': 0.562, 'learning_rate': 1.531505685018948e-05, 'epoch': 0.69} {'loss': 0.711, 'learning_rate': 1.5314772255730256e-05, 'epoch': 0.69} {'loss': 0.6083, 'learning_rate': 1.531448765527166e-05, 'epoch': 0.69} {'loss': 0.5839, 'learning_rate': 1.531420304881402e-05, 'epoch': 0.69} {'loss': 0.5823, 'learning_rate': 1.5313918436357654e-05, 'epoch': 0.69} {'loss': 0.4165, 'learning_rate': 1.531363381790289e-05, 'epoch': 0.69} {'loss': 0.6465, 'learning_rate': 1.531334919345004e-05, 'epoch': 0.69} {'loss': 0.5215, 'learning_rate': 1.5313064562999428e-05, 'epoch': 0.69} {'loss': 0.5241, 'learning_rate': 1.531277992655138e-05, 'epoch': 0.69} {'loss': 0.6183, 'learning_rate': 1.531249528410621e-05, 'epoch': 0.69} {'loss': 0.6769, 'learning_rate': 1.5312210635664247e-05, 'epoch': 0.69} {'loss': 0.5025, 'learning_rate': 1.5311925981225802e-05, 'epoch': 0.69} {'loss': 0.5038, 'learning_rate': 1.531164132079121e-05, 'epoch': 0.69} {'loss': 0.554, 'learning_rate': 1.5311356654360782e-05, 'epoch': 0.69} {'loss': 0.6994, 'learning_rate': 1.5311071981934844e-05, 'epoch': 0.69} {'loss': 0.7988, 'learning_rate': 1.5310787303513715e-05, 'epoch': 0.69} {'loss': 0.5757, 'learning_rate': 1.5310502619097713e-05, 'epoch': 0.69} {'loss': 0.7203, 'learning_rate': 1.531021792868717e-05, 'epoch': 0.69} {'loss': 0.6327, 'learning_rate': 1.5309933232282395e-05, 'epoch': 0.69} {'loss': 0.7613, 'learning_rate': 1.5309648529883715e-05, 'epoch': 0.69} {'loss': 0.5987, 'learning_rate': 1.5309363821491456e-05, 'epoch': 0.69} {'loss': 0.4135, 'learning_rate': 1.5309079107105932e-05, 'epoch': 0.69} {'loss': 0.6021, 'learning_rate': 1.530879438672747e-05, 'epoch': 0.69} {'loss': 0.5101, 'learning_rate': 1.5308509660356385e-05, 'epoch': 0.69} {'loss': 0.6652, 'learning_rate': 1.5308224927993003e-05, 'epoch': 0.69} {'loss': 0.5567, 'learning_rate': 1.5307940189637645e-05, 'epoch': 0.69} {'loss': 0.4708, 'learning_rate': 1.5307655445290634e-05, 'epoch': 0.69} {'loss': 0.5192, 'learning_rate': 1.5307370694952284e-05, 'epoch': 0.69} {'loss': 0.6187, 'learning_rate': 1.5307085938622925e-05, 'epoch': 0.69} {'loss': 0.5707, 'learning_rate': 1.5306801176302878e-05, 'epoch': 0.69} {'loss': 0.7473, 'learning_rate': 1.5306516407992454e-05, 'epoch': 0.69} {'loss': 0.6352, 'learning_rate': 1.530623163369199e-05, 'epoch': 0.69} {'loss': 0.495, 'learning_rate': 1.5305946853401796e-05, 'epoch': 0.69} {'loss': 0.5712, 'learning_rate': 1.5305662067122195e-05, 'epoch': 0.69} {'loss': 0.6124, 'learning_rate': 1.5305377274853516e-05, 'epoch': 0.69} {'loss': 0.5202, 'learning_rate': 1.530509247659607e-05, 'epoch': 0.69} {'loss': 0.5213, 'learning_rate': 1.5304807672350185e-05, 'epoch': 0.69} {'loss': 0.5422, 'learning_rate': 1.5304522862116184e-05, 'epoch': 0.69} {'loss': 0.4423, 'learning_rate': 1.530423804589438e-05, 'epoch': 0.69} {'loss': 0.5319, 'learning_rate': 1.53039532236851e-05, 'epoch': 0.69} {'loss': 0.4516, 'learning_rate': 1.5303668395488668e-05, 'epoch': 0.69} {'loss': 0.6096, 'learning_rate': 1.5303383561305404e-05, 'epoch': 0.69} {'loss': 0.7118, 'learning_rate': 1.530309872113563e-05, 'epoch': 0.69} {'loss': 0.5207, 'learning_rate': 1.530281387497966e-05, 'epoch': 0.69} {'loss': 0.5183, 'learning_rate': 1.5302529022837825e-05, 'epoch': 0.69} {'loss': 0.649, 'learning_rate': 1.530224416471044e-05, 'epoch': 0.69} {'loss': 0.5592, 'learning_rate': 1.5301959300597832e-05, 'epoch': 0.69} {'loss': 0.5368, 'learning_rate': 1.5301674430500323e-05, 'epoch': 0.69} {'loss': 0.6153, 'learning_rate': 1.5301389554418228e-05, 'epoch': 0.69} {'loss': 0.6134, 'learning_rate': 1.5301104672351873e-05, 'epoch': 0.69} {'loss': 0.689, 'learning_rate': 1.530081978430158e-05, 'epoch': 0.69} {'loss': 0.5255, 'learning_rate': 1.5300534890267667e-05, 'epoch': 0.69} {'loss': 0.612, 'learning_rate': 1.530024999025046e-05, 'epoch': 0.69} {'loss': 0.5352, 'learning_rate': 1.529996508425028e-05, 'epoch': 0.69} {'loss': 0.3952, 'learning_rate': 1.5299680172267444e-05, 'epoch': 0.69} {'loss': 0.5735, 'learning_rate': 1.529939525430228e-05, 'epoch': 0.69} {'loss': 0.5004, 'learning_rate': 1.5299110330355106e-05, 'epoch': 0.69} {'loss': 0.4762, 'learning_rate': 1.5298825400426242e-05, 'epoch': 0.69} {'loss': 0.5053, 'learning_rate': 1.529854046451601e-05, 'epoch': 0.69} {'loss': 0.5777, 'learning_rate': 1.529825552262474e-05, 'epoch': 0.69} {'loss': 0.7283, 'learning_rate': 1.5297970574752742e-05, 'epoch': 0.69} {'loss': 0.5715, 'learning_rate': 1.5297685620900344e-05, 'epoch': 0.69} {'loss': 0.5959, 'learning_rate': 1.5297400661067867e-05, 'epoch': 0.69} {'loss': 0.6352, 'learning_rate': 1.529711569525563e-05, 'epoch': 0.69} {'loss': 0.4698, 'learning_rate': 1.529683072346396e-05, 'epoch': 0.69} {'loss': 0.4451, 'learning_rate': 1.529654574569317e-05, 'epoch': 0.69} {'loss': 0.402, 'learning_rate': 1.5296260761943594e-05, 'epoch': 0.69} {'loss': 0.7261, 'learning_rate': 1.5295975772215542e-05, 'epoch': 0.69} {'loss': 0.6438, 'learning_rate': 1.529569077650934e-05, 'epoch': 0.69} {'loss': 0.4683, 'learning_rate': 1.5295405774825313e-05, 'epoch': 0.69} {'loss': 0.6308, 'learning_rate': 1.5295120767163778e-05, 'epoch': 0.69} {'loss': 0.4391, 'learning_rate': 1.5294835753525057e-05, 'epoch': 0.69} {'loss': 0.7404, 'learning_rate': 1.5294550733909475e-05, 'epoch': 0.69} {'loss': 0.7229, 'learning_rate': 1.5294265708317354e-05, 'epoch': 0.69} {'loss': 0.6113, 'learning_rate': 1.529398067674901e-05, 'epoch': 0.69} {'loss': 0.6705, 'learning_rate': 1.5293695639204772e-05, 'epoch': 0.69} {'loss': 0.6542, 'learning_rate': 1.5293410595684955e-05, 'epoch': 0.69} {'loss': 0.6633, 'learning_rate': 1.529312554618989e-05, 'epoch': 0.69} {'loss': 0.6709, 'learning_rate': 1.5292840490719884e-05, 'epoch': 0.69} {'loss': 0.6403, 'learning_rate': 1.5292555429275275e-05, 'epoch': 0.69} {'loss': 0.5168, 'learning_rate': 1.5292270361856375e-05, 'epoch': 0.69} {'loss': 0.4865, 'learning_rate': 1.5291985288463505e-05, 'epoch': 0.69} {'loss': 0.6012, 'learning_rate': 1.5291700209096993e-05, 'epoch': 0.69} {'loss': 0.5284, 'learning_rate': 1.529141512375716e-05, 'epoch': 0.69} {'loss': 0.4869, 'learning_rate': 1.5291130032444322e-05, 'epoch': 0.69} {'loss': 0.4846, 'learning_rate': 1.5290844935158804e-05, 'epoch': 0.69} {'loss': 0.5333, 'learning_rate': 1.529055983190093e-05, 'epoch': 0.69} {'loss': 0.6921, 'learning_rate': 1.529027472267102e-05, 'epoch': 0.69} {'loss': 0.5672, 'learning_rate': 1.5289989607469395e-05, 'epoch': 0.69} {'loss': 0.425, 'learning_rate': 1.528970448629638e-05, 'epoch': 0.69} {'loss': 0.4433, 'learning_rate': 1.528941935915229e-05, 'epoch': 0.69} {'loss': 0.6016, 'learning_rate': 1.5289134226037453e-05, 'epoch': 0.69} {'loss': 0.5977, 'learning_rate': 1.528884908695219e-05, 'epoch': 0.69} {'loss': 0.5337, 'learning_rate': 1.5288563941896822e-05, 'epoch': 0.69} {'loss': 0.6179, 'learning_rate': 1.528827879087167e-05, 'epoch': 0.69} {'loss': 0.5212, 'learning_rate': 1.528799363387706e-05, 'epoch': 0.69} {'loss': 0.5534, 'learning_rate': 1.5287708470913308e-05, 'epoch': 0.69} {'loss': 0.4428, 'learning_rate': 1.528742330198074e-05, 'epoch': 0.69} {'loss': 0.5671, 'learning_rate': 1.5287138127079674e-05, 'epoch': 0.69} {'loss': 0.5221, 'learning_rate': 1.528685294621044e-05, 'epoch': 0.69} {'loss': 0.5807, 'learning_rate': 1.528656775937335e-05, 'epoch': 0.69} {'loss': 0.5775, 'learning_rate': 1.528628256656873e-05, 'epoch': 0.69} {'loss': 0.5362, 'learning_rate': 1.5285997367796902e-05, 'epoch': 0.69} {'loss': 0.5688, 'learning_rate': 1.528571216305819e-05, 'epoch': 0.69} {'loss': 0.4506, 'learning_rate': 1.5285426952352914e-05, 'epoch': 0.69} {'loss': 0.6067, 'learning_rate': 1.5285141735681396e-05, 'epoch': 0.69} {'loss': 0.4854, 'learning_rate': 1.5284856513043956e-05, 'epoch': 0.69} {'loss': 0.5346, 'learning_rate': 1.5284571284440918e-05, 'epoch': 0.69} {'loss': 0.613, 'learning_rate': 1.528428604987261e-05, 'epoch': 0.69} {'loss': 0.5296, 'learning_rate': 1.5284000809339342e-05, 'epoch': 0.69} {'loss': 0.5865, 'learning_rate': 1.5283715562841442e-05, 'epoch': 0.69} {'loss': 0.6158, 'learning_rate': 1.5283430310379234e-05, 'epoch': 0.69} {'loss': 0.4297, 'learning_rate': 1.528314505195304e-05, 'epoch': 0.69} {'loss': 0.6252, 'learning_rate': 1.5282859787563174e-05, 'epoch': 0.69} {'loss': 0.6671, 'learning_rate': 1.5282574517209967e-05, 'epoch': 0.69} {'loss': 0.4008, 'learning_rate': 1.528228924089374e-05, 'epoch': 0.69} {'loss': 0.5746, 'learning_rate': 1.5282003958614805e-05, 'epoch': 0.69} {'loss': 0.5368, 'learning_rate': 1.5281718670373498e-05, 'epoch': 0.69} {'loss': 0.6236, 'learning_rate': 1.5281433376170137e-05, 'epoch': 0.69} {'loss': 0.6974, 'learning_rate': 1.528114807600504e-05, 'epoch': 0.69} {'loss': 0.4836, 'learning_rate': 1.528086276987853e-05, 'epoch': 0.69} {'loss': 0.6961, 'learning_rate': 1.5280577457790928e-05, 'epoch': 0.69} {'loss': 0.5358, 'learning_rate': 1.5280292139742562e-05, 'epoch': 0.69} {'loss': 0.4357, 'learning_rate': 1.5280006815733747e-05, 'epoch': 0.69} {'loss': 0.4067, 'learning_rate': 1.5279721485764813e-05, 'epoch': 0.69} {'loss': 0.5708, 'learning_rate': 1.5279436149836076e-05, 'epoch': 0.69} {'loss': 0.739, 'learning_rate': 1.5279150807947856e-05, 'epoch': 0.69} {'loss': 0.7572, 'learning_rate': 1.5278865460100482e-05, 'epoch': 0.69} {'loss': 0.783, 'learning_rate': 1.5278580106294268e-05, 'epoch': 0.69} {'loss': 0.6741, 'learning_rate': 1.5278294746529546e-05, 'epoch': 0.69} {'loss': 0.5292, 'learning_rate': 1.5278009380806633e-05, 'epoch': 0.69} {'loss': 0.6826, 'learning_rate': 1.527772400912585e-05, 'epoch': 0.69} {'loss': 0.412, 'learning_rate': 1.527743863148752e-05, 'epoch': 0.69} {'loss': 0.5313, 'learning_rate': 1.5277153247891962e-05, 'epoch': 0.69} {'loss': 0.5081, 'learning_rate': 1.5276867858339505e-05, 'epoch': 0.69} {'loss': 0.4654, 'learning_rate': 1.5276582462830467e-05, 'epoch': 0.69} {'loss': 0.6461, 'learning_rate': 1.5276297061365175e-05, 'epoch': 0.69} {'loss': 0.5438, 'learning_rate': 1.527601165394394e-05, 'epoch': 0.69} {'loss': 0.5692, 'learning_rate': 1.5275726240567096e-05, 'epoch': 0.69} {'loss': 0.5745, 'learning_rate': 1.527544082123496e-05, 'epoch': 0.69} {'loss': 0.5685, 'learning_rate': 1.527515539594785e-05, 'epoch': 0.69} {'loss': 0.7469, 'learning_rate': 1.5274869964706095e-05, 'epoch': 0.69} {'loss': 0.5518, 'learning_rate': 1.5274584527510016e-05, 'epoch': 0.69} {'loss': 0.5605, 'learning_rate': 1.5274299084359932e-05, 'epoch': 0.69} {'loss': 0.5216, 'learning_rate': 1.527401363525617e-05, 'epoch': 0.69} {'loss': 0.4622, 'learning_rate': 1.527372818019905e-05, 'epoch': 0.69} {'loss': 0.7604, 'learning_rate': 1.5273442719188892e-05, 'epoch': 0.69} {'loss': 0.5333, 'learning_rate': 1.527315725222602e-05, 'epoch': 0.69} {'loss': 0.5223, 'learning_rate': 1.5272871779310757e-05, 'epoch': 0.69} {'loss': 0.5217, 'learning_rate': 1.5272586300443425e-05, 'epoch': 0.69} {'loss': 0.5663, 'learning_rate': 1.527230081562434e-05, 'epoch': 0.69} {'loss': 0.5141, 'learning_rate': 1.527201532485384e-05, 'epoch': 0.69} {'loss': 0.5304, 'learning_rate': 1.5271729828132228e-05, 'epoch': 0.69} {'loss': 0.6215, 'learning_rate': 1.5271444325459838e-05, 'epoch': 0.69} {'loss': 0.7035, 'learning_rate': 1.5271158816836994e-05, 'epoch': 0.69} {'loss': 0.4956, 'learning_rate': 1.5270873302264008e-05, 'epoch': 0.69} {'loss': 0.5369, 'learning_rate': 1.5270587781741212e-05, 'epoch': 0.69} {'loss': 0.6323, 'learning_rate': 1.5270302255268924e-05, 'epoch': 0.69} {'loss': 0.6061, 'learning_rate': 1.5270016722847466e-05, 'epoch': 0.69} {'loss': 0.7639, 'learning_rate': 1.526973118447716e-05, 'epoch': 0.69} {'loss': 0.5363, 'learning_rate': 1.5269445640158333e-05, 'epoch': 0.69} {'loss': 0.6638, 'learning_rate': 1.5269160089891304e-05, 'epoch': 0.69} {'loss': 0.6342, 'learning_rate': 1.5268874533676396e-05, 'epoch': 0.69} {'loss': 0.6648, 'learning_rate': 1.5268588971513928e-05, 'epoch': 0.69} {'loss': 0.6427, 'learning_rate': 1.5268303403404224e-05, 'epoch': 0.69} {'loss': 0.6883, 'learning_rate': 1.5268017829347607e-05, 'epoch': 0.69} {'loss': 0.482, 'learning_rate': 1.52677322493444e-05, 'epoch': 0.69} {'loss': 0.7291, 'learning_rate': 1.526744666339493e-05, 'epoch': 0.69} {'loss': 0.555, 'learning_rate': 1.5267161071499506e-05, 'epoch': 0.69} {'loss': 0.5479, 'learning_rate': 1.5266875473658465e-05, 'epoch': 0.69} {'loss': 0.6609, 'learning_rate': 1.526658986987212e-05, 'epoch': 0.69} {'loss': 0.4403, 'learning_rate': 1.5266304260140797e-05, 'epoch': 0.69} {'loss': 0.7288, 'learning_rate': 1.526601864446482e-05, 'epoch': 0.69} {'loss': 0.4614, 'learning_rate': 1.5265733022844508e-05, 'epoch': 0.69} {'loss': 0.6581, 'learning_rate': 1.5265447395280183e-05, 'epoch': 0.69} {'loss': 0.6202, 'learning_rate': 1.5265161761772174e-05, 'epoch': 0.69} {'loss': 0.5456, 'learning_rate': 1.5264876122320798e-05, 'epoch': 0.69} {'loss': 0.5385, 'learning_rate': 1.5264590476926372e-05, 'epoch': 0.69} {'loss': 0.5968, 'learning_rate': 1.5264304825589227e-05, 'epoch': 0.69} {'loss': 0.6072, 'learning_rate': 1.5264019168309685e-05, 'epoch': 0.69} {'loss': 0.5644, 'learning_rate': 1.5263733505088065e-05, 'epoch': 0.69} {'loss': 0.5426, 'learning_rate': 1.5263447835924692e-05, 'epoch': 0.69} {'loss': 0.4748, 'learning_rate': 1.5263162160819884e-05, 'epoch': 0.69} {'loss': 0.6815, 'learning_rate': 1.5262876479773973e-05, 'epoch': 0.69} {'loss': 0.4798, 'learning_rate': 1.5262590792787268e-05, 'epoch': 0.69} {'loss': 0.5068, 'learning_rate': 1.5262305099860104e-05, 'epoch': 0.69} {'loss': 0.6681, 'learning_rate': 1.52620194009928e-05, 'epoch': 0.69} {'loss': 0.4372, 'learning_rate': 1.526173369618567e-05, 'epoch': 0.69} {'loss': 0.4916, 'learning_rate': 1.5261447985439047e-05, 'epoch': 0.69} {'loss': 0.522, 'learning_rate': 1.526116226875325e-05, 'epoch': 0.69} {'loss': 0.6186, 'learning_rate': 1.5260876546128602e-05, 'epoch': 0.69} {'loss': 0.5098, 'learning_rate': 1.526059081756542e-05, 'epoch': 0.69} {'loss': 0.4977, 'learning_rate': 1.5260305083064032e-05, 'epoch': 0.69} {'loss': 0.5537, 'learning_rate': 1.5260019342624764e-05, 'epoch': 0.69} {'loss': 0.7099, 'learning_rate': 1.525973359624793e-05, 'epoch': 0.69} {'loss': 0.5439, 'learning_rate': 1.5259447843933864e-05, 'epoch': 0.69} {'loss': 0.5011, 'learning_rate': 1.5259162085682875e-05, 'epoch': 0.69} {'loss': 0.6182, 'learning_rate': 1.5258876321495294e-05, 'epoch': 0.69} {'loss': 0.502, 'learning_rate': 1.5258590551371444e-05, 'epoch': 0.69} {'loss': 0.5084, 'learning_rate': 1.5258304775311644e-05, 'epoch': 0.69} {'loss': 0.3957, 'learning_rate': 1.5258018993316218e-05, 'epoch': 0.69} {'loss': 0.6037, 'learning_rate': 1.5257733205385486e-05, 'epoch': 0.69} {'loss': 0.4445, 'learning_rate': 1.5257447411519772e-05, 'epoch': 0.69} {'loss': 0.5515, 'learning_rate': 1.5257161611719404e-05, 'epoch': 0.69} {'loss': 0.4954, 'learning_rate': 1.5256875805984698e-05, 'epoch': 0.69} {'loss': 0.6172, 'learning_rate': 1.5256589994315979e-05, 'epoch': 0.69} {'loss': 0.6716, 'learning_rate': 1.5256304176713568e-05, 'epoch': 0.69} {'loss': 0.606, 'learning_rate': 1.525601835317779e-05, 'epoch': 0.69} {'loss': 0.4951, 'learning_rate': 1.5255732523708968e-05, 'epoch': 0.69} {'loss': 0.6955, 'learning_rate': 1.5255446688307425e-05, 'epoch': 0.69} {'loss': 0.3866, 'learning_rate': 1.5255160846973479e-05, 'epoch': 0.69} {'loss': 0.6766, 'learning_rate': 1.5254874999707459e-05, 'epoch': 0.69} {'loss': 0.6736, 'learning_rate': 1.5254589146509679e-05, 'epoch': 0.69} {'loss': 0.4491, 'learning_rate': 1.5254303287380471e-05, 'epoch': 0.69} {'loss': 0.4098, 'learning_rate': 1.5254017422320153e-05, 'epoch': 0.69} {'loss': 0.6263, 'learning_rate': 1.525373155132905e-05, 'epoch': 0.69} {'loss': 0.6702, 'learning_rate': 1.5253445674407479e-05, 'epoch': 0.69} {'loss': 0.5524, 'learning_rate': 1.525315979155577e-05, 'epoch': 0.69} {'loss': 0.4581, 'learning_rate': 1.5252873902774241e-05, 'epoch': 0.69} {'loss': 0.4045, 'learning_rate': 1.5252588008063217e-05, 'epoch': 0.69} {'loss': 0.5025, 'learning_rate': 1.525230210742302e-05, 'epoch': 0.69} {'loss': 0.7435, 'learning_rate': 1.5252016200853971e-05, 'epoch': 0.69} {'loss': 0.5336, 'learning_rate': 1.5251730288356397e-05, 'epoch': 0.69} {'loss': 0.5623, 'learning_rate': 1.5251444369930616e-05, 'epoch': 0.69} {'loss': 0.5428, 'learning_rate': 1.5251158445576954e-05, 'epoch': 0.69} {'loss': 0.533, 'learning_rate': 1.5250872515295736e-05, 'epoch': 0.69} {'loss': 0.5079, 'learning_rate': 1.5250586579087277e-05, 'epoch': 0.69} {'loss': 0.6583, 'learning_rate': 1.5250300636951905e-05, 'epoch': 0.69} {'loss': 0.5554, 'learning_rate': 1.525001468888994e-05, 'epoch': 0.69} {'loss': 0.7817, 'learning_rate': 1.524972873490171e-05, 'epoch': 0.69} {'loss': 0.5602, 'learning_rate': 1.5249442774987535e-05, 'epoch': 0.69} {'loss': 0.6264, 'learning_rate': 1.5249156809147736e-05, 'epoch': 0.69} {'loss': 0.5863, 'learning_rate': 1.5248870837382637e-05, 'epoch': 0.69} {'loss': 0.616, 'learning_rate': 1.524858485969256e-05, 'epoch': 0.69} {'loss': 0.488, 'learning_rate': 1.524829887607783e-05, 'epoch': 0.69} {'loss': 0.6559, 'learning_rate': 1.524801288653877e-05, 'epoch': 0.69} {'loss': 0.5202, 'learning_rate': 1.5247726891075698e-05, 'epoch': 0.69} {'loss': 0.4836, 'learning_rate': 1.5247440889688942e-05, 'epoch': 0.69} {'loss': 0.6602, 'learning_rate': 1.5247154882378824e-05, 'epoch': 0.69} {'loss': 0.5995, 'learning_rate': 1.5246868869145666e-05, 'epoch': 0.69} {'loss': 0.7156, 'learning_rate': 1.5246582849989788e-05, 'epoch': 0.69} {'loss': 0.5896, 'learning_rate': 1.5246296824911517e-05, 'epoch': 0.69} {'loss': 0.438, 'learning_rate': 1.5246010793911176e-05, 'epoch': 0.69} {'loss': 0.6524, 'learning_rate': 1.5245724756989084e-05, 'epoch': 0.69} {'loss': 0.5816, 'learning_rate': 1.524543871414557e-05, 'epoch': 0.69} {'loss': 0.57, 'learning_rate': 1.524515266538095e-05, 'epoch': 0.69} {'loss': 0.5085, 'learning_rate': 1.5244866610695553e-05, 'epoch': 0.69} {'loss': 0.5927, 'learning_rate': 1.5244580550089696e-05, 'epoch': 0.69} {'loss': 0.6653, 'learning_rate': 1.5244294483563706e-05, 'epoch': 0.69} {'loss': 0.5177, 'learning_rate': 1.5244008411117905e-05, 'epoch': 0.69} {'loss': 0.6095, 'learning_rate': 1.5243722332752615e-05, 'epoch': 0.69} {'loss': 0.6373, 'learning_rate': 1.5243436248468157e-05, 'epoch': 0.69} {'loss': 0.7083, 'learning_rate': 1.524315015826486e-05, 'epoch': 0.69} {'loss': 0.5745, 'learning_rate': 1.5242864062143044e-05, 'epoch': 0.69} {'loss': 0.6255, 'learning_rate': 1.524257796010303e-05, 'epoch': 0.69} {'loss': 0.5309, 'learning_rate': 1.5242291852145142e-05, 'epoch': 0.69} {'loss': 0.6461, 'learning_rate': 1.5242005738269705e-05, 'epoch': 0.69} {'loss': 0.7399, 'learning_rate': 1.5241719618477038e-05, 'epoch': 0.69} {'loss': 0.6301, 'learning_rate': 1.5241433492767468e-05, 'epoch': 0.69} {'loss': 0.538, 'learning_rate': 1.5241147361141315e-05, 'epoch': 0.69} {'loss': 0.6578, 'learning_rate': 1.5240861223598905e-05, 'epoch': 0.69} {'loss': 0.6271, 'learning_rate': 1.5240575080140563e-05, 'epoch': 0.69} {'loss': 0.4878, 'learning_rate': 1.5240288930766602e-05, 'epoch': 0.69} {'loss': 0.5746, 'learning_rate': 1.5240002775477352e-05, 'epoch': 0.69} {'loss': 0.4022, 'learning_rate': 1.5239716614273136e-05, 'epoch': 0.69} {'loss': 0.6287, 'learning_rate': 1.5239430447154277e-05, 'epoch': 0.69} {'loss': 0.5012, 'learning_rate': 1.5239144274121098e-05, 'epoch': 0.69} {'loss': 0.6435, 'learning_rate': 1.523885809517392e-05, 'epoch': 0.69} {'loss': 0.6224, 'learning_rate': 1.5238571910313069e-05, 'epoch': 0.69} {'loss': 0.5842, 'learning_rate': 1.5238285719538866e-05, 'epoch': 0.69} {'loss': 0.6022, 'learning_rate': 1.5237999522851632e-05, 'epoch': 0.69} {'loss': 0.6334, 'learning_rate': 1.5237713320251694e-05, 'epoch': 0.69} {'loss': 0.4861, 'learning_rate': 1.5237427111739377e-05, 'epoch': 0.69} {'loss': 0.5567, 'learning_rate': 1.5237140897314994e-05, 'epoch': 0.69} {'loss': 0.5446, 'learning_rate': 1.5236854676978881e-05, 'epoch': 0.69} {'loss': 0.4985, 'learning_rate': 1.5236568450731352e-05, 'epoch': 0.69} {'loss': 0.4419, 'learning_rate': 1.5236282218572733e-05, 'epoch': 0.69} {'loss': 0.4938, 'learning_rate': 1.5235995980503347e-05, 'epoch': 0.69} {'loss': 0.6683, 'learning_rate': 1.5235709736523518e-05, 'epoch': 0.69} {'loss': 0.7388, 'learning_rate': 1.5235423486633568e-05, 'epoch': 0.69} {'loss': 0.6475, 'learning_rate': 1.523513723083382e-05, 'epoch': 0.69} {'loss': 0.6085, 'learning_rate': 1.52348509691246e-05, 'epoch': 0.69} {'loss': 0.6428, 'learning_rate': 1.5234564701506225e-05, 'epoch': 0.69} {'loss': 0.5815, 'learning_rate': 1.5234278427979025e-05, 'epoch': 0.69} {'loss': 0.5433, 'learning_rate': 1.5233992148543317e-05, 'epoch': 0.69} {'loss': 0.5632, 'learning_rate': 1.5233705863199433e-05, 'epoch': 0.69} {'loss': 0.5235, 'learning_rate': 1.5233419571947686e-05, 'epoch': 0.69} {'loss': 0.6004, 'learning_rate': 1.5233133274788403e-05, 'epoch': 0.69} {'loss': 0.5297, 'learning_rate': 1.5232846971721908e-05, 'epoch': 0.69} {'loss': 0.6451, 'learning_rate': 1.5232560662748523e-05, 'epoch': 0.69} {'loss': 0.568, 'learning_rate': 1.5232274347868575e-05, 'epoch': 0.69} {'loss': 0.4346, 'learning_rate': 1.523198802708238e-05, 'epoch': 0.69} {'loss': 0.5022, 'learning_rate': 1.523170170039027e-05, 'epoch': 0.69} {'loss': 0.5613, 'learning_rate': 1.5231415367792562e-05, 'epoch': 0.69} {'loss': 0.4351, 'learning_rate': 1.523112902928958e-05, 'epoch': 0.69} {'loss': 0.5229, 'learning_rate': 1.5230842684881649e-05, 'epoch': 0.69} {'loss': 0.5457, 'learning_rate': 1.523055633456909e-05, 'epoch': 0.69} {'loss': 0.389, 'learning_rate': 1.5230269978352228e-05, 'epoch': 0.69} {'loss': 0.5888, 'learning_rate': 1.5229983616231387e-05, 'epoch': 0.69} {'loss': 0.4281, 'learning_rate': 1.5229697248206887e-05, 'epoch': 0.69} {'loss': 0.5954, 'learning_rate': 1.5229410874279056e-05, 'epoch': 0.69} {'loss': 0.7079, 'learning_rate': 1.5229124494448212e-05, 'epoch': 0.69} {'loss': 0.5793, 'learning_rate': 1.5228838108714683e-05, 'epoch': 0.69} {'loss': 0.5951, 'learning_rate': 1.5228551717078787e-05, 'epoch': 0.69} {'loss': 0.5523, 'learning_rate': 1.5228265319540854e-05, 'epoch': 0.69} {'loss': 0.5956, 'learning_rate': 1.5227978916101203e-05, 'epoch': 0.69} {'loss': 0.5358, 'learning_rate': 1.5227692506760154e-05, 'epoch': 0.69} {'loss': 0.4372, 'learning_rate': 1.5227406091518038e-05, 'epoch': 0.69} {'loss': 0.5237, 'learning_rate': 1.5227119670375175e-05, 'epoch': 0.69} {'loss': 0.4045, 'learning_rate': 1.5226833243331884e-05, 'epoch': 0.69} {'loss': 0.4658, 'learning_rate': 1.5226546810388496e-05, 'epoch': 0.69} {'loss': 0.5187, 'learning_rate': 1.5226260371545331e-05, 'epoch': 0.69} {'loss': 0.5318, 'learning_rate': 1.5225973926802708e-05, 'epoch': 0.69} {'loss': 0.5489, 'learning_rate': 1.5225687476160957e-05, 'epoch': 0.69} {'loss': 0.6122, 'learning_rate': 1.5225401019620398e-05, 'epoch': 0.69} {'loss': 0.648, 'learning_rate': 1.5225114557181355e-05, 'epoch': 0.69} {'loss': 0.6341, 'learning_rate': 1.522482808884415e-05, 'epoch': 0.69} {'loss': 0.5936, 'learning_rate': 1.5224541614609109e-05, 'epoch': 0.69} {'loss': 0.5108, 'learning_rate': 1.5224255134476553e-05, 'epoch': 0.69} {'loss': 0.6164, 'learning_rate': 1.5223968648446807e-05, 'epoch': 0.69} {'loss': 0.6443, 'learning_rate': 1.5223682156520195e-05, 'epoch': 0.69} {'loss': 0.4691, 'learning_rate': 1.5223395658697037e-05, 'epoch': 0.69} {'loss': 0.752, 'learning_rate': 1.522310915497766e-05, 'epoch': 0.69} {'loss': 0.5014, 'learning_rate': 1.5222822645362384e-05, 'epoch': 0.69} {'loss': 0.6266, 'learning_rate': 1.5222536129851539e-05, 'epoch': 0.69} {'loss': 0.5484, 'learning_rate': 1.522224960844544e-05, 'epoch': 0.69} {'loss': 0.6983, 'learning_rate': 1.5221963081144413e-05, 'epoch': 0.69} {'loss': 0.5965, 'learning_rate': 1.5221676547948785e-05, 'epoch': 0.69} {'loss': 0.5738, 'learning_rate': 1.5221390008858876e-05, 'epoch': 0.69} {'loss': 0.7993, 'learning_rate': 1.522110346387501e-05, 'epoch': 0.69} {'loss': 0.4171, 'learning_rate': 1.5220816912997514e-05, 'epoch': 0.69} {'loss': 0.2469, 'learning_rate': 1.5220530356226707e-05, 'epoch': 0.69} {'loss': 0.5106, 'learning_rate': 1.5220243793562915e-05, 'epoch': 0.69} {'loss': 0.4359, 'learning_rate': 1.5219957225006456e-05, 'epoch': 0.69} {'loss': 0.713, 'learning_rate': 1.5219670650557666e-05, 'epoch': 0.69} {'loss': 0.8127, 'learning_rate': 1.5219384070216854e-05, 'epoch': 0.69} {'loss': 0.4282, 'learning_rate': 1.5219097483984353e-05, 'epoch': 0.69} {'loss': 0.4308, 'learning_rate': 1.521881089186048e-05, 'epoch': 0.69} {'loss': 0.658, 'learning_rate': 1.5218524293845564e-05, 'epoch': 0.69} {'loss': 0.5331, 'learning_rate': 1.5218237689939925e-05, 'epoch': 0.69} {'loss': 0.5048, 'learning_rate': 1.521795108014389e-05, 'epoch': 0.69} {'loss': 0.589, 'learning_rate': 1.521766446445778e-05, 'epoch': 0.69} {'loss': 0.3748, 'learning_rate': 1.5217377842881918e-05, 'epoch': 0.69} {'loss': 0.6092, 'learning_rate': 1.521709121541663e-05, 'epoch': 0.69} {'loss': 0.5112, 'learning_rate': 1.5216804582062236e-05, 'epoch': 0.69} {'loss': 0.5191, 'learning_rate': 1.5216517942819064e-05, 'epoch': 0.69} {'loss': 0.5582, 'learning_rate': 1.5216231297687434e-05, 'epoch': 0.69} {'loss': 0.4548, 'learning_rate': 1.5215944646667673e-05, 'epoch': 0.69} {'loss': 0.4986, 'learning_rate': 1.52156579897601e-05, 'epoch': 0.69} {'loss': 0.5301, 'learning_rate': 1.521537132696504e-05, 'epoch': 0.69} {'loss': 0.6056, 'learning_rate': 1.521508465828282e-05, 'epoch': 0.69} {'loss': 0.4893, 'learning_rate': 1.521479798371376e-05, 'epoch': 0.69} {'loss': 0.636, 'learning_rate': 1.5214511303258183e-05, 'epoch': 0.69} {'loss': 0.381, 'learning_rate': 1.5214224616916418e-05, 'epoch': 0.69} {'loss': 0.6331, 'learning_rate': 1.521393792468878e-05, 'epoch': 0.69} {'loss': 0.6891, 'learning_rate': 1.5213651226575602e-05, 'epoch': 0.69} {'loss': 0.6097, 'learning_rate': 1.5213364522577201e-05, 'epoch': 0.69} {'loss': 0.5386, 'learning_rate': 1.5213077812693903e-05, 'epoch': 0.69} {'loss': 0.418, 'learning_rate': 1.5212791096926032e-05, 'epoch': 0.69} {'loss': 0.5477, 'learning_rate': 1.5212504375273912e-05, 'epoch': 0.69} {'loss': 0.5943, 'learning_rate': 1.5212217647737863e-05, 'epoch': 0.69} {'loss': 0.4334, 'learning_rate': 1.5211930914318215e-05, 'epoch': 0.69} {'loss': 0.5584, 'learning_rate': 1.5211644175015288e-05, 'epoch': 0.69} {'loss': 0.6012, 'learning_rate': 1.5211357429829404e-05, 'epoch': 0.69} {'loss': 0.5192, 'learning_rate': 1.5211070678760886e-05, 'epoch': 0.69} {'loss': 0.707, 'learning_rate': 1.5210783921810061e-05, 'epoch': 0.69} {'loss': 0.4852, 'learning_rate': 1.5210497158977255e-05, 'epoch': 0.69} {'loss': 0.505, 'learning_rate': 1.5210210390262788e-05, 'epoch': 0.69} {'loss': 0.6974, 'learning_rate': 1.5209923615666981e-05, 'epoch': 0.69} {'loss': 0.5803, 'learning_rate': 1.5209636835190164e-05, 'epoch': 0.69} {'loss': 0.7044, 'learning_rate': 1.5209350048832656e-05, 'epoch': 0.69} {'loss': 0.6281, 'learning_rate': 1.5209063256594783e-05, 'epoch': 0.69} {'loss': 0.5163, 'learning_rate': 1.5208776458476871e-05, 'epoch': 0.69} {'loss': 0.722, 'learning_rate': 1.5208489654479234e-05, 'epoch': 0.69} {'loss': 0.569, 'learning_rate': 1.5208202844602212e-05, 'epoch': 0.69} {'loss': 0.6539, 'learning_rate': 1.5207916028846113e-05, 'epoch': 0.69} {'loss': 0.6715, 'learning_rate': 1.5207629207211265e-05, 'epoch': 0.69} {'loss': 0.5927, 'learning_rate': 1.5207342379697998e-05, 'epoch': 0.69} {'loss': 0.6705, 'learning_rate': 1.5207055546306633e-05, 'epoch': 0.69} {'loss': 0.6872, 'learning_rate': 1.5206768707037487e-05, 'epoch': 0.69} {'loss': 0.5205, 'learning_rate': 1.5206481861890893e-05, 'epoch': 0.69} {'loss': 0.5317, 'learning_rate': 1.520619501086717e-05, 'epoch': 0.69} {'loss': 0.6864, 'learning_rate': 1.5205908153966644e-05, 'epoch': 0.69} {'loss': 0.5947, 'learning_rate': 1.5205621291189635e-05, 'epoch': 0.69} {'loss': 0.6094, 'learning_rate': 1.5205334422536475e-05, 'epoch': 0.69} {'loss': 0.5444, 'learning_rate': 1.520504754800748e-05, 'epoch': 0.69} {'loss': 0.6586, 'learning_rate': 1.5204760667602974e-05, 'epoch': 0.69} {'loss': 0.5263, 'learning_rate': 1.5204473781323285e-05, 'epoch': 0.69} {'loss': 0.5654, 'learning_rate': 1.5204186889168733e-05, 'epoch': 0.69} {'loss': 0.484, 'learning_rate': 1.5203899991139643e-05, 'epoch': 0.69} {'loss': 0.6128, 'learning_rate': 1.5203613087236342e-05, 'epoch': 0.69} {'loss': 0.6336, 'learning_rate': 1.520332617745915e-05, 'epoch': 0.69} {'loss': 0.687, 'learning_rate': 1.5203039261808392e-05, 'epoch': 0.69} {'loss': 0.6959, 'learning_rate': 1.5202752340284392e-05, 'epoch': 0.69} {'loss': 0.5401, 'learning_rate': 1.5202465412887475e-05, 'epoch': 0.69} {'loss': 0.564, 'learning_rate': 1.5202178479617962e-05, 'epoch': 0.69} {'loss': 0.4221, 'learning_rate': 1.5201891540476182e-05, 'epoch': 0.69} {'loss': 0.6453, 'learning_rate': 1.5201604595462454e-05, 'epoch': 0.69} {'loss': 0.638, 'learning_rate': 1.5201317644577102e-05, 'epoch': 0.69} {'loss': 0.6566, 'learning_rate': 1.5201030687820453e-05, 'epoch': 0.69} {'loss': 0.6507, 'learning_rate': 1.5200743725192829e-05, 'epoch': 0.69} {'loss': 0.6271, 'learning_rate': 1.5200456756694553e-05, 'epoch': 0.69} {'loss': 0.5969, 'learning_rate': 1.5200169782325951e-05, 'epoch': 0.69} {'loss': 0.6683, 'learning_rate': 1.5199882802087347e-05, 'epoch': 0.69} {'loss': 0.4239, 'learning_rate': 1.5199595815979065e-05, 'epoch': 0.69} {'loss': 0.6401, 'learning_rate': 1.5199308824001426e-05, 'epoch': 0.69} {'loss': 0.7566, 'learning_rate': 1.5199021826154758e-05, 'epoch': 0.69} {'loss': 0.726, 'learning_rate': 1.519873482243938e-05, 'epoch': 0.69} {'loss': 0.5227, 'learning_rate': 1.519844781285562e-05, 'epoch': 0.69} {'loss': 0.6071, 'learning_rate': 1.5198160797403803e-05, 'epoch': 0.69} {'loss': 0.533, 'learning_rate': 1.5197873776084251e-05, 'epoch': 0.69} {'loss': 0.5493, 'learning_rate': 1.5197586748897285e-05, 'epoch': 0.69} {'loss': 0.5005, 'learning_rate': 1.5197299715843237e-05, 'epoch': 0.69} {'loss': 0.6016, 'learning_rate': 1.5197012676922422e-05, 'epoch': 0.69} {'loss': 0.5635, 'learning_rate': 1.5196725632135167e-05, 'epoch': 0.69} {'loss': 0.5359, 'learning_rate': 1.5196438581481799e-05, 'epoch': 0.69} {'loss': 0.6818, 'learning_rate': 1.519615152496264e-05, 'epoch': 0.69} {'loss': 0.6205, 'learning_rate': 1.5195864462578014e-05, 'epoch': 0.69} {'loss': 0.4918, 'learning_rate': 1.5195577394328243e-05, 'epoch': 0.69} {'loss': 0.6787, 'learning_rate': 1.5195290320213654e-05, 'epoch': 0.69} {'loss': 0.5232, 'learning_rate': 1.5195003240234569e-05, 'epoch': 0.69} {'loss': 0.5858, 'learning_rate': 1.5194716154391315e-05, 'epoch': 0.69} {'loss': 0.6194, 'learning_rate': 1.5194429062684215e-05, 'epoch': 0.69} {'loss': 0.5871, 'learning_rate': 1.5194141965113595e-05, 'epoch': 0.69} {'loss': 0.6064, 'learning_rate': 1.5193854861679773e-05, 'epoch': 0.69} {'loss': 0.7458, 'learning_rate': 1.5193567752383074e-05, 'epoch': 0.69} {'loss': 0.575, 'learning_rate': 1.5193280637223829e-05, 'epoch': 0.69} {'loss': 0.545, 'learning_rate': 1.5192993516202355e-05, 'epoch': 0.69} {'loss': 0.6515, 'learning_rate': 1.5192706389318978e-05, 'epoch': 0.69} {'loss': 0.5877, 'learning_rate': 1.5192419256574024e-05, 'epoch': 0.69} {'loss': 0.5012, 'learning_rate': 1.5192132117967817e-05, 'epoch': 0.69} {'loss': 0.6292, 'learning_rate': 1.519184497350068e-05, 'epoch': 0.69} {'loss': 0.7204, 'learning_rate': 1.5191557823172938e-05, 'epoch': 0.69} {'loss': 0.5657, 'learning_rate': 1.5191270666984911e-05, 'epoch': 0.69} {'loss': 0.6487, 'learning_rate': 1.5190983504936934e-05, 'epoch': 0.69} {'loss': 0.6269, 'learning_rate': 1.5190696337029316e-05, 'epoch': 0.69} {'loss': 0.5655, 'learning_rate': 1.5190409163262394e-05, 'epoch': 0.69} {'loss': 0.5974, 'learning_rate': 1.5190121983636483e-05, 'epoch': 0.69} {'loss': 0.5979, 'learning_rate': 1.5189834798151912e-05, 'epoch': 0.69} {'loss': 0.611, 'learning_rate': 1.5189547606809006e-05, 'epoch': 0.69} {'loss': 0.5739, 'learning_rate': 1.5189260409608087e-05, 'epoch': 0.69} {'loss': 0.6422, 'learning_rate': 1.518897320654948e-05, 'epoch': 0.69} {'loss': 0.6333, 'learning_rate': 1.518868599763351e-05, 'epoch': 0.69} {'loss': 0.4949, 'learning_rate': 1.5188398782860496e-05, 'epoch': 0.69} {'loss': 0.6053, 'learning_rate': 1.5188111562230771e-05, 'epoch': 0.69} {'loss': 0.501, 'learning_rate': 1.5187824335744652e-05, 'epoch': 0.69} {'loss': 0.4634, 'learning_rate': 1.5187537103402468e-05, 'epoch': 0.69} {'loss': 0.4787, 'learning_rate': 1.5187249865204541e-05, 'epoch': 0.69} {'loss': 0.4634, 'learning_rate': 1.5186962621151193e-05, 'epoch': 0.69} {'loss': 0.6667, 'learning_rate': 1.5186675371242752e-05, 'epoch': 0.69} {'loss': 0.504, 'learning_rate': 1.518638811547954e-05, 'epoch': 0.69} {'loss': 0.6394, 'learning_rate': 1.5186100853861883e-05, 'epoch': 0.69} {'loss': 0.5284, 'learning_rate': 1.5185813586390103e-05, 'epoch': 0.69} {'loss': 0.661, 'learning_rate': 1.5185526313064528e-05, 'epoch': 0.69} {'loss': 0.4995, 'learning_rate': 1.5185239033885477e-05, 'epoch': 0.69} {'loss': 0.4994, 'learning_rate': 1.5184951748853277e-05, 'epoch': 0.69} {'loss': 0.5595, 'learning_rate': 1.5184664457968257e-05, 'epoch': 0.69} {'loss': 0.7088, 'learning_rate': 1.5184377161230735e-05, 'epoch': 0.69} {'loss': 0.64, 'learning_rate': 1.5184089858641033e-05, 'epoch': 0.69} {'loss': 0.6357, 'learning_rate': 1.5183802550199483e-05, 'epoch': 0.69} {'loss': 0.6761, 'learning_rate': 1.5183515235906408e-05, 'epoch': 0.69} {'loss': 0.7448, 'learning_rate': 1.5183227915762127e-05, 'epoch': 0.69} {'loss': 0.5588, 'learning_rate': 1.5182940589766965e-05, 'epoch': 0.7} {'loss': 0.5401, 'learning_rate': 1.5182653257921249e-05, 'epoch': 0.7} {'loss': 0.5429, 'learning_rate': 1.5182365920225306e-05, 'epoch': 0.7} {'loss': 0.5421, 'learning_rate': 1.5182078576679456e-05, 'epoch': 0.7} {'loss': 0.6258, 'learning_rate': 1.5181791227284027e-05, 'epoch': 0.7} {'loss': 0.6098, 'learning_rate': 1.5181503872039335e-05, 'epoch': 0.7} {'loss': 0.5677, 'learning_rate': 1.5181216510945715e-05, 'epoch': 0.7} {'loss': 0.6067, 'learning_rate': 1.5180929144003487e-05, 'epoch': 0.7} {'loss': 0.632, 'learning_rate': 1.5180641771212974e-05, 'epoch': 0.7} {'loss': 0.6294, 'learning_rate': 1.5180354392574501e-05, 'epoch': 0.7} {'loss': 0.5836, 'learning_rate': 1.5180067008088392e-05, 'epoch': 0.7} {'loss': 0.473, 'learning_rate': 1.5179779617754977e-05, 'epoch': 0.7} {'loss': 0.4743, 'learning_rate': 1.5179492221574574e-05, 'epoch': 0.7} {'loss': 0.6986, 'learning_rate': 1.5179204819547507e-05, 'epoch': 0.7} {'loss': 0.5038, 'learning_rate': 1.5178917411674104e-05, 'epoch': 0.7} {'loss': 0.4835, 'learning_rate': 1.5178629997954688e-05, 'epoch': 0.7} {'loss': 0.6112, 'learning_rate': 1.5178342578389582e-05, 'epoch': 0.7} {'loss': 0.5763, 'learning_rate': 1.5178055152979112e-05, 'epoch': 0.7} {'loss': 0.5393, 'learning_rate': 1.5177767721723605e-05, 'epoch': 0.7} {'loss': 0.5893, 'learning_rate': 1.517748028462338e-05, 'epoch': 0.7} {'loss': 0.6841, 'learning_rate': 1.5177192841678768e-05, 'epoch': 0.7} {'loss': 0.6824, 'learning_rate': 1.5176905392890089e-05, 'epoch': 0.7} {'loss': 0.6279, 'learning_rate': 1.5176617938257665e-05, 'epoch': 0.7} {'loss': 0.6037, 'learning_rate': 1.5176330477781827e-05, 'epoch': 0.7} {'loss': 0.5757, 'learning_rate': 1.5176043011462893e-05, 'epoch': 0.7} {'loss': 0.4822, 'learning_rate': 1.5175755539301193e-05, 'epoch': 0.7} {'loss': 0.7369, 'learning_rate': 1.517546806129705e-05, 'epoch': 0.7} {'loss': 0.6542, 'learning_rate': 1.5175180577450785e-05, 'epoch': 0.7} {'loss': 0.7042, 'learning_rate': 1.5174893087762727e-05, 'epoch': 0.7} {'loss': 0.7417, 'learning_rate': 1.51746055922332e-05, 'epoch': 0.7} {'loss': 0.4643, 'learning_rate': 1.5174318090862526e-05, 'epoch': 0.7} {'loss': 0.4657, 'learning_rate': 1.517403058365103e-05, 'epoch': 0.7} {'loss': 0.4825, 'learning_rate': 1.5173743070599037e-05, 'epoch': 0.7} {'loss': 0.5732, 'learning_rate': 1.5173455551706873e-05, 'epoch': 0.7} {'loss': 0.5524, 'learning_rate': 1.517316802697486e-05, 'epoch': 0.7} {'loss': 0.5926, 'learning_rate': 1.5172880496403325e-05, 'epoch': 0.7} {'loss': 0.5423, 'learning_rate': 1.5172592959992596e-05, 'epoch': 0.7} {'loss': 0.4628, 'learning_rate': 1.5172305417742988e-05, 'epoch': 0.7} {'loss': 0.6538, 'learning_rate': 1.5172017869654832e-05, 'epoch': 0.7} {'loss': 0.5793, 'learning_rate': 1.517173031572845e-05, 'epoch': 0.7} {'loss': 0.4466, 'learning_rate': 1.517144275596417e-05, 'epoch': 0.7} {'loss': 0.6312, 'learning_rate': 1.5171155190362312e-05, 'epoch': 0.7} {'loss': 0.5049, 'learning_rate': 1.5170867618923204e-05, 'epoch': 0.7} {'loss': 0.6719, 'learning_rate': 1.5170580041647172e-05, 'epoch': 0.7} {'loss': 0.6575, 'learning_rate': 1.5170292458534536e-05, 'epoch': 0.7} {'loss': 0.4696, 'learning_rate': 1.5170004869585624e-05, 'epoch': 0.7} {'loss': 0.5022, 'learning_rate': 1.5169717274800759e-05, 'epoch': 0.7} {'loss': 0.4937, 'learning_rate': 1.5169429674180265e-05, 'epoch': 0.7} {'loss': 0.441, 'learning_rate': 1.5169142067724472e-05, 'epoch': 0.7} {'loss': 0.5801, 'learning_rate': 1.5168854455433699e-05, 'epoch': 0.7} {'loss': 0.4601, 'learning_rate': 1.516856683730827e-05, 'epoch': 0.7} {'loss': 0.569, 'learning_rate': 1.5168279213348513e-05, 'epoch': 0.7} {'loss': 0.5523, 'learning_rate': 1.5167991583554753e-05, 'epoch': 0.7} {'loss': 0.4396, 'learning_rate': 1.5167703947927313e-05, 'epoch': 0.7} {'loss': 0.6363, 'learning_rate': 1.5167416306466516e-05, 'epoch': 0.7} {'loss': 0.5442, 'learning_rate': 1.516712865917269e-05, 'epoch': 0.7} {'loss': 0.3732, 'learning_rate': 1.5166841006046156e-05, 'epoch': 0.7} {'loss': 0.5426, 'learning_rate': 1.5166553347087245e-05, 'epoch': 0.7} {'loss': 0.6968, 'learning_rate': 1.5166265682296276e-05, 'epoch': 0.7} {'loss': 0.6265, 'learning_rate': 1.5165978011673574e-05, 'epoch': 0.7} {'loss': 0.4483, 'learning_rate': 1.5165690335219466e-05, 'epoch': 0.7} {'loss': 0.4788, 'learning_rate': 1.5165402652934278e-05, 'epoch': 0.7} {'loss': 0.6184, 'learning_rate': 1.5165114964818328e-05, 'epoch': 0.7} {'loss': 0.6472, 'learning_rate': 1.516482727087195e-05, 'epoch': 0.7} {'loss': 0.5948, 'learning_rate': 1.5164539571095463e-05, 'epoch': 0.7} {'loss': 0.6246, 'learning_rate': 1.516425186548919e-05, 'epoch': 0.7} {'loss': 0.5604, 'learning_rate': 1.516396415405346e-05, 'epoch': 0.7} {'loss': 0.5974, 'learning_rate': 1.5163676436788599e-05, 'epoch': 0.7} {'loss': 0.5708, 'learning_rate': 1.5163388713694928e-05, 'epoch': 0.7} {'loss': 0.4728, 'learning_rate': 1.5163100984772772e-05, 'epoch': 0.7} {'loss': 0.5202, 'learning_rate': 1.5162813250022456e-05, 'epoch': 0.7} {'loss': 0.4554, 'learning_rate': 1.516252550944431e-05, 'epoch': 0.7} {'loss': 0.6444, 'learning_rate': 1.516223776303865e-05, 'epoch': 0.7} {'loss': 0.4068, 'learning_rate': 1.5161950010805807e-05, 'epoch': 0.7} {'loss': 0.5676, 'learning_rate': 1.5161662252746104e-05, 'epoch': 0.7} {'loss': 0.6614, 'learning_rate': 1.5161374488859866e-05, 'epoch': 0.7} {'loss': 0.5955, 'learning_rate': 1.5161086719147418e-05, 'epoch': 0.7} {'loss': 0.5227, 'learning_rate': 1.5160798943609083e-05, 'epoch': 0.7} {'loss': 0.544, 'learning_rate': 1.5160511162245187e-05, 'epoch': 0.7} {'loss': 0.5671, 'learning_rate': 1.5160223375056057e-05, 'epoch': 0.7} {'loss': 0.5892, 'learning_rate': 1.5159935582042016e-05, 'epoch': 0.7} {'loss': 0.5872, 'learning_rate': 1.5159647783203389e-05, 'epoch': 0.7} {'loss': 0.5273, 'learning_rate': 1.51593599785405e-05, 'epoch': 0.7} {'loss': 0.6221, 'learning_rate': 1.5159072168053675e-05, 'epoch': 0.7} {'loss': 0.5486, 'learning_rate': 1.515878435174324e-05, 'epoch': 0.7} {'loss': 0.4676, 'learning_rate': 1.5158496529609515e-05, 'epoch': 0.7} {'loss': 0.4094, 'learning_rate': 1.515820870165283e-05, 'epoch': 0.7} {'loss': 0.566, 'learning_rate': 1.5157920867873511e-05, 'epoch': 0.7} {'loss': 0.6043, 'learning_rate': 1.5157633028271877e-05, 'epoch': 0.7} {'loss': 0.6383, 'learning_rate': 1.5157345182848255e-05, 'epoch': 0.7} {'loss': 0.4894, 'learning_rate': 1.5157057331602972e-05, 'epoch': 0.7} {'loss': 0.6839, 'learning_rate': 1.5156769474536352e-05, 'epoch': 0.7} {'loss': 0.5599, 'learning_rate': 1.5156481611648721e-05, 'epoch': 0.7} {'loss': 0.4869, 'learning_rate': 1.5156193742940404e-05, 'epoch': 0.7} {'loss': 0.5522, 'learning_rate': 1.5155905868411722e-05, 'epoch': 0.7} {'loss': 0.6571, 'learning_rate': 1.5155617988063002e-05, 'epoch': 0.7} {'loss': 0.6507, 'learning_rate': 1.5155330101894571e-05, 'epoch': 0.7} {'loss': 0.4815, 'learning_rate': 1.5155042209906756e-05, 'epoch': 0.7} {'loss': 0.4135, 'learning_rate': 1.5154754312099876e-05, 'epoch': 0.7} {'loss': 0.5718, 'learning_rate': 1.5154466408474258e-05, 'epoch': 0.7} {'loss': 0.6064, 'learning_rate': 1.5154178499030228e-05, 'epoch': 0.7} {'loss': 0.4851, 'learning_rate': 1.5153890583768109e-05, 'epoch': 0.7} {'loss': 0.6458, 'learning_rate': 1.515360266268823e-05, 'epoch': 0.7} {'loss': 0.378, 'learning_rate': 1.5153314735790914e-05, 'epoch': 0.7} {'loss': 0.4361, 'learning_rate': 1.5153026803076482e-05, 'epoch': 0.7} {'loss': 0.5623, 'learning_rate': 1.5152738864545264e-05, 'epoch': 0.7} {'loss': 0.5894, 'learning_rate': 1.5152450920197587e-05, 'epoch': 0.7} {'loss': 0.5582, 'learning_rate': 1.5152162970033767e-05, 'epoch': 0.7} {'loss': 0.5729, 'learning_rate': 1.515187501405414e-05, 'epoch': 0.7} {'loss': 0.5653, 'learning_rate': 1.5151587052259023e-05, 'epoch': 0.7} {'loss': 0.4642, 'learning_rate': 1.5151299084648745e-05, 'epoch': 0.7} {'loss': 0.58, 'learning_rate': 1.5151011111223633e-05, 'epoch': 0.7} {'loss': 0.5641, 'learning_rate': 1.5150723131984001e-05, 'epoch': 0.7} {'loss': 0.5183, 'learning_rate': 1.515043514693019e-05, 'epoch': 0.7} {'loss': 0.5949, 'learning_rate': 1.5150147156062511e-05, 'epoch': 0.7} {'loss': 0.5779, 'learning_rate': 1.5149859159381297e-05, 'epoch': 0.7} {'loss': 0.5315, 'learning_rate': 1.5149571156886874e-05, 'epoch': 0.7} {'loss': 0.5666, 'learning_rate': 1.5149283148579561e-05, 'epoch': 0.7} {'loss': 0.6576, 'learning_rate': 1.5148995134459687e-05, 'epoch': 0.7} {'loss': 0.6098, 'learning_rate': 1.514870711452758e-05, 'epoch': 0.7} {'loss': 0.5546, 'learning_rate': 1.514841908878356e-05, 'epoch': 0.7} {'loss': 0.5724, 'learning_rate': 1.5148131057227953e-05, 'epoch': 0.7} {'loss': 0.4824, 'learning_rate': 1.5147843019861086e-05, 'epoch': 0.7} {'loss': 0.5284, 'learning_rate': 1.5147554976683281e-05, 'epoch': 0.7} {'loss': 0.6699, 'learning_rate': 1.5147266927694868e-05, 'epoch': 0.7} {'loss': 0.6072, 'learning_rate': 1.5146978872896167e-05, 'epoch': 0.7} {'loss': 0.6436, 'learning_rate': 1.5146690812287508e-05, 'epoch': 0.7} {'loss': 0.5053, 'learning_rate': 1.5146402745869214e-05, 'epoch': 0.7} {'loss': 0.6435, 'learning_rate': 1.5146114673641607e-05, 'epoch': 0.7} {'loss': 0.6911, 'learning_rate': 1.5145826595605016e-05, 'epoch': 0.7} {'loss': 0.6954, 'learning_rate': 1.5145538511759765e-05, 'epoch': 0.7} {'loss': 0.6847, 'learning_rate': 1.5145250422106181e-05, 'epoch': 0.7} {'loss': 0.5642, 'learning_rate': 1.5144962326644588e-05, 'epoch': 0.7} {'loss': 0.679, 'learning_rate': 1.514467422537531e-05, 'epoch': 0.7} {'loss': 0.5104, 'learning_rate': 1.5144386118298675e-05, 'epoch': 0.7} {'loss': 0.6066, 'learning_rate': 1.5144098005415003e-05, 'epoch': 0.7} {'loss': 0.6467, 'learning_rate': 1.5143809886724623e-05, 'epoch': 0.7} {'loss': 0.5789, 'learning_rate': 1.514352176222786e-05, 'epoch': 0.7} {'loss': 0.7325, 'learning_rate': 1.514323363192504e-05, 'epoch': 0.7} {'loss': 0.6619, 'learning_rate': 1.5142945495816487e-05, 'epoch': 0.7} {'loss': 0.6439, 'learning_rate': 1.5142657353902528e-05, 'epoch': 0.7} {'loss': 0.6327, 'learning_rate': 1.5142369206183482e-05, 'epoch': 0.7} {'loss': 0.6467, 'learning_rate': 1.5142081052659686e-05, 'epoch': 0.7} {'loss': 0.5384, 'learning_rate': 1.5141792893331452e-05, 'epoch': 0.7} {'loss': 0.5167, 'learning_rate': 1.5141504728199114e-05, 'epoch': 0.7} {'loss': 0.5643, 'learning_rate': 1.5141216557262995e-05, 'epoch': 0.7} {'loss': 0.6092, 'learning_rate': 1.5140928380523422e-05, 'epoch': 0.7} {'loss': 0.5744, 'learning_rate': 1.5140640197980715e-05, 'epoch': 0.7} {'loss': 0.5984, 'learning_rate': 1.5140352009635207e-05, 'epoch': 0.7} {'loss': 0.7232, 'learning_rate': 1.5140063815487216e-05, 'epoch': 0.7} {'loss': 0.5734, 'learning_rate': 1.513977561553707e-05, 'epoch': 0.7} {'loss': 0.4969, 'learning_rate': 1.5139487409785096e-05, 'epoch': 0.7} {'loss': 0.5657, 'learning_rate': 1.5139199198231618e-05, 'epoch': 0.7} {'loss': 0.6409, 'learning_rate': 1.5138910980876959e-05, 'epoch': 0.7} {'loss': 0.7052, 'learning_rate': 1.5138622757721449e-05, 'epoch': 0.7} {'loss': 0.5981, 'learning_rate': 1.5138334528765413e-05, 'epoch': 0.7} {'loss': 0.6795, 'learning_rate': 1.513804629400917e-05, 'epoch': 0.7} {'loss': 0.6502, 'learning_rate': 1.513775805345305e-05, 'epoch': 0.7} {'loss': 0.6535, 'learning_rate': 1.5137469807097382e-05, 'epoch': 0.7} {'loss': 0.492, 'learning_rate': 1.5137181554942486e-05, 'epoch': 0.7} {'loss': 0.5357, 'learning_rate': 1.5136893296988691e-05, 'epoch': 0.7} {'loss': 0.5537, 'learning_rate': 1.5136605033236316e-05, 'epoch': 0.7} {'loss': 0.4562, 'learning_rate': 1.513631676368569e-05, 'epoch': 0.7} {'loss': 0.627, 'learning_rate': 1.5136028488337142e-05, 'epoch': 0.7} {'loss': 0.5479, 'learning_rate': 1.5135740207190994e-05, 'epoch': 0.7} {'loss': 0.608, 'learning_rate': 1.5135451920247572e-05, 'epoch': 0.7} {'loss': 0.5334, 'learning_rate': 1.51351636275072e-05, 'epoch': 0.7} {'loss': 0.6318, 'learning_rate': 1.5134875328970207e-05, 'epoch': 0.7} {'loss': 0.5829, 'learning_rate': 1.5134587024636916e-05, 'epoch': 0.7} {'loss': 0.5179, 'learning_rate': 1.5134298714507651e-05, 'epoch': 0.7} {'loss': 0.6647, 'learning_rate': 1.5134010398582741e-05, 'epoch': 0.7} {'loss': 0.6319, 'learning_rate': 1.513372207686251e-05, 'epoch': 0.7} {'loss': 0.5989, 'learning_rate': 1.5133433749347282e-05, 'epoch': 0.7} {'loss': 0.6492, 'learning_rate': 1.5133145416037382e-05, 'epoch': 0.7} {'loss': 0.5127, 'learning_rate': 1.5132857076933136e-05, 'epoch': 0.7} {'loss': 0.5211, 'learning_rate': 1.5132568732034874e-05, 'epoch': 0.7} {'loss': 0.6724, 'learning_rate': 1.5132280381342916e-05, 'epoch': 0.7} {'loss': 0.6042, 'learning_rate': 1.513199202485759e-05, 'epoch': 0.7} {'loss': 0.5911, 'learning_rate': 1.513170366257922e-05, 'epoch': 0.7} {'loss': 0.5622, 'learning_rate': 1.5131415294508131e-05, 'epoch': 0.7} {'loss': 0.5691, 'learning_rate': 1.5131126920644655e-05, 'epoch': 0.7} {'loss': 0.5163, 'learning_rate': 1.5130838540989108e-05, 'epoch': 0.7} {'loss': 0.6297, 'learning_rate': 1.5130550155541821e-05, 'epoch': 0.7} {'loss': 0.5348, 'learning_rate': 1.5130261764303119e-05, 'epoch': 0.7} {'loss': 0.5541, 'learning_rate': 1.5129973367273327e-05, 'epoch': 0.7} {'loss': 0.7058, 'learning_rate': 1.5129684964452769e-05, 'epoch': 0.7} {'loss': 0.8513, 'learning_rate': 1.5129396555841775e-05, 'epoch': 0.7} {'loss': 0.6129, 'learning_rate': 1.5129108141440668e-05, 'epoch': 0.7} {'loss': 0.6335, 'learning_rate': 1.5128819721249768e-05, 'epoch': 0.7} {'loss': 0.6566, 'learning_rate': 1.5128531295269411e-05, 'epoch': 0.7} {'loss': 0.4894, 'learning_rate': 1.5128242863499915e-05, 'epoch': 0.7} {'loss': 0.5906, 'learning_rate': 1.5127954425941606e-05, 'epoch': 0.7} {'loss': 0.493, 'learning_rate': 1.5127665982594818e-05, 'epoch': 0.7} {'loss': 0.6411, 'learning_rate': 1.5127377533459867e-05, 'epoch': 0.7} {'loss': 0.4585, 'learning_rate': 1.5127089078537079e-05, 'epoch': 0.7} {'loss': 0.6368, 'learning_rate': 1.5126800617826784e-05, 'epoch': 0.7} {'loss': 0.5648, 'learning_rate': 1.5126512151329307e-05, 'epoch': 0.7} {'loss': 0.7401, 'learning_rate': 1.5126223679044974e-05, 'epoch': 0.7} {'loss': 0.5493, 'learning_rate': 1.5125935200974107e-05, 'epoch': 0.7} {'loss': 0.5838, 'learning_rate': 1.5125646717117035e-05, 'epoch': 0.7} {'loss': 0.5077, 'learning_rate': 1.512535822747408e-05, 'epoch': 0.7} {'loss': 0.6353, 'learning_rate': 1.5125069732045572e-05, 'epoch': 0.7} {'loss': 0.6084, 'learning_rate': 1.5124781230831836e-05, 'epoch': 0.7} {'loss': 0.5408, 'learning_rate': 1.5124492723833195e-05, 'epoch': 0.7} {'loss': 0.5313, 'learning_rate': 1.5124204211049978e-05, 'epoch': 0.7} {'loss': 0.6218, 'learning_rate': 1.5123915692482505e-05, 'epoch': 0.7} {'loss': 0.6009, 'learning_rate': 1.5123627168131108e-05, 'epoch': 0.7} {'loss': 0.4, 'learning_rate': 1.512333863799611e-05, 'epoch': 0.7} {'loss': 0.7451, 'learning_rate': 1.5123050102077837e-05, 'epoch': 0.7} {'loss': 0.8475, 'learning_rate': 1.5122761560376615e-05, 'epoch': 0.7} {'loss': 0.6773, 'learning_rate': 1.512247301289277e-05, 'epoch': 0.7} {'loss': 0.4486, 'learning_rate': 1.5122184459626625e-05, 'epoch': 0.7} {'loss': 0.5043, 'learning_rate': 1.5121895900578509e-05, 'epoch': 0.7} {'loss': 0.6201, 'learning_rate': 1.5121607335748748e-05, 'epoch': 0.7} {'loss': 0.5875, 'learning_rate': 1.5121318765137663e-05, 'epoch': 0.7} {'loss': 0.6219, 'learning_rate': 1.5121030188745585e-05, 'epoch': 0.7} {'loss': 0.5799, 'learning_rate': 1.5120741606572838e-05, 'epoch': 0.7} {'loss': 0.4325, 'learning_rate': 1.5120453018619748e-05, 'epoch': 0.7} {'loss': 0.5336, 'learning_rate': 1.5120164424886637e-05, 'epoch': 0.7} {'loss': 0.6093, 'learning_rate': 1.5119875825373838e-05, 'epoch': 0.7} {'loss': 0.4668, 'learning_rate': 1.511958722008167e-05, 'epoch': 0.7} {'loss': 0.6979, 'learning_rate': 1.5119298609010464e-05, 'epoch': 0.7} {'loss': 0.7413, 'learning_rate': 1.511900999216054e-05, 'epoch': 0.7} {'loss': 0.6201, 'learning_rate': 1.511872136953223e-05, 'epoch': 0.7} {'loss': 0.5261, 'learning_rate': 1.5118432741125855e-05, 'epoch': 0.7} {'loss': 0.6592, 'learning_rate': 1.5118144106941745e-05, 'epoch': 0.7} {'loss': 0.5685, 'learning_rate': 1.5117855466980223e-05, 'epoch': 0.7} {'loss': 0.5119, 'learning_rate': 1.5117566821241613e-05, 'epoch': 0.7} {'loss': 0.4446, 'learning_rate': 1.5117278169726244e-05, 'epoch': 0.7} {'loss': 0.5264, 'learning_rate': 1.5116989512434441e-05, 'epoch': 0.7} {'loss': 0.4696, 'learning_rate': 1.511670084936653e-05, 'epoch': 0.7} {'loss': 0.482, 'learning_rate': 1.5116412180522839e-05, 'epoch': 0.7} {'loss': 0.809, 'learning_rate': 1.5116123505903691e-05, 'epoch': 0.7} {'loss': 0.5766, 'learning_rate': 1.5115834825509413e-05, 'epoch': 0.7} {'loss': 0.5214, 'learning_rate': 1.5115546139340329e-05, 'epoch': 0.7} {'loss': 0.6001, 'learning_rate': 1.5115257447396765e-05, 'epoch': 0.7} {'loss': 0.5234, 'learning_rate': 1.5114968749679049e-05, 'epoch': 0.7} {'loss': 0.6365, 'learning_rate': 1.5114680046187507e-05, 'epoch': 0.7} {'loss': 0.585, 'learning_rate': 1.511439133692246e-05, 'epoch': 0.7} {'loss': 0.4927, 'learning_rate': 1.5114102621884241e-05, 'epoch': 0.7} {'loss': 0.4686, 'learning_rate': 1.5113813901073173e-05, 'epoch': 0.7} {'loss': 0.5277, 'learning_rate': 1.511352517448958e-05, 'epoch': 0.7} {'loss': 0.6032, 'learning_rate': 1.5113236442133792e-05, 'epoch': 0.7} {'loss': 0.564, 'learning_rate': 1.5112947704006129e-05, 'epoch': 0.7} {'loss': 0.4468, 'learning_rate': 1.5112658960106923e-05, 'epoch': 0.7} {'loss': 0.4841, 'learning_rate': 1.5112370210436495e-05, 'epoch': 0.7} {'loss': 0.765, 'learning_rate': 1.5112081454995176e-05, 'epoch': 0.7} {'loss': 0.5669, 'learning_rate': 1.5111792693783287e-05, 'epoch': 0.7} {'loss': 0.5739, 'learning_rate': 1.5111503926801156e-05, 'epoch': 0.7} {'loss': 0.6544, 'learning_rate': 1.5111215154049111e-05, 'epoch': 0.7} {'loss': 0.5571, 'learning_rate': 1.5110926375527472e-05, 'epoch': 0.7} {'loss': 0.3986, 'learning_rate': 1.5110637591236572e-05, 'epoch': 0.7} {'loss': 0.5588, 'learning_rate': 1.5110348801176735e-05, 'epoch': 0.7} {'loss': 0.669, 'learning_rate': 1.5110060005348283e-05, 'epoch': 0.7} {'loss': 0.5406, 'learning_rate': 1.5109771203751549e-05, 'epoch': 0.7} {'loss': 0.5006, 'learning_rate': 1.510948239638685e-05, 'epoch': 0.7} {'loss': 0.3869, 'learning_rate': 1.510919358325452e-05, 'epoch': 0.7} {'loss': 0.6788, 'learning_rate': 1.510890476435488e-05, 'epoch': 0.7} {'loss': 0.5089, 'learning_rate': 1.510861593968826e-05, 'epoch': 0.7} {'loss': 0.572, 'learning_rate': 1.5108327109254983e-05, 'epoch': 0.7} {'loss': 0.5351, 'learning_rate': 1.5108038273055381e-05, 'epoch': 0.7} {'loss': 0.6187, 'learning_rate': 1.5107749431089768e-05, 'epoch': 0.7} {'loss': 0.6823, 'learning_rate': 1.510746058335848e-05, 'epoch': 0.7} {'loss': 0.5851, 'learning_rate': 1.5107171729861838e-05, 'epoch': 0.7} {'loss': 0.7006, 'learning_rate': 1.5106882870600175e-05, 'epoch': 0.7} {'loss': 0.6313, 'learning_rate': 1.510659400557381e-05, 'epoch': 0.7} {'loss': 0.5884, 'learning_rate': 1.510630513478307e-05, 'epoch': 0.7} {'loss': 0.6319, 'learning_rate': 1.5106016258228285e-05, 'epoch': 0.7} {'loss': 0.5324, 'learning_rate': 1.5105727375909775e-05, 'epoch': 0.7} {'loss': 0.683, 'learning_rate': 1.5105438487827875e-05, 'epoch': 0.7} {'loss': 0.5438, 'learning_rate': 1.5105149593982904e-05, 'epoch': 0.7} {'loss': 0.5845, 'learning_rate': 1.5104860694375188e-05, 'epoch': 0.7} {'loss': 0.6128, 'learning_rate': 1.5104571789005053e-05, 'epoch': 0.7} {'loss': 0.5516, 'learning_rate': 1.5104282877872832e-05, 'epoch': 0.7} {'loss': 0.5526, 'learning_rate': 1.5103993960978844e-05, 'epoch': 0.7} {'loss': 0.5172, 'learning_rate': 1.5103705038323417e-05, 'epoch': 0.7} {'loss': 0.6204, 'learning_rate': 1.510341610990688e-05, 'epoch': 0.7} {'loss': 0.6968, 'learning_rate': 1.5103127175729553e-05, 'epoch': 0.7} {'loss': 0.5915, 'learning_rate': 1.5102838235791768e-05, 'epoch': 0.7} {'loss': 0.5215, 'learning_rate': 1.5102549290093848e-05, 'epoch': 0.7} {'loss': 0.7305, 'learning_rate': 1.5102260338636122e-05, 'epoch': 0.7} {'loss': 0.4384, 'learning_rate': 1.5101971381418912e-05, 'epoch': 0.7} {'loss': 0.6624, 'learning_rate': 1.5101682418442547e-05, 'epoch': 0.7} {'loss': 0.7674, 'learning_rate': 1.5101393449707356e-05, 'epoch': 0.7} {'loss': 0.5253, 'learning_rate': 1.5101104475213659e-05, 'epoch': 0.7} {'loss': 0.6363, 'learning_rate': 1.5100815494961784e-05, 'epoch': 0.7} {'loss': 0.5908, 'learning_rate': 1.5100526508952059e-05, 'epoch': 0.7} {'loss': 0.7287, 'learning_rate': 1.510023751718481e-05, 'epoch': 0.7} {'loss': 0.5961, 'learning_rate': 1.5099948519660363e-05, 'epoch': 0.7} {'loss': 0.565, 'learning_rate': 1.5099659516379044e-05, 'epoch': 0.7} {'loss': 0.5012, 'learning_rate': 1.5099370507341178e-05, 'epoch': 0.7} {'loss': 0.6606, 'learning_rate': 1.5099081492547095e-05, 'epoch': 0.7} {'loss': 0.6205, 'learning_rate': 1.5098792471997114e-05, 'epoch': 0.7} {'loss': 0.5143, 'learning_rate': 1.509850344569157e-05, 'epoch': 0.7} {'loss': 0.5911, 'learning_rate': 1.5098214413630783e-05, 'epoch': 0.7} {'loss': 0.6737, 'learning_rate': 1.5097925375815081e-05, 'epoch': 0.7} {'loss': 0.5447, 'learning_rate': 1.5097636332244794e-05, 'epoch': 0.7} {'loss': 0.4937, 'learning_rate': 1.5097347282920243e-05, 'epoch': 0.7} {'loss': 0.7012, 'learning_rate': 1.5097058227841754e-05, 'epoch': 0.7} {'loss': 0.6751, 'learning_rate': 1.509676916700966e-05, 'epoch': 0.7} {'loss': 0.6607, 'learning_rate': 1.5096480100424278e-05, 'epoch': 0.7} {'loss': 0.4567, 'learning_rate': 1.5096191028085942e-05, 'epoch': 0.7} {'loss': 0.6981, 'learning_rate': 1.5095901949994976e-05, 'epoch': 0.7} {'loss': 0.6521, 'learning_rate': 1.5095612866151703e-05, 'epoch': 0.7} {'loss': 0.5259, 'learning_rate': 1.5095323776556454e-05, 'epoch': 0.7} {'loss': 0.7329, 'learning_rate': 1.5095034681209553e-05, 'epoch': 0.7} {'loss': 0.4466, 'learning_rate': 1.5094745580111325e-05, 'epoch': 0.7} {'loss': 0.4357, 'learning_rate': 1.50944564732621e-05, 'epoch': 0.7} {'loss': 0.5732, 'learning_rate': 1.5094167360662204e-05, 'epoch': 0.7} {'loss': 0.5805, 'learning_rate': 1.5093878242311961e-05, 'epoch': 0.7} {'loss': 0.5641, 'learning_rate': 1.5093589118211695e-05, 'epoch': 0.7} {'loss': 0.607, 'learning_rate': 1.5093299988361735e-05, 'epoch': 0.7} {'loss': 0.5273, 'learning_rate': 1.509301085276241e-05, 'epoch': 0.7} {'loss': 0.6216, 'learning_rate': 1.5092721711414048e-05, 'epoch': 0.7} {'loss': 0.4832, 'learning_rate': 1.5092432564316965e-05, 'epoch': 0.7} {'loss': 0.6211, 'learning_rate': 1.5092143411471497e-05, 'epoch': 0.7} {'loss': 0.4608, 'learning_rate': 1.5091854252877969e-05, 'epoch': 0.7} {'loss': 0.7125, 'learning_rate': 1.5091565088536704e-05, 'epoch': 0.7} {'loss': 0.5108, 'learning_rate': 1.5091275918448029e-05, 'epoch': 0.7} {'loss': 0.633, 'learning_rate': 1.5090986742612274e-05, 'epoch': 0.7} {'loss': 0.4718, 'learning_rate': 1.5090697561029765e-05, 'epoch': 0.7} {'loss': 0.582, 'learning_rate': 1.5090408373700825e-05, 'epoch': 0.7} {'loss': 0.5658, 'learning_rate': 1.5090119180625778e-05, 'epoch': 0.7} {'loss': 0.6001, 'learning_rate': 1.5089829981804958e-05, 'epoch': 0.7} {'loss': 0.6123, 'learning_rate': 1.5089540777238686e-05, 'epoch': 0.7} {'loss': 0.4267, 'learning_rate': 1.5089251566927292e-05, 'epoch': 0.7} {'loss': 0.6039, 'learning_rate': 1.50889623508711e-05, 'epoch': 0.7} {'loss': 0.4984, 'learning_rate': 1.5088673129070434e-05, 'epoch': 0.7} {'loss': 0.4574, 'learning_rate': 1.5088383901525629e-05, 'epoch': 0.7} {'loss': 0.61, 'learning_rate': 1.5088094668237005e-05, 'epoch': 0.7} {'loss': 0.6196, 'learning_rate': 1.5087805429204888e-05, 'epoch': 0.7} {'loss': 0.655, 'learning_rate': 1.5087516184429608e-05, 'epoch': 0.7} {'loss': 0.4564, 'learning_rate': 1.5087226933911487e-05, 'epoch': 0.7} {'loss': 0.4958, 'learning_rate': 1.5086937677650856e-05, 'epoch': 0.7} {'loss': 0.5318, 'learning_rate': 1.508664841564804e-05, 'epoch': 0.7} {'loss': 0.5246, 'learning_rate': 1.5086359147903365e-05, 'epoch': 0.7} {'loss': 0.502, 'learning_rate': 1.5086069874417158e-05, 'epoch': 0.7} {'loss': 0.6629, 'learning_rate': 1.5085780595189743e-05, 'epoch': 0.7} {'loss': 0.6473, 'learning_rate': 1.5085491310221452e-05, 'epoch': 0.7} {'loss': 0.5198, 'learning_rate': 1.5085202019512606e-05, 'epoch': 0.7} {'loss': 0.5533, 'learning_rate': 1.5084912723063534e-05, 'epoch': 0.7} {'loss': 0.6988, 'learning_rate': 1.5084623420874562e-05, 'epoch': 0.7} {'loss': 0.4205, 'learning_rate': 1.5084334112946018e-05, 'epoch': 0.7} {'loss': 0.6442, 'learning_rate': 1.508404479927823e-05, 'epoch': 0.7} {'loss': 0.6594, 'learning_rate': 1.5083755479871518e-05, 'epoch': 0.7} {'loss': 0.6107, 'learning_rate': 1.5083466154726213e-05, 'epoch': 0.7} {'loss': 0.6219, 'learning_rate': 1.5083176823842646e-05, 'epoch': 0.7} {'loss': 0.5996, 'learning_rate': 1.5082887487221136e-05, 'epoch': 0.7} {'loss': 0.599, 'learning_rate': 1.5082598144862016e-05, 'epoch': 0.7} {'loss': 0.507, 'learning_rate': 1.5082308796765604e-05, 'epoch': 0.7} {'loss': 0.5747, 'learning_rate': 1.5082019442932235e-05, 'epoch': 0.7} {'loss': 0.7424, 'learning_rate': 1.508173008336223e-05, 'epoch': 0.7} {'loss': 0.5945, 'learning_rate': 1.508144071805592e-05, 'epoch': 0.7} {'loss': 0.5442, 'learning_rate': 1.5081151347013627e-05, 'epoch': 0.7} {'loss': 0.5011, 'learning_rate': 1.5080861970235683e-05, 'epoch': 0.7} {'loss': 0.6169, 'learning_rate': 1.508057258772241e-05, 'epoch': 0.7} {'loss': 0.5073, 'learning_rate': 1.508028319947414e-05, 'epoch': 0.7} {'loss': 0.7126, 'learning_rate': 1.5079993805491193e-05, 'epoch': 0.7} {'loss': 0.4522, 'learning_rate': 1.5079704405773901e-05, 'epoch': 0.7} {'loss': 0.5677, 'learning_rate': 1.5079415000322588e-05, 'epoch': 0.7} {'loss': 0.6981, 'learning_rate': 1.5079125589137579e-05, 'epoch': 0.7} {'loss': 0.5917, 'learning_rate': 1.5078836172219205e-05, 'epoch': 0.7} {'loss': 0.5659, 'learning_rate': 1.507854674956779e-05, 'epoch': 0.7} {'loss': 0.6441, 'learning_rate': 1.5078257321183665e-05, 'epoch': 0.7} {'loss': 0.4462, 'learning_rate': 1.5077967887067151e-05, 'epoch': 0.7} {'loss': 0.667, 'learning_rate': 1.5077678447218576e-05, 'epoch': 0.7} {'loss': 0.675, 'learning_rate': 1.5077389001638267e-05, 'epoch': 0.7} {'loss': 0.5238, 'learning_rate': 1.5077099550326553e-05, 'epoch': 0.7} {'loss': 0.6455, 'learning_rate': 1.5076810093283757e-05, 'epoch': 0.7} {'loss': 0.6772, 'learning_rate': 1.5076520630510211e-05, 'epoch': 0.7} {'loss': 0.6536, 'learning_rate': 1.5076231162006238e-05, 'epoch': 0.7} {'loss': 0.6164, 'learning_rate': 1.5075941687772164e-05, 'epoch': 0.7} {'loss': 0.4287, 'learning_rate': 1.5075652207808318e-05, 'epoch': 0.7} {'loss': 0.5714, 'learning_rate': 1.5075362722115023e-05, 'epoch': 0.7} {'loss': 0.6464, 'learning_rate': 1.5075073230692612e-05, 'epoch': 0.7} {'loss': 0.6146, 'learning_rate': 1.507478373354141e-05, 'epoch': 0.7} {'loss': 0.5064, 'learning_rate': 1.5074494230661737e-05, 'epoch': 0.7} {'loss': 0.5616, 'learning_rate': 1.5074204722053927e-05, 'epoch': 0.7} {'loss': 0.4486, 'learning_rate': 1.5073915207718304e-05, 'epoch': 0.7} {'loss': 0.6514, 'learning_rate': 1.5073625687655198e-05, 'epoch': 0.7} {'loss': 0.4618, 'learning_rate': 1.507333616186493e-05, 'epoch': 0.7} {'loss': 0.6642, 'learning_rate': 1.5073046630347834e-05, 'epoch': 0.7} {'loss': 0.597, 'learning_rate': 1.5072757093104233e-05, 'epoch': 0.7} {'loss': 0.4297, 'learning_rate': 1.5072467550134452e-05, 'epoch': 0.7} {'loss': 0.5606, 'learning_rate': 1.507217800143882e-05, 'epoch': 0.7} {'loss': 0.5742, 'learning_rate': 1.5071888447017661e-05, 'epoch': 0.7} {'loss': 0.6009, 'learning_rate': 1.5071598886871308e-05, 'epoch': 0.7} {'loss': 0.694, 'learning_rate': 1.5071309321000085e-05, 'epoch': 0.7} {'loss': 0.4744, 'learning_rate': 1.5071019749404317e-05, 'epoch': 0.7} {'loss': 0.5311, 'learning_rate': 1.507073017208433e-05, 'epoch': 0.7} {'loss': 0.65, 'learning_rate': 1.5070440589040454e-05, 'epoch': 0.7} {'loss': 0.5457, 'learning_rate': 1.5070151000273015e-05, 'epoch': 0.7} {'loss': 0.4904, 'learning_rate': 1.506986140578234e-05, 'epoch': 0.7} {'loss': 0.6549, 'learning_rate': 1.5069571805568753e-05, 'epoch': 0.7} {'loss': 0.4805, 'learning_rate': 1.5069282199632586e-05, 'epoch': 0.7} {'loss': 0.5995, 'learning_rate': 1.5068992587974162e-05, 'epoch': 0.7} {'loss': 0.4729, 'learning_rate': 1.5068702970593813e-05, 'epoch': 0.7} {'loss': 0.6679, 'learning_rate': 1.506841334749186e-05, 'epoch': 0.7} {'loss': 0.5508, 'learning_rate': 1.506812371866863e-05, 'epoch': 0.7} {'loss': 0.4743, 'learning_rate': 1.5067834084124452e-05, 'epoch': 0.7} {'loss': 0.5462, 'learning_rate': 1.5067544443859657e-05, 'epoch': 0.7} {'loss': 0.6523, 'learning_rate': 1.5067254797874565e-05, 'epoch': 0.7} {'loss': 0.6126, 'learning_rate': 1.5066965146169507e-05, 'epoch': 0.7} {'loss': 0.7286, 'learning_rate': 1.5066675488744808e-05, 'epoch': 0.7} {'loss': 0.5192, 'learning_rate': 1.5066385825600795e-05, 'epoch': 0.7} {'loss': 0.729, 'learning_rate': 1.5066096156737798e-05, 'epoch': 0.7} {'loss': 0.6663, 'learning_rate': 1.506580648215614e-05, 'epoch': 0.7} {'loss': 0.4747, 'learning_rate': 1.506551680185615e-05, 'epoch': 0.7} {'loss': 0.562, 'learning_rate': 1.5065227115838154e-05, 'epoch': 0.7} {'loss': 0.5014, 'learning_rate': 1.5064937424102483e-05, 'epoch': 0.7} {'loss': 0.5582, 'learning_rate': 1.506464772664946e-05, 'epoch': 0.7} {'loss': 0.515, 'learning_rate': 1.506435802347941e-05, 'epoch': 0.7} {'loss': 0.7812, 'learning_rate': 1.5064068314592666e-05, 'epoch': 0.7} {'loss': 0.6897, 'learning_rate': 1.5063778599989548e-05, 'epoch': 0.7} {'loss': 0.546, 'learning_rate': 1.5063488879670392e-05, 'epoch': 0.7} {'loss': 0.5982, 'learning_rate': 1.5063199153635518e-05, 'epoch': 0.7} {'loss': 0.539, 'learning_rate': 1.5062909421885251e-05, 'epoch': 0.7} {'loss': 0.5854, 'learning_rate': 1.5062619684419929e-05, 'epoch': 0.7} {'loss': 0.6077, 'learning_rate': 1.5062329941239866e-05, 'epoch': 0.7} {'loss': 0.5159, 'learning_rate': 1.5062040192345397e-05, 'epoch': 0.7} {'loss': 0.6085, 'learning_rate': 1.5061750437736851e-05, 'epoch': 0.7} {'loss': 0.4515, 'learning_rate': 1.5061460677414546e-05, 'epoch': 0.7} {'loss': 0.5483, 'learning_rate': 1.5061170911378815e-05, 'epoch': 0.7} {'loss': 0.5017, 'learning_rate': 1.5060881139629988e-05, 'epoch': 0.7} {'loss': 0.6166, 'learning_rate': 1.5060591362168384e-05, 'epoch': 0.7} {'loss': 0.4433, 'learning_rate': 1.5060301578994338e-05, 'epoch': 0.7} {'loss': 0.5509, 'learning_rate': 1.5060011790108172e-05, 'epoch': 0.7} {'loss': 0.4989, 'learning_rate': 1.5059721995510216e-05, 'epoch': 0.7} {'loss': 0.6122, 'learning_rate': 1.5059432195200799e-05, 'epoch': 0.7} {'loss': 0.5672, 'learning_rate': 1.505914238918024e-05, 'epoch': 0.7} {'loss': 0.5521, 'learning_rate': 1.5058852577448872e-05, 'epoch': 0.7} {'loss': 0.5648, 'learning_rate': 1.5058562760007023e-05, 'epoch': 0.7} {'loss': 0.577, 'learning_rate': 1.505827293685502e-05, 'epoch': 0.7} {'loss': 0.6121, 'learning_rate': 1.5057983107993188e-05, 'epoch': 0.7} {'loss': 0.5721, 'learning_rate': 1.5057693273421853e-05, 'epoch': 0.7} {'loss': 0.5817, 'learning_rate': 1.5057403433141344e-05, 'epoch': 0.7} {'loss': 0.6583, 'learning_rate': 1.5057113587151988e-05, 'epoch': 0.7} {'loss': 0.5807, 'learning_rate': 1.5056823735454113e-05, 'epoch': 0.7} {'loss': 0.5829, 'learning_rate': 1.5056533878048047e-05, 'epoch': 0.7} {'loss': 0.5645, 'learning_rate': 1.5056244014934116e-05, 'epoch': 0.7} {'loss': 0.6572, 'learning_rate': 1.5055954146112645e-05, 'epoch': 0.7} {'loss': 0.6174, 'learning_rate': 1.5055664271583963e-05, 'epoch': 0.7} {'loss': 0.7006, 'learning_rate': 1.50553743913484e-05, 'epoch': 0.7} {'loss': 0.5499, 'learning_rate': 1.505508450540628e-05, 'epoch': 0.7} {'loss': 0.577, 'learning_rate': 1.5054794613757928e-05, 'epoch': 0.7} {'loss': 0.6098, 'learning_rate': 1.505450471640368e-05, 'epoch': 0.7} {'loss': 0.4914, 'learning_rate': 1.505421481334385e-05, 'epoch': 0.7} {'loss': 0.5198, 'learning_rate': 1.5053924904578776e-05, 'epoch': 0.7} {'loss': 0.6443, 'learning_rate': 1.5053634990108783e-05, 'epoch': 0.7} {'loss': 0.4414, 'learning_rate': 1.5053345069934198e-05, 'epoch': 0.7} {'loss': 0.7404, 'learning_rate': 1.5053055144055342e-05, 'epoch': 0.7} {'loss': 0.6777, 'learning_rate': 1.5052765212472552e-05, 'epoch': 0.7} {'loss': 0.4605, 'learning_rate': 1.505247527518615e-05, 'epoch': 0.7} {'loss': 0.6028, 'learning_rate': 1.5052185332196464e-05, 'epoch': 0.7} {'loss': 0.6389, 'learning_rate': 1.5051895383503823e-05, 'epoch': 0.7} {'loss': 0.5683, 'learning_rate': 1.5051605429108548e-05, 'epoch': 0.7} {'loss': 0.5428, 'learning_rate': 1.5051315469010974e-05, 'epoch': 0.7} {'loss': 0.7152, 'learning_rate': 1.5051025503211427e-05, 'epoch': 0.7} {'loss': 0.7744, 'learning_rate': 1.5050735531710232e-05, 'epoch': 0.7} {'loss': 0.5697, 'learning_rate': 1.5050445554507716e-05, 'epoch': 0.7} {'loss': 0.5449, 'learning_rate': 1.5050155571604208e-05, 'epoch': 0.7} {'loss': 0.5529, 'learning_rate': 1.5049865583000034e-05, 'epoch': 0.7} {'loss': 0.5048, 'learning_rate': 1.5049575588695522e-05, 'epoch': 0.7} {'loss': 0.656, 'learning_rate': 1.5049285588691001e-05, 'epoch': 0.7} {'loss': 0.6029, 'learning_rate': 1.5048995582986795e-05, 'epoch': 0.7} {'loss': 0.5184, 'learning_rate': 1.5048705571583233e-05, 'epoch': 0.7} {'loss': 0.66, 'learning_rate': 1.5048415554480645e-05, 'epoch': 0.7} {'loss': 0.5732, 'learning_rate': 1.5048125531679355e-05, 'epoch': 0.7} {'loss': 0.6118, 'learning_rate': 1.5047835503179688e-05, 'epoch': 0.7} {'loss': 0.7766, 'learning_rate': 1.5047545468981976e-05, 'epoch': 0.7} {'loss': 0.565, 'learning_rate': 1.5047255429086546e-05, 'epoch': 0.7} {'loss': 0.5651, 'learning_rate': 1.5046965383493726e-05, 'epoch': 0.7} {'loss': 0.5862, 'learning_rate': 1.504667533220384e-05, 'epoch': 0.7} {'loss': 0.5561, 'learning_rate': 1.5046385275217216e-05, 'epoch': 0.7} {'loss': 0.6039, 'learning_rate': 1.5046095212534186e-05, 'epoch': 0.7} {'loss': 0.4849, 'learning_rate': 1.504580514415507e-05, 'epoch': 0.7} {'loss': 0.6489, 'learning_rate': 1.5045515070080204e-05, 'epoch': 0.7} {'loss': 0.6768, 'learning_rate': 1.5045224990309905e-05, 'epoch': 0.7} {'loss': 0.6493, 'learning_rate': 1.504493490484451e-05, 'epoch': 0.7} {'loss': 0.4714, 'learning_rate': 1.5044644813684344e-05, 'epoch': 0.7} {'loss': 0.5157, 'learning_rate': 1.5044354716829731e-05, 'epoch': 0.7} {'loss': 0.5106, 'learning_rate': 1.5044064614281003e-05, 'epoch': 0.7} {'loss': 0.4926, 'learning_rate': 1.5043774506038484e-05, 'epoch': 0.7} {'loss': 0.6997, 'learning_rate': 1.5043484392102504e-05, 'epoch': 0.71} {'loss': 0.6008, 'learning_rate': 1.5043194272473388e-05, 'epoch': 0.71} {'loss': 0.7023, 'learning_rate': 1.5042904147151465e-05, 'epoch': 0.71} {'loss': 0.513, 'learning_rate': 1.504261401613706e-05, 'epoch': 0.71} {'loss': 0.4114, 'learning_rate': 1.5042323879430505e-05, 'epoch': 0.71} {'loss': 0.6714, 'learning_rate': 1.5042033737032124e-05, 'epoch': 0.71} {'loss': 0.6751, 'learning_rate': 1.5041743588942245e-05, 'epoch': 0.71} {'loss': 0.5052, 'learning_rate': 1.50414534351612e-05, 'epoch': 0.71} {'loss': 0.544, 'learning_rate': 1.5041163275689309e-05, 'epoch': 0.71} {'loss': 0.5934, 'learning_rate': 1.5040873110526903e-05, 'epoch': 0.71} {'loss': 0.5758, 'learning_rate': 1.5040582939674312e-05, 'epoch': 0.71} {'loss': 0.7112, 'learning_rate': 1.5040292763131861e-05, 'epoch': 0.71} {'loss': 0.6496, 'learning_rate': 1.5040002580899878e-05, 'epoch': 0.71} {'loss': 0.7387, 'learning_rate': 1.5039712392978692e-05, 'epoch': 0.71} {'loss': 0.588, 'learning_rate': 1.5039422199368625e-05, 'epoch': 0.71} {'loss': 0.615, 'learning_rate': 1.5039132000070011e-05, 'epoch': 0.71} {'loss': 0.5327, 'learning_rate': 1.5038841795083174e-05, 'epoch': 0.71} {'loss': 0.5531, 'learning_rate': 1.5038551584408445e-05, 'epoch': 0.71} {'loss': 0.3935, 'learning_rate': 1.5038261368046147e-05, 'epoch': 0.71} {'loss': 0.5701, 'learning_rate': 1.5037971145996611e-05, 'epoch': 0.71} {'loss': 0.6058, 'learning_rate': 1.5037680918260165e-05, 'epoch': 0.71} {'loss': 0.5435, 'learning_rate': 1.5037390684837134e-05, 'epoch': 0.71} {'loss': 0.5143, 'learning_rate': 1.5037100445727846e-05, 'epoch': 0.71} {'loss': 0.6542, 'learning_rate': 1.503681020093263e-05, 'epoch': 0.71} {'loss': 0.5372, 'learning_rate': 1.5036519950451814e-05, 'epoch': 0.71} {'loss': 0.6223, 'learning_rate': 1.5036229694285725e-05, 'epoch': 0.71} {'loss': 0.5664, 'learning_rate': 1.5035939432434688e-05, 'epoch': 0.71} {'loss': 0.5155, 'learning_rate': 1.5035649164899034e-05, 'epoch': 0.71} {'loss': 0.5485, 'learning_rate': 1.503535889167909e-05, 'epoch': 0.71} {'loss': 0.4575, 'learning_rate': 1.5035068612775181e-05, 'epoch': 0.71} {'loss': 0.4572, 'learning_rate': 1.503477832818764e-05, 'epoch': 0.71} {'loss': 0.5628, 'learning_rate': 1.5034488037916792e-05, 'epoch': 0.71} {'loss': 0.5555, 'learning_rate': 1.5034197741962961e-05, 'epoch': 0.71} {'loss': 0.551, 'learning_rate': 1.503390744032648e-05, 'epoch': 0.71} {'loss': 0.6177, 'learning_rate': 1.5033617133007676e-05, 'epoch': 0.71} {'loss': 0.5805, 'learning_rate': 1.5033326820006877e-05, 'epoch': 0.71} {'loss': 0.5364, 'learning_rate': 1.5033036501324407e-05, 'epoch': 0.71} {'loss': 0.5733, 'learning_rate': 1.5032746176960595e-05, 'epoch': 0.71} {'loss': 0.5535, 'learning_rate': 1.503245584691577e-05, 'epoch': 0.71} {'loss': 0.5531, 'learning_rate': 1.503216551119026e-05, 'epoch': 0.71} {'loss': 0.548, 'learning_rate': 1.503187516978439e-05, 'epoch': 0.71} {'loss': 0.461, 'learning_rate': 1.5031584822698493e-05, 'epoch': 0.71} {'loss': 0.4874, 'learning_rate': 1.5031294469932891e-05, 'epoch': 0.71} {'loss': 0.7283, 'learning_rate': 1.5031004111487915e-05, 'epoch': 0.71} {'loss': 0.6546, 'learning_rate': 1.5030713747363892e-05, 'epoch': 0.71} {'loss': 0.6433, 'learning_rate': 1.5030423377561149e-05, 'epoch': 0.71} {'loss': 0.7153, 'learning_rate': 1.5030133002080017e-05, 'epoch': 0.71} {'loss': 0.5921, 'learning_rate': 1.502984262092082e-05, 'epoch': 0.71} {'loss': 0.6996, 'learning_rate': 1.5029552234083887e-05, 'epoch': 0.71} {'loss': 0.647, 'learning_rate': 1.5029261841569546e-05, 'epoch': 0.71} {'loss': 0.6905, 'learning_rate': 1.5028971443378126e-05, 'epoch': 0.71} {'loss': 0.5499, 'learning_rate': 1.5028681039509954e-05, 'epoch': 0.71} {'loss': 0.4639, 'learning_rate': 1.5028390629965355e-05, 'epoch': 0.71} {'loss': 0.7245, 'learning_rate': 1.502810021474466e-05, 'epoch': 0.71} {'loss': 0.6176, 'learning_rate': 1.5027809793848196e-05, 'epoch': 0.71} {'loss': 0.6099, 'learning_rate': 1.5027519367276288e-05, 'epoch': 0.71} {'loss': 0.4176, 'learning_rate': 1.502722893502927e-05, 'epoch': 0.71} {'loss': 0.5403, 'learning_rate': 1.5026938497107466e-05, 'epoch': 0.71} {'loss': 0.588, 'learning_rate': 1.5026648053511204e-05, 'epoch': 0.71} {'loss': 0.5056, 'learning_rate': 1.5026357604240814e-05, 'epoch': 0.71} {'loss': 0.462, 'learning_rate': 1.502606714929662e-05, 'epoch': 0.71} {'loss': 0.7189, 'learning_rate': 1.502577668867895e-05, 'epoch': 0.71} {'loss': 0.4876, 'learning_rate': 1.502548622238814e-05, 'epoch': 0.71} {'loss': 0.5652, 'learning_rate': 1.5025195750424506e-05, 'epoch': 0.71} {'loss': 0.4084, 'learning_rate': 1.5024905272788383e-05, 'epoch': 0.71} {'loss': 0.5949, 'learning_rate': 1.50246147894801e-05, 'epoch': 0.71} {'loss': 0.6063, 'learning_rate': 1.502432430049998e-05, 'epoch': 0.71} {'loss': 0.6042, 'learning_rate': 1.5024033805848353e-05, 'epoch': 0.71} {'loss': 0.53, 'learning_rate': 1.5023743305525549e-05, 'epoch': 0.71} {'loss': 0.541, 'learning_rate': 1.5023452799531892e-05, 'epoch': 0.71} {'loss': 0.5514, 'learning_rate': 1.5023162287867711e-05, 'epoch': 0.71} {'loss': 0.5932, 'learning_rate': 1.5022871770533338e-05, 'epoch': 0.71} {'loss': 0.5823, 'learning_rate': 1.5022581247529098e-05, 'epoch': 0.71} {'loss': 0.5733, 'learning_rate': 1.5022290718855317e-05, 'epoch': 0.71} {'loss': 0.5595, 'learning_rate': 1.5022000184512324e-05, 'epoch': 0.71} {'loss': 0.5204, 'learning_rate': 1.5021709644500453e-05, 'epoch': 0.71} {'loss': 0.3667, 'learning_rate': 1.502141909882002e-05, 'epoch': 0.71} {'loss': 0.5125, 'learning_rate': 1.5021128547471362e-05, 'epoch': 0.71} {'loss': 0.6666, 'learning_rate': 1.5020837990454807e-05, 'epoch': 0.71} {'loss': 0.7749, 'learning_rate': 1.5020547427770678e-05, 'epoch': 0.71} {'loss': 0.3481, 'learning_rate': 1.5020256859419307e-05, 'epoch': 0.71} {'loss': 0.7458, 'learning_rate': 1.501996628540102e-05, 'epoch': 0.71} {'loss': 0.695, 'learning_rate': 1.5019675705716145e-05, 'epoch': 0.71} {'loss': 0.572, 'learning_rate': 1.5019385120365013e-05, 'epoch': 0.71} {'loss': 0.5524, 'learning_rate': 1.5019094529347948e-05, 'epoch': 0.71} {'loss': 0.5177, 'learning_rate': 1.5018803932665282e-05, 'epoch': 0.71} {'loss': 0.4261, 'learning_rate': 1.501851333031734e-05, 'epoch': 0.71} {'loss': 0.5931, 'learning_rate': 1.5018222722304447e-05, 'epoch': 0.71} {'loss': 0.6614, 'learning_rate': 1.5017932108626939e-05, 'epoch': 0.71} {'loss': 0.4905, 'learning_rate': 1.5017641489285137e-05, 'epoch': 0.71} {'loss': 0.6241, 'learning_rate': 1.5017350864279374e-05, 'epoch': 0.71} {'loss': 0.4795, 'learning_rate': 1.5017060233609975e-05, 'epoch': 0.71} {'loss': 0.5435, 'learning_rate': 1.501676959727727e-05, 'epoch': 0.71} {'loss': 0.6024, 'learning_rate': 1.5016478955281584e-05, 'epoch': 0.71} {'loss': 0.4282, 'learning_rate': 1.501618830762325e-05, 'epoch': 0.71} {'loss': 0.5131, 'learning_rate': 1.5015897654302589e-05, 'epoch': 0.71} {'loss': 0.3836, 'learning_rate': 1.5015606995319938e-05, 'epoch': 0.71} {'loss': 0.6511, 'learning_rate': 1.5015316330675617e-05, 'epoch': 0.71} {'loss': 0.5436, 'learning_rate': 1.5015025660369962e-05, 'epoch': 0.71} {'loss': 0.5998, 'learning_rate': 1.5014734984403294e-05, 'epoch': 0.71} {'loss': 0.5723, 'learning_rate': 1.5014444302775944e-05, 'epoch': 0.71} {'loss': 0.702, 'learning_rate': 1.5014153615488238e-05, 'epoch': 0.71} {'loss': 0.6764, 'learning_rate': 1.5013862922540508e-05, 'epoch': 0.71} {'loss': 0.6653, 'learning_rate': 1.501357222393308e-05, 'epoch': 0.71} {'loss': 0.6277, 'learning_rate': 1.501328151966628e-05, 'epoch': 0.71} {'loss': 0.5324, 'learning_rate': 1.5012990809740442e-05, 'epoch': 0.71} {'loss': 0.569, 'learning_rate': 1.5012700094155887e-05, 'epoch': 0.71} {'loss': 0.55, 'learning_rate': 1.501240937291295e-05, 'epoch': 0.71} {'loss': 0.7182, 'learning_rate': 1.5012118646011957e-05, 'epoch': 0.71} {'loss': 0.6685, 'learning_rate': 1.5011827913453232e-05, 'epoch': 0.71} {'loss': 0.6583, 'learning_rate': 1.5011537175237108e-05, 'epoch': 0.71} {'loss': 0.5806, 'learning_rate': 1.5011246431363912e-05, 'epoch': 0.71} {'loss': 0.5381, 'learning_rate': 1.5010955681833971e-05, 'epoch': 0.71} {'loss': 0.5936, 'learning_rate': 1.5010664926647614e-05, 'epoch': 0.71} {'loss': 0.63, 'learning_rate': 1.5010374165805166e-05, 'epoch': 0.71} {'loss': 0.6876, 'learning_rate': 1.5010083399306963e-05, 'epoch': 0.71} {'loss': 0.5863, 'learning_rate': 1.5009792627153326e-05, 'epoch': 0.71} {'loss': 0.6346, 'learning_rate': 1.5009501849344585e-05, 'epoch': 0.71} {'loss': 0.6558, 'learning_rate': 1.5009211065881073e-05, 'epoch': 0.71} {'loss': 0.5447, 'learning_rate': 1.500892027676311e-05, 'epoch': 0.71} {'loss': 0.5135, 'learning_rate': 1.500862948199103e-05, 'epoch': 0.71} {'loss': 0.5136, 'learning_rate': 1.500833868156516e-05, 'epoch': 0.71} {'loss': 0.4478, 'learning_rate': 1.5008047875485829e-05, 'epoch': 0.71} {'loss': 0.6329, 'learning_rate': 1.500775706375336e-05, 'epoch': 0.71} {'loss': 0.6531, 'learning_rate': 1.500746624636809e-05, 'epoch': 0.71} {'loss': 0.5887, 'learning_rate': 1.5007175423330342e-05, 'epoch': 0.71} {'loss': 0.4751, 'learning_rate': 1.5006884594640446e-05, 'epoch': 0.71} {'loss': 0.7115, 'learning_rate': 1.5006593760298727e-05, 'epoch': 0.71} {'loss': 0.5587, 'learning_rate': 1.5006302920305515e-05, 'epoch': 0.71} {'loss': 0.5687, 'learning_rate': 1.5006012074661143e-05, 'epoch': 0.71} {'loss': 0.5507, 'learning_rate': 1.5005721223365932e-05, 'epoch': 0.71} {'loss': 0.5801, 'learning_rate': 1.5005430366420215e-05, 'epoch': 0.71} {'loss': 0.654, 'learning_rate': 1.5005139503824318e-05, 'epoch': 0.71} {'loss': 0.6701, 'learning_rate': 1.500484863557857e-05, 'epoch': 0.71} {'loss': 0.6306, 'learning_rate': 1.5004557761683303e-05, 'epoch': 0.71} {'loss': 0.5076, 'learning_rate': 1.5004266882138838e-05, 'epoch': 0.71} {'loss': 0.5976, 'learning_rate': 1.500397599694551e-05, 'epoch': 0.71} {'loss': 0.5726, 'learning_rate': 1.5003685106103642e-05, 'epoch': 0.71} {'loss': 0.5088, 'learning_rate': 1.500339420961357e-05, 'epoch': 0.71} {'loss': 0.5854, 'learning_rate': 1.5003103307475613e-05, 'epoch': 0.71} {'loss': 0.5786, 'learning_rate': 1.5002812399690104e-05, 'epoch': 0.71} {'loss': 0.6775, 'learning_rate': 1.5002521486257371e-05, 'epoch': 0.71} {'loss': 0.5889, 'learning_rate': 1.5002230567177743e-05, 'epoch': 0.71} {'loss': 0.6007, 'learning_rate': 1.5001939642451549e-05, 'epoch': 0.71} {'loss': 0.6443, 'learning_rate': 1.5001648712079113e-05, 'epoch': 0.71} {'loss': 0.4947, 'learning_rate': 1.500135777606077e-05, 'epoch': 0.71} {'loss': 0.3002, 'learning_rate': 1.5001066834396842e-05, 'epoch': 0.71} {'loss': 0.6669, 'learning_rate': 1.5000775887087664e-05, 'epoch': 0.71} {'loss': 0.5262, 'learning_rate': 1.5000484934133561e-05, 'epoch': 0.71} {'loss': 0.5468, 'learning_rate': 1.5000193975534862e-05, 'epoch': 0.71} {'loss': 0.6056, 'learning_rate': 1.4999903011291893e-05, 'epoch': 0.71} {'loss': 0.6255, 'learning_rate': 1.4999612041404982e-05, 'epoch': 0.71} {'loss': 0.6116, 'learning_rate': 1.4999321065874463e-05, 'epoch': 0.71} {'loss': 0.5107, 'learning_rate': 1.4999030084700659e-05, 'epoch': 0.71} {'loss': 0.6805, 'learning_rate': 1.4998739097883903e-05, 'epoch': 0.71} {'loss': 0.4887, 'learning_rate': 1.4998448105424519e-05, 'epoch': 0.71} {'loss': 0.544, 'learning_rate': 1.499815710732284e-05, 'epoch': 0.71} {'loss': 0.5896, 'learning_rate': 1.4997866103579188e-05, 'epoch': 0.71} {'loss': 0.4579, 'learning_rate': 1.49975750941939e-05, 'epoch': 0.71} {'loss': 0.6283, 'learning_rate': 1.4997284079167298e-05, 'epoch': 0.71} {'loss': 0.4701, 'learning_rate': 1.4996993058499712e-05, 'epoch': 0.71} {'loss': 0.5326, 'learning_rate': 1.4996702032191474e-05, 'epoch': 0.71} {'loss': 0.4452, 'learning_rate': 1.4996411000242908e-05, 'epoch': 0.71} {'loss': 0.5291, 'learning_rate': 1.4996119962654341e-05, 'epoch': 0.71} {'loss': 0.5039, 'learning_rate': 1.4995828919426107e-05, 'epoch': 0.71} {'loss': 0.605, 'learning_rate': 1.4995537870558532e-05, 'epoch': 0.71} {'loss': 0.7, 'learning_rate': 1.4995246816051947e-05, 'epoch': 0.71} {'loss': 0.5139, 'learning_rate': 1.4994955755906674e-05, 'epoch': 0.71} {'loss': 0.5271, 'learning_rate': 1.4994664690123049e-05, 'epoch': 0.71} {'loss': 0.678, 'learning_rate': 1.4994373618701397e-05, 'epoch': 0.71} {'loss': 0.5439, 'learning_rate': 1.4994082541642045e-05, 'epoch': 0.71} {'loss': 0.5663, 'learning_rate': 1.4993791458945323e-05, 'epoch': 0.71} {'loss': 0.5612, 'learning_rate': 1.4993500370611563e-05, 'epoch': 0.71} {'loss': 0.6145, 'learning_rate': 1.499320927664109e-05, 'epoch': 0.71} {'loss': 0.6386, 'learning_rate': 1.4992918177034232e-05, 'epoch': 0.71} {'loss': 0.5644, 'learning_rate': 1.499262707179132e-05, 'epoch': 0.71} {'loss': 0.5666, 'learning_rate': 1.4992335960912678e-05, 'epoch': 0.71} {'loss': 0.655, 'learning_rate': 1.4992044844398641e-05, 'epoch': 0.71} {'loss': 0.7427, 'learning_rate': 1.4991753722249537e-05, 'epoch': 0.71} {'loss': 0.5331, 'learning_rate': 1.499146259446569e-05, 'epoch': 0.71} {'loss': 0.5344, 'learning_rate': 1.499117146104743e-05, 'epoch': 0.71} {'loss': 0.4757, 'learning_rate': 1.4990880321995085e-05, 'epoch': 0.71} {'loss': 0.5014, 'learning_rate': 1.4990589177308987e-05, 'epoch': 0.71} {'loss': 0.6017, 'learning_rate': 1.4990298026989465e-05, 'epoch': 0.71} {'loss': 0.4858, 'learning_rate': 1.4990006871036845e-05, 'epoch': 0.71} {'loss': 0.7404, 'learning_rate': 1.4989715709451455e-05, 'epoch': 0.71} {'loss': 0.6064, 'learning_rate': 1.4989424542233623e-05, 'epoch': 0.71} {'loss': 0.4404, 'learning_rate': 1.4989133369383681e-05, 'epoch': 0.71} {'loss': 0.4904, 'learning_rate': 1.4988842190901957e-05, 'epoch': 0.71} {'loss': 0.5343, 'learning_rate': 1.4988551006788778e-05, 'epoch': 0.71} {'loss': 0.5452, 'learning_rate': 1.4988259817044472e-05, 'epoch': 0.71} {'loss': 0.539, 'learning_rate': 1.4987968621669373e-05, 'epoch': 0.71} {'loss': 0.4814, 'learning_rate': 1.4987677420663805e-05, 'epoch': 0.71} {'loss': 0.5313, 'learning_rate': 1.4987386214028095e-05, 'epoch': 0.71} {'loss': 0.5867, 'learning_rate': 1.4987095001762574e-05, 'epoch': 0.71} {'loss': 0.6449, 'learning_rate': 1.4986803783867574e-05, 'epoch': 0.71} {'loss': 0.6389, 'learning_rate': 1.498651256034342e-05, 'epoch': 0.71} {'loss': 0.4006, 'learning_rate': 1.4986221331190441e-05, 'epoch': 0.71} {'loss': 0.5452, 'learning_rate': 1.4985930096408967e-05, 'epoch': 0.71} {'loss': 0.4874, 'learning_rate': 1.4985638855999328e-05, 'epoch': 0.71} {'loss': 0.4132, 'learning_rate': 1.4985347609961846e-05, 'epoch': 0.71} {'loss': 0.548, 'learning_rate': 1.4985056358296857e-05, 'epoch': 0.71} {'loss': 0.6222, 'learning_rate': 1.4984765101004688e-05, 'epoch': 0.71} {'loss': 0.6665, 'learning_rate': 1.4984473838085665e-05, 'epoch': 0.71} {'loss': 0.6022, 'learning_rate': 1.498418256954012e-05, 'epoch': 0.71} {'loss': 0.7923, 'learning_rate': 1.4983891295368382e-05, 'epoch': 0.71} {'loss': 0.4169, 'learning_rate': 1.4983600015570776e-05, 'epoch': 0.71} {'loss': 0.5606, 'learning_rate': 1.4983308730147635e-05, 'epoch': 0.71} {'loss': 0.6272, 'learning_rate': 1.4983017439099285e-05, 'epoch': 0.71} {'loss': 0.5823, 'learning_rate': 1.4982726142426058e-05, 'epoch': 0.71} {'loss': 0.4878, 'learning_rate': 1.4982434840128277e-05, 'epoch': 0.71} {'loss': 0.464, 'learning_rate': 1.4982143532206279e-05, 'epoch': 0.71} {'loss': 0.5317, 'learning_rate': 1.4981852218660386e-05, 'epoch': 0.71} {'loss': 0.5684, 'learning_rate': 1.498156089949093e-05, 'epoch': 0.71} {'loss': 0.4261, 'learning_rate': 1.4981269574698238e-05, 'epoch': 0.71} {'loss': 0.6755, 'learning_rate': 1.498097824428264e-05, 'epoch': 0.71} {'loss': 0.5, 'learning_rate': 1.4980686908244466e-05, 'epoch': 0.71} {'loss': 0.6877, 'learning_rate': 1.4980395566584043e-05, 'epoch': 0.71} {'loss': 0.5365, 'learning_rate': 1.4980104219301699e-05, 'epoch': 0.71} {'loss': 0.6495, 'learning_rate': 1.4979812866397765e-05, 'epoch': 0.71} {'loss': 0.557, 'learning_rate': 1.497952150787257e-05, 'epoch': 0.71} {'loss': 0.586, 'learning_rate': 1.4979230143726442e-05, 'epoch': 0.71} {'loss': 0.5907, 'learning_rate': 1.4978938773959708e-05, 'epoch': 0.71} {'loss': 0.6778, 'learning_rate': 1.4978647398572701e-05, 'epoch': 0.71} {'loss': 0.5227, 'learning_rate': 1.4978356017565749e-05, 'epoch': 0.71} {'loss': 0.5425, 'learning_rate': 1.4978064630939177e-05, 'epoch': 0.71} {'loss': 0.5266, 'learning_rate': 1.4977773238693316e-05, 'epoch': 0.71} {'loss': 0.7126, 'learning_rate': 1.4977481840828499e-05, 'epoch': 0.71} {'loss': 0.4716, 'learning_rate': 1.4977190437345051e-05, 'epoch': 0.71} {'loss': 0.5294, 'learning_rate': 1.4976899028243298e-05, 'epoch': 0.71} {'loss': 0.5093, 'learning_rate': 1.4976607613523574e-05, 'epoch': 0.71} {'loss': 0.4797, 'learning_rate': 1.4976316193186209e-05, 'epoch': 0.71} {'loss': 0.598, 'learning_rate': 1.4976024767231528e-05, 'epoch': 0.71} {'loss': 0.7215, 'learning_rate': 1.4975733335659858e-05, 'epoch': 0.71} {'loss': 0.4848, 'learning_rate': 1.4975441898471536e-05, 'epoch': 0.71} {'loss': 0.6802, 'learning_rate': 1.4975150455666885e-05, 'epoch': 0.71} {'loss': 0.5533, 'learning_rate': 1.4974859007246234e-05, 'epoch': 0.71} {'loss': 0.6711, 'learning_rate': 1.4974567553209913e-05, 'epoch': 0.71} {'loss': 0.7732, 'learning_rate': 1.4974276093558251e-05, 'epoch': 0.71} {'loss': 0.6173, 'learning_rate': 1.4973984628291578e-05, 'epoch': 0.71} {'loss': 0.5733, 'learning_rate': 1.4973693157410222e-05, 'epoch': 0.71} {'loss': 0.6645, 'learning_rate': 1.4973401680914515e-05, 'epoch': 0.71} {'loss': 0.5671, 'learning_rate': 1.4973110198804778e-05, 'epoch': 0.71} {'loss': 0.584, 'learning_rate': 1.4972818711081348e-05, 'epoch': 0.71} {'loss': 0.6952, 'learning_rate': 1.4972527217744552e-05, 'epoch': 0.71} {'loss': 0.4796, 'learning_rate': 1.4972235718794717e-05, 'epoch': 0.71} {'loss': 0.611, 'learning_rate': 1.4971944214232173e-05, 'epoch': 0.71} {'loss': 0.6372, 'learning_rate': 1.4971652704057253e-05, 'epoch': 0.71} {'loss': 0.4817, 'learning_rate': 1.497136118827028e-05, 'epoch': 0.71} {'loss': 0.4319, 'learning_rate': 1.4971069666871585e-05, 'epoch': 0.71} {'loss': 0.4629, 'learning_rate': 1.4970778139861496e-05, 'epoch': 0.71} {'loss': 0.6474, 'learning_rate': 1.4970486607240346e-05, 'epoch': 0.71} {'loss': 0.4423, 'learning_rate': 1.4970195069008461e-05, 'epoch': 0.71} {'loss': 0.5114, 'learning_rate': 1.4969903525166174e-05, 'epoch': 0.71} {'loss': 0.5944, 'learning_rate': 1.4969611975713806e-05, 'epoch': 0.71} {'loss': 0.5428, 'learning_rate': 1.4969320420651694e-05, 'epoch': 0.71} {'loss': 0.5655, 'learning_rate': 1.4969028859980164e-05, 'epoch': 0.71} {'loss': 0.5762, 'learning_rate': 1.4968737293699548e-05, 'epoch': 0.71} {'loss': 0.533, 'learning_rate': 1.4968445721810168e-05, 'epoch': 0.71} {'loss': 0.6032, 'learning_rate': 1.4968154144312358e-05, 'epoch': 0.71} {'loss': 0.7003, 'learning_rate': 1.4967862561206447e-05, 'epoch': 0.71} {'loss': 0.5151, 'learning_rate': 1.4967570972492767e-05, 'epoch': 0.71} {'loss': 0.4762, 'learning_rate': 1.4967279378171641e-05, 'epoch': 0.71} {'loss': 0.5799, 'learning_rate': 1.4966987778243403e-05, 'epoch': 0.71} {'loss': 0.5699, 'learning_rate': 1.4966696172708379e-05, 'epoch': 0.71} {'loss': 0.6725, 'learning_rate': 1.4966404561566898e-05, 'epoch': 0.71} {'loss': 0.545, 'learning_rate': 1.4966112944819293e-05, 'epoch': 0.71} {'loss': 0.7129, 'learning_rate': 1.496582132246589e-05, 'epoch': 0.71} {'loss': 0.5727, 'learning_rate': 1.496552969450702e-05, 'epoch': 0.71} {'loss': 0.5214, 'learning_rate': 1.496523806094301e-05, 'epoch': 0.71} {'loss': 0.5621, 'learning_rate': 1.4964946421774188e-05, 'epoch': 0.71} {'loss': 0.5488, 'learning_rate': 1.4964654777000892e-05, 'epoch': 0.71} {'loss': 0.6573, 'learning_rate': 1.4964363126623437e-05, 'epoch': 0.71} {'loss': 0.5696, 'learning_rate': 1.4964071470642165e-05, 'epoch': 0.71} {'loss': 0.6777, 'learning_rate': 1.4963779809057402e-05, 'epoch': 0.71} {'loss': 0.5139, 'learning_rate': 1.4963488141869471e-05, 'epoch': 0.71} {'loss': 0.7197, 'learning_rate': 1.4963196469078706e-05, 'epoch': 0.71} {'loss': 0.5647, 'learning_rate': 1.496290479068544e-05, 'epoch': 0.71} {'loss': 0.7401, 'learning_rate': 1.4962613106689995e-05, 'epoch': 0.71} {'loss': 0.6773, 'learning_rate': 1.4962321417092704e-05, 'epoch': 0.71} {'loss': 0.4915, 'learning_rate': 1.4962029721893898e-05, 'epoch': 0.71} {'loss': 0.5876, 'learning_rate': 1.49617380210939e-05, 'epoch': 0.71} {'loss': 0.3684, 'learning_rate': 1.4961446314693046e-05, 'epoch': 0.71} {'loss': 0.595, 'learning_rate': 1.4961154602691661e-05, 'epoch': 0.71} {'loss': 0.5368, 'learning_rate': 1.4960862885090079e-05, 'epoch': 0.71} {'loss': 0.4518, 'learning_rate': 1.4960571161888626e-05, 'epoch': 0.71} {'loss': 0.56, 'learning_rate': 1.4960279433087628e-05, 'epoch': 0.71} {'loss': 0.5352, 'learning_rate': 1.4959987698687419e-05, 'epoch': 0.71} {'loss': 0.5639, 'learning_rate': 1.4959695958688327e-05, 'epoch': 0.71} {'loss': 0.4503, 'learning_rate': 1.4959404213090683e-05, 'epoch': 0.71} {'loss': 0.552, 'learning_rate': 1.4959112461894813e-05, 'epoch': 0.71} {'loss': 0.4695, 'learning_rate': 1.495882070510105e-05, 'epoch': 0.71} {'loss': 0.4871, 'learning_rate': 1.4958528942709717e-05, 'epoch': 0.71} {'loss': 0.7597, 'learning_rate': 1.4958237174721153e-05, 'epoch': 0.71} {'loss': 0.5413, 'learning_rate': 1.4957945401135679e-05, 'epoch': 0.71} {'loss': 0.7794, 'learning_rate': 1.4957653621953627e-05, 'epoch': 0.71} {'loss': 0.7222, 'learning_rate': 1.4957361837175329e-05, 'epoch': 0.71} {'loss': 0.5917, 'learning_rate': 1.4957070046801112e-05, 'epoch': 0.71} {'loss': 0.6969, 'learning_rate': 1.4956778250831305e-05, 'epoch': 0.71} {'loss': 0.48, 'learning_rate': 1.4956486449266236e-05, 'epoch': 0.71} {'loss': 0.5121, 'learning_rate': 1.4956194642106239e-05, 'epoch': 0.71} {'loss': 0.4687, 'learning_rate': 1.4955902829351638e-05, 'epoch': 0.71} {'loss': 0.6167, 'learning_rate': 1.4955611011002768e-05, 'epoch': 0.71} {'loss': 0.668, 'learning_rate': 1.4955319187059956e-05, 'epoch': 0.71} {'loss': 0.4093, 'learning_rate': 1.4955027357523529e-05, 'epoch': 0.71} {'loss': 0.4995, 'learning_rate': 1.4954735522393818e-05, 'epoch': 0.71} {'loss': 0.7809, 'learning_rate': 1.4954443681671152e-05, 'epoch': 0.71} {'loss': 0.5502, 'learning_rate': 1.4954151835355864e-05, 'epoch': 0.71} {'loss': 0.5225, 'learning_rate': 1.4953859983448278e-05, 'epoch': 0.71} {'loss': 0.4584, 'learning_rate': 1.4953568125948728e-05, 'epoch': 0.71} {'loss': 0.5779, 'learning_rate': 1.4953276262857541e-05, 'epoch': 0.71} {'loss': 0.6409, 'learning_rate': 1.4952984394175048e-05, 'epoch': 0.71} {'loss': 0.5695, 'learning_rate': 1.4952692519901576e-05, 'epoch': 0.71} {'loss': 0.4679, 'learning_rate': 1.4952400640037456e-05, 'epoch': 0.71} {'loss': 0.5725, 'learning_rate': 1.4952108754583017e-05, 'epoch': 0.71} {'loss': 0.547, 'learning_rate': 1.4951816863538589e-05, 'epoch': 0.71} {'loss': 0.7226, 'learning_rate': 1.4951524966904502e-05, 'epoch': 0.71} {'loss': 0.7032, 'learning_rate': 1.4951233064681086e-05, 'epoch': 0.71} {'loss': 0.4876, 'learning_rate': 1.4950941156868669e-05, 'epoch': 0.71} {'loss': 0.5912, 'learning_rate': 1.4950649243467579e-05, 'epoch': 0.71} {'loss': 0.6874, 'learning_rate': 1.4950357324478148e-05, 'epoch': 0.71} {'loss': 0.5642, 'learning_rate': 1.4950065399900706e-05, 'epoch': 0.71} {'loss': 0.6217, 'learning_rate': 1.494977346973558e-05, 'epoch': 0.71} {'loss': 0.52, 'learning_rate': 1.4949481533983105e-05, 'epoch': 0.71} {'loss': 0.6375, 'learning_rate': 1.49491895926436e-05, 'epoch': 0.71} {'loss': 0.3973, 'learning_rate': 1.4948897645717404e-05, 'epoch': 0.71} {'loss': 0.7833, 'learning_rate': 1.4948605693204845e-05, 'epoch': 0.71} {'loss': 0.5498, 'learning_rate': 1.494831373510625e-05, 'epoch': 0.71} {'loss': 0.5347, 'learning_rate': 1.4948021771421952e-05, 'epoch': 0.71} {'loss': 0.6393, 'learning_rate': 1.4947729802152275e-05, 'epoch': 0.71} {'loss': 0.5634, 'learning_rate': 1.4947437827297554e-05, 'epoch': 0.71} {'loss': 0.5461, 'learning_rate': 1.4947145846858116e-05, 'epoch': 0.71} {'loss': 0.5148, 'learning_rate': 1.494685386083429e-05, 'epoch': 0.71} {'loss': 0.6004, 'learning_rate': 1.4946561869226408e-05, 'epoch': 0.71} {'loss': 0.3756, 'learning_rate': 1.49462698720348e-05, 'epoch': 0.71} {'loss': 0.513, 'learning_rate': 1.494597786925979e-05, 'epoch': 0.71} {'loss': 0.4965, 'learning_rate': 1.4945685860901715e-05, 'epoch': 0.71} {'loss': 0.6485, 'learning_rate': 1.4945393846960899e-05, 'epoch': 0.71} {'loss': 0.5146, 'learning_rate': 1.4945101827437673e-05, 'epoch': 0.71} {'loss': 0.5175, 'learning_rate': 1.494480980233237e-05, 'epoch': 0.71} {'loss': 0.52, 'learning_rate': 1.4944517771645315e-05, 'epoch': 0.71} {'loss': 0.4614, 'learning_rate': 1.494422573537684e-05, 'epoch': 0.71} {'loss': 0.4799, 'learning_rate': 1.4943933693527275e-05, 'epoch': 0.71} {'loss': 0.6201, 'learning_rate': 1.494364164609695e-05, 'epoch': 0.71} {'loss': 0.4684, 'learning_rate': 1.4943349593086192e-05, 'epoch': 0.71} {'loss': 0.6239, 'learning_rate': 1.4943057534495332e-05, 'epoch': 0.71} {'loss': 0.7248, 'learning_rate': 1.49427654703247e-05, 'epoch': 0.71} {'loss': 0.7567, 'learning_rate': 1.494247340057463e-05, 'epoch': 0.71} {'loss': 0.5405, 'learning_rate': 1.4942181325245441e-05, 'epoch': 0.71} {'loss': 0.5571, 'learning_rate': 1.4941889244337474e-05, 'epoch': 0.71} {'loss': 0.6837, 'learning_rate': 1.4941597157851049e-05, 'epoch': 0.71} {'loss': 0.6687, 'learning_rate': 1.4941305065786504e-05, 'epoch': 0.71} {'loss': 0.4972, 'learning_rate': 1.4941012968144164e-05, 'epoch': 0.71} {'loss': 0.4819, 'learning_rate': 1.494072086492436e-05, 'epoch': 0.71} {'loss': 0.4448, 'learning_rate': 1.4940428756127423e-05, 'epoch': 0.71} {'loss': 0.5561, 'learning_rate': 1.494013664175368e-05, 'epoch': 0.71} {'loss': 0.4007, 'learning_rate': 1.4939844521803462e-05, 'epoch': 0.71} {'loss': 0.4903, 'learning_rate': 1.4939552396277099e-05, 'epoch': 0.71} {'loss': 0.6119, 'learning_rate': 1.493926026517492e-05, 'epoch': 0.71} {'loss': 0.5806, 'learning_rate': 1.4938968128497258e-05, 'epoch': 0.71} {'loss': 0.6196, 'learning_rate': 1.493867598624444e-05, 'epoch': 0.71} {'loss': 0.5983, 'learning_rate': 1.4938383838416795e-05, 'epoch': 0.71} {'loss': 0.4384, 'learning_rate': 1.493809168501465e-05, 'epoch': 0.71} {'loss': 0.3854, 'learning_rate': 1.4937799526038343e-05, 'epoch': 0.71} {'loss': 0.7034, 'learning_rate': 1.4937507361488196e-05, 'epoch': 0.71} {'loss': 0.6262, 'learning_rate': 1.4937215191364547e-05, 'epoch': 0.71} {'loss': 0.5737, 'learning_rate': 1.4936923015667716e-05, 'epoch': 0.71} {'loss': 0.5504, 'learning_rate': 1.493663083439804e-05, 'epoch': 0.71} {'loss': 0.5197, 'learning_rate': 1.4936338647555848e-05, 'epoch': 0.71} {'loss': 0.562, 'learning_rate': 1.4936046455141467e-05, 'epoch': 0.71} {'loss': 0.6842, 'learning_rate': 1.4935754257155226e-05, 'epoch': 0.71} {'loss': 0.6017, 'learning_rate': 1.493546205359746e-05, 'epoch': 0.71} {'loss': 0.6315, 'learning_rate': 1.4935169844468493e-05, 'epoch': 0.71} {'loss': 0.6698, 'learning_rate': 1.4934877629768663e-05, 'epoch': 0.71} {'loss': 0.548, 'learning_rate': 1.4934585409498288e-05, 'epoch': 0.71} {'loss': 0.5435, 'learning_rate': 1.4934293183657707e-05, 'epoch': 0.71} {'loss': 0.384, 'learning_rate': 1.4934000952247248e-05, 'epoch': 0.71} {'loss': 0.6633, 'learning_rate': 1.4933708715267239e-05, 'epoch': 0.71} {'loss': 0.714, 'learning_rate': 1.4933416472718013e-05, 'epoch': 0.71} {'loss': 0.6825, 'learning_rate': 1.4933124224599897e-05, 'epoch': 0.71} {'loss': 0.6488, 'learning_rate': 1.493283197091322e-05, 'epoch': 0.71} {'loss': 0.6032, 'learning_rate': 1.4932539711658315e-05, 'epoch': 0.71} {'loss': 0.5923, 'learning_rate': 1.4932247446835512e-05, 'epoch': 0.71} {'loss': 0.5126, 'learning_rate': 1.493195517644514e-05, 'epoch': 0.71} {'loss': 0.6134, 'learning_rate': 1.4931662900487527e-05, 'epoch': 0.71} {'loss': 0.6339, 'learning_rate': 1.4931370618963006e-05, 'epoch': 0.71} {'loss': 0.6748, 'learning_rate': 1.4931078331871901e-05, 'epoch': 0.71} {'loss': 0.6122, 'learning_rate': 1.493078603921455e-05, 'epoch': 0.71} {'loss': 0.5047, 'learning_rate': 1.493049374099128e-05, 'epoch': 0.71} {'loss': 0.5732, 'learning_rate': 1.4930201437202416e-05, 'epoch': 0.71} {'loss': 0.4759, 'learning_rate': 1.4929909127848294e-05, 'epoch': 0.71} {'loss': 0.4734, 'learning_rate': 1.4929616812929245e-05, 'epoch': 0.71} {'loss': 0.608, 'learning_rate': 1.492932449244559e-05, 'epoch': 0.71} {'loss': 0.565, 'learning_rate': 1.492903216639767e-05, 'epoch': 0.71} {'loss': 0.532, 'learning_rate': 1.4928739834785808e-05, 'epoch': 0.71} {'loss': 0.6812, 'learning_rate': 1.4928447497610336e-05, 'epoch': 0.71} {'loss': 0.5119, 'learning_rate': 1.4928155154871586e-05, 'epoch': 0.71} {'loss': 0.6726, 'learning_rate': 1.4927862806569886e-05, 'epoch': 0.71} {'loss': 0.5839, 'learning_rate': 1.4927570452705565e-05, 'epoch': 0.71} {'loss': 0.5841, 'learning_rate': 1.4927278093278951e-05, 'epoch': 0.71} {'loss': 0.5591, 'learning_rate': 1.492698572829038e-05, 'epoch': 0.71} {'loss': 0.6146, 'learning_rate': 1.4926693357740179e-05, 'epoch': 0.71} {'loss': 0.8122, 'learning_rate': 1.4926400981628676e-05, 'epoch': 0.71} {'loss': 0.5088, 'learning_rate': 1.4926108599956206e-05, 'epoch': 0.71} {'loss': 0.7358, 'learning_rate': 1.4925816212723094e-05, 'epoch': 0.71} {'loss': 0.596, 'learning_rate': 1.4925523819929673e-05, 'epoch': 0.71} {'loss': 0.5167, 'learning_rate': 1.4925231421576272e-05, 'epoch': 0.71} {'loss': 0.4461, 'learning_rate': 1.492493901766322e-05, 'epoch': 0.71} {'loss': 0.6018, 'learning_rate': 1.4924646608190849e-05, 'epoch': 0.71} {'loss': 0.705, 'learning_rate': 1.4924354193159492e-05, 'epoch': 0.71} {'loss': 0.5417, 'learning_rate': 1.4924061772569474e-05, 'epoch': 0.71} {'loss': 0.7315, 'learning_rate': 1.4923769346421125e-05, 'epoch': 0.71} {'loss': 0.5638, 'learning_rate': 1.4923476914714776e-05, 'epoch': 0.71} {'loss': 0.6949, 'learning_rate': 1.4923184477450759e-05, 'epoch': 0.71} {'loss': 0.5809, 'learning_rate': 1.4922892034629404e-05, 'epoch': 0.71} {'loss': 0.565, 'learning_rate': 1.4922599586251036e-05, 'epoch': 0.71} {'loss': 0.4802, 'learning_rate': 1.4922307132315994e-05, 'epoch': 0.71} {'loss': 0.5207, 'learning_rate': 1.4922014672824601e-05, 'epoch': 0.71} {'loss': 0.5467, 'learning_rate': 1.4921722207777189e-05, 'epoch': 0.71} {'loss': 0.5919, 'learning_rate': 1.4921429737174089e-05, 'epoch': 0.71} {'loss': 0.6918, 'learning_rate': 1.492113726101563e-05, 'epoch': 0.71} {'loss': 0.5739, 'learning_rate': 1.4920844779302145e-05, 'epoch': 0.71} {'loss': 0.6313, 'learning_rate': 1.492055229203396e-05, 'epoch': 0.71} {'loss': 0.5541, 'learning_rate': 1.4920259799211408e-05, 'epoch': 0.71} {'loss': 0.5326, 'learning_rate': 1.4919967300834816e-05, 'epoch': 0.71} {'loss': 0.5962, 'learning_rate': 1.491967479690452e-05, 'epoch': 0.71} {'loss': 0.6579, 'learning_rate': 1.4919382287420845e-05, 'epoch': 0.71} {'loss': 0.6122, 'learning_rate': 1.491908977238412e-05, 'epoch': 0.71} {'loss': 0.6281, 'learning_rate': 1.4918797251794683e-05, 'epoch': 0.71} {'loss': 0.5021, 'learning_rate': 1.4918504725652859e-05, 'epoch': 0.71} {'loss': 0.478, 'learning_rate': 1.4918212193958975e-05, 'epoch': 0.71} {'loss': 0.4656, 'learning_rate': 1.4917919656713367e-05, 'epoch': 0.71} {'loss': 0.5762, 'learning_rate': 1.4917627113916361e-05, 'epoch': 0.71} {'loss': 0.4362, 'learning_rate': 1.4917334565568293e-05, 'epoch': 0.71} {'loss': 0.4306, 'learning_rate': 1.4917042011669488e-05, 'epoch': 0.71} {'loss': 0.7162, 'learning_rate': 1.4916749452220275e-05, 'epoch': 0.71} {'loss': 0.6357, 'learning_rate': 1.491645688722099e-05, 'epoch': 0.71} {'loss': 0.6804, 'learning_rate': 1.4916164316671957e-05, 'epoch': 0.71} {'loss': 0.5842, 'learning_rate': 1.4915871740573511e-05, 'epoch': 0.71} {'loss': 0.6154, 'learning_rate': 1.491557915892598e-05, 'epoch': 0.71} {'loss': 0.5981, 'learning_rate': 1.4915286571729695e-05, 'epoch': 0.71} {'loss': 0.694, 'learning_rate': 1.4914993978984986e-05, 'epoch': 0.71} {'loss': 0.4815, 'learning_rate': 1.4914701380692184e-05, 'epoch': 0.71} {'loss': 0.5593, 'learning_rate': 1.4914408776851618e-05, 'epoch': 0.71} {'loss': 0.7157, 'learning_rate': 1.491411616746362e-05, 'epoch': 0.71} {'loss': 0.6733, 'learning_rate': 1.491382355252852e-05, 'epoch': 0.71} {'loss': 0.5299, 'learning_rate': 1.4913530932046647e-05, 'epoch': 0.71} {'loss': 0.5689, 'learning_rate': 1.4913238306018332e-05, 'epoch': 0.71} {'loss': 0.593, 'learning_rate': 1.4912945674443903e-05, 'epoch': 0.71} {'loss': 0.6489, 'learning_rate': 1.4912653037323694e-05, 'epoch': 0.71} {'loss': 0.4953, 'learning_rate': 1.4912360394658034e-05, 'epoch': 0.71} {'loss': 0.5647, 'learning_rate': 1.4912067746447253e-05, 'epoch': 0.71} {'loss': 0.7076, 'learning_rate': 1.4911775092691683e-05, 'epoch': 0.71} {'loss': 0.6542, 'learning_rate': 1.4911482433391652e-05, 'epoch': 0.71} {'loss': 0.6405, 'learning_rate': 1.491118976854749e-05, 'epoch': 0.71} {'loss': 0.4775, 'learning_rate': 1.491089709815953e-05, 'epoch': 0.71} {'loss': 0.6219, 'learning_rate': 1.4910604422228101e-05, 'epoch': 0.71} {'loss': 0.6825, 'learning_rate': 1.4910311740753533e-05, 'epoch': 0.71} {'loss': 0.595, 'learning_rate': 1.4910019053736156e-05, 'epoch': 0.71} {'loss': 0.6565, 'learning_rate': 1.4909726361176304e-05, 'epoch': 0.71} {'loss': 0.6455, 'learning_rate': 1.4909433663074305e-05, 'epoch': 0.71} {'loss': 0.579, 'learning_rate': 1.4909140959430484e-05, 'epoch': 0.71} {'loss': 0.5726, 'learning_rate': 1.4908848250245181e-05, 'epoch': 0.71} {'loss': 0.3498, 'learning_rate': 1.4908555535518719e-05, 'epoch': 0.71} {'loss': 0.5341, 'learning_rate': 1.4908262815251431e-05, 'epoch': 0.71} {'loss': 0.5772, 'learning_rate': 1.4907970089443648e-05, 'epoch': 0.71} {'loss': 0.4639, 'learning_rate': 1.4907677358095703e-05, 'epoch': 0.71} {'loss': 0.5634, 'learning_rate': 1.490738462120792e-05, 'epoch': 0.71} {'loss': 0.5404, 'learning_rate': 1.4907091878780634e-05, 'epoch': 0.71} {'loss': 0.4794, 'learning_rate': 1.4906799130814174e-05, 'epoch': 0.71} {'loss': 0.4584, 'learning_rate': 1.4906506377308871e-05, 'epoch': 0.71} {'loss': 0.522, 'learning_rate': 1.4906213618265058e-05, 'epoch': 0.71} {'loss': 0.5577, 'learning_rate': 1.4905920853683063e-05, 'epoch': 0.71} {'loss': 0.6729, 'learning_rate': 1.490562808356321e-05, 'epoch': 0.71} {'loss': 0.6195, 'learning_rate': 1.490533530790584e-05, 'epoch': 0.71} {'loss': 0.5463, 'learning_rate': 1.4905042526711277e-05, 'epoch': 0.71} {'loss': 0.6139, 'learning_rate': 1.4904749739979855e-05, 'epoch': 0.71} {'loss': 0.5932, 'learning_rate': 1.4904456947711906e-05, 'epoch': 0.71} {'loss': 0.5096, 'learning_rate': 1.4904164149907754e-05, 'epoch': 0.71} {'loss': 0.5676, 'learning_rate': 1.4903871346567735e-05, 'epoch': 0.71} {'loss': 0.6018, 'learning_rate': 1.4903578537692179e-05, 'epoch': 0.71} {'loss': 0.6117, 'learning_rate': 1.4903285723281412e-05, 'epoch': 0.71} {'loss': 0.5646, 'learning_rate': 1.4902992903335769e-05, 'epoch': 0.72} {'loss': 0.6347, 'learning_rate': 1.4902700077855583e-05, 'epoch': 0.72} {'loss': 0.4753, 'learning_rate': 1.4902407246841177e-05, 'epoch': 0.72} {'loss': 0.4944, 'learning_rate': 1.4902114410292887e-05, 'epoch': 0.72} {'loss': 0.6077, 'learning_rate': 1.490182156821104e-05, 'epoch': 0.72} {'loss': 0.6111, 'learning_rate': 1.490152872059597e-05, 'epoch': 0.72} {'loss': 0.5421, 'learning_rate': 1.4901235867448005e-05, 'epoch': 0.72} {'loss': 0.5012, 'learning_rate': 1.490094300876748e-05, 'epoch': 0.72} {'loss': 0.4425, 'learning_rate': 1.4900650144554718e-05, 'epoch': 0.72} {'loss': 0.5228, 'learning_rate': 1.4900357274810056e-05, 'epoch': 0.72} {'loss': 0.6443, 'learning_rate': 1.4900064399533823e-05, 'epoch': 0.72} {'loss': 0.6509, 'learning_rate': 1.4899771518726346e-05, 'epoch': 0.72} {'loss': 0.7377, 'learning_rate': 1.4899478632387965e-05, 'epoch': 0.72} {'loss': 0.6329, 'learning_rate': 1.4899185740518998e-05, 'epoch': 0.72} {'loss': 0.6669, 'learning_rate': 1.4898892843119788e-05, 'epoch': 0.72} {'loss': 0.6535, 'learning_rate': 1.4898599940190655e-05, 'epoch': 0.72} {'loss': 0.523, 'learning_rate': 1.4898307031731936e-05, 'epoch': 0.72} {'loss': 0.5832, 'learning_rate': 1.4898014117743958e-05, 'epoch': 0.72} {'loss': 0.54, 'learning_rate': 1.4897721198227055e-05, 'epoch': 0.72} {'loss': 0.6228, 'learning_rate': 1.4897428273181555e-05, 'epoch': 0.72} {'loss': 0.4369, 'learning_rate': 1.4897135342607789e-05, 'epoch': 0.72} {'loss': 0.5719, 'learning_rate': 1.489684240650609e-05, 'epoch': 0.72} {'loss': 0.6434, 'learning_rate': 1.4896549464876789e-05, 'epoch': 0.72} {'loss': 0.656, 'learning_rate': 1.4896256517720211e-05, 'epoch': 0.72} {'loss': 0.6923, 'learning_rate': 1.489596356503669e-05, 'epoch': 0.72} {'loss': 0.6281, 'learning_rate': 1.489567060682656e-05, 'epoch': 0.72} {'loss': 0.4523, 'learning_rate': 1.4895377643090148e-05, 'epoch': 0.72} {'loss': 0.5913, 'learning_rate': 1.4895084673827788e-05, 'epoch': 0.72} {'loss': 0.7295, 'learning_rate': 1.4894791699039805e-05, 'epoch': 0.72} {'loss': 0.5043, 'learning_rate': 1.4894498718726533e-05, 'epoch': 0.72} {'loss': 0.7291, 'learning_rate': 1.4894205732888304e-05, 'epoch': 0.72} {'loss': 0.635, 'learning_rate': 1.4893912741525447e-05, 'epoch': 0.72} {'loss': 0.7892, 'learning_rate': 1.4893619744638295e-05, 'epoch': 0.72} {'loss': 0.5731, 'learning_rate': 1.4893326742227175e-05, 'epoch': 0.72} {'loss': 0.5585, 'learning_rate': 1.4893033734292416e-05, 'epoch': 0.72} {'loss': 0.4995, 'learning_rate': 1.4892740720834357e-05, 'epoch': 0.72} {'loss': 0.5367, 'learning_rate': 1.4892447701853323e-05, 'epoch': 0.72} {'loss': 0.4455, 'learning_rate': 1.4892154677349646e-05, 'epoch': 0.72} {'loss': 0.6571, 'learning_rate': 1.4891861647323658e-05, 'epoch': 0.72} {'loss': 0.5538, 'learning_rate': 1.4891568611775684e-05, 'epoch': 0.72} {'loss': 0.7255, 'learning_rate': 1.4891275570706062e-05, 'epoch': 0.72} {'loss': 0.6303, 'learning_rate': 1.489098252411512e-05, 'epoch': 0.72} {'loss': 0.4737, 'learning_rate': 1.489068947200319e-05, 'epoch': 0.72} {'loss': 0.6272, 'learning_rate': 1.4890396414370601e-05, 'epoch': 0.72} {'loss': 0.4834, 'learning_rate': 1.4890103351217685e-05, 'epoch': 0.72} {'loss': 0.5401, 'learning_rate': 1.488981028254477e-05, 'epoch': 0.72} {'loss': 0.5888, 'learning_rate': 1.4889517208352189e-05, 'epoch': 0.72} {'loss': 0.677, 'learning_rate': 1.4889224128640276e-05, 'epoch': 0.72} {'loss': 0.634, 'learning_rate': 1.4888931043409357e-05, 'epoch': 0.72} {'loss': 0.6612, 'learning_rate': 1.4888637952659761e-05, 'epoch': 0.72} {'loss': 0.504, 'learning_rate': 1.488834485639183e-05, 'epoch': 0.72} {'loss': 0.6546, 'learning_rate': 1.4888051754605881e-05, 'epoch': 0.72} {'loss': 0.5835, 'learning_rate': 1.4887758647302253e-05, 'epoch': 0.72} {'loss': 0.424, 'learning_rate': 1.4887465534481276e-05, 'epoch': 0.72} {'loss': 0.6841, 'learning_rate': 1.488717241614328e-05, 'epoch': 0.72} {'loss': 0.6283, 'learning_rate': 1.4886879292288592e-05, 'epoch': 0.72} {'loss': 0.5015, 'learning_rate': 1.4886586162917549e-05, 'epoch': 0.72} {'loss': 0.558, 'learning_rate': 1.4886293028030478e-05, 'epoch': 0.72} {'loss': 0.6418, 'learning_rate': 1.4885999887627713e-05, 'epoch': 0.72} {'loss': 0.4305, 'learning_rate': 1.4885706741709584e-05, 'epoch': 0.72} {'loss': 0.566, 'learning_rate': 1.4885413590276421e-05, 'epoch': 0.72} {'loss': 0.5865, 'learning_rate': 1.4885120433328553e-05, 'epoch': 0.72} {'loss': 0.6165, 'learning_rate': 1.4884827270866312e-05, 'epoch': 0.72} {'loss': 0.6012, 'learning_rate': 1.4884534102890033e-05, 'epoch': 0.72} {'loss': 0.511, 'learning_rate': 1.4884240929400044e-05, 'epoch': 0.72} {'loss': 0.5127, 'learning_rate': 1.4883947750396676e-05, 'epoch': 0.72} {'loss': 0.5981, 'learning_rate': 1.488365456588026e-05, 'epoch': 0.72} {'loss': 0.6048, 'learning_rate': 1.4883361375851121e-05, 'epoch': 0.72} {'loss': 0.487, 'learning_rate': 1.4883068180309602e-05, 'epoch': 0.72} {'loss': 0.4688, 'learning_rate': 1.4882774979256025e-05, 'epoch': 0.72} {'loss': 0.5888, 'learning_rate': 1.4882481772690724e-05, 'epoch': 0.72} {'loss': 0.6647, 'learning_rate': 1.4882188560614028e-05, 'epoch': 0.72} {'loss': 0.7475, 'learning_rate': 1.4881895343026272e-05, 'epoch': 0.72} {'loss': 0.6191, 'learning_rate': 1.4881602119927782e-05, 'epoch': 0.72} {'loss': 0.3975, 'learning_rate': 1.4881308891318894e-05, 'epoch': 0.72} {'loss': 0.6812, 'learning_rate': 1.4881015657199936e-05, 'epoch': 0.72} {'loss': 0.516, 'learning_rate': 1.4880722417571236e-05, 'epoch': 0.72} {'loss': 0.4853, 'learning_rate': 1.4880429172433135e-05, 'epoch': 0.72} {'loss': 0.6611, 'learning_rate': 1.4880135921785952e-05, 'epoch': 0.72} {'loss': 0.5707, 'learning_rate': 1.4879842665630026e-05, 'epoch': 0.72} {'loss': 0.6898, 'learning_rate': 1.4879549403965685e-05, 'epoch': 0.72} {'loss': 0.532, 'learning_rate': 1.4879256136793261e-05, 'epoch': 0.72} {'loss': 0.5162, 'learning_rate': 1.4878962864113082e-05, 'epoch': 0.72} {'loss': 0.5236, 'learning_rate': 1.4878669585925486e-05, 'epoch': 0.72} {'loss': 0.6841, 'learning_rate': 1.4878376302230797e-05, 'epoch': 0.72} {'loss': 0.6025, 'learning_rate': 1.487808301302935e-05, 'epoch': 0.72} {'loss': 0.6779, 'learning_rate': 1.4877789718321473e-05, 'epoch': 0.72} {'loss': 0.4893, 'learning_rate': 1.48774964181075e-05, 'epoch': 0.72} {'loss': 0.5189, 'learning_rate': 1.487720311238776e-05, 'epoch': 0.72} {'loss': 0.4778, 'learning_rate': 1.4876909801162589e-05, 'epoch': 0.72} {'loss': 0.6872, 'learning_rate': 1.4876616484432311e-05, 'epoch': 0.72} {'loss': 0.4808, 'learning_rate': 1.4876323162197261e-05, 'epoch': 0.72} {'loss': 0.6086, 'learning_rate': 1.4876029834457768e-05, 'epoch': 0.72} {'loss': 0.5947, 'learning_rate': 1.4875736501214166e-05, 'epoch': 0.72} {'loss': 0.5613, 'learning_rate': 1.4875443162466785e-05, 'epoch': 0.72} {'loss': 0.709, 'learning_rate': 1.4875149818215956e-05, 'epoch': 0.72} {'loss': 0.5473, 'learning_rate': 1.4874856468462009e-05, 'epoch': 0.72} {'loss': 0.6383, 'learning_rate': 1.4874563113205276e-05, 'epoch': 0.72} {'loss': 0.6103, 'learning_rate': 1.4874269752446089e-05, 'epoch': 0.72} {'loss': 0.5759, 'learning_rate': 1.4873976386184778e-05, 'epoch': 0.72} {'loss': 0.5447, 'learning_rate': 1.4873683014421676e-05, 'epoch': 0.72} {'loss': 0.5729, 'learning_rate': 1.4873389637157111e-05, 'epoch': 0.72} {'loss': 0.5177, 'learning_rate': 1.4873096254391415e-05, 'epoch': 0.72} {'loss': 0.4873, 'learning_rate': 1.4872802866124922e-05, 'epoch': 0.72} {'loss': 0.5642, 'learning_rate': 1.4872509472357959e-05, 'epoch': 0.72} {'loss': 0.5325, 'learning_rate': 1.4872216073090861e-05, 'epoch': 0.72} {'loss': 0.5623, 'learning_rate': 1.4871922668323957e-05, 'epoch': 0.72} {'loss': 0.2818, 'learning_rate': 1.4871629258057579e-05, 'epoch': 0.72} {'loss': 0.5205, 'learning_rate': 1.4871335842292057e-05, 'epoch': 0.72} {'loss': 0.6305, 'learning_rate': 1.4871042421027723e-05, 'epoch': 0.72} {'loss': 0.6823, 'learning_rate': 1.487074899426491e-05, 'epoch': 0.72} {'loss': 0.5931, 'learning_rate': 1.4870455562003944e-05, 'epoch': 0.72} {'loss': 0.5436, 'learning_rate': 1.4870162124245164e-05, 'epoch': 0.72} {'loss': 0.6642, 'learning_rate': 1.4869868680988898e-05, 'epoch': 0.72} {'loss': 0.5745, 'learning_rate': 1.4869575232235474e-05, 'epoch': 0.72} {'loss': 0.4654, 'learning_rate': 1.4869281777985225e-05, 'epoch': 0.72} {'loss': 0.5605, 'learning_rate': 1.4868988318238483e-05, 'epoch': 0.72} {'loss': 0.5771, 'learning_rate': 1.486869485299558e-05, 'epoch': 0.72} {'loss': 0.5998, 'learning_rate': 1.4868401382256846e-05, 'epoch': 0.72} {'loss': 0.6204, 'learning_rate': 1.486810790602261e-05, 'epoch': 0.72} {'loss': 0.5049, 'learning_rate': 1.486781442429321e-05, 'epoch': 0.72} {'loss': 0.5807, 'learning_rate': 1.4867520937068971e-05, 'epoch': 0.72} {'loss': 0.6549, 'learning_rate': 1.4867227444350226e-05, 'epoch': 0.72} {'loss': 0.5281, 'learning_rate': 1.4866933946137308e-05, 'epoch': 0.72} {'loss': 0.4616, 'learning_rate': 1.4866640442430547e-05, 'epoch': 0.72} {'loss': 0.5468, 'learning_rate': 1.4866346933230274e-05, 'epoch': 0.72} {'loss': 0.6282, 'learning_rate': 1.4866053418536822e-05, 'epoch': 0.72} {'loss': 0.5604, 'learning_rate': 1.486575989835052e-05, 'epoch': 0.72} {'loss': 0.6128, 'learning_rate': 1.48654663726717e-05, 'epoch': 0.72} {'loss': 0.6924, 'learning_rate': 1.4865172841500695e-05, 'epoch': 0.72} {'loss': 0.6614, 'learning_rate': 1.4864879304837832e-05, 'epoch': 0.72} {'loss': 0.5465, 'learning_rate': 1.4864585762683449e-05, 'epoch': 0.72} {'loss': 0.5547, 'learning_rate': 1.486429221503787e-05, 'epoch': 0.72} {'loss': 0.7072, 'learning_rate': 1.4863998661901432e-05, 'epoch': 0.72} {'loss': 0.4754, 'learning_rate': 1.4863705103274463e-05, 'epoch': 0.72} {'loss': 0.5688, 'learning_rate': 1.4863411539157297e-05, 'epoch': 0.72} {'loss': 0.6914, 'learning_rate': 1.4863117969550264e-05, 'epoch': 0.72} {'loss': 0.5963, 'learning_rate': 1.4862824394453696e-05, 'epoch': 0.72} {'loss': 0.8354, 'learning_rate': 1.4862530813867925e-05, 'epoch': 0.72} {'loss': 0.6434, 'learning_rate': 1.486223722779328e-05, 'epoch': 0.72} {'loss': 0.4891, 'learning_rate': 1.4861943636230094e-05, 'epoch': 0.72} {'loss': 0.6886, 'learning_rate': 1.48616500391787e-05, 'epoch': 0.72} {'loss': 0.6461, 'learning_rate': 1.4861356436639424e-05, 'epoch': 0.72} {'loss': 0.6114, 'learning_rate': 1.4861062828612603e-05, 'epoch': 0.72} {'loss': 0.6179, 'learning_rate': 1.4860769215098567e-05, 'epoch': 0.72} {'loss': 0.5606, 'learning_rate': 1.4860475596097645e-05, 'epoch': 0.72} {'loss': 0.5701, 'learning_rate': 1.486018197161017e-05, 'epoch': 0.72} {'loss': 0.5571, 'learning_rate': 1.4859888341636477e-05, 'epoch': 0.72} {'loss': 0.5723, 'learning_rate': 1.4859594706176892e-05, 'epoch': 0.72} {'loss': 0.5967, 'learning_rate': 1.4859301065231748e-05, 'epoch': 0.72} {'loss': 0.6335, 'learning_rate': 1.485900741880138e-05, 'epoch': 0.72} {'loss': 0.6258, 'learning_rate': 1.4858713766886115e-05, 'epoch': 0.72} {'loss': 0.6037, 'learning_rate': 1.4858420109486287e-05, 'epoch': 0.72} {'loss': 0.6434, 'learning_rate': 1.4858126446602225e-05, 'epoch': 0.72} {'loss': 0.681, 'learning_rate': 1.4857832778234263e-05, 'epoch': 0.72} {'loss': 0.4932, 'learning_rate': 1.485753910438273e-05, 'epoch': 0.72} {'loss': 0.5773, 'learning_rate': 1.4857245425047962e-05, 'epoch': 0.72} {'loss': 0.6365, 'learning_rate': 1.4856951740230283e-05, 'epoch': 0.72} {'loss': 0.677, 'learning_rate': 1.4856658049930032e-05, 'epoch': 0.72} {'loss': 0.5879, 'learning_rate': 1.4856364354147539e-05, 'epoch': 0.72} {'loss': 0.5856, 'learning_rate': 1.4856070652883132e-05, 'epoch': 0.72} {'loss': 0.5251, 'learning_rate': 1.4855776946137144e-05, 'epoch': 0.72} {'loss': 0.6045, 'learning_rate': 1.4855483233909909e-05, 'epoch': 0.72} {'loss': 0.6291, 'learning_rate': 1.4855189516201757e-05, 'epoch': 0.72} {'loss': 0.5025, 'learning_rate': 1.485489579301302e-05, 'epoch': 0.72} {'loss': 0.6, 'learning_rate': 1.4854602064344027e-05, 'epoch': 0.72} {'loss': 0.6448, 'learning_rate': 1.4854308330195111e-05, 'epoch': 0.72} {'loss': 0.6308, 'learning_rate': 1.4854014590566606e-05, 'epoch': 0.72} {'loss': 0.4499, 'learning_rate': 1.485372084545884e-05, 'epoch': 0.72} {'loss': 0.4261, 'learning_rate': 1.4853427094872145e-05, 'epoch': 0.72} {'loss': 0.745, 'learning_rate': 1.4853133338806855e-05, 'epoch': 0.72} {'loss': 0.512, 'learning_rate': 1.48528395772633e-05, 'epoch': 0.72} {'loss': 0.6401, 'learning_rate': 1.4852545810241812e-05, 'epoch': 0.72} {'loss': 0.4931, 'learning_rate': 1.4852252037742725e-05, 'epoch': 0.72} {'loss': 0.6647, 'learning_rate': 1.4851958259766366e-05, 'epoch': 0.72} {'loss': 0.5726, 'learning_rate': 1.4851664476313068e-05, 'epoch': 0.72} {'loss': 0.6839, 'learning_rate': 1.4851370687383164e-05, 'epoch': 0.72} {'loss': 0.5448, 'learning_rate': 1.4851076892976989e-05, 'epoch': 0.72} {'loss': 0.5254, 'learning_rate': 1.4850783093094864e-05, 'epoch': 0.72} {'loss': 0.5951, 'learning_rate': 1.485048928773713e-05, 'epoch': 0.72} {'loss': 0.6237, 'learning_rate': 1.4850195476904117e-05, 'epoch': 0.72} {'loss': 0.3963, 'learning_rate': 1.4849901660596153e-05, 'epoch': 0.72} {'loss': 0.512, 'learning_rate': 1.4849607838813575e-05, 'epoch': 0.72} {'loss': 0.5279, 'learning_rate': 1.4849314011556711e-05, 'epoch': 0.72} {'loss': 0.6442, 'learning_rate': 1.4849020178825893e-05, 'epoch': 0.72} {'loss': 0.6681, 'learning_rate': 1.4848726340621454e-05, 'epoch': 0.72} {'loss': 0.4915, 'learning_rate': 1.4848432496943726e-05, 'epoch': 0.72} {'loss': 0.5369, 'learning_rate': 1.4848138647793037e-05, 'epoch': 0.72} {'loss': 0.525, 'learning_rate': 1.4847844793169723e-05, 'epoch': 0.72} {'loss': 0.5366, 'learning_rate': 1.4847550933074115e-05, 'epoch': 0.72} {'loss': 0.552, 'learning_rate': 1.4847257067506542e-05, 'epoch': 0.72} {'loss': 0.6321, 'learning_rate': 1.484696319646734e-05, 'epoch': 0.72} {'loss': 0.6234, 'learning_rate': 1.4846669319956835e-05, 'epoch': 0.72} {'loss': 0.3484, 'learning_rate': 1.4846375437975362e-05, 'epoch': 0.72} {'loss': 0.5407, 'learning_rate': 1.4846081550523255e-05, 'epoch': 0.72} {'loss': 0.5284, 'learning_rate': 1.4845787657600843e-05, 'epoch': 0.72} {'loss': 0.5603, 'learning_rate': 1.4845493759208458e-05, 'epoch': 0.72} {'loss': 0.5125, 'learning_rate': 1.484519985534643e-05, 'epoch': 0.72} {'loss': 0.6479, 'learning_rate': 1.4844905946015096e-05, 'epoch': 0.72} {'loss': 0.6415, 'learning_rate': 1.4844612031214785e-05, 'epoch': 0.72} {'loss': 0.5653, 'learning_rate': 1.4844318110945826e-05, 'epoch': 0.72} {'loss': 0.572, 'learning_rate': 1.4844024185208554e-05, 'epoch': 0.72} {'loss': 0.7588, 'learning_rate': 1.4843730254003299e-05, 'epoch': 0.72} {'loss': 0.6457, 'learning_rate': 1.4843436317330393e-05, 'epoch': 0.72} {'loss': 0.6311, 'learning_rate': 1.484314237519017e-05, 'epoch': 0.72} {'loss': 0.5841, 'learning_rate': 1.484284842758296e-05, 'epoch': 0.72} {'loss': 0.5642, 'learning_rate': 1.4842554474509094e-05, 'epoch': 0.72} {'loss': 0.5447, 'learning_rate': 1.4842260515968904e-05, 'epoch': 0.72} {'loss': 0.6419, 'learning_rate': 1.4841966551962725e-05, 'epoch': 0.72} {'loss': 0.4946, 'learning_rate': 1.4841672582490887e-05, 'epoch': 0.72} {'loss': 0.6144, 'learning_rate': 1.4841378607553719e-05, 'epoch': 0.72} {'loss': 0.5982, 'learning_rate': 1.4841084627151557e-05, 'epoch': 0.72} {'loss': 0.6093, 'learning_rate': 1.4840790641284727e-05, 'epoch': 0.72} {'loss': 0.6487, 'learning_rate': 1.4840496649953572e-05, 'epoch': 0.72} {'loss': 0.5975, 'learning_rate': 1.4840202653158411e-05, 'epoch': 0.72} {'loss': 0.5664, 'learning_rate': 1.4839908650899584e-05, 'epoch': 0.72} {'loss': 0.7204, 'learning_rate': 1.483961464317742e-05, 'epoch': 0.72} {'loss': 0.5996, 'learning_rate': 1.483932062999225e-05, 'epoch': 0.72} {'loss': 0.4961, 'learning_rate': 1.483902661134441e-05, 'epoch': 0.72} {'loss': 0.4827, 'learning_rate': 1.4838732587234229e-05, 'epoch': 0.72} {'loss': 0.7446, 'learning_rate': 1.4838438557662036e-05, 'epoch': 0.72} {'loss': 0.5643, 'learning_rate': 1.4838144522628168e-05, 'epoch': 0.72} {'loss': 0.5789, 'learning_rate': 1.4837850482132953e-05, 'epoch': 0.72} {'loss': 0.6055, 'learning_rate': 1.4837556436176726e-05, 'epoch': 0.72} {'loss': 0.5197, 'learning_rate': 1.483726238475982e-05, 'epoch': 0.72} {'loss': 0.6661, 'learning_rate': 1.4836968327882562e-05, 'epoch': 0.72} {'loss': 0.5445, 'learning_rate': 1.4836674265545288e-05, 'epoch': 0.72} {'loss': 0.6298, 'learning_rate': 1.4836380197748328e-05, 'epoch': 0.72} {'loss': 0.5163, 'learning_rate': 1.4836086124492014e-05, 'epoch': 0.72} {'loss': 0.5574, 'learning_rate': 1.4835792045776679e-05, 'epoch': 0.72} {'loss': 0.5973, 'learning_rate': 1.4835497961602651e-05, 'epoch': 0.72} {'loss': 0.6865, 'learning_rate': 1.483520387197027e-05, 'epoch': 0.72} {'loss': 0.502, 'learning_rate': 1.483490977687986e-05, 'epoch': 0.72} {'loss': 0.4222, 'learning_rate': 1.4834615676331759e-05, 'epoch': 0.72} {'loss': 0.4392, 'learning_rate': 1.4834321570326293e-05, 'epoch': 0.72} {'loss': 0.657, 'learning_rate': 1.48340274588638e-05, 'epoch': 0.72} {'loss': 0.612, 'learning_rate': 1.4833733341944607e-05, 'epoch': 0.72} {'loss': 0.5766, 'learning_rate': 1.483343921956905e-05, 'epoch': 0.72} {'loss': 0.5128, 'learning_rate': 1.483314509173746e-05, 'epoch': 0.72} {'loss': 0.5245, 'learning_rate': 1.4832850958450165e-05, 'epoch': 0.72} {'loss': 0.5792, 'learning_rate': 1.4832556819707504e-05, 'epoch': 0.72} {'loss': 0.688, 'learning_rate': 1.4832262675509803e-05, 'epoch': 0.72} {'loss': 0.6307, 'learning_rate': 1.4831968525857397e-05, 'epoch': 0.72} {'loss': 0.6199, 'learning_rate': 1.4831674370750617e-05, 'epoch': 0.72} {'loss': 0.5249, 'learning_rate': 1.4831380210189795e-05, 'epoch': 0.72} {'loss': 0.3869, 'learning_rate': 1.4831086044175265e-05, 'epoch': 0.72} {'loss': 0.6283, 'learning_rate': 1.4830791872707355e-05, 'epoch': 0.72} {'loss': 0.5593, 'learning_rate': 1.4830497695786404e-05, 'epoch': 0.72} {'loss': 0.4674, 'learning_rate': 1.4830203513412735e-05, 'epoch': 0.72} {'loss': 0.5818, 'learning_rate': 1.4829909325586688e-05, 'epoch': 0.72} {'loss': 0.6334, 'learning_rate': 1.4829615132308592e-05, 'epoch': 0.72} {'loss': 0.6236, 'learning_rate': 1.4829320933578778e-05, 'epoch': 0.72} {'loss': 0.5528, 'learning_rate': 1.4829026729397578e-05, 'epoch': 0.72} {'loss': 0.4569, 'learning_rate': 1.4828732519765324e-05, 'epoch': 0.72} {'loss': 0.5001, 'learning_rate': 1.4828438304682351e-05, 'epoch': 0.72} {'loss': 0.4968, 'learning_rate': 1.482814408414899e-05, 'epoch': 0.72} {'loss': 0.4931, 'learning_rate': 1.482784985816557e-05, 'epoch': 0.72} {'loss': 0.5585, 'learning_rate': 1.4827555626732428e-05, 'epoch': 0.72} {'loss': 0.4304, 'learning_rate': 1.4827261389849892e-05, 'epoch': 0.72} {'loss': 0.3274, 'learning_rate': 1.4826967147518296e-05, 'epoch': 0.72} {'loss': 0.5902, 'learning_rate': 1.4826672899737973e-05, 'epoch': 0.72} {'loss': 0.4899, 'learning_rate': 1.4826378646509255e-05, 'epoch': 0.72} {'loss': 0.5648, 'learning_rate': 1.4826084387832473e-05, 'epoch': 0.72} {'loss': 0.5303, 'learning_rate': 1.482579012370796e-05, 'epoch': 0.72} {'loss': 0.5395, 'learning_rate': 1.4825495854136046e-05, 'epoch': 0.72} {'loss': 0.5456, 'learning_rate': 1.4825201579117064e-05, 'epoch': 0.72} {'loss': 0.5112, 'learning_rate': 1.4824907298651347e-05, 'epoch': 0.72} {'loss': 0.4739, 'learning_rate': 1.4824613012739229e-05, 'epoch': 0.72} {'loss': 0.6299, 'learning_rate': 1.4824318721381036e-05, 'epoch': 0.72} {'loss': 0.5447, 'learning_rate': 1.4824024424577111e-05, 'epoch': 0.72} {'loss': 0.6408, 'learning_rate': 1.4823730122327775e-05, 'epoch': 0.72} {'loss': 0.5911, 'learning_rate': 1.4823435814633366e-05, 'epoch': 0.72} {'loss': 0.5401, 'learning_rate': 1.4823141501494216e-05, 'epoch': 0.72} {'loss': 0.4927, 'learning_rate': 1.4822847182910658e-05, 'epoch': 0.72} {'loss': 0.6296, 'learning_rate': 1.482255285888302e-05, 'epoch': 0.72} {'loss': 0.5439, 'learning_rate': 1.4822258529411637e-05, 'epoch': 0.72} {'loss': 0.6707, 'learning_rate': 1.4821964194496845e-05, 'epoch': 0.72} {'loss': 0.5567, 'learning_rate': 1.4821669854138967e-05, 'epoch': 0.72} {'loss': 0.6749, 'learning_rate': 1.4821375508338345e-05, 'epoch': 0.72} {'loss': 0.5268, 'learning_rate': 1.4821081157095303e-05, 'epoch': 0.72} {'loss': 0.5607, 'learning_rate': 1.4820786800410179e-05, 'epoch': 0.72} {'loss': 0.5224, 'learning_rate': 1.4820492438283305e-05, 'epoch': 0.72} {'loss': 0.7951, 'learning_rate': 1.4820198070715008e-05, 'epoch': 0.72} {'loss': 0.5516, 'learning_rate': 1.4819903697705626e-05, 'epoch': 0.72} {'loss': 0.5332, 'learning_rate': 1.481960931925549e-05, 'epoch': 0.72} {'loss': 0.6347, 'learning_rate': 1.481931493536493e-05, 'epoch': 0.72} {'loss': 0.7184, 'learning_rate': 1.4819020546034282e-05, 'epoch': 0.72} {'loss': 0.6695, 'learning_rate': 1.4818726151263874e-05, 'epoch': 0.72} {'loss': 0.7918, 'learning_rate': 1.4818431751054042e-05, 'epoch': 0.72} {'loss': 0.458, 'learning_rate': 1.4818137345405115e-05, 'epoch': 0.72} {'loss': 0.6932, 'learning_rate': 1.4817842934317428e-05, 'epoch': 0.72} {'loss': 0.5459, 'learning_rate': 1.4817548517791313e-05, 'epoch': 0.72} {'loss': 0.5384, 'learning_rate': 1.4817254095827101e-05, 'epoch': 0.72} {'loss': 0.4918, 'learning_rate': 1.4816959668425125e-05, 'epoch': 0.72} {'loss': 0.4877, 'learning_rate': 1.4816665235585718e-05, 'epoch': 0.72} {'loss': 0.49, 'learning_rate': 1.4816370797309214e-05, 'epoch': 0.72} {'loss': 0.5923, 'learning_rate': 1.4816076353595941e-05, 'epoch': 0.72} {'loss': 0.6058, 'learning_rate': 1.4815781904446234e-05, 'epoch': 0.72} {'loss': 0.7666, 'learning_rate': 1.4815487449860423e-05, 'epoch': 0.72} {'loss': 0.5545, 'learning_rate': 1.481519298983885e-05, 'epoch': 0.72} {'loss': 0.5916, 'learning_rate': 1.4814898524381832e-05, 'epoch': 0.72} {'loss': 0.6411, 'learning_rate': 1.4814604053489712e-05, 'epoch': 0.72} {'loss': 0.6948, 'learning_rate': 1.4814309577162817e-05, 'epoch': 0.72} {'loss': 0.6571, 'learning_rate': 1.4814015095401484e-05, 'epoch': 0.72} {'loss': 0.6112, 'learning_rate': 1.4813720608206043e-05, 'epoch': 0.72} {'loss': 0.4736, 'learning_rate': 1.4813426115576828e-05, 'epoch': 0.72} {'loss': 0.6565, 'learning_rate': 1.481313161751417e-05, 'epoch': 0.72} {'loss': 0.6353, 'learning_rate': 1.4812837114018401e-05, 'epoch': 0.72} {'loss': 0.5515, 'learning_rate': 1.4812542605089855e-05, 'epoch': 0.72} {'loss': 0.4429, 'learning_rate': 1.481224809072886e-05, 'epoch': 0.72} {'loss': 0.6676, 'learning_rate': 1.4811953570935756e-05, 'epoch': 0.72} {'loss': 0.6411, 'learning_rate': 1.4811659045710869e-05, 'epoch': 0.72} {'loss': 0.6047, 'learning_rate': 1.4811364515054538e-05, 'epoch': 0.72} {'loss': 0.5982, 'learning_rate': 1.4811069978967087e-05, 'epoch': 0.72} {'loss': 0.5624, 'learning_rate': 1.4810775437448855e-05, 'epoch': 0.72} {'loss': 0.6876, 'learning_rate': 1.4810480890500171e-05, 'epoch': 0.72} {'loss': 0.5487, 'learning_rate': 1.4810186338121369e-05, 'epoch': 0.72} {'loss': 0.4713, 'learning_rate': 1.4809891780312781e-05, 'epoch': 0.72} {'loss': 0.5954, 'learning_rate': 1.4809597217074742e-05, 'epoch': 0.72} {'loss': 0.6536, 'learning_rate': 1.480930264840758e-05, 'epoch': 0.72} {'loss': 0.6275, 'learning_rate': 1.480900807431163e-05, 'epoch': 0.72} {'loss': 0.5961, 'learning_rate': 1.4808713494787225e-05, 'epoch': 0.72} {'loss': 0.6148, 'learning_rate': 1.4808418909834699e-05, 'epoch': 0.72} {'loss': 0.5383, 'learning_rate': 1.480812431945438e-05, 'epoch': 0.72} {'loss': 0.6431, 'learning_rate': 1.4807829723646603e-05, 'epoch': 0.72} {'loss': 0.5671, 'learning_rate': 1.4807535122411703e-05, 'epoch': 0.72} {'loss': 0.5024, 'learning_rate': 1.4807240515750007e-05, 'epoch': 0.72} {'loss': 0.485, 'learning_rate': 1.4806945903661852e-05, 'epoch': 0.72} {'loss': 0.6485, 'learning_rate': 1.4806651286147568e-05, 'epoch': 0.72} {'loss': 0.4052, 'learning_rate': 1.4806356663207488e-05, 'epoch': 0.72} {'loss': 0.556, 'learning_rate': 1.4806062034841948e-05, 'epoch': 0.72} {'loss': 0.5552, 'learning_rate': 1.4805767401051277e-05, 'epoch': 0.72} {'loss': 0.4975, 'learning_rate': 1.4805472761835806e-05, 'epoch': 0.72} {'loss': 0.5555, 'learning_rate': 1.4805178117195873e-05, 'epoch': 0.72} {'loss': 0.7459, 'learning_rate': 1.4804883467131807e-05, 'epoch': 0.72} {'loss': 0.5701, 'learning_rate': 1.480458881164394e-05, 'epoch': 0.72} {'loss': 0.5395, 'learning_rate': 1.4804294150732608e-05, 'epoch': 0.72} {'loss': 0.514, 'learning_rate': 1.4803999484398139e-05, 'epoch': 0.72} {'loss': 0.3804, 'learning_rate': 1.480370481264087e-05, 'epoch': 0.72} {'loss': 0.5392, 'learning_rate': 1.480341013546113e-05, 'epoch': 0.72} {'loss': 0.4142, 'learning_rate': 1.4803115452859253e-05, 'epoch': 0.72} {'loss': 0.4412, 'learning_rate': 1.4802820764835575e-05, 'epoch': 0.72} {'loss': 0.6157, 'learning_rate': 1.4802526071390424e-05, 'epoch': 0.72} {'loss': 0.64, 'learning_rate': 1.4802231372524133e-05, 'epoch': 0.72} {'loss': 0.6688, 'learning_rate': 1.4801936668237038e-05, 'epoch': 0.72} {'loss': 0.4713, 'learning_rate': 1.480164195852947e-05, 'epoch': 0.72} {'loss': 0.4844, 'learning_rate': 1.480134724340176e-05, 'epoch': 0.72} {'loss': 0.6166, 'learning_rate': 1.4801052522854243e-05, 'epoch': 0.72} {'loss': 0.6593, 'learning_rate': 1.4800757796887251e-05, 'epoch': 0.72} {'loss': 0.5741, 'learning_rate': 1.4800463065501116e-05, 'epoch': 0.72} {'loss': 0.6534, 'learning_rate': 1.480016832869617e-05, 'epoch': 0.72} {'loss': 0.6504, 'learning_rate': 1.4799873586472746e-05, 'epoch': 0.72} {'loss': 0.5386, 'learning_rate': 1.479957883883118e-05, 'epoch': 0.72} {'loss': 0.4302, 'learning_rate': 1.4799284085771798e-05, 'epoch': 0.72} {'loss': 0.6259, 'learning_rate': 1.4798989327294942e-05, 'epoch': 0.72} {'loss': 0.4279, 'learning_rate': 1.4798694563400937e-05, 'epoch': 0.72} {'loss': 0.6061, 'learning_rate': 1.479839979409012e-05, 'epoch': 0.72} {'loss': 0.6548, 'learning_rate': 1.4798105019362818e-05, 'epoch': 0.72} {'loss': 0.4638, 'learning_rate': 1.4797810239219372e-05, 'epoch': 0.72} {'loss': 0.5836, 'learning_rate': 1.4797515453660109e-05, 'epoch': 0.72} {'loss': 0.4966, 'learning_rate': 1.4797220662685363e-05, 'epoch': 0.72} {'loss': 0.6574, 'learning_rate': 1.4796925866295468e-05, 'epoch': 0.72} {'loss': 0.5729, 'learning_rate': 1.4796631064490756e-05, 'epoch': 0.72} {'loss': 0.5367, 'learning_rate': 1.479633625727156e-05, 'epoch': 0.72} {'loss': 0.4471, 'learning_rate': 1.4796041444638212e-05, 'epoch': 0.72} {'loss': 0.6416, 'learning_rate': 1.4795746626591046e-05, 'epoch': 0.72} {'loss': 0.4916, 'learning_rate': 1.4795451803130391e-05, 'epoch': 0.72} {'loss': 0.5639, 'learning_rate': 1.4795156974256584e-05, 'epoch': 0.72} {'loss': 0.6625, 'learning_rate': 1.4794862139969959e-05, 'epoch': 0.72} {'loss': 0.6029, 'learning_rate': 1.4794567300270844e-05, 'epoch': 0.72} {'loss': 0.6981, 'learning_rate': 1.4794272455159573e-05, 'epoch': 0.72} {'loss': 0.5934, 'learning_rate': 1.4793977604636483e-05, 'epoch': 0.72} {'loss': 0.6629, 'learning_rate': 1.4793682748701903e-05, 'epoch': 0.72} {'loss': 0.6625, 'learning_rate': 1.4793387887356165e-05, 'epoch': 0.72} {'loss': 0.631, 'learning_rate': 1.4793093020599607e-05, 'epoch': 0.72} {'loss': 0.7004, 'learning_rate': 1.4792798148432557e-05, 'epoch': 0.72} {'loss': 0.5705, 'learning_rate': 1.4792503270855349e-05, 'epoch': 0.72} {'loss': 0.5054, 'learning_rate': 1.4792208387868317e-05, 'epoch': 0.72} {'loss': 0.5175, 'learning_rate': 1.479191349947179e-05, 'epoch': 0.72} {'loss': 0.6628, 'learning_rate': 1.4791618605666106e-05, 'epoch': 0.72} {'loss': 0.6836, 'learning_rate': 1.4791323706451597e-05, 'epoch': 0.72} {'loss': 0.7633, 'learning_rate': 1.4791028801828592e-05, 'epoch': 0.72} {'loss': 0.4295, 'learning_rate': 1.4790733891797428e-05, 'epoch': 0.72} {'loss': 0.5882, 'learning_rate': 1.4790438976358436e-05, 'epoch': 0.72} {'loss': 0.5238, 'learning_rate': 1.479014405551195e-05, 'epoch': 0.72} {'loss': 0.6034, 'learning_rate': 1.4789849129258303e-05, 'epoch': 0.72} {'loss': 0.5715, 'learning_rate': 1.4789554197597827e-05, 'epoch': 0.72} {'loss': 0.6283, 'learning_rate': 1.4789259260530853e-05, 'epoch': 0.72} {'loss': 0.6, 'learning_rate': 1.4788964318057717e-05, 'epoch': 0.72} {'loss': 0.6346, 'learning_rate': 1.478866937017875e-05, 'epoch': 0.72} {'loss': 0.4821, 'learning_rate': 1.4788374416894286e-05, 'epoch': 0.72} {'loss': 0.5028, 'learning_rate': 1.478807945820466e-05, 'epoch': 0.72} {'loss': 0.4718, 'learning_rate': 1.4787784494110202e-05, 'epoch': 0.72} {'loss': 0.4238, 'learning_rate': 1.4787489524611245e-05, 'epoch': 0.72} {'loss': 0.6316, 'learning_rate': 1.4787194549708123e-05, 'epoch': 0.72} {'loss': 0.5456, 'learning_rate': 1.478689956940117e-05, 'epoch': 0.72} {'loss': 0.5062, 'learning_rate': 1.4786604583690715e-05, 'epoch': 0.72} {'loss': 0.5974, 'learning_rate': 1.4786309592577095e-05, 'epoch': 0.72} {'loss': 0.6963, 'learning_rate': 1.4786014596060643e-05, 'epoch': 0.72} {'loss': 0.4502, 'learning_rate': 1.478571959414169e-05, 'epoch': 0.72} {'loss': 0.6228, 'learning_rate': 1.478542458682057e-05, 'epoch': 0.72} {'loss': 0.5191, 'learning_rate': 1.4785129574097611e-05, 'epoch': 0.72} {'loss': 0.6825, 'learning_rate': 1.4784834555973157e-05, 'epoch': 0.72} {'loss': 0.385, 'learning_rate': 1.478453953244753e-05, 'epoch': 0.72} {'loss': 0.5339, 'learning_rate': 1.478424450352107e-05, 'epoch': 0.72} {'loss': 0.4662, 'learning_rate': 1.4783949469194108e-05, 'epoch': 0.72} {'loss': 0.5328, 'learning_rate': 1.4783654429466976e-05, 'epoch': 0.72} {'loss': 0.5785, 'learning_rate': 1.4783359384340008e-05, 'epoch': 0.72} {'loss': 0.5738, 'learning_rate': 1.4783064333813535e-05, 'epoch': 0.72} {'loss': 0.6855, 'learning_rate': 1.4782769277887893e-05, 'epoch': 0.72} {'loss': 0.4974, 'learning_rate': 1.4782474216563416e-05, 'epoch': 0.72} {'loss': 0.7017, 'learning_rate': 1.4782179149840436e-05, 'epoch': 0.72} {'loss': 0.5323, 'learning_rate': 1.4781884077719282e-05, 'epoch': 0.72} {'loss': 0.5159, 'learning_rate': 1.4781589000200292e-05, 'epoch': 0.72} {'loss': 0.7683, 'learning_rate': 1.4781293917283796e-05, 'epoch': 0.72} {'loss': 0.5714, 'learning_rate': 1.4780998828970128e-05, 'epoch': 0.72} {'loss': 0.6409, 'learning_rate': 1.478070373525962e-05, 'epoch': 0.72} {'loss': 0.5078, 'learning_rate': 1.478040863615261e-05, 'epoch': 0.72} {'loss': 0.6207, 'learning_rate': 1.4780113531649426e-05, 'epoch': 0.72} {'loss': 0.638, 'learning_rate': 1.4779818421750403e-05, 'epoch': 0.72} {'loss': 0.6251, 'learning_rate': 1.4779523306455874e-05, 'epoch': 0.72} {'loss': 0.6719, 'learning_rate': 1.4779228185766173e-05, 'epoch': 0.72} {'loss': 0.671, 'learning_rate': 1.477893305968163e-05, 'epoch': 0.72} {'loss': 0.6751, 'learning_rate': 1.4778637928202582e-05, 'epoch': 0.72} {'loss': 0.5329, 'learning_rate': 1.477834279132936e-05, 'epoch': 0.72} {'loss': 0.5833, 'learning_rate': 1.47780476490623e-05, 'epoch': 0.72} {'loss': 0.5654, 'learning_rate': 1.477775250140173e-05, 'epoch': 0.72} {'loss': 0.477, 'learning_rate': 1.4777457348347986e-05, 'epoch': 0.72} {'loss': 0.4246, 'learning_rate': 1.4777162189901401e-05, 'epoch': 0.72} {'loss': 0.5946, 'learning_rate': 1.477686702606231e-05, 'epoch': 0.72} {'loss': 0.5153, 'learning_rate': 1.4776571856831044e-05, 'epoch': 0.72} {'loss': 0.5966, 'learning_rate': 1.4776276682207936e-05, 'epoch': 0.72} {'loss': 0.6323, 'learning_rate': 1.4775981502193319e-05, 'epoch': 0.72} {'loss': 0.6233, 'learning_rate': 1.4775686316787527e-05, 'epoch': 0.72} {'loss': 0.5783, 'learning_rate': 1.4775391125990894e-05, 'epoch': 0.72} {'loss': 0.5444, 'learning_rate': 1.4775095929803755e-05, 'epoch': 0.72} {'loss': 0.5381, 'learning_rate': 1.4774800728226437e-05, 'epoch': 0.72} {'loss': 0.7479, 'learning_rate': 1.4774505521259279e-05, 'epoch': 0.72} {'loss': 0.6628, 'learning_rate': 1.4774210308902611e-05, 'epoch': 0.72} {'loss': 0.6506, 'learning_rate': 1.4773915091156768e-05, 'epoch': 0.72} {'loss': 0.726, 'learning_rate': 1.4773619868022082e-05, 'epoch': 0.72} {'loss': 0.5254, 'learning_rate': 1.477332463949889e-05, 'epoch': 0.72} {'loss': 0.4953, 'learning_rate': 1.4773029405587519e-05, 'epoch': 0.72} {'loss': 0.5722, 'learning_rate': 1.4772734166288305e-05, 'epoch': 0.72} {'loss': 0.5882, 'learning_rate': 1.4772438921601584e-05, 'epoch': 0.72} {'loss': 0.6741, 'learning_rate': 1.4772143671527686e-05, 'epoch': 0.72} {'loss': 0.5596, 'learning_rate': 1.4771848416066945e-05, 'epoch': 0.72} {'loss': 0.5579, 'learning_rate': 1.4771553155219693e-05, 'epoch': 0.72} {'loss': 0.5768, 'learning_rate': 1.477125788898627e-05, 'epoch': 0.72} {'loss': 0.6261, 'learning_rate': 1.4770962617367e-05, 'epoch': 0.72} {'loss': 0.6985, 'learning_rate': 1.4770667340362221e-05, 'epoch': 0.72} {'loss': 0.523, 'learning_rate': 1.4770372057972267e-05, 'epoch': 0.72} {'loss': 0.573, 'learning_rate': 1.4770076770197468e-05, 'epoch': 0.72} {'loss': 0.5151, 'learning_rate': 1.4769781477038161e-05, 'epoch': 0.72} {'loss': 0.5356, 'learning_rate': 1.4769486178494677e-05, 'epoch': 0.72} {'loss': 0.6847, 'learning_rate': 1.4769190874567349e-05, 'epoch': 0.72} {'loss': 0.4909, 'learning_rate': 1.4768895565256514e-05, 'epoch': 0.72} {'loss': 0.7492, 'learning_rate': 1.4768600250562501e-05, 'epoch': 0.72} {'loss': 0.4825, 'learning_rate': 1.4768304930485643e-05, 'epoch': 0.72} {'loss': 0.7177, 'learning_rate': 1.476800960502628e-05, 'epoch': 0.72} {'loss': 0.5822, 'learning_rate': 1.4767714274184739e-05, 'epoch': 0.72} {'loss': 0.6216, 'learning_rate': 1.4767418937961356e-05, 'epoch': 0.72} {'loss': 0.5348, 'learning_rate': 1.4767123596356463e-05, 'epoch': 0.72} {'loss': 0.7937, 'learning_rate': 1.4766828249370393e-05, 'epoch': 0.72} {'loss': 0.5834, 'learning_rate': 1.476653289700348e-05, 'epoch': 0.72} {'loss': 0.6229, 'learning_rate': 1.476623753925606e-05, 'epoch': 0.72} {'loss': 0.4935, 'learning_rate': 1.4765942176128462e-05, 'epoch': 0.72} {'loss': 0.4755, 'learning_rate': 1.4765646807621023e-05, 'epoch': 0.72} {'loss': 0.5331, 'learning_rate': 1.4765351433734075e-05, 'epoch': 0.72} {'loss': 0.7134, 'learning_rate': 1.476505605446795e-05, 'epoch': 0.72} {'loss': 0.5133, 'learning_rate': 1.4764760669822984e-05, 'epoch': 0.72} {'loss': 0.7122, 'learning_rate': 1.4764465279799507e-05, 'epoch': 0.72} {'loss': 0.6183, 'learning_rate': 1.4764169884397856e-05, 'epoch': 0.72} {'loss': 0.4622, 'learning_rate': 1.4763874483618365e-05, 'epoch': 0.72} {'loss': 0.5343, 'learning_rate': 1.4763579077461368e-05, 'epoch': 0.72} {'loss': 0.6013, 'learning_rate': 1.4763283665927191e-05, 'epoch': 0.72} {'loss': 0.5953, 'learning_rate': 1.4762988249016173e-05, 'epoch': 0.72} {'loss': 0.57, 'learning_rate': 1.476269282672865e-05, 'epoch': 0.72} {'loss': 0.6733, 'learning_rate': 1.476239739906495e-05, 'epoch': 0.72} {'loss': 0.5751, 'learning_rate': 1.4762101966025408e-05, 'epoch': 0.72} {'loss': 0.5772, 'learning_rate': 1.4761806527610358e-05, 'epoch': 0.72} {'loss': 0.5704, 'learning_rate': 1.4761511083820137e-05, 'epoch': 0.72} {'loss': 0.5878, 'learning_rate': 1.4761215634655075e-05, 'epoch': 0.72} {'loss': 0.5516, 'learning_rate': 1.4760920180115506e-05, 'epoch': 0.73} {'loss': 0.5642, 'learning_rate': 1.4760624720201762e-05, 'epoch': 0.73} {'loss': 0.6354, 'learning_rate': 1.4760329254914177e-05, 'epoch': 0.73} {'loss': 0.5488, 'learning_rate': 1.4760033784253087e-05, 'epoch': 0.73} {'loss': 0.5725, 'learning_rate': 1.4759738308218822e-05, 'epoch': 0.73} {'loss': 0.5649, 'learning_rate': 1.475944282681172e-05, 'epoch': 0.73} {'loss': 0.6433, 'learning_rate': 1.4759147340032111e-05, 'epoch': 0.73} {'loss': 0.5763, 'learning_rate': 1.4758851847880334e-05, 'epoch': 0.73} {'loss': 0.5393, 'learning_rate': 1.4758556350356713e-05, 'epoch': 0.73} {'loss': 0.6769, 'learning_rate': 1.4758260847461588e-05, 'epoch': 0.73} {'loss': 0.6874, 'learning_rate': 1.475796533919529e-05, 'epoch': 0.73} {'loss': 0.5649, 'learning_rate': 1.4757669825558156e-05, 'epoch': 0.73} {'loss': 0.5919, 'learning_rate': 1.4757374306550518e-05, 'epoch': 0.73} {'loss': 0.5862, 'learning_rate': 1.4757078782172707e-05, 'epoch': 0.73} {'loss': 0.5554, 'learning_rate': 1.475678325242506e-05, 'epoch': 0.73} {'loss': 0.4952, 'learning_rate': 1.475648771730791e-05, 'epoch': 0.73} {'loss': 0.3536, 'learning_rate': 1.475619217682159e-05, 'epoch': 0.73} {'loss': 0.5339, 'learning_rate': 1.4755896630966431e-05, 'epoch': 0.73} {'loss': 0.4341, 'learning_rate': 1.4755601079742769e-05, 'epoch': 0.73} {'loss': 0.5384, 'learning_rate': 1.475530552315094e-05, 'epoch': 0.73} {'loss': 0.5457, 'learning_rate': 1.4755009961191275e-05, 'epoch': 0.73} {'loss': 0.6391, 'learning_rate': 1.4754714393864106e-05, 'epoch': 0.73} {'loss': 0.5623, 'learning_rate': 1.4754418821169768e-05, 'epoch': 0.73} {'loss': 0.6426, 'learning_rate': 1.47541232431086e-05, 'epoch': 0.73} {'loss': 0.5486, 'learning_rate': 1.4753827659680928e-05, 'epoch': 0.73} {'loss': 0.5496, 'learning_rate': 1.4753532070887089e-05, 'epoch': 0.73} {'loss': 0.5836, 'learning_rate': 1.4753236476727415e-05, 'epoch': 0.73} {'loss': 0.5406, 'learning_rate': 1.4752940877202242e-05, 'epoch': 0.73} {'loss': 0.7093, 'learning_rate': 1.4752645272311904e-05, 'epoch': 0.73} {'loss': 0.5015, 'learning_rate': 1.475234966205673e-05, 'epoch': 0.73} {'loss': 0.4286, 'learning_rate': 1.4752054046437058e-05, 'epoch': 0.73} {'loss': 0.4573, 'learning_rate': 1.4751758425453221e-05, 'epoch': 0.73} {'loss': 0.5945, 'learning_rate': 1.4751462799105553e-05, 'epoch': 0.73} {'loss': 0.675, 'learning_rate': 1.4751167167394386e-05, 'epoch': 0.73} {'loss': 0.5885, 'learning_rate': 1.4750871530320056e-05, 'epoch': 0.73} {'loss': 0.3493, 'learning_rate': 1.4750575887882894e-05, 'epoch': 0.73} {'loss': 0.6154, 'learning_rate': 1.4750280240083237e-05, 'epoch': 0.73} {'loss': 0.5845, 'learning_rate': 1.4749984586921415e-05, 'epoch': 0.73} {'loss': 0.5081, 'learning_rate': 1.4749688928397766e-05, 'epoch': 0.73} {'loss': 0.5988, 'learning_rate': 1.4749393264512617e-05, 'epoch': 0.73} {'loss': 0.6183, 'learning_rate': 1.4749097595266308e-05, 'epoch': 0.73} {'loss': 0.6147, 'learning_rate': 1.4748801920659175e-05, 'epoch': 0.73} {'loss': 0.5474, 'learning_rate': 1.4748506240691545e-05, 'epoch': 0.73} {'loss': 0.5017, 'learning_rate': 1.4748210555363753e-05, 'epoch': 0.73} {'loss': 0.5905, 'learning_rate': 1.4747914864676137e-05, 'epoch': 0.73} {'loss': 0.5334, 'learning_rate': 1.4747619168629025e-05, 'epoch': 0.73} {'loss': 0.4835, 'learning_rate': 1.4747323467222753e-05, 'epoch': 0.73} {'loss': 0.6385, 'learning_rate': 1.4747027760457657e-05, 'epoch': 0.73} {'loss': 0.5268, 'learning_rate': 1.4746732048334071e-05, 'epoch': 0.73} {'loss': 0.5338, 'learning_rate': 1.4746436330852325e-05, 'epoch': 0.73} {'loss': 0.6604, 'learning_rate': 1.4746140608012756e-05, 'epoch': 0.73} {'loss': 0.6234, 'learning_rate': 1.4745844879815696e-05, 'epoch': 0.73} {'loss': 0.5519, 'learning_rate': 1.4745549146261482e-05, 'epoch': 0.73} {'loss': 0.5329, 'learning_rate': 1.4745253407350442e-05, 'epoch': 0.73} {'loss': 0.6245, 'learning_rate': 1.4744957663082915e-05, 'epoch': 0.73} {'loss': 0.6106, 'learning_rate': 1.4744661913459232e-05, 'epoch': 0.73} {'loss': 0.5685, 'learning_rate': 1.474436615847973e-05, 'epoch': 0.73} {'loss': 0.6085, 'learning_rate': 1.4744070398144738e-05, 'epoch': 0.73} {'loss': 0.5318, 'learning_rate': 1.4743774632454595e-05, 'epoch': 0.73} {'loss': 0.5607, 'learning_rate': 1.4743478861409633e-05, 'epoch': 0.73} {'loss': 0.553, 'learning_rate': 1.4743183085010185e-05, 'epoch': 0.73} {'loss': 0.771, 'learning_rate': 1.4742887303256584e-05, 'epoch': 0.73} {'loss': 0.683, 'learning_rate': 1.4742591516149164e-05, 'epoch': 0.73} {'loss': 0.5133, 'learning_rate': 1.4742295723688263e-05, 'epoch': 0.73} {'loss': 0.5977, 'learning_rate': 1.4741999925874213e-05, 'epoch': 0.73} {'loss': 0.5012, 'learning_rate': 1.4741704122707343e-05, 'epoch': 0.73} {'loss': 0.6414, 'learning_rate': 1.4741408314187992e-05, 'epoch': 0.73} {'loss': 0.6138, 'learning_rate': 1.4741112500316492e-05, 'epoch': 0.73} {'loss': 0.6086, 'learning_rate': 1.4740816681093179e-05, 'epoch': 0.73} {'loss': 0.6165, 'learning_rate': 1.4740520856518385e-05, 'epoch': 0.73} {'loss': 0.6896, 'learning_rate': 1.4740225026592443e-05, 'epoch': 0.73} {'loss': 0.5509, 'learning_rate': 1.4739929191315692e-05, 'epoch': 0.73} {'loss': 0.7623, 'learning_rate': 1.4739633350688458e-05, 'epoch': 0.73} {'loss': 0.6455, 'learning_rate': 1.4739337504711083e-05, 'epoch': 0.73} {'loss': 0.6752, 'learning_rate': 1.4739041653383895e-05, 'epoch': 0.73} {'loss': 0.5935, 'learning_rate': 1.4738745796707228e-05, 'epoch': 0.73} {'loss': 0.6676, 'learning_rate': 1.473844993468142e-05, 'epoch': 0.73} {'loss': 0.4358, 'learning_rate': 1.4738154067306805e-05, 'epoch': 0.73} {'loss': 0.5017, 'learning_rate': 1.4737858194583714e-05, 'epoch': 0.73} {'loss': 0.7324, 'learning_rate': 1.4737562316512482e-05, 'epoch': 0.73} {'loss': 0.4407, 'learning_rate': 1.4737266433093442e-05, 'epoch': 0.73} {'loss': 0.4732, 'learning_rate': 1.4736970544326929e-05, 'epoch': 0.73} {'loss': 0.5748, 'learning_rate': 1.4736674650213278e-05, 'epoch': 0.73} {'loss': 0.5409, 'learning_rate': 1.4736378750752823e-05, 'epoch': 0.73} {'loss': 0.5453, 'learning_rate': 1.4736082845945896e-05, 'epoch': 0.73} {'loss': 0.5022, 'learning_rate': 1.473578693579283e-05, 'epoch': 0.73} {'loss': 0.5691, 'learning_rate': 1.4735491020293964e-05, 'epoch': 0.73} {'loss': 0.6161, 'learning_rate': 1.4735195099449629e-05, 'epoch': 0.73} {'loss': 0.6292, 'learning_rate': 1.4734899173260158e-05, 'epoch': 0.73} {'loss': 0.6106, 'learning_rate': 1.4734603241725887e-05, 'epoch': 0.73} {'loss': 0.6321, 'learning_rate': 1.4734307304847146e-05, 'epoch': 0.73} {'loss': 0.423, 'learning_rate': 1.4734011362624278e-05, 'epoch': 0.73} {'loss': 0.5783, 'learning_rate': 1.473371541505761e-05, 'epoch': 0.73} {'loss': 0.6811, 'learning_rate': 1.4733419462147475e-05, 'epoch': 0.73} {'loss': 0.5558, 'learning_rate': 1.473312350389421e-05, 'epoch': 0.73} {'loss': 0.426, 'learning_rate': 1.4732827540298149e-05, 'epoch': 0.73} {'loss': 0.6494, 'learning_rate': 1.4732531571359625e-05, 'epoch': 0.73} {'loss': 0.5779, 'learning_rate': 1.4732235597078974e-05, 'epoch': 0.73} {'loss': 0.5395, 'learning_rate': 1.4731939617456527e-05, 'epoch': 0.73} {'loss': 0.7171, 'learning_rate': 1.4731643632492623e-05, 'epoch': 0.73} {'loss': 0.4147, 'learning_rate': 1.4731347642187593e-05, 'epoch': 0.73} {'loss': 0.5487, 'learning_rate': 1.4731051646541768e-05, 'epoch': 0.73} {'loss': 0.5405, 'learning_rate': 1.4730755645555488e-05, 'epoch': 0.73} {'loss': 0.5232, 'learning_rate': 1.4730459639229082e-05, 'epoch': 0.73} {'loss': 0.7227, 'learning_rate': 1.473016362756289e-05, 'epoch': 0.73} {'loss': 0.5239, 'learning_rate': 1.472986761055724e-05, 'epoch': 0.73} {'loss': 0.5784, 'learning_rate': 1.472957158821247e-05, 'epoch': 0.73} {'loss': 0.5449, 'learning_rate': 1.4729275560528913e-05, 'epoch': 0.73} {'loss': 0.6486, 'learning_rate': 1.4728979527506902e-05, 'epoch': 0.73} {'loss': 0.6513, 'learning_rate': 1.4728683489146774e-05, 'epoch': 0.73} {'loss': 0.646, 'learning_rate': 1.4728387445448861e-05, 'epoch': 0.73} {'loss': 0.5555, 'learning_rate': 1.4728091396413497e-05, 'epoch': 0.73} {'loss': 0.6053, 'learning_rate': 1.4727795342041018e-05, 'epoch': 0.73} {'loss': 0.5465, 'learning_rate': 1.4727499282331756e-05, 'epoch': 0.73} {'loss': 0.4448, 'learning_rate': 1.472720321728605e-05, 'epoch': 0.73} {'loss': 0.5744, 'learning_rate': 1.4726907146904226e-05, 'epoch': 0.73} {'loss': 0.4722, 'learning_rate': 1.4726611071186625e-05, 'epoch': 0.73} {'loss': 0.6641, 'learning_rate': 1.4726314990133577e-05, 'epoch': 0.73} {'loss': 0.6088, 'learning_rate': 1.4726018903745418e-05, 'epoch': 0.73} {'loss': 0.5156, 'learning_rate': 1.4725722812022484e-05, 'epoch': 0.73} {'loss': 0.482, 'learning_rate': 1.4725426714965107e-05, 'epoch': 0.73} {'loss': 0.6115, 'learning_rate': 1.4725130612573624e-05, 'epoch': 0.73} {'loss': 0.4738, 'learning_rate': 1.4724834504848363e-05, 'epoch': 0.73} {'loss': 0.4641, 'learning_rate': 1.4724538391789664e-05, 'epoch': 0.73} {'loss': 0.7061, 'learning_rate': 1.472424227339786e-05, 'epoch': 0.73} {'loss': 0.7806, 'learning_rate': 1.4723946149673286e-05, 'epoch': 0.73} {'loss': 0.6507, 'learning_rate': 1.4723650020616273e-05, 'epoch': 0.73} {'loss': 0.6852, 'learning_rate': 1.472335388622716e-05, 'epoch': 0.73} {'loss': 0.6741, 'learning_rate': 1.4723057746506278e-05, 'epoch': 0.73} {'loss': 0.4345, 'learning_rate': 1.4722761601453961e-05, 'epoch': 0.73} {'loss': 0.5443, 'learning_rate': 1.4722465451070543e-05, 'epoch': 0.73} {'loss': 0.2702, 'learning_rate': 1.4722169295356362e-05, 'epoch': 0.73} {'loss': 0.6508, 'learning_rate': 1.4721873134311746e-05, 'epoch': 0.73} {'loss': 0.6323, 'learning_rate': 1.4721576967937035e-05, 'epoch': 0.73} {'loss': 0.4658, 'learning_rate': 1.4721280796232562e-05, 'epoch': 0.73} {'loss': 0.6282, 'learning_rate': 1.4720984619198662e-05, 'epoch': 0.73} {'loss': 0.6271, 'learning_rate': 1.4720688436835667e-05, 'epoch': 0.73} {'loss': 0.4915, 'learning_rate': 1.4720392249143912e-05, 'epoch': 0.73} {'loss': 0.6206, 'learning_rate': 1.4720096056123731e-05, 'epoch': 0.73} {'loss': 0.5112, 'learning_rate': 1.4719799857775461e-05, 'epoch': 0.73} {'loss': 0.531, 'learning_rate': 1.4719503654099433e-05, 'epoch': 0.73} {'loss': 0.7622, 'learning_rate': 1.4719207445095983e-05, 'epoch': 0.73} {'loss': 0.5905, 'learning_rate': 1.4718911230765447e-05, 'epoch': 0.73} {'loss': 0.5288, 'learning_rate': 1.4718615011108157e-05, 'epoch': 0.73} {'loss': 0.4868, 'learning_rate': 1.4718318786124446e-05, 'epoch': 0.73} {'loss': 0.699, 'learning_rate': 1.4718022555814654e-05, 'epoch': 0.73} {'loss': 0.5868, 'learning_rate': 1.4717726320179107e-05, 'epoch': 0.73} {'loss': 0.5942, 'learning_rate': 1.4717430079218146e-05, 'epoch': 0.73} {'loss': 0.546, 'learning_rate': 1.4717133832932104e-05, 'epoch': 0.73} {'loss': 0.5363, 'learning_rate': 1.4716837581321314e-05, 'epoch': 0.73} {'loss': 0.3357, 'learning_rate': 1.4716541324386113e-05, 'epoch': 0.73} {'loss': 0.5667, 'learning_rate': 1.4716245062126832e-05, 'epoch': 0.73} {'loss': 0.5841, 'learning_rate': 1.4715948794543808e-05, 'epoch': 0.73} {'loss': 0.4594, 'learning_rate': 1.4715652521637376e-05, 'epoch': 0.73} {'loss': 0.547, 'learning_rate': 1.4715356243407866e-05, 'epoch': 0.73} {'loss': 0.4744, 'learning_rate': 1.4715059959855617e-05, 'epoch': 0.73} {'loss': 0.5036, 'learning_rate': 1.471476367098096e-05, 'epoch': 0.73} {'loss': 0.431, 'learning_rate': 1.4714467376784235e-05, 'epoch': 0.73} {'loss': 0.6128, 'learning_rate': 1.471417107726577e-05, 'epoch': 0.73} {'loss': 0.6716, 'learning_rate': 1.4713874772425904e-05, 'epoch': 0.73} {'loss': 0.7013, 'learning_rate': 1.4713578462264967e-05, 'epoch': 0.73} {'loss': 0.5476, 'learning_rate': 1.4713282146783301e-05, 'epoch': 0.73} {'loss': 0.6657, 'learning_rate': 1.4712985825981233e-05, 'epoch': 0.73} {'loss': 0.4499, 'learning_rate': 1.4712689499859098e-05, 'epoch': 0.73} {'loss': 0.6337, 'learning_rate': 1.4712393168417239e-05, 'epoch': 0.73} {'loss': 0.5131, 'learning_rate': 1.471209683165598e-05, 'epoch': 0.73} {'loss': 0.5788, 'learning_rate': 1.471180048957566e-05, 'epoch': 0.73} {'loss': 0.6143, 'learning_rate': 1.4711504142176614e-05, 'epoch': 0.73} {'loss': 0.6865, 'learning_rate': 1.4711207789459174e-05, 'epoch': 0.73} {'loss': 0.4777, 'learning_rate': 1.4710911431423677e-05, 'epoch': 0.73} {'loss': 0.669, 'learning_rate': 1.4710615068070458e-05, 'epoch': 0.73} {'loss': 0.5826, 'learning_rate': 1.4710318699399848e-05, 'epoch': 0.73} {'loss': 0.6364, 'learning_rate': 1.4710022325412186e-05, 'epoch': 0.73} {'loss': 0.6169, 'learning_rate': 1.4709725946107802e-05, 'epoch': 0.73} {'loss': 0.5389, 'learning_rate': 1.4709429561487036e-05, 'epoch': 0.73} {'loss': 0.4757, 'learning_rate': 1.4709133171550218e-05, 'epoch': 0.73} {'loss': 0.7223, 'learning_rate': 1.4708836776297686e-05, 'epoch': 0.73} {'loss': 0.6328, 'learning_rate': 1.4708540375729773e-05, 'epoch': 0.73} {'loss': 0.5689, 'learning_rate': 1.4708243969846809e-05, 'epoch': 0.73} {'loss': 0.598, 'learning_rate': 1.4707947558649136e-05, 'epoch': 0.73} {'loss': 0.5955, 'learning_rate': 1.4707651142137084e-05, 'epoch': 0.73} {'loss': 0.4971, 'learning_rate': 1.470735472031099e-05, 'epoch': 0.73} {'loss': 0.5532, 'learning_rate': 1.4707058293171188e-05, 'epoch': 0.73} {'loss': 0.5734, 'learning_rate': 1.4706761860718013e-05, 'epoch': 0.73} {'loss': 0.4876, 'learning_rate': 1.4706465422951797e-05, 'epoch': 0.73} {'loss': 0.5051, 'learning_rate': 1.4706168979872876e-05, 'epoch': 0.73} {'loss': 0.6576, 'learning_rate': 1.4705872531481586e-05, 'epoch': 0.73} {'loss': 0.6512, 'learning_rate': 1.4705576077778263e-05, 'epoch': 0.73} {'loss': 0.7823, 'learning_rate': 1.4705279618763237e-05, 'epoch': 0.73} {'loss': 0.408, 'learning_rate': 1.4704983154436845e-05, 'epoch': 0.73} {'loss': 0.5856, 'learning_rate': 1.4704686684799426e-05, 'epoch': 0.73} {'loss': 0.5494, 'learning_rate': 1.4704390209851305e-05, 'epoch': 0.73} {'loss': 0.6872, 'learning_rate': 1.4704093729592823e-05, 'epoch': 0.73} {'loss': 0.5141, 'learning_rate': 1.4703797244024314e-05, 'epoch': 0.73} {'loss': 0.527, 'learning_rate': 1.4703500753146114e-05, 'epoch': 0.73} {'loss': 0.5419, 'learning_rate': 1.4703204256958554e-05, 'epoch': 0.73} {'loss': 0.6924, 'learning_rate': 1.470290775546197e-05, 'epoch': 0.73} {'loss': 0.629, 'learning_rate': 1.4702611248656702e-05, 'epoch': 0.73} {'loss': 0.5569, 'learning_rate': 1.4702314736543076e-05, 'epoch': 0.73} {'loss': 0.5825, 'learning_rate': 1.4702018219121432e-05, 'epoch': 0.73} {'loss': 0.5747, 'learning_rate': 1.4701721696392104e-05, 'epoch': 0.73} {'loss': 0.5135, 'learning_rate': 1.4701425168355426e-05, 'epoch': 0.73} {'loss': 0.4571, 'learning_rate': 1.4701128635011733e-05, 'epoch': 0.73} {'loss': 0.6685, 'learning_rate': 1.4700832096361359e-05, 'epoch': 0.73} {'loss': 0.495, 'learning_rate': 1.470053555240464e-05, 'epoch': 0.73} {'loss': 0.7411, 'learning_rate': 1.470023900314191e-05, 'epoch': 0.73} {'loss': 0.6277, 'learning_rate': 1.4699942448573503e-05, 'epoch': 0.73} {'loss': 0.4852, 'learning_rate': 1.4699645888699755e-05, 'epoch': 0.73} {'loss': 0.5053, 'learning_rate': 1.4699349323521004e-05, 'epoch': 0.73} {'loss': 0.5969, 'learning_rate': 1.4699052753037577e-05, 'epoch': 0.73} {'loss': 0.5958, 'learning_rate': 1.4698756177249815e-05, 'epoch': 0.73} {'loss': 0.6424, 'learning_rate': 1.469845959615805e-05, 'epoch': 0.73} {'loss': 0.457, 'learning_rate': 1.4698163009762619e-05, 'epoch': 0.73} {'loss': 0.5997, 'learning_rate': 1.4697866418063854e-05, 'epoch': 0.73} {'loss': 0.583, 'learning_rate': 1.4697569821062092e-05, 'epoch': 0.73} {'loss': 0.4478, 'learning_rate': 1.4697273218757668e-05, 'epoch': 0.73} {'loss': 0.6208, 'learning_rate': 1.4696976611150913e-05, 'epoch': 0.73} {'loss': 0.5196, 'learning_rate': 1.4696679998242167e-05, 'epoch': 0.73} {'loss': 0.65, 'learning_rate': 1.469638338003176e-05, 'epoch': 0.73} {'loss': 0.6128, 'learning_rate': 1.4696086756520031e-05, 'epoch': 0.73} {'loss': 0.6168, 'learning_rate': 1.4695790127707312e-05, 'epoch': 0.73} {'loss': 0.5675, 'learning_rate': 1.469549349359394e-05, 'epoch': 0.73} {'loss': 0.5952, 'learning_rate': 1.4695196854180247e-05, 'epoch': 0.73} {'loss': 0.82, 'learning_rate': 1.4694900209466571e-05, 'epoch': 0.73} {'loss': 0.5775, 'learning_rate': 1.4694603559453247e-05, 'epoch': 0.73} {'loss': 0.5282, 'learning_rate': 1.4694306904140605e-05, 'epoch': 0.73} {'loss': 0.5856, 'learning_rate': 1.4694010243528985e-05, 'epoch': 0.73} {'loss': 0.5915, 'learning_rate': 1.469371357761872e-05, 'epoch': 0.73} {'loss': 0.5317, 'learning_rate': 1.4693416906410144e-05, 'epoch': 0.73} {'loss': 0.5807, 'learning_rate': 1.4693120229903595e-05, 'epoch': 0.73} {'loss': 0.5141, 'learning_rate': 1.4692823548099405e-05, 'epoch': 0.73} {'loss': 0.6129, 'learning_rate': 1.4692526860997908e-05, 'epoch': 0.73} {'loss': 0.5549, 'learning_rate': 1.4692230168599442e-05, 'epoch': 0.73} {'loss': 0.5897, 'learning_rate': 1.4691933470904338e-05, 'epoch': 0.73} {'loss': 0.5158, 'learning_rate': 1.4691636767912936e-05, 'epoch': 0.73} {'loss': 0.6954, 'learning_rate': 1.4691340059625567e-05, 'epoch': 0.73} {'loss': 0.5467, 'learning_rate': 1.4691043346042566e-05, 'epoch': 0.73} {'loss': 0.5634, 'learning_rate': 1.4690746627164272e-05, 'epoch': 0.73} {'loss': 0.5464, 'learning_rate': 1.4690449902991013e-05, 'epoch': 0.73} {'loss': 0.5671, 'learning_rate': 1.4690153173523132e-05, 'epoch': 0.73} {'loss': 0.6562, 'learning_rate': 1.468985643876096e-05, 'epoch': 0.73} {'loss': 0.5332, 'learning_rate': 1.4689559698704829e-05, 'epoch': 0.73} {'loss': 0.5441, 'learning_rate': 1.4689262953355079e-05, 'epoch': 0.73} {'loss': 0.4709, 'learning_rate': 1.4688966202712043e-05, 'epoch': 0.73} {'loss': 0.5944, 'learning_rate': 1.4688669446776053e-05, 'epoch': 0.73} {'loss': 0.6071, 'learning_rate': 1.4688372685547449e-05, 'epoch': 0.73} {'loss': 0.5056, 'learning_rate': 1.4688075919026563e-05, 'epoch': 0.73} {'loss': 0.4932, 'learning_rate': 1.4687779147213733e-05, 'epoch': 0.73} {'loss': 0.6126, 'learning_rate': 1.468748237010929e-05, 'epoch': 0.73} {'loss': 0.5231, 'learning_rate': 1.4687185587713568e-05, 'epoch': 0.73} {'loss': 0.5942, 'learning_rate': 1.4686888800026909e-05, 'epoch': 0.73} {'loss': 0.5939, 'learning_rate': 1.468659200704964e-05, 'epoch': 0.73} {'loss': 0.7189, 'learning_rate': 1.4686295208782104e-05, 'epoch': 0.73} {'loss': 0.5748, 'learning_rate': 1.4685998405224629e-05, 'epoch': 0.73} {'loss': 0.4725, 'learning_rate': 1.4685701596377553e-05, 'epoch': 0.73} {'loss': 0.69, 'learning_rate': 1.4685404782241213e-05, 'epoch': 0.73} {'loss': 0.649, 'learning_rate': 1.4685107962815941e-05, 'epoch': 0.73} {'loss': 0.6459, 'learning_rate': 1.4684811138102073e-05, 'epoch': 0.73} {'loss': 0.637, 'learning_rate': 1.4684514308099942e-05, 'epoch': 0.73} {'loss': 0.6738, 'learning_rate': 1.4684217472809887e-05, 'epoch': 0.73} {'loss': 0.5384, 'learning_rate': 1.4683920632232242e-05, 'epoch': 0.73} {'loss': 0.6723, 'learning_rate': 1.468362378636734e-05, 'epoch': 0.73} {'loss': 0.4816, 'learning_rate': 1.4683326935215518e-05, 'epoch': 0.73} {'loss': 0.7556, 'learning_rate': 1.4683030078777112e-05, 'epoch': 0.73} {'loss': 0.4556, 'learning_rate': 1.4682733217052453e-05, 'epoch': 0.73} {'loss': 0.6332, 'learning_rate': 1.468243635004188e-05, 'epoch': 0.73} {'loss': 0.4755, 'learning_rate': 1.4682139477745726e-05, 'epoch': 0.73} {'loss': 0.5671, 'learning_rate': 1.468184260016433e-05, 'epoch': 0.73} {'loss': 0.6183, 'learning_rate': 1.4681545717298018e-05, 'epoch': 0.73} {'loss': 0.5632, 'learning_rate': 1.4681248829147134e-05, 'epoch': 0.73} {'loss': 0.6003, 'learning_rate': 1.4680951935712011e-05, 'epoch': 0.73} {'loss': 0.5331, 'learning_rate': 1.4680655036992983e-05, 'epoch': 0.73} {'loss': 0.8059, 'learning_rate': 1.4680358132990384e-05, 'epoch': 0.73} {'loss': 0.5228, 'learning_rate': 1.4680061223704554e-05, 'epoch': 0.73} {'loss': 0.5662, 'learning_rate': 1.4679764309135822e-05, 'epoch': 0.73} {'loss': 0.6278, 'learning_rate': 1.4679467389284527e-05, 'epoch': 0.73} {'loss': 0.5195, 'learning_rate': 1.4679170464151005e-05, 'epoch': 0.73} {'loss': 0.6725, 'learning_rate': 1.4678873533735588e-05, 'epoch': 0.73} {'loss': 0.4253, 'learning_rate': 1.4678576598038612e-05, 'epoch': 0.73} {'loss': 0.6548, 'learning_rate': 1.4678279657060412e-05, 'epoch': 0.73} {'loss': 0.6012, 'learning_rate': 1.4677982710801325e-05, 'epoch': 0.73} {'loss': 0.6697, 'learning_rate': 1.4677685759261685e-05, 'epoch': 0.73} {'loss': 0.5079, 'learning_rate': 1.4677388802441826e-05, 'epoch': 0.73} {'loss': 0.5525, 'learning_rate': 1.4677091840342086e-05, 'epoch': 0.73} {'loss': 0.6571, 'learning_rate': 1.4676794872962798e-05, 'epoch': 0.73} {'loss': 0.843, 'learning_rate': 1.4676497900304299e-05, 'epoch': 0.73} {'loss': 0.5735, 'learning_rate': 1.4676200922366921e-05, 'epoch': 0.73} {'loss': 0.5142, 'learning_rate': 1.4675903939151002e-05, 'epoch': 0.73} {'loss': 0.519, 'learning_rate': 1.4675606950656878e-05, 'epoch': 0.73} {'loss': 0.6035, 'learning_rate': 1.4675309956884882e-05, 'epoch': 0.73} {'loss': 0.5631, 'learning_rate': 1.467501295783535e-05, 'epoch': 0.73} {'loss': 0.7282, 'learning_rate': 1.4674715953508619e-05, 'epoch': 0.73} {'loss': 0.6376, 'learning_rate': 1.467441894390502e-05, 'epoch': 0.73} {'loss': 0.6029, 'learning_rate': 1.4674121929024891e-05, 'epoch': 0.73} {'loss': 0.699, 'learning_rate': 1.467382490886857e-05, 'epoch': 0.73} {'loss': 0.597, 'learning_rate': 1.4673527883436387e-05, 'epoch': 0.73} {'loss': 0.5534, 'learning_rate': 1.4673230852728679e-05, 'epoch': 0.73} {'loss': 0.6383, 'learning_rate': 1.4672933816745785e-05, 'epoch': 0.73} {'loss': 0.5671, 'learning_rate': 1.4672636775488034e-05, 'epoch': 0.73} {'loss': 0.629, 'learning_rate': 1.4672339728955767e-05, 'epoch': 0.73} {'loss': 0.5968, 'learning_rate': 1.4672042677149317e-05, 'epoch': 0.73} {'loss': 0.6228, 'learning_rate': 1.4671745620069017e-05, 'epoch': 0.73} {'loss': 0.5873, 'learning_rate': 1.4671448557715206e-05, 'epoch': 0.73} {'loss': 0.6498, 'learning_rate': 1.467115149008822e-05, 'epoch': 0.73} {'loss': 0.5662, 'learning_rate': 1.467085441718839e-05, 'epoch': 0.73} {'loss': 0.7134, 'learning_rate': 1.4670557339016052e-05, 'epoch': 0.73} {'loss': 0.617, 'learning_rate': 1.4670260255571544e-05, 'epoch': 0.73} {'loss': 0.5673, 'learning_rate': 1.4669963166855201e-05, 'epoch': 0.73} {'loss': 0.6544, 'learning_rate': 1.466966607286736e-05, 'epoch': 0.73} {'loss': 0.5802, 'learning_rate': 1.4669368973608351e-05, 'epoch': 0.73} {'loss': 0.554, 'learning_rate': 1.466907186907851e-05, 'epoch': 0.73} {'loss': 0.5758, 'learning_rate': 1.4668774759278179e-05, 'epoch': 0.73} {'loss': 0.5101, 'learning_rate': 1.4668477644207688e-05, 'epoch': 0.73} {'loss': 0.5167, 'learning_rate': 1.4668180523867375e-05, 'epoch': 0.73} {'loss': 0.6515, 'learning_rate': 1.4667883398257572e-05, 'epoch': 0.73} {'loss': 0.3909, 'learning_rate': 1.4667586267378618e-05, 'epoch': 0.73} {'loss': 0.6192, 'learning_rate': 1.4667289131230844e-05, 'epoch': 0.73} {'loss': 0.553, 'learning_rate': 1.4666991989814588e-05, 'epoch': 0.73} {'loss': 0.5604, 'learning_rate': 1.4666694843130187e-05, 'epoch': 0.73} {'loss': 0.6964, 'learning_rate': 1.4666397691177974e-05, 'epoch': 0.73} {'loss': 0.5106, 'learning_rate': 1.4666100533958286e-05, 'epoch': 0.73} {'loss': 0.4637, 'learning_rate': 1.4665803371471458e-05, 'epoch': 0.73} {'loss': 0.5554, 'learning_rate': 1.4665506203717826e-05, 'epoch': 0.73} {'loss': 0.6031, 'learning_rate': 1.4665209030697722e-05, 'epoch': 0.73} {'loss': 0.6934, 'learning_rate': 1.4664911852411487e-05, 'epoch': 0.73} {'loss': 0.7335, 'learning_rate': 1.4664614668859452e-05, 'epoch': 0.73} {'loss': 0.6194, 'learning_rate': 1.4664317480041956e-05, 'epoch': 0.73} {'loss': 0.4859, 'learning_rate': 1.4664020285959331e-05, 'epoch': 0.73} {'loss': 0.6601, 'learning_rate': 1.4663723086611914e-05, 'epoch': 0.73} {'loss': 0.4136, 'learning_rate': 1.466342588200004e-05, 'epoch': 0.73} {'loss': 0.7049, 'learning_rate': 1.4663128672124046e-05, 'epoch': 0.73} {'loss': 0.6086, 'learning_rate': 1.4662831456984266e-05, 'epoch': 0.73} {'loss': 0.4589, 'learning_rate': 1.4662534236581034e-05, 'epoch': 0.73} {'loss': 0.6845, 'learning_rate': 1.466223701091469e-05, 'epoch': 0.73} {'loss': 0.5788, 'learning_rate': 1.4661939779985566e-05, 'epoch': 0.73} {'loss': 0.5567, 'learning_rate': 1.4661642543793999e-05, 'epoch': 0.73} {'loss': 0.597, 'learning_rate': 1.4661345302340324e-05, 'epoch': 0.73} {'loss': 0.4019, 'learning_rate': 1.4661048055624876e-05, 'epoch': 0.73} {'loss': 0.6384, 'learning_rate': 1.4660750803647991e-05, 'epoch': 0.73} {'loss': 0.6489, 'learning_rate': 1.4660453546410007e-05, 'epoch': 0.73} {'loss': 0.5099, 'learning_rate': 1.4660156283911255e-05, 'epoch': 0.73} {'loss': 0.5424, 'learning_rate': 1.4659859016152074e-05, 'epoch': 0.73} {'loss': 0.6652, 'learning_rate': 1.4659561743132797e-05, 'epoch': 0.73} {'loss': 0.5446, 'learning_rate': 1.4659264464853762e-05, 'epoch': 0.73} {'loss': 0.612, 'learning_rate': 1.4658967181315303e-05, 'epoch': 0.73} {'loss': 0.398, 'learning_rate': 1.4658669892517754e-05, 'epoch': 0.73} {'loss': 0.6545, 'learning_rate': 1.4658372598461454e-05, 'epoch': 0.73} {'loss': 0.5079, 'learning_rate': 1.4658075299146737e-05, 'epoch': 0.73} {'loss': 0.6556, 'learning_rate': 1.4657777994573938e-05, 'epoch': 0.73} {'loss': 0.5513, 'learning_rate': 1.4657480684743396e-05, 'epoch': 0.73} {'loss': 0.5569, 'learning_rate': 1.4657183369655444e-05, 'epoch': 0.73} {'loss': 0.5954, 'learning_rate': 1.4656886049310415e-05, 'epoch': 0.73} {'loss': 0.533, 'learning_rate': 1.4656588723708647e-05, 'epoch': 0.73} {'loss': 0.6906, 'learning_rate': 1.4656291392850477e-05, 'epoch': 0.73} {'loss': 0.5422, 'learning_rate': 1.465599405673624e-05, 'epoch': 0.73} {'loss': 0.5277, 'learning_rate': 1.465569671536627e-05, 'epoch': 0.73} {'loss': 0.3681, 'learning_rate': 1.4655399368740904e-05, 'epoch': 0.73} {'loss': 0.4728, 'learning_rate': 1.4655102016860476e-05, 'epoch': 0.73} {'loss': 0.5411, 'learning_rate': 1.4654804659725326e-05, 'epoch': 0.73} {'loss': 0.6646, 'learning_rate': 1.4654507297335786e-05, 'epoch': 0.73} {'loss': 0.5169, 'learning_rate': 1.4654209929692191e-05, 'epoch': 0.73} {'loss': 0.4376, 'learning_rate': 1.4653912556794878e-05, 'epoch': 0.73} {'loss': 0.7123, 'learning_rate': 1.4653615178644183e-05, 'epoch': 0.73} {'loss': 0.6763, 'learning_rate': 1.4653317795240444e-05, 'epoch': 0.73} {'loss': 0.481, 'learning_rate': 1.4653020406583993e-05, 'epoch': 0.73} {'loss': 0.6186, 'learning_rate': 1.4652723012675164e-05, 'epoch': 0.73} {'loss': 0.673, 'learning_rate': 1.4652425613514299e-05, 'epoch': 0.73} {'loss': 0.5624, 'learning_rate': 1.4652128209101728e-05, 'epoch': 0.73} {'loss': 0.5148, 'learning_rate': 1.465183079943779e-05, 'epoch': 0.73} {'loss': 0.7384, 'learning_rate': 1.4651533384522818e-05, 'epoch': 0.73} {'loss': 0.3797, 'learning_rate': 1.4651235964357148e-05, 'epoch': 0.73} {'loss': 0.5725, 'learning_rate': 1.465093853894112e-05, 'epoch': 0.73} {'loss': 0.618, 'learning_rate': 1.4650641108275068e-05, 'epoch': 0.73} {'loss': 0.5571, 'learning_rate': 1.4650343672359323e-05, 'epoch': 0.73} {'loss': 0.6223, 'learning_rate': 1.4650046231194226e-05, 'epoch': 0.73} {'loss': 0.6045, 'learning_rate': 1.4649748784780111e-05, 'epoch': 0.73} {'loss': 0.5525, 'learning_rate': 1.4649451333117315e-05, 'epoch': 0.73} {'loss': 0.5868, 'learning_rate': 1.4649153876206173e-05, 'epoch': 0.73} {'loss': 0.6434, 'learning_rate': 1.4648856414047017e-05, 'epoch': 0.73} {'loss': 0.4873, 'learning_rate': 1.4648558946640187e-05, 'epoch': 0.73} {'loss': 0.515, 'learning_rate': 1.4648261473986019e-05, 'epoch': 0.73} {'loss': 0.5301, 'learning_rate': 1.4647963996084849e-05, 'epoch': 0.73} {'loss': 0.592, 'learning_rate': 1.4647666512937009e-05, 'epoch': 0.73} {'loss': 0.6199, 'learning_rate': 1.4647369024542837e-05, 'epoch': 0.73} {'loss': 0.4339, 'learning_rate': 1.464707153090267e-05, 'epoch': 0.73} {'loss': 0.5764, 'learning_rate': 1.4646774032016843e-05, 'epoch': 0.73} {'loss': 0.5961, 'learning_rate': 1.4646476527885694e-05, 'epoch': 0.73} {'loss': 0.4443, 'learning_rate': 1.4646179018509555e-05, 'epoch': 0.73} {'loss': 0.4279, 'learning_rate': 1.4645881503888761e-05, 'epoch': 0.73} {'loss': 0.4129, 'learning_rate': 1.4645583984023655e-05, 'epoch': 0.73} {'loss': 0.5684, 'learning_rate': 1.4645286458914565e-05, 'epoch': 0.73} {'loss': 0.4516, 'learning_rate': 1.464498892856183e-05, 'epoch': 0.73} {'loss': 0.6403, 'learning_rate': 1.4644691392965787e-05, 'epoch': 0.73} {'loss': 0.6147, 'learning_rate': 1.4644393852126769e-05, 'epoch': 0.73} {'loss': 0.5613, 'learning_rate': 1.4644096306045115e-05, 'epoch': 0.73} {'loss': 0.429, 'learning_rate': 1.4643798754721157e-05, 'epoch': 0.73} {'loss': 0.5122, 'learning_rate': 1.4643501198155234e-05, 'epoch': 0.73} {'loss': 0.5502, 'learning_rate': 1.4643203636347683e-05, 'epoch': 0.73} {'loss': 0.6077, 'learning_rate': 1.4642906069298837e-05, 'epoch': 0.73} {'loss': 0.5672, 'learning_rate': 1.4642608497009033e-05, 'epoch': 0.73} {'loss': 0.7105, 'learning_rate': 1.4642310919478606e-05, 'epoch': 0.73} {'loss': 0.5038, 'learning_rate': 1.4642013336707894e-05, 'epoch': 0.73} {'loss': 0.4667, 'learning_rate': 1.4641715748697232e-05, 'epoch': 0.73} {'loss': 0.4639, 'learning_rate': 1.4641418155446954e-05, 'epoch': 0.73} {'loss': 0.4748, 'learning_rate': 1.4641120556957398e-05, 'epoch': 0.73} {'loss': 0.5272, 'learning_rate': 1.4640822953228899e-05, 'epoch': 0.73} {'loss': 0.5942, 'learning_rate': 1.4640525344261796e-05, 'epoch': 0.73} {'loss': 0.5863, 'learning_rate': 1.4640227730056418e-05, 'epoch': 0.73} {'loss': 0.7625, 'learning_rate': 1.463993011061311e-05, 'epoch': 0.73} {'loss': 0.5958, 'learning_rate': 1.46396324859322e-05, 'epoch': 0.73} {'loss': 0.5625, 'learning_rate': 1.4639334856014028e-05, 'epoch': 0.73} {'loss': 0.642, 'learning_rate': 1.463903722085893e-05, 'epoch': 0.73} {'loss': 0.5895, 'learning_rate': 1.4638739580467241e-05, 'epoch': 0.73} {'loss': 0.577, 'learning_rate': 1.4638441934839295e-05, 'epoch': 0.73} {'loss': 0.6108, 'learning_rate': 1.4638144283975432e-05, 'epoch': 0.73} {'loss': 0.6449, 'learning_rate': 1.4637846627875986e-05, 'epoch': 0.73} {'loss': 0.3343, 'learning_rate': 1.4637548966541293e-05, 'epoch': 0.73} {'loss': 0.5519, 'learning_rate': 1.463725129997169e-05, 'epoch': 0.73} {'loss': 0.6063, 'learning_rate': 1.463695362816751e-05, 'epoch': 0.73} {'loss': 0.4581, 'learning_rate': 1.4636655951129094e-05, 'epoch': 0.73} {'loss': 0.6613, 'learning_rate': 1.4636358268856771e-05, 'epoch': 0.73} {'loss': 0.3905, 'learning_rate': 1.4636060581350885e-05, 'epoch': 0.73} {'loss': 0.5399, 'learning_rate': 1.4635762888611766e-05, 'epoch': 0.73} {'loss': 0.4419, 'learning_rate': 1.463546519063975e-05, 'epoch': 0.73} {'loss': 0.5497, 'learning_rate': 1.463516748743518e-05, 'epoch': 0.73} {'loss': 0.474, 'learning_rate': 1.4634869778998386e-05, 'epoch': 0.73} {'loss': 0.6809, 'learning_rate': 1.4634572065329707e-05, 'epoch': 0.73} {'loss': 0.4767, 'learning_rate': 1.4634274346429474e-05, 'epoch': 0.73} {'loss': 0.4636, 'learning_rate': 1.4633976622298027e-05, 'epoch': 0.73} {'loss': 0.5732, 'learning_rate': 1.4633678892935704e-05, 'epoch': 0.73} {'loss': 0.4633, 'learning_rate': 1.4633381158342834e-05, 'epoch': 0.73} {'loss': 0.625, 'learning_rate': 1.4633083418519763e-05, 'epoch': 0.73} {'loss': 0.6252, 'learning_rate': 1.4632785673466818e-05, 'epoch': 0.73} {'loss': 0.5633, 'learning_rate': 1.4632487923184342e-05, 'epoch': 0.73} {'loss': 0.6536, 'learning_rate': 1.4632190167672667e-05, 'epoch': 0.73} {'loss': 0.4712, 'learning_rate': 1.4631892406932129e-05, 'epoch': 0.73} {'loss': 0.722, 'learning_rate': 1.4631594640963064e-05, 'epoch': 0.73} {'loss': 0.65, 'learning_rate': 1.4631296869765811e-05, 'epoch': 0.73} {'loss': 0.5499, 'learning_rate': 1.4630999093340705e-05, 'epoch': 0.73} {'loss': 0.4469, 'learning_rate': 1.4630701311688085e-05, 'epoch': 0.73} {'loss': 0.4748, 'learning_rate': 1.4630403524808281e-05, 'epoch': 0.73} {'loss': 0.616, 'learning_rate': 1.4630105732701629e-05, 'epoch': 0.73} {'loss': 0.6896, 'learning_rate': 1.4629807935368473e-05, 'epoch': 0.73} {'loss': 0.6035, 'learning_rate': 1.4629510132809139e-05, 'epoch': 0.73} {'loss': 0.6892, 'learning_rate': 1.4629212325023972e-05, 'epoch': 0.73} {'loss': 0.6202, 'learning_rate': 1.4628914512013303e-05, 'epoch': 0.73} {'loss': 0.5013, 'learning_rate': 1.4628616693777472e-05, 'epoch': 0.73} {'loss': 0.6962, 'learning_rate': 1.4628318870316808e-05, 'epoch': 0.73} {'loss': 0.5064, 'learning_rate': 1.4628021041631658e-05, 'epoch': 0.73} {'loss': 0.4729, 'learning_rate': 1.4627723207722349e-05, 'epoch': 0.73} {'loss': 0.6514, 'learning_rate': 1.4627425368589221e-05, 'epoch': 0.73} {'loss': 0.5873, 'learning_rate': 1.462712752423261e-05, 'epoch': 0.73} {'loss': 0.531, 'learning_rate': 1.462682967465285e-05, 'epoch': 0.73} {'loss': 0.4922, 'learning_rate': 1.462653181985028e-05, 'epoch': 0.73} {'loss': 0.5598, 'learning_rate': 1.4626233959825238e-05, 'epoch': 0.73} {'loss': 0.5367, 'learning_rate': 1.4625936094578054e-05, 'epoch': 0.73} {'loss': 0.5585, 'learning_rate': 1.4625638224109072e-05, 'epoch': 0.73} {'loss': 0.5048, 'learning_rate': 1.462534034841862e-05, 'epoch': 0.73} {'loss': 0.5239, 'learning_rate': 1.462504246750704e-05, 'epoch': 0.73} {'loss': 0.5244, 'learning_rate': 1.4624744581374666e-05, 'epoch': 0.73} {'loss': 0.5744, 'learning_rate': 1.4624446690021836e-05, 'epoch': 0.73} {'loss': 0.4816, 'learning_rate': 1.4624148793448885e-05, 'epoch': 0.73} {'loss': 0.546, 'learning_rate': 1.4623850891656148e-05, 'epoch': 0.73} {'loss': 0.454, 'learning_rate': 1.4623552984643965e-05, 'epoch': 0.73} {'loss': 0.7363, 'learning_rate': 1.4623255072412668e-05, 'epoch': 0.73} {'loss': 0.5717, 'learning_rate': 1.4622957154962595e-05, 'epoch': 0.73} {'loss': 0.5484, 'learning_rate': 1.4622659232294082e-05, 'epoch': 0.73} {'loss': 0.6044, 'learning_rate': 1.4622361304407467e-05, 'epoch': 0.73} {'loss': 0.6231, 'learning_rate': 1.4622063371303087e-05, 'epoch': 0.73} {'loss': 0.547, 'learning_rate': 1.4621765432981273e-05, 'epoch': 0.73} {'loss': 0.4862, 'learning_rate': 1.4621467489442364e-05, 'epoch': 0.73} {'loss': 0.6625, 'learning_rate': 1.4621169540686699e-05, 'epoch': 0.73} {'loss': 0.4875, 'learning_rate': 1.4620871586714613e-05, 'epoch': 0.73} {'loss': 0.6512, 'learning_rate': 1.4620573627526439e-05, 'epoch': 0.73} {'loss': 0.4582, 'learning_rate': 1.4620275663122519e-05, 'epoch': 0.73} {'loss': 0.6278, 'learning_rate': 1.4619977693503187e-05, 'epoch': 0.73} {'loss': 0.4903, 'learning_rate': 1.4619679718668778e-05, 'epoch': 0.73} {'loss': 0.5282, 'learning_rate': 1.4619381738619627e-05, 'epoch': 0.73} {'loss': 0.4928, 'learning_rate': 1.4619083753356074e-05, 'epoch': 0.73} {'loss': 0.6197, 'learning_rate': 1.461878576287845e-05, 'epoch': 0.73} {'loss': 0.6907, 'learning_rate': 1.4618487767187102e-05, 'epoch': 0.73} {'loss': 0.5894, 'learning_rate': 1.4618189766282354e-05, 'epoch': 0.73} {'loss': 0.6336, 'learning_rate': 1.4617891760164548e-05, 'epoch': 0.74} {'loss': 0.4855, 'learning_rate': 1.4617593748834025e-05, 'epoch': 0.74} {'loss': 0.6043, 'learning_rate': 1.4617295732291112e-05, 'epoch': 0.74} {'loss': 0.5782, 'learning_rate': 1.4616997710536154e-05, 'epoch': 0.74} {'loss': 0.7181, 'learning_rate': 1.4616699683569482e-05, 'epoch': 0.74} {'loss': 0.5629, 'learning_rate': 1.4616401651391432e-05, 'epoch': 0.74} {'loss': 0.674, 'learning_rate': 1.4616103614002346e-05, 'epoch': 0.74} {'loss': 0.5843, 'learning_rate': 1.4615805571402555e-05, 'epoch': 0.74} {'loss': 0.553, 'learning_rate': 1.4615507523592397e-05, 'epoch': 0.74} {'loss': 0.5241, 'learning_rate': 1.461520947057221e-05, 'epoch': 0.74} {'loss': 0.6106, 'learning_rate': 1.4614911412342325e-05, 'epoch': 0.74} {'loss': 0.5925, 'learning_rate': 1.4614613348903086e-05, 'epoch': 0.74} {'loss': 0.6563, 'learning_rate': 1.4614315280254824e-05, 'epoch': 0.74} {'loss': 0.6942, 'learning_rate': 1.461401720639788e-05, 'epoch': 0.74} {'loss': 0.5881, 'learning_rate': 1.4613719127332587e-05, 'epoch': 0.74} {'loss': 0.5698, 'learning_rate': 1.4613421043059281e-05, 'epoch': 0.74} {'loss': 0.4611, 'learning_rate': 1.4613122953578302e-05, 'epoch': 0.74} {'loss': 0.5785, 'learning_rate': 1.4612824858889985e-05, 'epoch': 0.74} {'loss': 0.5618, 'learning_rate': 1.4612526758994662e-05, 'epoch': 0.74} {'loss': 0.652, 'learning_rate': 1.4612228653892678e-05, 'epoch': 0.74} {'loss': 0.5171, 'learning_rate': 1.4611930543584363e-05, 'epoch': 0.74} {'loss': 0.5377, 'learning_rate': 1.4611632428070055e-05, 'epoch': 0.74} {'loss': 0.6031, 'learning_rate': 1.461133430735009e-05, 'epoch': 0.74} {'loss': 0.6381, 'learning_rate': 1.461103618142481e-05, 'epoch': 0.74} {'loss': 0.6723, 'learning_rate': 1.4610738050294542e-05, 'epoch': 0.74} {'loss': 0.5395, 'learning_rate': 1.461043991395963e-05, 'epoch': 0.74} {'loss': 0.6506, 'learning_rate': 1.4610141772420405e-05, 'epoch': 0.74} {'loss': 0.4595, 'learning_rate': 1.4609843625677208e-05, 'epoch': 0.74} {'loss': 0.5621, 'learning_rate': 1.4609545473730378e-05, 'epoch': 0.74} {'loss': 0.6373, 'learning_rate': 1.4609247316580244e-05, 'epoch': 0.74} {'loss': 0.5491, 'learning_rate': 1.4608949154227148e-05, 'epoch': 0.74} {'loss': 0.5898, 'learning_rate': 1.4608650986671424e-05, 'epoch': 0.74} {'loss': 0.6259, 'learning_rate': 1.460835281391341e-05, 'epoch': 0.74} {'loss': 0.5015, 'learning_rate': 1.4608054635953439e-05, 'epoch': 0.74} {'loss': 0.5743, 'learning_rate': 1.4607756452791852e-05, 'epoch': 0.74} {'loss': 0.6675, 'learning_rate': 1.4607458264428987e-05, 'epoch': 0.74} {'loss': 0.4872, 'learning_rate': 1.4607160070865174e-05, 'epoch': 0.74} {'loss': 0.7082, 'learning_rate': 1.4606861872100754e-05, 'epoch': 0.74} {'loss': 0.5648, 'learning_rate': 1.4606563668136067e-05, 'epoch': 0.74} {'loss': 0.5399, 'learning_rate': 1.4606265458971442e-05, 'epoch': 0.74} {'loss': 0.3712, 'learning_rate': 1.460596724460722e-05, 'epoch': 0.74} {'loss': 0.6901, 'learning_rate': 1.4605669025043735e-05, 'epoch': 0.74} {'loss': 0.4521, 'learning_rate': 1.4605370800281328e-05, 'epoch': 0.74} {'loss': 0.5673, 'learning_rate': 1.4605072570320336e-05, 'epoch': 0.74} {'loss': 0.6167, 'learning_rate': 1.4604774335161086e-05, 'epoch': 0.74} {'loss': 0.5006, 'learning_rate': 1.4604476094803925e-05, 'epoch': 0.74} {'loss': 0.6631, 'learning_rate': 1.4604177849249186e-05, 'epoch': 0.74} {'loss': 0.5496, 'learning_rate': 1.4603879598497206e-05, 'epoch': 0.74} {'loss': 0.5525, 'learning_rate': 1.4603581342548321e-05, 'epoch': 0.74} {'loss': 0.4587, 'learning_rate': 1.4603283081402868e-05, 'epoch': 0.74} {'loss': 0.5578, 'learning_rate': 1.4602984815061182e-05, 'epoch': 0.74} {'loss': 0.5083, 'learning_rate': 1.4602686543523604e-05, 'epoch': 0.74} {'loss': 0.5814, 'learning_rate': 1.4602388266790465e-05, 'epoch': 0.74} {'loss': 0.5795, 'learning_rate': 1.460208998486211e-05, 'epoch': 0.74} {'loss': 0.4401, 'learning_rate': 1.4601791697738867e-05, 'epoch': 0.74} {'loss': 0.5968, 'learning_rate': 1.4601493405421075e-05, 'epoch': 0.74} {'loss': 0.7063, 'learning_rate': 1.4601195107909077e-05, 'epoch': 0.74} {'loss': 0.4912, 'learning_rate': 1.4600896805203201e-05, 'epoch': 0.74} {'loss': 0.6899, 'learning_rate': 1.4600598497303789e-05, 'epoch': 0.74} {'loss': 0.592, 'learning_rate': 1.4600300184211173e-05, 'epoch': 0.74} {'loss': 0.5357, 'learning_rate': 1.4600001865925695e-05, 'epoch': 0.74} {'loss': 0.6883, 'learning_rate': 1.4599703542447689e-05, 'epoch': 0.74} {'loss': 0.5052, 'learning_rate': 1.4599405213777494e-05, 'epoch': 0.74} {'loss': 0.6708, 'learning_rate': 1.4599106879915444e-05, 'epoch': 0.74} {'loss': 0.4071, 'learning_rate': 1.4598808540861875e-05, 'epoch': 0.74} {'loss': 0.4454, 'learning_rate': 1.4598510196617128e-05, 'epoch': 0.74} {'loss': 0.4154, 'learning_rate': 1.4598211847181536e-05, 'epoch': 0.74} {'loss': 0.6565, 'learning_rate': 1.4597913492555437e-05, 'epoch': 0.74} {'loss': 0.4498, 'learning_rate': 1.4597615132739172e-05, 'epoch': 0.74} {'loss': 0.622, 'learning_rate': 1.459731676773307e-05, 'epoch': 0.74} {'loss': 0.4302, 'learning_rate': 1.4597018397537472e-05, 'epoch': 0.74} {'loss': 0.7664, 'learning_rate': 1.4596720022152715e-05, 'epoch': 0.74} {'loss': 0.6529, 'learning_rate': 1.4596421641579135e-05, 'epoch': 0.74} {'loss': 0.6623, 'learning_rate': 1.459612325581707e-05, 'epoch': 0.74} {'loss': 0.5607, 'learning_rate': 1.4595824864866854e-05, 'epoch': 0.74} {'loss': 0.531, 'learning_rate': 1.4595526468728826e-05, 'epoch': 0.74} {'loss': 0.749, 'learning_rate': 1.4595228067403325e-05, 'epoch': 0.74} {'loss': 0.5762, 'learning_rate': 1.4594929660890682e-05, 'epoch': 0.74} {'loss': 0.6839, 'learning_rate': 1.4594631249191237e-05, 'epoch': 0.74} {'loss': 0.5143, 'learning_rate': 1.459433283230533e-05, 'epoch': 0.74} {'loss': 0.5294, 'learning_rate': 1.4594034410233295e-05, 'epoch': 0.74} {'loss': 0.5294, 'learning_rate': 1.4593735982975467e-05, 'epoch': 0.74} {'loss': 0.4402, 'learning_rate': 1.4593437550532186e-05, 'epoch': 0.74} {'loss': 0.465, 'learning_rate': 1.4593139112903787e-05, 'epoch': 0.74} {'loss': 0.5413, 'learning_rate': 1.4592840670090605e-05, 'epoch': 0.74} {'loss': 0.4244, 'learning_rate': 1.4592542222092982e-05, 'epoch': 0.74} {'loss': 0.5087, 'learning_rate': 1.459224376891125e-05, 'epoch': 0.74} {'loss': 0.5587, 'learning_rate': 1.459194531054575e-05, 'epoch': 0.74} {'loss': 0.6426, 'learning_rate': 1.4591646846996816e-05, 'epoch': 0.74} {'loss': 0.4935, 'learning_rate': 1.4591348378264787e-05, 'epoch': 0.74} {'loss': 0.5193, 'learning_rate': 1.4591049904349997e-05, 'epoch': 0.74} {'loss': 0.6491, 'learning_rate': 1.4590751425252785e-05, 'epoch': 0.74} {'loss': 0.6158, 'learning_rate': 1.4590452940973488e-05, 'epoch': 0.74} {'loss': 0.4751, 'learning_rate': 1.4590154451512444e-05, 'epoch': 0.74} {'loss': 0.6813, 'learning_rate': 1.4589855956869987e-05, 'epoch': 0.74} {'loss': 0.6567, 'learning_rate': 1.4589557457046457e-05, 'epoch': 0.74} {'loss': 0.4968, 'learning_rate': 1.4589258952042186e-05, 'epoch': 0.74} {'loss': 0.5681, 'learning_rate': 1.4588960441857518e-05, 'epoch': 0.74} {'loss': 0.5277, 'learning_rate': 1.4588661926492784e-05, 'epoch': 0.74} {'loss': 0.6466, 'learning_rate': 1.4588363405948322e-05, 'epoch': 0.74} {'loss': 0.521, 'learning_rate': 1.4588064880224474e-05, 'epoch': 0.74} {'loss': 0.5425, 'learning_rate': 1.4587766349321571e-05, 'epoch': 0.74} {'loss': 0.5823, 'learning_rate': 1.458746781323995e-05, 'epoch': 0.74} {'loss': 0.6403, 'learning_rate': 1.4587169271979953e-05, 'epoch': 0.74} {'loss': 0.6221, 'learning_rate': 1.4586870725541914e-05, 'epoch': 0.74} {'loss': 0.3959, 'learning_rate': 1.458657217392617e-05, 'epoch': 0.74} {'loss': 0.7831, 'learning_rate': 1.458627361713306e-05, 'epoch': 0.74} {'loss': 0.4671, 'learning_rate': 1.4585975055162918e-05, 'epoch': 0.74} {'loss': 0.6103, 'learning_rate': 1.458567648801608e-05, 'epoch': 0.74} {'loss': 0.5804, 'learning_rate': 1.4585377915692889e-05, 'epoch': 0.74} {'loss': 0.6811, 'learning_rate': 1.4585079338193675e-05, 'epoch': 0.74} {'loss': 0.689, 'learning_rate': 1.458478075551878e-05, 'epoch': 0.74} {'loss': 0.674, 'learning_rate': 1.4584482167668539e-05, 'epoch': 0.74} {'loss': 0.579, 'learning_rate': 1.458418357464329e-05, 'epoch': 0.74} {'loss': 0.561, 'learning_rate': 1.4583884976443368e-05, 'epoch': 0.74} {'loss': 0.5361, 'learning_rate': 1.4583586373069111e-05, 'epoch': 0.74} {'loss': 0.471, 'learning_rate': 1.4583287764520857e-05, 'epoch': 0.74} {'loss': 0.5431, 'learning_rate': 1.4582989150798943e-05, 'epoch': 0.74} {'loss': 0.5748, 'learning_rate': 1.4582690531903707e-05, 'epoch': 0.74} {'loss': 0.447, 'learning_rate': 1.4582391907835484e-05, 'epoch': 0.74} {'loss': 0.5782, 'learning_rate': 1.4582093278594611e-05, 'epoch': 0.74} {'loss': 0.4351, 'learning_rate': 1.4581794644181428e-05, 'epoch': 0.74} {'loss': 0.4161, 'learning_rate': 1.458149600459627e-05, 'epoch': 0.74} {'loss': 0.6456, 'learning_rate': 1.4581197359839471e-05, 'epoch': 0.74} {'loss': 0.7065, 'learning_rate': 1.4580898709911375e-05, 'epoch': 0.74} {'loss': 0.5817, 'learning_rate': 1.4580600054812312e-05, 'epoch': 0.74} {'loss': 0.4805, 'learning_rate': 1.4580301394542627e-05, 'epoch': 0.74} {'loss': 0.6907, 'learning_rate': 1.4580002729102649e-05, 'epoch': 0.74} {'loss': 0.6974, 'learning_rate': 1.457970405849272e-05, 'epoch': 0.74} {'loss': 0.4989, 'learning_rate': 1.4579405382713179e-05, 'epoch': 0.74} {'loss': 0.5544, 'learning_rate': 1.4579106701764358e-05, 'epoch': 0.74} {'loss': 0.6451, 'learning_rate': 1.4578808015646594e-05, 'epoch': 0.74} {'loss': 0.5929, 'learning_rate': 1.4578509324360228e-05, 'epoch': 0.74} {'loss': 0.6401, 'learning_rate': 1.4578210627905596e-05, 'epoch': 0.74} {'loss': 0.6874, 'learning_rate': 1.4577911926283035e-05, 'epoch': 0.74} {'loss': 0.5514, 'learning_rate': 1.457761321949288e-05, 'epoch': 0.74} {'loss': 0.5297, 'learning_rate': 1.4577314507535474e-05, 'epoch': 0.74} {'loss': 0.4115, 'learning_rate': 1.4577015790411147e-05, 'epoch': 0.74} {'loss': 0.5275, 'learning_rate': 1.4576717068120242e-05, 'epoch': 0.74} {'loss': 0.5917, 'learning_rate': 1.457641834066309e-05, 'epoch': 0.74} {'loss': 0.5167, 'learning_rate': 1.4576119608040036e-05, 'epoch': 0.74} {'loss': 0.4736, 'learning_rate': 1.457582087025141e-05, 'epoch': 0.74} {'loss': 0.6739, 'learning_rate': 1.4575522127297554e-05, 'epoch': 0.74} {'loss': 0.6514, 'learning_rate': 1.4575223379178805e-05, 'epoch': 0.74} {'loss': 0.6956, 'learning_rate': 1.4574924625895497e-05, 'epoch': 0.74} {'loss': 0.4646, 'learning_rate': 1.4574625867447969e-05, 'epoch': 0.74} {'loss': 0.5378, 'learning_rate': 1.4574327103836559e-05, 'epoch': 0.74} {'loss': 0.5528, 'learning_rate': 1.4574028335061604e-05, 'epoch': 0.74} {'loss': 0.6096, 'learning_rate': 1.4573729561123437e-05, 'epoch': 0.74} {'loss': 0.6428, 'learning_rate': 1.4573430782022402e-05, 'epoch': 0.74} {'loss': 0.5749, 'learning_rate': 1.4573131997758834e-05, 'epoch': 0.74} {'loss': 0.6488, 'learning_rate': 1.4572833208333068e-05, 'epoch': 0.74} {'loss': 0.6825, 'learning_rate': 1.4572534413745443e-05, 'epoch': 0.74} {'loss': 0.5225, 'learning_rate': 1.4572235613996297e-05, 'epoch': 0.74} {'loss': 0.6032, 'learning_rate': 1.4571936809085966e-05, 'epoch': 0.74} {'loss': 0.5452, 'learning_rate': 1.4571637999014792e-05, 'epoch': 0.74} {'loss': 0.497, 'learning_rate': 1.4571339183783102e-05, 'epoch': 0.74} {'loss': 0.6647, 'learning_rate': 1.4571040363391242e-05, 'epoch': 0.74} {'loss': 0.5657, 'learning_rate': 1.4570741537839546e-05, 'epoch': 0.74} {'loss': 0.6851, 'learning_rate': 1.4570442707128351e-05, 'epoch': 0.74} {'loss': 0.5311, 'learning_rate': 1.4570143871257999e-05, 'epoch': 0.74} {'loss': 0.5328, 'learning_rate': 1.4569845030228819e-05, 'epoch': 0.74} {'loss': 0.6933, 'learning_rate': 1.4569546184041155e-05, 'epoch': 0.74} {'loss': 0.647, 'learning_rate': 1.4569247332695342e-05, 'epoch': 0.74} {'loss': 0.5002, 'learning_rate': 1.4568948476191718e-05, 'epoch': 0.74} {'loss': 0.5987, 'learning_rate': 1.4568649614530618e-05, 'epoch': 0.74} {'loss': 0.4699, 'learning_rate': 1.4568350747712386e-05, 'epoch': 0.74} {'loss': 0.5143, 'learning_rate': 1.456805187573735e-05, 'epoch': 0.74} {'loss': 0.6664, 'learning_rate': 1.4567752998605853e-05, 'epoch': 0.74} {'loss': 0.3846, 'learning_rate': 1.4567454116318234e-05, 'epoch': 0.74} {'loss': 0.5212, 'learning_rate': 1.4567155228874825e-05, 'epoch': 0.74} {'loss': 0.5952, 'learning_rate': 1.4566856336275967e-05, 'epoch': 0.74} {'loss': 0.6634, 'learning_rate': 1.4566557438521997e-05, 'epoch': 0.74} {'loss': 0.5349, 'learning_rate': 1.4566258535613254e-05, 'epoch': 0.74} {'loss': 0.5824, 'learning_rate': 1.456595962755007e-05, 'epoch': 0.74} {'loss': 0.4454, 'learning_rate': 1.4565660714332787e-05, 'epoch': 0.74} {'loss': 0.5674, 'learning_rate': 1.4565361795961744e-05, 'epoch': 0.74} {'loss': 0.7805, 'learning_rate': 1.4565062872437273e-05, 'epoch': 0.74} {'loss': 0.3895, 'learning_rate': 1.4564763943759714e-05, 'epoch': 0.74} {'loss': 0.7518, 'learning_rate': 1.4564465009929407e-05, 'epoch': 0.74} {'loss': 0.5796, 'learning_rate': 1.4564166070946684e-05, 'epoch': 0.74} {'loss': 0.6972, 'learning_rate': 1.4563867126811885e-05, 'epoch': 0.74} {'loss': 0.5513, 'learning_rate': 1.4563568177525351e-05, 'epoch': 0.74} {'loss': 0.4459, 'learning_rate': 1.4563269223087413e-05, 'epoch': 0.74} {'loss': 0.5235, 'learning_rate': 1.4562970263498415e-05, 'epoch': 0.74} {'loss': 0.4593, 'learning_rate': 1.4562671298758688e-05, 'epoch': 0.74} {'loss': 0.4928, 'learning_rate': 1.4562372328868575e-05, 'epoch': 0.74} {'loss': 0.7535, 'learning_rate': 1.456207335382841e-05, 'epoch': 0.74} {'loss': 0.5731, 'learning_rate': 1.4561774373638533e-05, 'epoch': 0.74} {'loss': 0.486, 'learning_rate': 1.4561475388299279e-05, 'epoch': 0.74} {'loss': 0.6642, 'learning_rate': 1.4561176397810987e-05, 'epoch': 0.74} {'loss': 0.5703, 'learning_rate': 1.4560877402173995e-05, 'epoch': 0.74} {'loss': 0.7319, 'learning_rate': 1.4560578401388641e-05, 'epoch': 0.74} {'loss': 0.3832, 'learning_rate': 1.4560279395455259e-05, 'epoch': 0.74} {'loss': 0.4565, 'learning_rate': 1.4559980384374188e-05, 'epoch': 0.74} {'loss': 0.5441, 'learning_rate': 1.4559681368145767e-05, 'epoch': 0.74} {'loss': 0.3693, 'learning_rate': 1.4559382346770334e-05, 'epoch': 0.74} {'loss': 0.6424, 'learning_rate': 1.4559083320248224e-05, 'epoch': 0.74} {'loss': 0.6018, 'learning_rate': 1.4558784288579776e-05, 'epoch': 0.74} {'loss': 0.6344, 'learning_rate': 1.4558485251765328e-05, 'epoch': 0.74} {'loss': 0.6908, 'learning_rate': 1.4558186209805217e-05, 'epoch': 0.74} {'loss': 0.4788, 'learning_rate': 1.455788716269978e-05, 'epoch': 0.74} {'loss': 0.6795, 'learning_rate': 1.4557588110449357e-05, 'epoch': 0.74} {'loss': 0.6143, 'learning_rate': 1.455728905305428e-05, 'epoch': 0.74} {'loss': 0.6239, 'learning_rate': 1.4556989990514892e-05, 'epoch': 0.74} {'loss': 0.4718, 'learning_rate': 1.455669092283153e-05, 'epoch': 0.74} {'loss': 0.555, 'learning_rate': 1.4556391850004532e-05, 'epoch': 0.74} {'loss': 0.6316, 'learning_rate': 1.4556092772034232e-05, 'epoch': 0.74} {'loss': 0.4288, 'learning_rate': 1.4555793688920968e-05, 'epoch': 0.74} {'loss': 0.6369, 'learning_rate': 1.4555494600665082e-05, 'epoch': 0.74} {'loss': 0.5022, 'learning_rate': 1.4555195507266906e-05, 'epoch': 0.74} {'loss': 0.5052, 'learning_rate': 1.4554896408726781e-05, 'epoch': 0.74} {'loss': 0.7137, 'learning_rate': 1.4554597305045046e-05, 'epoch': 0.74} {'loss': 0.5844, 'learning_rate': 1.4554298196222037e-05, 'epoch': 0.74} {'loss': 0.6261, 'learning_rate': 1.4553999082258087e-05, 'epoch': 0.74} {'loss': 0.4913, 'learning_rate': 1.4553699963153543e-05, 'epoch': 0.74} {'loss': 0.3692, 'learning_rate': 1.4553400838908736e-05, 'epoch': 0.74} {'loss': 0.5908, 'learning_rate': 1.4553101709524005e-05, 'epoch': 0.74} {'loss': 0.4899, 'learning_rate': 1.4552802574999688e-05, 'epoch': 0.74} {'loss': 0.5775, 'learning_rate': 1.4552503435336122e-05, 'epoch': 0.74} {'loss': 0.4934, 'learning_rate': 1.4552204290533646e-05, 'epoch': 0.74} {'loss': 0.4296, 'learning_rate': 1.4551905140592598e-05, 'epoch': 0.74} {'loss': 0.6347, 'learning_rate': 1.4551605985513314e-05, 'epoch': 0.74} {'loss': 0.5503, 'learning_rate': 1.4551306825296129e-05, 'epoch': 0.74} {'loss': 0.4611, 'learning_rate': 1.455100765994139e-05, 'epoch': 0.74} {'loss': 0.5614, 'learning_rate': 1.4550708489449425e-05, 'epoch': 0.74} {'loss': 0.5738, 'learning_rate': 1.4550409313820577e-05, 'epoch': 0.74} {'loss': 0.6322, 'learning_rate': 1.455011013305518e-05, 'epoch': 0.74} {'loss': 0.6453, 'learning_rate': 1.4549810947153575e-05, 'epoch': 0.74} {'loss': 0.6036, 'learning_rate': 1.4549511756116102e-05, 'epoch': 0.74} {'loss': 0.5296, 'learning_rate': 1.4549212559943094e-05, 'epoch': 0.74} {'loss': 0.6257, 'learning_rate': 1.4548913358634886e-05, 'epoch': 0.74} {'loss': 0.6224, 'learning_rate': 1.4548614152191824e-05, 'epoch': 0.74} {'loss': 0.5894, 'learning_rate': 1.454831494061424e-05, 'epoch': 0.74} {'loss': 0.4901, 'learning_rate': 1.4548015723902473e-05, 'epoch': 0.74} {'loss': 0.5697, 'learning_rate': 1.4547716502056862e-05, 'epoch': 0.74} {'loss': 0.4699, 'learning_rate': 1.4547417275077741e-05, 'epoch': 0.74} {'loss': 0.5614, 'learning_rate': 1.4547118042965456e-05, 'epoch': 0.74} {'loss': 0.4122, 'learning_rate': 1.4546818805720335e-05, 'epoch': 0.74} {'loss': 0.5444, 'learning_rate': 1.454651956334272e-05, 'epoch': 0.74} {'loss': 0.4389, 'learning_rate': 1.4546220315832953e-05, 'epoch': 0.74} {'loss': 0.5596, 'learning_rate': 1.4545921063191363e-05, 'epoch': 0.74} {'loss': 0.5676, 'learning_rate': 1.4545621805418297e-05, 'epoch': 0.74} {'loss': 0.6799, 'learning_rate': 1.4545322542514087e-05, 'epoch': 0.74} {'loss': 0.6913, 'learning_rate': 1.4545023274479072e-05, 'epoch': 0.74} {'loss': 0.5241, 'learning_rate': 1.4544724001313588e-05, 'epoch': 0.74} {'loss': 0.6753, 'learning_rate': 1.4544424723017976e-05, 'epoch': 0.74} {'loss': 0.7764, 'learning_rate': 1.4544125439592573e-05, 'epoch': 0.74} {'loss': 0.6112, 'learning_rate': 1.4543826151037717e-05, 'epoch': 0.74} {'loss': 0.4279, 'learning_rate': 1.4543526857353744e-05, 'epoch': 0.74} {'loss': 0.5111, 'learning_rate': 1.4543227558540993e-05, 'epoch': 0.74} {'loss': 0.4438, 'learning_rate': 1.4542928254599804e-05, 'epoch': 0.74} {'loss': 0.4682, 'learning_rate': 1.4542628945530513e-05, 'epoch': 0.74} {'loss': 0.6219, 'learning_rate': 1.4542329631333453e-05, 'epoch': 0.74} {'loss': 0.6314, 'learning_rate': 1.4542030312008971e-05, 'epoch': 0.74} {'loss': 0.5176, 'learning_rate': 1.4541730987557403e-05, 'epoch': 0.74} {'loss': 0.516, 'learning_rate': 1.4541431657979082e-05, 'epoch': 0.74} {'loss': 0.5394, 'learning_rate': 1.4541132323274346e-05, 'epoch': 0.74} {'loss': 0.5515, 'learning_rate': 1.4540832983443537e-05, 'epoch': 0.74} {'loss': 0.7587, 'learning_rate': 1.4540533638486989e-05, 'epoch': 0.74} {'loss': 0.5284, 'learning_rate': 1.4540234288405044e-05, 'epoch': 0.74} {'loss': 0.5233, 'learning_rate': 1.4539934933198037e-05, 'epoch': 0.74} {'loss': 0.5294, 'learning_rate': 1.4539635572866307e-05, 'epoch': 0.74} {'loss': 0.6647, 'learning_rate': 1.4539336207410191e-05, 'epoch': 0.74} {'loss': 0.5466, 'learning_rate': 1.4539036836830026e-05, 'epoch': 0.74} {'loss': 0.7715, 'learning_rate': 1.4538737461126156e-05, 'epoch': 0.74} {'loss': 0.6457, 'learning_rate': 1.4538438080298912e-05, 'epoch': 0.74} {'loss': 0.5101, 'learning_rate': 1.4538138694348634e-05, 'epoch': 0.74} {'loss': 0.5653, 'learning_rate': 1.4537839303275663e-05, 'epoch': 0.74} {'loss': 0.7361, 'learning_rate': 1.4537539907080332e-05, 'epoch': 0.74} {'loss': 0.4962, 'learning_rate': 1.453724050576298e-05, 'epoch': 0.74} {'loss': 0.5829, 'learning_rate': 1.453694109932395e-05, 'epoch': 0.74} {'loss': 0.4852, 'learning_rate': 1.4536641687763573e-05, 'epoch': 0.74} {'loss': 0.6414, 'learning_rate': 1.4536342271082192e-05, 'epoch': 0.74} {'loss': 0.6399, 'learning_rate': 1.453604284928014e-05, 'epoch': 0.74} {'loss': 0.5573, 'learning_rate': 1.4535743422357763e-05, 'epoch': 0.74} {'loss': 0.5334, 'learning_rate': 1.453544399031539e-05, 'epoch': 0.74} {'loss': 0.4778, 'learning_rate': 1.4535144553153366e-05, 'epoch': 0.74} {'loss': 0.6799, 'learning_rate': 1.4534845110872027e-05, 'epoch': 0.74} {'loss': 0.6221, 'learning_rate': 1.4534545663471708e-05, 'epoch': 0.74} {'loss': 0.527, 'learning_rate': 1.4534246210952749e-05, 'epoch': 0.74} {'loss': 0.6972, 'learning_rate': 1.4533946753315491e-05, 'epoch': 0.74} {'loss': 0.5847, 'learning_rate': 1.4533647290560266e-05, 'epoch': 0.74} {'loss': 0.491, 'learning_rate': 1.4533347822687418e-05, 'epoch': 0.74} {'loss': 0.6709, 'learning_rate': 1.453304834969728e-05, 'epoch': 0.74} {'loss': 0.6289, 'learning_rate': 1.4532748871590194e-05, 'epoch': 0.74} {'loss': 0.7052, 'learning_rate': 1.4532449388366496e-05, 'epoch': 0.74} {'loss': 0.5604, 'learning_rate': 1.4532149900026523e-05, 'epoch': 0.74} {'loss': 0.5936, 'learning_rate': 1.4531850406570618e-05, 'epoch': 0.74} {'loss': 0.6077, 'learning_rate': 1.4531550907999112e-05, 'epoch': 0.74} {'loss': 0.6097, 'learning_rate': 1.453125140431235e-05, 'epoch': 0.74} {'loss': 0.6246, 'learning_rate': 1.4530951895510667e-05, 'epoch': 0.74} {'loss': 0.599, 'learning_rate': 1.4530652381594399e-05, 'epoch': 0.74} {'loss': 0.6553, 'learning_rate': 1.4530352862563885e-05, 'epoch': 0.74} {'loss': 0.6956, 'learning_rate': 1.4530053338419466e-05, 'epoch': 0.74} {'loss': 0.591, 'learning_rate': 1.4529753809161478e-05, 'epoch': 0.74} {'loss': 0.6243, 'learning_rate': 1.4529454274790258e-05, 'epoch': 0.74} {'loss': 0.5542, 'learning_rate': 1.4529154735306146e-05, 'epoch': 0.74} {'loss': 0.5688, 'learning_rate': 1.452885519070948e-05, 'epoch': 0.74} {'loss': 0.3783, 'learning_rate': 1.4528555641000598e-05, 'epoch': 0.74} {'loss': 0.4674, 'learning_rate': 1.4528256086179837e-05, 'epoch': 0.74} {'loss': 0.6414, 'learning_rate': 1.4527956526247535e-05, 'epoch': 0.74} {'loss': 0.6643, 'learning_rate': 1.4527656961204033e-05, 'epoch': 0.74} {'loss': 0.4895, 'learning_rate': 1.4527357391049668e-05, 'epoch': 0.74} {'loss': 0.4996, 'learning_rate': 1.4527057815784775e-05, 'epoch': 0.74} {'loss': 0.4218, 'learning_rate': 1.4526758235409697e-05, 'epoch': 0.74} {'loss': 0.4612, 'learning_rate': 1.4526458649924768e-05, 'epoch': 0.74} {'loss': 0.6675, 'learning_rate': 1.4526159059330329e-05, 'epoch': 0.74} {'loss': 0.6965, 'learning_rate': 1.4525859463626716e-05, 'epoch': 0.74} {'loss': 0.5732, 'learning_rate': 1.4525559862814269e-05, 'epoch': 0.74} {'loss': 0.5742, 'learning_rate': 1.4525260256893326e-05, 'epoch': 0.74} {'loss': 0.4978, 'learning_rate': 1.4524960645864223e-05, 'epoch': 0.74} {'loss': 0.5697, 'learning_rate': 1.4524661029727302e-05, 'epoch': 0.74} {'loss': 0.5685, 'learning_rate': 1.4524361408482897e-05, 'epoch': 0.74} {'loss': 0.5375, 'learning_rate': 1.4524061782131349e-05, 'epoch': 0.74} {'loss': 0.4737, 'learning_rate': 1.4523762150672998e-05, 'epoch': 0.74} {'loss': 0.7846, 'learning_rate': 1.4523462514108176e-05, 'epoch': 0.74} {'loss': 0.6222, 'learning_rate': 1.4523162872437227e-05, 'epoch': 0.74} {'loss': 0.521, 'learning_rate': 1.4522863225660487e-05, 'epoch': 0.74} {'loss': 0.598, 'learning_rate': 1.4522563573778295e-05, 'epoch': 0.74} {'loss': 0.518, 'learning_rate': 1.4522263916790986e-05, 'epoch': 0.74} {'loss': 0.7075, 'learning_rate': 1.4521964254698903e-05, 'epoch': 0.74} {'loss': 0.4863, 'learning_rate': 1.4521664587502383e-05, 'epoch': 0.74} {'loss': 0.6737, 'learning_rate': 1.4521364915201762e-05, 'epoch': 0.74} {'loss': 0.5611, 'learning_rate': 1.452106523779738e-05, 'epoch': 0.74} {'loss': 0.5856, 'learning_rate': 1.4520765555289575e-05, 'epoch': 0.74} {'loss': 0.5292, 'learning_rate': 1.4520465867678688e-05, 'epoch': 0.74} {'loss': 0.4445, 'learning_rate': 1.452016617496505e-05, 'epoch': 0.74} {'loss': 0.639, 'learning_rate': 1.4519866477149009e-05, 'epoch': 0.74} {'loss': 0.7692, 'learning_rate': 1.4519566774230898e-05, 'epoch': 0.74} {'loss': 0.4899, 'learning_rate': 1.451926706621105e-05, 'epoch': 0.74} {'loss': 0.4975, 'learning_rate': 1.4518967353089815e-05, 'epoch': 0.74} {'loss': 0.5846, 'learning_rate': 1.451866763486752e-05, 'epoch': 0.74} {'loss': 0.5545, 'learning_rate': 1.4518367911544513e-05, 'epoch': 0.74} {'loss': 0.6679, 'learning_rate': 1.4518068183121125e-05, 'epoch': 0.74} {'loss': 0.6675, 'learning_rate': 1.4517768449597698e-05, 'epoch': 0.74} {'loss': 0.5594, 'learning_rate': 1.4517468710974569e-05, 'epoch': 0.74} {'loss': 0.6202, 'learning_rate': 1.4517168967252077e-05, 'epoch': 0.74} {'loss': 0.6001, 'learning_rate': 1.4516869218430561e-05, 'epoch': 0.74} {'loss': 0.5051, 'learning_rate': 1.4516569464510357e-05, 'epoch': 0.74} {'loss': 0.5555, 'learning_rate': 1.4516269705491808e-05, 'epoch': 0.74} {'loss': 0.5435, 'learning_rate': 1.4515969941375248e-05, 'epoch': 0.74} {'loss': 0.5792, 'learning_rate': 1.4515670172161015e-05, 'epoch': 0.74} {'loss': 0.5152, 'learning_rate': 1.451537039784945e-05, 'epoch': 0.74} {'loss': 0.699, 'learning_rate': 1.4515070618440892e-05, 'epoch': 0.74} {'loss': 0.6171, 'learning_rate': 1.4514770833935677e-05, 'epoch': 0.74} {'loss': 0.4884, 'learning_rate': 1.4514471044334142e-05, 'epoch': 0.74} {'loss': 0.5288, 'learning_rate': 1.4514171249636628e-05, 'epoch': 0.74} {'loss': 0.4721, 'learning_rate': 1.4513871449843475e-05, 'epoch': 0.74} {'loss': 0.6153, 'learning_rate': 1.451357164495502e-05, 'epoch': 0.74} {'loss': 0.6816, 'learning_rate': 1.4513271834971599e-05, 'epoch': 0.74} {'loss': 0.5571, 'learning_rate': 1.4512972019893555e-05, 'epoch': 0.74} {'loss': 0.6271, 'learning_rate': 1.451267219972122e-05, 'epoch': 0.74} {'loss': 0.501, 'learning_rate': 1.4512372374454936e-05, 'epoch': 0.74} {'loss': 0.5926, 'learning_rate': 1.4512072544095049e-05, 'epoch': 0.74} {'loss': 0.5506, 'learning_rate': 1.4511772708641883e-05, 'epoch': 0.74} {'loss': 0.546, 'learning_rate': 1.4511472868095787e-05, 'epoch': 0.74} {'loss': 0.6064, 'learning_rate': 1.4511173022457092e-05, 'epoch': 0.74} {'loss': 0.4834, 'learning_rate': 1.4510873171726143e-05, 'epoch': 0.74} {'loss': 0.5949, 'learning_rate': 1.4510573315903276e-05, 'epoch': 0.74} {'loss': 0.6008, 'learning_rate': 1.451027345498883e-05, 'epoch': 0.74} {'loss': 0.439, 'learning_rate': 1.4509973588983141e-05, 'epoch': 0.74} {'loss': 0.5993, 'learning_rate': 1.4509673717886553e-05, 'epoch': 0.74} {'loss': 0.5879, 'learning_rate': 1.4509373841699397e-05, 'epoch': 0.74} {'loss': 0.5192, 'learning_rate': 1.4509073960422018e-05, 'epoch': 0.74} {'loss': 0.56, 'learning_rate': 1.450877407405475e-05, 'epoch': 0.74} {'loss': 0.4288, 'learning_rate': 1.4508474182597936e-05, 'epoch': 0.74} {'loss': 0.588, 'learning_rate': 1.4508174286051908e-05, 'epoch': 0.74} {'loss': 0.5088, 'learning_rate': 1.450787438441701e-05, 'epoch': 0.74} {'loss': 0.496, 'learning_rate': 1.4507574477693582e-05, 'epoch': 0.74} {'loss': 0.6007, 'learning_rate': 1.4507274565881958e-05, 'epoch': 0.74} {'loss': 0.5507, 'learning_rate': 1.4506974648982477e-05, 'epoch': 0.74} {'loss': 0.4844, 'learning_rate': 1.4506674726995478e-05, 'epoch': 0.74} {'loss': 0.5548, 'learning_rate': 1.4506374799921301e-05, 'epoch': 0.74} {'loss': 0.4826, 'learning_rate': 1.4506074867760284e-05, 'epoch': 0.74} {'loss': 0.5032, 'learning_rate': 1.4505774930512769e-05, 'epoch': 0.74} {'loss': 0.7404, 'learning_rate': 1.4505474988179086e-05, 'epoch': 0.74} {'loss': 0.5796, 'learning_rate': 1.450517504075958e-05, 'epoch': 0.74} {'loss': 0.5654, 'learning_rate': 1.4504875088254591e-05, 'epoch': 0.74} {'loss': 0.5062, 'learning_rate': 1.4504575130664451e-05, 'epoch': 0.74} {'loss': 0.6339, 'learning_rate': 1.4504275167989503e-05, 'epoch': 0.74} {'loss': 0.4277, 'learning_rate': 1.4503975200230085e-05, 'epoch': 0.74} {'loss': 0.5837, 'learning_rate': 1.4503675227386533e-05, 'epoch': 0.74} {'loss': 0.4432, 'learning_rate': 1.4503375249459191e-05, 'epoch': 0.74} {'loss': 0.4158, 'learning_rate': 1.4503075266448395e-05, 'epoch': 0.74} {'loss': 0.5763, 'learning_rate': 1.4502775278354482e-05, 'epoch': 0.74} {'loss': 0.4808, 'learning_rate': 1.4502475285177793e-05, 'epoch': 0.74} {'loss': 0.5808, 'learning_rate': 1.4502175286918665e-05, 'epoch': 0.74} {'loss': 0.4461, 'learning_rate': 1.4501875283577436e-05, 'epoch': 0.74} {'loss': 0.7307, 'learning_rate': 1.4501575275154447e-05, 'epoch': 0.74} {'loss': 0.4322, 'learning_rate': 1.4501275261650037e-05, 'epoch': 0.74} {'loss': 0.5635, 'learning_rate': 1.4500975243064543e-05, 'epoch': 0.74} {'loss': 0.478, 'learning_rate': 1.4500675219398303e-05, 'epoch': 0.74} {'loss': 0.5827, 'learning_rate': 1.4500375190651657e-05, 'epoch': 0.74} {'loss': 0.558, 'learning_rate': 1.4500075156824942e-05, 'epoch': 0.74} {'loss': 0.7354, 'learning_rate': 1.4499775117918497e-05, 'epoch': 0.74} {'loss': 0.6243, 'learning_rate': 1.4499475073932663e-05, 'epoch': 0.74} {'loss': 0.6993, 'learning_rate': 1.4499175024867778e-05, 'epoch': 0.74} {'loss': 0.5721, 'learning_rate': 1.4498874970724179e-05, 'epoch': 0.74} {'loss': 0.6207, 'learning_rate': 1.4498574911502206e-05, 'epoch': 0.74} {'loss': 0.7176, 'learning_rate': 1.4498274847202197e-05, 'epoch': 0.74} {'loss': 0.4038, 'learning_rate': 1.449797477782449e-05, 'epoch': 0.74} {'loss': 0.5347, 'learning_rate': 1.4497674703369426e-05, 'epoch': 0.74} {'loss': 0.6079, 'learning_rate': 1.4497374623837343e-05, 'epoch': 0.74} {'loss': 0.5102, 'learning_rate': 1.4497074539228582e-05, 'epoch': 0.74} {'loss': 0.5249, 'learning_rate': 1.4496774449543474e-05, 'epoch': 0.74} {'loss': 0.7585, 'learning_rate': 1.4496474354782364e-05, 'epoch': 0.74} {'loss': 0.6597, 'learning_rate': 1.449617425494559e-05, 'epoch': 0.74} {'loss': 0.4782, 'learning_rate': 1.4495874150033491e-05, 'epoch': 0.74} {'loss': 0.5874, 'learning_rate': 1.4495574040046404e-05, 'epoch': 0.74} {'loss': 0.4809, 'learning_rate': 1.449527392498467e-05, 'epoch': 0.74} {'loss': 0.4974, 'learning_rate': 1.4494973804848625e-05, 'epoch': 0.74} {'loss': 0.6054, 'learning_rate': 1.449467367963861e-05, 'epoch': 0.74} {'loss': 0.4738, 'learning_rate': 1.4494373549354964e-05, 'epoch': 0.74} {'loss': 0.5056, 'learning_rate': 1.4494073413998022e-05, 'epoch': 0.74} {'loss': 0.4925, 'learning_rate': 1.4493773273568128e-05, 'epoch': 0.74} {'loss': 0.5772, 'learning_rate': 1.4493473128065619e-05, 'epoch': 0.74} {'loss': 0.3839, 'learning_rate': 1.449317297749083e-05, 'epoch': 0.74} {'loss': 0.6283, 'learning_rate': 1.4492872821844107e-05, 'epoch': 0.74} {'loss': 0.4433, 'learning_rate': 1.4492572661125782e-05, 'epoch': 0.74} {'loss': 0.3592, 'learning_rate': 1.44922724953362e-05, 'epoch': 0.74} {'loss': 0.5594, 'learning_rate': 1.4491972324475694e-05, 'epoch': 0.74} {'loss': 0.3487, 'learning_rate': 1.4491672148544607e-05, 'epoch': 0.74} {'loss': 0.5227, 'learning_rate': 1.4491371967543275e-05, 'epoch': 0.74} {'loss': 0.6011, 'learning_rate': 1.449107178147204e-05, 'epoch': 0.74} {'loss': 0.4961, 'learning_rate': 1.4490771590331236e-05, 'epoch': 0.74} {'loss': 0.5031, 'learning_rate': 1.4490471394121209e-05, 'epoch': 0.74} {'loss': 0.5439, 'learning_rate': 1.4490171192842293e-05, 'epoch': 0.74} {'loss': 0.5926, 'learning_rate': 1.4489870986494824e-05, 'epoch': 0.74} {'loss': 0.6055, 'learning_rate': 1.4489570775079147e-05, 'epoch': 0.74} {'loss': 0.6066, 'learning_rate': 1.4489270558595596e-05, 'epoch': 0.74} {'loss': 0.5874, 'learning_rate': 1.4488970337044514e-05, 'epoch': 0.74} {'loss': 0.5591, 'learning_rate': 1.4488670110426237e-05, 'epoch': 0.74} {'loss': 0.5906, 'learning_rate': 1.4488369878741106e-05, 'epoch': 0.74} {'loss': 0.5493, 'learning_rate': 1.4488069641989459e-05, 'epoch': 0.74} {'loss': 0.6069, 'learning_rate': 1.4487769400171636e-05, 'epoch': 0.74} {'loss': 0.5004, 'learning_rate': 1.4487469153287973e-05, 'epoch': 0.74} {'loss': 0.5098, 'learning_rate': 1.4487168901338811e-05, 'epoch': 0.74} {'loss': 0.656, 'learning_rate': 1.4486868644324488e-05, 'epoch': 0.74} {'loss': 0.6559, 'learning_rate': 1.4486568382245346e-05, 'epoch': 0.74} {'loss': 0.6263, 'learning_rate': 1.4486268115101718e-05, 'epoch': 0.74} {'loss': 0.444, 'learning_rate': 1.4485967842893951e-05, 'epoch': 0.74} {'loss': 0.5499, 'learning_rate': 1.4485667565622374e-05, 'epoch': 0.74} {'loss': 0.573, 'learning_rate': 1.4485367283287335e-05, 'epoch': 0.74} {'loss': 0.4717, 'learning_rate': 1.4485066995889167e-05, 'epoch': 0.74} {'loss': 0.6447, 'learning_rate': 1.4484766703428212e-05, 'epoch': 0.74} {'loss': 0.636, 'learning_rate': 1.4484466405904809e-05, 'epoch': 0.74} {'loss': 0.7123, 'learning_rate': 1.4484166103319295e-05, 'epoch': 0.74} {'loss': 0.6083, 'learning_rate': 1.4483865795672011e-05, 'epoch': 0.74} {'loss': 0.6112, 'learning_rate': 1.4483565482963295e-05, 'epoch': 0.74} {'loss': 0.4987, 'learning_rate': 1.4483265165193485e-05, 'epoch': 0.74} {'loss': 0.6404, 'learning_rate': 1.4482964842362923e-05, 'epoch': 0.74} {'loss': 0.5583, 'learning_rate': 1.4482664514471947e-05, 'epoch': 0.74} {'loss': 0.6196, 'learning_rate': 1.4482364181520892e-05, 'epoch': 0.74} {'loss': 0.6793, 'learning_rate': 1.4482063843510104e-05, 'epoch': 0.74} {'loss': 0.6468, 'learning_rate': 1.4481763500439916e-05, 'epoch': 0.74} {'loss': 0.563, 'learning_rate': 1.448146315231067e-05, 'epoch': 0.74} {'loss': 0.7129, 'learning_rate': 1.4481162799122703e-05, 'epoch': 0.74} {'loss': 0.5667, 'learning_rate': 1.4480862440876356e-05, 'epoch': 0.74} {'loss': 0.6875, 'learning_rate': 1.4480562077571966e-05, 'epoch': 0.74} {'loss': 0.6206, 'learning_rate': 1.4480261709209874e-05, 'epoch': 0.74} {'loss': 0.5204, 'learning_rate': 1.447996133579042e-05, 'epoch': 0.74} {'loss': 0.6717, 'learning_rate': 1.4479660957313942e-05, 'epoch': 0.74} {'loss': 0.5659, 'learning_rate': 1.4479360573780777e-05, 'epoch': 0.74} {'loss': 0.5383, 'learning_rate': 1.4479060185191264e-05, 'epoch': 0.74} {'loss': 0.6271, 'learning_rate': 1.4478759791545747e-05, 'epoch': 0.74} {'loss': 0.7515, 'learning_rate': 1.4478459392844562e-05, 'epoch': 0.74} {'loss': 0.6065, 'learning_rate': 1.4478158989088046e-05, 'epoch': 0.74} {'loss': 0.5382, 'learning_rate': 1.447785858027654e-05, 'epoch': 0.74} {'loss': 0.5654, 'learning_rate': 1.4477558166410383e-05, 'epoch': 0.74} {'loss': 0.6537, 'learning_rate': 1.4477257747489917e-05, 'epoch': 0.74} {'loss': 0.4682, 'learning_rate': 1.4476957323515475e-05, 'epoch': 0.74} {'loss': 0.5407, 'learning_rate': 1.4476656894487402e-05, 'epoch': 0.74} {'loss': 0.3936, 'learning_rate': 1.4476356460406033e-05, 'epoch': 0.74} {'loss': 0.4914, 'learning_rate': 1.447605602127171e-05, 'epoch': 0.74} {'loss': 0.5515, 'learning_rate': 1.447575557708477e-05, 'epoch': 0.74} {'loss': 0.4586, 'learning_rate': 1.4475455127845555e-05, 'epoch': 0.74} {'loss': 0.4681, 'learning_rate': 1.4475154673554402e-05, 'epoch': 0.74} {'loss': 0.5463, 'learning_rate': 1.447485421421165e-05, 'epoch': 0.74} {'loss': 0.477, 'learning_rate': 1.4474553749817638e-05, 'epoch': 0.74} {'loss': 0.5886, 'learning_rate': 1.4474253280372703e-05, 'epoch': 0.74} {'loss': 0.4306, 'learning_rate': 1.447395280587719e-05, 'epoch': 0.74} {'loss': 0.5894, 'learning_rate': 1.4473652326331434e-05, 'epoch': 0.74} {'loss': 0.6982, 'learning_rate': 1.4473351841735775e-05, 'epoch': 0.75} {'loss': 0.6334, 'learning_rate': 1.4473051352090552e-05, 'epoch': 0.75} {'loss': 0.5824, 'learning_rate': 1.4472750857396105e-05, 'epoch': 0.75} {'loss': 0.51, 'learning_rate': 1.4472450357652775e-05, 'epoch': 0.75} {'loss': 0.7003, 'learning_rate': 1.4472149852860895e-05, 'epoch': 0.75} {'loss': 0.6446, 'learning_rate': 1.4471849343020812e-05, 'epoch': 0.75} {'loss': 0.6169, 'learning_rate': 1.447154882813286e-05, 'epoch': 0.75} {'loss': 0.3182, 'learning_rate': 1.447124830819738e-05, 'epoch': 0.75} {'loss': 0.6313, 'learning_rate': 1.4470947783214713e-05, 'epoch': 0.75} {'loss': 0.516, 'learning_rate': 1.4470647253185192e-05, 'epoch': 0.75} {'loss': 0.6596, 'learning_rate': 1.4470346718109163e-05, 'epoch': 0.75} {'loss': 0.602, 'learning_rate': 1.447004617798696e-05, 'epoch': 0.75} {'loss': 0.5522, 'learning_rate': 1.4469745632818928e-05, 'epoch': 0.75} {'loss': 0.4523, 'learning_rate': 1.4469445082605403e-05, 'epoch': 0.75} {'loss': 0.709, 'learning_rate': 1.4469144527346721e-05, 'epoch': 0.75} {'loss': 0.656, 'learning_rate': 1.4468843967043227e-05, 'epoch': 0.75} {'loss': 0.57, 'learning_rate': 1.4468543401695256e-05, 'epoch': 0.75} {'loss': 0.608, 'learning_rate': 1.4468242831303152e-05, 'epoch': 0.75} {'loss': 0.6115, 'learning_rate': 1.4467942255867251e-05, 'epoch': 0.75} {'loss': 0.6728, 'learning_rate': 1.4467641675387891e-05, 'epoch': 0.75} {'loss': 0.6507, 'learning_rate': 1.4467341089865418e-05, 'epoch': 0.75} {'loss': 0.663, 'learning_rate': 1.4467040499300162e-05, 'epoch': 0.75} {'loss': 0.6595, 'learning_rate': 1.4466739903692468e-05, 'epoch': 0.75} {'loss': 0.6644, 'learning_rate': 1.4466439303042674e-05, 'epoch': 0.75} {'loss': 0.5647, 'learning_rate': 1.4466138697351117e-05, 'epoch': 0.75} {'loss': 0.6268, 'learning_rate': 1.4465838086618142e-05, 'epoch': 0.75} {'loss': 0.632, 'learning_rate': 1.4465537470844084e-05, 'epoch': 0.75} {'loss': 0.6652, 'learning_rate': 1.4465236850029282e-05, 'epoch': 0.75} {'loss': 0.5887, 'learning_rate': 1.4464936224174077e-05, 'epoch': 0.75} {'loss': 0.6449, 'learning_rate': 1.4464635593278811e-05, 'epoch': 0.75} {'loss': 0.5583, 'learning_rate': 1.4464334957343818e-05, 'epoch': 0.75} {'loss': 0.6907, 'learning_rate': 1.4464034316369437e-05, 'epoch': 0.75} {'loss': 0.6256, 'learning_rate': 1.4463733670356015e-05, 'epoch': 0.75} {'loss': 0.5076, 'learning_rate': 1.4463433019303886e-05, 'epoch': 0.75} {'loss': 0.4423, 'learning_rate': 1.4463132363213386e-05, 'epoch': 0.75} {'loss': 0.5562, 'learning_rate': 1.446283170208486e-05, 'epoch': 0.75} {'loss': 0.599, 'learning_rate': 1.4462531035918648e-05, 'epoch': 0.75} {'loss': 0.5654, 'learning_rate': 1.4462230364715085e-05, 'epoch': 0.75} {'loss': 0.6008, 'learning_rate': 1.4461929688474513e-05, 'epoch': 0.75} {'loss': 0.6127, 'learning_rate': 1.4461629007197271e-05, 'epoch': 0.75} {'loss': 0.6339, 'learning_rate': 1.4461328320883699e-05, 'epoch': 0.75} {'loss': 0.6637, 'learning_rate': 1.4461027629534132e-05, 'epoch': 0.75} {'loss': 0.5996, 'learning_rate': 1.4460726933148917e-05, 'epoch': 0.75} {'loss': 0.6554, 'learning_rate': 1.4460426231728388e-05, 'epoch': 0.75} {'loss': 0.5662, 'learning_rate': 1.4460125525272889e-05, 'epoch': 0.75} {'loss': 0.6152, 'learning_rate': 1.4459824813782753e-05, 'epoch': 0.75} {'loss': 0.5756, 'learning_rate': 1.4459524097258324e-05, 'epoch': 0.75} {'loss': 0.6369, 'learning_rate': 1.445922337569994e-05, 'epoch': 0.75} {'loss': 0.3726, 'learning_rate': 1.4458922649107941e-05, 'epoch': 0.75} {'loss': 0.4299, 'learning_rate': 1.4458621917482665e-05, 'epoch': 0.75} {'loss': 0.5319, 'learning_rate': 1.4458321180824452e-05, 'epoch': 0.75} {'loss': 0.5382, 'learning_rate': 1.4458020439133644e-05, 'epoch': 0.75} {'loss': 0.459, 'learning_rate': 1.4457719692410578e-05, 'epoch': 0.75} {'loss': 0.5525, 'learning_rate': 1.4457418940655596e-05, 'epoch': 0.75} {'loss': 0.6177, 'learning_rate': 1.4457118183869035e-05, 'epoch': 0.75} {'loss': 0.6318, 'learning_rate': 1.4456817422051232e-05, 'epoch': 0.75} {'loss': 0.6629, 'learning_rate': 1.4456516655202533e-05, 'epoch': 0.75} {'loss': 0.4077, 'learning_rate': 1.4456215883323274e-05, 'epoch': 0.75} {'loss': 0.6094, 'learning_rate': 1.4455915106413794e-05, 'epoch': 0.75} {'loss': 0.516, 'learning_rate': 1.4455614324474433e-05, 'epoch': 0.75} {'loss': 0.609, 'learning_rate': 1.445531353750553e-05, 'epoch': 0.75} {'loss': 0.5089, 'learning_rate': 1.4455012745507428e-05, 'epoch': 0.75} {'loss': 0.6715, 'learning_rate': 1.4454711948480463e-05, 'epoch': 0.75} {'loss': 0.7252, 'learning_rate': 1.4454411146424971e-05, 'epoch': 0.75} {'loss': 0.3681, 'learning_rate': 1.4454110339341299e-05, 'epoch': 0.75} {'loss': 0.4648, 'learning_rate': 1.4453809527229783e-05, 'epoch': 0.75} {'loss': 0.5096, 'learning_rate': 1.4453508710090764e-05, 'epoch': 0.75} {'loss': 0.4907, 'learning_rate': 1.4453207887924579e-05, 'epoch': 0.75} {'loss': 0.5403, 'learning_rate': 1.4452907060731569e-05, 'epoch': 0.75} {'loss': 0.5368, 'learning_rate': 1.4452606228512077e-05, 'epoch': 0.75} {'loss': 0.5551, 'learning_rate': 1.4452305391266437e-05, 'epoch': 0.75} {'loss': 0.527, 'learning_rate': 1.4452004548994992e-05, 'epoch': 0.75} {'loss': 0.7516, 'learning_rate': 1.445170370169808e-05, 'epoch': 0.75} {'loss': 0.7015, 'learning_rate': 1.4451402849376038e-05, 'epoch': 0.75} {'loss': 0.6157, 'learning_rate': 1.445110199202921e-05, 'epoch': 0.75} {'loss': 0.5735, 'learning_rate': 1.4450801129657937e-05, 'epoch': 0.75} {'loss': 0.6495, 'learning_rate': 1.4450500262262553e-05, 'epoch': 0.75} {'loss': 0.4298, 'learning_rate': 1.44501993898434e-05, 'epoch': 0.75} {'loss': 0.5776, 'learning_rate': 1.4449898512400821e-05, 'epoch': 0.75} {'loss': 0.6065, 'learning_rate': 1.444959762993515e-05, 'epoch': 0.75} {'loss': 0.5101, 'learning_rate': 1.4449296742446733e-05, 'epoch': 0.75} {'loss': 0.5253, 'learning_rate': 1.4448995849935903e-05, 'epoch': 0.75} {'loss': 0.6153, 'learning_rate': 1.4448694952403004e-05, 'epoch': 0.75} {'loss': 0.7609, 'learning_rate': 1.4448394049848372e-05, 'epoch': 0.75} {'loss': 0.5946, 'learning_rate': 1.4448093142272352e-05, 'epoch': 0.75} {'loss': 0.7192, 'learning_rate': 1.444779222967528e-05, 'epoch': 0.75} {'loss': 0.5207, 'learning_rate': 1.4447491312057496e-05, 'epoch': 0.75} {'loss': 0.6539, 'learning_rate': 1.4447190389419339e-05, 'epoch': 0.75} {'loss': 0.6632, 'learning_rate': 1.4446889461761152e-05, 'epoch': 0.75} {'loss': 0.5613, 'learning_rate': 1.444658852908327e-05, 'epoch': 0.75} {'loss': 0.4812, 'learning_rate': 1.4446287591386037e-05, 'epoch': 0.75} {'loss': 0.5616, 'learning_rate': 1.444598664866979e-05, 'epoch': 0.75} {'loss': 0.6479, 'learning_rate': 1.4445685700934868e-05, 'epoch': 0.75} {'loss': 0.4252, 'learning_rate': 1.4445384748181617e-05, 'epoch': 0.75} {'loss': 0.5366, 'learning_rate': 1.4445083790410369e-05, 'epoch': 0.75} {'loss': 0.5439, 'learning_rate': 1.4444782827621466e-05, 'epoch': 0.75} {'loss': 0.7197, 'learning_rate': 1.4444481859815249e-05, 'epoch': 0.75} {'loss': 0.6266, 'learning_rate': 1.4444180886992057e-05, 'epoch': 0.75} {'loss': 0.7241, 'learning_rate': 1.444387990915223e-05, 'epoch': 0.75} {'loss': 0.57, 'learning_rate': 1.4443578926296107e-05, 'epoch': 0.75} {'loss': 0.5374, 'learning_rate': 1.444327793842403e-05, 'epoch': 0.75} {'loss': 0.5346, 'learning_rate': 1.4442976945536336e-05, 'epoch': 0.75} {'loss': 0.6134, 'learning_rate': 1.4442675947633365e-05, 'epoch': 0.75} {'loss': 0.6568, 'learning_rate': 1.4442374944715458e-05, 'epoch': 0.75} {'loss': 0.4652, 'learning_rate': 1.4442073936782954e-05, 'epoch': 0.75} {'loss': 0.6783, 'learning_rate': 1.4441772923836194e-05, 'epoch': 0.75} {'loss': 0.5189, 'learning_rate': 1.4441471905875518e-05, 'epoch': 0.75} {'loss': 0.6823, 'learning_rate': 1.4441170882901265e-05, 'epoch': 0.75} {'loss': 0.5292, 'learning_rate': 1.4440869854913775e-05, 'epoch': 0.75} {'loss': 0.5078, 'learning_rate': 1.4440568821913385e-05, 'epoch': 0.75} {'loss': 0.5183, 'learning_rate': 1.4440267783900439e-05, 'epoch': 0.75} {'loss': 0.5895, 'learning_rate': 1.4439966740875273e-05, 'epoch': 0.75} {'loss': 0.4923, 'learning_rate': 1.443966569283823e-05, 'epoch': 0.75} {'loss': 0.6273, 'learning_rate': 1.4439364639789651e-05, 'epoch': 0.75} {'loss': 0.5373, 'learning_rate': 1.443906358172987e-05, 'epoch': 0.75} {'loss': 0.4318, 'learning_rate': 1.443876251865923e-05, 'epoch': 0.75} {'loss': 0.6971, 'learning_rate': 1.4438461450578074e-05, 'epoch': 0.75} {'loss': 0.6442, 'learning_rate': 1.4438160377486739e-05, 'epoch': 0.75} {'loss': 0.5344, 'learning_rate': 1.4437859299385561e-05, 'epoch': 0.75} {'loss': 0.6446, 'learning_rate': 1.4437558216274888e-05, 'epoch': 0.75} {'loss': 0.4537, 'learning_rate': 1.4437257128155055e-05, 'epoch': 0.75} {'loss': 0.6187, 'learning_rate': 1.4436956035026404e-05, 'epoch': 0.75} {'loss': 0.4684, 'learning_rate': 1.443665493688927e-05, 'epoch': 0.75} {'loss': 0.6155, 'learning_rate': 1.4436353833743997e-05, 'epoch': 0.75} {'loss': 0.562, 'learning_rate': 1.4436052725590922e-05, 'epoch': 0.75} {'loss': 0.716, 'learning_rate': 1.443575161243039e-05, 'epoch': 0.75} {'loss': 0.5026, 'learning_rate': 1.4435450494262736e-05, 'epoch': 0.75} {'loss': 0.6429, 'learning_rate': 1.4435149371088306e-05, 'epoch': 0.75} {'loss': 0.5365, 'learning_rate': 1.443484824290743e-05, 'epoch': 0.75} {'loss': 0.7167, 'learning_rate': 1.4434547109720458e-05, 'epoch': 0.75} {'loss': 0.5003, 'learning_rate': 1.4434245971527725e-05, 'epoch': 0.75} {'loss': 0.3633, 'learning_rate': 1.443394482832957e-05, 'epoch': 0.75} {'loss': 0.6008, 'learning_rate': 1.4433643680126334e-05, 'epoch': 0.75} {'loss': 0.5418, 'learning_rate': 1.4433342526918359e-05, 'epoch': 0.75} {'loss': 0.5822, 'learning_rate': 1.4433041368705984e-05, 'epoch': 0.75} {'loss': 0.6525, 'learning_rate': 1.4432740205489545e-05, 'epoch': 0.75} {'loss': 0.4328, 'learning_rate': 1.4432439037269388e-05, 'epoch': 0.75} {'loss': 0.6516, 'learning_rate': 1.443213786404585e-05, 'epoch': 0.75} {'loss': 0.4892, 'learning_rate': 1.4431836685819272e-05, 'epoch': 0.75} {'loss': 0.4989, 'learning_rate': 1.443153550258999e-05, 'epoch': 0.75} {'loss': 0.5263, 'learning_rate': 1.4431234314358348e-05, 'epoch': 0.75} {'loss': 0.5186, 'learning_rate': 1.4430933121124686e-05, 'epoch': 0.75} {'loss': 0.6709, 'learning_rate': 1.4430631922889344e-05, 'epoch': 0.75} {'loss': 0.6627, 'learning_rate': 1.4430330719652662e-05, 'epoch': 0.75} {'loss': 0.6485, 'learning_rate': 1.4430029511414978e-05, 'epoch': 0.75} {'loss': 0.524, 'learning_rate': 1.4429728298176633e-05, 'epoch': 0.75} {'loss': 0.585, 'learning_rate': 1.4429427079937965e-05, 'epoch': 0.75} {'loss': 0.6212, 'learning_rate': 1.4429125856699318e-05, 'epoch': 0.75} {'loss': 0.7629, 'learning_rate': 1.4428824628461029e-05, 'epoch': 0.75} {'loss': 0.5874, 'learning_rate': 1.4428523395223439e-05, 'epoch': 0.75} {'loss': 0.5364, 'learning_rate': 1.4428222156986888e-05, 'epoch': 0.75} {'loss': 0.5723, 'learning_rate': 1.442792091375172e-05, 'epoch': 0.75} {'loss': 0.4775, 'learning_rate': 1.4427619665518267e-05, 'epoch': 0.75} {'loss': 0.6987, 'learning_rate': 1.4427318412286874e-05, 'epoch': 0.75} {'loss': 0.4571, 'learning_rate': 1.4427017154057882e-05, 'epoch': 0.75} {'loss': 0.6369, 'learning_rate': 1.4426715890831631e-05, 'epoch': 0.75} {'loss': 0.6628, 'learning_rate': 1.4426414622608457e-05, 'epoch': 0.75} {'loss': 0.5551, 'learning_rate': 1.4426113349388703e-05, 'epoch': 0.75} {'loss': 0.55, 'learning_rate': 1.4425812071172709e-05, 'epoch': 0.75} {'loss': 0.5132, 'learning_rate': 1.4425510787960815e-05, 'epoch': 0.75} {'loss': 0.6949, 'learning_rate': 1.442520949975336e-05, 'epoch': 0.75} {'loss': 0.5699, 'learning_rate': 1.4424908206550685e-05, 'epoch': 0.75} {'loss': 0.5386, 'learning_rate': 1.4424606908353132e-05, 'epoch': 0.75} {'loss': 0.724, 'learning_rate': 1.4424305605161038e-05, 'epoch': 0.75} {'loss': 0.4091, 'learning_rate': 1.4424004296974742e-05, 'epoch': 0.75} {'loss': 0.6199, 'learning_rate': 1.4423702983794588e-05, 'epoch': 0.75} {'loss': 0.5018, 'learning_rate': 1.4423401665620915e-05, 'epoch': 0.75} {'loss': 0.6207, 'learning_rate': 1.4423100342454061e-05, 'epoch': 0.75} {'loss': 0.3869, 'learning_rate': 1.4422799014294371e-05, 'epoch': 0.75} {'loss': 0.448, 'learning_rate': 1.4422497681142183e-05, 'epoch': 0.75} {'loss': 0.4501, 'learning_rate': 1.4422196342997831e-05, 'epoch': 0.75} {'loss': 0.5172, 'learning_rate': 1.4421894999861664e-05, 'epoch': 0.75} {'loss': 0.4167, 'learning_rate': 1.4421593651734016e-05, 'epoch': 0.75} {'loss': 0.4588, 'learning_rate': 1.442129229861523e-05, 'epoch': 0.75} {'loss': 0.6112, 'learning_rate': 1.4420990940505646e-05, 'epoch': 0.75} {'loss': 0.3579, 'learning_rate': 1.4420689577405605e-05, 'epoch': 0.75} {'loss': 0.6183, 'learning_rate': 1.4420388209315445e-05, 'epoch': 0.75} {'loss': 0.5184, 'learning_rate': 1.4420086836235508e-05, 'epoch': 0.75} {'loss': 0.6184, 'learning_rate': 1.4419785458166133e-05, 'epoch': 0.75} {'loss': 0.4939, 'learning_rate': 1.4419484075107661e-05, 'epoch': 0.75} {'loss': 0.5386, 'learning_rate': 1.4419182687060431e-05, 'epoch': 0.75} {'loss': 0.6292, 'learning_rate': 1.4418881294024785e-05, 'epoch': 0.75} {'loss': 0.582, 'learning_rate': 1.441857989600106e-05, 'epoch': 0.75} {'loss': 0.5064, 'learning_rate': 1.4418278492989601e-05, 'epoch': 0.75} {'loss': 0.4196, 'learning_rate': 1.4417977084990746e-05, 'epoch': 0.75} {'loss': 0.4909, 'learning_rate': 1.4417675672004833e-05, 'epoch': 0.75} {'loss': 0.6392, 'learning_rate': 1.4417374254032205e-05, 'epoch': 0.75} {'loss': 0.6281, 'learning_rate': 1.4417072831073205e-05, 'epoch': 0.75} {'loss': 0.4811, 'learning_rate': 1.4416771403128165e-05, 'epoch': 0.75} {'loss': 0.4829, 'learning_rate': 1.4416469970197433e-05, 'epoch': 0.75} {'loss': 0.6695, 'learning_rate': 1.4416168532281342e-05, 'epoch': 0.75} {'loss': 0.4926, 'learning_rate': 1.4415867089380241e-05, 'epoch': 0.75} {'loss': 0.5434, 'learning_rate': 1.4415565641494464e-05, 'epoch': 0.75} {'loss': 0.6435, 'learning_rate': 1.4415264188624356e-05, 'epoch': 0.75} {'loss': 0.5389, 'learning_rate': 1.441496273077025e-05, 'epoch': 0.75} {'loss': 0.4912, 'learning_rate': 1.4414661267932492e-05, 'epoch': 0.75} {'loss': 0.6028, 'learning_rate': 1.4414359800111422e-05, 'epoch': 0.75} {'loss': 0.7034, 'learning_rate': 1.4414058327307378e-05, 'epoch': 0.75} {'loss': 0.5513, 'learning_rate': 1.4413756849520702e-05, 'epoch': 0.75} {'loss': 0.5461, 'learning_rate': 1.4413455366751734e-05, 'epoch': 0.75} {'loss': 0.6595, 'learning_rate': 1.4413153879000814e-05, 'epoch': 0.75} {'loss': 0.605, 'learning_rate': 1.4412852386268282e-05, 'epoch': 0.75} {'loss': 0.6317, 'learning_rate': 1.441255088855448e-05, 'epoch': 0.75} {'loss': 0.4397, 'learning_rate': 1.4412249385859745e-05, 'epoch': 0.75} {'loss': 0.6773, 'learning_rate': 1.441194787818442e-05, 'epoch': 0.75} {'loss': 0.4977, 'learning_rate': 1.4411646365528846e-05, 'epoch': 0.75} {'loss': 0.6361, 'learning_rate': 1.4411344847893362e-05, 'epoch': 0.75} {'loss': 0.6449, 'learning_rate': 1.4411043325278308e-05, 'epoch': 0.75} {'loss': 0.4704, 'learning_rate': 1.4410741797684026e-05, 'epoch': 0.75} {'loss': 0.6126, 'learning_rate': 1.4410440265110855e-05, 'epoch': 0.75} {'loss': 0.5003, 'learning_rate': 1.4410138727559135e-05, 'epoch': 0.75} {'loss': 0.6207, 'learning_rate': 1.4409837185029208e-05, 'epoch': 0.75} {'loss': 0.6336, 'learning_rate': 1.440953563752141e-05, 'epoch': 0.75} {'loss': 0.4733, 'learning_rate': 1.4409234085036088e-05, 'epoch': 0.75} {'loss': 0.7055, 'learning_rate': 1.4408932527573578e-05, 'epoch': 0.75} {'loss': 0.6641, 'learning_rate': 1.4408630965134223e-05, 'epoch': 0.75} {'loss': 0.5552, 'learning_rate': 1.4408329397718359e-05, 'epoch': 0.75} {'loss': 0.5453, 'learning_rate': 1.4408027825326333e-05, 'epoch': 0.75} {'loss': 0.5287, 'learning_rate': 1.440772624795848e-05, 'epoch': 0.75} {'loss': 0.4239, 'learning_rate': 1.4407424665615144e-05, 'epoch': 0.75} {'loss': 0.5334, 'learning_rate': 1.440712307829666e-05, 'epoch': 0.75} {'loss': 0.5334, 'learning_rate': 1.4406821486003375e-05, 'epoch': 0.75} {'loss': 0.6287, 'learning_rate': 1.4406519888735625e-05, 'epoch': 0.75} {'loss': 0.6422, 'learning_rate': 1.4406218286493753e-05, 'epoch': 0.75} {'loss': 0.4023, 'learning_rate': 1.4405916679278098e-05, 'epoch': 0.75} {'loss': 0.5488, 'learning_rate': 1.4405615067089e-05, 'epoch': 0.75} {'loss': 0.6705, 'learning_rate': 1.4405313449926803e-05, 'epoch': 0.75} {'loss': 0.6888, 'learning_rate': 1.4405011827791842e-05, 'epoch': 0.75} {'loss': 0.6006, 'learning_rate': 1.4404710200684462e-05, 'epoch': 0.75} {'loss': 0.5183, 'learning_rate': 1.4404408568605002e-05, 'epoch': 0.75} {'loss': 0.6457, 'learning_rate': 1.4404106931553801e-05, 'epoch': 0.75} {'loss': 0.5368, 'learning_rate': 1.44038052895312e-05, 'epoch': 0.75} {'loss': 0.6241, 'learning_rate': 1.4403503642537542e-05, 'epoch': 0.75} {'loss': 0.5977, 'learning_rate': 1.4403201990573164e-05, 'epoch': 0.75} {'loss': 0.5705, 'learning_rate': 1.440290033363841e-05, 'epoch': 0.75} {'loss': 0.4367, 'learning_rate': 1.4402598671733619e-05, 'epoch': 0.75} {'loss': 0.4709, 'learning_rate': 1.440229700485913e-05, 'epoch': 0.75} {'loss': 0.7286, 'learning_rate': 1.4401995333015284e-05, 'epoch': 0.75} {'loss': 0.6106, 'learning_rate': 1.4401693656202425e-05, 'epoch': 0.75} {'loss': 0.4637, 'learning_rate': 1.4401391974420888e-05, 'epoch': 0.75} {'loss': 0.5757, 'learning_rate': 1.4401090287671018e-05, 'epoch': 0.75} {'loss': 0.5869, 'learning_rate': 1.4400788595953154e-05, 'epoch': 0.75} {'loss': 0.5572, 'learning_rate': 1.4400486899267637e-05, 'epoch': 0.75} {'loss': 0.6093, 'learning_rate': 1.4400185197614808e-05, 'epoch': 0.75} {'loss': 0.5677, 'learning_rate': 1.4399883490995005e-05, 'epoch': 0.75} {'loss': 0.6159, 'learning_rate': 1.439958177940857e-05, 'epoch': 0.75} {'loss': 0.6209, 'learning_rate': 1.4399280062855845e-05, 'epoch': 0.75} {'loss': 0.6445, 'learning_rate': 1.4398978341337168e-05, 'epoch': 0.75} {'loss': 0.7328, 'learning_rate': 1.4398676614852883e-05, 'epoch': 0.75} {'loss': 0.5914, 'learning_rate': 1.4398374883403325e-05, 'epoch': 0.75} {'loss': 0.6725, 'learning_rate': 1.439807314698884e-05, 'epoch': 0.75} {'loss': 0.5443, 'learning_rate': 1.4397771405609769e-05, 'epoch': 0.75} {'loss': 0.5327, 'learning_rate': 1.4397469659266447e-05, 'epoch': 0.75} {'loss': 0.6352, 'learning_rate': 1.439716790795922e-05, 'epoch': 0.75} {'loss': 0.6879, 'learning_rate': 1.4396866151688425e-05, 'epoch': 0.75} {'loss': 0.7368, 'learning_rate': 1.4396564390454405e-05, 'epoch': 0.75} {'loss': 0.6283, 'learning_rate': 1.4396262624257503e-05, 'epoch': 0.75} {'loss': 0.6712, 'learning_rate': 1.4395960853098052e-05, 'epoch': 0.75} {'loss': 0.4951, 'learning_rate': 1.4395659076976399e-05, 'epoch': 0.75} {'loss': 0.5353, 'learning_rate': 1.4395357295892883e-05, 'epoch': 0.75} {'loss': 0.5345, 'learning_rate': 1.4395055509847841e-05, 'epoch': 0.75} {'loss': 0.5766, 'learning_rate': 1.439475371884162e-05, 'epoch': 0.75} {'loss': 0.5594, 'learning_rate': 1.439445192287456e-05, 'epoch': 0.75} {'loss': 0.5617, 'learning_rate': 1.4394150121946995e-05, 'epoch': 0.75} {'loss': 0.5201, 'learning_rate': 1.4393848316059274e-05, 'epoch': 0.75} {'loss': 0.7293, 'learning_rate': 1.439354650521173e-05, 'epoch': 0.75} {'loss': 0.5886, 'learning_rate': 1.439324468940471e-05, 'epoch': 0.75} {'loss': 0.5506, 'learning_rate': 1.4392942868638553e-05, 'epoch': 0.75} {'loss': 0.5485, 'learning_rate': 1.4392641042913595e-05, 'epoch': 0.75} {'loss': 0.6869, 'learning_rate': 1.4392339212230186e-05, 'epoch': 0.75} {'loss': 0.5194, 'learning_rate': 1.439203737658866e-05, 'epoch': 0.75} {'loss': 0.6564, 'learning_rate': 1.4391735535989354e-05, 'epoch': 0.75} {'loss': 0.6449, 'learning_rate': 1.439143369043262e-05, 'epoch': 0.75} {'loss': 0.4844, 'learning_rate': 1.4391131839918785e-05, 'epoch': 0.75} {'loss': 0.6014, 'learning_rate': 1.4390829984448202e-05, 'epoch': 0.75} {'loss': 0.5675, 'learning_rate': 1.4390528124021208e-05, 'epoch': 0.75} {'loss': 0.6516, 'learning_rate': 1.4390226258638142e-05, 'epoch': 0.75} {'loss': 0.6123, 'learning_rate': 1.4389924388299344e-05, 'epoch': 0.75} {'loss': 0.5713, 'learning_rate': 1.4389622513005158e-05, 'epoch': 0.75} {'loss': 0.5761, 'learning_rate': 1.4389320632755918e-05, 'epoch': 0.75} {'loss': 0.5482, 'learning_rate': 1.4389018747551975e-05, 'epoch': 0.75} {'loss': 0.5305, 'learning_rate': 1.4388716857393662e-05, 'epoch': 0.75} {'loss': 0.4714, 'learning_rate': 1.4388414962281323e-05, 'epoch': 0.75} {'loss': 0.4305, 'learning_rate': 1.43881130622153e-05, 'epoch': 0.75} {'loss': 0.5653, 'learning_rate': 1.4387811157195928e-05, 'epoch': 0.75} {'loss': 0.653, 'learning_rate': 1.4387509247223552e-05, 'epoch': 0.75} {'loss': 0.5267, 'learning_rate': 1.4387207332298514e-05, 'epoch': 0.75} {'loss': 0.7145, 'learning_rate': 1.4386905412421153e-05, 'epoch': 0.75} {'loss': 0.7068, 'learning_rate': 1.4386603487591808e-05, 'epoch': 0.75} {'loss': 0.6449, 'learning_rate': 1.4386301557810824e-05, 'epoch': 0.75} {'loss': 0.6062, 'learning_rate': 1.4385999623078539e-05, 'epoch': 0.75} {'loss': 0.4547, 'learning_rate': 1.4385697683395296e-05, 'epoch': 0.75} {'loss': 0.5376, 'learning_rate': 1.4385395738761434e-05, 'epoch': 0.75} {'loss': 0.5964, 'learning_rate': 1.4385093789177293e-05, 'epoch': 0.75} {'loss': 0.3963, 'learning_rate': 1.4384791834643217e-05, 'epoch': 0.75} {'loss': 0.5066, 'learning_rate': 1.4384489875159541e-05, 'epoch': 0.75} {'loss': 0.4647, 'learning_rate': 1.4384187910726613e-05, 'epoch': 0.75} {'loss': 0.5524, 'learning_rate': 1.4383885941344769e-05, 'epoch': 0.75} {'loss': 0.7927, 'learning_rate': 1.438358396701435e-05, 'epoch': 0.75} {'loss': 0.4391, 'learning_rate': 1.43832819877357e-05, 'epoch': 0.75} {'loss': 0.583, 'learning_rate': 1.4382980003509159e-05, 'epoch': 0.75} {'loss': 0.5461, 'learning_rate': 1.4382678014335066e-05, 'epoch': 0.75} {'loss': 0.5327, 'learning_rate': 1.4382376020213763e-05, 'epoch': 0.75} {'loss': 0.5947, 'learning_rate': 1.438207402114559e-05, 'epoch': 0.75} {'loss': 0.5904, 'learning_rate': 1.4381772017130891e-05, 'epoch': 0.75} {'loss': 0.5686, 'learning_rate': 1.4381470008170005e-05, 'epoch': 0.75} {'loss': 0.6311, 'learning_rate': 1.4381167994263269e-05, 'epoch': 0.75} {'loss': 0.2954, 'learning_rate': 1.4380865975411028e-05, 'epoch': 0.75} {'loss': 0.5427, 'learning_rate': 1.4380563951613625e-05, 'epoch': 0.75} {'loss': 0.5808, 'learning_rate': 1.4380261922871397e-05, 'epoch': 0.75} {'loss': 0.5461, 'learning_rate': 1.4379959889184685e-05, 'epoch': 0.75} {'loss': 0.6576, 'learning_rate': 1.4379657850553832e-05, 'epoch': 0.75} {'loss': 0.5209, 'learning_rate': 1.4379355806979178e-05, 'epoch': 0.75} {'loss': 0.7507, 'learning_rate': 1.4379053758461066e-05, 'epoch': 0.75} {'loss': 0.6029, 'learning_rate': 1.4378751704999831e-05, 'epoch': 0.75} {'loss': 0.5329, 'learning_rate': 1.4378449646595823e-05, 'epoch': 0.75} {'loss': 0.7016, 'learning_rate': 1.4378147583249373e-05, 'epoch': 0.75} {'loss': 0.4791, 'learning_rate': 1.4377845514960829e-05, 'epoch': 0.75} {'loss': 0.5677, 'learning_rate': 1.437754344173053e-05, 'epoch': 0.75} {'loss': 0.5041, 'learning_rate': 1.437724136355882e-05, 'epoch': 0.75} {'loss': 0.585, 'learning_rate': 1.4376939280446034e-05, 'epoch': 0.75} {'loss': 0.4522, 'learning_rate': 1.4376637192392516e-05, 'epoch': 0.75} {'loss': 0.4615, 'learning_rate': 1.4376335099398606e-05, 'epoch': 0.75} {'loss': 0.5247, 'learning_rate': 1.4376033001464647e-05, 'epoch': 0.75} {'loss': 0.6224, 'learning_rate': 1.4375730898590978e-05, 'epoch': 0.75} {'loss': 0.4025, 'learning_rate': 1.4375428790777941e-05, 'epoch': 0.75} {'loss': 0.472, 'learning_rate': 1.4375126678025876e-05, 'epoch': 0.75} {'loss': 0.4957, 'learning_rate': 1.4374824560335128e-05, 'epoch': 0.75} {'loss': 0.5767, 'learning_rate': 1.4374522437706033e-05, 'epoch': 0.75} {'loss': 0.5856, 'learning_rate': 1.4374220310138933e-05, 'epoch': 0.75} {'loss': 0.4401, 'learning_rate': 1.4373918177634172e-05, 'epoch': 0.75} {'loss': 0.3846, 'learning_rate': 1.4373616040192087e-05, 'epoch': 0.75} {'loss': 0.6885, 'learning_rate': 1.4373313897813024e-05, 'epoch': 0.75} {'loss': 0.4739, 'learning_rate': 1.4373011750497318e-05, 'epoch': 0.75} {'loss': 0.5158, 'learning_rate': 1.4372709598245315e-05, 'epoch': 0.75} {'loss': 0.5953, 'learning_rate': 1.4372407441057354e-05, 'epoch': 0.75} {'loss': 0.6341, 'learning_rate': 1.4372105278933778e-05, 'epoch': 0.75} {'loss': 0.4571, 'learning_rate': 1.4371803111874924e-05, 'epoch': 0.75} {'loss': 0.7056, 'learning_rate': 1.4371500939881138e-05, 'epoch': 0.75} {'loss': 0.4255, 'learning_rate': 1.4371198762952759e-05, 'epoch': 0.75} {'loss': 0.5082, 'learning_rate': 1.4370896581090125e-05, 'epoch': 0.75} {'loss': 0.6426, 'learning_rate': 1.4370594394293582e-05, 'epoch': 0.75} {'loss': 0.508, 'learning_rate': 1.4370292202563469e-05, 'epoch': 0.75} {'loss': 0.4973, 'learning_rate': 1.4369990005900127e-05, 'epoch': 0.75} {'loss': 0.5026, 'learning_rate': 1.4369687804303898e-05, 'epoch': 0.75} {'loss': 0.5843, 'learning_rate': 1.4369385597775121e-05, 'epoch': 0.75} {'loss': 0.4559, 'learning_rate': 1.436908338631414e-05, 'epoch': 0.75} {'loss': 0.7028, 'learning_rate': 1.4368781169921292e-05, 'epoch': 0.75} {'loss': 0.4053, 'learning_rate': 1.4368478948596922e-05, 'epoch': 0.75} {'loss': 0.6213, 'learning_rate': 1.4368176722341371e-05, 'epoch': 0.75} {'loss': 0.6634, 'learning_rate': 1.4367874491154979e-05, 'epoch': 0.75} {'loss': 0.5965, 'learning_rate': 1.4367572255038086e-05, 'epoch': 0.75} {'loss': 0.6292, 'learning_rate': 1.4367270013991035e-05, 'epoch': 0.75} {'loss': 0.5489, 'learning_rate': 1.4366967768014166e-05, 'epoch': 0.75} {'loss': 0.4844, 'learning_rate': 1.4366665517107822e-05, 'epoch': 0.75} {'loss': 0.6905, 'learning_rate': 1.4366363261272345e-05, 'epoch': 0.75} {'loss': 0.6376, 'learning_rate': 1.4366061000508072e-05, 'epoch': 0.75} {'loss': 0.6304, 'learning_rate': 1.4365758734815346e-05, 'epoch': 0.75} {'loss': 0.5546, 'learning_rate': 1.4365456464194509e-05, 'epoch': 0.75} {'loss': 0.5927, 'learning_rate': 1.4365154188645903e-05, 'epoch': 0.75} {'loss': 0.7609, 'learning_rate': 1.4364851908169866e-05, 'epoch': 0.75} {'loss': 0.4597, 'learning_rate': 1.436454962276674e-05, 'epoch': 0.75} {'loss': 0.7127, 'learning_rate': 1.436424733243687e-05, 'epoch': 0.75} {'loss': 0.5212, 'learning_rate': 1.4363945037180594e-05, 'epoch': 0.75} {'loss': 0.5301, 'learning_rate': 1.4363642736998254e-05, 'epoch': 0.75} {'loss': 0.6477, 'learning_rate': 1.4363340431890188e-05, 'epoch': 0.75} {'loss': 0.604, 'learning_rate': 1.4363038121856745e-05, 'epoch': 0.75} {'loss': 0.4249, 'learning_rate': 1.4362735806898261e-05, 'epoch': 0.75} {'loss': 0.6209, 'learning_rate': 1.4362433487015078e-05, 'epoch': 0.75} {'loss': 0.5686, 'learning_rate': 1.4362131162207535e-05, 'epoch': 0.75} {'loss': 0.5367, 'learning_rate': 1.4361828832475976e-05, 'epoch': 0.75} {'loss': 0.523, 'learning_rate': 1.4361526497820744e-05, 'epoch': 0.75} {'loss': 0.5108, 'learning_rate': 1.4361224158242175e-05, 'epoch': 0.75} {'loss': 0.5412, 'learning_rate': 1.4360921813740613e-05, 'epoch': 0.75} {'loss': 0.5949, 'learning_rate': 1.43606194643164e-05, 'epoch': 0.75} {'loss': 0.6678, 'learning_rate': 1.436031710996988e-05, 'epoch': 0.75} {'loss': 0.5921, 'learning_rate': 1.4360014750701387e-05, 'epoch': 0.75} {'loss': 0.6188, 'learning_rate': 1.4359712386511268e-05, 'epoch': 0.75} {'loss': 0.6174, 'learning_rate': 1.4359410017399863e-05, 'epoch': 0.75} {'loss': 0.6044, 'learning_rate': 1.4359107643367514e-05, 'epoch': 0.75} {'loss': 0.5974, 'learning_rate': 1.435880526441456e-05, 'epoch': 0.75} {'loss': 0.5919, 'learning_rate': 1.4358502880541346e-05, 'epoch': 0.75} {'loss': 0.5359, 'learning_rate': 1.4358200491748209e-05, 'epoch': 0.75} {'loss': 0.5254, 'learning_rate': 1.435789809803549e-05, 'epoch': 0.75} {'loss': 0.563, 'learning_rate': 1.4357595699403537e-05, 'epoch': 0.75} {'loss': 0.5572, 'learning_rate': 1.4357293295852684e-05, 'epoch': 0.75} {'loss': 0.5459, 'learning_rate': 1.4356990887383277e-05, 'epoch': 0.75} {'loss': 0.5976, 'learning_rate': 1.4356688473995658e-05, 'epoch': 0.75} {'loss': 0.4365, 'learning_rate': 1.4356386055690162e-05, 'epoch': 0.75} {'loss': 0.5688, 'learning_rate': 1.4356083632467135e-05, 'epoch': 0.75} {'loss': 0.6001, 'learning_rate': 1.4355781204326919e-05, 'epoch': 0.75} {'loss': 0.6074, 'learning_rate': 1.4355478771269855e-05, 'epoch': 0.75} {'loss': 0.6274, 'learning_rate': 1.4355176333296286e-05, 'epoch': 0.75} {'loss': 0.5628, 'learning_rate': 1.4354873890406548e-05, 'epoch': 0.75} {'loss': 0.552, 'learning_rate': 1.4354571442600987e-05, 'epoch': 0.75} {'loss': 0.4586, 'learning_rate': 1.4354268989879941e-05, 'epoch': 0.75} {'loss': 0.6382, 'learning_rate': 1.4353966532243754e-05, 'epoch': 0.75} {'loss': 0.6388, 'learning_rate': 1.4353664069692767e-05, 'epoch': 0.75} {'loss': 0.4886, 'learning_rate': 1.435336160222732e-05, 'epoch': 0.75} {'loss': 0.7061, 'learning_rate': 1.4353059129847756e-05, 'epoch': 0.75} {'loss': 0.5212, 'learning_rate': 1.4352756652554419e-05, 'epoch': 0.75} {'loss': 0.4701, 'learning_rate': 1.4352454170347646e-05, 'epoch': 0.75} {'loss': 0.5452, 'learning_rate': 1.4352151683227777e-05, 'epoch': 0.75} {'loss': 0.5944, 'learning_rate': 1.4351849191195158e-05, 'epoch': 0.75} {'loss': 0.3986, 'learning_rate': 1.4351546694250129e-05, 'epoch': 0.75} {'loss': 0.57, 'learning_rate': 1.4351244192393035e-05, 'epoch': 0.75} {'loss': 0.583, 'learning_rate': 1.435094168562421e-05, 'epoch': 0.75} {'loss': 0.4965, 'learning_rate': 1.4350639173943999e-05, 'epoch': 0.75} {'loss': 0.6838, 'learning_rate': 1.4350336657352743e-05, 'epoch': 0.75} {'loss': 0.5496, 'learning_rate': 1.4350034135850786e-05, 'epoch': 0.75} {'loss': 0.4783, 'learning_rate': 1.4349731609438466e-05, 'epoch': 0.75} {'loss': 0.5686, 'learning_rate': 1.4349429078116126e-05, 'epoch': 0.75} {'loss': 0.6386, 'learning_rate': 1.434912654188411e-05, 'epoch': 0.75} {'loss': 0.4351, 'learning_rate': 1.4348824000742756e-05, 'epoch': 0.75} {'loss': 0.5453, 'learning_rate': 1.4348521454692406e-05, 'epoch': 0.75} {'loss': 0.6457, 'learning_rate': 1.4348218903733402e-05, 'epoch': 0.75} {'loss': 0.5443, 'learning_rate': 1.4347916347866087e-05, 'epoch': 0.75} {'loss': 0.5956, 'learning_rate': 1.43476137870908e-05, 'epoch': 0.75} {'loss': 0.7006, 'learning_rate': 1.4347311221407888e-05, 'epoch': 0.75} {'loss': 0.6983, 'learning_rate': 1.4347008650817684e-05, 'epoch': 0.75} {'loss': 0.513, 'learning_rate': 1.4346706075320534e-05, 'epoch': 0.75} {'loss': 0.6575, 'learning_rate': 1.4346403494916779e-05, 'epoch': 0.75} {'loss': 0.6662, 'learning_rate': 1.4346100909606762e-05, 'epoch': 0.75} {'loss': 0.6611, 'learning_rate': 1.4345798319390824e-05, 'epoch': 0.75} {'loss': 0.5634, 'learning_rate': 1.4345495724269304e-05, 'epoch': 0.75} {'loss': 0.6394, 'learning_rate': 1.4345193124242549e-05, 'epoch': 0.75} {'loss': 0.532, 'learning_rate': 1.4344890519310894e-05, 'epoch': 0.75} {'loss': 0.5315, 'learning_rate': 1.4344587909474686e-05, 'epoch': 0.75} {'loss': 0.6258, 'learning_rate': 1.4344285294734263e-05, 'epoch': 0.75} {'loss': 0.4808, 'learning_rate': 1.434398267508997e-05, 'epoch': 0.75} {'loss': 0.5776, 'learning_rate': 1.4343680050542144e-05, 'epoch': 0.75} {'loss': 0.5066, 'learning_rate': 1.4343377421091131e-05, 'epoch': 0.75} {'loss': 0.4767, 'learning_rate': 1.434307478673727e-05, 'epoch': 0.75} {'loss': 0.6076, 'learning_rate': 1.4342772147480904e-05, 'epoch': 0.75} {'loss': 0.6953, 'learning_rate': 1.4342469503322373e-05, 'epoch': 0.75} {'loss': 0.5369, 'learning_rate': 1.4342166854262021e-05, 'epoch': 0.75} {'loss': 0.7041, 'learning_rate': 1.4341864200300189e-05, 'epoch': 0.75} {'loss': 0.4978, 'learning_rate': 1.4341561541437214e-05, 'epoch': 0.75} {'loss': 0.5858, 'learning_rate': 1.4341258877673445e-05, 'epoch': 0.75} {'loss': 0.5811, 'learning_rate': 1.434095620900922e-05, 'epoch': 0.75} {'loss': 0.5017, 'learning_rate': 1.4340653535444879e-05, 'epoch': 0.75} {'loss': 0.6215, 'learning_rate': 1.4340350856980769e-05, 'epoch': 0.75} {'loss': 0.5755, 'learning_rate': 1.4340048173617227e-05, 'epoch': 0.75} {'loss': 0.6757, 'learning_rate': 1.4339745485354594e-05, 'epoch': 0.75} {'loss': 0.5959, 'learning_rate': 1.4339442792193217e-05, 'epoch': 0.75} {'loss': 0.6745, 'learning_rate': 1.4339140094133432e-05, 'epoch': 0.75} {'loss': 0.6502, 'learning_rate': 1.4338837391175582e-05, 'epoch': 0.75} {'loss': 0.5666, 'learning_rate': 1.4338534683320011e-05, 'epoch': 0.75} {'loss': 0.566, 'learning_rate': 1.433823197056706e-05, 'epoch': 0.75} {'loss': 0.682, 'learning_rate': 1.4337929252917068e-05, 'epoch': 0.75} {'loss': 0.4709, 'learning_rate': 1.433762653037038e-05, 'epoch': 0.75} {'loss': 0.4013, 'learning_rate': 1.4337323802927337e-05, 'epoch': 0.75} {'loss': 0.5898, 'learning_rate': 1.433702107058828e-05, 'epoch': 0.75} {'loss': 0.6276, 'learning_rate': 1.433671833335355e-05, 'epoch': 0.75} {'loss': 0.5658, 'learning_rate': 1.433641559122349e-05, 'epoch': 0.75} {'loss': 0.7231, 'learning_rate': 1.4336112844198442e-05, 'epoch': 0.75} {'loss': 0.6283, 'learning_rate': 1.4335810092278747e-05, 'epoch': 0.75} {'loss': 0.4949, 'learning_rate': 1.4335507335464747e-05, 'epoch': 0.75} {'loss': 0.6318, 'learning_rate': 1.4335204573756785e-05, 'epoch': 0.75} {'loss': 0.525, 'learning_rate': 1.4334901807155199e-05, 'epoch': 0.75} {'loss': 0.5036, 'learning_rate': 1.4334599035660333e-05, 'epoch': 0.75} {'loss': 0.6757, 'learning_rate': 1.4334296259272531e-05, 'epoch': 0.75} {'loss': 0.3957, 'learning_rate': 1.4333993477992132e-05, 'epoch': 0.75} {'loss': 0.4468, 'learning_rate': 1.4333690691819478e-05, 'epoch': 0.75} {'loss': 0.7294, 'learning_rate': 1.433338790075491e-05, 'epoch': 0.75} {'loss': 0.4929, 'learning_rate': 1.4333085104798773e-05, 'epoch': 0.75} {'loss': 0.5544, 'learning_rate': 1.4332782303951405e-05, 'epoch': 0.75} {'loss': 0.456, 'learning_rate': 1.4332479498213153e-05, 'epoch': 0.75} {'loss': 0.6137, 'learning_rate': 1.4332176687584354e-05, 'epoch': 0.75} {'loss': 0.6587, 'learning_rate': 1.4331873872065351e-05, 'epoch': 0.75} {'loss': 0.6077, 'learning_rate': 1.4331571051656485e-05, 'epoch': 0.75} {'loss': 0.5363, 'learning_rate': 1.4331268226358102e-05, 'epoch': 0.75} {'loss': 0.5655, 'learning_rate': 1.4330965396170538e-05, 'epoch': 0.75} {'loss': 0.7841, 'learning_rate': 1.4330662561094137e-05, 'epoch': 0.75} {'loss': 0.4778, 'learning_rate': 1.4330359721129244e-05, 'epoch': 0.75} {'loss': 0.6514, 'learning_rate': 1.4330056876276197e-05, 'epoch': 0.75} {'loss': 0.6183, 'learning_rate': 1.432975402653534e-05, 'epoch': 0.75} {'loss': 0.4914, 'learning_rate': 1.4329451171907014e-05, 'epoch': 0.75} {'loss': 0.4965, 'learning_rate': 1.432914831239156e-05, 'epoch': 0.75} {'loss': 0.535, 'learning_rate': 1.4328845447989321e-05, 'epoch': 0.75} {'loss': 0.5259, 'learning_rate': 1.432854257870064e-05, 'epoch': 0.75} {'loss': 0.5368, 'learning_rate': 1.4328239704525855e-05, 'epoch': 0.75} {'loss': 0.6345, 'learning_rate': 1.4327936825465312e-05, 'epoch': 0.75} {'loss': 0.597, 'learning_rate': 1.432763394151935e-05, 'epoch': 0.76} {'loss': 0.4112, 'learning_rate': 1.4327331052688313e-05, 'epoch': 0.76} {'loss': 0.7448, 'learning_rate': 1.4327028158972543e-05, 'epoch': 0.76} {'loss': 0.5174, 'learning_rate': 1.4326725260372381e-05, 'epoch': 0.76} {'loss': 0.488, 'learning_rate': 1.4326422356888168e-05, 'epoch': 0.76} {'loss': 0.4857, 'learning_rate': 1.4326119448520248e-05, 'epoch': 0.76} {'loss': 0.6601, 'learning_rate': 1.4325816535268959e-05, 'epoch': 0.76} {'loss': 0.5926, 'learning_rate': 1.4325513617134647e-05, 'epoch': 0.76} {'loss': 0.5311, 'learning_rate': 1.4325210694117658e-05, 'epoch': 0.76} {'loss': 0.5018, 'learning_rate': 1.4324907766218323e-05, 'epoch': 0.76} {'loss': 0.4608, 'learning_rate': 1.432460483343699e-05, 'epoch': 0.76} {'loss': 0.5362, 'learning_rate': 1.4324301895774002e-05, 'epoch': 0.76} {'loss': 0.5005, 'learning_rate': 1.4323998953229698e-05, 'epoch': 0.76} {'loss': 0.6334, 'learning_rate': 1.432369600580442e-05, 'epoch': 0.76} {'loss': 0.5666, 'learning_rate': 1.4323393053498516e-05, 'epoch': 0.76} {'loss': 0.6065, 'learning_rate': 1.432309009631232e-05, 'epoch': 0.76} {'loss': 0.6805, 'learning_rate': 1.432278713424618e-05, 'epoch': 0.76} {'loss': 0.6478, 'learning_rate': 1.4322484167300432e-05, 'epoch': 0.76} {'loss': 0.6887, 'learning_rate': 1.4322181195475422e-05, 'epoch': 0.76} {'loss': 0.5041, 'learning_rate': 1.4321878218771492e-05, 'epoch': 0.76} {'loss': 0.569, 'learning_rate': 1.4321575237188985e-05, 'epoch': 0.76} {'loss': 0.6581, 'learning_rate': 1.432127225072824e-05, 'epoch': 0.76} {'loss': 0.6445, 'learning_rate': 1.43209692593896e-05, 'epoch': 0.76} {'loss': 0.535, 'learning_rate': 1.4320666263173408e-05, 'epoch': 0.76} {'loss': 0.5866, 'learning_rate': 1.4320363262080007e-05, 'epoch': 0.76} {'loss': 0.5895, 'learning_rate': 1.4320060256109733e-05, 'epoch': 0.76} {'loss': 0.4831, 'learning_rate': 1.4319757245262935e-05, 'epoch': 0.76} {'loss': 0.5109, 'learning_rate': 1.4319454229539954e-05, 'epoch': 0.76} {'loss': 0.5658, 'learning_rate': 1.4319151208941127e-05, 'epoch': 0.76} {'loss': 0.4597, 'learning_rate': 1.4318848183466803e-05, 'epoch': 0.76} {'loss': 0.4483, 'learning_rate': 1.4318545153117317e-05, 'epoch': 0.76} {'loss': 0.3936, 'learning_rate': 1.4318242117893018e-05, 'epoch': 0.76} {'loss': 0.611, 'learning_rate': 1.4317939077794246e-05, 'epoch': 0.76} {'loss': 0.5337, 'learning_rate': 1.4317636032821338e-05, 'epoch': 0.76} {'loss': 0.5193, 'learning_rate': 1.4317332982974644e-05, 'epoch': 0.76} {'loss': 0.484, 'learning_rate': 1.43170299282545e-05, 'epoch': 0.76} {'loss': 0.4279, 'learning_rate': 1.4316726868661248e-05, 'epoch': 0.76} {'loss': 0.4984, 'learning_rate': 1.4316423804195234e-05, 'epoch': 0.76} {'loss': 0.5635, 'learning_rate': 1.4316120734856798e-05, 'epoch': 0.76} {'loss': 0.4568, 'learning_rate': 1.4315817660646282e-05, 'epoch': 0.76} {'loss': 0.6925, 'learning_rate': 1.431551458156403e-05, 'epoch': 0.76} {'loss': 0.6058, 'learning_rate': 1.4315211497610382e-05, 'epoch': 0.76} {'loss': 0.4323, 'learning_rate': 1.4314908408785682e-05, 'epoch': 0.76} {'loss': 0.646, 'learning_rate': 1.4314605315090268e-05, 'epoch': 0.76} {'loss': 0.5215, 'learning_rate': 1.4314302216524488e-05, 'epoch': 0.76} {'loss': 0.629, 'learning_rate': 1.431399911308868e-05, 'epoch': 0.76} {'loss': 0.6163, 'learning_rate': 1.4313696004783187e-05, 'epoch': 0.76} {'loss': 0.5702, 'learning_rate': 1.4313392891608352e-05, 'epoch': 0.76} {'loss': 0.601, 'learning_rate': 1.4313089773564515e-05, 'epoch': 0.76} {'loss': 0.5487, 'learning_rate': 1.4312786650652022e-05, 'epoch': 0.76} {'loss': 0.4954, 'learning_rate': 1.4312483522871211e-05, 'epoch': 0.76} {'loss': 0.3915, 'learning_rate': 1.4312180390222428e-05, 'epoch': 0.76} {'loss': 0.5788, 'learning_rate': 1.4311877252706013e-05, 'epoch': 0.76} {'loss': 0.5913, 'learning_rate': 1.4311574110322309e-05, 'epoch': 0.76} {'loss': 0.5011, 'learning_rate': 1.4311270963071656e-05, 'epoch': 0.76} {'loss': 0.6043, 'learning_rate': 1.43109678109544e-05, 'epoch': 0.76} {'loss': 0.6518, 'learning_rate': 1.4310664653970879e-05, 'epoch': 0.76} {'loss': 0.4691, 'learning_rate': 1.4310361492121439e-05, 'epoch': 0.76} {'loss': 0.7899, 'learning_rate': 1.4310058325406422e-05, 'epoch': 0.76} {'loss': 0.5807, 'learning_rate': 1.4309755153826165e-05, 'epoch': 0.76} {'loss': 0.6465, 'learning_rate': 1.4309451977381015e-05, 'epoch': 0.76} {'loss': 0.7636, 'learning_rate': 1.4309148796071315e-05, 'epoch': 0.76} {'loss': 0.5074, 'learning_rate': 1.4308845609897404e-05, 'epoch': 0.76} {'loss': 0.5313, 'learning_rate': 1.4308542418859626e-05, 'epoch': 0.76} {'loss': 0.4945, 'learning_rate': 1.4308239222958323e-05, 'epoch': 0.76} {'loss': 0.6618, 'learning_rate': 1.4307936022193836e-05, 'epoch': 0.76} {'loss': 0.6924, 'learning_rate': 1.4307632816566508e-05, 'epoch': 0.76} {'loss': 0.6136, 'learning_rate': 1.4307329606076686e-05, 'epoch': 0.76} {'loss': 0.4537, 'learning_rate': 1.4307026390724703e-05, 'epoch': 0.76} {'loss': 0.479, 'learning_rate': 1.4306723170510908e-05, 'epoch': 0.76} {'loss': 0.8141, 'learning_rate': 1.430641994543564e-05, 'epoch': 0.76} {'loss': 0.5383, 'learning_rate': 1.4306116715499248e-05, 'epoch': 0.76} {'loss': 0.6175, 'learning_rate': 1.4305813480702067e-05, 'epoch': 0.76} {'loss': 0.5116, 'learning_rate': 1.4305510241044438e-05, 'epoch': 0.76} {'loss': 0.6654, 'learning_rate': 1.430520699652671e-05, 'epoch': 0.76} {'loss': 0.5538, 'learning_rate': 1.4304903747149219e-05, 'epoch': 0.76} {'loss': 0.4322, 'learning_rate': 1.4304600492912313e-05, 'epoch': 0.76} {'loss': 0.412, 'learning_rate': 1.4304297233816331e-05, 'epoch': 0.76} {'loss': 0.7973, 'learning_rate': 1.4303993969861613e-05, 'epoch': 0.76} {'loss': 0.7181, 'learning_rate': 1.4303690701048507e-05, 'epoch': 0.76} {'loss': 0.539, 'learning_rate': 1.4303387427377354e-05, 'epoch': 0.76} {'loss': 0.2992, 'learning_rate': 1.4303084148848492e-05, 'epoch': 0.76} {'loss': 0.5633, 'learning_rate': 1.4302780865462267e-05, 'epoch': 0.76} {'loss': 0.5777, 'learning_rate': 1.4302477577219021e-05, 'epoch': 0.76} {'loss': 0.5659, 'learning_rate': 1.43021742841191e-05, 'epoch': 0.76} {'loss': 0.5767, 'learning_rate': 1.4301870986162836e-05, 'epoch': 0.76} {'loss': 0.6106, 'learning_rate': 1.4301567683350581e-05, 'epoch': 0.76} {'loss': 0.6432, 'learning_rate': 1.4301264375682673e-05, 'epoch': 0.76} {'loss': 0.6076, 'learning_rate': 1.4300961063159455e-05, 'epoch': 0.76} {'loss': 0.5442, 'learning_rate': 1.430065774578127e-05, 'epoch': 0.76} {'loss': 0.4806, 'learning_rate': 1.4300354423548461e-05, 'epoch': 0.76} {'loss': 0.5136, 'learning_rate': 1.4300051096461369e-05, 'epoch': 0.76} {'loss': 0.6318, 'learning_rate': 1.4299747764520337e-05, 'epoch': 0.76} {'loss': 0.6452, 'learning_rate': 1.4299444427725707e-05, 'epoch': 0.76} {'loss': 0.5067, 'learning_rate': 1.4299141086077823e-05, 'epoch': 0.76} {'loss': 0.634, 'learning_rate': 1.4298837739577025e-05, 'epoch': 0.76} {'loss': 0.4553, 'learning_rate': 1.4298534388223657e-05, 'epoch': 0.76} {'loss': 0.6314, 'learning_rate': 1.4298231032018062e-05, 'epoch': 0.76} {'loss': 0.6576, 'learning_rate': 1.429792767096058e-05, 'epoch': 0.76} {'loss': 0.3366, 'learning_rate': 1.4297624305051556e-05, 'epoch': 0.76} {'loss': 0.5256, 'learning_rate': 1.4297320934291333e-05, 'epoch': 0.76} {'loss': 0.4225, 'learning_rate': 1.4297017558680249e-05, 'epoch': 0.76} {'loss': 0.4574, 'learning_rate': 1.4296714178218649e-05, 'epoch': 0.76} {'loss': 0.6466, 'learning_rate': 1.4296410792906878e-05, 'epoch': 0.76} {'loss': 0.4978, 'learning_rate': 1.4296107402745274e-05, 'epoch': 0.76} {'loss': 0.6046, 'learning_rate': 1.4295804007734184e-05, 'epoch': 0.76} {'loss': 0.5339, 'learning_rate': 1.4295500607873947e-05, 'epoch': 0.76} {'loss': 0.4016, 'learning_rate': 1.4295197203164906e-05, 'epoch': 0.76} {'loss': 0.4192, 'learning_rate': 1.4294893793607406e-05, 'epoch': 0.76} {'loss': 0.5913, 'learning_rate': 1.4294590379201786e-05, 'epoch': 0.76} {'loss': 0.6974, 'learning_rate': 1.4294286959948393e-05, 'epoch': 0.76} {'loss': 0.6176, 'learning_rate': 1.4293983535847565e-05, 'epoch': 0.76} {'loss': 0.5662, 'learning_rate': 1.4293680106899643e-05, 'epoch': 0.76} {'loss': 0.6556, 'learning_rate': 1.4293376673104974e-05, 'epoch': 0.76} {'loss': 0.6199, 'learning_rate': 1.4293073234463904e-05, 'epoch': 0.76} {'loss': 0.6256, 'learning_rate': 1.4292769790976766e-05, 'epoch': 0.76} {'loss': 0.5281, 'learning_rate': 1.4292466342643907e-05, 'epoch': 0.76} {'loss': 0.6005, 'learning_rate': 1.429216288946567e-05, 'epoch': 0.76} {'loss': 0.5833, 'learning_rate': 1.4291859431442399e-05, 'epoch': 0.76} {'loss': 0.6369, 'learning_rate': 1.4291555968574432e-05, 'epoch': 0.76} {'loss': 0.6684, 'learning_rate': 1.4291252500862119e-05, 'epoch': 0.76} {'loss': 0.5192, 'learning_rate': 1.4290949028305796e-05, 'epoch': 0.76} {'loss': 0.4702, 'learning_rate': 1.4290645550905805e-05, 'epoch': 0.76} {'loss': 0.6578, 'learning_rate': 1.4290342068662496e-05, 'epoch': 0.76} {'loss': 0.7799, 'learning_rate': 1.4290038581576202e-05, 'epoch': 0.76} {'loss': 0.5155, 'learning_rate': 1.4289735089647272e-05, 'epoch': 0.76} {'loss': 0.5787, 'learning_rate': 1.4289431592876047e-05, 'epoch': 0.76} {'loss': 0.518, 'learning_rate': 1.4289128091262869e-05, 'epoch': 0.76} {'loss': 0.5981, 'learning_rate': 1.4288824584808081e-05, 'epoch': 0.76} {'loss': 0.5384, 'learning_rate': 1.4288521073512026e-05, 'epoch': 0.76} {'loss': 0.6327, 'learning_rate': 1.4288217557375047e-05, 'epoch': 0.76} {'loss': 0.4315, 'learning_rate': 1.4287914036397483e-05, 'epoch': 0.76} {'loss': 0.5352, 'learning_rate': 1.4287610510579681e-05, 'epoch': 0.76} {'loss': 0.5582, 'learning_rate': 1.4287306979921982e-05, 'epoch': 0.76} {'loss': 0.4668, 'learning_rate': 1.428700344442473e-05, 'epoch': 0.76} {'loss': 0.6119, 'learning_rate': 1.4286699904088266e-05, 'epoch': 0.76} {'loss': 0.4459, 'learning_rate': 1.428639635891293e-05, 'epoch': 0.76} {'loss': 0.6057, 'learning_rate': 1.4286092808899072e-05, 'epoch': 0.76} {'loss': 0.5495, 'learning_rate': 1.4285789254047027e-05, 'epoch': 0.76} {'loss': 0.4141, 'learning_rate': 1.4285485694357142e-05, 'epoch': 0.76} {'loss': 0.6936, 'learning_rate': 1.4285182129829758e-05, 'epoch': 0.76} {'loss': 0.6536, 'learning_rate': 1.4284878560465219e-05, 'epoch': 0.76} {'loss': 0.4725, 'learning_rate': 1.4284574986263865e-05, 'epoch': 0.76} {'loss': 0.5565, 'learning_rate': 1.4284271407226045e-05, 'epoch': 0.76} {'loss': 0.4874, 'learning_rate': 1.4283967823352094e-05, 'epoch': 0.76} {'loss': 0.6611, 'learning_rate': 1.4283664234642358e-05, 'epoch': 0.76} {'loss': 0.4218, 'learning_rate': 1.428336064109718e-05, 'epoch': 0.76} {'loss': 0.5393, 'learning_rate': 1.4283057042716901e-05, 'epoch': 0.76} {'loss': 0.5299, 'learning_rate': 1.4282753439501867e-05, 'epoch': 0.76} {'loss': 0.5465, 'learning_rate': 1.4282449831452418e-05, 'epoch': 0.76} {'loss': 0.6086, 'learning_rate': 1.4282146218568898e-05, 'epoch': 0.76} {'loss': 0.628, 'learning_rate': 1.428184260085165e-05, 'epoch': 0.76} {'loss': 0.5505, 'learning_rate': 1.4281538978301014e-05, 'epoch': 0.76} {'loss': 0.4187, 'learning_rate': 1.4281235350917334e-05, 'epoch': 0.76} {'loss': 0.626, 'learning_rate': 1.4280931718700956e-05, 'epoch': 0.76} {'loss': 0.5655, 'learning_rate': 1.428062808165222e-05, 'epoch': 0.76} {'loss': 0.742, 'learning_rate': 1.4280324439771466e-05, 'epoch': 0.76} {'loss': 0.6712, 'learning_rate': 1.4280020793059044e-05, 'epoch': 0.76} {'loss': 0.5131, 'learning_rate': 1.427971714151529e-05, 'epoch': 0.76} {'loss': 0.6285, 'learning_rate': 1.427941348514055e-05, 'epoch': 0.76} {'loss': 0.721, 'learning_rate': 1.4279109823935165e-05, 'epoch': 0.76} {'loss': 0.4947, 'learning_rate': 1.4278806157899478e-05, 'epoch': 0.76} {'loss': 0.6439, 'learning_rate': 1.4278502487033834e-05, 'epoch': 0.76} {'loss': 0.5508, 'learning_rate': 1.4278198811338573e-05, 'epoch': 0.76} {'loss': 0.7659, 'learning_rate': 1.427789513081404e-05, 'epoch': 0.76} {'loss': 0.6454, 'learning_rate': 1.4277591445460577e-05, 'epoch': 0.76} {'loss': 0.5115, 'learning_rate': 1.4277287755278526e-05, 'epoch': 0.76} {'loss': 0.5766, 'learning_rate': 1.427698406026823e-05, 'epoch': 0.76} {'loss': 0.6195, 'learning_rate': 1.4276680360430033e-05, 'epoch': 0.76} {'loss': 0.4457, 'learning_rate': 1.4276376655764277e-05, 'epoch': 0.76} {'loss': 0.705, 'learning_rate': 1.427607294627131e-05, 'epoch': 0.76} {'loss': 0.6174, 'learning_rate': 1.4275769231951463e-05, 'epoch': 0.76} {'loss': 0.6599, 'learning_rate': 1.4275465512805086e-05, 'epoch': 0.76} {'loss': 0.8367, 'learning_rate': 1.4275161788832526e-05, 'epoch': 0.76} {'loss': 0.5443, 'learning_rate': 1.4274858060034115e-05, 'epoch': 0.76} {'loss': 0.714, 'learning_rate': 1.4274554326410206e-05, 'epoch': 0.76} {'loss': 0.5867, 'learning_rate': 1.4274250587961139e-05, 'epoch': 0.76} {'loss': 0.7094, 'learning_rate': 1.4273946844687254e-05, 'epoch': 0.76} {'loss': 0.5675, 'learning_rate': 1.4273643096588896e-05, 'epoch': 0.76} {'loss': 0.4733, 'learning_rate': 1.4273339343666406e-05, 'epoch': 0.76} {'loss': 0.6657, 'learning_rate': 1.4273035585920131e-05, 'epoch': 0.76} {'loss': 0.5962, 'learning_rate': 1.427273182335041e-05, 'epoch': 0.76} {'loss': 0.6745, 'learning_rate': 1.4272428055957587e-05, 'epoch': 0.76} {'loss': 0.4652, 'learning_rate': 1.4272124283742011e-05, 'epoch': 0.76} {'loss': 0.477, 'learning_rate': 1.4271820506704012e-05, 'epoch': 0.76} {'loss': 0.5456, 'learning_rate': 1.4271516724843943e-05, 'epoch': 0.76} {'loss': 0.6436, 'learning_rate': 1.4271212938162142e-05, 'epoch': 0.76} {'loss': 0.7374, 'learning_rate': 1.4270909146658956e-05, 'epoch': 0.76} {'loss': 0.4771, 'learning_rate': 1.4270605350334723e-05, 'epoch': 0.76} {'loss': 0.5112, 'learning_rate': 1.4270301549189789e-05, 'epoch': 0.76} {'loss': 0.6129, 'learning_rate': 1.42699977432245e-05, 'epoch': 0.76} {'loss': 0.6425, 'learning_rate': 1.4269693932439192e-05, 'epoch': 0.76} {'loss': 0.5308, 'learning_rate': 1.4269390116834213e-05, 'epoch': 0.76} {'loss': 0.5705, 'learning_rate': 1.4269086296409904e-05, 'epoch': 0.76} {'loss': 0.8154, 'learning_rate': 1.4268782471166609e-05, 'epoch': 0.76} {'loss': 0.6877, 'learning_rate': 1.4268478641104668e-05, 'epoch': 0.76} {'loss': 0.4039, 'learning_rate': 1.4268174806224428e-05, 'epoch': 0.76} {'loss': 0.6129, 'learning_rate': 1.4267870966526232e-05, 'epoch': 0.76} {'loss': 0.5179, 'learning_rate': 1.4267567122010419e-05, 'epoch': 0.76} {'loss': 0.3607, 'learning_rate': 1.4267263272677334e-05, 'epoch': 0.76} {'loss': 0.5148, 'learning_rate': 1.4266959418527321e-05, 'epoch': 0.76} {'loss': 0.6409, 'learning_rate': 1.4266655559560723e-05, 'epoch': 0.76} {'loss': 0.4184, 'learning_rate': 1.426635169577788e-05, 'epoch': 0.76} {'loss': 0.4739, 'learning_rate': 1.426604782717914e-05, 'epoch': 0.76} {'loss': 0.7099, 'learning_rate': 1.426574395376484e-05, 'epoch': 0.76} {'loss': 0.6105, 'learning_rate': 1.426544007553533e-05, 'epoch': 0.76} {'loss': 0.5974, 'learning_rate': 1.4265136192490946e-05, 'epoch': 0.76} {'loss': 0.5166, 'learning_rate': 1.4264832304632039e-05, 'epoch': 0.76} {'loss': 0.5653, 'learning_rate': 1.4264528411958945e-05, 'epoch': 0.76} {'loss': 0.4079, 'learning_rate': 1.4264224514472007e-05, 'epoch': 0.76} {'loss': 0.4759, 'learning_rate': 1.426392061217157e-05, 'epoch': 0.76} {'loss': 0.6701, 'learning_rate': 1.4263616705057981e-05, 'epoch': 0.76} {'loss': 0.543, 'learning_rate': 1.4263312793131578e-05, 'epoch': 0.76} {'loss': 0.581, 'learning_rate': 1.4263008876392706e-05, 'epoch': 0.76} {'loss': 0.621, 'learning_rate': 1.4262704954841706e-05, 'epoch': 0.76} {'loss': 0.6056, 'learning_rate': 1.4262401028478925e-05, 'epoch': 0.76} {'loss': 0.6999, 'learning_rate': 1.42620970973047e-05, 'epoch': 0.76} {'loss': 0.6246, 'learning_rate': 1.4261793161319382e-05, 'epoch': 0.76} {'loss': 0.6744, 'learning_rate': 1.4261489220523307e-05, 'epoch': 0.76} {'loss': 0.6402, 'learning_rate': 1.4261185274916822e-05, 'epoch': 0.76} {'loss': 0.557, 'learning_rate': 1.4260881324500273e-05, 'epoch': 0.76} {'loss': 0.5491, 'learning_rate': 1.4260577369273996e-05, 'epoch': 0.76} {'loss': 0.297, 'learning_rate': 1.4260273409238337e-05, 'epoch': 0.76} {'loss': 0.7368, 'learning_rate': 1.4259969444393638e-05, 'epoch': 0.76} {'loss': 0.5941, 'learning_rate': 1.4259665474740245e-05, 'epoch': 0.76} {'loss': 0.6303, 'learning_rate': 1.4259361500278498e-05, 'epoch': 0.76} {'loss': 0.6164, 'learning_rate': 1.4259057521008746e-05, 'epoch': 0.76} {'loss': 0.5891, 'learning_rate': 1.4258753536931325e-05, 'epoch': 0.76} {'loss': 0.6281, 'learning_rate': 1.4258449548046583e-05, 'epoch': 0.76} {'loss': 0.6075, 'learning_rate': 1.4258145554354859e-05, 'epoch': 0.76} {'loss': 0.5688, 'learning_rate': 1.4257841555856498e-05, 'epoch': 0.76} {'loss': 0.2368, 'learning_rate': 1.4257537552551846e-05, 'epoch': 0.76} {'loss': 0.6315, 'learning_rate': 1.425723354444124e-05, 'epoch': 0.76} {'loss': 0.414, 'learning_rate': 1.4256929531525033e-05, 'epoch': 0.76} {'loss': 0.6773, 'learning_rate': 1.4256625513803557e-05, 'epoch': 0.76} {'loss': 0.6302, 'learning_rate': 1.4256321491277163e-05, 'epoch': 0.76} {'loss': 0.5866, 'learning_rate': 1.425601746394619e-05, 'epoch': 0.76} {'loss': 0.4845, 'learning_rate': 1.4255713431810983e-05, 'epoch': 0.76} {'loss': 0.6727, 'learning_rate': 1.4255409394871885e-05, 'epoch': 0.76} {'loss': 0.5351, 'learning_rate': 1.4255105353129237e-05, 'epoch': 0.76} {'loss': 0.54, 'learning_rate': 1.4254801306583386e-05, 'epoch': 0.76} {'loss': 0.3828, 'learning_rate': 1.4254497255234672e-05, 'epoch': 0.76} {'loss': 0.4419, 'learning_rate': 1.4254193199083441e-05, 'epoch': 0.76} {'loss': 0.4295, 'learning_rate': 1.4253889138130034e-05, 'epoch': 0.76} {'loss': 0.4394, 'learning_rate': 1.4253585072374795e-05, 'epoch': 0.76} {'loss': 0.5026, 'learning_rate': 1.4253281001818069e-05, 'epoch': 0.76} {'loss': 0.6137, 'learning_rate': 1.4252976926460196e-05, 'epoch': 0.76} {'loss': 0.57, 'learning_rate': 1.425267284630152e-05, 'epoch': 0.76} {'loss': 0.5571, 'learning_rate': 1.4252368761342388e-05, 'epoch': 0.76} {'loss': 0.5844, 'learning_rate': 1.4252064671583137e-05, 'epoch': 0.76} {'loss': 0.6327, 'learning_rate': 1.4251760577024116e-05, 'epoch': 0.76} {'loss': 0.6954, 'learning_rate': 1.4251456477665664e-05, 'epoch': 0.76} {'loss': 0.4959, 'learning_rate': 1.4251152373508128e-05, 'epoch': 0.76} {'loss': 0.674, 'learning_rate': 1.425084826455185e-05, 'epoch': 0.76} {'loss': 0.5594, 'learning_rate': 1.425054415079717e-05, 'epoch': 0.76} {'loss': 0.6273, 'learning_rate': 1.4250240032244434e-05, 'epoch': 0.76} {'loss': 0.474, 'learning_rate': 1.4249935908893986e-05, 'epoch': 0.76} {'loss': 0.6488, 'learning_rate': 1.4249631780746171e-05, 'epoch': 0.76} {'loss': 0.5625, 'learning_rate': 1.4249327647801328e-05, 'epoch': 0.76} {'loss': 0.562, 'learning_rate': 1.42490235100598e-05, 'epoch': 0.76} {'loss': 0.4731, 'learning_rate': 1.4248719367521934e-05, 'epoch': 0.76} {'loss': 0.5121, 'learning_rate': 1.4248415220188071e-05, 'epoch': 0.76} {'loss': 0.5004, 'learning_rate': 1.4248111068058559e-05, 'epoch': 0.76} {'loss': 0.6896, 'learning_rate': 1.4247806911133733e-05, 'epoch': 0.76} {'loss': 0.5751, 'learning_rate': 1.4247502749413943e-05, 'epoch': 0.76} {'loss': 0.5505, 'learning_rate': 1.4247198582899529e-05, 'epoch': 0.76} {'loss': 0.7443, 'learning_rate': 1.4246894411590835e-05, 'epoch': 0.76} {'loss': 0.6956, 'learning_rate': 1.4246590235488205e-05, 'epoch': 0.76} {'loss': 0.4818, 'learning_rate': 1.4246286054591983e-05, 'epoch': 0.76} {'loss': 0.5094, 'learning_rate': 1.424598186890251e-05, 'epoch': 0.76} {'loss': 0.5686, 'learning_rate': 1.4245677678420136e-05, 'epoch': 0.76} {'loss': 0.7701, 'learning_rate': 1.4245373483145195e-05, 'epoch': 0.76} {'loss': 0.5777, 'learning_rate': 1.4245069283078035e-05, 'epoch': 0.76} {'loss': 0.484, 'learning_rate': 1.4244765078218999e-05, 'epoch': 0.76} {'loss': 0.6366, 'learning_rate': 1.4244460868568429e-05, 'epoch': 0.76} {'loss': 0.4582, 'learning_rate': 1.424415665412667e-05, 'epoch': 0.76} {'loss': 0.617, 'learning_rate': 1.4243852434894067e-05, 'epoch': 0.76} {'loss': 0.6208, 'learning_rate': 1.4243548210870961e-05, 'epoch': 0.76} {'loss': 0.6108, 'learning_rate': 1.4243243982057697e-05, 'epoch': 0.76} {'loss': 0.4665, 'learning_rate': 1.4242939748454616e-05, 'epoch': 0.76} {'loss': 0.4164, 'learning_rate': 1.4242635510062064e-05, 'epoch': 0.76} {'loss': 0.4534, 'learning_rate': 1.424233126688038e-05, 'epoch': 0.76} {'loss': 0.4257, 'learning_rate': 1.4242027018909915e-05, 'epoch': 0.76} {'loss': 0.6388, 'learning_rate': 1.4241722766151007e-05, 'epoch': 0.76} {'loss': 0.6758, 'learning_rate': 1.4241418508604001e-05, 'epoch': 0.76} {'loss': 0.6289, 'learning_rate': 1.4241114246269239e-05, 'epoch': 0.76} {'loss': 0.6698, 'learning_rate': 1.4240809979147065e-05, 'epoch': 0.76} {'loss': 0.5252, 'learning_rate': 1.4240505707237824e-05, 'epoch': 0.76} {'loss': 0.4707, 'learning_rate': 1.4240201430541857e-05, 'epoch': 0.76} {'loss': 0.5871, 'learning_rate': 1.4239897149059512e-05, 'epoch': 0.76} {'loss': 0.4616, 'learning_rate': 1.4239592862791124e-05, 'epoch': 0.76} {'loss': 0.5508, 'learning_rate': 1.4239288571737046e-05, 'epoch': 0.76} {'loss': 0.6459, 'learning_rate': 1.4238984275897618e-05, 'epoch': 0.76} {'loss': 0.5539, 'learning_rate': 1.423867997527318e-05, 'epoch': 0.76} {'loss': 0.4628, 'learning_rate': 1.4238375669864079e-05, 'epoch': 0.76} {'loss': 0.5067, 'learning_rate': 1.4238071359670658e-05, 'epoch': 0.76} {'loss': 0.4512, 'learning_rate': 1.4237767044693262e-05, 'epoch': 0.76} {'loss': 0.5346, 'learning_rate': 1.4237462724932231e-05, 'epoch': 0.76} {'loss': 0.5777, 'learning_rate': 1.4237158400387912e-05, 'epoch': 0.76} {'loss': 0.5389, 'learning_rate': 1.4236854071060643e-05, 'epoch': 0.76} {'loss': 0.4124, 'learning_rate': 1.4236549736950776e-05, 'epoch': 0.76} {'loss': 0.4341, 'learning_rate': 1.4236245398058648e-05, 'epoch': 0.76} {'loss': 0.6523, 'learning_rate': 1.4235941054384605e-05, 'epoch': 0.76} {'loss': 0.7216, 'learning_rate': 1.423563670592899e-05, 'epoch': 0.76} {'loss': 0.5524, 'learning_rate': 1.4235332352692146e-05, 'epoch': 0.76} {'loss': 0.6394, 'learning_rate': 1.4235027994674418e-05, 'epoch': 0.76} {'loss': 0.482, 'learning_rate': 1.423472363187615e-05, 'epoch': 0.76} {'loss': 0.6706, 'learning_rate': 1.423441926429768e-05, 'epoch': 0.76} {'loss': 0.3866, 'learning_rate': 1.4234114891939361e-05, 'epoch': 0.76} {'loss': 0.6323, 'learning_rate': 1.4233810514801528e-05, 'epoch': 0.76} {'loss': 0.6036, 'learning_rate': 1.423350613288453e-05, 'epoch': 0.76} {'loss': 0.4664, 'learning_rate': 1.4233201746188707e-05, 'epoch': 0.76} {'loss': 0.5316, 'learning_rate': 1.4232897354714404e-05, 'epoch': 0.76} {'loss': 0.5344, 'learning_rate': 1.4232592958461966e-05, 'epoch': 0.76} {'loss': 0.5075, 'learning_rate': 1.4232288557431735e-05, 'epoch': 0.76} {'loss': 0.4162, 'learning_rate': 1.4231984151624054e-05, 'epoch': 0.76} {'loss': 0.6156, 'learning_rate': 1.4231679741039268e-05, 'epoch': 0.76} {'loss': 0.5271, 'learning_rate': 1.4231375325677723e-05, 'epoch': 0.76} {'loss': 0.4187, 'learning_rate': 1.4231070905539757e-05, 'epoch': 0.76} {'loss': 0.7485, 'learning_rate': 1.423076648062572e-05, 'epoch': 0.76} {'loss': 0.7366, 'learning_rate': 1.423046205093595e-05, 'epoch': 0.76} {'loss': 0.4972, 'learning_rate': 1.423015761647079e-05, 'epoch': 0.76} {'loss': 0.3954, 'learning_rate': 1.4229853177230588e-05, 'epoch': 0.76} {'loss': 0.443, 'learning_rate': 1.4229548733215688e-05, 'epoch': 0.76} {'loss': 0.5644, 'learning_rate': 1.4229244284426431e-05, 'epoch': 0.76} {'loss': 0.4609, 'learning_rate': 1.422893983086316e-05, 'epoch': 0.76} {'loss': 0.5299, 'learning_rate': 1.422863537252622e-05, 'epoch': 0.76} {'loss': 0.6227, 'learning_rate': 1.4228330909415958e-05, 'epoch': 0.76} {'loss': 0.7261, 'learning_rate': 1.4228026441532711e-05, 'epoch': 0.76} {'loss': 0.4856, 'learning_rate': 1.422772196887683e-05, 'epoch': 0.76} {'loss': 0.5288, 'learning_rate': 1.422741749144865e-05, 'epoch': 0.76} {'loss': 0.5749, 'learning_rate': 1.4227113009248523e-05, 'epoch': 0.76} {'loss': 0.7746, 'learning_rate': 1.4226808522276788e-05, 'epoch': 0.76} {'loss': 0.5532, 'learning_rate': 1.4226504030533792e-05, 'epoch': 0.76} {'loss': 0.5302, 'learning_rate': 1.4226199534019874e-05, 'epoch': 0.76} {'loss': 0.4417, 'learning_rate': 1.4225895032735379e-05, 'epoch': 0.76} {'loss': 0.546, 'learning_rate': 1.4225590526680657e-05, 'epoch': 0.76} {'loss': 0.5505, 'learning_rate': 1.4225286015856044e-05, 'epoch': 0.76} {'loss': 0.5, 'learning_rate': 1.4224981500261885e-05, 'epoch': 0.76} {'loss': 0.4352, 'learning_rate': 1.4224676979898526e-05, 'epoch': 0.76} {'loss': 0.6196, 'learning_rate': 1.4224372454766312e-05, 'epoch': 0.76} {'loss': 0.5636, 'learning_rate': 1.4224067924865583e-05, 'epoch': 0.76} {'loss': 0.6018, 'learning_rate': 1.4223763390196686e-05, 'epoch': 0.76} {'loss': 0.6504, 'learning_rate': 1.4223458850759962e-05, 'epoch': 0.76} {'loss': 0.6166, 'learning_rate': 1.4223154306555757e-05, 'epoch': 0.76} {'loss': 0.5903, 'learning_rate': 1.4222849757584414e-05, 'epoch': 0.76} {'loss': 0.7039, 'learning_rate': 1.4222545203846276e-05, 'epoch': 0.76} {'loss': 0.6888, 'learning_rate': 1.4222240645341687e-05, 'epoch': 0.76} {'loss': 0.3645, 'learning_rate': 1.4221936082070991e-05, 'epoch': 0.76} {'loss': 0.6268, 'learning_rate': 1.4221631514034534e-05, 'epoch': 0.76} {'loss': 0.5546, 'learning_rate': 1.4221326941232655e-05, 'epoch': 0.76} {'loss': 0.468, 'learning_rate': 1.4221022363665702e-05, 'epoch': 0.76} {'loss': 0.5843, 'learning_rate': 1.422071778133402e-05, 'epoch': 0.76} {'loss': 0.5991, 'learning_rate': 1.4220413194237947e-05, 'epoch': 0.76} {'loss': 0.6739, 'learning_rate': 1.4220108602377831e-05, 'epoch': 0.76} {'loss': 0.6279, 'learning_rate': 1.4219804005754015e-05, 'epoch': 0.76} {'loss': 0.565, 'learning_rate': 1.4219499404366843e-05, 'epoch': 0.76} {'loss': 0.62, 'learning_rate': 1.4219194798216658e-05, 'epoch': 0.76} {'loss': 0.5106, 'learning_rate': 1.4218890187303804e-05, 'epoch': 0.76} {'loss': 0.5289, 'learning_rate': 1.4218585571628626e-05, 'epoch': 0.76} {'loss': 0.7001, 'learning_rate': 1.4218280951191468e-05, 'epoch': 0.76} {'loss': 0.5974, 'learning_rate': 1.421797632599267e-05, 'epoch': 0.76} {'loss': 0.5918, 'learning_rate': 1.4217671696032582e-05, 'epoch': 0.76} {'loss': 0.7161, 'learning_rate': 1.4217367061311542e-05, 'epoch': 0.76} {'loss': 0.6573, 'learning_rate': 1.4217062421829896e-05, 'epoch': 0.76} {'loss': 0.4429, 'learning_rate': 1.4216757777587992e-05, 'epoch': 0.76} {'loss': 0.4829, 'learning_rate': 1.4216453128586168e-05, 'epoch': 0.76} {'loss': 0.7524, 'learning_rate': 1.4216148474824772e-05, 'epoch': 0.76} {'loss': 0.6393, 'learning_rate': 1.4215843816304145e-05, 'epoch': 0.76} {'loss': 0.6157, 'learning_rate': 1.4215539153024633e-05, 'epoch': 0.76} {'loss': 0.4452, 'learning_rate': 1.4215234484986578e-05, 'epoch': 0.76} {'loss': 0.5758, 'learning_rate': 1.4214929812190323e-05, 'epoch': 0.76} {'loss': 0.4654, 'learning_rate': 1.4214625134636215e-05, 'epoch': 0.76} {'loss': 0.4939, 'learning_rate': 1.42143204523246e-05, 'epoch': 0.76} {'loss': 0.3963, 'learning_rate': 1.4214015765255813e-05, 'epoch': 0.76} {'loss': 0.6284, 'learning_rate': 1.4213711073430207e-05, 'epoch': 0.76} {'loss': 0.4542, 'learning_rate': 1.421340637684812e-05, 'epoch': 0.76} {'loss': 0.7355, 'learning_rate': 1.4213101675509901e-05, 'epoch': 0.76} {'loss': 0.6846, 'learning_rate': 1.4212796969415892e-05, 'epoch': 0.76} {'loss': 0.5914, 'learning_rate': 1.4212492258566432e-05, 'epoch': 0.76} {'loss': 0.5011, 'learning_rate': 1.4212187542961872e-05, 'epoch': 0.76} {'loss': 0.6296, 'learning_rate': 1.4211882822602555e-05, 'epoch': 0.76} {'loss': 0.6392, 'learning_rate': 1.4211578097488823e-05, 'epoch': 0.76} {'loss': 0.5104, 'learning_rate': 1.4211273367621019e-05, 'epoch': 0.76} {'loss': 0.4681, 'learning_rate': 1.4210968632999486e-05, 'epoch': 0.76} {'loss': 0.5467, 'learning_rate': 1.4210663893624572e-05, 'epoch': 0.76} {'loss': 0.6239, 'learning_rate': 1.4210359149496619e-05, 'epoch': 0.76} {'loss': 0.5535, 'learning_rate': 1.4210054400615971e-05, 'epoch': 0.76} {'loss': 0.5043, 'learning_rate': 1.4209749646982974e-05, 'epoch': 0.76} {'loss': 0.5884, 'learning_rate': 1.4209444888597967e-05, 'epoch': 0.76} {'loss': 0.4882, 'learning_rate': 1.42091401254613e-05, 'epoch': 0.76} {'loss': 0.5298, 'learning_rate': 1.4208835357573315e-05, 'epoch': 0.76} {'loss': 0.5256, 'learning_rate': 1.420853058493435e-05, 'epoch': 0.76} {'loss': 0.5882, 'learning_rate': 1.420822580754476e-05, 'epoch': 0.76} {'loss': 0.4748, 'learning_rate': 1.420792102540488e-05, 'epoch': 0.76} {'loss': 0.4967, 'learning_rate': 1.4207616238515059e-05, 'epoch': 0.76} {'loss': 0.5326, 'learning_rate': 1.4207311446875639e-05, 'epoch': 0.76} {'loss': 0.4875, 'learning_rate': 1.4207006650486962e-05, 'epoch': 0.76} {'loss': 0.6377, 'learning_rate': 1.4206701849349376e-05, 'epoch': 0.76} {'loss': 0.4031, 'learning_rate': 1.4206397043463224e-05, 'epoch': 0.76} {'loss': 0.6726, 'learning_rate': 1.420609223282885e-05, 'epoch': 0.76} {'loss': 0.5582, 'learning_rate': 1.4205787417446596e-05, 'epoch': 0.76} {'loss': 0.4389, 'learning_rate': 1.4205482597316812e-05, 'epoch': 0.76} {'loss': 0.4874, 'learning_rate': 1.4205177772439834e-05, 'epoch': 0.76} {'loss': 0.7059, 'learning_rate': 1.420487294281601e-05, 'epoch': 0.76} {'loss': 0.5533, 'learning_rate': 1.4204568108445684e-05, 'epoch': 0.76} {'loss': 0.5637, 'learning_rate': 1.4204263269329204e-05, 'epoch': 0.76} {'loss': 0.6416, 'learning_rate': 1.4203958425466908e-05, 'epoch': 0.76} {'loss': 0.5422, 'learning_rate': 1.4203653576859141e-05, 'epoch': 0.76} {'loss': 0.6807, 'learning_rate': 1.420334872350625e-05, 'epoch': 0.76} {'loss': 0.6111, 'learning_rate': 1.4203043865408575e-05, 'epoch': 0.76} {'loss': 0.7094, 'learning_rate': 1.4202739002566466e-05, 'epoch': 0.76} {'loss': 0.5409, 'learning_rate': 1.4202434134980261e-05, 'epoch': 0.76} {'loss': 0.636, 'learning_rate': 1.4202129262650307e-05, 'epoch': 0.76} {'loss': 0.5277, 'learning_rate': 1.4201824385576952e-05, 'epoch': 0.76} {'loss': 0.6018, 'learning_rate': 1.4201519503760533e-05, 'epoch': 0.76} {'loss': 0.6053, 'learning_rate': 1.4201214617201398e-05, 'epoch': 0.76} {'loss': 0.7615, 'learning_rate': 1.4200909725899891e-05, 'epoch': 0.76} {'loss': 0.56, 'learning_rate': 1.4200604829856354e-05, 'epoch': 0.76} {'loss': 0.4976, 'learning_rate': 1.4200299929071137e-05, 'epoch': 0.76} {'loss': 0.3643, 'learning_rate': 1.419999502354458e-05, 'epoch': 0.76} {'loss': 0.7982, 'learning_rate': 1.4199690113277023e-05, 'epoch': 0.76} {'loss': 0.5839, 'learning_rate': 1.4199385198268816e-05, 'epoch': 0.76} {'loss': 0.6787, 'learning_rate': 1.4199080278520301e-05, 'epoch': 0.76} {'loss': 0.6656, 'learning_rate': 1.4198775354031824e-05, 'epoch': 0.76} {'loss': 0.6884, 'learning_rate': 1.419847042480373e-05, 'epoch': 0.76} {'loss': 0.688, 'learning_rate': 1.4198165490836357e-05, 'epoch': 0.76} {'loss': 0.6504, 'learning_rate': 1.4197860552130057e-05, 'epoch': 0.76} {'loss': 0.6288, 'learning_rate': 1.419755560868517e-05, 'epoch': 0.76} {'loss': 0.5906, 'learning_rate': 1.4197250660502037e-05, 'epoch': 0.76} {'loss': 0.4487, 'learning_rate': 1.4196945707581012e-05, 'epoch': 0.76} {'loss': 0.4506, 'learning_rate': 1.419664074992243e-05, 'epoch': 0.76} {'loss': 0.6146, 'learning_rate': 1.419633578752664e-05, 'epoch': 0.76} {'loss': 0.7946, 'learning_rate': 1.4196030820393984e-05, 'epoch': 0.76} {'loss': 0.6531, 'learning_rate': 1.4195725848524808e-05, 'epoch': 0.76} {'loss': 0.5967, 'learning_rate': 1.4195420871919456e-05, 'epoch': 0.76} {'loss': 0.5734, 'learning_rate': 1.419511589057827e-05, 'epoch': 0.76} {'loss': 0.6054, 'learning_rate': 1.4194810904501597e-05, 'epoch': 0.76} {'loss': 0.47, 'learning_rate': 1.4194505913689778e-05, 'epoch': 0.76} {'loss': 0.618, 'learning_rate': 1.4194200918143161e-05, 'epoch': 0.76} {'loss': 0.4811, 'learning_rate': 1.4193895917862089e-05, 'epoch': 0.76} {'loss': 0.6023, 'learning_rate': 1.4193590912846906e-05, 'epoch': 0.76} {'loss': 0.4832, 'learning_rate': 1.4193285903097955e-05, 'epoch': 0.76} {'loss': 0.4756, 'learning_rate': 1.4192980888615582e-05, 'epoch': 0.76} {'loss': 0.5187, 'learning_rate': 1.4192675869400132e-05, 'epoch': 0.76} {'loss': 0.5178, 'learning_rate': 1.4192370845451948e-05, 'epoch': 0.76} {'loss': 0.466, 'learning_rate': 1.4192065816771374e-05, 'epoch': 0.76} {'loss': 0.4086, 'learning_rate': 1.4191760783358754e-05, 'epoch': 0.76} {'loss': 0.4514, 'learning_rate': 1.4191455745214435e-05, 'epoch': 0.76} {'loss': 0.62, 'learning_rate': 1.4191150702338758e-05, 'epoch': 0.76} {'loss': 0.6435, 'learning_rate': 1.419084565473207e-05, 'epoch': 0.76} {'loss': 0.6086, 'learning_rate': 1.4190540602394713e-05, 'epoch': 0.76} {'loss': 0.7039, 'learning_rate': 1.4190235545327034e-05, 'epoch': 0.76} {'loss': 0.568, 'learning_rate': 1.4189930483529374e-05, 'epoch': 0.76} {'loss': 0.5787, 'learning_rate': 1.4189625417002083e-05, 'epoch': 0.76} {'loss': 0.4831, 'learning_rate': 1.41893203457455e-05, 'epoch': 0.76} {'loss': 0.6728, 'learning_rate': 1.418901526975997e-05, 'epoch': 0.76} {'loss': 0.6798, 'learning_rate': 1.4188710189045839e-05, 'epoch': 0.76} {'loss': 0.5566, 'learning_rate': 1.4188405103603449e-05, 'epoch': 0.76} {'loss': 0.5758, 'learning_rate': 1.4188100013433145e-05, 'epoch': 0.76} {'loss': 0.4755, 'learning_rate': 1.4187794918535276e-05, 'epoch': 0.76} {'loss': 0.6667, 'learning_rate': 1.4187489818910182e-05, 'epoch': 0.76} {'loss': 0.5299, 'learning_rate': 1.4187184714558209e-05, 'epoch': 0.76} {'loss': 0.5444, 'learning_rate': 1.4186879605479697e-05, 'epoch': 0.76} {'loss': 0.787, 'learning_rate': 1.4186574491674999e-05, 'epoch': 0.76} {'loss': 0.465, 'learning_rate': 1.418626937314445e-05, 'epoch': 0.76} {'loss': 0.6374, 'learning_rate': 1.4185964249888402e-05, 'epoch': 0.76} {'loss': 0.5222, 'learning_rate': 1.4185659121907196e-05, 'epoch': 0.76} {'loss': 0.4308, 'learning_rate': 1.4185353989201174e-05, 'epoch': 0.76} {'loss': 0.4696, 'learning_rate': 1.4185048851770689e-05, 'epoch': 0.76} {'loss': 0.6215, 'learning_rate': 1.4184743709616076e-05, 'epoch': 0.76} {'loss': 0.5237, 'learning_rate': 1.4184438562737684e-05, 'epoch': 0.76} {'loss': 0.5412, 'learning_rate': 1.4184133411135854e-05, 'epoch': 0.76} {'loss': 0.5975, 'learning_rate': 1.4183828254810934e-05, 'epoch': 0.76} {'loss': 0.4447, 'learning_rate': 1.418352309376327e-05, 'epoch': 0.76} {'loss': 0.4389, 'learning_rate': 1.41832179279932e-05, 'epoch': 0.76} {'loss': 0.7827, 'learning_rate': 1.4182912757501076e-05, 'epoch': 0.76} {'loss': 0.4875, 'learning_rate': 1.4182607582287237e-05, 'epoch': 0.76} {'loss': 0.3986, 'learning_rate': 1.4182302402352031e-05, 'epoch': 0.76} {'loss': 0.5758, 'learning_rate': 1.4181997217695798e-05, 'epoch': 0.76} {'loss': 0.4926, 'learning_rate': 1.4181692028318888e-05, 'epoch': 0.76} {'loss': 0.658, 'learning_rate': 1.4181386834221643e-05, 'epoch': 0.76} {'loss': 0.7258, 'learning_rate': 1.4181081635404408e-05, 'epoch': 0.77} {'loss': 0.4967, 'learning_rate': 1.4180776431867525e-05, 'epoch': 0.77} {'loss': 0.5711, 'learning_rate': 1.4180471223611341e-05, 'epoch': 0.77} {'loss': 0.4666, 'learning_rate': 1.41801660106362e-05, 'epoch': 0.77} {'loss': 0.5786, 'learning_rate': 1.4179860792942447e-05, 'epoch': 0.77} {'loss': 0.4869, 'learning_rate': 1.4179555570530423e-05, 'epoch': 0.77} {'loss': 0.6111, 'learning_rate': 1.4179250343400479e-05, 'epoch': 0.77} {'loss': 0.5097, 'learning_rate': 1.4178945111552956e-05, 'epoch': 0.77} {'loss': 0.4256, 'learning_rate': 1.4178639874988196e-05, 'epoch': 0.77} {'loss': 0.5776, 'learning_rate': 1.4178334633706548e-05, 'epoch': 0.77} {'loss': 0.6954, 'learning_rate': 1.4178029387708354e-05, 'epoch': 0.77} {'loss': 0.3989, 'learning_rate': 1.417772413699396e-05, 'epoch': 0.77} {'loss': 0.3646, 'learning_rate': 1.4177418881563709e-05, 'epoch': 0.77} {'loss': 0.5667, 'learning_rate': 1.4177113621417947e-05, 'epoch': 0.77} {'loss': 0.545, 'learning_rate': 1.417680835655702e-05, 'epoch': 0.77} {'loss': 0.6834, 'learning_rate': 1.4176503086981268e-05, 'epoch': 0.77} {'loss': 0.6653, 'learning_rate': 1.4176197812691037e-05, 'epoch': 0.77} {'loss': 0.6625, 'learning_rate': 1.4175892533686675e-05, 'epoch': 0.77} {'loss': 0.5746, 'learning_rate': 1.4175587249968525e-05, 'epoch': 0.77} {'loss': 0.6193, 'learning_rate': 1.4175281961536929e-05, 'epoch': 0.77} {'loss': 0.5058, 'learning_rate': 1.4174976668392235e-05, 'epoch': 0.77} {'loss': 0.5845, 'learning_rate': 1.4174671370534787e-05, 'epoch': 0.77} {'loss': 0.488, 'learning_rate': 1.4174366067964927e-05, 'epoch': 0.77} {'loss': 0.5033, 'learning_rate': 1.4174060760683005e-05, 'epoch': 0.77} {'loss': 0.4609, 'learning_rate': 1.417375544868936e-05, 'epoch': 0.77} {'loss': 0.5906, 'learning_rate': 1.4173450131984336e-05, 'epoch': 0.77} {'loss': 0.7074, 'learning_rate': 1.4173144810568284e-05, 'epoch': 0.77} {'loss': 0.5307, 'learning_rate': 1.4172839484441544e-05, 'epoch': 0.77} {'loss': 0.5612, 'learning_rate': 1.4172534153604463e-05, 'epoch': 0.77} {'loss': 0.6809, 'learning_rate': 1.4172228818057381e-05, 'epoch': 0.77} {'loss': 0.5364, 'learning_rate': 1.4171923477800649e-05, 'epoch': 0.77} {'loss': 0.5476, 'learning_rate': 1.4171618132834608e-05, 'epoch': 0.77} {'loss': 0.5281, 'learning_rate': 1.4171312783159603e-05, 'epoch': 0.77} {'loss': 0.4171, 'learning_rate': 1.4171007428775979e-05, 'epoch': 0.77} {'loss': 0.6064, 'learning_rate': 1.4170702069684081e-05, 'epoch': 0.77} {'loss': 0.6602, 'learning_rate': 1.4170396705884253e-05, 'epoch': 0.77} {'loss': 0.4475, 'learning_rate': 1.4170091337376844e-05, 'epoch': 0.77} {'loss': 0.6457, 'learning_rate': 1.416978596416219e-05, 'epoch': 0.77} {'loss': 0.5255, 'learning_rate': 1.416948058624064e-05, 'epoch': 0.77} {'loss': 0.4911, 'learning_rate': 1.4169175203612544e-05, 'epoch': 0.77} {'loss': 0.5553, 'learning_rate': 1.4168869816278239e-05, 'epoch': 0.77} {'loss': 0.6474, 'learning_rate': 1.4168564424238071e-05, 'epoch': 0.77} {'loss': 0.7177, 'learning_rate': 1.416825902749239e-05, 'epoch': 0.77} {'loss': 0.571, 'learning_rate': 1.4167953626041535e-05, 'epoch': 0.77} {'loss': 0.513, 'learning_rate': 1.4167648219885854e-05, 'epoch': 0.77} {'loss': 0.5596, 'learning_rate': 1.416734280902569e-05, 'epoch': 0.77} {'loss': 0.5634, 'learning_rate': 1.416703739346139e-05, 'epoch': 0.77} {'loss': 0.8733, 'learning_rate': 1.4166731973193295e-05, 'epoch': 0.77} {'loss': 0.7079, 'learning_rate': 1.4166426548221753e-05, 'epoch': 0.77} {'loss': 0.5795, 'learning_rate': 1.416612111854711e-05, 'epoch': 0.77} {'loss': 0.6537, 'learning_rate': 1.4165815684169704e-05, 'epoch': 0.77} {'loss': 0.5823, 'learning_rate': 1.4165510245089887e-05, 'epoch': 0.77} {'loss': 0.4745, 'learning_rate': 1.4165204801307998e-05, 'epoch': 0.77} {'loss': 0.5502, 'learning_rate': 1.4164899352824389e-05, 'epoch': 0.77} {'loss': 0.5381, 'learning_rate': 1.4164593899639398e-05, 'epoch': 0.77} {'loss': 0.6084, 'learning_rate': 1.4164288441753374e-05, 'epoch': 0.77} {'loss': 0.5708, 'learning_rate': 1.416398297916666e-05, 'epoch': 0.77} {'loss': 0.654, 'learning_rate': 1.4163677511879601e-05, 'epoch': 0.77} {'loss': 0.5878, 'learning_rate': 1.416337203989254e-05, 'epoch': 0.77} {'loss': 0.5812, 'learning_rate': 1.4163066563205822e-05, 'epoch': 0.77} {'loss': 0.4717, 'learning_rate': 1.4162761081819797e-05, 'epoch': 0.77} {'loss': 0.5144, 'learning_rate': 1.4162455595734808e-05, 'epoch': 0.77} {'loss': 0.5849, 'learning_rate': 1.4162150104951195e-05, 'epoch': 0.77} {'loss': 0.5222, 'learning_rate': 1.4161844609469309e-05, 'epoch': 0.77} {'loss': 0.7191, 'learning_rate': 1.4161539109289488e-05, 'epoch': 0.77} {'loss': 0.5949, 'learning_rate': 1.4161233604412084e-05, 'epoch': 0.77} {'loss': 0.6437, 'learning_rate': 1.4160928094837436e-05, 'epoch': 0.77} {'loss': 0.5607, 'learning_rate': 1.4160622580565892e-05, 'epoch': 0.77} {'loss': 0.4874, 'learning_rate': 1.4160317061597797e-05, 'epoch': 0.77} {'loss': 0.5452, 'learning_rate': 1.4160011537933493e-05, 'epoch': 0.77} {'loss': 0.6414, 'learning_rate': 1.4159706009573331e-05, 'epoch': 0.77} {'loss': 0.6315, 'learning_rate': 1.4159400476517648e-05, 'epoch': 0.77} {'loss': 0.5814, 'learning_rate': 1.4159094938766795e-05, 'epoch': 0.77} {'loss': 0.6346, 'learning_rate': 1.4158789396321118e-05, 'epoch': 0.77} {'loss': 0.6558, 'learning_rate': 1.4158483849180955e-05, 'epoch': 0.77} {'loss': 0.5201, 'learning_rate': 1.4158178297346655e-05, 'epoch': 0.77} {'loss': 0.665, 'learning_rate': 1.4157872740818562e-05, 'epoch': 0.77} {'loss': 0.5501, 'learning_rate': 1.415756717959702e-05, 'epoch': 0.77} {'loss': 0.583, 'learning_rate': 1.4157261613682376e-05, 'epoch': 0.77} {'loss': 0.5418, 'learning_rate': 1.4156956043074974e-05, 'epoch': 0.77} {'loss': 0.4968, 'learning_rate': 1.4156650467775159e-05, 'epoch': 0.77} {'loss': 0.6664, 'learning_rate': 1.4156344887783278e-05, 'epoch': 0.77} {'loss': 0.5819, 'learning_rate': 1.4156039303099674e-05, 'epoch': 0.77} {'loss': 0.56, 'learning_rate': 1.415573371372469e-05, 'epoch': 0.77} {'loss': 0.6055, 'learning_rate': 1.4155428119658674e-05, 'epoch': 0.77} {'loss': 0.6354, 'learning_rate': 1.4155122520901969e-05, 'epoch': 0.77} {'loss': 0.4773, 'learning_rate': 1.4154816917454923e-05, 'epoch': 0.77} {'loss': 0.6182, 'learning_rate': 1.4154511309317877e-05, 'epoch': 0.77} {'loss': 0.6771, 'learning_rate': 1.4154205696491177e-05, 'epoch': 0.77} {'loss': 0.6111, 'learning_rate': 1.4153900078975168e-05, 'epoch': 0.77} {'loss': 0.3426, 'learning_rate': 1.4153594456770199e-05, 'epoch': 0.77} {'loss': 0.5263, 'learning_rate': 1.4153288829876611e-05, 'epoch': 0.77} {'loss': 0.5696, 'learning_rate': 1.4152983198294748e-05, 'epoch': 0.77} {'loss': 0.7266, 'learning_rate': 1.4152677562024958e-05, 'epoch': 0.77} {'loss': 0.5429, 'learning_rate': 1.4152371921067582e-05, 'epoch': 0.77} {'loss': 0.6461, 'learning_rate': 1.4152066275422971e-05, 'epoch': 0.77} {'loss': 0.4927, 'learning_rate': 1.4151760625091465e-05, 'epoch': 0.77} {'loss': 0.4243, 'learning_rate': 1.415145497007341e-05, 'epoch': 0.77} {'loss': 0.6792, 'learning_rate': 1.4151149310369155e-05, 'epoch': 0.77} {'loss': 0.6011, 'learning_rate': 1.415084364597904e-05, 'epoch': 0.77} {'loss': 0.4317, 'learning_rate': 1.4150537976903414e-05, 'epoch': 0.77} {'loss': 0.5407, 'learning_rate': 1.4150232303142615e-05, 'epoch': 0.77} {'loss': 0.7083, 'learning_rate': 1.4149926624696994e-05, 'epoch': 0.77} {'loss': 0.4285, 'learning_rate': 1.4149620941566897e-05, 'epoch': 0.77} {'loss': 0.5453, 'learning_rate': 1.4149315253752666e-05, 'epoch': 0.77} {'loss': 0.5895, 'learning_rate': 1.414900956125465e-05, 'epoch': 0.77} {'loss': 0.5968, 'learning_rate': 1.4148703864073187e-05, 'epoch': 0.77} {'loss': 0.693, 'learning_rate': 1.414839816220863e-05, 'epoch': 0.77} {'loss': 0.6016, 'learning_rate': 1.4148092455661317e-05, 'epoch': 0.77} {'loss': 0.775, 'learning_rate': 1.4147786744431598e-05, 'epoch': 0.77} {'loss': 0.5085, 'learning_rate': 1.4147481028519816e-05, 'epoch': 0.77} {'loss': 0.5378, 'learning_rate': 1.4147175307926318e-05, 'epoch': 0.77} {'loss': 0.6034, 'learning_rate': 1.4146869582651445e-05, 'epoch': 0.77} {'loss': 0.6444, 'learning_rate': 1.4146563852695547e-05, 'epoch': 0.77} {'loss': 0.6016, 'learning_rate': 1.4146258118058967e-05, 'epoch': 0.77} {'loss': 0.6285, 'learning_rate': 1.4145952378742048e-05, 'epoch': 0.77} {'loss': 0.4062, 'learning_rate': 1.4145646634745138e-05, 'epoch': 0.77} {'loss': 0.6074, 'learning_rate': 1.4145340886068582e-05, 'epoch': 0.77} {'loss': 0.6493, 'learning_rate': 1.4145035132712726e-05, 'epoch': 0.77} {'loss': 0.4315, 'learning_rate': 1.414472937467791e-05, 'epoch': 0.77} {'loss': 0.6071, 'learning_rate': 1.4144423611964483e-05, 'epoch': 0.77} {'loss': 0.507, 'learning_rate': 1.4144117844572791e-05, 'epoch': 0.77} {'loss': 0.7064, 'learning_rate': 1.414381207250318e-05, 'epoch': 0.77} {'loss': 0.5431, 'learning_rate': 1.4143506295755993e-05, 'epoch': 0.77} {'loss': 0.4792, 'learning_rate': 1.4143200514331574e-05, 'epoch': 0.77} {'loss': 0.5817, 'learning_rate': 1.4142894728230268e-05, 'epoch': 0.77} {'loss': 0.6454, 'learning_rate': 1.4142588937452423e-05, 'epoch': 0.77} {'loss': 0.4865, 'learning_rate': 1.4142283141998382e-05, 'epoch': 0.77} {'loss': 0.3883, 'learning_rate': 1.4141977341868494e-05, 'epoch': 0.77} {'loss': 0.5748, 'learning_rate': 1.4141671537063098e-05, 'epoch': 0.77} {'loss': 0.6108, 'learning_rate': 1.4141365727582544e-05, 'epoch': 0.77} {'loss': 0.5403, 'learning_rate': 1.4141059913427173e-05, 'epoch': 0.77} {'loss': 0.6132, 'learning_rate': 1.4140754094597335e-05, 'epoch': 0.77} {'loss': 0.5385, 'learning_rate': 1.4140448271093371e-05, 'epoch': 0.77} {'loss': 0.5397, 'learning_rate': 1.4140142442915632e-05, 'epoch': 0.77} {'loss': 0.5343, 'learning_rate': 1.4139836610064457e-05, 'epoch': 0.77} {'loss': 0.6334, 'learning_rate': 1.4139530772540195e-05, 'epoch': 0.77} {'loss': 0.6856, 'learning_rate': 1.4139224930343192e-05, 'epoch': 0.77} {'loss': 0.6813, 'learning_rate': 1.4138919083473787e-05, 'epoch': 0.77} {'loss': 0.5301, 'learning_rate': 1.413861323193233e-05, 'epoch': 0.77} {'loss': 0.4987, 'learning_rate': 1.4138307375719167e-05, 'epoch': 0.77} {'loss': 0.5897, 'learning_rate': 1.413800151483464e-05, 'epoch': 0.77} {'loss': 0.6588, 'learning_rate': 1.4137695649279097e-05, 'epoch': 0.77} {'loss': 0.6665, 'learning_rate': 1.4137389779052884e-05, 'epoch': 0.77} {'loss': 0.475, 'learning_rate': 1.4137083904156343e-05, 'epoch': 0.77} {'loss': 0.4948, 'learning_rate': 1.4136778024589822e-05, 'epoch': 0.77} {'loss': 0.4555, 'learning_rate': 1.4136472140353665e-05, 'epoch': 0.77} {'loss': 0.7545, 'learning_rate': 1.4136166251448216e-05, 'epoch': 0.77} {'loss': 0.689, 'learning_rate': 1.4135860357873826e-05, 'epoch': 0.77} {'loss': 0.6138, 'learning_rate': 1.4135554459630834e-05, 'epoch': 0.77} {'loss': 0.5854, 'learning_rate': 1.4135248556719585e-05, 'epoch': 0.77} {'loss': 0.6443, 'learning_rate': 1.4134942649140429e-05, 'epoch': 0.77} {'loss': 0.4788, 'learning_rate': 1.4134636736893707e-05, 'epoch': 0.77} {'loss': 0.5172, 'learning_rate': 1.4134330819979769e-05, 'epoch': 0.77} {'loss': 0.5593, 'learning_rate': 1.4134024898398958e-05, 'epoch': 0.77} {'loss': 0.565, 'learning_rate': 1.4133718972151615e-05, 'epoch': 0.77} {'loss': 0.6065, 'learning_rate': 1.4133413041238094e-05, 'epoch': 0.77} {'loss': 0.5134, 'learning_rate': 1.4133107105658732e-05, 'epoch': 0.77} {'loss': 0.5615, 'learning_rate': 1.413280116541388e-05, 'epoch': 0.77} {'loss': 0.5379, 'learning_rate': 1.4132495220503881e-05, 'epoch': 0.77} {'loss': 0.6453, 'learning_rate': 1.413218927092908e-05, 'epoch': 0.77} {'loss': 0.6231, 'learning_rate': 1.4131883316689825e-05, 'epoch': 0.77} {'loss': 0.4523, 'learning_rate': 1.4131577357786457e-05, 'epoch': 0.77} {'loss': 0.4608, 'learning_rate': 1.4131271394219326e-05, 'epoch': 0.77} {'loss': 0.466, 'learning_rate': 1.4130965425988775e-05, 'epoch': 0.77} {'loss': 0.6387, 'learning_rate': 1.4130659453095148e-05, 'epoch': 0.77} {'loss': 0.6252, 'learning_rate': 1.4130353475538792e-05, 'epoch': 0.77} {'loss': 0.6656, 'learning_rate': 1.4130047493320054e-05, 'epoch': 0.77} {'loss': 0.7232, 'learning_rate': 1.4129741506439276e-05, 'epoch': 0.77} {'loss': 0.4657, 'learning_rate': 1.4129435514896805e-05, 'epoch': 0.77} {'loss': 0.6024, 'learning_rate': 1.4129129518692988e-05, 'epoch': 0.77} {'loss': 0.6359, 'learning_rate': 1.412882351782817e-05, 'epoch': 0.77} {'loss': 0.6009, 'learning_rate': 1.4128517512302696e-05, 'epoch': 0.77} {'loss': 0.5289, 'learning_rate': 1.4128211502116906e-05, 'epoch': 0.77} {'loss': 0.5349, 'learning_rate': 1.4127905487271154e-05, 'epoch': 0.77} {'loss': 0.4481, 'learning_rate': 1.412759946776578e-05, 'epoch': 0.77} {'loss': 0.531, 'learning_rate': 1.4127293443601131e-05, 'epoch': 0.77} {'loss': 0.7102, 'learning_rate': 1.4126987414777555e-05, 'epoch': 0.77} {'loss': 0.6434, 'learning_rate': 1.4126681381295392e-05, 'epoch': 0.77} {'loss': 0.6017, 'learning_rate': 1.4126375343154993e-05, 'epoch': 0.77} {'loss': 0.6408, 'learning_rate': 1.4126069300356698e-05, 'epoch': 0.77} {'loss': 0.4251, 'learning_rate': 1.4125763252900856e-05, 'epoch': 0.77} {'loss': 0.5742, 'learning_rate': 1.4125457200787813e-05, 'epoch': 0.77} {'loss': 0.6236, 'learning_rate': 1.4125151144017914e-05, 'epoch': 0.77} {'loss': 0.7006, 'learning_rate': 1.4124845082591503e-05, 'epoch': 0.77} {'loss': 0.6061, 'learning_rate': 1.412453901650893e-05, 'epoch': 0.77} {'loss': 0.6461, 'learning_rate': 1.4124232945770531e-05, 'epoch': 0.77} {'loss': 0.4505, 'learning_rate': 1.4123926870376658e-05, 'epoch': 0.77} {'loss': 0.5603, 'learning_rate': 1.4123620790327657e-05, 'epoch': 0.77} {'loss': 0.5838, 'learning_rate': 1.4123314705623874e-05, 'epoch': 0.77} {'loss': 0.6131, 'learning_rate': 1.412300861626565e-05, 'epoch': 0.77} {'loss': 0.5969, 'learning_rate': 1.4122702522253336e-05, 'epoch': 0.77} {'loss': 0.5301, 'learning_rate': 1.4122396423587272e-05, 'epoch': 0.77} {'loss': 0.6683, 'learning_rate': 1.4122090320267807e-05, 'epoch': 0.77} {'loss': 0.5287, 'learning_rate': 1.4121784212295287e-05, 'epoch': 0.77} {'loss': 0.5671, 'learning_rate': 1.4121478099670054e-05, 'epoch': 0.77} {'loss': 0.6242, 'learning_rate': 1.4121171982392458e-05, 'epoch': 0.77} {'loss': 0.684, 'learning_rate': 1.4120865860462843e-05, 'epoch': 0.77} {'loss': 0.5093, 'learning_rate': 1.4120559733881554e-05, 'epoch': 0.77} {'loss': 0.4116, 'learning_rate': 1.4120253602648937e-05, 'epoch': 0.77} {'loss': 0.6047, 'learning_rate': 1.4119947466765336e-05, 'epoch': 0.77} {'loss': 0.6286, 'learning_rate': 1.4119641326231097e-05, 'epoch': 0.77} {'loss': 0.701, 'learning_rate': 1.4119335181046567e-05, 'epoch': 0.77} {'loss': 0.4568, 'learning_rate': 1.4119029031212091e-05, 'epoch': 0.77} {'loss': 0.5889, 'learning_rate': 1.4118722876728014e-05, 'epoch': 0.77} {'loss': 0.5993, 'learning_rate': 1.4118416717594682e-05, 'epoch': 0.77} {'loss': 0.7512, 'learning_rate': 1.4118110553812444e-05, 'epoch': 0.77} {'loss': 0.4364, 'learning_rate': 1.4117804385381639e-05, 'epoch': 0.77} {'loss': 0.6776, 'learning_rate': 1.4117498212302614e-05, 'epoch': 0.77} {'loss': 0.7143, 'learning_rate': 1.411719203457572e-05, 'epoch': 0.77} {'loss': 0.3406, 'learning_rate': 1.41168858522013e-05, 'epoch': 0.77} {'loss': 0.5681, 'learning_rate': 1.4116579665179695e-05, 'epoch': 0.77} {'loss': 0.5078, 'learning_rate': 1.4116273473511257e-05, 'epoch': 0.77} {'loss': 0.5798, 'learning_rate': 1.4115967277196328e-05, 'epoch': 0.77} {'loss': 0.5413, 'learning_rate': 1.4115661076235255e-05, 'epoch': 0.77} {'loss': 0.4641, 'learning_rate': 1.4115354870628384e-05, 'epoch': 0.77} {'loss': 0.6056, 'learning_rate': 1.4115048660376057e-05, 'epoch': 0.77} {'loss': 0.5348, 'learning_rate': 1.4114742445478626e-05, 'epoch': 0.77} {'loss': 0.5747, 'learning_rate': 1.4114436225936432e-05, 'epoch': 0.77} {'loss': 0.6317, 'learning_rate': 1.4114130001749819e-05, 'epoch': 0.77} {'loss': 0.5244, 'learning_rate': 1.411382377291914e-05, 'epoch': 0.77} {'loss': 0.5546, 'learning_rate': 1.4113517539444734e-05, 'epoch': 0.77} {'loss': 0.5758, 'learning_rate': 1.4113211301326952e-05, 'epoch': 0.77} {'loss': 0.511, 'learning_rate': 1.4112905058566133e-05, 'epoch': 0.77} {'loss': 0.5149, 'learning_rate': 1.4112598811162627e-05, 'epoch': 0.77} {'loss': 0.6082, 'learning_rate': 1.411229255911678e-05, 'epoch': 0.77} {'loss': 0.5593, 'learning_rate': 1.4111986302428938e-05, 'epoch': 0.77} {'loss': 0.587, 'learning_rate': 1.411168004109944e-05, 'epoch': 0.77} {'loss': 0.7119, 'learning_rate': 1.4111373775128644e-05, 'epoch': 0.77} {'loss': 0.4722, 'learning_rate': 1.4111067504516882e-05, 'epoch': 0.77} {'loss': 0.5628, 'learning_rate': 1.4110761229264511e-05, 'epoch': 0.77} {'loss': 0.6279, 'learning_rate': 1.411045494937187e-05, 'epoch': 0.77} {'loss': 0.5311, 'learning_rate': 1.411014866483931e-05, 'epoch': 0.77} {'loss': 0.7256, 'learning_rate': 1.410984237566717e-05, 'epoch': 0.77} {'loss': 0.6167, 'learning_rate': 1.4109536081855803e-05, 'epoch': 0.77} {'loss': 0.5946, 'learning_rate': 1.4109229783405551e-05, 'epoch': 0.77} {'loss': 0.4599, 'learning_rate': 1.410892348031676e-05, 'epoch': 0.77} {'loss': 0.6757, 'learning_rate': 1.4108617172589774e-05, 'epoch': 0.77} {'loss': 0.652, 'learning_rate': 1.410831086022494e-05, 'epoch': 0.77} {'loss': 0.4994, 'learning_rate': 1.4108004543222604e-05, 'epoch': 0.77} {'loss': 0.4318, 'learning_rate': 1.4107698221583114e-05, 'epoch': 0.77} {'loss': 0.5411, 'learning_rate': 1.4107391895306812e-05, 'epoch': 0.77} {'loss': 0.6858, 'learning_rate': 1.4107085564394048e-05, 'epoch': 0.77} {'loss': 0.5185, 'learning_rate': 1.4106779228845163e-05, 'epoch': 0.77} {'loss': 0.6312, 'learning_rate': 1.4106472888660508e-05, 'epoch': 0.77} {'loss': 0.655, 'learning_rate': 1.4106166543840424e-05, 'epoch': 0.77} {'loss': 0.5877, 'learning_rate': 1.4105860194385256e-05, 'epoch': 0.77} {'loss': 0.5831, 'learning_rate': 1.4105553840295357e-05, 'epoch': 0.77} {'loss': 0.4444, 'learning_rate': 1.4105247481571069e-05, 'epoch': 0.77} {'loss': 0.4162, 'learning_rate': 1.4104941118212736e-05, 'epoch': 0.77} {'loss': 0.573, 'learning_rate': 1.4104634750220703e-05, 'epoch': 0.77} {'loss': 0.6718, 'learning_rate': 1.410432837759532e-05, 'epoch': 0.77} {'loss': 0.6873, 'learning_rate': 1.4104022000336927e-05, 'epoch': 0.77} {'loss': 0.5371, 'learning_rate': 1.410371561844588e-05, 'epoch': 0.77} {'loss': 0.4946, 'learning_rate': 1.4103409231922514e-05, 'epoch': 0.77} {'loss': 0.6927, 'learning_rate': 1.410310284076718e-05, 'epoch': 0.77} {'loss': 0.6067, 'learning_rate': 1.4102796444980223e-05, 'epoch': 0.77} {'loss': 0.6654, 'learning_rate': 1.410249004456199e-05, 'epoch': 0.77} {'loss': 0.6868, 'learning_rate': 1.4102183639512825e-05, 'epoch': 0.77} {'loss': 0.4228, 'learning_rate': 1.4101877229833075e-05, 'epoch': 0.77} {'loss': 0.6413, 'learning_rate': 1.4101570815523085e-05, 'epoch': 0.77} {'loss': 0.4929, 'learning_rate': 1.41012643965832e-05, 'epoch': 0.77} {'loss': 0.5054, 'learning_rate': 1.4100957973013772e-05, 'epoch': 0.77} {'loss': 0.4299, 'learning_rate': 1.4100651544815139e-05, 'epoch': 0.77} {'loss': 0.6509, 'learning_rate': 1.410034511198765e-05, 'epoch': 0.77} {'loss': 0.5378, 'learning_rate': 1.4100038674531651e-05, 'epoch': 0.77} {'loss': 0.6141, 'learning_rate': 1.409973223244749e-05, 'epoch': 0.77} {'loss': 0.5603, 'learning_rate': 1.409942578573551e-05, 'epoch': 0.77} {'loss': 0.531, 'learning_rate': 1.4099119334396058e-05, 'epoch': 0.77} {'loss': 0.5197, 'learning_rate': 1.409881287842948e-05, 'epoch': 0.77} {'loss': 0.5361, 'learning_rate': 1.409850641783612e-05, 'epoch': 0.77} {'loss': 0.5264, 'learning_rate': 1.4098199952616326e-05, 'epoch': 0.77} {'loss': 0.6107, 'learning_rate': 1.4097893482770447e-05, 'epoch': 0.77} {'loss': 0.3685, 'learning_rate': 1.4097587008298824e-05, 'epoch': 0.77} {'loss': 0.5139, 'learning_rate': 1.4097280529201803e-05, 'epoch': 0.77} {'loss': 0.5659, 'learning_rate': 1.409697404547973e-05, 'epoch': 0.77} {'loss': 0.5859, 'learning_rate': 1.4096667557132955e-05, 'epoch': 0.77} {'loss': 0.4261, 'learning_rate': 1.409636106416182e-05, 'epoch': 0.77} {'loss': 0.4829, 'learning_rate': 1.4096054566566672e-05, 'epoch': 0.77} {'loss': 0.5333, 'learning_rate': 1.4095748064347859e-05, 'epoch': 0.77} {'loss': 0.5109, 'learning_rate': 1.4095441557505725e-05, 'epoch': 0.77} {'loss': 0.6075, 'learning_rate': 1.4095135046040614e-05, 'epoch': 0.77} {'loss': 0.5139, 'learning_rate': 1.4094828529952875e-05, 'epoch': 0.77} {'loss': 0.4636, 'learning_rate': 1.4094522009242855e-05, 'epoch': 0.77} {'loss': 0.4829, 'learning_rate': 1.4094215483910898e-05, 'epoch': 0.77} {'loss': 0.6128, 'learning_rate': 1.4093908953957351e-05, 'epoch': 0.77} {'loss': 0.6157, 'learning_rate': 1.4093602419382557e-05, 'epoch': 0.77} {'loss': 0.4265, 'learning_rate': 1.4093295880186866e-05, 'epoch': 0.77} {'loss': 0.4702, 'learning_rate': 1.409298933637062e-05, 'epoch': 0.77} {'loss': 0.5986, 'learning_rate': 1.4092682787934172e-05, 'epoch': 0.77} {'loss': 0.6548, 'learning_rate': 1.409237623487786e-05, 'epoch': 0.77} {'loss': 0.5086, 'learning_rate': 1.4092069677202034e-05, 'epoch': 0.77} {'loss': 0.6945, 'learning_rate': 1.4091763114907038e-05, 'epoch': 0.77} {'loss': 0.5292, 'learning_rate': 1.409145654799322e-05, 'epoch': 0.77} {'loss': 0.5619, 'learning_rate': 1.4091149976460927e-05, 'epoch': 0.77} {'loss': 0.4719, 'learning_rate': 1.4090843400310503e-05, 'epoch': 0.77} {'loss': 0.7806, 'learning_rate': 1.4090536819542293e-05, 'epoch': 0.77} {'loss': 0.4774, 'learning_rate': 1.4090230234156647e-05, 'epoch': 0.77} {'loss': 0.6862, 'learning_rate': 1.4089923644153911e-05, 'epoch': 0.77} {'loss': 0.6022, 'learning_rate': 1.4089617049534425e-05, 'epoch': 0.77} {'loss': 0.4036, 'learning_rate': 1.408931045029854e-05, 'epoch': 0.77} {'loss': 0.5471, 'learning_rate': 1.4089003846446602e-05, 'epoch': 0.77} {'loss': 0.581, 'learning_rate': 1.4088697237978956e-05, 'epoch': 0.77} {'loss': 0.6901, 'learning_rate': 1.408839062489595e-05, 'epoch': 0.77} {'loss': 0.681, 'learning_rate': 1.4088084007197924e-05, 'epoch': 0.77} {'loss': 0.4825, 'learning_rate': 1.408777738488523e-05, 'epoch': 0.77} {'loss': 0.5166, 'learning_rate': 1.4087470757958215e-05, 'epoch': 0.77} {'loss': 0.5945, 'learning_rate': 1.408716412641722e-05, 'epoch': 0.77} {'loss': 0.5087, 'learning_rate': 1.4086857490262595e-05, 'epoch': 0.77} {'loss': 0.5025, 'learning_rate': 1.4086550849494687e-05, 'epoch': 0.77} {'loss': 0.5277, 'learning_rate': 1.4086244204113837e-05, 'epoch': 0.77} {'loss': 0.5792, 'learning_rate': 1.4085937554120397e-05, 'epoch': 0.77} {'loss': 0.5752, 'learning_rate': 1.4085630899514709e-05, 'epoch': 0.77} {'loss': 0.6111, 'learning_rate': 1.408532424029712e-05, 'epoch': 0.77} {'loss': 0.5384, 'learning_rate': 1.4085017576467979e-05, 'epoch': 0.77} {'loss': 0.5903, 'learning_rate': 1.4084710908027627e-05, 'epoch': 0.77} {'loss': 0.5281, 'learning_rate': 1.4084404234976417e-05, 'epoch': 0.77} {'loss': 0.5833, 'learning_rate': 1.4084097557314689e-05, 'epoch': 0.77} {'loss': 0.5933, 'learning_rate': 1.408379087504279e-05, 'epoch': 0.77} {'loss': 0.5044, 'learning_rate': 1.4083484188161069e-05, 'epoch': 0.77} {'loss': 0.5927, 'learning_rate': 1.408317749666987e-05, 'epoch': 0.77} {'loss': 0.6119, 'learning_rate': 1.4082870800569546e-05, 'epoch': 0.77} {'loss': 0.5114, 'learning_rate': 1.4082564099860432e-05, 'epoch': 0.77} {'loss': 0.5816, 'learning_rate': 1.408225739454288e-05, 'epoch': 0.77} {'loss': 0.5705, 'learning_rate': 1.4081950684617236e-05, 'epoch': 0.77} {'loss': 0.3457, 'learning_rate': 1.4081643970083844e-05, 'epoch': 0.77} {'loss': 0.54, 'learning_rate': 1.4081337250943055e-05, 'epoch': 0.77} {'loss': 0.5733, 'learning_rate': 1.408103052719521e-05, 'epoch': 0.77} {'loss': 0.3261, 'learning_rate': 1.4080723798840659e-05, 'epoch': 0.77} {'loss': 0.6523, 'learning_rate': 1.4080417065879746e-05, 'epoch': 0.77} {'loss': 0.6982, 'learning_rate': 1.4080110328312816e-05, 'epoch': 0.77} {'loss': 0.6435, 'learning_rate': 1.4079803586140222e-05, 'epoch': 0.77} {'loss': 0.6742, 'learning_rate': 1.4079496839362304e-05, 'epoch': 0.77} {'loss': 0.55, 'learning_rate': 1.4079190087979408e-05, 'epoch': 0.77} {'loss': 0.5142, 'learning_rate': 1.4078883331991886e-05, 'epoch': 0.77} {'loss': 0.365, 'learning_rate': 1.4078576571400075e-05, 'epoch': 0.77} {'loss': 0.52, 'learning_rate': 1.407826980620433e-05, 'epoch': 0.77} {'loss': 0.5981, 'learning_rate': 1.4077963036404993e-05, 'epoch': 0.77} {'loss': 0.4882, 'learning_rate': 1.407765626200241e-05, 'epoch': 0.77} {'loss': 0.5876, 'learning_rate': 1.4077349482996932e-05, 'epoch': 0.77} {'loss': 0.4548, 'learning_rate': 1.4077042699388898e-05, 'epoch': 0.77} {'loss': 0.6199, 'learning_rate': 1.407673591117866e-05, 'epoch': 0.77} {'loss': 0.7283, 'learning_rate': 1.4076429118366562e-05, 'epoch': 0.77} {'loss': 0.6454, 'learning_rate': 1.407612232095295e-05, 'epoch': 0.77} {'loss': 0.6342, 'learning_rate': 1.4075815518938172e-05, 'epoch': 0.77} {'loss': 0.6402, 'learning_rate': 1.4075508712322573e-05, 'epoch': 0.77} {'loss': 0.6468, 'learning_rate': 1.4075201901106499e-05, 'epoch': 0.77} {'loss': 0.5467, 'learning_rate': 1.4074895085290298e-05, 'epoch': 0.77} {'loss': 0.6132, 'learning_rate': 1.4074588264874319e-05, 'epoch': 0.77} {'loss': 0.6513, 'learning_rate': 1.4074281439858898e-05, 'epoch': 0.77} {'loss': 0.4262, 'learning_rate': 1.4073974610244392e-05, 'epoch': 0.77} {'loss': 0.5654, 'learning_rate': 1.407366777603114e-05, 'epoch': 0.77} {'loss': 0.4701, 'learning_rate': 1.4073360937219495e-05, 'epoch': 0.77} {'loss': 0.6384, 'learning_rate': 1.4073054093809798e-05, 'epoch': 0.77} {'loss': 0.6156, 'learning_rate': 1.40727472458024e-05, 'epoch': 0.77} {'loss': 0.5383, 'learning_rate': 1.4072440393197645e-05, 'epoch': 0.77} {'loss': 0.6547, 'learning_rate': 1.4072133535995875e-05, 'epoch': 0.77} {'loss': 0.5976, 'learning_rate': 1.4071826674197442e-05, 'epoch': 0.77} {'loss': 0.4762, 'learning_rate': 1.4071519807802694e-05, 'epoch': 0.77} {'loss': 0.4462, 'learning_rate': 1.4071212936811971e-05, 'epoch': 0.77} {'loss': 0.6578, 'learning_rate': 1.4070906061225624e-05, 'epoch': 0.77} {'loss': 0.3991, 'learning_rate': 1.4070599181043998e-05, 'epoch': 0.77} {'loss': 0.4697, 'learning_rate': 1.407029229626744e-05, 'epoch': 0.77} {'loss': 0.7081, 'learning_rate': 1.4069985406896296e-05, 'epoch': 0.77} {'loss': 0.5189, 'learning_rate': 1.4069678512930911e-05, 'epoch': 0.77} {'loss': 0.613, 'learning_rate': 1.4069371614371635e-05, 'epoch': 0.77} {'loss': 0.7105, 'learning_rate': 1.4069064711218812e-05, 'epoch': 0.77} {'loss': 0.7187, 'learning_rate': 1.4068757803472788e-05, 'epoch': 0.77} {'loss': 0.768, 'learning_rate': 1.406845089113391e-05, 'epoch': 0.77} {'loss': 0.6475, 'learning_rate': 1.4068143974202524e-05, 'epoch': 0.77} {'loss': 0.7388, 'learning_rate': 1.4067837052678979e-05, 'epoch': 0.77} {'loss': 0.6873, 'learning_rate': 1.406753012656362e-05, 'epoch': 0.77} {'loss': 0.5673, 'learning_rate': 1.406722319585679e-05, 'epoch': 0.77} {'loss': 0.4955, 'learning_rate': 1.406691626055884e-05, 'epoch': 0.77} {'loss': 0.4872, 'learning_rate': 1.4066609320670114e-05, 'epoch': 0.77} {'loss': 0.6311, 'learning_rate': 1.4066302376190959e-05, 'epoch': 0.77} {'loss': 0.495, 'learning_rate': 1.4065995427121724e-05, 'epoch': 0.77} {'loss': 0.4526, 'learning_rate': 1.4065688473462753e-05, 'epoch': 0.77} {'loss': 0.6292, 'learning_rate': 1.406538151521439e-05, 'epoch': 0.77} {'loss': 0.5896, 'learning_rate': 1.4065074552376988e-05, 'epoch': 0.77} {'loss': 0.57, 'learning_rate': 1.4064767584950887e-05, 'epoch': 0.77} {'loss': 0.5677, 'learning_rate': 1.4064460612936439e-05, 'epoch': 0.77} {'loss': 0.4681, 'learning_rate': 1.4064153636333986e-05, 'epoch': 0.77} {'loss': 0.6544, 'learning_rate': 1.4063846655143877e-05, 'epoch': 0.77} {'loss': 0.6779, 'learning_rate': 1.406353966936646e-05, 'epoch': 0.77} {'loss': 0.5319, 'learning_rate': 1.4063232679002077e-05, 'epoch': 0.77} {'loss': 0.5964, 'learning_rate': 1.4062925684051076e-05, 'epoch': 0.77} {'loss': 0.55, 'learning_rate': 1.4062618684513805e-05, 'epoch': 0.77} {'loss': 0.3919, 'learning_rate': 1.4062311680390612e-05, 'epoch': 0.77} {'loss': 0.6482, 'learning_rate': 1.406200467168184e-05, 'epoch': 0.77} {'loss': 0.4676, 'learning_rate': 1.4061697658387839e-05, 'epoch': 0.77} {'loss': 0.599, 'learning_rate': 1.4061390640508949e-05, 'epoch': 0.77} {'loss': 0.5033, 'learning_rate': 1.4061083618045525e-05, 'epoch': 0.77} {'loss': 0.5223, 'learning_rate': 1.4060776590997912e-05, 'epoch': 0.77} {'loss': 0.5266, 'learning_rate': 1.4060469559366449e-05, 'epoch': 0.77} {'loss': 0.6056, 'learning_rate': 1.4060162523151491e-05, 'epoch': 0.77} {'loss': 0.4935, 'learning_rate': 1.4059855482353382e-05, 'epoch': 0.77} {'loss': 0.737, 'learning_rate': 1.4059548436972467e-05, 'epoch': 0.77} {'loss': 0.513, 'learning_rate': 1.4059241387009097e-05, 'epoch': 0.77} {'loss': 0.6667, 'learning_rate': 1.4058934332463611e-05, 'epoch': 0.77} {'loss': 0.5286, 'learning_rate': 1.4058627273336363e-05, 'epoch': 0.77} {'loss': 0.5846, 'learning_rate': 1.4058320209627693e-05, 'epoch': 0.77} {'loss': 0.5025, 'learning_rate': 1.4058013141337954e-05, 'epoch': 0.77} {'loss': 0.7649, 'learning_rate': 1.405770606846749e-05, 'epoch': 0.77} {'loss': 0.5124, 'learning_rate': 1.4057398991016646e-05, 'epoch': 0.77} {'loss': 0.5111, 'learning_rate': 1.4057091908985772e-05, 'epoch': 0.77} {'loss': 0.5725, 'learning_rate': 1.4056784822375212e-05, 'epoch': 0.77} {'loss': 0.5636, 'learning_rate': 1.405647773118531e-05, 'epoch': 0.77} {'loss': 0.3774, 'learning_rate': 1.405617063541642e-05, 'epoch': 0.77} {'loss': 0.6951, 'learning_rate': 1.4055863535068884e-05, 'epoch': 0.77} {'loss': 0.511, 'learning_rate': 1.4055556430143047e-05, 'epoch': 0.77} {'loss': 0.5139, 'learning_rate': 1.4055249320639262e-05, 'epoch': 0.77} {'loss': 0.5392, 'learning_rate': 1.405494220655787e-05, 'epoch': 0.77} {'loss': 0.6403, 'learning_rate': 1.4054635087899218e-05, 'epoch': 0.77} {'loss': 0.5797, 'learning_rate': 1.4054327964663654e-05, 'epoch': 0.77} {'loss': 0.6464, 'learning_rate': 1.4054020836851526e-05, 'epoch': 0.77} {'loss': 0.6843, 'learning_rate': 1.4053713704463178e-05, 'epoch': 0.77} {'loss': 0.588, 'learning_rate': 1.4053406567498959e-05, 'epoch': 0.77} {'loss': 0.5348, 'learning_rate': 1.4053099425959213e-05, 'epoch': 0.77} {'loss': 0.6853, 'learning_rate': 1.4052792279844292e-05, 'epoch': 0.77} {'loss': 0.5608, 'learning_rate': 1.4052485129154536e-05, 'epoch': 0.77} {'loss': 0.4806, 'learning_rate': 1.40521779738903e-05, 'epoch': 0.77} {'loss': 0.6465, 'learning_rate': 1.4051870814051922e-05, 'epoch': 0.77} {'loss': 0.2658, 'learning_rate': 1.4051563649639752e-05, 'epoch': 0.77} {'loss': 0.5166, 'learning_rate': 1.4051256480654138e-05, 'epoch': 0.77} {'loss': 0.5822, 'learning_rate': 1.4050949307095426e-05, 'epoch': 0.77} {'loss': 0.5773, 'learning_rate': 1.405064212896396e-05, 'epoch': 0.77} {'loss': 0.5152, 'learning_rate': 1.4050334946260092e-05, 'epoch': 0.77} {'loss': 0.7466, 'learning_rate': 1.4050027758984164e-05, 'epoch': 0.77} {'loss': 0.568, 'learning_rate': 1.4049720567136527e-05, 'epoch': 0.77} {'loss': 0.6626, 'learning_rate': 1.4049413370717524e-05, 'epoch': 0.77} {'loss': 0.6338, 'learning_rate': 1.4049106169727504e-05, 'epoch': 0.77} {'loss': 0.5015, 'learning_rate': 1.4048798964166812e-05, 'epoch': 0.77} {'loss': 0.6727, 'learning_rate': 1.4048491754035797e-05, 'epoch': 0.77} {'loss': 0.6392, 'learning_rate': 1.4048184539334805e-05, 'epoch': 0.77} {'loss': 0.4933, 'learning_rate': 1.4047877320064183e-05, 'epoch': 0.77} {'loss': 0.4741, 'learning_rate': 1.4047570096224276e-05, 'epoch': 0.77} {'loss': 0.4967, 'learning_rate': 1.4047262867815432e-05, 'epoch': 0.77} {'loss': 0.5046, 'learning_rate': 1.4046955634838e-05, 'epoch': 0.77} {'loss': 0.4632, 'learning_rate': 1.4046648397292322e-05, 'epoch': 0.77} {'loss': 0.6513, 'learning_rate': 1.4046341155178747e-05, 'epoch': 0.77} {'loss': 0.4667, 'learning_rate': 1.4046033908497623e-05, 'epoch': 0.77} {'loss': 0.5992, 'learning_rate': 1.4045726657249298e-05, 'epoch': 0.77} {'loss': 0.6909, 'learning_rate': 1.4045419401434114e-05, 'epoch': 0.77} {'loss': 0.5472, 'learning_rate': 1.4045112141052424e-05, 'epoch': 0.77} {'loss': 0.6061, 'learning_rate': 1.4044804876104569e-05, 'epoch': 0.77} {'loss': 0.5332, 'learning_rate': 1.40444976065909e-05, 'epoch': 0.77} {'loss': 0.4688, 'learning_rate': 1.4044190332511763e-05, 'epoch': 0.77} {'loss': 0.505, 'learning_rate': 1.4043883053867502e-05, 'epoch': 0.77} {'loss': 0.5385, 'learning_rate': 1.4043575770658469e-05, 'epoch': 0.77} {'loss': 0.6133, 'learning_rate': 1.4043268482885003e-05, 'epoch': 0.77} {'loss': 0.4666, 'learning_rate': 1.4042961190547459e-05, 'epoch': 0.77} {'loss': 0.5372, 'learning_rate': 1.4042653893646182e-05, 'epoch': 0.77} {'loss': 0.6156, 'learning_rate': 1.4042346592181515e-05, 'epoch': 0.77} {'loss': 0.611, 'learning_rate': 1.4042039286153805e-05, 'epoch': 0.77} {'loss': 0.5103, 'learning_rate': 1.4041731975563407e-05, 'epoch': 0.77} {'loss': 0.5605, 'learning_rate': 1.4041424660410657e-05, 'epoch': 0.77} {'loss': 0.6655, 'learning_rate': 1.4041117340695911e-05, 'epoch': 0.77} {'loss': 0.5908, 'learning_rate': 1.404081001641951e-05, 'epoch': 0.77} {'loss': 0.5336, 'learning_rate': 1.4040502687581803e-05, 'epoch': 0.77} {'loss': 0.6645, 'learning_rate': 1.4040195354183137e-05, 'epoch': 0.77} {'loss': 0.5597, 'learning_rate': 1.4039888016223859e-05, 'epoch': 0.77} {'loss': 0.5412, 'learning_rate': 1.4039580673704316e-05, 'epoch': 0.77} {'loss': 0.715, 'learning_rate': 1.4039273326624853e-05, 'epoch': 0.77} {'loss': 0.4699, 'learning_rate': 1.4038965974985819e-05, 'epoch': 0.77} {'loss': 0.6319, 'learning_rate': 1.4038658618787561e-05, 'epoch': 0.77} {'loss': 0.3748, 'learning_rate': 1.4038351258030427e-05, 'epoch': 0.77} {'loss': 0.5775, 'learning_rate': 1.4038043892714762e-05, 'epoch': 0.77} {'loss': 0.4861, 'learning_rate': 1.403773652284091e-05, 'epoch': 0.77} {'loss': 0.517, 'learning_rate': 1.4037429148409224e-05, 'epoch': 0.77} {'loss': 0.5259, 'learning_rate': 1.4037121769420047e-05, 'epoch': 0.77} {'loss': 0.5068, 'learning_rate': 1.4036814385873729e-05, 'epoch': 0.77} {'loss': 0.5616, 'learning_rate': 1.4036506997770615e-05, 'epoch': 0.77} {'loss': 0.6626, 'learning_rate': 1.403619960511105e-05, 'epoch': 0.77} {'loss': 0.3816, 'learning_rate': 1.4035892207895386e-05, 'epoch': 0.77} {'loss': 0.4763, 'learning_rate': 1.4035584806123966e-05, 'epoch': 0.77} {'loss': 0.3215, 'learning_rate': 1.4035277399797135e-05, 'epoch': 0.77} {'loss': 0.6377, 'learning_rate': 1.4034969988915247e-05, 'epoch': 0.77} {'loss': 0.5348, 'learning_rate': 1.4034662573478643e-05, 'epoch': 0.77} {'loss': 0.5822, 'learning_rate': 1.4034355153487673e-05, 'epoch': 0.77} {'loss': 0.7197, 'learning_rate': 1.4034047728942683e-05, 'epoch': 0.77} {'loss': 0.4655, 'learning_rate': 1.4033740299844022e-05, 'epoch': 0.77} {'loss': 0.4051, 'learning_rate': 1.4033432866192034e-05, 'epoch': 0.77} {'loss': 0.5437, 'learning_rate': 1.4033125427987067e-05, 'epoch': 0.78} {'loss': 0.664, 'learning_rate': 1.4032817985229471e-05, 'epoch': 0.78} {'loss': 0.6484, 'learning_rate': 1.4032510537919588e-05, 'epoch': 0.78} {'loss': 0.6082, 'learning_rate': 1.4032203086057767e-05, 'epoch': 0.78} {'loss': 0.5012, 'learning_rate': 1.4031895629644354e-05, 'epoch': 0.78} {'loss': 0.6477, 'learning_rate': 1.4031588168679701e-05, 'epoch': 0.78} {'loss': 0.5042, 'learning_rate': 1.403128070316415e-05, 'epoch': 0.78} {'loss': 0.4061, 'learning_rate': 1.4030973233098049e-05, 'epoch': 0.78} {'loss': 0.4275, 'learning_rate': 1.4030665758481745e-05, 'epoch': 0.78} {'loss': 0.5468, 'learning_rate': 1.4030358279315588e-05, 'epoch': 0.78} {'loss': 0.6608, 'learning_rate': 1.4030050795599924e-05, 'epoch': 0.78} {'loss': 0.6508, 'learning_rate': 1.4029743307335095e-05, 'epoch': 0.78} {'loss': 0.6021, 'learning_rate': 1.4029435814521455e-05, 'epoch': 0.78} {'loss': 0.6033, 'learning_rate': 1.4029128317159347e-05, 'epoch': 0.78} {'loss': 0.5558, 'learning_rate': 1.4028820815249122e-05, 'epoch': 0.78} {'loss': 0.5105, 'learning_rate': 1.4028513308791121e-05, 'epoch': 0.78} {'loss': 0.6502, 'learning_rate': 1.4028205797785697e-05, 'epoch': 0.78} {'loss': 0.677, 'learning_rate': 1.4027898282233192e-05, 'epoch': 0.78} {'loss': 0.6624, 'learning_rate': 1.4027590762133958e-05, 'epoch': 0.78} {'loss': 0.6529, 'learning_rate': 1.4027283237488339e-05, 'epoch': 0.78} {'loss': 0.5317, 'learning_rate': 1.4026975708296682e-05, 'epoch': 0.78} {'loss': 0.6532, 'learning_rate': 1.4026668174559336e-05, 'epoch': 0.78} {'loss': 0.5482, 'learning_rate': 1.4026360636276648e-05, 'epoch': 0.78} {'loss': 0.4936, 'learning_rate': 1.4026053093448962e-05, 'epoch': 0.78} {'loss': 0.5236, 'learning_rate': 1.402574554607663e-05, 'epoch': 0.78} {'loss': 0.4357, 'learning_rate': 1.4025437994159998e-05, 'epoch': 0.78} {'loss': 0.5098, 'learning_rate': 1.402513043769941e-05, 'epoch': 0.78} {'loss': 0.5555, 'learning_rate': 1.4024822876695216e-05, 'epoch': 0.78} {'loss': 0.5914, 'learning_rate': 1.4024515311147762e-05, 'epoch': 0.78} {'loss': 0.7132, 'learning_rate': 1.4024207741057394e-05, 'epoch': 0.78} {'loss': 0.7035, 'learning_rate': 1.4023900166424462e-05, 'epoch': 0.78} {'loss': 0.6698, 'learning_rate': 1.4023592587249313e-05, 'epoch': 0.78} {'loss': 0.491, 'learning_rate': 1.4023285003532292e-05, 'epoch': 0.78} {'loss': 0.623, 'learning_rate': 1.4022977415273747e-05, 'epoch': 0.78} {'loss': 0.6389, 'learning_rate': 1.4022669822474027e-05, 'epoch': 0.78} {'loss': 0.5254, 'learning_rate': 1.4022362225133477e-05, 'epoch': 0.78} {'loss': 0.4705, 'learning_rate': 1.4022054623252443e-05, 'epoch': 0.78} {'loss': 0.4949, 'learning_rate': 1.4021747016831277e-05, 'epoch': 0.78} {'loss': 0.6453, 'learning_rate': 1.4021439405870324e-05, 'epoch': 0.78} {'loss': 0.5676, 'learning_rate': 1.4021131790369928e-05, 'epoch': 0.78} {'loss': 0.6033, 'learning_rate': 1.4020824170330438e-05, 'epoch': 0.78} {'loss': 0.6358, 'learning_rate': 1.4020516545752206e-05, 'epoch': 0.78} {'loss': 0.6638, 'learning_rate': 1.4020208916635571e-05, 'epoch': 0.78} {'loss': 0.7348, 'learning_rate': 1.4019901282980887e-05, 'epoch': 0.78} {'loss': 0.5855, 'learning_rate': 1.4019593644788498e-05, 'epoch': 0.78} {'loss': 0.6127, 'learning_rate': 1.4019286002058752e-05, 'epoch': 0.78} {'loss': 0.4496, 'learning_rate': 1.4018978354791999e-05, 'epoch': 0.78} {'loss': 0.5697, 'learning_rate': 1.4018670702988582e-05, 'epoch': 0.78} {'loss': 0.5948, 'learning_rate': 1.4018363046648849e-05, 'epoch': 0.78} {'loss': 0.6097, 'learning_rate': 1.4018055385773149e-05, 'epoch': 0.78} {'loss': 0.4838, 'learning_rate': 1.401774772036183e-05, 'epoch': 0.78} {'loss': 0.67, 'learning_rate': 1.4017440050415237e-05, 'epoch': 0.78} {'loss': 0.6359, 'learning_rate': 1.4017132375933718e-05, 'epoch': 0.78} {'loss': 0.6128, 'learning_rate': 1.401682469691762e-05, 'epoch': 0.78} {'loss': 0.5708, 'learning_rate': 1.401651701336729e-05, 'epoch': 0.78} {'loss': 0.6012, 'learning_rate': 1.4016209325283074e-05, 'epoch': 0.78} {'loss': 0.5979, 'learning_rate': 1.4015901632665326e-05, 'epoch': 0.78} {'loss': 0.4296, 'learning_rate': 1.4015593935514386e-05, 'epoch': 0.78} {'loss': 0.5942, 'learning_rate': 1.4015286233830605e-05, 'epoch': 0.78} {'loss': 0.5796, 'learning_rate': 1.401497852761433e-05, 'epoch': 0.78} {'loss': 0.5595, 'learning_rate': 1.4014670816865907e-05, 'epoch': 0.78} {'loss': 0.6775, 'learning_rate': 1.4014363101585684e-05, 'epoch': 0.78} {'loss': 0.5607, 'learning_rate': 1.4014055381774008e-05, 'epoch': 0.78} {'loss': 0.7456, 'learning_rate': 1.4013747657431228e-05, 'epoch': 0.78} {'loss': 0.6979, 'learning_rate': 1.401343992855769e-05, 'epoch': 0.78} {'loss': 0.6315, 'learning_rate': 1.401313219515374e-05, 'epoch': 0.78} {'loss': 0.7076, 'learning_rate': 1.401282445721973e-05, 'epoch': 0.78} {'loss': 0.4296, 'learning_rate': 1.4012516714756002e-05, 'epoch': 0.78} {'loss': 0.4334, 'learning_rate': 1.4012208967762906e-05, 'epoch': 0.78} {'loss': 0.5187, 'learning_rate': 1.4011901216240786e-05, 'epoch': 0.78} {'loss': 0.6382, 'learning_rate': 1.4011593460189996e-05, 'epoch': 0.78} {'loss': 0.5722, 'learning_rate': 1.401128569961088e-05, 'epoch': 0.78} {'loss': 0.4792, 'learning_rate': 1.4010977934503784e-05, 'epoch': 0.78} {'loss': 0.618, 'learning_rate': 1.4010670164869053e-05, 'epoch': 0.78} {'loss': 0.5541, 'learning_rate': 1.4010362390707047e-05, 'epoch': 0.78} {'loss': 0.5254, 'learning_rate': 1.4010054612018099e-05, 'epoch': 0.78} {'loss': 0.5464, 'learning_rate': 1.4009746828802562e-05, 'epoch': 0.78} {'loss': 0.4283, 'learning_rate': 1.4009439041060781e-05, 'epoch': 0.78} {'loss': 0.5287, 'learning_rate': 1.400913124879311e-05, 'epoch': 0.78} {'loss': 0.6764, 'learning_rate': 1.400882345199989e-05, 'epoch': 0.78} {'loss': 0.4912, 'learning_rate': 1.4008515650681471e-05, 'epoch': 0.78} {'loss': 0.4403, 'learning_rate': 1.40082078448382e-05, 'epoch': 0.78} {'loss': 0.6257, 'learning_rate': 1.4007900034470424e-05, 'epoch': 0.78} {'loss': 0.5659, 'learning_rate': 1.4007592219578492e-05, 'epoch': 0.78} {'loss': 0.6459, 'learning_rate': 1.400728440016275e-05, 'epoch': 0.78} {'loss': 0.5221, 'learning_rate': 1.4006976576223547e-05, 'epoch': 0.78} {'loss': 0.3873, 'learning_rate': 1.400666874776123e-05, 'epoch': 0.78} {'loss': 0.393, 'learning_rate': 1.4006360914776144e-05, 'epoch': 0.78} {'loss': 0.6041, 'learning_rate': 1.400605307726864e-05, 'epoch': 0.78} {'loss': 0.6928, 'learning_rate': 1.4005745235239063e-05, 'epoch': 0.78} {'loss': 0.4142, 'learning_rate': 1.4005437388687759e-05, 'epoch': 0.78} {'loss': 0.4774, 'learning_rate': 1.4005129537615081e-05, 'epoch': 0.78} {'loss': 0.5978, 'learning_rate': 1.4004821682021372e-05, 'epoch': 0.78} {'loss': 0.4356, 'learning_rate': 1.4004513821906982e-05, 'epoch': 0.78} {'loss': 0.6698, 'learning_rate': 1.4004205957272257e-05, 'epoch': 0.78} {'loss': 0.4764, 'learning_rate': 1.4003898088117542e-05, 'epoch': 0.78} {'loss': 0.4828, 'learning_rate': 1.4003590214443193e-05, 'epoch': 0.78} {'loss': 0.5669, 'learning_rate': 1.4003282336249547e-05, 'epoch': 0.78} {'loss': 0.6664, 'learning_rate': 1.400297445353696e-05, 'epoch': 0.78} {'loss': 0.551, 'learning_rate': 1.4002666566305774e-05, 'epoch': 0.78} {'loss': 0.508, 'learning_rate': 1.400235867455634e-05, 'epoch': 0.78} {'loss': 0.6356, 'learning_rate': 1.4002050778289003e-05, 'epoch': 0.78} {'loss': 0.5392, 'learning_rate': 1.4001742877504112e-05, 'epoch': 0.78} {'loss': 0.5291, 'learning_rate': 1.4001434972202012e-05, 'epoch': 0.78} {'loss': 0.4628, 'learning_rate': 1.4001127062383056e-05, 'epoch': 0.78} {'loss': 0.5438, 'learning_rate': 1.4000819148047588e-05, 'epoch': 0.78} {'loss': 0.4893, 'learning_rate': 1.4000511229195954e-05, 'epoch': 0.78} {'loss': 0.6744, 'learning_rate': 1.4000203305828506e-05, 'epoch': 0.78} {'loss': 0.6066, 'learning_rate': 1.3999895377945587e-05, 'epoch': 0.78} {'loss': 0.5368, 'learning_rate': 1.3999587445547547e-05, 'epoch': 0.78} {'loss': 0.6256, 'learning_rate': 1.3999279508634736e-05, 'epoch': 0.78} {'loss': 0.6717, 'learning_rate': 1.3998971567207495e-05, 'epoch': 0.78} {'loss': 0.5403, 'learning_rate': 1.3998663621266177e-05, 'epoch': 0.78} {'loss': 0.7233, 'learning_rate': 1.3998355670811132e-05, 'epoch': 0.78} {'loss': 0.594, 'learning_rate': 1.39980477158427e-05, 'epoch': 0.78} {'loss': 0.6367, 'learning_rate': 1.3997739756361233e-05, 'epoch': 0.78} {'loss': 0.4821, 'learning_rate': 1.3997431792367078e-05, 'epoch': 0.78} {'loss': 0.6513, 'learning_rate': 1.399712382386058e-05, 'epoch': 0.78} {'loss': 0.555, 'learning_rate': 1.3996815850842094e-05, 'epoch': 0.78} {'loss': 0.6365, 'learning_rate': 1.399650787331196e-05, 'epoch': 0.78} {'loss': 0.4591, 'learning_rate': 1.399619989127053e-05, 'epoch': 0.78} {'loss': 0.5798, 'learning_rate': 1.3995891904718149e-05, 'epoch': 0.78} {'loss': 0.6511, 'learning_rate': 1.3995583913655164e-05, 'epoch': 0.78} {'loss': 0.5842, 'learning_rate': 1.399527591808193e-05, 'epoch': 0.78} {'loss': 0.577, 'learning_rate': 1.3994967917998786e-05, 'epoch': 0.78} {'loss': 0.6556, 'learning_rate': 1.3994659913406081e-05, 'epoch': 0.78} {'loss': 0.628, 'learning_rate': 1.3994351904304169e-05, 'epoch': 0.78} {'loss': 0.6178, 'learning_rate': 1.3994043890693389e-05, 'epoch': 0.78} {'loss': 0.6455, 'learning_rate': 1.3993735872574096e-05, 'epoch': 0.78} {'loss': 0.5869, 'learning_rate': 1.3993427849946633e-05, 'epoch': 0.78} {'loss': 0.3221, 'learning_rate': 1.399311982281135e-05, 'epoch': 0.78} {'loss': 0.5338, 'learning_rate': 1.3992811791168594e-05, 'epoch': 0.78} {'loss': 0.6311, 'learning_rate': 1.3992503755018713e-05, 'epoch': 0.78} {'loss': 0.6348, 'learning_rate': 1.3992195714362054e-05, 'epoch': 0.78} {'loss': 0.6169, 'learning_rate': 1.3991887669198965e-05, 'epoch': 0.78} {'loss': 0.6618, 'learning_rate': 1.3991579619529794e-05, 'epoch': 0.78} {'loss': 0.489, 'learning_rate': 1.3991271565354888e-05, 'epoch': 0.78} {'loss': 0.4693, 'learning_rate': 1.39909635066746e-05, 'epoch': 0.78} {'loss': 0.7451, 'learning_rate': 1.3990655443489267e-05, 'epoch': 0.78} {'loss': 0.6228, 'learning_rate': 1.3990347375799248e-05, 'epoch': 0.78} {'loss': 0.5475, 'learning_rate': 1.399003930360488e-05, 'epoch': 0.78} {'loss': 0.4865, 'learning_rate': 1.398973122690652e-05, 'epoch': 0.78} {'loss': 0.5565, 'learning_rate': 1.398942314570451e-05, 'epoch': 0.78} {'loss': 0.5081, 'learning_rate': 1.3989115059999203e-05, 'epoch': 0.78} {'loss': 0.5716, 'learning_rate': 1.3988806969790942e-05, 'epoch': 0.78} {'loss': 0.4566, 'learning_rate': 1.3988498875080076e-05, 'epoch': 0.78} {'loss': 0.5759, 'learning_rate': 1.3988190775866954e-05, 'epoch': 0.78} {'loss': 0.5679, 'learning_rate': 1.3987882672151922e-05, 'epoch': 0.78} {'loss': 0.6553, 'learning_rate': 1.398757456393533e-05, 'epoch': 0.78} {'loss': 0.5209, 'learning_rate': 1.3987266451217523e-05, 'epoch': 0.78} {'loss': 0.6086, 'learning_rate': 1.3986958333998852e-05, 'epoch': 0.78} {'loss': 0.456, 'learning_rate': 1.3986650212279665e-05, 'epoch': 0.78} {'loss': 0.6915, 'learning_rate': 1.3986342086060304e-05, 'epoch': 0.78} {'loss': 0.5032, 'learning_rate': 1.3986033955341122e-05, 'epoch': 0.78} {'loss': 0.4254, 'learning_rate': 1.3985725820122467e-05, 'epoch': 0.78} {'loss': 0.6688, 'learning_rate': 1.3985417680404685e-05, 'epoch': 0.78} {'loss': 0.6605, 'learning_rate': 1.3985109536188124e-05, 'epoch': 0.78} {'loss': 0.6019, 'learning_rate': 1.3984801387473131e-05, 'epoch': 0.78} {'loss': 0.776, 'learning_rate': 1.3984493234260056e-05, 'epoch': 0.78} {'loss': 0.5664, 'learning_rate': 1.3984185076549245e-05, 'epoch': 0.78} {'loss': 0.7648, 'learning_rate': 1.3983876914341048e-05, 'epoch': 0.78} {'loss': 0.5702, 'learning_rate': 1.398356874763581e-05, 'epoch': 0.78} {'loss': 0.6073, 'learning_rate': 1.3983260576433882e-05, 'epoch': 0.78} {'loss': 0.5958, 'learning_rate': 1.3982952400735612e-05, 'epoch': 0.78} {'loss': 0.4963, 'learning_rate': 1.3982644220541344e-05, 'epoch': 0.78} {'loss': 0.504, 'learning_rate': 1.3982336035851427e-05, 'epoch': 0.78} {'loss': 0.4356, 'learning_rate': 1.398202784666621e-05, 'epoch': 0.78} {'loss': 0.6434, 'learning_rate': 1.3981719652986041e-05, 'epoch': 0.78} {'loss': 0.5622, 'learning_rate': 1.398141145481127e-05, 'epoch': 0.78} {'loss': 0.5273, 'learning_rate': 1.3981103252142239e-05, 'epoch': 0.78} {'loss': 0.5376, 'learning_rate': 1.39807950449793e-05, 'epoch': 0.78} {'loss': 0.5396, 'learning_rate': 1.3980486833322804e-05, 'epoch': 0.78} {'loss': 0.4483, 'learning_rate': 1.398017861717309e-05, 'epoch': 0.78} {'loss': 0.719, 'learning_rate': 1.3979870396530515e-05, 'epoch': 0.78} {'loss': 0.622, 'learning_rate': 1.3979562171395423e-05, 'epoch': 0.78} {'loss': 0.6938, 'learning_rate': 1.3979253941768161e-05, 'epoch': 0.78} {'loss': 0.5564, 'learning_rate': 1.3978945707649079e-05, 'epoch': 0.78} {'loss': 0.5537, 'learning_rate': 1.3978637469038521e-05, 'epoch': 0.78} {'loss': 0.5345, 'learning_rate': 1.397832922593684e-05, 'epoch': 0.78} {'loss': 0.5621, 'learning_rate': 1.3978020978344383e-05, 'epoch': 0.78} {'loss': 0.5524, 'learning_rate': 1.3977712726261495e-05, 'epoch': 0.78} {'loss': 0.5816, 'learning_rate': 1.3977404469688525e-05, 'epoch': 0.78} {'loss': 0.5343, 'learning_rate': 1.3977096208625824e-05, 'epoch': 0.78} {'loss': 0.5712, 'learning_rate': 1.3976787943073738e-05, 'epoch': 0.78} {'loss': 0.6852, 'learning_rate': 1.3976479673032612e-05, 'epoch': 0.78} {'loss': 0.6264, 'learning_rate': 1.3976171398502799e-05, 'epoch': 0.78} {'loss': 0.5256, 'learning_rate': 1.3975863119484643e-05, 'epoch': 0.78} {'loss': 0.5412, 'learning_rate': 1.3975554835978496e-05, 'epoch': 0.78} {'loss': 0.6026, 'learning_rate': 1.39752465479847e-05, 'epoch': 0.78} {'loss': 0.5835, 'learning_rate': 1.3974938255503609e-05, 'epoch': 0.78} {'loss': 0.4689, 'learning_rate': 1.3974629958535566e-05, 'epoch': 0.78} {'loss': 0.5688, 'learning_rate': 1.3974321657080925e-05, 'epoch': 0.78} {'loss': 0.6124, 'learning_rate': 1.3974013351140028e-05, 'epoch': 0.78} {'loss': 0.6363, 'learning_rate': 1.3973705040713227e-05, 'epoch': 0.78} {'loss': 0.5162, 'learning_rate': 1.3973396725800867e-05, 'epoch': 0.78} {'loss': 0.6152, 'learning_rate': 1.3973088406403298e-05, 'epoch': 0.78} {'loss': 0.6953, 'learning_rate': 1.3972780082520872e-05, 'epoch': 0.78} {'loss': 0.6473, 'learning_rate': 1.3972471754153927e-05, 'epoch': 0.78} {'loss': 0.4393, 'learning_rate': 1.397216342130282e-05, 'epoch': 0.78} {'loss': 0.5991, 'learning_rate': 1.3971855083967895e-05, 'epoch': 0.78} {'loss': 0.5302, 'learning_rate': 1.3971546742149502e-05, 'epoch': 0.78} {'loss': 0.4663, 'learning_rate': 1.3971238395847988e-05, 'epoch': 0.78} {'loss': 0.689, 'learning_rate': 1.39709300450637e-05, 'epoch': 0.78} {'loss': 0.5005, 'learning_rate': 1.3970621689796987e-05, 'epoch': 0.78} {'loss': 0.6051, 'learning_rate': 1.3970313330048195e-05, 'epoch': 0.78} {'loss': 0.6956, 'learning_rate': 1.3970004965817676e-05, 'epoch': 0.78} {'loss': 0.504, 'learning_rate': 1.3969696597105778e-05, 'epoch': 0.78} {'loss': 0.4793, 'learning_rate': 1.3969388223912845e-05, 'epoch': 0.78} {'loss': 0.4639, 'learning_rate': 1.3969079846239229e-05, 'epoch': 0.78} {'loss': 0.4573, 'learning_rate': 1.3968771464085276e-05, 'epoch': 0.78} {'loss': 0.6505, 'learning_rate': 1.3968463077451335e-05, 'epoch': 0.78} {'loss': 0.6694, 'learning_rate': 1.3968154686337753e-05, 'epoch': 0.78} {'loss': 0.6892, 'learning_rate': 1.3967846290744882e-05, 'epoch': 0.78} {'loss': 0.6367, 'learning_rate': 1.3967537890673066e-05, 'epoch': 0.78} {'loss': 0.507, 'learning_rate': 1.3967229486122652e-05, 'epoch': 0.78} {'loss': 0.4685, 'learning_rate': 1.396692107709399e-05, 'epoch': 0.78} {'loss': 0.5934, 'learning_rate': 1.3966612663587431e-05, 'epoch': 0.78} {'loss': 0.5217, 'learning_rate': 1.396630424560332e-05, 'epoch': 0.78} {'loss': 0.5475, 'learning_rate': 1.3965995823142005e-05, 'epoch': 0.78} {'loss': 0.5626, 'learning_rate': 1.3965687396203834e-05, 'epoch': 0.78} {'loss': 0.6522, 'learning_rate': 1.3965378964789157e-05, 'epoch': 0.78} {'loss': 0.5515, 'learning_rate': 1.3965070528898322e-05, 'epoch': 0.78} {'loss': 0.5476, 'learning_rate': 1.3964762088531672e-05, 'epoch': 0.78} {'loss': 0.5505, 'learning_rate': 1.3964453643689564e-05, 'epoch': 0.78} {'loss': 0.5267, 'learning_rate': 1.3964145194372342e-05, 'epoch': 0.78} {'loss': 0.5609, 'learning_rate': 1.3963836740580352e-05, 'epoch': 0.78} {'loss': 0.4765, 'learning_rate': 1.3963528282313944e-05, 'epoch': 0.78} {'loss': 0.5928, 'learning_rate': 1.3963219819573468e-05, 'epoch': 0.78} {'loss': 0.5397, 'learning_rate': 1.396291135235927e-05, 'epoch': 0.78} {'loss': 0.4721, 'learning_rate': 1.3962602880671697e-05, 'epoch': 0.78} {'loss': 0.5601, 'learning_rate': 1.39622944045111e-05, 'epoch': 0.78} {'loss': 0.5136, 'learning_rate': 1.3961985923877826e-05, 'epoch': 0.78} {'loss': 0.5161, 'learning_rate': 1.3961677438772222e-05, 'epoch': 0.78} {'loss': 0.38, 'learning_rate': 1.396136894919464e-05, 'epoch': 0.78} {'loss': 0.6349, 'learning_rate': 1.3961060455145426e-05, 'epoch': 0.78} {'loss': 0.4754, 'learning_rate': 1.3960751956624926e-05, 'epoch': 0.78} {'loss': 0.5936, 'learning_rate': 1.3960443453633493e-05, 'epoch': 0.78} {'loss': 0.4552, 'learning_rate': 1.3960134946171469e-05, 'epoch': 0.78} {'loss': 0.486, 'learning_rate': 1.3959826434239207e-05, 'epoch': 0.78} {'loss': 0.4793, 'learning_rate': 1.3959517917837054e-05, 'epoch': 0.78} {'loss': 0.4767, 'learning_rate': 1.3959209396965357e-05, 'epoch': 0.78} {'loss': 0.6677, 'learning_rate': 1.3958900871624468e-05, 'epoch': 0.78} {'loss': 0.6674, 'learning_rate': 1.3958592341814732e-05, 'epoch': 0.78} {'loss': 0.5413, 'learning_rate': 1.3958283807536494e-05, 'epoch': 0.78} {'loss': 0.6005, 'learning_rate': 1.3957975268790111e-05, 'epoch': 0.78} {'loss': 0.6637, 'learning_rate': 1.3957666725575924e-05, 'epoch': 0.78} {'loss': 0.5105, 'learning_rate': 1.3957358177894286e-05, 'epoch': 0.78} {'loss': 0.6767, 'learning_rate': 1.3957049625745542e-05, 'epoch': 0.78} {'loss': 0.5355, 'learning_rate': 1.3956741069130042e-05, 'epoch': 0.78} {'loss': 0.6268, 'learning_rate': 1.3956432508048137e-05, 'epoch': 0.78} {'loss': 0.6031, 'learning_rate': 1.3956123942500165e-05, 'epoch': 0.78} {'loss': 0.7086, 'learning_rate': 1.3955815372486488e-05, 'epoch': 0.78} {'loss': 0.5288, 'learning_rate': 1.3955506798007443e-05, 'epoch': 0.78} {'loss': 0.6413, 'learning_rate': 1.3955198219063384e-05, 'epoch': 0.78} {'loss': 0.6248, 'learning_rate': 1.3954889635654658e-05, 'epoch': 0.78} {'loss': 0.7092, 'learning_rate': 1.3954581047781615e-05, 'epoch': 0.78} {'loss': 0.668, 'learning_rate': 1.3954272455444603e-05, 'epoch': 0.78} {'loss': 0.5833, 'learning_rate': 1.3953963858643966e-05, 'epoch': 0.78} {'loss': 0.7595, 'learning_rate': 1.3953655257380057e-05, 'epoch': 0.78} {'loss': 0.5887, 'learning_rate': 1.3953346651653224e-05, 'epoch': 0.78} {'loss': 0.5706, 'learning_rate': 1.3953038041463814e-05, 'epoch': 0.78} {'loss': 0.6818, 'learning_rate': 1.3952729426812174e-05, 'epoch': 0.78} {'loss': 0.5505, 'learning_rate': 1.3952420807698658e-05, 'epoch': 0.78} {'loss': 0.5998, 'learning_rate': 1.395211218412361e-05, 'epoch': 0.78} {'loss': 0.6548, 'learning_rate': 1.3951803556087376e-05, 'epoch': 0.78} {'loss': 0.5904, 'learning_rate': 1.395149492359031e-05, 'epoch': 0.78} {'loss': 0.5705, 'learning_rate': 1.3951186286632754e-05, 'epoch': 0.78} {'loss': 0.6931, 'learning_rate': 1.3950877645215061e-05, 'epoch': 0.78} {'loss': 0.4456, 'learning_rate': 1.3950568999337581e-05, 'epoch': 0.78} {'loss': 0.573, 'learning_rate': 1.3950260349000657e-05, 'epoch': 0.78} {'loss': 0.4202, 'learning_rate': 1.3949951694204642e-05, 'epoch': 0.78} {'loss': 0.6782, 'learning_rate': 1.394964303494988e-05, 'epoch': 0.78} {'loss': 0.7134, 'learning_rate': 1.3949334371236724e-05, 'epoch': 0.78} {'loss': 0.513, 'learning_rate': 1.3949025703065523e-05, 'epoch': 0.78} {'loss': 0.3904, 'learning_rate': 1.3948717030436622e-05, 'epoch': 0.78} {'loss': 0.5755, 'learning_rate': 1.3948408353350369e-05, 'epoch': 0.78} {'loss': 0.607, 'learning_rate': 1.3948099671807114e-05, 'epoch': 0.78} {'loss': 0.5379, 'learning_rate': 1.3947790985807203e-05, 'epoch': 0.78} {'loss': 0.5714, 'learning_rate': 1.3947482295350989e-05, 'epoch': 0.78} {'loss': 0.4222, 'learning_rate': 1.3947173600438819e-05, 'epoch': 0.78} {'loss': 0.6456, 'learning_rate': 1.394686490107104e-05, 'epoch': 0.78} {'loss': 0.4498, 'learning_rate': 1.3946556197248001e-05, 'epoch': 0.78} {'loss': 0.5724, 'learning_rate': 1.3946247488970049e-05, 'epoch': 0.78} {'loss': 0.5265, 'learning_rate': 1.3945938776237536e-05, 'epoch': 0.78} {'loss': 0.7124, 'learning_rate': 1.3945630059050805e-05, 'epoch': 0.78} {'loss': 0.7058, 'learning_rate': 1.3945321337410212e-05, 'epoch': 0.78} {'loss': 0.7231, 'learning_rate': 1.3945012611316103e-05, 'epoch': 0.78} {'loss': 0.5753, 'learning_rate': 1.394470388076882e-05, 'epoch': 0.78} {'loss': 0.5678, 'learning_rate': 1.3944395145768718e-05, 'epoch': 0.78} {'loss': 0.4519, 'learning_rate': 1.3944086406316144e-05, 'epoch': 0.78} {'loss': 0.604, 'learning_rate': 1.3943777662411448e-05, 'epoch': 0.78} {'loss': 0.5167, 'learning_rate': 1.3943468914054977e-05, 'epoch': 0.78} {'loss': 0.6121, 'learning_rate': 1.3943160161247077e-05, 'epoch': 0.78} {'loss': 0.4556, 'learning_rate': 1.39428514039881e-05, 'epoch': 0.78} {'loss': 0.497, 'learning_rate': 1.3942542642278395e-05, 'epoch': 0.78} {'loss': 0.6878, 'learning_rate': 1.3942233876118306e-05, 'epoch': 0.78} {'loss': 0.3493, 'learning_rate': 1.3941925105508185e-05, 'epoch': 0.78} {'loss': 0.6174, 'learning_rate': 1.3941616330448382e-05, 'epoch': 0.78} {'loss': 0.7629, 'learning_rate': 1.3941307550939246e-05, 'epoch': 0.78} {'loss': 0.5734, 'learning_rate': 1.3940998766981119e-05, 'epoch': 0.78} {'loss': 0.5534, 'learning_rate': 1.3940689978574357e-05, 'epoch': 0.78} {'loss': 0.5529, 'learning_rate': 1.3940381185719303e-05, 'epoch': 0.78} {'loss': 0.6388, 'learning_rate': 1.3940072388416308e-05, 'epoch': 0.78} {'loss': 0.4778, 'learning_rate': 1.3939763586665723e-05, 'epoch': 0.78} {'loss': 0.4377, 'learning_rate': 1.393945478046789e-05, 'epoch': 0.78} {'loss': 0.5974, 'learning_rate': 1.3939145969823165e-05, 'epoch': 0.78} {'loss': 0.739, 'learning_rate': 1.3938837154731892e-05, 'epoch': 0.78} {'loss': 0.7927, 'learning_rate': 1.393852833519442e-05, 'epoch': 0.78} {'loss': 0.6969, 'learning_rate': 1.39382195112111e-05, 'epoch': 0.78} {'loss': 0.6201, 'learning_rate': 1.393791068278228e-05, 'epoch': 0.78} {'loss': 0.6106, 'learning_rate': 1.3937601849908304e-05, 'epoch': 0.78} {'loss': 0.5925, 'learning_rate': 1.3937293012589526e-05, 'epoch': 0.78} {'loss': 0.5339, 'learning_rate': 1.3936984170826295e-05, 'epoch': 0.78} {'loss': 0.6198, 'learning_rate': 1.3936675324618958e-05, 'epoch': 0.78} {'loss': 0.6043, 'learning_rate': 1.393636647396786e-05, 'epoch': 0.78} {'loss': 0.5599, 'learning_rate': 1.3936057618873353e-05, 'epoch': 0.78} {'loss': 0.5281, 'learning_rate': 1.3935748759335788e-05, 'epoch': 0.78} {'loss': 0.4867, 'learning_rate': 1.3935439895355507e-05, 'epoch': 0.78} {'loss': 0.737, 'learning_rate': 1.3935131026932867e-05, 'epoch': 0.78} {'loss': 0.5705, 'learning_rate': 1.3934822154068211e-05, 'epoch': 0.78} {'loss': 0.4791, 'learning_rate': 1.3934513276761887e-05, 'epoch': 0.78} {'loss': 0.4633, 'learning_rate': 1.3934204395014246e-05, 'epoch': 0.78} {'loss': 0.4927, 'learning_rate': 1.393389550882564e-05, 'epoch': 0.78} {'loss': 0.5593, 'learning_rate': 1.393358661819641e-05, 'epoch': 0.78} {'loss': 0.671, 'learning_rate': 1.393327772312691e-05, 'epoch': 0.78} {'loss': 0.4963, 'learning_rate': 1.3932968823617488e-05, 'epoch': 0.78} {'loss': 0.5828, 'learning_rate': 1.3932659919668492e-05, 'epoch': 0.78} {'loss': 0.5921, 'learning_rate': 1.393235101128027e-05, 'epoch': 0.78} {'loss': 0.4896, 'learning_rate': 1.3932042098453172e-05, 'epoch': 0.78} {'loss': 0.6016, 'learning_rate': 1.3931733181187545e-05, 'epoch': 0.78} {'loss': 0.6377, 'learning_rate': 1.3931424259483742e-05, 'epoch': 0.78} {'loss': 0.7207, 'learning_rate': 1.3931115333342104e-05, 'epoch': 0.78} {'loss': 0.6445, 'learning_rate': 1.393080640276299e-05, 'epoch': 0.78} {'loss': 0.6819, 'learning_rate': 1.3930497467746737e-05, 'epoch': 0.78} {'loss': 0.6353, 'learning_rate': 1.3930188528293705e-05, 'epoch': 0.78} {'loss': 0.3966, 'learning_rate': 1.3929879584404235e-05, 'epoch': 0.78} {'loss': 0.531, 'learning_rate': 1.392957063607868e-05, 'epoch': 0.78} {'loss': 0.5936, 'learning_rate': 1.3929261683317385e-05, 'epoch': 0.78} {'loss': 0.6006, 'learning_rate': 1.3928952726120702e-05, 'epoch': 0.78} {'loss': 0.5471, 'learning_rate': 1.3928643764488978e-05, 'epoch': 0.78} {'loss': 0.7232, 'learning_rate': 1.392833479842256e-05, 'epoch': 0.78} {'loss': 0.6174, 'learning_rate': 1.39280258279218e-05, 'epoch': 0.78} {'loss': 0.524, 'learning_rate': 1.3927716852987048e-05, 'epoch': 0.78} {'loss': 0.5218, 'learning_rate': 1.392740787361865e-05, 'epoch': 0.78} {'loss': 0.6312, 'learning_rate': 1.3927098889816955e-05, 'epoch': 0.78} {'loss': 0.5857, 'learning_rate': 1.3926789901582311e-05, 'epoch': 0.78} {'loss': 0.5412, 'learning_rate': 1.392648090891507e-05, 'epoch': 0.78} {'loss': 0.5063, 'learning_rate': 1.3926171911815578e-05, 'epoch': 0.78} {'loss': 0.5064, 'learning_rate': 1.3925862910284185e-05, 'epoch': 0.78} {'loss': 0.5687, 'learning_rate': 1.3925553904321239e-05, 'epoch': 0.78} {'loss': 0.5021, 'learning_rate': 1.3925244893927087e-05, 'epoch': 0.78} {'loss': 0.5408, 'learning_rate': 1.3924935879102082e-05, 'epoch': 0.78} {'loss': 0.6069, 'learning_rate': 1.392462685984657e-05, 'epoch': 0.78} {'loss': 0.693, 'learning_rate': 1.3924317836160901e-05, 'epoch': 0.78} {'loss': 0.5279, 'learning_rate': 1.3924008808045421e-05, 'epoch': 0.78} {'loss': 0.4806, 'learning_rate': 1.3923699775500485e-05, 'epoch': 0.78} {'loss': 0.5651, 'learning_rate': 1.3923390738526437e-05, 'epoch': 0.78} {'loss': 0.5704, 'learning_rate': 1.3923081697123627e-05, 'epoch': 0.78} {'loss': 0.5247, 'learning_rate': 1.3922772651292402e-05, 'epoch': 0.78} {'loss': 0.5716, 'learning_rate': 1.3922463601033114e-05, 'epoch': 0.78} {'loss': 0.6436, 'learning_rate': 1.392215454634611e-05, 'epoch': 0.78} {'loss': 0.4384, 'learning_rate': 1.392184548723174e-05, 'epoch': 0.78} {'loss': 0.5006, 'learning_rate': 1.3921536423690353e-05, 'epoch': 0.78} {'loss': 0.585, 'learning_rate': 1.3921227355722295e-05, 'epoch': 0.78} {'loss': 0.504, 'learning_rate': 1.3920918283327918e-05, 'epoch': 0.78} {'loss': 0.7504, 'learning_rate': 1.3920609206507569e-05, 'epoch': 0.78} {'loss': 0.5547, 'learning_rate': 1.3920300125261598e-05, 'epoch': 0.78} {'loss': 0.6745, 'learning_rate': 1.3919991039590355e-05, 'epoch': 0.78} {'loss': 0.5149, 'learning_rate': 1.3919681949494187e-05, 'epoch': 0.78} {'loss': 0.5377, 'learning_rate': 1.3919372854973443e-05, 'epoch': 0.78} {'loss': 0.5187, 'learning_rate': 1.391906375602847e-05, 'epoch': 0.78} {'loss': 0.6319, 'learning_rate': 1.3918754652659623e-05, 'epoch': 0.78} {'loss': 0.3633, 'learning_rate': 1.3918445544867247e-05, 'epoch': 0.78} {'loss': 0.4723, 'learning_rate': 1.391813643265169e-05, 'epoch': 0.78} {'loss': 0.6858, 'learning_rate': 1.3917827316013301e-05, 'epoch': 0.78} {'loss': 0.5841, 'learning_rate': 1.391751819495243e-05, 'epoch': 0.78} {'loss': 0.6875, 'learning_rate': 1.3917209069469428e-05, 'epoch': 0.78} {'loss': 0.6584, 'learning_rate': 1.391689993956464e-05, 'epoch': 0.78} {'loss': 0.4405, 'learning_rate': 1.391659080523842e-05, 'epoch': 0.78} {'loss': 0.4606, 'learning_rate': 1.3916281666491109e-05, 'epoch': 0.78} {'loss': 0.5244, 'learning_rate': 1.3915972523323064e-05, 'epoch': 0.78} {'loss': 0.5774, 'learning_rate': 1.3915663375734629e-05, 'epoch': 0.78} {'loss': 0.4797, 'learning_rate': 1.3915354223726157e-05, 'epoch': 0.78} {'loss': 0.5442, 'learning_rate': 1.3915045067297992e-05, 'epoch': 0.78} {'loss': 0.5662, 'learning_rate': 1.3914735906450486e-05, 'epoch': 0.78} {'loss': 0.3251, 'learning_rate': 1.3914426741183991e-05, 'epoch': 0.78} {'loss': 0.6435, 'learning_rate': 1.3914117571498848e-05, 'epoch': 0.78} {'loss': 0.7497, 'learning_rate': 1.3913808397395415e-05, 'epoch': 0.78} {'loss': 0.7321, 'learning_rate': 1.391349921887403e-05, 'epoch': 0.78} {'loss': 0.597, 'learning_rate': 1.3913190035935053e-05, 'epoch': 0.78} {'loss': 0.5387, 'learning_rate': 1.3912880848578829e-05, 'epoch': 0.78} {'loss': 0.6249, 'learning_rate': 1.3912571656805707e-05, 'epoch': 0.78} {'loss': 0.7345, 'learning_rate': 1.3912262460616032e-05, 'epoch': 0.78} {'loss': 0.7191, 'learning_rate': 1.391195326001016e-05, 'epoch': 0.78} {'loss': 0.6591, 'learning_rate': 1.3911644054988436e-05, 'epoch': 0.78} {'loss': 0.4999, 'learning_rate': 1.391133484555121e-05, 'epoch': 0.78} {'loss': 0.5588, 'learning_rate': 1.3911025631698828e-05, 'epoch': 0.78} {'loss': 0.5506, 'learning_rate': 1.3910716413431644e-05, 'epoch': 0.78} {'loss': 0.4394, 'learning_rate': 1.3910407190750006e-05, 'epoch': 0.78} {'loss': 0.637, 'learning_rate': 1.391009796365426e-05, 'epoch': 0.78} {'loss': 0.4862, 'learning_rate': 1.3909788732144758e-05, 'epoch': 0.78} {'loss': 0.4486, 'learning_rate': 1.3909479496221847e-05, 'epoch': 0.78} {'loss': 0.6823, 'learning_rate': 1.3909170255885877e-05, 'epoch': 0.78} {'loss': 0.5086, 'learning_rate': 1.3908861011137197e-05, 'epoch': 0.78} {'loss': 0.7355, 'learning_rate': 1.3908551761976159e-05, 'epoch': 0.78} {'loss': 0.6028, 'learning_rate': 1.3908242508403107e-05, 'epoch': 0.78} {'loss': 0.5374, 'learning_rate': 1.390793325041839e-05, 'epoch': 0.78} {'loss': 0.5056, 'learning_rate': 1.3907623988022362e-05, 'epoch': 0.78} {'loss': 0.479, 'learning_rate': 1.3907314721215371e-05, 'epoch': 0.78} {'loss': 0.5202, 'learning_rate': 1.3907005449997764e-05, 'epoch': 0.78} {'loss': 0.5126, 'learning_rate': 1.3906696174369888e-05, 'epoch': 0.78} {'loss': 0.7523, 'learning_rate': 1.39063868943321e-05, 'epoch': 0.78} {'loss': 0.5073, 'learning_rate': 1.3906077609884741e-05, 'epoch': 0.78} {'loss': 0.4979, 'learning_rate': 1.3905768321028164e-05, 'epoch': 0.78} {'loss': 0.5947, 'learning_rate': 1.3905459027762715e-05, 'epoch': 0.78} {'loss': 0.4331, 'learning_rate': 1.3905149730088747e-05, 'epoch': 0.78} {'loss': 0.661, 'learning_rate': 1.3904840428006608e-05, 'epoch': 0.78} {'loss': 0.5428, 'learning_rate': 1.3904531121516645e-05, 'epoch': 0.78} {'loss': 0.6091, 'learning_rate': 1.390422181061921e-05, 'epoch': 0.78} {'loss': 0.543, 'learning_rate': 1.390391249531465e-05, 'epoch': 0.78} {'loss': 0.5805, 'learning_rate': 1.3903603175603315e-05, 'epoch': 0.78} {'loss': 0.6006, 'learning_rate': 1.3903293851485556e-05, 'epoch': 0.78} {'loss': 0.5959, 'learning_rate': 1.3902984522961723e-05, 'epoch': 0.78} {'loss': 0.6403, 'learning_rate': 1.3902675190032158e-05, 'epoch': 0.78} {'loss': 0.601, 'learning_rate': 1.3902365852697214e-05, 'epoch': 0.78} {'loss': 0.6412, 'learning_rate': 1.3902056510957245e-05, 'epoch': 0.78} {'loss': 0.5277, 'learning_rate': 1.3901747164812596e-05, 'epoch': 0.78} {'loss': 0.6053, 'learning_rate': 1.3901437814263614e-05, 'epoch': 0.78} {'loss': 0.5249, 'learning_rate': 1.390112845931065e-05, 'epoch': 0.78} {'loss': 0.6534, 'learning_rate': 1.3900819099954056e-05, 'epoch': 0.78} {'loss': 0.525, 'learning_rate': 1.3900509736194178e-05, 'epoch': 0.78} {'loss': 0.7417, 'learning_rate': 1.390020036803137e-05, 'epoch': 0.78} {'loss': 0.4806, 'learning_rate': 1.3899890995465972e-05, 'epoch': 0.78} {'loss': 0.5056, 'learning_rate': 1.3899581618498342e-05, 'epoch': 0.78} {'loss': 0.5419, 'learning_rate': 1.3899272237128823e-05, 'epoch': 0.78} {'loss': 0.4328, 'learning_rate': 1.3898962851357772e-05, 'epoch': 0.78} {'loss': 0.5439, 'learning_rate': 1.3898653461185529e-05, 'epoch': 0.78} {'loss': 0.5798, 'learning_rate': 1.3898344066612449e-05, 'epoch': 0.78} {'loss': 0.6349, 'learning_rate': 1.3898034667638878e-05, 'epoch': 0.78} {'loss': 0.5211, 'learning_rate': 1.389772526426517e-05, 'epoch': 0.78} {'loss': 0.5634, 'learning_rate': 1.3897415856491669e-05, 'epoch': 0.78} {'loss': 0.6235, 'learning_rate': 1.3897106444318728e-05, 'epoch': 0.78} {'loss': 0.7148, 'learning_rate': 1.3896797027746696e-05, 'epoch': 0.78} {'loss': 0.5177, 'learning_rate': 1.3896487606775919e-05, 'epoch': 0.78} {'loss': 0.4557, 'learning_rate': 1.3896178181406748e-05, 'epoch': 0.78} {'loss': 0.434, 'learning_rate': 1.3895868751639534e-05, 'epoch': 0.78} {'loss': 0.6556, 'learning_rate': 1.3895559317474626e-05, 'epoch': 0.78} {'loss': 0.4696, 'learning_rate': 1.3895249878912372e-05, 'epoch': 0.78} {'loss': 0.5708, 'learning_rate': 1.3894940435953122e-05, 'epoch': 0.78} {'loss': 0.5333, 'learning_rate': 1.3894630988597224e-05, 'epoch': 0.78} {'loss': 0.621, 'learning_rate': 1.3894321536845027e-05, 'epoch': 0.78} {'loss': 0.6586, 'learning_rate': 1.3894012080696882e-05, 'epoch': 0.78} {'loss': 0.8231, 'learning_rate': 1.389370262015314e-05, 'epoch': 0.78} {'loss': 0.5419, 'learning_rate': 1.3893393155214145e-05, 'epoch': 0.78} {'loss': 0.6074, 'learning_rate': 1.3893083685880251e-05, 'epoch': 0.78} {'loss': 0.5651, 'learning_rate': 1.3892774212151805e-05, 'epoch': 0.78} {'loss': 0.5712, 'learning_rate': 1.3892464734029158e-05, 'epoch': 0.78} {'loss': 0.5105, 'learning_rate': 1.3892155251512658e-05, 'epoch': 0.78} {'loss': 0.5304, 'learning_rate': 1.3891845764602656e-05, 'epoch': 0.78} {'loss': 0.579, 'learning_rate': 1.38915362732995e-05, 'epoch': 0.78} {'loss': 0.5926, 'learning_rate': 1.389122677760354e-05, 'epoch': 0.78} {'loss': 0.5951, 'learning_rate': 1.3890917277515125e-05, 'epoch': 0.78} {'loss': 0.5464, 'learning_rate': 1.3890607773034604e-05, 'epoch': 0.78} {'loss': 0.6865, 'learning_rate': 1.3890298264162325e-05, 'epoch': 0.78} {'loss': 0.6382, 'learning_rate': 1.388998875089864e-05, 'epoch': 0.78} {'loss': 0.6625, 'learning_rate': 1.3889679233243898e-05, 'epoch': 0.78} {'loss': 0.4539, 'learning_rate': 1.3889369711198446e-05, 'epoch': 0.78} {'loss': 0.5761, 'learning_rate': 1.3889060184762637e-05, 'epoch': 0.78} {'loss': 0.6288, 'learning_rate': 1.3888750653936818e-05, 'epoch': 0.78} {'loss': 0.5767, 'learning_rate': 1.3888441118721339e-05, 'epoch': 0.78} {'loss': 0.47, 'learning_rate': 1.3888131579116546e-05, 'epoch': 0.78} {'loss': 0.54, 'learning_rate': 1.3887822035122798e-05, 'epoch': 0.78} {'loss': 0.42, 'learning_rate': 1.3887512486740436e-05, 'epoch': 0.78} {'loss': 0.7448, 'learning_rate': 1.388720293396981e-05, 'epoch': 0.78} {'loss': 0.5586, 'learning_rate': 1.3886893376811272e-05, 'epoch': 0.78} {'loss': 0.6346, 'learning_rate': 1.3886583815265172e-05, 'epoch': 0.78} {'loss': 0.6338, 'learning_rate': 1.3886274249331854e-05, 'epoch': 0.78} {'loss': 0.4953, 'learning_rate': 1.3885964679011674e-05, 'epoch': 0.78} {'loss': 0.6339, 'learning_rate': 1.388565510430498e-05, 'epoch': 0.78} {'loss': 0.5146, 'learning_rate': 1.3885345525212119e-05, 'epoch': 0.78} {'loss': 0.5357, 'learning_rate': 1.388503594173344e-05, 'epoch': 0.78} {'loss': 0.7496, 'learning_rate': 1.3884726353869298e-05, 'epoch': 0.78} {'loss': 0.6682, 'learning_rate': 1.3884416761620036e-05, 'epoch': 0.79} {'loss': 0.6359, 'learning_rate': 1.3884107164986006e-05, 'epoch': 0.79} {'loss': 0.636, 'learning_rate': 1.3883797563967561e-05, 'epoch': 0.79} {'loss': 0.6068, 'learning_rate': 1.3883487958565045e-05, 'epoch': 0.79} {'loss': 0.5741, 'learning_rate': 1.3883178348778807e-05, 'epoch': 0.79} {'loss': 0.6058, 'learning_rate': 1.3882868734609203e-05, 'epoch': 0.79} {'loss': 0.6172, 'learning_rate': 1.3882559116056576e-05, 'epoch': 0.79} {'loss': 0.5785, 'learning_rate': 1.3882249493121279e-05, 'epoch': 0.79} {'loss': 0.5541, 'learning_rate': 1.388193986580366e-05, 'epoch': 0.79} {'loss': 0.5543, 'learning_rate': 1.3881630234104069e-05, 'epoch': 0.79} {'loss': 0.4481, 'learning_rate': 1.3881320598022855e-05, 'epoch': 0.79} {'loss': 0.4054, 'learning_rate': 1.388101095756037e-05, 'epoch': 0.79} {'loss': 0.3609, 'learning_rate': 1.388070131271696e-05, 'epoch': 0.79} {'loss': 0.713, 'learning_rate': 1.3880391663492978e-05, 'epoch': 0.79} {'loss': 0.512, 'learning_rate': 1.388008200988877e-05, 'epoch': 0.79} {'loss': 0.3796, 'learning_rate': 1.3879772351904689e-05, 'epoch': 0.79} {'loss': 0.3632, 'learning_rate': 1.3879462689541083e-05, 'epoch': 0.79} {'loss': 0.5598, 'learning_rate': 1.3879153022798299e-05, 'epoch': 0.79} {'loss': 0.7502, 'learning_rate': 1.387884335167669e-05, 'epoch': 0.79} {'loss': 0.5368, 'learning_rate': 1.3878533676176605e-05, 'epoch': 0.79} {'loss': 0.4424, 'learning_rate': 1.387822399629839e-05, 'epoch': 0.79} {'loss': 0.702, 'learning_rate': 1.3877914312042399e-05, 'epoch': 0.79} {'loss': 0.5641, 'learning_rate': 1.3877604623408982e-05, 'epoch': 0.79} {'loss': 0.5451, 'learning_rate': 1.3877294930398486e-05, 'epoch': 0.79} {'loss': 0.5212, 'learning_rate': 1.3876985233011263e-05, 'epoch': 0.79} {'loss': 0.6209, 'learning_rate': 1.3876675531247657e-05, 'epoch': 0.79} {'loss': 0.5667, 'learning_rate': 1.3876365825108025e-05, 'epoch': 0.79} {'loss': 0.5911, 'learning_rate': 1.3876056114592711e-05, 'epoch': 0.79} {'loss': 0.584, 'learning_rate': 1.3875746399702065e-05, 'epoch': 0.79} {'loss': 0.7071, 'learning_rate': 1.3875436680436445e-05, 'epoch': 0.79} {'loss': 0.4928, 'learning_rate': 1.387512695679619e-05, 'epoch': 0.79} {'loss': 0.4872, 'learning_rate': 1.3874817228781652e-05, 'epoch': 0.79} {'loss': 0.4948, 'learning_rate': 1.3874507496393184e-05, 'epoch': 0.79} {'loss': 0.4351, 'learning_rate': 1.3874197759631135e-05, 'epoch': 0.79} {'loss': 0.5152, 'learning_rate': 1.3873888018495849e-05, 'epoch': 0.79} {'loss': 0.4116, 'learning_rate': 1.3873578272987682e-05, 'epoch': 0.79} {'loss': 0.2502, 'learning_rate': 1.3873268523106985e-05, 'epoch': 0.79} {'loss': 0.5632, 'learning_rate': 1.3872958768854098e-05, 'epoch': 0.79} {'loss': 0.6068, 'learning_rate': 1.3872649010229382e-05, 'epoch': 0.79} {'loss': 0.351, 'learning_rate': 1.3872339247233182e-05, 'epoch': 0.79} {'loss': 0.5311, 'learning_rate': 1.3872029479865845e-05, 'epoch': 0.79} {'loss': 0.6015, 'learning_rate': 1.3871719708127725e-05, 'epoch': 0.79} {'loss': 0.4994, 'learning_rate': 1.3871409932019167e-05, 'epoch': 0.79} {'loss': 0.5665, 'learning_rate': 1.3871100151540527e-05, 'epoch': 0.79} {'loss': 0.4653, 'learning_rate': 1.3870790366692146e-05, 'epoch': 0.79} {'loss': 0.4629, 'learning_rate': 1.3870480577474384e-05, 'epoch': 0.79} {'loss': 0.6314, 'learning_rate': 1.3870170783887582e-05, 'epoch': 0.79} {'loss': 0.6766, 'learning_rate': 1.3869860985932093e-05, 'epoch': 0.79} {'loss': 0.5846, 'learning_rate': 1.386955118360827e-05, 'epoch': 0.79} {'loss': 0.5355, 'learning_rate': 1.3869241376916456e-05, 'epoch': 0.79} {'loss': 0.5364, 'learning_rate': 1.3868931565857006e-05, 'epoch': 0.79} {'loss': 0.5034, 'learning_rate': 1.3868621750430268e-05, 'epoch': 0.79} {'loss': 0.7132, 'learning_rate': 1.3868311930636592e-05, 'epoch': 0.79} {'loss': 0.4151, 'learning_rate': 1.3868002106476328e-05, 'epoch': 0.79} {'loss': 0.4176, 'learning_rate': 1.3867692277949824e-05, 'epoch': 0.79} {'loss': 0.6967, 'learning_rate': 1.386738244505743e-05, 'epoch': 0.79} {'loss': 0.5079, 'learning_rate': 1.38670726077995e-05, 'epoch': 0.79} {'loss': 0.5933, 'learning_rate': 1.3866762766176378e-05, 'epoch': 0.79} {'loss': 0.5952, 'learning_rate': 1.3866452920188415e-05, 'epoch': 0.79} {'loss': 0.7301, 'learning_rate': 1.3866143069835963e-05, 'epoch': 0.79} {'loss': 0.5343, 'learning_rate': 1.386583321511937e-05, 'epoch': 0.79} {'loss': 0.5604, 'learning_rate': 1.3865523356038987e-05, 'epoch': 0.79} {'loss': 0.7285, 'learning_rate': 1.3865213492595164e-05, 'epoch': 0.79} {'loss': 0.6913, 'learning_rate': 1.3864903624788251e-05, 'epoch': 0.79} {'loss': 0.5336, 'learning_rate': 1.3864593752618593e-05, 'epoch': 0.79} {'loss': 0.4915, 'learning_rate': 1.3864283876086549e-05, 'epoch': 0.79} {'loss': 0.5206, 'learning_rate': 1.386397399519246e-05, 'epoch': 0.79} {'loss': 0.5586, 'learning_rate': 1.3863664109936678e-05, 'epoch': 0.79} {'loss': 0.5086, 'learning_rate': 1.3863354220319556e-05, 'epoch': 0.79} {'loss': 0.5624, 'learning_rate': 1.386304432634144e-05, 'epoch': 0.79} {'loss': 0.4562, 'learning_rate': 1.3862734428002682e-05, 'epoch': 0.79} {'loss': 0.6779, 'learning_rate': 1.3862424525303632e-05, 'epoch': 0.79} {'loss': 0.4906, 'learning_rate': 1.386211461824464e-05, 'epoch': 0.79} {'loss': 0.6198, 'learning_rate': 1.3861804706826053e-05, 'epoch': 0.79} {'loss': 0.4925, 'learning_rate': 1.3861494791048223e-05, 'epoch': 0.79} {'loss': 0.5775, 'learning_rate': 1.3861184870911499e-05, 'epoch': 0.79} {'loss': 0.7022, 'learning_rate': 1.3860874946416235e-05, 'epoch': 0.79} {'loss': 0.4672, 'learning_rate': 1.3860565017562774e-05, 'epoch': 0.79} {'loss': 0.8033, 'learning_rate': 1.3860255084351473e-05, 'epoch': 0.79} {'loss': 0.5483, 'learning_rate': 1.3859945146782676e-05, 'epoch': 0.79} {'loss': 0.5372, 'learning_rate': 1.3859635204856734e-05, 'epoch': 0.79} {'loss': 0.6109, 'learning_rate': 1.3859325258573998e-05, 'epoch': 0.79} {'loss': 0.3682, 'learning_rate': 1.3859015307934818e-05, 'epoch': 0.79} {'loss': 0.559, 'learning_rate': 1.3858705352939542e-05, 'epoch': 0.79} {'loss': 0.627, 'learning_rate': 1.3858395393588523e-05, 'epoch': 0.79} {'loss': 0.4947, 'learning_rate': 1.3858085429882112e-05, 'epoch': 0.79} {'loss': 0.5527, 'learning_rate': 1.385777546182065e-05, 'epoch': 0.79} {'loss': 0.5168, 'learning_rate': 1.3857465489404495e-05, 'epoch': 0.79} {'loss': 0.5555, 'learning_rate': 1.3857155512633998e-05, 'epoch': 0.79} {'loss': 0.6284, 'learning_rate': 1.3856845531509506e-05, 'epoch': 0.79} {'loss': 0.645, 'learning_rate': 1.3856535546031366e-05, 'epoch': 0.79} {'loss': 0.6204, 'learning_rate': 1.3856225556199934e-05, 'epoch': 0.79} {'loss': 0.6741, 'learning_rate': 1.3855915562015554e-05, 'epoch': 0.79} {'loss': 0.6608, 'learning_rate': 1.3855605563478579e-05, 'epoch': 0.79} {'loss': 0.4751, 'learning_rate': 1.385529556058936e-05, 'epoch': 0.79} {'loss': 0.4711, 'learning_rate': 1.3854985553348241e-05, 'epoch': 0.79} {'loss': 0.5097, 'learning_rate': 1.385467554175558e-05, 'epoch': 0.79} {'loss': 0.4453, 'learning_rate': 1.3854365525811724e-05, 'epoch': 0.79} {'loss': 0.5032, 'learning_rate': 1.385405550551702e-05, 'epoch': 0.79} {'loss': 0.5659, 'learning_rate': 1.3853745480871821e-05, 'epoch': 0.79} {'loss': 0.5218, 'learning_rate': 1.3853435451876478e-05, 'epoch': 0.79} {'loss': 0.5329, 'learning_rate': 1.3853125418531337e-05, 'epoch': 0.79} {'loss': 0.6096, 'learning_rate': 1.385281538083675e-05, 'epoch': 0.79} {'loss': 0.5605, 'learning_rate': 1.3852505338793069e-05, 'epoch': 0.79} {'loss': 0.5441, 'learning_rate': 1.3852195292400641e-05, 'epoch': 0.79} {'loss': 0.7001, 'learning_rate': 1.3851885241659817e-05, 'epoch': 0.79} {'loss': 0.5558, 'learning_rate': 1.3851575186570948e-05, 'epoch': 0.79} {'loss': 0.466, 'learning_rate': 1.3851265127134382e-05, 'epoch': 0.79} {'loss': 0.4381, 'learning_rate': 1.3850955063350469e-05, 'epoch': 0.79} {'loss': 0.4011, 'learning_rate': 1.385064499521956e-05, 'epoch': 0.79} {'loss': 0.4703, 'learning_rate': 1.3850334922742006e-05, 'epoch': 0.79} {'loss': 0.6006, 'learning_rate': 1.3850024845918157e-05, 'epoch': 0.79} {'loss': 0.4616, 'learning_rate': 1.384971476474836e-05, 'epoch': 0.79} {'loss': 0.5835, 'learning_rate': 1.384940467923297e-05, 'epoch': 0.79} {'loss': 0.5427, 'learning_rate': 1.3849094589372331e-05, 'epoch': 0.79} {'loss': 0.4619, 'learning_rate': 1.3848784495166799e-05, 'epoch': 0.79} {'loss': 0.6172, 'learning_rate': 1.384847439661672e-05, 'epoch': 0.79} {'loss': 0.5406, 'learning_rate': 1.3848164293722444e-05, 'epoch': 0.79} {'loss': 0.7613, 'learning_rate': 1.3847854186484325e-05, 'epoch': 0.79} {'loss': 0.6635, 'learning_rate': 1.3847544074902706e-05, 'epoch': 0.79} {'loss': 0.6498, 'learning_rate': 1.3847233958977943e-05, 'epoch': 0.79} {'loss': 0.7058, 'learning_rate': 1.3846923838710387e-05, 'epoch': 0.79} {'loss': 0.4857, 'learning_rate': 1.3846613714100384e-05, 'epoch': 0.79} {'loss': 0.6225, 'learning_rate': 1.3846303585148285e-05, 'epoch': 0.79} {'loss': 0.6373, 'learning_rate': 1.384599345185444e-05, 'epoch': 0.79} {'loss': 0.4383, 'learning_rate': 1.38456833142192e-05, 'epoch': 0.79} {'loss': 0.6897, 'learning_rate': 1.3845373172242917e-05, 'epoch': 0.79} {'loss': 0.5901, 'learning_rate': 1.3845063025925938e-05, 'epoch': 0.79} {'loss': 0.5024, 'learning_rate': 1.3844752875268615e-05, 'epoch': 0.79} {'loss': 0.708, 'learning_rate': 1.3844442720271296e-05, 'epoch': 0.79} {'loss': 0.5401, 'learning_rate': 1.3844132560934331e-05, 'epoch': 0.79} {'loss': 0.4794, 'learning_rate': 1.3843822397258072e-05, 'epoch': 0.79} {'loss': 0.4843, 'learning_rate': 1.3843512229242869e-05, 'epoch': 0.79} {'loss': 0.5928, 'learning_rate': 1.3843202056889071e-05, 'epoch': 0.79} {'loss': 0.6065, 'learning_rate': 1.384289188019703e-05, 'epoch': 0.79} {'loss': 0.5408, 'learning_rate': 1.3842581699167092e-05, 'epoch': 0.79} {'loss': 0.586, 'learning_rate': 1.3842271513799612e-05, 'epoch': 0.79} {'loss': 0.5977, 'learning_rate': 1.3841961324094937e-05, 'epoch': 0.79} {'loss': 0.5804, 'learning_rate': 1.384165113005342e-05, 'epoch': 0.79} {'loss': 0.7066, 'learning_rate': 1.3841340931675408e-05, 'epoch': 0.79} {'loss': 0.5845, 'learning_rate': 1.3841030728961253e-05, 'epoch': 0.79} {'loss': 0.6361, 'learning_rate': 1.3840720521911306e-05, 'epoch': 0.79} {'loss': 0.5907, 'learning_rate': 1.3840410310525913e-05, 'epoch': 0.79} {'loss': 0.6465, 'learning_rate': 1.3840100094805428e-05, 'epoch': 0.79} {'loss': 0.5057, 'learning_rate': 1.3839789874750202e-05, 'epoch': 0.79} {'loss': 0.5389, 'learning_rate': 1.3839479650360584e-05, 'epoch': 0.79} {'loss': 0.5061, 'learning_rate': 1.3839169421636919e-05, 'epoch': 0.79} {'loss': 0.4845, 'learning_rate': 1.3838859188579565e-05, 'epoch': 0.79} {'loss': 0.3869, 'learning_rate': 1.383854895118887e-05, 'epoch': 0.79} {'loss': 0.5621, 'learning_rate': 1.383823870946518e-05, 'epoch': 0.79} {'loss': 0.5224, 'learning_rate': 1.3837928463408852e-05, 'epoch': 0.79} {'loss': 0.4773, 'learning_rate': 1.383761821302023e-05, 'epoch': 0.79} {'loss': 0.5567, 'learning_rate': 1.383730795829967e-05, 'epoch': 0.79} {'loss': 0.5419, 'learning_rate': 1.3836997699247516e-05, 'epoch': 0.79} {'loss': 0.6429, 'learning_rate': 1.3836687435864122e-05, 'epoch': 0.79} {'loss': 0.4683, 'learning_rate': 1.3836377168149837e-05, 'epoch': 0.79} {'loss': 0.3902, 'learning_rate': 1.3836066896105011e-05, 'epoch': 0.79} {'loss': 0.5904, 'learning_rate': 1.3835756619729996e-05, 'epoch': 0.79} {'loss': 0.3849, 'learning_rate': 1.3835446339025143e-05, 'epoch': 0.79} {'loss': 0.568, 'learning_rate': 1.3835136053990796e-05, 'epoch': 0.79} {'loss': 0.7006, 'learning_rate': 1.3834825764627313e-05, 'epoch': 0.79} {'loss': 0.6166, 'learning_rate': 1.3834515470935039e-05, 'epoch': 0.79} {'loss': 0.7177, 'learning_rate': 1.3834205172914328e-05, 'epoch': 0.79} {'loss': 0.6333, 'learning_rate': 1.3833894870565527e-05, 'epoch': 0.79} {'loss': 0.6014, 'learning_rate': 1.3833584563888988e-05, 'epoch': 0.79} {'loss': 0.5642, 'learning_rate': 1.3833274252885065e-05, 'epoch': 0.79} {'loss': 0.6541, 'learning_rate': 1.38329639375541e-05, 'epoch': 0.79} {'loss': 0.6406, 'learning_rate': 1.3832653617896447e-05, 'epoch': 0.79} {'loss': 0.6432, 'learning_rate': 1.383234329391246e-05, 'epoch': 0.79} {'loss': 0.6149, 'learning_rate': 1.3832032965602484e-05, 'epoch': 0.79} {'loss': 0.522, 'learning_rate': 1.3831722632966873e-05, 'epoch': 0.79} {'loss': 0.6022, 'learning_rate': 1.3831412296005974e-05, 'epoch': 0.79} {'loss': 0.7036, 'learning_rate': 1.383110195472014e-05, 'epoch': 0.79} {'loss': 0.7207, 'learning_rate': 1.3830791609109719e-05, 'epoch': 0.79} {'loss': 0.7118, 'learning_rate': 1.3830481259175064e-05, 'epoch': 0.79} {'loss': 0.5715, 'learning_rate': 1.3830170904916524e-05, 'epoch': 0.79} {'loss': 0.5773, 'learning_rate': 1.382986054633445e-05, 'epoch': 0.79} {'loss': 0.745, 'learning_rate': 1.3829550183429192e-05, 'epoch': 0.79} {'loss': 0.5863, 'learning_rate': 1.3829239816201102e-05, 'epoch': 0.79} {'loss': 0.6481, 'learning_rate': 1.3828929444650525e-05, 'epoch': 0.79} {'loss': 0.5867, 'learning_rate': 1.3828619068777815e-05, 'epoch': 0.79} {'loss': 0.6998, 'learning_rate': 1.3828308688583323e-05, 'epoch': 0.79} {'loss': 0.5042, 'learning_rate': 1.3827998304067396e-05, 'epoch': 0.79} {'loss': 0.6821, 'learning_rate': 1.382768791523039e-05, 'epoch': 0.79} {'loss': 0.5575, 'learning_rate': 1.3827377522072651e-05, 'epoch': 0.79} {'loss': 0.5935, 'learning_rate': 1.3827067124594531e-05, 'epoch': 0.79} {'loss': 0.7038, 'learning_rate': 1.3826756722796378e-05, 'epoch': 0.79} {'loss': 0.6021, 'learning_rate': 1.3826446316678544e-05, 'epoch': 0.79} {'loss': 0.6578, 'learning_rate': 1.3826135906241382e-05, 'epoch': 0.79} {'loss': 0.6464, 'learning_rate': 1.382582549148524e-05, 'epoch': 0.79} {'loss': 0.7996, 'learning_rate': 1.382551507241047e-05, 'epoch': 0.79} {'loss': 0.5491, 'learning_rate': 1.3825204649017419e-05, 'epoch': 0.79} {'loss': 0.5361, 'learning_rate': 1.382489422130644e-05, 'epoch': 0.79} {'loss': 0.5244, 'learning_rate': 1.382458378927788e-05, 'epoch': 0.79} {'loss': 0.7222, 'learning_rate': 1.3824273352932095e-05, 'epoch': 0.79} {'loss': 0.6162, 'learning_rate': 1.3823962912269434e-05, 'epoch': 0.79} {'loss': 0.4012, 'learning_rate': 1.3823652467290243e-05, 'epoch': 0.79} {'loss': 0.616, 'learning_rate': 1.3823342017994876e-05, 'epoch': 0.79} {'loss': 0.549, 'learning_rate': 1.3823031564383685e-05, 'epoch': 0.79} {'loss': 0.5155, 'learning_rate': 1.3822721106457015e-05, 'epoch': 0.79} {'loss': 0.5459, 'learning_rate': 1.3822410644215224e-05, 'epoch': 0.79} {'loss': 0.7312, 'learning_rate': 1.3822100177658657e-05, 'epoch': 0.79} {'loss': 0.3771, 'learning_rate': 1.3821789706787665e-05, 'epoch': 0.79} {'loss': 0.6894, 'learning_rate': 1.3821479231602596e-05, 'epoch': 0.79} {'loss': 0.5058, 'learning_rate': 1.3821168752103808e-05, 'epoch': 0.79} {'loss': 0.5, 'learning_rate': 1.3820858268291645e-05, 'epoch': 0.79} {'loss': 0.5446, 'learning_rate': 1.382054778016646e-05, 'epoch': 0.79} {'loss': 0.5377, 'learning_rate': 1.3820237287728605e-05, 'epoch': 0.79} {'loss': 0.644, 'learning_rate': 1.3819926790978427e-05, 'epoch': 0.79} {'loss': 0.6162, 'learning_rate': 1.3819616289916279e-05, 'epoch': 0.79} {'loss': 0.451, 'learning_rate': 1.3819305784542507e-05, 'epoch': 0.79} {'loss': 0.5594, 'learning_rate': 1.3818995274857467e-05, 'epoch': 0.79} {'loss': 0.6048, 'learning_rate': 1.3818684760861509e-05, 'epoch': 0.79} {'loss': 0.5876, 'learning_rate': 1.381837424255498e-05, 'epoch': 0.79} {'loss': 0.6273, 'learning_rate': 1.3818063719938235e-05, 'epoch': 0.79} {'loss': 0.5811, 'learning_rate': 1.381775319301162e-05, 'epoch': 0.79} {'loss': 0.5076, 'learning_rate': 1.3817442661775489e-05, 'epoch': 0.79} {'loss': 0.6158, 'learning_rate': 1.381713212623019e-05, 'epoch': 0.79} {'loss': 0.567, 'learning_rate': 1.3816821586376076e-05, 'epoch': 0.79} {'loss': 0.596, 'learning_rate': 1.3816511042213497e-05, 'epoch': 0.79} {'loss': 0.5153, 'learning_rate': 1.38162004937428e-05, 'epoch': 0.79} {'loss': 0.5758, 'learning_rate': 1.381588994096434e-05, 'epoch': 0.79} {'loss': 0.574, 'learning_rate': 1.3815579383878464e-05, 'epoch': 0.79} {'loss': 0.5901, 'learning_rate': 1.3815268822485526e-05, 'epoch': 0.79} {'loss': 0.6222, 'learning_rate': 1.3814958256785876e-05, 'epoch': 0.79} {'loss': 0.62, 'learning_rate': 1.381464768677986e-05, 'epoch': 0.79} {'loss': 0.5476, 'learning_rate': 1.3814337112467836e-05, 'epoch': 0.79} {'loss': 0.6667, 'learning_rate': 1.3814026533850148e-05, 'epoch': 0.79} {'loss': 0.5197, 'learning_rate': 1.3813715950927153e-05, 'epoch': 0.79} {'loss': 0.4621, 'learning_rate': 1.3813405363699194e-05, 'epoch': 0.79} {'loss': 0.6576, 'learning_rate': 1.381309477216663e-05, 'epoch': 0.79} {'loss': 0.5601, 'learning_rate': 1.3812784176329804e-05, 'epoch': 0.79} {'loss': 0.5387, 'learning_rate': 1.3812473576189066e-05, 'epoch': 0.79} {'loss': 0.6428, 'learning_rate': 1.3812162971744775e-05, 'epoch': 0.79} {'loss': 0.4521, 'learning_rate': 1.3811852362997278e-05, 'epoch': 0.79} {'loss': 0.4797, 'learning_rate': 1.3811541749946922e-05, 'epoch': 0.79} {'loss': 0.5312, 'learning_rate': 1.3811231132594059e-05, 'epoch': 0.79} {'loss': 0.4304, 'learning_rate': 1.381092051093904e-05, 'epoch': 0.79} {'loss': 0.426, 'learning_rate': 1.3810609884982223e-05, 'epoch': 0.79} {'loss': 0.7053, 'learning_rate': 1.3810299254723947e-05, 'epoch': 0.79} {'loss': 0.7014, 'learning_rate': 1.380998862016457e-05, 'epoch': 0.79} {'loss': 0.7835, 'learning_rate': 1.3809677981304437e-05, 'epoch': 0.79} {'loss': 0.5774, 'learning_rate': 1.3809367338143904e-05, 'epoch': 0.79} {'loss': 0.6996, 'learning_rate': 1.380905669068332e-05, 'epoch': 0.79} {'loss': 0.5112, 'learning_rate': 1.3808746038923035e-05, 'epoch': 0.79} {'loss': 0.5229, 'learning_rate': 1.38084353828634e-05, 'epoch': 0.79} {'loss': 0.5146, 'learning_rate': 1.3808124722504765e-05, 'epoch': 0.79} {'loss': 0.6411, 'learning_rate': 1.3807814057847483e-05, 'epoch': 0.79} {'loss': 0.354, 'learning_rate': 1.38075033888919e-05, 'epoch': 0.79} {'loss': 0.5581, 'learning_rate': 1.3807192715638373e-05, 'epoch': 0.79} {'loss': 0.4215, 'learning_rate': 1.3806882038087249e-05, 'epoch': 0.79} {'loss': 0.5766, 'learning_rate': 1.3806571356238881e-05, 'epoch': 0.79} {'loss': 0.6054, 'learning_rate': 1.3806260670093613e-05, 'epoch': 0.79} {'loss': 0.4828, 'learning_rate': 1.3805949979651803e-05, 'epoch': 0.79} {'loss': 0.5671, 'learning_rate': 1.3805639284913798e-05, 'epoch': 0.79} {'loss': 0.4439, 'learning_rate': 1.3805328585879952e-05, 'epoch': 0.79} {'loss': 0.6371, 'learning_rate': 1.3805017882550611e-05, 'epoch': 0.79} {'loss': 0.586, 'learning_rate': 1.3804707174926132e-05, 'epoch': 0.79} {'loss': 0.4449, 'learning_rate': 1.3804396463006857e-05, 'epoch': 0.79} {'loss': 0.7395, 'learning_rate': 1.3804085746793145e-05, 'epoch': 0.79} {'loss': 0.5977, 'learning_rate': 1.3803775026285345e-05, 'epoch': 0.79} {'loss': 0.4379, 'learning_rate': 1.3803464301483802e-05, 'epoch': 0.79} {'loss': 0.4397, 'learning_rate': 1.3803153572388874e-05, 'epoch': 0.79} {'loss': 0.6453, 'learning_rate': 1.380284283900091e-05, 'epoch': 0.79} {'loss': 0.6316, 'learning_rate': 1.3802532101320258e-05, 'epoch': 0.79} {'loss': 0.4929, 'learning_rate': 1.380222135934727e-05, 'epoch': 0.79} {'loss': 0.7163, 'learning_rate': 1.38019106130823e-05, 'epoch': 0.79} {'loss': 0.582, 'learning_rate': 1.3801599862525692e-05, 'epoch': 0.79} {'loss': 0.4393, 'learning_rate': 1.38012891076778e-05, 'epoch': 0.79} {'loss': 0.6498, 'learning_rate': 1.3800978348538978e-05, 'epoch': 0.79} {'loss': 0.5867, 'learning_rate': 1.3800667585109575e-05, 'epoch': 0.79} {'loss': 0.4388, 'learning_rate': 1.3800356817389937e-05, 'epoch': 0.79} {'loss': 0.5234, 'learning_rate': 1.3800046045380425e-05, 'epoch': 0.79} {'loss': 0.4555, 'learning_rate': 1.3799735269081378e-05, 'epoch': 0.79} {'loss': 0.3984, 'learning_rate': 1.3799424488493153e-05, 'epoch': 0.79} {'loss': 0.4542, 'learning_rate': 1.3799113703616102e-05, 'epoch': 0.79} {'loss': 0.627, 'learning_rate': 1.3798802914450576e-05, 'epoch': 0.79} {'loss': 0.52, 'learning_rate': 1.3798492120996922e-05, 'epoch': 0.79} {'loss': 0.6612, 'learning_rate': 1.3798181323255494e-05, 'epoch': 0.79} {'loss': 0.4203, 'learning_rate': 1.3797870521226639e-05, 'epoch': 0.79} {'loss': 0.696, 'learning_rate': 1.3797559714910711e-05, 'epoch': 0.79} {'loss': 0.6311, 'learning_rate': 1.379724890430806e-05, 'epoch': 0.79} {'loss': 0.7123, 'learning_rate': 1.3796938089419038e-05, 'epoch': 0.79} {'loss': 0.6485, 'learning_rate': 1.3796627270243995e-05, 'epoch': 0.79} {'loss': 0.6446, 'learning_rate': 1.379631644678328e-05, 'epoch': 0.79} {'loss': 0.5162, 'learning_rate': 1.3796005619037246e-05, 'epoch': 0.79} {'loss': 0.5971, 'learning_rate': 1.3795694787006244e-05, 'epoch': 0.79} {'loss': 0.5413, 'learning_rate': 1.3795383950690625e-05, 'epoch': 0.79} {'loss': 0.7376, 'learning_rate': 1.379507311009074e-05, 'epoch': 0.79} {'loss': 0.5136, 'learning_rate': 1.3794762265206937e-05, 'epoch': 0.79} {'loss': 0.4675, 'learning_rate': 1.3794451416039572e-05, 'epoch': 0.79} {'loss': 0.5928, 'learning_rate': 1.379414056258899e-05, 'epoch': 0.79} {'loss': 0.6445, 'learning_rate': 1.3793829704855547e-05, 'epoch': 0.79} {'loss': 0.3837, 'learning_rate': 1.379351884283959e-05, 'epoch': 0.79} {'loss': 0.3507, 'learning_rate': 1.3793207976541472e-05, 'epoch': 0.79} {'loss': 0.4952, 'learning_rate': 1.3792897105961545e-05, 'epoch': 0.79} {'loss': 0.5597, 'learning_rate': 1.3792586231100155e-05, 'epoch': 0.79} {'loss': 0.4575, 'learning_rate': 1.379227535195766e-05, 'epoch': 0.79} {'loss': 0.6077, 'learning_rate': 1.3791964468534404e-05, 'epoch': 0.79} {'loss': 0.4996, 'learning_rate': 1.3791653580830745e-05, 'epoch': 0.79} {'loss': 0.5572, 'learning_rate': 1.3791342688847026e-05, 'epoch': 0.79} {'loss': 0.4759, 'learning_rate': 1.3791031792583606e-05, 'epoch': 0.79} {'loss': 0.7021, 'learning_rate': 1.3790720892040832e-05, 'epoch': 0.79} {'loss': 0.6928, 'learning_rate': 1.379040998721905e-05, 'epoch': 0.79} {'loss': 0.6896, 'learning_rate': 1.3790099078118622e-05, 'epoch': 0.79} {'loss': 0.3815, 'learning_rate': 1.378978816473989e-05, 'epoch': 0.79} {'loss': 0.4361, 'learning_rate': 1.3789477247083207e-05, 'epoch': 0.79} {'loss': 0.554, 'learning_rate': 1.3789166325148923e-05, 'epoch': 0.79} {'loss': 0.2971, 'learning_rate': 1.3788855398937395e-05, 'epoch': 0.79} {'loss': 0.8008, 'learning_rate': 1.3788544468448968e-05, 'epoch': 0.79} {'loss': 0.5819, 'learning_rate': 1.3788233533683994e-05, 'epoch': 0.79} {'loss': 0.468, 'learning_rate': 1.3787922594642827e-05, 'epoch': 0.79} {'loss': 0.6707, 'learning_rate': 1.3787611651325812e-05, 'epoch': 0.79} {'loss': 0.5432, 'learning_rate': 1.3787300703733307e-05, 'epoch': 0.79} {'loss': 0.4649, 'learning_rate': 1.378698975186566e-05, 'epoch': 0.79} {'loss': 0.5041, 'learning_rate': 1.3786678795723218e-05, 'epoch': 0.79} {'loss': 0.5277, 'learning_rate': 1.378636783530634e-05, 'epoch': 0.79} {'loss': 0.6111, 'learning_rate': 1.3786056870615369e-05, 'epoch': 0.79} {'loss': 0.5438, 'learning_rate': 1.3785745901650662e-05, 'epoch': 0.79} {'loss': 0.5695, 'learning_rate': 1.3785434928412566e-05, 'epoch': 0.79} {'loss': 0.6681, 'learning_rate': 1.3785123950901436e-05, 'epoch': 0.79} {'loss': 0.5491, 'learning_rate': 1.378481296911762e-05, 'epoch': 0.79} {'loss': 0.5296, 'learning_rate': 1.378450198306147e-05, 'epoch': 0.79} {'loss': 0.5982, 'learning_rate': 1.3784190992733334e-05, 'epoch': 0.79} {'loss': 0.6705, 'learning_rate': 1.3783879998133572e-05, 'epoch': 0.79} {'loss': 0.6489, 'learning_rate': 1.3783568999262524e-05, 'epoch': 0.79} {'loss': 0.4788, 'learning_rate': 1.3783257996120548e-05, 'epoch': 0.79} {'loss': 0.6182, 'learning_rate': 1.3782946988707995e-05, 'epoch': 0.79} {'loss': 0.6087, 'learning_rate': 1.378263597702521e-05, 'epoch': 0.79} {'loss': 0.4741, 'learning_rate': 1.3782324961072551e-05, 'epoch': 0.79} {'loss': 0.5556, 'learning_rate': 1.3782013940850366e-05, 'epoch': 0.79} {'loss': 0.6308, 'learning_rate': 1.3781702916359005e-05, 'epoch': 0.79} {'loss': 0.5825, 'learning_rate': 1.378139188759882e-05, 'epoch': 0.79} {'loss': 0.6363, 'learning_rate': 1.3781080854570166e-05, 'epoch': 0.79} {'loss': 0.4584, 'learning_rate': 1.3780769817273387e-05, 'epoch': 0.79} {'loss': 0.7437, 'learning_rate': 1.3780458775708837e-05, 'epoch': 0.79} {'loss': 0.5137, 'learning_rate': 1.3780147729876872e-05, 'epoch': 0.79} {'loss': 0.5874, 'learning_rate': 1.377983667977784e-05, 'epoch': 0.79} {'loss': 0.5992, 'learning_rate': 1.3779525625412088e-05, 'epoch': 0.79} {'loss': 0.7617, 'learning_rate': 1.3779214566779972e-05, 'epoch': 0.79} {'loss': 0.5863, 'learning_rate': 1.3778903503881843e-05, 'epoch': 0.79} {'loss': 0.5916, 'learning_rate': 1.3778592436718047e-05, 'epoch': 0.79} {'loss': 0.5328, 'learning_rate': 1.377828136528894e-05, 'epoch': 0.79} {'loss': 0.5773, 'learning_rate': 1.3777970289594871e-05, 'epoch': 0.79} {'loss': 0.6085, 'learning_rate': 1.3777659209636192e-05, 'epoch': 0.79} {'loss': 0.5837, 'learning_rate': 1.3777348125413254e-05, 'epoch': 0.79} {'loss': 0.6205, 'learning_rate': 1.3777037036926408e-05, 'epoch': 0.79} {'loss': 0.6693, 'learning_rate': 1.3776725944176007e-05, 'epoch': 0.79} {'loss': 0.7121, 'learning_rate': 1.37764148471624e-05, 'epoch': 0.79} {'loss': 0.4444, 'learning_rate': 1.3776103745885938e-05, 'epoch': 0.79} {'loss': 0.4905, 'learning_rate': 1.3775792640346977e-05, 'epoch': 0.79} {'loss': 0.5328, 'learning_rate': 1.377548153054586e-05, 'epoch': 0.79} {'loss': 0.4966, 'learning_rate': 1.3775170416482944e-05, 'epoch': 0.79} {'loss': 0.5573, 'learning_rate': 1.3774859298158576e-05, 'epoch': 0.79} {'loss': 0.5919, 'learning_rate': 1.3774548175573111e-05, 'epoch': 0.79} {'loss': 0.5937, 'learning_rate': 1.3774237048726899e-05, 'epoch': 0.79} {'loss': 0.4788, 'learning_rate': 1.377392591762029e-05, 'epoch': 0.79} {'loss': 0.6429, 'learning_rate': 1.3773614782253639e-05, 'epoch': 0.79} {'loss': 0.6244, 'learning_rate': 1.377330364262729e-05, 'epoch': 0.79} {'loss': 0.5983, 'learning_rate': 1.3772992498741603e-05, 'epoch': 0.79} {'loss': 0.5108, 'learning_rate': 1.3772681350596924e-05, 'epoch': 0.79} {'loss': 0.7053, 'learning_rate': 1.3772370198193606e-05, 'epoch': 0.79} {'loss': 0.5733, 'learning_rate': 1.3772059041531995e-05, 'epoch': 0.79} {'loss': 0.5893, 'learning_rate': 1.3771747880612455e-05, 'epoch': 0.79} {'loss': 0.6437, 'learning_rate': 1.3771436715435322e-05, 'epoch': 0.79} {'loss': 0.7041, 'learning_rate': 1.3771125546000956e-05, 'epoch': 0.79} {'loss': 0.5852, 'learning_rate': 1.3770814372309704e-05, 'epoch': 0.79} {'loss': 0.5925, 'learning_rate': 1.3770503194361925e-05, 'epoch': 0.79} {'loss': 0.8125, 'learning_rate': 1.3770192012157959e-05, 'epoch': 0.79} {'loss': 0.5041, 'learning_rate': 1.3769880825698165e-05, 'epoch': 0.79} {'loss': 0.5673, 'learning_rate': 1.3769569634982894e-05, 'epoch': 0.79} {'loss': 0.546, 'learning_rate': 1.3769258440012493e-05, 'epoch': 0.79} {'loss': 0.6082, 'learning_rate': 1.3768947240787318e-05, 'epoch': 0.79} {'loss': 0.3901, 'learning_rate': 1.376863603730772e-05, 'epoch': 0.79} {'loss': 0.5538, 'learning_rate': 1.3768324829574047e-05, 'epoch': 0.79} {'loss': 0.5484, 'learning_rate': 1.3768013617586652e-05, 'epoch': 0.79} {'loss': 0.5401, 'learning_rate': 1.3767702401345883e-05, 'epoch': 0.79} {'loss': 0.7441, 'learning_rate': 1.3767391180852098e-05, 'epoch': 0.79} {'loss': 0.6321, 'learning_rate': 1.3767079956105644e-05, 'epoch': 0.79} {'loss': 0.671, 'learning_rate': 1.3766768727106874e-05, 'epoch': 0.79} {'loss': 0.5615, 'learning_rate': 1.3766457493856138e-05, 'epoch': 0.79} {'loss': 0.4304, 'learning_rate': 1.3766146256353787e-05, 'epoch': 0.79} {'loss': 0.5939, 'learning_rate': 1.3765835014600173e-05, 'epoch': 0.79} {'loss': 0.6626, 'learning_rate': 1.3765523768595648e-05, 'epoch': 0.79} {'loss': 0.6444, 'learning_rate': 1.3765212518340561e-05, 'epoch': 0.79} {'loss': 0.7764, 'learning_rate': 1.3764901263835264e-05, 'epoch': 0.79} {'loss': 0.5556, 'learning_rate': 1.3764590005080112e-05, 'epoch': 0.79} {'loss': 0.6011, 'learning_rate': 1.3764278742075456e-05, 'epoch': 0.79} {'loss': 0.5346, 'learning_rate': 1.3763967474821643e-05, 'epoch': 0.79} {'loss': 0.3557, 'learning_rate': 1.3763656203319025e-05, 'epoch': 0.79} {'loss': 0.4501, 'learning_rate': 1.3763344927567955e-05, 'epoch': 0.79} {'loss': 0.6271, 'learning_rate': 1.3763033647568784e-05, 'epoch': 0.79} {'loss': 0.5277, 'learning_rate': 1.3762722363321865e-05, 'epoch': 0.79} {'loss': 0.7116, 'learning_rate': 1.3762411074827549e-05, 'epoch': 0.79} {'loss': 0.5327, 'learning_rate': 1.3762099782086185e-05, 'epoch': 0.79} {'loss': 0.5306, 'learning_rate': 1.3761788485098123e-05, 'epoch': 0.79} {'loss': 0.5133, 'learning_rate': 1.3761477183863721e-05, 'epoch': 0.79} {'loss': 0.5436, 'learning_rate': 1.3761165878383324e-05, 'epoch': 0.79} {'loss': 0.5077, 'learning_rate': 1.3760854568657288e-05, 'epoch': 0.79} {'loss': 0.4852, 'learning_rate': 1.376054325468596e-05, 'epoch': 0.79} {'loss': 0.6169, 'learning_rate': 1.3760231936469698e-05, 'epoch': 0.79} {'loss': 0.4769, 'learning_rate': 1.3759920614008849e-05, 'epoch': 0.79} {'loss': 0.611, 'learning_rate': 1.3759609287303761e-05, 'epoch': 0.79} {'loss': 0.7059, 'learning_rate': 1.3759297956354791e-05, 'epoch': 0.79} {'loss': 0.5448, 'learning_rate': 1.3758986621162288e-05, 'epoch': 0.79} {'loss': 0.4484, 'learning_rate': 1.3758675281726603e-05, 'epoch': 0.79} {'loss': 0.5625, 'learning_rate': 1.375836393804809e-05, 'epoch': 0.79} {'loss': 0.5669, 'learning_rate': 1.3758052590127095e-05, 'epoch': 0.79} {'loss': 0.5307, 'learning_rate': 1.3757741237963977e-05, 'epoch': 0.79} {'loss': 0.6485, 'learning_rate': 1.3757429881559082e-05, 'epoch': 0.79} {'loss': 0.5875, 'learning_rate': 1.3757118520912764e-05, 'epoch': 0.79} {'loss': 0.6772, 'learning_rate': 1.3756807156025374e-05, 'epoch': 0.79} {'loss': 0.6236, 'learning_rate': 1.3756495786897261e-05, 'epoch': 0.79} {'loss': 0.7033, 'learning_rate': 1.3756184413528783e-05, 'epoch': 0.79} {'loss': 0.5606, 'learning_rate': 1.3755873035920285e-05, 'epoch': 0.79} {'loss': 0.5485, 'learning_rate': 1.375556165407212e-05, 'epoch': 0.79} {'loss': 0.5664, 'learning_rate': 1.375525026798464e-05, 'epoch': 0.79} {'loss': 0.584, 'learning_rate': 1.3754938877658194e-05, 'epoch': 0.79} {'loss': 0.5063, 'learning_rate': 1.375462748309314e-05, 'epoch': 0.79} {'loss': 0.6593, 'learning_rate': 1.3754316084289823e-05, 'epoch': 0.79} {'loss': 0.5265, 'learning_rate': 1.3754004681248598e-05, 'epoch': 0.79} {'loss': 0.5707, 'learning_rate': 1.3753693273969818e-05, 'epoch': 0.79} {'loss': 0.6346, 'learning_rate': 1.3753381862453827e-05, 'epoch': 0.79} {'loss': 0.4388, 'learning_rate': 1.3753070446700985e-05, 'epoch': 0.79} {'loss': 0.6756, 'learning_rate': 1.3752759026711639e-05, 'epoch': 0.79} {'loss': 0.487, 'learning_rate': 1.3752447602486144e-05, 'epoch': 0.79} {'loss': 0.5837, 'learning_rate': 1.3752136174024849e-05, 'epoch': 0.79} {'loss': 0.5374, 'learning_rate': 1.3751824741328104e-05, 'epoch': 0.79} {'loss': 0.5789, 'learning_rate': 1.3751513304396263e-05, 'epoch': 0.79} {'loss': 0.5154, 'learning_rate': 1.3751201863229675e-05, 'epoch': 0.79} {'loss': 0.468, 'learning_rate': 1.3750890417828695e-05, 'epoch': 0.79} {'loss': 0.4263, 'learning_rate': 1.3750578968193673e-05, 'epoch': 0.79} {'loss': 0.721, 'learning_rate': 1.3750267514324959e-05, 'epoch': 0.79} {'loss': 0.5852, 'learning_rate': 1.3749956056222908e-05, 'epoch': 0.79} {'loss': 0.4409, 'learning_rate': 1.3749644593887866e-05, 'epoch': 0.79} {'loss': 0.5085, 'learning_rate': 1.3749333127320193e-05, 'epoch': 0.79} {'loss': 0.6214, 'learning_rate': 1.3749021656520234e-05, 'epoch': 0.79} {'loss': 0.5072, 'learning_rate': 1.3748710181488342e-05, 'epoch': 0.79} {'loss': 0.4938, 'learning_rate': 1.3748398702224872e-05, 'epoch': 0.79} {'loss': 0.5828, 'learning_rate': 1.374808721873017e-05, 'epoch': 0.79} {'loss': 0.5672, 'learning_rate': 1.3747775731004591e-05, 'epoch': 0.79} {'loss': 0.6744, 'learning_rate': 1.3747464239048485e-05, 'epoch': 0.79} {'loss': 0.6612, 'learning_rate': 1.3747152742862204e-05, 'epoch': 0.79} {'loss': 0.5821, 'learning_rate': 1.37468412424461e-05, 'epoch': 0.79} {'loss': 0.5534, 'learning_rate': 1.3746529737800528e-05, 'epoch': 0.79} {'loss': 0.564, 'learning_rate': 1.3746218228925834e-05, 'epoch': 0.79} {'loss': 0.6457, 'learning_rate': 1.3745906715822373e-05, 'epoch': 0.79} {'loss': 0.7579, 'learning_rate': 1.3745595198490493e-05, 'epoch': 0.79} {'loss': 0.6485, 'learning_rate': 1.374528367693055e-05, 'epoch': 0.79} {'loss': 0.6323, 'learning_rate': 1.3744972151142895e-05, 'epoch': 0.79} {'loss': 0.5006, 'learning_rate': 1.374466062112788e-05, 'epoch': 0.79} {'loss': 0.6047, 'learning_rate': 1.3744349086885854e-05, 'epoch': 0.79} {'loss': 0.5921, 'learning_rate': 1.3744037548417166e-05, 'epoch': 0.79} {'loss': 0.6806, 'learning_rate': 1.3743726005722175e-05, 'epoch': 0.79} {'loss': 0.5181, 'learning_rate': 1.374341445880123e-05, 'epoch': 0.79} {'loss': 0.6914, 'learning_rate': 1.374310290765468e-05, 'epoch': 0.79} {'loss': 0.5714, 'learning_rate': 1.3742791352282878e-05, 'epoch': 0.79} {'loss': 0.618, 'learning_rate': 1.3742479792686179e-05, 'epoch': 0.79} {'loss': 0.535, 'learning_rate': 1.3742168228864929e-05, 'epoch': 0.79} {'loss': 0.6424, 'learning_rate': 1.3741856660819484e-05, 'epoch': 0.79} {'loss': 0.4364, 'learning_rate': 1.3741545088550195e-05, 'epoch': 0.79} {'loss': 0.6291, 'learning_rate': 1.374123351205741e-05, 'epoch': 0.79} {'loss': 0.4118, 'learning_rate': 1.3740921931341489e-05, 'epoch': 0.79} {'loss': 0.5499, 'learning_rate': 1.3740610346402776e-05, 'epoch': 0.79} {'loss': 0.624, 'learning_rate': 1.3740298757241626e-05, 'epoch': 0.79} {'loss': 0.6902, 'learning_rate': 1.3739987163858388e-05, 'epoch': 0.79} {'loss': 0.6411, 'learning_rate': 1.3739675566253416e-05, 'epoch': 0.79} {'loss': 0.6558, 'learning_rate': 1.3739363964427063e-05, 'epoch': 0.79} {'loss': 0.5457, 'learning_rate': 1.3739052358379678e-05, 'epoch': 0.79} {'loss': 0.4353, 'learning_rate': 1.3738740748111614e-05, 'epoch': 0.79} {'loss': 0.7293, 'learning_rate': 1.3738429133623223e-05, 'epoch': 0.79} {'loss': 0.6133, 'learning_rate': 1.3738117514914855e-05, 'epoch': 0.79} {'loss': 0.5482, 'learning_rate': 1.3737805891986866e-05, 'epoch': 0.79} {'loss': 0.5318, 'learning_rate': 1.3737494264839603e-05, 'epoch': 0.79} {'loss': 0.5768, 'learning_rate': 1.373718263347342e-05, 'epoch': 0.79} {'loss': 0.4727, 'learning_rate': 1.373687099788867e-05, 'epoch': 0.79} {'loss': 0.5341, 'learning_rate': 1.3736559358085702e-05, 'epoch': 0.79} {'loss': 0.5101, 'learning_rate': 1.3736247714064867e-05, 'epoch': 0.79} {'loss': 0.5767, 'learning_rate': 1.3735936065826524e-05, 'epoch': 0.79} {'loss': 0.5897, 'learning_rate': 1.3735624413371013e-05, 'epoch': 0.79} {'loss': 0.6561, 'learning_rate': 1.3735312756698696e-05, 'epoch': 0.79} {'loss': 0.5221, 'learning_rate': 1.3735001095809922e-05, 'epoch': 0.79} {'loss': 0.5354, 'learning_rate': 1.373468943070504e-05, 'epoch': 0.79} {'loss': 0.5233, 'learning_rate': 1.3734377761384403e-05, 'epoch': 0.8} {'loss': 0.6848, 'learning_rate': 1.3734066087848363e-05, 'epoch': 0.8} {'loss': 0.6596, 'learning_rate': 1.3733754410097276e-05, 'epoch': 0.8} {'loss': 0.5779, 'learning_rate': 1.373344272813149e-05, 'epoch': 0.8} {'loss': 0.7286, 'learning_rate': 1.3733131041951357e-05, 'epoch': 0.8} {'loss': 0.4814, 'learning_rate': 1.3732819351557227e-05, 'epoch': 0.8} {'loss': 0.5965, 'learning_rate': 1.3732507656949454e-05, 'epoch': 0.8} {'loss': 0.587, 'learning_rate': 1.3732195958128391e-05, 'epoch': 0.8} {'loss': 0.676, 'learning_rate': 1.3731884255094388e-05, 'epoch': 0.8} {'loss': 0.5283, 'learning_rate': 1.3731572547847797e-05, 'epoch': 0.8} {'loss': 0.5828, 'learning_rate': 1.3731260836388971e-05, 'epoch': 0.8} {'loss': 0.4711, 'learning_rate': 1.373094912071826e-05, 'epoch': 0.8} {'loss': 0.6324, 'learning_rate': 1.3730637400836018e-05, 'epoch': 0.8} {'loss': 0.8235, 'learning_rate': 1.3730325676742596e-05, 'epoch': 0.8} {'loss': 0.4546, 'learning_rate': 1.3730013948438344e-05, 'epoch': 0.8} {'loss': 0.6561, 'learning_rate': 1.3729702215923615e-05, 'epoch': 0.8} {'loss': 0.5213, 'learning_rate': 1.3729390479198765e-05, 'epoch': 0.8} {'loss': 0.6478, 'learning_rate': 1.372907873826414e-05, 'epoch': 0.8} {'loss': 0.6598, 'learning_rate': 1.3728766993120095e-05, 'epoch': 0.8} {'loss': 0.6399, 'learning_rate': 1.3728455243766981e-05, 'epoch': 0.8} {'loss': 0.5402, 'learning_rate': 1.3728143490205149e-05, 'epoch': 0.8} {'loss': 0.628, 'learning_rate': 1.372783173243495e-05, 'epoch': 0.8} {'loss': 0.5418, 'learning_rate': 1.3727519970456743e-05, 'epoch': 0.8} {'loss': 0.5977, 'learning_rate': 1.372720820427087e-05, 'epoch': 0.8} {'loss': 0.6324, 'learning_rate': 1.372689643387769e-05, 'epoch': 0.8} {'loss': 0.6478, 'learning_rate': 1.372658465927755e-05, 'epoch': 0.8} {'loss': 0.4472, 'learning_rate': 1.372627288047081e-05, 'epoch': 0.8} {'loss': 0.3989, 'learning_rate': 1.3725961097457812e-05, 'epoch': 0.8} {'loss': 0.6708, 'learning_rate': 1.3725649310238914e-05, 'epoch': 0.8} {'loss': 0.5498, 'learning_rate': 1.3725337518814465e-05, 'epoch': 0.8} {'loss': 0.5612, 'learning_rate': 1.3725025723184824e-05, 'epoch': 0.8} {'loss': 0.4245, 'learning_rate': 1.3724713923350333e-05, 'epoch': 0.8} {'loss': 0.4831, 'learning_rate': 1.3724402119311346e-05, 'epoch': 0.8} {'loss': 0.3984, 'learning_rate': 1.3724090311068219e-05, 'epoch': 0.8} {'loss': 0.4987, 'learning_rate': 1.3723778498621303e-05, 'epoch': 0.8} {'loss': 0.5176, 'learning_rate': 1.372346668197095e-05, 'epoch': 0.8} {'loss': 0.7058, 'learning_rate': 1.372315486111751e-05, 'epoch': 0.8} {'loss': 0.48, 'learning_rate': 1.3722843036061334e-05, 'epoch': 0.8} {'loss': 0.649, 'learning_rate': 1.372253120680278e-05, 'epoch': 0.8} {'loss': 0.4223, 'learning_rate': 1.3722219373342193e-05, 'epoch': 0.8} {'loss': 0.5415, 'learning_rate': 1.372190753567993e-05, 'epoch': 0.8} {'loss': 0.3573, 'learning_rate': 1.3721595693816341e-05, 'epoch': 0.8} {'loss': 0.6945, 'learning_rate': 1.3721283847751777e-05, 'epoch': 0.8} {'loss': 0.7343, 'learning_rate': 1.3720971997486594e-05, 'epoch': 0.8} {'loss': 0.5786, 'learning_rate': 1.372066014302114e-05, 'epoch': 0.8} {'loss': 0.4444, 'learning_rate': 1.3720348284355767e-05, 'epoch': 0.8} {'loss': 0.4746, 'learning_rate': 1.3720036421490827e-05, 'epoch': 0.8} {'loss': 0.4261, 'learning_rate': 1.3719724554426677e-05, 'epoch': 0.8} {'loss': 0.6208, 'learning_rate': 1.3719412683163662e-05, 'epoch': 0.8} {'loss': 0.3981, 'learning_rate': 1.371910080770214e-05, 'epoch': 0.8} {'loss': 0.5397, 'learning_rate': 1.3718788928042459e-05, 'epoch': 0.8} {'loss': 0.6189, 'learning_rate': 1.3718477044184968e-05, 'epoch': 0.8} {'loss': 0.561, 'learning_rate': 1.371816515613003e-05, 'epoch': 0.8} {'loss': 0.361, 'learning_rate': 1.371785326387799e-05, 'epoch': 0.8} {'loss': 0.6886, 'learning_rate': 1.3717541367429199e-05, 'epoch': 0.8} {'loss': 0.6164, 'learning_rate': 1.371722946678401e-05, 'epoch': 0.8} {'loss': 0.6246, 'learning_rate': 1.3716917561942778e-05, 'epoch': 0.8} {'loss': 0.5365, 'learning_rate': 1.371660565290585e-05, 'epoch': 0.8} {'loss': 0.4625, 'learning_rate': 1.3716293739673583e-05, 'epoch': 0.8} {'loss': 0.5989, 'learning_rate': 1.3715981822246327e-05, 'epoch': 0.8} {'loss': 0.3356, 'learning_rate': 1.3715669900624434e-05, 'epoch': 0.8} {'loss': 0.614, 'learning_rate': 1.3715357974808257e-05, 'epoch': 0.8} {'loss': 0.6079, 'learning_rate': 1.3715046044798145e-05, 'epoch': 0.8} {'loss': 0.6734, 'learning_rate': 1.3714734110594455e-05, 'epoch': 0.8} {'loss': 0.7817, 'learning_rate': 1.3714422172197535e-05, 'epoch': 0.8} {'loss': 0.5912, 'learning_rate': 1.3714110229607737e-05, 'epoch': 0.8} {'loss': 0.6432, 'learning_rate': 1.371379828282542e-05, 'epoch': 0.8} {'loss': 0.6295, 'learning_rate': 1.3713486331850927e-05, 'epoch': 0.8} {'loss': 0.5068, 'learning_rate': 1.3713174376684615e-05, 'epoch': 0.8} {'loss': 0.5376, 'learning_rate': 1.3712862417326836e-05, 'epoch': 0.8} {'loss': 0.5097, 'learning_rate': 1.371255045377794e-05, 'epoch': 0.8} {'loss': 0.5594, 'learning_rate': 1.371223848603828e-05, 'epoch': 0.8} {'loss': 0.5868, 'learning_rate': 1.3711926514108212e-05, 'epoch': 0.8} {'loss': 0.4915, 'learning_rate': 1.371161453798808e-05, 'epoch': 0.8} {'loss': 0.5979, 'learning_rate': 1.3711302557678245e-05, 'epoch': 0.8} {'loss': 0.5189, 'learning_rate': 1.3710990573179053e-05, 'epoch': 0.8} {'loss': 0.3708, 'learning_rate': 1.3710678584490859e-05, 'epoch': 0.8} {'loss': 0.6397, 'learning_rate': 1.3710366591614015e-05, 'epoch': 0.8} {'loss': 0.6611, 'learning_rate': 1.3710054594548872e-05, 'epoch': 0.8} {'loss': 0.4007, 'learning_rate': 1.3709742593295785e-05, 'epoch': 0.8} {'loss': 0.4778, 'learning_rate': 1.3709430587855102e-05, 'epoch': 0.8} {'loss': 0.6045, 'learning_rate': 1.3709118578227177e-05, 'epoch': 0.8} {'loss': 0.3992, 'learning_rate': 1.3708806564412362e-05, 'epoch': 0.8} {'loss': 0.4666, 'learning_rate': 1.3708494546411011e-05, 'epoch': 0.8} {'loss': 0.6167, 'learning_rate': 1.3708182524223474e-05, 'epoch': 0.8} {'loss': 0.7214, 'learning_rate': 1.3707870497850104e-05, 'epoch': 0.8} {'loss': 0.7129, 'learning_rate': 1.3707558467291256e-05, 'epoch': 0.8} {'loss': 0.6083, 'learning_rate': 1.3707246432547274e-05, 'epoch': 0.8} {'loss': 0.5631, 'learning_rate': 1.370693439361852e-05, 'epoch': 0.8} {'loss': 0.5791, 'learning_rate': 1.3706622350505341e-05, 'epoch': 0.8} {'loss': 0.6727, 'learning_rate': 1.370631030320809e-05, 'epoch': 0.8} {'loss': 0.5635, 'learning_rate': 1.370599825172712e-05, 'epoch': 0.8} {'loss': 0.5177, 'learning_rate': 1.3705686196062784e-05, 'epoch': 0.8} {'loss': 0.7158, 'learning_rate': 1.370537413621543e-05, 'epoch': 0.8} {'loss': 0.3754, 'learning_rate': 1.3705062072185416e-05, 'epoch': 0.8} {'loss': 0.4609, 'learning_rate': 1.3704750003973089e-05, 'epoch': 0.8} {'loss': 0.4886, 'learning_rate': 1.3704437931578804e-05, 'epoch': 0.8} {'loss': 0.4195, 'learning_rate': 1.3704125855002914e-05, 'epoch': 0.8} {'loss': 0.58, 'learning_rate': 1.3703813774245771e-05, 'epoch': 0.8} {'loss': 0.4544, 'learning_rate': 1.3703501689307723e-05, 'epoch': 0.8} {'loss': 0.3772, 'learning_rate': 1.3703189600189126e-05, 'epoch': 0.8} {'loss': 0.6768, 'learning_rate': 1.3702877506890336e-05, 'epoch': 0.8} {'loss': 0.627, 'learning_rate': 1.3702565409411699e-05, 'epoch': 0.8} {'loss': 0.4741, 'learning_rate': 1.3702253307753574e-05, 'epoch': 0.8} {'loss': 0.542, 'learning_rate': 1.3701941201916304e-05, 'epoch': 0.8} {'loss': 0.632, 'learning_rate': 1.3701629091900248e-05, 'epoch': 0.8} {'loss': 0.5181, 'learning_rate': 1.370131697770576e-05, 'epoch': 0.8} {'loss': 0.545, 'learning_rate': 1.3701004859333183e-05, 'epoch': 0.8} {'loss': 0.6558, 'learning_rate': 1.3700692736782877e-05, 'epoch': 0.8} {'loss': 0.5933, 'learning_rate': 1.3700380610055194e-05, 'epoch': 0.8} {'loss': 0.6544, 'learning_rate': 1.3700068479150486e-05, 'epoch': 0.8} {'loss': 0.6058, 'learning_rate': 1.3699756344069102e-05, 'epoch': 0.8} {'loss': 0.631, 'learning_rate': 1.3699444204811396e-05, 'epoch': 0.8} {'loss': 0.6427, 'learning_rate': 1.3699132061377722e-05, 'epoch': 0.8} {'loss': 0.631, 'learning_rate': 1.3698819913768432e-05, 'epoch': 0.8} {'loss': 0.6312, 'learning_rate': 1.3698507761983877e-05, 'epoch': 0.8} {'loss': 0.5604, 'learning_rate': 1.3698195606024413e-05, 'epoch': 0.8} {'loss': 0.5473, 'learning_rate': 1.3697883445890388e-05, 'epoch': 0.8} {'loss': 0.4893, 'learning_rate': 1.3697571281582154e-05, 'epoch': 0.8} {'loss': 0.6825, 'learning_rate': 1.3697259113100065e-05, 'epoch': 0.8} {'loss': 0.6027, 'learning_rate': 1.3696946940444473e-05, 'epoch': 0.8} {'loss': 0.5835, 'learning_rate': 1.3696634763615733e-05, 'epoch': 0.8} {'loss': 0.5359, 'learning_rate': 1.3696322582614194e-05, 'epoch': 0.8} {'loss': 0.5641, 'learning_rate': 1.3696010397440212e-05, 'epoch': 0.8} {'loss': 0.5883, 'learning_rate': 1.3695698208094134e-05, 'epoch': 0.8} {'loss': 0.663, 'learning_rate': 1.3695386014576317e-05, 'epoch': 0.8} {'loss': 0.4823, 'learning_rate': 1.369507381688711e-05, 'epoch': 0.8} {'loss': 0.6313, 'learning_rate': 1.369476161502687e-05, 'epoch': 0.8} {'loss': 0.6357, 'learning_rate': 1.3694449408995945e-05, 'epoch': 0.8} {'loss': 0.6905, 'learning_rate': 1.3694137198794692e-05, 'epoch': 0.8} {'loss': 0.6957, 'learning_rate': 1.3693824984423458e-05, 'epoch': 0.8} {'loss': 0.6611, 'learning_rate': 1.36935127658826e-05, 'epoch': 0.8} {'loss': 0.518, 'learning_rate': 1.3693200543172464e-05, 'epoch': 0.8} {'loss': 0.5562, 'learning_rate': 1.3692888316293412e-05, 'epoch': 0.8} {'loss': 0.5385, 'learning_rate': 1.3692576085245788e-05, 'epoch': 0.8} {'loss': 0.6238, 'learning_rate': 1.369226385002995e-05, 'epoch': 0.8} {'loss': 0.5277, 'learning_rate': 1.3691951610646246e-05, 'epoch': 0.8} {'loss': 0.6346, 'learning_rate': 1.3691639367095033e-05, 'epoch': 0.8} {'loss': 0.429, 'learning_rate': 1.3691327119376659e-05, 'epoch': 0.8} {'loss': 0.5808, 'learning_rate': 1.369101486749148e-05, 'epoch': 0.8} {'loss': 0.6471, 'learning_rate': 1.3690702611439845e-05, 'epoch': 0.8} {'loss': 0.5545, 'learning_rate': 1.3690390351222111e-05, 'epoch': 0.8} {'loss': 0.624, 'learning_rate': 1.369007808683863e-05, 'epoch': 0.8} {'loss': 0.6855, 'learning_rate': 1.3689765818289748e-05, 'epoch': 0.8} {'loss': 0.5445, 'learning_rate': 1.3689453545575825e-05, 'epoch': 0.8} {'loss': 0.6526, 'learning_rate': 1.3689141268697207e-05, 'epoch': 0.8} {'loss': 0.4455, 'learning_rate': 1.3688828987654255e-05, 'epoch': 0.8} {'loss': 0.3389, 'learning_rate': 1.3688516702447311e-05, 'epoch': 0.8} {'loss': 0.4661, 'learning_rate': 1.3688204413076738e-05, 'epoch': 0.8} {'loss': 0.6434, 'learning_rate': 1.3687892119542881e-05, 'epoch': 0.8} {'loss': 0.5772, 'learning_rate': 1.3687579821846092e-05, 'epoch': 0.8} {'loss': 0.5578, 'learning_rate': 1.3687267519986733e-05, 'epoch': 0.8} {'loss': 0.5357, 'learning_rate': 1.3686955213965147e-05, 'epoch': 0.8} {'loss': 0.5124, 'learning_rate': 1.368664290378169e-05, 'epoch': 0.8} {'loss': 0.5757, 'learning_rate': 1.3686330589436716e-05, 'epoch': 0.8} {'loss': 0.6321, 'learning_rate': 1.3686018270930573e-05, 'epoch': 0.8} {'loss': 0.5119, 'learning_rate': 1.3685705948263617e-05, 'epoch': 0.8} {'loss': 0.7997, 'learning_rate': 1.36853936214362e-05, 'epoch': 0.8} {'loss': 0.492, 'learning_rate': 1.3685081290448677e-05, 'epoch': 0.8} {'loss': 0.4748, 'learning_rate': 1.3684768955301394e-05, 'epoch': 0.8} {'loss': 0.5812, 'learning_rate': 1.3684456615994708e-05, 'epoch': 0.8} {'loss': 0.4758, 'learning_rate': 1.3684144272528972e-05, 'epoch': 0.8} {'loss': 0.5205, 'learning_rate': 1.3683831924904538e-05, 'epoch': 0.8} {'loss': 0.6584, 'learning_rate': 1.368351957312176e-05, 'epoch': 0.8} {'loss': 0.5335, 'learning_rate': 1.3683207217180985e-05, 'epoch': 0.8} {'loss': 0.5264, 'learning_rate': 1.368289485708257e-05, 'epoch': 0.8} {'loss': 0.4745, 'learning_rate': 1.3682582492826873e-05, 'epoch': 0.8} {'loss': 0.6061, 'learning_rate': 1.3682270124414236e-05, 'epoch': 0.8} {'loss': 0.5373, 'learning_rate': 1.3681957751845017e-05, 'epoch': 0.8} {'loss': 0.6225, 'learning_rate': 1.3681645375119565e-05, 'epoch': 0.8} {'loss': 0.7352, 'learning_rate': 1.3681332994238239e-05, 'epoch': 0.8} {'loss': 0.7558, 'learning_rate': 1.3681020609201386e-05, 'epoch': 0.8} {'loss': 0.5039, 'learning_rate': 1.3680708220009362e-05, 'epoch': 0.8} {'loss': 0.4206, 'learning_rate': 1.3680395826662518e-05, 'epoch': 0.8} {'loss': 0.6616, 'learning_rate': 1.3680083429161206e-05, 'epoch': 0.8} {'loss': 0.6642, 'learning_rate': 1.3679771027505779e-05, 'epoch': 0.8} {'loss': 0.4821, 'learning_rate': 1.3679458621696593e-05, 'epoch': 0.8} {'loss': 0.5511, 'learning_rate': 1.3679146211733996e-05, 'epoch': 0.8} {'loss': 0.481, 'learning_rate': 1.3678833797618343e-05, 'epoch': 0.8} {'loss': 0.3861, 'learning_rate': 1.3678521379349987e-05, 'epoch': 0.8} {'loss': 0.6042, 'learning_rate': 1.367820895692928e-05, 'epoch': 0.8} {'loss': 0.4938, 'learning_rate': 1.3677896530356574e-05, 'epoch': 0.8} {'loss': 0.6454, 'learning_rate': 1.3677584099632222e-05, 'epoch': 0.8} {'loss': 0.707, 'learning_rate': 1.3677271664756577e-05, 'epoch': 0.8} {'loss': 0.6471, 'learning_rate': 1.367695922572999e-05, 'epoch': 0.8} {'loss': 0.6103, 'learning_rate': 1.3676646782552818e-05, 'epoch': 0.8} {'loss': 0.5517, 'learning_rate': 1.3676334335225408e-05, 'epoch': 0.8} {'loss': 0.4325, 'learning_rate': 1.3676021883748119e-05, 'epoch': 0.8} {'loss': 0.5607, 'learning_rate': 1.3675709428121297e-05, 'epoch': 0.8} {'loss': 0.6742, 'learning_rate': 1.3675396968345301e-05, 'epoch': 0.8} {'loss': 0.6443, 'learning_rate': 1.3675084504420477e-05, 'epoch': 0.8} {'loss': 0.6623, 'learning_rate': 1.3674772036347183e-05, 'epoch': 0.8} {'loss': 0.676, 'learning_rate': 1.3674459564125773e-05, 'epoch': 0.8} {'loss': 0.4416, 'learning_rate': 1.3674147087756595e-05, 'epoch': 0.8} {'loss': 0.6234, 'learning_rate': 1.3673834607240004e-05, 'epoch': 0.8} {'loss': 0.6147, 'learning_rate': 1.3673522122576351e-05, 'epoch': 0.8} {'loss': 0.4831, 'learning_rate': 1.3673209633765992e-05, 'epoch': 0.8} {'loss': 0.6817, 'learning_rate': 1.3672897140809276e-05, 'epoch': 0.8} {'loss': 0.4054, 'learning_rate': 1.3672584643706557e-05, 'epoch': 0.8} {'loss': 0.628, 'learning_rate': 1.367227214245819e-05, 'epoch': 0.8} {'loss': 0.5512, 'learning_rate': 1.3671959637064522e-05, 'epoch': 0.8} {'loss': 0.5923, 'learning_rate': 1.3671647127525916e-05, 'epoch': 0.8} {'loss': 0.6019, 'learning_rate': 1.3671334613842717e-05, 'epoch': 0.8} {'loss': 0.4719, 'learning_rate': 1.3671022096015278e-05, 'epoch': 0.8} {'loss': 0.4527, 'learning_rate': 1.3670709574043953e-05, 'epoch': 0.8} {'loss': 0.7198, 'learning_rate': 1.3670397047929096e-05, 'epoch': 0.8} {'loss': 0.6451, 'learning_rate': 1.3670084517671056e-05, 'epoch': 0.8} {'loss': 0.752, 'learning_rate': 1.366977198327019e-05, 'epoch': 0.8} {'loss': 0.6192, 'learning_rate': 1.366945944472685e-05, 'epoch': 0.8} {'loss': 0.5886, 'learning_rate': 1.3669146902041388e-05, 'epoch': 0.8} {'loss': 0.5359, 'learning_rate': 1.3668834355214156e-05, 'epoch': 0.8} {'loss': 0.5457, 'learning_rate': 1.3668521804245509e-05, 'epoch': 0.8} {'loss': 0.5809, 'learning_rate': 1.3668209249135797e-05, 'epoch': 0.8} {'loss': 0.5076, 'learning_rate': 1.3667896689885377e-05, 'epoch': 0.8} {'loss': 0.4846, 'learning_rate': 1.3667584126494595e-05, 'epoch': 0.8} {'loss': 0.7661, 'learning_rate': 1.3667271558963812e-05, 'epoch': 0.8} {'loss': 0.5109, 'learning_rate': 1.3666958987293377e-05, 'epoch': 0.8} {'loss': 0.4328, 'learning_rate': 1.366664641148364e-05, 'epoch': 0.8} {'loss': 0.3568, 'learning_rate': 1.3666333831534957e-05, 'epoch': 0.8} {'loss': 0.6405, 'learning_rate': 1.3666021247447679e-05, 'epoch': 0.8} {'loss': 0.4779, 'learning_rate': 1.366570865922216e-05, 'epoch': 0.8} {'loss': 0.4617, 'learning_rate': 1.3665396066858755e-05, 'epoch': 0.8} {'loss': 0.7585, 'learning_rate': 1.3665083470357817e-05, 'epoch': 0.8} {'loss': 0.6217, 'learning_rate': 1.3664770869719693e-05, 'epoch': 0.8} {'loss': 0.5491, 'learning_rate': 1.366445826494474e-05, 'epoch': 0.8} {'loss': 0.5674, 'learning_rate': 1.3664145656033313e-05, 'epoch': 0.8} {'loss': 0.6132, 'learning_rate': 1.3663833042985756e-05, 'epoch': 0.8} {'loss': 0.4958, 'learning_rate': 1.3663520425802435e-05, 'epoch': 0.8} {'loss': 0.5833, 'learning_rate': 1.3663207804483696e-05, 'epoch': 0.8} {'loss': 0.6094, 'learning_rate': 1.3662895179029889e-05, 'epoch': 0.8} {'loss': 0.4574, 'learning_rate': 1.366258254944137e-05, 'epoch': 0.8} {'loss': 0.6554, 'learning_rate': 1.3662269915718493e-05, 'epoch': 0.8} {'loss': 0.6322, 'learning_rate': 1.3661957277861608e-05, 'epoch': 0.8} {'loss': 0.4747, 'learning_rate': 1.366164463587107e-05, 'epoch': 0.8} {'loss': 0.4986, 'learning_rate': 1.3661331989747234e-05, 'epoch': 0.8} {'loss': 0.5644, 'learning_rate': 1.3661019339490447e-05, 'epoch': 0.8} {'loss': 0.5212, 'learning_rate': 1.3660706685101065e-05, 'epoch': 0.8} {'loss': 0.613, 'learning_rate': 1.3660394026579444e-05, 'epoch': 0.8} {'loss': 0.6034, 'learning_rate': 1.3660081363925932e-05, 'epoch': 0.8} {'loss': 0.5116, 'learning_rate': 1.3659768697140887e-05, 'epoch': 0.8} {'loss': 0.66, 'learning_rate': 1.3659456026224658e-05, 'epoch': 0.8} {'loss': 0.5523, 'learning_rate': 1.3659143351177597e-05, 'epoch': 0.8} {'loss': 0.7596, 'learning_rate': 1.3658830672000063e-05, 'epoch': 0.8} {'loss': 0.6234, 'learning_rate': 1.3658517988692404e-05, 'epoch': 0.8} {'loss': 0.5415, 'learning_rate': 1.365820530125497e-05, 'epoch': 0.8} {'loss': 0.5468, 'learning_rate': 1.3657892609688118e-05, 'epoch': 0.8} {'loss': 0.6228, 'learning_rate': 1.3657579913992205e-05, 'epoch': 0.8} {'loss': 0.5512, 'learning_rate': 1.3657267214167578e-05, 'epoch': 0.8} {'loss': 0.5612, 'learning_rate': 1.3656954510214591e-05, 'epoch': 0.8} {'loss': 0.5912, 'learning_rate': 1.3656641802133597e-05, 'epoch': 0.8} {'loss': 0.6621, 'learning_rate': 1.365632908992495e-05, 'epoch': 0.8} {'loss': 0.6087, 'learning_rate': 1.3656016373589002e-05, 'epoch': 0.8} {'loss': 0.4919, 'learning_rate': 1.3655703653126113e-05, 'epoch': 0.8} {'loss': 0.4949, 'learning_rate': 1.3655390928536625e-05, 'epoch': 0.8} {'loss': 0.6813, 'learning_rate': 1.3655078199820895e-05, 'epoch': 0.8} {'loss': 0.6278, 'learning_rate': 1.3654765466979278e-05, 'epoch': 0.8} {'loss': 0.6808, 'learning_rate': 1.3654452730012127e-05, 'epoch': 0.8} {'loss': 0.4405, 'learning_rate': 1.3654139988919792e-05, 'epoch': 0.8} {'loss': 0.6262, 'learning_rate': 1.3653827243702626e-05, 'epoch': 0.8} {'loss': 0.5234, 'learning_rate': 1.3653514494360987e-05, 'epoch': 0.8} {'loss': 0.5349, 'learning_rate': 1.3653201740895224e-05, 'epoch': 0.8} {'loss': 0.6895, 'learning_rate': 1.365288898330569e-05, 'epoch': 0.8} {'loss': 0.5878, 'learning_rate': 1.365257622159274e-05, 'epoch': 0.8} {'loss': 0.7453, 'learning_rate': 1.3652263455756725e-05, 'epoch': 0.8} {'loss': 0.6267, 'learning_rate': 1.3651950685798e-05, 'epoch': 0.8} {'loss': 0.5646, 'learning_rate': 1.365163791171692e-05, 'epoch': 0.8} {'loss': 0.4875, 'learning_rate': 1.365132513351383e-05, 'epoch': 0.8} {'loss': 0.5104, 'learning_rate': 1.3651012351189092e-05, 'epoch': 0.8} {'loss': 0.5625, 'learning_rate': 1.3650699564743053e-05, 'epoch': 0.8} {'loss': 0.6124, 'learning_rate': 1.365038677417607e-05, 'epoch': 0.8} {'loss': 0.6047, 'learning_rate': 1.3650073979488495e-05, 'epoch': 0.8} {'loss': 0.5892, 'learning_rate': 1.3649761180680679e-05, 'epoch': 0.8} {'loss': 0.5867, 'learning_rate': 1.3649448377752976e-05, 'epoch': 0.8} {'loss': 0.5903, 'learning_rate': 1.3649135570705738e-05, 'epoch': 0.8} {'loss': 0.5648, 'learning_rate': 1.3648822759539323e-05, 'epoch': 0.8} {'loss': 0.6002, 'learning_rate': 1.364850994425408e-05, 'epoch': 0.8} {'loss': 0.4378, 'learning_rate': 1.3648197124850364e-05, 'epoch': 0.8} {'loss': 0.5541, 'learning_rate': 1.3647884301328527e-05, 'epoch': 0.8} {'loss': 0.555, 'learning_rate': 1.3647571473688924e-05, 'epoch': 0.8} {'loss': 0.6556, 'learning_rate': 1.3647258641931904e-05, 'epoch': 0.8} {'loss': 0.6291, 'learning_rate': 1.3646945806057823e-05, 'epoch': 0.8} {'loss': 0.5544, 'learning_rate': 1.3646632966067034e-05, 'epoch': 0.8} {'loss': 0.6414, 'learning_rate': 1.3646320121959891e-05, 'epoch': 0.8} {'loss': 0.4605, 'learning_rate': 1.3646007273736744e-05, 'epoch': 0.8} {'loss': 0.6418, 'learning_rate': 1.3645694421397945e-05, 'epoch': 0.8} {'loss': 0.5114, 'learning_rate': 1.3645381564943857e-05, 'epoch': 0.8} {'loss': 0.6002, 'learning_rate': 1.3645068704374821e-05, 'epoch': 0.8} {'loss': 0.6746, 'learning_rate': 1.36447558396912e-05, 'epoch': 0.8} {'loss': 0.5727, 'learning_rate': 1.364444297089334e-05, 'epoch': 0.8} {'loss': 0.3761, 'learning_rate': 1.3644130097981596e-05, 'epoch': 0.8} {'loss': 0.4476, 'learning_rate': 1.3643817220956323e-05, 'epoch': 0.8} {'loss': 0.666, 'learning_rate': 1.3643504339817877e-05, 'epoch': 0.8} {'loss': 0.4998, 'learning_rate': 1.3643191454566605e-05, 'epoch': 0.8} {'loss': 0.6055, 'learning_rate': 1.3642878565202859e-05, 'epoch': 0.8} {'loss': 0.6227, 'learning_rate': 1.3642565671727e-05, 'epoch': 0.8} {'loss': 0.6349, 'learning_rate': 1.3642252774139376e-05, 'epoch': 0.8} {'loss': 0.5963, 'learning_rate': 1.364193987244034e-05, 'epoch': 0.8} {'loss': 0.6629, 'learning_rate': 1.3641626966630248e-05, 'epoch': 0.8} {'loss': 0.6325, 'learning_rate': 1.3641314056709451e-05, 'epoch': 0.8} {'loss': 0.5231, 'learning_rate': 1.36410011426783e-05, 'epoch': 0.8} {'loss': 0.3948, 'learning_rate': 1.3640688224537155e-05, 'epoch': 0.8} {'loss': 0.6094, 'learning_rate': 1.3640375302286364e-05, 'epoch': 0.8} {'loss': 0.5411, 'learning_rate': 1.3640062375926281e-05, 'epoch': 0.8} {'loss': 0.5999, 'learning_rate': 1.3639749445457263e-05, 'epoch': 0.8} {'loss': 0.4605, 'learning_rate': 1.3639436510879657e-05, 'epoch': 0.8} {'loss': 0.6465, 'learning_rate': 1.363912357219382e-05, 'epoch': 0.8} {'loss': 0.4782, 'learning_rate': 1.3638810629400103e-05, 'epoch': 0.8} {'loss': 0.5355, 'learning_rate': 1.3638497682498864e-05, 'epoch': 0.8} {'loss': 0.4679, 'learning_rate': 1.3638184731490449e-05, 'epoch': 0.8} {'loss': 0.6252, 'learning_rate': 1.3637871776375218e-05, 'epoch': 0.8} {'loss': 0.5313, 'learning_rate': 1.363755881715352e-05, 'epoch': 0.8} {'loss': 0.6117, 'learning_rate': 1.3637245853825711e-05, 'epoch': 0.8} {'loss': 0.5354, 'learning_rate': 1.3636932886392143e-05, 'epoch': 0.8} {'loss': 0.6643, 'learning_rate': 1.3636619914853169e-05, 'epoch': 0.8} {'loss': 0.6891, 'learning_rate': 1.3636306939209143e-05, 'epoch': 0.8} {'loss': 0.6453, 'learning_rate': 1.363599395946042e-05, 'epoch': 0.8} {'loss': 0.4596, 'learning_rate': 1.3635680975607349e-05, 'epoch': 0.8} {'loss': 0.656, 'learning_rate': 1.3635367987650286e-05, 'epoch': 0.8} {'loss': 0.546, 'learning_rate': 1.3635054995589582e-05, 'epoch': 0.8} {'loss': 0.5252, 'learning_rate': 1.3634741999425593e-05, 'epoch': 0.8} {'loss': 0.6989, 'learning_rate': 1.3634428999158673e-05, 'epoch': 0.8} {'loss': 0.4073, 'learning_rate': 1.3634115994789173e-05, 'epoch': 0.8} {'loss': 0.5916, 'learning_rate': 1.3633802986317446e-05, 'epoch': 0.8} {'loss': 0.5628, 'learning_rate': 1.3633489973743847e-05, 'epoch': 0.8} {'loss': 0.5452, 'learning_rate': 1.3633176957068729e-05, 'epoch': 0.8} {'loss': 0.5283, 'learning_rate': 1.3632863936292444e-05, 'epoch': 0.8} {'loss': 0.5652, 'learning_rate': 1.3632550911415348e-05, 'epoch': 0.8} {'loss': 0.6001, 'learning_rate': 1.3632237882437794e-05, 'epoch': 0.8} {'loss': 0.5821, 'learning_rate': 1.3631924849360133e-05, 'epoch': 0.8} {'loss': 0.6111, 'learning_rate': 1.3631611812182719e-05, 'epoch': 0.8} {'loss': 0.6799, 'learning_rate': 1.3631298770905906e-05, 'epoch': 0.8} {'loss': 0.7238, 'learning_rate': 1.3630985725530046e-05, 'epoch': 0.8} {'loss': 0.6233, 'learning_rate': 1.3630672676055494e-05, 'epoch': 0.8} {'loss': 0.5623, 'learning_rate': 1.3630359622482602e-05, 'epoch': 0.8} {'loss': 0.5917, 'learning_rate': 1.3630046564811728e-05, 'epoch': 0.8} {'loss': 0.4952, 'learning_rate': 1.362973350304322e-05, 'epoch': 0.8} {'loss': 0.5975, 'learning_rate': 1.3629420437177431e-05, 'epoch': 0.8} {'loss': 0.6578, 'learning_rate': 1.3629107367214718e-05, 'epoch': 0.8} {'loss': 0.6873, 'learning_rate': 1.3628794293155434e-05, 'epoch': 0.8} {'loss': 0.6667, 'learning_rate': 1.362848121499993e-05, 'epoch': 0.8} {'loss': 0.5313, 'learning_rate': 1.362816813274856e-05, 'epoch': 0.8} {'loss': 0.6065, 'learning_rate': 1.3627855046401682e-05, 'epoch': 0.8} {'loss': 0.6073, 'learning_rate': 1.3627541955959643e-05, 'epoch': 0.8} {'loss': 0.5305, 'learning_rate': 1.36272288614228e-05, 'epoch': 0.8} {'loss': 0.5138, 'learning_rate': 1.3626915762791502e-05, 'epoch': 0.8} {'loss': 0.4636, 'learning_rate': 1.3626602660066108e-05, 'epoch': 0.8} {'loss': 0.5708, 'learning_rate': 1.3626289553246968e-05, 'epoch': 0.8} {'loss': 0.6154, 'learning_rate': 1.362597644233444e-05, 'epoch': 0.8} {'loss': 0.7409, 'learning_rate': 1.3625663327328868e-05, 'epoch': 0.8} {'loss': 0.7067, 'learning_rate': 1.3625350208230614e-05, 'epoch': 0.8} {'loss': 0.5133, 'learning_rate': 1.3625037085040031e-05, 'epoch': 0.8} {'loss': 0.7071, 'learning_rate': 1.3624723957757473e-05, 'epoch': 0.8} {'loss': 0.5752, 'learning_rate': 1.3624410826383287e-05, 'epoch': 0.8} {'loss': 0.4741, 'learning_rate': 1.362409769091783e-05, 'epoch': 0.8} {'loss': 0.5232, 'learning_rate': 1.3623784551361458e-05, 'epoch': 0.8} {'loss': 0.6356, 'learning_rate': 1.3623471407714522e-05, 'epoch': 0.8} {'loss': 0.7075, 'learning_rate': 1.3623158259977373e-05, 'epoch': 0.8} {'loss': 0.5374, 'learning_rate': 1.3622845108150369e-05, 'epoch': 0.8} {'loss': 0.5983, 'learning_rate': 1.3622531952233864e-05, 'epoch': 0.8} {'loss': 0.4025, 'learning_rate': 1.3622218792228205e-05, 'epoch': 0.8} {'loss': 0.5437, 'learning_rate': 1.3621905628133753e-05, 'epoch': 0.8} {'loss': 0.3309, 'learning_rate': 1.3621592459950859e-05, 'epoch': 0.8} {'loss': 0.486, 'learning_rate': 1.3621279287679874e-05, 'epoch': 0.8} {'loss': 0.4686, 'learning_rate': 1.3620966111321152e-05, 'epoch': 0.8} {'loss': 0.7389, 'learning_rate': 1.3620652930875054e-05, 'epoch': 0.8} {'loss': 0.6825, 'learning_rate': 1.362033974634192e-05, 'epoch': 0.8} {'loss': 0.4845, 'learning_rate': 1.3620026557722115e-05, 'epoch': 0.8} {'loss': 0.7472, 'learning_rate': 1.3619713365015987e-05, 'epoch': 0.8} {'loss': 0.5335, 'learning_rate': 1.3619400168223891e-05, 'epoch': 0.8} {'loss': 0.6777, 'learning_rate': 1.361908696734618e-05, 'epoch': 0.8} {'loss': 0.5653, 'learning_rate': 1.3618773762383209e-05, 'epoch': 0.8} {'loss': 0.5494, 'learning_rate': 1.3618460553335329e-05, 'epoch': 0.8} {'loss': 0.4312, 'learning_rate': 1.3618147340202897e-05, 'epoch': 0.8} {'loss': 0.425, 'learning_rate': 1.3617834122986262e-05, 'epoch': 0.8} {'loss': 0.6176, 'learning_rate': 1.3617520901685784e-05, 'epoch': 0.8} {'loss': 0.5556, 'learning_rate': 1.361720767630181e-05, 'epoch': 0.8} {'loss': 0.5246, 'learning_rate': 1.3616894446834696e-05, 'epoch': 0.8} {'loss': 0.5158, 'learning_rate': 1.36165812132848e-05, 'epoch': 0.8} {'loss': 0.5831, 'learning_rate': 1.3616267975652468e-05, 'epoch': 0.8} {'loss': 0.5247, 'learning_rate': 1.3615954733938059e-05, 'epoch': 0.8} {'loss': 0.6232, 'learning_rate': 1.3615641488141922e-05, 'epoch': 0.8} {'loss': 0.5984, 'learning_rate': 1.3615328238264417e-05, 'epoch': 0.8} {'loss': 0.5889, 'learning_rate': 1.361501498430589e-05, 'epoch': 0.8} {'loss': 0.531, 'learning_rate': 1.3614701726266701e-05, 'epoch': 0.8} {'loss': 0.4916, 'learning_rate': 1.36143884641472e-05, 'epoch': 0.8} {'loss': 0.4221, 'learning_rate': 1.3614075197947743e-05, 'epoch': 0.8} {'loss': 0.6326, 'learning_rate': 1.3613761927668681e-05, 'epoch': 0.8} {'loss': 0.7416, 'learning_rate': 1.3613448653310368e-05, 'epoch': 0.8} {'loss': 0.5058, 'learning_rate': 1.3613135374873161e-05, 'epoch': 0.8} {'loss': 0.6611, 'learning_rate': 1.361282209235741e-05, 'epoch': 0.8} {'loss': 0.5801, 'learning_rate': 1.361250880576347e-05, 'epoch': 0.8} {'loss': 0.5523, 'learning_rate': 1.3612195515091697e-05, 'epoch': 0.8} {'loss': 0.6518, 'learning_rate': 1.3611882220342438e-05, 'epoch': 0.8} {'loss': 0.6696, 'learning_rate': 1.3611568921516054e-05, 'epoch': 0.8} {'loss': 0.6264, 'learning_rate': 1.3611255618612893e-05, 'epoch': 0.8} {'loss': 0.58, 'learning_rate': 1.3610942311633313e-05, 'epoch': 0.8} {'loss': 0.6027, 'learning_rate': 1.3610629000577664e-05, 'epoch': 0.8} {'loss': 0.5008, 'learning_rate': 1.3610315685446303e-05, 'epoch': 0.8} {'loss': 0.7295, 'learning_rate': 1.3610002366239578e-05, 'epoch': 0.8} {'loss': 0.71, 'learning_rate': 1.3609689042957851e-05, 'epoch': 0.8} {'loss': 0.5668, 'learning_rate': 1.3609375715601471e-05, 'epoch': 0.8} {'loss': 0.4918, 'learning_rate': 1.3609062384170795e-05, 'epoch': 0.8} {'loss': 0.5631, 'learning_rate': 1.360874904866617e-05, 'epoch': 0.8} {'loss': 0.6444, 'learning_rate': 1.3608435709087954e-05, 'epoch': 0.8} {'loss': 0.6007, 'learning_rate': 1.3608122365436503e-05, 'epoch': 0.8} {'loss': 0.507, 'learning_rate': 1.3607809017712164e-05, 'epoch': 0.8} {'loss': 0.5671, 'learning_rate': 1.3607495665915295e-05, 'epoch': 0.8} {'loss': 0.384, 'learning_rate': 1.3607182310046253e-05, 'epoch': 0.8} {'loss': 0.5328, 'learning_rate': 1.3606868950105386e-05, 'epoch': 0.8} {'loss': 0.465, 'learning_rate': 1.3606555586093046e-05, 'epoch': 0.8} {'loss': 0.5811, 'learning_rate': 1.3606242218009596e-05, 'epoch': 0.8} {'loss': 0.3901, 'learning_rate': 1.3605928845855383e-05, 'epoch': 0.8} {'loss': 0.5846, 'learning_rate': 1.360561546963076e-05, 'epoch': 0.8} {'loss': 0.3532, 'learning_rate': 1.3605302089336086e-05, 'epoch': 0.8} {'loss': 0.7218, 'learning_rate': 1.3604988704971712e-05, 'epoch': 0.8} {'loss': 0.6896, 'learning_rate': 1.3604675316537988e-05, 'epoch': 0.8} {'loss': 0.8326, 'learning_rate': 1.3604361924035272e-05, 'epoch': 0.8} {'loss': 0.5353, 'learning_rate': 1.3604048527463918e-05, 'epoch': 0.8} {'loss': 0.5797, 'learning_rate': 1.3603735126824275e-05, 'epoch': 0.8} {'loss': 0.6112, 'learning_rate': 1.3603421722116706e-05, 'epoch': 0.8} {'loss': 0.5517, 'learning_rate': 1.3603108313341554e-05, 'epoch': 0.8} {'loss': 0.6153, 'learning_rate': 1.360279490049918e-05, 'epoch': 0.8} {'loss': 0.4623, 'learning_rate': 1.3602481483589936e-05, 'epoch': 0.8} {'loss': 0.6582, 'learning_rate': 1.3602168062614174e-05, 'epoch': 0.8} {'loss': 0.5983, 'learning_rate': 1.3601854637572249e-05, 'epoch': 0.8} {'loss': 0.4185, 'learning_rate': 1.3601541208464518e-05, 'epoch': 0.8} {'loss': 0.6898, 'learning_rate': 1.3601227775291328e-05, 'epoch': 0.8} {'loss': 0.6173, 'learning_rate': 1.3600914338053042e-05, 'epoch': 0.8} {'loss': 0.4141, 'learning_rate': 1.3600600896750005e-05, 'epoch': 0.8} {'loss': 0.4529, 'learning_rate': 1.3600287451382574e-05, 'epoch': 0.8} {'loss': 0.6686, 'learning_rate': 1.3599974001951104e-05, 'epoch': 0.8} {'loss': 0.4401, 'learning_rate': 1.3599660548455946e-05, 'epoch': 0.8} {'loss': 0.4511, 'learning_rate': 1.3599347090897458e-05, 'epoch': 0.8} {'loss': 0.647, 'learning_rate': 1.3599033629275991e-05, 'epoch': 0.8} {'loss': 0.5124, 'learning_rate': 1.3598720163591898e-05, 'epoch': 0.8} {'loss': 0.5034, 'learning_rate': 1.3598406693845536e-05, 'epoch': 0.8} {'loss': 0.4448, 'learning_rate': 1.3598093220037256e-05, 'epoch': 0.8} {'loss': 0.6691, 'learning_rate': 1.3597779742167414e-05, 'epoch': 0.8} {'loss': 0.5134, 'learning_rate': 1.359746626023636e-05, 'epoch': 0.8} {'loss': 0.5933, 'learning_rate': 1.3597152774244453e-05, 'epoch': 0.8} {'loss': 0.6061, 'learning_rate': 1.3596839284192048e-05, 'epoch': 0.8} {'loss': 0.4528, 'learning_rate': 1.3596525790079491e-05, 'epoch': 0.8} {'loss': 0.6424, 'learning_rate': 1.3596212291907142e-05, 'epoch': 0.8} {'loss': 0.5373, 'learning_rate': 1.3595898789675353e-05, 'epoch': 0.8} {'loss': 0.6781, 'learning_rate': 1.3595585283384476e-05, 'epoch': 0.8} {'loss': 0.5928, 'learning_rate': 1.359527177303487e-05, 'epoch': 0.8} {'loss': 0.5632, 'learning_rate': 1.3594958258626885e-05, 'epoch': 0.8} {'loss': 0.5282, 'learning_rate': 1.3594644740160873e-05, 'epoch': 0.8} {'loss': 0.5556, 'learning_rate': 1.359433121763719e-05, 'epoch': 0.8} {'loss': 0.5393, 'learning_rate': 1.3594017691056194e-05, 'epoch': 0.8} {'loss': 0.6094, 'learning_rate': 1.3593704160418236e-05, 'epoch': 0.8} {'loss': 0.5987, 'learning_rate': 1.3593390625723669e-05, 'epoch': 0.8} {'loss': 0.4971, 'learning_rate': 1.3593077086972846e-05, 'epoch': 0.8} {'loss': 0.5688, 'learning_rate': 1.359276354416612e-05, 'epoch': 0.8} {'loss': 0.4655, 'learning_rate': 1.359244999730385e-05, 'epoch': 0.8} {'loss': 0.5024, 'learning_rate': 1.3592136446386389e-05, 'epoch': 0.8} {'loss': 0.6231, 'learning_rate': 1.3591822891414087e-05, 'epoch': 0.8} {'loss': 0.6281, 'learning_rate': 1.3591509332387299e-05, 'epoch': 0.8} {'loss': 0.637, 'learning_rate': 1.359119576930638e-05, 'epoch': 0.8} {'loss': 0.5901, 'learning_rate': 1.3590882202171685e-05, 'epoch': 0.8} {'loss': 0.8026, 'learning_rate': 1.3590568630983568e-05, 'epoch': 0.8} {'loss': 0.6119, 'learning_rate': 1.3590255055742379e-05, 'epoch': 0.8} {'loss': 0.7424, 'learning_rate': 1.3589941476448476e-05, 'epoch': 0.8} {'loss': 0.4514, 'learning_rate': 1.358962789310221e-05, 'epoch': 0.8} {'loss': 0.6347, 'learning_rate': 1.3589314305703942e-05, 'epoch': 0.8} {'loss': 0.4816, 'learning_rate': 1.3589000714254017e-05, 'epoch': 0.8} {'loss': 0.5145, 'learning_rate': 1.3588687118752793e-05, 'epoch': 0.8} {'loss': 0.5881, 'learning_rate': 1.3588373519200624e-05, 'epoch': 0.8} {'loss': 0.7134, 'learning_rate': 1.3588059915597863e-05, 'epoch': 0.8} {'loss': 0.495, 'learning_rate': 1.3587746307944865e-05, 'epoch': 0.8} {'loss': 0.5725, 'learning_rate': 1.3587432696241983e-05, 'epoch': 0.8} {'loss': 0.3947, 'learning_rate': 1.358711908048957e-05, 'epoch': 0.8} {'loss': 0.4404, 'learning_rate': 1.3586805460687985e-05, 'epoch': 0.8} {'loss': 0.6233, 'learning_rate': 1.3586491836837576e-05, 'epoch': 0.8} {'loss': 0.5708, 'learning_rate': 1.35861782089387e-05, 'epoch': 0.8} {'loss': 0.5212, 'learning_rate': 1.3585864576991715e-05, 'epoch': 0.8} {'loss': 0.4248, 'learning_rate': 1.3585550940996966e-05, 'epoch': 0.8} {'loss': 0.5971, 'learning_rate': 1.3585237300954814e-05, 'epoch': 0.8} {'loss': 0.4527, 'learning_rate': 1.3584923656865611e-05, 'epoch': 0.8} {'loss': 0.6252, 'learning_rate': 1.358461000872971e-05, 'epoch': 0.8} {'loss': 0.7059, 'learning_rate': 1.358429635654747e-05, 'epoch': 0.8} {'loss': 0.5155, 'learning_rate': 1.3583982700319234e-05, 'epoch': 0.8} {'loss': 0.5093, 'learning_rate': 1.3583669040045367e-05, 'epoch': 0.81} {'loss': 0.4639, 'learning_rate': 1.3583355375726217e-05, 'epoch': 0.81} {'loss': 0.4792, 'learning_rate': 1.3583041707362141e-05, 'epoch': 0.81} {'loss': 0.545, 'learning_rate': 1.3582728034953493e-05, 'epoch': 0.81} {'loss': 0.5983, 'learning_rate': 1.3582414358500629e-05, 'epoch': 0.81} {'loss': 0.6084, 'learning_rate': 1.3582100678003896e-05, 'epoch': 0.81} {'loss': 0.6069, 'learning_rate': 1.3581786993463656e-05, 'epoch': 0.81} {'loss': 0.5106, 'learning_rate': 1.3581473304880254e-05, 'epoch': 0.81} {'loss': 0.5135, 'learning_rate': 1.3581159612254058e-05, 'epoch': 0.81} {'loss': 0.7065, 'learning_rate': 1.3580845915585408e-05, 'epoch': 0.81} {'loss': 0.5454, 'learning_rate': 1.3580532214874665e-05, 'epoch': 0.81} {'loss': 0.5419, 'learning_rate': 1.358021851012218e-05, 'epoch': 0.81} {'loss': 0.5009, 'learning_rate': 1.3579904801328313e-05, 'epoch': 0.81} {'loss': 0.5954, 'learning_rate': 1.3579591088493411e-05, 'epoch': 0.81} {'loss': 0.7015, 'learning_rate': 1.3579277371617834e-05, 'epoch': 0.81} {'loss': 0.489, 'learning_rate': 1.357896365070193e-05, 'epoch': 0.81} {'loss': 0.4622, 'learning_rate': 1.3578649925746059e-05, 'epoch': 0.81} {'loss': 0.7937, 'learning_rate': 1.3578336196750572e-05, 'epoch': 0.81} {'loss': 0.4307, 'learning_rate': 1.3578022463715827e-05, 'epoch': 0.81} {'loss': 0.5211, 'learning_rate': 1.3577708726642171e-05, 'epoch': 0.81} {'loss': 0.6839, 'learning_rate': 1.3577394985529963e-05, 'epoch': 0.81} {'loss': 0.4517, 'learning_rate': 1.3577081240379557e-05, 'epoch': 0.81} {'loss': 0.423, 'learning_rate': 1.3576767491191308e-05, 'epoch': 0.81} {'loss': 0.666, 'learning_rate': 1.3576453737965567e-05, 'epoch': 0.81} {'loss': 0.5651, 'learning_rate': 1.357613998070269e-05, 'epoch': 0.81} {'loss': 0.6301, 'learning_rate': 1.357582621940303e-05, 'epoch': 0.81} {'loss': 0.5357, 'learning_rate': 1.3575512454066943e-05, 'epoch': 0.81} {'loss': 0.5644, 'learning_rate': 1.3575198684694783e-05, 'epoch': 0.81} {'loss': 0.4517, 'learning_rate': 1.3574884911286902e-05, 'epoch': 0.81} {'loss': 0.4087, 'learning_rate': 1.3574571133843656e-05, 'epoch': 0.81} {'loss': 0.5532, 'learning_rate': 1.3574257352365402e-05, 'epoch': 0.81} {'loss': 0.5827, 'learning_rate': 1.357394356685249e-05, 'epoch': 0.81} {'loss': 0.5023, 'learning_rate': 1.3573629777305276e-05, 'epoch': 0.81} {'loss': 0.6211, 'learning_rate': 1.357331598372411e-05, 'epoch': 0.81} {'loss': 0.4693, 'learning_rate': 1.3573002186109352e-05, 'epoch': 0.81} {'loss': 0.592, 'learning_rate': 1.3572688384461352e-05, 'epoch': 0.81} {'loss': 0.459, 'learning_rate': 1.3572374578780467e-05, 'epoch': 0.81} {'loss': 0.6533, 'learning_rate': 1.3572060769067053e-05, 'epoch': 0.81} {'loss': 0.4848, 'learning_rate': 1.357174695532146e-05, 'epoch': 0.81} {'loss': 0.7392, 'learning_rate': 1.3571433137544041e-05, 'epoch': 0.81} {'loss': 0.6332, 'learning_rate': 1.3571119315735155e-05, 'epoch': 0.81} {'loss': 0.6677, 'learning_rate': 1.3570805489895155e-05, 'epoch': 0.81} {'loss': 0.5169, 'learning_rate': 1.3570491660024397e-05, 'epoch': 0.81} {'loss': 0.5496, 'learning_rate': 1.357017782612323e-05, 'epoch': 0.81} {'loss': 0.6753, 'learning_rate': 1.3569863988192012e-05, 'epoch': 0.81} {'loss': 0.6267, 'learning_rate': 1.3569550146231097e-05, 'epoch': 0.81} {'loss': 0.5054, 'learning_rate': 1.3569236300240837e-05, 'epoch': 0.81} {'loss': 0.4209, 'learning_rate': 1.356892245022159e-05, 'epoch': 0.81} {'loss': 0.5634, 'learning_rate': 1.3568608596173704e-05, 'epoch': 0.81} {'loss': 0.5315, 'learning_rate': 1.3568294738097543e-05, 'epoch': 0.81} {'loss': 0.5698, 'learning_rate': 1.3567980875993452e-05, 'epoch': 0.81} {'loss': 0.3652, 'learning_rate': 1.3567667009861791e-05, 'epoch': 0.81} {'loss': 0.6024, 'learning_rate': 1.3567353139702912e-05, 'epoch': 0.81} {'loss': 0.4817, 'learning_rate': 1.3567039265517167e-05, 'epoch': 0.81} {'loss': 0.4145, 'learning_rate': 1.3566725387304916e-05, 'epoch': 0.81} {'loss': 0.5384, 'learning_rate': 1.356641150506651e-05, 'epoch': 0.81} {'loss': 0.3996, 'learning_rate': 1.3566097618802304e-05, 'epoch': 0.81} {'loss': 0.6861, 'learning_rate': 1.356578372851265e-05, 'epoch': 0.81} {'loss': 0.4869, 'learning_rate': 1.3565469834197909e-05, 'epoch': 0.81} {'loss': 0.4982, 'learning_rate': 1.3565155935858425e-05, 'epoch': 0.81} {'loss': 0.5957, 'learning_rate': 1.356484203349456e-05, 'epoch': 0.81} {'loss': 0.6003, 'learning_rate': 1.3564528127106664e-05, 'epoch': 0.81} {'loss': 0.586, 'learning_rate': 1.3564214216695097e-05, 'epoch': 0.81} {'loss': 0.527, 'learning_rate': 1.356390030226021e-05, 'epoch': 0.81} {'loss': 0.5549, 'learning_rate': 1.3563586383802355e-05, 'epoch': 0.81} {'loss': 0.4908, 'learning_rate': 1.3563272461321886e-05, 'epoch': 0.81} {'loss': 0.5377, 'learning_rate': 1.3562958534819163e-05, 'epoch': 0.81} {'loss': 0.5432, 'learning_rate': 1.3562644604294536e-05, 'epoch': 0.81} {'loss': 0.4286, 'learning_rate': 1.3562330669748366e-05, 'epoch': 0.81} {'loss': 0.5171, 'learning_rate': 1.3562016731180999e-05, 'epoch': 0.81} {'loss': 0.6735, 'learning_rate': 1.3561702788592791e-05, 'epoch': 0.81} {'loss': 0.5285, 'learning_rate': 1.35613888419841e-05, 'epoch': 0.81} {'loss': 0.6583, 'learning_rate': 1.3561074891355275e-05, 'epoch': 0.81} {'loss': 0.3366, 'learning_rate': 1.3560760936706677e-05, 'epoch': 0.81} {'loss': 0.5381, 'learning_rate': 1.3560446978038655e-05, 'epoch': 0.81} {'loss': 0.5322, 'learning_rate': 1.3560133015351567e-05, 'epoch': 0.81} {'loss': 0.5668, 'learning_rate': 1.3559819048645763e-05, 'epoch': 0.81} {'loss': 0.679, 'learning_rate': 1.3559505077921602e-05, 'epoch': 0.81} {'loss': 0.524, 'learning_rate': 1.3559191103179439e-05, 'epoch': 0.81} {'loss': 0.4689, 'learning_rate': 1.3558877124419623e-05, 'epoch': 0.81} {'loss': 0.5218, 'learning_rate': 1.3558563141642511e-05, 'epoch': 0.81} {'loss': 0.664, 'learning_rate': 1.3558249154848462e-05, 'epoch': 0.81} {'loss': 0.4704, 'learning_rate': 1.3557935164037824e-05, 'epoch': 0.81} {'loss': 0.5501, 'learning_rate': 1.3557621169210953e-05, 'epoch': 0.81} {'loss': 0.472, 'learning_rate': 1.3557307170368203e-05, 'epoch': 0.81} {'loss': 0.5408, 'learning_rate': 1.355699316750993e-05, 'epoch': 0.81} {'loss': 0.5665, 'learning_rate': 1.355667916063649e-05, 'epoch': 0.81} {'loss': 0.7144, 'learning_rate': 1.3556365149748234e-05, 'epoch': 0.81} {'loss': 0.6891, 'learning_rate': 1.355605113484552e-05, 'epoch': 0.81} {'loss': 0.594, 'learning_rate': 1.35557371159287e-05, 'epoch': 0.81} {'loss': 0.5378, 'learning_rate': 1.3555423092998128e-05, 'epoch': 0.81} {'loss': 0.6024, 'learning_rate': 1.355510906605416e-05, 'epoch': 0.81} {'loss': 0.458, 'learning_rate': 1.3554795035097148e-05, 'epoch': 0.81} {'loss': 0.5573, 'learning_rate': 1.3554481000127451e-05, 'epoch': 0.81} {'loss': 0.5058, 'learning_rate': 1.355416696114542e-05, 'epoch': 0.81} {'loss': 0.5475, 'learning_rate': 1.3553852918151412e-05, 'epoch': 0.81} {'loss': 0.6389, 'learning_rate': 1.3553538871145777e-05, 'epoch': 0.81} {'loss': 0.5475, 'learning_rate': 1.3553224820128873e-05, 'epoch': 0.81} {'loss': 0.5301, 'learning_rate': 1.3552910765101056e-05, 'epoch': 0.81} {'loss': 0.5849, 'learning_rate': 1.3552596706062676e-05, 'epoch': 0.81} {'loss': 0.4999, 'learning_rate': 1.355228264301409e-05, 'epoch': 0.81} {'loss': 0.4341, 'learning_rate': 1.3551968575955652e-05, 'epoch': 0.81} {'loss': 0.4073, 'learning_rate': 1.3551654504887717e-05, 'epoch': 0.81} {'loss': 0.6475, 'learning_rate': 1.3551340429810643e-05, 'epoch': 0.81} {'loss': 0.58, 'learning_rate': 1.3551026350724777e-05, 'epoch': 0.81} {'loss': 0.6966, 'learning_rate': 1.3550712267630477e-05, 'epoch': 0.81} {'loss': 0.5642, 'learning_rate': 1.3550398180528101e-05, 'epoch': 0.81} {'loss': 0.5705, 'learning_rate': 1.3550084089418001e-05, 'epoch': 0.81} {'loss': 0.4619, 'learning_rate': 1.3549769994300529e-05, 'epoch': 0.81} {'loss': 0.6868, 'learning_rate': 1.3549455895176042e-05, 'epoch': 0.81} {'loss': 0.6303, 'learning_rate': 1.3549141792044896e-05, 'epoch': 0.81} {'loss': 0.4703, 'learning_rate': 1.354882768490744e-05, 'epoch': 0.81} {'loss': 0.5255, 'learning_rate': 1.3548513573764035e-05, 'epoch': 0.81} {'loss': 0.5856, 'learning_rate': 1.3548199458615033e-05, 'epoch': 0.81} {'loss': 0.5051, 'learning_rate': 1.3547885339460787e-05, 'epoch': 0.81} {'loss': 0.4635, 'learning_rate': 1.3547571216301653e-05, 'epoch': 0.81} {'loss': 0.5027, 'learning_rate': 1.3547257089137985e-05, 'epoch': 0.81} {'loss': 0.3728, 'learning_rate': 1.3546942957970142e-05, 'epoch': 0.81} {'loss': 0.5125, 'learning_rate': 1.3546628822798476e-05, 'epoch': 0.81} {'loss': 0.4752, 'learning_rate': 1.3546314683623337e-05, 'epoch': 0.81} {'loss': 0.6048, 'learning_rate': 1.3546000540445083e-05, 'epoch': 0.81} {'loss': 0.5794, 'learning_rate': 1.354568639326407e-05, 'epoch': 0.81} {'loss': 0.5687, 'learning_rate': 1.354537224208065e-05, 'epoch': 0.81} {'loss': 0.6, 'learning_rate': 1.3545058086895179e-05, 'epoch': 0.81} {'loss': 0.3756, 'learning_rate': 1.3544743927708013e-05, 'epoch': 0.81} {'loss': 0.5346, 'learning_rate': 1.3544429764519502e-05, 'epoch': 0.81} {'loss': 0.413, 'learning_rate': 1.3544115597330007e-05, 'epoch': 0.81} {'loss': 0.6797, 'learning_rate': 1.354380142613988e-05, 'epoch': 0.81} {'loss': 0.4174, 'learning_rate': 1.3543487250949472e-05, 'epoch': 0.81} {'loss': 0.6388, 'learning_rate': 1.3543173071759144e-05, 'epoch': 0.81} {'loss': 0.5775, 'learning_rate': 1.3542858888569246e-05, 'epoch': 0.81} {'loss': 0.5287, 'learning_rate': 1.3542544701380133e-05, 'epoch': 0.81} {'loss': 0.4808, 'learning_rate': 1.3542230510192162e-05, 'epoch': 0.81} {'loss': 0.3964, 'learning_rate': 1.3541916315005685e-05, 'epoch': 0.81} {'loss': 0.5914, 'learning_rate': 1.354160211582106e-05, 'epoch': 0.81} {'loss': 0.6318, 'learning_rate': 1.3541287912638639e-05, 'epoch': 0.81} {'loss': 0.5163, 'learning_rate': 1.3540973705458775e-05, 'epoch': 0.81} {'loss': 0.5941, 'learning_rate': 1.3540659494281828e-05, 'epoch': 0.81} {'loss': 0.4639, 'learning_rate': 1.3540345279108147e-05, 'epoch': 0.81} {'loss': 0.4441, 'learning_rate': 1.3540031059938092e-05, 'epoch': 0.81} {'loss': 0.679, 'learning_rate': 1.3539716836772014e-05, 'epoch': 0.81} {'loss': 0.6272, 'learning_rate': 1.3539402609610268e-05, 'epoch': 0.81} {'loss': 0.5223, 'learning_rate': 1.353908837845321e-05, 'epoch': 0.81} {'loss': 0.5675, 'learning_rate': 1.3538774143301194e-05, 'epoch': 0.81} {'loss': 0.6475, 'learning_rate': 1.353845990415458e-05, 'epoch': 0.81} {'loss': 0.5478, 'learning_rate': 1.353814566101371e-05, 'epoch': 0.81} {'loss': 0.5169, 'learning_rate': 1.3537831413878952e-05, 'epoch': 0.81} {'loss': 0.5158, 'learning_rate': 1.353751716275065e-05, 'epoch': 0.81} {'loss': 0.5593, 'learning_rate': 1.3537202907629168e-05, 'epoch': 0.81} {'loss': 0.5499, 'learning_rate': 1.3536888648514855e-05, 'epoch': 0.81} {'loss': 0.5231, 'learning_rate': 1.3536574385408066e-05, 'epoch': 0.81} {'loss': 0.5711, 'learning_rate': 1.353626011830916e-05, 'epoch': 0.81} {'loss': 0.5982, 'learning_rate': 1.3535945847218486e-05, 'epoch': 0.81} {'loss': 0.5624, 'learning_rate': 1.3535631572136403e-05, 'epoch': 0.81} {'loss': 0.592, 'learning_rate': 1.3535317293063263e-05, 'epoch': 0.81} {'loss': 0.6989, 'learning_rate': 1.3535003009999424e-05, 'epoch': 0.81} {'loss': 0.5603, 'learning_rate': 1.3534688722945238e-05, 'epoch': 0.81} {'loss': 0.5455, 'learning_rate': 1.353437443190106e-05, 'epoch': 0.81} {'loss': 0.7409, 'learning_rate': 1.3534060136867247e-05, 'epoch': 0.81} {'loss': 0.6943, 'learning_rate': 1.353374583784415e-05, 'epoch': 0.81} {'loss': 0.5213, 'learning_rate': 1.3533431534832127e-05, 'epoch': 0.81} {'loss': 0.5743, 'learning_rate': 1.3533117227831531e-05, 'epoch': 0.81} {'loss': 0.7115, 'learning_rate': 1.3532802916842718e-05, 'epoch': 0.81} {'loss': 0.4236, 'learning_rate': 1.353248860186604e-05, 'epoch': 0.81} {'loss': 0.7072, 'learning_rate': 1.3532174282901855e-05, 'epoch': 0.81} {'loss': 0.608, 'learning_rate': 1.353185995995052e-05, 'epoch': 0.81} {'loss': 0.4271, 'learning_rate': 1.3531545633012384e-05, 'epoch': 0.81} {'loss': 0.5818, 'learning_rate': 1.3531231302087809e-05, 'epoch': 0.81} {'loss': 0.5011, 'learning_rate': 1.3530916967177139e-05, 'epoch': 0.81} {'loss': 0.4651, 'learning_rate': 1.3530602628280738e-05, 'epoch': 0.81} {'loss': 0.6641, 'learning_rate': 1.3530288285398958e-05, 'epoch': 0.81} {'loss': 0.5122, 'learning_rate': 1.3529973938532155e-05, 'epoch': 0.81} {'loss': 0.6854, 'learning_rate': 1.3529659587680681e-05, 'epoch': 0.81} {'loss': 0.6279, 'learning_rate': 1.3529345232844892e-05, 'epoch': 0.81} {'loss': 0.5051, 'learning_rate': 1.3529030874025147e-05, 'epoch': 0.81} {'loss': 0.4666, 'learning_rate': 1.3528716511221794e-05, 'epoch': 0.81} {'loss': 0.608, 'learning_rate': 1.352840214443519e-05, 'epoch': 0.81} {'loss': 0.5176, 'learning_rate': 1.3528087773665692e-05, 'epoch': 0.81} {'loss': 0.315, 'learning_rate': 1.3527773398913655e-05, 'epoch': 0.81} {'loss': 0.6705, 'learning_rate': 1.3527459020179432e-05, 'epoch': 0.81} {'loss': 0.6436, 'learning_rate': 1.352714463746338e-05, 'epoch': 0.81} {'loss': 0.5912, 'learning_rate': 1.3526830250765852e-05, 'epoch': 0.81} {'loss': 0.4872, 'learning_rate': 1.3526515860087202e-05, 'epoch': 0.81} {'loss': 0.5593, 'learning_rate': 1.3526201465427786e-05, 'epoch': 0.81} {'loss': 0.6208, 'learning_rate': 1.352588706678796e-05, 'epoch': 0.81} {'loss': 0.5024, 'learning_rate': 1.3525572664168078e-05, 'epoch': 0.81} {'loss': 0.6373, 'learning_rate': 1.3525258257568495e-05, 'epoch': 0.81} {'loss': 0.5921, 'learning_rate': 1.3524943846989565e-05, 'epoch': 0.81} {'loss': 0.5828, 'learning_rate': 1.3524629432431645e-05, 'epoch': 0.81} {'loss': 0.4056, 'learning_rate': 1.3524315013895086e-05, 'epoch': 0.81} {'loss': 0.5314, 'learning_rate': 1.3524000591380246e-05, 'epoch': 0.81} {'loss': 0.6386, 'learning_rate': 1.3523686164887481e-05, 'epoch': 0.81} {'loss': 0.6996, 'learning_rate': 1.3523371734417143e-05, 'epoch': 0.81} {'loss': 0.6153, 'learning_rate': 1.3523057299969591e-05, 'epoch': 0.81} {'loss': 0.5101, 'learning_rate': 1.3522742861545178e-05, 'epoch': 0.81} {'loss': 0.4813, 'learning_rate': 1.3522428419144253e-05, 'epoch': 0.81} {'loss': 0.309, 'learning_rate': 1.352211397276718e-05, 'epoch': 0.81} {'loss': 0.6058, 'learning_rate': 1.352179952241431e-05, 'epoch': 0.81} {'loss': 0.4429, 'learning_rate': 1.3521485068085996e-05, 'epoch': 0.81} {'loss': 0.4855, 'learning_rate': 1.3521170609782596e-05, 'epoch': 0.81} {'loss': 0.5842, 'learning_rate': 1.3520856147504465e-05, 'epoch': 0.81} {'loss': 0.6445, 'learning_rate': 1.3520541681251954e-05, 'epoch': 0.81} {'loss': 0.4161, 'learning_rate': 1.3520227211025423e-05, 'epoch': 0.81} {'loss': 0.5206, 'learning_rate': 1.3519912736825225e-05, 'epoch': 0.81} {'loss': 0.4616, 'learning_rate': 1.3519598258651713e-05, 'epoch': 0.81} {'loss': 0.5421, 'learning_rate': 1.3519283776505248e-05, 'epoch': 0.81} {'loss': 0.6118, 'learning_rate': 1.3518969290386177e-05, 'epoch': 0.81} {'loss': 0.7577, 'learning_rate': 1.351865480029486e-05, 'epoch': 0.81} {'loss': 0.5147, 'learning_rate': 1.3518340306231652e-05, 'epoch': 0.81} {'loss': 0.54, 'learning_rate': 1.3518025808196907e-05, 'epoch': 0.81} {'loss': 0.6123, 'learning_rate': 1.3517711306190977e-05, 'epoch': 0.81} {'loss': 0.5752, 'learning_rate': 1.3517396800214222e-05, 'epoch': 0.81} {'loss': 0.4386, 'learning_rate': 1.3517082290266994e-05, 'epoch': 0.81} {'loss': 0.8246, 'learning_rate': 1.351676777634965e-05, 'epoch': 0.81} {'loss': 0.5709, 'learning_rate': 1.351645325846254e-05, 'epoch': 0.81} {'loss': 0.4599, 'learning_rate': 1.3516138736606026e-05, 'epoch': 0.81} {'loss': 0.6338, 'learning_rate': 1.351582421078046e-05, 'epoch': 0.81} {'loss': 0.587, 'learning_rate': 1.3515509680986198e-05, 'epoch': 0.81} {'loss': 0.625, 'learning_rate': 1.3515195147223595e-05, 'epoch': 0.81} {'loss': 0.6918, 'learning_rate': 1.3514880609493001e-05, 'epoch': 0.81} {'loss': 0.5363, 'learning_rate': 1.3514566067794779e-05, 'epoch': 0.81} {'loss': 0.6058, 'learning_rate': 1.3514251522129279e-05, 'epoch': 0.81} {'loss': 0.5649, 'learning_rate': 1.3513936972496854e-05, 'epoch': 0.81} {'loss': 0.586, 'learning_rate': 1.3513622418897866e-05, 'epoch': 0.81} {'loss': 0.678, 'learning_rate': 1.3513307861332667e-05, 'epoch': 0.81} {'loss': 0.372, 'learning_rate': 1.3512993299801611e-05, 'epoch': 0.81} {'loss': 0.5317, 'learning_rate': 1.351267873430505e-05, 'epoch': 0.81} {'loss': 0.6342, 'learning_rate': 1.3512364164843348e-05, 'epoch': 0.81} {'loss': 0.5754, 'learning_rate': 1.3512049591416852e-05, 'epoch': 0.81} {'loss': 0.5342, 'learning_rate': 1.3511735014025919e-05, 'epoch': 0.81} {'loss': 0.5116, 'learning_rate': 1.351142043267091e-05, 'epoch': 0.81} {'loss': 0.4932, 'learning_rate': 1.351110584735217e-05, 'epoch': 0.81} {'loss': 0.5835, 'learning_rate': 1.3510791258070061e-05, 'epoch': 0.81} {'loss': 0.5812, 'learning_rate': 1.3510476664824937e-05, 'epoch': 0.81} {'loss': 0.5455, 'learning_rate': 1.351016206761715e-05, 'epoch': 0.81} {'loss': 0.5979, 'learning_rate': 1.3509847466447057e-05, 'epoch': 0.81} {'loss': 0.5606, 'learning_rate': 1.3509532861315016e-05, 'epoch': 0.81} {'loss': 0.6997, 'learning_rate': 1.3509218252221379e-05, 'epoch': 0.81} {'loss': 0.6863, 'learning_rate': 1.3508903639166502e-05, 'epoch': 0.81} {'loss': 0.6465, 'learning_rate': 1.350858902215074e-05, 'epoch': 0.81} {'loss': 0.5342, 'learning_rate': 1.3508274401174446e-05, 'epoch': 0.81} {'loss': 0.4837, 'learning_rate': 1.350795977623798e-05, 'epoch': 0.81} {'loss': 0.5538, 'learning_rate': 1.3507645147341695e-05, 'epoch': 0.81} {'loss': 0.5568, 'learning_rate': 1.3507330514485946e-05, 'epoch': 0.81} {'loss': 0.6898, 'learning_rate': 1.3507015877671085e-05, 'epoch': 0.81} {'loss': 0.6282, 'learning_rate': 1.3506701236897473e-05, 'epoch': 0.81} {'loss': 0.645, 'learning_rate': 1.350638659216546e-05, 'epoch': 0.81} {'loss': 0.619, 'learning_rate': 1.3506071943475402e-05, 'epoch': 0.81} {'loss': 0.7575, 'learning_rate': 1.3505757290827659e-05, 'epoch': 0.81} {'loss': 0.5346, 'learning_rate': 1.3505442634222581e-05, 'epoch': 0.81} {'loss': 0.5346, 'learning_rate': 1.3505127973660523e-05, 'epoch': 0.81} {'loss': 0.55, 'learning_rate': 1.3504813309141844e-05, 'epoch': 0.81} {'loss': 0.5145, 'learning_rate': 1.3504498640666897e-05, 'epoch': 0.81} {'loss': 0.5328, 'learning_rate': 1.3504183968236037e-05, 'epoch': 0.81} {'loss': 0.5658, 'learning_rate': 1.350386929184962e-05, 'epoch': 0.81} {'loss': 0.5191, 'learning_rate': 1.3503554611508002e-05, 'epoch': 0.81} {'loss': 0.5572, 'learning_rate': 1.3503239927211536e-05, 'epoch': 0.81} {'loss': 0.4616, 'learning_rate': 1.350292523896058e-05, 'epoch': 0.81} {'loss': 0.5846, 'learning_rate': 1.3502610546755486e-05, 'epoch': 0.81} {'loss': 0.5805, 'learning_rate': 1.3502295850596609e-05, 'epoch': 0.81} {'loss': 0.6738, 'learning_rate': 1.3501981150484309e-05, 'epoch': 0.81} {'loss': 0.4612, 'learning_rate': 1.3501666446418937e-05, 'epoch': 0.81} {'loss': 0.3595, 'learning_rate': 1.350135173840085e-05, 'epoch': 0.81} {'loss': 0.6064, 'learning_rate': 1.35010370264304e-05, 'epoch': 0.81} {'loss': 0.6233, 'learning_rate': 1.3500722310507946e-05, 'epoch': 0.81} {'loss': 0.6861, 'learning_rate': 1.3500407590633841e-05, 'epoch': 0.81} {'loss': 0.5973, 'learning_rate': 1.3500092866808445e-05, 'epoch': 0.81} {'loss': 0.5958, 'learning_rate': 1.3499778139032112e-05, 'epoch': 0.81} {'loss': 0.5833, 'learning_rate': 1.3499463407305192e-05, 'epoch': 0.81} {'loss': 0.4698, 'learning_rate': 1.349914867162804e-05, 'epoch': 0.81} {'loss': 0.6148, 'learning_rate': 1.3498833932001017e-05, 'epoch': 0.81} {'loss': 0.4877, 'learning_rate': 1.3498519188424476e-05, 'epoch': 0.81} {'loss': 0.5658, 'learning_rate': 1.3498204440898772e-05, 'epoch': 0.81} {'loss': 0.5626, 'learning_rate': 1.3497889689424261e-05, 'epoch': 0.81} {'loss': 0.6098, 'learning_rate': 1.3497574934001296e-05, 'epoch': 0.81} {'loss': 0.4715, 'learning_rate': 1.3497260174630236e-05, 'epoch': 0.81} {'loss': 0.5656, 'learning_rate': 1.3496945411311433e-05, 'epoch': 0.81} {'loss': 0.5747, 'learning_rate': 1.3496630644045243e-05, 'epoch': 0.81} {'loss': 0.5701, 'learning_rate': 1.3496315872832025e-05, 'epoch': 0.81} {'loss': 0.5312, 'learning_rate': 1.3496001097672128e-05, 'epoch': 0.81} {'loss': 0.5562, 'learning_rate': 1.3495686318565912e-05, 'epoch': 0.81} {'loss': 0.6472, 'learning_rate': 1.3495371535513733e-05, 'epoch': 0.81} {'loss': 0.478, 'learning_rate': 1.349505674851594e-05, 'epoch': 0.81} {'loss': 0.3402, 'learning_rate': 1.3494741957572895e-05, 'epoch': 0.81} {'loss': 0.4024, 'learning_rate': 1.349442716268495e-05, 'epoch': 0.81} {'loss': 0.6865, 'learning_rate': 1.349411236385246e-05, 'epoch': 0.81} {'loss': 0.6048, 'learning_rate': 1.3493797561075786e-05, 'epoch': 0.81} {'loss': 0.4996, 'learning_rate': 1.3493482754355274e-05, 'epoch': 0.81} {'loss': 0.5297, 'learning_rate': 1.3493167943691288e-05, 'epoch': 0.81} {'loss': 0.5434, 'learning_rate': 1.3492853129084176e-05, 'epoch': 0.81} {'loss': 0.4736, 'learning_rate': 1.34925383105343e-05, 'epoch': 0.81} {'loss': 0.5987, 'learning_rate': 1.3492223488042011e-05, 'epoch': 0.81} {'loss': 0.5004, 'learning_rate': 1.3491908661607666e-05, 'epoch': 0.81} {'loss': 0.4255, 'learning_rate': 1.3491593831231623e-05, 'epoch': 0.81} {'loss': 0.5627, 'learning_rate': 1.349127899691423e-05, 'epoch': 0.81} {'loss': 0.5039, 'learning_rate': 1.349096415865585e-05, 'epoch': 0.81} {'loss': 0.5717, 'learning_rate': 1.3490649316456833e-05, 'epoch': 0.81} {'loss': 0.6077, 'learning_rate': 1.349033447031754e-05, 'epoch': 0.81} {'loss': 0.4952, 'learning_rate': 1.3490019620238319e-05, 'epoch': 0.81} {'loss': 0.64, 'learning_rate': 1.3489704766219531e-05, 'epoch': 0.81} {'loss': 0.7489, 'learning_rate': 1.348938990826153e-05, 'epoch': 0.81} {'loss': 0.6394, 'learning_rate': 1.348907504636467e-05, 'epoch': 0.81} {'loss': 0.6607, 'learning_rate': 1.348876018052931e-05, 'epoch': 0.81} {'loss': 0.6342, 'learning_rate': 1.3488445310755803e-05, 'epoch': 0.81} {'loss': 0.5568, 'learning_rate': 1.3488130437044504e-05, 'epoch': 0.81} {'loss': 0.5549, 'learning_rate': 1.3487815559395769e-05, 'epoch': 0.81} {'loss': 0.594, 'learning_rate': 1.3487500677809955e-05, 'epoch': 0.81} {'loss': 0.498, 'learning_rate': 1.3487185792287413e-05, 'epoch': 0.81} {'loss': 0.6598, 'learning_rate': 1.3486870902828506e-05, 'epoch': 0.81} {'loss': 0.6441, 'learning_rate': 1.348655600943358e-05, 'epoch': 0.81} {'loss': 0.6513, 'learning_rate': 1.3486241112102998e-05, 'epoch': 0.81} {'loss': 0.5166, 'learning_rate': 1.348592621083711e-05, 'epoch': 0.81} {'loss': 0.6776, 'learning_rate': 1.3485611305636278e-05, 'epoch': 0.81} {'loss': 0.7226, 'learning_rate': 1.3485296396500846e-05, 'epoch': 0.81} {'loss': 0.6045, 'learning_rate': 1.3484981483431185e-05, 'epoch': 0.81} {'loss': 0.6762, 'learning_rate': 1.348466656642764e-05, 'epoch': 0.81} {'loss': 0.3667, 'learning_rate': 1.348435164549057e-05, 'epoch': 0.81} {'loss': 0.5749, 'learning_rate': 1.348403672062033e-05, 'epoch': 0.81} {'loss': 0.5236, 'learning_rate': 1.3483721791817272e-05, 'epoch': 0.81} {'loss': 0.475, 'learning_rate': 1.3483406859081757e-05, 'epoch': 0.81} {'loss': 0.6005, 'learning_rate': 1.3483091922414138e-05, 'epoch': 0.81} {'loss': 0.5948, 'learning_rate': 1.3482776981814771e-05, 'epoch': 0.81} {'loss': 0.521, 'learning_rate': 1.348246203728401e-05, 'epoch': 0.81} {'loss': 0.5429, 'learning_rate': 1.348214708882221e-05, 'epoch': 0.81} {'loss': 0.5756, 'learning_rate': 1.3481832136429731e-05, 'epoch': 0.81} {'loss': 0.6232, 'learning_rate': 1.3481517180106924e-05, 'epoch': 0.81} {'loss': 0.6001, 'learning_rate': 1.3481202219854148e-05, 'epoch': 0.81} {'loss': 0.544, 'learning_rate': 1.3480887255671755e-05, 'epoch': 0.81} {'loss': 0.7674, 'learning_rate': 1.34805722875601e-05, 'epoch': 0.81} {'loss': 0.5735, 'learning_rate': 1.3480257315519545e-05, 'epoch': 0.81} {'loss': 0.4774, 'learning_rate': 1.3479942339550443e-05, 'epoch': 0.81} {'loss': 0.4812, 'learning_rate': 1.3479627359653143e-05, 'epoch': 0.81} {'loss': 0.496, 'learning_rate': 1.3479312375828006e-05, 'epoch': 0.81} {'loss': 0.5858, 'learning_rate': 1.3478997388075388e-05, 'epoch': 0.81} {'loss': 0.5248, 'learning_rate': 1.3478682396395643e-05, 'epoch': 0.81} {'loss': 0.4194, 'learning_rate': 1.3478367400789127e-05, 'epoch': 0.81} {'loss': 0.5223, 'learning_rate': 1.3478052401256196e-05, 'epoch': 0.81} {'loss': 0.488, 'learning_rate': 1.3477737397797205e-05, 'epoch': 0.81} {'loss': 0.6053, 'learning_rate': 1.3477422390412511e-05, 'epoch': 0.81} {'loss': 0.4099, 'learning_rate': 1.3477107379102465e-05, 'epoch': 0.81} {'loss': 0.61, 'learning_rate': 1.347679236386743e-05, 'epoch': 0.81} {'loss': 0.6527, 'learning_rate': 1.3476477344707757e-05, 'epoch': 0.81} {'loss': 0.5996, 'learning_rate': 1.34761623216238e-05, 'epoch': 0.81} {'loss': 0.3816, 'learning_rate': 1.347584729461592e-05, 'epoch': 0.81} {'loss': 0.6766, 'learning_rate': 1.3475532263684468e-05, 'epoch': 0.81} {'loss': 0.6262, 'learning_rate': 1.3475217228829797e-05, 'epoch': 0.81} {'loss': 0.6297, 'learning_rate': 1.347490219005227e-05, 'epoch': 0.81} {'loss': 0.5397, 'learning_rate': 1.3474587147352241e-05, 'epoch': 0.81} {'loss': 0.5092, 'learning_rate': 1.3474272100730062e-05, 'epoch': 0.81} {'loss': 0.5439, 'learning_rate': 1.3473957050186088e-05, 'epoch': 0.81} {'loss': 0.4878, 'learning_rate': 1.347364199572068e-05, 'epoch': 0.81} {'loss': 0.4531, 'learning_rate': 1.3473326937334191e-05, 'epoch': 0.81} {'loss': 0.6397, 'learning_rate': 1.3473011875026974e-05, 'epoch': 0.81} {'loss': 0.4903, 'learning_rate': 1.3472696808799387e-05, 'epoch': 0.81} {'loss': 0.5489, 'learning_rate': 1.347238173865179e-05, 'epoch': 0.81} {'loss': 0.6587, 'learning_rate': 1.3472066664584532e-05, 'epoch': 0.81} {'loss': 0.4697, 'learning_rate': 1.347175158659797e-05, 'epoch': 0.81} {'loss': 0.6505, 'learning_rate': 1.3471436504692462e-05, 'epoch': 0.81} {'loss': 0.6022, 'learning_rate': 1.347112141886836e-05, 'epoch': 0.81} {'loss': 0.4755, 'learning_rate': 1.3470806329126025e-05, 'epoch': 0.81} {'loss': 0.5205, 'learning_rate': 1.3470491235465808e-05, 'epoch': 0.81} {'loss': 0.553, 'learning_rate': 1.3470176137888066e-05, 'epoch': 0.81} {'loss': 0.553, 'learning_rate': 1.3469861036393155e-05, 'epoch': 0.81} {'loss': 0.6371, 'learning_rate': 1.3469545930981429e-05, 'epoch': 0.81} {'loss': 0.7396, 'learning_rate': 1.3469230821653247e-05, 'epoch': 0.81} {'loss': 0.5231, 'learning_rate': 1.3468915708408963e-05, 'epoch': 0.81} {'loss': 0.5231, 'learning_rate': 1.3468600591248936e-05, 'epoch': 0.81} {'loss': 0.5639, 'learning_rate': 1.3468285470173517e-05, 'epoch': 0.81} {'loss': 0.5582, 'learning_rate': 1.3467970345183062e-05, 'epoch': 0.81} {'loss': 0.7158, 'learning_rate': 1.3467655216277927e-05, 'epoch': 0.81} {'loss': 0.6267, 'learning_rate': 1.3467340083458468e-05, 'epoch': 0.81} {'loss': 0.5731, 'learning_rate': 1.3467024946725045e-05, 'epoch': 0.81} {'loss': 0.6483, 'learning_rate': 1.3466709806078009e-05, 'epoch': 0.81} {'loss': 0.6584, 'learning_rate': 1.3466394661517716e-05, 'epoch': 0.81} {'loss': 0.6702, 'learning_rate': 1.3466079513044523e-05, 'epoch': 0.81} {'loss': 0.4428, 'learning_rate': 1.3465764360658784e-05, 'epoch': 0.81} {'loss': 0.5906, 'learning_rate': 1.3465449204360856e-05, 'epoch': 0.81} {'loss': 0.3198, 'learning_rate': 1.3465134044151098e-05, 'epoch': 0.81} {'loss': 0.498, 'learning_rate': 1.3464818880029859e-05, 'epoch': 0.81} {'loss': 0.5887, 'learning_rate': 1.3464503711997502e-05, 'epoch': 0.81} {'loss': 0.4316, 'learning_rate': 1.3464188540054376e-05, 'epoch': 0.81} {'loss': 0.489, 'learning_rate': 1.3463873364200843e-05, 'epoch': 0.81} {'loss': 0.4799, 'learning_rate': 1.3463558184437253e-05, 'epoch': 0.81} {'loss': 0.7596, 'learning_rate': 1.3463243000763964e-05, 'epoch': 0.81} {'loss': 0.6194, 'learning_rate': 1.3462927813181335e-05, 'epoch': 0.81} {'loss': 0.6275, 'learning_rate': 1.3462612621689716e-05, 'epoch': 0.81} {'loss': 0.5249, 'learning_rate': 1.3462297426289466e-05, 'epoch': 0.81} {'loss': 0.6183, 'learning_rate': 1.3461982226980943e-05, 'epoch': 0.81} {'loss': 0.6746, 'learning_rate': 1.3461667023764497e-05, 'epoch': 0.81} {'loss': 0.6969, 'learning_rate': 1.3461351816640491e-05, 'epoch': 0.81} {'loss': 0.7405, 'learning_rate': 1.3461036605609274e-05, 'epoch': 0.81} {'loss': 0.6799, 'learning_rate': 1.3460721390671208e-05, 'epoch': 0.81} {'loss': 0.5031, 'learning_rate': 1.3460406171826643e-05, 'epoch': 0.81} {'loss': 0.575, 'learning_rate': 1.346009094907594e-05, 'epoch': 0.81} {'loss': 0.5727, 'learning_rate': 1.345977572241945e-05, 'epoch': 0.81} {'loss': 0.5514, 'learning_rate': 1.345946049185753e-05, 'epoch': 0.81} {'loss': 0.6474, 'learning_rate': 1.345914525739054e-05, 'epoch': 0.81} {'loss': 0.4504, 'learning_rate': 1.3458830019018832e-05, 'epoch': 0.81} {'loss': 0.5809, 'learning_rate': 1.3458514776742762e-05, 'epoch': 0.81} {'loss': 0.5679, 'learning_rate': 1.3458199530562685e-05, 'epoch': 0.81} {'loss': 0.5801, 'learning_rate': 1.3457884280478962e-05, 'epoch': 0.81} {'loss': 0.5576, 'learning_rate': 1.3457569026491941e-05, 'epoch': 0.81} {'loss': 0.6941, 'learning_rate': 1.3457253768601983e-05, 'epoch': 0.81} {'loss': 0.5932, 'learning_rate': 1.3456938506809445e-05, 'epoch': 0.81} {'loss': 0.8236, 'learning_rate': 1.345662324111468e-05, 'epoch': 0.81} {'loss': 0.649, 'learning_rate': 1.3456307971518043e-05, 'epoch': 0.81} {'loss': 0.4133, 'learning_rate': 1.3455992698019895e-05, 'epoch': 0.81} {'loss': 0.4055, 'learning_rate': 1.3455677420620586e-05, 'epoch': 0.81} {'loss': 0.5842, 'learning_rate': 1.3455362139320477e-05, 'epoch': 0.81} {'loss': 0.4399, 'learning_rate': 1.3455046854119918e-05, 'epoch': 0.81} {'loss': 0.5237, 'learning_rate': 1.3454731565019268e-05, 'epoch': 0.81} {'loss': 0.575, 'learning_rate': 1.3454416272018885e-05, 'epoch': 0.81} {'loss': 0.6455, 'learning_rate': 1.3454100975119117e-05, 'epoch': 0.81} {'loss': 0.3305, 'learning_rate': 1.3453785674320333e-05, 'epoch': 0.81} {'loss': 0.5289, 'learning_rate': 1.3453470369622878e-05, 'epoch': 0.81} {'loss': 0.5255, 'learning_rate': 1.3453155061027115e-05, 'epoch': 0.81} {'loss': 0.5429, 'learning_rate': 1.3452839748533394e-05, 'epoch': 0.81} {'loss': 0.538, 'learning_rate': 1.3452524432142075e-05, 'epoch': 0.81} {'loss': 0.625, 'learning_rate': 1.3452209111853512e-05, 'epoch': 0.81} {'loss': 0.6147, 'learning_rate': 1.345189378766806e-05, 'epoch': 0.81} {'loss': 0.5838, 'learning_rate': 1.3451578459586079e-05, 'epoch': 0.81} {'loss': 0.5355, 'learning_rate': 1.345126312760792e-05, 'epoch': 0.81} {'loss': 0.5715, 'learning_rate': 1.3450947791733941e-05, 'epoch': 0.81} {'loss': 0.6016, 'learning_rate': 1.3450632451964501e-05, 'epoch': 0.81} {'loss': 0.3968, 'learning_rate': 1.3450317108299951e-05, 'epoch': 0.81} {'loss': 0.4259, 'learning_rate': 1.3450001760740647e-05, 'epoch': 0.81} {'loss': 0.5592, 'learning_rate': 1.3449686409286951e-05, 'epoch': 0.81} {'loss': 0.4542, 'learning_rate': 1.3449371053939213e-05, 'epoch': 0.81} {'loss': 0.6842, 'learning_rate': 1.3449055694697792e-05, 'epoch': 0.81} {'loss': 0.4927, 'learning_rate': 1.3448740331563044e-05, 'epoch': 0.81} {'loss': 0.4615, 'learning_rate': 1.344842496453532e-05, 'epoch': 0.81} {'loss': 0.6219, 'learning_rate': 1.3448109593614984e-05, 'epoch': 0.81} {'loss': 0.5803, 'learning_rate': 1.3447794218802385e-05, 'epoch': 0.81} {'loss': 0.6002, 'learning_rate': 1.3447478840097885e-05, 'epoch': 0.81} {'loss': 0.7124, 'learning_rate': 1.3447163457501834e-05, 'epoch': 0.81} {'loss': 0.6551, 'learning_rate': 1.3446848071014591e-05, 'epoch': 0.81} {'loss': 0.6752, 'learning_rate': 1.3446532680636515e-05, 'epoch': 0.81} {'loss': 0.5711, 'learning_rate': 1.3446217286367955e-05, 'epoch': 0.81} {'loss': 0.6288, 'learning_rate': 1.3445901888209274e-05, 'epoch': 0.81} {'loss': 0.4636, 'learning_rate': 1.3445586486160824e-05, 'epoch': 0.81} {'loss': 0.5902, 'learning_rate': 1.3445271080222964e-05, 'epoch': 0.81} {'loss': 0.4814, 'learning_rate': 1.3444955670396045e-05, 'epoch': 0.81} {'loss': 0.6513, 'learning_rate': 1.3444640256680429e-05, 'epoch': 0.81} {'loss': 0.7082, 'learning_rate': 1.3444324839076469e-05, 'epoch': 0.81} {'loss': 0.4607, 'learning_rate': 1.3444009417584519e-05, 'epoch': 0.81} {'loss': 0.4487, 'learning_rate': 1.3443693992204939e-05, 'epoch': 0.81} {'loss': 0.6626, 'learning_rate': 1.344337856293808e-05, 'epoch': 0.81} {'loss': 0.6627, 'learning_rate': 1.3443063129784305e-05, 'epoch': 0.81} {'loss': 0.6303, 'learning_rate': 1.3442747692743964e-05, 'epoch': 0.81} {'loss': 0.662, 'learning_rate': 1.344243225181742e-05, 'epoch': 0.81} {'loss': 0.5485, 'learning_rate': 1.344211680700502e-05, 'epoch': 0.81} {'loss': 0.5858, 'learning_rate': 1.3441801358307126e-05, 'epoch': 0.81} {'loss': 0.6272, 'learning_rate': 1.3441485905724093e-05, 'epoch': 0.81} {'loss': 0.5297, 'learning_rate': 1.3441170449256276e-05, 'epoch': 0.81} {'loss': 0.4836, 'learning_rate': 1.344085498890403e-05, 'epoch': 0.81} {'loss': 0.6237, 'learning_rate': 1.344053952466772e-05, 'epoch': 0.81} {'loss': 0.6852, 'learning_rate': 1.344022405654769e-05, 'epoch': 0.81} {'loss': 0.3816, 'learning_rate': 1.3439908584544301e-05, 'epoch': 0.81} {'loss': 0.3447, 'learning_rate': 1.3439593108657912e-05, 'epoch': 0.81} {'loss': 0.6172, 'learning_rate': 1.3439277628888874e-05, 'epoch': 0.81} {'loss': 0.557, 'learning_rate': 1.3438962145237547e-05, 'epoch': 0.81} {'loss': 0.5936, 'learning_rate': 1.3438646657704285e-05, 'epoch': 0.81} {'loss': 0.4824, 'learning_rate': 1.3438331166289442e-05, 'epoch': 0.81} {'loss': 0.5219, 'learning_rate': 1.343801567099338e-05, 'epoch': 0.81} {'loss': 0.5125, 'learning_rate': 1.3437700171816453e-05, 'epoch': 0.81} {'loss': 0.4916, 'learning_rate': 1.3437384668759013e-05, 'epoch': 0.81} {'loss': 0.6116, 'learning_rate': 1.3437069161821424e-05, 'epoch': 0.81} {'loss': 0.5281, 'learning_rate': 1.3436753651004036e-05, 'epoch': 0.81} {'loss': 0.5052, 'learning_rate': 1.3436438136307205e-05, 'epoch': 0.81} {'loss': 0.502, 'learning_rate': 1.343612261773129e-05, 'epoch': 0.81} {'loss': 0.4881, 'learning_rate': 1.3435807095276645e-05, 'epoch': 0.81} {'loss': 0.423, 'learning_rate': 1.3435491568943625e-05, 'epoch': 0.81} {'loss': 0.733, 'learning_rate': 1.3435176038732593e-05, 'epoch': 0.81} {'loss': 0.4987, 'learning_rate': 1.3434860504643896e-05, 'epoch': 0.81} {'loss': 0.6706, 'learning_rate': 1.3434544966677898e-05, 'epoch': 0.81} {'loss': 0.5109, 'learning_rate': 1.3434229424834952e-05, 'epoch': 0.81} {'loss': 0.5753, 'learning_rate': 1.3433913879115412e-05, 'epoch': 0.81} {'loss': 0.4628, 'learning_rate': 1.3433598329519638e-05, 'epoch': 0.81} {'loss': 0.6255, 'learning_rate': 1.3433282776047983e-05, 'epoch': 0.81} {'loss': 0.6903, 'learning_rate': 1.3432967218700808e-05, 'epoch': 0.81} {'loss': 0.5234, 'learning_rate': 1.3432651657478461e-05, 'epoch': 0.81} {'loss': 0.6023, 'learning_rate': 1.3432336092381305e-05, 'epoch': 0.81} {'loss': 0.6931, 'learning_rate': 1.3432020523409694e-05, 'epoch': 0.81} {'loss': 0.5657, 'learning_rate': 1.3431704950563983e-05, 'epoch': 0.82} {'loss': 0.6014, 'learning_rate': 1.3431389373844532e-05, 'epoch': 0.82} {'loss': 0.6601, 'learning_rate': 1.3431073793251695e-05, 'epoch': 0.82} {'loss': 0.5112, 'learning_rate': 1.3430758208785827e-05, 'epoch': 0.82} {'loss': 0.6567, 'learning_rate': 1.3430442620447286e-05, 'epoch': 0.82} {'loss': 0.5599, 'learning_rate': 1.3430127028236429e-05, 'epoch': 0.82} {'loss': 0.5605, 'learning_rate': 1.3429811432153607e-05, 'epoch': 0.82} {'loss': 0.3734, 'learning_rate': 1.3429495832199182e-05, 'epoch': 0.82} {'loss': 0.588, 'learning_rate': 1.3429180228373508e-05, 'epoch': 0.82} {'loss': 0.5951, 'learning_rate': 1.3428864620676944e-05, 'epoch': 0.82} {'loss': 0.4079, 'learning_rate': 1.3428549009109844e-05, 'epoch': 0.82} {'loss': 0.5801, 'learning_rate': 1.3428233393672564e-05, 'epoch': 0.82} {'loss': 0.5046, 'learning_rate': 1.3427917774365456e-05, 'epoch': 0.82} {'loss': 0.6881, 'learning_rate': 1.3427602151188883e-05, 'epoch': 0.82} {'loss': 0.5194, 'learning_rate': 1.34272865241432e-05, 'epoch': 0.82} {'loss': 0.5448, 'learning_rate': 1.342697089322876e-05, 'epoch': 0.82} {'loss': 0.6773, 'learning_rate': 1.3426655258445924e-05, 'epoch': 0.82} {'loss': 0.6153, 'learning_rate': 1.3426339619795045e-05, 'epoch': 0.82} {'loss': 0.5138, 'learning_rate': 1.3426023977276482e-05, 'epoch': 0.82} {'loss': 0.5272, 'learning_rate': 1.3425708330890586e-05, 'epoch': 0.82} {'loss': 0.6959, 'learning_rate': 1.3425392680637716e-05, 'epoch': 0.82} {'loss': 0.6833, 'learning_rate': 1.3425077026518233e-05, 'epoch': 0.82} {'loss': 0.681, 'learning_rate': 1.342476136853249e-05, 'epoch': 0.82} {'loss': 0.4607, 'learning_rate': 1.342444570668084e-05, 'epoch': 0.82} {'loss': 0.5756, 'learning_rate': 1.3424130040963641e-05, 'epoch': 0.82} {'loss': 0.6574, 'learning_rate': 1.3423814371381252e-05, 'epoch': 0.82} {'loss': 0.5072, 'learning_rate': 1.3423498697934028e-05, 'epoch': 0.82} {'loss': 0.4124, 'learning_rate': 1.3423183020622324e-05, 'epoch': 0.82} {'loss': 0.6311, 'learning_rate': 1.3422867339446497e-05, 'epoch': 0.82} {'loss': 0.5346, 'learning_rate': 1.3422551654406901e-05, 'epoch': 0.82} {'loss': 0.4907, 'learning_rate': 1.3422235965503897e-05, 'epoch': 0.82} {'loss': 0.5772, 'learning_rate': 1.342192027273784e-05, 'epoch': 0.82} {'loss': 0.5882, 'learning_rate': 1.3421604576109091e-05, 'epoch': 0.82} {'loss': 0.7142, 'learning_rate': 1.3421288875617995e-05, 'epoch': 0.82} {'loss': 0.6087, 'learning_rate': 1.3420973171264917e-05, 'epoch': 0.82} {'loss': 0.388, 'learning_rate': 1.342065746305021e-05, 'epoch': 0.82} {'loss': 0.5367, 'learning_rate': 1.3420341750974229e-05, 'epoch': 0.82} {'loss': 0.5173, 'learning_rate': 1.3420026035037335e-05, 'epoch': 0.82} {'loss': 0.674, 'learning_rate': 1.341971031523988e-05, 'epoch': 0.82} {'loss': 0.5204, 'learning_rate': 1.3419394591582224e-05, 'epoch': 0.82} {'loss': 0.5354, 'learning_rate': 1.3419078864064721e-05, 'epoch': 0.82} {'loss': 0.5816, 'learning_rate': 1.341876313268773e-05, 'epoch': 0.82} {'loss': 0.6211, 'learning_rate': 1.3418447397451603e-05, 'epoch': 0.82} {'loss': 0.5771, 'learning_rate': 1.34181316583567e-05, 'epoch': 0.82} {'loss': 0.437, 'learning_rate': 1.3417815915403376e-05, 'epoch': 0.82} {'loss': 0.5767, 'learning_rate': 1.3417500168591991e-05, 'epoch': 0.82} {'loss': 0.5335, 'learning_rate': 1.3417184417922892e-05, 'epoch': 0.82} {'loss': 0.4929, 'learning_rate': 1.3416868663396448e-05, 'epoch': 0.82} {'loss': 0.7138, 'learning_rate': 1.3416552905013005e-05, 'epoch': 0.82} {'loss': 0.4721, 'learning_rate': 1.3416237142772922e-05, 'epoch': 0.82} {'loss': 0.5785, 'learning_rate': 1.341592137667656e-05, 'epoch': 0.82} {'loss': 0.6282, 'learning_rate': 1.3415605606724272e-05, 'epoch': 0.82} {'loss': 0.5886, 'learning_rate': 1.3415289832916413e-05, 'epoch': 0.82} {'loss': 0.4365, 'learning_rate': 1.3414974055253343e-05, 'epoch': 0.82} {'loss': 0.4292, 'learning_rate': 1.3414658273735416e-05, 'epoch': 0.82} {'loss': 0.5266, 'learning_rate': 1.341434248836299e-05, 'epoch': 0.82} {'loss': 0.5533, 'learning_rate': 1.3414026699136419e-05, 'epoch': 0.82} {'loss': 0.7843, 'learning_rate': 1.3413710906056064e-05, 'epoch': 0.82} {'loss': 0.6359, 'learning_rate': 1.3413395109122276e-05, 'epoch': 0.82} {'loss': 0.5757, 'learning_rate': 1.3413079308335415e-05, 'epoch': 0.82} {'loss': 0.5609, 'learning_rate': 1.3412763503695838e-05, 'epoch': 0.82} {'loss': 0.5765, 'learning_rate': 1.3412447695203897e-05, 'epoch': 0.82} {'loss': 0.5431, 'learning_rate': 1.341213188285995e-05, 'epoch': 0.82} {'loss': 0.5124, 'learning_rate': 1.341181606666436e-05, 'epoch': 0.82} {'loss': 0.6791, 'learning_rate': 1.3411500246617475e-05, 'epoch': 0.82} {'loss': 0.4225, 'learning_rate': 1.3411184422719657e-05, 'epoch': 0.82} {'loss': 0.7377, 'learning_rate': 1.3410868594971258e-05, 'epoch': 0.82} {'loss': 0.5143, 'learning_rate': 1.3410552763372637e-05, 'epoch': 0.82} {'loss': 0.496, 'learning_rate': 1.3410236927924154e-05, 'epoch': 0.82} {'loss': 0.5136, 'learning_rate': 1.340992108862616e-05, 'epoch': 0.82} {'loss': 0.7128, 'learning_rate': 1.3409605245479011e-05, 'epoch': 0.82} {'loss': 0.6192, 'learning_rate': 1.340928939848307e-05, 'epoch': 0.82} {'loss': 0.556, 'learning_rate': 1.3408973547638689e-05, 'epoch': 0.82} {'loss': 0.652, 'learning_rate': 1.3408657692946223e-05, 'epoch': 0.82} {'loss': 0.4692, 'learning_rate': 1.3408341834406033e-05, 'epoch': 0.82} {'loss': 0.5749, 'learning_rate': 1.340802597201847e-05, 'epoch': 0.82} {'loss': 0.4699, 'learning_rate': 1.3407710105783896e-05, 'epoch': 0.82} {'loss': 0.6791, 'learning_rate': 1.3407394235702667e-05, 'epoch': 0.82} {'loss': 0.6412, 'learning_rate': 1.3407078361775131e-05, 'epoch': 0.82} {'loss': 0.6373, 'learning_rate': 1.3406762484001656e-05, 'epoch': 0.82} {'loss': 0.6995, 'learning_rate': 1.3406446602382595e-05, 'epoch': 0.82} {'loss': 0.6503, 'learning_rate': 1.3406130716918303e-05, 'epoch': 0.82} {'loss': 0.6203, 'learning_rate': 1.3405814827609138e-05, 'epoch': 0.82} {'loss': 0.5253, 'learning_rate': 1.3405498934455455e-05, 'epoch': 0.82} {'loss': 0.5012, 'learning_rate': 1.340518303745761e-05, 'epoch': 0.82} {'loss': 0.6093, 'learning_rate': 1.3404867136615963e-05, 'epoch': 0.82} {'loss': 0.4259, 'learning_rate': 1.3404551231930865e-05, 'epoch': 0.82} {'loss': 0.5635, 'learning_rate': 1.3404235323402678e-05, 'epoch': 0.82} {'loss': 0.5213, 'learning_rate': 1.3403919411031758e-05, 'epoch': 0.82} {'loss': 0.5139, 'learning_rate': 1.3403603494818458e-05, 'epoch': 0.82} {'loss': 0.7567, 'learning_rate': 1.3403287574763138e-05, 'epoch': 0.82} {'loss': 0.559, 'learning_rate': 1.3402971650866155e-05, 'epoch': 0.82} {'loss': 0.3888, 'learning_rate': 1.3402655723127861e-05, 'epoch': 0.82} {'loss': 0.4778, 'learning_rate': 1.3402339791548617e-05, 'epoch': 0.82} {'loss': 0.7038, 'learning_rate': 1.3402023856128778e-05, 'epoch': 0.82} {'loss': 0.6767, 'learning_rate': 1.3401707916868705e-05, 'epoch': 0.82} {'loss': 0.7218, 'learning_rate': 1.3401391973768746e-05, 'epoch': 0.82} {'loss': 0.3978, 'learning_rate': 1.3401076026829264e-05, 'epoch': 0.82} {'loss': 0.6248, 'learning_rate': 1.3400760076050614e-05, 'epoch': 0.82} {'loss': 0.6068, 'learning_rate': 1.3400444121433152e-05, 'epoch': 0.82} {'loss': 0.5577, 'learning_rate': 1.3400128162977236e-05, 'epoch': 0.82} {'loss': 0.5614, 'learning_rate': 1.339981220068322e-05, 'epoch': 0.82} {'loss': 0.555, 'learning_rate': 1.3399496234551463e-05, 'epoch': 0.82} {'loss': 0.6942, 'learning_rate': 1.3399180264582322e-05, 'epoch': 0.82} {'loss': 0.4307, 'learning_rate': 1.3398864290776153e-05, 'epoch': 0.82} {'loss': 0.501, 'learning_rate': 1.3398548313133312e-05, 'epoch': 0.82} {'loss': 0.5384, 'learning_rate': 1.3398232331654157e-05, 'epoch': 0.82} {'loss': 0.74, 'learning_rate': 1.3397916346339041e-05, 'epoch': 0.82} {'loss': 0.4275, 'learning_rate': 1.3397600357188329e-05, 'epoch': 0.82} {'loss': 0.5825, 'learning_rate': 1.3397284364202369e-05, 'epoch': 0.82} {'loss': 0.5817, 'learning_rate': 1.3396968367381521e-05, 'epoch': 0.82} {'loss': 0.4871, 'learning_rate': 1.3396652366726142e-05, 'epoch': 0.82} {'loss': 0.6409, 'learning_rate': 1.3396336362236589e-05, 'epoch': 0.82} {'loss': 0.5024, 'learning_rate': 1.3396020353913216e-05, 'epoch': 0.82} {'loss': 0.5744, 'learning_rate': 1.3395704341756383e-05, 'epoch': 0.82} {'loss': 0.6097, 'learning_rate': 1.3395388325766447e-05, 'epoch': 0.82} {'loss': 0.6408, 'learning_rate': 1.3395072305943762e-05, 'epoch': 0.82} {'loss': 0.5, 'learning_rate': 1.3394756282288685e-05, 'epoch': 0.82} {'loss': 0.6561, 'learning_rate': 1.3394440254801576e-05, 'epoch': 0.82} {'loss': 0.5143, 'learning_rate': 1.3394124223482787e-05, 'epoch': 0.82} {'loss': 0.3745, 'learning_rate': 1.3393808188332677e-05, 'epoch': 0.82} {'loss': 0.5852, 'learning_rate': 1.3393492149351608e-05, 'epoch': 0.82} {'loss': 0.6173, 'learning_rate': 1.3393176106539926e-05, 'epoch': 0.82} {'loss': 0.6699, 'learning_rate': 1.3392860059897997e-05, 'epoch': 0.82} {'loss': 0.5789, 'learning_rate': 1.3392544009426172e-05, 'epoch': 0.82} {'loss': 0.5923, 'learning_rate': 1.339222795512481e-05, 'epoch': 0.82} {'loss': 0.515, 'learning_rate': 1.3391911896994267e-05, 'epoch': 0.82} {'loss': 0.5352, 'learning_rate': 1.33915958350349e-05, 'epoch': 0.82} {'loss': 0.5797, 'learning_rate': 1.3391279769247068e-05, 'epoch': 0.82} {'loss': 0.3935, 'learning_rate': 1.3390963699631125e-05, 'epoch': 0.82} {'loss': 0.5153, 'learning_rate': 1.339064762618743e-05, 'epoch': 0.82} {'loss': 0.6185, 'learning_rate': 1.3390331548916338e-05, 'epoch': 0.82} {'loss': 0.5595, 'learning_rate': 1.339001546781821e-05, 'epoch': 0.82} {'loss': 0.4831, 'learning_rate': 1.3389699382893392e-05, 'epoch': 0.82} {'loss': 0.5483, 'learning_rate': 1.3389383294142253e-05, 'epoch': 0.82} {'loss': 0.6475, 'learning_rate': 1.3389067201565142e-05, 'epoch': 0.82} {'loss': 0.5523, 'learning_rate': 1.338875110516242e-05, 'epoch': 0.82} {'loss': 0.6431, 'learning_rate': 1.3388435004934444e-05, 'epoch': 0.82} {'loss': 0.3843, 'learning_rate': 1.3388118900881568e-05, 'epoch': 0.82} {'loss': 0.613, 'learning_rate': 1.338780279300415e-05, 'epoch': 0.82} {'loss': 0.5733, 'learning_rate': 1.3387486681302545e-05, 'epoch': 0.82} {'loss': 0.8089, 'learning_rate': 1.3387170565777115e-05, 'epoch': 0.82} {'loss': 0.504, 'learning_rate': 1.338685444642821e-05, 'epoch': 0.82} {'loss': 0.5226, 'learning_rate': 1.3386538323256193e-05, 'epoch': 0.82} {'loss': 0.3807, 'learning_rate': 1.3386222196261418e-05, 'epoch': 0.82} {'loss': 0.4566, 'learning_rate': 1.3385906065444244e-05, 'epoch': 0.82} {'loss': 0.5341, 'learning_rate': 1.3385589930805023e-05, 'epoch': 0.82} {'loss': 0.7197, 'learning_rate': 1.3385273792344114e-05, 'epoch': 0.82} {'loss': 0.5661, 'learning_rate': 1.3384957650061877e-05, 'epoch': 0.82} {'loss': 0.568, 'learning_rate': 1.3384641503958663e-05, 'epoch': 0.82} {'loss': 0.6077, 'learning_rate': 1.3384325354034835e-05, 'epoch': 0.82} {'loss': 0.5351, 'learning_rate': 1.3384009200290746e-05, 'epoch': 0.82} {'loss': 0.5905, 'learning_rate': 1.3383693042726755e-05, 'epoch': 0.82} {'loss': 0.5554, 'learning_rate': 1.3383376881343217e-05, 'epoch': 0.82} {'loss': 0.4892, 'learning_rate': 1.3383060716140493e-05, 'epoch': 0.82} {'loss': 0.5445, 'learning_rate': 1.3382744547118933e-05, 'epoch': 0.82} {'loss': 0.744, 'learning_rate': 1.33824283742789e-05, 'epoch': 0.82} {'loss': 0.4494, 'learning_rate': 1.3382112197620747e-05, 'epoch': 0.82} {'loss': 0.652, 'learning_rate': 1.3381796017144836e-05, 'epoch': 0.82} {'loss': 0.5908, 'learning_rate': 1.3381479832851518e-05, 'epoch': 0.82} {'loss': 0.4868, 'learning_rate': 1.3381163644741151e-05, 'epoch': 0.82} {'loss': 0.5752, 'learning_rate': 1.3380847452814094e-05, 'epoch': 0.82} {'loss': 0.4967, 'learning_rate': 1.3380531257070703e-05, 'epoch': 0.82} {'loss': 0.5658, 'learning_rate': 1.3380215057511337e-05, 'epoch': 0.82} {'loss': 0.5974, 'learning_rate': 1.3379898854136348e-05, 'epoch': 0.82} {'loss': 0.6292, 'learning_rate': 1.3379582646946098e-05, 'epoch': 0.82} {'loss': 0.6342, 'learning_rate': 1.337926643594094e-05, 'epoch': 0.82} {'loss': 0.4675, 'learning_rate': 1.3378950221121234e-05, 'epoch': 0.82} {'loss': 0.5954, 'learning_rate': 1.3378634002487337e-05, 'epoch': 0.82} {'loss': 0.5952, 'learning_rate': 1.3378317780039602e-05, 'epoch': 0.82} {'loss': 0.5046, 'learning_rate': 1.337800155377839e-05, 'epoch': 0.82} {'loss': 0.4766, 'learning_rate': 1.3377685323704057e-05, 'epoch': 0.82} {'loss': 0.6333, 'learning_rate': 1.337736908981696e-05, 'epoch': 0.82} {'loss': 0.6327, 'learning_rate': 1.3377052852117455e-05, 'epoch': 0.82} {'loss': 0.5736, 'learning_rate': 1.3376736610605898e-05, 'epoch': 0.82} {'loss': 0.766, 'learning_rate': 1.337642036528265e-05, 'epoch': 0.82} {'loss': 0.5843, 'learning_rate': 1.3376104116148063e-05, 'epoch': 0.82} {'loss': 0.5007, 'learning_rate': 1.3375787863202499e-05, 'epoch': 0.82} {'loss': 0.4781, 'learning_rate': 1.3375471606446308e-05, 'epoch': 0.82} {'loss': 0.5145, 'learning_rate': 1.3375155345879853e-05, 'epoch': 0.82} {'loss': 0.3442, 'learning_rate': 1.3374839081503492e-05, 'epoch': 0.82} {'loss': 0.5009, 'learning_rate': 1.337452281331758e-05, 'epoch': 0.82} {'loss': 0.4661, 'learning_rate': 1.3374206541322473e-05, 'epoch': 0.82} {'loss': 0.3644, 'learning_rate': 1.3373890265518525e-05, 'epoch': 0.82} {'loss': 0.5161, 'learning_rate': 1.33735739859061e-05, 'epoch': 0.82} {'loss': 0.5003, 'learning_rate': 1.3373257702485549e-05, 'epoch': 0.82} {'loss': 0.4115, 'learning_rate': 1.3372941415257232e-05, 'epoch': 0.82} {'loss': 0.6296, 'learning_rate': 1.3372625124221505e-05, 'epoch': 0.82} {'loss': 0.6922, 'learning_rate': 1.3372308829378728e-05, 'epoch': 0.82} {'loss': 0.5856, 'learning_rate': 1.3371992530729254e-05, 'epoch': 0.82} {'loss': 0.7098, 'learning_rate': 1.3371676228273442e-05, 'epoch': 0.82} {'loss': 0.4908, 'learning_rate': 1.3371359922011648e-05, 'epoch': 0.82} {'loss': 0.6106, 'learning_rate': 1.3371043611944232e-05, 'epoch': 0.82} {'loss': 0.6085, 'learning_rate': 1.3370727298071546e-05, 'epoch': 0.82} {'loss': 0.6629, 'learning_rate': 1.337041098039395e-05, 'epoch': 0.82} {'loss': 0.6364, 'learning_rate': 1.3370094658911805e-05, 'epoch': 0.82} {'loss': 0.434, 'learning_rate': 1.3369778333625463e-05, 'epoch': 0.82} {'loss': 0.6258, 'learning_rate': 1.3369462004535278e-05, 'epoch': 0.82} {'loss': 0.7145, 'learning_rate': 1.3369145671641613e-05, 'epoch': 0.82} {'loss': 0.4845, 'learning_rate': 1.3368829334944824e-05, 'epoch': 0.82} {'loss': 0.5759, 'learning_rate': 1.3368512994445266e-05, 'epoch': 0.82} {'loss': 0.5439, 'learning_rate': 1.3368196650143297e-05, 'epoch': 0.82} {'loss': 0.6359, 'learning_rate': 1.3367880302039277e-05, 'epoch': 0.82} {'loss': 0.5455, 'learning_rate': 1.3367563950133558e-05, 'epoch': 0.82} {'loss': 0.5839, 'learning_rate': 1.33672475944265e-05, 'epoch': 0.82} {'loss': 0.526, 'learning_rate': 1.3366931234918461e-05, 'epoch': 0.82} {'loss': 0.4533, 'learning_rate': 1.3366614871609795e-05, 'epoch': 0.82} {'loss': 0.4749, 'learning_rate': 1.3366298504500862e-05, 'epoch': 0.82} {'loss': 0.3449, 'learning_rate': 1.3365982133592023e-05, 'epoch': 0.82} {'loss': 0.5191, 'learning_rate': 1.3365665758883625e-05, 'epoch': 0.82} {'loss': 0.5017, 'learning_rate': 1.3365349380376032e-05, 'epoch': 0.82} {'loss': 0.4221, 'learning_rate': 1.3365032998069599e-05, 'epoch': 0.82} {'loss': 0.7046, 'learning_rate': 1.3364716611964684e-05, 'epoch': 0.82} {'loss': 0.5617, 'learning_rate': 1.3364400222061642e-05, 'epoch': 0.82} {'loss': 0.5559, 'learning_rate': 1.3364083828360833e-05, 'epoch': 0.82} {'loss': 0.566, 'learning_rate': 1.3363767430862611e-05, 'epoch': 0.82} {'loss': 0.7194, 'learning_rate': 1.3363451029567338e-05, 'epoch': 0.82} {'loss': 0.624, 'learning_rate': 1.3363134624475366e-05, 'epoch': 0.82} {'loss': 0.5266, 'learning_rate': 1.3362818215587057e-05, 'epoch': 0.82} {'loss': 0.5828, 'learning_rate': 1.3362501802902765e-05, 'epoch': 0.82} {'loss': 0.5732, 'learning_rate': 1.3362185386422847e-05, 'epoch': 0.82} {'loss': 0.6376, 'learning_rate': 1.3361868966147664e-05, 'epoch': 0.82} {'loss': 0.4839, 'learning_rate': 1.3361552542077569e-05, 'epoch': 0.82} {'loss': 0.7059, 'learning_rate': 1.3361236114212918e-05, 'epoch': 0.82} {'loss': 0.6019, 'learning_rate': 1.3360919682554072e-05, 'epoch': 0.82} {'loss': 0.4137, 'learning_rate': 1.3360603247101387e-05, 'epoch': 0.82} {'loss': 0.5225, 'learning_rate': 1.336028680785522e-05, 'epoch': 0.82} {'loss': 0.5227, 'learning_rate': 1.3359970364815927e-05, 'epoch': 0.82} {'loss': 0.5365, 'learning_rate': 1.3359653917983866e-05, 'epoch': 0.82} {'loss': 0.5893, 'learning_rate': 1.3359337467359398e-05, 'epoch': 0.82} {'loss': 0.4628, 'learning_rate': 1.3359021012942873e-05, 'epoch': 0.82} {'loss': 0.6257, 'learning_rate': 1.3358704554734656e-05, 'epoch': 0.82} {'loss': 0.6225, 'learning_rate': 1.3358388092735098e-05, 'epoch': 0.82} {'loss': 0.458, 'learning_rate': 1.3358071626944557e-05, 'epoch': 0.82} {'loss': 0.5815, 'learning_rate': 1.3357755157363395e-05, 'epoch': 0.82} {'loss': 0.6406, 'learning_rate': 1.3357438683991964e-05, 'epoch': 0.82} {'loss': 0.4405, 'learning_rate': 1.3357122206830622e-05, 'epoch': 0.82} {'loss': 0.5762, 'learning_rate': 1.3356805725879728e-05, 'epoch': 0.82} {'loss': 0.7272, 'learning_rate': 1.3356489241139641e-05, 'epoch': 0.82} {'loss': 0.7079, 'learning_rate': 1.3356172752610715e-05, 'epoch': 0.82} {'loss': 0.5855, 'learning_rate': 1.3355856260293308e-05, 'epoch': 0.82} {'loss': 0.5664, 'learning_rate': 1.3355539764187775e-05, 'epoch': 0.82} {'loss': 0.8196, 'learning_rate': 1.3355223264294476e-05, 'epoch': 0.82} {'loss': 0.4885, 'learning_rate': 1.335490676061377e-05, 'epoch': 0.82} {'loss': 0.5677, 'learning_rate': 1.3354590253146013e-05, 'epoch': 0.82} {'loss': 0.6073, 'learning_rate': 1.3354273741891562e-05, 'epoch': 0.82} {'loss': 0.62, 'learning_rate': 1.3353957226850772e-05, 'epoch': 0.82} {'loss': 0.7462, 'learning_rate': 1.3353640708024003e-05, 'epoch': 0.82} {'loss': 0.5803, 'learning_rate': 1.335332418541161e-05, 'epoch': 0.82} {'loss': 0.5744, 'learning_rate': 1.335300765901395e-05, 'epoch': 0.82} {'loss': 0.6973, 'learning_rate': 1.3352691128831386e-05, 'epoch': 0.82} {'loss': 0.5139, 'learning_rate': 1.3352374594864268e-05, 'epoch': 0.82} {'loss': 0.3934, 'learning_rate': 1.3352058057112957e-05, 'epoch': 0.82} {'loss': 0.6169, 'learning_rate': 1.3351741515577812e-05, 'epoch': 0.82} {'loss': 0.6411, 'learning_rate': 1.3351424970259186e-05, 'epoch': 0.82} {'loss': 0.3849, 'learning_rate': 1.3351108421157441e-05, 'epoch': 0.82} {'loss': 0.6377, 'learning_rate': 1.335079186827293e-05, 'epoch': 0.82} {'loss': 0.5134, 'learning_rate': 1.3350475311606015e-05, 'epoch': 0.82} {'loss': 0.464, 'learning_rate': 1.3350158751157047e-05, 'epoch': 0.82} {'loss': 0.6109, 'learning_rate': 1.3349842186926387e-05, 'epoch': 0.82} {'loss': 0.6253, 'learning_rate': 1.3349525618914394e-05, 'epoch': 0.82} {'loss': 0.579, 'learning_rate': 1.3349209047121423e-05, 'epoch': 0.82} {'loss': 0.6296, 'learning_rate': 1.334889247154783e-05, 'epoch': 0.82} {'loss': 0.4697, 'learning_rate': 1.3348575892193975e-05, 'epoch': 0.82} {'loss': 0.5081, 'learning_rate': 1.3348259309060217e-05, 'epoch': 0.82} {'loss': 0.5873, 'learning_rate': 1.3347942722146909e-05, 'epoch': 0.82} {'loss': 0.503, 'learning_rate': 1.334762613145441e-05, 'epoch': 0.82} {'loss': 0.6206, 'learning_rate': 1.3347309536983077e-05, 'epoch': 0.82} {'loss': 0.6016, 'learning_rate': 1.334699293873327e-05, 'epoch': 0.82} {'loss': 0.4676, 'learning_rate': 1.3346676336705344e-05, 'epoch': 0.82} {'loss': 0.4625, 'learning_rate': 1.3346359730899656e-05, 'epoch': 0.82} {'loss': 0.6191, 'learning_rate': 1.3346043121316568e-05, 'epoch': 0.82} {'loss': 0.6388, 'learning_rate': 1.3345726507956429e-05, 'epoch': 0.82} {'loss': 0.5779, 'learning_rate': 1.3345409890819601e-05, 'epoch': 0.82} {'loss': 0.4495, 'learning_rate': 1.3345093269906443e-05, 'epoch': 0.82} {'loss': 0.7872, 'learning_rate': 1.334477664521731e-05, 'epoch': 0.82} {'loss': 0.3817, 'learning_rate': 1.3344460016752561e-05, 'epoch': 0.82} {'loss': 0.6865, 'learning_rate': 1.3344143384512549e-05, 'epoch': 0.82} {'loss': 0.6314, 'learning_rate': 1.3343826748497639e-05, 'epoch': 0.82} {'loss': 0.5242, 'learning_rate': 1.3343510108708184e-05, 'epoch': 0.82} {'loss': 0.5948, 'learning_rate': 1.3343193465144542e-05, 'epoch': 0.82} {'loss': 0.5814, 'learning_rate': 1.3342876817807071e-05, 'epoch': 0.82} {'loss': 0.7244, 'learning_rate': 1.3342560166696129e-05, 'epoch': 0.82} {'loss': 0.3511, 'learning_rate': 1.3342243511812067e-05, 'epoch': 0.82} {'loss': 0.4668, 'learning_rate': 1.3341926853155252e-05, 'epoch': 0.82} {'loss': 0.6417, 'learning_rate': 1.3341610190726036e-05, 'epoch': 0.82} {'loss': 0.6011, 'learning_rate': 1.3341293524524774e-05, 'epoch': 0.82} {'loss': 0.6429, 'learning_rate': 1.3340976854551833e-05, 'epoch': 0.82} {'loss': 0.5983, 'learning_rate': 1.3340660180807561e-05, 'epoch': 0.82} {'loss': 0.4284, 'learning_rate': 1.334034350329232e-05, 'epoch': 0.82} {'loss': 0.4736, 'learning_rate': 1.3340026822006465e-05, 'epoch': 0.82} {'loss': 0.6634, 'learning_rate': 1.3339710136950355e-05, 'epoch': 0.82} {'loss': 0.552, 'learning_rate': 1.3339393448124347e-05, 'epoch': 0.82} {'loss': 0.5538, 'learning_rate': 1.33390767555288e-05, 'epoch': 0.82} {'loss': 0.528, 'learning_rate': 1.3338760059164073e-05, 'epoch': 0.82} {'loss': 0.6471, 'learning_rate': 1.3338443359030517e-05, 'epoch': 0.82} {'loss': 0.585, 'learning_rate': 1.3338126655128493e-05, 'epoch': 0.82} {'loss': 0.3917, 'learning_rate': 1.3337809947458362e-05, 'epoch': 0.82} {'loss': 0.5741, 'learning_rate': 1.3337493236020476e-05, 'epoch': 0.82} {'loss': 0.3566, 'learning_rate': 1.3337176520815197e-05, 'epoch': 0.82} {'loss': 0.6415, 'learning_rate': 1.3336859801842876e-05, 'epoch': 0.82} {'loss': 0.6326, 'learning_rate': 1.3336543079103876e-05, 'epoch': 0.82} {'loss': 0.5849, 'learning_rate': 1.3336226352598556e-05, 'epoch': 0.82} {'loss': 0.4775, 'learning_rate': 1.333590962232727e-05, 'epoch': 0.82} {'loss': 0.4669, 'learning_rate': 1.3335592888290373e-05, 'epoch': 0.82} {'loss': 0.4962, 'learning_rate': 1.333527615048823e-05, 'epoch': 0.82} {'loss': 0.5156, 'learning_rate': 1.3334959408921193e-05, 'epoch': 0.82} {'loss': 0.4998, 'learning_rate': 1.3334642663589624e-05, 'epoch': 0.82} {'loss': 0.5435, 'learning_rate': 1.3334325914493874e-05, 'epoch': 0.82} {'loss': 0.6287, 'learning_rate': 1.3334009161634304e-05, 'epoch': 0.82} {'loss': 0.6101, 'learning_rate': 1.3333692405011274e-05, 'epoch': 0.82} {'loss': 0.409, 'learning_rate': 1.3333375644625134e-05, 'epoch': 0.82} {'loss': 0.3428, 'learning_rate': 1.3333058880476252e-05, 'epoch': 0.82} {'loss': 0.558, 'learning_rate': 1.333274211256498e-05, 'epoch': 0.82} {'loss': 0.6076, 'learning_rate': 1.3332425340891675e-05, 'epoch': 0.82} {'loss': 0.5765, 'learning_rate': 1.3332108565456694e-05, 'epoch': 0.82} {'loss': 0.5108, 'learning_rate': 1.3331791786260397e-05, 'epoch': 0.82} {'loss': 0.507, 'learning_rate': 1.333147500330314e-05, 'epoch': 0.82} {'loss': 0.5528, 'learning_rate': 1.3331158216585283e-05, 'epoch': 0.82} {'loss': 0.6967, 'learning_rate': 1.333084142610718e-05, 'epoch': 0.82} {'loss': 0.4852, 'learning_rate': 1.3330524631869195e-05, 'epoch': 0.82} {'loss': 0.5264, 'learning_rate': 1.3330207833871675e-05, 'epoch': 0.82} {'loss': 0.4946, 'learning_rate': 1.3329891032114986e-05, 'epoch': 0.82} {'loss': 0.4571, 'learning_rate': 1.3329574226599485e-05, 'epoch': 0.82} {'loss': 0.6597, 'learning_rate': 1.3329257417325525e-05, 'epoch': 0.82} {'loss': 0.4822, 'learning_rate': 1.3328940604293467e-05, 'epoch': 0.82} {'loss': 0.3746, 'learning_rate': 1.3328623787503668e-05, 'epoch': 0.82} {'loss': 0.5266, 'learning_rate': 1.3328306966956484e-05, 'epoch': 0.82} {'loss': 0.5275, 'learning_rate': 1.3327990142652279e-05, 'epoch': 0.82} {'loss': 0.6206, 'learning_rate': 1.3327673314591403e-05, 'epoch': 0.82} {'loss': 0.6579, 'learning_rate': 1.3327356482774216e-05, 'epoch': 0.82} {'loss': 0.6546, 'learning_rate': 1.3327039647201078e-05, 'epoch': 0.82} {'loss': 0.5578, 'learning_rate': 1.3326722807872345e-05, 'epoch': 0.82} {'loss': 0.6198, 'learning_rate': 1.3326405964788374e-05, 'epoch': 0.82} {'loss': 0.4107, 'learning_rate': 1.3326089117949524e-05, 'epoch': 0.82} {'loss': 0.4752, 'learning_rate': 1.332577226735615e-05, 'epoch': 0.82} {'loss': 0.5211, 'learning_rate': 1.3325455413008611e-05, 'epoch': 0.82} {'loss': 0.5546, 'learning_rate': 1.3325138554907268e-05, 'epoch': 0.82} {'loss': 0.4947, 'learning_rate': 1.3324821693052475e-05, 'epoch': 0.82} {'loss': 0.4915, 'learning_rate': 1.3324504827444589e-05, 'epoch': 0.82} {'loss': 0.4499, 'learning_rate': 1.3324187958083972e-05, 'epoch': 0.82} {'loss': 0.7447, 'learning_rate': 1.3323871084970976e-05, 'epoch': 0.82} {'loss': 0.5647, 'learning_rate': 1.3323554208105964e-05, 'epoch': 0.82} {'loss': 0.5487, 'learning_rate': 1.332323732748929e-05, 'epoch': 0.82} {'loss': 0.4681, 'learning_rate': 1.3322920443121314e-05, 'epoch': 0.82} {'loss': 0.4667, 'learning_rate': 1.3322603555002394e-05, 'epoch': 0.82} {'loss': 0.4728, 'learning_rate': 1.3322286663132883e-05, 'epoch': 0.82} {'loss': 0.4772, 'learning_rate': 1.3321969767513143e-05, 'epoch': 0.82} {'loss': 0.5684, 'learning_rate': 1.3321652868143531e-05, 'epoch': 0.82} {'loss': 0.6915, 'learning_rate': 1.3321335965024404e-05, 'epoch': 0.82} {'loss': 0.4758, 'learning_rate': 1.3321019058156122e-05, 'epoch': 0.82} {'loss': 0.5088, 'learning_rate': 1.332070214753904e-05, 'epoch': 0.82} {'loss': 0.6603, 'learning_rate': 1.3320385233173516e-05, 'epoch': 0.82} {'loss': 0.6277, 'learning_rate': 1.332006831505991e-05, 'epoch': 0.82} {'loss': 0.5418, 'learning_rate': 1.331975139319858e-05, 'epoch': 0.82} {'loss': 0.5818, 'learning_rate': 1.3319434467589878e-05, 'epoch': 0.82} {'loss': 0.6329, 'learning_rate': 1.3319117538234165e-05, 'epoch': 0.82} {'loss': 0.7541, 'learning_rate': 1.3318800605131805e-05, 'epoch': 0.82} {'loss': 0.5383, 'learning_rate': 1.3318483668283147e-05, 'epoch': 0.82} {'loss': 0.6031, 'learning_rate': 1.331816672768855e-05, 'epoch': 0.82} {'loss': 0.6112, 'learning_rate': 1.3317849783348378e-05, 'epoch': 0.82} {'loss': 0.4154, 'learning_rate': 1.331753283526298e-05, 'epoch': 0.82} {'loss': 0.5413, 'learning_rate': 1.331721588343272e-05, 'epoch': 0.82} {'loss': 0.5255, 'learning_rate': 1.3316898927857955e-05, 'epoch': 0.82} {'loss': 0.4796, 'learning_rate': 1.3316581968539041e-05, 'epoch': 0.82} {'loss': 0.4813, 'learning_rate': 1.3316265005476336e-05, 'epoch': 0.82} {'loss': 0.5369, 'learning_rate': 1.3315948038670202e-05, 'epoch': 0.82} {'loss': 0.6661, 'learning_rate': 1.3315631068120988e-05, 'epoch': 0.82} {'loss': 0.6203, 'learning_rate': 1.3315314093829061e-05, 'epoch': 0.82} {'loss': 0.6183, 'learning_rate': 1.3314997115794773e-05, 'epoch': 0.82} {'loss': 0.5322, 'learning_rate': 1.3314680134018486e-05, 'epoch': 0.82} {'loss': 0.5804, 'learning_rate': 1.3314363148500554e-05, 'epoch': 0.82} {'loss': 0.6836, 'learning_rate': 1.3314046159241336e-05, 'epoch': 0.82} {'loss': 0.3996, 'learning_rate': 1.3313729166241189e-05, 'epoch': 0.82} {'loss': 0.5402, 'learning_rate': 1.3313412169500473e-05, 'epoch': 0.82} {'loss': 0.4076, 'learning_rate': 1.3313095169019544e-05, 'epoch': 0.82} {'loss': 0.6109, 'learning_rate': 1.3312778164798758e-05, 'epoch': 0.82} {'loss': 0.6206, 'learning_rate': 1.331246115683848e-05, 'epoch': 0.82} {'loss': 0.7137, 'learning_rate': 1.3312144145139061e-05, 'epoch': 0.82} {'loss': 0.5409, 'learning_rate': 1.3311827129700862e-05, 'epoch': 0.82} {'loss': 0.6116, 'learning_rate': 1.3311510110524242e-05, 'epoch': 0.82} {'loss': 0.6055, 'learning_rate': 1.3311193087609553e-05, 'epoch': 0.82} {'loss': 0.4492, 'learning_rate': 1.3310876060957159e-05, 'epoch': 0.82} {'loss': 0.7168, 'learning_rate': 1.3310559030567415e-05, 'epoch': 0.82} {'loss': 0.6101, 'learning_rate': 1.3310241996440678e-05, 'epoch': 0.82} {'loss': 0.5985, 'learning_rate': 1.330992495857731e-05, 'epoch': 0.82} {'loss': 0.4868, 'learning_rate': 1.3309607916977663e-05, 'epoch': 0.82} {'loss': 0.5348, 'learning_rate': 1.33092908716421e-05, 'epoch': 0.82} {'loss': 0.6519, 'learning_rate': 1.3308973822570977e-05, 'epoch': 0.82} {'loss': 0.7142, 'learning_rate': 1.330865676976465e-05, 'epoch': 0.82} {'loss': 0.5887, 'learning_rate': 1.330833971322348e-05, 'epoch': 0.82} {'loss': 0.5223, 'learning_rate': 1.3308022652947823e-05, 'epoch': 0.82} {'loss': 0.7406, 'learning_rate': 1.3307705588938037e-05, 'epoch': 0.82} {'loss': 0.3933, 'learning_rate': 1.3307388521194485e-05, 'epoch': 0.82} {'loss': 0.6305, 'learning_rate': 1.3307071449717517e-05, 'epoch': 0.82} {'loss': 0.4711, 'learning_rate': 1.3306754374507493e-05, 'epoch': 0.82} {'loss': 0.5019, 'learning_rate': 1.3306437295564774e-05, 'epoch': 0.82} {'loss': 0.6313, 'learning_rate': 1.3306120212889715e-05, 'epoch': 0.82} {'loss': 0.5787, 'learning_rate': 1.3305803126482672e-05, 'epoch': 0.82} {'loss': 0.5106, 'learning_rate': 1.330548603634401e-05, 'epoch': 0.82} {'loss': 0.451, 'learning_rate': 1.330516894247408e-05, 'epoch': 0.82} {'loss': 0.5606, 'learning_rate': 1.3304851844873245e-05, 'epoch': 0.82} {'loss': 0.5951, 'learning_rate': 1.3304534743541861e-05, 'epoch': 0.82} {'loss': 0.7037, 'learning_rate': 1.3304217638480283e-05, 'epoch': 0.82} {'loss': 0.6236, 'learning_rate': 1.3303900529688875e-05, 'epoch': 0.82} {'loss': 0.6529, 'learning_rate': 1.330358341716799e-05, 'epoch': 0.82} {'loss': 0.5776, 'learning_rate': 1.3303266300917988e-05, 'epoch': 0.82} {'loss': 0.5625, 'learning_rate': 1.3302949180939226e-05, 'epoch': 0.82} {'loss': 0.4804, 'learning_rate': 1.3302632057232063e-05, 'epoch': 0.82} {'loss': 0.5095, 'learning_rate': 1.3302314929796856e-05, 'epoch': 0.82} {'loss': 0.7001, 'learning_rate': 1.3301997798633963e-05, 'epoch': 0.82} {'loss': 0.5711, 'learning_rate': 1.3301680663743744e-05, 'epoch': 0.82} {'loss': 0.4312, 'learning_rate': 1.3301363525126554e-05, 'epoch': 0.82} {'loss': 0.503, 'learning_rate': 1.3301046382782752e-05, 'epoch': 0.82} {'loss': 0.4784, 'learning_rate': 1.3300729236712697e-05, 'epoch': 0.82} {'loss': 0.5788, 'learning_rate': 1.3300412086916746e-05, 'epoch': 0.82} {'loss': 0.5589, 'learning_rate': 1.3300094933395258e-05, 'epoch': 0.82} {'loss': 0.7355, 'learning_rate': 1.3299777776148588e-05, 'epoch': 0.82} {'loss': 0.6158, 'learning_rate': 1.3299460615177098e-05, 'epoch': 0.82} {'loss': 0.5902, 'learning_rate': 1.3299143450481144e-05, 'epoch': 0.82} {'loss': 0.5242, 'learning_rate': 1.3298826282061089e-05, 'epoch': 0.82} {'loss': 0.4578, 'learning_rate': 1.3298509109917281e-05, 'epoch': 0.82} {'loss': 0.6198, 'learning_rate': 1.3298191934050087e-05, 'epoch': 0.82} {'loss': 0.5266, 'learning_rate': 1.3297874754459858e-05, 'epoch': 0.82} {'loss': 0.636, 'learning_rate': 1.3297557571146956e-05, 'epoch': 0.82} {'loss': 0.5802, 'learning_rate': 1.329724038411174e-05, 'epoch': 0.82} {'loss': 0.4618, 'learning_rate': 1.3296923193354563e-05, 'epoch': 0.82} {'loss': 0.7287, 'learning_rate': 1.329660599887579e-05, 'epoch': 0.82} {'loss': 0.6425, 'learning_rate': 1.3296288800675777e-05, 'epoch': 0.82} {'loss': 0.6414, 'learning_rate': 1.3295971598754878e-05, 'epoch': 0.82} {'loss': 0.5287, 'learning_rate': 1.3295654393113457e-05, 'epoch': 0.82} {'loss': 0.5801, 'learning_rate': 1.3295337183751866e-05, 'epoch': 0.82} {'loss': 0.5384, 'learning_rate': 1.3295019970670468e-05, 'epoch': 0.82} {'loss': 0.5792, 'learning_rate': 1.3294702753869617e-05, 'epoch': 0.82} {'loss': 0.5534, 'learning_rate': 1.3294385533349674e-05, 'epoch': 0.82} {'loss': 0.5201, 'learning_rate': 1.3294068309110997e-05, 'epoch': 0.82} {'loss': 0.7361, 'learning_rate': 1.3293751081153943e-05, 'epoch': 0.82} {'loss': 0.399, 'learning_rate': 1.3293433849478867e-05, 'epoch': 0.82} {'loss': 0.5835, 'learning_rate': 1.3293116614086134e-05, 'epoch': 0.82} {'loss': 0.6559, 'learning_rate': 1.3292799374976097e-05, 'epoch': 0.82} {'loss': 0.6378, 'learning_rate': 1.3292482132149118e-05, 'epoch': 0.82} {'loss': 0.5698, 'learning_rate': 1.329216488560555e-05, 'epoch': 0.82} {'loss': 0.4296, 'learning_rate': 1.3291847635345757e-05, 'epoch': 0.82} {'loss': 0.5755, 'learning_rate': 1.3291530381370093e-05, 'epoch': 0.82} {'loss': 0.671, 'learning_rate': 1.3291213123678917e-05, 'epoch': 0.82} {'loss': 0.6072, 'learning_rate': 1.3290895862272586e-05, 'epoch': 0.82} {'loss': 0.6556, 'learning_rate': 1.329057859715146e-05, 'epoch': 0.82} {'loss': 0.5029, 'learning_rate': 1.3290261328315897e-05, 'epoch': 0.82} {'loss': 0.5988, 'learning_rate': 1.3289944055766252e-05, 'epoch': 0.82} {'loss': 0.5824, 'learning_rate': 1.3289626779502888e-05, 'epoch': 0.82} {'loss': 0.4779, 'learning_rate': 1.3289309499526159e-05, 'epoch': 0.82} {'loss': 0.5842, 'learning_rate': 1.3288992215836428e-05, 'epoch': 0.82} {'loss': 0.6683, 'learning_rate': 1.328867492843405e-05, 'epoch': 0.82} {'loss': 0.4581, 'learning_rate': 1.328835763731938e-05, 'epoch': 0.82} {'loss': 0.4919, 'learning_rate': 1.3288040342492783e-05, 'epoch': 0.82} {'loss': 0.5331, 'learning_rate': 1.3287723043954613e-05, 'epoch': 0.82} {'loss': 0.6317, 'learning_rate': 1.328740574170523e-05, 'epoch': 0.82} {'loss': 0.6864, 'learning_rate': 1.328708843574499e-05, 'epoch': 0.82} {'loss': 0.7165, 'learning_rate': 1.3286771126074251e-05, 'epoch': 0.82} {'loss': 0.5773, 'learning_rate': 1.3286453812693375e-05, 'epoch': 0.82} {'loss': 0.5826, 'learning_rate': 1.3286136495602713e-05, 'epoch': 0.82} {'loss': 0.6443, 'learning_rate': 1.3285819174802633e-05, 'epoch': 0.82} {'loss': 0.4832, 'learning_rate': 1.3285501850293483e-05, 'epoch': 0.82} {'loss': 0.5351, 'learning_rate': 1.3285184522075629e-05, 'epoch': 0.82} {'loss': 0.5899, 'learning_rate': 1.3284867190149427e-05, 'epoch': 0.82} {'loss': 0.4066, 'learning_rate': 1.3284549854515232e-05, 'epoch': 0.82} {'loss': 0.5356, 'learning_rate': 1.3284232515173407e-05, 'epoch': 0.82} {'loss': 0.5969, 'learning_rate': 1.3283915172124306e-05, 'epoch': 0.82} {'loss': 0.5743, 'learning_rate': 1.328359782536829e-05, 'epoch': 0.82} {'loss': 0.5054, 'learning_rate': 1.328328047490572e-05, 'epoch': 0.82} {'loss': 0.5973, 'learning_rate': 1.3282963120736949e-05, 'epoch': 0.82} {'loss': 0.6277, 'learning_rate': 1.3282645762862333e-05, 'epoch': 0.82} {'loss': 0.4555, 'learning_rate': 1.3282328401282238e-05, 'epoch': 0.82} {'loss': 0.5182, 'learning_rate': 1.3282011035997017e-05, 'epoch': 0.82} {'loss': 0.5489, 'learning_rate': 1.3281693667007032e-05, 'epoch': 0.82} {'loss': 0.438, 'learning_rate': 1.3281376294312633e-05, 'epoch': 0.82} {'loss': 0.5121, 'learning_rate': 1.328105891791419e-05, 'epoch': 0.82} {'loss': 0.4919, 'learning_rate': 1.3280741537812052e-05, 'epoch': 0.82} {'loss': 0.4793, 'learning_rate': 1.3280424154006582e-05, 'epoch': 0.82} {'loss': 0.5001, 'learning_rate': 1.3280106766498137e-05, 'epoch': 0.82} {'loss': 0.5581, 'learning_rate': 1.3279789375287078e-05, 'epoch': 0.82} {'loss': 0.5584, 'learning_rate': 1.3279471980373758e-05, 'epoch': 0.82} {'loss': 0.6302, 'learning_rate': 1.3279154581758536e-05, 'epoch': 0.83} {'loss': 0.4929, 'learning_rate': 1.3278837179441772e-05, 'epoch': 0.83} {'loss': 0.6979, 'learning_rate': 1.3278519773423826e-05, 'epoch': 0.83} {'loss': 0.4169, 'learning_rate': 1.3278202363705055e-05, 'epoch': 0.83} {'loss': 0.6337, 'learning_rate': 1.3277884950285818e-05, 'epoch': 0.83} {'loss': 0.4942, 'learning_rate': 1.3277567533166469e-05, 'epoch': 0.83} {'loss': 0.466, 'learning_rate': 1.3277250112347371e-05, 'epoch': 0.83} {'loss': 0.53, 'learning_rate': 1.327693268782888e-05, 'epoch': 0.83} {'loss': 0.5216, 'learning_rate': 1.3276615259611357e-05, 'epoch': 0.83} {'loss': 0.6143, 'learning_rate': 1.3276297827695157e-05, 'epoch': 0.83} {'loss': 0.7223, 'learning_rate': 1.3275980392080641e-05, 'epoch': 0.83} {'loss': 0.6665, 'learning_rate': 1.3275662952768167e-05, 'epoch': 0.83} {'loss': 0.5198, 'learning_rate': 1.3275345509758092e-05, 'epoch': 0.83} {'loss': 0.5153, 'learning_rate': 1.327502806305077e-05, 'epoch': 0.83} {'loss': 0.5509, 'learning_rate': 1.3274710612646568e-05, 'epoch': 0.83} {'loss': 0.5271, 'learning_rate': 1.327439315854584e-05, 'epoch': 0.83} {'loss': 0.6244, 'learning_rate': 1.3274075700748945e-05, 'epoch': 0.83} {'loss': 0.5687, 'learning_rate': 1.327375823925624e-05, 'epoch': 0.83} {'loss': 0.5404, 'learning_rate': 1.3273440774068088e-05, 'epoch': 0.83} {'loss': 0.5746, 'learning_rate': 1.3273123305184839e-05, 'epoch': 0.83} {'loss': 0.599, 'learning_rate': 1.327280583260686e-05, 'epoch': 0.83} {'loss': 0.4252, 'learning_rate': 1.3272488356334504e-05, 'epoch': 0.83} {'loss': 0.493, 'learning_rate': 1.3272170876368129e-05, 'epoch': 0.83} {'loss': 0.5229, 'learning_rate': 1.3271853392708099e-05, 'epoch': 0.83} {'loss': 0.5538, 'learning_rate': 1.3271535905354766e-05, 'epoch': 0.83} {'loss': 0.5687, 'learning_rate': 1.3271218414308494e-05, 'epoch': 0.83} {'loss': 0.4528, 'learning_rate': 1.3270900919569635e-05, 'epoch': 0.83} {'loss': 0.5935, 'learning_rate': 1.3270583421138552e-05, 'epoch': 0.83} {'loss': 0.6177, 'learning_rate': 1.3270265919015603e-05, 'epoch': 0.83} {'loss': 0.4144, 'learning_rate': 1.3269948413201147e-05, 'epoch': 0.83} {'loss': 0.6186, 'learning_rate': 1.3269630903695538e-05, 'epoch': 0.83} {'loss': 0.58, 'learning_rate': 1.3269313390499139e-05, 'epoch': 0.83} {'loss': 0.68, 'learning_rate': 1.3268995873612305e-05, 'epoch': 0.83} {'loss': 0.5008, 'learning_rate': 1.3268678353035398e-05, 'epoch': 0.83} {'loss': 0.5573, 'learning_rate': 1.3268360828768776e-05, 'epoch': 0.83} {'loss': 0.5092, 'learning_rate': 1.3268043300812794e-05, 'epoch': 0.83} {'loss': 0.7038, 'learning_rate': 1.3267725769167812e-05, 'epoch': 0.83} {'loss': 0.6014, 'learning_rate': 1.3267408233834194e-05, 'epoch': 0.83} {'loss': 0.6587, 'learning_rate': 1.326709069481229e-05, 'epoch': 0.83} {'loss': 0.5382, 'learning_rate': 1.3266773152102461e-05, 'epoch': 0.83} {'loss': 0.5305, 'learning_rate': 1.3266455605705066e-05, 'epoch': 0.83} {'loss': 0.7026, 'learning_rate': 1.3266138055620465e-05, 'epoch': 0.83} {'loss': 0.5081, 'learning_rate': 1.3265820501849014e-05, 'epoch': 0.83} {'loss': 0.5457, 'learning_rate': 1.326550294439107e-05, 'epoch': 0.83} {'loss': 0.663, 'learning_rate': 1.3265185383247e-05, 'epoch': 0.83} {'loss': 0.5305, 'learning_rate': 1.3264867818417152e-05, 'epoch': 0.83} {'loss': 0.7405, 'learning_rate': 1.3264550249901892e-05, 'epoch': 0.83} {'loss': 0.6361, 'learning_rate': 1.3264232677701578e-05, 'epoch': 0.83} {'loss': 0.5555, 'learning_rate': 1.3263915101816562e-05, 'epoch': 0.83} {'loss': 0.6306, 'learning_rate': 1.326359752224721e-05, 'epoch': 0.83} {'loss': 0.5181, 'learning_rate': 1.3263279938993874e-05, 'epoch': 0.83} {'loss': 0.5388, 'learning_rate': 1.3262962352056914e-05, 'epoch': 0.83} {'loss': 0.5111, 'learning_rate': 1.3262644761436691e-05, 'epoch': 0.83} {'loss': 0.5315, 'learning_rate': 1.3262327167133564e-05, 'epoch': 0.83} {'loss': 0.5224, 'learning_rate': 1.3262009569147889e-05, 'epoch': 0.83} {'loss': 0.4775, 'learning_rate': 1.3261691967480025e-05, 'epoch': 0.83} {'loss': 0.5635, 'learning_rate': 1.3261374362130334e-05, 'epoch': 0.83} {'loss': 0.6037, 'learning_rate': 1.3261056753099169e-05, 'epoch': 0.83} {'loss': 0.5438, 'learning_rate': 1.3260739140386892e-05, 'epoch': 0.83} {'loss': 0.6559, 'learning_rate': 1.3260421523993858e-05, 'epoch': 0.83} {'loss': 0.6218, 'learning_rate': 1.3260103903920432e-05, 'epoch': 0.83} {'loss': 0.5743, 'learning_rate': 1.3259786280166969e-05, 'epoch': 0.83} {'loss': 0.751, 'learning_rate': 1.3259468652733825e-05, 'epoch': 0.83} {'loss': 0.5185, 'learning_rate': 1.3259151021621359e-05, 'epoch': 0.83} {'loss': 0.5459, 'learning_rate': 1.3258833386829935e-05, 'epoch': 0.83} {'loss': 0.5931, 'learning_rate': 1.3258515748359904e-05, 'epoch': 0.83} {'loss': 0.5632, 'learning_rate': 1.325819810621163e-05, 'epoch': 0.83} {'loss': 0.5267, 'learning_rate': 1.325788046038547e-05, 'epoch': 0.83} {'loss': 0.5591, 'learning_rate': 1.3257562810881784e-05, 'epoch': 0.83} {'loss': 0.606, 'learning_rate': 1.3257245157700927e-05, 'epoch': 0.83} {'loss': 0.5575, 'learning_rate': 1.3256927500843259e-05, 'epoch': 0.83} {'loss': 0.4999, 'learning_rate': 1.3256609840309141e-05, 'epoch': 0.83} {'loss': 0.6648, 'learning_rate': 1.3256292176098928e-05, 'epoch': 0.83} {'loss': 0.4041, 'learning_rate': 1.325597450821298e-05, 'epoch': 0.83} {'loss': 0.6305, 'learning_rate': 1.3255656836651661e-05, 'epoch': 0.83} {'loss': 0.555, 'learning_rate': 1.325533916141532e-05, 'epoch': 0.83} {'loss': 0.2898, 'learning_rate': 1.3255021482504323e-05, 'epoch': 0.83} {'loss': 0.6175, 'learning_rate': 1.3254703799919022e-05, 'epoch': 0.83} {'loss': 0.5983, 'learning_rate': 1.3254386113659782e-05, 'epoch': 0.83} {'loss': 0.4996, 'learning_rate': 1.3254068423726956e-05, 'epoch': 0.83} {'loss': 0.5093, 'learning_rate': 1.325375073012091e-05, 'epoch': 0.83} {'loss': 0.6926, 'learning_rate': 1.3253433032841994e-05, 'epoch': 0.83} {'loss': 0.6035, 'learning_rate': 1.3253115331890571e-05, 'epoch': 0.83} {'loss': 0.6085, 'learning_rate': 1.3252797627267003e-05, 'epoch': 0.83} {'loss': 0.4451, 'learning_rate': 1.3252479918971642e-05, 'epoch': 0.83} {'loss': 0.4787, 'learning_rate': 1.3252162207004848e-05, 'epoch': 0.83} {'loss': 0.5305, 'learning_rate': 1.3251844491366985e-05, 'epoch': 0.83} {'loss': 0.526, 'learning_rate': 1.325152677205841e-05, 'epoch': 0.83} {'loss': 0.6127, 'learning_rate': 1.3251209049079475e-05, 'epoch': 0.83} {'loss': 0.5712, 'learning_rate': 1.3250891322430546e-05, 'epoch': 0.83} {'loss': 0.6538, 'learning_rate': 1.3250573592111974e-05, 'epoch': 0.83} {'loss': 0.4787, 'learning_rate': 1.3250255858124128e-05, 'epoch': 0.83} {'loss': 0.7037, 'learning_rate': 1.3249938120467359e-05, 'epoch': 0.83} {'loss': 0.5941, 'learning_rate': 1.3249620379142026e-05, 'epoch': 0.83} {'loss': 0.6242, 'learning_rate': 1.3249302634148491e-05, 'epoch': 0.83} {'loss': 0.4832, 'learning_rate': 1.324898488548711e-05, 'epoch': 0.83} {'loss': 0.5654, 'learning_rate': 1.3248667133158247e-05, 'epoch': 0.83} {'loss': 0.5913, 'learning_rate': 1.3248349377162256e-05, 'epoch': 0.83} {'loss': 0.5363, 'learning_rate': 1.3248031617499493e-05, 'epoch': 0.83} {'loss': 0.6498, 'learning_rate': 1.3247713854170324e-05, 'epoch': 0.83} {'loss': 0.4767, 'learning_rate': 1.32473960871751e-05, 'epoch': 0.83} {'loss': 0.5298, 'learning_rate': 1.3247078316514183e-05, 'epoch': 0.83} {'loss': 0.6143, 'learning_rate': 1.3246760542187933e-05, 'epoch': 0.83} {'loss': 0.562, 'learning_rate': 1.324644276419671e-05, 'epoch': 0.83} {'loss': 0.6727, 'learning_rate': 1.3246124982540867e-05, 'epoch': 0.83} {'loss': 0.6982, 'learning_rate': 1.3245807197220768e-05, 'epoch': 0.83} {'loss': 0.6946, 'learning_rate': 1.3245489408236769e-05, 'epoch': 0.83} {'loss': 0.4975, 'learning_rate': 1.324517161558923e-05, 'epoch': 0.83} {'loss': 0.5727, 'learning_rate': 1.3244853819278509e-05, 'epoch': 0.83} {'loss': 0.5285, 'learning_rate': 1.3244536019304967e-05, 'epoch': 0.83} {'loss': 0.4711, 'learning_rate': 1.3244218215668963e-05, 'epoch': 0.83} {'loss': 0.7319, 'learning_rate': 1.3243900408370849e-05, 'epoch': 0.83} {'loss': 0.7356, 'learning_rate': 1.3243582597410988e-05, 'epoch': 0.83} {'loss': 0.5775, 'learning_rate': 1.3243264782789742e-05, 'epoch': 0.83} {'loss': 0.4669, 'learning_rate': 1.3242946964507463e-05, 'epoch': 0.83} {'loss': 0.4679, 'learning_rate': 1.3242629142564515e-05, 'epoch': 0.83} {'loss': 0.5071, 'learning_rate': 1.3242311316961259e-05, 'epoch': 0.83} {'loss': 0.548, 'learning_rate': 1.3241993487698046e-05, 'epoch': 0.83} {'loss': 0.6488, 'learning_rate': 1.324167565477524e-05, 'epoch': 0.83} {'loss': 0.4343, 'learning_rate': 1.3241357818193199e-05, 'epoch': 0.83} {'loss': 0.6608, 'learning_rate': 1.3241039977952281e-05, 'epoch': 0.83} {'loss': 0.5679, 'learning_rate': 1.3240722134052844e-05, 'epoch': 0.83} {'loss': 0.4874, 'learning_rate': 1.3240404286495249e-05, 'epoch': 0.83} {'loss': 0.7689, 'learning_rate': 1.3240086435279858e-05, 'epoch': 0.83} {'loss': 0.5533, 'learning_rate': 1.323976858040702e-05, 'epoch': 0.83} {'loss': 0.6701, 'learning_rate': 1.3239450721877101e-05, 'epoch': 0.83} {'loss': 0.6827, 'learning_rate': 1.3239132859690458e-05, 'epoch': 0.83} {'loss': 0.7295, 'learning_rate': 1.3238814993847448e-05, 'epoch': 0.83} {'loss': 0.5153, 'learning_rate': 1.3238497124348435e-05, 'epoch': 0.83} {'loss': 0.3443, 'learning_rate': 1.3238179251193772e-05, 'epoch': 0.83} {'loss': 0.6324, 'learning_rate': 1.3237861374383822e-05, 'epoch': 0.83} {'loss': 0.6259, 'learning_rate': 1.3237543493918943e-05, 'epoch': 0.83} {'loss': 0.4015, 'learning_rate': 1.323722560979949e-05, 'epoch': 0.83} {'loss': 0.5934, 'learning_rate': 1.3236907722025829e-05, 'epoch': 0.83} {'loss': 0.4974, 'learning_rate': 1.3236589830598312e-05, 'epoch': 0.83} {'loss': 0.5186, 'learning_rate': 1.32362719355173e-05, 'epoch': 0.83} {'loss': 0.622, 'learning_rate': 1.3235954036783157e-05, 'epoch': 0.83} {'loss': 0.509, 'learning_rate': 1.3235636134396232e-05, 'epoch': 0.83} {'loss': 0.5777, 'learning_rate': 1.323531822835689e-05, 'epoch': 0.83} {'loss': 0.5818, 'learning_rate': 1.3235000318665492e-05, 'epoch': 0.83} {'loss': 0.6752, 'learning_rate': 1.323468240532239e-05, 'epoch': 0.83} {'loss': 0.5386, 'learning_rate': 1.3234364488327948e-05, 'epoch': 0.83} {'loss': 0.6348, 'learning_rate': 1.3234046567682521e-05, 'epoch': 0.83} {'loss': 0.6131, 'learning_rate': 1.3233728643386474e-05, 'epoch': 0.83} {'loss': 0.5077, 'learning_rate': 1.323341071544016e-05, 'epoch': 0.83} {'loss': 0.4819, 'learning_rate': 1.3233092783843944e-05, 'epoch': 0.83} {'loss': 0.4202, 'learning_rate': 1.3232774848598178e-05, 'epoch': 0.83} {'loss': 0.5214, 'learning_rate': 1.3232456909703226e-05, 'epoch': 0.83} {'loss': 0.563, 'learning_rate': 1.3232138967159443e-05, 'epoch': 0.83} {'loss': 0.4951, 'learning_rate': 1.3231821020967191e-05, 'epoch': 0.83} {'loss': 0.5258, 'learning_rate': 1.3231503071126825e-05, 'epoch': 0.83} {'loss': 0.7106, 'learning_rate': 1.323118511763871e-05, 'epoch': 0.83} {'loss': 0.7368, 'learning_rate': 1.3230867160503198e-05, 'epoch': 0.83} {'loss': 0.5231, 'learning_rate': 1.3230549199720652e-05, 'epoch': 0.83} {'loss': 0.6149, 'learning_rate': 1.3230231235291433e-05, 'epoch': 0.83} {'loss': 0.6303, 'learning_rate': 1.3229913267215895e-05, 'epoch': 0.83} {'loss': 0.3913, 'learning_rate': 1.32295952954944e-05, 'epoch': 0.83} {'loss': 0.5402, 'learning_rate': 1.3229277320127304e-05, 'epoch': 0.83} {'loss': 0.5668, 'learning_rate': 1.322895934111497e-05, 'epoch': 0.83} {'loss': 0.5662, 'learning_rate': 1.3228641358457755e-05, 'epoch': 0.83} {'loss': 0.6339, 'learning_rate': 1.322832337215602e-05, 'epoch': 0.83} {'loss': 0.629, 'learning_rate': 1.3228005382210119e-05, 'epoch': 0.83} {'loss': 0.4497, 'learning_rate': 1.3227687388620414e-05, 'epoch': 0.83} {'loss': 0.5658, 'learning_rate': 1.3227369391387264e-05, 'epoch': 0.83} {'loss': 0.5628, 'learning_rate': 1.3227051390511027e-05, 'epoch': 0.83} {'loss': 0.5531, 'learning_rate': 1.322673338599206e-05, 'epoch': 0.83} {'loss': 0.6391, 'learning_rate': 1.322641537783073e-05, 'epoch': 0.83} {'loss': 0.4224, 'learning_rate': 1.3226097366027389e-05, 'epoch': 0.83} {'loss': 0.4899, 'learning_rate': 1.3225779350582396e-05, 'epoch': 0.83} {'loss': 0.5159, 'learning_rate': 1.3225461331496113e-05, 'epoch': 0.83} {'loss': 0.5366, 'learning_rate': 1.3225143308768896e-05, 'epoch': 0.83} {'loss': 0.5822, 'learning_rate': 1.3224825282401106e-05, 'epoch': 0.83} {'loss': 0.7123, 'learning_rate': 1.3224507252393102e-05, 'epoch': 0.83} {'loss': 0.588, 'learning_rate': 1.3224189218745243e-05, 'epoch': 0.83} {'loss': 0.5027, 'learning_rate': 1.3223871181457887e-05, 'epoch': 0.83} {'loss': 0.648, 'learning_rate': 1.3223553140531393e-05, 'epoch': 0.83} {'loss': 0.5387, 'learning_rate': 1.322323509596612e-05, 'epoch': 0.83} {'loss': 0.5398, 'learning_rate': 1.322291704776243e-05, 'epoch': 0.83} {'loss': 0.4528, 'learning_rate': 1.3222598995920677e-05, 'epoch': 0.83} {'loss': 0.5986, 'learning_rate': 1.3222280940441224e-05, 'epoch': 0.83} {'loss': 0.4124, 'learning_rate': 1.3221962881324426e-05, 'epoch': 0.83} {'loss': 0.5165, 'learning_rate': 1.3221644818570647e-05, 'epoch': 0.83} {'loss': 0.5486, 'learning_rate': 1.322132675218024e-05, 'epoch': 0.83} {'loss': 0.6342, 'learning_rate': 1.3221008682153574e-05, 'epoch': 0.83} {'loss': 0.5666, 'learning_rate': 1.3220690608490996e-05, 'epoch': 0.83} {'loss': 0.6274, 'learning_rate': 1.3220372531192874e-05, 'epoch': 0.83} {'loss': 0.6122, 'learning_rate': 1.3220054450259565e-05, 'epoch': 0.83} {'loss': 0.5013, 'learning_rate': 1.3219736365691425e-05, 'epoch': 0.83} {'loss': 0.5751, 'learning_rate': 1.3219418277488814e-05, 'epoch': 0.83} {'loss': 0.5562, 'learning_rate': 1.3219100185652094e-05, 'epoch': 0.83} {'loss': 0.6808, 'learning_rate': 1.321878209018162e-05, 'epoch': 0.83} {'loss': 0.6155, 'learning_rate': 1.3218463991077752e-05, 'epoch': 0.83} {'loss': 0.6206, 'learning_rate': 1.321814588834085e-05, 'epoch': 0.83} {'loss': 0.4437, 'learning_rate': 1.3217827781971276e-05, 'epoch': 0.83} {'loss': 0.6473, 'learning_rate': 1.3217509671969384e-05, 'epoch': 0.83} {'loss': 0.7821, 'learning_rate': 1.3217191558335538e-05, 'epoch': 0.83} {'loss': 0.4557, 'learning_rate': 1.3216873441070095e-05, 'epoch': 0.83} {'loss': 0.5942, 'learning_rate': 1.3216555320173413e-05, 'epoch': 0.83} {'loss': 0.457, 'learning_rate': 1.3216237195645851e-05, 'epoch': 0.83} {'loss': 0.5903, 'learning_rate': 1.3215919067487769e-05, 'epoch': 0.83} {'loss': 0.4504, 'learning_rate': 1.3215600935699524e-05, 'epoch': 0.83} {'loss': 0.6293, 'learning_rate': 1.3215282800281476e-05, 'epoch': 0.83} {'loss': 0.5726, 'learning_rate': 1.321496466123399e-05, 'epoch': 0.83} {'loss': 0.5298, 'learning_rate': 1.3214646518557417e-05, 'epoch': 0.83} {'loss': 0.8342, 'learning_rate': 1.3214328372252122e-05, 'epoch': 0.83} {'loss': 0.5133, 'learning_rate': 1.3214010222318459e-05, 'epoch': 0.83} {'loss': 0.4756, 'learning_rate': 1.321369206875679e-05, 'epoch': 0.83} {'loss': 0.6085, 'learning_rate': 1.3213373911567473e-05, 'epoch': 0.83} {'loss': 0.3732, 'learning_rate': 1.3213055750750869e-05, 'epoch': 0.83} {'loss': 0.4258, 'learning_rate': 1.3212737586307335e-05, 'epoch': 0.83} {'loss': 0.5404, 'learning_rate': 1.3212419418237237e-05, 'epoch': 0.83} {'loss': 0.5249, 'learning_rate': 1.3212101246540923e-05, 'epoch': 0.83} {'loss': 0.6328, 'learning_rate': 1.3211783071218759e-05, 'epoch': 0.83} {'loss': 0.5916, 'learning_rate': 1.32114648922711e-05, 'epoch': 0.83} {'loss': 0.478, 'learning_rate': 1.321114670969831e-05, 'epoch': 0.83} {'loss': 0.6416, 'learning_rate': 1.3210828523500745e-05, 'epoch': 0.83} {'loss': 0.3498, 'learning_rate': 1.3210510333678766e-05, 'epoch': 0.83} {'loss': 0.5365, 'learning_rate': 1.321019214023273e-05, 'epoch': 0.83} {'loss': 0.6623, 'learning_rate': 1.3209873943163e-05, 'epoch': 0.83} {'loss': 0.6856, 'learning_rate': 1.320955574246993e-05, 'epoch': 0.83} {'loss': 0.3676, 'learning_rate': 1.3209237538153882e-05, 'epoch': 0.83} {'loss': 0.4848, 'learning_rate': 1.3208919330215217e-05, 'epoch': 0.83} {'loss': 0.5016, 'learning_rate': 1.3208601118654292e-05, 'epoch': 0.83} {'loss': 0.6895, 'learning_rate': 1.3208282903471468e-05, 'epoch': 0.83} {'loss': 0.6458, 'learning_rate': 1.32079646846671e-05, 'epoch': 0.83} {'loss': 0.4399, 'learning_rate': 1.3207646462241552e-05, 'epoch': 0.83} {'loss': 0.7094, 'learning_rate': 1.3207328236195178e-05, 'epoch': 0.83} {'loss': 0.4806, 'learning_rate': 1.3207010006528342e-05, 'epoch': 0.83} {'loss': 0.5177, 'learning_rate': 1.3206691773241403e-05, 'epoch': 0.83} {'loss': 0.5248, 'learning_rate': 1.3206373536334715e-05, 'epoch': 0.83} {'loss': 0.5155, 'learning_rate': 1.3206055295808644e-05, 'epoch': 0.83} {'loss': 0.4306, 'learning_rate': 1.3205737051663547e-05, 'epoch': 0.83} {'loss': 0.4716, 'learning_rate': 1.3205418803899781e-05, 'epoch': 0.83} {'loss': 0.7274, 'learning_rate': 1.3205100552517706e-05, 'epoch': 0.83} {'loss': 0.5682, 'learning_rate': 1.3204782297517682e-05, 'epoch': 0.83} {'loss': 0.5205, 'learning_rate': 1.320446403890007e-05, 'epoch': 0.83} {'loss': 0.3022, 'learning_rate': 1.3204145776665227e-05, 'epoch': 0.83} {'loss': 0.4847, 'learning_rate': 1.3203827510813513e-05, 'epoch': 0.83} {'loss': 0.6, 'learning_rate': 1.3203509241345285e-05, 'epoch': 0.83} {'loss': 0.5804, 'learning_rate': 1.3203190968260906e-05, 'epoch': 0.83} {'loss': 0.5619, 'learning_rate': 1.3202872691560733e-05, 'epoch': 0.83} {'loss': 0.6206, 'learning_rate': 1.3202554411245125e-05, 'epoch': 0.83} {'loss': 0.6399, 'learning_rate': 1.3202236127314441e-05, 'epoch': 0.83} {'loss': 0.6732, 'learning_rate': 1.3201917839769043e-05, 'epoch': 0.83} {'loss': 0.4851, 'learning_rate': 1.3201599548609289e-05, 'epoch': 0.83} {'loss': 0.5299, 'learning_rate': 1.3201281253835537e-05, 'epoch': 0.83} {'loss': 0.6054, 'learning_rate': 1.3200962955448149e-05, 'epoch': 0.83} {'loss': 0.6313, 'learning_rate': 1.3200644653447481e-05, 'epoch': 0.83} {'loss': 0.5971, 'learning_rate': 1.3200326347833894e-05, 'epoch': 0.83} {'loss': 0.5379, 'learning_rate': 1.3200008038607747e-05, 'epoch': 0.83} {'loss': 0.7614, 'learning_rate': 1.31996897257694e-05, 'epoch': 0.83} {'loss': 0.5858, 'learning_rate': 1.3199371409319212e-05, 'epoch': 0.83} {'loss': 0.5694, 'learning_rate': 1.319905308925754e-05, 'epoch': 0.83} {'loss': 0.575, 'learning_rate': 1.3198734765584749e-05, 'epoch': 0.83} {'loss': 0.6496, 'learning_rate': 1.319841643830119e-05, 'epoch': 0.83} {'loss': 0.5115, 'learning_rate': 1.3198098107407231e-05, 'epoch': 0.83} {'loss': 0.4497, 'learning_rate': 1.3197779772903226e-05, 'epoch': 0.83} {'loss': 0.6487, 'learning_rate': 1.3197461434789535e-05, 'epoch': 0.83} {'loss': 0.6831, 'learning_rate': 1.319714309306652e-05, 'epoch': 0.83} {'loss': 0.5734, 'learning_rate': 1.3196824747734537e-05, 'epoch': 0.83} {'loss': 0.5408, 'learning_rate': 1.319650639879395e-05, 'epoch': 0.83} {'loss': 0.6072, 'learning_rate': 1.319618804624511e-05, 'epoch': 0.83} {'loss': 0.6175, 'learning_rate': 1.3195869690088383e-05, 'epoch': 0.83} {'loss': 0.4935, 'learning_rate': 1.3195551330324127e-05, 'epoch': 0.83} {'loss': 0.4834, 'learning_rate': 1.3195232966952702e-05, 'epoch': 0.83} {'loss': 0.6714, 'learning_rate': 1.3194914599974466e-05, 'epoch': 0.83} {'loss': 0.6511, 'learning_rate': 1.319459622938978e-05, 'epoch': 0.83} {'loss': 0.6122, 'learning_rate': 1.3194277855199003e-05, 'epoch': 0.83} {'loss': 0.4247, 'learning_rate': 1.3193959477402491e-05, 'epoch': 0.83} {'loss': 0.7923, 'learning_rate': 1.3193641096000608e-05, 'epoch': 0.83} {'loss': 0.5465, 'learning_rate': 1.319332271099371e-05, 'epoch': 0.83} {'loss': 0.5029, 'learning_rate': 1.319300432238216e-05, 'epoch': 0.83} {'loss': 0.6329, 'learning_rate': 1.3192685930166316e-05, 'epoch': 0.83} {'loss': 0.4908, 'learning_rate': 1.3192367534346532e-05, 'epoch': 0.83} {'loss': 0.591, 'learning_rate': 1.3192049134923174e-05, 'epoch': 0.83} {'loss': 0.5633, 'learning_rate': 1.3191730731896604e-05, 'epoch': 0.83} {'loss': 0.573, 'learning_rate': 1.3191412325267172e-05, 'epoch': 0.83} {'loss': 0.5434, 'learning_rate': 1.3191093915035245e-05, 'epoch': 0.83} {'loss': 0.5915, 'learning_rate': 1.3190775501201176e-05, 'epoch': 0.83} {'loss': 0.4946, 'learning_rate': 1.3190457083765332e-05, 'epoch': 0.83} {'loss': 0.5425, 'learning_rate': 1.3190138662728066e-05, 'epoch': 0.83} {'loss': 0.4302, 'learning_rate': 1.3189820238089742e-05, 'epoch': 0.83} {'loss': 0.4121, 'learning_rate': 1.3189501809850716e-05, 'epoch': 0.83} {'loss': 0.4809, 'learning_rate': 1.318918337801135e-05, 'epoch': 0.83} {'loss': 0.6371, 'learning_rate': 1.3188864942572002e-05, 'epoch': 0.83} {'loss': 0.7057, 'learning_rate': 1.3188546503533033e-05, 'epoch': 0.83} {'loss': 0.5341, 'learning_rate': 1.3188228060894801e-05, 'epoch': 0.83} {'loss': 0.5369, 'learning_rate': 1.3187909614657665e-05, 'epoch': 0.83} {'loss': 0.4365, 'learning_rate': 1.3187591164821987e-05, 'epoch': 0.83} {'loss': 0.495, 'learning_rate': 1.3187272711388124e-05, 'epoch': 0.83} {'loss': 0.618, 'learning_rate': 1.3186954254356434e-05, 'epoch': 0.83} {'loss': 0.5164, 'learning_rate': 1.3186635793727278e-05, 'epoch': 0.83} {'loss': 0.477, 'learning_rate': 1.318631732950102e-05, 'epoch': 0.83} {'loss': 0.5689, 'learning_rate': 1.3185998861678013e-05, 'epoch': 0.83} {'loss': 0.4445, 'learning_rate': 1.318568039025862e-05, 'epoch': 0.83} {'loss': 0.6148, 'learning_rate': 1.31853619152432e-05, 'epoch': 0.83} {'loss': 0.5703, 'learning_rate': 1.3185043436632112e-05, 'epoch': 0.83} {'loss': 0.5526, 'learning_rate': 1.3184724954425717e-05, 'epoch': 0.83} {'loss': 0.4953, 'learning_rate': 1.3184406468624371e-05, 'epoch': 0.83} {'loss': 0.3624, 'learning_rate': 1.3184087979228437e-05, 'epoch': 0.83} {'loss': 0.4503, 'learning_rate': 1.3183769486238272e-05, 'epoch': 0.83} {'loss': 0.5501, 'learning_rate': 1.3183450989654236e-05, 'epoch': 0.83} {'loss': 0.6338, 'learning_rate': 1.3183132489476691e-05, 'epoch': 0.83} {'loss': 0.6805, 'learning_rate': 1.3182813985705994e-05, 'epoch': 0.83} {'loss': 0.622, 'learning_rate': 1.3182495478342505e-05, 'epoch': 0.83} {'loss': 0.5236, 'learning_rate': 1.3182176967386585e-05, 'epoch': 0.83} {'loss': 0.5788, 'learning_rate': 1.318185845283859e-05, 'epoch': 0.83} {'loss': 0.6575, 'learning_rate': 1.3181539934698884e-05, 'epoch': 0.83} {'loss': 0.5141, 'learning_rate': 1.3181221412967821e-05, 'epoch': 0.83} {'loss': 0.6581, 'learning_rate': 1.318090288764577e-05, 'epoch': 0.83} {'loss': 0.3954, 'learning_rate': 1.318058435873308e-05, 'epoch': 0.83} {'loss': 0.4541, 'learning_rate': 1.3180265826230117e-05, 'epoch': 0.83} {'loss': 0.5451, 'learning_rate': 1.3179947290137239e-05, 'epoch': 0.83} {'loss': 0.4743, 'learning_rate': 1.3179628750454803e-05, 'epoch': 0.83} {'loss': 0.5021, 'learning_rate': 1.3179310207183171e-05, 'epoch': 0.83} {'loss': 0.4511, 'learning_rate': 1.3178991660322704e-05, 'epoch': 0.83} {'loss': 0.5748, 'learning_rate': 1.3178673109873759e-05, 'epoch': 0.83} {'loss': 0.509, 'learning_rate': 1.3178354555836696e-05, 'epoch': 0.83} {'loss': 0.5175, 'learning_rate': 1.3178035998211876e-05, 'epoch': 0.83} {'loss': 0.6716, 'learning_rate': 1.3177717436999657e-05, 'epoch': 0.83} {'loss': 0.5042, 'learning_rate': 1.3177398872200398e-05, 'epoch': 0.83} {'loss': 0.36, 'learning_rate': 1.3177080303814462e-05, 'epoch': 0.83} {'loss': 0.6831, 'learning_rate': 1.317676173184221e-05, 'epoch': 0.83} {'loss': 0.4343, 'learning_rate': 1.3176443156283992e-05, 'epoch': 0.83} {'loss': 0.5287, 'learning_rate': 1.3176124577140174e-05, 'epoch': 0.83} {'loss': 0.4916, 'learning_rate': 1.3175805994411119e-05, 'epoch': 0.83} {'loss': 0.681, 'learning_rate': 1.3175487408097181e-05, 'epoch': 0.83} {'loss': 0.5148, 'learning_rate': 1.3175168818198722e-05, 'epoch': 0.83} {'loss': 0.4758, 'learning_rate': 1.31748502247161e-05, 'epoch': 0.83} {'loss': 0.5463, 'learning_rate': 1.3174531627649676e-05, 'epoch': 0.83} {'loss': 0.604, 'learning_rate': 1.3174213026999811e-05, 'epoch': 0.83} {'loss': 0.4127, 'learning_rate': 1.3173894422766863e-05, 'epoch': 0.83} {'loss': 0.8174, 'learning_rate': 1.317357581495119e-05, 'epoch': 0.83} {'loss': 0.5123, 'learning_rate': 1.3173257203553154e-05, 'epoch': 0.83} {'loss': 0.5422, 'learning_rate': 1.3172938588573115e-05, 'epoch': 0.83} {'loss': 0.5099, 'learning_rate': 1.3172619970011433e-05, 'epoch': 0.83} {'loss': 0.4686, 'learning_rate': 1.3172301347868463e-05, 'epoch': 0.83} {'loss': 0.562, 'learning_rate': 1.3171982722144569e-05, 'epoch': 0.83} {'loss': 0.5329, 'learning_rate': 1.3171664092840111e-05, 'epoch': 0.83} {'loss': 0.4431, 'learning_rate': 1.3171345459955447e-05, 'epoch': 0.83} {'loss': 0.6031, 'learning_rate': 1.3171026823490936e-05, 'epoch': 0.83} {'loss': 0.7062, 'learning_rate': 1.3170708183446936e-05, 'epoch': 0.83} {'loss': 0.5736, 'learning_rate': 1.3170389539823813e-05, 'epoch': 0.83} {'loss': 0.7124, 'learning_rate': 1.3170070892621923e-05, 'epoch': 0.83} {'loss': 0.5728, 'learning_rate': 1.3169752241841624e-05, 'epoch': 0.83} {'loss': 0.5919, 'learning_rate': 1.316943358748328e-05, 'epoch': 0.83} {'loss': 0.5714, 'learning_rate': 1.3169114929547249e-05, 'epoch': 0.83} {'loss': 0.6239, 'learning_rate': 1.3168796268033887e-05, 'epoch': 0.83} {'loss': 0.6919, 'learning_rate': 1.316847760294356e-05, 'epoch': 0.83} {'loss': 0.5172, 'learning_rate': 1.316815893427662e-05, 'epoch': 0.83} {'loss': 0.6105, 'learning_rate': 1.3167840262033434e-05, 'epoch': 0.83} {'loss': 0.4068, 'learning_rate': 1.3167521586214359e-05, 'epoch': 0.83} {'loss': 0.551, 'learning_rate': 1.3167202906819752e-05, 'epoch': 0.83} {'loss': 0.5952, 'learning_rate': 1.3166884223849973e-05, 'epoch': 0.83} {'loss': 0.5763, 'learning_rate': 1.3166565537305389e-05, 'epoch': 0.83} {'loss': 0.5407, 'learning_rate': 1.3166246847186352e-05, 'epoch': 0.83} {'loss': 0.5999, 'learning_rate': 1.3165928153493226e-05, 'epoch': 0.83} {'loss': 0.57, 'learning_rate': 1.3165609456226366e-05, 'epoch': 0.83} {'loss': 0.4503, 'learning_rate': 1.3165290755386139e-05, 'epoch': 0.83} {'loss': 0.6231, 'learning_rate': 1.3164972050972901e-05, 'epoch': 0.83} {'loss': 0.4772, 'learning_rate': 1.3164653342987011e-05, 'epoch': 0.83} {'loss': 0.5526, 'learning_rate': 1.3164334631428825e-05, 'epoch': 0.83} {'loss': 0.4726, 'learning_rate': 1.3164015916298711e-05, 'epoch': 0.83} {'loss': 0.4627, 'learning_rate': 1.3163697197597022e-05, 'epoch': 0.83} {'loss': 0.6155, 'learning_rate': 1.3163378475324122e-05, 'epoch': 0.83} {'loss': 0.5709, 'learning_rate': 1.316305974948037e-05, 'epoch': 0.83} {'loss': 0.6454, 'learning_rate': 1.3162741020066123e-05, 'epoch': 0.83} {'loss': 0.5748, 'learning_rate': 1.3162422287081744e-05, 'epoch': 0.83} {'loss': 0.5618, 'learning_rate': 1.3162103550527592e-05, 'epoch': 0.83} {'loss': 0.5914, 'learning_rate': 1.3161784810404023e-05, 'epoch': 0.83} {'loss': 0.568, 'learning_rate': 1.3161466066711403e-05, 'epoch': 0.83} {'loss': 0.5755, 'learning_rate': 1.3161147319450089e-05, 'epoch': 0.83} {'loss': 0.6091, 'learning_rate': 1.3160828568620444e-05, 'epoch': 0.83} {'loss': 0.5177, 'learning_rate': 1.316050981422282e-05, 'epoch': 0.83} {'loss': 0.6025, 'learning_rate': 1.3160191056257582e-05, 'epoch': 0.83} {'loss': 0.5482, 'learning_rate': 1.3159872294725091e-05, 'epoch': 0.83} {'loss': 0.6684, 'learning_rate': 1.3159553529625704e-05, 'epoch': 0.83} {'loss': 0.4912, 'learning_rate': 1.315923476095978e-05, 'epoch': 0.83} {'loss': 0.5262, 'learning_rate': 1.3158915988727685e-05, 'epoch': 0.83} {'loss': 0.4368, 'learning_rate': 1.3158597212929771e-05, 'epoch': 0.83} {'loss': 0.5465, 'learning_rate': 1.3158278433566403e-05, 'epoch': 0.83} {'loss': 0.5115, 'learning_rate': 1.315795965063794e-05, 'epoch': 0.83} {'loss': 0.5867, 'learning_rate': 1.3157640864144738e-05, 'epoch': 0.83} {'loss': 0.5743, 'learning_rate': 1.3157322074087162e-05, 'epoch': 0.83} {'loss': 0.5994, 'learning_rate': 1.3157003280465568e-05, 'epoch': 0.83} {'loss': 0.5503, 'learning_rate': 1.3156684483280322e-05, 'epoch': 0.83} {'loss': 0.5192, 'learning_rate': 1.3156365682531776e-05, 'epoch': 0.83} {'loss': 0.5178, 'learning_rate': 1.3156046878220294e-05, 'epoch': 0.83} {'loss': 0.7098, 'learning_rate': 1.3155728070346237e-05, 'epoch': 0.83} {'loss': 0.5834, 'learning_rate': 1.315540925890996e-05, 'epoch': 0.83} {'loss': 0.5133, 'learning_rate': 1.3155090443911824e-05, 'epoch': 0.83} {'loss': 0.4974, 'learning_rate': 1.3154771625352194e-05, 'epoch': 0.83} {'loss': 0.4135, 'learning_rate': 1.3154452803231428e-05, 'epoch': 0.83} {'loss': 0.5518, 'learning_rate': 1.3154133977549883e-05, 'epoch': 0.83} {'loss': 0.5179, 'learning_rate': 1.315381514830792e-05, 'epoch': 0.83} {'loss': 0.6605, 'learning_rate': 1.3153496315505903e-05, 'epoch': 0.83} {'loss': 0.6098, 'learning_rate': 1.3153177479144185e-05, 'epoch': 0.83} {'loss': 0.5402, 'learning_rate': 1.3152858639223132e-05, 'epoch': 0.83} {'loss': 0.5365, 'learning_rate': 1.3152539795743098e-05, 'epoch': 0.83} {'loss': 0.531, 'learning_rate': 1.3152220948704449e-05, 'epoch': 0.83} {'loss': 0.6593, 'learning_rate': 1.315190209810754e-05, 'epoch': 0.83} {'loss': 0.5728, 'learning_rate': 1.315158324395273e-05, 'epoch': 0.83} {'loss': 0.5641, 'learning_rate': 1.3151264386240385e-05, 'epoch': 0.83} {'loss': 0.5573, 'learning_rate': 1.3150945524970863e-05, 'epoch': 0.83} {'loss': 0.584, 'learning_rate': 1.3150626660144521e-05, 'epoch': 0.83} {'loss': 0.5352, 'learning_rate': 1.315030779176172e-05, 'epoch': 0.83} {'loss': 0.4566, 'learning_rate': 1.314998891982282e-05, 'epoch': 0.83} {'loss': 0.5461, 'learning_rate': 1.3149670044328184e-05, 'epoch': 0.83} {'loss': 0.5806, 'learning_rate': 1.314935116527817e-05, 'epoch': 0.83} {'loss': 0.6625, 'learning_rate': 1.3149032282673138e-05, 'epoch': 0.83} {'loss': 0.5537, 'learning_rate': 1.3148713396513443e-05, 'epoch': 0.83} {'loss': 0.7105, 'learning_rate': 1.3148394506799451e-05, 'epoch': 0.83} {'loss': 0.6277, 'learning_rate': 1.314807561353152e-05, 'epoch': 0.83} {'loss': 0.5084, 'learning_rate': 1.3147756716710012e-05, 'epoch': 0.83} {'loss': 0.6093, 'learning_rate': 1.3147437816335287e-05, 'epoch': 0.83} {'loss': 0.5717, 'learning_rate': 1.31471189124077e-05, 'epoch': 0.83} {'loss': 0.5882, 'learning_rate': 1.3146800004927613e-05, 'epoch': 0.83} {'loss': 0.5301, 'learning_rate': 1.314648109389539e-05, 'epoch': 0.83} {'loss': 0.6717, 'learning_rate': 1.3146162179311385e-05, 'epoch': 0.83} {'loss': 0.5488, 'learning_rate': 1.3145843261175965e-05, 'epoch': 0.83} {'loss': 0.4041, 'learning_rate': 1.3145524339489484e-05, 'epoch': 0.83} {'loss': 0.4704, 'learning_rate': 1.3145205414252304e-05, 'epoch': 0.83} {'loss': 0.3932, 'learning_rate': 1.3144886485464787e-05, 'epoch': 0.83} {'loss': 0.5502, 'learning_rate': 1.3144567553127293e-05, 'epoch': 0.83} {'loss': 0.561, 'learning_rate': 1.3144248617240176e-05, 'epoch': 0.83} {'loss': 0.417, 'learning_rate': 1.3143929677803802e-05, 'epoch': 0.83} {'loss': 0.5392, 'learning_rate': 1.3143610734818525e-05, 'epoch': 0.83} {'loss': 0.6307, 'learning_rate': 1.3143291788284716e-05, 'epoch': 0.83} {'loss': 0.7332, 'learning_rate': 1.3142972838202725e-05, 'epoch': 0.83} {'loss': 0.5911, 'learning_rate': 1.3142653884572916e-05, 'epoch': 0.83} {'loss': 0.5234, 'learning_rate': 1.3142334927395646e-05, 'epoch': 0.83} {'loss': 0.5845, 'learning_rate': 1.314201596667128e-05, 'epoch': 0.83} {'loss': 0.4764, 'learning_rate': 1.3141697002400173e-05, 'epoch': 0.83} {'loss': 0.6194, 'learning_rate': 1.314137803458269e-05, 'epoch': 0.83} {'loss': 0.6711, 'learning_rate': 1.3141059063219188e-05, 'epoch': 0.83} {'loss': 0.6264, 'learning_rate': 1.314074008831003e-05, 'epoch': 0.83} {'loss': 0.6201, 'learning_rate': 1.314042110985557e-05, 'epoch': 0.83} {'loss': 0.4583, 'learning_rate': 1.3140102127856173e-05, 'epoch': 0.83} {'loss': 0.4516, 'learning_rate': 1.3139783142312199e-05, 'epoch': 0.83} {'loss': 0.437, 'learning_rate': 1.3139464153224005e-05, 'epoch': 0.83} {'loss': 0.455, 'learning_rate': 1.313914516059195e-05, 'epoch': 0.83} {'loss': 0.4925, 'learning_rate': 1.3138826164416401e-05, 'epoch': 0.83} {'loss': 0.6351, 'learning_rate': 1.3138507164697714e-05, 'epoch': 0.83} {'loss': 0.5401, 'learning_rate': 1.313818816143625e-05, 'epoch': 0.83} {'loss': 0.3338, 'learning_rate': 1.3137869154632368e-05, 'epoch': 0.83} {'loss': 0.6263, 'learning_rate': 1.3137550144286429e-05, 'epoch': 0.83} {'loss': 0.5265, 'learning_rate': 1.3137231130398791e-05, 'epoch': 0.83} {'loss': 0.5027, 'learning_rate': 1.3136912112969815e-05, 'epoch': 0.83} {'loss': 0.6811, 'learning_rate': 1.3136593091999863e-05, 'epoch': 0.83} {'loss': 0.5664, 'learning_rate': 1.3136274067489292e-05, 'epoch': 0.83} {'loss': 0.7609, 'learning_rate': 1.3135955039438467e-05, 'epoch': 0.83} {'loss': 0.7291, 'learning_rate': 1.3135636007847744e-05, 'epoch': 0.83} {'loss': 0.647, 'learning_rate': 1.3135316972717483e-05, 'epoch': 0.83} {'loss': 0.6414, 'learning_rate': 1.3134997934048044e-05, 'epoch': 0.83} {'loss': 0.7028, 'learning_rate': 1.3134678891839792e-05, 'epoch': 0.83} {'loss': 0.5878, 'learning_rate': 1.3134359846093082e-05, 'epoch': 0.83} {'loss': 0.6152, 'learning_rate': 1.3134040796808275e-05, 'epoch': 0.83} {'loss': 0.5457, 'learning_rate': 1.3133721743985733e-05, 'epoch': 0.83} {'loss': 0.4666, 'learning_rate': 1.3133402687625818e-05, 'epoch': 0.83} {'loss': 0.5174, 'learning_rate': 1.3133083627728885e-05, 'epoch': 0.83} {'loss': 0.6287, 'learning_rate': 1.3132764564295293e-05, 'epoch': 0.83} {'loss': 0.415, 'learning_rate': 1.3132445497325408e-05, 'epoch': 0.83} {'loss': 0.5753, 'learning_rate': 1.3132126426819589e-05, 'epoch': 0.83} {'loss': 0.6157, 'learning_rate': 1.3131807352778192e-05, 'epoch': 0.83} {'loss': 0.575, 'learning_rate': 1.3131488275201582e-05, 'epoch': 0.83} {'loss': 0.531, 'learning_rate': 1.3131169194090116e-05, 'epoch': 0.83} {'loss': 0.5064, 'learning_rate': 1.3130850109444158e-05, 'epoch': 0.83} {'loss': 0.5673, 'learning_rate': 1.3130531021264061e-05, 'epoch': 0.83} {'loss': 0.5832, 'learning_rate': 1.3130211929550194e-05, 'epoch': 0.83} {'loss': 0.596, 'learning_rate': 1.312989283430291e-05, 'epoch': 0.83} {'loss': 0.5687, 'learning_rate': 1.3129573735522576e-05, 'epoch': 0.83} {'loss': 0.4521, 'learning_rate': 1.3129254633209547e-05, 'epoch': 0.83} {'loss': 0.5034, 'learning_rate': 1.3128935527364183e-05, 'epoch': 0.83} {'loss': 0.4972, 'learning_rate': 1.3128616417986848e-05, 'epoch': 0.83} {'loss': 0.5897, 'learning_rate': 1.3128297305077897e-05, 'epoch': 0.83} {'loss': 0.6298, 'learning_rate': 1.3127978188637695e-05, 'epoch': 0.83} {'loss': 0.4082, 'learning_rate': 1.3127659068666599e-05, 'epoch': 0.83} {'loss': 0.5829, 'learning_rate': 1.3127339945164972e-05, 'epoch': 0.83} {'loss': 0.6314, 'learning_rate': 1.3127020818133174e-05, 'epoch': 0.83} {'loss': 0.5796, 'learning_rate': 1.3126701687571562e-05, 'epoch': 0.83} {'loss': 0.4751, 'learning_rate': 1.3126382553480499e-05, 'epoch': 0.83} {'loss': 0.602, 'learning_rate': 1.3126063415860344e-05, 'epoch': 0.83} {'loss': 0.499, 'learning_rate': 1.3125744274711458e-05, 'epoch': 0.83} {'loss': 0.6473, 'learning_rate': 1.3125425130034202e-05, 'epoch': 0.84} {'loss': 0.4654, 'learning_rate': 1.3125105981828936e-05, 'epoch': 0.84} {'loss': 0.5576, 'learning_rate': 1.3124786830096019e-05, 'epoch': 0.84} {'loss': 0.4063, 'learning_rate': 1.3124467674835812e-05, 'epoch': 0.84} {'loss': 0.5096, 'learning_rate': 1.3124148516048675e-05, 'epoch': 0.84} {'loss': 0.4245, 'learning_rate': 1.3123829353734968e-05, 'epoch': 0.84} {'loss': 0.658, 'learning_rate': 1.3123510187895052e-05, 'epoch': 0.84} {'loss': 0.6021, 'learning_rate': 1.3123191018529285e-05, 'epoch': 0.84} {'loss': 0.4909, 'learning_rate': 1.312287184563803e-05, 'epoch': 0.84} {'loss': 0.5958, 'learning_rate': 1.3122552669221647e-05, 'epoch': 0.84} {'loss': 0.5777, 'learning_rate': 1.3122233489280496e-05, 'epoch': 0.84} {'loss': 0.687, 'learning_rate': 1.3121914305814937e-05, 'epoch': 0.84} {'loss': 0.609, 'learning_rate': 1.3121595118825332e-05, 'epoch': 0.84} {'loss': 0.6532, 'learning_rate': 1.3121275928312041e-05, 'epoch': 0.84} {'loss': 0.6304, 'learning_rate': 1.3120956734275421e-05, 'epoch': 0.84} {'loss': 0.4738, 'learning_rate': 1.3120637536715833e-05, 'epoch': 0.84} {'loss': 0.5536, 'learning_rate': 1.3120318335633639e-05, 'epoch': 0.84} {'loss': 0.5512, 'learning_rate': 1.3119999131029199e-05, 'epoch': 0.84} {'loss': 0.5591, 'learning_rate': 1.3119679922902874e-05, 'epoch': 0.84} {'loss': 0.6711, 'learning_rate': 1.3119360711255022e-05, 'epoch': 0.84} {'loss': 0.5312, 'learning_rate': 1.3119041496086008e-05, 'epoch': 0.84} {'loss': 0.6244, 'learning_rate': 1.3118722277396186e-05, 'epoch': 0.84} {'loss': 0.5693, 'learning_rate': 1.3118403055185922e-05, 'epoch': 0.84} {'loss': 0.5704, 'learning_rate': 1.3118083829455573e-05, 'epoch': 0.84} {'loss': 0.653, 'learning_rate': 1.31177646002055e-05, 'epoch': 0.84} {'loss': 0.4709, 'learning_rate': 1.3117445367436066e-05, 'epoch': 0.84} {'loss': 0.6786, 'learning_rate': 1.3117126131147625e-05, 'epoch': 0.84} {'loss': 0.6199, 'learning_rate': 1.3116806891340545e-05, 'epoch': 0.84} {'loss': 0.4817, 'learning_rate': 1.3116487648015182e-05, 'epoch': 0.84} {'loss': 0.5841, 'learning_rate': 1.3116168401171896e-05, 'epoch': 0.84} {'loss': 0.471, 'learning_rate': 1.3115849150811046e-05, 'epoch': 0.84} {'loss': 0.5857, 'learning_rate': 1.3115529896933e-05, 'epoch': 0.84} {'loss': 0.5699, 'learning_rate': 1.311521063953811e-05, 'epoch': 0.84} {'loss': 0.5122, 'learning_rate': 1.311489137862674e-05, 'epoch': 0.84} {'loss': 0.5991, 'learning_rate': 1.3114572114199248e-05, 'epoch': 0.84} {'loss': 0.7301, 'learning_rate': 1.3114252846255999e-05, 'epoch': 0.84} {'loss': 0.5438, 'learning_rate': 1.3113933574797351e-05, 'epoch': 0.84} {'loss': 0.5099, 'learning_rate': 1.3113614299823662e-05, 'epoch': 0.84} {'loss': 0.5196, 'learning_rate': 1.3113295021335298e-05, 'epoch': 0.84} {'loss': 0.4983, 'learning_rate': 1.3112975739332614e-05, 'epoch': 0.84} {'loss': 0.3028, 'learning_rate': 1.3112656453815972e-05, 'epoch': 0.84} {'loss': 0.5261, 'learning_rate': 1.3112337164785733e-05, 'epoch': 0.84} {'loss': 0.6703, 'learning_rate': 1.3112017872242258e-05, 'epoch': 0.84} {'loss': 0.6622, 'learning_rate': 1.3111698576185905e-05, 'epoch': 0.84} {'loss': 0.5374, 'learning_rate': 1.3111379276617036e-05, 'epoch': 0.84} {'loss': 0.3975, 'learning_rate': 1.3111059973536012e-05, 'epoch': 0.84} {'loss': 0.4194, 'learning_rate': 1.3110740666943193e-05, 'epoch': 0.84} {'loss': 0.4, 'learning_rate': 1.3110421356838941e-05, 'epoch': 0.84} {'loss': 0.5953, 'learning_rate': 1.311010204322361e-05, 'epoch': 0.84} {'loss': 0.5861, 'learning_rate': 1.3109782726097571e-05, 'epoch': 0.84} {'loss': 0.5477, 'learning_rate': 1.3109463405461176e-05, 'epoch': 0.84} {'loss': 0.5696, 'learning_rate': 1.3109144081314788e-05, 'epoch': 0.84} {'loss': 0.5119, 'learning_rate': 1.3108824753658769e-05, 'epoch': 0.84} {'loss': 0.6017, 'learning_rate': 1.3108505422493477e-05, 'epoch': 0.84} {'loss': 0.5045, 'learning_rate': 1.3108186087819272e-05, 'epoch': 0.84} {'loss': 0.6003, 'learning_rate': 1.3107866749636517e-05, 'epoch': 0.84} {'loss': 0.5438, 'learning_rate': 1.3107547407945568e-05, 'epoch': 0.84} {'loss': 0.59, 'learning_rate': 1.3107228062746793e-05, 'epoch': 0.84} {'loss': 0.5129, 'learning_rate': 1.310690871404055e-05, 'epoch': 0.84} {'loss': 0.5306, 'learning_rate': 1.3106589361827194e-05, 'epoch': 0.84} {'loss': 0.519, 'learning_rate': 1.3106270006107092e-05, 'epoch': 0.84} {'loss': 0.5261, 'learning_rate': 1.3105950646880601e-05, 'epoch': 0.84} {'loss': 0.5383, 'learning_rate': 1.3105631284148083e-05, 'epoch': 0.84} {'loss': 0.6133, 'learning_rate': 1.3105311917909898e-05, 'epoch': 0.84} {'loss': 0.6254, 'learning_rate': 1.3104992548166403e-05, 'epoch': 0.84} {'loss': 0.5039, 'learning_rate': 1.3104673174917966e-05, 'epoch': 0.84} {'loss': 0.4676, 'learning_rate': 1.310435379816494e-05, 'epoch': 0.84} {'loss': 0.554, 'learning_rate': 1.3104034417907692e-05, 'epoch': 0.84} {'loss': 0.5865, 'learning_rate': 1.3103715034146579e-05, 'epoch': 0.84} {'loss': 0.6934, 'learning_rate': 1.310339564688196e-05, 'epoch': 0.84} {'loss': 0.5352, 'learning_rate': 1.3103076256114197e-05, 'epoch': 0.84} {'loss': 0.5615, 'learning_rate': 1.3102756861843653e-05, 'epoch': 0.84} {'loss': 0.6739, 'learning_rate': 1.3102437464070685e-05, 'epoch': 0.84} {'loss': 0.5612, 'learning_rate': 1.3102118062795657e-05, 'epoch': 0.84} {'loss': 0.6358, 'learning_rate': 1.3101798658018926e-05, 'epoch': 0.84} {'loss': 0.5435, 'learning_rate': 1.3101479249740857e-05, 'epoch': 0.84} {'loss': 0.6734, 'learning_rate': 1.3101159837961802e-05, 'epoch': 0.84} {'loss': 0.4404, 'learning_rate': 1.3100840422682132e-05, 'epoch': 0.84} {'loss': 0.4771, 'learning_rate': 1.3100521003902203e-05, 'epoch': 0.84} {'loss': 0.7215, 'learning_rate': 1.3100201581622374e-05, 'epoch': 0.84} {'loss': 0.595, 'learning_rate': 1.3099882155843004e-05, 'epoch': 0.84} {'loss': 0.539, 'learning_rate': 1.309956272656446e-05, 'epoch': 0.84} {'loss': 0.4688, 'learning_rate': 1.3099243293787099e-05, 'epoch': 0.84} {'loss': 0.7079, 'learning_rate': 1.309892385751128e-05, 'epoch': 0.84} {'loss': 0.4935, 'learning_rate': 1.3098604417737369e-05, 'epoch': 0.84} {'loss': 0.5962, 'learning_rate': 1.3098284974465718e-05, 'epoch': 0.84} {'loss': 0.6176, 'learning_rate': 1.3097965527696695e-05, 'epoch': 0.84} {'loss': 0.5768, 'learning_rate': 1.3097646077430657e-05, 'epoch': 0.84} {'loss': 0.6658, 'learning_rate': 1.3097326623667967e-05, 'epoch': 0.84} {'loss': 0.7234, 'learning_rate': 1.3097007166408983e-05, 'epoch': 0.84} {'loss': 0.7304, 'learning_rate': 1.309668770565407e-05, 'epoch': 0.84} {'loss': 0.5371, 'learning_rate': 1.3096368241403582e-05, 'epoch': 0.84} {'loss': 0.7385, 'learning_rate': 1.3096048773657884e-05, 'epoch': 0.84} {'loss': 0.6003, 'learning_rate': 1.3095729302417335e-05, 'epoch': 0.84} {'loss': 0.4727, 'learning_rate': 1.3095409827682295e-05, 'epoch': 0.84} {'loss': 0.5909, 'learning_rate': 1.3095090349453128e-05, 'epoch': 0.84} {'loss': 0.6251, 'learning_rate': 1.3094770867730194e-05, 'epoch': 0.84} {'loss': 0.6529, 'learning_rate': 1.3094451382513849e-05, 'epoch': 0.84} {'loss': 0.5731, 'learning_rate': 1.3094131893804459e-05, 'epoch': 0.84} {'loss': 0.62, 'learning_rate': 1.3093812401602382e-05, 'epoch': 0.84} {'loss': 0.5849, 'learning_rate': 1.3093492905907977e-05, 'epoch': 0.84} {'loss': 0.4823, 'learning_rate': 1.309317340672161e-05, 'epoch': 0.84} {'loss': 0.51, 'learning_rate': 1.3092853904043636e-05, 'epoch': 0.84} {'loss': 0.7213, 'learning_rate': 1.3092534397874421e-05, 'epoch': 0.84} {'loss': 0.6459, 'learning_rate': 1.309221488821432e-05, 'epoch': 0.84} {'loss': 0.6303, 'learning_rate': 1.3091895375063698e-05, 'epoch': 0.84} {'loss': 0.5352, 'learning_rate': 1.3091575858422911e-05, 'epoch': 0.84} {'loss': 0.4849, 'learning_rate': 1.3091256338292324e-05, 'epoch': 0.84} {'loss': 0.5268, 'learning_rate': 1.3090936814672296e-05, 'epoch': 0.84} {'loss': 0.6289, 'learning_rate': 1.3090617287563192e-05, 'epoch': 0.84} {'loss': 0.6746, 'learning_rate': 1.3090297756965365e-05, 'epoch': 0.84} {'loss': 0.6632, 'learning_rate': 1.3089978222879183e-05, 'epoch': 0.84} {'loss': 0.3218, 'learning_rate': 1.3089658685305e-05, 'epoch': 0.84} {'loss': 0.5863, 'learning_rate': 1.3089339144243182e-05, 'epoch': 0.84} {'loss': 0.5028, 'learning_rate': 1.3089019599694087e-05, 'epoch': 0.84} {'loss': 0.4916, 'learning_rate': 1.3088700051658073e-05, 'epoch': 0.84} {'loss': 0.5394, 'learning_rate': 1.308838050013551e-05, 'epoch': 0.84} {'loss': 0.4853, 'learning_rate': 1.3088060945126749e-05, 'epoch': 0.84} {'loss': 0.5992, 'learning_rate': 1.3087741386632153e-05, 'epoch': 0.84} {'loss': 0.5439, 'learning_rate': 1.3087421824652084e-05, 'epoch': 0.84} {'loss': 0.7823, 'learning_rate': 1.3087102259186906e-05, 'epoch': 0.84} {'loss': 0.4911, 'learning_rate': 1.3086782690236976e-05, 'epoch': 0.84} {'loss': 0.7291, 'learning_rate': 1.3086463117802655e-05, 'epoch': 0.84} {'loss': 0.497, 'learning_rate': 1.3086143541884303e-05, 'epoch': 0.84} {'loss': 0.3902, 'learning_rate': 1.3085823962482285e-05, 'epoch': 0.84} {'loss': 0.4924, 'learning_rate': 1.3085504379596956e-05, 'epoch': 0.84} {'loss': 0.5822, 'learning_rate': 1.3085184793228678e-05, 'epoch': 0.84} {'loss': 0.5955, 'learning_rate': 1.3084865203377815e-05, 'epoch': 0.84} {'loss': 0.5447, 'learning_rate': 1.3084545610044726e-05, 'epoch': 0.84} {'loss': 0.506, 'learning_rate': 1.308422601322977e-05, 'epoch': 0.84} {'loss': 0.5936, 'learning_rate': 1.3083906412933309e-05, 'epoch': 0.84} {'loss': 0.5649, 'learning_rate': 1.3083586809155705e-05, 'epoch': 0.84} {'loss': 0.5863, 'learning_rate': 1.3083267201897318e-05, 'epoch': 0.84} {'loss': 0.5102, 'learning_rate': 1.308294759115851e-05, 'epoch': 0.84} {'loss': 0.5354, 'learning_rate': 1.3082627976939639e-05, 'epoch': 0.84} {'loss': 0.6111, 'learning_rate': 1.3082308359241068e-05, 'epoch': 0.84} {'loss': 0.3202, 'learning_rate': 1.3081988738063155e-05, 'epoch': 0.84} {'loss': 0.4808, 'learning_rate': 1.3081669113406266e-05, 'epoch': 0.84} {'loss': 0.6463, 'learning_rate': 1.3081349485270756e-05, 'epoch': 0.84} {'loss': 0.6207, 'learning_rate': 1.308102985365699e-05, 'epoch': 0.84} {'loss': 0.4573, 'learning_rate': 1.3080710218565326e-05, 'epoch': 0.84} {'loss': 0.534, 'learning_rate': 1.3080390579996124e-05, 'epoch': 0.84} {'loss': 0.4917, 'learning_rate': 1.3080070937949749e-05, 'epoch': 0.84} {'loss': 0.4793, 'learning_rate': 1.3079751292426562e-05, 'epoch': 0.84} {'loss': 0.6158, 'learning_rate': 1.3079431643426918e-05, 'epoch': 0.84} {'loss': 0.4678, 'learning_rate': 1.307911199095118e-05, 'epoch': 0.84} {'loss': 0.6425, 'learning_rate': 1.3078792334999715e-05, 'epoch': 0.84} {'loss': 0.4397, 'learning_rate': 1.3078472675572876e-05, 'epoch': 0.84} {'loss': 0.5375, 'learning_rate': 1.3078153012671026e-05, 'epoch': 0.84} {'loss': 0.4403, 'learning_rate': 1.3077833346294529e-05, 'epoch': 0.84} {'loss': 0.5598, 'learning_rate': 1.3077513676443743e-05, 'epoch': 0.84} {'loss': 0.5347, 'learning_rate': 1.3077194003119029e-05, 'epoch': 0.84} {'loss': 0.4755, 'learning_rate': 1.3076874326320748e-05, 'epoch': 0.84} {'loss': 0.5081, 'learning_rate': 1.307655464604926e-05, 'epoch': 0.84} {'loss': 0.4602, 'learning_rate': 1.3076234962304927e-05, 'epoch': 0.84} {'loss': 0.7072, 'learning_rate': 1.307591527508811e-05, 'epoch': 0.84} {'loss': 0.519, 'learning_rate': 1.3075595584399166e-05, 'epoch': 0.84} {'loss': 0.3952, 'learning_rate': 1.3075275890238463e-05, 'epoch': 0.84} {'loss': 0.6929, 'learning_rate': 1.3074956192606358e-05, 'epoch': 0.84} {'loss': 0.565, 'learning_rate': 1.3074636491503214e-05, 'epoch': 0.84} {'loss': 0.7158, 'learning_rate': 1.3074316786929387e-05, 'epoch': 0.84} {'loss': 0.4415, 'learning_rate': 1.3073997078885246e-05, 'epoch': 0.84} {'loss': 0.2837, 'learning_rate': 1.3073677367371142e-05, 'epoch': 0.84} {'loss': 0.6235, 'learning_rate': 1.3073357652387442e-05, 'epoch': 0.84} {'loss': 0.5448, 'learning_rate': 1.3073037933934507e-05, 'epoch': 0.84} {'loss': 0.6236, 'learning_rate': 1.3072718212012694e-05, 'epoch': 0.84} {'loss': 0.3881, 'learning_rate': 1.3072398486622368e-05, 'epoch': 0.84} {'loss': 0.5825, 'learning_rate': 1.3072078757763889e-05, 'epoch': 0.84} {'loss': 0.7281, 'learning_rate': 1.3071759025437616e-05, 'epoch': 0.84} {'loss': 0.4352, 'learning_rate': 1.307143928964391e-05, 'epoch': 0.84} {'loss': 0.7491, 'learning_rate': 1.3071119550383135e-05, 'epoch': 0.84} {'loss': 0.5372, 'learning_rate': 1.307079980765565e-05, 'epoch': 0.84} {'loss': 0.4458, 'learning_rate': 1.3070480061461815e-05, 'epoch': 0.84} {'loss': 0.7648, 'learning_rate': 1.3070160311801994e-05, 'epoch': 0.84} {'loss': 0.6382, 'learning_rate': 1.3069840558676546e-05, 'epoch': 0.84} {'loss': 0.6353, 'learning_rate': 1.3069520802085829e-05, 'epoch': 0.84} {'loss': 0.6077, 'learning_rate': 1.3069201042030208e-05, 'epoch': 0.84} {'loss': 0.513, 'learning_rate': 1.3068881278510041e-05, 'epoch': 0.84} {'loss': 0.4385, 'learning_rate': 1.3068561511525693e-05, 'epoch': 0.84} {'loss': 0.6161, 'learning_rate': 1.3068241741077522e-05, 'epoch': 0.84} {'loss': 0.551, 'learning_rate': 1.3067921967165888e-05, 'epoch': 0.84} {'loss': 0.5893, 'learning_rate': 1.3067602189791156e-05, 'epoch': 0.84} {'loss': 0.6278, 'learning_rate': 1.3067282408953684e-05, 'epoch': 0.84} {'loss': 0.4352, 'learning_rate': 1.306696262465383e-05, 'epoch': 0.84} {'loss': 0.6611, 'learning_rate': 1.306664283689196e-05, 'epoch': 0.84} {'loss': 0.5867, 'learning_rate': 1.3066323045668434e-05, 'epoch': 0.84} {'loss': 0.6618, 'learning_rate': 1.3066003250983614e-05, 'epoch': 0.84} {'loss': 0.5743, 'learning_rate': 1.306568345283786e-05, 'epoch': 0.84} {'loss': 0.6317, 'learning_rate': 1.3065363651231531e-05, 'epoch': 0.84} {'loss': 0.5853, 'learning_rate': 1.3065043846164988e-05, 'epoch': 0.84} {'loss': 0.5699, 'learning_rate': 1.3064724037638595e-05, 'epoch': 0.84} {'loss': 0.5192, 'learning_rate': 1.3064404225652709e-05, 'epoch': 0.84} {'loss': 0.4017, 'learning_rate': 1.3064084410207696e-05, 'epoch': 0.84} {'loss': 0.6571, 'learning_rate': 1.3063764591303914e-05, 'epoch': 0.84} {'loss': 0.5554, 'learning_rate': 1.3063444768941722e-05, 'epoch': 0.84} {'loss': 0.7759, 'learning_rate': 1.3063124943121484e-05, 'epoch': 0.84} {'loss': 0.6765, 'learning_rate': 1.3062805113843563e-05, 'epoch': 0.84} {'loss': 0.5042, 'learning_rate': 1.3062485281108315e-05, 'epoch': 0.84} {'loss': 0.4914, 'learning_rate': 1.3062165444916105e-05, 'epoch': 0.84} {'loss': 0.6022, 'learning_rate': 1.3061845605267292e-05, 'epoch': 0.84} {'loss': 0.4803, 'learning_rate': 1.3061525762162237e-05, 'epoch': 0.84} {'loss': 0.5813, 'learning_rate': 1.3061205915601303e-05, 'epoch': 0.84} {'loss': 0.5311, 'learning_rate': 1.3060886065584849e-05, 'epoch': 0.84} {'loss': 0.6696, 'learning_rate': 1.3060566212113235e-05, 'epoch': 0.84} {'loss': 0.4544, 'learning_rate': 1.3060246355186825e-05, 'epoch': 0.84} {'loss': 0.5954, 'learning_rate': 1.3059926494805976e-05, 'epoch': 0.84} {'loss': 0.5019, 'learning_rate': 1.3059606630971055e-05, 'epoch': 0.84} {'loss': 0.6344, 'learning_rate': 1.3059286763682419e-05, 'epoch': 0.84} {'loss': 0.4307, 'learning_rate': 1.305896689294043e-05, 'epoch': 0.84} {'loss': 0.6, 'learning_rate': 1.305864701874545e-05, 'epoch': 0.84} {'loss': 0.4459, 'learning_rate': 1.3058327141097843e-05, 'epoch': 0.84} {'loss': 0.5548, 'learning_rate': 1.305800725999796e-05, 'epoch': 0.84} {'loss': 0.7119, 'learning_rate': 1.3057687375446171e-05, 'epoch': 0.84} {'loss': 0.7384, 'learning_rate': 1.3057367487442834e-05, 'epoch': 0.84} {'loss': 0.4578, 'learning_rate': 1.305704759598831e-05, 'epoch': 0.84} {'loss': 0.6251, 'learning_rate': 1.3056727701082959e-05, 'epoch': 0.84} {'loss': 0.5568, 'learning_rate': 1.3056407802727147e-05, 'epoch': 0.84} {'loss': 0.5773, 'learning_rate': 1.3056087900921229e-05, 'epoch': 0.84} {'loss': 0.6285, 'learning_rate': 1.3055767995665568e-05, 'epoch': 0.84} {'loss': 0.6147, 'learning_rate': 1.305544808696053e-05, 'epoch': 0.84} {'loss': 0.6906, 'learning_rate': 1.305512817480647e-05, 'epoch': 0.84} {'loss': 0.6562, 'learning_rate': 1.3054808259203753e-05, 'epoch': 0.84} {'loss': 0.5346, 'learning_rate': 1.3054488340152735e-05, 'epoch': 0.84} {'loss': 0.5852, 'learning_rate': 1.3054168417653783e-05, 'epoch': 0.84} {'loss': 0.4095, 'learning_rate': 1.3053848491707257e-05, 'epoch': 0.84} {'loss': 0.5109, 'learning_rate': 1.3053528562313516e-05, 'epoch': 0.84} {'loss': 0.4873, 'learning_rate': 1.305320862947292e-05, 'epoch': 0.84} {'loss': 0.4806, 'learning_rate': 1.3052888693185832e-05, 'epoch': 0.84} {'loss': 0.6442, 'learning_rate': 1.3052568753452615e-05, 'epoch': 0.84} {'loss': 0.4263, 'learning_rate': 1.3052248810273626e-05, 'epoch': 0.84} {'loss': 0.6542, 'learning_rate': 1.3051928863649231e-05, 'epoch': 0.84} {'loss': 0.4996, 'learning_rate': 1.3051608913579788e-05, 'epoch': 0.84} {'loss': 0.6085, 'learning_rate': 1.3051288960065657e-05, 'epoch': 0.84} {'loss': 0.4789, 'learning_rate': 1.3050969003107201e-05, 'epoch': 0.84} {'loss': 0.5553, 'learning_rate': 1.3050649042704785e-05, 'epoch': 0.84} {'loss': 0.579, 'learning_rate': 1.3050329078858761e-05, 'epoch': 0.84} {'loss': 0.6375, 'learning_rate': 1.30500091115695e-05, 'epoch': 0.84} {'loss': 0.601, 'learning_rate': 1.3049689140837359e-05, 'epoch': 0.84} {'loss': 0.6635, 'learning_rate': 1.3049369166662698e-05, 'epoch': 0.84} {'loss': 0.6199, 'learning_rate': 1.3049049189045877e-05, 'epoch': 0.84} {'loss': 0.71, 'learning_rate': 1.3048729207987258e-05, 'epoch': 0.84} {'loss': 0.4113, 'learning_rate': 1.3048409223487207e-05, 'epoch': 0.84} {'loss': 0.6389, 'learning_rate': 1.304808923554608e-05, 'epoch': 0.84} {'loss': 0.7004, 'learning_rate': 1.3047769244164241e-05, 'epoch': 0.84} {'loss': 0.7082, 'learning_rate': 1.3047449249342048e-05, 'epoch': 0.84} {'loss': 0.5522, 'learning_rate': 1.3047129251079866e-05, 'epoch': 0.84} {'loss': 0.6197, 'learning_rate': 1.3046809249378055e-05, 'epoch': 0.84} {'loss': 0.6089, 'learning_rate': 1.3046489244236974e-05, 'epoch': 0.84} {'loss': 0.7309, 'learning_rate': 1.3046169235656988e-05, 'epoch': 0.84} {'loss': 0.6802, 'learning_rate': 1.3045849223638454e-05, 'epoch': 0.84} {'loss': 0.5325, 'learning_rate': 1.304552920818174e-05, 'epoch': 0.84} {'loss': 0.6193, 'learning_rate': 1.3045209189287198e-05, 'epoch': 0.84} {'loss': 0.7726, 'learning_rate': 1.3044889166955194e-05, 'epoch': 0.84} {'loss': 0.4528, 'learning_rate': 1.304456914118609e-05, 'epoch': 0.84} {'loss': 0.6058, 'learning_rate': 1.3044249111980248e-05, 'epoch': 0.84} {'loss': 0.4164, 'learning_rate': 1.3043929079338025e-05, 'epoch': 0.84} {'loss': 0.6086, 'learning_rate': 1.3043609043259783e-05, 'epoch': 0.84} {'loss': 0.5221, 'learning_rate': 1.3043289003745889e-05, 'epoch': 0.84} {'loss': 0.5988, 'learning_rate': 1.30429689607967e-05, 'epoch': 0.84} {'loss': 0.4424, 'learning_rate': 1.3042648914412578e-05, 'epoch': 0.84} {'loss': 0.4987, 'learning_rate': 1.3042328864593885e-05, 'epoch': 0.84} {'loss': 0.6145, 'learning_rate': 1.304200881134098e-05, 'epoch': 0.84} {'loss': 0.5325, 'learning_rate': 1.3041688754654224e-05, 'epoch': 0.84} {'loss': 0.7323, 'learning_rate': 1.304136869453398e-05, 'epoch': 0.84} {'loss': 0.6091, 'learning_rate': 1.304104863098061e-05, 'epoch': 0.84} {'loss': 0.7148, 'learning_rate': 1.3040728563994476e-05, 'epoch': 0.84} {'loss': 0.4422, 'learning_rate': 1.3040408493575936e-05, 'epoch': 0.84} {'loss': 0.5527, 'learning_rate': 1.3040088419725352e-05, 'epoch': 0.84} {'loss': 0.5884, 'learning_rate': 1.3039768342443089e-05, 'epoch': 0.84} {'loss': 0.5006, 'learning_rate': 1.3039448261729502e-05, 'epoch': 0.84} {'loss': 0.6114, 'learning_rate': 1.3039128177584957e-05, 'epoch': 0.84} {'loss': 0.5705, 'learning_rate': 1.3038808090009815e-05, 'epoch': 0.84} {'loss': 0.4512, 'learning_rate': 1.3038487999004436e-05, 'epoch': 0.84} {'loss': 0.6484, 'learning_rate': 1.3038167904569186e-05, 'epoch': 0.84} {'loss': 0.752, 'learning_rate': 1.3037847806704417e-05, 'epoch': 0.84} {'loss': 0.677, 'learning_rate': 1.3037527705410498e-05, 'epoch': 0.84} {'loss': 0.6961, 'learning_rate': 1.3037207600687787e-05, 'epoch': 0.84} {'loss': 0.4371, 'learning_rate': 1.3036887492536645e-05, 'epoch': 0.84} {'loss': 0.4408, 'learning_rate': 1.3036567380957435e-05, 'epoch': 0.84} {'loss': 0.6699, 'learning_rate': 1.303624726595052e-05, 'epoch': 0.84} {'loss': 0.6207, 'learning_rate': 1.3035927147516257e-05, 'epoch': 0.84} {'loss': 0.5251, 'learning_rate': 1.303560702565501e-05, 'epoch': 0.84} {'loss': 0.5387, 'learning_rate': 1.303528690036714e-05, 'epoch': 0.84} {'loss': 0.5523, 'learning_rate': 1.3034966771653009e-05, 'epoch': 0.84} {'loss': 0.5694, 'learning_rate': 1.3034646639512975e-05, 'epoch': 0.84} {'loss': 0.7309, 'learning_rate': 1.3034326503947403e-05, 'epoch': 0.84} {'loss': 0.5176, 'learning_rate': 1.3034006364956657e-05, 'epoch': 0.84} {'loss': 0.4506, 'learning_rate': 1.3033686222541094e-05, 'epoch': 0.84} {'loss': 0.3967, 'learning_rate': 1.3033366076701073e-05, 'epoch': 0.84} {'loss': 0.5724, 'learning_rate': 1.303304592743696e-05, 'epoch': 0.84} {'loss': 0.6062, 'learning_rate': 1.3032725774749114e-05, 'epoch': 0.84} {'loss': 0.4619, 'learning_rate': 1.3032405618637899e-05, 'epoch': 0.84} {'loss': 0.5332, 'learning_rate': 1.3032085459103674e-05, 'epoch': 0.84} {'loss': 0.5539, 'learning_rate': 1.3031765296146798e-05, 'epoch': 0.84} {'loss': 0.4992, 'learning_rate': 1.303144512976764e-05, 'epoch': 0.84} {'loss': 0.5548, 'learning_rate': 1.3031124959966554e-05, 'epoch': 0.84} {'loss': 0.5105, 'learning_rate': 1.3030804786743905e-05, 'epoch': 0.84} {'loss': 0.6575, 'learning_rate': 1.3030484610100054e-05, 'epoch': 0.84} {'loss': 0.4888, 'learning_rate': 1.3030164430035364e-05, 'epoch': 0.84} {'loss': 0.5769, 'learning_rate': 1.3029844246550192e-05, 'epoch': 0.84} {'loss': 0.5589, 'learning_rate': 1.3029524059644904e-05, 'epoch': 0.84} {'loss': 0.523, 'learning_rate': 1.302920386931986e-05, 'epoch': 0.84} {'loss': 0.6119, 'learning_rate': 1.3028883675575418e-05, 'epoch': 0.84} {'loss': 0.4994, 'learning_rate': 1.3028563478411943e-05, 'epoch': 0.84} {'loss': 0.6068, 'learning_rate': 1.3028243277829794e-05, 'epoch': 0.84} {'loss': 0.5671, 'learning_rate': 1.3027923073829335e-05, 'epoch': 0.84} {'loss': 0.4321, 'learning_rate': 1.3027602866410931e-05, 'epoch': 0.84} {'loss': 0.6324, 'learning_rate': 1.3027282655574935e-05, 'epoch': 0.84} {'loss': 0.5489, 'learning_rate': 1.3026962441321713e-05, 'epoch': 0.84} {'loss': 0.4868, 'learning_rate': 1.302664222365163e-05, 'epoch': 0.84} {'loss': 0.4553, 'learning_rate': 1.3026322002565039e-05, 'epoch': 0.84} {'loss': 0.6088, 'learning_rate': 1.3026001778062307e-05, 'epoch': 0.84} {'loss': 0.4768, 'learning_rate': 1.3025681550143796e-05, 'epoch': 0.84} {'loss': 0.676, 'learning_rate': 1.3025361318809863e-05, 'epoch': 0.84} {'loss': 0.6176, 'learning_rate': 1.3025041084060875e-05, 'epoch': 0.84} {'loss': 0.6043, 'learning_rate': 1.302472084589719e-05, 'epoch': 0.84} {'loss': 0.5759, 'learning_rate': 1.302440060431917e-05, 'epoch': 0.84} {'loss': 0.537, 'learning_rate': 1.3024080359327177e-05, 'epoch': 0.84} {'loss': 0.5233, 'learning_rate': 1.3023760110921571e-05, 'epoch': 0.84} {'loss': 0.3699, 'learning_rate': 1.3023439859102716e-05, 'epoch': 0.84} {'loss': 0.5846, 'learning_rate': 1.302311960387097e-05, 'epoch': 0.84} {'loss': 0.6719, 'learning_rate': 1.30227993452267e-05, 'epoch': 0.84} {'loss': 0.464, 'learning_rate': 1.3022479083170265e-05, 'epoch': 0.84} {'loss': 0.5414, 'learning_rate': 1.3022158817702026e-05, 'epoch': 0.84} {'loss': 0.6259, 'learning_rate': 1.3021838548822344e-05, 'epoch': 0.84} {'loss': 0.5715, 'learning_rate': 1.3021518276531578e-05, 'epoch': 0.84} {'loss': 0.5774, 'learning_rate': 1.3021198000830093e-05, 'epoch': 0.84} {'loss': 0.4228, 'learning_rate': 1.3020877721718253e-05, 'epoch': 0.84} {'loss': 0.6274, 'learning_rate': 1.3020557439196413e-05, 'epoch': 0.84} {'loss': 0.5899, 'learning_rate': 1.3020237153264939e-05, 'epoch': 0.84} {'loss': 0.6298, 'learning_rate': 1.3019916863924193e-05, 'epoch': 0.84} {'loss': 0.5187, 'learning_rate': 1.3019596571174536e-05, 'epoch': 0.84} {'loss': 0.4443, 'learning_rate': 1.3019276275016326e-05, 'epoch': 0.84} {'loss': 0.5252, 'learning_rate': 1.3018955975449927e-05, 'epoch': 0.84} {'loss': 0.5403, 'learning_rate': 1.3018635672475701e-05, 'epoch': 0.84} {'loss': 0.6227, 'learning_rate': 1.3018315366094013e-05, 'epoch': 0.84} {'loss': 0.6867, 'learning_rate': 1.3017995056305219e-05, 'epoch': 0.84} {'loss': 0.5051, 'learning_rate': 1.301767474310968e-05, 'epoch': 0.84} {'loss': 0.6167, 'learning_rate': 1.3017354426507763e-05, 'epoch': 0.84} {'loss': 0.4866, 'learning_rate': 1.3017034106499825e-05, 'epoch': 0.84} {'loss': 0.6145, 'learning_rate': 1.301671378308623e-05, 'epoch': 0.84} {'loss': 0.5582, 'learning_rate': 1.3016393456267338e-05, 'epoch': 0.84} {'loss': 0.4901, 'learning_rate': 1.3016073126043512e-05, 'epoch': 0.84} {'loss': 0.4332, 'learning_rate': 1.3015752792415113e-05, 'epoch': 0.84} {'loss': 0.5699, 'learning_rate': 1.3015432455382502e-05, 'epoch': 0.84} {'loss': 0.615, 'learning_rate': 1.301511211494604e-05, 'epoch': 0.84} {'loss': 0.5953, 'learning_rate': 1.3014791771106093e-05, 'epoch': 0.84} {'loss': 0.4512, 'learning_rate': 1.3014471423863015e-05, 'epoch': 0.84} {'loss': 0.5328, 'learning_rate': 1.3014151073217176e-05, 'epoch': 0.84} {'loss': 0.6865, 'learning_rate': 1.3013830719168934e-05, 'epoch': 0.84} {'loss': 0.498, 'learning_rate': 1.3013510361718648e-05, 'epoch': 0.84} {'loss': 0.5129, 'learning_rate': 1.3013190000866684e-05, 'epoch': 0.84} {'loss': 0.6147, 'learning_rate': 1.30128696366134e-05, 'epoch': 0.84} {'loss': 0.6657, 'learning_rate': 1.3012549268959158e-05, 'epoch': 0.84} {'loss': 0.6094, 'learning_rate': 1.301222889790432e-05, 'epoch': 0.84} {'loss': 0.4762, 'learning_rate': 1.3011908523449248e-05, 'epoch': 0.84} {'loss': 0.7269, 'learning_rate': 1.3011588145594308e-05, 'epoch': 0.84} {'loss': 0.5999, 'learning_rate': 1.3011267764339855e-05, 'epoch': 0.84} {'loss': 0.6224, 'learning_rate': 1.3010947379686254e-05, 'epoch': 0.84} {'loss': 0.5066, 'learning_rate': 1.3010626991633865e-05, 'epoch': 0.84} {'loss': 0.4583, 'learning_rate': 1.3010306600183053e-05, 'epoch': 0.84} {'loss': 0.5184, 'learning_rate': 1.3009986205334177e-05, 'epoch': 0.84} {'loss': 0.639, 'learning_rate': 1.3009665807087596e-05, 'epoch': 0.84} {'loss': 0.4805, 'learning_rate': 1.3009345405443678e-05, 'epoch': 0.84} {'loss': 0.5289, 'learning_rate': 1.300902500040278e-05, 'epoch': 0.84} {'loss': 0.4971, 'learning_rate': 1.3008704591965264e-05, 'epoch': 0.84} {'loss': 0.4919, 'learning_rate': 1.3008384180131492e-05, 'epoch': 0.84} {'loss': 0.4963, 'learning_rate': 1.3008063764901828e-05, 'epoch': 0.84} {'loss': 0.4812, 'learning_rate': 1.3007743346276632e-05, 'epoch': 0.84} {'loss': 0.6431, 'learning_rate': 1.3007422924256265e-05, 'epoch': 0.84} {'loss': 0.4606, 'learning_rate': 1.3007102498841091e-05, 'epoch': 0.84} {'loss': 0.5055, 'learning_rate': 1.3006782070031467e-05, 'epoch': 0.84} {'loss': 0.4212, 'learning_rate': 1.300646163782776e-05, 'epoch': 0.84} {'loss': 0.4775, 'learning_rate': 1.3006141202230334e-05, 'epoch': 0.84} {'loss': 0.3672, 'learning_rate': 1.3005820763239538e-05, 'epoch': 0.84} {'loss': 0.7403, 'learning_rate': 1.3005500320855746e-05, 'epoch': 0.84} {'loss': 0.5649, 'learning_rate': 1.3005179875079317e-05, 'epoch': 0.84} {'loss': 0.4212, 'learning_rate': 1.3004859425910608e-05, 'epoch': 0.84} {'loss': 0.5749, 'learning_rate': 1.3004538973349984e-05, 'epoch': 0.84} {'loss': 0.5568, 'learning_rate': 1.3004218517397812e-05, 'epoch': 0.84} {'loss': 0.6569, 'learning_rate': 1.3003898058054443e-05, 'epoch': 0.84} {'loss': 0.5331, 'learning_rate': 1.3003577595320247e-05, 'epoch': 0.84} {'loss': 0.639, 'learning_rate': 1.3003257129195581e-05, 'epoch': 0.84} {'loss': 0.6705, 'learning_rate': 1.3002936659680812e-05, 'epoch': 0.84} {'loss': 0.4516, 'learning_rate': 1.3002616186776296e-05, 'epoch': 0.84} {'loss': 0.5661, 'learning_rate': 1.3002295710482397e-05, 'epoch': 0.84} {'loss': 0.5389, 'learning_rate': 1.300197523079948e-05, 'epoch': 0.84} {'loss': 0.5695, 'learning_rate': 1.3001654747727903e-05, 'epoch': 0.84} {'loss': 0.5808, 'learning_rate': 1.3001334261268026e-05, 'epoch': 0.84} {'loss': 0.5755, 'learning_rate': 1.3001013771420214e-05, 'epoch': 0.84} {'loss': 0.5549, 'learning_rate': 1.3000693278184829e-05, 'epoch': 0.84} {'loss': 0.6012, 'learning_rate': 1.3000372781562232e-05, 'epoch': 0.84} {'loss': 0.6371, 'learning_rate': 1.3000052281552784e-05, 'epoch': 0.84} {'loss': 0.5553, 'learning_rate': 1.2999731778156848e-05, 'epoch': 0.84} {'loss': 0.6349, 'learning_rate': 1.2999411271374784e-05, 'epoch': 0.84} {'loss': 0.5014, 'learning_rate': 1.2999090761206958e-05, 'epoch': 0.84} {'loss': 0.6082, 'learning_rate': 1.2998770247653727e-05, 'epoch': 0.84} {'loss': 0.7247, 'learning_rate': 1.2998449730715454e-05, 'epoch': 0.84} {'loss': 0.5456, 'learning_rate': 1.2998129210392502e-05, 'epoch': 0.84} {'loss': 0.6569, 'learning_rate': 1.2997808686685236e-05, 'epoch': 0.84} {'loss': 0.5166, 'learning_rate': 1.299748815959401e-05, 'epoch': 0.84} {'loss': 0.4698, 'learning_rate': 1.299716762911919e-05, 'epoch': 0.84} {'loss': 0.5476, 'learning_rate': 1.2996847095261136e-05, 'epoch': 0.84} {'loss': 0.5623, 'learning_rate': 1.2996526558020214e-05, 'epoch': 0.84} {'loss': 0.4689, 'learning_rate': 1.2996206017396782e-05, 'epoch': 0.84} {'loss': 0.5229, 'learning_rate': 1.2995885473391203e-05, 'epoch': 0.84} {'loss': 0.4592, 'learning_rate': 1.2995564926003841e-05, 'epoch': 0.84} {'loss': 0.4695, 'learning_rate': 1.2995244375235054e-05, 'epoch': 0.84} {'loss': 0.5827, 'learning_rate': 1.2994923821085205e-05, 'epoch': 0.84} {'loss': 0.4842, 'learning_rate': 1.2994603263554661e-05, 'epoch': 0.84} {'loss': 0.6226, 'learning_rate': 1.2994282702643777e-05, 'epoch': 0.84} {'loss': 0.3629, 'learning_rate': 1.2993962138352916e-05, 'epoch': 0.84} {'loss': 0.6146, 'learning_rate': 1.299364157068244e-05, 'epoch': 0.84} {'loss': 0.6175, 'learning_rate': 1.2993320999632715e-05, 'epoch': 0.84} {'loss': 0.5269, 'learning_rate': 1.29930004252041e-05, 'epoch': 0.84} {'loss': 0.4999, 'learning_rate': 1.2992679847396952e-05, 'epoch': 0.84} {'loss': 0.7236, 'learning_rate': 1.2992359266211643e-05, 'epoch': 0.84} {'loss': 0.4406, 'learning_rate': 1.2992038681648525e-05, 'epoch': 0.84} {'loss': 0.5962, 'learning_rate': 1.2991718093707965e-05, 'epoch': 0.84} {'loss': 0.4892, 'learning_rate': 1.2991397502390326e-05, 'epoch': 0.84} {'loss': 0.4463, 'learning_rate': 1.2991076907695967e-05, 'epoch': 0.84} {'loss': 0.6075, 'learning_rate': 1.2990756309625253e-05, 'epoch': 0.84} {'loss': 0.4342, 'learning_rate': 1.2990435708178544e-05, 'epoch': 0.84} {'loss': 0.4229, 'learning_rate': 1.29901151033562e-05, 'epoch': 0.84} {'loss': 0.6514, 'learning_rate': 1.2989794495158585e-05, 'epoch': 0.84} {'loss': 0.6969, 'learning_rate': 1.2989473883586059e-05, 'epoch': 0.84} {'loss': 0.6708, 'learning_rate': 1.2989153268638987e-05, 'epoch': 0.84} {'loss': 0.6223, 'learning_rate': 1.2988832650317729e-05, 'epoch': 0.84} {'loss': 0.6946, 'learning_rate': 1.2988512028622648e-05, 'epoch': 0.84} {'loss': 0.7141, 'learning_rate': 1.2988191403554105e-05, 'epoch': 0.84} {'loss': 0.5011, 'learning_rate': 1.2987870775112462e-05, 'epoch': 0.84} {'loss': 0.5326, 'learning_rate': 1.298755014329808e-05, 'epoch': 0.84} {'loss': 0.513, 'learning_rate': 1.2987229508111324e-05, 'epoch': 0.84} {'loss': 0.5026, 'learning_rate': 1.2986908869552551e-05, 'epoch': 0.84} {'loss': 0.4139, 'learning_rate': 1.2986588227622128e-05, 'epoch': 0.84} {'loss': 0.5903, 'learning_rate': 1.2986267582320414e-05, 'epoch': 0.84} {'loss': 0.4659, 'learning_rate': 1.2985946933647773e-05, 'epoch': 0.84} {'loss': 0.4884, 'learning_rate': 1.2985626281604566e-05, 'epoch': 0.84} {'loss': 0.5618, 'learning_rate': 1.2985305626191154e-05, 'epoch': 0.84} {'loss': 0.5016, 'learning_rate': 1.29849849674079e-05, 'epoch': 0.84} {'loss': 0.4526, 'learning_rate': 1.2984664305255161e-05, 'epoch': 0.84} {'loss': 0.6319, 'learning_rate': 1.298434363973331e-05, 'epoch': 0.84} {'loss': 0.6061, 'learning_rate': 1.2984022970842698e-05, 'epoch': 0.84} {'loss': 0.5674, 'learning_rate': 1.2983702298583694e-05, 'epoch': 0.84} {'loss': 0.442, 'learning_rate': 1.2983381622956657e-05, 'epoch': 0.84} {'loss': 0.6287, 'learning_rate': 1.298306094396195e-05, 'epoch': 0.84} {'loss': 0.5488, 'learning_rate': 1.2982740261599934e-05, 'epoch': 0.84} {'loss': 0.5258, 'learning_rate': 1.298241957587097e-05, 'epoch': 0.84} {'loss': 0.7181, 'learning_rate': 1.2982098886775423e-05, 'epoch': 0.84} {'loss': 0.4164, 'learning_rate': 1.2981778194313654e-05, 'epoch': 0.84} {'loss': 0.6844, 'learning_rate': 1.2981457498486023e-05, 'epoch': 0.84} {'loss': 0.7087, 'learning_rate': 1.2981136799292895e-05, 'epoch': 0.84} {'loss': 0.5784, 'learning_rate': 1.2980816096734627e-05, 'epoch': 0.84} {'loss': 0.5338, 'learning_rate': 1.2980495390811586e-05, 'epoch': 0.84} {'loss': 0.6465, 'learning_rate': 1.2980174681524134e-05, 'epoch': 0.84} {'loss': 0.6845, 'learning_rate': 1.2979853968872632e-05, 'epoch': 0.84} {'loss': 0.5346, 'learning_rate': 1.297953325285744e-05, 'epoch': 0.84} {'loss': 0.6513, 'learning_rate': 1.297921253347892e-05, 'epoch': 0.84} {'loss': 0.5756, 'learning_rate': 1.2978891810737437e-05, 'epoch': 0.84} {'loss': 0.5316, 'learning_rate': 1.2978571084633354e-05, 'epoch': 0.84} {'loss': 0.6558, 'learning_rate': 1.2978250355167031e-05, 'epoch': 0.84} {'loss': 0.4126, 'learning_rate': 1.2977929622338826e-05, 'epoch': 0.84} {'loss': 0.6202, 'learning_rate': 1.2977608886149104e-05, 'epoch': 0.84} {'loss': 0.4834, 'learning_rate': 1.297728814659823e-05, 'epoch': 0.84} {'loss': 0.4007, 'learning_rate': 1.2976967403686564e-05, 'epoch': 0.84} {'loss': 0.5807, 'learning_rate': 1.2976646657414469e-05, 'epoch': 0.84} {'loss': 0.463, 'learning_rate': 1.2976325907782304e-05, 'epoch': 0.84} {'loss': 0.5551, 'learning_rate': 1.2976005154790432e-05, 'epoch': 0.84} {'loss': 0.7476, 'learning_rate': 1.297568439843922e-05, 'epoch': 0.84} {'loss': 0.5991, 'learning_rate': 1.297536363872902e-05, 'epoch': 0.84} {'loss': 0.6007, 'learning_rate': 1.2975042875660206e-05, 'epoch': 0.84} {'loss': 0.5403, 'learning_rate': 1.2974722109233133e-05, 'epoch': 0.84} {'loss': 0.4052, 'learning_rate': 1.2974401339448166e-05, 'epoch': 0.84} {'loss': 0.5924, 'learning_rate': 1.2974080566305663e-05, 'epoch': 0.84} {'loss': 0.6987, 'learning_rate': 1.2973759789805989e-05, 'epoch': 0.84} {'loss': 0.5261, 'learning_rate': 1.2973439009949505e-05, 'epoch': 0.84} {'loss': 0.4148, 'learning_rate': 1.2973118226736573e-05, 'epoch': 0.84} {'loss': 0.4994, 'learning_rate': 1.297279744016756e-05, 'epoch': 0.84} {'loss': 0.6177, 'learning_rate': 1.297247665024282e-05, 'epoch': 0.84} {'loss': 0.6298, 'learning_rate': 1.297215585696272e-05, 'epoch': 0.84} {'loss': 0.6135, 'learning_rate': 1.2971835060327622e-05, 'epoch': 0.84} {'loss': 0.6633, 'learning_rate': 1.2971514260337888e-05, 'epoch': 0.84} {'loss': 0.4825, 'learning_rate': 1.2971193456993878e-05, 'epoch': 0.85} {'loss': 0.5846, 'learning_rate': 1.2970872650295955e-05, 'epoch': 0.85} {'loss': 0.5599, 'learning_rate': 1.2970551840244483e-05, 'epoch': 0.85} {'loss': 0.4812, 'learning_rate': 1.2970231026839824e-05, 'epoch': 0.85} {'loss': 0.7229, 'learning_rate': 1.2969910210082336e-05, 'epoch': 0.85} {'loss': 0.5986, 'learning_rate': 1.2969589389972389e-05, 'epoch': 0.85} {'loss': 0.4179, 'learning_rate': 1.2969268566510333e-05, 'epoch': 0.85} {'loss': 0.6731, 'learning_rate': 1.2968947739696543e-05, 'epoch': 0.85} {'loss': 0.5647, 'learning_rate': 1.2968626909531374e-05, 'epoch': 0.85} {'loss': 0.4436, 'learning_rate': 1.2968306076015189e-05, 'epoch': 0.85} {'loss': 0.5753, 'learning_rate': 1.296798523914835e-05, 'epoch': 0.85} {'loss': 0.5975, 'learning_rate': 1.2967664398931223e-05, 'epoch': 0.85} {'loss': 0.5101, 'learning_rate': 1.2967343555364167e-05, 'epoch': 0.85} {'loss': 0.5939, 'learning_rate': 1.296702270844754e-05, 'epoch': 0.85} {'loss': 0.5432, 'learning_rate': 1.2966701858181714e-05, 'epoch': 0.85} {'loss': 0.5798, 'learning_rate': 1.2966381004567044e-05, 'epoch': 0.85} {'loss': 0.5749, 'learning_rate': 1.2966060147603895e-05, 'epoch': 0.85} {'loss': 0.5702, 'learning_rate': 1.2965739287292627e-05, 'epoch': 0.85} {'loss': 0.5299, 'learning_rate': 1.2965418423633602e-05, 'epoch': 0.85} {'loss': 0.6502, 'learning_rate': 1.2965097556627184e-05, 'epoch': 0.85} {'loss': 0.5235, 'learning_rate': 1.2964776686273735e-05, 'epoch': 0.85} {'loss': 0.4384, 'learning_rate': 1.2964455812573615e-05, 'epoch': 0.85} {'loss': 0.602, 'learning_rate': 1.296413493552719e-05, 'epoch': 0.85} {'loss': 0.7294, 'learning_rate': 1.296381405513482e-05, 'epoch': 0.85} {'loss': 0.7005, 'learning_rate': 1.2963493171396868e-05, 'epoch': 0.85} {'loss': 0.583, 'learning_rate': 1.2963172284313697e-05, 'epoch': 0.85} {'loss': 0.4235, 'learning_rate': 1.2962851393885665e-05, 'epoch': 0.85} {'loss': 0.5209, 'learning_rate': 1.296253050011314e-05, 'epoch': 0.85} {'loss': 0.4649, 'learning_rate': 1.2962209602996481e-05, 'epoch': 0.85} {'loss': 0.4295, 'learning_rate': 1.296188870253605e-05, 'epoch': 0.85} {'loss': 0.6267, 'learning_rate': 1.2961567798732211e-05, 'epoch': 0.85} {'loss': 0.5259, 'learning_rate': 1.2961246891585321e-05, 'epoch': 0.85} {'loss': 0.7226, 'learning_rate': 1.296092598109575e-05, 'epoch': 0.85} {'loss': 0.493, 'learning_rate': 1.2960605067263857e-05, 'epoch': 0.85} {'loss': 0.4938, 'learning_rate': 1.2960284150090001e-05, 'epoch': 0.85} {'loss': 0.6107, 'learning_rate': 1.2959963229574548e-05, 'epoch': 0.85} {'loss': 0.5598, 'learning_rate': 1.295964230571786e-05, 'epoch': 0.85} {'loss': 0.417, 'learning_rate': 1.29593213785203e-05, 'epoch': 0.85} {'loss': 0.502, 'learning_rate': 1.2959000447982228e-05, 'epoch': 0.85} {'loss': 0.7869, 'learning_rate': 1.2958679514104007e-05, 'epoch': 0.85} {'loss': 0.5299, 'learning_rate': 1.2958358576886002e-05, 'epoch': 0.85} {'loss': 0.4879, 'learning_rate': 1.2958037636328568e-05, 'epoch': 0.85} {'loss': 0.5666, 'learning_rate': 1.2957716692432074e-05, 'epoch': 0.85} {'loss': 0.6277, 'learning_rate': 1.2957395745196882e-05, 'epoch': 0.85} {'loss': 0.5868, 'learning_rate': 1.295707479462335e-05, 'epoch': 0.85} {'loss': 0.4184, 'learning_rate': 1.2956753840711844e-05, 'epoch': 0.85} {'loss': 0.5388, 'learning_rate': 1.2956432883462724e-05, 'epoch': 0.85} {'loss': 0.5486, 'learning_rate': 1.2956111922876355e-05, 'epoch': 0.85} {'loss': 0.512, 'learning_rate': 1.2955790958953098e-05, 'epoch': 0.85} {'loss': 0.6872, 'learning_rate': 1.2955469991693315e-05, 'epoch': 0.85} {'loss': 0.562, 'learning_rate': 1.2955149021097366e-05, 'epoch': 0.85} {'loss': 0.5752, 'learning_rate': 1.2954828047165617e-05, 'epoch': 0.85} {'loss': 0.6, 'learning_rate': 1.295450706989843e-05, 'epoch': 0.85} {'loss': 0.6451, 'learning_rate': 1.2954186089296169e-05, 'epoch': 0.85} {'loss': 0.5375, 'learning_rate': 1.2953865105359188e-05, 'epoch': 0.85} {'loss': 0.6333, 'learning_rate': 1.295354411808786e-05, 'epoch': 0.85} {'loss': 0.5108, 'learning_rate': 1.2953223127482537e-05, 'epoch': 0.85} {'loss': 0.635, 'learning_rate': 1.295290213354359e-05, 'epoch': 0.85} {'loss': 0.5143, 'learning_rate': 1.2952581136271379e-05, 'epoch': 0.85} {'loss': 0.5917, 'learning_rate': 1.2952260135666264e-05, 'epoch': 0.85} {'loss': 0.5459, 'learning_rate': 1.2951939131728608e-05, 'epoch': 0.85} {'loss': 0.4799, 'learning_rate': 1.2951618124458773e-05, 'epoch': 0.85} {'loss': 0.5316, 'learning_rate': 1.2951297113857124e-05, 'epoch': 0.85} {'loss': 0.2953, 'learning_rate': 1.2950976099924022e-05, 'epoch': 0.85} {'loss': 0.6501, 'learning_rate': 1.295065508265983e-05, 'epoch': 0.85} {'loss': 0.6518, 'learning_rate': 1.295033406206491e-05, 'epoch': 0.85} {'loss': 0.5971, 'learning_rate': 1.2950013038139622e-05, 'epoch': 0.85} {'loss': 0.5558, 'learning_rate': 1.294969201088433e-05, 'epoch': 0.85} {'loss': 0.5326, 'learning_rate': 1.2949370980299398e-05, 'epoch': 0.85} {'loss': 0.5743, 'learning_rate': 1.2949049946385185e-05, 'epoch': 0.85} {'loss': 0.4473, 'learning_rate': 1.2948728909142057e-05, 'epoch': 0.85} {'loss': 0.4258, 'learning_rate': 1.2948407868570371e-05, 'epoch': 0.85} {'loss': 0.5401, 'learning_rate': 1.2948086824670499e-05, 'epoch': 0.85} {'loss': 0.3829, 'learning_rate': 1.2947765777442793e-05, 'epoch': 0.85} {'loss': 0.5024, 'learning_rate': 1.2947444726887622e-05, 'epoch': 0.85} {'loss': 0.5438, 'learning_rate': 1.2947123673005346e-05, 'epoch': 0.85} {'loss': 0.7072, 'learning_rate': 1.2946802615796332e-05, 'epoch': 0.85} {'loss': 0.485, 'learning_rate': 1.2946481555260934e-05, 'epoch': 0.85} {'loss': 0.6413, 'learning_rate': 1.2946160491399517e-05, 'epoch': 0.85} {'loss': 0.6053, 'learning_rate': 1.2945839424212449e-05, 'epoch': 0.85} {'loss': 0.5335, 'learning_rate': 1.2945518353700085e-05, 'epoch': 0.85} {'loss': 0.5502, 'learning_rate': 1.2945197279862794e-05, 'epoch': 0.85} {'loss': 0.5941, 'learning_rate': 1.2944876202700934e-05, 'epoch': 0.85} {'loss': 0.6007, 'learning_rate': 1.2944555122214869e-05, 'epoch': 0.85} {'loss': 0.6006, 'learning_rate': 1.2944234038404959e-05, 'epoch': 0.85} {'loss': 0.5766, 'learning_rate': 1.294391295127157e-05, 'epoch': 0.85} {'loss': 0.7098, 'learning_rate': 1.2943591860815064e-05, 'epoch': 0.85} {'loss': 0.6487, 'learning_rate': 1.2943270767035803e-05, 'epoch': 0.85} {'loss': 0.6445, 'learning_rate': 1.2942949669934147e-05, 'epoch': 0.85} {'loss': 0.5411, 'learning_rate': 1.2942628569510463e-05, 'epoch': 0.85} {'loss': 0.512, 'learning_rate': 1.2942307465765112e-05, 'epoch': 0.85} {'loss': 0.5434, 'learning_rate': 1.294198635869845e-05, 'epoch': 0.85} {'loss': 0.438, 'learning_rate': 1.2941665248310849e-05, 'epoch': 0.85} {'loss': 0.4862, 'learning_rate': 1.2941344134602664e-05, 'epoch': 0.85} {'loss': 0.6888, 'learning_rate': 1.2941023017574263e-05, 'epoch': 0.85} {'loss': 0.4866, 'learning_rate': 1.2940701897226006e-05, 'epoch': 0.85} {'loss': 0.8206, 'learning_rate': 1.2940380773558256e-05, 'epoch': 0.85} {'loss': 0.5899, 'learning_rate': 1.2940059646571377e-05, 'epoch': 0.85} {'loss': 0.6563, 'learning_rate': 1.2939738516265727e-05, 'epoch': 0.85} {'loss': 0.7423, 'learning_rate': 1.293941738264167e-05, 'epoch': 0.85} {'loss': 0.5915, 'learning_rate': 1.2939096245699574e-05, 'epoch': 0.85} {'loss': 0.6431, 'learning_rate': 1.2938775105439793e-05, 'epoch': 0.85} {'loss': 0.7381, 'learning_rate': 1.2938453961862696e-05, 'epoch': 0.85} {'loss': 0.5248, 'learning_rate': 1.2938132814968645e-05, 'epoch': 0.85} {'loss': 0.5623, 'learning_rate': 1.2937811664758e-05, 'epoch': 0.85} {'loss': 0.456, 'learning_rate': 1.2937490511231122e-05, 'epoch': 0.85} {'loss': 0.6905, 'learning_rate': 1.2937169354388377e-05, 'epoch': 0.85} {'loss': 0.4482, 'learning_rate': 1.2936848194230124e-05, 'epoch': 0.85} {'loss': 0.5244, 'learning_rate': 1.2936527030756731e-05, 'epoch': 0.85} {'loss': 0.6085, 'learning_rate': 1.2936205863968556e-05, 'epoch': 0.85} {'loss': 0.6337, 'learning_rate': 1.2935884693865965e-05, 'epoch': 0.85} {'loss': 0.5127, 'learning_rate': 1.2935563520449317e-05, 'epoch': 0.85} {'loss': 0.6768, 'learning_rate': 1.2935242343718975e-05, 'epoch': 0.85} {'loss': 0.5336, 'learning_rate': 1.2934921163675303e-05, 'epoch': 0.85} {'loss': 0.7103, 'learning_rate': 1.2934599980318662e-05, 'epoch': 0.85} {'loss': 0.4938, 'learning_rate': 1.2934278793649418e-05, 'epoch': 0.85} {'loss': 0.6026, 'learning_rate': 1.2933957603667933e-05, 'epoch': 0.85} {'loss': 0.5428, 'learning_rate': 1.2933636410374564e-05, 'epoch': 0.85} {'loss': 0.5185, 'learning_rate': 1.2933315213769679e-05, 'epoch': 0.85} {'loss': 0.5344, 'learning_rate': 1.2932994013853639e-05, 'epoch': 0.85} {'loss': 0.4794, 'learning_rate': 1.2932672810626803e-05, 'epoch': 0.85} {'loss': 0.402, 'learning_rate': 1.2932351604089538e-05, 'epoch': 0.85} {'loss': 0.539, 'learning_rate': 1.293203039424221e-05, 'epoch': 0.85} {'loss': 0.5416, 'learning_rate': 1.2931709181085173e-05, 'epoch': 0.85} {'loss': 0.5773, 'learning_rate': 1.2931387964618795e-05, 'epoch': 0.85} {'loss': 0.5239, 'learning_rate': 1.293106674484344e-05, 'epoch': 0.85} {'loss': 0.6633, 'learning_rate': 1.2930745521759468e-05, 'epoch': 0.85} {'loss': 0.6592, 'learning_rate': 1.293042429536724e-05, 'epoch': 0.85} {'loss': 0.75, 'learning_rate': 1.2930103065667119e-05, 'epoch': 0.85} {'loss': 0.5954, 'learning_rate': 1.292978183265947e-05, 'epoch': 0.85} {'loss': 0.5278, 'learning_rate': 1.2929460596344654e-05, 'epoch': 0.85} {'loss': 0.6953, 'learning_rate': 1.2929139356723033e-05, 'epoch': 0.85} {'loss': 0.5979, 'learning_rate': 1.2928818113794971e-05, 'epoch': 0.85} {'loss': 0.5533, 'learning_rate': 1.2928496867560832e-05, 'epoch': 0.85} {'loss': 0.5514, 'learning_rate': 1.2928175618020977e-05, 'epoch': 0.85} {'loss': 0.4657, 'learning_rate': 1.2927854365175768e-05, 'epoch': 0.85} {'loss': 0.5384, 'learning_rate': 1.2927533109025568e-05, 'epoch': 0.85} {'loss': 0.559, 'learning_rate': 1.2927211849570738e-05, 'epoch': 0.85} {'loss': 0.4623, 'learning_rate': 1.2926890586811645e-05, 'epoch': 0.85} {'loss': 0.5606, 'learning_rate': 1.292656932074865e-05, 'epoch': 0.85} {'loss': 0.6092, 'learning_rate': 1.2926248051382113e-05, 'epoch': 0.85} {'loss': 0.437, 'learning_rate': 1.2925926778712397e-05, 'epoch': 0.85} {'loss': 0.5238, 'learning_rate': 1.2925605502739869e-05, 'epoch': 0.85} {'loss': 0.5921, 'learning_rate': 1.2925284223464887e-05, 'epoch': 0.85} {'loss': 0.5543, 'learning_rate': 1.2924962940887815e-05, 'epoch': 0.85} {'loss': 0.615, 'learning_rate': 1.2924641655009017e-05, 'epoch': 0.85} {'loss': 0.6202, 'learning_rate': 1.2924320365828853e-05, 'epoch': 0.85} {'loss': 0.5392, 'learning_rate': 1.2923999073347689e-05, 'epoch': 0.85} {'loss': 0.7202, 'learning_rate': 1.2923677777565886e-05, 'epoch': 0.85} {'loss': 0.5452, 'learning_rate': 1.2923356478483806e-05, 'epoch': 0.85} {'loss': 0.6005, 'learning_rate': 1.2923035176101813e-05, 'epoch': 0.85} {'loss': 0.5718, 'learning_rate': 1.2922713870420269e-05, 'epoch': 0.85} {'loss': 0.6015, 'learning_rate': 1.2922392561439538e-05, 'epoch': 0.85} {'loss': 0.664, 'learning_rate': 1.292207124915998e-05, 'epoch': 0.85} {'loss': 0.5109, 'learning_rate': 1.292174993358196e-05, 'epoch': 0.85} {'loss': 0.5587, 'learning_rate': 1.292142861470584e-05, 'epoch': 0.85} {'loss': 0.5466, 'learning_rate': 1.292110729253198e-05, 'epoch': 0.85} {'loss': 0.736, 'learning_rate': 1.2920785967060749e-05, 'epoch': 0.85} {'loss': 0.5034, 'learning_rate': 1.2920464638292505e-05, 'epoch': 0.85} {'loss': 0.6096, 'learning_rate': 1.292014330622761e-05, 'epoch': 0.85} {'loss': 0.3933, 'learning_rate': 1.291982197086643e-05, 'epoch': 0.85} {'loss': 0.5785, 'learning_rate': 1.2919500632209326e-05, 'epoch': 0.85} {'loss': 0.5143, 'learning_rate': 1.291917929025666e-05, 'epoch': 0.85} {'loss': 0.6362, 'learning_rate': 1.2918857945008798e-05, 'epoch': 0.85} {'loss': 0.5602, 'learning_rate': 1.2918536596466099e-05, 'epoch': 0.85} {'loss': 0.502, 'learning_rate': 1.291821524462893e-05, 'epoch': 0.85} {'loss': 0.6159, 'learning_rate': 1.2917893889497648e-05, 'epoch': 0.85} {'loss': 0.6637, 'learning_rate': 1.2917572531072617e-05, 'epoch': 0.85} {'loss': 0.4793, 'learning_rate': 1.2917251169354204e-05, 'epoch': 0.85} {'loss': 0.5435, 'learning_rate': 1.2916929804342769e-05, 'epoch': 0.85} {'loss': 0.6408, 'learning_rate': 1.2916608436038671e-05, 'epoch': 0.85} {'loss': 0.5401, 'learning_rate': 1.2916287064442282e-05, 'epoch': 0.85} {'loss': 0.7048, 'learning_rate': 1.2915965689553956e-05, 'epoch': 0.85} {'loss': 0.6962, 'learning_rate': 1.291564431137406e-05, 'epoch': 0.85} {'loss': 0.4706, 'learning_rate': 1.2915322929902958e-05, 'epoch': 0.85} {'loss': 0.6238, 'learning_rate': 1.2915001545141008e-05, 'epoch': 0.85} {'loss': 0.5415, 'learning_rate': 1.291468015708858e-05, 'epoch': 0.85} {'loss': 0.4704, 'learning_rate': 1.2914358765746029e-05, 'epoch': 0.85} {'loss': 0.5752, 'learning_rate': 1.2914037371113721e-05, 'epoch': 0.85} {'loss': 0.5607, 'learning_rate': 1.291371597319202e-05, 'epoch': 0.85} {'loss': 0.5445, 'learning_rate': 1.2913394571981287e-05, 'epoch': 0.85} {'loss': 0.5703, 'learning_rate': 1.2913073167481886e-05, 'epoch': 0.85} {'loss': 0.5437, 'learning_rate': 1.291275175969418e-05, 'epoch': 0.85} {'loss': 0.4868, 'learning_rate': 1.291243034861853e-05, 'epoch': 0.85} {'loss': 0.672, 'learning_rate': 1.29121089342553e-05, 'epoch': 0.85} {'loss': 0.6189, 'learning_rate': 1.2911787516604852e-05, 'epoch': 0.85} {'loss': 0.6017, 'learning_rate': 1.291146609566755e-05, 'epoch': 0.85} {'loss': 0.6321, 'learning_rate': 1.2911144671443759e-05, 'epoch': 0.85} {'loss': 0.4539, 'learning_rate': 1.2910823243933837e-05, 'epoch': 0.85} {'loss': 0.7719, 'learning_rate': 1.291050181313815e-05, 'epoch': 0.85} {'loss': 0.6569, 'learning_rate': 1.291018037905706e-05, 'epoch': 0.85} {'loss': 0.6488, 'learning_rate': 1.2909858941690929e-05, 'epoch': 0.85} {'loss': 0.5057, 'learning_rate': 1.2909537501040119e-05, 'epoch': 0.85} {'loss': 0.5854, 'learning_rate': 1.2909216057104997e-05, 'epoch': 0.85} {'loss': 0.4624, 'learning_rate': 1.2908894609885922e-05, 'epoch': 0.85} {'loss': 0.4199, 'learning_rate': 1.290857315938326e-05, 'epoch': 0.85} {'loss': 0.4139, 'learning_rate': 1.290825170559737e-05, 'epoch': 0.85} {'loss': 0.3257, 'learning_rate': 1.2907930248528617e-05, 'epoch': 0.85} {'loss': 0.5103, 'learning_rate': 1.2907608788177364e-05, 'epoch': 0.85} {'loss': 0.5424, 'learning_rate': 1.2907287324543974e-05, 'epoch': 0.85} {'loss': 0.4347, 'learning_rate': 1.2906965857628809e-05, 'epoch': 0.85} {'loss': 0.6725, 'learning_rate': 1.2906644387432233e-05, 'epoch': 0.85} {'loss': 0.7243, 'learning_rate': 1.2906322913954607e-05, 'epoch': 0.85} {'loss': 0.7064, 'learning_rate': 1.2906001437196295e-05, 'epoch': 0.85} {'loss': 0.5487, 'learning_rate': 1.2905679957157662e-05, 'epoch': 0.85} {'loss': 0.5153, 'learning_rate': 1.2905358473839069e-05, 'epoch': 0.85} {'loss': 0.5246, 'learning_rate': 1.2905036987240876e-05, 'epoch': 0.85} {'loss': 0.4834, 'learning_rate': 1.2904715497363452e-05, 'epoch': 0.85} {'loss': 0.5002, 'learning_rate': 1.2904394004207153e-05, 'epoch': 0.85} {'loss': 0.5641, 'learning_rate': 1.2904072507772348e-05, 'epoch': 0.85} {'loss': 0.4543, 'learning_rate': 1.2903751008059396e-05, 'epoch': 0.85} {'loss': 0.576, 'learning_rate': 1.290342950506866e-05, 'epoch': 0.85} {'loss': 0.5484, 'learning_rate': 1.2903107998800505e-05, 'epoch': 0.85} {'loss': 0.6505, 'learning_rate': 1.2902786489255295e-05, 'epoch': 0.85} {'loss': 0.5902, 'learning_rate': 1.2902464976433392e-05, 'epoch': 0.85} {'loss': 0.6931, 'learning_rate': 1.2902143460335157e-05, 'epoch': 0.85} {'loss': 0.4667, 'learning_rate': 1.2901821940960952e-05, 'epoch': 0.85} {'loss': 0.6099, 'learning_rate': 1.2901500418311143e-05, 'epoch': 0.85} {'loss': 0.6915, 'learning_rate': 1.290117889238609e-05, 'epoch': 0.85} {'loss': 0.6423, 'learning_rate': 1.2900857363186158e-05, 'epoch': 0.85} {'loss': 0.5304, 'learning_rate': 1.2900535830711712e-05, 'epoch': 0.85} {'loss': 0.5555, 'learning_rate': 1.2900214294963109e-05, 'epoch': 0.85} {'loss': 0.5167, 'learning_rate': 1.289989275594072e-05, 'epoch': 0.85} {'loss': 0.5842, 'learning_rate': 1.2899571213644901e-05, 'epoch': 0.85} {'loss': 0.388, 'learning_rate': 1.2899249668076016e-05, 'epoch': 0.85} {'loss': 0.6716, 'learning_rate': 1.2898928119234434e-05, 'epoch': 0.85} {'loss': 0.6922, 'learning_rate': 1.2898606567120514e-05, 'epoch': 0.85} {'loss': 0.5625, 'learning_rate': 1.2898285011734615e-05, 'epoch': 0.85} {'loss': 0.6892, 'learning_rate': 1.2897963453077103e-05, 'epoch': 0.85} {'loss': 0.5904, 'learning_rate': 1.289764189114834e-05, 'epoch': 0.85} {'loss': 0.595, 'learning_rate': 1.2897320325948692e-05, 'epoch': 0.85} {'loss': 0.527, 'learning_rate': 1.2896998757478522e-05, 'epoch': 0.85} {'loss': 0.6254, 'learning_rate': 1.289667718573819e-05, 'epoch': 0.85} {'loss': 0.6973, 'learning_rate': 1.2896355610728059e-05, 'epoch': 0.85} {'loss': 0.448, 'learning_rate': 1.2896034032448495e-05, 'epoch': 0.85} {'loss': 0.6037, 'learning_rate': 1.2895712450899858e-05, 'epoch': 0.85} {'loss': 0.5293, 'learning_rate': 1.2895390866082513e-05, 'epoch': 0.85} {'loss': 0.6004, 'learning_rate': 1.2895069277996823e-05, 'epoch': 0.85} {'loss': 0.4187, 'learning_rate': 1.289474768664315e-05, 'epoch': 0.85} {'loss': 0.4414, 'learning_rate': 1.2894426092021858e-05, 'epoch': 0.85} {'loss': 0.4767, 'learning_rate': 1.2894104494133309e-05, 'epoch': 0.85} {'loss': 0.5868, 'learning_rate': 1.2893782892977863e-05, 'epoch': 0.85} {'loss': 0.3774, 'learning_rate': 1.2893461288555891e-05, 'epoch': 0.85} {'loss': 0.5806, 'learning_rate': 1.289313968086775e-05, 'epoch': 0.85} {'loss': 0.666, 'learning_rate': 1.2892818069913804e-05, 'epoch': 0.85} {'loss': 0.5884, 'learning_rate': 1.2892496455694416e-05, 'epoch': 0.85} {'loss': 0.3624, 'learning_rate': 1.289217483820995e-05, 'epoch': 0.85} {'loss': 0.5167, 'learning_rate': 1.2891853217460768e-05, 'epoch': 0.85} {'loss': 0.4405, 'learning_rate': 1.2891531593447236e-05, 'epoch': 0.85} {'loss': 0.4013, 'learning_rate': 1.2891209966169711e-05, 'epoch': 0.85} {'loss': 0.7165, 'learning_rate': 1.2890888335628561e-05, 'epoch': 0.85} {'loss': 0.6693, 'learning_rate': 1.289056670182415e-05, 'epoch': 0.85} {'loss': 0.7291, 'learning_rate': 1.2890245064756838e-05, 'epoch': 0.85} {'loss': 0.3539, 'learning_rate': 1.288992342442699e-05, 'epoch': 0.85} {'loss': 0.4701, 'learning_rate': 1.2889601780834963e-05, 'epoch': 0.85} {'loss': 0.463, 'learning_rate': 1.288928013398113e-05, 'epoch': 0.85} {'loss': 0.6532, 'learning_rate': 1.2888958483865848e-05, 'epoch': 0.85} {'loss': 0.515, 'learning_rate': 1.2888636830489478e-05, 'epoch': 0.85} {'loss': 0.5531, 'learning_rate': 1.288831517385239e-05, 'epoch': 0.85} {'loss': 0.5049, 'learning_rate': 1.2887993513954942e-05, 'epoch': 0.85} {'loss': 0.6807, 'learning_rate': 1.2887671850797498e-05, 'epoch': 0.85} {'loss': 0.4943, 'learning_rate': 1.2887350184380422e-05, 'epoch': 0.85} {'loss': 0.433, 'learning_rate': 1.2887028514704079e-05, 'epoch': 0.85} {'loss': 0.4723, 'learning_rate': 1.2886706841768828e-05, 'epoch': 0.85} {'loss': 0.5517, 'learning_rate': 1.2886385165575032e-05, 'epoch': 0.85} {'loss': 0.665, 'learning_rate': 1.2886063486123061e-05, 'epoch': 0.85} {'loss': 0.626, 'learning_rate': 1.288574180341327e-05, 'epoch': 0.85} {'loss': 0.626, 'learning_rate': 1.2885420117446026e-05, 'epoch': 0.85} {'loss': 0.4607, 'learning_rate': 1.288509842822169e-05, 'epoch': 0.85} {'loss': 0.6875, 'learning_rate': 1.2884776735740624e-05, 'epoch': 0.85} {'loss': 0.6093, 'learning_rate': 1.2884455040003196e-05, 'epoch': 0.85} {'loss': 0.5626, 'learning_rate': 1.288413334100977e-05, 'epoch': 0.85} {'loss': 0.5247, 'learning_rate': 1.2883811638760704e-05, 'epoch': 0.85} {'loss': 0.462, 'learning_rate': 1.288348993325636e-05, 'epoch': 0.85} {'loss': 0.4815, 'learning_rate': 1.2883168224497107e-05, 'epoch': 0.85} {'loss': 0.6478, 'learning_rate': 1.2882846512483308e-05, 'epoch': 0.85} {'loss': 0.6628, 'learning_rate': 1.2882524797215319e-05, 'epoch': 0.85} {'loss': 0.6054, 'learning_rate': 1.288220307869351e-05, 'epoch': 0.85} {'loss': 0.4288, 'learning_rate': 1.288188135691824e-05, 'epoch': 0.85} {'loss': 0.6222, 'learning_rate': 1.2881559631889875e-05, 'epoch': 0.85} {'loss': 0.5702, 'learning_rate': 1.2881237903608779e-05, 'epoch': 0.85} {'loss': 0.4806, 'learning_rate': 1.288091617207531e-05, 'epoch': 0.85} {'loss': 0.4983, 'learning_rate': 1.2880594437289834e-05, 'epoch': 0.85} {'loss': 0.652, 'learning_rate': 1.2880272699252718e-05, 'epoch': 0.85} {'loss': 0.686, 'learning_rate': 1.287995095796432e-05, 'epoch': 0.85} {'loss': 0.5501, 'learning_rate': 1.2879629213425005e-05, 'epoch': 0.85} {'loss': 0.5479, 'learning_rate': 1.2879307465635136e-05, 'epoch': 0.85} {'loss': 0.469, 'learning_rate': 1.2878985714595077e-05, 'epoch': 0.85} {'loss': 0.5664, 'learning_rate': 1.2878663960305192e-05, 'epoch': 0.85} {'loss': 0.5361, 'learning_rate': 1.2878342202765844e-05, 'epoch': 0.85} {'loss': 0.5723, 'learning_rate': 1.287802044197739e-05, 'epoch': 0.85} {'loss': 0.5241, 'learning_rate': 1.28776986779402e-05, 'epoch': 0.85} {'loss': 0.5299, 'learning_rate': 1.2877376910654638e-05, 'epoch': 0.85} {'loss': 0.5295, 'learning_rate': 1.2877055140121062e-05, 'epoch': 0.85} {'loss': 0.5807, 'learning_rate': 1.2876733366339837e-05, 'epoch': 0.85} {'loss': 0.4924, 'learning_rate': 1.287641158931133e-05, 'epoch': 0.85} {'loss': 0.5603, 'learning_rate': 1.2876089809035898e-05, 'epoch': 0.85} {'loss': 0.5642, 'learning_rate': 1.2875768025513908e-05, 'epoch': 0.85} {'loss': 0.5129, 'learning_rate': 1.2875446238745726e-05, 'epoch': 0.85} {'loss': 0.5608, 'learning_rate': 1.2875124448731708e-05, 'epoch': 0.85} {'loss': 0.6867, 'learning_rate': 1.2874802655472224e-05, 'epoch': 0.85} {'loss': 0.5368, 'learning_rate': 1.2874480858967635e-05, 'epoch': 0.85} {'loss': 0.4754, 'learning_rate': 1.2874159059218303e-05, 'epoch': 0.85} {'loss': 0.6361, 'learning_rate': 1.2873837256224593e-05, 'epoch': 0.85} {'loss': 0.544, 'learning_rate': 1.2873515449986864e-05, 'epoch': 0.85} {'loss': 0.581, 'learning_rate': 1.2873193640505484e-05, 'epoch': 0.85} {'loss': 0.6292, 'learning_rate': 1.2872871827780816e-05, 'epoch': 0.85} {'loss': 0.7342, 'learning_rate': 1.2872550011813219e-05, 'epoch': 0.85} {'loss': 0.4959, 'learning_rate': 1.2872228192603063e-05, 'epoch': 0.85} {'loss': 0.5407, 'learning_rate': 1.2871906370150704e-05, 'epoch': 0.85} {'loss': 0.5866, 'learning_rate': 1.287158454445651e-05, 'epoch': 0.85} {'loss': 0.6911, 'learning_rate': 1.2871262715520844e-05, 'epoch': 0.85} {'loss': 0.5665, 'learning_rate': 1.2870940883344067e-05, 'epoch': 0.85} {'loss': 0.5021, 'learning_rate': 1.2870619047926548e-05, 'epoch': 0.85} {'loss': 0.5469, 'learning_rate': 1.287029720926864e-05, 'epoch': 0.85} {'loss': 0.5955, 'learning_rate': 1.2869975367370717e-05, 'epoch': 0.85} {'loss': 0.617, 'learning_rate': 1.2869653522233137e-05, 'epoch': 0.85} {'loss': 0.4271, 'learning_rate': 1.286933167385626e-05, 'epoch': 0.85} {'loss': 0.6439, 'learning_rate': 1.2869009822240455e-05, 'epoch': 0.85} {'loss': 0.4455, 'learning_rate': 1.2868687967386082e-05, 'epoch': 0.85} {'loss': 0.5875, 'learning_rate': 1.2868366109293509e-05, 'epoch': 0.85} {'loss': 0.6891, 'learning_rate': 1.2868044247963095e-05, 'epoch': 0.85} {'loss': 0.6132, 'learning_rate': 1.2867722383395202e-05, 'epoch': 0.85} {'loss': 0.5158, 'learning_rate': 1.2867400515590198e-05, 'epoch': 0.85} {'loss': 0.6368, 'learning_rate': 1.2867078644548445e-05, 'epoch': 0.85} {'loss': 0.6355, 'learning_rate': 1.2866756770270308e-05, 'epoch': 0.85} {'loss': 0.704, 'learning_rate': 1.2866434892756144e-05, 'epoch': 0.85} {'loss': 0.5414, 'learning_rate': 1.2866113012006319e-05, 'epoch': 0.85} {'loss': 0.7007, 'learning_rate': 1.2865791128021198e-05, 'epoch': 0.85} {'loss': 0.5676, 'learning_rate': 1.2865469240801144e-05, 'epoch': 0.85} {'loss': 0.4859, 'learning_rate': 1.2865147350346524e-05, 'epoch': 0.85} {'loss': 0.5227, 'learning_rate': 1.2864825456657692e-05, 'epoch': 0.85} {'loss': 0.5827, 'learning_rate': 1.2864503559735018e-05, 'epoch': 0.85} {'loss': 0.4084, 'learning_rate': 1.2864181659578865e-05, 'epoch': 0.85} {'loss': 0.4722, 'learning_rate': 1.2863859756189596e-05, 'epoch': 0.85} {'loss': 0.48, 'learning_rate': 1.2863537849567574e-05, 'epoch': 0.85} {'loss': 0.4675, 'learning_rate': 1.2863215939713163e-05, 'epoch': 0.85} {'loss': 0.5965, 'learning_rate': 1.2862894026626722e-05, 'epoch': 0.85} {'loss': 0.6586, 'learning_rate': 1.2862572110308624e-05, 'epoch': 0.85} {'loss': 0.6495, 'learning_rate': 1.2862250190759221e-05, 'epoch': 0.85} {'loss': 0.4557, 'learning_rate': 1.2861928267978888e-05, 'epoch': 0.85} {'loss': 0.7004, 'learning_rate': 1.2861606341967976e-05, 'epoch': 0.85} {'loss': 0.6388, 'learning_rate': 1.2861284412726857e-05, 'epoch': 0.85} {'loss': 0.6763, 'learning_rate': 1.2860962480255893e-05, 'epoch': 0.85} {'loss': 0.6618, 'learning_rate': 1.2860640544555443e-05, 'epoch': 0.85} {'loss': 0.4413, 'learning_rate': 1.2860318605625876e-05, 'epoch': 0.85} {'loss': 0.5932, 'learning_rate': 1.2859996663467553e-05, 'epoch': 0.85} {'loss': 0.5175, 'learning_rate': 1.2859674718080836e-05, 'epoch': 0.85} {'loss': 0.5034, 'learning_rate': 1.2859352769466093e-05, 'epoch': 0.85} {'loss': 0.5667, 'learning_rate': 1.2859030817623683e-05, 'epoch': 0.85} {'loss': 0.5892, 'learning_rate': 1.2858708862553972e-05, 'epoch': 0.85} {'loss': 0.4633, 'learning_rate': 1.2858386904257323e-05, 'epoch': 0.85} {'loss': 0.4626, 'learning_rate': 1.2858064942734097e-05, 'epoch': 0.85} {'loss': 0.5544, 'learning_rate': 1.285774297798466e-05, 'epoch': 0.85} {'loss': 0.5259, 'learning_rate': 1.2857421010009372e-05, 'epoch': 0.85} {'loss': 0.432, 'learning_rate': 1.2857099038808603e-05, 'epoch': 0.85} {'loss': 0.5586, 'learning_rate': 1.2856777064382709e-05, 'epoch': 0.85} {'loss': 0.5186, 'learning_rate': 1.2856455086732059e-05, 'epoch': 0.85} {'loss': 0.7453, 'learning_rate': 1.2856133105857013e-05, 'epoch': 0.85} {'loss': 0.5233, 'learning_rate': 1.2855811121757937e-05, 'epoch': 0.85} {'loss': 0.6589, 'learning_rate': 1.2855489134435193e-05, 'epoch': 0.85} {'loss': 0.5053, 'learning_rate': 1.2855167143889144e-05, 'epoch': 0.85} {'loss': 0.453, 'learning_rate': 1.2854845150120155e-05, 'epoch': 0.85} {'loss': 0.5386, 'learning_rate': 1.2854523153128588e-05, 'epoch': 0.85} {'loss': 0.6053, 'learning_rate': 1.2854201152914811e-05, 'epoch': 0.85} {'loss': 0.629, 'learning_rate': 1.285387914947918e-05, 'epoch': 0.85} {'loss': 0.5442, 'learning_rate': 1.2853557142822061e-05, 'epoch': 0.85} {'loss': 0.6236, 'learning_rate': 1.2853235132943822e-05, 'epoch': 0.85} {'loss': 0.6343, 'learning_rate': 1.2852913119844819e-05, 'epoch': 0.85} {'loss': 0.397, 'learning_rate': 1.285259110352542e-05, 'epoch': 0.85} {'loss': 0.6796, 'learning_rate': 1.285226908398599e-05, 'epoch': 0.85} {'loss': 0.5181, 'learning_rate': 1.285194706122689e-05, 'epoch': 0.85} {'loss': 0.4527, 'learning_rate': 1.2851625035248486e-05, 'epoch': 0.85} {'loss': 0.6287, 'learning_rate': 1.2851303006051137e-05, 'epoch': 0.85} {'loss': 0.6068, 'learning_rate': 1.285098097363521e-05, 'epoch': 0.85} {'loss': 0.472, 'learning_rate': 1.2850658938001071e-05, 'epoch': 0.85} {'loss': 0.6716, 'learning_rate': 1.2850336899149077e-05, 'epoch': 0.85} {'loss': 0.6084, 'learning_rate': 1.2850014857079595e-05, 'epoch': 0.85} {'loss': 0.5998, 'learning_rate': 1.2849692811792987e-05, 'epoch': 0.85} {'loss': 0.6139, 'learning_rate': 1.284937076328962e-05, 'epoch': 0.85} {'loss': 0.4931, 'learning_rate': 1.2849048711569854e-05, 'epoch': 0.85} {'loss': 0.6939, 'learning_rate': 1.2848726656634051e-05, 'epoch': 0.85} {'loss': 0.513, 'learning_rate': 1.2848404598482582e-05, 'epoch': 0.85} {'loss': 0.6506, 'learning_rate': 1.2848082537115802e-05, 'epoch': 0.85} {'loss': 0.6542, 'learning_rate': 1.284776047253408e-05, 'epoch': 0.85} {'loss': 0.7156, 'learning_rate': 1.284743840473778e-05, 'epoch': 0.85} {'loss': 0.6362, 'learning_rate': 1.2847116333727261e-05, 'epoch': 0.85} {'loss': 0.559, 'learning_rate': 1.2846794259502891e-05, 'epoch': 0.85} {'loss': 0.5305, 'learning_rate': 1.284647218206503e-05, 'epoch': 0.85} {'loss': 0.5237, 'learning_rate': 1.2846150101414042e-05, 'epoch': 0.85} {'loss': 0.5302, 'learning_rate': 1.2845828017550295e-05, 'epoch': 0.85} {'loss': 0.4801, 'learning_rate': 1.2845505930474147e-05, 'epoch': 0.85} {'loss': 0.5281, 'learning_rate': 1.2845183840185964e-05, 'epoch': 0.85} {'loss': 0.644, 'learning_rate': 1.284486174668611e-05, 'epoch': 0.85} {'loss': 0.3886, 'learning_rate': 1.2844539649974949e-05, 'epoch': 0.85} {'loss': 0.5842, 'learning_rate': 1.2844217550052841e-05, 'epoch': 0.85} {'loss': 0.6023, 'learning_rate': 1.2843895446920155e-05, 'epoch': 0.85} {'loss': 0.5621, 'learning_rate': 1.2843573340577252e-05, 'epoch': 0.85} {'loss': 0.5621, 'learning_rate': 1.2843251231024495e-05, 'epoch': 0.85} {'loss': 0.5013, 'learning_rate': 1.2842929118262247e-05, 'epoch': 0.85} {'loss': 0.6251, 'learning_rate': 1.2842607002290872e-05, 'epoch': 0.85} {'loss': 0.4321, 'learning_rate': 1.2842284883110735e-05, 'epoch': 0.85} {'loss': 0.673, 'learning_rate': 1.28419627607222e-05, 'epoch': 0.85} {'loss': 0.5347, 'learning_rate': 1.284164063512563e-05, 'epoch': 0.85} {'loss': 0.491, 'learning_rate': 1.2841318506321386e-05, 'epoch': 0.85} {'loss': 0.5135, 'learning_rate': 1.2840996374309833e-05, 'epoch': 0.85} {'loss': 0.5465, 'learning_rate': 1.2840674239091337e-05, 'epoch': 0.85} {'loss': 0.5621, 'learning_rate': 1.284035210066626e-05, 'epoch': 0.85} {'loss': 0.6035, 'learning_rate': 1.2840029959034964e-05, 'epoch': 0.85} {'loss': 0.4965, 'learning_rate': 1.2839707814197814e-05, 'epoch': 0.85} {'loss': 0.3917, 'learning_rate': 1.2839385666155177e-05, 'epoch': 0.85} {'loss': 0.4313, 'learning_rate': 1.2839063514907411e-05, 'epoch': 0.85} {'loss': 0.612, 'learning_rate': 1.2838741360454883e-05, 'epoch': 0.85} {'loss': 0.7188, 'learning_rate': 1.2838419202797956e-05, 'epoch': 0.85} {'loss': 0.7097, 'learning_rate': 1.2838097041936996e-05, 'epoch': 0.85} {'loss': 0.5745, 'learning_rate': 1.283777487787236e-05, 'epoch': 0.85} {'loss': 0.5468, 'learning_rate': 1.2837452710604419e-05, 'epoch': 0.85} {'loss': 0.63, 'learning_rate': 1.2837130540133532e-05, 'epoch': 0.85} {'loss': 0.3613, 'learning_rate': 1.2836808366460059e-05, 'epoch': 0.85} {'loss': 0.4761, 'learning_rate': 1.2836486189584374e-05, 'epoch': 0.85} {'loss': 0.5768, 'learning_rate': 1.2836164009506836e-05, 'epoch': 0.85} {'loss': 0.5575, 'learning_rate': 1.2835841826227806e-05, 'epoch': 0.85} {'loss': 0.595, 'learning_rate': 1.283551963974765e-05, 'epoch': 0.85} {'loss': 0.3971, 'learning_rate': 1.2835197450066734e-05, 'epoch': 0.85} {'loss': 0.6218, 'learning_rate': 1.283487525718542e-05, 'epoch': 0.85} {'loss': 0.728, 'learning_rate': 1.2834553061104066e-05, 'epoch': 0.85} {'loss': 0.5641, 'learning_rate': 1.2834230861823046e-05, 'epoch': 0.85} {'loss': 0.5058, 'learning_rate': 1.2833908659342712e-05, 'epoch': 0.85} {'loss': 0.7561, 'learning_rate': 1.283358645366344e-05, 'epoch': 0.85} {'loss': 0.567, 'learning_rate': 1.2833264244785584e-05, 'epoch': 0.85} {'loss': 0.6078, 'learning_rate': 1.2832942032709514e-05, 'epoch': 0.85} {'loss': 0.629, 'learning_rate': 1.283261981743559e-05, 'epoch': 0.85} {'loss': 0.6134, 'learning_rate': 1.2832297598964176e-05, 'epoch': 0.85} {'loss': 0.6718, 'learning_rate': 1.2831975377295637e-05, 'epoch': 0.85} {'loss': 0.6661, 'learning_rate': 1.2831653152430337e-05, 'epoch': 0.85} {'loss': 0.5284, 'learning_rate': 1.2831330924368638e-05, 'epoch': 0.85} {'loss': 0.6381, 'learning_rate': 1.2831008693110904e-05, 'epoch': 0.85} {'loss': 0.6416, 'learning_rate': 1.2830686458657505e-05, 'epoch': 0.85} {'loss': 0.5861, 'learning_rate': 1.2830364221008795e-05, 'epoch': 0.85} {'loss': 0.6064, 'learning_rate': 1.2830041980165142e-05, 'epoch': 0.85} {'loss': 0.5141, 'learning_rate': 1.282971973612691e-05, 'epoch': 0.85} {'loss': 0.4455, 'learning_rate': 1.2829397488894464e-05, 'epoch': 0.85} {'loss': 0.5032, 'learning_rate': 1.2829075238468164e-05, 'epoch': 0.85} {'loss': 0.4724, 'learning_rate': 1.2828752984848376e-05, 'epoch': 0.85} {'loss': 0.5736, 'learning_rate': 1.2828430728035466e-05, 'epoch': 0.85} {'loss': 0.7349, 'learning_rate': 1.2828108468029793e-05, 'epoch': 0.85} {'loss': 0.4725, 'learning_rate': 1.2827786204831724e-05, 'epoch': 0.85} {'loss': 0.4418, 'learning_rate': 1.2827463938441622e-05, 'epoch': 0.85} {'loss': 0.6098, 'learning_rate': 1.2827141668859853e-05, 'epoch': 0.85} {'loss': 0.4417, 'learning_rate': 1.2826819396086778e-05, 'epoch': 0.85} {'loss': 0.4607, 'learning_rate': 1.282649712012276e-05, 'epoch': 0.85} {'loss': 0.692, 'learning_rate': 1.2826174840968166e-05, 'epoch': 0.85} {'loss': 0.6661, 'learning_rate': 1.2825852558623357e-05, 'epoch': 0.85} {'loss': 0.4968, 'learning_rate': 1.2825530273088697e-05, 'epoch': 0.85} {'loss': 0.4794, 'learning_rate': 1.2825207984364552e-05, 'epoch': 0.85} {'loss': 0.4758, 'learning_rate': 1.2824885692451283e-05, 'epoch': 0.85} {'loss': 0.6635, 'learning_rate': 1.2824563397349257e-05, 'epoch': 0.85} {'loss': 0.4602, 'learning_rate': 1.2824241099058833e-05, 'epoch': 0.85} {'loss': 0.4482, 'learning_rate': 1.282391879758038e-05, 'epoch': 0.85} {'loss': 0.4091, 'learning_rate': 1.282359649291426e-05, 'epoch': 0.85} {'loss': 0.4613, 'learning_rate': 1.2823274185060836e-05, 'epoch': 0.85} {'loss': 0.4501, 'learning_rate': 1.2822951874020472e-05, 'epoch': 0.85} {'loss': 0.6098, 'learning_rate': 1.2822629559793534e-05, 'epoch': 0.85} {'loss': 0.592, 'learning_rate': 1.2822307242380384e-05, 'epoch': 0.85} {'loss': 0.5358, 'learning_rate': 1.2821984921781385e-05, 'epoch': 0.85} {'loss': 0.5217, 'learning_rate': 1.28216625979969e-05, 'epoch': 0.85} {'loss': 0.3895, 'learning_rate': 1.2821340271027295e-05, 'epoch': 0.85} {'loss': 0.4258, 'learning_rate': 1.2821017940872935e-05, 'epoch': 0.85} {'loss': 0.5789, 'learning_rate': 1.2820695607534179e-05, 'epoch': 0.85} {'loss': 0.4851, 'learning_rate': 1.2820373271011395e-05, 'epoch': 0.85} {'loss': 0.5197, 'learning_rate': 1.2820050931304947e-05, 'epoch': 0.85} {'loss': 0.5644, 'learning_rate': 1.28197285884152e-05, 'epoch': 0.85} {'loss': 0.5867, 'learning_rate': 1.2819406242342512e-05, 'epoch': 0.85} {'loss': 0.5788, 'learning_rate': 1.281908389308725e-05, 'epoch': 0.85} {'loss': 0.6819, 'learning_rate': 1.2818761540649782e-05, 'epoch': 0.85} {'loss': 0.5208, 'learning_rate': 1.2818439185030467e-05, 'epoch': 0.85} {'loss': 0.5404, 'learning_rate': 1.281811682622967e-05, 'epoch': 0.85} {'loss': 0.5596, 'learning_rate': 1.2817794464247752e-05, 'epoch': 0.85} {'loss': 0.6542, 'learning_rate': 1.2817472099085085e-05, 'epoch': 0.85} {'loss': 0.6676, 'learning_rate': 1.2817149730742024e-05, 'epoch': 0.85} {'loss': 0.5702, 'learning_rate': 1.2816827359218937e-05, 'epoch': 0.85} {'loss': 0.6264, 'learning_rate': 1.2816504984516189e-05, 'epoch': 0.85} {'loss': 0.6308, 'learning_rate': 1.2816182606634141e-05, 'epoch': 0.85} {'loss': 0.7571, 'learning_rate': 1.281586022557316e-05, 'epoch': 0.86} {'loss': 0.5159, 'learning_rate': 1.2815537841333607e-05, 'epoch': 0.86} {'loss': 0.5943, 'learning_rate': 1.2815215453915847e-05, 'epoch': 0.86} {'loss': 0.5963, 'learning_rate': 1.2814893063320247e-05, 'epoch': 0.86} {'loss': 0.5128, 'learning_rate': 1.2814570669547167e-05, 'epoch': 0.86} {'loss': 0.5923, 'learning_rate': 1.281424827259697e-05, 'epoch': 0.86} {'loss': 0.6158, 'learning_rate': 1.281392587247002e-05, 'epoch': 0.86} {'loss': 0.6344, 'learning_rate': 1.2813603469166686e-05, 'epoch': 0.86} {'loss': 0.4884, 'learning_rate': 1.2813281062687329e-05, 'epoch': 0.86} {'loss': 0.6305, 'learning_rate': 1.281295865303231e-05, 'epoch': 0.86} {'loss': 0.576, 'learning_rate': 1.2812636240201998e-05, 'epoch': 0.86} {'loss': 0.6282, 'learning_rate': 1.2812313824196754e-05, 'epoch': 0.86} {'loss': 0.5318, 'learning_rate': 1.2811991405016944e-05, 'epoch': 0.86} {'loss': 0.5686, 'learning_rate': 1.2811668982662928e-05, 'epoch': 0.86} {'loss': 0.5829, 'learning_rate': 1.2811346557135072e-05, 'epoch': 0.86} {'loss': 0.6309, 'learning_rate': 1.281102412843374e-05, 'epoch': 0.86} {'loss': 0.6084, 'learning_rate': 1.28107016965593e-05, 'epoch': 0.86} {'loss': 0.3384, 'learning_rate': 1.2810379261512111e-05, 'epoch': 0.86} {'loss': 0.516, 'learning_rate': 1.2810056823292536e-05, 'epoch': 0.86} {'loss': 0.7446, 'learning_rate': 1.2809734381900945e-05, 'epoch': 0.86} {'loss': 0.602, 'learning_rate': 1.2809411937337694e-05, 'epoch': 0.86} {'loss': 0.4577, 'learning_rate': 1.2809089489603152e-05, 'epoch': 0.86} {'loss': 0.5886, 'learning_rate': 1.2808767038697683e-05, 'epoch': 0.86} {'loss': 0.5601, 'learning_rate': 1.2808444584621648e-05, 'epoch': 0.86} {'loss': 0.474, 'learning_rate': 1.2808122127375417e-05, 'epoch': 0.86} {'loss': 0.6731, 'learning_rate': 1.2807799666959349e-05, 'epoch': 0.86} {'loss': 0.5796, 'learning_rate': 1.2807477203373808e-05, 'epoch': 0.86} {'loss': 0.5925, 'learning_rate': 1.2807154736619159e-05, 'epoch': 0.86} {'loss': 0.4107, 'learning_rate': 1.2806832266695765e-05, 'epoch': 0.86} {'loss': 0.599, 'learning_rate': 1.2806509793603994e-05, 'epoch': 0.86} {'loss': 0.5493, 'learning_rate': 1.2806187317344208e-05, 'epoch': 0.86} {'loss': 0.5148, 'learning_rate': 1.2805864837916766e-05, 'epoch': 0.86} {'loss': 0.6028, 'learning_rate': 1.280554235532204e-05, 'epoch': 0.86} {'loss': 0.5964, 'learning_rate': 1.2805219869560387e-05, 'epoch': 0.86} {'loss': 0.4274, 'learning_rate': 1.2804897380632173e-05, 'epoch': 0.86} {'loss': 0.5485, 'learning_rate': 1.2804574888537767e-05, 'epoch': 0.86} {'loss': 0.6055, 'learning_rate': 1.2804252393277527e-05, 'epoch': 0.86} {'loss': 0.4686, 'learning_rate': 1.2803929894851818e-05, 'epoch': 0.86} {'loss': 0.4466, 'learning_rate': 1.2803607393261009e-05, 'epoch': 0.86} {'loss': 0.6257, 'learning_rate': 1.2803284888505459e-05, 'epoch': 0.86} {'loss': 0.7489, 'learning_rate': 1.2802962380585532e-05, 'epoch': 0.86} {'loss': 0.5655, 'learning_rate': 1.2802639869501599e-05, 'epoch': 0.86} {'loss': 0.5578, 'learning_rate': 1.2802317355254013e-05, 'epoch': 0.86} {'loss': 0.6739, 'learning_rate': 1.2801994837843145e-05, 'epoch': 0.86} {'loss': 0.4488, 'learning_rate': 1.2801672317269358e-05, 'epoch': 0.86} {'loss': 0.5444, 'learning_rate': 1.2801349793533016e-05, 'epoch': 0.86} {'loss': 0.4401, 'learning_rate': 1.280102726663448e-05, 'epoch': 0.86} {'loss': 0.4805, 'learning_rate': 1.2800704736574122e-05, 'epoch': 0.86} {'loss': 0.6753, 'learning_rate': 1.2800382203352295e-05, 'epoch': 0.86} {'loss': 0.4941, 'learning_rate': 1.2800059666969373e-05, 'epoch': 0.86} {'loss': 0.5401, 'learning_rate': 1.2799737127425716e-05, 'epoch': 0.86} {'loss': 0.492, 'learning_rate': 1.2799414584721685e-05, 'epoch': 0.86} {'loss': 0.5861, 'learning_rate': 1.279909203885765e-05, 'epoch': 0.86} {'loss': 0.6968, 'learning_rate': 1.2798769489833972e-05, 'epoch': 0.86} {'loss': 0.6188, 'learning_rate': 1.2798446937651017e-05, 'epoch': 0.86} {'loss': 0.4578, 'learning_rate': 1.2798124382309145e-05, 'epoch': 0.86} {'loss': 0.5367, 'learning_rate': 1.2797801823808724e-05, 'epoch': 0.86} {'loss': 0.5309, 'learning_rate': 1.2797479262150116e-05, 'epoch': 0.86} {'loss': 0.7674, 'learning_rate': 1.2797156697333689e-05, 'epoch': 0.86} {'loss': 0.6364, 'learning_rate': 1.2796834129359799e-05, 'epoch': 0.86} {'loss': 0.7029, 'learning_rate': 1.2796511558228817e-05, 'epoch': 0.86} {'loss': 0.3355, 'learning_rate': 1.2796188983941105e-05, 'epoch': 0.86} {'loss': 0.5387, 'learning_rate': 1.2795866406497028e-05, 'epoch': 0.86} {'loss': 0.5907, 'learning_rate': 1.279554382589695e-05, 'epoch': 0.86} {'loss': 0.5981, 'learning_rate': 1.2795221242141234e-05, 'epoch': 0.86} {'loss': 0.4711, 'learning_rate': 1.2794898655230244e-05, 'epoch': 0.86} {'loss': 0.7227, 'learning_rate': 1.2794576065164346e-05, 'epoch': 0.86} {'loss': 0.5181, 'learning_rate': 1.2794253471943905e-05, 'epoch': 0.86} {'loss': 0.5672, 'learning_rate': 1.279393087556928e-05, 'epoch': 0.86} {'loss': 0.4668, 'learning_rate': 1.2793608276040839e-05, 'epoch': 0.86} {'loss': 0.5419, 'learning_rate': 1.2793285673358945e-05, 'epoch': 0.86} {'loss': 0.6454, 'learning_rate': 1.2792963067523965e-05, 'epoch': 0.86} {'loss': 0.5108, 'learning_rate': 1.279264045853626e-05, 'epoch': 0.86} {'loss': 0.6474, 'learning_rate': 1.2792317846396191e-05, 'epoch': 0.86} {'loss': 0.6218, 'learning_rate': 1.279199523110413e-05, 'epoch': 0.86} {'loss': 0.4565, 'learning_rate': 1.2791672612660437e-05, 'epoch': 0.86} {'loss': 0.4947, 'learning_rate': 1.2791349991065474e-05, 'epoch': 0.86} {'loss': 0.5259, 'learning_rate': 1.279102736631961e-05, 'epoch': 0.86} {'loss': 0.7197, 'learning_rate': 1.2790704738423207e-05, 'epoch': 0.86} {'loss': 0.4454, 'learning_rate': 1.2790382107376628e-05, 'epoch': 0.86} {'loss': 0.6152, 'learning_rate': 1.279005947318024e-05, 'epoch': 0.86} {'loss': 0.5018, 'learning_rate': 1.2789736835834405e-05, 'epoch': 0.86} {'loss': 0.6734, 'learning_rate': 1.2789414195339487e-05, 'epoch': 0.86} {'loss': 0.4721, 'learning_rate': 1.278909155169585e-05, 'epoch': 0.86} {'loss': 0.65, 'learning_rate': 1.2788768904903857e-05, 'epoch': 0.86} {'loss': 0.5232, 'learning_rate': 1.2788446254963878e-05, 'epoch': 0.86} {'loss': 0.6731, 'learning_rate': 1.2788123601876272e-05, 'epoch': 0.86} {'loss': 0.6334, 'learning_rate': 1.2787800945641404e-05, 'epoch': 0.86} {'loss': 0.3659, 'learning_rate': 1.278747828625964e-05, 'epoch': 0.86} {'loss': 0.4465, 'learning_rate': 1.2787155623731342e-05, 'epoch': 0.86} {'loss': 0.671, 'learning_rate': 1.2786832958056878e-05, 'epoch': 0.86} {'loss': 0.5586, 'learning_rate': 1.278651028923661e-05, 'epoch': 0.86} {'loss': 0.5728, 'learning_rate': 1.2786187617270897e-05, 'epoch': 0.86} {'loss': 0.5983, 'learning_rate': 1.2785864942160111e-05, 'epoch': 0.86} {'loss': 0.5092, 'learning_rate': 1.278554226390461e-05, 'epoch': 0.86} {'loss': 0.6043, 'learning_rate': 1.2785219582504764e-05, 'epoch': 0.86} {'loss': 0.5116, 'learning_rate': 1.2784896897960936e-05, 'epoch': 0.86} {'loss': 0.5546, 'learning_rate': 1.2784574210273488e-05, 'epoch': 0.86} {'loss': 0.5426, 'learning_rate': 1.2784251519442785e-05, 'epoch': 0.86} {'loss': 0.5348, 'learning_rate': 1.2783928825469192e-05, 'epoch': 0.86} {'loss': 0.4469, 'learning_rate': 1.2783606128353071e-05, 'epoch': 0.86} {'loss': 0.5792, 'learning_rate': 1.2783283428094789e-05, 'epoch': 0.86} {'loss': 0.5149, 'learning_rate': 1.2782960724694712e-05, 'epoch': 0.86} {'loss': 0.6185, 'learning_rate': 1.2782638018153198e-05, 'epoch': 0.86} {'loss': 0.52, 'learning_rate': 1.2782315308470616e-05, 'epoch': 0.86} {'loss': 0.6946, 'learning_rate': 1.278199259564733e-05, 'epoch': 0.86} {'loss': 0.5326, 'learning_rate': 1.2781669879683703e-05, 'epoch': 0.86} {'loss': 0.5744, 'learning_rate': 1.2781347160580097e-05, 'epoch': 0.86} {'loss': 0.709, 'learning_rate': 1.2781024438336883e-05, 'epoch': 0.86} {'loss': 0.6799, 'learning_rate': 1.2780701712954417e-05, 'epoch': 0.86} {'loss': 0.5629, 'learning_rate': 1.278037898443307e-05, 'epoch': 0.86} {'loss': 0.552, 'learning_rate': 1.2780056252773205e-05, 'epoch': 0.86} {'loss': 0.3843, 'learning_rate': 1.2779733517975182e-05, 'epoch': 0.86} {'loss': 0.7905, 'learning_rate': 1.2779410780039369e-05, 'epoch': 0.86} {'loss': 0.6825, 'learning_rate': 1.2779088038966133e-05, 'epoch': 0.86} {'loss': 0.4775, 'learning_rate': 1.2778765294755832e-05, 'epoch': 0.86} {'loss': 0.5969, 'learning_rate': 1.2778442547408836e-05, 'epoch': 0.86} {'loss': 0.6285, 'learning_rate': 1.2778119796925506e-05, 'epoch': 0.86} {'loss': 0.5626, 'learning_rate': 1.2777797043306206e-05, 'epoch': 0.86} {'loss': 0.6285, 'learning_rate': 1.2777474286551302e-05, 'epoch': 0.86} {'loss': 0.5324, 'learning_rate': 1.2777151526661156e-05, 'epoch': 0.86} {'loss': 0.5896, 'learning_rate': 1.2776828763636136e-05, 'epoch': 0.86} {'loss': 0.7989, 'learning_rate': 1.2776505997476603e-05, 'epoch': 0.86} {'loss': 0.6292, 'learning_rate': 1.2776183228182924e-05, 'epoch': 0.86} {'loss': 0.5175, 'learning_rate': 1.277586045575546e-05, 'epoch': 0.86} {'loss': 0.6364, 'learning_rate': 1.2775537680194578e-05, 'epoch': 0.86} {'loss': 0.6155, 'learning_rate': 1.2775214901500643e-05, 'epoch': 0.86} {'loss': 0.4541, 'learning_rate': 1.2774892119674019e-05, 'epoch': 0.86} {'loss': 0.609, 'learning_rate': 1.2774569334715067e-05, 'epoch': 0.86} {'loss': 0.5002, 'learning_rate': 1.2774246546624154e-05, 'epoch': 0.86} {'loss': 0.5393, 'learning_rate': 1.2773923755401647e-05, 'epoch': 0.86} {'loss': 0.5494, 'learning_rate': 1.2773600961047908e-05, 'epoch': 0.86} {'loss': 0.5615, 'learning_rate': 1.2773278163563297e-05, 'epoch': 0.86} {'loss': 0.6181, 'learning_rate': 1.2772955362948185e-05, 'epoch': 0.86} {'loss': 0.5283, 'learning_rate': 1.2772632559202928e-05, 'epoch': 0.86} {'loss': 0.3902, 'learning_rate': 1.27723097523279e-05, 'epoch': 0.86} {'loss': 0.5712, 'learning_rate': 1.2771986942323465e-05, 'epoch': 0.86} {'loss': 0.3819, 'learning_rate': 1.277166412918998e-05, 'epoch': 0.86} {'loss': 0.4978, 'learning_rate': 1.2771341312927814e-05, 'epoch': 0.86} {'loss': 0.5673, 'learning_rate': 1.2771018493537331e-05, 'epoch': 0.86} {'loss': 0.448, 'learning_rate': 1.2770695671018895e-05, 'epoch': 0.86} {'loss': 0.5246, 'learning_rate': 1.2770372845372872e-05, 'epoch': 0.86} {'loss': 0.3601, 'learning_rate': 1.2770050016599625e-05, 'epoch': 0.86} {'loss': 0.5797, 'learning_rate': 1.2769727184699515e-05, 'epoch': 0.86} {'loss': 0.6735, 'learning_rate': 1.2769404349672911e-05, 'epoch': 0.86} {'loss': 0.4709, 'learning_rate': 1.2769081511520175e-05, 'epoch': 0.86} {'loss': 0.6257, 'learning_rate': 1.2768758670241676e-05, 'epoch': 0.86} {'loss': 0.626, 'learning_rate': 1.2768435825837773e-05, 'epoch': 0.86} {'loss': 0.4433, 'learning_rate': 1.276811297830883e-05, 'epoch': 0.86} {'loss': 0.4819, 'learning_rate': 1.2767790127655217e-05, 'epoch': 0.86} {'loss': 0.6255, 'learning_rate': 1.2767467273877294e-05, 'epoch': 0.86} {'loss': 0.6521, 'learning_rate': 1.2767144416975428e-05, 'epoch': 0.86} {'loss': 0.4209, 'learning_rate': 1.276682155694998e-05, 'epoch': 0.86} {'loss': 0.7778, 'learning_rate': 1.2766498693801321e-05, 'epoch': 0.86} {'loss': 0.4977, 'learning_rate': 1.2766175827529807e-05, 'epoch': 0.86} {'loss': 0.6239, 'learning_rate': 1.2765852958135807e-05, 'epoch': 0.86} {'loss': 0.5456, 'learning_rate': 1.2765530085619687e-05, 'epoch': 0.86} {'loss': 0.5396, 'learning_rate': 1.2765207209981807e-05, 'epoch': 0.86} {'loss': 0.5535, 'learning_rate': 1.2764884331222534e-05, 'epoch': 0.86} {'loss': 0.4191, 'learning_rate': 1.2764561449342233e-05, 'epoch': 0.86} {'loss': 0.6479, 'learning_rate': 1.2764238564341267e-05, 'epoch': 0.86} {'loss': 0.5645, 'learning_rate': 1.2763915676220003e-05, 'epoch': 0.86} {'loss': 0.4359, 'learning_rate': 1.2763592784978803e-05, 'epoch': 0.86} {'loss': 0.6391, 'learning_rate': 1.2763269890618033e-05, 'epoch': 0.86} {'loss': 0.5652, 'learning_rate': 1.2762946993138055e-05, 'epoch': 0.86} {'loss': 0.6147, 'learning_rate': 1.2762624092539235e-05, 'epoch': 0.86} {'loss': 0.5763, 'learning_rate': 1.2762301188821942e-05, 'epoch': 0.86} {'loss': 0.5701, 'learning_rate': 1.2761978281986534e-05, 'epoch': 0.86} {'loss': 0.5079, 'learning_rate': 1.2761655372033376e-05, 'epoch': 0.86} {'loss': 0.5989, 'learning_rate': 1.2761332458962836e-05, 'epoch': 0.86} {'loss': 0.3552, 'learning_rate': 1.2761009542775274e-05, 'epoch': 0.86} {'loss': 0.5007, 'learning_rate': 1.2760686623471059e-05, 'epoch': 0.86} {'loss': 0.574, 'learning_rate': 1.2760363701050555e-05, 'epoch': 0.86} {'loss': 0.6753, 'learning_rate': 1.2760040775514124e-05, 'epoch': 0.86} {'loss': 0.4724, 'learning_rate': 1.2759717846862132e-05, 'epoch': 0.86} {'loss': 0.7388, 'learning_rate': 1.2759394915094942e-05, 'epoch': 0.86} {'loss': 0.6135, 'learning_rate': 1.2759071980212922e-05, 'epoch': 0.86} {'loss': 0.645, 'learning_rate': 1.2758749042216433e-05, 'epoch': 0.86} {'loss': 0.5663, 'learning_rate': 1.2758426101105843e-05, 'epoch': 0.86} {'loss': 0.5538, 'learning_rate': 1.2758103156881512e-05, 'epoch': 0.86} {'loss': 0.4545, 'learning_rate': 1.275778020954381e-05, 'epoch': 0.86} {'loss': 0.5829, 'learning_rate': 1.2757457259093098e-05, 'epoch': 0.86} {'loss': 0.6527, 'learning_rate': 1.2757134305529739e-05, 'epoch': 0.86} {'loss': 0.6673, 'learning_rate': 1.2756811348854097e-05, 'epoch': 0.86} {'loss': 0.5336, 'learning_rate': 1.2756488389066544e-05, 'epoch': 0.86} {'loss': 0.6284, 'learning_rate': 1.2756165426167437e-05, 'epoch': 0.86} {'loss': 0.6269, 'learning_rate': 1.2755842460157144e-05, 'epoch': 0.86} {'loss': 0.5518, 'learning_rate': 1.275551949103603e-05, 'epoch': 0.86} {'loss': 0.5657, 'learning_rate': 1.2755196518804458e-05, 'epoch': 0.86} {'loss': 0.5773, 'learning_rate': 1.2754873543462793e-05, 'epoch': 0.86} {'loss': 0.4993, 'learning_rate': 1.2754550565011403e-05, 'epoch': 0.86} {'loss': 0.4822, 'learning_rate': 1.2754227583450644e-05, 'epoch': 0.86} {'loss': 0.5807, 'learning_rate': 1.2753904598780888e-05, 'epoch': 0.86} {'loss': 0.5219, 'learning_rate': 1.27535816110025e-05, 'epoch': 0.86} {'loss': 0.6476, 'learning_rate': 1.2753258620115837e-05, 'epoch': 0.86} {'loss': 0.6727, 'learning_rate': 1.275293562612127e-05, 'epoch': 0.86} {'loss': 0.6636, 'learning_rate': 1.2752612629019164e-05, 'epoch': 0.86} {'loss': 0.6382, 'learning_rate': 1.275228962880988e-05, 'epoch': 0.86} {'loss': 0.4203, 'learning_rate': 1.2751966625493783e-05, 'epoch': 0.86} {'loss': 0.6499, 'learning_rate': 1.2751643619071244e-05, 'epoch': 0.86} {'loss': 0.5682, 'learning_rate': 1.275132060954262e-05, 'epoch': 0.86} {'loss': 0.5959, 'learning_rate': 1.2750997596908277e-05, 'epoch': 0.86} {'loss': 0.5389, 'learning_rate': 1.275067458116858e-05, 'epoch': 0.86} {'loss': 0.5464, 'learning_rate': 1.27503515623239e-05, 'epoch': 0.86} {'loss': 0.6581, 'learning_rate': 1.275002854037459e-05, 'epoch': 0.86} {'loss': 0.6754, 'learning_rate': 1.2749705515321025e-05, 'epoch': 0.86} {'loss': 0.6353, 'learning_rate': 1.2749382487163562e-05, 'epoch': 0.86} {'loss': 0.708, 'learning_rate': 1.274905945590257e-05, 'epoch': 0.86} {'loss': 0.61, 'learning_rate': 1.2748736421538412e-05, 'epoch': 0.86} {'loss': 0.4886, 'learning_rate': 1.2748413384071454e-05, 'epoch': 0.86} {'loss': 0.5596, 'learning_rate': 1.2748090343502062e-05, 'epoch': 0.86} {'loss': 0.5223, 'learning_rate': 1.2747767299830596e-05, 'epoch': 0.86} {'loss': 0.5647, 'learning_rate': 1.2747444253057423e-05, 'epoch': 0.86} {'loss': 0.6165, 'learning_rate': 1.274712120318291e-05, 'epoch': 0.86} {'loss': 0.5043, 'learning_rate': 1.2746798150207418e-05, 'epoch': 0.86} {'loss': 0.511, 'learning_rate': 1.2746475094131314e-05, 'epoch': 0.86} {'loss': 0.6175, 'learning_rate': 1.2746152034954963e-05, 'epoch': 0.86} {'loss': 0.5499, 'learning_rate': 1.2745828972678727e-05, 'epoch': 0.86} {'loss': 0.5412, 'learning_rate': 1.2745505907302972e-05, 'epoch': 0.86} {'loss': 0.7267, 'learning_rate': 1.2745182838828063e-05, 'epoch': 0.86} {'loss': 0.5643, 'learning_rate': 1.2744859767254365e-05, 'epoch': 0.86} {'loss': 0.5063, 'learning_rate': 1.2744536692582244e-05, 'epoch': 0.86} {'loss': 0.6817, 'learning_rate': 1.274421361481206e-05, 'epoch': 0.86} {'loss': 0.6079, 'learning_rate': 1.274389053394418e-05, 'epoch': 0.86} {'loss': 0.5719, 'learning_rate': 1.2743567449978973e-05, 'epoch': 0.86} {'loss': 0.7893, 'learning_rate': 1.2743244362916798e-05, 'epoch': 0.86} {'loss': 0.675, 'learning_rate': 1.274292127275802e-05, 'epoch': 0.86} {'loss': 0.67, 'learning_rate': 1.2742598179503007e-05, 'epoch': 0.86} {'loss': 0.495, 'learning_rate': 1.2742275083152125e-05, 'epoch': 0.86} {'loss': 0.466, 'learning_rate': 1.2741951983705734e-05, 'epoch': 0.86} {'loss': 0.4405, 'learning_rate': 1.2741628881164201e-05, 'epoch': 0.86} {'loss': 0.6833, 'learning_rate': 1.2741305775527888e-05, 'epoch': 0.86} {'loss': 0.432, 'learning_rate': 1.2740982666797163e-05, 'epoch': 0.86} {'loss': 0.4872, 'learning_rate': 1.274065955497239e-05, 'epoch': 0.86} {'loss': 0.4831, 'learning_rate': 1.2740336440053934e-05, 'epoch': 0.86} {'loss': 0.6182, 'learning_rate': 1.2740013322042158e-05, 'epoch': 0.86} {'loss': 0.6737, 'learning_rate': 1.2739690200937429e-05, 'epoch': 0.86} {'loss': 0.4769, 'learning_rate': 1.273936707674011e-05, 'epoch': 0.86} {'loss': 0.6653, 'learning_rate': 1.2739043949450566e-05, 'epoch': 0.86} {'loss': 0.6175, 'learning_rate': 1.2738720819069164e-05, 'epoch': 0.86} {'loss': 0.631, 'learning_rate': 1.2738397685596269e-05, 'epoch': 0.86} {'loss': 0.5982, 'learning_rate': 1.2738074549032241e-05, 'epoch': 0.86} {'loss': 0.5499, 'learning_rate': 1.2737751409377449e-05, 'epoch': 0.86} {'loss': 0.5203, 'learning_rate': 1.2737428266632254e-05, 'epoch': 0.86} {'loss': 0.534, 'learning_rate': 1.2737105120797024e-05, 'epoch': 0.86} {'loss': 0.6055, 'learning_rate': 1.2736781971872123e-05, 'epoch': 0.86} {'loss': 0.6032, 'learning_rate': 1.2736458819857915e-05, 'epoch': 0.86} {'loss': 0.545, 'learning_rate': 1.2736135664754764e-05, 'epoch': 0.86} {'loss': 0.4439, 'learning_rate': 1.2735812506563038e-05, 'epoch': 0.86} {'loss': 0.5653, 'learning_rate': 1.2735489345283101e-05, 'epoch': 0.86} {'loss': 0.6587, 'learning_rate': 1.2735166180915318e-05, 'epoch': 0.86} {'loss': 0.4682, 'learning_rate': 1.2734843013460048e-05, 'epoch': 0.86} {'loss': 0.7384, 'learning_rate': 1.2734519842917662e-05, 'epoch': 0.86} {'loss': 0.5355, 'learning_rate': 1.2734196669288526e-05, 'epoch': 0.86} {'loss': 0.5686, 'learning_rate': 1.2733873492573e-05, 'epoch': 0.86} {'loss': 0.5508, 'learning_rate': 1.2733550312771448e-05, 'epoch': 0.86} {'loss': 0.5398, 'learning_rate': 1.273322712988424e-05, 'epoch': 0.86} {'loss': 0.5682, 'learning_rate': 1.2732903943911739e-05, 'epoch': 0.86} {'loss': 0.5873, 'learning_rate': 1.2732580754854307e-05, 'epoch': 0.86} {'loss': 0.5245, 'learning_rate': 1.273225756271231e-05, 'epoch': 0.86} {'loss': 0.5813, 'learning_rate': 1.2731934367486115e-05, 'epoch': 0.86} {'loss': 0.5835, 'learning_rate': 1.2731611169176088e-05, 'epoch': 0.86} {'loss': 0.4443, 'learning_rate': 1.2731287967782589e-05, 'epoch': 0.86} {'loss': 0.6981, 'learning_rate': 1.2730964763305985e-05, 'epoch': 0.86} {'loss': 0.5347, 'learning_rate': 1.2730641555746643e-05, 'epoch': 0.86} {'loss': 0.4677, 'learning_rate': 1.2730318345104926e-05, 'epoch': 0.86} {'loss': 0.51, 'learning_rate': 1.2729995131381198e-05, 'epoch': 0.86} {'loss': 0.657, 'learning_rate': 1.2729671914575826e-05, 'epoch': 0.86} {'loss': 0.4788, 'learning_rate': 1.2729348694689172e-05, 'epoch': 0.86} {'loss': 0.6094, 'learning_rate': 1.2729025471721601e-05, 'epoch': 0.86} {'loss': 0.5575, 'learning_rate': 1.2728702245673481e-05, 'epoch': 0.86} {'loss': 0.6177, 'learning_rate': 1.2728379016545173e-05, 'epoch': 0.86} {'loss': 0.5532, 'learning_rate': 1.2728055784337045e-05, 'epoch': 0.86} {'loss': 0.5046, 'learning_rate': 1.2727732549049463e-05, 'epoch': 0.86} {'loss': 0.703, 'learning_rate': 1.2727409310682789e-05, 'epoch': 0.86} {'loss': 0.4426, 'learning_rate': 1.2727086069237387e-05, 'epoch': 0.86} {'loss': 0.6004, 'learning_rate': 1.2726762824713623e-05, 'epoch': 0.86} {'loss': 0.5307, 'learning_rate': 1.2726439577111862e-05, 'epoch': 0.86} {'loss': 0.5086, 'learning_rate': 1.2726116326432471e-05, 'epoch': 0.86} {'loss': 0.4122, 'learning_rate': 1.2725793072675813e-05, 'epoch': 0.86} {'loss': 0.4494, 'learning_rate': 1.2725469815842252e-05, 'epoch': 0.86} {'loss': 0.6587, 'learning_rate': 1.2725146555932155e-05, 'epoch': 0.86} {'loss': 0.6307, 'learning_rate': 1.2724823292945882e-05, 'epoch': 0.86} {'loss': 0.455, 'learning_rate': 1.2724500026883806e-05, 'epoch': 0.86} {'loss': 0.4753, 'learning_rate': 1.2724176757746285e-05, 'epoch': 0.86} {'loss': 0.6955, 'learning_rate': 1.2723853485533688e-05, 'epoch': 0.86} {'loss': 0.5768, 'learning_rate': 1.2723530210246378e-05, 'epoch': 0.86} {'loss': 0.4974, 'learning_rate': 1.272320693188472e-05, 'epoch': 0.86} {'loss': 0.5269, 'learning_rate': 1.2722883650449079e-05, 'epoch': 0.86} {'loss': 0.4693, 'learning_rate': 1.2722560365939822e-05, 'epoch': 0.86} {'loss': 0.4464, 'learning_rate': 1.2722237078357311e-05, 'epoch': 0.86} {'loss': 0.4884, 'learning_rate': 1.2721913787701911e-05, 'epoch': 0.86} {'loss': 0.6549, 'learning_rate': 1.272159049397399e-05, 'epoch': 0.86} {'loss': 0.5641, 'learning_rate': 1.2721267197173908e-05, 'epoch': 0.86} {'loss': 0.6639, 'learning_rate': 1.2720943897302033e-05, 'epoch': 0.86} {'loss': 0.7658, 'learning_rate': 1.2720620594358733e-05, 'epoch': 0.86} {'loss': 0.5829, 'learning_rate': 1.2720297288344368e-05, 'epoch': 0.86} {'loss': 0.4563, 'learning_rate': 1.2719973979259303e-05, 'epoch': 0.86} {'loss': 0.4582, 'learning_rate': 1.2719650667103906e-05, 'epoch': 0.86} {'loss': 0.5805, 'learning_rate': 1.2719327351878541e-05, 'epoch': 0.86} {'loss': 0.5675, 'learning_rate': 1.2719004033583571e-05, 'epoch': 0.86} {'loss': 0.502, 'learning_rate': 1.2718680712219364e-05, 'epoch': 0.86} {'loss': 0.5777, 'learning_rate': 1.2718357387786283e-05, 'epoch': 0.86} {'loss': 0.5402, 'learning_rate': 1.2718034060284694e-05, 'epoch': 0.86} {'loss': 0.6216, 'learning_rate': 1.2717710729714963e-05, 'epoch': 0.86} {'loss': 0.6901, 'learning_rate': 1.271738739607745e-05, 'epoch': 0.86} {'loss': 0.6814, 'learning_rate': 1.2717064059372524e-05, 'epoch': 0.86} {'loss': 0.5456, 'learning_rate': 1.271674071960055e-05, 'epoch': 0.86} {'loss': 0.6043, 'learning_rate': 1.2716417376761892e-05, 'epoch': 0.86} {'loss': 0.5671, 'learning_rate': 1.2716094030856916e-05, 'epoch': 0.86} {'loss': 0.4935, 'learning_rate': 1.2715770681885986e-05, 'epoch': 0.86} {'loss': 0.6745, 'learning_rate': 1.2715447329849467e-05, 'epoch': 0.86} {'loss': 0.6513, 'learning_rate': 1.2715123974747722e-05, 'epoch': 0.86} {'loss': 0.5353, 'learning_rate': 1.2714800616581123e-05, 'epoch': 0.86} {'loss': 0.4604, 'learning_rate': 1.2714477255350029e-05, 'epoch': 0.86} {'loss': 0.6185, 'learning_rate': 1.2714153891054805e-05, 'epoch': 0.86} {'loss': 0.6036, 'learning_rate': 1.2713830523695818e-05, 'epoch': 0.86} {'loss': 0.4987, 'learning_rate': 1.2713507153273434e-05, 'epoch': 0.86} {'loss': 0.6379, 'learning_rate': 1.2713183779788014e-05, 'epoch': 0.86} {'loss': 0.5506, 'learning_rate': 1.2712860403239927e-05, 'epoch': 0.86} {'loss': 0.6655, 'learning_rate': 1.2712537023629534e-05, 'epoch': 0.86} {'loss': 0.409, 'learning_rate': 1.2712213640957204e-05, 'epoch': 0.86} {'loss': 0.5294, 'learning_rate': 1.2711890255223303e-05, 'epoch': 0.86} {'loss': 0.6403, 'learning_rate': 1.2711566866428192e-05, 'epoch': 0.86} {'loss': 0.6206, 'learning_rate': 1.2711243474572235e-05, 'epoch': 0.86} {'loss': 0.7325, 'learning_rate': 1.2710920079655802e-05, 'epoch': 0.86} {'loss': 0.7015, 'learning_rate': 1.2710596681679255e-05, 'epoch': 0.86} {'loss': 0.5779, 'learning_rate': 1.271027328064296e-05, 'epoch': 0.86} {'loss': 0.4718, 'learning_rate': 1.2709949876547283e-05, 'epoch': 0.86} {'loss': 0.4266, 'learning_rate': 1.2709626469392588e-05, 'epoch': 0.86} {'loss': 0.5077, 'learning_rate': 1.270930305917924e-05, 'epoch': 0.86} {'loss': 0.4783, 'learning_rate': 1.2708979645907602e-05, 'epoch': 0.86} {'loss': 0.6504, 'learning_rate': 1.270865622957804e-05, 'epoch': 0.86} {'loss': 0.4668, 'learning_rate': 1.2708332810190921e-05, 'epoch': 0.86} {'loss': 0.5931, 'learning_rate': 1.2708009387746612e-05, 'epoch': 0.86} {'loss': 0.5267, 'learning_rate': 1.2707685962245474e-05, 'epoch': 0.86} {'loss': 0.7744, 'learning_rate': 1.2707362533687873e-05, 'epoch': 0.86} {'loss': 0.6834, 'learning_rate': 1.2707039102074174e-05, 'epoch': 0.86} {'loss': 0.5384, 'learning_rate': 1.2706715667404743e-05, 'epoch': 0.86} {'loss': 0.6326, 'learning_rate': 1.2706392229679949e-05, 'epoch': 0.86} {'loss': 0.5428, 'learning_rate': 1.2706068788900147e-05, 'epoch': 0.86} {'loss': 0.6352, 'learning_rate': 1.270574534506571e-05, 'epoch': 0.86} {'loss': 0.6629, 'learning_rate': 1.2705421898177001e-05, 'epoch': 0.86} {'loss': 0.5412, 'learning_rate': 1.2705098448234385e-05, 'epoch': 0.86} {'loss': 0.6045, 'learning_rate': 1.2704774995238229e-05, 'epoch': 0.86} {'loss': 0.5095, 'learning_rate': 1.2704451539188893e-05, 'epoch': 0.86} {'loss': 0.5588, 'learning_rate': 1.2704128080086749e-05, 'epoch': 0.86} {'loss': 0.683, 'learning_rate': 1.2703804617932156e-05, 'epoch': 0.86} {'loss': 0.6243, 'learning_rate': 1.2703481152725483e-05, 'epoch': 0.86} {'loss': 0.5125, 'learning_rate': 1.270315768446709e-05, 'epoch': 0.86} {'loss': 0.5193, 'learning_rate': 1.2702834213157352e-05, 'epoch': 0.86} {'loss': 0.681, 'learning_rate': 1.2702510738796626e-05, 'epoch': 0.86} {'loss': 0.5122, 'learning_rate': 1.2702187261385278e-05, 'epoch': 0.86} {'loss': 0.5784, 'learning_rate': 1.2701863780923677e-05, 'epoch': 0.86} {'loss': 0.6225, 'learning_rate': 1.2701540297412185e-05, 'epoch': 0.86} {'loss': 0.514, 'learning_rate': 1.2701216810851164e-05, 'epoch': 0.86} {'loss': 0.6497, 'learning_rate': 1.2700893321240986e-05, 'epoch': 0.86} {'loss': 0.6956, 'learning_rate': 1.2700569828582015e-05, 'epoch': 0.86} {'loss': 0.5369, 'learning_rate': 1.270024633287461e-05, 'epoch': 0.86} {'loss': 0.6306, 'learning_rate': 1.2699922834119143e-05, 'epoch': 0.86} {'loss': 0.4481, 'learning_rate': 1.2699599332315976e-05, 'epoch': 0.86} {'loss': 0.6948, 'learning_rate': 1.2699275827465472e-05, 'epoch': 0.86} {'loss': 0.4539, 'learning_rate': 1.2698952319568001e-05, 'epoch': 0.86} {'loss': 0.5858, 'learning_rate': 1.2698628808623927e-05, 'epoch': 0.86} {'loss': 0.5633, 'learning_rate': 1.2698305294633613e-05, 'epoch': 0.86} {'loss': 0.3999, 'learning_rate': 1.2697981777597427e-05, 'epoch': 0.86} {'loss': 0.3411, 'learning_rate': 1.2697658257515733e-05, 'epoch': 0.86} {'loss': 0.6873, 'learning_rate': 1.2697334734388896e-05, 'epoch': 0.86} {'loss': 0.5344, 'learning_rate': 1.2697011208217277e-05, 'epoch': 0.86} {'loss': 0.6494, 'learning_rate': 1.2696687679001247e-05, 'epoch': 0.86} {'loss': 0.6494, 'learning_rate': 1.2696364146741171e-05, 'epoch': 0.86} {'loss': 0.4881, 'learning_rate': 1.269604061143741e-05, 'epoch': 0.86} {'loss': 0.5433, 'learning_rate': 1.2695717073090335e-05, 'epoch': 0.86} {'loss': 0.5046, 'learning_rate': 1.2695393531700306e-05, 'epoch': 0.86} {'loss': 0.5553, 'learning_rate': 1.2695069987267692e-05, 'epoch': 0.86} {'loss': 0.7229, 'learning_rate': 1.2694746439792854e-05, 'epoch': 0.86} {'loss': 0.4143, 'learning_rate': 1.2694422889276161e-05, 'epoch': 0.86} {'loss': 0.6022, 'learning_rate': 1.2694099335717978e-05, 'epoch': 0.86} {'loss': 0.4803, 'learning_rate': 1.2693775779118669e-05, 'epoch': 0.86} {'loss': 0.6804, 'learning_rate': 1.2693452219478597e-05, 'epoch': 0.86} {'loss': 0.48, 'learning_rate': 1.269312865679813e-05, 'epoch': 0.86} {'loss': 0.6042, 'learning_rate': 1.2692805091077636e-05, 'epoch': 0.86} {'loss': 0.5969, 'learning_rate': 1.2692481522317472e-05, 'epoch': 0.86} {'loss': 0.5081, 'learning_rate': 1.2692157950518011e-05, 'epoch': 0.86} {'loss': 0.5846, 'learning_rate': 1.2691834375679618e-05, 'epoch': 0.86} {'loss': 0.4273, 'learning_rate': 1.2691510797802651e-05, 'epoch': 0.86} {'loss': 0.574, 'learning_rate': 1.2691187216887485e-05, 'epoch': 0.86} {'loss': 0.5513, 'learning_rate': 1.2690863632934477e-05, 'epoch': 0.86} {'loss': 0.5309, 'learning_rate': 1.2690540045943998e-05, 'epoch': 0.86} {'loss': 0.7996, 'learning_rate': 1.269021645591641e-05, 'epoch': 0.86} {'loss': 0.6793, 'learning_rate': 1.268989286285208e-05, 'epoch': 0.86} {'loss': 0.5988, 'learning_rate': 1.2689569266751371e-05, 'epoch': 0.86} {'loss': 0.6272, 'learning_rate': 1.2689245667614652e-05, 'epoch': 0.86} {'loss': 0.6285, 'learning_rate': 1.2688922065442282e-05, 'epoch': 0.86} {'loss': 0.6197, 'learning_rate': 1.2688598460234634e-05, 'epoch': 0.86} {'loss': 0.5494, 'learning_rate': 1.2688274851992067e-05, 'epoch': 0.86} {'loss': 0.6537, 'learning_rate': 1.2687951240714951e-05, 'epoch': 0.86} {'loss': 0.5681, 'learning_rate': 1.2687627626403647e-05, 'epoch': 0.86} {'loss': 0.431, 'learning_rate': 1.2687304009058523e-05, 'epoch': 0.86} {'loss': 0.6439, 'learning_rate': 1.2686980388679946e-05, 'epoch': 0.86} {'loss': 0.5772, 'learning_rate': 1.2686656765268277e-05, 'epoch': 0.86} {'loss': 0.4835, 'learning_rate': 1.2686333138823885e-05, 'epoch': 0.86} {'loss': 0.4434, 'learning_rate': 1.2686009509347135e-05, 'epoch': 0.86} {'loss': 0.4987, 'learning_rate': 1.2685685876838387e-05, 'epoch': 0.86} {'loss': 0.493, 'learning_rate': 1.2685362241298014e-05, 'epoch': 0.86} {'loss': 0.4863, 'learning_rate': 1.2685038602726374e-05, 'epoch': 0.86} {'loss': 0.4024, 'learning_rate': 1.2684714961123839e-05, 'epoch': 0.86} {'loss': 0.3626, 'learning_rate': 1.268439131649077e-05, 'epoch': 0.86} {'loss': 0.5364, 'learning_rate': 1.2684067668827533e-05, 'epoch': 0.86} {'loss': 0.4858, 'learning_rate': 1.2683744018134493e-05, 'epoch': 0.86} {'loss': 0.6711, 'learning_rate': 1.268342036441202e-05, 'epoch': 0.86} {'loss': 0.6378, 'learning_rate': 1.2683096707660474e-05, 'epoch': 0.86} {'loss': 0.5747, 'learning_rate': 1.268277304788022e-05, 'epoch': 0.86} {'loss': 0.6391, 'learning_rate': 1.2682449385071628e-05, 'epoch': 0.86} {'loss': 0.6204, 'learning_rate': 1.2682125719235061e-05, 'epoch': 0.86} {'loss': 0.6852, 'learning_rate': 1.2681802050370884e-05, 'epoch': 0.86} {'loss': 0.5727, 'learning_rate': 1.2681478378479461e-05, 'epoch': 0.86} {'loss': 0.5642, 'learning_rate': 1.268115470356116e-05, 'epoch': 0.86} {'loss': 0.6433, 'learning_rate': 1.2680831025616345e-05, 'epoch': 0.86} {'loss': 0.5052, 'learning_rate': 1.2680507344645381e-05, 'epoch': 0.86} {'loss': 0.4784, 'learning_rate': 1.2680183660648636e-05, 'epoch': 0.86} {'loss': 0.4902, 'learning_rate': 1.267985997362647e-05, 'epoch': 0.86} {'loss': 0.4774, 'learning_rate': 1.2679536283579253e-05, 'epoch': 0.86} {'loss': 0.5924, 'learning_rate': 1.2679212590507349e-05, 'epoch': 0.86} {'loss': 0.4896, 'learning_rate': 1.2678888894411124e-05, 'epoch': 0.86} {'loss': 0.7431, 'learning_rate': 1.2678565195290942e-05, 'epoch': 0.86} {'loss': 0.6282, 'learning_rate': 1.2678241493147168e-05, 'epoch': 0.86} {'loss': 0.6249, 'learning_rate': 1.2677917787980173e-05, 'epoch': 0.86} {'loss': 0.4881, 'learning_rate': 1.2677594079790315e-05, 'epoch': 0.86} {'loss': 0.4416, 'learning_rate': 1.2677270368577963e-05, 'epoch': 0.86} {'loss': 0.6869, 'learning_rate': 1.2676946654343483e-05, 'epoch': 0.86} {'loss': 0.6386, 'learning_rate': 1.2676622937087235e-05, 'epoch': 0.86} {'loss': 0.5821, 'learning_rate': 1.267629921680959e-05, 'epoch': 0.86} {'loss': 0.4199, 'learning_rate': 1.2675975493510914e-05, 'epoch': 0.86} {'loss': 0.6099, 'learning_rate': 1.267565176719157e-05, 'epoch': 0.86} {'loss': 0.6547, 'learning_rate': 1.2675328037851924e-05, 'epoch': 0.86} {'loss': 0.3907, 'learning_rate': 1.2675004305492342e-05, 'epoch': 0.86} {'loss': 0.6684, 'learning_rate': 1.2674680570113189e-05, 'epoch': 0.86} {'loss': 0.6299, 'learning_rate': 1.267435683171483e-05, 'epoch': 0.86} {'loss': 0.5861, 'learning_rate': 1.267403309029763e-05, 'epoch': 0.86} {'loss': 0.4527, 'learning_rate': 1.2673709345861958e-05, 'epoch': 0.86} {'loss': 0.623, 'learning_rate': 1.2673385598408174e-05, 'epoch': 0.86} {'loss': 0.5383, 'learning_rate': 1.2673061847936646e-05, 'epoch': 0.86} {'loss': 0.6367, 'learning_rate': 1.2672738094447738e-05, 'epoch': 0.86} {'loss': 0.4796, 'learning_rate': 1.2672414337941818e-05, 'epoch': 0.86} {'loss': 0.3787, 'learning_rate': 1.2672090578419251e-05, 'epoch': 0.86} {'loss': 0.7313, 'learning_rate': 1.2671766815880402e-05, 'epoch': 0.86} {'loss': 0.588, 'learning_rate': 1.2671443050325639e-05, 'epoch': 0.86} {'loss': 0.3744, 'learning_rate': 1.267111928175532e-05, 'epoch': 0.86} {'loss': 0.5514, 'learning_rate': 1.2670795510169818e-05, 'epoch': 0.86} {'loss': 0.5096, 'learning_rate': 1.2670471735569494e-05, 'epoch': 0.86} {'loss': 0.4846, 'learning_rate': 1.2670147957954716e-05, 'epoch': 0.86} {'loss': 0.6481, 'learning_rate': 1.2669824177325852e-05, 'epoch': 0.86} {'loss': 0.5889, 'learning_rate': 1.2669500393683258e-05, 'epoch': 0.86} {'loss': 0.4873, 'learning_rate': 1.2669176607027308e-05, 'epoch': 0.86} {'loss': 0.5612, 'learning_rate': 1.2668852817358368e-05, 'epoch': 0.86} {'loss': 0.6282, 'learning_rate': 1.2668529024676799e-05, 'epoch': 0.86} {'loss': 0.6105, 'learning_rate': 1.2668205228982966e-05, 'epoch': 0.86} {'loss': 0.499, 'learning_rate': 1.266788143027724e-05, 'epoch': 0.86} {'loss': 0.6548, 'learning_rate': 1.2667557628559982e-05, 'epoch': 0.86} {'loss': 0.5218, 'learning_rate': 1.2667233823831558e-05, 'epoch': 0.86} {'loss': 0.5162, 'learning_rate': 1.2666910016092333e-05, 'epoch': 0.86} {'loss': 0.5638, 'learning_rate': 1.2666586205342675e-05, 'epoch': 0.86} {'loss': 0.4952, 'learning_rate': 1.2666262391582949e-05, 'epoch': 0.86} {'loss': 0.4591, 'learning_rate': 1.2665938574813518e-05, 'epoch': 0.86} {'loss': 0.6463, 'learning_rate': 1.2665614755034754e-05, 'epoch': 0.86} {'loss': 0.6192, 'learning_rate': 1.2665290932247015e-05, 'epoch': 0.86} {'loss': 0.6578, 'learning_rate': 1.2664967106450667e-05, 'epoch': 0.86} {'loss': 0.4617, 'learning_rate': 1.266464327764608e-05, 'epoch': 0.86} {'loss': 0.5528, 'learning_rate': 1.2664319445833617e-05, 'epoch': 0.86} {'loss': 0.5925, 'learning_rate': 1.2663995611013644e-05, 'epoch': 0.86} {'loss': 0.472, 'learning_rate': 1.2663671773186526e-05, 'epoch': 0.86} {'loss': 0.5821, 'learning_rate': 1.266334793235263e-05, 'epoch': 0.86} {'loss': 0.5513, 'learning_rate': 1.2663024088512322e-05, 'epoch': 0.86} {'loss': 0.4728, 'learning_rate': 1.2662700241665964e-05, 'epoch': 0.86} {'loss': 0.5625, 'learning_rate': 1.2662376391813921e-05, 'epoch': 0.86} {'loss': 0.6505, 'learning_rate': 1.2662052538956567e-05, 'epoch': 0.86} {'loss': 0.4302, 'learning_rate': 1.2661728683094258e-05, 'epoch': 0.86} {'loss': 0.6578, 'learning_rate': 1.2661404824227368e-05, 'epoch': 0.86} {'loss': 0.6791, 'learning_rate': 1.2661080962356256e-05, 'epoch': 0.86} {'loss': 0.5609, 'learning_rate': 1.2660757097481286e-05, 'epoch': 0.86} {'loss': 0.3891, 'learning_rate': 1.266043322960283e-05, 'epoch': 0.86} {'loss': 0.4637, 'learning_rate': 1.2660109358721249e-05, 'epoch': 0.87} {'loss': 0.5577, 'learning_rate': 1.2659785484836913e-05, 'epoch': 0.87} {'loss': 0.5415, 'learning_rate': 1.2659461607950183e-05, 'epoch': 0.87} {'loss': 0.6197, 'learning_rate': 1.2659137728061429e-05, 'epoch': 0.87} {'loss': 0.5321, 'learning_rate': 1.2658813845171012e-05, 'epoch': 0.87} {'loss': 0.5066, 'learning_rate': 1.2658489959279301e-05, 'epoch': 0.87} {'loss': 0.5608, 'learning_rate': 1.2658166070386661e-05, 'epoch': 0.87} {'loss': 0.5083, 'learning_rate': 1.2657842178493456e-05, 'epoch': 0.87} {'loss': 0.4527, 'learning_rate': 1.2657518283600052e-05, 'epoch': 0.87} {'loss': 0.655, 'learning_rate': 1.2657194385706817e-05, 'epoch': 0.87} {'loss': 0.6407, 'learning_rate': 1.2656870484814112e-05, 'epoch': 0.87} {'loss': 0.6082, 'learning_rate': 1.2656546580922306e-05, 'epoch': 0.87} {'loss': 0.5135, 'learning_rate': 1.2656222674031766e-05, 'epoch': 0.87} {'loss': 0.4801, 'learning_rate': 1.2655898764142855e-05, 'epoch': 0.87} {'loss': 0.6227, 'learning_rate': 1.2655574851255939e-05, 'epoch': 0.87} {'loss': 0.7587, 'learning_rate': 1.2655250935371384e-05, 'epoch': 0.87} {'loss': 0.3307, 'learning_rate': 1.2654927016489555e-05, 'epoch': 0.87} {'loss': 0.625, 'learning_rate': 1.265460309461082e-05, 'epoch': 0.87} {'loss': 0.4389, 'learning_rate': 1.265427916973554e-05, 'epoch': 0.87} {'loss': 0.6208, 'learning_rate': 1.2653955241864088e-05, 'epoch': 0.87} {'loss': 0.5773, 'learning_rate': 1.2653631310996824e-05, 'epoch': 0.87} {'loss': 0.5698, 'learning_rate': 1.2653307377134112e-05, 'epoch': 0.87} {'loss': 0.5241, 'learning_rate': 1.2652983440276322e-05, 'epoch': 0.87} {'loss': 0.6984, 'learning_rate': 1.2652659500423819e-05, 'epoch': 0.87} {'loss': 0.6296, 'learning_rate': 1.2652335557576968e-05, 'epoch': 0.87} {'loss': 0.4521, 'learning_rate': 1.2652011611736131e-05, 'epoch': 0.87} {'loss': 0.6232, 'learning_rate': 1.265168766290168e-05, 'epoch': 0.87} {'loss': 0.5938, 'learning_rate': 1.2651363711073979e-05, 'epoch': 0.87} {'loss': 0.5416, 'learning_rate': 1.2651039756253389e-05, 'epoch': 0.87} {'loss': 0.7108, 'learning_rate': 1.2650715798440283e-05, 'epoch': 0.87} {'loss': 0.4867, 'learning_rate': 1.265039183763502e-05, 'epoch': 0.87} {'loss': 0.5711, 'learning_rate': 1.265006787383797e-05, 'epoch': 0.87} {'loss': 0.4131, 'learning_rate': 1.2649743907049498e-05, 'epoch': 0.87} {'loss': 0.5453, 'learning_rate': 1.2649419937269969e-05, 'epoch': 0.87} {'loss': 0.6601, 'learning_rate': 1.2649095964499748e-05, 'epoch': 0.87} {'loss': 0.6081, 'learning_rate': 1.2648771988739202e-05, 'epoch': 0.87} {'loss': 0.3996, 'learning_rate': 1.2648448009988694e-05, 'epoch': 0.87} {'loss': 0.6043, 'learning_rate': 1.2648124028248594e-05, 'epoch': 0.87} {'loss': 0.5182, 'learning_rate': 1.2647800043519265e-05, 'epoch': 0.87} {'loss': 0.5024, 'learning_rate': 1.2647476055801072e-05, 'epoch': 0.87} {'loss': 0.6659, 'learning_rate': 1.2647152065094384e-05, 'epoch': 0.87} {'loss': 0.6142, 'learning_rate': 1.2646828071399562e-05, 'epoch': 0.87} {'loss': 0.5115, 'learning_rate': 1.2646504074716977e-05, 'epoch': 0.87} {'loss': 0.4814, 'learning_rate': 1.264618007504699e-05, 'epoch': 0.87} {'loss': 0.5956, 'learning_rate': 1.264585607238997e-05, 'epoch': 0.87} {'loss': 0.5325, 'learning_rate': 1.2645532066746285e-05, 'epoch': 0.87} {'loss': 0.5019, 'learning_rate': 1.2645208058116293e-05, 'epoch': 0.87} {'loss': 0.6599, 'learning_rate': 1.2644884046500365e-05, 'epoch': 0.87} {'loss': 0.6286, 'learning_rate': 1.2644560031898868e-05, 'epoch': 0.87} {'loss': 0.4901, 'learning_rate': 1.2644236014312158e-05, 'epoch': 0.87} {'loss': 0.5507, 'learning_rate': 1.2643911993740617e-05, 'epoch': 0.87} {'loss': 0.4747, 'learning_rate': 1.2643587970184599e-05, 'epoch': 0.87} {'loss': 0.479, 'learning_rate': 1.2643263943644473e-05, 'epoch': 0.87} {'loss': 0.5523, 'learning_rate': 1.2642939914120605e-05, 'epoch': 0.87} {'loss': 0.4621, 'learning_rate': 1.264261588161336e-05, 'epoch': 0.87} {'loss': 0.6674, 'learning_rate': 1.2642291846123103e-05, 'epoch': 0.87} {'loss': 0.5884, 'learning_rate': 1.2641967807650205e-05, 'epoch': 0.87} {'loss': 0.508, 'learning_rate': 1.2641643766195023e-05, 'epoch': 0.87} {'loss': 0.5174, 'learning_rate': 1.2641319721757932e-05, 'epoch': 0.87} {'loss': 0.5923, 'learning_rate': 1.264099567433929e-05, 'epoch': 0.87} {'loss': 0.6293, 'learning_rate': 1.2640671623939466e-05, 'epoch': 0.87} {'loss': 0.5296, 'learning_rate': 1.2640347570558827e-05, 'epoch': 0.87} {'loss': 0.5812, 'learning_rate': 1.264002351419774e-05, 'epoch': 0.87} {'loss': 0.3686, 'learning_rate': 1.2639699454856565e-05, 'epoch': 0.87} {'loss': 0.4973, 'learning_rate': 1.263937539253567e-05, 'epoch': 0.87} {'loss': 0.6841, 'learning_rate': 1.2639051327235426e-05, 'epoch': 0.87} {'loss': 0.5453, 'learning_rate': 1.2638727258956194e-05, 'epoch': 0.87} {'loss': 0.6405, 'learning_rate': 1.2638403187698338e-05, 'epoch': 0.87} {'loss': 0.6836, 'learning_rate': 1.263807911346223e-05, 'epoch': 0.87} {'loss': 0.5236, 'learning_rate': 1.2637755036248231e-05, 'epoch': 0.87} {'loss': 0.41, 'learning_rate': 1.2637430956056708e-05, 'epoch': 0.87} {'loss': 0.4601, 'learning_rate': 1.2637106872888028e-05, 'epoch': 0.87} {'loss': 0.6623, 'learning_rate': 1.2636782786742555e-05, 'epoch': 0.87} {'loss': 0.4003, 'learning_rate': 1.2636458697620655e-05, 'epoch': 0.87} {'loss': 0.5142, 'learning_rate': 1.2636134605522694e-05, 'epoch': 0.87} {'loss': 0.6139, 'learning_rate': 1.2635810510449038e-05, 'epoch': 0.87} {'loss': 0.576, 'learning_rate': 1.2635486412400055e-05, 'epoch': 0.87} {'loss': 0.4302, 'learning_rate': 1.2635162311376108e-05, 'epoch': 0.87} {'loss': 0.5765, 'learning_rate': 1.2634838207377564e-05, 'epoch': 0.87} {'loss': 0.5841, 'learning_rate': 1.263451410040479e-05, 'epoch': 0.87} {'loss': 0.5973, 'learning_rate': 1.2634189990458148e-05, 'epoch': 0.87} {'loss': 0.7115, 'learning_rate': 1.2633865877538009e-05, 'epoch': 0.87} {'loss': 0.5844, 'learning_rate': 1.2633541761644736e-05, 'epoch': 0.87} {'loss': 0.6529, 'learning_rate': 1.2633217642778695e-05, 'epoch': 0.87} {'loss': 0.4904, 'learning_rate': 1.263289352094025e-05, 'epoch': 0.87} {'loss': 0.5858, 'learning_rate': 1.2632569396129771e-05, 'epoch': 0.87} {'loss': 0.6016, 'learning_rate': 1.2632245268347621e-05, 'epoch': 0.87} {'loss': 0.5845, 'learning_rate': 1.2631921137594167e-05, 'epoch': 0.87} {'loss': 0.6175, 'learning_rate': 1.2631597003869773e-05, 'epoch': 0.87} {'loss': 0.6964, 'learning_rate': 1.2631272867174809e-05, 'epoch': 0.87} {'loss': 0.6524, 'learning_rate': 1.2630948727509635e-05, 'epoch': 0.87} {'loss': 0.5395, 'learning_rate': 1.2630624584874622e-05, 'epoch': 0.87} {'loss': 0.5494, 'learning_rate': 1.2630300439270133e-05, 'epoch': 0.87} {'loss': 0.7207, 'learning_rate': 1.2629976290696538e-05, 'epoch': 0.87} {'loss': 0.5827, 'learning_rate': 1.2629652139154195e-05, 'epoch': 0.87} {'loss': 0.6016, 'learning_rate': 1.2629327984643482e-05, 'epoch': 0.87} {'loss': 0.5882, 'learning_rate': 1.2629003827164751e-05, 'epoch': 0.87} {'loss': 0.6207, 'learning_rate': 1.262867966671838e-05, 'epoch': 0.87} {'loss': 0.7368, 'learning_rate': 1.2628355503304724e-05, 'epoch': 0.87} {'loss': 0.5791, 'learning_rate': 1.2628031336924156e-05, 'epoch': 0.87} {'loss': 0.4642, 'learning_rate': 1.2627707167577041e-05, 'epoch': 0.87} {'loss': 0.5289, 'learning_rate': 1.2627382995263746e-05, 'epoch': 0.87} {'loss': 0.4238, 'learning_rate': 1.2627058819984632e-05, 'epoch': 0.87} {'loss': 0.487, 'learning_rate': 1.262673464174007e-05, 'epoch': 0.87} {'loss': 0.4591, 'learning_rate': 1.2626410460530425e-05, 'epoch': 0.87} {'loss': 0.7044, 'learning_rate': 1.2626086276356062e-05, 'epoch': 0.87} {'loss': 0.6668, 'learning_rate': 1.2625762089217346e-05, 'epoch': 0.87} {'loss': 0.5986, 'learning_rate': 1.2625437899114642e-05, 'epoch': 0.87} {'loss': 0.4509, 'learning_rate': 1.2625113706048322e-05, 'epoch': 0.87} {'loss': 0.6758, 'learning_rate': 1.2624789510018744e-05, 'epoch': 0.87} {'loss': 0.48, 'learning_rate': 1.2624465311026282e-05, 'epoch': 0.87} {'loss': 0.4502, 'learning_rate': 1.2624141109071295e-05, 'epoch': 0.87} {'loss': 0.6483, 'learning_rate': 1.2623816904154152e-05, 'epoch': 0.87} {'loss': 0.5526, 'learning_rate': 1.2623492696275216e-05, 'epoch': 0.87} {'loss': 0.582, 'learning_rate': 1.262316848543486e-05, 'epoch': 0.87} {'loss': 0.6201, 'learning_rate': 1.2622844271633443e-05, 'epoch': 0.87} {'loss': 0.5796, 'learning_rate': 1.2622520054871334e-05, 'epoch': 0.87} {'loss': 0.659, 'learning_rate': 1.2622195835148898e-05, 'epoch': 0.87} {'loss': 0.5533, 'learning_rate': 1.2621871612466503e-05, 'epoch': 0.87} {'loss': 0.5403, 'learning_rate': 1.2621547386824515e-05, 'epoch': 0.87} {'loss': 0.482, 'learning_rate': 1.2621223158223296e-05, 'epoch': 0.87} {'loss': 0.5886, 'learning_rate': 1.2620898926663214e-05, 'epoch': 0.87} {'loss': 0.4896, 'learning_rate': 1.2620574692144638e-05, 'epoch': 0.87} {'loss': 0.4575, 'learning_rate': 1.262025045466793e-05, 'epoch': 0.87} {'loss': 0.4865, 'learning_rate': 1.2619926214233455e-05, 'epoch': 0.87} {'loss': 0.7057, 'learning_rate': 1.2619601970841586e-05, 'epoch': 0.87} {'loss': 0.5923, 'learning_rate': 1.2619277724492682e-05, 'epoch': 0.87} {'loss': 0.5272, 'learning_rate': 1.2618953475187112e-05, 'epoch': 0.87} {'loss': 0.5128, 'learning_rate': 1.261862922292524e-05, 'epoch': 0.87} {'loss': 0.5862, 'learning_rate': 1.2618304967707436e-05, 'epoch': 0.87} {'loss': 0.5683, 'learning_rate': 1.2617980709534064e-05, 'epoch': 0.87} {'loss': 0.4443, 'learning_rate': 1.2617656448405486e-05, 'epoch': 0.87} {'loss': 0.614, 'learning_rate': 1.2617332184322077e-05, 'epoch': 0.87} {'loss': 0.4108, 'learning_rate': 1.2617007917284193e-05, 'epoch': 0.87} {'loss': 0.6182, 'learning_rate': 1.2616683647292206e-05, 'epoch': 0.87} {'loss': 0.6488, 'learning_rate': 1.2616359374346483e-05, 'epoch': 0.87} {'loss': 0.4872, 'learning_rate': 1.2616035098447385e-05, 'epoch': 0.87} {'loss': 0.5487, 'learning_rate': 1.2615710819595281e-05, 'epoch': 0.87} {'loss': 0.5741, 'learning_rate': 1.2615386537790539e-05, 'epoch': 0.87} {'loss': 0.4378, 'learning_rate': 1.261506225303352e-05, 'epoch': 0.87} {'loss': 0.4266, 'learning_rate': 1.2614737965324594e-05, 'epoch': 0.87} {'loss': 0.5223, 'learning_rate': 1.2614413674664127e-05, 'epoch': 0.87} {'loss': 0.7164, 'learning_rate': 1.2614089381052483e-05, 'epoch': 0.87} {'loss': 0.5555, 'learning_rate': 1.261376508449003e-05, 'epoch': 0.87} {'loss': 0.5841, 'learning_rate': 1.2613440784977133e-05, 'epoch': 0.87} {'loss': 0.574, 'learning_rate': 1.261311648251416e-05, 'epoch': 0.87} {'loss': 0.4101, 'learning_rate': 1.2612792177101474e-05, 'epoch': 0.87} {'loss': 0.4971, 'learning_rate': 1.2612467868739442e-05, 'epoch': 0.87} {'loss': 0.621, 'learning_rate': 1.2612143557428429e-05, 'epoch': 0.87} {'loss': 0.7237, 'learning_rate': 1.2611819243168806e-05, 'epoch': 0.87} {'loss': 0.5664, 'learning_rate': 1.2611494925960932e-05, 'epoch': 0.87} {'loss': 0.5542, 'learning_rate': 1.261117060580518e-05, 'epoch': 0.87} {'loss': 0.6444, 'learning_rate': 1.2610846282701912e-05, 'epoch': 0.87} {'loss': 0.5796, 'learning_rate': 1.2610521956651494e-05, 'epoch': 0.87} {'loss': 0.6404, 'learning_rate': 1.2610197627654294e-05, 'epoch': 0.87} {'loss': 0.5361, 'learning_rate': 1.260987329571068e-05, 'epoch': 0.87} {'loss': 0.5806, 'learning_rate': 1.2609548960821012e-05, 'epoch': 0.87} {'loss': 0.5074, 'learning_rate': 1.260922462298566e-05, 'epoch': 0.87} {'loss': 0.5821, 'learning_rate': 1.260890028220499e-05, 'epoch': 0.87} {'loss': 0.5442, 'learning_rate': 1.2608575938479368e-05, 'epoch': 0.87} {'loss': 0.6094, 'learning_rate': 1.2608251591809157e-05, 'epoch': 0.87} {'loss': 0.6031, 'learning_rate': 1.2607927242194728e-05, 'epoch': 0.87} {'loss': 0.4836, 'learning_rate': 1.2607602889636446e-05, 'epoch': 0.87} {'loss': 0.5941, 'learning_rate': 1.2607278534134677e-05, 'epoch': 0.87} {'loss': 0.467, 'learning_rate': 1.2606954175689782e-05, 'epoch': 0.87} {'loss': 0.4299, 'learning_rate': 1.2606629814302135e-05, 'epoch': 0.87} {'loss': 0.705, 'learning_rate': 1.2606305449972098e-05, 'epoch': 0.87} {'loss': 0.5629, 'learning_rate': 1.2605981082700039e-05, 'epoch': 0.87} {'loss': 0.4771, 'learning_rate': 1.2605656712486322e-05, 'epoch': 0.87} {'loss': 0.4573, 'learning_rate': 1.2605332339331313e-05, 'epoch': 0.87} {'loss': 0.4027, 'learning_rate': 1.2605007963235381e-05, 'epoch': 0.87} {'loss': 0.568, 'learning_rate': 1.260468358419889e-05, 'epoch': 0.87} {'loss': 0.6097, 'learning_rate': 1.2604359202222205e-05, 'epoch': 0.87} {'loss': 0.5236, 'learning_rate': 1.2604034817305692e-05, 'epoch': 0.87} {'loss': 0.5466, 'learning_rate': 1.2603710429449723e-05, 'epoch': 0.87} {'loss': 0.4402, 'learning_rate': 1.2603386038654657e-05, 'epoch': 0.87} {'loss': 0.6169, 'learning_rate': 1.2603061644920864e-05, 'epoch': 0.87} {'loss': 0.5809, 'learning_rate': 1.2602737248248711e-05, 'epoch': 0.87} {'loss': 0.5587, 'learning_rate': 1.2602412848638562e-05, 'epoch': 0.87} {'loss': 0.5738, 'learning_rate': 1.2602088446090784e-05, 'epoch': 0.87} {'loss': 0.5805, 'learning_rate': 1.260176404060574e-05, 'epoch': 0.87} {'loss': 0.4377, 'learning_rate': 1.2601439632183804e-05, 'epoch': 0.87} {'loss': 0.4681, 'learning_rate': 1.2601115220825335e-05, 'epoch': 0.87} {'loss': 0.6233, 'learning_rate': 1.26007908065307e-05, 'epoch': 0.87} {'loss': 0.5852, 'learning_rate': 1.2600466389300267e-05, 'epoch': 0.87} {'loss': 0.4928, 'learning_rate': 1.2600141969134402e-05, 'epoch': 0.87} {'loss': 0.4698, 'learning_rate': 1.2599817546033473e-05, 'epoch': 0.87} {'loss': 0.6956, 'learning_rate': 1.2599493119997846e-05, 'epoch': 0.87} {'loss': 0.6985, 'learning_rate': 1.2599168691027881e-05, 'epoch': 0.87} {'loss': 0.5931, 'learning_rate': 1.259884425912395e-05, 'epoch': 0.87} {'loss': 0.6555, 'learning_rate': 1.259851982428642e-05, 'epoch': 0.87} {'loss': 0.5653, 'learning_rate': 1.2598195386515654e-05, 'epoch': 0.87} {'loss': 0.5577, 'learning_rate': 1.2597870945812018e-05, 'epoch': 0.87} {'loss': 0.714, 'learning_rate': 1.2597546502175883e-05, 'epoch': 0.87} {'loss': 0.5471, 'learning_rate': 1.259722205560761e-05, 'epoch': 0.87} {'loss': 0.5469, 'learning_rate': 1.259689760610757e-05, 'epoch': 0.87} {'loss': 0.5495, 'learning_rate': 1.2596573153676124e-05, 'epoch': 0.87} {'loss': 0.5404, 'learning_rate': 1.259624869831364e-05, 'epoch': 0.87} {'loss': 0.6602, 'learning_rate': 1.2595924240020484e-05, 'epoch': 0.87} {'loss': 0.8023, 'learning_rate': 1.2595599778797022e-05, 'epoch': 0.87} {'loss': 0.4538, 'learning_rate': 1.2595275314643625e-05, 'epoch': 0.87} {'loss': 0.5991, 'learning_rate': 1.2594950847560654e-05, 'epoch': 0.87} {'loss': 0.568, 'learning_rate': 1.2594626377548477e-05, 'epoch': 0.87} {'loss': 0.5582, 'learning_rate': 1.2594301904607462e-05, 'epoch': 0.87} {'loss': 0.5648, 'learning_rate': 1.2593977428737971e-05, 'epoch': 0.87} {'loss': 0.6626, 'learning_rate': 1.2593652949940376e-05, 'epoch': 0.87} {'loss': 0.5714, 'learning_rate': 1.2593328468215038e-05, 'epoch': 0.87} {'loss': 0.5653, 'learning_rate': 1.2593003983562327e-05, 'epoch': 0.87} {'loss': 0.6198, 'learning_rate': 1.2592679495982605e-05, 'epoch': 0.87} {'loss': 0.5028, 'learning_rate': 1.2592355005476243e-05, 'epoch': 0.87} {'loss': 0.6607, 'learning_rate': 1.2592030512043603e-05, 'epoch': 0.87} {'loss': 0.5624, 'learning_rate': 1.2591706015685054e-05, 'epoch': 0.87} {'loss': 0.4778, 'learning_rate': 1.2591381516400962e-05, 'epoch': 0.87} {'loss': 0.4007, 'learning_rate': 1.2591057014191694e-05, 'epoch': 0.87} {'loss': 0.5445, 'learning_rate': 1.2590732509057615e-05, 'epoch': 0.87} {'loss': 0.604, 'learning_rate': 1.259040800099909e-05, 'epoch': 0.87} {'loss': 0.7404, 'learning_rate': 1.2590083490016487e-05, 'epoch': 0.87} {'loss': 0.5714, 'learning_rate': 1.2589758976110177e-05, 'epoch': 0.87} {'loss': 0.5803, 'learning_rate': 1.2589434459280519e-05, 'epoch': 0.87} {'loss': 0.4841, 'learning_rate': 1.2589109939527879e-05, 'epoch': 0.87} {'loss': 0.6319, 'learning_rate': 1.258878541685263e-05, 'epoch': 0.87} {'loss': 0.6285, 'learning_rate': 1.2588460891255132e-05, 'epoch': 0.87} {'loss': 0.452, 'learning_rate': 1.2588136362735755e-05, 'epoch': 0.87} {'loss': 0.5805, 'learning_rate': 1.2587811831294863e-05, 'epoch': 0.87} {'loss': 0.6529, 'learning_rate': 1.2587487296932823e-05, 'epoch': 0.87} {'loss': 0.6463, 'learning_rate': 1.2587162759650004e-05, 'epoch': 0.87} {'loss': 0.652, 'learning_rate': 1.2586838219446769e-05, 'epoch': 0.87} {'loss': 0.533, 'learning_rate': 1.2586513676323487e-05, 'epoch': 0.87} {'loss': 0.6003, 'learning_rate': 1.2586189130280521e-05, 'epoch': 0.87} {'loss': 0.6309, 'learning_rate': 1.2585864581318238e-05, 'epoch': 0.87} {'loss': 0.5995, 'learning_rate': 1.2585540029437008e-05, 'epoch': 0.87} {'loss': 0.5133, 'learning_rate': 1.2585215474637198e-05, 'epoch': 0.87} {'loss': 0.483, 'learning_rate': 1.2584890916919167e-05, 'epoch': 0.87} {'loss': 0.3854, 'learning_rate': 1.2584566356283288e-05, 'epoch': 0.87} {'loss': 0.6327, 'learning_rate': 1.2584241792729924e-05, 'epoch': 0.87} {'loss': 0.5118, 'learning_rate': 1.258391722625944e-05, 'epoch': 0.87} {'loss': 0.5085, 'learning_rate': 1.2583592656872208e-05, 'epoch': 0.87} {'loss': 0.471, 'learning_rate': 1.2583268084568592e-05, 'epoch': 0.87} {'loss': 0.7173, 'learning_rate': 1.2582943509348955e-05, 'epoch': 0.87} {'loss': 0.4746, 'learning_rate': 1.2582618931213666e-05, 'epoch': 0.87} {'loss': 0.5025, 'learning_rate': 1.2582294350163093e-05, 'epoch': 0.87} {'loss': 0.524, 'learning_rate': 1.2581969766197599e-05, 'epoch': 0.87} {'loss': 0.5051, 'learning_rate': 1.2581645179317552e-05, 'epoch': 0.87} {'loss': 0.5005, 'learning_rate': 1.2581320589523321e-05, 'epoch': 0.87} {'loss': 0.7318, 'learning_rate': 1.2580995996815269e-05, 'epoch': 0.87} {'loss': 0.4989, 'learning_rate': 1.2580671401193763e-05, 'epoch': 0.87} {'loss': 0.6098, 'learning_rate': 1.258034680265917e-05, 'epoch': 0.87} {'loss': 0.5772, 'learning_rate': 1.2580022201211852e-05, 'epoch': 0.87} {'loss': 0.5768, 'learning_rate': 1.2579697596852186e-05, 'epoch': 0.87} {'loss': 0.3892, 'learning_rate': 1.2579372989580527e-05, 'epoch': 0.87} {'loss': 0.4453, 'learning_rate': 1.2579048379397247e-05, 'epoch': 0.87} {'loss': 0.7255, 'learning_rate': 1.2578723766302715e-05, 'epoch': 0.87} {'loss': 0.5067, 'learning_rate': 1.2578399150297291e-05, 'epoch': 0.87} {'loss': 0.4776, 'learning_rate': 1.2578074531381349e-05, 'epoch': 0.87} {'loss': 0.4425, 'learning_rate': 1.2577749909555247e-05, 'epoch': 0.87} {'loss': 0.497, 'learning_rate': 1.2577425284819358e-05, 'epoch': 0.87} {'loss': 0.6024, 'learning_rate': 1.2577100657174045e-05, 'epoch': 0.87} {'loss': 0.588, 'learning_rate': 1.2576776026619675e-05, 'epoch': 0.87} {'loss': 0.6558, 'learning_rate': 1.2576451393156614e-05, 'epoch': 0.87} {'loss': 0.7175, 'learning_rate': 1.257612675678523e-05, 'epoch': 0.87} {'loss': 0.4403, 'learning_rate': 1.2575802117505889e-05, 'epoch': 0.87} {'loss': 0.5549, 'learning_rate': 1.2575477475318958e-05, 'epoch': 0.87} {'loss': 0.6019, 'learning_rate': 1.2575152830224801e-05, 'epoch': 0.87} {'loss': 0.6183, 'learning_rate': 1.2574828182223789e-05, 'epoch': 0.87} {'loss': 0.6502, 'learning_rate': 1.2574503531316283e-05, 'epoch': 0.87} {'loss': 0.5654, 'learning_rate': 1.2574178877502652e-05, 'epoch': 0.87} {'loss': 0.5527, 'learning_rate': 1.2573854220783264e-05, 'epoch': 0.87} {'loss': 0.6731, 'learning_rate': 1.2573529561158482e-05, 'epoch': 0.87} {'loss': 0.558, 'learning_rate': 1.257320489862868e-05, 'epoch': 0.87} {'loss': 0.521, 'learning_rate': 1.2572880233194213e-05, 'epoch': 0.87} {'loss': 0.5579, 'learning_rate': 1.2572555564855455e-05, 'epoch': 0.87} {'loss': 0.6023, 'learning_rate': 1.2572230893612771e-05, 'epoch': 0.87} {'loss': 0.5184, 'learning_rate': 1.257190621946653e-05, 'epoch': 0.87} {'loss': 0.4427, 'learning_rate': 1.2571581542417094e-05, 'epoch': 0.87} {'loss': 0.4606, 'learning_rate': 1.257125686246483e-05, 'epoch': 0.87} {'loss': 0.7033, 'learning_rate': 1.2570932179610107e-05, 'epoch': 0.87} {'loss': 0.5615, 'learning_rate': 1.257060749385329e-05, 'epoch': 0.87} {'loss': 0.5344, 'learning_rate': 1.2570282805194747e-05, 'epoch': 0.87} {'loss': 0.5363, 'learning_rate': 1.2569958113634842e-05, 'epoch': 0.87} {'loss': 0.4472, 'learning_rate': 1.2569633419173943e-05, 'epoch': 0.87} {'loss': 0.5529, 'learning_rate': 1.2569308721812418e-05, 'epoch': 0.87} {'loss': 0.6663, 'learning_rate': 1.2568984021550635e-05, 'epoch': 0.87} {'loss': 0.5109, 'learning_rate': 1.2568659318388955e-05, 'epoch': 0.87} {'loss': 0.684, 'learning_rate': 1.2568334612327744e-05, 'epoch': 0.87} {'loss': 0.6302, 'learning_rate': 1.2568009903367372e-05, 'epoch': 0.87} {'loss': 0.5093, 'learning_rate': 1.2567685191508207e-05, 'epoch': 0.87} {'loss': 0.4643, 'learning_rate': 1.2567360476750614e-05, 'epoch': 0.87} {'loss': 0.6298, 'learning_rate': 1.2567035759094962e-05, 'epoch': 0.87} {'loss': 0.3441, 'learning_rate': 1.256671103854161e-05, 'epoch': 0.87} {'loss': 0.6291, 'learning_rate': 1.256638631509093e-05, 'epoch': 0.87} {'loss': 0.5884, 'learning_rate': 1.256606158874329e-05, 'epoch': 0.87} {'loss': 0.5532, 'learning_rate': 1.2565736859499054e-05, 'epoch': 0.87} {'loss': 0.5858, 'learning_rate': 1.2565412127358588e-05, 'epoch': 0.87} {'loss': 0.5174, 'learning_rate': 1.256508739232226e-05, 'epoch': 0.87} {'loss': 0.6123, 'learning_rate': 1.2564762654390436e-05, 'epoch': 0.87} {'loss': 0.5731, 'learning_rate': 1.2564437913563483e-05, 'epoch': 0.87} {'loss': 0.6311, 'learning_rate': 1.2564113169841767e-05, 'epoch': 0.87} {'loss': 0.4806, 'learning_rate': 1.2563788423225652e-05, 'epoch': 0.87} {'loss': 0.546, 'learning_rate': 1.256346367371551e-05, 'epoch': 0.87} {'loss': 0.6281, 'learning_rate': 1.2563138921311703e-05, 'epoch': 0.87} {'loss': 0.5008, 'learning_rate': 1.2562814166014603e-05, 'epoch': 0.87} {'loss': 0.6207, 'learning_rate': 1.2562489407824572e-05, 'epoch': 0.87} {'loss': 0.4767, 'learning_rate': 1.2562164646741976e-05, 'epoch': 0.87} {'loss': 0.5448, 'learning_rate': 1.2561839882767186e-05, 'epoch': 0.87} {'loss': 0.4712, 'learning_rate': 1.2561515115900566e-05, 'epoch': 0.87} {'loss': 0.5582, 'learning_rate': 1.2561190346142482e-05, 'epoch': 0.87} {'loss': 0.568, 'learning_rate': 1.2560865573493299e-05, 'epoch': 0.87} {'loss': 0.5862, 'learning_rate': 1.2560540797953387e-05, 'epoch': 0.87} {'loss': 0.6579, 'learning_rate': 1.2560216019523113e-05, 'epoch': 0.87} {'loss': 0.7334, 'learning_rate': 1.255989123820284e-05, 'epoch': 0.87} {'loss': 0.5425, 'learning_rate': 1.2559566453992935e-05, 'epoch': 0.87} {'loss': 0.4771, 'learning_rate': 1.2559241666893768e-05, 'epoch': 0.87} {'loss': 0.7078, 'learning_rate': 1.2558916876905705e-05, 'epoch': 0.87} {'loss': 0.4293, 'learning_rate': 1.255859208402911e-05, 'epoch': 0.87} {'loss': 0.5522, 'learning_rate': 1.2558267288264353e-05, 'epoch': 0.87} {'loss': 0.5307, 'learning_rate': 1.2557942489611797e-05, 'epoch': 0.87} {'loss': 0.5078, 'learning_rate': 1.255761768807181e-05, 'epoch': 0.87} {'loss': 0.6839, 'learning_rate': 1.2557292883644761e-05, 'epoch': 0.87} {'loss': 0.6223, 'learning_rate': 1.2556968076331014e-05, 'epoch': 0.87} {'loss': 0.5488, 'learning_rate': 1.2556643266130934e-05, 'epoch': 0.87} {'loss': 0.5786, 'learning_rate': 1.2556318453044894e-05, 'epoch': 0.87} {'loss': 0.4533, 'learning_rate': 1.2555993637073252e-05, 'epoch': 0.87} {'loss': 0.5129, 'learning_rate': 1.255566881821638e-05, 'epoch': 0.87} {'loss': 0.4686, 'learning_rate': 1.2555343996474644e-05, 'epoch': 0.87} {'loss': 0.5673, 'learning_rate': 1.2555019171848412e-05, 'epoch': 0.87} {'loss': 0.5479, 'learning_rate': 1.255469434433805e-05, 'epoch': 0.87} {'loss': 0.4702, 'learning_rate': 1.2554369513943922e-05, 'epoch': 0.87} {'loss': 0.4898, 'learning_rate': 1.2554044680666397e-05, 'epoch': 0.87} {'loss': 0.5737, 'learning_rate': 1.2553719844505843e-05, 'epoch': 0.87} {'loss': 0.5322, 'learning_rate': 1.2553395005462623e-05, 'epoch': 0.87} {'loss': 0.5397, 'learning_rate': 1.2553070163537107e-05, 'epoch': 0.87} {'loss': 0.4216, 'learning_rate': 1.2552745318729659e-05, 'epoch': 0.87} {'loss': 0.6213, 'learning_rate': 1.2552420471040648e-05, 'epoch': 0.87} {'loss': 0.5972, 'learning_rate': 1.2552095620470439e-05, 'epoch': 0.87} {'loss': 0.5848, 'learning_rate': 1.2551770767019398e-05, 'epoch': 0.87} {'loss': 0.5668, 'learning_rate': 1.2551445910687896e-05, 'epoch': 0.87} {'loss': 0.5795, 'learning_rate': 1.2551121051476294e-05, 'epoch': 0.87} {'loss': 0.6813, 'learning_rate': 1.2550796189384964e-05, 'epoch': 0.87} {'loss': 0.5911, 'learning_rate': 1.2550471324414266e-05, 'epoch': 0.87} {'loss': 0.7959, 'learning_rate': 1.2550146456564573e-05, 'epoch': 0.87} {'loss': 0.6311, 'learning_rate': 1.254982158583625e-05, 'epoch': 0.87} {'loss': 0.5258, 'learning_rate': 1.2549496712229664e-05, 'epoch': 0.87} {'loss': 0.6528, 'learning_rate': 1.2549171835745182e-05, 'epoch': 0.87} {'loss': 0.5667, 'learning_rate': 1.2548846956383168e-05, 'epoch': 0.87} {'loss': 0.6283, 'learning_rate': 1.2548522074143991e-05, 'epoch': 0.87} {'loss': 0.532, 'learning_rate': 1.2548197189028018e-05, 'epoch': 0.87} {'loss': 0.6062, 'learning_rate': 1.254787230103561e-05, 'epoch': 0.87} {'loss': 0.4547, 'learning_rate': 1.2547547410167145e-05, 'epoch': 0.87} {'loss': 0.6648, 'learning_rate': 1.2547222516422978e-05, 'epoch': 0.87} {'loss': 0.658, 'learning_rate': 1.2546897619803486e-05, 'epoch': 0.87} {'loss': 0.517, 'learning_rate': 1.2546572720309027e-05, 'epoch': 0.87} {'loss': 0.573, 'learning_rate': 1.2546247817939973e-05, 'epoch': 0.87} {'loss': 0.6463, 'learning_rate': 1.2545922912696691e-05, 'epoch': 0.87} {'loss': 0.4817, 'learning_rate': 1.2545598004579546e-05, 'epoch': 0.87} {'loss': 0.6444, 'learning_rate': 1.2545273093588905e-05, 'epoch': 0.87} {'loss': 0.5545, 'learning_rate': 1.2544948179725133e-05, 'epoch': 0.87} {'loss': 0.6374, 'learning_rate': 1.25446232629886e-05, 'epoch': 0.87} {'loss': 0.647, 'learning_rate': 1.254429834337967e-05, 'epoch': 0.87} {'loss': 0.4744, 'learning_rate': 1.2543973420898712e-05, 'epoch': 0.87} {'loss': 0.5039, 'learning_rate': 1.254364849554609e-05, 'epoch': 0.87} {'loss': 0.5443, 'learning_rate': 1.2543323567322174e-05, 'epoch': 0.87} {'loss': 0.5493, 'learning_rate': 1.254299863622733e-05, 'epoch': 0.87} {'loss': 0.6783, 'learning_rate': 1.2542673702261922e-05, 'epoch': 0.87} {'loss': 0.5978, 'learning_rate': 1.254234876542632e-05, 'epoch': 0.87} {'loss': 0.6297, 'learning_rate': 1.2542023825720891e-05, 'epoch': 0.87} {'loss': 0.5718, 'learning_rate': 1.2541698883145999e-05, 'epoch': 0.87} {'loss': 0.5507, 'learning_rate': 1.2541373937702011e-05, 'epoch': 0.87} {'loss': 0.5105, 'learning_rate': 1.25410489893893e-05, 'epoch': 0.87} {'loss': 0.7311, 'learning_rate': 1.2540724038208222e-05, 'epoch': 0.87} {'loss': 0.5855, 'learning_rate': 1.2540399084159154e-05, 'epoch': 0.87} {'loss': 0.4543, 'learning_rate': 1.2540074127242456e-05, 'epoch': 0.87} {'loss': 0.3952, 'learning_rate': 1.2539749167458499e-05, 'epoch': 0.87} {'loss': 0.5055, 'learning_rate': 1.2539424204807647e-05, 'epoch': 0.87} {'loss': 0.6374, 'learning_rate': 1.2539099239290267e-05, 'epoch': 0.87} {'loss': 0.6075, 'learning_rate': 1.2538774270906729e-05, 'epoch': 0.87} {'loss': 0.7448, 'learning_rate': 1.2538449299657396e-05, 'epoch': 0.87} {'loss': 0.4821, 'learning_rate': 1.2538124325542636e-05, 'epoch': 0.87} {'loss': 0.694, 'learning_rate': 1.2537799348562817e-05, 'epoch': 0.87} {'loss': 0.525, 'learning_rate': 1.2537474368718306e-05, 'epoch': 0.87} {'loss': 0.6422, 'learning_rate': 1.2537149386009468e-05, 'epoch': 0.87} {'loss': 0.5955, 'learning_rate': 1.2536824400436673e-05, 'epoch': 0.87} {'loss': 0.5852, 'learning_rate': 1.2536499412000285e-05, 'epoch': 0.87} {'loss': 0.4886, 'learning_rate': 1.2536174420700671e-05, 'epoch': 0.87} {'loss': 0.5655, 'learning_rate': 1.2535849426538196e-05, 'epoch': 0.87} {'loss': 0.522, 'learning_rate': 1.2535524429513231e-05, 'epoch': 0.87} {'loss': 0.4191, 'learning_rate': 1.2535199429626141e-05, 'epoch': 0.87} {'loss': 0.5502, 'learning_rate': 1.2534874426877293e-05, 'epoch': 0.87} {'loss': 0.5415, 'learning_rate': 1.2534549421267053e-05, 'epoch': 0.87} {'loss': 0.4927, 'learning_rate': 1.253422441279579e-05, 'epoch': 0.87} {'loss': 0.6401, 'learning_rate': 1.2533899401463869e-05, 'epoch': 0.87} {'loss': 0.553, 'learning_rate': 1.2533574387271656e-05, 'epoch': 0.87} {'loss': 0.4311, 'learning_rate': 1.2533249370219522e-05, 'epoch': 0.87} {'loss': 0.547, 'learning_rate': 1.2532924350307828e-05, 'epoch': 0.87} {'loss': 0.469, 'learning_rate': 1.253259932753695e-05, 'epoch': 0.87} {'loss': 0.5837, 'learning_rate': 1.2532274301907243e-05, 'epoch': 0.87} {'loss': 0.4593, 'learning_rate': 1.2531949273419081e-05, 'epoch': 0.87} {'loss': 0.4343, 'learning_rate': 1.2531624242072829e-05, 'epoch': 0.87} {'loss': 0.6079, 'learning_rate': 1.2531299207868857e-05, 'epoch': 0.87} {'loss': 0.4365, 'learning_rate': 1.2530974170807529e-05, 'epoch': 0.87} {'loss': 0.6705, 'learning_rate': 1.2530649130889212e-05, 'epoch': 0.87} {'loss': 0.7405, 'learning_rate': 1.2530324088114273e-05, 'epoch': 0.87} {'loss': 0.6264, 'learning_rate': 1.2529999042483079e-05, 'epoch': 0.87} {'loss': 0.7433, 'learning_rate': 1.2529673993995997e-05, 'epoch': 0.87} {'loss': 0.5654, 'learning_rate': 1.2529348942653394e-05, 'epoch': 0.87} {'loss': 0.5267, 'learning_rate': 1.2529023888455641e-05, 'epoch': 0.87} {'loss': 0.5914, 'learning_rate': 1.25286988314031e-05, 'epoch': 0.87} {'loss': 0.562, 'learning_rate': 1.2528373771496134e-05, 'epoch': 0.87} {'loss': 0.4733, 'learning_rate': 1.2528048708735119e-05, 'epoch': 0.87} {'loss': 0.5466, 'learning_rate': 1.2527723643120416e-05, 'epoch': 0.87} {'loss': 0.5636, 'learning_rate': 1.2527398574652394e-05, 'epoch': 0.87} {'loss': 0.7014, 'learning_rate': 1.252707350333142e-05, 'epoch': 0.87} {'loss': 0.566, 'learning_rate': 1.252674842915786e-05, 'epoch': 0.87} {'loss': 0.6882, 'learning_rate': 1.252642335213208e-05, 'epoch': 0.87} {'loss': 0.4563, 'learning_rate': 1.252609827225445e-05, 'epoch': 0.87} {'loss': 0.5432, 'learning_rate': 1.2525773189525337e-05, 'epoch': 0.87} {'loss': 0.4827, 'learning_rate': 1.2525448103945103e-05, 'epoch': 0.87} {'loss': 0.5875, 'learning_rate': 1.2525123015514123e-05, 'epoch': 0.87} {'loss': 0.5975, 'learning_rate': 1.2524797924232757e-05, 'epoch': 0.87} {'loss': 0.7207, 'learning_rate': 1.2524472830101374e-05, 'epoch': 0.87} {'loss': 0.4158, 'learning_rate': 1.2524147733120339e-05, 'epoch': 0.87} {'loss': 0.8321, 'learning_rate': 1.2523822633290026e-05, 'epoch': 0.87} {'loss': 0.492, 'learning_rate': 1.2523497530610793e-05, 'epoch': 0.87} {'loss': 0.6166, 'learning_rate': 1.2523172425083013e-05, 'epoch': 0.87} {'loss': 0.4447, 'learning_rate': 1.252284731670705e-05, 'epoch': 0.87} {'loss': 0.6822, 'learning_rate': 1.2522522205483272e-05, 'epoch': 0.87} {'loss': 0.6954, 'learning_rate': 1.2522197091412047e-05, 'epoch': 0.87} {'loss': 0.6053, 'learning_rate': 1.2521871974493742e-05, 'epoch': 0.87} {'loss': 0.6329, 'learning_rate': 1.252154685472872e-05, 'epoch': 0.87} {'loss': 0.6312, 'learning_rate': 1.2521221732117355e-05, 'epoch': 0.87} {'loss': 0.4642, 'learning_rate': 1.252089660666001e-05, 'epoch': 0.87} {'loss': 0.4851, 'learning_rate': 1.2520571478357052e-05, 'epoch': 0.87} {'loss': 0.6463, 'learning_rate': 1.2520246347208844e-05, 'epoch': 0.87} {'loss': 0.4052, 'learning_rate': 1.251992121321576e-05, 'epoch': 0.87} {'loss': 0.6772, 'learning_rate': 1.2519596076378164e-05, 'epoch': 0.87} {'loss': 0.5664, 'learning_rate': 1.2519270936696421e-05, 'epoch': 0.87} {'loss': 0.5965, 'learning_rate': 1.2518945794170905e-05, 'epoch': 0.87} {'loss': 0.7078, 'learning_rate': 1.2518620648801973e-05, 'epoch': 0.87} {'loss': 0.5157, 'learning_rate': 1.251829550059e-05, 'epoch': 0.87} {'loss': 0.7104, 'learning_rate': 1.2517970349535351e-05, 'epoch': 0.87} {'loss': 0.517, 'learning_rate': 1.251764519563839e-05, 'epoch': 0.87} {'loss': 0.6166, 'learning_rate': 1.2517320038899488e-05, 'epoch': 0.87} {'loss': 0.7072, 'learning_rate': 1.2516994879319008e-05, 'epoch': 0.87} {'loss': 0.6264, 'learning_rate': 1.2516669716897323e-05, 'epoch': 0.87} {'loss': 0.5635, 'learning_rate': 1.2516344551634796e-05, 'epoch': 0.87} {'loss': 0.6106, 'learning_rate': 1.2516019383531792e-05, 'epoch': 0.87} {'loss': 0.622, 'learning_rate': 1.2515694212588683e-05, 'epoch': 0.87} {'loss': 0.5017, 'learning_rate': 1.251536903880583e-05, 'epoch': 0.87} {'loss': 0.3297, 'learning_rate': 1.2515043862183608e-05, 'epoch': 0.87} {'loss': 0.5431, 'learning_rate': 1.2514718682722376e-05, 'epoch': 0.87} {'loss': 0.4855, 'learning_rate': 1.2514393500422506e-05, 'epoch': 0.87} {'loss': 0.5068, 'learning_rate': 1.2514068315284364e-05, 'epoch': 0.87} {'loss': 0.6297, 'learning_rate': 1.2513743127308318e-05, 'epoch': 0.87} {'loss': 0.521, 'learning_rate': 1.2513417936494732e-05, 'epoch': 0.87} {'loss': 0.3554, 'learning_rate': 1.251309274284398e-05, 'epoch': 0.87} {'loss': 0.3909, 'learning_rate': 1.2512767546356418e-05, 'epoch': 0.87} {'loss': 0.3678, 'learning_rate': 1.2512442347032423e-05, 'epoch': 0.87} {'loss': 0.5509, 'learning_rate': 1.2512117144872358e-05, 'epoch': 0.87} {'loss': 0.5071, 'learning_rate': 1.251179193987659e-05, 'epoch': 0.87} {'loss': 0.4592, 'learning_rate': 1.2511466732045484e-05, 'epoch': 0.87} {'loss': 0.645, 'learning_rate': 1.2511141521379413e-05, 'epoch': 0.87} {'loss': 0.6497, 'learning_rate': 1.2510816307878739e-05, 'epoch': 0.87} {'loss': 0.7575, 'learning_rate': 1.251049109154383e-05, 'epoch': 0.87} {'loss': 0.4153, 'learning_rate': 1.2510165872375057e-05, 'epoch': 0.87} {'loss': 0.4219, 'learning_rate': 1.2509840650372783e-05, 'epoch': 0.87} {'loss': 0.4217, 'learning_rate': 1.2509515425537374e-05, 'epoch': 0.87} {'loss': 0.5788, 'learning_rate': 1.2509190197869204e-05, 'epoch': 0.87} {'loss': 0.5573, 'learning_rate': 1.2508864967368632e-05, 'epoch': 0.87} {'loss': 0.7125, 'learning_rate': 1.2508539734036029e-05, 'epoch': 0.87} {'loss': 0.6584, 'learning_rate': 1.2508214497871762e-05, 'epoch': 0.87} {'loss': 0.6266, 'learning_rate': 1.2507889258876195e-05, 'epoch': 0.87} {'loss': 0.459, 'learning_rate': 1.2507564017049703e-05, 'epoch': 0.87} {'loss': 0.4849, 'learning_rate': 1.2507238772392645e-05, 'epoch': 0.87} {'loss': 0.6319, 'learning_rate': 1.250691352490539e-05, 'epoch': 0.87} {'loss': 0.5685, 'learning_rate': 1.2506588274588309e-05, 'epoch': 0.87} {'loss': 0.461, 'learning_rate': 1.2506263021441765e-05, 'epoch': 0.87} {'loss': 0.6069, 'learning_rate': 1.2505937765466127e-05, 'epoch': 0.87} {'loss': 0.5636, 'learning_rate': 1.2505612506661762e-05, 'epoch': 0.87} {'loss': 0.4396, 'learning_rate': 1.2505287245029037e-05, 'epoch': 0.87} {'loss': 0.5991, 'learning_rate': 1.2504961980568318e-05, 'epoch': 0.87} {'loss': 0.6147, 'learning_rate': 1.2504636713279974e-05, 'epoch': 0.87} {'loss': 0.5151, 'learning_rate': 1.2504311443164373e-05, 'epoch': 0.87} {'loss': 0.6294, 'learning_rate': 1.2503986170221878e-05, 'epoch': 0.87} {'loss': 0.501, 'learning_rate': 1.2503660894452861e-05, 'epoch': 0.87} {'loss': 0.4826, 'learning_rate': 1.2503335615857686e-05, 'epoch': 0.88} {'loss': 0.5731, 'learning_rate': 1.250301033443672e-05, 'epoch': 0.88} {'loss': 0.5716, 'learning_rate': 1.2502685050190333e-05, 'epoch': 0.88} {'loss': 0.6472, 'learning_rate': 1.250235976311889e-05, 'epoch': 0.88} {'loss': 0.6737, 'learning_rate': 1.2502034473222757e-05, 'epoch': 0.88} {'loss': 0.7037, 'learning_rate': 1.2501709180502303e-05, 'epoch': 0.88} {'loss': 0.5105, 'learning_rate': 1.2501383884957898e-05, 'epoch': 0.88} {'loss': 0.6776, 'learning_rate': 1.2501058586589904e-05, 'epoch': 0.88} {'loss': 0.5026, 'learning_rate': 1.2500733285398692e-05, 'epoch': 0.88} {'loss': 0.6296, 'learning_rate': 1.2500407981384626e-05, 'epoch': 0.88} {'loss': 0.5757, 'learning_rate': 1.2500082674548077e-05, 'epoch': 0.88} {'loss': 0.7446, 'learning_rate': 1.249975736488941e-05, 'epoch': 0.88} {'loss': 0.486, 'learning_rate': 1.2499432052408988e-05, 'epoch': 0.88} {'loss': 0.6348, 'learning_rate': 1.2499106737107185e-05, 'epoch': 0.88} {'loss': 0.6046, 'learning_rate': 1.2498781418984366e-05, 'epoch': 0.88} {'loss': 0.5931, 'learning_rate': 1.24984560980409e-05, 'epoch': 0.88} {'loss': 0.4103, 'learning_rate': 1.2498130774277149e-05, 'epoch': 0.88} {'loss': 0.5376, 'learning_rate': 1.2497805447693484e-05, 'epoch': 0.88} {'loss': 0.5576, 'learning_rate': 1.2497480118290273e-05, 'epoch': 0.88} {'loss': 0.4889, 'learning_rate': 1.249715478606788e-05, 'epoch': 0.88} {'loss': 0.4033, 'learning_rate': 1.2496829451026677e-05, 'epoch': 0.88} {'loss': 0.5697, 'learning_rate': 1.2496504113167028e-05, 'epoch': 0.88} {'loss': 0.6503, 'learning_rate': 1.2496178772489298e-05, 'epoch': 0.88} {'loss': 0.663, 'learning_rate': 1.2495853428993858e-05, 'epoch': 0.88} {'loss': 0.3988, 'learning_rate': 1.2495528082681074e-05, 'epoch': 0.88} {'loss': 0.3769, 'learning_rate': 1.2495202733551312e-05, 'epoch': 0.88} {'loss': 0.6536, 'learning_rate': 1.2494877381604945e-05, 'epoch': 0.88} {'loss': 0.5892, 'learning_rate': 1.2494552026842331e-05, 'epoch': 0.88} {'loss': 0.6324, 'learning_rate': 1.2494226669263845e-05, 'epoch': 0.88} {'loss': 0.5492, 'learning_rate': 1.249390130886985e-05, 'epoch': 0.88} {'loss': 0.4517, 'learning_rate': 1.2493575945660715e-05, 'epoch': 0.88} {'loss': 0.4275, 'learning_rate': 1.2493250579636807e-05, 'epoch': 0.88} {'loss': 0.5701, 'learning_rate': 1.2492925210798493e-05, 'epoch': 0.88} {'loss': 0.5269, 'learning_rate': 1.2492599839146142e-05, 'epoch': 0.88} {'loss': 0.6954, 'learning_rate': 1.2492274464680118e-05, 'epoch': 0.88} {'loss': 0.6375, 'learning_rate': 1.249194908740079e-05, 'epoch': 0.88} {'loss': 0.4625, 'learning_rate': 1.2491623707308527e-05, 'epoch': 0.88} {'loss': 0.5343, 'learning_rate': 1.2491298324403693e-05, 'epoch': 0.88} {'loss': 0.7259, 'learning_rate': 1.2490972938686657e-05, 'epoch': 0.88} {'loss': 0.6444, 'learning_rate': 1.2490647550157786e-05, 'epoch': 0.88} {'loss': 0.423, 'learning_rate': 1.249032215881745e-05, 'epoch': 0.88} {'loss': 0.4709, 'learning_rate': 1.248999676466601e-05, 'epoch': 0.88} {'loss': 0.7195, 'learning_rate': 1.2489671367703839e-05, 'epoch': 0.88} {'loss': 0.5627, 'learning_rate': 1.2489345967931304e-05, 'epoch': 0.88} {'loss': 0.6918, 'learning_rate': 1.2489020565348768e-05, 'epoch': 0.88} {'loss': 0.5812, 'learning_rate': 1.2488695159956603e-05, 'epoch': 0.88} {'loss': 0.432, 'learning_rate': 1.2488369751755175e-05, 'epoch': 0.88} {'loss': 0.4417, 'learning_rate': 1.2488044340744851e-05, 'epoch': 0.88} {'loss': 0.6616, 'learning_rate': 1.2487718926925996e-05, 'epoch': 0.88} {'loss': 0.6335, 'learning_rate': 1.248739351029898e-05, 'epoch': 0.88} {'loss': 0.7361, 'learning_rate': 1.2487068090864169e-05, 'epoch': 0.88} {'loss': 0.4915, 'learning_rate': 1.2486742668621932e-05, 'epoch': 0.88} {'loss': 0.537, 'learning_rate': 1.2486417243572634e-05, 'epoch': 0.88} {'loss': 0.5564, 'learning_rate': 1.2486091815716648e-05, 'epoch': 0.88} {'loss': 0.4649, 'learning_rate': 1.2485766385054332e-05, 'epoch': 0.88} {'loss': 0.5426, 'learning_rate': 1.2485440951586061e-05, 'epoch': 0.88} {'loss': 0.6334, 'learning_rate': 1.24851155153122e-05, 'epoch': 0.88} {'loss': 0.5163, 'learning_rate': 1.2484790076233115e-05, 'epoch': 0.88} {'loss': 0.566, 'learning_rate': 1.2484464634349177e-05, 'epoch': 0.88} {'loss': 0.6556, 'learning_rate': 1.248413918966075e-05, 'epoch': 0.88} {'loss': 0.6243, 'learning_rate': 1.2483813742168201e-05, 'epoch': 0.88} {'loss': 0.4907, 'learning_rate': 1.2483488291871898e-05, 'epoch': 0.88} {'loss': 0.6041, 'learning_rate': 1.2483162838772206e-05, 'epoch': 0.88} {'loss': 0.4721, 'learning_rate': 1.24828373828695e-05, 'epoch': 0.88} {'loss': 0.5444, 'learning_rate': 1.2482511924164143e-05, 'epoch': 0.88} {'loss': 0.5826, 'learning_rate': 1.24821864626565e-05, 'epoch': 0.88} {'loss': 0.6253, 'learning_rate': 1.2481860998346942e-05, 'epoch': 0.88} {'loss': 0.7134, 'learning_rate': 1.2481535531235834e-05, 'epoch': 0.88} {'loss': 0.5206, 'learning_rate': 1.2481210061323543e-05, 'epoch': 0.88} {'loss': 0.5773, 'learning_rate': 1.248088458861044e-05, 'epoch': 0.88} {'loss': 0.5243, 'learning_rate': 1.2480559113096891e-05, 'epoch': 0.88} {'loss': 0.5701, 'learning_rate': 1.248023363478326e-05, 'epoch': 0.88} {'loss': 0.552, 'learning_rate': 1.2479908153669917e-05, 'epoch': 0.88} {'loss': 0.6145, 'learning_rate': 1.2479582669757231e-05, 'epoch': 0.88} {'loss': 0.5021, 'learning_rate': 1.2479257183045565e-05, 'epoch': 0.88} {'loss': 0.6205, 'learning_rate': 1.2478931693535292e-05, 'epoch': 0.88} {'loss': 0.5123, 'learning_rate': 1.2478606201226775e-05, 'epoch': 0.88} {'loss': 0.6659, 'learning_rate': 1.2478280706120383e-05, 'epoch': 0.88} {'loss': 0.4807, 'learning_rate': 1.2477955208216484e-05, 'epoch': 0.88} {'loss': 0.6506, 'learning_rate': 1.2477629707515443e-05, 'epoch': 0.88} {'loss': 0.5835, 'learning_rate': 1.247730420401763e-05, 'epoch': 0.88} {'loss': 0.6611, 'learning_rate': 1.2476978697723411e-05, 'epoch': 0.88} {'loss': 0.5208, 'learning_rate': 1.2476653188633157e-05, 'epoch': 0.88} {'loss': 0.4241, 'learning_rate': 1.2476327676747232e-05, 'epoch': 0.88} {'loss': 0.5018, 'learning_rate': 1.2476002162066003e-05, 'epoch': 0.88} {'loss': 0.4458, 'learning_rate': 1.2475676644589838e-05, 'epoch': 0.88} {'loss': 0.5751, 'learning_rate': 1.2475351124319104e-05, 'epoch': 0.88} {'loss': 0.621, 'learning_rate': 1.2475025601254171e-05, 'epoch': 0.88} {'loss': 0.6884, 'learning_rate': 1.2474700075395403e-05, 'epoch': 0.88} {'loss': 0.5259, 'learning_rate': 1.2474374546743172e-05, 'epoch': 0.88} {'loss': 0.5116, 'learning_rate': 1.2474049015297837e-05, 'epoch': 0.88} {'loss': 0.4897, 'learning_rate': 1.2473723481059776e-05, 'epoch': 0.88} {'loss': 0.457, 'learning_rate': 1.2473397944029351e-05, 'epoch': 0.88} {'loss': 0.6891, 'learning_rate': 1.2473072404206929e-05, 'epoch': 0.88} {'loss': 0.54, 'learning_rate': 1.2472746861592879e-05, 'epoch': 0.88} {'loss': 0.5385, 'learning_rate': 1.2472421316187569e-05, 'epoch': 0.88} {'loss': 0.719, 'learning_rate': 1.2472095767991366e-05, 'epoch': 0.88} {'loss': 0.5397, 'learning_rate': 1.2471770217004635e-05, 'epoch': 0.88} {'loss': 0.3687, 'learning_rate': 1.2471444663227746e-05, 'epoch': 0.88} {'loss': 0.6135, 'learning_rate': 1.2471119106661066e-05, 'epoch': 0.88} {'loss': 0.4135, 'learning_rate': 1.2470793547304962e-05, 'epoch': 0.88} {'loss': 0.5987, 'learning_rate': 1.2470467985159803e-05, 'epoch': 0.88} {'loss': 0.4468, 'learning_rate': 1.2470142420225955e-05, 'epoch': 0.88} {'loss': 0.6135, 'learning_rate': 1.2469816852503785e-05, 'epoch': 0.88} {'loss': 0.6046, 'learning_rate': 1.2469491281993662e-05, 'epoch': 0.88} {'loss': 0.5184, 'learning_rate': 1.2469165708695952e-05, 'epoch': 0.88} {'loss': 0.4045, 'learning_rate': 1.2468840132611024e-05, 'epoch': 0.88} {'loss': 0.7418, 'learning_rate': 1.2468514553739245e-05, 'epoch': 0.88} {'loss': 0.5974, 'learning_rate': 1.2468188972080983e-05, 'epoch': 0.88} {'loss': 0.5934, 'learning_rate': 1.2467863387636607e-05, 'epoch': 0.88} {'loss': 0.633, 'learning_rate': 1.2467537800406479e-05, 'epoch': 0.88} {'loss': 0.5591, 'learning_rate': 1.2467212210390972e-05, 'epoch': 0.88} {'loss': 0.5148, 'learning_rate': 1.246688661759045e-05, 'epoch': 0.88} {'loss': 0.5231, 'learning_rate': 1.2466561022005281e-05, 'epoch': 0.88} {'loss': 0.7214, 'learning_rate': 1.2466235423635838e-05, 'epoch': 0.88} {'loss': 0.5583, 'learning_rate': 1.246590982248248e-05, 'epoch': 0.88} {'loss': 0.5953, 'learning_rate': 1.246558421854558e-05, 'epoch': 0.88} {'loss': 0.4986, 'learning_rate': 1.2465258611825505e-05, 'epoch': 0.88} {'loss': 0.5814, 'learning_rate': 1.2464933002322624e-05, 'epoch': 0.88} {'loss': 0.5417, 'learning_rate': 1.24646073900373e-05, 'epoch': 0.88} {'loss': 0.6207, 'learning_rate': 1.2464281774969905e-05, 'epoch': 0.88} {'loss': 0.6065, 'learning_rate': 1.2463956157120803e-05, 'epoch': 0.88} {'loss': 0.705, 'learning_rate': 1.2463630536490361e-05, 'epoch': 0.88} {'loss': 0.5608, 'learning_rate': 1.2463304913078948e-05, 'epoch': 0.88} {'loss': 0.5022, 'learning_rate': 1.2462979286886935e-05, 'epoch': 0.88} {'loss': 0.5356, 'learning_rate': 1.2462653657914688e-05, 'epoch': 0.88} {'loss': 0.4571, 'learning_rate': 1.2462328026162572e-05, 'epoch': 0.88} {'loss': 0.4851, 'learning_rate': 1.2462002391630954e-05, 'epoch': 0.88} {'loss': 0.7017, 'learning_rate': 1.2461676754320205e-05, 'epoch': 0.88} {'loss': 0.6756, 'learning_rate': 1.2461351114230689e-05, 'epoch': 0.88} {'loss': 0.4254, 'learning_rate': 1.2461025471362778e-05, 'epoch': 0.88} {'loss': 0.5325, 'learning_rate': 1.2460699825716836e-05, 'epoch': 0.88} {'loss': 0.7259, 'learning_rate': 1.2460374177293233e-05, 'epoch': 0.88} {'loss': 0.6379, 'learning_rate': 1.2460048526092337e-05, 'epoch': 0.88} {'loss': 0.5626, 'learning_rate': 1.2459722872114513e-05, 'epoch': 0.88} {'loss': 0.5245, 'learning_rate': 1.2459397215360127e-05, 'epoch': 0.88} {'loss': 0.4728, 'learning_rate': 1.2459071555829552e-05, 'epoch': 0.88} {'loss': 0.7359, 'learning_rate': 1.245874589352315e-05, 'epoch': 0.88} {'loss': 0.4937, 'learning_rate': 1.2458420228441293e-05, 'epoch': 0.88} {'loss': 0.5584, 'learning_rate': 1.2458094560584347e-05, 'epoch': 0.88} {'loss': 0.6334, 'learning_rate': 1.245776888995268e-05, 'epoch': 0.88} {'loss': 0.6326, 'learning_rate': 1.245744321654666e-05, 'epoch': 0.88} {'loss': 0.4043, 'learning_rate': 1.2457117540366652e-05, 'epoch': 0.88} {'loss': 0.3947, 'learning_rate': 1.2456791861413027e-05, 'epoch': 0.88} {'loss': 0.6347, 'learning_rate': 1.2456466179686148e-05, 'epoch': 0.88} {'loss': 0.6936, 'learning_rate': 1.2456140495186391e-05, 'epoch': 0.88} {'loss': 0.5284, 'learning_rate': 1.2455814807914117e-05, 'epoch': 0.88} {'loss': 0.4768, 'learning_rate': 1.2455489117869694e-05, 'epoch': 0.88} {'loss': 0.5473, 'learning_rate': 1.2455163425053489e-05, 'epoch': 0.88} {'loss': 0.4878, 'learning_rate': 1.2454837729465875e-05, 'epoch': 0.88} {'loss': 0.3659, 'learning_rate': 1.2454512031107212e-05, 'epoch': 0.88} {'loss': 0.5061, 'learning_rate': 1.2454186329977875e-05, 'epoch': 0.88} {'loss': 0.7095, 'learning_rate': 1.2453860626078226e-05, 'epoch': 0.88} {'loss': 0.6062, 'learning_rate': 1.2453534919408636e-05, 'epoch': 0.88} {'loss': 0.6258, 'learning_rate': 1.2453209209969472e-05, 'epoch': 0.88} {'loss': 0.4171, 'learning_rate': 1.2452883497761101e-05, 'epoch': 0.88} {'loss': 0.577, 'learning_rate': 1.2452557782783891e-05, 'epoch': 0.88} {'loss': 0.5829, 'learning_rate': 1.245223206503821e-05, 'epoch': 0.88} {'loss': 0.5654, 'learning_rate': 1.2451906344524426e-05, 'epoch': 0.88} {'loss': 0.5624, 'learning_rate': 1.2451580621242905e-05, 'epoch': 0.88} {'loss': 0.5886, 'learning_rate': 1.2451254895194016e-05, 'epoch': 0.88} {'loss': 0.5533, 'learning_rate': 1.2450929166378122e-05, 'epoch': 0.88} {'loss': 0.502, 'learning_rate': 1.24506034347956e-05, 'epoch': 0.88} {'loss': 0.5996, 'learning_rate': 1.2450277700446812e-05, 'epoch': 0.88} {'loss': 0.3933, 'learning_rate': 1.2449951963332125e-05, 'epoch': 0.88} {'loss': 0.475, 'learning_rate': 1.244962622345191e-05, 'epoch': 0.88} {'loss': 0.6061, 'learning_rate': 1.2449300480806533e-05, 'epoch': 0.88} {'loss': 0.4886, 'learning_rate': 1.2448974735396359e-05, 'epoch': 0.88} {'loss': 0.427, 'learning_rate': 1.2448648987221758e-05, 'epoch': 0.88} {'loss': 0.3486, 'learning_rate': 1.2448323236283102e-05, 'epoch': 0.88} {'loss': 0.4383, 'learning_rate': 1.2447997482580754e-05, 'epoch': 0.88} {'loss': 0.5947, 'learning_rate': 1.244767172611508e-05, 'epoch': 0.88} {'loss': 0.623, 'learning_rate': 1.244734596688645e-05, 'epoch': 0.88} {'loss': 0.3842, 'learning_rate': 1.2447020204895233e-05, 'epoch': 0.88} {'loss': 0.409, 'learning_rate': 1.2446694440141793e-05, 'epoch': 0.88} {'loss': 0.5529, 'learning_rate': 1.2446368672626503e-05, 'epoch': 0.88} {'loss': 0.7308, 'learning_rate': 1.2446042902349729e-05, 'epoch': 0.88} {'loss': 0.5676, 'learning_rate': 1.2445717129311834e-05, 'epoch': 0.88} {'loss': 0.5829, 'learning_rate': 1.2445391353513192e-05, 'epoch': 0.88} {'loss': 0.7315, 'learning_rate': 1.2445065574954167e-05, 'epoch': 0.88} {'loss': 0.5647, 'learning_rate': 1.2444739793635128e-05, 'epoch': 0.88} {'loss': 0.3801, 'learning_rate': 1.2444414009556443e-05, 'epoch': 0.88} {'loss': 0.5519, 'learning_rate': 1.2444088222718483e-05, 'epoch': 0.88} {'loss': 0.5868, 'learning_rate': 1.2443762433121607e-05, 'epoch': 0.88} {'loss': 0.5059, 'learning_rate': 1.244343664076619e-05, 'epoch': 0.88} {'loss': 0.4083, 'learning_rate': 1.2443110845652597e-05, 'epoch': 0.88} {'loss': 0.6272, 'learning_rate': 1.2442785047781196e-05, 'epoch': 0.88} {'loss': 0.7919, 'learning_rate': 1.2442459247152357e-05, 'epoch': 0.88} {'loss': 0.6247, 'learning_rate': 1.2442133443766444e-05, 'epoch': 0.88} {'loss': 0.6209, 'learning_rate': 1.2441807637623828e-05, 'epoch': 0.88} {'loss': 0.6609, 'learning_rate': 1.2441481828724875e-05, 'epoch': 0.88} {'loss': 0.441, 'learning_rate': 1.2441156017069953e-05, 'epoch': 0.88} {'loss': 0.4517, 'learning_rate': 1.2440830202659431e-05, 'epoch': 0.88} {'loss': 0.5468, 'learning_rate': 1.2440504385493674e-05, 'epoch': 0.88} {'loss': 0.5469, 'learning_rate': 1.2440178565573053e-05, 'epoch': 0.88} {'loss': 0.6159, 'learning_rate': 1.2439852742897935e-05, 'epoch': 0.88} {'loss': 0.4734, 'learning_rate': 1.2439526917468686e-05, 'epoch': 0.88} {'loss': 0.5659, 'learning_rate': 1.2439201089285677e-05, 'epoch': 0.88} {'loss': 0.517, 'learning_rate': 1.2438875258349273e-05, 'epoch': 0.88} {'loss': 0.4564, 'learning_rate': 1.2438549424659843e-05, 'epoch': 0.88} {'loss': 0.5663, 'learning_rate': 1.2438223588217753e-05, 'epoch': 0.88} {'loss': 0.4759, 'learning_rate': 1.2437897749023371e-05, 'epoch': 0.88} {'loss': 0.4966, 'learning_rate': 1.2437571907077068e-05, 'epoch': 0.88} {'loss': 0.6196, 'learning_rate': 1.2437246062379209e-05, 'epoch': 0.88} {'loss': 0.6597, 'learning_rate': 1.2436920214930164e-05, 'epoch': 0.88} {'loss': 0.4472, 'learning_rate': 1.2436594364730299e-05, 'epoch': 0.88} {'loss': 0.6485, 'learning_rate': 1.243626851177998e-05, 'epoch': 0.88} {'loss': 0.6344, 'learning_rate': 1.243594265607958e-05, 'epoch': 0.88} {'loss': 0.3858, 'learning_rate': 1.2435616797629461e-05, 'epoch': 0.88} {'loss': 0.4897, 'learning_rate': 1.2435290936430001e-05, 'epoch': 0.88} {'loss': 0.602, 'learning_rate': 1.2434965072481553e-05, 'epoch': 0.88} {'loss': 0.509, 'learning_rate': 1.2434639205784494e-05, 'epoch': 0.88} {'loss': 0.6801, 'learning_rate': 1.243431333633919e-05, 'epoch': 0.88} {'loss': 0.4884, 'learning_rate': 1.243398746414601e-05, 'epoch': 0.88} {'loss': 0.4697, 'learning_rate': 1.2433661589205321e-05, 'epoch': 0.88} {'loss': 0.6346, 'learning_rate': 1.2433335711517492e-05, 'epoch': 0.88} {'loss': 0.5301, 'learning_rate': 1.2433009831082887e-05, 'epoch': 0.88} {'loss': 0.5417, 'learning_rate': 1.243268394790188e-05, 'epoch': 0.88} {'loss': 0.4659, 'learning_rate': 1.2432358061974834e-05, 'epoch': 0.88} {'loss': 0.5914, 'learning_rate': 1.2432032173302119e-05, 'epoch': 0.88} {'loss': 0.4129, 'learning_rate': 1.2431706281884101e-05, 'epoch': 0.88} {'loss': 0.4788, 'learning_rate': 1.243138038772115e-05, 'epoch': 0.88} {'loss': 0.7237, 'learning_rate': 1.2431054490813632e-05, 'epoch': 0.88} {'loss': 0.5097, 'learning_rate': 1.2430728591161917e-05, 'epoch': 0.88} {'loss': 0.5613, 'learning_rate': 1.243040268876637e-05, 'epoch': 0.88} {'loss': 0.4709, 'learning_rate': 1.243007678362736e-05, 'epoch': 0.88} {'loss': 0.3436, 'learning_rate': 1.2429750875745257e-05, 'epoch': 0.88} {'loss': 0.4301, 'learning_rate': 1.2429424965120427e-05, 'epoch': 0.88} {'loss': 0.5174, 'learning_rate': 1.2429099051753237e-05, 'epoch': 0.88} {'loss': 0.5097, 'learning_rate': 1.2428773135644056e-05, 'epoch': 0.88} {'loss': 0.5903, 'learning_rate': 1.2428447216793256e-05, 'epoch': 0.88} {'loss': 0.4884, 'learning_rate': 1.2428121295201197e-05, 'epoch': 0.88} {'loss': 0.6146, 'learning_rate': 1.2427795370868254e-05, 'epoch': 0.88} {'loss': 0.5639, 'learning_rate': 1.2427469443794789e-05, 'epoch': 0.88} {'loss': 0.6754, 'learning_rate': 1.2427143513981172e-05, 'epoch': 0.88} {'loss': 0.4958, 'learning_rate': 1.2426817581427773e-05, 'epoch': 0.88} {'loss': 0.3972, 'learning_rate': 1.2426491646134958e-05, 'epoch': 0.88} {'loss': 0.5455, 'learning_rate': 1.2426165708103095e-05, 'epoch': 0.88} {'loss': 0.5909, 'learning_rate': 1.2425839767332553e-05, 'epoch': 0.88} {'loss': 0.631, 'learning_rate': 1.2425513823823698e-05, 'epoch': 0.88} {'loss': 0.5978, 'learning_rate': 1.2425187877576901e-05, 'epoch': 0.88} {'loss': 0.4944, 'learning_rate': 1.2424861928592527e-05, 'epoch': 0.88} {'loss': 0.5114, 'learning_rate': 1.2424535976870943e-05, 'epoch': 0.88} {'loss': 0.4542, 'learning_rate': 1.2424210022412522e-05, 'epoch': 0.88} {'loss': 0.5153, 'learning_rate': 1.2423884065217628e-05, 'epoch': 0.88} {'loss': 0.4865, 'learning_rate': 1.242355810528663e-05, 'epoch': 0.88} {'loss': 0.5928, 'learning_rate': 1.2423232142619897e-05, 'epoch': 0.88} {'loss': 0.485, 'learning_rate': 1.2422906177217792e-05, 'epoch': 0.88} {'loss': 0.4814, 'learning_rate': 1.242258020908069e-05, 'epoch': 0.88} {'loss': 0.5261, 'learning_rate': 1.2422254238208955e-05, 'epoch': 0.88} {'loss': 0.5224, 'learning_rate': 1.2421928264602954e-05, 'epoch': 0.88} {'loss': 0.5928, 'learning_rate': 1.2421602288263058e-05, 'epoch': 0.88} {'loss': 0.4863, 'learning_rate': 1.2421276309189632e-05, 'epoch': 0.88} {'loss': 0.5218, 'learning_rate': 1.2420950327383045e-05, 'epoch': 0.88} {'loss': 0.7423, 'learning_rate': 1.2420624342843668e-05, 'epoch': 0.88} {'loss': 0.6948, 'learning_rate': 1.2420298355571866e-05, 'epoch': 0.88} {'loss': 0.5097, 'learning_rate': 1.2419972365568007e-05, 'epoch': 0.88} {'loss': 0.6414, 'learning_rate': 1.241964637283246e-05, 'epoch': 0.88} {'loss': 0.57, 'learning_rate': 1.2419320377365592e-05, 'epoch': 0.88} {'loss': 0.4556, 'learning_rate': 1.2418994379167771e-05, 'epoch': 0.88} {'loss': 0.4864, 'learning_rate': 1.2418668378239362e-05, 'epoch': 0.88} {'loss': 0.6019, 'learning_rate': 1.241834237458074e-05, 'epoch': 0.88} {'loss': 0.5798, 'learning_rate': 1.241801636819227e-05, 'epoch': 0.88} {'loss': 0.5773, 'learning_rate': 1.2417690359074316e-05, 'epoch': 0.88} {'loss': 0.6501, 'learning_rate': 1.2417364347227252e-05, 'epoch': 0.88} {'loss': 0.3838, 'learning_rate': 1.2417038332651443e-05, 'epoch': 0.88} {'loss': 0.5551, 'learning_rate': 1.2416712315347256e-05, 'epoch': 0.88} {'loss': 0.5368, 'learning_rate': 1.2416386295315061e-05, 'epoch': 0.88} {'loss': 0.385, 'learning_rate': 1.2416060272555226e-05, 'epoch': 0.88} {'loss': 0.5534, 'learning_rate': 1.2415734247068122e-05, 'epoch': 0.88} {'loss': 0.5058, 'learning_rate': 1.2415408218854108e-05, 'epoch': 0.88} {'loss': 0.6754, 'learning_rate': 1.2415082187913558e-05, 'epoch': 0.88} {'loss': 0.6301, 'learning_rate': 1.2414756154246842e-05, 'epoch': 0.88} {'loss': 0.635, 'learning_rate': 1.2414430117854324e-05, 'epoch': 0.88} {'loss': 0.5455, 'learning_rate': 1.2414104078736372e-05, 'epoch': 0.88} {'loss': 0.5358, 'learning_rate': 1.2413778036893358e-05, 'epoch': 0.88} {'loss': 0.6366, 'learning_rate': 1.2413451992325647e-05, 'epoch': 0.88} {'loss': 0.4171, 'learning_rate': 1.2413125945033609e-05, 'epoch': 0.88} {'loss': 0.5209, 'learning_rate': 1.2412799895017606e-05, 'epoch': 0.88} {'loss': 0.4671, 'learning_rate': 1.2412473842278014e-05, 'epoch': 0.88} {'loss': 0.5268, 'learning_rate': 1.2412147786815198e-05, 'epoch': 0.88} {'loss': 0.5175, 'learning_rate': 1.2411821728629525e-05, 'epoch': 0.88} {'loss': 0.5402, 'learning_rate': 1.2411495667721367e-05, 'epoch': 0.88} {'loss': 0.5745, 'learning_rate': 1.2411169604091087e-05, 'epoch': 0.88} {'loss': 0.5636, 'learning_rate': 1.2410843537739052e-05, 'epoch': 0.88} {'loss': 0.5181, 'learning_rate': 1.2410517468665638e-05, 'epoch': 0.88} {'loss': 0.7769, 'learning_rate': 1.2410191396871203e-05, 'epoch': 0.88} {'loss': 0.5033, 'learning_rate': 1.2409865322356125e-05, 'epoch': 0.88} {'loss': 0.5566, 'learning_rate': 1.2409539245120763e-05, 'epoch': 0.88} {'loss': 0.5311, 'learning_rate': 1.2409213165165492e-05, 'epoch': 0.88} {'loss': 0.595, 'learning_rate': 1.2408887082490677e-05, 'epoch': 0.88} {'loss': 0.7098, 'learning_rate': 1.2408560997096686e-05, 'epoch': 0.88} {'loss': 0.5637, 'learning_rate': 1.2408234908983889e-05, 'epoch': 0.88} {'loss': 0.6486, 'learning_rate': 1.2407908818152651e-05, 'epoch': 0.88} {'loss': 0.6107, 'learning_rate': 1.2407582724603342e-05, 'epoch': 0.88} {'loss': 0.5189, 'learning_rate': 1.2407256628336333e-05, 'epoch': 0.88} {'loss': 0.5292, 'learning_rate': 1.2406930529351985e-05, 'epoch': 0.88} {'loss': 0.4895, 'learning_rate': 1.2406604427650672e-05, 'epoch': 0.88} {'loss': 0.6953, 'learning_rate': 1.2406278323232762e-05, 'epoch': 0.88} {'loss': 0.5862, 'learning_rate': 1.2405952216098618e-05, 'epoch': 0.88} {'loss': 0.5673, 'learning_rate': 1.2405626106248614e-05, 'epoch': 0.88} {'loss': 0.5944, 'learning_rate': 1.2405299993683113e-05, 'epoch': 0.88} {'loss': 0.501, 'learning_rate': 1.2404973878402489e-05, 'epoch': 0.88} {'loss': 0.5699, 'learning_rate': 1.2404647760407103e-05, 'epoch': 0.88} {'loss': 0.5721, 'learning_rate': 1.240432163969733e-05, 'epoch': 0.88} {'loss': 0.6736, 'learning_rate': 1.2403995516273532e-05, 'epoch': 0.88} {'loss': 0.5283, 'learning_rate': 1.2403669390136084e-05, 'epoch': 0.88} {'loss': 0.5906, 'learning_rate': 1.2403343261285347e-05, 'epoch': 0.88} {'loss': 0.7347, 'learning_rate': 1.2403017129721698e-05, 'epoch': 0.88} {'loss': 0.6383, 'learning_rate': 1.2402690995445495e-05, 'epoch': 0.88} {'loss': 0.5355, 'learning_rate': 1.2402364858457108e-05, 'epoch': 0.88} {'loss': 0.6627, 'learning_rate': 1.240203871875691e-05, 'epoch': 0.88} {'loss': 0.511, 'learning_rate': 1.2401712576345268e-05, 'epoch': 0.88} {'loss': 0.4906, 'learning_rate': 1.240138643122255e-05, 'epoch': 0.88} {'loss': 0.4831, 'learning_rate': 1.2401060283389124e-05, 'epoch': 0.88} {'loss': 0.5172, 'learning_rate': 1.2400734132845355e-05, 'epoch': 0.88} {'loss': 0.3975, 'learning_rate': 1.2400407979591616e-05, 'epoch': 0.88} {'loss': 0.5422, 'learning_rate': 1.2400081823628271e-05, 'epoch': 0.88} {'loss': 0.4888, 'learning_rate': 1.2399755664955693e-05, 'epoch': 0.88} {'loss': 0.6166, 'learning_rate': 1.2399429503574245e-05, 'epoch': 0.88} {'loss': 0.6201, 'learning_rate': 1.2399103339484298e-05, 'epoch': 0.88} {'loss': 0.4962, 'learning_rate': 1.2398777172686219e-05, 'epoch': 0.88} {'loss': 0.6597, 'learning_rate': 1.2398451003180376e-05, 'epoch': 0.88} {'loss': 0.526, 'learning_rate': 1.239812483096714e-05, 'epoch': 0.88} {'loss': 0.5366, 'learning_rate': 1.2397798656046873e-05, 'epoch': 0.88} {'loss': 0.6324, 'learning_rate': 1.2397472478419951e-05, 'epoch': 0.88} {'loss': 0.6156, 'learning_rate': 1.2397146298086738e-05, 'epoch': 0.88} {'loss': 0.4561, 'learning_rate': 1.23968201150476e-05, 'epoch': 0.88} {'loss': 0.535, 'learning_rate': 1.2396493929302911e-05, 'epoch': 0.88} {'loss': 0.6909, 'learning_rate': 1.2396167740853035e-05, 'epoch': 0.88} {'loss': 0.437, 'learning_rate': 1.2395841549698341e-05, 'epoch': 0.88} {'loss': 0.5915, 'learning_rate': 1.2395515355839201e-05, 'epoch': 0.88} {'loss': 0.5752, 'learning_rate': 1.2395189159275975e-05, 'epoch': 0.88} {'loss': 0.4805, 'learning_rate': 1.2394862960009038e-05, 'epoch': 0.88} {'loss': 0.6276, 'learning_rate': 1.2394536758038756e-05, 'epoch': 0.88} {'loss': 0.385, 'learning_rate': 1.2394210553365498e-05, 'epoch': 0.88} {'loss': 0.5597, 'learning_rate': 1.2393884345989628e-05, 'epoch': 0.88} {'loss': 0.5002, 'learning_rate': 1.2393558135911521e-05, 'epoch': 0.88} {'loss': 0.4326, 'learning_rate': 1.2393231923131541e-05, 'epoch': 0.88} {'loss': 0.5784, 'learning_rate': 1.2392905707650059e-05, 'epoch': 0.88} {'loss': 0.6384, 'learning_rate': 1.2392579489467438e-05, 'epoch': 0.88} {'loss': 0.5997, 'learning_rate': 1.239225326858405e-05, 'epoch': 0.88} {'loss': 0.5689, 'learning_rate': 1.2391927045000266e-05, 'epoch': 0.88} {'loss': 0.4244, 'learning_rate': 1.2391600818716451e-05, 'epoch': 0.88} {'loss': 0.5234, 'learning_rate': 1.2391274589732971e-05, 'epoch': 0.88} {'loss': 0.5437, 'learning_rate': 1.2390948358050202e-05, 'epoch': 0.88} {'loss': 0.5433, 'learning_rate': 1.23906221236685e-05, 'epoch': 0.88} {'loss': 0.5991, 'learning_rate': 1.2390295886588244e-05, 'epoch': 0.88} {'loss': 0.6449, 'learning_rate': 1.2389969646809798e-05, 'epoch': 0.88} {'loss': 0.4997, 'learning_rate': 1.238964340433353e-05, 'epoch': 0.88} {'loss': 0.6281, 'learning_rate': 1.238931715915981e-05, 'epoch': 0.88} {'loss': 0.5258, 'learning_rate': 1.2388990911289004e-05, 'epoch': 0.88} {'loss': 0.7539, 'learning_rate': 1.2388664660721483e-05, 'epoch': 0.88} {'loss': 0.4272, 'learning_rate': 1.2388338407457613e-05, 'epoch': 0.88} {'loss': 0.4087, 'learning_rate': 1.2388012151497764e-05, 'epoch': 0.88} {'loss': 0.4115, 'learning_rate': 1.2387685892842302e-05, 'epoch': 0.88} {'loss': 0.4676, 'learning_rate': 1.2387359631491598e-05, 'epoch': 0.88} {'loss': 0.5994, 'learning_rate': 1.2387033367446017e-05, 'epoch': 0.88} {'loss': 0.5573, 'learning_rate': 1.2386707100705933e-05, 'epoch': 0.88} {'loss': 0.6363, 'learning_rate': 1.2386380831271706e-05, 'epoch': 0.88} {'loss': 0.5406, 'learning_rate': 1.238605455914371e-05, 'epoch': 0.88} {'loss': 0.6593, 'learning_rate': 1.2385728284322313e-05, 'epoch': 0.88} {'loss': 0.6927, 'learning_rate': 1.2385402006807882e-05, 'epoch': 0.88} {'loss': 0.3897, 'learning_rate': 1.2385075726600786e-05, 'epoch': 0.88} {'loss': 0.7088, 'learning_rate': 1.2384749443701393e-05, 'epoch': 0.88} {'loss': 0.4921, 'learning_rate': 1.2384423158110073e-05, 'epoch': 0.88} {'loss': 0.4724, 'learning_rate': 1.2384096869827191e-05, 'epoch': 0.88} {'loss': 0.6582, 'learning_rate': 1.2383770578853115e-05, 'epoch': 0.88} {'loss': 0.5056, 'learning_rate': 1.2383444285188222e-05, 'epoch': 0.88} {'loss': 0.4072, 'learning_rate': 1.238311798883287e-05, 'epoch': 0.88} {'loss': 0.4774, 'learning_rate': 1.2382791689787428e-05, 'epoch': 0.88} {'loss': 0.5094, 'learning_rate': 1.238246538805227e-05, 'epoch': 0.88} {'loss': 0.5086, 'learning_rate': 1.238213908362776e-05, 'epoch': 0.88} {'loss': 0.5061, 'learning_rate': 1.238181277651427e-05, 'epoch': 0.88} {'loss': 0.5017, 'learning_rate': 1.2381486466712166e-05, 'epoch': 0.88} {'loss': 0.552, 'learning_rate': 1.2381160154221814e-05, 'epoch': 0.88} {'loss': 0.5299, 'learning_rate': 1.2380833839043587e-05, 'epoch': 0.88} {'loss': 0.5208, 'learning_rate': 1.2380507521177851e-05, 'epoch': 0.88} {'loss': 0.7206, 'learning_rate': 1.2380181200624977e-05, 'epoch': 0.88} {'loss': 0.5549, 'learning_rate': 1.2379854877385327e-05, 'epoch': 0.88} {'loss': 0.6496, 'learning_rate': 1.2379528551459275e-05, 'epoch': 0.88} {'loss': 0.4744, 'learning_rate': 1.2379202222847191e-05, 'epoch': 0.88} {'loss': 0.5519, 'learning_rate': 1.2378875891549437e-05, 'epoch': 0.88} {'loss': 0.5507, 'learning_rate': 1.2378549557566384e-05, 'epoch': 0.88} {'loss': 0.5563, 'learning_rate': 1.2378223220898402e-05, 'epoch': 0.88} {'loss': 0.4946, 'learning_rate': 1.2377896881545857e-05, 'epoch': 0.88} {'loss': 0.6097, 'learning_rate': 1.2377570539509121e-05, 'epoch': 0.88} {'loss': 0.4917, 'learning_rate': 1.2377244194788558e-05, 'epoch': 0.88} {'loss': 0.6777, 'learning_rate': 1.2376917847384537e-05, 'epoch': 0.88} {'loss': 0.6168, 'learning_rate': 1.237659149729743e-05, 'epoch': 0.88} {'loss': 0.7016, 'learning_rate': 1.2376265144527602e-05, 'epoch': 0.88} {'loss': 0.5607, 'learning_rate': 1.2375938789075423e-05, 'epoch': 0.88} {'loss': 0.5926, 'learning_rate': 1.2375612430941261e-05, 'epoch': 0.88} {'loss': 0.6108, 'learning_rate': 1.2375286070125485e-05, 'epoch': 0.88} {'loss': 0.6408, 'learning_rate': 1.2374959706628465e-05, 'epoch': 0.88} {'loss': 0.5456, 'learning_rate': 1.2374633340450563e-05, 'epoch': 0.88} {'loss': 0.5742, 'learning_rate': 1.2374306971592153e-05, 'epoch': 0.88} {'loss': 0.3599, 'learning_rate': 1.23739806000536e-05, 'epoch': 0.88} {'loss': 0.5786, 'learning_rate': 1.2373654225835276e-05, 'epoch': 0.88} {'loss': 0.5345, 'learning_rate': 1.237332784893755e-05, 'epoch': 0.88} {'loss': 0.517, 'learning_rate': 1.2373001469360784e-05, 'epoch': 0.88} {'loss': 0.575, 'learning_rate': 1.2372675087105352e-05, 'epoch': 0.88} {'loss': 0.5664, 'learning_rate': 1.237234870217162e-05, 'epoch': 0.88} {'loss': 0.5103, 'learning_rate': 1.2372022314559962e-05, 'epoch': 0.88} {'loss': 0.5741, 'learning_rate': 1.2371695924270738e-05, 'epoch': 0.88} {'loss': 0.6395, 'learning_rate': 1.237136953130432e-05, 'epoch': 0.88} {'loss': 0.5048, 'learning_rate': 1.2371043135661078e-05, 'epoch': 0.88} {'loss': 0.5831, 'learning_rate': 1.2370716737341381e-05, 'epoch': 0.88} {'loss': 0.6206, 'learning_rate': 1.2370390336345594e-05, 'epoch': 0.88} {'loss': 0.6724, 'learning_rate': 1.2370063932674083e-05, 'epoch': 0.88} {'loss': 0.5244, 'learning_rate': 1.2369737526327226e-05, 'epoch': 0.88} {'loss': 0.5607, 'learning_rate': 1.2369411117305383e-05, 'epoch': 0.88} {'loss': 0.4692, 'learning_rate': 1.2369084705608928e-05, 'epoch': 0.88} {'loss': 0.5797, 'learning_rate': 1.2368758291238226e-05, 'epoch': 0.88} {'loss': 0.4994, 'learning_rate': 1.2368431874193645e-05, 'epoch': 0.88} {'loss': 0.5654, 'learning_rate': 1.2368105454475555e-05, 'epoch': 0.88} {'loss': 0.5953, 'learning_rate': 1.2367779032084324e-05, 'epoch': 0.88} {'loss': 0.6438, 'learning_rate': 1.236745260702032e-05, 'epoch': 0.88} {'loss': 0.4493, 'learning_rate': 1.2367126179283917e-05, 'epoch': 0.88} {'loss': 0.5614, 'learning_rate': 1.2366799748875475e-05, 'epoch': 0.88} {'loss': 0.6807, 'learning_rate': 1.2366473315795367e-05, 'epoch': 0.88} {'loss': 0.7354, 'learning_rate': 1.2366146880043962e-05, 'epoch': 0.88} {'loss': 0.5019, 'learning_rate': 1.2365820441621622e-05, 'epoch': 0.88} {'loss': 0.6719, 'learning_rate': 1.2365494000528724e-05, 'epoch': 0.88} {'loss': 0.4391, 'learning_rate': 1.2365167556765633e-05, 'epoch': 0.88} {'loss': 0.5088, 'learning_rate': 1.2364841110332719e-05, 'epoch': 0.88} {'loss': 0.6567, 'learning_rate': 1.2364514661230346e-05, 'epoch': 0.88} {'loss': 0.5658, 'learning_rate': 1.2364188209458888e-05, 'epoch': 0.88} {'loss': 0.5439, 'learning_rate': 1.2363861755018708e-05, 'epoch': 0.88} {'loss': 0.6169, 'learning_rate': 1.236353529791018e-05, 'epoch': 0.88} {'loss': 0.5091, 'learning_rate': 1.236320883813367e-05, 'epoch': 0.88} {'loss': 0.5793, 'learning_rate': 1.2362882375689552e-05, 'epoch': 0.88} {'loss': 0.7887, 'learning_rate': 1.2362555910578182e-05, 'epoch': 0.88} {'loss': 0.5559, 'learning_rate': 1.2362229442799939e-05, 'epoch': 0.88} {'loss': 0.4815, 'learning_rate': 1.2361902972355185e-05, 'epoch': 0.88} {'loss': 0.4878, 'learning_rate': 1.2361576499244292e-05, 'epoch': 0.88} {'loss': 0.5882, 'learning_rate': 1.236125002346763e-05, 'epoch': 0.88} {'loss': 0.5095, 'learning_rate': 1.2360923545025564e-05, 'epoch': 0.88} {'loss': 0.6417, 'learning_rate': 1.2360597063918467e-05, 'epoch': 0.88} {'loss': 0.7502, 'learning_rate': 1.2360270580146703e-05, 'epoch': 0.88} {'loss': 0.5196, 'learning_rate': 1.2359944093710643e-05, 'epoch': 0.88} {'loss': 0.4333, 'learning_rate': 1.2359617604610655e-05, 'epoch': 0.88} {'loss': 0.4581, 'learning_rate': 1.2359291112847105e-05, 'epoch': 0.88} {'loss': 0.5481, 'learning_rate': 1.2358964618420365e-05, 'epoch': 0.88} {'loss': 0.7293, 'learning_rate': 1.2358638121330806e-05, 'epoch': 0.88} {'loss': 0.6753, 'learning_rate': 1.235831162157879e-05, 'epoch': 0.88} {'loss': 0.4994, 'learning_rate': 1.2357985119164691e-05, 'epoch': 0.88} {'loss': 0.5706, 'learning_rate': 1.2357658614088872e-05, 'epoch': 0.88} {'loss': 0.4943, 'learning_rate': 1.2357332106351705e-05, 'epoch': 0.88} {'loss': 0.5258, 'learning_rate': 1.235700559595356e-05, 'epoch': 0.88} {'loss': 0.6573, 'learning_rate': 1.2356679082894802e-05, 'epoch': 0.88} {'loss': 0.5133, 'learning_rate': 1.2356352567175804e-05, 'epoch': 0.88} {'loss': 0.6223, 'learning_rate': 1.235602604879693e-05, 'epoch': 0.88} {'loss': 0.5334, 'learning_rate': 1.2355699527758552e-05, 'epoch': 0.88} {'loss': 0.5397, 'learning_rate': 1.2355373004061035e-05, 'epoch': 0.88} {'loss': 0.5788, 'learning_rate': 1.2355046477704753e-05, 'epoch': 0.88} {'loss': 0.7717, 'learning_rate': 1.2354719948690068e-05, 'epoch': 0.88} {'loss': 0.4838, 'learning_rate': 1.2354393417017357e-05, 'epoch': 0.88} {'loss': 0.5708, 'learning_rate': 1.235406688268698e-05, 'epoch': 0.88} {'loss': 0.6443, 'learning_rate': 1.2353740345699305e-05, 'epoch': 0.88} {'loss': 0.6472, 'learning_rate': 1.2353413806054711e-05, 'epoch': 0.88} {'loss': 0.3183, 'learning_rate': 1.2353087263753557e-05, 'epoch': 0.88} {'loss': 0.3692, 'learning_rate': 1.2352760718796217e-05, 'epoch': 0.88} {'loss': 0.71, 'learning_rate': 1.2352434171183057e-05, 'epoch': 0.88} {'loss': 0.5615, 'learning_rate': 1.2352107620914447e-05, 'epoch': 0.88} {'loss': 0.6069, 'learning_rate': 1.235178106799075e-05, 'epoch': 0.88} {'loss': 0.4965, 'learning_rate': 1.2351454512412344e-05, 'epoch': 0.88} {'loss': 0.4299, 'learning_rate': 1.2351127954179596e-05, 'epoch': 0.88} {'loss': 0.6878, 'learning_rate': 1.2350801393292866e-05, 'epoch': 0.88} {'loss': 0.7709, 'learning_rate': 1.235047482975253e-05, 'epoch': 0.88} {'loss': 0.6263, 'learning_rate': 1.2350148263558954e-05, 'epoch': 0.88} {'loss': 0.5091, 'learning_rate': 1.2349821694712509e-05, 'epoch': 0.88} {'loss': 0.4632, 'learning_rate': 1.2349495123213562e-05, 'epoch': 0.88} {'loss': 0.5887, 'learning_rate': 1.2349168549062482e-05, 'epoch': 0.88} {'loss': 0.5826, 'learning_rate': 1.2348841972259635e-05, 'epoch': 0.88} {'loss': 0.6169, 'learning_rate': 1.2348515392805397e-05, 'epoch': 0.88} {'loss': 0.7704, 'learning_rate': 1.2348188810700127e-05, 'epoch': 0.88} {'loss': 0.5771, 'learning_rate': 1.2347862225944197e-05, 'epoch': 0.88} {'loss': 0.492, 'learning_rate': 1.2347535638537982e-05, 'epoch': 0.88} {'loss': 0.4463, 'learning_rate': 1.2347209048481842e-05, 'epoch': 0.88} {'loss': 0.4954, 'learning_rate': 1.2346882455776155e-05, 'epoch': 0.88} {'loss': 0.4995, 'learning_rate': 1.2346555860421279e-05, 'epoch': 0.88} {'loss': 0.6172, 'learning_rate': 1.2346229262417588e-05, 'epoch': 0.89} {'loss': 0.5985, 'learning_rate': 1.2345902661765453e-05, 'epoch': 0.89} {'loss': 0.5771, 'learning_rate': 1.2345576058465236e-05, 'epoch': 0.89} {'loss': 0.5639, 'learning_rate': 1.2345249452517312e-05, 'epoch': 0.89} {'loss': 0.4983, 'learning_rate': 1.2344922843922047e-05, 'epoch': 0.89} {'loss': 0.6497, 'learning_rate': 1.2344596232679808e-05, 'epoch': 0.89} {'loss': 0.4543, 'learning_rate': 1.234426961879097e-05, 'epoch': 0.89} {'loss': 0.5573, 'learning_rate': 1.2343943002255894e-05, 'epoch': 0.89} {'loss': 0.5837, 'learning_rate': 1.2343616383074952e-05, 'epoch': 0.89} {'loss': 0.6542, 'learning_rate': 1.2343289761248514e-05, 'epoch': 0.89} {'loss': 0.6129, 'learning_rate': 1.2342963136776946e-05, 'epoch': 0.89} {'loss': 0.6692, 'learning_rate': 1.234263650966062e-05, 'epoch': 0.89} {'loss': 0.7147, 'learning_rate': 1.2342309879899906e-05, 'epoch': 0.89} {'loss': 0.5298, 'learning_rate': 1.2341983247495163e-05, 'epoch': 0.89} {'loss': 0.6581, 'learning_rate': 1.2341656612446771e-05, 'epoch': 0.89} {'loss': 0.6049, 'learning_rate': 1.2341329974755091e-05, 'epoch': 0.89} {'loss': 0.7691, 'learning_rate': 1.2341003334420496e-05, 'epoch': 0.89} {'loss': 0.5721, 'learning_rate': 1.2340676691443352e-05, 'epoch': 0.89} {'loss': 0.4414, 'learning_rate': 1.234035004582403e-05, 'epoch': 0.89} {'loss': 0.5458, 'learning_rate': 1.23400233975629e-05, 'epoch': 0.89} {'loss': 0.3872, 'learning_rate': 1.2339696746660326e-05, 'epoch': 0.89} {'loss': 0.5885, 'learning_rate': 1.233937009311668e-05, 'epoch': 0.89} {'loss': 0.451, 'learning_rate': 1.233904343693233e-05, 'epoch': 0.89} {'loss': 0.5957, 'learning_rate': 1.2338716778107645e-05, 'epoch': 0.89} {'loss': 0.4202, 'learning_rate': 1.233839011664299e-05, 'epoch': 0.89} {'loss': 0.3817, 'learning_rate': 1.2338063452538745e-05, 'epoch': 0.89} {'loss': 0.5678, 'learning_rate': 1.2337736785795266e-05, 'epoch': 0.89} {'loss': 0.5925, 'learning_rate': 1.2337410116412924e-05, 'epoch': 0.89} {'loss': 0.6894, 'learning_rate': 1.2337083444392093e-05, 'epoch': 0.89} {'loss': 0.6084, 'learning_rate': 1.233675676973314e-05, 'epoch': 0.89} {'loss': 0.4306, 'learning_rate': 1.2336430092436433e-05, 'epoch': 0.89} {'loss': 0.5948, 'learning_rate': 1.233610341250234e-05, 'epoch': 0.89} {'loss': 0.5689, 'learning_rate': 1.2335776729931231e-05, 'epoch': 0.89} {'loss': 0.4885, 'learning_rate': 1.2335450044723474e-05, 'epoch': 0.89} {'loss': 0.5112, 'learning_rate': 1.2335123356879439e-05, 'epoch': 0.89} {'loss': 0.3155, 'learning_rate': 1.2334796666399493e-05, 'epoch': 0.89} {'loss': 0.5821, 'learning_rate': 1.2334469973284006e-05, 'epoch': 0.89} {'loss': 0.6592, 'learning_rate': 1.2334143277533346e-05, 'epoch': 0.89} {'loss': 0.6119, 'learning_rate': 1.233381657914788e-05, 'epoch': 0.89} {'loss': 0.4703, 'learning_rate': 1.2333489878127982e-05, 'epoch': 0.89} {'loss': 0.442, 'learning_rate': 1.2333163174474016e-05, 'epoch': 0.89} {'loss': 0.6473, 'learning_rate': 1.2332836468186354e-05, 'epoch': 0.89} {'loss': 0.478, 'learning_rate': 1.233250975926536e-05, 'epoch': 0.89} {'loss': 0.7185, 'learning_rate': 1.233218304771141e-05, 'epoch': 0.89} {'loss': 0.6011, 'learning_rate': 1.2331856333524867e-05, 'epoch': 0.89} {'loss': 0.5367, 'learning_rate': 1.2331529616706101e-05, 'epoch': 0.89} {'loss': 0.5429, 'learning_rate': 1.233120289725548e-05, 'epoch': 0.89} {'loss': 0.629, 'learning_rate': 1.2330876175173378e-05, 'epoch': 0.89} {'loss': 0.4173, 'learning_rate': 1.233054945046016e-05, 'epoch': 0.89} {'loss': 0.5542, 'learning_rate': 1.2330222723116194e-05, 'epoch': 0.89} {'loss': 0.6271, 'learning_rate': 1.232989599314185e-05, 'epoch': 0.89} {'loss': 0.6696, 'learning_rate': 1.2329569260537494e-05, 'epoch': 0.89} {'loss': 0.5868, 'learning_rate': 1.2329242525303498e-05, 'epoch': 0.89} {'loss': 0.6061, 'learning_rate': 1.232891578744023e-05, 'epoch': 0.89} {'loss': 0.5813, 'learning_rate': 1.232858904694806e-05, 'epoch': 0.89} {'loss': 0.6582, 'learning_rate': 1.2328262303827353e-05, 'epoch': 0.89} {'loss': 0.6102, 'learning_rate': 1.2327935558078486e-05, 'epoch': 0.89} {'loss': 0.4813, 'learning_rate': 1.2327608809701819e-05, 'epoch': 0.89} {'loss': 0.703, 'learning_rate': 1.2327282058697722e-05, 'epoch': 0.89} {'loss': 0.4966, 'learning_rate': 1.232695530506657e-05, 'epoch': 0.89} {'loss': 0.5011, 'learning_rate': 1.2326628548808728e-05, 'epoch': 0.89} {'loss': 0.5926, 'learning_rate': 1.2326301789924563e-05, 'epoch': 0.89} {'loss': 0.5179, 'learning_rate': 1.2325975028414447e-05, 'epoch': 0.89} {'loss': 0.5111, 'learning_rate': 1.2325648264278747e-05, 'epoch': 0.89} {'loss': 0.4371, 'learning_rate': 1.2325321497517832e-05, 'epoch': 0.89} {'loss': 0.6189, 'learning_rate': 1.2324994728132071e-05, 'epoch': 0.89} {'loss': 0.487, 'learning_rate': 1.2324667956121835e-05, 'epoch': 0.89} {'loss': 0.5747, 'learning_rate': 1.2324341181487487e-05, 'epoch': 0.89} {'loss': 0.4607, 'learning_rate': 1.2324014404229402e-05, 'epoch': 0.89} {'loss': 0.6468, 'learning_rate': 1.2323687624347946e-05, 'epoch': 0.89} {'loss': 0.6541, 'learning_rate': 1.232336084184349e-05, 'epoch': 0.89} {'loss': 0.5435, 'learning_rate': 1.2323034056716401e-05, 'epoch': 0.89} {'loss': 0.5429, 'learning_rate': 1.2322707268967048e-05, 'epoch': 0.89} {'loss': 0.5875, 'learning_rate': 1.2322380478595798e-05, 'epoch': 0.89} {'loss': 0.6386, 'learning_rate': 1.2322053685603028e-05, 'epoch': 0.89} {'loss': 0.659, 'learning_rate': 1.2321726889989097e-05, 'epoch': 0.89} {'loss': 0.5183, 'learning_rate': 1.2321400091754377e-05, 'epoch': 0.89} {'loss': 0.6747, 'learning_rate': 1.2321073290899236e-05, 'epoch': 0.89} {'loss': 0.5228, 'learning_rate': 1.2320746487424049e-05, 'epoch': 0.89} {'loss': 0.4234, 'learning_rate': 1.232041968132918e-05, 'epoch': 0.89} {'loss': 0.4826, 'learning_rate': 1.2320092872614995e-05, 'epoch': 0.89} {'loss': 0.6073, 'learning_rate': 1.2319766061281869e-05, 'epoch': 0.89} {'loss': 0.4823, 'learning_rate': 1.2319439247330167e-05, 'epoch': 0.89} {'loss': 0.5645, 'learning_rate': 1.231911243076026e-05, 'epoch': 0.89} {'loss': 0.7419, 'learning_rate': 1.2318785611572516e-05, 'epoch': 0.89} {'loss': 0.7112, 'learning_rate': 1.2318458789767307e-05, 'epoch': 0.89} {'loss': 0.4557, 'learning_rate': 1.2318131965344994e-05, 'epoch': 0.89} {'loss': 0.5568, 'learning_rate': 1.2317805138305953e-05, 'epoch': 0.89} {'loss': 0.4608, 'learning_rate': 1.2317478308650553e-05, 'epoch': 0.89} {'loss': 0.5379, 'learning_rate': 1.2317151476379157e-05, 'epoch': 0.89} {'loss': 0.6368, 'learning_rate': 1.2316824641492138e-05, 'epoch': 0.89} {'loss': 0.4944, 'learning_rate': 1.2316497803989867e-05, 'epoch': 0.89} {'loss': 0.6483, 'learning_rate': 1.2316170963872706e-05, 'epoch': 0.89} {'loss': 0.4817, 'learning_rate': 1.2315844121141031e-05, 'epoch': 0.89} {'loss': 0.6141, 'learning_rate': 1.231551727579521e-05, 'epoch': 0.89} {'loss': 0.6048, 'learning_rate': 1.2315190427835608e-05, 'epoch': 0.89} {'loss': 0.6727, 'learning_rate': 1.2314863577262596e-05, 'epoch': 0.89} {'loss': 0.6082, 'learning_rate': 1.2314536724076547e-05, 'epoch': 0.89} {'loss': 0.6641, 'learning_rate': 1.2314209868277824e-05, 'epoch': 0.89} {'loss': 0.5363, 'learning_rate': 1.2313883009866798e-05, 'epoch': 0.89} {'loss': 0.5522, 'learning_rate': 1.2313556148843838e-05, 'epoch': 0.89} {'loss': 0.5185, 'learning_rate': 1.2313229285209314e-05, 'epoch': 0.89} {'loss': 0.5621, 'learning_rate': 1.2312902418963591e-05, 'epoch': 0.89} {'loss': 0.5348, 'learning_rate': 1.2312575550107045e-05, 'epoch': 0.89} {'loss': 0.6609, 'learning_rate': 1.2312248678640038e-05, 'epoch': 0.89} {'loss': 0.5803, 'learning_rate': 1.2311921804562941e-05, 'epoch': 0.89} {'loss': 0.4355, 'learning_rate': 1.2311594927876128e-05, 'epoch': 0.89} {'loss': 0.4237, 'learning_rate': 1.2311268048579961e-05, 'epoch': 0.89} {'loss': 0.5829, 'learning_rate': 1.231094116667481e-05, 'epoch': 0.89} {'loss': 0.4956, 'learning_rate': 1.231061428216105e-05, 'epoch': 0.89} {'loss': 0.6406, 'learning_rate': 1.2310287395039042e-05, 'epoch': 0.89} {'loss': 0.4434, 'learning_rate': 1.2309960505309165e-05, 'epoch': 0.89} {'loss': 0.7009, 'learning_rate': 1.2309633612971776e-05, 'epoch': 0.89} {'loss': 0.6743, 'learning_rate': 1.2309306718027252e-05, 'epoch': 0.89} {'loss': 0.5461, 'learning_rate': 1.230897982047596e-05, 'epoch': 0.89} {'loss': 0.7422, 'learning_rate': 1.230865292031827e-05, 'epoch': 0.89} {'loss': 0.4734, 'learning_rate': 1.2308326017554546e-05, 'epoch': 0.89} {'loss': 0.6872, 'learning_rate': 1.2307999112185162e-05, 'epoch': 0.89} {'loss': 0.6262, 'learning_rate': 1.2307672204210488e-05, 'epoch': 0.89} {'loss': 0.7412, 'learning_rate': 1.230734529363089e-05, 'epoch': 0.89} {'loss': 0.6543, 'learning_rate': 1.2307018380446737e-05, 'epoch': 0.89} {'loss': 0.5086, 'learning_rate': 1.23066914646584e-05, 'epoch': 0.89} {'loss': 0.4373, 'learning_rate': 1.2306364546266247e-05, 'epoch': 0.89} {'loss': 0.6465, 'learning_rate': 1.2306037625270648e-05, 'epoch': 0.89} {'loss': 0.5205, 'learning_rate': 1.2305710701671972e-05, 'epoch': 0.89} {'loss': 0.8056, 'learning_rate': 1.2305383775470584e-05, 'epoch': 0.89} {'loss': 0.4692, 'learning_rate': 1.2305056846666854e-05, 'epoch': 0.89} {'loss': 0.5633, 'learning_rate': 1.2304729915261158e-05, 'epoch': 0.89} {'loss': 0.6185, 'learning_rate': 1.2304402981253858e-05, 'epoch': 0.89} {'loss': 0.5197, 'learning_rate': 1.2304076044645323e-05, 'epoch': 0.89} {'loss': 0.4728, 'learning_rate': 1.230374910543593e-05, 'epoch': 0.89} {'loss': 0.6711, 'learning_rate': 1.2303422163626037e-05, 'epoch': 0.89} {'loss': 0.6077, 'learning_rate': 1.2303095219216022e-05, 'epoch': 0.89} {'loss': 0.7188, 'learning_rate': 1.2302768272206248e-05, 'epoch': 0.89} {'loss': 0.5961, 'learning_rate': 1.230244132259709e-05, 'epoch': 0.89} {'loss': 0.6655, 'learning_rate': 1.230211437038891e-05, 'epoch': 0.89} {'loss': 0.6306, 'learning_rate': 1.2301787415582083e-05, 'epoch': 0.89} {'loss': 0.4052, 'learning_rate': 1.2301460458176973e-05, 'epoch': 0.89} {'loss': 0.6854, 'learning_rate': 1.2301133498173954e-05, 'epoch': 0.89} {'loss': 0.5049, 'learning_rate': 1.230080653557339e-05, 'epoch': 0.89} {'loss': 0.6726, 'learning_rate': 1.2300479570375657e-05, 'epoch': 0.89} {'loss': 0.5292, 'learning_rate': 1.2300152602581117e-05, 'epoch': 0.89} {'loss': 0.5024, 'learning_rate': 1.2299825632190144e-05, 'epoch': 0.89} {'loss': 0.6155, 'learning_rate': 1.2299498659203104e-05, 'epoch': 0.89} {'loss': 0.664, 'learning_rate': 1.2299171683620368e-05, 'epoch': 0.89} {'loss': 0.4855, 'learning_rate': 1.2298844705442303e-05, 'epoch': 0.89} {'loss': 0.5131, 'learning_rate': 1.2298517724669281e-05, 'epoch': 0.89} {'loss': 0.4547, 'learning_rate': 1.229819074130167e-05, 'epoch': 0.89} {'loss': 0.5822, 'learning_rate': 1.2297863755339838e-05, 'epoch': 0.89} {'loss': 0.5886, 'learning_rate': 1.2297536766784155e-05, 'epoch': 0.89} {'loss': 0.6018, 'learning_rate': 1.2297209775634991e-05, 'epoch': 0.89} {'loss': 0.7082, 'learning_rate': 1.2296882781892712e-05, 'epoch': 0.89} {'loss': 0.5965, 'learning_rate': 1.2296555785557688e-05, 'epoch': 0.89} {'loss': 0.4339, 'learning_rate': 1.2296228786630292e-05, 'epoch': 0.89} {'loss': 0.6902, 'learning_rate': 1.2295901785110888e-05, 'epoch': 0.89} {'loss': 0.6212, 'learning_rate': 1.2295574780999848e-05, 'epoch': 0.89} {'loss': 0.5132, 'learning_rate': 1.2295247774297541e-05, 'epoch': 0.89} {'loss': 0.5611, 'learning_rate': 1.2294920765004336e-05, 'epoch': 0.89} {'loss': 0.366, 'learning_rate': 1.2294593753120604e-05, 'epoch': 0.89} {'loss': 0.4705, 'learning_rate': 1.2294266738646707e-05, 'epoch': 0.89} {'loss': 0.6903, 'learning_rate': 1.2293939721583024e-05, 'epoch': 0.89} {'loss': 0.5503, 'learning_rate': 1.2293612701929918e-05, 'epoch': 0.89} {'loss': 0.5197, 'learning_rate': 1.2293285679687758e-05, 'epoch': 0.89} {'loss': 0.6207, 'learning_rate': 1.2292958654856915e-05, 'epoch': 0.89} {'loss': 0.5829, 'learning_rate': 1.229263162743776e-05, 'epoch': 0.89} {'loss': 0.5027, 'learning_rate': 1.2292304597430656e-05, 'epoch': 0.89} {'loss': 0.5259, 'learning_rate': 1.2291977564835978e-05, 'epoch': 0.89} {'loss': 0.3861, 'learning_rate': 1.229165052965409e-05, 'epoch': 0.89} {'loss': 0.5303, 'learning_rate': 1.229132349188537e-05, 'epoch': 0.89} {'loss': 0.736, 'learning_rate': 1.2290996451530178e-05, 'epoch': 0.89} {'loss': 0.64, 'learning_rate': 1.2290669408588886e-05, 'epoch': 0.89} {'loss': 0.6061, 'learning_rate': 1.2290342363061867e-05, 'epoch': 0.89} {'loss': 0.4046, 'learning_rate': 1.2290015314949484e-05, 'epoch': 0.89} {'loss': 0.5963, 'learning_rate': 1.228968826425211e-05, 'epoch': 0.89} {'loss': 0.5626, 'learning_rate': 1.2289361210970116e-05, 'epoch': 0.89} {'loss': 0.6034, 'learning_rate': 1.2289034155103867e-05, 'epoch': 0.89} {'loss': 0.4561, 'learning_rate': 1.2288707096653729e-05, 'epoch': 0.89} {'loss': 0.7158, 'learning_rate': 1.228838003562008e-05, 'epoch': 0.89} {'loss': 0.6236, 'learning_rate': 1.2288052972003286e-05, 'epoch': 0.89} {'loss': 0.6632, 'learning_rate': 1.2287725905803713e-05, 'epoch': 0.89} {'loss': 0.4714, 'learning_rate': 1.2287398837021734e-05, 'epoch': 0.89} {'loss': 0.5215, 'learning_rate': 1.2287071765657716e-05, 'epoch': 0.89} {'loss': 0.6803, 'learning_rate': 1.2286744691712029e-05, 'epoch': 0.89} {'loss': 0.5866, 'learning_rate': 1.2286417615185042e-05, 'epoch': 0.89} {'loss': 0.5284, 'learning_rate': 1.2286090536077129e-05, 'epoch': 0.89} {'loss': 0.6762, 'learning_rate': 1.2285763454388648e-05, 'epoch': 0.89} {'loss': 0.4796, 'learning_rate': 1.2285436370119979e-05, 'epoch': 0.89} {'loss': 0.5185, 'learning_rate': 1.2285109283271484e-05, 'epoch': 0.89} {'loss': 0.4394, 'learning_rate': 1.2284782193843536e-05, 'epoch': 0.89} {'loss': 0.7298, 'learning_rate': 1.2284455101836504e-05, 'epoch': 0.89} {'loss': 0.6211, 'learning_rate': 1.2284128007250756e-05, 'epoch': 0.89} {'loss': 0.5629, 'learning_rate': 1.228380091008666e-05, 'epoch': 0.89} {'loss': 0.6032, 'learning_rate': 1.2283473810344589e-05, 'epoch': 0.89} {'loss': 0.6849, 'learning_rate': 1.2283146708024912e-05, 'epoch': 0.89} {'loss': 0.5972, 'learning_rate': 1.2282819603127993e-05, 'epoch': 0.89} {'loss': 0.6035, 'learning_rate': 1.2282492495654205e-05, 'epoch': 0.89} {'loss': 0.6298, 'learning_rate': 1.228216538560392e-05, 'epoch': 0.89} {'loss': 0.5691, 'learning_rate': 1.2281838272977505e-05, 'epoch': 0.89} {'loss': 0.7374, 'learning_rate': 1.2281511157775325e-05, 'epoch': 0.89} {'loss': 0.6119, 'learning_rate': 1.2281184039997753e-05, 'epoch': 0.89} {'loss': 0.7128, 'learning_rate': 1.228085691964516e-05, 'epoch': 0.89} {'loss': 0.4925, 'learning_rate': 1.2280529796717913e-05, 'epoch': 0.89} {'loss': 0.6835, 'learning_rate': 1.2280202671216379e-05, 'epoch': 0.89} {'loss': 0.6593, 'learning_rate': 1.2279875543140932e-05, 'epoch': 0.89} {'loss': 0.5298, 'learning_rate': 1.227954841249194e-05, 'epoch': 0.89} {'loss': 0.6572, 'learning_rate': 1.2279221279269768e-05, 'epoch': 0.89} {'loss': 0.5748, 'learning_rate': 1.2278894143474792e-05, 'epoch': 0.89} {'loss': 0.5596, 'learning_rate': 1.2278567005107376e-05, 'epoch': 0.89} {'loss': 0.6009, 'learning_rate': 1.227823986416789e-05, 'epoch': 0.89} {'loss': 0.6455, 'learning_rate': 1.2277912720656707e-05, 'epoch': 0.89} {'loss': 0.5568, 'learning_rate': 1.2277585574574193e-05, 'epoch': 0.89} {'loss': 0.6, 'learning_rate': 1.2277258425920718e-05, 'epoch': 0.89} {'loss': 0.582, 'learning_rate': 1.2276931274696651e-05, 'epoch': 0.89} {'loss': 0.5509, 'learning_rate': 1.227660412090236e-05, 'epoch': 0.89} {'loss': 0.61, 'learning_rate': 1.2276276964538219e-05, 'epoch': 0.89} {'loss': 0.6488, 'learning_rate': 1.2275949805604592e-05, 'epoch': 0.89} {'loss': 0.6907, 'learning_rate': 1.227562264410185e-05, 'epoch': 0.89} {'loss': 0.5652, 'learning_rate': 1.2275295480030365e-05, 'epoch': 0.89} {'loss': 0.5381, 'learning_rate': 1.22749683133905e-05, 'epoch': 0.89} {'loss': 0.6258, 'learning_rate': 1.2274641144182633e-05, 'epoch': 0.89} {'loss': 0.4417, 'learning_rate': 1.2274313972407126e-05, 'epoch': 0.89} {'loss': 0.7, 'learning_rate': 1.2273986798064353e-05, 'epoch': 0.89} {'loss': 0.4115, 'learning_rate': 1.2273659621154678e-05, 'epoch': 0.89} {'loss': 0.6012, 'learning_rate': 1.2273332441678475e-05, 'epoch': 0.89} {'loss': 0.4846, 'learning_rate': 1.2273005259636116e-05, 'epoch': 0.89} {'loss': 0.6639, 'learning_rate': 1.2272678075027961e-05, 'epoch': 0.89} {'loss': 0.5848, 'learning_rate': 1.2272350887854387e-05, 'epoch': 0.89} {'loss': 0.515, 'learning_rate': 1.227202369811576e-05, 'epoch': 0.89} {'loss': 0.5677, 'learning_rate': 1.2271696505812452e-05, 'epoch': 0.89} {'loss': 0.4485, 'learning_rate': 1.227136931094483e-05, 'epoch': 0.89} {'loss': 0.6971, 'learning_rate': 1.2271042113513264e-05, 'epoch': 0.89} {'loss': 0.7407, 'learning_rate': 1.2270714913518123e-05, 'epoch': 0.89} {'loss': 0.5101, 'learning_rate': 1.2270387710959774e-05, 'epoch': 0.89} {'loss': 0.6353, 'learning_rate': 1.2270060505838593e-05, 'epoch': 0.89} {'loss': 0.528, 'learning_rate': 1.2269733298154944e-05, 'epoch': 0.89} {'loss': 0.5126, 'learning_rate': 1.2269406087909199e-05, 'epoch': 0.89} {'loss': 0.4288, 'learning_rate': 1.2269078875101722e-05, 'epoch': 0.89} {'loss': 0.5552, 'learning_rate': 1.2268751659732891e-05, 'epoch': 0.89} {'loss': 0.4913, 'learning_rate': 1.2268424441803068e-05, 'epoch': 0.89} {'loss': 0.4327, 'learning_rate': 1.2268097221312627e-05, 'epoch': 0.89} {'loss': 0.5356, 'learning_rate': 1.2267769998261933e-05, 'epoch': 0.89} {'loss': 0.569, 'learning_rate': 1.2267442772651361e-05, 'epoch': 0.89} {'loss': 0.7284, 'learning_rate': 1.2267115544481277e-05, 'epoch': 0.89} {'loss': 0.6085, 'learning_rate': 1.2266788313752047e-05, 'epoch': 0.89} {'loss': 0.7245, 'learning_rate': 1.2266461080464047e-05, 'epoch': 0.89} {'loss': 0.4782, 'learning_rate': 1.2266133844617643e-05, 'epoch': 0.89} {'loss': 0.478, 'learning_rate': 1.2265806606213205e-05, 'epoch': 0.89} {'loss': 0.5201, 'learning_rate': 1.2265479365251102e-05, 'epoch': 0.89} {'loss': 0.3911, 'learning_rate': 1.2265152121731705e-05, 'epoch': 0.89} {'loss': 0.6644, 'learning_rate': 1.2264824875655382e-05, 'epoch': 0.89} {'loss': 0.4477, 'learning_rate': 1.22644976270225e-05, 'epoch': 0.89} {'loss': 0.7025, 'learning_rate': 1.2264170375833431e-05, 'epoch': 0.89} {'loss': 0.6279, 'learning_rate': 1.2263843122088546e-05, 'epoch': 0.89} {'loss': 0.5525, 'learning_rate': 1.226351586578821e-05, 'epoch': 0.89} {'loss': 0.5471, 'learning_rate': 1.2263188606932797e-05, 'epoch': 0.89} {'loss': 0.6415, 'learning_rate': 1.2262861345522673e-05, 'epoch': 0.89} {'loss': 0.6315, 'learning_rate': 1.226253408155821e-05, 'epoch': 0.89} {'loss': 0.5489, 'learning_rate': 1.2262206815039777e-05, 'epoch': 0.89} {'loss': 0.5437, 'learning_rate': 1.226187954596774e-05, 'epoch': 0.89} {'loss': 0.5054, 'learning_rate': 1.2261552274342474e-05, 'epoch': 0.89} {'loss': 0.4301, 'learning_rate': 1.2261225000164345e-05, 'epoch': 0.89} {'loss': 0.5207, 'learning_rate': 1.2260897723433722e-05, 'epoch': 0.89} {'loss': 0.5496, 'learning_rate': 1.2260570444150976e-05, 'epoch': 0.89} {'loss': 0.5746, 'learning_rate': 1.2260243162316476e-05, 'epoch': 0.89} {'loss': 0.5865, 'learning_rate': 1.225991587793059e-05, 'epoch': 0.89} {'loss': 0.7573, 'learning_rate': 1.2259588590993689e-05, 'epoch': 0.89} {'loss': 0.5088, 'learning_rate': 1.2259261301506144e-05, 'epoch': 0.89} {'loss': 0.5203, 'learning_rate': 1.2258934009468322e-05, 'epoch': 0.89} {'loss': 0.682, 'learning_rate': 1.2258606714880593e-05, 'epoch': 0.89} {'loss': 0.6234, 'learning_rate': 1.2258279417743324e-05, 'epoch': 0.89} {'loss': 0.6273, 'learning_rate': 1.2257952118056888e-05, 'epoch': 0.89} {'loss': 0.5088, 'learning_rate': 1.2257624815821657e-05, 'epoch': 0.89} {'loss': 0.478, 'learning_rate': 1.2257297511037993e-05, 'epoch': 0.89} {'loss': 0.6649, 'learning_rate': 1.2256970203706273e-05, 'epoch': 0.89} {'loss': 0.3818, 'learning_rate': 1.225664289382686e-05, 'epoch': 0.89} {'loss': 0.3949, 'learning_rate': 1.2256315581400124e-05, 'epoch': 0.89} {'loss': 0.5737, 'learning_rate': 1.225598826642644e-05, 'epoch': 0.89} {'loss': 0.4611, 'learning_rate': 1.2255660948906173e-05, 'epoch': 0.89} {'loss': 0.6854, 'learning_rate': 1.2255333628839694e-05, 'epoch': 0.89} {'loss': 0.6262, 'learning_rate': 1.2255006306227373e-05, 'epoch': 0.89} {'loss': 0.4779, 'learning_rate': 1.2254678981069578e-05, 'epoch': 0.89} {'loss': 0.5252, 'learning_rate': 1.225435165336668e-05, 'epoch': 0.89} {'loss': 0.5857, 'learning_rate': 1.2254024323119046e-05, 'epoch': 0.89} {'loss': 0.6183, 'learning_rate': 1.2253696990327049e-05, 'epoch': 0.89} {'loss': 0.6812, 'learning_rate': 1.2253369654991058e-05, 'epoch': 0.89} {'loss': 0.6393, 'learning_rate': 1.2253042317111439e-05, 'epoch': 0.89} {'loss': 0.4348, 'learning_rate': 1.2252714976688564e-05, 'epoch': 0.89} {'loss': 0.5463, 'learning_rate': 1.2252387633722801e-05, 'epoch': 0.89} {'loss': 0.5257, 'learning_rate': 1.2252060288214522e-05, 'epoch': 0.89} {'loss': 0.4086, 'learning_rate': 1.2251732940164094e-05, 'epoch': 0.89} {'loss': 0.6241, 'learning_rate': 1.225140558957189e-05, 'epoch': 0.89} {'loss': 0.6301, 'learning_rate': 1.2251078236438275e-05, 'epoch': 0.89} {'loss': 0.537, 'learning_rate': 1.2250750880763622e-05, 'epoch': 0.89} {'loss': 0.751, 'learning_rate': 1.2250423522548298e-05, 'epoch': 0.89} {'loss': 0.5868, 'learning_rate': 1.2250096161792675e-05, 'epoch': 0.89} {'loss': 0.4521, 'learning_rate': 1.2249768798497119e-05, 'epoch': 0.89} {'loss': 0.7017, 'learning_rate': 1.2249441432662004e-05, 'epoch': 0.89} {'loss': 0.68, 'learning_rate': 1.22491140642877e-05, 'epoch': 0.89} {'loss': 0.6022, 'learning_rate': 1.2248786693374571e-05, 'epoch': 0.89} {'loss': 0.6058, 'learning_rate': 1.2248459319922988e-05, 'epoch': 0.89} {'loss': 0.4906, 'learning_rate': 1.2248131943933324e-05, 'epoch': 0.89} {'loss': 0.6376, 'learning_rate': 1.2247804565405945e-05, 'epoch': 0.89} {'loss': 0.6699, 'learning_rate': 1.2247477184341223e-05, 'epoch': 0.89} {'loss': 0.6219, 'learning_rate': 1.2247149800739526e-05, 'epoch': 0.89} {'loss': 0.5532, 'learning_rate': 1.2246822414601224e-05, 'epoch': 0.89} {'loss': 0.4388, 'learning_rate': 1.2246495025926691e-05, 'epoch': 0.89} {'loss': 0.667, 'learning_rate': 1.2246167634716286e-05, 'epoch': 0.89} {'loss': 0.584, 'learning_rate': 1.2245840240970387e-05, 'epoch': 0.89} {'loss': 0.4304, 'learning_rate': 1.2245512844689364e-05, 'epoch': 0.89} {'loss': 0.6842, 'learning_rate': 1.2245185445873581e-05, 'epoch': 0.89} {'loss': 0.4601, 'learning_rate': 1.2244858044523415e-05, 'epoch': 0.89} {'loss': 0.7139, 'learning_rate': 1.2244530640639227e-05, 'epoch': 0.89} {'loss': 0.5702, 'learning_rate': 1.2244203234221392e-05, 'epoch': 0.89} {'loss': 0.7069, 'learning_rate': 1.2243875825270277e-05, 'epoch': 0.89} {'loss': 0.4967, 'learning_rate': 1.2243548413786254e-05, 'epoch': 0.89} {'loss': 0.526, 'learning_rate': 1.224322099976969e-05, 'epoch': 0.89} {'loss': 0.6006, 'learning_rate': 1.2242893583220958e-05, 'epoch': 0.89} {'loss': 0.6238, 'learning_rate': 1.2242566164140425e-05, 'epoch': 0.89} {'loss': 0.6099, 'learning_rate': 1.2242238742528463e-05, 'epoch': 0.89} {'loss': 0.52, 'learning_rate': 1.2241911318385438e-05, 'epoch': 0.89} {'loss': 0.6479, 'learning_rate': 1.224158389171172e-05, 'epoch': 0.89} {'loss': 0.6692, 'learning_rate': 1.2241256462507683e-05, 'epoch': 0.89} {'loss': 0.4412, 'learning_rate': 1.2240929030773692e-05, 'epoch': 0.89} {'loss': 0.5141, 'learning_rate': 1.224060159651012e-05, 'epoch': 0.89} {'loss': 0.5811, 'learning_rate': 1.2240274159717331e-05, 'epoch': 0.89} {'loss': 0.5513, 'learning_rate': 1.2239946720395701e-05, 'epoch': 0.89} {'loss': 0.4472, 'learning_rate': 1.2239619278545596e-05, 'epoch': 0.89} {'loss': 0.7149, 'learning_rate': 1.2239291834167388e-05, 'epoch': 0.89} {'loss': 0.5969, 'learning_rate': 1.2238964387261445e-05, 'epoch': 0.89} {'loss': 0.5404, 'learning_rate': 1.2238636937828137e-05, 'epoch': 0.89} {'loss': 0.6116, 'learning_rate': 1.2238309485867832e-05, 'epoch': 0.89} {'loss': 0.5403, 'learning_rate': 1.2237982031380903e-05, 'epoch': 0.89} {'loss': 0.5346, 'learning_rate': 1.223765457436772e-05, 'epoch': 0.89} {'loss': 0.5438, 'learning_rate': 1.2237327114828648e-05, 'epoch': 0.89} {'loss': 0.6173, 'learning_rate': 1.223699965276406e-05, 'epoch': 0.89} {'loss': 0.4569, 'learning_rate': 1.2236672188174323e-05, 'epoch': 0.89} {'loss': 0.6767, 'learning_rate': 1.2236344721059809e-05, 'epoch': 0.89} {'loss': 0.3981, 'learning_rate': 1.223601725142089e-05, 'epoch': 0.89} {'loss': 0.5305, 'learning_rate': 1.2235689779257928e-05, 'epoch': 0.89} {'loss': 0.4663, 'learning_rate': 1.2235362304571299e-05, 'epoch': 0.89} {'loss': 0.5537, 'learning_rate': 1.2235034827361371e-05, 'epoch': 0.89} {'loss': 0.7392, 'learning_rate': 1.2234707347628516e-05, 'epoch': 0.89} {'loss': 0.6858, 'learning_rate': 1.2234379865373098e-05, 'epoch': 0.89} {'loss': 0.619, 'learning_rate': 1.2234052380595492e-05, 'epoch': 0.89} {'loss': 0.6055, 'learning_rate': 1.2233724893296066e-05, 'epoch': 0.89} {'loss': 0.381, 'learning_rate': 1.2233397403475189e-05, 'epoch': 0.89} {'loss': 0.6094, 'learning_rate': 1.2233069911133233e-05, 'epoch': 0.89} {'loss': 0.6462, 'learning_rate': 1.2232742416270561e-05, 'epoch': 0.89} {'loss': 0.6154, 'learning_rate': 1.2232414918887552e-05, 'epoch': 0.89} {'loss': 0.6616, 'learning_rate': 1.2232087418984568e-05, 'epoch': 0.89} {'loss': 0.3336, 'learning_rate': 1.2231759916561982e-05, 'epoch': 0.89} {'loss': 0.4698, 'learning_rate': 1.2231432411620166e-05, 'epoch': 0.89} {'loss': 0.657, 'learning_rate': 1.2231104904159483e-05, 'epoch': 0.89} {'loss': 0.3945, 'learning_rate': 1.223077739418031e-05, 'epoch': 0.89} {'loss': 0.7146, 'learning_rate': 1.2230449881683013e-05, 'epoch': 0.89} {'loss': 0.6504, 'learning_rate': 1.2230122366667961e-05, 'epoch': 0.89} {'loss': 0.4486, 'learning_rate': 1.2229794849135525e-05, 'epoch': 0.89} {'loss': 0.6172, 'learning_rate': 1.2229467329086076e-05, 'epoch': 0.89} {'loss': 0.5424, 'learning_rate': 1.2229139806519981e-05, 'epoch': 0.89} {'loss': 0.4853, 'learning_rate': 1.2228812281437612e-05, 'epoch': 0.89} {'loss': 0.7319, 'learning_rate': 1.2228484753839341e-05, 'epoch': 0.89} {'loss': 0.6459, 'learning_rate': 1.222815722372553e-05, 'epoch': 0.89} {'loss': 0.5295, 'learning_rate': 1.2227829691096553e-05, 'epoch': 0.89} {'loss': 0.6932, 'learning_rate': 1.2227502155952782e-05, 'epoch': 0.89} {'loss': 0.5797, 'learning_rate': 1.2227174618294584e-05, 'epoch': 0.89} {'loss': 0.5364, 'learning_rate': 1.2226847078122328e-05, 'epoch': 0.89} {'loss': 0.6938, 'learning_rate': 1.2226519535436388e-05, 'epoch': 0.89} {'loss': 0.5357, 'learning_rate': 1.2226191990237128e-05, 'epoch': 0.89} {'loss': 0.5948, 'learning_rate': 1.2225864442524922e-05, 'epoch': 0.89} {'loss': 0.6213, 'learning_rate': 1.2225536892300138e-05, 'epoch': 0.89} {'loss': 0.4572, 'learning_rate': 1.2225209339563144e-05, 'epoch': 0.89} {'loss': 0.4057, 'learning_rate': 1.2224881784314315e-05, 'epoch': 0.89} {'loss': 0.4589, 'learning_rate': 1.2224554226554018e-05, 'epoch': 0.89} {'loss': 0.5665, 'learning_rate': 1.2224226666282622e-05, 'epoch': 0.89} {'loss': 0.5633, 'learning_rate': 1.2223899103500495e-05, 'epoch': 0.89} {'loss': 0.5019, 'learning_rate': 1.2223571538208008e-05, 'epoch': 0.89} {'loss': 0.5769, 'learning_rate': 1.2223243970405532e-05, 'epoch': 0.89} {'loss': 0.7616, 'learning_rate': 1.2222916400093436e-05, 'epoch': 0.89} {'loss': 0.5967, 'learning_rate': 1.2222588827272093e-05, 'epoch': 0.89} {'loss': 0.4296, 'learning_rate': 1.2222261251941868e-05, 'epoch': 0.89} {'loss': 0.5699, 'learning_rate': 1.2221933674103132e-05, 'epoch': 0.89} {'loss': 0.7391, 'learning_rate': 1.2221606093756257e-05, 'epoch': 0.89} {'loss': 0.5509, 'learning_rate': 1.2221278510901611e-05, 'epoch': 0.89} {'loss': 0.3793, 'learning_rate': 1.2220950925539566e-05, 'epoch': 0.89} {'loss': 0.4147, 'learning_rate': 1.2220623337670488e-05, 'epoch': 0.89} {'loss': 0.6228, 'learning_rate': 1.2220295747294745e-05, 'epoch': 0.89} {'loss': 0.5793, 'learning_rate': 1.2219968154412713e-05, 'epoch': 0.89} {'loss': 0.4505, 'learning_rate': 1.221964055902476e-05, 'epoch': 0.89} {'loss': 0.5487, 'learning_rate': 1.2219312961131256e-05, 'epoch': 0.89} {'loss': 0.5551, 'learning_rate': 1.2218985360732567e-05, 'epoch': 0.89} {'loss': 0.6295, 'learning_rate': 1.2218657757829066e-05, 'epoch': 0.89} {'loss': 0.6565, 'learning_rate': 1.2218330152421122e-05, 'epoch': 0.89} {'loss': 0.6048, 'learning_rate': 1.2218002544509107e-05, 'epoch': 0.89} {'loss': 0.4475, 'learning_rate': 1.2217674934093386e-05, 'epoch': 0.89} {'loss': 0.5755, 'learning_rate': 1.2217347321174334e-05, 'epoch': 0.89} {'loss': 0.394, 'learning_rate': 1.2217019705752318e-05, 'epoch': 0.89} {'loss': 0.6446, 'learning_rate': 1.2216692087827709e-05, 'epoch': 0.89} {'loss': 0.541, 'learning_rate': 1.2216364467400877e-05, 'epoch': 0.89} {'loss': 0.671, 'learning_rate': 1.2216036844472189e-05, 'epoch': 0.89} {'loss': 0.66, 'learning_rate': 1.2215709219042016e-05, 'epoch': 0.89} {'loss': 0.5926, 'learning_rate': 1.2215381591110729e-05, 'epoch': 0.89} {'loss': 0.6869, 'learning_rate': 1.2215053960678698e-05, 'epoch': 0.89} {'loss': 0.4693, 'learning_rate': 1.2214726327746292e-05, 'epoch': 0.89} {'loss': 0.4634, 'learning_rate': 1.2214398692313883e-05, 'epoch': 0.89} {'loss': 0.5394, 'learning_rate': 1.2214071054381837e-05, 'epoch': 0.89} {'loss': 0.6149, 'learning_rate': 1.2213743413950525e-05, 'epoch': 0.89} {'loss': 0.7187, 'learning_rate': 1.221341577102032e-05, 'epoch': 0.89} {'loss': 0.4826, 'learning_rate': 1.2213088125591588e-05, 'epoch': 0.89} {'loss': 0.6235, 'learning_rate': 1.22127604776647e-05, 'epoch': 0.89} {'loss': 0.6077, 'learning_rate': 1.2212432827240031e-05, 'epoch': 0.89} {'loss': 0.7058, 'learning_rate': 1.221210517431794e-05, 'epoch': 0.89} {'loss': 0.5124, 'learning_rate': 1.2211777518898807e-05, 'epoch': 0.89} {'loss': 0.608, 'learning_rate': 1.2211449860982994e-05, 'epoch': 0.89} {'loss': 0.568, 'learning_rate': 1.2211122200570877e-05, 'epoch': 0.89} {'loss': 0.7295, 'learning_rate': 1.2210794537662822e-05, 'epoch': 0.89} {'loss': 0.4962, 'learning_rate': 1.2210466872259201e-05, 'epoch': 0.89} {'loss': 0.5626, 'learning_rate': 1.2210139204360383e-05, 'epoch': 0.89} {'loss': 0.4335, 'learning_rate': 1.220981153396674e-05, 'epoch': 0.89} {'loss': 0.5795, 'learning_rate': 1.220948386107864e-05, 'epoch': 0.89} {'loss': 0.6298, 'learning_rate': 1.2209156185696449e-05, 'epoch': 0.89} {'loss': 0.6059, 'learning_rate': 1.2208828507820542e-05, 'epoch': 0.89} {'loss': 0.4926, 'learning_rate': 1.220850082745129e-05, 'epoch': 0.89} {'loss': 0.6097, 'learning_rate': 1.2208173144589062e-05, 'epoch': 0.89} {'loss': 0.5423, 'learning_rate': 1.2207845459234225e-05, 'epoch': 0.89} {'loss': 0.5938, 'learning_rate': 1.2207517771387145e-05, 'epoch': 0.89} {'loss': 0.5144, 'learning_rate': 1.2207190081048202e-05, 'epoch': 0.89} {'loss': 0.3833, 'learning_rate': 1.2206862388217759e-05, 'epoch': 0.89} {'loss': 0.4629, 'learning_rate': 1.220653469289619e-05, 'epoch': 0.89} {'loss': 0.5598, 'learning_rate': 1.2206206995083862e-05, 'epoch': 0.89} {'loss': 0.6111, 'learning_rate': 1.2205879294781147e-05, 'epoch': 0.89} {'loss': 0.5741, 'learning_rate': 1.2205551591988415e-05, 'epoch': 0.89} {'loss': 0.6806, 'learning_rate': 1.220522388670603e-05, 'epoch': 0.89} {'loss': 0.5688, 'learning_rate': 1.2204896178934368e-05, 'epoch': 0.89} {'loss': 0.5012, 'learning_rate': 1.2204568468673803e-05, 'epoch': 0.89} {'loss': 0.5717, 'learning_rate': 1.2204240755924695e-05, 'epoch': 0.89} {'loss': 0.6403, 'learning_rate': 1.2203913040687418e-05, 'epoch': 0.89} {'loss': 0.5341, 'learning_rate': 1.2203585322962343e-05, 'epoch': 0.89} {'loss': 0.5842, 'learning_rate': 1.2203257602749839e-05, 'epoch': 0.89} {'loss': 0.6308, 'learning_rate': 1.2202929880050275e-05, 'epoch': 0.89} {'loss': 0.4326, 'learning_rate': 1.2202602154864023e-05, 'epoch': 0.89} {'loss': 0.5254, 'learning_rate': 1.2202274427191452e-05, 'epoch': 0.89} {'loss': 0.5028, 'learning_rate': 1.2201946697032931e-05, 'epoch': 0.89} {'loss': 0.5626, 'learning_rate': 1.2201618964388833e-05, 'epoch': 0.89} {'loss': 0.6493, 'learning_rate': 1.2201291229259525e-05, 'epoch': 0.89} {'loss': 0.5331, 'learning_rate': 1.2200963491645376e-05, 'epoch': 0.89} {'loss': 0.5009, 'learning_rate': 1.2200635751546761e-05, 'epoch': 0.89} {'loss': 0.4968, 'learning_rate': 1.2200308008964047e-05, 'epoch': 0.89} {'loss': 0.5707, 'learning_rate': 1.2199980263897601e-05, 'epoch': 0.89} {'loss': 0.6263, 'learning_rate': 1.2199652516347798e-05, 'epoch': 0.89} {'loss': 0.5719, 'learning_rate': 1.2199324766315004e-05, 'epoch': 0.89} {'loss': 0.432, 'learning_rate': 1.219899701379959e-05, 'epoch': 0.89} {'loss': 0.5409, 'learning_rate': 1.2198669258801927e-05, 'epoch': 0.89} {'loss': 0.5354, 'learning_rate': 1.2198341501322384e-05, 'epoch': 0.89} {'loss': 0.6151, 'learning_rate': 1.2198013741361331e-05, 'epoch': 0.89} {'loss': 0.6059, 'learning_rate': 1.219768597891914e-05, 'epoch': 0.89} {'loss': 0.7085, 'learning_rate': 1.219735821399618e-05, 'epoch': 0.89} {'loss': 0.5027, 'learning_rate': 1.219703044659282e-05, 'epoch': 0.89} {'loss': 0.5614, 'learning_rate': 1.219670267670943e-05, 'epoch': 0.89} {'loss': 0.5919, 'learning_rate': 1.2196374904346379e-05, 'epoch': 0.89} {'loss': 0.5709, 'learning_rate': 1.2196047129504041e-05, 'epoch': 0.89} {'loss': 0.4218, 'learning_rate': 1.2195719352182782e-05, 'epoch': 0.89} {'loss': 0.6183, 'learning_rate': 1.2195391572382974e-05, 'epoch': 0.89} {'loss': 0.5148, 'learning_rate': 1.2195063790104986e-05, 'epoch': 0.89} {'loss': 0.5578, 'learning_rate': 1.2194736005349188e-05, 'epoch': 0.89} {'loss': 0.5726, 'learning_rate': 1.2194408218115949e-05, 'epoch': 0.89} {'loss': 0.6629, 'learning_rate': 1.2194080428405642e-05, 'epoch': 0.89} {'loss': 0.6494, 'learning_rate': 1.2193752636218636e-05, 'epoch': 0.89} {'loss': 0.5661, 'learning_rate': 1.2193424841555299e-05, 'epoch': 0.89} {'loss': 0.7177, 'learning_rate': 1.2193097044416004e-05, 'epoch': 0.89} {'loss': 0.5839, 'learning_rate': 1.2192769244801119e-05, 'epoch': 0.89} {'loss': 0.6365, 'learning_rate': 1.2192441442711014e-05, 'epoch': 0.89} {'loss': 0.6389, 'learning_rate': 1.219211363814606e-05, 'epoch': 0.89} {'loss': 0.513, 'learning_rate': 1.2191785831106629e-05, 'epoch': 0.89} {'loss': 0.6605, 'learning_rate': 1.219145802159308e-05, 'epoch': 0.89} {'loss': 0.4481, 'learning_rate': 1.2191130209605799e-05, 'epoch': 0.89} {'loss': 0.5523, 'learning_rate': 1.2190802395145146e-05, 'epoch': 0.89} {'loss': 0.5649, 'learning_rate': 1.2190474578211497e-05, 'epoch': 0.89} {'loss': 0.5424, 'learning_rate': 1.2190146758805217e-05, 'epoch': 0.89} {'loss': 0.6433, 'learning_rate': 1.2189818936926676e-05, 'epoch': 0.89} {'loss': 0.6107, 'learning_rate': 1.2189491112576248e-05, 'epoch': 0.89} {'loss': 0.6889, 'learning_rate': 1.21891632857543e-05, 'epoch': 0.89} {'loss': 0.4912, 'learning_rate': 1.2188835456461203e-05, 'epoch': 0.89} {'loss': 0.5186, 'learning_rate': 1.2188507624697328e-05, 'epoch': 0.89} {'loss': 0.5456, 'learning_rate': 1.2188179790463044e-05, 'epoch': 0.9} {'loss': 0.6105, 'learning_rate': 1.218785195375872e-05, 'epoch': 0.9} {'loss': 0.566, 'learning_rate': 1.2187524114584729e-05, 'epoch': 0.9} {'loss': 0.5958, 'learning_rate': 1.2187196272941436e-05, 'epoch': 0.9} {'loss': 0.5013, 'learning_rate': 1.2186868428829214e-05, 'epoch': 0.9} {'loss': 0.4975, 'learning_rate': 1.2186540582248436e-05, 'epoch': 0.9} {'loss': 0.6165, 'learning_rate': 1.218621273319947e-05, 'epoch': 0.9} {'loss': 0.5413, 'learning_rate': 1.2185884881682684e-05, 'epoch': 0.9} {'loss': 0.5885, 'learning_rate': 1.218555702769845e-05, 'epoch': 0.9} {'loss': 0.5065, 'learning_rate': 1.2185229171247137e-05, 'epoch': 0.9} {'loss': 0.5476, 'learning_rate': 1.2184901312329115e-05, 'epoch': 0.9} {'loss': 0.6023, 'learning_rate': 1.2184573450944759e-05, 'epoch': 0.9} {'loss': 0.6269, 'learning_rate': 1.2184245587094434e-05, 'epoch': 0.9} {'loss': 0.553, 'learning_rate': 1.2183917720778509e-05, 'epoch': 0.9} {'loss': 0.6534, 'learning_rate': 1.2183589851997358e-05, 'epoch': 0.9} {'loss': 0.5848, 'learning_rate': 1.2183261980751346e-05, 'epoch': 0.9} {'loss': 0.5039, 'learning_rate': 1.2182934107040849e-05, 'epoch': 0.9} {'loss': 0.4994, 'learning_rate': 1.2182606230866233e-05, 'epoch': 0.9} {'loss': 0.7037, 'learning_rate': 1.2182278352227872e-05, 'epoch': 0.9} {'loss': 0.5232, 'learning_rate': 1.2181950471126132e-05, 'epoch': 0.9} {'loss': 0.5359, 'learning_rate': 1.2181622587561384e-05, 'epoch': 0.9} {'loss': 0.4937, 'learning_rate': 1.2181294701534002e-05, 'epoch': 0.9} {'loss': 0.5563, 'learning_rate': 1.2180966813044349e-05, 'epoch': 0.9} {'loss': 0.3735, 'learning_rate': 1.2180638922092803e-05, 'epoch': 0.9} {'loss': 0.6216, 'learning_rate': 1.2180311028679727e-05, 'epoch': 0.9} {'loss': 0.4921, 'learning_rate': 1.2179983132805495e-05, 'epoch': 0.9} {'loss': 0.7517, 'learning_rate': 1.217965523447048e-05, 'epoch': 0.9} {'loss': 0.3792, 'learning_rate': 1.2179327333675046e-05, 'epoch': 0.9} {'loss': 0.579, 'learning_rate': 1.2178999430419567e-05, 'epoch': 0.9} {'loss': 0.7352, 'learning_rate': 1.217867152470441e-05, 'epoch': 0.9} {'loss': 0.6039, 'learning_rate': 1.2178343616529948e-05, 'epoch': 0.9} {'loss': 0.6006, 'learning_rate': 1.217801570589655e-05, 'epoch': 0.9} {'loss': 0.6083, 'learning_rate': 1.2177687792804588e-05, 'epoch': 0.9} {'loss': 0.8284, 'learning_rate': 1.2177359877254431e-05, 'epoch': 0.9} {'loss': 0.6666, 'learning_rate': 1.2177031959246446e-05, 'epoch': 0.9} {'loss': 0.5273, 'learning_rate': 1.217670403878101e-05, 'epoch': 0.9} {'loss': 0.5513, 'learning_rate': 1.2176376115858483e-05, 'epoch': 0.9} {'loss': 0.6734, 'learning_rate': 1.2176048190479246e-05, 'epoch': 0.9} {'loss': 0.6181, 'learning_rate': 1.2175720262643662e-05, 'epoch': 0.9} {'loss': 0.5416, 'learning_rate': 1.2175392332352107e-05, 'epoch': 0.9} {'loss': 0.6511, 'learning_rate': 1.2175064399604943e-05, 'epoch': 0.9} {'loss': 0.4353, 'learning_rate': 1.2174736464402548e-05, 'epoch': 0.9} {'loss': 0.5169, 'learning_rate': 1.2174408526745287e-05, 'epoch': 0.9} {'loss': 0.5684, 'learning_rate': 1.2174080586633535e-05, 'epoch': 0.9} {'loss': 0.6177, 'learning_rate': 1.2173752644067655e-05, 'epoch': 0.9} {'loss': 0.4831, 'learning_rate': 1.2173424699048026e-05, 'epoch': 0.9} {'loss': 0.7426, 'learning_rate': 1.2173096751575014e-05, 'epoch': 0.9} {'loss': 0.669, 'learning_rate': 1.2172768801648987e-05, 'epoch': 0.9} {'loss': 0.5216, 'learning_rate': 1.2172440849270317e-05, 'epoch': 0.9} {'loss': 0.7836, 'learning_rate': 1.2172112894439377e-05, 'epoch': 0.9} {'loss': 0.5664, 'learning_rate': 1.2171784937156532e-05, 'epoch': 0.9} {'loss': 0.5579, 'learning_rate': 1.2171456977422157e-05, 'epoch': 0.9} {'loss': 0.5216, 'learning_rate': 1.2171129015236615e-05, 'epoch': 0.9} {'loss': 0.576, 'learning_rate': 1.2170801050600284e-05, 'epoch': 0.9} {'loss': 0.5933, 'learning_rate': 1.2170473083513535e-05, 'epoch': 0.9} {'loss': 0.5354, 'learning_rate': 1.217014511397673e-05, 'epoch': 0.9} {'loss': 0.519, 'learning_rate': 1.2169817141990245e-05, 'epoch': 0.9} {'loss': 0.4723, 'learning_rate': 1.216948916755445e-05, 'epoch': 0.9} {'loss': 0.3879, 'learning_rate': 1.2169161190669714e-05, 'epoch': 0.9} {'loss': 0.6668, 'learning_rate': 1.2168833211336406e-05, 'epoch': 0.9} {'loss': 0.5364, 'learning_rate': 1.21685052295549e-05, 'epoch': 0.9} {'loss': 0.5666, 'learning_rate': 1.2168177245325562e-05, 'epoch': 0.9} {'loss': 0.549, 'learning_rate': 1.2167849258648767e-05, 'epoch': 0.9} {'loss': 0.708, 'learning_rate': 1.216752126952488e-05, 'epoch': 0.9} {'loss': 0.6456, 'learning_rate': 1.2167193277954275e-05, 'epoch': 0.9} {'loss': 0.4543, 'learning_rate': 1.2166865283937319e-05, 'epoch': 0.9} {'loss': 0.7019, 'learning_rate': 1.2166537287474386e-05, 'epoch': 0.9} {'loss': 0.6803, 'learning_rate': 1.2166209288565843e-05, 'epoch': 0.9} {'loss': 0.4871, 'learning_rate': 1.2165881287212062e-05, 'epoch': 0.9} {'loss': 0.5766, 'learning_rate': 1.2165553283413413e-05, 'epoch': 0.9} {'loss': 0.5594, 'learning_rate': 1.2165225277170266e-05, 'epoch': 0.9} {'loss': 0.6465, 'learning_rate': 1.2164897268482991e-05, 'epoch': 0.9} {'loss': 0.6526, 'learning_rate': 1.2164569257351961e-05, 'epoch': 0.9} {'loss': 0.5501, 'learning_rate': 1.216424124377754e-05, 'epoch': 0.9} {'loss': 0.6229, 'learning_rate': 1.2163913227760107e-05, 'epoch': 0.9} {'loss': 0.4955, 'learning_rate': 1.2163585209300026e-05, 'epoch': 0.9} {'loss': 0.6515, 'learning_rate': 1.2163257188397668e-05, 'epoch': 0.9} {'loss': 0.7008, 'learning_rate': 1.2162929165053404e-05, 'epoch': 0.9} {'loss': 0.4674, 'learning_rate': 1.2162601139267603e-05, 'epoch': 0.9} {'loss': 0.6198, 'learning_rate': 1.2162273111040637e-05, 'epoch': 0.9} {'loss': 0.6068, 'learning_rate': 1.2161945080372877e-05, 'epoch': 0.9} {'loss': 0.4759, 'learning_rate': 1.2161617047264691e-05, 'epoch': 0.9} {'loss': 0.5561, 'learning_rate': 1.2161289011716451e-05, 'epoch': 0.9} {'loss': 0.469, 'learning_rate': 1.2160960973728525e-05, 'epoch': 0.9} {'loss': 0.55, 'learning_rate': 1.2160632933301287e-05, 'epoch': 0.9} {'loss': 0.729, 'learning_rate': 1.2160304890435104e-05, 'epoch': 0.9} {'loss': 0.6122, 'learning_rate': 1.2159976845130348e-05, 'epoch': 0.9} {'loss': 0.6324, 'learning_rate': 1.2159648797387388e-05, 'epoch': 0.9} {'loss': 0.608, 'learning_rate': 1.21593207472066e-05, 'epoch': 0.9} {'loss': 0.5375, 'learning_rate': 1.2158992694588348e-05, 'epoch': 0.9} {'loss': 0.7122, 'learning_rate': 1.2158664639532998e-05, 'epoch': 0.9} {'loss': 0.6837, 'learning_rate': 1.2158336582040931e-05, 'epoch': 0.9} {'loss': 0.5563, 'learning_rate': 1.215800852211251e-05, 'epoch': 0.9} {'loss': 0.6915, 'learning_rate': 1.2157680459748109e-05, 'epoch': 0.9} {'loss': 0.5597, 'learning_rate': 1.2157352394948097e-05, 'epoch': 0.9} {'loss': 0.4414, 'learning_rate': 1.2157024327712842e-05, 'epoch': 0.9} {'loss': 0.5982, 'learning_rate': 1.2156696258042722e-05, 'epoch': 0.9} {'loss': 0.5221, 'learning_rate': 1.2156368185938096e-05, 'epoch': 0.9} {'loss': 0.6713, 'learning_rate': 1.2156040111399345e-05, 'epoch': 0.9} {'loss': 0.6187, 'learning_rate': 1.2155712034426837e-05, 'epoch': 0.9} {'loss': 0.5827, 'learning_rate': 1.2155383955020934e-05, 'epoch': 0.9} {'loss': 0.4182, 'learning_rate': 1.2155055873182015e-05, 'epoch': 0.9} {'loss': 0.3569, 'learning_rate': 1.2154727788910447e-05, 'epoch': 0.9} {'loss': 0.4721, 'learning_rate': 1.2154399702206602e-05, 'epoch': 0.9} {'loss': 0.4785, 'learning_rate': 1.2154071613070848e-05, 'epoch': 0.9} {'loss': 0.4669, 'learning_rate': 1.2153743521503559e-05, 'epoch': 0.9} {'loss': 0.7082, 'learning_rate': 1.21534154275051e-05, 'epoch': 0.9} {'loss': 0.6695, 'learning_rate': 1.2153087331075848e-05, 'epoch': 0.9} {'loss': 0.3707, 'learning_rate': 1.2152759232216167e-05, 'epoch': 0.9} {'loss': 0.5294, 'learning_rate': 1.2152431130926432e-05, 'epoch': 0.9} {'loss': 0.4289, 'learning_rate': 1.215210302720701e-05, 'epoch': 0.9} {'loss': 0.4191, 'learning_rate': 1.2151774921058272e-05, 'epoch': 0.9} {'loss': 0.5365, 'learning_rate': 1.2151446812480594e-05, 'epoch': 0.9} {'loss': 0.7075, 'learning_rate': 1.2151118701474339e-05, 'epoch': 0.9} {'loss': 0.6737, 'learning_rate': 1.215079058803988e-05, 'epoch': 0.9} {'loss': 0.5118, 'learning_rate': 1.2150462472177586e-05, 'epoch': 0.9} {'loss': 0.5495, 'learning_rate': 1.215013435388783e-05, 'epoch': 0.9} {'loss': 0.6282, 'learning_rate': 1.2149806233170982e-05, 'epoch': 0.9} {'loss': 0.3798, 'learning_rate': 1.214947811002741e-05, 'epoch': 0.9} {'loss': 0.5495, 'learning_rate': 1.2149149984457486e-05, 'epoch': 0.9} {'loss': 0.3823, 'learning_rate': 1.2148821856461581e-05, 'epoch': 0.9} {'loss': 0.7155, 'learning_rate': 1.2148493726040066e-05, 'epoch': 0.9} {'loss': 0.5864, 'learning_rate': 1.2148165593193308e-05, 'epoch': 0.9} {'loss': 0.6881, 'learning_rate': 1.214783745792168e-05, 'epoch': 0.9} {'loss': 0.7311, 'learning_rate': 1.2147509320225552e-05, 'epoch': 0.9} {'loss': 0.6527, 'learning_rate': 1.21471811801053e-05, 'epoch': 0.9} {'loss': 0.5812, 'learning_rate': 1.2146853037561282e-05, 'epoch': 0.9} {'loss': 0.554, 'learning_rate': 1.2146524892593876e-05, 'epoch': 0.9} {'loss': 0.5567, 'learning_rate': 1.214619674520345e-05, 'epoch': 0.9} {'loss': 0.6763, 'learning_rate': 1.214586859539038e-05, 'epoch': 0.9} {'loss': 0.4758, 'learning_rate': 1.2145540443155031e-05, 'epoch': 0.9} {'loss': 0.5932, 'learning_rate': 1.2145212288497775e-05, 'epoch': 0.9} {'loss': 0.5185, 'learning_rate': 1.2144884131418979e-05, 'epoch': 0.9} {'loss': 0.706, 'learning_rate': 1.2144555971919022e-05, 'epoch': 0.9} {'loss': 0.4207, 'learning_rate': 1.2144227809998263e-05, 'epoch': 0.9} {'loss': 0.372, 'learning_rate': 1.2143899645657084e-05, 'epoch': 0.9} {'loss': 0.5857, 'learning_rate': 1.2143571478895848e-05, 'epoch': 0.9} {'loss': 0.4698, 'learning_rate': 1.2143243309714927e-05, 'epoch': 0.9} {'loss': 0.6278, 'learning_rate': 1.2142915138114695e-05, 'epoch': 0.9} {'loss': 0.658, 'learning_rate': 1.2142586964095512e-05, 'epoch': 0.9} {'loss': 0.5825, 'learning_rate': 1.2142258787657761e-05, 'epoch': 0.9} {'loss': 0.4578, 'learning_rate': 1.2141930608801807e-05, 'epoch': 0.9} {'loss': 0.5078, 'learning_rate': 1.2141602427528021e-05, 'epoch': 0.9} {'loss': 0.5548, 'learning_rate': 1.2141274243836771e-05, 'epoch': 0.9} {'loss': 0.713, 'learning_rate': 1.2140946057728431e-05, 'epoch': 0.9} {'loss': 0.6466, 'learning_rate': 1.214061786920337e-05, 'epoch': 0.9} {'loss': 0.6502, 'learning_rate': 1.2140289678261959e-05, 'epoch': 0.9} {'loss': 0.6161, 'learning_rate': 1.2139961484904565e-05, 'epoch': 0.9} {'loss': 0.4037, 'learning_rate': 1.2139633289131568e-05, 'epoch': 0.9} {'loss': 0.5412, 'learning_rate': 1.2139305090943327e-05, 'epoch': 0.9} {'loss': 0.7519, 'learning_rate': 1.2138976890340217e-05, 'epoch': 0.9} {'loss': 0.4328, 'learning_rate': 1.2138648687322609e-05, 'epoch': 0.9} {'loss': 0.6597, 'learning_rate': 1.2138320481890876e-05, 'epoch': 0.9} {'loss': 0.5343, 'learning_rate': 1.2137992274045383e-05, 'epoch': 0.9} {'loss': 0.4669, 'learning_rate': 1.2137664063786504e-05, 'epoch': 0.9} {'loss': 0.4267, 'learning_rate': 1.2137335851114608e-05, 'epoch': 0.9} {'loss': 0.4429, 'learning_rate': 1.2137007636030067e-05, 'epoch': 0.9} {'loss': 0.699, 'learning_rate': 1.2136679418533253e-05, 'epoch': 0.9} {'loss': 0.5463, 'learning_rate': 1.2136351198624529e-05, 'epoch': 0.9} {'loss': 0.5532, 'learning_rate': 1.2136022976304275e-05, 'epoch': 0.9} {'loss': 0.7403, 'learning_rate': 1.2135694751572858e-05, 'epoch': 0.9} {'loss': 0.4526, 'learning_rate': 1.2135366524430645e-05, 'epoch': 0.9} {'loss': 0.6217, 'learning_rate': 1.2135038294878012e-05, 'epoch': 0.9} {'loss': 0.3279, 'learning_rate': 1.2134710062915325e-05, 'epoch': 0.9} {'loss': 0.6038, 'learning_rate': 1.2134381828542957e-05, 'epoch': 0.9} {'loss': 0.4688, 'learning_rate': 1.2134053591761277e-05, 'epoch': 0.9} {'loss': 0.7373, 'learning_rate': 1.2133725352570656e-05, 'epoch': 0.9} {'loss': 0.5559, 'learning_rate': 1.2133397110971463e-05, 'epoch': 0.9} {'loss': 0.555, 'learning_rate': 1.2133068866964073e-05, 'epoch': 0.9} {'loss': 0.3119, 'learning_rate': 1.2132740620548852e-05, 'epoch': 0.9} {'loss': 0.6176, 'learning_rate': 1.2132412371726176e-05, 'epoch': 0.9} {'loss': 0.4839, 'learning_rate': 1.213208412049641e-05, 'epoch': 0.9} {'loss': 0.4256, 'learning_rate': 1.2131755866859925e-05, 'epoch': 0.9} {'loss': 0.6091, 'learning_rate': 1.2131427610817094e-05, 'epoch': 0.9} {'loss': 0.5639, 'learning_rate': 1.2131099352368288e-05, 'epoch': 0.9} {'loss': 0.5283, 'learning_rate': 1.2130771091513875e-05, 'epoch': 0.9} {'loss': 0.6423, 'learning_rate': 1.2130442828254227e-05, 'epoch': 0.9} {'loss': 0.5935, 'learning_rate': 1.2130114562589715e-05, 'epoch': 0.9} {'loss': 0.5481, 'learning_rate': 1.2129786294520705e-05, 'epoch': 0.9} {'loss': 0.5643, 'learning_rate': 1.2129458024047573e-05, 'epoch': 0.9} {'loss': 0.6609, 'learning_rate': 1.212912975117069e-05, 'epoch': 0.9} {'loss': 0.632, 'learning_rate': 1.2128801475890422e-05, 'epoch': 0.9} {'loss': 0.5763, 'learning_rate': 1.2128473198207143e-05, 'epoch': 0.9} {'loss': 0.5254, 'learning_rate': 1.2128144918121221e-05, 'epoch': 0.9} {'loss': 0.5988, 'learning_rate': 1.2127816635633029e-05, 'epoch': 0.9} {'loss': 0.5412, 'learning_rate': 1.2127488350742937e-05, 'epoch': 0.9} {'loss': 0.4836, 'learning_rate': 1.2127160063451315e-05, 'epoch': 0.9} {'loss': 0.5105, 'learning_rate': 1.2126831773758535e-05, 'epoch': 0.9} {'loss': 0.4315, 'learning_rate': 1.2126503481664967e-05, 'epoch': 0.9} {'loss': 0.7514, 'learning_rate': 1.2126175187170977e-05, 'epoch': 0.9} {'loss': 0.5279, 'learning_rate': 1.2125846890276943e-05, 'epoch': 0.9} {'loss': 0.5785, 'learning_rate': 1.212551859098323e-05, 'epoch': 0.9} {'loss': 0.5826, 'learning_rate': 1.212519028929021e-05, 'epoch': 0.9} {'loss': 0.6647, 'learning_rate': 1.2124861985198258e-05, 'epoch': 0.9} {'loss': 0.7213, 'learning_rate': 1.2124533678707737e-05, 'epoch': 0.9} {'loss': 0.5964, 'learning_rate': 1.2124205369819022e-05, 'epoch': 0.9} {'loss': 0.5515, 'learning_rate': 1.2123877058532485e-05, 'epoch': 0.9} {'loss': 0.6633, 'learning_rate': 1.2123548744848495e-05, 'epoch': 0.9} {'loss': 0.5442, 'learning_rate': 1.2123220428767421e-05, 'epoch': 0.9} {'loss': 0.6564, 'learning_rate': 1.2122892110289636e-05, 'epoch': 0.9} {'loss': 0.5669, 'learning_rate': 1.2122563789415508e-05, 'epoch': 0.9} {'loss': 0.5283, 'learning_rate': 1.212223546614541e-05, 'epoch': 0.9} {'loss': 0.6343, 'learning_rate': 1.2121907140479712e-05, 'epoch': 0.9} {'loss': 0.5681, 'learning_rate': 1.2121578812418784e-05, 'epoch': 0.9} {'loss': 0.7787, 'learning_rate': 1.2121250481962996e-05, 'epoch': 0.9} {'loss': 0.5227, 'learning_rate': 1.212092214911272e-05, 'epoch': 0.9} {'loss': 0.5416, 'learning_rate': 1.2120593813868327e-05, 'epoch': 0.9} {'loss': 0.6267, 'learning_rate': 1.2120265476230186e-05, 'epoch': 0.9} {'loss': 0.6759, 'learning_rate': 1.211993713619867e-05, 'epoch': 0.9} {'loss': 0.6209, 'learning_rate': 1.2119608793774145e-05, 'epoch': 0.9} {'loss': 0.6911, 'learning_rate': 1.2119280448956988e-05, 'epoch': 0.9} {'loss': 0.736, 'learning_rate': 1.2118952101747565e-05, 'epoch': 0.9} {'loss': 0.5215, 'learning_rate': 1.2118623752146249e-05, 'epoch': 0.9} {'loss': 0.5574, 'learning_rate': 1.2118295400153408e-05, 'epoch': 0.9} {'loss': 0.4904, 'learning_rate': 1.2117967045769415e-05, 'epoch': 0.9} {'loss': 0.4621, 'learning_rate': 1.2117638688994639e-05, 'epoch': 0.9} {'loss': 0.5075, 'learning_rate': 1.2117310329829453e-05, 'epoch': 0.9} {'loss': 0.3911, 'learning_rate': 1.2116981968274227e-05, 'epoch': 0.9} {'loss': 0.5598, 'learning_rate': 1.211665360432933e-05, 'epoch': 0.9} {'loss': 0.4903, 'learning_rate': 1.2116325237995133e-05, 'epoch': 0.9} {'loss': 0.5824, 'learning_rate': 1.2115996869272007e-05, 'epoch': 0.9} {'loss': 0.6597, 'learning_rate': 1.2115668498160323e-05, 'epoch': 0.9} {'loss': 0.4259, 'learning_rate': 1.2115340124660453e-05, 'epoch': 0.9} {'loss': 0.4095, 'learning_rate': 1.2115011748772765e-05, 'epoch': 0.9} {'loss': 0.4623, 'learning_rate': 1.2114683370497633e-05, 'epoch': 0.9} {'loss': 0.7208, 'learning_rate': 1.2114354989835424e-05, 'epoch': 0.9} {'loss': 0.6112, 'learning_rate': 1.2114026606786508e-05, 'epoch': 0.9} {'loss': 0.4896, 'learning_rate': 1.2113698221351263e-05, 'epoch': 0.9} {'loss': 0.5871, 'learning_rate': 1.2113369833530051e-05, 'epoch': 0.9} {'loss': 0.6418, 'learning_rate': 1.2113041443323246e-05, 'epoch': 0.9} {'loss': 0.3409, 'learning_rate': 1.211271305073122e-05, 'epoch': 0.9} {'loss': 0.5289, 'learning_rate': 1.2112384655754341e-05, 'epoch': 0.9} {'loss': 0.4948, 'learning_rate': 1.2112056258392984e-05, 'epoch': 0.9} {'loss': 0.6977, 'learning_rate': 1.2111727858647517e-05, 'epoch': 0.9} {'loss': 0.5432, 'learning_rate': 1.2111399456518308e-05, 'epoch': 0.9} {'loss': 0.6317, 'learning_rate': 1.2111071052005733e-05, 'epoch': 0.9} {'loss': 0.5606, 'learning_rate': 1.2110742645110161e-05, 'epoch': 0.9} {'loss': 0.4236, 'learning_rate': 1.211041423583196e-05, 'epoch': 0.9} {'loss': 0.5583, 'learning_rate': 1.2110085824171504e-05, 'epoch': 0.9} {'loss': 0.6019, 'learning_rate': 1.2109757410129161e-05, 'epoch': 0.9} {'loss': 0.5947, 'learning_rate': 1.2109428993705304e-05, 'epoch': 0.9} {'loss': 0.6229, 'learning_rate': 1.2109100574900303e-05, 'epoch': 0.9} {'loss': 0.3754, 'learning_rate': 1.2108772153714528e-05, 'epoch': 0.9} {'loss': 0.5466, 'learning_rate': 1.2108443730148349e-05, 'epoch': 0.9} {'loss': 0.5152, 'learning_rate': 1.2108115304202142e-05, 'epoch': 0.9} {'loss': 0.6027, 'learning_rate': 1.2107786875876269e-05, 'epoch': 0.9} {'loss': 0.7232, 'learning_rate': 1.2107458445171107e-05, 'epoch': 0.9} {'loss': 0.4288, 'learning_rate': 1.2107130012087026e-05, 'epoch': 0.9} {'loss': 0.4663, 'learning_rate': 1.21068015766244e-05, 'epoch': 0.9} {'loss': 0.5623, 'learning_rate': 1.210647313878359e-05, 'epoch': 0.9} {'loss': 0.6658, 'learning_rate': 1.2106144698564973e-05, 'epoch': 0.9} {'loss': 0.451, 'learning_rate': 1.2105816255968919e-05, 'epoch': 0.9} {'loss': 0.4574, 'learning_rate': 1.2105487810995799e-05, 'epoch': 0.9} {'loss': 0.5837, 'learning_rate': 1.2105159363645984e-05, 'epoch': 0.9} {'loss': 0.5491, 'learning_rate': 1.2104830913919844e-05, 'epoch': 0.9} {'loss': 0.5247, 'learning_rate': 1.2104502461817753e-05, 'epoch': 0.9} {'loss': 0.7031, 'learning_rate': 1.2104174007340075e-05, 'epoch': 0.9} {'loss': 0.5354, 'learning_rate': 1.2103845550487187e-05, 'epoch': 0.9} {'loss': 0.3641, 'learning_rate': 1.2103517091259459e-05, 'epoch': 0.9} {'loss': 0.4678, 'learning_rate': 1.2103188629657256e-05, 'epoch': 0.9} {'loss': 0.4901, 'learning_rate': 1.2102860165680954e-05, 'epoch': 0.9} {'loss': 0.4917, 'learning_rate': 1.2102531699330926e-05, 'epoch': 0.9} {'loss': 0.7339, 'learning_rate': 1.210220323060754e-05, 'epoch': 0.9} {'loss': 0.4872, 'learning_rate': 1.2101874759511161e-05, 'epoch': 0.9} {'loss': 0.3737, 'learning_rate': 1.2101546286042167e-05, 'epoch': 0.9} {'loss': 0.5598, 'learning_rate': 1.210121781020093e-05, 'epoch': 0.9} {'loss': 0.4539, 'learning_rate': 1.2100889331987812e-05, 'epoch': 0.9} {'loss': 0.43, 'learning_rate': 1.2100560851403193e-05, 'epoch': 0.9} {'loss': 0.5837, 'learning_rate': 1.210023236844744e-05, 'epoch': 0.9} {'loss': 0.4611, 'learning_rate': 1.2099903883120926e-05, 'epoch': 0.9} {'loss': 0.4366, 'learning_rate': 1.2099575395424016e-05, 'epoch': 0.9} {'loss': 0.5155, 'learning_rate': 1.2099246905357087e-05, 'epoch': 0.9} {'loss': 0.4366, 'learning_rate': 1.2098918412920506e-05, 'epoch': 0.9} {'loss': 0.513, 'learning_rate': 1.2098589918114647e-05, 'epoch': 0.9} {'loss': 0.7093, 'learning_rate': 1.2098261420939878e-05, 'epoch': 0.9} {'loss': 0.647, 'learning_rate': 1.2097932921396574e-05, 'epoch': 0.9} {'loss': 0.6347, 'learning_rate': 1.2097604419485098e-05, 'epoch': 0.9} {'loss': 0.8405, 'learning_rate': 1.2097275915205827e-05, 'epoch': 0.9} {'loss': 0.577, 'learning_rate': 1.209694740855913e-05, 'epoch': 0.9} {'loss': 0.5935, 'learning_rate': 1.2096618899545378e-05, 'epoch': 0.9} {'loss': 0.6028, 'learning_rate': 1.2096290388164944e-05, 'epoch': 0.9} {'loss': 0.5119, 'learning_rate': 1.2095961874418194e-05, 'epoch': 0.9} {'loss': 0.6653, 'learning_rate': 1.2095633358305503e-05, 'epoch': 0.9} {'loss': 0.5048, 'learning_rate': 1.209530483982724e-05, 'epoch': 0.9} {'loss': 0.3427, 'learning_rate': 1.2094976318983778e-05, 'epoch': 0.9} {'loss': 0.55, 'learning_rate': 1.2094647795775483e-05, 'epoch': 0.9} {'loss': 0.6221, 'learning_rate': 1.209431927020273e-05, 'epoch': 0.9} {'loss': 0.6605, 'learning_rate': 1.2093990742265892e-05, 'epoch': 0.9} {'loss': 0.433, 'learning_rate': 1.2093662211965333e-05, 'epoch': 0.9} {'loss': 0.5454, 'learning_rate': 1.2093333679301428e-05, 'epoch': 0.9} {'loss': 0.5197, 'learning_rate': 1.2093005144274547e-05, 'epoch': 0.9} {'loss': 0.545, 'learning_rate': 1.2092676606885063e-05, 'epoch': 0.9} {'loss': 0.5232, 'learning_rate': 1.2092348067133344e-05, 'epoch': 0.9} {'loss': 0.3839, 'learning_rate': 1.2092019525019763e-05, 'epoch': 0.9} {'loss': 0.3785, 'learning_rate': 1.2091690980544688e-05, 'epoch': 0.9} {'loss': 0.5096, 'learning_rate': 1.2091362433708493e-05, 'epoch': 0.9} {'loss': 0.6381, 'learning_rate': 1.2091033884511547e-05, 'epoch': 0.9} {'loss': 0.5291, 'learning_rate': 1.209070533295422e-05, 'epoch': 0.9} {'loss': 0.4358, 'learning_rate': 1.2090376779036887e-05, 'epoch': 0.9} {'loss': 0.6788, 'learning_rate': 1.2090048222759917e-05, 'epoch': 0.9} {'loss': 0.4794, 'learning_rate': 1.2089719664123676e-05, 'epoch': 0.9} {'loss': 0.639, 'learning_rate': 1.208939110312854e-05, 'epoch': 0.9} {'loss': 0.5408, 'learning_rate': 1.208906253977488e-05, 'epoch': 0.9} {'loss': 0.5618, 'learning_rate': 1.2088733974063065e-05, 'epoch': 0.9} {'loss': 0.5192, 'learning_rate': 1.2088405405993466e-05, 'epoch': 0.9} {'loss': 0.5834, 'learning_rate': 1.2088076835566455e-05, 'epoch': 0.9} {'loss': 0.4773, 'learning_rate': 1.2087748262782405e-05, 'epoch': 0.9} {'loss': 0.6185, 'learning_rate': 1.208741968764168e-05, 'epoch': 0.9} {'loss': 0.5887, 'learning_rate': 1.2087091110144655e-05, 'epoch': 0.9} {'loss': 0.4991, 'learning_rate': 1.2086762530291702e-05, 'epoch': 0.9} {'loss': 0.6098, 'learning_rate': 1.2086433948083194e-05, 'epoch': 0.9} {'loss': 0.4581, 'learning_rate': 1.2086105363519498e-05, 'epoch': 0.9} {'loss': 0.4091, 'learning_rate': 1.2085776776600983e-05, 'epoch': 0.9} {'loss': 0.5306, 'learning_rate': 1.2085448187328024e-05, 'epoch': 0.9} {'loss': 0.4745, 'learning_rate': 1.2085119595700992e-05, 'epoch': 0.9} {'loss': 0.4678, 'learning_rate': 1.2084791001720253e-05, 'epoch': 0.9} {'loss': 0.5256, 'learning_rate': 1.2084462405386184e-05, 'epoch': 0.9} {'loss': 0.647, 'learning_rate': 1.2084133806699151e-05, 'epoch': 0.9} {'loss': 0.3887, 'learning_rate': 1.2083805205659528e-05, 'epoch': 0.9} {'loss': 0.5815, 'learning_rate': 1.2083476602267688e-05, 'epoch': 0.9} {'loss': 0.7028, 'learning_rate': 1.2083147996523996e-05, 'epoch': 0.9} {'loss': 0.4667, 'learning_rate': 1.2082819388428828e-05, 'epoch': 0.9} {'loss': 0.5207, 'learning_rate': 1.2082490777982551e-05, 'epoch': 0.9} {'loss': 0.6584, 'learning_rate': 1.208216216518554e-05, 'epoch': 0.9} {'loss': 0.6048, 'learning_rate': 1.2081833550038165e-05, 'epoch': 0.9} {'loss': 0.5884, 'learning_rate': 1.2081504932540793e-05, 'epoch': 0.9} {'loss': 0.499, 'learning_rate': 1.2081176312693798e-05, 'epoch': 0.9} {'loss': 0.5339, 'learning_rate': 1.2080847690497552e-05, 'epoch': 0.9} {'loss': 0.56, 'learning_rate': 1.2080519065952422e-05, 'epoch': 0.9} {'loss': 0.5723, 'learning_rate': 1.2080190439058785e-05, 'epoch': 0.9} {'loss': 0.581, 'learning_rate': 1.2079861809817006e-05, 'epoch': 0.9} {'loss': 0.5419, 'learning_rate': 1.207953317822746e-05, 'epoch': 0.9} {'loss': 0.576, 'learning_rate': 1.2079204544290514e-05, 'epoch': 0.9} {'loss': 0.6119, 'learning_rate': 1.2078875908006545e-05, 'epoch': 0.9} {'loss': 0.4668, 'learning_rate': 1.2078547269375918e-05, 'epoch': 0.9} {'loss': 0.4821, 'learning_rate': 1.2078218628399008e-05, 'epoch': 0.9} {'loss': 0.6212, 'learning_rate': 1.2077889985076183e-05, 'epoch': 0.9} {'loss': 0.5511, 'learning_rate': 1.2077561339407817e-05, 'epoch': 0.9} {'loss': 0.6123, 'learning_rate': 1.2077232691394278e-05, 'epoch': 0.9} {'loss': 0.6053, 'learning_rate': 1.2076904041035938e-05, 'epoch': 0.9} {'loss': 0.5744, 'learning_rate': 1.207657538833317e-05, 'epoch': 0.9} {'loss': 0.5905, 'learning_rate': 1.2076246733286342e-05, 'epoch': 0.9} {'loss': 0.3469, 'learning_rate': 1.2075918075895826e-05, 'epoch': 0.9} {'loss': 0.4525, 'learning_rate': 1.2075589416161993e-05, 'epoch': 0.9} {'loss': 0.5942, 'learning_rate': 1.2075260754085215e-05, 'epoch': 0.9} {'loss': 0.3908, 'learning_rate': 1.207493208966586e-05, 'epoch': 0.9} {'loss': 0.6785, 'learning_rate': 1.2074603422904304e-05, 'epoch': 0.9} {'loss': 0.4996, 'learning_rate': 1.2074274753800916e-05, 'epoch': 0.9} {'loss': 0.4625, 'learning_rate': 1.2073946082356065e-05, 'epoch': 0.9} {'loss': 0.5143, 'learning_rate': 1.2073617408570122e-05, 'epoch': 0.9} {'loss': 0.4005, 'learning_rate': 1.207328873244346e-05, 'epoch': 0.9} {'loss': 0.6326, 'learning_rate': 1.207296005397645e-05, 'epoch': 0.9} {'loss': 0.6904, 'learning_rate': 1.207263137316946e-05, 'epoch': 0.9} {'loss': 0.5263, 'learning_rate': 1.2072302690022868e-05, 'epoch': 0.9} {'loss': 0.5675, 'learning_rate': 1.2071974004537037e-05, 'epoch': 0.9} {'loss': 0.6366, 'learning_rate': 1.2071645316712342e-05, 'epoch': 0.9} {'loss': 0.5109, 'learning_rate': 1.2071316626549153e-05, 'epoch': 0.9} {'loss': 0.6133, 'learning_rate': 1.207098793404784e-05, 'epoch': 0.9} {'loss': 0.5512, 'learning_rate': 1.2070659239208778e-05, 'epoch': 0.9} {'loss': 0.4299, 'learning_rate': 1.2070330542032333e-05, 'epoch': 0.9} {'loss': 0.6596, 'learning_rate': 1.2070001842518884e-05, 'epoch': 0.9} {'loss': 0.5437, 'learning_rate': 1.2069673140668791e-05, 'epoch': 0.9} {'loss': 0.5973, 'learning_rate': 1.2069344436482432e-05, 'epoch': 0.9} {'loss': 0.6046, 'learning_rate': 1.2069015729960179e-05, 'epoch': 0.9} {'loss': 0.5911, 'learning_rate': 1.2068687021102397e-05, 'epoch': 0.9} {'loss': 0.6297, 'learning_rate': 1.2068358309909463e-05, 'epoch': 0.9} {'loss': 0.6274, 'learning_rate': 1.2068029596381746e-05, 'epoch': 0.9} {'loss': 0.7713, 'learning_rate': 1.2067700880519615e-05, 'epoch': 0.9} {'loss': 0.3936, 'learning_rate': 1.2067372162323443e-05, 'epoch': 0.9} {'loss': 0.5556, 'learning_rate': 1.20670434417936e-05, 'epoch': 0.9} {'loss': 0.3368, 'learning_rate': 1.2066714718930462e-05, 'epoch': 0.9} {'loss': 0.6325, 'learning_rate': 1.2066385993734393e-05, 'epoch': 0.9} {'loss': 0.5179, 'learning_rate': 1.2066057266205769e-05, 'epoch': 0.9} {'loss': 0.65, 'learning_rate': 1.2065728536344956e-05, 'epoch': 0.9} {'loss': 0.5342, 'learning_rate': 1.2065399804152333e-05, 'epoch': 0.9} {'loss': 0.5076, 'learning_rate': 1.2065071069628265e-05, 'epoch': 0.9} {'loss': 0.5196, 'learning_rate': 1.2064742332773122e-05, 'epoch': 0.9} {'loss': 0.4999, 'learning_rate': 1.2064413593587279e-05, 'epoch': 0.9} {'loss': 0.5731, 'learning_rate': 1.2064084852071106e-05, 'epoch': 0.9} {'loss': 0.407, 'learning_rate': 1.206375610822497e-05, 'epoch': 0.9} {'loss': 0.4632, 'learning_rate': 1.2063427362049252e-05, 'epoch': 0.9} {'loss': 0.5724, 'learning_rate': 1.2063098613544313e-05, 'epoch': 0.9} {'loss': 0.6866, 'learning_rate': 1.2062769862710529e-05, 'epoch': 0.9} {'loss': 0.6077, 'learning_rate': 1.2062441109548269e-05, 'epoch': 0.9} {'loss': 0.4041, 'learning_rate': 1.2062112354057907e-05, 'epoch': 0.9} {'loss': 0.5768, 'learning_rate': 1.206178359623981e-05, 'epoch': 0.9} {'loss': 0.5908, 'learning_rate': 1.2061454836094352e-05, 'epoch': 0.9} {'loss': 0.5445, 'learning_rate': 1.2061126073621905e-05, 'epoch': 0.9} {'loss': 0.4318, 'learning_rate': 1.2060797308822837e-05, 'epoch': 0.9} {'loss': 0.5956, 'learning_rate': 1.2060468541697522e-05, 'epoch': 0.9} {'loss': 0.4838, 'learning_rate': 1.2060139772246328e-05, 'epoch': 0.9} {'loss': 0.6578, 'learning_rate': 1.2059811000469632e-05, 'epoch': 0.9} {'loss': 0.5088, 'learning_rate': 1.2059482226367798e-05, 'epoch': 0.9} {'loss': 0.5164, 'learning_rate': 1.20591534499412e-05, 'epoch': 0.9} {'loss': 0.5228, 'learning_rate': 1.205882467119021e-05, 'epoch': 0.9} {'loss': 0.4812, 'learning_rate': 1.2058495890115199e-05, 'epoch': 0.9} {'loss': 0.7399, 'learning_rate': 1.2058167106716536e-05, 'epoch': 0.9} {'loss': 0.6204, 'learning_rate': 1.2057838320994596e-05, 'epoch': 0.9} {'loss': 0.6416, 'learning_rate': 1.2057509532949746e-05, 'epoch': 0.9} {'loss': 0.5032, 'learning_rate': 1.2057180742582362e-05, 'epoch': 0.9} {'loss': 0.5182, 'learning_rate': 1.2056851949892807e-05, 'epoch': 0.9} {'loss': 0.6043, 'learning_rate': 1.205652315488146e-05, 'epoch': 0.9} {'loss': 0.5945, 'learning_rate': 1.2056194357548689e-05, 'epoch': 0.9} {'loss': 0.5491, 'learning_rate': 1.2055865557894868e-05, 'epoch': 0.9} {'loss': 0.5442, 'learning_rate': 1.2055536755920363e-05, 'epoch': 0.9} {'loss': 0.6304, 'learning_rate': 1.205520795162555e-05, 'epoch': 0.9} {'loss': 0.5766, 'learning_rate': 1.2054879145010793e-05, 'epoch': 0.9} {'loss': 0.4196, 'learning_rate': 1.2054550336076474e-05, 'epoch': 0.9} {'loss': 0.7927, 'learning_rate': 1.2054221524822955e-05, 'epoch': 0.9} {'loss': 0.5312, 'learning_rate': 1.2053892711250613e-05, 'epoch': 0.9} {'loss': 0.466, 'learning_rate': 1.2053563895359817e-05, 'epoch': 0.9} {'loss': 0.6285, 'learning_rate': 1.2053235077150935e-05, 'epoch': 0.9} {'loss': 0.6413, 'learning_rate': 1.2052906256624341e-05, 'epoch': 0.9} {'loss': 0.4741, 'learning_rate': 1.205257743378041e-05, 'epoch': 0.9} {'loss': 0.5277, 'learning_rate': 1.2052248608619506e-05, 'epoch': 0.9} {'loss': 0.4712, 'learning_rate': 1.2051919781142004e-05, 'epoch': 0.9} {'loss': 0.5553, 'learning_rate': 1.2051590951348276e-05, 'epoch': 0.9} {'loss': 0.57, 'learning_rate': 1.2051262119238692e-05, 'epoch': 0.9} {'loss': 0.4377, 'learning_rate': 1.205093328481362e-05, 'epoch': 0.9} {'loss': 0.394, 'learning_rate': 1.2050604448073438e-05, 'epoch': 0.9} {'loss': 0.5477, 'learning_rate': 1.205027560901851e-05, 'epoch': 0.9} {'loss': 0.4402, 'learning_rate': 1.2049946767649215e-05, 'epoch': 0.9} {'loss': 0.5792, 'learning_rate': 1.2049617923965918e-05, 'epoch': 0.9} {'loss': 0.5594, 'learning_rate': 1.2049289077968993e-05, 'epoch': 0.9} {'loss': 0.567, 'learning_rate': 1.2048960229658808e-05, 'epoch': 0.9} {'loss': 0.5701, 'learning_rate': 1.2048631379035738e-05, 'epoch': 0.9} {'loss': 0.5643, 'learning_rate': 1.2048302526100153e-05, 'epoch': 0.9} {'loss': 0.5212, 'learning_rate': 1.2047973670852422e-05, 'epoch': 0.9} {'loss': 0.5588, 'learning_rate': 1.204764481329292e-05, 'epoch': 0.9} {'loss': 0.5489, 'learning_rate': 1.2047315953422017e-05, 'epoch': 0.9} {'loss': 0.6286, 'learning_rate': 1.2046987091240081e-05, 'epoch': 0.9} {'loss': 0.3025, 'learning_rate': 1.2046658226747487e-05, 'epoch': 0.9} {'loss': 0.5433, 'learning_rate': 1.2046329359944606e-05, 'epoch': 0.9} {'loss': 0.4574, 'learning_rate': 1.2046000490831808e-05, 'epoch': 0.9} {'loss': 0.5482, 'learning_rate': 1.2045671619409464e-05, 'epoch': 0.9} {'loss': 0.4984, 'learning_rate': 1.2045342745677947e-05, 'epoch': 0.9} {'loss': 0.6449, 'learning_rate': 1.2045013869637627e-05, 'epoch': 0.9} {'loss': 0.6475, 'learning_rate': 1.2044684991288872e-05, 'epoch': 0.9} {'loss': 0.5875, 'learning_rate': 1.2044356110632058e-05, 'epoch': 0.9} {'loss': 0.4095, 'learning_rate': 1.2044027227667556e-05, 'epoch': 0.9} {'loss': 0.6568, 'learning_rate': 1.2043698342395736e-05, 'epoch': 0.9} {'loss': 0.5911, 'learning_rate': 1.2043369454816966e-05, 'epoch': 0.9} {'loss': 0.3855, 'learning_rate': 1.2043040564931623e-05, 'epoch': 0.9} {'loss': 0.6867, 'learning_rate': 1.2042711672740078e-05, 'epoch': 0.9} {'loss': 0.4092, 'learning_rate': 1.2042382778242695e-05, 'epoch': 0.9} {'loss': 0.5077, 'learning_rate': 1.2042053881439855e-05, 'epoch': 0.9} {'loss': 0.5136, 'learning_rate': 1.2041724982331921e-05, 'epoch': 0.9} {'loss': 0.5707, 'learning_rate': 1.2041396080919272e-05, 'epoch': 0.9} {'loss': 0.5528, 'learning_rate': 1.2041067177202271e-05, 'epoch': 0.9} {'loss': 0.4929, 'learning_rate': 1.2040738271181293e-05, 'epoch': 0.9} {'loss': 0.5561, 'learning_rate': 1.2040409362856713e-05, 'epoch': 0.9} {'loss': 0.4179, 'learning_rate': 1.2040080452228895e-05, 'epoch': 0.9} {'loss': 0.5775, 'learning_rate': 1.2039751539298217e-05, 'epoch': 0.9} {'loss': 0.5152, 'learning_rate': 1.2039422624065046e-05, 'epoch': 0.9} {'loss': 0.5035, 'learning_rate': 1.2039093706529753e-05, 'epoch': 0.9} {'loss': 0.57, 'learning_rate': 1.2038764786692714e-05, 'epoch': 0.9} {'loss': 0.4192, 'learning_rate': 1.2038435864554297e-05, 'epoch': 0.9} {'loss': 0.5653, 'learning_rate': 1.203810694011487e-05, 'epoch': 0.9} {'loss': 0.6196, 'learning_rate': 1.2037778013374813e-05, 'epoch': 0.9} {'loss': 0.581, 'learning_rate': 1.203744908433449e-05, 'epoch': 0.9} {'loss': 0.6137, 'learning_rate': 1.2037120152994274e-05, 'epoch': 0.9} {'loss': 0.5232, 'learning_rate': 1.2036791219354538e-05, 'epoch': 0.9} {'loss': 0.4712, 'learning_rate': 1.203646228341565e-05, 'epoch': 0.9} {'loss': 0.5605, 'learning_rate': 1.2036133345177984e-05, 'epoch': 0.9} {'loss': 0.4589, 'learning_rate': 1.2035804404641912e-05, 'epoch': 0.9} {'loss': 0.5354, 'learning_rate': 1.2035475461807801e-05, 'epoch': 0.9} {'loss': 0.5571, 'learning_rate': 1.2035146516676029e-05, 'epoch': 0.9} {'loss': 0.5686, 'learning_rate': 1.203481756924696e-05, 'epoch': 0.9} {'loss': 0.4829, 'learning_rate': 1.203448861952097e-05, 'epoch': 0.9} {'loss': 0.4729, 'learning_rate': 1.2034159667498431e-05, 'epoch': 0.9} {'loss': 0.6557, 'learning_rate': 1.203383071317971e-05, 'epoch': 0.9} {'loss': 0.6146, 'learning_rate': 1.2033501756565182e-05, 'epoch': 0.9} {'loss': 0.4672, 'learning_rate': 1.2033172797655218e-05, 'epoch': 0.9} {'loss': 0.5849, 'learning_rate': 1.2032843836450189e-05, 'epoch': 0.9} {'loss': 0.6238, 'learning_rate': 1.2032514872950465e-05, 'epoch': 0.9} {'loss': 0.5499, 'learning_rate': 1.2032185907156417e-05, 'epoch': 0.9} {'loss': 0.5918, 'learning_rate': 1.2031856939068419e-05, 'epoch': 0.9} {'loss': 0.5197, 'learning_rate': 1.203152796868684e-05, 'epoch': 0.9} {'loss': 0.4632, 'learning_rate': 1.2031198996012052e-05, 'epoch': 0.9} {'loss': 0.3599, 'learning_rate': 1.2030870021044427e-05, 'epoch': 0.9} {'loss': 0.733, 'learning_rate': 1.2030541043784336e-05, 'epoch': 0.9} {'loss': 0.6315, 'learning_rate': 1.2030212064232152e-05, 'epoch': 0.9} {'loss': 0.4991, 'learning_rate': 1.2029883082388244e-05, 'epoch': 0.91} {'loss': 0.7113, 'learning_rate': 1.2029554098252981e-05, 'epoch': 0.91} {'loss': 0.6354, 'learning_rate': 1.2029225111826738e-05, 'epoch': 0.91} {'loss': 0.6575, 'learning_rate': 1.2028896123109888e-05, 'epoch': 0.91} {'loss': 0.5299, 'learning_rate': 1.2028567132102801e-05, 'epoch': 0.91} {'loss': 0.4942, 'learning_rate': 1.2028238138805844e-05, 'epoch': 0.91} {'loss': 0.5157, 'learning_rate': 1.2027909143219394e-05, 'epoch': 0.91} {'loss': 0.5261, 'learning_rate': 1.2027580145343818e-05, 'epoch': 0.91} {'loss': 0.4553, 'learning_rate': 1.2027251145179492e-05, 'epoch': 0.91} {'loss': 0.6188, 'learning_rate': 1.2026922142726785e-05, 'epoch': 0.91} {'loss': 0.3882, 'learning_rate': 1.2026593137986067e-05, 'epoch': 0.91} {'loss': 0.5546, 'learning_rate': 1.202626413095771e-05, 'epoch': 0.91} {'loss': 0.4791, 'learning_rate': 1.2025935121642087e-05, 'epoch': 0.91} {'loss': 0.6257, 'learning_rate': 1.202560611003957e-05, 'epoch': 0.91} {'loss': 0.5915, 'learning_rate': 1.2025277096150529e-05, 'epoch': 0.91} {'loss': 0.4643, 'learning_rate': 1.2024948079975333e-05, 'epoch': 0.91} {'loss': 0.6102, 'learning_rate': 1.2024619061514357e-05, 'epoch': 0.91} {'loss': 0.6632, 'learning_rate': 1.2024290040767972e-05, 'epoch': 0.91} {'loss': 0.6122, 'learning_rate': 1.2023961017736547e-05, 'epoch': 0.91} {'loss': 0.6468, 'learning_rate': 1.2023631992420455e-05, 'epoch': 0.91} {'loss': 0.511, 'learning_rate': 1.2023302964820068e-05, 'epoch': 0.91} {'loss': 0.6973, 'learning_rate': 1.2022973934935756e-05, 'epoch': 0.91} {'loss': 0.6244, 'learning_rate': 1.202264490276789e-05, 'epoch': 0.91} {'loss': 0.6634, 'learning_rate': 1.2022315868316845e-05, 'epoch': 0.91} {'loss': 0.4888, 'learning_rate': 1.2021986831582988e-05, 'epoch': 0.91} {'loss': 0.3652, 'learning_rate': 1.2021657792566694e-05, 'epoch': 0.91} {'loss': 0.6285, 'learning_rate': 1.202132875126833e-05, 'epoch': 0.91} {'loss': 0.5109, 'learning_rate': 1.2020999707688272e-05, 'epoch': 0.91} {'loss': 0.5012, 'learning_rate': 1.2020670661826892e-05, 'epoch': 0.91} {'loss': 0.4826, 'learning_rate': 1.2020341613684558e-05, 'epoch': 0.91} {'loss': 0.5479, 'learning_rate': 1.2020012563261641e-05, 'epoch': 0.91} {'loss': 0.4424, 'learning_rate': 1.2019683510558516e-05, 'epoch': 0.91} {'loss': 0.645, 'learning_rate': 1.2019354455575549e-05, 'epoch': 0.91} {'loss': 0.6103, 'learning_rate': 1.2019025398313116e-05, 'epoch': 0.91} {'loss': 0.7015, 'learning_rate': 1.2018696338771588e-05, 'epoch': 0.91} {'loss': 0.5467, 'learning_rate': 1.2018367276951335e-05, 'epoch': 0.91} {'loss': 0.4883, 'learning_rate': 1.201803821285273e-05, 'epoch': 0.91} {'loss': 0.4785, 'learning_rate': 1.2017709146476144e-05, 'epoch': 0.91} {'loss': 0.5524, 'learning_rate': 1.2017380077821948e-05, 'epoch': 0.91} {'loss': 0.5612, 'learning_rate': 1.201705100689051e-05, 'epoch': 0.91} {'loss': 0.6416, 'learning_rate': 1.2016721933682209e-05, 'epoch': 0.91} {'loss': 0.6663, 'learning_rate': 1.2016392858197413e-05, 'epoch': 0.91} {'loss': 0.4684, 'learning_rate': 1.2016063780436492e-05, 'epoch': 0.91} {'loss': 0.5126, 'learning_rate': 1.2015734700399817e-05, 'epoch': 0.91} {'loss': 0.5409, 'learning_rate': 1.201540561808776e-05, 'epoch': 0.91} {'loss': 0.6306, 'learning_rate': 1.2015076533500695e-05, 'epoch': 0.91} {'loss': 0.5906, 'learning_rate': 1.2014747446638993e-05, 'epoch': 0.91} {'loss': 0.7307, 'learning_rate': 1.201441835750302e-05, 'epoch': 0.91} {'loss': 0.4605, 'learning_rate': 1.2014089266093155e-05, 'epoch': 0.91} {'loss': 0.7578, 'learning_rate': 1.2013760172409766e-05, 'epoch': 0.91} {'loss': 0.4696, 'learning_rate': 1.2013431076453223e-05, 'epoch': 0.91} {'loss': 0.5299, 'learning_rate': 1.20131019782239e-05, 'epoch': 0.91} {'loss': 0.3748, 'learning_rate': 1.201277287772217e-05, 'epoch': 0.91} {'loss': 0.5569, 'learning_rate': 1.2012443774948398e-05, 'epoch': 0.91} {'loss': 0.5532, 'learning_rate': 1.2012114669902964e-05, 'epoch': 0.91} {'loss': 0.517, 'learning_rate': 1.201178556258623e-05, 'epoch': 0.91} {'loss': 0.5627, 'learning_rate': 1.2011456452998578e-05, 'epoch': 0.91} {'loss': 0.6396, 'learning_rate': 1.2011127341140371e-05, 'epoch': 0.91} {'loss': 0.437, 'learning_rate': 1.2010798227011985e-05, 'epoch': 0.91} {'loss': 0.6261, 'learning_rate': 1.201046911061379e-05, 'epoch': 0.91} {'loss': 0.6434, 'learning_rate': 1.2010139991946156e-05, 'epoch': 0.91} {'loss': 0.4177, 'learning_rate': 1.200981087100946e-05, 'epoch': 0.91} {'loss': 0.4296, 'learning_rate': 1.2009481747804066e-05, 'epoch': 0.91} {'loss': 0.6701, 'learning_rate': 1.2009152622330352e-05, 'epoch': 0.91} {'loss': 0.4305, 'learning_rate': 1.2008823494588686e-05, 'epoch': 0.91} {'loss': 0.556, 'learning_rate': 1.2008494364579439e-05, 'epoch': 0.91} {'loss': 0.4904, 'learning_rate': 1.2008165232302984e-05, 'epoch': 0.91} {'loss': 0.5175, 'learning_rate': 1.2007836097759693e-05, 'epoch': 0.91} {'loss': 0.6196, 'learning_rate': 1.2007506960949937e-05, 'epoch': 0.91} {'loss': 0.4688, 'learning_rate': 1.2007177821874088e-05, 'epoch': 0.91} {'loss': 0.6202, 'learning_rate': 1.2006848680532514e-05, 'epoch': 0.91} {'loss': 0.7169, 'learning_rate': 1.2006519536925591e-05, 'epoch': 0.91} {'loss': 0.642, 'learning_rate': 1.200619039105369e-05, 'epoch': 0.91} {'loss': 0.7028, 'learning_rate': 1.200586124291718e-05, 'epoch': 0.91} {'loss': 0.6234, 'learning_rate': 1.2005532092516436e-05, 'epoch': 0.91} {'loss': 0.4438, 'learning_rate': 1.2005202939851826e-05, 'epoch': 0.91} {'loss': 0.5174, 'learning_rate': 1.2004873784923725e-05, 'epoch': 0.91} {'loss': 0.3723, 'learning_rate': 1.2004544627732502e-05, 'epoch': 0.91} {'loss': 0.5587, 'learning_rate': 1.2004215468278528e-05, 'epoch': 0.91} {'loss': 0.421, 'learning_rate': 1.2003886306562178e-05, 'epoch': 0.91} {'loss': 0.5734, 'learning_rate': 1.200355714258382e-05, 'epoch': 0.91} {'loss': 0.471, 'learning_rate': 1.2003227976343827e-05, 'epoch': 0.91} {'loss': 0.3941, 'learning_rate': 1.2002898807842572e-05, 'epoch': 0.91} {'loss': 0.468, 'learning_rate': 1.2002569637080423e-05, 'epoch': 0.91} {'loss': 0.6037, 'learning_rate': 1.2002240464057754e-05, 'epoch': 0.91} {'loss': 0.649, 'learning_rate': 1.2001911288774937e-05, 'epoch': 0.91} {'loss': 0.5057, 'learning_rate': 1.2001582111232342e-05, 'epoch': 0.91} {'loss': 0.7504, 'learning_rate': 1.2001252931430343e-05, 'epoch': 0.91} {'loss': 0.5734, 'learning_rate': 1.2000923749369307e-05, 'epoch': 0.91} {'loss': 0.6596, 'learning_rate': 1.200059456504961e-05, 'epoch': 0.91} {'loss': 0.6277, 'learning_rate': 1.2000265378471624e-05, 'epoch': 0.91} {'loss': 0.6895, 'learning_rate': 1.1999936189635719e-05, 'epoch': 0.91} {'loss': 0.5473, 'learning_rate': 1.1999606998542265e-05, 'epoch': 0.91} {'loss': 0.5942, 'learning_rate': 1.1999277805191633e-05, 'epoch': 0.91} {'loss': 0.586, 'learning_rate': 1.19989486095842e-05, 'epoch': 0.91} {'loss': 0.4476, 'learning_rate': 1.1998619411720331e-05, 'epoch': 0.91} {'loss': 0.6094, 'learning_rate': 1.1998290211600403e-05, 'epoch': 0.91} {'loss': 0.5241, 'learning_rate': 1.1997961009224783e-05, 'epoch': 0.91} {'loss': 0.5226, 'learning_rate': 1.1997631804593847e-05, 'epoch': 0.91} {'loss': 0.8058, 'learning_rate': 1.1997302597707966e-05, 'epoch': 0.91} {'loss': 0.6558, 'learning_rate': 1.1996973388567508e-05, 'epoch': 0.91} {'loss': 0.5779, 'learning_rate': 1.1996644177172845e-05, 'epoch': 0.91} {'loss': 0.4801, 'learning_rate': 1.1996314963524354e-05, 'epoch': 0.91} {'loss': 0.6723, 'learning_rate': 1.1995985747622403e-05, 'epoch': 0.91} {'loss': 0.5608, 'learning_rate': 1.1995656529467358e-05, 'epoch': 0.91} {'loss': 0.462, 'learning_rate': 1.19953273090596e-05, 'epoch': 0.91} {'loss': 0.3875, 'learning_rate': 1.19949980863995e-05, 'epoch': 0.91} {'loss': 0.5577, 'learning_rate': 1.1994668861487422e-05, 'epoch': 0.91} {'loss': 0.431, 'learning_rate': 1.1994339634323745e-05, 'epoch': 0.91} {'loss': 0.6868, 'learning_rate': 1.1994010404908835e-05, 'epoch': 0.91} {'loss': 0.553, 'learning_rate': 1.1993681173243067e-05, 'epoch': 0.91} {'loss': 0.5674, 'learning_rate': 1.1993351939326815e-05, 'epoch': 0.91} {'loss': 0.4295, 'learning_rate': 1.1993022703160446e-05, 'epoch': 0.91} {'loss': 0.4481, 'learning_rate': 1.1992693464744332e-05, 'epoch': 0.91} {'loss': 0.5522, 'learning_rate': 1.199236422407885e-05, 'epoch': 0.91} {'loss': 0.651, 'learning_rate': 1.1992034981164364e-05, 'epoch': 0.91} {'loss': 0.4903, 'learning_rate': 1.199170573600125e-05, 'epoch': 0.91} {'loss': 0.6631, 'learning_rate': 1.199137648858988e-05, 'epoch': 0.91} {'loss': 0.4861, 'learning_rate': 1.1991047238930625e-05, 'epoch': 0.91} {'loss': 0.5699, 'learning_rate': 1.1990717987023855e-05, 'epoch': 0.91} {'loss': 0.4943, 'learning_rate': 1.1990388732869942e-05, 'epoch': 0.91} {'loss': 0.4415, 'learning_rate': 1.199005947646926e-05, 'epoch': 0.91} {'loss': 0.7076, 'learning_rate': 1.1989730217822178e-05, 'epoch': 0.91} {'loss': 0.3902, 'learning_rate': 1.198940095692907e-05, 'epoch': 0.91} {'loss': 0.7071, 'learning_rate': 1.1989071693790307e-05, 'epoch': 0.91} {'loss': 0.4535, 'learning_rate': 1.1988742428406258e-05, 'epoch': 0.91} {'loss': 0.6325, 'learning_rate': 1.19884131607773e-05, 'epoch': 0.91} {'loss': 0.5898, 'learning_rate': 1.19880838909038e-05, 'epoch': 0.91} {'loss': 0.4191, 'learning_rate': 1.1987754618786133e-05, 'epoch': 0.91} {'loss': 0.4758, 'learning_rate': 1.1987425344424669e-05, 'epoch': 0.91} {'loss': 0.6099, 'learning_rate': 1.1987096067819776e-05, 'epoch': 0.91} {'loss': 0.5633, 'learning_rate': 1.1986766788971833e-05, 'epoch': 0.91} {'loss': 0.5582, 'learning_rate': 1.1986437507881208e-05, 'epoch': 0.91} {'loss': 0.5109, 'learning_rate': 1.1986108224548272e-05, 'epoch': 0.91} {'loss': 0.7226, 'learning_rate': 1.1985778938973396e-05, 'epoch': 0.91} {'loss': 0.7172, 'learning_rate': 1.1985449651156955e-05, 'epoch': 0.91} {'loss': 0.6252, 'learning_rate': 1.1985120361099318e-05, 'epoch': 0.91} {'loss': 0.4784, 'learning_rate': 1.1984791068800859e-05, 'epoch': 0.91} {'loss': 0.6183, 'learning_rate': 1.1984461774261946e-05, 'epoch': 0.91} {'loss': 0.432, 'learning_rate': 1.1984132477482955e-05, 'epoch': 0.91} {'loss': 0.723, 'learning_rate': 1.1983803178464257e-05, 'epoch': 0.91} {'loss': 0.4686, 'learning_rate': 1.198347387720622e-05, 'epoch': 0.91} {'loss': 0.533, 'learning_rate': 1.1983144573709218e-05, 'epoch': 0.91} {'loss': 0.5819, 'learning_rate': 1.1982815267973624e-05, 'epoch': 0.91} {'loss': 0.6163, 'learning_rate': 1.1982485959999809e-05, 'epoch': 0.91} {'loss': 0.6785, 'learning_rate': 1.1982156649788142e-05, 'epoch': 0.91} {'loss': 0.6375, 'learning_rate': 1.1981827337338998e-05, 'epoch': 0.91} {'loss': 0.665, 'learning_rate': 1.198149802265275e-05, 'epoch': 0.91} {'loss': 0.6699, 'learning_rate': 1.1981168705729765e-05, 'epoch': 0.91} {'loss': 0.5203, 'learning_rate': 1.1980839386570418e-05, 'epoch': 0.91} {'loss': 0.5914, 'learning_rate': 1.198051006517508e-05, 'epoch': 0.91} {'loss': 0.6385, 'learning_rate': 1.1980180741544123e-05, 'epoch': 0.91} {'loss': 0.5296, 'learning_rate': 1.1979851415677918e-05, 'epoch': 0.91} {'loss': 0.644, 'learning_rate': 1.197952208757684e-05, 'epoch': 0.91} {'loss': 0.5983, 'learning_rate': 1.1979192757241253e-05, 'epoch': 0.91} {'loss': 0.5552, 'learning_rate': 1.1978863424671537e-05, 'epoch': 0.91} {'loss': 0.5572, 'learning_rate': 1.197853408986806e-05, 'epoch': 0.91} {'loss': 0.5572, 'learning_rate': 1.1978204752831194e-05, 'epoch': 0.91} {'loss': 0.5124, 'learning_rate': 1.197787541356131e-05, 'epoch': 0.91} {'loss': 0.4842, 'learning_rate': 1.1977546072058781e-05, 'epoch': 0.91} {'loss': 0.4963, 'learning_rate': 1.197721672832398e-05, 'epoch': 0.91} {'loss': 0.5605, 'learning_rate': 1.1976887382357276e-05, 'epoch': 0.91} {'loss': 0.668, 'learning_rate': 1.1976558034159043e-05, 'epoch': 0.91} {'loss': 0.5471, 'learning_rate': 1.1976228683729654e-05, 'epoch': 0.91} {'loss': 0.7554, 'learning_rate': 1.1975899331069476e-05, 'epoch': 0.91} {'loss': 0.4215, 'learning_rate': 1.1975569976178885e-05, 'epoch': 0.91} {'loss': 0.6566, 'learning_rate': 1.1975240619058249e-05, 'epoch': 0.91} {'loss': 0.571, 'learning_rate': 1.1974911259707941e-05, 'epoch': 0.91} {'loss': 0.5977, 'learning_rate': 1.1974581898128336e-05, 'epoch': 0.91} {'loss': 0.523, 'learning_rate': 1.1974252534319803e-05, 'epoch': 0.91} {'loss': 0.7378, 'learning_rate': 1.1973923168282716e-05, 'epoch': 0.91} {'loss': 0.6662, 'learning_rate': 1.1973593800017442e-05, 'epoch': 0.91} {'loss': 0.5351, 'learning_rate': 1.1973264429524356e-05, 'epoch': 0.91} {'loss': 0.5657, 'learning_rate': 1.1972935056803831e-05, 'epoch': 0.91} {'loss': 0.4715, 'learning_rate': 1.197260568185624e-05, 'epoch': 0.91} {'loss': 0.5576, 'learning_rate': 1.1972276304681949e-05, 'epoch': 0.91} {'loss': 0.5865, 'learning_rate': 1.1971946925281333e-05, 'epoch': 0.91} {'loss': 0.5058, 'learning_rate': 1.1971617543654767e-05, 'epoch': 0.91} {'loss': 0.6816, 'learning_rate': 1.1971288159802617e-05, 'epoch': 0.91} {'loss': 0.7209, 'learning_rate': 1.1970958773725259e-05, 'epoch': 0.91} {'loss': 0.4738, 'learning_rate': 1.197062938542306e-05, 'epoch': 0.91} {'loss': 0.4504, 'learning_rate': 1.1970299994896399e-05, 'epoch': 0.91} {'loss': 0.5356, 'learning_rate': 1.1969970602145643e-05, 'epoch': 0.91} {'loss': 0.5827, 'learning_rate': 1.1969641207171164e-05, 'epoch': 0.91} {'loss': 0.5327, 'learning_rate': 1.1969311809973334e-05, 'epoch': 0.91} {'loss': 0.5584, 'learning_rate': 1.1968982410552527e-05, 'epoch': 0.91} {'loss': 0.6818, 'learning_rate': 1.1968653008909112e-05, 'epoch': 0.91} {'loss': 0.4503, 'learning_rate': 1.1968323605043464e-05, 'epoch': 0.91} {'loss': 0.5247, 'learning_rate': 1.196799419895595e-05, 'epoch': 0.91} {'loss': 0.5587, 'learning_rate': 1.1967664790646947e-05, 'epoch': 0.91} {'loss': 0.5216, 'learning_rate': 1.1967335380116827e-05, 'epoch': 0.91} {'loss': 0.3641, 'learning_rate': 1.1967005967365954e-05, 'epoch': 0.91} {'loss': 0.5464, 'learning_rate': 1.196667655239471e-05, 'epoch': 0.91} {'loss': 0.3814, 'learning_rate': 1.196634713520346e-05, 'epoch': 0.91} {'loss': 0.5296, 'learning_rate': 1.1966017715792577e-05, 'epoch': 0.91} {'loss': 0.6127, 'learning_rate': 1.1965688294162434e-05, 'epoch': 0.91} {'loss': 0.5895, 'learning_rate': 1.1965358870313405e-05, 'epoch': 0.91} {'loss': 0.5778, 'learning_rate': 1.1965029444245858e-05, 'epoch': 0.91} {'loss': 0.4975, 'learning_rate': 1.1964700015960165e-05, 'epoch': 0.91} {'loss': 0.5877, 'learning_rate': 1.1964370585456701e-05, 'epoch': 0.91} {'loss': 0.6381, 'learning_rate': 1.1964041152735837e-05, 'epoch': 0.91} {'loss': 0.4857, 'learning_rate': 1.1963711717797941e-05, 'epoch': 0.91} {'loss': 0.5945, 'learning_rate': 1.1963382280643392e-05, 'epoch': 0.91} {'loss': 0.5553, 'learning_rate': 1.1963052841272555e-05, 'epoch': 0.91} {'loss': 0.5718, 'learning_rate': 1.1962723399685804e-05, 'epoch': 0.91} {'loss': 0.6288, 'learning_rate': 1.1962393955883513e-05, 'epoch': 0.91} {'loss': 0.4209, 'learning_rate': 1.1962064509866051e-05, 'epoch': 0.91} {'loss': 0.4565, 'learning_rate': 1.1961735061633795e-05, 'epoch': 0.91} {'loss': 0.5571, 'learning_rate': 1.1961405611187108e-05, 'epoch': 0.91} {'loss': 0.7301, 'learning_rate': 1.196107615852637e-05, 'epoch': 0.91} {'loss': 0.5253, 'learning_rate': 1.1960746703651951e-05, 'epoch': 0.91} {'loss': 0.6071, 'learning_rate': 1.196041724656422e-05, 'epoch': 0.91} {'loss': 0.7128, 'learning_rate': 1.196008778726355e-05, 'epoch': 0.91} {'loss': 0.5605, 'learning_rate': 1.1959758325750318e-05, 'epoch': 0.91} {'loss': 0.4684, 'learning_rate': 1.195942886202489e-05, 'epoch': 0.91} {'loss': 0.5953, 'learning_rate': 1.1959099396087637e-05, 'epoch': 0.91} {'loss': 0.4333, 'learning_rate': 1.1958769927938934e-05, 'epoch': 0.91} {'loss': 0.385, 'learning_rate': 1.195844045757915e-05, 'epoch': 0.91} {'loss': 0.5138, 'learning_rate': 1.1958110985008662e-05, 'epoch': 0.91} {'loss': 0.6285, 'learning_rate': 1.195778151022784e-05, 'epoch': 0.91} {'loss': 0.5622, 'learning_rate': 1.1957452033237052e-05, 'epoch': 0.91} {'loss': 0.5992, 'learning_rate': 1.1957122554036673e-05, 'epoch': 0.91} {'loss': 0.5412, 'learning_rate': 1.1956793072627078e-05, 'epoch': 0.91} {'loss': 0.5767, 'learning_rate': 1.1956463589008633e-05, 'epoch': 0.91} {'loss': 0.5353, 'learning_rate': 1.1956134103181713e-05, 'epoch': 0.91} {'loss': 0.5042, 'learning_rate': 1.195580461514669e-05, 'epoch': 0.91} {'loss': 0.5296, 'learning_rate': 1.1955475124903937e-05, 'epoch': 0.91} {'loss': 0.5678, 'learning_rate': 1.1955145632453825e-05, 'epoch': 0.91} {'loss': 0.6091, 'learning_rate': 1.195481613779672e-05, 'epoch': 0.91} {'loss': 0.6156, 'learning_rate': 1.1954486640933005e-05, 'epoch': 0.91} {'loss': 0.3151, 'learning_rate': 1.1954157141863044e-05, 'epoch': 0.91} {'loss': 0.5748, 'learning_rate': 1.195382764058721e-05, 'epoch': 0.91} {'loss': 0.511, 'learning_rate': 1.1953498137105877e-05, 'epoch': 0.91} {'loss': 0.4656, 'learning_rate': 1.1953168631419416e-05, 'epoch': 0.91} {'loss': 0.6406, 'learning_rate': 1.1952839123528199e-05, 'epoch': 0.91} {'loss': 0.4958, 'learning_rate': 1.19525096134326e-05, 'epoch': 0.91} {'loss': 0.5171, 'learning_rate': 1.1952180101132987e-05, 'epoch': 0.91} {'loss': 0.4488, 'learning_rate': 1.1951850586629732e-05, 'epoch': 0.91} {'loss': 0.4034, 'learning_rate': 1.1951521069923212e-05, 'epoch': 0.91} {'loss': 0.5294, 'learning_rate': 1.1951191551013796e-05, 'epoch': 0.91} {'loss': 0.4407, 'learning_rate': 1.1950862029901856e-05, 'epoch': 0.91} {'loss': 0.4973, 'learning_rate': 1.1950532506587762e-05, 'epoch': 0.91} {'loss': 0.7045, 'learning_rate': 1.1950202981071888e-05, 'epoch': 0.91} {'loss': 0.6016, 'learning_rate': 1.1949873453354605e-05, 'epoch': 0.91} {'loss': 0.539, 'learning_rate': 1.1949543923436287e-05, 'epoch': 0.91} {'loss': 0.6042, 'learning_rate': 1.1949214391317303e-05, 'epoch': 0.91} {'loss': 0.4553, 'learning_rate': 1.1948884856998027e-05, 'epoch': 0.91} {'loss': 0.662, 'learning_rate': 1.1948555320478832e-05, 'epoch': 0.91} {'loss': 0.5763, 'learning_rate': 1.1948225781760087e-05, 'epoch': 0.91} {'loss': 0.5494, 'learning_rate': 1.1947896240842165e-05, 'epoch': 0.91} {'loss': 0.6572, 'learning_rate': 1.1947566697725441e-05, 'epoch': 0.91} {'loss': 0.5782, 'learning_rate': 1.1947237152410283e-05, 'epoch': 0.91} {'loss': 0.5807, 'learning_rate': 1.1946907604897065e-05, 'epoch': 0.91} {'loss': 0.4379, 'learning_rate': 1.1946578055186158e-05, 'epoch': 0.91} {'loss': 0.476, 'learning_rate': 1.1946248503277935e-05, 'epoch': 0.91} {'loss': 0.5096, 'learning_rate': 1.1945918949172767e-05, 'epoch': 0.91} {'loss': 0.4569, 'learning_rate': 1.194558939287103e-05, 'epoch': 0.91} {'loss': 0.4958, 'learning_rate': 1.1945259834373086e-05, 'epoch': 0.91} {'loss': 0.6161, 'learning_rate': 1.1944930273679319e-05, 'epoch': 0.91} {'loss': 0.3983, 'learning_rate': 1.1944600710790092e-05, 'epoch': 0.91} {'loss': 0.6417, 'learning_rate': 1.1944271145705783e-05, 'epoch': 0.91} {'loss': 0.5869, 'learning_rate': 1.1943941578426761e-05, 'epoch': 0.91} {'loss': 0.3445, 'learning_rate': 1.1943612008953397e-05, 'epoch': 0.91} {'loss': 0.427, 'learning_rate': 1.194328243728607e-05, 'epoch': 0.91} {'loss': 0.3761, 'learning_rate': 1.1942952863425143e-05, 'epoch': 0.91} {'loss': 0.6034, 'learning_rate': 1.1942623287370992e-05, 'epoch': 0.91} {'loss': 0.2897, 'learning_rate': 1.1942293709123986e-05, 'epoch': 0.91} {'loss': 0.7254, 'learning_rate': 1.1941964128684505e-05, 'epoch': 0.91} {'loss': 0.7027, 'learning_rate': 1.1941634546052912e-05, 'epoch': 0.91} {'loss': 0.6442, 'learning_rate': 1.1941304961229583e-05, 'epoch': 0.91} {'loss': 0.4839, 'learning_rate': 1.194097537421489e-05, 'epoch': 0.91} {'loss': 0.6215, 'learning_rate': 1.1940645785009206e-05, 'epoch': 0.91} {'loss': 0.6262, 'learning_rate': 1.1940316193612899e-05, 'epoch': 0.91} {'loss': 0.4385, 'learning_rate': 1.1939986600026348e-05, 'epoch': 0.91} {'loss': 0.8196, 'learning_rate': 1.1939657004249918e-05, 'epoch': 0.91} {'loss': 0.5579, 'learning_rate': 1.1939327406283986e-05, 'epoch': 0.91} {'loss': 0.5123, 'learning_rate': 1.1938997806128925e-05, 'epoch': 0.91} {'loss': 0.5413, 'learning_rate': 1.19386682037851e-05, 'epoch': 0.91} {'loss': 0.5421, 'learning_rate': 1.1938338599252887e-05, 'epoch': 0.91} {'loss': 0.5969, 'learning_rate': 1.1938008992532659e-05, 'epoch': 0.91} {'loss': 0.3676, 'learning_rate': 1.1937679383624788e-05, 'epoch': 0.91} {'loss': 0.6904, 'learning_rate': 1.1937349772529644e-05, 'epoch': 0.91} {'loss': 0.5029, 'learning_rate': 1.1937020159247602e-05, 'epoch': 0.91} {'loss': 0.5043, 'learning_rate': 1.1936690543779033e-05, 'epoch': 0.91} {'loss': 0.6053, 'learning_rate': 1.1936360926124309e-05, 'epoch': 0.91} {'loss': 0.4656, 'learning_rate': 1.1936031306283799e-05, 'epoch': 0.91} {'loss': 0.7136, 'learning_rate': 1.1935701684257878e-05, 'epoch': 0.91} {'loss': 0.4725, 'learning_rate': 1.1935372060046922e-05, 'epoch': 0.91} {'loss': 0.5511, 'learning_rate': 1.1935042433651294e-05, 'epoch': 0.91} {'loss': 0.6407, 'learning_rate': 1.1934712805071376e-05, 'epoch': 0.91} {'loss': 0.6873, 'learning_rate': 1.1934383174307533e-05, 'epoch': 0.91} {'loss': 0.6132, 'learning_rate': 1.1934053541360137e-05, 'epoch': 0.91} {'loss': 0.5151, 'learning_rate': 1.1933723906229564e-05, 'epoch': 0.91} {'loss': 0.5577, 'learning_rate': 1.1933394268916185e-05, 'epoch': 0.91} {'loss': 0.637, 'learning_rate': 1.1933064629420372e-05, 'epoch': 0.91} {'loss': 0.727, 'learning_rate': 1.1932734987742496e-05, 'epoch': 0.91} {'loss': 0.7496, 'learning_rate': 1.1932405343882927e-05, 'epoch': 0.91} {'loss': 0.4827, 'learning_rate': 1.1932075697842043e-05, 'epoch': 0.91} {'loss': 0.6085, 'learning_rate': 1.1931746049620212e-05, 'epoch': 0.91} {'loss': 0.5365, 'learning_rate': 1.1931416399217808e-05, 'epoch': 0.91} {'loss': 0.4789, 'learning_rate': 1.1931086746635201e-05, 'epoch': 0.91} {'loss': 0.4918, 'learning_rate': 1.1930757091872765e-05, 'epoch': 0.91} {'loss': 0.5928, 'learning_rate': 1.1930427434930868e-05, 'epoch': 0.91} {'loss': 0.503, 'learning_rate': 1.193009777580989e-05, 'epoch': 0.91} {'loss': 0.5362, 'learning_rate': 1.1929768114510196e-05, 'epoch': 0.91} {'loss': 0.7068, 'learning_rate': 1.1929438451032163e-05, 'epoch': 0.91} {'loss': 0.6894, 'learning_rate': 1.192910878537616e-05, 'epoch': 0.91} {'loss': 0.6197, 'learning_rate': 1.192877911754256e-05, 'epoch': 0.91} {'loss': 0.5811, 'learning_rate': 1.1928449447531733e-05, 'epoch': 0.91} {'loss': 0.5658, 'learning_rate': 1.1928119775344055e-05, 'epoch': 0.91} {'loss': 0.6064, 'learning_rate': 1.1927790100979897e-05, 'epoch': 0.91} {'loss': 0.5274, 'learning_rate': 1.1927460424439632e-05, 'epoch': 0.91} {'loss': 0.5818, 'learning_rate': 1.1927130745723628e-05, 'epoch': 0.91} {'loss': 0.542, 'learning_rate': 1.1926801064832263e-05, 'epoch': 0.91} {'loss': 0.6648, 'learning_rate': 1.1926471381765904e-05, 'epoch': 0.91} {'loss': 0.6489, 'learning_rate': 1.1926141696524925e-05, 'epoch': 0.91} {'loss': 0.587, 'learning_rate': 1.1925812009109697e-05, 'epoch': 0.91} {'loss': 0.4973, 'learning_rate': 1.1925482319520594e-05, 'epoch': 0.91} {'loss': 0.4626, 'learning_rate': 1.1925152627757987e-05, 'epoch': 0.91} {'loss': 0.5841, 'learning_rate': 1.192482293382225e-05, 'epoch': 0.91} {'loss': 0.6172, 'learning_rate': 1.1924493237713754e-05, 'epoch': 0.91} {'loss': 0.4749, 'learning_rate': 1.1924163539432874e-05, 'epoch': 0.91} {'loss': 0.6523, 'learning_rate': 1.1923833838979974e-05, 'epoch': 0.91} {'loss': 0.6326, 'learning_rate': 1.1923504136355435e-05, 'epoch': 0.91} {'loss': 0.4983, 'learning_rate': 1.1923174431559623e-05, 'epoch': 0.91} {'loss': 0.6751, 'learning_rate': 1.1922844724592914e-05, 'epoch': 0.91} {'loss': 0.4988, 'learning_rate': 1.1922515015455682e-05, 'epoch': 0.91} {'loss': 0.7091, 'learning_rate': 1.1922185304148293e-05, 'epoch': 0.91} {'loss': 0.688, 'learning_rate': 1.1921855590671123e-05, 'epoch': 0.91} {'loss': 0.6276, 'learning_rate': 1.1921525875024543e-05, 'epoch': 0.91} {'loss': 0.4941, 'learning_rate': 1.1921196157208925e-05, 'epoch': 0.91} {'loss': 0.5862, 'learning_rate': 1.1920866437224643e-05, 'epoch': 0.91} {'loss': 0.3678, 'learning_rate': 1.1920536715072065e-05, 'epoch': 0.91} {'loss': 0.5303, 'learning_rate': 1.192020699075157e-05, 'epoch': 0.91} {'loss': 0.4994, 'learning_rate': 1.1919877264263527e-05, 'epoch': 0.91} {'loss': 0.4929, 'learning_rate': 1.1919547535608304e-05, 'epoch': 0.91} {'loss': 0.4337, 'learning_rate': 1.191921780478628e-05, 'epoch': 0.91} {'loss': 0.5573, 'learning_rate': 1.1918888071797822e-05, 'epoch': 0.91} {'loss': 0.7458, 'learning_rate': 1.1918558336643304e-05, 'epoch': 0.91} {'loss': 0.5643, 'learning_rate': 1.1918228599323102e-05, 'epoch': 0.91} {'loss': 0.7544, 'learning_rate': 1.1917898859837584e-05, 'epoch': 0.91} {'loss': 0.7083, 'learning_rate': 1.191756911818712e-05, 'epoch': 0.91} {'loss': 0.751, 'learning_rate': 1.1917239374372088e-05, 'epoch': 0.91} {'loss': 0.4679, 'learning_rate': 1.1916909628392855e-05, 'epoch': 0.91} {'loss': 0.716, 'learning_rate': 1.1916579880249795e-05, 'epoch': 0.91} {'loss': 0.6212, 'learning_rate': 1.1916250129943282e-05, 'epoch': 0.91} {'loss': 0.4889, 'learning_rate': 1.1915920377473686e-05, 'epoch': 0.91} {'loss': 0.6409, 'learning_rate': 1.1915590622841382e-05, 'epoch': 0.91} {'loss': 0.4529, 'learning_rate': 1.1915260866046738e-05, 'epoch': 0.91} {'loss': 0.6502, 'learning_rate': 1.1914931107090131e-05, 'epoch': 0.91} {'loss': 0.5432, 'learning_rate': 1.1914601345971931e-05, 'epoch': 0.91} {'loss': 0.5711, 'learning_rate': 1.1914271582692509e-05, 'epoch': 0.91} {'loss': 0.5552, 'learning_rate': 1.191394181725224e-05, 'epoch': 0.91} {'loss': 0.5373, 'learning_rate': 1.1913612049651493e-05, 'epoch': 0.91} {'loss': 0.5193, 'learning_rate': 1.191328227989064e-05, 'epoch': 0.91} {'loss': 0.5496, 'learning_rate': 1.191295250797006e-05, 'epoch': 0.91} {'loss': 0.5959, 'learning_rate': 1.1912622733890115e-05, 'epoch': 0.91} {'loss': 0.5428, 'learning_rate': 1.1912292957651185e-05, 'epoch': 0.91} {'loss': 0.5822, 'learning_rate': 1.1911963179253643e-05, 'epoch': 0.91} {'loss': 0.4408, 'learning_rate': 1.1911633398697854e-05, 'epoch': 0.91} {'loss': 0.4829, 'learning_rate': 1.1911303615984196e-05, 'epoch': 0.91} {'loss': 0.5134, 'learning_rate': 1.191097383111304e-05, 'epoch': 0.91} {'loss': 0.3468, 'learning_rate': 1.1910644044084761e-05, 'epoch': 0.91} {'loss': 0.3247, 'learning_rate': 1.1910314254899722e-05, 'epoch': 0.91} {'loss': 0.5752, 'learning_rate': 1.1909984463558304e-05, 'epoch': 0.91} {'loss': 0.5553, 'learning_rate': 1.1909654670060878e-05, 'epoch': 0.91} {'loss': 0.4293, 'learning_rate': 1.1909324874407812e-05, 'epoch': 0.91} {'loss': 0.5951, 'learning_rate': 1.1908995076599485e-05, 'epoch': 0.91} {'loss': 0.5545, 'learning_rate': 1.1908665276636264e-05, 'epoch': 0.91} {'loss': 0.5689, 'learning_rate': 1.1908335474518523e-05, 'epoch': 0.91} {'loss': 0.547, 'learning_rate': 1.1908005670246631e-05, 'epoch': 0.91} {'loss': 0.6747, 'learning_rate': 1.1907675863820967e-05, 'epoch': 0.91} {'loss': 0.5304, 'learning_rate': 1.19073460552419e-05, 'epoch': 0.91} {'loss': 0.5032, 'learning_rate': 1.1907016244509801e-05, 'epoch': 0.91} {'loss': 0.5886, 'learning_rate': 1.1906686431625043e-05, 'epoch': 0.91} {'loss': 0.66, 'learning_rate': 1.1906356616588e-05, 'epoch': 0.91} {'loss': 0.6518, 'learning_rate': 1.1906026799399042e-05, 'epoch': 0.91} {'loss': 0.5566, 'learning_rate': 1.190569698005854e-05, 'epoch': 0.91} {'loss': 0.5204, 'learning_rate': 1.1905367158566871e-05, 'epoch': 0.91} {'loss': 0.6213, 'learning_rate': 1.1905037334924405e-05, 'epoch': 0.91} {'loss': 0.3451, 'learning_rate': 1.1904707509131512e-05, 'epoch': 0.91} {'loss': 0.5267, 'learning_rate': 1.1904377681188568e-05, 'epoch': 0.91} {'loss': 0.5546, 'learning_rate': 1.1904047851095944e-05, 'epoch': 0.91} {'loss': 0.6397, 'learning_rate': 1.1903718018854012e-05, 'epoch': 0.91} {'loss': 0.4065, 'learning_rate': 1.1903388184463143e-05, 'epoch': 0.91} {'loss': 0.4698, 'learning_rate': 1.1903058347923713e-05, 'epoch': 0.91} {'loss': 0.5694, 'learning_rate': 1.1902728509236088e-05, 'epoch': 0.91} {'loss': 0.5814, 'learning_rate': 1.1902398668400647e-05, 'epoch': 0.91} {'loss': 0.6792, 'learning_rate': 1.190206882541776e-05, 'epoch': 0.91} {'loss': 0.6011, 'learning_rate': 1.19017389802878e-05, 'epoch': 0.91} {'loss': 0.5325, 'learning_rate': 1.1901409133011138e-05, 'epoch': 0.91} {'loss': 0.6536, 'learning_rate': 1.1901079283588146e-05, 'epoch': 0.91} {'loss': 0.6549, 'learning_rate': 1.1900749432019195e-05, 'epoch': 0.91} {'loss': 0.4777, 'learning_rate': 1.1900419578304661e-05, 'epoch': 0.91} {'loss': 0.5323, 'learning_rate': 1.1900089722444914e-05, 'epoch': 0.91} {'loss': 0.6376, 'learning_rate': 1.1899759864440328e-05, 'epoch': 0.91} {'loss': 0.6674, 'learning_rate': 1.1899430004291274e-05, 'epoch': 0.91} {'loss': 0.6465, 'learning_rate': 1.1899100141998124e-05, 'epoch': 0.91} {'loss': 0.4626, 'learning_rate': 1.1898770277561252e-05, 'epoch': 0.91} {'loss': 0.409, 'learning_rate': 1.1898440410981029e-05, 'epoch': 0.91} {'loss': 0.6352, 'learning_rate': 1.1898110542257827e-05, 'epoch': 0.91} {'loss': 0.4896, 'learning_rate': 1.1897780671392021e-05, 'epoch': 0.91} {'loss': 0.5474, 'learning_rate': 1.189745079838398e-05, 'epoch': 0.91} {'loss': 0.5617, 'learning_rate': 1.1897120923234077e-05, 'epoch': 0.91} {'loss': 0.4282, 'learning_rate': 1.1896791045942689e-05, 'epoch': 0.91} {'loss': 0.4817, 'learning_rate': 1.1896461166510181e-05, 'epoch': 0.91} {'loss': 0.6993, 'learning_rate': 1.1896131284936931e-05, 'epoch': 0.91} {'loss': 0.5459, 'learning_rate': 1.1895801401223308e-05, 'epoch': 0.91} {'loss': 0.4955, 'learning_rate': 1.1895471515369686e-05, 'epoch': 0.91} {'loss': 0.6983, 'learning_rate': 1.1895141627376436e-05, 'epoch': 0.91} {'loss': 0.588, 'learning_rate': 1.1894811737243935e-05, 'epoch': 0.91} {'loss': 0.4085, 'learning_rate': 1.1894481844972549e-05, 'epoch': 0.91} {'loss': 0.4986, 'learning_rate': 1.1894151950562655e-05, 'epoch': 0.91} {'loss': 0.5315, 'learning_rate': 1.1893822054014623e-05, 'epoch': 0.91} {'loss': 0.4797, 'learning_rate': 1.1893492155328826e-05, 'epoch': 0.91} {'loss': 0.4747, 'learning_rate': 1.1893162254505634e-05, 'epoch': 0.91} {'loss': 0.3978, 'learning_rate': 1.1892832351545424e-05, 'epoch': 0.91} {'loss': 0.5489, 'learning_rate': 1.1892502446448568e-05, 'epoch': 0.91} {'loss': 0.5371, 'learning_rate': 1.1892172539215434e-05, 'epoch': 0.91} {'loss': 0.5375, 'learning_rate': 1.1891842629846397e-05, 'epoch': 0.91} {'loss': 0.6337, 'learning_rate': 1.1891512718341831e-05, 'epoch': 0.91} {'loss': 0.6107, 'learning_rate': 1.1891182804702106e-05, 'epoch': 0.91} {'loss': 0.5373, 'learning_rate': 1.1890852888927595e-05, 'epoch': 0.91} {'loss': 0.5396, 'learning_rate': 1.189052297101867e-05, 'epoch': 0.91} {'loss': 0.569, 'learning_rate': 1.1890193050975704e-05, 'epoch': 0.91} {'loss': 0.5281, 'learning_rate': 1.1889863128799073e-05, 'epoch': 0.91} {'loss': 0.4637, 'learning_rate': 1.1889533204489143e-05, 'epoch': 0.91} {'loss': 0.6305, 'learning_rate': 1.1889203278046291e-05, 'epoch': 0.91} {'loss': 0.3901, 'learning_rate': 1.1888873349470886e-05, 'epoch': 0.91} {'loss': 0.5309, 'learning_rate': 1.1888543418763302e-05, 'epoch': 0.91} {'loss': 0.5534, 'learning_rate': 1.1888213485923911e-05, 'epoch': 0.91} {'loss': 0.7229, 'learning_rate': 1.1887883550953087e-05, 'epoch': 0.91} {'loss': 0.5852, 'learning_rate': 1.1887553613851202e-05, 'epoch': 0.91} {'loss': 0.7466, 'learning_rate': 1.1887223674618628e-05, 'epoch': 0.91} {'loss': 0.6405, 'learning_rate': 1.1886893733255738e-05, 'epoch': 0.91} {'loss': 0.5742, 'learning_rate': 1.1886563789762901e-05, 'epoch': 0.91} {'loss': 0.5398, 'learning_rate': 1.1886233844140494e-05, 'epoch': 0.91} {'loss': 0.5623, 'learning_rate': 1.1885903896388889e-05, 'epoch': 0.91} {'loss': 0.6877, 'learning_rate': 1.1885573946508457e-05, 'epoch': 0.91} {'loss': 0.3688, 'learning_rate': 1.188524399449957e-05, 'epoch': 0.91} {'loss': 0.5255, 'learning_rate': 1.18849140403626e-05, 'epoch': 0.91} {'loss': 0.5846, 'learning_rate': 1.1884584084097921e-05, 'epoch': 0.91} {'loss': 0.5987, 'learning_rate': 1.1884254125705903e-05, 'epoch': 0.91} {'loss': 0.7397, 'learning_rate': 1.1883924165186923e-05, 'epoch': 0.91} {'loss': 0.5598, 'learning_rate': 1.1883594202541349e-05, 'epoch': 0.91} {'loss': 0.4286, 'learning_rate': 1.1883264237769557e-05, 'epoch': 0.91} {'loss': 0.6155, 'learning_rate': 1.1882934270871918e-05, 'epoch': 0.91} {'loss': 0.7858, 'learning_rate': 1.1882604301848801e-05, 'epoch': 0.91} {'loss': 0.4641, 'learning_rate': 1.1882274330700586e-05, 'epoch': 0.91} {'loss': 0.6665, 'learning_rate': 1.1881944357427637e-05, 'epoch': 0.91} {'loss': 0.4544, 'learning_rate': 1.1881614382030333e-05, 'epoch': 0.91} {'loss': 0.6456, 'learning_rate': 1.1881284404509046e-05, 'epoch': 0.91} {'loss': 0.5436, 'learning_rate': 1.1880954424864145e-05, 'epoch': 0.91} {'loss': 0.5784, 'learning_rate': 1.1880624443096003e-05, 'epoch': 0.91} {'loss': 0.5041, 'learning_rate': 1.1880294459204995e-05, 'epoch': 0.91} {'loss': 0.5325, 'learning_rate': 1.187996447319149e-05, 'epoch': 0.91} {'loss': 0.5113, 'learning_rate': 1.1879634485055864e-05, 'epoch': 0.91} {'loss': 0.732, 'learning_rate': 1.187930449479849e-05, 'epoch': 0.91} {'loss': 0.4287, 'learning_rate': 1.1878974502419735e-05, 'epoch': 0.91} {'loss': 0.574, 'learning_rate': 1.1878644507919978e-05, 'epoch': 0.91} {'loss': 0.6166, 'learning_rate': 1.187831451129959e-05, 'epoch': 0.91} {'loss': 0.7211, 'learning_rate': 1.1877984512558937e-05, 'epoch': 0.91} {'loss': 0.5031, 'learning_rate': 1.1877654511698403e-05, 'epoch': 0.91} {'loss': 0.5996, 'learning_rate': 1.1877324508718348e-05, 'epoch': 0.91} {'loss': 0.6485, 'learning_rate': 1.1876994503619155e-05, 'epoch': 0.91} {'loss': 0.6178, 'learning_rate': 1.187666449640119e-05, 'epoch': 0.91} {'loss': 0.7311, 'learning_rate': 1.1876334487064827e-05, 'epoch': 0.91} {'loss': 0.6005, 'learning_rate': 1.187600447561044e-05, 'epoch': 0.91} {'loss': 0.6022, 'learning_rate': 1.18756744620384e-05, 'epoch': 0.91} {'loss': 0.6631, 'learning_rate': 1.1875344446349082e-05, 'epoch': 0.91} {'loss': 0.596, 'learning_rate': 1.1875014428542854e-05, 'epoch': 0.91} {'loss': 0.5684, 'learning_rate': 1.1874684408620094e-05, 'epoch': 0.91} {'loss': 0.5666, 'learning_rate': 1.187435438658117e-05, 'epoch': 0.91} {'loss': 0.745, 'learning_rate': 1.1874024362426458e-05, 'epoch': 0.91} {'loss': 0.5316, 'learning_rate': 1.1873694336156328e-05, 'epoch': 0.91} {'loss': 0.495, 'learning_rate': 1.1873364307771156e-05, 'epoch': 0.91} {'loss': 0.3853, 'learning_rate': 1.1873034277271307e-05, 'epoch': 0.91} {'loss': 0.5749, 'learning_rate': 1.187270424465716e-05, 'epoch': 0.91} {'loss': 0.5219, 'learning_rate': 1.1872374209929087e-05, 'epoch': 0.91} {'loss': 0.7308, 'learning_rate': 1.187204417308746e-05, 'epoch': 0.91} {'loss': 0.3758, 'learning_rate': 1.187171413413265e-05, 'epoch': 0.91} {'loss': 0.6206, 'learning_rate': 1.187138409306503e-05, 'epoch': 0.91} {'loss': 0.5895, 'learning_rate': 1.1871054049884975e-05, 'epoch': 0.91} {'loss': 0.5598, 'learning_rate': 1.1870724004592855e-05, 'epoch': 0.92} {'loss': 0.6031, 'learning_rate': 1.1870393957189043e-05, 'epoch': 0.92} {'loss': 0.4899, 'learning_rate': 1.1870063907673912e-05, 'epoch': 0.92} {'loss': 0.4567, 'learning_rate': 1.1869733856047835e-05, 'epoch': 0.92} {'loss': 0.3958, 'learning_rate': 1.1869403802311183e-05, 'epoch': 0.92} {'loss': 0.4526, 'learning_rate': 1.1869073746464335e-05, 'epoch': 0.92} {'loss': 0.6093, 'learning_rate': 1.1868743688507651e-05, 'epoch': 0.92} {'loss': 0.5378, 'learning_rate': 1.1868413628441515e-05, 'epoch': 0.92} {'loss': 0.4047, 'learning_rate': 1.1868083566266293e-05, 'epoch': 0.92} {'loss': 0.4961, 'learning_rate': 1.186775350198236e-05, 'epoch': 0.92} {'loss': 0.4446, 'learning_rate': 1.1867423435590089e-05, 'epoch': 0.92} {'loss': 0.5636, 'learning_rate': 1.1867093367089852e-05, 'epoch': 0.92} {'loss': 0.5721, 'learning_rate': 1.186676329648202e-05, 'epoch': 0.92} {'loss': 0.5802, 'learning_rate': 1.1866433223766971e-05, 'epoch': 0.92} {'loss': 0.4409, 'learning_rate': 1.186610314894507e-05, 'epoch': 0.92} {'loss': 0.6782, 'learning_rate': 1.1865773072016695e-05, 'epoch': 0.92} {'loss': 0.5746, 'learning_rate': 1.1865442992982216e-05, 'epoch': 0.92} {'loss': 0.4804, 'learning_rate': 1.186511291184201e-05, 'epoch': 0.92} {'loss': 0.5781, 'learning_rate': 1.1864782828596441e-05, 'epoch': 0.92} {'loss': 0.4687, 'learning_rate': 1.1864452743245892e-05, 'epoch': 0.92} {'loss': 0.6795, 'learning_rate': 1.1864122655790727e-05, 'epoch': 0.92} {'loss': 0.4905, 'learning_rate': 1.1863792566231323e-05, 'epoch': 0.92} {'loss': 0.3888, 'learning_rate': 1.186346247456805e-05, 'epoch': 0.92} {'loss': 0.5149, 'learning_rate': 1.1863132380801286e-05, 'epoch': 0.92} {'loss': 0.4738, 'learning_rate': 1.1862802284931397e-05, 'epoch': 0.92} {'loss': 0.5751, 'learning_rate': 1.1862472186958757e-05, 'epoch': 0.92} {'loss': 0.6269, 'learning_rate': 1.1862142086883743e-05, 'epoch': 0.92} {'loss': 0.7053, 'learning_rate': 1.1861811984706724e-05, 'epoch': 0.92} {'loss': 0.4424, 'learning_rate': 1.1861481880428076e-05, 'epoch': 0.92} {'loss': 0.4546, 'learning_rate': 1.1861151774048165e-05, 'epoch': 0.92} {'loss': 0.4427, 'learning_rate': 1.1860821665567367e-05, 'epoch': 0.92} {'loss': 0.5233, 'learning_rate': 1.1860491554986058e-05, 'epoch': 0.92} {'loss': 0.5341, 'learning_rate': 1.1860161442304607e-05, 'epoch': 0.92} {'loss': 0.5112, 'learning_rate': 1.1859831327523388e-05, 'epoch': 0.92} {'loss': 0.4923, 'learning_rate': 1.1859501210642772e-05, 'epoch': 0.92} {'loss': 0.5648, 'learning_rate': 1.1859171091663133e-05, 'epoch': 0.92} {'loss': 0.4714, 'learning_rate': 1.1858840970584842e-05, 'epoch': 0.92} {'loss': 0.5859, 'learning_rate': 1.1858510847408275e-05, 'epoch': 0.92} {'loss': 0.5077, 'learning_rate': 1.18581807221338e-05, 'epoch': 0.92} {'loss': 0.4995, 'learning_rate': 1.1857850594761796e-05, 'epoch': 0.92} {'loss': 0.4485, 'learning_rate': 1.185752046529263e-05, 'epoch': 0.92} {'loss': 0.5079, 'learning_rate': 1.1857190333726676e-05, 'epoch': 0.92} {'loss': 0.6712, 'learning_rate': 1.185686020006431e-05, 'epoch': 0.92} {'loss': 0.5339, 'learning_rate': 1.1856530064305902e-05, 'epoch': 0.92} {'loss': 0.5256, 'learning_rate': 1.1856199926451821e-05, 'epoch': 0.92} {'loss': 0.6945, 'learning_rate': 1.1855869786502444e-05, 'epoch': 0.92} {'loss': 0.6983, 'learning_rate': 1.1855539644458145e-05, 'epoch': 0.92} {'loss': 0.5363, 'learning_rate': 1.1855209500319293e-05, 'epoch': 0.92} {'loss': 0.4447, 'learning_rate': 1.1854879354086264e-05, 'epoch': 0.92} {'loss': 0.5072, 'learning_rate': 1.1854549205759426e-05, 'epoch': 0.92} {'loss': 0.6079, 'learning_rate': 1.1854219055339157e-05, 'epoch': 0.92} {'loss': 0.5743, 'learning_rate': 1.1853888902825827e-05, 'epoch': 0.92} {'loss': 0.4857, 'learning_rate': 1.185355874821981e-05, 'epoch': 0.92} {'loss': 0.5961, 'learning_rate': 1.1853228591521474e-05, 'epoch': 0.92} {'loss': 0.4259, 'learning_rate': 1.1852898432731197e-05, 'epoch': 0.92} {'loss': 0.4852, 'learning_rate': 1.1852568271849353e-05, 'epoch': 0.92} {'loss': 0.7198, 'learning_rate': 1.1852238108876308e-05, 'epoch': 0.92} {'loss': 0.5808, 'learning_rate': 1.185190794381244e-05, 'epoch': 0.92} {'loss': 0.5757, 'learning_rate': 1.185157777665812e-05, 'epoch': 0.92} {'loss': 0.5175, 'learning_rate': 1.1851247607413721e-05, 'epoch': 0.92} {'loss': 0.5253, 'learning_rate': 1.1850917436079614e-05, 'epoch': 0.92} {'loss': 0.4183, 'learning_rate': 1.1850587262656175e-05, 'epoch': 0.92} {'loss': 0.4764, 'learning_rate': 1.1850257087143773e-05, 'epoch': 0.92} {'loss': 0.6575, 'learning_rate': 1.1849926909542784e-05, 'epoch': 0.92} {'loss': 0.6224, 'learning_rate': 1.1849596729853579e-05, 'epoch': 0.92} {'loss': 0.5446, 'learning_rate': 1.184926654807653e-05, 'epoch': 0.92} {'loss': 0.621, 'learning_rate': 1.1848936364212012e-05, 'epoch': 0.92} {'loss': 0.5639, 'learning_rate': 1.1848606178260396e-05, 'epoch': 0.92} {'loss': 0.4767, 'learning_rate': 1.1848275990222056e-05, 'epoch': 0.92} {'loss': 0.5434, 'learning_rate': 1.1847945800097363e-05, 'epoch': 0.92} {'loss': 0.542, 'learning_rate': 1.1847615607886689e-05, 'epoch': 0.92} {'loss': 0.5951, 'learning_rate': 1.184728541359041e-05, 'epoch': 0.92} {'loss': 0.6243, 'learning_rate': 1.1846955217208898e-05, 'epoch': 0.92} {'loss': 0.5881, 'learning_rate': 1.1846625018742523e-05, 'epoch': 0.92} {'loss': 0.5249, 'learning_rate': 1.184629481819166e-05, 'epoch': 0.92} {'loss': 0.5834, 'learning_rate': 1.1845964615556683e-05, 'epoch': 0.92} {'loss': 0.6409, 'learning_rate': 1.1845634410837961e-05, 'epoch': 0.92} {'loss': 0.4303, 'learning_rate': 1.1845304204035867e-05, 'epoch': 0.92} {'loss': 0.4892, 'learning_rate': 1.1844973995150782e-05, 'epoch': 0.92} {'loss': 0.3258, 'learning_rate': 1.1844643784183068e-05, 'epoch': 0.92} {'loss': 0.5253, 'learning_rate': 1.1844313571133102e-05, 'epoch': 0.92} {'loss': 0.5032, 'learning_rate': 1.1843983356001257e-05, 'epoch': 0.92} {'loss': 0.4029, 'learning_rate': 1.1843653138787903e-05, 'epoch': 0.92} {'loss': 0.5404, 'learning_rate': 1.1843322919493417e-05, 'epoch': 0.92} {'loss': 0.4748, 'learning_rate': 1.184299269811817e-05, 'epoch': 0.92} {'loss': 0.4944, 'learning_rate': 1.1842662474662534e-05, 'epoch': 0.92} {'loss': 0.6889, 'learning_rate': 1.1842332249126885e-05, 'epoch': 0.92} {'loss': 0.7145, 'learning_rate': 1.1842002021511591e-05, 'epoch': 0.92} {'loss': 0.338, 'learning_rate': 1.1841671791817027e-05, 'epoch': 0.92} {'loss': 0.573, 'learning_rate': 1.1841341560043567e-05, 'epoch': 0.92} {'loss': 0.6852, 'learning_rate': 1.184101132619158e-05, 'epoch': 0.92} {'loss': 0.6209, 'learning_rate': 1.1840681090261445e-05, 'epoch': 0.92} {'loss': 0.6463, 'learning_rate': 1.184035085225353e-05, 'epoch': 0.92} {'loss': 0.5575, 'learning_rate': 1.1840020612168209e-05, 'epoch': 0.92} {'loss': 0.527, 'learning_rate': 1.1839690370005852e-05, 'epoch': 0.92} {'loss': 0.7824, 'learning_rate': 1.1839360125766836e-05, 'epoch': 0.92} {'loss': 0.3922, 'learning_rate': 1.1839029879451533e-05, 'epoch': 0.92} {'loss': 0.5152, 'learning_rate': 1.1838699631060313e-05, 'epoch': 0.92} {'loss': 0.5602, 'learning_rate': 1.1838369380593554e-05, 'epoch': 0.92} {'loss': 0.5391, 'learning_rate': 1.1838039128051621e-05, 'epoch': 0.92} {'loss': 0.4538, 'learning_rate': 1.1837708873434895e-05, 'epoch': 0.92} {'loss': 0.6256, 'learning_rate': 1.1837378616743745e-05, 'epoch': 0.92} {'loss': 0.6306, 'learning_rate': 1.1837048357978543e-05, 'epoch': 0.92} {'loss': 0.5016, 'learning_rate': 1.1836718097139662e-05, 'epoch': 0.92} {'loss': 0.3839, 'learning_rate': 1.1836387834227478e-05, 'epoch': 0.92} {'loss': 0.5702, 'learning_rate': 1.1836057569242359e-05, 'epoch': 0.92} {'loss': 0.4225, 'learning_rate': 1.183572730218468e-05, 'epoch': 0.92} {'loss': 0.5181, 'learning_rate': 1.1835397033054816e-05, 'epoch': 0.92} {'loss': 0.5003, 'learning_rate': 1.1835066761853135e-05, 'epoch': 0.92} {'loss': 0.5532, 'learning_rate': 1.1834736488580014e-05, 'epoch': 0.92} {'loss': 0.704, 'learning_rate': 1.1834406213235824e-05, 'epoch': 0.92} {'loss': 0.6237, 'learning_rate': 1.1834075935820939e-05, 'epoch': 0.92} {'loss': 0.3944, 'learning_rate': 1.183374565633573e-05, 'epoch': 0.92} {'loss': 0.5188, 'learning_rate': 1.1833415374780573e-05, 'epoch': 0.92} {'loss': 0.4804, 'learning_rate': 1.1833085091155837e-05, 'epoch': 0.92} {'loss': 0.5998, 'learning_rate': 1.1832754805461897e-05, 'epoch': 0.92} {'loss': 0.6762, 'learning_rate': 1.1832424517699124e-05, 'epoch': 0.92} {'loss': 0.5701, 'learning_rate': 1.1832094227867892e-05, 'epoch': 0.92} {'loss': 0.6177, 'learning_rate': 1.1831763935968577e-05, 'epoch': 0.92} {'loss': 0.6046, 'learning_rate': 1.1831433642001546e-05, 'epoch': 0.92} {'loss': 0.7681, 'learning_rate': 1.1831103345967176e-05, 'epoch': 0.92} {'loss': 0.542, 'learning_rate': 1.1830773047865838e-05, 'epoch': 0.92} {'loss': 0.5415, 'learning_rate': 1.1830442747697905e-05, 'epoch': 0.92} {'loss': 0.6452, 'learning_rate': 1.1830112445463751e-05, 'epoch': 0.92} {'loss': 0.5691, 'learning_rate': 1.1829782141163749e-05, 'epoch': 0.92} {'loss': 0.5183, 'learning_rate': 1.182945183479827e-05, 'epoch': 0.92} {'loss': 0.6956, 'learning_rate': 1.1829121526367685e-05, 'epoch': 0.92} {'loss': 0.383, 'learning_rate': 1.1828791215872372e-05, 'epoch': 0.92} {'loss': 0.4886, 'learning_rate': 1.1828460903312704e-05, 'epoch': 0.92} {'loss': 0.5567, 'learning_rate': 1.1828130588689048e-05, 'epoch': 0.92} {'loss': 0.6657, 'learning_rate': 1.1827800272001784e-05, 'epoch': 0.92} {'loss': 0.6447, 'learning_rate': 1.1827469953251275e-05, 'epoch': 0.92} {'loss': 0.5092, 'learning_rate': 1.1827139632437905e-05, 'epoch': 0.92} {'loss': 0.5561, 'learning_rate': 1.182680930956204e-05, 'epoch': 0.92} {'loss': 0.67, 'learning_rate': 1.1826478984624055e-05, 'epoch': 0.92} {'loss': 0.6725, 'learning_rate': 1.1826148657624322e-05, 'epoch': 0.92} {'loss': 0.5181, 'learning_rate': 1.1825818328563215e-05, 'epoch': 0.92} {'loss': 0.6132, 'learning_rate': 1.1825487997441106e-05, 'epoch': 0.92} {'loss': 0.6401, 'learning_rate': 1.1825157664258366e-05, 'epoch': 0.92} {'loss': 0.3813, 'learning_rate': 1.1824827329015374e-05, 'epoch': 0.92} {'loss': 0.6733, 'learning_rate': 1.1824496991712496e-05, 'epoch': 0.92} {'loss': 0.6245, 'learning_rate': 1.182416665235011e-05, 'epoch': 0.92} {'loss': 0.5037, 'learning_rate': 1.1823836310928587e-05, 'epoch': 0.92} {'loss': 0.6031, 'learning_rate': 1.18235059674483e-05, 'epoch': 0.92} {'loss': 0.6628, 'learning_rate': 1.1823175621909617e-05, 'epoch': 0.92} {'loss': 0.5939, 'learning_rate': 1.1822845274312919e-05, 'epoch': 0.92} {'loss': 0.5606, 'learning_rate': 1.1822514924658574e-05, 'epoch': 0.92} {'loss': 0.397, 'learning_rate': 1.1822184572946958e-05, 'epoch': 0.92} {'loss': 0.509, 'learning_rate': 1.1821854219178439e-05, 'epoch': 0.92} {'loss': 0.627, 'learning_rate': 1.1821523863353397e-05, 'epoch': 0.92} {'loss': 0.5612, 'learning_rate': 1.1821193505472197e-05, 'epoch': 0.92} {'loss': 0.4328, 'learning_rate': 1.1820863145535217e-05, 'epoch': 0.92} {'loss': 0.5103, 'learning_rate': 1.1820532783542831e-05, 'epoch': 0.92} {'loss': 0.6323, 'learning_rate': 1.1820202419495408e-05, 'epoch': 0.92} {'loss': 0.6556, 'learning_rate': 1.1819872053393323e-05, 'epoch': 0.92} {'loss': 0.545, 'learning_rate': 1.181954168523695e-05, 'epoch': 0.92} {'loss': 0.6128, 'learning_rate': 1.1819211315026658e-05, 'epoch': 0.92} {'loss': 0.5156, 'learning_rate': 1.1818880942762822e-05, 'epoch': 0.92} {'loss': 0.5084, 'learning_rate': 1.1818550568445817e-05, 'epoch': 0.92} {'loss': 0.5634, 'learning_rate': 1.1818220192076013e-05, 'epoch': 0.92} {'loss': 0.6178, 'learning_rate': 1.1817889813653787e-05, 'epoch': 0.92} {'loss': 0.4832, 'learning_rate': 1.1817559433179506e-05, 'epoch': 0.92} {'loss': 0.5464, 'learning_rate': 1.1817229050653546e-05, 'epoch': 0.92} {'loss': 0.5243, 'learning_rate': 1.1816898666076282e-05, 'epoch': 0.92} {'loss': 0.6913, 'learning_rate': 1.1816568279448082e-05, 'epoch': 0.92} {'loss': 0.3037, 'learning_rate': 1.1816237890769324e-05, 'epoch': 0.92} {'loss': 0.5406, 'learning_rate': 1.1815907500040378e-05, 'epoch': 0.92} {'loss': 0.5511, 'learning_rate': 1.1815577107261618e-05, 'epoch': 0.92} {'loss': 0.5404, 'learning_rate': 1.1815246712433417e-05, 'epoch': 0.92} {'loss': 0.5766, 'learning_rate': 1.181491631555615e-05, 'epoch': 0.92} {'loss': 0.5105, 'learning_rate': 1.1814585916630183e-05, 'epoch': 0.92} {'loss': 0.4613, 'learning_rate': 1.1814255515655894e-05, 'epoch': 0.92} {'loss': 0.5709, 'learning_rate': 1.1813925112633658e-05, 'epoch': 0.92} {'loss': 0.4951, 'learning_rate': 1.1813594707563845e-05, 'epoch': 0.92} {'loss': 0.5587, 'learning_rate': 1.1813264300446827e-05, 'epoch': 0.92} {'loss': 0.6163, 'learning_rate': 1.181293389128298e-05, 'epoch': 0.92} {'loss': 0.6629, 'learning_rate': 1.1812603480072675e-05, 'epoch': 0.92} {'loss': 0.6062, 'learning_rate': 1.1812273066816286e-05, 'epoch': 0.92} {'loss': 0.4876, 'learning_rate': 1.1811942651514185e-05, 'epoch': 0.92} {'loss': 0.4291, 'learning_rate': 1.1811612234166744e-05, 'epoch': 0.92} {'loss': 0.6604, 'learning_rate': 1.181128181477434e-05, 'epoch': 0.92} {'loss': 0.5302, 'learning_rate': 1.181095139333734e-05, 'epoch': 0.92} {'loss': 0.5996, 'learning_rate': 1.1810620969856121e-05, 'epoch': 0.92} {'loss': 0.5572, 'learning_rate': 1.1810290544331058e-05, 'epoch': 0.92} {'loss': 0.3222, 'learning_rate': 1.1809960116762517e-05, 'epoch': 0.92} {'loss': 0.5371, 'learning_rate': 1.1809629687150878e-05, 'epoch': 0.92} {'loss': 0.539, 'learning_rate': 1.1809299255496512e-05, 'epoch': 0.92} {'loss': 0.4959, 'learning_rate': 1.1808968821799789e-05, 'epoch': 0.92} {'loss': 0.524, 'learning_rate': 1.1808638386061085e-05, 'epoch': 0.92} {'loss': 0.6121, 'learning_rate': 1.180830794828077e-05, 'epoch': 0.92} {'loss': 0.5119, 'learning_rate': 1.1807977508459223e-05, 'epoch': 0.92} {'loss': 0.4987, 'learning_rate': 1.1807647066596812e-05, 'epoch': 0.92} {'loss': 0.5576, 'learning_rate': 1.1807316622693911e-05, 'epoch': 0.92} {'loss': 0.6958, 'learning_rate': 1.1806986176750894e-05, 'epoch': 0.92} {'loss': 0.4202, 'learning_rate': 1.180665572876813e-05, 'epoch': 0.92} {'loss': 0.542, 'learning_rate': 1.1806325278745998e-05, 'epoch': 0.92} {'loss': 0.5178, 'learning_rate': 1.1805994826684868e-05, 'epoch': 0.92} {'loss': 0.5089, 'learning_rate': 1.1805664372585112e-05, 'epoch': 0.92} {'loss': 0.6107, 'learning_rate': 1.1805333916447106e-05, 'epoch': 0.92} {'loss': 0.5429, 'learning_rate': 1.1805003458271221e-05, 'epoch': 0.92} {'loss': 0.4847, 'learning_rate': 1.1804672998057828e-05, 'epoch': 0.92} {'loss': 0.6423, 'learning_rate': 1.1804342535807304e-05, 'epoch': 0.92} {'loss': 0.5576, 'learning_rate': 1.1804012071520022e-05, 'epoch': 0.92} {'loss': 0.5224, 'learning_rate': 1.1803681605196352e-05, 'epoch': 0.92} {'loss': 0.6318, 'learning_rate': 1.1803351136836669e-05, 'epoch': 0.92} {'loss': 0.5744, 'learning_rate': 1.1803020666441345e-05, 'epoch': 0.92} {'loss': 0.5643, 'learning_rate': 1.1802690194010753e-05, 'epoch': 0.92} {'loss': 0.5613, 'learning_rate': 1.1802359719545266e-05, 'epoch': 0.92} {'loss': 0.5376, 'learning_rate': 1.1802029243045258e-05, 'epoch': 0.92} {'loss': 0.5396, 'learning_rate': 1.1801698764511105e-05, 'epoch': 0.92} {'loss': 0.5342, 'learning_rate': 1.1801368283943173e-05, 'epoch': 0.92} {'loss': 0.4825, 'learning_rate': 1.180103780134184e-05, 'epoch': 0.92} {'loss': 0.5133, 'learning_rate': 1.1800707316707479e-05, 'epoch': 0.92} {'loss': 0.4535, 'learning_rate': 1.1800376830040459e-05, 'epoch': 0.92} {'loss': 0.5175, 'learning_rate': 1.1800046341341155e-05, 'epoch': 0.92} {'loss': 0.703, 'learning_rate': 1.1799715850609945e-05, 'epoch': 0.92} {'loss': 0.4874, 'learning_rate': 1.1799385357847195e-05, 'epoch': 0.92} {'loss': 0.5236, 'learning_rate': 1.1799054863053282e-05, 'epoch': 0.92} {'loss': 0.5936, 'learning_rate': 1.179872436622858e-05, 'epoch': 0.92} {'loss': 0.5898, 'learning_rate': 1.1798393867373459e-05, 'epoch': 0.92} {'loss': 0.4981, 'learning_rate': 1.1798063366488293e-05, 'epoch': 0.92} {'loss': 0.5928, 'learning_rate': 1.1797732863573454e-05, 'epoch': 0.92} {'loss': 0.5017, 'learning_rate': 1.1797402358629317e-05, 'epoch': 0.92} {'loss': 0.5005, 'learning_rate': 1.1797071851656256e-05, 'epoch': 0.92} {'loss': 0.5441, 'learning_rate': 1.1796741342654643e-05, 'epoch': 0.92} {'loss': 0.6095, 'learning_rate': 1.1796410831624849e-05, 'epoch': 0.92} {'loss': 0.5897, 'learning_rate': 1.1796080318567249e-05, 'epoch': 0.92} {'loss': 0.6198, 'learning_rate': 1.179574980348222e-05, 'epoch': 0.92} {'loss': 0.4907, 'learning_rate': 1.1795419286370126e-05, 'epoch': 0.92} {'loss': 0.58, 'learning_rate': 1.1795088767231346e-05, 'epoch': 0.92} {'loss': 0.6736, 'learning_rate': 1.1794758246066254e-05, 'epoch': 0.92} {'loss': 0.5153, 'learning_rate': 1.179442772287522e-05, 'epoch': 0.92} {'loss': 0.4828, 'learning_rate': 1.1794097197658616e-05, 'epoch': 0.92} {'loss': 0.7141, 'learning_rate': 1.1793766670416819e-05, 'epoch': 0.92} {'loss': 0.5715, 'learning_rate': 1.1793436141150204e-05, 'epoch': 0.92} {'loss': 0.6194, 'learning_rate': 1.1793105609859137e-05, 'epoch': 0.92} {'loss': 0.5171, 'learning_rate': 1.1792775076543994e-05, 'epoch': 0.92} {'loss': 0.3756, 'learning_rate': 1.179244454120515e-05, 'epoch': 0.92} {'loss': 0.5359, 'learning_rate': 1.1792114003842978e-05, 'epoch': 0.92} {'loss': 0.7052, 'learning_rate': 1.1791783464457848e-05, 'epoch': 0.92} {'loss': 0.5805, 'learning_rate': 1.179145292305014e-05, 'epoch': 0.92} {'loss': 0.6845, 'learning_rate': 1.1791122379620217e-05, 'epoch': 0.92} {'loss': 0.6245, 'learning_rate': 1.1790791834168461e-05, 'epoch': 0.92} {'loss': 0.5194, 'learning_rate': 1.1790461286695238e-05, 'epoch': 0.92} {'loss': 0.4999, 'learning_rate': 1.1790130737200927e-05, 'epoch': 0.92} {'loss': 0.4659, 'learning_rate': 1.1789800185685897e-05, 'epoch': 0.92} {'loss': 0.5918, 'learning_rate': 1.1789469632150526e-05, 'epoch': 0.92} {'loss': 0.5475, 'learning_rate': 1.1789139076595182e-05, 'epoch': 0.92} {'loss': 0.5971, 'learning_rate': 1.1788808519020241e-05, 'epoch': 0.92} {'loss': 0.6807, 'learning_rate': 1.1788477959426072e-05, 'epoch': 0.92} {'loss': 0.4963, 'learning_rate': 1.1788147397813057e-05, 'epoch': 0.92} {'loss': 0.5853, 'learning_rate': 1.178781683418156e-05, 'epoch': 0.92} {'loss': 0.7298, 'learning_rate': 1.1787486268531959e-05, 'epoch': 0.92} {'loss': 0.639, 'learning_rate': 1.1787155700864627e-05, 'epoch': 0.92} {'loss': 0.6143, 'learning_rate': 1.1786825131179934e-05, 'epoch': 0.92} {'loss': 0.3908, 'learning_rate': 1.1786494559478257e-05, 'epoch': 0.92} {'loss': 0.6699, 'learning_rate': 1.1786163985759966e-05, 'epoch': 0.92} {'loss': 0.6331, 'learning_rate': 1.1785833410025436e-05, 'epoch': 0.92} {'loss': 0.5502, 'learning_rate': 1.1785502832275038e-05, 'epoch': 0.92} {'loss': 0.309, 'learning_rate': 1.1785172252509146e-05, 'epoch': 0.92} {'loss': 0.5085, 'learning_rate': 1.1784841670728138e-05, 'epoch': 0.92} {'loss': 0.5862, 'learning_rate': 1.1784511086932383e-05, 'epoch': 0.92} {'loss': 0.6586, 'learning_rate': 1.178418050112225e-05, 'epoch': 0.92} {'loss': 0.7654, 'learning_rate': 1.178384991329812e-05, 'epoch': 0.92} {'loss': 0.6226, 'learning_rate': 1.1783519323460361e-05, 'epoch': 0.92} {'loss': 0.3978, 'learning_rate': 1.178318873160935e-05, 'epoch': 0.92} {'loss': 0.589, 'learning_rate': 1.1782858137745457e-05, 'epoch': 0.92} {'loss': 0.6406, 'learning_rate': 1.1782527541869055e-05, 'epoch': 0.92} {'loss': 0.5989, 'learning_rate': 1.178219694398052e-05, 'epoch': 0.92} {'loss': 0.6057, 'learning_rate': 1.1781866344080221e-05, 'epoch': 0.92} {'loss': 0.6588, 'learning_rate': 1.1781535742168537e-05, 'epoch': 0.92} {'loss': 0.524, 'learning_rate': 1.1781205138245835e-05, 'epoch': 0.92} {'loss': 0.576, 'learning_rate': 1.1780874532312494e-05, 'epoch': 0.92} {'loss': 0.5115, 'learning_rate': 1.1780543924368881e-05, 'epoch': 0.92} {'loss': 0.5873, 'learning_rate': 1.1780213314415376e-05, 'epoch': 0.92} {'loss': 0.5452, 'learning_rate': 1.1779882702452346e-05, 'epoch': 0.92} {'loss': 0.633, 'learning_rate': 1.1779552088480169e-05, 'epoch': 0.92} {'loss': 0.6288, 'learning_rate': 1.1779221472499216e-05, 'epoch': 0.92} {'loss': 0.5612, 'learning_rate': 1.1778890854509859e-05, 'epoch': 0.92} {'loss': 0.4032, 'learning_rate': 1.1778560234512472e-05, 'epoch': 0.92} {'loss': 0.5119, 'learning_rate': 1.177822961250743e-05, 'epoch': 0.92} {'loss': 0.4799, 'learning_rate': 1.1777898988495104e-05, 'epoch': 0.92} {'loss': 0.637, 'learning_rate': 1.1777568362475869e-05, 'epoch': 0.92} {'loss': 0.5168, 'learning_rate': 1.1777237734450098e-05, 'epoch': 0.92} {'loss': 0.4167, 'learning_rate': 1.1776907104418163e-05, 'epoch': 0.92} {'loss': 0.5684, 'learning_rate': 1.1776576472380437e-05, 'epoch': 0.92} {'loss': 0.6001, 'learning_rate': 1.1776245838337292e-05, 'epoch': 0.92} {'loss': 0.5769, 'learning_rate': 1.1775915202289106e-05, 'epoch': 0.92} {'loss': 0.4229, 'learning_rate': 1.1775584564236248e-05, 'epoch': 0.92} {'loss': 0.5196, 'learning_rate': 1.1775253924179096e-05, 'epoch': 0.92} {'loss': 0.5102, 'learning_rate': 1.1774923282118019e-05, 'epoch': 0.92} {'loss': 0.5284, 'learning_rate': 1.1774592638053389e-05, 'epoch': 0.92} {'loss': 0.6063, 'learning_rate': 1.177426199198558e-05, 'epoch': 0.92} {'loss': 0.5068, 'learning_rate': 1.177393134391497e-05, 'epoch': 0.92} {'loss': 0.4637, 'learning_rate': 1.1773600693841926e-05, 'epoch': 0.92} {'loss': 0.5504, 'learning_rate': 1.1773270041766826e-05, 'epoch': 0.92} {'loss': 0.5088, 'learning_rate': 1.1772939387690042e-05, 'epoch': 0.92} {'loss': 0.7513, 'learning_rate': 1.1772608731611945e-05, 'epoch': 0.92} {'loss': 0.6599, 'learning_rate': 1.177227807353291e-05, 'epoch': 0.92} {'loss': 0.4866, 'learning_rate': 1.177194741345331e-05, 'epoch': 0.92} {'loss': 0.6297, 'learning_rate': 1.1771616751373518e-05, 'epoch': 0.92} {'loss': 0.4667, 'learning_rate': 1.1771286087293908e-05, 'epoch': 0.92} {'loss': 0.5641, 'learning_rate': 1.1770955421214853e-05, 'epoch': 0.92} {'loss': 0.5292, 'learning_rate': 1.1770624753136727e-05, 'epoch': 0.92} {'loss': 0.4862, 'learning_rate': 1.1770294083059903e-05, 'epoch': 0.92} {'loss': 0.7311, 'learning_rate': 1.1769963410984753e-05, 'epoch': 0.92} {'loss': 0.7064, 'learning_rate': 1.176963273691165e-05, 'epoch': 0.92} {'loss': 0.6688, 'learning_rate': 1.1769302060840965e-05, 'epoch': 0.92} {'loss': 0.6182, 'learning_rate': 1.1768971382773079e-05, 'epoch': 0.92} {'loss': 0.5651, 'learning_rate': 1.1768640702708357e-05, 'epoch': 0.92} {'loss': 0.4078, 'learning_rate': 1.176831002064718e-05, 'epoch': 0.92} {'loss': 0.3646, 'learning_rate': 1.1767979336589916e-05, 'epoch': 0.92} {'loss': 0.5137, 'learning_rate': 1.1767648650536938e-05, 'epoch': 0.92} {'loss': 0.6331, 'learning_rate': 1.1767317962488622e-05, 'epoch': 0.92} {'loss': 0.5754, 'learning_rate': 1.1766987272445341e-05, 'epoch': 0.92} {'loss': 0.5686, 'learning_rate': 1.1766656580407465e-05, 'epoch': 0.92} {'loss': 0.4642, 'learning_rate': 1.1766325886375372e-05, 'epoch': 0.92} {'loss': 0.671, 'learning_rate': 1.176599519034943e-05, 'epoch': 0.92} {'loss': 0.601, 'learning_rate': 1.1765664492330018e-05, 'epoch': 0.92} {'loss': 0.4558, 'learning_rate': 1.1765333792317506e-05, 'epoch': 0.92} {'loss': 0.7101, 'learning_rate': 1.1765003090312265e-05, 'epoch': 0.92} {'loss': 0.462, 'learning_rate': 1.1764672386314674e-05, 'epoch': 0.92} {'loss': 0.5447, 'learning_rate': 1.1764341680325104e-05, 'epoch': 0.92} {'loss': 0.4722, 'learning_rate': 1.1764010972343927e-05, 'epoch': 0.92} {'loss': 0.7352, 'learning_rate': 1.1763680262371517e-05, 'epoch': 0.92} {'loss': 0.5101, 'learning_rate': 1.1763349550408247e-05, 'epoch': 0.92} {'loss': 0.6416, 'learning_rate': 1.176301883645449e-05, 'epoch': 0.92} {'loss': 0.7636, 'learning_rate': 1.1762688120510624e-05, 'epoch': 0.92} {'loss': 0.36, 'learning_rate': 1.1762357402577013e-05, 'epoch': 0.92} {'loss': 0.5075, 'learning_rate': 1.176202668265404e-05, 'epoch': 0.92} {'loss': 0.6288, 'learning_rate': 1.176169596074207e-05, 'epoch': 0.92} {'loss': 0.6767, 'learning_rate': 1.1761365236841483e-05, 'epoch': 0.92} {'loss': 0.6914, 'learning_rate': 1.1761034510952648e-05, 'epoch': 0.92} {'loss': 0.6708, 'learning_rate': 1.176070378307594e-05, 'epoch': 0.92} {'loss': 0.4616, 'learning_rate': 1.1760373053211732e-05, 'epoch': 0.92} {'loss': 0.5155, 'learning_rate': 1.1760042321360401e-05, 'epoch': 0.92} {'loss': 0.5151, 'learning_rate': 1.1759711587522314e-05, 'epoch': 0.92} {'loss': 0.4623, 'learning_rate': 1.1759380851697846e-05, 'epoch': 0.92} {'loss': 0.5268, 'learning_rate': 1.1759050113887373e-05, 'epoch': 0.92} {'loss': 0.6854, 'learning_rate': 1.1758719374091268e-05, 'epoch': 0.92} {'loss': 0.6481, 'learning_rate': 1.1758388632309903e-05, 'epoch': 0.92} {'loss': 0.4694, 'learning_rate': 1.1758057888543651e-05, 'epoch': 0.92} {'loss': 0.6047, 'learning_rate': 1.1757727142792885e-05, 'epoch': 0.92} {'loss': 0.5953, 'learning_rate': 1.175739639505798e-05, 'epoch': 0.92} {'loss': 0.5433, 'learning_rate': 1.1757065645339309e-05, 'epoch': 0.92} {'loss': 0.5568, 'learning_rate': 1.1756734893637246e-05, 'epoch': 0.92} {'loss': 0.503, 'learning_rate': 1.1756404139952163e-05, 'epoch': 0.92} {'loss': 0.5729, 'learning_rate': 1.175607338428443e-05, 'epoch': 0.92} {'loss': 0.5059, 'learning_rate': 1.1755742626634427e-05, 'epoch': 0.92} {'loss': 0.4122, 'learning_rate': 1.1755411867002526e-05, 'epoch': 0.92} {'loss': 0.6414, 'learning_rate': 1.1755081105389096e-05, 'epoch': 0.92} {'loss': 0.5751, 'learning_rate': 1.1754750341794514e-05, 'epoch': 0.92} {'loss': 0.5301, 'learning_rate': 1.1754419576219154e-05, 'epoch': 0.92} {'loss': 0.5743, 'learning_rate': 1.1754088808663388e-05, 'epoch': 0.92} {'loss': 0.5127, 'learning_rate': 1.175375803912759e-05, 'epoch': 0.92} {'loss': 0.7214, 'learning_rate': 1.175342726761213e-05, 'epoch': 0.92} {'loss': 0.6629, 'learning_rate': 1.1753096494117385e-05, 'epoch': 0.92} {'loss': 0.5308, 'learning_rate': 1.1752765718643726e-05, 'epoch': 0.92} {'loss': 0.4503, 'learning_rate': 1.1752434941191528e-05, 'epoch': 0.92} {'loss': 0.5407, 'learning_rate': 1.1752104161761167e-05, 'epoch': 0.92} {'loss': 0.56, 'learning_rate': 1.175177338035301e-05, 'epoch': 0.92} {'loss': 0.4531, 'learning_rate': 1.1751442596967438e-05, 'epoch': 0.92} {'loss': 0.566, 'learning_rate': 1.1751111811604817e-05, 'epoch': 0.92} {'loss': 0.6295, 'learning_rate': 1.1750781024265524e-05, 'epoch': 0.92} {'loss': 0.5422, 'learning_rate': 1.1750450234949933e-05, 'epoch': 0.92} {'loss': 0.5943, 'learning_rate': 1.1750119443658417e-05, 'epoch': 0.92} {'loss': 0.4341, 'learning_rate': 1.174978865039135e-05, 'epoch': 0.92} {'loss': 0.5634, 'learning_rate': 1.1749457855149102e-05, 'epoch': 0.92} {'loss': 0.5944, 'learning_rate': 1.1749127057932049e-05, 'epoch': 0.92} {'loss': 0.5611, 'learning_rate': 1.1748796258740565e-05, 'epoch': 0.92} {'loss': 0.6243, 'learning_rate': 1.1748465457575022e-05, 'epoch': 0.92} {'loss': 0.5689, 'learning_rate': 1.1748134654435795e-05, 'epoch': 0.92} {'loss': 0.6278, 'learning_rate': 1.1747803849323254e-05, 'epoch': 0.92} {'loss': 0.5243, 'learning_rate': 1.1747473042237777e-05, 'epoch': 0.92} {'loss': 0.4724, 'learning_rate': 1.1747142233179735e-05, 'epoch': 0.92} {'loss': 0.4568, 'learning_rate': 1.1746811422149502e-05, 'epoch': 0.92} {'loss': 0.5511, 'learning_rate': 1.1746480609147453e-05, 'epoch': 0.92} {'loss': 0.5032, 'learning_rate': 1.1746149794173956e-05, 'epoch': 0.92} {'loss': 0.5537, 'learning_rate': 1.1745818977229388e-05, 'epoch': 0.92} {'loss': 0.4667, 'learning_rate': 1.1745488158314124e-05, 'epoch': 0.92} {'loss': 0.4807, 'learning_rate': 1.1745157337428537e-05, 'epoch': 0.92} {'loss': 0.4964, 'learning_rate': 1.1744826514572996e-05, 'epoch': 0.92} {'loss': 0.5513, 'learning_rate': 1.1744495689747879e-05, 'epoch': 0.92} {'loss': 0.4475, 'learning_rate': 1.1744164862953558e-05, 'epoch': 0.92} {'loss': 0.4256, 'learning_rate': 1.1743834034190406e-05, 'epoch': 0.92} {'loss': 0.5993, 'learning_rate': 1.1743503203458796e-05, 'epoch': 0.92} {'loss': 0.6407, 'learning_rate': 1.1743172370759106e-05, 'epoch': 0.92} {'loss': 0.5035, 'learning_rate': 1.1742841536091705e-05, 'epoch': 0.92} {'loss': 0.5939, 'learning_rate': 1.1742510699456964e-05, 'epoch': 0.92} {'loss': 0.4516, 'learning_rate': 1.1742179860855265e-05, 'epoch': 0.92} {'loss': 0.7537, 'learning_rate': 1.1741849020286973e-05, 'epoch': 0.92} {'loss': 0.5434, 'learning_rate': 1.1741518177752465e-05, 'epoch': 0.92} {'loss': 0.6476, 'learning_rate': 1.1741187333252113e-05, 'epoch': 0.92} {'loss': 0.5959, 'learning_rate': 1.1740856486786294e-05, 'epoch': 0.92} {'loss': 0.5441, 'learning_rate': 1.1740525638355378e-05, 'epoch': 0.92} {'loss': 0.4953, 'learning_rate': 1.1740194787959738e-05, 'epoch': 0.92} {'loss': 0.5887, 'learning_rate': 1.1739863935599752e-05, 'epoch': 0.92} {'loss': 0.533, 'learning_rate': 1.1739533081275786e-05, 'epoch': 0.92} {'loss': 0.5713, 'learning_rate': 1.1739202224988222e-05, 'epoch': 0.92} {'loss': 0.6188, 'learning_rate': 1.1738871366737427e-05, 'epoch': 0.92} {'loss': 0.4821, 'learning_rate': 1.1738540506523779e-05, 'epoch': 0.92} {'loss': 0.5763, 'learning_rate': 1.1738209644347646e-05, 'epoch': 0.92} {'loss': 0.5282, 'learning_rate': 1.1737878780209408e-05, 'epoch': 0.92} {'loss': 0.4932, 'learning_rate': 1.1737547914109436e-05, 'epoch': 0.92} {'loss': 0.4863, 'learning_rate': 1.1737217046048104e-05, 'epoch': 0.92} {'loss': 0.3978, 'learning_rate': 1.1736886176025782e-05, 'epoch': 0.92} {'loss': 0.7545, 'learning_rate': 1.1736555304042845e-05, 'epoch': 0.92} {'loss': 0.571, 'learning_rate': 1.1736224430099665e-05, 'epoch': 0.92} {'loss': 0.6939, 'learning_rate': 1.1735893554196622e-05, 'epoch': 0.92} {'loss': 0.4563, 'learning_rate': 1.1735562676334085e-05, 'epoch': 0.92} {'loss': 0.6635, 'learning_rate': 1.1735231796512425e-05, 'epoch': 0.92} {'loss': 0.7109, 'learning_rate': 1.1734900914732018e-05, 'epoch': 0.92} {'loss': 0.5775, 'learning_rate': 1.1734570030993241e-05, 'epoch': 0.92} {'loss': 0.6887, 'learning_rate': 1.1734239145296463e-05, 'epoch': 0.92} {'loss': 0.5137, 'learning_rate': 1.1733908257642059e-05, 'epoch': 0.92} {'loss': 0.5693, 'learning_rate': 1.1733577368030402e-05, 'epoch': 0.92} {'loss': 0.4518, 'learning_rate': 1.1733246476461866e-05, 'epoch': 0.92} {'loss': 0.5428, 'learning_rate': 1.1732915582936824e-05, 'epoch': 0.92} {'loss': 0.4443, 'learning_rate': 1.1732584687455648e-05, 'epoch': 0.92} {'loss': 0.544, 'learning_rate': 1.1732253790018717e-05, 'epoch': 0.92} {'loss': 0.4967, 'learning_rate': 1.17319228906264e-05, 'epoch': 0.92} {'loss': 0.6837, 'learning_rate': 1.1731591989279068e-05, 'epoch': 0.92} {'loss': 0.59, 'learning_rate': 1.17312610859771e-05, 'epoch': 0.92} {'loss': 0.5472, 'learning_rate': 1.173093018072087e-05, 'epoch': 0.92} {'loss': 0.6732, 'learning_rate': 1.1730599273510745e-05, 'epoch': 0.92} {'loss': 0.6122, 'learning_rate': 1.1730268364347107e-05, 'epoch': 0.92} {'loss': 0.6227, 'learning_rate': 1.1729937453230322e-05, 'epoch': 0.92} {'loss': 0.6747, 'learning_rate': 1.1729606540160768e-05, 'epoch': 0.92} {'loss': 0.6579, 'learning_rate': 1.1729275625138816e-05, 'epoch': 0.92} {'loss': 0.4259, 'learning_rate': 1.172894470816484e-05, 'epoch': 0.92} {'loss': 0.5736, 'learning_rate': 1.1728613789239214e-05, 'epoch': 0.92} {'loss': 0.4969, 'learning_rate': 1.1728282868362313e-05, 'epoch': 0.92} {'loss': 0.5216, 'learning_rate': 1.172795194553451e-05, 'epoch': 0.92} {'loss': 0.4905, 'learning_rate': 1.1727621020756177e-05, 'epoch': 0.92} {'loss': 0.4243, 'learning_rate': 1.1727290094027687e-05, 'epoch': 0.92} {'loss': 0.5959, 'learning_rate': 1.1726959165349416e-05, 'epoch': 0.92} {'loss': 0.5832, 'learning_rate': 1.1726628234721738e-05, 'epoch': 0.92} {'loss': 0.4747, 'learning_rate': 1.1726297302145023e-05, 'epoch': 0.92} {'loss': 0.592, 'learning_rate': 1.1725966367619647e-05, 'epoch': 0.92} {'loss': 0.5093, 'learning_rate': 1.1725635431145985e-05, 'epoch': 0.92} {'loss': 0.6267, 'learning_rate': 1.1725304492724407e-05, 'epoch': 0.92} {'loss': 0.566, 'learning_rate': 1.172497355235529e-05, 'epoch': 0.92} {'loss': 0.6098, 'learning_rate': 1.1724642610039003e-05, 'epoch': 0.92} {'loss': 0.4191, 'learning_rate': 1.1724311665775925e-05, 'epoch': 0.92} {'loss': 0.4517, 'learning_rate': 1.1723980719566425e-05, 'epoch': 0.92} {'loss': 0.5052, 'learning_rate': 1.172364977141088e-05, 'epoch': 0.92} {'loss': 0.6633, 'learning_rate': 1.1723318821309662e-05, 'epoch': 0.92} {'loss': 0.6147, 'learning_rate': 1.1722987869263145e-05, 'epoch': 0.92} {'loss': 0.4726, 'learning_rate': 1.1722656915271702e-05, 'epoch': 0.92} {'loss': 0.7606, 'learning_rate': 1.1722325959335706e-05, 'epoch': 0.92} {'loss': 0.7433, 'learning_rate': 1.172199500145553e-05, 'epoch': 0.92} {'loss': 0.6273, 'learning_rate': 1.1721664041631552e-05, 'epoch': 0.92} {'loss': 0.5849, 'learning_rate': 1.1721333079864146e-05, 'epoch': 0.92} {'loss': 0.5221, 'learning_rate': 1.1721002116153676e-05, 'epoch': 0.92} {'loss': 0.591, 'learning_rate': 1.1720671150500525e-05, 'epoch': 0.92} {'loss': 0.3872, 'learning_rate': 1.1720340182905064e-05, 'epoch': 0.92} {'loss': 0.4005, 'learning_rate': 1.1720009213367663e-05, 'epoch': 0.92} {'loss': 0.3714, 'learning_rate': 1.1719678241888702e-05, 'epoch': 0.92} {'loss': 0.6001, 'learning_rate': 1.1719347268468548e-05, 'epoch': 0.92} {'loss': 0.509, 'learning_rate': 1.1719016293107579e-05, 'epoch': 0.92} {'loss': 0.6194, 'learning_rate': 1.1718685315806169e-05, 'epoch': 0.92} {'loss': 0.4346, 'learning_rate': 1.1718354336564688e-05, 'epoch': 0.92} {'loss': 0.5831, 'learning_rate': 1.1718023355383515e-05, 'epoch': 0.92} {'loss': 0.5478, 'learning_rate': 1.1717692372263016e-05, 'epoch': 0.92} {'loss': 0.4672, 'learning_rate': 1.1717361387203572e-05, 'epoch': 0.92} {'loss': 0.6651, 'learning_rate': 1.1717030400205551e-05, 'epoch': 0.92} {'loss': 0.4125, 'learning_rate': 1.1716699411269332e-05, 'epoch': 0.92} {'loss': 0.506, 'learning_rate': 1.1716368420395284e-05, 'epoch': 0.92} {'loss': 0.4917, 'learning_rate': 1.1716037427583784e-05, 'epoch': 0.92} {'loss': 0.551, 'learning_rate': 1.1715706432835203e-05, 'epoch': 0.92} {'loss': 0.6172, 'learning_rate': 1.1715375436149915e-05, 'epoch': 0.92} {'loss': 0.4414, 'learning_rate': 1.1715044437528295e-05, 'epoch': 0.92} {'loss': 0.5025, 'learning_rate': 1.1714713436970717e-05, 'epoch': 0.92} {'loss': 0.3982, 'learning_rate': 1.1714382434477551e-05, 'epoch': 0.92} {'loss': 0.5276, 'learning_rate': 1.1714051430049176e-05, 'epoch': 0.92} {'loss': 0.6596, 'learning_rate': 1.171372042368596e-05, 'epoch': 0.92} {'loss': 0.5462, 'learning_rate': 1.1713389415388285e-05, 'epoch': 0.92} {'loss': 0.6068, 'learning_rate': 1.1713058405156516e-05, 'epoch': 0.92} {'loss': 0.4695, 'learning_rate': 1.171272739299103e-05, 'epoch': 0.92} {'loss': 0.6214, 'learning_rate': 1.1712396378892199e-05, 'epoch': 0.92} {'loss': 0.5642, 'learning_rate': 1.1712065362860399e-05, 'epoch': 0.92} {'loss': 0.753, 'learning_rate': 1.1711734344896002e-05, 'epoch': 0.92} {'loss': 0.5097, 'learning_rate': 1.1711403324999384e-05, 'epoch': 0.92} {'loss': 0.5603, 'learning_rate': 1.1711072303170916e-05, 'epoch': 0.93} {'loss': 0.4379, 'learning_rate': 1.1710741279410973e-05, 'epoch': 0.93} {'loss': 0.5012, 'learning_rate': 1.1710410253719928e-05, 'epoch': 0.93} {'loss': 0.6181, 'learning_rate': 1.1710079226098155e-05, 'epoch': 0.93} {'loss': 0.5237, 'learning_rate': 1.1709748196546027e-05, 'epoch': 0.93} {'loss': 0.4285, 'learning_rate': 1.1709417165063921e-05, 'epoch': 0.93} {'loss': 0.6364, 'learning_rate': 1.1709086131652208e-05, 'epoch': 0.93} {'loss': 0.5127, 'learning_rate': 1.1708755096311262e-05, 'epoch': 0.93} {'loss': 0.5519, 'learning_rate': 1.1708424059041454e-05, 'epoch': 0.93} {'loss': 0.5607, 'learning_rate': 1.1708093019843161e-05, 'epoch': 0.93} {'loss': 0.4297, 'learning_rate': 1.1707761978716757e-05, 'epoch': 0.93} {'loss': 0.67, 'learning_rate': 1.1707430935662612e-05, 'epoch': 0.93} {'loss': 0.5595, 'learning_rate': 1.1707099890681101e-05, 'epoch': 0.93} {'loss': 0.5042, 'learning_rate': 1.1706768843772603e-05, 'epoch': 0.93} {'loss': 0.5317, 'learning_rate': 1.1706437794937487e-05, 'epoch': 0.93} {'loss': 0.5279, 'learning_rate': 1.1706106744176125e-05, 'epoch': 0.93} {'loss': 0.5284, 'learning_rate': 1.1705775691488893e-05, 'epoch': 0.93} {'loss': 0.5649, 'learning_rate': 1.1705444636876167e-05, 'epoch': 0.93} {'loss': 0.4863, 'learning_rate': 1.1705113580338315e-05, 'epoch': 0.93} {'loss': 0.4352, 'learning_rate': 1.170478252187572e-05, 'epoch': 0.93} {'loss': 0.6427, 'learning_rate': 1.1704451461488744e-05, 'epoch': 0.93} {'loss': 0.5675, 'learning_rate': 1.1704120399177768e-05, 'epoch': 0.93} {'loss': 0.5936, 'learning_rate': 1.1703789334943163e-05, 'epoch': 0.93} {'loss': 0.5371, 'learning_rate': 1.1703458268785307e-05, 'epoch': 0.93} {'loss': 0.5534, 'learning_rate': 1.1703127200704567e-05, 'epoch': 0.93} {'loss': 0.4928, 'learning_rate': 1.1702796130701322e-05, 'epoch': 0.93} {'loss': 0.5349, 'learning_rate': 1.1702465058775943e-05, 'epoch': 0.93} {'loss': 0.5968, 'learning_rate': 1.1702133984928804e-05, 'epoch': 0.93} {'loss': 0.536, 'learning_rate': 1.1701802909160282e-05, 'epoch': 0.93} {'loss': 0.2469, 'learning_rate': 1.1701471831470748e-05, 'epoch': 0.93} {'loss': 0.4923, 'learning_rate': 1.1701140751860574e-05, 'epoch': 0.93} {'loss': 0.5923, 'learning_rate': 1.1700809670330136e-05, 'epoch': 0.93} {'loss': 0.5572, 'learning_rate': 1.1700478586879807e-05, 'epoch': 0.93} {'loss': 0.4894, 'learning_rate': 1.1700147501509962e-05, 'epoch': 0.93} {'loss': 0.5092, 'learning_rate': 1.1699816414220973e-05, 'epoch': 0.93} {'loss': 0.4721, 'learning_rate': 1.1699485325013216e-05, 'epoch': 0.93} {'loss': 0.5328, 'learning_rate': 1.1699154233887063e-05, 'epoch': 0.93} {'loss': 0.6509, 'learning_rate': 1.1698823140842885e-05, 'epoch': 0.93} {'loss': 0.5368, 'learning_rate': 1.1698492045881062e-05, 'epoch': 0.93} {'loss': 0.5653, 'learning_rate': 1.1698160949001961e-05, 'epoch': 0.93} {'loss': 0.5837, 'learning_rate': 1.1697829850205964e-05, 'epoch': 0.93} {'loss': 0.6107, 'learning_rate': 1.1697498749493436e-05, 'epoch': 0.93} {'loss': 0.6594, 'learning_rate': 1.169716764686476e-05, 'epoch': 0.93} {'loss': 0.5997, 'learning_rate': 1.16968365423203e-05, 'epoch': 0.93} {'loss': 0.5025, 'learning_rate': 1.1696505435860435e-05, 'epoch': 0.93} {'loss': 0.546, 'learning_rate': 1.1696174327485537e-05, 'epoch': 0.93} {'loss': 0.4765, 'learning_rate': 1.1695843217195982e-05, 'epoch': 0.93} {'loss': 0.588, 'learning_rate': 1.1695512104992142e-05, 'epoch': 0.93} {'loss': 0.586, 'learning_rate': 1.1695180990874391e-05, 'epoch': 0.93} {'loss': 0.5412, 'learning_rate': 1.1694849874843103e-05, 'epoch': 0.93} {'loss': 0.4423, 'learning_rate': 1.1694518756898652e-05, 'epoch': 0.93} {'loss': 0.4877, 'learning_rate': 1.1694187637041413e-05, 'epoch': 0.93} {'loss': 0.4996, 'learning_rate': 1.1693856515271756e-05, 'epoch': 0.93} {'loss': 0.4489, 'learning_rate': 1.1693525391590058e-05, 'epoch': 0.93} {'loss': 0.4342, 'learning_rate': 1.1693194265996693e-05, 'epoch': 0.93} {'loss': 0.5697, 'learning_rate': 1.1692863138492031e-05, 'epoch': 0.93} {'loss': 0.6007, 'learning_rate': 1.1692532009076452e-05, 'epoch': 0.93} {'loss': 0.636, 'learning_rate': 1.1692200877750324e-05, 'epoch': 0.93} {'loss': 0.4967, 'learning_rate': 1.1691869744514025e-05, 'epoch': 0.93} {'loss': 0.6673, 'learning_rate': 1.1691538609367924e-05, 'epoch': 0.93} {'loss': 0.5818, 'learning_rate': 1.1691207472312398e-05, 'epoch': 0.93} {'loss': 0.4363, 'learning_rate': 1.169087633334782e-05, 'epoch': 0.93} {'loss': 0.5024, 'learning_rate': 1.1690545192474567e-05, 'epoch': 0.93} {'loss': 0.5212, 'learning_rate': 1.1690214049693008e-05, 'epoch': 0.93} {'loss': 0.4713, 'learning_rate': 1.1689882905003518e-05, 'epoch': 0.93} {'loss': 0.6461, 'learning_rate': 1.1689551758406472e-05, 'epoch': 0.93} {'loss': 0.7026, 'learning_rate': 1.1689220609902243e-05, 'epoch': 0.93} {'loss': 0.4657, 'learning_rate': 1.1688889459491205e-05, 'epoch': 0.93} {'loss': 0.6985, 'learning_rate': 1.1688558307173734e-05, 'epoch': 0.93} {'loss': 0.5148, 'learning_rate': 1.1688227152950203e-05, 'epoch': 0.93} {'loss': 0.5527, 'learning_rate': 1.1687895996820981e-05, 'epoch': 0.93} {'loss': 0.5634, 'learning_rate': 1.1687564838786447e-05, 'epoch': 0.93} {'loss': 0.6434, 'learning_rate': 1.1687233678846974e-05, 'epoch': 0.93} {'loss': 0.5843, 'learning_rate': 1.1686902517002935e-05, 'epoch': 0.93} {'loss': 0.5423, 'learning_rate': 1.1686571353254701e-05, 'epoch': 0.93} {'loss': 0.5009, 'learning_rate': 1.1686240187602649e-05, 'epoch': 0.93} {'loss': 0.4748, 'learning_rate': 1.1685909020047155e-05, 'epoch': 0.93} {'loss': 0.6362, 'learning_rate': 1.1685577850588587e-05, 'epoch': 0.93} {'loss': 0.6822, 'learning_rate': 1.1685246679227325e-05, 'epoch': 0.93} {'loss': 0.6825, 'learning_rate': 1.1684915505963738e-05, 'epoch': 0.93} {'loss': 0.681, 'learning_rate': 1.1684584330798205e-05, 'epoch': 0.93} {'loss': 0.5183, 'learning_rate': 1.1684253153731093e-05, 'epoch': 0.93} {'loss': 0.6703, 'learning_rate': 1.1683921974762782e-05, 'epoch': 0.93} {'loss': 0.4681, 'learning_rate': 1.1683590793893643e-05, 'epoch': 0.93} {'loss': 0.7139, 'learning_rate': 1.168325961112405e-05, 'epoch': 0.93} {'loss': 0.5094, 'learning_rate': 1.1682928426454375e-05, 'epoch': 0.93} {'loss': 0.438, 'learning_rate': 1.1682597239884995e-05, 'epoch': 0.93} {'loss': 0.5028, 'learning_rate': 1.1682266051416283e-05, 'epoch': 0.93} {'loss': 0.61, 'learning_rate': 1.1681934861048612e-05, 'epoch': 0.93} {'loss': 0.4237, 'learning_rate': 1.1681603668782358e-05, 'epoch': 0.93} {'loss': 0.6102, 'learning_rate': 1.1681272474617891e-05, 'epoch': 0.93} {'loss': 0.5754, 'learning_rate': 1.168094127855559e-05, 'epoch': 0.93} {'loss': 0.5769, 'learning_rate': 1.1680610080595824e-05, 'epoch': 0.93} {'loss': 0.6438, 'learning_rate': 1.1680278880738969e-05, 'epoch': 0.93} {'loss': 0.5409, 'learning_rate': 1.16799476789854e-05, 'epoch': 0.93} {'loss': 0.5148, 'learning_rate': 1.1679616475335487e-05, 'epoch': 0.93} {'loss': 0.5389, 'learning_rate': 1.1679285269789608e-05, 'epoch': 0.93} {'loss': 0.4965, 'learning_rate': 1.1678954062348134e-05, 'epoch': 0.93} {'loss': 0.6925, 'learning_rate': 1.167862285301144e-05, 'epoch': 0.93} {'loss': 0.5726, 'learning_rate': 1.1678291641779901e-05, 'epoch': 0.93} {'loss': 0.6157, 'learning_rate': 1.1677960428653892e-05, 'epoch': 0.93} {'loss': 0.5282, 'learning_rate': 1.167762921363378e-05, 'epoch': 0.93} {'loss': 0.5331, 'learning_rate': 1.1677297996719947e-05, 'epoch': 0.93} {'loss': 0.6275, 'learning_rate': 1.1676966777912764e-05, 'epoch': 0.93} {'loss': 0.576, 'learning_rate': 1.1676635557212601e-05, 'epoch': 0.93} {'loss': 0.5508, 'learning_rate': 1.1676304334619842e-05, 'epoch': 0.93} {'loss': 0.6237, 'learning_rate': 1.1675973110134848e-05, 'epoch': 0.93} {'loss': 0.6092, 'learning_rate': 1.1675641883758e-05, 'epoch': 0.93} {'loss': 0.7084, 'learning_rate': 1.167531065548967e-05, 'epoch': 0.93} {'loss': 0.4672, 'learning_rate': 1.1674979425330237e-05, 'epoch': 0.93} {'loss': 0.4907, 'learning_rate': 1.1674648193280067e-05, 'epoch': 0.93} {'loss': 0.626, 'learning_rate': 1.167431695933954e-05, 'epoch': 0.93} {'loss': 0.589, 'learning_rate': 1.1673985723509026e-05, 'epoch': 0.93} {'loss': 0.5479, 'learning_rate': 1.1673654485788898e-05, 'epoch': 0.93} {'loss': 0.6151, 'learning_rate': 1.1673323246179538e-05, 'epoch': 0.93} {'loss': 0.4409, 'learning_rate': 1.167299200468131e-05, 'epoch': 0.93} {'loss': 0.4697, 'learning_rate': 1.1672660761294593e-05, 'epoch': 0.93} {'loss': 0.532, 'learning_rate': 1.1672329516019762e-05, 'epoch': 0.93} {'loss': 0.5234, 'learning_rate': 1.167199826885719e-05, 'epoch': 0.93} {'loss': 0.5169, 'learning_rate': 1.1671667019807247e-05, 'epoch': 0.93} {'loss': 0.566, 'learning_rate': 1.1671335768870309e-05, 'epoch': 0.93} {'loss': 0.4481, 'learning_rate': 1.1671004516046754e-05, 'epoch': 0.93} {'loss': 0.4517, 'learning_rate': 1.1670673261336948e-05, 'epoch': 0.93} {'loss': 0.7141, 'learning_rate': 1.1670342004741273e-05, 'epoch': 0.93} {'loss': 0.5477, 'learning_rate': 1.1670010746260098e-05, 'epoch': 0.93} {'loss': 0.5941, 'learning_rate': 1.1669679485893801e-05, 'epoch': 0.93} {'loss': 0.6067, 'learning_rate': 1.1669348223642751e-05, 'epoch': 0.93} {'loss': 0.6519, 'learning_rate': 1.1669016959507325e-05, 'epoch': 0.93} {'loss': 0.432, 'learning_rate': 1.1668685693487896e-05, 'epoch': 0.93} {'loss': 0.5808, 'learning_rate': 1.1668354425584837e-05, 'epoch': 0.93} {'loss': 0.5893, 'learning_rate': 1.1668023155798524e-05, 'epoch': 0.93} {'loss': 0.5194, 'learning_rate': 1.166769188412933e-05, 'epoch': 0.93} {'loss': 0.4641, 'learning_rate': 1.1667360610577632e-05, 'epoch': 0.93} {'loss': 0.5106, 'learning_rate': 1.1667029335143798e-05, 'epoch': 0.93} {'loss': 0.6385, 'learning_rate': 1.1666698057828206e-05, 'epoch': 0.93} {'loss': 0.5927, 'learning_rate': 1.1666366778631226e-05, 'epoch': 0.93} {'loss': 0.5429, 'learning_rate': 1.1666035497553237e-05, 'epoch': 0.93} {'loss': 0.5169, 'learning_rate': 1.1665704214594611e-05, 'epoch': 0.93} {'loss': 0.4234, 'learning_rate': 1.166537292975572e-05, 'epoch': 0.93} {'loss': 0.5046, 'learning_rate': 1.166504164303694e-05, 'epoch': 0.93} {'loss': 0.5429, 'learning_rate': 1.1664710354438646e-05, 'epoch': 0.93} {'loss': 0.6146, 'learning_rate': 1.166437906396121e-05, 'epoch': 0.93} {'loss': 0.4313, 'learning_rate': 1.166404777160501e-05, 'epoch': 0.93} {'loss': 0.5914, 'learning_rate': 1.1663716477370412e-05, 'epoch': 0.93} {'loss': 0.5933, 'learning_rate': 1.1663385181257797e-05, 'epoch': 0.93} {'loss': 0.5752, 'learning_rate': 1.1663053883267534e-05, 'epoch': 0.93} {'loss': 0.6639, 'learning_rate': 1.1662722583400002e-05, 'epoch': 0.93} {'loss': 0.4788, 'learning_rate': 1.166239128165557e-05, 'epoch': 0.93} {'loss': 0.4786, 'learning_rate': 1.1662059978034615e-05, 'epoch': 0.93} {'loss': 0.6055, 'learning_rate': 1.166172867253751e-05, 'epoch': 0.93} {'loss': 0.4671, 'learning_rate': 1.1661397365164628e-05, 'epoch': 0.93} {'loss': 0.5425, 'learning_rate': 1.1661066055916348e-05, 'epoch': 0.93} {'loss': 0.5646, 'learning_rate': 1.1660734744793038e-05, 'epoch': 0.93} {'loss': 0.4198, 'learning_rate': 1.1660403431795075e-05, 'epoch': 0.93} {'loss': 0.5161, 'learning_rate': 1.1660072116922831e-05, 'epoch': 0.93} {'loss': 0.5289, 'learning_rate': 1.1659740800176684e-05, 'epoch': 0.93} {'loss': 0.5865, 'learning_rate': 1.1659409481557004e-05, 'epoch': 0.93} {'loss': 0.3843, 'learning_rate': 1.1659078161064165e-05, 'epoch': 0.93} {'loss': 0.5756, 'learning_rate': 1.1658746838698544e-05, 'epoch': 0.93} {'loss': 0.6231, 'learning_rate': 1.1658415514460513e-05, 'epoch': 0.93} {'loss': 0.6219, 'learning_rate': 1.1658084188350445e-05, 'epoch': 0.93} {'loss': 0.6561, 'learning_rate': 1.1657752860368716e-05, 'epoch': 0.93} {'loss': 0.4829, 'learning_rate': 1.1657421530515699e-05, 'epoch': 0.93} {'loss': 0.5594, 'learning_rate': 1.1657090198791767e-05, 'epoch': 0.93} {'loss': 0.643, 'learning_rate': 1.1656758865197298e-05, 'epoch': 0.93} {'loss': 0.651, 'learning_rate': 1.1656427529732662e-05, 'epoch': 0.93} {'loss': 0.4775, 'learning_rate': 1.1656096192398232e-05, 'epoch': 0.93} {'loss': 0.5262, 'learning_rate': 1.1655764853194386e-05, 'epoch': 0.93} {'loss': 0.6528, 'learning_rate': 1.1655433512121499e-05, 'epoch': 0.93} {'loss': 0.6371, 'learning_rate': 1.1655102169179942e-05, 'epoch': 0.93} {'loss': 0.512, 'learning_rate': 1.1654770824370085e-05, 'epoch': 0.93} {'loss': 0.5271, 'learning_rate': 1.165443947769231e-05, 'epoch': 0.93} {'loss': 0.572, 'learning_rate': 1.1654108129146986e-05, 'epoch': 0.93} {'loss': 0.4765, 'learning_rate': 1.165377677873449e-05, 'epoch': 0.93} {'loss': 0.4399, 'learning_rate': 1.1653445426455192e-05, 'epoch': 0.93} {'loss': 0.6318, 'learning_rate': 1.165311407230947e-05, 'epoch': 0.93} {'loss': 0.4943, 'learning_rate': 1.1652782716297697e-05, 'epoch': 0.93} {'loss': 0.5535, 'learning_rate': 1.1652451358420245e-05, 'epoch': 0.93} {'loss': 0.392, 'learning_rate': 1.1652119998677491e-05, 'epoch': 0.93} {'loss': 0.5896, 'learning_rate': 1.1651788637069807e-05, 'epoch': 0.93} {'loss': 0.6323, 'learning_rate': 1.1651457273597569e-05, 'epoch': 0.93} {'loss': 0.2776, 'learning_rate': 1.1651125908261147e-05, 'epoch': 0.93} {'loss': 0.538, 'learning_rate': 1.1650794541060919e-05, 'epoch': 0.93} {'loss': 0.5696, 'learning_rate': 1.165046317199726e-05, 'epoch': 0.93} {'loss': 0.5579, 'learning_rate': 1.1650131801070541e-05, 'epoch': 0.93} {'loss': 0.565, 'learning_rate': 1.1649800428281135e-05, 'epoch': 0.93} {'loss': 0.5589, 'learning_rate': 1.1649469053629421e-05, 'epoch': 0.93} {'loss': 0.5197, 'learning_rate': 1.1649137677115768e-05, 'epoch': 0.93} {'loss': 0.648, 'learning_rate': 1.164880629874055e-05, 'epoch': 0.93} {'loss': 0.6794, 'learning_rate': 1.1648474918504148e-05, 'epoch': 0.93} {'loss': 0.4328, 'learning_rate': 1.1648143536406928e-05, 'epoch': 0.93} {'loss': 0.5181, 'learning_rate': 1.164781215244927e-05, 'epoch': 0.93} {'loss': 0.6144, 'learning_rate': 1.1647480766631547e-05, 'epoch': 0.93} {'loss': 0.5315, 'learning_rate': 1.1647149378954128e-05, 'epoch': 0.93} {'loss': 0.5751, 'learning_rate': 1.164681798941739e-05, 'epoch': 0.93} {'loss': 0.5189, 'learning_rate': 1.164648659802171e-05, 'epoch': 0.93} {'loss': 0.664, 'learning_rate': 1.1646155204767458e-05, 'epoch': 0.93} {'loss': 0.4707, 'learning_rate': 1.164582380965501e-05, 'epoch': 0.93} {'loss': 0.6902, 'learning_rate': 1.164549241268474e-05, 'epoch': 0.93} {'loss': 0.6175, 'learning_rate': 1.1645161013857022e-05, 'epoch': 0.93} {'loss': 0.5313, 'learning_rate': 1.1644829613172231e-05, 'epoch': 0.93} {'loss': 0.4576, 'learning_rate': 1.1644498210630739e-05, 'epoch': 0.93} {'loss': 0.466, 'learning_rate': 1.1644166806232922e-05, 'epoch': 0.93} {'loss': 0.5537, 'learning_rate': 1.1643835399979154e-05, 'epoch': 0.93} {'loss': 0.5082, 'learning_rate': 1.1643503991869804e-05, 'epoch': 0.93} {'loss': 0.47, 'learning_rate': 1.1643172581905257e-05, 'epoch': 0.93} {'loss': 0.7428, 'learning_rate': 1.1642841170085876e-05, 'epoch': 0.93} {'loss': 0.6072, 'learning_rate': 1.1642509756412044e-05, 'epoch': 0.93} {'loss': 0.5116, 'learning_rate': 1.1642178340884127e-05, 'epoch': 0.93} {'loss': 0.5284, 'learning_rate': 1.1641846923502504e-05, 'epoch': 0.93} {'loss': 0.574, 'learning_rate': 1.164151550426755e-05, 'epoch': 0.93} {'loss': 0.4079, 'learning_rate': 1.1641184083179632e-05, 'epoch': 0.93} {'loss': 0.3933, 'learning_rate': 1.1640852660239132e-05, 'epoch': 0.93} {'loss': 0.5997, 'learning_rate': 1.1640521235446422e-05, 'epoch': 0.93} {'loss': 0.5914, 'learning_rate': 1.1640189808801875e-05, 'epoch': 0.93} {'loss': 0.5446, 'learning_rate': 1.1639858380305866e-05, 'epoch': 0.93} {'loss': 0.6774, 'learning_rate': 1.1639526949958769e-05, 'epoch': 0.93} {'loss': 0.4519, 'learning_rate': 1.1639195517760957e-05, 'epoch': 0.93} {'loss': 0.5649, 'learning_rate': 1.163886408371281e-05, 'epoch': 0.93} {'loss': 0.4395, 'learning_rate': 1.163853264781469e-05, 'epoch': 0.93} {'loss': 0.4712, 'learning_rate': 1.1638201210066982e-05, 'epoch': 0.93} {'loss': 0.5638, 'learning_rate': 1.1637869770470054e-05, 'epoch': 0.93} {'loss': 0.7187, 'learning_rate': 1.1637538329024282e-05, 'epoch': 0.93} {'loss': 0.5705, 'learning_rate': 1.1637206885730043e-05, 'epoch': 0.93} {'loss': 0.552, 'learning_rate': 1.163687544058771e-05, 'epoch': 0.93} {'loss': 0.7224, 'learning_rate': 1.163654399359765e-05, 'epoch': 0.93} {'loss': 0.4089, 'learning_rate': 1.1636212544760248e-05, 'epoch': 0.93} {'loss': 0.4445, 'learning_rate': 1.1635881094075873e-05, 'epoch': 0.93} {'loss': 0.4826, 'learning_rate': 1.1635549641544899e-05, 'epoch': 0.93} {'loss': 0.6119, 'learning_rate': 1.1635218187167699e-05, 'epoch': 0.93} {'loss': 0.4505, 'learning_rate': 1.163488673094465e-05, 'epoch': 0.93} {'loss': 0.6008, 'learning_rate': 1.1634555272876122e-05, 'epoch': 0.93} {'loss': 0.4824, 'learning_rate': 1.1634223812962494e-05, 'epoch': 0.93} {'loss': 0.5913, 'learning_rate': 1.163389235120414e-05, 'epoch': 0.93} {'loss': 0.5727, 'learning_rate': 1.163356088760143e-05, 'epoch': 0.93} {'loss': 0.3606, 'learning_rate': 1.1633229422154741e-05, 'epoch': 0.93} {'loss': 0.5087, 'learning_rate': 1.1632897954864446e-05, 'epoch': 0.93} {'loss': 0.4926, 'learning_rate': 1.1632566485730921e-05, 'epoch': 0.93} {'loss': 0.6368, 'learning_rate': 1.1632235014754536e-05, 'epoch': 0.93} {'loss': 0.6617, 'learning_rate': 1.1631903541935672e-05, 'epoch': 0.93} {'loss': 0.7156, 'learning_rate': 1.1631572067274696e-05, 'epoch': 0.93} {'loss': 0.7584, 'learning_rate': 1.1631240590771988e-05, 'epoch': 0.93} {'loss': 0.5986, 'learning_rate': 1.163090911242792e-05, 'epoch': 0.93} {'loss': 0.4741, 'learning_rate': 1.1630577632242863e-05, 'epoch': 0.93} {'loss': 0.4598, 'learning_rate': 1.1630246150217195e-05, 'epoch': 0.93} {'loss': 0.547, 'learning_rate': 1.1629914666351287e-05, 'epoch': 0.93} {'loss': 0.5664, 'learning_rate': 1.1629583180645519e-05, 'epoch': 0.93} {'loss': 0.4885, 'learning_rate': 1.1629251693100259e-05, 'epoch': 0.93} {'loss': 0.4635, 'learning_rate': 1.1628920203715884e-05, 'epoch': 0.93} {'loss': 0.5363, 'learning_rate': 1.1628588712492768e-05, 'epoch': 0.93} {'loss': 0.4722, 'learning_rate': 1.1628257219431287e-05, 'epoch': 0.93} {'loss': 0.5899, 'learning_rate': 1.162792572453181e-05, 'epoch': 0.93} {'loss': 0.5688, 'learning_rate': 1.1627594227794716e-05, 'epoch': 0.93} {'loss': 0.5049, 'learning_rate': 1.1627262729220377e-05, 'epoch': 0.93} {'loss': 0.5904, 'learning_rate': 1.1626931228809171e-05, 'epoch': 0.93} {'loss': 0.5729, 'learning_rate': 1.1626599726561467e-05, 'epoch': 0.93} {'loss': 0.6342, 'learning_rate': 1.1626268222477639e-05, 'epoch': 0.93} {'loss': 0.5529, 'learning_rate': 1.1625936716558066e-05, 'epoch': 0.93} {'loss': 0.5064, 'learning_rate': 1.162560520880312e-05, 'epoch': 0.93} {'loss': 0.4991, 'learning_rate': 1.162527369921317e-05, 'epoch': 0.93} {'loss': 0.5712, 'learning_rate': 1.16249421877886e-05, 'epoch': 0.93} {'loss': 0.6737, 'learning_rate': 1.1624610674529778e-05, 'epoch': 0.93} {'loss': 0.4775, 'learning_rate': 1.162427915943708e-05, 'epoch': 0.93} {'loss': 0.5178, 'learning_rate': 1.1623947642510878e-05, 'epoch': 0.93} {'loss': 0.4479, 'learning_rate': 1.162361612375155e-05, 'epoch': 0.93} {'loss': 0.3941, 'learning_rate': 1.1623284603159465e-05, 'epoch': 0.93} {'loss': 0.5077, 'learning_rate': 1.1622953080735005e-05, 'epoch': 0.93} {'loss': 0.5974, 'learning_rate': 1.1622621556478537e-05, 'epoch': 0.93} {'loss': 0.5551, 'learning_rate': 1.1622290030390437e-05, 'epoch': 0.93} {'loss': 0.5113, 'learning_rate': 1.1621958502471083e-05, 'epoch': 0.93} {'loss': 0.4685, 'learning_rate': 1.1621626972720843e-05, 'epoch': 0.93} {'loss': 0.6207, 'learning_rate': 1.1621295441140095e-05, 'epoch': 0.93} {'loss': 0.5981, 'learning_rate': 1.1620963907729214e-05, 'epoch': 0.93} {'loss': 0.5423, 'learning_rate': 1.1620632372488572e-05, 'epoch': 0.93} {'loss': 0.6375, 'learning_rate': 1.1620300835418546e-05, 'epoch': 0.93} {'loss': 0.5372, 'learning_rate': 1.1619969296519507e-05, 'epoch': 0.93} {'loss': 0.5693, 'learning_rate': 1.1619637755791831e-05, 'epoch': 0.93} {'loss': 0.6191, 'learning_rate': 1.161930621323589e-05, 'epoch': 0.93} {'loss': 0.6565, 'learning_rate': 1.1618974668852063e-05, 'epoch': 0.93} {'loss': 0.6943, 'learning_rate': 1.161864312264072e-05, 'epoch': 0.93} {'loss': 0.588, 'learning_rate': 1.1618311574602237e-05, 'epoch': 0.93} {'loss': 0.5501, 'learning_rate': 1.1617980024736987e-05, 'epoch': 0.93} {'loss': 0.672, 'learning_rate': 1.1617648473045346e-05, 'epoch': 0.93} {'loss': 0.4551, 'learning_rate': 1.1617316919527689e-05, 'epoch': 0.93} {'loss': 0.5393, 'learning_rate': 1.1616985364184387e-05, 'epoch': 0.93} {'loss': 0.4833, 'learning_rate': 1.1616653807015816e-05, 'epoch': 0.93} {'loss': 0.5742, 'learning_rate': 1.1616322248022351e-05, 'epoch': 0.93} {'loss': 0.4576, 'learning_rate': 1.1615990687204365e-05, 'epoch': 0.93} {'loss': 0.5072, 'learning_rate': 1.1615659124562235e-05, 'epoch': 0.93} {'loss': 0.5462, 'learning_rate': 1.161532756009633e-05, 'epoch': 0.93} {'loss': 0.4954, 'learning_rate': 1.161499599380703e-05, 'epoch': 0.93} {'loss': 0.4676, 'learning_rate': 1.1614664425694706e-05, 'epoch': 0.93} {'loss': 0.4886, 'learning_rate': 1.1614332855759734e-05, 'epoch': 0.93} {'loss': 0.633, 'learning_rate': 1.1614001284002484e-05, 'epoch': 0.93} {'loss': 0.5671, 'learning_rate': 1.1613669710423333e-05, 'epoch': 0.93} {'loss': 0.4656, 'learning_rate': 1.1613338135022657e-05, 'epoch': 0.93} {'loss': 0.6999, 'learning_rate': 1.1613006557800832e-05, 'epoch': 0.93} {'loss': 0.3877, 'learning_rate': 1.1612674978758228e-05, 'epoch': 0.93} {'loss': 0.561, 'learning_rate': 1.1612343397895218e-05, 'epoch': 0.93} {'loss': 0.6478, 'learning_rate': 1.1612011815212181e-05, 'epoch': 0.93} {'loss': 0.4812, 'learning_rate': 1.1611680230709487e-05, 'epoch': 0.93} {'loss': 0.7223, 'learning_rate': 1.1611348644387514e-05, 'epoch': 0.93} {'loss': 0.6882, 'learning_rate': 1.1611017056246636e-05, 'epoch': 0.93} {'loss': 0.5027, 'learning_rate': 1.1610685466287226e-05, 'epoch': 0.93} {'loss': 0.6792, 'learning_rate': 1.1610353874509659e-05, 'epoch': 0.93} {'loss': 0.5382, 'learning_rate': 1.1610022280914305e-05, 'epoch': 0.93} {'loss': 0.5376, 'learning_rate': 1.1609690685501546e-05, 'epoch': 0.93} {'loss': 0.6846, 'learning_rate': 1.160935908827175e-05, 'epoch': 0.93} {'loss': 0.4469, 'learning_rate': 1.1609027489225296e-05, 'epoch': 0.93} {'loss': 0.6867, 'learning_rate': 1.1608695888362552e-05, 'epoch': 0.93} {'loss': 0.5524, 'learning_rate': 1.1608364285683897e-05, 'epoch': 0.93} {'loss': 0.4912, 'learning_rate': 1.1608032681189707e-05, 'epoch': 0.93} {'loss': 0.5454, 'learning_rate': 1.1607701074880354e-05, 'epoch': 0.93} {'loss': 0.4366, 'learning_rate': 1.1607369466756208e-05, 'epoch': 0.93} {'loss': 0.5911, 'learning_rate': 1.160703785681765e-05, 'epoch': 0.93} {'loss': 0.5672, 'learning_rate': 1.1606706245065053e-05, 'epoch': 0.93} {'loss': 0.5233, 'learning_rate': 1.1606374631498792e-05, 'epoch': 0.93} {'loss': 0.6056, 'learning_rate': 1.1606043016119237e-05, 'epoch': 0.93} {'loss': 0.5233, 'learning_rate': 1.1605711398926765e-05, 'epoch': 0.93} {'loss': 0.521, 'learning_rate': 1.1605379779921751e-05, 'epoch': 0.93} {'loss': 0.524, 'learning_rate': 1.1605048159104566e-05, 'epoch': 0.93} {'loss': 0.6459, 'learning_rate': 1.160471653647559e-05, 'epoch': 0.93} {'loss': 0.4811, 'learning_rate': 1.1604384912035192e-05, 'epoch': 0.93} {'loss': 0.5746, 'learning_rate': 1.1604053285783747e-05, 'epoch': 0.93} {'loss': 0.5163, 'learning_rate': 1.1603721657721634e-05, 'epoch': 0.93} {'loss': 0.5245, 'learning_rate': 1.1603390027849224e-05, 'epoch': 0.93} {'loss': 0.4387, 'learning_rate': 1.1603058396166889e-05, 'epoch': 0.93} {'loss': 0.566, 'learning_rate': 1.1602726762675008e-05, 'epoch': 0.93} {'loss': 0.4486, 'learning_rate': 1.1602395127373954e-05, 'epoch': 0.93} {'loss': 0.5158, 'learning_rate': 1.1602063490264097e-05, 'epoch': 0.93} {'loss': 0.5974, 'learning_rate': 1.1601731851345818e-05, 'epoch': 0.93} {'loss': 0.6477, 'learning_rate': 1.160140021061949e-05, 'epoch': 0.93} {'loss': 0.5333, 'learning_rate': 1.1601068568085481e-05, 'epoch': 0.93} {'loss': 0.4049, 'learning_rate': 1.1600736923744173e-05, 'epoch': 0.93} {'loss': 0.5828, 'learning_rate': 1.1600405277595936e-05, 'epoch': 0.93} {'loss': 0.4567, 'learning_rate': 1.1600073629641147e-05, 'epoch': 0.93} {'loss': 0.3357, 'learning_rate': 1.1599741979880179e-05, 'epoch': 0.93} {'loss': 0.6789, 'learning_rate': 1.1599410328313408e-05, 'epoch': 0.93} {'loss': 0.5559, 'learning_rate': 1.1599078674941204e-05, 'epoch': 0.93} {'loss': 0.7081, 'learning_rate': 1.1598747019763945e-05, 'epoch': 0.93} {'loss': 0.5573, 'learning_rate': 1.1598415362782006e-05, 'epoch': 0.93} {'loss': 0.3689, 'learning_rate': 1.1598083703995759e-05, 'epoch': 0.93} {'loss': 0.6446, 'learning_rate': 1.1597752043405581e-05, 'epoch': 0.93} {'loss': 0.633, 'learning_rate': 1.1597420381011843e-05, 'epoch': 0.93} {'loss': 0.6349, 'learning_rate': 1.1597088716814922e-05, 'epoch': 0.93} {'loss': 0.5577, 'learning_rate': 1.159675705081519e-05, 'epoch': 0.93} {'loss': 0.512, 'learning_rate': 1.1596425383013023e-05, 'epoch': 0.93} {'loss': 0.4415, 'learning_rate': 1.1596093713408795e-05, 'epoch': 0.93} {'loss': 0.5334, 'learning_rate': 1.1595762042002883e-05, 'epoch': 0.93} {'loss': 0.777, 'learning_rate': 1.159543036879566e-05, 'epoch': 0.93} {'loss': 0.5582, 'learning_rate': 1.1595098693787497e-05, 'epoch': 0.93} {'loss': 0.6229, 'learning_rate': 1.159476701697877e-05, 'epoch': 0.93} {'loss': 0.7115, 'learning_rate': 1.1594435338369856e-05, 'epoch': 0.93} {'loss': 0.5797, 'learning_rate': 1.1594103657961127e-05, 'epoch': 0.93} {'loss': 0.5638, 'learning_rate': 1.1593771975752961e-05, 'epoch': 0.93} {'loss': 0.6226, 'learning_rate': 1.1593440291745726e-05, 'epoch': 0.93} {'loss': 0.5859, 'learning_rate': 1.1593108605939802e-05, 'epoch': 0.93} {'loss': 0.5282, 'learning_rate': 1.159277691833556e-05, 'epoch': 0.93} {'loss': 0.5766, 'learning_rate': 1.1592445228933376e-05, 'epoch': 0.93} {'loss': 0.4502, 'learning_rate': 1.1592113537733623e-05, 'epoch': 0.93} {'loss': 0.4327, 'learning_rate': 1.1591781844736678e-05, 'epoch': 0.93} {'loss': 0.6088, 'learning_rate': 1.1591450149942913e-05, 'epoch': 0.93} {'loss': 0.5529, 'learning_rate': 1.1591118453352705e-05, 'epoch': 0.93} {'loss': 0.6437, 'learning_rate': 1.1590786754966425e-05, 'epoch': 0.93} {'loss': 0.5722, 'learning_rate': 1.159045505478445e-05, 'epoch': 0.93} {'loss': 0.5068, 'learning_rate': 1.1590123352807155e-05, 'epoch': 0.93} {'loss': 0.4782, 'learning_rate': 1.1589791649034912e-05, 'epoch': 0.93} {'loss': 0.6089, 'learning_rate': 1.1589459943468098e-05, 'epoch': 0.93} {'loss': 0.4538, 'learning_rate': 1.1589128236107084e-05, 'epoch': 0.93} {'loss': 0.5293, 'learning_rate': 1.1588796526952247e-05, 'epoch': 0.93} {'loss': 0.6645, 'learning_rate': 1.1588464816003961e-05, 'epoch': 0.93} {'loss': 0.579, 'learning_rate': 1.15881331032626e-05, 'epoch': 0.93} {'loss': 0.4179, 'learning_rate': 1.158780138872854e-05, 'epoch': 0.93} {'loss': 0.5084, 'learning_rate': 1.1587469672402152e-05, 'epoch': 0.93} {'loss': 0.5913, 'learning_rate': 1.1587137954283811e-05, 'epoch': 0.93} {'loss': 0.3237, 'learning_rate': 1.1586806234373897e-05, 'epoch': 0.93} {'loss': 0.4843, 'learning_rate': 1.1586474512672779e-05, 'epoch': 0.93} {'loss': 0.4568, 'learning_rate': 1.1586142789180831e-05, 'epoch': 0.93} {'loss': 0.4507, 'learning_rate': 1.1585811063898433e-05, 'epoch': 0.93} {'loss': 0.5245, 'learning_rate': 1.1585479336825954e-05, 'epoch': 0.93} {'loss': 0.6829, 'learning_rate': 1.1585147607963772e-05, 'epoch': 0.93} {'loss': 0.6168, 'learning_rate': 1.1584815877312256e-05, 'epoch': 0.93} {'loss': 0.5839, 'learning_rate': 1.1584484144871787e-05, 'epoch': 0.93} {'loss': 0.3923, 'learning_rate': 1.1584152410642737e-05, 'epoch': 0.93} {'loss': 0.5782, 'learning_rate': 1.1583820674625478e-05, 'epoch': 0.93} {'loss': 0.564, 'learning_rate': 1.158348893682039e-05, 'epoch': 0.93} {'loss': 0.5544, 'learning_rate': 1.158315719722784e-05, 'epoch': 0.93} {'loss': 0.7009, 'learning_rate': 1.158282545584821e-05, 'epoch': 0.93} {'loss': 0.5858, 'learning_rate': 1.158249371268187e-05, 'epoch': 0.93} {'loss': 0.4539, 'learning_rate': 1.1582161967729195e-05, 'epoch': 0.93} {'loss': 0.6017, 'learning_rate': 1.1581830220990564e-05, 'epoch': 0.93} {'loss': 0.682, 'learning_rate': 1.1581498472466344e-05, 'epoch': 0.93} {'loss': 0.5449, 'learning_rate': 1.1581166722156912e-05, 'epoch': 0.93} {'loss': 0.5338, 'learning_rate': 1.1580834970062644e-05, 'epoch': 0.93} {'loss': 0.6484, 'learning_rate': 1.1580503216183913e-05, 'epoch': 0.93} {'loss': 0.5867, 'learning_rate': 1.1580171460521097e-05, 'epoch': 0.93} {'loss': 0.5237, 'learning_rate': 1.1579839703074567e-05, 'epoch': 0.93} {'loss': 0.508, 'learning_rate': 1.1579507943844697e-05, 'epoch': 0.93} {'loss': 0.5005, 'learning_rate': 1.1579176182831864e-05, 'epoch': 0.93} {'loss': 0.4774, 'learning_rate': 1.157884442003644e-05, 'epoch': 0.93} {'loss': 0.4681, 'learning_rate': 1.1578512655458803e-05, 'epoch': 0.93} {'loss': 0.4814, 'learning_rate': 1.1578180889099325e-05, 'epoch': 0.93} {'loss': 0.3261, 'learning_rate': 1.157784912095838e-05, 'epoch': 0.93} {'loss': 0.8681, 'learning_rate': 1.1577517351036348e-05, 'epoch': 0.93} {'loss': 0.6007, 'learning_rate': 1.1577185579333592e-05, 'epoch': 0.93} {'loss': 0.6278, 'learning_rate': 1.1576853805850496e-05, 'epoch': 0.93} {'loss': 0.6598, 'learning_rate': 1.1576522030587432e-05, 'epoch': 0.93} {'loss': 0.4782, 'learning_rate': 1.1576190253544775e-05, 'epoch': 0.93} {'loss': 0.504, 'learning_rate': 1.1575858474722899e-05, 'epoch': 0.93} {'loss': 0.5762, 'learning_rate': 1.1575526694122176e-05, 'epoch': 0.93} {'loss': 0.68, 'learning_rate': 1.1575194911742984e-05, 'epoch': 0.93} {'loss': 0.4753, 'learning_rate': 1.1574863127585698e-05, 'epoch': 0.93} {'loss': 0.4377, 'learning_rate': 1.157453134165069e-05, 'epoch': 0.93} {'loss': 0.6392, 'learning_rate': 1.1574199553938335e-05, 'epoch': 0.93} {'loss': 0.4898, 'learning_rate': 1.157386776444901e-05, 'epoch': 0.93} {'loss': 0.5561, 'learning_rate': 1.1573535973183085e-05, 'epoch': 0.93} {'loss': 0.58, 'learning_rate': 1.157320418014094e-05, 'epoch': 0.93} {'loss': 0.5008, 'learning_rate': 1.1572872385322946e-05, 'epoch': 0.93} {'loss': 0.5761, 'learning_rate': 1.1572540588729477e-05, 'epoch': 0.93} {'loss': 0.4875, 'learning_rate': 1.1572208790360908e-05, 'epoch': 0.93} {'loss': 0.522, 'learning_rate': 1.1571876990217617e-05, 'epoch': 0.93} {'loss': 0.6158, 'learning_rate': 1.1571545188299973e-05, 'epoch': 0.93} {'loss': 0.4858, 'learning_rate': 1.1571213384608355e-05, 'epoch': 0.93} {'loss': 0.6355, 'learning_rate': 1.1570881579143134e-05, 'epoch': 0.93} {'loss': 0.5862, 'learning_rate': 1.1570549771904689e-05, 'epoch': 0.93} {'loss': 0.4172, 'learning_rate': 1.1570217962893388e-05, 'epoch': 0.93} {'loss': 0.659, 'learning_rate': 1.1569886152109613e-05, 'epoch': 0.93} {'loss': 0.6004, 'learning_rate': 1.1569554339553734e-05, 'epoch': 0.93} {'loss': 0.6296, 'learning_rate': 1.1569222525226128e-05, 'epoch': 0.93} {'loss': 0.4871, 'learning_rate': 1.1568890709127165e-05, 'epoch': 0.93} {'loss': 0.4752, 'learning_rate': 1.1568558891257227e-05, 'epoch': 0.93} {'loss': 0.5783, 'learning_rate': 1.156822707161668e-05, 'epoch': 0.93} {'loss': 0.5535, 'learning_rate': 1.1567895250205905e-05, 'epoch': 0.93} {'loss': 0.6204, 'learning_rate': 1.1567563427025275e-05, 'epoch': 0.93} {'loss': 0.4703, 'learning_rate': 1.1567231602075162e-05, 'epoch': 0.93} {'loss': 0.5582, 'learning_rate': 1.1566899775355943e-05, 'epoch': 0.93} {'loss': 0.4985, 'learning_rate': 1.1566567946867994e-05, 'epoch': 0.93} {'loss': 0.5297, 'learning_rate': 1.1566236116611686e-05, 'epoch': 0.93} {'loss': 0.5486, 'learning_rate': 1.1565904284587397e-05, 'epoch': 0.93} {'loss': 0.6528, 'learning_rate': 1.1565572450795497e-05, 'epoch': 0.93} {'loss': 0.6153, 'learning_rate': 1.1565240615236369e-05, 'epoch': 0.93} {'loss': 0.5038, 'learning_rate': 1.1564908777910375e-05, 'epoch': 0.93} {'loss': 0.5478, 'learning_rate': 1.15645769388179e-05, 'epoch': 0.93} {'loss': 0.5495, 'learning_rate': 1.1564245097959315e-05, 'epoch': 0.93} {'loss': 0.5876, 'learning_rate': 1.1563913255334995e-05, 'epoch': 0.93} {'loss': 0.4265, 'learning_rate': 1.1563581410945312e-05, 'epoch': 0.93} {'loss': 0.7288, 'learning_rate': 1.1563249564790646e-05, 'epoch': 0.93} {'loss': 0.4533, 'learning_rate': 1.1562917716871367e-05, 'epoch': 0.93} {'loss': 0.62, 'learning_rate': 1.1562585867187853e-05, 'epoch': 0.93} {'loss': 0.5245, 'learning_rate': 1.1562254015740473e-05, 'epoch': 0.93} {'loss': 0.5655, 'learning_rate': 1.1561922162529609e-05, 'epoch': 0.93} {'loss': 0.69, 'learning_rate': 1.1561590307555627e-05, 'epoch': 0.93} {'loss': 0.5886, 'learning_rate': 1.1561258450818911e-05, 'epoch': 0.93} {'loss': 0.7666, 'learning_rate': 1.1560926592319832e-05, 'epoch': 0.93} {'loss': 0.6738, 'learning_rate': 1.1560594732058761e-05, 'epoch': 0.93} {'loss': 0.6037, 'learning_rate': 1.1560262870036076e-05, 'epoch': 0.93} {'loss': 0.5155, 'learning_rate': 1.1559931006252152e-05, 'epoch': 0.93} {'loss': 0.664, 'learning_rate': 1.155959914070736e-05, 'epoch': 0.93} {'loss': 0.5987, 'learning_rate': 1.1559267273402079e-05, 'epoch': 0.93} {'loss': 0.5324, 'learning_rate': 1.155893540433668e-05, 'epoch': 0.93} {'loss': 0.4646, 'learning_rate': 1.1558603533511542e-05, 'epoch': 0.93} {'loss': 0.5223, 'learning_rate': 1.1558271660927034e-05, 'epoch': 0.93} {'loss': 0.3868, 'learning_rate': 1.1557939786583536e-05, 'epoch': 0.93} {'loss': 0.665, 'learning_rate': 1.1557607910481419e-05, 'epoch': 0.93} {'loss': 0.6783, 'learning_rate': 1.1557276032621058e-05, 'epoch': 0.93} {'loss': 0.5249, 'learning_rate': 1.1556944153002832e-05, 'epoch': 0.93} {'loss': 0.5399, 'learning_rate': 1.155661227162711e-05, 'epoch': 0.93} {'loss': 0.5716, 'learning_rate': 1.155628038849427e-05, 'epoch': 0.93} {'loss': 0.6789, 'learning_rate': 1.1555948503604684e-05, 'epoch': 0.93} {'loss': 0.5778, 'learning_rate': 1.1555616616958726e-05, 'epoch': 0.93} {'loss': 0.5228, 'learning_rate': 1.1555284728556774e-05, 'epoch': 0.93} {'loss': 0.6317, 'learning_rate': 1.1554952838399202e-05, 'epoch': 0.93} {'loss': 0.6063, 'learning_rate': 1.1554620946486386e-05, 'epoch': 0.93} {'loss': 0.5513, 'learning_rate': 1.1554289052818695e-05, 'epoch': 0.93} {'loss': 0.589, 'learning_rate': 1.155395715739651e-05, 'epoch': 0.93} {'loss': 0.493, 'learning_rate': 1.1553625260220201e-05, 'epoch': 0.93} {'loss': 0.5294, 'learning_rate': 1.1553293361290143e-05, 'epoch': 0.93} {'loss': 0.5244, 'learning_rate': 1.1552961460606716e-05, 'epoch': 0.93} {'loss': 0.5931, 'learning_rate': 1.1552629558170287e-05, 'epoch': 0.93} {'loss': 0.6185, 'learning_rate': 1.1552297653981238e-05, 'epoch': 0.93} {'loss': 0.5286, 'learning_rate': 1.1551965748039937e-05, 'epoch': 0.93} {'loss': 0.659, 'learning_rate': 1.1551633840346766e-05, 'epoch': 0.93} {'loss': 0.4381, 'learning_rate': 1.155130193090209e-05, 'epoch': 0.94} {'loss': 0.4976, 'learning_rate': 1.1550970019706294e-05, 'epoch': 0.94} {'loss': 0.4378, 'learning_rate': 1.1550638106759744e-05, 'epoch': 0.94} {'loss': 0.5831, 'learning_rate': 1.1550306192062822e-05, 'epoch': 0.94} {'loss': 0.6042, 'learning_rate': 1.1549974275615897e-05, 'epoch': 0.94} {'loss': 0.554, 'learning_rate': 1.1549642357419345e-05, 'epoch': 0.94} {'loss': 0.6352, 'learning_rate': 1.1549310437473542e-05, 'epoch': 0.94} {'loss': 0.7398, 'learning_rate': 1.1548978515778864e-05, 'epoch': 0.94} {'loss': 0.4437, 'learning_rate': 1.1548646592335684e-05, 'epoch': 0.94} {'loss': 0.6371, 'learning_rate': 1.1548314667144375e-05, 'epoch': 0.94} {'loss': 0.487, 'learning_rate': 1.1547982740205312e-05, 'epoch': 0.94} {'loss': 0.6591, 'learning_rate': 1.1547650811518873e-05, 'epoch': 0.94} {'loss': 0.6172, 'learning_rate': 1.154731888108543e-05, 'epoch': 0.94} {'loss': 0.5134, 'learning_rate': 1.1546986948905357e-05, 'epoch': 0.94} {'loss': 0.5319, 'learning_rate': 1.1546655014979032e-05, 'epoch': 0.94} {'loss': 0.5314, 'learning_rate': 1.1546323079306825e-05, 'epoch': 0.94} {'loss': 0.582, 'learning_rate': 1.1545991141889114e-05, 'epoch': 0.94} {'loss': 0.4769, 'learning_rate': 1.1545659202726273e-05, 'epoch': 0.94} {'loss': 0.5159, 'learning_rate': 1.1545327261818677e-05, 'epoch': 0.94} {'loss': 0.3916, 'learning_rate': 1.15449953191667e-05, 'epoch': 0.94} {'loss': 0.5311, 'learning_rate': 1.1544663374770719e-05, 'epoch': 0.94} {'loss': 0.6746, 'learning_rate': 1.1544331428631108e-05, 'epoch': 0.94} {'loss': 0.4711, 'learning_rate': 1.1543999480748237e-05, 'epoch': 0.94} {'loss': 0.5925, 'learning_rate': 1.1543667531122485e-05, 'epoch': 0.94} {'loss': 0.5153, 'learning_rate': 1.1543335579754227e-05, 'epoch': 0.94} {'loss': 0.5536, 'learning_rate': 1.1543003626643834e-05, 'epoch': 0.94} {'loss': 0.6331, 'learning_rate': 1.1542671671791686e-05, 'epoch': 0.94} {'loss': 0.6034, 'learning_rate': 1.1542339715198154e-05, 'epoch': 0.94} {'loss': 0.4948, 'learning_rate': 1.1542007756863613e-05, 'epoch': 0.94} {'loss': 0.5046, 'learning_rate': 1.1541675796788438e-05, 'epoch': 0.94} {'loss': 0.5117, 'learning_rate': 1.1541343834973007e-05, 'epoch': 0.94} {'loss': 0.6072, 'learning_rate': 1.154101187141769e-05, 'epoch': 0.94} {'loss': 0.6169, 'learning_rate': 1.1540679906122864e-05, 'epoch': 0.94} {'loss': 0.476, 'learning_rate': 1.1540347939088904e-05, 'epoch': 0.94} {'loss': 0.5442, 'learning_rate': 1.1540015970316184e-05, 'epoch': 0.94} {'loss': 0.5167, 'learning_rate': 1.1539683999805078e-05, 'epoch': 0.94} {'loss': 0.5423, 'learning_rate': 1.153935202755596e-05, 'epoch': 0.94} {'loss': 0.4859, 'learning_rate': 1.153902005356921e-05, 'epoch': 0.94} {'loss': 0.4331, 'learning_rate': 1.1538688077845197e-05, 'epoch': 0.94} {'loss': 0.7398, 'learning_rate': 1.1538356100384298e-05, 'epoch': 0.94} {'loss': 0.3759, 'learning_rate': 1.1538024121186885e-05, 'epoch': 0.94} {'loss': 0.5114, 'learning_rate': 1.1537692140253341e-05, 'epoch': 0.94} {'loss': 0.6307, 'learning_rate': 1.153736015758403e-05, 'epoch': 0.94} {'loss': 0.5766, 'learning_rate': 1.1537028173179332e-05, 'epoch': 0.94} {'loss': 0.6227, 'learning_rate': 1.1536696187039625e-05, 'epoch': 0.94} {'loss': 0.5348, 'learning_rate': 1.1536364199165276e-05, 'epoch': 0.94} {'loss': 0.5086, 'learning_rate': 1.1536032209556666e-05, 'epoch': 0.94} {'loss': 0.6616, 'learning_rate': 1.1535700218214168e-05, 'epoch': 0.94} {'loss': 0.6588, 'learning_rate': 1.1535368225138154e-05, 'epoch': 0.94} {'loss': 0.5006, 'learning_rate': 1.1535036230329005e-05, 'epoch': 0.94} {'loss': 0.4896, 'learning_rate': 1.1534704233787091e-05, 'epoch': 0.94} {'loss': 0.4007, 'learning_rate': 1.1534372235512787e-05, 'epoch': 0.94} {'loss': 0.6512, 'learning_rate': 1.1534040235506467e-05, 'epoch': 0.94} {'loss': 0.4539, 'learning_rate': 1.153370823376851e-05, 'epoch': 0.94} {'loss': 0.6942, 'learning_rate': 1.1533376230299286e-05, 'epoch': 0.94} {'loss': 0.5587, 'learning_rate': 1.1533044225099173e-05, 'epoch': 0.94} {'loss': 0.5022, 'learning_rate': 1.1532712218168545e-05, 'epoch': 0.94} {'loss': 0.4816, 'learning_rate': 1.1532380209507777e-05, 'epoch': 0.94} {'loss': 0.6054, 'learning_rate': 1.1532048199117243e-05, 'epoch': 0.94} {'loss': 0.3818, 'learning_rate': 1.1531716186997314e-05, 'epoch': 0.94} {'loss': 0.4574, 'learning_rate': 1.1531384173148372e-05, 'epoch': 0.94} {'loss': 0.5293, 'learning_rate': 1.153105215757079e-05, 'epoch': 0.94} {'loss': 0.7104, 'learning_rate': 1.1530720140264939e-05, 'epoch': 0.94} {'loss': 0.7414, 'learning_rate': 1.1530388121231195e-05, 'epoch': 0.94} {'loss': 0.548, 'learning_rate': 1.1530056100469935e-05, 'epoch': 0.94} {'loss': 0.5, 'learning_rate': 1.1529724077981532e-05, 'epoch': 0.94} {'loss': 0.4177, 'learning_rate': 1.1529392053766363e-05, 'epoch': 0.94} {'loss': 0.507, 'learning_rate': 1.15290600278248e-05, 'epoch': 0.94} {'loss': 0.5646, 'learning_rate': 1.152872800015722e-05, 'epoch': 0.94} {'loss': 0.4409, 'learning_rate': 1.1528395970763994e-05, 'epoch': 0.94} {'loss': 0.6627, 'learning_rate': 1.1528063939645505e-05, 'epoch': 0.94} {'loss': 0.4921, 'learning_rate': 1.1527731906802119e-05, 'epoch': 0.94} {'loss': 0.4565, 'learning_rate': 1.1527399872234215e-05, 'epoch': 0.94} {'loss': 0.5475, 'learning_rate': 1.1527067835942165e-05, 'epoch': 0.94} {'loss': 0.567, 'learning_rate': 1.1526735797926348e-05, 'epoch': 0.94} {'loss': 0.676, 'learning_rate': 1.1526403758187135e-05, 'epoch': 0.94} {'loss': 0.4649, 'learning_rate': 1.1526071716724903e-05, 'epoch': 0.94} {'loss': 0.6712, 'learning_rate': 1.1525739673540026e-05, 'epoch': 0.94} {'loss': 0.5071, 'learning_rate': 1.1525407628632878e-05, 'epoch': 0.94} {'loss': 0.5178, 'learning_rate': 1.1525075582003837e-05, 'epoch': 0.94} {'loss': 0.6899, 'learning_rate': 1.1524743533653275e-05, 'epoch': 0.94} {'loss': 0.5112, 'learning_rate': 1.1524411483581568e-05, 'epoch': 0.94} {'loss': 0.4746, 'learning_rate': 1.152407943178909e-05, 'epoch': 0.94} {'loss': 0.7321, 'learning_rate': 1.1523747378276215e-05, 'epoch': 0.94} {'loss': 0.4679, 'learning_rate': 1.1523415323043321e-05, 'epoch': 0.94} {'loss': 0.543, 'learning_rate': 1.152308326609078e-05, 'epoch': 0.94} {'loss': 0.6475, 'learning_rate': 1.1522751207418967e-05, 'epoch': 0.94} {'loss': 0.5991, 'learning_rate': 1.1522419147028259e-05, 'epoch': 0.94} {'loss': 0.6265, 'learning_rate': 1.1522087084919028e-05, 'epoch': 0.94} {'loss': 0.5008, 'learning_rate': 1.152175502109165e-05, 'epoch': 0.94} {'loss': 0.5991, 'learning_rate': 1.1521422955546499e-05, 'epoch': 0.94} {'loss': 0.444, 'learning_rate': 1.1521090888283953e-05, 'epoch': 0.94} {'loss': 0.573, 'learning_rate': 1.1520758819304384e-05, 'epoch': 0.94} {'loss': 0.6613, 'learning_rate': 1.1520426748608164e-05, 'epoch': 0.94} {'loss': 0.5019, 'learning_rate': 1.1520094676195674e-05, 'epoch': 0.94} {'loss': 0.3486, 'learning_rate': 1.1519762602067287e-05, 'epoch': 0.94} {'loss': 0.5282, 'learning_rate': 1.1519430526223376e-05, 'epoch': 0.94} {'loss': 0.6279, 'learning_rate': 1.1519098448664318e-05, 'epoch': 0.94} {'loss': 0.637, 'learning_rate': 1.1518766369390486e-05, 'epoch': 0.94} {'loss': 0.6685, 'learning_rate': 1.1518434288402256e-05, 'epoch': 0.94} {'loss': 0.5327, 'learning_rate': 1.1518102205700001e-05, 'epoch': 0.94} {'loss': 0.6293, 'learning_rate': 1.1517770121284098e-05, 'epoch': 0.94} {'loss': 0.451, 'learning_rate': 1.1517438035154922e-05, 'epoch': 0.94} {'loss': 0.656, 'learning_rate': 1.1517105947312845e-05, 'epoch': 0.94} {'loss': 0.4357, 'learning_rate': 1.1516773857758245e-05, 'epoch': 0.94} {'loss': 0.5484, 'learning_rate': 1.1516441766491497e-05, 'epoch': 0.94} {'loss': 0.6575, 'learning_rate': 1.1516109673512974e-05, 'epoch': 0.94} {'loss': 0.5975, 'learning_rate': 1.1515777578823052e-05, 'epoch': 0.94} {'loss': 0.4731, 'learning_rate': 1.1515445482422106e-05, 'epoch': 0.94} {'loss': 0.5694, 'learning_rate': 1.1515113384310508e-05, 'epoch': 0.94} {'loss': 0.5376, 'learning_rate': 1.1514781284488636e-05, 'epoch': 0.94} {'loss': 0.588, 'learning_rate': 1.1514449182956864e-05, 'epoch': 0.94} {'loss': 0.5615, 'learning_rate': 1.1514117079715565e-05, 'epoch': 0.94} {'loss': 0.5315, 'learning_rate': 1.1513784974765119e-05, 'epoch': 0.94} {'loss': 0.6815, 'learning_rate': 1.1513452868105897e-05, 'epoch': 0.94} {'loss': 0.5857, 'learning_rate': 1.1513120759738272e-05, 'epoch': 0.94} {'loss': 0.559, 'learning_rate': 1.1512788649662624e-05, 'epoch': 0.94} {'loss': 0.5893, 'learning_rate': 1.1512456537879323e-05, 'epoch': 0.94} {'loss': 0.6018, 'learning_rate': 1.1512124424388748e-05, 'epoch': 0.94} {'loss': 0.4983, 'learning_rate': 1.1511792309191271e-05, 'epoch': 0.94} {'loss': 0.6134, 'learning_rate': 1.1511460192287272e-05, 'epoch': 0.94} {'loss': 0.5049, 'learning_rate': 1.1511128073677118e-05, 'epoch': 0.94} {'loss': 0.6398, 'learning_rate': 1.1510795953361188e-05, 'epoch': 0.94} {'loss': 0.7198, 'learning_rate': 1.1510463831339856e-05, 'epoch': 0.94} {'loss': 0.6321, 'learning_rate': 1.15101317076135e-05, 'epoch': 0.94} {'loss': 0.4645, 'learning_rate': 1.1509799582182489e-05, 'epoch': 0.94} {'loss': 0.5295, 'learning_rate': 1.1509467455047202e-05, 'epoch': 0.94} {'loss': 0.526, 'learning_rate': 1.1509135326208014e-05, 'epoch': 0.94} {'loss': 0.5398, 'learning_rate': 1.15088031956653e-05, 'epoch': 0.94} {'loss': 0.6632, 'learning_rate': 1.1508471063419434e-05, 'epoch': 0.94} {'loss': 0.7063, 'learning_rate': 1.1508138929470791e-05, 'epoch': 0.94} {'loss': 0.4912, 'learning_rate': 1.1507806793819744e-05, 'epoch': 0.94} {'loss': 0.5392, 'learning_rate': 1.1507474656466674e-05, 'epoch': 0.94} {'loss': 0.5485, 'learning_rate': 1.1507142517411951e-05, 'epoch': 0.94} {'loss': 0.6296, 'learning_rate': 1.1506810376655948e-05, 'epoch': 0.94} {'loss': 0.5577, 'learning_rate': 1.1506478234199044e-05, 'epoch': 0.94} {'loss': 0.4011, 'learning_rate': 1.1506146090041612e-05, 'epoch': 0.94} {'loss': 0.5365, 'learning_rate': 1.1505813944184028e-05, 'epoch': 0.94} {'loss': 0.4906, 'learning_rate': 1.1505481796626665e-05, 'epoch': 0.94} {'loss': 0.6652, 'learning_rate': 1.15051496473699e-05, 'epoch': 0.94} {'loss': 0.6523, 'learning_rate': 1.150481749641411e-05, 'epoch': 0.94} {'loss': 0.4982, 'learning_rate': 1.1504485343759662e-05, 'epoch': 0.94} {'loss': 0.552, 'learning_rate': 1.1504153189406939e-05, 'epoch': 0.94} {'loss': 0.5317, 'learning_rate': 1.1503821033356312e-05, 'epoch': 0.94} {'loss': 0.47, 'learning_rate': 1.1503488875608159e-05, 'epoch': 0.94} {'loss': 0.6162, 'learning_rate': 1.1503156716162853e-05, 'epoch': 0.94} {'loss': 0.6285, 'learning_rate': 1.1502824555020768e-05, 'epoch': 0.94} {'loss': 0.6671, 'learning_rate': 1.1502492392182279e-05, 'epoch': 0.94} {'loss': 0.4961, 'learning_rate': 1.1502160227647762e-05, 'epoch': 0.94} {'loss': 0.4514, 'learning_rate': 1.1501828061417592e-05, 'epoch': 0.94} {'loss': 0.7771, 'learning_rate': 1.1501495893492145e-05, 'epoch': 0.94} {'loss': 0.6224, 'learning_rate': 1.1501163723871793e-05, 'epoch': 0.94} {'loss': 0.6923, 'learning_rate': 1.1500831552556913e-05, 'epoch': 0.94} {'loss': 0.5616, 'learning_rate': 1.1500499379547881e-05, 'epoch': 0.94} {'loss': 0.5178, 'learning_rate': 1.1500167204845067e-05, 'epoch': 0.94} {'loss': 0.7573, 'learning_rate': 1.1499835028448854e-05, 'epoch': 0.94} {'loss': 0.5277, 'learning_rate': 1.149950285035961e-05, 'epoch': 0.94} {'loss': 0.4062, 'learning_rate': 1.1499170670577715e-05, 'epoch': 0.94} {'loss': 0.5647, 'learning_rate': 1.1498838489103539e-05, 'epoch': 0.94} {'loss': 0.5249, 'learning_rate': 1.149850630593746e-05, 'epoch': 0.94} {'loss': 0.6828, 'learning_rate': 1.149817412107985e-05, 'epoch': 0.94} {'loss': 0.5468, 'learning_rate': 1.1497841934531089e-05, 'epoch': 0.94} {'loss': 0.5494, 'learning_rate': 1.1497509746291549e-05, 'epoch': 0.94} {'loss': 0.5464, 'learning_rate': 1.1497177556361604e-05, 'epoch': 0.94} {'loss': 0.6147, 'learning_rate': 1.1496845364741631e-05, 'epoch': 0.94} {'loss': 0.4389, 'learning_rate': 1.1496513171432004e-05, 'epoch': 0.94} {'loss': 0.6393, 'learning_rate': 1.1496180976433097e-05, 'epoch': 0.94} {'loss': 0.4892, 'learning_rate': 1.149584877974529e-05, 'epoch': 0.94} {'loss': 0.4442, 'learning_rate': 1.149551658136895e-05, 'epoch': 0.94} {'loss': 0.44, 'learning_rate': 1.1495184381304459e-05, 'epoch': 0.94} {'loss': 0.4279, 'learning_rate': 1.149485217955219e-05, 'epoch': 0.94} {'loss': 0.522, 'learning_rate': 1.1494519976112515e-05, 'epoch': 0.94} {'loss': 0.5526, 'learning_rate': 1.1494187770985811e-05, 'epoch': 0.94} {'loss': 0.5038, 'learning_rate': 1.1493855564172453e-05, 'epoch': 0.94} {'loss': 0.3918, 'learning_rate': 1.1493523355672818e-05, 'epoch': 0.94} {'loss': 0.5508, 'learning_rate': 1.1493191145487278e-05, 'epoch': 0.94} {'loss': 0.7187, 'learning_rate': 1.1492858933616206e-05, 'epoch': 0.94} {'loss': 0.6133, 'learning_rate': 1.1492526720059984e-05, 'epoch': 0.94} {'loss': 0.3894, 'learning_rate': 1.1492194504818984e-05, 'epoch': 0.94} {'loss': 0.6098, 'learning_rate': 1.1491862287893577e-05, 'epoch': 0.94} {'loss': 0.3486, 'learning_rate': 1.1491530069284143e-05, 'epoch': 0.94} {'loss': 0.5015, 'learning_rate': 1.1491197848991053e-05, 'epoch': 0.94} {'loss': 0.4406, 'learning_rate': 1.1490865627014687e-05, 'epoch': 0.94} {'loss': 0.5668, 'learning_rate': 1.1490533403355419e-05, 'epoch': 0.94} {'loss': 0.6048, 'learning_rate': 1.1490201178013618e-05, 'epoch': 0.94} {'loss': 0.5182, 'learning_rate': 1.1489868950989664e-05, 'epoch': 0.94} {'loss': 0.527, 'learning_rate': 1.1489536722283931e-05, 'epoch': 0.94} {'loss': 0.5599, 'learning_rate': 1.1489204491896797e-05, 'epoch': 0.94} {'loss': 0.3785, 'learning_rate': 1.1488872259828632e-05, 'epoch': 0.94} {'loss': 0.5996, 'learning_rate': 1.1488540026079814e-05, 'epoch': 0.94} {'loss': 0.5645, 'learning_rate': 1.1488207790650716e-05, 'epoch': 0.94} {'loss': 0.5491, 'learning_rate': 1.1487875553541717e-05, 'epoch': 0.94} {'loss': 0.6287, 'learning_rate': 1.1487543314753187e-05, 'epoch': 0.94} {'loss': 0.5289, 'learning_rate': 1.1487211074285505e-05, 'epoch': 0.94} {'loss': 0.6076, 'learning_rate': 1.1486878832139043e-05, 'epoch': 0.94} {'loss': 0.5661, 'learning_rate': 1.148654658831418e-05, 'epoch': 0.94} {'loss': 0.6428, 'learning_rate': 1.1486214342811286e-05, 'epoch': 0.94} {'loss': 0.438, 'learning_rate': 1.148588209563074e-05, 'epoch': 0.94} {'loss': 0.5794, 'learning_rate': 1.1485549846772914e-05, 'epoch': 0.94} {'loss': 0.6368, 'learning_rate': 1.1485217596238187e-05, 'epoch': 0.94} {'loss': 0.6426, 'learning_rate': 1.148488534402693e-05, 'epoch': 0.94} {'loss': 0.5384, 'learning_rate': 1.1484553090139522e-05, 'epoch': 0.94} {'loss': 0.3997, 'learning_rate': 1.1484220834576334e-05, 'epoch': 0.94} {'loss': 0.5954, 'learning_rate': 1.1483888577337742e-05, 'epoch': 0.94} {'loss': 0.5107, 'learning_rate': 1.1483556318424124e-05, 'epoch': 0.94} {'loss': 0.5108, 'learning_rate': 1.1483224057835853e-05, 'epoch': 0.94} {'loss': 0.6714, 'learning_rate': 1.1482891795573304e-05, 'epoch': 0.94} {'loss': 0.7192, 'learning_rate': 1.1482559531636855e-05, 'epoch': 0.94} {'loss': 0.5439, 'learning_rate': 1.1482227266026873e-05, 'epoch': 0.94} {'loss': 0.349, 'learning_rate': 1.148189499874374e-05, 'epoch': 0.94} {'loss': 0.6521, 'learning_rate': 1.1481562729787829e-05, 'epoch': 0.94} {'loss': 0.53, 'learning_rate': 1.1481230459159517e-05, 'epoch': 0.94} {'loss': 0.5237, 'learning_rate': 1.1480898186859175e-05, 'epoch': 0.94} {'loss': 0.6459, 'learning_rate': 1.1480565912887183e-05, 'epoch': 0.94} {'loss': 0.5465, 'learning_rate': 1.1480233637243912e-05, 'epoch': 0.94} {'loss': 0.5663, 'learning_rate': 1.147990135992974e-05, 'epoch': 0.94} {'loss': 0.3676, 'learning_rate': 1.147956908094504e-05, 'epoch': 0.94} {'loss': 0.5073, 'learning_rate': 1.1479236800290188e-05, 'epoch': 0.94} {'loss': 0.6598, 'learning_rate': 1.1478904517965559e-05, 'epoch': 0.94} {'loss': 0.5607, 'learning_rate': 1.1478572233971527e-05, 'epoch': 0.94} {'loss': 0.5781, 'learning_rate': 1.1478239948308472e-05, 'epoch': 0.94} {'loss': 0.4267, 'learning_rate': 1.1477907660976761e-05, 'epoch': 0.94} {'loss': 0.6961, 'learning_rate': 1.1477575371976775e-05, 'epoch': 0.94} {'loss': 0.4358, 'learning_rate': 1.1477243081308887e-05, 'epoch': 0.94} {'loss': 0.6245, 'learning_rate': 1.1476910788973473e-05, 'epoch': 0.94} {'loss': 0.5329, 'learning_rate': 1.1476578494970905e-05, 'epoch': 0.94} {'loss': 0.545, 'learning_rate': 1.1476246199301563e-05, 'epoch': 0.94} {'loss': 0.5998, 'learning_rate': 1.1475913901965821e-05, 'epoch': 0.94} {'loss': 0.6452, 'learning_rate': 1.147558160296405e-05, 'epoch': 0.94} {'loss': 0.6222, 'learning_rate': 1.1475249302296629e-05, 'epoch': 0.94} {'loss': 0.4277, 'learning_rate': 1.1474916999963932e-05, 'epoch': 0.94} {'loss': 0.5726, 'learning_rate': 1.1474584695966334e-05, 'epoch': 0.94} {'loss': 0.5677, 'learning_rate': 1.147425239030421e-05, 'epoch': 0.94} {'loss': 0.7699, 'learning_rate': 1.1473920082977938e-05, 'epoch': 0.94} {'loss': 0.6958, 'learning_rate': 1.1473587773987888e-05, 'epoch': 0.94} {'loss': 0.4828, 'learning_rate': 1.1473255463334438e-05, 'epoch': 0.94} {'loss': 0.5104, 'learning_rate': 1.1472923151017964e-05, 'epoch': 0.94} {'loss': 0.6514, 'learning_rate': 1.147259083703884e-05, 'epoch': 0.94} {'loss': 0.558, 'learning_rate': 1.147225852139744e-05, 'epoch': 0.94} {'loss': 0.5577, 'learning_rate': 1.147192620409414e-05, 'epoch': 0.94} {'loss': 0.6663, 'learning_rate': 1.1471593885129312e-05, 'epoch': 0.94} {'loss': 0.6875, 'learning_rate': 1.147126156450334e-05, 'epoch': 0.94} {'loss': 0.4696, 'learning_rate': 1.1470929242216591e-05, 'epoch': 0.94} {'loss': 0.5248, 'learning_rate': 1.147059691826944e-05, 'epoch': 0.94} {'loss': 0.4362, 'learning_rate': 1.1470264592662268e-05, 'epoch': 0.94} {'loss': 0.4992, 'learning_rate': 1.1469932265395447e-05, 'epoch': 0.94} {'loss': 0.5118, 'learning_rate': 1.146959993646935e-05, 'epoch': 0.94} {'loss': 0.6146, 'learning_rate': 1.1469267605884356e-05, 'epoch': 0.94} {'loss': 0.6765, 'learning_rate': 1.1468935273640836e-05, 'epoch': 0.94} {'loss': 0.5693, 'learning_rate': 1.1468602939739168e-05, 'epoch': 0.94} {'loss': 0.6661, 'learning_rate': 1.1468270604179729e-05, 'epoch': 0.94} {'loss': 0.6006, 'learning_rate': 1.146793826696289e-05, 'epoch': 0.94} {'loss': 0.5441, 'learning_rate': 1.1467605928089027e-05, 'epoch': 0.94} {'loss': 0.5957, 'learning_rate': 1.1467273587558518e-05, 'epoch': 0.94} {'loss': 0.4851, 'learning_rate': 1.1466941245371734e-05, 'epoch': 0.94} {'loss': 0.664, 'learning_rate': 1.1466608901529055e-05, 'epoch': 0.94} {'loss': 0.3708, 'learning_rate': 1.1466276556030853e-05, 'epoch': 0.94} {'loss': 0.565, 'learning_rate': 1.1465944208877502e-05, 'epoch': 0.94} {'loss': 0.5326, 'learning_rate': 1.1465611860069378e-05, 'epoch': 0.94} {'loss': 0.6551, 'learning_rate': 1.1465279509606859e-05, 'epoch': 0.94} {'loss': 0.7175, 'learning_rate': 1.1464947157490316e-05, 'epoch': 0.94} {'loss': 0.5872, 'learning_rate': 1.146461480372013e-05, 'epoch': 0.94} {'loss': 0.5689, 'learning_rate': 1.1464282448296669e-05, 'epoch': 0.94} {'loss': 0.5964, 'learning_rate': 1.1463950091220311e-05, 'epoch': 0.94} {'loss': 0.5598, 'learning_rate': 1.1463617732491433e-05, 'epoch': 0.94} {'loss': 0.4041, 'learning_rate': 1.1463285372110408e-05, 'epoch': 0.94} {'loss': 0.6109, 'learning_rate': 1.1462953010077613e-05, 'epoch': 0.94} {'loss': 0.7164, 'learning_rate': 1.1462620646393423e-05, 'epoch': 0.94} {'loss': 0.5556, 'learning_rate': 1.1462288281058211e-05, 'epoch': 0.94} {'loss': 0.5966, 'learning_rate': 1.1461955914072357e-05, 'epoch': 0.94} {'loss': 0.4902, 'learning_rate': 1.146162354543623e-05, 'epoch': 0.94} {'loss': 0.6591, 'learning_rate': 1.1461291175150207e-05, 'epoch': 0.94} {'loss': 0.5883, 'learning_rate': 1.1460958803214665e-05, 'epoch': 0.94} {'loss': 0.5041, 'learning_rate': 1.1460626429629979e-05, 'epoch': 0.94} {'loss': 0.6629, 'learning_rate': 1.1460294054396523e-05, 'epoch': 0.94} {'loss': 0.5724, 'learning_rate': 1.1459961677514673e-05, 'epoch': 0.94} {'loss': 0.5547, 'learning_rate': 1.1459629298984803e-05, 'epoch': 0.94} {'loss': 0.5993, 'learning_rate': 1.145929691880729e-05, 'epoch': 0.94} {'loss': 0.4848, 'learning_rate': 1.1458964536982507e-05, 'epoch': 0.94} {'loss': 0.6246, 'learning_rate': 1.1458632153510832e-05, 'epoch': 0.94} {'loss': 0.3873, 'learning_rate': 1.1458299768392637e-05, 'epoch': 0.94} {'loss': 0.6506, 'learning_rate': 1.1457967381628301e-05, 'epoch': 0.94} {'loss': 0.4606, 'learning_rate': 1.1457634993218198e-05, 'epoch': 0.94} {'loss': 0.6396, 'learning_rate': 1.1457302603162699e-05, 'epoch': 0.94} {'loss': 0.5741, 'learning_rate': 1.1456970211462184e-05, 'epoch': 0.94} {'loss': 0.5984, 'learning_rate': 1.1456637818117027e-05, 'epoch': 0.94} {'loss': 0.4904, 'learning_rate': 1.1456305423127602e-05, 'epoch': 0.94} {'loss': 0.6257, 'learning_rate': 1.1455973026494286e-05, 'epoch': 0.94} {'loss': 0.6259, 'learning_rate': 1.1455640628217452e-05, 'epoch': 0.94} {'loss': 0.5512, 'learning_rate': 1.1455308228297477e-05, 'epoch': 0.94} {'loss': 0.5191, 'learning_rate': 1.1454975826734737e-05, 'epoch': 0.94} {'loss': 0.6655, 'learning_rate': 1.1454643423529604e-05, 'epoch': 0.94} {'loss': 0.6843, 'learning_rate': 1.1454311018682455e-05, 'epoch': 0.94} {'loss': 0.4383, 'learning_rate': 1.1453978612193668e-05, 'epoch': 0.94} {'loss': 0.5129, 'learning_rate': 1.1453646204063612e-05, 'epoch': 0.94} {'loss': 0.6179, 'learning_rate': 1.1453313794292671e-05, 'epoch': 0.94} {'loss': 0.4731, 'learning_rate': 1.1452981382881211e-05, 'epoch': 0.94} {'loss': 0.5857, 'learning_rate': 1.1452648969829613e-05, 'epoch': 0.94} {'loss': 0.3998, 'learning_rate': 1.145231655513825e-05, 'epoch': 0.94} {'loss': 0.7478, 'learning_rate': 1.1451984138807496e-05, 'epoch': 0.94} {'loss': 0.5826, 'learning_rate': 1.145165172083773e-05, 'epoch': 0.94} {'loss': 0.6442, 'learning_rate': 1.1451319301229326e-05, 'epoch': 0.94} {'loss': 0.5448, 'learning_rate': 1.1450986879982657e-05, 'epoch': 0.94} {'loss': 0.5218, 'learning_rate': 1.14506544570981e-05, 'epoch': 0.94} {'loss': 0.6778, 'learning_rate': 1.1450322032576031e-05, 'epoch': 0.94} {'loss': 0.5313, 'learning_rate': 1.1449989606416825e-05, 'epoch': 0.94} {'loss': 0.5532, 'learning_rate': 1.1449657178620857e-05, 'epoch': 0.94} {'loss': 0.4795, 'learning_rate': 1.14493247491885e-05, 'epoch': 0.94} {'loss': 0.5947, 'learning_rate': 1.1448992318120128e-05, 'epoch': 0.94} {'loss': 0.6118, 'learning_rate': 1.1448659885416122e-05, 'epoch': 0.94} {'loss': 0.6275, 'learning_rate': 1.1448327451076855e-05, 'epoch': 0.94} {'loss': 0.6546, 'learning_rate': 1.1447995015102702e-05, 'epoch': 0.94} {'loss': 0.5325, 'learning_rate': 1.1447662577494036e-05, 'epoch': 0.94} {'loss': 0.5068, 'learning_rate': 1.1447330138251235e-05, 'epoch': 0.94} {'loss': 0.5484, 'learning_rate': 1.1446997697374673e-05, 'epoch': 0.94} {'loss': 0.4585, 'learning_rate': 1.1446665254864725e-05, 'epoch': 0.94} {'loss': 0.557, 'learning_rate': 1.144633281072177e-05, 'epoch': 0.94} {'loss': 0.7061, 'learning_rate': 1.144600036494618e-05, 'epoch': 0.94} {'loss': 0.5993, 'learning_rate': 1.1445667917538327e-05, 'epoch': 0.94} {'loss': 0.6823, 'learning_rate': 1.1445335468498595e-05, 'epoch': 0.94} {'loss': 0.5948, 'learning_rate': 1.1445003017827351e-05, 'epoch': 0.94} {'loss': 0.6094, 'learning_rate': 1.1444670565524976e-05, 'epoch': 0.94} {'loss': 0.5067, 'learning_rate': 1.144433811159184e-05, 'epoch': 0.94} {'loss': 0.7383, 'learning_rate': 1.1444005656028322e-05, 'epoch': 0.94} {'loss': 0.5225, 'learning_rate': 1.1443673198834792e-05, 'epoch': 0.94} {'loss': 0.4366, 'learning_rate': 1.1443340740011634e-05, 'epoch': 0.94} {'loss': 0.4988, 'learning_rate': 1.1443008279559218e-05, 'epoch': 0.94} {'loss': 0.562, 'learning_rate': 1.144267581747792e-05, 'epoch': 0.94} {'loss': 0.5617, 'learning_rate': 1.1442343353768115e-05, 'epoch': 0.94} {'loss': 0.7027, 'learning_rate': 1.1442010888430177e-05, 'epoch': 0.94} {'loss': 0.5567, 'learning_rate': 1.1441678421464486e-05, 'epoch': 0.94} {'loss': 0.6548, 'learning_rate': 1.1441345952871413e-05, 'epoch': 0.94} {'loss': 0.5253, 'learning_rate': 1.1441013482651337e-05, 'epoch': 0.94} {'loss': 0.4673, 'learning_rate': 1.1440681010804627e-05, 'epoch': 0.94} {'loss': 0.6493, 'learning_rate': 1.1440348537331665e-05, 'epoch': 0.94} {'loss': 0.5163, 'learning_rate': 1.144001606223282e-05, 'epoch': 0.94} {'loss': 0.6532, 'learning_rate': 1.1439683585508472e-05, 'epoch': 0.94} {'loss': 0.5438, 'learning_rate': 1.1439351107158996e-05, 'epoch': 0.94} {'loss': 0.5054, 'learning_rate': 1.1439018627184766e-05, 'epoch': 0.94} {'loss': 0.6888, 'learning_rate': 1.1438686145586156e-05, 'epoch': 0.94} {'loss': 0.6711, 'learning_rate': 1.1438353662363544e-05, 'epoch': 0.94} {'loss': 0.7925, 'learning_rate': 1.1438021177517305e-05, 'epoch': 0.94} {'loss': 0.5, 'learning_rate': 1.1437688691047813e-05, 'epoch': 0.94} {'loss': 0.3706, 'learning_rate': 1.1437356202955443e-05, 'epoch': 0.94} {'loss': 0.5299, 'learning_rate': 1.1437023713240572e-05, 'epoch': 0.94} {'loss': 0.4965, 'learning_rate': 1.1436691221903574e-05, 'epoch': 0.94} {'loss': 0.6722, 'learning_rate': 1.1436358728944826e-05, 'epoch': 0.94} {'loss': 0.4154, 'learning_rate': 1.14360262343647e-05, 'epoch': 0.94} {'loss': 0.5951, 'learning_rate': 1.1435693738163576e-05, 'epoch': 0.94} {'loss': 0.4572, 'learning_rate': 1.1435361240341827e-05, 'epoch': 0.94} {'loss': 0.4974, 'learning_rate': 1.1435028740899825e-05, 'epoch': 0.94} {'loss': 0.6406, 'learning_rate': 1.143469623983795e-05, 'epoch': 0.94} {'loss': 0.7029, 'learning_rate': 1.1434363737156578e-05, 'epoch': 0.94} {'loss': 0.6282, 'learning_rate': 1.1434031232856078e-05, 'epoch': 0.94} {'loss': 0.7446, 'learning_rate': 1.1433698726936833e-05, 'epoch': 0.94} {'loss': 0.5476, 'learning_rate': 1.1433366219399211e-05, 'epoch': 0.94} {'loss': 0.4682, 'learning_rate': 1.1433033710243597e-05, 'epoch': 0.94} {'loss': 0.676, 'learning_rate': 1.1432701199470358e-05, 'epoch': 0.94} {'loss': 0.4071, 'learning_rate': 1.1432368687079869e-05, 'epoch': 0.94} {'loss': 0.5011, 'learning_rate': 1.143203617307251e-05, 'epoch': 0.94} {'loss': 0.5294, 'learning_rate': 1.1431703657448653e-05, 'epoch': 0.94} {'loss': 0.4231, 'learning_rate': 1.1431371140208675e-05, 'epoch': 0.94} {'loss': 0.5099, 'learning_rate': 1.1431038621352955e-05, 'epoch': 0.94} {'loss': 0.5225, 'learning_rate': 1.1430706100881861e-05, 'epoch': 0.94} {'loss': 0.4598, 'learning_rate': 1.1430373578795773e-05, 'epoch': 0.94} {'loss': 0.5105, 'learning_rate': 1.1430041055095064e-05, 'epoch': 0.94} {'loss': 0.6304, 'learning_rate': 1.142970852978011e-05, 'epoch': 0.94} {'loss': 0.6054, 'learning_rate': 1.142937600285129e-05, 'epoch': 0.94} {'loss': 0.5758, 'learning_rate': 1.1429043474308973e-05, 'epoch': 0.94} {'loss': 0.3821, 'learning_rate': 1.1428710944153542e-05, 'epoch': 0.94} {'loss': 0.509, 'learning_rate': 1.1428378412385365e-05, 'epoch': 0.94} {'loss': 0.7093, 'learning_rate': 1.142804587900482e-05, 'epoch': 0.94} {'loss': 0.4681, 'learning_rate': 1.1427713344012284e-05, 'epoch': 0.94} {'loss': 0.476, 'learning_rate': 1.142738080740813e-05, 'epoch': 0.94} {'loss': 0.6225, 'learning_rate': 1.1427048269192736e-05, 'epoch': 0.94} {'loss': 0.63, 'learning_rate': 1.1426715729366476e-05, 'epoch': 0.94} {'loss': 0.5131, 'learning_rate': 1.1426383187929724e-05, 'epoch': 0.94} {'loss': 0.5136, 'learning_rate': 1.1426050644882856e-05, 'epoch': 0.94} {'loss': 0.5371, 'learning_rate': 1.1425718100226248e-05, 'epoch': 0.94} {'loss': 0.6882, 'learning_rate': 1.1425385553960276e-05, 'epoch': 0.94} {'loss': 0.5322, 'learning_rate': 1.1425053006085317e-05, 'epoch': 0.94} {'loss': 0.4279, 'learning_rate': 1.142472045660174e-05, 'epoch': 0.94} {'loss': 0.6764, 'learning_rate': 1.142438790550993e-05, 'epoch': 0.94} {'loss': 0.6078, 'learning_rate': 1.1424055352810253e-05, 'epoch': 0.94} {'loss': 0.4572, 'learning_rate': 1.1423722798503088e-05, 'epoch': 0.94} {'loss': 0.6972, 'learning_rate': 1.1423390242588812e-05, 'epoch': 0.94} {'loss': 0.605, 'learning_rate': 1.1423057685067798e-05, 'epoch': 0.94} {'loss': 0.5855, 'learning_rate': 1.1422725125940423e-05, 'epoch': 0.94} {'loss': 0.5698, 'learning_rate': 1.1422392565207063e-05, 'epoch': 0.94} {'loss': 0.4787, 'learning_rate': 1.1422060002868092e-05, 'epoch': 0.94} {'loss': 0.5516, 'learning_rate': 1.1421727438923884e-05, 'epoch': 0.94} {'loss': 0.5451, 'learning_rate': 1.1421394873374815e-05, 'epoch': 0.94} {'loss': 0.6729, 'learning_rate': 1.1421062306221265e-05, 'epoch': 0.94} {'loss': 0.5068, 'learning_rate': 1.1420729737463604e-05, 'epoch': 0.94} {'loss': 0.5639, 'learning_rate': 1.1420397167102211e-05, 'epoch': 0.94} {'loss': 0.6683, 'learning_rate': 1.1420064595137457e-05, 'epoch': 0.94} {'loss': 0.5941, 'learning_rate': 1.1419732021569722e-05, 'epoch': 0.94} {'loss': 0.5921, 'learning_rate': 1.1419399446399377e-05, 'epoch': 0.94} {'loss': 0.6252, 'learning_rate': 1.1419066869626803e-05, 'epoch': 0.94} {'loss': 0.6856, 'learning_rate': 1.1418734291252371e-05, 'epoch': 0.94} {'loss': 0.3702, 'learning_rate': 1.141840171127646e-05, 'epoch': 0.94} {'loss': 0.6298, 'learning_rate': 1.141806912969944e-05, 'epoch': 0.94} {'loss': 0.5249, 'learning_rate': 1.1417736546521691e-05, 'epoch': 0.94} {'loss': 0.4849, 'learning_rate': 1.1417403961743587e-05, 'epoch': 0.94} {'loss': 0.5777, 'learning_rate': 1.1417071375365502e-05, 'epoch': 0.94} {'loss': 0.4769, 'learning_rate': 1.1416738787387817e-05, 'epoch': 0.94} {'loss': 0.6066, 'learning_rate': 1.14164061978109e-05, 'epoch': 0.94} {'loss': 0.591, 'learning_rate': 1.1416073606635129e-05, 'epoch': 0.94} {'loss': 0.3739, 'learning_rate': 1.1415741013860883e-05, 'epoch': 0.94} {'loss': 0.64, 'learning_rate': 1.1415408419488533e-05, 'epoch': 0.94} {'loss': 0.3768, 'learning_rate': 1.1415075823518456e-05, 'epoch': 0.94} {'loss': 0.4195, 'learning_rate': 1.1414743225951028e-05, 'epoch': 0.94} {'loss': 0.3783, 'learning_rate': 1.1414410626786623e-05, 'epoch': 0.94} {'loss': 0.613, 'learning_rate': 1.1414078026025619e-05, 'epoch': 0.94} {'loss': 0.4945, 'learning_rate': 1.1413745423668388e-05, 'epoch': 0.94} {'loss': 0.6391, 'learning_rate': 1.1413412819715309e-05, 'epoch': 0.94} {'loss': 0.5922, 'learning_rate': 1.1413080214166752e-05, 'epoch': 0.94} {'loss': 0.5704, 'learning_rate': 1.14127476070231e-05, 'epoch': 0.94} {'loss': 0.4311, 'learning_rate': 1.1412414998284725e-05, 'epoch': 0.94} {'loss': 0.4549, 'learning_rate': 1.1412082387952e-05, 'epoch': 0.94} {'loss': 0.602, 'learning_rate': 1.1411749776025303e-05, 'epoch': 0.94} {'loss': 0.558, 'learning_rate': 1.141141716250501e-05, 'epoch': 0.94} {'loss': 0.6332, 'learning_rate': 1.1411084547391493e-05, 'epoch': 0.94} {'loss': 0.4494, 'learning_rate': 1.1410751930685132e-05, 'epoch': 0.94} {'loss': 0.5303, 'learning_rate': 1.1410419312386298e-05, 'epoch': 0.94} {'loss': 0.5319, 'learning_rate': 1.1410086692495372e-05, 'epoch': 0.94} {'loss': 0.5344, 'learning_rate': 1.1409754071012725e-05, 'epoch': 0.94} {'loss': 0.5937, 'learning_rate': 1.1409421447938733e-05, 'epoch': 0.94} {'loss': 0.5492, 'learning_rate': 1.140908882327377e-05, 'epoch': 0.94} {'loss': 0.48, 'learning_rate': 1.1408756197018218e-05, 'epoch': 0.94} {'loss': 0.2949, 'learning_rate': 1.1408423569172446e-05, 'epoch': 0.94} {'loss': 0.686, 'learning_rate': 1.1408090939736832e-05, 'epoch': 0.94} {'loss': 0.5228, 'learning_rate': 1.1407758308711754e-05, 'epoch': 0.94} {'loss': 0.3418, 'learning_rate': 1.140742567609758e-05, 'epoch': 0.94} {'loss': 0.4507, 'learning_rate': 1.1407093041894692e-05, 'epoch': 0.94} {'loss': 0.4842, 'learning_rate': 1.1406760406103463e-05, 'epoch': 0.94} {'loss': 0.4941, 'learning_rate': 1.140642776872427e-05, 'epoch': 0.94} {'loss': 0.4565, 'learning_rate': 1.1406095129757486e-05, 'epoch': 0.94} {'loss': 0.5109, 'learning_rate': 1.1405762489203489e-05, 'epoch': 0.94} {'loss': 0.5098, 'learning_rate': 1.1405429847062653e-05, 'epoch': 0.94} {'loss': 0.5256, 'learning_rate': 1.1405097203335353e-05, 'epoch': 0.94} {'loss': 0.765, 'learning_rate': 1.1404764558021968e-05, 'epoch': 0.94} {'loss': 0.6704, 'learning_rate': 1.1404431911122869e-05, 'epoch': 0.94} {'loss': 0.5676, 'learning_rate': 1.1404099262638436e-05, 'epoch': 0.94} {'loss': 0.5663, 'learning_rate': 1.1403766612569038e-05, 'epoch': 0.94} {'loss': 0.5947, 'learning_rate': 1.1403433960915055e-05, 'epoch': 0.94} {'loss': 0.5749, 'learning_rate': 1.1403101307676865e-05, 'epoch': 0.94} {'loss': 0.4389, 'learning_rate': 1.1402768652854838e-05, 'epoch': 0.94} {'loss': 0.6682, 'learning_rate': 1.1402435996449353e-05, 'epoch': 0.94} {'loss': 0.4511, 'learning_rate': 1.1402103338460783e-05, 'epoch': 0.94} {'loss': 0.6469, 'learning_rate': 1.1401770678889505e-05, 'epoch': 0.94} {'loss': 0.5703, 'learning_rate': 1.1401438017735897e-05, 'epoch': 0.94} {'loss': 0.5765, 'learning_rate': 1.140110535500033e-05, 'epoch': 0.94} {'loss': 0.5505, 'learning_rate': 1.1400772690683182e-05, 'epoch': 0.94} {'loss': 0.5022, 'learning_rate': 1.1400440024784827e-05, 'epoch': 0.94} {'loss': 0.4444, 'learning_rate': 1.1400107357305645e-05, 'epoch': 0.94} {'loss': 0.3406, 'learning_rate': 1.1399774688246006e-05, 'epoch': 0.94} {'loss': 0.5307, 'learning_rate': 1.1399442017606286e-05, 'epoch': 0.94} {'loss': 0.491, 'learning_rate': 1.1399109345386863e-05, 'epoch': 0.94} {'loss': 0.5745, 'learning_rate': 1.1398776671588112e-05, 'epoch': 0.94} {'loss': 0.4988, 'learning_rate': 1.1398443996210408e-05, 'epoch': 0.94} {'loss': 0.4787, 'learning_rate': 1.1398111319254126e-05, 'epoch': 0.94} {'loss': 0.5112, 'learning_rate': 1.1397778640719643e-05, 'epoch': 0.94} {'loss': 0.6115, 'learning_rate': 1.1397445960607335e-05, 'epoch': 0.94} {'loss': 0.6597, 'learning_rate': 1.1397113278917574e-05, 'epoch': 0.94} {'loss': 0.5289, 'learning_rate': 1.1396780595650739e-05, 'epoch': 0.94} {'loss': 0.561, 'learning_rate': 1.1396447910807203e-05, 'epoch': 0.94} {'loss': 0.7094, 'learning_rate': 1.1396115224387342e-05, 'epoch': 0.94} {'loss': 0.4626, 'learning_rate': 1.1395782536391538e-05, 'epoch': 0.94} {'loss': 0.5509, 'learning_rate': 1.1395449846820154e-05, 'epoch': 0.94} {'loss': 0.6526, 'learning_rate': 1.1395117155673577e-05, 'epoch': 0.94} {'loss': 0.6132, 'learning_rate': 1.1394784462952175e-05, 'epoch': 0.94} {'loss': 0.521, 'learning_rate': 1.139445176865633e-05, 'epoch': 0.94} {'loss': 0.6981, 'learning_rate': 1.1394119072786412e-05, 'epoch': 0.94} {'loss': 0.691, 'learning_rate': 1.1393786375342799e-05, 'epoch': 0.94} {'loss': 0.527, 'learning_rate': 1.1393453676325866e-05, 'epoch': 0.94} {'loss': 0.6728, 'learning_rate': 1.1393120975735988e-05, 'epoch': 0.94} {'loss': 0.5749, 'learning_rate': 1.1392788273573544e-05, 'epoch': 0.94} {'loss': 0.6142, 'learning_rate': 1.1392455569838903e-05, 'epoch': 0.94} {'loss': 0.5673, 'learning_rate': 1.1392122864532447e-05, 'epoch': 0.94} {'loss': 0.668, 'learning_rate': 1.1391790157654547e-05, 'epoch': 0.94} {'loss': 0.5166, 'learning_rate': 1.1391457449205585e-05, 'epoch': 0.94} {'loss': 0.5582, 'learning_rate': 1.1391124739185928e-05, 'epoch': 0.94} {'loss': 0.5498, 'learning_rate': 1.1390792027595958e-05, 'epoch': 0.95} {'loss': 0.4952, 'learning_rate': 1.1390459314436047e-05, 'epoch': 0.95} {'loss': 0.6847, 'learning_rate': 1.1390126599706573e-05, 'epoch': 0.95} {'loss': 0.5831, 'learning_rate': 1.1389793883407906e-05, 'epoch': 0.95} {'loss': 0.5263, 'learning_rate': 1.1389461165540431e-05, 'epoch': 0.95} {'loss': 0.6182, 'learning_rate': 1.1389128446104519e-05, 'epoch': 0.95} {'loss': 0.655, 'learning_rate': 1.1388795725100542e-05, 'epoch': 0.95} {'loss': 0.5443, 'learning_rate': 1.138846300252888e-05, 'epoch': 0.95} {'loss': 0.6167, 'learning_rate': 1.1388130278389906e-05, 'epoch': 0.95} {'loss': 0.4768, 'learning_rate': 1.1387797552683999e-05, 'epoch': 0.95} {'loss': 0.5313, 'learning_rate': 1.1387464825411532e-05, 'epoch': 0.95} {'loss': 0.3637, 'learning_rate': 1.138713209657288e-05, 'epoch': 0.95} {'loss': 0.5702, 'learning_rate': 1.138679936616842e-05, 'epoch': 0.95} {'loss': 0.443, 'learning_rate': 1.1386466634198525e-05, 'epoch': 0.95} {'loss': 0.5228, 'learning_rate': 1.1386133900663576e-05, 'epoch': 0.95} {'loss': 0.472, 'learning_rate': 1.1385801165563946e-05, 'epoch': 0.95} {'loss': 0.6282, 'learning_rate': 1.1385468428900009e-05, 'epoch': 0.95} {'loss': 0.5692, 'learning_rate': 1.138513569067214e-05, 'epoch': 0.95} {'loss': 0.5825, 'learning_rate': 1.1384802950880718e-05, 'epoch': 0.95} {'loss': 0.5104, 'learning_rate': 1.1384470209526116e-05, 'epoch': 0.95} {'loss': 0.4093, 'learning_rate': 1.1384137466608709e-05, 'epoch': 0.95} {'loss': 0.4361, 'learning_rate': 1.1383804722128878e-05, 'epoch': 0.95} {'loss': 0.5866, 'learning_rate': 1.1383471976086993e-05, 'epoch': 0.95} {'loss': 0.6529, 'learning_rate': 1.138313922848343e-05, 'epoch': 0.95} {'loss': 0.552, 'learning_rate': 1.1382806479318567e-05, 'epoch': 0.95} {'loss': 0.6484, 'learning_rate': 1.1382473728592778e-05, 'epoch': 0.95} {'loss': 0.5162, 'learning_rate': 1.1382140976306436e-05, 'epoch': 0.95} {'loss': 0.4388, 'learning_rate': 1.1381808222459924e-05, 'epoch': 0.95} {'loss': 0.5209, 'learning_rate': 1.138147546705361e-05, 'epoch': 0.95} {'loss': 0.4853, 'learning_rate': 1.1381142710087876e-05, 'epoch': 0.95} {'loss': 0.4197, 'learning_rate': 1.1380809951563094e-05, 'epoch': 0.95} {'loss': 0.5843, 'learning_rate': 1.1380477191479637e-05, 'epoch': 0.95} {'loss': 0.5767, 'learning_rate': 1.1380144429837887e-05, 'epoch': 0.95} {'loss': 0.4321, 'learning_rate': 1.1379811666638217e-05, 'epoch': 0.95} {'loss': 0.528, 'learning_rate': 1.1379478901880999e-05, 'epoch': 0.95} {'loss': 0.5513, 'learning_rate': 1.1379146135566614e-05, 'epoch': 0.95} {'loss': 0.5139, 'learning_rate': 1.1378813367695436e-05, 'epoch': 0.95} {'loss': 0.4421, 'learning_rate': 1.1378480598267837e-05, 'epoch': 0.95} {'loss': 0.553, 'learning_rate': 1.1378147827284199e-05, 'epoch': 0.95} {'loss': 0.5194, 'learning_rate': 1.1377815054744889e-05, 'epoch': 0.95} {'loss': 0.5153, 'learning_rate': 1.1377482280650291e-05, 'epoch': 0.95} {'loss': 0.5032, 'learning_rate': 1.1377149505000778e-05, 'epoch': 0.95} {'loss': 0.6282, 'learning_rate': 1.1376816727796724e-05, 'epoch': 0.95} {'loss': 0.5626, 'learning_rate': 1.1376483949038506e-05, 'epoch': 0.95} {'loss': 0.6061, 'learning_rate': 1.1376151168726499e-05, 'epoch': 0.95} {'loss': 0.6955, 'learning_rate': 1.137581838686108e-05, 'epoch': 0.95} {'loss': 0.5178, 'learning_rate': 1.1375485603442625e-05, 'epoch': 0.95} {'loss': 0.5828, 'learning_rate': 1.1375152818471504e-05, 'epoch': 0.95} {'loss': 0.3674, 'learning_rate': 1.1374820031948102e-05, 'epoch': 0.95} {'loss': 0.5819, 'learning_rate': 1.1374487243872787e-05, 'epoch': 0.95} {'loss': 0.618, 'learning_rate': 1.1374154454245936e-05, 'epoch': 0.95} {'loss': 0.4869, 'learning_rate': 1.1373821663067928e-05, 'epoch': 0.95} {'loss': 0.6539, 'learning_rate': 1.1373488870339136e-05, 'epoch': 0.95} {'loss': 0.5337, 'learning_rate': 1.1373156076059936e-05, 'epoch': 0.95} {'loss': 0.6168, 'learning_rate': 1.1372823280230705e-05, 'epoch': 0.95} {'loss': 0.6309, 'learning_rate': 1.1372490482851815e-05, 'epoch': 0.95} {'loss': 0.5678, 'learning_rate': 1.1372157683923646e-05, 'epoch': 0.95} {'loss': 0.4648, 'learning_rate': 1.1371824883446571e-05, 'epoch': 0.95} {'loss': 0.6757, 'learning_rate': 1.1371492081420967e-05, 'epoch': 0.95} {'loss': 0.6628, 'learning_rate': 1.137115927784721e-05, 'epoch': 0.95} {'loss': 0.6115, 'learning_rate': 1.1370826472725673e-05, 'epoch': 0.95} {'loss': 0.5663, 'learning_rate': 1.1370493666056736e-05, 'epoch': 0.95} {'loss': 0.6214, 'learning_rate': 1.1370160857840771e-05, 'epoch': 0.95} {'loss': 0.5099, 'learning_rate': 1.1369828048078155e-05, 'epoch': 0.95} {'loss': 0.4627, 'learning_rate': 1.1369495236769263e-05, 'epoch': 0.95} {'loss': 0.6404, 'learning_rate': 1.1369162423914473e-05, 'epoch': 0.95} {'loss': 0.3826, 'learning_rate': 1.1368829609514158e-05, 'epoch': 0.95} {'loss': 0.5868, 'learning_rate': 1.1368496793568696e-05, 'epoch': 0.95} {'loss': 0.5911, 'learning_rate': 1.1368163976078459e-05, 'epoch': 0.95} {'loss': 0.5649, 'learning_rate': 1.1367831157043825e-05, 'epoch': 0.95} {'loss': 0.5439, 'learning_rate': 1.136749833646517e-05, 'epoch': 0.95} {'loss': 0.5451, 'learning_rate': 1.1367165514342872e-05, 'epoch': 0.95} {'loss': 0.5933, 'learning_rate': 1.1366832690677303e-05, 'epoch': 0.95} {'loss': 0.5139, 'learning_rate': 1.136649986546884e-05, 'epoch': 0.95} {'loss': 0.5549, 'learning_rate': 1.1366167038717857e-05, 'epoch': 0.95} {'loss': 0.6208, 'learning_rate': 1.1365834210424733e-05, 'epoch': 0.95} {'loss': 0.6901, 'learning_rate': 1.1365501380589841e-05, 'epoch': 0.95} {'loss': 0.5734, 'learning_rate': 1.1365168549213556e-05, 'epoch': 0.95} {'loss': 0.6126, 'learning_rate': 1.1364835716296257e-05, 'epoch': 0.95} {'loss': 0.5589, 'learning_rate': 1.1364502881838317e-05, 'epoch': 0.95} {'loss': 0.431, 'learning_rate': 1.1364170045840114e-05, 'epoch': 0.95} {'loss': 0.6615, 'learning_rate': 1.1363837208302021e-05, 'epoch': 0.95} {'loss': 0.6361, 'learning_rate': 1.1363504369224416e-05, 'epoch': 0.95} {'loss': 0.563, 'learning_rate': 1.1363171528607674e-05, 'epoch': 0.95} {'loss': 0.5666, 'learning_rate': 1.1362838686452171e-05, 'epoch': 0.95} {'loss': 0.6241, 'learning_rate': 1.1362505842758282e-05, 'epoch': 0.95} {'loss': 0.5738, 'learning_rate': 1.1362172997526383e-05, 'epoch': 0.95} {'loss': 0.6462, 'learning_rate': 1.1361840150756851e-05, 'epoch': 0.95} {'loss': 0.6203, 'learning_rate': 1.1361507302450058e-05, 'epoch': 0.95} {'loss': 0.3925, 'learning_rate': 1.1361174452606383e-05, 'epoch': 0.95} {'loss': 0.5148, 'learning_rate': 1.13608416012262e-05, 'epoch': 0.95} {'loss': 0.4704, 'learning_rate': 1.1360508748309886e-05, 'epoch': 0.95} {'loss': 0.6173, 'learning_rate': 1.1360175893857818e-05, 'epoch': 0.95} {'loss': 0.5318, 'learning_rate': 1.1359843037870369e-05, 'epoch': 0.95} {'loss': 0.6372, 'learning_rate': 1.1359510180347915e-05, 'epoch': 0.95} {'loss': 0.5285, 'learning_rate': 1.1359177321290834e-05, 'epoch': 0.95} {'loss': 0.5522, 'learning_rate': 1.1358844460699498e-05, 'epoch': 0.95} {'loss': 0.4546, 'learning_rate': 1.1358511598574287e-05, 'epoch': 0.95} {'loss': 0.5622, 'learning_rate': 1.1358178734915577e-05, 'epoch': 0.95} {'loss': 0.5406, 'learning_rate': 1.1357845869723738e-05, 'epoch': 0.95} {'loss': 0.5162, 'learning_rate': 1.135751300299915e-05, 'epoch': 0.95} {'loss': 0.6493, 'learning_rate': 1.1357180134742187e-05, 'epoch': 0.95} {'loss': 0.5504, 'learning_rate': 1.1356847264953229e-05, 'epoch': 0.95} {'loss': 0.4485, 'learning_rate': 1.1356514393632643e-05, 'epoch': 0.95} {'loss': 0.544, 'learning_rate': 1.1356181520780814e-05, 'epoch': 0.95} {'loss': 0.526, 'learning_rate': 1.1355848646398113e-05, 'epoch': 0.95} {'loss': 0.6793, 'learning_rate': 1.1355515770484917e-05, 'epoch': 0.95} {'loss': 0.5714, 'learning_rate': 1.13551828930416e-05, 'epoch': 0.95} {'loss': 0.5282, 'learning_rate': 1.1354850014068542e-05, 'epoch': 0.95} {'loss': 0.5745, 'learning_rate': 1.1354517133566114e-05, 'epoch': 0.95} {'loss': 0.7091, 'learning_rate': 1.1354184251534694e-05, 'epoch': 0.95} {'loss': 0.6004, 'learning_rate': 1.1353851367974657e-05, 'epoch': 0.95} {'loss': 0.5997, 'learning_rate': 1.1353518482886382e-05, 'epoch': 0.95} {'loss': 0.6003, 'learning_rate': 1.135318559627024e-05, 'epoch': 0.95} {'loss': 0.6681, 'learning_rate': 1.1352852708126608e-05, 'epoch': 0.95} {'loss': 0.4918, 'learning_rate': 1.1352519818455862e-05, 'epoch': 0.95} {'loss': 0.5236, 'learning_rate': 1.135218692725838e-05, 'epoch': 0.95} {'loss': 0.6622, 'learning_rate': 1.1351854034534536e-05, 'epoch': 0.95} {'loss': 0.5053, 'learning_rate': 1.1351521140284704e-05, 'epoch': 0.95} {'loss': 0.3893, 'learning_rate': 1.1351188244509265e-05, 'epoch': 0.95} {'loss': 0.5188, 'learning_rate': 1.1350855347208589e-05, 'epoch': 0.95} {'loss': 0.5067, 'learning_rate': 1.1350522448383056e-05, 'epoch': 0.95} {'loss': 0.7217, 'learning_rate': 1.135018954803304e-05, 'epoch': 0.95} {'loss': 0.6011, 'learning_rate': 1.1349856646158917e-05, 'epoch': 0.95} {'loss': 0.5807, 'learning_rate': 1.134952374276106e-05, 'epoch': 0.95} {'loss': 0.6013, 'learning_rate': 1.1349190837839847e-05, 'epoch': 0.95} {'loss': 0.5252, 'learning_rate': 1.1348857931395657e-05, 'epoch': 0.95} {'loss': 0.4744, 'learning_rate': 1.134852502342886e-05, 'epoch': 0.95} {'loss': 0.4326, 'learning_rate': 1.1348192113939835e-05, 'epoch': 0.95} {'loss': 0.5235, 'learning_rate': 1.1347859202928962e-05, 'epoch': 0.95} {'loss': 0.5411, 'learning_rate': 1.1347526290396607e-05, 'epoch': 0.95} {'loss': 0.4305, 'learning_rate': 1.1347193376343153e-05, 'epoch': 0.95} {'loss': 0.6371, 'learning_rate': 1.1346860460768973e-05, 'epoch': 0.95} {'loss': 0.5402, 'learning_rate': 1.1346527543674446e-05, 'epoch': 0.95} {'loss': 0.4844, 'learning_rate': 1.1346194625059946e-05, 'epoch': 0.95} {'loss': 0.4803, 'learning_rate': 1.1345861704925844e-05, 'epoch': 0.95} {'loss': 0.7566, 'learning_rate': 1.1345528783272523e-05, 'epoch': 0.95} {'loss': 0.729, 'learning_rate': 1.1345195860100356e-05, 'epoch': 0.95} {'loss': 0.6701, 'learning_rate': 1.1344862935409717e-05, 'epoch': 0.95} {'loss': 0.6518, 'learning_rate': 1.1344530009200985e-05, 'epoch': 0.95} {'loss': 0.6185, 'learning_rate': 1.1344197081474533e-05, 'epoch': 0.95} {'loss': 0.4911, 'learning_rate': 1.1343864152230736e-05, 'epoch': 0.95} {'loss': 0.4703, 'learning_rate': 1.1343531221469977e-05, 'epoch': 0.95} {'loss': 0.4292, 'learning_rate': 1.1343198289192623e-05, 'epoch': 0.95} {'loss': 0.8143, 'learning_rate': 1.1342865355399055e-05, 'epoch': 0.95} {'loss': 0.4499, 'learning_rate': 1.1342532420089647e-05, 'epoch': 0.95} {'loss': 0.5155, 'learning_rate': 1.1342199483264775e-05, 'epoch': 0.95} {'loss': 0.5358, 'learning_rate': 1.1341866544924817e-05, 'epoch': 0.95} {'loss': 0.4361, 'learning_rate': 1.1341533605070146e-05, 'epoch': 0.95} {'loss': 0.6258, 'learning_rate': 1.1341200663701137e-05, 'epoch': 0.95} {'loss': 0.5752, 'learning_rate': 1.134086772081817e-05, 'epoch': 0.95} {'loss': 0.7451, 'learning_rate': 1.1340534776421617e-05, 'epoch': 0.95} {'loss': 0.6836, 'learning_rate': 1.1340201830511854e-05, 'epoch': 0.95} {'loss': 0.401, 'learning_rate': 1.1339868883089258e-05, 'epoch': 0.95} {'loss': 0.3721, 'learning_rate': 1.1339535934154207e-05, 'epoch': 0.95} {'loss': 0.6707, 'learning_rate': 1.1339202983707072e-05, 'epoch': 0.95} {'loss': 0.4882, 'learning_rate': 1.1338870031748232e-05, 'epoch': 0.95} {'loss': 0.4793, 'learning_rate': 1.1338537078278065e-05, 'epoch': 0.95} {'loss': 0.5263, 'learning_rate': 1.133820412329694e-05, 'epoch': 0.95} {'loss': 0.4826, 'learning_rate': 1.133787116680524e-05, 'epoch': 0.95} {'loss': 0.4406, 'learning_rate': 1.1337538208803339e-05, 'epoch': 0.95} {'loss': 0.5079, 'learning_rate': 1.133720524929161e-05, 'epoch': 0.95} {'loss': 0.4858, 'learning_rate': 1.1336872288270428e-05, 'epoch': 0.95} {'loss': 0.393, 'learning_rate': 1.1336539325740175e-05, 'epoch': 0.95} {'loss': 0.5988, 'learning_rate': 1.133620636170122e-05, 'epoch': 0.95} {'loss': 0.6413, 'learning_rate': 1.1335873396153947e-05, 'epoch': 0.95} {'loss': 0.5929, 'learning_rate': 1.1335540429098724e-05, 'epoch': 0.95} {'loss': 0.6176, 'learning_rate': 1.1335207460535929e-05, 'epoch': 0.95} {'loss': 0.5967, 'learning_rate': 1.1334874490465939e-05, 'epoch': 0.95} {'loss': 0.516, 'learning_rate': 1.1334541518889131e-05, 'epoch': 0.95} {'loss': 0.6709, 'learning_rate': 1.1334208545805879e-05, 'epoch': 0.95} {'loss': 0.6717, 'learning_rate': 1.133387557121656e-05, 'epoch': 0.95} {'loss': 0.6661, 'learning_rate': 1.133354259512155e-05, 'epoch': 0.95} {'loss': 0.523, 'learning_rate': 1.133320961752122e-05, 'epoch': 0.95} {'loss': 0.5424, 'learning_rate': 1.1332876638415953e-05, 'epoch': 0.95} {'loss': 0.5204, 'learning_rate': 1.133254365780612e-05, 'epoch': 0.95} {'loss': 0.7556, 'learning_rate': 1.13322106756921e-05, 'epoch': 0.95} {'loss': 0.4116, 'learning_rate': 1.1331877692074264e-05, 'epoch': 0.95} {'loss': 0.5423, 'learning_rate': 1.1331544706952995e-05, 'epoch': 0.95} {'loss': 0.5531, 'learning_rate': 1.1331211720328666e-05, 'epoch': 0.95} {'loss': 0.4915, 'learning_rate': 1.133087873220165e-05, 'epoch': 0.95} {'loss': 0.5879, 'learning_rate': 1.1330545742572325e-05, 'epoch': 0.95} {'loss': 0.5841, 'learning_rate': 1.1330212751441066e-05, 'epoch': 0.95} {'loss': 0.4836, 'learning_rate': 1.1329879758808251e-05, 'epoch': 0.95} {'loss': 0.5579, 'learning_rate': 1.1329546764674258e-05, 'epoch': 0.95} {'loss': 0.5424, 'learning_rate': 1.1329213769039455e-05, 'epoch': 0.95} {'loss': 0.5391, 'learning_rate': 1.1328880771904224e-05, 'epoch': 0.95} {'loss': 0.5136, 'learning_rate': 1.132854777326894e-05, 'epoch': 0.95} {'loss': 0.4779, 'learning_rate': 1.1328214773133977e-05, 'epoch': 0.95} {'loss': 0.5081, 'learning_rate': 1.1327881771499711e-05, 'epoch': 0.95} {'loss': 0.6395, 'learning_rate': 1.1327548768366522e-05, 'epoch': 0.95} {'loss': 0.4381, 'learning_rate': 1.1327215763734778e-05, 'epoch': 0.95} {'loss': 0.5245, 'learning_rate': 1.1326882757604864e-05, 'epoch': 0.95} {'loss': 0.6163, 'learning_rate': 1.1326549749977149e-05, 'epoch': 0.95} {'loss': 0.6921, 'learning_rate': 1.1326216740852015e-05, 'epoch': 0.95} {'loss': 0.4611, 'learning_rate': 1.1325883730229833e-05, 'epoch': 0.95} {'loss': 0.5201, 'learning_rate': 1.1325550718110979e-05, 'epoch': 0.95} {'loss': 0.5748, 'learning_rate': 1.1325217704495833e-05, 'epoch': 0.95} {'loss': 0.4501, 'learning_rate': 1.1324884689384768e-05, 'epoch': 0.95} {'loss': 0.6395, 'learning_rate': 1.1324551672778157e-05, 'epoch': 0.95} {'loss': 0.6065, 'learning_rate': 1.132421865467638e-05, 'epoch': 0.95} {'loss': 0.5146, 'learning_rate': 1.1323885635079814e-05, 'epoch': 0.95} {'loss': 0.5716, 'learning_rate': 1.1323552613988832e-05, 'epoch': 0.95} {'loss': 0.6221, 'learning_rate': 1.1323219591403808e-05, 'epoch': 0.95} {'loss': 0.4145, 'learning_rate': 1.1322886567325124e-05, 'epoch': 0.95} {'loss': 0.4544, 'learning_rate': 1.1322553541753153e-05, 'epoch': 0.95} {'loss': 0.5678, 'learning_rate': 1.1322220514688267e-05, 'epoch': 0.95} {'loss': 0.5534, 'learning_rate': 1.1321887486130847e-05, 'epoch': 0.95} {'loss': 0.6759, 'learning_rate': 1.132155445608127e-05, 'epoch': 0.95} {'loss': 0.5369, 'learning_rate': 1.1321221424539905e-05, 'epoch': 0.95} {'loss': 0.5952, 'learning_rate': 1.1320888391507137e-05, 'epoch': 0.95} {'loss': 0.6593, 'learning_rate': 1.1320555356983333e-05, 'epoch': 0.95} {'loss': 0.4578, 'learning_rate': 1.1320222320968874e-05, 'epoch': 0.95} {'loss': 0.4784, 'learning_rate': 1.1319889283464138e-05, 'epoch': 0.95} {'loss': 0.7558, 'learning_rate': 1.1319556244469494e-05, 'epoch': 0.95} {'loss': 0.4828, 'learning_rate': 1.1319223203985325e-05, 'epoch': 0.95} {'loss': 0.5947, 'learning_rate': 1.1318890162012002e-05, 'epoch': 0.95} {'loss': 0.8017, 'learning_rate': 1.1318557118549904e-05, 'epoch': 0.95} {'loss': 0.5015, 'learning_rate': 1.1318224073599406e-05, 'epoch': 0.95} {'loss': 0.5565, 'learning_rate': 1.1317891027160881e-05, 'epoch': 0.95} {'loss': 0.6089, 'learning_rate': 1.131755797923471e-05, 'epoch': 0.95} {'loss': 0.5345, 'learning_rate': 1.131722492982127e-05, 'epoch': 0.95} {'loss': 0.4734, 'learning_rate': 1.1316891878920928e-05, 'epoch': 0.95} {'loss': 0.6275, 'learning_rate': 1.1316558826534068e-05, 'epoch': 0.95} {'loss': 0.5694, 'learning_rate': 1.1316225772661063e-05, 'epoch': 0.95} {'loss': 0.5711, 'learning_rate': 1.1315892717302288e-05, 'epoch': 0.95} {'loss': 0.5941, 'learning_rate': 1.1315559660458121e-05, 'epoch': 0.95} {'loss': 0.5247, 'learning_rate': 1.131522660212894e-05, 'epoch': 0.95} {'loss': 0.486, 'learning_rate': 1.1314893542315114e-05, 'epoch': 0.95} {'loss': 0.5461, 'learning_rate': 1.1314560481017025e-05, 'epoch': 0.95} {'loss': 0.4672, 'learning_rate': 1.1314227418235048e-05, 'epoch': 0.95} {'loss': 0.4702, 'learning_rate': 1.1313894353969557e-05, 'epoch': 0.95} {'loss': 0.6641, 'learning_rate': 1.1313561288220929e-05, 'epoch': 0.95} {'loss': 0.465, 'learning_rate': 1.1313228220989543e-05, 'epoch': 0.95} {'loss': 0.5971, 'learning_rate': 1.1312895152275771e-05, 'epoch': 0.95} {'loss': 0.5809, 'learning_rate': 1.1312562082079988e-05, 'epoch': 0.95} {'loss': 0.3729, 'learning_rate': 1.1312229010402573e-05, 'epoch': 0.95} {'loss': 0.6664, 'learning_rate': 1.1311895937243901e-05, 'epoch': 0.95} {'loss': 0.573, 'learning_rate': 1.1311562862604348e-05, 'epoch': 0.95} {'loss': 0.5746, 'learning_rate': 1.131122978648429e-05, 'epoch': 0.95} {'loss': 0.5078, 'learning_rate': 1.1310896708884102e-05, 'epoch': 0.95} {'loss': 0.7826, 'learning_rate': 1.131056362980416e-05, 'epoch': 0.95} {'loss': 0.524, 'learning_rate': 1.1310230549244845e-05, 'epoch': 0.95} {'loss': 0.3593, 'learning_rate': 1.1309897467206525e-05, 'epoch': 0.95} {'loss': 0.5973, 'learning_rate': 1.1309564383689582e-05, 'epoch': 0.95} {'loss': 0.541, 'learning_rate': 1.1309231298694388e-05, 'epoch': 0.95} {'loss': 0.5293, 'learning_rate': 1.1308898212221322e-05, 'epoch': 0.95} {'loss': 0.4063, 'learning_rate': 1.1308565124270761e-05, 'epoch': 0.95} {'loss': 0.7182, 'learning_rate': 1.1308232034843077e-05, 'epoch': 0.95} {'loss': 0.5096, 'learning_rate': 1.1307898943938646e-05, 'epoch': 0.95} {'loss': 0.5668, 'learning_rate': 1.1307565851557847e-05, 'epoch': 0.95} {'loss': 0.4668, 'learning_rate': 1.1307232757701055e-05, 'epoch': 0.95} {'loss': 0.5185, 'learning_rate': 1.1306899662368644e-05, 'epoch': 0.95} {'loss': 0.6199, 'learning_rate': 1.1306566565560995e-05, 'epoch': 0.95} {'loss': 0.4238, 'learning_rate': 1.1306233467278477e-05, 'epoch': 0.95} {'loss': 0.6478, 'learning_rate': 1.1305900367521475e-05, 'epoch': 0.95} {'loss': 0.5314, 'learning_rate': 1.1305567266290356e-05, 'epoch': 0.95} {'loss': 0.5356, 'learning_rate': 1.13052341635855e-05, 'epoch': 0.95} {'loss': 0.4452, 'learning_rate': 1.1304901059407283e-05, 'epoch': 0.95} {'loss': 0.4785, 'learning_rate': 1.1304567953756083e-05, 'epoch': 0.95} {'loss': 0.5671, 'learning_rate': 1.130423484663227e-05, 'epoch': 0.95} {'loss': 0.4988, 'learning_rate': 1.1303901738036227e-05, 'epoch': 0.95} {'loss': 0.4208, 'learning_rate': 1.1303568627968327e-05, 'epoch': 0.95} {'loss': 0.7243, 'learning_rate': 1.1303235516428944e-05, 'epoch': 0.95} {'loss': 0.6142, 'learning_rate': 1.1302902403418456e-05, 'epoch': 0.95} {'loss': 0.5252, 'learning_rate': 1.1302569288937239e-05, 'epoch': 0.95} {'loss': 0.501, 'learning_rate': 1.130223617298567e-05, 'epoch': 0.95} {'loss': 0.5304, 'learning_rate': 1.1301903055564126e-05, 'epoch': 0.95} {'loss': 0.5797, 'learning_rate': 1.1301569936672978e-05, 'epoch': 0.95} {'loss': 0.4492, 'learning_rate': 1.1301236816312603e-05, 'epoch': 0.95} {'loss': 0.6299, 'learning_rate': 1.1300903694483384e-05, 'epoch': 0.95} {'loss': 0.7188, 'learning_rate': 1.1300570571185692e-05, 'epoch': 0.95} {'loss': 0.5309, 'learning_rate': 1.1300237446419899e-05, 'epoch': 0.95} {'loss': 0.4206, 'learning_rate': 1.1299904320186388e-05, 'epoch': 0.95} {'loss': 0.7458, 'learning_rate': 1.1299571192485532e-05, 'epoch': 0.95} {'loss': 0.7119, 'learning_rate': 1.1299238063317706e-05, 'epoch': 0.95} {'loss': 0.617, 'learning_rate': 1.1298904932683288e-05, 'epoch': 0.95} {'loss': 0.5987, 'learning_rate': 1.1298571800582654e-05, 'epoch': 0.95} {'loss': 0.4672, 'learning_rate': 1.129823866701618e-05, 'epoch': 0.95} {'loss': 0.436, 'learning_rate': 1.129790553198424e-05, 'epoch': 0.95} {'loss': 0.4152, 'learning_rate': 1.129757239548721e-05, 'epoch': 0.95} {'loss': 0.5884, 'learning_rate': 1.129723925752547e-05, 'epoch': 0.95} {'loss': 0.4723, 'learning_rate': 1.1296906118099391e-05, 'epoch': 0.95} {'loss': 0.4822, 'learning_rate': 1.1296572977209356e-05, 'epoch': 0.95} {'loss': 0.5929, 'learning_rate': 1.1296239834855733e-05, 'epoch': 0.95} {'loss': 0.5917, 'learning_rate': 1.1295906691038902e-05, 'epoch': 0.95} {'loss': 0.4596, 'learning_rate': 1.129557354575924e-05, 'epoch': 0.95} {'loss': 0.5976, 'learning_rate': 1.1295240399017122e-05, 'epoch': 0.95} {'loss': 0.529, 'learning_rate': 1.1294907250812924e-05, 'epoch': 0.95} {'loss': 0.6252, 'learning_rate': 1.129457410114702e-05, 'epoch': 0.95} {'loss': 0.5985, 'learning_rate': 1.129424095001979e-05, 'epoch': 0.95} {'loss': 0.5937, 'learning_rate': 1.1293907797431607e-05, 'epoch': 0.95} {'loss': 0.4383, 'learning_rate': 1.1293574643382847e-05, 'epoch': 0.95} {'loss': 0.5352, 'learning_rate': 1.1293241487873889e-05, 'epoch': 0.95} {'loss': 0.4862, 'learning_rate': 1.1292908330905105e-05, 'epoch': 0.95} {'loss': 0.5579, 'learning_rate': 1.1292575172476876e-05, 'epoch': 0.95} {'loss': 0.4858, 'learning_rate': 1.1292242012589578e-05, 'epoch': 0.95} {'loss': 0.5563, 'learning_rate': 1.129190885124358e-05, 'epoch': 0.95} {'loss': 0.5397, 'learning_rate': 1.1291575688439264e-05, 'epoch': 0.95} {'loss': 0.6056, 'learning_rate': 1.1291242524177005e-05, 'epoch': 0.95} {'loss': 0.5204, 'learning_rate': 1.1290909358457178e-05, 'epoch': 0.95} {'loss': 0.4398, 'learning_rate': 1.1290576191280161e-05, 'epoch': 0.95} {'loss': 0.4177, 'learning_rate': 1.1290243022646325e-05, 'epoch': 0.95} {'loss': 0.53, 'learning_rate': 1.1289909852556054e-05, 'epoch': 0.95} {'loss': 0.5649, 'learning_rate': 1.1289576681009718e-05, 'epoch': 0.95} {'loss': 0.607, 'learning_rate': 1.1289243508007696e-05, 'epoch': 0.95} {'loss': 0.5818, 'learning_rate': 1.1288910333550362e-05, 'epoch': 0.95} {'loss': 0.6065, 'learning_rate': 1.1288577157638096e-05, 'epoch': 0.95} {'loss': 0.4924, 'learning_rate': 1.128824398027127e-05, 'epoch': 0.95} {'loss': 0.681, 'learning_rate': 1.1287910801450262e-05, 'epoch': 0.95} {'loss': 0.6831, 'learning_rate': 1.1287577621175444e-05, 'epoch': 0.95} {'loss': 0.7127, 'learning_rate': 1.12872444394472e-05, 'epoch': 0.95} {'loss': 0.605, 'learning_rate': 1.1286911256265902e-05, 'epoch': 0.95} {'loss': 0.5009, 'learning_rate': 1.1286578071631924e-05, 'epoch': 0.95} {'loss': 0.3932, 'learning_rate': 1.1286244885545642e-05, 'epoch': 0.95} {'loss': 0.3913, 'learning_rate': 1.128591169800744e-05, 'epoch': 0.95} {'loss': 0.594, 'learning_rate': 1.1285578509017683e-05, 'epoch': 0.95} {'loss': 0.5769, 'learning_rate': 1.1285245318576753e-05, 'epoch': 0.95} {'loss': 0.5006, 'learning_rate': 1.1284912126685028e-05, 'epoch': 0.95} {'loss': 0.525, 'learning_rate': 1.128457893334288e-05, 'epoch': 0.95} {'loss': 0.5141, 'learning_rate': 1.1284245738550689e-05, 'epoch': 0.95} {'loss': 0.601, 'learning_rate': 1.1283912542308826e-05, 'epoch': 0.95} {'loss': 0.5533, 'learning_rate': 1.128357934461767e-05, 'epoch': 0.95} {'loss': 0.6764, 'learning_rate': 1.1283246145477598e-05, 'epoch': 0.95} {'loss': 0.5071, 'learning_rate': 1.1282912944888986e-05, 'epoch': 0.95} {'loss': 0.5384, 'learning_rate': 1.1282579742852206e-05, 'epoch': 0.95} {'loss': 0.4107, 'learning_rate': 1.128224653936764e-05, 'epoch': 0.95} {'loss': 0.592, 'learning_rate': 1.1281913334435662e-05, 'epoch': 0.95} {'loss': 0.5475, 'learning_rate': 1.1281580128056644e-05, 'epoch': 0.95} {'loss': 0.5424, 'learning_rate': 1.1281246920230969e-05, 'epoch': 0.95} {'loss': 0.5706, 'learning_rate': 1.128091371095901e-05, 'epoch': 0.95} {'loss': 0.5201, 'learning_rate': 1.128058050024114e-05, 'epoch': 0.95} {'loss': 0.3725, 'learning_rate': 1.1280247288077741e-05, 'epoch': 0.95} {'loss': 0.5597, 'learning_rate': 1.1279914074469187e-05, 'epoch': 0.95} {'loss': 0.6864, 'learning_rate': 1.127958085941585e-05, 'epoch': 0.95} {'loss': 0.5543, 'learning_rate': 1.1279247642918113e-05, 'epoch': 0.95} {'loss': 0.5363, 'learning_rate': 1.1278914424976346e-05, 'epoch': 0.95} {'loss': 0.5138, 'learning_rate': 1.1278581205590928e-05, 'epoch': 0.95} {'loss': 0.5648, 'learning_rate': 1.1278247984762236e-05, 'epoch': 0.95} {'loss': 0.6378, 'learning_rate': 1.1277914762490646e-05, 'epoch': 0.95} {'loss': 0.5871, 'learning_rate': 1.1277581538776533e-05, 'epoch': 0.95} {'loss': 0.4263, 'learning_rate': 1.127724831362027e-05, 'epoch': 0.95} {'loss': 0.6366, 'learning_rate': 1.127691508702224e-05, 'epoch': 0.95} {'loss': 0.5643, 'learning_rate': 1.1276581858982813e-05, 'epoch': 0.95} {'loss': 0.5389, 'learning_rate': 1.127624862950237e-05, 'epoch': 0.95} {'loss': 0.4511, 'learning_rate': 1.1275915398581285e-05, 'epoch': 0.95} {'loss': 0.6778, 'learning_rate': 1.1275582166219936e-05, 'epoch': 0.95} {'loss': 0.5912, 'learning_rate': 1.1275248932418694e-05, 'epoch': 0.95} {'loss': 0.532, 'learning_rate': 1.1274915697177939e-05, 'epoch': 0.95} {'loss': 0.4587, 'learning_rate': 1.1274582460498047e-05, 'epoch': 0.95} {'loss': 0.3903, 'learning_rate': 1.1274249222379395e-05, 'epoch': 0.95} {'loss': 0.6048, 'learning_rate': 1.1273915982822356e-05, 'epoch': 0.95} {'loss': 0.4562, 'learning_rate': 1.1273582741827309e-05, 'epoch': 0.95} {'loss': 0.5996, 'learning_rate': 1.127324949939463e-05, 'epoch': 0.95} {'loss': 0.6256, 'learning_rate': 1.127291625552469e-05, 'epoch': 0.95} {'loss': 0.5712, 'learning_rate': 1.1272583010217875e-05, 'epoch': 0.95} {'loss': 0.5491, 'learning_rate': 1.1272249763474554e-05, 'epoch': 0.95} {'loss': 0.665, 'learning_rate': 1.1271916515295104e-05, 'epoch': 0.95} {'loss': 0.4287, 'learning_rate': 1.1271583265679901e-05, 'epoch': 0.95} {'loss': 0.4155, 'learning_rate': 1.1271250014629326e-05, 'epoch': 0.95} {'loss': 0.5916, 'learning_rate': 1.1270916762143749e-05, 'epoch': 0.95} {'loss': 0.4914, 'learning_rate': 1.127058350822355e-05, 'epoch': 0.95} {'loss': 0.455, 'learning_rate': 1.1270250252869104e-05, 'epoch': 0.95} {'loss': 0.5752, 'learning_rate': 1.1269916996080785e-05, 'epoch': 0.95} {'loss': 0.5959, 'learning_rate': 1.126958373785897e-05, 'epoch': 0.95} {'loss': 0.5947, 'learning_rate': 1.1269250478204042e-05, 'epoch': 0.95} {'loss': 0.4717, 'learning_rate': 1.1268917217116369e-05, 'epoch': 0.95} {'loss': 0.5303, 'learning_rate': 1.1268583954596329e-05, 'epoch': 0.95} {'loss': 0.5355, 'learning_rate': 1.1268250690644297e-05, 'epoch': 0.95} {'loss': 0.5977, 'learning_rate': 1.1267917425260653e-05, 'epoch': 0.95} {'loss': 0.6181, 'learning_rate': 1.1267584158445775e-05, 'epoch': 0.95} {'loss': 0.6303, 'learning_rate': 1.126725089020003e-05, 'epoch': 0.95} {'loss': 0.5925, 'learning_rate': 1.1266917620523803e-05, 'epoch': 0.95} {'loss': 0.5689, 'learning_rate': 1.1266584349417465e-05, 'epoch': 0.95} {'loss': 0.5932, 'learning_rate': 1.1266251076881396e-05, 'epoch': 0.95} {'loss': 0.474, 'learning_rate': 1.126591780291597e-05, 'epoch': 0.95} {'loss': 0.5975, 'learning_rate': 1.1265584527521561e-05, 'epoch': 0.95} {'loss': 0.5518, 'learning_rate': 1.1265251250698548e-05, 'epoch': 0.95} {'loss': 0.577, 'learning_rate': 1.126491797244731e-05, 'epoch': 0.95} {'loss': 0.6103, 'learning_rate': 1.1264584692768217e-05, 'epoch': 0.95} {'loss': 0.5088, 'learning_rate': 1.126425141166165e-05, 'epoch': 0.95} {'loss': 0.6921, 'learning_rate': 1.1263918129127984e-05, 'epoch': 0.95} {'loss': 0.5046, 'learning_rate': 1.1263584845167594e-05, 'epoch': 0.95} {'loss': 0.3372, 'learning_rate': 1.126325155978086e-05, 'epoch': 0.95} {'loss': 0.5657, 'learning_rate': 1.126291827296815e-05, 'epoch': 0.95} {'loss': 0.5045, 'learning_rate': 1.126258498472985e-05, 'epoch': 0.95} {'loss': 0.5392, 'learning_rate': 1.1262251695066329e-05, 'epoch': 0.95} {'loss': 0.6543, 'learning_rate': 1.1261918403977965e-05, 'epoch': 0.95} {'loss': 0.4508, 'learning_rate': 1.1261585111465136e-05, 'epoch': 0.95} {'loss': 0.5981, 'learning_rate': 1.1261251817528217e-05, 'epoch': 0.95} {'loss': 0.5242, 'learning_rate': 1.1260918522167586e-05, 'epoch': 0.95} {'loss': 0.6389, 'learning_rate': 1.1260585225383618e-05, 'epoch': 0.95} {'loss': 0.4573, 'learning_rate': 1.1260251927176686e-05, 'epoch': 0.95} {'loss': 0.4583, 'learning_rate': 1.1259918627547173e-05, 'epoch': 0.95} {'loss': 0.5503, 'learning_rate': 1.1259585326495448e-05, 'epoch': 0.95} {'loss': 0.6779, 'learning_rate': 1.1259252024021894e-05, 'epoch': 0.95} {'loss': 0.5204, 'learning_rate': 1.1258918720126884e-05, 'epoch': 0.95} {'loss': 0.5647, 'learning_rate': 1.1258585414810793e-05, 'epoch': 0.95} {'loss': 0.4787, 'learning_rate': 1.1258252108073997e-05, 'epoch': 0.95} {'loss': 0.5198, 'learning_rate': 1.1257918799916874e-05, 'epoch': 0.95} {'loss': 0.6423, 'learning_rate': 1.12575854903398e-05, 'epoch': 0.95} {'loss': 0.3873, 'learning_rate': 1.1257252179343152e-05, 'epoch': 0.95} {'loss': 0.729, 'learning_rate': 1.1256918866927305e-05, 'epoch': 0.95} {'loss': 0.3667, 'learning_rate': 1.1256585553092634e-05, 'epoch': 0.95} {'loss': 0.6093, 'learning_rate': 1.1256252237839518e-05, 'epoch': 0.95} {'loss': 0.7029, 'learning_rate': 1.1255918921168335e-05, 'epoch': 0.95} {'loss': 0.6091, 'learning_rate': 1.1255585603079452e-05, 'epoch': 0.95} {'loss': 0.4922, 'learning_rate': 1.1255252283573257e-05, 'epoch': 0.95} {'loss': 0.6493, 'learning_rate': 1.125491896265012e-05, 'epoch': 0.95} {'loss': 0.516, 'learning_rate': 1.1254585640310416e-05, 'epoch': 0.95} {'loss': 0.5754, 'learning_rate': 1.1254252316554526e-05, 'epoch': 0.95} {'loss': 0.6208, 'learning_rate': 1.1253918991382822e-05, 'epoch': 0.95} {'loss': 0.573, 'learning_rate': 1.1253585664795681e-05, 'epoch': 0.95} {'loss': 0.4812, 'learning_rate': 1.1253252336793481e-05, 'epoch': 0.95} {'loss': 0.4943, 'learning_rate': 1.1252919007376599e-05, 'epoch': 0.95} {'loss': 0.5909, 'learning_rate': 1.1252585676545409e-05, 'epoch': 0.95} {'loss': 0.6509, 'learning_rate': 1.1252252344300288e-05, 'epoch': 0.95} {'loss': 0.5464, 'learning_rate': 1.125191901064161e-05, 'epoch': 0.95} {'loss': 0.5523, 'learning_rate': 1.1251585675569757e-05, 'epoch': 0.95} {'loss': 0.5959, 'learning_rate': 1.12512523390851e-05, 'epoch': 0.95} {'loss': 0.55, 'learning_rate': 1.125091900118802e-05, 'epoch': 0.95} {'loss': 0.6613, 'learning_rate': 1.1250585661878886e-05, 'epoch': 0.95} {'loss': 0.5298, 'learning_rate': 1.125025232115808e-05, 'epoch': 0.95} {'loss': 0.4422, 'learning_rate': 1.1249918979025976e-05, 'epoch': 0.95} {'loss': 0.718, 'learning_rate': 1.124958563548295e-05, 'epoch': 0.95} {'loss': 0.6921, 'learning_rate': 1.1249252290529382e-05, 'epoch': 0.95} {'loss': 0.6173, 'learning_rate': 1.1248918944165645e-05, 'epoch': 0.95} {'loss': 0.5327, 'learning_rate': 1.1248585596392117e-05, 'epoch': 0.95} {'loss': 0.3629, 'learning_rate': 1.1248252247209172e-05, 'epoch': 0.95} {'loss': 0.6285, 'learning_rate': 1.1247918896617189e-05, 'epoch': 0.95} {'loss': 0.4749, 'learning_rate': 1.1247585544616541e-05, 'epoch': 0.95} {'loss': 0.511, 'learning_rate': 1.1247252191207607e-05, 'epoch': 0.95} {'loss': 0.6032, 'learning_rate': 1.1246918836390766e-05, 'epoch': 0.95} {'loss': 0.6315, 'learning_rate': 1.1246585480166387e-05, 'epoch': 0.95} {'loss': 0.4659, 'learning_rate': 1.124625212253485e-05, 'epoch': 0.95} {'loss': 0.4971, 'learning_rate': 1.1245918763496531e-05, 'epoch': 0.95} {'loss': 0.4407, 'learning_rate': 1.1245585403051809e-05, 'epoch': 0.95} {'loss': 0.4703, 'learning_rate': 1.1245252041201056e-05, 'epoch': 0.95} {'loss': 0.5643, 'learning_rate': 1.124491867794465e-05, 'epoch': 0.95} {'loss': 0.64, 'learning_rate': 1.1244585313282967e-05, 'epoch': 0.95} {'loss': 0.5931, 'learning_rate': 1.1244251947216385e-05, 'epoch': 0.95} {'loss': 0.5983, 'learning_rate': 1.1243918579745279e-05, 'epoch': 0.95} {'loss': 0.4578, 'learning_rate': 1.1243585210870025e-05, 'epoch': 0.95} {'loss': 0.5404, 'learning_rate': 1.1243251840591001e-05, 'epoch': 0.95} {'loss': 0.7083, 'learning_rate': 1.1242918468908581e-05, 'epoch': 0.95} {'loss': 0.5641, 'learning_rate': 1.1242585095823142e-05, 'epoch': 0.95} {'loss': 0.5211, 'learning_rate': 1.1242251721335064e-05, 'epoch': 0.95} {'loss': 0.6545, 'learning_rate': 1.1241918345444718e-05, 'epoch': 0.95} {'loss': 0.6293, 'learning_rate': 1.1241584968152481e-05, 'epoch': 0.95} {'loss': 0.6045, 'learning_rate': 1.1241251589458733e-05, 'epoch': 0.95} {'loss': 0.6246, 'learning_rate': 1.1240918209363846e-05, 'epoch': 0.95} {'loss': 0.6121, 'learning_rate': 1.12405848278682e-05, 'epoch': 0.95} {'loss': 0.6739, 'learning_rate': 1.1240251444972168e-05, 'epoch': 0.95} {'loss': 0.6666, 'learning_rate': 1.1239918060676128e-05, 'epoch': 0.95} {'loss': 0.5309, 'learning_rate': 1.1239584674980457e-05, 'epoch': 0.95} {'loss': 0.5229, 'learning_rate': 1.1239251287885528e-05, 'epoch': 0.95} {'loss': 0.4974, 'learning_rate': 1.1238917899391723e-05, 'epoch': 0.95} {'loss': 0.6629, 'learning_rate': 1.1238584509499416e-05, 'epoch': 0.95} {'loss': 0.5391, 'learning_rate': 1.123825111820898e-05, 'epoch': 0.95} {'loss': 0.4785, 'learning_rate': 1.1237917725520795e-05, 'epoch': 0.95} {'loss': 0.6368, 'learning_rate': 1.1237584331435236e-05, 'epoch': 0.95} {'loss': 0.5826, 'learning_rate': 1.1237250935952682e-05, 'epoch': 0.95} {'loss': 0.3399, 'learning_rate': 1.1236917539073505e-05, 'epoch': 0.95} {'loss': 0.6715, 'learning_rate': 1.1236584140798082e-05, 'epoch': 0.95} {'loss': 0.7147, 'learning_rate': 1.1236250741126793e-05, 'epoch': 0.95} {'loss': 0.5277, 'learning_rate': 1.123591734006001e-05, 'epoch': 0.95} {'loss': 0.5654, 'learning_rate': 1.1235583937598111e-05, 'epoch': 0.95} {'loss': 0.3792, 'learning_rate': 1.1235250533741475e-05, 'epoch': 0.95} {'loss': 0.7082, 'learning_rate': 1.1234917128490475e-05, 'epoch': 0.95} {'loss': 0.5566, 'learning_rate': 1.1234583721845492e-05, 'epoch': 0.95} {'loss': 0.5709, 'learning_rate': 1.1234250313806894e-05, 'epoch': 0.95} {'loss': 0.597, 'learning_rate': 1.1233916904375062e-05, 'epoch': 0.95} {'loss': 0.5166, 'learning_rate': 1.1233583493550375e-05, 'epoch': 0.95} {'loss': 0.5281, 'learning_rate': 1.1233250081333204e-05, 'epoch': 0.95} {'loss': 0.5656, 'learning_rate': 1.123291666772393e-05, 'epoch': 0.95} {'loss': 0.5163, 'learning_rate': 1.1232583252722929e-05, 'epoch': 0.95} {'loss': 0.4094, 'learning_rate': 1.1232249836330574e-05, 'epoch': 0.95} {'loss': 0.5954, 'learning_rate': 1.1231916418547242e-05, 'epoch': 0.95} {'loss': 0.654, 'learning_rate': 1.1231582999373312e-05, 'epoch': 0.95} {'loss': 0.6251, 'learning_rate': 1.123124957880916e-05, 'epoch': 0.95} {'loss': 0.5777, 'learning_rate': 1.123091615685516e-05, 'epoch': 0.95} {'loss': 0.6572, 'learning_rate': 1.123058273351169e-05, 'epoch': 0.95} {'loss': 0.5849, 'learning_rate': 1.1230249308779129e-05, 'epoch': 0.96} {'loss': 0.6802, 'learning_rate': 1.1229915882657847e-05, 'epoch': 0.96} {'loss': 0.4863, 'learning_rate': 1.1229582455148225e-05, 'epoch': 0.96} {'loss': 0.6377, 'learning_rate': 1.1229249026250637e-05, 'epoch': 0.96} {'loss': 0.4268, 'learning_rate': 1.1228915595965461e-05, 'epoch': 0.96} {'loss': 0.5438, 'learning_rate': 1.1228582164293074e-05, 'epoch': 0.96} {'loss': 0.5127, 'learning_rate': 1.122824873123385e-05, 'epoch': 0.96} {'loss': 0.6199, 'learning_rate': 1.1227915296788169e-05, 'epoch': 0.96} {'loss': 0.6232, 'learning_rate': 1.1227581860956402e-05, 'epoch': 0.96} {'loss': 0.5414, 'learning_rate': 1.122724842373893e-05, 'epoch': 0.96} {'loss': 0.4682, 'learning_rate': 1.1226914985136129e-05, 'epoch': 0.96} {'loss': 0.4475, 'learning_rate': 1.1226581545148372e-05, 'epoch': 0.96} {'loss': 0.5994, 'learning_rate': 1.1226248103776038e-05, 'epoch': 0.96} {'loss': 0.5988, 'learning_rate': 1.1225914661019508e-05, 'epoch': 0.96} {'loss': 0.6166, 'learning_rate': 1.1225581216879148e-05, 'epoch': 0.96} {'loss': 0.5918, 'learning_rate': 1.1225247771355343e-05, 'epoch': 0.96} {'loss': 0.4851, 'learning_rate': 1.1224914324448464e-05, 'epoch': 0.96} {'loss': 0.424, 'learning_rate': 1.122458087615889e-05, 'epoch': 0.96} {'loss': 0.5252, 'learning_rate': 1.1224247426486998e-05, 'epoch': 0.96} {'loss': 0.5487, 'learning_rate': 1.1223913975433162e-05, 'epoch': 0.96} {'loss': 0.428, 'learning_rate': 1.1223580522997761e-05, 'epoch': 0.96} {'loss': 0.6122, 'learning_rate': 1.1223247069181168e-05, 'epoch': 0.96} {'loss': 0.5507, 'learning_rate': 1.1222913613983766e-05, 'epoch': 0.96} {'loss': 0.5529, 'learning_rate': 1.1222580157405925e-05, 'epoch': 0.96} {'loss': 0.5959, 'learning_rate': 1.1222246699448022e-05, 'epoch': 0.96} {'loss': 0.6063, 'learning_rate': 1.1221913240110436e-05, 'epoch': 0.96} {'loss': 0.7308, 'learning_rate': 1.1221579779393542e-05, 'epoch': 0.96} {'loss': 0.6989, 'learning_rate': 1.1221246317297716e-05, 'epoch': 0.96} {'loss': 0.4546, 'learning_rate': 1.1220912853823338e-05, 'epoch': 0.96} {'loss': 0.5897, 'learning_rate': 1.1220579388970778e-05, 'epoch': 0.96} {'loss': 0.5334, 'learning_rate': 1.1220245922740418e-05, 'epoch': 0.96} {'loss': 0.5216, 'learning_rate': 1.1219912455132633e-05, 'epoch': 0.96} {'loss': 0.5211, 'learning_rate': 1.1219578986147797e-05, 'epoch': 0.96} {'loss': 0.4671, 'learning_rate': 1.121924551578629e-05, 'epoch': 0.96} {'loss': 0.5068, 'learning_rate': 1.1218912044048486e-05, 'epoch': 0.96} {'loss': 0.454, 'learning_rate': 1.1218578570934761e-05, 'epoch': 0.96} {'loss': 0.3887, 'learning_rate': 1.1218245096445494e-05, 'epoch': 0.96} {'loss': 0.4166, 'learning_rate': 1.121791162058106e-05, 'epoch': 0.96} {'loss': 0.5634, 'learning_rate': 1.1217578143341836e-05, 'epoch': 0.96} {'loss': 0.554, 'learning_rate': 1.1217244664728198e-05, 'epoch': 0.96} {'loss': 0.5372, 'learning_rate': 1.121691118474052e-05, 'epoch': 0.96} {'loss': 0.4354, 'learning_rate': 1.121657770337918e-05, 'epoch': 0.96} {'loss': 0.5962, 'learning_rate': 1.1216244220644556e-05, 'epoch': 0.96} {'loss': 0.4275, 'learning_rate': 1.1215910736537026e-05, 'epoch': 0.96} {'loss': 0.693, 'learning_rate': 1.121557725105696e-05, 'epoch': 0.96} {'loss': 0.5593, 'learning_rate': 1.1215243764204741e-05, 'epoch': 0.96} {'loss': 0.6716, 'learning_rate': 1.1214910275980743e-05, 'epoch': 0.96} {'loss': 0.5934, 'learning_rate': 1.1214576786385343e-05, 'epoch': 0.96} {'loss': 0.6115, 'learning_rate': 1.1214243295418916e-05, 'epoch': 0.96} {'loss': 0.6024, 'learning_rate': 1.1213909803081837e-05, 'epoch': 0.96} {'loss': 0.563, 'learning_rate': 1.121357630937449e-05, 'epoch': 0.96} {'loss': 0.3189, 'learning_rate': 1.1213242814297243e-05, 'epoch': 0.96} {'loss': 0.6571, 'learning_rate': 1.1212909317850474e-05, 'epoch': 0.96} {'loss': 0.38, 'learning_rate': 1.1212575820034561e-05, 'epoch': 0.96} {'loss': 0.5018, 'learning_rate': 1.1212242320849883e-05, 'epoch': 0.96} {'loss': 0.4219, 'learning_rate': 1.1211908820296813e-05, 'epoch': 0.96} {'loss': 0.6592, 'learning_rate': 1.1211575318375727e-05, 'epoch': 0.96} {'loss': 0.6036, 'learning_rate': 1.1211241815087004e-05, 'epoch': 0.96} {'loss': 0.6496, 'learning_rate': 1.1210908310431019e-05, 'epoch': 0.96} {'loss': 0.4074, 'learning_rate': 1.121057480440815e-05, 'epoch': 0.96} {'loss': 0.5819, 'learning_rate': 1.1210241297018771e-05, 'epoch': 0.96} {'loss': 0.6209, 'learning_rate': 1.1209907788263259e-05, 'epoch': 0.96} {'loss': 0.5266, 'learning_rate': 1.1209574278141992e-05, 'epoch': 0.96} {'loss': 0.6164, 'learning_rate': 1.1209240766655349e-05, 'epoch': 0.96} {'loss': 0.4902, 'learning_rate': 1.1208907253803698e-05, 'epoch': 0.96} {'loss': 0.599, 'learning_rate': 1.1208573739587424e-05, 'epoch': 0.96} {'loss': 0.6454, 'learning_rate': 1.1208240224006899e-05, 'epoch': 0.96} {'loss': 0.6387, 'learning_rate': 1.1207906707062499e-05, 'epoch': 0.96} {'loss': 0.5156, 'learning_rate': 1.1207573188754603e-05, 'epoch': 0.96} {'loss': 0.641, 'learning_rate': 1.1207239669083587e-05, 'epoch': 0.96} {'loss': 0.6594, 'learning_rate': 1.1206906148049825e-05, 'epoch': 0.96} {'loss': 0.4515, 'learning_rate': 1.1206572625653697e-05, 'epoch': 0.96} {'loss': 0.6053, 'learning_rate': 1.120623910189558e-05, 'epoch': 0.96} {'loss': 0.7021, 'learning_rate': 1.1205905576775846e-05, 'epoch': 0.96} {'loss': 0.4896, 'learning_rate': 1.1205572050294875e-05, 'epoch': 0.96} {'loss': 0.6333, 'learning_rate': 1.1205238522453042e-05, 'epoch': 0.96} {'loss': 0.5569, 'learning_rate': 1.1204904993250723e-05, 'epoch': 0.96} {'loss': 0.579, 'learning_rate': 1.1204571462688297e-05, 'epoch': 0.96} {'loss': 0.4429, 'learning_rate': 1.1204237930766135e-05, 'epoch': 0.96} {'loss': 0.5485, 'learning_rate': 1.1203904397484622e-05, 'epoch': 0.96} {'loss': 0.6308, 'learning_rate': 1.1203570862844127e-05, 'epoch': 0.96} {'loss': 0.5395, 'learning_rate': 1.1203237326845031e-05, 'epoch': 0.96} {'loss': 0.5091, 'learning_rate': 1.120290378948771e-05, 'epoch': 0.96} {'loss': 0.6906, 'learning_rate': 1.1202570250772535e-05, 'epoch': 0.96} {'loss': 0.4777, 'learning_rate': 1.120223671069989e-05, 'epoch': 0.96} {'loss': 0.581, 'learning_rate': 1.1201903169270148e-05, 'epoch': 0.96} {'loss': 0.5504, 'learning_rate': 1.1201569626483687e-05, 'epoch': 0.96} {'loss': 0.514, 'learning_rate': 1.1201236082340883e-05, 'epoch': 0.96} {'loss': 0.539, 'learning_rate': 1.1200902536842108e-05, 'epoch': 0.96} {'loss': 0.4252, 'learning_rate': 1.1200568989987746e-05, 'epoch': 0.96} {'loss': 0.5572, 'learning_rate': 1.120023544177817e-05, 'epoch': 0.96} {'loss': 0.5308, 'learning_rate': 1.1199901892213754e-05, 'epoch': 0.96} {'loss': 0.6811, 'learning_rate': 1.1199568341294878e-05, 'epoch': 0.96} {'loss': 0.3908, 'learning_rate': 1.1199234789021916e-05, 'epoch': 0.96} {'loss': 0.4585, 'learning_rate': 1.1198901235395247e-05, 'epoch': 0.96} {'loss': 0.4998, 'learning_rate': 1.1198567680415247e-05, 'epoch': 0.96} {'loss': 0.5964, 'learning_rate': 1.1198234124082292e-05, 'epoch': 0.96} {'loss': 0.4853, 'learning_rate': 1.1197900566396758e-05, 'epoch': 0.96} {'loss': 0.5404, 'learning_rate': 1.1197567007359023e-05, 'epoch': 0.96} {'loss': 0.5089, 'learning_rate': 1.1197233446969463e-05, 'epoch': 0.96} {'loss': 0.6439, 'learning_rate': 1.1196899885228453e-05, 'epoch': 0.96} {'loss': 0.6093, 'learning_rate': 1.1196566322136372e-05, 'epoch': 0.96} {'loss': 0.6681, 'learning_rate': 1.1196232757693593e-05, 'epoch': 0.96} {'loss': 0.6137, 'learning_rate': 1.1195899191900494e-05, 'epoch': 0.96} {'loss': 0.4402, 'learning_rate': 1.1195565624757454e-05, 'epoch': 0.96} {'loss': 0.4646, 'learning_rate': 1.1195232056264848e-05, 'epoch': 0.96} {'loss': 0.5764, 'learning_rate': 1.1194898486423052e-05, 'epoch': 0.96} {'loss': 0.5647, 'learning_rate': 1.1194564915232441e-05, 'epoch': 0.96} {'loss': 0.4498, 'learning_rate': 1.1194231342693396e-05, 'epoch': 0.96} {'loss': 0.6998, 'learning_rate': 1.119389776880629e-05, 'epoch': 0.96} {'loss': 0.5148, 'learning_rate': 1.11935641935715e-05, 'epoch': 0.96} {'loss': 0.5379, 'learning_rate': 1.1193230616989404e-05, 'epoch': 0.96} {'loss': 0.4529, 'learning_rate': 1.1192897039060375e-05, 'epoch': 0.96} {'loss': 0.4821, 'learning_rate': 1.1192563459784797e-05, 'epoch': 0.96} {'loss': 0.4866, 'learning_rate': 1.1192229879163038e-05, 'epoch': 0.96} {'loss': 0.3831, 'learning_rate': 1.119189629719548e-05, 'epoch': 0.96} {'loss': 0.5233, 'learning_rate': 1.1191562713882496e-05, 'epoch': 0.96} {'loss': 0.703, 'learning_rate': 1.1191229129224463e-05, 'epoch': 0.96} {'loss': 0.5921, 'learning_rate': 1.119089554322176e-05, 'epoch': 0.96} {'loss': 0.6589, 'learning_rate': 1.1190561955874764e-05, 'epoch': 0.96} {'loss': 0.5885, 'learning_rate': 1.1190228367183848e-05, 'epoch': 0.96} {'loss': 0.4616, 'learning_rate': 1.1189894777149393e-05, 'epoch': 0.96} {'loss': 0.539, 'learning_rate': 1.1189561185771771e-05, 'epoch': 0.96} {'loss': 0.6207, 'learning_rate': 1.1189227593051362e-05, 'epoch': 0.96} {'loss': 0.7312, 'learning_rate': 1.1188893998988538e-05, 'epoch': 0.96} {'loss': 0.6862, 'learning_rate': 1.1188560403583681e-05, 'epoch': 0.96} {'loss': 0.6852, 'learning_rate': 1.1188226806837165e-05, 'epoch': 0.96} {'loss': 0.5328, 'learning_rate': 1.1187893208749367e-05, 'epoch': 0.96} {'loss': 0.3327, 'learning_rate': 1.1187559609320666e-05, 'epoch': 0.96} {'loss': 0.4272, 'learning_rate': 1.1187226008551433e-05, 'epoch': 0.96} {'loss': 0.5004, 'learning_rate': 1.1186892406442047e-05, 'epoch': 0.96} {'loss': 0.3543, 'learning_rate': 1.1186558802992886e-05, 'epoch': 0.96} {'loss': 0.4945, 'learning_rate': 1.1186225198204329e-05, 'epoch': 0.96} {'loss': 0.7199, 'learning_rate': 1.1185891592076744e-05, 'epoch': 0.96} {'loss': 0.6946, 'learning_rate': 1.1185557984610516e-05, 'epoch': 0.96} {'loss': 0.6335, 'learning_rate': 1.1185224375806018e-05, 'epoch': 0.96} {'loss': 0.5407, 'learning_rate': 1.118489076566363e-05, 'epoch': 0.96} {'loss': 0.3867, 'learning_rate': 1.1184557154183722e-05, 'epoch': 0.96} {'loss': 0.5774, 'learning_rate': 1.1184223541366675e-05, 'epoch': 0.96} {'loss': 0.6471, 'learning_rate': 1.1183889927212865e-05, 'epoch': 0.96} {'loss': 0.5162, 'learning_rate': 1.1183556311722667e-05, 'epoch': 0.96} {'loss': 0.4929, 'learning_rate': 1.118322269489646e-05, 'epoch': 0.96} {'loss': 0.5647, 'learning_rate': 1.118288907673462e-05, 'epoch': 0.96} {'loss': 0.6362, 'learning_rate': 1.1182555457237523e-05, 'epoch': 0.96} {'loss': 0.5253, 'learning_rate': 1.1182221836405545e-05, 'epoch': 0.96} {'loss': 0.5595, 'learning_rate': 1.1181888214239065e-05, 'epoch': 0.96} {'loss': 0.6232, 'learning_rate': 1.1181554590738456e-05, 'epoch': 0.96} {'loss': 0.4234, 'learning_rate': 1.1181220965904098e-05, 'epoch': 0.96} {'loss': 0.4373, 'learning_rate': 1.1180887339736365e-05, 'epoch': 0.96} {'loss': 0.4307, 'learning_rate': 1.1180553712235639e-05, 'epoch': 0.96} {'loss': 0.4826, 'learning_rate': 1.1180220083402288e-05, 'epoch': 0.96} {'loss': 0.4797, 'learning_rate': 1.1179886453236693e-05, 'epoch': 0.96} {'loss': 0.5711, 'learning_rate': 1.117955282173923e-05, 'epoch': 0.96} {'loss': 0.592, 'learning_rate': 1.1179219188910277e-05, 'epoch': 0.96} {'loss': 0.7239, 'learning_rate': 1.1178885554750212e-05, 'epoch': 0.96} {'loss': 0.4983, 'learning_rate': 1.1178551919259405e-05, 'epoch': 0.96} {'loss': 0.5832, 'learning_rate': 1.117821828243824e-05, 'epoch': 0.96} {'loss': 0.5888, 'learning_rate': 1.1177884644287092e-05, 'epoch': 0.96} {'loss': 0.4178, 'learning_rate': 1.1177551004806333e-05, 'epoch': 0.96} {'loss': 0.6345, 'learning_rate': 1.1177217363996344e-05, 'epoch': 0.96} {'loss': 0.6234, 'learning_rate': 1.1176883721857502e-05, 'epoch': 0.96} {'loss': 0.4439, 'learning_rate': 1.1176550078390181e-05, 'epoch': 0.96} {'loss': 0.5808, 'learning_rate': 1.117621643359476e-05, 'epoch': 0.96} {'loss': 0.5961, 'learning_rate': 1.1175882787471613e-05, 'epoch': 0.96} {'loss': 0.6726, 'learning_rate': 1.1175549140021116e-05, 'epoch': 0.96} {'loss': 0.6396, 'learning_rate': 1.117521549124365e-05, 'epoch': 0.96} {'loss': 0.4568, 'learning_rate': 1.1174881841139589e-05, 'epoch': 0.96} {'loss': 0.5824, 'learning_rate': 1.117454818970931e-05, 'epoch': 0.96} {'loss': 0.533, 'learning_rate': 1.1174214536953188e-05, 'epoch': 0.96} {'loss': 0.4814, 'learning_rate': 1.11738808828716e-05, 'epoch': 0.96} {'loss': 0.6012, 'learning_rate': 1.1173547227464926e-05, 'epoch': 0.96} {'loss': 0.5534, 'learning_rate': 1.1173213570733538e-05, 'epoch': 0.96} {'loss': 0.4086, 'learning_rate': 1.1172879912677816e-05, 'epoch': 0.96} {'loss': 0.5247, 'learning_rate': 1.1172546253298138e-05, 'epoch': 0.96} {'loss': 0.5792, 'learning_rate': 1.1172212592594877e-05, 'epoch': 0.96} {'loss': 0.4177, 'learning_rate': 1.117187893056841e-05, 'epoch': 0.96} {'loss': 0.5289, 'learning_rate': 1.1171545267219114e-05, 'epoch': 0.96} {'loss': 0.2809, 'learning_rate': 1.1171211602547369e-05, 'epoch': 0.96} {'loss': 0.491, 'learning_rate': 1.1170877936553546e-05, 'epoch': 0.96} {'loss': 0.4341, 'learning_rate': 1.1170544269238026e-05, 'epoch': 0.96} {'loss': 0.5902, 'learning_rate': 1.1170210600601184e-05, 'epoch': 0.96} {'loss': 0.5124, 'learning_rate': 1.1169876930643396e-05, 'epoch': 0.96} {'loss': 0.48, 'learning_rate': 1.1169543259365039e-05, 'epoch': 0.96} {'loss': 0.5916, 'learning_rate': 1.1169209586766492e-05, 'epoch': 0.96} {'loss': 0.5179, 'learning_rate': 1.1168875912848128e-05, 'epoch': 0.96} {'loss': 0.428, 'learning_rate': 1.1168542237610324e-05, 'epoch': 0.96} {'loss': 0.746, 'learning_rate': 1.1168208561053465e-05, 'epoch': 0.96} {'loss': 0.7089, 'learning_rate': 1.1167874883177914e-05, 'epoch': 0.96} {'loss': 0.5227, 'learning_rate': 1.1167541203984056e-05, 'epoch': 0.96} {'loss': 0.4565, 'learning_rate': 1.1167207523472265e-05, 'epoch': 0.96} {'loss': 0.6383, 'learning_rate': 1.116687384164292e-05, 'epoch': 0.96} {'loss': 0.4596, 'learning_rate': 1.1166540158496397e-05, 'epoch': 0.96} {'loss': 0.4302, 'learning_rate': 1.116620647403307e-05, 'epoch': 0.96} {'loss': 0.4911, 'learning_rate': 1.1165872788253319e-05, 'epoch': 0.96} {'loss': 0.4027, 'learning_rate': 1.1165539101157518e-05, 'epoch': 0.96} {'loss': 0.473, 'learning_rate': 1.1165205412746048e-05, 'epoch': 0.96} {'loss': 0.48, 'learning_rate': 1.116487172301928e-05, 'epoch': 0.96} {'loss': 0.5898, 'learning_rate': 1.1164538031977591e-05, 'epoch': 0.96} {'loss': 0.5312, 'learning_rate': 1.1164204339621365e-05, 'epoch': 0.96} {'loss': 0.6687, 'learning_rate': 1.1163870645950974e-05, 'epoch': 0.96} {'loss': 0.7055, 'learning_rate': 1.1163536950966791e-05, 'epoch': 0.96} {'loss': 0.5861, 'learning_rate': 1.1163203254669197e-05, 'epoch': 0.96} {'loss': 0.643, 'learning_rate': 1.1162869557058568e-05, 'epoch': 0.96} {'loss': 0.5474, 'learning_rate': 1.116253585813528e-05, 'epoch': 0.96} {'loss': 0.6033, 'learning_rate': 1.1162202157899711e-05, 'epoch': 0.96} {'loss': 0.4687, 'learning_rate': 1.1161868456352234e-05, 'epoch': 0.96} {'loss': 0.5231, 'learning_rate': 1.116153475349323e-05, 'epoch': 0.96} {'loss': 0.5712, 'learning_rate': 1.1161201049323076e-05, 'epoch': 0.96} {'loss': 0.564, 'learning_rate': 1.1160867343842146e-05, 'epoch': 0.96} {'loss': 0.4624, 'learning_rate': 1.1160533637050816e-05, 'epoch': 0.96} {'loss': 0.4474, 'learning_rate': 1.1160199928949464e-05, 'epoch': 0.96} {'loss': 0.5108, 'learning_rate': 1.1159866219538468e-05, 'epoch': 0.96} {'loss': 0.6692, 'learning_rate': 1.1159532508818207e-05, 'epoch': 0.96} {'loss': 0.6086, 'learning_rate': 1.1159198796789051e-05, 'epoch': 0.96} {'loss': 0.831, 'learning_rate': 1.115886508345138e-05, 'epoch': 0.96} {'loss': 0.4736, 'learning_rate': 1.115853136880557e-05, 'epoch': 0.96} {'loss': 0.6894, 'learning_rate': 1.1158197652851999e-05, 'epoch': 0.96} {'loss': 0.4867, 'learning_rate': 1.1157863935591042e-05, 'epoch': 0.96} {'loss': 0.534, 'learning_rate': 1.1157530217023078e-05, 'epoch': 0.96} {'loss': 0.5793, 'learning_rate': 1.1157196497148481e-05, 'epoch': 0.96} {'loss': 0.5107, 'learning_rate': 1.1156862775967631e-05, 'epoch': 0.96} {'loss': 0.4204, 'learning_rate': 1.1156529053480903e-05, 'epoch': 0.96} {'loss': 0.5788, 'learning_rate': 1.1156195329688672e-05, 'epoch': 0.96} {'loss': 0.5408, 'learning_rate': 1.1155861604591317e-05, 'epoch': 0.96} {'loss': 0.5494, 'learning_rate': 1.1155527878189217e-05, 'epoch': 0.96} {'loss': 0.7379, 'learning_rate': 1.1155194150482742e-05, 'epoch': 0.96} {'loss': 0.5079, 'learning_rate': 1.1154860421472273e-05, 'epoch': 0.96} {'loss': 0.4963, 'learning_rate': 1.1154526691158188e-05, 'epoch': 0.96} {'loss': 0.6638, 'learning_rate': 1.1154192959540861e-05, 'epoch': 0.96} {'loss': 0.4506, 'learning_rate': 1.115385922662067e-05, 'epoch': 0.96} {'loss': 0.582, 'learning_rate': 1.115352549239799e-05, 'epoch': 0.96} {'loss': 0.4708, 'learning_rate': 1.1153191756873199e-05, 'epoch': 0.96} {'loss': 0.5419, 'learning_rate': 1.1152858020046676e-05, 'epoch': 0.96} {'loss': 0.4944, 'learning_rate': 1.1152524281918793e-05, 'epoch': 0.96} {'loss': 0.6265, 'learning_rate': 1.1152190542489931e-05, 'epoch': 0.96} {'loss': 0.5284, 'learning_rate': 1.1151856801760463e-05, 'epoch': 0.96} {'loss': 0.383, 'learning_rate': 1.115152305973077e-05, 'epoch': 0.96} {'loss': 0.563, 'learning_rate': 1.1151189316401227e-05, 'epoch': 0.96} {'loss': 0.5305, 'learning_rate': 1.115085557177221e-05, 'epoch': 0.96} {'loss': 0.3895, 'learning_rate': 1.1150521825844095e-05, 'epoch': 0.96} {'loss': 0.6807, 'learning_rate': 1.1150188078617257e-05, 'epoch': 0.96} {'loss': 0.5375, 'learning_rate': 1.1149854330092077e-05, 'epoch': 0.96} {'loss': 0.5809, 'learning_rate': 1.1149520580268932e-05, 'epoch': 0.96} {'loss': 0.5374, 'learning_rate': 1.1149186829148195e-05, 'epoch': 0.96} {'loss': 0.5521, 'learning_rate': 1.1148853076730245e-05, 'epoch': 0.96} {'loss': 0.4887, 'learning_rate': 1.114851932301546e-05, 'epoch': 0.96} {'loss': 0.6437, 'learning_rate': 1.1148185568004213e-05, 'epoch': 0.96} {'loss': 0.5589, 'learning_rate': 1.1147851811696884e-05, 'epoch': 0.96} {'loss': 0.623, 'learning_rate': 1.1147518054093847e-05, 'epoch': 0.96} {'loss': 0.6107, 'learning_rate': 1.1147184295195483e-05, 'epoch': 0.96} {'loss': 0.3912, 'learning_rate': 1.1146850535002166e-05, 'epoch': 0.96} {'loss': 0.5719, 'learning_rate': 1.1146516773514271e-05, 'epoch': 0.96} {'loss': 0.528, 'learning_rate': 1.1146183010732177e-05, 'epoch': 0.96} {'loss': 0.64, 'learning_rate': 1.114584924665626e-05, 'epoch': 0.96} {'loss': 0.5653, 'learning_rate': 1.1145515481286897e-05, 'epoch': 0.96} {'loss': 0.6259, 'learning_rate': 1.1145181714624465e-05, 'epoch': 0.96} {'loss': 0.657, 'learning_rate': 1.1144847946669339e-05, 'epoch': 0.96} {'loss': 0.5575, 'learning_rate': 1.1144514177421901e-05, 'epoch': 0.96} {'loss': 0.5703, 'learning_rate': 1.1144180406882521e-05, 'epoch': 0.96} {'loss': 0.5983, 'learning_rate': 1.114384663505158e-05, 'epoch': 0.96} {'loss': 0.5176, 'learning_rate': 1.1143512861929455e-05, 'epoch': 0.96} {'loss': 0.3868, 'learning_rate': 1.1143179087516521e-05, 'epoch': 0.96} {'loss': 0.5786, 'learning_rate': 1.1142845311813156e-05, 'epoch': 0.96} {'loss': 0.5274, 'learning_rate': 1.1142511534819734e-05, 'epoch': 0.96} {'loss': 0.5658, 'learning_rate': 1.1142177756536633e-05, 'epoch': 0.96} {'loss': 0.527, 'learning_rate': 1.1141843976964234e-05, 'epoch': 0.96} {'loss': 0.5533, 'learning_rate': 1.1141510196102905e-05, 'epoch': 0.96} {'loss': 0.5672, 'learning_rate': 1.1141176413953032e-05, 'epoch': 0.96} {'loss': 0.6462, 'learning_rate': 1.1140842630514985e-05, 'epoch': 0.96} {'loss': 0.5618, 'learning_rate': 1.1140508845789147e-05, 'epoch': 0.96} {'loss': 0.5956, 'learning_rate': 1.1140175059775888e-05, 'epoch': 0.96} {'loss': 0.4659, 'learning_rate': 1.1139841272475591e-05, 'epoch': 0.96} {'loss': 0.5808, 'learning_rate': 1.113950748388863e-05, 'epoch': 0.96} {'loss': 0.5307, 'learning_rate': 1.113917369401538e-05, 'epoch': 0.96} {'loss': 0.6927, 'learning_rate': 1.113883990285622e-05, 'epoch': 0.96} {'loss': 0.6114, 'learning_rate': 1.1138506110411527e-05, 'epoch': 0.96} {'loss': 0.5358, 'learning_rate': 1.1138172316681676e-05, 'epoch': 0.96} {'loss': 0.5526, 'learning_rate': 1.1137838521667046e-05, 'epoch': 0.96} {'loss': 0.749, 'learning_rate': 1.1137504725368012e-05, 'epoch': 0.96} {'loss': 0.5186, 'learning_rate': 1.113717092778495e-05, 'epoch': 0.96} {'loss': 0.4421, 'learning_rate': 1.1136837128918241e-05, 'epoch': 0.96} {'loss': 0.5211, 'learning_rate': 1.1136503328768258e-05, 'epoch': 0.96} {'loss': 0.3979, 'learning_rate': 1.1136169527335378e-05, 'epoch': 0.96} {'loss': 0.6052, 'learning_rate': 1.1135835724619981e-05, 'epoch': 0.96} {'loss': 0.7635, 'learning_rate': 1.1135501920622438e-05, 'epoch': 0.96} {'loss': 0.4153, 'learning_rate': 1.1135168115343133e-05, 'epoch': 0.96} {'loss': 0.5816, 'learning_rate': 1.1134834308782439e-05, 'epoch': 0.96} {'loss': 0.6759, 'learning_rate': 1.113450050094073e-05, 'epoch': 0.96} {'loss': 0.6108, 'learning_rate': 1.1134166691818386e-05, 'epoch': 0.96} {'loss': 0.727, 'learning_rate': 1.1133832881415784e-05, 'epoch': 0.96} {'loss': 0.5267, 'learning_rate': 1.1133499069733302e-05, 'epoch': 0.96} {'loss': 0.3674, 'learning_rate': 1.1133165256771314e-05, 'epoch': 0.96} {'loss': 0.4986, 'learning_rate': 1.1132831442530196e-05, 'epoch': 0.96} {'loss': 0.6881, 'learning_rate': 1.1132497627010331e-05, 'epoch': 0.96} {'loss': 0.605, 'learning_rate': 1.1132163810212087e-05, 'epoch': 0.96} {'loss': 0.7505, 'learning_rate': 1.1131829992135847e-05, 'epoch': 0.96} {'loss': 0.337, 'learning_rate': 1.1131496172781986e-05, 'epoch': 0.96} {'loss': 0.5556, 'learning_rate': 1.1131162352150882e-05, 'epoch': 0.96} {'loss': 0.5224, 'learning_rate': 1.1130828530242911e-05, 'epoch': 0.96} {'loss': 0.5399, 'learning_rate': 1.113049470705845e-05, 'epoch': 0.96} {'loss': 0.5728, 'learning_rate': 1.1130160882597873e-05, 'epoch': 0.96} {'loss': 0.2934, 'learning_rate': 1.1129827056861563e-05, 'epoch': 0.96} {'loss': 0.6409, 'learning_rate': 1.1129493229849888e-05, 'epoch': 0.96} {'loss': 0.5655, 'learning_rate': 1.1129159401563233e-05, 'epoch': 0.96} {'loss': 0.4588, 'learning_rate': 1.112882557200197e-05, 'epoch': 0.96} {'loss': 0.4265, 'learning_rate': 1.112849174116648e-05, 'epoch': 0.96} {'loss': 0.3634, 'learning_rate': 1.1128157909057135e-05, 'epoch': 0.96} {'loss': 0.3463, 'learning_rate': 1.1127824075674316e-05, 'epoch': 0.96} {'loss': 0.4023, 'learning_rate': 1.1127490241018398e-05, 'epoch': 0.96} {'loss': 0.5792, 'learning_rate': 1.1127156405089758e-05, 'epoch': 0.96} {'loss': 0.5865, 'learning_rate': 1.112682256788877e-05, 'epoch': 0.96} {'loss': 0.494, 'learning_rate': 1.1126488729415819e-05, 'epoch': 0.96} {'loss': 0.5426, 'learning_rate': 1.1126154889671274e-05, 'epoch': 0.96} {'loss': 0.3715, 'learning_rate': 1.1125821048655514e-05, 'epoch': 0.96} {'loss': 0.4077, 'learning_rate': 1.1125487206368915e-05, 'epoch': 0.96} {'loss': 0.5585, 'learning_rate': 1.1125153362811856e-05, 'epoch': 0.96} {'loss': 0.4534, 'learning_rate': 1.1124819517984712e-05, 'epoch': 0.96} {'loss': 0.5969, 'learning_rate': 1.1124485671887861e-05, 'epoch': 0.96} {'loss': 0.5928, 'learning_rate': 1.112415182452168e-05, 'epoch': 0.96} {'loss': 0.5855, 'learning_rate': 1.1123817975886543e-05, 'epoch': 0.96} {'loss': 0.6728, 'learning_rate': 1.1123484125982833e-05, 'epoch': 0.96} {'loss': 0.6358, 'learning_rate': 1.112315027481092e-05, 'epoch': 0.96} {'loss': 0.4378, 'learning_rate': 1.1122816422371185e-05, 'epoch': 0.96} {'loss': 0.7712, 'learning_rate': 1.1122482568664005e-05, 'epoch': 0.96} {'loss': 0.6649, 'learning_rate': 1.1122148713689756e-05, 'epoch': 0.96} {'loss': 0.5691, 'learning_rate': 1.1121814857448812e-05, 'epoch': 0.96} {'loss': 0.787, 'learning_rate': 1.1121480999941551e-05, 'epoch': 0.96} {'loss': 0.4333, 'learning_rate': 1.1121147141168355e-05, 'epoch': 0.96} {'loss': 0.5885, 'learning_rate': 1.1120813281129596e-05, 'epoch': 0.96} {'loss': 0.4618, 'learning_rate': 1.1120479419825652e-05, 'epoch': 0.96} {'loss': 0.6496, 'learning_rate': 1.1120145557256898e-05, 'epoch': 0.96} {'loss': 0.5312, 'learning_rate': 1.1119811693423714e-05, 'epoch': 0.96} {'loss': 0.5276, 'learning_rate': 1.1119477828326477e-05, 'epoch': 0.96} {'loss': 0.5709, 'learning_rate': 1.1119143961965561e-05, 'epoch': 0.96} {'loss': 0.529, 'learning_rate': 1.1118810094341344e-05, 'epoch': 0.96} {'loss': 0.5779, 'learning_rate': 1.1118476225454205e-05, 'epoch': 0.96} {'loss': 0.5368, 'learning_rate': 1.1118142355304517e-05, 'epoch': 0.96} {'loss': 0.6206, 'learning_rate': 1.1117808483892661e-05, 'epoch': 0.96} {'loss': 0.5279, 'learning_rate': 1.111747461121901e-05, 'epoch': 0.96} {'loss': 0.5427, 'learning_rate': 1.1117140737283942e-05, 'epoch': 0.96} {'loss': 0.5899, 'learning_rate': 1.1116806862087834e-05, 'epoch': 0.96} {'loss': 0.5971, 'learning_rate': 1.1116472985631066e-05, 'epoch': 0.96} {'loss': 0.5658, 'learning_rate': 1.1116139107914012e-05, 'epoch': 0.96} {'loss': 0.5314, 'learning_rate': 1.1115805228937049e-05, 'epoch': 0.96} {'loss': 0.4252, 'learning_rate': 1.1115471348700553e-05, 'epoch': 0.96} {'loss': 0.5115, 'learning_rate': 1.1115137467204903e-05, 'epoch': 0.96} {'loss': 0.5974, 'learning_rate': 1.1114803584450473e-05, 'epoch': 0.96} {'loss': 0.662, 'learning_rate': 1.1114469700437643e-05, 'epoch': 0.96} {'loss': 0.5592, 'learning_rate': 1.1114135815166792e-05, 'epoch': 0.96} {'loss': 0.5718, 'learning_rate': 1.1113801928638288e-05, 'epoch': 0.96} {'loss': 0.5013, 'learning_rate': 1.1113468040852515e-05, 'epoch': 0.96} {'loss': 0.5377, 'learning_rate': 1.111313415180985e-05, 'epoch': 0.96} {'loss': 0.6265, 'learning_rate': 1.1112800261510665e-05, 'epoch': 0.96} {'loss': 0.5676, 'learning_rate': 1.1112466369955344e-05, 'epoch': 0.96} {'loss': 0.515, 'learning_rate': 1.1112132477144258e-05, 'epoch': 0.96} {'loss': 0.5954, 'learning_rate': 1.1111798583077786e-05, 'epoch': 0.96} {'loss': 0.5544, 'learning_rate': 1.1111464687756306e-05, 'epoch': 0.96} {'loss': 0.6822, 'learning_rate': 1.111113079118019e-05, 'epoch': 0.96} {'loss': 0.4552, 'learning_rate': 1.1110796893349823e-05, 'epoch': 0.96} {'loss': 0.7776, 'learning_rate': 1.1110462994265577e-05, 'epoch': 0.96} {'loss': 0.4994, 'learning_rate': 1.1110129093927826e-05, 'epoch': 0.96} {'loss': 0.4906, 'learning_rate': 1.1109795192336957e-05, 'epoch': 0.96} {'loss': 0.4872, 'learning_rate': 1.1109461289493335e-05, 'epoch': 0.96} {'loss': 0.5329, 'learning_rate': 1.1109127385397342e-05, 'epoch': 0.96} {'loss': 0.4959, 'learning_rate': 1.1108793480049355e-05, 'epoch': 0.96} {'loss': 0.7023, 'learning_rate': 1.1108459573449752e-05, 'epoch': 0.96} {'loss': 0.465, 'learning_rate': 1.110812566559891e-05, 'epoch': 0.96} {'loss': 0.5308, 'learning_rate': 1.1107791756497203e-05, 'epoch': 0.96} {'loss': 0.6868, 'learning_rate': 1.1107457846145012e-05, 'epoch': 0.96} {'loss': 0.5775, 'learning_rate': 1.110712393454271e-05, 'epoch': 0.96} {'loss': 0.5702, 'learning_rate': 1.1106790021690677e-05, 'epoch': 0.96} {'loss': 0.7661, 'learning_rate': 1.1106456107589285e-05, 'epoch': 0.96} {'loss': 0.6019, 'learning_rate': 1.110612219223892e-05, 'epoch': 0.96} {'loss': 0.4061, 'learning_rate': 1.1105788275639949e-05, 'epoch': 0.96} {'loss': 0.4735, 'learning_rate': 1.1105454357792756e-05, 'epoch': 0.96} {'loss': 0.5468, 'learning_rate': 1.1105120438697712e-05, 'epoch': 0.96} {'loss': 0.5185, 'learning_rate': 1.11047865183552e-05, 'epoch': 0.96} {'loss': 0.4147, 'learning_rate': 1.1104452596765593e-05, 'epoch': 0.96} {'loss': 0.5359, 'learning_rate': 1.110411867392927e-05, 'epoch': 0.96} {'loss': 0.5288, 'learning_rate': 1.1103784749846604e-05, 'epoch': 0.96} {'loss': 0.4056, 'learning_rate': 1.1103450824517978e-05, 'epoch': 0.96} {'loss': 0.5136, 'learning_rate': 1.1103116897943764e-05, 'epoch': 0.96} {'loss': 0.58, 'learning_rate': 1.1102782970124343e-05, 'epoch': 0.96} {'loss': 0.3327, 'learning_rate': 1.1102449041060088e-05, 'epoch': 0.96} {'loss': 0.6203, 'learning_rate': 1.110211511075138e-05, 'epoch': 0.96} {'loss': 0.6775, 'learning_rate': 1.1101781179198593e-05, 'epoch': 0.96} {'loss': 0.3884, 'learning_rate': 1.1101447246402102e-05, 'epoch': 0.96} {'loss': 0.552, 'learning_rate': 1.1101113312362288e-05, 'epoch': 0.96} {'loss': 0.3839, 'learning_rate': 1.1100779377079527e-05, 'epoch': 0.96} {'loss': 0.5302, 'learning_rate': 1.1100445440554195e-05, 'epoch': 0.96} {'loss': 0.6271, 'learning_rate': 1.1100111502786668e-05, 'epoch': 0.96} {'loss': 0.596, 'learning_rate': 1.1099777563777326e-05, 'epoch': 0.96} {'loss': 0.4941, 'learning_rate': 1.1099443623526543e-05, 'epoch': 0.96} {'loss': 0.5188, 'learning_rate': 1.1099109682034698e-05, 'epoch': 0.96} {'loss': 0.3577, 'learning_rate': 1.1098775739302169e-05, 'epoch': 0.96} {'loss': 0.6095, 'learning_rate': 1.1098441795329327e-05, 'epoch': 0.96} {'loss': 0.5553, 'learning_rate': 1.1098107850116556e-05, 'epoch': 0.96} {'loss': 0.5039, 'learning_rate': 1.1097773903664229e-05, 'epoch': 0.96} {'loss': 0.6066, 'learning_rate': 1.1097439955972726e-05, 'epoch': 0.96} {'loss': 0.6769, 'learning_rate': 1.1097106007042419e-05, 'epoch': 0.96} {'loss': 0.5013, 'learning_rate': 1.109677205687369e-05, 'epoch': 0.96} {'loss': 0.5514, 'learning_rate': 1.1096438105466913e-05, 'epoch': 0.96} {'loss': 0.4808, 'learning_rate': 1.1096104152822467e-05, 'epoch': 0.96} {'loss': 0.5813, 'learning_rate': 1.1095770198940725e-05, 'epoch': 0.96} {'loss': 0.3696, 'learning_rate': 1.109543624382207e-05, 'epoch': 0.96} {'loss': 0.6081, 'learning_rate': 1.1095102287466874e-05, 'epoch': 0.96} {'loss': 0.5931, 'learning_rate': 1.1094768329875516e-05, 'epoch': 0.96} {'loss': 0.5605, 'learning_rate': 1.1094434371048373e-05, 'epoch': 0.96} {'loss': 0.4727, 'learning_rate': 1.1094100410985822e-05, 'epoch': 0.96} {'loss': 0.59, 'learning_rate': 1.1093766449688239e-05, 'epoch': 0.96} {'loss': 0.5527, 'learning_rate': 1.1093432487156002e-05, 'epoch': 0.96} {'loss': 0.4094, 'learning_rate': 1.109309852338949e-05, 'epoch': 0.96} {'loss': 0.4672, 'learning_rate': 1.1092764558389076e-05, 'epoch': 0.96} {'loss': 0.4791, 'learning_rate': 1.1092430592155137e-05, 'epoch': 0.96} {'loss': 0.5587, 'learning_rate': 1.1092096624688053e-05, 'epoch': 0.96} {'loss': 0.4876, 'learning_rate': 1.1091762655988199e-05, 'epoch': 0.96} {'loss': 0.4789, 'learning_rate': 1.1091428686055952e-05, 'epoch': 0.96} {'loss': 0.5079, 'learning_rate': 1.109109471489169e-05, 'epoch': 0.96} {'loss': 0.4648, 'learning_rate': 1.109076074249579e-05, 'epoch': 0.96} {'loss': 0.6116, 'learning_rate': 1.109042676886863e-05, 'epoch': 0.96} {'loss': 0.5695, 'learning_rate': 1.1090092794010583e-05, 'epoch': 0.96} {'loss': 0.7255, 'learning_rate': 1.108975881792203e-05, 'epoch': 0.96} {'loss': 0.623, 'learning_rate': 1.1089424840603344e-05, 'epoch': 0.96} {'loss': 0.5483, 'learning_rate': 1.1089090862054908e-05, 'epoch': 0.96} {'loss': 0.5308, 'learning_rate': 1.1088756882277095e-05, 'epoch': 0.96} {'loss': 0.5519, 'learning_rate': 1.108842290127028e-05, 'epoch': 0.96} {'loss': 0.6206, 'learning_rate': 1.1088088919034843e-05, 'epoch': 0.96} {'loss': 0.6089, 'learning_rate': 1.1087754935571162e-05, 'epoch': 0.96} {'loss': 0.4595, 'learning_rate': 1.1087420950879613e-05, 'epoch': 0.96} {'loss': 0.5384, 'learning_rate': 1.108708696496057e-05, 'epoch': 0.96} {'loss': 0.7575, 'learning_rate': 1.1086752977814415e-05, 'epoch': 0.96} {'loss': 0.6918, 'learning_rate': 1.108641898944152e-05, 'epoch': 0.96} {'loss': 0.6408, 'learning_rate': 1.1086084999842267e-05, 'epoch': 0.96} {'loss': 0.5904, 'learning_rate': 1.1085751009017029e-05, 'epoch': 0.96} {'loss': 0.4265, 'learning_rate': 1.1085417016966189e-05, 'epoch': 0.96} {'loss': 0.319, 'learning_rate': 1.1085083023690116e-05, 'epoch': 0.96} {'loss': 0.5784, 'learning_rate': 1.108474902918919e-05, 'epoch': 0.96} {'loss': 0.6398, 'learning_rate': 1.108441503346379e-05, 'epoch': 0.96} {'loss': 0.5381, 'learning_rate': 1.1084081036514288e-05, 'epoch': 0.96} {'loss': 0.6263, 'learning_rate': 1.1083747038341069e-05, 'epoch': 0.96} {'loss': 0.6851, 'learning_rate': 1.1083413038944503e-05, 'epoch': 0.96} {'loss': 0.5995, 'learning_rate': 1.1083079038324971e-05, 'epoch': 0.96} {'loss': 0.5766, 'learning_rate': 1.1082745036482849e-05, 'epoch': 0.96} {'loss': 0.5161, 'learning_rate': 1.1082411033418512e-05, 'epoch': 0.96} {'loss': 0.5872, 'learning_rate': 1.108207702913234e-05, 'epoch': 0.96} {'loss': 0.4765, 'learning_rate': 1.108174302362471e-05, 'epoch': 0.96} {'loss': 0.5905, 'learning_rate': 1.1081409016895997e-05, 'epoch': 0.96} {'loss': 0.4938, 'learning_rate': 1.108107500894658e-05, 'epoch': 0.96} {'loss': 0.5226, 'learning_rate': 1.1080740999776833e-05, 'epoch': 0.96} {'loss': 0.3676, 'learning_rate': 1.1080406989387135e-05, 'epoch': 0.96} {'loss': 0.6561, 'learning_rate': 1.1080072977777866e-05, 'epoch': 0.96} {'loss': 0.6341, 'learning_rate': 1.1079738964949395e-05, 'epoch': 0.96} {'loss': 0.5015, 'learning_rate': 1.1079404950902106e-05, 'epoch': 0.96} {'loss': 0.6616, 'learning_rate': 1.1079070935636376e-05, 'epoch': 0.96} {'loss': 0.492, 'learning_rate': 1.1078736919152578e-05, 'epoch': 0.96} {'loss': 0.5889, 'learning_rate': 1.1078402901451092e-05, 'epoch': 0.96} {'loss': 0.4789, 'learning_rate': 1.1078068882532294e-05, 'epoch': 0.96} {'loss': 0.621, 'learning_rate': 1.1077734862396562e-05, 'epoch': 0.96} {'loss': 0.5708, 'learning_rate': 1.107740084104427e-05, 'epoch': 0.96} {'loss': 0.536, 'learning_rate': 1.1077066818475797e-05, 'epoch': 0.96} {'loss': 0.724, 'learning_rate': 1.1076732794691523e-05, 'epoch': 0.96} {'loss': 0.6514, 'learning_rate': 1.1076398769691823e-05, 'epoch': 0.96} {'loss': 0.6009, 'learning_rate': 1.1076064743477073e-05, 'epoch': 0.96} {'loss': 0.5842, 'learning_rate': 1.1075730716047649e-05, 'epoch': 0.96} {'loss': 0.5509, 'learning_rate': 1.107539668740393e-05, 'epoch': 0.96} {'loss': 0.4954, 'learning_rate': 1.1075062657546291e-05, 'epoch': 0.96} {'loss': 0.5394, 'learning_rate': 1.1074728626475113e-05, 'epoch': 0.96} {'loss': 0.6387, 'learning_rate': 1.1074394594190772e-05, 'epoch': 0.96} {'loss': 0.5837, 'learning_rate': 1.1074060560693641e-05, 'epoch': 0.96} {'loss': 0.5073, 'learning_rate': 1.10737265259841e-05, 'epoch': 0.96} {'loss': 0.4918, 'learning_rate': 1.1073392490062524e-05, 'epoch': 0.96} {'loss': 0.5231, 'learning_rate': 1.1073058452929297e-05, 'epoch': 0.96} {'loss': 0.7168, 'learning_rate': 1.107272441458479e-05, 'epoch': 0.96} {'loss': 0.4647, 'learning_rate': 1.107239037502938e-05, 'epoch': 0.96} {'loss': 0.6244, 'learning_rate': 1.1072056334263446e-05, 'epoch': 0.96} {'loss': 0.3763, 'learning_rate': 1.1071722292287361e-05, 'epoch': 0.96} {'loss': 0.4966, 'learning_rate': 1.107138824910151e-05, 'epoch': 0.96} {'loss': 0.4566, 'learning_rate': 1.1071054204706261e-05, 'epoch': 0.96} {'loss': 0.5316, 'learning_rate': 1.1070720159101997e-05, 'epoch': 0.96} {'loss': 0.7246, 'learning_rate': 1.1070386112289096e-05, 'epoch': 0.96} {'loss': 0.6574, 'learning_rate': 1.1070052064267932e-05, 'epoch': 0.96} {'loss': 0.4338, 'learning_rate': 1.106971801503888e-05, 'epoch': 0.96} {'loss': 0.6089, 'learning_rate': 1.1069383964602321e-05, 'epoch': 0.96} {'loss': 0.4932, 'learning_rate': 1.1069049912958632e-05, 'epoch': 0.97} {'loss': 0.4945, 'learning_rate': 1.106871586010819e-05, 'epoch': 0.97} {'loss': 0.4768, 'learning_rate': 1.106838180605137e-05, 'epoch': 0.97} {'loss': 0.4575, 'learning_rate': 1.1068047750788546e-05, 'epoch': 0.97} {'loss': 0.6241, 'learning_rate': 1.1067713694320103e-05, 'epoch': 0.97} {'loss': 0.6218, 'learning_rate': 1.1067379636646414e-05, 'epoch': 0.97} {'loss': 0.3549, 'learning_rate': 1.1067045577767857e-05, 'epoch': 0.97} {'loss': 0.6326, 'learning_rate': 1.1066711517684808e-05, 'epoch': 0.97} {'loss': 0.686, 'learning_rate': 1.1066377456397644e-05, 'epoch': 0.97} {'loss': 0.5753, 'learning_rate': 1.1066043393906741e-05, 'epoch': 0.97} {'loss': 0.5659, 'learning_rate': 1.106570933021248e-05, 'epoch': 0.97} {'loss': 0.5689, 'learning_rate': 1.1065375265315235e-05, 'epoch': 0.97} {'loss': 0.4898, 'learning_rate': 1.1065041199215384e-05, 'epoch': 0.97} {'loss': 0.6671, 'learning_rate': 1.1064707131913303e-05, 'epoch': 0.97} {'loss': 0.658, 'learning_rate': 1.1064373063409372e-05, 'epoch': 0.97} {'loss': 0.5714, 'learning_rate': 1.1064038993703968e-05, 'epoch': 0.97} {'loss': 0.6283, 'learning_rate': 1.1063704922797462e-05, 'epoch': 0.97} {'loss': 0.4807, 'learning_rate': 1.1063370850690238e-05, 'epoch': 0.97} {'loss': 0.6292, 'learning_rate': 1.1063036777382669e-05, 'epoch': 0.97} {'loss': 0.3569, 'learning_rate': 1.1062702702875135e-05, 'epoch': 0.97} {'loss': 0.6049, 'learning_rate': 1.1062368627168009e-05, 'epoch': 0.97} {'loss': 0.629, 'learning_rate': 1.1062034550261673e-05, 'epoch': 0.97} {'loss': 0.4673, 'learning_rate': 1.1061700472156503e-05, 'epoch': 0.97} {'loss': 0.5839, 'learning_rate': 1.1061366392852876e-05, 'epoch': 0.97} {'loss': 0.5327, 'learning_rate': 1.1061032312351164e-05, 'epoch': 0.97} {'loss': 0.434, 'learning_rate': 1.1060698230651749e-05, 'epoch': 0.97} {'loss': 0.5799, 'learning_rate': 1.106036414775501e-05, 'epoch': 0.97} {'loss': 0.489, 'learning_rate': 1.1060030063661322e-05, 'epoch': 0.97} {'loss': 0.6402, 'learning_rate': 1.1059695978371059e-05, 'epoch': 0.97} {'loss': 0.4978, 'learning_rate': 1.1059361891884603e-05, 'epoch': 0.97} {'loss': 0.6354, 'learning_rate': 1.1059027804202327e-05, 'epoch': 0.97} {'loss': 0.736, 'learning_rate': 1.1058693715324612e-05, 'epoch': 0.97} {'loss': 0.6829, 'learning_rate': 1.1058359625251829e-05, 'epoch': 0.97} {'loss': 0.5291, 'learning_rate': 1.1058025533984362e-05, 'epoch': 0.97} {'loss': 0.5881, 'learning_rate': 1.1057691441522586e-05, 'epoch': 0.97} {'loss': 0.4915, 'learning_rate': 1.1057357347866878e-05, 'epoch': 0.97} {'loss': 0.6263, 'learning_rate': 1.1057023253017612e-05, 'epoch': 0.97} {'loss': 0.5579, 'learning_rate': 1.1056689156975167e-05, 'epoch': 0.97} {'loss': 0.631, 'learning_rate': 1.1056355059739924e-05, 'epoch': 0.97} {'loss': 0.6287, 'learning_rate': 1.1056020961312258e-05, 'epoch': 0.97} {'loss': 0.6399, 'learning_rate': 1.1055686861692541e-05, 'epoch': 0.97} {'loss': 0.5548, 'learning_rate': 1.1055352760881158e-05, 'epoch': 0.97} {'loss': 0.5545, 'learning_rate': 1.105501865887848e-05, 'epoch': 0.97} {'loss': 0.4198, 'learning_rate': 1.1054684555684886e-05, 'epoch': 0.97} {'loss': 0.4561, 'learning_rate': 1.1054350451300755e-05, 'epoch': 0.97} {'loss': 0.5227, 'learning_rate': 1.1054016345726464e-05, 'epoch': 0.97} {'loss': 0.5497, 'learning_rate': 1.1053682238962387e-05, 'epoch': 0.97} {'loss': 0.466, 'learning_rate': 1.1053348131008903e-05, 'epoch': 0.97} {'loss': 0.632, 'learning_rate': 1.105301402186639e-05, 'epoch': 0.97} {'loss': 0.6458, 'learning_rate': 1.1052679911535227e-05, 'epoch': 0.97} {'loss': 0.5007, 'learning_rate': 1.1052345800015784e-05, 'epoch': 0.97} {'loss': 0.6319, 'learning_rate': 1.1052011687308448e-05, 'epoch': 0.97} {'loss': 0.5919, 'learning_rate': 1.1051677573413589e-05, 'epoch': 0.97} {'loss': 0.6729, 'learning_rate': 1.1051343458331582e-05, 'epoch': 0.97} {'loss': 0.7894, 'learning_rate': 1.1051009342062813e-05, 'epoch': 0.97} {'loss': 0.5782, 'learning_rate': 1.1050675224607653e-05, 'epoch': 0.97} {'loss': 0.7453, 'learning_rate': 1.1050341105966478e-05, 'epoch': 0.97} {'loss': 0.4142, 'learning_rate': 1.105000698613967e-05, 'epoch': 0.97} {'loss': 0.6701, 'learning_rate': 1.1049672865127603e-05, 'epoch': 0.97} {'loss': 0.6486, 'learning_rate': 1.1049338742930655e-05, 'epoch': 0.97} {'loss': 0.6051, 'learning_rate': 1.1049004619549201e-05, 'epoch': 0.97} {'loss': 0.5688, 'learning_rate': 1.1048670494983624e-05, 'epoch': 0.97} {'loss': 0.4876, 'learning_rate': 1.1048336369234297e-05, 'epoch': 0.97} {'loss': 0.6247, 'learning_rate': 1.1048002242301595e-05, 'epoch': 0.97} {'loss': 0.5869, 'learning_rate': 1.1047668114185901e-05, 'epoch': 0.97} {'loss': 0.5388, 'learning_rate': 1.1047333984887587e-05, 'epoch': 0.97} {'loss': 0.6014, 'learning_rate': 1.1046999854407031e-05, 'epoch': 0.97} {'loss': 0.5743, 'learning_rate': 1.1046665722744614e-05, 'epoch': 0.97} {'loss': 0.4632, 'learning_rate': 1.104633158990071e-05, 'epoch': 0.97} {'loss': 0.5739, 'learning_rate': 1.1045997455875694e-05, 'epoch': 0.97} {'loss': 0.639, 'learning_rate': 1.1045663320669949e-05, 'epoch': 0.97} {'loss': 0.5959, 'learning_rate': 1.1045329184283846e-05, 'epoch': 0.97} {'loss': 0.6554, 'learning_rate': 1.1044995046717767e-05, 'epoch': 0.97} {'loss': 0.526, 'learning_rate': 1.1044660907972084e-05, 'epoch': 0.97} {'loss': 0.4516, 'learning_rate': 1.1044326768047182e-05, 'epoch': 0.97} {'loss': 0.5927, 'learning_rate': 1.1043992626943431e-05, 'epoch': 0.97} {'loss': 0.4907, 'learning_rate': 1.1043658484661211e-05, 'epoch': 0.97} {'loss': 0.5128, 'learning_rate': 1.1043324341200903e-05, 'epoch': 0.97} {'loss': 0.5436, 'learning_rate': 1.1042990196562878e-05, 'epoch': 0.97} {'loss': 0.6445, 'learning_rate': 1.1042656050747514e-05, 'epoch': 0.97} {'loss': 0.4834, 'learning_rate': 1.1042321903755188e-05, 'epoch': 0.97} {'loss': 0.5065, 'learning_rate': 1.104198775558628e-05, 'epoch': 0.97} {'loss': 0.6845, 'learning_rate': 1.1041653606241167e-05, 'epoch': 0.97} {'loss': 0.7574, 'learning_rate': 1.1041319455720225e-05, 'epoch': 0.97} {'loss': 0.567, 'learning_rate': 1.1040985304023832e-05, 'epoch': 0.97} {'loss': 0.4288, 'learning_rate': 1.1040651151152364e-05, 'epoch': 0.97} {'loss': 0.5291, 'learning_rate': 1.1040316997106198e-05, 'epoch': 0.97} {'loss': 0.5392, 'learning_rate': 1.1039982841885713e-05, 'epoch': 0.97} {'loss': 0.609, 'learning_rate': 1.1039648685491282e-05, 'epoch': 0.97} {'loss': 0.4302, 'learning_rate': 1.1039314527923289e-05, 'epoch': 0.97} {'loss': 0.3685, 'learning_rate': 1.1038980369182106e-05, 'epoch': 0.97} {'loss': 0.5028, 'learning_rate': 1.1038646209268111e-05, 'epoch': 0.97} {'loss': 0.4707, 'learning_rate': 1.1038312048181684e-05, 'epoch': 0.97} {'loss': 0.4996, 'learning_rate': 1.1037977885923198e-05, 'epoch': 0.97} {'loss': 0.5282, 'learning_rate': 1.1037643722493034e-05, 'epoch': 0.97} {'loss': 0.3893, 'learning_rate': 1.1037309557891567e-05, 'epoch': 0.97} {'loss': 0.5522, 'learning_rate': 1.1036975392119176e-05, 'epoch': 0.97} {'loss': 0.6069, 'learning_rate': 1.1036641225176234e-05, 'epoch': 0.97} {'loss': 0.6639, 'learning_rate': 1.1036307057063124e-05, 'epoch': 0.97} {'loss': 0.488, 'learning_rate': 1.103597288778022e-05, 'epoch': 0.97} {'loss': 0.3266, 'learning_rate': 1.10356387173279e-05, 'epoch': 0.97} {'loss': 0.5859, 'learning_rate': 1.103530454570654e-05, 'epoch': 0.97} {'loss': 0.7011, 'learning_rate': 1.1034970372916518e-05, 'epoch': 0.97} {'loss': 0.4037, 'learning_rate': 1.1034636198958212e-05, 'epoch': 0.97} {'loss': 0.5817, 'learning_rate': 1.1034302023831998e-05, 'epoch': 0.97} {'loss': 0.5865, 'learning_rate': 1.1033967847538251e-05, 'epoch': 0.97} {'loss': 0.4956, 'learning_rate': 1.1033633670077355e-05, 'epoch': 0.97} {'loss': 0.6656, 'learning_rate': 1.103329949144968e-05, 'epoch': 0.97} {'loss': 0.5272, 'learning_rate': 1.1032965311655609e-05, 'epoch': 0.97} {'loss': 0.6693, 'learning_rate': 1.1032631130695515e-05, 'epoch': 0.97} {'loss': 0.3331, 'learning_rate': 1.1032296948569777e-05, 'epoch': 0.97} {'loss': 0.6067, 'learning_rate': 1.1031962765278772e-05, 'epoch': 0.97} {'loss': 0.6244, 'learning_rate': 1.1031628580822877e-05, 'epoch': 0.97} {'loss': 0.4383, 'learning_rate': 1.103129439520247e-05, 'epoch': 0.97} {'loss': 0.4639, 'learning_rate': 1.1030960208417929e-05, 'epoch': 0.97} {'loss': 0.7081, 'learning_rate': 1.103062602046963e-05, 'epoch': 0.97} {'loss': 0.561, 'learning_rate': 1.1030291831357949e-05, 'epoch': 0.97} {'loss': 0.6683, 'learning_rate': 1.1029957641083264e-05, 'epoch': 0.97} {'loss': 0.6099, 'learning_rate': 1.1029623449645952e-05, 'epoch': 0.97} {'loss': 0.4339, 'learning_rate': 1.1029289257046391e-05, 'epoch': 0.97} {'loss': 0.6922, 'learning_rate': 1.1028955063284961e-05, 'epoch': 0.97} {'loss': 0.4291, 'learning_rate': 1.1028620868362034e-05, 'epoch': 0.97} {'loss': 0.5943, 'learning_rate': 1.1028286672277991e-05, 'epoch': 0.97} {'loss': 0.4886, 'learning_rate': 1.1027952475033206e-05, 'epoch': 0.97} {'loss': 0.4774, 'learning_rate': 1.1027618276628059e-05, 'epoch': 0.97} {'loss': 0.4634, 'learning_rate': 1.1027284077062925e-05, 'epoch': 0.97} {'loss': 0.6673, 'learning_rate': 1.1026949876338185e-05, 'epoch': 0.97} {'loss': 0.5871, 'learning_rate': 1.1026615674454216e-05, 'epoch': 0.97} {'loss': 0.5112, 'learning_rate': 1.1026281471411389e-05, 'epoch': 0.97} {'loss': 0.5582, 'learning_rate': 1.1025947267210086e-05, 'epoch': 0.97} {'loss': 0.4774, 'learning_rate': 1.1025613061850683e-05, 'epoch': 0.97} {'loss': 0.4475, 'learning_rate': 1.1025278855333561e-05, 'epoch': 0.97} {'loss': 0.506, 'learning_rate': 1.102494464765909e-05, 'epoch': 0.97} {'loss': 0.4126, 'learning_rate': 1.1024610438827655e-05, 'epoch': 0.97} {'loss': 0.5769, 'learning_rate': 1.1024276228839628e-05, 'epoch': 0.97} {'loss': 0.4758, 'learning_rate': 1.1023942017695389e-05, 'epoch': 0.97} {'loss': 0.519, 'learning_rate': 1.1023607805395311e-05, 'epoch': 0.97} {'loss': 0.5291, 'learning_rate': 1.1023273591939778e-05, 'epoch': 0.97} {'loss': 0.5122, 'learning_rate': 1.1022939377329162e-05, 'epoch': 0.97} {'loss': 0.4065, 'learning_rate': 1.1022605161563842e-05, 'epoch': 0.97} {'loss': 0.5766, 'learning_rate': 1.1022270944644195e-05, 'epoch': 0.97} {'loss': 0.5271, 'learning_rate': 1.1021936726570602e-05, 'epoch': 0.97} {'loss': 0.5977, 'learning_rate': 1.1021602507343432e-05, 'epoch': 0.97} {'loss': 0.4892, 'learning_rate': 1.102126828696307e-05, 'epoch': 0.97} {'loss': 0.4277, 'learning_rate': 1.1020934065429886e-05, 'epoch': 0.97} {'loss': 0.4111, 'learning_rate': 1.1020599842744267e-05, 'epoch': 0.97} {'loss': 0.457, 'learning_rate': 1.1020265618906583e-05, 'epoch': 0.97} {'loss': 0.543, 'learning_rate': 1.1019931393917211e-05, 'epoch': 0.97} {'loss': 0.4479, 'learning_rate': 1.1019597167776533e-05, 'epoch': 0.97} {'loss': 0.6157, 'learning_rate': 1.1019262940484922e-05, 'epoch': 0.97} {'loss': 0.5894, 'learning_rate': 1.101892871204276e-05, 'epoch': 0.97} {'loss': 0.6736, 'learning_rate': 1.1018594482450419e-05, 'epoch': 0.97} {'loss': 0.5931, 'learning_rate': 1.101826025170828e-05, 'epoch': 0.97} {'loss': 0.6617, 'learning_rate': 1.1017926019816716e-05, 'epoch': 0.97} {'loss': 0.6548, 'learning_rate': 1.1017591786776109e-05, 'epoch': 0.97} {'loss': 0.6679, 'learning_rate': 1.1017257552586833e-05, 'epoch': 0.97} {'loss': 0.5475, 'learning_rate': 1.101692331724927e-05, 'epoch': 0.97} {'loss': 0.7136, 'learning_rate': 1.101658908076379e-05, 'epoch': 0.97} {'loss': 0.5181, 'learning_rate': 1.1016254843130776e-05, 'epoch': 0.97} {'loss': 0.4258, 'learning_rate': 1.1015920604350604e-05, 'epoch': 0.97} {'loss': 0.5646, 'learning_rate': 1.1015586364423649e-05, 'epoch': 0.97} {'loss': 0.4423, 'learning_rate': 1.101525212335029e-05, 'epoch': 0.97} {'loss': 0.4311, 'learning_rate': 1.1014917881130906e-05, 'epoch': 0.97} {'loss': 0.6615, 'learning_rate': 1.1014583637765875e-05, 'epoch': 0.97} {'loss': 0.5667, 'learning_rate': 1.1014249393255569e-05, 'epoch': 0.97} {'loss': 0.6683, 'learning_rate': 1.1013915147600369e-05, 'epoch': 0.97} {'loss': 0.6129, 'learning_rate': 1.1013580900800652e-05, 'epoch': 0.97} {'loss': 0.5329, 'learning_rate': 1.1013246652856793e-05, 'epoch': 0.97} {'loss': 0.6483, 'learning_rate': 1.1012912403769171e-05, 'epoch': 0.97} {'loss': 0.5407, 'learning_rate': 1.1012578153538164e-05, 'epoch': 0.97} {'loss': 0.6563, 'learning_rate': 1.101224390216415e-05, 'epoch': 0.97} {'loss': 0.6651, 'learning_rate': 1.1011909649647506e-05, 'epoch': 0.97} {'loss': 0.4913, 'learning_rate': 1.1011575395988607e-05, 'epoch': 0.97} {'loss': 0.5253, 'learning_rate': 1.1011241141187832e-05, 'epoch': 0.97} {'loss': 0.6245, 'learning_rate': 1.1010906885245558e-05, 'epoch': 0.97} {'loss': 0.3959, 'learning_rate': 1.1010572628162162e-05, 'epoch': 0.97} {'loss': 0.4672, 'learning_rate': 1.1010238369938025e-05, 'epoch': 0.97} {'loss': 0.5766, 'learning_rate': 1.1009904110573518e-05, 'epoch': 0.97} {'loss': 0.5682, 'learning_rate': 1.1009569850069019e-05, 'epoch': 0.97} {'loss': 0.5005, 'learning_rate': 1.1009235588424912e-05, 'epoch': 0.97} {'loss': 0.5286, 'learning_rate': 1.1008901325641568e-05, 'epoch': 0.97} {'loss': 0.6042, 'learning_rate': 1.1008567061719367e-05, 'epoch': 0.97} {'loss': 0.4571, 'learning_rate': 1.1008232796658681e-05, 'epoch': 0.97} {'loss': 0.4011, 'learning_rate': 1.1007898530459897e-05, 'epoch': 0.97} {'loss': 0.4767, 'learning_rate': 1.1007564263123386e-05, 'epoch': 0.97} {'loss': 0.4563, 'learning_rate': 1.1007229994649526e-05, 'epoch': 0.97} {'loss': 0.5682, 'learning_rate': 1.1006895725038693e-05, 'epoch': 0.97} {'loss': 0.6127, 'learning_rate': 1.1006561454291272e-05, 'epoch': 0.97} {'loss': 0.5074, 'learning_rate': 1.1006227182407629e-05, 'epoch': 0.97} {'loss': 0.6535, 'learning_rate': 1.1005892909388149e-05, 'epoch': 0.97} {'loss': 0.6146, 'learning_rate': 1.1005558635233206e-05, 'epoch': 0.97} {'loss': 0.6145, 'learning_rate': 1.1005224359943181e-05, 'epoch': 0.97} {'loss': 0.5258, 'learning_rate': 1.1004890083518448e-05, 'epoch': 0.97} {'loss': 0.7035, 'learning_rate': 1.1004555805959383e-05, 'epoch': 0.97} {'loss': 0.5606, 'learning_rate': 1.1004221527266368e-05, 'epoch': 0.97} {'loss': 0.5408, 'learning_rate': 1.1003887247439777e-05, 'epoch': 0.97} {'loss': 0.5138, 'learning_rate': 1.1003552966479986e-05, 'epoch': 0.97} {'loss': 0.6394, 'learning_rate': 1.1003218684387377e-05, 'epoch': 0.97} {'loss': 0.5603, 'learning_rate': 1.1002884401162326e-05, 'epoch': 0.97} {'loss': 0.4843, 'learning_rate': 1.1002550116805208e-05, 'epoch': 0.97} {'loss': 0.4528, 'learning_rate': 1.1002215831316402e-05, 'epoch': 0.97} {'loss': 0.4977, 'learning_rate': 1.1001881544696285e-05, 'epoch': 0.97} {'loss': 0.552, 'learning_rate': 1.1001547256945234e-05, 'epoch': 0.97} {'loss': 0.6525, 'learning_rate': 1.1001212968063625e-05, 'epoch': 0.97} {'loss': 0.6785, 'learning_rate': 1.100087867805184e-05, 'epoch': 0.97} {'loss': 0.4843, 'learning_rate': 1.100054438691025e-05, 'epoch': 0.97} {'loss': 0.6159, 'learning_rate': 1.1000210094639236e-05, 'epoch': 0.97} {'loss': 0.3963, 'learning_rate': 1.0999875801239178e-05, 'epoch': 0.97} {'loss': 0.578, 'learning_rate': 1.0999541506710448e-05, 'epoch': 0.97} {'loss': 0.5094, 'learning_rate': 1.0999207211053425e-05, 'epoch': 0.97} {'loss': 0.5826, 'learning_rate': 1.0998872914268489e-05, 'epoch': 0.97} {'loss': 0.4857, 'learning_rate': 1.0998538616356013e-05, 'epoch': 0.97} {'loss': 0.685, 'learning_rate': 1.0998204317316379e-05, 'epoch': 0.97} {'loss': 0.5595, 'learning_rate': 1.0997870017149962e-05, 'epoch': 0.97} {'loss': 0.3492, 'learning_rate': 1.0997535715857139e-05, 'epoch': 0.97} {'loss': 0.4997, 'learning_rate': 1.0997201413438287e-05, 'epoch': 0.97} {'loss': 0.6502, 'learning_rate': 1.0996867109893788e-05, 'epoch': 0.97} {'loss': 0.5088, 'learning_rate': 1.0996532805224012e-05, 'epoch': 0.97} {'loss': 0.6037, 'learning_rate': 1.099619849942934e-05, 'epoch': 0.97} {'loss': 0.3551, 'learning_rate': 1.0995864192510149e-05, 'epoch': 0.97} {'loss': 0.542, 'learning_rate': 1.0995529884466817e-05, 'epoch': 0.97} {'loss': 0.4124, 'learning_rate': 1.0995195575299722e-05, 'epoch': 0.97} {'loss': 0.5105, 'learning_rate': 1.099486126500924e-05, 'epoch': 0.97} {'loss': 0.6063, 'learning_rate': 1.099452695359575e-05, 'epoch': 0.97} {'loss': 0.5787, 'learning_rate': 1.0994192641059627e-05, 'epoch': 0.97} {'loss': 0.5888, 'learning_rate': 1.099385832740125e-05, 'epoch': 0.97} {'loss': 0.4917, 'learning_rate': 1.0993524012620997e-05, 'epoch': 0.97} {'loss': 0.5206, 'learning_rate': 1.0993189696719243e-05, 'epoch': 0.97} {'loss': 0.706, 'learning_rate': 1.0992855379696366e-05, 'epoch': 0.97} {'loss': 0.4615, 'learning_rate': 1.0992521061552745e-05, 'epoch': 0.97} {'loss': 0.5549, 'learning_rate': 1.0992186742288754e-05, 'epoch': 0.97} {'loss': 0.6791, 'learning_rate': 1.0991852421904776e-05, 'epoch': 0.97} {'loss': 0.7073, 'learning_rate': 1.0991518100401186e-05, 'epoch': 0.97} {'loss': 0.5655, 'learning_rate': 1.0991183777778359e-05, 'epoch': 0.97} {'loss': 0.5386, 'learning_rate': 1.0990849454036674e-05, 'epoch': 0.97} {'loss': 0.5979, 'learning_rate': 1.0990515129176504e-05, 'epoch': 0.97} {'loss': 0.5308, 'learning_rate': 1.0990180803198239e-05, 'epoch': 0.97} {'loss': 0.4698, 'learning_rate': 1.0989846476102244e-05, 'epoch': 0.97} {'loss': 0.6684, 'learning_rate': 1.0989512147888898e-05, 'epoch': 0.97} {'loss': 0.6603, 'learning_rate': 1.0989177818558585e-05, 'epoch': 0.97} {'loss': 0.6839, 'learning_rate': 1.0988843488111679e-05, 'epoch': 0.97} {'loss': 0.4878, 'learning_rate': 1.0988509156548553e-05, 'epoch': 0.97} {'loss': 0.4761, 'learning_rate': 1.0988174823869591e-05, 'epoch': 0.97} {'loss': 0.5092, 'learning_rate': 1.0987840490075165e-05, 'epoch': 0.97} {'loss': 0.709, 'learning_rate': 1.0987506155165657e-05, 'epoch': 0.97} {'loss': 0.5209, 'learning_rate': 1.0987171819141443e-05, 'epoch': 0.97} {'loss': 0.4393, 'learning_rate': 1.0986837482002897e-05, 'epoch': 0.97} {'loss': 0.3621, 'learning_rate': 1.09865031437504e-05, 'epoch': 0.97} {'loss': 0.6751, 'learning_rate': 1.098616880438433e-05, 'epoch': 0.97} {'loss': 0.6024, 'learning_rate': 1.098583446390506e-05, 'epoch': 0.97} {'loss': 0.3495, 'learning_rate': 1.0985500122312976e-05, 'epoch': 0.97} {'loss': 0.6963, 'learning_rate': 1.0985165779608446e-05, 'epoch': 0.97} {'loss': 0.5812, 'learning_rate': 1.0984831435791851e-05, 'epoch': 0.97} {'loss': 0.5136, 'learning_rate': 1.0984497090863569e-05, 'epoch': 0.97} {'loss': 0.5827, 'learning_rate': 1.0984162744823977e-05, 'epoch': 0.97} {'loss': 0.5163, 'learning_rate': 1.0983828397673452e-05, 'epoch': 0.97} {'loss': 0.5724, 'learning_rate': 1.0983494049412373e-05, 'epoch': 0.97} {'loss': 0.6252, 'learning_rate': 1.0983159700041114e-05, 'epoch': 0.97} {'loss': 0.4162, 'learning_rate': 1.0982825349560056e-05, 'epoch': 0.97} {'loss': 0.6061, 'learning_rate': 1.0982490997969575e-05, 'epoch': 0.97} {'loss': 0.5993, 'learning_rate': 1.0982156645270051e-05, 'epoch': 0.97} {'loss': 0.5667, 'learning_rate': 1.0981822291461854e-05, 'epoch': 0.97} {'loss': 0.5138, 'learning_rate': 1.0981487936545369e-05, 'epoch': 0.97} {'loss': 0.6627, 'learning_rate': 1.0981153580520973e-05, 'epoch': 0.97} {'loss': 0.6191, 'learning_rate': 1.0980819223389038e-05, 'epoch': 0.97} {'loss': 0.6412, 'learning_rate': 1.0980484865149947e-05, 'epoch': 0.97} {'loss': 0.342, 'learning_rate': 1.0980150505804073e-05, 'epoch': 0.97} {'loss': 0.6415, 'learning_rate': 1.0979816145351796e-05, 'epoch': 0.97} {'loss': 0.6567, 'learning_rate': 1.0979481783793493e-05, 'epoch': 0.97} {'loss': 0.5433, 'learning_rate': 1.0979147421129541e-05, 'epoch': 0.97} {'loss': 0.5607, 'learning_rate': 1.0978813057360319e-05, 'epoch': 0.97} {'loss': 0.5755, 'learning_rate': 1.09784786924862e-05, 'epoch': 0.97} {'loss': 0.6526, 'learning_rate': 1.0978144326507567e-05, 'epoch': 0.97} {'loss': 0.6938, 'learning_rate': 1.0977809959424795e-05, 'epoch': 0.97} {'loss': 0.6119, 'learning_rate': 1.097747559123826e-05, 'epoch': 0.97} {'loss': 0.4948, 'learning_rate': 1.0977141221948344e-05, 'epoch': 0.97} {'loss': 0.4484, 'learning_rate': 1.0976806851555422e-05, 'epoch': 0.97} {'loss': 0.3879, 'learning_rate': 1.0976472480059867e-05, 'epoch': 0.97} {'loss': 0.5878, 'learning_rate': 1.0976138107462062e-05, 'epoch': 0.97} {'loss': 0.5932, 'learning_rate': 1.0975803733762383e-05, 'epoch': 0.97} {'loss': 0.5904, 'learning_rate': 1.0975469358961206e-05, 'epoch': 0.97} {'loss': 0.4649, 'learning_rate': 1.097513498305891e-05, 'epoch': 0.97} {'loss': 0.5587, 'learning_rate': 1.097480060605587e-05, 'epoch': 0.97} {'loss': 0.5257, 'learning_rate': 1.097446622795247e-05, 'epoch': 0.97} {'loss': 0.4353, 'learning_rate': 1.0974131848749079e-05, 'epoch': 0.97} {'loss': 0.5625, 'learning_rate': 1.097379746844608e-05, 'epoch': 0.97} {'loss': 0.5458, 'learning_rate': 1.097346308704385e-05, 'epoch': 0.97} {'loss': 0.5192, 'learning_rate': 1.0973128704542764e-05, 'epoch': 0.97} {'loss': 0.7071, 'learning_rate': 1.0972794320943199e-05, 'epoch': 0.97} {'loss': 0.5708, 'learning_rate': 1.0972459936245537e-05, 'epoch': 0.97} {'loss': 0.5312, 'learning_rate': 1.097212555045015e-05, 'epoch': 0.97} {'loss': 0.6074, 'learning_rate': 1.0971791163557421e-05, 'epoch': 0.97} {'loss': 0.5843, 'learning_rate': 1.0971456775567723e-05, 'epoch': 0.97} {'loss': 0.5429, 'learning_rate': 1.0971122386481434e-05, 'epoch': 0.97} {'loss': 0.4406, 'learning_rate': 1.0970787996298934e-05, 'epoch': 0.97} {'loss': 0.5227, 'learning_rate': 1.0970453605020599e-05, 'epoch': 0.97} {'loss': 0.5734, 'learning_rate': 1.0970119212646805e-05, 'epoch': 0.97} {'loss': 0.5572, 'learning_rate': 1.0969784819177932e-05, 'epoch': 0.97} {'loss': 0.4732, 'learning_rate': 1.096945042461436e-05, 'epoch': 0.97} {'loss': 0.5127, 'learning_rate': 1.0969116028956458e-05, 'epoch': 0.97} {'loss': 0.5143, 'learning_rate': 1.0968781632204611e-05, 'epoch': 0.97} {'loss': 0.5298, 'learning_rate': 1.0968447234359192e-05, 'epoch': 0.97} {'loss': 0.7135, 'learning_rate': 1.0968112835420582e-05, 'epoch': 0.97} {'loss': 0.6612, 'learning_rate': 1.0967778435389153e-05, 'epoch': 0.97} {'loss': 0.5326, 'learning_rate': 1.096744403426529e-05, 'epoch': 0.97} {'loss': 0.5855, 'learning_rate': 1.0967109632049365e-05, 'epoch': 0.97} {'loss': 0.4756, 'learning_rate': 1.0966775228741757e-05, 'epoch': 0.97} {'loss': 0.4669, 'learning_rate': 1.0966440824342844e-05, 'epoch': 0.97} {'loss': 0.6836, 'learning_rate': 1.0966106418853001e-05, 'epoch': 0.97} {'loss': 0.388, 'learning_rate': 1.096577201227261e-05, 'epoch': 0.97} {'loss': 0.7011, 'learning_rate': 1.0965437604602044e-05, 'epoch': 0.97} {'loss': 0.5721, 'learning_rate': 1.0965103195841686e-05, 'epoch': 0.97} {'loss': 0.4341, 'learning_rate': 1.096476878599191e-05, 'epoch': 0.97} {'loss': 0.573, 'learning_rate': 1.0964434375053093e-05, 'epoch': 0.97} {'loss': 0.5167, 'learning_rate': 1.096409996302561e-05, 'epoch': 0.97} {'loss': 0.4358, 'learning_rate': 1.0963765549909842e-05, 'epoch': 0.97} {'loss': 0.4629, 'learning_rate': 1.0963431135706168e-05, 'epoch': 0.97} {'loss': 0.572, 'learning_rate': 1.0963096720414963e-05, 'epoch': 0.97} {'loss': 0.4003, 'learning_rate': 1.0962762304036602e-05, 'epoch': 0.97} {'loss': 0.5871, 'learning_rate': 1.096242788657147e-05, 'epoch': 0.97} {'loss': 0.6935, 'learning_rate': 1.0962093468019936e-05, 'epoch': 0.97} {'loss': 0.5776, 'learning_rate': 1.0961759048382383e-05, 'epoch': 0.97} {'loss': 0.5738, 'learning_rate': 1.0961424627659187e-05, 'epoch': 0.97} {'loss': 0.5206, 'learning_rate': 1.0961090205850726e-05, 'epoch': 0.97} {'loss': 0.6482, 'learning_rate': 1.0960755782957377e-05, 'epoch': 0.97} {'loss': 0.6705, 'learning_rate': 1.0960421358979516e-05, 'epoch': 0.97} {'loss': 0.5241, 'learning_rate': 1.0960086933917525e-05, 'epoch': 0.97} {'loss': 0.6201, 'learning_rate': 1.0959752507771778e-05, 'epoch': 0.97} {'loss': 0.5955, 'learning_rate': 1.095941808054265e-05, 'epoch': 0.97} {'loss': 0.7973, 'learning_rate': 1.0959083652230523e-05, 'epoch': 0.97} {'loss': 0.5349, 'learning_rate': 1.0958749222835772e-05, 'epoch': 0.97} {'loss': 0.7035, 'learning_rate': 1.0958414792358776e-05, 'epoch': 0.97} {'loss': 0.4002, 'learning_rate': 1.095808036079991e-05, 'epoch': 0.97} {'loss': 0.5862, 'learning_rate': 1.0957745928159555e-05, 'epoch': 0.97} {'loss': 0.5796, 'learning_rate': 1.0957411494438088e-05, 'epoch': 0.97} {'loss': 0.5302, 'learning_rate': 1.0957077059635884e-05, 'epoch': 0.97} {'loss': 0.5688, 'learning_rate': 1.0956742623753325e-05, 'epoch': 0.97} {'loss': 0.5686, 'learning_rate': 1.0956408186790781e-05, 'epoch': 0.97} {'loss': 0.5188, 'learning_rate': 1.0956073748748637e-05, 'epoch': 0.97} {'loss': 0.6398, 'learning_rate': 1.0955739309627267e-05, 'epoch': 0.97} {'loss': 0.5938, 'learning_rate': 1.095540486942705e-05, 'epoch': 0.97} {'loss': 0.538, 'learning_rate': 1.095507042814836e-05, 'epoch': 0.97} {'loss': 0.6077, 'learning_rate': 1.0954735985791578e-05, 'epoch': 0.97} {'loss': 0.5078, 'learning_rate': 1.0954401542357082e-05, 'epoch': 0.97} {'loss': 0.5114, 'learning_rate': 1.0954067097845247e-05, 'epoch': 0.97} {'loss': 0.5704, 'learning_rate': 1.0953732652256453e-05, 'epoch': 0.97} {'loss': 0.467, 'learning_rate': 1.0953398205591075e-05, 'epoch': 0.97} {'loss': 0.5605, 'learning_rate': 1.0953063757849491e-05, 'epoch': 0.97} {'loss': 0.3512, 'learning_rate': 1.095272930903208e-05, 'epoch': 0.97} {'loss': 0.4599, 'learning_rate': 1.0952394859139222e-05, 'epoch': 0.97} {'loss': 0.5039, 'learning_rate': 1.0952060408171288e-05, 'epoch': 0.97} {'loss': 0.6417, 'learning_rate': 1.0951725956128659e-05, 'epoch': 0.97} {'loss': 0.5176, 'learning_rate': 1.0951391503011712e-05, 'epoch': 0.97} {'loss': 0.4328, 'learning_rate': 1.0951057048820826e-05, 'epoch': 0.97} {'loss': 0.656, 'learning_rate': 1.0950722593556376e-05, 'epoch': 0.97} {'loss': 0.6035, 'learning_rate': 1.0950388137218741e-05, 'epoch': 0.97} {'loss': 0.5395, 'learning_rate': 1.0950053679808301e-05, 'epoch': 0.97} {'loss': 0.5396, 'learning_rate': 1.0949719221325428e-05, 'epoch': 0.97} {'loss': 0.4415, 'learning_rate': 1.0949384761770506e-05, 'epoch': 0.97} {'loss': 0.5495, 'learning_rate': 1.0949050301143906e-05, 'epoch': 0.97} {'loss': 0.5472, 'learning_rate': 1.0948715839446009e-05, 'epoch': 0.97} {'loss': 0.5348, 'learning_rate': 1.0948381376677193e-05, 'epoch': 0.97} {'loss': 0.5251, 'learning_rate': 1.0948046912837838e-05, 'epoch': 0.97} {'loss': 0.6524, 'learning_rate': 1.0947712447928314e-05, 'epoch': 0.97} {'loss': 0.6833, 'learning_rate': 1.0947377981949004e-05, 'epoch': 0.97} {'loss': 0.4899, 'learning_rate': 1.0947043514900285e-05, 'epoch': 0.97} {'loss': 0.6303, 'learning_rate': 1.0946709046782534e-05, 'epoch': 0.97} {'loss': 0.4513, 'learning_rate': 1.0946374577596127e-05, 'epoch': 0.97} {'loss': 0.5676, 'learning_rate': 1.0946040107341444e-05, 'epoch': 0.97} {'loss': 0.5924, 'learning_rate': 1.0945705636018862e-05, 'epoch': 0.97} {'loss': 0.5203, 'learning_rate': 1.0945371163628757e-05, 'epoch': 0.97} {'loss': 0.4855, 'learning_rate': 1.0945036690171508e-05, 'epoch': 0.97} {'loss': 0.5012, 'learning_rate': 1.0944702215647493e-05, 'epoch': 0.97} {'loss': 0.4788, 'learning_rate': 1.0944367740057088e-05, 'epoch': 0.97} {'loss': 0.6666, 'learning_rate': 1.0944033263400673e-05, 'epoch': 0.97} {'loss': 0.6903, 'learning_rate': 1.0943698785678625e-05, 'epoch': 0.97} {'loss': 0.4446, 'learning_rate': 1.0943364306891318e-05, 'epoch': 0.97} {'loss': 0.5724, 'learning_rate': 1.0943029827039134e-05, 'epoch': 0.97} {'loss': 0.697, 'learning_rate': 1.0942695346122446e-05, 'epoch': 0.97} {'loss': 0.5901, 'learning_rate': 1.0942360864141635e-05, 'epoch': 0.97} {'loss': 0.6582, 'learning_rate': 1.0942026381097078e-05, 'epoch': 0.97} {'loss': 0.5644, 'learning_rate': 1.0941691896989152e-05, 'epoch': 0.97} {'loss': 0.4713, 'learning_rate': 1.0941357411818236e-05, 'epoch': 0.97} {'loss': 0.5151, 'learning_rate': 1.0941022925584705e-05, 'epoch': 0.97} {'loss': 0.4537, 'learning_rate': 1.0940688438288937e-05, 'epoch': 0.97} {'loss': 0.6586, 'learning_rate': 1.0940353949931312e-05, 'epoch': 0.97} {'loss': 0.5135, 'learning_rate': 1.094001946051221e-05, 'epoch': 0.97} {'loss': 0.5728, 'learning_rate': 1.0939684970032003e-05, 'epoch': 0.97} {'loss': 0.516, 'learning_rate': 1.0939350478491069e-05, 'epoch': 0.97} {'loss': 0.2865, 'learning_rate': 1.0939015985889785e-05, 'epoch': 0.97} {'loss': 0.7206, 'learning_rate': 1.0938681492228534e-05, 'epoch': 0.97} {'loss': 0.5524, 'learning_rate': 1.0938346997507687e-05, 'epoch': 0.97} {'loss': 0.552, 'learning_rate': 1.0938012501727626e-05, 'epoch': 0.97} {'loss': 0.69, 'learning_rate': 1.0937678004888727e-05, 'epoch': 0.97} {'loss': 0.4377, 'learning_rate': 1.093734350699137e-05, 'epoch': 0.97} {'loss': 0.5984, 'learning_rate': 1.0937009008035929e-05, 'epoch': 0.97} {'loss': 0.505, 'learning_rate': 1.0936674508022783e-05, 'epoch': 0.97} {'loss': 0.6523, 'learning_rate': 1.093634000695231e-05, 'epoch': 0.97} {'loss': 0.6663, 'learning_rate': 1.0936005504824884e-05, 'epoch': 0.97} {'loss': 0.4973, 'learning_rate': 1.0935671001640891e-05, 'epoch': 0.97} {'loss': 0.5692, 'learning_rate': 1.0935336497400702e-05, 'epoch': 0.97} {'loss': 0.6732, 'learning_rate': 1.0935001992104692e-05, 'epoch': 0.97} {'loss': 0.5202, 'learning_rate': 1.0934667485753245e-05, 'epoch': 0.97} {'loss': 0.3186, 'learning_rate': 1.0934332978346738e-05, 'epoch': 0.97} {'loss': 0.4589, 'learning_rate': 1.0933998469885544e-05, 'epoch': 0.97} {'loss': 0.5038, 'learning_rate': 1.0933663960370044e-05, 'epoch': 0.97} {'loss': 0.5361, 'learning_rate': 1.0933329449800616e-05, 'epoch': 0.97} {'loss': 0.4993, 'learning_rate': 1.0932994938177637e-05, 'epoch': 0.97} {'loss': 0.6087, 'learning_rate': 1.0932660425501482e-05, 'epoch': 0.97} {'loss': 0.3955, 'learning_rate': 1.0932325911772533e-05, 'epoch': 0.97} {'loss': 0.6428, 'learning_rate': 1.0931991396991161e-05, 'epoch': 0.97} {'loss': 0.5768, 'learning_rate': 1.0931656881157754e-05, 'epoch': 0.97} {'loss': 0.4835, 'learning_rate': 1.093132236427268e-05, 'epoch': 0.97} {'loss': 0.4767, 'learning_rate': 1.093098784633632e-05, 'epoch': 0.97} {'loss': 0.5722, 'learning_rate': 1.0930653327349054e-05, 'epoch': 0.97} {'loss': 0.653, 'learning_rate': 1.0930318807311256e-05, 'epoch': 0.97} {'loss': 0.618, 'learning_rate': 1.0929984286223305e-05, 'epoch': 0.97} {'loss': 0.59, 'learning_rate': 1.0929649764085577e-05, 'epoch': 0.97} {'loss': 0.6039, 'learning_rate': 1.0929315240898452e-05, 'epoch': 0.97} {'loss': 0.6175, 'learning_rate': 1.092898071666231e-05, 'epoch': 0.97} {'loss': 0.5884, 'learning_rate': 1.0928646191377521e-05, 'epoch': 0.97} {'loss': 0.6211, 'learning_rate': 1.092831166504447e-05, 'epoch': 0.97} {'loss': 0.689, 'learning_rate': 1.092797713766353e-05, 'epoch': 0.97} {'loss': 0.5163, 'learning_rate': 1.0927642609235081e-05, 'epoch': 0.97} {'loss': 0.6383, 'learning_rate': 1.09273080797595e-05, 'epoch': 0.97} {'loss': 0.6006, 'learning_rate': 1.0926973549237166e-05, 'epoch': 0.97} {'loss': 0.5782, 'learning_rate': 1.0926639017668453e-05, 'epoch': 0.97} {'loss': 0.5454, 'learning_rate': 1.092630448505374e-05, 'epoch': 0.97} {'loss': 0.4998, 'learning_rate': 1.0925969951393407e-05, 'epoch': 0.97} {'loss': 0.6207, 'learning_rate': 1.092563541668783e-05, 'epoch': 0.97} {'loss': 0.5731, 'learning_rate': 1.0925300880937386e-05, 'epoch': 0.97} {'loss': 0.4525, 'learning_rate': 1.0924966344142454e-05, 'epoch': 0.97} {'loss': 0.5169, 'learning_rate': 1.0924631806303409e-05, 'epoch': 0.97} {'loss': 0.4632, 'learning_rate': 1.092429726742063e-05, 'epoch': 0.97} {'loss': 0.5392, 'learning_rate': 1.0923962727494498e-05, 'epoch': 0.97} {'loss': 0.5489, 'learning_rate': 1.0923628186525388e-05, 'epoch': 0.97} {'loss': 0.4338, 'learning_rate': 1.0923293644513675e-05, 'epoch': 0.97} {'loss': 0.5679, 'learning_rate': 1.092295910145974e-05, 'epoch': 0.97} {'loss': 0.3197, 'learning_rate': 1.0922624557363961e-05, 'epoch': 0.97} {'loss': 0.6126, 'learning_rate': 1.0922290012226714e-05, 'epoch': 0.97} {'loss': 0.5113, 'learning_rate': 1.0921955466048375e-05, 'epoch': 0.97} {'loss': 0.5088, 'learning_rate': 1.0921620918829324e-05, 'epoch': 0.97} {'loss': 0.5224, 'learning_rate': 1.0921286370569938e-05, 'epoch': 0.97} {'loss': 0.7109, 'learning_rate': 1.0920951821270596e-05, 'epoch': 0.97} {'loss': 0.5372, 'learning_rate': 1.0920617270931676e-05, 'epoch': 0.97} {'loss': 0.7571, 'learning_rate': 1.0920282719553552e-05, 'epoch': 0.97} {'loss': 0.5775, 'learning_rate': 1.0919948167136602e-05, 'epoch': 0.97} {'loss': 0.5027, 'learning_rate': 1.0919613613681208e-05, 'epoch': 0.97} {'loss': 0.6578, 'learning_rate': 1.0919279059187748e-05, 'epoch': 0.97} {'loss': 0.5241, 'learning_rate': 1.0918944503656594e-05, 'epoch': 0.97} {'loss': 0.5242, 'learning_rate': 1.0918609947088125e-05, 'epoch': 0.97} {'loss': 0.5963, 'learning_rate': 1.0918275389482722e-05, 'epoch': 0.97} {'loss': 0.4772, 'learning_rate': 1.091794083084076e-05, 'epoch': 0.97} {'loss': 0.3454, 'learning_rate': 1.0917606271162617e-05, 'epoch': 0.97} {'loss': 0.5299, 'learning_rate': 1.0917271710448671e-05, 'epoch': 0.97} {'loss': 0.5117, 'learning_rate': 1.09169371486993e-05, 'epoch': 0.97} {'loss': 0.6941, 'learning_rate': 1.0916602585914879e-05, 'epoch': 0.97} {'loss': 0.5558, 'learning_rate': 1.0916268022095791e-05, 'epoch': 0.97} {'loss': 0.6143, 'learning_rate': 1.0915933457242409e-05, 'epoch': 0.97} {'loss': 0.6557, 'learning_rate': 1.0915598891355114e-05, 'epoch': 0.97} {'loss': 0.4393, 'learning_rate': 1.091526432443428e-05, 'epoch': 0.97} {'loss': 0.7312, 'learning_rate': 1.091492975648029e-05, 'epoch': 0.97} {'loss': 0.5868, 'learning_rate': 1.0914595187493518e-05, 'epoch': 0.97} {'loss': 0.5323, 'learning_rate': 1.0914260617474339e-05, 'epoch': 0.97} {'loss': 0.6784, 'learning_rate': 1.0913926046423133e-05, 'epoch': 0.97} {'loss': 0.5281, 'learning_rate': 1.0913591474340282e-05, 'epoch': 0.97} {'loss': 0.4237, 'learning_rate': 1.0913256901226157e-05, 'epoch': 0.97} {'loss': 0.6317, 'learning_rate': 1.091292232708114e-05, 'epoch': 0.97} {'loss': 0.4996, 'learning_rate': 1.0912587751905605e-05, 'epoch': 0.97} {'loss': 0.6662, 'learning_rate': 1.0912253175699934e-05, 'epoch': 0.97} {'loss': 0.3657, 'learning_rate': 1.0911918598464502e-05, 'epoch': 0.97} {'loss': 0.5893, 'learning_rate': 1.0911584020199688e-05, 'epoch': 0.97} {'loss': 0.6059, 'learning_rate': 1.0911249440905869e-05, 'epoch': 0.97} {'loss': 0.6209, 'learning_rate': 1.0910914860583422e-05, 'epoch': 0.97} {'loss': 0.4336, 'learning_rate': 1.0910580279232726e-05, 'epoch': 0.97} {'loss': 0.6496, 'learning_rate': 1.0910245696854159e-05, 'epoch': 0.97} {'loss': 0.6513, 'learning_rate': 1.0909911113448095e-05, 'epoch': 0.97} {'loss': 0.5794, 'learning_rate': 1.0909576529014916e-05, 'epoch': 0.97} {'loss': 0.7255, 'learning_rate': 1.0909241943554997e-05, 'epoch': 0.97} {'loss': 0.5625, 'learning_rate': 1.0908907357068718e-05, 'epoch': 0.97} {'loss': 0.4551, 'learning_rate': 1.0908572769556456e-05, 'epoch': 0.97} {'loss': 0.6288, 'learning_rate': 1.0908238181018587e-05, 'epoch': 0.97} {'loss': 0.6288, 'learning_rate': 1.0907903591455488e-05, 'epoch': 0.98} {'loss': 0.5275, 'learning_rate': 1.0907569000867542e-05, 'epoch': 0.98} {'loss': 0.5941, 'learning_rate': 1.0907234409255118e-05, 'epoch': 0.98} {'loss': 0.3695, 'learning_rate': 1.0906899816618606e-05, 'epoch': 0.98} {'loss': 0.6196, 'learning_rate': 1.0906565222958371e-05, 'epoch': 0.98} {'loss': 0.5223, 'learning_rate': 1.0906230628274799e-05, 'epoch': 0.98} {'loss': 0.4958, 'learning_rate': 1.0905896032568263e-05, 'epoch': 0.98} {'loss': 0.5726, 'learning_rate': 1.0905561435839146e-05, 'epoch': 0.98} {'loss': 0.6592, 'learning_rate': 1.0905226838087818e-05, 'epoch': 0.98} {'loss': 0.5804, 'learning_rate': 1.0904892239314664e-05, 'epoch': 0.98} {'loss': 0.5304, 'learning_rate': 1.0904557639520056e-05, 'epoch': 0.98} {'loss': 0.7708, 'learning_rate': 1.0904223038704379e-05, 'epoch': 0.98} {'loss': 0.5069, 'learning_rate': 1.0903888436868003e-05, 'epoch': 0.98} {'loss': 0.5893, 'learning_rate': 1.090355383401131e-05, 'epoch': 0.98} {'loss': 0.5344, 'learning_rate': 1.0903219230134674e-05, 'epoch': 0.98} {'loss': 0.6212, 'learning_rate': 1.0902884625238476e-05, 'epoch': 0.98} {'loss': 0.7271, 'learning_rate': 1.0902550019323098e-05, 'epoch': 0.98} {'loss': 0.5533, 'learning_rate': 1.0902215412388908e-05, 'epoch': 0.98} {'loss': 0.5549, 'learning_rate': 1.0901880804436289e-05, 'epoch': 0.98} {'loss': 0.7793, 'learning_rate': 1.0901546195465617e-05, 'epoch': 0.98} {'loss': 0.6577, 'learning_rate': 1.0901211585477274e-05, 'epoch': 0.98} {'loss': 0.6186, 'learning_rate': 1.0900876974471631e-05, 'epoch': 0.98} {'loss': 0.5656, 'learning_rate': 1.090054236244907e-05, 'epoch': 0.98} {'loss': 0.5103, 'learning_rate': 1.090020774940997e-05, 'epoch': 0.98} {'loss': 0.5972, 'learning_rate': 1.0899873135354704e-05, 'epoch': 0.98} {'loss': 0.5913, 'learning_rate': 1.0899538520283654e-05, 'epoch': 0.98} {'loss': 0.4485, 'learning_rate': 1.0899203904197196e-05, 'epoch': 0.98} {'loss': 0.5631, 'learning_rate': 1.0898869287095705e-05, 'epoch': 0.98} {'loss': 0.593, 'learning_rate': 1.0898534668979566e-05, 'epoch': 0.98} {'loss': 0.4965, 'learning_rate': 1.0898200049849153e-05, 'epoch': 0.98} {'loss': 0.3428, 'learning_rate': 1.0897865429704839e-05, 'epoch': 0.98} {'loss': 0.5217, 'learning_rate': 1.0897530808547005e-05, 'epoch': 0.98} {'loss': 0.5768, 'learning_rate': 1.0897196186376031e-05, 'epoch': 0.98} {'loss': 0.4127, 'learning_rate': 1.0896861563192294e-05, 'epoch': 0.98} {'loss': 0.5756, 'learning_rate': 1.089652693899617e-05, 'epoch': 0.98} {'loss': 0.5995, 'learning_rate': 1.0896192313788037e-05, 'epoch': 0.98} {'loss': 0.617, 'learning_rate': 1.0895857687568274e-05, 'epoch': 0.98} {'loss': 0.5571, 'learning_rate': 1.089552306033726e-05, 'epoch': 0.98} {'loss': 0.6573, 'learning_rate': 1.0895188432095366e-05, 'epoch': 0.98} {'loss': 0.6847, 'learning_rate': 1.0894853802842977e-05, 'epoch': 0.98} {'loss': 0.4674, 'learning_rate': 1.0894519172580468e-05, 'epoch': 0.98} {'loss': 0.4195, 'learning_rate': 1.0894184541308219e-05, 'epoch': 0.98} {'loss': 0.3889, 'learning_rate': 1.0893849909026606e-05, 'epoch': 0.98} {'loss': 0.7183, 'learning_rate': 1.0893515275736003e-05, 'epoch': 0.98} {'loss': 0.6735, 'learning_rate': 1.0893180641436793e-05, 'epoch': 0.98} {'loss': 0.6677, 'learning_rate': 1.0892846006129352e-05, 'epoch': 0.98} {'loss': 0.5508, 'learning_rate': 1.0892511369814057e-05, 'epoch': 0.98} {'loss': 0.4901, 'learning_rate': 1.0892176732491287e-05, 'epoch': 0.98} {'loss': 0.4159, 'learning_rate': 1.0891842094161418e-05, 'epoch': 0.98} {'loss': 0.3642, 'learning_rate': 1.089150745482483e-05, 'epoch': 0.98} {'loss': 0.7166, 'learning_rate': 1.0891172814481898e-05, 'epoch': 0.98} {'loss': 0.5376, 'learning_rate': 1.0890838173133e-05, 'epoch': 0.98} {'loss': 0.445, 'learning_rate': 1.0890503530778517e-05, 'epoch': 0.98} {'loss': 0.5531, 'learning_rate': 1.0890168887418828e-05, 'epoch': 0.98} {'loss': 0.5471, 'learning_rate': 1.0889834243054307e-05, 'epoch': 0.98} {'loss': 0.6669, 'learning_rate': 1.0889499597685328e-05, 'epoch': 0.98} {'loss': 0.5654, 'learning_rate': 1.0889164951312277e-05, 'epoch': 0.98} {'loss': 0.5713, 'learning_rate': 1.0888830303935527e-05, 'epoch': 0.98} {'loss': 0.4154, 'learning_rate': 1.0888495655555456e-05, 'epoch': 0.98} {'loss': 0.4244, 'learning_rate': 1.0888161006172441e-05, 'epoch': 0.98} {'loss': 0.5025, 'learning_rate': 1.0887826355786864e-05, 'epoch': 0.98} {'loss': 0.4769, 'learning_rate': 1.0887491704399098e-05, 'epoch': 0.98} {'loss': 0.7334, 'learning_rate': 1.0887157052009523e-05, 'epoch': 0.98} {'loss': 0.7406, 'learning_rate': 1.0886822398618515e-05, 'epoch': 0.98} {'loss': 0.7357, 'learning_rate': 1.0886487744226455e-05, 'epoch': 0.98} {'loss': 0.4101, 'learning_rate': 1.0886153088833718e-05, 'epoch': 0.98} {'loss': 0.6478, 'learning_rate': 1.0885818432440685e-05, 'epoch': 0.98} {'loss': 0.656, 'learning_rate': 1.088548377504773e-05, 'epoch': 0.98} {'loss': 0.4202, 'learning_rate': 1.0885149116655232e-05, 'epoch': 0.98} {'loss': 0.6038, 'learning_rate': 1.0884814457263568e-05, 'epoch': 0.98} {'loss': 0.5711, 'learning_rate': 1.0884479796873118e-05, 'epoch': 0.98} {'loss': 0.5667, 'learning_rate': 1.0884145135484256e-05, 'epoch': 0.98} {'loss': 0.4017, 'learning_rate': 1.0883810473097366e-05, 'epoch': 0.98} {'loss': 0.4541, 'learning_rate': 1.088347580971282e-05, 'epoch': 0.98} {'loss': 0.5955, 'learning_rate': 1.0883141145330997e-05, 'epoch': 0.98} {'loss': 0.5202, 'learning_rate': 1.0882806479952276e-05, 'epoch': 0.98} {'loss': 0.7109, 'learning_rate': 1.0882471813577035e-05, 'epoch': 0.98} {'loss': 0.604, 'learning_rate': 1.088213714620565e-05, 'epoch': 0.98} {'loss': 0.4083, 'learning_rate': 1.0881802477838503e-05, 'epoch': 0.98} {'loss': 0.4301, 'learning_rate': 1.0881467808475969e-05, 'epoch': 0.98} {'loss': 0.5721, 'learning_rate': 1.0881133138118422e-05, 'epoch': 0.98} {'loss': 0.4664, 'learning_rate': 1.0880798466766244e-05, 'epoch': 0.98} {'loss': 0.4369, 'learning_rate': 1.0880463794419813e-05, 'epoch': 0.98} {'loss': 0.5467, 'learning_rate': 1.0880129121079506e-05, 'epoch': 0.98} {'loss': 0.5839, 'learning_rate': 1.0879794446745699e-05, 'epoch': 0.98} {'loss': 0.4056, 'learning_rate': 1.0879459771418773e-05, 'epoch': 0.98} {'loss': 0.7043, 'learning_rate': 1.0879125095099104e-05, 'epoch': 0.98} {'loss': 0.5393, 'learning_rate': 1.087879041778707e-05, 'epoch': 0.98} {'loss': 0.5674, 'learning_rate': 1.0878455739483044e-05, 'epoch': 0.98} {'loss': 0.6474, 'learning_rate': 1.0878121060187414e-05, 'epoch': 0.98} {'loss': 0.6625, 'learning_rate': 1.087778637990055e-05, 'epoch': 0.98} {'loss': 0.4607, 'learning_rate': 1.0877451698622834e-05, 'epoch': 0.98} {'loss': 0.5747, 'learning_rate': 1.0877117016354644e-05, 'epoch': 0.98} {'loss': 0.473, 'learning_rate': 1.0876782333096352e-05, 'epoch': 0.98} {'loss': 0.6487, 'learning_rate': 1.0876447648848339e-05, 'epoch': 0.98} {'loss': 0.5347, 'learning_rate': 1.0876112963610983e-05, 'epoch': 0.98} {'loss': 0.7217, 'learning_rate': 1.0875778277384664e-05, 'epoch': 0.98} {'loss': 0.5995, 'learning_rate': 1.0875443590169756e-05, 'epoch': 0.98} {'loss': 0.5417, 'learning_rate': 1.087510890196664e-05, 'epoch': 0.98} {'loss': 0.4423, 'learning_rate': 1.0874774212775695e-05, 'epoch': 0.98} {'loss': 0.5739, 'learning_rate': 1.087443952259729e-05, 'epoch': 0.98} {'loss': 0.6467, 'learning_rate': 1.0874104831431812e-05, 'epoch': 0.98} {'loss': 0.5877, 'learning_rate': 1.0873770139279639e-05, 'epoch': 0.98} {'loss': 0.4356, 'learning_rate': 1.0873435446141143e-05, 'epoch': 0.98} {'loss': 0.4776, 'learning_rate': 1.0873100752016706e-05, 'epoch': 0.98} {'loss': 0.5739, 'learning_rate': 1.0872766056906701e-05, 'epoch': 0.98} {'loss': 0.3733, 'learning_rate': 1.087243136081151e-05, 'epoch': 0.98} {'loss': 0.447, 'learning_rate': 1.087209666373151e-05, 'epoch': 0.98} {'loss': 0.607, 'learning_rate': 1.087176196566708e-05, 'epoch': 0.98} {'loss': 0.6696, 'learning_rate': 1.0871427266618597e-05, 'epoch': 0.98} {'loss': 0.56, 'learning_rate': 1.0871092566586439e-05, 'epoch': 0.98} {'loss': 0.5586, 'learning_rate': 1.087075786557098e-05, 'epoch': 0.98} {'loss': 0.5798, 'learning_rate': 1.0870423163572604e-05, 'epoch': 0.98} {'loss': 0.7167, 'learning_rate': 1.0870088460591683e-05, 'epoch': 0.98} {'loss': 0.532, 'learning_rate': 1.0869753756628598e-05, 'epoch': 0.98} {'loss': 0.5291, 'learning_rate': 1.086941905168373e-05, 'epoch': 0.98} {'loss': 0.7267, 'learning_rate': 1.086908434575745e-05, 'epoch': 0.98} {'loss': 0.3918, 'learning_rate': 1.086874963885014e-05, 'epoch': 0.98} {'loss': 0.5197, 'learning_rate': 1.0868414930962177e-05, 'epoch': 0.98} {'loss': 0.5616, 'learning_rate': 1.0868080222093937e-05, 'epoch': 0.98} {'loss': 0.4883, 'learning_rate': 1.08677455122458e-05, 'epoch': 0.98} {'loss': 0.6036, 'learning_rate': 1.0867410801418144e-05, 'epoch': 0.98} {'loss': 0.5028, 'learning_rate': 1.0867076089611347e-05, 'epoch': 0.98} {'loss': 0.4306, 'learning_rate': 1.0866741376825784e-05, 'epoch': 0.98} {'loss': 0.6519, 'learning_rate': 1.0866406663061838e-05, 'epoch': 0.98} {'loss': 0.6701, 'learning_rate': 1.0866071948319878e-05, 'epoch': 0.98} {'loss': 0.6796, 'learning_rate': 1.0865737232600293e-05, 'epoch': 0.98} {'loss': 0.595, 'learning_rate': 1.0865402515903451e-05, 'epoch': 0.98} {'loss': 0.5746, 'learning_rate': 1.0865067798229738e-05, 'epoch': 0.98} {'loss': 0.6692, 'learning_rate': 1.0864733079579528e-05, 'epoch': 0.98} {'loss': 0.5159, 'learning_rate': 1.0864398359953197e-05, 'epoch': 0.98} {'loss': 0.6708, 'learning_rate': 1.0864063639351123e-05, 'epoch': 0.98} {'loss': 0.3544, 'learning_rate': 1.0863728917773689e-05, 'epoch': 0.98} {'loss': 0.6506, 'learning_rate': 1.0863394195221266e-05, 'epoch': 0.98} {'loss': 0.6732, 'learning_rate': 1.0863059471694238e-05, 'epoch': 0.98} {'loss': 0.5693, 'learning_rate': 1.0862724747192978e-05, 'epoch': 0.98} {'loss': 0.6039, 'learning_rate': 1.0862390021717866e-05, 'epoch': 0.98} {'loss': 0.7411, 'learning_rate': 1.0862055295269281e-05, 'epoch': 0.98} {'loss': 0.6196, 'learning_rate': 1.0861720567847597e-05, 'epoch': 0.98} {'loss': 0.6012, 'learning_rate': 1.0861385839453196e-05, 'epoch': 0.98} {'loss': 0.56, 'learning_rate': 1.0861051110086454e-05, 'epoch': 0.98} {'loss': 0.6393, 'learning_rate': 1.0860716379747748e-05, 'epoch': 0.98} {'loss': 0.4899, 'learning_rate': 1.0860381648437462e-05, 'epoch': 0.98} {'loss': 0.5331, 'learning_rate': 1.0860046916155964e-05, 'epoch': 0.98} {'loss': 0.4786, 'learning_rate': 1.0859712182903638e-05, 'epoch': 0.98} {'loss': 0.608, 'learning_rate': 1.0859377448680859e-05, 'epoch': 0.98} {'loss': 0.511, 'learning_rate': 1.0859042713488005e-05, 'epoch': 0.98} {'loss': 0.5162, 'learning_rate': 1.0858707977325458e-05, 'epoch': 0.98} {'loss': 0.7396, 'learning_rate': 1.0858373240193592e-05, 'epoch': 0.98} {'loss': 0.4828, 'learning_rate': 1.0858038502092787e-05, 'epoch': 0.98} {'loss': 0.5332, 'learning_rate': 1.0857703763023416e-05, 'epoch': 0.98} {'loss': 0.5656, 'learning_rate': 1.0857369022985863e-05, 'epoch': 0.98} {'loss': 0.5691, 'learning_rate': 1.0857034281980505e-05, 'epoch': 0.98} {'loss': 0.5033, 'learning_rate': 1.0856699540007718e-05, 'epoch': 0.98} {'loss': 0.477, 'learning_rate': 1.0856364797067878e-05, 'epoch': 0.98} {'loss': 0.5081, 'learning_rate': 1.0856030053161366e-05, 'epoch': 0.98} {'loss': 0.4277, 'learning_rate': 1.085569530828856e-05, 'epoch': 0.98} {'loss': 0.5787, 'learning_rate': 1.0855360562449835e-05, 'epoch': 0.98} {'loss': 0.5239, 'learning_rate': 1.085502581564557e-05, 'epoch': 0.98} {'loss': 0.4874, 'learning_rate': 1.0854691067876145e-05, 'epoch': 0.98} {'loss': 0.443, 'learning_rate': 1.0854356319141937e-05, 'epoch': 0.98} {'loss': 0.4966, 'learning_rate': 1.085402156944332e-05, 'epoch': 0.98} {'loss': 0.5983, 'learning_rate': 1.0853686818780677e-05, 'epoch': 0.98} {'loss': 0.6421, 'learning_rate': 1.0853352067154385e-05, 'epoch': 0.98} {'loss': 0.5814, 'learning_rate': 1.085301731456482e-05, 'epoch': 0.98} {'loss': 0.426, 'learning_rate': 1.0852682561012362e-05, 'epoch': 0.98} {'loss': 0.5889, 'learning_rate': 1.0852347806497386e-05, 'epoch': 0.98} {'loss': 0.4179, 'learning_rate': 1.0852013051020272e-05, 'epoch': 0.98} {'loss': 0.6682, 'learning_rate': 1.0851678294581396e-05, 'epoch': 0.98} {'loss': 0.5431, 'learning_rate': 1.0851343537181138e-05, 'epoch': 0.98} {'loss': 0.5032, 'learning_rate': 1.0851008778819873e-05, 'epoch': 0.98} {'loss': 0.5265, 'learning_rate': 1.0850674019497985e-05, 'epoch': 0.98} {'loss': 0.7012, 'learning_rate': 1.0850339259215845e-05, 'epoch': 0.98} {'loss': 0.5263, 'learning_rate': 1.0850004497973835e-05, 'epoch': 0.98} {'loss': 0.5342, 'learning_rate': 1.084966973577233e-05, 'epoch': 0.98} {'loss': 0.5427, 'learning_rate': 1.0849334972611708e-05, 'epoch': 0.98} {'loss': 0.5373, 'learning_rate': 1.0849000208492353e-05, 'epoch': 0.98} {'loss': 0.4231, 'learning_rate': 1.0848665443414634e-05, 'epoch': 0.98} {'loss': 0.6357, 'learning_rate': 1.0848330677378937e-05, 'epoch': 0.98} {'loss': 0.5512, 'learning_rate': 1.0847995910385636e-05, 'epoch': 0.98} {'loss': 0.5159, 'learning_rate': 1.0847661142435107e-05, 'epoch': 0.98} {'loss': 0.4526, 'learning_rate': 1.084732637352773e-05, 'epoch': 0.98} {'loss': 0.5735, 'learning_rate': 1.0846991603663881e-05, 'epoch': 0.98} {'loss': 0.6252, 'learning_rate': 1.084665683284394e-05, 'epoch': 0.98} {'loss': 0.6029, 'learning_rate': 1.0846322061068284e-05, 'epoch': 0.98} {'loss': 0.5426, 'learning_rate': 1.0845987288337295e-05, 'epoch': 0.98} {'loss': 0.6025, 'learning_rate': 1.0845652514651344e-05, 'epoch': 0.98} {'loss': 0.4545, 'learning_rate': 1.0845317740010813e-05, 'epoch': 0.98} {'loss': 0.5742, 'learning_rate': 1.0844982964416077e-05, 'epoch': 0.98} {'loss': 0.5197, 'learning_rate': 1.084464818786752e-05, 'epoch': 0.98} {'loss': 0.5814, 'learning_rate': 1.0844313410365512e-05, 'epoch': 0.98} {'loss': 0.4854, 'learning_rate': 1.084397863191044e-05, 'epoch': 0.98} {'loss': 0.6075, 'learning_rate': 1.084364385250267e-05, 'epoch': 0.98} {'loss': 0.6831, 'learning_rate': 1.0843309072142589e-05, 'epoch': 0.98} {'loss': 0.5353, 'learning_rate': 1.0842974290830575e-05, 'epoch': 0.98} {'loss': 0.5808, 'learning_rate': 1.0842639508567e-05, 'epoch': 0.98} {'loss': 0.4973, 'learning_rate': 1.0842304725352247e-05, 'epoch': 0.98} {'loss': 0.662, 'learning_rate': 1.084196994118669e-05, 'epoch': 0.98} {'loss': 0.4822, 'learning_rate': 1.0841635156070712e-05, 'epoch': 0.98} {'loss': 0.4764, 'learning_rate': 1.0841300370004687e-05, 'epoch': 0.98} {'loss': 0.6872, 'learning_rate': 1.0840965582988989e-05, 'epoch': 0.98} {'loss': 0.4879, 'learning_rate': 1.0840630795024006e-05, 'epoch': 0.98} {'loss': 0.5684, 'learning_rate': 1.0840296006110112e-05, 'epoch': 0.98} {'loss': 0.5173, 'learning_rate': 1.083996121624768e-05, 'epoch': 0.98} {'loss': 0.5234, 'learning_rate': 1.0839626425437094e-05, 'epoch': 0.98} {'loss': 0.3063, 'learning_rate': 1.0839291633678728e-05, 'epoch': 0.98} {'loss': 0.5915, 'learning_rate': 1.0838956840972962e-05, 'epoch': 0.98} {'loss': 0.4417, 'learning_rate': 1.0838622047320173e-05, 'epoch': 0.98} {'loss': 0.6096, 'learning_rate': 1.0838287252720739e-05, 'epoch': 0.98} {'loss': 0.5442, 'learning_rate': 1.0837952457175038e-05, 'epoch': 0.98} {'loss': 0.7108, 'learning_rate': 1.0837617660683448e-05, 'epoch': 0.98} {'loss': 0.5987, 'learning_rate': 1.0837282863246348e-05, 'epoch': 0.98} {'loss': 0.6274, 'learning_rate': 1.0836948064864112e-05, 'epoch': 0.98} {'loss': 0.5463, 'learning_rate': 1.0836613265537124e-05, 'epoch': 0.98} {'loss': 0.6045, 'learning_rate': 1.0836278465265757e-05, 'epoch': 0.98} {'loss': 0.6633, 'learning_rate': 1.0835943664050395e-05, 'epoch': 0.98} {'loss': 0.7281, 'learning_rate': 1.0835608861891406e-05, 'epoch': 0.98} {'loss': 0.649, 'learning_rate': 1.0835274058789175e-05, 'epoch': 0.98} {'loss': 0.4165, 'learning_rate': 1.0834939254744078e-05, 'epoch': 0.98} {'loss': 0.4322, 'learning_rate': 1.0834604449756496e-05, 'epoch': 0.98} {'loss': 0.5479, 'learning_rate': 1.0834269643826803e-05, 'epoch': 0.98} {'loss': 0.5324, 'learning_rate': 1.0833934836955376e-05, 'epoch': 0.98} {'loss': 0.6272, 'learning_rate': 1.0833600029142596e-05, 'epoch': 0.98} {'loss': 0.4704, 'learning_rate': 1.0833265220388843e-05, 'epoch': 0.98} {'loss': 0.4762, 'learning_rate': 1.0832930410694488e-05, 'epoch': 0.98} {'loss': 0.5142, 'learning_rate': 1.0832595600059914e-05, 'epoch': 0.98} {'loss': 0.6321, 'learning_rate': 1.08322607884855e-05, 'epoch': 0.98} {'loss': 0.3713, 'learning_rate': 1.083192597597162e-05, 'epoch': 0.98} {'loss': 0.5977, 'learning_rate': 1.0831591162518655e-05, 'epoch': 0.98} {'loss': 0.5555, 'learning_rate': 1.0831256348126983e-05, 'epoch': 0.98} {'loss': 0.4992, 'learning_rate': 1.0830921532796979e-05, 'epoch': 0.98} {'loss': 0.5803, 'learning_rate': 1.0830586716529022e-05, 'epoch': 0.98} {'loss': 0.6629, 'learning_rate': 1.0830251899323489e-05, 'epoch': 0.98} {'loss': 0.6054, 'learning_rate': 1.082991708118076e-05, 'epoch': 0.98} {'loss': 0.507, 'learning_rate': 1.0829582262101214e-05, 'epoch': 0.98} {'loss': 0.4481, 'learning_rate': 1.082924744208523e-05, 'epoch': 0.98} {'loss': 0.5081, 'learning_rate': 1.0828912621133179e-05, 'epoch': 0.98} {'loss': 0.3952, 'learning_rate': 1.0828577799245443e-05, 'epoch': 0.98} {'loss': 0.6023, 'learning_rate': 1.0828242976422403e-05, 'epoch': 0.98} {'loss': 0.8343, 'learning_rate': 1.0827908152664433e-05, 'epoch': 0.98} {'loss': 0.4631, 'learning_rate': 1.0827573327971912e-05, 'epoch': 0.98} {'loss': 0.3963, 'learning_rate': 1.0827238502345221e-05, 'epoch': 0.98} {'loss': 0.6328, 'learning_rate': 1.0826903675784731e-05, 'epoch': 0.98} {'loss': 0.7349, 'learning_rate': 1.0826568848290827e-05, 'epoch': 0.98} {'loss': 0.4936, 'learning_rate': 1.0826234019863881e-05, 'epoch': 0.98} {'loss': 0.6563, 'learning_rate': 1.0825899190504274e-05, 'epoch': 0.98} {'loss': 0.4999, 'learning_rate': 1.0825564360212386e-05, 'epoch': 0.98} {'loss': 0.5714, 'learning_rate': 1.0825229528988593e-05, 'epoch': 0.98} {'loss': 0.6315, 'learning_rate': 1.0824894696833271e-05, 'epoch': 0.98} {'loss': 0.5896, 'learning_rate': 1.08245598637468e-05, 'epoch': 0.98} {'loss': 0.6877, 'learning_rate': 1.0824225029729556e-05, 'epoch': 0.98} {'loss': 0.6544, 'learning_rate': 1.0823890194781924e-05, 'epoch': 0.98} {'loss': 0.5164, 'learning_rate': 1.0823555358904271e-05, 'epoch': 0.98} {'loss': 0.5389, 'learning_rate': 1.0823220522096985e-05, 'epoch': 0.98} {'loss': 0.4421, 'learning_rate': 1.0822885684360436e-05, 'epoch': 0.98} {'loss': 0.6982, 'learning_rate': 1.0822550845695008e-05, 'epoch': 0.98} {'loss': 0.5331, 'learning_rate': 1.0822216006101077e-05, 'epoch': 0.98} {'loss': 0.425, 'learning_rate': 1.0821881165579017e-05, 'epoch': 0.98} {'loss': 0.5129, 'learning_rate': 1.0821546324129211e-05, 'epoch': 0.98} {'loss': 0.5979, 'learning_rate': 1.0821211481752036e-05, 'epoch': 0.98} {'loss': 0.4735, 'learning_rate': 1.082087663844787e-05, 'epoch': 0.98} {'loss': 0.6118, 'learning_rate': 1.082054179421709e-05, 'epoch': 0.98} {'loss': 0.5848, 'learning_rate': 1.0820206949060073e-05, 'epoch': 0.98} {'loss': 0.645, 'learning_rate': 1.08198721029772e-05, 'epoch': 0.98} {'loss': 0.6607, 'learning_rate': 1.0819537255968845e-05, 'epoch': 0.98} {'loss': 0.6647, 'learning_rate': 1.0819202408035395e-05, 'epoch': 0.98} {'loss': 0.6263, 'learning_rate': 1.0818867559177215e-05, 'epoch': 0.98} {'loss': 0.5771, 'learning_rate': 1.0818532709394692e-05, 'epoch': 0.98} {'loss': 0.5028, 'learning_rate': 1.0818197858688198e-05, 'epoch': 0.98} {'loss': 0.5358, 'learning_rate': 1.0817863007058116e-05, 'epoch': 0.98} {'loss': 0.4178, 'learning_rate': 1.0817528154504821e-05, 'epoch': 0.98} {'loss': 0.5172, 'learning_rate': 1.0817193301028694e-05, 'epoch': 0.98} {'loss': 0.5855, 'learning_rate': 1.081685844663011e-05, 'epoch': 0.98} {'loss': 0.6679, 'learning_rate': 1.0816523591309448e-05, 'epoch': 0.98} {'loss': 0.6048, 'learning_rate': 1.0816188735067088e-05, 'epoch': 0.98} {'loss': 0.4793, 'learning_rate': 1.0815853877903404e-05, 'epoch': 0.98} {'loss': 0.5779, 'learning_rate': 1.0815519019818777e-05, 'epoch': 0.98} {'loss': 0.5197, 'learning_rate': 1.0815184160813585e-05, 'epoch': 0.98} {'loss': 0.4685, 'learning_rate': 1.0814849300888206e-05, 'epoch': 0.98} {'loss': 0.7141, 'learning_rate': 1.0814514440043016e-05, 'epoch': 0.98} {'loss': 0.6872, 'learning_rate': 1.0814179578278392e-05, 'epoch': 0.98} {'loss': 0.5641, 'learning_rate': 1.0813844715594715e-05, 'epoch': 0.98} {'loss': 0.5716, 'learning_rate': 1.0813509851992363e-05, 'epoch': 0.98} {'loss': 0.5172, 'learning_rate': 1.0813174987471714e-05, 'epoch': 0.98} {'loss': 0.4247, 'learning_rate': 1.0812840122033142e-05, 'epoch': 0.98} {'loss': 0.5215, 'learning_rate': 1.0812505255677031e-05, 'epoch': 0.98} {'loss': 0.5257, 'learning_rate': 1.0812170388403754e-05, 'epoch': 0.98} {'loss': 0.6223, 'learning_rate': 1.0811835520213692e-05, 'epoch': 0.98} {'loss': 0.4073, 'learning_rate': 1.0811500651107221e-05, 'epoch': 0.98} {'loss': 0.4661, 'learning_rate': 1.081116578108472e-05, 'epoch': 0.98} {'loss': 0.5165, 'learning_rate': 1.081083091014657e-05, 'epoch': 0.98} {'loss': 0.5225, 'learning_rate': 1.0810496038293145e-05, 'epoch': 0.98} {'loss': 0.5545, 'learning_rate': 1.0810161165524824e-05, 'epoch': 0.98} {'loss': 0.4947, 'learning_rate': 1.0809826291841985e-05, 'epoch': 0.98} {'loss': 0.6487, 'learning_rate': 1.0809491417245004e-05, 'epoch': 0.98} {'loss': 0.3471, 'learning_rate': 1.0809156541734263e-05, 'epoch': 0.98} {'loss': 0.5206, 'learning_rate': 1.080882166531014e-05, 'epoch': 0.98} {'loss': 0.5827, 'learning_rate': 1.0808486787973007e-05, 'epoch': 0.98} {'loss': 0.5506, 'learning_rate': 1.0808151909723248e-05, 'epoch': 0.98} {'loss': 0.6838, 'learning_rate': 1.0807817030561237e-05, 'epoch': 0.98} {'loss': 0.6581, 'learning_rate': 1.0807482150487357e-05, 'epoch': 0.98} {'loss': 0.6633, 'learning_rate': 1.0807147269501983e-05, 'epoch': 0.98} {'loss': 0.6293, 'learning_rate': 1.0806812387605494e-05, 'epoch': 0.98} {'loss': 0.5618, 'learning_rate': 1.0806477504798265e-05, 'epoch': 0.98} {'loss': 0.5857, 'learning_rate': 1.0806142621080677e-05, 'epoch': 0.98} {'loss': 0.7511, 'learning_rate': 1.080580773645311e-05, 'epoch': 0.98} {'loss': 0.582, 'learning_rate': 1.0805472850915935e-05, 'epoch': 0.98} {'loss': 0.651, 'learning_rate': 1.0805137964469536e-05, 'epoch': 0.98} {'loss': 0.7222, 'learning_rate': 1.080480307711429e-05, 'epoch': 0.98} {'loss': 0.54, 'learning_rate': 1.0804468188850573e-05, 'epoch': 0.98} {'loss': 0.4575, 'learning_rate': 1.0804133299678765e-05, 'epoch': 0.98} {'loss': 0.6322, 'learning_rate': 1.0803798409599244e-05, 'epoch': 0.98} {'loss': 0.5609, 'learning_rate': 1.0803463518612388e-05, 'epoch': 0.98} {'loss': 0.5003, 'learning_rate': 1.0803128626718573e-05, 'epoch': 0.98} {'loss': 0.4486, 'learning_rate': 1.0802793733918182e-05, 'epoch': 0.98} {'loss': 0.6366, 'learning_rate': 1.0802458840211586e-05, 'epoch': 0.98} {'loss': 0.405, 'learning_rate': 1.0802123945599168e-05, 'epoch': 0.98} {'loss': 0.5292, 'learning_rate': 1.0801789050081305e-05, 'epoch': 0.98} {'loss': 0.4821, 'learning_rate': 1.0801454153658372e-05, 'epoch': 0.98} {'loss': 0.5658, 'learning_rate': 1.080111925633075e-05, 'epoch': 0.98} {'loss': 0.5989, 'learning_rate': 1.080078435809882e-05, 'epoch': 0.98} {'loss': 0.5479, 'learning_rate': 1.0800449458962954e-05, 'epoch': 0.98} {'loss': 0.3994, 'learning_rate': 1.0800114558923532e-05, 'epoch': 0.98} {'loss': 0.557, 'learning_rate': 1.0799779657980935e-05, 'epoch': 0.98} {'loss': 0.3221, 'learning_rate': 1.0799444756135537e-05, 'epoch': 0.98} {'loss': 0.6379, 'learning_rate': 1.079910985338772e-05, 'epoch': 0.98} {'loss': 0.4997, 'learning_rate': 1.0798774949737858e-05, 'epoch': 0.98} {'loss': 0.6193, 'learning_rate': 1.0798440045186334e-05, 'epoch': 0.98} {'loss': 0.4689, 'learning_rate': 1.079810513973352e-05, 'epoch': 0.98} {'loss': 0.3839, 'learning_rate': 1.0797770233379798e-05, 'epoch': 0.98} {'loss': 0.5689, 'learning_rate': 1.0797435326125545e-05, 'epoch': 0.98} {'loss': 0.5081, 'learning_rate': 1.079710041797114e-05, 'epoch': 0.98} {'loss': 0.4589, 'learning_rate': 1.079676550891696e-05, 'epoch': 0.98} {'loss': 0.4928, 'learning_rate': 1.0796430598963381e-05, 'epoch': 0.98} {'loss': 0.5968, 'learning_rate': 1.0796095688110785e-05, 'epoch': 0.98} {'loss': 0.4098, 'learning_rate': 1.079576077635955e-05, 'epoch': 0.98} {'loss': 0.4695, 'learning_rate': 1.079542586371005e-05, 'epoch': 0.98} {'loss': 0.585, 'learning_rate': 1.0795090950162665e-05, 'epoch': 0.98} {'loss': 0.447, 'learning_rate': 1.0794756035717775e-05, 'epoch': 0.98} {'loss': 0.5256, 'learning_rate': 1.0794421120375756e-05, 'epoch': 0.98} {'loss': 0.5344, 'learning_rate': 1.0794086204136987e-05, 'epoch': 0.98} {'loss': 0.5117, 'learning_rate': 1.0793751287001848e-05, 'epoch': 0.98} {'loss': 0.51, 'learning_rate': 1.079341636897071e-05, 'epoch': 0.98} {'loss': 0.4931, 'learning_rate': 1.0793081450043961e-05, 'epoch': 0.98} {'loss': 0.5336, 'learning_rate': 1.079274653022197e-05, 'epoch': 0.98} {'loss': 0.6315, 'learning_rate': 1.079241160950512e-05, 'epoch': 0.98} {'loss': 0.4545, 'learning_rate': 1.0792076687893787e-05, 'epoch': 0.98} {'loss': 0.5285, 'learning_rate': 1.079174176538835e-05, 'epoch': 0.98} {'loss': 0.5298, 'learning_rate': 1.0791406841989189e-05, 'epoch': 0.98} {'loss': 0.4819, 'learning_rate': 1.0791071917696676e-05, 'epoch': 0.98} {'loss': 0.4618, 'learning_rate': 1.0790736992511196e-05, 'epoch': 0.98} {'loss': 0.3754, 'learning_rate': 1.0790402066433127e-05, 'epoch': 0.98} {'loss': 0.4744, 'learning_rate': 1.0790067139462843e-05, 'epoch': 0.98} {'loss': 0.5266, 'learning_rate': 1.0789732211600721e-05, 'epoch': 0.98} {'loss': 0.5141, 'learning_rate': 1.0789397282847143e-05, 'epoch': 0.98} {'loss': 0.4779, 'learning_rate': 1.0789062353202486e-05, 'epoch': 0.98} {'loss': 0.4441, 'learning_rate': 1.0788727422667126e-05, 'epoch': 0.98} {'loss': 0.4596, 'learning_rate': 1.0788392491241447e-05, 'epoch': 0.98} {'loss': 0.6391, 'learning_rate': 1.0788057558925817e-05, 'epoch': 0.98} {'loss': 0.6919, 'learning_rate': 1.0787722625720623e-05, 'epoch': 0.98} {'loss': 0.4853, 'learning_rate': 1.078738769162624e-05, 'epoch': 0.98} {'loss': 0.5907, 'learning_rate': 1.0787052756643047e-05, 'epoch': 0.98} {'loss': 0.6124, 'learning_rate': 1.0786717820771417e-05, 'epoch': 0.98} {'loss': 0.3471, 'learning_rate': 1.0786382884011734e-05, 'epoch': 0.98} {'loss': 0.6002, 'learning_rate': 1.0786047946364379e-05, 'epoch': 0.98} {'loss': 0.4987, 'learning_rate': 1.0785713007829721e-05, 'epoch': 0.98} {'loss': 0.5578, 'learning_rate': 1.0785378068408143e-05, 'epoch': 0.98} {'loss': 0.4836, 'learning_rate': 1.0785043128100022e-05, 'epoch': 0.98} {'loss': 0.6378, 'learning_rate': 1.0784708186905737e-05, 'epoch': 0.98} {'loss': 0.5369, 'learning_rate': 1.0784373244825665e-05, 'epoch': 0.98} {'loss': 0.5356, 'learning_rate': 1.0784038301860187e-05, 'epoch': 0.98} {'loss': 0.7902, 'learning_rate': 1.0783703358009676e-05, 'epoch': 0.98} {'loss': 0.4777, 'learning_rate': 1.0783368413274515e-05, 'epoch': 0.98} {'loss': 0.6681, 'learning_rate': 1.078303346765508e-05, 'epoch': 0.98} {'loss': 0.4412, 'learning_rate': 1.0782698521151746e-05, 'epoch': 0.98} {'loss': 0.594, 'learning_rate': 1.0782363573764898e-05, 'epoch': 0.98} {'loss': 0.492, 'learning_rate': 1.0782028625494906e-05, 'epoch': 0.98} {'loss': 0.4877, 'learning_rate': 1.078169367634216e-05, 'epoch': 0.98} {'loss': 0.6715, 'learning_rate': 1.0781358726307025e-05, 'epoch': 0.98} {'loss': 0.6036, 'learning_rate': 1.0781023775389884e-05, 'epoch': 0.98} {'loss': 0.4215, 'learning_rate': 1.078068882359112e-05, 'epoch': 0.98} {'loss': 0.5264, 'learning_rate': 1.0780353870911102e-05, 'epoch': 0.98} {'loss': 0.538, 'learning_rate': 1.0780018917350215e-05, 'epoch': 0.98} {'loss': 0.6303, 'learning_rate': 1.0779683962908833e-05, 'epoch': 0.98} {'loss': 0.5507, 'learning_rate': 1.077934900758734e-05, 'epoch': 0.98} {'loss': 0.4875, 'learning_rate': 1.0779014051386105e-05, 'epoch': 0.98} {'loss': 0.3746, 'learning_rate': 1.0778679094305516e-05, 'epoch': 0.98} {'loss': 0.4942, 'learning_rate': 1.0778344136345943e-05, 'epoch': 0.98} {'loss': 0.6497, 'learning_rate': 1.0778009177507769e-05, 'epoch': 0.98} {'loss': 0.7358, 'learning_rate': 1.0777674217791372e-05, 'epoch': 0.98} {'loss': 0.4902, 'learning_rate': 1.0777339257197129e-05, 'epoch': 0.98} {'loss': 0.5657, 'learning_rate': 1.0777004295725415e-05, 'epoch': 0.98} {'loss': 0.5408, 'learning_rate': 1.0776669333376613e-05, 'epoch': 0.98} {'loss': 0.5761, 'learning_rate': 1.0776334370151096e-05, 'epoch': 0.98} {'loss': 0.2615, 'learning_rate': 1.0775999406049249e-05, 'epoch': 0.98} {'loss': 0.3783, 'learning_rate': 1.0775664441071442e-05, 'epoch': 0.98} {'loss': 0.5271, 'learning_rate': 1.0775329475218061e-05, 'epoch': 0.98} {'loss': 0.4966, 'learning_rate': 1.0774994508489478e-05, 'epoch': 0.98} {'loss': 0.6792, 'learning_rate': 1.0774659540886075e-05, 'epoch': 0.98} {'loss': 0.5295, 'learning_rate': 1.0774324572408225e-05, 'epoch': 0.98} {'loss': 0.6226, 'learning_rate': 1.0773989603056313e-05, 'epoch': 0.98} {'loss': 0.6306, 'learning_rate': 1.0773654632830716e-05, 'epoch': 0.98} {'loss': 0.509, 'learning_rate': 1.077331966173181e-05, 'epoch': 0.98} {'loss': 0.4807, 'learning_rate': 1.077298468975997e-05, 'epoch': 0.98} {'loss': 0.6086, 'learning_rate': 1.077264971691558e-05, 'epoch': 0.98} {'loss': 0.5452, 'learning_rate': 1.0772314743199012e-05, 'epoch': 0.98} {'loss': 0.5854, 'learning_rate': 1.077197976861065e-05, 'epoch': 0.98} {'loss': 0.6733, 'learning_rate': 1.077164479315087e-05, 'epoch': 0.98} {'loss': 0.3961, 'learning_rate': 1.0771309816820049e-05, 'epoch': 0.98} {'loss': 0.3872, 'learning_rate': 1.0770974839618564e-05, 'epoch': 0.98} {'loss': 0.4106, 'learning_rate': 1.0770639861546799e-05, 'epoch': 0.98} {'loss': 0.4026, 'learning_rate': 1.0770304882605124e-05, 'epoch': 0.98} {'loss': 0.4027, 'learning_rate': 1.0769969902793925e-05, 'epoch': 0.98} {'loss': 0.7141, 'learning_rate': 1.0769634922113572e-05, 'epoch': 0.98} {'loss': 0.5458, 'learning_rate': 1.0769299940564452e-05, 'epoch': 0.98} {'loss': 0.5196, 'learning_rate': 1.0768964958146939e-05, 'epoch': 0.98} {'loss': 0.608, 'learning_rate': 1.0768629974861406e-05, 'epoch': 0.98} {'loss': 0.5182, 'learning_rate': 1.076829499070824e-05, 'epoch': 0.98} {'loss': 0.5879, 'learning_rate': 1.0767960005687814e-05, 'epoch': 0.98} {'loss': 0.5247, 'learning_rate': 1.0767625019800505e-05, 'epoch': 0.98} {'loss': 0.5445, 'learning_rate': 1.0767290033046696e-05, 'epoch': 0.98} {'loss': 0.5002, 'learning_rate': 1.076695504542676e-05, 'epoch': 0.98} {'loss': 0.4614, 'learning_rate': 1.076662005694108e-05, 'epoch': 0.98} {'loss': 0.5432, 'learning_rate': 1.0766285067590032e-05, 'epoch': 0.98} {'loss': 0.6762, 'learning_rate': 1.0765950077373993e-05, 'epoch': 0.98} {'loss': 0.5282, 'learning_rate': 1.076561508629334e-05, 'epoch': 0.98} {'loss': 0.6187, 'learning_rate': 1.0765280094348456e-05, 'epoch': 0.98} {'loss': 0.7263, 'learning_rate': 1.0764945101539717e-05, 'epoch': 0.98} {'loss': 0.554, 'learning_rate': 1.0764610107867499e-05, 'epoch': 0.98} {'loss': 0.6521, 'learning_rate': 1.0764275113332181e-05, 'epoch': 0.98} {'loss': 0.493, 'learning_rate': 1.0763940117934142e-05, 'epoch': 0.98} {'loss': 0.4529, 'learning_rate': 1.0763605121673759e-05, 'epoch': 0.98} {'loss': 0.7424, 'learning_rate': 1.0763270124551411e-05, 'epoch': 0.98} {'loss': 0.4511, 'learning_rate': 1.0762935126567477e-05, 'epoch': 0.98} {'loss': 0.6332, 'learning_rate': 1.0762600127722334e-05, 'epoch': 0.98} {'loss': 0.5093, 'learning_rate': 1.076226512801636e-05, 'epoch': 0.98} {'loss': 0.4128, 'learning_rate': 1.0761930127449935e-05, 'epoch': 0.98} {'loss': 0.6269, 'learning_rate': 1.0761595126023436e-05, 'epoch': 0.98} {'loss': 0.4183, 'learning_rate': 1.076126012373724e-05, 'epoch': 0.98} {'loss': 0.5042, 'learning_rate': 1.0760925120591726e-05, 'epoch': 0.98} {'loss': 0.4826, 'learning_rate': 1.0760590116587274e-05, 'epoch': 0.98} {'loss': 0.6145, 'learning_rate': 1.0760255111724259e-05, 'epoch': 0.98} {'loss': 0.4065, 'learning_rate': 1.0759920106003061e-05, 'epoch': 0.98} {'loss': 0.294, 'learning_rate': 1.0759585099424057e-05, 'epoch': 0.98} {'loss': 0.5537, 'learning_rate': 1.0759250091987626e-05, 'epoch': 0.98} {'loss': 0.5958, 'learning_rate': 1.0758915083694145e-05, 'epoch': 0.98} {'loss': 0.5799, 'learning_rate': 1.0758580074543994e-05, 'epoch': 0.98} {'loss': 0.5392, 'learning_rate': 1.075824506453755e-05, 'epoch': 0.98} {'loss': 0.5943, 'learning_rate': 1.0757910053675192e-05, 'epoch': 0.98} {'loss': 0.5648, 'learning_rate': 1.0757575041957296e-05, 'epoch': 0.98} {'loss': 0.4922, 'learning_rate': 1.0757240029384246e-05, 'epoch': 0.98} {'loss': 0.5005, 'learning_rate': 1.0756905015956414e-05, 'epoch': 0.98} {'loss': 0.5867, 'learning_rate': 1.0756570001674178e-05, 'epoch': 0.98} {'loss': 0.5977, 'learning_rate': 1.0756234986537922e-05, 'epoch': 0.98} {'loss': 0.3662, 'learning_rate': 1.0755899970548015e-05, 'epoch': 0.98} {'loss': 0.5929, 'learning_rate': 1.0755564953704847e-05, 'epoch': 0.98} {'loss': 0.6151, 'learning_rate': 1.0755229936008786e-05, 'epoch': 0.98} {'loss': 0.685, 'learning_rate': 1.0754894917460214e-05, 'epoch': 0.98} {'loss': 0.621, 'learning_rate': 1.0754559898059511e-05, 'epoch': 0.98} {'loss': 0.4142, 'learning_rate': 1.0754224877807054e-05, 'epoch': 0.98} {'loss': 0.5071, 'learning_rate': 1.0753889856703216e-05, 'epoch': 0.98} {'loss': 0.5167, 'learning_rate': 1.0753554834748385e-05, 'epoch': 0.98} {'loss': 0.5103, 'learning_rate': 1.0753219811942931e-05, 'epoch': 0.98} {'loss': 0.6828, 'learning_rate': 1.075288478828724e-05, 'epoch': 0.98} {'loss': 0.5352, 'learning_rate': 1.0752549763781679e-05, 'epoch': 0.98} {'loss': 0.5629, 'learning_rate': 1.0752214738426634e-05, 'epoch': 0.98} {'loss': 0.4043, 'learning_rate': 1.0751879712222482e-05, 'epoch': 0.98} {'loss': 0.4413, 'learning_rate': 1.0751544685169602e-05, 'epoch': 0.98} {'loss': 0.5026, 'learning_rate': 1.0751209657268369e-05, 'epoch': 0.98} {'loss': 0.6534, 'learning_rate': 1.0750874628519163e-05, 'epoch': 0.98} {'loss': 0.6456, 'learning_rate': 1.0750539598922365e-05, 'epoch': 0.98} {'loss': 0.5349, 'learning_rate': 1.0750204568478348e-05, 'epoch': 0.98} {'loss': 0.5816, 'learning_rate': 1.0749869537187494e-05, 'epoch': 0.98} {'loss': 0.6208, 'learning_rate': 1.0749534505050179e-05, 'epoch': 0.98} {'loss': 0.5453, 'learning_rate': 1.0749199472066782e-05, 'epoch': 0.98} {'loss': 0.4662, 'learning_rate': 1.074886443823768e-05, 'epoch': 0.98} {'loss': 0.6335, 'learning_rate': 1.0748529403563255e-05, 'epoch': 0.98} {'loss': 0.5396, 'learning_rate': 1.0748194368043885e-05, 'epoch': 0.98} {'loss': 0.4665, 'learning_rate': 1.0747859331679942e-05, 'epoch': 0.98} {'loss': 0.6015, 'learning_rate': 1.074752429447181e-05, 'epoch': 0.98} {'loss': 0.5432, 'learning_rate': 1.0747189256419863e-05, 'epoch': 0.98} {'loss': 0.613, 'learning_rate': 1.0746854217524483e-05, 'epoch': 0.98} {'loss': 0.3741, 'learning_rate': 1.0746519177786046e-05, 'epoch': 0.98} {'loss': 0.6338, 'learning_rate': 1.074618413720493e-05, 'epoch': 0.99} {'loss': 0.6047, 'learning_rate': 1.0745849095781514e-05, 'epoch': 0.99} {'loss': 0.6055, 'learning_rate': 1.0745514053516178e-05, 'epoch': 0.99} {'loss': 0.4252, 'learning_rate': 1.0745179010409297e-05, 'epoch': 0.99} {'loss': 0.5298, 'learning_rate': 1.0744843966461249e-05, 'epoch': 0.99} {'loss': 0.4851, 'learning_rate': 1.0744508921672417e-05, 'epoch': 0.99} {'loss': 0.408, 'learning_rate': 1.0744173876043174e-05, 'epoch': 0.99} {'loss': 0.5652, 'learning_rate': 1.0743838829573903e-05, 'epoch': 0.99} {'loss': 0.741, 'learning_rate': 1.0743503782264977e-05, 'epoch': 0.99} {'loss': 0.5453, 'learning_rate': 1.0743168734116777e-05, 'epoch': 0.99} {'loss': 0.5032, 'learning_rate': 1.074283368512968e-05, 'epoch': 0.99} {'loss': 0.4511, 'learning_rate': 1.0742498635304066e-05, 'epoch': 0.99} {'loss': 0.6401, 'learning_rate': 1.0742163584640313e-05, 'epoch': 0.99} {'loss': 0.498, 'learning_rate': 1.0741828533138796e-05, 'epoch': 0.99} {'loss': 0.5617, 'learning_rate': 1.0741493480799899e-05, 'epoch': 0.99} {'loss': 0.3817, 'learning_rate': 1.0741158427623992e-05, 'epoch': 0.99} {'loss': 0.6562, 'learning_rate': 1.074082337361146e-05, 'epoch': 0.99} {'loss': 0.5926, 'learning_rate': 1.0740488318762683e-05, 'epoch': 0.99} {'loss': 0.5995, 'learning_rate': 1.0740153263078033e-05, 'epoch': 0.99} {'loss': 0.6019, 'learning_rate': 1.0739818206557891e-05, 'epoch': 0.99} {'loss': 0.7048, 'learning_rate': 1.0739483149202634e-05, 'epoch': 0.99} {'loss': 0.6174, 'learning_rate': 1.0739148091012641e-05, 'epoch': 0.99} {'loss': 0.4115, 'learning_rate': 1.0738813031988291e-05, 'epoch': 0.99} {'loss': 0.6201, 'learning_rate': 1.0738477972129962e-05, 'epoch': 0.99} {'loss': 0.516, 'learning_rate': 1.0738142911438032e-05, 'epoch': 0.99} {'loss': 0.6856, 'learning_rate': 1.0737807849912878e-05, 'epoch': 0.99} {'loss': 0.5159, 'learning_rate': 1.0737472787554878e-05, 'epoch': 0.99} {'loss': 0.6842, 'learning_rate': 1.0737137724364415e-05, 'epoch': 0.99} {'loss': 0.6227, 'learning_rate': 1.073680266034186e-05, 'epoch': 0.99} {'loss': 0.6892, 'learning_rate': 1.0736467595487597e-05, 'epoch': 0.99} {'loss': 0.4772, 'learning_rate': 1.0736132529802003e-05, 'epoch': 0.99} {'loss': 0.636, 'learning_rate': 1.0735797463285455e-05, 'epoch': 0.99} {'loss': 0.6653, 'learning_rate': 1.0735462395938331e-05, 'epoch': 0.99} {'loss': 0.5222, 'learning_rate': 1.073512732776101e-05, 'epoch': 0.99} {'loss': 0.5228, 'learning_rate': 1.0734792258753868e-05, 'epoch': 0.99} {'loss': 0.531, 'learning_rate': 1.0734457188917286e-05, 'epoch': 0.99} {'loss': 0.4928, 'learning_rate': 1.0734122118251644e-05, 'epoch': 0.99} {'loss': 0.5833, 'learning_rate': 1.0733787046757316e-05, 'epoch': 0.99} {'loss': 0.5648, 'learning_rate': 1.073345197443468e-05, 'epoch': 0.99} {'loss': 0.5429, 'learning_rate': 1.073311690128412e-05, 'epoch': 0.99} {'loss': 0.4589, 'learning_rate': 1.0732781827306009e-05, 'epoch': 0.99} {'loss': 0.709, 'learning_rate': 1.0732446752500726e-05, 'epoch': 0.99} {'loss': 0.609, 'learning_rate': 1.0732111676868651e-05, 'epoch': 0.99} {'loss': 0.5321, 'learning_rate': 1.0731776600410162e-05, 'epoch': 0.99} {'loss': 0.5673, 'learning_rate': 1.0731441523125635e-05, 'epoch': 0.99} {'loss': 0.5169, 'learning_rate': 1.0731106445015448e-05, 'epoch': 0.99} {'loss': 0.7001, 'learning_rate': 1.0730771366079982e-05, 'epoch': 0.99} {'loss': 0.5266, 'learning_rate': 1.0730436286319615e-05, 'epoch': 0.99} {'loss': 0.5038, 'learning_rate': 1.0730101205734721e-05, 'epoch': 0.99} {'loss': 0.622, 'learning_rate': 1.0729766124325687e-05, 'epoch': 0.99} {'loss': 0.4849, 'learning_rate': 1.0729431042092881e-05, 'epoch': 0.99} {'loss': 0.4319, 'learning_rate': 1.0729095959036688e-05, 'epoch': 0.99} {'loss': 0.5409, 'learning_rate': 1.0728760875157484e-05, 'epoch': 0.99} {'loss': 0.5146, 'learning_rate': 1.072842579045565e-05, 'epoch': 0.99} {'loss': 0.4406, 'learning_rate': 1.072809070493156e-05, 'epoch': 0.99} {'loss': 0.5641, 'learning_rate': 1.0727755618585594e-05, 'epoch': 0.99} {'loss': 0.7263, 'learning_rate': 1.0727420531418132e-05, 'epoch': 0.99} {'loss': 0.6861, 'learning_rate': 1.0727085443429547e-05, 'epoch': 0.99} {'loss': 0.5419, 'learning_rate': 1.0726750354620223e-05, 'epoch': 0.99} {'loss': 0.4404, 'learning_rate': 1.0726415264990535e-05, 'epoch': 0.99} {'loss': 0.3655, 'learning_rate': 1.0726080174540864e-05, 'epoch': 0.99} {'loss': 0.6556, 'learning_rate': 1.0725745083271583e-05, 'epoch': 0.99} {'loss': 0.7026, 'learning_rate': 1.0725409991183078e-05, 'epoch': 0.99} {'loss': 0.6261, 'learning_rate': 1.072507489827572e-05, 'epoch': 0.99} {'loss': 0.4963, 'learning_rate': 1.072473980454989e-05, 'epoch': 0.99} {'loss': 0.6559, 'learning_rate': 1.0724404710005967e-05, 'epoch': 0.99} {'loss': 0.3939, 'learning_rate': 1.072406961464433e-05, 'epoch': 0.99} {'loss': 0.5062, 'learning_rate': 1.0723734518465359e-05, 'epoch': 0.99} {'loss': 0.4339, 'learning_rate': 1.0723399421469424e-05, 'epoch': 0.99} {'loss': 0.6014, 'learning_rate': 1.0723064323656914e-05, 'epoch': 0.99} {'loss': 0.4981, 'learning_rate': 1.0722729225028196e-05, 'epoch': 0.99} {'loss': 0.6251, 'learning_rate': 1.0722394125583657e-05, 'epoch': 0.99} {'loss': 0.5109, 'learning_rate': 1.0722059025323673e-05, 'epoch': 0.99} {'loss': 0.6737, 'learning_rate': 1.0721723924248622e-05, 'epoch': 0.99} {'loss': 0.6442, 'learning_rate': 1.072138882235888e-05, 'epoch': 0.99} {'loss': 0.6801, 'learning_rate': 1.0721053719654828e-05, 'epoch': 0.99} {'loss': 0.5898, 'learning_rate': 1.0720718616136843e-05, 'epoch': 0.99} {'loss': 0.548, 'learning_rate': 1.0720383511805306e-05, 'epoch': 0.99} {'loss': 0.4054, 'learning_rate': 1.0720048406660591e-05, 'epoch': 0.99} {'loss': 0.5542, 'learning_rate': 1.0719713300703078e-05, 'epoch': 0.99} {'loss': 0.6262, 'learning_rate': 1.0719378193933148e-05, 'epoch': 0.99} {'loss': 0.5205, 'learning_rate': 1.0719043086351175e-05, 'epoch': 0.99} {'loss': 0.6014, 'learning_rate': 1.071870797795754e-05, 'epoch': 0.99} {'loss': 0.4965, 'learning_rate': 1.0718372868752618e-05, 'epoch': 0.99} {'loss': 0.6535, 'learning_rate': 1.0718037758736792e-05, 'epoch': 0.99} {'loss': 0.707, 'learning_rate': 1.0717702647910437e-05, 'epoch': 0.99} {'loss': 0.4801, 'learning_rate': 1.071736753627393e-05, 'epoch': 0.99} {'loss': 0.5242, 'learning_rate': 1.0717032423827655e-05, 'epoch': 0.99} {'loss': 0.5186, 'learning_rate': 1.0716697310571986e-05, 'epoch': 0.99} {'loss': 0.5016, 'learning_rate': 1.0716362196507303e-05, 'epoch': 0.99} {'loss': 0.6443, 'learning_rate': 1.071602708163398e-05, 'epoch': 0.99} {'loss': 0.4053, 'learning_rate': 1.0715691965952399e-05, 'epoch': 0.99} {'loss': 0.6749, 'learning_rate': 1.071535684946294e-05, 'epoch': 0.99} {'loss': 0.7132, 'learning_rate': 1.071502173216598e-05, 'epoch': 0.99} {'loss': 0.5037, 'learning_rate': 1.0714686614061896e-05, 'epoch': 0.99} {'loss': 0.493, 'learning_rate': 1.0714351495151066e-05, 'epoch': 0.99} {'loss': 0.5299, 'learning_rate': 1.0714016375433867e-05, 'epoch': 0.99} {'loss': 0.4658, 'learning_rate': 1.071368125491068e-05, 'epoch': 0.99} {'loss': 0.7518, 'learning_rate': 1.0713346133581884e-05, 'epoch': 0.99} {'loss': 0.4382, 'learning_rate': 1.0713011011447856e-05, 'epoch': 0.99} {'loss': 0.636, 'learning_rate': 1.0712675888508972e-05, 'epoch': 0.99} {'loss': 0.4744, 'learning_rate': 1.0712340764765614e-05, 'epoch': 0.99} {'loss': 0.6465, 'learning_rate': 1.0712005640218158e-05, 'epoch': 0.99} {'loss': 0.593, 'learning_rate': 1.0711670514866984e-05, 'epoch': 0.99} {'loss': 0.5723, 'learning_rate': 1.071133538871247e-05, 'epoch': 0.99} {'loss': 0.4295, 'learning_rate': 1.0711000261754991e-05, 'epoch': 0.99} {'loss': 0.4118, 'learning_rate': 1.071066513399493e-05, 'epoch': 0.99} {'loss': 0.6165, 'learning_rate': 1.0710330005432663e-05, 'epoch': 0.99} {'loss': 0.5495, 'learning_rate': 1.0709994876068569e-05, 'epoch': 0.99} {'loss': 0.7482, 'learning_rate': 1.0709659745903025e-05, 'epoch': 0.99} {'loss': 0.4556, 'learning_rate': 1.0709324614936409e-05, 'epoch': 0.99} {'loss': 0.5428, 'learning_rate': 1.0708989483169101e-05, 'epoch': 0.99} {'loss': 0.5136, 'learning_rate': 1.070865435060148e-05, 'epoch': 0.99} {'loss': 0.5655, 'learning_rate': 1.0708319217233923e-05, 'epoch': 0.99} {'loss': 0.665, 'learning_rate': 1.0707984083066804e-05, 'epoch': 0.99} {'loss': 0.4795, 'learning_rate': 1.0707648948100509e-05, 'epoch': 0.99} {'loss': 0.5291, 'learning_rate': 1.0707313812335415e-05, 'epoch': 0.99} {'loss': 0.6364, 'learning_rate': 1.0706978675771895e-05, 'epoch': 0.99} {'loss': 0.5833, 'learning_rate': 1.0706643538410333e-05, 'epoch': 0.99} {'loss': 0.4209, 'learning_rate': 1.0706308400251102e-05, 'epoch': 0.99} {'loss': 0.4327, 'learning_rate': 1.0705973261294584e-05, 'epoch': 0.99} {'loss': 0.5618, 'learning_rate': 1.0705638121541158e-05, 'epoch': 0.99} {'loss': 0.5868, 'learning_rate': 1.0705302980991199e-05, 'epoch': 0.99} {'loss': 0.5466, 'learning_rate': 1.0704967839645088e-05, 'epoch': 0.99} {'loss': 0.5859, 'learning_rate': 1.0704632697503204e-05, 'epoch': 0.99} {'loss': 0.5828, 'learning_rate': 1.0704297554565922e-05, 'epoch': 0.99} {'loss': 0.6098, 'learning_rate': 1.070396241083362e-05, 'epoch': 0.99} {'loss': 0.6091, 'learning_rate': 1.070362726630668e-05, 'epoch': 0.99} {'loss': 0.5019, 'learning_rate': 1.0703292120985478e-05, 'epoch': 0.99} {'loss': 0.5156, 'learning_rate': 1.0702956974870396e-05, 'epoch': 0.99} {'loss': 0.6805, 'learning_rate': 1.0702621827961808e-05, 'epoch': 0.99} {'loss': 0.6089, 'learning_rate': 1.0702286680260092e-05, 'epoch': 0.99} {'loss': 0.5266, 'learning_rate': 1.0701951531765629e-05, 'epoch': 0.99} {'loss': 0.5075, 'learning_rate': 1.0701616382478794e-05, 'epoch': 0.99} {'loss': 0.469, 'learning_rate': 1.0701281232399969e-05, 'epoch': 0.99} {'loss': 0.462, 'learning_rate': 1.070094608152953e-05, 'epoch': 0.99} {'loss': 0.4773, 'learning_rate': 1.0700610929867858e-05, 'epoch': 0.99} {'loss': 0.5143, 'learning_rate': 1.070027577741533e-05, 'epoch': 0.99} {'loss': 0.6498, 'learning_rate': 1.0699940624172321e-05, 'epoch': 0.99} {'loss': 0.499, 'learning_rate': 1.0699605470139214e-05, 'epoch': 0.99} {'loss': 0.6198, 'learning_rate': 1.0699270315316384e-05, 'epoch': 0.99} {'loss': 0.6867, 'learning_rate': 1.069893515970421e-05, 'epoch': 0.99} {'loss': 0.5646, 'learning_rate': 1.0698600003303074e-05, 'epoch': 0.99} {'loss': 0.5675, 'learning_rate': 1.0698264846113353e-05, 'epoch': 0.99} {'loss': 0.5885, 'learning_rate': 1.0697929688135422e-05, 'epoch': 0.99} {'loss': 0.4956, 'learning_rate': 1.0697594529369659e-05, 'epoch': 0.99} {'loss': 0.498, 'learning_rate': 1.0697259369816446e-05, 'epoch': 0.99} {'loss': 0.5442, 'learning_rate': 1.0696924209476159e-05, 'epoch': 0.99} {'loss': 0.5898, 'learning_rate': 1.0696589048349178e-05, 'epoch': 0.99} {'loss': 0.5577, 'learning_rate': 1.0696253886435879e-05, 'epoch': 0.99} {'loss': 0.5042, 'learning_rate': 1.0695918723736642e-05, 'epoch': 0.99} {'loss': 0.4585, 'learning_rate': 1.0695583560251847e-05, 'epoch': 0.99} {'loss': 0.5754, 'learning_rate': 1.069524839598187e-05, 'epoch': 0.99} {'loss': 0.5135, 'learning_rate': 1.069491323092709e-05, 'epoch': 0.99} {'loss': 0.3538, 'learning_rate': 1.0694578065087881e-05, 'epoch': 0.99} {'loss': 0.6717, 'learning_rate': 1.0694242898464628e-05, 'epoch': 0.99} {'loss': 0.6174, 'learning_rate': 1.0693907731057711e-05, 'epoch': 0.99} {'loss': 0.5119, 'learning_rate': 1.06935725628675e-05, 'epoch': 0.99} {'loss': 0.4931, 'learning_rate': 1.0693237393894379e-05, 'epoch': 0.99} {'loss': 0.651, 'learning_rate': 1.0692902224138724e-05, 'epoch': 0.99} {'loss': 0.688, 'learning_rate': 1.0692567053600914e-05, 'epoch': 0.99} {'loss': 0.4366, 'learning_rate': 1.0692231882281326e-05, 'epoch': 0.99} {'loss': 0.4707, 'learning_rate': 1.069189671018034e-05, 'epoch': 0.99} {'loss': 0.5557, 'learning_rate': 1.0691561537298336e-05, 'epoch': 0.99} {'loss': 0.5558, 'learning_rate': 1.0691226363635687e-05, 'epoch': 0.99} {'loss': 0.6699, 'learning_rate': 1.0690891189192778e-05, 'epoch': 0.99} {'loss': 0.6853, 'learning_rate': 1.0690556013969986e-05, 'epoch': 0.99} {'loss': 0.5772, 'learning_rate': 1.0690220837967687e-05, 'epoch': 0.99} {'loss': 0.6884, 'learning_rate': 1.0689885661186256e-05, 'epoch': 0.99} {'loss': 0.3575, 'learning_rate': 1.0689550483626079e-05, 'epoch': 0.99} {'loss': 0.4854, 'learning_rate': 1.068921530528753e-05, 'epoch': 0.99} {'loss': 0.51, 'learning_rate': 1.0688880126170986e-05, 'epoch': 0.99} {'loss': 0.4301, 'learning_rate': 1.068854494627683e-05, 'epoch': 0.99} {'loss': 0.5764, 'learning_rate': 1.0688209765605436e-05, 'epoch': 0.99} {'loss': 0.5248, 'learning_rate': 1.0687874584157182e-05, 'epoch': 0.99} {'loss': 0.5519, 'learning_rate': 1.0687539401932452e-05, 'epoch': 0.99} {'loss': 0.5047, 'learning_rate': 1.0687204218931619e-05, 'epoch': 0.99} {'loss': 0.6133, 'learning_rate': 1.0686869035155065e-05, 'epoch': 0.99} {'loss': 0.4857, 'learning_rate': 1.0686533850603164e-05, 'epoch': 0.99} {'loss': 0.4013, 'learning_rate': 1.0686198665276301e-05, 'epoch': 0.99} {'loss': 0.5366, 'learning_rate': 1.0685863479174847e-05, 'epoch': 0.99} {'loss': 0.5138, 'learning_rate': 1.0685528292299184e-05, 'epoch': 0.99} {'loss': 0.62, 'learning_rate': 1.0685193104649689e-05, 'epoch': 0.99} {'loss': 0.5066, 'learning_rate': 1.0684857916226742e-05, 'epoch': 0.99} {'loss': 0.5026, 'learning_rate': 1.0684522727030721e-05, 'epoch': 0.99} {'loss': 0.4931, 'learning_rate': 1.0684187537062004e-05, 'epoch': 0.99} {'loss': 0.6305, 'learning_rate': 1.0683852346320969e-05, 'epoch': 0.99} {'loss': 0.558, 'learning_rate': 1.0683517154807994e-05, 'epoch': 0.99} {'loss': 0.6012, 'learning_rate': 1.068318196252346e-05, 'epoch': 0.99} {'loss': 0.5362, 'learning_rate': 1.0682846769467741e-05, 'epoch': 0.99} {'loss': 0.7542, 'learning_rate': 1.0682511575641219e-05, 'epoch': 0.99} {'loss': 0.4876, 'learning_rate': 1.0682176381044272e-05, 'epoch': 0.99} {'loss': 0.4896, 'learning_rate': 1.068184118567728e-05, 'epoch': 0.99} {'loss': 0.5361, 'learning_rate': 1.0681505989540614e-05, 'epoch': 0.99} {'loss': 0.4464, 'learning_rate': 1.068117079263466e-05, 'epoch': 0.99} {'loss': 0.5057, 'learning_rate': 1.0680835594959793e-05, 'epoch': 0.99} {'loss': 0.5116, 'learning_rate': 1.0680500396516391e-05, 'epoch': 0.99} {'loss': 0.5726, 'learning_rate': 1.0680165197304835e-05, 'epoch': 0.99} {'loss': 0.4931, 'learning_rate': 1.0679829997325501e-05, 'epoch': 0.99} {'loss': 0.4618, 'learning_rate': 1.067949479657877e-05, 'epoch': 0.99} {'loss': 0.4954, 'learning_rate': 1.0679159595065017e-05, 'epoch': 0.99} {'loss': 0.6082, 'learning_rate': 1.0678824392784622e-05, 'epoch': 0.99} {'loss': 0.4946, 'learning_rate': 1.0678489189737961e-05, 'epoch': 0.99} {'loss': 0.6234, 'learning_rate': 1.0678153985925419e-05, 'epoch': 0.99} {'loss': 0.3964, 'learning_rate': 1.0677818781347367e-05, 'epoch': 0.99} {'loss': 0.4357, 'learning_rate': 1.067748357600419e-05, 'epoch': 0.99} {'loss': 0.4903, 'learning_rate': 1.0677148369896262e-05, 'epoch': 0.99} {'loss': 0.3875, 'learning_rate': 1.067681316302396e-05, 'epoch': 0.99} {'loss': 0.6093, 'learning_rate': 1.0676477955387666e-05, 'epoch': 0.99} {'loss': 0.5617, 'learning_rate': 1.0676142746987757e-05, 'epoch': 0.99} {'loss': 0.6158, 'learning_rate': 1.067580753782461e-05, 'epoch': 0.99} {'loss': 0.4742, 'learning_rate': 1.0675472327898607e-05, 'epoch': 0.99} {'loss': 0.7126, 'learning_rate': 1.0675137117210122e-05, 'epoch': 0.99} {'loss': 0.4241, 'learning_rate': 1.0674801905759533e-05, 'epoch': 0.99} {'loss': 0.5457, 'learning_rate': 1.0674466693547226e-05, 'epoch': 0.99} {'loss': 0.6448, 'learning_rate': 1.0674131480573573e-05, 'epoch': 0.99} {'loss': 0.5476, 'learning_rate': 1.0673796266838953e-05, 'epoch': 0.99} {'loss': 0.6378, 'learning_rate': 1.0673461052343748e-05, 'epoch': 0.99} {'loss': 0.5275, 'learning_rate': 1.067312583708833e-05, 'epoch': 0.99} {'loss': 0.5241, 'learning_rate': 1.0672790621073083e-05, 'epoch': 0.99} {'loss': 0.4486, 'learning_rate': 1.0672455404298384e-05, 'epoch': 0.99} {'loss': 0.4198, 'learning_rate': 1.0672120186764607e-05, 'epoch': 0.99} {'loss': 0.4756, 'learning_rate': 1.0671784968472137e-05, 'epoch': 0.99} {'loss': 0.5179, 'learning_rate': 1.0671449749421348e-05, 'epoch': 0.99} {'loss': 0.5947, 'learning_rate': 1.067111452961262e-05, 'epoch': 0.99} {'loss': 0.5361, 'learning_rate': 1.0670779309046332e-05, 'epoch': 0.99} {'loss': 0.629, 'learning_rate': 1.0670444087722863e-05, 'epoch': 0.99} {'loss': 0.4063, 'learning_rate': 1.067010886564259e-05, 'epoch': 0.99} {'loss': 0.511, 'learning_rate': 1.0669773642805889e-05, 'epoch': 0.99} {'loss': 0.6832, 'learning_rate': 1.0669438419213145e-05, 'epoch': 0.99} {'loss': 0.4708, 'learning_rate': 1.066910319486473e-05, 'epoch': 0.99} {'loss': 0.5317, 'learning_rate': 1.0668767969761025e-05, 'epoch': 0.99} {'loss': 0.5979, 'learning_rate': 1.0668432743902405e-05, 'epoch': 0.99} {'loss': 0.4892, 'learning_rate': 1.0668097517289256e-05, 'epoch': 0.99} {'loss': 0.4424, 'learning_rate': 1.066776228992195e-05, 'epoch': 0.99} {'loss': 0.5836, 'learning_rate': 1.0667427061800868e-05, 'epoch': 0.99} {'loss': 0.5889, 'learning_rate': 1.0667091832926386e-05, 'epoch': 0.99} {'loss': 0.619, 'learning_rate': 1.0666756603298885e-05, 'epoch': 0.99} {'loss': 0.632, 'learning_rate': 1.0666421372918743e-05, 'epoch': 0.99} {'loss': 0.6835, 'learning_rate': 1.0666086141786339e-05, 'epoch': 0.99} {'loss': 0.5564, 'learning_rate': 1.0665750909902049e-05, 'epoch': 0.99} {'loss': 0.6699, 'learning_rate': 1.0665415677266253e-05, 'epoch': 0.99} {'loss': 0.4499, 'learning_rate': 1.0665080443879331e-05, 'epoch': 0.99} {'loss': 0.5102, 'learning_rate': 1.0664745209741658e-05, 'epoch': 0.99} {'loss': 0.6204, 'learning_rate': 1.0664409974853613e-05, 'epoch': 0.99} {'loss': 0.5601, 'learning_rate': 1.0664074739215578e-05, 'epoch': 0.99} {'loss': 0.5759, 'learning_rate': 1.0663739502827929e-05, 'epoch': 0.99} {'loss': 0.5638, 'learning_rate': 1.0663404265691042e-05, 'epoch': 0.99} {'loss': 0.4223, 'learning_rate': 1.0663069027805298e-05, 'epoch': 0.99} {'loss': 0.6495, 'learning_rate': 1.0662733789171075e-05, 'epoch': 0.99} {'loss': 0.5314, 'learning_rate': 1.0662398549788753e-05, 'epoch': 0.99} {'loss': 0.6638, 'learning_rate': 1.0662063309658708e-05, 'epoch': 0.99} {'loss': 0.5332, 'learning_rate': 1.0661728068781318e-05, 'epoch': 0.99} {'loss': 0.6044, 'learning_rate': 1.0661392827156966e-05, 'epoch': 0.99} {'loss': 0.5203, 'learning_rate': 1.0661057584786025e-05, 'epoch': 0.99} {'loss': 0.5666, 'learning_rate': 1.0660722341668879e-05, 'epoch': 0.99} {'loss': 0.5242, 'learning_rate': 1.06603870978059e-05, 'epoch': 0.99} {'loss': 0.6254, 'learning_rate': 1.0660051853197471e-05, 'epoch': 0.99} {'loss': 0.6063, 'learning_rate': 1.0659716607843968e-05, 'epoch': 0.99} {'loss': 0.5991, 'learning_rate': 1.065938136174577e-05, 'epoch': 0.99} {'loss': 0.4317, 'learning_rate': 1.0659046114903258e-05, 'epoch': 0.99} {'loss': 0.549, 'learning_rate': 1.0658710867316805e-05, 'epoch': 0.99} {'loss': 0.4534, 'learning_rate': 1.0658375618986793e-05, 'epoch': 0.99} {'loss': 0.5464, 'learning_rate': 1.0658040369913601e-05, 'epoch': 0.99} {'loss': 0.4531, 'learning_rate': 1.0657705120097605e-05, 'epoch': 0.99} {'loss': 0.3785, 'learning_rate': 1.0657369869539191e-05, 'epoch': 0.99} {'loss': 0.4425, 'learning_rate': 1.0657034618238726e-05, 'epoch': 0.99} {'loss': 0.5104, 'learning_rate': 1.0656699366196597e-05, 'epoch': 0.99} {'loss': 0.4983, 'learning_rate': 1.0656364113413178e-05, 'epoch': 0.99} {'loss': 0.709, 'learning_rate': 1.0656028859888847e-05, 'epoch': 0.99} {'loss': 0.4358, 'learning_rate': 1.0655693605623984e-05, 'epoch': 0.99} {'loss': 0.7252, 'learning_rate': 1.065535835061897e-05, 'epoch': 0.99} {'loss': 0.3913, 'learning_rate': 1.065502309487418e-05, 'epoch': 0.99} {'loss': 0.5533, 'learning_rate': 1.0654687838389995e-05, 'epoch': 0.99} {'loss': 0.4194, 'learning_rate': 1.0654352581166789e-05, 'epoch': 0.99} {'loss': 0.5224, 'learning_rate': 1.0654017323204947e-05, 'epoch': 0.99} {'loss': 0.613, 'learning_rate': 1.065368206450484e-05, 'epoch': 0.99} {'loss': 0.5779, 'learning_rate': 1.0653346805066852e-05, 'epoch': 0.99} {'loss': 0.5306, 'learning_rate': 1.0653011544891358e-05, 'epoch': 0.99} {'loss': 0.5426, 'learning_rate': 1.0652676283978742e-05, 'epoch': 0.99} {'loss': 0.6214, 'learning_rate': 1.0652341022329378e-05, 'epoch': 0.99} {'loss': 0.7246, 'learning_rate': 1.0652005759943641e-05, 'epoch': 0.99} {'loss': 0.6002, 'learning_rate': 1.0651670496821918e-05, 'epoch': 0.99} {'loss': 0.3911, 'learning_rate': 1.065133523296458e-05, 'epoch': 0.99} {'loss': 0.5657, 'learning_rate': 1.0650999968372008e-05, 'epoch': 0.99} {'loss': 0.4842, 'learning_rate': 1.0650664703044584e-05, 'epoch': 0.99} {'loss': 0.4638, 'learning_rate': 1.0650329436982681e-05, 'epoch': 0.99} {'loss': 0.5003, 'learning_rate': 1.064999417018668e-05, 'epoch': 0.99} {'loss': 0.5531, 'learning_rate': 1.0649658902656958e-05, 'epoch': 0.99} {'loss': 0.501, 'learning_rate': 1.0649323634393897e-05, 'epoch': 0.99} {'loss': 0.4894, 'learning_rate': 1.0648988365397872e-05, 'epoch': 0.99} {'loss': 0.3338, 'learning_rate': 1.0648653095669261e-05, 'epoch': 0.99} {'loss': 0.6153, 'learning_rate': 1.064831782520845e-05, 'epoch': 0.99} {'loss': 0.5653, 'learning_rate': 1.0647982554015805e-05, 'epoch': 0.99} {'loss': 0.6873, 'learning_rate': 1.0647647282091714e-05, 'epoch': 0.99} {'loss': 0.3933, 'learning_rate': 1.064731200943655e-05, 'epoch': 0.99} {'loss': 0.577, 'learning_rate': 1.0646976736050695e-05, 'epoch': 0.99} {'loss': 0.4474, 'learning_rate': 1.0646641461934528e-05, 'epoch': 0.99} {'loss': 0.4756, 'learning_rate': 1.0646306187088422e-05, 'epoch': 0.99} {'loss': 0.4566, 'learning_rate': 1.0645970911512762e-05, 'epoch': 0.99} {'loss': 0.4999, 'learning_rate': 1.0645635635207923e-05, 'epoch': 0.99} {'loss': 0.6972, 'learning_rate': 1.0645300358174285e-05, 'epoch': 0.99} {'loss': 0.4772, 'learning_rate': 1.0644965080412224e-05, 'epoch': 0.99} {'loss': 0.7508, 'learning_rate': 1.0644629801922121e-05, 'epoch': 0.99} {'loss': 0.5667, 'learning_rate': 1.0644294522704353e-05, 'epoch': 0.99} {'loss': 0.5431, 'learning_rate': 1.0643959242759303e-05, 'epoch': 0.99} {'loss': 0.4978, 'learning_rate': 1.0643623962087342e-05, 'epoch': 0.99} {'loss': 0.5023, 'learning_rate': 1.064328868068885e-05, 'epoch': 0.99} {'loss': 0.6209, 'learning_rate': 1.0642953398564209e-05, 'epoch': 0.99} {'loss': 0.6402, 'learning_rate': 1.0642618115713796e-05, 'epoch': 0.99} {'loss': 0.4789, 'learning_rate': 1.0642282832137989e-05, 'epoch': 0.99} {'loss': 0.5192, 'learning_rate': 1.0641947547837169e-05, 'epoch': 0.99} {'loss': 0.5662, 'learning_rate': 1.0641612262811709e-05, 'epoch': 0.99} {'loss': 0.3412, 'learning_rate': 1.0641276977061992e-05, 'epoch': 0.99} {'loss': 0.6573, 'learning_rate': 1.0640941690588393e-05, 'epoch': 0.99} {'loss': 0.7307, 'learning_rate': 1.0640606403391299e-05, 'epoch': 0.99} {'loss': 0.5325, 'learning_rate': 1.0640271115471076e-05, 'epoch': 0.99} {'loss': 0.4606, 'learning_rate': 1.0639935826828113e-05, 'epoch': 0.99} {'loss': 0.5044, 'learning_rate': 1.0639600537462782e-05, 'epoch': 0.99} {'loss': 0.5821, 'learning_rate': 1.0639265247375463e-05, 'epoch': 0.99} {'loss': 0.3102, 'learning_rate': 1.0638929956566537e-05, 'epoch': 0.99} {'loss': 0.5998, 'learning_rate': 1.0638594665036379e-05, 'epoch': 0.99} {'loss': 0.577, 'learning_rate': 1.0638259372785369e-05, 'epoch': 0.99} {'loss': 0.5488, 'learning_rate': 1.0637924079813886e-05, 'epoch': 0.99} {'loss': 0.7089, 'learning_rate': 1.0637588786122308e-05, 'epoch': 0.99} {'loss': 0.5618, 'learning_rate': 1.0637253491711015e-05, 'epoch': 0.99} {'loss': 0.4502, 'learning_rate': 1.0636918196580381e-05, 'epoch': 0.99} {'loss': 0.6297, 'learning_rate': 1.0636582900730789e-05, 'epoch': 0.99} {'loss': 0.4894, 'learning_rate': 1.063624760416262e-05, 'epoch': 0.99} {'loss': 0.5614, 'learning_rate': 1.0635912306876244e-05, 'epoch': 0.99} {'loss': 0.497, 'learning_rate': 1.0635577008872044e-05, 'epoch': 0.99} {'loss': 0.4075, 'learning_rate': 1.0635241710150398e-05, 'epoch': 0.99} {'loss': 0.6212, 'learning_rate': 1.0634906410711687e-05, 'epoch': 0.99} {'loss': 0.6515, 'learning_rate': 1.0634571110556286e-05, 'epoch': 0.99} {'loss': 0.3851, 'learning_rate': 1.0634235809684574e-05, 'epoch': 0.99} {'loss': 0.5342, 'learning_rate': 1.0633900508096933e-05, 'epoch': 0.99} {'loss': 0.5615, 'learning_rate': 1.0633565205793736e-05, 'epoch': 0.99} {'loss': 0.71, 'learning_rate': 1.0633229902775367e-05, 'epoch': 0.99} {'loss': 0.5295, 'learning_rate': 1.0632894599042198e-05, 'epoch': 0.99} {'loss': 0.7305, 'learning_rate': 1.0632559294594615e-05, 'epoch': 0.99} {'loss': 0.4717, 'learning_rate': 1.063222398943299e-05, 'epoch': 0.99} {'loss': 0.626, 'learning_rate': 1.0631888683557709e-05, 'epoch': 0.99} {'loss': 0.6833, 'learning_rate': 1.0631553376969143e-05, 'epoch': 0.99} {'loss': 0.5393, 'learning_rate': 1.0631218069667676e-05, 'epoch': 0.99} {'loss': 0.54, 'learning_rate': 1.0630882761653679e-05, 'epoch': 0.99} {'loss': 0.6665, 'learning_rate': 1.0630547452927537e-05, 'epoch': 0.99} {'loss': 0.4681, 'learning_rate': 1.0630212143489627e-05, 'epoch': 0.99} {'loss': 0.5003, 'learning_rate': 1.0629876833340327e-05, 'epoch': 0.99} {'loss': 0.4759, 'learning_rate': 1.0629541522480016e-05, 'epoch': 0.99} {'loss': 0.5377, 'learning_rate': 1.0629206210909074e-05, 'epoch': 0.99} {'loss': 0.5285, 'learning_rate': 1.0628870898627876e-05, 'epoch': 0.99} {'loss': 0.5413, 'learning_rate': 1.0628535585636803e-05, 'epoch': 0.99} {'loss': 0.6547, 'learning_rate': 1.0628200271936234e-05, 'epoch': 0.99} {'loss': 0.6007, 'learning_rate': 1.0627864957526544e-05, 'epoch': 0.99} {'loss': 0.556, 'learning_rate': 1.0627529642408114e-05, 'epoch': 0.99} {'loss': 0.385, 'learning_rate': 1.0627194326581324e-05, 'epoch': 0.99} {'loss': 0.5233, 'learning_rate': 1.062685901004655e-05, 'epoch': 0.99} {'loss': 0.6289, 'learning_rate': 1.0626523692804174e-05, 'epoch': 0.99} {'loss': 0.4404, 'learning_rate': 1.0626188374854569e-05, 'epoch': 0.99} {'loss': 0.4814, 'learning_rate': 1.0625853056198116e-05, 'epoch': 0.99} {'loss': 0.5776, 'learning_rate': 1.0625517736835196e-05, 'epoch': 0.99} {'loss': 0.4202, 'learning_rate': 1.0625182416766182e-05, 'epoch': 0.99} {'loss': 0.6138, 'learning_rate': 1.0624847095991458e-05, 'epoch': 0.99} {'loss': 0.5582, 'learning_rate': 1.0624511774511399e-05, 'epoch': 0.99} {'loss': 0.5782, 'learning_rate': 1.0624176452326387e-05, 'epoch': 0.99} {'loss': 0.4914, 'learning_rate': 1.06238411294368e-05, 'epoch': 0.99} {'loss': 0.5068, 'learning_rate': 1.0623505805843014e-05, 'epoch': 0.99} {'loss': 0.425, 'learning_rate': 1.0623170481545406e-05, 'epoch': 0.99} {'loss': 0.4664, 'learning_rate': 1.0622835156544357e-05, 'epoch': 0.99} {'loss': 0.5629, 'learning_rate': 1.062249983084025e-05, 'epoch': 0.99} {'loss': 0.4365, 'learning_rate': 1.0622164504433454e-05, 'epoch': 0.99} {'loss': 0.5014, 'learning_rate': 1.0621829177324353e-05, 'epoch': 0.99} {'loss': 0.5978, 'learning_rate': 1.062149384951333e-05, 'epoch': 0.99} {'loss': 0.4653, 'learning_rate': 1.0621158521000755e-05, 'epoch': 0.99} {'loss': 0.5732, 'learning_rate': 1.062082319178701e-05, 'epoch': 0.99} {'loss': 0.6422, 'learning_rate': 1.0620487861872475e-05, 'epoch': 0.99} {'loss': 0.5053, 'learning_rate': 1.0620152531257525e-05, 'epoch': 0.99} {'loss': 0.4366, 'learning_rate': 1.0619817199942542e-05, 'epoch': 0.99} {'loss': 0.5469, 'learning_rate': 1.0619481867927905e-05, 'epoch': 0.99} {'loss': 0.678, 'learning_rate': 1.061914653521399e-05, 'epoch': 0.99} {'loss': 0.5088, 'learning_rate': 1.0618811201801176e-05, 'epoch': 0.99} {'loss': 0.6298, 'learning_rate': 1.0618475867689841e-05, 'epoch': 0.99} {'loss': 0.5502, 'learning_rate': 1.0618140532880365e-05, 'epoch': 0.99} {'loss': 0.5487, 'learning_rate': 1.0617805197373126e-05, 'epoch': 0.99} {'loss': 0.4279, 'learning_rate': 1.06174698611685e-05, 'epoch': 0.99} {'loss': 0.4281, 'learning_rate': 1.061713452426687e-05, 'epoch': 0.99} {'loss': 0.4772, 'learning_rate': 1.0616799186668613e-05, 'epoch': 0.99} {'loss': 0.5182, 'learning_rate': 1.0616463848374105e-05, 'epoch': 0.99} {'loss': 0.3723, 'learning_rate': 1.061612850938373e-05, 'epoch': 0.99} {'loss': 0.472, 'learning_rate': 1.061579316969786e-05, 'epoch': 0.99} {'loss': 0.5237, 'learning_rate': 1.0615457829316878e-05, 'epoch': 0.99} {'loss': 0.6318, 'learning_rate': 1.0615122488241163e-05, 'epoch': 0.99} {'loss': 0.542, 'learning_rate': 1.0614787146471089e-05, 'epoch': 0.99} {'loss': 0.4926, 'learning_rate': 1.0614451804007037e-05, 'epoch': 0.99} {'loss': 0.5481, 'learning_rate': 1.0614116460849386e-05, 'epoch': 0.99} {'loss': 0.5716, 'learning_rate': 1.0613781116998516e-05, 'epoch': 0.99} {'loss': 0.5215, 'learning_rate': 1.0613445772454802e-05, 'epoch': 0.99} {'loss': 0.5657, 'learning_rate': 1.0613110427218625e-05, 'epoch': 0.99} {'loss': 0.4805, 'learning_rate': 1.0612775081290363e-05, 'epoch': 0.99} {'loss': 0.4958, 'learning_rate': 1.0612439734670395e-05, 'epoch': 0.99} {'loss': 0.5495, 'learning_rate': 1.0612104387359097e-05, 'epoch': 0.99} {'loss': 0.6073, 'learning_rate': 1.0611769039356851e-05, 'epoch': 0.99} {'loss': 0.6519, 'learning_rate': 1.0611433690664035e-05, 'epoch': 0.99} {'loss': 0.4908, 'learning_rate': 1.0611098341281023e-05, 'epoch': 0.99} {'loss': 0.5284, 'learning_rate': 1.0610762991208203e-05, 'epoch': 0.99} {'loss': 0.5296, 'learning_rate': 1.0610427640445945e-05, 'epoch': 0.99} {'loss': 0.5756, 'learning_rate': 1.061009228899463e-05, 'epoch': 0.99} {'loss': 0.3547, 'learning_rate': 1.0609756936854636e-05, 'epoch': 0.99} {'loss': 0.6448, 'learning_rate': 1.0609421584026342e-05, 'epoch': 0.99} {'loss': 0.5477, 'learning_rate': 1.0609086230510128e-05, 'epoch': 0.99} {'loss': 0.4584, 'learning_rate': 1.0608750876306371e-05, 'epoch': 0.99} {'loss': 0.5258, 'learning_rate': 1.0608415521415452e-05, 'epoch': 0.99} {'loss': 0.3902, 'learning_rate': 1.0608080165837743e-05, 'epoch': 0.99} {'loss': 0.6528, 'learning_rate': 1.060774480957363e-05, 'epoch': 0.99} {'loss': 0.5426, 'learning_rate': 1.0607409452623488e-05, 'epoch': 0.99} {'loss': 0.4897, 'learning_rate': 1.0607074094987699e-05, 'epoch': 0.99} {'loss': 0.6688, 'learning_rate': 1.0606738736666638e-05, 'epoch': 0.99} {'loss': 0.447, 'learning_rate': 1.0606403377660682e-05, 'epoch': 0.99} {'loss': 0.6034, 'learning_rate': 1.0606068017970213e-05, 'epoch': 0.99} {'loss': 0.5504, 'learning_rate': 1.0605732657595609e-05, 'epoch': 0.99} {'loss': 0.5487, 'learning_rate': 1.0605397296537245e-05, 'epoch': 0.99} {'loss': 0.5259, 'learning_rate': 1.0605061934795506e-05, 'epoch': 0.99} {'loss': 0.4895, 'learning_rate': 1.0604726572370767e-05, 'epoch': 0.99} {'loss': 0.5633, 'learning_rate': 1.0604391209263405e-05, 'epoch': 0.99} {'loss': 0.5853, 'learning_rate': 1.0604055845473801e-05, 'epoch': 0.99} {'loss': 0.4465, 'learning_rate': 1.0603720481002333e-05, 'epoch': 0.99} {'loss': 0.7627, 'learning_rate': 1.0603385115849379e-05, 'epoch': 0.99} {'loss': 0.4694, 'learning_rate': 1.0603049750015319e-05, 'epoch': 0.99} {'loss': 0.5375, 'learning_rate': 1.0602714383500532e-05, 'epoch': 0.99} {'loss': 0.3708, 'learning_rate': 1.0602379016305392e-05, 'epoch': 0.99} {'loss': 0.4305, 'learning_rate': 1.0602043648430283e-05, 'epoch': 0.99} {'loss': 0.6505, 'learning_rate': 1.0601708279875579e-05, 'epoch': 0.99} {'loss': 0.511, 'learning_rate': 1.060137291064166e-05, 'epoch': 0.99} {'loss': 0.5331, 'learning_rate': 1.0601037540728907e-05, 'epoch': 0.99} {'loss': 0.5474, 'learning_rate': 1.0600702170137698e-05, 'epoch': 0.99} {'loss': 0.4306, 'learning_rate': 1.0600366798868409e-05, 'epoch': 0.99} {'loss': 0.5043, 'learning_rate': 1.060003142692142e-05, 'epoch': 0.99} {'loss': 0.4885, 'learning_rate': 1.0599696054297108e-05, 'epoch': 0.99} {'loss': 0.5338, 'learning_rate': 1.0599360680995856e-05, 'epoch': 0.99} {'loss': 0.6284, 'learning_rate': 1.0599025307018038e-05, 'epoch': 0.99} {'loss': 0.3677, 'learning_rate': 1.0598689932364035e-05, 'epoch': 0.99} {'loss': 0.5209, 'learning_rate': 1.0598354557034227e-05, 'epoch': 0.99} {'loss': 0.4219, 'learning_rate': 1.0598019181028989e-05, 'epoch': 0.99} {'loss': 0.4684, 'learning_rate': 1.05976838043487e-05, 'epoch': 0.99} {'loss': 0.6156, 'learning_rate': 1.0597348426993741e-05, 'epoch': 0.99} {'loss': 0.5301, 'learning_rate': 1.0597013048964489e-05, 'epoch': 0.99} {'loss': 0.6431, 'learning_rate': 1.0596677670261322e-05, 'epoch': 0.99} {'loss': 0.5916, 'learning_rate': 1.0596342290884618e-05, 'epoch': 0.99} {'loss': 0.4556, 'learning_rate': 1.059600691083476e-05, 'epoch': 0.99} {'loss': 0.6193, 'learning_rate': 1.059567153011212e-05, 'epoch': 0.99} {'loss': 0.7319, 'learning_rate': 1.0595336148717083e-05, 'epoch': 0.99} {'loss': 0.4852, 'learning_rate': 1.0595000766650025e-05, 'epoch': 0.99} {'loss': 0.583, 'learning_rate': 1.0594665383911322e-05, 'epoch': 0.99} {'loss': 0.4268, 'learning_rate': 1.0594330000501355e-05, 'epoch': 0.99} {'loss': 0.4521, 'learning_rate': 1.0593994616420507e-05, 'epoch': 0.99} {'loss': 0.5015, 'learning_rate': 1.0593659231669148e-05, 'epoch': 0.99} {'loss': 0.3162, 'learning_rate': 1.0593323846247663e-05, 'epoch': 0.99} {'loss': 0.4054, 'learning_rate': 1.0592988460156426e-05, 'epoch': 0.99} {'loss': 0.5934, 'learning_rate': 1.0592653073395817e-05, 'epoch': 0.99} {'loss': 0.6287, 'learning_rate': 1.0592317685966215e-05, 'epoch': 0.99} {'loss': 0.5251, 'learning_rate': 1.0591982297868001e-05, 'epoch': 0.99} {'loss': 0.4921, 'learning_rate': 1.0591646909101551e-05, 'epoch': 0.99} {'loss': 0.4682, 'learning_rate': 1.0591311519667242e-05, 'epoch': 0.99} {'loss': 0.6152, 'learning_rate': 1.0590976129565458e-05, 'epoch': 0.99} {'loss': 0.5654, 'learning_rate': 1.0590640738796576e-05, 'epoch': 0.99} {'loss': 0.5364, 'learning_rate': 1.0590305347360969e-05, 'epoch': 0.99} {'loss': 0.4908, 'learning_rate': 1.058996995525902e-05, 'epoch': 0.99} {'loss': 0.6209, 'learning_rate': 1.058963456249111e-05, 'epoch': 0.99} {'loss': 0.6302, 'learning_rate': 1.0589299169057611e-05, 'epoch': 0.99} {'loss': 0.4343, 'learning_rate': 1.0588963774958907e-05, 'epoch': 0.99} {'loss': 0.5525, 'learning_rate': 1.0588628380195374e-05, 'epoch': 0.99} {'loss': 0.4971, 'learning_rate': 1.0588292984767392e-05, 'epoch': 0.99} {'loss': 0.6081, 'learning_rate': 1.058795758867534e-05, 'epoch': 0.99} {'loss': 0.4832, 'learning_rate': 1.0587622191919596e-05, 'epoch': 0.99} {'loss': 0.5648, 'learning_rate': 1.0587286794500536e-05, 'epoch': 0.99} {'loss': 0.7031, 'learning_rate': 1.0586951396418541e-05, 'epoch': 0.99} {'loss': 0.501, 'learning_rate': 1.0586615997673992e-05, 'epoch': 0.99} {'loss': 0.6035, 'learning_rate': 1.0586280598267264e-05, 'epoch': 0.99} {'loss': 0.4787, 'learning_rate': 1.0585945198198736e-05, 'epoch': 0.99} {'loss': 0.4716, 'learning_rate': 1.058560979746879e-05, 'epoch': 0.99} {'loss': 0.5165, 'learning_rate': 1.0585274396077797e-05, 'epoch': 0.99} {'loss': 0.5801, 'learning_rate': 1.0584938994026144e-05, 'epoch': 0.99} {'loss': 0.6058, 'learning_rate': 1.0584603591314207e-05, 'epoch': 1.0} {'loss': 0.5899, 'learning_rate': 1.0584268187942361e-05, 'epoch': 1.0} {'loss': 0.4641, 'learning_rate': 1.0583932783910988e-05, 'epoch': 1.0} {'loss': 0.5697, 'learning_rate': 1.0583597379220467e-05, 'epoch': 1.0} {'loss': 0.3715, 'learning_rate': 1.0583261973871173e-05, 'epoch': 1.0} {'loss': 0.5132, 'learning_rate': 1.058292656786349e-05, 'epoch': 1.0} {'loss': 0.5479, 'learning_rate': 1.0582591161197793e-05, 'epoch': 1.0} {'loss': 0.527, 'learning_rate': 1.058225575387446e-05, 'epoch': 1.0} {'loss': 0.5491, 'learning_rate': 1.0581920345893872e-05, 'epoch': 1.0} {'loss': 0.5119, 'learning_rate': 1.0581584937256408e-05, 'epoch': 1.0} {'loss': 0.4484, 'learning_rate': 1.0581249527962445e-05, 'epoch': 1.0} {'loss': 0.6202, 'learning_rate': 1.058091411801236e-05, 'epoch': 1.0} {'loss': 0.3832, 'learning_rate': 1.0580578707406532e-05, 'epoch': 1.0} {'loss': 0.464, 'learning_rate': 1.0580243296145344e-05, 'epoch': 1.0} {'loss': 0.5722, 'learning_rate': 1.057990788422917e-05, 'epoch': 1.0} {'loss': 0.6062, 'learning_rate': 1.0579572471658392e-05, 'epoch': 1.0} {'loss': 0.5715, 'learning_rate': 1.0579237058433384e-05, 'epoch': 1.0} {'loss': 0.4821, 'learning_rate': 1.0578901644554531e-05, 'epoch': 1.0} {'loss': 0.4186, 'learning_rate': 1.0578566230022206e-05, 'epoch': 1.0} {'loss': 0.5468, 'learning_rate': 1.057823081483679e-05, 'epoch': 1.0} {'loss': 0.5539, 'learning_rate': 1.0577895398998662e-05, 'epoch': 1.0} {'loss': 0.6616, 'learning_rate': 1.05775599825082e-05, 'epoch': 1.0} {'loss': 0.5681, 'learning_rate': 1.0577224565365785e-05, 'epoch': 1.0} {'loss': 0.4157, 'learning_rate': 1.057688914757179e-05, 'epoch': 1.0} {'loss': 0.6124, 'learning_rate': 1.0576553729126596e-05, 'epoch': 1.0} {'loss': 0.5804, 'learning_rate': 1.0576218310030584e-05, 'epoch': 1.0} {'loss': 0.5287, 'learning_rate': 1.057588289028413e-05, 'epoch': 1.0} {'loss': 0.591, 'learning_rate': 1.0575547469887615e-05, 'epoch': 1.0} {'loss': 0.4836, 'learning_rate': 1.0575212048841417e-05, 'epoch': 1.0} {'loss': 0.5046, 'learning_rate': 1.0574876627145908e-05, 'epoch': 1.0} {'loss': 0.5085, 'learning_rate': 1.0574541204801478e-05, 'epoch': 1.0} {'loss': 0.6186, 'learning_rate': 1.05742057818085e-05, 'epoch': 1.0} {'loss': 0.4192, 'learning_rate': 1.0573870358167355e-05, 'epoch': 1.0} {'loss': 0.5337, 'learning_rate': 1.0573534933878418e-05, 'epoch': 1.0} {'loss': 0.5369, 'learning_rate': 1.0573199508942067e-05, 'epoch': 1.0} {'loss': 0.5031, 'learning_rate': 1.0572864083358686e-05, 'epoch': 1.0} {'loss': 0.4375, 'learning_rate': 1.0572528657128647e-05, 'epoch': 1.0} {'loss': 0.5816, 'learning_rate': 1.0572193230252332e-05, 'epoch': 1.0} {'loss': 0.3353, 'learning_rate': 1.057185780273012e-05, 'epoch': 1.0} {'loss': 0.6506, 'learning_rate': 1.0571522374562393e-05, 'epoch': 1.0} {'loss': 0.5744, 'learning_rate': 1.0571186945749523e-05, 'epoch': 1.0} {'loss': 0.6094, 'learning_rate': 1.057085151629189e-05, 'epoch': 1.0} {'loss': 0.519, 'learning_rate': 1.0570516086189877e-05, 'epoch': 1.0} {'loss': 0.6645, 'learning_rate': 1.0570180655443859e-05, 'epoch': 1.0} {'loss': 0.5393, 'learning_rate': 1.0569845224054214e-05, 'epoch': 1.0} {'loss': 0.6248, 'learning_rate': 1.0569509792021326e-05, 'epoch': 1.0} {'loss': 0.4991, 'learning_rate': 1.0569174359345567e-05, 'epoch': 1.0} {'loss': 0.6953, 'learning_rate': 1.0568838926027318e-05, 'epoch': 1.0} {'loss': 0.6124, 'learning_rate': 1.0568503492066959e-05, 'epoch': 1.0} {'loss': 0.5285, 'learning_rate': 1.0568168057464867e-05, 'epoch': 1.0} {'loss': 0.401, 'learning_rate': 1.0567832622221421e-05, 'epoch': 1.0} {'loss': 0.6593, 'learning_rate': 1.0567497186337001e-05, 'epoch': 1.0} {'loss': 0.4901, 'learning_rate': 1.0567161749811982e-05, 'epoch': 1.0} {'loss': 0.6406, 'learning_rate': 1.056682631264675e-05, 'epoch': 1.0} {'loss': 0.3919, 'learning_rate': 1.0566490874841675e-05, 'epoch': 1.0} {'loss': 0.4773, 'learning_rate': 1.056615543639714e-05, 'epoch': 1.0} {'loss': 0.5004, 'learning_rate': 1.0565819997313524e-05, 'epoch': 1.0} {'loss': 0.6068, 'learning_rate': 1.0565484557591205e-05, 'epoch': 1.0} {'loss': 0.5299, 'learning_rate': 1.0565149117230562e-05, 'epoch': 1.0} {'loss': 0.5897, 'learning_rate': 1.0564813676231974e-05, 'epoch': 1.0} {'loss': 0.4694, 'learning_rate': 1.0564478234595816e-05, 'epoch': 1.0} {'loss': 0.6861, 'learning_rate': 1.0564142792322472e-05, 'epoch': 1.0} {'loss': 0.6413, 'learning_rate': 1.0563807349412313e-05, 'epoch': 1.0} {'loss': 0.5609, 'learning_rate': 1.0563471905865727e-05, 'epoch': 1.0} {'loss': 0.5724, 'learning_rate': 1.0563136461683088e-05, 'epoch': 1.0} {'loss': 0.599, 'learning_rate': 1.0562801016864774e-05, 'epoch': 1.0} {'loss': 0.4692, 'learning_rate': 1.0562465571411167e-05, 'epoch': 1.0} {'loss': 0.3972, 'learning_rate': 1.056213012532264e-05, 'epoch': 1.0} {'loss': 0.5592, 'learning_rate': 1.0561794678599578e-05, 'epoch': 1.0} {'loss': 0.5723, 'learning_rate': 1.0561459231242354e-05, 'epoch': 1.0} {'loss': 0.5115, 'learning_rate': 1.056112378325135e-05, 'epoch': 1.0} {'loss': 0.45, 'learning_rate': 1.0560788334626948e-05, 'epoch': 1.0} {'loss': 0.6129, 'learning_rate': 1.0560452885369518e-05, 'epoch': 1.0} {'loss': 0.5969, 'learning_rate': 1.0560117435479444e-05, 'epoch': 1.0} {'loss': 0.4747, 'learning_rate': 1.0559781984957104e-05, 'epoch': 1.0} {'loss': 0.626, 'learning_rate': 1.0559446533802877e-05, 'epoch': 1.0} {'loss': 0.5396, 'learning_rate': 1.0559111082017142e-05, 'epoch': 1.0} {'loss': 0.5239, 'learning_rate': 1.0558775629600275e-05, 'epoch': 1.0} {'loss': 0.5915, 'learning_rate': 1.0558440176552657e-05, 'epoch': 1.0} {'loss': 0.5019, 'learning_rate': 1.0558104722874665e-05, 'epoch': 1.0} {'loss': 0.6436, 'learning_rate': 1.055776926856668e-05, 'epoch': 1.0} {'loss': 0.5003, 'learning_rate': 1.0557433813629082e-05, 'epoch': 1.0} {'loss': 0.6075, 'learning_rate': 1.0557098358062245e-05, 'epoch': 1.0} {'loss': 0.4846, 'learning_rate': 1.0556762901866551e-05, 'epoch': 1.0} {'loss': 0.5737, 'learning_rate': 1.0556427445042376e-05, 'epoch': 1.0} {'loss': 0.5516, 'learning_rate': 1.0556091987590102e-05, 'epoch': 1.0} {'loss': 0.5013, 'learning_rate': 1.0555756529510107e-05, 'epoch': 1.0} {'loss': 0.5457, 'learning_rate': 1.0555421070802765e-05, 'epoch': 1.0} {'loss': 0.4446, 'learning_rate': 1.055508561146846e-05, 'epoch': 1.0} {'loss': 0.5571, 'learning_rate': 1.055475015150757e-05, 'epoch': 1.0} {'loss': 0.4926, 'learning_rate': 1.0554414690920469e-05, 'epoch': 1.0} {'loss': 0.5996, 'learning_rate': 1.0554079229707541e-05, 'epoch': 1.0} {'loss': 0.5199, 'learning_rate': 1.0553743767869165e-05, 'epoch': 1.0} {'loss': 0.476, 'learning_rate': 1.0553408305405715e-05, 'epoch': 1.0} {'loss': 0.5272, 'learning_rate': 1.0553072842317573e-05, 'epoch': 1.0} {'loss': 0.453, 'learning_rate': 1.055273737860512e-05, 'epoch': 1.0} {'loss': 0.6277, 'learning_rate': 1.0552401914268729e-05, 'epoch': 1.0} {'loss': 0.7352, 'learning_rate': 1.055206644930878e-05, 'epoch': 1.0} {'loss': 0.5645, 'learning_rate': 1.0551730983725654e-05, 'epoch': 1.0} {'loss': 0.4796, 'learning_rate': 1.055139551751973e-05, 'epoch': 1.0} {'loss': 0.6249, 'learning_rate': 1.0551060050691383e-05, 'epoch': 1.0} {'loss': 0.5473, 'learning_rate': 1.0550724583240995e-05, 'epoch': 1.0} {'loss': 0.4998, 'learning_rate': 1.0550389115168944e-05, 'epoch': 1.0} {'loss': 0.5128, 'learning_rate': 1.0550053646475609e-05, 'epoch': 1.0} {'loss': 0.5134, 'learning_rate': 1.0549718177161365e-05, 'epoch': 1.0} {'loss': 0.5342, 'learning_rate': 1.0549382707226597e-05, 'epoch': 1.0} {'loss': 0.7619, 'learning_rate': 1.0549047236671678e-05, 'epoch': 1.0} {'loss': 0.6079, 'learning_rate': 1.0548711765496991e-05, 'epoch': 1.0} {'loss': 0.4857, 'learning_rate': 1.0548376293702913e-05, 'epoch': 1.0} {'loss': 0.5672, 'learning_rate': 1.0548040821289823e-05, 'epoch': 1.0} {'loss': 0.4161, 'learning_rate': 1.0547705348258097e-05, 'epoch': 1.0} {'loss': 0.4737, 'learning_rate': 1.0547369874608115e-05, 'epoch': 1.0} {'loss': 0.5517, 'learning_rate': 1.0547034400340258e-05, 'epoch': 1.0} {'loss': 0.4645, 'learning_rate': 1.0546698925454903e-05, 'epoch': 1.0} {'loss': 0.6327, 'learning_rate': 1.054636344995243e-05, 'epoch': 1.0} {'loss': 0.4266, 'learning_rate': 1.0546027973833215e-05, 'epoch': 1.0} {'loss': 0.6516, 'learning_rate': 1.0545692497097639e-05, 'epoch': 1.0} {'loss': 0.6293, 'learning_rate': 1.054535701974608e-05, 'epoch': 1.0} {'loss': 0.4934, 'learning_rate': 1.0545021541778914e-05, 'epoch': 1.0} {'loss': 0.7387, 'learning_rate': 1.0544686063196526e-05, 'epoch': 1.0} {'loss': 0.537, 'learning_rate': 1.054435058399929e-05, 'epoch': 1.0} {'loss': 0.5107, 'learning_rate': 1.0544015104187589e-05, 'epoch': 1.0} {'loss': 0.6206, 'learning_rate': 1.0543679623761794e-05, 'epoch': 1.0} {'loss': 0.502, 'learning_rate': 1.0543344142722287e-05, 'epoch': 1.0} {'loss': 0.5283, 'learning_rate': 1.054300866106945e-05, 'epoch': 1.0} {'loss': 0.6094, 'learning_rate': 1.054267317880366e-05, 'epoch': 1.0} {'loss': 0.6118, 'learning_rate': 1.0542337695925294e-05, 'epoch': 1.0} {'loss': 0.7148, 'learning_rate': 1.0542002212434732e-05, 'epoch': 1.0} {'loss': 0.493, 'learning_rate': 1.0541666728332348e-05, 'epoch': 1.0} {'loss': 0.5116, 'learning_rate': 1.054133124361853e-05, 'epoch': 1.0} {'loss': 0.6143, 'learning_rate': 1.0540995758293653e-05, 'epoch': 1.0} {'loss': 0.4145, 'learning_rate': 1.0540660272358097e-05, 'epoch': 1.0} {'loss': 0.7237, 'learning_rate': 1.0540324785812235e-05, 'epoch': 1.0} {'loss': 0.4818, 'learning_rate': 1.0539989298656449e-05, 'epoch': 1.0} {'loss': 0.5345, 'learning_rate': 1.0539653810891117e-05, 'epoch': 1.0} {'loss': 0.5277, 'learning_rate': 1.053931832251662e-05, 'epoch': 1.0} {'loss': 0.4459, 'learning_rate': 1.0538982833533334e-05, 'epoch': 1.0} {'loss': 0.4371, 'learning_rate': 1.053864734394164e-05, 'epoch': 1.0} {'loss': 0.5726, 'learning_rate': 1.0538311853741915e-05, 'epoch': 1.0} {'loss': 0.586, 'learning_rate': 1.0537976362934537e-05, 'epoch': 1.0} {'loss': 0.6724, 'learning_rate': 1.0537640871519887e-05, 'epoch': 1.0} {'loss': 0.3939, 'learning_rate': 1.0537305379498342e-05, 'epoch': 1.0} {'loss': 0.5832, 'learning_rate': 1.0536969886870283e-05, 'epoch': 1.0} {'loss': 0.4877, 'learning_rate': 1.0536634393636085e-05, 'epoch': 1.0} {'loss': 0.5882, 'learning_rate': 1.0536298899796133e-05, 'epoch': 1.0} {'loss': 0.4178, 'learning_rate': 1.05359634053508e-05, 'epoch': 1.0} {'loss': 0.5378, 'learning_rate': 1.0535627910300464e-05, 'epoch': 1.0} {'loss': 0.6844, 'learning_rate': 1.0535292414645506e-05, 'epoch': 1.0} {'loss': 0.6152, 'learning_rate': 1.0534956918386306e-05, 'epoch': 1.0} {'loss': 0.3476, 'learning_rate': 1.053462142152324e-05, 'epoch': 1.0} {'loss': 0.5134, 'learning_rate': 1.0534285924056688e-05, 'epoch': 1.0} {'loss': 0.5395, 'learning_rate': 1.0533950425987033e-05, 'epoch': 1.0} {'loss': 0.4816, 'learning_rate': 1.0533614927314644e-05, 'epoch': 1.0} {'loss': 0.5432, 'learning_rate': 1.0533279428039908e-05, 'epoch': 1.0} {'loss': 0.5975, 'learning_rate': 1.05329439281632e-05, 'epoch': 1.0} {'loss': 0.3857, 'learning_rate': 1.05326084276849e-05, 'epoch': 1.0} {'loss': 0.6251, 'learning_rate': 1.0532272926605387e-05, 'epoch': 1.0} {'loss': 0.6804, 'learning_rate': 1.0531937424925038e-05, 'epoch': 1.0} {'loss': 0.5187, 'learning_rate': 1.0531601922644235e-05, 'epoch': 1.0} {'loss': 0.4656, 'learning_rate': 1.0531266419763353e-05, 'epoch': 1.0} {'loss': 0.441, 'learning_rate': 1.0530930916282773e-05, 'epoch': 1.0} {'loss': 0.6484, 'learning_rate': 1.0530595412202871e-05, 'epoch': 1.0} {'loss': 0.6633, 'learning_rate': 1.053025990752403e-05, 'epoch': 1.0} {'loss': 0.4787, 'learning_rate': 1.0529924402246622e-05, 'epoch': 1.0} {'loss': 0.6277, 'learning_rate': 1.0529588896371035e-05, 'epoch': 1.0} {'loss': 0.4916, 'learning_rate': 1.052925338989764e-05, 'epoch': 1.0} {'loss': 0.5284, 'learning_rate': 1.0528917882826821e-05, 'epoch': 1.0} {'loss': 0.5354, 'learning_rate': 1.0528582375158953e-05, 'epoch': 1.0} {'loss': 0.5206, 'learning_rate': 1.0528246866894416e-05, 'epoch': 1.0} {'loss': 0.5736, 'learning_rate': 1.052791135803359e-05, 'epoch': 1.0} {'loss': 0.5083, 'learning_rate': 1.052757584857685e-05, 'epoch': 1.0} {'loss': 0.5874, 'learning_rate': 1.052724033852458e-05, 'epoch': 1.0} {'loss': 0.6059, 'learning_rate': 1.0526904827877153e-05, 'epoch': 1.0} {'loss': 0.3773, 'learning_rate': 1.0526569316634951e-05, 'epoch': 1.0} {'loss': 0.6689, 'learning_rate': 1.0526233804798354e-05, 'epoch': 1.0} {'loss': 0.3735, 'learning_rate': 1.052589829236774e-05, 'epoch': 1.0} {'loss': 0.6222, 'learning_rate': 1.0525562779343484e-05, 'epoch': 1.0} {'loss': 0.634, 'learning_rate': 1.0525227265725968e-05, 'epoch': 1.0} {'loss': 0.6201, 'learning_rate': 1.052489175151557e-05, 'epoch': 1.0} {'loss': 0.617, 'learning_rate': 1.0524556236712668e-05, 'epoch': 1.0} {'loss': 0.606, 'learning_rate': 1.0524220721317647e-05, 'epoch': 1.0} {'loss': 0.5162, 'learning_rate': 1.0523885205330878e-05, 'epoch': 1.0} {'loss': 0.506, 'learning_rate': 1.0523549688752741e-05, 'epoch': 1.0} {'loss': 0.4112, 'learning_rate': 1.0523214171583616e-05, 'epoch': 1.0} {'loss': 0.5438, 'learning_rate': 1.0522878653823882e-05, 'epoch': 1.0} {'loss': 0.4035, 'learning_rate': 1.052254313547392e-05, 'epoch': 1.0} {'loss': 0.5791, 'learning_rate': 1.0522207616534101e-05, 'epoch': 1.0} {'loss': 0.5436, 'learning_rate': 1.0521872097004812e-05, 'epoch': 1.0} {'loss': 0.4916, 'learning_rate': 1.0521536576886428e-05, 'epoch': 1.0} {'loss': 0.5009, 'learning_rate': 1.052120105617933e-05, 'epoch': 1.0} {'loss': 0.6902, 'learning_rate': 1.0520865534883893e-05, 'epoch': 1.0} {'loss': 0.5783, 'learning_rate': 1.0520530013000498e-05, 'epoch': 1.0} {'loss': 0.5067, 'learning_rate': 1.0520194490529526e-05, 'epoch': 1.0} {'loss': 0.5164, 'learning_rate': 1.051985896747135e-05, 'epoch': 1.0} {'loss': 0.628, 'learning_rate': 1.0519523443826356e-05, 'epoch': 1.0} {'loss': 0.6492, 'learning_rate': 1.0519187919594918e-05, 'epoch': 1.0} {'loss': 0.5165, 'learning_rate': 1.0518852394777412e-05, 'epoch': 1.0} {'loss': 0.5313, 'learning_rate': 1.0518516869374222e-05, 'epoch': 1.0} {'loss': 0.4799, 'learning_rate': 1.0518181343385727e-05, 'epoch': 1.0} {'loss': 0.4633, 'learning_rate': 1.0517845816812302e-05, 'epoch': 1.0} {'loss': 0.4251, 'learning_rate': 1.0517510289654327e-05, 'epoch': 1.0} {'loss': 0.4596, 'learning_rate': 1.0517174761912183e-05, 'epoch': 1.0} {'loss': 0.4589, 'learning_rate': 1.0516839233586246e-05, 'epoch': 1.0} {'loss': 0.5435, 'learning_rate': 1.0516503704676895e-05, 'epoch': 1.0} {'loss': 0.5937, 'learning_rate': 1.0516168175184511e-05, 'epoch': 1.0} {'loss': 0.6033, 'learning_rate': 1.0515832645109472e-05, 'epoch': 1.0} {'loss': 0.5279, 'learning_rate': 1.0515497114452154e-05, 'epoch': 1.0} {'loss': 0.5534, 'learning_rate': 1.051516158321294e-05, 'epoch': 1.0} {'loss': 0.499, 'learning_rate': 1.0514826051392207e-05, 'epoch': 1.0} {'loss': 0.5694, 'learning_rate': 1.051449051899033e-05, 'epoch': 1.0} {'loss': 0.5227, 'learning_rate': 1.0514154986007692e-05, 'epoch': 1.0} {'loss': 0.4911, 'learning_rate': 1.0513819452444671e-05, 'epoch': 1.0} {'loss': 0.5598, 'learning_rate': 1.0513483918301646e-05, 'epoch': 1.0} {'loss': 0.5939, 'learning_rate': 1.0513148383578995e-05, 'epoch': 1.0} {'loss': 0.6677, 'learning_rate': 1.0512812848277096e-05, 'epoch': 1.0} {'loss': 0.7005, 'learning_rate': 1.051247731239633e-05, 'epoch': 1.0} {'loss': 0.6138, 'learning_rate': 1.0512141775937075e-05, 'epoch': 1.0} {'loss': 0.522, 'learning_rate': 1.0511806238899708e-05, 'epoch': 1.0} {'loss': 0.5605, 'learning_rate': 1.0511470701284612e-05, 'epoch': 1.0} {'loss': 0.6379, 'learning_rate': 1.051113516309216e-05, 'epoch': 1.0} {'loss': 0.5234, 'learning_rate': 1.0510799624322735e-05, 'epoch': 1.0} {'loss': 0.4937, 'learning_rate': 1.0510464084976716e-05, 'epoch': 1.0} {'loss': 0.4696, 'learning_rate': 1.0510128545054476e-05, 'epoch': 1.0} {'loss': 0.471, 'learning_rate': 1.0509793004556398e-05, 'epoch': 1.0} {'loss': 0.5887, 'learning_rate': 1.0509457463482863e-05, 'epoch': 1.0} {'loss': 0.5952, 'learning_rate': 1.0509121921834249e-05, 'epoch': 1.0} {'loss': 0.4715, 'learning_rate': 1.050878637961093e-05, 'epoch': 1.0} {'loss': 0.6753, 'learning_rate': 1.0508450836813289e-05, 'epoch': 1.0} {'loss': 0.5339, 'learning_rate': 1.0508115293441701e-05, 'epoch': 1.0} {'loss': 0.6385, 'learning_rate': 1.050777974949655e-05, 'epoch': 1.0} {'loss': 0.5176, 'learning_rate': 1.0507444204978211e-05, 'epoch': 1.0} {'loss': 0.5135, 'learning_rate': 1.0507108659887069e-05, 'epoch': 1.0} {'loss': 0.6884, 'learning_rate': 1.0506773114223493e-05, 'epoch': 1.0} {'loss': 0.6563, 'learning_rate': 1.0506437567987868e-05, 'epoch': 1.0} {'loss': 0.7418, 'learning_rate': 1.050610202118057e-05, 'epoch': 1.0} {'loss': 0.4647, 'learning_rate': 1.050576647380198e-05, 'epoch': 1.0} {'loss': 0.5692, 'learning_rate': 1.0505430925852475e-05, 'epoch': 1.0} {'loss': 0.4632, 'learning_rate': 1.0505095377332434e-05, 'epoch': 1.0} {'loss': 0.5569, 'learning_rate': 1.0504759828242239e-05, 'epoch': 1.0} {'loss': 0.6212, 'learning_rate': 1.0504424278582263e-05, 'epoch': 1.0} {'loss': 0.5297, 'learning_rate': 1.050408872835289e-05, 'epoch': 1.0} {'loss': 0.6074, 'learning_rate': 1.0503753177554497e-05, 'epoch': 1.0} {'loss': 0.2904, 'learning_rate': 1.0503417626187461e-05, 'epoch': 1.0} {'loss': 0.3505, 'learning_rate': 1.0503082074252164e-05, 'epoch': 1.0} {'loss': 0.2507, 'learning_rate': 1.0502746521748983e-05, 'epoch': 1.0} {'loss': 0.3403, 'learning_rate': 1.0502410968678297e-05, 'epoch': 1.0} {'loss': 0.3888, 'learning_rate': 1.0502075415040483e-05, 'epoch': 1.0} {'loss': 0.3429, 'learning_rate': 1.0501739860835922e-05, 'epoch': 1.0} {'loss': 0.2701, 'learning_rate': 1.0501404306064991e-05, 'epoch': 1.0} {'loss': 0.417, 'learning_rate': 1.0501068750728072e-05, 'epoch': 1.0} {'loss': 0.2608, 'learning_rate': 1.0500733194825538e-05, 'epoch': 1.0} {'loss': 0.2671, 'learning_rate': 1.0500397638357775e-05, 'epoch': 1.0} {'loss': 0.3308, 'learning_rate': 1.0500062081325157e-05, 'epoch': 1.0} {'loss': 0.6398, 'learning_rate': 1.0499726523728064e-05, 'epoch': 1.0} {'loss': 0.2702, 'learning_rate': 1.0499390965566874e-05, 'epoch': 1.0} {'loss': 0.1907, 'learning_rate': 1.0499055406841967e-05, 'epoch': 1.0} {'loss': 0.359, 'learning_rate': 1.0498719847553722e-05, 'epoch': 1.0} {'loss': 0.404, 'learning_rate': 1.0498384287702519e-05, 'epoch': 1.0} {'loss': 0.4388, 'learning_rate': 1.0498048727288733e-05, 'epoch': 1.0} {'loss': 0.3647, 'learning_rate': 1.0497713166312744e-05, 'epoch': 1.0} {'loss': 0.2557, 'learning_rate': 1.0497377604774932e-05, 'epoch': 1.0} {'loss': 0.4071, 'learning_rate': 1.0497042042675676e-05, 'epoch': 1.0} {'loss': 0.3889, 'learning_rate': 1.0496706480015352e-05, 'epoch': 1.0} {'loss': 0.2987, 'learning_rate': 1.0496370916794343e-05, 'epoch': 1.0} {'loss': 0.4449, 'learning_rate': 1.0496035353013024e-05, 'epoch': 1.0} {'loss': 0.4109, 'learning_rate': 1.0495699788671777e-05, 'epoch': 1.0} {'loss': 0.2527, 'learning_rate': 1.0495364223770976e-05, 'epoch': 1.0} {'loss': 0.2273, 'learning_rate': 1.0495028658311007e-05, 'epoch': 1.0} {'loss': 0.297, 'learning_rate': 1.0494693092292243e-05, 'epoch': 1.0} {'loss': 0.3097, 'learning_rate': 1.0494357525715064e-05, 'epoch': 1.0} {'loss': 0.211, 'learning_rate': 1.0494021958579852e-05, 'epoch': 1.0} {'loss': 0.3605, 'learning_rate': 1.0493686390886982e-05, 'epoch': 1.0} {'loss': 0.3767, 'learning_rate': 1.0493350822636831e-05, 'epoch': 1.0} {'loss': 0.52, 'learning_rate': 1.0493015253829784e-05, 'epoch': 1.0} {'loss': 0.3767, 'learning_rate': 1.0492679684466216e-05, 'epoch': 1.0} {'loss': 0.3035, 'learning_rate': 1.0492344114546505e-05, 'epoch': 1.0} {'loss': 0.3611, 'learning_rate': 1.049200854407103e-05, 'epoch': 1.0} {'loss': 0.4015, 'learning_rate': 1.0491672973040172e-05, 'epoch': 1.0} {'loss': 0.3359, 'learning_rate': 1.049133740145431e-05, 'epoch': 1.0} {'loss': 0.4206, 'learning_rate': 1.049100182931382e-05, 'epoch': 1.0} {'loss': 0.374, 'learning_rate': 1.0490666256619087e-05, 'epoch': 1.0} {'loss': 0.4335, 'learning_rate': 1.049033068337048e-05, 'epoch': 1.0} {'loss': 0.3184, 'learning_rate': 1.0489995109568385e-05, 'epoch': 1.0} {'loss': 0.3115, 'learning_rate': 1.0489659535213177e-05, 'epoch': 1.0} {'loss': 0.281, 'learning_rate': 1.0489323960305238e-05, 'epoch': 1.0} {'loss': 0.416, 'learning_rate': 1.0488988384844945e-05, 'epoch': 1.0} {'loss': 0.2351, 'learning_rate': 1.0488652808832675e-05, 'epoch': 1.0} {'loss': 0.3489, 'learning_rate': 1.0488317232268812e-05, 'epoch': 1.0} {'loss': 0.3626, 'learning_rate': 1.048798165515373e-05, 'epoch': 1.0} {'loss': 0.372, 'learning_rate': 1.048764607748781e-05, 'epoch': 1.0} {'loss': 0.292, 'learning_rate': 1.048731049927143e-05, 'epoch': 1.0} {'loss': 0.3698, 'learning_rate': 1.0486974920504968e-05, 'epoch': 1.0} {'loss': 0.3851, 'learning_rate': 1.0486639341188807e-05, 'epoch': 1.0} {'loss': 0.3606, 'learning_rate': 1.048630376132332e-05, 'epoch': 1.0} {'loss': 0.3122, 'learning_rate': 1.0485968180908892e-05, 'epoch': 1.0} {'loss': 0.3205, 'learning_rate': 1.0485632599945897e-05, 'epoch': 1.0} {'loss': 0.4619, 'learning_rate': 1.0485297018434713e-05, 'epoch': 1.0} {'loss': 0.2913, 'learning_rate': 1.0484961436375722e-05, 'epoch': 1.0} {'loss': 0.3599, 'learning_rate': 1.0484625853769302e-05, 'epoch': 1.0} {'loss': 0.4387, 'learning_rate': 1.048429027061583e-05, 'epoch': 1.0} {'loss': 0.2952, 'learning_rate': 1.0483954686915688e-05, 'epoch': 1.0} {'loss': 0.3986, 'learning_rate': 1.0483619102669254e-05, 'epoch': 1.0} {'loss': 0.372, 'learning_rate': 1.0483283517876903e-05, 'epoch': 1.0} {'loss': 0.3853, 'learning_rate': 1.0482947932539019e-05, 'epoch': 1.0} {'loss': 0.3882, 'learning_rate': 1.0482612346655979e-05, 'epoch': 1.0} {'loss': 0.3398, 'learning_rate': 1.0482276760228161e-05, 'epoch': 1.0} {'loss': 0.4376, 'learning_rate': 1.0481941173255943e-05, 'epoch': 1.0} {'loss': 0.2411, 'learning_rate': 1.0481605585739707e-05, 'epoch': 1.0} {'loss': 0.4029, 'learning_rate': 1.048126999767983e-05, 'epoch': 1.0} {'loss': 0.3353, 'learning_rate': 1.048093440907669e-05, 'epoch': 1.0} {'loss': 0.3294, 'learning_rate': 1.0480598819930665e-05, 'epoch': 1.0} {'loss': 0.2098, 'learning_rate': 1.0480263230242136e-05, 'epoch': 1.0} {'loss': 0.3924, 'learning_rate': 1.0479927640011483e-05, 'epoch': 1.0} {'loss': 0.2123, 'learning_rate': 1.047959204923908e-05, 'epoch': 1.0} {'loss': 0.3737, 'learning_rate': 1.0479256457925311e-05, 'epoch': 1.0} {'loss': 0.3674, 'learning_rate': 1.047892086607055e-05, 'epoch': 1.0} {'loss': 0.5117, 'learning_rate': 1.0478585273675182e-05, 'epoch': 1.0} {'loss': 0.3651, 'learning_rate': 1.0478249680739581e-05, 'epoch': 1.0} {'loss': 0.3865, 'learning_rate': 1.0477914087264124e-05, 'epoch': 1.0} {'loss': 0.4073, 'learning_rate': 1.0477578493249197e-05, 'epoch': 1.0} {'loss': 0.4313, 'learning_rate': 1.0477242898695174e-05, 'epoch': 1.0} {'loss': 0.372, 'learning_rate': 1.0476907303602435e-05, 'epoch': 1.0} {'loss': 0.3756, 'learning_rate': 1.0476571707971357e-05, 'epoch': 1.0} {'loss': 0.3656, 'learning_rate': 1.047623611180232e-05, 'epoch': 1.0} {'loss': 0.2868, 'learning_rate': 1.0475900515095703e-05, 'epoch': 1.0} {'loss': 0.3418, 'learning_rate': 1.0475564917851883e-05, 'epoch': 1.0} {'loss': 0.3691, 'learning_rate': 1.0475229320071244e-05, 'epoch': 1.0} {'loss': 0.2782, 'learning_rate': 1.0474893721754158e-05, 'epoch': 1.0} {'loss': 0.3191, 'learning_rate': 1.047455812290101e-05, 'epoch': 1.0} {'loss': 0.3342, 'learning_rate': 1.0474222523512175e-05, 'epoch': 1.0} {'loss': 0.3462, 'learning_rate': 1.0473886923588034e-05, 'epoch': 1.0} {'loss': 0.3635, 'learning_rate': 1.0473551323128965e-05, 'epoch': 1.0} {'loss': 0.3107, 'learning_rate': 1.0473215722135347e-05, 'epoch': 1.0} {'loss': 0.329, 'learning_rate': 1.0472880120607556e-05, 'epoch': 1.0} {'loss': 0.2953, 'learning_rate': 1.0472544518545975e-05, 'epoch': 1.0} {'loss': 0.2455, 'learning_rate': 1.0472208915950981e-05, 'epoch': 1.0} {'loss': 0.4259, 'learning_rate': 1.047187331282295e-05, 'epoch': 1.0} {'loss': 0.2426, 'learning_rate': 1.0471537709162268e-05, 'epoch': 1.0} {'loss': 0.4709, 'learning_rate': 1.0471202104969306e-05, 'epoch': 1.0} {'loss': 0.3911, 'learning_rate': 1.047086650024445e-05, 'epoch': 1.0} {'loss': 0.2414, 'learning_rate': 1.0470530894988073e-05, 'epoch': 1.0} {'loss': 0.2685, 'learning_rate': 1.0470195289200558e-05, 'epoch': 1.0} {'loss': 0.3405, 'learning_rate': 1.046985968288228e-05, 'epoch': 1.0} {'loss': 0.4016, 'learning_rate': 1.0469524076033622e-05, 'epoch': 1.0} {'loss': 0.2714, 'learning_rate': 1.0469188468654958e-05, 'epoch': 1.0} {'loss': 0.471, 'learning_rate': 1.0468852860746673e-05, 'epoch': 1.0} {'loss': 0.3605, 'learning_rate': 1.0468517252309138e-05, 'epoch': 1.0} {'loss': 0.3493, 'learning_rate': 1.0468181643342739e-05, 'epoch': 1.0} {'loss': 0.4144, 'learning_rate': 1.0467846033847849e-05, 'epoch': 1.0} {'loss': 0.299, 'learning_rate': 1.0467510423824851e-05, 'epoch': 1.0} {'loss': 0.3089, 'learning_rate': 1.0467174813274123e-05, 'epoch': 1.0} {'loss': 0.4456, 'learning_rate': 1.0466839202196044e-05, 'epoch': 1.0} {'loss': 0.4227, 'learning_rate': 1.0466503590590992e-05, 'epoch': 1.0} {'loss': 0.3751, 'learning_rate': 1.0466167978459348e-05, 'epoch': 1.0} {'loss': 0.2617, 'learning_rate': 1.0465832365801485e-05, 'epoch': 1.0} {'loss': 0.463, 'learning_rate': 1.0465496752617787e-05, 'epoch': 1.0} {'loss': 0.2481, 'learning_rate': 1.0465161138908636e-05, 'epoch': 1.0} {'loss': 0.2774, 'learning_rate': 1.0464825524674402e-05, 'epoch': 1.0} {'loss': 0.3814, 'learning_rate': 1.046448990991547e-05, 'epoch': 1.0} {'loss': 0.3614, 'learning_rate': 1.0464154294632218e-05, 'epoch': 1.0} {'loss': 0.2181, 'learning_rate': 1.0463818678825022e-05, 'epoch': 1.0} {'loss': 0.516, 'learning_rate': 1.0463483062494265e-05, 'epoch': 1.0} {'loss': 0.3196, 'learning_rate': 1.046314744564032e-05, 'epoch': 1.0} {'loss': 0.4674, 'learning_rate': 1.0462811828263572e-05, 'epoch': 1.0} {'loss': 0.3344, 'learning_rate': 1.0462476210364398e-05, 'epoch': 1.0} {'loss': 0.3531, 'learning_rate': 1.0462140591943177e-05, 'epoch': 1.0} {'loss': 0.4231, 'learning_rate': 1.0461804973000285e-05, 'epoch': 1.0} {'loss': 0.4348, 'learning_rate': 1.0461469353536104e-05, 'epoch': 1.0} {'loss': 0.3146, 'learning_rate': 1.0461133733551013e-05, 'epoch': 1.0} {'loss': 0.4234, 'learning_rate': 1.0460798113045388e-05, 'epoch': 1.0} {'loss': 0.2135, 'learning_rate': 1.0460462492019611e-05, 'epoch': 1.0} {'loss': 0.4251, 'learning_rate': 1.0460126870474058e-05, 'epoch': 1.0} {'loss': 0.3835, 'learning_rate': 1.045979124840911e-05, 'epoch': 1.0} {'loss': 0.412, 'learning_rate': 1.0459455625825145e-05, 'epoch': 1.0} {'loss': 0.4443, 'learning_rate': 1.0459120002722543e-05, 'epoch': 1.0} {'loss': 0.3387, 'learning_rate': 1.0458784379101681e-05, 'epoch': 1.0} {'loss': 0.2728, 'learning_rate': 1.0458448754962937e-05, 'epoch': 1.0} {'loss': 0.2621, 'learning_rate': 1.0458113130306691e-05, 'epoch': 1.0} {'loss': 0.5198, 'learning_rate': 1.0457777505133325e-05, 'epoch': 1.0} {'loss': 0.3747, 'learning_rate': 1.0457441879443213e-05, 'epoch': 1.0} {'loss': 0.4332, 'learning_rate': 1.0457106253236742e-05, 'epoch': 1.0} {'loss': 0.2254, 'learning_rate': 1.0456770626514278e-05, 'epoch': 1.0} {'loss': 0.32, 'learning_rate': 1.045643499927621e-05, 'epoch': 1.0} {'loss': 0.4237, 'learning_rate': 1.0456099371522915e-05, 'epoch': 1.0} {'loss': 0.252, 'learning_rate': 1.0455763743254768e-05, 'epoch': 1.0} {'loss': 0.3552, 'learning_rate': 1.045542811447215e-05, 'epoch': 1.0} {'loss': 0.3674, 'learning_rate': 1.0455092485175442e-05, 'epoch': 1.0} {'loss': 0.4055, 'learning_rate': 1.045475685536502e-05, 'epoch': 1.0} {'loss': 0.2888, 'learning_rate': 1.0454421225041265e-05, 'epoch': 1.0} {'loss': 0.3, 'learning_rate': 1.0454085594204552e-05, 'epoch': 1.0} {'loss': 0.3181, 'learning_rate': 1.0453749962855267e-05, 'epoch': 1.0} {'loss': 0.3167, 'learning_rate': 1.0453414330993783e-05, 'epoch': 1.0} {'loss': 0.3572, 'learning_rate': 1.045307869862048e-05, 'epoch': 1.0} {'loss': 0.2962, 'learning_rate': 1.0452743065735737e-05, 'epoch': 1.0} {'loss': 0.2612, 'learning_rate': 1.0452407432339935e-05, 'epoch': 1.0} {'loss': 0.3141, 'learning_rate': 1.045207179843345e-05, 'epoch': 1.0} {'loss': 0.3136, 'learning_rate': 1.0451736164016662e-05, 'epoch': 1.0} {'loss': 0.4141, 'learning_rate': 1.0451400529089948e-05, 'epoch': 1.0} {'loss': 0.3184, 'learning_rate': 1.045106489365369e-05, 'epoch': 1.0} {'loss': 0.4424, 'learning_rate': 1.0450729257708266e-05, 'epoch': 1.0} {'loss': 0.3354, 'learning_rate': 1.0450393621254054e-05, 'epoch': 1.0} {'loss': 0.369, 'learning_rate': 1.045005798429143e-05, 'epoch': 1.0} {'loss': 0.3352, 'learning_rate': 1.044972234682078e-05, 'epoch': 1.0} {'loss': 0.3665, 'learning_rate': 1.044938670884248e-05, 'epoch': 1.0} {'loss': 0.4337, 'learning_rate': 1.0449051070356903e-05, 'epoch': 1.0} {'loss': 0.3793, 'learning_rate': 1.0448715431364439e-05, 'epoch': 1.0} {'loss': 0.4236, 'learning_rate': 1.0448379791865457e-05, 'epoch': 1.0} {'loss': 0.4525, 'learning_rate': 1.0448044151860338e-05, 'epoch': 1.0} {'loss': 0.397, 'learning_rate': 1.0447708511349465e-05, 'epoch': 1.0} {'loss': 0.3157, 'learning_rate': 1.0447372870333214e-05, 'epoch': 1.0} {'loss': 0.1477, 'learning_rate': 1.0447037228811964e-05, 'epoch': 1.0} {'loss': 0.4012, 'learning_rate': 1.0446701586786095e-05, 'epoch': 1.0} {'loss': 0.2783, 'learning_rate': 1.044636594425598e-05, 'epoch': 1.0} {'loss': 0.3433, 'learning_rate': 1.0446030301222007e-05, 'epoch': 1.0} {'loss': 0.4567, 'learning_rate': 1.044569465768455e-05, 'epoch': 1.0} {'loss': 0.2881, 'learning_rate': 1.0445359013643988e-05, 'epoch': 1.0} {'loss': 0.3509, 'learning_rate': 1.0445023369100699e-05, 'epoch': 1.0} {'loss': 0.3083, 'learning_rate': 1.0444687724055067e-05, 'epoch': 1.0} {'loss': 0.2802, 'learning_rate': 1.0444352078507465e-05, 'epoch': 1.0} {'loss': 0.3837, 'learning_rate': 1.0444016432458274e-05, 'epoch': 1.0} {'loss': 0.3771, 'learning_rate': 1.0443680785907873e-05, 'epoch': 1.0} {'loss': 0.4029, 'learning_rate': 1.044334513885664e-05, 'epoch': 1.0} {'loss': 0.4614, 'learning_rate': 1.0443009491304957e-05, 'epoch': 1.0} {'loss': 0.2169, 'learning_rate': 1.0442673843253197e-05, 'epoch': 1.0} {'loss': 0.3369, 'learning_rate': 1.0442338194701745e-05, 'epoch': 1.0} {'loss': 0.3946, 'learning_rate': 1.0442002545650976e-05, 'epoch': 1.0} {'loss': 0.2422, 'learning_rate': 1.0441666896101268e-05, 'epoch': 1.0} {'loss': 0.2489, 'learning_rate': 1.0441331246053004e-05, 'epoch': 1.0} {'loss': 0.283, 'learning_rate': 1.0440995595506563e-05, 'epoch': 1.0} {'loss': 0.285, 'learning_rate': 1.0440659944462318e-05, 'epoch': 1.0} {'loss': 0.401, 'learning_rate': 1.0440324292920659e-05, 'epoch': 1.0} {'loss': 0.437, 'learning_rate': 1.043998864088195e-05, 'epoch': 1.0} {'loss': 0.2174, 'learning_rate': 1.043965298834658e-05, 'epoch': 1.0} {'loss': 0.352, 'learning_rate': 1.0439317335314926e-05, 'epoch': 1.0} {'loss': 0.4344, 'learning_rate': 1.0438981681787366e-05, 'epoch': 1.0} {'loss': 0.3684, 'learning_rate': 1.043864602776428e-05, 'epoch': 1.0} {'loss': 0.3114, 'learning_rate': 1.0438310373246043e-05, 'epoch': 1.0} {'loss': 0.4375, 'learning_rate': 1.0437974718233039e-05, 'epoch': 1.0} {'loss': 0.3984, 'learning_rate': 1.0437639062725646e-05, 'epoch': 1.0} {'loss': 0.3557, 'learning_rate': 1.043730340672424e-05, 'epoch': 1.0} {'loss': 0.3316, 'learning_rate': 1.0436967750229204e-05, 'epoch': 1.0} {'loss': 0.3212, 'learning_rate': 1.0436632093240911e-05, 'epoch': 1.0} {'loss': 0.2623, 'learning_rate': 1.0436296435759745e-05, 'epoch': 1.0} {'loss': 0.3102, 'learning_rate': 1.0435960777786085e-05, 'epoch': 1.0} {'loss': 0.3012, 'learning_rate': 1.0435625119320307e-05, 'epoch': 1.0} {'loss': 0.3863, 'learning_rate': 1.043528946036279e-05, 'epoch': 1.0} {'loss': 0.3527, 'learning_rate': 1.0434953800913913e-05, 'epoch': 1.0} {'loss': 0.1609, 'learning_rate': 1.043461814097406e-05, 'epoch': 1.0} {'loss': 0.3082, 'learning_rate': 1.0434282480543602e-05, 'epoch': 1.0} {'loss': 0.3139, 'learning_rate': 1.0433946819622921e-05, 'epoch': 1.0} {'loss': 0.4337, 'learning_rate': 1.04336111582124e-05, 'epoch': 1.0} {'loss': 0.3131, 'learning_rate': 1.0433275496312413e-05, 'epoch': 1.0} {'loss': 0.2828, 'learning_rate': 1.0432939833923338e-05, 'epoch': 1.0} {'loss': 0.3988, 'learning_rate': 1.043260417104556e-05, 'epoch': 1.0} {'loss': 0.4743, 'learning_rate': 1.0432268507679452e-05, 'epoch': 1.0} {'loss': 0.3223, 'learning_rate': 1.0431932843825396e-05, 'epoch': 1.0} {'loss': 0.311, 'learning_rate': 1.0431597179483773e-05, 'epoch': 1.0} {'loss': 0.4324, 'learning_rate': 1.0431261514654955e-05, 'epoch': 1.0} {'loss': 0.3665, 'learning_rate': 1.0430925849339324e-05, 'epoch': 1.0} {'loss': 0.3785, 'learning_rate': 1.0430590183537261e-05, 'epoch': 1.0} {'loss': 0.3284, 'learning_rate': 1.0430254517249143e-05, 'epoch': 1.0} {'loss': 0.2671, 'learning_rate': 1.0429918850475351e-05, 'epoch': 1.0} {'loss': 0.3137, 'learning_rate': 1.0429583183216262e-05, 'epoch': 1.0} {'loss': 0.2365, 'learning_rate': 1.0429247515472254e-05, 'epoch': 1.0} {'loss': 0.46, 'learning_rate': 1.0428911847243707e-05, 'epoch': 1.0} {'loss': 0.3992, 'learning_rate': 1.0428576178531001e-05, 'epoch': 1.0} {'loss': 0.3352, 'learning_rate': 1.0428240509334513e-05, 'epoch': 1.0} {'loss': 0.3905, 'learning_rate': 1.0427904839654626e-05, 'epoch': 1.0} {'loss': 0.2756, 'learning_rate': 1.0427569169491711e-05, 'epoch': 1.0} {'loss': 0.4962, 'learning_rate': 1.0427233498846157e-05, 'epoch': 1.0} {'loss': 0.3681, 'learning_rate': 1.0426897827718336e-05, 'epoch': 1.0} {'loss': 0.2785, 'learning_rate': 1.0426562156108627e-05, 'epoch': 1.0} {'loss': 0.2404, 'learning_rate': 1.042622648401741e-05, 'epoch': 1.0} {'loss': 0.3775, 'learning_rate': 1.0425890811445065e-05, 'epoch': 1.0} {'loss': 0.3739, 'learning_rate': 1.0425555138391972e-05, 'epoch': 1.0} {'loss': 0.1663, 'learning_rate': 1.0425219464858505e-05, 'epoch': 1.0} {'loss': 0.2769, 'learning_rate': 1.0424883790845046e-05, 'epoch': 1.0} {'loss': 0.4062, 'learning_rate': 1.0424548116351976e-05, 'epoch': 1.0} {'loss': 0.3684, 'learning_rate': 1.042421244137967e-05, 'epoch': 1.0} {'loss': 0.3974, 'learning_rate': 1.0423876765928514e-05, 'epoch': 1.0} {'loss': 0.4956, 'learning_rate': 1.0423541089998879e-05, 'epoch': 1.0} {'loss': 0.4031, 'learning_rate': 1.0423205413591144e-05, 'epoch': 1.0} {'loss': 0.2846, 'learning_rate': 1.0422869736705691e-05, 'epoch': 1.0} {'loss': 0.3093, 'learning_rate': 1.0422534059342902e-05, 'epoch': 1.01} {'loss': 0.298, 'learning_rate': 1.0422198381503151e-05, 'epoch': 1.01} {'loss': 0.4229, 'learning_rate': 1.0421862703186816e-05, 'epoch': 1.01} {'loss': 0.3395, 'learning_rate': 1.042152702439428e-05, 'epoch': 1.01} {'loss': 0.2546, 'learning_rate': 1.042119134512592e-05, 'epoch': 1.01} {'loss': 0.4226, 'learning_rate': 1.0420855665382114e-05, 'epoch': 1.01} {'loss': 0.2301, 'learning_rate': 1.0420519985163245e-05, 'epoch': 1.01} {'loss': 0.3605, 'learning_rate': 1.0420184304469684e-05, 'epoch': 1.01} {'loss': 0.3242, 'learning_rate': 1.0419848623301821e-05, 'epoch': 1.01} {'loss': 0.3442, 'learning_rate': 1.0419512941660026e-05, 'epoch': 1.01} {'loss': 0.2431, 'learning_rate': 1.041917725954468e-05, 'epoch': 1.01} {'loss': 0.3942, 'learning_rate': 1.0418841576956163e-05, 'epoch': 1.01} {'loss': 0.2932, 'learning_rate': 1.0418505893894853e-05, 'epoch': 1.01} {'loss': 0.2964, 'learning_rate': 1.041817021036113e-05, 'epoch': 1.01} {'loss': 0.2785, 'learning_rate': 1.041783452635537e-05, 'epoch': 1.01} {'loss': 0.3494, 'learning_rate': 1.0417498841877958e-05, 'epoch': 1.01} {'loss': 0.4374, 'learning_rate': 1.0417163156929267e-05, 'epoch': 1.01} {'loss': 0.2626, 'learning_rate': 1.0416827471509678e-05, 'epoch': 1.01} {'loss': 0.3352, 'learning_rate': 1.0416491785619572e-05, 'epoch': 1.01} {'loss': 0.4052, 'learning_rate': 1.0416156099259322e-05, 'epoch': 1.01} {'loss': 0.3674, 'learning_rate': 1.0415820412429316e-05, 'epoch': 1.01} {'loss': 0.3442, 'learning_rate': 1.0415484725129926e-05, 'epoch': 1.01} {'loss': 0.3125, 'learning_rate': 1.041514903736153e-05, 'epoch': 1.01} {'loss': 0.4288, 'learning_rate': 1.0414813349124515e-05, 'epoch': 1.01} {'loss': 0.3907, 'learning_rate': 1.0414477660419251e-05, 'epoch': 1.01} {'loss': 0.3654, 'learning_rate': 1.041414197124612e-05, 'epoch': 1.01} {'loss': 0.2037, 'learning_rate': 1.0413806281605504e-05, 'epoch': 1.01} {'loss': 0.335, 'learning_rate': 1.0413470591497777e-05, 'epoch': 1.01} {'loss': 0.3512, 'learning_rate': 1.0413134900923321e-05, 'epoch': 1.01} {'loss': 0.4195, 'learning_rate': 1.0412799209882513e-05, 'epoch': 1.01} {'loss': 0.3278, 'learning_rate': 1.0412463518375735e-05, 'epoch': 1.01} {'loss': 0.4547, 'learning_rate': 1.0412127826403364e-05, 'epoch': 1.01} {'loss': 0.2661, 'learning_rate': 1.041179213396578e-05, 'epoch': 1.01} {'loss': 0.3525, 'learning_rate': 1.0411456441063359e-05, 'epoch': 1.01} {'loss': 0.3889, 'learning_rate': 1.0411120747696481e-05, 'epoch': 1.01} {'loss': 0.3951, 'learning_rate': 1.0410785053865528e-05, 'epoch': 1.01} {'loss': 0.3744, 'learning_rate': 1.0410449359570879e-05, 'epoch': 1.01} {'loss': 0.3945, 'learning_rate': 1.0410113664812909e-05, 'epoch': 1.01} {'loss': 0.2004, 'learning_rate': 1.0409777969591996e-05, 'epoch': 1.01} {'loss': 0.3257, 'learning_rate': 1.0409442273908523e-05, 'epoch': 1.01} {'loss': 0.3652, 'learning_rate': 1.0409106577762869e-05, 'epoch': 1.01} {'loss': 0.3194, 'learning_rate': 1.040877088115541e-05, 'epoch': 1.01} {'loss': 0.3696, 'learning_rate': 1.0408435184086525e-05, 'epoch': 1.01} {'loss': 0.3739, 'learning_rate': 1.0408099486556596e-05, 'epoch': 1.01} {'loss': 0.4138, 'learning_rate': 1.0407763788566e-05, 'epoch': 1.01} {'loss': 0.3346, 'learning_rate': 1.0407428090115115e-05, 'epoch': 1.01} {'loss': 0.355, 'learning_rate': 1.0407092391204325e-05, 'epoch': 1.01} {'loss': 0.3483, 'learning_rate': 1.0406756691834004e-05, 'epoch': 1.01} {'loss': 0.3173, 'learning_rate': 1.0406420992004529e-05, 'epoch': 1.01} {'loss': 0.3711, 'learning_rate': 1.0406085291716284e-05, 'epoch': 1.01} {'loss': 0.3912, 'learning_rate': 1.0405749590969648e-05, 'epoch': 1.01} {'loss': 0.356, 'learning_rate': 1.0405413889764993e-05, 'epoch': 1.01} {'loss': 0.4783, 'learning_rate': 1.0405078188102707e-05, 'epoch': 1.01} {'loss': 0.471, 'learning_rate': 1.0404742485983162e-05, 'epoch': 1.01} {'loss': 0.2825, 'learning_rate': 1.0404406783406742e-05, 'epoch': 1.01} {'loss': 0.3123, 'learning_rate': 1.0404071080373821e-05, 'epoch': 1.01} {'loss': 0.4258, 'learning_rate': 1.0403735376884783e-05, 'epoch': 1.01} {'loss': 0.5519, 'learning_rate': 1.0403399672940002e-05, 'epoch': 1.01} {'loss': 0.2257, 'learning_rate': 1.0403063968539862e-05, 'epoch': 1.01} {'loss': 0.4154, 'learning_rate': 1.040272826368474e-05, 'epoch': 1.01} {'loss': 0.3133, 'learning_rate': 1.0402392558375014e-05, 'epoch': 1.01} {'loss': 0.3489, 'learning_rate': 1.0402056852611062e-05, 'epoch': 1.01} {'loss': 0.3778, 'learning_rate': 1.0401721146393265e-05, 'epoch': 1.01} {'loss': 0.4444, 'learning_rate': 1.0401385439722e-05, 'epoch': 1.01} {'loss': 0.2602, 'learning_rate': 1.0401049732597647e-05, 'epoch': 1.01} {'loss': 0.4425, 'learning_rate': 1.0400714025020586e-05, 'epoch': 1.01} {'loss': 0.2733, 'learning_rate': 1.0400378316991196e-05, 'epoch': 1.01} {'loss': 0.336, 'learning_rate': 1.0400042608509852e-05, 'epoch': 1.01} {'loss': 0.4328, 'learning_rate': 1.039970689957694e-05, 'epoch': 1.01} {'loss': 0.4121, 'learning_rate': 1.0399371190192834e-05, 'epoch': 1.01} {'loss': 0.2999, 'learning_rate': 1.0399035480357911e-05, 'epoch': 1.01} {'loss': 0.3625, 'learning_rate': 1.0398699770072555e-05, 'epoch': 1.01} {'loss': 0.2733, 'learning_rate': 1.0398364059337145e-05, 'epoch': 1.01} {'loss': 0.2639, 'learning_rate': 1.0398028348152054e-05, 'epoch': 1.01} {'loss': 0.3454, 'learning_rate': 1.0397692636517667e-05, 'epoch': 1.01} {'loss': 0.5065, 'learning_rate': 1.0397356924434358e-05, 'epoch': 1.01} {'loss': 0.3309, 'learning_rate': 1.0397021211902512e-05, 'epoch': 1.01} {'loss': 0.323, 'learning_rate': 1.0396685498922502e-05, 'epoch': 1.01} {'loss': 0.392, 'learning_rate': 1.0396349785494707e-05, 'epoch': 1.01} {'loss': 0.4454, 'learning_rate': 1.0396014071619514e-05, 'epoch': 1.01} {'loss': 0.2781, 'learning_rate': 1.0395678357297294e-05, 'epoch': 1.01} {'loss': 0.1675, 'learning_rate': 1.0395342642528428e-05, 'epoch': 1.01} {'loss': 0.36, 'learning_rate': 1.0395006927313296e-05, 'epoch': 1.01} {'loss': 0.4058, 'learning_rate': 1.0394671211652276e-05, 'epoch': 1.01} {'loss': 0.416, 'learning_rate': 1.0394335495545747e-05, 'epoch': 1.01} {'loss': 0.4087, 'learning_rate': 1.039399977899409e-05, 'epoch': 1.01} {'loss': 0.2526, 'learning_rate': 1.0393664061997682e-05, 'epoch': 1.01} {'loss': 0.2864, 'learning_rate': 1.0393328344556898e-05, 'epoch': 1.01} {'loss': 0.3127, 'learning_rate': 1.0392992626672125e-05, 'epoch': 1.01} {'loss': 0.4144, 'learning_rate': 1.0392656908343737e-05, 'epoch': 1.01} {'loss': 0.3543, 'learning_rate': 1.0392321189572114e-05, 'epoch': 1.01} {'loss': 0.4742, 'learning_rate': 1.0391985470357635e-05, 'epoch': 1.01} {'loss': 0.4406, 'learning_rate': 1.0391649750700676e-05, 'epoch': 1.01} {'loss': 0.2314, 'learning_rate': 1.0391314030601623e-05, 'epoch': 1.01} {'loss': 0.3209, 'learning_rate': 1.0390978310060848e-05, 'epoch': 1.01} {'loss': 0.3879, 'learning_rate': 1.0390642589078736e-05, 'epoch': 1.01} {'loss': 0.3411, 'learning_rate': 1.0390306867655664e-05, 'epoch': 1.01} {'loss': 0.3291, 'learning_rate': 1.0389971145792007e-05, 'epoch': 1.01} {'loss': 0.3299, 'learning_rate': 1.0389635423488144e-05, 'epoch': 1.01} {'loss': 0.3703, 'learning_rate': 1.0389299700744461e-05, 'epoch': 1.01} {'loss': 0.4659, 'learning_rate': 1.038896397756133e-05, 'epoch': 1.01} {'loss': 0.2147, 'learning_rate': 1.0388628253939135e-05, 'epoch': 1.01} {'loss': 0.3363, 'learning_rate': 1.0388292529878252e-05, 'epoch': 1.01} {'loss': 0.2604, 'learning_rate': 1.0387956805379058e-05, 'epoch': 1.01} {'loss': 0.316, 'learning_rate': 1.0387621080441939e-05, 'epoch': 1.01} {'loss': 0.4557, 'learning_rate': 1.0387285355067265e-05, 'epoch': 1.01} {'loss': 0.5208, 'learning_rate': 1.0386949629255423e-05, 'epoch': 1.01} {'loss': 0.3455, 'learning_rate': 1.0386613903006786e-05, 'epoch': 1.01} {'loss': 0.3637, 'learning_rate': 1.0386278176321737e-05, 'epoch': 1.01} {'loss': 0.3413, 'learning_rate': 1.0385942449200654e-05, 'epoch': 1.01} {'loss': 0.2162, 'learning_rate': 1.0385606721643915e-05, 'epoch': 1.01} {'loss': 0.2988, 'learning_rate': 1.0385270993651897e-05, 'epoch': 1.01} {'loss': 0.3754, 'learning_rate': 1.0384935265224983e-05, 'epoch': 1.01} {'loss': 0.4226, 'learning_rate': 1.038459953636355e-05, 'epoch': 1.01} {'loss': 0.2994, 'learning_rate': 1.0384263807067978e-05, 'epoch': 1.01} {'loss': 0.3687, 'learning_rate': 1.0383928077338644e-05, 'epoch': 1.01} {'loss': 0.2565, 'learning_rate': 1.0383592347175928e-05, 'epoch': 1.01} {'loss': 0.298, 'learning_rate': 1.0383256616580211e-05, 'epoch': 1.01} {'loss': 0.2955, 'learning_rate': 1.0382920885551869e-05, 'epoch': 1.01} {'loss': 0.4689, 'learning_rate': 1.0382585154091282e-05, 'epoch': 1.01} {'loss': 0.2105, 'learning_rate': 1.0382249422198829e-05, 'epoch': 1.01} {'loss': 0.3583, 'learning_rate': 1.038191368987489e-05, 'epoch': 1.01} {'loss': 0.2994, 'learning_rate': 1.0381577957119844e-05, 'epoch': 1.01} {'loss': 0.4215, 'learning_rate': 1.0381242223934067e-05, 'epoch': 1.01} {'loss': 0.2438, 'learning_rate': 1.0380906490317941e-05, 'epoch': 1.01} {'loss': 0.2644, 'learning_rate': 1.0380570756271844e-05, 'epoch': 1.01} {'loss': 0.2273, 'learning_rate': 1.0380235021796155e-05, 'epoch': 1.01} {'loss': 0.2895, 'learning_rate': 1.0379899286891251e-05, 'epoch': 1.01} {'loss': 0.3745, 'learning_rate': 1.0379563551557515e-05, 'epoch': 1.01} {'loss': 0.239, 'learning_rate': 1.0379227815795324e-05, 'epoch': 1.01} {'loss': 0.2765, 'learning_rate': 1.0378892079605056e-05, 'epoch': 1.01} {'loss': 0.3393, 'learning_rate': 1.037855634298709e-05, 'epoch': 1.01} {'loss': 0.3035, 'learning_rate': 1.0378220605941807e-05, 'epoch': 1.01} {'loss': 0.3719, 'learning_rate': 1.0377884868469585e-05, 'epoch': 1.01} {'loss': 0.3105, 'learning_rate': 1.0377549130570804e-05, 'epoch': 1.01} {'loss': 0.2294, 'learning_rate': 1.0377213392245842e-05, 'epoch': 1.01} {'loss': 0.2338, 'learning_rate': 1.0376877653495076e-05, 'epoch': 1.01} {'loss': 0.367, 'learning_rate': 1.0376541914318887e-05, 'epoch': 1.01} {'loss': 0.3778, 'learning_rate': 1.0376206174717654e-05, 'epoch': 1.01} {'loss': 0.2923, 'learning_rate': 1.0375870434691755e-05, 'epoch': 1.01} {'loss': 0.3058, 'learning_rate': 1.0375534694241572e-05, 'epoch': 1.01} {'loss': 0.3244, 'learning_rate': 1.037519895336748e-05, 'epoch': 1.01} {'loss': 0.4165, 'learning_rate': 1.0374863212069857e-05, 'epoch': 1.01} {'loss': 0.2764, 'learning_rate': 1.0374527470349087e-05, 'epoch': 1.01} {'loss': 0.5273, 'learning_rate': 1.037419172820555e-05, 'epoch': 1.01} {'loss': 0.3383, 'learning_rate': 1.037385598563962e-05, 'epoch': 1.01} {'loss': 0.34, 'learning_rate': 1.0373520242651676e-05, 'epoch': 1.01} {'loss': 0.2196, 'learning_rate': 1.0373184499242099e-05, 'epoch': 1.01} {'loss': 0.3725, 'learning_rate': 1.0372848755411268e-05, 'epoch': 1.01} {'loss': 0.3458, 'learning_rate': 1.0372513011159562e-05, 'epoch': 1.01} {'loss': 0.2831, 'learning_rate': 1.037217726648736e-05, 'epoch': 1.01} {'loss': 0.2821, 'learning_rate': 1.037184152139504e-05, 'epoch': 1.01} {'loss': 0.285, 'learning_rate': 1.0371505775882982e-05, 'epoch': 1.01} {'loss': 0.3775, 'learning_rate': 1.0371170029951562e-05, 'epoch': 1.01} {'loss': 0.3206, 'learning_rate': 1.0370834283601166e-05, 'epoch': 1.01} {'loss': 0.4405, 'learning_rate': 1.0370498536832165e-05, 'epoch': 1.01} {'loss': 0.3727, 'learning_rate': 1.0370162789644944e-05, 'epoch': 1.01} {'loss': 0.335, 'learning_rate': 1.0369827042039879e-05, 'epoch': 1.01} {'loss': 0.3571, 'learning_rate': 1.0369491294017348e-05, 'epoch': 1.01} {'loss': 0.3112, 'learning_rate': 1.0369155545577736e-05, 'epoch': 1.01} {'loss': 0.2644, 'learning_rate': 1.0368819796721415e-05, 'epoch': 1.01} {'loss': 0.3918, 'learning_rate': 1.0368484047448765e-05, 'epoch': 1.01} {'loss': 0.3245, 'learning_rate': 1.0368148297760168e-05, 'epoch': 1.01} {'loss': 0.3967, 'learning_rate': 1.0367812547656002e-05, 'epoch': 1.01} {'loss': 0.3094, 'learning_rate': 1.0367476797136645e-05, 'epoch': 1.01} {'loss': 0.3948, 'learning_rate': 1.0367141046202476e-05, 'epoch': 1.01} {'loss': 0.4144, 'learning_rate': 1.0366805294853874e-05, 'epoch': 1.01} {'loss': 0.2149, 'learning_rate': 1.036646954309122e-05, 'epoch': 1.01} {'loss': 0.3856, 'learning_rate': 1.0366133790914891e-05, 'epoch': 1.01} {'loss': 0.3183, 'learning_rate': 1.0365798038325267e-05, 'epoch': 1.01} {'loss': 0.2611, 'learning_rate': 1.0365462285322727e-05, 'epoch': 1.01} {'loss': 0.4268, 'learning_rate': 1.0365126531907647e-05, 'epoch': 1.01} {'loss': 0.3602, 'learning_rate': 1.0364790778080414e-05, 'epoch': 1.01} {'loss': 0.3969, 'learning_rate': 1.0364455023841398e-05, 'epoch': 1.01} {'loss': 0.4085, 'learning_rate': 1.0364119269190982e-05, 'epoch': 1.01} {'loss': 0.2776, 'learning_rate': 1.0363783514129543e-05, 'epoch': 1.01} {'loss': 0.3578, 'learning_rate': 1.0363447758657463e-05, 'epoch': 1.01} {'loss': 0.2448, 'learning_rate': 1.0363112002775119e-05, 'epoch': 1.01} {'loss': 0.303, 'learning_rate': 1.036277624648289e-05, 'epoch': 1.01} {'loss': 0.3596, 'learning_rate': 1.0362440489781157e-05, 'epoch': 1.01} {'loss': 0.3465, 'learning_rate': 1.0362104732670297e-05, 'epoch': 1.01} {'loss': 0.2982, 'learning_rate': 1.036176897515069e-05, 'epoch': 1.01} {'loss': 0.3538, 'learning_rate': 1.0361433217222715e-05, 'epoch': 1.01} {'loss': 0.3919, 'learning_rate': 1.036109745888675e-05, 'epoch': 1.01} {'loss': 0.3575, 'learning_rate': 1.0360761700143174e-05, 'epoch': 1.01} {'loss': 0.3655, 'learning_rate': 1.0360425940992369e-05, 'epoch': 1.01} {'loss': 0.3333, 'learning_rate': 1.036009018143471e-05, 'epoch': 1.01} {'loss': 0.3241, 'learning_rate': 1.0359754421470579e-05, 'epoch': 1.01} {'loss': 0.3525, 'learning_rate': 1.035941866110035e-05, 'epoch': 1.01} {'loss': 0.2739, 'learning_rate': 1.035908290032441e-05, 'epoch': 1.01} {'loss': 0.2445, 'learning_rate': 1.035874713914313e-05, 'epoch': 1.01} {'loss': 0.381, 'learning_rate': 1.0358411377556894e-05, 'epoch': 1.01} {'loss': 0.2173, 'learning_rate': 1.0358075615566078e-05, 'epoch': 1.01} {'loss': 0.404, 'learning_rate': 1.0357739853171065e-05, 'epoch': 1.01} {'loss': 0.4023, 'learning_rate': 1.0357404090372232e-05, 'epoch': 1.01} {'loss': 0.3975, 'learning_rate': 1.035706832716996e-05, 'epoch': 1.01} {'loss': 0.3796, 'learning_rate': 1.0356732563564623e-05, 'epoch': 1.01} {'loss': 0.3663, 'learning_rate': 1.0356396799556604e-05, 'epoch': 1.01} {'loss': 0.2491, 'learning_rate': 1.035606103514628e-05, 'epoch': 1.01} {'loss': 0.3237, 'learning_rate': 1.035572527033403e-05, 'epoch': 1.01} {'loss': 0.3606, 'learning_rate': 1.0355389505120232e-05, 'epoch': 1.01} {'loss': 0.4516, 'learning_rate': 1.0355053739505269e-05, 'epoch': 1.01} {'loss': 0.3159, 'learning_rate': 1.0354717973489519e-05, 'epoch': 1.01} {'loss': 0.3475, 'learning_rate': 1.035438220707336e-05, 'epoch': 1.01} {'loss': 0.3039, 'learning_rate': 1.0354046440257169e-05, 'epoch': 1.01} {'loss': 0.495, 'learning_rate': 1.0353710673041326e-05, 'epoch': 1.01} {'loss': 0.4682, 'learning_rate': 1.0353374905426211e-05, 'epoch': 1.01} {'loss': 0.2741, 'learning_rate': 1.0353039137412206e-05, 'epoch': 1.01} {'loss': 0.4659, 'learning_rate': 1.0352703368999688e-05, 'epoch': 1.01} {'loss': 0.2713, 'learning_rate': 1.0352367600189031e-05, 'epoch': 1.01} {'loss': 0.2605, 'learning_rate': 1.035203183098062e-05, 'epoch': 1.01} {'loss': 0.3421, 'learning_rate': 1.0351696061374832e-05, 'epoch': 1.01} {'loss': 0.4764, 'learning_rate': 1.0351360291372044e-05, 'epoch': 1.01} {'loss': 0.4203, 'learning_rate': 1.0351024520972639e-05, 'epoch': 1.01} {'loss': 0.3694, 'learning_rate': 1.035068875017699e-05, 'epoch': 1.01} {'loss': 0.3925, 'learning_rate': 1.0350352978985485e-05, 'epoch': 1.01} {'loss': 0.315, 'learning_rate': 1.0350017207398498e-05, 'epoch': 1.01} {'loss': 0.3167, 'learning_rate': 1.0349681435416406e-05, 'epoch': 1.01} {'loss': 0.4802, 'learning_rate': 1.0349345663039592e-05, 'epoch': 1.01} {'loss': 0.4899, 'learning_rate': 1.0349009890268431e-05, 'epoch': 1.01} {'loss': 0.239, 'learning_rate': 1.0348674117103306e-05, 'epoch': 1.01} {'loss': 0.2971, 'learning_rate': 1.0348338343544594e-05, 'epoch': 1.01} {'loss': 0.3202, 'learning_rate': 1.0348002569592674e-05, 'epoch': 1.01} {'loss': 0.3222, 'learning_rate': 1.0347666795247926e-05, 'epoch': 1.01} {'loss': 0.3668, 'learning_rate': 1.0347331020510726e-05, 'epoch': 1.01} {'loss': 0.3778, 'learning_rate': 1.0346995245381458e-05, 'epoch': 1.01} {'loss': 0.2852, 'learning_rate': 1.0346659469860495e-05, 'epoch': 1.01} {'loss': 0.3794, 'learning_rate': 1.0346323693948221e-05, 'epoch': 1.01} {'loss': 0.3994, 'learning_rate': 1.0345987917645015e-05, 'epoch': 1.01} {'loss': 0.3801, 'learning_rate': 1.0345652140951253e-05, 'epoch': 1.01} {'loss': 0.3728, 'learning_rate': 1.0345316363867315e-05, 'epoch': 1.01} {'loss': 0.3452, 'learning_rate': 1.0344980586393583e-05, 'epoch': 1.01} {'loss': 0.3995, 'learning_rate': 1.034464480853043e-05, 'epoch': 1.01} {'loss': 0.3179, 'learning_rate': 1.0344309030278241e-05, 'epoch': 1.01} {'loss': 0.4081, 'learning_rate': 1.0343973251637394e-05, 'epoch': 1.01} {'loss': 0.265, 'learning_rate': 1.0343637472608264e-05, 'epoch': 1.01} {'loss': 0.3515, 'learning_rate': 1.0343301693191233e-05, 'epoch': 1.01} {'loss': 0.3714, 'learning_rate': 1.034296591338668e-05, 'epoch': 1.01} {'loss': 0.1187, 'learning_rate': 1.0342630133194983e-05, 'epoch': 1.01} {'loss': 0.3433, 'learning_rate': 1.0342294352616522e-05, 'epoch': 1.01} {'loss': 0.3099, 'learning_rate': 1.0341958571651676e-05, 'epoch': 1.01} {'loss': 0.2913, 'learning_rate': 1.034162279030082e-05, 'epoch': 1.01} {'loss': 0.2972, 'learning_rate': 1.0341287008564343e-05, 'epoch': 1.01} {'loss': 0.2679, 'learning_rate': 1.0340951226442614e-05, 'epoch': 1.01} {'loss': 0.2389, 'learning_rate': 1.0340615443936017e-05, 'epoch': 1.01} {'loss': 0.4338, 'learning_rate': 1.0340279661044931e-05, 'epoch': 1.01} {'loss': 0.4664, 'learning_rate': 1.0339943877769737e-05, 'epoch': 1.01} {'loss': 0.3701, 'learning_rate': 1.0339608094110804e-05, 'epoch': 1.01} {'loss': 0.3323, 'learning_rate': 1.0339272310068522e-05, 'epoch': 1.01} {'loss': 0.3269, 'learning_rate': 1.0338936525643267e-05, 'epoch': 1.01} {'loss': 0.2566, 'learning_rate': 1.0338600740835413e-05, 'epoch': 1.01} {'loss': 0.376, 'learning_rate': 1.0338264955645347e-05, 'epoch': 1.01} {'loss': 0.4618, 'learning_rate': 1.0337929170073442e-05, 'epoch': 1.01} {'loss': 0.374, 'learning_rate': 1.033759338412008e-05, 'epoch': 1.01} {'loss': 0.4866, 'learning_rate': 1.033725759778564e-05, 'epoch': 1.01} {'loss': 0.2972, 'learning_rate': 1.03369218110705e-05, 'epoch': 1.01} {'loss': 0.3635, 'learning_rate': 1.0336586023975037e-05, 'epoch': 1.01} {'loss': 0.4279, 'learning_rate': 1.0336250236499635e-05, 'epoch': 1.01} {'loss': 0.3246, 'learning_rate': 1.0335914448644672e-05, 'epoch': 1.01} {'loss': 0.2491, 'learning_rate': 1.0335578660410523e-05, 'epoch': 1.01} {'loss': 0.3458, 'learning_rate': 1.033524287179757e-05, 'epoch': 1.01} {'loss': 0.2976, 'learning_rate': 1.033490708280619e-05, 'epoch': 1.01} {'loss': 0.5837, 'learning_rate': 1.0334571293436767e-05, 'epoch': 1.01} {'loss': 0.3731, 'learning_rate': 1.0334235503689674e-05, 'epoch': 1.01} {'loss': 0.3027, 'learning_rate': 1.0333899713565292e-05, 'epoch': 1.01} {'loss': 0.4219, 'learning_rate': 1.0333563923064003e-05, 'epoch': 1.01} {'loss': 0.2633, 'learning_rate': 1.033322813218618e-05, 'epoch': 1.01} {'loss': 0.318, 'learning_rate': 1.033289234093221e-05, 'epoch': 1.01} {'loss': 0.2998, 'learning_rate': 1.0332556549302467e-05, 'epoch': 1.01} {'loss': 0.3785, 'learning_rate': 1.0332220757297329e-05, 'epoch': 1.01} {'loss': 0.3124, 'learning_rate': 1.0331884964917179e-05, 'epoch': 1.01} {'loss': 0.3158, 'learning_rate': 1.0331549172162394e-05, 'epoch': 1.01} {'loss': 0.4349, 'learning_rate': 1.0331213379033353e-05, 'epoch': 1.01} {'loss': 0.4443, 'learning_rate': 1.0330877585530434e-05, 'epoch': 1.01} {'loss': 0.378, 'learning_rate': 1.0330541791654017e-05, 'epoch': 1.01} {'loss': 0.3548, 'learning_rate': 1.033020599740448e-05, 'epoch': 1.01} {'loss': 0.4464, 'learning_rate': 1.0329870202782205e-05, 'epoch': 1.01} {'loss': 0.3755, 'learning_rate': 1.0329534407787571e-05, 'epoch': 1.01} {'loss': 0.3741, 'learning_rate': 1.0329198612420952e-05, 'epoch': 1.01} {'loss': 0.2012, 'learning_rate': 1.0328862816682732e-05, 'epoch': 1.01} {'loss': 0.2956, 'learning_rate': 1.0328527020573288e-05, 'epoch': 1.01} {'loss': 0.295, 'learning_rate': 1.0328191224093e-05, 'epoch': 1.01} {'loss': 0.3551, 'learning_rate': 1.0327855427242246e-05, 'epoch': 1.01} {'loss': 0.3556, 'learning_rate': 1.0327519630021405e-05, 'epoch': 1.01} {'loss': 0.2472, 'learning_rate': 1.032718383243086e-05, 'epoch': 1.01} {'loss': 0.3709, 'learning_rate': 1.0326848034470984e-05, 'epoch': 1.01} {'loss': 0.389, 'learning_rate': 1.0326512236142158e-05, 'epoch': 1.01} {'loss': 0.3183, 'learning_rate': 1.0326176437444764e-05, 'epoch': 1.01} {'loss': 0.4013, 'learning_rate': 1.0325840638379176e-05, 'epoch': 1.01} {'loss': 0.3765, 'learning_rate': 1.0325504838945777e-05, 'epoch': 1.01} {'loss': 0.3039, 'learning_rate': 1.0325169039144944e-05, 'epoch': 1.01} {'loss': 0.3749, 'learning_rate': 1.0324833238977056e-05, 'epoch': 1.01} {'loss': 0.2564, 'learning_rate': 1.0324497438442496e-05, 'epoch': 1.01} {'loss': 0.3783, 'learning_rate': 1.0324161637541638e-05, 'epoch': 1.01} {'loss': 0.3812, 'learning_rate': 1.0323825836274868e-05, 'epoch': 1.01} {'loss': 0.3627, 'learning_rate': 1.0323490034642556e-05, 'epoch': 1.01} {'loss': 0.3021, 'learning_rate': 1.0323154232645086e-05, 'epoch': 1.01} {'loss': 0.1833, 'learning_rate': 1.0322818430282835e-05, 'epoch': 1.01} {'loss': 0.3677, 'learning_rate': 1.0322482627556184e-05, 'epoch': 1.01} {'loss': 0.3046, 'learning_rate': 1.0322146824465513e-05, 'epoch': 1.01} {'loss': 0.3522, 'learning_rate': 1.03218110210112e-05, 'epoch': 1.01} {'loss': 0.3686, 'learning_rate': 1.0321475217193621e-05, 'epoch': 1.01} {'loss': 0.341, 'learning_rate': 1.0321139413013159e-05, 'epoch': 1.01} {'loss': 0.1567, 'learning_rate': 1.0320803608470191e-05, 'epoch': 1.01} {'loss': 0.2635, 'learning_rate': 1.0320467803565097e-05, 'epoch': 1.01} {'loss': 0.317, 'learning_rate': 1.0320131998298255e-05, 'epoch': 1.01} {'loss': 0.3142, 'learning_rate': 1.0319796192670046e-05, 'epoch': 1.01} {'loss': 0.2766, 'learning_rate': 1.0319460386680848e-05, 'epoch': 1.01} {'loss': 0.4145, 'learning_rate': 1.031912458033104e-05, 'epoch': 1.01} {'loss': 0.4276, 'learning_rate': 1.0318788773621002e-05, 'epoch': 1.01} {'loss': 0.394, 'learning_rate': 1.0318452966551112e-05, 'epoch': 1.01} {'loss': 0.2393, 'learning_rate': 1.0318117159121746e-05, 'epoch': 1.01} {'loss': 0.3824, 'learning_rate': 1.0317781351333287e-05, 'epoch': 1.01} {'loss': 0.282, 'learning_rate': 1.0317445543186115e-05, 'epoch': 1.01} {'loss': 0.2861, 'learning_rate': 1.0317109734680606e-05, 'epoch': 1.01} {'loss': 0.2873, 'learning_rate': 1.0316773925817142e-05, 'epoch': 1.01} {'loss': 0.433, 'learning_rate': 1.0316438116596098e-05, 'epoch': 1.01} {'loss': 0.3011, 'learning_rate': 1.0316102307017859e-05, 'epoch': 1.01} {'loss': 0.3671, 'learning_rate': 1.0315766497082797e-05, 'epoch': 1.01} {'loss': 0.2677, 'learning_rate': 1.0315430686791297e-05, 'epoch': 1.01} {'loss': 0.2817, 'learning_rate': 1.0315094876143736e-05, 'epoch': 1.01} {'loss': 0.3644, 'learning_rate': 1.0314759065140494e-05, 'epoch': 1.01} {'loss': 0.3536, 'learning_rate': 1.0314423253781947e-05, 'epoch': 1.01} {'loss': 0.2749, 'learning_rate': 1.0314087442068475e-05, 'epoch': 1.01} {'loss': 0.4489, 'learning_rate': 1.0313751630000459e-05, 'epoch': 1.01} {'loss': 0.334, 'learning_rate': 1.0313415817578276e-05, 'epoch': 1.01} {'loss': 0.3501, 'learning_rate': 1.0313080004802307e-05, 'epoch': 1.01} {'loss': 0.3891, 'learning_rate': 1.031274419167293e-05, 'epoch': 1.01} {'loss': 0.4657, 'learning_rate': 1.0312408378190526e-05, 'epoch': 1.01} {'loss': 0.4389, 'learning_rate': 1.0312072564355468e-05, 'epoch': 1.01} {'loss': 0.3611, 'learning_rate': 1.0311736750168145e-05, 'epoch': 1.01} {'loss': 0.3584, 'learning_rate': 1.0311400935628925e-05, 'epoch': 1.01} {'loss': 0.341, 'learning_rate': 1.0311065120738197e-05, 'epoch': 1.01} {'loss': 0.2265, 'learning_rate': 1.0310729305496334e-05, 'epoch': 1.01} {'loss': 0.3517, 'learning_rate': 1.0310393489903719e-05, 'epoch': 1.01} {'loss': 0.4782, 'learning_rate': 1.0310057673960725e-05, 'epoch': 1.01} {'loss': 0.4767, 'learning_rate': 1.0309721857667735e-05, 'epoch': 1.01} {'loss': 0.42, 'learning_rate': 1.0309386041025131e-05, 'epoch': 1.01} {'loss': 0.3917, 'learning_rate': 1.0309050224033285e-05, 'epoch': 1.01} {'loss': 0.37, 'learning_rate': 1.0308714406692583e-05, 'epoch': 1.01} {'loss': 0.4061, 'learning_rate': 1.0308378589003399e-05, 'epoch': 1.01} {'loss': 0.205, 'learning_rate': 1.0308042770966116e-05, 'epoch': 1.01} {'loss': 0.4086, 'learning_rate': 1.030770695258111e-05, 'epoch': 1.01} {'loss': 0.3564, 'learning_rate': 1.0307371133848763e-05, 'epoch': 1.01} {'loss': 0.3407, 'learning_rate': 1.0307035314769453e-05, 'epoch': 1.01} {'loss': 0.2657, 'learning_rate': 1.0306699495343558e-05, 'epoch': 1.01} {'loss': 0.4211, 'learning_rate': 1.0306363675571456e-05, 'epoch': 1.01} {'loss': 0.2049, 'learning_rate': 1.0306027855453529e-05, 'epoch': 1.01} {'loss': 0.2991, 'learning_rate': 1.0305692034990154e-05, 'epoch': 1.01} {'loss': 0.281, 'learning_rate': 1.0305356214181709e-05, 'epoch': 1.01} {'loss': 0.3572, 'learning_rate': 1.0305020393028578e-05, 'epoch': 1.01} {'loss': 0.3634, 'learning_rate': 1.0304684571531137e-05, 'epoch': 1.01} {'loss': 0.449, 'learning_rate': 1.0304348749689763e-05, 'epoch': 1.01} {'loss': 0.2853, 'learning_rate': 1.030401292750484e-05, 'epoch': 1.01} {'loss': 0.3643, 'learning_rate': 1.030367710497674e-05, 'epoch': 1.01} {'loss': 0.489, 'learning_rate': 1.0303341282105848e-05, 'epoch': 1.01} {'loss': 0.4182, 'learning_rate': 1.0303005458892544e-05, 'epoch': 1.01} {'loss': 0.2944, 'learning_rate': 1.0302669635337204e-05, 'epoch': 1.01} {'loss': 0.3142, 'learning_rate': 1.0302333811440204e-05, 'epoch': 1.01} {'loss': 0.1717, 'learning_rate': 1.0301997987201929e-05, 'epoch': 1.01} {'loss': 0.3523, 'learning_rate': 1.0301662162622756e-05, 'epoch': 1.01} {'loss': 0.4351, 'learning_rate': 1.0301326337703061e-05, 'epoch': 1.01} {'loss': 0.4647, 'learning_rate': 1.030099051244323e-05, 'epoch': 1.01} {'loss': 0.2825, 'learning_rate': 1.0300654686843633e-05, 'epoch': 1.01} {'loss': 0.4333, 'learning_rate': 1.030031886090466e-05, 'epoch': 1.01} {'loss': 0.365, 'learning_rate': 1.029998303462668e-05, 'epoch': 1.01} {'loss': 0.3517, 'learning_rate': 1.0299647208010078e-05, 'epoch': 1.01} {'loss': 0.2957, 'learning_rate': 1.0299311381055229e-05, 'epoch': 1.01} {'loss': 0.3255, 'learning_rate': 1.0298975553762517e-05, 'epoch': 1.01} {'loss': 0.4058, 'learning_rate': 1.0298639726132316e-05, 'epoch': 1.01} {'loss': 0.2836, 'learning_rate': 1.0298303898165012e-05, 'epoch': 1.01} {'loss': 0.3425, 'learning_rate': 1.0297968069860975e-05, 'epoch': 1.01} {'loss': 0.3991, 'learning_rate': 1.029763224122059e-05, 'epoch': 1.01} {'loss': 0.3204, 'learning_rate': 1.0297296412244235e-05, 'epoch': 1.01} {'loss': 0.3176, 'learning_rate': 1.029696058293229e-05, 'epoch': 1.01} {'loss': 0.3512, 'learning_rate': 1.0296624753285131e-05, 'epoch': 1.01} {'loss': 0.4725, 'learning_rate': 1.029628892330314e-05, 'epoch': 1.01} {'loss': 0.3988, 'learning_rate': 1.0295953092986695e-05, 'epoch': 1.01} {'loss': 0.4061, 'learning_rate': 1.0295617262336175e-05, 'epoch': 1.01} {'loss': 0.2283, 'learning_rate': 1.029528143135196e-05, 'epoch': 1.01} {'loss': 0.3366, 'learning_rate': 1.0294945600034427e-05, 'epoch': 1.01} {'loss': 0.1746, 'learning_rate': 1.0294609768383959e-05, 'epoch': 1.01} {'loss': 0.3026, 'learning_rate': 1.0294273936400929e-05, 'epoch': 1.01} {'loss': 0.4577, 'learning_rate': 1.0293938104085723e-05, 'epoch': 1.01} {'loss': 0.2234, 'learning_rate': 1.0293602271438716e-05, 'epoch': 1.01} {'loss': 0.4303, 'learning_rate': 1.0293266438460287e-05, 'epoch': 1.01} {'loss': 0.3272, 'learning_rate': 1.0292930605150817e-05, 'epoch': 1.01} {'loss': 0.3253, 'learning_rate': 1.0292594771510684e-05, 'epoch': 1.01} {'loss': 0.3001, 'learning_rate': 1.0292258937540267e-05, 'epoch': 1.01} {'loss': 0.2033, 'learning_rate': 1.0291923103239945e-05, 'epoch': 1.01} {'loss': 0.3998, 'learning_rate': 1.0291587268610095e-05, 'epoch': 1.01} {'loss': 0.4406, 'learning_rate': 1.02912514336511e-05, 'epoch': 1.01} {'loss': 0.1443, 'learning_rate': 1.0290915598363338e-05, 'epoch': 1.01} {'loss': 0.1939, 'learning_rate': 1.0290579762747188e-05, 'epoch': 1.01} {'loss': 0.3433, 'learning_rate': 1.029024392680303e-05, 'epoch': 1.01} {'loss': 0.4247, 'learning_rate': 1.028990809053124e-05, 'epoch': 1.01} {'loss': 0.3102, 'learning_rate': 1.02895722539322e-05, 'epoch': 1.01} {'loss': 0.2867, 'learning_rate': 1.0289236417006285e-05, 'epoch': 1.01} {'loss': 0.214, 'learning_rate': 1.028890057975388e-05, 'epoch': 1.01} {'loss': 0.3859, 'learning_rate': 1.028856474217536e-05, 'epoch': 1.01} {'loss': 0.2597, 'learning_rate': 1.0288228904271106e-05, 'epoch': 1.01} {'loss': 0.3857, 'learning_rate': 1.0287893066041496e-05, 'epoch': 1.01} {'loss': 0.4278, 'learning_rate': 1.0287557227486909e-05, 'epoch': 1.01} {'loss': 0.3463, 'learning_rate': 1.0287221388607725e-05, 'epoch': 1.01} {'loss': 0.3376, 'learning_rate': 1.0286885549404323e-05, 'epoch': 1.01} {'loss': 0.4623, 'learning_rate': 1.0286549709877081e-05, 'epoch': 1.01} {'loss': 0.4181, 'learning_rate': 1.028621387002638e-05, 'epoch': 1.01} {'loss': 0.3469, 'learning_rate': 1.0285878029852598e-05, 'epoch': 1.01} {'loss': 0.362, 'learning_rate': 1.0285542189356114e-05, 'epoch': 1.01} {'loss': 0.4051, 'learning_rate': 1.0285206348537306e-05, 'epoch': 1.01} {'loss': 0.2262, 'learning_rate': 1.0284870507396556e-05, 'epoch': 1.01} {'loss': 0.3526, 'learning_rate': 1.0284534665934241e-05, 'epoch': 1.01} {'loss': 0.4205, 'learning_rate': 1.028419882415074e-05, 'epoch': 1.01} {'loss': 0.3457, 'learning_rate': 1.028386298204643e-05, 'epoch': 1.01} {'loss': 0.5526, 'learning_rate': 1.0283527139621697e-05, 'epoch': 1.01} {'loss': 0.2541, 'learning_rate': 1.028319129687691e-05, 'epoch': 1.01} {'loss': 0.4844, 'learning_rate': 1.028285545381246e-05, 'epoch': 1.01} {'loss': 0.2085, 'learning_rate': 1.0282519610428716e-05, 'epoch': 1.01} {'loss': 0.4006, 'learning_rate': 1.0282183766726063e-05, 'epoch': 1.01} {'loss': 0.2242, 'learning_rate': 1.0281847922704877e-05, 'epoch': 1.01} {'loss': 0.5321, 'learning_rate': 1.0281512078365543e-05, 'epoch': 1.01} {'loss': 0.3567, 'learning_rate': 1.028117623370843e-05, 'epoch': 1.01} {'loss': 0.3159, 'learning_rate': 1.0280840388733926e-05, 'epoch': 1.01} {'loss': 0.3844, 'learning_rate': 1.0280504543442402e-05, 'epoch': 1.01} {'loss': 0.3693, 'learning_rate': 1.0280168697834246e-05, 'epoch': 1.01} {'loss': 0.2381, 'learning_rate': 1.027983285190983e-05, 'epoch': 1.01} {'loss': 0.5021, 'learning_rate': 1.027949700566954e-05, 'epoch': 1.01} {'loss': 0.2217, 'learning_rate': 1.0279161159113746e-05, 'epoch': 1.01} {'loss': 0.3684, 'learning_rate': 1.0278825312242833e-05, 'epoch': 1.01} {'loss': 0.3312, 'learning_rate': 1.0278489465057182e-05, 'epoch': 1.01} {'loss': 0.5074, 'learning_rate': 1.0278153617557167e-05, 'epoch': 1.01} {'loss': 0.523, 'learning_rate': 1.027781776974317e-05, 'epoch': 1.01} {'loss': 0.2914, 'learning_rate': 1.0277481921615571e-05, 'epoch': 1.01} {'loss': 0.3136, 'learning_rate': 1.0277146073174747e-05, 'epoch': 1.01} {'loss': 0.197, 'learning_rate': 1.0276810224421076e-05, 'epoch': 1.01} {'loss': 0.3761, 'learning_rate': 1.027647437535494e-05, 'epoch': 1.01} {'loss': 0.3314, 'learning_rate': 1.027613852597672e-05, 'epoch': 1.01} {'loss': 0.3249, 'learning_rate': 1.0275802676286788e-05, 'epoch': 1.01} {'loss': 0.422, 'learning_rate': 1.027546682628553e-05, 'epoch': 1.01} {'loss': 0.2642, 'learning_rate': 1.027513097597332e-05, 'epoch': 1.01} {'loss': 0.189, 'learning_rate': 1.0274795125350536e-05, 'epoch': 1.01} {'loss': 0.2342, 'learning_rate': 1.0274459274417566e-05, 'epoch': 1.01} {'loss': 0.3471, 'learning_rate': 1.0274123423174782e-05, 'epoch': 1.01} {'loss': 0.2756, 'learning_rate': 1.0273787571622567e-05, 'epoch': 1.01} {'loss': 0.5784, 'learning_rate': 1.0273451719761299e-05, 'epoch': 1.01} {'loss': 0.263, 'learning_rate': 1.0273115867591353e-05, 'epoch': 1.01} {'loss': 0.1974, 'learning_rate': 1.027278001511311e-05, 'epoch': 1.01} {'loss': 0.216, 'learning_rate': 1.0272444162326951e-05, 'epoch': 1.01} {'loss': 0.3168, 'learning_rate': 1.0272108309233255e-05, 'epoch': 1.01} {'loss': 0.3395, 'learning_rate': 1.02717724558324e-05, 'epoch': 1.01} {'loss': 0.2825, 'learning_rate': 1.0271436602124766e-05, 'epoch': 1.01} {'loss': 0.2411, 'learning_rate': 1.0271100748110731e-05, 'epoch': 1.01} {'loss': 0.193, 'learning_rate': 1.0270764893790677e-05, 'epoch': 1.01} {'loss': 0.2243, 'learning_rate': 1.0270429039164977e-05, 'epoch': 1.01} {'loss': 0.413, 'learning_rate': 1.0270093184234017e-05, 'epoch': 1.01} {'loss': 0.3467, 'learning_rate': 1.0269757328998173e-05, 'epoch': 1.01} {'loss': 0.4797, 'learning_rate': 1.0269421473457824e-05, 'epoch': 1.01} {'loss': 0.4358, 'learning_rate': 1.0269085617613352e-05, 'epoch': 1.01} {'loss': 0.335, 'learning_rate': 1.0268749761465131e-05, 'epoch': 1.01} {'loss': 0.3866, 'learning_rate': 1.026841390501354e-05, 'epoch': 1.01} {'loss': 0.4007, 'learning_rate': 1.0268078048258964e-05, 'epoch': 1.01} {'loss': 0.3954, 'learning_rate': 1.0267742191201779e-05, 'epoch': 1.01} {'loss': 0.4406, 'learning_rate': 1.0267406333842362e-05, 'epoch': 1.01} {'loss': 0.322, 'learning_rate': 1.0267070476181096e-05, 'epoch': 1.01} {'loss': 0.3122, 'learning_rate': 1.0266734618218356e-05, 'epoch': 1.01} {'loss': 0.2959, 'learning_rate': 1.0266398759954526e-05, 'epoch': 1.01} {'loss': 0.4474, 'learning_rate': 1.026606290138998e-05, 'epoch': 1.01} {'loss': 0.323, 'learning_rate': 1.02657270425251e-05, 'epoch': 1.01} {'loss': 0.2291, 'learning_rate': 1.0265391183360265e-05, 'epoch': 1.01} {'loss': 0.2895, 'learning_rate': 1.0265055323895856e-05, 'epoch': 1.01} {'loss': 0.4417, 'learning_rate': 1.026471946413225e-05, 'epoch': 1.01} {'loss': 0.3947, 'learning_rate': 1.0264383604069823e-05, 'epoch': 1.01} {'loss': 0.281, 'learning_rate': 1.0264047743708959e-05, 'epoch': 1.01} {'loss': 0.2027, 'learning_rate': 1.0263711883050033e-05, 'epoch': 1.01} {'loss': 0.422, 'learning_rate': 1.026337602209343e-05, 'epoch': 1.01} {'loss': 0.2943, 'learning_rate': 1.0263040160839523e-05, 'epoch': 1.01} {'loss': 0.2986, 'learning_rate': 1.0262704299288696e-05, 'epoch': 1.01} {'loss': 0.3858, 'learning_rate': 1.0262368437441322e-05, 'epoch': 1.01} {'loss': 0.3261, 'learning_rate': 1.0262032575297787e-05, 'epoch': 1.01} {'loss': 0.5307, 'learning_rate': 1.0261696712858464e-05, 'epoch': 1.01} {'loss': 0.2904, 'learning_rate': 1.0261360850123739e-05, 'epoch': 1.01} {'loss': 0.3286, 'learning_rate': 1.0261024987093987e-05, 'epoch': 1.01} {'loss': 0.3183, 'learning_rate': 1.0260689123769586e-05, 'epoch': 1.02} {'loss': 0.3344, 'learning_rate': 1.0260353260150917e-05, 'epoch': 1.02} {'loss': 0.321, 'learning_rate': 1.0260017396238357e-05, 'epoch': 1.02} {'loss': 0.3999, 'learning_rate': 1.0259681532032288e-05, 'epoch': 1.02} {'loss': 0.247, 'learning_rate': 1.025934566753309e-05, 'epoch': 1.02} {'loss': 0.2741, 'learning_rate': 1.0259009802741136e-05, 'epoch': 1.02} {'loss': 0.2815, 'learning_rate': 1.0258673937656811e-05, 'epoch': 1.02} {'loss': 0.3221, 'learning_rate': 1.0258338072280491e-05, 'epoch': 1.02} {'loss': 0.4179, 'learning_rate': 1.0258002206612559e-05, 'epoch': 1.02} {'loss': 0.451, 'learning_rate': 1.0257666340653389e-05, 'epoch': 1.02} {'loss': 0.3888, 'learning_rate': 1.0257330474403365e-05, 'epoch': 1.02} {'loss': 0.3469, 'learning_rate': 1.0256994607862865e-05, 'epoch': 1.02} {'loss': 0.3803, 'learning_rate': 1.0256658741032264e-05, 'epoch': 1.02} {'loss': 0.3399, 'learning_rate': 1.0256322873911946e-05, 'epoch': 1.02} {'loss': 0.2704, 'learning_rate': 1.0255987006502288e-05, 'epoch': 1.02} {'loss': 0.5125, 'learning_rate': 1.0255651138803669e-05, 'epoch': 1.02} {'loss': 0.3108, 'learning_rate': 1.0255315270816466e-05, 'epoch': 1.02} {'loss': 0.394, 'learning_rate': 1.0254979402541063e-05, 'epoch': 1.02} {'loss': 0.4086, 'learning_rate': 1.0254643533977838e-05, 'epoch': 1.02} {'loss': 0.4184, 'learning_rate': 1.0254307665127165e-05, 'epoch': 1.02} {'loss': 0.275, 'learning_rate': 1.025397179598943e-05, 'epoch': 1.02} {'loss': 0.3748, 'learning_rate': 1.0253635926565008e-05, 'epoch': 1.02} {'loss': 0.2966, 'learning_rate': 1.025330005685428e-05, 'epoch': 1.02} {'loss': 0.4267, 'learning_rate': 1.0252964186857626e-05, 'epoch': 1.02} {'loss': 0.2998, 'learning_rate': 1.0252628316575424e-05, 'epoch': 1.02} {'loss': 0.3902, 'learning_rate': 1.025229244600805e-05, 'epoch': 1.02} {'loss': 0.4082, 'learning_rate': 1.0251956575155885e-05, 'epoch': 1.02} {'loss': 0.2797, 'learning_rate': 1.025162070401931e-05, 'epoch': 1.02} {'loss': 0.3393, 'learning_rate': 1.0251284832598702e-05, 'epoch': 1.02} {'loss': 0.424, 'learning_rate': 1.0250948960894445e-05, 'epoch': 1.02} {'loss': 0.3379, 'learning_rate': 1.0250613088906911e-05, 'epoch': 1.02} {'loss': 0.3197, 'learning_rate': 1.0250277216636482e-05, 'epoch': 1.02} {'loss': 0.4066, 'learning_rate': 1.024994134408354e-05, 'epoch': 1.02} {'loss': 0.3563, 'learning_rate': 1.024960547124846e-05, 'epoch': 1.02} {'loss': 0.2946, 'learning_rate': 1.0249269598131623e-05, 'epoch': 1.02} {'loss': 0.321, 'learning_rate': 1.024893372473341e-05, 'epoch': 1.02} {'loss': 0.2707, 'learning_rate': 1.0248597851054196e-05, 'epoch': 1.02} {'loss': 0.3916, 'learning_rate': 1.0248261977094363e-05, 'epoch': 1.02} {'loss': 0.425, 'learning_rate': 1.0247926102854291e-05, 'epoch': 1.02} {'loss': 0.304, 'learning_rate': 1.0247590228334356e-05, 'epoch': 1.02} {'loss': 0.3191, 'learning_rate': 1.0247254353534939e-05, 'epoch': 1.02} {'loss': 0.4176, 'learning_rate': 1.0246918478456417e-05, 'epoch': 1.02} {'loss': 0.3987, 'learning_rate': 1.0246582603099173e-05, 'epoch': 1.02} {'loss': 0.3355, 'learning_rate': 1.0246246727463585e-05, 'epoch': 1.02} {'loss': 0.4891, 'learning_rate': 1.0245910851550029e-05, 'epoch': 1.02} {'loss': 0.3328, 'learning_rate': 1.0245574975358887e-05, 'epoch': 1.02} {'loss': 0.2879, 'learning_rate': 1.0245239098890537e-05, 'epoch': 1.02} {'loss': 0.1969, 'learning_rate': 1.0244903222145362e-05, 'epoch': 1.02} {'loss': 0.4411, 'learning_rate': 1.0244567345123735e-05, 'epoch': 1.02} {'loss': 0.2983, 'learning_rate': 1.0244231467826038e-05, 'epoch': 1.02} {'loss': 0.4788, 'learning_rate': 1.0243895590252651e-05, 'epoch': 1.02} {'loss': 0.3283, 'learning_rate': 1.0243559712403953e-05, 'epoch': 1.02} {'loss': 0.3052, 'learning_rate': 1.024322383428032e-05, 'epoch': 1.02} {'loss': 0.3866, 'learning_rate': 1.0242887955882135e-05, 'epoch': 1.02} {'loss': 0.3077, 'learning_rate': 1.0242552077209775e-05, 'epoch': 1.02} {'loss': 0.4027, 'learning_rate': 1.0242216198263622e-05, 'epoch': 1.02} {'loss': 0.3297, 'learning_rate': 1.0241880319044051e-05, 'epoch': 1.02} {'loss': 0.2537, 'learning_rate': 1.0241544439551441e-05, 'epoch': 1.02} {'loss': 0.4172, 'learning_rate': 1.0241208559786175e-05, 'epoch': 1.02} {'loss': 0.3745, 'learning_rate': 1.024087267974863e-05, 'epoch': 1.02} {'loss': 0.3598, 'learning_rate': 1.0240536799439187e-05, 'epoch': 1.02} {'loss': 0.224, 'learning_rate': 1.0240200918858225e-05, 'epoch': 1.02} {'loss': 0.3479, 'learning_rate': 1.023986503800612e-05, 'epoch': 1.02} {'loss': 0.3783, 'learning_rate': 1.0239529156883255e-05, 'epoch': 1.02} {'loss': 0.4423, 'learning_rate': 1.0239193275490005e-05, 'epoch': 1.02} {'loss': 0.3958, 'learning_rate': 1.0238857393826751e-05, 'epoch': 1.02} {'loss': 0.3071, 'learning_rate': 1.0238521511893873e-05, 'epoch': 1.02} {'loss': 0.2775, 'learning_rate': 1.0238185629691749e-05, 'epoch': 1.02} {'loss': 0.4338, 'learning_rate': 1.0237849747220758e-05, 'epoch': 1.02} {'loss': 0.3988, 'learning_rate': 1.0237513864481281e-05, 'epoch': 1.02} {'loss': 0.3091, 'learning_rate': 1.0237177981473696e-05, 'epoch': 1.02} {'loss': 0.1927, 'learning_rate': 1.0236842098198383e-05, 'epoch': 1.02} {'loss': 0.3484, 'learning_rate': 1.0236506214655719e-05, 'epoch': 1.02} {'loss': 0.2925, 'learning_rate': 1.0236170330846085e-05, 'epoch': 1.02} {'loss': 0.3627, 'learning_rate': 1.0235834446769862e-05, 'epoch': 1.02} {'loss': 0.351, 'learning_rate': 1.0235498562427424e-05, 'epoch': 1.02} {'loss': 0.3178, 'learning_rate': 1.0235162677819152e-05, 'epoch': 1.02} {'loss': 0.2082, 'learning_rate': 1.023482679294543e-05, 'epoch': 1.02} {'loss': 0.4148, 'learning_rate': 1.0234490907806629e-05, 'epoch': 1.02} {'loss': 0.2996, 'learning_rate': 1.0234155022403133e-05, 'epoch': 1.02} {'loss': 0.4452, 'learning_rate': 1.0233819136735321e-05, 'epoch': 1.02} {'loss': 0.5169, 'learning_rate': 1.0233483250803574e-05, 'epoch': 1.02} {'loss': 0.2974, 'learning_rate': 1.0233147364608267e-05, 'epoch': 1.02} {'loss': 0.5318, 'learning_rate': 1.023281147814978e-05, 'epoch': 1.02} {'loss': 0.4161, 'learning_rate': 1.0232475591428494e-05, 'epoch': 1.02} {'loss': 0.3019, 'learning_rate': 1.0232139704444786e-05, 'epoch': 1.02} {'loss': 0.3818, 'learning_rate': 1.0231803817199038e-05, 'epoch': 1.02} {'loss': 0.2947, 'learning_rate': 1.023146792969163e-05, 'epoch': 1.02} {'loss': 0.2734, 'learning_rate': 1.0231132041922935e-05, 'epoch': 1.02} {'loss': 0.3569, 'learning_rate': 1.0230796153893336e-05, 'epoch': 1.02} {'loss': 0.329, 'learning_rate': 1.0230460265603212e-05, 'epoch': 1.02} {'loss': 0.4021, 'learning_rate': 1.0230124377052943e-05, 'epoch': 1.02} {'loss': 0.4215, 'learning_rate': 1.0229788488242908e-05, 'epoch': 1.02} {'loss': 0.3347, 'learning_rate': 1.0229452599173486e-05, 'epoch': 1.02} {'loss': 0.3806, 'learning_rate': 1.0229116709845056e-05, 'epoch': 1.02} {'loss': 0.2701, 'learning_rate': 1.0228780820257993e-05, 'epoch': 1.02} {'loss': 0.5065, 'learning_rate': 1.0228444930412682e-05, 'epoch': 1.02} {'loss': 0.343, 'learning_rate': 1.02281090403095e-05, 'epoch': 1.02} {'loss': 0.3083, 'learning_rate': 1.0227773149948828e-05, 'epoch': 1.02} {'loss': 0.3286, 'learning_rate': 1.0227437259331042e-05, 'epoch': 1.02} {'loss': 0.5528, 'learning_rate': 1.0227101368456525e-05, 'epoch': 1.02} {'loss': 0.3982, 'learning_rate': 1.022676547732565e-05, 'epoch': 1.02} {'loss': 0.2206, 'learning_rate': 1.0226429585938802e-05, 'epoch': 1.02} {'loss': 0.4725, 'learning_rate': 1.0226093694296357e-05, 'epoch': 1.02} {'loss': 0.4374, 'learning_rate': 1.0225757802398695e-05, 'epoch': 1.02} {'loss': 0.4041, 'learning_rate': 1.0225421910246196e-05, 'epoch': 1.02} {'loss': 0.3391, 'learning_rate': 1.0225086017839237e-05, 'epoch': 1.02} {'loss': 0.1587, 'learning_rate': 1.02247501251782e-05, 'epoch': 1.02} {'loss': 0.2931, 'learning_rate': 1.0224414232263463e-05, 'epoch': 1.02} {'loss': 0.3497, 'learning_rate': 1.0224078339095404e-05, 'epoch': 1.02} {'loss': 0.2437, 'learning_rate': 1.0223742445674403e-05, 'epoch': 1.02} {'loss': 0.3385, 'learning_rate': 1.0223406552000842e-05, 'epoch': 1.02} {'loss': 0.3711, 'learning_rate': 1.0223070658075098e-05, 'epoch': 1.02} {'loss': 0.2788, 'learning_rate': 1.0222734763897545e-05, 'epoch': 1.02} {'loss': 0.4092, 'learning_rate': 1.022239886946857e-05, 'epoch': 1.02} {'loss': 0.3189, 'learning_rate': 1.022206297478855e-05, 'epoch': 1.02} {'loss': 0.2157, 'learning_rate': 1.0221727079857861e-05, 'epoch': 1.02} {'loss': 0.3001, 'learning_rate': 1.0221391184676885e-05, 'epoch': 1.02} {'loss': 0.3771, 'learning_rate': 1.0221055289246e-05, 'epoch': 1.02} {'loss': 0.2477, 'learning_rate': 1.0220719393565586e-05, 'epoch': 1.02} {'loss': 0.4051, 'learning_rate': 1.0220383497636022e-05, 'epoch': 1.02} {'loss': 0.2637, 'learning_rate': 1.0220047601457685e-05, 'epoch': 1.02} {'loss': 0.3308, 'learning_rate': 1.0219711705030958e-05, 'epoch': 1.02} {'loss': 0.2083, 'learning_rate': 1.0219375808356217e-05, 'epoch': 1.02} {'loss': 0.3016, 'learning_rate': 1.0219039911433846e-05, 'epoch': 1.02} {'loss': 0.3827, 'learning_rate': 1.0218704014264218e-05, 'epoch': 1.02} {'loss': 0.3582, 'learning_rate': 1.0218368116847715e-05, 'epoch': 1.02} {'loss': 0.3558, 'learning_rate': 1.0218032219184715e-05, 'epoch': 1.02} {'loss': 0.3594, 'learning_rate': 1.0217696321275598e-05, 'epoch': 1.02} {'loss': 0.3388, 'learning_rate': 1.0217360423120745e-05, 'epoch': 1.02} {'loss': 0.4086, 'learning_rate': 1.021702452472053e-05, 'epoch': 1.02} {'loss': 0.3375, 'learning_rate': 1.021668862607534e-05, 'epoch': 1.02} {'loss': 0.2466, 'learning_rate': 1.0216352727185547e-05, 'epoch': 1.02} {'loss': 0.2817, 'learning_rate': 1.0216016828051534e-05, 'epoch': 1.02} {'loss': 0.2323, 'learning_rate': 1.0215680928673679e-05, 'epoch': 1.02} {'loss': 0.4092, 'learning_rate': 1.0215345029052361e-05, 'epoch': 1.02} {'loss': 0.3513, 'learning_rate': 1.0215009129187958e-05, 'epoch': 1.02} {'loss': 0.3889, 'learning_rate': 1.0214673229080855e-05, 'epoch': 1.02} {'loss': 0.3708, 'learning_rate': 1.0214337328731423e-05, 'epoch': 1.02} {'loss': 0.3326, 'learning_rate': 1.0214001428140046e-05, 'epoch': 1.02} {'loss': 0.3049, 'learning_rate': 1.0213665527307101e-05, 'epoch': 1.02} {'loss': 0.3368, 'learning_rate': 1.0213329626232971e-05, 'epoch': 1.02} {'loss': 0.3436, 'learning_rate': 1.021299372491803e-05, 'epoch': 1.02} {'loss': 0.2799, 'learning_rate': 1.021265782336266e-05, 'epoch': 1.02} {'loss': 0.217, 'learning_rate': 1.0212321921567238e-05, 'epoch': 1.02} {'loss': 0.3819, 'learning_rate': 1.0211986019532148e-05, 'epoch': 1.02} {'loss': 0.4641, 'learning_rate': 1.0211650117257763e-05, 'epoch': 1.02} {'loss': 0.4195, 'learning_rate': 1.0211314214744468e-05, 'epoch': 1.02} {'loss': 0.2266, 'learning_rate': 1.0210978311992639e-05, 'epoch': 1.02} {'loss': 0.3049, 'learning_rate': 1.0210642409002654e-05, 'epoch': 1.02} {'loss': 0.2636, 'learning_rate': 1.0210306505774897e-05, 'epoch': 1.02} {'loss': 0.3508, 'learning_rate': 1.0209970602309742e-05, 'epoch': 1.02} {'loss': 0.3602, 'learning_rate': 1.0209634698607568e-05, 'epoch': 1.02} {'loss': 0.4073, 'learning_rate': 1.020929879466876e-05, 'epoch': 1.02} {'loss': 0.4583, 'learning_rate': 1.020896289049369e-05, 'epoch': 1.02} {'loss': 0.4154, 'learning_rate': 1.0208626986082744e-05, 'epoch': 1.02} {'loss': 0.3218, 'learning_rate': 1.0208291081436293e-05, 'epoch': 1.02} {'loss': 0.3435, 'learning_rate': 1.0207955176554724e-05, 'epoch': 1.02} {'loss': 0.2802, 'learning_rate': 1.0207619271438414e-05, 'epoch': 1.02} {'loss': 0.3718, 'learning_rate': 1.020728336608774e-05, 'epoch': 1.02} {'loss': 0.2152, 'learning_rate': 1.0206947460503084e-05, 'epoch': 1.02} {'loss': 0.3837, 'learning_rate': 1.0206611554684823e-05, 'epoch': 1.02} {'loss': 0.3043, 'learning_rate': 1.0206275648633337e-05, 'epoch': 1.02} {'loss': 0.2796, 'learning_rate': 1.0205939742349004e-05, 'epoch': 1.02} {'loss': 0.3856, 'learning_rate': 1.0205603835832205e-05, 'epoch': 1.02} {'loss': 0.3659, 'learning_rate': 1.0205267929083318e-05, 'epoch': 1.02} {'loss': 0.3337, 'learning_rate': 1.0204932022102722e-05, 'epoch': 1.02} {'loss': 0.324, 'learning_rate': 1.0204596114890796e-05, 'epoch': 1.02} {'loss': 0.3299, 'learning_rate': 1.0204260207447922e-05, 'epoch': 1.02} {'loss': 0.2984, 'learning_rate': 1.0203924299774477e-05, 'epoch': 1.02} {'loss': 0.2162, 'learning_rate': 1.020358839187084e-05, 'epoch': 1.02} {'loss': 0.5991, 'learning_rate': 1.0203252483737389e-05, 'epoch': 1.02} {'loss': 0.2298, 'learning_rate': 1.0202916575374506e-05, 'epoch': 1.02} {'loss': 0.2133, 'learning_rate': 1.0202580666782569e-05, 'epoch': 1.02} {'loss': 0.2239, 'learning_rate': 1.0202244757961957e-05, 'epoch': 1.02} {'loss': 0.3833, 'learning_rate': 1.0201908848913049e-05, 'epoch': 1.02} {'loss': 0.3248, 'learning_rate': 1.0201572939636224e-05, 'epoch': 1.02} {'loss': 0.4048, 'learning_rate': 1.0201237030131862e-05, 'epoch': 1.02} {'loss': 0.2639, 'learning_rate': 1.020090112040034e-05, 'epoch': 1.02} {'loss': 0.2755, 'learning_rate': 1.0200565210442039e-05, 'epoch': 1.02} {'loss': 0.2379, 'learning_rate': 1.0200229300257339e-05, 'epoch': 1.02} {'loss': 0.4599, 'learning_rate': 1.0199893389846619e-05, 'epoch': 1.02} {'loss': 0.277, 'learning_rate': 1.0199557479210254e-05, 'epoch': 1.02} {'loss': 0.3616, 'learning_rate': 1.019922156834863e-05, 'epoch': 1.02} {'loss': 0.3392, 'learning_rate': 1.0198885657262121e-05, 'epoch': 1.02} {'loss': 0.2413, 'learning_rate': 1.0198549745951108e-05, 'epoch': 1.02} {'loss': 0.2906, 'learning_rate': 1.019821383441597e-05, 'epoch': 1.02} {'loss': 0.3477, 'learning_rate': 1.0197877922657089e-05, 'epoch': 1.02} {'loss': 0.3975, 'learning_rate': 1.019754201067484e-05, 'epoch': 1.02} {'loss': 0.3392, 'learning_rate': 1.0197206098469604e-05, 'epoch': 1.02} {'loss': 0.3611, 'learning_rate': 1.0196870186041756e-05, 'epoch': 1.02} {'loss': 0.2861, 'learning_rate': 1.0196534273391682e-05, 'epoch': 1.02} {'loss': 0.3944, 'learning_rate': 1.0196198360519757e-05, 'epoch': 1.02} {'loss': 0.4694, 'learning_rate': 1.0195862447426363e-05, 'epoch': 1.02} {'loss': 0.2673, 'learning_rate': 1.0195526534111877e-05, 'epoch': 1.02} {'loss': 0.2583, 'learning_rate': 1.0195190620576677e-05, 'epoch': 1.02} {'loss': 0.2448, 'learning_rate': 1.0194854706821146e-05, 'epoch': 1.02} {'loss': 0.3196, 'learning_rate': 1.0194518792845662e-05, 'epoch': 1.02} {'loss': 0.3631, 'learning_rate': 1.0194182878650602e-05, 'epoch': 1.02} {'loss': 0.2907, 'learning_rate': 1.0193846964236347e-05, 'epoch': 1.02} {'loss': 0.427, 'learning_rate': 1.0193511049603276e-05, 'epoch': 1.02} {'loss': 0.4373, 'learning_rate': 1.0193175134751767e-05, 'epoch': 1.02} {'loss': 0.4126, 'learning_rate': 1.01928392196822e-05, 'epoch': 1.02} {'loss': 0.4044, 'learning_rate': 1.0192503304394953e-05, 'epoch': 1.02} {'loss': 0.3513, 'learning_rate': 1.0192167388890409e-05, 'epoch': 1.02} {'loss': 0.4287, 'learning_rate': 1.0191831473168941e-05, 'epoch': 1.02} {'loss': 0.3082, 'learning_rate': 1.019149555723093e-05, 'epoch': 1.02} {'loss': 0.3207, 'learning_rate': 1.0191159641076762e-05, 'epoch': 1.02} {'loss': 0.2411, 'learning_rate': 1.019082372470681e-05, 'epoch': 1.02} {'loss': 0.2515, 'learning_rate': 1.0190487808121454e-05, 'epoch': 1.02} {'loss': 0.3279, 'learning_rate': 1.0190151891321073e-05, 'epoch': 1.02} {'loss': 0.3727, 'learning_rate': 1.0189815974306049e-05, 'epoch': 1.02} {'loss': 0.4816, 'learning_rate': 1.0189480057076758e-05, 'epoch': 1.02} {'loss': 0.3278, 'learning_rate': 1.0189144139633577e-05, 'epoch': 1.02} {'loss': 0.4095, 'learning_rate': 1.0188808221976891e-05, 'epoch': 1.02} {'loss': 0.3179, 'learning_rate': 1.0188472304107075e-05, 'epoch': 1.02} {'loss': 0.3782, 'learning_rate': 1.0188136386024512e-05, 'epoch': 1.02} {'loss': 0.4273, 'learning_rate': 1.0187800467729577e-05, 'epoch': 1.02} {'loss': 0.3587, 'learning_rate': 1.018746454922265e-05, 'epoch': 1.02} {'loss': 0.3108, 'learning_rate': 1.0187128630504113e-05, 'epoch': 1.02} {'loss': 0.4119, 'learning_rate': 1.0186792711574343e-05, 'epoch': 1.02} {'loss': 0.3614, 'learning_rate': 1.0186456792433716e-05, 'epoch': 1.02} {'loss': 0.3217, 'learning_rate': 1.018612087308262e-05, 'epoch': 1.02} {'loss': 0.336, 'learning_rate': 1.0185784953521429e-05, 'epoch': 1.02} {'loss': 0.3848, 'learning_rate': 1.0185449033750519e-05, 'epoch': 1.02} {'loss': 0.3859, 'learning_rate': 1.0185113113770273e-05, 'epoch': 1.02} {'loss': 0.258, 'learning_rate': 1.018477719358107e-05, 'epoch': 1.02} {'loss': 0.3377, 'learning_rate': 1.0184441273183288e-05, 'epoch': 1.02} {'loss': 0.3735, 'learning_rate': 1.0184105352577307e-05, 'epoch': 1.02} {'loss': 0.3673, 'learning_rate': 1.0183769431763506e-05, 'epoch': 1.02} {'loss': 0.4554, 'learning_rate': 1.0183433510742265e-05, 'epoch': 1.02} {'loss': 0.3929, 'learning_rate': 1.0183097589513961e-05, 'epoch': 1.02} {'loss': 0.4936, 'learning_rate': 1.0182761668078977e-05, 'epoch': 1.02} {'loss': 0.3406, 'learning_rate': 1.0182425746437687e-05, 'epoch': 1.02} {'loss': 0.4692, 'learning_rate': 1.0182089824590476e-05, 'epoch': 1.02} {'loss': 0.2864, 'learning_rate': 1.0181753902537718e-05, 'epoch': 1.02} {'loss': 0.3828, 'learning_rate': 1.0181417980279797e-05, 'epoch': 1.02} {'loss': 0.3096, 'learning_rate': 1.0181082057817089e-05, 'epoch': 1.02} {'loss': 0.5092, 'learning_rate': 1.0180746135149973e-05, 'epoch': 1.02} {'loss': 0.3565, 'learning_rate': 1.0180410212278829e-05, 'epoch': 1.02} {'loss': 0.3418, 'learning_rate': 1.0180074289204035e-05, 'epoch': 1.02} {'loss': 0.3294, 'learning_rate': 1.017973836592597e-05, 'epoch': 1.02} {'loss': 0.2545, 'learning_rate': 1.0179402442445019e-05, 'epoch': 1.02} {'loss': 0.4136, 'learning_rate': 1.0179066518761553e-05, 'epoch': 1.02} {'loss': 0.2152, 'learning_rate': 1.0178730594875957e-05, 'epoch': 1.02} {'loss': 0.3901, 'learning_rate': 1.0178394670788607e-05, 'epoch': 1.02} {'loss': 0.4279, 'learning_rate': 1.0178058746499884e-05, 'epoch': 1.02} {'loss': 0.2526, 'learning_rate': 1.0177722822010165e-05, 'epoch': 1.02} {'loss': 0.3703, 'learning_rate': 1.0177386897319832e-05, 'epoch': 1.02} {'loss': 0.4301, 'learning_rate': 1.0177050972429266e-05, 'epoch': 1.02} {'loss': 0.3099, 'learning_rate': 1.0176715047338842e-05, 'epoch': 1.02} {'loss': 0.251, 'learning_rate': 1.0176379122048936e-05, 'epoch': 1.02} {'loss': 0.2188, 'learning_rate': 1.0176043196559935e-05, 'epoch': 1.02} {'loss': 0.4271, 'learning_rate': 1.0175707270872213e-05, 'epoch': 1.02} {'loss': 0.3982, 'learning_rate': 1.0175371344986152e-05, 'epoch': 1.02} {'loss': 0.389, 'learning_rate': 1.0175035418902129e-05, 'epoch': 1.02} {'loss': 0.265, 'learning_rate': 1.0174699492620523e-05, 'epoch': 1.02} {'loss': 0.3509, 'learning_rate': 1.0174363566141717e-05, 'epoch': 1.02} {'loss': 0.473, 'learning_rate': 1.0174027639466087e-05, 'epoch': 1.02} {'loss': 0.2166, 'learning_rate': 1.0173691712594013e-05, 'epoch': 1.02} {'loss': 0.242, 'learning_rate': 1.0173355785525875e-05, 'epoch': 1.02} {'loss': 0.4193, 'learning_rate': 1.0173019858262052e-05, 'epoch': 1.02} {'loss': 0.2397, 'learning_rate': 1.017268393080292e-05, 'epoch': 1.02} {'loss': 0.3776, 'learning_rate': 1.0172348003148862e-05, 'epoch': 1.02} {'loss': 0.2819, 'learning_rate': 1.0172012075300255e-05, 'epoch': 1.02} {'loss': 0.3552, 'learning_rate': 1.0171676147257478e-05, 'epoch': 1.02} {'loss': 0.4971, 'learning_rate': 1.0171340219020916e-05, 'epoch': 1.02} {'loss': 0.3887, 'learning_rate': 1.0171004290590938e-05, 'epoch': 1.02} {'loss': 0.3658, 'learning_rate': 1.0170668361967932e-05, 'epoch': 1.02} {'loss': 0.3326, 'learning_rate': 1.0170332433152272e-05, 'epoch': 1.02} {'loss': 0.2919, 'learning_rate': 1.0169996504144339e-05, 'epoch': 1.02} {'loss': 0.2888, 'learning_rate': 1.0169660574944513e-05, 'epoch': 1.02} {'loss': 0.2827, 'learning_rate': 1.0169324645553174e-05, 'epoch': 1.02} {'loss': 0.2353, 'learning_rate': 1.01689887159707e-05, 'epoch': 1.02} {'loss': 0.3199, 'learning_rate': 1.0168652786197469e-05, 'epoch': 1.02} {'loss': 0.2859, 'learning_rate': 1.0168316856233859e-05, 'epoch': 1.02} {'loss': 0.1961, 'learning_rate': 1.0167980926080254e-05, 'epoch': 1.02} {'loss': 0.4605, 'learning_rate': 1.0167644995737028e-05, 'epoch': 1.02} {'loss': 0.1915, 'learning_rate': 1.0167309065204565e-05, 'epoch': 1.02} {'loss': 0.4476, 'learning_rate': 1.016697313448324e-05, 'epoch': 1.02} {'loss': 0.342, 'learning_rate': 1.0166637203573433e-05, 'epoch': 1.02} {'loss': 0.265, 'learning_rate': 1.0166301272475528e-05, 'epoch': 1.02} {'loss': 0.3281, 'learning_rate': 1.0165965341189896e-05, 'epoch': 1.02} {'loss': 0.3303, 'learning_rate': 1.0165629409716924e-05, 'epoch': 1.02} {'loss': 0.3423, 'learning_rate': 1.0165293478056988e-05, 'epoch': 1.02} {'loss': 0.2265, 'learning_rate': 1.0164957546210466e-05, 'epoch': 1.02} {'loss': 0.2772, 'learning_rate': 1.016462161417774e-05, 'epoch': 1.02} {'loss': 0.3938, 'learning_rate': 1.0164285681959185e-05, 'epoch': 1.02} {'loss': 0.2904, 'learning_rate': 1.0163949749555185e-05, 'epoch': 1.02} {'loss': 0.3177, 'learning_rate': 1.0163613816966116e-05, 'epoch': 1.02} {'loss': 0.36, 'learning_rate': 1.0163277884192357e-05, 'epoch': 1.02} {'loss': 0.26, 'learning_rate': 1.016294195123429e-05, 'epoch': 1.02} {'loss': 0.3112, 'learning_rate': 1.016260601809229e-05, 'epoch': 1.02} {'loss': 0.3211, 'learning_rate': 1.0162270084766738e-05, 'epoch': 1.02} {'loss': 0.2565, 'learning_rate': 1.0161934151258017e-05, 'epoch': 1.02} {'loss': 0.3835, 'learning_rate': 1.0161598217566503e-05, 'epoch': 1.02} {'loss': 0.3315, 'learning_rate': 1.0161262283692574e-05, 'epoch': 1.02} {'loss': 0.3073, 'learning_rate': 1.0160926349636612e-05, 'epoch': 1.02} {'loss': 0.3392, 'learning_rate': 1.0160590415398994e-05, 'epoch': 1.02} {'loss': 0.5535, 'learning_rate': 1.0160254480980101e-05, 'epoch': 1.02} {'loss': 0.3169, 'learning_rate': 1.0159918546380312e-05, 'epoch': 1.02} {'loss': 0.4224, 'learning_rate': 1.0159582611600003e-05, 'epoch': 1.02} {'loss': 0.3991, 'learning_rate': 1.0159246676639556e-05, 'epoch': 1.02} {'loss': 0.1396, 'learning_rate': 1.0158910741499348e-05, 'epoch': 1.02} {'loss': 0.1767, 'learning_rate': 1.0158574806179762e-05, 'epoch': 1.02} {'loss': 0.2133, 'learning_rate': 1.0158238870681175e-05, 'epoch': 1.02} {'loss': 0.3293, 'learning_rate': 1.0157902935003965e-05, 'epoch': 1.02} {'loss': 0.3457, 'learning_rate': 1.0157566999148514e-05, 'epoch': 1.02} {'loss': 0.4663, 'learning_rate': 1.0157231063115198e-05, 'epoch': 1.02} {'loss': 0.2636, 'learning_rate': 1.0156895126904403e-05, 'epoch': 1.02} {'loss': 0.3409, 'learning_rate': 1.01565591905165e-05, 'epoch': 1.02} {'loss': 0.2895, 'learning_rate': 1.0156223253951871e-05, 'epoch': 1.02} {'loss': 0.3683, 'learning_rate': 1.0155887317210898e-05, 'epoch': 1.02} {'loss': 0.3037, 'learning_rate': 1.0155551380293955e-05, 'epoch': 1.02} {'loss': 0.3171, 'learning_rate': 1.0155215443201424e-05, 'epoch': 1.02} {'loss': 0.4774, 'learning_rate': 1.0154879505933687e-05, 'epoch': 1.02} {'loss': 0.3203, 'learning_rate': 1.0154543568491118e-05, 'epoch': 1.02} {'loss': 0.2558, 'learning_rate': 1.01542076308741e-05, 'epoch': 1.02} {'loss': 0.5453, 'learning_rate': 1.015387169308301e-05, 'epoch': 1.02} {'loss': 0.4642, 'learning_rate': 1.0153535755118229e-05, 'epoch': 1.02} {'loss': 0.4054, 'learning_rate': 1.0153199816980136e-05, 'epoch': 1.02} {'loss': 0.2771, 'learning_rate': 1.0152863878669105e-05, 'epoch': 1.02} {'loss': 0.3022, 'learning_rate': 1.0152527940185526e-05, 'epoch': 1.02} {'loss': 0.3212, 'learning_rate': 1.0152192001529771e-05, 'epoch': 1.02} {'loss': 0.2989, 'learning_rate': 1.0151856062702217e-05, 'epoch': 1.02} {'loss': 0.188, 'learning_rate': 1.0151520123703249e-05, 'epoch': 1.02} {'loss': 0.3366, 'learning_rate': 1.015118418453324e-05, 'epoch': 1.02} {'loss': 0.3418, 'learning_rate': 1.0150848245192578e-05, 'epoch': 1.02} {'loss': 0.4524, 'learning_rate': 1.0150512305681633e-05, 'epoch': 1.02} {'loss': 0.327, 'learning_rate': 1.0150176366000788e-05, 'epoch': 1.02} {'loss': 0.4347, 'learning_rate': 1.0149840426150424e-05, 'epoch': 1.02} {'loss': 0.289, 'learning_rate': 1.0149504486130919e-05, 'epoch': 1.02} {'loss': 0.4242, 'learning_rate': 1.0149168545942652e-05, 'epoch': 1.02} {'loss': 0.3231, 'learning_rate': 1.0148832605586002e-05, 'epoch': 1.02} {'loss': 0.296, 'learning_rate': 1.0148496665061348e-05, 'epoch': 1.02} {'loss': 0.3263, 'learning_rate': 1.0148160724369067e-05, 'epoch': 1.02} {'loss': 0.4172, 'learning_rate': 1.0147824783509546e-05, 'epoch': 1.02} {'loss': 0.3433, 'learning_rate': 1.0147488842483155e-05, 'epoch': 1.02} {'loss': 0.1895, 'learning_rate': 1.0147152901290278e-05, 'epoch': 1.02} {'loss': 0.3041, 'learning_rate': 1.0146816959931293e-05, 'epoch': 1.02} {'loss': 0.3147, 'learning_rate': 1.014648101840658e-05, 'epoch': 1.02} {'loss': 0.3524, 'learning_rate': 1.0146145076716518e-05, 'epoch': 1.02} {'loss': 0.3078, 'learning_rate': 1.0145809134861486e-05, 'epoch': 1.02} {'loss': 0.4285, 'learning_rate': 1.014547319284186e-05, 'epoch': 1.02} {'loss': 0.4575, 'learning_rate': 1.0145137250658028e-05, 'epoch': 1.02} {'loss': 0.3947, 'learning_rate': 1.0144801308310361e-05, 'epoch': 1.02} {'loss': 0.3937, 'learning_rate': 1.014446536579924e-05, 'epoch': 1.02} {'loss': 0.2309, 'learning_rate': 1.0144129423125047e-05, 'epoch': 1.02} {'loss': 0.2878, 'learning_rate': 1.0143793480288157e-05, 'epoch': 1.02} {'loss': 0.3479, 'learning_rate': 1.0143457537288954e-05, 'epoch': 1.02} {'loss': 0.2661, 'learning_rate': 1.0143121594127814e-05, 'epoch': 1.02} {'loss': 0.3648, 'learning_rate': 1.0142785650805118e-05, 'epoch': 1.02} {'loss': 0.4459, 'learning_rate': 1.0142449707321243e-05, 'epoch': 1.02} {'loss': 0.2924, 'learning_rate': 1.0142113763676567e-05, 'epoch': 1.02} {'loss': 0.4124, 'learning_rate': 1.0141777819871474e-05, 'epoch': 1.02} {'loss': 0.4146, 'learning_rate': 1.0141441875906337e-05, 'epoch': 1.02} {'loss': 0.2461, 'learning_rate': 1.0141105931781544e-05, 'epoch': 1.02} {'loss': 0.3789, 'learning_rate': 1.0140769987497468e-05, 'epoch': 1.02} {'loss': 0.4059, 'learning_rate': 1.0140434043054488e-05, 'epoch': 1.02} {'loss': 0.2731, 'learning_rate': 1.0140098098452987e-05, 'epoch': 1.02} {'loss': 0.2739, 'learning_rate': 1.013976215369334e-05, 'epoch': 1.02} {'loss': 0.3918, 'learning_rate': 1.0139426208775928e-05, 'epoch': 1.02} {'loss': 0.279, 'learning_rate': 1.0139090263701133e-05, 'epoch': 1.02} {'loss': 0.4589, 'learning_rate': 1.0138754318469329e-05, 'epoch': 1.02} {'loss': 0.2986, 'learning_rate': 1.0138418373080898e-05, 'epoch': 1.02} {'loss': 0.4861, 'learning_rate': 1.013808242753622e-05, 'epoch': 1.02} {'loss': 0.4191, 'learning_rate': 1.0137746481835672e-05, 'epoch': 1.02} {'loss': 0.3981, 'learning_rate': 1.0137410535979635e-05, 'epoch': 1.02} {'loss': 0.3193, 'learning_rate': 1.0137074589968487e-05, 'epoch': 1.02} {'loss': 0.3755, 'learning_rate': 1.0136738643802609e-05, 'epoch': 1.02} {'loss': 0.3188, 'learning_rate': 1.0136402697482378e-05, 'epoch': 1.02} {'loss': 0.3388, 'learning_rate': 1.0136066751008173e-05, 'epoch': 1.02} {'loss': 0.3623, 'learning_rate': 1.0135730804380379e-05, 'epoch': 1.02} {'loss': 0.4915, 'learning_rate': 1.0135394857599368e-05, 'epoch': 1.02} {'loss': 0.3506, 'learning_rate': 1.0135058910665522e-05, 'epoch': 1.02} {'loss': 0.3299, 'learning_rate': 1.013472296357922e-05, 'epoch': 1.02} {'loss': 0.4499, 'learning_rate': 1.0134387016340841e-05, 'epoch': 1.02} {'loss': 0.2631, 'learning_rate': 1.0134051068950765e-05, 'epoch': 1.02} {'loss': 0.2746, 'learning_rate': 1.0133715121409371e-05, 'epoch': 1.02} {'loss': 0.3929, 'learning_rate': 1.0133379173717038e-05, 'epoch': 1.02} {'loss': 0.2258, 'learning_rate': 1.0133043225874146e-05, 'epoch': 1.02} {'loss': 0.4232, 'learning_rate': 1.0132707277881074e-05, 'epoch': 1.02} {'loss': 0.2377, 'learning_rate': 1.0132371329738197e-05, 'epoch': 1.02} {'loss': 0.3519, 'learning_rate': 1.0132035381445902e-05, 'epoch': 1.02} {'loss': 0.2913, 'learning_rate': 1.0131699433004563e-05, 'epoch': 1.02} {'loss': 0.3001, 'learning_rate': 1.0131363484414561e-05, 'epoch': 1.02} {'loss': 0.3609, 'learning_rate': 1.0131027535676272e-05, 'epoch': 1.02} {'loss': 0.3271, 'learning_rate': 1.013069158679008e-05, 'epoch': 1.02} {'loss': 0.4655, 'learning_rate': 1.0130355637756362e-05, 'epoch': 1.02} {'loss': 0.357, 'learning_rate': 1.0130019688575497e-05, 'epoch': 1.02} {'loss': 0.3789, 'learning_rate': 1.0129683739247865e-05, 'epoch': 1.02} {'loss': 0.5202, 'learning_rate': 1.0129347789773842e-05, 'epoch': 1.02} {'loss': 0.201, 'learning_rate': 1.0129011840153812e-05, 'epoch': 1.02} {'loss': 0.5134, 'learning_rate': 1.0128675890388153e-05, 'epoch': 1.02} {'loss': 0.3392, 'learning_rate': 1.012833994047724e-05, 'epoch': 1.02} {'loss': 0.4416, 'learning_rate': 1.012800399042146e-05, 'epoch': 1.02} {'loss': 0.2668, 'learning_rate': 1.0127668040221185e-05, 'epoch': 1.02} {'loss': 0.3126, 'learning_rate': 1.0127332089876799e-05, 'epoch': 1.02} {'loss': 0.3288, 'learning_rate': 1.0126996139388679e-05, 'epoch': 1.02} {'loss': 0.3834, 'learning_rate': 1.0126660188757204e-05, 'epoch': 1.02} {'loss': 0.2983, 'learning_rate': 1.0126324237982754e-05, 'epoch': 1.02} {'loss': 0.3201, 'learning_rate': 1.0125988287065707e-05, 'epoch': 1.02} {'loss': 0.3094, 'learning_rate': 1.0125652336006444e-05, 'epoch': 1.02} {'loss': 0.4582, 'learning_rate': 1.0125316384805343e-05, 'epoch': 1.02} {'loss': 0.3433, 'learning_rate': 1.012498043346278e-05, 'epoch': 1.02} {'loss': 0.2871, 'learning_rate': 1.0124644481979142e-05, 'epoch': 1.02} {'loss': 0.1954, 'learning_rate': 1.0124308530354805e-05, 'epoch': 1.02} {'loss': 0.337, 'learning_rate': 1.0123972578590144e-05, 'epoch': 1.02} {'loss': 0.3989, 'learning_rate': 1.0123636626685545e-05, 'epoch': 1.02} {'loss': 0.3763, 'learning_rate': 1.0123300674641383e-05, 'epoch': 1.02} {'loss': 0.1837, 'learning_rate': 1.0122964722458037e-05, 'epoch': 1.02} {'loss': 0.3577, 'learning_rate': 1.0122628770135886e-05, 'epoch': 1.02} {'loss': 0.3748, 'learning_rate': 1.0122292817675315e-05, 'epoch': 1.02} {'loss': 0.4479, 'learning_rate': 1.0121956865076694e-05, 'epoch': 1.02} {'loss': 0.3412, 'learning_rate': 1.0121620912340408e-05, 'epoch': 1.02} {'loss': 0.5378, 'learning_rate': 1.0121284959466836e-05, 'epoch': 1.02} {'loss': 0.3406, 'learning_rate': 1.0120949006456355e-05, 'epoch': 1.02} {'loss': 0.4039, 'learning_rate': 1.0120613053309347e-05, 'epoch': 1.02} {'loss': 0.3303, 'learning_rate': 1.0120277100026191e-05, 'epoch': 1.02} {'loss': 0.3138, 'learning_rate': 1.0119941146607261e-05, 'epoch': 1.02} {'loss': 0.3501, 'learning_rate': 1.0119605193052941e-05, 'epoch': 1.02} {'loss': 0.3487, 'learning_rate': 1.0119269239363611e-05, 'epoch': 1.02} {'loss': 0.2552, 'learning_rate': 1.011893328553965e-05, 'epoch': 1.02} {'loss': 0.3376, 'learning_rate': 1.0118597331581437e-05, 'epoch': 1.02} {'loss': 0.4755, 'learning_rate': 1.0118261377489346e-05, 'epoch': 1.02} {'loss': 0.4097, 'learning_rate': 1.0117925423263763e-05, 'epoch': 1.02} {'loss': 0.4277, 'learning_rate': 1.0117589468905064e-05, 'epoch': 1.02} {'loss': 0.4579, 'learning_rate': 1.011725351441363e-05, 'epoch': 1.02} {'loss': 0.3912, 'learning_rate': 1.0116917559789836e-05, 'epoch': 1.02} {'loss': 0.2948, 'learning_rate': 1.0116581605034066e-05, 'epoch': 1.02} {'loss': 0.3099, 'learning_rate': 1.01162456501467e-05, 'epoch': 1.02} {'loss': 0.3284, 'learning_rate': 1.011590969512811e-05, 'epoch': 1.02} {'loss': 0.3187, 'learning_rate': 1.0115573739978684e-05, 'epoch': 1.02} {'loss': 0.3865, 'learning_rate': 1.0115237784698795e-05, 'epoch': 1.02} {'loss': 0.3209, 'learning_rate': 1.0114901829288823e-05, 'epoch': 1.02} {'loss': 0.3038, 'learning_rate': 1.0114565873749153e-05, 'epoch': 1.02} {'loss': 0.4601, 'learning_rate': 1.0114229918080158e-05, 'epoch': 1.02} {'loss': 0.2948, 'learning_rate': 1.011389396228222e-05, 'epoch': 1.02} {'loss': 0.3609, 'learning_rate': 1.0113558006355714e-05, 'epoch': 1.02} {'loss': 0.298, 'learning_rate': 1.0113222050301026e-05, 'epoch': 1.02} {'loss': 0.2327, 'learning_rate': 1.011288609411853e-05, 'epoch': 1.02} {'loss': 0.3491, 'learning_rate': 1.0112550137808608e-05, 'epoch': 1.02} {'loss': 0.3227, 'learning_rate': 1.0112214181371637e-05, 'epoch': 1.02} {'loss': 0.3356, 'learning_rate': 1.0111878224807998e-05, 'epoch': 1.02} {'loss': 0.3876, 'learning_rate': 1.011154226811807e-05, 'epoch': 1.02} {'loss': 0.408, 'learning_rate': 1.0111206311302234e-05, 'epoch': 1.02} {'loss': 0.3666, 'learning_rate': 1.0110870354360865e-05, 'epoch': 1.02} {'loss': 0.3708, 'learning_rate': 1.0110534397294345e-05, 'epoch': 1.02} {'loss': 0.239, 'learning_rate': 1.0110198440103054e-05, 'epoch': 1.02} {'loss': 0.3129, 'learning_rate': 1.010986248278737e-05, 'epoch': 1.02} {'loss': 0.23, 'learning_rate': 1.0109526525347669e-05, 'epoch': 1.02} {'loss': 0.4784, 'learning_rate': 1.0109190567784335e-05, 'epoch': 1.02} {'loss': 0.3485, 'learning_rate': 1.0108854610097745e-05, 'epoch': 1.02} {'loss': 0.4175, 'learning_rate': 1.010851865228828e-05, 'epoch': 1.02} {'loss': 0.3272, 'learning_rate': 1.0108182694356314e-05, 'epoch': 1.02} {'loss': 0.4178, 'learning_rate': 1.0107846736302235e-05, 'epoch': 1.02} {'loss': 0.5022, 'learning_rate': 1.0107510778126417e-05, 'epoch': 1.02} {'loss': 0.2236, 'learning_rate': 1.0107174819829237e-05, 'epoch': 1.02} {'loss': 0.4028, 'learning_rate': 1.0106838861411081e-05, 'epoch': 1.02} {'loss': 0.4233, 'learning_rate': 1.0106502902872323e-05, 'epoch': 1.02} {'loss': 0.2843, 'learning_rate': 1.0106166944213344e-05, 'epoch': 1.02} {'loss': 0.438, 'learning_rate': 1.0105830985434522e-05, 'epoch': 1.02} {'loss': 0.2923, 'learning_rate': 1.0105495026536236e-05, 'epoch': 1.02} {'loss': 0.4817, 'learning_rate': 1.0105159067518865e-05, 'epoch': 1.02} {'loss': 0.4541, 'learning_rate': 1.0104823108382793e-05, 'epoch': 1.02} {'loss': 0.4675, 'learning_rate': 1.0104487149128393e-05, 'epoch': 1.02} {'loss': 0.1364, 'learning_rate': 1.0104151189756048e-05, 'epoch': 1.02} {'loss': 0.2717, 'learning_rate': 1.0103815230266136e-05, 'epoch': 1.02} {'loss': 0.3785, 'learning_rate': 1.0103479270659036e-05, 'epoch': 1.02} {'loss': 0.5941, 'learning_rate': 1.0103143310935128e-05, 'epoch': 1.02} {'loss': 0.3545, 'learning_rate': 1.010280735109479e-05, 'epoch': 1.02} {'loss': 0.4571, 'learning_rate': 1.0102471391138401e-05, 'epoch': 1.02} {'loss': 0.3447, 'learning_rate': 1.0102135431066346e-05, 'epoch': 1.02} {'loss': 0.3239, 'learning_rate': 1.0101799470878996e-05, 'epoch': 1.02} {'loss': 0.2878, 'learning_rate': 1.0101463510576734e-05, 'epoch': 1.02} {'loss': 0.2073, 'learning_rate': 1.010112755015994e-05, 'epoch': 1.02} {'loss': 0.3722, 'learning_rate': 1.0100791589628991e-05, 'epoch': 1.02} {'loss': 0.2789, 'learning_rate': 1.0100455628984267e-05, 'epoch': 1.02} {'loss': 0.2458, 'learning_rate': 1.010011966822615e-05, 'epoch': 1.02} {'loss': 0.2749, 'learning_rate': 1.0099783707355015e-05, 'epoch': 1.02} {'loss': 0.2824, 'learning_rate': 1.0099447746371242e-05, 'epoch': 1.02} {'loss': 0.2782, 'learning_rate': 1.0099111785275212e-05, 'epoch': 1.02} {'loss': 0.1865, 'learning_rate': 1.0098775824067306e-05, 'epoch': 1.02} {'loss': 0.4119, 'learning_rate': 1.00984398627479e-05, 'epoch': 1.03} {'loss': 0.4103, 'learning_rate': 1.0098103901317374e-05, 'epoch': 1.03} {'loss': 0.446, 'learning_rate': 1.0097767939776109e-05, 'epoch': 1.03} {'loss': 0.2742, 'learning_rate': 1.0097431978124481e-05, 'epoch': 1.03} {'loss': 0.3044, 'learning_rate': 1.0097096016362868e-05, 'epoch': 1.03} {'loss': 0.4646, 'learning_rate': 1.0096760054491656e-05, 'epoch': 1.03} {'loss': 0.3657, 'learning_rate': 1.0096424092511218e-05, 'epoch': 1.03} {'loss': 0.2062, 'learning_rate': 1.0096088130421937e-05, 'epoch': 1.03} {'loss': 0.3019, 'learning_rate': 1.0095752168224189e-05, 'epoch': 1.03} {'loss': 0.4972, 'learning_rate': 1.0095416205918355e-05, 'epoch': 1.03} {'loss': 0.3787, 'learning_rate': 1.0095080243504818e-05, 'epoch': 1.03} {'loss': 0.2728, 'learning_rate': 1.009474428098395e-05, 'epoch': 1.03} {'loss': 0.2699, 'learning_rate': 1.0094408318356135e-05, 'epoch': 1.03} {'loss': 0.352, 'learning_rate': 1.0094072355621749e-05, 'epoch': 1.03} {'loss': 0.5096, 'learning_rate': 1.0093736392781175e-05, 'epoch': 1.03} {'loss': 0.2656, 'learning_rate': 1.0093400429834793e-05, 'epoch': 1.03} {'loss': 0.415, 'learning_rate': 1.0093064466782976e-05, 'epoch': 1.03} {'loss': 0.2378, 'learning_rate': 1.0092728503626108e-05, 'epoch': 1.03} {'loss': 0.3138, 'learning_rate': 1.0092392540364567e-05, 'epoch': 1.03} {'loss': 0.2409, 'learning_rate': 1.0092056576998733e-05, 'epoch': 1.03} {'loss': 0.4311, 'learning_rate': 1.0091720613528984e-05, 'epoch': 1.03} {'loss': 0.3063, 'learning_rate': 1.0091384649955695e-05, 'epoch': 1.03} {'loss': 0.2622, 'learning_rate': 1.0091048686279257e-05, 'epoch': 1.03} {'loss': 0.3036, 'learning_rate': 1.009071272250004e-05, 'epoch': 1.03} {'loss': 0.3154, 'learning_rate': 1.0090376758618425e-05, 'epoch': 1.03} {'loss': 0.2715, 'learning_rate': 1.0090040794634794e-05, 'epoch': 1.03} {'loss': 0.3373, 'learning_rate': 1.0089704830549522e-05, 'epoch': 1.03} {'loss': 0.4066, 'learning_rate': 1.0089368866362992e-05, 'epoch': 1.03} {'loss': 0.174, 'learning_rate': 1.0089032902075581e-05, 'epoch': 1.03} {'loss': 0.3945, 'learning_rate': 1.0088696937687668e-05, 'epoch': 1.03} {'loss': 0.3098, 'learning_rate': 1.0088360973199633e-05, 'epoch': 1.03} {'loss': 0.33, 'learning_rate': 1.0088025008611854e-05, 'epoch': 1.03} {'loss': 0.4291, 'learning_rate': 1.0087689043924716e-05, 'epoch': 1.03} {'loss': 0.4413, 'learning_rate': 1.0087353079138589e-05, 'epoch': 1.03} {'loss': 0.3754, 'learning_rate': 1.0087017114253859e-05, 'epoch': 1.03} {'loss': 0.2957, 'learning_rate': 1.0086681149270903e-05, 'epoch': 1.03} {'loss': 0.2585, 'learning_rate': 1.0086345184190101e-05, 'epoch': 1.03} {'loss': 0.2, 'learning_rate': 1.0086009219011832e-05, 'epoch': 1.03} {'loss': 0.2742, 'learning_rate': 1.0085673253736475e-05, 'epoch': 1.03} {'loss': 0.3116, 'learning_rate': 1.008533728836441e-05, 'epoch': 1.03} {'loss': 0.2836, 'learning_rate': 1.0085001322896014e-05, 'epoch': 1.03} {'loss': 0.3122, 'learning_rate': 1.0084665357331667e-05, 'epoch': 1.03} {'loss': 0.331, 'learning_rate': 1.0084329391671749e-05, 'epoch': 1.03} {'loss': 0.3245, 'learning_rate': 1.0083993425916638e-05, 'epoch': 1.03} {'loss': 0.246, 'learning_rate': 1.0083657460066717e-05, 'epoch': 1.03} {'loss': 0.2289, 'learning_rate': 1.008332149412236e-05, 'epoch': 1.03} {'loss': 0.2875, 'learning_rate': 1.008298552808395e-05, 'epoch': 1.03} {'loss': 0.2031, 'learning_rate': 1.0082649561951867e-05, 'epoch': 1.03} {'loss': 0.3402, 'learning_rate': 1.0082313595726487e-05, 'epoch': 1.03} {'loss': 0.3176, 'learning_rate': 1.008197762940819e-05, 'epoch': 1.03} {'loss': 0.3686, 'learning_rate': 1.0081641662997357e-05, 'epoch': 1.03} {'loss': 0.2975, 'learning_rate': 1.0081305696494366e-05, 'epoch': 1.03} {'loss': 0.3493, 'learning_rate': 1.0080969729899598e-05, 'epoch': 1.03} {'loss': 0.4584, 'learning_rate': 1.0080633763213428e-05, 'epoch': 1.03} {'loss': 0.3189, 'learning_rate': 1.0080297796436238e-05, 'epoch': 1.03} {'loss': 0.2591, 'learning_rate': 1.0079961829568405e-05, 'epoch': 1.03} {'loss': 0.4172, 'learning_rate': 1.0079625862610314e-05, 'epoch': 1.03} {'loss': 0.3605, 'learning_rate': 1.0079289895562338e-05, 'epoch': 1.03} {'loss': 0.4701, 'learning_rate': 1.0078953928424861e-05, 'epoch': 1.03} {'loss': 0.4889, 'learning_rate': 1.0078617961198259e-05, 'epoch': 1.03} {'loss': 0.3447, 'learning_rate': 1.0078281993882913e-05, 'epoch': 1.03} {'loss': 0.34, 'learning_rate': 1.00779460264792e-05, 'epoch': 1.03} {'loss': 0.2797, 'learning_rate': 1.0077610058987502e-05, 'epoch': 1.03} {'loss': 0.3028, 'learning_rate': 1.0077274091408196e-05, 'epoch': 1.03} {'loss': 0.3687, 'learning_rate': 1.0076938123741662e-05, 'epoch': 1.03} {'loss': 0.4413, 'learning_rate': 1.0076602155988281e-05, 'epoch': 1.03} {'loss': 0.3108, 'learning_rate': 1.007626618814843e-05, 'epoch': 1.03} {'loss': 0.3767, 'learning_rate': 1.007593022022249e-05, 'epoch': 1.03} {'loss': 0.3263, 'learning_rate': 1.0075594252210839e-05, 'epoch': 1.03} {'loss': 0.2593, 'learning_rate': 1.0075258284113853e-05, 'epoch': 1.03} {'loss': 0.3294, 'learning_rate': 1.0074922315931916e-05, 'epoch': 1.03} {'loss': 0.2549, 'learning_rate': 1.0074586347665407e-05, 'epoch': 1.03} {'loss': 0.413, 'learning_rate': 1.0074250379314706e-05, 'epoch': 1.03} {'loss': 0.3322, 'learning_rate': 1.0073914410880187e-05, 'epoch': 1.03} {'loss': 0.3019, 'learning_rate': 1.0073578442362234e-05, 'epoch': 1.03} {'loss': 0.1903, 'learning_rate': 1.0073242473761228e-05, 'epoch': 1.03} {'loss': 0.3869, 'learning_rate': 1.0072906505077542e-05, 'epoch': 1.03} {'loss': 0.3906, 'learning_rate': 1.007257053631156e-05, 'epoch': 1.03} {'loss': 0.3303, 'learning_rate': 1.007223456746366e-05, 'epoch': 1.03} {'loss': 0.3138, 'learning_rate': 1.0071898598534218e-05, 'epoch': 1.03} {'loss': 0.3109, 'learning_rate': 1.0071562629523619e-05, 'epoch': 1.03} {'loss': 0.2764, 'learning_rate': 1.0071226660432237e-05, 'epoch': 1.03} {'loss': 0.4535, 'learning_rate': 1.0070890691260456e-05, 'epoch': 1.03} {'loss': 0.2289, 'learning_rate': 1.007055472200865e-05, 'epoch': 1.03} {'loss': 0.3992, 'learning_rate': 1.0070218752677204e-05, 'epoch': 1.03} {'loss': 0.4248, 'learning_rate': 1.0069882783266493e-05, 'epoch': 1.03} {'loss': 0.3326, 'learning_rate': 1.0069546813776899e-05, 'epoch': 1.03} {'loss': 0.4134, 'learning_rate': 1.0069210844208796e-05, 'epoch': 1.03} {'loss': 0.4156, 'learning_rate': 1.0068874874562573e-05, 'epoch': 1.03} {'loss': 0.4211, 'learning_rate': 1.00685389048386e-05, 'epoch': 1.03} {'loss': 0.5357, 'learning_rate': 1.0068202935037262e-05, 'epoch': 1.03} {'loss': 0.4281, 'learning_rate': 1.0067866965158931e-05, 'epoch': 1.03} {'loss': 0.3184, 'learning_rate': 1.0067530995203994e-05, 'epoch': 1.03} {'loss': 0.2714, 'learning_rate': 1.0067195025172827e-05, 'epoch': 1.03} {'loss': 0.3918, 'learning_rate': 1.006685905506581e-05, 'epoch': 1.03} {'loss': 0.2702, 'learning_rate': 1.0066523084883322e-05, 'epoch': 1.03} {'loss': 0.3037, 'learning_rate': 1.0066187114625741e-05, 'epoch': 1.03} {'loss': 0.5007, 'learning_rate': 1.0065851144293449e-05, 'epoch': 1.03} {'loss': 0.3153, 'learning_rate': 1.0065515173886821e-05, 'epoch': 1.03} {'loss': 0.3007, 'learning_rate': 1.0065179203406242e-05, 'epoch': 1.03} {'loss': 0.3125, 'learning_rate': 1.0064843232852086e-05, 'epoch': 1.03} {'loss': 0.2983, 'learning_rate': 1.0064507262224737e-05, 'epoch': 1.03} {'loss': 0.2623, 'learning_rate': 1.006417129152457e-05, 'epoch': 1.03} {'loss': 0.315, 'learning_rate': 1.0063835320751964e-05, 'epoch': 1.03} {'loss': 0.2916, 'learning_rate': 1.0063499349907301e-05, 'epoch': 1.03} {'loss': 0.411, 'learning_rate': 1.006316337899096e-05, 'epoch': 1.03} {'loss': 0.3857, 'learning_rate': 1.006282740800332e-05, 'epoch': 1.03} {'loss': 0.3946, 'learning_rate': 1.0062491436944757e-05, 'epoch': 1.03} {'loss': 0.2436, 'learning_rate': 1.0062155465815654e-05, 'epoch': 1.03} {'loss': 0.2808, 'learning_rate': 1.0061819494616392e-05, 'epoch': 1.03} {'loss': 0.2825, 'learning_rate': 1.0061483523347347e-05, 'epoch': 1.03} {'loss': 0.3523, 'learning_rate': 1.0061147552008896e-05, 'epoch': 1.03} {'loss': 0.3331, 'learning_rate': 1.0060811580601421e-05, 'epoch': 1.03} {'loss': 0.5017, 'learning_rate': 1.0060475609125304e-05, 'epoch': 1.03} {'loss': 0.3417, 'learning_rate': 1.0060139637580924e-05, 'epoch': 1.03} {'loss': 0.2308, 'learning_rate': 1.0059803665968653e-05, 'epoch': 1.03} {'loss': 0.2611, 'learning_rate': 1.0059467694288875e-05, 'epoch': 1.03} {'loss': 0.4255, 'learning_rate': 1.0059131722541972e-05, 'epoch': 1.03} {'loss': 0.3555, 'learning_rate': 1.0058795750728319e-05, 'epoch': 1.03} {'loss': 0.3494, 'learning_rate': 1.0058459778848297e-05, 'epoch': 1.03} {'loss': 0.4977, 'learning_rate': 1.0058123806902282e-05, 'epoch': 1.03} {'loss': 0.3387, 'learning_rate': 1.005778783489066e-05, 'epoch': 1.03} {'loss': 0.4026, 'learning_rate': 1.0057451862813805e-05, 'epoch': 1.03} {'loss': 0.2138, 'learning_rate': 1.0057115890672098e-05, 'epoch': 1.03} {'loss': 0.4035, 'learning_rate': 1.005677991846592e-05, 'epoch': 1.03} {'loss': 0.4054, 'learning_rate': 1.0056443946195648e-05, 'epoch': 1.03} {'loss': 0.3879, 'learning_rate': 1.005610797386166e-05, 'epoch': 1.03} {'loss': 0.2822, 'learning_rate': 1.0055772001464337e-05, 'epoch': 1.03} {'loss': 0.4379, 'learning_rate': 1.0055436029004057e-05, 'epoch': 1.03} {'loss': 0.4564, 'learning_rate': 1.0055100056481202e-05, 'epoch': 1.03} {'loss': 0.3284, 'learning_rate': 1.0054764083896149e-05, 'epoch': 1.03} {'loss': 0.3939, 'learning_rate': 1.0054428111249277e-05, 'epoch': 1.03} {'loss': 0.3898, 'learning_rate': 1.0054092138540967e-05, 'epoch': 1.03} {'loss': 0.2132, 'learning_rate': 1.0053756165771598e-05, 'epoch': 1.03} {'loss': 0.2737, 'learning_rate': 1.0053420192941548e-05, 'epoch': 1.03} {'loss': 0.3027, 'learning_rate': 1.0053084220051194e-05, 'epoch': 1.03} {'loss': 0.4317, 'learning_rate': 1.0052748247100921e-05, 'epoch': 1.03} {'loss': 0.2318, 'learning_rate': 1.0052412274091103e-05, 'epoch': 1.03} {'loss': 0.4744, 'learning_rate': 1.0052076301022127e-05, 'epoch': 1.03} {'loss': 0.3416, 'learning_rate': 1.0051740327894362e-05, 'epoch': 1.03} {'loss': 0.3021, 'learning_rate': 1.0051404354708192e-05, 'epoch': 1.03} {'loss': 0.4492, 'learning_rate': 1.0051068381463997e-05, 'epoch': 1.03} {'loss': 0.3948, 'learning_rate': 1.0050732408162156e-05, 'epoch': 1.03} {'loss': 0.2645, 'learning_rate': 1.0050396434803047e-05, 'epoch': 1.03} {'loss': 0.4355, 'learning_rate': 1.005006046138705e-05, 'epoch': 1.03} {'loss': 0.3192, 'learning_rate': 1.0049724487914546e-05, 'epoch': 1.03} {'loss': 0.1814, 'learning_rate': 1.0049388514385909e-05, 'epoch': 1.03} {'loss': 0.3401, 'learning_rate': 1.0049052540801525e-05, 'epoch': 1.03} {'loss': 0.3257, 'learning_rate': 1.0048716567161767e-05, 'epoch': 1.03} {'loss': 0.3116, 'learning_rate': 1.004838059346702e-05, 'epoch': 1.03} {'loss': 0.3765, 'learning_rate': 1.004804461971766e-05, 'epoch': 1.03} {'loss': 0.4172, 'learning_rate': 1.0047708645914067e-05, 'epoch': 1.03} {'loss': 0.2786, 'learning_rate': 1.004737267205662e-05, 'epoch': 1.03} {'loss': 0.3624, 'learning_rate': 1.0047036698145698e-05, 'epoch': 1.03} {'loss': 0.3283, 'learning_rate': 1.0046700724181679e-05, 'epoch': 1.03} {'loss': 0.372, 'learning_rate': 1.0046364750164946e-05, 'epoch': 1.03} {'loss': 0.2665, 'learning_rate': 1.0046028776095873e-05, 'epoch': 1.03} {'loss': 0.403, 'learning_rate': 1.0045692801974844e-05, 'epoch': 1.03} {'loss': 0.4872, 'learning_rate': 1.0045356827802237e-05, 'epoch': 1.03} {'loss': 0.257, 'learning_rate': 1.0045020853578431e-05, 'epoch': 1.03} {'loss': 0.2961, 'learning_rate': 1.0044684879303805e-05, 'epoch': 1.03} {'loss': 0.3042, 'learning_rate': 1.0044348904978738e-05, 'epoch': 1.03} {'loss': 0.3552, 'learning_rate': 1.0044012930603608e-05, 'epoch': 1.03} {'loss': 0.5135, 'learning_rate': 1.0043676956178797e-05, 'epoch': 1.03} {'loss': 0.3365, 'learning_rate': 1.0043340981704686e-05, 'epoch': 1.03} {'loss': 0.3297, 'learning_rate': 1.0043005007181647e-05, 'epoch': 1.03} {'loss': 0.3879, 'learning_rate': 1.0042669032610067e-05, 'epoch': 1.03} {'loss': 0.3659, 'learning_rate': 1.0042333057990317e-05, 'epoch': 1.03} {'loss': 0.2414, 'learning_rate': 1.0041997083322785e-05, 'epoch': 1.03} {'loss': 0.1968, 'learning_rate': 1.0041661108607841e-05, 'epoch': 1.03} {'loss': 0.396, 'learning_rate': 1.0041325133845875e-05, 'epoch': 1.03} {'loss': 0.2498, 'learning_rate': 1.0040989159037257e-05, 'epoch': 1.03} {'loss': 0.5072, 'learning_rate': 1.0040653184182375e-05, 'epoch': 1.03} {'loss': 0.3215, 'learning_rate': 1.0040317209281598e-05, 'epoch': 1.03} {'loss': 0.3769, 'learning_rate': 1.0039981234335316e-05, 'epoch': 1.03} {'loss': 0.3134, 'learning_rate': 1.00396452593439e-05, 'epoch': 1.03} {'loss': 0.3486, 'learning_rate': 1.0039309284307732e-05, 'epoch': 1.03} {'loss': 0.3195, 'learning_rate': 1.0038973309227192e-05, 'epoch': 1.03} {'loss': 0.3966, 'learning_rate': 1.0038637334102656e-05, 'epoch': 1.03} {'loss': 0.205, 'learning_rate': 1.0038301358934509e-05, 'epoch': 1.03} {'loss': 0.3877, 'learning_rate': 1.0037965383723125e-05, 'epoch': 1.03} {'loss': 0.2993, 'learning_rate': 1.0037629408468885e-05, 'epoch': 1.03} {'loss': 0.4576, 'learning_rate': 1.003729343317217e-05, 'epoch': 1.03} {'loss': 0.3813, 'learning_rate': 1.0036957457833356e-05, 'epoch': 1.03} {'loss': 0.1911, 'learning_rate': 1.0036621482452827e-05, 'epoch': 1.03} {'loss': 0.3361, 'learning_rate': 1.0036285507030956e-05, 'epoch': 1.03} {'loss': 0.234, 'learning_rate': 1.0035949531568127e-05, 'epoch': 1.03} {'loss': 0.2689, 'learning_rate': 1.0035613556064719e-05, 'epoch': 1.03} {'loss': 0.3807, 'learning_rate': 1.003527758052111e-05, 'epoch': 1.03} {'loss': 0.4924, 'learning_rate': 1.003494160493768e-05, 'epoch': 1.03} {'loss': 0.3495, 'learning_rate': 1.0034605629314804e-05, 'epoch': 1.03} {'loss': 0.2863, 'learning_rate': 1.0034269653652869e-05, 'epoch': 1.03} {'loss': 0.4411, 'learning_rate': 1.0033933677952246e-05, 'epoch': 1.03} {'loss': 0.4197, 'learning_rate': 1.003359770221332e-05, 'epoch': 1.03} {'loss': 0.4091, 'learning_rate': 1.003326172643647e-05, 'epoch': 1.03} {'loss': 0.4355, 'learning_rate': 1.0032925750622072e-05, 'epoch': 1.03} {'loss': 0.3771, 'learning_rate': 1.0032589774770508e-05, 'epoch': 1.03} {'loss': 0.2967, 'learning_rate': 1.0032253798882155e-05, 'epoch': 1.03} {'loss': 0.4221, 'learning_rate': 1.0031917822957396e-05, 'epoch': 1.03} {'loss': 0.3045, 'learning_rate': 1.0031581846996605e-05, 'epoch': 1.03} {'loss': 0.5482, 'learning_rate': 1.0031245871000166e-05, 'epoch': 1.03} {'loss': 0.3923, 'learning_rate': 1.0030909894968456e-05, 'epoch': 1.03} {'loss': 0.4311, 'learning_rate': 1.0030573918901856e-05, 'epoch': 1.03} {'loss': 0.2898, 'learning_rate': 1.0030237942800742e-05, 'epoch': 1.03} {'loss': 0.3242, 'learning_rate': 1.0029901966665497e-05, 'epoch': 1.03} {'loss': 0.4656, 'learning_rate': 1.0029565990496497e-05, 'epoch': 1.03} {'loss': 0.2785, 'learning_rate': 1.0029230014294122e-05, 'epoch': 1.03} {'loss': 0.4171, 'learning_rate': 1.0028894038058752e-05, 'epoch': 1.03} {'loss': 0.2482, 'learning_rate': 1.0028558061790765e-05, 'epoch': 1.03} {'loss': 0.4041, 'learning_rate': 1.0028222085490544e-05, 'epoch': 1.03} {'loss': 0.3474, 'learning_rate': 1.0027886109158465e-05, 'epoch': 1.03} {'loss': 0.3481, 'learning_rate': 1.0027550132794907e-05, 'epoch': 1.03} {'loss': 0.3258, 'learning_rate': 1.0027214156400249e-05, 'epoch': 1.03} {'loss': 0.3767, 'learning_rate': 1.0026878179974874e-05, 'epoch': 1.03} {'loss': 0.3628, 'learning_rate': 1.002654220351916e-05, 'epoch': 1.03} {'loss': 0.1546, 'learning_rate': 1.0026206227033482e-05, 'epoch': 1.03} {'loss': 0.3718, 'learning_rate': 1.0025870250518222e-05, 'epoch': 1.03} {'loss': 0.3683, 'learning_rate': 1.0025534273973761e-05, 'epoch': 1.03} {'loss': 0.3302, 'learning_rate': 1.0025198297400476e-05, 'epoch': 1.03} {'loss': 0.2563, 'learning_rate': 1.0024862320798742e-05, 'epoch': 1.03} {'loss': 0.4464, 'learning_rate': 1.002452634416895e-05, 'epoch': 1.03} {'loss': 0.354, 'learning_rate': 1.0024190367511469e-05, 'epoch': 1.03} {'loss': 0.2343, 'learning_rate': 1.0023854390826684e-05, 'epoch': 1.03} {'loss': 0.4549, 'learning_rate': 1.002351841411497e-05, 'epoch': 1.03} {'loss': 0.4502, 'learning_rate': 1.0023182437376711e-05, 'epoch': 1.03} {'loss': 0.2713, 'learning_rate': 1.002284646061228e-05, 'epoch': 1.03} {'loss': 0.3811, 'learning_rate': 1.0022510483822062e-05, 'epoch': 1.03} {'loss': 0.2851, 'learning_rate': 1.0022174507006432e-05, 'epoch': 1.03} {'loss': 0.2619, 'learning_rate': 1.0021838530165772e-05, 'epoch': 1.03} {'loss': 0.3571, 'learning_rate': 1.0021502553300462e-05, 'epoch': 1.03} {'loss': 0.5091, 'learning_rate': 1.002116657641088e-05, 'epoch': 1.03} {'loss': 0.3312, 'learning_rate': 1.0020830599497402e-05, 'epoch': 1.03} {'loss': 0.36, 'learning_rate': 1.002049462256041e-05, 'epoch': 1.03} {'loss': 0.392, 'learning_rate': 1.0020158645600287e-05, 'epoch': 1.03} {'loss': 0.3297, 'learning_rate': 1.0019822668617406e-05, 'epoch': 1.03} {'loss': 0.4558, 'learning_rate': 1.001948669161215e-05, 'epoch': 1.03} {'loss': 0.3219, 'learning_rate': 1.0019150714584896e-05, 'epoch': 1.03} {'loss': 0.3701, 'learning_rate': 1.0018814737536027e-05, 'epoch': 1.03} {'loss': 0.2816, 'learning_rate': 1.001847876046592e-05, 'epoch': 1.03} {'loss': 0.2311, 'learning_rate': 1.0018142783374952e-05, 'epoch': 1.03} {'loss': 0.2155, 'learning_rate': 1.0017806806263504e-05, 'epoch': 1.03} {'loss': 0.3166, 'learning_rate': 1.0017470829131954e-05, 'epoch': 1.03} {'loss': 0.2916, 'learning_rate': 1.0017134851980686e-05, 'epoch': 1.03} {'loss': 0.4239, 'learning_rate': 1.0016798874810075e-05, 'epoch': 1.03} {'loss': 0.2278, 'learning_rate': 1.00164628976205e-05, 'epoch': 1.03} {'loss': 0.3419, 'learning_rate': 1.0016126920412343e-05, 'epoch': 1.03} {'loss': 0.3745, 'learning_rate': 1.0015790943185982e-05, 'epoch': 1.03} {'loss': 0.2479, 'learning_rate': 1.0015454965941794e-05, 'epoch': 1.03} {'loss': 0.2178, 'learning_rate': 1.001511898868016e-05, 'epoch': 1.03} {'loss': 0.4346, 'learning_rate': 1.0014783011401463e-05, 'epoch': 1.03} {'loss': 0.2664, 'learning_rate': 1.0014447034106079e-05, 'epoch': 1.03} {'loss': 0.2777, 'learning_rate': 1.0014111056794384e-05, 'epoch': 1.03} {'loss': 0.2327, 'learning_rate': 1.0013775079466761e-05, 'epoch': 1.03} {'loss': 0.4715, 'learning_rate': 1.001343910212359e-05, 'epoch': 1.03} {'loss': 0.3024, 'learning_rate': 1.0013103124765247e-05, 'epoch': 1.03} {'loss': 0.4125, 'learning_rate': 1.0012767147392113e-05, 'epoch': 1.03} {'loss': 0.3283, 'learning_rate': 1.0012431170004568e-05, 'epoch': 1.03} {'loss': 0.3248, 'learning_rate': 1.0012095192602991e-05, 'epoch': 1.03} {'loss': 0.283, 'learning_rate': 1.0011759215187759e-05, 'epoch': 1.03} {'loss': 0.4116, 'learning_rate': 1.0011423237759257e-05, 'epoch': 1.03} {'loss': 0.4802, 'learning_rate': 1.0011087260317856e-05, 'epoch': 1.03} {'loss': 0.3534, 'learning_rate': 1.0010751282863942e-05, 'epoch': 1.03} {'loss': 0.2319, 'learning_rate': 1.0010415305397891e-05, 'epoch': 1.03} {'loss': 0.4064, 'learning_rate': 1.0010079327920086e-05, 'epoch': 1.03} {'loss': 0.2937, 'learning_rate': 1.0009743350430901e-05, 'epoch': 1.03} {'loss': 0.315, 'learning_rate': 1.0009407372930718e-05, 'epoch': 1.03} {'loss': 0.3322, 'learning_rate': 1.0009071395419914e-05, 'epoch': 1.03} {'loss': 0.3371, 'learning_rate': 1.0008735417898872e-05, 'epoch': 1.03} {'loss': 0.2987, 'learning_rate': 1.0008399440367967e-05, 'epoch': 1.03} {'loss': 0.3314, 'learning_rate': 1.000806346282758e-05, 'epoch': 1.03} {'loss': 0.4046, 'learning_rate': 1.0007727485278094e-05, 'epoch': 1.03} {'loss': 0.3623, 'learning_rate': 1.0007391507719884e-05, 'epoch': 1.03} {'loss': 0.3432, 'learning_rate': 1.000705553015333e-05, 'epoch': 1.03} {'loss': 0.3252, 'learning_rate': 1.0006719552578812e-05, 'epoch': 1.03} {'loss': 0.3389, 'learning_rate': 1.0006383574996712e-05, 'epoch': 1.03} {'loss': 0.3418, 'learning_rate': 1.0006047597407402e-05, 'epoch': 1.03} {'loss': 0.3157, 'learning_rate': 1.0005711619811268e-05, 'epoch': 1.03} {'loss': 0.3167, 'learning_rate': 1.0005375642208686e-05, 'epoch': 1.03} {'loss': 0.4163, 'learning_rate': 1.0005039664600036e-05, 'epoch': 1.03} {'loss': 0.3312, 'learning_rate': 1.0004703686985695e-05, 'epoch': 1.03} {'loss': 0.2537, 'learning_rate': 1.0004367709366048e-05, 'epoch': 1.03} {'loss': 0.359, 'learning_rate': 1.0004031731741468e-05, 'epoch': 1.03} {'loss': 0.2097, 'learning_rate': 1.0003695754112337e-05, 'epoch': 1.03} {'loss': 0.2574, 'learning_rate': 1.0003359776479034e-05, 'epoch': 1.03} {'loss': 0.4493, 'learning_rate': 1.000302379884194e-05, 'epoch': 1.03} {'loss': 0.3181, 'learning_rate': 1.0002687821201432e-05, 'epoch': 1.03} {'loss': 0.3281, 'learning_rate': 1.000235184355789e-05, 'epoch': 1.03} {'loss': 0.3229, 'learning_rate': 1.0002015865911693e-05, 'epoch': 1.03} {'loss': 0.442, 'learning_rate': 1.0001679888263223e-05, 'epoch': 1.03} {'loss': 0.3291, 'learning_rate': 1.0001343910612853e-05, 'epoch': 1.03} {'loss': 0.3323, 'learning_rate': 1.0001007932960969e-05, 'epoch': 1.03} {'loss': 0.4535, 'learning_rate': 1.0000671955307945e-05, 'epoch': 1.03} {'loss': 0.2637, 'learning_rate': 1.0000335977654163e-05, 'epoch': 1.03} {'loss': 0.2203, 'learning_rate': 1e-05, 'epoch': 1.03} {'loss': 0.2869, 'learning_rate': 9.99966402234584e-06, 'epoch': 1.03} {'loss': 0.291, 'learning_rate': 9.999328044692058e-06, 'epoch': 1.03} {'loss': 0.2439, 'learning_rate': 9.998992067039034e-06, 'epoch': 1.03} {'loss': 0.2754, 'learning_rate': 9.998656089387149e-06, 'epoch': 1.03} {'loss': 0.365, 'learning_rate': 9.99832011173678e-06, 'epoch': 1.03} {'loss': 0.4779, 'learning_rate': 9.997984134088308e-06, 'epoch': 1.03} {'loss': 0.3021, 'learning_rate': 9.997648156442113e-06, 'epoch': 1.03} {'loss': 0.3017, 'learning_rate': 9.997312178798572e-06, 'epoch': 1.03} {'loss': 0.3448, 'learning_rate': 9.996976201158064e-06, 'epoch': 1.03} {'loss': 0.2364, 'learning_rate': 9.996640223520968e-06, 'epoch': 1.03} {'loss': 0.3823, 'learning_rate': 9.996304245887666e-06, 'epoch': 1.03} {'loss': 0.4724, 'learning_rate': 9.995968268258536e-06, 'epoch': 1.03} {'loss': 0.5881, 'learning_rate': 9.995632290633957e-06, 'epoch': 1.03} {'loss': 0.4162, 'learning_rate': 9.995296313014308e-06, 'epoch': 1.03} {'loss': 0.2697, 'learning_rate': 9.994960335399969e-06, 'epoch': 1.03} {'loss': 0.35, 'learning_rate': 9.994624357791318e-06, 'epoch': 1.03} {'loss': 0.415, 'learning_rate': 9.994288380188735e-06, 'epoch': 1.03} {'loss': 0.1846, 'learning_rate': 9.9939524025926e-06, 'epoch': 1.03} {'loss': 0.1946, 'learning_rate': 9.99361642500329e-06, 'epoch': 1.03} {'loss': 0.2707, 'learning_rate': 9.99328044742119e-06, 'epoch': 1.03} {'loss': 0.2976, 'learning_rate': 9.992944469846673e-06, 'epoch': 1.03} {'loss': 0.1626, 'learning_rate': 9.99260849228012e-06, 'epoch': 1.03} {'loss': 0.2852, 'learning_rate': 9.99227251472191e-06, 'epoch': 1.03} {'loss': 0.2037, 'learning_rate': 9.991936537172424e-06, 'epoch': 1.03} {'loss': 0.4313, 'learning_rate': 9.991600559632038e-06, 'epoch': 1.03} {'loss': 0.3831, 'learning_rate': 9.991264582101135e-06, 'epoch': 1.03} {'loss': 0.36, 'learning_rate': 9.990928604580091e-06, 'epoch': 1.03} {'loss': 0.3402, 'learning_rate': 9.990592627069289e-06, 'epoch': 1.03} {'loss': 0.3044, 'learning_rate': 9.990256649569104e-06, 'epoch': 1.03} {'loss': 0.4275, 'learning_rate': 9.989920672079919e-06, 'epoch': 1.03} {'loss': 0.264, 'learning_rate': 9.98958469460211e-06, 'epoch': 1.03} {'loss': 0.3937, 'learning_rate': 9.989248717136061e-06, 'epoch': 1.03} {'loss': 0.2226, 'learning_rate': 9.988912739682148e-06, 'epoch': 1.03} {'loss': 0.2442, 'learning_rate': 9.988576762240749e-06, 'epoch': 1.03} {'loss': 0.3108, 'learning_rate': 9.988240784812245e-06, 'epoch': 1.03} {'loss': 0.3016, 'learning_rate': 9.987904807397014e-06, 'epoch': 1.03} {'loss': 0.2267, 'learning_rate': 9.987568829995437e-06, 'epoch': 1.03} {'loss': 0.3663, 'learning_rate': 9.98723285260789e-06, 'epoch': 1.03} {'loss': 0.2923, 'learning_rate': 9.986896875234758e-06, 'epoch': 1.03} {'loss': 0.4873, 'learning_rate': 9.986560897876416e-06, 'epoch': 1.03} {'loss': 0.2604, 'learning_rate': 9.986224920533244e-06, 'epoch': 1.03} {'loss': 0.4692, 'learning_rate': 9.985888943205621e-06, 'epoch': 1.03} {'loss': 0.3199, 'learning_rate': 9.985552965893926e-06, 'epoch': 1.03} {'loss': 0.509, 'learning_rate': 9.98521698859854e-06, 'epoch': 1.03} {'loss': 0.29, 'learning_rate': 9.984881011319841e-06, 'epoch': 1.03} {'loss': 0.3584, 'learning_rate': 9.984545034058211e-06, 'epoch': 1.03} {'loss': 0.3462, 'learning_rate': 9.984209056814023e-06, 'epoch': 1.03} {'loss': 0.4413, 'learning_rate': 9.983873079587662e-06, 'epoch': 1.03} {'loss': 0.3488, 'learning_rate': 9.983537102379505e-06, 'epoch': 1.03} {'loss': 0.2962, 'learning_rate': 9.983201125189927e-06, 'epoch': 1.03} {'loss': 0.3593, 'learning_rate': 9.982865148019316e-06, 'epoch': 1.03} {'loss': 0.3563, 'learning_rate': 9.982529170868046e-06, 'epoch': 1.03} {'loss': 0.3559, 'learning_rate': 9.982193193736496e-06, 'epoch': 1.03} {'loss': 0.3068, 'learning_rate': 9.981857216625052e-06, 'epoch': 1.03} {'loss': 0.294, 'learning_rate': 9.981521239534084e-06, 'epoch': 1.03} {'loss': 0.4556, 'learning_rate': 9.981185262463975e-06, 'epoch': 1.03} {'loss': 0.3285, 'learning_rate': 9.980849285415104e-06, 'epoch': 1.03} {'loss': 0.2344, 'learning_rate': 9.980513308387851e-06, 'epoch': 1.03} {'loss': 0.3542, 'learning_rate': 9.980177331382594e-06, 'epoch': 1.03} {'loss': 0.215, 'learning_rate': 9.979841354399714e-06, 'epoch': 1.03} {'loss': 0.2402, 'learning_rate': 9.979505377439591e-06, 'epoch': 1.03} {'loss': 0.4549, 'learning_rate': 9.9791694005026e-06, 'epoch': 1.03} {'loss': 0.2392, 'learning_rate': 9.978833423589122e-06, 'epoch': 1.03} {'loss': 0.3317, 'learning_rate': 9.97849744669954e-06, 'epoch': 1.03} {'loss': 0.3682, 'learning_rate': 9.978161469834228e-06, 'epoch': 1.03} {'loss': 0.2732, 'learning_rate': 9.977825492993568e-06, 'epoch': 1.03} {'loss': 0.4416, 'learning_rate': 9.97748951617794e-06, 'epoch': 1.03} {'loss': 0.4387, 'learning_rate': 9.977153539387721e-06, 'epoch': 1.03} {'loss': 0.328, 'learning_rate': 9.976817562623292e-06, 'epoch': 1.03} {'loss': 0.3947, 'learning_rate': 9.97648158588503e-06, 'epoch': 1.03} {'loss': 0.252, 'learning_rate': 9.976145609173318e-06, 'epoch': 1.03} {'loss': 0.2987, 'learning_rate': 9.975809632488531e-06, 'epoch': 1.03} {'loss': 0.245, 'learning_rate': 9.975473655831052e-06, 'epoch': 1.03} {'loss': 0.3119, 'learning_rate': 9.975137679201258e-06, 'epoch': 1.03} {'loss': 0.369, 'learning_rate': 9.974801702599528e-06, 'epoch': 1.03} {'loss': 0.4233, 'learning_rate': 9.974465726026242e-06, 'epoch': 1.03} {'loss': 0.2863, 'learning_rate': 9.97412974948178e-06, 'epoch': 1.03} {'loss': 0.3181, 'learning_rate': 9.973793772966521e-06, 'epoch': 1.03} {'loss': 0.4479, 'learning_rate': 9.973457796480843e-06, 'epoch': 1.03} {'loss': 0.3846, 'learning_rate': 9.97312182002513e-06, 'epoch': 1.03} {'loss': 0.4381, 'learning_rate': 9.972785843599753e-06, 'epoch': 1.03} {'loss': 0.4649, 'learning_rate': 9.972449867205096e-06, 'epoch': 1.03} {'loss': 0.3854, 'learning_rate': 9.972113890841538e-06, 'epoch': 1.03} {'loss': 0.4242, 'learning_rate': 9.971777914509459e-06, 'epoch': 1.03} {'loss': 0.3839, 'learning_rate': 9.971441938209237e-06, 'epoch': 1.03} {'loss': 0.3943, 'learning_rate': 9.971105961941251e-06, 'epoch': 1.03} {'loss': 0.3107, 'learning_rate': 9.970769985705881e-06, 'epoch': 1.03} {'loss': 0.4174, 'learning_rate': 9.970434009503506e-06, 'epoch': 1.03} {'loss': 0.3936, 'learning_rate': 9.970098033334506e-06, 'epoch': 1.03} {'loss': 0.2418, 'learning_rate': 9.96976205719926e-06, 'epoch': 1.03} {'loss': 0.2982, 'learning_rate': 9.969426081098147e-06, 'epoch': 1.03} {'loss': 0.3097, 'learning_rate': 9.969090105031545e-06, 'epoch': 1.03} {'loss': 0.3246, 'learning_rate': 9.968754128999837e-06, 'epoch': 1.03} {'loss': 0.3881, 'learning_rate': 9.968418153003397e-06, 'epoch': 1.03} {'loss': 0.4528, 'learning_rate': 9.968082177042608e-06, 'epoch': 1.03} {'loss': 0.3782, 'learning_rate': 9.967746201117846e-06, 'epoch': 1.03} {'loss': 0.2499, 'learning_rate': 9.967410225229496e-06, 'epoch': 1.03} {'loss': 0.4127, 'learning_rate': 9.96707424937793e-06, 'epoch': 1.03} {'loss': 0.2275, 'learning_rate': 9.966738273563534e-06, 'epoch': 1.03} {'loss': 0.3267, 'learning_rate': 9.966402297786683e-06, 'epoch': 1.03} {'loss': 0.285, 'learning_rate': 9.966066322047755e-06, 'epoch': 1.03} {'loss': 0.3768, 'learning_rate': 9.965730346347136e-06, 'epoch': 1.03} {'loss': 0.3854, 'learning_rate': 9.965394370685197e-06, 'epoch': 1.03} {'loss': 0.3208, 'learning_rate': 9.965058395062323e-06, 'epoch': 1.03} {'loss': 0.2685, 'learning_rate': 9.964722419478891e-06, 'epoch': 1.03} {'loss': 0.2971, 'learning_rate': 9.964386443935284e-06, 'epoch': 1.03} {'loss': 0.2684, 'learning_rate': 9.964050468431874e-06, 'epoch': 1.03} {'loss': 0.2856, 'learning_rate': 9.963714492969046e-06, 'epoch': 1.03} {'loss': 0.3947, 'learning_rate': 9.963378517547177e-06, 'epoch': 1.03} {'loss': 0.3332, 'learning_rate': 9.963042542166646e-06, 'epoch': 1.03} {'loss': 0.3718, 'learning_rate': 9.962706566827833e-06, 'epoch': 1.03} {'loss': 0.212, 'learning_rate': 9.962370591531118e-06, 'epoch': 1.03} {'loss': 0.3331, 'learning_rate': 9.962034616276878e-06, 'epoch': 1.03} {'loss': 0.4267, 'learning_rate': 9.961698641065495e-06, 'epoch': 1.03} {'loss': 0.3167, 'learning_rate': 9.961362665897345e-06, 'epoch': 1.03} {'loss': 0.223, 'learning_rate': 9.961026690772812e-06, 'epoch': 1.03} {'loss': 0.318, 'learning_rate': 9.960690715692271e-06, 'epoch': 1.03} {'loss': 0.4211, 'learning_rate': 9.960354740656103e-06, 'epoch': 1.03} {'loss': 0.2627, 'learning_rate': 9.960018765664686e-06, 'epoch': 1.03} {'loss': 0.2894, 'learning_rate': 9.959682790718404e-06, 'epoch': 1.03} {'loss': 0.3877, 'learning_rate': 9.959346815817629e-06, 'epoch': 1.03} {'loss': 0.3121, 'learning_rate': 9.959010840962745e-06, 'epoch': 1.03} {'loss': 0.2485, 'learning_rate': 9.958674866154129e-06, 'epoch': 1.03} {'loss': 0.3157, 'learning_rate': 9.95833889139216e-06, 'epoch': 1.03} {'loss': 0.2534, 'learning_rate': 9.95800291667722e-06, 'epoch': 1.03} {'loss': 0.3365, 'learning_rate': 9.957666942009688e-06, 'epoch': 1.03} {'loss': 0.2638, 'learning_rate': 9.95733096738994e-06, 'epoch': 1.03} {'loss': 0.3995, 'learning_rate': 9.956994992818358e-06, 'epoch': 1.03} {'loss': 0.167, 'learning_rate': 9.956659018295319e-06, 'epoch': 1.03} {'loss': 0.2999, 'learning_rate': 9.956323043821205e-06, 'epoch': 1.03} {'loss': 0.2113, 'learning_rate': 9.955987069396395e-06, 'epoch': 1.03} {'loss': 0.2951, 'learning_rate': 9.955651095021265e-06, 'epoch': 1.03} {'loss': 0.4664, 'learning_rate': 9.9553151206962e-06, 'epoch': 1.03} {'loss': 0.19, 'learning_rate': 9.954979146421574e-06, 'epoch': 1.03} {'loss': 0.2692, 'learning_rate': 9.954643172197768e-06, 'epoch': 1.03} {'loss': 0.5307, 'learning_rate': 9.954307198025161e-06, 'epoch': 1.03} {'loss': 0.5221, 'learning_rate': 9.95397122390413e-06, 'epoch': 1.03} {'loss': 0.331, 'learning_rate': 9.95363524983506e-06, 'epoch': 1.03} {'loss': 0.3143, 'learning_rate': 9.953299275818326e-06, 'epoch': 1.03} {'loss': 0.2815, 'learning_rate': 9.952963301854309e-06, 'epoch': 1.03} {'loss': 0.3778, 'learning_rate': 9.952627327943385e-06, 'epoch': 1.03} {'loss': 0.4608, 'learning_rate': 9.952291354085938e-06, 'epoch': 1.03} {'loss': 0.3447, 'learning_rate': 9.951955380282342e-06, 'epoch': 1.03} {'loss': 0.3423, 'learning_rate': 9.951619406532984e-06, 'epoch': 1.03} {'loss': 0.3018, 'learning_rate': 9.951283432838235e-06, 'epoch': 1.03} {'loss': 0.3792, 'learning_rate': 9.95094745919848e-06, 'epoch': 1.03} {'loss': 0.4054, 'learning_rate': 9.950611485614096e-06, 'epoch': 1.03} {'loss': 0.4885, 'learning_rate': 9.950275512085461e-06, 'epoch': 1.03} {'loss': 0.3701, 'learning_rate': 9.94993953861295e-06, 'epoch': 1.03} {'loss': 0.3457, 'learning_rate': 9.949603565196954e-06, 'epoch': 1.03} {'loss': 0.3138, 'learning_rate': 9.949267591837844e-06, 'epoch': 1.03} {'loss': 0.4742, 'learning_rate': 9.948931618536003e-06, 'epoch': 1.03} {'loss': 0.3405, 'learning_rate': 9.948595645291811e-06, 'epoch': 1.03} {'loss': 0.2861, 'learning_rate': 9.948259672105641e-06, 'epoch': 1.03} {'loss': 0.2117, 'learning_rate': 9.947923698977878e-06, 'epoch': 1.03} {'loss': 0.4991, 'learning_rate': 9.947587725908897e-06, 'epoch': 1.03} {'loss': 0.2769, 'learning_rate': 9.94725175289908e-06, 'epoch': 1.03} {'loss': 0.2895, 'learning_rate': 9.946915779948806e-06, 'epoch': 1.03} {'loss': 0.2056, 'learning_rate': 9.946579807058454e-06, 'epoch': 1.03} {'loss': 0.4109, 'learning_rate': 9.946243834228403e-06, 'epoch': 1.03} {'loss': 0.2784, 'learning_rate': 9.945907861459033e-06, 'epoch': 1.03} {'loss': 0.3509, 'learning_rate': 9.945571888750722e-06, 'epoch': 1.03} {'loss': 0.2449, 'learning_rate': 9.94523591610385e-06, 'epoch': 1.03} {'loss': 0.3397, 'learning_rate': 9.944899943518798e-06, 'epoch': 1.03} {'loss': 0.3415, 'learning_rate': 9.944563970995943e-06, 'epoch': 1.03} {'loss': 0.3678, 'learning_rate': 9.944227998535667e-06, 'epoch': 1.03} {'loss': 0.4075, 'learning_rate': 9.943892026138344e-06, 'epoch': 1.03} {'loss': 0.3321, 'learning_rate': 9.943556053804355e-06, 'epoch': 1.03} {'loss': 0.4287, 'learning_rate': 9.943220081534082e-06, 'epoch': 1.03} {'loss': 0.369, 'learning_rate': 9.942884109327902e-06, 'epoch': 1.03} {'loss': 0.3725, 'learning_rate': 9.942548137186196e-06, 'epoch': 1.03} {'loss': 0.3741, 'learning_rate': 9.942212165109341e-06, 'epoch': 1.03} {'loss': 0.2434, 'learning_rate': 9.941876193097718e-06, 'epoch': 1.03} {'loss': 0.244, 'learning_rate': 9.941540221151706e-06, 'epoch': 1.03} {'loss': 0.4104, 'learning_rate': 9.941204249271684e-06, 'epoch': 1.03} {'loss': 0.2972, 'learning_rate': 9.940868277458031e-06, 'epoch': 1.03} {'loss': 0.2175, 'learning_rate': 9.940532305711126e-06, 'epoch': 1.03} {'loss': 0.4601, 'learning_rate': 9.94019633403135e-06, 'epoch': 1.03} {'loss': 0.2409, 'learning_rate': 9.939860362419081e-06, 'epoch': 1.03} {'loss': 0.3496, 'learning_rate': 9.939524390874698e-06, 'epoch': 1.03} {'loss': 0.3652, 'learning_rate': 9.93918841939858e-06, 'epoch': 1.03} {'loss': 0.3484, 'learning_rate': 9.938852447991107e-06, 'epoch': 1.03} {'loss': 0.3852, 'learning_rate': 9.938516476652658e-06, 'epoch': 1.03} {'loss': 0.2862, 'learning_rate': 9.938180505383612e-06, 'epoch': 1.03} {'loss': 0.4296, 'learning_rate': 9.937844534184347e-06, 'epoch': 1.03} {'loss': 0.5658, 'learning_rate': 9.937508563055244e-06, 'epoch': 1.03} {'loss': 0.4167, 'learning_rate': 9.937172591996684e-06, 'epoch': 1.03} {'loss': 0.3066, 'learning_rate': 9.936836621009042e-06, 'epoch': 1.03} {'loss': 0.3927, 'learning_rate': 9.936500650092702e-06, 'epoch': 1.04} {'loss': 0.323, 'learning_rate': 9.93616467924804e-06, 'epoch': 1.04} {'loss': 0.3065, 'learning_rate': 9.935828708475434e-06, 'epoch': 1.04} {'loss': 0.3629, 'learning_rate': 9.935492737775267e-06, 'epoch': 1.04} {'loss': 0.2652, 'learning_rate': 9.935156767147917e-06, 'epoch': 1.04} {'loss': 0.3815, 'learning_rate': 9.934820796593761e-06, 'epoch': 1.04} {'loss': 0.31, 'learning_rate': 9.93448482611318e-06, 'epoch': 1.04} {'loss': 0.4263, 'learning_rate': 9.934148855706554e-06, 'epoch': 1.04} {'loss': 0.334, 'learning_rate': 9.93381288537426e-06, 'epoch': 1.04} {'loss': 0.3564, 'learning_rate': 9.933476915116681e-06, 'epoch': 1.04} {'loss': 0.3775, 'learning_rate': 9.933140944934194e-06, 'epoch': 1.04} {'loss': 0.4145, 'learning_rate': 9.932804974827175e-06, 'epoch': 1.04} {'loss': 0.3892, 'learning_rate': 9.932469004796008e-06, 'epoch': 1.04} {'loss': 0.2366, 'learning_rate': 9.932133034841072e-06, 'epoch': 1.04} {'loss': 0.324, 'learning_rate': 9.931797064962743e-06, 'epoch': 1.04} {'loss': 0.441, 'learning_rate': 9.931461095161402e-06, 'epoch': 1.04} {'loss': 0.2688, 'learning_rate': 9.93112512543743e-06, 'epoch': 1.04} {'loss': 0.3928, 'learning_rate': 9.930789155791205e-06, 'epoch': 1.04} {'loss': 0.438, 'learning_rate': 9.930453186223106e-06, 'epoch': 1.04} {'loss': 0.2429, 'learning_rate': 9.93011721673351e-06, 'epoch': 1.04} {'loss': 0.3526, 'learning_rate': 9.9297812473228e-06, 'epoch': 1.04} {'loss': 0.354, 'learning_rate': 9.929445277991351e-06, 'epoch': 1.04} {'loss': 0.376, 'learning_rate': 9.929109308739548e-06, 'epoch': 1.04} {'loss': 0.3324, 'learning_rate': 9.928773339567765e-06, 'epoch': 1.04} {'loss': 0.3008, 'learning_rate': 9.928437370476384e-06, 'epoch': 1.04} {'loss': 0.3342, 'learning_rate': 9.928101401465785e-06, 'epoch': 1.04} {'loss': 0.1983, 'learning_rate': 9.927765432536344e-06, 'epoch': 1.04} {'loss': 0.2949, 'learning_rate': 9.927429463688443e-06, 'epoch': 1.04} {'loss': 0.2215, 'learning_rate': 9.92709349492246e-06, 'epoch': 1.04} {'loss': 0.4177, 'learning_rate': 9.926757526238773e-06, 'epoch': 1.04} {'loss': 0.3474, 'learning_rate': 9.926421557637767e-06, 'epoch': 1.04} {'loss': 0.4323, 'learning_rate': 9.926085589119816e-06, 'epoch': 1.04} {'loss': 0.4411, 'learning_rate': 9.9257496206853e-06, 'epoch': 1.04} {'loss': 0.3206, 'learning_rate': 9.925413652334595e-06, 'epoch': 1.04} {'loss': 0.2081, 'learning_rate': 9.925077684068087e-06, 'epoch': 1.04} {'loss': 0.38, 'learning_rate': 9.924741715886152e-06, 'epoch': 1.04} {'loss': 0.4274, 'learning_rate': 9.924405747789168e-06, 'epoch': 1.04} {'loss': 0.3275, 'learning_rate': 9.924069779777515e-06, 'epoch': 1.04} {'loss': 0.3142, 'learning_rate': 9.923733811851574e-06, 'epoch': 1.04} {'loss': 0.3447, 'learning_rate': 9.923397844011724e-06, 'epoch': 1.04} {'loss': 0.3771, 'learning_rate': 9.92306187625834e-06, 'epoch': 1.04} {'loss': 0.3135, 'learning_rate': 9.922725908591808e-06, 'epoch': 1.04} {'loss': 0.4069, 'learning_rate': 9.922389941012503e-06, 'epoch': 1.04} {'loss': 0.4614, 'learning_rate': 9.922053973520805e-06, 'epoch': 1.04} {'loss': 0.184, 'learning_rate': 9.921718006117094e-06, 'epoch': 1.04} {'loss': 0.2782, 'learning_rate': 9.921382038801746e-06, 'epoch': 1.04} {'loss': 0.3319, 'learning_rate': 9.921046071575144e-06, 'epoch': 1.04} {'loss': 0.3455, 'learning_rate': 9.920710104437667e-06, 'epoch': 1.04} {'loss': 0.3233, 'learning_rate': 9.92037413738969e-06, 'epoch': 1.04} {'loss': 0.3283, 'learning_rate': 9.920038170431598e-06, 'epoch': 1.04} {'loss': 0.4204, 'learning_rate': 9.919702203563769e-06, 'epoch': 1.04} {'loss': 0.3678, 'learning_rate': 9.919366236786579e-06, 'epoch': 1.04} {'loss': 0.2815, 'learning_rate': 9.919030270100407e-06, 'epoch': 1.04} {'loss': 0.3119, 'learning_rate': 9.918694303505638e-06, 'epoch': 1.04} {'loss': 0.3008, 'learning_rate': 9.918358337002646e-06, 'epoch': 1.04} {'loss': 0.3497, 'learning_rate': 9.918022370591813e-06, 'epoch': 1.04} {'loss': 0.4325, 'learning_rate': 9.917686404273518e-06, 'epoch': 1.04} {'loss': 0.225, 'learning_rate': 9.917350438048138e-06, 'epoch': 1.04} {'loss': 0.4479, 'learning_rate': 9.917014471916053e-06, 'epoch': 1.04} {'loss': 0.3259, 'learning_rate': 9.916678505877644e-06, 'epoch': 1.04} {'loss': 0.4058, 'learning_rate': 9.916342539933285e-06, 'epoch': 1.04} {'loss': 0.2113, 'learning_rate': 9.916006574083362e-06, 'epoch': 1.04} {'loss': 0.2408, 'learning_rate': 9.915670608328253e-06, 'epoch': 1.04} {'loss': 0.2402, 'learning_rate': 9.915334642668335e-06, 'epoch': 1.04} {'loss': 0.3149, 'learning_rate': 9.914998677103991e-06, 'epoch': 1.04} {'loss': 0.3359, 'learning_rate': 9.914662711635594e-06, 'epoch': 1.04} {'loss': 0.2576, 'learning_rate': 9.914326746263527e-06, 'epoch': 1.04} {'loss': 0.4329, 'learning_rate': 9.91399078098817e-06, 'epoch': 1.04} {'loss': 0.3774, 'learning_rate': 9.9136548158099e-06, 'epoch': 1.04} {'loss': 0.3239, 'learning_rate': 9.913318850729097e-06, 'epoch': 1.04} {'loss': 0.417, 'learning_rate': 9.912982885746141e-06, 'epoch': 1.04} {'loss': 0.415, 'learning_rate': 9.912646920861411e-06, 'epoch': 1.04} {'loss': 0.4125, 'learning_rate': 9.912310956075285e-06, 'epoch': 1.04} {'loss': 0.4824, 'learning_rate': 9.911974991388144e-06, 'epoch': 1.04} {'loss': 0.3764, 'learning_rate': 9.911639026800367e-06, 'epoch': 1.04} {'loss': 0.298, 'learning_rate': 9.911303062312332e-06, 'epoch': 1.04} {'loss': 0.3284, 'learning_rate': 9.91096709792442e-06, 'epoch': 1.04} {'loss': 0.3915, 'learning_rate': 9.910631133637011e-06, 'epoch': 1.04} {'loss': 0.4185, 'learning_rate': 9.91029516945048e-06, 'epoch': 1.04} {'loss': 0.3138, 'learning_rate': 9.909959205365208e-06, 'epoch': 1.04} {'loss': 0.2155, 'learning_rate': 9.909623241381576e-06, 'epoch': 1.04} {'loss': 0.4452, 'learning_rate': 9.909287277499962e-06, 'epoch': 1.04} {'loss': 0.2324, 'learning_rate': 9.908951313720745e-06, 'epoch': 1.04} {'loss': 0.3078, 'learning_rate': 9.908615350044304e-06, 'epoch': 1.04} {'loss': 0.2726, 'learning_rate': 9.90827938647102e-06, 'epoch': 1.04} {'loss': 0.4269, 'learning_rate': 9.90794342300127e-06, 'epoch': 1.04} {'loss': 0.2977, 'learning_rate': 9.907607459635436e-06, 'epoch': 1.04} {'loss': 0.2917, 'learning_rate': 9.907271496373896e-06, 'epoch': 1.04} {'loss': 0.3215, 'learning_rate': 9.906935533217028e-06, 'epoch': 1.04} {'loss': 0.3004, 'learning_rate': 9.90659957016521e-06, 'epoch': 1.04} {'loss': 0.2497, 'learning_rate': 9.906263607218829e-06, 'epoch': 1.04} {'loss': 0.3494, 'learning_rate': 9.905927644378253e-06, 'epoch': 1.04} {'loss': 0.2162, 'learning_rate': 9.90559168164387e-06, 'epoch': 1.04} {'loss': 0.2743, 'learning_rate': 9.905255719016054e-06, 'epoch': 1.04} {'loss': 0.3547, 'learning_rate': 9.904919756495186e-06, 'epoch': 1.04} {'loss': 0.3429, 'learning_rate': 9.904583794081647e-06, 'epoch': 1.04} {'loss': 0.3783, 'learning_rate': 9.904247831775813e-06, 'epoch': 1.04} {'loss': 0.284, 'learning_rate': 9.903911869578066e-06, 'epoch': 1.04} {'loss': 0.3417, 'learning_rate': 9.903575907488783e-06, 'epoch': 1.04} {'loss': 0.4307, 'learning_rate': 9.903239945508348e-06, 'epoch': 1.04} {'loss': 0.2854, 'learning_rate': 9.902903983637133e-06, 'epoch': 1.04} {'loss': 0.3128, 'learning_rate': 9.902568021875522e-06, 'epoch': 1.04} {'loss': 0.2358, 'learning_rate': 9.902232060223894e-06, 'epoch': 1.04} {'loss': 0.3977, 'learning_rate': 9.90189609868263e-06, 'epoch': 1.04} {'loss': 0.3187, 'learning_rate': 9.901560137252103e-06, 'epoch': 1.04} {'loss': 0.2936, 'learning_rate': 9.901224175932697e-06, 'epoch': 1.04} {'loss': 0.2369, 'learning_rate': 9.90088821472479e-06, 'epoch': 1.04} {'loss': 0.4337, 'learning_rate': 9.90055225362876e-06, 'epoch': 1.04} {'loss': 0.3244, 'learning_rate': 9.900216292644988e-06, 'epoch': 1.04} {'loss': 0.2402, 'learning_rate': 9.899880331773854e-06, 'epoch': 1.04} {'loss': 0.3806, 'learning_rate': 9.899544371015736e-06, 'epoch': 1.04} {'loss': 0.2991, 'learning_rate': 9.899208410371012e-06, 'epoch': 1.04} {'loss': 0.3281, 'learning_rate': 9.898872449840063e-06, 'epoch': 1.04} {'loss': 0.2927, 'learning_rate': 9.898536489423269e-06, 'epoch': 1.04} {'loss': 0.3184, 'learning_rate': 9.898200529121005e-06, 'epoch': 1.04} {'loss': 0.2717, 'learning_rate': 9.897864568933656e-06, 'epoch': 1.04} {'loss': 0.4764, 'learning_rate': 9.8975286088616e-06, 'epoch': 1.04} {'loss': 0.2415, 'learning_rate': 9.897192648905213e-06, 'epoch': 1.04} {'loss': 0.1515, 'learning_rate': 9.896856689064875e-06, 'epoch': 1.04} {'loss': 0.2884, 'learning_rate': 9.896520729340967e-06, 'epoch': 1.04} {'loss': 0.372, 'learning_rate': 9.896184769733867e-06, 'epoch': 1.04} {'loss': 0.3576, 'learning_rate': 9.895848810243956e-06, 'epoch': 1.04} {'loss': 0.3971, 'learning_rate': 9.895512850871609e-06, 'epoch': 1.04} {'loss': 0.3107, 'learning_rate': 9.89517689161721e-06, 'epoch': 1.04} {'loss': 0.261, 'learning_rate': 9.894840932481136e-06, 'epoch': 1.04} {'loss': 0.3435, 'learning_rate': 9.894504973463766e-06, 'epoch': 1.04} {'loss': 0.3764, 'learning_rate': 9.894169014565481e-06, 'epoch': 1.04} {'loss': 0.4414, 'learning_rate': 9.89383305578666e-06, 'epoch': 1.04} {'loss': 0.4068, 'learning_rate': 9.893497097127679e-06, 'epoch': 1.04} {'loss': 0.3202, 'learning_rate': 9.893161138588922e-06, 'epoch': 1.04} {'loss': 0.1374, 'learning_rate': 9.892825180170765e-06, 'epoch': 1.04} {'loss': 0.2827, 'learning_rate': 9.892489221873586e-06, 'epoch': 1.04} {'loss': 0.3227, 'learning_rate': 9.892153263697768e-06, 'epoch': 1.04} {'loss': 0.2535, 'learning_rate': 9.891817305643688e-06, 'epoch': 1.04} {'loss': 0.4889, 'learning_rate': 9.891481347711726e-06, 'epoch': 1.04} {'loss': 0.4368, 'learning_rate': 9.89114538990226e-06, 'epoch': 1.04} {'loss': 0.3948, 'learning_rate': 9.89080943221567e-06, 'epoch': 1.04} {'loss': 0.3104, 'learning_rate': 9.890473474652336e-06, 'epoch': 1.04} {'loss': 0.3904, 'learning_rate': 9.890137517212637e-06, 'epoch': 1.04} {'loss': 0.2844, 'learning_rate': 9.889801559896951e-06, 'epoch': 1.04} {'loss': 0.231, 'learning_rate': 9.889465602705658e-06, 'epoch': 1.04} {'loss': 0.3155, 'learning_rate': 9.889129645639139e-06, 'epoch': 1.04} {'loss': 0.2877, 'learning_rate': 9.88879368869777e-06, 'epoch': 1.04} {'loss': 0.402, 'learning_rate': 9.888457731881934e-06, 'epoch': 1.04} {'loss': 0.3735, 'learning_rate': 9.888121775192006e-06, 'epoch': 1.04} {'loss': 0.4525, 'learning_rate': 9.887785818628368e-06, 'epoch': 1.04} {'loss': 0.3336, 'learning_rate': 9.887449862191397e-06, 'epoch': 1.04} {'loss': 0.2272, 'learning_rate': 9.887113905881474e-06, 'epoch': 1.04} {'loss': 0.4104, 'learning_rate': 9.886777949698979e-06, 'epoch': 1.04} {'loss': 0.3728, 'learning_rate': 9.88644199364429e-06, 'epoch': 1.04} {'loss': 0.3652, 'learning_rate': 9.886106037717786e-06, 'epoch': 1.04} {'loss': 0.2524, 'learning_rate': 9.885770081919847e-06, 'epoch': 1.04} {'loss': 0.2161, 'learning_rate': 9.885434126250852e-06, 'epoch': 1.04} {'loss': 0.3937, 'learning_rate': 9.885098170711179e-06, 'epoch': 1.04} {'loss': 0.4187, 'learning_rate': 9.88476221530121e-06, 'epoch': 1.04} {'loss': 0.4381, 'learning_rate': 9.88442626002132e-06, 'epoch': 1.04} {'loss': 0.3873, 'learning_rate': 9.884090304871895e-06, 'epoch': 1.04} {'loss': 0.3739, 'learning_rate': 9.883754349853307e-06, 'epoch': 1.04} {'loss': 0.638, 'learning_rate': 9.883418394965939e-06, 'epoch': 1.04} {'loss': 0.2131, 'learning_rate': 9.883082440210164e-06, 'epoch': 1.04} {'loss': 0.4267, 'learning_rate': 9.882746485586372e-06, 'epoch': 1.04} {'loss': 0.4693, 'learning_rate': 9.882410531094936e-06, 'epoch': 1.04} {'loss': 0.2911, 'learning_rate': 9.882074576736237e-06, 'epoch': 1.04} {'loss': 0.3201, 'learning_rate': 9.881738622510655e-06, 'epoch': 1.04} {'loss': 0.3109, 'learning_rate': 9.881402668418566e-06, 'epoch': 1.04} {'loss': 0.2826, 'learning_rate': 9.881066714460351e-06, 'epoch': 1.04} {'loss': 0.3397, 'learning_rate': 9.880730760636388e-06, 'epoch': 1.04} {'loss': 0.3486, 'learning_rate': 9.880394806947059e-06, 'epoch': 1.04} {'loss': 0.2104, 'learning_rate': 9.88005885339274e-06, 'epoch': 1.04} {'loss': 0.2653, 'learning_rate': 9.87972289997381e-06, 'epoch': 1.04} {'loss': 0.2979, 'learning_rate': 9.879386946690653e-06, 'epoch': 1.04} {'loss': 0.4046, 'learning_rate': 9.879050993543645e-06, 'epoch': 1.04} {'loss': 0.2408, 'learning_rate': 9.878715040533164e-06, 'epoch': 1.04} {'loss': 0.3163, 'learning_rate': 9.878379087659592e-06, 'epoch': 1.04} {'loss': 0.3744, 'learning_rate': 9.878043134923306e-06, 'epoch': 1.04} {'loss': 0.3182, 'learning_rate': 9.877707182324687e-06, 'epoch': 1.04} {'loss': 0.3382, 'learning_rate': 9.877371229864115e-06, 'epoch': 1.04} {'loss': 0.3338, 'learning_rate': 9.877035277541966e-06, 'epoch': 1.04} {'loss': 0.3691, 'learning_rate': 9.87669932535862e-06, 'epoch': 1.04} {'loss': 0.4474, 'learning_rate': 9.876363373314457e-06, 'epoch': 1.04} {'loss': 0.3302, 'learning_rate': 9.876027421409856e-06, 'epoch': 1.04} {'loss': 0.2151, 'learning_rate': 9.875691469645196e-06, 'epoch': 1.04} {'loss': 0.3901, 'learning_rate': 9.875355518020858e-06, 'epoch': 1.04} {'loss': 0.4802, 'learning_rate': 9.875019566537219e-06, 'epoch': 1.04} {'loss': 0.2469, 'learning_rate': 9.87468361519466e-06, 'epoch': 1.04} {'loss': 0.3222, 'learning_rate': 9.874347663993559e-06, 'epoch': 1.04} {'loss': 0.3468, 'learning_rate': 9.874011712934297e-06, 'epoch': 1.04} {'loss': 0.4139, 'learning_rate': 9.873675762017248e-06, 'epoch': 1.04} {'loss': 0.3688, 'learning_rate': 9.873339811242797e-06, 'epoch': 1.04} {'loss': 0.3155, 'learning_rate': 9.873003860611326e-06, 'epoch': 1.04} {'loss': 0.3853, 'learning_rate': 9.872667910123205e-06, 'epoch': 1.04} {'loss': 0.4539, 'learning_rate': 9.872331959778816e-06, 'epoch': 1.04} {'loss': 0.5301, 'learning_rate': 9.871996009578542e-06, 'epoch': 1.04} {'loss': 0.3536, 'learning_rate': 9.871660059522762e-06, 'epoch': 1.04} {'loss': 0.2966, 'learning_rate': 9.87132410961185e-06, 'epoch': 1.04} {'loss': 0.288, 'learning_rate': 9.870988159846191e-06, 'epoch': 1.04} {'loss': 0.4184, 'learning_rate': 9.87065221022616e-06, 'epoch': 1.04} {'loss': 0.2701, 'learning_rate': 9.87031626075214e-06, 'epoch': 1.04} {'loss': 0.383, 'learning_rate': 9.869980311424506e-06, 'epoch': 1.04} {'loss': 0.3825, 'learning_rate': 9.869644362243642e-06, 'epoch': 1.04} {'loss': 0.3701, 'learning_rate': 9.869308413209923e-06, 'epoch': 1.04} {'loss': 0.4121, 'learning_rate': 9.868972464323729e-06, 'epoch': 1.04} {'loss': 0.2999, 'learning_rate': 9.868636515585442e-06, 'epoch': 1.04} {'loss': 0.3252, 'learning_rate': 9.86830056699544e-06, 'epoch': 1.04} {'loss': 0.4441, 'learning_rate': 9.867964618554103e-06, 'epoch': 1.04} {'loss': 0.2218, 'learning_rate': 9.867628670261805e-06, 'epoch': 1.04} {'loss': 0.4554, 'learning_rate': 9.867292722118931e-06, 'epoch': 1.04} {'loss': 0.3929, 'learning_rate': 9.866956774125857e-06, 'epoch': 1.04} {'loss': 0.3029, 'learning_rate': 9.866620826282964e-06, 'epoch': 1.04} {'loss': 0.2976, 'learning_rate': 9.866284878590632e-06, 'epoch': 1.04} {'loss': 0.3853, 'learning_rate': 9.865948931049237e-06, 'epoch': 1.04} {'loss': 0.3715, 'learning_rate': 9.865612983659162e-06, 'epoch': 1.04} {'loss': 0.3622, 'learning_rate': 9.865277036420783e-06, 'epoch': 1.04} {'loss': 0.2967, 'learning_rate': 9.864941089334481e-06, 'epoch': 1.04} {'loss': 0.3258, 'learning_rate': 9.864605142400635e-06, 'epoch': 1.04} {'loss': 0.4543, 'learning_rate': 9.864269195619623e-06, 'epoch': 1.04} {'loss': 0.35, 'learning_rate': 9.863933248991829e-06, 'epoch': 1.04} {'loss': 0.4006, 'learning_rate': 9.863597302517626e-06, 'epoch': 1.04} {'loss': 0.3426, 'learning_rate': 9.863261356197394e-06, 'epoch': 1.04} {'loss': 0.187, 'learning_rate': 9.862925410031516e-06, 'epoch': 1.04} {'loss': 0.4055, 'learning_rate': 9.862589464020369e-06, 'epoch': 1.04} {'loss': 0.3504, 'learning_rate': 9.862253518164332e-06, 'epoch': 1.04} {'loss': 0.3924, 'learning_rate': 9.861917572463785e-06, 'epoch': 1.04} {'loss': 0.3859, 'learning_rate': 9.861581626919105e-06, 'epoch': 1.04} {'loss': 0.2412, 'learning_rate': 9.861245681530674e-06, 'epoch': 1.04} {'loss': 0.2625, 'learning_rate': 9.86090973629887e-06, 'epoch': 1.04} {'loss': 0.3285, 'learning_rate': 9.860573791224074e-06, 'epoch': 1.04} {'loss': 0.392, 'learning_rate': 9.860237846306661e-06, 'epoch': 1.04} {'loss': 0.411, 'learning_rate': 9.859901901547015e-06, 'epoch': 1.04} {'loss': 0.2163, 'learning_rate': 9.859565956945517e-06, 'epoch': 1.04} {'loss': 0.3734, 'learning_rate': 9.859230012502536e-06, 'epoch': 1.04} {'loss': 0.3783, 'learning_rate': 9.85889406821846e-06, 'epoch': 1.04} {'loss': 0.3663, 'learning_rate': 9.858558124093665e-06, 'epoch': 1.04} {'loss': 0.348, 'learning_rate': 9.85822218012853e-06, 'epoch': 1.04} {'loss': 0.2331, 'learning_rate': 9.857886236323437e-06, 'epoch': 1.04} {'loss': 0.2832, 'learning_rate': 9.857550292678764e-06, 'epoch': 1.04} {'loss': 0.2834, 'learning_rate': 9.857214349194888e-06, 'epoch': 1.04} {'loss': 0.3742, 'learning_rate': 9.85687840587219e-06, 'epoch': 1.04} {'loss': 0.4219, 'learning_rate': 9.856542462711049e-06, 'epoch': 1.04} {'loss': 0.3978, 'learning_rate': 9.856206519711846e-06, 'epoch': 1.04} {'loss': 0.3051, 'learning_rate': 9.855870576874956e-06, 'epoch': 1.04} {'loss': 0.4657, 'learning_rate': 9.855534634200761e-06, 'epoch': 1.04} {'loss': 0.217, 'learning_rate': 9.855198691689645e-06, 'epoch': 1.04} {'loss': 0.3159, 'learning_rate': 9.854862749341977e-06, 'epoch': 1.04} {'loss': 0.3173, 'learning_rate': 9.854526807158143e-06, 'epoch': 1.04} {'loss': 0.1953, 'learning_rate': 9.85419086513852e-06, 'epoch': 1.04} {'loss': 0.3675, 'learning_rate': 9.853854923283487e-06, 'epoch': 1.04} {'loss': 0.3172, 'learning_rate': 9.853518981593425e-06, 'epoch': 1.04} {'loss': 0.3688, 'learning_rate': 9.853183040068712e-06, 'epoch': 1.04} {'loss': 0.3621, 'learning_rate': 9.852847098709727e-06, 'epoch': 1.04} {'loss': 0.4584, 'learning_rate': 9.85251115751685e-06, 'epoch': 1.04} {'loss': 0.3054, 'learning_rate': 9.85217521649046e-06, 'epoch': 1.04} {'loss': 0.1788, 'learning_rate': 9.851839275630936e-06, 'epoch': 1.04} {'loss': 0.169, 'learning_rate': 9.851503334938657e-06, 'epoch': 1.04} {'loss': 0.2964, 'learning_rate': 9.851167394414002e-06, 'epoch': 1.04} {'loss': 0.386, 'learning_rate': 9.850831454057353e-06, 'epoch': 1.04} {'loss': 0.3759, 'learning_rate': 9.850495513869086e-06, 'epoch': 1.04} {'loss': 0.3525, 'learning_rate': 9.85015957384958e-06, 'epoch': 1.04} {'loss': 0.4137, 'learning_rate': 9.84982363399921e-06, 'epoch': 1.04} {'loss': 0.2204, 'learning_rate': 9.849487694318367e-06, 'epoch': 1.04} {'loss': 0.3269, 'learning_rate': 9.849151754807424e-06, 'epoch': 1.04} {'loss': 0.2553, 'learning_rate': 9.848815815466759e-06, 'epoch': 1.04} {'loss': 0.2536, 'learning_rate': 9.848479876296753e-06, 'epoch': 1.04} {'loss': 0.5017, 'learning_rate': 9.848143937297785e-06, 'epoch': 1.04} {'loss': 0.2685, 'learning_rate': 9.847807998470232e-06, 'epoch': 1.04} {'loss': 0.3192, 'learning_rate': 9.847472059814475e-06, 'epoch': 1.04} {'loss': 0.3436, 'learning_rate': 9.847136121330893e-06, 'epoch': 1.04} {'loss': 0.3188, 'learning_rate': 9.846800183019866e-06, 'epoch': 1.04} {'loss': 0.2276, 'learning_rate': 9.846464244881773e-06, 'epoch': 1.04} {'loss': 0.3628, 'learning_rate': 9.846128306916992e-06, 'epoch': 1.04} {'loss': 0.2689, 'learning_rate': 9.8457923691259e-06, 'epoch': 1.04} {'loss': 0.274, 'learning_rate': 9.845456431508882e-06, 'epoch': 1.04} {'loss': 0.4223, 'learning_rate': 9.845120494066315e-06, 'epoch': 1.04} {'loss': 0.1846, 'learning_rate': 9.844784556798576e-06, 'epoch': 1.04} {'loss': 0.4054, 'learning_rate': 9.844448619706046e-06, 'epoch': 1.04} {'loss': 0.3823, 'learning_rate': 9.844112682789104e-06, 'epoch': 1.04} {'loss': 0.4428, 'learning_rate': 9.84377674604813e-06, 'epoch': 1.04} {'loss': 0.2399, 'learning_rate': 9.843440809483503e-06, 'epoch': 1.04} {'loss': 0.295, 'learning_rate': 9.8431048730956e-06, 'epoch': 1.04} {'loss': 0.4377, 'learning_rate': 9.8427689368848e-06, 'epoch': 1.04} {'loss': 0.3994, 'learning_rate': 9.842433000851486e-06, 'epoch': 1.04} {'loss': 0.3348, 'learning_rate': 9.842097064996035e-06, 'epoch': 1.04} {'loss': 0.3663, 'learning_rate': 9.841761129318827e-06, 'epoch': 1.04} {'loss': 0.3717, 'learning_rate': 9.84142519382024e-06, 'epoch': 1.04} {'loss': 0.3058, 'learning_rate': 9.841089258500655e-06, 'epoch': 1.04} {'loss': 0.3128, 'learning_rate': 9.840753323360447e-06, 'epoch': 1.04} {'loss': 0.2172, 'learning_rate': 9.8404173884e-06, 'epoch': 1.04} {'loss': 0.3319, 'learning_rate': 9.840081453619691e-06, 'epoch': 1.04} {'loss': 0.419, 'learning_rate': 9.8397455190199e-06, 'epoch': 1.04} {'loss': 0.3802, 'learning_rate': 9.839409584601009e-06, 'epoch': 1.04} {'loss': 0.3227, 'learning_rate': 9.839073650363391e-06, 'epoch': 1.04} {'loss': 0.3833, 'learning_rate': 9.838737716307428e-06, 'epoch': 1.04} {'loss': 0.3555, 'learning_rate': 9.8384017824335e-06, 'epoch': 1.04} {'loss': 0.3381, 'learning_rate': 9.838065848741984e-06, 'epoch': 1.04} {'loss': 0.2424, 'learning_rate': 9.837729915233264e-06, 'epoch': 1.04} {'loss': 0.2463, 'learning_rate': 9.837393981907714e-06, 'epoch': 1.04} {'loss': 0.2804, 'learning_rate': 9.837058048765714e-06, 'epoch': 1.04} {'loss': 0.3064, 'learning_rate': 9.836722115807646e-06, 'epoch': 1.04} {'loss': 0.3461, 'learning_rate': 9.836386183033889e-06, 'epoch': 1.04} {'loss': 0.4322, 'learning_rate': 9.836050250444819e-06, 'epoch': 1.04} {'loss': 0.3554, 'learning_rate': 9.835714318040817e-06, 'epoch': 1.04} {'loss': 0.2365, 'learning_rate': 9.835378385822263e-06, 'epoch': 1.04} {'loss': 0.4343, 'learning_rate': 9.835042453789538e-06, 'epoch': 1.04} {'loss': 0.3759, 'learning_rate': 9.834706521943016e-06, 'epoch': 1.04} {'loss': 0.269, 'learning_rate': 9.834370590283078e-06, 'epoch': 1.04} {'loss': 0.3462, 'learning_rate': 9.834034658810106e-06, 'epoch': 1.04} {'loss': 0.434, 'learning_rate': 9.833698727524477e-06, 'epoch': 1.04} {'loss': 0.4865, 'learning_rate': 9.833362796426568e-06, 'epoch': 1.04} {'loss': 0.2398, 'learning_rate': 9.833026865516763e-06, 'epoch': 1.04} {'loss': 0.2536, 'learning_rate': 9.83269093479544e-06, 'epoch': 1.04} {'loss': 0.297, 'learning_rate': 9.832355004262974e-06, 'epoch': 1.04} {'loss': 0.3562, 'learning_rate': 9.832019073919749e-06, 'epoch': 1.04} {'loss': 0.4294, 'learning_rate': 9.831683143766143e-06, 'epoch': 1.04} {'loss': 0.3325, 'learning_rate': 9.831347213802534e-06, 'epoch': 1.04} {'loss': 0.3574, 'learning_rate': 9.831011284029303e-06, 'epoch': 1.04} {'loss': 0.4061, 'learning_rate': 9.83067535444683e-06, 'epoch': 1.04} {'loss': 0.3979, 'learning_rate': 9.830339425055488e-06, 'epoch': 1.04} {'loss': 0.4824, 'learning_rate': 9.830003495855663e-06, 'epoch': 1.04} {'loss': 0.225, 'learning_rate': 9.82966756684773e-06, 'epoch': 1.04} {'loss': 0.3986, 'learning_rate': 9.829331638032071e-06, 'epoch': 1.04} {'loss': 0.4156, 'learning_rate': 9.828995709409063e-06, 'epoch': 1.04} {'loss': 0.3398, 'learning_rate': 9.828659780979088e-06, 'epoch': 1.04} {'loss': 0.3318, 'learning_rate': 9.828323852742524e-06, 'epoch': 1.04} {'loss': 0.2839, 'learning_rate': 9.827987924699747e-06, 'epoch': 1.04} {'loss': 0.2749, 'learning_rate': 9.827651996851141e-06, 'epoch': 1.04} {'loss': 0.3148, 'learning_rate': 9.827316069197083e-06, 'epoch': 1.04} {'loss': 0.3683, 'learning_rate': 9.826980141737951e-06, 'epoch': 1.04} {'loss': 0.3129, 'learning_rate': 9.826644214474126e-06, 'epoch': 1.04} {'loss': 0.3388, 'learning_rate': 9.82630828740599e-06, 'epoch': 1.04} {'loss': 0.2627, 'learning_rate': 9.825972360533916e-06, 'epoch': 1.04} {'loss': 0.3489, 'learning_rate': 9.825636433858287e-06, 'epoch': 1.04} {'loss': 0.2572, 'learning_rate': 9.82530050737948e-06, 'epoch': 1.04} {'loss': 0.4329, 'learning_rate': 9.824964581097875e-06, 'epoch': 1.04} {'loss': 0.3288, 'learning_rate': 9.824628655013853e-06, 'epoch': 1.04} {'loss': 0.2532, 'learning_rate': 9.824292729127792e-06, 'epoch': 1.04} {'loss': 0.4232, 'learning_rate': 9.82395680344007e-06, 'epoch': 1.04} {'loss': 0.2161, 'learning_rate': 9.823620877951068e-06, 'epoch': 1.04} {'loss': 0.3951, 'learning_rate': 9.823284952661165e-06, 'epoch': 1.04} {'loss': 0.4138, 'learning_rate': 9.822949027570739e-06, 'epoch': 1.04} {'loss': 0.3187, 'learning_rate': 9.82261310268017e-06, 'epoch': 1.04} {'loss': 0.2844, 'learning_rate': 9.822277177989836e-06, 'epoch': 1.04} {'loss': 0.3494, 'learning_rate': 9.82194125350012e-06, 'epoch': 1.04} {'loss': 0.3361, 'learning_rate': 9.821605329211398e-06, 'epoch': 1.04} {'loss': 0.4765, 'learning_rate': 9.821269405124048e-06, 'epoch': 1.04} {'loss': 0.3633, 'learning_rate': 9.820933481238452e-06, 'epoch': 1.04} {'loss': 0.3332, 'learning_rate': 9.820597557554988e-06, 'epoch': 1.04} {'loss': 0.365, 'learning_rate': 9.820261634074034e-06, 'epoch': 1.04} {'loss': 0.3952, 'learning_rate': 9.81992571079597e-06, 'epoch': 1.04} {'loss': 0.1699, 'learning_rate': 9.819589787721178e-06, 'epoch': 1.04} {'loss': 0.3689, 'learning_rate': 9.819253864850032e-06, 'epoch': 1.04} {'loss': 0.4263, 'learning_rate': 9.818917942182916e-06, 'epoch': 1.04} {'loss': 0.2526, 'learning_rate': 9.818582019720208e-06, 'epoch': 1.04} {'loss': 0.4121, 'learning_rate': 9.818246097462284e-06, 'epoch': 1.04} {'loss': 0.3185, 'learning_rate': 9.817910175409528e-06, 'epoch': 1.04} {'loss': 0.3121, 'learning_rate': 9.817574253562316e-06, 'epoch': 1.04} {'loss': 0.4016, 'learning_rate': 9.817238331921028e-06, 'epoch': 1.04} {'loss': 0.2074, 'learning_rate': 9.816902410486042e-06, 'epoch': 1.04} {'loss': 0.3625, 'learning_rate': 9.816566489257735e-06, 'epoch': 1.04} {'loss': 0.4308, 'learning_rate': 9.816230568236493e-06, 'epoch': 1.04} {'loss': 0.3961, 'learning_rate': 9.815894647422693e-06, 'epoch': 1.04} {'loss': 0.349, 'learning_rate': 9.815558726816712e-06, 'epoch': 1.04} {'loss': 0.4618, 'learning_rate': 9.815222806418931e-06, 'epoch': 1.04} {'loss': 0.3242, 'learning_rate': 9.81488688622973e-06, 'epoch': 1.04} {'loss': 0.4302, 'learning_rate': 9.814550966249483e-06, 'epoch': 1.04} {'loss': 0.2475, 'learning_rate': 9.814215046478574e-06, 'epoch': 1.04} {'loss': 0.4783, 'learning_rate': 9.813879126917382e-06, 'epoch': 1.04} {'loss': 0.2707, 'learning_rate': 9.813543207566282e-06, 'epoch': 1.04} {'loss': 0.4991, 'learning_rate': 9.813207288425659e-06, 'epoch': 1.04} {'loss': 0.3415, 'learning_rate': 9.812871369495888e-06, 'epoch': 1.04} {'loss': 0.2676, 'learning_rate': 9.81253545077735e-06, 'epoch': 1.04} {'loss': 0.2923, 'learning_rate': 9.812199532270425e-06, 'epoch': 1.04} {'loss': 0.384, 'learning_rate': 9.81186361397549e-06, 'epoch': 1.04} {'loss': 0.375, 'learning_rate': 9.811527695892925e-06, 'epoch': 1.04} {'loss': 0.3677, 'learning_rate': 9.811191778023109e-06, 'epoch': 1.04} {'loss': 0.3281, 'learning_rate': 9.810855860366423e-06, 'epoch': 1.04} {'loss': 0.3163, 'learning_rate': 9.810519942923246e-06, 'epoch': 1.04} {'loss': 0.2879, 'learning_rate': 9.810184025693954e-06, 'epoch': 1.04} {'loss': 0.4884, 'learning_rate': 9.809848108678928e-06, 'epoch': 1.04} {'loss': 0.2705, 'learning_rate': 9.809512191878547e-06, 'epoch': 1.04} {'loss': 0.1991, 'learning_rate': 9.80917627529319e-06, 'epoch': 1.04} {'loss': 0.3271, 'learning_rate': 9.808840358923238e-06, 'epoch': 1.04} {'loss': 0.4205, 'learning_rate': 9.808504442769069e-06, 'epoch': 1.04} {'loss': 0.2593, 'learning_rate': 9.808168526831062e-06, 'epoch': 1.04} {'loss': 0.3798, 'learning_rate': 9.807832611109596e-06, 'epoch': 1.04} {'loss': 0.4453, 'learning_rate': 9.80749669560505e-06, 'epoch': 1.04} {'loss': 0.2898, 'learning_rate': 9.807160780317804e-06, 'epoch': 1.04} {'loss': 0.2627, 'learning_rate': 9.806824865248236e-06, 'epoch': 1.04} {'loss': 0.3416, 'learning_rate': 9.806488950396726e-06, 'epoch': 1.04} {'loss': 0.347, 'learning_rate': 9.806153035763656e-06, 'epoch': 1.04} {'loss': 0.36, 'learning_rate': 9.805817121349401e-06, 'epoch': 1.04} {'loss': 0.4017, 'learning_rate': 9.805481207154341e-06, 'epoch': 1.04} {'loss': 0.4237, 'learning_rate': 9.805145293178855e-06, 'epoch': 1.04} {'loss': 0.2592, 'learning_rate': 9.804809379423324e-06, 'epoch': 1.04} {'loss': 0.3751, 'learning_rate': 9.804473465888126e-06, 'epoch': 1.04} {'loss': 0.2585, 'learning_rate': 9.80413755257364e-06, 'epoch': 1.04} {'loss': 0.3435, 'learning_rate': 9.803801639480245e-06, 'epoch': 1.04} {'loss': 0.2291, 'learning_rate': 9.80346572660832e-06, 'epoch': 1.04} {'loss': 0.4361, 'learning_rate': 9.803129813958246e-06, 'epoch': 1.04} {'loss': 0.2351, 'learning_rate': 9.802793901530401e-06, 'epoch': 1.04} {'loss': 0.2104, 'learning_rate': 9.802457989325164e-06, 'epoch': 1.04} {'loss': 0.3078, 'learning_rate': 9.802122077342915e-06, 'epoch': 1.04} {'loss': 0.2979, 'learning_rate': 9.801786165584033e-06, 'epoch': 1.04} {'loss': 0.2498, 'learning_rate': 9.801450254048895e-06, 'epoch': 1.04} {'loss': 0.3684, 'learning_rate': 9.801114342737882e-06, 'epoch': 1.04} {'loss': 0.4068, 'learning_rate': 9.800778431651374e-06, 'epoch': 1.04} {'loss': 0.5098, 'learning_rate': 9.800442520789748e-06, 'epoch': 1.04} {'loss': 0.3295, 'learning_rate': 9.800106610153386e-06, 'epoch': 1.04} {'loss': 0.2842, 'learning_rate': 9.799770699742664e-06, 'epoch': 1.04} {'loss': 0.4527, 'learning_rate': 9.799434789557965e-06, 'epoch': 1.04} {'loss': 0.2015, 'learning_rate': 9.799098879599664e-06, 'epoch': 1.04} {'loss': 0.3786, 'learning_rate': 9.798762969868143e-06, 'epoch': 1.04} {'loss': 0.3507, 'learning_rate': 9.79842706036378e-06, 'epoch': 1.04} {'loss': 0.2636, 'learning_rate': 9.798091151086955e-06, 'epoch': 1.04} {'loss': 0.3522, 'learning_rate': 9.797755242038047e-06, 'epoch': 1.04} {'loss': 0.2797, 'learning_rate': 9.797419333217434e-06, 'epoch': 1.04} {'loss': 0.3558, 'learning_rate': 9.797083424625497e-06, 'epoch': 1.04} {'loss': 0.3548, 'learning_rate': 9.796747516262613e-06, 'epoch': 1.04} {'loss': 0.3953, 'learning_rate': 9.796411608129165e-06, 'epoch': 1.04} {'loss': 0.4015, 'learning_rate': 9.796075700225526e-06, 'epoch': 1.04} {'loss': 0.2565, 'learning_rate': 9.79573979255208e-06, 'epoch': 1.04} {'loss': 0.4667, 'learning_rate': 9.795403885109205e-06, 'epoch': 1.04} {'loss': 0.4706, 'learning_rate': 9.795067977897281e-06, 'epoch': 1.04} {'loss': 0.4259, 'learning_rate': 9.794732070916685e-06, 'epoch': 1.04} {'loss': 0.3652, 'learning_rate': 9.794396164167799e-06, 'epoch': 1.04} {'loss': 0.4332, 'learning_rate': 9.794060257650999e-06, 'epoch': 1.04} {'loss': 0.3645, 'learning_rate': 9.793724351366668e-06, 'epoch': 1.04} {'loss': 0.3322, 'learning_rate': 9.793388445315179e-06, 'epoch': 1.04} {'loss': 0.223, 'learning_rate': 9.793052539496919e-06, 'epoch': 1.04} {'loss': 0.266, 'learning_rate': 9.792716633912264e-06, 'epoch': 1.04} {'loss': 0.3556, 'learning_rate': 9.79238072856159e-06, 'epoch': 1.04} {'loss': 0.332, 'learning_rate': 9.79204482344528e-06, 'epoch': 1.04} {'loss': 0.3104, 'learning_rate': 9.79170891856371e-06, 'epoch': 1.04} {'loss': 0.3082, 'learning_rate': 9.791373013917263e-06, 'epoch': 1.04} {'loss': 0.2755, 'learning_rate': 9.791037109506315e-06, 'epoch': 1.04} {'loss': 0.3919, 'learning_rate': 9.790701205331246e-06, 'epoch': 1.04} {'loss': 0.3717, 'learning_rate': 9.790365301392437e-06, 'epoch': 1.04} {'loss': 0.304, 'learning_rate': 9.790029397690263e-06, 'epoch': 1.04} {'loss': 0.311, 'learning_rate': 9.789693494225108e-06, 'epoch': 1.04} {'loss': 0.32, 'learning_rate': 9.78935759099735e-06, 'epoch': 1.04} {'loss': 0.4404, 'learning_rate': 9.789021688007365e-06, 'epoch': 1.04} {'loss': 0.2178, 'learning_rate': 9.788685785255535e-06, 'epoch': 1.04} {'loss': 0.3417, 'learning_rate': 9.78834988274224e-06, 'epoch': 1.04} {'loss': 0.5218, 'learning_rate': 9.788013980467857e-06, 'epoch': 1.04} {'loss': 0.3916, 'learning_rate': 9.787678078432767e-06, 'epoch': 1.04} {'loss': 0.4394, 'learning_rate': 9.787342176637347e-06, 'epoch': 1.04} {'loss': 0.2875, 'learning_rate': 9.787006275081975e-06, 'epoch': 1.04} {'loss': 0.3216, 'learning_rate': 9.786670373767036e-06, 'epoch': 1.04} {'loss': 0.2864, 'learning_rate': 9.786334472692904e-06, 'epoch': 1.04} {'loss': 0.3001, 'learning_rate': 9.785998571859958e-06, 'epoch': 1.04} {'loss': 0.434, 'learning_rate': 9.78566267126858e-06, 'epoch': 1.04} {'loss': 0.3613, 'learning_rate': 9.78532677091915e-06, 'epoch': 1.04} {'loss': 0.298, 'learning_rate': 9.784990870812043e-06, 'epoch': 1.04} {'loss': 0.3249, 'learning_rate': 9.784654970947642e-06, 'epoch': 1.04} {'loss': 0.2906, 'learning_rate': 9.784319071326324e-06, 'epoch': 1.04} {'loss': 0.3344, 'learning_rate': 9.783983171948471e-06, 'epoch': 1.04} {'loss': 0.3983, 'learning_rate': 9.783647272814458e-06, 'epoch': 1.04} {'loss': 0.4107, 'learning_rate': 9.783311373924665e-06, 'epoch': 1.04} {'loss': 0.3272, 'learning_rate': 9.782975475279468e-06, 'epoch': 1.04} {'loss': 0.2543, 'learning_rate': 9.782639576879256e-06, 'epoch': 1.04} {'loss': 0.3166, 'learning_rate': 9.782303678724402e-06, 'epoch': 1.04} {'loss': 0.399, 'learning_rate': 9.781967780815285e-06, 'epoch': 1.04} {'loss': 0.3319, 'learning_rate': 9.781631883152288e-06, 'epoch': 1.04} {'loss': 0.4405, 'learning_rate': 9.781295985735785e-06, 'epoch': 1.04} {'loss': 0.3223, 'learning_rate': 9.780960088566155e-06, 'epoch': 1.04} {'loss': 0.3828, 'learning_rate': 9.780624191643783e-06, 'epoch': 1.04} {'loss': 0.304, 'learning_rate': 9.780288294969043e-06, 'epoch': 1.04} {'loss': 0.3416, 'learning_rate': 9.779952398542315e-06, 'epoch': 1.04} {'loss': 0.3095, 'learning_rate': 9.77961650236398e-06, 'epoch': 1.04} {'loss': 0.3157, 'learning_rate': 9.779280606434414e-06, 'epoch': 1.04} {'loss': 0.3119, 'learning_rate': 9.778944710754002e-06, 'epoch': 1.04} {'loss': 0.3852, 'learning_rate': 9.778608815323117e-06, 'epoch': 1.04} {'loss': 0.3551, 'learning_rate': 9.77827292014214e-06, 'epoch': 1.04} {'loss': 0.3816, 'learning_rate': 9.77793702521145e-06, 'epoch': 1.04} {'loss': 0.2829, 'learning_rate': 9.77760113053143e-06, 'epoch': 1.04} {'loss': 0.1907, 'learning_rate': 9.777265236102456e-06, 'epoch': 1.04} {'loss': 0.2322, 'learning_rate': 9.776929341924906e-06, 'epoch': 1.04} {'loss': 0.3195, 'learning_rate': 9.77659344799916e-06, 'epoch': 1.04} {'loss': 0.395, 'learning_rate': 9.776257554325597e-06, 'epoch': 1.04} {'loss': 0.442, 'learning_rate': 9.775921660904597e-06, 'epoch': 1.04} {'loss': 0.3634, 'learning_rate': 9.775585767736539e-06, 'epoch': 1.04} {'loss': 0.38, 'learning_rate': 9.775249874821801e-06, 'epoch': 1.04} {'loss': 0.2746, 'learning_rate': 9.774913982160765e-06, 'epoch': 1.04} {'loss': 0.4453, 'learning_rate': 9.774578089753806e-06, 'epoch': 1.04} {'loss': 0.2824, 'learning_rate': 9.774242197601308e-06, 'epoch': 1.05} {'loss': 0.3267, 'learning_rate': 9.773906305703646e-06, 'epoch': 1.05} {'loss': 0.3403, 'learning_rate': 9.773570414061203e-06, 'epoch': 1.05} {'loss': 0.3044, 'learning_rate': 9.773234522674353e-06, 'epoch': 1.05} {'loss': 0.3575, 'learning_rate': 9.77289863154348e-06, 'epoch': 1.05} {'loss': 0.3733, 'learning_rate': 9.772562740668961e-06, 'epoch': 1.05} {'loss': 0.3538, 'learning_rate': 9.772226850051175e-06, 'epoch': 1.05} {'loss': 0.2298, 'learning_rate': 9.771890959690502e-06, 'epoch': 1.05} {'loss': 0.3201, 'learning_rate': 9.771555069587321e-06, 'epoch': 1.05} {'loss': 0.3927, 'learning_rate': 9.77121917974201e-06, 'epoch': 1.05} {'loss': 0.2124, 'learning_rate': 9.77088329015495e-06, 'epoch': 1.05} {'loss': 0.4101, 'learning_rate': 9.770547400826519e-06, 'epoch': 1.05} {'loss': 0.2607, 'learning_rate': 9.770211511757093e-06, 'epoch': 1.05} {'loss': 0.387, 'learning_rate': 9.769875622947058e-06, 'epoch': 1.05} {'loss': 0.2769, 'learning_rate': 9.76953973439679e-06, 'epoch': 1.05} {'loss': 0.1904, 'learning_rate': 9.769203846106667e-06, 'epoch': 1.05} {'loss': 0.4066, 'learning_rate': 9.768867958077068e-06, 'epoch': 1.05} {'loss': 0.2492, 'learning_rate': 9.768532070308374e-06, 'epoch': 1.05} {'loss': 0.2823, 'learning_rate': 9.768196182800965e-06, 'epoch': 1.05} {'loss': 0.3223, 'learning_rate': 9.767860295555215e-06, 'epoch': 1.05} {'loss': 0.4744, 'learning_rate': 9.767524408571509e-06, 'epoch': 1.05} {'loss': 0.2963, 'learning_rate': 9.767188521850223e-06, 'epoch': 1.05} {'loss': 0.4531, 'learning_rate': 9.766852635391736e-06, 'epoch': 1.05} {'loss': 0.2162, 'learning_rate': 9.76651674919643e-06, 'epoch': 1.05} {'loss': 0.2601, 'learning_rate': 9.76618086326468e-06, 'epoch': 1.05} {'loss': 0.2284, 'learning_rate': 9.765844977596868e-06, 'epoch': 1.05} {'loss': 0.3393, 'learning_rate': 9.765509092193375e-06, 'epoch': 1.05} {'loss': 0.3821, 'learning_rate': 9.765173207054575e-06, 'epoch': 1.05} {'loss': 0.218, 'learning_rate': 9.76483732218085e-06, 'epoch': 1.05} {'loss': 0.3271, 'learning_rate': 9.76450143757258e-06, 'epoch': 1.05} {'loss': 0.3187, 'learning_rate': 9.76416555323014e-06, 'epoch': 1.05} {'loss': 0.3148, 'learning_rate': 9.763829669153918e-06, 'epoch': 1.05} {'loss': 0.3799, 'learning_rate': 9.763493785344283e-06, 'epoch': 1.05} {'loss': 0.314, 'learning_rate': 9.76315790180162e-06, 'epoch': 1.05} {'loss': 0.1826, 'learning_rate': 9.762822018526307e-06, 'epoch': 1.05} {'loss': 0.2438, 'learning_rate': 9.762486135518722e-06, 'epoch': 1.05} {'loss': 0.3474, 'learning_rate': 9.762150252779244e-06, 'epoch': 1.05} {'loss': 0.5965, 'learning_rate': 9.761814370308254e-06, 'epoch': 1.05} {'loss': 0.3487, 'learning_rate': 9.76147848810613e-06, 'epoch': 1.05} {'loss': 0.4716, 'learning_rate': 9.761142606173252e-06, 'epoch': 1.05} {'loss': 0.3116, 'learning_rate': 9.760806724509999e-06, 'epoch': 1.05} {'loss': 0.4055, 'learning_rate': 9.76047084311675e-06, 'epoch': 1.05} {'loss': 0.3419, 'learning_rate': 9.760134961993883e-06, 'epoch': 1.05} {'loss': 0.3368, 'learning_rate': 9.759799081141777e-06, 'epoch': 1.05} {'loss': 0.3865, 'learning_rate': 9.759463200560816e-06, 'epoch': 1.05} {'loss': 0.1766, 'learning_rate': 9.759127320251372e-06, 'epoch': 1.05} {'loss': 0.2508, 'learning_rate': 9.758791440213828e-06, 'epoch': 1.05} {'loss': 0.3492, 'learning_rate': 9.758455560448562e-06, 'epoch': 1.05} {'loss': 0.2925, 'learning_rate': 9.758119680955954e-06, 'epoch': 1.05} {'loss': 0.3034, 'learning_rate': 9.757783801736383e-06, 'epoch': 1.05} {'loss': 0.3848, 'learning_rate': 9.757447922790228e-06, 'epoch': 1.05} {'loss': 0.3512, 'learning_rate': 9.757112044117868e-06, 'epoch': 1.05} {'loss': 0.14, 'learning_rate': 9.756776165719684e-06, 'epoch': 1.05} {'loss': 0.261, 'learning_rate': 9.756440287596052e-06, 'epoch': 1.05} {'loss': 0.3942, 'learning_rate': 9.756104409747352e-06, 'epoch': 1.05} {'loss': 0.3617, 'learning_rate': 9.755768532173965e-06, 'epoch': 1.05} {'loss': 0.2731, 'learning_rate': 9.755432654876268e-06, 'epoch': 1.05} {'loss': 0.2479, 'learning_rate': 9.755096777854645e-06, 'epoch': 1.05} {'loss': 0.2342, 'learning_rate': 9.754760901109466e-06, 'epoch': 1.05} {'loss': 0.3216, 'learning_rate': 9.754425024641118e-06, 'epoch': 1.05} {'loss': 0.2573, 'learning_rate': 9.754089148449975e-06, 'epoch': 1.05} {'loss': 0.2545, 'learning_rate': 9.75375327253642e-06, 'epoch': 1.05} {'loss': 0.4821, 'learning_rate': 9.753417396900832e-06, 'epoch': 1.05} {'loss': 0.363, 'learning_rate': 9.753081521543588e-06, 'epoch': 1.05} {'loss': 0.4317, 'learning_rate': 9.752745646465066e-06, 'epoch': 1.05} {'loss': 0.2434, 'learning_rate': 9.75240977166565e-06, 'epoch': 1.05} {'loss': 0.4501, 'learning_rate': 9.752073897145714e-06, 'epoch': 1.05} {'loss': 0.3578, 'learning_rate': 9.75173802290564e-06, 'epoch': 1.05} {'loss': 0.2653, 'learning_rate': 9.751402148945807e-06, 'epoch': 1.05} {'loss': 0.2838, 'learning_rate': 9.751066275266595e-06, 'epoch': 1.05} {'loss': 0.4302, 'learning_rate': 9.750730401868382e-06, 'epoch': 1.05} {'loss': 0.2427, 'learning_rate': 9.750394528751546e-06, 'epoch': 1.05} {'loss': 0.4712, 'learning_rate': 9.750058655916466e-06, 'epoch': 1.05} {'loss': 0.3736, 'learning_rate': 9.749722783363518e-06, 'epoch': 1.05} {'loss': 0.4382, 'learning_rate': 9.74938691109309e-06, 'epoch': 1.05} {'loss': 0.3072, 'learning_rate': 9.749051039105557e-06, 'epoch': 1.05} {'loss': 0.1602, 'learning_rate': 9.748715167401296e-06, 'epoch': 1.05} {'loss': 0.3805, 'learning_rate': 9.74837929598069e-06, 'epoch': 1.05} {'loss': 0.3627, 'learning_rate': 9.748043424844118e-06, 'epoch': 1.05} {'loss': 0.2633, 'learning_rate': 9.747707553991954e-06, 'epoch': 1.05} {'loss': 0.3074, 'learning_rate': 9.74737168342458e-06, 'epoch': 1.05} {'loss': 0.3132, 'learning_rate': 9.747035813142375e-06, 'epoch': 1.05} {'loss': 0.3498, 'learning_rate': 9.74669994314572e-06, 'epoch': 1.05} {'loss': 0.4501, 'learning_rate': 9.746364073434992e-06, 'epoch': 1.05} {'loss': 0.332, 'learning_rate': 9.74602820401057e-06, 'epoch': 1.05} {'loss': 0.2599, 'learning_rate': 9.745692334872834e-06, 'epoch': 1.05} {'loss': 0.2306, 'learning_rate': 9.745356466022164e-06, 'epoch': 1.05} {'loss': 0.4211, 'learning_rate': 9.745020597458937e-06, 'epoch': 1.05} {'loss': 0.2816, 'learning_rate': 9.744684729183533e-06, 'epoch': 1.05} {'loss': 0.3529, 'learning_rate': 9.744348861196333e-06, 'epoch': 1.05} {'loss': 0.322, 'learning_rate': 9.744012993497713e-06, 'epoch': 1.05} {'loss': 0.3141, 'learning_rate': 9.743677126088057e-06, 'epoch': 1.05} {'loss': 0.3704, 'learning_rate': 9.743341258967738e-06, 'epoch': 1.05} {'loss': 0.2071, 'learning_rate': 9.743005392137139e-06, 'epoch': 1.05} {'loss': 0.2932, 'learning_rate': 9.742669525596637e-06, 'epoch': 1.05} {'loss': 0.3083, 'learning_rate': 9.742333659346611e-06, 'epoch': 1.05} {'loss': 0.4033, 'learning_rate': 9.741997793387443e-06, 'epoch': 1.05} {'loss': 0.1953, 'learning_rate': 9.74166192771951e-06, 'epoch': 1.05} {'loss': 0.4728, 'learning_rate': 9.74132606234319e-06, 'epoch': 1.05} {'loss': 0.468, 'learning_rate': 9.740990197258865e-06, 'epoch': 1.05} {'loss': 0.2637, 'learning_rate': 9.740654332466914e-06, 'epoch': 1.05} {'loss': 0.3891, 'learning_rate': 9.740318467967714e-06, 'epoch': 1.05} {'loss': 0.4123, 'learning_rate': 9.739982603761645e-06, 'epoch': 1.05} {'loss': 0.4441, 'learning_rate': 9.739646739849086e-06, 'epoch': 1.05} {'loss': 0.4154, 'learning_rate': 9.73931087623042e-06, 'epoch': 1.05} {'loss': 0.3958, 'learning_rate': 9.738975012906018e-06, 'epoch': 1.05} {'loss': 0.3003, 'learning_rate': 9.738639149876265e-06, 'epoch': 1.05} {'loss': 0.3187, 'learning_rate': 9.738303287141538e-06, 'epoch': 1.05} {'loss': 0.4454, 'learning_rate': 9.737967424702217e-06, 'epoch': 1.05} {'loss': 0.5135, 'learning_rate': 9.73763156255868e-06, 'epoch': 1.05} {'loss': 0.5056, 'learning_rate': 9.73729570071131e-06, 'epoch': 1.05} {'loss': 0.3857, 'learning_rate': 9.73695983916048e-06, 'epoch': 1.05} {'loss': 0.436, 'learning_rate': 9.736623977906574e-06, 'epoch': 1.05} {'loss': 0.4066, 'learning_rate': 9.736288116949969e-06, 'epoch': 1.05} {'loss': 0.5349, 'learning_rate': 9.735952256291045e-06, 'epoch': 1.05} {'loss': 0.3702, 'learning_rate': 9.73561639593018e-06, 'epoch': 1.05} {'loss': 0.3778, 'learning_rate': 9.735280535867754e-06, 'epoch': 1.05} {'loss': 0.3452, 'learning_rate': 9.734944676104147e-06, 'epoch': 1.05} {'loss': 0.3275, 'learning_rate': 9.734608816639737e-06, 'epoch': 1.05} {'loss': 0.2963, 'learning_rate': 9.734272957474901e-06, 'epoch': 1.05} {'loss': 0.3873, 'learning_rate': 9.733937098610022e-06, 'epoch': 1.05} {'loss': 0.3227, 'learning_rate': 9.733601240045479e-06, 'epoch': 1.05} {'loss': 0.297, 'learning_rate': 9.733265381781646e-06, 'epoch': 1.05} {'loss': 0.3179, 'learning_rate': 9.732929523818907e-06, 'epoch': 1.05} {'loss': 0.2967, 'learning_rate': 9.73259366615764e-06, 'epoch': 1.05} {'loss': 0.2666, 'learning_rate': 9.732257808798225e-06, 'epoch': 1.05} {'loss': 0.4107, 'learning_rate': 9.731921951741037e-06, 'epoch': 1.05} {'loss': 0.2767, 'learning_rate': 9.731586094986461e-06, 'epoch': 1.05} {'loss': 0.4538, 'learning_rate': 9.731250238534872e-06, 'epoch': 1.05} {'loss': 0.1778, 'learning_rate': 9.730914382386651e-06, 'epoch': 1.05} {'loss': 0.4351, 'learning_rate': 9.730578526542178e-06, 'epoch': 1.05} {'loss': 0.286, 'learning_rate': 9.730242671001829e-06, 'epoch': 1.05} {'loss': 0.3416, 'learning_rate': 9.729906815765984e-06, 'epoch': 1.05} {'loss': 0.3941, 'learning_rate': 9.729570960835024e-06, 'epoch': 1.05} {'loss': 0.4568, 'learning_rate': 9.729235106209326e-06, 'epoch': 1.05} {'loss': 0.5061, 'learning_rate': 9.72889925188927e-06, 'epoch': 1.05} {'loss': 0.2862, 'learning_rate': 9.728563397875237e-06, 'epoch': 1.05} {'loss': 0.3976, 'learning_rate': 9.728227544167603e-06, 'epoch': 1.05} {'loss': 0.336, 'learning_rate': 9.727891690766747e-06, 'epoch': 1.05} {'loss': 0.4518, 'learning_rate': 9.727555837673052e-06, 'epoch': 1.05} {'loss': 0.1934, 'learning_rate': 9.727219984886893e-06, 'epoch': 1.05} {'loss': 0.2796, 'learning_rate': 9.726884132408652e-06, 'epoch': 1.05} {'loss': 0.3415, 'learning_rate': 9.726548280238706e-06, 'epoch': 1.05} {'loss': 0.2277, 'learning_rate': 9.726212428377438e-06, 'epoch': 1.05} {'loss': 0.4521, 'learning_rate': 9.725876576825221e-06, 'epoch': 1.05} {'loss': 0.4416, 'learning_rate': 9.725540725582436e-06, 'epoch': 1.05} {'loss': 0.3128, 'learning_rate': 9.725204874649466e-06, 'epoch': 1.05} {'loss': 0.3952, 'learning_rate': 9.724869024026687e-06, 'epoch': 1.05} {'loss': 0.2254, 'learning_rate': 9.724533173714477e-06, 'epoch': 1.05} {'loss': 0.3491, 'learning_rate': 9.724197323713217e-06, 'epoch': 1.05} {'loss': 0.2695, 'learning_rate': 9.723861474023287e-06, 'epoch': 1.05} {'loss': 0.3095, 'learning_rate': 9.723525624645063e-06, 'epoch': 1.05} {'loss': 0.3652, 'learning_rate': 9.723189775578927e-06, 'epoch': 1.05} {'loss': 0.3877, 'learning_rate': 9.722853926825258e-06, 'epoch': 1.05} {'loss': 0.4939, 'learning_rate': 9.722518078384434e-06, 'epoch': 1.05} {'loss': 0.405, 'learning_rate': 9.722182230256832e-06, 'epoch': 1.05} {'loss': 0.1255, 'learning_rate': 9.721846382442836e-06, 'epoch': 1.05} {'loss': 0.4699, 'learning_rate': 9.721510534942823e-06, 'epoch': 1.05} {'loss': 0.3346, 'learning_rate': 9.721174687757172e-06, 'epoch': 1.05} {'loss': 0.3688, 'learning_rate': 9.72083884088626e-06, 'epoch': 1.05} {'loss': 0.4154, 'learning_rate': 9.720502994330467e-06, 'epoch': 1.05} {'loss': 0.3268, 'learning_rate': 9.720167148090176e-06, 'epoch': 1.05} {'loss': 0.2878, 'learning_rate': 9.71983130216576e-06, 'epoch': 1.05} {'loss': 0.2755, 'learning_rate': 9.719495456557601e-06, 'epoch': 1.05} {'loss': 0.1291, 'learning_rate': 9.71915961126608e-06, 'epoch': 1.05} {'loss': 0.2878, 'learning_rate': 9.718823766291573e-06, 'epoch': 1.05} {'loss': 0.2478, 'learning_rate': 9.718487921634462e-06, 'epoch': 1.05} {'loss': 0.31, 'learning_rate': 9.718152077295124e-06, 'epoch': 1.05} {'loss': 0.4216, 'learning_rate': 9.717816233273938e-06, 'epoch': 1.05} {'loss': 0.3067, 'learning_rate': 9.717480389571286e-06, 'epoch': 1.05} {'loss': 0.2156, 'learning_rate': 9.717144546187545e-06, 'epoch': 1.05} {'loss': 0.3267, 'learning_rate': 9.716808703123093e-06, 'epoch': 1.05} {'loss': 0.2394, 'learning_rate': 9.716472860378305e-06, 'epoch': 1.05} {'loss': 0.3557, 'learning_rate': 9.71613701795357e-06, 'epoch': 1.05} {'loss': 0.4571, 'learning_rate': 9.715801175849261e-06, 'epoch': 1.05} {'loss': 0.4616, 'learning_rate': 9.71546533406576e-06, 'epoch': 1.05} {'loss': 0.3787, 'learning_rate': 9.715129492603444e-06, 'epoch': 1.05} {'loss': 0.3679, 'learning_rate': 9.714793651462696e-06, 'epoch': 1.05} {'loss': 0.2622, 'learning_rate': 9.714457810643887e-06, 'epoch': 1.05} {'loss': 0.3507, 'learning_rate': 9.714121970147404e-06, 'epoch': 1.05} {'loss': 0.3558, 'learning_rate': 9.713786129973621e-06, 'epoch': 1.05} {'loss': 0.2873, 'learning_rate': 9.713450290122919e-06, 'epoch': 1.05} {'loss': 0.4583, 'learning_rate': 9.713114450595678e-06, 'epoch': 1.05} {'loss': 0.3008, 'learning_rate': 9.712778611392275e-06, 'epoch': 1.05} {'loss': 0.2912, 'learning_rate': 9.712442772513091e-06, 'epoch': 1.05} {'loss': 0.3488, 'learning_rate': 9.712106933958505e-06, 'epoch': 1.05} {'loss': 0.3043, 'learning_rate': 9.711771095728895e-06, 'epoch': 1.05} {'loss': 0.2916, 'learning_rate': 9.71143525782464e-06, 'epoch': 1.05} {'loss': 0.4241, 'learning_rate': 9.71109942024612e-06, 'epoch': 1.05} {'loss': 0.3881, 'learning_rate': 9.710763582993713e-06, 'epoch': 1.05} {'loss': 0.258, 'learning_rate': 9.710427746067802e-06, 'epoch': 1.05} {'loss': 0.3811, 'learning_rate': 9.710091909468763e-06, 'epoch': 1.05} {'loss': 0.3281, 'learning_rate': 9.709756073196973e-06, 'epoch': 1.05} {'loss': 0.3939, 'learning_rate': 9.709420237252814e-06, 'epoch': 1.05} {'loss': 0.3048, 'learning_rate': 9.709084401636662e-06, 'epoch': 1.05} {'loss': 0.4059, 'learning_rate': 9.7087485663489e-06, 'epoch': 1.05} {'loss': 0.4223, 'learning_rate': 9.708412731389905e-06, 'epoch': 1.05} {'loss': 0.4482, 'learning_rate': 9.708076896760058e-06, 'epoch': 1.05} {'loss': 0.4147, 'learning_rate': 9.707741062459736e-06, 'epoch': 1.05} {'loss': 0.4022, 'learning_rate': 9.707405228489318e-06, 'epoch': 1.05} {'loss': 0.4467, 'learning_rate': 9.707069394849185e-06, 'epoch': 1.05} {'loss': 0.3825, 'learning_rate': 9.706733561539715e-06, 'epoch': 1.05} {'loss': 0.3369, 'learning_rate': 9.706397728561286e-06, 'epoch': 1.05} {'loss': 0.2344, 'learning_rate': 9.70606189591428e-06, 'epoch': 1.05} {'loss': 0.412, 'learning_rate': 9.705726063599073e-06, 'epoch': 1.05} {'loss': 0.2456, 'learning_rate': 9.705390231616045e-06, 'epoch': 1.05} {'loss': 0.3725, 'learning_rate': 9.705054399965575e-06, 'epoch': 1.05} {'loss': 0.3615, 'learning_rate': 9.704718568648044e-06, 'epoch': 1.05} {'loss': 0.323, 'learning_rate': 9.704382737663828e-06, 'epoch': 1.05} {'loss': 0.3373, 'learning_rate': 9.704046907013308e-06, 'epoch': 1.05} {'loss': 0.458, 'learning_rate': 9.703711076696863e-06, 'epoch': 1.05} {'loss': 0.1732, 'learning_rate': 9.703375246714872e-06, 'epoch': 1.05} {'loss': 0.4186, 'learning_rate': 9.703039417067714e-06, 'epoch': 1.05} {'loss': 0.3516, 'learning_rate': 9.702703587755767e-06, 'epoch': 1.05} {'loss': 0.3793, 'learning_rate': 9.702367758779412e-06, 'epoch': 1.05} {'loss': 0.4326, 'learning_rate': 9.702031930139027e-06, 'epoch': 1.05} {'loss': 0.3353, 'learning_rate': 9.701696101834991e-06, 'epoch': 1.05} {'loss': 0.3413, 'learning_rate': 9.701360273867687e-06, 'epoch': 1.05} {'loss': 0.2765, 'learning_rate': 9.701024446237487e-06, 'epoch': 1.05} {'loss': 0.4205, 'learning_rate': 9.700688618944773e-06, 'epoch': 1.05} {'loss': 0.3429, 'learning_rate': 9.700352791989927e-06, 'epoch': 1.05} {'loss': 0.303, 'learning_rate': 9.700016965373324e-06, 'epoch': 1.05} {'loss': 0.438, 'learning_rate': 9.699681139095344e-06, 'epoch': 1.05} {'loss': 0.2566, 'learning_rate': 9.699345313156368e-06, 'epoch': 1.05} {'loss': 0.1796, 'learning_rate': 9.699009487556773e-06, 'epoch': 1.05} {'loss': 0.2556, 'learning_rate': 9.69867366229694e-06, 'epoch': 1.05} {'loss': 0.4922, 'learning_rate': 9.698337837377247e-06, 'epoch': 1.05} {'loss': 0.3153, 'learning_rate': 9.698002012798073e-06, 'epoch': 1.05} {'loss': 0.3251, 'learning_rate': 9.697666188559797e-06, 'epoch': 1.05} {'loss': 0.381, 'learning_rate': 9.6973303646628e-06, 'epoch': 1.05} {'loss': 0.3459, 'learning_rate': 9.696994541107461e-06, 'epoch': 1.05} {'loss': 0.3753, 'learning_rate': 9.696658717894153e-06, 'epoch': 1.05} {'loss': 0.3917, 'learning_rate': 9.696322895023263e-06, 'epoch': 1.05} {'loss': 0.3028, 'learning_rate': 9.695987072495166e-06, 'epoch': 1.05} {'loss': 0.2992, 'learning_rate': 9.69565125031024e-06, 'epoch': 1.05} {'loss': 0.4728, 'learning_rate': 9.695315428468866e-06, 'epoch': 1.05} {'loss': 0.2252, 'learning_rate': 9.694979606971425e-06, 'epoch': 1.05} {'loss': 0.2392, 'learning_rate': 9.694643785818292e-06, 'epoch': 1.05} {'loss': 0.4608, 'learning_rate': 9.69430796500985e-06, 'epoch': 1.05} {'loss': 0.4035, 'learning_rate': 9.693972144546475e-06, 'epoch': 1.05} {'loss': 0.3106, 'learning_rate': 9.693636324428547e-06, 'epoch': 1.05} {'loss': 0.3408, 'learning_rate': 9.693300504656446e-06, 'epoch': 1.05} {'loss': 0.4139, 'learning_rate': 9.692964685230549e-06, 'epoch': 1.05} {'loss': 0.3484, 'learning_rate': 9.69262886615124e-06, 'epoch': 1.05} {'loss': 0.5756, 'learning_rate': 9.692293047418893e-06, 'epoch': 1.05} {'loss': 0.3354, 'learning_rate': 9.691957229033888e-06, 'epoch': 1.05} {'loss': 0.1898, 'learning_rate': 9.691621410996603e-06, 'epoch': 1.05} {'loss': 0.2169, 'learning_rate': 9.691285593307422e-06, 'epoch': 1.05} {'loss': 0.2747, 'learning_rate': 9.690949775966718e-06, 'epoch': 1.05} {'loss': 0.4757, 'learning_rate': 9.690613958974876e-06, 'epoch': 1.05} {'loss': 0.4084, 'learning_rate': 9.69027814233227e-06, 'epoch': 1.05} {'loss': 0.272, 'learning_rate': 9.68994232603928e-06, 'epoch': 1.05} {'loss': 0.3103, 'learning_rate': 9.689606510096286e-06, 'epoch': 1.05} {'loss': 0.3165, 'learning_rate': 9.689270694503669e-06, 'epoch': 1.05} {'loss': 0.3882, 'learning_rate': 9.688934879261807e-06, 'epoch': 1.05} {'loss': 0.3891, 'learning_rate': 9.688599064371077e-06, 'epoch': 1.05} {'loss': 0.3133, 'learning_rate': 9.688263249831862e-06, 'epoch': 1.05} {'loss': 0.273, 'learning_rate': 9.687927435644535e-06, 'epoch': 1.05} {'loss': 0.3564, 'learning_rate': 9.68759162180948e-06, 'epoch': 1.05} {'loss': 0.2335, 'learning_rate': 9.687255808327073e-06, 'epoch': 1.05} {'loss': 0.2758, 'learning_rate': 9.686919995197698e-06, 'epoch': 1.05} {'loss': 0.3695, 'learning_rate': 9.68658418242173e-06, 'epoch': 1.05} {'loss': 0.4489, 'learning_rate': 9.686248369999546e-06, 'epoch': 1.05} {'loss': 0.3585, 'learning_rate': 9.68591255793153e-06, 'epoch': 1.05} {'loss': 0.5467, 'learning_rate': 9.685576746218058e-06, 'epoch': 1.05} {'loss': 0.1865, 'learning_rate': 9.685240934859511e-06, 'epoch': 1.05} {'loss': 0.4202, 'learning_rate': 9.684905123856268e-06, 'epoch': 1.05} {'loss': 0.2983, 'learning_rate': 9.684569313208705e-06, 'epoch': 1.05} {'loss': 0.3018, 'learning_rate': 9.684233502917205e-06, 'epoch': 1.05} {'loss': 0.3263, 'learning_rate': 9.683897692982148e-06, 'epoch': 1.05} {'loss': 0.2516, 'learning_rate': 9.683561883403907e-06, 'epoch': 1.05} {'loss': 0.2563, 'learning_rate': 9.683226074182863e-06, 'epoch': 1.05} {'loss': 0.3447, 'learning_rate': 9.682890265319394e-06, 'epoch': 1.05} {'loss': 0.3649, 'learning_rate': 9.682554456813885e-06, 'epoch': 1.05} {'loss': 0.3595, 'learning_rate': 9.682218648666712e-06, 'epoch': 1.05} {'loss': 0.4253, 'learning_rate': 9.681882840878255e-06, 'epoch': 1.05} {'loss': 0.3513, 'learning_rate': 9.68154703344889e-06, 'epoch': 1.05} {'loss': 0.2911, 'learning_rate': 9.681211226379001e-06, 'epoch': 1.05} {'loss': 0.3298, 'learning_rate': 9.680875419668961e-06, 'epoch': 1.05} {'loss': 0.4159, 'learning_rate': 9.680539613319154e-06, 'epoch': 1.05} {'loss': 0.2235, 'learning_rate': 9.680203807329956e-06, 'epoch': 1.05} {'loss': 0.4173, 'learning_rate': 9.679868001701746e-06, 'epoch': 1.05} {'loss': 0.2301, 'learning_rate': 9.679532196434905e-06, 'epoch': 1.05} {'loss': 0.3351, 'learning_rate': 9.67919639152981e-06, 'epoch': 1.05} {'loss': 0.3947, 'learning_rate': 9.678860586986843e-06, 'epoch': 1.05} {'loss': 0.4487, 'learning_rate': 9.67852478280638e-06, 'epoch': 1.05} {'loss': 0.3827, 'learning_rate': 9.678188978988802e-06, 'epoch': 1.05} {'loss': 0.3876, 'learning_rate': 9.677853175534487e-06, 'epoch': 1.05} {'loss': 0.2766, 'learning_rate': 9.677517372443816e-06, 'epoch': 1.05} {'loss': 0.2295, 'learning_rate': 9.677181569717165e-06, 'epoch': 1.05} {'loss': 0.4817, 'learning_rate': 9.676845767354916e-06, 'epoch': 1.05} {'loss': 0.1542, 'learning_rate': 9.676509965357447e-06, 'epoch': 1.05} {'loss': 0.3463, 'learning_rate': 9.676174163725136e-06, 'epoch': 1.05} {'loss': 0.2647, 'learning_rate': 9.675838362458362e-06, 'epoch': 1.05} {'loss': 0.2673, 'learning_rate': 9.675502561557505e-06, 'epoch': 1.05} {'loss': 0.3827, 'learning_rate': 9.675166761022944e-06, 'epoch': 1.05} {'loss': 0.405, 'learning_rate': 9.67483096085506e-06, 'epoch': 1.05} {'loss': 0.3954, 'learning_rate': 9.674495161054226e-06, 'epoch': 1.05} {'loss': 0.3617, 'learning_rate': 9.674159361620828e-06, 'epoch': 1.05} {'loss': 0.4105, 'learning_rate': 9.67382356255524e-06, 'epoch': 1.05} {'loss': 0.3334, 'learning_rate': 9.673487763857845e-06, 'epoch': 1.05} {'loss': 0.3737, 'learning_rate': 9.67315196552902e-06, 'epoch': 1.05} {'loss': 0.3807, 'learning_rate': 9.672816167569143e-06, 'epoch': 1.05} {'loss': 0.4538, 'learning_rate': 9.672480369978597e-06, 'epoch': 1.05} {'loss': 0.2891, 'learning_rate': 9.672144572757757e-06, 'epoch': 1.05} {'loss': 0.3584, 'learning_rate': 9.671808775907004e-06, 'epoch': 1.05} {'loss': 0.3841, 'learning_rate': 9.671472979426715e-06, 'epoch': 1.05} {'loss': 0.4515, 'learning_rate': 9.67113718331727e-06, 'epoch': 1.05} {'loss': 0.2427, 'learning_rate': 9.670801387579051e-06, 'epoch': 1.05} {'loss': 0.3211, 'learning_rate': 9.670465592212432e-06, 'epoch': 1.05} {'loss': 0.382, 'learning_rate': 9.670129797217796e-06, 'epoch': 1.05} {'loss': 0.3554, 'learning_rate': 9.669794002595521e-06, 'epoch': 1.05} {'loss': 0.3242, 'learning_rate': 9.669458208345985e-06, 'epoch': 1.05} {'loss': 0.3195, 'learning_rate': 9.66912241446957e-06, 'epoch': 1.05} {'loss': 0.2811, 'learning_rate': 9.66878662096665e-06, 'epoch': 1.05} {'loss': 0.3506, 'learning_rate': 9.668450827837607e-06, 'epoch': 1.05} {'loss': 0.4113, 'learning_rate': 9.668115035082825e-06, 'epoch': 1.05} {'loss': 0.3437, 'learning_rate': 9.667779242702673e-06, 'epoch': 1.05} {'loss': 0.3558, 'learning_rate': 9.667443450697537e-06, 'epoch': 1.05} {'loss': 0.1907, 'learning_rate': 9.667107659067793e-06, 'epoch': 1.05} {'loss': 0.2478, 'learning_rate': 9.66677186781382e-06, 'epoch': 1.05} {'loss': 0.3637, 'learning_rate': 9.666436076936e-06, 'epoch': 1.05} {'loss': 0.2225, 'learning_rate': 9.66610028643471e-06, 'epoch': 1.05} {'loss': 0.3342, 'learning_rate': 9.665764496310329e-06, 'epoch': 1.05} {'loss': 0.2859, 'learning_rate': 9.665428706563237e-06, 'epoch': 1.05} {'loss': 0.2935, 'learning_rate': 9.665092917193813e-06, 'epoch': 1.05} {'loss': 0.4492, 'learning_rate': 9.664757128202433e-06, 'epoch': 1.05} {'loss': 0.3066, 'learning_rate': 9.664421339589479e-06, 'epoch': 1.05} {'loss': 0.3023, 'learning_rate': 9.664085551355331e-06, 'epoch': 1.05} {'loss': 0.37, 'learning_rate': 9.663749763500367e-06, 'epoch': 1.05} {'loss': 0.3988, 'learning_rate': 9.663413976024964e-06, 'epoch': 1.05} {'loss': 0.4019, 'learning_rate': 9.663078188929505e-06, 'epoch': 1.05} {'loss': 0.6515, 'learning_rate': 9.662742402214364e-06, 'epoch': 1.05} {'loss': 0.3065, 'learning_rate': 9.662406615879922e-06, 'epoch': 1.05} {'loss': 0.4077, 'learning_rate': 9.662070829926561e-06, 'epoch': 1.05} {'loss': 0.3185, 'learning_rate': 9.661735044354657e-06, 'epoch': 1.05} {'loss': 0.399, 'learning_rate': 9.661399259164588e-06, 'epoch': 1.05} {'loss': 0.4199, 'learning_rate': 9.661063474356738e-06, 'epoch': 1.05} {'loss': 0.4099, 'learning_rate': 9.660727689931481e-06, 'epoch': 1.05} {'loss': 0.3226, 'learning_rate': 9.660391905889198e-06, 'epoch': 1.05} {'loss': 0.3739, 'learning_rate': 9.660056122230268e-06, 'epoch': 1.05} {'loss': 0.1806, 'learning_rate': 9.65972033895507e-06, 'epoch': 1.05} {'loss': 0.2908, 'learning_rate': 9.659384556063986e-06, 'epoch': 1.05} {'loss': 0.4036, 'learning_rate': 9.65904877355739e-06, 'epoch': 1.05} {'loss': 0.4728, 'learning_rate': 9.658712991435662e-06, 'epoch': 1.05} {'loss': 0.3631, 'learning_rate': 9.658377209699182e-06, 'epoch': 1.05} {'loss': 0.4037, 'learning_rate': 9.65804142834833e-06, 'epoch': 1.05} {'loss': 0.362, 'learning_rate': 9.657705647383483e-06, 'epoch': 1.05} {'loss': 0.3082, 'learning_rate': 9.657369866805022e-06, 'epoch': 1.05} {'loss': 0.3743, 'learning_rate': 9.657034086613326e-06, 'epoch': 1.05} {'loss': 0.3449, 'learning_rate': 9.656698306808772e-06, 'epoch': 1.05} {'loss': 0.2532, 'learning_rate': 9.656362527391741e-06, 'epoch': 1.05} {'loss': 0.3471, 'learning_rate': 9.656026748362611e-06, 'epoch': 1.05} {'loss': 0.333, 'learning_rate': 9.655690969721762e-06, 'epoch': 1.05} {'loss': 0.2251, 'learning_rate': 9.655355191469573e-06, 'epoch': 1.05} {'loss': 0.2811, 'learning_rate': 9.655019413606424e-06, 'epoch': 1.05} {'loss': 0.3498, 'learning_rate': 9.65468363613269e-06, 'epoch': 1.05} {'loss': 0.3097, 'learning_rate': 9.654347859048752e-06, 'epoch': 1.05} {'loss': 0.3497, 'learning_rate': 9.65401208235499e-06, 'epoch': 1.05} {'loss': 0.2456, 'learning_rate': 9.653676306051782e-06, 'epoch': 1.05} {'loss': 0.2312, 'learning_rate': 9.65334053013951e-06, 'epoch': 1.05} {'loss': 0.3544, 'learning_rate': 9.653004754618547e-06, 'epoch': 1.05} {'loss': 0.3553, 'learning_rate': 9.652668979489279e-06, 'epoch': 1.05} {'loss': 0.4075, 'learning_rate': 9.65233320475208e-06, 'epoch': 1.05} {'loss': 0.2199, 'learning_rate': 9.65199743040733e-06, 'epoch': 1.05} {'loss': 0.1978, 'learning_rate': 9.65166165645541e-06, 'epoch': 1.05} {'loss': 0.3383, 'learning_rate': 9.651325882896699e-06, 'epoch': 1.05} {'loss': 0.1425, 'learning_rate': 9.650990109731572e-06, 'epoch': 1.05} {'loss': 0.4251, 'learning_rate': 9.650654336960414e-06, 'epoch': 1.05} {'loss': 0.499, 'learning_rate': 9.650318564583598e-06, 'epoch': 1.05} {'loss': 0.5336, 'learning_rate': 9.649982792601507e-06, 'epoch': 1.05} {'loss': 0.403, 'learning_rate': 9.649647021014515e-06, 'epoch': 1.05} {'loss': 0.3257, 'learning_rate': 9.649311249823007e-06, 'epoch': 1.05} {'loss': 0.5245, 'learning_rate': 9.648975479027363e-06, 'epoch': 1.05} {'loss': 0.4874, 'learning_rate': 9.648639708627958e-06, 'epoch': 1.05} {'loss': 0.2047, 'learning_rate': 9.64830393862517e-06, 'epoch': 1.05} {'loss': 0.3011, 'learning_rate': 9.647968169019384e-06, 'epoch': 1.05} {'loss': 0.2056, 'learning_rate': 9.64763239981097e-06, 'epoch': 1.05} {'loss': 0.1777, 'learning_rate': 9.647296631000315e-06, 'epoch': 1.05} {'loss': 0.4259, 'learning_rate': 9.646960862587796e-06, 'epoch': 1.05} {'loss': 0.3237, 'learning_rate': 9.646625094573788e-06, 'epoch': 1.05} {'loss': 0.2768, 'learning_rate': 9.646289326958674e-06, 'epoch': 1.05} {'loss': 0.3323, 'learning_rate': 9.645953559742833e-06, 'epoch': 1.05} {'loss': 0.3365, 'learning_rate': 9.645617792926642e-06, 'epoch': 1.05} {'loss': 0.3872, 'learning_rate': 9.645282026510483e-06, 'epoch': 1.05} {'loss': 0.3297, 'learning_rate': 9.644946260494731e-06, 'epoch': 1.05} {'loss': 0.2282, 'learning_rate': 9.644610494879768e-06, 'epoch': 1.05} {'loss': 0.4362, 'learning_rate': 9.644274729665972e-06, 'epoch': 1.05} {'loss': 0.252, 'learning_rate': 9.643938964853722e-06, 'epoch': 1.05} {'loss': 0.2049, 'learning_rate': 9.6436032004434e-06, 'epoch': 1.05} {'loss': 0.3691, 'learning_rate': 9.643267436435379e-06, 'epoch': 1.05} {'loss': 0.4185, 'learning_rate': 9.642931672830042e-06, 'epoch': 1.05} {'loss': 0.4542, 'learning_rate': 9.642595909627768e-06, 'epoch': 1.05} {'loss': 0.4748, 'learning_rate': 9.642260146828934e-06, 'epoch': 1.05} {'loss': 0.3672, 'learning_rate': 9.641924384433922e-06, 'epoch': 1.05} {'loss': 0.4905, 'learning_rate': 9.641588622443108e-06, 'epoch': 1.05} {'loss': 0.4104, 'learning_rate': 9.641252860856871e-06, 'epoch': 1.05} {'loss': 0.4964, 'learning_rate': 9.640917099675592e-06, 'epoch': 1.05} {'loss': 0.2126, 'learning_rate': 9.640581338899651e-06, 'epoch': 1.05} {'loss': 0.4285, 'learning_rate': 9.640245578529425e-06, 'epoch': 1.05} {'loss': 0.3123, 'learning_rate': 9.639909818565292e-06, 'epoch': 1.05} {'loss': 0.2847, 'learning_rate': 9.639574059007633e-06, 'epoch': 1.05} {'loss': 0.4925, 'learning_rate': 9.639238299856827e-06, 'epoch': 1.05} {'loss': 0.4038, 'learning_rate': 9.638902541113253e-06, 'epoch': 1.05} {'loss': 0.284, 'learning_rate': 9.638566782777287e-06, 'epoch': 1.05} {'loss': 0.299, 'learning_rate': 9.638231024849313e-06, 'epoch': 1.05} {'loss': 0.2587, 'learning_rate': 9.637895267329706e-06, 'epoch': 1.05} {'loss': 0.2613, 'learning_rate': 9.637559510218846e-06, 'epoch': 1.05} {'loss': 0.399, 'learning_rate': 9.637223753517113e-06, 'epoch': 1.05} {'loss': 0.3648, 'learning_rate': 9.636887997224884e-06, 'epoch': 1.05} {'loss': 0.3362, 'learning_rate': 9.63655224134254e-06, 'epoch': 1.05} {'loss': 0.3374, 'learning_rate': 9.63621648587046e-06, 'epoch': 1.05} {'loss': 0.3082, 'learning_rate': 9.635880730809021e-06, 'epoch': 1.05} {'loss': 0.2917, 'learning_rate': 9.635544976158605e-06, 'epoch': 1.05} {'loss': 0.314, 'learning_rate': 9.63520922191959e-06, 'epoch': 1.05} {'loss': 0.3368, 'learning_rate': 9.634873468092354e-06, 'epoch': 1.05} {'loss': 0.3221, 'learning_rate': 9.634537714677277e-06, 'epoch': 1.05} {'loss': 0.3964, 'learning_rate': 9.634201961674736e-06, 'epoch': 1.05} {'loss': 0.3939, 'learning_rate': 9.633866209085112e-06, 'epoch': 1.05} {'loss': 0.3251, 'learning_rate': 9.633530456908783e-06, 'epoch': 1.05} {'loss': 0.2237, 'learning_rate': 9.633194705146128e-06, 'epoch': 1.05} {'loss': 0.432, 'learning_rate': 9.632858953797527e-06, 'epoch': 1.05} {'loss': 0.3808, 'learning_rate': 9.632523202863358e-06, 'epoch': 1.05} {'loss': 0.4116, 'learning_rate': 9.632187452344002e-06, 'epoch': 1.05} {'loss': 0.3423, 'learning_rate': 9.631851702239834e-06, 'epoch': 1.05} {'loss': 0.4059, 'learning_rate': 9.631515952551237e-06, 'epoch': 1.05} {'loss': 0.3878, 'learning_rate': 9.631180203278589e-06, 'epoch': 1.05} {'loss': 0.5419, 'learning_rate': 9.630844454422266e-06, 'epoch': 1.05} {'loss': 0.4529, 'learning_rate': 9.630508705982655e-06, 'epoch': 1.05} {'loss': 0.455, 'learning_rate': 9.630172957960124e-06, 'epoch': 1.05} {'loss': 0.2626, 'learning_rate': 9.629837210355059e-06, 'epoch': 1.05} {'loss': 0.3803, 'learning_rate': 9.629501463167837e-06, 'epoch': 1.05} {'loss': 0.2635, 'learning_rate': 9.629165716398837e-06, 'epoch': 1.05} {'loss': 0.3661, 'learning_rate': 9.62882997004844e-06, 'epoch': 1.05} {'loss': 0.394, 'learning_rate': 9.628494224117021e-06, 'epoch': 1.05} {'loss': 0.3551, 'learning_rate': 9.628158478604963e-06, 'epoch': 1.05} {'loss': 0.4267, 'learning_rate': 9.627822733512643e-06, 'epoch': 1.05} {'loss': 0.3185, 'learning_rate': 9.62748698884044e-06, 'epoch': 1.05} {'loss': 0.3713, 'learning_rate': 9.627151244588733e-06, 'epoch': 1.05} {'loss': 0.5154, 'learning_rate': 9.626815500757903e-06, 'epoch': 1.05} {'loss': 0.2737, 'learning_rate': 9.626479757348327e-06, 'epoch': 1.05} {'loss': 0.3797, 'learning_rate': 9.626144014360383e-06, 'epoch': 1.05} {'loss': 0.2936, 'learning_rate': 9.625808271794455e-06, 'epoch': 1.05} {'loss': 0.1932, 'learning_rate': 9.625472529650915e-06, 'epoch': 1.05} {'loss': 0.2792, 'learning_rate': 9.625136787930146e-06, 'epoch': 1.05} {'loss': 0.4882, 'learning_rate': 9.624801046632526e-06, 'epoch': 1.05} {'loss': 0.3868, 'learning_rate': 9.624465305758433e-06, 'epoch': 1.05} {'loss': 0.2734, 'learning_rate': 9.624129565308248e-06, 'epoch': 1.05} {'loss': 0.357, 'learning_rate': 9.62379382528235e-06, 'epoch': 1.05} {'loss': 0.3213, 'learning_rate': 9.623458085681118e-06, 'epoch': 1.05} {'loss': 0.2977, 'learning_rate': 9.623122346504929e-06, 'epoch': 1.05} {'loss': 0.3675, 'learning_rate': 9.622786607754163e-06, 'epoch': 1.05} {'loss': 0.398, 'learning_rate': 9.6224508694292e-06, 'epoch': 1.05} {'loss': 0.4009, 'learning_rate': 9.622115131530417e-06, 'epoch': 1.05} {'loss': 0.308, 'learning_rate': 9.621779394058195e-06, 'epoch': 1.05} {'loss': 0.2552, 'learning_rate': 9.621443657012915e-06, 'epoch': 1.05} {'loss': 0.355, 'learning_rate': 9.62110792039495e-06, 'epoch': 1.05} {'loss': 0.3685, 'learning_rate': 9.620772184204681e-06, 'epoch': 1.05} {'loss': 0.2708, 'learning_rate': 9.62043644844249e-06, 'epoch': 1.05} {'loss': 0.2229, 'learning_rate': 9.620100713108754e-06, 'epoch': 1.05} {'loss': 0.3286, 'learning_rate': 9.619764978203852e-06, 'epoch': 1.05} {'loss': 0.1888, 'learning_rate': 9.619429243728163e-06, 'epoch': 1.05} {'loss': 0.3054, 'learning_rate': 9.619093509682064e-06, 'epoch': 1.05} {'loss': 0.25, 'learning_rate': 9.618757776065938e-06, 'epoch': 1.05} {'loss': 0.5013, 'learning_rate': 9.618422042880161e-06, 'epoch': 1.05} {'loss': 0.3534, 'learning_rate': 9.618086310125114e-06, 'epoch': 1.05} {'loss': 0.3139, 'learning_rate': 9.617750577801173e-06, 'epoch': 1.05} {'loss': 0.4772, 'learning_rate': 9.617414845908721e-06, 'epoch': 1.05} {'loss': 0.3979, 'learning_rate': 9.617079114448136e-06, 'epoch': 1.05} {'loss': 0.2705, 'learning_rate': 9.616743383419794e-06, 'epoch': 1.05} {'loss': 0.2895, 'learning_rate': 9.616407652824072e-06, 'epoch': 1.05} {'loss': 0.3054, 'learning_rate': 9.616071922661356e-06, 'epoch': 1.05} {'loss': 0.2905, 'learning_rate': 9.615736192932023e-06, 'epoch': 1.05} {'loss': 0.2633, 'learning_rate': 9.615400463636451e-06, 'epoch': 1.05} {'loss': 0.2039, 'learning_rate': 9.615064734775017e-06, 'epoch': 1.05} {'loss': 0.4545, 'learning_rate': 9.614729006348106e-06, 'epoch': 1.05} {'loss': 0.3904, 'learning_rate': 9.614393278356089e-06, 'epoch': 1.05} {'loss': 0.296, 'learning_rate': 9.61405755079935e-06, 'epoch': 1.05} {'loss': 0.1879, 'learning_rate': 9.613721823678265e-06, 'epoch': 1.05} {'loss': 0.4757, 'learning_rate': 9.613386096993214e-06, 'epoch': 1.05} {'loss': 0.3926, 'learning_rate': 9.613050370744579e-06, 'epoch': 1.05} {'loss': 0.2405, 'learning_rate': 9.612714644932735e-06, 'epoch': 1.05} {'loss': 0.4532, 'learning_rate': 9.612378919558063e-06, 'epoch': 1.06} {'loss': 0.2405, 'learning_rate': 9.61204319462094e-06, 'epoch': 1.06} {'loss': 0.3346, 'learning_rate': 9.61170747012175e-06, 'epoch': 1.06} {'loss': 0.3922, 'learning_rate': 9.611371746060865e-06, 'epoch': 1.06} {'loss': 0.3973, 'learning_rate': 9.611036022438669e-06, 'epoch': 1.06} {'loss': 0.5096, 'learning_rate': 9.61070029925554e-06, 'epoch': 1.06} {'loss': 0.2313, 'learning_rate': 9.610364576511854e-06, 'epoch': 1.06} {'loss': 0.2361, 'learning_rate': 9.610028854207997e-06, 'epoch': 1.06} {'loss': 0.3548, 'learning_rate': 9.60969313234434e-06, 'epoch': 1.06} {'loss': 0.3987, 'learning_rate': 9.609357410921265e-06, 'epoch': 1.06} {'loss': 0.2162, 'learning_rate': 9.609021689939152e-06, 'epoch': 1.06} {'loss': 0.2487, 'learning_rate': 9.608685969398378e-06, 'epoch': 1.06} {'loss': 0.4096, 'learning_rate': 9.608350249299324e-06, 'epoch': 1.06} {'loss': 0.3285, 'learning_rate': 9.608014529642368e-06, 'epoch': 1.06} {'loss': 0.4183, 'learning_rate': 9.60767881042789e-06, 'epoch': 1.06} {'loss': 0.2244, 'learning_rate': 9.607343091656264e-06, 'epoch': 1.06} {'loss': 0.3119, 'learning_rate': 9.607007373327876e-06, 'epoch': 1.06} {'loss': 0.3901, 'learning_rate': 9.606671655443103e-06, 'epoch': 1.06} {'loss': 0.3394, 'learning_rate': 9.606335938002321e-06, 'epoch': 1.06} {'loss': 0.3506, 'learning_rate': 9.606000221005913e-06, 'epoch': 1.06} {'loss': 0.3692, 'learning_rate': 9.605664504454256e-06, 'epoch': 1.06} {'loss': 0.2923, 'learning_rate': 9.605328788347727e-06, 'epoch': 1.06} {'loss': 0.2824, 'learning_rate': 9.604993072686707e-06, 'epoch': 1.06} {'loss': 0.2482, 'learning_rate': 9.604657357471575e-06, 'epoch': 1.06} {'loss': 0.2756, 'learning_rate': 9.60432164270271e-06, 'epoch': 1.06} {'loss': 0.3468, 'learning_rate': 9.60398592838049e-06, 'epoch': 1.06} {'loss': 0.5014, 'learning_rate': 9.603650214505294e-06, 'epoch': 1.06} {'loss': 0.2802, 'learning_rate': 9.603314501077502e-06, 'epoch': 1.06} {'loss': 0.2483, 'learning_rate': 9.602978788097492e-06, 'epoch': 1.06} {'loss': 0.2667, 'learning_rate': 9.602643075565643e-06, 'epoch': 1.06} {'loss': 0.4272, 'learning_rate': 9.602307363482338e-06, 'epoch': 1.06} {'loss': 0.278, 'learning_rate': 9.601971651847948e-06, 'epoch': 1.06} {'loss': 0.3269, 'learning_rate': 9.601635940662858e-06, 'epoch': 1.06} {'loss': 0.3652, 'learning_rate': 9.601300229927448e-06, 'epoch': 1.06} {'loss': 0.3157, 'learning_rate': 9.600964519642092e-06, 'epoch': 1.06} {'loss': 0.3912, 'learning_rate': 9.600628809807171e-06, 'epoch': 1.06} {'loss': 0.3063, 'learning_rate': 9.600293100423063e-06, 'epoch': 1.06} {'loss': 0.2185, 'learning_rate': 9.59995739149015e-06, 'epoch': 1.06} {'loss': 0.3334, 'learning_rate': 9.599621683008808e-06, 'epoch': 1.06} {'loss': 0.463, 'learning_rate': 9.599285974979417e-06, 'epoch': 1.06} {'loss': 0.2628, 'learning_rate': 9.598950267402354e-06, 'epoch': 1.06} {'loss': 0.339, 'learning_rate': 9.598614560278003e-06, 'epoch': 1.06} {'loss': 0.3118, 'learning_rate': 9.598278853606739e-06, 'epoch': 1.06} {'loss': 0.3169, 'learning_rate': 9.597943147388941e-06, 'epoch': 1.06} {'loss': 0.3241, 'learning_rate': 9.59760744162499e-06, 'epoch': 1.06} {'loss': 0.345, 'learning_rate': 9.597271736315263e-06, 'epoch': 1.06} {'loss': 0.4002, 'learning_rate': 9.596936031460142e-06, 'epoch': 1.06} {'loss': 0.3594, 'learning_rate': 9.59660032706e-06, 'epoch': 1.06} {'loss': 0.3433, 'learning_rate': 9.59626462311522e-06, 'epoch': 1.06} {'loss': 0.2647, 'learning_rate': 9.595928919626182e-06, 'epoch': 1.06} {'loss': 0.377, 'learning_rate': 9.595593216593263e-06, 'epoch': 1.06} {'loss': 0.1701, 'learning_rate': 9.59525751401684e-06, 'epoch': 1.06} {'loss': 0.3193, 'learning_rate': 9.594921811897297e-06, 'epoch': 1.06} {'loss': 0.311, 'learning_rate': 9.594586110235009e-06, 'epoch': 1.06} {'loss': 0.2676, 'learning_rate': 9.594250409030357e-06, 'epoch': 1.06} {'loss': 0.2642, 'learning_rate': 9.593914708283717e-06, 'epoch': 1.06} {'loss': 0.2353, 'learning_rate': 9.593579007995473e-06, 'epoch': 1.06} {'loss': 0.3746, 'learning_rate': 9.593243308166e-06, 'epoch': 1.06} {'loss': 0.3731, 'learning_rate': 9.592907608795678e-06, 'epoch': 1.06} {'loss': 0.2109, 'learning_rate': 9.592571909884888e-06, 'epoch': 1.06} {'loss': 0.3457, 'learning_rate': 9.592236211434004e-06, 'epoch': 1.06} {'loss': 0.2576, 'learning_rate': 9.591900513443409e-06, 'epoch': 1.06} {'loss': 0.2979, 'learning_rate': 9.591564815913478e-06, 'epoch': 1.06} {'loss': 0.4486, 'learning_rate': 9.591229118844596e-06, 'epoch': 1.06} {'loss': 0.3076, 'learning_rate': 9.590893422237138e-06, 'epoch': 1.06} {'loss': 0.3431, 'learning_rate': 9.590557726091482e-06, 'epoch': 1.06} {'loss': 0.3674, 'learning_rate': 9.590222030408009e-06, 'epoch': 1.06} {'loss': 0.5601, 'learning_rate': 9.589886335187098e-06, 'epoch': 1.06} {'loss': 0.4106, 'learning_rate': 9.589550640429127e-06, 'epoch': 1.06} {'loss': 0.324, 'learning_rate': 9.589214946134473e-06, 'epoch': 1.06} {'loss': 0.5067, 'learning_rate': 9.588879252303522e-06, 'epoch': 1.06} {'loss': 0.2286, 'learning_rate': 9.588543558936644e-06, 'epoch': 1.06} {'loss': 0.3403, 'learning_rate': 9.588207866034227e-06, 'epoch': 1.06} {'loss': 0.3188, 'learning_rate': 9.587872173596641e-06, 'epoch': 1.06} {'loss': 0.2893, 'learning_rate': 9.58753648162427e-06, 'epoch': 1.06} {'loss': 0.495, 'learning_rate': 9.587200790117492e-06, 'epoch': 1.06} {'loss': 0.3223, 'learning_rate': 9.586865099076684e-06, 'epoch': 1.06} {'loss': 0.4239, 'learning_rate': 9.586529408502228e-06, 'epoch': 1.06} {'loss': 0.3557, 'learning_rate': 9.586193718394501e-06, 'epoch': 1.06} {'loss': 0.2658, 'learning_rate': 9.585858028753885e-06, 'epoch': 1.06} {'loss': 0.5145, 'learning_rate': 9.585522339580755e-06, 'epoch': 1.06} {'loss': 0.3219, 'learning_rate': 9.585186650875491e-06, 'epoch': 1.06} {'loss': 0.2499, 'learning_rate': 9.584850962638472e-06, 'epoch': 1.06} {'loss': 0.3294, 'learning_rate': 9.58451527487008e-06, 'epoch': 1.06} {'loss': 0.4049, 'learning_rate': 9.584179587570687e-06, 'epoch': 1.06} {'loss': 0.2302, 'learning_rate': 9.583843900740681e-06, 'epoch': 1.06} {'loss': 0.4586, 'learning_rate': 9.583508214380433e-06, 'epoch': 1.06} {'loss': 0.2857, 'learning_rate': 9.583172528490322e-06, 'epoch': 1.06} {'loss': 0.2374, 'learning_rate': 9.582836843070735e-06, 'epoch': 1.06} {'loss': 0.413, 'learning_rate': 9.582501158122043e-06, 'epoch': 1.06} {'loss': 0.1925, 'learning_rate': 9.58216547364463e-06, 'epoch': 1.06} {'loss': 0.3665, 'learning_rate': 9.581829789638872e-06, 'epoch': 1.06} {'loss': 0.2878, 'learning_rate': 9.581494106105147e-06, 'epoch': 1.06} {'loss': 0.4519, 'learning_rate': 9.58115842304384e-06, 'epoch': 1.06} {'loss': 0.3613, 'learning_rate': 9.580822740455321e-06, 'epoch': 1.06} {'loss': 0.3165, 'learning_rate': 9.580487058339977e-06, 'epoch': 1.06} {'loss': 0.3884, 'learning_rate': 9.58015137669818e-06, 'epoch': 1.06} {'loss': 0.2031, 'learning_rate': 9.579815695530314e-06, 'epoch': 1.06} {'loss': 0.3131, 'learning_rate': 9.579480014836757e-06, 'epoch': 1.06} {'loss': 0.2032, 'learning_rate': 9.579144334617886e-06, 'epoch': 1.06} {'loss': 0.3084, 'learning_rate': 9.578808654874081e-06, 'epoch': 1.06} {'loss': 0.3789, 'learning_rate': 9.57847297560572e-06, 'epoch': 1.06} {'loss': 0.3748, 'learning_rate': 9.578137296813184e-06, 'epoch': 1.06} {'loss': 0.3997, 'learning_rate': 9.57780161849685e-06, 'epoch': 1.06} {'loss': 0.1992, 'learning_rate': 9.577465940657098e-06, 'epoch': 1.06} {'loss': 0.4617, 'learning_rate': 9.577130263294307e-06, 'epoch': 1.06} {'loss': 0.5511, 'learning_rate': 9.576794586408858e-06, 'epoch': 1.06} {'loss': 0.3032, 'learning_rate': 9.576458910001125e-06, 'epoch': 1.06} {'loss': 0.3016, 'learning_rate': 9.57612323407149e-06, 'epoch': 1.06} {'loss': 0.3654, 'learning_rate': 9.57578755862033e-06, 'epoch': 1.06} {'loss': 0.3722, 'learning_rate': 9.575451883648024e-06, 'epoch': 1.06} {'loss': 0.3059, 'learning_rate': 9.575116209154954e-06, 'epoch': 1.06} {'loss': 0.4881, 'learning_rate': 9.574780535141496e-06, 'epoch': 1.06} {'loss': 0.3634, 'learning_rate': 9.574444861608033e-06, 'epoch': 1.06} {'loss': 0.2426, 'learning_rate': 9.574109188554938e-06, 'epoch': 1.06} {'loss': 0.3408, 'learning_rate': 9.573773515982592e-06, 'epoch': 1.06} {'loss': 0.2728, 'learning_rate': 9.573437843891377e-06, 'epoch': 1.06} {'loss': 0.5048, 'learning_rate': 9.573102172281667e-06, 'epoch': 1.06} {'loss': 0.4581, 'learning_rate': 9.572766501153844e-06, 'epoch': 1.06} {'loss': 0.3361, 'learning_rate': 9.57243083050829e-06, 'epoch': 1.06} {'loss': 0.25, 'learning_rate': 9.572095160345379e-06, 'epoch': 1.06} {'loss': 0.4241, 'learning_rate': 9.571759490665488e-06, 'epoch': 1.06} {'loss': 0.3851, 'learning_rate': 9.571423821469e-06, 'epoch': 1.06} {'loss': 0.4147, 'learning_rate': 9.571088152756294e-06, 'epoch': 1.06} {'loss': 0.3507, 'learning_rate': 9.570752484527749e-06, 'epoch': 1.06} {'loss': 0.2512, 'learning_rate': 9.570416816783742e-06, 'epoch': 1.06} {'loss': 0.365, 'learning_rate': 9.57008114952465e-06, 'epoch': 1.06} {'loss': 0.3302, 'learning_rate': 9.569745482750859e-06, 'epoch': 1.06} {'loss': 0.3075, 'learning_rate': 9.569409816462742e-06, 'epoch': 1.06} {'loss': 0.4286, 'learning_rate': 9.569074150660678e-06, 'epoch': 1.06} {'loss': 0.1792, 'learning_rate': 9.568738485345048e-06, 'epoch': 1.06} {'loss': 0.164, 'learning_rate': 9.56840282051623e-06, 'epoch': 1.06} {'loss': 0.3981, 'learning_rate': 9.568067156174607e-06, 'epoch': 1.06} {'loss': 0.3878, 'learning_rate': 9.56773149232055e-06, 'epoch': 1.06} {'loss': 0.3299, 'learning_rate': 9.567395828954442e-06, 'epoch': 1.06} {'loss': 0.4239, 'learning_rate': 9.567060166076663e-06, 'epoch': 1.06} {'loss': 0.3614, 'learning_rate': 9.56672450368759e-06, 'epoch': 1.06} {'loss': 0.3219, 'learning_rate': 9.566388841787603e-06, 'epoch': 1.06} {'loss': 0.4019, 'learning_rate': 9.56605318037708e-06, 'epoch': 1.06} {'loss': 0.3043, 'learning_rate': 9.565717519456401e-06, 'epoch': 1.06} {'loss': 0.3341, 'learning_rate': 9.565381859025944e-06, 'epoch': 1.06} {'loss': 0.3595, 'learning_rate': 9.565046199086088e-06, 'epoch': 1.06} {'loss': 0.5037, 'learning_rate': 9.564710539637214e-06, 'epoch': 1.06} {'loss': 0.2712, 'learning_rate': 9.564374880679696e-06, 'epoch': 1.06} {'loss': 0.4022, 'learning_rate': 9.564039222213919e-06, 'epoch': 1.06} {'loss': 0.383, 'learning_rate': 9.563703564240259e-06, 'epoch': 1.06} {'loss': 0.2591, 'learning_rate': 9.563367906759092e-06, 'epoch': 1.06} {'loss': 0.3043, 'learning_rate': 9.563032249770801e-06, 'epoch': 1.06} {'loss': 0.3112, 'learning_rate': 9.562696593275762e-06, 'epoch': 1.06} {'loss': 0.2488, 'learning_rate': 9.562360937274358e-06, 'epoch': 1.06} {'loss': 0.3889, 'learning_rate': 9.562025281766963e-06, 'epoch': 1.06} {'loss': 0.3577, 'learning_rate': 9.561689626753959e-06, 'epoch': 1.06} {'loss': 0.2977, 'learning_rate': 9.561353972235724e-06, 'epoch': 1.06} {'loss': 0.2845, 'learning_rate': 9.561018318212638e-06, 'epoch': 1.06} {'loss': 0.271, 'learning_rate': 9.560682664685076e-06, 'epoch': 1.06} {'loss': 0.3757, 'learning_rate': 9.56034701165342e-06, 'epoch': 1.06} {'loss': 0.2654, 'learning_rate': 9.560011359118053e-06, 'epoch': 1.06} {'loss': 0.4444, 'learning_rate': 9.559675707079346e-06, 'epoch': 1.06} {'loss': 0.3322, 'learning_rate': 9.559340055537683e-06, 'epoch': 1.06} {'loss': 0.3693, 'learning_rate': 9.559004404493442e-06, 'epoch': 1.06} {'loss': 0.3579, 'learning_rate': 9.558668753946997e-06, 'epoch': 1.06} {'loss': 0.4085, 'learning_rate': 9.558333103898735e-06, 'epoch': 1.06} {'loss': 0.2812, 'learning_rate': 9.55799745434903e-06, 'epoch': 1.06} {'loss': 0.4076, 'learning_rate': 9.55766180529826e-06, 'epoch': 1.06} {'loss': 0.371, 'learning_rate': 9.557326156746808e-06, 'epoch': 1.06} {'loss': 0.3746, 'learning_rate': 9.556990508695048e-06, 'epoch': 1.06} {'loss': 0.4525, 'learning_rate': 9.556654861143365e-06, 'epoch': 1.06} {'loss': 0.2643, 'learning_rate': 9.556319214092132e-06, 'epoch': 1.06} {'loss': 0.2768, 'learning_rate': 9.55598356754173e-06, 'epoch': 1.06} {'loss': 0.4732, 'learning_rate': 9.55564792149254e-06, 'epoch': 1.06} {'loss': 0.2607, 'learning_rate': 9.555312275944938e-06, 'epoch': 1.06} {'loss': 0.4284, 'learning_rate': 9.554976630899303e-06, 'epoch': 1.06} {'loss': 0.2766, 'learning_rate': 9.554640986356017e-06, 'epoch': 1.06} {'loss': 0.3745, 'learning_rate': 9.554305342315455e-06, 'epoch': 1.06} {'loss': 0.3142, 'learning_rate': 9.553969698777998e-06, 'epoch': 1.06} {'loss': 0.4252, 'learning_rate': 9.553634055744023e-06, 'epoch': 1.06} {'loss': 0.4421, 'learning_rate': 9.553298413213912e-06, 'epoch': 1.06} {'loss': 0.3132, 'learning_rate': 9.552962771188041e-06, 'epoch': 1.06} {'loss': 0.3954, 'learning_rate': 9.55262712966679e-06, 'epoch': 1.06} {'loss': 0.336, 'learning_rate': 9.55229148865054e-06, 'epoch': 1.06} {'loss': 0.3863, 'learning_rate': 9.551955848139665e-06, 'epoch': 1.06} {'loss': 0.2741, 'learning_rate': 9.551620208134548e-06, 'epoch': 1.06} {'loss': 0.2137, 'learning_rate': 9.551284568635566e-06, 'epoch': 1.06} {'loss': 0.3802, 'learning_rate': 9.550948929643098e-06, 'epoch': 1.06} {'loss': 0.355, 'learning_rate': 9.550613291157525e-06, 'epoch': 1.06} {'loss': 0.3254, 'learning_rate': 9.550277653179225e-06, 'epoch': 1.06} {'loss': 0.3611, 'learning_rate': 9.549942015708573e-06, 'epoch': 1.06} {'loss': 0.4391, 'learning_rate': 9.549606378745948e-06, 'epoch': 1.06} {'loss': 0.1155, 'learning_rate': 9.549270742291734e-06, 'epoch': 1.06} {'loss': 0.3541, 'learning_rate': 9.548935106346311e-06, 'epoch': 1.06} {'loss': 0.3062, 'learning_rate': 9.548599470910053e-06, 'epoch': 1.06} {'loss': 0.389, 'learning_rate': 9.54826383598334e-06, 'epoch': 1.06} {'loss': 0.3762, 'learning_rate': 9.547928201566554e-06, 'epoch': 1.06} {'loss': 0.3596, 'learning_rate': 9.547592567660068e-06, 'epoch': 1.06} {'loss': 0.3098, 'learning_rate': 9.547256934264265e-06, 'epoch': 1.06} {'loss': 0.4194, 'learning_rate': 9.54692130137952e-06, 'epoch': 1.06} {'loss': 0.3582, 'learning_rate': 9.546585669006219e-06, 'epoch': 1.06} {'loss': 0.4344, 'learning_rate': 9.546250037144735e-06, 'epoch': 1.06} {'loss': 0.2917, 'learning_rate': 9.545914405795446e-06, 'epoch': 1.06} {'loss': 0.2791, 'learning_rate': 9.545578774958736e-06, 'epoch': 1.06} {'loss': 0.3467, 'learning_rate': 9.54524314463498e-06, 'epoch': 1.06} {'loss': 0.3514, 'learning_rate': 9.544907514824558e-06, 'epoch': 1.06} {'loss': 0.3133, 'learning_rate': 9.54457188552785e-06, 'epoch': 1.06} {'loss': 0.3399, 'learning_rate': 9.544236256745233e-06, 'epoch': 1.06} {'loss': 0.3458, 'learning_rate': 9.543900628477087e-06, 'epoch': 1.06} {'loss': 0.3143, 'learning_rate': 9.543565000723792e-06, 'epoch': 1.06} {'loss': 0.3868, 'learning_rate': 9.543229373485724e-06, 'epoch': 1.06} {'loss': 0.2032, 'learning_rate': 9.542893746763263e-06, 'epoch': 1.06} {'loss': 0.5966, 'learning_rate': 9.542558120556786e-06, 'epoch': 1.06} {'loss': 0.3001, 'learning_rate': 9.542222494866677e-06, 'epoch': 1.06} {'loss': 0.2713, 'learning_rate': 9.541886869693309e-06, 'epoch': 1.06} {'loss': 0.2262, 'learning_rate': 9.541551245037065e-06, 'epoch': 1.06} {'loss': 0.3411, 'learning_rate': 9.541215620898322e-06, 'epoch': 1.06} {'loss': 0.3774, 'learning_rate': 9.54087999727746e-06, 'epoch': 1.06} {'loss': 0.2183, 'learning_rate': 9.540544374174858e-06, 'epoch': 1.06} {'loss': 0.2984, 'learning_rate': 9.540208751590892e-06, 'epoch': 1.06} {'loss': 0.2885, 'learning_rate': 9.539873129525943e-06, 'epoch': 1.06} {'loss': 0.3666, 'learning_rate': 9.53953750798039e-06, 'epoch': 1.06} {'loss': 0.3269, 'learning_rate': 9.539201886954616e-06, 'epoch': 1.06} {'loss': 0.2878, 'learning_rate': 9.53886626644899e-06, 'epoch': 1.06} {'loss': 0.2406, 'learning_rate': 9.538530646463898e-06, 'epoch': 1.06} {'loss': 0.3634, 'learning_rate': 9.538195026999717e-06, 'epoch': 1.06} {'loss': 0.2322, 'learning_rate': 9.537859408056827e-06, 'epoch': 1.06} {'loss': 0.2832, 'learning_rate': 9.537523789635604e-06, 'epoch': 1.06} {'loss': 0.4512, 'learning_rate': 9.53718817173643e-06, 'epoch': 1.06} {'loss': 0.3603, 'learning_rate': 9.536852554359681e-06, 'epoch': 1.06} {'loss': 0.3734, 'learning_rate': 9.536516937505739e-06, 'epoch': 1.06} {'loss': 0.2058, 'learning_rate': 9.536181321174982e-06, 'epoch': 1.06} {'loss': 0.3403, 'learning_rate': 9.535845705367785e-06, 'epoch': 1.06} {'loss': 0.2925, 'learning_rate': 9.535510090084532e-06, 'epoch': 1.06} {'loss': 0.348, 'learning_rate': 9.5351744753256e-06, 'epoch': 1.06} {'loss': 0.375, 'learning_rate': 9.534838861091366e-06, 'epoch': 1.06} {'loss': 0.3003, 'learning_rate': 9.534503247382215e-06, 'epoch': 1.06} {'loss': 0.2173, 'learning_rate': 9.534167634198519e-06, 'epoch': 1.06} {'loss': 0.3893, 'learning_rate': 9.533832021540657e-06, 'epoch': 1.06} {'loss': 0.3428, 'learning_rate': 9.533496409409011e-06, 'epoch': 1.06} {'loss': 0.3611, 'learning_rate': 9.53316079780396e-06, 'epoch': 1.06} {'loss': 0.3518, 'learning_rate': 9.532825186725879e-06, 'epoch': 1.06} {'loss': 0.2104, 'learning_rate': 9.53248957617515e-06, 'epoch': 1.06} {'loss': 0.2112, 'learning_rate': 9.532153966152153e-06, 'epoch': 1.06} {'loss': 0.3663, 'learning_rate': 9.531818356657265e-06, 'epoch': 1.06} {'loss': 0.3236, 'learning_rate': 9.531482747690866e-06, 'epoch': 1.06} {'loss': 0.2938, 'learning_rate': 9.531147139253332e-06, 'epoch': 1.06} {'loss': 0.2879, 'learning_rate': 9.530811531345044e-06, 'epoch': 1.06} {'loss': 0.2257, 'learning_rate': 9.530475923966381e-06, 'epoch': 1.06} {'loss': 0.4624, 'learning_rate': 9.530140317117722e-06, 'epoch': 1.06} {'loss': 0.2828, 'learning_rate': 9.529804710799447e-06, 'epoch': 1.06} {'loss': 0.2439, 'learning_rate': 9.529469105011929e-06, 'epoch': 1.06} {'loss': 0.4804, 'learning_rate': 9.529133499755553e-06, 'epoch': 1.06} {'loss': 0.2911, 'learning_rate': 9.528797895030695e-06, 'epoch': 1.06} {'loss': 0.3318, 'learning_rate': 9.528462290837736e-06, 'epoch': 1.06} {'loss': 0.4104, 'learning_rate': 9.528126687177051e-06, 'epoch': 1.06} {'loss': 0.3272, 'learning_rate': 9.527791084049024e-06, 'epoch': 1.06} {'loss': 0.4419, 'learning_rate': 9.527455481454029e-06, 'epoch': 1.06} {'loss': 0.3012, 'learning_rate': 9.527119879392446e-06, 'epoch': 1.06} {'loss': 0.4975, 'learning_rate': 9.526784277864657e-06, 'epoch': 1.06} {'loss': 0.3339, 'learning_rate': 9.526448676871037e-06, 'epoch': 1.06} {'loss': 0.2677, 'learning_rate': 9.526113076411968e-06, 'epoch': 1.06} {'loss': 0.4449, 'learning_rate': 9.525777476487829e-06, 'epoch': 1.06} {'loss': 0.333, 'learning_rate': 9.525441877098994e-06, 'epoch': 1.06} {'loss': 0.3757, 'learning_rate': 9.525106278245845e-06, 'epoch': 1.06} {'loss': 0.5061, 'learning_rate': 9.524770679928761e-06, 'epoch': 1.06} {'loss': 0.2825, 'learning_rate': 9.52443508214812e-06, 'epoch': 1.06} {'loss': 0.3566, 'learning_rate': 9.524099484904302e-06, 'epoch': 1.06} {'loss': 0.3195, 'learning_rate': 9.523763888197685e-06, 'epoch': 1.06} {'loss': 0.359, 'learning_rate': 9.52342829202865e-06, 'epoch': 1.06} {'loss': 0.4077, 'learning_rate': 9.523092696397572e-06, 'epoch': 1.06} {'loss': 0.2798, 'learning_rate': 9.522757101304831e-06, 'epoch': 1.06} {'loss': 0.2943, 'learning_rate': 9.522421506750806e-06, 'epoch': 1.06} {'loss': 0.3119, 'learning_rate': 9.522085912735877e-06, 'epoch': 1.06} {'loss': 0.4016, 'learning_rate': 9.521750319260424e-06, 'epoch': 1.06} {'loss': 0.431, 'learning_rate': 9.521414726324823e-06, 'epoch': 1.06} {'loss': 0.2912, 'learning_rate': 9.521079133929453e-06, 'epoch': 1.06} {'loss': 0.3056, 'learning_rate': 9.520743542074696e-06, 'epoch': 1.06} {'loss': 0.4148, 'learning_rate': 9.520407950760924e-06, 'epoch': 1.06} {'loss': 0.3268, 'learning_rate': 9.520072359988524e-06, 'epoch': 1.06} {'loss': 0.2458, 'learning_rate': 9.519736769757869e-06, 'epoch': 1.06} {'loss': 0.4652, 'learning_rate': 9.51940118006934e-06, 'epoch': 1.06} {'loss': 0.2669, 'learning_rate': 9.519065590923316e-06, 'epoch': 1.06} {'loss': 0.3572, 'learning_rate': 9.518730002320175e-06, 'epoch': 1.06} {'loss': 0.2812, 'learning_rate': 9.518394414260298e-06, 'epoch': 1.06} {'loss': 0.266, 'learning_rate': 9.518058826744062e-06, 'epoch': 1.06} {'loss': 0.2072, 'learning_rate': 9.517723239771844e-06, 'epoch': 1.06} {'loss': 0.4095, 'learning_rate': 9.517387653344025e-06, 'epoch': 1.06} {'loss': 0.2709, 'learning_rate': 9.517052067460986e-06, 'epoch': 1.06} {'loss': 0.4284, 'learning_rate': 9.516716482123102e-06, 'epoch': 1.06} {'loss': 0.2871, 'learning_rate': 9.516380897330747e-06, 'epoch': 1.06} {'loss': 0.3434, 'learning_rate': 9.516045313084314e-06, 'epoch': 1.06} {'loss': 0.4354, 'learning_rate': 9.515709729384171e-06, 'epoch': 1.06} {'loss': 0.2492, 'learning_rate': 9.5153741462307e-06, 'epoch': 1.06} {'loss': 0.4823, 'learning_rate': 9.51503856362428e-06, 'epoch': 1.06} {'loss': 0.4094, 'learning_rate': 9.514702981565289e-06, 'epoch': 1.06} {'loss': 0.3519, 'learning_rate': 9.514367400054108e-06, 'epoch': 1.06} {'loss': 0.3322, 'learning_rate': 9.514031819091111e-06, 'epoch': 1.06} {'loss': 0.2729, 'learning_rate': 9.51369623867668e-06, 'epoch': 1.06} {'loss': 0.3446, 'learning_rate': 9.513360658811195e-06, 'epoch': 1.06} {'loss': 0.2759, 'learning_rate': 9.513025079495032e-06, 'epoch': 1.06} {'loss': 0.2716, 'learning_rate': 9.512689500728571e-06, 'epoch': 1.06} {'loss': 0.2899, 'learning_rate': 9.51235392251219e-06, 'epoch': 1.06} {'loss': 0.5286, 'learning_rate': 9.512018344846272e-06, 'epoch': 1.06} {'loss': 0.2466, 'learning_rate': 9.51168276773119e-06, 'epoch': 1.06} {'loss': 0.2678, 'learning_rate': 9.511347191167325e-06, 'epoch': 1.06} {'loss': 0.2564, 'learning_rate': 9.511011615155057e-06, 'epoch': 1.06} {'loss': 0.3659, 'learning_rate': 9.510676039694764e-06, 'epoch': 1.06} {'loss': 0.4204, 'learning_rate': 9.510340464786823e-06, 'epoch': 1.06} {'loss': 0.2567, 'learning_rate': 9.510004890431619e-06, 'epoch': 1.06} {'loss': 0.3233, 'learning_rate': 9.509669316629523e-06, 'epoch': 1.06} {'loss': 0.2536, 'learning_rate': 9.509333743380918e-06, 'epoch': 1.06} {'loss': 0.3348, 'learning_rate': 9.50899817068618e-06, 'epoch': 1.06} {'loss': 0.4076, 'learning_rate': 9.508662598545692e-06, 'epoch': 1.06} {'loss': 0.3452, 'learning_rate': 9.508327026959828e-06, 'epoch': 1.06} {'loss': 0.5039, 'learning_rate': 9.507991455928972e-06, 'epoch': 1.06} {'loss': 0.3439, 'learning_rate': 9.507655885453498e-06, 'epoch': 1.06} {'loss': 0.2403, 'learning_rate': 9.507320315533787e-06, 'epoch': 1.06} {'loss': 0.3589, 'learning_rate': 9.506984746170219e-06, 'epoch': 1.06} {'loss': 0.4212, 'learning_rate': 9.50664917736317e-06, 'epoch': 1.06} {'loss': 0.3804, 'learning_rate': 9.506313609113022e-06, 'epoch': 1.06} {'loss': 0.2547, 'learning_rate': 9.505978041420152e-06, 'epoch': 1.06} {'loss': 0.3431, 'learning_rate': 9.505642474284939e-06, 'epoch': 1.06} {'loss': 0.408, 'learning_rate': 9.50530690770776e-06, 'epoch': 1.06} {'loss': 0.3274, 'learning_rate': 9.504971341688997e-06, 'epoch': 1.06} {'loss': 0.367, 'learning_rate': 9.504635776229026e-06, 'epoch': 1.06} {'loss': 0.28, 'learning_rate': 9.504300211328227e-06, 'epoch': 1.06} {'loss': 0.2259, 'learning_rate': 9.503964646986978e-06, 'epoch': 1.06} {'loss': 0.2824, 'learning_rate': 9.50362908320566e-06, 'epoch': 1.06} {'loss': 0.2885, 'learning_rate': 9.50329351998465e-06, 'epoch': 1.06} {'loss': 0.2998, 'learning_rate': 9.502957957324327e-06, 'epoch': 1.06} {'loss': 0.5063, 'learning_rate': 9.502622395225071e-06, 'epoch': 1.06} {'loss': 0.2107, 'learning_rate': 9.50228683368726e-06, 'epoch': 1.06} {'loss': 0.2395, 'learning_rate': 9.501951272711269e-06, 'epoch': 1.06} {'loss': 0.3153, 'learning_rate': 9.501615712297483e-06, 'epoch': 1.06} {'loss': 0.3729, 'learning_rate': 9.501280152446281e-06, 'epoch': 1.06} {'loss': 0.3116, 'learning_rate': 9.500944593158035e-06, 'epoch': 1.06} {'loss': 0.2625, 'learning_rate': 9.500609034433127e-06, 'epoch': 1.06} {'loss': 0.2876, 'learning_rate': 9.50027347627194e-06, 'epoch': 1.06} {'loss': 0.4042, 'learning_rate': 9.499937918674846e-06, 'epoch': 1.06} {'loss': 0.3961, 'learning_rate': 9.499602361642228e-06, 'epoch': 1.06} {'loss': 0.4167, 'learning_rate': 9.499266805174464e-06, 'epoch': 1.06} {'loss': 0.2021, 'learning_rate': 9.498931249271931e-06, 'epoch': 1.06} {'loss': 0.3709, 'learning_rate': 9.49859569393501e-06, 'epoch': 1.06} {'loss': 0.3451, 'learning_rate': 9.498260139164082e-06, 'epoch': 1.06} {'loss': 0.255, 'learning_rate': 9.497924584959518e-06, 'epoch': 1.06} {'loss': 0.279, 'learning_rate': 9.497589031321705e-06, 'epoch': 1.06} {'loss': 0.2773, 'learning_rate': 9.497253478251019e-06, 'epoch': 1.06} {'loss': 0.3941, 'learning_rate': 9.49691792574784e-06, 'epoch': 1.06} {'loss': 0.3674, 'learning_rate': 9.49658237381254e-06, 'epoch': 1.06} {'loss': 0.3106, 'learning_rate': 9.496246822445505e-06, 'epoch': 1.06} {'loss': 0.2831, 'learning_rate': 9.495911271647112e-06, 'epoch': 1.06} {'loss': 0.2983, 'learning_rate': 9.495575721417739e-06, 'epoch': 1.06} {'loss': 0.4046, 'learning_rate': 9.495240171757763e-06, 'epoch': 1.06} {'loss': 0.2612, 'learning_rate': 9.494904622667567e-06, 'epoch': 1.06} {'loss': 0.335, 'learning_rate': 9.494569074147527e-06, 'epoch': 1.06} {'loss': 0.3774, 'learning_rate': 9.494233526198024e-06, 'epoch': 1.06} {'loss': 0.5009, 'learning_rate': 9.493897978819433e-06, 'epoch': 1.06} {'loss': 0.3371, 'learning_rate': 9.493562432012136e-06, 'epoch': 1.06} {'loss': 0.3906, 'learning_rate': 9.493226885776509e-06, 'epoch': 1.06} {'loss': 0.4056, 'learning_rate': 9.492891340112935e-06, 'epoch': 1.06} {'loss': 0.3708, 'learning_rate': 9.492555795021792e-06, 'epoch': 1.06} {'loss': 0.424, 'learning_rate': 9.492220250503453e-06, 'epoch': 1.06} {'loss': 0.2643, 'learning_rate': 9.491884706558302e-06, 'epoch': 1.06} {'loss': 0.3556, 'learning_rate': 9.491549163186716e-06, 'epoch': 1.06} {'loss': 0.3252, 'learning_rate': 9.491213620389076e-06, 'epoch': 1.06} {'loss': 0.286, 'learning_rate': 9.490878078165758e-06, 'epoch': 1.06} {'loss': 0.3801, 'learning_rate': 9.490542536517142e-06, 'epoch': 1.06} {'loss': 0.3679, 'learning_rate': 9.490206995443605e-06, 'epoch': 1.06} {'loss': 0.2835, 'learning_rate': 9.489871454945529e-06, 'epoch': 1.06} {'loss': 0.3754, 'learning_rate': 9.48953591502329e-06, 'epoch': 1.06} {'loss': 0.3304, 'learning_rate': 9.489200375677268e-06, 'epoch': 1.06} {'loss': 0.341, 'learning_rate': 9.488864836907842e-06, 'epoch': 1.06} {'loss': 0.5341, 'learning_rate': 9.488529298715391e-06, 'epoch': 1.06} {'loss': 0.3375, 'learning_rate': 9.488193761100297e-06, 'epoch': 1.06} {'loss': 0.2277, 'learning_rate': 9.48785822406293e-06, 'epoch': 1.06} {'loss': 0.3992, 'learning_rate': 9.487522687603674e-06, 'epoch': 1.06} {'loss': 0.397, 'learning_rate': 9.487187151722909e-06, 'epoch': 1.06} {'loss': 0.3025, 'learning_rate': 9.48685161642101e-06, 'epoch': 1.06} {'loss': 0.3634, 'learning_rate': 9.486516081698359e-06, 'epoch': 1.06} {'loss': 0.3181, 'learning_rate': 9.486180547555334e-06, 'epoch': 1.06} {'loss': 0.2519, 'learning_rate': 9.485845013992313e-06, 'epoch': 1.06} {'loss': 0.2163, 'learning_rate': 9.485509481009676e-06, 'epoch': 1.06} {'loss': 0.3419, 'learning_rate': 9.4851739486078e-06, 'epoch': 1.06} {'loss': 0.4122, 'learning_rate': 9.484838416787065e-06, 'epoch': 1.06} {'loss': 0.3144, 'learning_rate': 9.48450288554785e-06, 'epoch': 1.06} {'loss': 0.238, 'learning_rate': 9.484167354890533e-06, 'epoch': 1.06} {'loss': 0.3768, 'learning_rate': 9.483831824815494e-06, 'epoch': 1.06} {'loss': 0.2361, 'learning_rate': 9.48349629532311e-06, 'epoch': 1.06} {'loss': 0.3777, 'learning_rate': 9.483160766413756e-06, 'epoch': 1.06} {'loss': 0.348, 'learning_rate': 9.482825238087819e-06, 'epoch': 1.06} {'loss': 0.448, 'learning_rate': 9.482489710345673e-06, 'epoch': 1.06} {'loss': 0.3426, 'learning_rate': 9.482154183187698e-06, 'epoch': 1.06} {'loss': 0.5314, 'learning_rate': 9.481818656614273e-06, 'epoch': 1.06} {'loss': 0.2828, 'learning_rate': 9.481483130625776e-06, 'epoch': 1.06} {'loss': 0.3311, 'learning_rate': 9.48114760522259e-06, 'epoch': 1.06} {'loss': 0.2622, 'learning_rate': 9.480812080405086e-06, 'epoch': 1.06} {'loss': 0.2256, 'learning_rate': 9.480476556173647e-06, 'epoch': 1.06} {'loss': 0.3381, 'learning_rate': 9.48014103252865e-06, 'epoch': 1.06} {'loss': 0.3752, 'learning_rate': 9.479805509470476e-06, 'epoch': 1.06} {'loss': 0.3116, 'learning_rate': 9.479469986999502e-06, 'epoch': 1.06} {'loss': 0.3119, 'learning_rate': 9.479134465116108e-06, 'epoch': 1.06} {'loss': 0.3447, 'learning_rate': 9.47879894382067e-06, 'epoch': 1.06} {'loss': 0.2858, 'learning_rate': 9.478463423113572e-06, 'epoch': 1.06} {'loss': 0.4173, 'learning_rate': 9.478127902995188e-06, 'epoch': 1.06} {'loss': 0.3379, 'learning_rate': 9.477792383465899e-06, 'epoch': 1.06} {'loss': 0.3209, 'learning_rate': 9.477456864526082e-06, 'epoch': 1.06} {'loss': 0.2801, 'learning_rate': 9.477121346176118e-06, 'epoch': 1.06} {'loss': 0.3449, 'learning_rate': 9.476785828416386e-06, 'epoch': 1.06} {'loss': 0.4228, 'learning_rate': 9.476450311247262e-06, 'epoch': 1.06} {'loss': 0.3693, 'learning_rate': 9.476114794669125e-06, 'epoch': 1.06} {'loss': 0.296, 'learning_rate': 9.475779278682355e-06, 'epoch': 1.06} {'loss': 0.3401, 'learning_rate': 9.47544376328733e-06, 'epoch': 1.06} {'loss': 0.2818, 'learning_rate': 9.475108248484432e-06, 'epoch': 1.06} {'loss': 0.2142, 'learning_rate': 9.474772734274034e-06, 'epoch': 1.06} {'loss': 0.4281, 'learning_rate': 9.474437220656518e-06, 'epoch': 1.06} {'loss': 0.4074, 'learning_rate': 9.474101707632264e-06, 'epoch': 1.06} {'loss': 0.3383, 'learning_rate': 9.473766195201647e-06, 'epoch': 1.06} {'loss': 0.3442, 'learning_rate': 9.47343068336505e-06, 'epoch': 1.06} {'loss': 0.3551, 'learning_rate': 9.473095172122848e-06, 'epoch': 1.06} {'loss': 0.4665, 'learning_rate': 9.472759661475423e-06, 'epoch': 1.06} {'loss': 0.4295, 'learning_rate': 9.472424151423153e-06, 'epoch': 1.06} {'loss': 0.3945, 'learning_rate': 9.472088641966416e-06, 'epoch': 1.06} {'loss': 0.3962, 'learning_rate': 9.471753133105588e-06, 'epoch': 1.06} {'loss': 0.3367, 'learning_rate': 9.47141762484105e-06, 'epoch': 1.06} {'loss': 0.3509, 'learning_rate': 9.471082117173182e-06, 'epoch': 1.06} {'loss': 0.2456, 'learning_rate': 9.470746610102362e-06, 'epoch': 1.06} {'loss': 0.3259, 'learning_rate': 9.470411103628969e-06, 'epoch': 1.06} {'loss': 0.4465, 'learning_rate': 9.47007559775338e-06, 'epoch': 1.06} {'loss': 0.2126, 'learning_rate': 9.469740092475974e-06, 'epoch': 1.06} {'loss': 0.3175, 'learning_rate': 9.469404587797132e-06, 'epoch': 1.06} {'loss': 0.4276, 'learning_rate': 9.46906908371723e-06, 'epoch': 1.06} {'loss': 0.3962, 'learning_rate': 9.468733580236649e-06, 'epoch': 1.06} {'loss': 0.2651, 'learning_rate': 9.468398077355767e-06, 'epoch': 1.06} {'loss': 0.3309, 'learning_rate': 9.468062575074964e-06, 'epoch': 1.06} {'loss': 0.3898, 'learning_rate': 9.467727073394615e-06, 'epoch': 1.06} {'loss': 0.326, 'learning_rate': 9.467391572315103e-06, 'epoch': 1.06} {'loss': 0.3463, 'learning_rate': 9.467056071836802e-06, 'epoch': 1.06} {'loss': 0.2886, 'learning_rate': 9.466720571960095e-06, 'epoch': 1.06} {'loss': 0.3929, 'learning_rate': 9.466385072685358e-06, 'epoch': 1.06} {'loss': 0.3129, 'learning_rate': 9.46604957401297e-06, 'epoch': 1.06} {'loss': 0.3636, 'learning_rate': 9.465714075943314e-06, 'epoch': 1.06} {'loss': 0.361, 'learning_rate': 9.465378578476761e-06, 'epoch': 1.06} {'loss': 0.5034, 'learning_rate': 9.465043081613697e-06, 'epoch': 1.06} {'loss': 0.5002, 'learning_rate': 9.464707585354497e-06, 'epoch': 1.06} {'loss': 0.2978, 'learning_rate': 9.46437208969954e-06, 'epoch': 1.06} {'loss': 0.3102, 'learning_rate': 9.464036594649204e-06, 'epoch': 1.06} {'loss': 0.3312, 'learning_rate': 9.463701100203869e-06, 'epoch': 1.06} {'loss': 0.3426, 'learning_rate': 9.463365606363917e-06, 'epoch': 1.06} {'loss': 0.3303, 'learning_rate': 9.46303011312972e-06, 'epoch': 1.06} {'loss': 0.4015, 'learning_rate': 9.46269462050166e-06, 'epoch': 1.06} {'loss': 0.4236, 'learning_rate': 9.462359128480116e-06, 'epoch': 1.06} {'loss': 0.3654, 'learning_rate': 9.462023637065467e-06, 'epoch': 1.06} {'loss': 0.4103, 'learning_rate': 9.461688146258089e-06, 'epoch': 1.06} {'loss': 0.4382, 'learning_rate': 9.461352656058364e-06, 'epoch': 1.06} {'loss': 0.4289, 'learning_rate': 9.46101716646667e-06, 'epoch': 1.06} {'loss': 0.3803, 'learning_rate': 9.460681677483382e-06, 'epoch': 1.06} {'loss': 0.2512, 'learning_rate': 9.460346189108885e-06, 'epoch': 1.06} {'loss': 0.343, 'learning_rate': 9.460010701343555e-06, 'epoch': 1.06} {'loss': 0.3626, 'learning_rate': 9.45967521418777e-06, 'epoch': 1.06} {'loss': 0.2331, 'learning_rate': 9.459339727641906e-06, 'epoch': 1.06} {'loss': 0.3593, 'learning_rate': 9.459004241706348e-06, 'epoch': 1.06} {'loss': 0.4426, 'learning_rate': 9.458668756381471e-06, 'epoch': 1.06} {'loss': 0.3844, 'learning_rate': 9.458333271667653e-06, 'epoch': 1.06} {'loss': 0.405, 'learning_rate': 9.457997787565275e-06, 'epoch': 1.06} {'loss': 0.2903, 'learning_rate': 9.457662304074711e-06, 'epoch': 1.06} {'loss': 0.2591, 'learning_rate': 9.457326821196346e-06, 'epoch': 1.06} {'loss': 0.4199, 'learning_rate': 9.456991338930554e-06, 'epoch': 1.06} {'loss': 0.2726, 'learning_rate': 9.456655857277718e-06, 'epoch': 1.06} {'loss': 0.1768, 'learning_rate': 9.456320376238213e-06, 'epoch': 1.06} {'loss': 0.2291, 'learning_rate': 9.455984895812418e-06, 'epoch': 1.06} {'loss': 0.3184, 'learning_rate': 9.455649416000713e-06, 'epoch': 1.06} {'loss': 0.2908, 'learning_rate': 9.455313936803476e-06, 'epoch': 1.06} {'loss': 0.38, 'learning_rate': 9.454978458221087e-06, 'epoch': 1.06} {'loss': 0.2739, 'learning_rate': 9.454642980253926e-06, 'epoch': 1.06} {'loss': 0.3776, 'learning_rate': 9.454307502902366e-06, 'epoch': 1.06} {'loss': 0.2422, 'learning_rate': 9.45397202616679e-06, 'epoch': 1.06} {'loss': 0.2802, 'learning_rate': 9.453636550047576e-06, 'epoch': 1.06} {'loss': 0.4202, 'learning_rate': 9.453301074545102e-06, 'epoch': 1.06} {'loss': 0.3934, 'learning_rate': 9.452965599659747e-06, 'epoch': 1.06} {'loss': 0.4065, 'learning_rate': 9.45263012539189e-06, 'epoch': 1.06} {'loss': 0.2831, 'learning_rate': 9.45229465174191e-06, 'epoch': 1.06} {'loss': 0.4956, 'learning_rate': 9.451959178710182e-06, 'epoch': 1.06} {'loss': 0.4053, 'learning_rate': 9.451623706297092e-06, 'epoch': 1.06} {'loss': 0.3112, 'learning_rate': 9.451288234503012e-06, 'epoch': 1.06} {'loss': 0.2824, 'learning_rate': 9.450952763328325e-06, 'epoch': 1.06} {'loss': 0.214, 'learning_rate': 9.450617292773407e-06, 'epoch': 1.06} {'loss': 0.3469, 'learning_rate': 9.45028182283864e-06, 'epoch': 1.07} {'loss': 0.4612, 'learning_rate': 9.449946353524393e-06, 'epoch': 1.07} {'loss': 0.309, 'learning_rate': 9.449610884831056e-06, 'epoch': 1.07} {'loss': 0.4722, 'learning_rate': 9.449275416759005e-06, 'epoch': 1.07} {'loss': 0.3406, 'learning_rate': 9.448939949308618e-06, 'epoch': 1.07} {'loss': 0.4299, 'learning_rate': 9.44860448248027e-06, 'epoch': 1.07} {'loss': 0.3379, 'learning_rate': 9.448269016274346e-06, 'epoch': 1.07} {'loss': 0.2661, 'learning_rate': 9.447933550691222e-06, 'epoch': 1.07} {'loss': 0.4832, 'learning_rate': 9.447598085731275e-06, 'epoch': 1.07} {'loss': 0.2809, 'learning_rate': 9.447262621394883e-06, 'epoch': 1.07} {'loss': 0.292, 'learning_rate': 9.446927157682427e-06, 'epoch': 1.07} {'loss': 0.1874, 'learning_rate': 9.446591694594285e-06, 'epoch': 1.07} {'loss': 0.3522, 'learning_rate': 9.446256232130835e-06, 'epoch': 1.07} {'loss': 0.2745, 'learning_rate': 9.445920770292459e-06, 'epoch': 1.07} {'loss': 0.418, 'learning_rate': 9.445585309079531e-06, 'epoch': 1.07} {'loss': 0.3677, 'learning_rate': 9.445249848492432e-06, 'epoch': 1.07} {'loss': 0.3651, 'learning_rate': 9.444914388531541e-06, 'epoch': 1.07} {'loss': 0.3235, 'learning_rate': 9.444578929197236e-06, 'epoch': 1.07} {'loss': 0.327, 'learning_rate': 9.444243470489895e-06, 'epoch': 1.07} {'loss': 0.4144, 'learning_rate': 9.443908012409898e-06, 'epoch': 1.07} {'loss': 0.3768, 'learning_rate': 9.443572554957622e-06, 'epoch': 1.07} {'loss': 0.3709, 'learning_rate': 9.44323709813345e-06, 'epoch': 1.07} {'loss': 0.2652, 'learning_rate': 9.442901641937756e-06, 'epoch': 1.07} {'loss': 0.3989, 'learning_rate': 9.44256618637092e-06, 'epoch': 1.07} {'loss': 0.4799, 'learning_rate': 9.442230731433319e-06, 'epoch': 1.07} {'loss': 0.3061, 'learning_rate': 9.441895277125336e-06, 'epoch': 1.07} {'loss': 0.2706, 'learning_rate': 9.441559823447344e-06, 'epoch': 1.07} {'loss': 0.3726, 'learning_rate': 9.441224370399728e-06, 'epoch': 1.07} {'loss': 0.4067, 'learning_rate': 9.440888917982861e-06, 'epoch': 1.07} {'loss': 0.2474, 'learning_rate': 9.440553466197126e-06, 'epoch': 1.07} {'loss': 0.3065, 'learning_rate': 9.440218015042898e-06, 'epoch': 1.07} {'loss': 0.2901, 'learning_rate': 9.439882564520558e-06, 'epoch': 1.07} {'loss': 0.5138, 'learning_rate': 9.439547114630485e-06, 'epoch': 1.07} {'loss': 0.2491, 'learning_rate': 9.439211665373057e-06, 'epoch': 1.07} {'loss': 0.4173, 'learning_rate': 9.438876216748653e-06, 'epoch': 1.07} {'loss': 0.4038, 'learning_rate': 9.438540768757649e-06, 'epoch': 1.07} {'loss': 0.4357, 'learning_rate': 9.438205321400425e-06, 'epoch': 1.07} {'loss': 0.3649, 'learning_rate': 9.437869874677362e-06, 'epoch': 1.07} {'loss': 0.4212, 'learning_rate': 9.437534428588838e-06, 'epoch': 1.07} {'loss': 0.337, 'learning_rate': 9.437198983135229e-06, 'epoch': 1.07} {'loss': 0.4573, 'learning_rate': 9.436863538316916e-06, 'epoch': 1.07} {'loss': 0.3159, 'learning_rate': 9.436528094134275e-06, 'epoch': 1.07} {'loss': 0.4532, 'learning_rate': 9.436192650587688e-06, 'epoch': 1.07} {'loss': 0.2796, 'learning_rate': 9.435857207677532e-06, 'epoch': 1.07} {'loss': 0.203, 'learning_rate': 9.435521765404186e-06, 'epoch': 1.07} {'loss': 0.4723, 'learning_rate': 9.43518632376803e-06, 'epoch': 1.07} {'loss': 0.4428, 'learning_rate': 9.43485088276944e-06, 'epoch': 1.07} {'loss': 0.3955, 'learning_rate': 9.434515442408798e-06, 'epoch': 1.07} {'loss': 0.2643, 'learning_rate': 9.434180002686479e-06, 'epoch': 1.07} {'loss': 0.3877, 'learning_rate': 9.433844563602861e-06, 'epoch': 1.07} {'loss': 0.3551, 'learning_rate': 9.433509125158327e-06, 'epoch': 1.07} {'loss': 0.2015, 'learning_rate': 9.433173687353255e-06, 'epoch': 1.07} {'loss': 0.1548, 'learning_rate': 9.43283825018802e-06, 'epoch': 1.07} {'loss': 0.2145, 'learning_rate': 9.432502813663002e-06, 'epoch': 1.07} {'loss': 0.4412, 'learning_rate': 9.432167377778582e-06, 'epoch': 1.07} {'loss': 0.3069, 'learning_rate': 9.431831942535136e-06, 'epoch': 1.07} {'loss': 0.1893, 'learning_rate': 9.431496507933043e-06, 'epoch': 1.07} {'loss': 0.4322, 'learning_rate': 9.431161073972684e-06, 'epoch': 1.07} {'loss': 0.3001, 'learning_rate': 9.430825640654435e-06, 'epoch': 1.07} {'loss': 0.1876, 'learning_rate': 9.430490207978676e-06, 'epoch': 1.07} {'loss': 0.3383, 'learning_rate': 9.430154775945788e-06, 'epoch': 1.07} {'loss': 0.3133, 'learning_rate': 9.429819344556145e-06, 'epoch': 1.07} {'loss': 0.5118, 'learning_rate': 9.429483913810127e-06, 'epoch': 1.07} {'loss': 0.4623, 'learning_rate': 9.429148483708111e-06, 'epoch': 1.07} {'loss': 0.4007, 'learning_rate': 9.42881305425048e-06, 'epoch': 1.07} {'loss': 0.3462, 'learning_rate': 9.42847762543761e-06, 'epoch': 1.07} {'loss': 0.3576, 'learning_rate': 9.428142197269881e-06, 'epoch': 1.07} {'loss': 0.4217, 'learning_rate': 9.42780676974767e-06, 'epoch': 1.07} {'loss': 0.4094, 'learning_rate': 9.427471342871356e-06, 'epoch': 1.07} {'loss': 0.2076, 'learning_rate': 9.42713591664132e-06, 'epoch': 1.07} {'loss': 0.4043, 'learning_rate': 9.426800491057937e-06, 'epoch': 1.07} {'loss': 0.2884, 'learning_rate': 9.426465066121585e-06, 'epoch': 1.07} {'loss': 0.4142, 'learning_rate': 9.426129641832648e-06, 'epoch': 1.07} {'loss': 0.1677, 'learning_rate': 9.425794218191502e-06, 'epoch': 1.07} {'loss': 0.3357, 'learning_rate': 9.425458795198524e-06, 'epoch': 1.07} {'loss': 0.2961, 'learning_rate': 9.425123372854093e-06, 'epoch': 1.07} {'loss': 0.3525, 'learning_rate': 9.42478795115859e-06, 'epoch': 1.07} {'loss': 0.4587, 'learning_rate': 9.42445253011239e-06, 'epoch': 1.07} {'loss': 0.2254, 'learning_rate': 9.424117109715874e-06, 'epoch': 1.07} {'loss': 0.3501, 'learning_rate': 9.423781689969421e-06, 'epoch': 1.07} {'loss': 0.3272, 'learning_rate': 9.42344627087341e-06, 'epoch': 1.07} {'loss': 0.4569, 'learning_rate': 9.423110852428215e-06, 'epoch': 1.07} {'loss': 0.3638, 'learning_rate': 9.422775434634222e-06, 'epoch': 1.07} {'loss': 0.3528, 'learning_rate': 9.422440017491802e-06, 'epoch': 1.07} {'loss': 0.4247, 'learning_rate': 9.42210460100134e-06, 'epoch': 1.07} {'loss': 0.3544, 'learning_rate': 9.421769185163212e-06, 'epoch': 1.07} {'loss': 0.2461, 'learning_rate': 9.421433769977799e-06, 'epoch': 1.07} {'loss': 0.3601, 'learning_rate': 9.421098355445474e-06, 'epoch': 1.07} {'loss': 0.4079, 'learning_rate': 9.420762941566619e-06, 'epoch': 1.07} {'loss': 0.3443, 'learning_rate': 9.420427528341613e-06, 'epoch': 1.07} {'loss': 0.3875, 'learning_rate': 9.420092115770833e-06, 'epoch': 1.07} {'loss': 0.3411, 'learning_rate': 9.41975670385466e-06, 'epoch': 1.07} {'loss': 0.3353, 'learning_rate': 9.419421292593472e-06, 'epoch': 1.07} {'loss': 0.3695, 'learning_rate': 9.419085881987646e-06, 'epoch': 1.07} {'loss': 0.4545, 'learning_rate': 9.418750472037562e-06, 'epoch': 1.07} {'loss': 0.3014, 'learning_rate': 9.418415062743597e-06, 'epoch': 1.07} {'loss': 0.2253, 'learning_rate': 9.418079654106131e-06, 'epoch': 1.07} {'loss': 0.1377, 'learning_rate': 9.417744246125543e-06, 'epoch': 1.07} {'loss': 0.409, 'learning_rate': 9.41740883880221e-06, 'epoch': 1.07} {'loss': 0.4979, 'learning_rate': 9.417073432136516e-06, 'epoch': 1.07} {'loss': 0.2886, 'learning_rate': 9.416738026128832e-06, 'epoch': 1.07} {'loss': 0.4033, 'learning_rate': 9.416402620779535e-06, 'epoch': 1.07} {'loss': 0.2895, 'learning_rate': 9.416067216089014e-06, 'epoch': 1.07} {'loss': 0.2828, 'learning_rate': 9.41573181205764e-06, 'epoch': 1.07} {'loss': 0.2653, 'learning_rate': 9.415396408685794e-06, 'epoch': 1.07} {'loss': 0.2841, 'learning_rate': 9.415061005973856e-06, 'epoch': 1.07} {'loss': 0.3892, 'learning_rate': 9.4147256039222e-06, 'epoch': 1.07} {'loss': 0.2991, 'learning_rate': 9.414390202531214e-06, 'epoch': 1.07} {'loss': 0.348, 'learning_rate': 9.414054801801265e-06, 'epoch': 1.07} {'loss': 0.3899, 'learning_rate': 9.413719401732737e-06, 'epoch': 1.07} {'loss': 0.3346, 'learning_rate': 9.41338400232601e-06, 'epoch': 1.07} {'loss': 0.2784, 'learning_rate': 9.413048603581459e-06, 'epoch': 1.07} {'loss': 0.4499, 'learning_rate': 9.412713205499466e-06, 'epoch': 1.07} {'loss': 0.4241, 'learning_rate': 9.412377808080406e-06, 'epoch': 1.07} {'loss': 0.4044, 'learning_rate': 9.412042411324661e-06, 'epoch': 1.07} {'loss': 0.3022, 'learning_rate': 9.411707015232608e-06, 'epoch': 1.07} {'loss': 0.2854, 'learning_rate': 9.411371619804626e-06, 'epoch': 1.07} {'loss': 0.4633, 'learning_rate': 9.411036225041094e-06, 'epoch': 1.07} {'loss': 0.3205, 'learning_rate': 9.41070083094239e-06, 'epoch': 1.07} {'loss': 0.3914, 'learning_rate': 9.410365437508892e-06, 'epoch': 1.07} {'loss': 0.3094, 'learning_rate': 9.410030044740982e-06, 'epoch': 1.07} {'loss': 0.3611, 'learning_rate': 9.409694652639033e-06, 'epoch': 1.07} {'loss': 0.2764, 'learning_rate': 9.409359261203427e-06, 'epoch': 1.07} {'loss': 0.237, 'learning_rate': 9.409023870434542e-06, 'epoch': 1.07} {'loss': 0.2483, 'learning_rate': 9.408688480332758e-06, 'epoch': 1.07} {'loss': 0.3576, 'learning_rate': 9.40835309089845e-06, 'epoch': 1.07} {'loss': 0.1996, 'learning_rate': 9.408017702132e-06, 'epoch': 1.07} {'loss': 0.283, 'learning_rate': 9.407682314033786e-06, 'epoch': 1.07} {'loss': 0.3946, 'learning_rate': 9.407346926604186e-06, 'epoch': 1.07} {'loss': 0.38, 'learning_rate': 9.407011539843577e-06, 'epoch': 1.07} {'loss': 0.2227, 'learning_rate': 9.406676153752342e-06, 'epoch': 1.07} {'loss': 0.3176, 'learning_rate': 9.406340768330853e-06, 'epoch': 1.07} {'loss': 0.2686, 'learning_rate': 9.406005383579495e-06, 'epoch': 1.07} {'loss': 0.2584, 'learning_rate': 9.405669999498646e-06, 'epoch': 1.07} {'loss': 0.4855, 'learning_rate': 9.40533461608868e-06, 'epoch': 1.07} {'loss': 0.342, 'learning_rate': 9.404999233349979e-06, 'epoch': 1.07} {'loss': 0.3831, 'learning_rate': 9.404663851282919e-06, 'epoch': 1.07} {'loss': 0.2643, 'learning_rate': 9.40432846988788e-06, 'epoch': 1.07} {'loss': 0.4576, 'learning_rate': 9.403993089165243e-06, 'epoch': 1.07} {'loss': 0.4366, 'learning_rate': 9.403657709115384e-06, 'epoch': 1.07} {'loss': 0.3792, 'learning_rate': 9.403322329738682e-06, 'epoch': 1.07} {'loss': 0.5317, 'learning_rate': 9.402986951035515e-06, 'epoch': 1.07} {'loss': 0.334, 'learning_rate': 9.402651573006262e-06, 'epoch': 1.07} {'loss': 0.384, 'learning_rate': 9.402316195651302e-06, 'epoch': 1.07} {'loss': 0.4173, 'learning_rate': 9.401980818971014e-06, 'epoch': 1.07} {'loss': 0.3288, 'learning_rate': 9.401645442965776e-06, 'epoch': 1.07} {'loss': 0.3637, 'learning_rate': 9.401310067635967e-06, 'epoch': 1.07} {'loss': 0.2699, 'learning_rate': 9.400974692981965e-06, 'epoch': 1.07} {'loss': 0.3322, 'learning_rate': 9.400639319004147e-06, 'epoch': 1.07} {'loss': 0.266, 'learning_rate': 9.400303945702894e-06, 'epoch': 1.07} {'loss': 0.3705, 'learning_rate': 9.399968573078584e-06, 'epoch': 1.07} {'loss': 0.3558, 'learning_rate': 9.399633201131594e-06, 'epoch': 1.07} {'loss': 0.4202, 'learning_rate': 9.399297829862305e-06, 'epoch': 1.07} {'loss': 0.3623, 'learning_rate': 9.398962459271097e-06, 'epoch': 1.07} {'loss': 0.2915, 'learning_rate': 9.398627089358343e-06, 'epoch': 1.07} {'loss': 0.3618, 'learning_rate': 9.398291720124425e-06, 'epoch': 1.07} {'loss': 0.5101, 'learning_rate': 9.397956351569722e-06, 'epoch': 1.07} {'loss': 0.2592, 'learning_rate': 9.397620983694611e-06, 'epoch': 1.07} {'loss': 0.3277, 'learning_rate': 9.397285616499473e-06, 'epoch': 1.07} {'loss': 0.2917, 'learning_rate': 9.396950249984685e-06, 'epoch': 1.07} {'loss': 0.4532, 'learning_rate': 9.396614884150623e-06, 'epoch': 1.07} {'loss': 0.3126, 'learning_rate': 9.396279518997669e-06, 'epoch': 1.07} {'loss': 0.4418, 'learning_rate': 9.395944154526202e-06, 'epoch': 1.07} {'loss': 0.4054, 'learning_rate': 9.395608790736597e-06, 'epoch': 1.07} {'loss': 0.2599, 'learning_rate': 9.395273427629236e-06, 'epoch': 1.07} {'loss': 0.3102, 'learning_rate': 9.394938065204496e-06, 'epoch': 1.07} {'loss': 0.308, 'learning_rate': 9.394602703462757e-06, 'epoch': 1.07} {'loss': 0.3364, 'learning_rate': 9.394267342404396e-06, 'epoch': 1.07} {'loss': 0.3983, 'learning_rate': 9.39393198202979e-06, 'epoch': 1.07} {'loss': 0.3347, 'learning_rate': 9.39359662233932e-06, 'epoch': 1.07} {'loss': 0.446, 'learning_rate': 9.393261263333367e-06, 'epoch': 1.07} {'loss': 0.4278, 'learning_rate': 9.392925905012303e-06, 'epoch': 1.07} {'loss': 0.309, 'learning_rate': 9.392590547376514e-06, 'epoch': 1.07} {'loss': 0.3682, 'learning_rate': 9.392255190426375e-06, 'epoch': 1.07} {'loss': 0.4487, 'learning_rate': 9.39191983416226e-06, 'epoch': 1.07} {'loss': 0.2176, 'learning_rate': 9.391584478584555e-06, 'epoch': 1.07} {'loss': 0.4021, 'learning_rate': 9.391249123693634e-06, 'epoch': 1.07} {'loss': 0.3912, 'learning_rate': 9.390913769489877e-06, 'epoch': 1.07} {'loss': 0.3646, 'learning_rate': 9.390578415973663e-06, 'epoch': 1.07} {'loss': 0.3337, 'learning_rate': 9.390243063145369e-06, 'epoch': 1.07} {'loss': 0.3681, 'learning_rate': 9.389907711005375e-06, 'epoch': 1.07} {'loss': 0.2702, 'learning_rate': 9.38957235955406e-06, 'epoch': 1.07} {'loss': 0.5041, 'learning_rate': 9.389237008791802e-06, 'epoch': 1.07} {'loss': 0.1707, 'learning_rate': 9.388901658718978e-06, 'epoch': 1.07} {'loss': 0.3836, 'learning_rate': 9.388566309335969e-06, 'epoch': 1.07} {'loss': 0.267, 'learning_rate': 9.388230960643152e-06, 'epoch': 1.07} {'loss': 0.3748, 'learning_rate': 9.387895612640908e-06, 'epoch': 1.07} {'loss': 0.2592, 'learning_rate': 9.387560265329612e-06, 'epoch': 1.07} {'loss': 0.2902, 'learning_rate': 9.387224918709642e-06, 'epoch': 1.07} {'loss': 0.158, 'learning_rate': 9.38688957278138e-06, 'epoch': 1.07} {'loss': 0.3468, 'learning_rate': 9.386554227545203e-06, 'epoch': 1.07} {'loss': 0.399, 'learning_rate': 9.38621888300149e-06, 'epoch': 1.07} {'loss': 0.4282, 'learning_rate': 9.38588353915062e-06, 'epoch': 1.07} {'loss': 0.3464, 'learning_rate': 9.385548195992968e-06, 'epoch': 1.07} {'loss': 0.3222, 'learning_rate': 9.385212853528915e-06, 'epoch': 1.07} {'loss': 0.272, 'learning_rate': 9.384877511758842e-06, 'epoch': 1.07} {'loss': 0.3853, 'learning_rate': 9.384542170683125e-06, 'epoch': 1.07} {'loss': 0.3815, 'learning_rate': 9.384206830302143e-06, 'epoch': 1.07} {'loss': 0.279, 'learning_rate': 9.383871490616275e-06, 'epoch': 1.07} {'loss': 0.2846, 'learning_rate': 9.383536151625898e-06, 'epoch': 1.07} {'loss': 0.4117, 'learning_rate': 9.383200813331389e-06, 'epoch': 1.07} {'loss': 0.3576, 'learning_rate': 9.38286547573313e-06, 'epoch': 1.07} {'loss': 0.1795, 'learning_rate': 9.3825301388315e-06, 'epoch': 1.07} {'loss': 0.4064, 'learning_rate': 9.382194802626876e-06, 'epoch': 1.07} {'loss': 0.4239, 'learning_rate': 9.381859467119636e-06, 'epoch': 1.07} {'loss': 0.1295, 'learning_rate': 9.38152413231016e-06, 'epoch': 1.07} {'loss': 0.2728, 'learning_rate': 9.381188798198828e-06, 'epoch': 1.07} {'loss': 0.3805, 'learning_rate': 9.380853464786013e-06, 'epoch': 1.07} {'loss': 0.2988, 'learning_rate': 9.380518132072098e-06, 'epoch': 1.07} {'loss': 0.299, 'learning_rate': 9.380182800057458e-06, 'epoch': 1.07} {'loss': 0.3155, 'learning_rate': 9.379847468742476e-06, 'epoch': 1.07} {'loss': 0.3382, 'learning_rate': 9.379512138127526e-06, 'epoch': 1.07} {'loss': 0.4626, 'learning_rate': 9.379176808212991e-06, 'epoch': 1.07} {'loss': 0.3776, 'learning_rate': 9.378841478999247e-06, 'epoch': 1.07} {'loss': 0.3597, 'learning_rate': 9.378506150486672e-06, 'epoch': 1.07} {'loss': 0.3998, 'learning_rate': 9.378170822675645e-06, 'epoch': 1.07} {'loss': 0.3346, 'learning_rate': 9.377835495566546e-06, 'epoch': 1.07} {'loss': 0.3975, 'learning_rate': 9.377500169159752e-06, 'epoch': 1.07} {'loss': 0.4329, 'learning_rate': 9.377164843455641e-06, 'epoch': 1.07} {'loss': 0.4786, 'learning_rate': 9.376829518454597e-06, 'epoch': 1.07} {'loss': 0.3671, 'learning_rate': 9.37649419415699e-06, 'epoch': 1.07} {'loss': 0.2446, 'learning_rate': 9.376158870563203e-06, 'epoch': 1.07} {'loss': 0.4167, 'learning_rate': 9.375823547673613e-06, 'epoch': 1.07} {'loss': 0.4191, 'learning_rate': 9.375488225488601e-06, 'epoch': 1.07} {'loss': 0.3448, 'learning_rate': 9.375152904008544e-06, 'epoch': 1.07} {'loss': 0.2323, 'learning_rate': 9.37481758323382e-06, 'epoch': 1.07} {'loss': 0.4471, 'learning_rate': 9.374482263164808e-06, 'epoch': 1.07} {'loss': 0.2112, 'learning_rate': 9.374146943801887e-06, 'epoch': 1.07} {'loss': 0.2817, 'learning_rate': 9.373811625145435e-06, 'epoch': 1.07} {'loss': 0.5147, 'learning_rate': 9.37347630719583e-06, 'epoch': 1.07} {'loss': 0.2913, 'learning_rate': 9.373140989953451e-06, 'epoch': 1.07} {'loss': 0.3724, 'learning_rate': 9.372805673418677e-06, 'epoch': 1.07} {'loss': 0.3206, 'learning_rate': 9.37247035759189e-06, 'epoch': 1.07} {'loss': 0.4156, 'learning_rate': 9.37213504247346e-06, 'epoch': 1.07} {'loss': 0.1818, 'learning_rate': 9.371799728063771e-06, 'epoch': 1.07} {'loss': 0.2971, 'learning_rate': 9.3714644143632e-06, 'epoch': 1.07} {'loss': 0.3093, 'learning_rate': 9.371129101372127e-06, 'epoch': 1.07} {'loss': 0.4921, 'learning_rate': 9.37079378909093e-06, 'epoch': 1.07} {'loss': 0.2977, 'learning_rate': 9.370458477519985e-06, 'epoch': 1.07} {'loss': 0.3375, 'learning_rate': 9.370123166659675e-06, 'epoch': 1.07} {'loss': 0.412, 'learning_rate': 9.369787856510376e-06, 'epoch': 1.07} {'loss': 0.2985, 'learning_rate': 9.369452547072466e-06, 'epoch': 1.07} {'loss': 0.367, 'learning_rate': 9.369117238346325e-06, 'epoch': 1.07} {'loss': 0.3498, 'learning_rate': 9.36878193033233e-06, 'epoch': 1.07} {'loss': 0.3666, 'learning_rate': 9.368446623030858e-06, 'epoch': 1.07} {'loss': 0.4598, 'learning_rate': 9.368111316442293e-06, 'epoch': 1.07} {'loss': 0.2877, 'learning_rate': 9.367776010567012e-06, 'epoch': 1.07} {'loss': 0.4317, 'learning_rate': 9.367440705405388e-06, 'epoch': 1.07} {'loss': 0.3521, 'learning_rate': 9.367105400957803e-06, 'epoch': 1.07} {'loss': 0.2707, 'learning_rate': 9.366770097224637e-06, 'epoch': 1.07} {'loss': 0.2357, 'learning_rate': 9.366434794206267e-06, 'epoch': 1.07} {'loss': 0.1924, 'learning_rate': 9.366099491903072e-06, 'epoch': 1.07} {'loss': 0.3878, 'learning_rate': 9.36576419031543e-06, 'epoch': 1.07} {'loss': 0.3623, 'learning_rate': 9.365428889443718e-06, 'epoch': 1.07} {'loss': 0.3646, 'learning_rate': 9.365093589288316e-06, 'epoch': 1.07} {'loss': 0.3311, 'learning_rate': 9.364758289849603e-06, 'epoch': 1.07} {'loss': 0.2384, 'learning_rate': 9.36442299112796e-06, 'epoch': 1.07} {'loss': 0.3663, 'learning_rate': 9.364087693123759e-06, 'epoch': 1.07} {'loss': 0.4039, 'learning_rate': 9.363752395837384e-06, 'epoch': 1.07} {'loss': 0.3416, 'learning_rate': 9.363417099269213e-06, 'epoch': 1.07} {'loss': 0.3217, 'learning_rate': 9.363081803419622e-06, 'epoch': 1.07} {'loss': 0.2832, 'learning_rate': 9.36274650828899e-06, 'epoch': 1.07} {'loss': 0.2784, 'learning_rate': 9.362411213877693e-06, 'epoch': 1.07} {'loss': 0.334, 'learning_rate': 9.362075920186116e-06, 'epoch': 1.07} {'loss': 0.2206, 'learning_rate': 9.361740627214633e-06, 'epoch': 1.07} {'loss': 0.317, 'learning_rate': 9.361405334963624e-06, 'epoch': 1.07} {'loss': 0.2281, 'learning_rate': 9.361070043433466e-06, 'epoch': 1.07} {'loss': 0.1993, 'learning_rate': 9.360734752624538e-06, 'epoch': 1.07} {'loss': 0.3678, 'learning_rate': 9.360399462537221e-06, 'epoch': 1.07} {'loss': 0.425, 'learning_rate': 9.36006417317189e-06, 'epoch': 1.07} {'loss': 0.2348, 'learning_rate': 9.359728884528925e-06, 'epoch': 1.07} {'loss': 0.4547, 'learning_rate': 9.359393596608705e-06, 'epoch': 1.07} {'loss': 0.4017, 'learning_rate': 9.359058309411608e-06, 'epoch': 1.07} {'loss': 0.2998, 'learning_rate': 9.358723022938012e-06, 'epoch': 1.07} {'loss': 0.3763, 'learning_rate': 9.358387737188296e-06, 'epoch': 1.07} {'loss': 0.4232, 'learning_rate': 9.358052452162836e-06, 'epoch': 1.07} {'loss': 0.4132, 'learning_rate': 9.357717167862015e-06, 'epoch': 1.07} {'loss': 0.2802, 'learning_rate': 9.35738188428621e-06, 'epoch': 1.07} {'loss': 0.3021, 'learning_rate': 9.357046601435795e-06, 'epoch': 1.07} {'loss': 0.3244, 'learning_rate': 9.356711319311155e-06, 'epoch': 1.07} {'loss': 0.3203, 'learning_rate': 9.356376037912665e-06, 'epoch': 1.07} {'loss': 0.2803, 'learning_rate': 9.356040757240703e-06, 'epoch': 1.07} {'loss': 0.2248, 'learning_rate': 9.355705477295649e-06, 'epoch': 1.07} {'loss': 0.3595, 'learning_rate': 9.355370198077882e-06, 'epoch': 1.07} {'loss': 0.353, 'learning_rate': 9.35503491958778e-06, 'epoch': 1.07} {'loss': 0.1943, 'learning_rate': 9.35469964182572e-06, 'epoch': 1.07} {'loss': 0.2527, 'learning_rate': 9.35436436479208e-06, 'epoch': 1.07} {'loss': 0.3724, 'learning_rate': 9.354029088487242e-06, 'epoch': 1.07} {'loss': 0.3446, 'learning_rate': 9.353693812911581e-06, 'epoch': 1.07} {'loss': 0.199, 'learning_rate': 9.353358538065478e-06, 'epoch': 1.07} {'loss': 0.4138, 'learning_rate': 9.353023263949308e-06, 'epoch': 1.07} {'loss': 0.4154, 'learning_rate': 9.352687990563453e-06, 'epoch': 1.07} {'loss': 0.2942, 'learning_rate': 9.352352717908291e-06, 'epoch': 1.07} {'loss': 0.2686, 'learning_rate': 9.3520174459842e-06, 'epoch': 1.07} {'loss': 0.3872, 'learning_rate': 9.351682174791557e-06, 'epoch': 1.07} {'loss': 0.3017, 'learning_rate': 9.35134690433074e-06, 'epoch': 1.07} {'loss': 0.3509, 'learning_rate': 9.35101163460213e-06, 'epoch': 1.07} {'loss': 0.3312, 'learning_rate': 9.350676365606106e-06, 'epoch': 1.07} {'loss': 0.2974, 'learning_rate': 9.350341097343045e-06, 'epoch': 1.07} {'loss': 0.2857, 'learning_rate': 9.35000582981332e-06, 'epoch': 1.07} {'loss': 0.4662, 'learning_rate': 9.349670563017319e-06, 'epoch': 1.07} {'loss': 0.3488, 'learning_rate': 9.349335296955417e-06, 'epoch': 1.07} {'loss': 0.3183, 'learning_rate': 9.34900003162799e-06, 'epoch': 1.07} {'loss': 0.3342, 'learning_rate': 9.348664767035421e-06, 'epoch': 1.07} {'loss': 0.2918, 'learning_rate': 9.348329503178083e-06, 'epoch': 1.07} {'loss': 0.4325, 'learning_rate': 9.347994240056357e-06, 'epoch': 1.07} {'loss': 0.4652, 'learning_rate': 9.347658977670626e-06, 'epoch': 1.07} {'loss': 0.2513, 'learning_rate': 9.34732371602126e-06, 'epoch': 1.07} {'loss': 0.3123, 'learning_rate': 9.34698845510864e-06, 'epoch': 1.07} {'loss': 0.3255, 'learning_rate': 9.346653194933148e-06, 'epoch': 1.07} {'loss': 0.4602, 'learning_rate': 9.346317935495161e-06, 'epoch': 1.07} {'loss': 0.2016, 'learning_rate': 9.345982676795055e-06, 'epoch': 1.07} {'loss': 0.3068, 'learning_rate': 9.345647418833211e-06, 'epoch': 1.07} {'loss': 0.3711, 'learning_rate': 9.345312161610007e-06, 'epoch': 1.07} {'loss': 0.2877, 'learning_rate': 9.34497690512582e-06, 'epoch': 1.07} {'loss': 0.4379, 'learning_rate': 9.34464164938103e-06, 'epoch': 1.07} {'loss': 0.3399, 'learning_rate': 9.344306394376015e-06, 'epoch': 1.07} {'loss': 0.3143, 'learning_rate': 9.343971140111153e-06, 'epoch': 1.07} {'loss': 0.2176, 'learning_rate': 9.343635886586823e-06, 'epoch': 1.07} {'loss': 0.4201, 'learning_rate': 9.343300633803407e-06, 'epoch': 1.07} {'loss': 0.2786, 'learning_rate': 9.342965381761276e-06, 'epoch': 1.07} {'loss': 0.2646, 'learning_rate': 9.342630130460812e-06, 'epoch': 1.07} {'loss': 0.3224, 'learning_rate': 9.342294879902393e-06, 'epoch': 1.07} {'loss': 0.4813, 'learning_rate': 9.3419596300864e-06, 'epoch': 1.07} {'loss': 0.4022, 'learning_rate': 9.341624381013209e-06, 'epoch': 1.07} {'loss': 0.32, 'learning_rate': 9.341289132683198e-06, 'epoch': 1.07} {'loss': 0.3423, 'learning_rate': 9.340953885096747e-06, 'epoch': 1.07} {'loss': 0.3151, 'learning_rate': 9.340618638254233e-06, 'epoch': 1.07} {'loss': 0.4117, 'learning_rate': 9.340283392156035e-06, 'epoch': 1.07} {'loss': 0.3793, 'learning_rate': 9.339948146802532e-06, 'epoch': 1.07} {'loss': 0.4132, 'learning_rate': 9.339612902194102e-06, 'epoch': 1.07} {'loss': 0.2599, 'learning_rate': 9.339277658331124e-06, 'epoch': 1.07} {'loss': 0.5239, 'learning_rate': 9.338942415213978e-06, 'epoch': 1.07} {'loss': 0.207, 'learning_rate': 9.338607172843038e-06, 'epoch': 1.07} {'loss': 0.3152, 'learning_rate': 9.338271931218684e-06, 'epoch': 1.07} {'loss': 0.3087, 'learning_rate': 9.337936690341296e-06, 'epoch': 1.07} {'loss': 0.4309, 'learning_rate': 9.337601450211252e-06, 'epoch': 1.07} {'loss': 0.2762, 'learning_rate': 9.337266210828928e-06, 'epoch': 1.07} {'loss': 0.3316, 'learning_rate': 9.336930972194705e-06, 'epoch': 1.07} {'loss': 0.2563, 'learning_rate': 9.336595734308962e-06, 'epoch': 1.07} {'loss': 0.2724, 'learning_rate': 9.336260497172076e-06, 'epoch': 1.07} {'loss': 0.3555, 'learning_rate': 9.335925260784426e-06, 'epoch': 1.07} {'loss': 0.2909, 'learning_rate': 9.335590025146389e-06, 'epoch': 1.07} {'loss': 0.2393, 'learning_rate': 9.335254790258344e-06, 'epoch': 1.07} {'loss': 0.2845, 'learning_rate': 9.334919556120672e-06, 'epoch': 1.07} {'loss': 0.2157, 'learning_rate': 9.33458432273375e-06, 'epoch': 1.07} {'loss': 0.2603, 'learning_rate': 9.334249090097955e-06, 'epoch': 1.07} {'loss': 0.3707, 'learning_rate': 9.333913858213665e-06, 'epoch': 1.07} {'loss': 0.4014, 'learning_rate': 9.33357862708126e-06, 'epoch': 1.07} {'loss': 0.3051, 'learning_rate': 9.333243396701116e-06, 'epoch': 1.07} {'loss': 0.2646, 'learning_rate': 9.332908167073617e-06, 'epoch': 1.07} {'loss': 0.3288, 'learning_rate': 9.332572938199137e-06, 'epoch': 1.07} {'loss': 0.2276, 'learning_rate': 9.332237710078053e-06, 'epoch': 1.07} {'loss': 0.3425, 'learning_rate': 9.331902482710748e-06, 'epoch': 1.07} {'loss': 0.368, 'learning_rate': 9.331567256097596e-06, 'epoch': 1.07} {'loss': 0.3247, 'learning_rate': 9.331232030238979e-06, 'epoch': 1.07} {'loss': 0.3542, 'learning_rate': 9.330896805135274e-06, 'epoch': 1.07} {'loss': 0.3176, 'learning_rate': 9.330561580786858e-06, 'epoch': 1.07} {'loss': 0.2872, 'learning_rate': 9.330226357194113e-06, 'epoch': 1.07} {'loss': 0.3495, 'learning_rate': 9.329891134357414e-06, 'epoch': 1.07} {'loss': 0.3305, 'learning_rate': 9.329555912277139e-06, 'epoch': 1.07} {'loss': 0.4153, 'learning_rate': 9.32922069095367e-06, 'epoch': 1.07} {'loss': 0.3692, 'learning_rate': 9.328885470387383e-06, 'epoch': 1.07} {'loss': 0.3663, 'learning_rate': 9.328550250578654e-06, 'epoch': 1.07} {'loss': 0.3259, 'learning_rate': 9.328215031527867e-06, 'epoch': 1.07} {'loss': 0.2963, 'learning_rate': 9.327879813235396e-06, 'epoch': 1.07} {'loss': 0.4264, 'learning_rate': 9.327544595701621e-06, 'epoch': 1.07} {'loss': 0.3334, 'learning_rate': 9.32720937892692e-06, 'epoch': 1.07} {'loss': 0.2347, 'learning_rate': 9.326874162911672e-06, 'epoch': 1.07} {'loss': 0.3644, 'learning_rate': 9.326538947656257e-06, 'epoch': 1.07} {'loss': 0.4897, 'learning_rate': 9.326203733161049e-06, 'epoch': 1.07} {'loss': 0.3594, 'learning_rate': 9.325868519426432e-06, 'epoch': 1.07} {'loss': 0.3883, 'learning_rate': 9.325533306452777e-06, 'epoch': 1.07} {'loss': 0.312, 'learning_rate': 9.32519809424047e-06, 'epoch': 1.07} {'loss': 0.3863, 'learning_rate': 9.324862882789883e-06, 'epoch': 1.07} {'loss': 0.2808, 'learning_rate': 9.3245276721014e-06, 'epoch': 1.07} {'loss': 0.3738, 'learning_rate': 9.324192462175396e-06, 'epoch': 1.07} {'loss': 0.4191, 'learning_rate': 9.32385725301225e-06, 'epoch': 1.07} {'loss': 0.2528, 'learning_rate': 9.32352204461234e-06, 'epoch': 1.07} {'loss': 0.3284, 'learning_rate': 9.323186836976045e-06, 'epoch': 1.07} {'loss': 0.2447, 'learning_rate': 9.322851630103745e-06, 'epoch': 1.07} {'loss': 0.2549, 'learning_rate': 9.322516423995814e-06, 'epoch': 1.07} {'loss': 0.3197, 'learning_rate': 9.322181218652634e-06, 'epoch': 1.07} {'loss': 0.3884, 'learning_rate': 9.321846014074584e-06, 'epoch': 1.07} {'loss': 0.3204, 'learning_rate': 9.321510810262042e-06, 'epoch': 1.07} {'loss': 0.3393, 'learning_rate': 9.321175607215385e-06, 'epoch': 1.07} {'loss': 0.4013, 'learning_rate': 9.320840404934988e-06, 'epoch': 1.07} {'loss': 0.4448, 'learning_rate': 9.320505203421236e-06, 'epoch': 1.07} {'loss': 0.3784, 'learning_rate': 9.320170002674504e-06, 'epoch': 1.07} {'loss': 0.3404, 'learning_rate': 9.31983480269517e-06, 'epoch': 1.07} {'loss': 0.2131, 'learning_rate': 9.319499603483614e-06, 'epoch': 1.07} {'loss': 0.3288, 'learning_rate': 9.319164405040214e-06, 'epoch': 1.07} {'loss': 0.3737, 'learning_rate': 9.318829207365345e-06, 'epoch': 1.07} {'loss': 0.4297, 'learning_rate': 9.31849401045939e-06, 'epoch': 1.07} {'loss': 0.392, 'learning_rate': 9.318158814322727e-06, 'epoch': 1.07} {'loss': 0.2773, 'learning_rate': 9.317823618955732e-06, 'epoch': 1.07} {'loss': 0.4207, 'learning_rate': 9.317488424358784e-06, 'epoch': 1.07} {'loss': 0.2697, 'learning_rate': 9.317153230532262e-06, 'epoch': 1.07} {'loss': 0.2428, 'learning_rate': 9.316818037476542e-06, 'epoch': 1.07} {'loss': 0.3088, 'learning_rate': 9.316482845192006e-06, 'epoch': 1.07} {'loss': 0.2728, 'learning_rate': 9.316147653679031e-06, 'epoch': 1.07} {'loss': 0.5038, 'learning_rate': 9.315812462937996e-06, 'epoch': 1.07} {'loss': 0.3447, 'learning_rate': 9.31547727296928e-06, 'epoch': 1.07} {'loss': 0.279, 'learning_rate': 9.31514208377326e-06, 'epoch': 1.07} {'loss': 0.3726, 'learning_rate': 9.314806895350311e-06, 'epoch': 1.07} {'loss': 0.413, 'learning_rate': 9.314471707700818e-06, 'epoch': 1.07} {'loss': 0.2578, 'learning_rate': 9.314136520825155e-06, 'epoch': 1.07} {'loss': 0.4494, 'learning_rate': 9.313801334723702e-06, 'epoch': 1.07} {'loss': 0.3275, 'learning_rate': 9.313466149396836e-06, 'epoch': 1.07} {'loss': 0.3117, 'learning_rate': 9.313130964844936e-06, 'epoch': 1.07} {'loss': 0.2802, 'learning_rate': 9.31279578106838e-06, 'epoch': 1.07} {'loss': 0.2844, 'learning_rate': 9.312460598067548e-06, 'epoch': 1.07} {'loss': 0.3969, 'learning_rate': 9.312125415842816e-06, 'epoch': 1.07} {'loss': 0.4189, 'learning_rate': 9.311790234394566e-06, 'epoch': 1.07} {'loss': 0.2152, 'learning_rate': 9.311455053723172e-06, 'epoch': 1.07} {'loss': 0.2672, 'learning_rate': 9.311119873829014e-06, 'epoch': 1.07} {'loss': 0.4482, 'learning_rate': 9.310784694712471e-06, 'epoch': 1.07} {'loss': 0.3959, 'learning_rate': 9.310449516373921e-06, 'epoch': 1.07} {'loss': 0.2711, 'learning_rate': 9.310114338813746e-06, 'epoch': 1.07} {'loss': 0.4575, 'learning_rate': 9.309779162032317e-06, 'epoch': 1.07} {'loss': 0.3463, 'learning_rate': 9.309443986030017e-06, 'epoch': 1.07} {'loss': 0.3437, 'learning_rate': 9.309108810807222e-06, 'epoch': 1.07} {'loss': 0.2537, 'learning_rate': 9.308773636364312e-06, 'epoch': 1.07} {'loss': 0.355, 'learning_rate': 9.308438462701667e-06, 'epoch': 1.07} {'loss': 0.3143, 'learning_rate': 9.308103289819661e-06, 'epoch': 1.07} {'loss': 0.286, 'learning_rate': 9.307768117718677e-06, 'epoch': 1.07} {'loss': 0.569, 'learning_rate': 9.307432946399091e-06, 'epoch': 1.07} {'loss': 0.5006, 'learning_rate': 9.30709777586128e-06, 'epoch': 1.07} {'loss': 0.2146, 'learning_rate': 9.306762606105625e-06, 'epoch': 1.07} {'loss': 0.1529, 'learning_rate': 9.306427437132503e-06, 'epoch': 1.07} {'loss': 0.3434, 'learning_rate': 9.306092268942292e-06, 'epoch': 1.07} {'loss': 0.3634, 'learning_rate': 9.305757101535373e-06, 'epoch': 1.07} {'loss': 0.3658, 'learning_rate': 9.30542193491212e-06, 'epoch': 1.07} {'loss': 0.3561, 'learning_rate': 9.305086769072916e-06, 'epoch': 1.07} {'loss': 0.349, 'learning_rate': 9.304751604018135e-06, 'epoch': 1.07} {'loss': 0.3504, 'learning_rate': 9.304416439748157e-06, 'epoch': 1.07} {'loss': 0.2205, 'learning_rate': 9.30408127626336e-06, 'epoch': 1.07} {'loss': 0.444, 'learning_rate': 9.303746113564123e-06, 'epoch': 1.07} {'loss': 0.3725, 'learning_rate': 9.303410951650826e-06, 'epoch': 1.07} {'loss': 0.4625, 'learning_rate': 9.303075790523843e-06, 'epoch': 1.07} {'loss': 0.3634, 'learning_rate': 9.302740630183557e-06, 'epoch': 1.07} {'loss': 0.3463, 'learning_rate': 9.302405470630343e-06, 'epoch': 1.07} {'loss': 0.4718, 'learning_rate': 9.302070311864582e-06, 'epoch': 1.07} {'loss': 0.3121, 'learning_rate': 9.301735153886649e-06, 'epoch': 1.07} {'loss': 0.377, 'learning_rate': 9.301399996696928e-06, 'epoch': 1.07} {'loss': 0.4284, 'learning_rate': 9.30106484029579e-06, 'epoch': 1.07} {'loss': 0.3372, 'learning_rate': 9.300729684683618e-06, 'epoch': 1.07} {'loss': 0.3143, 'learning_rate': 9.30039452986079e-06, 'epoch': 1.07} {'loss': 0.3243, 'learning_rate': 9.30005937582768e-06, 'epoch': 1.07} {'loss': 0.4273, 'learning_rate': 9.299724222584674e-06, 'epoch': 1.07} {'loss': 0.2999, 'learning_rate': 9.299389070132144e-06, 'epoch': 1.07} {'loss': 0.2165, 'learning_rate': 9.299053918470471e-06, 'epoch': 1.07} {'loss': 0.3761, 'learning_rate': 9.298718767600033e-06, 'epoch': 1.07} {'loss': 0.2925, 'learning_rate': 9.298383617521209e-06, 'epoch': 1.07} {'loss': 0.2435, 'learning_rate': 9.298048468234375e-06, 'epoch': 1.07} {'loss': 0.3209, 'learning_rate': 9.297713319739911e-06, 'epoch': 1.07} {'loss': 0.2907, 'learning_rate': 9.297378172038195e-06, 'epoch': 1.07} {'loss': 0.2651, 'learning_rate': 9.297043025129606e-06, 'epoch': 1.07} {'loss': 0.5833, 'learning_rate': 9.296707879014524e-06, 'epoch': 1.07} {'loss': 0.2909, 'learning_rate': 9.296372733693323e-06, 'epoch': 1.07} {'loss': 0.306, 'learning_rate': 9.296037589166382e-06, 'epoch': 1.07} {'loss': 0.2363, 'learning_rate': 9.295702445434083e-06, 'epoch': 1.07} {'loss': 0.2624, 'learning_rate': 9.295367302496801e-06, 'epoch': 1.07} {'loss': 0.4003, 'learning_rate': 9.295032160354915e-06, 'epoch': 1.07} {'loss': 0.487, 'learning_rate': 9.294697019008803e-06, 'epoch': 1.07} {'loss': 0.249, 'learning_rate': 9.294361878458844e-06, 'epoch': 1.07} {'loss': 0.2526, 'learning_rate': 9.294026738705418e-06, 'epoch': 1.07} {'loss': 0.3602, 'learning_rate': 9.2936915997489e-06, 'epoch': 1.07} {'loss': 0.2867, 'learning_rate': 9.29335646158967e-06, 'epoch': 1.07} {'loss': 0.4237, 'learning_rate': 9.293021324228106e-06, 'epoch': 1.07} {'loss': 0.4216, 'learning_rate': 9.292686187664588e-06, 'epoch': 1.07} {'loss': 0.3314, 'learning_rate': 9.292351051899495e-06, 'epoch': 1.07} {'loss': 0.3152, 'learning_rate': 9.292015916933199e-06, 'epoch': 1.07} {'loss': 0.2312, 'learning_rate': 9.291680782766082e-06, 'epoch': 1.07} {'loss': 0.3115, 'learning_rate': 9.291345649398526e-06, 'epoch': 1.07} {'loss': 0.502, 'learning_rate': 9.291010516830902e-06, 'epoch': 1.07} {'loss': 0.3694, 'learning_rate': 9.290675385063596e-06, 'epoch': 1.07} {'loss': 0.3141, 'learning_rate': 9.29034025409698e-06, 'epoch': 1.07} {'loss': 0.2657, 'learning_rate': 9.290005123931436e-06, 'epoch': 1.07} {'loss': 0.349, 'learning_rate': 9.28966999456734e-06, 'epoch': 1.07} {'loss': 0.4099, 'learning_rate': 9.289334866005073e-06, 'epoch': 1.07} {'loss': 0.2449, 'learning_rate': 9.288999738245012e-06, 'epoch': 1.07} {'loss': 0.3541, 'learning_rate': 9.288664611287535e-06, 'epoch': 1.08} {'loss': 0.3281, 'learning_rate': 9.288329485133018e-06, 'epoch': 1.08} {'loss': 0.2695, 'learning_rate': 9.287994359781847e-06, 'epoch': 1.08} {'loss': 0.2881, 'learning_rate': 9.28765923523439e-06, 'epoch': 1.08} {'loss': 0.3822, 'learning_rate': 9.287324111491033e-06, 'epoch': 1.08} {'loss': 0.2096, 'learning_rate': 9.28698898855215e-06, 'epoch': 1.08} {'loss': 0.3719, 'learning_rate': 9.286653866418121e-06, 'epoch': 1.08} {'loss': 0.1263, 'learning_rate': 9.286318745089324e-06, 'epoch': 1.08} {'loss': 0.3794, 'learning_rate': 9.285983624566138e-06, 'epoch': 1.08} {'loss': 0.4235, 'learning_rate': 9.28564850484894e-06, 'epoch': 1.08} {'loss': 0.2675, 'learning_rate': 9.28531338593811e-06, 'epoch': 1.08} {'loss': 0.4037, 'learning_rate': 9.284978267834025e-06, 'epoch': 1.08} {'loss': 0.3103, 'learning_rate': 9.284643150537062e-06, 'epoch': 1.08} {'loss': 0.3908, 'learning_rate': 9.284308034047603e-06, 'epoch': 1.08} {'loss': 0.2363, 'learning_rate': 9.283972918366023e-06, 'epoch': 1.08} {'loss': 0.4631, 'learning_rate': 9.283637803492704e-06, 'epoch': 1.08} {'loss': 0.392, 'learning_rate': 9.283302689428016e-06, 'epoch': 1.08} {'loss': 0.2678, 'learning_rate': 9.282967576172347e-06, 'epoch': 1.08} {'loss': 0.3234, 'learning_rate': 9.282632463726069e-06, 'epoch': 1.08} {'loss': 0.2374, 'learning_rate': 9.282297352089564e-06, 'epoch': 1.08} {'loss': 0.3624, 'learning_rate': 9.28196224126321e-06, 'epoch': 1.08} {'loss': 0.3744, 'learning_rate': 9.281627131247382e-06, 'epoch': 1.08} {'loss': 0.4108, 'learning_rate': 9.281292022042464e-06, 'epoch': 1.08} {'loss': 0.3263, 'learning_rate': 9.280956913648827e-06, 'epoch': 1.08} {'loss': 0.5137, 'learning_rate': 9.280621806066854e-06, 'epoch': 1.08} {'loss': 0.4344, 'learning_rate': 9.280286699296923e-06, 'epoch': 1.08} {'loss': 0.1978, 'learning_rate': 9.27995159333941e-06, 'epoch': 1.08} {'loss': 0.3979, 'learning_rate': 9.279616488194695e-06, 'epoch': 1.08} {'loss': 0.259, 'learning_rate': 9.279281383863157e-06, 'epoch': 1.08} {'loss': 0.3537, 'learning_rate': 9.278946280345172e-06, 'epoch': 1.08} {'loss': 0.3578, 'learning_rate': 9.27861117764112e-06, 'epoch': 1.08} {'loss': 0.353, 'learning_rate': 9.27827607575138e-06, 'epoch': 1.08} {'loss': 0.3854, 'learning_rate': 9.277940974676327e-06, 'epoch': 1.08} {'loss': 0.3166, 'learning_rate': 9.277605874416343e-06, 'epoch': 1.08} {'loss': 0.3408, 'learning_rate': 9.277270774971804e-06, 'epoch': 1.08} {'loss': 0.3912, 'learning_rate': 9.276935676343088e-06, 'epoch': 1.08} {'loss': 0.2894, 'learning_rate': 9.276600578530578e-06, 'epoch': 1.08} {'loss': 0.3796, 'learning_rate': 9.276265481534645e-06, 'epoch': 1.08} {'loss': 0.3504, 'learning_rate': 9.27593038535567e-06, 'epoch': 1.08} {'loss': 0.3449, 'learning_rate': 9.275595289994035e-06, 'epoch': 1.08} {'loss': 0.411, 'learning_rate': 9.275260195450111e-06, 'epoch': 1.08} {'loss': 0.2407, 'learning_rate': 9.274925101724283e-06, 'epoch': 1.08} {'loss': 0.2039, 'learning_rate': 9.274590008816925e-06, 'epoch': 1.08} {'loss': 0.2007, 'learning_rate': 9.274254916728418e-06, 'epoch': 1.08} {'loss': 0.4606, 'learning_rate': 9.27391982545914e-06, 'epoch': 1.08} {'loss': 0.2448, 'learning_rate': 9.273584735009467e-06, 'epoch': 1.08} {'loss': 0.4853, 'learning_rate': 9.27324964537978e-06, 'epoch': 1.08} {'loss': 0.3019, 'learning_rate': 9.272914556570456e-06, 'epoch': 1.08} {'loss': 0.2144, 'learning_rate': 9.272579468581873e-06, 'epoch': 1.08} {'loss': 0.2783, 'learning_rate': 9.27224438141441e-06, 'epoch': 1.08} {'loss': 0.194, 'learning_rate': 9.271909295068445e-06, 'epoch': 1.08} {'loss': 0.3956, 'learning_rate': 9.271574209544354e-06, 'epoch': 1.08} {'loss': 0.328, 'learning_rate': 9.271239124842518e-06, 'epoch': 1.08} {'loss': 0.4031, 'learning_rate': 9.270904040963314e-06, 'epoch': 1.08} {'loss': 0.2661, 'learning_rate': 9.27056895790712e-06, 'epoch': 1.08} {'loss': 0.4489, 'learning_rate': 9.270233875674318e-06, 'epoch': 1.08} {'loss': 0.3696, 'learning_rate': 9.26989879426528e-06, 'epoch': 1.08} {'loss': 0.3134, 'learning_rate': 9.269563713680389e-06, 'epoch': 1.08} {'loss': 0.5263, 'learning_rate': 9.26922863392002e-06, 'epoch': 1.08} {'loss': 0.3178, 'learning_rate': 9.268893554984555e-06, 'epoch': 1.08} {'loss': 0.4688, 'learning_rate': 9.268558476874369e-06, 'epoch': 1.08} {'loss': 0.2383, 'learning_rate': 9.268223399589841e-06, 'epoch': 1.08} {'loss': 0.4225, 'learning_rate': 9.267888323131354e-06, 'epoch': 1.08} {'loss': 0.2877, 'learning_rate': 9.267553247499277e-06, 'epoch': 1.08} {'loss': 0.2242, 'learning_rate': 9.267218172693995e-06, 'epoch': 1.08} {'loss': 0.2731, 'learning_rate': 9.266883098715884e-06, 'epoch': 1.08} {'loss': 0.3795, 'learning_rate': 9.266548025565321e-06, 'epoch': 1.08} {'loss': 0.4837, 'learning_rate': 9.266212953242687e-06, 'epoch': 1.08} {'loss': 0.1961, 'learning_rate': 9.265877881748358e-06, 'epoch': 1.08} {'loss': 0.3984, 'learning_rate': 9.265542811082715e-06, 'epoch': 1.08} {'loss': 0.4286, 'learning_rate': 9.265207741246133e-06, 'epoch': 1.08} {'loss': 0.349, 'learning_rate': 9.264872672238993e-06, 'epoch': 1.08} {'loss': 0.3674, 'learning_rate': 9.264537604061672e-06, 'epoch': 1.08} {'loss': 0.3429, 'learning_rate': 9.264202536714549e-06, 'epoch': 1.08} {'loss': 0.426, 'learning_rate': 9.263867470197998e-06, 'epoch': 1.08} {'loss': 0.2989, 'learning_rate': 9.263532404512405e-06, 'epoch': 1.08} {'loss': 0.3191, 'learning_rate': 9.263197339658142e-06, 'epoch': 1.08} {'loss': 0.1837, 'learning_rate': 9.262862275635588e-06, 'epoch': 1.08} {'loss': 0.3359, 'learning_rate': 9.262527212445123e-06, 'epoch': 1.08} {'loss': 0.2415, 'learning_rate': 9.262192150087126e-06, 'epoch': 1.08} {'loss': 0.3041, 'learning_rate': 9.261857088561971e-06, 'epoch': 1.08} {'loss': 0.3501, 'learning_rate': 9.261522027870041e-06, 'epoch': 1.08} {'loss': 0.3358, 'learning_rate': 9.261186968011712e-06, 'epoch': 1.08} {'loss': 0.2573, 'learning_rate': 9.260851908987362e-06, 'epoch': 1.08} {'loss': 0.2844, 'learning_rate': 9.26051685079737e-06, 'epoch': 1.08} {'loss': 0.1911, 'learning_rate': 9.260181793442112e-06, 'epoch': 1.08} {'loss': 0.3586, 'learning_rate': 9.25984673692197e-06, 'epoch': 1.08} {'loss': 0.3917, 'learning_rate': 9.25951168123732e-06, 'epoch': 1.08} {'loss': 0.4322, 'learning_rate': 9.259176626388542e-06, 'epoch': 1.08} {'loss': 0.3154, 'learning_rate': 9.258841572376011e-06, 'epoch': 1.08} {'loss': 0.3072, 'learning_rate': 9.258506519200106e-06, 'epoch': 1.08} {'loss': 0.2484, 'learning_rate': 9.258171466861207e-06, 'epoch': 1.08} {'loss': 0.3087, 'learning_rate': 9.257836415359692e-06, 'epoch': 1.08} {'loss': 0.5521, 'learning_rate': 9.25750136469594e-06, 'epoch': 1.08} {'loss': 0.2561, 'learning_rate': 9.257166314870324e-06, 'epoch': 1.08} {'loss': 0.4022, 'learning_rate': 9.256831265883228e-06, 'epoch': 1.08} {'loss': 0.3117, 'learning_rate': 9.256496217735028e-06, 'epoch': 1.08} {'loss': 0.3383, 'learning_rate': 9.256161170426102e-06, 'epoch': 1.08} {'loss': 0.2783, 'learning_rate': 9.255826123956829e-06, 'epoch': 1.08} {'loss': 0.3396, 'learning_rate': 9.255491078327586e-06, 'epoch': 1.08} {'loss': 0.2885, 'learning_rate': 9.255156033538753e-06, 'epoch': 1.08} {'loss': 0.369, 'learning_rate': 9.25482098959071e-06, 'epoch': 1.08} {'loss': 0.322, 'learning_rate': 9.25448594648383e-06, 'epoch': 1.08} {'loss': 0.4045, 'learning_rate': 9.254150904218491e-06, 'epoch': 1.08} {'loss': 0.3876, 'learning_rate': 9.253815862795075e-06, 'epoch': 1.08} {'loss': 0.4282, 'learning_rate': 9.253480822213961e-06, 'epoch': 1.08} {'loss': 0.4431, 'learning_rate': 9.253145782475524e-06, 'epoch': 1.08} {'loss': 0.274, 'learning_rate': 9.252810743580142e-06, 'epoch': 1.08} {'loss': 0.2199, 'learning_rate': 9.252475705528197e-06, 'epoch': 1.08} {'loss': 0.375, 'learning_rate': 9.252140668320063e-06, 'epoch': 1.08} {'loss': 0.3181, 'learning_rate': 9.25180563195612e-06, 'epoch': 1.08} {'loss': 0.2396, 'learning_rate': 9.251470596436746e-06, 'epoch': 1.08} {'loss': 0.3544, 'learning_rate': 9.251135561762321e-06, 'epoch': 1.08} {'loss': 0.4249, 'learning_rate': 9.250800527933221e-06, 'epoch': 1.08} {'loss': 0.3413, 'learning_rate': 9.250465494949827e-06, 'epoch': 1.08} {'loss': 0.3418, 'learning_rate': 9.250130462812507e-06, 'epoch': 1.08} {'loss': 0.2928, 'learning_rate': 9.249795431521654e-06, 'epoch': 1.08} {'loss': 0.2804, 'learning_rate': 9.249460401077636e-06, 'epoch': 1.08} {'loss': 0.3607, 'learning_rate': 9.249125371480837e-06, 'epoch': 1.08} {'loss': 0.279, 'learning_rate': 9.248790342731633e-06, 'epoch': 1.08} {'loss': 0.204, 'learning_rate': 9.2484553148304e-06, 'epoch': 1.08} {'loss': 0.2198, 'learning_rate': 9.248120287777518e-06, 'epoch': 1.08} {'loss': 0.3403, 'learning_rate': 9.247785261573368e-06, 'epoch': 1.08} {'loss': 0.1856, 'learning_rate': 9.247450236218323e-06, 'epoch': 1.08} {'loss': 0.5137, 'learning_rate': 9.247115211712766e-06, 'epoch': 1.08} {'loss': 0.4286, 'learning_rate': 9.24678018805707e-06, 'epoch': 1.08} {'loss': 0.3307, 'learning_rate': 9.246445165251617e-06, 'epoch': 1.08} {'loss': 0.1476, 'learning_rate': 9.246110143296782e-06, 'epoch': 1.08} {'loss': 0.3659, 'learning_rate': 9.245775122192948e-06, 'epoch': 1.08} {'loss': 0.2365, 'learning_rate': 9.245440101940489e-06, 'epoch': 1.08} {'loss': 0.4115, 'learning_rate': 9.245105082539786e-06, 'epoch': 1.08} {'loss': 0.4498, 'learning_rate': 9.244770063991216e-06, 'epoch': 1.08} {'loss': 0.3859, 'learning_rate': 9.244435046295155e-06, 'epoch': 1.08} {'loss': 0.3438, 'learning_rate': 9.244100029451983e-06, 'epoch': 1.08} {'loss': 0.4299, 'learning_rate': 9.24376501346208e-06, 'epoch': 1.08} {'loss': 0.2923, 'learning_rate': 9.243429998325825e-06, 'epoch': 1.08} {'loss': 0.3814, 'learning_rate': 9.243094984043591e-06, 'epoch': 1.08} {'loss': 0.3549, 'learning_rate': 9.242759970615757e-06, 'epoch': 1.08} {'loss': 0.3439, 'learning_rate': 9.242424958042706e-06, 'epoch': 1.08} {'loss': 0.2571, 'learning_rate': 9.24208994632481e-06, 'epoch': 1.08} {'loss': 0.2861, 'learning_rate': 9.241754935462453e-06, 'epoch': 1.08} {'loss': 0.2434, 'learning_rate': 9.241419925456009e-06, 'epoch': 1.08} {'loss': 0.316, 'learning_rate': 9.241084916305858e-06, 'epoch': 1.08} {'loss': 0.491, 'learning_rate': 9.240749908012377e-06, 'epoch': 1.08} {'loss': 0.3827, 'learning_rate': 9.240414900575947e-06, 'epoch': 1.08} {'loss': 0.3167, 'learning_rate': 9.240079893996942e-06, 'epoch': 1.08} {'loss': 0.3807, 'learning_rate': 9.239744888275743e-06, 'epoch': 1.08} {'loss': 0.3297, 'learning_rate': 9.239409883412729e-06, 'epoch': 1.08} {'loss': 0.3183, 'learning_rate': 9.239074879408278e-06, 'epoch': 1.08} {'loss': 0.4246, 'learning_rate': 9.238739876262764e-06, 'epoch': 1.08} {'loss': 0.4145, 'learning_rate': 9.238404873976568e-06, 'epoch': 1.08} {'loss': 0.3388, 'learning_rate': 9.238069872550068e-06, 'epoch': 1.08} {'loss': 0.2799, 'learning_rate': 9.237734871983642e-06, 'epoch': 1.08} {'loss': 0.3883, 'learning_rate': 9.237399872277668e-06, 'epoch': 1.08} {'loss': 0.3727, 'learning_rate': 9.237064873432525e-06, 'epoch': 1.08} {'loss': 0.2272, 'learning_rate': 9.23672987544859e-06, 'epoch': 1.08} {'loss': 0.39, 'learning_rate': 9.236394878326245e-06, 'epoch': 1.08} {'loss': 0.2801, 'learning_rate': 9.236059882065861e-06, 'epoch': 1.08} {'loss': 0.2485, 'learning_rate': 9.235724886667822e-06, 'epoch': 1.08} {'loss': 0.2116, 'learning_rate': 9.235389892132505e-06, 'epoch': 1.08} {'loss': 0.3626, 'learning_rate': 9.235054898460287e-06, 'epoch': 1.08} {'loss': 0.2134, 'learning_rate': 9.234719905651547e-06, 'epoch': 1.08} {'loss': 0.3325, 'learning_rate': 9.234384913706662e-06, 'epoch': 1.08} {'loss': 0.2786, 'learning_rate': 9.234049922626012e-06, 'epoch': 1.08} {'loss': 0.3598, 'learning_rate': 9.233714932409971e-06, 'epoch': 1.08} {'loss': 0.3248, 'learning_rate': 9.233379943058922e-06, 'epoch': 1.08} {'loss': 0.3823, 'learning_rate': 9.233044954573241e-06, 'epoch': 1.08} {'loss': 0.3391, 'learning_rate': 9.232709966953307e-06, 'epoch': 1.08} {'loss': 0.3186, 'learning_rate': 9.232374980199497e-06, 'epoch': 1.08} {'loss': 0.3447, 'learning_rate': 9.232039994312189e-06, 'epoch': 1.08} {'loss': 0.275, 'learning_rate': 9.231705009291762e-06, 'epoch': 1.08} {'loss': 0.2662, 'learning_rate': 9.231370025138595e-06, 'epoch': 1.08} {'loss': 0.3637, 'learning_rate': 9.231035041853064e-06, 'epoch': 1.08} {'loss': 0.2575, 'learning_rate': 9.23070005943555e-06, 'epoch': 1.08} {'loss': 0.4011, 'learning_rate': 9.23036507788643e-06, 'epoch': 1.08} {'loss': 0.3214, 'learning_rate': 9.23003009720608e-06, 'epoch': 1.08} {'loss': 0.2499, 'learning_rate': 9.229695117394877e-06, 'epoch': 1.08} {'loss': 0.2978, 'learning_rate': 9.229360138453204e-06, 'epoch': 1.08} {'loss': 0.4427, 'learning_rate': 9.229025160381437e-06, 'epoch': 1.08} {'loss': 0.3497, 'learning_rate': 9.228690183179955e-06, 'epoch': 1.08} {'loss': 0.2177, 'learning_rate': 9.228355206849134e-06, 'epoch': 1.08} {'loss': 0.2703, 'learning_rate': 9.228020231389352e-06, 'epoch': 1.08} {'loss': 0.4523, 'learning_rate': 9.22768525680099e-06, 'epoch': 1.08} {'loss': 0.4237, 'learning_rate': 9.227350283084422e-06, 'epoch': 1.08} {'loss': 0.4959, 'learning_rate': 9.227015310240031e-06, 'epoch': 1.08} {'loss': 0.4225, 'learning_rate': 9.226680338268194e-06, 'epoch': 1.08} {'loss': 0.2179, 'learning_rate': 9.226345367169285e-06, 'epoch': 1.08} {'loss': 0.2328, 'learning_rate': 9.226010396943688e-06, 'epoch': 1.08} {'loss': 0.4656, 'learning_rate': 9.225675427591777e-06, 'epoch': 1.08} {'loss': 0.4973, 'learning_rate': 9.22534045911393e-06, 'epoch': 1.08} {'loss': 0.1516, 'learning_rate': 9.225005491510527e-06, 'epoch': 1.08} {'loss': 0.2781, 'learning_rate': 9.224670524781945e-06, 'epoch': 1.08} {'loss': 0.3246, 'learning_rate': 9.224335558928563e-06, 'epoch': 1.08} {'loss': 0.3012, 'learning_rate': 9.224000593950756e-06, 'epoch': 1.08} {'loss': 0.3079, 'learning_rate': 9.223665629848907e-06, 'epoch': 1.08} {'loss': 0.4018, 'learning_rate': 9.223330666623394e-06, 'epoch': 1.08} {'loss': 0.4495, 'learning_rate': 9.22299570427459e-06, 'epoch': 1.08} {'loss': 0.2936, 'learning_rate': 9.222660742802876e-06, 'epoch': 1.08} {'loss': 0.306, 'learning_rate': 9.222325782208631e-06, 'epoch': 1.08} {'loss': 0.2017, 'learning_rate': 9.221990822492233e-06, 'epoch': 1.08} {'loss': 0.3738, 'learning_rate': 9.22165586365406e-06, 'epoch': 1.08} {'loss': 0.2243, 'learning_rate': 9.221320905694489e-06, 'epoch': 1.08} {'loss': 0.343, 'learning_rate': 9.220985948613898e-06, 'epoch': 1.08} {'loss': 0.4371, 'learning_rate': 9.220650992412666e-06, 'epoch': 1.08} {'loss': 0.3758, 'learning_rate': 9.220316037091172e-06, 'epoch': 1.08} {'loss': 0.2409, 'learning_rate': 9.21998108264979e-06, 'epoch': 1.08} {'loss': 0.4701, 'learning_rate': 9.219646129088903e-06, 'epoch': 1.08} {'loss': 0.1907, 'learning_rate': 9.219311176408887e-06, 'epoch': 1.08} {'loss': 0.3115, 'learning_rate': 9.21897622461012e-06, 'epoch': 1.08} {'loss': 0.2139, 'learning_rate': 9.21864127369298e-06, 'epoch': 1.08} {'loss': 0.267, 'learning_rate': 9.218306323657846e-06, 'epoch': 1.08} {'loss': 0.4026, 'learning_rate': 9.217971374505095e-06, 'epoch': 1.08} {'loss': 0.4665, 'learning_rate': 9.217636426235105e-06, 'epoch': 1.08} {'loss': 0.4244, 'learning_rate': 9.217301478848256e-06, 'epoch': 1.08} {'loss': 0.299, 'learning_rate': 9.216966532344922e-06, 'epoch': 1.08} {'loss': 0.2613, 'learning_rate': 9.216631586725486e-06, 'epoch': 1.08} {'loss': 0.3041, 'learning_rate': 9.216296641990324e-06, 'epoch': 1.08} {'loss': 0.1835, 'learning_rate': 9.215961698139815e-06, 'epoch': 1.08} {'loss': 0.3588, 'learning_rate': 9.215626755174335e-06, 'epoch': 1.08} {'loss': 0.3314, 'learning_rate': 9.215291813094263e-06, 'epoch': 1.08} {'loss': 0.3634, 'learning_rate': 9.214956871899978e-06, 'epoch': 1.08} {'loss': 0.3291, 'learning_rate': 9.214621931591859e-06, 'epoch': 1.08} {'loss': 0.3832, 'learning_rate': 9.214286992170282e-06, 'epoch': 1.08} {'loss': 0.2918, 'learning_rate': 9.213952053635624e-06, 'epoch': 1.08} {'loss': 0.3448, 'learning_rate': 9.213617115988264e-06, 'epoch': 1.08} {'loss': 0.4352, 'learning_rate': 9.213282179228583e-06, 'epoch': 1.08} {'loss': 0.2164, 'learning_rate': 9.212947243356955e-06, 'epoch': 1.08} {'loss': 0.3302, 'learning_rate': 9.21261230837376e-06, 'epoch': 1.08} {'loss': 0.319, 'learning_rate': 9.212277374279377e-06, 'epoch': 1.08} {'loss': 0.4682, 'learning_rate': 9.211942441074183e-06, 'epoch': 1.08} {'loss': 0.3188, 'learning_rate': 9.211607508758555e-06, 'epoch': 1.08} {'loss': 0.2897, 'learning_rate': 9.211272577332874e-06, 'epoch': 1.08} {'loss': 0.279, 'learning_rate': 9.210937646797514e-06, 'epoch': 1.08} {'loss': 0.3284, 'learning_rate': 9.210602717152857e-06, 'epoch': 1.08} {'loss': 0.4122, 'learning_rate': 9.21026778839928e-06, 'epoch': 1.08} {'loss': 0.3746, 'learning_rate': 9.20993286053716e-06, 'epoch': 1.08} {'loss': 0.3324, 'learning_rate': 9.209597933566876e-06, 'epoch': 1.08} {'loss': 0.3425, 'learning_rate': 9.209263007488805e-06, 'epoch': 1.08} {'loss': 0.3361, 'learning_rate': 9.208928082303324e-06, 'epoch': 1.08} {'loss': 0.4229, 'learning_rate': 9.208593158010814e-06, 'epoch': 1.08} {'loss': 0.2651, 'learning_rate': 9.208258234611653e-06, 'epoch': 1.08} {'loss': 0.2792, 'learning_rate': 9.207923312106216e-06, 'epoch': 1.08} {'loss': 0.4888, 'learning_rate': 9.207588390494884e-06, 'epoch': 1.08} {'loss': 0.3328, 'learning_rate': 9.207253469778034e-06, 'epoch': 1.08} {'loss': 0.3796, 'learning_rate': 9.206918549956044e-06, 'epoch': 1.08} {'loss': 0.4041, 'learning_rate': 9.206583631029291e-06, 'epoch': 1.08} {'loss': 0.2465, 'learning_rate': 9.206248712998155e-06, 'epoch': 1.08} {'loss': 0.3627, 'learning_rate': 9.205913795863016e-06, 'epoch': 1.08} {'loss': 0.3585, 'learning_rate': 9.205578879624246e-06, 'epoch': 1.08} {'loss': 0.2815, 'learning_rate': 9.205243964282228e-06, 'epoch': 1.08} {'loss': 0.3276, 'learning_rate': 9.204909049837337e-06, 'epoch': 1.08} {'loss': 0.4387, 'learning_rate': 9.204574136289953e-06, 'epoch': 1.08} {'loss': 0.4607, 'learning_rate': 9.204239223640455e-06, 'epoch': 1.08} {'loss': 0.2803, 'learning_rate': 9.203904311889218e-06, 'epoch': 1.08} {'loss': 0.4228, 'learning_rate': 9.203569401036622e-06, 'epoch': 1.08} {'loss': 0.6202, 'learning_rate': 9.203234491083043e-06, 'epoch': 1.08} {'loss': 0.3103, 'learning_rate': 9.202899582028864e-06, 'epoch': 1.08} {'loss': 0.5032, 'learning_rate': 9.202564673874456e-06, 'epoch': 1.08} {'loss': 0.2399, 'learning_rate': 9.202229766620204e-06, 'epoch': 1.08} {'loss': 0.2601, 'learning_rate': 9.201894860266483e-06, 'epoch': 1.08} {'loss': 0.3179, 'learning_rate': 9.20155995481367e-06, 'epoch': 1.08} {'loss': 0.4386, 'learning_rate': 9.201225050262145e-06, 'epoch': 1.08} {'loss': 0.3557, 'learning_rate': 9.200890146612284e-06, 'epoch': 1.08} {'loss': 0.2939, 'learning_rate': 9.200555243864465e-06, 'epoch': 1.08} {'loss': 0.411, 'learning_rate': 9.200220342019068e-06, 'epoch': 1.08} {'loss': 0.2965, 'learning_rate': 9.19988544107647e-06, 'epoch': 1.08} {'loss': 0.3281, 'learning_rate': 9.19955054103705e-06, 'epoch': 1.08} {'loss': 0.3899, 'learning_rate': 9.199215641901184e-06, 'epoch': 1.08} {'loss': 0.1966, 'learning_rate': 9.198880743669252e-06, 'epoch': 1.08} {'loss': 0.4556, 'learning_rate': 9.198545846341631e-06, 'epoch': 1.08} {'loss': 0.3886, 'learning_rate': 9.1982109499187e-06, 'epoch': 1.08} {'loss': 0.3512, 'learning_rate': 9.197876054400835e-06, 'epoch': 1.08} {'loss': 0.342, 'learning_rate': 9.197541159788417e-06, 'epoch': 1.08} {'loss': 0.3445, 'learning_rate': 9.197206266081821e-06, 'epoch': 1.08} {'loss': 0.4107, 'learning_rate': 9.19687137328143e-06, 'epoch': 1.08} {'loss': 0.4282, 'learning_rate': 9.196536481387614e-06, 'epoch': 1.08} {'loss': 0.3206, 'learning_rate': 9.196201590400758e-06, 'epoch': 1.08} {'loss': 0.2829, 'learning_rate': 9.195866700321237e-06, 'epoch': 1.08} {'loss': 0.3556, 'learning_rate': 9.19553181114943e-06, 'epoch': 1.08} {'loss': 0.2565, 'learning_rate': 9.195196922885714e-06, 'epoch': 1.08} {'loss': 0.3541, 'learning_rate': 9.194862035530466e-06, 'epoch': 1.08} {'loss': 0.3523, 'learning_rate': 9.194527149084067e-06, 'epoch': 1.08} {'loss': 0.2355, 'learning_rate': 9.194192263546896e-06, 'epoch': 1.08} {'loss': 0.2052, 'learning_rate': 9.193857378919326e-06, 'epoch': 1.08} {'loss': 0.3932, 'learning_rate': 9.193522495201737e-06, 'epoch': 1.08} {'loss': 0.3576, 'learning_rate': 9.193187612394509e-06, 'epoch': 1.08} {'loss': 0.29, 'learning_rate': 9.192852730498019e-06, 'epoch': 1.08} {'loss': 0.2482, 'learning_rate': 9.192517849512647e-06, 'epoch': 1.08} {'loss': 0.4071, 'learning_rate': 9.192182969438767e-06, 'epoch': 1.08} {'loss': 0.1704, 'learning_rate': 9.191848090276757e-06, 'epoch': 1.08} {'loss': 0.3893, 'learning_rate': 9.191513212027e-06, 'epoch': 1.08} {'loss': 0.5307, 'learning_rate': 9.191178334689867e-06, 'epoch': 1.08} {'loss': 0.3305, 'learning_rate': 9.19084345826574e-06, 'epoch': 1.08} {'loss': 0.279, 'learning_rate': 9.190508582755e-06, 'epoch': 1.08} {'loss': 0.2503, 'learning_rate': 9.190173708158021e-06, 'epoch': 1.08} {'loss': 0.3746, 'learning_rate': 9.189838834475181e-06, 'epoch': 1.08} {'loss': 0.2601, 'learning_rate': 9.18950396170686e-06, 'epoch': 1.08} {'loss': 0.2924, 'learning_rate': 9.189169089853433e-06, 'epoch': 1.08} {'loss': 0.3003, 'learning_rate': 9.188834218915281e-06, 'epoch': 1.08} {'loss': 0.4542, 'learning_rate': 9.18849934889278e-06, 'epoch': 1.08} {'loss': 0.2195, 'learning_rate': 9.188164479786313e-06, 'epoch': 1.08} {'loss': 0.3142, 'learning_rate': 9.187829611596251e-06, 'epoch': 1.08} {'loss': 0.3677, 'learning_rate': 9.187494744322975e-06, 'epoch': 1.08} {'loss': 0.3851, 'learning_rate': 9.187159877966862e-06, 'epoch': 1.08} {'loss': 0.4998, 'learning_rate': 9.186825012528291e-06, 'epoch': 1.08} {'loss': 0.3837, 'learning_rate': 9.186490148007642e-06, 'epoch': 1.08} {'loss': 0.3363, 'learning_rate': 9.186155284405289e-06, 'epoch': 1.08} {'loss': 0.3612, 'learning_rate': 9.185820421721613e-06, 'epoch': 1.08} {'loss': 0.3214, 'learning_rate': 9.18548555995699e-06, 'epoch': 1.08} {'loss': 0.1984, 'learning_rate': 9.185150699111799e-06, 'epoch': 1.08} {'loss': 0.3354, 'learning_rate': 9.184815839186418e-06, 'epoch': 1.08} {'loss': 0.2778, 'learning_rate': 9.184480980181224e-06, 'epoch': 1.08} {'loss': 0.261, 'learning_rate': 9.184146122096597e-06, 'epoch': 1.08} {'loss': 0.2858, 'learning_rate': 9.183811264932912e-06, 'epoch': 1.08} {'loss': 0.2022, 'learning_rate': 9.183476408690551e-06, 'epoch': 1.08} {'loss': 0.309, 'learning_rate': 9.18314155336989e-06, 'epoch': 1.08} {'loss': 0.3103, 'learning_rate': 9.182806698971306e-06, 'epoch': 1.08} {'loss': 0.3435, 'learning_rate': 9.182471845495179e-06, 'epoch': 1.08} {'loss': 0.3151, 'learning_rate': 9.182136992941885e-06, 'epoch': 1.08} {'loss': 0.2567, 'learning_rate': 9.181802141311804e-06, 'epoch': 1.08} {'loss': 0.242, 'learning_rate': 9.18146729060531e-06, 'epoch': 1.08} {'loss': 0.4328, 'learning_rate': 9.181132440822788e-06, 'epoch': 1.08} {'loss': 0.2826, 'learning_rate': 9.18079759196461e-06, 'epoch': 1.08} {'loss': 0.3077, 'learning_rate': 9.180462744031155e-06, 'epoch': 1.08} {'loss': 0.1815, 'learning_rate': 9.180127897022802e-06, 'epoch': 1.08} {'loss': 0.3044, 'learning_rate': 9.179793050939927e-06, 'epoch': 1.08} {'loss': 0.234, 'learning_rate': 9.179458205782912e-06, 'epoch': 1.08} {'loss': 0.364, 'learning_rate': 9.179123361552132e-06, 'epoch': 1.08} {'loss': 0.4388, 'learning_rate': 9.178788518247964e-06, 'epoch': 1.08} {'loss': 0.2332, 'learning_rate': 9.178453675870789e-06, 'epoch': 1.08} {'loss': 0.4242, 'learning_rate': 9.178118834420984e-06, 'epoch': 1.08} {'loss': 0.3907, 'learning_rate': 9.177783993898925e-06, 'epoch': 1.08} {'loss': 0.345, 'learning_rate': 9.177449154304993e-06, 'epoch': 1.08} {'loss': 0.4164, 'learning_rate': 9.177114315639564e-06, 'epoch': 1.08} {'loss': 0.3248, 'learning_rate': 9.17677947790302e-06, 'epoch': 1.08} {'loss': 0.3063, 'learning_rate': 9.17644464109573e-06, 'epoch': 1.08} {'loss': 0.197, 'learning_rate': 9.176109805218081e-06, 'epoch': 1.08} {'loss': 0.2258, 'learning_rate': 9.175774970270444e-06, 'epoch': 1.08} {'loss': 0.2909, 'learning_rate': 9.175440136253203e-06, 'epoch': 1.08} {'loss': 0.3202, 'learning_rate': 9.175105303166732e-06, 'epoch': 1.08} {'loss': 0.3477, 'learning_rate': 9.17477047101141e-06, 'epoch': 1.08} {'loss': 0.3748, 'learning_rate': 9.174435639787616e-06, 'epoch': 1.08} {'loss': 0.3196, 'learning_rate': 9.174100809495728e-06, 'epoch': 1.08} {'loss': 0.2838, 'learning_rate': 9.17376598013612e-06, 'epoch': 1.08} {'loss': 0.294, 'learning_rate': 9.173431151709177e-06, 'epoch': 1.08} {'loss': 0.3576, 'learning_rate': 9.173096324215272e-06, 'epoch': 1.08} {'loss': 0.3816, 'learning_rate': 9.172761497654782e-06, 'epoch': 1.08} {'loss': 0.2918, 'learning_rate': 9.17242667202809e-06, 'epoch': 1.08} {'loss': 0.2081, 'learning_rate': 9.17209184733557e-06, 'epoch': 1.08} {'loss': 0.2032, 'learning_rate': 9.1717570235776e-06, 'epoch': 1.08} {'loss': 0.215, 'learning_rate': 9.171422200754559e-06, 'epoch': 1.08} {'loss': 0.3065, 'learning_rate': 9.171087378866825e-06, 'epoch': 1.08} {'loss': 0.4086, 'learning_rate': 9.170752557914775e-06, 'epoch': 1.08} {'loss': 0.3175, 'learning_rate': 9.170417737898787e-06, 'epoch': 1.08} {'loss': 0.4951, 'learning_rate': 9.170082918819242e-06, 'epoch': 1.08} {'loss': 0.3063, 'learning_rate': 9.169748100676513e-06, 'epoch': 1.08} {'loss': 0.2678, 'learning_rate': 9.169413283470981e-06, 'epoch': 1.08} {'loss': 0.2907, 'learning_rate': 9.169078467203026e-06, 'epoch': 1.08} {'loss': 0.3678, 'learning_rate': 9.16874365187302e-06, 'epoch': 1.08} {'loss': 0.3836, 'learning_rate': 9.168408837481347e-06, 'epoch': 1.08} {'loss': 0.3821, 'learning_rate': 9.168074024028383e-06, 'epoch': 1.08} {'loss': 0.392, 'learning_rate': 9.167739211514503e-06, 'epoch': 1.08} {'loss': 0.2397, 'learning_rate': 9.167404399940088e-06, 'epoch': 1.08} {'loss': 0.2846, 'learning_rate': 9.167069589305515e-06, 'epoch': 1.08} {'loss': 0.2298, 'learning_rate': 9.166734779611162e-06, 'epoch': 1.08} {'loss': 0.3257, 'learning_rate': 9.166399970857405e-06, 'epoch': 1.08} {'loss': 0.4423, 'learning_rate': 9.166065163044626e-06, 'epoch': 1.08} {'loss': 0.4518, 'learning_rate': 9.165730356173202e-06, 'epoch': 1.08} {'loss': 0.351, 'learning_rate': 9.165395550243507e-06, 'epoch': 1.08} {'loss': 0.3748, 'learning_rate': 9.165060745255923e-06, 'epoch': 1.08} {'loss': 0.2596, 'learning_rate': 9.164725941210826e-06, 'epoch': 1.08} {'loss': 0.3393, 'learning_rate': 9.164391138108595e-06, 'epoch': 1.08} {'loss': 0.2367, 'learning_rate': 9.16405633594961e-06, 'epoch': 1.08} {'loss': 0.3716, 'learning_rate': 9.163721534734245e-06, 'epoch': 1.08} {'loss': 0.251, 'learning_rate': 9.16338673446288e-06, 'epoch': 1.08} {'loss': 0.2709, 'learning_rate': 9.16305193513589e-06, 'epoch': 1.08} {'loss': 0.3845, 'learning_rate': 9.162717136753657e-06, 'epoch': 1.08} {'loss': 0.2712, 'learning_rate': 9.162382339316555e-06, 'epoch': 1.08} {'loss': 0.444, 'learning_rate': 9.162047542824964e-06, 'epoch': 1.08} {'loss': 0.4891, 'learning_rate': 9.161712747279265e-06, 'epoch': 1.08} {'loss': 0.3188, 'learning_rate': 9.16137795267983e-06, 'epoch': 1.08} {'loss': 0.3443, 'learning_rate': 9.161043159027041e-06, 'epoch': 1.08} {'loss': 0.4316, 'learning_rate': 9.160708366321274e-06, 'epoch': 1.08} {'loss': 0.2911, 'learning_rate': 9.160373574562908e-06, 'epoch': 1.08} {'loss': 0.1567, 'learning_rate': 9.160038783752321e-06, 'epoch': 1.08} {'loss': 0.3668, 'learning_rate': 9.159703993889891e-06, 'epoch': 1.08} {'loss': 0.4551, 'learning_rate': 9.159369204975998e-06, 'epoch': 1.08} {'loss': 0.304, 'learning_rate': 9.159034417011013e-06, 'epoch': 1.08} {'loss': 0.2981, 'learning_rate': 9.15869962999532e-06, 'epoch': 1.08} {'loss': 0.2518, 'learning_rate': 9.158364843929293e-06, 'epoch': 1.08} {'loss': 0.2442, 'learning_rate': 9.158030058813314e-06, 'epoch': 1.08} {'loss': 0.2764, 'learning_rate': 9.157695274647758e-06, 'epoch': 1.08} {'loss': 0.37, 'learning_rate': 9.157360491433005e-06, 'epoch': 1.08} {'loss': 0.2359, 'learning_rate': 9.157025709169432e-06, 'epoch': 1.08} {'loss': 0.4238, 'learning_rate': 9.156690927857415e-06, 'epoch': 1.08} {'loss': 0.2111, 'learning_rate': 9.156356147497334e-06, 'epoch': 1.08} {'loss': 0.3575, 'learning_rate': 9.156021368089567e-06, 'epoch': 1.08} {'loss': 0.272, 'learning_rate': 9.155686589634491e-06, 'epoch': 1.08} {'loss': 0.3443, 'learning_rate': 9.155351812132484e-06, 'epoch': 1.08} {'loss': 0.2899, 'learning_rate': 9.155017035583928e-06, 'epoch': 1.08} {'loss': 0.2858, 'learning_rate': 9.154682259989194e-06, 'epoch': 1.08} {'loss': 0.3623, 'learning_rate': 9.154347485348662e-06, 'epoch': 1.08} {'loss': 0.276, 'learning_rate': 9.154012711662712e-06, 'epoch': 1.08} {'loss': 0.3518, 'learning_rate': 9.15367793893172e-06, 'epoch': 1.08} {'loss': 0.2644, 'learning_rate': 9.153343167156065e-06, 'epoch': 1.08} {'loss': 0.3798, 'learning_rate': 9.153008396336125e-06, 'epoch': 1.08} {'loss': 0.2594, 'learning_rate': 9.152673626472277e-06, 'epoch': 1.08} {'loss': 0.3259, 'learning_rate': 9.1523388575649e-06, 'epoch': 1.08} {'loss': 0.2176, 'learning_rate': 9.15200408961437e-06, 'epoch': 1.08} {'loss': 0.3768, 'learning_rate': 9.151669322621068e-06, 'epoch': 1.08} {'loss': 0.3538, 'learning_rate': 9.151334556585368e-06, 'epoch': 1.08} {'loss': 0.3257, 'learning_rate': 9.15099979150765e-06, 'epoch': 1.08} {'loss': 0.3809, 'learning_rate': 9.150665027388293e-06, 'epoch': 1.08} {'loss': 0.3023, 'learning_rate': 9.150330264227672e-06, 'epoch': 1.08} {'loss': 0.3039, 'learning_rate': 9.149995502026167e-06, 'epoch': 1.08} {'loss': 0.3649, 'learning_rate': 9.149660740784157e-06, 'epoch': 1.08} {'loss': 0.3227, 'learning_rate': 9.149325980502017e-06, 'epoch': 1.08} {'loss': 0.2495, 'learning_rate': 9.148991221180125e-06, 'epoch': 1.08} {'loss': 0.2952, 'learning_rate': 9.148656462818864e-06, 'epoch': 1.08} {'loss': 0.3832, 'learning_rate': 9.148321705418604e-06, 'epoch': 1.08} {'loss': 0.3804, 'learning_rate': 9.147986948979732e-06, 'epoch': 1.08} {'loss': 0.3993, 'learning_rate': 9.147652193502616e-06, 'epoch': 1.08} {'loss': 0.2406, 'learning_rate': 9.14731743898764e-06, 'epoch': 1.08} {'loss': 0.3369, 'learning_rate': 9.146982685435181e-06, 'epoch': 1.08} {'loss': 0.2675, 'learning_rate': 9.146647932845616e-06, 'epoch': 1.08} {'loss': 0.3775, 'learning_rate': 9.146313181219323e-06, 'epoch': 1.08} {'loss': 0.2646, 'learning_rate': 9.14597843055668e-06, 'epoch': 1.08} {'loss': 0.3421, 'learning_rate': 9.145643680858065e-06, 'epoch': 1.08} {'loss': 0.3137, 'learning_rate': 9.145308932123855e-06, 'epoch': 1.08} {'loss': 0.4345, 'learning_rate': 9.14497418435443e-06, 'epoch': 1.08} {'loss': 0.288, 'learning_rate': 9.144639437550165e-06, 'epoch': 1.08} {'loss': 0.3669, 'learning_rate': 9.144304691711442e-06, 'epoch': 1.08} {'loss': 0.5067, 'learning_rate': 9.143969946838634e-06, 'epoch': 1.08} {'loss': 0.2846, 'learning_rate': 9.143635202932124e-06, 'epoch': 1.08} {'loss': 0.2987, 'learning_rate': 9.143300459992287e-06, 'epoch': 1.08} {'loss': 0.2609, 'learning_rate': 9.142965718019497e-06, 'epoch': 1.08} {'loss': 0.2156, 'learning_rate': 9.142630977014137e-06, 'epoch': 1.08} {'loss': 0.2474, 'learning_rate': 9.142296236976584e-06, 'epoch': 1.08} {'loss': 0.4477, 'learning_rate': 9.141961497907217e-06, 'epoch': 1.08} {'loss': 0.3199, 'learning_rate': 9.14162675980641e-06, 'epoch': 1.08} {'loss': 0.2777, 'learning_rate': 9.141292022674543e-06, 'epoch': 1.08} {'loss': 0.2523, 'learning_rate': 9.140957286511996e-06, 'epoch': 1.08} {'loss': 0.3155, 'learning_rate': 9.140622551319145e-06, 'epoch': 1.08} {'loss': 0.4956, 'learning_rate': 9.140287817096366e-06, 'epoch': 1.08} {'loss': 0.3534, 'learning_rate': 9.13995308384404e-06, 'epoch': 1.08} {'loss': 0.2873, 'learning_rate': 9.139618351562542e-06, 'epoch': 1.08} {'loss': 0.3377, 'learning_rate': 9.139283620252253e-06, 'epoch': 1.08} {'loss': 0.2446, 'learning_rate': 9.138948889913548e-06, 'epoch': 1.08} {'loss': 0.375, 'learning_rate': 9.138614160546807e-06, 'epoch': 1.08} {'loss': 0.5021, 'learning_rate': 9.138279432152406e-06, 'epoch': 1.08} {'loss': 0.3047, 'learning_rate': 9.137944704730724e-06, 'epoch': 1.08} {'loss': 0.3063, 'learning_rate': 9.137609978282137e-06, 'epoch': 1.08} {'loss': 0.2979, 'learning_rate': 9.137275252807025e-06, 'epoch': 1.08} {'loss': 0.3479, 'learning_rate': 9.136940528305766e-06, 'epoch': 1.08} {'loss': 0.1766, 'learning_rate': 9.136605804778736e-06, 'epoch': 1.08} {'loss': 0.5111, 'learning_rate': 9.136271082226315e-06, 'epoch': 1.08} {'loss': 0.3297, 'learning_rate': 9.135936360648879e-06, 'epoch': 1.08} {'loss': 0.3317, 'learning_rate': 9.135601640046806e-06, 'epoch': 1.08} {'loss': 0.2881, 'learning_rate': 9.135266920420475e-06, 'epoch': 1.08} {'loss': 0.3856, 'learning_rate': 9.134932201770265e-06, 'epoch': 1.08} {'loss': 0.3977, 'learning_rate': 9.13459748409655e-06, 'epoch': 1.08} {'loss': 0.3293, 'learning_rate': 9.134262767399712e-06, 'epoch': 1.08} {'loss': 0.4778, 'learning_rate': 9.133928051680124e-06, 'epoch': 1.08} {'loss': 0.3977, 'learning_rate': 9.133593336938167e-06, 'epoch': 1.08} {'loss': 0.3027, 'learning_rate': 9.13325862317422e-06, 'epoch': 1.08} {'loss': 0.5167, 'learning_rate': 9.132923910388657e-06, 'epoch': 1.08} {'loss': 0.374, 'learning_rate': 9.132589198581858e-06, 'epoch': 1.08} {'loss': 0.3119, 'learning_rate': 9.132254487754202e-06, 'epoch': 1.08} {'loss': 0.3261, 'learning_rate': 9.131919777906067e-06, 'epoch': 1.08} {'loss': 0.2582, 'learning_rate': 9.131585069037827e-06, 'epoch': 1.08} {'loss': 0.3796, 'learning_rate': 9.131250361149863e-06, 'epoch': 1.08} {'loss': 0.3009, 'learning_rate': 9.130915654242553e-06, 'epoch': 1.08} {'loss': 0.2751, 'learning_rate': 9.130580948316274e-06, 'epoch': 1.08} {'loss': 0.2911, 'learning_rate': 9.130246243371404e-06, 'epoch': 1.08} {'loss': 0.4503, 'learning_rate': 9.12991153940832e-06, 'epoch': 1.08} {'loss': 0.3535, 'learning_rate': 9.129576836427401e-06, 'epoch': 1.08} {'loss': 0.3942, 'learning_rate': 9.129242134429023e-06, 'epoch': 1.08} {'loss': 0.3988, 'learning_rate': 9.128907433413565e-06, 'epoch': 1.08} {'loss': 0.4536, 'learning_rate': 9.128572733381405e-06, 'epoch': 1.08} {'loss': 0.2242, 'learning_rate': 9.128238034332921e-06, 'epoch': 1.08} {'loss': 0.4047, 'learning_rate': 9.127903336268491e-06, 'epoch': 1.08} {'loss': 0.2934, 'learning_rate': 9.127568639188492e-06, 'epoch': 1.08} {'loss': 0.3212, 'learning_rate': 9.127233943093302e-06, 'epoch': 1.08} {'loss': 0.4101, 'learning_rate': 9.126899247983298e-06, 'epoch': 1.09} {'loss': 0.2203, 'learning_rate': 9.12656455385886e-06, 'epoch': 1.09} {'loss': 0.271, 'learning_rate': 9.126229860720363e-06, 'epoch': 1.09} {'loss': 0.3548, 'learning_rate': 9.125895168568191e-06, 'epoch': 1.09} {'loss': 0.3527, 'learning_rate': 9.125560477402713e-06, 'epoch': 1.09} {'loss': 0.2165, 'learning_rate': 9.125225787224312e-06, 'epoch': 1.09} {'loss': 0.3095, 'learning_rate': 9.124891098033364e-06, 'epoch': 1.09} {'loss': 0.2349, 'learning_rate': 9.124556409830248e-06, 'epoch': 1.09} {'loss': 0.4402, 'learning_rate': 9.124221722615341e-06, 'epoch': 1.09} {'loss': 0.2053, 'learning_rate': 9.12388703638902e-06, 'epoch': 1.09} {'loss': 0.2272, 'learning_rate': 9.123552351151666e-06, 'epoch': 1.09} {'loss': 0.332, 'learning_rate': 9.123217666903655e-06, 'epoch': 1.09} {'loss': 0.3004, 'learning_rate': 9.122882983645363e-06, 'epoch': 1.09} {'loss': 0.3283, 'learning_rate': 9.12254830137717e-06, 'epoch': 1.09} {'loss': 0.2947, 'learning_rate': 9.122213620099452e-06, 'epoch': 1.09} {'loss': 0.2078, 'learning_rate': 9.121878939812589e-06, 'epoch': 1.09} {'loss': 0.3722, 'learning_rate': 9.12154426051696e-06, 'epoch': 1.09} {'loss': 0.3476, 'learning_rate': 9.121209582212938e-06, 'epoch': 1.09} {'loss': 0.3227, 'learning_rate': 9.120874904900903e-06, 'epoch': 1.09} {'loss': 0.2718, 'learning_rate': 9.120540228581232e-06, 'epoch': 1.09} {'loss': 0.2213, 'learning_rate': 9.120205553254306e-06, 'epoch': 1.09} {'loss': 0.2081, 'learning_rate': 9.119870878920499e-06, 'epoch': 1.09} {'loss': 0.4066, 'learning_rate': 9.119536205580192e-06, 'epoch': 1.09} {'loss': 0.3358, 'learning_rate': 9.119201533233761e-06, 'epoch': 1.09} {'loss': 0.2608, 'learning_rate': 9.118866861881583e-06, 'epoch': 1.09} {'loss': 0.2594, 'learning_rate': 9.118532191524036e-06, 'epoch': 1.09} {'loss': 0.2656, 'learning_rate': 9.1181975221615e-06, 'epoch': 1.09} {'loss': 0.2977, 'learning_rate': 9.117862853794351e-06, 'epoch': 1.09} {'loss': 0.3735, 'learning_rate': 9.117528186422967e-06, 'epoch': 1.09} {'loss': 0.293, 'learning_rate': 9.117193520047723e-06, 'epoch': 1.09} {'loss': 0.3216, 'learning_rate': 9.116858854669004e-06, 'epoch': 1.09} {'loss': 0.4095, 'learning_rate': 9.116524190287182e-06, 'epoch': 1.09} {'loss': 0.3408, 'learning_rate': 9.116189526902636e-06, 'epoch': 1.09} {'loss': 0.3157, 'learning_rate': 9.115854864515744e-06, 'epoch': 1.09} {'loss': 0.3744, 'learning_rate': 9.115520203126884e-06, 'epoch': 1.09} {'loss': 0.229, 'learning_rate': 9.115185542736433e-06, 'epoch': 1.09} {'loss': 0.3747, 'learning_rate': 9.114850883344772e-06, 'epoch': 1.09} {'loss': 0.4074, 'learning_rate': 9.114516224952274e-06, 'epoch': 1.09} {'loss': 0.4207, 'learning_rate': 9.114181567559318e-06, 'epoch': 1.09} {'loss': 0.5093, 'learning_rate': 9.113846911166284e-06, 'epoch': 1.09} {'loss': 0.2993, 'learning_rate': 9.113512255773546e-06, 'epoch': 1.09} {'loss': 0.2851, 'learning_rate': 9.113177601381485e-06, 'epoch': 1.09} {'loss': 0.3324, 'learning_rate': 9.112842947990479e-06, 'epoch': 1.09} {'loss': 0.3173, 'learning_rate': 9.112508295600904e-06, 'epoch': 1.09} {'loss': 0.4101, 'learning_rate': 9.112173644213138e-06, 'epoch': 1.09} {'loss': 0.2719, 'learning_rate': 9.11183899382756e-06, 'epoch': 1.09} {'loss': 0.4598, 'learning_rate': 9.111504344444545e-06, 'epoch': 1.09} {'loss': 0.333, 'learning_rate': 9.111169696064475e-06, 'epoch': 1.09} {'loss': 0.4282, 'learning_rate': 9.110835048687723e-06, 'epoch': 1.09} {'loss': 0.3758, 'learning_rate': 9.110500402314672e-06, 'epoch': 1.09} {'loss': 0.4143, 'learning_rate': 9.110165756945697e-06, 'epoch': 1.09} {'loss': 0.4059, 'learning_rate': 9.109831112581174e-06, 'epoch': 1.09} {'loss': 0.3097, 'learning_rate': 9.109496469221481e-06, 'epoch': 1.09} {'loss': 0.4581, 'learning_rate': 9.109161826867e-06, 'epoch': 1.09} {'loss': 0.4629, 'learning_rate': 9.108827185518104e-06, 'epoch': 1.09} {'loss': 0.2183, 'learning_rate': 9.108492545175173e-06, 'epoch': 1.09} {'loss': 0.3627, 'learning_rate': 9.108157905838585e-06, 'epoch': 1.09} {'loss': 0.2421, 'learning_rate': 9.107823267508716e-06, 'epoch': 1.09} {'loss': 0.4112, 'learning_rate': 9.107488630185946e-06, 'epoch': 1.09} {'loss': 0.3582, 'learning_rate': 9.107153993870652e-06, 'epoch': 1.09} {'loss': 0.2764, 'learning_rate': 9.10681935856321e-06, 'epoch': 1.09} {'loss': 0.2372, 'learning_rate': 9.106484724263998e-06, 'epoch': 1.09} {'loss': 0.2268, 'learning_rate': 9.106150090973396e-06, 'epoch': 1.09} {'loss': 0.2638, 'learning_rate': 9.105815458691785e-06, 'epoch': 1.09} {'loss': 0.3917, 'learning_rate': 9.105480827419533e-06, 'epoch': 1.09} {'loss': 0.2891, 'learning_rate': 9.105146197157025e-06, 'epoch': 1.09} {'loss': 0.4353, 'learning_rate': 9.104811567904635e-06, 'epoch': 1.09} {'loss': 0.3678, 'learning_rate': 9.104476939662744e-06, 'epoch': 1.09} {'loss': 0.3715, 'learning_rate': 9.10414231243173e-06, 'epoch': 1.09} {'loss': 0.3268, 'learning_rate': 9.103807686211965e-06, 'epoch': 1.09} {'loss': 0.3687, 'learning_rate': 9.103473061003833e-06, 'epoch': 1.09} {'loss': 0.4972, 'learning_rate': 9.10313843680771e-06, 'epoch': 1.09} {'loss': 0.3978, 'learning_rate': 9.10280381362397e-06, 'epoch': 1.09} {'loss': 0.2968, 'learning_rate': 9.102469191452997e-06, 'epoch': 1.09} {'loss': 0.2942, 'learning_rate': 9.102134570295164e-06, 'epoch': 1.09} {'loss': 0.3923, 'learning_rate': 9.101799950150852e-06, 'epoch': 1.09} {'loss': 0.3211, 'learning_rate': 9.101465331020439e-06, 'epoch': 1.09} {'loss': 0.1856, 'learning_rate': 9.101130712904296e-06, 'epoch': 1.09} {'loss': 0.3363, 'learning_rate': 9.100796095802808e-06, 'epoch': 1.09} {'loss': 0.2902, 'learning_rate': 9.10046147971635e-06, 'epoch': 1.09} {'loss': 0.3547, 'learning_rate': 9.100126864645299e-06, 'epoch': 1.09} {'loss': 0.3849, 'learning_rate': 9.099792250590034e-06, 'epoch': 1.09} {'loss': 0.3131, 'learning_rate': 9.099457637550933e-06, 'epoch': 1.09} {'loss': 0.4329, 'learning_rate': 9.09912302552837e-06, 'epoch': 1.09} {'loss': 0.292, 'learning_rate': 9.098788414522731e-06, 'epoch': 1.09} {'loss': 0.4415, 'learning_rate': 9.098453804534385e-06, 'epoch': 1.09} {'loss': 0.3888, 'learning_rate': 9.098119195563714e-06, 'epoch': 1.09} {'loss': 0.4064, 'learning_rate': 9.097784587611095e-06, 'epoch': 1.09} {'loss': 0.4519, 'learning_rate': 9.097449980676905e-06, 'epoch': 1.09} {'loss': 0.2212, 'learning_rate': 9.097115374761526e-06, 'epoch': 1.09} {'loss': 0.284, 'learning_rate': 9.09678076986533e-06, 'epoch': 1.09} {'loss': 0.3767, 'learning_rate': 9.096446165988695e-06, 'epoch': 1.09} {'loss': 0.2888, 'learning_rate': 9.096111563132e-06, 'epoch': 1.09} {'loss': 0.3221, 'learning_rate': 9.095776961295625e-06, 'epoch': 1.09} {'loss': 0.3053, 'learning_rate': 9.095442360479946e-06, 'epoch': 1.09} {'loss': 0.2477, 'learning_rate': 9.09510776068534e-06, 'epoch': 1.09} {'loss': 0.3118, 'learning_rate': 9.094773161912183e-06, 'epoch': 1.09} {'loss': 0.3592, 'learning_rate': 9.094438564160858e-06, 'epoch': 1.09} {'loss': 0.4189, 'learning_rate': 9.094103967431738e-06, 'epoch': 1.09} {'loss': 0.3192, 'learning_rate': 9.093769371725204e-06, 'epoch': 1.09} {'loss': 0.3632, 'learning_rate': 9.09343477704163e-06, 'epoch': 1.09} {'loss': 0.2707, 'learning_rate': 9.093100183381397e-06, 'epoch': 1.09} {'loss': 0.3675, 'learning_rate': 9.092765590744884e-06, 'epoch': 1.09} {'loss': 0.2804, 'learning_rate': 9.092430999132465e-06, 'epoch': 1.09} {'loss': 0.184, 'learning_rate': 9.092096408544517e-06, 'epoch': 1.09} {'loss': 0.457, 'learning_rate': 9.09176181898142e-06, 'epoch': 1.09} {'loss': 0.3309, 'learning_rate': 9.09142723044355e-06, 'epoch': 1.09} {'loss': 0.286, 'learning_rate': 9.091092642931287e-06, 'epoch': 1.09} {'loss': 0.3578, 'learning_rate': 9.090758056445006e-06, 'epoch': 1.09} {'loss': 0.3823, 'learning_rate': 9.09042347098509e-06, 'epoch': 1.09} {'loss': 0.3435, 'learning_rate': 9.090088886551908e-06, 'epoch': 1.09} {'loss': 0.3046, 'learning_rate': 9.089754303145846e-06, 'epoch': 1.09} {'loss': 0.3212, 'learning_rate': 9.089419720767279e-06, 'epoch': 1.09} {'loss': 0.3104, 'learning_rate': 9.089085139416581e-06, 'epoch': 1.09} {'loss': 0.4094, 'learning_rate': 9.088750559094134e-06, 'epoch': 1.09} {'loss': 0.3656, 'learning_rate': 9.088415979800319e-06, 'epoch': 1.09} {'loss': 0.414, 'learning_rate': 9.088081401535503e-06, 'epoch': 1.09} {'loss': 0.3935, 'learning_rate': 9.08774682430007e-06, 'epoch': 1.09} {'loss': 0.2858, 'learning_rate': 9.0874122480944e-06, 'epoch': 1.09} {'loss': 0.2017, 'learning_rate': 9.087077672918866e-06, 'epoch': 1.09} {'loss': 0.2049, 'learning_rate': 9.086743098773848e-06, 'epoch': 1.09} {'loss': 0.3204, 'learning_rate': 9.086408525659725e-06, 'epoch': 1.09} {'loss': 0.3755, 'learning_rate': 9.08607395357687e-06, 'epoch': 1.09} {'loss': 0.3541, 'learning_rate': 9.085739382525666e-06, 'epoch': 1.09} {'loss': 0.304, 'learning_rate': 9.085404812506489e-06, 'epoch': 1.09} {'loss': 0.2145, 'learning_rate': 9.085070243519714e-06, 'epoch': 1.09} {'loss': 0.3978, 'learning_rate': 9.084735675565722e-06, 'epoch': 1.09} {'loss': 0.3232, 'learning_rate': 9.08440110864489e-06, 'epoch': 1.09} {'loss': 0.2467, 'learning_rate': 9.08406654275759e-06, 'epoch': 1.09} {'loss': 0.363, 'learning_rate': 9.083731977904209e-06, 'epoch': 1.09} {'loss': 0.5262, 'learning_rate': 9.08339741408512e-06, 'epoch': 1.09} {'loss': 0.3668, 'learning_rate': 9.083062851300701e-06, 'epoch': 1.09} {'loss': 0.3453, 'learning_rate': 9.08272828955133e-06, 'epoch': 1.09} {'loss': 0.3849, 'learning_rate': 9.082393728837384e-06, 'epoch': 1.09} {'loss': 0.239, 'learning_rate': 9.08205916915924e-06, 'epoch': 1.09} {'loss': 0.34, 'learning_rate': 9.081724610517278e-06, 'epoch': 1.09} {'loss': 0.3956, 'learning_rate': 9.081390052911877e-06, 'epoch': 1.09} {'loss': 0.3727, 'learning_rate': 9.08105549634341e-06, 'epoch': 1.09} {'loss': 0.3004, 'learning_rate': 9.080720940812255e-06, 'epoch': 1.09} {'loss': 0.355, 'learning_rate': 9.080386386318792e-06, 'epoch': 1.09} {'loss': 0.3139, 'learning_rate': 9.080051832863396e-06, 'epoch': 1.09} {'loss': 0.3818, 'learning_rate': 9.07971728044645e-06, 'epoch': 1.09} {'loss': 0.3246, 'learning_rate': 9.079382729068326e-06, 'epoch': 1.09} {'loss': 0.2637, 'learning_rate': 9.079048178729404e-06, 'epoch': 1.09} {'loss': 0.2655, 'learning_rate': 9.078713629430062e-06, 'epoch': 1.09} {'loss': 0.5065, 'learning_rate': 9.078379081170678e-06, 'epoch': 1.09} {'loss': 0.4686, 'learning_rate': 9.078044533951627e-06, 'epoch': 1.09} {'loss': 0.4121, 'learning_rate': 9.077709987773288e-06, 'epoch': 1.09} {'loss': 0.5188, 'learning_rate': 9.07737544263604e-06, 'epoch': 1.09} {'loss': 0.3465, 'learning_rate': 9.077040898540263e-06, 'epoch': 1.09} {'loss': 0.4224, 'learning_rate': 9.076706355486328e-06, 'epoch': 1.09} {'loss': 0.3879, 'learning_rate': 9.076371813474616e-06, 'epoch': 1.09} {'loss': 0.1714, 'learning_rate': 9.076037272505504e-06, 'epoch': 1.09} {'loss': 0.3195, 'learning_rate': 9.075702732579371e-06, 'epoch': 1.09} {'loss': 0.3306, 'learning_rate': 9.075368193696594e-06, 'epoch': 1.09} {'loss': 0.2595, 'learning_rate': 9.07503365585755e-06, 'epoch': 1.09} {'loss': 0.4165, 'learning_rate': 9.074699119062617e-06, 'epoch': 1.09} {'loss': 0.3413, 'learning_rate': 9.074364583312174e-06, 'epoch': 1.09} {'loss': 0.2534, 'learning_rate': 9.074030048606596e-06, 'epoch': 1.09} {'loss': 0.1807, 'learning_rate': 9.073695514946263e-06, 'epoch': 1.09} {'loss': 0.3412, 'learning_rate': 9.07336098233155e-06, 'epoch': 1.09} {'loss': 0.4115, 'learning_rate': 9.073026450762837e-06, 'epoch': 1.09} {'loss': 0.1931, 'learning_rate': 9.072691920240505e-06, 'epoch': 1.09} {'loss': 0.3394, 'learning_rate': 9.072357390764922e-06, 'epoch': 1.09} {'loss': 0.4114, 'learning_rate': 9.072022862336474e-06, 'epoch': 1.09} {'loss': 0.3042, 'learning_rate': 9.071688334955534e-06, 'epoch': 1.09} {'loss': 0.3904, 'learning_rate': 9.071353808622482e-06, 'epoch': 1.09} {'loss': 0.304, 'learning_rate': 9.071019283337695e-06, 'epoch': 1.09} {'loss': 0.2453, 'learning_rate': 9.07068475910155e-06, 'epoch': 1.09} {'loss': 0.3363, 'learning_rate': 9.070350235914424e-06, 'epoch': 1.09} {'loss': 0.3599, 'learning_rate': 9.070015713776698e-06, 'epoch': 1.09} {'loss': 0.2218, 'learning_rate': 9.069681192688747e-06, 'epoch': 1.09} {'loss': 0.2705, 'learning_rate': 9.06934667265095e-06, 'epoch': 1.09} {'loss': 0.4045, 'learning_rate': 9.069012153663681e-06, 'epoch': 1.09} {'loss': 0.2778, 'learning_rate': 9.068677635727321e-06, 'epoch': 1.09} {'loss': 0.3415, 'learning_rate': 9.068343118842251e-06, 'epoch': 1.09} {'loss': 0.2922, 'learning_rate': 9.06800860300884e-06, 'epoch': 1.09} {'loss': 0.2179, 'learning_rate': 9.067674088227472e-06, 'epoch': 1.09} {'loss': 0.3501, 'learning_rate': 9.067339574498521e-06, 'epoch': 1.09} {'loss': 0.362, 'learning_rate': 9.067005061822367e-06, 'epoch': 1.09} {'loss': 0.3873, 'learning_rate': 9.066670550199387e-06, 'epoch': 1.09} {'loss': 0.2499, 'learning_rate': 9.066336039629958e-06, 'epoch': 1.09} {'loss': 0.2734, 'learning_rate': 9.066001530114459e-06, 'epoch': 1.09} {'loss': 0.5161, 'learning_rate': 9.065667021653266e-06, 'epoch': 1.09} {'loss': 0.2841, 'learning_rate': 9.065332514246757e-06, 'epoch': 1.09} {'loss': 0.2334, 'learning_rate': 9.06499800789531e-06, 'epoch': 1.09} {'loss': 0.2145, 'learning_rate': 9.064663502599302e-06, 'epoch': 1.09} {'loss': 0.3069, 'learning_rate': 9.064328998359112e-06, 'epoch': 1.09} {'loss': 0.3683, 'learning_rate': 9.063994495175119e-06, 'epoch': 1.09} {'loss': 0.2442, 'learning_rate': 9.063659993047696e-06, 'epoch': 1.09} {'loss': 0.3385, 'learning_rate': 9.063325491977222e-06, 'epoch': 1.09} {'loss': 0.2733, 'learning_rate': 9.062990991964075e-06, 'epoch': 1.09} {'loss': 0.3902, 'learning_rate': 9.062656493008634e-06, 'epoch': 1.09} {'loss': 0.3445, 'learning_rate': 9.062321995111275e-06, 'epoch': 1.09} {'loss': 0.3265, 'learning_rate': 9.061987498272376e-06, 'epoch': 1.09} {'loss': 0.426, 'learning_rate': 9.061653002492316e-06, 'epoch': 1.09} {'loss': 0.4059, 'learning_rate': 9.061318507771471e-06, 'epoch': 1.09} {'loss': 0.3285, 'learning_rate': 9.060984014110217e-06, 'epoch': 1.09} {'loss': 0.248, 'learning_rate': 9.060649521508936e-06, 'epoch': 1.09} {'loss': 0.1904, 'learning_rate': 9.060315029968002e-06, 'epoch': 1.09} {'loss': 0.3625, 'learning_rate': 9.059980539487793e-06, 'epoch': 1.09} {'loss': 0.3263, 'learning_rate': 9.05964605006869e-06, 'epoch': 1.09} {'loss': 0.285, 'learning_rate': 9.059311561711064e-06, 'epoch': 1.09} {'loss': 0.384, 'learning_rate': 9.0589770744153e-06, 'epoch': 1.09} {'loss': 0.2829, 'learning_rate': 9.058642588181769e-06, 'epoch': 1.09} {'loss': 0.4338, 'learning_rate': 9.058308103010853e-06, 'epoch': 1.09} {'loss': 0.3049, 'learning_rate': 9.057973618902927e-06, 'epoch': 1.09} {'loss': 0.3726, 'learning_rate': 9.05763913585837e-06, 'epoch': 1.09} {'loss': 0.4122, 'learning_rate': 9.05730465387756e-06, 'epoch': 1.09} {'loss': 0.3579, 'learning_rate': 9.056970172960873e-06, 'epoch': 1.09} {'loss': 0.2989, 'learning_rate': 9.056635693108687e-06, 'epoch': 1.09} {'loss': 0.3048, 'learning_rate': 9.05630121432138e-06, 'epoch': 1.09} {'loss': 0.3101, 'learning_rate': 9.05596673659933e-06, 'epoch': 1.09} {'loss': 0.4356, 'learning_rate': 9.055632259942915e-06, 'epoch': 1.09} {'loss': 0.4161, 'learning_rate': 9.05529778435251e-06, 'epoch': 1.09} {'loss': 0.4709, 'learning_rate': 9.054963309828497e-06, 'epoch': 1.09} {'loss': 0.3497, 'learning_rate': 9.054628836371248e-06, 'epoch': 1.09} {'loss': 0.4243, 'learning_rate': 9.054294363981144e-06, 'epoch': 1.09} {'loss': 0.3369, 'learning_rate': 9.053959892658561e-06, 'epoch': 1.09} {'loss': 0.2964, 'learning_rate': 9.053625422403878e-06, 'epoch': 1.09} {'loss': 0.1441, 'learning_rate': 9.053290953217471e-06, 'epoch': 1.09} {'loss': 0.3958, 'learning_rate': 9.05295648509972e-06, 'epoch': 1.09} {'loss': 0.2165, 'learning_rate': 9.052622018051001e-06, 'epoch': 1.09} {'loss': 0.4477, 'learning_rate': 9.05228755207169e-06, 'epoch': 1.09} {'loss': 0.3394, 'learning_rate': 9.051953087162168e-06, 'epoch': 1.09} {'loss': 0.3672, 'learning_rate': 9.051618623322809e-06, 'epoch': 1.09} {'loss': 0.3668, 'learning_rate': 9.051284160553993e-06, 'epoch': 1.09} {'loss': 0.3258, 'learning_rate': 9.050949698856098e-06, 'epoch': 1.09} {'loss': 0.4099, 'learning_rate': 9.050615238229496e-06, 'epoch': 1.09} {'loss': 0.2572, 'learning_rate': 9.050280778674572e-06, 'epoch': 1.09} {'loss': 0.3449, 'learning_rate': 9.0499463201917e-06, 'epoch': 1.09} {'loss': 0.3948, 'learning_rate': 9.049611862781257e-06, 'epoch': 1.09} {'loss': 0.2199, 'learning_rate': 9.049277406443624e-06, 'epoch': 1.09} {'loss': 0.3324, 'learning_rate': 9.048942951179174e-06, 'epoch': 1.09} {'loss': 0.2649, 'learning_rate': 9.048608496988288e-06, 'epoch': 1.09} {'loss': 0.2828, 'learning_rate': 9.048274043871343e-06, 'epoch': 1.09} {'loss': 0.3116, 'learning_rate': 9.047939591828715e-06, 'epoch': 1.09} {'loss': 0.333, 'learning_rate': 9.047605140860781e-06, 'epoch': 1.09} {'loss': 0.3221, 'learning_rate': 9.04727069096792e-06, 'epoch': 1.09} {'loss': 0.325, 'learning_rate': 9.046936242150509e-06, 'epoch': 1.09} {'loss': 0.3133, 'learning_rate': 9.046601794408927e-06, 'epoch': 1.09} {'loss': 0.3048, 'learning_rate': 9.046267347743549e-06, 'epoch': 1.09} {'loss': 0.3462, 'learning_rate': 9.045932902154753e-06, 'epoch': 1.09} {'loss': 0.2947, 'learning_rate': 9.04559845764292e-06, 'epoch': 1.09} {'loss': 0.3898, 'learning_rate': 9.045264014208421e-06, 'epoch': 1.09} {'loss': 0.5107, 'learning_rate': 9.044929571851641e-06, 'epoch': 1.09} {'loss': 0.2605, 'learning_rate': 9.044595130572952e-06, 'epoch': 1.09} {'loss': 0.4272, 'learning_rate': 9.044260690372733e-06, 'epoch': 1.09} {'loss': 0.2711, 'learning_rate': 9.043926251251366e-06, 'epoch': 1.09} {'loss': 0.2799, 'learning_rate': 9.04359181320922e-06, 'epoch': 1.09} {'loss': 0.3952, 'learning_rate': 9.04325737624668e-06, 'epoch': 1.09} {'loss': 0.579, 'learning_rate': 9.042922940364117e-06, 'epoch': 1.09} {'loss': 0.4948, 'learning_rate': 9.042588505561914e-06, 'epoch': 1.09} {'loss': 0.2171, 'learning_rate': 9.042254071840446e-06, 'epoch': 1.09} {'loss': 0.2707, 'learning_rate': 9.041919639200092e-06, 'epoch': 1.09} {'loss': 0.2472, 'learning_rate': 9.041585207641229e-06, 'epoch': 1.09} {'loss': 0.3647, 'learning_rate': 9.041250777164231e-06, 'epoch': 1.09} {'loss': 0.3507, 'learning_rate': 9.04091634776948e-06, 'epoch': 1.09} {'loss': 0.4183, 'learning_rate': 9.040581919457353e-06, 'epoch': 1.09} {'loss': 0.4517, 'learning_rate': 9.040247492228227e-06, 'epoch': 1.09} {'loss': 0.3848, 'learning_rate': 9.039913066082477e-06, 'epoch': 1.09} {'loss': 0.2177, 'learning_rate': 9.039578641020486e-06, 'epoch': 1.09} {'loss': 0.3692, 'learning_rate': 9.039244217042626e-06, 'epoch': 1.09} {'loss': 0.3402, 'learning_rate': 9.038909794149276e-06, 'epoch': 1.09} {'loss': 0.3561, 'learning_rate': 9.038575372340815e-06, 'epoch': 1.09} {'loss': 0.4342, 'learning_rate': 9.038240951617618e-06, 'epoch': 1.09} {'loss': 0.3219, 'learning_rate': 9.037906531980066e-06, 'epoch': 1.09} {'loss': 0.3392, 'learning_rate': 9.037572113428535e-06, 'epoch': 1.09} {'loss': 0.4074, 'learning_rate': 9.0372376959634e-06, 'epoch': 1.09} {'loss': 0.3745, 'learning_rate': 9.03690327958504e-06, 'epoch': 1.09} {'loss': 0.2713, 'learning_rate': 9.036568864293835e-06, 'epoch': 1.09} {'loss': 0.3478, 'learning_rate': 9.03623445009016e-06, 'epoch': 1.09} {'loss': 0.2321, 'learning_rate': 9.035900036974394e-06, 'epoch': 1.09} {'loss': 0.4125, 'learning_rate': 9.035565624946912e-06, 'epoch': 1.09} {'loss': 0.2849, 'learning_rate': 9.035231214008093e-06, 'epoch': 1.09} {'loss': 0.3902, 'learning_rate': 9.034896804158318e-06, 'epoch': 1.09} {'loss': 0.3224, 'learning_rate': 9.034562395397957e-06, 'epoch': 1.09} {'loss': 0.2545, 'learning_rate': 9.034227987727393e-06, 'epoch': 1.09} {'loss': 0.5193, 'learning_rate': 9.033893581147e-06, 'epoch': 1.09} {'loss': 0.3591, 'learning_rate': 9.03355917565716e-06, 'epoch': 1.09} {'loss': 0.4727, 'learning_rate': 9.033224771258246e-06, 'epoch': 1.09} {'loss': 0.338, 'learning_rate': 9.032890367950638e-06, 'epoch': 1.09} {'loss': 0.2672, 'learning_rate': 9.032555965734714e-06, 'epoch': 1.09} {'loss': 0.2657, 'learning_rate': 9.032221564610848e-06, 'epoch': 1.09} {'loss': 0.3687, 'learning_rate': 9.031887164579423e-06, 'epoch': 1.09} {'loss': 0.332, 'learning_rate': 9.031552765640811e-06, 'epoch': 1.09} {'loss': 0.2975, 'learning_rate': 9.03121836779539e-06, 'epoch': 1.09} {'loss': 0.1985, 'learning_rate': 9.030883971043543e-06, 'epoch': 1.09} {'loss': 0.3218, 'learning_rate': 9.030549575385644e-06, 'epoch': 1.09} {'loss': 0.3693, 'learning_rate': 9.03021518082207e-06, 'epoch': 1.09} {'loss': 0.35, 'learning_rate': 9.029880787353196e-06, 'epoch': 1.09} {'loss': 0.3013, 'learning_rate': 9.029546394979403e-06, 'epoch': 1.09} {'loss': 0.5014, 'learning_rate': 9.029212003701067e-06, 'epoch': 1.09} {'loss': 0.2811, 'learning_rate': 9.028877613518567e-06, 'epoch': 1.09} {'loss': 0.3219, 'learning_rate': 9.02854322443228e-06, 'epoch': 1.09} {'loss': 0.1977, 'learning_rate': 9.028208836442582e-06, 'epoch': 1.09} {'loss': 0.2845, 'learning_rate': 9.027874449549851e-06, 'epoch': 1.09} {'loss': 0.3873, 'learning_rate': 9.027540063754466e-06, 'epoch': 1.09} {'loss': 0.3459, 'learning_rate': 9.027205679056803e-06, 'epoch': 1.09} {'loss': 0.3491, 'learning_rate': 9.02687129545724e-06, 'epoch': 1.09} {'loss': 0.3336, 'learning_rate': 9.026536912956154e-06, 'epoch': 1.09} {'loss': 0.3929, 'learning_rate': 9.026202531553924e-06, 'epoch': 1.09} {'loss': 0.31, 'learning_rate': 9.025868151250925e-06, 'epoch': 1.09} {'loss': 0.4688, 'learning_rate': 9.025533772047535e-06, 'epoch': 1.09} {'loss': 0.3444, 'learning_rate': 9.025199393944133e-06, 'epoch': 1.09} {'loss': 0.3727, 'learning_rate': 9.024865016941096e-06, 'epoch': 1.09} {'loss': 0.3833, 'learning_rate': 9.0245306410388e-06, 'epoch': 1.09} {'loss': 0.3281, 'learning_rate': 9.024196266237622e-06, 'epoch': 1.09} {'loss': 0.2881, 'learning_rate': 9.023861892537943e-06, 'epoch': 1.09} {'loss': 0.3302, 'learning_rate': 9.023527519940138e-06, 'epoch': 1.09} {'loss': 0.4179, 'learning_rate': 9.023193148444585e-06, 'epoch': 1.09} {'loss': 0.3015, 'learning_rate': 9.02285877805166e-06, 'epoch': 1.09} {'loss': 0.4301, 'learning_rate': 9.022524408761742e-06, 'epoch': 1.09} {'loss': 0.1651, 'learning_rate': 9.022190040575208e-06, 'epoch': 1.09} {'loss': 0.2423, 'learning_rate': 9.021855673492438e-06, 'epoch': 1.09} {'loss': 0.3007, 'learning_rate': 9.021521307513805e-06, 'epoch': 1.09} {'loss': 0.4208, 'learning_rate': 9.021186942639688e-06, 'epoch': 1.09} {'loss': 0.3615, 'learning_rate': 9.020852578870465e-06, 'epoch': 1.09} {'loss': 0.3611, 'learning_rate': 9.020518216206514e-06, 'epoch': 1.09} {'loss': 0.2558, 'learning_rate': 9.02018385464821e-06, 'epoch': 1.09} {'loss': 0.2061, 'learning_rate': 9.019849494195932e-06, 'epoch': 1.09} {'loss': 0.3095, 'learning_rate': 9.01951513485006e-06, 'epoch': 1.09} {'loss': 0.3959, 'learning_rate': 9.019180776610965e-06, 'epoch': 1.09} {'loss': 0.2301, 'learning_rate': 9.018846419479032e-06, 'epoch': 1.09} {'loss': 0.3198, 'learning_rate': 9.018512063454633e-06, 'epoch': 1.09} {'loss': 0.4519, 'learning_rate': 9.018177708538147e-06, 'epoch': 1.09} {'loss': 0.1749, 'learning_rate': 9.017843354729954e-06, 'epoch': 1.09} {'loss': 0.3973, 'learning_rate': 9.017509002030425e-06, 'epoch': 1.09} {'loss': 0.4014, 'learning_rate': 9.017174650439944e-06, 'epoch': 1.09} {'loss': 0.4432, 'learning_rate': 9.016840299958886e-06, 'epoch': 1.09} {'loss': 0.2964, 'learning_rate': 9.016505950587629e-06, 'epoch': 1.09} {'loss': 0.387, 'learning_rate': 9.01617160232655e-06, 'epoch': 1.09} {'loss': 0.3826, 'learning_rate': 9.015837255176023e-06, 'epoch': 1.09} {'loss': 0.3737, 'learning_rate': 9.015502909136431e-06, 'epoch': 1.09} {'loss': 0.2596, 'learning_rate': 9.01516856420815e-06, 'epoch': 1.09} {'loss': 0.3101, 'learning_rate': 9.014834220391558e-06, 'epoch': 1.09} {'loss': 0.304, 'learning_rate': 9.014499877687028e-06, 'epoch': 1.09} {'loss': 0.4286, 'learning_rate': 9.01416553609494e-06, 'epoch': 1.09} {'loss': 0.3585, 'learning_rate': 9.01383119561567e-06, 'epoch': 1.09} {'loss': 0.4202, 'learning_rate': 9.013496856249601e-06, 'epoch': 1.09} {'loss': 0.2761, 'learning_rate': 9.013162517997103e-06, 'epoch': 1.09} {'loss': 0.2961, 'learning_rate': 9.012828180858559e-06, 'epoch': 1.09} {'loss': 0.2526, 'learning_rate': 9.012493844834344e-06, 'epoch': 1.09} {'loss': 0.2059, 'learning_rate': 9.012159509924835e-06, 'epoch': 1.09} {'loss': 0.2924, 'learning_rate': 9.01182517613041e-06, 'epoch': 1.09} {'loss': 0.3706, 'learning_rate': 9.011490843451447e-06, 'epoch': 1.09} {'loss': 0.4961, 'learning_rate': 9.011156511888323e-06, 'epoch': 1.09} {'loss': 0.3117, 'learning_rate': 9.010822181441415e-06, 'epoch': 1.09} {'loss': 0.5293, 'learning_rate': 9.010487852111104e-06, 'epoch': 1.09} {'loss': 0.3796, 'learning_rate': 9.01015352389776e-06, 'epoch': 1.09} {'loss': 0.3872, 'learning_rate': 9.009819196801764e-06, 'epoch': 1.09} {'loss': 0.2057, 'learning_rate': 9.009484870823496e-06, 'epoch': 1.09} {'loss': 0.2628, 'learning_rate': 9.00915054596333e-06, 'epoch': 1.09} {'loss': 0.3264, 'learning_rate': 9.008816222221645e-06, 'epoch': 1.09} {'loss': 0.3347, 'learning_rate': 9.008481899598817e-06, 'epoch': 1.09} {'loss': 0.4795, 'learning_rate': 9.008147578095226e-06, 'epoch': 1.09} {'loss': 0.3595, 'learning_rate': 9.007813257711247e-06, 'epoch': 1.09} {'loss': 0.3263, 'learning_rate': 9.007478938447258e-06, 'epoch': 1.09} {'loss': 0.275, 'learning_rate': 9.007144620303636e-06, 'epoch': 1.09} {'loss': 0.4171, 'learning_rate': 9.006810303280759e-06, 'epoch': 1.09} {'loss': 0.3408, 'learning_rate': 9.006475987379006e-06, 'epoch': 1.09} {'loss': 0.3202, 'learning_rate': 9.006141672598754e-06, 'epoch': 1.09} {'loss': 0.3962, 'learning_rate': 9.005807358940376e-06, 'epoch': 1.09} {'loss': 0.3893, 'learning_rate': 9.005473046404254e-06, 'epoch': 1.09} {'loss': 0.2379, 'learning_rate': 9.005138734990763e-06, 'epoch': 1.09} {'loss': 0.2597, 'learning_rate': 9.004804424700282e-06, 'epoch': 1.09} {'loss': 0.4587, 'learning_rate': 9.004470115533184e-06, 'epoch': 1.09} {'loss': 0.3414, 'learning_rate': 9.004135807489853e-06, 'epoch': 1.09} {'loss': 0.228, 'learning_rate': 9.003801500570664e-06, 'epoch': 1.09} {'loss': 0.3351, 'learning_rate': 9.003467194775993e-06, 'epoch': 1.09} {'loss': 0.3234, 'learning_rate': 9.003132890106217e-06, 'epoch': 1.09} {'loss': 0.3875, 'learning_rate': 9.002798586561714e-06, 'epoch': 1.09} {'loss': 0.2747, 'learning_rate': 9.002464284142863e-06, 'epoch': 1.09} {'loss': 0.2936, 'learning_rate': 9.00212998285004e-06, 'epoch': 1.09} {'loss': 0.2832, 'learning_rate': 9.001795682683624e-06, 'epoch': 1.09} {'loss': 0.4109, 'learning_rate': 9.00146138364399e-06, 'epoch': 1.09} {'loss': 0.3899, 'learning_rate': 9.001127085731516e-06, 'epoch': 1.09} {'loss': 0.253, 'learning_rate': 9.000792788946579e-06, 'epoch': 1.09} {'loss': 0.3447, 'learning_rate': 9.000458493289557e-06, 'epoch': 1.09} {'loss': 0.2915, 'learning_rate': 9.000124198760827e-06, 'epoch': 1.09} {'loss': 0.385, 'learning_rate': 8.999789905360766e-06, 'epoch': 1.09} {'loss': 0.1977, 'learning_rate': 8.999455613089753e-06, 'epoch': 1.09} {'loss': 0.3123, 'learning_rate': 8.999121321948164e-06, 'epoch': 1.09} {'loss': 0.2505, 'learning_rate': 8.998787031936378e-06, 'epoch': 1.09} {'loss': 0.2355, 'learning_rate': 8.99845274305477e-06, 'epoch': 1.09} {'loss': 0.2175, 'learning_rate': 8.998118455303718e-06, 'epoch': 1.09} {'loss': 0.3309, 'learning_rate': 8.9977841686836e-06, 'epoch': 1.09} {'loss': 0.3698, 'learning_rate': 8.997449883194795e-06, 'epoch': 1.09} {'loss': 0.3883, 'learning_rate': 8.997115598837677e-06, 'epoch': 1.09} {'loss': 0.4915, 'learning_rate': 8.996781315612624e-06, 'epoch': 1.09} {'loss': 0.4572, 'learning_rate': 8.996447033520015e-06, 'epoch': 1.09} {'loss': 0.4406, 'learning_rate': 8.996112752560227e-06, 'epoch': 1.09} {'loss': 0.3278, 'learning_rate': 8.995778472733636e-06, 'epoch': 1.09} {'loss': 0.3248, 'learning_rate': 8.995444194040619e-06, 'epoch': 1.09} {'loss': 0.4342, 'learning_rate': 8.995109916481556e-06, 'epoch': 1.09} {'loss': 0.5128, 'learning_rate': 8.994775640056822e-06, 'epoch': 1.09} {'loss': 0.3254, 'learning_rate': 8.994441364766796e-06, 'epoch': 1.09} {'loss': 0.3714, 'learning_rate': 8.994107090611853e-06, 'epoch': 1.09} {'loss': 0.2101, 'learning_rate': 8.993772817592373e-06, 'epoch': 1.09} {'loss': 0.428, 'learning_rate': 8.993438545708732e-06, 'epoch': 1.09} {'loss': 0.4841, 'learning_rate': 8.993104274961309e-06, 'epoch': 1.09} {'loss': 0.3722, 'learning_rate': 8.992770005350478e-06, 'epoch': 1.09} {'loss': 0.3583, 'learning_rate': 8.992435736876619e-06, 'epoch': 1.09} {'loss': 0.5195, 'learning_rate': 8.992101469540108e-06, 'epoch': 1.09} {'loss': 0.3188, 'learning_rate': 8.991767203341322e-06, 'epoch': 1.09} {'loss': 0.3545, 'learning_rate': 8.99143293828064e-06, 'epoch': 1.09} {'loss': 0.4149, 'learning_rate': 8.991098674358437e-06, 'epoch': 1.09} {'loss': 0.3042, 'learning_rate': 8.990764411575093e-06, 'epoch': 1.09} {'loss': 0.3888, 'learning_rate': 8.990430149930984e-06, 'epoch': 1.09} {'loss': 0.4226, 'learning_rate': 8.990095889426487e-06, 'epoch': 1.09} {'loss': 0.4424, 'learning_rate': 8.98976163006198e-06, 'epoch': 1.09} {'loss': 0.3905, 'learning_rate': 8.98942737183784e-06, 'epoch': 1.09} {'loss': 0.3569, 'learning_rate': 8.989093114754444e-06, 'epoch': 1.09} {'loss': 0.3388, 'learning_rate': 8.988758858812173e-06, 'epoch': 1.09} {'loss': 0.4232, 'learning_rate': 8.988424604011398e-06, 'epoch': 1.09} {'loss': 0.4584, 'learning_rate': 8.988090350352499e-06, 'epoch': 1.09} {'loss': 0.2798, 'learning_rate': 8.987756097835853e-06, 'epoch': 1.09} {'loss': 0.2965, 'learning_rate': 8.98742184646184e-06, 'epoch': 1.09} {'loss': 0.426, 'learning_rate': 8.987087596230834e-06, 'epoch': 1.09} {'loss': 0.4323, 'learning_rate': 8.986753347143212e-06, 'epoch': 1.09} {'loss': 0.4903, 'learning_rate': 8.986419099199355e-06, 'epoch': 1.09} {'loss': 0.2536, 'learning_rate': 8.986084852399638e-06, 'epoch': 1.09} {'loss': 0.2802, 'learning_rate': 8.985750606744436e-06, 'epoch': 1.09} {'loss': 0.3801, 'learning_rate': 8.98541636223413e-06, 'epoch': 1.09} {'loss': 0.3161, 'learning_rate': 8.985082118869096e-06, 'epoch': 1.09} {'loss': 0.3414, 'learning_rate': 8.984747876649713e-06, 'epoch': 1.09} {'loss': 0.3364, 'learning_rate': 8.984413635576353e-06, 'epoch': 1.09} {'loss': 0.44, 'learning_rate': 8.984079395649398e-06, 'epoch': 1.09} {'loss': 0.2132, 'learning_rate': 8.983745156869226e-06, 'epoch': 1.09} {'loss': 0.3324, 'learning_rate': 8.983410919236211e-06, 'epoch': 1.09} {'loss': 0.2747, 'learning_rate': 8.983076682750732e-06, 'epoch': 1.09} {'loss': 0.4839, 'learning_rate': 8.982742447413166e-06, 'epoch': 1.09} {'loss': 0.3839, 'learning_rate': 8.982408213223893e-06, 'epoch': 1.09} {'loss': 0.3748, 'learning_rate': 8.982073980183284e-06, 'epoch': 1.09} {'loss': 0.3553, 'learning_rate': 8.981739748291724e-06, 'epoch': 1.09} {'loss': 0.3922, 'learning_rate': 8.981405517549583e-06, 'epoch': 1.09} {'loss': 0.2013, 'learning_rate': 8.981071287957241e-06, 'epoch': 1.09} {'loss': 0.3411, 'learning_rate': 8.980737059515077e-06, 'epoch': 1.09} {'loss': 0.366, 'learning_rate': 8.980402832223467e-06, 'epoch': 1.09} {'loss': 0.3921, 'learning_rate': 8.980068606082789e-06, 'epoch': 1.09} {'loss': 0.3844, 'learning_rate': 8.979734381093417e-06, 'epoch': 1.09} {'loss': 0.3056, 'learning_rate': 8.979400157255735e-06, 'epoch': 1.09} {'loss': 0.2779, 'learning_rate': 8.979065934570112e-06, 'epoch': 1.09} {'loss': 0.2579, 'learning_rate': 8.978731713036932e-06, 'epoch': 1.09} {'loss': 0.5716, 'learning_rate': 8.978397492656568e-06, 'epoch': 1.09} {'loss': 0.3736, 'learning_rate': 8.9780632734294e-06, 'epoch': 1.09} {'loss': 0.293, 'learning_rate': 8.977729055355803e-06, 'epoch': 1.09} {'loss': 0.3034, 'learning_rate': 8.97739483843616e-06, 'epoch': 1.09} {'loss': 0.4879, 'learning_rate': 8.97706062267084e-06, 'epoch': 1.09} {'loss': 0.3481, 'learning_rate': 8.976726408060224e-06, 'epoch': 1.09} {'loss': 0.2193, 'learning_rate': 8.97639219460469e-06, 'epoch': 1.09} {'loss': 0.4462, 'learning_rate': 8.976057982304615e-06, 'epoch': 1.09} {'loss': 0.2414, 'learning_rate': 8.975723771160375e-06, 'epoch': 1.09} {'loss': 0.2965, 'learning_rate': 8.975389561172347e-06, 'epoch': 1.09} {'loss': 0.5508, 'learning_rate': 8.975055352340912e-06, 'epoch': 1.09} {'loss': 0.3491, 'learning_rate': 8.974721144666442e-06, 'epoch': 1.09} {'loss': 0.3271, 'learning_rate': 8.974386938149318e-06, 'epoch': 1.09} {'loss': 0.2763, 'learning_rate': 8.974052732789917e-06, 'epoch': 1.09} {'loss': 0.214, 'learning_rate': 8.973718528588615e-06, 'epoch': 1.09} {'loss': 0.3566, 'learning_rate': 8.973384325545788e-06, 'epoch': 1.09} {'loss': 0.3961, 'learning_rate': 8.973050123661818e-06, 'epoch': 1.09} {'loss': 0.3864, 'learning_rate': 8.972715922937076e-06, 'epoch': 1.09} {'loss': 0.4356, 'learning_rate': 8.972381723371945e-06, 'epoch': 1.09} {'loss': 0.3342, 'learning_rate': 8.972047524966797e-06, 'epoch': 1.09} {'loss': 0.238, 'learning_rate': 8.971713327722014e-06, 'epoch': 1.09} {'loss': 0.342, 'learning_rate': 8.971379131637969e-06, 'epoch': 1.09} {'loss': 0.1475, 'learning_rate': 8.971044936715044e-06, 'epoch': 1.09} {'loss': 0.2981, 'learning_rate': 8.97071074295361e-06, 'epoch': 1.09} {'loss': 0.2574, 'learning_rate': 8.970376550354051e-06, 'epoch': 1.09} {'loss': 0.3995, 'learning_rate': 8.970042358916739e-06, 'epoch': 1.09} {'loss': 0.2909, 'learning_rate': 8.969708168642056e-06, 'epoch': 1.09} {'loss': 0.3223, 'learning_rate': 8.969373979530373e-06, 'epoch': 1.09} {'loss': 0.463, 'learning_rate': 8.969039791582073e-06, 'epoch': 1.09} {'loss': 0.4126, 'learning_rate': 8.968705604797533e-06, 'epoch': 1.09} {'loss': 0.3246, 'learning_rate': 8.968371419177127e-06, 'epoch': 1.09} {'loss': 0.3942, 'learning_rate': 8.968037234721231e-06, 'epoch': 1.09} {'loss': 0.3421, 'learning_rate': 8.967703051430227e-06, 'epoch': 1.09} {'loss': 0.4246, 'learning_rate': 8.967368869304488e-06, 'epoch': 1.09} {'loss': 0.293, 'learning_rate': 8.967034688344395e-06, 'epoch': 1.09} {'loss': 0.3998, 'learning_rate': 8.966700508550323e-06, 'epoch': 1.09} {'loss': 0.294, 'learning_rate': 8.96636632992265e-06, 'epoch': 1.09} {'loss': 0.3871, 'learning_rate': 8.96603215246175e-06, 'epoch': 1.09} {'loss': 0.3333, 'learning_rate': 8.965697976168007e-06, 'epoch': 1.09} {'loss': 0.3905, 'learning_rate': 8.965363801041792e-06, 'epoch': 1.1} {'loss': 0.2306, 'learning_rate': 8.965029627083484e-06, 'epoch': 1.1} {'loss': 0.2951, 'learning_rate': 8.964695454293464e-06, 'epoch': 1.1} {'loss': 0.2948, 'learning_rate': 8.964361282672103e-06, 'epoch': 1.1} {'loss': 0.3505, 'learning_rate': 8.964027112219783e-06, 'epoch': 1.1} {'loss': 0.2275, 'learning_rate': 8.963692942936879e-06, 'epoch': 1.1} {'loss': 0.3193, 'learning_rate': 8.963358774823768e-06, 'epoch': 1.1} {'loss': 0.3036, 'learning_rate': 8.963024607880827e-06, 'epoch': 1.1} {'loss': 0.3852, 'learning_rate': 8.962690442108434e-06, 'epoch': 1.1} {'loss': 0.1871, 'learning_rate': 8.96235627750697e-06, 'epoch': 1.1} {'loss': 0.3175, 'learning_rate': 8.962022114076803e-06, 'epoch': 1.1} {'loss': 0.3626, 'learning_rate': 8.961687951818318e-06, 'epoch': 1.1} {'loss': 0.2723, 'learning_rate': 8.96135379073189e-06, 'epoch': 1.1} {'loss': 0.2848, 'learning_rate': 8.961019630817897e-06, 'epoch': 1.1} {'loss': 0.295, 'learning_rate': 8.960685472076714e-06, 'epoch': 1.1} {'loss': 0.3519, 'learning_rate': 8.96035131450872e-06, 'epoch': 1.1} {'loss': 0.2531, 'learning_rate': 8.960017158114292e-06, 'epoch': 1.1} {'loss': 0.4542, 'learning_rate': 8.959683002893807e-06, 'epoch': 1.1} {'loss': 0.2645, 'learning_rate': 8.959348848847643e-06, 'epoch': 1.1} {'loss': 0.3345, 'learning_rate': 8.959014695976173e-06, 'epoch': 1.1} {'loss': 0.3065, 'learning_rate': 8.95868054427978e-06, 'epoch': 1.1} {'loss': 0.4479, 'learning_rate': 8.958346393758839e-06, 'epoch': 1.1} {'loss': 0.3153, 'learning_rate': 8.958012244413724e-06, 'epoch': 1.1} {'loss': 0.4759, 'learning_rate': 8.957678096244817e-06, 'epoch': 1.1} {'loss': 0.4883, 'learning_rate': 8.957343949252493e-06, 'epoch': 1.1} {'loss': 0.1936, 'learning_rate': 8.95700980343713e-06, 'epoch': 1.1} {'loss': 0.3263, 'learning_rate': 8.956675658799102e-06, 'epoch': 1.1} {'loss': 0.4299, 'learning_rate': 8.95634151533879e-06, 'epoch': 1.1} {'loss': 0.4031, 'learning_rate': 8.956007373056572e-06, 'epoch': 1.1} {'loss': 0.313, 'learning_rate': 8.955673231952821e-06, 'epoch': 1.1} {'loss': 0.2987, 'learning_rate': 8.95533909202792e-06, 'epoch': 1.1} {'loss': 0.376, 'learning_rate': 8.955004953282238e-06, 'epoch': 1.1} {'loss': 0.2445, 'learning_rate': 8.95467081571616e-06, 'epoch': 1.1} {'loss': 0.2742, 'learning_rate': 8.954336679330058e-06, 'epoch': 1.1} {'loss': 0.3516, 'learning_rate': 8.95400254412431e-06, 'epoch': 1.1} {'loss': 0.2582, 'learning_rate': 8.953668410099297e-06, 'epoch': 1.1} {'loss': 0.2417, 'learning_rate': 8.95333427725539e-06, 'epoch': 1.1} {'loss': 0.3831, 'learning_rate': 8.953000145592974e-06, 'epoch': 1.1} {'loss': 0.3396, 'learning_rate': 8.952666015112418e-06, 'epoch': 1.1} {'loss': 0.3057, 'learning_rate': 8.952331885814104e-06, 'epoch': 1.1} {'loss': 0.3862, 'learning_rate': 8.951997757698407e-06, 'epoch': 1.1} {'loss': 0.2986, 'learning_rate': 8.951663630765708e-06, 'epoch': 1.1} {'loss': 0.3615, 'learning_rate': 8.951329505016377e-06, 'epoch': 1.1} {'loss': 0.2835, 'learning_rate': 8.950995380450797e-06, 'epoch': 1.1} {'loss': 0.3235, 'learning_rate': 8.950661257069347e-06, 'epoch': 1.1} {'loss': 0.4702, 'learning_rate': 8.950327134872399e-06, 'epoch': 1.1} {'loss': 0.2576, 'learning_rate': 8.949993013860332e-06, 'epoch': 1.1} {'loss': 0.2277, 'learning_rate': 8.949658894033523e-06, 'epoch': 1.1} {'loss': 0.3949, 'learning_rate': 8.949324775392349e-06, 'epoch': 1.1} {'loss': 0.3815, 'learning_rate': 8.948990657937188e-06, 'epoch': 1.1} {'loss': 0.5005, 'learning_rate': 8.94865654166842e-06, 'epoch': 1.1} {'loss': 0.4258, 'learning_rate': 8.948322426586415e-06, 'epoch': 1.1} {'loss': 0.4359, 'learning_rate': 8.947988312691554e-06, 'epoch': 1.1} {'loss': 0.2088, 'learning_rate': 8.947654199984216e-06, 'epoch': 1.1} {'loss': 0.2111, 'learning_rate': 8.947320088464774e-06, 'epoch': 1.1} {'loss': 0.3717, 'learning_rate': 8.946985978133608e-06, 'epoch': 1.1} {'loss': 0.2318, 'learning_rate': 8.946651868991097e-06, 'epoch': 1.1} {'loss': 0.264, 'learning_rate': 8.946317761037615e-06, 'epoch': 1.1} {'loss': 0.2983, 'learning_rate': 8.945983654273538e-06, 'epoch': 1.1} {'loss': 0.2848, 'learning_rate': 8.945649548699244e-06, 'epoch': 1.1} {'loss': 0.3191, 'learning_rate': 8.945315444315115e-06, 'epoch': 1.1} {'loss': 0.4367, 'learning_rate': 8.944981341121521e-06, 'epoch': 1.1} {'loss': 0.3492, 'learning_rate': 8.944647239118844e-06, 'epoch': 1.1} {'loss': 0.3722, 'learning_rate': 8.944313138307459e-06, 'epoch': 1.1} {'loss': 0.3769, 'learning_rate': 8.943979038687747e-06, 'epoch': 1.1} {'loss': 0.3102, 'learning_rate': 8.943644940260079e-06, 'epoch': 1.1} {'loss': 0.4121, 'learning_rate': 8.943310843024835e-06, 'epoch': 1.1} {'loss': 0.2277, 'learning_rate': 8.942976746982391e-06, 'epoch': 1.1} {'loss': 0.3665, 'learning_rate': 8.942642652133127e-06, 'epoch': 1.1} {'loss': 0.3328, 'learning_rate': 8.942308558477417e-06, 'epoch': 1.1} {'loss': 0.4796, 'learning_rate': 8.941974466015641e-06, 'epoch': 1.1} {'loss': 0.285, 'learning_rate': 8.941640374748173e-06, 'epoch': 1.1} {'loss': 0.2674, 'learning_rate': 8.941306284675393e-06, 'epoch': 1.1} {'loss': 0.3086, 'learning_rate': 8.940972195797676e-06, 'epoch': 1.1} {'loss': 0.3643, 'learning_rate': 8.9406381081154e-06, 'epoch': 1.1} {'loss': 0.3063, 'learning_rate': 8.940304021628943e-06, 'epoch': 1.1} {'loss': 0.4008, 'learning_rate': 8.939969936338681e-06, 'epoch': 1.1} {'loss': 0.3121, 'learning_rate': 8.939635852244994e-06, 'epoch': 1.1} {'loss': 0.3265, 'learning_rate': 8.939301769348253e-06, 'epoch': 1.1} {'loss': 0.3225, 'learning_rate': 8.938967687648838e-06, 'epoch': 1.1} {'loss': 0.4059, 'learning_rate': 8.93863360714713e-06, 'epoch': 1.1} {'loss': 0.3043, 'learning_rate': 8.9382995278435e-06, 'epoch': 1.1} {'loss': 0.2934, 'learning_rate': 8.937965449738329e-06, 'epoch': 1.1} {'loss': 0.4019, 'learning_rate': 8.937631372831993e-06, 'epoch': 1.1} {'loss': 0.29, 'learning_rate': 8.937297297124869e-06, 'epoch': 1.1} {'loss': 0.2831, 'learning_rate': 8.936963222617334e-06, 'epoch': 1.1} {'loss': 0.33, 'learning_rate': 8.936629149309765e-06, 'epoch': 1.1} {'loss': 0.3212, 'learning_rate': 8.936295077202541e-06, 'epoch': 1.1} {'loss': 0.3893, 'learning_rate': 8.935961006296035e-06, 'epoch': 1.1} {'loss': 0.3429, 'learning_rate': 8.93562693659063e-06, 'epoch': 1.1} {'loss': 0.4867, 'learning_rate': 8.9352928680867e-06, 'epoch': 1.1} {'loss': 0.2193, 'learning_rate': 8.93495880078462e-06, 'epoch': 1.1} {'loss': 0.5426, 'learning_rate': 8.934624734684769e-06, 'epoch': 1.1} {'loss': 0.3674, 'learning_rate': 8.934290669787525e-06, 'epoch': 1.1} {'loss': 0.3906, 'learning_rate': 8.93395660609326e-06, 'epoch': 1.1} {'loss': 0.3672, 'learning_rate': 8.933622543602361e-06, 'epoch': 1.1} {'loss': 0.2198, 'learning_rate': 8.933288482315197e-06, 'epoch': 1.1} {'loss': 0.3344, 'learning_rate': 8.932954422232148e-06, 'epoch': 1.1} {'loss': 0.4274, 'learning_rate': 8.93262036335359e-06, 'epoch': 1.1} {'loss': 0.3519, 'learning_rate': 8.932286305679899e-06, 'epoch': 1.1} {'loss': 0.2537, 'learning_rate': 8.931952249211456e-06, 'epoch': 1.1} {'loss': 0.206, 'learning_rate': 8.931618193948634e-06, 'epoch': 1.1} {'loss': 0.2434, 'learning_rate': 8.931284139891814e-06, 'epoch': 1.1} {'loss': 0.4009, 'learning_rate': 8.930950087041373e-06, 'epoch': 1.1} {'loss': 0.4721, 'learning_rate': 8.930616035397682e-06, 'epoch': 1.1} {'loss': 0.3336, 'learning_rate': 8.930281984961124e-06, 'epoch': 1.1} {'loss': 0.32, 'learning_rate': 8.929947935732073e-06, 'epoch': 1.1} {'loss': 0.225, 'learning_rate': 8.929613887710907e-06, 'epoch': 1.1} {'loss': 0.3404, 'learning_rate': 8.929279840898005e-06, 'epoch': 1.1} {'loss': 0.3181, 'learning_rate': 8.92894579529374e-06, 'epoch': 1.1} {'loss': 0.4581, 'learning_rate': 8.928611750898494e-06, 'epoch': 1.1} {'loss': 0.2803, 'learning_rate': 8.92827770771264e-06, 'epoch': 1.1} {'loss': 0.3211, 'learning_rate': 8.927943665736559e-06, 'epoch': 1.1} {'loss': 0.3278, 'learning_rate': 8.927609624970623e-06, 'epoch': 1.1} {'loss': 0.4098, 'learning_rate': 8.927275585415212e-06, 'epoch': 1.1} {'loss': 0.2429, 'learning_rate': 8.926941547070704e-06, 'epoch': 1.1} {'loss': 0.3776, 'learning_rate': 8.926607509937478e-06, 'epoch': 1.1} {'loss': 0.3855, 'learning_rate': 8.926273474015904e-06, 'epoch': 1.1} {'loss': 0.2866, 'learning_rate': 8.925939439306364e-06, 'epoch': 1.1} {'loss': 0.234, 'learning_rate': 8.925605405809235e-06, 'epoch': 1.1} {'loss': 0.1732, 'learning_rate': 8.92527137352489e-06, 'epoch': 1.1} {'loss': 0.4381, 'learning_rate': 8.924937342453712e-06, 'epoch': 1.1} {'loss': 0.2741, 'learning_rate': 8.924603312596075e-06, 'epoch': 1.1} {'loss': 0.3739, 'learning_rate': 8.924269283952356e-06, 'epoch': 1.1} {'loss': 0.3581, 'learning_rate': 8.923935256522934e-06, 'epoch': 1.1} {'loss': 0.3316, 'learning_rate': 8.923601230308182e-06, 'epoch': 1.1} {'loss': 0.321, 'learning_rate': 8.92326720530848e-06, 'epoch': 1.1} {'loss': 0.2825, 'learning_rate': 8.922933181524205e-06, 'epoch': 1.1} {'loss': 0.3211, 'learning_rate': 8.922599158955733e-06, 'epoch': 1.1} {'loss': 0.3656, 'learning_rate': 8.922265137603445e-06, 'epoch': 1.1} {'loss': 0.472, 'learning_rate': 8.921931117467713e-06, 'epoch': 1.1} {'loss': 0.349, 'learning_rate': 8.921597098548913e-06, 'epoch': 1.1} {'loss': 0.3189, 'learning_rate': 8.921263080847427e-06, 'epoch': 1.1} {'loss': 0.3535, 'learning_rate': 8.92092906436363e-06, 'epoch': 1.1} {'loss': 0.2783, 'learning_rate': 8.920595049097899e-06, 'epoch': 1.1} {'loss': 0.2937, 'learning_rate': 8.92026103505061e-06, 'epoch': 1.1} {'loss': 0.2298, 'learning_rate': 8.919927022222141e-06, 'epoch': 1.1} {'loss': 0.2423, 'learning_rate': 8.91959301061287e-06, 'epoch': 1.1} {'loss': 0.451, 'learning_rate': 8.919259000223172e-06, 'epoch': 1.1} {'loss': 0.2889, 'learning_rate': 8.918924991053425e-06, 'epoch': 1.1} {'loss': 0.3898, 'learning_rate': 8.918590983104007e-06, 'epoch': 1.1} {'loss': 0.4966, 'learning_rate': 8.918256976375292e-06, 'epoch': 1.1} {'loss': 0.3546, 'learning_rate': 8.91792297086766e-06, 'epoch': 1.1} {'loss': 0.4179, 'learning_rate': 8.917588966581488e-06, 'epoch': 1.1} {'loss': 0.4191, 'learning_rate': 8.917254963517153e-06, 'epoch': 1.1} {'loss': 0.3275, 'learning_rate': 8.91692096167503e-06, 'epoch': 1.1} {'loss': 0.2808, 'learning_rate': 8.916586961055497e-06, 'epoch': 1.1} {'loss': 0.3702, 'learning_rate': 8.916252961658933e-06, 'epoch': 1.1} {'loss': 0.3221, 'learning_rate': 8.915918963485711e-06, 'epoch': 1.1} {'loss': 0.3224, 'learning_rate': 8.915584966536212e-06, 'epoch': 1.1} {'loss': 0.3135, 'learning_rate': 8.915250970810814e-06, 'epoch': 1.1} {'loss': 0.2549, 'learning_rate': 8.914916976309888e-06, 'epoch': 1.1} {'loss': 0.3023, 'learning_rate': 8.914582983033814e-06, 'epoch': 1.1} {'loss': 0.2472, 'learning_rate': 8.914248990982971e-06, 'epoch': 1.1} {'loss': 0.4439, 'learning_rate': 8.913915000157733e-06, 'epoch': 1.1} {'loss': 0.2033, 'learning_rate': 8.91358101055848e-06, 'epoch': 1.1} {'loss': 0.5162, 'learning_rate': 8.913247022185587e-06, 'epoch': 1.1} {'loss': 0.3045, 'learning_rate': 8.91291303503943e-06, 'epoch': 1.1} {'loss': 0.338, 'learning_rate': 8.912579049120389e-06, 'epoch': 1.1} {'loss': 0.3651, 'learning_rate': 8.91224506442884e-06, 'epoch': 1.1} {'loss': 0.2656, 'learning_rate': 8.911911080965157e-06, 'epoch': 1.1} {'loss': 0.296, 'learning_rate': 8.911577098729722e-06, 'epoch': 1.1} {'loss': 0.3003, 'learning_rate': 8.911243117722907e-06, 'epoch': 1.1} {'loss': 0.3332, 'learning_rate': 8.910909137945097e-06, 'epoch': 1.1} {'loss': 0.3045, 'learning_rate': 8.910575159396658e-06, 'epoch': 1.1} {'loss': 0.2352, 'learning_rate': 8.910241182077974e-06, 'epoch': 1.1} {'loss': 0.2834, 'learning_rate': 8.90990720598942e-06, 'epoch': 1.1} {'loss': 0.3297, 'learning_rate': 8.909573231131374e-06, 'epoch': 1.1} {'loss': 0.3561, 'learning_rate': 8.909239257504212e-06, 'epoch': 1.1} {'loss': 0.2913, 'learning_rate': 8.908905285108313e-06, 'epoch': 1.1} {'loss': 0.2919, 'learning_rate': 8.90857131394405e-06, 'epoch': 1.1} {'loss': 0.247, 'learning_rate': 8.908237344011805e-06, 'epoch': 1.1} {'loss': 0.2663, 'learning_rate': 8.90790337531195e-06, 'epoch': 1.1} {'loss': 0.309, 'learning_rate': 8.907569407844864e-06, 'epoch': 1.1} {'loss': 0.3836, 'learning_rate': 8.907235441610928e-06, 'epoch': 1.1} {'loss': 0.2998, 'learning_rate': 8.906901476610512e-06, 'epoch': 1.1} {'loss': 0.4232, 'learning_rate': 8.906567512844e-06, 'epoch': 1.1} {'loss': 0.3686, 'learning_rate': 8.906233550311764e-06, 'epoch': 1.1} {'loss': 0.4029, 'learning_rate': 8.90589958901418e-06, 'epoch': 1.1} {'loss': 0.3231, 'learning_rate': 8.905565628951629e-06, 'epoch': 1.1} {'loss': 0.2975, 'learning_rate': 8.905231670124487e-06, 'epoch': 1.1} {'loss': 0.3452, 'learning_rate': 8.904897712533128e-06, 'epoch': 1.1} {'loss': 0.275, 'learning_rate': 8.904563756177933e-06, 'epoch': 1.1} {'loss': 0.3457, 'learning_rate': 8.904229801059276e-06, 'epoch': 1.1} {'loss': 0.3961, 'learning_rate': 8.903895847177537e-06, 'epoch': 1.1} {'loss': 0.2641, 'learning_rate': 8.903561894533088e-06, 'epoch': 1.1} {'loss': 0.5187, 'learning_rate': 8.903227943126313e-06, 'epoch': 1.1} {'loss': 0.3783, 'learning_rate': 8.902893992957583e-06, 'epoch': 1.1} {'loss': 0.2806, 'learning_rate': 8.902560044027277e-06, 'epoch': 1.1} {'loss': 0.2051, 'learning_rate': 8.902226096335775e-06, 'epoch': 1.1} {'loss': 0.4473, 'learning_rate': 8.901892149883447e-06, 'epoch': 1.1} {'loss': 0.3979, 'learning_rate': 8.901558204670676e-06, 'epoch': 1.1} {'loss': 0.3069, 'learning_rate': 8.901224260697836e-06, 'epoch': 1.1} {'loss': 0.2664, 'learning_rate': 8.900890317965305e-06, 'epoch': 1.1} {'loss': 0.275, 'learning_rate': 8.900556376473458e-06, 'epoch': 1.1} {'loss': 0.2964, 'learning_rate': 8.900222436222678e-06, 'epoch': 1.1} {'loss': 0.3237, 'learning_rate': 8.899888497213336e-06, 'epoch': 1.1} {'loss': 0.2933, 'learning_rate': 8.899554559445808e-06, 'epoch': 1.1} {'loss': 0.396, 'learning_rate': 8.899220622920477e-06, 'epoch': 1.1} {'loss': 0.3361, 'learning_rate': 8.898886687637715e-06, 'epoch': 1.1} {'loss': 0.3964, 'learning_rate': 8.8985527535979e-06, 'epoch': 1.1} {'loss': 0.2105, 'learning_rate': 8.89821882080141e-06, 'epoch': 1.1} {'loss': 0.3802, 'learning_rate': 8.897884889248625e-06, 'epoch': 1.1} {'loss': 0.2499, 'learning_rate': 8.897550958939914e-06, 'epoch': 1.1} {'loss': 0.2365, 'learning_rate': 8.89721702987566e-06, 'epoch': 1.1} {'loss': 0.4856, 'learning_rate': 8.896883102056238e-06, 'epoch': 1.1} {'loss': 0.3559, 'learning_rate': 8.896549175482024e-06, 'epoch': 1.1} {'loss': 0.3465, 'learning_rate': 8.896215250153399e-06, 'epoch': 1.1} {'loss': 0.4111, 'learning_rate': 8.895881326070734e-06, 'epoch': 1.1} {'loss': 0.278, 'learning_rate': 8.89554740323441e-06, 'epoch': 1.1} {'loss': 0.4304, 'learning_rate': 8.895213481644804e-06, 'epoch': 1.1} {'loss': 0.3745, 'learning_rate': 8.894879561302289e-06, 'epoch': 1.1} {'loss': 0.1997, 'learning_rate': 8.894545642207249e-06, 'epoch': 1.1} {'loss': 0.3052, 'learning_rate': 8.894211724360053e-06, 'epoch': 1.1} {'loss': 0.3582, 'learning_rate': 8.893877807761085e-06, 'epoch': 1.1} {'loss': 0.2995, 'learning_rate': 8.89354389241072e-06, 'epoch': 1.1} {'loss': 0.3843, 'learning_rate': 8.893209978309328e-06, 'epoch': 1.1} {'loss': 0.2113, 'learning_rate': 8.892876065457294e-06, 'epoch': 1.1} {'loss': 0.4684, 'learning_rate': 8.892542153854993e-06, 'epoch': 1.1} {'loss': 0.3615, 'learning_rate': 8.8922082435028e-06, 'epoch': 1.1} {'loss': 0.2563, 'learning_rate': 8.891874334401095e-06, 'epoch': 1.1} {'loss': 0.369, 'learning_rate': 8.891540426550251e-06, 'epoch': 1.1} {'loss': 0.3649, 'learning_rate': 8.891206519950648e-06, 'epoch': 1.1} {'loss': 0.3036, 'learning_rate': 8.890872614602663e-06, 'epoch': 1.1} {'loss': 0.2926, 'learning_rate': 8.89053871050667e-06, 'epoch': 1.1} {'loss': 0.2519, 'learning_rate': 8.89020480766305e-06, 'epoch': 1.1} {'loss': 0.4079, 'learning_rate': 8.889870906072176e-06, 'epoch': 1.1} {'loss': 0.2447, 'learning_rate': 8.889537005734428e-06, 'epoch': 1.1} {'loss': 0.388, 'learning_rate': 8.88920310665018e-06, 'epoch': 1.1} {'loss': 0.3911, 'learning_rate': 8.888869208819814e-06, 'epoch': 1.1} {'loss': 0.3889, 'learning_rate': 8.8885353122437e-06, 'epoch': 1.1} {'loss': 0.3377, 'learning_rate': 8.888201416922219e-06, 'epoch': 1.1} {'loss': 0.1944, 'learning_rate': 8.887867522855747e-06, 'epoch': 1.1} {'loss': 0.4117, 'learning_rate': 8.887533630044661e-06, 'epoch': 1.1} {'loss': 0.2901, 'learning_rate': 8.887199738489338e-06, 'epoch': 1.1} {'loss': 0.2611, 'learning_rate': 8.886865848190156e-06, 'epoch': 1.1} {'loss': 0.2801, 'learning_rate': 8.88653195914749e-06, 'epoch': 1.1} {'loss': 0.3569, 'learning_rate': 8.886198071361717e-06, 'epoch': 1.1} {'loss': 0.3927, 'learning_rate': 8.885864184833215e-06, 'epoch': 1.1} {'loss': 0.3068, 'learning_rate': 8.88553029956236e-06, 'epoch': 1.1} {'loss': 0.4526, 'learning_rate': 8.88519641554953e-06, 'epoch': 1.1} {'loss': 0.3675, 'learning_rate': 8.884862532795099e-06, 'epoch': 1.1} {'loss': 0.2335, 'learning_rate': 8.884528651299448e-06, 'epoch': 1.1} {'loss': 0.3294, 'learning_rate': 8.884194771062953e-06, 'epoch': 1.1} {'loss': 0.3614, 'learning_rate': 8.88386089208599e-06, 'epoch': 1.1} {'loss': 0.4051, 'learning_rate': 8.883527014368934e-06, 'epoch': 1.1} {'loss': 0.3896, 'learning_rate': 8.883193137912165e-06, 'epoch': 1.1} {'loss': 0.2547, 'learning_rate': 8.882859262716058e-06, 'epoch': 1.1} {'loss': 0.4243, 'learning_rate': 8.882525388780991e-06, 'epoch': 1.1} {'loss': 0.2913, 'learning_rate': 8.882191516107342e-06, 'epoch': 1.1} {'loss': 0.3428, 'learning_rate': 8.881857644695485e-06, 'epoch': 1.1} {'loss': 0.4183, 'learning_rate': 8.881523774545796e-06, 'epoch': 1.1} {'loss': 0.4022, 'learning_rate': 8.881189905658658e-06, 'epoch': 1.1} {'loss': 0.3574, 'learning_rate': 8.88085603803444e-06, 'epoch': 1.1} {'loss': 0.1966, 'learning_rate': 8.880522171673525e-06, 'epoch': 1.1} {'loss': 0.2531, 'learning_rate': 8.880188306576286e-06, 'epoch': 1.1} {'loss': 0.3528, 'learning_rate': 8.879854442743102e-06, 'epoch': 1.1} {'loss': 0.2921, 'learning_rate': 8.879520580174348e-06, 'epoch': 1.1} {'loss': 0.3179, 'learning_rate': 8.879186718870406e-06, 'epoch': 1.1} {'loss': 0.37, 'learning_rate': 8.878852858831646e-06, 'epoch': 1.1} {'loss': 0.3992, 'learning_rate': 8.878519000058447e-06, 'epoch': 1.1} {'loss': 0.2797, 'learning_rate': 8.87818514255119e-06, 'epoch': 1.1} {'loss': 0.2056, 'learning_rate': 8.877851286310248e-06, 'epoch': 1.1} {'loss': 0.2922, 'learning_rate': 8.877517431335998e-06, 'epoch': 1.1} {'loss': 0.2061, 'learning_rate': 8.877183577628818e-06, 'epoch': 1.1} {'loss': 0.351, 'learning_rate': 8.876849725189082e-06, 'epoch': 1.1} {'loss': 0.3762, 'learning_rate': 8.87651587401717e-06, 'epoch': 1.1} {'loss': 0.4314, 'learning_rate': 8.876182024113458e-06, 'epoch': 1.1} {'loss': 0.2847, 'learning_rate': 8.875848175478323e-06, 'epoch': 1.1} {'loss': 0.3755, 'learning_rate': 8.87551432811214e-06, 'epoch': 1.1} {'loss': 0.3623, 'learning_rate': 8.875180482015291e-06, 'epoch': 1.1} {'loss': 0.2954, 'learning_rate': 8.874846637188147e-06, 'epoch': 1.1} {'loss': 0.3792, 'learning_rate': 8.874512793631088e-06, 'epoch': 1.1} {'loss': 0.3116, 'learning_rate': 8.87417895134449e-06, 'epoch': 1.1} {'loss': 0.2532, 'learning_rate': 8.87384511032873e-06, 'epoch': 1.1} {'loss': 0.283, 'learning_rate': 8.873511270584184e-06, 'epoch': 1.1} {'loss': 0.3501, 'learning_rate': 8.873177432111231e-06, 'epoch': 1.1} {'loss': 0.2093, 'learning_rate': 8.872843594910245e-06, 'epoch': 1.1} {'loss': 0.3154, 'learning_rate': 8.872509758981604e-06, 'epoch': 1.1} {'loss': 0.4799, 'learning_rate': 8.872175924325687e-06, 'epoch': 1.1} {'loss': 0.279, 'learning_rate': 8.871842090942867e-06, 'epoch': 1.1} {'loss': 0.2656, 'learning_rate': 8.871508258833523e-06, 'epoch': 1.1} {'loss': 0.4198, 'learning_rate': 8.871174427998031e-06, 'epoch': 1.1} {'loss': 0.136, 'learning_rate': 8.870840598436769e-06, 'epoch': 1.1} {'loss': 0.4707, 'learning_rate': 8.870506770150115e-06, 'epoch': 1.1} {'loss': 0.3136, 'learning_rate': 8.870172943138442e-06, 'epoch': 1.1} {'loss': 0.355, 'learning_rate': 8.869839117402129e-06, 'epoch': 1.1} {'loss': 0.2135, 'learning_rate': 8.869505292941553e-06, 'epoch': 1.1} {'loss': 0.3796, 'learning_rate': 8.86917146975709e-06, 'epoch': 1.1} {'loss': 0.3185, 'learning_rate': 8.868837647849121e-06, 'epoch': 1.1} {'loss': 0.4979, 'learning_rate': 8.868503827218017e-06, 'epoch': 1.1} {'loss': 0.5097, 'learning_rate': 8.868170007864156e-06, 'epoch': 1.1} {'loss': 0.327, 'learning_rate': 8.867836189787917e-06, 'epoch': 1.1} {'loss': 0.3865, 'learning_rate': 8.867502372989674e-06, 'epoch': 1.1} {'loss': 0.4809, 'learning_rate': 8.867168557469806e-06, 'epoch': 1.1} {'loss': 0.3471, 'learning_rate': 8.86683474322869e-06, 'epoch': 1.1} {'loss': 0.4075, 'learning_rate': 8.8665009302667e-06, 'epoch': 1.1} {'loss': 0.2459, 'learning_rate': 8.866167118584218e-06, 'epoch': 1.1} {'loss': 0.2976, 'learning_rate': 8.865833308181616e-06, 'epoch': 1.1} {'loss': 0.4781, 'learning_rate': 8.865499499059272e-06, 'epoch': 1.1} {'loss': 0.3825, 'learning_rate': 8.865165691217564e-06, 'epoch': 1.1} {'loss': 0.1617, 'learning_rate': 8.864831884656868e-06, 'epoch': 1.1} {'loss': 0.2417, 'learning_rate': 8.864498079377564e-06, 'epoch': 1.1} {'loss': 0.4126, 'learning_rate': 8.864164275380022e-06, 'epoch': 1.1} {'loss': 0.4406, 'learning_rate': 8.863830472664624e-06, 'epoch': 1.1} {'loss': 0.4223, 'learning_rate': 8.863496671231745e-06, 'epoch': 1.1} {'loss': 0.3885, 'learning_rate': 8.863162871081762e-06, 'epoch': 1.1} {'loss': 0.3659, 'learning_rate': 8.862829072215051e-06, 'epoch': 1.1} {'loss': 0.5262, 'learning_rate': 8.862495274631991e-06, 'epoch': 1.1} {'loss': 0.299, 'learning_rate': 8.862161478332957e-06, 'epoch': 1.1} {'loss': 0.4589, 'learning_rate': 8.861827683318327e-06, 'epoch': 1.1} {'loss': 0.45, 'learning_rate': 8.861493889588476e-06, 'epoch': 1.1} {'loss': 0.3462, 'learning_rate': 8.861160097143783e-06, 'epoch': 1.1} {'loss': 0.2789, 'learning_rate': 8.860826305984624e-06, 'epoch': 1.1} {'loss': 0.304, 'learning_rate': 8.860492516111373e-06, 'epoch': 1.1} {'loss': 0.3181, 'learning_rate': 8.860158727524414e-06, 'epoch': 1.1} {'loss': 0.3286, 'learning_rate': 8.859824940224115e-06, 'epoch': 1.1} {'loss': 0.2854, 'learning_rate': 8.859491154210858e-06, 'epoch': 1.1} {'loss': 0.3519, 'learning_rate': 8.859157369485018e-06, 'epoch': 1.1} {'loss': 0.4025, 'learning_rate': 8.858823586046973e-06, 'epoch': 1.1} {'loss': 0.4805, 'learning_rate': 8.8584898038971e-06, 'epoch': 1.1} {'loss': 0.3192, 'learning_rate': 8.858156023035773e-06, 'epoch': 1.1} {'loss': 0.282, 'learning_rate': 8.857822243463372e-06, 'epoch': 1.1} {'loss': 0.4013, 'learning_rate': 8.857488465180271e-06, 'epoch': 1.1} {'loss': 0.3424, 'learning_rate': 8.85715468818685e-06, 'epoch': 1.1} {'loss': 0.3861, 'learning_rate': 8.856820912483484e-06, 'epoch': 1.1} {'loss': 0.4534, 'learning_rate': 8.856487138070548e-06, 'epoch': 1.1} {'loss': 0.2464, 'learning_rate': 8.856153364948423e-06, 'epoch': 1.1} {'loss': 0.4242, 'learning_rate': 8.855819593117484e-06, 'epoch': 1.1} {'loss': 0.3787, 'learning_rate': 8.855485822578106e-06, 'epoch': 1.1} {'loss': 0.3038, 'learning_rate': 8.855152053330665e-06, 'epoch': 1.1} {'loss': 0.3438, 'learning_rate': 8.85481828537554e-06, 'epoch': 1.1} {'loss': 0.3226, 'learning_rate': 8.854484518713108e-06, 'epoch': 1.1} {'loss': 0.3747, 'learning_rate': 8.854150753343747e-06, 'epoch': 1.1} {'loss': 0.2256, 'learning_rate': 8.85381698926783e-06, 'epoch': 1.1} {'loss': 0.3745, 'learning_rate': 8.853483226485735e-06, 'epoch': 1.1} {'loss': 0.4136, 'learning_rate': 8.85314946499784e-06, 'epoch': 1.1} {'loss': 0.2934, 'learning_rate': 8.852815704804522e-06, 'epoch': 1.1} {'loss': 0.3772, 'learning_rate': 8.852481945906156e-06, 'epoch': 1.1} {'loss': 0.3031, 'learning_rate': 8.85214818830312e-06, 'epoch': 1.1} {'loss': 0.3791, 'learning_rate': 8.851814431995787e-06, 'epoch': 1.1} {'loss': 0.3415, 'learning_rate': 8.851480676984542e-06, 'epoch': 1.1} {'loss': 0.3275, 'learning_rate': 8.851146923269754e-06, 'epoch': 1.1} {'loss': 0.2878, 'learning_rate': 8.850813170851804e-06, 'epoch': 1.1} {'loss': 0.3241, 'learning_rate': 8.850479419731068e-06, 'epoch': 1.1} {'loss': 0.4694, 'learning_rate': 8.850145669907922e-06, 'epoch': 1.1} {'loss': 0.343, 'learning_rate': 8.849811921382743e-06, 'epoch': 1.1} {'loss': 0.5081, 'learning_rate': 8.849478174155907e-06, 'epoch': 1.1} {'loss': 0.3946, 'learning_rate': 8.849144428227791e-06, 'epoch': 1.1} {'loss': 0.4684, 'learning_rate': 8.848810683598775e-06, 'epoch': 1.1} {'loss': 0.3921, 'learning_rate': 8.848476940269231e-06, 'epoch': 1.1} {'loss': 0.4245, 'learning_rate': 8.848143198239537e-06, 'epoch': 1.1} {'loss': 0.4506, 'learning_rate': 8.84780945751007e-06, 'epoch': 1.1} {'loss': 0.4252, 'learning_rate': 8.847475718081208e-06, 'epoch': 1.1} {'loss': 0.4086, 'learning_rate': 8.847141979953326e-06, 'epoch': 1.1} {'loss': 0.3141, 'learning_rate': 8.846808243126801e-06, 'epoch': 1.1} {'loss': 0.4047, 'learning_rate': 8.846474507602012e-06, 'epoch': 1.1} {'loss': 0.1501, 'learning_rate': 8.846140773379332e-06, 'epoch': 1.1} {'loss': 0.3758, 'learning_rate': 8.84580704045914e-06, 'epoch': 1.1} {'loss': 0.4681, 'learning_rate': 8.845473308841814e-06, 'epoch': 1.1} {'loss': 0.3604, 'learning_rate': 8.845139578527726e-06, 'epoch': 1.1} {'loss': 0.1294, 'learning_rate': 8.844805849517258e-06, 'epoch': 1.1} {'loss': 0.4094, 'learning_rate': 8.844472121810786e-06, 'epoch': 1.1} {'loss': 0.3786, 'learning_rate': 8.844138395408684e-06, 'epoch': 1.1} {'loss': 0.4038, 'learning_rate': 8.84380467031133e-06, 'epoch': 1.1} {'loss': 0.3422, 'learning_rate': 8.843470946519099e-06, 'epoch': 1.1} {'loss': 0.2825, 'learning_rate': 8.84313722403237e-06, 'epoch': 1.1} {'loss': 0.3076, 'learning_rate': 8.84280350285152e-06, 'epoch': 1.1} {'loss': 0.2995, 'learning_rate': 8.842469782976925e-06, 'epoch': 1.1} {'loss': 0.3804, 'learning_rate': 8.842136064408961e-06, 'epoch': 1.1} {'loss': 0.4632, 'learning_rate': 8.841802347148005e-06, 'epoch': 1.1} {'loss': 0.3681, 'learning_rate': 8.841468631194433e-06, 'epoch': 1.1} {'loss': 0.2909, 'learning_rate': 8.841134916548623e-06, 'epoch': 1.1} {'loss': 0.3997, 'learning_rate': 8.840801203210952e-06, 'epoch': 1.1} {'loss': 0.3296, 'learning_rate': 8.840467491181796e-06, 'epoch': 1.1} {'loss': 0.2232, 'learning_rate': 8.840133780461533e-06, 'epoch': 1.1} {'loss': 0.3408, 'learning_rate': 8.839800071050538e-06, 'epoch': 1.1} {'loss': 0.2086, 'learning_rate': 8.839466362949187e-06, 'epoch': 1.1} {'loss': 0.5345, 'learning_rate': 8.839132656157858e-06, 'epoch': 1.1} {'loss': 0.2386, 'learning_rate': 8.838798950676927e-06, 'epoch': 1.1} {'loss': 0.4263, 'learning_rate': 8.838465246506772e-06, 'epoch': 1.1} {'loss': 0.1549, 'learning_rate': 8.838131543647767e-06, 'epoch': 1.1} {'loss': 0.3107, 'learning_rate': 8.837797842100294e-06, 'epoch': 1.1} {'loss': 0.2353, 'learning_rate': 8.837464141864723e-06, 'epoch': 1.1} {'loss': 0.351, 'learning_rate': 8.837130442941435e-06, 'epoch': 1.1} {'loss': 0.2859, 'learning_rate': 8.836796745330806e-06, 'epoch': 1.1} {'loss': 0.3891, 'learning_rate': 8.836463049033212e-06, 'epoch': 1.1} {'loss': 0.2941, 'learning_rate': 8.836129354049031e-06, 'epoch': 1.1} {'loss': 0.22, 'learning_rate': 8.835795660378638e-06, 'epoch': 1.1} {'loss': 0.2104, 'learning_rate': 8.83546196802241e-06, 'epoch': 1.1} {'loss': 0.3716, 'learning_rate': 8.835128276980725e-06, 'epoch': 1.1} {'loss': 0.438, 'learning_rate': 8.834794587253957e-06, 'epoch': 1.1} {'loss': 0.2893, 'learning_rate': 8.834460898842484e-06, 'epoch': 1.1} {'loss': 0.2452, 'learning_rate': 8.834127211746683e-06, 'epoch': 1.1} {'loss': 0.4743, 'learning_rate': 8.833793525966932e-06, 'epoch': 1.1} {'loss': 0.2403, 'learning_rate': 8.833459841503607e-06, 'epoch': 1.1} {'loss': 0.3315, 'learning_rate': 8.833126158357083e-06, 'epoch': 1.1} {'loss': 0.3931, 'learning_rate': 8.832792476527737e-06, 'epoch': 1.1} {'loss': 0.3694, 'learning_rate': 8.832458796015947e-06, 'epoch': 1.1} {'loss': 0.1826, 'learning_rate': 8.83212511682209e-06, 'epoch': 1.1} {'loss': 0.2816, 'learning_rate': 8.831791438946539e-06, 'epoch': 1.1} {'loss': 0.3823, 'learning_rate': 8.831457762389677e-06, 'epoch': 1.1} {'loss': 0.2617, 'learning_rate': 8.831124087151875e-06, 'epoch': 1.1} {'loss': 0.5749, 'learning_rate': 8.830790413233512e-06, 'epoch': 1.1} {'loss': 0.4562, 'learning_rate': 8.830456740634963e-06, 'epoch': 1.1} {'loss': 0.399, 'learning_rate': 8.830123069356606e-06, 'epoch': 1.1} {'loss': 0.3466, 'learning_rate': 8.82978939939882e-06, 'epoch': 1.1} {'loss': 0.2954, 'learning_rate': 8.829455730761977e-06, 'epoch': 1.1} {'loss': 0.3645, 'learning_rate': 8.829122063446456e-06, 'epoch': 1.1} {'loss': 0.3864, 'learning_rate': 8.828788397452634e-06, 'epoch': 1.1} {'loss': 0.3183, 'learning_rate': 8.828454732780887e-06, 'epoch': 1.1} {'loss': 0.3905, 'learning_rate': 8.828121069431592e-06, 'epoch': 1.1} {'loss': 0.2952, 'learning_rate': 8.827787407405126e-06, 'epoch': 1.1} {'loss': 0.313, 'learning_rate': 8.827453746701864e-06, 'epoch': 1.1} {'loss': 0.4523, 'learning_rate': 8.827120087322187e-06, 'epoch': 1.1} {'loss': 0.4146, 'learning_rate': 8.826786429266465e-06, 'epoch': 1.1} {'loss': 0.2967, 'learning_rate': 8.82645277253508e-06, 'epoch': 1.1} {'loss': 0.287, 'learning_rate': 8.826119117128404e-06, 'epoch': 1.1} {'loss': 0.2493, 'learning_rate': 8.825785463046819e-06, 'epoch': 1.1} {'loss': 0.2724, 'learning_rate': 8.825451810290697e-06, 'epoch': 1.1} {'loss': 0.3228, 'learning_rate': 8.825118158860417e-06, 'epoch': 1.1} {'loss': 0.2651, 'learning_rate': 8.824784508756355e-06, 'epoch': 1.1} {'loss': 0.384, 'learning_rate': 8.824450859978889e-06, 'epoch': 1.1} {'loss': 0.381, 'learning_rate': 8.824117212528394e-06, 'epoch': 1.1} {'loss': 0.548, 'learning_rate': 8.823783566405247e-06, 'epoch': 1.1} {'loss': 0.341, 'learning_rate': 8.823449921609824e-06, 'epoch': 1.1} {'loss': 0.3395, 'learning_rate': 8.823116278142502e-06, 'epoch': 1.1} {'loss': 0.3295, 'learning_rate': 8.82278263600366e-06, 'epoch': 1.1} {'loss': 0.25, 'learning_rate': 8.822448995193672e-06, 'epoch': 1.1} {'loss': 0.4636, 'learning_rate': 8.822115355712915e-06, 'epoch': 1.1} {'loss': 0.3439, 'learning_rate': 8.821781717561763e-06, 'epoch': 1.1} {'loss': 0.4738, 'learning_rate': 8.8214480807406e-06, 'epoch': 1.1} {'loss': 0.3207, 'learning_rate': 8.821114445249795e-06, 'epoch': 1.1} {'loss': 0.2919, 'learning_rate': 8.820780811089728e-06, 'epoch': 1.1} {'loss': 0.2982, 'learning_rate': 8.820447178260775e-06, 'epoch': 1.1} {'loss': 0.3521, 'learning_rate': 8.820113546763312e-06, 'epoch': 1.1} {'loss': 0.2804, 'learning_rate': 8.819779916597718e-06, 'epoch': 1.1} {'loss': 0.2772, 'learning_rate': 8.819446287764368e-06, 'epoch': 1.1} {'loss': 0.3974, 'learning_rate': 8.819112660263637e-06, 'epoch': 1.1} {'loss': 0.2555, 'learning_rate': 8.818779034095904e-06, 'epoch': 1.1} {'loss': 0.2169, 'learning_rate': 8.818445409261544e-06, 'epoch': 1.1} {'loss': 0.416, 'learning_rate': 8.818111785760936e-06, 'epoch': 1.1} {'loss': 0.3969, 'learning_rate': 8.817778163594455e-06, 'epoch': 1.1} {'loss': 0.2817, 'learning_rate': 8.817444542762478e-06, 'epoch': 1.1} {'loss': 0.3886, 'learning_rate': 8.81711092326538e-06, 'epoch': 1.1} {'loss': 0.3974, 'learning_rate': 8.81677730510354e-06, 'epoch': 1.1} {'loss': 0.382, 'learning_rate': 8.816443688277333e-06, 'epoch': 1.1} {'loss': 0.4075, 'learning_rate': 8.816110072787136e-06, 'epoch': 1.1} {'loss': 0.4368, 'learning_rate': 8.815776458633329e-06, 'epoch': 1.1} {'loss': 0.386, 'learning_rate': 8.815442845816281e-06, 'epoch': 1.1} {'loss': 0.226, 'learning_rate': 8.815109234336374e-06, 'epoch': 1.1} {'loss': 0.4135, 'learning_rate': 8.814775624193982e-06, 'epoch': 1.1} {'loss': 0.387, 'learning_rate': 8.814442015389484e-06, 'epoch': 1.1} {'loss': 0.3898, 'learning_rate': 8.814108407923255e-06, 'epoch': 1.1} {'loss': 0.3979, 'learning_rate': 8.813774801795673e-06, 'epoch': 1.1} {'loss': 0.3366, 'learning_rate': 8.813441197007114e-06, 'epoch': 1.1} {'loss': 0.3191, 'learning_rate': 8.813107593557953e-06, 'epoch': 1.1} {'loss': 0.3062, 'learning_rate': 8.812773991448567e-06, 'epoch': 1.1} {'loss': 0.2066, 'learning_rate': 8.812440390679336e-06, 'epoch': 1.1} {'loss': 0.5056, 'learning_rate': 8.812106791250632e-06, 'epoch': 1.1} {'loss': 0.4929, 'learning_rate': 8.811773193162835e-06, 'epoch': 1.1} {'loss': 0.3244, 'learning_rate': 8.811439596416322e-06, 'epoch': 1.1} {'loss': 0.4454, 'learning_rate': 8.811106001011463e-06, 'epoch': 1.1} {'loss': 0.4119, 'learning_rate': 8.810772406948642e-06, 'epoch': 1.1} {'loss': 0.5029, 'learning_rate': 8.810438814228232e-06, 'epoch': 1.1} {'loss': 0.2959, 'learning_rate': 8.81010522285061e-06, 'epoch': 1.1} {'loss': 0.2801, 'learning_rate': 8.809771632816154e-06, 'epoch': 1.1} {'loss': 0.4327, 'learning_rate': 8.809438044125237e-06, 'epoch': 1.1} {'loss': 0.3679, 'learning_rate': 8.809104456778242e-06, 'epoch': 1.1} {'loss': 0.291, 'learning_rate': 8.808770870775539e-06, 'epoch': 1.1} {'loss': 0.3076, 'learning_rate': 8.808437286117509e-06, 'epoch': 1.1} {'loss': 0.4078, 'learning_rate': 8.808103702804525e-06, 'epoch': 1.1} {'loss': 0.5228, 'learning_rate': 8.807770120836965e-06, 'epoch': 1.1} {'loss': 0.4124, 'learning_rate': 8.807436540215206e-06, 'epoch': 1.1} {'loss': 0.3002, 'learning_rate': 8.807102960939627e-06, 'epoch': 1.1} {'loss': 0.2547, 'learning_rate': 8.806769383010601e-06, 'epoch': 1.1} {'loss': 0.2927, 'learning_rate': 8.806435806428504e-06, 'epoch': 1.1} {'loss': 0.2433, 'learning_rate': 8.806102231193713e-06, 'epoch': 1.1} {'loss': 0.2571, 'learning_rate': 8.805768657306607e-06, 'epoch': 1.1} {'loss': 0.378, 'learning_rate': 8.80543508476756e-06, 'epoch': 1.1} {'loss': 0.3471, 'learning_rate': 8.805101513576951e-06, 'epoch': 1.1} {'loss': 0.3411, 'learning_rate': 8.804767943735155e-06, 'epoch': 1.1} {'loss': 0.3139, 'learning_rate': 8.80443437524255e-06, 'epoch': 1.11} {'loss': 0.2657, 'learning_rate': 8.804100808099509e-06, 'epoch': 1.11} {'loss': 0.306, 'learning_rate': 8.80376724230641e-06, 'epoch': 1.11} {'loss': 0.3629, 'learning_rate': 8.803433677863632e-06, 'epoch': 1.11} {'loss': 0.3695, 'learning_rate': 8.80310011477155e-06, 'epoch': 1.11} {'loss': 0.3541, 'learning_rate': 8.802766553030542e-06, 'epoch': 1.11} {'loss': 0.4545, 'learning_rate': 8.802432992640982e-06, 'epoch': 1.11} {'loss': 0.2813, 'learning_rate': 8.802099433603246e-06, 'epoch': 1.11} {'loss': 0.3261, 'learning_rate': 8.801765875917711e-06, 'epoch': 1.11} {'loss': 0.2485, 'learning_rate': 8.801432319584756e-06, 'epoch': 1.11} {'loss': 0.2338, 'learning_rate': 8.801098764604755e-06, 'epoch': 1.11} {'loss': 0.2559, 'learning_rate': 8.800765210978085e-06, 'epoch': 1.11} {'loss': 0.2426, 'learning_rate': 8.800431658705125e-06, 'epoch': 1.11} {'loss': 0.2859, 'learning_rate': 8.800098107786249e-06, 'epoch': 1.11} {'loss': 0.3838, 'learning_rate': 8.799764558221834e-06, 'epoch': 1.11} {'loss': 0.3307, 'learning_rate': 8.799431010012257e-06, 'epoch': 1.11} {'loss': 0.319, 'learning_rate': 8.799097463157894e-06, 'epoch': 1.11} {'loss': 0.3804, 'learning_rate': 8.79876391765912e-06, 'epoch': 1.11} {'loss': 0.2976, 'learning_rate': 8.798430373516314e-06, 'epoch': 1.11} {'loss': 0.2555, 'learning_rate': 8.798096830729854e-06, 'epoch': 1.11} {'loss': 0.497, 'learning_rate': 8.797763289300111e-06, 'epoch': 1.11} {'loss': 0.302, 'learning_rate': 8.797429749227468e-06, 'epoch': 1.11} {'loss': 0.3871, 'learning_rate': 8.797096210512295e-06, 'epoch': 1.11} {'loss': 0.3052, 'learning_rate': 8.796762673154972e-06, 'epoch': 1.11} {'loss': 0.4011, 'learning_rate': 8.796429137155875e-06, 'epoch': 1.11} {'loss': 0.4595, 'learning_rate': 8.796095602515383e-06, 'epoch': 1.11} {'loss': 0.2842, 'learning_rate': 8.795762069233867e-06, 'epoch': 1.11} {'loss': 0.26, 'learning_rate': 8.795428537311708e-06, 'epoch': 1.11} {'loss': 0.2795, 'learning_rate': 8.79509500674928e-06, 'epoch': 1.11} {'loss': 0.2514, 'learning_rate': 8.794761477546963e-06, 'epoch': 1.11} {'loss': 0.3501, 'learning_rate': 8.794427949705128e-06, 'epoch': 1.11} {'loss': 0.3223, 'learning_rate': 8.794094423224157e-06, 'epoch': 1.11} {'loss': 0.2423, 'learning_rate': 8.793760898104425e-06, 'epoch': 1.11} {'loss': 0.423, 'learning_rate': 8.793427374346308e-06, 'epoch': 1.11} {'loss': 0.4306, 'learning_rate': 8.793093851950178e-06, 'epoch': 1.11} {'loss': 0.289, 'learning_rate': 8.792760330916418e-06, 'epoch': 1.11} {'loss': 0.3032, 'learning_rate': 8.792426811245402e-06, 'epoch': 1.11} {'loss': 0.242, 'learning_rate': 8.792093292937506e-06, 'epoch': 1.11} {'loss': 0.3543, 'learning_rate': 8.791759775993108e-06, 'epoch': 1.11} {'loss': 0.348, 'learning_rate': 8.791426260412581e-06, 'epoch': 1.11} {'loss': 0.2622, 'learning_rate': 8.791092746196305e-06, 'epoch': 1.11} {'loss': 0.3585, 'learning_rate': 8.790759233344656e-06, 'epoch': 1.11} {'loss': 0.3411, 'learning_rate': 8.79042572185801e-06, 'epoch': 1.11} {'loss': 0.5271, 'learning_rate': 8.790092211736743e-06, 'epoch': 1.11} {'loss': 0.3166, 'learning_rate': 8.789758702981232e-06, 'epoch': 1.11} {'loss': 0.4553, 'learning_rate': 8.789425195591855e-06, 'epoch': 1.11} {'loss': 0.4695, 'learning_rate': 8.789091689568986e-06, 'epoch': 1.11} {'loss': 0.3499, 'learning_rate': 8.788758184913001e-06, 'epoch': 1.11} {'loss': 0.3526, 'learning_rate': 8.788424681624278e-06, 'epoch': 1.11} {'loss': 0.3457, 'learning_rate': 8.788091179703193e-06, 'epoch': 1.11} {'loss': 0.2326, 'learning_rate': 8.787757679150122e-06, 'epoch': 1.11} {'loss': 0.2216, 'learning_rate': 8.787424179965442e-06, 'epoch': 1.11} {'loss': 0.3462, 'learning_rate': 8.787090682149531e-06, 'epoch': 1.11} {'loss': 0.2388, 'learning_rate': 8.786757185702764e-06, 'epoch': 1.11} {'loss': 0.4925, 'learning_rate': 8.786423690625516e-06, 'epoch': 1.11} {'loss': 0.5, 'learning_rate': 8.786090196918165e-06, 'epoch': 1.11} {'loss': 0.2405, 'learning_rate': 8.785756704581087e-06, 'epoch': 1.11} {'loss': 0.2426, 'learning_rate': 8.785423213614657e-06, 'epoch': 1.11} {'loss': 0.2464, 'learning_rate': 8.785089724019257e-06, 'epoch': 1.11} {'loss': 0.3354, 'learning_rate': 8.784756235795257e-06, 'epoch': 1.11} {'loss': 0.2599, 'learning_rate': 8.784422748943039e-06, 'epoch': 1.11} {'loss': 0.4705, 'learning_rate': 8.784089263462976e-06, 'epoch': 1.11} {'loss': 0.222, 'learning_rate': 8.783755779355442e-06, 'epoch': 1.11} {'loss': 0.4747, 'learning_rate': 8.78342229662082e-06, 'epoch': 1.11} {'loss': 0.3531, 'learning_rate': 8.78308881525948e-06, 'epoch': 1.11} {'loss': 0.4472, 'learning_rate': 8.782755335271807e-06, 'epoch': 1.11} {'loss': 0.2642, 'learning_rate': 8.782421856658167e-06, 'epoch': 1.11} {'loss': 0.4077, 'learning_rate': 8.782088379418941e-06, 'epoch': 1.11} {'loss': 0.2559, 'learning_rate': 8.781754903554508e-06, 'epoch': 1.11} {'loss': 0.4563, 'learning_rate': 8.781421429065239e-06, 'epoch': 1.11} {'loss': 0.3032, 'learning_rate': 8.781087955951515e-06, 'epoch': 1.11} {'loss': 0.337, 'learning_rate': 8.780754484213711e-06, 'epoch': 1.11} {'loss': 0.2034, 'learning_rate': 8.780421013852203e-06, 'epoch': 1.11} {'loss': 0.3506, 'learning_rate': 8.780087544867369e-06, 'epoch': 1.11} {'loss': 0.3127, 'learning_rate': 8.779754077259582e-06, 'epoch': 1.11} {'loss': 0.4081, 'learning_rate': 8.779420611029221e-06, 'epoch': 1.11} {'loss': 0.3467, 'learning_rate': 8.779087146176663e-06, 'epoch': 1.11} {'loss': 0.2622, 'learning_rate': 8.778753682702284e-06, 'epoch': 1.11} {'loss': 0.3935, 'learning_rate': 8.778420220606458e-06, 'epoch': 1.11} {'loss': 0.3785, 'learning_rate': 8.778086759889567e-06, 'epoch': 1.11} {'loss': 0.4071, 'learning_rate': 8.777753300551981e-06, 'epoch': 1.11} {'loss': 0.3545, 'learning_rate': 8.77741984259408e-06, 'epoch': 1.11} {'loss': 0.3578, 'learning_rate': 8.777086386016237e-06, 'epoch': 1.11} {'loss': 0.2624, 'learning_rate': 8.776752930818833e-06, 'epoch': 1.11} {'loss': 0.2103, 'learning_rate': 8.776419477002242e-06, 'epoch': 1.11} {'loss': 0.4245, 'learning_rate': 8.776086024566841e-06, 'epoch': 1.11} {'loss': 0.2798, 'learning_rate': 8.775752573513005e-06, 'epoch': 1.11} {'loss': 0.2097, 'learning_rate': 8.775419123841112e-06, 'epoch': 1.11} {'loss': 0.2873, 'learning_rate': 8.77508567555154e-06, 'epoch': 1.11} {'loss': 0.2601, 'learning_rate': 8.77475222864466e-06, 'epoch': 1.11} {'loss': 0.3545, 'learning_rate': 8.774418783120853e-06, 'epoch': 1.11} {'loss': 0.1601, 'learning_rate': 8.774085338980495e-06, 'epoch': 1.11} {'loss': 0.2742, 'learning_rate': 8.773751896223964e-06, 'epoch': 1.11} {'loss': 0.3711, 'learning_rate': 8.77341845485163e-06, 'epoch': 1.11} {'loss': 0.3307, 'learning_rate': 8.773085014863874e-06, 'epoch': 1.11} {'loss': 0.559, 'learning_rate': 8.772751576261072e-06, 'epoch': 1.11} {'loss': 0.3022, 'learning_rate': 8.772418139043601e-06, 'epoch': 1.11} {'loss': 0.4112, 'learning_rate': 8.772084703211835e-06, 'epoch': 1.11} {'loss': 0.3631, 'learning_rate': 8.771751268766152e-06, 'epoch': 1.11} {'loss': 0.3555, 'learning_rate': 8.77141783570693e-06, 'epoch': 1.11} {'loss': 0.5308, 'learning_rate': 8.77108440403454e-06, 'epoch': 1.11} {'loss': 0.5142, 'learning_rate': 8.770750973749365e-06, 'epoch': 1.11} {'loss': 0.3078, 'learning_rate': 8.770417544851778e-06, 'epoch': 1.11} {'loss': 0.4398, 'learning_rate': 8.770084117342156e-06, 'epoch': 1.11} {'loss': 0.4072, 'learning_rate': 8.769750691220876e-06, 'epoch': 1.11} {'loss': 0.3844, 'learning_rate': 8.769417266488313e-06, 'epoch': 1.11} {'loss': 0.2025, 'learning_rate': 8.769083843144843e-06, 'epoch': 1.11} {'loss': 0.3546, 'learning_rate': 8.768750421190844e-06, 'epoch': 1.11} {'loss': 0.3656, 'learning_rate': 8.76841700062669e-06, 'epoch': 1.11} {'loss': 0.2605, 'learning_rate': 8.76808358145276e-06, 'epoch': 1.11} {'loss': 0.3514, 'learning_rate': 8.76775016366943e-06, 'epoch': 1.11} {'loss': 0.2705, 'learning_rate': 8.767416747277075e-06, 'epoch': 1.11} {'loss': 0.3366, 'learning_rate': 8.767083332276071e-06, 'epoch': 1.11} {'loss': 0.3454, 'learning_rate': 8.766749918666797e-06, 'epoch': 1.11} {'loss': 0.2781, 'learning_rate': 8.766416506449629e-06, 'epoch': 1.11} {'loss': 0.4351, 'learning_rate': 8.76608309562494e-06, 'epoch': 1.11} {'loss': 0.2699, 'learning_rate': 8.765749686193109e-06, 'epoch': 1.11} {'loss': 0.3162, 'learning_rate': 8.765416278154513e-06, 'epoch': 1.11} {'loss': 0.3595, 'learning_rate': 8.765082871509529e-06, 'epoch': 1.11} {'loss': 0.278, 'learning_rate': 8.764749466258527e-06, 'epoch': 1.11} {'loss': 0.2557, 'learning_rate': 8.76441606240189e-06, 'epoch': 1.11} {'loss': 0.3431, 'learning_rate': 8.764082659939994e-06, 'epoch': 1.11} {'loss': 0.2513, 'learning_rate': 8.76374925887321e-06, 'epoch': 1.11} {'loss': 0.2253, 'learning_rate': 8.763415859201921e-06, 'epoch': 1.11} {'loss': 0.2715, 'learning_rate': 8.7630824609265e-06, 'epoch': 1.11} {'loss': 0.4022, 'learning_rate': 8.762749064047323e-06, 'epoch': 1.11} {'loss': 0.4006, 'learning_rate': 8.762415668564766e-06, 'epoch': 1.11} {'loss': 0.4685, 'learning_rate': 8.762082274479208e-06, 'epoch': 1.11} {'loss': 0.3764, 'learning_rate': 8.761748881791023e-06, 'epoch': 1.11} {'loss': 0.2566, 'learning_rate': 8.761415490500588e-06, 'epoch': 1.11} {'loss': 0.278, 'learning_rate': 8.761082100608279e-06, 'epoch': 1.11} {'loss': 0.2176, 'learning_rate': 8.760748712114475e-06, 'epoch': 1.11} {'loss': 0.3324, 'learning_rate': 8.760415325019548e-06, 'epoch': 1.11} {'loss': 0.2118, 'learning_rate': 8.760081939323877e-06, 'epoch': 1.11} {'loss': 0.3765, 'learning_rate': 8.759748555027839e-06, 'epoch': 1.11} {'loss': 0.3661, 'learning_rate': 8.759415172131807e-06, 'epoch': 1.11} {'loss': 0.3038, 'learning_rate': 8.759081790636159e-06, 'epoch': 1.11} {'loss': 0.3306, 'learning_rate': 8.758748410541272e-06, 'epoch': 1.11} {'loss': 0.247, 'learning_rate': 8.758415031847524e-06, 'epoch': 1.11} {'loss': 0.4142, 'learning_rate': 8.758081654555287e-06, 'epoch': 1.11} {'loss': 0.3802, 'learning_rate': 8.75774827866494e-06, 'epoch': 1.11} {'loss': 0.2637, 'learning_rate': 8.75741490417686e-06, 'epoch': 1.11} {'loss': 0.2822, 'learning_rate': 8.75708153109142e-06, 'epoch': 1.11} {'loss': 0.3733, 'learning_rate': 8.756748159409002e-06, 'epoch': 1.11} {'loss': 0.3427, 'learning_rate': 8.75641478912998e-06, 'epoch': 1.11} {'loss': 0.3117, 'learning_rate': 8.756081420254726e-06, 'epoch': 1.11} {'loss': 0.3476, 'learning_rate': 8.75574805278362e-06, 'epoch': 1.11} {'loss': 0.3095, 'learning_rate': 8.755414686717038e-06, 'epoch': 1.11} {'loss': 0.1845, 'learning_rate': 8.755081322055355e-06, 'epoch': 1.11} {'loss': 0.1701, 'learning_rate': 8.754747958798951e-06, 'epoch': 1.11} {'loss': 0.3468, 'learning_rate': 8.754414596948198e-06, 'epoch': 1.11} {'loss': 0.213, 'learning_rate': 8.754081236503474e-06, 'epoch': 1.11} {'loss': 0.4543, 'learning_rate': 8.753747877465155e-06, 'epoch': 1.11} {'loss': 0.246, 'learning_rate': 8.753414519833618e-06, 'epoch': 1.11} {'loss': 0.4564, 'learning_rate': 8.753081163609239e-06, 'epoch': 1.11} {'loss': 0.4872, 'learning_rate': 8.752747808792395e-06, 'epoch': 1.11} {'loss': 0.3707, 'learning_rate': 8.752414455383458e-06, 'epoch': 1.11} {'loss': 0.4012, 'learning_rate': 8.75208110338281e-06, 'epoch': 1.11} {'loss': 0.2612, 'learning_rate': 8.751747752790828e-06, 'epoch': 1.11} {'loss': 0.31, 'learning_rate': 8.751414403607883e-06, 'epoch': 1.11} {'loss': 0.3713, 'learning_rate': 8.751081055834353e-06, 'epoch': 1.11} {'loss': 0.3388, 'learning_rate': 8.750747709470617e-06, 'epoch': 1.11} {'loss': 0.4182, 'learning_rate': 8.75041436451705e-06, 'epoch': 1.11} {'loss': 0.4494, 'learning_rate': 8.750081020974026e-06, 'epoch': 1.11} {'loss': 0.272, 'learning_rate': 8.749747678841922e-06, 'epoch': 1.11} {'loss': 0.3761, 'learning_rate': 8.749414338121119e-06, 'epoch': 1.11} {'loss': 0.2424, 'learning_rate': 8.749080998811986e-06, 'epoch': 1.11} {'loss': 0.3456, 'learning_rate': 8.748747660914903e-06, 'epoch': 1.11} {'loss': 0.3293, 'learning_rate': 8.748414324430245e-06, 'epoch': 1.11} {'loss': 0.3644, 'learning_rate': 8.74808098935839e-06, 'epoch': 1.11} {'loss': 0.299, 'learning_rate': 8.747747655699713e-06, 'epoch': 1.11} {'loss': 0.2196, 'learning_rate': 8.747414323454593e-06, 'epoch': 1.11} {'loss': 0.2263, 'learning_rate': 8.747080992623403e-06, 'epoch': 1.11} {'loss': 0.2317, 'learning_rate': 8.746747663206519e-06, 'epoch': 1.11} {'loss': 0.2315, 'learning_rate': 8.746414335204319e-06, 'epoch': 1.11} {'loss': 0.2306, 'learning_rate': 8.74608100861718e-06, 'epoch': 1.11} {'loss': 0.2903, 'learning_rate': 8.745747683445476e-06, 'epoch': 1.11} {'loss': 0.3481, 'learning_rate': 8.745414359689584e-06, 'epoch': 1.11} {'loss': 0.4391, 'learning_rate': 8.745081037349884e-06, 'epoch': 1.11} {'loss': 0.3955, 'learning_rate': 8.744747716426746e-06, 'epoch': 1.11} {'loss': 0.3496, 'learning_rate': 8.74441439692055e-06, 'epoch': 1.11} {'loss': 0.2421, 'learning_rate': 8.74408107883167e-06, 'epoch': 1.11} {'loss': 0.3449, 'learning_rate': 8.743747762160484e-06, 'epoch': 1.11} {'loss': 0.3442, 'learning_rate': 8.743414446907368e-06, 'epoch': 1.11} {'loss': 0.2413, 'learning_rate': 8.7430811330727e-06, 'epoch': 1.11} {'loss': 0.2292, 'learning_rate': 8.742747820656852e-06, 'epoch': 1.11} {'loss': 0.3777, 'learning_rate': 8.742414509660203e-06, 'epoch': 1.11} {'loss': 0.3591, 'learning_rate': 8.74208120008313e-06, 'epoch': 1.11} {'loss': 0.3193, 'learning_rate': 8.741747891926007e-06, 'epoch': 1.11} {'loss': 0.3702, 'learning_rate': 8.741414585189212e-06, 'epoch': 1.11} {'loss': 0.2179, 'learning_rate': 8.74108127987312e-06, 'epoch': 1.11} {'loss': 0.3786, 'learning_rate': 8.74074797597811e-06, 'epoch': 1.11} {'loss': 0.2526, 'learning_rate': 8.740414673504553e-06, 'epoch': 1.11} {'loss': 0.3116, 'learning_rate': 8.74008137245283e-06, 'epoch': 1.11} {'loss': 0.3478, 'learning_rate': 8.739748072823315e-06, 'epoch': 1.11} {'loss': 0.2627, 'learning_rate': 8.739414774616385e-06, 'epoch': 1.11} {'loss': 0.3057, 'learning_rate': 8.739081477832416e-06, 'epoch': 1.11} {'loss': 0.259, 'learning_rate': 8.738748182471784e-06, 'epoch': 1.11} {'loss': 0.3565, 'learning_rate': 8.738414888534866e-06, 'epoch': 1.11} {'loss': 0.3426, 'learning_rate': 8.738081596022038e-06, 'epoch': 1.11} {'loss': 0.4145, 'learning_rate': 8.737748304933676e-06, 'epoch': 1.11} {'loss': 0.499, 'learning_rate': 8.737415015270154e-06, 'epoch': 1.11} {'loss': 0.3506, 'learning_rate': 8.737081727031853e-06, 'epoch': 1.11} {'loss': 0.2748, 'learning_rate': 8.736748440219144e-06, 'epoch': 1.11} {'loss': 0.3149, 'learning_rate': 8.73641515483241e-06, 'epoch': 1.11} {'loss': 0.4384, 'learning_rate': 8.73608187087202e-06, 'epoch': 1.11} {'loss': 0.4274, 'learning_rate': 8.735748588338353e-06, 'epoch': 1.11} {'loss': 0.4284, 'learning_rate': 8.735415307231785e-06, 'epoch': 1.11} {'loss': 0.2499, 'learning_rate': 8.735082027552694e-06, 'epoch': 1.11} {'loss': 0.3034, 'learning_rate': 8.734748749301453e-06, 'epoch': 1.11} {'loss': 0.2571, 'learning_rate': 8.734415472478442e-06, 'epoch': 1.11} {'loss': 0.3124, 'learning_rate': 8.734082197084035e-06, 'epoch': 1.11} {'loss': 0.4041, 'learning_rate': 8.733748923118607e-06, 'epoch': 1.11} {'loss': 0.2914, 'learning_rate': 8.733415650582537e-06, 'epoch': 1.11} {'loss': 0.2552, 'learning_rate': 8.7330823794762e-06, 'epoch': 1.11} {'loss': 0.3214, 'learning_rate': 8.732749109799972e-06, 'epoch': 1.11} {'loss': 0.4381, 'learning_rate': 8.732415841554229e-06, 'epoch': 1.11} {'loss': 0.2356, 'learning_rate': 8.732082574739349e-06, 'epoch': 1.11} {'loss': 0.3869, 'learning_rate': 8.731749309355706e-06, 'epoch': 1.11} {'loss': 0.4394, 'learning_rate': 8.731416045403676e-06, 'epoch': 1.11} {'loss': 0.2756, 'learning_rate': 8.731082782883635e-06, 'epoch': 1.11} {'loss': 0.333, 'learning_rate': 8.730749521795962e-06, 'epoch': 1.11} {'loss': 0.2216, 'learning_rate': 8.730416262141031e-06, 'epoch': 1.11} {'loss': 0.3235, 'learning_rate': 8.730083003919218e-06, 'epoch': 1.11} {'loss': 0.2095, 'learning_rate': 8.7297497471309e-06, 'epoch': 1.11} {'loss': 0.3002, 'learning_rate': 8.729416491776452e-06, 'epoch': 1.11} {'loss': 0.4887, 'learning_rate': 8.729083237856253e-06, 'epoch': 1.11} {'loss': 0.3854, 'learning_rate': 8.728749985370677e-06, 'epoch': 1.11} {'loss': 0.362, 'learning_rate': 8.7284167343201e-06, 'epoch': 1.11} {'loss': 0.3717, 'learning_rate': 8.7280834847049e-06, 'epoch': 1.11} {'loss': 0.5013, 'learning_rate': 8.727750236525453e-06, 'epoch': 1.11} {'loss': 0.3766, 'learning_rate': 8.72741698978213e-06, 'epoch': 1.11} {'loss': 0.3509, 'learning_rate': 8.727083744475313e-06, 'epoch': 1.11} {'loss': 0.26, 'learning_rate': 8.726750500605377e-06, 'epoch': 1.11} {'loss': 0.3111, 'learning_rate': 8.726417258172696e-06, 'epoch': 1.11} {'loss': 0.3078, 'learning_rate': 8.72608401717765e-06, 'epoch': 1.11} {'loss': 0.3783, 'learning_rate': 8.72575077762061e-06, 'epoch': 1.11} {'loss': 0.3707, 'learning_rate': 8.725417539501957e-06, 'epoch': 1.11} {'loss': 0.3738, 'learning_rate': 8.725084302822066e-06, 'epoch': 1.11} {'loss': 0.2627, 'learning_rate': 8.72475106758131e-06, 'epoch': 1.11} {'loss': 0.3861, 'learning_rate': 8.72441783378007e-06, 'epoch': 1.11} {'loss': 0.2598, 'learning_rate': 8.724084601418718e-06, 'epoch': 1.11} {'loss': 0.3057, 'learning_rate': 8.723751370497632e-06, 'epoch': 1.11} {'loss': 0.3689, 'learning_rate': 8.723418141017189e-06, 'epoch': 1.11} {'loss': 0.2667, 'learning_rate': 8.723084912977766e-06, 'epoch': 1.11} {'loss': 0.3098, 'learning_rate': 8.722751686379735e-06, 'epoch': 1.11} {'loss': 0.2616, 'learning_rate': 8.722418461223474e-06, 'epoch': 1.11} {'loss': 0.3367, 'learning_rate': 8.72208523750936e-06, 'epoch': 1.11} {'loss': 0.3141, 'learning_rate': 8.721752015237767e-06, 'epoch': 1.11} {'loss': 0.3551, 'learning_rate': 8.721418794409076e-06, 'epoch': 1.11} {'loss': 0.2182, 'learning_rate': 8.721085575023659e-06, 'epoch': 1.11} {'loss': 0.3325, 'learning_rate': 8.720752357081892e-06, 'epoch': 1.11} {'loss': 0.3837, 'learning_rate': 8.720419140584153e-06, 'epoch': 1.11} {'loss': 0.3165, 'learning_rate': 8.720085925530818e-06, 'epoch': 1.11} {'loss': 0.3496, 'learning_rate': 8.719752711922262e-06, 'epoch': 1.11} {'loss': 0.3713, 'learning_rate': 8.71941949975886e-06, 'epoch': 1.11} {'loss': 0.3563, 'learning_rate': 8.719086289040992e-06, 'epoch': 1.11} {'loss': 0.221, 'learning_rate': 8.718753079769031e-06, 'epoch': 1.11} {'loss': 0.3818, 'learning_rate': 8.718419871943356e-06, 'epoch': 1.11} {'loss': 0.3884, 'learning_rate': 8.71808666556434e-06, 'epoch': 1.11} {'loss': 0.3689, 'learning_rate': 8.717753460632361e-06, 'epoch': 1.11} {'loss': 0.3729, 'learning_rate': 8.717420257147794e-06, 'epoch': 1.11} {'loss': 0.2407, 'learning_rate': 8.717087055111016e-06, 'epoch': 1.11} {'loss': 0.2575, 'learning_rate': 8.716753854522401e-06, 'epoch': 1.11} {'loss': 0.2213, 'learning_rate': 8.716420655382332e-06, 'epoch': 1.11} {'loss': 0.2684, 'learning_rate': 8.716087457691175e-06, 'epoch': 1.11} {'loss': 0.3156, 'learning_rate': 8.715754261449314e-06, 'epoch': 1.11} {'loss': 0.273, 'learning_rate': 8.715421066657121e-06, 'epoch': 1.11} {'loss': 0.3783, 'learning_rate': 8.715087873314972e-06, 'epoch': 1.11} {'loss': 0.4311, 'learning_rate': 8.714754681423246e-06, 'epoch': 1.11} {'loss': 0.3446, 'learning_rate': 8.714421490982317e-06, 'epoch': 1.11} {'loss': 0.3075, 'learning_rate': 8.714088301992562e-06, 'epoch': 1.11} {'loss': 0.3078, 'learning_rate': 8.713755114454356e-06, 'epoch': 1.11} {'loss': 0.3596, 'learning_rate': 8.713421928368076e-06, 'epoch': 1.11} {'loss': 0.2107, 'learning_rate': 8.7130887437341e-06, 'epoch': 1.11} {'loss': 0.3711, 'learning_rate': 8.7127555605528e-06, 'epoch': 1.11} {'loss': 0.3142, 'learning_rate': 8.712422378824554e-06, 'epoch': 1.11} {'loss': 0.3182, 'learning_rate': 8.712089198549743e-06, 'epoch': 1.11} {'loss': 0.3572, 'learning_rate': 8.711756019728734e-06, 'epoch': 1.11} {'loss': 0.2526, 'learning_rate': 8.711422842361907e-06, 'epoch': 1.11} {'loss': 0.4373, 'learning_rate': 8.71108966644964e-06, 'epoch': 1.11} {'loss': 0.174, 'learning_rate': 8.710756491992307e-06, 'epoch': 1.11} {'loss': 0.3488, 'learning_rate': 8.710423318990284e-06, 'epoch': 1.11} {'loss': 0.386, 'learning_rate': 8.71009014744395e-06, 'epoch': 1.11} {'loss': 0.3287, 'learning_rate': 8.709756977353678e-06, 'epoch': 1.11} {'loss': 0.445, 'learning_rate': 8.709423808719844e-06, 'epoch': 1.11} {'loss': 0.3363, 'learning_rate': 8.709090641542826e-06, 'epoch': 1.11} {'loss': 0.3979, 'learning_rate': 8.708757475822999e-06, 'epoch': 1.11} {'loss': 0.3492, 'learning_rate': 8.70842431156074e-06, 'epoch': 1.11} {'loss': 0.4291, 'learning_rate': 8.708091148756422e-06, 'epoch': 1.11} {'loss': 0.3324, 'learning_rate': 8.707757987410426e-06, 'epoch': 1.11} {'loss': 0.5035, 'learning_rate': 8.707424827523125e-06, 'epoch': 1.11} {'loss': 0.3294, 'learning_rate': 8.707091669094897e-06, 'epoch': 1.11} {'loss': 0.3293, 'learning_rate': 8.706758512126114e-06, 'epoch': 1.11} {'loss': 0.4034, 'learning_rate': 8.706425356617156e-06, 'epoch': 1.11} {'loss': 0.3682, 'learning_rate': 8.706092202568396e-06, 'epoch': 1.11} {'loss': 0.4996, 'learning_rate': 8.705759049980214e-06, 'epoch': 1.11} {'loss': 0.3965, 'learning_rate': 8.705425898852983e-06, 'epoch': 1.11} {'loss': 0.2126, 'learning_rate': 8.70509274918708e-06, 'epoch': 1.11} {'loss': 0.4137, 'learning_rate': 8.704759600982881e-06, 'epoch': 1.11} {'loss': 0.3267, 'learning_rate': 8.704426454240761e-06, 'epoch': 1.11} {'loss': 0.3288, 'learning_rate': 8.7040933089611e-06, 'epoch': 1.11} {'loss': 0.3167, 'learning_rate': 8.703760165144269e-06, 'epoch': 1.11} {'loss': 0.3574, 'learning_rate': 8.703427022790647e-06, 'epoch': 1.11} {'loss': 0.3256, 'learning_rate': 8.70309388190061e-06, 'epoch': 1.11} {'loss': 0.294, 'learning_rate': 8.702760742474534e-06, 'epoch': 1.11} {'loss': 0.3036, 'learning_rate': 8.702427604512793e-06, 'epoch': 1.11} {'loss': 0.2371, 'learning_rate': 8.702094468015764e-06, 'epoch': 1.11} {'loss': 0.5015, 'learning_rate': 8.701761332983824e-06, 'epoch': 1.11} {'loss': 0.3663, 'learning_rate': 8.701428199417349e-06, 'epoch': 1.11} {'loss': 0.2225, 'learning_rate': 8.701095067316714e-06, 'epoch': 1.11} {'loss': 0.487, 'learning_rate': 8.700761936682296e-06, 'epoch': 1.11} {'loss': 0.2981, 'learning_rate': 8.70042880751447e-06, 'epoch': 1.11} {'loss': 0.202, 'learning_rate': 8.700095679813613e-06, 'epoch': 1.11} {'loss': 0.427, 'learning_rate': 8.699762553580102e-06, 'epoch': 1.11} {'loss': 0.3883, 'learning_rate': 8.699429428814312e-06, 'epoch': 1.11} {'loss': 0.3969, 'learning_rate': 8.699096305516617e-06, 'epoch': 1.11} {'loss': 0.4146, 'learning_rate': 8.698763183687398e-06, 'epoch': 1.11} {'loss': 0.2697, 'learning_rate': 8.698430063327026e-06, 'epoch': 1.11} {'loss': 0.3297, 'learning_rate': 8.69809694443588e-06, 'epoch': 1.11} {'loss': 0.3703, 'learning_rate': 8.697763827014332e-06, 'epoch': 1.11} {'loss': 0.4218, 'learning_rate': 8.697430711062763e-06, 'epoch': 1.11} {'loss': 0.2997, 'learning_rate': 8.697097596581546e-06, 'epoch': 1.11} {'loss': 0.3425, 'learning_rate': 8.696764483571058e-06, 'epoch': 1.11} {'loss': 0.3661, 'learning_rate': 8.696431372031677e-06, 'epoch': 1.11} {'loss': 0.3722, 'learning_rate': 8.696098261963776e-06, 'epoch': 1.11} {'loss': 0.4021, 'learning_rate': 8.695765153367733e-06, 'epoch': 1.11} {'loss': 0.3212, 'learning_rate': 8.695432046243922e-06, 'epoch': 1.11} {'loss': 0.2773, 'learning_rate': 8.695098940592719e-06, 'epoch': 1.11} {'loss': 0.4103, 'learning_rate': 8.694765836414503e-06, 'epoch': 1.11} {'loss': 0.4375, 'learning_rate': 8.69443273370965e-06, 'epoch': 1.11} {'loss': 0.33, 'learning_rate': 8.69409963247853e-06, 'epoch': 1.11} {'loss': 0.3729, 'learning_rate': 8.693766532721526e-06, 'epoch': 1.11} {'loss': 0.2795, 'learning_rate': 8.69343343443901e-06, 'epoch': 1.11} {'loss': 0.313, 'learning_rate': 8.69310033763136e-06, 'epoch': 1.11} {'loss': 0.24, 'learning_rate': 8.69276724229895e-06, 'epoch': 1.11} {'loss': 0.145, 'learning_rate': 8.692434148442158e-06, 'epoch': 1.11} {'loss': 0.2021, 'learning_rate': 8.692101056061359e-06, 'epoch': 1.11} {'loss': 0.3731, 'learning_rate': 8.69176796515693e-06, 'epoch': 1.11} {'loss': 0.4118, 'learning_rate': 8.691434875729244e-06, 'epoch': 1.11} {'loss': 0.3149, 'learning_rate': 8.691101787778681e-06, 'epoch': 1.11} {'loss': 0.3409, 'learning_rate': 8.690768701305613e-06, 'epoch': 1.11} {'loss': 0.4414, 'learning_rate': 8.690435616310422e-06, 'epoch': 1.11} {'loss': 0.3842, 'learning_rate': 8.690102532793479e-06, 'epoch': 1.11} {'loss': 0.3274, 'learning_rate': 8.68976945075516e-06, 'epoch': 1.11} {'loss': 0.472, 'learning_rate': 8.689436370195843e-06, 'epoch': 1.11} {'loss': 0.4314, 'learning_rate': 8.689103291115903e-06, 'epoch': 1.11} {'loss': 0.2855, 'learning_rate': 8.688770213515715e-06, 'epoch': 1.11} {'loss': 0.4634, 'learning_rate': 8.688437137395658e-06, 'epoch': 1.11} {'loss': 0.1824, 'learning_rate': 8.688104062756104e-06, 'epoch': 1.11} {'loss': 0.3909, 'learning_rate': 8.687770989597432e-06, 'epoch': 1.11} {'loss': 0.2859, 'learning_rate': 8.687437917920017e-06, 'epoch': 1.11} {'loss': 0.3631, 'learning_rate': 8.687104847724234e-06, 'epoch': 1.11} {'loss': 0.3294, 'learning_rate': 8.68677177901046e-06, 'epoch': 1.11} {'loss': 0.3107, 'learning_rate': 8.686438711779071e-06, 'epoch': 1.11} {'loss': 0.1871, 'learning_rate': 8.686105646030443e-06, 'epoch': 1.11} {'loss': 0.4297, 'learning_rate': 8.685772581764953e-06, 'epoch': 1.11} {'loss': 0.4861, 'learning_rate': 8.685439518982975e-06, 'epoch': 1.11} {'loss': 0.3304, 'learning_rate': 8.685106457684887e-06, 'epoch': 1.11} {'loss': 0.3719, 'learning_rate': 8.684773397871062e-06, 'epoch': 1.11} {'loss': 0.2363, 'learning_rate': 8.684440339541878e-06, 'epoch': 1.11} {'loss': 0.4478, 'learning_rate': 8.684107282697712e-06, 'epoch': 1.11} {'loss': 0.4151, 'learning_rate': 8.683774227338937e-06, 'epoch': 1.11} {'loss': 0.3387, 'learning_rate': 8.683441173465933e-06, 'epoch': 1.11} {'loss': 0.4289, 'learning_rate': 8.683108121079074e-06, 'epoch': 1.11} {'loss': 0.2635, 'learning_rate': 8.682775070178734e-06, 'epoch': 1.11} {'loss': 0.3064, 'learning_rate': 8.682442020765289e-06, 'epoch': 1.11} {'loss': 0.317, 'learning_rate': 8.682108972839118e-06, 'epoch': 1.11} {'loss': 0.483, 'learning_rate': 8.681775926400596e-06, 'epoch': 1.11} {'loss': 0.4398, 'learning_rate': 8.681442881450098e-06, 'epoch': 1.11} {'loss': 0.3601, 'learning_rate': 8.681109837987998e-06, 'epoch': 1.11} {'loss': 0.3576, 'learning_rate': 8.680776796014677e-06, 'epoch': 1.11} {'loss': 0.2967, 'learning_rate': 8.680443755530506e-06, 'epoch': 1.11} {'loss': 0.4636, 'learning_rate': 8.680110716535864e-06, 'epoch': 1.11} {'loss': 0.3715, 'learning_rate': 8.679777679031125e-06, 'epoch': 1.11} {'loss': 0.4201, 'learning_rate': 8.679444643016667e-06, 'epoch': 1.11} {'loss': 0.4286, 'learning_rate': 8.679111608492865e-06, 'epoch': 1.11} {'loss': 0.1949, 'learning_rate': 8.678778575460097e-06, 'epoch': 1.11} {'loss': 0.3427, 'learning_rate': 8.678445543918734e-06, 'epoch': 1.11} {'loss': 0.4705, 'learning_rate': 8.678112513869155e-06, 'epoch': 1.11} {'loss': 0.2091, 'learning_rate': 8.677779485311735e-06, 'epoch': 1.11} {'loss': 0.1916, 'learning_rate': 8.677446458246852e-06, 'epoch': 1.11} {'loss': 0.3895, 'learning_rate': 8.67711343267488e-06, 'epoch': 1.11} {'loss': 0.3845, 'learning_rate': 8.676780408596193e-06, 'epoch': 1.11} {'loss': 0.3302, 'learning_rate': 8.676447386011172e-06, 'epoch': 1.11} {'loss': 0.4625, 'learning_rate': 8.67611436492019e-06, 'epoch': 1.11} {'loss': 0.3525, 'learning_rate': 8.675781345323622e-06, 'epoch': 1.11} {'loss': 0.3499, 'learning_rate': 8.675448327221846e-06, 'epoch': 1.11} {'loss': 0.4378, 'learning_rate': 8.675115310615236e-06, 'epoch': 1.11} {'loss': 0.2549, 'learning_rate': 8.674782295504169e-06, 'epoch': 1.11} {'loss': 0.3696, 'learning_rate': 8.674449281889023e-06, 'epoch': 1.11} {'loss': 0.3392, 'learning_rate': 8.67411626977017e-06, 'epoch': 1.11} {'loss': 0.3269, 'learning_rate': 8.673783259147989e-06, 'epoch': 1.11} {'loss': 0.4458, 'learning_rate': 8.673450250022853e-06, 'epoch': 1.11} {'loss': 0.3646, 'learning_rate': 8.673117242395139e-06, 'epoch': 1.11} {'loss': 0.42, 'learning_rate': 8.672784236265223e-06, 'epoch': 1.11} {'loss': 0.2433, 'learning_rate': 8.672451231633483e-06, 'epoch': 1.11} {'loss': 0.2119, 'learning_rate': 8.672118228500292e-06, 'epoch': 1.11} {'loss': 0.3328, 'learning_rate': 8.671785226866028e-06, 'epoch': 1.11} {'loss': 0.3315, 'learning_rate': 8.671452226731064e-06, 'epoch': 1.11} {'loss': 0.2166, 'learning_rate': 8.671119228095779e-06, 'epoch': 1.11} {'loss': 0.1973, 'learning_rate': 8.670786230960547e-06, 'epoch': 1.11} {'loss': 0.3196, 'learning_rate': 8.670453235325745e-06, 'epoch': 1.11} {'loss': 0.2922, 'learning_rate': 8.670120241191752e-06, 'epoch': 1.11} {'loss': 0.2893, 'learning_rate': 8.669787248558936e-06, 'epoch': 1.11} {'loss': 0.376, 'learning_rate': 8.669454257427678e-06, 'epoch': 1.11} {'loss': 0.2998, 'learning_rate': 8.669121267798354e-06, 'epoch': 1.11} {'loss': 0.2896, 'learning_rate': 8.668788279671339e-06, 'epoch': 1.11} {'loss': 0.2391, 'learning_rate': 8.668455293047007e-06, 'epoch': 1.11} {'loss': 0.5806, 'learning_rate': 8.668122307925737e-06, 'epoch': 1.11} {'loss': 0.2888, 'learning_rate': 8.667789324307904e-06, 'epoch': 1.11} {'loss': 0.2965, 'learning_rate': 8.667456342193883e-06, 'epoch': 1.11} {'loss': 0.2909, 'learning_rate': 8.66712336158405e-06, 'epoch': 1.11} {'loss': 0.4004, 'learning_rate': 8.666790382478782e-06, 'epoch': 1.11} {'loss': 0.2996, 'learning_rate': 8.666457404878454e-06, 'epoch': 1.11} {'loss': 0.2887, 'learning_rate': 8.666124428783442e-06, 'epoch': 1.11} {'loss': 0.3663, 'learning_rate': 8.665791454194125e-06, 'epoch': 1.11} {'loss': 0.3666, 'learning_rate': 8.665458481110872e-06, 'epoch': 1.11} {'loss': 0.3126, 'learning_rate': 8.665125509534063e-06, 'epoch': 1.11} {'loss': 0.1989, 'learning_rate': 8.664792539464073e-06, 'epoch': 1.11} {'loss': 0.4441, 'learning_rate': 8.66445957090128e-06, 'epoch': 1.11} {'loss': 0.3385, 'learning_rate': 8.664126603846056e-06, 'epoch': 1.11} {'loss': 0.4015, 'learning_rate': 8.663793638298782e-06, 'epoch': 1.11} {'loss': 0.2411, 'learning_rate': 8.663460674259829e-06, 'epoch': 1.11} {'loss': 0.2868, 'learning_rate': 8.663127711729574e-06, 'epoch': 1.11} {'loss': 0.2929, 'learning_rate': 8.662794750708394e-06, 'epoch': 1.11} {'loss': 0.3851, 'learning_rate': 8.662461791196665e-06, 'epoch': 1.11} {'loss': 0.3033, 'learning_rate': 8.662128833194761e-06, 'epoch': 1.11} {'loss': 0.3644, 'learning_rate': 8.661795876703062e-06, 'epoch': 1.11} {'loss': 0.2858, 'learning_rate': 8.661462921721942e-06, 'epoch': 1.11} {'loss': 0.4791, 'learning_rate': 8.661129968251771e-06, 'epoch': 1.11} {'loss': 0.1933, 'learning_rate': 8.660797016292931e-06, 'epoch': 1.11} {'loss': 0.3562, 'learning_rate': 8.6604640658458e-06, 'epoch': 1.11} {'loss': 0.3872, 'learning_rate': 8.660131116910747e-06, 'epoch': 1.11} {'loss': 0.2535, 'learning_rate': 8.659798169488151e-06, 'epoch': 1.11} {'loss': 0.226, 'learning_rate': 8.65946522357839e-06, 'epoch': 1.11} {'loss': 0.3458, 'learning_rate': 8.659132279181835e-06, 'epoch': 1.11} {'loss': 0.3337, 'learning_rate': 8.658799336298866e-06, 'epoch': 1.11} {'loss': 0.4092, 'learning_rate': 8.65846639492986e-06, 'epoch': 1.11} {'loss': 0.3721, 'learning_rate': 8.658133455075188e-06, 'epoch': 1.11} {'loss': 0.4391, 'learning_rate': 8.657800516735228e-06, 'epoch': 1.11} {'loss': 0.4077, 'learning_rate': 8.657467579910356e-06, 'epoch': 1.11} {'loss': 0.2261, 'learning_rate': 8.65713464460095e-06, 'epoch': 1.11} {'loss': 0.3097, 'learning_rate': 8.656801710807382e-06, 'epoch': 1.11} {'loss': 0.159, 'learning_rate': 8.65646877853003e-06, 'epoch': 1.11} {'loss': 0.457, 'learning_rate': 8.656135847769267e-06, 'epoch': 1.11} {'loss': 0.3956, 'learning_rate': 8.655802918525474e-06, 'epoch': 1.11} {'loss': 0.2053, 'learning_rate': 8.655469990799022e-06, 'epoch': 1.11} {'loss': 0.3593, 'learning_rate': 8.655137064590288e-06, 'epoch': 1.11} {'loss': 0.3241, 'learning_rate': 8.654804139899651e-06, 'epoch': 1.11} {'loss': 0.2568, 'learning_rate': 8.654471216727483e-06, 'epoch': 1.11} {'loss': 0.3134, 'learning_rate': 8.65413829507416e-06, 'epoch': 1.11} {'loss': 0.2687, 'learning_rate': 8.653805374940061e-06, 'epoch': 1.11} {'loss': 0.4505, 'learning_rate': 8.653472456325557e-06, 'epoch': 1.11} {'loss': 0.3031, 'learning_rate': 8.653139539231027e-06, 'epoch': 1.11} {'loss': 0.3579, 'learning_rate': 8.652806623656848e-06, 'epoch': 1.11} {'loss': 0.3384, 'learning_rate': 8.652473709603393e-06, 'epoch': 1.11} {'loss': 0.2016, 'learning_rate': 8.65214079707104e-06, 'epoch': 1.11} {'loss': 0.2641, 'learning_rate': 8.651807886060165e-06, 'epoch': 1.11} {'loss': 0.5029, 'learning_rate': 8.65147497657114e-06, 'epoch': 1.11} {'loss': 0.3634, 'learning_rate': 8.651142068604345e-06, 'epoch': 1.11} {'loss': 0.4029, 'learning_rate': 8.650809162160153e-06, 'epoch': 1.11} {'loss': 0.1589, 'learning_rate': 8.650476257238941e-06, 'epoch': 1.11} {'loss': 0.3355, 'learning_rate': 8.650143353841088e-06, 'epoch': 1.11} {'loss': 0.3815, 'learning_rate': 8.649810451966962e-06, 'epoch': 1.11} {'loss': 0.3817, 'learning_rate': 8.649477551616945e-06, 'epoch': 1.11} {'loss': 0.4673, 'learning_rate': 8.649144652791411e-06, 'epoch': 1.11} {'loss': 0.3078, 'learning_rate': 8.648811755490737e-06, 'epoch': 1.11} {'loss': 0.4051, 'learning_rate': 8.648478859715294e-06, 'epoch': 1.11} {'loss': 0.4853, 'learning_rate': 8.648145965465464e-06, 'epoch': 1.11} {'loss': 0.4352, 'learning_rate': 8.64781307274162e-06, 'epoch': 1.11} {'loss': 0.2913, 'learning_rate': 8.647480181544138e-06, 'epoch': 1.11} {'loss': 0.4206, 'learning_rate': 8.647147291873394e-06, 'epoch': 1.11} {'loss': 0.2848, 'learning_rate': 8.646814403729762e-06, 'epoch': 1.11} {'loss': 0.3968, 'learning_rate': 8.64648151711362e-06, 'epoch': 1.11} {'loss': 0.2157, 'learning_rate': 8.646148632025343e-06, 'epoch': 1.11} {'loss': 0.4607, 'learning_rate': 8.645815748465308e-06, 'epoch': 1.11} {'loss': 0.4242, 'learning_rate': 8.64548286643389e-06, 'epoch': 1.11} {'loss': 0.3674, 'learning_rate': 8.645149985931462e-06, 'epoch': 1.11} {'loss': 0.2445, 'learning_rate': 8.644817106958401e-06, 'epoch': 1.11} {'loss': 0.326, 'learning_rate': 8.644484229515086e-06, 'epoch': 1.11} {'loss': 0.3102, 'learning_rate': 8.64415135360189e-06, 'epoch': 1.11} {'loss': 0.3767, 'learning_rate': 8.643818479219188e-06, 'epoch': 1.11} {'loss': 0.1871, 'learning_rate': 8.643485606367358e-06, 'epoch': 1.12} {'loss': 0.2602, 'learning_rate': 8.643152735046776e-06, 'epoch': 1.12} {'loss': 0.3387, 'learning_rate': 8.642819865257815e-06, 'epoch': 1.12} {'loss': 0.3024, 'learning_rate': 8.642486997000853e-06, 'epoch': 1.12} {'loss': 0.3735, 'learning_rate': 8.642154130276265e-06, 'epoch': 1.12} {'loss': 0.4813, 'learning_rate': 8.641821265084428e-06, 'epoch': 1.12} {'loss': 0.3764, 'learning_rate': 8.641488401425716e-06, 'epoch': 1.12} {'loss': 0.2416, 'learning_rate': 8.641155539300504e-06, 'epoch': 1.12} {'loss': 0.3103, 'learning_rate': 8.64082267870917e-06, 'epoch': 1.12} {'loss': 0.3198, 'learning_rate': 8.640489819652087e-06, 'epoch': 1.12} {'loss': 0.2543, 'learning_rate': 8.640156962129634e-06, 'epoch': 1.12} {'loss': 0.3169, 'learning_rate': 8.639824106142185e-06, 'epoch': 1.12} {'loss': 0.414, 'learning_rate': 8.639491251690116e-06, 'epoch': 1.12} {'loss': 0.3806, 'learning_rate': 8.639158398773803e-06, 'epoch': 1.12} {'loss': 0.5005, 'learning_rate': 8.63882554739362e-06, 'epoch': 1.12} {'loss': 0.245, 'learning_rate': 8.638492697549945e-06, 'epoch': 1.12} {'loss': 0.2433, 'learning_rate': 8.638159849243154e-06, 'epoch': 1.12} {'loss': 0.3262, 'learning_rate': 8.637827002473618e-06, 'epoch': 1.12} {'loss': 0.3854, 'learning_rate': 8.63749415724172e-06, 'epoch': 1.12} {'loss': 0.3126, 'learning_rate': 8.637161313547832e-06, 'epoch': 1.12} {'loss': 0.3003, 'learning_rate': 8.63682847139233e-06, 'epoch': 1.12} {'loss': 0.3598, 'learning_rate': 8.636495630775587e-06, 'epoch': 1.12} {'loss': 0.2944, 'learning_rate': 8.636162791697982e-06, 'epoch': 1.12} {'loss': 0.4514, 'learning_rate': 8.635829954159888e-06, 'epoch': 1.12} {'loss': 0.4409, 'learning_rate': 8.635497118161685e-06, 'epoch': 1.12} {'loss': 0.2338, 'learning_rate': 8.635164283703746e-06, 'epoch': 1.12} {'loss': 0.4808, 'learning_rate': 8.634831450786447e-06, 'epoch': 1.12} {'loss': 0.2441, 'learning_rate': 8.634498619410162e-06, 'epoch': 1.12} {'loss': 0.3853, 'learning_rate': 8.63416578957527e-06, 'epoch': 1.12} {'loss': 0.3938, 'learning_rate': 8.633832961282145e-06, 'epoch': 1.12} {'loss': 0.3746, 'learning_rate': 8.633500134531163e-06, 'epoch': 1.12} {'loss': 0.28, 'learning_rate': 8.633167309322699e-06, 'epoch': 1.12} {'loss': 0.27, 'learning_rate': 8.63283448565713e-06, 'epoch': 1.12} {'loss': 0.4036, 'learning_rate': 8.632501663534832e-06, 'epoch': 1.12} {'loss': 0.3143, 'learning_rate': 8.632168842956179e-06, 'epoch': 1.12} {'loss': 0.431, 'learning_rate': 8.631836023921545e-06, 'epoch': 1.12} {'loss': 0.3051, 'learning_rate': 8.63150320643131e-06, 'epoch': 1.12} {'loss': 0.3326, 'learning_rate': 8.631170390485845e-06, 'epoch': 1.12} {'loss': 0.2137, 'learning_rate': 8.63083757608553e-06, 'epoch': 1.12} {'loss': 0.3109, 'learning_rate': 8.630504763230739e-06, 'epoch': 1.12} {'loss': 0.3424, 'learning_rate': 8.630171951921847e-06, 'epoch': 1.12} {'loss': 0.3403, 'learning_rate': 8.629839142159232e-06, 'epoch': 1.12} {'loss': 0.4134, 'learning_rate': 8.629506333943267e-06, 'epoch': 1.12} {'loss': 0.313, 'learning_rate': 8.629173527274328e-06, 'epoch': 1.12} {'loss': 0.3123, 'learning_rate': 8.628840722152793e-06, 'epoch': 1.12} {'loss': 0.2806, 'learning_rate': 8.628507918579035e-06, 'epoch': 1.12} {'loss': 0.3862, 'learning_rate': 8.628175116553434e-06, 'epoch': 1.12} {'loss': 0.4343, 'learning_rate': 8.627842316076359e-06, 'epoch': 1.12} {'loss': 0.3903, 'learning_rate': 8.62750951714819e-06, 'epoch': 1.12} {'loss': 0.3074, 'learning_rate': 8.627176719769302e-06, 'epoch': 1.12} {'loss': 0.3211, 'learning_rate': 8.626843923940069e-06, 'epoch': 1.12} {'loss': 0.448, 'learning_rate': 8.626511129660869e-06, 'epoch': 1.12} {'loss': 0.4145, 'learning_rate': 8.626178336932077e-06, 'epoch': 1.12} {'loss': 0.3956, 'learning_rate': 8.625845545754068e-06, 'epoch': 1.12} {'loss': 0.3196, 'learning_rate': 8.625512756127218e-06, 'epoch': 1.12} {'loss': 0.3692, 'learning_rate': 8.625179968051903e-06, 'epoch': 1.12} {'loss': 0.2964, 'learning_rate': 8.624847181528498e-06, 'epoch': 1.12} {'loss': 0.2543, 'learning_rate': 8.62451439655738e-06, 'epoch': 1.12} {'loss': 0.2706, 'learning_rate': 8.624181613138922e-06, 'epoch': 1.12} {'loss': 0.2988, 'learning_rate': 8.623848831273505e-06, 'epoch': 1.12} {'loss': 0.308, 'learning_rate': 8.623516050961499e-06, 'epoch': 1.12} {'loss': 0.3297, 'learning_rate': 8.62318327220328e-06, 'epoch': 1.12} {'loss': 0.1613, 'learning_rate': 8.622850494999227e-06, 'epoch': 1.12} {'loss': 0.4084, 'learning_rate': 8.622517719349712e-06, 'epoch': 1.12} {'loss': 0.341, 'learning_rate': 8.622184945255115e-06, 'epoch': 1.12} {'loss': 0.2533, 'learning_rate': 8.621852172715808e-06, 'epoch': 1.12} {'loss': 0.3928, 'learning_rate': 8.621519401732168e-06, 'epoch': 1.12} {'loss': 0.4234, 'learning_rate': 8.621186632304569e-06, 'epoch': 1.12} {'loss': 0.3989, 'learning_rate': 8.62085386443339e-06, 'epoch': 1.12} {'loss': 0.4375, 'learning_rate': 8.620521098119003e-06, 'epoch': 1.12} {'loss': 0.1952, 'learning_rate': 8.620188333361785e-06, 'epoch': 1.12} {'loss': 0.4072, 'learning_rate': 8.619855570162113e-06, 'epoch': 1.12} {'loss': 0.4621, 'learning_rate': 8.619522808520361e-06, 'epoch': 1.12} {'loss': 0.3431, 'learning_rate': 8.619190048436908e-06, 'epoch': 1.12} {'loss': 0.3852, 'learning_rate': 8.618857289912124e-06, 'epoch': 1.12} {'loss': 0.2396, 'learning_rate': 8.61852453294639e-06, 'epoch': 1.12} {'loss': 0.2307, 'learning_rate': 8.618191777540078e-06, 'epoch': 1.12} {'loss': 0.2277, 'learning_rate': 8.617859023693564e-06, 'epoch': 1.12} {'loss': 0.2075, 'learning_rate': 8.617526271407223e-06, 'epoch': 1.12} {'loss': 0.3188, 'learning_rate': 8.617193520681436e-06, 'epoch': 1.12} {'loss': 0.2822, 'learning_rate': 8.616860771516573e-06, 'epoch': 1.12} {'loss': 0.1762, 'learning_rate': 8.61652802391301e-06, 'epoch': 1.12} {'loss': 0.4059, 'learning_rate': 8.616195277871124e-06, 'epoch': 1.12} {'loss': 0.2401, 'learning_rate': 8.61586253339129e-06, 'epoch': 1.12} {'loss': 0.3106, 'learning_rate': 8.615529790473886e-06, 'epoch': 1.12} {'loss': 0.4281, 'learning_rate': 8.615197049119283e-06, 'epoch': 1.12} {'loss': 0.4163, 'learning_rate': 8.614864309327861e-06, 'epoch': 1.12} {'loss': 0.1914, 'learning_rate': 8.614531571099993e-06, 'epoch': 1.12} {'loss': 0.3296, 'learning_rate': 8.614198834436055e-06, 'epoch': 1.12} {'loss': 0.4369, 'learning_rate': 8.613866099336423e-06, 'epoch': 1.12} {'loss': 0.376, 'learning_rate': 8.613533365801475e-06, 'epoch': 1.12} {'loss': 0.3308, 'learning_rate': 8.613200633831582e-06, 'epoch': 1.12} {'loss': 0.279, 'learning_rate': 8.612867903427122e-06, 'epoch': 1.12} {'loss': 0.3587, 'learning_rate': 8.612535174588473e-06, 'epoch': 1.12} {'loss': 0.319, 'learning_rate': 8.612202447316005e-06, 'epoch': 1.12} {'loss': 0.2213, 'learning_rate': 8.611869721610097e-06, 'epoch': 1.12} {'loss': 0.2926, 'learning_rate': 8.611536997471124e-06, 'epoch': 1.12} {'loss': 0.3451, 'learning_rate': 8.611204274899462e-06, 'epoch': 1.12} {'loss': 0.2824, 'learning_rate': 8.610871553895486e-06, 'epoch': 1.12} {'loss': 0.2988, 'learning_rate': 8.610538834459572e-06, 'epoch': 1.12} {'loss': 0.4171, 'learning_rate': 8.610206116592095e-06, 'epoch': 1.12} {'loss': 0.3862, 'learning_rate': 8.609873400293432e-06, 'epoch': 1.12} {'loss': 0.4375, 'learning_rate': 8.609540685563957e-06, 'epoch': 1.12} {'loss': 0.1743, 'learning_rate': 8.609207972404045e-06, 'epoch': 1.12} {'loss': 0.3794, 'learning_rate': 8.608875260814074e-06, 'epoch': 1.12} {'loss': 0.3992, 'learning_rate': 8.608542550794418e-06, 'epoch': 1.12} {'loss': 0.2522, 'learning_rate': 8.608209842345455e-06, 'epoch': 1.12} {'loss': 0.2358, 'learning_rate': 8.607877135467558e-06, 'epoch': 1.12} {'loss': 0.4602, 'learning_rate': 8.6075444301611e-06, 'epoch': 1.12} {'loss': 0.2176, 'learning_rate': 8.607211726426462e-06, 'epoch': 1.12} {'loss': 0.2736, 'learning_rate': 8.606879024264016e-06, 'epoch': 1.12} {'loss': 0.2787, 'learning_rate': 8.606546323674138e-06, 'epoch': 1.12} {'loss': 0.4034, 'learning_rate': 8.606213624657205e-06, 'epoch': 1.12} {'loss': 0.3783, 'learning_rate': 8.605880927213591e-06, 'epoch': 1.12} {'loss': 0.3451, 'learning_rate': 8.605548231343674e-06, 'epoch': 1.12} {'loss': 0.2975, 'learning_rate': 8.605215537047826e-06, 'epoch': 1.12} {'loss': 0.3379, 'learning_rate': 8.604882844326425e-06, 'epoch': 1.12} {'loss': 0.3039, 'learning_rate': 8.604550153179848e-06, 'epoch': 1.12} {'loss': 0.3801, 'learning_rate': 8.604217463608467e-06, 'epoch': 1.12} {'loss': 0.3059, 'learning_rate': 8.603884775612661e-06, 'epoch': 1.12} {'loss': 0.4761, 'learning_rate': 8.603552089192802e-06, 'epoch': 1.12} {'loss': 0.184, 'learning_rate': 8.603219404349266e-06, 'epoch': 1.12} {'loss': 0.2346, 'learning_rate': 8.60288672108243e-06, 'epoch': 1.12} {'loss': 0.3958, 'learning_rate': 8.60255403939267e-06, 'epoch': 1.12} {'loss': 0.2763, 'learning_rate': 8.60222135928036e-06, 'epoch': 1.12} {'loss': 0.354, 'learning_rate': 8.601888680745877e-06, 'epoch': 1.12} {'loss': 0.284, 'learning_rate': 8.601556003789595e-06, 'epoch': 1.12} {'loss': 0.4441, 'learning_rate': 8.60122332841189e-06, 'epoch': 1.12} {'loss': 0.2797, 'learning_rate': 8.600890654613139e-06, 'epoch': 1.12} {'loss': 0.2643, 'learning_rate': 8.600557982393716e-06, 'epoch': 1.12} {'loss': 0.3612, 'learning_rate': 8.600225311753998e-06, 'epoch': 1.12} {'loss': 0.3204, 'learning_rate': 8.599892642694357e-06, 'epoch': 1.12} {'loss': 0.2548, 'learning_rate': 8.599559975215174e-06, 'epoch': 1.12} {'loss': 0.2946, 'learning_rate': 8.599227309316821e-06, 'epoch': 1.12} {'loss': 0.39, 'learning_rate': 8.598894644999674e-06, 'epoch': 1.12} {'loss': 0.3935, 'learning_rate': 8.598561982264106e-06, 'epoch': 1.12} {'loss': 0.3852, 'learning_rate': 8.598229321110496e-06, 'epoch': 1.12} {'loss': 0.3457, 'learning_rate': 8.59789666153922e-06, 'epoch': 1.12} {'loss': 0.378, 'learning_rate': 8.59756400355065e-06, 'epoch': 1.12} {'loss': 0.2933, 'learning_rate': 8.597231347145165e-06, 'epoch': 1.12} {'loss': 0.455, 'learning_rate': 8.596898692323139e-06, 'epoch': 1.12} {'loss': 0.341, 'learning_rate': 8.596566039084947e-06, 'epoch': 1.12} {'loss': 0.1594, 'learning_rate': 8.596233387430965e-06, 'epoch': 1.12} {'loss': 0.3258, 'learning_rate': 8.59590073736157e-06, 'epoch': 1.12} {'loss': 0.3354, 'learning_rate': 8.595568088877135e-06, 'epoch': 1.12} {'loss': 0.3183, 'learning_rate': 8.595235441978039e-06, 'epoch': 1.12} {'loss': 0.3392, 'learning_rate': 8.59490279666465e-06, 'epoch': 1.12} {'loss': 0.4434, 'learning_rate': 8.594570152937352e-06, 'epoch': 1.12} {'loss': 0.3172, 'learning_rate': 8.594237510796516e-06, 'epoch': 1.12} {'loss': 0.352, 'learning_rate': 8.59390487024252e-06, 'epoch': 1.12} {'loss': 0.25, 'learning_rate': 8.593572231275735e-06, 'epoch': 1.12} {'loss': 0.3639, 'learning_rate': 8.593239593896542e-06, 'epoch': 1.12} {'loss': 0.389, 'learning_rate': 8.592906958105313e-06, 'epoch': 1.12} {'loss': 0.2901, 'learning_rate': 8.592574323902424e-06, 'epoch': 1.12} {'loss': 0.3902, 'learning_rate': 8.592241691288251e-06, 'epoch': 1.12} {'loss': 0.3337, 'learning_rate': 8.59190906026317e-06, 'epoch': 1.12} {'loss': 0.2852, 'learning_rate': 8.591576430827556e-06, 'epoch': 1.12} {'loss': 0.2413, 'learning_rate': 8.591243802981785e-06, 'epoch': 1.12} {'loss': 0.1802, 'learning_rate': 8.590911176726233e-06, 'epoch': 1.12} {'loss': 0.489, 'learning_rate': 8.590578552061272e-06, 'epoch': 1.12} {'loss': 0.4954, 'learning_rate': 8.59024592898728e-06, 'epoch': 1.12} {'loss': 0.1824, 'learning_rate': 8.589913307504633e-06, 'epoch': 1.12} {'loss': 0.3053, 'learning_rate': 8.589580687613705e-06, 'epoch': 1.12} {'loss': 0.3858, 'learning_rate': 8.589248069314873e-06, 'epoch': 1.12} {'loss': 0.3753, 'learning_rate': 8.588915452608512e-06, 'epoch': 1.12} {'loss': 0.2861, 'learning_rate': 8.588582837494996e-06, 'epoch': 1.12} {'loss': 0.4471, 'learning_rate': 8.588250223974702e-06, 'epoch': 1.12} {'loss': 0.3609, 'learning_rate': 8.587917612048004e-06, 'epoch': 1.12} {'loss': 0.2591, 'learning_rate': 8.58758500171528e-06, 'epoch': 1.12} {'loss': 0.3525, 'learning_rate': 8.587252392976901e-06, 'epoch': 1.12} {'loss': 0.2207, 'learning_rate': 8.586919785833247e-06, 'epoch': 1.12} {'loss': 0.3115, 'learning_rate': 8.586587180284693e-06, 'epoch': 1.12} {'loss': 0.3055, 'learning_rate': 8.586254576331612e-06, 'epoch': 1.12} {'loss': 0.322, 'learning_rate': 8.585921973974383e-06, 'epoch': 1.12} {'loss': 0.3474, 'learning_rate': 8.585589373213379e-06, 'epoch': 1.12} {'loss': 0.2946, 'learning_rate': 8.585256774048974e-06, 'epoch': 1.12} {'loss': 0.29, 'learning_rate': 8.584924176481544e-06, 'epoch': 1.12} {'loss': 0.3344, 'learning_rate': 8.584591580511468e-06, 'epoch': 1.12} {'loss': 0.2354, 'learning_rate': 8.584258986139119e-06, 'epoch': 1.12} {'loss': 0.2594, 'learning_rate': 8.583926393364873e-06, 'epoch': 1.12} {'loss': 0.431, 'learning_rate': 8.583593802189103e-06, 'epoch': 1.12} {'loss': 0.2839, 'learning_rate': 8.583261212612186e-06, 'epoch': 1.12} {'loss': 0.3932, 'learning_rate': 8.582928624634498e-06, 'epoch': 1.12} {'loss': 0.412, 'learning_rate': 8.582596038256415e-06, 'epoch': 1.12} {'loss': 0.3365, 'learning_rate': 8.58226345347831e-06, 'epoch': 1.12} {'loss': 0.2708, 'learning_rate': 8.581930870300562e-06, 'epoch': 1.12} {'loss': 0.3646, 'learning_rate': 8.581598288723542e-06, 'epoch': 1.12} {'loss': 0.2779, 'learning_rate': 8.581265708747629e-06, 'epoch': 1.12} {'loss': 0.342, 'learning_rate': 8.580933130373197e-06, 'epoch': 1.12} {'loss': 0.2899, 'learning_rate': 8.580600553600623e-06, 'epoch': 1.12} {'loss': 0.2933, 'learning_rate': 8.58026797843028e-06, 'epoch': 1.12} {'loss': 0.2769, 'learning_rate': 8.579935404862545e-06, 'epoch': 1.12} {'loss': 0.3878, 'learning_rate': 8.579602832897792e-06, 'epoch': 1.12} {'loss': 0.4057, 'learning_rate': 8.579270262536399e-06, 'epoch': 1.12} {'loss': 0.3731, 'learning_rate': 8.578937693778739e-06, 'epoch': 1.12} {'loss': 0.3232, 'learning_rate': 8.578605126625186e-06, 'epoch': 1.12} {'loss': 0.3483, 'learning_rate': 8.578272561076119e-06, 'epoch': 1.12} {'loss': 0.2165, 'learning_rate': 8.577939997131912e-06, 'epoch': 1.12} {'loss': 0.3864, 'learning_rate': 8.57760743479294e-06, 'epoch': 1.12} {'loss': 0.3509, 'learning_rate': 8.577274874059579e-06, 'epoch': 1.12} {'loss': 0.3899, 'learning_rate': 8.576942314932204e-06, 'epoch': 1.12} {'loss': 0.251, 'learning_rate': 8.576609757411191e-06, 'epoch': 1.12} {'loss': 0.3135, 'learning_rate': 8.576277201496914e-06, 'epoch': 1.12} {'loss': 0.4064, 'learning_rate': 8.57594464718975e-06, 'epoch': 1.12} {'loss': 0.3312, 'learning_rate': 8.575612094490074e-06, 'epoch': 1.12} {'loss': 0.4059, 'learning_rate': 8.575279543398263e-06, 'epoch': 1.12} {'loss': 0.3064, 'learning_rate': 8.574946993914688e-06, 'epoch': 1.12} {'loss': 0.2627, 'learning_rate': 8.574614446039726e-06, 'epoch': 1.12} {'loss': 0.3414, 'learning_rate': 8.574281899773753e-06, 'epoch': 1.12} {'loss': 0.2803, 'learning_rate': 8.573949355117147e-06, 'epoch': 1.12} {'loss': 0.1885, 'learning_rate': 8.57361681207028e-06, 'epoch': 1.12} {'loss': 0.3628, 'learning_rate': 8.573284270633528e-06, 'epoch': 1.12} {'loss': 0.3589, 'learning_rate': 8.572951730807266e-06, 'epoch': 1.12} {'loss': 0.1974, 'learning_rate': 8.572619192591872e-06, 'epoch': 1.12} {'loss': 0.3311, 'learning_rate': 8.572286655987718e-06, 'epoch': 1.12} {'loss': 0.1955, 'learning_rate': 8.571954120995181e-06, 'epoch': 1.12} {'loss': 0.2905, 'learning_rate': 8.571621587614638e-06, 'epoch': 1.12} {'loss': 0.362, 'learning_rate': 8.571289055846461e-06, 'epoch': 1.12} {'loss': 0.4479, 'learning_rate': 8.57095652569103e-06, 'epoch': 1.12} {'loss': 0.3058, 'learning_rate': 8.570623997148714e-06, 'epoch': 1.12} {'loss': 0.2912, 'learning_rate': 8.570291470219892e-06, 'epoch': 1.12} {'loss': 0.3672, 'learning_rate': 8.569958944904939e-06, 'epoch': 1.12} {'loss': 0.2432, 'learning_rate': 8.56962642120423e-06, 'epoch': 1.12} {'loss': 0.2984, 'learning_rate': 8.569293899118144e-06, 'epoch': 1.12} {'loss': 0.3143, 'learning_rate': 8.56896137864705e-06, 'epoch': 1.12} {'loss': 0.2358, 'learning_rate': 8.568628859791326e-06, 'epoch': 1.12} {'loss': 0.3469, 'learning_rate': 8.56829634255135e-06, 'epoch': 1.12} {'loss': 0.2718, 'learning_rate': 8.567963826927494e-06, 'epoch': 1.12} {'loss': 0.1891, 'learning_rate': 8.567631312920134e-06, 'epoch': 1.12} {'loss': 0.5681, 'learning_rate': 8.567298800529647e-06, 'epoch': 1.12} {'loss': 0.3257, 'learning_rate': 8.566966289756407e-06, 'epoch': 1.12} {'loss': 0.2096, 'learning_rate': 8.56663378060079e-06, 'epoch': 1.12} {'loss': 0.3807, 'learning_rate': 8.56630127306317e-06, 'epoch': 1.12} {'loss': 0.2329, 'learning_rate': 8.565968767143923e-06, 'epoch': 1.12} {'loss': 0.2649, 'learning_rate': 8.565636262843426e-06, 'epoch': 1.12} {'loss': 0.363, 'learning_rate': 8.565303760162052e-06, 'epoch': 1.12} {'loss': 0.3095, 'learning_rate': 8.564971259100178e-06, 'epoch': 1.12} {'loss': 0.5887, 'learning_rate': 8.564638759658177e-06, 'epoch': 1.12} {'loss': 0.3877, 'learning_rate': 8.564306261836427e-06, 'epoch': 1.12} {'loss': 0.2895, 'learning_rate': 8.563973765635301e-06, 'epoch': 1.12} {'loss': 0.543, 'learning_rate': 8.563641271055176e-06, 'epoch': 1.12} {'loss': 0.2382, 'learning_rate': 8.563308778096429e-06, 'epoch': 1.12} {'loss': 0.2919, 'learning_rate': 8.56297628675943e-06, 'epoch': 1.12} {'loss': 0.3501, 'learning_rate': 8.562643797044559e-06, 'epoch': 1.12} {'loss': 0.2059, 'learning_rate': 8.56231130895219e-06, 'epoch': 1.12} {'loss': 0.4165, 'learning_rate': 8.5619788224827e-06, 'epoch': 1.12} {'loss': 0.3516, 'learning_rate': 8.56164633763646e-06, 'epoch': 1.12} {'loss': 0.3678, 'learning_rate': 8.561313854413848e-06, 'epoch': 1.12} {'loss': 0.1752, 'learning_rate': 8.560981372815241e-06, 'epoch': 1.12} {'loss': 0.3367, 'learning_rate': 8.56064889284101e-06, 'epoch': 1.12} {'loss': 0.324, 'learning_rate': 8.560316414491533e-06, 'epoch': 1.12} {'loss': 0.2561, 'learning_rate': 8.559983937767184e-06, 'epoch': 1.12} {'loss': 0.261, 'learning_rate': 8.559651462668342e-06, 'epoch': 1.12} {'loss': 0.4055, 'learning_rate': 8.559318989195378e-06, 'epoch': 1.12} {'loss': 0.2738, 'learning_rate': 8.558986517348668e-06, 'epoch': 1.12} {'loss': 0.5614, 'learning_rate': 8.558654047128589e-06, 'epoch': 1.12} {'loss': 0.4543, 'learning_rate': 8.558321578535517e-06, 'epoch': 1.12} {'loss': 0.4161, 'learning_rate': 8.557989111569825e-06, 'epoch': 1.12} {'loss': 0.3387, 'learning_rate': 8.55765664623189e-06, 'epoch': 1.12} {'loss': 0.1904, 'learning_rate': 8.557324182522086e-06, 'epoch': 1.12} {'loss': 0.2257, 'learning_rate': 8.556991720440787e-06, 'epoch': 1.12} {'loss': 0.421, 'learning_rate': 8.556659259988371e-06, 'epoch': 1.12} {'loss': 0.3303, 'learning_rate': 8.556326801165211e-06, 'epoch': 1.12} {'loss': 0.329, 'learning_rate': 8.555994343971685e-06, 'epoch': 1.12} {'loss': 0.444, 'learning_rate': 8.555661888408167e-06, 'epoch': 1.12} {'loss': 0.3284, 'learning_rate': 8.55532943447503e-06, 'epoch': 1.12} {'loss': 0.3713, 'learning_rate': 8.554996982172654e-06, 'epoch': 1.12} {'loss': 0.2056, 'learning_rate': 8.554664531501409e-06, 'epoch': 1.12} {'loss': 0.4001, 'learning_rate': 8.55433208246167e-06, 'epoch': 1.12} {'loss': 0.3026, 'learning_rate': 8.553999635053822e-06, 'epoch': 1.12} {'loss': 0.4464, 'learning_rate': 8.55366718927823e-06, 'epoch': 1.12} {'loss': 0.3729, 'learning_rate': 8.553334745135273e-06, 'epoch': 1.12} {'loss': 0.4195, 'learning_rate': 8.553002302625327e-06, 'epoch': 1.12} {'loss': 0.2088, 'learning_rate': 8.552669861748766e-06, 'epoch': 1.12} {'loss': 0.3359, 'learning_rate': 8.552337422505966e-06, 'epoch': 1.12} {'loss': 0.3515, 'learning_rate': 8.5520049848973e-06, 'epoch': 1.12} {'loss': 0.345, 'learning_rate': 8.551672548923145e-06, 'epoch': 1.12} {'loss': 0.2975, 'learning_rate': 8.551340114583878e-06, 'epoch': 1.12} {'loss': 0.3273, 'learning_rate': 8.551007681879873e-06, 'epoch': 1.12} {'loss': 0.3081, 'learning_rate': 8.550675250811505e-06, 'epoch': 1.12} {'loss': 0.5488, 'learning_rate': 8.550342821379147e-06, 'epoch': 1.12} {'loss': 0.3821, 'learning_rate': 8.550010393583176e-06, 'epoch': 1.12} {'loss': 0.3407, 'learning_rate': 8.549677967423969e-06, 'epoch': 1.12} {'loss': 0.2739, 'learning_rate': 8.5493455429019e-06, 'epoch': 1.12} {'loss': 0.1977, 'learning_rate': 8.549013120017343e-06, 'epoch': 1.12} {'loss': 0.3712, 'learning_rate': 8.548680698770676e-06, 'epoch': 1.12} {'loss': 0.2274, 'learning_rate': 8.54834827916227e-06, 'epoch': 1.12} {'loss': 0.3211, 'learning_rate': 8.548015861192503e-06, 'epoch': 1.12} {'loss': 0.3741, 'learning_rate': 8.547683444861751e-06, 'epoch': 1.12} {'loss': 0.2636, 'learning_rate': 8.547351030170388e-06, 'epoch': 1.12} {'loss': 0.3579, 'learning_rate': 8.54701861711879e-06, 'epoch': 1.12} {'loss': 0.3077, 'learning_rate': 8.546686205707332e-06, 'epoch': 1.12} {'loss': 0.3635, 'learning_rate': 8.54635379593639e-06, 'epoch': 1.12} {'loss': 0.3026, 'learning_rate': 8.546021387806335e-06, 'epoch': 1.12} {'loss': 0.3508, 'learning_rate': 8.545688981317547e-06, 'epoch': 1.12} {'loss': 0.2942, 'learning_rate': 8.545356576470398e-06, 'epoch': 1.12} {'loss': 0.3741, 'learning_rate': 8.545024173265266e-06, 'epoch': 1.12} {'loss': 0.2809, 'learning_rate': 8.544691771702526e-06, 'epoch': 1.12} {'loss': 0.1933, 'learning_rate': 8.544359371782551e-06, 'epoch': 1.12} {'loss': 0.4352, 'learning_rate': 8.544026973505716e-06, 'epoch': 1.12} {'loss': 0.384, 'learning_rate': 8.543694576872401e-06, 'epoch': 1.12} {'loss': 0.1417, 'learning_rate': 8.543362181882976e-06, 'epoch': 1.12} {'loss': 0.2248, 'learning_rate': 8.543029788537818e-06, 'epoch': 1.12} {'loss': 0.3742, 'learning_rate': 8.542697396837303e-06, 'epoch': 1.12} {'loss': 0.3531, 'learning_rate': 8.542365006781806e-06, 'epoch': 1.12} {'loss': 0.3103, 'learning_rate': 8.542032618371704e-06, 'epoch': 1.12} {'loss': 0.3879, 'learning_rate': 8.541700231607365e-06, 'epoch': 1.12} {'loss': 0.3918, 'learning_rate': 8.541367846489171e-06, 'epoch': 1.12} {'loss': 0.1822, 'learning_rate': 8.541035463017495e-06, 'epoch': 1.12} {'loss': 0.4128, 'learning_rate': 8.540703081192713e-06, 'epoch': 1.12} {'loss': 0.3058, 'learning_rate': 8.540370701015199e-06, 'epoch': 1.12} {'loss': 0.1861, 'learning_rate': 8.54003832248533e-06, 'epoch': 1.12} {'loss': 0.4417, 'learning_rate': 8.53970594560348e-06, 'epoch': 1.12} {'loss': 0.3195, 'learning_rate': 8.539373570370024e-06, 'epoch': 1.12} {'loss': 0.4188, 'learning_rate': 8.539041196785337e-06, 'epoch': 1.12} {'loss': 0.2904, 'learning_rate': 8.538708824849795e-06, 'epoch': 1.12} {'loss': 0.4385, 'learning_rate': 8.538376454563772e-06, 'epoch': 1.12} {'loss': 0.3622, 'learning_rate': 8.538044085927646e-06, 'epoch': 1.12} {'loss': 0.4223, 'learning_rate': 8.53771171894179e-06, 'epoch': 1.12} {'loss': 0.3266, 'learning_rate': 8.53737935360658e-06, 'epoch': 1.12} {'loss': 0.3286, 'learning_rate': 8.537046989922388e-06, 'epoch': 1.12} {'loss': 0.3698, 'learning_rate': 8.536714627889594e-06, 'epoch': 1.12} {'loss': 0.3117, 'learning_rate': 8.536382267508569e-06, 'epoch': 1.12} {'loss': 0.2832, 'learning_rate': 8.536049908779692e-06, 'epoch': 1.12} {'loss': 0.2671, 'learning_rate': 8.535717551703335e-06, 'epoch': 1.12} {'loss': 0.2895, 'learning_rate': 8.535385196279875e-06, 'epoch': 1.12} {'loss': 0.3365, 'learning_rate': 8.535052842509686e-06, 'epoch': 1.12} {'loss': 0.3088, 'learning_rate': 8.534720490393145e-06, 'epoch': 1.12} {'loss': 0.2275, 'learning_rate': 8.534388139930623e-06, 'epoch': 1.12} {'loss': 0.2466, 'learning_rate': 8.5340557911225e-06, 'epoch': 1.12} {'loss': 0.3067, 'learning_rate': 8.53372344396915e-06, 'epoch': 1.12} {'loss': 0.2027, 'learning_rate': 8.533391098470949e-06, 'epoch': 1.12} {'loss': 0.33, 'learning_rate': 8.533058754628268e-06, 'epoch': 1.12} {'loss': 0.3092, 'learning_rate': 8.532726412441486e-06, 'epoch': 1.12} {'loss': 0.3855, 'learning_rate': 8.532394071910975e-06, 'epoch': 1.12} {'loss': 0.2782, 'learning_rate': 8.532061733037113e-06, 'epoch': 1.12} {'loss': 0.3842, 'learning_rate': 8.531729395820274e-06, 'epoch': 1.12} {'loss': 0.2534, 'learning_rate': 8.531397060260834e-06, 'epoch': 1.12} {'loss': 0.3308, 'learning_rate': 8.531064726359165e-06, 'epoch': 1.12} {'loss': 0.2059, 'learning_rate': 8.530732394115647e-06, 'epoch': 1.12} {'loss': 0.5253, 'learning_rate': 8.530400063530653e-06, 'epoch': 1.12} {'loss': 0.3981, 'learning_rate': 8.530067734604556e-06, 'epoch': 1.12} {'loss': 0.2906, 'learning_rate': 8.529735407337734e-06, 'epoch': 1.12} {'loss': 0.2684, 'learning_rate': 8.529403081730561e-06, 'epoch': 1.12} {'loss': 0.3236, 'learning_rate': 8.529070757783416e-06, 'epoch': 1.12} {'loss': 0.2566, 'learning_rate': 8.528738435496666e-06, 'epoch': 1.12} {'loss': 0.2604, 'learning_rate': 8.528406114870691e-06, 'epoch': 1.12} {'loss': 0.3287, 'learning_rate': 8.528073795905867e-06, 'epoch': 1.12} {'loss': 0.2918, 'learning_rate': 8.527741478602567e-06, 'epoch': 1.12} {'loss': 0.3185, 'learning_rate': 8.527409162961167e-06, 'epoch': 1.12} {'loss': 0.4475, 'learning_rate': 8.52707684898204e-06, 'epoch': 1.12} {'loss': 0.2426, 'learning_rate': 8.526744536665565e-06, 'epoch': 1.12} {'loss': 0.3426, 'learning_rate': 8.526412226012115e-06, 'epoch': 1.12} {'loss': 0.3463, 'learning_rate': 8.526079917022067e-06, 'epoch': 1.12} {'loss': 0.3602, 'learning_rate': 8.525747609695793e-06, 'epoch': 1.12} {'loss': 0.3229, 'learning_rate': 8.525415304033668e-06, 'epoch': 1.12} {'loss': 0.2342, 'learning_rate': 8.525083000036071e-06, 'epoch': 1.12} {'loss': 0.348, 'learning_rate': 8.524750697703376e-06, 'epoch': 1.12} {'loss': 0.2536, 'learning_rate': 8.524418397035955e-06, 'epoch': 1.12} {'loss': 0.286, 'learning_rate': 8.524086098034186e-06, 'epoch': 1.12} {'loss': 0.3849, 'learning_rate': 8.523753800698442e-06, 'epoch': 1.12} {'loss': 0.4317, 'learning_rate': 8.5234215050291e-06, 'epoch': 1.12} {'loss': 0.3877, 'learning_rate': 8.523089211026534e-06, 'epoch': 1.12} {'loss': 0.4131, 'learning_rate': 8.522756918691118e-06, 'epoch': 1.12} {'loss': 0.4074, 'learning_rate': 8.52242462802323e-06, 'epoch': 1.12} {'loss': 0.4146, 'learning_rate': 8.522092339023244e-06, 'epoch': 1.12} {'loss': 0.4004, 'learning_rate': 8.521760051691535e-06, 'epoch': 1.12} {'loss': 0.4318, 'learning_rate': 8.521427766028476e-06, 'epoch': 1.12} {'loss': 0.2671, 'learning_rate': 8.521095482034443e-06, 'epoch': 1.12} {'loss': 0.2795, 'learning_rate': 8.520763199709813e-06, 'epoch': 1.12} {'loss': 0.2929, 'learning_rate': 8.52043091905496e-06, 'epoch': 1.12} {'loss': 0.3761, 'learning_rate': 8.520098640070261e-06, 'epoch': 1.12} {'loss': 0.2872, 'learning_rate': 8.519766362756088e-06, 'epoch': 1.12} {'loss': 0.403, 'learning_rate': 8.519434087112819e-06, 'epoch': 1.12} {'loss': 0.3811, 'learning_rate': 8.519101813140823e-06, 'epoch': 1.12} {'loss': 0.366, 'learning_rate': 8.518769540840483e-06, 'epoch': 1.12} {'loss': 0.2884, 'learning_rate': 8.518437270212171e-06, 'epoch': 1.12} {'loss': 0.1925, 'learning_rate': 8.518105001256261e-06, 'epoch': 1.12} {'loss': 0.2948, 'learning_rate': 8.517772733973129e-06, 'epoch': 1.12} {'loss': 0.2932, 'learning_rate': 8.51744046836315e-06, 'epoch': 1.12} {'loss': 0.3545, 'learning_rate': 8.517108204426698e-06, 'epoch': 1.12} {'loss': 0.3649, 'learning_rate': 8.516775942164147e-06, 'epoch': 1.12} {'loss': 0.3919, 'learning_rate': 8.516443681575876e-06, 'epoch': 1.12} {'loss': 0.3649, 'learning_rate': 8.516111422662256e-06, 'epoch': 1.12} {'loss': 0.2341, 'learning_rate': 8.515779165423666e-06, 'epoch': 1.12} {'loss': 0.287, 'learning_rate': 8.515446909860478e-06, 'epoch': 1.12} {'loss': 0.34, 'learning_rate': 8.51511465597307e-06, 'epoch': 1.12} {'loss': 0.4663, 'learning_rate': 8.514782403761813e-06, 'epoch': 1.12} {'loss': 0.3471, 'learning_rate': 8.514450153227086e-06, 'epoch': 1.12} {'loss': 0.3559, 'learning_rate': 8.514117904369262e-06, 'epoch': 1.12} {'loss': 0.1932, 'learning_rate': 8.513785657188715e-06, 'epoch': 1.12} {'loss': 0.2267, 'learning_rate': 8.513453411685824e-06, 'epoch': 1.12} {'loss': 0.2821, 'learning_rate': 8.51312116786096e-06, 'epoch': 1.12} {'loss': 0.277, 'learning_rate': 8.512788925714498e-06, 'epoch': 1.12} {'loss': 0.4637, 'learning_rate': 8.512456685246815e-06, 'epoch': 1.12} {'loss': 0.2779, 'learning_rate': 8.512124446458286e-06, 'epoch': 1.12} {'loss': 0.2806, 'learning_rate': 8.511792209349285e-06, 'epoch': 1.12} {'loss': 0.4134, 'learning_rate': 8.511459973920188e-06, 'epoch': 1.12} {'loss': 0.3148, 'learning_rate': 8.511127740171372e-06, 'epoch': 1.12} {'loss': 0.3746, 'learning_rate': 8.510795508103206e-06, 'epoch': 1.12} {'loss': 0.155, 'learning_rate': 8.51046327771607e-06, 'epoch': 1.12} {'loss': 0.3904, 'learning_rate': 8.510131049010338e-06, 'epoch': 1.12} {'loss': 0.2516, 'learning_rate': 8.509798821986385e-06, 'epoch': 1.12} {'loss': 0.2398, 'learning_rate': 8.509466596644584e-06, 'epoch': 1.12} {'loss': 0.3206, 'learning_rate': 8.509134372985316e-06, 'epoch': 1.12} {'loss': 0.4365, 'learning_rate': 8.508802151008949e-06, 'epoch': 1.12} {'loss': 0.2221, 'learning_rate': 8.50846993071586e-06, 'epoch': 1.12} {'loss': 0.3342, 'learning_rate': 8.508137712106425e-06, 'epoch': 1.12} {'loss': 0.3808, 'learning_rate': 8.507805495181021e-06, 'epoch': 1.12} {'loss': 0.3366, 'learning_rate': 8.507473279940019e-06, 'epoch': 1.12} {'loss': 0.4019, 'learning_rate': 8.507141066383796e-06, 'epoch': 1.12} {'loss': 0.3132, 'learning_rate': 8.506808854512726e-06, 'epoch': 1.12} {'loss': 0.2318, 'learning_rate': 8.506476644327187e-06, 'epoch': 1.12} {'loss': 0.3721, 'learning_rate': 8.506144435827549e-06, 'epoch': 1.12} {'loss': 0.2142, 'learning_rate': 8.505812229014192e-06, 'epoch': 1.12} {'loss': 0.2867, 'learning_rate': 8.505480023887488e-06, 'epoch': 1.12} {'loss': 0.339, 'learning_rate': 8.505147820447813e-06, 'epoch': 1.12} {'loss': 0.2507, 'learning_rate': 8.504815618695544e-06, 'epoch': 1.12} {'loss': 0.271, 'learning_rate': 8.504483418631052e-06, 'epoch': 1.12} {'loss': 0.3794, 'learning_rate': 8.504151220254714e-06, 'epoch': 1.12} {'loss': 0.4068, 'learning_rate': 8.503819023566905e-06, 'epoch': 1.12} {'loss': 0.3287, 'learning_rate': 8.503486828568e-06, 'epoch': 1.12} {'loss': 0.4322, 'learning_rate': 8.503154635258372e-06, 'epoch': 1.12} {'loss': 0.3285, 'learning_rate': 8.502822443638398e-06, 'epoch': 1.12} {'loss': 0.4565, 'learning_rate': 8.502490253708455e-06, 'epoch': 1.12} {'loss': 0.355, 'learning_rate': 8.502158065468914e-06, 'epoch': 1.12} {'loss': 0.1718, 'learning_rate': 8.501825878920152e-06, 'epoch': 1.12} {'loss': 0.3306, 'learning_rate': 8.501493694062543e-06, 'epoch': 1.12} {'loss': 0.5409, 'learning_rate': 8.501161510896464e-06, 'epoch': 1.12} {'loss': 0.3739, 'learning_rate': 8.500829329422288e-06, 'epoch': 1.12} {'loss': 0.4351, 'learning_rate': 8.500497149640392e-06, 'epoch': 1.12} {'loss': 0.4019, 'learning_rate': 8.50016497155115e-06, 'epoch': 1.12} {'loss': 0.2986, 'learning_rate': 8.499832795154934e-06, 'epoch': 1.12} {'loss': 0.3569, 'learning_rate': 8.499500620452122e-06, 'epoch': 1.12} {'loss': 0.3274, 'learning_rate': 8.499168447443088e-06, 'epoch': 1.12} {'loss': 0.3325, 'learning_rate': 8.49883627612821e-06, 'epoch': 1.12} {'loss': 0.2854, 'learning_rate': 8.498504106507858e-06, 'epoch': 1.12} {'loss': 0.398, 'learning_rate': 8.49817193858241e-06, 'epoch': 1.12} {'loss': 0.3459, 'learning_rate': 8.497839772352241e-06, 'epoch': 1.12} {'loss': 0.2945, 'learning_rate': 8.497507607817723e-06, 'epoch': 1.12} {'loss': 0.324, 'learning_rate': 8.497175444979235e-06, 'epoch': 1.12} {'loss': 0.5561, 'learning_rate': 8.49684328383715e-06, 'epoch': 1.12} {'loss': 0.3729, 'learning_rate': 8.496511124391843e-06, 'epoch': 1.12} {'loss': 0.1952, 'learning_rate': 8.496178966643691e-06, 'epoch': 1.12} {'loss': 0.253, 'learning_rate': 8.495846810593066e-06, 'epoch': 1.12} {'loss': 0.2963, 'learning_rate': 8.495514656240343e-06, 'epoch': 1.12} {'loss': 0.3892, 'learning_rate': 8.495182503585897e-06, 'epoch': 1.12} {'loss': 0.3579, 'learning_rate': 8.494850352630105e-06, 'epoch': 1.12} {'loss': 0.3293, 'learning_rate': 8.49451820337334e-06, 'epoch': 1.12} {'loss': 0.3664, 'learning_rate': 8.494186055815979e-06, 'epoch': 1.12} {'loss': 0.3262, 'learning_rate': 8.493853909958395e-06, 'epoch': 1.12} {'loss': 0.5363, 'learning_rate': 8.493521765800961e-06, 'epoch': 1.12} {'loss': 0.3218, 'learning_rate': 8.493189623344057e-06, 'epoch': 1.12} {'loss': 0.391, 'learning_rate': 8.492857482588055e-06, 'epoch': 1.12} {'loss': 0.3821, 'learning_rate': 8.49252534353333e-06, 'epoch': 1.12} {'loss': 0.3393, 'learning_rate': 8.492193206180258e-06, 'epoch': 1.12} {'loss': 0.3368, 'learning_rate': 8.491861070529216e-06, 'epoch': 1.12} {'loss': 0.2913, 'learning_rate': 8.49152893658057e-06, 'epoch': 1.12} {'loss': 0.3193, 'learning_rate': 8.491196804334704e-06, 'epoch': 1.12} {'loss': 0.2247, 'learning_rate': 8.49086467379199e-06, 'epoch': 1.12} {'loss': 0.2804, 'learning_rate': 8.490532544952803e-06, 'epoch': 1.12} {'loss': 0.42, 'learning_rate': 8.490200417817516e-06, 'epoch': 1.12} {'loss': 0.2836, 'learning_rate': 8.489868292386507e-06, 'epoch': 1.12} {'loss': 0.147, 'learning_rate': 8.48953616866015e-06, 'epoch': 1.12} {'loss': 0.3784, 'learning_rate': 8.489204046638817e-06, 'epoch': 1.12} {'loss': 0.3284, 'learning_rate': 8.488871926322888e-06, 'epoch': 1.12} {'loss': 0.2964, 'learning_rate': 8.488539807712734e-06, 'epoch': 1.12} {'loss': 0.3156, 'learning_rate': 8.48820769080873e-06, 'epoch': 1.12} {'loss': 0.3364, 'learning_rate': 8.487875575611253e-06, 'epoch': 1.12} {'loss': 0.2753, 'learning_rate': 8.487543462120678e-06, 'epoch': 1.12} {'loss': 0.3082, 'learning_rate': 8.487211350337378e-06, 'epoch': 1.12} {'loss': 0.3387, 'learning_rate': 8.486879240261728e-06, 'epoch': 1.12} {'loss': 0.2426, 'learning_rate': 8.486547131894105e-06, 'epoch': 1.12} {'loss': 0.3321, 'learning_rate': 8.486215025234881e-06, 'epoch': 1.12} {'loss': 0.1704, 'learning_rate': 8.485882920284435e-06, 'epoch': 1.12} {'loss': 0.3699, 'learning_rate': 8.485550817043136e-06, 'epoch': 1.12} {'loss': 0.3141, 'learning_rate': 8.485218715511364e-06, 'epoch': 1.12} {'loss': 0.4302, 'learning_rate': 8.484886615689493e-06, 'epoch': 1.12} {'loss': 0.3705, 'learning_rate': 8.484554517577896e-06, 'epoch': 1.12} {'loss': 0.3315, 'learning_rate': 8.48422242117695e-06, 'epoch': 1.12} {'loss': 0.2611, 'learning_rate': 8.483890326487026e-06, 'epoch': 1.12} {'loss': 0.2394, 'learning_rate': 8.483558233508503e-06, 'epoch': 1.12} {'loss': 0.2426, 'learning_rate': 8.483226142241753e-06, 'epoch': 1.13} {'loss': 0.4776, 'learning_rate': 8.482894052687154e-06, 'epoch': 1.13} {'loss': 0.2932, 'learning_rate': 8.482561964845078e-06, 'epoch': 1.13} {'loss': 0.2974, 'learning_rate': 8.482229878715902e-06, 'epoch': 1.13} {'loss': 0.434, 'learning_rate': 8.481897794299999e-06, 'epoch': 1.13} {'loss': 0.2719, 'learning_rate': 8.481565711597745e-06, 'epoch': 1.13} {'loss': 0.4841, 'learning_rate': 8.481233630609515e-06, 'epoch': 1.13} {'loss': 0.4327, 'learning_rate': 8.480901551335683e-06, 'epoch': 1.13} {'loss': 0.3839, 'learning_rate': 8.480569473776627e-06, 'epoch': 1.13} {'loss': 0.3401, 'learning_rate': 8.480237397932716e-06, 'epoch': 1.13} {'loss': 0.3168, 'learning_rate': 8.479905323804328e-06, 'epoch': 1.13} {'loss': 0.3068, 'learning_rate': 8.479573251391839e-06, 'epoch': 1.13} {'loss': 0.3481, 'learning_rate': 8.479241180695622e-06, 'epoch': 1.13} {'loss': 0.368, 'learning_rate': 8.478909111716052e-06, 'epoch': 1.13} {'loss': 0.2991, 'learning_rate': 8.478577044453505e-06, 'epoch': 1.13} {'loss': 0.4022, 'learning_rate': 8.478244978908354e-06, 'epoch': 1.13} {'loss': 0.3738, 'learning_rate': 8.477912915080976e-06, 'epoch': 1.13} {'loss': 0.2954, 'learning_rate': 8.477580852971745e-06, 'epoch': 1.13} {'loss': 0.3766, 'learning_rate': 8.477248792581035e-06, 'epoch': 1.13} {'loss': 0.3855, 'learning_rate': 8.476916733909221e-06, 'epoch': 1.13} {'loss': 0.3089, 'learning_rate': 8.47658467695668e-06, 'epoch': 1.13} {'loss': 0.3003, 'learning_rate': 8.476252621723787e-06, 'epoch': 1.13} {'loss': 0.3135, 'learning_rate': 8.475920568210913e-06, 'epoch': 1.13} {'loss': 0.3827, 'learning_rate': 8.475588516418435e-06, 'epoch': 1.13} {'loss': 0.4353, 'learning_rate': 8.475256466346728e-06, 'epoch': 1.13} {'loss': 0.3351, 'learning_rate': 8.474924417996165e-06, 'epoch': 1.13} {'loss': 0.3662, 'learning_rate': 8.474592371367123e-06, 'epoch': 1.13} {'loss': 0.3505, 'learning_rate': 8.474260326459976e-06, 'epoch': 1.13} {'loss': 0.264, 'learning_rate': 8.473928283275099e-06, 'epoch': 1.13} {'loss': 0.3279, 'learning_rate': 8.473596241812867e-06, 'epoch': 1.13} {'loss': 0.4186, 'learning_rate': 8.473264202073654e-06, 'epoch': 1.13} {'loss': 0.2644, 'learning_rate': 8.472932164057836e-06, 'epoch': 1.13} {'loss': 0.3323, 'learning_rate': 8.472600127765788e-06, 'epoch': 1.13} {'loss': 0.2605, 'learning_rate': 8.472268093197884e-06, 'epoch': 1.13} {'loss': 0.3563, 'learning_rate': 8.4719360603545e-06, 'epoch': 1.13} {'loss': 0.3255, 'learning_rate': 8.471604029236008e-06, 'epoch': 1.13} {'loss': 0.2489, 'learning_rate': 8.471271999842782e-06, 'epoch': 1.13} {'loss': 0.2038, 'learning_rate': 8.470939972175203e-06, 'epoch': 1.13} {'loss': 0.2289, 'learning_rate': 8.47060794623364e-06, 'epoch': 1.13} {'loss': 0.3487, 'learning_rate': 8.47027592201847e-06, 'epoch': 1.13} {'loss': 0.4821, 'learning_rate': 8.469943899530068e-06, 'epoch': 1.13} {'loss': 0.3987, 'learning_rate': 8.469611878768808e-06, 'epoch': 1.13} {'loss': 0.3511, 'learning_rate': 8.469279859735065e-06, 'epoch': 1.13} {'loss': 0.24, 'learning_rate': 8.468947842429215e-06, 'epoch': 1.13} {'loss': 0.5515, 'learning_rate': 8.46861582685163e-06, 'epoch': 1.13} {'loss': 0.3161, 'learning_rate': 8.468283813002687e-06, 'epoch': 1.13} {'loss': 0.2688, 'learning_rate': 8.46795180088276e-06, 'epoch': 1.13} {'loss': 0.2577, 'learning_rate': 8.467619790492224e-06, 'epoch': 1.13} {'loss': 0.3234, 'learning_rate': 8.467287781831458e-06, 'epoch': 1.13} {'loss': 0.3938, 'learning_rate': 8.466955774900828e-06, 'epoch': 1.13} {'loss': 0.2732, 'learning_rate': 8.466623769700715e-06, 'epoch': 1.13} {'loss': 0.281, 'learning_rate': 8.466291766231494e-06, 'epoch': 1.13} {'loss': 0.4056, 'learning_rate': 8.465959764493535e-06, 'epoch': 1.13} {'loss': 0.4378, 'learning_rate': 8.465627764487216e-06, 'epoch': 1.13} {'loss': 0.3389, 'learning_rate': 8.465295766212914e-06, 'epoch': 1.13} {'loss': 0.2899, 'learning_rate': 8.464963769670997e-06, 'epoch': 1.13} {'loss': 0.3691, 'learning_rate': 8.464631774861847e-06, 'epoch': 1.13} {'loss': 0.3722, 'learning_rate': 8.464299781785835e-06, 'epoch': 1.13} {'loss': 0.3839, 'learning_rate': 8.463967790443337e-06, 'epoch': 1.13} {'loss': 0.451, 'learning_rate': 8.463635800834726e-06, 'epoch': 1.13} {'loss': 0.3293, 'learning_rate': 8.46330381296038e-06, 'epoch': 1.13} {'loss': 0.3703, 'learning_rate': 8.462971826820672e-06, 'epoch': 1.13} {'loss': 0.3352, 'learning_rate': 8.462639842415975e-06, 'epoch': 1.13} {'loss': 0.3779, 'learning_rate': 8.462307859746666e-06, 'epoch': 1.13} {'loss': 0.2302, 'learning_rate': 8.461975878813118e-06, 'epoch': 1.13} {'loss': 0.2954, 'learning_rate': 8.461643899615709e-06, 'epoch': 1.13} {'loss': 0.3265, 'learning_rate': 8.461311922154808e-06, 'epoch': 1.13} {'loss': 0.3194, 'learning_rate': 8.460979946430795e-06, 'epoch': 1.13} {'loss': 0.4026, 'learning_rate': 8.460647972444043e-06, 'epoch': 1.13} {'loss': 0.3107, 'learning_rate': 8.460316000194927e-06, 'epoch': 1.13} {'loss': 0.2185, 'learning_rate': 8.45998402968382e-06, 'epoch': 1.13} {'loss': 0.2859, 'learning_rate': 8.4596520609111e-06, 'epoch': 1.13} {'loss': 0.3561, 'learning_rate': 8.45932009387714e-06, 'epoch': 1.13} {'loss': 0.1883, 'learning_rate': 8.458988128582312e-06, 'epoch': 1.13} {'loss': 0.1747, 'learning_rate': 8.458656165026998e-06, 'epoch': 1.13} {'loss': 0.3209, 'learning_rate': 8.458324203211565e-06, 'epoch': 1.13} {'loss': 0.3123, 'learning_rate': 8.457992243136392e-06, 'epoch': 1.13} {'loss': 0.2507, 'learning_rate': 8.457660284801851e-06, 'epoch': 1.13} {'loss': 0.3936, 'learning_rate': 8.457328328208319e-06, 'epoch': 1.13} {'loss': 0.4552, 'learning_rate': 8.45699637335617e-06, 'epoch': 1.13} {'loss': 0.2544, 'learning_rate': 8.45666442024578e-06, 'epoch': 1.13} {'loss': 0.4459, 'learning_rate': 8.456332468877519e-06, 'epoch': 1.13} {'loss': 0.2013, 'learning_rate': 8.456000519251768e-06, 'epoch': 1.13} {'loss': 0.2785, 'learning_rate': 8.455668571368899e-06, 'epoch': 1.13} {'loss': 0.3675, 'learning_rate': 8.455336625229283e-06, 'epoch': 1.13} {'loss': 0.4552, 'learning_rate': 8.4550046808333e-06, 'epoch': 1.13} {'loss': 0.313, 'learning_rate': 8.454672738181323e-06, 'epoch': 1.13} {'loss': 0.3722, 'learning_rate': 8.454340797273726e-06, 'epoch': 1.13} {'loss': 0.3673, 'learning_rate': 8.454008858110887e-06, 'epoch': 1.13} {'loss': 0.338, 'learning_rate': 8.453676920693176e-06, 'epoch': 1.13} {'loss': 0.346, 'learning_rate': 8.45334498502097e-06, 'epoch': 1.13} {'loss': 0.4123, 'learning_rate': 8.453013051094644e-06, 'epoch': 1.13} {'loss': 0.378, 'learning_rate': 8.452681118914572e-06, 'epoch': 1.13} {'loss': 0.4115, 'learning_rate': 8.452349188481129e-06, 'epoch': 1.13} {'loss': 0.3728, 'learning_rate': 8.452017259794691e-06, 'epoch': 1.13} {'loss': 0.3899, 'learning_rate': 8.451685332855628e-06, 'epoch': 1.13} {'loss': 0.174, 'learning_rate': 8.45135340766432e-06, 'epoch': 1.13} {'loss': 0.4869, 'learning_rate': 8.451021484221138e-06, 'epoch': 1.13} {'loss': 0.2027, 'learning_rate': 8.45068956252646e-06, 'epoch': 1.13} {'loss': 0.2745, 'learning_rate': 8.450357642580656e-06, 'epoch': 1.13} {'loss': 0.2962, 'learning_rate': 8.450025724384105e-06, 'epoch': 1.13} {'loss': 0.3777, 'learning_rate': 8.44969380793718e-06, 'epoch': 1.13} {'loss': 0.4264, 'learning_rate': 8.449361893240255e-06, 'epoch': 1.13} {'loss': 0.2215, 'learning_rate': 8.449029980293708e-06, 'epoch': 1.13} {'loss': 0.6048, 'learning_rate': 8.44869806909791e-06, 'epoch': 1.13} {'loss': 0.247, 'learning_rate': 8.448366159653236e-06, 'epoch': 1.13} {'loss': 0.2142, 'learning_rate': 8.448034251960063e-06, 'epoch': 1.13} {'loss': 0.39, 'learning_rate': 8.447702346018764e-06, 'epoch': 1.13} {'loss': 0.3084, 'learning_rate': 8.447370441829715e-06, 'epoch': 1.13} {'loss': 0.2768, 'learning_rate': 8.447038539393287e-06, 'epoch': 1.13} {'loss': 0.3681, 'learning_rate': 8.446706638709859e-06, 'epoch': 1.13} {'loss': 0.4445, 'learning_rate': 8.446374739779802e-06, 'epoch': 1.13} {'loss': 0.2424, 'learning_rate': 8.446042842603495e-06, 'epoch': 1.13} {'loss': 0.3414, 'learning_rate': 8.445710947181307e-06, 'epoch': 1.13} {'loss': 0.3066, 'learning_rate': 8.445379053513619e-06, 'epoch': 1.13} {'loss': 0.3834, 'learning_rate': 8.4450471616008e-06, 'epoch': 1.13} {'loss': 0.3912, 'learning_rate': 8.444715271443228e-06, 'epoch': 1.13} {'loss': 0.2924, 'learning_rate': 8.444383383041275e-06, 'epoch': 1.13} {'loss': 0.4347, 'learning_rate': 8.444051496395321e-06, 'epoch': 1.13} {'loss': 0.2474, 'learning_rate': 8.443719611505735e-06, 'epoch': 1.13} {'loss': 0.3073, 'learning_rate': 8.443387728372893e-06, 'epoch': 1.13} {'loss': 0.3334, 'learning_rate': 8.443055846997173e-06, 'epoch': 1.13} {'loss': 0.3801, 'learning_rate': 8.442723967378944e-06, 'epoch': 1.13} {'loss': 0.231, 'learning_rate': 8.442392089518584e-06, 'epoch': 1.13} {'loss': 0.3532, 'learning_rate': 8.442060213416467e-06, 'epoch': 1.13} {'loss': 0.3316, 'learning_rate': 8.441728339072968e-06, 'epoch': 1.13} {'loss': 0.3822, 'learning_rate': 8.441396466488462e-06, 'epoch': 1.13} {'loss': 0.2719, 'learning_rate': 8.441064595663322e-06, 'epoch': 1.13} {'loss': 0.4085, 'learning_rate': 8.440732726597925e-06, 'epoch': 1.13} {'loss': 0.328, 'learning_rate': 8.440400859292643e-06, 'epoch': 1.13} {'loss': 0.3744, 'learning_rate': 8.440068993747853e-06, 'epoch': 1.13} {'loss': 0.3222, 'learning_rate': 8.439737129963927e-06, 'epoch': 1.13} {'loss': 0.4646, 'learning_rate': 8.43940526794124e-06, 'epoch': 1.13} {'loss': 0.225, 'learning_rate': 8.439073407680171e-06, 'epoch': 1.13} {'loss': 0.3349, 'learning_rate': 8.43874154918109e-06, 'epoch': 1.13} {'loss': 0.4256, 'learning_rate': 8.438409692444374e-06, 'epoch': 1.13} {'loss': 0.3931, 'learning_rate': 8.438077837470396e-06, 'epoch': 1.13} {'loss': 0.4187, 'learning_rate': 8.437745984259529e-06, 'epoch': 1.13} {'loss': 0.413, 'learning_rate': 8.437414132812152e-06, 'epoch': 1.13} {'loss': 0.3225, 'learning_rate': 8.437082283128637e-06, 'epoch': 1.13} {'loss': 0.3127, 'learning_rate': 8.436750435209357e-06, 'epoch': 1.13} {'loss': 0.4012, 'learning_rate': 8.43641858905469e-06, 'epoch': 1.13} {'loss': 0.3836, 'learning_rate': 8.436086744665008e-06, 'epoch': 1.13} {'loss': 0.3572, 'learning_rate': 8.435754902040687e-06, 'epoch': 1.13} {'loss': 0.4053, 'learning_rate': 8.435423061182101e-06, 'epoch': 1.13} {'loss': 0.3107, 'learning_rate': 8.435091222089627e-06, 'epoch': 1.13} {'loss': 0.224, 'learning_rate': 8.434759384763636e-06, 'epoch': 1.13} {'loss': 0.3863, 'learning_rate': 8.434427549204505e-06, 'epoch': 1.13} {'loss': 0.3886, 'learning_rate': 8.434095715412607e-06, 'epoch': 1.13} {'loss': 0.3467, 'learning_rate': 8.433763883388317e-06, 'epoch': 1.13} {'loss': 0.2955, 'learning_rate': 8.433432053132009e-06, 'epoch': 1.13} {'loss': 0.3099, 'learning_rate': 8.433100224644058e-06, 'epoch': 1.13} {'loss': 0.3675, 'learning_rate': 8.43276839792484e-06, 'epoch': 1.13} {'loss': 0.4247, 'learning_rate': 8.432436572974728e-06, 'epoch': 1.13} {'loss': 0.3435, 'learning_rate': 8.432104749794098e-06, 'epoch': 1.13} {'loss': 0.339, 'learning_rate': 8.431772928383323e-06, 'epoch': 1.13} {'loss': 0.341, 'learning_rate': 8.431441108742777e-06, 'epoch': 1.13} {'loss': 0.2987, 'learning_rate': 8.431109290872836e-06, 'epoch': 1.13} {'loss': 0.2908, 'learning_rate': 8.430777474773876e-06, 'epoch': 1.13} {'loss': 0.2881, 'learning_rate': 8.430445660446268e-06, 'epoch': 1.13} {'loss': 0.2218, 'learning_rate': 8.430113847890392e-06, 'epoch': 1.13} {'loss': 0.2643, 'learning_rate': 8.429782037106615e-06, 'epoch': 1.13} {'loss': 0.1533, 'learning_rate': 8.429450228095316e-06, 'epoch': 1.13} {'loss': 0.2801, 'learning_rate': 8.42911842085687e-06, 'epoch': 1.13} {'loss': 0.2721, 'learning_rate': 8.42878661539165e-06, 'epoch': 1.13} {'loss': 0.3438, 'learning_rate': 8.428454811700032e-06, 'epoch': 1.13} {'loss': 0.3371, 'learning_rate': 8.428123009782388e-06, 'epoch': 1.13} {'loss': 0.3487, 'learning_rate': 8.427791209639095e-06, 'epoch': 1.13} {'loss': 0.423, 'learning_rate': 8.427459411270528e-06, 'epoch': 1.13} {'loss': 0.4816, 'learning_rate': 8.42712761467706e-06, 'epoch': 1.13} {'loss': 0.4801, 'learning_rate': 8.426795819859063e-06, 'epoch': 1.13} {'loss': 0.42, 'learning_rate': 8.426464026816917e-06, 'epoch': 1.13} {'loss': 0.2657, 'learning_rate': 8.426132235550994e-06, 'epoch': 1.13} {'loss': 0.3864, 'learning_rate': 8.42580044606167e-06, 'epoch': 1.13} {'loss': 0.3521, 'learning_rate': 8.425468658349314e-06, 'epoch': 1.13} {'loss': 0.3816, 'learning_rate': 8.425136872414307e-06, 'epoch': 1.13} {'loss': 0.2963, 'learning_rate': 8.42480508825702e-06, 'epoch': 1.13} {'loss': 0.2776, 'learning_rate': 8.424473305877829e-06, 'epoch': 1.13} {'loss': 0.2843, 'learning_rate': 8.424141525277108e-06, 'epoch': 1.13} {'loss': 0.3228, 'learning_rate': 8.42380974645523e-06, 'epoch': 1.13} {'loss': 0.3397, 'learning_rate': 8.423477969412573e-06, 'epoch': 1.13} {'loss': 0.2829, 'learning_rate': 8.42314619414951e-06, 'epoch': 1.13} {'loss': 0.4053, 'learning_rate': 8.422814420666413e-06, 'epoch': 1.13} {'loss': 0.3422, 'learning_rate': 8.42248264896366e-06, 'epoch': 1.13} {'loss': 0.4689, 'learning_rate': 8.422150879041621e-06, 'epoch': 1.13} {'loss': 0.4238, 'learning_rate': 8.421819110900677e-06, 'epoch': 1.13} {'loss': 0.2764, 'learning_rate': 8.421487344541197e-06, 'epoch': 1.13} {'loss': 0.4175, 'learning_rate': 8.421155579963559e-06, 'epoch': 1.13} {'loss': 0.465, 'learning_rate': 8.420823817168136e-06, 'epoch': 1.13} {'loss': 0.22, 'learning_rate': 8.420492056155303e-06, 'epoch': 1.13} {'loss': 0.361, 'learning_rate': 8.420160296925435e-06, 'epoch': 1.13} {'loss': 0.2756, 'learning_rate': 8.419828539478903e-06, 'epoch': 1.13} {'loss': 0.3207, 'learning_rate': 8.419496783816085e-06, 'epoch': 1.13} {'loss': 0.3007, 'learning_rate': 8.419165029937356e-06, 'epoch': 1.13} {'loss': 0.4437, 'learning_rate': 8.41883327784309e-06, 'epoch': 1.13} {'loss': 0.3375, 'learning_rate': 8.41850152753366e-06, 'epoch': 1.13} {'loss': 0.4399, 'learning_rate': 8.41816977900944e-06, 'epoch': 1.13} {'loss': 0.2982, 'learning_rate': 8.417838032270805e-06, 'epoch': 1.13} {'loss': 0.2933, 'learning_rate': 8.41750628731813e-06, 'epoch': 1.13} {'loss': 0.2958, 'learning_rate': 8.417174544151789e-06, 'epoch': 1.13} {'loss': 0.2498, 'learning_rate': 8.416842802772157e-06, 'epoch': 1.13} {'loss': 0.3639, 'learning_rate': 8.416511063179611e-06, 'epoch': 1.13} {'loss': 0.386, 'learning_rate': 8.41617932537452e-06, 'epoch': 1.13} {'loss': 0.2305, 'learning_rate': 8.415847589357263e-06, 'epoch': 1.13} {'loss': 0.3621, 'learning_rate': 8.415515855128213e-06, 'epoch': 1.13} {'loss': 0.2442, 'learning_rate': 8.415184122687743e-06, 'epoch': 1.13} {'loss': 0.2563, 'learning_rate': 8.41485239203623e-06, 'epoch': 1.13} {'loss': 0.1736, 'learning_rate': 8.414520663174048e-06, 'epoch': 1.13} {'loss': 0.4126, 'learning_rate': 8.414188936101569e-06, 'epoch': 1.13} {'loss': 0.4724, 'learning_rate': 8.41385721081917e-06, 'epoch': 1.13} {'loss': 0.283, 'learning_rate': 8.413525487327225e-06, 'epoch': 1.13} {'loss': 0.3278, 'learning_rate': 8.413193765626107e-06, 'epoch': 1.13} {'loss': 0.407, 'learning_rate': 8.41286204571619e-06, 'epoch': 1.13} {'loss': 0.4514, 'learning_rate': 8.412530327597853e-06, 'epoch': 1.13} {'loss': 0.3312, 'learning_rate': 8.412198611271465e-06, 'epoch': 1.13} {'loss': 0.3018, 'learning_rate': 8.411866896737403e-06, 'epoch': 1.13} {'loss': 0.315, 'learning_rate': 8.411535183996042e-06, 'epoch': 1.13} {'loss': 0.3159, 'learning_rate': 8.411203473047755e-06, 'epoch': 1.13} {'loss': 0.2787, 'learning_rate': 8.410871763892918e-06, 'epoch': 1.13} {'loss': 0.3132, 'learning_rate': 8.410540056531905e-06, 'epoch': 1.13} {'loss': 0.3335, 'learning_rate': 8.410208350965093e-06, 'epoch': 1.13} {'loss': 0.2767, 'learning_rate': 8.409876647192848e-06, 'epoch': 1.13} {'loss': 0.2121, 'learning_rate': 8.409544945215553e-06, 'epoch': 1.13} {'loss': 0.3664, 'learning_rate': 8.409213245033577e-06, 'epoch': 1.13} {'loss': 0.4171, 'learning_rate': 8.408881546647298e-06, 'epoch': 1.13} {'loss': 0.3365, 'learning_rate': 8.40854985005709e-06, 'epoch': 1.13} {'loss': 0.1779, 'learning_rate': 8.408218155263324e-06, 'epoch': 1.13} {'loss': 0.4296, 'learning_rate': 8.407886462266379e-06, 'epoch': 1.13} {'loss': 0.4275, 'learning_rate': 8.407554771066628e-06, 'epoch': 1.13} {'loss': 0.3925, 'learning_rate': 8.407223081664445e-06, 'epoch': 1.13} {'loss': 0.3836, 'learning_rate': 8.406891394060201e-06, 'epoch': 1.13} {'loss': 0.2355, 'learning_rate': 8.406559708254276e-06, 'epoch': 1.13} {'loss': 0.4258, 'learning_rate': 8.406228024247042e-06, 'epoch': 1.13} {'loss': 0.2367, 'learning_rate': 8.405896342038876e-06, 'epoch': 1.13} {'loss': 0.2616, 'learning_rate': 8.405564661630149e-06, 'epoch': 1.13} {'loss': 0.5643, 'learning_rate': 8.405232983021234e-06, 'epoch': 1.13} {'loss': 0.3473, 'learning_rate': 8.404901306212508e-06, 'epoch': 1.13} {'loss': 0.4044, 'learning_rate': 8.404569631204344e-06, 'epoch': 1.13} {'loss': 0.2631, 'learning_rate': 8.404237957997119e-06, 'epoch': 1.13} {'loss': 0.2763, 'learning_rate': 8.403906286591206e-06, 'epoch': 1.13} {'loss': 0.2768, 'learning_rate': 8.403574616986979e-06, 'epoch': 1.13} {'loss': 0.3192, 'learning_rate': 8.403242949184813e-06, 'epoch': 1.13} {'loss': 0.3091, 'learning_rate': 8.402911283185082e-06, 'epoch': 1.13} {'loss': 0.3357, 'learning_rate': 8.40257961898816e-06, 'epoch': 1.13} {'loss': 0.3359, 'learning_rate': 8.402247956594422e-06, 'epoch': 1.13} {'loss': 0.2514, 'learning_rate': 8.401916296004243e-06, 'epoch': 1.13} {'loss': 0.3199, 'learning_rate': 8.401584637217998e-06, 'epoch': 1.13} {'loss': 0.3808, 'learning_rate': 8.401252980236058e-06, 'epoch': 1.13} {'loss': 0.4505, 'learning_rate': 8.400921325058799e-06, 'epoch': 1.13} {'loss': 0.2681, 'learning_rate': 8.400589671686597e-06, 'epoch': 1.13} {'loss': 0.3602, 'learning_rate': 8.400258020119824e-06, 'epoch': 1.13} {'loss': 0.1885, 'learning_rate': 8.399926370358854e-06, 'epoch': 1.13} {'loss': 0.3662, 'learning_rate': 8.399594722404065e-06, 'epoch': 1.13} {'loss': 0.3387, 'learning_rate': 8.39926307625583e-06, 'epoch': 1.13} {'loss': 0.4348, 'learning_rate': 8.39893143191452e-06, 'epoch': 1.13} {'loss': 0.338, 'learning_rate': 8.398599789380515e-06, 'epoch': 1.13} {'loss': 0.3979, 'learning_rate': 8.398268148654184e-06, 'epoch': 1.13} {'loss': 0.3573, 'learning_rate': 8.397936509735905e-06, 'epoch': 1.13} {'loss': 0.3063, 'learning_rate': 8.39760487262605e-06, 'epoch': 1.13} {'loss': 0.2935, 'learning_rate': 8.397273237324994e-06, 'epoch': 1.13} {'loss': 0.4966, 'learning_rate': 8.396941603833115e-06, 'epoch': 1.13} {'loss': 0.2693, 'learning_rate': 8.396609972150782e-06, 'epoch': 1.13} {'loss': 0.3041, 'learning_rate': 8.396278342278371e-06, 'epoch': 1.13} {'loss': 0.3509, 'learning_rate': 8.395946714216256e-06, 'epoch': 1.13} {'loss': 0.2934, 'learning_rate': 8.395615087964813e-06, 'epoch': 1.13} {'loss': 0.3182, 'learning_rate': 8.395283463524416e-06, 'epoch': 1.13} {'loss': 0.4525, 'learning_rate': 8.394951840895439e-06, 'epoch': 1.13} {'loss': 0.3333, 'learning_rate': 8.394620220078256e-06, 'epoch': 1.13} {'loss': 0.2042, 'learning_rate': 8.394288601073239e-06, 'epoch': 1.13} {'loss': 0.3732, 'learning_rate': 8.393956983880769e-06, 'epoch': 1.13} {'loss': 0.3028, 'learning_rate': 8.393625368501213e-06, 'epoch': 1.13} {'loss': 0.307, 'learning_rate': 8.393293754934949e-06, 'epoch': 1.13} {'loss': 0.4023, 'learning_rate': 8.392962143182351e-06, 'epoch': 1.13} {'loss': 0.2737, 'learning_rate': 8.392630533243795e-06, 'epoch': 1.13} {'loss': 0.3622, 'learning_rate': 8.392298925119653e-06, 'epoch': 1.13} {'loss': 0.4509, 'learning_rate': 8.391967318810298e-06, 'epoch': 1.13} {'loss': 0.31, 'learning_rate': 8.391635714316107e-06, 'epoch': 1.13} {'loss': 0.3327, 'learning_rate': 8.391304111637453e-06, 'epoch': 1.13} {'loss': 0.1713, 'learning_rate': 8.390972510774711e-06, 'epoch': 1.13} {'loss': 0.3663, 'learning_rate': 8.390640911728255e-06, 'epoch': 1.13} {'loss': 0.2493, 'learning_rate': 8.390309314498459e-06, 'epoch': 1.13} {'loss': 0.2756, 'learning_rate': 8.389977719085698e-06, 'epoch': 1.13} {'loss': 0.4605, 'learning_rate': 8.389646125490348e-06, 'epoch': 1.13} {'loss': 0.2842, 'learning_rate': 8.389314533712776e-06, 'epoch': 1.13} {'loss': 0.2352, 'learning_rate': 8.388982943753366e-06, 'epoch': 1.13} {'loss': 0.3578, 'learning_rate': 8.388651355612486e-06, 'epoch': 1.13} {'loss': 0.3277, 'learning_rate': 8.388319769290513e-06, 'epoch': 1.13} {'loss': 0.4355, 'learning_rate': 8.38798818478782e-06, 'epoch': 1.13} {'loss': 0.3522, 'learning_rate': 8.387656602104784e-06, 'epoch': 1.13} {'loss': 0.2676, 'learning_rate': 8.387325021241774e-06, 'epoch': 1.13} {'loss': 0.2345, 'learning_rate': 8.38699344219917e-06, 'epoch': 1.13} {'loss': 0.4137, 'learning_rate': 8.38666186497734e-06, 'epoch': 1.13} {'loss': 0.276, 'learning_rate': 8.386330289576667e-06, 'epoch': 1.13} {'loss': 0.4179, 'learning_rate': 8.385998715997518e-06, 'epoch': 1.13} {'loss': 0.3355, 'learning_rate': 8.38566714424027e-06, 'epoch': 1.13} {'loss': 0.3177, 'learning_rate': 8.385335574305297e-06, 'epoch': 1.13} {'loss': 0.228, 'learning_rate': 8.385004006192972e-06, 'epoch': 1.13} {'loss': 0.4522, 'learning_rate': 8.38467243990367e-06, 'epoch': 1.13} {'loss': 0.3853, 'learning_rate': 8.384340875437767e-06, 'epoch': 1.13} {'loss': 0.5247, 'learning_rate': 8.384009312795635e-06, 'epoch': 1.13} {'loss': 0.3601, 'learning_rate': 8.383677751977649e-06, 'epoch': 1.13} {'loss': 0.4483, 'learning_rate': 8.383346192984184e-06, 'epoch': 1.13} {'loss': 0.4083, 'learning_rate': 8.383014635815615e-06, 'epoch': 1.13} {'loss': 0.2357, 'learning_rate': 8.382683080472311e-06, 'epoch': 1.13} {'loss': 0.347, 'learning_rate': 8.382351526954654e-06, 'epoch': 1.13} {'loss': 0.274, 'learning_rate': 8.382019975263013e-06, 'epoch': 1.13} {'loss': 0.262, 'learning_rate': 8.381688425397766e-06, 'epoch': 1.13} {'loss': 0.1904, 'learning_rate': 8.381356877359284e-06, 'epoch': 1.13} {'loss': 0.2752, 'learning_rate': 8.38102533114794e-06, 'epoch': 1.13} {'loss': 0.1815, 'learning_rate': 8.380693786764112e-06, 'epoch': 1.13} {'loss': 0.3035, 'learning_rate': 8.380362244208174e-06, 'epoch': 1.13} {'loss': 0.3697, 'learning_rate': 8.380030703480497e-06, 'epoch': 1.13} {'loss': 0.359, 'learning_rate': 8.379699164581459e-06, 'epoch': 1.13} {'loss': 0.3409, 'learning_rate': 8.37936762751143e-06, 'epoch': 1.13} {'loss': 0.331, 'learning_rate': 8.37903609227079e-06, 'epoch': 1.13} {'loss': 0.302, 'learning_rate': 8.378704558859907e-06, 'epoch': 1.13} {'loss': 0.2711, 'learning_rate': 8.378373027279159e-06, 'epoch': 1.13} {'loss': 0.262, 'learning_rate': 8.378041497528922e-06, 'epoch': 1.13} {'loss': 0.3138, 'learning_rate': 8.377709969609564e-06, 'epoch': 1.13} {'loss': 0.3754, 'learning_rate': 8.377378443521466e-06, 'epoch': 1.13} {'loss': 0.6186, 'learning_rate': 8.377046919265e-06, 'epoch': 1.13} {'loss': 0.4067, 'learning_rate': 8.376715396840536e-06, 'epoch': 1.13} {'loss': 0.3628, 'learning_rate': 8.376383876248454e-06, 'epoch': 1.13} {'loss': 0.3328, 'learning_rate': 8.376052357489125e-06, 'epoch': 1.13} {'loss': 0.2006, 'learning_rate': 8.375720840562925e-06, 'epoch': 1.13} {'loss': 0.3766, 'learning_rate': 8.375389325470224e-06, 'epoch': 1.13} {'loss': 0.2904, 'learning_rate': 8.375057812211402e-06, 'epoch': 1.13} {'loss': 0.3301, 'learning_rate': 8.374726300786832e-06, 'epoch': 1.13} {'loss': 0.19, 'learning_rate': 8.374394791196885e-06, 'epoch': 1.13} {'loss': 0.3514, 'learning_rate': 8.374063283441938e-06, 'epoch': 1.13} {'loss': 0.2789, 'learning_rate': 8.373731777522363e-06, 'epoch': 1.13} {'loss': 0.3651, 'learning_rate': 8.373400273438536e-06, 'epoch': 1.13} {'loss': 0.3748, 'learning_rate': 8.373068771190832e-06, 'epoch': 1.13} {'loss': 0.1697, 'learning_rate': 8.372737270779625e-06, 'epoch': 1.13} {'loss': 0.3198, 'learning_rate': 8.372405772205286e-06, 'epoch': 1.13} {'loss': 0.3534, 'learning_rate': 8.372074275468192e-06, 'epoch': 1.13} {'loss': 0.3604, 'learning_rate': 8.371742780568716e-06, 'epoch': 1.13} {'loss': 0.3693, 'learning_rate': 8.371411287507234e-06, 'epoch': 1.13} {'loss': 0.468, 'learning_rate': 8.371079796284118e-06, 'epoch': 1.13} {'loss': 0.2981, 'learning_rate': 8.370748306899743e-06, 'epoch': 1.13} {'loss': 0.2953, 'learning_rate': 8.370416819354485e-06, 'epoch': 1.13} {'loss': 0.3392, 'learning_rate': 8.370085333648714e-06, 'epoch': 1.13} {'loss': 0.3565, 'learning_rate': 8.36975384978281e-06, 'epoch': 1.13} {'loss': 0.3237, 'learning_rate': 8.36942236775714e-06, 'epoch': 1.13} {'loss': 0.4456, 'learning_rate': 8.369090887572085e-06, 'epoch': 1.13} {'loss': 0.3853, 'learning_rate': 8.368759409228015e-06, 'epoch': 1.13} {'loss': 0.3032, 'learning_rate': 8.368427932725307e-06, 'epoch': 1.13} {'loss': 0.2972, 'learning_rate': 8.368096458064331e-06, 'epoch': 1.13} {'loss': 0.3847, 'learning_rate': 8.367764985245466e-06, 'epoch': 1.13} {'loss': 0.3267, 'learning_rate': 8.367433514269084e-06, 'epoch': 1.13} {'loss': 0.2917, 'learning_rate': 8.367102045135557e-06, 'epoch': 1.13} {'loss': 0.2903, 'learning_rate': 8.366770577845262e-06, 'epoch': 1.13} {'loss': 0.4221, 'learning_rate': 8.366439112398574e-06, 'epoch': 1.13} {'loss': 0.4015, 'learning_rate': 8.366107648795864e-06, 'epoch': 1.13} {'loss': 0.4693, 'learning_rate': 8.365776187037507e-06, 'epoch': 1.13} {'loss': 0.3034, 'learning_rate': 8.36544472712388e-06, 'epoch': 1.13} {'loss': 0.3438, 'learning_rate': 8.365113269055353e-06, 'epoch': 1.13} {'loss': 0.2423, 'learning_rate': 8.364781812832304e-06, 'epoch': 1.13} {'loss': 0.4168, 'learning_rate': 8.364450358455105e-06, 'epoch': 1.13} {'loss': 0.2677, 'learning_rate': 8.364118905924132e-06, 'epoch': 1.13} {'loss': 0.3269, 'learning_rate': 8.363787455239755e-06, 'epoch': 1.13} {'loss': 0.2869, 'learning_rate': 8.363456006402353e-06, 'epoch': 1.13} {'loss': 0.5015, 'learning_rate': 8.363124559412297e-06, 'epoch': 1.13} {'loss': 0.4165, 'learning_rate': 8.362793114269962e-06, 'epoch': 1.13} {'loss': 0.3409, 'learning_rate': 8.362461670975721e-06, 'epoch': 1.13} {'loss': 0.3326, 'learning_rate': 8.362130229529951e-06, 'epoch': 1.13} {'loss': 0.2712, 'learning_rate': 8.361798789933024e-06, 'epoch': 1.13} {'loss': 0.3795, 'learning_rate': 8.361467352185314e-06, 'epoch': 1.13} {'loss': 0.3715, 'learning_rate': 8.361135916287197e-06, 'epoch': 1.13} {'loss': 0.2168, 'learning_rate': 8.360804482239046e-06, 'epoch': 1.13} {'loss': 0.4793, 'learning_rate': 8.360473050041233e-06, 'epoch': 1.13} {'loss': 0.3207, 'learning_rate': 8.360141619694136e-06, 'epoch': 1.13} {'loss': 0.3504, 'learning_rate': 8.35981019119813e-06, 'epoch': 1.13} {'loss': 0.2901, 'learning_rate': 8.359478764553583e-06, 'epoch': 1.13} {'loss': 0.331, 'learning_rate': 8.359147339760873e-06, 'epoch': 1.13} {'loss': 0.3069, 'learning_rate': 8.358815916820373e-06, 'epoch': 1.13} {'loss': 0.3395, 'learning_rate': 8.358484495732457e-06, 'epoch': 1.13} {'loss': 0.2394, 'learning_rate': 8.358153076497501e-06, 'epoch': 1.13} {'loss': 0.4121, 'learning_rate': 8.357821659115878e-06, 'epoch': 1.13} {'loss': 0.4622, 'learning_rate': 8.357490243587963e-06, 'epoch': 1.13} {'loss': 0.3763, 'learning_rate': 8.357158829914127e-06, 'epoch': 1.13} {'loss': 0.3419, 'learning_rate': 8.356827418094748e-06, 'epoch': 1.13} {'loss': 0.2293, 'learning_rate': 8.356496008130194e-06, 'epoch': 1.13} {'loss': 0.4841, 'learning_rate': 8.356164600020848e-06, 'epoch': 1.13} {'loss': 0.4031, 'learning_rate': 8.35583319376708e-06, 'epoch': 1.13} {'loss': 0.4067, 'learning_rate': 8.355501789369263e-06, 'epoch': 1.13} {'loss': 0.3124, 'learning_rate': 8.35517038682777e-06, 'epoch': 1.13} {'loss': 0.3303, 'learning_rate': 8.35483898614298e-06, 'epoch': 1.13} {'loss': 0.3096, 'learning_rate': 8.35450758731526e-06, 'epoch': 1.13} {'loss': 0.3573, 'learning_rate': 8.35417619034499e-06, 'epoch': 1.13} {'loss': 0.354, 'learning_rate': 8.353844795232542e-06, 'epoch': 1.13} {'loss': 0.3346, 'learning_rate': 8.353513401978292e-06, 'epoch': 1.13} {'loss': 0.3175, 'learning_rate': 8.35318201058261e-06, 'epoch': 1.13} {'loss': 0.2899, 'learning_rate': 8.352850621045874e-06, 'epoch': 1.13} {'loss': 0.331, 'learning_rate': 8.352519233368457e-06, 'epoch': 1.13} {'loss': 0.3225, 'learning_rate': 8.35218784755073e-06, 'epoch': 1.13} {'loss': 0.2517, 'learning_rate': 8.35185646359307e-06, 'epoch': 1.13} {'loss': 0.4273, 'learning_rate': 8.351525081495853e-06, 'epoch': 1.13} {'loss': 0.298, 'learning_rate': 8.351193701259448e-06, 'epoch': 1.13} {'loss': 0.3354, 'learning_rate': 8.350862322884234e-06, 'epoch': 1.13} {'loss': 0.2628, 'learning_rate': 8.35053094637058e-06, 'epoch': 1.13} {'loss': 0.488, 'learning_rate': 8.350199571718865e-06, 'epoch': 1.13} {'loss': 0.4356, 'learning_rate': 8.34986819892946e-06, 'epoch': 1.13} {'loss': 0.3632, 'learning_rate': 8.349536828002741e-06, 'epoch': 1.13} {'loss': 0.2565, 'learning_rate': 8.34920545893908e-06, 'epoch': 1.13} {'loss': 0.3372, 'learning_rate': 8.348874091738853e-06, 'epoch': 1.13} {'loss': 0.3205, 'learning_rate': 8.348542726402435e-06, 'epoch': 1.13} {'loss': 0.336, 'learning_rate': 8.348211362930197e-06, 'epoch': 1.13} {'loss': 0.3435, 'learning_rate': 8.347880001322512e-06, 'epoch': 1.13} {'loss': 0.3129, 'learning_rate': 8.347548641579758e-06, 'epoch': 1.13} {'loss': 0.4269, 'learning_rate': 8.347217283702307e-06, 'epoch': 1.13} {'loss': 0.3132, 'learning_rate': 8.346885927690533e-06, 'epoch': 1.13} {'loss': 0.2958, 'learning_rate': 8.346554573544811e-06, 'epoch': 1.13} {'loss': 0.2345, 'learning_rate': 8.346223221265514e-06, 'epoch': 1.13} {'loss': 0.4054, 'learning_rate': 8.345891870853018e-06, 'epoch': 1.13} {'loss': 0.2546, 'learning_rate': 8.345560522307692e-06, 'epoch': 1.13} {'loss': 0.3791, 'learning_rate': 8.345229175629917e-06, 'epoch': 1.13} {'loss': 0.3249, 'learning_rate': 8.344897830820063e-06, 'epoch': 1.13} {'loss': 0.4235, 'learning_rate': 8.344566487878504e-06, 'epoch': 1.13} {'loss': 0.1833, 'learning_rate': 8.344235146805615e-06, 'epoch': 1.13} {'loss': 0.4053, 'learning_rate': 8.343903807601771e-06, 'epoch': 1.13} {'loss': 0.3406, 'learning_rate': 8.343572470267343e-06, 'epoch': 1.13} {'loss': 0.2242, 'learning_rate': 8.343241134802707e-06, 'epoch': 1.13} {'loss': 0.3108, 'learning_rate': 8.342909801208235e-06, 'epoch': 1.13} {'loss': 0.3078, 'learning_rate': 8.342578469484305e-06, 'epoch': 1.13} {'loss': 0.3309, 'learning_rate': 8.342247139631287e-06, 'epoch': 1.13} {'loss': 0.442, 'learning_rate': 8.341915811649559e-06, 'epoch': 1.13} {'loss': 0.3286, 'learning_rate': 8.341584485539492e-06, 'epoch': 1.13} {'loss': 0.303, 'learning_rate': 8.341253161301459e-06, 'epoch': 1.13} {'loss': 0.3728, 'learning_rate': 8.340921838935837e-06, 'epoch': 1.13} {'loss': 0.3113, 'learning_rate': 8.340590518442999e-06, 'epoch': 1.13} {'loss': 0.2639, 'learning_rate': 8.340259199823317e-06, 'epoch': 1.13} {'loss': 0.3728, 'learning_rate': 8.33992788307717e-06, 'epoch': 1.13} {'loss': 0.3246, 'learning_rate': 8.339596568204929e-06, 'epoch': 1.13} {'loss': 0.3187, 'learning_rate': 8.339265255206966e-06, 'epoch': 1.13} {'loss': 0.2762, 'learning_rate': 8.338933944083656e-06, 'epoch': 1.13} {'loss': 0.4477, 'learning_rate': 8.338602634835374e-06, 'epoch': 1.13} {'loss': 0.3266, 'learning_rate': 8.338271327462492e-06, 'epoch': 1.13} {'loss': 0.4317, 'learning_rate': 8.337940021965388e-06, 'epoch': 1.13} {'loss': 0.2711, 'learning_rate': 8.337608718344432e-06, 'epoch': 1.13} {'loss': 0.304, 'learning_rate': 8.337277416600002e-06, 'epoch': 1.13} {'loss': 0.3427, 'learning_rate': 8.336946116732469e-06, 'epoch': 1.13} {'loss': 0.4353, 'learning_rate': 8.336614818742207e-06, 'epoch': 1.13} {'loss': 0.4064, 'learning_rate': 8.33628352262959e-06, 'epoch': 1.13} {'loss': 0.4399, 'learning_rate': 8.335952228394994e-06, 'epoch': 1.13} {'loss': 0.2759, 'learning_rate': 8.335620936038792e-06, 'epoch': 1.13} {'loss': 0.2066, 'learning_rate': 8.335289645561356e-06, 'epoch': 1.13} {'loss': 0.3319, 'learning_rate': 8.334958356963061e-06, 'epoch': 1.13} {'loss': 0.2325, 'learning_rate': 8.334627070244282e-06, 'epoch': 1.13} {'loss': 0.4569, 'learning_rate': 8.334295785405394e-06, 'epoch': 1.13} {'loss': 0.3053, 'learning_rate': 8.333964502446764e-06, 'epoch': 1.13} {'loss': 0.3236, 'learning_rate': 8.333633221368777e-06, 'epoch': 1.13} {'loss': 0.3582, 'learning_rate': 8.3333019421718e-06, 'epoch': 1.13} {'loss': 0.2885, 'learning_rate': 8.332970664856205e-06, 'epoch': 1.13} {'loss': 0.4484, 'learning_rate': 8.332639389422373e-06, 'epoch': 1.13} {'loss': 0.3286, 'learning_rate': 8.332308115870672e-06, 'epoch': 1.13} {'loss': 0.2968, 'learning_rate': 8.331976844201479e-06, 'epoch': 1.13} {'loss': 0.3897, 'learning_rate': 8.331645574415164e-06, 'epoch': 1.13} {'loss': 0.3795, 'learning_rate': 8.331314306512109e-06, 'epoch': 1.13} {'loss': 0.3717, 'learning_rate': 8.33098304049268e-06, 'epoch': 1.13} {'loss': 0.3633, 'learning_rate': 8.330651776357254e-06, 'epoch': 1.13} {'loss': 0.3091, 'learning_rate': 8.330320514106205e-06, 'epoch': 1.13} {'loss': 0.3257, 'learning_rate': 8.329989253739905e-06, 'epoch': 1.13} {'loss': 0.4061, 'learning_rate': 8.329657995258732e-06, 'epoch': 1.13} {'loss': 0.3508, 'learning_rate': 8.329326738663057e-06, 'epoch': 1.13} {'loss': 0.382, 'learning_rate': 8.328995483953253e-06, 'epoch': 1.13} {'loss': 0.1936, 'learning_rate': 8.328664231129694e-06, 'epoch': 1.13} {'loss': 0.3462, 'learning_rate': 8.328332980192758e-06, 'epoch': 1.13} {'loss': 0.4333, 'learning_rate': 8.328001731142816e-06, 'epoch': 1.13} {'loss': 0.2026, 'learning_rate': 8.327670483980241e-06, 'epoch': 1.13} {'loss': 0.4483, 'learning_rate': 8.327339238705408e-06, 'epoch': 1.13} {'loss': 0.3967, 'learning_rate': 8.327007995318695e-06, 'epoch': 1.13} {'loss': 0.344, 'learning_rate': 8.326676753820468e-06, 'epoch': 1.13} {'loss': 0.2797, 'learning_rate': 8.326345514211105e-06, 'epoch': 1.13} {'loss': 0.3139, 'learning_rate': 8.32601427649098e-06, 'epoch': 1.13} {'loss': 0.3684, 'learning_rate': 8.325683040660466e-06, 'epoch': 1.13} {'loss': 0.1794, 'learning_rate': 8.325351806719938e-06, 'epoch': 1.13} {'loss': 0.3751, 'learning_rate': 8.32502057466977e-06, 'epoch': 1.13} {'loss': 0.2466, 'learning_rate': 8.324689344510333e-06, 'epoch': 1.13} {'loss': 0.3731, 'learning_rate': 8.324358116242004e-06, 'epoch': 1.13} {'loss': 0.2578, 'learning_rate': 8.324026889865157e-06, 'epoch': 1.13} {'loss': 0.284, 'learning_rate': 8.323695665380163e-06, 'epoch': 1.13} {'loss': 0.3498, 'learning_rate': 8.323364442787399e-06, 'epoch': 1.13} {'loss': 0.3124, 'learning_rate': 8.323033222087238e-06, 'epoch': 1.14} {'loss': 0.3628, 'learning_rate': 8.322702003280053e-06, 'epoch': 1.14} {'loss': 0.3138, 'learning_rate': 8.32237078636622e-06, 'epoch': 1.14} {'loss': 0.3921, 'learning_rate': 8.32203957134611e-06, 'epoch': 1.14} {'loss': 0.3386, 'learning_rate': 8.321708358220098e-06, 'epoch': 1.14} {'loss': 0.3523, 'learning_rate': 8.32137714698856e-06, 'epoch': 1.14} {'loss': 0.5741, 'learning_rate': 8.321045937651866e-06, 'epoch': 1.14} {'loss': 0.2636, 'learning_rate': 8.320714730210393e-06, 'epoch': 1.14} {'loss': 0.4704, 'learning_rate': 8.320383524664514e-06, 'epoch': 1.14} {'loss': 0.4515, 'learning_rate': 8.320052321014603e-06, 'epoch': 1.14} {'loss': 0.4091, 'learning_rate': 8.319721119261033e-06, 'epoch': 1.14} {'loss': 0.3175, 'learning_rate': 8.319389919404178e-06, 'epoch': 1.14} {'loss': 0.2112, 'learning_rate': 8.319058721444412e-06, 'epoch': 1.14} {'loss': 0.3813, 'learning_rate': 8.318727525382109e-06, 'epoch': 1.14} {'loss': 0.2372, 'learning_rate': 8.318396331217644e-06, 'epoch': 1.14} {'loss': 0.2616, 'learning_rate': 8.318065138951388e-06, 'epoch': 1.14} {'loss': 0.4177, 'learning_rate': 8.317733948583717e-06, 'epoch': 1.14} {'loss': 0.2708, 'learning_rate': 8.317402760115005e-06, 'epoch': 1.14} {'loss': 0.3929, 'learning_rate': 8.317071573545625e-06, 'epoch': 1.14} {'loss': 0.4602, 'learning_rate': 8.316740388875952e-06, 'epoch': 1.14} {'loss': 0.2439, 'learning_rate': 8.316409206106359e-06, 'epoch': 1.14} {'loss': 0.2582, 'learning_rate': 8.31607802523722e-06, 'epoch': 1.14} {'loss': 0.4646, 'learning_rate': 8.315746846268908e-06, 'epoch': 1.14} {'loss': 0.3385, 'learning_rate': 8.315415669201798e-06, 'epoch': 1.14} {'loss': 0.2817, 'learning_rate': 8.315084494036263e-06, 'epoch': 1.14} {'loss': 0.399, 'learning_rate': 8.314753320772677e-06, 'epoch': 1.14} {'loss': 0.3086, 'learning_rate': 8.314422149411414e-06, 'epoch': 1.14} {'loss': 0.2051, 'learning_rate': 8.314090979952849e-06, 'epoch': 1.14} {'loss': 0.2924, 'learning_rate': 8.313759812397353e-06, 'epoch': 1.14} {'loss': 0.354, 'learning_rate': 8.313428646745302e-06, 'epoch': 1.14} {'loss': 0.3397, 'learning_rate': 8.31309748299707e-06, 'epoch': 1.14} {'loss': 0.326, 'learning_rate': 8.31276632115303e-06, 'epoch': 1.14} {'loss': 0.4024, 'learning_rate': 8.312435161213554e-06, 'epoch': 1.14} {'loss': 0.3128, 'learning_rate': 8.31210400317902e-06, 'epoch': 1.14} {'loss': 0.3895, 'learning_rate': 8.311772847049799e-06, 'epoch': 1.14} {'loss': 0.3559, 'learning_rate': 8.31144169282627e-06, 'epoch': 1.14} {'loss': 0.3211, 'learning_rate': 8.311110540508796e-06, 'epoch': 1.14} {'loss': 0.2931, 'learning_rate': 8.310779390097759e-06, 'epoch': 1.14} {'loss': 0.2441, 'learning_rate': 8.310448241593531e-06, 'epoch': 1.14} {'loss': 0.2904, 'learning_rate': 8.310117094996485e-06, 'epoch': 1.14} {'loss': 0.3308, 'learning_rate': 8.309785950306996e-06, 'epoch': 1.14} {'loss': 0.3447, 'learning_rate': 8.309454807525436e-06, 'epoch': 1.14} {'loss': 0.1586, 'learning_rate': 8.309123666652181e-06, 'epoch': 1.14} {'loss': 0.3967, 'learning_rate': 8.308792527687605e-06, 'epoch': 1.14} {'loss': 0.375, 'learning_rate': 8.308461390632078e-06, 'epoch': 1.14} {'loss': 0.2751, 'learning_rate': 8.308130255485979e-06, 'epoch': 1.14} {'loss': 0.3349, 'learning_rate': 8.307799122249678e-06, 'epoch': 1.14} {'loss': 0.3573, 'learning_rate': 8.30746799092355e-06, 'epoch': 1.14} {'loss': 0.2807, 'learning_rate': 8.307136861507972e-06, 'epoch': 1.14} {'loss': 0.2521, 'learning_rate': 8.30680573400331e-06, 'epoch': 1.14} {'loss': 0.3269, 'learning_rate': 8.306474608409944e-06, 'epoch': 1.14} {'loss': 0.5288, 'learning_rate': 8.306143484728247e-06, 'epoch': 1.14} {'loss': 0.4076, 'learning_rate': 8.30581236295859e-06, 'epoch': 1.14} {'loss': 0.2557, 'learning_rate': 8.30548124310135e-06, 'epoch': 1.14} {'loss': 0.4818, 'learning_rate': 8.3051501251569e-06, 'epoch': 1.14} {'loss': 0.3659, 'learning_rate': 8.304819009125612e-06, 'epoch': 1.14} {'loss': 0.3596, 'learning_rate': 8.304487895007861e-06, 'epoch': 1.14} {'loss': 0.3123, 'learning_rate': 8.304156782804022e-06, 'epoch': 1.14} {'loss': 0.2789, 'learning_rate': 8.303825672514465e-06, 'epoch': 1.14} {'loss': 0.3706, 'learning_rate': 8.303494564139569e-06, 'epoch': 1.14} {'loss': 0.2586, 'learning_rate': 8.303163457679704e-06, 'epoch': 1.14} {'loss': 0.3808, 'learning_rate': 8.302832353135244e-06, 'epoch': 1.14} {'loss': 0.3785, 'learning_rate': 8.302501250506565e-06, 'epoch': 1.14} {'loss': 0.3914, 'learning_rate': 8.302170149794039e-06, 'epoch': 1.14} {'loss': 0.3191, 'learning_rate': 8.30183905099804e-06, 'epoch': 1.14} {'loss': 0.4419, 'learning_rate': 8.301507954118941e-06, 'epoch': 1.14} {'loss': 0.4109, 'learning_rate': 8.301176859157118e-06, 'epoch': 1.14} {'loss': 0.4749, 'learning_rate': 8.300845766112942e-06, 'epoch': 1.14} {'loss': 0.2996, 'learning_rate': 8.300514674986788e-06, 'epoch': 1.14} {'loss': 0.2583, 'learning_rate': 8.300183585779029e-06, 'epoch': 1.14} {'loss': 0.4314, 'learning_rate': 8.29985249849004e-06, 'epoch': 1.14} {'loss': 0.4192, 'learning_rate': 8.299521413120194e-06, 'epoch': 1.14} {'loss': 0.2019, 'learning_rate': 8.299190329669866e-06, 'epoch': 1.14} {'loss': 0.3076, 'learning_rate': 8.298859248139429e-06, 'epoch': 1.14} {'loss': 0.3515, 'learning_rate': 8.298528168529257e-06, 'epoch': 1.14} {'loss': 0.3578, 'learning_rate': 8.298197090839723e-06, 'epoch': 1.14} {'loss': 0.4144, 'learning_rate': 8.2978660150712e-06, 'epoch': 1.14} {'loss': 0.4396, 'learning_rate': 8.29753494122406e-06, 'epoch': 1.14} {'loss': 0.3005, 'learning_rate': 8.297203869298683e-06, 'epoch': 1.14} {'loss': 0.3348, 'learning_rate': 8.296872799295438e-06, 'epoch': 1.14} {'loss': 0.3349, 'learning_rate': 8.2965417312147e-06, 'epoch': 1.14} {'loss': 0.3228, 'learning_rate': 8.29621066505684e-06, 'epoch': 1.14} {'loss': 0.2839, 'learning_rate': 8.295879600822237e-06, 'epoch': 1.14} {'loss': 0.3029, 'learning_rate': 8.29554853851126e-06, 'epoch': 1.14} {'loss': 0.3924, 'learning_rate': 8.295217478124286e-06, 'epoch': 1.14} {'loss': 0.387, 'learning_rate': 8.294886419661687e-06, 'epoch': 1.14} {'loss': 0.2309, 'learning_rate': 8.294555363123838e-06, 'epoch': 1.14} {'loss': 0.2866, 'learning_rate': 8.294224308511109e-06, 'epoch': 1.14} {'loss': 0.2023, 'learning_rate': 8.29389325582388e-06, 'epoch': 1.14} {'loss': 0.3032, 'learning_rate': 8.29356220506252e-06, 'epoch': 1.14} {'loss': 0.2722, 'learning_rate': 8.293231156227403e-06, 'epoch': 1.14} {'loss': 0.393, 'learning_rate': 8.292900109318902e-06, 'epoch': 1.14} {'loss': 0.335, 'learning_rate': 8.292569064337393e-06, 'epoch': 1.14} {'loss': 0.3155, 'learning_rate': 8.29223802128325e-06, 'epoch': 1.14} {'loss': 0.4271, 'learning_rate': 8.291906980156846e-06, 'epoch': 1.14} {'loss': 0.1909, 'learning_rate': 8.291575940958552e-06, 'epoch': 1.14} {'loss': 0.1715, 'learning_rate': 8.291244903688745e-06, 'epoch': 1.14} {'loss': 0.415, 'learning_rate': 8.290913868347796e-06, 'epoch': 1.14} {'loss': 0.3951, 'learning_rate': 8.29058283493608e-06, 'epoch': 1.14} {'loss': 0.4284, 'learning_rate': 8.290251803453973e-06, 'epoch': 1.14} {'loss': 0.2621, 'learning_rate': 8.289920773901845e-06, 'epoch': 1.14} {'loss': 0.3198, 'learning_rate': 8.289589746280073e-06, 'epoch': 1.14} {'loss': 0.2187, 'learning_rate': 8.289258720589028e-06, 'epoch': 1.14} {'loss': 0.2999, 'learning_rate': 8.288927696829086e-06, 'epoch': 1.14} {'loss': 0.1511, 'learning_rate': 8.288596675000618e-06, 'epoch': 1.14} {'loss': 0.3643, 'learning_rate': 8.288265655103998e-06, 'epoch': 1.14} {'loss': 0.1984, 'learning_rate': 8.287934637139601e-06, 'epoch': 1.14} {'loss': 0.3037, 'learning_rate': 8.287603621107803e-06, 'epoch': 1.14} {'loss': 0.2236, 'learning_rate': 8.287272607008973e-06, 'epoch': 1.14} {'loss': 0.3609, 'learning_rate': 8.286941594843487e-06, 'epoch': 1.14} {'loss': 0.3032, 'learning_rate': 8.286610584611717e-06, 'epoch': 1.14} {'loss': 0.3843, 'learning_rate': 8.28627957631404e-06, 'epoch': 1.14} {'loss': 0.2883, 'learning_rate': 8.285948569950824e-06, 'epoch': 1.14} {'loss': 0.2848, 'learning_rate': 8.285617565522447e-06, 'epoch': 1.14} {'loss': 0.3424, 'learning_rate': 8.285286563029285e-06, 'epoch': 1.14} {'loss': 0.2576, 'learning_rate': 8.284955562471707e-06, 'epoch': 1.14} {'loss': 0.3183, 'learning_rate': 8.284624563850086e-06, 'epoch': 1.14} {'loss': 0.4063, 'learning_rate': 8.284293567164798e-06, 'epoch': 1.14} {'loss': 0.433, 'learning_rate': 8.283962572416218e-06, 'epoch': 1.14} {'loss': 0.3539, 'learning_rate': 8.283631579604716e-06, 'epoch': 1.14} {'loss': 0.3039, 'learning_rate': 8.28330058873067e-06, 'epoch': 1.14} {'loss': 0.3207, 'learning_rate': 8.282969599794449e-06, 'epoch': 1.14} {'loss': 0.3564, 'learning_rate': 8.282638612796431e-06, 'epoch': 1.14} {'loss': 0.3174, 'learning_rate': 8.282307627736986e-06, 'epoch': 1.14} {'loss': 0.5452, 'learning_rate': 8.28197664461649e-06, 'epoch': 1.14} {'loss': 0.3871, 'learning_rate': 8.281645663435314e-06, 'epoch': 1.14} {'loss': 0.3636, 'learning_rate': 8.281314684193834e-06, 'epoch': 1.14} {'loss': 0.3811, 'learning_rate': 8.280983706892423e-06, 'epoch': 1.14} {'loss': 0.2672, 'learning_rate': 8.280652731531454e-06, 'epoch': 1.14} {'loss': 0.3277, 'learning_rate': 8.280321758111303e-06, 'epoch': 1.14} {'loss': 0.4431, 'learning_rate': 8.279990786632339e-06, 'epoch': 1.14} {'loss': 0.3201, 'learning_rate': 8.279659817094941e-06, 'epoch': 1.14} {'loss': 0.1483, 'learning_rate': 8.279328849499477e-06, 'epoch': 1.14} {'loss': 0.3558, 'learning_rate': 8.278997883846326e-06, 'epoch': 1.14} {'loss': 0.2463, 'learning_rate': 8.278666920135858e-06, 'epoch': 1.14} {'loss': 0.4139, 'learning_rate': 8.278335958368451e-06, 'epoch': 1.14} {'loss': 0.491, 'learning_rate': 8.278004998544472e-06, 'epoch': 1.14} {'loss': 0.3052, 'learning_rate': 8.277674040664298e-06, 'epoch': 1.14} {'loss': 0.3167, 'learning_rate': 8.277343084728301e-06, 'epoch': 1.14} {'loss': 0.2165, 'learning_rate': 8.277012130736859e-06, 'epoch': 1.14} {'loss': 0.4, 'learning_rate': 8.276681178690341e-06, 'epoch': 1.14} {'loss': 0.3561, 'learning_rate': 8.276350228589123e-06, 'epoch': 1.14} {'loss': 0.2749, 'learning_rate': 8.276019280433576e-06, 'epoch': 1.14} {'loss': 0.3061, 'learning_rate': 8.275688334224078e-06, 'epoch': 1.14} {'loss': 0.2977, 'learning_rate': 8.275357389960999e-06, 'epoch': 1.14} {'loss': 0.2535, 'learning_rate': 8.275026447644714e-06, 'epoch': 1.14} {'loss': 0.4143, 'learning_rate': 8.274695507275595e-06, 'epoch': 1.14} {'loss': 0.3014, 'learning_rate': 8.274364568854017e-06, 'epoch': 1.14} {'loss': 0.2202, 'learning_rate': 8.274033632380356e-06, 'epoch': 1.14} {'loss': 0.2476, 'learning_rate': 8.273702697854979e-06, 'epoch': 1.14} {'loss': 0.2217, 'learning_rate': 8.273371765278266e-06, 'epoch': 1.14} {'loss': 0.3615, 'learning_rate': 8.273040834650586e-06, 'epoch': 1.14} {'loss': 0.2847, 'learning_rate': 8.272709905972316e-06, 'epoch': 1.14} {'loss': 0.4231, 'learning_rate': 8.272378979243827e-06, 'epoch': 1.14} {'loss': 0.2881, 'learning_rate': 8.272048054465494e-06, 'epoch': 1.14} {'loss': 0.244, 'learning_rate': 8.271717131637689e-06, 'epoch': 1.14} {'loss': 0.2807, 'learning_rate': 8.271386210760788e-06, 'epoch': 1.14} {'loss': 0.2675, 'learning_rate': 8.271055291835163e-06, 'epoch': 1.14} {'loss': 0.42, 'learning_rate': 8.270724374861188e-06, 'epoch': 1.14} {'loss': 0.2472, 'learning_rate': 8.270393459839236e-06, 'epoch': 1.14} {'loss': 0.3347, 'learning_rate': 8.270062546769681e-06, 'epoch': 1.14} {'loss': 0.3529, 'learning_rate': 8.269731635652898e-06, 'epoch': 1.14} {'loss': 0.3555, 'learning_rate': 8.269400726489257e-06, 'epoch': 1.14} {'loss': 0.3997, 'learning_rate': 8.269069819279134e-06, 'epoch': 1.14} {'loss': 0.2836, 'learning_rate': 8.268738914022903e-06, 'epoch': 1.14} {'loss': 0.2258, 'learning_rate': 8.268408010720934e-06, 'epoch': 1.14} {'loss': 0.4242, 'learning_rate': 8.268077109373604e-06, 'epoch': 1.14} {'loss': 0.3107, 'learning_rate': 8.267746209981287e-06, 'epoch': 1.14} {'loss': 0.36, 'learning_rate': 8.267415312544354e-06, 'epoch': 1.14} {'loss': 0.2713, 'learning_rate': 8.26708441706318e-06, 'epoch': 1.14} {'loss': 0.2085, 'learning_rate': 8.266753523538137e-06, 'epoch': 1.14} {'loss': 0.266, 'learning_rate': 8.266422631969601e-06, 'epoch': 1.14} {'loss': 0.2907, 'learning_rate': 8.266091742357945e-06, 'epoch': 1.14} {'loss': 0.3494, 'learning_rate': 8.265760854703539e-06, 'epoch': 1.14} {'loss': 0.2857, 'learning_rate': 8.265429969006764e-06, 'epoch': 1.14} {'loss': 0.228, 'learning_rate': 8.265099085267985e-06, 'epoch': 1.14} {'loss': 0.291, 'learning_rate': 8.26476820348758e-06, 'epoch': 1.14} {'loss': 0.276, 'learning_rate': 8.264437323665922e-06, 'epoch': 1.14} {'loss': 0.3045, 'learning_rate': 8.264106445803383e-06, 'epoch': 1.14} {'loss': 0.4075, 'learning_rate': 8.263775569900339e-06, 'epoch': 1.14} {'loss': 0.2824, 'learning_rate': 8.263444695957162e-06, 'epoch': 1.14} {'loss': 0.2962, 'learning_rate': 8.263113823974225e-06, 'epoch': 1.14} {'loss': 0.3231, 'learning_rate': 8.262782953951903e-06, 'epoch': 1.14} {'loss': 0.2986, 'learning_rate': 8.262452085890567e-06, 'epoch': 1.14} {'loss': 0.2957, 'learning_rate': 8.262121219790594e-06, 'epoch': 1.14} {'loss': 0.3924, 'learning_rate': 8.261790355652355e-06, 'epoch': 1.14} {'loss': 0.4671, 'learning_rate': 8.261459493476223e-06, 'epoch': 1.14} {'loss': 0.5795, 'learning_rate': 8.261128633262578e-06, 'epoch': 1.14} {'loss': 0.2657, 'learning_rate': 8.260797775011783e-06, 'epoch': 1.14} {'loss': 0.3654, 'learning_rate': 8.260466918724219e-06, 'epoch': 1.14} {'loss': 0.4429, 'learning_rate': 8.260136064400255e-06, 'epoch': 1.14} {'loss': 0.2862, 'learning_rate': 8.259805212040265e-06, 'epoch': 1.14} {'loss': 0.3546, 'learning_rate': 8.259474361644628e-06, 'epoch': 1.14} {'loss': 0.3662, 'learning_rate': 8.259143513213712e-06, 'epoch': 1.14} {'loss': 0.3155, 'learning_rate': 8.25881266674789e-06, 'epoch': 1.14} {'loss': 0.3381, 'learning_rate': 8.25848182224754e-06, 'epoch': 1.14} {'loss': 0.3872, 'learning_rate': 8.258150979713032e-06, 'epoch': 1.14} {'loss': 0.2386, 'learning_rate': 8.257820139144737e-06, 'epoch': 1.14} {'loss': 0.3862, 'learning_rate': 8.257489300543036e-06, 'epoch': 1.14} {'loss': 0.4036, 'learning_rate': 8.257158463908296e-06, 'epoch': 1.14} {'loss': 0.3623, 'learning_rate': 8.256827629240896e-06, 'epoch': 1.14} {'loss': 0.3838, 'learning_rate': 8.256496796541202e-06, 'epoch': 1.14} {'loss': 0.2945, 'learning_rate': 8.256165965809596e-06, 'epoch': 1.14} {'loss': 0.4878, 'learning_rate': 8.255835137046443e-06, 'epoch': 1.14} {'loss': 0.4317, 'learning_rate': 8.255504310252122e-06, 'epoch': 1.14} {'loss': 0.2783, 'learning_rate': 8.255173485427004e-06, 'epoch': 1.14} {'loss': 0.2117, 'learning_rate': 8.254842662571464e-06, 'epoch': 1.14} {'loss': 0.2836, 'learning_rate': 8.254511841685876e-06, 'epoch': 1.14} {'loss': 0.3244, 'learning_rate': 8.254181022770613e-06, 'epoch': 1.14} {'loss': 0.2587, 'learning_rate': 8.253850205826046e-06, 'epoch': 1.14} {'loss': 0.3187, 'learning_rate': 8.25351939085255e-06, 'epoch': 1.14} {'loss': 0.3725, 'learning_rate': 8.2531885778505e-06, 'epoch': 1.14} {'loss': 0.3821, 'learning_rate': 8.252857766820266e-06, 'epoch': 1.14} {'loss': 0.2804, 'learning_rate': 8.252526957762224e-06, 'epoch': 1.14} {'loss': 0.3059, 'learning_rate': 8.252196150676746e-06, 'epoch': 1.14} {'loss': 0.2169, 'learning_rate': 8.251865345564207e-06, 'epoch': 1.14} {'loss': 0.311, 'learning_rate': 8.25153454242498e-06, 'epoch': 1.14} {'loss': 0.237, 'learning_rate': 8.251203741259437e-06, 'epoch': 1.14} {'loss': 0.3049, 'learning_rate': 8.250872942067951e-06, 'epoch': 1.14} {'loss': 0.3454, 'learning_rate': 8.2505421448509e-06, 'epoch': 1.14} {'loss': 0.3242, 'learning_rate': 8.250211349608652e-06, 'epoch': 1.14} {'loss': 0.4567, 'learning_rate': 8.249880556341586e-06, 'epoch': 1.14} {'loss': 0.5479, 'learning_rate': 8.249549765050068e-06, 'epoch': 1.14} {'loss': 0.4187, 'learning_rate': 8.249218975734479e-06, 'epoch': 1.14} {'loss': 0.355, 'learning_rate': 8.248888188395186e-06, 'epoch': 1.14} {'loss': 0.3617, 'learning_rate': 8.248557403032567e-06, 'epoch': 1.14} {'loss': 0.341, 'learning_rate': 8.248226619646991e-06, 'epoch': 1.14} {'loss': 0.3041, 'learning_rate': 8.247895838238837e-06, 'epoch': 1.14} {'loss': 0.3358, 'learning_rate': 8.247565058808474e-06, 'epoch': 1.14} {'loss': 0.3279, 'learning_rate': 8.247234281356277e-06, 'epoch': 1.14} {'loss': 0.3861, 'learning_rate': 8.24690350588262e-06, 'epoch': 1.14} {'loss': 0.4207, 'learning_rate': 8.246572732387875e-06, 'epoch': 1.14} {'loss': 0.3386, 'learning_rate': 8.246241960872415e-06, 'epoch': 1.14} {'loss': 0.1616, 'learning_rate': 8.245911191336615e-06, 'epoch': 1.14} {'loss': 0.3481, 'learning_rate': 8.24558042378085e-06, 'epoch': 1.14} {'loss': 0.2663, 'learning_rate': 8.245249658205487e-06, 'epoch': 1.14} {'loss': 0.4795, 'learning_rate': 8.244918894610907e-06, 'epoch': 1.14} {'loss': 0.5496, 'learning_rate': 8.244588132997477e-06, 'epoch': 1.14} {'loss': 0.3104, 'learning_rate': 8.244257373365575e-06, 'epoch': 1.14} {'loss': 0.278, 'learning_rate': 8.243926615715571e-06, 'epoch': 1.14} {'loss': 0.4042, 'learning_rate': 8.243595860047842e-06, 'epoch': 1.14} {'loss': 0.2111, 'learning_rate': 8.243265106362758e-06, 'epoch': 1.14} {'loss': 0.3009, 'learning_rate': 8.242934354660693e-06, 'epoch': 1.14} {'loss': 0.2922, 'learning_rate': 8.242603604942021e-06, 'epoch': 1.14} {'loss': 0.2596, 'learning_rate': 8.242272857207116e-06, 'epoch': 1.14} {'loss': 0.2504, 'learning_rate': 8.24194211145635e-06, 'epoch': 1.14} {'loss': 0.2401, 'learning_rate': 8.241611367690098e-06, 'epoch': 1.14} {'loss': 0.3053, 'learning_rate': 8.241280625908736e-06, 'epoch': 1.14} {'loss': 0.3393, 'learning_rate': 8.24094988611263e-06, 'epoch': 1.14} {'loss': 0.3448, 'learning_rate': 8.240619148302158e-06, 'epoch': 1.14} {'loss': 0.2754, 'learning_rate': 8.24028841247769e-06, 'epoch': 1.14} {'loss': 0.1358, 'learning_rate': 8.239957678639604e-06, 'epoch': 1.14} {'loss': 0.2576, 'learning_rate': 8.23962694678827e-06, 'epoch': 1.14} {'loss': 0.3474, 'learning_rate': 8.239296216924062e-06, 'epoch': 1.14} {'loss': 0.3609, 'learning_rate': 8.238965489047355e-06, 'epoch': 1.14} {'loss': 0.2571, 'learning_rate': 8.238634763158519e-06, 'epoch': 1.14} {'loss': 0.2527, 'learning_rate': 8.238304039257932e-06, 'epoch': 1.14} {'loss': 0.3882, 'learning_rate': 8.237973317345965e-06, 'epoch': 1.14} {'loss': 0.152, 'learning_rate': 8.237642597422989e-06, 'epoch': 1.14} {'loss': 0.3742, 'learning_rate': 8.23731187948938e-06, 'epoch': 1.14} {'loss': 0.3081, 'learning_rate': 8.236981163545512e-06, 'epoch': 1.14} {'loss': 0.2485, 'learning_rate': 8.236650449591756e-06, 'epoch': 1.14} {'loss': 0.3903, 'learning_rate': 8.236319737628486e-06, 'epoch': 1.14} {'loss': 0.2769, 'learning_rate': 8.235989027656077e-06, 'epoch': 1.14} {'loss': 0.3207, 'learning_rate': 8.235658319674898e-06, 'epoch': 1.14} {'loss': 0.4034, 'learning_rate': 8.235327613685327e-06, 'epoch': 1.14} {'loss': 0.373, 'learning_rate': 8.234996909687736e-06, 'epoch': 1.14} {'loss': 0.3432, 'learning_rate': 8.234666207682499e-06, 'epoch': 1.14} {'loss': 0.2229, 'learning_rate': 8.234335507669986e-06, 'epoch': 1.14} {'loss': 0.3874, 'learning_rate': 8.234004809650572e-06, 'epoch': 1.14} {'loss': 0.2769, 'learning_rate': 8.233674113624633e-06, 'epoch': 1.14} {'loss': 0.2135, 'learning_rate': 8.233343419592538e-06, 'epoch': 1.14} {'loss': 0.236, 'learning_rate': 8.233012727554664e-06, 'epoch': 1.14} {'loss': 0.318, 'learning_rate': 8.232682037511382e-06, 'epoch': 1.14} {'loss': 0.3323, 'learning_rate': 8.232351349463067e-06, 'epoch': 1.14} {'loss': 0.3624, 'learning_rate': 8.23202066341009e-06, 'epoch': 1.14} {'loss': 0.4201, 'learning_rate': 8.231689979352825e-06, 'epoch': 1.14} {'loss': 0.2373, 'learning_rate': 8.231359297291646e-06, 'epoch': 1.14} {'loss': 0.3427, 'learning_rate': 8.231028617226926e-06, 'epoch': 1.14} {'loss': 0.3598, 'learning_rate': 8.230697939159038e-06, 'epoch': 1.14} {'loss': 0.1293, 'learning_rate': 8.230367263088357e-06, 'epoch': 1.14} {'loss': 0.2741, 'learning_rate': 8.230036589015254e-06, 'epoch': 1.14} {'loss': 0.2501, 'learning_rate': 8.229705916940103e-06, 'epoch': 1.14} {'loss': 0.4393, 'learning_rate': 8.229375246863276e-06, 'epoch': 1.14} {'loss': 0.2864, 'learning_rate': 8.229044578785149e-06, 'epoch': 1.14} {'loss': 0.3741, 'learning_rate': 8.228713912706094e-06, 'epoch': 1.14} {'loss': 0.2998, 'learning_rate': 8.228383248626485e-06, 'epoch': 1.14} {'loss': 0.3005, 'learning_rate': 8.228052586546696e-06, 'epoch': 1.14} {'loss': 0.3659, 'learning_rate': 8.227721926467096e-06, 'epoch': 1.14} {'loss': 0.1703, 'learning_rate': 8.22739126838806e-06, 'epoch': 1.14} {'loss': 0.4082, 'learning_rate': 8.227060612309963e-06, 'epoch': 1.14} {'loss': 0.3591, 'learning_rate': 8.226729958233179e-06, 'epoch': 1.14} {'loss': 0.3545, 'learning_rate': 8.226399306158079e-06, 'epoch': 1.14} {'loss': 0.3352, 'learning_rate': 8.226068656085036e-06, 'epoch': 1.14} {'loss': 0.4894, 'learning_rate': 8.225738008014423e-06, 'epoch': 1.14} {'loss': 0.1925, 'learning_rate': 8.225407361946616e-06, 'epoch': 1.14} {'loss': 0.2995, 'learning_rate': 8.225076717881984e-06, 'epoch': 1.14} {'loss': 0.3154, 'learning_rate': 8.224746075820906e-06, 'epoch': 1.14} {'loss': 0.4042, 'learning_rate': 8.224415435763752e-06, 'epoch': 1.14} {'loss': 0.2725, 'learning_rate': 8.224084797710894e-06, 'epoch': 1.14} {'loss': 0.2784, 'learning_rate': 8.223754161662708e-06, 'epoch': 1.14} {'loss': 0.4293, 'learning_rate': 8.223423527619565e-06, 'epoch': 1.14} {'loss': 0.4938, 'learning_rate': 8.223092895581839e-06, 'epoch': 1.14} {'loss': 0.3673, 'learning_rate': 8.222762265549904e-06, 'epoch': 1.14} {'loss': 0.474, 'learning_rate': 8.222431637524131e-06, 'epoch': 1.14} {'loss': 0.3639, 'learning_rate': 8.222101011504896e-06, 'epoch': 1.14} {'loss': 0.3675, 'learning_rate': 8.22177038749257e-06, 'epoch': 1.14} {'loss': 0.3369, 'learning_rate': 8.22143976548753e-06, 'epoch': 1.14} {'loss': 0.2839, 'learning_rate': 8.221109145490144e-06, 'epoch': 1.14} {'loss': 0.3825, 'learning_rate': 8.220778527500787e-06, 'epoch': 1.14} {'loss': 0.2965, 'learning_rate': 8.220447911519833e-06, 'epoch': 1.14} {'loss': 0.3266, 'learning_rate': 8.220117297547654e-06, 'epoch': 1.14} {'loss': 0.2586, 'learning_rate': 8.219786685584626e-06, 'epoch': 1.14} {'loss': 0.3605, 'learning_rate': 8.219456075631117e-06, 'epoch': 1.14} {'loss': 0.3339, 'learning_rate': 8.219125467687508e-06, 'epoch': 1.14} {'loss': 0.4482, 'learning_rate': 8.218794861754165e-06, 'epoch': 1.14} {'loss': 0.5183, 'learning_rate': 8.218464257831465e-06, 'epoch': 1.14} {'loss': 0.3666, 'learning_rate': 8.218133655919779e-06, 'epoch': 1.14} {'loss': 0.3827, 'learning_rate': 8.21780305601948e-06, 'epoch': 1.14} {'loss': 0.2869, 'learning_rate': 8.217472458130947e-06, 'epoch': 1.14} {'loss': 0.3145, 'learning_rate': 8.217141862254546e-06, 'epoch': 1.14} {'loss': 0.3535, 'learning_rate': 8.216811268390654e-06, 'epoch': 1.14} {'loss': 0.3683, 'learning_rate': 8.21648067653964e-06, 'epoch': 1.14} {'loss': 0.2529, 'learning_rate': 8.216150086701883e-06, 'epoch': 1.14} {'loss': 0.2872, 'learning_rate': 8.215819498877751e-06, 'epoch': 1.14} {'loss': 0.3896, 'learning_rate': 8.215488913067622e-06, 'epoch': 1.14} {'loss': 0.2465, 'learning_rate': 8.215158329271863e-06, 'epoch': 1.14} {'loss': 0.2971, 'learning_rate': 8.214827747490855e-06, 'epoch': 1.14} {'loss': 0.2165, 'learning_rate': 8.214497167724964e-06, 'epoch': 1.14} {'loss': 0.2156, 'learning_rate': 8.214166589974569e-06, 'epoch': 1.14} {'loss': 0.4127, 'learning_rate': 8.213836014240038e-06, 'epoch': 1.14} {'loss': 0.3234, 'learning_rate': 8.213505440521748e-06, 'epoch': 1.14} {'loss': 0.2685, 'learning_rate': 8.213174868820068e-06, 'epoch': 1.14} {'loss': 0.262, 'learning_rate': 8.212844299135376e-06, 'epoch': 1.14} {'loss': 0.367, 'learning_rate': 8.212513731468045e-06, 'epoch': 1.14} {'loss': 0.2729, 'learning_rate': 8.212183165818444e-06, 'epoch': 1.14} {'loss': 0.3074, 'learning_rate': 8.211852602186948e-06, 'epoch': 1.14} {'loss': 0.3097, 'learning_rate': 8.21152204057393e-06, 'epoch': 1.14} {'loss': 0.3775, 'learning_rate': 8.211191480979764e-06, 'epoch': 1.14} {'loss': 0.4537, 'learning_rate': 8.210860923404823e-06, 'epoch': 1.14} {'loss': 0.3241, 'learning_rate': 8.210530367849478e-06, 'epoch': 1.14} {'loss': 0.1924, 'learning_rate': 8.210199814314105e-06, 'epoch': 1.14} {'loss': 0.2371, 'learning_rate': 8.209869262799076e-06, 'epoch': 1.14} {'loss': 0.3209, 'learning_rate': 8.209538713304765e-06, 'epoch': 1.14} {'loss': 0.3695, 'learning_rate': 8.209208165831542e-06, 'epoch': 1.14} {'loss': 0.2593, 'learning_rate': 8.208877620379784e-06, 'epoch': 1.14} {'loss': 0.3189, 'learning_rate': 8.208547076949865e-06, 'epoch': 1.14} {'loss': 0.176, 'learning_rate': 8.208216535542154e-06, 'epoch': 1.14} {'loss': 0.3699, 'learning_rate': 8.207885996157025e-06, 'epoch': 1.14} {'loss': 0.3428, 'learning_rate': 8.207555458794853e-06, 'epoch': 1.14} {'loss': 0.2308, 'learning_rate': 8.20722492345601e-06, 'epoch': 1.14} {'loss': 0.3703, 'learning_rate': 8.206894390140868e-06, 'epoch': 1.14} {'loss': 0.3898, 'learning_rate': 8.206563858849801e-06, 'epoch': 1.14} {'loss': 0.3634, 'learning_rate': 8.206233329583183e-06, 'epoch': 1.14} {'loss': 0.2828, 'learning_rate': 8.205902802341386e-06, 'epoch': 1.14} {'loss': 0.3134, 'learning_rate': 8.205572277124784e-06, 'epoch': 1.14} {'loss': 0.3598, 'learning_rate': 8.20524175393375e-06, 'epoch': 1.14} {'loss': 0.2268, 'learning_rate': 8.204911232768655e-06, 'epoch': 1.14} {'loss': 0.3696, 'learning_rate': 8.204580713629876e-06, 'epoch': 1.14} {'loss': 0.4067, 'learning_rate': 8.204250196517783e-06, 'epoch': 1.14} {'loss': 0.3242, 'learning_rate': 8.203919681432753e-06, 'epoch': 1.14} {'loss': 0.232, 'learning_rate': 8.203589168375153e-06, 'epoch': 1.14} {'loss': 0.3435, 'learning_rate': 8.20325865734536e-06, 'epoch': 1.14} {'loss': 0.2457, 'learning_rate': 8.202928148343745e-06, 'epoch': 1.14} {'loss': 0.3959, 'learning_rate': 8.202597641370685e-06, 'epoch': 1.14} {'loss': 0.4466, 'learning_rate': 8.202267136426548e-06, 'epoch': 1.14} {'loss': 0.3249, 'learning_rate': 8.201936633511712e-06, 'epoch': 1.14} {'loss': 0.3932, 'learning_rate': 8.201606132626545e-06, 'epoch': 1.14} {'loss': 0.3616, 'learning_rate': 8.201275633771424e-06, 'epoch': 1.14} {'loss': 0.293, 'learning_rate': 8.20094513694672e-06, 'epoch': 1.14} {'loss': 0.2712, 'learning_rate': 8.200614642152807e-06, 'epoch': 1.14} {'loss': 0.3359, 'learning_rate': 8.200284149390059e-06, 'epoch': 1.14} {'loss': 0.3922, 'learning_rate': 8.199953658658846e-06, 'epoch': 1.14} {'loss': 0.3252, 'learning_rate': 8.199623169959548e-06, 'epoch': 1.14} {'loss': 0.3502, 'learning_rate': 8.199292683292528e-06, 'epoch': 1.14} {'loss': 0.3228, 'learning_rate': 8.198962198658166e-06, 'epoch': 1.14} {'loss': 0.3674, 'learning_rate': 8.198631716056832e-06, 'epoch': 1.14} {'loss': 0.3937, 'learning_rate': 8.198301235488902e-06, 'epoch': 1.14} {'loss': 0.2338, 'learning_rate': 8.197970756954745e-06, 'epoch': 1.14} {'loss': 0.4521, 'learning_rate': 8.197640280454737e-06, 'epoch': 1.14} {'loss': 0.2825, 'learning_rate': 8.19730980598925e-06, 'epoch': 1.14} {'loss': 0.3864, 'learning_rate': 8.19697933355866e-06, 'epoch': 1.14} {'loss': 0.3153, 'learning_rate': 8.196648863163336e-06, 'epoch': 1.14} {'loss': 0.2664, 'learning_rate': 8.196318394803652e-06, 'epoch': 1.14} {'loss': 0.3451, 'learning_rate': 8.195987928479982e-06, 'epoch': 1.14} {'loss': 0.1839, 'learning_rate': 8.195657464192697e-06, 'epoch': 1.14} {'loss': 0.485, 'learning_rate': 8.195327001942175e-06, 'epoch': 1.14} {'loss': 0.3542, 'learning_rate': 8.194996541728784e-06, 'epoch': 1.14} {'loss': 0.2698, 'learning_rate': 8.194666083552899e-06, 'epoch': 1.14} {'loss': 0.3093, 'learning_rate': 8.194335627414891e-06, 'epoch': 1.14} {'loss': 0.33, 'learning_rate': 8.194005173315137e-06, 'epoch': 1.14} {'loss': 0.3718, 'learning_rate': 8.193674721254007e-06, 'epoch': 1.14} {'loss': 0.2479, 'learning_rate': 8.193344271231873e-06, 'epoch': 1.14} {'loss': 0.3363, 'learning_rate': 8.193013823249112e-06, 'epoch': 1.14} {'loss': 0.3754, 'learning_rate': 8.192683377306094e-06, 'epoch': 1.14} {'loss': 0.4679, 'learning_rate': 8.192352933403191e-06, 'epoch': 1.14} {'loss': 0.3015, 'learning_rate': 8.192022491540779e-06, 'epoch': 1.14} {'loss': 0.3601, 'learning_rate': 8.19169205171923e-06, 'epoch': 1.14} {'loss': 0.2883, 'learning_rate': 8.191361613938917e-06, 'epoch': 1.14} {'loss': 0.3428, 'learning_rate': 8.191031178200213e-06, 'epoch': 1.14} {'loss': 0.3045, 'learning_rate': 8.19070074450349e-06, 'epoch': 1.14} {'loss': 0.2025, 'learning_rate': 8.190370312849124e-06, 'epoch': 1.14} {'loss': 0.3201, 'learning_rate': 8.190039883237483e-06, 'epoch': 1.14} {'loss': 0.2939, 'learning_rate': 8.189709455668943e-06, 'epoch': 1.14} {'loss': 0.2081, 'learning_rate': 8.189379030143877e-06, 'epoch': 1.14} {'loss': 0.3699, 'learning_rate': 8.18904860666266e-06, 'epoch': 1.14} {'loss': 0.3465, 'learning_rate': 8.188718185225661e-06, 'epoch': 1.14} {'loss': 0.4556, 'learning_rate': 8.188387765833257e-06, 'epoch': 1.14} {'loss': 0.4396, 'learning_rate': 8.188057348485817e-06, 'epoch': 1.14} {'loss': 0.4677, 'learning_rate': 8.187726933183715e-06, 'epoch': 1.14} {'loss': 0.398, 'learning_rate': 8.187396519927327e-06, 'epoch': 1.14} {'loss': 0.2262, 'learning_rate': 8.187066108717021e-06, 'epoch': 1.14} {'loss': 0.4171, 'learning_rate': 8.186735699553173e-06, 'epoch': 1.14} {'loss': 0.2932, 'learning_rate': 8.186405292436155e-06, 'epoch': 1.14} {'loss': 0.3833, 'learning_rate': 8.186074887366342e-06, 'epoch': 1.14} {'loss': 0.3498, 'learning_rate': 8.185744484344106e-06, 'epoch': 1.14} {'loss': 0.268, 'learning_rate': 8.185414083369819e-06, 'epoch': 1.14} {'loss': 0.2087, 'learning_rate': 8.185083684443852e-06, 'epoch': 1.14} {'loss': 0.3234, 'learning_rate': 8.184753287566584e-06, 'epoch': 1.14} {'loss': 0.3588, 'learning_rate': 8.184422892738382e-06, 'epoch': 1.14} {'loss': 0.3188, 'learning_rate': 8.184092499959623e-06, 'epoch': 1.14} {'loss': 0.3343, 'learning_rate': 8.18376210923068e-06, 'epoch': 1.14} {'loss': 0.4052, 'learning_rate': 8.18343172055192e-06, 'epoch': 1.14} {'loss': 0.3927, 'learning_rate': 8.183101333923723e-06, 'epoch': 1.14} {'loss': 0.3064, 'learning_rate': 8.182770949346457e-06, 'epoch': 1.14} {'loss': 0.3454, 'learning_rate': 8.182440566820497e-06, 'epoch': 1.14} {'loss': 0.3558, 'learning_rate': 8.182110186346217e-06, 'epoch': 1.14} {'loss': 0.2241, 'learning_rate': 8.181779807923989e-06, 'epoch': 1.14} {'loss': 0.3281, 'learning_rate': 8.181449431554184e-06, 'epoch': 1.14} {'loss': 0.2962, 'learning_rate': 8.18111905723718e-06, 'epoch': 1.14} {'loss': 0.266, 'learning_rate': 8.180788684973344e-06, 'epoch': 1.14} {'loss': 0.5118, 'learning_rate': 8.180458314763053e-06, 'epoch': 1.14} {'loss': 0.3809, 'learning_rate': 8.180127946606678e-06, 'epoch': 1.14} {'loss': 0.4591, 'learning_rate': 8.179797580504595e-06, 'epoch': 1.14} {'loss': 0.4673, 'learning_rate': 8.179467216457172e-06, 'epoch': 1.14} {'loss': 0.3551, 'learning_rate': 8.179136854464785e-06, 'epoch': 1.14} {'loss': 0.2723, 'learning_rate': 8.178806494527806e-06, 'epoch': 1.14} {'loss': 0.3764, 'learning_rate': 8.178476136646607e-06, 'epoch': 1.14} {'loss': 0.3385, 'learning_rate': 8.178145780821563e-06, 'epoch': 1.14} {'loss': 0.3138, 'learning_rate': 8.177815427053047e-06, 'epoch': 1.14} {'loss': 0.3398, 'learning_rate': 8.177485075341427e-06, 'epoch': 1.14} {'loss': 0.3297, 'learning_rate': 8.177154725687085e-06, 'epoch': 1.14} {'loss': 0.4325, 'learning_rate': 8.176824378090386e-06, 'epoch': 1.14} {'loss': 0.3035, 'learning_rate': 8.176494032551706e-06, 'epoch': 1.14} {'loss': 0.3296, 'learning_rate': 8.176163689071416e-06, 'epoch': 1.14} {'loss': 0.4131, 'learning_rate': 8.175833347649892e-06, 'epoch': 1.14} {'loss': 0.4291, 'learning_rate': 8.175503008287506e-06, 'epoch': 1.14} {'loss': 0.4533, 'learning_rate': 8.17517267098463e-06, 'epoch': 1.14} {'loss': 0.3594, 'learning_rate': 8.174842335741636e-06, 'epoch': 1.14} {'loss': 0.1966, 'learning_rate': 8.174512002558899e-06, 'epoch': 1.14} {'loss': 0.354, 'learning_rate': 8.17418167143679e-06, 'epoch': 1.14} {'loss': 0.4021, 'learning_rate': 8.173851342375682e-06, 'epoch': 1.14} {'loss': 0.3415, 'learning_rate': 8.17352101537595e-06, 'epoch': 1.14} {'loss': 0.2557, 'learning_rate': 8.173190690437962e-06, 'epoch': 1.14} {'loss': 0.4617, 'learning_rate': 8.172860367562097e-06, 'epoch': 1.14} {'loss': 0.4269, 'learning_rate': 8.172530046748726e-06, 'epoch': 1.14} {'loss': 0.3641, 'learning_rate': 8.17219972799822e-06, 'epoch': 1.14} {'loss': 0.2305, 'learning_rate': 8.171869411310953e-06, 'epoch': 1.14} {'loss': 0.1402, 'learning_rate': 8.171539096687298e-06, 'epoch': 1.14} {'loss': 0.3627, 'learning_rate': 8.17120878412763e-06, 'epoch': 1.14} {'loss': 0.3412, 'learning_rate': 8.170878473632318e-06, 'epoch': 1.14} {'loss': 0.4737, 'learning_rate': 8.170548165201735e-06, 'epoch': 1.14} {'loss': 0.3495, 'learning_rate': 8.170217858836256e-06, 'epoch': 1.14} {'loss': 0.3126, 'learning_rate': 8.169887554536252e-06, 'epoch': 1.14} {'loss': 0.2884, 'learning_rate': 8.169557252302099e-06, 'epoch': 1.14} {'loss': 0.394, 'learning_rate': 8.169226952134165e-06, 'epoch': 1.14} {'loss': 0.3486, 'learning_rate': 8.168896654032827e-06, 'epoch': 1.14} {'loss': 0.2981, 'learning_rate': 8.168566357998457e-06, 'epoch': 1.14} {'loss': 0.3804, 'learning_rate': 8.168236064031428e-06, 'epoch': 1.14} {'loss': 0.4188, 'learning_rate': 8.16790577213211e-06, 'epoch': 1.14} {'loss': 0.1451, 'learning_rate': 8.16757548230088e-06, 'epoch': 1.14} {'loss': 0.3816, 'learning_rate': 8.167245194538106e-06, 'epoch': 1.14} {'loss': 0.2044, 'learning_rate': 8.166914908844168e-06, 'epoch': 1.14} {'loss': 0.4316, 'learning_rate': 8.166584625219434e-06, 'epoch': 1.14} {'loss': 0.2444, 'learning_rate': 8.166254343664275e-06, 'epoch': 1.14} {'loss': 0.1581, 'learning_rate': 8.165924064179066e-06, 'epoch': 1.14} {'loss': 0.4141, 'learning_rate': 8.16559378676418e-06, 'epoch': 1.14} {'loss': 0.4214, 'learning_rate': 8.165263511419991e-06, 'epoch': 1.14} {'loss': 0.2817, 'learning_rate': 8.16493323814687e-06, 'epoch': 1.14} {'loss': 0.4269, 'learning_rate': 8.16460296694519e-06, 'epoch': 1.14} {'loss': 0.3685, 'learning_rate': 8.164272697815325e-06, 'epoch': 1.14} {'loss': 0.3044, 'learning_rate': 8.163942430757645e-06, 'epoch': 1.14} {'loss': 0.2627, 'learning_rate': 8.163612165772527e-06, 'epoch': 1.15} {'loss': 0.3773, 'learning_rate': 8.163281902860342e-06, 'epoch': 1.15} {'loss': 0.4916, 'learning_rate': 8.162951642021462e-06, 'epoch': 1.15} {'loss': 0.3358, 'learning_rate': 8.162621383256262e-06, 'epoch': 1.15} {'loss': 0.4182, 'learning_rate': 8.16229112656511e-06, 'epoch': 1.15} {'loss': 0.4894, 'learning_rate': 8.161960871948382e-06, 'epoch': 1.15} {'loss': 0.2474, 'learning_rate': 8.161630619406451e-06, 'epoch': 1.15} {'loss': 0.3396, 'learning_rate': 8.16130036893969e-06, 'epoch': 1.15} {'loss': 0.392, 'learning_rate': 8.160970120548472e-06, 'epoch': 1.15} {'loss': 0.3425, 'learning_rate': 8.160639874233169e-06, 'epoch': 1.15} {'loss': 0.375, 'learning_rate': 8.160309629994151e-06, 'epoch': 1.15} {'loss': 0.4802, 'learning_rate': 8.159979387831796e-06, 'epoch': 1.15} {'loss': 0.3827, 'learning_rate': 8.159649147746474e-06, 'epoch': 1.15} {'loss': 0.3267, 'learning_rate': 8.159318909738557e-06, 'epoch': 1.15} {'loss': 0.3018, 'learning_rate': 8.15898867380842e-06, 'epoch': 1.15} {'loss': 0.2939, 'learning_rate': 8.158658439956433e-06, 'epoch': 1.15} {'loss': 0.2398, 'learning_rate': 8.158328208182973e-06, 'epoch': 1.15} {'loss': 0.3124, 'learning_rate': 8.15799797848841e-06, 'epoch': 1.15} {'loss': 0.3536, 'learning_rate': 8.157667750873116e-06, 'epoch': 1.15} {'loss': 0.3647, 'learning_rate': 8.157337525337466e-06, 'epoch': 1.15} {'loss': 0.3547, 'learning_rate': 8.15700730188183e-06, 'epoch': 1.15} {'loss': 0.2351, 'learning_rate': 8.156677080506583e-06, 'epoch': 1.15} {'loss': 0.3168, 'learning_rate': 8.156346861212099e-06, 'epoch': 1.15} {'loss': 0.1489, 'learning_rate': 8.156016643998745e-06, 'epoch': 1.15} {'loss': 0.3069, 'learning_rate': 8.155686428866902e-06, 'epoch': 1.15} {'loss': 0.3317, 'learning_rate': 8.155356215816935e-06, 'epoch': 1.15} {'loss': 0.3368, 'learning_rate': 8.155026004849221e-06, 'epoch': 1.15} {'loss': 0.2276, 'learning_rate': 8.154695795964131e-06, 'epoch': 1.15} {'loss': 0.3354, 'learning_rate': 8.15436558916204e-06, 'epoch': 1.15} {'loss': 0.3297, 'learning_rate': 8.154035384443319e-06, 'epoch': 1.15} {'loss': 0.4082, 'learning_rate': 8.153705181808341e-06, 'epoch': 1.15} {'loss': 0.2795, 'learning_rate': 8.153374981257479e-06, 'epoch': 1.15} {'loss': 0.4238, 'learning_rate': 8.153044782791102e-06, 'epoch': 1.15} {'loss': 0.3982, 'learning_rate': 8.15271458640959e-06, 'epoch': 1.15} {'loss': 0.3341, 'learning_rate': 8.152384392113311e-06, 'epoch': 1.15} {'loss': 0.3811, 'learning_rate': 8.152054199902639e-06, 'epoch': 1.15} {'loss': 0.3145, 'learning_rate': 8.151724009777946e-06, 'epoch': 1.15} {'loss': 0.3701, 'learning_rate': 8.151393821739607e-06, 'epoch': 1.15} {'loss': 0.2188, 'learning_rate': 8.15106363578799e-06, 'epoch': 1.15} {'loss': 0.2604, 'learning_rate': 8.150733451923473e-06, 'epoch': 1.15} {'loss': 0.2594, 'learning_rate': 8.150403270146424e-06, 'epoch': 1.15} {'loss': 0.2741, 'learning_rate': 8.15007309045722e-06, 'epoch': 1.15} {'loss': 0.3577, 'learning_rate': 8.149742912856229e-06, 'epoch': 1.15} {'loss': 0.5043, 'learning_rate': 8.149412737343829e-06, 'epoch': 1.15} {'loss': 0.3568, 'learning_rate': 8.14908256392039e-06, 'epoch': 1.15} {'loss': 0.2734, 'learning_rate': 8.148752392586282e-06, 'epoch': 1.15} {'loss': 0.4381, 'learning_rate': 8.148422223341883e-06, 'epoch': 1.15} {'loss': 0.2553, 'learning_rate': 8.148092056187562e-06, 'epoch': 1.15} {'loss': 0.3602, 'learning_rate': 8.147761891123694e-06, 'epoch': 1.15} {'loss': 0.3354, 'learning_rate': 8.147431728150649e-06, 'epoch': 1.15} {'loss': 0.4059, 'learning_rate': 8.147101567268805e-06, 'epoch': 1.15} {'loss': 0.3989, 'learning_rate': 8.146771408478529e-06, 'epoch': 1.15} {'loss': 0.3793, 'learning_rate': 8.146441251780196e-06, 'epoch': 1.15} {'loss': 0.2588, 'learning_rate': 8.146111097174176e-06, 'epoch': 1.15} {'loss': 0.2674, 'learning_rate': 8.145780944660846e-06, 'epoch': 1.15} {'loss': 0.2407, 'learning_rate': 8.145450794240575e-06, 'epoch': 1.15} {'loss': 0.3063, 'learning_rate': 8.14512064591374e-06, 'epoch': 1.15} {'loss': 0.3729, 'learning_rate': 8.144790499680709e-06, 'epoch': 1.15} {'loss': 0.3455, 'learning_rate': 8.144460355541858e-06, 'epoch': 1.15} {'loss': 0.2705, 'learning_rate': 8.144130213497557e-06, 'epoch': 1.15} {'loss': 0.3519, 'learning_rate': 8.14380007354818e-06, 'epoch': 1.15} {'loss': 0.256, 'learning_rate': 8.143469935694101e-06, 'epoch': 1.15} {'loss': 0.4405, 'learning_rate': 8.143139799935693e-06, 'epoch': 1.15} {'loss': 0.3923, 'learning_rate': 8.142809666273325e-06, 'epoch': 1.15} {'loss': 0.3653, 'learning_rate': 8.142479534707373e-06, 'epoch': 1.15} {'loss': 0.3706, 'learning_rate': 8.142149405238206e-06, 'epoch': 1.15} {'loss': 0.2718, 'learning_rate': 8.141819277866201e-06, 'epoch': 1.15} {'loss': 0.2523, 'learning_rate': 8.141489152591728e-06, 'epoch': 1.15} {'loss': 0.3255, 'learning_rate': 8.14115902941516e-06, 'epoch': 1.15} {'loss': 0.2752, 'learning_rate': 8.14082890833687e-06, 'epoch': 1.15} {'loss': 0.4877, 'learning_rate': 8.140498789357231e-06, 'epoch': 1.15} {'loss': 0.3459, 'learning_rate': 8.140168672476616e-06, 'epoch': 1.15} {'loss': 0.3811, 'learning_rate': 8.139838557695395e-06, 'epoch': 1.15} {'loss': 0.2869, 'learning_rate': 8.139508445013944e-06, 'epoch': 1.15} {'loss': 0.3475, 'learning_rate': 8.139178334432634e-06, 'epoch': 1.15} {'loss': 0.4128, 'learning_rate': 8.138848225951838e-06, 'epoch': 1.15} {'loss': 0.3489, 'learning_rate': 8.138518119571927e-06, 'epoch': 1.15} {'loss': 0.3128, 'learning_rate': 8.138188015293278e-06, 'epoch': 1.15} {'loss': 0.2958, 'learning_rate': 8.13785791311626e-06, 'epoch': 1.15} {'loss': 0.1638, 'learning_rate': 8.137527813041244e-06, 'epoch': 1.15} {'loss': 0.2803, 'learning_rate': 8.137197715068606e-06, 'epoch': 1.15} {'loss': 0.3069, 'learning_rate': 8.136867619198718e-06, 'epoch': 1.15} {'loss': 0.3925, 'learning_rate': 8.13653752543195e-06, 'epoch': 1.15} {'loss': 0.2318, 'learning_rate': 8.13620743376868e-06, 'epoch': 1.15} {'loss': 0.4288, 'learning_rate': 8.135877344209275e-06, 'epoch': 1.15} {'loss': 0.3973, 'learning_rate': 8.135547256754112e-06, 'epoch': 1.15} {'loss': 0.282, 'learning_rate': 8.13521717140356e-06, 'epoch': 1.15} {'loss': 0.3677, 'learning_rate': 8.134887088157995e-06, 'epoch': 1.15} {'loss': 0.3613, 'learning_rate': 8.134557007017786e-06, 'epoch': 1.15} {'loss': 0.2652, 'learning_rate': 8.134226927983307e-06, 'epoch': 1.15} {'loss': 0.3516, 'learning_rate': 8.133896851054935e-06, 'epoch': 1.15} {'loss': 0.3689, 'learning_rate': 8.133566776233036e-06, 'epoch': 1.15} {'loss': 0.3158, 'learning_rate': 8.133236703517984e-06, 'epoch': 1.15} {'loss': 0.363, 'learning_rate': 8.132906632910153e-06, 'epoch': 1.15} {'loss': 0.3768, 'learning_rate': 8.132576564409916e-06, 'epoch': 1.15} {'loss': 0.3751, 'learning_rate': 8.132246498017645e-06, 'epoch': 1.15} {'loss': 0.4141, 'learning_rate': 8.131916433733712e-06, 'epoch': 1.15} {'loss': 0.2594, 'learning_rate': 8.13158637155849e-06, 'epoch': 1.15} {'loss': 0.4915, 'learning_rate': 8.131256311492352e-06, 'epoch': 1.15} {'loss': 0.2982, 'learning_rate': 8.130926253535672e-06, 'epoch': 1.15} {'loss': 0.3124, 'learning_rate': 8.130596197688818e-06, 'epoch': 1.15} {'loss': 0.3843, 'learning_rate': 8.130266143952166e-06, 'epoch': 1.15} {'loss': 0.2011, 'learning_rate': 8.12993609232609e-06, 'epoch': 1.15} {'loss': 0.3315, 'learning_rate': 8.129606042810962e-06, 'epoch': 1.15} {'loss': 0.417, 'learning_rate': 8.12927599540715e-06, 'epoch': 1.15} {'loss': 0.3697, 'learning_rate': 8.12894595011503e-06, 'epoch': 1.15} {'loss': 0.2592, 'learning_rate': 8.128615906934973e-06, 'epoch': 1.15} {'loss': 0.4541, 'learning_rate': 8.128285865867355e-06, 'epoch': 1.15} {'loss': 0.312, 'learning_rate': 8.127955826912545e-06, 'epoch': 1.15} {'loss': 0.353, 'learning_rate': 8.127625790070917e-06, 'epoch': 1.15} {'loss': 0.2558, 'learning_rate': 8.127295755342843e-06, 'epoch': 1.15} {'loss': 0.3131, 'learning_rate': 8.126965722728697e-06, 'epoch': 1.15} {'loss': 0.4118, 'learning_rate': 8.126635692228849e-06, 'epoch': 1.15} {'loss': 0.402, 'learning_rate': 8.126305663843674e-06, 'epoch': 1.15} {'loss': 0.4357, 'learning_rate': 8.125975637573544e-06, 'epoch': 1.15} {'loss': 0.3178, 'learning_rate': 8.12564561341883e-06, 'epoch': 1.15} {'loss': 0.2894, 'learning_rate': 8.125315591379907e-06, 'epoch': 1.15} {'loss': 0.2425, 'learning_rate': 8.124985571457146e-06, 'epoch': 1.15} {'loss': 0.4297, 'learning_rate': 8.12465555365092e-06, 'epoch': 1.15} {'loss': 0.337, 'learning_rate': 8.124325537961598e-06, 'epoch': 1.15} {'loss': 0.3992, 'learning_rate': 8.123995524389561e-06, 'epoch': 1.15} {'loss': 0.505, 'learning_rate': 8.123665512935174e-06, 'epoch': 1.15} {'loss': 0.3694, 'learning_rate': 8.123335503598812e-06, 'epoch': 1.15} {'loss': 0.3058, 'learning_rate': 8.123005496380848e-06, 'epoch': 1.15} {'loss': 0.2521, 'learning_rate': 8.122675491281653e-06, 'epoch': 1.15} {'loss': 0.2652, 'learning_rate': 8.1223454883016e-06, 'epoch': 1.15} {'loss': 0.4499, 'learning_rate': 8.122015487441063e-06, 'epoch': 1.15} {'loss': 0.5093, 'learning_rate': 8.121685488700412e-06, 'epoch': 1.15} {'loss': 0.242, 'learning_rate': 8.121355492080023e-06, 'epoch': 1.15} {'loss': 0.3637, 'learning_rate': 8.121025497580264e-06, 'epoch': 1.15} {'loss': 0.2739, 'learning_rate': 8.120695505201512e-06, 'epoch': 1.15} {'loss': 0.3641, 'learning_rate': 8.120365514944135e-06, 'epoch': 1.15} {'loss': 0.4016, 'learning_rate': 8.12003552680851e-06, 'epoch': 1.15} {'loss': 0.3835, 'learning_rate': 8.119705540795007e-06, 'epoch': 1.15} {'loss': 0.5998, 'learning_rate': 8.119375556903997e-06, 'epoch': 1.15} {'loss': 0.3742, 'learning_rate': 8.119045575135857e-06, 'epoch': 1.15} {'loss': 0.3542, 'learning_rate': 8.118715595490955e-06, 'epoch': 1.15} {'loss': 0.3787, 'learning_rate': 8.118385617969669e-06, 'epoch': 1.15} {'loss': 0.3432, 'learning_rate': 8.118055642572365e-06, 'epoch': 1.15} {'loss': 0.274, 'learning_rate': 8.117725669299418e-06, 'epoch': 1.15} {'loss': 0.4351, 'learning_rate': 8.1173956981512e-06, 'epoch': 1.15} {'loss': 0.292, 'learning_rate': 8.117065729128087e-06, 'epoch': 1.15} {'loss': 0.3947, 'learning_rate': 8.116735762230447e-06, 'epoch': 1.15} {'loss': 0.4796, 'learning_rate': 8.116405797458653e-06, 'epoch': 1.15} {'loss': 0.4774, 'learning_rate': 8.116075834813079e-06, 'epoch': 1.15} {'loss': 0.4564, 'learning_rate': 8.1157458742941e-06, 'epoch': 1.15} {'loss': 0.2832, 'learning_rate': 8.115415915902082e-06, 'epoch': 1.15} {'loss': 0.2739, 'learning_rate': 8.115085959637402e-06, 'epoch': 1.15} {'loss': 0.3326, 'learning_rate': 8.114756005500434e-06, 'epoch': 1.15} {'loss': 0.2509, 'learning_rate': 8.114426053491546e-06, 'epoch': 1.15} {'loss': 0.2288, 'learning_rate': 8.114096103611115e-06, 'epoch': 1.15} {'loss': 0.3184, 'learning_rate': 8.113766155859507e-06, 'epoch': 1.15} {'loss': 0.3108, 'learning_rate': 8.1134362102371e-06, 'epoch': 1.15} {'loss': 0.2131, 'learning_rate': 8.113106266744267e-06, 'epoch': 1.15} {'loss': 0.3681, 'learning_rate': 8.112776325381375e-06, 'epoch': 1.15} {'loss': 0.4054, 'learning_rate': 8.1124463861488e-06, 'epoch': 1.15} {'loss': 0.3697, 'learning_rate': 8.112116449046914e-06, 'epoch': 1.15} {'loss': 0.0899, 'learning_rate': 8.11178651407609e-06, 'epoch': 1.15} {'loss': 0.1639, 'learning_rate': 8.1114565812367e-06, 'epoch': 1.15} {'loss': 0.3569, 'learning_rate': 8.111126650529117e-06, 'epoch': 1.15} {'loss': 0.3403, 'learning_rate': 8.110796721953714e-06, 'epoch': 1.15} {'loss': 0.2015, 'learning_rate': 8.110466795510859e-06, 'epoch': 1.15} {'loss': 0.3527, 'learning_rate': 8.110136871200929e-06, 'epoch': 1.15} {'loss': 0.2949, 'learning_rate': 8.109806949024298e-06, 'epoch': 1.15} {'loss': 0.2575, 'learning_rate': 8.109477028981332e-06, 'epoch': 1.15} {'loss': 0.2546, 'learning_rate': 8.109147111072408e-06, 'epoch': 1.15} {'loss': 0.3076, 'learning_rate': 8.108817195297897e-06, 'epoch': 1.15} {'loss': 0.3883, 'learning_rate': 8.108487281658172e-06, 'epoch': 1.15} {'loss': 0.2322, 'learning_rate': 8.108157370153605e-06, 'epoch': 1.15} {'loss': 0.3957, 'learning_rate': 8.107827460784569e-06, 'epoch': 1.15} {'loss': 0.3755, 'learning_rate': 8.107497553551435e-06, 'epoch': 1.15} {'loss': 0.2215, 'learning_rate': 8.107167648454578e-06, 'epoch': 1.15} {'loss': 0.1967, 'learning_rate': 8.106837745494367e-06, 'epoch': 1.15} {'loss': 0.2551, 'learning_rate': 8.106507844671177e-06, 'epoch': 1.15} {'loss': 0.2599, 'learning_rate': 8.10617794598538e-06, 'epoch': 1.15} {'loss': 0.2356, 'learning_rate': 8.105848049437346e-06, 'epoch': 1.15} {'loss': 0.324, 'learning_rate': 8.105518155027455e-06, 'epoch': 1.15} {'loss': 0.3764, 'learning_rate': 8.105188262756068e-06, 'epoch': 1.15} {'loss': 0.2498, 'learning_rate': 8.104858372623566e-06, 'epoch': 1.15} {'loss': 0.5014, 'learning_rate': 8.104528484630316e-06, 'epoch': 1.15} {'loss': 0.3111, 'learning_rate': 8.104198598776695e-06, 'epoch': 1.15} {'loss': 0.2525, 'learning_rate': 8.103868715063072e-06, 'epoch': 1.15} {'loss': 0.3479, 'learning_rate': 8.10353883348982e-06, 'epoch': 1.15} {'loss': 0.3277, 'learning_rate': 8.103208954057314e-06, 'epoch': 1.15} {'loss': 0.3158, 'learning_rate': 8.102879076765924e-06, 'epoch': 1.15} {'loss': 0.3184, 'learning_rate': 8.102549201616022e-06, 'epoch': 1.15} {'loss': 0.3246, 'learning_rate': 8.102219328607982e-06, 'epoch': 1.15} {'loss': 0.3585, 'learning_rate': 8.101889457742174e-06, 'epoch': 1.15} {'loss': 0.3462, 'learning_rate': 8.101559589018973e-06, 'epoch': 1.15} {'loss': 0.4071, 'learning_rate': 8.101229722438753e-06, 'epoch': 1.15} {'loss': 0.2563, 'learning_rate': 8.100899858001881e-06, 'epoch': 1.15} {'loss': 0.3493, 'learning_rate': 8.10056999570873e-06, 'epoch': 1.15} {'loss': 0.2534, 'learning_rate': 8.100240135559677e-06, 'epoch': 1.15} {'loss': 0.3395, 'learning_rate': 8.099910277555091e-06, 'epoch': 1.15} {'loss': 0.1451, 'learning_rate': 8.099580421695344e-06, 'epoch': 1.15} {'loss': 0.382, 'learning_rate': 8.09925056798081e-06, 'epoch': 1.15} {'loss': 0.272, 'learning_rate': 8.09892071641186e-06, 'epoch': 1.15} {'loss': 0.2814, 'learning_rate': 8.098590866988867e-06, 'epoch': 1.15} {'loss': 0.2381, 'learning_rate': 8.098261019712203e-06, 'epoch': 1.15} {'loss': 0.2736, 'learning_rate': 8.097931174582243e-06, 'epoch': 1.15} {'loss': 0.2111, 'learning_rate': 8.097601331599355e-06, 'epoch': 1.15} {'loss': 0.2722, 'learning_rate': 8.097271490763914e-06, 'epoch': 1.15} {'loss': 0.2569, 'learning_rate': 8.096941652076293e-06, 'epoch': 1.15} {'loss': 0.3995, 'learning_rate': 8.096611815536862e-06, 'epoch': 1.15} {'loss': 0.3205, 'learning_rate': 8.096281981145993e-06, 'epoch': 1.15} {'loss': 0.3838, 'learning_rate': 8.09595214890406e-06, 'epoch': 1.15} {'loss': 0.3197, 'learning_rate': 8.095622318811435e-06, 'epoch': 1.15} {'loss': 0.4127, 'learning_rate': 8.095292490868492e-06, 'epoch': 1.15} {'loss': 0.2771, 'learning_rate': 8.0949626650756e-06, 'epoch': 1.15} {'loss': 0.2223, 'learning_rate': 8.094632841433132e-06, 'epoch': 1.15} {'loss': 0.3889, 'learning_rate': 8.094303019941463e-06, 'epoch': 1.15} {'loss': 0.4318, 'learning_rate': 8.093973200600962e-06, 'epoch': 1.15} {'loss': 0.3814, 'learning_rate': 8.093643383412002e-06, 'epoch': 1.15} {'loss': 0.3658, 'learning_rate': 8.093313568374959e-06, 'epoch': 1.15} {'loss': 0.3655, 'learning_rate': 8.0929837554902e-06, 'epoch': 1.15} {'loss': 0.2549, 'learning_rate': 8.0926539447581e-06, 'epoch': 1.15} {'loss': 0.3964, 'learning_rate': 8.092324136179033e-06, 'epoch': 1.15} {'loss': 0.2075, 'learning_rate': 8.091994329753367e-06, 'epoch': 1.15} {'loss': 0.2357, 'learning_rate': 8.091664525481479e-06, 'epoch': 1.15} {'loss': 0.3114, 'learning_rate': 8.091334723363738e-06, 'epoch': 1.15} {'loss': 0.3428, 'learning_rate': 8.091004923400516e-06, 'epoch': 1.15} {'loss': 0.3657, 'learning_rate': 8.090675125592186e-06, 'epoch': 1.15} {'loss': 0.4219, 'learning_rate': 8.090345329939124e-06, 'epoch': 1.15} {'loss': 0.2482, 'learning_rate': 8.090015536441698e-06, 'epoch': 1.15} {'loss': 0.2579, 'learning_rate': 8.08968574510028e-06, 'epoch': 1.15} {'loss': 0.2524, 'learning_rate': 8.089355955915244e-06, 'epoch': 1.15} {'loss': 0.3123, 'learning_rate': 8.089026168886961e-06, 'epoch': 1.15} {'loss': 0.5058, 'learning_rate': 8.088696384015804e-06, 'epoch': 1.15} {'loss': 0.2946, 'learning_rate': 8.088366601302147e-06, 'epoch': 1.15} {'loss': 0.3145, 'learning_rate': 8.088036820746358e-06, 'epoch': 1.15} {'loss': 0.1938, 'learning_rate': 8.087707042348813e-06, 'epoch': 1.15} {'loss': 0.2829, 'learning_rate': 8.087377266109883e-06, 'epoch': 1.15} {'loss': 0.3165, 'learning_rate': 8.087047492029942e-06, 'epoch': 1.15} {'loss': 0.2502, 'learning_rate': 8.08671772010936e-06, 'epoch': 1.15} {'loss': 0.345, 'learning_rate': 8.086387950348509e-06, 'epoch': 1.15} {'loss': 0.2475, 'learning_rate': 8.086058182747762e-06, 'epoch': 1.15} {'loss': 0.3096, 'learning_rate': 8.085728417307493e-06, 'epoch': 1.15} {'loss': 0.3766, 'learning_rate': 8.08539865402807e-06, 'epoch': 1.15} {'loss': 0.287, 'learning_rate': 8.08506889290987e-06, 'epoch': 1.15} {'loss': 0.3468, 'learning_rate': 8.084739133953264e-06, 'epoch': 1.15} {'loss': 0.4797, 'learning_rate': 8.084409377158621e-06, 'epoch': 1.15} {'loss': 0.2759, 'learning_rate': 8.084079622526316e-06, 'epoch': 1.15} {'loss': 0.4868, 'learning_rate': 8.08374987005672e-06, 'epoch': 1.15} {'loss': 0.2059, 'learning_rate': 8.083420119750207e-06, 'epoch': 1.15} {'loss': 0.2467, 'learning_rate': 8.083090371607149e-06, 'epoch': 1.15} {'loss': 0.3294, 'learning_rate': 8.082760625627917e-06, 'epoch': 1.15} {'loss': 0.2815, 'learning_rate': 8.082430881812884e-06, 'epoch': 1.15} {'loss': 0.4361, 'learning_rate': 8.082101140162419e-06, 'epoch': 1.15} {'loss': 0.3736, 'learning_rate': 8.0817714006769e-06, 'epoch': 1.15} {'loss': 0.2041, 'learning_rate': 8.081441663356698e-06, 'epoch': 1.15} {'loss': 0.3995, 'learning_rate': 8.081111928202181e-06, 'epoch': 1.15} {'loss': 0.3184, 'learning_rate': 8.080782195213723e-06, 'epoch': 1.15} {'loss': 0.3574, 'learning_rate': 8.080452464391699e-06, 'epoch': 1.15} {'loss': 0.2805, 'learning_rate': 8.080122735736478e-06, 'epoch': 1.15} {'loss': 0.2207, 'learning_rate': 8.079793009248432e-06, 'epoch': 1.15} {'loss': 0.3414, 'learning_rate': 8.079463284927936e-06, 'epoch': 1.15} {'loss': 0.2698, 'learning_rate': 8.07913356277536e-06, 'epoch': 1.15} {'loss': 0.248, 'learning_rate': 8.078803842791077e-06, 'epoch': 1.15} {'loss': 0.4309, 'learning_rate': 8.07847412497546e-06, 'epoch': 1.15} {'loss': 0.3824, 'learning_rate': 8.07814440932888e-06, 'epoch': 1.15} {'loss': 0.2162, 'learning_rate': 8.07781469585171e-06, 'epoch': 1.15} {'loss': 0.3584, 'learning_rate': 8.077484984544321e-06, 'epoch': 1.15} {'loss': 0.4599, 'learning_rate': 8.077155275407087e-06, 'epoch': 1.15} {'loss': 0.2768, 'learning_rate': 8.076825568440379e-06, 'epoch': 1.15} {'loss': 0.3761, 'learning_rate': 8.076495863644569e-06, 'epoch': 1.15} {'loss': 0.454, 'learning_rate': 8.076166161020027e-06, 'epoch': 1.15} {'loss': 0.2759, 'learning_rate': 8.07583646056713e-06, 'epoch': 1.15} {'loss': 0.4384, 'learning_rate': 8.075506762286248e-06, 'epoch': 1.15} {'loss': 0.2836, 'learning_rate': 8.075177066177751e-06, 'epoch': 1.15} {'loss': 0.317, 'learning_rate': 8.074847372242015e-06, 'epoch': 1.15} {'loss': 0.2772, 'learning_rate': 8.074517680479407e-06, 'epoch': 1.15} {'loss': 0.3666, 'learning_rate': 8.074187990890305e-06, 'epoch': 1.15} {'loss': 0.3637, 'learning_rate': 8.073858303475079e-06, 'epoch': 1.15} {'loss': 0.2661, 'learning_rate': 8.0735286182341e-06, 'epoch': 1.15} {'loss': 0.2006, 'learning_rate': 8.07319893516774e-06, 'epoch': 1.15} {'loss': 0.2711, 'learning_rate': 8.072869254276376e-06, 'epoch': 1.15} {'loss': 0.2951, 'learning_rate': 8.072539575560373e-06, 'epoch': 1.15} {'loss': 0.2579, 'learning_rate': 8.072209899020104e-06, 'epoch': 1.15} {'loss': 0.3762, 'learning_rate': 8.071880224655947e-06, 'epoch': 1.15} {'loss': 0.22, 'learning_rate': 8.071550552468269e-06, 'epoch': 1.15} {'loss': 0.3659, 'learning_rate': 8.071220882457444e-06, 'epoch': 1.15} {'loss': 0.503, 'learning_rate': 8.070891214623844e-06, 'epoch': 1.15} {'loss': 0.4303, 'learning_rate': 8.07056154896784e-06, 'epoch': 1.15} {'loss': 0.3879, 'learning_rate': 8.070231885489806e-06, 'epoch': 1.15} {'loss': 0.2553, 'learning_rate': 8.069902224190113e-06, 'epoch': 1.15} {'loss': 0.3847, 'learning_rate': 8.069572565069133e-06, 'epoch': 1.15} {'loss': 0.2004, 'learning_rate': 8.069242908127239e-06, 'epoch': 1.15} {'loss': 0.3838, 'learning_rate': 8.068913253364802e-06, 'epoch': 1.15} {'loss': 0.3872, 'learning_rate': 8.068583600782197e-06, 'epoch': 1.15} {'loss': 0.2735, 'learning_rate': 8.068253950379793e-06, 'epoch': 1.15} {'loss': 0.312, 'learning_rate': 8.067924302157962e-06, 'epoch': 1.15} {'loss': 0.3213, 'learning_rate': 8.067594656117077e-06, 'epoch': 1.15} {'loss': 0.2517, 'learning_rate': 8.06726501225751e-06, 'epoch': 1.15} {'loss': 0.2112, 'learning_rate': 8.066935370579633e-06, 'epoch': 1.15} {'loss': 0.4604, 'learning_rate': 8.06660573108382e-06, 'epoch': 1.15} {'loss': 0.3396, 'learning_rate': 8.06627609377044e-06, 'epoch': 1.15} {'loss': 0.505, 'learning_rate': 8.065946458639868e-06, 'epoch': 1.15} {'loss': 0.356, 'learning_rate': 8.065616825692472e-06, 'epoch': 1.15} {'loss': 0.3059, 'learning_rate': 8.065287194928629e-06, 'epoch': 1.15} {'loss': 0.3918, 'learning_rate': 8.064957566348708e-06, 'epoch': 1.15} {'loss': 0.3472, 'learning_rate': 8.064627939953083e-06, 'epoch': 1.15} {'loss': 0.2875, 'learning_rate': 8.064298315742124e-06, 'epoch': 1.15} {'loss': 0.2315, 'learning_rate': 8.063968693716206e-06, 'epoch': 1.15} {'loss': 0.462, 'learning_rate': 8.063639073875698e-06, 'epoch': 1.15} {'loss': 0.4608, 'learning_rate': 8.063309456220972e-06, 'epoch': 1.15} {'loss': 0.2466, 'learning_rate': 8.062979840752403e-06, 'epoch': 1.15} {'loss': 0.2593, 'learning_rate': 8.06265022747036e-06, 'epoch': 1.15} {'loss': 0.27, 'learning_rate': 8.062320616375217e-06, 'epoch': 1.15} {'loss': 0.2959, 'learning_rate': 8.061991007467346e-06, 'epoch': 1.15} {'loss': 0.3189, 'learning_rate': 8.061661400747118e-06, 'epoch': 1.15} {'loss': 0.3387, 'learning_rate': 8.061331796214904e-06, 'epoch': 1.15} {'loss': 0.3588, 'learning_rate': 8.06100219387108e-06, 'epoch': 1.15} {'loss': 0.3535, 'learning_rate': 8.060672593716015e-06, 'epoch': 1.15} {'loss': 0.2685, 'learning_rate': 8.06034299575008e-06, 'epoch': 1.15} {'loss': 0.213, 'learning_rate': 8.060013399973653e-06, 'epoch': 1.15} {'loss': 0.3503, 'learning_rate': 8.059683806387099e-06, 'epoch': 1.15} {'loss': 0.3243, 'learning_rate': 8.059354214990796e-06, 'epoch': 1.15} {'loss': 0.2896, 'learning_rate': 8.05902462578511e-06, 'epoch': 1.15} {'loss': 0.3358, 'learning_rate': 8.058695038770418e-06, 'epoch': 1.15} {'loss': 0.3591, 'learning_rate': 8.05836545394709e-06, 'epoch': 1.15} {'loss': 0.485, 'learning_rate': 8.058035871315497e-06, 'epoch': 1.15} {'loss': 0.3316, 'learning_rate': 8.057706290876012e-06, 'epoch': 1.15} {'loss': 0.3329, 'learning_rate': 8.057376712629011e-06, 'epoch': 1.15} {'loss': 0.3312, 'learning_rate': 8.05704713657486e-06, 'epoch': 1.15} {'loss': 0.3036, 'learning_rate': 8.056717562713933e-06, 'epoch': 1.15} {'loss': 0.2432, 'learning_rate': 8.056387991046601e-06, 'epoch': 1.15} {'loss': 0.4054, 'learning_rate': 8.05605842157324e-06, 'epoch': 1.15} {'loss': 0.312, 'learning_rate': 8.055728854294217e-06, 'epoch': 1.15} {'loss': 0.2068, 'learning_rate': 8.055399289209908e-06, 'epoch': 1.15} {'loss': 0.3082, 'learning_rate': 8.055069726320683e-06, 'epoch': 1.15} {'loss': 0.4422, 'learning_rate': 8.054740165626914e-06, 'epoch': 1.15} {'loss': 0.3305, 'learning_rate': 8.054410607128972e-06, 'epoch': 1.15} {'loss': 0.2874, 'learning_rate': 8.054081050827233e-06, 'epoch': 1.15} {'loss': 0.3544, 'learning_rate': 8.053751496722065e-06, 'epoch': 1.15} {'loss': 0.2633, 'learning_rate': 8.053421944813842e-06, 'epoch': 1.15} {'loss': 0.4054, 'learning_rate': 8.053092395102937e-06, 'epoch': 1.15} {'loss': 0.2853, 'learning_rate': 8.052762847589719e-06, 'epoch': 1.15} {'loss': 0.4322, 'learning_rate': 8.05243330227456e-06, 'epoch': 1.15} {'loss': 0.253, 'learning_rate': 8.052103759157836e-06, 'epoch': 1.15} {'loss': 0.2279, 'learning_rate': 8.051774218239916e-06, 'epoch': 1.15} {'loss': 0.3765, 'learning_rate': 8.051444679521171e-06, 'epoch': 1.15} {'loss': 0.4269, 'learning_rate': 8.051115143001975e-06, 'epoch': 1.15} {'loss': 0.3965, 'learning_rate': 8.0507856086827e-06, 'epoch': 1.15} {'loss': 0.2617, 'learning_rate': 8.050456076563718e-06, 'epoch': 1.15} {'loss': 0.2646, 'learning_rate': 8.050126546645398e-06, 'epoch': 1.15} {'loss': 0.3666, 'learning_rate': 8.049797018928116e-06, 'epoch': 1.15} {'loss': 0.4327, 'learning_rate': 8.049467493412241e-06, 'epoch': 1.15} {'loss': 0.2918, 'learning_rate': 8.049137970098147e-06, 'epoch': 1.15} {'loss': 0.3947, 'learning_rate': 8.048808448986206e-06, 'epoch': 1.15} {'loss': 0.3543, 'learning_rate': 8.04847893007679e-06, 'epoch': 1.15} {'loss': 0.464, 'learning_rate': 8.04814941337027e-06, 'epoch': 1.15} {'loss': 0.3191, 'learning_rate': 8.047819898867018e-06, 'epoch': 1.15} {'loss': 0.2424, 'learning_rate': 8.047490386567405e-06, 'epoch': 1.15} {'loss': 0.4397, 'learning_rate': 8.047160876471803e-06, 'epoch': 1.15} {'loss': 0.2646, 'learning_rate': 8.046831368580587e-06, 'epoch': 1.15} {'loss': 0.3232, 'learning_rate': 8.046501862894126e-06, 'epoch': 1.15} {'loss': 0.524, 'learning_rate': 8.046172359412793e-06, 'epoch': 1.15} {'loss': 0.3458, 'learning_rate': 8.04584285813696e-06, 'epoch': 1.15} {'loss': 0.4277, 'learning_rate': 8.045513359066999e-06, 'epoch': 1.15} {'loss': 0.4424, 'learning_rate': 8.045183862203281e-06, 'epoch': 1.15} {'loss': 0.4793, 'learning_rate': 8.04485436754618e-06, 'epoch': 1.15} {'loss': 0.4013, 'learning_rate': 8.044524875096065e-06, 'epoch': 1.15} {'loss': 0.3269, 'learning_rate': 8.044195384853312e-06, 'epoch': 1.15} {'loss': 0.2363, 'learning_rate': 8.04386589681829e-06, 'epoch': 1.15} {'loss': 0.1826, 'learning_rate': 8.04353641099137e-06, 'epoch': 1.15} {'loss': 0.2715, 'learning_rate': 8.043206927372925e-06, 'epoch': 1.15} {'loss': 0.2519, 'learning_rate': 8.042877445963329e-06, 'epoch': 1.15} {'loss': 0.4247, 'learning_rate': 8.042547966762952e-06, 'epoch': 1.15} {'loss': 0.4007, 'learning_rate': 8.042218489772165e-06, 'epoch': 1.15} {'loss': 0.2614, 'learning_rate': 8.041889014991341e-06, 'epoch': 1.15} {'loss': 0.5001, 'learning_rate': 8.041559542420852e-06, 'epoch': 1.15} {'loss': 0.4102, 'learning_rate': 8.041230072061071e-06, 'epoch': 1.15} {'loss': 0.3763, 'learning_rate': 8.040900603912366e-06, 'epoch': 1.15} {'loss': 0.2503, 'learning_rate': 8.040571137975116e-06, 'epoch': 1.15} {'loss': 0.3917, 'learning_rate': 8.040241674249685e-06, 'epoch': 1.15} {'loss': 0.5801, 'learning_rate': 8.039912212736452e-06, 'epoch': 1.15} {'loss': 0.4182, 'learning_rate': 8.039582753435784e-06, 'epoch': 1.15} {'loss': 0.2959, 'learning_rate': 8.039253296348052e-06, 'epoch': 1.15} {'loss': 0.3664, 'learning_rate': 8.038923841473631e-06, 'epoch': 1.15} {'loss': 0.3956, 'learning_rate': 8.038594388812893e-06, 'epoch': 1.15} {'loss': 0.3756, 'learning_rate': 8.03826493836621e-06, 'epoch': 1.15} {'loss': 0.2356, 'learning_rate': 8.03793549013395e-06, 'epoch': 1.15} {'loss': 0.3348, 'learning_rate': 8.03760604411649e-06, 'epoch': 1.15} {'loss': 0.3112, 'learning_rate': 8.037276600314197e-06, 'epoch': 1.15} {'loss': 0.3267, 'learning_rate': 8.036947158727448e-06, 'epoch': 1.15} {'loss': 0.1998, 'learning_rate': 8.036617719356612e-06, 'epoch': 1.15} {'loss': 0.3133, 'learning_rate': 8.03628828220206e-06, 'epoch': 1.15} {'loss': 0.4146, 'learning_rate': 8.035958847264168e-06, 'epoch': 1.15} {'loss': 0.362, 'learning_rate': 8.035629414543304e-06, 'epoch': 1.15} {'loss': 0.2684, 'learning_rate': 8.03529998403984e-06, 'epoch': 1.15} {'loss': 0.5234, 'learning_rate': 8.034970555754147e-06, 'epoch': 1.15} {'loss': 0.2771, 'learning_rate': 8.0346411296866e-06, 'epoch': 1.15} {'loss': 0.2253, 'learning_rate': 8.03431170583757e-06, 'epoch': 1.15} {'loss': 0.2426, 'learning_rate': 8.033982284207428e-06, 'epoch': 1.15} {'loss': 0.3855, 'learning_rate': 8.033652864796546e-06, 'epoch': 1.15} {'loss': 0.2776, 'learning_rate': 8.033323447605296e-06, 'epoch': 1.15} {'loss': 0.3535, 'learning_rate': 8.03299403263405e-06, 'epoch': 1.15} {'loss': 0.4334, 'learning_rate': 8.03266461988318e-06, 'epoch': 1.15} {'loss': 0.223, 'learning_rate': 8.032335209353056e-06, 'epoch': 1.15} {'loss': 0.4489, 'learning_rate': 8.032005801044053e-06, 'epoch': 1.15} {'loss': 0.2764, 'learning_rate': 8.031676394956541e-06, 'epoch': 1.15} {'loss': 0.1919, 'learning_rate': 8.031346991090893e-06, 'epoch': 1.15} {'loss': 0.2729, 'learning_rate': 8.031017589447478e-06, 'epoch': 1.15} {'loss': 0.3241, 'learning_rate': 8.030688190026671e-06, 'epoch': 1.15} {'loss': 0.4075, 'learning_rate': 8.030358792828841e-06, 'epoch': 1.15} {'loss': 0.2151, 'learning_rate': 8.030029397854362e-06, 'epoch': 1.15} {'loss': 0.2945, 'learning_rate': 8.029700005103606e-06, 'epoch': 1.15} {'loss': 0.3181, 'learning_rate': 8.029370614576943e-06, 'epoch': 1.15} {'loss': 0.2621, 'learning_rate': 8.029041226274748e-06, 'epoch': 1.15} {'loss': 0.2797, 'learning_rate': 8.028711840197388e-06, 'epoch': 1.15} {'loss': 0.2915, 'learning_rate': 8.028382456345236e-06, 'epoch': 1.15} {'loss': 0.3513, 'learning_rate': 8.028053074718669e-06, 'epoch': 1.15} {'loss': 0.3944, 'learning_rate': 8.027723695318053e-06, 'epoch': 1.15} {'loss': 0.3846, 'learning_rate': 8.027394318143761e-06, 'epoch': 1.15} {'loss': 0.3621, 'learning_rate': 8.027064943196167e-06, 'epoch': 1.15} {'loss': 0.3164, 'learning_rate': 8.026735570475643e-06, 'epoch': 1.15} {'loss': 0.3554, 'learning_rate': 8.026406199982557e-06, 'epoch': 1.15} {'loss': 0.457, 'learning_rate': 8.026076831717286e-06, 'epoch': 1.15} {'loss': 0.4522, 'learning_rate': 8.025747465680197e-06, 'epoch': 1.15} {'loss': 0.3413, 'learning_rate': 8.025418101871664e-06, 'epoch': 1.15} {'loss': 0.2034, 'learning_rate': 8.025088740292059e-06, 'epoch': 1.15} {'loss': 0.3325, 'learning_rate': 8.024759380941753e-06, 'epoch': 1.15} {'loss': 0.4674, 'learning_rate': 8.024430023821119e-06, 'epoch': 1.15} {'loss': 0.5047, 'learning_rate': 8.024100668930526e-06, 'epoch': 1.15} {'loss': 0.3316, 'learning_rate': 8.023771316270347e-06, 'epoch': 1.15} {'loss': 0.4102, 'learning_rate': 8.023441965840957e-06, 'epoch': 1.15} {'loss': 0.292, 'learning_rate': 8.023112617642722e-06, 'epoch': 1.15} {'loss': 0.3135, 'learning_rate': 8.02278327167602e-06, 'epoch': 1.15} {'loss': 0.2178, 'learning_rate': 8.022453927941219e-06, 'epoch': 1.15} {'loss': 0.3237, 'learning_rate': 8.022124586438692e-06, 'epoch': 1.15} {'loss': 0.2759, 'learning_rate': 8.021795247168808e-06, 'epoch': 1.15} {'loss': 0.3423, 'learning_rate': 8.021465910131942e-06, 'epoch': 1.15} {'loss': 0.3646, 'learning_rate': 8.021136575328465e-06, 'epoch': 1.15} {'loss': 0.318, 'learning_rate': 8.020807242758749e-06, 'epoch': 1.15} {'loss': 0.3104, 'learning_rate': 8.020477912423163e-06, 'epoch': 1.15} {'loss': 0.2863, 'learning_rate': 8.020148584322085e-06, 'epoch': 1.15} {'loss': 0.2106, 'learning_rate': 8.019819258455879e-06, 'epoch': 1.15} {'loss': 0.2858, 'learning_rate': 8.019489934824922e-06, 'epoch': 1.15} {'loss': 0.5291, 'learning_rate': 8.019160613429585e-06, 'epoch': 1.15} {'loss': 0.4632, 'learning_rate': 8.018831294270237e-06, 'epoch': 1.15} {'loss': 0.2723, 'learning_rate': 8.018501977347254e-06, 'epoch': 1.15} {'loss': 0.2514, 'learning_rate': 8.018172662661004e-06, 'epoch': 1.15} {'loss': 0.2981, 'learning_rate': 8.01784335021186e-06, 'epoch': 1.15} {'loss': 0.3606, 'learning_rate': 8.017514040000195e-06, 'epoch': 1.15} {'loss': 0.3173, 'learning_rate': 8.01718473202638e-06, 'epoch': 1.15} {'loss': 0.3337, 'learning_rate': 8.016855426290784e-06, 'epoch': 1.15} {'loss': 0.3634, 'learning_rate': 8.016526122793783e-06, 'epoch': 1.15} {'loss': 0.4064, 'learning_rate': 8.016196821535746e-06, 'epoch': 1.15} {'loss': 0.4743, 'learning_rate': 8.01586752251705e-06, 'epoch': 1.15} {'loss': 0.4831, 'learning_rate': 8.015538225738057e-06, 'epoch': 1.15} {'loss': 0.4003, 'learning_rate': 8.015208931199146e-06, 'epoch': 1.15} {'loss': 0.3759, 'learning_rate': 8.014879638900685e-06, 'epoch': 1.15} {'loss': 0.3868, 'learning_rate': 8.014550348843048e-06, 'epoch': 1.15} {'loss': 0.5466, 'learning_rate': 8.014221061026606e-06, 'epoch': 1.15} {'loss': 0.2755, 'learning_rate': 8.013891775451733e-06, 'epoch': 1.15} {'loss': 0.3148, 'learning_rate': 8.013562492118795e-06, 'epoch': 1.15} {'loss': 0.179, 'learning_rate': 8.013233211028169e-06, 'epoch': 1.15} {'loss': 0.3043, 'learning_rate': 8.012903932180225e-06, 'epoch': 1.15} {'loss': 0.3074, 'learning_rate': 8.012574655575335e-06, 'epoch': 1.15} {'loss': 0.4742, 'learning_rate': 8.012245381213869e-06, 'epoch': 1.15} {'loss': 0.4603, 'learning_rate': 8.011916109096201e-06, 'epoch': 1.15} {'loss': 0.3971, 'learning_rate': 8.011586839222703e-06, 'epoch': 1.15} {'loss': 0.3258, 'learning_rate': 8.011257571593745e-06, 'epoch': 1.15} {'loss': 0.3544, 'learning_rate': 8.010928306209696e-06, 'epoch': 1.15} {'loss': 0.2133, 'learning_rate': 8.010599043070934e-06, 'epoch': 1.15} {'loss': 0.3042, 'learning_rate': 8.010269782177825e-06, 'epoch': 1.15} {'loss': 0.4511, 'learning_rate': 8.009940523530743e-06, 'epoch': 1.15} {'loss': 0.1339, 'learning_rate': 8.009611267130062e-06, 'epoch': 1.15} {'loss': 0.3206, 'learning_rate': 8.009282012976149e-06, 'epoch': 1.15} {'loss': 0.4006, 'learning_rate': 8.00895276106938e-06, 'epoch': 1.15} {'loss': 0.377, 'learning_rate': 8.008623511410122e-06, 'epoch': 1.15} {'loss': 0.3884, 'learning_rate': 8.008294263998753e-06, 'epoch': 1.15} {'loss': 0.449, 'learning_rate': 8.007965018835639e-06, 'epoch': 1.15} {'loss': 0.1992, 'learning_rate': 8.007635775921153e-06, 'epoch': 1.15} {'loss': 0.3636, 'learning_rate': 8.00730653525567e-06, 'epoch': 1.15} {'loss': 0.2796, 'learning_rate': 8.006977296839557e-06, 'epoch': 1.15} {'loss': 0.4727, 'learning_rate': 8.006648060673187e-06, 'epoch': 1.15} {'loss': 0.3337, 'learning_rate': 8.006318826756934e-06, 'epoch': 1.15} {'loss': 0.3213, 'learning_rate': 8.005989595091168e-06, 'epoch': 1.15} {'loss': 0.293, 'learning_rate': 8.005660365676259e-06, 'epoch': 1.15} {'loss': 0.3936, 'learning_rate': 8.005331138512581e-06, 'epoch': 1.15} {'loss': 0.295, 'learning_rate': 8.005001913600504e-06, 'epoch': 1.15} {'loss': 0.246, 'learning_rate': 8.004672690940401e-06, 'epoch': 1.15} {'loss': 0.2926, 'learning_rate': 8.004343470532643e-06, 'epoch': 1.16} {'loss': 0.3625, 'learning_rate': 8.004014252377603e-06, 'epoch': 1.16} {'loss': 0.3133, 'learning_rate': 8.003685036475651e-06, 'epoch': 1.16} {'loss': 0.115, 'learning_rate': 8.003355822827157e-06, 'epoch': 1.16} {'loss': 0.3554, 'learning_rate': 8.003026611432499e-06, 'epoch': 1.16} {'loss': 0.2563, 'learning_rate': 8.00269740229204e-06, 'epoch': 1.16} {'loss': 0.2997, 'learning_rate': 8.002368195406158e-06, 'epoch': 1.16} {'loss': 0.442, 'learning_rate': 8.00203899077522e-06, 'epoch': 1.16} {'loss': 0.2643, 'learning_rate': 8.001709788399602e-06, 'epoch': 1.16} {'loss': 0.3114, 'learning_rate': 8.001380588279674e-06, 'epoch': 1.16} {'loss': 0.4483, 'learning_rate': 8.001051390415806e-06, 'epoch': 1.16} {'loss': 0.433, 'learning_rate': 8.00072219480837e-06, 'epoch': 1.16} {'loss': 0.4636, 'learning_rate': 8.00039300145774e-06, 'epoch': 1.16} {'loss': 0.484, 'learning_rate': 8.000063810364287e-06, 'epoch': 1.16} {'loss': 0.2042, 'learning_rate': 7.999734621528379e-06, 'epoch': 1.16} {'loss': 0.3984, 'learning_rate': 7.999405434950392e-06, 'epoch': 1.16} {'loss': 0.4085, 'learning_rate': 7.999076250630695e-06, 'epoch': 1.16} {'loss': 0.5106, 'learning_rate': 7.998747068569664e-06, 'epoch': 1.16} {'loss': 0.1468, 'learning_rate': 7.998417888767663e-06, 'epoch': 1.16} {'loss': 0.2373, 'learning_rate': 7.99808871122507e-06, 'epoch': 1.16} {'loss': 0.399, 'learning_rate': 7.997759535942251e-06, 'epoch': 1.16} {'loss': 0.4031, 'learning_rate': 7.997430362919582e-06, 'epoch': 1.16} {'loss': 0.2789, 'learning_rate': 7.997101192157435e-06, 'epoch': 1.16} {'loss': 0.2593, 'learning_rate': 7.996772023656178e-06, 'epoch': 1.16} {'loss': 0.3186, 'learning_rate': 7.996442857416184e-06, 'epoch': 1.16} {'loss': 0.3272, 'learning_rate': 7.996113693437827e-06, 'epoch': 1.16} {'loss': 0.2517, 'learning_rate': 7.995784531721474e-06, 'epoch': 1.16} {'loss': 0.3562, 'learning_rate': 7.9954553722675e-06, 'epoch': 1.16} {'loss': 0.2421, 'learning_rate': 7.995126215076277e-06, 'epoch': 1.16} {'loss': 0.4944, 'learning_rate': 7.994797060148174e-06, 'epoch': 1.16} {'loss': 0.2654, 'learning_rate': 7.994467907483565e-06, 'epoch': 1.16} {'loss': 0.3104, 'learning_rate': 7.99413875708282e-06, 'epoch': 1.16} {'loss': 0.3128, 'learning_rate': 7.99380960894631e-06, 'epoch': 1.16} {'loss': 0.3855, 'learning_rate': 7.993480463074409e-06, 'epoch': 1.16} {'loss': 0.4785, 'learning_rate': 7.993151319467486e-06, 'epoch': 1.16} {'loss': 0.3002, 'learning_rate': 7.992822178125914e-06, 'epoch': 1.16} {'loss': 0.3657, 'learning_rate': 7.992493039050065e-06, 'epoch': 1.16} {'loss': 0.3382, 'learning_rate': 7.992163902240307e-06, 'epoch': 1.16} {'loss': 0.3478, 'learning_rate': 7.991834767697017e-06, 'epoch': 1.16} {'loss': 0.4068, 'learning_rate': 7.991505635420563e-06, 'epoch': 1.16} {'loss': 0.3602, 'learning_rate': 7.991176505411317e-06, 'epoch': 1.16} {'loss': 0.5227, 'learning_rate': 7.99084737766965e-06, 'epoch': 1.16} {'loss': 0.2727, 'learning_rate': 7.990518252195935e-06, 'epoch': 1.16} {'loss': 0.3403, 'learning_rate': 7.990189128990541e-06, 'epoch': 1.16} {'loss': 0.2497, 'learning_rate': 7.989860008053843e-06, 'epoch': 1.16} {'loss': 0.3021, 'learning_rate': 7.989530889386211e-06, 'epoch': 1.16} {'loss': 0.253, 'learning_rate': 7.989201772988016e-06, 'epoch': 1.16} {'loss': 0.4921, 'learning_rate': 7.988872658859629e-06, 'epoch': 1.16} {'loss': 0.1866, 'learning_rate': 7.988543547001423e-06, 'epoch': 1.16} {'loss': 0.3161, 'learning_rate': 7.988214437413768e-06, 'epoch': 1.16} {'loss': 0.2925, 'learning_rate': 7.987885330097038e-06, 'epoch': 1.16} {'loss': 0.4445, 'learning_rate': 7.987556225051603e-06, 'epoch': 1.16} {'loss': 0.3819, 'learning_rate': 7.987227122277835e-06, 'epoch': 1.16} {'loss': 0.3759, 'learning_rate': 7.986898021776102e-06, 'epoch': 1.16} {'loss': 0.1632, 'learning_rate': 7.986568923546778e-06, 'epoch': 1.16} {'loss': 0.2223, 'learning_rate': 7.986239827590238e-06, 'epoch': 1.16} {'loss': 0.2818, 'learning_rate': 7.985910733906847e-06, 'epoch': 1.16} {'loss': 0.2587, 'learning_rate': 7.985581642496983e-06, 'epoch': 1.16} {'loss': 0.2056, 'learning_rate': 7.985252553361012e-06, 'epoch': 1.16} {'loss': 0.4526, 'learning_rate': 7.984923466499308e-06, 'epoch': 1.16} {'loss': 0.4158, 'learning_rate': 7.984594381912243e-06, 'epoch': 1.16} {'loss': 0.2597, 'learning_rate': 7.984265299600187e-06, 'epoch': 1.16} {'loss': 0.323, 'learning_rate': 7.983936219563512e-06, 'epoch': 1.16} {'loss': 0.4824, 'learning_rate': 7.983607141802589e-06, 'epoch': 1.16} {'loss': 0.3264, 'learning_rate': 7.983278066317794e-06, 'epoch': 1.16} {'loss': 0.4286, 'learning_rate': 7.982948993109492e-06, 'epoch': 1.16} {'loss': 0.536, 'learning_rate': 7.982619922178057e-06, 'epoch': 1.16} {'loss': 0.3641, 'learning_rate': 7.98229085352386e-06, 'epoch': 1.16} {'loss': 0.5389, 'learning_rate': 7.981961787147273e-06, 'epoch': 1.16} {'loss': 0.403, 'learning_rate': 7.981632723048668e-06, 'epoch': 1.16} {'loss': 0.3847, 'learning_rate': 7.981303661228414e-06, 'epoch': 1.16} {'loss': 0.2923, 'learning_rate': 7.980974601686885e-06, 'epoch': 1.16} {'loss': 0.4265, 'learning_rate': 7.980645544424453e-06, 'epoch': 1.16} {'loss': 0.3067, 'learning_rate': 7.98031648944149e-06, 'epoch': 1.16} {'loss': 0.3133, 'learning_rate': 7.97998743673836e-06, 'epoch': 1.16} {'loss': 0.3466, 'learning_rate': 7.979658386315445e-06, 'epoch': 1.16} {'loss': 0.3342, 'learning_rate': 7.97932933817311e-06, 'epoch': 1.16} {'loss': 0.2753, 'learning_rate': 7.97900029231173e-06, 'epoch': 1.16} {'loss': 0.3514, 'learning_rate': 7.978671248731672e-06, 'epoch': 1.16} {'loss': 0.2813, 'learning_rate': 7.97834220743331e-06, 'epoch': 1.16} {'loss': 0.2857, 'learning_rate': 7.978013168417016e-06, 'epoch': 1.16} {'loss': 0.2443, 'learning_rate': 7.977684131683158e-06, 'epoch': 1.16} {'loss': 0.3077, 'learning_rate': 7.977355097232111e-06, 'epoch': 1.16} {'loss': 0.3535, 'learning_rate': 7.977026065064247e-06, 'epoch': 1.16} {'loss': 0.4085, 'learning_rate': 7.976697035179936e-06, 'epoch': 1.16} {'loss': 0.3383, 'learning_rate': 7.976368007579547e-06, 'epoch': 1.16} {'loss': 0.3707, 'learning_rate': 7.976038982263455e-06, 'epoch': 1.16} {'loss': 0.3029, 'learning_rate': 7.975709959232031e-06, 'epoch': 1.16} {'loss': 0.2361, 'learning_rate': 7.975380938485645e-06, 'epoch': 1.16} {'loss': 0.3962, 'learning_rate': 7.975051920024668e-06, 'epoch': 1.16} {'loss': 0.3121, 'learning_rate': 7.974722903849473e-06, 'epoch': 1.16} {'loss': 0.2442, 'learning_rate': 7.974393889960433e-06, 'epoch': 1.16} {'loss': 0.3219, 'learning_rate': 7.974064878357915e-06, 'epoch': 1.16} {'loss': 0.2699, 'learning_rate': 7.973735869042292e-06, 'epoch': 1.16} {'loss': 0.3276, 'learning_rate': 7.973406862013937e-06, 'epoch': 1.16} {'loss': 0.3745, 'learning_rate': 7.973077857273219e-06, 'epoch': 1.16} {'loss': 0.2599, 'learning_rate': 7.972748854820511e-06, 'epoch': 1.16} {'loss': 0.2672, 'learning_rate': 7.972419854656183e-06, 'epoch': 1.16} {'loss': 0.4068, 'learning_rate': 7.97209085678061e-06, 'epoch': 1.16} {'loss': 0.3327, 'learning_rate': 7.97176186119416e-06, 'epoch': 1.16} {'loss': 0.3006, 'learning_rate': 7.971432867897204e-06, 'epoch': 1.16} {'loss': 0.2768, 'learning_rate': 7.971103876890115e-06, 'epoch': 1.16} {'loss': 0.3389, 'learning_rate': 7.970774888173264e-06, 'epoch': 1.16} {'loss': 0.1922, 'learning_rate': 7.970445901747022e-06, 'epoch': 1.16} {'loss': 0.3174, 'learning_rate': 7.970116917611763e-06, 'epoch': 1.16} {'loss': 0.2556, 'learning_rate': 7.969787935767853e-06, 'epoch': 1.16} {'loss': 0.2757, 'learning_rate': 7.96945895621567e-06, 'epoch': 1.16} {'loss': 0.3185, 'learning_rate': 7.969129978955578e-06, 'epoch': 1.16} {'loss': 0.3024, 'learning_rate': 7.968801003987953e-06, 'epoch': 1.16} {'loss': 0.3971, 'learning_rate': 7.968472031313167e-06, 'epoch': 1.16} {'loss': 0.3397, 'learning_rate': 7.968143060931586e-06, 'epoch': 1.16} {'loss': 0.3251, 'learning_rate': 7.967814092843588e-06, 'epoch': 1.16} {'loss': 0.2058, 'learning_rate': 7.967485127049542e-06, 'epoch': 1.16} {'loss': 0.274, 'learning_rate': 7.967156163549816e-06, 'epoch': 1.16} {'loss': 0.4398, 'learning_rate': 7.966827202344786e-06, 'epoch': 1.16} {'loss': 0.4803, 'learning_rate': 7.966498243434821e-06, 'epoch': 1.16} {'loss': 0.318, 'learning_rate': 7.966169286820293e-06, 'epoch': 1.16} {'loss': 0.3183, 'learning_rate': 7.965840332501576e-06, 'epoch': 1.16} {'loss': 0.3265, 'learning_rate': 7.965511380479035e-06, 'epoch': 1.16} {'loss': 0.4215, 'learning_rate': 7.965182430753046e-06, 'epoch': 1.16} {'loss': 0.5451, 'learning_rate': 7.964853483323978e-06, 'epoch': 1.16} {'loss': 0.2089, 'learning_rate': 7.964524538192204e-06, 'epoch': 1.16} {'loss': 0.2587, 'learning_rate': 7.964195595358093e-06, 'epoch': 1.16} {'loss': 0.4016, 'learning_rate': 7.96386665482202e-06, 'epoch': 1.16} {'loss': 0.3262, 'learning_rate': 7.963537716584355e-06, 'epoch': 1.16} {'loss': 0.4218, 'learning_rate': 7.963208780645467e-06, 'epoch': 1.16} {'loss': 0.4054, 'learning_rate': 7.962879847005728e-06, 'epoch': 1.16} {'loss': 0.2529, 'learning_rate': 7.962550915665512e-06, 'epoch': 1.16} {'loss': 0.3113, 'learning_rate': 7.962221986625189e-06, 'epoch': 1.16} {'loss': 0.1731, 'learning_rate': 7.961893059885128e-06, 'epoch': 1.16} {'loss': 0.3323, 'learning_rate': 7.961564135445705e-06, 'epoch': 1.16} {'loss': 0.3875, 'learning_rate': 7.961235213307287e-06, 'epoch': 1.16} {'loss': 0.4033, 'learning_rate': 7.960906293470247e-06, 'epoch': 1.16} {'loss': 0.4452, 'learning_rate': 7.960577375934955e-06, 'epoch': 1.16} {'loss': 0.3656, 'learning_rate': 7.960248460701784e-06, 'epoch': 1.16} {'loss': 0.3422, 'learning_rate': 7.959919547771105e-06, 'epoch': 1.16} {'loss': 0.3106, 'learning_rate': 7.959590637143289e-06, 'epoch': 1.16} {'loss': 0.3502, 'learning_rate': 7.959261728818705e-06, 'epoch': 1.16} {'loss': 0.3732, 'learning_rate': 7.95893282279773e-06, 'epoch': 1.16} {'loss': 0.3363, 'learning_rate': 7.958603919080731e-06, 'epoch': 1.16} {'loss': 0.4629, 'learning_rate': 7.95827501766808e-06, 'epoch': 1.16} {'loss': 0.2785, 'learning_rate': 7.957946118560147e-06, 'epoch': 1.16} {'loss': 0.2515, 'learning_rate': 7.957617221757305e-06, 'epoch': 1.16} {'loss': 0.3521, 'learning_rate': 7.957288327259924e-06, 'epoch': 1.16} {'loss': 0.4658, 'learning_rate': 7.956959435068376e-06, 'epoch': 1.16} {'loss': 0.3502, 'learning_rate': 7.956630545183032e-06, 'epoch': 1.16} {'loss': 0.3217, 'learning_rate': 7.956301657604266e-06, 'epoch': 1.16} {'loss': 0.4719, 'learning_rate': 7.955972772332446e-06, 'epoch': 1.16} {'loss': 0.2941, 'learning_rate': 7.955643889367942e-06, 'epoch': 1.16} {'loss': 0.3074, 'learning_rate': 7.955315008711128e-06, 'epoch': 1.16} {'loss': 0.4144, 'learning_rate': 7.954986130362376e-06, 'epoch': 1.16} {'loss': 0.3272, 'learning_rate': 7.954657254322057e-06, 'epoch': 1.16} {'loss': 0.2376, 'learning_rate': 7.954328380590539e-06, 'epoch': 1.16} {'loss': 0.2725, 'learning_rate': 7.953999509168196e-06, 'epoch': 1.16} {'loss': 0.3617, 'learning_rate': 7.953670640055396e-06, 'epoch': 1.16} {'loss': 0.301, 'learning_rate': 7.953341773252514e-06, 'epoch': 1.16} {'loss': 0.488, 'learning_rate': 7.95301290875992e-06, 'epoch': 1.16} {'loss': 0.3304, 'learning_rate': 7.952684046577987e-06, 'epoch': 1.16} {'loss': 0.4272, 'learning_rate': 7.952355186707082e-06, 'epoch': 1.16} {'loss': 0.4807, 'learning_rate': 7.95202632914758e-06, 'epoch': 1.16} {'loss': 0.3669, 'learning_rate': 7.95169747389985e-06, 'epoch': 1.16} {'loss': 0.3117, 'learning_rate': 7.951368620964266e-06, 'epoch': 1.16} {'loss': 0.3164, 'learning_rate': 7.951039770341194e-06, 'epoch': 1.16} {'loss': 0.1933, 'learning_rate': 7.95071092203101e-06, 'epoch': 1.16} {'loss': 0.3072, 'learning_rate': 7.950382076034087e-06, 'epoch': 1.16} {'loss': 0.4223, 'learning_rate': 7.95005323235079e-06, 'epoch': 1.16} {'loss': 0.4062, 'learning_rate': 7.949724390981491e-06, 'epoch': 1.16} {'loss': 0.3269, 'learning_rate': 7.949395551926567e-06, 'epoch': 1.16} {'loss': 0.3065, 'learning_rate': 7.949066715186382e-06, 'epoch': 1.16} {'loss': 0.3073, 'learning_rate': 7.948737880761313e-06, 'epoch': 1.16} {'loss': 0.4357, 'learning_rate': 7.948409048651727e-06, 'epoch': 1.16} {'loss': 0.2208, 'learning_rate': 7.948080218857999e-06, 'epoch': 1.16} {'loss': 0.3201, 'learning_rate': 7.947751391380497e-06, 'epoch': 1.16} {'loss': 0.2532, 'learning_rate': 7.947422566219594e-06, 'epoch': 1.16} {'loss': 0.3009, 'learning_rate': 7.94709374337566e-06, 'epoch': 1.16} {'loss': 0.2862, 'learning_rate': 7.946764922849067e-06, 'epoch': 1.16} {'loss': 0.4216, 'learning_rate': 7.946436104640186e-06, 'epoch': 1.16} {'loss': 0.3634, 'learning_rate': 7.94610728874939e-06, 'epoch': 1.16} {'loss': 0.4351, 'learning_rate': 7.945778475177048e-06, 'epoch': 1.16} {'loss': 0.3058, 'learning_rate': 7.94544966392353e-06, 'epoch': 1.16} {'loss': 0.3153, 'learning_rate': 7.945120854989208e-06, 'epoch': 1.16} {'loss': 0.3045, 'learning_rate': 7.944792048374455e-06, 'epoch': 1.16} {'loss': 0.5554, 'learning_rate': 7.94446324407964e-06, 'epoch': 1.16} {'loss': 0.3495, 'learning_rate': 7.944134442105136e-06, 'epoch': 1.16} {'loss': 0.4712, 'learning_rate': 7.943805642451313e-06, 'epoch': 1.16} {'loss': 0.3947, 'learning_rate': 7.943476845118541e-06, 'epoch': 1.16} {'loss': 0.27, 'learning_rate': 7.943148050107194e-06, 'epoch': 1.16} {'loss': 0.3177, 'learning_rate': 7.942819257417643e-06, 'epoch': 1.16} {'loss': 0.3131, 'learning_rate': 7.942490467050255e-06, 'epoch': 1.16} {'loss': 0.2961, 'learning_rate': 7.942161679005407e-06, 'epoch': 1.16} {'loss': 0.3672, 'learning_rate': 7.941832893283467e-06, 'epoch': 1.16} {'loss': 0.2788, 'learning_rate': 7.941504109884804e-06, 'epoch': 1.16} {'loss': 0.2037, 'learning_rate': 7.941175328809794e-06, 'epoch': 1.16} {'loss': 0.2951, 'learning_rate': 7.940846550058803e-06, 'epoch': 1.16} {'loss': 0.4166, 'learning_rate': 7.940517773632206e-06, 'epoch': 1.16} {'loss': 0.3088, 'learning_rate': 7.940188999530372e-06, 'epoch': 1.16} {'loss': 0.2213, 'learning_rate': 7.939860227753674e-06, 'epoch': 1.16} {'loss': 0.3309, 'learning_rate': 7.939531458302481e-06, 'epoch': 1.16} {'loss': 0.1902, 'learning_rate': 7.939202691177164e-06, 'epoch': 1.16} {'loss': 0.4442, 'learning_rate': 7.938873926378099e-06, 'epoch': 1.16} {'loss': 0.3273, 'learning_rate': 7.93854516390565e-06, 'epoch': 1.16} {'loss': 0.3185, 'learning_rate': 7.938216403760193e-06, 'epoch': 1.16} {'loss': 0.3196, 'learning_rate': 7.937887645942098e-06, 'epoch': 1.16} {'loss': 0.2854, 'learning_rate': 7.937558890451736e-06, 'epoch': 1.16} {'loss': 0.3933, 'learning_rate': 7.937230137289476e-06, 'epoch': 1.16} {'loss': 0.4307, 'learning_rate': 7.936901386455692e-06, 'epoch': 1.16} {'loss': 0.2909, 'learning_rate': 7.936572637950755e-06, 'epoch': 1.16} {'loss': 0.2593, 'learning_rate': 7.936243891775033e-06, 'epoch': 1.16} {'loss': 0.2374, 'learning_rate': 7.9359151479289e-06, 'epoch': 1.16} {'loss': 0.282, 'learning_rate': 7.935586406412726e-06, 'epoch': 1.16} {'loss': 0.3397, 'learning_rate': 7.935257667226883e-06, 'epoch': 1.16} {'loss': 0.3114, 'learning_rate': 7.934928930371742e-06, 'epoch': 1.16} {'loss': 0.3984, 'learning_rate': 7.934600195847672e-06, 'epoch': 1.16} {'loss': 0.3388, 'learning_rate': 7.934271463655046e-06, 'epoch': 1.16} {'loss': 0.264, 'learning_rate': 7.933942733794236e-06, 'epoch': 1.16} {'loss': 0.4262, 'learning_rate': 7.93361400626561e-06, 'epoch': 1.16} {'loss': 0.3541, 'learning_rate': 7.933285281069545e-06, 'epoch': 1.16} {'loss': 0.3082, 'learning_rate': 7.932956558206404e-06, 'epoch': 1.16} {'loss': 0.4258, 'learning_rate': 7.932627837676563e-06, 'epoch': 1.16} {'loss': 0.2428, 'learning_rate': 7.932299119480391e-06, 'epoch': 1.16} {'loss': 0.3872, 'learning_rate': 7.931970403618261e-06, 'epoch': 1.16} {'loss': 0.4026, 'learning_rate': 7.931641690090543e-06, 'epoch': 1.16} {'loss': 0.3523, 'learning_rate': 7.931312978897608e-06, 'epoch': 1.16} {'loss': 0.4032, 'learning_rate': 7.930984270039828e-06, 'epoch': 1.16} {'loss': 0.3766, 'learning_rate': 7.93065556351757e-06, 'epoch': 1.16} {'loss': 0.2874, 'learning_rate': 7.93032685933121e-06, 'epoch': 1.16} {'loss': 0.1953, 'learning_rate': 7.92999815748112e-06, 'epoch': 1.16} {'loss': 0.4314, 'learning_rate': 7.929669457967667e-06, 'epoch': 1.16} {'loss': 0.2968, 'learning_rate': 7.929340760791224e-06, 'epoch': 1.16} {'loss': 0.2742, 'learning_rate': 7.92901206595216e-06, 'epoch': 1.16} {'loss': 0.1682, 'learning_rate': 7.928683373450849e-06, 'epoch': 1.16} {'loss': 0.3034, 'learning_rate': 7.92835468328766e-06, 'epoch': 1.16} {'loss': 0.3195, 'learning_rate': 7.928025995462965e-06, 'epoch': 1.16} {'loss': 0.2152, 'learning_rate': 7.927697309977134e-06, 'epoch': 1.16} {'loss': 0.2102, 'learning_rate': 7.927368626830538e-06, 'epoch': 1.16} {'loss': 0.3437, 'learning_rate': 7.92703994602355e-06, 'epoch': 1.16} {'loss': 0.3313, 'learning_rate': 7.926711267556539e-06, 'epoch': 1.16} {'loss': 0.3108, 'learning_rate': 7.92638259142988e-06, 'epoch': 1.16} {'loss': 0.2279, 'learning_rate': 7.926053917643938e-06, 'epoch': 1.16} {'loss': 0.2663, 'learning_rate': 7.925725246199087e-06, 'epoch': 1.16} {'loss': 0.3898, 'learning_rate': 7.925396577095696e-06, 'epoch': 1.16} {'loss': 0.2619, 'learning_rate': 7.92506791033414e-06, 'epoch': 1.16} {'loss': 0.3334, 'learning_rate': 7.924739245914787e-06, 'epoch': 1.16} {'loss': 0.3312, 'learning_rate': 7.924410583838009e-06, 'epoch': 1.16} {'loss': 0.2255, 'learning_rate': 7.924081924104176e-06, 'epoch': 1.16} {'loss': 0.3817, 'learning_rate': 7.92375326671366e-06, 'epoch': 1.16} {'loss': 0.2072, 'learning_rate': 7.923424611666832e-06, 'epoch': 1.16} {'loss': 0.2757, 'learning_rate': 7.923095958964064e-06, 'epoch': 1.16} {'loss': 0.3158, 'learning_rate': 7.922767308605724e-06, 'epoch': 1.16} {'loss': 0.2322, 'learning_rate': 7.922438660592184e-06, 'epoch': 1.16} {'loss': 0.3702, 'learning_rate': 7.92211001492382e-06, 'epoch': 1.16} {'loss': 0.3376, 'learning_rate': 7.921781371600995e-06, 'epoch': 1.16} {'loss': 0.3694, 'learning_rate': 7.921452730624083e-06, 'epoch': 1.16} {'loss': 0.3321, 'learning_rate': 7.921124091993457e-06, 'epoch': 1.16} {'loss': 0.3216, 'learning_rate': 7.920795455709487e-06, 'epoch': 1.16} {'loss': 0.3567, 'learning_rate': 7.920466821772543e-06, 'epoch': 1.16} {'loss': 0.4264, 'learning_rate': 7.920138190182996e-06, 'epoch': 1.16} {'loss': 0.3823, 'learning_rate': 7.919809560941218e-06, 'epoch': 1.16} {'loss': 0.3667, 'learning_rate': 7.91948093404758e-06, 'epoch': 1.16} {'loss': 0.4807, 'learning_rate': 7.919152309502452e-06, 'epoch': 1.16} {'loss': 0.4022, 'learning_rate': 7.918823687306204e-06, 'epoch': 1.16} {'loss': 0.1916, 'learning_rate': 7.91849506745921e-06, 'epoch': 1.16} {'loss': 0.3286, 'learning_rate': 7.918166449961839e-06, 'epoch': 1.16} {'loss': 0.3722, 'learning_rate': 7.917837834814463e-06, 'epoch': 1.16} {'loss': 0.3613, 'learning_rate': 7.91750922201745e-06, 'epoch': 1.16} {'loss': 0.3658, 'learning_rate': 7.917180611571176e-06, 'epoch': 1.16} {'loss': 0.3911, 'learning_rate': 7.916852003476007e-06, 'epoch': 1.16} {'loss': 0.259, 'learning_rate': 7.916523397732315e-06, 'epoch': 1.16} {'loss': 0.2892, 'learning_rate': 7.916194794340473e-06, 'epoch': 1.16} {'loss': 0.2415, 'learning_rate': 7.91586619330085e-06, 'epoch': 1.16} {'loss': 0.3747, 'learning_rate': 7.915537594613819e-06, 'epoch': 1.16} {'loss': 0.3493, 'learning_rate': 7.91520899827975e-06, 'epoch': 1.16} {'loss': 0.3151, 'learning_rate': 7.914880404299012e-06, 'epoch': 1.16} {'loss': 0.3632, 'learning_rate': 7.914551812671978e-06, 'epoch': 1.16} {'loss': 0.2879, 'learning_rate': 7.91422322339902e-06, 'epoch': 1.16} {'loss': 0.3283, 'learning_rate': 7.913894636480505e-06, 'epoch': 1.16} {'loss': 0.3898, 'learning_rate': 7.91356605191681e-06, 'epoch': 1.16} {'loss': 0.3978, 'learning_rate': 7.9132374697083e-06, 'epoch': 1.16} {'loss': 0.3476, 'learning_rate': 7.912908889855347e-06, 'epoch': 1.16} {'loss': 0.3499, 'learning_rate': 7.912580312358324e-06, 'epoch': 1.16} {'loss': 0.3122, 'learning_rate': 7.9122517372176e-06, 'epoch': 1.16} {'loss': 0.3641, 'learning_rate': 7.911923164433546e-06, 'epoch': 1.16} {'loss': 0.3609, 'learning_rate': 7.911594594006536e-06, 'epoch': 1.16} {'loss': 0.3527, 'learning_rate': 7.911266025936937e-06, 'epoch': 1.16} {'loss': 0.3657, 'learning_rate': 7.910937460225122e-06, 'epoch': 1.16} {'loss': 0.2123, 'learning_rate': 7.910608896871462e-06, 'epoch': 1.16} {'loss': 0.2501, 'learning_rate': 7.910280335876326e-06, 'epoch': 1.16} {'loss': 0.2598, 'learning_rate': 7.909951777240087e-06, 'epoch': 1.16} {'loss': 0.3463, 'learning_rate': 7.909623220963114e-06, 'epoch': 1.16} {'loss': 0.3124, 'learning_rate': 7.909294667045782e-06, 'epoch': 1.16} {'loss': 0.4412, 'learning_rate': 7.908966115488457e-06, 'epoch': 1.16} {'loss': 0.3415, 'learning_rate': 7.90863756629151e-06, 'epoch': 1.16} {'loss': 0.3774, 'learning_rate': 7.908309019455315e-06, 'epoch': 1.16} {'loss': 0.31, 'learning_rate': 7.907980474980242e-06, 'epoch': 1.16} {'loss': 0.4529, 'learning_rate': 7.90765193286666e-06, 'epoch': 1.16} {'loss': 0.3723, 'learning_rate': 7.907323393114939e-06, 'epoch': 1.16} {'loss': 0.3575, 'learning_rate': 7.906994855725454e-06, 'epoch': 1.16} {'loss': 0.2512, 'learning_rate': 7.906666320698575e-06, 'epoch': 1.16} {'loss': 0.3472, 'learning_rate': 7.90633778803467e-06, 'epoch': 1.16} {'loss': 0.3775, 'learning_rate': 7.906009257734113e-06, 'epoch': 1.16} {'loss': 0.4501, 'learning_rate': 7.905680729797272e-06, 'epoch': 1.16} {'loss': 0.3212, 'learning_rate': 7.905352204224518e-06, 'epoch': 1.16} {'loss': 0.2692, 'learning_rate': 7.905023681016227e-06, 'epoch': 1.16} {'loss': 0.3419, 'learning_rate': 7.904695160172764e-06, 'epoch': 1.16} {'loss': 0.208, 'learning_rate': 7.904366641694502e-06, 'epoch': 1.16} {'loss': 0.4135, 'learning_rate': 7.904038125581811e-06, 'epoch': 1.16} {'loss': 0.2079, 'learning_rate': 7.903709611835062e-06, 'epoch': 1.16} {'loss': 0.423, 'learning_rate': 7.903381100454626e-06, 'epoch': 1.16} {'loss': 0.1736, 'learning_rate': 7.903052591440875e-06, 'epoch': 1.16} {'loss': 0.3472, 'learning_rate': 7.902724084794178e-06, 'epoch': 1.16} {'loss': 0.2218, 'learning_rate': 7.902395580514908e-06, 'epoch': 1.16} {'loss': 0.3026, 'learning_rate': 7.902067078603433e-06, 'epoch': 1.16} {'loss': 0.2671, 'learning_rate': 7.901738579060125e-06, 'epoch': 1.16} {'loss': 0.4039, 'learning_rate': 7.901410081885356e-06, 'epoch': 1.16} {'loss': 0.3385, 'learning_rate': 7.901081587079497e-06, 'epoch': 1.16} {'loss': 0.356, 'learning_rate': 7.900753094642917e-06, 'epoch': 1.16} {'loss': 0.3519, 'learning_rate': 7.900424604575989e-06, 'epoch': 1.16} {'loss': 0.3548, 'learning_rate': 7.90009611687908e-06, 'epoch': 1.16} {'loss': 0.2583, 'learning_rate': 7.899767631552565e-06, 'epoch': 1.16} {'loss': 0.3541, 'learning_rate': 7.89943914859681e-06, 'epoch': 1.16} {'loss': 0.3946, 'learning_rate': 7.899110668012191e-06, 'epoch': 1.16} {'loss': 0.4566, 'learning_rate': 7.898782189799077e-06, 'epoch': 1.16} {'loss': 0.4247, 'learning_rate': 7.898453713957836e-06, 'epoch': 1.16} {'loss': 0.3389, 'learning_rate': 7.898125240488844e-06, 'epoch': 1.16} {'loss': 0.4089, 'learning_rate': 7.897796769392466e-06, 'epoch': 1.16} {'loss': 0.39, 'learning_rate': 7.897468300669076e-06, 'epoch': 1.16} {'loss': 0.3369, 'learning_rate': 7.897139834319045e-06, 'epoch': 1.16} {'loss': 0.3892, 'learning_rate': 7.896811370342746e-06, 'epoch': 1.16} {'loss': 0.3838, 'learning_rate': 7.896482908740543e-06, 'epoch': 1.16} {'loss': 0.3349, 'learning_rate': 7.896154449512814e-06, 'epoch': 1.16} {'loss': 0.3293, 'learning_rate': 7.895825992659925e-06, 'epoch': 1.16} {'loss': 0.2969, 'learning_rate': 7.895497538182249e-06, 'epoch': 1.16} {'loss': 0.2537, 'learning_rate': 7.895169086080154e-06, 'epoch': 1.16} {'loss': 0.1779, 'learning_rate': 7.894840636354016e-06, 'epoch': 1.16} {'loss': 0.2947, 'learning_rate': 7.894512189004201e-06, 'epoch': 1.16} {'loss': 0.2565, 'learning_rate': 7.894183744031081e-06, 'epoch': 1.16} {'loss': 0.2417, 'learning_rate': 7.893855301435029e-06, 'epoch': 1.16} {'loss': 0.3078, 'learning_rate': 7.893526861216413e-06, 'epoch': 1.16} {'loss': 0.3042, 'learning_rate': 7.893198423375606e-06, 'epoch': 1.16} {'loss': 0.2673, 'learning_rate': 7.892869987912975e-06, 'epoch': 1.16} {'loss': 0.4552, 'learning_rate': 7.892541554828893e-06, 'epoch': 1.16} {'loss': 0.346, 'learning_rate': 7.892213124123731e-06, 'epoch': 1.16} {'loss': 0.4405, 'learning_rate': 7.89188469579786e-06, 'epoch': 1.16} {'loss': 0.372, 'learning_rate': 7.89155626985165e-06, 'epoch': 1.16} {'loss': 0.3569, 'learning_rate': 7.891227846285473e-06, 'epoch': 1.16} {'loss': 0.3768, 'learning_rate': 7.890899425099697e-06, 'epoch': 1.16} {'loss': 0.4265, 'learning_rate': 7.890571006294696e-06, 'epoch': 1.16} {'loss': 0.4043, 'learning_rate': 7.890242589870838e-06, 'epoch': 1.16} {'loss': 0.3767, 'learning_rate': 7.889914175828497e-06, 'epoch': 1.16} {'loss': 0.4592, 'learning_rate': 7.889585764168041e-06, 'epoch': 1.16} {'loss': 0.3222, 'learning_rate': 7.889257354889842e-06, 'epoch': 1.16} {'loss': 0.2956, 'learning_rate': 7.888928947994269e-06, 'epoch': 1.16} {'loss': 0.3807, 'learning_rate': 7.888600543481693e-06, 'epoch': 1.16} {'loss': 0.3689, 'learning_rate': 7.888272141352486e-06, 'epoch': 1.16} {'loss': 0.3907, 'learning_rate': 7.887943741607017e-06, 'epoch': 1.16} {'loss': 0.3752, 'learning_rate': 7.88761534424566e-06, 'epoch': 1.16} {'loss': 0.269, 'learning_rate': 7.887286949268784e-06, 'epoch': 1.16} {'loss': 0.3697, 'learning_rate': 7.886958556676757e-06, 'epoch': 1.16} {'loss': 0.2065, 'learning_rate': 7.886630166469954e-06, 'epoch': 1.16} {'loss': 0.2878, 'learning_rate': 7.886301778648742e-06, 'epoch': 1.16} {'loss': 0.2963, 'learning_rate': 7.885973393213494e-06, 'epoch': 1.16} {'loss': 0.2851, 'learning_rate': 7.88564501016458e-06, 'epoch': 1.16} {'loss': 0.3097, 'learning_rate': 7.885316629502372e-06, 'epoch': 1.16} {'loss': 0.3114, 'learning_rate': 7.884988251227238e-06, 'epoch': 1.16} {'loss': 0.2814, 'learning_rate': 7.88465987533955e-06, 'epoch': 1.16} {'loss': 0.2929, 'learning_rate': 7.884331501839679e-06, 'epoch': 1.16} {'loss': 0.2974, 'learning_rate': 7.884003130727996e-06, 'epoch': 1.16} {'loss': 0.2989, 'learning_rate': 7.88367476200487e-06, 'epoch': 1.16} {'loss': 0.2758, 'learning_rate': 7.883346395670674e-06, 'epoch': 1.16} {'loss': 0.4166, 'learning_rate': 7.883018031725776e-06, 'epoch': 1.16} {'loss': 0.3203, 'learning_rate': 7.882689670170548e-06, 'epoch': 1.16} {'loss': 0.2059, 'learning_rate': 7.882361311005363e-06, 'epoch': 1.16} {'loss': 0.4744, 'learning_rate': 7.882032954230587e-06, 'epoch': 1.16} {'loss': 0.2718, 'learning_rate': 7.881704599846594e-06, 'epoch': 1.16} {'loss': 0.3315, 'learning_rate': 7.881376247853753e-06, 'epoch': 1.16} {'loss': 0.2871, 'learning_rate': 7.881047898252436e-06, 'epoch': 1.16} {'loss': 0.3866, 'learning_rate': 7.880719551043016e-06, 'epoch': 1.16} {'loss': 0.3015, 'learning_rate': 7.880391206225857e-06, 'epoch': 1.16} {'loss': 0.3212, 'learning_rate': 7.880062863801334e-06, 'epoch': 1.16} {'loss': 0.2348, 'learning_rate': 7.879734523769818e-06, 'epoch': 1.16} {'loss': 0.4267, 'learning_rate': 7.879406186131676e-06, 'epoch': 1.16} {'loss': 0.1174, 'learning_rate': 7.879077850887282e-06, 'epoch': 1.16} {'loss': 0.446, 'learning_rate': 7.878749518037006e-06, 'epoch': 1.16} {'loss': 0.3339, 'learning_rate': 7.87842118758122e-06, 'epoch': 1.16} {'loss': 0.4452, 'learning_rate': 7.878092859520291e-06, 'epoch': 1.16} {'loss': 0.3307, 'learning_rate': 7.877764533854593e-06, 'epoch': 1.16} {'loss': 0.2428, 'learning_rate': 7.877436210584493e-06, 'epoch': 1.16} {'loss': 0.3129, 'learning_rate': 7.877107889710367e-06, 'epoch': 1.16} {'loss': 0.3001, 'learning_rate': 7.87677957123258e-06, 'epoch': 1.16} {'loss': 0.3911, 'learning_rate': 7.876451255151509e-06, 'epoch': 1.16} {'loss': 0.2497, 'learning_rate': 7.876122941467518e-06, 'epoch': 1.16} {'loss': 0.2519, 'learning_rate': 7.87579463018098e-06, 'epoch': 1.16} {'loss': 0.3429, 'learning_rate': 7.875466321292267e-06, 'epoch': 1.16} {'loss': 0.2282, 'learning_rate': 7.875138014801746e-06, 'epoch': 1.16} {'loss': 0.4511, 'learning_rate': 7.874809710709792e-06, 'epoch': 1.16} {'loss': 0.2554, 'learning_rate': 7.874481409016774e-06, 'epoch': 1.16} {'loss': 0.373, 'learning_rate': 7.874153109723062e-06, 'epoch': 1.16} {'loss': 0.3403, 'learning_rate': 7.873824812829026e-06, 'epoch': 1.16} {'loss': 0.4589, 'learning_rate': 7.873496518335038e-06, 'epoch': 1.16} {'loss': 0.2541, 'learning_rate': 7.873168226241469e-06, 'epoch': 1.16} {'loss': 0.363, 'learning_rate': 7.872839936548687e-06, 'epoch': 1.16} {'loss': 0.2043, 'learning_rate': 7.872511649257066e-06, 'epoch': 1.16} {'loss': 0.2551, 'learning_rate': 7.872183364366976e-06, 'epoch': 1.16} {'loss': 0.3436, 'learning_rate': 7.871855081878784e-06, 'epoch': 1.16} {'loss': 0.2237, 'learning_rate': 7.871526801792862e-06, 'epoch': 1.16} {'loss': 0.2571, 'learning_rate': 7.871198524109583e-06, 'epoch': 1.16} {'loss': 0.2281, 'learning_rate': 7.870870248829317e-06, 'epoch': 1.16} {'loss': 0.2611, 'learning_rate': 7.87054197595243e-06, 'epoch': 1.16} {'loss': 0.2762, 'learning_rate': 7.8702137054793e-06, 'epoch': 1.16} {'loss': 0.4024, 'learning_rate': 7.869885437410292e-06, 'epoch': 1.16} {'loss': 0.3336, 'learning_rate': 7.869557171745778e-06, 'epoch': 1.16} {'loss': 0.3315, 'learning_rate': 7.86922890848613e-06, 'epoch': 1.16} {'loss': 0.449, 'learning_rate': 7.868900647631717e-06, 'epoch': 1.16} {'loss': 0.4006, 'learning_rate': 7.86857238918291e-06, 'epoch': 1.16} {'loss': 0.3872, 'learning_rate': 7.868244133140077e-06, 'epoch': 1.16} {'loss': 0.3981, 'learning_rate': 7.867915879503595e-06, 'epoch': 1.16} {'loss': 0.4002, 'learning_rate': 7.867587628273829e-06, 'epoch': 1.16} {'loss': 0.2736, 'learning_rate': 7.867259379451151e-06, 'epoch': 1.16} {'loss': 0.241, 'learning_rate': 7.86693113303593e-06, 'epoch': 1.16} {'loss': 0.3289, 'learning_rate': 7.86660288902854e-06, 'epoch': 1.16} {'loss': 0.3411, 'learning_rate': 7.86627464742935e-06, 'epoch': 1.16} {'loss': 0.3772, 'learning_rate': 7.86594640823873e-06, 'epoch': 1.16} {'loss': 0.2315, 'learning_rate': 7.865618171457048e-06, 'epoch': 1.16} {'loss': 0.267, 'learning_rate': 7.865289937084678e-06, 'epoch': 1.16} {'loss': 0.4424, 'learning_rate': 7.864961705121991e-06, 'epoch': 1.16} {'loss': 0.3994, 'learning_rate': 7.864633475569357e-06, 'epoch': 1.16} {'loss': 0.3072, 'learning_rate': 7.864305248427144e-06, 'epoch': 1.16} {'loss': 0.3838, 'learning_rate': 7.863977023695725e-06, 'epoch': 1.16} {'loss': 0.2808, 'learning_rate': 7.86364880137547e-06, 'epoch': 1.16} {'loss': 0.302, 'learning_rate': 7.863320581466749e-06, 'epoch': 1.16} {'loss': 0.3329, 'learning_rate': 7.862992363969933e-06, 'epoch': 1.16} {'loss': 0.2732, 'learning_rate': 7.862664148885392e-06, 'epoch': 1.16} {'loss': 0.2694, 'learning_rate': 7.862335936213497e-06, 'epoch': 1.16} {'loss': 0.4539, 'learning_rate': 7.862007725954618e-06, 'epoch': 1.16} {'loss': 0.2649, 'learning_rate': 7.861679518109126e-06, 'epoch': 1.16} {'loss': 0.2318, 'learning_rate': 7.86135131267739e-06, 'epoch': 1.16} {'loss': 0.3997, 'learning_rate': 7.861023109659785e-06, 'epoch': 1.16} {'loss': 0.3547, 'learning_rate': 7.860694909056677e-06, 'epoch': 1.16} {'loss': 0.3157, 'learning_rate': 7.860366710868436e-06, 'epoch': 1.16} {'loss': 0.2664, 'learning_rate': 7.860038515095435e-06, 'epoch': 1.16} {'loss': 0.2638, 'learning_rate': 7.859710321738043e-06, 'epoch': 1.16} {'loss': 0.3917, 'learning_rate': 7.859382130796631e-06, 'epoch': 1.16} {'loss': 0.3589, 'learning_rate': 7.859053942271569e-06, 'epoch': 1.16} {'loss': 0.3308, 'learning_rate': 7.858725756163229e-06, 'epoch': 1.16} {'loss': 0.3029, 'learning_rate': 7.85839757247198e-06, 'epoch': 1.16} {'loss': 0.1913, 'learning_rate': 7.858069391198193e-06, 'epoch': 1.16} {'loss': 0.2897, 'learning_rate': 7.857741212342239e-06, 'epoch': 1.16} {'loss': 0.2309, 'learning_rate': 7.857413035904488e-06, 'epoch': 1.16} {'loss': 0.1782, 'learning_rate': 7.857084861885308e-06, 'epoch': 1.16} {'loss': 0.4718, 'learning_rate': 7.856756690285078e-06, 'epoch': 1.16} {'loss': 0.4043, 'learning_rate': 7.856428521104156e-06, 'epoch': 1.16} {'loss': 0.3286, 'learning_rate': 7.856100354342919e-06, 'epoch': 1.16} {'loss': 0.3079, 'learning_rate': 7.855772190001738e-06, 'epoch': 1.16} {'loss': 0.2875, 'learning_rate': 7.855444028080983e-06, 'epoch': 1.16} {'loss': 0.2759, 'learning_rate': 7.855115868581023e-06, 'epoch': 1.16} {'loss': 0.3804, 'learning_rate': 7.85478771150223e-06, 'epoch': 1.16} {'loss': 0.3453, 'learning_rate': 7.854459556844974e-06, 'epoch': 1.16} {'loss': 0.3089, 'learning_rate': 7.854131404609624e-06, 'epoch': 1.16} {'loss': 0.3486, 'learning_rate': 7.853803254796551e-06, 'epoch': 1.16} {'loss': 0.2179, 'learning_rate': 7.853475107406128e-06, 'epoch': 1.16} {'loss': 0.2867, 'learning_rate': 7.853146962438722e-06, 'epoch': 1.16} {'loss': 0.2659, 'learning_rate': 7.852818819894706e-06, 'epoch': 1.16} {'loss': 0.3204, 'learning_rate': 7.852490679774451e-06, 'epoch': 1.16} {'loss': 0.4181, 'learning_rate': 7.852162542078322e-06, 'epoch': 1.16} {'loss': 0.3022, 'learning_rate': 7.851834406806695e-06, 'epoch': 1.16} {'loss': 0.366, 'learning_rate': 7.851506273959938e-06, 'epoch': 1.16} {'loss': 0.2996, 'learning_rate': 7.851178143538422e-06, 'epoch': 1.16} {'loss': 0.2185, 'learning_rate': 7.850850015542515e-06, 'epoch': 1.16} {'loss': 0.4334, 'learning_rate': 7.850521889972593e-06, 'epoch': 1.16} {'loss': 0.2901, 'learning_rate': 7.850193766829021e-06, 'epoch': 1.16} {'loss': 0.3256, 'learning_rate': 7.849865646112172e-06, 'epoch': 1.16} {'loss': 0.4112, 'learning_rate': 7.849537527822416e-06, 'epoch': 1.16} {'loss': 0.4609, 'learning_rate': 7.849209411960124e-06, 'epoch': 1.16} {'loss': 0.4333, 'learning_rate': 7.848881298525663e-06, 'epoch': 1.16} {'loss': 0.4049, 'learning_rate': 7.848553187519408e-06, 'epoch': 1.16} {'loss': 0.4097, 'learning_rate': 7.84822507894173e-06, 'epoch': 1.16} {'loss': 0.4454, 'learning_rate': 7.847896972792993e-06, 'epoch': 1.16} {'loss': 0.3571, 'learning_rate': 7.847568869073571e-06, 'epoch': 1.16} {'loss': 0.4027, 'learning_rate': 7.847240767783836e-06, 'epoch': 1.16} {'loss': 0.4405, 'learning_rate': 7.846912668924155e-06, 'epoch': 1.16} {'loss': 0.3447, 'learning_rate': 7.846584572494902e-06, 'epoch': 1.16} {'loss': 0.4285, 'learning_rate': 7.846256478496445e-06, 'epoch': 1.16} {'loss': 0.2838, 'learning_rate': 7.845928386929154e-06, 'epoch': 1.17} {'loss': 0.478, 'learning_rate': 7.845600297793401e-06, 'epoch': 1.17} {'loss': 0.3649, 'learning_rate': 7.845272211089554e-06, 'epoch': 1.17} {'loss': 0.2206, 'learning_rate': 7.844944126817988e-06, 'epoch': 1.17} {'loss': 0.5048, 'learning_rate': 7.844616044979067e-06, 'epoch': 1.17} {'loss': 0.3556, 'learning_rate': 7.844287965573167e-06, 'epoch': 1.17} {'loss': 0.4312, 'learning_rate': 7.843959888600658e-06, 'epoch': 1.17} {'loss': 0.3482, 'learning_rate': 7.843631814061906e-06, 'epoch': 1.17} {'loss': 0.4263, 'learning_rate': 7.843303741957282e-06, 'epoch': 1.17} {'loss': 0.273, 'learning_rate': 7.84297567228716e-06, 'epoch': 1.17} {'loss': 0.3143, 'learning_rate': 7.842647605051906e-06, 'epoch': 1.17} {'loss': 0.3148, 'learning_rate': 7.842319540251894e-06, 'epoch': 1.17} {'loss': 0.4653, 'learning_rate': 7.841991477887494e-06, 'epoch': 1.17} {'loss': 0.25, 'learning_rate': 7.841663417959074e-06, 'epoch': 1.17} {'loss': 0.3662, 'learning_rate': 7.841335360467005e-06, 'epoch': 1.17} {'loss': 0.2597, 'learning_rate': 7.841007305411659e-06, 'epoch': 1.17} {'loss': 0.3156, 'learning_rate': 7.840679252793404e-06, 'epoch': 1.17} {'loss': 0.3264, 'learning_rate': 7.840351202612613e-06, 'epoch': 1.17} {'loss': 0.2159, 'learning_rate': 7.840023154869653e-06, 'epoch': 1.17} {'loss': 0.3462, 'learning_rate': 7.8396951095649e-06, 'epoch': 1.17} {'loss': 0.3657, 'learning_rate': 7.839367066698718e-06, 'epoch': 1.17} {'loss': 0.2715, 'learning_rate': 7.83903902627148e-06, 'epoch': 1.17} {'loss': 0.2945, 'learning_rate': 7.838710988283554e-06, 'epoch': 1.17} {'loss': 0.4313, 'learning_rate': 7.838382952735315e-06, 'epoch': 1.17} {'loss': 0.4624, 'learning_rate': 7.83805491962713e-06, 'epoch': 1.17} {'loss': 0.2658, 'learning_rate': 7.837726888959368e-06, 'epoch': 1.17} {'loss': 0.3675, 'learning_rate': 7.837398860732403e-06, 'epoch': 1.17} {'loss': 0.2738, 'learning_rate': 7.837070834946601e-06, 'epoch': 1.17} {'loss': 0.2786, 'learning_rate': 7.836742811602337e-06, 'epoch': 1.17} {'loss': 0.4689, 'learning_rate': 7.83641479069998e-06, 'epoch': 1.17} {'loss': 0.3461, 'learning_rate': 7.836086772239897e-06, 'epoch': 1.17} {'loss': 0.4472, 'learning_rate': 7.83575875622246e-06, 'epoch': 1.17} {'loss': 0.4214, 'learning_rate': 7.835430742648044e-06, 'epoch': 1.17} {'loss': 0.4089, 'learning_rate': 7.835102731517012e-06, 'epoch': 1.17} {'loss': 0.4614, 'learning_rate': 7.834774722829739e-06, 'epoch': 1.17} {'loss': 0.3934, 'learning_rate': 7.834446716586592e-06, 'epoch': 1.17} {'loss': 0.25, 'learning_rate': 7.834118712787943e-06, 'epoch': 1.17} {'loss': 0.3856, 'learning_rate': 7.833790711434162e-06, 'epoch': 1.17} {'loss': 0.2874, 'learning_rate': 7.83346271252562e-06, 'epoch': 1.17} {'loss': 0.275, 'learning_rate': 7.833134716062686e-06, 'epoch': 1.17} {'loss': 0.2562, 'learning_rate': 7.832806722045728e-06, 'epoch': 1.17} {'loss': 0.3141, 'learning_rate': 7.832478730475123e-06, 'epoch': 1.17} {'loss': 0.4823, 'learning_rate': 7.832150741351236e-06, 'epoch': 1.17} {'loss': 0.1809, 'learning_rate': 7.831822754674438e-06, 'epoch': 1.17} {'loss': 0.4025, 'learning_rate': 7.831494770445102e-06, 'epoch': 1.17} {'loss': 0.401, 'learning_rate': 7.831166788663594e-06, 'epoch': 1.17} {'loss': 0.3552, 'learning_rate': 7.830838809330288e-06, 'epoch': 1.17} {'loss': 0.196, 'learning_rate': 7.830510832445552e-06, 'epoch': 1.17} {'loss': 0.3949, 'learning_rate': 7.830182858009756e-06, 'epoch': 1.17} {'loss': 0.4812, 'learning_rate': 7.829854886023272e-06, 'epoch': 1.17} {'loss': 0.468, 'learning_rate': 7.829526916486467e-06, 'epoch': 1.17} {'loss': 0.2299, 'learning_rate': 7.829198949399716e-06, 'epoch': 1.17} {'loss': 0.4238, 'learning_rate': 7.828870984763385e-06, 'epoch': 1.17} {'loss': 0.3188, 'learning_rate': 7.828543022577849e-06, 'epoch': 1.17} {'loss': 0.4128, 'learning_rate': 7.828215062843472e-06, 'epoch': 1.17} {'loss': 0.4007, 'learning_rate': 7.827887105560627e-06, 'epoch': 1.17} {'loss': 0.3751, 'learning_rate': 7.827559150729685e-06, 'epoch': 1.17} {'loss': 0.3356, 'learning_rate': 7.827231198351015e-06, 'epoch': 1.17} {'loss': 0.4114, 'learning_rate': 7.826903248424988e-06, 'epoch': 1.17} {'loss': 0.3785, 'learning_rate': 7.826575300951976e-06, 'epoch': 1.17} {'loss': 0.3932, 'learning_rate': 7.826247355932343e-06, 'epoch': 1.17} {'loss': 0.2542, 'learning_rate': 7.825919413366467e-06, 'epoch': 1.17} {'loss': 0.3718, 'learning_rate': 7.825591473254713e-06, 'epoch': 1.17} {'loss': 0.3062, 'learning_rate': 7.825263535597454e-06, 'epoch': 1.17} {'loss': 0.4475, 'learning_rate': 7.824935600395057e-06, 'epoch': 1.17} {'loss': 0.265, 'learning_rate': 7.824607667647895e-06, 'epoch': 1.17} {'loss': 0.3041, 'learning_rate': 7.824279737356341e-06, 'epoch': 1.17} {'loss': 0.5546, 'learning_rate': 7.823951809520758e-06, 'epoch': 1.17} {'loss': 0.2968, 'learning_rate': 7.823623884141519e-06, 'epoch': 1.17} {'loss': 0.519, 'learning_rate': 7.823295961218995e-06, 'epoch': 1.17} {'loss': 0.4294, 'learning_rate': 7.822968040753556e-06, 'epoch': 1.17} {'loss': 0.1839, 'learning_rate': 7.822640122745574e-06, 'epoch': 1.17} {'loss': 0.2587, 'learning_rate': 7.822312207195413e-06, 'epoch': 1.17} {'loss': 0.3061, 'learning_rate': 7.821984294103451e-06, 'epoch': 1.17} {'loss': 0.4197, 'learning_rate': 7.821656383470053e-06, 'epoch': 1.17} {'loss': 0.2228, 'learning_rate': 7.821328475295592e-06, 'epoch': 1.17} {'loss': 0.4919, 'learning_rate': 7.821000569580436e-06, 'epoch': 1.17} {'loss': 0.3243, 'learning_rate': 7.820672666324956e-06, 'epoch': 1.17} {'loss': 0.3404, 'learning_rate': 7.820344765529522e-06, 'epoch': 1.17} {'loss': 0.3393, 'learning_rate': 7.820016867194507e-06, 'epoch': 1.17} {'loss': 0.24, 'learning_rate': 7.819688971320276e-06, 'epoch': 1.17} {'loss': 0.3623, 'learning_rate': 7.819361077907202e-06, 'epoch': 1.17} {'loss': 0.1712, 'learning_rate': 7.819033186955653e-06, 'epoch': 1.17} {'loss': 0.2837, 'learning_rate': 7.818705298466003e-06, 'epoch': 1.17} {'loss': 0.3603, 'learning_rate': 7.818377412438618e-06, 'epoch': 1.17} {'loss': 0.183, 'learning_rate': 7.818049528873872e-06, 'epoch': 1.17} {'loss': 0.4438, 'learning_rate': 7.817721647772132e-06, 'epoch': 1.17} {'loss': 0.4043, 'learning_rate': 7.817393769133768e-06, 'epoch': 1.17} {'loss': 0.3235, 'learning_rate': 7.817065892959154e-06, 'epoch': 1.17} {'loss': 0.3148, 'learning_rate': 7.816738019248656e-06, 'epoch': 1.17} {'loss': 0.4578, 'learning_rate': 7.816410148002647e-06, 'epoch': 1.17} {'loss': 0.2569, 'learning_rate': 7.816082279221493e-06, 'epoch': 1.17} {'loss': 0.3531, 'learning_rate': 7.81575441290557e-06, 'epoch': 1.17} {'loss': 0.321, 'learning_rate': 7.815426549055245e-06, 'epoch': 1.17} {'loss': 0.352, 'learning_rate': 7.815098687670886e-06, 'epoch': 1.17} {'loss': 0.2141, 'learning_rate': 7.814770828752866e-06, 'epoch': 1.17} {'loss': 0.3849, 'learning_rate': 7.814442972301552e-06, 'epoch': 1.17} {'loss': 0.36, 'learning_rate': 7.814115118317319e-06, 'epoch': 1.17} {'loss': 0.2941, 'learning_rate': 7.813787266800534e-06, 'epoch': 1.17} {'loss': 0.4227, 'learning_rate': 7.813459417751566e-06, 'epoch': 1.17} {'loss': 0.423, 'learning_rate': 7.813131571170787e-06, 'epoch': 1.17} {'loss': 0.4198, 'learning_rate': 7.812803727058566e-06, 'epoch': 1.17} {'loss': 0.292, 'learning_rate': 7.812475885415276e-06, 'epoch': 1.17} {'loss': 0.219, 'learning_rate': 7.812148046241284e-06, 'epoch': 1.17} {'loss': 0.4282, 'learning_rate': 7.811820209536959e-06, 'epoch': 1.17} {'loss': 0.3869, 'learning_rate': 7.811492375302673e-06, 'epoch': 1.17} {'loss': 0.4135, 'learning_rate': 7.8111645435388e-06, 'epoch': 1.17} {'loss': 0.2674, 'learning_rate': 7.810836714245703e-06, 'epoch': 1.17} {'loss': 0.3654, 'learning_rate': 7.810508887423755e-06, 'epoch': 1.17} {'loss': 0.2956, 'learning_rate': 7.810181063073326e-06, 'epoch': 1.17} {'loss': 0.3598, 'learning_rate': 7.809853241194788e-06, 'epoch': 1.17} {'loss': 0.5264, 'learning_rate': 7.809525421788507e-06, 'epoch': 1.17} {'loss': 0.2838, 'learning_rate': 7.809197604854855e-06, 'epoch': 1.17} {'loss': 0.2994, 'learning_rate': 7.808869790394203e-06, 'epoch': 1.17} {'loss': 0.1967, 'learning_rate': 7.808541978406921e-06, 'epoch': 1.17} {'loss': 0.2124, 'learning_rate': 7.808214168893378e-06, 'epoch': 1.17} {'loss': 0.3248, 'learning_rate': 7.807886361853944e-06, 'epoch': 1.17} {'loss': 0.3151, 'learning_rate': 7.80755855728899e-06, 'epoch': 1.17} {'loss': 0.3419, 'learning_rate': 7.807230755198884e-06, 'epoch': 1.17} {'loss': 0.3546, 'learning_rate': 7.806902955584e-06, 'epoch': 1.17} {'loss': 0.3276, 'learning_rate': 7.806575158444707e-06, 'epoch': 1.17} {'loss': 0.3981, 'learning_rate': 7.806247363781369e-06, 'epoch': 1.17} {'loss': 0.3926, 'learning_rate': 7.805919571594363e-06, 'epoch': 1.17} {'loss': 0.2953, 'learning_rate': 7.805591781884056e-06, 'epoch': 1.17} {'loss': 0.522, 'learning_rate': 7.805263994650819e-06, 'epoch': 1.17} {'loss': 0.4508, 'learning_rate': 7.80493620989502e-06, 'epoch': 1.17} {'loss': 0.4191, 'learning_rate': 7.804608427617031e-06, 'epoch': 1.17} {'loss': 0.2923, 'learning_rate': 7.804280647817223e-06, 'epoch': 1.17} {'loss': 0.2099, 'learning_rate': 7.803952870495964e-06, 'epoch': 1.17} {'loss': 0.2508, 'learning_rate': 7.803625095653624e-06, 'epoch': 1.17} {'loss': 0.42, 'learning_rate': 7.803297323290574e-06, 'epoch': 1.17} {'loss': 0.2246, 'learning_rate': 7.802969553407184e-06, 'epoch': 1.17} {'loss': 0.355, 'learning_rate': 7.802641786003826e-06, 'epoch': 1.17} {'loss': 0.2188, 'learning_rate': 7.802314021080864e-06, 'epoch': 1.17} {'loss': 0.4308, 'learning_rate': 7.801986258638674e-06, 'epoch': 1.17} {'loss': 0.2802, 'learning_rate': 7.80165849867762e-06, 'epoch': 1.17} {'loss': 0.1893, 'learning_rate': 7.80133074119808e-06, 'epoch': 1.17} {'loss': 0.3217, 'learning_rate': 7.801002986200416e-06, 'epoch': 1.17} {'loss': 0.3316, 'learning_rate': 7.800675233685002e-06, 'epoch': 1.17} {'loss': 0.4141, 'learning_rate': 7.800347483652207e-06, 'epoch': 1.17} {'loss': 0.2635, 'learning_rate': 7.8000197361024e-06, 'epoch': 1.17} {'loss': 0.35, 'learning_rate': 7.799691991035956e-06, 'epoch': 1.17} {'loss': 0.3888, 'learning_rate': 7.799364248453239e-06, 'epoch': 1.17} {'loss': 0.3268, 'learning_rate': 7.799036508354622e-06, 'epoch': 1.17} {'loss': 0.3727, 'learning_rate': 7.798708770740475e-06, 'epoch': 1.17} {'loss': 0.2991, 'learning_rate': 7.798381035611167e-06, 'epoch': 1.17} {'loss': 0.4755, 'learning_rate': 7.798053302967069e-06, 'epoch': 1.17} {'loss': 0.3797, 'learning_rate': 7.797725572808548e-06, 'epoch': 1.17} {'loss': 0.3392, 'learning_rate': 7.797397845135977e-06, 'epoch': 1.17} {'loss': 0.1931, 'learning_rate': 7.797070119949726e-06, 'epoch': 1.17} {'loss': 0.4551, 'learning_rate': 7.796742397250162e-06, 'epoch': 1.17} {'loss': 0.3422, 'learning_rate': 7.796414677037658e-06, 'epoch': 1.17} {'loss': 0.4792, 'learning_rate': 7.796086959312584e-06, 'epoch': 1.17} {'loss': 0.2723, 'learning_rate': 7.795759244075309e-06, 'epoch': 1.17} {'loss': 0.3021, 'learning_rate': 7.7954315313262e-06, 'epoch': 1.17} {'loss': 0.2612, 'learning_rate': 7.79510382106563e-06, 'epoch': 1.17} {'loss': 0.2471, 'learning_rate': 7.79477611329397e-06, 'epoch': 1.17} {'loss': 0.3125, 'learning_rate': 7.794448408011587e-06, 'epoch': 1.17} {'loss': 0.3418, 'learning_rate': 7.794120705218854e-06, 'epoch': 1.17} {'loss': 0.3762, 'learning_rate': 7.793793004916138e-06, 'epoch': 1.17} {'loss': 0.1924, 'learning_rate': 7.79346530710381e-06, 'epoch': 1.17} {'loss': 0.3941, 'learning_rate': 7.79313761178224e-06, 'epoch': 1.17} {'loss': 0.4977, 'learning_rate': 7.7928099189518e-06, 'epoch': 1.17} {'loss': 0.2342, 'learning_rate': 7.792482228612855e-06, 'epoch': 1.17} {'loss': 0.4907, 'learning_rate': 7.79215454076578e-06, 'epoch': 1.17} {'loss': 0.2369, 'learning_rate': 7.791826855410942e-06, 'epoch': 1.17} {'loss': 0.273, 'learning_rate': 7.791499172548713e-06, 'epoch': 1.17} {'loss': 0.3128, 'learning_rate': 7.79117149217946e-06, 'epoch': 1.17} {'loss': 0.2881, 'learning_rate': 7.790843814303553e-06, 'epoch': 1.17} {'loss': 0.2941, 'learning_rate': 7.790516138921365e-06, 'epoch': 1.17} {'loss': 0.214, 'learning_rate': 7.790188466033265e-06, 'epoch': 1.17} {'loss': 0.3282, 'learning_rate': 7.789860795639618e-06, 'epoch': 1.17} {'loss': 0.3274, 'learning_rate': 7.7895331277408e-06, 'epoch': 1.17} {'loss': 0.4466, 'learning_rate': 7.78920546233718e-06, 'epoch': 1.17} {'loss': 0.4132, 'learning_rate': 7.788877799429126e-06, 'epoch': 1.17} {'loss': 0.3229, 'learning_rate': 7.788550139017008e-06, 'epoch': 1.17} {'loss': 0.3671, 'learning_rate': 7.788222481101197e-06, 'epoch': 1.17} {'loss': 0.2912, 'learning_rate': 7.787894825682061e-06, 'epoch': 1.17} {'loss': 0.3295, 'learning_rate': 7.787567172759974e-06, 'epoch': 1.17} {'loss': 0.3556, 'learning_rate': 7.787239522335302e-06, 'epoch': 1.17} {'loss': 0.2407, 'learning_rate': 7.786911874408415e-06, 'epoch': 1.17} {'loss': 0.3268, 'learning_rate': 7.786584228979683e-06, 'epoch': 1.17} {'loss': 0.2212, 'learning_rate': 7.786256586049477e-06, 'epoch': 1.17} {'loss': 0.32, 'learning_rate': 7.785928945618166e-06, 'epoch': 1.17} {'loss': 0.2921, 'learning_rate': 7.78560130768612e-06, 'epoch': 1.17} {'loss': 0.3577, 'learning_rate': 7.78527367225371e-06, 'epoch': 1.17} {'loss': 0.2448, 'learning_rate': 7.784946039321305e-06, 'epoch': 1.17} {'loss': 0.3326, 'learning_rate': 7.784618408889274e-06, 'epoch': 1.17} {'loss': 0.3059, 'learning_rate': 7.784290780957988e-06, 'epoch': 1.17} {'loss': 0.3801, 'learning_rate': 7.783963155527815e-06, 'epoch': 1.17} {'loss': 0.2581, 'learning_rate': 7.783635532599127e-06, 'epoch': 1.17} {'loss': 0.5062, 'learning_rate': 7.783307912172293e-06, 'epoch': 1.17} {'loss': 0.3379, 'learning_rate': 7.782980294247686e-06, 'epoch': 1.17} {'loss': 0.2142, 'learning_rate': 7.78265267882567e-06, 'epoch': 1.17} {'loss': 0.3032, 'learning_rate': 7.782325065906617e-06, 'epoch': 1.17} {'loss': 0.3487, 'learning_rate': 7.781997455490898e-06, 'epoch': 1.17} {'loss': 0.3783, 'learning_rate': 7.781669847578881e-06, 'epoch': 1.17} {'loss': 0.2772, 'learning_rate': 7.781342242170937e-06, 'epoch': 1.17} {'loss': 0.1984, 'learning_rate': 7.781014639267436e-06, 'epoch': 1.17} {'loss': 0.3539, 'learning_rate': 7.780687038868749e-06, 'epoch': 1.17} {'loss': 0.3363, 'learning_rate': 7.780359440975243e-06, 'epoch': 1.17} {'loss': 0.3517, 'learning_rate': 7.780031845587289e-06, 'epoch': 1.17} {'loss': 0.3601, 'learning_rate': 7.779704252705257e-06, 'epoch': 1.17} {'loss': 0.3801, 'learning_rate': 7.779376662329517e-06, 'epoch': 1.17} {'loss': 0.2807, 'learning_rate': 7.779049074460437e-06, 'epoch': 1.17} {'loss': 0.3242, 'learning_rate': 7.778721489098392e-06, 'epoch': 1.17} {'loss': 0.3196, 'learning_rate': 7.778393906243746e-06, 'epoch': 1.17} {'loss': 0.4374, 'learning_rate': 7.77806632589687e-06, 'epoch': 1.17} {'loss': 0.3936, 'learning_rate': 7.777738748058134e-06, 'epoch': 1.17} {'loss': 0.278, 'learning_rate': 7.77741117272791e-06, 'epoch': 1.17} {'loss': 0.4215, 'learning_rate': 7.777083599906566e-06, 'epoch': 1.17} {'loss': 0.3933, 'learning_rate': 7.77675602959447e-06, 'epoch': 1.17} {'loss': 0.3513, 'learning_rate': 7.776428461791996e-06, 'epoch': 1.17} {'loss': 0.3344, 'learning_rate': 7.77610089649951e-06, 'epoch': 1.17} {'loss': 0.4901, 'learning_rate': 7.775773333717383e-06, 'epoch': 1.17} {'loss': 0.439, 'learning_rate': 7.775445773445986e-06, 'epoch': 1.17} {'loss': 0.418, 'learning_rate': 7.775118215685687e-06, 'epoch': 1.17} {'loss': 0.2723, 'learning_rate': 7.774790660436857e-06, 'epoch': 1.17} {'loss': 0.3138, 'learning_rate': 7.774463107699869e-06, 'epoch': 1.17} {'loss': 0.2543, 'learning_rate': 7.774135557475083e-06, 'epoch': 1.17} {'loss': 0.2375, 'learning_rate': 7.773808009762877e-06, 'epoch': 1.17} {'loss': 0.1893, 'learning_rate': 7.773480464563617e-06, 'epoch': 1.17} {'loss': 0.4101, 'learning_rate': 7.773152921877675e-06, 'epoch': 1.17} {'loss': 0.2615, 'learning_rate': 7.772825381705421e-06, 'epoch': 1.17} {'loss': 0.2981, 'learning_rate': 7.772497844047223e-06, 'epoch': 1.17} {'loss': 0.4036, 'learning_rate': 7.77217030890345e-06, 'epoch': 1.17} {'loss': 0.2064, 'learning_rate': 7.771842776274475e-06, 'epoch': 1.17} {'loss': 0.2748, 'learning_rate': 7.771515246160664e-06, 'epoch': 1.17} {'loss': 0.3572, 'learning_rate': 7.77118771856239e-06, 'epoch': 1.17} {'loss': 0.2595, 'learning_rate': 7.77086019348002e-06, 'epoch': 1.17} {'loss': 0.1954, 'learning_rate': 7.770532670913925e-06, 'epoch': 1.17} {'loss': 0.3326, 'learning_rate': 7.77020515086448e-06, 'epoch': 1.17} {'loss': 0.379, 'learning_rate': 7.769877633332044e-06, 'epoch': 1.17} {'loss': 0.3893, 'learning_rate': 7.769550118316993e-06, 'epoch': 1.17} {'loss': 0.3159, 'learning_rate': 7.769222605819696e-06, 'epoch': 1.17} {'loss': 0.2346, 'learning_rate': 7.76889509584052e-06, 'epoch': 1.17} {'loss': 0.3939, 'learning_rate': 7.768567588379841e-06, 'epoch': 1.17} {'loss': 0.2521, 'learning_rate': 7.768240083438023e-06, 'epoch': 1.17} {'loss': 0.2825, 'learning_rate': 7.767912581015437e-06, 'epoch': 1.17} {'loss': 0.2682, 'learning_rate': 7.767585081112452e-06, 'epoch': 1.17} {'loss': 0.4622, 'learning_rate': 7.76725758372944e-06, 'epoch': 1.17} {'loss': 0.3134, 'learning_rate': 7.76693008886677e-06, 'epoch': 1.17} {'loss': 0.2469, 'learning_rate': 7.766602596524813e-06, 'epoch': 1.17} {'loss': 0.4118, 'learning_rate': 7.766275106703936e-06, 'epoch': 1.17} {'loss': 0.348, 'learning_rate': 7.765947619404508e-06, 'epoch': 1.17} {'loss': 0.2077, 'learning_rate': 7.765620134626902e-06, 'epoch': 1.17} {'loss': 0.256, 'learning_rate': 7.765292652371486e-06, 'epoch': 1.17} {'loss': 0.3691, 'learning_rate': 7.764965172638629e-06, 'epoch': 1.17} {'loss': 0.3528, 'learning_rate': 7.764637695428701e-06, 'epoch': 1.17} {'loss': 0.2758, 'learning_rate': 7.764310220742073e-06, 'epoch': 1.17} {'loss': 0.4786, 'learning_rate': 7.763982748579112e-06, 'epoch': 1.17} {'loss': 0.2829, 'learning_rate': 7.763655278940193e-06, 'epoch': 1.17} {'loss': 0.2783, 'learning_rate': 7.76332781182568e-06, 'epoch': 1.17} {'loss': 0.4353, 'learning_rate': 7.763000347235944e-06, 'epoch': 1.17} {'loss': 0.2554, 'learning_rate': 7.762672885171356e-06, 'epoch': 1.17} {'loss': 0.3562, 'learning_rate': 7.762345425632282e-06, 'epoch': 1.17} {'loss': 0.3554, 'learning_rate': 7.762017968619098e-06, 'epoch': 1.17} {'loss': 0.3158, 'learning_rate': 7.761690514132167e-06, 'epoch': 1.17} {'loss': 0.4336, 'learning_rate': 7.761363062171865e-06, 'epoch': 1.17} {'loss': 0.5629, 'learning_rate': 7.761035612738557e-06, 'epoch': 1.17} {'loss': 0.3812, 'learning_rate': 7.760708165832614e-06, 'epoch': 1.17} {'loss': 0.4202, 'learning_rate': 7.760380721454405e-06, 'epoch': 1.17} {'loss': 0.3917, 'learning_rate': 7.7600532796043e-06, 'epoch': 1.17} {'loss': 0.2215, 'learning_rate': 7.75972584028267e-06, 'epoch': 1.17} {'loss': 0.3515, 'learning_rate': 7.759398403489884e-06, 'epoch': 1.17} {'loss': 0.2772, 'learning_rate': 7.759070969226313e-06, 'epoch': 1.17} {'loss': 0.4099, 'learning_rate': 7.75874353749232e-06, 'epoch': 1.17} {'loss': 0.2999, 'learning_rate': 7.758416108288282e-06, 'epoch': 1.17} {'loss': 0.334, 'learning_rate': 7.758088681614567e-06, 'epoch': 1.17} {'loss': 0.1859, 'learning_rate': 7.757761257471542e-06, 'epoch': 1.17} {'loss': 0.291, 'learning_rate': 7.757433835859576e-06, 'epoch': 1.17} {'loss': 0.25, 'learning_rate': 7.757106416779044e-06, 'epoch': 1.17} {'loss': 0.3364, 'learning_rate': 7.756779000230311e-06, 'epoch': 1.17} {'loss': 0.3313, 'learning_rate': 7.75645158621375e-06, 'epoch': 1.17} {'loss': 0.3208, 'learning_rate': 7.756124174729725e-06, 'epoch': 1.17} {'loss': 0.4477, 'learning_rate': 7.755796765778612e-06, 'epoch': 1.17} {'loss': 0.4617, 'learning_rate': 7.755469359360776e-06, 'epoch': 1.17} {'loss': 0.1561, 'learning_rate': 7.755141955476589e-06, 'epoch': 1.17} {'loss': 0.324, 'learning_rate': 7.75481455412642e-06, 'epoch': 1.17} {'loss': 0.2981, 'learning_rate': 7.75448715531064e-06, 'epoch': 1.17} {'loss': 0.3458, 'learning_rate': 7.754159759029614e-06, 'epoch': 1.17} {'loss': 0.2945, 'learning_rate': 7.753832365283715e-06, 'epoch': 1.17} {'loss': 0.2758, 'learning_rate': 7.753504974073314e-06, 'epoch': 1.17} {'loss': 0.2989, 'learning_rate': 7.753177585398777e-06, 'epoch': 1.17} {'loss': 0.2588, 'learning_rate': 7.752850199260476e-06, 'epoch': 1.17} {'loss': 0.4279, 'learning_rate': 7.75252281565878e-06, 'epoch': 1.17} {'loss': 0.3939, 'learning_rate': 7.752195434594058e-06, 'epoch': 1.17} {'loss': 0.3206, 'learning_rate': 7.75186805606668e-06, 'epoch': 1.17} {'loss': 0.303, 'learning_rate': 7.751540680077014e-06, 'epoch': 1.17} {'loss': 0.4677, 'learning_rate': 7.751213306625432e-06, 'epoch': 1.17} {'loss': 0.3634, 'learning_rate': 7.750885935712304e-06, 'epoch': 1.17} {'loss': 0.4538, 'learning_rate': 7.750558567337998e-06, 'epoch': 1.17} {'loss': 0.3228, 'learning_rate': 7.750231201502883e-06, 'epoch': 1.17} {'loss': 0.4045, 'learning_rate': 7.749903838207328e-06, 'epoch': 1.17} {'loss': 0.2956, 'learning_rate': 7.749576477451705e-06, 'epoch': 1.17} {'loss': 0.358, 'learning_rate': 7.749249119236382e-06, 'epoch': 1.17} {'loss': 0.3909, 'learning_rate': 7.748921763561727e-06, 'epoch': 1.17} {'loss': 0.2965, 'learning_rate': 7.748594410428115e-06, 'epoch': 1.17} {'loss': 0.3037, 'learning_rate': 7.748267059835908e-06, 'epoch': 1.17} {'loss': 0.2458, 'learning_rate': 7.747939711785481e-06, 'epoch': 1.17} {'loss': 0.4521, 'learning_rate': 7.747612366277202e-06, 'epoch': 1.17} {'loss': 0.4074, 'learning_rate': 7.74728502331144e-06, 'epoch': 1.17} {'loss': 0.4027, 'learning_rate': 7.746957682888565e-06, 'epoch': 1.17} {'loss': 0.3936, 'learning_rate': 7.746630345008945e-06, 'epoch': 1.17} {'loss': 0.2957, 'learning_rate': 7.746303009672954e-06, 'epoch': 1.17} {'loss': 0.2599, 'learning_rate': 7.745975676880957e-06, 'epoch': 1.17} {'loss': 0.4457, 'learning_rate': 7.745648346633323e-06, 'epoch': 1.17} {'loss': 0.2207, 'learning_rate': 7.745321018930425e-06, 'epoch': 1.17} {'loss': 0.2317, 'learning_rate': 7.74499369377263e-06, 'epoch': 1.17} {'loss': 0.2303, 'learning_rate': 7.74466637116031e-06, 'epoch': 1.17} {'loss': 0.4521, 'learning_rate': 7.74433905109383e-06, 'epoch': 1.17} {'loss': 0.4292, 'learning_rate': 7.744011733573562e-06, 'epoch': 1.17} {'loss': 0.2977, 'learning_rate': 7.743684418599879e-06, 'epoch': 1.17} {'loss': 0.3257, 'learning_rate': 7.743357106173146e-06, 'epoch': 1.17} {'loss': 0.3114, 'learning_rate': 7.743029796293734e-06, 'epoch': 1.17} {'loss': 0.3775, 'learning_rate': 7.74270248896201e-06, 'epoch': 1.17} {'loss': 0.2077, 'learning_rate': 7.742375184178347e-06, 'epoch': 1.17} {'loss': 0.2741, 'learning_rate': 7.742047881943114e-06, 'epoch': 1.17} {'loss': 0.4258, 'learning_rate': 7.74172058225668e-06, 'epoch': 1.17} {'loss': 0.3401, 'learning_rate': 7.741393285119412e-06, 'epoch': 1.17} {'loss': 0.2306, 'learning_rate': 7.741065990531683e-06, 'epoch': 1.17} {'loss': 0.3661, 'learning_rate': 7.74073869849386e-06, 'epoch': 1.17} {'loss': 0.319, 'learning_rate': 7.740411409006314e-06, 'epoch': 1.17} {'loss': 0.2782, 'learning_rate': 7.740084122069413e-06, 'epoch': 1.17} {'loss': 0.3298, 'learning_rate': 7.73975683768353e-06, 'epoch': 1.17} {'loss': 0.323, 'learning_rate': 7.739429555849029e-06, 'epoch': 1.17} {'loss': 0.5129, 'learning_rate': 7.739102276566282e-06, 'epoch': 1.17} {'loss': 0.2649, 'learning_rate': 7.738774999835658e-06, 'epoch': 1.17} {'loss': 0.2834, 'learning_rate': 7.73844772565753e-06, 'epoch': 1.17} {'loss': 0.2553, 'learning_rate': 7.738120454032261e-06, 'epoch': 1.17} {'loss': 0.4612, 'learning_rate': 7.737793184960227e-06, 'epoch': 1.17} {'loss': 0.3491, 'learning_rate': 7.737465918441795e-06, 'epoch': 1.17} {'loss': 0.2562, 'learning_rate': 7.737138654477332e-06, 'epoch': 1.17} {'loss': 0.3768, 'learning_rate': 7.736811393067208e-06, 'epoch': 1.17} {'loss': 0.3066, 'learning_rate': 7.736484134211795e-06, 'epoch': 1.17} {'loss': 0.2918, 'learning_rate': 7.73615687791146e-06, 'epoch': 1.17} {'loss': 0.3323, 'learning_rate': 7.735829624166574e-06, 'epoch': 1.17} {'loss': 0.3646, 'learning_rate': 7.735502372977505e-06, 'epoch': 1.17} {'loss': 0.4384, 'learning_rate': 7.735175124344623e-06, 'epoch': 1.17} {'loss': 0.4095, 'learning_rate': 7.734847878268298e-06, 'epoch': 1.17} {'loss': 0.4208, 'learning_rate': 7.7345206347489e-06, 'epoch': 1.17} {'loss': 0.438, 'learning_rate': 7.734193393786797e-06, 'epoch': 1.17} {'loss': 0.4229, 'learning_rate': 7.733866155382357e-06, 'epoch': 1.17} {'loss': 0.3183, 'learning_rate': 7.733538919535954e-06, 'epoch': 1.17} {'loss': 0.3909, 'learning_rate': 7.733211686247953e-06, 'epoch': 1.17} {'loss': 0.2203, 'learning_rate': 7.732884455518725e-06, 'epoch': 1.17} {'loss': 0.337, 'learning_rate': 7.73255722734864e-06, 'epoch': 1.17} {'loss': 0.4483, 'learning_rate': 7.732230001738067e-06, 'epoch': 1.17} {'loss': 0.3236, 'learning_rate': 7.731902778687373e-06, 'epoch': 1.17} {'loss': 0.3614, 'learning_rate': 7.731575558196932e-06, 'epoch': 1.17} {'loss': 0.2903, 'learning_rate': 7.73124834026711e-06, 'epoch': 1.17} {'loss': 0.4556, 'learning_rate': 7.73092112489828e-06, 'epoch': 1.17} {'loss': 0.3585, 'learning_rate': 7.730593912090805e-06, 'epoch': 1.17} {'loss': 0.3282, 'learning_rate': 7.730266701845057e-06, 'epoch': 1.17} {'loss': 0.2576, 'learning_rate': 7.729939494161409e-06, 'epoch': 1.17} {'loss': 0.2552, 'learning_rate': 7.729612289040226e-06, 'epoch': 1.17} {'loss': 0.3631, 'learning_rate': 7.729285086481879e-06, 'epoch': 1.17} {'loss': 0.3238, 'learning_rate': 7.728957886486738e-06, 'epoch': 1.17} {'loss': 0.4507, 'learning_rate': 7.728630689055171e-06, 'epoch': 1.17} {'loss': 0.2591, 'learning_rate': 7.72830349418755e-06, 'epoch': 1.17} {'loss': 0.3398, 'learning_rate': 7.72797630188424e-06, 'epoch': 1.17} {'loss': 0.4492, 'learning_rate': 7.727649112145613e-06, 'epoch': 1.17} {'loss': 0.2955, 'learning_rate': 7.727321924972039e-06, 'epoch': 1.17} {'loss': 0.2497, 'learning_rate': 7.726994740363885e-06, 'epoch': 1.17} {'loss': 0.3698, 'learning_rate': 7.726667558321526e-06, 'epoch': 1.17} {'loss': 0.3979, 'learning_rate': 7.726340378845323e-06, 'epoch': 1.17} {'loss': 0.2045, 'learning_rate': 7.72601320193565e-06, 'epoch': 1.17} {'loss': 0.3355, 'learning_rate': 7.725686027592875e-06, 'epoch': 1.17} {'loss': 0.4559, 'learning_rate': 7.725358855817369e-06, 'epoch': 1.17} {'loss': 0.3048, 'learning_rate': 7.725031686609501e-06, 'epoch': 1.17} {'loss': 0.3429, 'learning_rate': 7.724704519969638e-06, 'epoch': 1.17} {'loss': 0.3912, 'learning_rate': 7.724377355898152e-06, 'epoch': 1.17} {'loss': 0.2146, 'learning_rate': 7.724050194395411e-06, 'epoch': 1.17} {'loss': 0.1538, 'learning_rate': 7.723723035461785e-06, 'epoch': 1.17} {'loss': 0.3917, 'learning_rate': 7.723395879097641e-06, 'epoch': 1.17} {'loss': 0.3544, 'learning_rate': 7.723068725303352e-06, 'epoch': 1.17} {'loss': 0.3738, 'learning_rate': 7.722741574079284e-06, 'epoch': 1.17} {'loss': 0.4847, 'learning_rate': 7.722414425425809e-06, 'epoch': 1.17} {'loss': 0.3594, 'learning_rate': 7.722087279343297e-06, 'epoch': 1.17} {'loss': 0.2652, 'learning_rate': 7.721760135832113e-06, 'epoch': 1.17} {'loss': 0.3933, 'learning_rate': 7.721432994892627e-06, 'epoch': 1.17} {'loss': 0.3852, 'learning_rate': 7.721105856525214e-06, 'epoch': 1.17} {'loss': 0.4138, 'learning_rate': 7.720778720730235e-06, 'epoch': 1.17} {'loss': 0.208, 'learning_rate': 7.720451587508064e-06, 'epoch': 1.17} {'loss': 0.3244, 'learning_rate': 7.72012445685907e-06, 'epoch': 1.17} {'loss': 0.3038, 'learning_rate': 7.719797328783623e-06, 'epoch': 1.17} {'loss': 0.3236, 'learning_rate': 7.71947020328209e-06, 'epoch': 1.17} {'loss': 0.2272, 'learning_rate': 7.719143080354842e-06, 'epoch': 1.17} {'loss': 0.5023, 'learning_rate': 7.718815960002249e-06, 'epoch': 1.17} {'loss': 0.3854, 'learning_rate': 7.718488842224678e-06, 'epoch': 1.17} {'loss': 0.3826, 'learning_rate': 7.718161727022499e-06, 'epoch': 1.17} {'loss': 0.3272, 'learning_rate': 7.717834614396084e-06, 'epoch': 1.17} {'loss': 0.2575, 'learning_rate': 7.717507504345796e-06, 'epoch': 1.17} {'loss': 0.3315, 'learning_rate': 7.71718039687201e-06, 'epoch': 1.17} {'loss': 0.3806, 'learning_rate': 7.716853291975093e-06, 'epoch': 1.17} {'loss': 0.2274, 'learning_rate': 7.716526189655413e-06, 'epoch': 1.17} {'loss': 0.2654, 'learning_rate': 7.716199089913343e-06, 'epoch': 1.17} {'loss': 0.2478, 'learning_rate': 7.715871992749249e-06, 'epoch': 1.17} {'loss': 0.3889, 'learning_rate': 7.715544898163501e-06, 'epoch': 1.17} {'loss': 0.1198, 'learning_rate': 7.715217806156467e-06, 'epoch': 1.17} {'loss': 0.2885, 'learning_rate': 7.71489071672852e-06, 'epoch': 1.17} {'loss': 0.3914, 'learning_rate': 7.714563629880025e-06, 'epoch': 1.17} {'loss': 0.2874, 'learning_rate': 7.714236545611353e-06, 'epoch': 1.17} {'loss': 0.3049, 'learning_rate': 7.713909463922875e-06, 'epoch': 1.17} {'loss': 0.2467, 'learning_rate': 7.71358238481496e-06, 'epoch': 1.17} {'loss': 0.4022, 'learning_rate': 7.713255308287973e-06, 'epoch': 1.17} {'loss': 0.4131, 'learning_rate': 7.712928234342287e-06, 'epoch': 1.17} {'loss': 0.3463, 'learning_rate': 7.712601162978267e-06, 'epoch': 1.17} {'loss': 0.2866, 'learning_rate': 7.712274094196289e-06, 'epoch': 1.17} {'loss': 0.3583, 'learning_rate': 7.711947027996717e-06, 'epoch': 1.17} {'loss': 0.3116, 'learning_rate': 7.711619964379922e-06, 'epoch': 1.17} {'loss': 0.204, 'learning_rate': 7.711292903346273e-06, 'epoch': 1.17} {'loss': 0.3225, 'learning_rate': 7.71096584489614e-06, 'epoch': 1.17} {'loss': 0.2469, 'learning_rate': 7.710638789029889e-06, 'epoch': 1.17} {'loss': 0.2743, 'learning_rate': 7.710311735747893e-06, 'epoch': 1.17} {'loss': 0.2379, 'learning_rate': 7.709984685050519e-06, 'epoch': 1.17} {'loss': 0.2837, 'learning_rate': 7.709657636938137e-06, 'epoch': 1.17} {'loss': 0.2694, 'learning_rate': 7.709330591411119e-06, 'epoch': 1.17} {'loss': 0.3506, 'learning_rate': 7.709003548469827e-06, 'epoch': 1.17} {'loss': 0.2528, 'learning_rate': 7.708676508114637e-06, 'epoch': 1.17} {'loss': 0.3801, 'learning_rate': 7.708349470345913e-06, 'epoch': 1.17} {'loss': 0.2988, 'learning_rate': 7.708022435164027e-06, 'epoch': 1.17} {'loss': 0.307, 'learning_rate': 7.70769540256935e-06, 'epoch': 1.17} {'loss': 0.2369, 'learning_rate': 7.707368372562247e-06, 'epoch': 1.17} {'loss': 0.4259, 'learning_rate': 7.70704134514309e-06, 'epoch': 1.17} {'loss': 0.2663, 'learning_rate': 7.706714320312247e-06, 'epoch': 1.17} {'loss': 0.4411, 'learning_rate': 7.706387298070087e-06, 'epoch': 1.17} {'loss': 0.4762, 'learning_rate': 7.70606027841698e-06, 'epoch': 1.17} {'loss': 0.2226, 'learning_rate': 7.705733261353295e-06, 'epoch': 1.17} {'loss': 0.4548, 'learning_rate': 7.705406246879401e-06, 'epoch': 1.17} {'loss': 0.3292, 'learning_rate': 7.705079234995669e-06, 'epoch': 1.17} {'loss': 0.3128, 'learning_rate': 7.704752225702462e-06, 'epoch': 1.17} {'loss': 0.2614, 'learning_rate': 7.704425219000157e-06, 'epoch': 1.17} {'loss': 0.2561, 'learning_rate': 7.704098214889117e-06, 'epoch': 1.17} {'loss': 0.2874, 'learning_rate': 7.703771213369713e-06, 'epoch': 1.17} {'loss': 0.2839, 'learning_rate': 7.703444214442317e-06, 'epoch': 1.17} {'loss': 0.4794, 'learning_rate': 7.703117218107295e-06, 'epoch': 1.17} {'loss': 0.2458, 'learning_rate': 7.70279022436501e-06, 'epoch': 1.17} {'loss': 0.3674, 'learning_rate': 7.702463233215848e-06, 'epoch': 1.17} {'loss': 0.3195, 'learning_rate': 7.702136244660163e-06, 'epoch': 1.17} {'loss': 0.4423, 'learning_rate': 7.701809258698332e-06, 'epoch': 1.17} {'loss': 0.3011, 'learning_rate': 7.701482275330719e-06, 'epoch': 1.17} {'loss': 0.1521, 'learning_rate': 7.701155294557697e-06, 'epoch': 1.17} {'loss': 0.4622, 'learning_rate': 7.700828316379632e-06, 'epoch': 1.17} {'loss': 0.2315, 'learning_rate': 7.700501340796896e-06, 'epoch': 1.17} {'loss': 0.3627, 'learning_rate': 7.700174367809858e-06, 'epoch': 1.17} {'loss': 0.2272, 'learning_rate': 7.699847397418883e-06, 'epoch': 1.17} {'loss': 0.2293, 'learning_rate': 7.699520429624345e-06, 'epoch': 1.17} {'loss': 0.2346, 'learning_rate': 7.699193464426608e-06, 'epoch': 1.17} {'loss': 0.261, 'learning_rate': 7.698866501826047e-06, 'epoch': 1.17} {'loss': 0.2799, 'learning_rate': 7.698539541823027e-06, 'epoch': 1.17} {'loss': 0.4125, 'learning_rate': 7.698212584417922e-06, 'epoch': 1.17} {'loss': 0.4171, 'learning_rate': 7.697885629611093e-06, 'epoch': 1.17} {'loss': 0.4829, 'learning_rate': 7.697558677402913e-06, 'epoch': 1.17} {'loss': 0.409, 'learning_rate': 7.697231727793752e-06, 'epoch': 1.17} {'loss': 0.3591, 'learning_rate': 7.69690478078398e-06, 'epoch': 1.17} {'loss': 0.2956, 'learning_rate': 7.696577836373963e-06, 'epoch': 1.17} {'loss': 0.2533, 'learning_rate': 7.696250894564072e-06, 'epoch': 1.17} {'loss': 0.2878, 'learning_rate': 7.695923955354676e-06, 'epoch': 1.17} {'loss': 0.4457, 'learning_rate': 7.695597018746143e-06, 'epoch': 1.17} {'loss': 0.4111, 'learning_rate': 7.695270084738843e-06, 'epoch': 1.17} {'loss': 0.2981, 'learning_rate': 7.694943153333146e-06, 'epoch': 1.17} {'loss': 0.3018, 'learning_rate': 7.694616224529418e-06, 'epoch': 1.17} {'loss': 0.2565, 'learning_rate': 7.694289298328031e-06, 'epoch': 1.17} {'loss': 0.2415, 'learning_rate': 7.693962374729355e-06, 'epoch': 1.17} {'loss': 0.2849, 'learning_rate': 7.693635453733755e-06, 'epoch': 1.17} {'loss': 0.3732, 'learning_rate': 7.693308535341602e-06, 'epoch': 1.17} {'loss': 0.3699, 'learning_rate': 7.692981619553264e-06, 'epoch': 1.17} {'loss': 0.3972, 'learning_rate': 7.692654706369112e-06, 'epoch': 1.17} {'loss': 0.3938, 'learning_rate': 7.692327795789514e-06, 'epoch': 1.17} {'loss': 0.3601, 'learning_rate': 7.69200088781484e-06, 'epoch': 1.17} {'loss': 0.347, 'learning_rate': 7.691673982445456e-06, 'epoch': 1.17} {'loss': 0.2596, 'learning_rate': 7.691347079681735e-06, 'epoch': 1.17} {'loss': 0.2703, 'learning_rate': 7.691020179524042e-06, 'epoch': 1.17} {'loss': 0.4266, 'learning_rate': 7.69069328197275e-06, 'epoch': 1.17} {'loss': 0.4265, 'learning_rate': 7.690366387028226e-06, 'epoch': 1.17} {'loss': 0.4274, 'learning_rate': 7.690039494690839e-06, 'epoch': 1.17} {'loss': 0.4009, 'learning_rate': 7.68971260496096e-06, 'epoch': 1.17} {'loss': 0.2939, 'learning_rate': 7.689385717838952e-06, 'epoch': 1.17} {'loss': 0.2857, 'learning_rate': 7.689058833325192e-06, 'epoch': 1.17} {'loss': 0.2508, 'learning_rate': 7.688731951420044e-06, 'epoch': 1.17} {'loss': 0.2733, 'learning_rate': 7.688405072123877e-06, 'epoch': 1.17} {'loss': 0.2905, 'learning_rate': 7.68807819543706e-06, 'epoch': 1.17} {'loss': 0.305, 'learning_rate': 7.687751321359967e-06, 'epoch': 1.18} {'loss': 0.2606, 'learning_rate': 7.68742444989296e-06, 'epoch': 1.18} {'loss': 0.2123, 'learning_rate': 7.68709758103641e-06, 'epoch': 1.18} {'loss': 0.3528, 'learning_rate': 7.68677071479069e-06, 'epoch': 1.18} {'loss': 0.2944, 'learning_rate': 7.686443851156164e-06, 'epoch': 1.18} {'loss': 0.4147, 'learning_rate': 7.686116990133205e-06, 'epoch': 1.18} {'loss': 0.3835, 'learning_rate': 7.685790131722178e-06, 'epoch': 1.18} {'loss': 0.2377, 'learning_rate': 7.685463275923458e-06, 'epoch': 1.18} {'loss': 0.3793, 'learning_rate': 7.685136422737405e-06, 'epoch': 1.18} {'loss': 0.2648, 'learning_rate': 7.684809572164394e-06, 'epoch': 1.18} {'loss': 0.2146, 'learning_rate': 7.684482724204793e-06, 'epoch': 1.18} {'loss': 0.3097, 'learning_rate': 7.68415587885897e-06, 'epoch': 1.18} {'loss': 0.2434, 'learning_rate': 7.683829036127295e-06, 'epoch': 1.18} {'loss': 0.3484, 'learning_rate': 7.683502196010138e-06, 'epoch': 1.18} {'loss': 0.4425, 'learning_rate': 7.683175358507865e-06, 'epoch': 1.18} {'loss': 0.3029, 'learning_rate': 7.682848523620847e-06, 'epoch': 1.18} {'loss': 0.2606, 'learning_rate': 7.68252169134945e-06, 'epoch': 1.18} {'loss': 0.4047, 'learning_rate': 7.682194861694048e-06, 'epoch': 1.18} {'loss': 0.3321, 'learning_rate': 7.681868034655007e-06, 'epoch': 1.18} {'loss': 0.2674, 'learning_rate': 7.681541210232696e-06, 'epoch': 1.18} {'loss': 0.3722, 'learning_rate': 7.681214388427487e-06, 'epoch': 1.18} {'loss': 0.4787, 'learning_rate': 7.680887569239741e-06, 'epoch': 1.18} {'loss': 0.4137, 'learning_rate': 7.680560752669836e-06, 'epoch': 1.18} {'loss': 0.4833, 'learning_rate': 7.680233938718133e-06, 'epoch': 1.18} {'loss': 0.3404, 'learning_rate': 7.679907127385007e-06, 'epoch': 1.18} {'loss': 0.2504, 'learning_rate': 7.679580318670826e-06, 'epoch': 1.18} {'loss': 0.5112, 'learning_rate': 7.679253512575955e-06, 'epoch': 1.18} {'loss': 0.2935, 'learning_rate': 7.678926709100765e-06, 'epoch': 1.18} {'loss': 0.2618, 'learning_rate': 7.678599908245628e-06, 'epoch': 1.18} {'loss': 0.3107, 'learning_rate': 7.678273110010908e-06, 'epoch': 1.18} {'loss': 0.5193, 'learning_rate': 7.677946314396977e-06, 'epoch': 1.18} {'loss': 0.2998, 'learning_rate': 7.677619521404203e-06, 'epoch': 1.18} {'loss': 0.4871, 'learning_rate': 7.677292731032954e-06, 'epoch': 1.18} {'loss': 0.4419, 'learning_rate': 7.676965943283604e-06, 'epoch': 1.18} {'loss': 0.2424, 'learning_rate': 7.676639158156515e-06, 'epoch': 1.18} {'loss': 0.392, 'learning_rate': 7.676312375652057e-06, 'epoch': 1.18} {'loss': 0.2845, 'learning_rate': 7.675985595770603e-06, 'epoch': 1.18} {'loss': 0.3481, 'learning_rate': 7.675658818512516e-06, 'epoch': 1.18} {'loss': 0.418, 'learning_rate': 7.675332043878172e-06, 'epoch': 1.18} {'loss': 0.5457, 'learning_rate': 7.675005271867934e-06, 'epoch': 1.18} {'loss': 0.2622, 'learning_rate': 7.674678502482173e-06, 'epoch': 1.18} {'loss': 0.2728, 'learning_rate': 7.674351735721258e-06, 'epoch': 1.18} {'loss': 0.4001, 'learning_rate': 7.674024971585558e-06, 'epoch': 1.18} {'loss': 0.3466, 'learning_rate': 7.67369821007544e-06, 'epoch': 1.18} {'loss': 0.3808, 'learning_rate': 7.673371451191275e-06, 'epoch': 1.18} {'loss': 0.2291, 'learning_rate': 7.673044694933433e-06, 'epoch': 1.18} {'loss': 0.2879, 'learning_rate': 7.67271794130228e-06, 'epoch': 1.18} {'loss': 0.3254, 'learning_rate': 7.672391190298188e-06, 'epoch': 1.18} {'loss': 0.3895, 'learning_rate': 7.672064441921521e-06, 'epoch': 1.18} {'loss': 0.3614, 'learning_rate': 7.67173769617265e-06, 'epoch': 1.18} {'loss': 0.3931, 'learning_rate': 7.671410953051946e-06, 'epoch': 1.18} {'loss': 0.2486, 'learning_rate': 7.671084212559774e-06, 'epoch': 1.18} {'loss': 0.3098, 'learning_rate': 7.670757474696507e-06, 'epoch': 1.18} {'loss': 0.3488, 'learning_rate': 7.670430739462511e-06, 'epoch': 1.18} {'loss': 0.337, 'learning_rate': 7.670104006858155e-06, 'epoch': 1.18} {'loss': 0.2861, 'learning_rate': 7.66977727688381e-06, 'epoch': 1.18} {'loss': 0.4081, 'learning_rate': 7.669450549539841e-06, 'epoch': 1.18} {'loss': 0.2761, 'learning_rate': 7.669123824826624e-06, 'epoch': 1.18} {'loss': 0.3273, 'learning_rate': 7.668797102744519e-06, 'epoch': 1.18} {'loss': 0.3532, 'learning_rate': 7.6684703832939e-06, 'epoch': 1.18} {'loss': 0.3451, 'learning_rate': 7.668143666475135e-06, 'epoch': 1.18} {'loss': 0.3976, 'learning_rate': 7.66781695228859e-06, 'epoch': 1.18} {'loss': 0.3195, 'learning_rate': 7.66749024073464e-06, 'epoch': 1.18} {'loss': 0.3823, 'learning_rate': 7.667163531813646e-06, 'epoch': 1.18} {'loss': 0.3558, 'learning_rate': 7.666836825525984e-06, 'epoch': 1.18} {'loss': 0.1822, 'learning_rate': 7.666510121872018e-06, 'epoch': 1.18} {'loss': 0.3113, 'learning_rate': 7.666183420852118e-06, 'epoch': 1.18} {'loss': 0.2316, 'learning_rate': 7.665856722466656e-06, 'epoch': 1.18} {'loss': 0.3088, 'learning_rate': 7.665530026715995e-06, 'epoch': 1.18} {'loss': 0.3486, 'learning_rate': 7.665203333600508e-06, 'epoch': 1.18} {'loss': 0.3481, 'learning_rate': 7.664876643120563e-06, 'epoch': 1.18} {'loss': 0.4884, 'learning_rate': 7.664549955276526e-06, 'epoch': 1.18} {'loss': 0.4682, 'learning_rate': 7.664223270068769e-06, 'epoch': 1.18} {'loss': 0.3141, 'learning_rate': 7.66389658749766e-06, 'epoch': 1.18} {'loss': 0.3235, 'learning_rate': 7.663569907563567e-06, 'epoch': 1.18} {'loss': 0.314, 'learning_rate': 7.66324323026686e-06, 'epoch': 1.18} {'loss': 0.3994, 'learning_rate': 7.662916555607907e-06, 'epoch': 1.18} {'loss': 0.3496, 'learning_rate': 7.662589883587076e-06, 'epoch': 1.18} {'loss': 0.3744, 'learning_rate': 7.662263214204737e-06, 'epoch': 1.18} {'loss': 0.3259, 'learning_rate': 7.661936547461259e-06, 'epoch': 1.18} {'loss': 0.2625, 'learning_rate': 7.66160988335701e-06, 'epoch': 1.18} {'loss': 0.3474, 'learning_rate': 7.66128322189236e-06, 'epoch': 1.18} {'loss': 0.2241, 'learning_rate': 7.660956563067674e-06, 'epoch': 1.18} {'loss': 0.3686, 'learning_rate': 7.660629906883323e-06, 'epoch': 1.18} {'loss': 0.2095, 'learning_rate': 7.660303253339677e-06, 'epoch': 1.18} {'loss': 0.3587, 'learning_rate': 7.659976602437104e-06, 'epoch': 1.18} {'loss': 0.2785, 'learning_rate': 7.659649954175972e-06, 'epoch': 1.18} {'loss': 0.4017, 'learning_rate': 7.65932330855665e-06, 'epoch': 1.18} {'loss': 0.3392, 'learning_rate': 7.658996665579506e-06, 'epoch': 1.18} {'loss': 0.4342, 'learning_rate': 7.658670025244912e-06, 'epoch': 1.18} {'loss': 0.4257, 'learning_rate': 7.658343387553232e-06, 'epoch': 1.18} {'loss': 0.2337, 'learning_rate': 7.658016752504838e-06, 'epoch': 1.18} {'loss': 0.3736, 'learning_rate': 7.657690120100099e-06, 'epoch': 1.18} {'loss': 0.2838, 'learning_rate': 7.657363490339382e-06, 'epoch': 1.18} {'loss': 0.3021, 'learning_rate': 7.657036863223055e-06, 'epoch': 1.18} {'loss': 0.4438, 'learning_rate': 7.65671023875149e-06, 'epoch': 1.18} {'loss': 0.3596, 'learning_rate': 7.65638361692505e-06, 'epoch': 1.18} {'loss': 0.4364, 'learning_rate': 7.656056997744109e-06, 'epoch': 1.18} {'loss': 0.2434, 'learning_rate': 7.655730381209035e-06, 'epoch': 1.18} {'loss': 0.3764, 'learning_rate': 7.655403767320194e-06, 'epoch': 1.18} {'loss': 0.3644, 'learning_rate': 7.655077156077956e-06, 'epoch': 1.18} {'loss': 0.3605, 'learning_rate': 7.654750547482691e-06, 'epoch': 1.18} {'loss': 0.4169, 'learning_rate': 7.654423941534767e-06, 'epoch': 1.18} {'loss': 0.3662, 'learning_rate': 7.654097338234552e-06, 'epoch': 1.18} {'loss': 0.296, 'learning_rate': 7.653770737582415e-06, 'epoch': 1.18} {'loss': 0.3822, 'learning_rate': 7.653444139578725e-06, 'epoch': 1.18} {'loss': 0.3277, 'learning_rate': 7.653117544223849e-06, 'epoch': 1.18} {'loss': 0.3983, 'learning_rate': 7.65279095151816e-06, 'epoch': 1.18} {'loss': 0.4041, 'learning_rate': 7.652464361462022e-06, 'epoch': 1.18} {'loss': 0.318, 'learning_rate': 7.652137774055804e-06, 'epoch': 1.18} {'loss': 0.3011, 'learning_rate': 7.651811189299875e-06, 'epoch': 1.18} {'loss': 0.1551, 'learning_rate': 7.651484607194608e-06, 'epoch': 1.18} {'loss': 0.1899, 'learning_rate': 7.651158027740367e-06, 'epoch': 1.18} {'loss': 0.3963, 'learning_rate': 7.650831450937522e-06, 'epoch': 1.18} {'loss': 0.4226, 'learning_rate': 7.650504876786441e-06, 'epoch': 1.18} {'loss': 0.3181, 'learning_rate': 7.650178305287493e-06, 'epoch': 1.18} {'loss': 0.298, 'learning_rate': 7.649851736441048e-06, 'epoch': 1.18} {'loss': 0.3277, 'learning_rate': 7.649525170247471e-06, 'epoch': 1.18} {'loss': 0.3513, 'learning_rate': 7.649198606707136e-06, 'epoch': 1.18} {'loss': 0.3866, 'learning_rate': 7.648872045820407e-06, 'epoch': 1.18} {'loss': 0.3318, 'learning_rate': 7.648545487587658e-06, 'epoch': 1.18} {'loss': 0.3403, 'learning_rate': 7.64821893200925e-06, 'epoch': 1.18} {'loss': 0.2752, 'learning_rate': 7.647892379085557e-06, 'epoch': 1.18} {'loss': 0.3886, 'learning_rate': 7.647565828816947e-06, 'epoch': 1.18} {'loss': 0.4578, 'learning_rate': 7.647239281203787e-06, 'epoch': 1.18} {'loss': 0.383, 'learning_rate': 7.646912736246446e-06, 'epoch': 1.18} {'loss': 0.1997, 'learning_rate': 7.646586193945292e-06, 'epoch': 1.18} {'loss': 0.3677, 'learning_rate': 7.646259654300696e-06, 'epoch': 1.18} {'loss': 0.3225, 'learning_rate': 7.645933117313026e-06, 'epoch': 1.18} {'loss': 0.354, 'learning_rate': 7.645606582982648e-06, 'epoch': 1.18} {'loss': 0.2642, 'learning_rate': 7.645280051309935e-06, 'epoch': 1.18} {'loss': 0.3621, 'learning_rate': 7.64495352229525e-06, 'epoch': 1.18} {'loss': 0.2906, 'learning_rate': 7.644626995938967e-06, 'epoch': 1.18} {'loss': 0.3293, 'learning_rate': 7.644300472241453e-06, 'epoch': 1.18} {'loss': 0.3553, 'learning_rate': 7.643973951203075e-06, 'epoch': 1.18} {'loss': 0.2789, 'learning_rate': 7.643647432824201e-06, 'epoch': 1.18} {'loss': 0.3428, 'learning_rate': 7.643320917105201e-06, 'epoch': 1.18} {'loss': 0.3756, 'learning_rate': 7.642994404046445e-06, 'epoch': 1.18} {'loss': 0.3436, 'learning_rate': 7.6426678936483e-06, 'epoch': 1.18} {'loss': 0.3686, 'learning_rate': 7.642341385911133e-06, 'epoch': 1.18} {'loss': 0.2566, 'learning_rate': 7.642014880835316e-06, 'epoch': 1.18} {'loss': 0.2601, 'learning_rate': 7.641688378421214e-06, 'epoch': 1.18} {'loss': 0.4362, 'learning_rate': 7.641361878669199e-06, 'epoch': 1.18} {'loss': 0.25, 'learning_rate': 7.641035381579636e-06, 'epoch': 1.18} {'loss': 0.3304, 'learning_rate': 7.640708887152898e-06, 'epoch': 1.18} {'loss': 0.2223, 'learning_rate': 7.64038239538935e-06, 'epoch': 1.18} {'loss': 0.3625, 'learning_rate': 7.640055906289363e-06, 'epoch': 1.18} {'loss': 0.3849, 'learning_rate': 7.639729419853302e-06, 'epoch': 1.18} {'loss': 0.3299, 'learning_rate': 7.639402936081538e-06, 'epoch': 1.18} {'loss': 0.2531, 'learning_rate': 7.639076454974441e-06, 'epoch': 1.18} {'loss': 0.2775, 'learning_rate': 7.638749976532375e-06, 'epoch': 1.18} {'loss': 0.3008, 'learning_rate': 7.638423500755711e-06, 'epoch': 1.18} {'loss': 0.3088, 'learning_rate': 7.63809702764482e-06, 'epoch': 1.18} {'loss': 0.3949, 'learning_rate': 7.637770557200066e-06, 'epoch': 1.18} {'loss': 0.2534, 'learning_rate': 7.63744408942182e-06, 'epoch': 1.18} {'loss': 0.3382, 'learning_rate': 7.637117624310453e-06, 'epoch': 1.18} {'loss': 0.4234, 'learning_rate': 7.636791161866327e-06, 'epoch': 1.18} {'loss': 0.2694, 'learning_rate': 7.636464702089818e-06, 'epoch': 1.18} {'loss': 0.416, 'learning_rate': 7.63613824498129e-06, 'epoch': 1.18} {'loss': 0.3027, 'learning_rate': 7.635811790541112e-06, 'epoch': 1.18} {'loss': 0.3516, 'learning_rate': 7.635485338769654e-06, 'epoch': 1.18} {'loss': 0.3463, 'learning_rate': 7.635158889667283e-06, 'epoch': 1.18} {'loss': 0.2958, 'learning_rate': 7.634832443234367e-06, 'epoch': 1.18} {'loss': 0.4315, 'learning_rate': 7.634505999471276e-06, 'epoch': 1.18} {'loss': 0.3061, 'learning_rate': 7.634179558378378e-06, 'epoch': 1.18} {'loss': 0.2596, 'learning_rate': 7.63385311995604e-06, 'epoch': 1.18} {'loss': 0.3413, 'learning_rate': 7.633526684204634e-06, 'epoch': 1.18} {'loss': 0.322, 'learning_rate': 7.633200251124527e-06, 'epoch': 1.18} {'loss': 0.3888, 'learning_rate': 7.632873820716086e-06, 'epoch': 1.18} {'loss': 0.3272, 'learning_rate': 7.63254739297968e-06, 'epoch': 1.18} {'loss': 0.3948, 'learning_rate': 7.632220967915676e-06, 'epoch': 1.18} {'loss': 0.3865, 'learning_rate': 7.631894545524447e-06, 'epoch': 1.18} {'loss': 0.2226, 'learning_rate': 7.631568125806357e-06, 'epoch': 1.18} {'loss': 0.2963, 'learning_rate': 7.631241708761776e-06, 'epoch': 1.18} {'loss': 0.2147, 'learning_rate': 7.630915294391074e-06, 'epoch': 1.18} {'loss': 0.3119, 'learning_rate': 7.630588882694617e-06, 'epoch': 1.18} {'loss': 0.3064, 'learning_rate': 7.630262473672776e-06, 'epoch': 1.18} {'loss': 0.3171, 'learning_rate': 7.629936067325915e-06, 'epoch': 1.18} {'loss': 0.3307, 'learning_rate': 7.629609663654409e-06, 'epoch': 1.18} {'loss': 0.3409, 'learning_rate': 7.629283262658621e-06, 'epoch': 1.18} {'loss': 0.2459, 'learning_rate': 7.6289568643389245e-06, 'epoch': 1.18} {'loss': 0.3452, 'learning_rate': 7.628630468695683e-06, 'epoch': 1.18} {'loss': 0.393, 'learning_rate': 7.628304075729265e-06, 'epoch': 1.18} {'loss': 0.2309, 'learning_rate': 7.627977685440042e-06, 'epoch': 1.18} {'loss': 0.3278, 'learning_rate': 7.62765129782838e-06, 'epoch': 1.18} {'loss': 0.4831, 'learning_rate': 7.62732491289465e-06, 'epoch': 1.18} {'loss': 0.2974, 'learning_rate': 7.626998530639218e-06, 'epoch': 1.18} {'loss': 0.3058, 'learning_rate': 7.626672151062454e-06, 'epoch': 1.18} {'loss': 0.5401, 'learning_rate': 7.6263457741647254e-06, 'epoch': 1.18} {'loss': 0.1656, 'learning_rate': 7.626019399946402e-06, 'epoch': 1.18} {'loss': 0.4058, 'learning_rate': 7.62569302840785e-06, 'epoch': 1.18} {'loss': 0.3052, 'learning_rate': 7.62536665954944e-06, 'epoch': 1.18} {'loss': 0.4334, 'learning_rate': 7.6250402933715385e-06, 'epoch': 1.18} {'loss': 0.1503, 'learning_rate': 7.6247139298745175e-06, 'epoch': 1.18} {'loss': 0.4435, 'learning_rate': 7.624387569058741e-06, 'epoch': 1.18} {'loss': 0.2327, 'learning_rate': 7.624061210924579e-06, 'epoch': 1.18} {'loss': 0.2568, 'learning_rate': 7.6237348554724e-06, 'epoch': 1.18} {'loss': 0.2751, 'learning_rate': 7.623408502702573e-06, 'epoch': 1.18} {'loss': 0.3626, 'learning_rate': 7.6230821526154655e-06, 'epoch': 1.18} {'loss': 0.295, 'learning_rate': 7.6227558052114454e-06, 'epoch': 1.18} {'loss': 0.2265, 'learning_rate': 7.622429460490883e-06, 'epoch': 1.18} {'loss': 0.2931, 'learning_rate': 7.622103118454145e-06, 'epoch': 1.18} {'loss': 0.3783, 'learning_rate': 7.621776779101601e-06, 'epoch': 1.18} {'loss': 0.2786, 'learning_rate': 7.6214504424336176e-06, 'epoch': 1.18} {'loss': 0.5004, 'learning_rate': 7.621124108450566e-06, 'epoch': 1.18} {'loss': 0.3106, 'learning_rate': 7.620797777152812e-06, 'epoch': 1.18} {'loss': 0.2025, 'learning_rate': 7.620471448540727e-06, 'epoch': 1.18} {'loss': 0.4218, 'learning_rate': 7.620145122614675e-06, 'epoch': 1.18} {'loss': 0.4884, 'learning_rate': 7.619818799375028e-06, 'epoch': 1.18} {'loss': 0.2568, 'learning_rate': 7.619492478822151e-06, 'epoch': 1.18} {'loss': 0.3543, 'learning_rate': 7.619166160956415e-06, 'epoch': 1.18} {'loss': 0.4054, 'learning_rate': 7.618839845778187e-06, 'epoch': 1.18} {'loss': 0.3661, 'learning_rate': 7.618513533287838e-06, 'epoch': 1.18} {'loss': 0.2077, 'learning_rate': 7.618187223485734e-06, 'epoch': 1.18} {'loss': 0.3536, 'learning_rate': 7.617860916372242e-06, 'epoch': 1.18} {'loss': 0.2563, 'learning_rate': 7.617534611947733e-06, 'epoch': 1.18} {'loss': 0.3281, 'learning_rate': 7.617208310212575e-06, 'epoch': 1.18} {'loss': 0.3287, 'learning_rate': 7.616882011167135e-06, 'epoch': 1.18} {'loss': 0.3397, 'learning_rate': 7.616555714811782e-06, 'epoch': 1.18} {'loss': 0.2751, 'learning_rate': 7.616229421146886e-06, 'epoch': 1.18} {'loss': 0.3721, 'learning_rate': 7.615903130172813e-06, 'epoch': 1.18} {'loss': 0.3214, 'learning_rate': 7.6155768418899315e-06, 'epoch': 1.18} {'loss': 0.2589, 'learning_rate': 7.615250556298609e-06, 'epoch': 1.18} {'loss': 0.1882, 'learning_rate': 7.614924273399216e-06, 'epoch': 1.18} {'loss': 0.2911, 'learning_rate': 7.6145979931921195e-06, 'epoch': 1.18} {'loss': 0.3246, 'learning_rate': 7.61427171567769e-06, 'epoch': 1.18} {'loss': 0.5678, 'learning_rate': 7.613945440856292e-06, 'epoch': 1.18} {'loss': 0.459, 'learning_rate': 7.613619168728297e-06, 'epoch': 1.18} {'loss': 0.283, 'learning_rate': 7.613292899294072e-06, 'epoch': 1.18} {'loss': 0.3348, 'learning_rate': 7.612966632553986e-06, 'epoch': 1.18} {'loss': 0.3651, 'learning_rate': 7.612640368508406e-06, 'epoch': 1.18} {'loss': 0.3849, 'learning_rate': 7.612314107157701e-06, 'epoch': 1.18} {'loss': 0.2599, 'learning_rate': 7.6119878485022415e-06, 'epoch': 1.18} {'loss': 0.3574, 'learning_rate': 7.611661592542392e-06, 'epoch': 1.18} {'loss': 0.5004, 'learning_rate': 7.611335339278522e-06, 'epoch': 1.18} {'loss': 0.2517, 'learning_rate': 7.611009088711e-06, 'epoch': 1.18} {'loss': 0.4591, 'learning_rate': 7.610682840840194e-06, 'epoch': 1.18} {'loss': 0.3156, 'learning_rate': 7.610356595666474e-06, 'epoch': 1.18} {'loss': 0.4038, 'learning_rate': 7.610030353190207e-06, 'epoch': 1.18} {'loss': 0.3802, 'learning_rate': 7.60970411341176e-06, 'epoch': 1.18} {'loss': 0.3417, 'learning_rate': 7.609377876331503e-06, 'epoch': 1.18} {'loss': 0.4175, 'learning_rate': 7.609051641949804e-06, 'epoch': 1.18} {'loss': 0.3035, 'learning_rate': 7.608725410267031e-06, 'epoch': 1.18} {'loss': 0.4358, 'learning_rate': 7.608399181283552e-06, 'epoch': 1.18} {'loss': 0.2949, 'learning_rate': 7.608072954999737e-06, 'epoch': 1.18} {'loss': 0.3124, 'learning_rate': 7.607746731415953e-06, 'epoch': 1.18} {'loss': 0.2731, 'learning_rate': 7.607420510532566e-06, 'epoch': 1.18} {'loss': 0.3829, 'learning_rate': 7.607094292349948e-06, 'epoch': 1.18} {'loss': 0.2651, 'learning_rate': 7.606768076868464e-06, 'epoch': 1.18} {'loss': 0.349, 'learning_rate': 7.606441864088484e-06, 'epoch': 1.18} {'loss': 0.3862, 'learning_rate': 7.606115654010376e-06, 'epoch': 1.18} {'loss': 0.2527, 'learning_rate': 7.605789446634508e-06, 'epoch': 1.18} {'loss': 0.5045, 'learning_rate': 7.605463241961245e-06, 'epoch': 1.18} {'loss': 0.2948, 'learning_rate': 7.605137039990964e-06, 'epoch': 1.18} {'loss': 0.4223, 'learning_rate': 7.604810840724028e-06, 'epoch': 1.18} {'loss': 0.2725, 'learning_rate': 7.604484644160802e-06, 'epoch': 1.18} {'loss': 0.4041, 'learning_rate': 7.60415845030166e-06, 'epoch': 1.18} {'loss': 0.3472, 'learning_rate': 7.603832259146965e-06, 'epoch': 1.18} {'loss': 0.4769, 'learning_rate': 7.603506070697089e-06, 'epoch': 1.18} {'loss': 0.3714, 'learning_rate': 7.6031798849523985e-06, 'epoch': 1.18} {'loss': 0.2392, 'learning_rate': 7.6028537019132635e-06, 'epoch': 1.18} {'loss': 0.2853, 'learning_rate': 7.60252752158005e-06, 'epoch': 1.18} {'loss': 0.1809, 'learning_rate': 7.6022013439531265e-06, 'epoch': 1.18} {'loss': 0.3723, 'learning_rate': 7.6018751690328615e-06, 'epoch': 1.18} {'loss': 0.23, 'learning_rate': 7.601548996819624e-06, 'epoch': 1.18} {'loss': 0.3122, 'learning_rate': 7.601222827313783e-06, 'epoch': 1.18} {'loss': 0.3815, 'learning_rate': 7.6008966605157055e-06, 'epoch': 1.18} {'loss': 0.1799, 'learning_rate': 7.600570496425758e-06, 'epoch': 1.18} {'loss': 0.3331, 'learning_rate': 7.60024433504431e-06, 'epoch': 1.18} {'loss': 0.2163, 'learning_rate': 7.59991817637173e-06, 'epoch': 1.18} {'loss': 0.2905, 'learning_rate': 7.599592020408385e-06, 'epoch': 1.18} {'loss': 0.3439, 'learning_rate': 7.599265867154645e-06, 'epoch': 1.18} {'loss': 0.2443, 'learning_rate': 7.598939716610878e-06, 'epoch': 1.18} {'loss': 0.4585, 'learning_rate': 7.59861356877745e-06, 'epoch': 1.18} {'loss': 0.3362, 'learning_rate': 7.5982874236547314e-06, 'epoch': 1.18} {'loss': 0.3548, 'learning_rate': 7.5979612812430895e-06, 'epoch': 1.18} {'loss': 0.2749, 'learning_rate': 7.5976351415428924e-06, 'epoch': 1.18} {'loss': 0.3726, 'learning_rate': 7.597309004554509e-06, 'epoch': 1.18} {'loss': 0.3602, 'learning_rate': 7.596982870278306e-06, 'epoch': 1.18} {'loss': 0.3505, 'learning_rate': 7.596656738714656e-06, 'epoch': 1.18} {'loss': 0.4958, 'learning_rate': 7.59633060986392e-06, 'epoch': 1.18} {'loss': 0.4273, 'learning_rate': 7.5960044837264706e-06, 'epoch': 1.18} {'loss': 0.38, 'learning_rate': 7.595678360302674e-06, 'epoch': 1.18} {'loss': 0.4169, 'learning_rate': 7.595352239592899e-06, 'epoch': 1.18} {'loss': 0.2425, 'learning_rate': 7.595026121597515e-06, 'epoch': 1.18} {'loss': 0.2358, 'learning_rate': 7.594700006316888e-06, 'epoch': 1.18} {'loss': 0.2694, 'learning_rate': 7.59437389375139e-06, 'epoch': 1.18} {'loss': 0.3453, 'learning_rate': 7.5940477839013835e-06, 'epoch': 1.18} {'loss': 0.4108, 'learning_rate': 7.593721676767242e-06, 'epoch': 1.18} {'loss': 0.4361, 'learning_rate': 7.593395572349329e-06, 'epoch': 1.18} {'loss': 0.2843, 'learning_rate': 7.5930694706480156e-06, 'epoch': 1.18} {'loss': 0.2698, 'learning_rate': 7.592743371663669e-06, 'epoch': 1.18} {'loss': 0.2099, 'learning_rate': 7.59241727539666e-06, 'epoch': 1.18} {'loss': 0.426, 'learning_rate': 7.592091181847352e-06, 'epoch': 1.18} {'loss': 0.3093, 'learning_rate': 7.591765091016114e-06, 'epoch': 1.18} {'loss': 0.3838, 'learning_rate': 7.591439002903317e-06, 'epoch': 1.18} {'loss': 0.3674, 'learning_rate': 7.591112917509325e-06, 'epoch': 1.18} {'loss': 0.2425, 'learning_rate': 7.59078683483451e-06, 'epoch': 1.18} {'loss': 0.3554, 'learning_rate': 7.590460754879239e-06, 'epoch': 1.18} {'loss': 0.4069, 'learning_rate': 7.590134677643879e-06, 'epoch': 1.18} {'loss': 0.3711, 'learning_rate': 7.589808603128799e-06, 'epoch': 1.18} {'loss': 0.259, 'learning_rate': 7.5894825313343664e-06, 'epoch': 1.18} {'loss': 0.3348, 'learning_rate': 7.58915646226095e-06, 'epoch': 1.18} {'loss': 0.3828, 'learning_rate': 7.5888303959089175e-06, 'epoch': 1.18} {'loss': 0.269, 'learning_rate': 7.588504332278635e-06, 'epoch': 1.18} {'loss': 0.2924, 'learning_rate': 7.588178271370476e-06, 'epoch': 1.18} {'loss': 0.3916, 'learning_rate': 7.587852213184804e-06, 'epoch': 1.18} {'loss': 0.2977, 'learning_rate': 7.587526157721987e-06, 'epoch': 1.18} {'loss': 0.4144, 'learning_rate': 7.587200104982395e-06, 'epoch': 1.18} {'loss': 0.4507, 'learning_rate': 7.586874054966395e-06, 'epoch': 1.18} {'loss': 0.3809, 'learning_rate': 7.5865480076743554e-06, 'epoch': 1.18} {'loss': 0.2435, 'learning_rate': 7.586221963106644e-06, 'epoch': 1.18} {'loss': 0.4363, 'learning_rate': 7.585895921263629e-06, 'epoch': 1.18} {'loss': 0.4147, 'learning_rate': 7.585569882145679e-06, 'epoch': 1.18} {'loss': 0.3891, 'learning_rate': 7.585243845753161e-06, 'epoch': 1.18} {'loss': 0.3128, 'learning_rate': 7.584917812086443e-06, 'epoch': 1.18} {'loss': 0.2876, 'learning_rate': 7.584591781145894e-06, 'epoch': 1.18} {'loss': 0.207, 'learning_rate': 7.584265752931882e-06, 'epoch': 1.18} {'loss': 0.3815, 'learning_rate': 7.5839397274447755e-06, 'epoch': 1.18} {'loss': 0.4131, 'learning_rate': 7.58361370468494e-06, 'epoch': 1.18} {'loss': 0.3734, 'learning_rate': 7.583287684652746e-06, 'epoch': 1.18} {'loss': 0.3558, 'learning_rate': 7.582961667348561e-06, 'epoch': 1.18} {'loss': 0.2498, 'learning_rate': 7.582635652772751e-06, 'epoch': 1.18} {'loss': 0.4317, 'learning_rate': 7.582309640925687e-06, 'epoch': 1.18} {'loss': 0.4473, 'learning_rate': 7.581983631807734e-06, 'epoch': 1.18} {'loss': 0.2647, 'learning_rate': 7.581657625419263e-06, 'epoch': 1.18} {'loss': 0.2562, 'learning_rate': 7.581331621760641e-06, 'epoch': 1.18} {'loss': 0.4843, 'learning_rate': 7.581005620832235e-06, 'epoch': 1.18} {'loss': 0.3671, 'learning_rate': 7.5806796226344125e-06, 'epoch': 1.18} {'loss': 0.4244, 'learning_rate': 7.580353627167545e-06, 'epoch': 1.18} {'loss': 0.3227, 'learning_rate': 7.5800276344319965e-06, 'epoch': 1.18} {'loss': 0.3051, 'learning_rate': 7.579701644428137e-06, 'epoch': 1.18} {'loss': 0.3721, 'learning_rate': 7.579375657156336e-06, 'epoch': 1.18} {'loss': 0.3021, 'learning_rate': 7.579049672616958e-06, 'epoch': 1.18} {'loss': 0.3504, 'learning_rate': 7.578723690810373e-06, 'epoch': 1.18} {'loss': 0.2889, 'learning_rate': 7.5783977117369475e-06, 'epoch': 1.18} {'loss': 0.2227, 'learning_rate': 7.57807173539705e-06, 'epoch': 1.18} {'loss': 0.2911, 'learning_rate': 7.5777457617910515e-06, 'epoch': 1.18} {'loss': 0.2627, 'learning_rate': 7.577419790919315e-06, 'epoch': 1.18} {'loss': 0.3474, 'learning_rate': 7.577093822782211e-06, 'epoch': 1.18} {'loss': 0.6157, 'learning_rate': 7.576767857380108e-06, 'epoch': 1.18} {'loss': 0.3535, 'learning_rate': 7.576441894713373e-06, 'epoch': 1.18} {'loss': 0.2604, 'learning_rate': 7.576115934782375e-06, 'epoch': 1.18} {'loss': 0.4586, 'learning_rate': 7.575789977587481e-06, 'epoch': 1.18} {'loss': 0.2807, 'learning_rate': 7.575464023129059e-06, 'epoch': 1.18} {'loss': 0.2661, 'learning_rate': 7.575138071407478e-06, 'epoch': 1.18} {'loss': 0.2765, 'learning_rate': 7.574812122423105e-06, 'epoch': 1.18} {'loss': 0.4054, 'learning_rate': 7.574486176176306e-06, 'epoch': 1.18} {'loss': 0.4687, 'learning_rate': 7.574160232667453e-06, 'epoch': 1.18} {'loss': 0.1898, 'learning_rate': 7.57383429189691e-06, 'epoch': 1.18} {'loss': 0.3843, 'learning_rate': 7.5735083538650465e-06, 'epoch': 1.18} {'loss': 0.302, 'learning_rate': 7.573182418572228e-06, 'epoch': 1.18} {'loss': 0.3549, 'learning_rate': 7.57285648601883e-06, 'epoch': 1.18} {'loss': 0.3338, 'learning_rate': 7.572530556205214e-06, 'epoch': 1.18} {'loss': 0.4294, 'learning_rate': 7.57220462913175e-06, 'epoch': 1.18} {'loss': 0.2221, 'learning_rate': 7.571878704798804e-06, 'epoch': 1.18} {'loss': 0.3681, 'learning_rate': 7.571552783206746e-06, 'epoch': 1.18} {'loss': 0.4094, 'learning_rate': 7.571226864355942e-06, 'epoch': 1.18} {'loss': 0.2682, 'learning_rate': 7.570900948246763e-06, 'epoch': 1.18} {'loss': 0.2671, 'learning_rate': 7.570575034879574e-06, 'epoch': 1.18} {'loss': 0.3989, 'learning_rate': 7.570249124254744e-06, 'epoch': 1.18} {'loss': 0.3094, 'learning_rate': 7.56992321637264e-06, 'epoch': 1.18} {'loss': 0.356, 'learning_rate': 7.569597311233632e-06, 'epoch': 1.18} {'loss': 0.299, 'learning_rate': 7.569271408838085e-06, 'epoch': 1.18} {'loss': 0.2598, 'learning_rate': 7.568945509186369e-06, 'epoch': 1.18} {'loss': 0.4014, 'learning_rate': 7.568619612278853e-06, 'epoch': 1.18} {'loss': 0.4472, 'learning_rate': 7.568293718115901e-06, 'epoch': 1.18} {'loss': 0.2887, 'learning_rate': 7.5679678266978825e-06, 'epoch': 1.18} {'loss': 0.4719, 'learning_rate': 7.5676419380251675e-06, 'epoch': 1.18} {'loss': 0.3035, 'learning_rate': 7.567316052098122e-06, 'epoch': 1.18} {'loss': 0.3006, 'learning_rate': 7.566990168917112e-06, 'epoch': 1.18} {'loss': 0.3295, 'learning_rate': 7.566664288482509e-06, 'epoch': 1.18} {'loss': 0.3256, 'learning_rate': 7.566338410794679e-06, 'epoch': 1.18} {'loss': 0.3794, 'learning_rate': 7.566012535853991e-06, 'epoch': 1.18} {'loss': 0.2645, 'learning_rate': 7.565686663660811e-06, 'epoch': 1.18} {'loss': 0.3202, 'learning_rate': 7.5653607942155075e-06, 'epoch': 1.18} {'loss': 0.1756, 'learning_rate': 7.565034927518448e-06, 'epoch': 1.18} {'loss': 0.2816, 'learning_rate': 7.564709063570004e-06, 'epoch': 1.18} {'loss': 0.3949, 'learning_rate': 7.56438320237054e-06, 'epoch': 1.18} {'loss': 0.4292, 'learning_rate': 7.564057343920423e-06, 'epoch': 1.18} {'loss': 0.2118, 'learning_rate': 7.563731488220022e-06, 'epoch': 1.18} {'loss': 0.3009, 'learning_rate': 7.563405635269705e-06, 'epoch': 1.18} {'loss': 0.3595, 'learning_rate': 7.56307978506984e-06, 'epoch': 1.18} {'loss': 0.3716, 'learning_rate': 7.562753937620794e-06, 'epoch': 1.18} {'loss': 0.3063, 'learning_rate': 7.562428092922935e-06, 'epoch': 1.18} {'loss': 0.2813, 'learning_rate': 7.562102250976632e-06, 'epoch': 1.18} {'loss': 0.4343, 'learning_rate': 7.561776411782251e-06, 'epoch': 1.18} {'loss': 0.2563, 'learning_rate': 7.561450575340161e-06, 'epoch': 1.18} {'loss': 0.3765, 'learning_rate': 7.561124741650729e-06, 'epoch': 1.18} {'loss': 0.3401, 'learning_rate': 7.560798910714325e-06, 'epoch': 1.18} {'loss': 0.3696, 'learning_rate': 7.560473082531314e-06, 'epoch': 1.18} {'loss': 0.3998, 'learning_rate': 7.560147257102066e-06, 'epoch': 1.18} {'loss': 0.2029, 'learning_rate': 7.559821434426949e-06, 'epoch': 1.18} {'loss': 0.1915, 'learning_rate': 7.559495614506328e-06, 'epoch': 1.18} {'loss': 0.48, 'learning_rate': 7.559169797340573e-06, 'epoch': 1.18} {'loss': 0.3364, 'learning_rate': 7.55884398293005e-06, 'epoch': 1.18} {'loss': 0.3405, 'learning_rate': 7.558518171275129e-06, 'epoch': 1.18} {'loss': 0.3427, 'learning_rate': 7.558192362376176e-06, 'epoch': 1.18} {'loss': 0.3368, 'learning_rate': 7.557866556233559e-06, 'epoch': 1.18} {'loss': 0.1648, 'learning_rate': 7.557540752847647e-06, 'epoch': 1.18} {'loss': 0.3391, 'learning_rate': 7.557214952218807e-06, 'epoch': 1.18} {'loss': 0.4609, 'learning_rate': 7.556889154347405e-06, 'epoch': 1.18} {'loss': 0.4379, 'learning_rate': 7.556563359233813e-06, 'epoch': 1.18} {'loss': 0.2953, 'learning_rate': 7.556237566878395e-06, 'epoch': 1.18} {'loss': 0.2504, 'learning_rate': 7.555911777281521e-06, 'epoch': 1.18} {'loss': 0.3616, 'learning_rate': 7.555585990443559e-06, 'epoch': 1.18} {'loss': 0.2151, 'learning_rate': 7.555260206364874e-06, 'epoch': 1.18} {'loss': 0.3525, 'learning_rate': 7.554934425045836e-06, 'epoch': 1.18} {'loss': 0.3059, 'learning_rate': 7.554608646486812e-06, 'epoch': 1.18} {'loss': 0.2339, 'learning_rate': 7.554282870688169e-06, 'epoch': 1.18} {'loss': 0.2508, 'learning_rate': 7.553957097650275e-06, 'epoch': 1.18} {'loss': 0.2791, 'learning_rate': 7.5536313273735e-06, 'epoch': 1.18} {'loss': 0.1564, 'learning_rate': 7.553305559858208e-06, 'epoch': 1.18} {'loss': 0.469, 'learning_rate': 7.55297979510477e-06, 'epoch': 1.18} {'loss': 0.2804, 'learning_rate': 7.552654033113553e-06, 'epoch': 1.18} {'loss': 0.4018, 'learning_rate': 7.552328273884923e-06, 'epoch': 1.18} {'loss': 0.3163, 'learning_rate': 7.55200251741925e-06, 'epoch': 1.18} {'loss': 0.2286, 'learning_rate': 7.5516767637169e-06, 'epoch': 1.18} {'loss': 0.3631, 'learning_rate': 7.551351012778243e-06, 'epoch': 1.18} {'loss': 0.3575, 'learning_rate': 7.551025264603644e-06, 'epoch': 1.18} {'loss': 0.4139, 'learning_rate': 7.550699519193472e-06, 'epoch': 1.18} {'loss': 0.2627, 'learning_rate': 7.550373776548093e-06, 'epoch': 1.18} {'loss': 0.2441, 'learning_rate': 7.550048036667878e-06, 'epoch': 1.18} {'loss': 0.2814, 'learning_rate': 7.549722299553192e-06, 'epoch': 1.18} {'loss': 0.3753, 'learning_rate': 7.549396565204403e-06, 'epoch': 1.18} {'loss': 0.3092, 'learning_rate': 7.5490708336218796e-06, 'epoch': 1.18} {'loss': 0.414, 'learning_rate': 7.54874510480599e-06, 'epoch': 1.18} {'loss': 0.2237, 'learning_rate': 7.5484193787571e-06, 'epoch': 1.18} {'loss': 0.3068, 'learning_rate': 7.548093655475579e-06, 'epoch': 1.18} {'loss': 0.1432, 'learning_rate': 7.547767934961794e-06, 'epoch': 1.18} {'loss': 0.1876, 'learning_rate': 7.547442217216112e-06, 'epoch': 1.18} {'loss': 0.2581, 'learning_rate': 7.547116502238905e-06, 'epoch': 1.18} {'loss': 0.3223, 'learning_rate': 7.546790790030532e-06, 'epoch': 1.18} {'loss': 0.2739, 'learning_rate': 7.546465080591369e-06, 'epoch': 1.18} {'loss': 0.3316, 'learning_rate': 7.546139373921778e-06, 'epoch': 1.18} {'loss': 0.3995, 'learning_rate': 7.545813670022131e-06, 'epoch': 1.18} {'loss': 0.2487, 'learning_rate': 7.545487968892792e-06, 'epoch': 1.18} {'loss': 0.3232, 'learning_rate': 7.545162270534131e-06, 'epoch': 1.18} {'loss': 0.3601, 'learning_rate': 7.5448365749465145e-06, 'epoch': 1.18} {'loss': 0.357, 'learning_rate': 7.544510882130312e-06, 'epoch': 1.18} {'loss': 0.3036, 'learning_rate': 7.5441851920858885e-06, 'epoch': 1.18} {'loss': 0.3622, 'learning_rate': 7.543859504813613e-06, 'epoch': 1.18} {'loss': 0.2934, 'learning_rate': 7.543533820313853e-06, 'epoch': 1.18} {'loss': 0.3861, 'learning_rate': 7.5432081385869774e-06, 'epoch': 1.18} {'loss': 0.4421, 'learning_rate': 7.542882459633354e-06, 'epoch': 1.18} {'loss': 0.2977, 'learning_rate': 7.5425567834533465e-06, 'epoch': 1.18} {'loss': 0.2502, 'learning_rate': 7.542231110047325e-06, 'epoch': 1.18} {'loss': 0.2752, 'learning_rate': 7.541905439415657e-06, 'epoch': 1.18} {'loss': 0.1488, 'learning_rate': 7.541579771558712e-06, 'epoch': 1.18} {'loss': 0.2336, 'learning_rate': 7.541254106476855e-06, 'epoch': 1.18} {'loss': 0.3055, 'learning_rate': 7.540928444170455e-06, 'epoch': 1.18} {'loss': 0.3211, 'learning_rate': 7.5406027846398735e-06, 'epoch': 1.18} {'loss': 0.3434, 'learning_rate': 7.540277127885491e-06, 'epoch': 1.18} {'loss': 0.3827, 'learning_rate': 7.539951473907666e-06, 'epoch': 1.18} {'loss': 0.3149, 'learning_rate': 7.539625822706767e-06, 'epoch': 1.18} {'loss': 0.3449, 'learning_rate': 7.539300174283164e-06, 'epoch': 1.18} {'loss': 0.2677, 'learning_rate': 7.538974528637223e-06, 'epoch': 1.18} {'loss': 0.3436, 'learning_rate': 7.53864888576931e-06, 'epoch': 1.18} {'loss': 0.3263, 'learning_rate': 7.538323245679797e-06, 'epoch': 1.18} {'loss': 0.4112, 'learning_rate': 7.5379976083690475e-06, 'epoch': 1.18} {'loss': 0.4646, 'learning_rate': 7.537671973837431e-06, 'epoch': 1.18} {'loss': 0.467, 'learning_rate': 7.5373463420853144e-06, 'epoch': 1.18} {'loss': 0.3519, 'learning_rate': 7.5370207131130646e-06, 'epoch': 1.18} {'loss': 0.4564, 'learning_rate': 7.536695086921051e-06, 'epoch': 1.18} {'loss': 0.3703, 'learning_rate': 7.5363694635096405e-06, 'epoch': 1.18} {'loss': 0.4001, 'learning_rate': 7.5360438428792015e-06, 'epoch': 1.18} {'loss': 0.2731, 'learning_rate': 7.535718225030099e-06, 'epoch': 1.18} {'loss': 0.3231, 'learning_rate': 7.535392609962702e-06, 'epoch': 1.18} {'loss': 0.2461, 'learning_rate': 7.535066997677378e-06, 'epoch': 1.18} {'loss': 0.4451, 'learning_rate': 7.5347413881744945e-06, 'epoch': 1.18} {'loss': 0.2663, 'learning_rate': 7.534415781454419e-06, 'epoch': 1.18} {'loss': 0.2891, 'learning_rate': 7.53409017751752e-06, 'epoch': 1.18} {'loss': 0.2418, 'learning_rate': 7.533764576364164e-06, 'epoch': 1.18} {'loss': 0.2112, 'learning_rate': 7.533438977994718e-06, 'epoch': 1.18} {'loss': 0.289, 'learning_rate': 7.533113382409552e-06, 'epoch': 1.18} {'loss': 0.2255, 'learning_rate': 7.532787789609031e-06, 'epoch': 1.18} {'loss': 0.1758, 'learning_rate': 7.532462199593522e-06, 'epoch': 1.18} {'loss': 0.317, 'learning_rate': 7.532136612363396e-06, 'epoch': 1.18} {'loss': 0.4887, 'learning_rate': 7.5318110279190205e-06, 'epoch': 1.18} {'loss': 0.3365, 'learning_rate': 7.531485446260758e-06, 'epoch': 1.18} {'loss': 0.3302, 'learning_rate': 7.531159867388979e-06, 'epoch': 1.18} {'loss': 0.3469, 'learning_rate': 7.530834291304051e-06, 'epoch': 1.18} {'loss': 0.2511, 'learning_rate': 7.5305087180063415e-06, 'epoch': 1.19} {'loss': 0.2619, 'learning_rate': 7.530183147496219e-06, 'epoch': 1.19} {'loss': 0.401, 'learning_rate': 7.529857579774049e-06, 'epoch': 1.19} {'loss': 0.2722, 'learning_rate': 7.529532014840201e-06, 'epoch': 1.19} {'loss': 0.3431, 'learning_rate': 7.529206452695041e-06, 'epoch': 1.19} {'loss': 0.3, 'learning_rate': 7.528880893338937e-06, 'epoch': 1.19} {'loss': 0.2995, 'learning_rate': 7.528555336772256e-06, 'epoch': 1.19} {'loss': 0.3411, 'learning_rate': 7.528229782995368e-06, 'epoch': 1.19} {'loss': 0.3153, 'learning_rate': 7.527904232008637e-06, 'epoch': 1.19} {'loss': 0.315, 'learning_rate': 7.5275786838124355e-06, 'epoch': 1.19} {'loss': 0.2498, 'learning_rate': 7.527253138407124e-06, 'epoch': 1.19} {'loss': 0.2404, 'learning_rate': 7.526927595793073e-06, 'epoch': 1.19} {'loss': 0.4245, 'learning_rate': 7.526602055970652e-06, 'epoch': 1.19} {'loss': 0.4075, 'learning_rate': 7.526276518940227e-06, 'epoch': 1.19} {'loss': 0.3549, 'learning_rate': 7.525950984702164e-06, 'epoch': 1.19} {'loss': 0.2801, 'learning_rate': 7.5256254532568326e-06, 'epoch': 1.19} {'loss': 0.4172, 'learning_rate': 7.5252999246046e-06, 'epoch': 1.19} {'loss': 0.469, 'learning_rate': 7.5249743987458325e-06, 'epoch': 1.19} {'loss': 0.263, 'learning_rate': 7.524648875680898e-06, 'epoch': 1.19} {'loss': 0.324, 'learning_rate': 7.524323355410165e-06, 'epoch': 1.19} {'loss': 0.4537, 'learning_rate': 7.5239978379339995e-06, 'epoch': 1.19} {'loss': 0.4352, 'learning_rate': 7.523672323252771e-06, 'epoch': 1.19} {'loss': 0.3391, 'learning_rate': 7.523346811366846e-06, 'epoch': 1.19} {'loss': 0.4254, 'learning_rate': 7.5230213022765895e-06, 'epoch': 1.19} {'loss': 0.3071, 'learning_rate': 7.522695795982372e-06, 'epoch': 1.19} {'loss': 0.5393, 'learning_rate': 7.52237029248456e-06, 'epoch': 1.19} {'loss': 0.4551, 'learning_rate': 7.5220447917835196e-06, 'epoch': 1.19} {'loss': 0.3974, 'learning_rate': 7.521719293879619e-06, 'epoch': 1.19} {'loss': 0.2841, 'learning_rate': 7.521393798773228e-06, 'epoch': 1.19} {'loss': 0.305, 'learning_rate': 7.52106830646471e-06, 'epoch': 1.19} {'loss': 0.4601, 'learning_rate': 7.520742816954436e-06, 'epoch': 1.19} {'loss': 0.3241, 'learning_rate': 7.5204173302427715e-06, 'epoch': 1.19} {'loss': 0.3658, 'learning_rate': 7.520091846330084e-06, 'epoch': 1.19} {'loss': 0.3597, 'learning_rate': 7.519766365216742e-06, 'epoch': 1.19} {'loss': 0.1912, 'learning_rate': 7.519440886903112e-06, 'epoch': 1.19} {'loss': 0.373, 'learning_rate': 7.519115411389564e-06, 'epoch': 1.19} {'loss': 0.2502, 'learning_rate': 7.51878993867646e-06, 'epoch': 1.19} {'loss': 0.3148, 'learning_rate': 7.51846446876417e-06, 'epoch': 1.19} {'loss': 0.4738, 'learning_rate': 7.518139001653062e-06, 'epoch': 1.19} {'loss': 0.3891, 'learning_rate': 7.517813537343504e-06, 'epoch': 1.19} {'loss': 0.4268, 'learning_rate': 7.517488075835861e-06, 'epoch': 1.19} {'loss': 0.2999, 'learning_rate': 7.517162617130502e-06, 'epoch': 1.19} {'loss': 0.2753, 'learning_rate': 7.516837161227795e-06, 'epoch': 1.19} {'loss': 0.5139, 'learning_rate': 7.516511708128107e-06, 'epoch': 1.19} {'loss': 0.3231, 'learning_rate': 7.516186257831805e-06, 'epoch': 1.19} {'loss': 0.4805, 'learning_rate': 7.5158608103392564e-06, 'epoch': 1.19} {'loss': 0.4065, 'learning_rate': 7.515535365650828e-06, 'epoch': 1.19} {'loss': 0.3633, 'learning_rate': 7.515209923766888e-06, 'epoch': 1.19} {'loss': 0.341, 'learning_rate': 7.514884484687806e-06, 'epoch': 1.19} {'loss': 0.3519, 'learning_rate': 7.514559048413943e-06, 'epoch': 1.19} {'loss': 0.3132, 'learning_rate': 7.514233614945672e-06, 'epoch': 1.19} {'loss': 0.4644, 'learning_rate': 7.513908184283358e-06, 'epoch': 1.19} {'loss': 0.2633, 'learning_rate': 7.513582756427369e-06, 'epoch': 1.19} {'loss': 0.3521, 'learning_rate': 7.513257331378072e-06, 'epoch': 1.19} {'loss': 0.4226, 'learning_rate': 7.512931909135835e-06, 'epoch': 1.19} {'loss': 0.2636, 'learning_rate': 7.512606489701024e-06, 'epoch': 1.19} {'loss': 0.3164, 'learning_rate': 7.512281073074009e-06, 'epoch': 1.19} {'loss': 0.3712, 'learning_rate': 7.511955659255155e-06, 'epoch': 1.19} {'loss': 0.3418, 'learning_rate': 7.511630248244829e-06, 'epoch': 1.19} {'loss': 0.3179, 'learning_rate': 7.5113048400434e-06, 'epoch': 1.19} {'loss': 0.4499, 'learning_rate': 7.510979434651234e-06, 'epoch': 1.19} {'loss': 0.2238, 'learning_rate': 7.5106540320686995e-06, 'epoch': 1.19} {'loss': 0.2458, 'learning_rate': 7.5103286322961655e-06, 'epoch': 1.19} {'loss': 0.2456, 'learning_rate': 7.5100032353339945e-06, 'epoch': 1.19} {'loss': 0.3138, 'learning_rate': 7.509677841182557e-06, 'epoch': 1.19} {'loss': 0.3914, 'learning_rate': 7.509352449842219e-06, 'epoch': 1.19} {'loss': 0.283, 'learning_rate': 7.509027061313347e-06, 'epoch': 1.19} {'loss': 0.3951, 'learning_rate': 7.508701675596313e-06, 'epoch': 1.19} {'loss': 0.2364, 'learning_rate': 7.508376292691475e-06, 'epoch': 1.19} {'loss': 0.2688, 'learning_rate': 7.508050912599211e-06, 'epoch': 1.19} {'loss': 0.249, 'learning_rate': 7.5077255353198855e-06, 'epoch': 1.19} {'loss': 0.3794, 'learning_rate': 7.507400160853862e-06, 'epoch': 1.19} {'loss': 0.338, 'learning_rate': 7.5070747892015096e-06, 'epoch': 1.19} {'loss': 0.4125, 'learning_rate': 7.506749420363196e-06, 'epoch': 1.19} {'loss': 0.2899, 'learning_rate': 7.5064240543392876e-06, 'epoch': 1.19} {'loss': 0.4862, 'learning_rate': 7.506098691130151e-06, 'epoch': 1.19} {'loss': 0.4552, 'learning_rate': 7.505773330736157e-06, 'epoch': 1.19} {'loss': 0.3841, 'learning_rate': 7.5054479731576705e-06, 'epoch': 1.19} {'loss': 0.3443, 'learning_rate': 7.505122618395058e-06, 'epoch': 1.19} {'loss': 0.5379, 'learning_rate': 7.5047972664486875e-06, 'epoch': 1.19} {'loss': 0.358, 'learning_rate': 7.504471917318927e-06, 'epoch': 1.19} {'loss': 0.3077, 'learning_rate': 7.504146571006143e-06, 'epoch': 1.19} {'loss': 0.4223, 'learning_rate': 7.503821227510705e-06, 'epoch': 1.19} {'loss': 0.3077, 'learning_rate': 7.503495886832976e-06, 'epoch': 1.19} {'loss': 0.2419, 'learning_rate': 7.5031705489733255e-06, 'epoch': 1.19} {'loss': 0.3022, 'learning_rate': 7.502845213932121e-06, 'epoch': 1.19} {'loss': 0.3656, 'learning_rate': 7.502519881709729e-06, 'epoch': 1.19} {'loss': 0.2725, 'learning_rate': 7.502194552306516e-06, 'epoch': 1.19} {'loss': 0.3205, 'learning_rate': 7.5018692257228534e-06, 'epoch': 1.19} {'loss': 0.2906, 'learning_rate': 7.501543901959103e-06, 'epoch': 1.19} {'loss': 0.3557, 'learning_rate': 7.501218581015634e-06, 'epoch': 1.19} {'loss': 0.3073, 'learning_rate': 7.500893262892816e-06, 'epoch': 1.19} {'loss': 0.3246, 'learning_rate': 7.5005679475910135e-06, 'epoch': 1.19} {'loss': 0.3013, 'learning_rate': 7.500242635110594e-06, 'epoch': 1.19} {'loss': 0.3154, 'learning_rate': 7.499917325451925e-06, 'epoch': 1.19} {'loss': 0.3255, 'learning_rate': 7.499592018615377e-06, 'epoch': 1.19} {'loss': 0.3858, 'learning_rate': 7.499266714601312e-06, 'epoch': 1.19} {'loss': 0.3072, 'learning_rate': 7.498941413410099e-06, 'epoch': 1.19} {'loss': 0.2896, 'learning_rate': 7.498616115042106e-06, 'epoch': 1.19} {'loss': 0.2512, 'learning_rate': 7.498290819497698e-06, 'epoch': 1.19} {'loss': 0.2968, 'learning_rate': 7.497965526777246e-06, 'epoch': 1.19} {'loss': 0.3566, 'learning_rate': 7.497640236881114e-06, 'epoch': 1.19} {'loss': 0.2168, 'learning_rate': 7.497314949809671e-06, 'epoch': 1.19} {'loss': 0.3013, 'learning_rate': 7.4969896655632825e-06, 'epoch': 1.19} {'loss': 0.3479, 'learning_rate': 7.496664384142317e-06, 'epoch': 1.19} {'loss': 0.3541, 'learning_rate': 7.496339105547141e-06, 'epoch': 1.19} {'loss': 0.3724, 'learning_rate': 7.496013829778123e-06, 'epoch': 1.19} {'loss': 0.1795, 'learning_rate': 7.49568855683563e-06, 'epoch': 1.19} {'loss': 0.3992, 'learning_rate': 7.49536328672003e-06, 'epoch': 1.19} {'loss': 0.3405, 'learning_rate': 7.4950380194316855e-06, 'epoch': 1.19} {'loss': 0.2645, 'learning_rate': 7.494712754970967e-06, 'epoch': 1.19} {'loss': 0.3264, 'learning_rate': 7.494387493338242e-06, 'epoch': 1.19} {'loss': 0.2571, 'learning_rate': 7.494062234533876e-06, 'epoch': 1.19} {'loss': 0.3099, 'learning_rate': 7.493736978558238e-06, 'epoch': 1.19} {'loss': 0.1729, 'learning_rate': 7.493411725411695e-06, 'epoch': 1.19} {'loss': 0.2067, 'learning_rate': 7.493086475094613e-06, 'epoch': 1.19} {'loss': 0.3321, 'learning_rate': 7.492761227607359e-06, 'epoch': 1.19} {'loss': 0.4263, 'learning_rate': 7.492435982950301e-06, 'epoch': 1.19} {'loss': 0.4359, 'learning_rate': 7.492110741123806e-06, 'epoch': 1.19} {'loss': 0.3905, 'learning_rate': 7.491785502128242e-06, 'epoch': 1.19} {'loss': 0.4571, 'learning_rate': 7.491460265963974e-06, 'epoch': 1.19} {'loss': 0.2997, 'learning_rate': 7.49113503263137e-06, 'epoch': 1.19} {'loss': 0.4089, 'learning_rate': 7.490809802130801e-06, 'epoch': 1.19} {'loss': 0.3035, 'learning_rate': 7.490484574462627e-06, 'epoch': 1.19} {'loss': 0.2682, 'learning_rate': 7.49015934962722e-06, 'epoch': 1.19} {'loss': 0.3959, 'learning_rate': 7.4898341276249465e-06, 'epoch': 1.19} {'loss': 0.1732, 'learning_rate': 7.489508908456171e-06, 'epoch': 1.19} {'loss': 0.3338, 'learning_rate': 7.489183692121264e-06, 'epoch': 1.19} {'loss': 0.3261, 'learning_rate': 7.48885847862059e-06, 'epoch': 1.19} {'loss': 0.2567, 'learning_rate': 7.488533267954517e-06, 'epoch': 1.19} {'loss': 0.3896, 'learning_rate': 7.488208060123414e-06, 'epoch': 1.19} {'loss': 0.3648, 'learning_rate': 7.487882855127646e-06, 'epoch': 1.19} {'loss': 0.3475, 'learning_rate': 7.4875576529675795e-06, 'epoch': 1.19} {'loss': 0.3952, 'learning_rate': 7.487232453643584e-06, 'epoch': 1.19} {'loss': 0.4127, 'learning_rate': 7.486907257156024e-06, 'epoch': 1.19} {'loss': 0.2887, 'learning_rate': 7.48658206350527e-06, 'epoch': 1.19} {'loss': 0.3414, 'learning_rate': 7.486256872691686e-06, 'epoch': 1.19} {'loss': 0.3305, 'learning_rate': 7.4859316847156394e-06, 'epoch': 1.19} {'loss': 0.319, 'learning_rate': 7.485606499577498e-06, 'epoch': 1.19} {'loss': 0.2631, 'learning_rate': 7.485281317277629e-06, 'epoch': 1.19} {'loss': 0.2519, 'learning_rate': 7.484956137816397e-06, 'epoch': 1.19} {'loss': 0.3883, 'learning_rate': 7.484630961194172e-06, 'epoch': 1.19} {'loss': 0.3512, 'learning_rate': 7.484305787411322e-06, 'epoch': 1.19} {'loss': 0.2472, 'learning_rate': 7.483980616468212e-06, 'epoch': 1.19} {'loss': 0.3768, 'learning_rate': 7.4836554483652095e-06, 'epoch': 1.19} {'loss': 0.5061, 'learning_rate': 7.483330283102681e-06, 'epoch': 1.19} {'loss': 0.2672, 'learning_rate': 7.483005120680994e-06, 'epoch': 1.19} {'loss': 0.2669, 'learning_rate': 7.482679961100515e-06, 'epoch': 1.19} {'loss': 0.2606, 'learning_rate': 7.482354804361616e-06, 'epoch': 1.19} {'loss': 0.3107, 'learning_rate': 7.482029650464655e-06, 'epoch': 1.19} {'loss': 0.3214, 'learning_rate': 7.481704499410005e-06, 'epoch': 1.19} {'loss': 0.3339, 'learning_rate': 7.481379351198031e-06, 'epoch': 1.19} {'loss': 0.3643, 'learning_rate': 7.481054205829101e-06, 'epoch': 1.19} {'loss': 0.2492, 'learning_rate': 7.480729063303582e-06, 'epoch': 1.19} {'loss': 0.3457, 'learning_rate': 7.480403923621842e-06, 'epoch': 1.19} {'loss': 0.374, 'learning_rate': 7.480078786784244e-06, 'epoch': 1.19} {'loss': 0.435, 'learning_rate': 7.479753652791159e-06, 'epoch': 1.19} {'loss': 0.3319, 'learning_rate': 7.479428521642955e-06, 'epoch': 1.19} {'loss': 0.2975, 'learning_rate': 7.479103393339995e-06, 'epoch': 1.19} {'loss': 0.3084, 'learning_rate': 7.4787782678826485e-06, 'epoch': 1.19} {'loss': 0.4126, 'learning_rate': 7.47845314527128e-06, 'epoch': 1.19} {'loss': 0.1766, 'learning_rate': 7.478128025506264e-06, 'epoch': 1.19} {'loss': 0.3139, 'learning_rate': 7.477802908587957e-06, 'epoch': 1.19} {'loss': 0.228, 'learning_rate': 7.477477794516732e-06, 'epoch': 1.19} {'loss': 0.2644, 'learning_rate': 7.4771526832929546e-06, 'epoch': 1.19} {'loss': 0.2901, 'learning_rate': 7.476827574916992e-06, 'epoch': 1.19} {'loss': 0.2808, 'learning_rate': 7.4765024693892115e-06, 'epoch': 1.19} {'loss': 0.3063, 'learning_rate': 7.476177366709975e-06, 'epoch': 1.19} {'loss': 0.3173, 'learning_rate': 7.475852266879662e-06, 'epoch': 1.19} {'loss': 0.3067, 'learning_rate': 7.475527169898629e-06, 'epoch': 1.19} {'loss': 0.4442, 'learning_rate': 7.475202075767246e-06, 'epoch': 1.19} {'loss': 0.397, 'learning_rate': 7.474876984485879e-06, 'epoch': 1.19} {'loss': 0.332, 'learning_rate': 7.474551896054897e-06, 'epoch': 1.19} {'loss': 0.3431, 'learning_rate': 7.474226810474665e-06, 'epoch': 1.19} {'loss': 0.4082, 'learning_rate': 7.47390172774555e-06, 'epoch': 1.19} {'loss': 0.3353, 'learning_rate': 7.4735766478679195e-06, 'epoch': 1.19} {'loss': 0.2872, 'learning_rate': 7.473251570842142e-06, 'epoch': 1.19} {'loss': 0.4314, 'learning_rate': 7.472926496668582e-06, 'epoch': 1.19} {'loss': 0.3608, 'learning_rate': 7.472601425347608e-06, 'epoch': 1.19} {'loss': 0.371, 'learning_rate': 7.472276356879585e-06, 'epoch': 1.19} {'loss': 0.3368, 'learning_rate': 7.471951291264883e-06, 'epoch': 1.19} {'loss': 0.2804, 'learning_rate': 7.471626228503866e-06, 'epoch': 1.19} {'loss': 0.2536, 'learning_rate': 7.471301168596905e-06, 'epoch': 1.19} {'loss': 0.4401, 'learning_rate': 7.470976111544361e-06, 'epoch': 1.19} {'loss': 0.2957, 'learning_rate': 7.470651057346605e-06, 'epoch': 1.19} {'loss': 0.3305, 'learning_rate': 7.470326006004003e-06, 'epoch': 1.19} {'loss': 0.3, 'learning_rate': 7.470000957516922e-06, 'epoch': 1.19} {'loss': 0.2439, 'learning_rate': 7.469675911885729e-06, 'epoch': 1.19} {'loss': 0.2946, 'learning_rate': 7.46935086911079e-06, 'epoch': 1.19} {'loss': 0.3253, 'learning_rate': 7.469025829192473e-06, 'epoch': 1.19} {'loss': 0.2134, 'learning_rate': 7.468700792131145e-06, 'epoch': 1.19} {'loss': 0.2192, 'learning_rate': 7.468375757927171e-06, 'epoch': 1.19} {'loss': 0.3408, 'learning_rate': 7.468050726580921e-06, 'epoch': 1.19} {'loss': 0.3852, 'learning_rate': 7.467725698092759e-06, 'epoch': 1.19} {'loss': 0.189, 'learning_rate': 7.467400672463054e-06, 'epoch': 1.19} {'loss': 0.3987, 'learning_rate': 7.467075649692175e-06, 'epoch': 1.19} {'loss': 0.3153, 'learning_rate': 7.466750629780481e-06, 'epoch': 1.19} {'loss': 0.2092, 'learning_rate': 7.466425612728346e-06, 'epoch': 1.19} {'loss': 0.2567, 'learning_rate': 7.466100598536135e-06, 'epoch': 1.19} {'loss': 0.3564, 'learning_rate': 7.465775587204214e-06, 'epoch': 1.19} {'loss': 0.2995, 'learning_rate': 7.465450578732949e-06, 'epoch': 1.19} {'loss': 0.472, 'learning_rate': 7.46512557312271e-06, 'epoch': 1.19} {'loss': 0.5359, 'learning_rate': 7.464800570373863e-06, 'epoch': 1.19} {'loss': 0.2473, 'learning_rate': 7.464475570486771e-06, 'epoch': 1.19} {'loss': 0.3726, 'learning_rate': 7.4641505734618055e-06, 'epoch': 1.19} {'loss': 0.2371, 'learning_rate': 7.463825579299333e-06, 'epoch': 1.19} {'loss': 0.4187, 'learning_rate': 7.4635005879997194e-06, 'epoch': 1.19} {'loss': 0.4677, 'learning_rate': 7.4631755995633295e-06, 'epoch': 1.19} {'loss': 0.3108, 'learning_rate': 7.462850613990534e-06, 'epoch': 1.19} {'loss': 0.3721, 'learning_rate': 7.4625256312816965e-06, 'epoch': 1.19} {'loss': 0.2882, 'learning_rate': 7.4622006514371844e-06, 'epoch': 1.19} {'loss': 0.2756, 'learning_rate': 7.461875674457366e-06, 'epoch': 1.19} {'loss': 0.2127, 'learning_rate': 7.461550700342607e-06, 'epoch': 1.19} {'loss': 0.4362, 'learning_rate': 7.461225729093275e-06, 'epoch': 1.19} {'loss': 0.3853, 'learning_rate': 7.460900760709735e-06, 'epoch': 1.19} {'loss': 0.3387, 'learning_rate': 7.460575795192357e-06, 'epoch': 1.19} {'loss': 0.3087, 'learning_rate': 7.460250832541505e-06, 'epoch': 1.19} {'loss': 0.2964, 'learning_rate': 7.459925872757547e-06, 'epoch': 1.19} {'loss': 0.1916, 'learning_rate': 7.4596009158408485e-06, 'epoch': 1.19} {'loss': 0.309, 'learning_rate': 7.459275961791779e-06, 'epoch': 1.19} {'loss': 0.3796, 'learning_rate': 7.458951010610704e-06, 'epoch': 1.19} {'loss': 0.3994, 'learning_rate': 7.458626062297991e-06, 'epoch': 1.19} {'loss': 0.231, 'learning_rate': 7.458301116854005e-06, 'epoch': 1.19} {'loss': 0.2367, 'learning_rate': 7.457976174279113e-06, 'epoch': 1.19} {'loss': 0.4064, 'learning_rate': 7.4576512345736815e-06, 'epoch': 1.19} {'loss': 0.3611, 'learning_rate': 7.457326297738081e-06, 'epoch': 1.19} {'loss': 0.5081, 'learning_rate': 7.4570013637726735e-06, 'epoch': 1.19} {'loss': 0.431, 'learning_rate': 7.456676432677828e-06, 'epoch': 1.19} {'loss': 0.368, 'learning_rate': 7.456351504453911e-06, 'epoch': 1.19} {'loss': 0.2871, 'learning_rate': 7.456026579101291e-06, 'epoch': 1.19} {'loss': 0.2495, 'learning_rate': 7.455701656620332e-06, 'epoch': 1.19} {'loss': 0.4232, 'learning_rate': 7.455376737011402e-06, 'epoch': 1.19} {'loss': 0.3705, 'learning_rate': 7.455051820274869e-06, 'epoch': 1.19} {'loss': 0.4598, 'learning_rate': 7.454726906411097e-06, 'epoch': 1.19} {'loss': 0.415, 'learning_rate': 7.454401995420457e-06, 'epoch': 1.19} {'loss': 0.2428, 'learning_rate': 7.4540770873033106e-06, 'epoch': 1.19} {'loss': 0.484, 'learning_rate': 7.453752182060028e-06, 'epoch': 1.19} {'loss': 0.327, 'learning_rate': 7.453427279690975e-06, 'epoch': 1.19} {'loss': 0.502, 'learning_rate': 7.453102380196517e-06, 'epoch': 1.19} {'loss': 0.3232, 'learning_rate': 7.452777483577023e-06, 'epoch': 1.19} {'loss': 0.4058, 'learning_rate': 7.45245258983286e-06, 'epoch': 1.19} {'loss': 0.3693, 'learning_rate': 7.452127698964391e-06, 'epoch': 1.19} {'loss': 0.4306, 'learning_rate': 7.4518028109719874e-06, 'epoch': 1.19} {'loss': 0.3123, 'learning_rate': 7.451477925856013e-06, 'epoch': 1.19} {'loss': 0.3082, 'learning_rate': 7.451153043616836e-06, 'epoch': 1.19} {'loss': 0.3501, 'learning_rate': 7.450828164254822e-06, 'epoch': 1.19} {'loss': 0.324, 'learning_rate': 7.450503287770339e-06, 'epoch': 1.19} {'loss': 0.3626, 'learning_rate': 7.450178414163754e-06, 'epoch': 1.19} {'loss': 0.4139, 'learning_rate': 7.44985354343543e-06, 'epoch': 1.19} {'loss': 0.3841, 'learning_rate': 7.449528675585738e-06, 'epoch': 1.19} {'loss': 0.316, 'learning_rate': 7.449203810615042e-06, 'epoch': 1.19} {'loss': 0.4377, 'learning_rate': 7.44887894852371e-06, 'epoch': 1.19} {'loss': 0.3101, 'learning_rate': 7.44855408931211e-06, 'epoch': 1.19} {'loss': 0.1348, 'learning_rate': 7.448229232980606e-06, 'epoch': 1.19} {'loss': 0.1858, 'learning_rate': 7.447904379529566e-06, 'epoch': 1.19} {'loss': 0.3957, 'learning_rate': 7.447579528959357e-06, 'epoch': 1.19} {'loss': 0.2035, 'learning_rate': 7.447254681270345e-06, 'epoch': 1.19} {'loss': 0.3339, 'learning_rate': 7.446929836462898e-06, 'epoch': 1.19} {'loss': 0.3099, 'learning_rate': 7.44660499453738e-06, 'epoch': 1.19} {'loss': 0.4386, 'learning_rate': 7.446280155494161e-06, 'epoch': 1.19} {'loss': 0.3112, 'learning_rate': 7.445955319333606e-06, 'epoch': 1.19} {'loss': 0.4202, 'learning_rate': 7.445630486056081e-06, 'epoch': 1.19} {'loss': 0.1392, 'learning_rate': 7.445305655661954e-06, 'epoch': 1.19} {'loss': 0.3481, 'learning_rate': 7.444980828151591e-06, 'epoch': 1.19} {'loss': 0.3059, 'learning_rate': 7.444656003525359e-06, 'epoch': 1.19} {'loss': 0.4179, 'learning_rate': 7.444331181783624e-06, 'epoch': 1.19} {'loss': 0.2548, 'learning_rate': 7.444006362926749e-06, 'epoch': 1.19} {'loss': 0.4464, 'learning_rate': 7.443681546955109e-06, 'epoch': 1.19} {'loss': 0.3158, 'learning_rate': 7.443356733869068e-06, 'epoch': 1.19} {'loss': 0.1804, 'learning_rate': 7.44303192366899e-06, 'epoch': 1.19} {'loss': 0.3526, 'learning_rate': 7.442707116355241e-06, 'epoch': 1.19} {'loss': 0.2974, 'learning_rate': 7.442382311928191e-06, 'epoch': 1.19} {'loss': 0.5199, 'learning_rate': 7.442057510388204e-06, 'epoch': 1.19} {'loss': 0.2877, 'learning_rate': 7.441732711735649e-06, 'epoch': 1.19} {'loss': 0.4276, 'learning_rate': 7.441407915970891e-06, 'epoch': 1.19} {'loss': 0.4215, 'learning_rate': 7.441083123094295e-06, 'epoch': 1.19} {'loss': 0.2237, 'learning_rate': 7.44075833310623e-06, 'epoch': 1.19} {'loss': 0.4045, 'learning_rate': 7.4404335460070646e-06, 'epoch': 1.19} {'loss': 0.298, 'learning_rate': 7.440108761797161e-06, 'epoch': 1.19} {'loss': 0.3693, 'learning_rate': 7.439783980476889e-06, 'epoch': 1.19} {'loss': 0.3952, 'learning_rate': 7.439459202046613e-06, 'epoch': 1.19} {'loss': 0.3172, 'learning_rate': 7.439134426506703e-06, 'epoch': 1.19} {'loss': 0.3988, 'learning_rate': 7.438809653857522e-06, 'epoch': 1.19} {'loss': 0.2923, 'learning_rate': 7.438484884099437e-06, 'epoch': 1.19} {'loss': 0.1578, 'learning_rate': 7.438160117232816e-06, 'epoch': 1.19} {'loss': 0.4431, 'learning_rate': 7.437835353258024e-06, 'epoch': 1.19} {'loss': 0.2338, 'learning_rate': 7.43751059217543e-06, 'epoch': 1.19} {'loss': 0.3768, 'learning_rate': 7.437185833985398e-06, 'epoch': 1.19} {'loss': 0.3365, 'learning_rate': 7.436861078688296e-06, 'epoch': 1.19} {'loss': 0.472, 'learning_rate': 7.436536326284492e-06, 'epoch': 1.19} {'loss': 0.3156, 'learning_rate': 7.43621157677435e-06, 'epoch': 1.19} {'loss': 0.3139, 'learning_rate': 7.435886830158237e-06, 'epoch': 1.19} {'loss': 0.3547, 'learning_rate': 7.4355620864365205e-06, 'epoch': 1.19} {'loss': 0.2954, 'learning_rate': 7.435237345609567e-06, 'epoch': 1.19} {'loss': 0.3965, 'learning_rate': 7.434912607677744e-06, 'epoch': 1.19} {'loss': 0.3629, 'learning_rate': 7.4345878726414165e-06, 'epoch': 1.19} {'loss': 0.2762, 'learning_rate': 7.43426314050095e-06, 'epoch': 1.19} {'loss': 0.3153, 'learning_rate': 7.4339384112567134e-06, 'epoch': 1.19} {'loss': 0.3697, 'learning_rate': 7.4336136849090726e-06, 'epoch': 1.19} {'loss': 0.3303, 'learning_rate': 7.433288961458394e-06, 'epoch': 1.19} {'loss': 0.3251, 'learning_rate': 7.4329642409050425e-06, 'epoch': 1.19} {'loss': 0.4545, 'learning_rate': 7.432639523249388e-06, 'epoch': 1.19} {'loss': 0.3401, 'learning_rate': 7.432314808491794e-06, 'epoch': 1.19} {'loss': 0.2444, 'learning_rate': 7.431990096632628e-06, 'epoch': 1.19} {'loss': 0.4961, 'learning_rate': 7.431665387672259e-06, 'epoch': 1.19} {'loss': 0.309, 'learning_rate': 7.43134068161105e-06, 'epoch': 1.19} {'loss': 0.4512, 'learning_rate': 7.431015978449369e-06, 'epoch': 1.19} {'loss': 0.2195, 'learning_rate': 7.430691278187585e-06, 'epoch': 1.19} {'loss': 0.3613, 'learning_rate': 7.430366580826058e-06, 'epoch': 1.19} {'loss': 0.3213, 'learning_rate': 7.43004188636516e-06, 'epoch': 1.19} {'loss': 0.1334, 'learning_rate': 7.429717194805257e-06, 'epoch': 1.19} {'loss': 0.3035, 'learning_rate': 7.429392506146713e-06, 'epoch': 1.19} {'loss': 0.2096, 'learning_rate': 7.429067820389897e-06, 'epoch': 1.19} {'loss': 0.2277, 'learning_rate': 7.428743137535174e-06, 'epoch': 1.19} {'loss': 0.3069, 'learning_rate': 7.428418457582911e-06, 'epoch': 1.19} {'loss': 0.3148, 'learning_rate': 7.428093780533474e-06, 'epoch': 1.19} {'loss': 0.4694, 'learning_rate': 7.42776910638723e-06, 'epoch': 1.19} {'loss': 0.2158, 'learning_rate': 7.427444435144548e-06, 'epoch': 1.19} {'loss': 0.266, 'learning_rate': 7.4271197668057896e-06, 'epoch': 1.19} {'loss': 0.3666, 'learning_rate': 7.4267951013713245e-06, 'epoch': 1.19} {'loss': 0.3304, 'learning_rate': 7.42647043884152e-06, 'epoch': 1.19} {'loss': 0.3171, 'learning_rate': 7.4261457792167406e-06, 'epoch': 1.19} {'loss': 0.346, 'learning_rate': 7.425821122497351e-06, 'epoch': 1.19} {'loss': 0.2287, 'learning_rate': 7.4254964686837205e-06, 'epoch': 1.19} {'loss': 0.2167, 'learning_rate': 7.425171817776215e-06, 'epoch': 1.19} {'loss': 0.2555, 'learning_rate': 7.424847169775201e-06, 'epoch': 1.19} {'loss': 0.1531, 'learning_rate': 7.424522524681046e-06, 'epoch': 1.19} {'loss': 0.3248, 'learning_rate': 7.424197882494113e-06, 'epoch': 1.19} {'loss': 0.3767, 'learning_rate': 7.423873243214772e-06, 'epoch': 1.19} {'loss': 0.3001, 'learning_rate': 7.4235486068433895e-06, 'epoch': 1.19} {'loss': 0.3083, 'learning_rate': 7.423223973380329e-06, 'epoch': 1.19} {'loss': 0.2539, 'learning_rate': 7.422899342825959e-06, 'epoch': 1.19} {'loss': 0.5408, 'learning_rate': 7.422574715180646e-06, 'epoch': 1.19} {'loss': 0.3024, 'learning_rate': 7.422250090444757e-06, 'epoch': 1.19} {'loss': 0.2769, 'learning_rate': 7.421925468618656e-06, 'epoch': 1.19} {'loss': 0.4511, 'learning_rate': 7.4216008497027115e-06, 'epoch': 1.19} {'loss': 0.4019, 'learning_rate': 7.421276233697289e-06, 'epoch': 1.19} {'loss': 0.3356, 'learning_rate': 7.420951620602755e-06, 'epoch': 1.19} {'loss': 0.4283, 'learning_rate': 7.420627010419477e-06, 'epoch': 1.19} {'loss': 0.4836, 'learning_rate': 7.4203024031478185e-06, 'epoch': 1.19} {'loss': 0.3014, 'learning_rate': 7.419977798788149e-06, 'epoch': 1.19} {'loss': 0.4598, 'learning_rate': 7.419653197340835e-06, 'epoch': 1.19} {'loss': 0.2676, 'learning_rate': 7.4193285988062416e-06, 'epoch': 1.19} {'loss': 0.2666, 'learning_rate': 7.419004003184735e-06, 'epoch': 1.19} {'loss': 0.3107, 'learning_rate': 7.4186794104766825e-06, 'epoch': 1.19} {'loss': 0.3013, 'learning_rate': 7.418354820682449e-06, 'epoch': 1.19} {'loss': 0.2538, 'learning_rate': 7.418030233802404e-06, 'epoch': 1.19} {'loss': 0.3722, 'learning_rate': 7.417705649836912e-06, 'epoch': 1.19} {'loss': 0.4006, 'learning_rate': 7.417381068786338e-06, 'epoch': 1.19} {'loss': 0.4183, 'learning_rate': 7.41705649065105e-06, 'epoch': 1.19} {'loss': 0.3229, 'learning_rate': 7.4167319154314145e-06, 'epoch': 1.19} {'loss': 0.3612, 'learning_rate': 7.416407343127796e-06, 'epoch': 1.19} {'loss': 0.3874, 'learning_rate': 7.416082773740563e-06, 'epoch': 1.19} {'loss': 0.2826, 'learning_rate': 7.415758207270081e-06, 'epoch': 1.19} {'loss': 0.4494, 'learning_rate': 7.4154336437167164e-06, 'epoch': 1.19} {'loss': 0.3069, 'learning_rate': 7.415109083080836e-06, 'epoch': 1.19} {'loss': 0.3331, 'learning_rate': 7.414784525362806e-06, 'epoch': 1.19} {'loss': 0.3792, 'learning_rate': 7.4144599705629925e-06, 'epoch': 1.19} {'loss': 0.2046, 'learning_rate': 7.414135418681763e-06, 'epoch': 1.19} {'loss': 0.5219, 'learning_rate': 7.413810869719482e-06, 'epoch': 1.19} {'loss': 0.4878, 'learning_rate': 7.413486323676518e-06, 'epoch': 1.19} {'loss': 0.4351, 'learning_rate': 7.413161780553236e-06, 'epoch': 1.19} {'loss': 0.3942, 'learning_rate': 7.412837240350002e-06, 'epoch': 1.19} {'loss': 0.4281, 'learning_rate': 7.4125127030671805e-06, 'epoch': 1.19} {'loss': 0.2612, 'learning_rate': 7.4121881687051424e-06, 'epoch': 1.19} {'loss': 0.339, 'learning_rate': 7.411863637264252e-06, 'epoch': 1.19} {'loss': 0.3769, 'learning_rate': 7.41153910874487e-06, 'epoch': 1.19} {'loss': 0.2889, 'learning_rate': 7.411214583147375e-06, 'epoch': 1.19} {'loss': 0.2713, 'learning_rate': 7.410890060472123e-06, 'epoch': 1.19} {'loss': 0.3334, 'learning_rate': 7.410565540719486e-06, 'epoch': 1.19} {'loss': 0.2406, 'learning_rate': 7.410241023889826e-06, 'epoch': 1.19} {'loss': 0.3895, 'learning_rate': 7.4099165099835125e-06, 'epoch': 1.19} {'loss': 0.4336, 'learning_rate': 7.409591999000911e-06, 'epoch': 1.19} {'loss': 0.1997, 'learning_rate': 7.409267490942387e-06, 'epoch': 1.19} {'loss': 0.3604, 'learning_rate': 7.408942985808307e-06, 'epoch': 1.19} {'loss': 0.1852, 'learning_rate': 7.4086184835990386e-06, 'epoch': 1.19} {'loss': 0.2873, 'learning_rate': 7.408293984314947e-06, 'epoch': 1.19} {'loss': 0.2131, 'learning_rate': 7.407969487956398e-06, 'epoch': 1.19} {'loss': 0.4094, 'learning_rate': 7.407644994523759e-06, 'epoch': 1.19} {'loss': 0.3638, 'learning_rate': 7.4073205040173956e-06, 'epoch': 1.19} {'loss': 0.2761, 'learning_rate': 7.406996016437677e-06, 'epoch': 1.19} {'loss': 0.2094, 'learning_rate': 7.406671531784964e-06, 'epoch': 1.19} {'loss': 0.2819, 'learning_rate': 7.406347050059626e-06, 'epoch': 1.19} {'loss': 0.1852, 'learning_rate': 7.4060225712620285e-06, 'epoch': 1.19} {'loss': 0.3971, 'learning_rate': 7.405698095392539e-06, 'epoch': 1.19} {'loss': 0.3194, 'learning_rate': 7.4053736224515224e-06, 'epoch': 1.19} {'loss': 0.2644, 'learning_rate': 7.4050491524393465e-06, 'epoch': 1.19} {'loss': 0.28, 'learning_rate': 7.404724685356376e-06, 'epoch': 1.19} {'loss': 0.2811, 'learning_rate': 7.404400221202978e-06, 'epoch': 1.19} {'loss': 0.2594, 'learning_rate': 7.404075759979519e-06, 'epoch': 1.19} {'loss': 0.427, 'learning_rate': 7.403751301686364e-06, 'epoch': 1.19} {'loss': 0.3424, 'learning_rate': 7.40342684632388e-06, 'epoch': 1.19} {'loss': 0.2111, 'learning_rate': 7.403102393892434e-06, 'epoch': 1.19} {'loss': 0.3899, 'learning_rate': 7.402777944392394e-06, 'epoch': 1.19} {'loss': 0.4214, 'learning_rate': 7.40245349782412e-06, 'epoch': 1.19} {'loss': 0.3156, 'learning_rate': 7.402129054187983e-06, 'epoch': 1.19} {'loss': 0.2639, 'learning_rate': 7.401804613484349e-06, 'epoch': 1.19} {'loss': 0.4042, 'learning_rate': 7.401480175713582e-06, 'epoch': 1.19} {'loss': 0.4362, 'learning_rate': 7.401155740876052e-06, 'epoch': 1.19} {'loss': 0.478, 'learning_rate': 7.400831308972122e-06, 'epoch': 1.19} {'loss': 0.3394, 'learning_rate': 7.400506880002158e-06, 'epoch': 1.19} {'loss': 0.445, 'learning_rate': 7.400182453966529e-06, 'epoch': 1.19} {'loss': 0.3757, 'learning_rate': 7.399858030865599e-06, 'epoch': 1.19} {'loss': 0.2647, 'learning_rate': 7.399533610699734e-06, 'epoch': 1.19} {'loss': 0.284, 'learning_rate': 7.399209193469304e-06, 'epoch': 1.19} {'loss': 0.3782, 'learning_rate': 7.398884779174669e-06, 'epoch': 1.19} {'loss': 0.2804, 'learning_rate': 7.398560367816199e-06, 'epoch': 1.19} {'loss': 0.3665, 'learning_rate': 7.398235959394262e-06, 'epoch': 1.19} {'loss': 0.4323, 'learning_rate': 7.39791155390922e-06, 'epoch': 1.19} {'loss': 0.4697, 'learning_rate': 7.3975871513614414e-06, 'epoch': 1.19} {'loss': 0.2666, 'learning_rate': 7.397262751751293e-06, 'epoch': 1.19} {'loss': 0.39, 'learning_rate': 7.396938355079137e-06, 'epoch': 1.19} {'loss': 0.3348, 'learning_rate': 7.396613961345344e-06, 'epoch': 1.19} {'loss': 0.3676, 'learning_rate': 7.396289570550282e-06, 'epoch': 1.19} {'loss': 0.3757, 'learning_rate': 7.395965182694309e-06, 'epoch': 1.19} {'loss': 0.4751, 'learning_rate': 7.395640797777799e-06, 'epoch': 1.19} {'loss': 0.3729, 'learning_rate': 7.3953164158011145e-06, 'epoch': 1.19} {'loss': 0.3129, 'learning_rate': 7.394992036764623e-06, 'epoch': 1.19} {'loss': 0.3446, 'learning_rate': 7.394667660668688e-06, 'epoch': 1.19} {'loss': 0.3366, 'learning_rate': 7.394343287513681e-06, 'epoch': 1.19} {'loss': 0.4501, 'learning_rate': 7.3940189172999655e-06, 'epoch': 1.19} {'loss': 0.2362, 'learning_rate': 7.393694550027905e-06, 'epoch': 1.19} {'loss': 0.3942, 'learning_rate': 7.393370185697868e-06, 'epoch': 1.19} {'loss': 0.2723, 'learning_rate': 7.393045824310219e-06, 'epoch': 1.19} {'loss': 0.4309, 'learning_rate': 7.392721465865327e-06, 'epoch': 1.19} {'loss': 0.3404, 'learning_rate': 7.392397110363556e-06, 'epoch': 1.19} {'loss': 0.5422, 'learning_rate': 7.3920727578052735e-06, 'epoch': 1.19} {'loss': 0.2437, 'learning_rate': 7.391748408190844e-06, 'epoch': 1.19} {'loss': 0.2972, 'learning_rate': 7.391424061520636e-06, 'epoch': 1.19} {'loss': 0.4184, 'learning_rate': 7.391099717795012e-06, 'epoch': 1.19} {'loss': 0.2316, 'learning_rate': 7.390775377014343e-06, 'epoch': 1.19} {'loss': 0.289, 'learning_rate': 7.39045103917899e-06, 'epoch': 1.19} {'loss': 0.2673, 'learning_rate': 7.390126704289322e-06, 'epoch': 1.19} {'loss': 0.4116, 'learning_rate': 7.389802372345709e-06, 'epoch': 1.19} {'loss': 0.3643, 'learning_rate': 7.389478043348508e-06, 'epoch': 1.19} {'loss': 0.2971, 'learning_rate': 7.389153717298091e-06, 'epoch': 1.19} {'loss': 0.2615, 'learning_rate': 7.388829394194823e-06, 'epoch': 1.19} {'loss': 0.4418, 'learning_rate': 7.3885050740390694e-06, 'epoch': 1.19} {'loss': 0.2638, 'learning_rate': 7.388180756831198e-06, 'epoch': 1.19} {'loss': 0.3058, 'learning_rate': 7.387856442571573e-06, 'epoch': 1.19} {'loss': 0.2642, 'learning_rate': 7.3875321312605615e-06, 'epoch': 1.19} {'loss': 0.369, 'learning_rate': 7.38720782289853e-06, 'epoch': 1.19} {'loss': 0.2712, 'learning_rate': 7.3868835174858435e-06, 'epoch': 1.19} {'loss': 0.4267, 'learning_rate': 7.3865592150228696e-06, 'epoch': 1.19} {'loss': 0.2039, 'learning_rate': 7.3862349155099725e-06, 'epoch': 1.19} {'loss': 0.1995, 'learning_rate': 7.385910618947518e-06, 'epoch': 1.19} {'loss': 0.2639, 'learning_rate': 7.3855863253358785e-06, 'epoch': 1.19} {'loss': 0.3066, 'learning_rate': 7.38526203467541e-06, 'epoch': 1.19} {'loss': 0.3377, 'learning_rate': 7.3849377469664855e-06, 'epoch': 1.19} {'loss': 0.4034, 'learning_rate': 7.3846134622094665e-06, 'epoch': 1.19} {'loss': 0.1978, 'learning_rate': 7.384289180404723e-06, 'epoch': 1.19} {'loss': 0.3395, 'learning_rate': 7.383964901552621e-06, 'epoch': 1.19} {'loss': 0.3578, 'learning_rate': 7.383640625653523e-06, 'epoch': 1.19} {'loss': 0.1767, 'learning_rate': 7.383316352707798e-06, 'epoch': 1.19} {'loss': 0.2798, 'learning_rate': 7.382992082715811e-06, 'epoch': 1.19} {'loss': 0.4183, 'learning_rate': 7.382667815677928e-06, 'epoch': 1.19} {'loss': 0.3553, 'learning_rate': 7.382343551594515e-06, 'epoch': 1.19} {'loss': 0.4699, 'learning_rate': 7.38201929046594e-06, 'epoch': 1.19} {'loss': 0.3897, 'learning_rate': 7.381695032292567e-06, 'epoch': 1.19} {'loss': 0.4051, 'learning_rate': 7.381370777074764e-06, 'epoch': 1.19} {'loss': 0.4248, 'learning_rate': 7.381046524812894e-06, 'epoch': 1.19} {'loss': 0.3847, 'learning_rate': 7.3807222755073235e-06, 'epoch': 1.19} {'loss': 0.225, 'learning_rate': 7.38039802915842e-06, 'epoch': 1.19} {'loss': 0.3487, 'learning_rate': 7.380073785766549e-06, 'epoch': 1.19} {'loss': 0.3307, 'learning_rate': 7.379749545332075e-06, 'epoch': 1.19} {'loss': 0.2878, 'learning_rate': 7.379425307855363e-06, 'epoch': 1.19} {'loss': 0.3033, 'learning_rate': 7.3791010733367856e-06, 'epoch': 1.19} {'loss': 0.3727, 'learning_rate': 7.378776841776707e-06, 'epoch': 1.19} {'loss': 0.503, 'learning_rate': 7.378452613175489e-06, 'epoch': 1.19} {'loss': 0.3049, 'learning_rate': 7.378128387533497e-06, 'epoch': 1.19} {'loss': 0.4183, 'learning_rate': 7.3778041648511014e-06, 'epoch': 1.19} {'loss': 0.2958, 'learning_rate': 7.377479945128667e-06, 'epoch': 1.19} {'loss': 0.3712, 'learning_rate': 7.377155728366558e-06, 'epoch': 1.19} {'loss': 0.2257, 'learning_rate': 7.376831514565141e-06, 'epoch': 1.19} {'loss': 0.3497, 'learning_rate': 7.376507303724784e-06, 'epoch': 1.19} {'loss': 0.3299, 'learning_rate': 7.3761830958458505e-06, 'epoch': 1.19} {'loss': 0.3119, 'learning_rate': 7.375858890928707e-06, 'epoch': 1.19} {'loss': 0.4489, 'learning_rate': 7.37553468897372e-06, 'epoch': 1.19} {'loss': 0.3402, 'learning_rate': 7.375210489981255e-06, 'epoch': 1.19} {'loss': 0.3199, 'learning_rate': 7.374886293951678e-06, 'epoch': 1.19} {'loss': 0.2873, 'learning_rate': 7.3745621008853585e-06, 'epoch': 1.19} {'loss': 0.1737, 'learning_rate': 7.374237910782655e-06, 'epoch': 1.19} {'loss': 0.2541, 'learning_rate': 7.37391372364394e-06, 'epoch': 1.19} {'loss': 0.2817, 'learning_rate': 7.373589539469577e-06, 'epoch': 1.2} {'loss': 0.4151, 'learning_rate': 7.37326535825993e-06, 'epoch': 1.2} {'loss': 0.3678, 'learning_rate': 7.372941180015369e-06, 'epoch': 1.2} {'loss': 0.3498, 'learning_rate': 7.372617004736255e-06, 'epoch': 1.2} {'loss': 0.3057, 'learning_rate': 7.372292832422959e-06, 'epoch': 1.2} {'loss': 0.3882, 'learning_rate': 7.3719686630758444e-06, 'epoch': 1.2} {'loss': 0.4035, 'learning_rate': 7.371644496695277e-06, 'epoch': 1.2} {'loss': 0.3277, 'learning_rate': 7.371320333281624e-06, 'epoch': 1.2} {'loss': 0.2785, 'learning_rate': 7.370996172835249e-06, 'epoch': 1.2} {'loss': 0.3357, 'learning_rate': 7.3706720153565215e-06, 'epoch': 1.2} {'loss': 0.384, 'learning_rate': 7.3703478608458055e-06, 'epoch': 1.2} {'loss': 0.3861, 'learning_rate': 7.370023709303466e-06, 'epoch': 1.2} {'loss': 0.3828, 'learning_rate': 7.369699560729868e-06, 'epoch': 1.2} {'loss': 0.2133, 'learning_rate': 7.369375415125381e-06, 'epoch': 1.2} {'loss': 0.4614, 'learning_rate': 7.3690512724903674e-06, 'epoch': 1.2} {'loss': 0.3967, 'learning_rate': 7.368727132825196e-06, 'epoch': 1.2} {'loss': 0.2542, 'learning_rate': 7.3684029961302295e-06, 'epoch': 1.2} {'loss': 0.4768, 'learning_rate': 7.368078862405837e-06, 'epoch': 1.2} {'loss': 0.4336, 'learning_rate': 7.367754731652382e-06, 'epoch': 1.2} {'loss': 0.3485, 'learning_rate': 7.367430603870232e-06, 'epoch': 1.2} {'loss': 0.5042, 'learning_rate': 7.367106479059751e-06, 'epoch': 1.2} {'loss': 0.5026, 'learning_rate': 7.366782357221308e-06, 'epoch': 1.2} {'loss': 0.3906, 'learning_rate': 7.366458238355266e-06, 'epoch': 1.2} {'loss': 0.3232, 'learning_rate': 7.366134122461994e-06, 'epoch': 1.2} {'loss': 0.3669, 'learning_rate': 7.365810009541854e-06, 'epoch': 1.2} {'loss': 0.3151, 'learning_rate': 7.365485899595212e-06, 'epoch': 1.2} {'loss': 0.2793, 'learning_rate': 7.3651617926224385e-06, 'epoch': 1.2} {'loss': 0.3302, 'learning_rate': 7.364837688623894e-06, 'epoch': 1.2} {'loss': 0.3217, 'learning_rate': 7.364513587599947e-06, 'epoch': 1.2} {'loss': 0.4749, 'learning_rate': 7.364189489550964e-06, 'epoch': 1.2} {'loss': 0.2742, 'learning_rate': 7.3638653944773085e-06, 'epoch': 1.2} {'loss': 0.326, 'learning_rate': 7.363541302379349e-06, 'epoch': 1.2} {'loss': 0.3856, 'learning_rate': 7.363217213257449e-06, 'epoch': 1.2} {'loss': 0.2982, 'learning_rate': 7.3628931271119765e-06, 'epoch': 1.2} {'loss': 0.2415, 'learning_rate': 7.362569043943295e-06, 'epoch': 1.2} {'loss': 0.4613, 'learning_rate': 7.3622449637517715e-06, 'epoch': 1.2} {'loss': 0.4516, 'learning_rate': 7.361920886537775e-06, 'epoch': 1.2} {'loss': 0.4209, 'learning_rate': 7.361596812301665e-06, 'epoch': 1.2} {'loss': 0.4571, 'learning_rate': 7.36127274104381e-06, 'epoch': 1.2} {'loss': 0.2096, 'learning_rate': 7.360948672764577e-06, 'epoch': 1.2} {'loss': 0.4778, 'learning_rate': 7.360624607464332e-06, 'epoch': 1.2} {'loss': 0.4496, 'learning_rate': 7.360300545143439e-06, 'epoch': 1.2} {'loss': 0.4886, 'learning_rate': 7.359976485802265e-06, 'epoch': 1.2} {'loss': 0.3166, 'learning_rate': 7.3596524294411756e-06, 'epoch': 1.2} {'loss': 0.5068, 'learning_rate': 7.359328376060536e-06, 'epoch': 1.2} {'loss': 0.3152, 'learning_rate': 7.3590043256607125e-06, 'epoch': 1.2} {'loss': 0.3104, 'learning_rate': 7.358680278242072e-06, 'epoch': 1.2} {'loss': 0.2917, 'learning_rate': 7.3583562338049774e-06, 'epoch': 1.2} {'loss': 0.4695, 'learning_rate': 7.358032192349798e-06, 'epoch': 1.2} {'loss': 0.2731, 'learning_rate': 7.3577081538768995e-06, 'epoch': 1.2} {'loss': 0.3092, 'learning_rate': 7.357384118386644e-06, 'epoch': 1.2} {'loss': 0.2356, 'learning_rate': 7.357060085879399e-06, 'epoch': 1.2} {'loss': 0.1832, 'learning_rate': 7.356736056355532e-06, 'epoch': 1.2} {'loss': 0.3763, 'learning_rate': 7.3564120298154055e-06, 'epoch': 1.2} {'loss': 0.3004, 'learning_rate': 7.3560880062593866e-06, 'epoch': 1.2} {'loss': 0.3789, 'learning_rate': 7.3557639856878425e-06, 'epoch': 1.2} {'loss': 0.2166, 'learning_rate': 7.355439968101138e-06, 'epoch': 1.2} {'loss': 0.3035, 'learning_rate': 7.355115953499638e-06, 'epoch': 1.2} {'loss': 0.3266, 'learning_rate': 7.354791941883712e-06, 'epoch': 1.2} {'loss': 0.3018, 'learning_rate': 7.35446793325372e-06, 'epoch': 1.2} {'loss': 0.2524, 'learning_rate': 7.3541439276100325e-06, 'epoch': 1.2} {'loss': 0.3091, 'learning_rate': 7.353819924953012e-06, 'epoch': 1.2} {'loss': 0.4156, 'learning_rate': 7.353495925283029e-06, 'epoch': 1.2} {'loss': 0.3963, 'learning_rate': 7.353171928600442e-06, 'epoch': 1.2} {'loss': 0.3076, 'learning_rate': 7.352847934905623e-06, 'epoch': 1.2} {'loss': 0.282, 'learning_rate': 7.352523944198932e-06, 'epoch': 1.2} {'loss': 0.4048, 'learning_rate': 7.352199956480741e-06, 'epoch': 1.2} {'loss': 0.2781, 'learning_rate': 7.351875971751412e-06, 'epoch': 1.2} {'loss': 0.2218, 'learning_rate': 7.351551990011311e-06, 'epoch': 1.2} {'loss': 0.3272, 'learning_rate': 7.351228011260805e-06, 'epoch': 1.2} {'loss': 0.1659, 'learning_rate': 7.350904035500257e-06, 'epoch': 1.2} {'loss': 0.2787, 'learning_rate': 7.350580062730036e-06, 'epoch': 1.2} {'loss': 0.346, 'learning_rate': 7.350256092950507e-06, 'epoch': 1.2} {'loss': 0.2856, 'learning_rate': 7.349932126162034e-06, 'epoch': 1.2} {'loss': 0.3285, 'learning_rate': 7.349608162364983e-06, 'epoch': 1.2} {'loss': 0.3052, 'learning_rate': 7.349284201559721e-06, 'epoch': 1.2} {'loss': 0.3459, 'learning_rate': 7.348960243746616e-06, 'epoch': 1.2} {'loss': 0.2616, 'learning_rate': 7.348636288926028e-06, 'epoch': 1.2} {'loss': 0.1938, 'learning_rate': 7.348312337098324e-06, 'epoch': 1.2} {'loss': 0.4151, 'learning_rate': 7.347988388263873e-06, 'epoch': 1.2} {'loss': 0.3856, 'learning_rate': 7.347664442423039e-06, 'epoch': 1.2} {'loss': 0.2861, 'learning_rate': 7.3473404995761836e-06, 'epoch': 1.2} {'loss': 0.3339, 'learning_rate': 7.3470165597236784e-06, 'epoch': 1.2} {'loss': 0.3807, 'learning_rate': 7.3466926228658905e-06, 'epoch': 1.2} {'loss': 0.3267, 'learning_rate': 7.3463686890031805e-06, 'epoch': 1.2} {'loss': 0.246, 'learning_rate': 7.346044758135915e-06, 'epoch': 1.2} {'loss': 0.3394, 'learning_rate': 7.34572083026446e-06, 'epoch': 1.2} {'loss': 0.3695, 'learning_rate': 7.345396905389181e-06, 'epoch': 1.2} {'loss': 0.3526, 'learning_rate': 7.345072983510445e-06, 'epoch': 1.2} {'loss': 0.3963, 'learning_rate': 7.3447490646286165e-06, 'epoch': 1.2} {'loss': 0.229, 'learning_rate': 7.344425148744061e-06, 'epoch': 1.2} {'loss': 0.324, 'learning_rate': 7.3441012358571466e-06, 'epoch': 1.2} {'loss': 0.3825, 'learning_rate': 7.343777325968235e-06, 'epoch': 1.2} {'loss': 0.4075, 'learning_rate': 7.343453419077693e-06, 'epoch': 1.2} {'loss': 0.2923, 'learning_rate': 7.343129515185889e-06, 'epoch': 1.2} {'loss': 0.4992, 'learning_rate': 7.342805614293185e-06, 'epoch': 1.2} {'loss': 0.3809, 'learning_rate': 7.342481716399949e-06, 'epoch': 1.2} {'loss': 0.2235, 'learning_rate': 7.342157821506546e-06, 'epoch': 1.2} {'loss': 0.2742, 'learning_rate': 7.341833929613341e-06, 'epoch': 1.2} {'loss': 0.3149, 'learning_rate': 7.3415100407207005e-06, 'epoch': 1.2} {'loss': 0.2627, 'learning_rate': 7.341186154828988e-06, 'epoch': 1.2} {'loss': 0.3418, 'learning_rate': 7.340862271938572e-06, 'epoch': 1.2} {'loss': 0.3784, 'learning_rate': 7.340538392049816e-06, 'epoch': 1.2} {'loss': 0.3146, 'learning_rate': 7.340214515163088e-06, 'epoch': 1.2} {'loss': 0.2087, 'learning_rate': 7.339890641278751e-06, 'epoch': 1.2} {'loss': 0.3472, 'learning_rate': 7.339566770397171e-06, 'epoch': 1.2} {'loss': 0.3096, 'learning_rate': 7.339242902518715e-06, 'epoch': 1.2} {'loss': 0.2662, 'learning_rate': 7.338919037643748e-06, 'epoch': 1.2} {'loss': 0.1982, 'learning_rate': 7.338595175772635e-06, 'epoch': 1.2} {'loss': 0.3617, 'learning_rate': 7.338271316905743e-06, 'epoch': 1.2} {'loss': 0.399, 'learning_rate': 7.337947461043436e-06, 'epoch': 1.2} {'loss': 0.4382, 'learning_rate': 7.3376236081860795e-06, 'epoch': 1.2} {'loss': 0.3557, 'learning_rate': 7.33729975833404e-06, 'epoch': 1.2} {'loss': 0.3859, 'learning_rate': 7.336975911487682e-06, 'epoch': 1.2} {'loss': 0.2816, 'learning_rate': 7.3366520676473715e-06, 'epoch': 1.2} {'loss': 0.3423, 'learning_rate': 7.336328226813476e-06, 'epoch': 1.2} {'loss': 0.4768, 'learning_rate': 7.336004388986359e-06, 'epoch': 1.2} {'loss': 0.3814, 'learning_rate': 7.3356805541663855e-06, 'epoch': 1.2} {'loss': 0.3586, 'learning_rate': 7.335356722353924e-06, 'epoch': 1.2} {'loss': 0.3024, 'learning_rate': 7.3350328935493355e-06, 'epoch': 1.2} {'loss': 0.4014, 'learning_rate': 7.33470906775299e-06, 'epoch': 1.2} {'loss': 0.2907, 'learning_rate': 7.33438524496525e-06, 'epoch': 1.2} {'loss': 0.3067, 'learning_rate': 7.3340614251864836e-06, 'epoch': 1.2} {'loss': 0.2681, 'learning_rate': 7.333737608417054e-06, 'epoch': 1.2} {'loss': 0.2173, 'learning_rate': 7.333413794657327e-06, 'epoch': 1.2} {'loss': 0.3533, 'learning_rate': 7.333089983907669e-06, 'epoch': 1.2} {'loss': 0.4422, 'learning_rate': 7.3327661761684465e-06, 'epoch': 1.2} {'loss': 0.4003, 'learning_rate': 7.3324423714400226e-06, 'epoch': 1.2} {'loss': 0.3094, 'learning_rate': 7.3321185697227635e-06, 'epoch': 1.2} {'loss': 0.422, 'learning_rate': 7.331794771017036e-06, 'epoch': 1.2} {'loss': 0.2011, 'learning_rate': 7.331470975323205e-06, 'epoch': 1.2} {'loss': 0.3458, 'learning_rate': 7.331147182641636e-06, 'epoch': 1.2} {'loss': 0.3024, 'learning_rate': 7.330823392972692e-06, 'epoch': 1.2} {'loss': 0.3909, 'learning_rate': 7.330499606316743e-06, 'epoch': 1.2} {'loss': 0.3723, 'learning_rate': 7.330175822674153e-06, 'epoch': 1.2} {'loss': 0.2336, 'learning_rate': 7.329852042045284e-06, 'epoch': 1.2} {'loss': 0.3758, 'learning_rate': 7.3295282644305095e-06, 'epoch': 1.2} {'loss': 0.4546, 'learning_rate': 7.329204489830186e-06, 'epoch': 1.2} {'loss': 0.3085, 'learning_rate': 7.328880718244684e-06, 'epoch': 1.2} {'loss': 0.2917, 'learning_rate': 7.328556949674366e-06, 'epoch': 1.2} {'loss': 0.336, 'learning_rate': 7.3282331841196e-06, 'epoch': 1.2} {'loss': 0.4739, 'learning_rate': 7.32790942158075e-06, 'epoch': 1.2} {'loss': 0.3399, 'learning_rate': 7.327585662058183e-06, 'epoch': 1.2} {'loss': 0.3798, 'learning_rate': 7.327261905552264e-06, 'epoch': 1.2} {'loss': 0.2805, 'learning_rate': 7.326938152063358e-06, 'epoch': 1.2} {'loss': 0.3227, 'learning_rate': 7.32661440159183e-06, 'epoch': 1.2} {'loss': 0.1778, 'learning_rate': 7.326290654138047e-06, 'epoch': 1.2} {'loss': 0.2772, 'learning_rate': 7.3259669097023715e-06, 'epoch': 1.2} {'loss': 0.3862, 'learning_rate': 7.325643168285171e-06, 'epoch': 1.2} {'loss': 0.3833, 'learning_rate': 7.325319429886815e-06, 'epoch': 1.2} {'loss': 0.3023, 'learning_rate': 7.324995694507659e-06, 'epoch': 1.2} {'loss': 0.3896, 'learning_rate': 7.3246719621480775e-06, 'epoch': 1.2} {'loss': 0.2884, 'learning_rate': 7.324348232808431e-06, 'epoch': 1.2} {'loss': 0.3954, 'learning_rate': 7.324024506489088e-06, 'epoch': 1.2} {'loss': 0.2344, 'learning_rate': 7.323700783190412e-06, 'epoch': 1.2} {'loss': 0.2676, 'learning_rate': 7.323377062912769e-06, 'epoch': 1.2} {'loss': 0.3253, 'learning_rate': 7.323053345656523e-06, 'epoch': 1.2} {'loss': 0.3542, 'learning_rate': 7.322729631422042e-06, 'epoch': 1.2} {'loss': 0.4306, 'learning_rate': 7.32240592020969e-06, 'epoch': 1.2} {'loss': 0.3412, 'learning_rate': 7.3220822120198324e-06, 'epoch': 1.2} {'loss': 0.322, 'learning_rate': 7.321758506852834e-06, 'epoch': 1.2} {'loss': 0.3607, 'learning_rate': 7.321434804709062e-06, 'epoch': 1.2} {'loss': 0.3348, 'learning_rate': 7.321111105588883e-06, 'epoch': 1.2} {'loss': 0.2789, 'learning_rate': 7.320787409492657e-06, 'epoch': 1.2} {'loss': 0.3254, 'learning_rate': 7.320463716420752e-06, 'epoch': 1.2} {'loss': 0.4485, 'learning_rate': 7.320140026373535e-06, 'epoch': 1.2} {'loss': 0.3429, 'learning_rate': 7.319816339351371e-06, 'epoch': 1.2} {'loss': 0.2715, 'learning_rate': 7.319492655354623e-06, 'epoch': 1.2} {'loss': 0.3263, 'learning_rate': 7.319168974383659e-06, 'epoch': 1.2} {'loss': 0.3375, 'learning_rate': 7.318845296438844e-06, 'epoch': 1.2} {'loss': 0.2421, 'learning_rate': 7.318521621520542e-06, 'epoch': 1.2} {'loss': 0.3788, 'learning_rate': 7.31819794962912e-06, 'epoch': 1.2} {'loss': 0.415, 'learning_rate': 7.3178742807649425e-06, 'epoch': 1.2} {'loss': 0.3066, 'learning_rate': 7.317550614928373e-06, 'epoch': 1.2} {'loss': 0.4141, 'learning_rate': 7.31722695211978e-06, 'epoch': 1.2} {'loss': 0.42, 'learning_rate': 7.316903292339531e-06, 'epoch': 1.2} {'loss': 0.3295, 'learning_rate': 7.316579635587985e-06, 'epoch': 1.2} {'loss': 0.4435, 'learning_rate': 7.31625598186551e-06, 'epoch': 1.2} {'loss': 0.3433, 'learning_rate': 7.315932331172471e-06, 'epoch': 1.2} {'loss': 0.2786, 'learning_rate': 7.3156086835092355e-06, 'epoch': 1.2} {'loss': 0.2216, 'learning_rate': 7.315285038876162e-06, 'epoch': 1.2} {'loss': 0.3124, 'learning_rate': 7.314961397273625e-06, 'epoch': 1.2} {'loss': 0.3505, 'learning_rate': 7.31463775870199e-06, 'epoch': 1.2} {'loss': 0.3424, 'learning_rate': 7.314314123161614e-06, 'epoch': 1.2} {'loss': 0.3219, 'learning_rate': 7.313990490652869e-06, 'epoch': 1.2} {'loss': 0.3566, 'learning_rate': 7.313666861176117e-06, 'epoch': 1.2} {'loss': 0.3454, 'learning_rate': 7.313343234731724e-06, 'epoch': 1.2} {'loss': 0.3418, 'learning_rate': 7.313019611320055e-06, 'epoch': 1.2} {'loss': 0.4149, 'learning_rate': 7.312695990941477e-06, 'epoch': 1.2} {'loss': 0.3505, 'learning_rate': 7.312372373596353e-06, 'epoch': 1.2} {'loss': 0.381, 'learning_rate': 7.312048759285051e-06, 'epoch': 1.2} {'loss': 0.2216, 'learning_rate': 7.311725148007933e-06, 'epoch': 1.2} {'loss': 0.384, 'learning_rate': 7.3114015397653686e-06, 'epoch': 1.2} {'loss': 0.2689, 'learning_rate': 7.311077934557718e-06, 'epoch': 1.2} {'loss': 0.229, 'learning_rate': 7.31075433238535e-06, 'epoch': 1.2} {'loss': 0.2959, 'learning_rate': 7.31043073324863e-06, 'epoch': 1.2} {'loss': 0.3447, 'learning_rate': 7.310107137147924e-06, 'epoch': 1.2} {'loss': 0.3321, 'learning_rate': 7.3097835440835915e-06, 'epoch': 1.2} {'loss': 0.467, 'learning_rate': 7.309459954056004e-06, 'epoch': 1.2} {'loss': 0.3967, 'learning_rate': 7.3091363670655234e-06, 'epoch': 1.2} {'loss': 0.3591, 'learning_rate': 7.308812783112517e-06, 'epoch': 1.2} {'loss': 0.2276, 'learning_rate': 7.3084892021973485e-06, 'epoch': 1.2} {'loss': 0.3061, 'learning_rate': 7.308165624320385e-06, 'epoch': 1.2} {'loss': 0.2867, 'learning_rate': 7.307842049481989e-06, 'epoch': 1.2} {'loss': 0.2653, 'learning_rate': 7.307518477682529e-06, 'epoch': 1.2} {'loss': 0.3221, 'learning_rate': 7.307194908922368e-06, 'epoch': 1.2} {'loss': 0.187, 'learning_rate': 7.306871343201871e-06, 'epoch': 1.2} {'loss': 0.2673, 'learning_rate': 7.306547780521405e-06, 'epoch': 1.2} {'loss': 0.2637, 'learning_rate': 7.306224220881335e-06, 'epoch': 1.2} {'loss': 0.3641, 'learning_rate': 7.305900664282026e-06, 'epoch': 1.2} {'loss': 0.2848, 'learning_rate': 7.305577110723842e-06, 'epoch': 1.2} {'loss': 0.2771, 'learning_rate': 7.305253560207148e-06, 'epoch': 1.2} {'loss': 0.4568, 'learning_rate': 7.304930012732312e-06, 'epoch': 1.2} {'loss': 0.3092, 'learning_rate': 7.304606468299697e-06, 'epoch': 1.2} {'loss': 0.3704, 'learning_rate': 7.304282926909668e-06, 'epoch': 1.2} {'loss': 0.2862, 'learning_rate': 7.303959388562591e-06, 'epoch': 1.2} {'loss': 0.2427, 'learning_rate': 7.303635853258832e-06, 'epoch': 1.2} {'loss': 0.3713, 'learning_rate': 7.303312320998754e-06, 'epoch': 1.2} {'loss': 0.3547, 'learning_rate': 7.302988791782726e-06, 'epoch': 1.2} {'loss': 0.2641, 'learning_rate': 7.302665265611109e-06, 'epoch': 1.2} {'loss': 0.2377, 'learning_rate': 7.3023417424842694e-06, 'epoch': 1.2} {'loss': 0.4677, 'learning_rate': 7.3020182224025735e-06, 'epoch': 1.2} {'loss': 0.4051, 'learning_rate': 7.301694705366389e-06, 'epoch': 1.2} {'loss': 0.2729, 'learning_rate': 7.301371191376075e-06, 'epoch': 1.2} {'loss': 0.3084, 'learning_rate': 7.301047680432001e-06, 'epoch': 1.2} {'loss': 0.3107, 'learning_rate': 7.30072417253453e-06, 'epoch': 1.2} {'loss': 0.355, 'learning_rate': 7.300400667684029e-06, 'epoch': 1.2} {'loss': 0.3079, 'learning_rate': 7.300077165880861e-06, 'epoch': 1.2} {'loss': 0.2716, 'learning_rate': 7.299753667125394e-06, 'epoch': 1.2} {'loss': 0.4691, 'learning_rate': 7.299430171417989e-06, 'epoch': 1.2} {'loss': 0.2028, 'learning_rate': 7.299106678759016e-06, 'epoch': 1.2} {'loss': 0.3819, 'learning_rate': 7.298783189148837e-06, 'epoch': 1.2} {'loss': 0.385, 'learning_rate': 7.298459702587819e-06, 'epoch': 1.2} {'loss': 0.3661, 'learning_rate': 7.298136219076326e-06, 'epoch': 1.2} {'loss': 0.3147, 'learning_rate': 7.297812738614722e-06, 'epoch': 1.2} {'loss': 0.3278, 'learning_rate': 7.297489261203378e-06, 'epoch': 1.2} {'loss': 0.3886, 'learning_rate': 7.297165786842651e-06, 'epoch': 1.2} {'loss': 0.4033, 'learning_rate': 7.29684231553291e-06, 'epoch': 1.2} {'loss': 0.3901, 'learning_rate': 7.296518847274521e-06, 'epoch': 1.2} {'loss': 0.2114, 'learning_rate': 7.2961953820678474e-06, 'epoch': 1.2} {'loss': 0.4237, 'learning_rate': 7.295871919913256e-06, 'epoch': 1.2} {'loss': 0.3202, 'learning_rate': 7.295548460811109e-06, 'epoch': 1.2} {'loss': 0.3664, 'learning_rate': 7.2952250047617745e-06, 'epoch': 1.2} {'loss': 0.3442, 'learning_rate': 7.294901551765617e-06, 'epoch': 1.2} {'loss': 0.4036, 'learning_rate': 7.2945781018230014e-06, 'epoch': 1.2} {'loss': 0.4079, 'learning_rate': 7.2942546549342916e-06, 'epoch': 1.2} {'loss': 0.2489, 'learning_rate': 7.2939312110998554e-06, 'epoch': 1.2} {'loss': 0.3124, 'learning_rate': 7.293607770320055e-06, 'epoch': 1.2} {'loss': 0.3476, 'learning_rate': 7.293284332595259e-06, 'epoch': 1.2} {'loss': 0.4846, 'learning_rate': 7.292960897925829e-06, 'epoch': 1.2} {'loss': 0.2035, 'learning_rate': 7.29263746631213e-06, 'epoch': 1.2} {'loss': 0.3109, 'learning_rate': 7.292314037754529e-06, 'epoch': 1.2} {'loss': 0.3413, 'learning_rate': 7.291990612253391e-06, 'epoch': 1.2} {'loss': 0.2816, 'learning_rate': 7.291667189809081e-06, 'epoch': 1.2} {'loss': 0.2633, 'learning_rate': 7.291343770421964e-06, 'epoch': 1.2} {'loss': 0.3845, 'learning_rate': 7.291020354092403e-06, 'epoch': 1.2} {'loss': 0.4173, 'learning_rate': 7.290696940820766e-06, 'epoch': 1.2} {'loss': 0.33, 'learning_rate': 7.2903735306074175e-06, 'epoch': 1.2} {'loss': 0.2909, 'learning_rate': 7.290050123452721e-06, 'epoch': 1.2} {'loss': 0.3998, 'learning_rate': 7.289726719357042e-06, 'epoch': 1.2} {'loss': 0.3481, 'learning_rate': 7.289403318320748e-06, 'epoch': 1.2} {'loss': 0.3715, 'learning_rate': 7.289079920344203e-06, 'epoch': 1.2} {'loss': 0.3396, 'learning_rate': 7.28875652542777e-06, 'epoch': 1.2} {'loss': 0.3832, 'learning_rate': 7.288433133571815e-06, 'epoch': 1.2} {'loss': 0.4042, 'learning_rate': 7.288109744776703e-06, 'epoch': 1.2} {'loss': 0.229, 'learning_rate': 7.287786359042799e-06, 'epoch': 1.2} {'loss': 0.4032, 'learning_rate': 7.28746297637047e-06, 'epoch': 1.2} {'loss': 0.3652, 'learning_rate': 7.2871395967600775e-06, 'epoch': 1.2} {'loss': 0.4035, 'learning_rate': 7.2868162202119906e-06, 'epoch': 1.2} {'loss': 0.2492, 'learning_rate': 7.2864928467265714e-06, 'epoch': 1.2} {'loss': 0.3031, 'learning_rate': 7.286169476304186e-06, 'epoch': 1.2} {'loss': 0.3516, 'learning_rate': 7.285846108945198e-06, 'epoch': 1.2} {'loss': 0.4199, 'learning_rate': 7.285522744649975e-06, 'epoch': 1.2} {'loss': 0.4693, 'learning_rate': 7.285199383418879e-06, 'epoch': 1.2} {'loss': 0.315, 'learning_rate': 7.284876025252281e-06, 'epoch': 1.2} {'loss': 0.2787, 'learning_rate': 7.284552670150537e-06, 'epoch': 1.2} {'loss': 0.5015, 'learning_rate': 7.28422931811402e-06, 'epoch': 1.2} {'loss': 0.3854, 'learning_rate': 7.283905969143089e-06, 'epoch': 1.2} {'loss': 0.3454, 'learning_rate': 7.283582623238112e-06, 'epoch': 1.2} {'loss': 0.4102, 'learning_rate': 7.283259280399455e-06, 'epoch': 1.2} {'loss': 0.3839, 'learning_rate': 7.282935940627476e-06, 'epoch': 1.2} {'loss': 0.3349, 'learning_rate': 7.282612603922551e-06, 'epoch': 1.2} {'loss': 0.3808, 'learning_rate': 7.282289270285041e-06, 'epoch': 1.2} {'loss': 0.4606, 'learning_rate': 7.281965939715308e-06, 'epoch': 1.2} {'loss': 0.3627, 'learning_rate': 7.281642612213717e-06, 'epoch': 1.2} {'loss': 0.3657, 'learning_rate': 7.281319287780637e-06, 'epoch': 1.2} {'loss': 0.375, 'learning_rate': 7.280995966416429e-06, 'epoch': 1.2} {'loss': 0.3081, 'learning_rate': 7.280672648121461e-06, 'epoch': 1.2} {'loss': 0.5006, 'learning_rate': 7.280349332896095e-06, 'epoch': 1.2} {'loss': 0.3163, 'learning_rate': 7.280026020740698e-06, 'epoch': 1.2} {'loss': 0.3851, 'learning_rate': 7.279702711655634e-06, 'epoch': 1.2} {'loss': 0.3438, 'learning_rate': 7.279379405641268e-06, 'epoch': 1.2} {'loss': 0.3411, 'learning_rate': 7.279056102697966e-06, 'epoch': 1.2} {'loss': 0.292, 'learning_rate': 7.278732802826091e-06, 'epoch': 1.2} {'loss': 0.2181, 'learning_rate': 7.2784095060260116e-06, 'epoch': 1.2} {'loss': 0.3124, 'learning_rate': 7.2780862122980914e-06, 'epoch': 1.2} {'loss': 0.316, 'learning_rate': 7.277762921642692e-06, 'epoch': 1.2} {'loss': 0.2531, 'learning_rate': 7.27743963406018e-06, 'epoch': 1.2} {'loss': 0.2185, 'learning_rate': 7.277116349550921e-06, 'epoch': 1.2} {'loss': 0.2676, 'learning_rate': 7.276793068115281e-06, 'epoch': 1.2} {'loss': 0.2274, 'learning_rate': 7.276469789753623e-06, 'epoch': 1.2} {'loss': 0.3233, 'learning_rate': 7.276146514466313e-06, 'epoch': 1.2} {'loss': 0.364, 'learning_rate': 7.275823242253715e-06, 'epoch': 1.2} {'loss': 0.3438, 'learning_rate': 7.275499973116196e-06, 'epoch': 1.2} {'loss': 0.373, 'learning_rate': 7.275176707054118e-06, 'epoch': 1.2} {'loss': 0.4648, 'learning_rate': 7.274853444067848e-06, 'epoch': 1.2} {'loss': 0.224, 'learning_rate': 7.2745301841577495e-06, 'epoch': 1.2} {'loss': 0.274, 'learning_rate': 7.274206927324189e-06, 'epoch': 1.2} {'loss': 0.2204, 'learning_rate': 7.273883673567532e-06, 'epoch': 1.2} {'loss': 0.2994, 'learning_rate': 7.273560422888139e-06, 'epoch': 1.2} {'loss': 0.2777, 'learning_rate': 7.273237175286381e-06, 'epoch': 1.2} {'loss': 0.175, 'learning_rate': 7.272913930762617e-06, 'epoch': 1.2} {'loss': 0.2716, 'learning_rate': 7.272590689317215e-06, 'epoch': 1.2} {'loss': 0.2729, 'learning_rate': 7.27226745095054e-06, 'epoch': 1.2} {'loss': 0.3238, 'learning_rate': 7.271944215662956e-06, 'epoch': 1.2} {'loss': 0.2938, 'learning_rate': 7.271620983454828e-06, 'epoch': 1.2} {'loss': 0.2501, 'learning_rate': 7.271297754326522e-06, 'epoch': 1.2} {'loss': 0.2474, 'learning_rate': 7.2709745282784005e-06, 'epoch': 1.2} {'loss': 0.4894, 'learning_rate': 7.270651305310832e-06, 'epoch': 1.2} {'loss': 0.2903, 'learning_rate': 7.270328085424176e-06, 'epoch': 1.2} {'loss': 0.35, 'learning_rate': 7.270004868618803e-06, 'epoch': 1.2} {'loss': 0.2452, 'learning_rate': 7.269681654895078e-06, 'epoch': 1.2} {'loss': 0.2201, 'learning_rate': 7.269358444253359e-06, 'epoch': 1.2} {'loss': 0.4254, 'learning_rate': 7.269035236694015e-06, 'epoch': 1.2} {'loss': 0.2214, 'learning_rate': 7.268712032217413e-06, 'epoch': 1.2} {'loss': 0.356, 'learning_rate': 7.268388830823915e-06, 'epoch': 1.2} {'loss': 0.382, 'learning_rate': 7.268065632513885e-06, 'epoch': 1.2} {'loss': 0.2843, 'learning_rate': 7.267742437287692e-06, 'epoch': 1.2} {'loss': 0.1071, 'learning_rate': 7.267419245145697e-06, 'epoch': 1.2} {'loss': 0.2821, 'learning_rate': 7.2670960560882654e-06, 'epoch': 1.2} {'loss': 0.4794, 'learning_rate': 7.266772870115764e-06, 'epoch': 1.2} {'loss': 0.4171, 'learning_rate': 7.266449687228554e-06, 'epoch': 1.2} {'loss': 0.1476, 'learning_rate': 7.266126507427005e-06, 'epoch': 1.2} {'loss': 0.5298, 'learning_rate': 7.265803330711477e-06, 'epoch': 1.2} {'loss': 0.232, 'learning_rate': 7.265480157082341e-06, 'epoch': 1.2} {'loss': 0.3634, 'learning_rate': 7.2651569865399555e-06, 'epoch': 1.2} {'loss': 0.3696, 'learning_rate': 7.264833819084687e-06, 'epoch': 1.2} {'loss': 0.3075, 'learning_rate': 7.264510654716901e-06, 'epoch': 1.2} {'loss': 0.535, 'learning_rate': 7.264187493436962e-06, 'epoch': 1.2} {'loss': 0.3486, 'learning_rate': 7.263864335245236e-06, 'epoch': 1.2} {'loss': 0.3725, 'learning_rate': 7.263541180142089e-06, 'epoch': 1.2} {'loss': 0.3744, 'learning_rate': 7.263218028127881e-06, 'epoch': 1.2} {'loss': 0.3352, 'learning_rate': 7.26289487920298e-06, 'epoch': 1.2} {'loss': 0.3129, 'learning_rate': 7.262571733367749e-06, 'epoch': 1.2} {'loss': 0.2648, 'learning_rate': 7.262248590622555e-06, 'epoch': 1.2} {'loss': 0.2968, 'learning_rate': 7.261925450967762e-06, 'epoch': 1.2} {'loss': 0.282, 'learning_rate': 7.261602314403733e-06, 'epoch': 1.2} {'loss': 0.3066, 'learning_rate': 7.261279180930838e-06, 'epoch': 1.2} {'loss': 0.1904, 'learning_rate': 7.260956050549435e-06, 'epoch': 1.2} {'loss': 0.5769, 'learning_rate': 7.260632923259892e-06, 'epoch': 1.2} {'loss': 0.2221, 'learning_rate': 7.260309799062575e-06, 'epoch': 1.2} {'loss': 0.3523, 'learning_rate': 7.259986677957845e-06, 'epoch': 1.2} {'loss': 0.3712, 'learning_rate': 7.25966355994607e-06, 'epoch': 1.2} {'loss': 0.326, 'learning_rate': 7.259340445027614e-06, 'epoch': 1.2} {'loss': 0.3443, 'learning_rate': 7.259017333202841e-06, 'epoch': 1.2} {'loss': 0.3155, 'learning_rate': 7.258694224472116e-06, 'epoch': 1.2} {'loss': 0.2287, 'learning_rate': 7.258371118835805e-06, 'epoch': 1.2} {'loss': 0.2051, 'learning_rate': 7.2580480162942714e-06, 'epoch': 1.2} {'loss': 0.2462, 'learning_rate': 7.257724916847879e-06, 'epoch': 1.2} {'loss': 0.3308, 'learning_rate': 7.2574018204969945e-06, 'epoch': 1.2} {'loss': 0.4007, 'learning_rate': 7.257078727241982e-06, 'epoch': 1.2} {'loss': 0.3086, 'learning_rate': 7.256755637083208e-06, 'epoch': 1.2} {'loss': 0.3782, 'learning_rate': 7.256432550021033e-06, 'epoch': 1.2} {'loss': 0.401, 'learning_rate': 7.256109466055824e-06, 'epoch': 1.2} {'loss': 0.327, 'learning_rate': 7.2557863851879466e-06, 'epoch': 1.2} {'loss': 0.4152, 'learning_rate': 7.255463307417763e-06, 'epoch': 1.2} {'loss': 0.383, 'learning_rate': 7.25514023274564e-06, 'epoch': 1.2} {'loss': 0.3696, 'learning_rate': 7.254817161171941e-06, 'epoch': 1.2} {'loss': 0.3215, 'learning_rate': 7.2544940926970335e-06, 'epoch': 1.2} {'loss': 0.502, 'learning_rate': 7.254171027321277e-06, 'epoch': 1.2} {'loss': 0.3016, 'learning_rate': 7.253847965045042e-06, 'epoch': 1.2} {'loss': 0.2888, 'learning_rate': 7.25352490586869e-06, 'epoch': 1.2} {'loss': 0.4096, 'learning_rate': 7.2532018497925845e-06, 'epoch': 1.2} {'loss': 0.2779, 'learning_rate': 7.252878796817093e-06, 'epoch': 1.2} {'loss': 0.3606, 'learning_rate': 7.252555746942581e-06, 'epoch': 1.2} {'loss': 0.4606, 'learning_rate': 7.2522327001694085e-06, 'epoch': 1.2} {'loss': 0.4249, 'learning_rate': 7.251909656497944e-06, 'epoch': 1.2} {'loss': 0.3161, 'learning_rate': 7.25158661592855e-06, 'epoch': 1.2} {'loss': 0.3412, 'learning_rate': 7.251263578461592e-06, 'epoch': 1.2} {'loss': 0.4236, 'learning_rate': 7.25094054409743e-06, 'epoch': 1.2} {'loss': 0.1904, 'learning_rate': 7.250617512836439e-06, 'epoch': 1.2} {'loss': 0.3022, 'learning_rate': 7.250294484678979e-06, 'epoch': 1.2} {'loss': 0.3169, 'learning_rate': 7.249971459625411e-06, 'epoch': 1.2} {'loss': 0.3526, 'learning_rate': 7.2496484376761045e-06, 'epoch': 1.2} {'loss': 0.2611, 'learning_rate': 7.24932541883142e-06, 'epoch': 1.2} {'loss': 0.3794, 'learning_rate': 7.249002403091725e-06, 'epoch': 1.2} {'loss': 0.3918, 'learning_rate': 7.248679390457382e-06, 'epoch': 1.2} {'loss': 0.28, 'learning_rate': 7.248356380928759e-06, 'epoch': 1.2} {'loss': 0.2854, 'learning_rate': 7.248033374506216e-06, 'epoch': 1.2} {'loss': 0.2988, 'learning_rate': 7.2477103711901205e-06, 'epoch': 1.2} {'loss': 0.4344, 'learning_rate': 7.247387370980837e-06, 'epoch': 1.2} {'loss': 0.3529, 'learning_rate': 7.2470643738787305e-06, 'epoch': 1.2} {'loss': 0.3674, 'learning_rate': 7.246741379884163e-06, 'epoch': 1.2} {'loss': 0.3673, 'learning_rate': 7.246418388997502e-06, 'epoch': 1.2} {'loss': 0.2956, 'learning_rate': 7.246095401219114e-06, 'epoch': 1.2} {'loss': 0.4057, 'learning_rate': 7.2457724165493585e-06, 'epoch': 1.2} {'loss': 0.2245, 'learning_rate': 7.245449434988601e-06, 'epoch': 1.2} {'loss': 0.3188, 'learning_rate': 7.245126456537208e-06, 'epoch': 1.2} {'loss': 0.2683, 'learning_rate': 7.2448034811955425e-06, 'epoch': 1.2} {'loss': 0.3516, 'learning_rate': 7.244480508963972e-06, 'epoch': 1.2} {'loss': 0.397, 'learning_rate': 7.244157539842856e-06, 'epoch': 1.2} {'loss': 0.3726, 'learning_rate': 7.243834573832565e-06, 'epoch': 1.2} {'loss': 0.504, 'learning_rate': 7.243511610933458e-06, 'epoch': 1.2} {'loss': 0.3119, 'learning_rate': 7.243188651145904e-06, 'epoch': 1.2} {'loss': 0.3633, 'learning_rate': 7.242865694470265e-06, 'epoch': 1.2} {'loss': 0.3701, 'learning_rate': 7.242542740906906e-06, 'epoch': 1.2} {'loss': 0.3967, 'learning_rate': 7.242219790456193e-06, 'epoch': 1.2} {'loss': 0.2368, 'learning_rate': 7.241896843118491e-06, 'epoch': 1.2} {'loss': 0.2176, 'learning_rate': 7.241573898894161e-06, 'epoch': 1.2} {'loss': 0.48, 'learning_rate': 7.24125095778357e-06, 'epoch': 1.2} {'loss': 0.3015, 'learning_rate': 7.240928019787081e-06, 'epoch': 1.2} {'loss': 0.2865, 'learning_rate': 7.24060508490506e-06, 'epoch': 1.2} {'loss': 0.386, 'learning_rate': 7.240282153137872e-06, 'epoch': 1.2} {'loss': 0.2765, 'learning_rate': 7.23995922448588e-06, 'epoch': 1.2} {'loss': 0.5082, 'learning_rate': 7.239636298949449e-06, 'epoch': 1.2} {'loss': 0.5113, 'learning_rate': 7.239313376528942e-06, 'epoch': 1.2} {'loss': 0.5348, 'learning_rate': 7.238990457224728e-06, 'epoch': 1.2} {'loss': 0.327, 'learning_rate': 7.2386675410371675e-06, 'epoch': 1.2} {'loss': 0.2684, 'learning_rate': 7.238344627966627e-06, 'epoch': 1.2} {'loss': 0.3526, 'learning_rate': 7.2380217180134706e-06, 'epoch': 1.2} {'loss': 0.2879, 'learning_rate': 7.237698811178061e-06, 'epoch': 1.2} {'loss': 0.2459, 'learning_rate': 7.237375907460767e-06, 'epoch': 1.2} {'loss': 0.2454, 'learning_rate': 7.237053006861948e-06, 'epoch': 1.2} {'loss': 0.3025, 'learning_rate': 7.236730109381971e-06, 'epoch': 1.2} {'loss': 0.2074, 'learning_rate': 7.2364072150212e-06, 'epoch': 1.2} {'loss': 0.3013, 'learning_rate': 7.23608432378e-06, 'epoch': 1.2} {'loss': 0.37, 'learning_rate': 7.235761435658734e-06, 'epoch': 1.2} {'loss': 0.332, 'learning_rate': 7.23543855065777e-06, 'epoch': 1.2} {'loss': 0.4471, 'learning_rate': 7.235115668777468e-06, 'epoch': 1.2} {'loss': 0.3201, 'learning_rate': 7.234792790018197e-06, 'epoch': 1.2} {'loss': 0.3504, 'learning_rate': 7.234469914380318e-06, 'epoch': 1.2} {'loss': 0.345, 'learning_rate': 7.2341470418641944e-06, 'epoch': 1.2} {'loss': 0.4312, 'learning_rate': 7.233824172470195e-06, 'epoch': 1.2} {'loss': 0.3487, 'learning_rate': 7.233501306198682e-06, 'epoch': 1.2} {'loss': 0.3054, 'learning_rate': 7.233178443050022e-06, 'epoch': 1.2} {'loss': 0.4109, 'learning_rate': 7.232855583024575e-06, 'epoch': 1.2} {'loss': 0.1555, 'learning_rate': 7.232532726122708e-06, 'epoch': 1.2} {'loss': 0.4093, 'learning_rate': 7.232209872344785e-06, 'epoch': 1.2} {'loss': 0.3265, 'learning_rate': 7.231887021691172e-06, 'epoch': 1.2} {'loss': 0.4121, 'learning_rate': 7.231564174162231e-06, 'epoch': 1.2} {'loss': 0.507, 'learning_rate': 7.231241329758327e-06, 'epoch': 1.2} {'loss': 0.3231, 'learning_rate': 7.230918488479827e-06, 'epoch': 1.2} {'loss': 0.2443, 'learning_rate': 7.230595650327093e-06, 'epoch': 1.2} {'loss': 0.3069, 'learning_rate': 7.230272815300488e-06, 'epoch': 1.2} {'loss': 0.3126, 'learning_rate': 7.2299499834003795e-06, 'epoch': 1.2} {'loss': 0.3527, 'learning_rate': 7.22962715462713e-06, 'epoch': 1.2} {'loss': 0.3455, 'learning_rate': 7.229304328981106e-06, 'epoch': 1.2} {'loss': 0.2614, 'learning_rate': 7.2289815064626725e-06, 'epoch': 1.2} {'loss': 0.3309, 'learning_rate': 7.228658687072189e-06, 'epoch': 1.2} {'loss': 0.3868, 'learning_rate': 7.228335870810024e-06, 'epoch': 1.2} {'loss': 0.2735, 'learning_rate': 7.228013057676539e-06, 'epoch': 1.2} {'loss': 0.4592, 'learning_rate': 7.227690247672101e-06, 'epoch': 1.2} {'loss': 0.2642, 'learning_rate': 7.2273674407970725e-06, 'epoch': 1.2} {'loss': 0.3582, 'learning_rate': 7.227044637051821e-06, 'epoch': 1.2} {'loss': 0.2364, 'learning_rate': 7.226721836436708e-06, 'epoch': 1.2} {'loss': 0.413, 'learning_rate': 7.226399038952099e-06, 'epoch': 1.2} {'loss': 0.2872, 'learning_rate': 7.226076244598357e-06, 'epoch': 1.2} {'loss': 0.3844, 'learning_rate': 7.225753453375848e-06, 'epoch': 1.2} {'loss': 0.3348, 'learning_rate': 7.225430665284936e-06, 'epoch': 1.2} {'loss': 0.3905, 'learning_rate': 7.225107880325985e-06, 'epoch': 1.2} {'loss': 0.4385, 'learning_rate': 7.2247850984993604e-06, 'epoch': 1.2} {'loss': 0.2874, 'learning_rate': 7.224462319805425e-06, 'epoch': 1.2} {'loss': 0.2837, 'learning_rate': 7.224139544244544e-06, 'epoch': 1.2} {'loss': 0.4005, 'learning_rate': 7.223816771817081e-06, 'epoch': 1.2} {'loss': 0.4563, 'learning_rate': 7.2234940025234016e-06, 'epoch': 1.2} {'loss': 0.3545, 'learning_rate': 7.223171236363869e-06, 'epoch': 1.2} {'loss': 0.377, 'learning_rate': 7.222848473338848e-06, 'epoch': 1.2} {'loss': 0.439, 'learning_rate': 7.222525713448703e-06, 'epoch': 1.2} {'loss': 0.241, 'learning_rate': 7.222202956693799e-06, 'epoch': 1.2} {'loss': 0.3125, 'learning_rate': 7.221880203074498e-06, 'epoch': 1.2} {'loss': 0.3023, 'learning_rate': 7.221557452591168e-06, 'epoch': 1.2} {'loss': 0.3799, 'learning_rate': 7.221234705244171e-06, 'epoch': 1.2} {'loss': 0.3584, 'learning_rate': 7.22091196103387e-06, 'epoch': 1.2} {'loss': 0.3004, 'learning_rate': 7.220589219960634e-06, 'epoch': 1.2} {'loss': 0.4104, 'learning_rate': 7.220266482024823e-06, 'epoch': 1.2} {'loss': 0.3223, 'learning_rate': 7.219943747226801e-06, 'epoch': 1.2} {'loss': 0.4164, 'learning_rate': 7.219621015566934e-06, 'epoch': 1.2} {'loss': 0.3001, 'learning_rate': 7.219298287045586e-06, 'epoch': 1.2} {'loss': 0.3186, 'learning_rate': 7.21897556166312e-06, 'epoch': 1.2} {'loss': 0.1833, 'learning_rate': 7.218652839419903e-06, 'epoch': 1.2} {'loss': 0.2732, 'learning_rate': 7.218330120316299e-06, 'epoch': 1.2} {'loss': 0.3668, 'learning_rate': 7.2180074043526735e-06, 'epoch': 1.2} {'loss': 0.2963, 'learning_rate': 7.2176846915293854e-06, 'epoch': 1.21} {'loss': 0.277, 'learning_rate': 7.217361981846804e-06, 'epoch': 1.21} {'loss': 0.3644, 'learning_rate': 7.217039275305291e-06, 'epoch': 1.21} {'loss': 0.3538, 'learning_rate': 7.216716571905211e-06, 'epoch': 1.21} {'loss': 0.428, 'learning_rate': 7.216393871646929e-06, 'epoch': 1.21} {'loss': 0.2932, 'learning_rate': 7.21607117453081e-06, 'epoch': 1.21} {'loss': 0.3831, 'learning_rate': 7.215748480557216e-06, 'epoch': 1.21} {'loss': 0.3355, 'learning_rate': 7.2154257897265135e-06, 'epoch': 1.21} {'loss': 0.3652, 'learning_rate': 7.215103102039065e-06, 'epoch': 1.21} {'loss': 0.3038, 'learning_rate': 7.214780417495235e-06, 'epoch': 1.21} {'loss': 0.3782, 'learning_rate': 7.214457736095388e-06, 'epoch': 1.21} {'loss': 0.4273, 'learning_rate': 7.2141350578398904e-06, 'epoch': 1.21} {'loss': 0.4224, 'learning_rate': 7.213812382729106e-06, 'epoch': 1.21} {'loss': 0.4345, 'learning_rate': 7.213489710763395e-06, 'epoch': 1.21} {'loss': 0.3285, 'learning_rate': 7.2131670419431255e-06, 'epoch': 1.21} {'loss': 0.3785, 'learning_rate': 7.212844376268658e-06, 'epoch': 1.21} {'loss': 0.2481, 'learning_rate': 7.212521713740361e-06, 'epoch': 1.21} {'loss': 0.2439, 'learning_rate': 7.212199054358598e-06, 'epoch': 1.21} {'loss': 0.5089, 'learning_rate': 7.211876398123729e-06, 'epoch': 1.21} {'loss': 0.4377, 'learning_rate': 7.211553745036124e-06, 'epoch': 1.21} {'loss': 0.2759, 'learning_rate': 7.211231095096143e-06, 'epoch': 1.21} {'loss': 0.3246, 'learning_rate': 7.210908448304153e-06, 'epoch': 1.21} {'loss': 0.3925, 'learning_rate': 7.210585804660516e-06, 'epoch': 1.21} {'loss': 0.3296, 'learning_rate': 7.210263164165598e-06, 'epoch': 1.21} {'loss': 0.3965, 'learning_rate': 7.209940526819762e-06, 'epoch': 1.21} {'loss': 0.2889, 'learning_rate': 7.209617892623375e-06, 'epoch': 1.21} {'loss': 0.3468, 'learning_rate': 7.209295261576797e-06, 'epoch': 1.21} {'loss': 0.4112, 'learning_rate': 7.208972633680392e-06, 'epoch': 1.21} {'loss': 0.3278, 'learning_rate': 7.208650008934528e-06, 'epoch': 1.21} {'loss': 0.2583, 'learning_rate': 7.208327387339567e-06, 'epoch': 1.21} {'loss': 0.4404, 'learning_rate': 7.2080047688958735e-06, 'epoch': 1.21} {'loss': 0.2739, 'learning_rate': 7.207682153603811e-06, 'epoch': 1.21} {'loss': 0.3287, 'learning_rate': 7.207359541463746e-06, 'epoch': 1.21} {'loss': 0.2152, 'learning_rate': 7.207036932476039e-06, 'epoch': 1.21} {'loss': 0.4163, 'learning_rate': 7.206714326641058e-06, 'epoch': 1.21} {'loss': 0.3221, 'learning_rate': 7.206391723959164e-06, 'epoch': 1.21} {'loss': 0.3398, 'learning_rate': 7.206069124430724e-06, 'epoch': 1.21} {'loss': 0.39, 'learning_rate': 7.205746528056099e-06, 'epoch': 1.21} {'loss': 0.325, 'learning_rate': 7.2054239348356584e-06, 'epoch': 1.21} {'loss': 0.3324, 'learning_rate': 7.205101344769759e-06, 'epoch': 1.21} {'loss': 0.4128, 'learning_rate': 7.204778757858769e-06, 'epoch': 1.21} {'loss': 0.2636, 'learning_rate': 7.204456174103054e-06, 'epoch': 1.21} {'loss': 0.4579, 'learning_rate': 7.2041335935029745e-06, 'epoch': 1.21} {'loss': 0.2836, 'learning_rate': 7.203811016058897e-06, 'epoch': 1.21} {'loss': 0.2137, 'learning_rate': 7.203488441771185e-06, 'epoch': 1.21} {'loss': 0.2826, 'learning_rate': 7.203165870640203e-06, 'epoch': 1.21} {'loss': 0.3365, 'learning_rate': 7.2028433026663156e-06, 'epoch': 1.21} {'loss': 0.5357, 'learning_rate': 7.202520737849885e-06, 'epoch': 1.21} {'loss': 0.3798, 'learning_rate': 7.202198176191277e-06, 'epoch': 1.21} {'loss': 0.3285, 'learning_rate': 7.201875617690857e-06, 'epoch': 1.21} {'loss': 0.417, 'learning_rate': 7.201553062348985e-06, 'epoch': 1.21} {'loss': 0.3007, 'learning_rate': 7.201230510166031e-06, 'epoch': 1.21} {'loss': 0.3001, 'learning_rate': 7.200907961142352e-06, 'epoch': 1.21} {'loss': 0.4319, 'learning_rate': 7.200585415278316e-06, 'epoch': 1.21} {'loss': 0.3589, 'learning_rate': 7.200262872574289e-06, 'epoch': 1.21} {'loss': 0.2863, 'learning_rate': 7.1999403330306295e-06, 'epoch': 1.21} {'loss': 0.3326, 'learning_rate': 7.199617796647707e-06, 'epoch': 1.21} {'loss': 0.1978, 'learning_rate': 7.199295263425883e-06, 'epoch': 1.21} {'loss': 0.3547, 'learning_rate': 7.198972733365521e-06, 'epoch': 1.21} {'loss': 0.2508, 'learning_rate': 7.198650206466987e-06, 'epoch': 1.21} {'loss': 0.3348, 'learning_rate': 7.198327682730645e-06, 'epoch': 1.21} {'loss': 0.3632, 'learning_rate': 7.198005162156857e-06, 'epoch': 1.21} {'loss': 0.3183, 'learning_rate': 7.197682644745989e-06, 'epoch': 1.21} {'loss': 0.4085, 'learning_rate': 7.197360130498404e-06, 'epoch': 1.21} {'loss': 0.3199, 'learning_rate': 7.1970376194144685e-06, 'epoch': 1.21} {'loss': 0.3812, 'learning_rate': 7.196715111494543e-06, 'epoch': 1.21} {'loss': 0.1868, 'learning_rate': 7.196392606738993e-06, 'epoch': 1.21} {'loss': 0.3251, 'learning_rate': 7.196070105148183e-06, 'epoch': 1.21} {'loss': 0.2489, 'learning_rate': 7.195747606722476e-06, 'epoch': 1.21} {'loss': 0.3903, 'learning_rate': 7.195425111462238e-06, 'epoch': 1.21} {'loss': 0.3643, 'learning_rate': 7.1951026193678285e-06, 'epoch': 1.21} {'loss': 0.2715, 'learning_rate': 7.194780130439618e-06, 'epoch': 1.21} {'loss': 0.3542, 'learning_rate': 7.194457644677966e-06, 'epoch': 1.21} {'loss': 0.4486, 'learning_rate': 7.194135162083238e-06, 'epoch': 1.21} {'loss': 0.3638, 'learning_rate': 7.193812682655797e-06, 'epoch': 1.21} {'loss': 0.4861, 'learning_rate': 7.19349020639601e-06, 'epoch': 1.21} {'loss': 0.4562, 'learning_rate': 7.193167733304237e-06, 'epoch': 1.21} {'loss': 0.2463, 'learning_rate': 7.192845263380847e-06, 'epoch': 1.21} {'loss': 0.3792, 'learning_rate': 7.192522796626198e-06, 'epoch': 1.21} {'loss': 0.2788, 'learning_rate': 7.192200333040657e-06, 'epoch': 1.21} {'loss': 0.244, 'learning_rate': 7.1918778726245884e-06, 'epoch': 1.21} {'loss': 0.3551, 'learning_rate': 7.191555415378355e-06, 'epoch': 1.21} {'loss': 0.2246, 'learning_rate': 7.191232961302322e-06, 'epoch': 1.21} {'loss': 0.2598, 'learning_rate': 7.190910510396852e-06, 'epoch': 1.21} {'loss': 0.308, 'learning_rate': 7.1905880626623115e-06, 'epoch': 1.21} {'loss': 0.3174, 'learning_rate': 7.190265618099061e-06, 'epoch': 1.21} {'loss': 0.2657, 'learning_rate': 7.189943176707468e-06, 'epoch': 1.21} {'loss': 0.3585, 'learning_rate': 7.189620738487895e-06, 'epoch': 1.21} {'loss': 0.1973, 'learning_rate': 7.189298303440704e-06, 'epoch': 1.21} {'loss': 0.382, 'learning_rate': 7.188975871566261e-06, 'epoch': 1.21} {'loss': 0.4367, 'learning_rate': 7.1886534428649305e-06, 'epoch': 1.21} {'loss': 0.2473, 'learning_rate': 7.188331017337078e-06, 'epoch': 1.21} {'loss': 0.2704, 'learning_rate': 7.188008594983062e-06, 'epoch': 1.21} {'loss': 0.4326, 'learning_rate': 7.18768617580325e-06, 'epoch': 1.21} {'loss': 0.2343, 'learning_rate': 7.187363759798006e-06, 'epoch': 1.21} {'loss': 0.3344, 'learning_rate': 7.1870413469676935e-06, 'epoch': 1.21} {'loss': 0.3035, 'learning_rate': 7.186718937312671e-06, 'epoch': 1.21} {'loss': 0.4221, 'learning_rate': 7.186396530833313e-06, 'epoch': 1.21} {'loss': 0.3602, 'learning_rate': 7.1860741275299804e-06, 'epoch': 1.21} {'loss': 0.2708, 'learning_rate': 7.185751727403033e-06, 'epoch': 1.21} {'loss': 0.2276, 'learning_rate': 7.185429330452837e-06, 'epoch': 1.21} {'loss': 0.3058, 'learning_rate': 7.185106936679756e-06, 'epoch': 1.21} {'loss': 0.3346, 'learning_rate': 7.1847845460841534e-06, 'epoch': 1.21} {'loss': 0.4472, 'learning_rate': 7.184462158666394e-06, 'epoch': 1.21} {'loss': 0.4174, 'learning_rate': 7.184139774426841e-06, 'epoch': 1.21} {'loss': 0.4308, 'learning_rate': 7.183817393365859e-06, 'epoch': 1.21} {'loss': 0.3351, 'learning_rate': 7.183495015483813e-06, 'epoch': 1.21} {'loss': 0.3819, 'learning_rate': 7.183172640781062e-06, 'epoch': 1.21} {'loss': 0.3069, 'learning_rate': 7.182850269257977e-06, 'epoch': 1.21} {'loss': 0.3054, 'learning_rate': 7.182527900914916e-06, 'epoch': 1.21} {'loss': 0.3835, 'learning_rate': 7.182205535752247e-06, 'epoch': 1.21} {'loss': 0.2452, 'learning_rate': 7.181883173770333e-06, 'epoch': 1.21} {'loss': 0.3892, 'learning_rate': 7.181560814969536e-06, 'epoch': 1.21} {'loss': 0.4646, 'learning_rate': 7.181238459350219e-06, 'epoch': 1.21} {'loss': 0.2737, 'learning_rate': 7.18091610691275e-06, 'epoch': 1.21} {'loss': 0.2655, 'learning_rate': 7.18059375765749e-06, 'epoch': 1.21} {'loss': 0.354, 'learning_rate': 7.180271411584803e-06, 'epoch': 1.21} {'loss': 0.2853, 'learning_rate': 7.179949068695053e-06, 'epoch': 1.21} {'loss': 0.3816, 'learning_rate': 7.1796267289886046e-06, 'epoch': 1.21} {'loss': 0.3682, 'learning_rate': 7.179304392465822e-06, 'epoch': 1.21} {'loss': 0.3336, 'learning_rate': 7.178982059127069e-06, 'epoch': 1.21} {'loss': 0.3846, 'learning_rate': 7.178659728972706e-06, 'epoch': 1.21} {'loss': 0.4926, 'learning_rate': 7.178337402003101e-06, 'epoch': 1.21} {'loss': 0.2926, 'learning_rate': 7.178015078218619e-06, 'epoch': 1.21} {'loss': 0.2443, 'learning_rate': 7.177692757619621e-06, 'epoch': 1.21} {'loss': 0.3916, 'learning_rate': 7.177370440206468e-06, 'epoch': 1.21} {'loss': 0.3617, 'learning_rate': 7.1770481259795284e-06, 'epoch': 1.21} {'loss': 0.3408, 'learning_rate': 7.176725814939165e-06, 'epoch': 1.21} {'loss': 0.2901, 'learning_rate': 7.1764035070857415e-06, 'epoch': 1.21} {'loss': 0.4548, 'learning_rate': 7.176081202419621e-06, 'epoch': 1.21} {'loss': 0.206, 'learning_rate': 7.1757589009411675e-06, 'epoch': 1.21} {'loss': 0.2773, 'learning_rate': 7.175436602650746e-06, 'epoch': 1.21} {'loss': 0.3578, 'learning_rate': 7.1751143075487186e-06, 'epoch': 1.21} {'loss': 0.3362, 'learning_rate': 7.17479201563545e-06, 'epoch': 1.21} {'loss': 0.2478, 'learning_rate': 7.174469726911305e-06, 'epoch': 1.21} {'loss': 0.269, 'learning_rate': 7.174147441376645e-06, 'epoch': 1.21} {'loss': 0.4065, 'learning_rate': 7.173825159031837e-06, 'epoch': 1.21} {'loss': 0.2374, 'learning_rate': 7.173502879877243e-06, 'epoch': 1.21} {'loss': 0.1866, 'learning_rate': 7.1731806039132254e-06, 'epoch': 1.21} {'loss': 0.3407, 'learning_rate': 7.17285833114015e-06, 'epoch': 1.21} {'loss': 0.3785, 'learning_rate': 7.172536061558379e-06, 'epoch': 1.21} {'loss': 0.4409, 'learning_rate': 7.172213795168278e-06, 'epoch': 1.21} {'loss': 0.4107, 'learning_rate': 7.17189153197021e-06, 'epoch': 1.21} {'loss': 0.3636, 'learning_rate': 7.171569271964538e-06, 'epoch': 1.21} {'loss': 0.2647, 'learning_rate': 7.171247015151626e-06, 'epoch': 1.21} {'loss': 0.3044, 'learning_rate': 7.170924761531839e-06, 'epoch': 1.21} {'loss': 0.3487, 'learning_rate': 7.17060251110554e-06, 'epoch': 1.21} {'loss': 0.2536, 'learning_rate': 7.170280263873093e-06, 'epoch': 1.21} {'loss': 0.3494, 'learning_rate': 7.1699580198348605e-06, 'epoch': 1.21} {'loss': 0.1927, 'learning_rate': 7.169635778991207e-06, 'epoch': 1.21} {'loss': 0.4504, 'learning_rate': 7.169313541342498e-06, 'epoch': 1.21} {'loss': 0.2908, 'learning_rate': 7.168991306889097e-06, 'epoch': 1.21} {'loss': 0.3599, 'learning_rate': 7.168669075631365e-06, 'epoch': 1.21} {'loss': 0.5125, 'learning_rate': 7.168346847569666e-06, 'epoch': 1.21} {'loss': 0.3207, 'learning_rate': 7.168024622704366e-06, 'epoch': 1.21} {'loss': 0.3063, 'learning_rate': 7.1677024010358275e-06, 'epoch': 1.21} {'loss': 0.4678, 'learning_rate': 7.167380182564414e-06, 'epoch': 1.21} {'loss': 0.4285, 'learning_rate': 7.167057967290489e-06, 'epoch': 1.21} {'loss': 0.4694, 'learning_rate': 7.166735755214418e-06, 'epoch': 1.21} {'loss': 0.3519, 'learning_rate': 7.166413546336564e-06, 'epoch': 1.21} {'loss': 0.4203, 'learning_rate': 7.1660913406572885e-06, 'epoch': 1.21} {'loss': 0.2656, 'learning_rate': 7.165769138176959e-06, 'epoch': 1.21} {'loss': 0.2564, 'learning_rate': 7.1654469388959345e-06, 'epoch': 1.21} {'loss': 0.2836, 'learning_rate': 7.165124742814584e-06, 'epoch': 1.21} {'loss': 0.4564, 'learning_rate': 7.16480254993327e-06, 'epoch': 1.21} {'loss': 0.36, 'learning_rate': 7.164480360252353e-06, 'epoch': 1.21} {'loss': 0.472, 'learning_rate': 7.164158173772197e-06, 'epoch': 1.21} {'loss': 0.1963, 'learning_rate': 7.163835990493169e-06, 'epoch': 1.21} {'loss': 0.3391, 'learning_rate': 7.163513810415629e-06, 'epoch': 1.21} {'loss': 0.2286, 'learning_rate': 7.163191633539943e-06, 'epoch': 1.21} {'loss': 0.2621, 'learning_rate': 7.162869459866475e-06, 'epoch': 1.21} {'loss': 0.4301, 'learning_rate': 7.162547289395587e-06, 'epoch': 1.21} {'loss': 0.2177, 'learning_rate': 7.162225122127644e-06, 'epoch': 1.21} {'loss': 0.2675, 'learning_rate': 7.16190295806301e-06, 'epoch': 1.21} {'loss': 0.3283, 'learning_rate': 7.161580797202047e-06, 'epoch': 1.21} {'loss': 0.2545, 'learning_rate': 7.161258639545119e-06, 'epoch': 1.21} {'loss': 0.2716, 'learning_rate': 7.160936485092591e-06, 'epoch': 1.21} {'loss': 0.282, 'learning_rate': 7.160614333844829e-06, 'epoch': 1.21} {'loss': 0.2018, 'learning_rate': 7.160292185802189e-06, 'epoch': 1.21} {'loss': 0.3025, 'learning_rate': 7.1599700409650405e-06, 'epoch': 1.21} {'loss': 0.3383, 'learning_rate': 7.159647899333746e-06, 'epoch': 1.21} {'loss': 0.2952, 'learning_rate': 7.159325760908669e-06, 'epoch': 1.21} {'loss': 0.2709, 'learning_rate': 7.15900362569017e-06, 'epoch': 1.21} {'loss': 0.4328, 'learning_rate': 7.158681493678619e-06, 'epoch': 1.21} {'loss': 0.2983, 'learning_rate': 7.158359364874376e-06, 'epoch': 1.21} {'loss': 0.2552, 'learning_rate': 7.158037239277804e-06, 'epoch': 1.21} {'loss': 0.4057, 'learning_rate': 7.157715116889268e-06, 'epoch': 1.21} {'loss': 0.4713, 'learning_rate': 7.157392997709132e-06, 'epoch': 1.21} {'loss': 0.4163, 'learning_rate': 7.157070881737757e-06, 'epoch': 1.21} {'loss': 0.2901, 'learning_rate': 7.15674876897551e-06, 'epoch': 1.21} {'loss': 0.4183, 'learning_rate': 7.156426659422754e-06, 'epoch': 1.21} {'loss': 0.3335, 'learning_rate': 7.15610455307985e-06, 'epoch': 1.21} {'loss': 0.375, 'learning_rate': 7.155782449947162e-06, 'epoch': 1.21} {'loss': 0.5042, 'learning_rate': 7.155460350025056e-06, 'epoch': 1.21} {'loss': 0.3715, 'learning_rate': 7.1551382533138935e-06, 'epoch': 1.21} {'loss': 0.3873, 'learning_rate': 7.1548161598140355e-06, 'epoch': 1.21} {'loss': 0.3267, 'learning_rate': 7.154494069525853e-06, 'epoch': 1.21} {'loss': 0.2976, 'learning_rate': 7.154171982449707e-06, 'epoch': 1.21} {'loss': 0.488, 'learning_rate': 7.153849898585958e-06, 'epoch': 1.21} {'loss': 0.3266, 'learning_rate': 7.153527817934972e-06, 'epoch': 1.21} {'loss': 0.3506, 'learning_rate': 7.153205740497111e-06, 'epoch': 1.21} {'loss': 0.3684, 'learning_rate': 7.152883666272741e-06, 'epoch': 1.21} {'loss': 0.1429, 'learning_rate': 7.1525615952622215e-06, 'epoch': 1.21} {'loss': 0.3932, 'learning_rate': 7.1522395274659204e-06, 'epoch': 1.21} {'loss': 0.4248, 'learning_rate': 7.151917462884198e-06, 'epoch': 1.21} {'loss': 0.2701, 'learning_rate': 7.151595401517419e-06, 'epoch': 1.21} {'loss': 0.3768, 'learning_rate': 7.151273343365949e-06, 'epoch': 1.21} {'loss': 0.2825, 'learning_rate': 7.150951288430148e-06, 'epoch': 1.21} {'loss': 0.3398, 'learning_rate': 7.150629236710382e-06, 'epoch': 1.21} {'loss': 0.3236, 'learning_rate': 7.150307188207013e-06, 'epoch': 1.21} {'loss': 0.2622, 'learning_rate': 7.149985142920406e-06, 'epoch': 1.21} {'loss': 0.3605, 'learning_rate': 7.149663100850926e-06, 'epoch': 1.21} {'loss': 0.3074, 'learning_rate': 7.149341061998932e-06, 'epoch': 1.21} {'loss': 0.4723, 'learning_rate': 7.14901902636479e-06, 'epoch': 1.21} {'loss': 0.3558, 'learning_rate': 7.148696993948863e-06, 'epoch': 1.21} {'loss': 0.3775, 'learning_rate': 7.148374964751516e-06, 'epoch': 1.21} {'loss': 0.2895, 'learning_rate': 7.148052938773109e-06, 'epoch': 1.21} {'loss': 0.2274, 'learning_rate': 7.147730916014011e-06, 'epoch': 1.21} {'loss': 0.1881, 'learning_rate': 7.14740889647458e-06, 'epoch': 1.21} {'loss': 0.3911, 'learning_rate': 7.147086880155183e-06, 'epoch': 1.21} {'loss': 0.3775, 'learning_rate': 7.146764867056182e-06, 'epoch': 1.21} {'loss': 0.2691, 'learning_rate': 7.146442857177941e-06, 'epoch': 1.21} {'loss': 0.3217, 'learning_rate': 7.146120850520824e-06, 'epoch': 1.21} {'loss': 0.4577, 'learning_rate': 7.145798847085192e-06, 'epoch': 1.21} {'loss': 0.2727, 'learning_rate': 7.145476846871415e-06, 'epoch': 1.21} {'loss': 0.256, 'learning_rate': 7.145154849879848e-06, 'epoch': 1.21} {'loss': 0.3469, 'learning_rate': 7.144832856110859e-06, 'epoch': 1.21} {'loss': 0.2904, 'learning_rate': 7.144510865564811e-06, 'epoch': 1.21} {'loss': 0.273, 'learning_rate': 7.144188878242067e-06, 'epoch': 1.21} {'loss': 0.2518, 'learning_rate': 7.14386689414299e-06, 'epoch': 1.21} {'loss': 0.3682, 'learning_rate': 7.1435449132679445e-06, 'epoch': 1.21} {'loss': 0.3579, 'learning_rate': 7.143222935617293e-06, 'epoch': 1.21} {'loss': 0.2499, 'learning_rate': 7.142900961191401e-06, 'epoch': 1.21} {'loss': 0.3961, 'learning_rate': 7.1425789899906295e-06, 'epoch': 1.21} {'loss': 0.4416, 'learning_rate': 7.142257022015344e-06, 'epoch': 1.21} {'loss': 0.2714, 'learning_rate': 7.1419350572659054e-06, 'epoch': 1.21} {'loss': 0.299, 'learning_rate': 7.14161309574268e-06, 'epoch': 1.21} {'loss': 0.3989, 'learning_rate': 7.1412911374460315e-06, 'epoch': 1.21} {'loss': 0.3435, 'learning_rate': 7.140969182376319e-06, 'epoch': 1.21} {'loss': 0.2973, 'learning_rate': 7.140647230533909e-06, 'epoch': 1.21} {'loss': 0.2522, 'learning_rate': 7.140325281919165e-06, 'epoch': 1.21} {'loss': 0.448, 'learning_rate': 7.14000333653245e-06, 'epoch': 1.21} {'loss': 0.3336, 'learning_rate': 7.139681394374127e-06, 'epoch': 1.21} {'loss': 0.2676, 'learning_rate': 7.139359455444559e-06, 'epoch': 1.21} {'loss': 0.2379, 'learning_rate': 7.139037519744112e-06, 'epoch': 1.21} {'loss': 0.3179, 'learning_rate': 7.138715587273146e-06, 'epoch': 1.21} {'loss': 0.34, 'learning_rate': 7.138393658032027e-06, 'epoch': 1.21} {'loss': 0.3467, 'learning_rate': 7.138071732021117e-06, 'epoch': 1.21} {'loss': 0.3234, 'learning_rate': 7.137749809240779e-06, 'epoch': 1.21} {'loss': 0.3754, 'learning_rate': 7.137427889691378e-06, 'epoch': 1.21} {'loss': 0.429, 'learning_rate': 7.137105973373279e-06, 'epoch': 1.21} {'loss': 0.2315, 'learning_rate': 7.136784060286841e-06, 'epoch': 1.21} {'loss': 0.49, 'learning_rate': 7.1364621504324284e-06, 'epoch': 1.21} {'loss': 0.3071, 'learning_rate': 7.136140243810405e-06, 'epoch': 1.21} {'loss': 0.303, 'learning_rate': 7.135818340421137e-06, 'epoch': 1.21} {'loss': 0.3101, 'learning_rate': 7.135496440264984e-06, 'epoch': 1.21} {'loss': 0.5098, 'learning_rate': 7.135174543342312e-06, 'epoch': 1.21} {'loss': 0.263, 'learning_rate': 7.1348526496534806e-06, 'epoch': 1.21} {'loss': 0.2955, 'learning_rate': 7.134530759198857e-06, 'epoch': 1.21} {'loss': 0.1917, 'learning_rate': 7.134208871978804e-06, 'epoch': 1.21} {'loss': 0.2398, 'learning_rate': 7.133886987993683e-06, 'epoch': 1.21} {'loss': 0.2614, 'learning_rate': 7.13356510724386e-06, 'epoch': 1.21} {'loss': 0.314, 'learning_rate': 7.133243229729696e-06, 'epoch': 1.21} {'loss': 0.2329, 'learning_rate': 7.132921355451558e-06, 'epoch': 1.21} {'loss': 0.4433, 'learning_rate': 7.132599484409803e-06, 'epoch': 1.21} {'loss': 0.3159, 'learning_rate': 7.132277616604799e-06, 'epoch': 1.21} {'loss': 0.3158, 'learning_rate': 7.131955752036909e-06, 'epoch': 1.21} {'loss': 0.4072, 'learning_rate': 7.1316338907064945e-06, 'epoch': 1.21} {'loss': 0.2819, 'learning_rate': 7.1313120326139196e-06, 'epoch': 1.21} {'loss': 0.3141, 'learning_rate': 7.130990177759549e-06, 'epoch': 1.21} {'loss': 0.2889, 'learning_rate': 7.130668326143744e-06, 'epoch': 1.21} {'loss': 0.4352, 'learning_rate': 7.13034647776687e-06, 'epoch': 1.21} {'loss': 0.3108, 'learning_rate': 7.130024632629288e-06, 'epoch': 1.21} {'loss': 0.2833, 'learning_rate': 7.129702790731363e-06, 'epoch': 1.21} {'loss': 0.4879, 'learning_rate': 7.129380952073457e-06, 'epoch': 1.21} {'loss': 0.3603, 'learning_rate': 7.129059116655934e-06, 'epoch': 1.21} {'loss': 0.3491, 'learning_rate': 7.128737284479162e-06, 'epoch': 1.21} {'loss': 0.4748, 'learning_rate': 7.128415455543494e-06, 'epoch': 1.21} {'loss': 0.3573, 'learning_rate': 7.1280936298493005e-06, 'epoch': 1.21} {'loss': 0.3169, 'learning_rate': 7.127771807396944e-06, 'epoch': 1.21} {'loss': 0.3821, 'learning_rate': 7.127449988186785e-06, 'epoch': 1.21} {'loss': 0.3633, 'learning_rate': 7.12712817221919e-06, 'epoch': 1.21} {'loss': 0.3553, 'learning_rate': 7.126806359494521e-06, 'epoch': 1.21} {'loss': 0.3639, 'learning_rate': 7.12648455001314e-06, 'epoch': 1.21} {'loss': 0.275, 'learning_rate': 7.1261627437754135e-06, 'epoch': 1.21} {'loss': 0.3647, 'learning_rate': 7.125840940781701e-06, 'epoch': 1.21} {'loss': 0.3001, 'learning_rate': 7.125519141032369e-06, 'epoch': 1.21} {'loss': 0.2988, 'learning_rate': 7.125197344527779e-06, 'epoch': 1.21} {'loss': 0.3613, 'learning_rate': 7.1248755512682936e-06, 'epoch': 1.21} {'loss': 0.3942, 'learning_rate': 7.124553761254279e-06, 'epoch': 1.21} {'loss': 0.3356, 'learning_rate': 7.124231974486096e-06, 'epoch': 1.21} {'loss': 0.4175, 'learning_rate': 7.123910190964107e-06, 'epoch': 1.21} {'loss': 0.5205, 'learning_rate': 7.123588410688676e-06, 'epoch': 1.21} {'loss': 0.4819, 'learning_rate': 7.123266633660168e-06, 'epoch': 1.21} {'loss': 0.2739, 'learning_rate': 7.12294485987894e-06, 'epoch': 1.21} {'loss': 0.3369, 'learning_rate': 7.122623089345364e-06, 'epoch': 1.21} {'loss': 0.3788, 'learning_rate': 7.1223013220598e-06, 'epoch': 1.21} {'loss': 0.3433, 'learning_rate': 7.121979558022613e-06, 'epoch': 1.21} {'loss': 0.2738, 'learning_rate': 7.121657797234161e-06, 'epoch': 1.21} {'loss': 0.2572, 'learning_rate': 7.121336039694809e-06, 'epoch': 1.21} {'loss': 0.1986, 'learning_rate': 7.121014285404923e-06, 'epoch': 1.21} {'loss': 0.3543, 'learning_rate': 7.120692534364863e-06, 'epoch': 1.21} {'loss': 0.3165, 'learning_rate': 7.120370786574995e-06, 'epoch': 1.21} {'loss': 0.3463, 'learning_rate': 7.120049042035681e-06, 'epoch': 1.21} {'loss': 0.2885, 'learning_rate': 7.119727300747283e-06, 'epoch': 1.21} {'loss': 0.346, 'learning_rate': 7.119405562710165e-06, 'epoch': 1.21} {'loss': 0.4002, 'learning_rate': 7.119083827924691e-06, 'epoch': 1.21} {'loss': 0.3202, 'learning_rate': 7.1187620963912226e-06, 'epoch': 1.21} {'loss': 0.3372, 'learning_rate': 7.118440368110125e-06, 'epoch': 1.21} {'loss': 0.2855, 'learning_rate': 7.1181186430817595e-06, 'epoch': 1.21} {'loss': 0.3088, 'learning_rate': 7.117796921306492e-06, 'epoch': 1.21} {'loss': 0.4522, 'learning_rate': 7.1174752027846825e-06, 'epoch': 1.21} {'loss': 0.491, 'learning_rate': 7.117153487516695e-06, 'epoch': 1.21} {'loss': 0.3422, 'learning_rate': 7.116831775502893e-06, 'epoch': 1.21} {'loss': 0.2809, 'learning_rate': 7.11651006674364e-06, 'epoch': 1.21} {'loss': 0.3473, 'learning_rate': 7.116188361239298e-06, 'epoch': 1.21} {'loss': 0.2882, 'learning_rate': 7.115866658990231e-06, 'epoch': 1.21} {'loss': 0.3118, 'learning_rate': 7.115544959996803e-06, 'epoch': 1.21} {'loss': 0.2206, 'learning_rate': 7.115223264259376e-06, 'epoch': 1.21} {'loss': 0.3859, 'learning_rate': 7.1149015717783125e-06, 'epoch': 1.21} {'loss': 0.3662, 'learning_rate': 7.114579882553978e-06, 'epoch': 1.21} {'loss': 0.2901, 'learning_rate': 7.114258196586732e-06, 'epoch': 1.21} {'loss': 0.383, 'learning_rate': 7.113936513876941e-06, 'epoch': 1.21} {'loss': 0.5326, 'learning_rate': 7.113614834424969e-06, 'epoch': 1.21} {'loss': 0.3154, 'learning_rate': 7.113293158231175e-06, 'epoch': 1.21} {'loss': 0.2852, 'learning_rate': 7.112971485295924e-06, 'epoch': 1.21} {'loss': 0.3263, 'learning_rate': 7.112649815619579e-06, 'epoch': 1.21} {'loss': 0.1668, 'learning_rate': 7.112328149202503e-06, 'epoch': 1.21} {'loss': 0.4166, 'learning_rate': 7.11200648604506e-06, 'epoch': 1.21} {'loss': 0.3459, 'learning_rate': 7.111684826147612e-06, 'epoch': 1.21} {'loss': 0.2639, 'learning_rate': 7.111363169510524e-06, 'epoch': 1.21} {'loss': 0.2141, 'learning_rate': 7.111041516134156e-06, 'epoch': 1.21} {'loss': 0.3974, 'learning_rate': 7.110719866018874e-06, 'epoch': 1.21} {'loss': 0.3349, 'learning_rate': 7.110398219165038e-06, 'epoch': 1.21} {'loss': 0.4346, 'learning_rate': 7.110076575573015e-06, 'epoch': 1.21} {'loss': 0.3902, 'learning_rate': 7.109754935243165e-06, 'epoch': 1.21} {'loss': 0.2776, 'learning_rate': 7.109433298175854e-06, 'epoch': 1.21} {'loss': 0.3053, 'learning_rate': 7.109111664371442e-06, 'epoch': 1.21} {'loss': 0.3563, 'learning_rate': 7.1087900338302915e-06, 'epoch': 1.21} {'loss': 0.3465, 'learning_rate': 7.108468406552768e-06, 'epoch': 1.21} {'loss': 0.2863, 'learning_rate': 7.108146782539235e-06, 'epoch': 1.21} {'loss': 0.3785, 'learning_rate': 7.107825161790053e-06, 'epoch': 1.21} {'loss': 0.2938, 'learning_rate': 7.107503544305587e-06, 'epoch': 1.21} {'loss': 0.3194, 'learning_rate': 7.1071819300862e-06, 'epoch': 1.21} {'loss': 0.3664, 'learning_rate': 7.1068603191322534e-06, 'epoch': 1.21} {'loss': 0.2512, 'learning_rate': 7.106538711444111e-06, 'epoch': 1.21} {'loss': 0.3547, 'learning_rate': 7.106217107022137e-06, 'epoch': 1.21} {'loss': 0.1941, 'learning_rate': 7.1058955058666936e-06, 'epoch': 1.21} {'loss': 0.2833, 'learning_rate': 7.105573907978145e-06, 'epoch': 1.21} {'loss': 0.3655, 'learning_rate': 7.105252313356854e-06, 'epoch': 1.21} {'loss': 0.4614, 'learning_rate': 7.10493072200318e-06, 'epoch': 1.21} {'loss': 0.296, 'learning_rate': 7.10460913391749e-06, 'epoch': 1.21} {'loss': 0.361, 'learning_rate': 7.104287549100144e-06, 'epoch': 1.21} {'loss': 0.4604, 'learning_rate': 7.103965967551507e-06, 'epoch': 1.21} {'loss': 0.3779, 'learning_rate': 7.103644389271943e-06, 'epoch': 1.21} {'loss': 0.3178, 'learning_rate': 7.103322814261813e-06, 'epoch': 1.21} {'loss': 0.2423, 'learning_rate': 7.103001242521481e-06, 'epoch': 1.21} {'loss': 0.3314, 'learning_rate': 7.102679674051309e-06, 'epoch': 1.21} {'loss': 0.3843, 'learning_rate': 7.102358108851661e-06, 'epoch': 1.21} {'loss': 0.3771, 'learning_rate': 7.102036546922901e-06, 'epoch': 1.21} {'loss': 0.3657, 'learning_rate': 7.101714988265389e-06, 'epoch': 1.21} {'loss': 0.4211, 'learning_rate': 7.101393432879491e-06, 'epoch': 1.21} {'loss': 0.2564, 'learning_rate': 7.101071880765569e-06, 'epoch': 1.21} {'loss': 0.3056, 'learning_rate': 7.100750331923984e-06, 'epoch': 1.21} {'loss': 0.2035, 'learning_rate': 7.100428786355102e-06, 'epoch': 1.21} {'loss': 0.3596, 'learning_rate': 7.1001072440592834e-06, 'epoch': 1.21} {'loss': 0.338, 'learning_rate': 7.099785705036892e-06, 'epoch': 1.21} {'loss': 0.3875, 'learning_rate': 7.099464169288292e-06, 'epoch': 1.21} {'loss': 0.2447, 'learning_rate': 7.099142636813845e-06, 'epoch': 1.21} {'loss': 0.2597, 'learning_rate': 7.0988211076139135e-06, 'epoch': 1.21} {'loss': 0.428, 'learning_rate': 7.098499581688862e-06, 'epoch': 1.21} {'loss': 0.34, 'learning_rate': 7.0981780590390535e-06, 'epoch': 1.21} {'loss': 0.3337, 'learning_rate': 7.097856539664849e-06, 'epoch': 1.21} {'loss': 0.4094, 'learning_rate': 7.097535023566613e-06, 'epoch': 1.21} {'loss': 0.3945, 'learning_rate': 7.097213510744707e-06, 'epoch': 1.21} {'loss': 0.5022, 'learning_rate': 7.0968920011994965e-06, 'epoch': 1.21} {'loss': 0.2215, 'learning_rate': 7.096570494931346e-06, 'epoch': 1.21} {'loss': 0.2555, 'learning_rate': 7.096248991940611e-06, 'epoch': 1.21} {'loss': 0.3115, 'learning_rate': 7.095927492227659e-06, 'epoch': 1.21} {'loss': 0.2598, 'learning_rate': 7.095605995792853e-06, 'epoch': 1.21} {'loss': 0.4315, 'learning_rate': 7.095284502636555e-06, 'epoch': 1.21} {'loss': 0.2592, 'learning_rate': 7.094963012759129e-06, 'epoch': 1.21} {'loss': 0.3197, 'learning_rate': 7.094641526160937e-06, 'epoch': 1.21} {'loss': 0.3119, 'learning_rate': 7.094320042842342e-06, 'epoch': 1.21} {'loss': 0.417, 'learning_rate': 7.093998562803708e-06, 'epoch': 1.21} {'loss': 0.3385, 'learning_rate': 7.093677086045396e-06, 'epoch': 1.21} {'loss': 0.2369, 'learning_rate': 7.093355612567771e-06, 'epoch': 1.21} {'loss': 0.357, 'learning_rate': 7.0930341423711945e-06, 'epoch': 1.21} {'loss': 0.3767, 'learning_rate': 7.092712675456029e-06, 'epoch': 1.21} {'loss': 0.3019, 'learning_rate': 7.092391211822641e-06, 'epoch': 1.21} {'loss': 0.3754, 'learning_rate': 7.0920697514713886e-06, 'epoch': 1.21} {'loss': 0.4274, 'learning_rate': 7.0917482944026365e-06, 'epoch': 1.21} {'loss': 0.3828, 'learning_rate': 7.091426840616746e-06, 'epoch': 1.21} {'loss': 0.3245, 'learning_rate': 7.0911053901140784e-06, 'epoch': 1.21} {'loss': 0.2243, 'learning_rate': 7.090783942895003e-06, 'epoch': 1.21} {'loss': 0.3385, 'learning_rate': 7.09046249895988e-06, 'epoch': 1.21} {'loss': 0.2687, 'learning_rate': 7.0901410583090744e-06, 'epoch': 1.21} {'loss': 0.3807, 'learning_rate': 7.089819620942942e-06, 'epoch': 1.21} {'loss': 0.2878, 'learning_rate': 7.089498186861851e-06, 'epoch': 1.21} {'loss': 0.3656, 'learning_rate': 7.089176756066165e-06, 'epoch': 1.21} {'loss': 0.3833, 'learning_rate': 7.088855328556244e-06, 'epoch': 1.21} {'loss': 0.3223, 'learning_rate': 7.0885339043324496e-06, 'epoch': 1.21} {'loss': 0.3519, 'learning_rate': 7.088212483395148e-06, 'epoch': 1.21} {'loss': 0.3593, 'learning_rate': 7.087891065744701e-06, 'epoch': 1.21} {'loss': 0.3289, 'learning_rate': 7.087569651381472e-06, 'epoch': 1.21} {'loss': 0.2548, 'learning_rate': 7.087248240305821e-06, 'epoch': 1.21} {'loss': 0.4792, 'learning_rate': 7.0869268325181154e-06, 'epoch': 1.21} {'loss': 0.3965, 'learning_rate': 7.086605428018713e-06, 'epoch': 1.21} {'loss': 0.2858, 'learning_rate': 7.08628402680798e-06, 'epoch': 1.21} {'loss': 0.3852, 'learning_rate': 7.08596262888628e-06, 'epoch': 1.21} {'loss': 0.2882, 'learning_rate': 7.085641234253973e-06, 'epoch': 1.21} {'loss': 0.338, 'learning_rate': 7.085319842911422e-06, 'epoch': 1.21} {'loss': 0.4048, 'learning_rate': 7.084998454858991e-06, 'epoch': 1.21} {'loss': 0.4075, 'learning_rate': 7.084677070097044e-06, 'epoch': 1.21} {'loss': 0.249, 'learning_rate': 7.08435568862594e-06, 'epoch': 1.21} {'loss': 0.1956, 'learning_rate': 7.084034310446044e-06, 'epoch': 1.21} {'loss': 0.2401, 'learning_rate': 7.083712935557721e-06, 'epoch': 1.21} {'loss': 0.3351, 'learning_rate': 7.08339156396133e-06, 'epoch': 1.21} {'loss': 0.3925, 'learning_rate': 7.0830701956572344e-06, 'epoch': 1.21} {'loss': 0.3052, 'learning_rate': 7.082748830645798e-06, 'epoch': 1.21} {'loss': 0.2968, 'learning_rate': 7.0824274689273845e-06, 'epoch': 1.21} {'loss': 0.4744, 'learning_rate': 7.082106110502356e-06, 'epoch': 1.21} {'loss': 0.453, 'learning_rate': 7.081784755371074e-06, 'epoch': 1.21} {'loss': 0.1924, 'learning_rate': 7.081463403533904e-06, 'epoch': 1.21} {'loss': 0.3077, 'learning_rate': 7.081142054991206e-06, 'epoch': 1.21} {'loss': 0.3637, 'learning_rate': 7.080820709743341e-06, 'epoch': 1.21} {'loss': 0.383, 'learning_rate': 7.080499367790677e-06, 'epoch': 1.21} {'loss': 0.2404, 'learning_rate': 7.080178029133573e-06, 'epoch': 1.21} {'loss': 0.3294, 'learning_rate': 7.0798566937723925e-06, 'epoch': 1.21} {'loss': 0.3736, 'learning_rate': 7.079535361707499e-06, 'epoch': 1.21} {'loss': 0.3064, 'learning_rate': 7.0792140329392545e-06, 'epoch': 1.21} {'loss': 0.216, 'learning_rate': 7.078892707468021e-06, 'epoch': 1.21} {'loss': 0.2915, 'learning_rate': 7.078571385294164e-06, 'epoch': 1.21} {'loss': 0.3938, 'learning_rate': 7.078250066418042e-06, 'epoch': 1.21} {'loss': 0.3583, 'learning_rate': 7.077928750840022e-06, 'epoch': 1.21} {'loss': 0.2428, 'learning_rate': 7.077607438560465e-06, 'epoch': 1.21} {'loss': 0.2143, 'learning_rate': 7.077286129579735e-06, 'epoch': 1.21} {'loss': 0.3584, 'learning_rate': 7.0769648238981905e-06, 'epoch': 1.21} {'loss': 0.3964, 'learning_rate': 7.076643521516198e-06, 'epoch': 1.21} {'loss': 0.3804, 'learning_rate': 7.076322222434118e-06, 'epoch': 1.21} {'loss': 0.3879, 'learning_rate': 7.076000926652314e-06, 'epoch': 1.21} {'loss': 0.2494, 'learning_rate': 7.07567963417115e-06, 'epoch': 1.21} {'loss': 0.3612, 'learning_rate': 7.075358344990987e-06, 'epoch': 1.21} {'loss': 0.2513, 'learning_rate': 7.0750370591121885e-06, 'epoch': 1.21} {'loss': 0.3259, 'learning_rate': 7.074715776535117e-06, 'epoch': 1.21} {'loss': 0.3946, 'learning_rate': 7.074394497260135e-06, 'epoch': 1.21} {'loss': 0.4382, 'learning_rate': 7.074073221287605e-06, 'epoch': 1.21} {'loss': 0.4543, 'learning_rate': 7.073751948617891e-06, 'epoch': 1.21} {'loss': 0.2979, 'learning_rate': 7.073430679251353e-06, 'epoch': 1.21} {'loss': 0.4006, 'learning_rate': 7.073109413188358e-06, 'epoch': 1.21} {'loss': 0.3475, 'learning_rate': 7.072788150429264e-06, 'epoch': 1.21} {'loss': 0.1951, 'learning_rate': 7.0724668909744365e-06, 'epoch': 1.21} {'loss': 0.1865, 'learning_rate': 7.072145634824236e-06, 'epoch': 1.21} {'loss': 0.4409, 'learning_rate': 7.071824381979027e-06, 'epoch': 1.21} {'loss': 0.3038, 'learning_rate': 7.07150313243917e-06, 'epoch': 1.21} {'loss': 0.3907, 'learning_rate': 7.071181886205029e-06, 'epoch': 1.21} {'loss': 0.2777, 'learning_rate': 7.070860643276969e-06, 'epoch': 1.21} {'loss': 0.362, 'learning_rate': 7.07053940365535e-06, 'epoch': 1.21} {'loss': 0.3071, 'learning_rate': 7.0702181673405335e-06, 'epoch': 1.21} {'loss': 0.4126, 'learning_rate': 7.069896934332884e-06, 'epoch': 1.21} {'loss': 0.3021, 'learning_rate': 7.069575704632764e-06, 'epoch': 1.21} {'loss': 0.2235, 'learning_rate': 7.069254478240535e-06, 'epoch': 1.21} {'loss': 0.3617, 'learning_rate': 7.068933255156564e-06, 'epoch': 1.21} {'loss': 0.2423, 'learning_rate': 7.068612035381206e-06, 'epoch': 1.21} {'loss': 0.2627, 'learning_rate': 7.0682908189148296e-06, 'epoch': 1.21} {'loss': 0.3095, 'learning_rate': 7.067969605757794e-06, 'epoch': 1.21} {'loss': 0.372, 'learning_rate': 7.067648395910462e-06, 'epoch': 1.21} {'loss': 0.3378, 'learning_rate': 7.0673271893732e-06, 'epoch': 1.21} {'loss': 0.4455, 'learning_rate': 7.067005986146367e-06, 'epoch': 1.21} {'loss': 0.4389, 'learning_rate': 7.066684786230327e-06, 'epoch': 1.21} {'loss': 0.1563, 'learning_rate': 7.06636358962544e-06, 'epoch': 1.21} {'loss': 0.272, 'learning_rate': 7.066042396332072e-06, 'epoch': 1.21} {'loss': 0.3637, 'learning_rate': 7.065721206350584e-06, 'epoch': 1.21} {'loss': 0.2428, 'learning_rate': 7.06540001968134e-06, 'epoch': 1.21} {'loss': 0.3981, 'learning_rate': 7.0650788363247e-06, 'epoch': 1.21} {'loss': 0.3878, 'learning_rate': 7.0647576562810305e-06, 'epoch': 1.21} {'loss': 0.4879, 'learning_rate': 7.0644364795506895e-06, 'epoch': 1.21} {'loss': 0.2891, 'learning_rate': 7.0641153061340405e-06, 'epoch': 1.21} {'loss': 0.217, 'learning_rate': 7.063794136031448e-06, 'epoch': 1.21} {'loss': 0.3937, 'learning_rate': 7.063472969243274e-06, 'epoch': 1.21} {'loss': 0.3503, 'learning_rate': 7.063151805769879e-06, 'epoch': 1.21} {'loss': 0.3335, 'learning_rate': 7.062830645611629e-06, 'epoch': 1.21} {'loss': 0.3578, 'learning_rate': 7.0625094887688826e-06, 'epoch': 1.21} {'loss': 0.3659, 'learning_rate': 7.062188335242006e-06, 'epoch': 1.22} {'loss': 0.2023, 'learning_rate': 7.061867185031359e-06, 'epoch': 1.22} {'loss': 0.2556, 'learning_rate': 7.061546038137306e-06, 'epoch': 1.22} {'loss': 0.3928, 'learning_rate': 7.061224894560209e-06, 'epoch': 1.22} {'loss': 0.2938, 'learning_rate': 7.06090375430043e-06, 'epoch': 1.22} {'loss': 0.2773, 'learning_rate': 7.060582617358334e-06, 'epoch': 1.22} {'loss': 0.354, 'learning_rate': 7.060261483734279e-06, 'epoch': 1.22} {'loss': 0.3301, 'learning_rate': 7.059940353428629e-06, 'epoch': 1.22} {'loss': 0.4328, 'learning_rate': 7.059619226441748e-06, 'epoch': 1.22} {'loss': 0.4217, 'learning_rate': 7.059298102773998e-06, 'epoch': 1.22} {'loss': 0.3495, 'learning_rate': 7.058976982425736e-06, 'epoch': 1.22} {'loss': 0.5072, 'learning_rate': 7.058655865397335e-06, 'epoch': 1.22} {'loss': 0.3331, 'learning_rate': 7.058334751689152e-06, 'epoch': 1.22} {'loss': 0.3295, 'learning_rate': 7.058013641301552e-06, 'epoch': 1.22} {'loss': 0.3146, 'learning_rate': 7.057692534234892e-06, 'epoch': 1.22} {'loss': 0.3398, 'learning_rate': 7.057371430489539e-06, 'epoch': 1.22} {'loss': 0.2683, 'learning_rate': 7.057050330065853e-06, 'epoch': 1.22} {'loss': 0.3124, 'learning_rate': 7.056729232964199e-06, 'epoch': 1.22} {'loss': 0.2443, 'learning_rate': 7.056408139184936e-06, 'epoch': 1.22} {'loss': 0.4778, 'learning_rate': 7.05608704872843e-06, 'epoch': 1.22} {'loss': 0.2075, 'learning_rate': 7.0557659615950414e-06, 'epoch': 1.22} {'loss': 0.2283, 'learning_rate': 7.055444877785134e-06, 'epoch': 1.22} {'loss': 0.5379, 'learning_rate': 7.055123797299067e-06, 'epoch': 1.22} {'loss': 0.2522, 'learning_rate': 7.054802720137207e-06, 'epoch': 1.22} {'loss': 0.3486, 'learning_rate': 7.0544816462999146e-06, 'epoch': 1.22} {'loss': 0.3761, 'learning_rate': 7.054160575787552e-06, 'epoch': 1.22} {'loss': 0.2587, 'learning_rate': 7.053839508600484e-06, 'epoch': 1.22} {'loss': 0.3735, 'learning_rate': 7.053518444739069e-06, 'epoch': 1.22} {'loss': 0.2427, 'learning_rate': 7.053197384203672e-06, 'epoch': 1.22} {'loss': 0.3745, 'learning_rate': 7.052876326994654e-06, 'epoch': 1.22} {'loss': 0.3471, 'learning_rate': 7.052555273112378e-06, 'epoch': 1.22} {'loss': 0.2302, 'learning_rate': 7.052234222557207e-06, 'epoch': 1.22} {'loss': 0.3918, 'learning_rate': 7.051913175329504e-06, 'epoch': 1.22} {'loss': 0.2867, 'learning_rate': 7.0515921314296286e-06, 'epoch': 1.22} {'loss': 0.266, 'learning_rate': 7.051271090857947e-06, 'epoch': 1.22} {'loss': 0.3012, 'learning_rate': 7.050950053614818e-06, 'epoch': 1.22} {'loss': 0.3419, 'learning_rate': 7.050629019700606e-06, 'epoch': 1.22} {'loss': 0.3886, 'learning_rate': 7.050307989115673e-06, 'epoch': 1.22} {'loss': 0.6289, 'learning_rate': 7.049986961860381e-06, 'epoch': 1.22} {'loss': 0.4305, 'learning_rate': 7.049665937935095e-06, 'epoch': 1.22} {'loss': 0.3255, 'learning_rate': 7.049344917340173e-06, 'epoch': 1.22} {'loss': 0.2527, 'learning_rate': 7.049023900075979e-06, 'epoch': 1.22} {'loss': 0.4972, 'learning_rate': 7.048702886142877e-06, 'epoch': 1.22} {'loss': 0.4852, 'learning_rate': 7.048381875541229e-06, 'epoch': 1.22} {'loss': 0.3533, 'learning_rate': 7.0480608682713955e-06, 'epoch': 1.22} {'loss': 0.4294, 'learning_rate': 7.04773986433374e-06, 'epoch': 1.22} {'loss': 0.2787, 'learning_rate': 7.0474188637286245e-06, 'epoch': 1.22} {'loss': 0.3652, 'learning_rate': 7.047097866456411e-06, 'epoch': 1.22} {'loss': 0.3278, 'learning_rate': 7.046776872517464e-06, 'epoch': 1.22} {'loss': 0.3248, 'learning_rate': 7.046455881912144e-06, 'epoch': 1.22} {'loss': 0.3705, 'learning_rate': 7.046134894640813e-06, 'epoch': 1.22} {'loss': 0.4903, 'learning_rate': 7.045813910703835e-06, 'epoch': 1.22} {'loss': 0.3122, 'learning_rate': 7.045492930101573e-06, 'epoch': 1.22} {'loss': 0.3032, 'learning_rate': 7.045171952834384e-06, 'epoch': 1.22} {'loss': 0.3667, 'learning_rate': 7.044850978902636e-06, 'epoch': 1.22} {'loss': 0.1384, 'learning_rate': 7.044530008306689e-06, 'epoch': 1.22} {'loss': 0.3016, 'learning_rate': 7.044209041046906e-06, 'epoch': 1.22} {'loss': 0.2687, 'learning_rate': 7.043888077123648e-06, 'epoch': 1.22} {'loss': 0.2795, 'learning_rate': 7.043567116537278e-06, 'epoch': 1.22} {'loss': 0.362, 'learning_rate': 7.043246159288158e-06, 'epoch': 1.22} {'loss': 0.2823, 'learning_rate': 7.042925205376652e-06, 'epoch': 1.22} {'loss': 0.1894, 'learning_rate': 7.042604254803122e-06, 'epoch': 1.22} {'loss': 0.3728, 'learning_rate': 7.042283307567927e-06, 'epoch': 1.22} {'loss': 0.3475, 'learning_rate': 7.041962363671433e-06, 'epoch': 1.22} {'loss': 0.3329, 'learning_rate': 7.041641423114002e-06, 'epoch': 1.22} {'loss': 0.4188, 'learning_rate': 7.041320485895996e-06, 'epoch': 1.22} {'loss': 0.3725, 'learning_rate': 7.040999552017775e-06, 'epoch': 1.22} {'loss': 0.3795, 'learning_rate': 7.0406786214797015e-06, 'epoch': 1.22} {'loss': 0.3022, 'learning_rate': 7.04035769428214e-06, 'epoch': 1.22} {'loss': 0.2324, 'learning_rate': 7.040036770425453e-06, 'epoch': 1.22} {'loss': 0.1739, 'learning_rate': 7.0397158499100004e-06, 'epoch': 1.22} {'loss': 0.2887, 'learning_rate': 7.039394932736147e-06, 'epoch': 1.22} {'loss': 0.2997, 'learning_rate': 7.039074018904253e-06, 'epoch': 1.22} {'loss': 0.3322, 'learning_rate': 7.03875310841468e-06, 'epoch': 1.22} {'loss': 0.3262, 'learning_rate': 7.038432201267793e-06, 'epoch': 1.22} {'loss': 0.2938, 'learning_rate': 7.038111297463953e-06, 'epoch': 1.22} {'loss': 0.3564, 'learning_rate': 7.037790397003521e-06, 'epoch': 1.22} {'loss': 0.3512, 'learning_rate': 7.037469499886862e-06, 'epoch': 1.22} {'loss': 0.4608, 'learning_rate': 7.037148606114338e-06, 'epoch': 1.22} {'loss': 0.2764, 'learning_rate': 7.0368277156863076e-06, 'epoch': 1.22} {'loss': 0.2198, 'learning_rate': 7.036506828603135e-06, 'epoch': 1.22} {'loss': 0.4862, 'learning_rate': 7.036185944865183e-06, 'epoch': 1.22} {'loss': 0.3669, 'learning_rate': 7.035865064472813e-06, 'epoch': 1.22} {'loss': 0.3366, 'learning_rate': 7.035544187426389e-06, 'epoch': 1.22} {'loss': 0.2389, 'learning_rate': 7.035223313726269e-06, 'epoch': 1.22} {'loss': 0.4727, 'learning_rate': 7.0349024433728205e-06, 'epoch': 1.22} {'loss': 0.3745, 'learning_rate': 7.034581576366402e-06, 'epoch': 1.22} {'loss': 0.315, 'learning_rate': 7.03426071270738e-06, 'epoch': 1.22} {'loss': 0.376, 'learning_rate': 7.03393985239611e-06, 'epoch': 1.22} {'loss': 0.4286, 'learning_rate': 7.03361899543296e-06, 'epoch': 1.22} {'loss': 0.313, 'learning_rate': 7.033298141818289e-06, 'epoch': 1.22} {'loss': 0.419, 'learning_rate': 7.032977291552463e-06, 'epoch': 1.22} {'loss': 0.1833, 'learning_rate': 7.032656444635839e-06, 'epoch': 1.22} {'loss': 0.3558, 'learning_rate': 7.032335601068782e-06, 'epoch': 1.22} {'loss': 0.2987, 'learning_rate': 7.0320147608516534e-06, 'epoch': 1.22} {'loss': 0.2563, 'learning_rate': 7.031693923984815e-06, 'epoch': 1.22} {'loss': 0.3638, 'learning_rate': 7.031373090468632e-06, 'epoch': 1.22} {'loss': 0.3795, 'learning_rate': 7.031052260303462e-06, 'epoch': 1.22} {'loss': 0.3685, 'learning_rate': 7.03073143348967e-06, 'epoch': 1.22} {'loss': 0.2809, 'learning_rate': 7.030410610027618e-06, 'epoch': 1.22} {'loss': 0.3273, 'learning_rate': 7.030089789917667e-06, 'epoch': 1.22} {'loss': 0.311, 'learning_rate': 7.029768973160181e-06, 'epoch': 1.22} {'loss': 0.3018, 'learning_rate': 7.029448159755521e-06, 'epoch': 1.22} {'loss': 0.2606, 'learning_rate': 7.029127349704048e-06, 'epoch': 1.22} {'loss': 0.3149, 'learning_rate': 7.028806543006126e-06, 'epoch': 1.22} {'loss': 0.4893, 'learning_rate': 7.028485739662119e-06, 'epoch': 1.22} {'loss': 0.2822, 'learning_rate': 7.028164939672384e-06, 'epoch': 1.22} {'loss': 0.5169, 'learning_rate': 7.027844143037284e-06, 'epoch': 1.22} {'loss': 0.2231, 'learning_rate': 7.027523349757185e-06, 'epoch': 1.22} {'loss': 0.3441, 'learning_rate': 7.027202559832442e-06, 'epoch': 1.22} {'loss': 0.4182, 'learning_rate': 7.026881773263425e-06, 'epoch': 1.22} {'loss': 0.2587, 'learning_rate': 7.026560990050495e-06, 'epoch': 1.22} {'loss': 0.38, 'learning_rate': 7.026240210194014e-06, 'epoch': 1.22} {'loss': 0.3963, 'learning_rate': 7.02591943369434e-06, 'epoch': 1.22} {'loss': 0.2765, 'learning_rate': 7.025598660551837e-06, 'epoch': 1.22} {'loss': 0.3314, 'learning_rate': 7.025277890766868e-06, 'epoch': 1.22} {'loss': 0.2927, 'learning_rate': 7.0249571243397944e-06, 'epoch': 1.22} {'loss': 0.3127, 'learning_rate': 7.024636361270977e-06, 'epoch': 1.22} {'loss': 0.2676, 'learning_rate': 7.0243156015607815e-06, 'epoch': 1.22} {'loss': 0.3975, 'learning_rate': 7.023994845209568e-06, 'epoch': 1.22} {'loss': 0.2512, 'learning_rate': 7.0236740922176974e-06, 'epoch': 1.22} {'loss': 0.3644, 'learning_rate': 7.023353342585533e-06, 'epoch': 1.22} {'loss': 0.3538, 'learning_rate': 7.023032596313436e-06, 'epoch': 1.22} {'loss': 0.3999, 'learning_rate': 7.022711853401769e-06, 'epoch': 1.22} {'loss': 0.2323, 'learning_rate': 7.022391113850895e-06, 'epoch': 1.22} {'loss': 0.455, 'learning_rate': 7.0220703776611775e-06, 'epoch': 1.22} {'loss': 0.2089, 'learning_rate': 7.021749644832974e-06, 'epoch': 1.22} {'loss': 0.4232, 'learning_rate': 7.0214289153666486e-06, 'epoch': 1.22} {'loss': 0.1975, 'learning_rate': 7.021108189262563e-06, 'epoch': 1.22} {'loss': 0.2739, 'learning_rate': 7.020787466521081e-06, 'epoch': 1.22} {'loss': 0.1885, 'learning_rate': 7.020466747142562e-06, 'epoch': 1.22} {'loss': 0.2117, 'learning_rate': 7.020146031127371e-06, 'epoch': 1.22} {'loss': 0.3894, 'learning_rate': 7.019825318475867e-06, 'epoch': 1.22} {'loss': 0.398, 'learning_rate': 7.019504609188414e-06, 'epoch': 1.22} {'loss': 0.3873, 'learning_rate': 7.019183903265374e-06, 'epoch': 1.22} {'loss': 0.3801, 'learning_rate': 7.018863200707109e-06, 'epoch': 1.22} {'loss': 0.606, 'learning_rate': 7.0185425015139785e-06, 'epoch': 1.22} {'loss': 0.4314, 'learning_rate': 7.018221805686349e-06, 'epoch': 1.22} {'loss': 0.3379, 'learning_rate': 7.017901113224581e-06, 'epoch': 1.22} {'loss': 0.4163, 'learning_rate': 7.017580424129033e-06, 'epoch': 1.22} {'loss': 0.3664, 'learning_rate': 7.017259738400071e-06, 'epoch': 1.22} {'loss': 0.353, 'learning_rate': 7.0169390560380546e-06, 'epoch': 1.22} {'loss': 0.2227, 'learning_rate': 7.016618377043346e-06, 'epoch': 1.22} {'loss': 0.2575, 'learning_rate': 7.016297701416309e-06, 'epoch': 1.22} {'loss': 0.3901, 'learning_rate': 7.015977029157304e-06, 'epoch': 1.22} {'loss': 0.287, 'learning_rate': 7.015656360266694e-06, 'epoch': 1.22} {'loss': 0.3236, 'learning_rate': 7.015335694744841e-06, 'epoch': 1.22} {'loss': 0.3741, 'learning_rate': 7.015015032592105e-06, 'epoch': 1.22} {'loss': 0.2046, 'learning_rate': 7.01469437380885e-06, 'epoch': 1.22} {'loss': 0.306, 'learning_rate': 7.014373718395437e-06, 'epoch': 1.22} {'loss': 0.2659, 'learning_rate': 7.014053066352229e-06, 'epoch': 1.22} {'loss': 0.2488, 'learning_rate': 7.013732417679589e-06, 'epoch': 1.22} {'loss': 0.3401, 'learning_rate': 7.013411772377876e-06, 'epoch': 1.22} {'loss': 0.3498, 'learning_rate': 7.0130911304474516e-06, 'epoch': 1.22} {'loss': 0.3931, 'learning_rate': 7.0127704918886805e-06, 'epoch': 1.22} {'loss': 0.3106, 'learning_rate': 7.012449856701924e-06, 'epoch': 1.22} {'loss': 0.3623, 'learning_rate': 7.012129224887543e-06, 'epoch': 1.22} {'loss': 0.3092, 'learning_rate': 7.011808596445899e-06, 'epoch': 1.22} {'loss': 0.3603, 'learning_rate': 7.011487971377355e-06, 'epoch': 1.22} {'loss': 0.2161, 'learning_rate': 7.011167349682273e-06, 'epoch': 1.22} {'loss': 0.4467, 'learning_rate': 7.0108467313610165e-06, 'epoch': 1.22} {'loss': 0.319, 'learning_rate': 7.010526116413943e-06, 'epoch': 1.22} {'loss': 0.3629, 'learning_rate': 7.010205504841419e-06, 'epoch': 1.22} {'loss': 0.3763, 'learning_rate': 7.0098848966438025e-06, 'epoch': 1.22} {'loss': 0.379, 'learning_rate': 7.009564291821459e-06, 'epoch': 1.22} {'loss': 0.3747, 'learning_rate': 7.00924369037475e-06, 'epoch': 1.22} {'loss': 0.406, 'learning_rate': 7.008923092304034e-06, 'epoch': 1.22} {'loss': 0.3509, 'learning_rate': 7.008602497609676e-06, 'epoch': 1.22} {'loss': 0.3912, 'learning_rate': 7.008281906292036e-06, 'epoch': 1.22} {'loss': 0.576, 'learning_rate': 7.007961318351477e-06, 'epoch': 1.22} {'loss': 0.3374, 'learning_rate': 7.007640733788361e-06, 'epoch': 1.22} {'loss': 0.3642, 'learning_rate': 7.00732015260305e-06, 'epoch': 1.22} {'loss': 0.4078, 'learning_rate': 7.0069995747959055e-06, 'epoch': 1.22} {'loss': 0.3805, 'learning_rate': 7.006679000367288e-06, 'epoch': 1.22} {'loss': 0.2736, 'learning_rate': 7.006358429317561e-06, 'epoch': 1.22} {'loss': 0.3944, 'learning_rate': 7.006037861647087e-06, 'epoch': 1.22} {'loss': 0.3596, 'learning_rate': 7.005717297356227e-06, 'epoch': 1.22} {'loss': 0.3699, 'learning_rate': 7.005396736445343e-06, 'epoch': 1.22} {'loss': 0.4333, 'learning_rate': 7.005076178914797e-06, 'epoch': 1.22} {'loss': 0.2933, 'learning_rate': 7.00475562476495e-06, 'epoch': 1.22} {'loss': 0.1735, 'learning_rate': 7.004435073996163e-06, 'epoch': 1.22} {'loss': 0.4536, 'learning_rate': 7.0041145266088e-06, 'epoch': 1.22} {'loss': 0.2697, 'learning_rate': 7.003793982603222e-06, 'epoch': 1.22} {'loss': 0.4461, 'learning_rate': 7.0034734419797914e-06, 'epoch': 1.22} {'loss': 0.5109, 'learning_rate': 7.003152904738868e-06, 'epoch': 1.22} {'loss': 0.3474, 'learning_rate': 7.002832370880816e-06, 'epoch': 1.22} {'loss': 0.3541, 'learning_rate': 7.0025118404059965e-06, 'epoch': 1.22} {'loss': 0.3665, 'learning_rate': 7.00219131331477e-06, 'epoch': 1.22} {'loss': 0.2385, 'learning_rate': 7.001870789607501e-06, 'epoch': 1.22} {'loss': 0.2655, 'learning_rate': 7.001550269284548e-06, 'epoch': 1.22} {'loss': 0.3619, 'learning_rate': 7.001229752346277e-06, 'epoch': 1.22} {'loss': 0.4602, 'learning_rate': 7.000909238793047e-06, 'epoch': 1.22} {'loss': 0.2697, 'learning_rate': 7.00058872862522e-06, 'epoch': 1.22} {'loss': 0.4575, 'learning_rate': 7.0002682218431564e-06, 'epoch': 1.22} {'loss': 0.2431, 'learning_rate': 6.99994771844722e-06, 'epoch': 1.22} {'loss': 0.3785, 'learning_rate': 6.999627218437772e-06, 'epoch': 1.22} {'loss': 0.4819, 'learning_rate': 6.999306721815175e-06, 'epoch': 1.22} {'loss': 0.2675, 'learning_rate': 6.99898622857979e-06, 'epoch': 1.22} {'loss': 0.3477, 'learning_rate': 6.998665738731979e-06, 'epoch': 1.22} {'loss': 0.2361, 'learning_rate': 6.998345252272103e-06, 'epoch': 1.22} {'loss': 0.255, 'learning_rate': 6.998024769200524e-06, 'epoch': 1.22} {'loss': 0.522, 'learning_rate': 6.997704289517606e-06, 'epoch': 1.22} {'loss': 0.292, 'learning_rate': 6.997383813223708e-06, 'epoch': 1.22} {'loss': 0.5179, 'learning_rate': 6.997063340319192e-06, 'epoch': 1.22} {'loss': 0.355, 'learning_rate': 6.996742870804423e-06, 'epoch': 1.22} {'loss': 0.3126, 'learning_rate': 6.996422404679759e-06, 'epoch': 1.22} {'loss': 0.2303, 'learning_rate': 6.9961019419455615e-06, 'epoch': 1.22} {'loss': 0.3419, 'learning_rate': 6.995781482602195e-06, 'epoch': 1.22} {'loss': 0.293, 'learning_rate': 6.995461026650015e-06, 'epoch': 1.22} {'loss': 0.3182, 'learning_rate': 6.995140574089392e-06, 'epoch': 1.22} {'loss': 0.3679, 'learning_rate': 6.994820124920685e-06, 'epoch': 1.22} {'loss': 0.2329, 'learning_rate': 6.9944996791442555e-06, 'epoch': 1.22} {'loss': 0.3278, 'learning_rate': 6.994179236760463e-06, 'epoch': 1.22} {'loss': 0.3117, 'learning_rate': 6.9938587977696705e-06, 'epoch': 1.22} {'loss': 0.3238, 'learning_rate': 6.99353836217224e-06, 'epoch': 1.22} {'loss': 0.2474, 'learning_rate': 6.993217929968532e-06, 'epoch': 1.22} {'loss': 0.2442, 'learning_rate': 6.992897501158911e-06, 'epoch': 1.22} {'loss': 0.431, 'learning_rate': 6.992577075743735e-06, 'epoch': 1.22} {'loss': 0.2532, 'learning_rate': 6.992256653723368e-06, 'epoch': 1.22} {'loss': 0.3939, 'learning_rate': 6.991936235098171e-06, 'epoch': 1.22} {'loss': 0.3225, 'learning_rate': 6.991615819868507e-06, 'epoch': 1.22} {'loss': 0.2611, 'learning_rate': 6.991295408034737e-06, 'epoch': 1.22} {'loss': 0.4117, 'learning_rate': 6.990974999597222e-06, 'epoch': 1.22} {'loss': 0.1786, 'learning_rate': 6.990654594556323e-06, 'epoch': 1.22} {'loss': 0.3704, 'learning_rate': 6.990334192912402e-06, 'epoch': 1.22} {'loss': 0.268, 'learning_rate': 6.990013794665826e-06, 'epoch': 1.22} {'loss': 0.2902, 'learning_rate': 6.989693399816949e-06, 'epoch': 1.22} {'loss': 0.3598, 'learning_rate': 6.989373008366136e-06, 'epoch': 1.22} {'loss': 0.4112, 'learning_rate': 6.989052620313748e-06, 'epoch': 1.22} {'loss': 0.3736, 'learning_rate': 6.988732235660146e-06, 'epoch': 1.22} {'loss': 0.3956, 'learning_rate': 6.988411854405695e-06, 'epoch': 1.22} {'loss': 0.4077, 'learning_rate': 6.988091476550751e-06, 'epoch': 1.22} {'loss': 0.4529, 'learning_rate': 6.9877711020956815e-06, 'epoch': 1.22} {'loss': 0.3695, 'learning_rate': 6.987450731040845e-06, 'epoch': 1.22} {'loss': 0.3301, 'learning_rate': 6.987130363386604e-06, 'epoch': 1.22} {'loss': 0.2406, 'learning_rate': 6.98680999913332e-06, 'epoch': 1.22} {'loss': 0.4342, 'learning_rate': 6.986489638281354e-06, 'epoch': 1.22} {'loss': 0.3846, 'learning_rate': 6.986169280831068e-06, 'epoch': 1.22} {'loss': 0.2659, 'learning_rate': 6.985848926782827e-06, 'epoch': 1.22} {'loss': 0.2801, 'learning_rate': 6.985528576136986e-06, 'epoch': 1.22} {'loss': 0.3432, 'learning_rate': 6.9852082288939105e-06, 'epoch': 1.22} {'loss': 0.3727, 'learning_rate': 6.984887885053962e-06, 'epoch': 1.22} {'loss': 0.3549, 'learning_rate': 6.984567544617502e-06, 'epoch': 1.22} {'loss': 0.4196, 'learning_rate': 6.984247207584891e-06, 'epoch': 1.22} {'loss': 0.3547, 'learning_rate': 6.983926873956491e-06, 'epoch': 1.22} {'loss': 0.2559, 'learning_rate': 6.983606543732665e-06, 'epoch': 1.22} {'loss': 0.4193, 'learning_rate': 6.983286216913774e-06, 'epoch': 1.22} {'loss': 0.4374, 'learning_rate': 6.982965893500178e-06, 'epoch': 1.22} {'loss': 0.4105, 'learning_rate': 6.9826455734922395e-06, 'epoch': 1.22} {'loss': 0.411, 'learning_rate': 6.982325256890321e-06, 'epoch': 1.22} {'loss': 0.3547, 'learning_rate': 6.982004943694785e-06, 'epoch': 1.22} {'loss': 0.2701, 'learning_rate': 6.981684633905992e-06, 'epoch': 1.22} {'loss': 0.2747, 'learning_rate': 6.9813643275243e-06, 'epoch': 1.22} {'loss': 0.3284, 'learning_rate': 6.981044024550077e-06, 'epoch': 1.22} {'loss': 0.4647, 'learning_rate': 6.980723724983678e-06, 'epoch': 1.22} {'loss': 0.3066, 'learning_rate': 6.980403428825469e-06, 'epoch': 1.22} {'loss': 0.4419, 'learning_rate': 6.98008313607581e-06, 'epoch': 1.22} {'loss': 0.2674, 'learning_rate': 6.9797628467350634e-06, 'epoch': 1.22} {'loss': 0.2443, 'learning_rate': 6.9794425608035885e-06, 'epoch': 1.22} {'loss': 0.3935, 'learning_rate': 6.9791222782817515e-06, 'epoch': 1.22} {'loss': 0.4002, 'learning_rate': 6.978801999169908e-06, 'epoch': 1.22} {'loss': 0.3433, 'learning_rate': 6.9784817234684245e-06, 'epoch': 1.22} {'loss': 0.3887, 'learning_rate': 6.9781614511776605e-06, 'epoch': 1.22} {'loss': 0.3739, 'learning_rate': 6.977841182297978e-06, 'epoch': 1.22} {'loss': 0.212, 'learning_rate': 6.977520916829739e-06, 'epoch': 1.22} {'loss': 0.2974, 'learning_rate': 6.977200654773302e-06, 'epoch': 1.22} {'loss': 0.3509, 'learning_rate': 6.976880396129031e-06, 'epoch': 1.22} {'loss': 0.3709, 'learning_rate': 6.9765601408972875e-06, 'epoch': 1.22} {'loss': 0.2679, 'learning_rate': 6.976239889078432e-06, 'epoch': 1.22} {'loss': 0.4669, 'learning_rate': 6.975919640672828e-06, 'epoch': 1.22} {'loss': 0.222, 'learning_rate': 6.975599395680834e-06, 'epoch': 1.22} {'loss': 0.2845, 'learning_rate': 6.975279154102814e-06, 'epoch': 1.22} {'loss': 0.3685, 'learning_rate': 6.974958915939129e-06, 'epoch': 1.22} {'loss': 0.3549, 'learning_rate': 6.974638681190139e-06, 'epoch': 1.22} {'loss': 0.3864, 'learning_rate': 6.974318449856208e-06, 'epoch': 1.22} {'loss': 0.5274, 'learning_rate': 6.973998221937694e-06, 'epoch': 1.22} {'loss': 0.3788, 'learning_rate': 6.973677997434962e-06, 'epoch': 1.22} {'loss': 0.2222, 'learning_rate': 6.9733577763483755e-06, 'epoch': 1.22} {'loss': 0.2999, 'learning_rate': 6.973037558678288e-06, 'epoch': 1.22} {'loss': 0.3811, 'learning_rate': 6.972717344425067e-06, 'epoch': 1.22} {'loss': 0.3408, 'learning_rate': 6.9723971335890725e-06, 'epoch': 1.22} {'loss': 0.2994, 'learning_rate': 6.972076926170665e-06, 'epoch': 1.22} {'loss': 0.2398, 'learning_rate': 6.971756722170207e-06, 'epoch': 1.22} {'loss': 0.4343, 'learning_rate': 6.971436521588061e-06, 'epoch': 1.22} {'loss': 0.3923, 'learning_rate': 6.9711163244245875e-06, 'epoch': 1.22} {'loss': 0.3709, 'learning_rate': 6.970796130680147e-06, 'epoch': 1.22} {'loss': 0.2331, 'learning_rate': 6.970475940355099e-06, 'epoch': 1.22} {'loss': 0.2979, 'learning_rate': 6.97015575344981e-06, 'epoch': 1.22} {'loss': 0.3085, 'learning_rate': 6.96983556996464e-06, 'epoch': 1.22} {'loss': 0.2583, 'learning_rate': 6.969515389899948e-06, 'epoch': 1.22} {'loss': 0.3545, 'learning_rate': 6.969195213256099e-06, 'epoch': 1.22} {'loss': 0.3241, 'learning_rate': 6.968875040033451e-06, 'epoch': 1.22} {'loss': 0.2795, 'learning_rate': 6.9685548702323645e-06, 'epoch': 1.22} {'loss': 0.3233, 'learning_rate': 6.968234703853205e-06, 'epoch': 1.22} {'loss': 0.327, 'learning_rate': 6.967914540896332e-06, 'epoch': 1.22} {'loss': 0.392, 'learning_rate': 6.9675943813621064e-06, 'epoch': 1.22} {'loss': 0.4371, 'learning_rate': 6.9672742252508905e-06, 'epoch': 1.22} {'loss': 0.2028, 'learning_rate': 6.9669540725630455e-06, 'epoch': 1.22} {'loss': 0.3894, 'learning_rate': 6.966633923298932e-06, 'epoch': 1.22} {'loss': 0.3704, 'learning_rate': 6.966313777458913e-06, 'epoch': 1.22} {'loss': 0.2899, 'learning_rate': 6.965993635043347e-06, 'epoch': 1.22} {'loss': 0.2335, 'learning_rate': 6.965673496052599e-06, 'epoch': 1.22} {'loss': 0.349, 'learning_rate': 6.9653533604870275e-06, 'epoch': 1.22} {'loss': 0.3542, 'learning_rate': 6.965033228346998e-06, 'epoch': 1.22} {'loss': 0.3305, 'learning_rate': 6.964713099632865e-06, 'epoch': 1.22} {'loss': 0.304, 'learning_rate': 6.9643929743449956e-06, 'epoch': 1.22} {'loss': 0.3706, 'learning_rate': 6.964072852483748e-06, 'epoch': 1.22} {'loss': 0.3651, 'learning_rate': 6.963752734049481e-06, 'epoch': 1.22} {'loss': 0.4333, 'learning_rate': 6.963432619042565e-06, 'epoch': 1.22} {'loss': 0.344, 'learning_rate': 6.963112507463355e-06, 'epoch': 1.22} {'loss': 0.4455, 'learning_rate': 6.962792399312215e-06, 'epoch': 1.22} {'loss': 0.35, 'learning_rate': 6.962472294589505e-06, 'epoch': 1.22} {'loss': 0.4037, 'learning_rate': 6.9621521932955846e-06, 'epoch': 1.22} {'loss': 0.3758, 'learning_rate': 6.961832095430817e-06, 'epoch': 1.22} {'loss': 0.1395, 'learning_rate': 6.961512000995564e-06, 'epoch': 1.22} {'loss': 0.3112, 'learning_rate': 6.961191909990185e-06, 'epoch': 1.22} {'loss': 0.2267, 'learning_rate': 6.960871822415043e-06, 'epoch': 1.22} {'loss': 0.4218, 'learning_rate': 6.960551738270498e-06, 'epoch': 1.22} {'loss': 0.334, 'learning_rate': 6.960231657556913e-06, 'epoch': 1.22} {'loss': 0.2774, 'learning_rate': 6.959911580274649e-06, 'epoch': 1.22} {'loss': 0.2544, 'learning_rate': 6.959591506424066e-06, 'epoch': 1.22} {'loss': 0.2635, 'learning_rate': 6.959271436005526e-06, 'epoch': 1.22} {'loss': 0.3148, 'learning_rate': 6.9589513690193885e-06, 'epoch': 1.22} {'loss': 0.2283, 'learning_rate': 6.958631305466019e-06, 'epoch': 1.22} {'loss': 0.2812, 'learning_rate': 6.958311245345779e-06, 'epoch': 1.22} {'loss': 0.3791, 'learning_rate': 6.957991188659024e-06, 'epoch': 1.22} {'loss': 0.3367, 'learning_rate': 6.957671135406118e-06, 'epoch': 1.22} {'loss': 0.3452, 'learning_rate': 6.957351085587422e-06, 'epoch': 1.22} {'loss': 0.3557, 'learning_rate': 6.9570310392033e-06, 'epoch': 1.22} {'loss': 0.3637, 'learning_rate': 6.956710996254111e-06, 'epoch': 1.22} {'loss': 0.2354, 'learning_rate': 6.956390956740215e-06, 'epoch': 1.22} {'loss': 0.3111, 'learning_rate': 6.956070920661977e-06, 'epoch': 1.22} {'loss': 0.2741, 'learning_rate': 6.9557508880197555e-06, 'epoch': 1.22} {'loss': 0.2515, 'learning_rate': 6.955430858813912e-06, 'epoch': 1.22} {'loss': 0.3486, 'learning_rate': 6.955110833044808e-06, 'epoch': 1.22} {'loss': 0.3126, 'learning_rate': 6.954790810712805e-06, 'epoch': 1.22} {'loss': 0.3815, 'learning_rate': 6.954470791818264e-06, 'epoch': 1.22} {'loss': 0.3805, 'learning_rate': 6.954150776361548e-06, 'epoch': 1.22} {'loss': 0.3516, 'learning_rate': 6.953830764343015e-06, 'epoch': 1.22} {'loss': 0.3875, 'learning_rate': 6.953510755763029e-06, 'epoch': 1.22} {'loss': 0.3958, 'learning_rate': 6.953190750621948e-06, 'epoch': 1.22} {'loss': 0.475, 'learning_rate': 6.952870748920136e-06, 'epoch': 1.22} {'loss': 0.3747, 'learning_rate': 6.952550750657954e-06, 'epoch': 1.22} {'loss': 0.346, 'learning_rate': 6.952230755835762e-06, 'epoch': 1.22} {'loss': 0.3118, 'learning_rate': 6.9519107644539215e-06, 'epoch': 1.22} {'loss': 0.3291, 'learning_rate': 6.9515907765127955e-06, 'epoch': 1.22} {'loss': 0.5049, 'learning_rate': 6.951270792012743e-06, 'epoch': 1.22} {'loss': 0.3807, 'learning_rate': 6.950950810954127e-06, 'epoch': 1.22} {'loss': 0.2665, 'learning_rate': 6.950630833337307e-06, 'epoch': 1.22} {'loss': 0.3074, 'learning_rate': 6.950310859162644e-06, 'epoch': 1.22} {'loss': 0.2419, 'learning_rate': 6.949990888430503e-06, 'epoch': 1.22} {'loss': 0.414, 'learning_rate': 6.949670921141241e-06, 'epoch': 1.22} {'loss': 0.3609, 'learning_rate': 6.949350957295219e-06, 'epoch': 1.22} {'loss': 0.3432, 'learning_rate': 6.949030996892801e-06, 'epoch': 1.22} {'loss': 0.2839, 'learning_rate': 6.948711039934346e-06, 'epoch': 1.22} {'loss': 0.5017, 'learning_rate': 6.948391086420217e-06, 'epoch': 1.22} {'loss': 0.3699, 'learning_rate': 6.948071136350772e-06, 'epoch': 1.22} {'loss': 0.2176, 'learning_rate': 6.947751189726376e-06, 'epoch': 1.22} {'loss': 0.2509, 'learning_rate': 6.947431246547389e-06, 'epoch': 1.22} {'loss': 0.3519, 'learning_rate': 6.947111306814171e-06, 'epoch': 1.22} {'loss': 0.4138, 'learning_rate': 6.946791370527083e-06, 'epoch': 1.22} {'loss': 0.2397, 'learning_rate': 6.946471437686488e-06, 'epoch': 1.22} {'loss': 0.442, 'learning_rate': 6.946151508292745e-06, 'epoch': 1.22} {'loss': 0.3385, 'learning_rate': 6.94583158234622e-06, 'epoch': 1.22} {'loss': 0.2022, 'learning_rate': 6.945511659847266e-06, 'epoch': 1.22} {'loss': 0.3307, 'learning_rate': 6.945191740796251e-06, 'epoch': 1.22} {'loss': 0.3003, 'learning_rate': 6.944871825193532e-06, 'epoch': 1.22} {'loss': 0.4022, 'learning_rate': 6.9445519130394725e-06, 'epoch': 1.22} {'loss': 0.3801, 'learning_rate': 6.944232004334432e-06, 'epoch': 1.22} {'loss': 0.2361, 'learning_rate': 6.943912099078774e-06, 'epoch': 1.22} {'loss': 0.3256, 'learning_rate': 6.943592197272857e-06, 'epoch': 1.22} {'loss': 0.5251, 'learning_rate': 6.943272298917043e-06, 'epoch': 1.22} {'loss': 0.3557, 'learning_rate': 6.942952404011693e-06, 'epoch': 1.22} {'loss': 0.3488, 'learning_rate': 6.94263251255717e-06, 'epoch': 1.22} {'loss': 0.3225, 'learning_rate': 6.942312624553833e-06, 'epoch': 1.22} {'loss': 0.3893, 'learning_rate': 6.941992740002042e-06, 'epoch': 1.22} {'loss': 0.3697, 'learning_rate': 6.941672858902162e-06, 'epoch': 1.22} {'loss': 0.352, 'learning_rate': 6.941352981254552e-06, 'epoch': 1.22} {'loss': 0.3023, 'learning_rate': 6.941033107059572e-06, 'epoch': 1.22} {'loss': 0.2768, 'learning_rate': 6.940713236317584e-06, 'epoch': 1.22} {'loss': 0.1609, 'learning_rate': 6.940393369028948e-06, 'epoch': 1.22} {'loss': 0.2931, 'learning_rate': 6.940073505194026e-06, 'epoch': 1.22} {'loss': 0.3183, 'learning_rate': 6.93975364481318e-06, 'epoch': 1.22} {'loss': 0.2679, 'learning_rate': 6.939433787886769e-06, 'epoch': 1.22} {'loss': 0.2036, 'learning_rate': 6.939113934415157e-06, 'epoch': 1.22} {'loss': 0.3274, 'learning_rate': 6.938794084398702e-06, 'epoch': 1.22} {'loss': 0.3383, 'learning_rate': 6.938474237837767e-06, 'epoch': 1.22} {'loss': 0.2716, 'learning_rate': 6.938154394732713e-06, 'epoch': 1.22} {'loss': 0.1836, 'learning_rate': 6.9378345550839e-06, 'epoch': 1.22} {'loss': 0.419, 'learning_rate': 6.937514718891689e-06, 'epoch': 1.22} {'loss': 0.2821, 'learning_rate': 6.937194886156443e-06, 'epoch': 1.22} {'loss': 0.2694, 'learning_rate': 6.93687505687852e-06, 'epoch': 1.22} {'loss': 0.4419, 'learning_rate': 6.936555231058284e-06, 'epoch': 1.22} {'loss': 0.3266, 'learning_rate': 6.936235408696093e-06, 'epoch': 1.22} {'loss': 0.396, 'learning_rate': 6.93591558979231e-06, 'epoch': 1.22} {'loss': 0.2842, 'learning_rate': 6.935595774347295e-06, 'epoch': 1.22} {'loss': 0.3493, 'learning_rate': 6.9352759623614105e-06, 'epoch': 1.22} {'loss': 0.4904, 'learning_rate': 6.934956153835017e-06, 'epoch': 1.22} {'loss': 0.3761, 'learning_rate': 6.934636348768475e-06, 'epoch': 1.22} {'loss': 0.4517, 'learning_rate': 6.934316547162146e-06, 'epoch': 1.22} {'loss': 0.2584, 'learning_rate': 6.933996749016388e-06, 'epoch': 1.22} {'loss': 0.3696, 'learning_rate': 6.933676954331567e-06, 'epoch': 1.22} {'loss': 0.3217, 'learning_rate': 6.933357163108041e-06, 'epoch': 1.22} {'loss': 0.2876, 'learning_rate': 6.933037375346174e-06, 'epoch': 1.22} {'loss': 0.231, 'learning_rate': 6.932717591046323e-06, 'epoch': 1.22} {'loss': 0.2345, 'learning_rate': 6.932397810208851e-06, 'epoch': 1.22} {'loss': 0.3865, 'learning_rate': 6.9320780328341166e-06, 'epoch': 1.22} {'loss': 0.3931, 'learning_rate': 6.9317582589224784e-06, 'epoch': 1.22} {'loss': 0.1862, 'learning_rate': 6.931438488474308e-06, 'epoch': 1.22} {'loss': 0.1526, 'learning_rate': 6.931118721489959e-06, 'epoch': 1.22} {'loss': 0.2564, 'learning_rate': 6.930798957969795e-06, 'epoch': 1.22} {'loss': 0.45, 'learning_rate': 6.930479197914174e-06, 'epoch': 1.22} {'loss': 0.3148, 'learning_rate': 6.930159441323459e-06, 'epoch': 1.22} {'loss': 0.4028, 'learning_rate': 6.929839688198008e-06, 'epoch': 1.22} {'loss': 0.1982, 'learning_rate': 6.929519938538185e-06, 'epoch': 1.22} {'loss': 0.1811, 'learning_rate': 6.929200192344351e-06, 'epoch': 1.22} {'loss': 0.2777, 'learning_rate': 6.928880449616866e-06, 'epoch': 1.22} {'loss': 0.3104, 'learning_rate': 6.92856071035609e-06, 'epoch': 1.22} {'loss': 0.2669, 'learning_rate': 6.928240974562386e-06, 'epoch': 1.22} {'loss': 0.2499, 'learning_rate': 6.927921242236113e-06, 'epoch': 1.22} {'loss': 0.3532, 'learning_rate': 6.927601513377633e-06, 'epoch': 1.22} {'loss': 0.3417, 'learning_rate': 6.927281787987306e-06, 'epoch': 1.22} {'loss': 0.2807, 'learning_rate': 6.9269620660654944e-06, 'epoch': 1.22} {'loss': 0.2154, 'learning_rate': 6.92664234761256e-06, 'epoch': 1.22} {'loss': 0.3964, 'learning_rate': 6.92632263262886e-06, 'epoch': 1.22} {'loss': 0.3987, 'learning_rate': 6.926002921114759e-06, 'epoch': 1.22} {'loss': 0.3356, 'learning_rate': 6.925683213070613e-06, 'epoch': 1.22} {'loss': 0.3395, 'learning_rate': 6.925363508496787e-06, 'epoch': 1.22} {'loss': 0.4288, 'learning_rate': 6.925043807393641e-06, 'epoch': 1.22} {'loss': 0.4462, 'learning_rate': 6.924724109761537e-06, 'epoch': 1.22} {'loss': 0.4377, 'learning_rate': 6.924404415600834e-06, 'epoch': 1.22} {'loss': 0.3072, 'learning_rate': 6.924084724911894e-06, 'epoch': 1.22} {'loss': 0.2327, 'learning_rate': 6.923765037695076e-06, 'epoch': 1.22} {'loss': 0.2588, 'learning_rate': 6.923445353950744e-06, 'epoch': 1.22} {'loss': 0.3307, 'learning_rate': 6.923125673679256e-06, 'epoch': 1.22} {'loss': 0.4096, 'learning_rate': 6.922805996880975e-06, 'epoch': 1.22} {'loss': 0.3168, 'learning_rate': 6.922486323556259e-06, 'epoch': 1.22} {'loss': 0.3553, 'learning_rate': 6.922166653705475e-06, 'epoch': 1.22} {'loss': 0.3031, 'learning_rate': 6.921846987328976e-06, 'epoch': 1.22} {'loss': 0.2968, 'learning_rate': 6.921527324427127e-06, 'epoch': 1.22} {'loss': 0.3594, 'learning_rate': 6.921207665000288e-06, 'epoch': 1.22} {'loss': 0.3822, 'learning_rate': 6.9208880090488206e-06, 'epoch': 1.22} {'loss': 0.3013, 'learning_rate': 6.920568356573085e-06, 'epoch': 1.22} {'loss': 0.3113, 'learning_rate': 6.920248707573441e-06, 'epoch': 1.22} {'loss': 0.394, 'learning_rate': 6.919929062050252e-06, 'epoch': 1.22} {'loss': 0.2904, 'learning_rate': 6.9196094200038765e-06, 'epoch': 1.22} {'loss': 0.2256, 'learning_rate': 6.919289781434677e-06, 'epoch': 1.22} {'loss': 0.2745, 'learning_rate': 6.918970146343014e-06, 'epoch': 1.22} {'loss': 0.2698, 'learning_rate': 6.918650514729246e-06, 'epoch': 1.22} {'loss': 0.192, 'learning_rate': 6.918330886593737e-06, 'epoch': 1.22} {'loss': 0.392, 'learning_rate': 6.918011261936848e-06, 'epoch': 1.22} {'loss': 0.4987, 'learning_rate': 6.9176916407589365e-06, 'epoch': 1.22} {'loss': 0.325, 'learning_rate': 6.9173720230603645e-06, 'epoch': 1.22} {'loss': 0.3551, 'learning_rate': 6.917052408841494e-06, 'epoch': 1.22} {'loss': 0.3982, 'learning_rate': 6.916732798102683e-06, 'epoch': 1.22} {'loss': 0.3849, 'learning_rate': 6.916413190844298e-06, 'epoch': 1.22} {'loss': 0.2463, 'learning_rate': 6.916093587066692e-06, 'epoch': 1.22} {'loss': 0.3308, 'learning_rate': 6.9157739867702335e-06, 'epoch': 1.22} {'loss': 0.1715, 'learning_rate': 6.915454389955278e-06, 'epoch': 1.22} {'loss': 0.3065, 'learning_rate': 6.915134796622187e-06, 'epoch': 1.22} {'loss': 0.3133, 'learning_rate': 6.914815206771324e-06, 'epoch': 1.22} {'loss': 0.2557, 'learning_rate': 6.914495620403048e-06, 'epoch': 1.22} {'loss': 0.299, 'learning_rate': 6.914176037517719e-06, 'epoch': 1.22} {'loss': 0.321, 'learning_rate': 6.9138564581157e-06, 'epoch': 1.22} {'loss': 0.3032, 'learning_rate': 6.913536882197349e-06, 'epoch': 1.22} {'loss': 0.4113, 'learning_rate': 6.913217309763027e-06, 'epoch': 1.22} {'loss': 0.5174, 'learning_rate': 6.912897740813096e-06, 'epoch': 1.22} {'loss': 0.3044, 'learning_rate': 6.912578175347917e-06, 'epoch': 1.22} {'loss': 0.205, 'learning_rate': 6.912258613367851e-06, 'epoch': 1.22} {'loss': 0.3926, 'learning_rate': 6.911939054873256e-06, 'epoch': 1.22} {'loss': 0.2898, 'learning_rate': 6.911619499864495e-06, 'epoch': 1.22} {'loss': 0.3432, 'learning_rate': 6.911299948341928e-06, 'epoch': 1.22} {'loss': 0.4251, 'learning_rate': 6.910980400305917e-06, 'epoch': 1.22} {'loss': 0.3444, 'learning_rate': 6.910660855756821e-06, 'epoch': 1.22} {'loss': 0.1776, 'learning_rate': 6.910341314695002e-06, 'epoch': 1.22} {'loss': 0.4215, 'learning_rate': 6.91002177712082e-06, 'epoch': 1.22} {'loss': 0.2145, 'learning_rate': 6.909702243034638e-06, 'epoch': 1.22} {'loss': 0.4184, 'learning_rate': 6.909382712436812e-06, 'epoch': 1.22} {'loss': 0.5094, 'learning_rate': 6.909063185327705e-06, 'epoch': 1.22} {'loss': 0.4174, 'learning_rate': 6.9087436617076786e-06, 'epoch': 1.22} {'loss': 0.3197, 'learning_rate': 6.908424141577093e-06, 'epoch': 1.22} {'loss': 0.3544, 'learning_rate': 6.9081046249363075e-06, 'epoch': 1.22} {'loss': 0.3052, 'learning_rate': 6.907785111785685e-06, 'epoch': 1.23} {'loss': 0.3311, 'learning_rate': 6.907465602125585e-06, 'epoch': 1.23} {'loss': 0.2849, 'learning_rate': 6.9071460959563675e-06, 'epoch': 1.23} {'loss': 0.3813, 'learning_rate': 6.906826593278395e-06, 'epoch': 1.23} {'loss': 0.2265, 'learning_rate': 6.9065070940920254e-06, 'epoch': 1.23} {'loss': 0.4297, 'learning_rate': 6.906187598397622e-06, 'epoch': 1.23} {'loss': 0.1931, 'learning_rate': 6.9058681061955456e-06, 'epoch': 1.23} {'loss': 0.4285, 'learning_rate': 6.905548617486156e-06, 'epoch': 1.23} {'loss': 0.1862, 'learning_rate': 6.905229132269813e-06, 'epoch': 1.23} {'loss': 0.3143, 'learning_rate': 6.904909650546876e-06, 'epoch': 1.23} {'loss': 0.456, 'learning_rate': 6.904590172317709e-06, 'epoch': 1.23} {'loss': 0.3993, 'learning_rate': 6.9042706975826714e-06, 'epoch': 1.23} {'loss': 0.5083, 'learning_rate': 6.903951226342123e-06, 'epoch': 1.23} {'loss': 0.5064, 'learning_rate': 6.903631758596423e-06, 'epoch': 1.23} {'loss': 0.4401, 'learning_rate': 6.903312294345936e-06, 'epoch': 1.23} {'loss': 0.4167, 'learning_rate': 6.90299283359102e-06, 'epoch': 1.23} {'loss': 0.2622, 'learning_rate': 6.902673376332036e-06, 'epoch': 1.23} {'loss': 0.4389, 'learning_rate': 6.902353922569346e-06, 'epoch': 1.23} {'loss': 0.32, 'learning_rate': 6.902034472303308e-06, 'epoch': 1.23} {'loss': 0.3129, 'learning_rate': 6.901715025534285e-06, 'epoch': 1.23} {'loss': 0.3138, 'learning_rate': 6.901395582262638e-06, 'epoch': 1.23} {'loss': 0.2856, 'learning_rate': 6.901076142488724e-06, 'epoch': 1.23} {'loss': 0.2887, 'learning_rate': 6.9007567062129055e-06, 'epoch': 1.23} {'loss': 0.3317, 'learning_rate': 6.900437273435544e-06, 'epoch': 1.23} {'loss': 0.2666, 'learning_rate': 6.900117844156995e-06, 'epoch': 1.23} {'loss': 0.3474, 'learning_rate': 6.899798418377628e-06, 'epoch': 1.23} {'loss': 0.4254, 'learning_rate': 6.899478996097798e-06, 'epoch': 1.23} {'loss': 0.3943, 'learning_rate': 6.899159577317868e-06, 'epoch': 1.23} {'loss': 0.3361, 'learning_rate': 6.898840162038198e-06, 'epoch': 1.23} {'loss': 0.2572, 'learning_rate': 6.8985207502591465e-06, 'epoch': 1.23} {'loss': 0.3107, 'learning_rate': 6.898201341981074e-06, 'epoch': 1.23} {'loss': 0.2613, 'learning_rate': 6.897881937204345e-06, 'epoch': 1.23} {'loss': 0.3014, 'learning_rate': 6.897562535929315e-06, 'epoch': 1.23} {'loss': 0.3397, 'learning_rate': 6.897243138156349e-06, 'epoch': 1.23} {'loss': 0.2264, 'learning_rate': 6.896923743885804e-06, 'epoch': 1.23} {'loss': 0.2299, 'learning_rate': 6.896604353118042e-06, 'epoch': 1.23} {'loss': 0.346, 'learning_rate': 6.896284965853424e-06, 'epoch': 1.23} {'loss': 0.3305, 'learning_rate': 6.895965582092309e-06, 'epoch': 1.23} {'loss': 0.2735, 'learning_rate': 6.89564620183506e-06, 'epoch': 1.23} {'loss': 0.2619, 'learning_rate': 6.895326825082035e-06, 'epoch': 1.23} {'loss': 0.2697, 'learning_rate': 6.8950074518335965e-06, 'epoch': 1.23} {'loss': 0.4025, 'learning_rate': 6.8946880820901065e-06, 'epoch': 1.23} {'loss': 0.4077, 'learning_rate': 6.89436871585192e-06, 'epoch': 1.23} {'loss': 0.5861, 'learning_rate': 6.8940493531194005e-06, 'epoch': 1.23} {'loss': 0.1899, 'learning_rate': 6.89372999389291e-06, 'epoch': 1.23} {'loss': 0.4202, 'learning_rate': 6.893410638172806e-06, 'epoch': 1.23} {'loss': 0.4569, 'learning_rate': 6.893091285959453e-06, 'epoch': 1.23} {'loss': 0.2563, 'learning_rate': 6.8927719372532066e-06, 'epoch': 1.23} {'loss': 0.4143, 'learning_rate': 6.892452592054432e-06, 'epoch': 1.23} {'loss': 0.3328, 'learning_rate': 6.892133250363486e-06, 'epoch': 1.23} {'loss': 0.3216, 'learning_rate': 6.891813912180732e-06, 'epoch': 1.23} {'loss': 0.3873, 'learning_rate': 6.891494577506527e-06, 'epoch': 1.23} {'loss': 0.3623, 'learning_rate': 6.891175246341235e-06, 'epoch': 1.23} {'loss': 0.4467, 'learning_rate': 6.890855918685214e-06, 'epoch': 1.23} {'loss': 0.2564, 'learning_rate': 6.890536594538828e-06, 'epoch': 1.23} {'loss': 0.2802, 'learning_rate': 6.890217273902433e-06, 'epoch': 1.23} {'loss': 0.2817, 'learning_rate': 6.889897956776391e-06, 'epoch': 1.23} {'loss': 0.3903, 'learning_rate': 6.889578643161063e-06, 'epoch': 1.23} {'loss': 0.3753, 'learning_rate': 6.8892593330568105e-06, 'epoch': 1.23} {'loss': 0.1499, 'learning_rate': 6.888940026463991e-06, 'epoch': 1.23} {'loss': 0.2259, 'learning_rate': 6.888620723382966e-06, 'epoch': 1.23} {'loss': 0.3205, 'learning_rate': 6.888301423814099e-06, 'epoch': 1.23} {'loss': 0.3855, 'learning_rate': 6.887982127757746e-06, 'epoch': 1.23} {'loss': 0.4075, 'learning_rate': 6.887662835214271e-06, 'epoch': 1.23} {'loss': 0.2692, 'learning_rate': 6.887343546184031e-06, 'epoch': 1.23} {'loss': 0.2408, 'learning_rate': 6.887024260667389e-06, 'epoch': 1.23} {'loss': 0.3146, 'learning_rate': 6.8867049786647046e-06, 'epoch': 1.23} {'loss': 0.4973, 'learning_rate': 6.8863857001763405e-06, 'epoch': 1.23} {'loss': 0.3316, 'learning_rate': 6.886066425202653e-06, 'epoch': 1.23} {'loss': 0.2915, 'learning_rate': 6.8857471537440035e-06, 'epoch': 1.23} {'loss': 0.3657, 'learning_rate': 6.885427885800754e-06, 'epoch': 1.23} {'loss': 0.4388, 'learning_rate': 6.885108621373264e-06, 'epoch': 1.23} {'loss': 0.314, 'learning_rate': 6.884789360461894e-06, 'epoch': 1.23} {'loss': 0.3029, 'learning_rate': 6.884470103067005e-06, 'epoch': 1.23} {'loss': 0.5099, 'learning_rate': 6.884150849188955e-06, 'epoch': 1.23} {'loss': 0.3381, 'learning_rate': 6.883831598828108e-06, 'epoch': 1.23} {'loss': 0.3198, 'learning_rate': 6.883512351984822e-06, 'epoch': 1.23} {'loss': 0.2898, 'learning_rate': 6.883193108659458e-06, 'epoch': 1.23} {'loss': 0.3751, 'learning_rate': 6.8828738688523755e-06, 'epoch': 1.23} {'loss': 0.2804, 'learning_rate': 6.882554632563937e-06, 'epoch': 1.23} {'loss': 0.3444, 'learning_rate': 6.8822353997945035e-06, 'epoch': 1.23} {'loss': 0.2187, 'learning_rate': 6.8819161705444306e-06, 'epoch': 1.23} {'loss': 0.1905, 'learning_rate': 6.881596944814082e-06, 'epoch': 1.23} {'loss': 0.4073, 'learning_rate': 6.881277722603817e-06, 'epoch': 1.23} {'loss': 0.2457, 'learning_rate': 6.880958503913996e-06, 'epoch': 1.23} {'loss': 0.3474, 'learning_rate': 6.88063928874498e-06, 'epoch': 1.23} {'loss': 0.2721, 'learning_rate': 6.880320077097129e-06, 'epoch': 1.23} {'loss': 0.3668, 'learning_rate': 6.880000868970804e-06, 'epoch': 1.23} {'loss': 0.3776, 'learning_rate': 6.8796816643663646e-06, 'epoch': 1.23} {'loss': 0.2656, 'learning_rate': 6.879362463284171e-06, 'epoch': 1.23} {'loss': 0.2601, 'learning_rate': 6.879043265724583e-06, 'epoch': 1.23} {'loss': 0.1597, 'learning_rate': 6.878724071687963e-06, 'epoch': 1.23} {'loss': 0.2757, 'learning_rate': 6.8784048811746695e-06, 'epoch': 1.23} {'loss': 0.2728, 'learning_rate': 6.878085694185066e-06, 'epoch': 1.23} {'loss': 0.2735, 'learning_rate': 6.877766510719506e-06, 'epoch': 1.23} {'loss': 0.474, 'learning_rate': 6.8774473307783555e-06, 'epoch': 1.23} {'loss': 0.3912, 'learning_rate': 6.877128154361974e-06, 'epoch': 1.23} {'loss': 0.1922, 'learning_rate': 6.876808981470719e-06, 'epoch': 1.23} {'loss': 0.4256, 'learning_rate': 6.876489812104954e-06, 'epoch': 1.23} {'loss': 0.2568, 'learning_rate': 6.8761706462650366e-06, 'epoch': 1.23} {'loss': 0.2183, 'learning_rate': 6.87585148395133e-06, 'epoch': 1.23} {'loss': 0.238, 'learning_rate': 6.875532325164192e-06, 'epoch': 1.23} {'loss': 0.2621, 'learning_rate': 6.8752131699039845e-06, 'epoch': 1.23} {'loss': 0.2969, 'learning_rate': 6.874894018171068e-06, 'epoch': 1.23} {'loss': 0.1962, 'learning_rate': 6.8745748699658e-06, 'epoch': 1.23} {'loss': 0.4241, 'learning_rate': 6.874255725288544e-06, 'epoch': 1.23} {'loss': 0.3077, 'learning_rate': 6.8739365841396614e-06, 'epoch': 1.23} {'loss': 0.3946, 'learning_rate': 6.873617446519507e-06, 'epoch': 1.23} {'loss': 0.2765, 'learning_rate': 6.873298312428443e-06, 'epoch': 1.23} {'loss': 0.3042, 'learning_rate': 6.872979181866832e-06, 'epoch': 1.23} {'loss': 0.4296, 'learning_rate': 6.872660054835032e-06, 'epoch': 1.23} {'loss': 0.363, 'learning_rate': 6.8723409313334055e-06, 'epoch': 1.23} {'loss': 0.3618, 'learning_rate': 6.872021811362311e-06, 'epoch': 1.23} {'loss': 0.2571, 'learning_rate': 6.871702694922108e-06, 'epoch': 1.23} {'loss': 0.3578, 'learning_rate': 6.871383582013158e-06, 'epoch': 1.23} {'loss': 0.3341, 'learning_rate': 6.871064472635822e-06, 'epoch': 1.23} {'loss': 0.2675, 'learning_rate': 6.870745366790458e-06, 'epoch': 1.23} {'loss': 0.2744, 'learning_rate': 6.8704262644774275e-06, 'epoch': 1.23} {'loss': 0.373, 'learning_rate': 6.8701071656970905e-06, 'epoch': 1.23} {'loss': 0.4576, 'learning_rate': 6.869788070449808e-06, 'epoch': 1.23} {'loss': 0.4365, 'learning_rate': 6.869468978735943e-06, 'epoch': 1.23} {'loss': 0.3326, 'learning_rate': 6.869149890555849e-06, 'epoch': 1.23} {'loss': 0.3569, 'learning_rate': 6.868830805909889e-06, 'epoch': 1.23} {'loss': 0.2519, 'learning_rate': 6.868511724798419e-06, 'epoch': 1.23} {'loss': 0.3547, 'learning_rate': 6.868192647221809e-06, 'epoch': 1.23} {'loss': 0.344, 'learning_rate': 6.867873573180413e-06, 'epoch': 1.23} {'loss': 0.1799, 'learning_rate': 6.867554502674592e-06, 'epoch': 1.23} {'loss': 0.3441, 'learning_rate': 6.8672354357047085e-06, 'epoch': 1.23} {'loss': 0.1565, 'learning_rate': 6.86691637227112e-06, 'epoch': 1.23} {'loss': 0.3455, 'learning_rate': 6.866597312374186e-06, 'epoch': 1.23} {'loss': 0.4043, 'learning_rate': 6.866278256014267e-06, 'epoch': 1.23} {'loss': 0.2996, 'learning_rate': 6.865959203191725e-06, 'epoch': 1.23} {'loss': 0.4742, 'learning_rate': 6.865640153906918e-06, 'epoch': 1.23} {'loss': 0.3306, 'learning_rate': 6.865321108160209e-06, 'epoch': 1.23} {'loss': 0.4454, 'learning_rate': 6.8650020659519554e-06, 'epoch': 1.23} {'loss': 0.4323, 'learning_rate': 6.8646830272825186e-06, 'epoch': 1.23} {'loss': 0.3012, 'learning_rate': 6.864363992152259e-06, 'epoch': 1.23} {'loss': 0.399, 'learning_rate': 6.864044960561535e-06, 'epoch': 1.23} {'loss': 0.2867, 'learning_rate': 6.863725932510707e-06, 'epoch': 1.23} {'loss': 0.2772, 'learning_rate': 6.863406908000138e-06, 'epoch': 1.23} {'loss': 0.2486, 'learning_rate': 6.863087887030188e-06, 'epoch': 1.23} {'loss': 0.3345, 'learning_rate': 6.862768869601213e-06, 'epoch': 1.23} {'loss': 0.3325, 'learning_rate': 6.862449855713575e-06, 'epoch': 1.23} {'loss': 0.3, 'learning_rate': 6.862130845367634e-06, 'epoch': 1.23} {'loss': 0.2932, 'learning_rate': 6.861811838563752e-06, 'epoch': 1.23} {'loss': 0.239, 'learning_rate': 6.8614928353022855e-06, 'epoch': 1.23} {'loss': 0.3225, 'learning_rate': 6.861173835583599e-06, 'epoch': 1.23} {'loss': 0.3835, 'learning_rate': 6.860854839408049e-06, 'epoch': 1.23} {'loss': 0.4066, 'learning_rate': 6.860535846775998e-06, 'epoch': 1.23} {'loss': 0.2424, 'learning_rate': 6.860216857687805e-06, 'epoch': 1.23} {'loss': 0.3147, 'learning_rate': 6.859897872143829e-06, 'epoch': 1.23} {'loss': 0.3182, 'learning_rate': 6.859578890144432e-06, 'epoch': 1.23} {'loss': 0.3061, 'learning_rate': 6.859259911689972e-06, 'epoch': 1.23} {'loss': 0.4028, 'learning_rate': 6.858940936780814e-06, 'epoch': 1.23} {'loss': 0.1883, 'learning_rate': 6.858621965417312e-06, 'epoch': 1.23} {'loss': 0.4544, 'learning_rate': 6.858302997599829e-06, 'epoch': 1.23} {'loss': 0.2483, 'learning_rate': 6.857984033328723e-06, 'epoch': 1.23} {'loss': 0.2462, 'learning_rate': 6.857665072604356e-06, 'epoch': 1.23} {'loss': 0.2523, 'learning_rate': 6.8573461154270885e-06, 'epoch': 1.23} {'loss': 0.2794, 'learning_rate': 6.8570271617972786e-06, 'epoch': 1.23} {'loss': 0.2558, 'learning_rate': 6.856708211715288e-06, 'epoch': 1.23} {'loss': 0.3079, 'learning_rate': 6.8563892651814756e-06, 'epoch': 1.23} {'loss': 0.3674, 'learning_rate': 6.8560703221962025e-06, 'epoch': 1.23} {'loss': 0.3799, 'learning_rate': 6.855751382759828e-06, 'epoch': 1.23} {'loss': 0.4459, 'learning_rate': 6.855432446872711e-06, 'epoch': 1.23} {'loss': 0.4377, 'learning_rate': 6.855113514535214e-06, 'epoch': 1.23} {'loss': 0.4871, 'learning_rate': 6.854794585747698e-06, 'epoch': 1.23} {'loss': 0.3721, 'learning_rate': 6.854475660510519e-06, 'epoch': 1.23} {'loss': 0.3933, 'learning_rate': 6.8541567388240385e-06, 'epoch': 1.23} {'loss': 0.3327, 'learning_rate': 6.853837820688616e-06, 'epoch': 1.23} {'loss': 0.3288, 'learning_rate': 6.853518906104612e-06, 'epoch': 1.23} {'loss': 0.4208, 'learning_rate': 6.853199995072389e-06, 'epoch': 1.23} {'loss': 0.2846, 'learning_rate': 6.8528810875923045e-06, 'epoch': 1.23} {'loss': 0.4287, 'learning_rate': 6.8525621836647176e-06, 'epoch': 1.23} {'loss': 0.2229, 'learning_rate': 6.85224328328999e-06, 'epoch': 1.23} {'loss': 0.3911, 'learning_rate': 6.85192438646848e-06, 'epoch': 1.23} {'loss': 0.3706, 'learning_rate': 6.85160549320055e-06, 'epoch': 1.23} {'loss': 0.2724, 'learning_rate': 6.851286603486559e-06, 'epoch': 1.23} {'loss': 0.288, 'learning_rate': 6.8509677173268664e-06, 'epoch': 1.23} {'loss': 0.2467, 'learning_rate': 6.850648834721831e-06, 'epoch': 1.23} {'loss': 0.3211, 'learning_rate': 6.850329955671818e-06, 'epoch': 1.23} {'loss': 0.2969, 'learning_rate': 6.8500110801771815e-06, 'epoch': 1.23} {'loss': 0.4253, 'learning_rate': 6.8496922082382834e-06, 'epoch': 1.23} {'loss': 0.3027, 'learning_rate': 6.849373339855483e-06, 'epoch': 1.23} {'loss': 0.3371, 'learning_rate': 6.84905447502914e-06, 'epoch': 1.23} {'loss': 0.2333, 'learning_rate': 6.848735613759617e-06, 'epoch': 1.23} {'loss': 0.2099, 'learning_rate': 6.848416756047272e-06, 'epoch': 1.23} {'loss': 0.3204, 'learning_rate': 6.848097901892466e-06, 'epoch': 1.23} {'loss': 0.2923, 'learning_rate': 6.8477790512955554e-06, 'epoch': 1.23} {'loss': 0.3144, 'learning_rate': 6.847460204256905e-06, 'epoch': 1.23} {'loss': 0.2801, 'learning_rate': 6.8471413607768725e-06, 'epoch': 1.23} {'loss': 0.4295, 'learning_rate': 6.846822520855817e-06, 'epoch': 1.23} {'loss': 0.1747, 'learning_rate': 6.846503684494099e-06, 'epoch': 1.23} {'loss': 0.4102, 'learning_rate': 6.846184851692082e-06, 'epoch': 1.23} {'loss': 0.1911, 'learning_rate': 6.845866022450121e-06, 'epoch': 1.23} {'loss': 0.4853, 'learning_rate': 6.845547196768576e-06, 'epoch': 1.23} {'loss': 0.2665, 'learning_rate': 6.845228374647807e-06, 'epoch': 1.23} {'loss': 0.4181, 'learning_rate': 6.844909556088178e-06, 'epoch': 1.23} {'loss': 0.3216, 'learning_rate': 6.8445907410900445e-06, 'epoch': 1.23} {'loss': 0.2898, 'learning_rate': 6.84427192965377e-06, 'epoch': 1.23} {'loss': 0.3807, 'learning_rate': 6.8439531217797105e-06, 'epoch': 1.23} {'loss': 0.2394, 'learning_rate': 6.843634317468229e-06, 'epoch': 1.23} {'loss': 0.523, 'learning_rate': 6.843315516719683e-06, 'epoch': 1.23} {'loss': 0.3769, 'learning_rate': 6.842996719534434e-06, 'epoch': 1.23} {'loss': 0.2639, 'learning_rate': 6.8426779259128415e-06, 'epoch': 1.23} {'loss': 0.266, 'learning_rate': 6.842359135855266e-06, 'epoch': 1.23} {'loss': 0.3202, 'learning_rate': 6.842040349362067e-06, 'epoch': 1.23} {'loss': 0.2898, 'learning_rate': 6.841721566433603e-06, 'epoch': 1.23} {'loss': 0.2066, 'learning_rate': 6.841402787070234e-06, 'epoch': 1.23} {'loss': 0.3075, 'learning_rate': 6.841084011272321e-06, 'epoch': 1.23} {'loss': 0.3183, 'learning_rate': 6.8407652390402235e-06, 'epoch': 1.23} {'loss': 0.3076, 'learning_rate': 6.840446470374301e-06, 'epoch': 1.23} {'loss': 0.3829, 'learning_rate': 6.840127705274914e-06, 'epoch': 1.23} {'loss': 0.2512, 'learning_rate': 6.839808943742421e-06, 'epoch': 1.23} {'loss': 0.5198, 'learning_rate': 6.839490185777185e-06, 'epoch': 1.23} {'loss': 0.2556, 'learning_rate': 6.839171431379561e-06, 'epoch': 1.23} {'loss': 0.2873, 'learning_rate': 6.838852680549913e-06, 'epoch': 1.23} {'loss': 0.3267, 'learning_rate': 6.838533933288598e-06, 'epoch': 1.23} {'loss': 0.388, 'learning_rate': 6.838215189595978e-06, 'epoch': 1.23} {'loss': 0.3688, 'learning_rate': 6.837896449472414e-06, 'epoch': 1.23} {'loss': 0.5075, 'learning_rate': 6.837577712918262e-06, 'epoch': 1.23} {'loss': 0.2614, 'learning_rate': 6.837258979933883e-06, 'epoch': 1.23} {'loss': 0.2899, 'learning_rate': 6.8369402505196325e-06, 'epoch': 1.23} {'loss': 0.3645, 'learning_rate': 6.8366215246758786e-06, 'epoch': 1.23} {'loss': 0.2483, 'learning_rate': 6.836302802402978e-06, 'epoch': 1.23} {'loss': 0.3288, 'learning_rate': 6.83598408370129e-06, 'epoch': 1.23} {'loss': 0.3259, 'learning_rate': 6.835665368571176e-06, 'epoch': 1.23} {'loss': 0.3521, 'learning_rate': 6.835346657012993e-06, 'epoch': 1.23} {'loss': 0.3531, 'learning_rate': 6.835027949027101e-06, 'epoch': 1.23} {'loss': 0.2303, 'learning_rate': 6.834709244613862e-06, 'epoch': 1.23} {'loss': 0.3448, 'learning_rate': 6.834390543773633e-06, 'epoch': 1.23} {'loss': 0.4379, 'learning_rate': 6.834071846506775e-06, 'epoch': 1.23} {'loss': 0.2989, 'learning_rate': 6.833753152813648e-06, 'epoch': 1.23} {'loss': 0.3615, 'learning_rate': 6.8334344626946114e-06, 'epoch': 1.23} {'loss': 0.3032, 'learning_rate': 6.833115776150025e-06, 'epoch': 1.23} {'loss': 0.3987, 'learning_rate': 6.83279709318025e-06, 'epoch': 1.23} {'loss': 0.336, 'learning_rate': 6.832478413785644e-06, 'epoch': 1.23} {'loss': 0.3688, 'learning_rate': 6.832159737966568e-06, 'epoch': 1.23} {'loss': 0.3872, 'learning_rate': 6.83184106572338e-06, 'epoch': 1.23} {'loss': 0.3521, 'learning_rate': 6.8315223970564424e-06, 'epoch': 1.23} {'loss': 0.2042, 'learning_rate': 6.831203731966114e-06, 'epoch': 1.23} {'loss': 0.232, 'learning_rate': 6.830885070452753e-06, 'epoch': 1.23} {'loss': 0.2028, 'learning_rate': 6.8305664125167214e-06, 'epoch': 1.23} {'loss': 0.3651, 'learning_rate': 6.830247758158375e-06, 'epoch': 1.23} {'loss': 0.2198, 'learning_rate': 6.8299291073780785e-06, 'epoch': 1.23} {'loss': 0.3619, 'learning_rate': 6.829610460176188e-06, 'epoch': 1.23} {'loss': 0.3543, 'learning_rate': 6.829291816553064e-06, 'epoch': 1.23} {'loss': 0.4491, 'learning_rate': 6.828973176509067e-06, 'epoch': 1.23} {'loss': 0.222, 'learning_rate': 6.828654540044557e-06, 'epoch': 1.23} {'loss': 0.228, 'learning_rate': 6.828335907159892e-06, 'epoch': 1.23} {'loss': 0.2673, 'learning_rate': 6.828017277855433e-06, 'epoch': 1.23} {'loss': 0.3875, 'learning_rate': 6.827698652131539e-06, 'epoch': 1.23} {'loss': 0.4135, 'learning_rate': 6.827380029988571e-06, 'epoch': 1.23} {'loss': 0.3521, 'learning_rate': 6.827061411426889e-06, 'epoch': 1.23} {'loss': 0.3664, 'learning_rate': 6.826742796446849e-06, 'epoch': 1.23} {'loss': 0.3023, 'learning_rate': 6.826424185048813e-06, 'epoch': 1.23} {'loss': 0.5297, 'learning_rate': 6.826105577233141e-06, 'epoch': 1.23} {'loss': 0.3353, 'learning_rate': 6.825786973000192e-06, 'epoch': 1.23} {'loss': 0.3065, 'learning_rate': 6.825468372350325e-06, 'epoch': 1.23} {'loss': 0.2618, 'learning_rate': 6.8251497752839025e-06, 'epoch': 1.23} {'loss': 0.3566, 'learning_rate': 6.824831181801281e-06, 'epoch': 1.23} {'loss': 0.381, 'learning_rate': 6.824512591902822e-06, 'epoch': 1.23} {'loss': 0.2733, 'learning_rate': 6.824194005588884e-06, 'epoch': 1.23} {'loss': 0.2193, 'learning_rate': 6.823875422859827e-06, 'epoch': 1.23} {'loss': 0.4308, 'learning_rate': 6.82355684371601e-06, 'epoch': 1.23} {'loss': 0.3135, 'learning_rate': 6.823238268157794e-06, 'epoch': 1.23} {'loss': 0.3625, 'learning_rate': 6.822919696185541e-06, 'epoch': 1.23} {'loss': 0.4444, 'learning_rate': 6.822601127799604e-06, 'epoch': 1.23} {'loss': 0.3047, 'learning_rate': 6.822282563000347e-06, 'epoch': 1.23} {'loss': 0.4662, 'learning_rate': 6.821964001788128e-06, 'epoch': 1.23} {'loss': 0.3549, 'learning_rate': 6.821645444163307e-06, 'epoch': 1.23} {'loss': 0.3564, 'learning_rate': 6.821326890126245e-06, 'epoch': 1.23} {'loss': 0.4602, 'learning_rate': 6.8210083396773e-06, 'epoch': 1.23} {'loss': 0.3951, 'learning_rate': 6.820689792816833e-06, 'epoch': 1.23} {'loss': 0.2786, 'learning_rate': 6.820371249545201e-06, 'epoch': 1.23} {'loss': 0.2942, 'learning_rate': 6.820052709862765e-06, 'epoch': 1.23} {'loss': 0.3372, 'learning_rate': 6.8197341737698855e-06, 'epoch': 1.23} {'loss': 0.1866, 'learning_rate': 6.819415641266922e-06, 'epoch': 1.23} {'loss': 0.4699, 'learning_rate': 6.819097112354234e-06, 'epoch': 1.23} {'loss': 0.2425, 'learning_rate': 6.81877858703218e-06, 'epoch': 1.23} {'loss': 0.2578, 'learning_rate': 6.8184600653011205e-06, 'epoch': 1.23} {'loss': 0.4217, 'learning_rate': 6.818141547161413e-06, 'epoch': 1.23} {'loss': 0.2915, 'learning_rate': 6.8178230326134194e-06, 'epoch': 1.23} {'loss': 0.4089, 'learning_rate': 6.8175045216574985e-06, 'epoch': 1.23} {'loss': 0.3713, 'learning_rate': 6.817186014294009e-06, 'epoch': 1.23} {'loss': 0.2438, 'learning_rate': 6.816867510523313e-06, 'epoch': 1.23} {'loss': 0.3235, 'learning_rate': 6.816549010345767e-06, 'epoch': 1.23} {'loss': 0.2397, 'learning_rate': 6.816230513761731e-06, 'epoch': 1.23} {'loss': 0.4656, 'learning_rate': 6.815912020771567e-06, 'epoch': 1.23} {'loss': 0.2636, 'learning_rate': 6.815593531375632e-06, 'epoch': 1.23} {'loss': 0.2744, 'learning_rate': 6.815275045574286e-06, 'epoch': 1.23} {'loss': 0.3619, 'learning_rate': 6.814956563367889e-06, 'epoch': 1.23} {'loss': 0.3644, 'learning_rate': 6.814638084756804e-06, 'epoch': 1.23} {'loss': 0.2782, 'learning_rate': 6.814319609741383e-06, 'epoch': 1.23} {'loss': 0.3592, 'learning_rate': 6.81400113832199e-06, 'epoch': 1.23} {'loss': 0.4956, 'learning_rate': 6.813682670498984e-06, 'epoch': 1.23} {'loss': 0.2616, 'learning_rate': 6.813364206272723e-06, 'epoch': 1.23} {'loss': 0.3506, 'learning_rate': 6.813045745643571e-06, 'epoch': 1.23} {'loss': 0.3462, 'learning_rate': 6.812727288611882e-06, 'epoch': 1.23} {'loss': 0.3079, 'learning_rate': 6.812408835178017e-06, 'epoch': 1.23} {'loss': 0.2443, 'learning_rate': 6.812090385342338e-06, 'epoch': 1.23} {'loss': 0.3366, 'learning_rate': 6.811771939105203e-06, 'epoch': 1.23} {'loss': 0.4079, 'learning_rate': 6.81145349646697e-06, 'epoch': 1.23} {'loss': 0.3056, 'learning_rate': 6.811135057428e-06, 'epoch': 1.23} {'loss': 0.2967, 'learning_rate': 6.810816621988652e-06, 'epoch': 1.23} {'loss': 0.2526, 'learning_rate': 6.8104981901492886e-06, 'epoch': 1.23} {'loss': 0.4338, 'learning_rate': 6.8101797619102625e-06, 'epoch': 1.23} {'loss': 0.4265, 'learning_rate': 6.809861337271939e-06, 'epoch': 1.23} {'loss': 0.3242, 'learning_rate': 6.809542916234674e-06, 'epoch': 1.23} {'loss': 0.2621, 'learning_rate': 6.809224498798828e-06, 'epoch': 1.23} {'loss': 0.3881, 'learning_rate': 6.808906084964762e-06, 'epoch': 1.23} {'loss': 0.2675, 'learning_rate': 6.808587674732834e-06, 'epoch': 1.23} {'loss': 0.414, 'learning_rate': 6.808269268103402e-06, 'epoch': 1.23} {'loss': 0.2624, 'learning_rate': 6.807950865076829e-06, 'epoch': 1.23} {'loss': 0.4027, 'learning_rate': 6.807632465653471e-06, 'epoch': 1.23} {'loss': 0.5169, 'learning_rate': 6.807314069833691e-06, 'epoch': 1.23} {'loss': 0.3146, 'learning_rate': 6.806995677617845e-06, 'epoch': 1.23} {'loss': 0.3198, 'learning_rate': 6.806677289006292e-06, 'epoch': 1.23} {'loss': 0.2417, 'learning_rate': 6.8063589039993975e-06, 'epoch': 1.23} {'loss': 0.3506, 'learning_rate': 6.806040522597515e-06, 'epoch': 1.23} {'loss': 0.3856, 'learning_rate': 6.805722144801003e-06, 'epoch': 1.23} {'loss': 0.3817, 'learning_rate': 6.805403770610224e-06, 'epoch': 1.23} {'loss': 0.309, 'learning_rate': 6.805085400025533e-06, 'epoch': 1.23} {'loss': 0.3601, 'learning_rate': 6.804767033047297e-06, 'epoch': 1.23} {'loss': 0.2841, 'learning_rate': 6.804448669675872e-06, 'epoch': 1.23} {'loss': 0.389, 'learning_rate': 6.804130309911616e-06, 'epoch': 1.23} {'loss': 0.3391, 'learning_rate': 6.803811953754892e-06, 'epoch': 1.23} {'loss': 0.214, 'learning_rate': 6.8034936012060545e-06, 'epoch': 1.23} {'loss': 0.3543, 'learning_rate': 6.8031752522654635e-06, 'epoch': 1.23} {'loss': 0.3339, 'learning_rate': 6.802856906933482e-06, 'epoch': 1.23} {'loss': 0.2992, 'learning_rate': 6.8025385652104645e-06, 'epoch': 1.23} {'loss': 0.3689, 'learning_rate': 6.802220227096774e-06, 'epoch': 1.23} {'loss': 0.2266, 'learning_rate': 6.8019018925927695e-06, 'epoch': 1.23} {'loss': 0.2287, 'learning_rate': 6.801583561698809e-06, 'epoch': 1.23} {'loss': 0.3231, 'learning_rate': 6.801265234415253e-06, 'epoch': 1.23} {'loss': 0.3447, 'learning_rate': 6.800946910742459e-06, 'epoch': 1.23} {'loss': 0.3612, 'learning_rate': 6.800628590680789e-06, 'epoch': 1.23} {'loss': 0.3128, 'learning_rate': 6.800310274230599e-06, 'epoch': 1.23} {'loss': 0.2871, 'learning_rate': 6.7999919613922526e-06, 'epoch': 1.23} {'loss': 0.3567, 'learning_rate': 6.799673652166107e-06, 'epoch': 1.23} {'loss': 0.2283, 'learning_rate': 6.7993553465525205e-06, 'epoch': 1.23} {'loss': 0.3725, 'learning_rate': 6.799037044551853e-06, 'epoch': 1.23} {'loss': 0.4472, 'learning_rate': 6.798718746164463e-06, 'epoch': 1.23} {'loss': 0.2037, 'learning_rate': 6.798400451390712e-06, 'epoch': 1.23} {'loss': 0.3739, 'learning_rate': 6.798082160230959e-06, 'epoch': 1.23} {'loss': 0.3388, 'learning_rate': 6.79776387268556e-06, 'epoch': 1.23} {'loss': 0.3739, 'learning_rate': 6.7974455887548776e-06, 'epoch': 1.23} {'loss': 0.4085, 'learning_rate': 6.7971273084392705e-06, 'epoch': 1.23} {'loss': 0.2458, 'learning_rate': 6.7968090317390965e-06, 'epoch': 1.23} {'loss': 0.3107, 'learning_rate': 6.7964907586547164e-06, 'epoch': 1.23} {'loss': 0.1736, 'learning_rate': 6.79617248918649e-06, 'epoch': 1.23} {'loss': 0.2692, 'learning_rate': 6.795854223334775e-06, 'epoch': 1.23} {'loss': 0.2463, 'learning_rate': 6.795535961099933e-06, 'epoch': 1.23} {'loss': 0.3422, 'learning_rate': 6.79521770248232e-06, 'epoch': 1.23} {'loss': 0.2594, 'learning_rate': 6.794899447482297e-06, 'epoch': 1.23} {'loss': 0.332, 'learning_rate': 6.794581196100223e-06, 'epoch': 1.23} {'loss': 0.2226, 'learning_rate': 6.794262948336456e-06, 'epoch': 1.23} {'loss': 0.3957, 'learning_rate': 6.793944704191357e-06, 'epoch': 1.23} {'loss': 0.2392, 'learning_rate': 6.793626463665286e-06, 'epoch': 1.23} {'loss': 0.331, 'learning_rate': 6.7933082267586e-06, 'epoch': 1.23} {'loss': 0.3437, 'learning_rate': 6.792989993471661e-06, 'epoch': 1.23} {'loss': 0.2331, 'learning_rate': 6.792671763804823e-06, 'epoch': 1.23} {'loss': 0.3059, 'learning_rate': 6.792353537758452e-06, 'epoch': 1.23} {'loss': 0.3332, 'learning_rate': 6.792035315332902e-06, 'epoch': 1.23} {'loss': 0.2924, 'learning_rate': 6.791717096528535e-06, 'epoch': 1.23} {'loss': 0.3553, 'learning_rate': 6.791398881345711e-06, 'epoch': 1.23} {'loss': 0.329, 'learning_rate': 6.7910806697847855e-06, 'epoch': 1.23} {'loss': 0.3349, 'learning_rate': 6.7907624618461185e-06, 'epoch': 1.23} {'loss': 0.2897, 'learning_rate': 6.790444257530073e-06, 'epoch': 1.23} {'loss': 0.3718, 'learning_rate': 6.790126056837003e-06, 'epoch': 1.23} {'loss': 0.4402, 'learning_rate': 6.7898078597672725e-06, 'epoch': 1.23} {'loss': 0.2968, 'learning_rate': 6.789489666321238e-06, 'epoch': 1.23} {'loss': 0.3913, 'learning_rate': 6.789171476499259e-06, 'epoch': 1.23} {'loss': 0.3821, 'learning_rate': 6.788853290301694e-06, 'epoch': 1.23} {'loss': 0.2883, 'learning_rate': 6.788535107728903e-06, 'epoch': 1.23} {'loss': 0.3242, 'learning_rate': 6.788216928781246e-06, 'epoch': 1.23} {'loss': 0.2218, 'learning_rate': 6.7878987534590816e-06, 'epoch': 1.23} {'loss': 0.3902, 'learning_rate': 6.787580581762767e-06, 'epoch': 1.23} {'loss': 0.2492, 'learning_rate': 6.787262413692666e-06, 'epoch': 1.23} {'loss': 0.2228, 'learning_rate': 6.786944249249134e-06, 'epoch': 1.23} {'loss': 0.3565, 'learning_rate': 6.78662608843253e-06, 'epoch': 1.23} {'loss': 0.2544, 'learning_rate': 6.7863079312432135e-06, 'epoch': 1.23} {'loss': 0.2902, 'learning_rate': 6.785989777681545e-06, 'epoch': 1.23} {'loss': 0.2575, 'learning_rate': 6.785671627747883e-06, 'epoch': 1.23} {'loss': 0.3359, 'learning_rate': 6.7853534814425845e-06, 'epoch': 1.23} {'loss': 0.309, 'learning_rate': 6.785035338766013e-06, 'epoch': 1.23} {'loss': 0.457, 'learning_rate': 6.784717199718524e-06, 'epoch': 1.23} {'loss': 0.3656, 'learning_rate': 6.78439906430048e-06, 'epoch': 1.23} {'loss': 0.4429, 'learning_rate': 6.784080932512236e-06, 'epoch': 1.23} {'loss': 0.3601, 'learning_rate': 6.7837628043541524e-06, 'epoch': 1.23} {'loss': 0.3534, 'learning_rate': 6.783444679826591e-06, 'epoch': 1.23} {'loss': 0.3025, 'learning_rate': 6.783126558929907e-06, 'epoch': 1.23} {'loss': 0.1893, 'learning_rate': 6.7828084416644644e-06, 'epoch': 1.23} {'loss': 0.2276, 'learning_rate': 6.782490328030617e-06, 'epoch': 1.23} {'loss': 0.2757, 'learning_rate': 6.782172218028726e-06, 'epoch': 1.23} {'loss': 0.3198, 'learning_rate': 6.781854111659152e-06, 'epoch': 1.23} {'loss': 0.4263, 'learning_rate': 6.7815360089222516e-06, 'epoch': 1.23} {'loss': 0.2845, 'learning_rate': 6.781217909818385e-06, 'epoch': 1.23} {'loss': 0.4131, 'learning_rate': 6.780899814347912e-06, 'epoch': 1.23} {'loss': 0.352, 'learning_rate': 6.780581722511191e-06, 'epoch': 1.23} {'loss': 0.3592, 'learning_rate': 6.78026363430858e-06, 'epoch': 1.23} {'loss': 0.4377, 'learning_rate': 6.77994554974044e-06, 'epoch': 1.23} {'loss': 0.2873, 'learning_rate': 6.779627468807129e-06, 'epoch': 1.23} {'loss': 0.3326, 'learning_rate': 6.779309391509006e-06, 'epoch': 1.23} {'loss': 0.2693, 'learning_rate': 6.77899131784643e-06, 'epoch': 1.23} {'loss': 0.3617, 'learning_rate': 6.778673247819763e-06, 'epoch': 1.23} {'loss': 0.2513, 'learning_rate': 6.7783551814293594e-06, 'epoch': 1.23} {'loss': 0.4401, 'learning_rate': 6.7780371186755786e-06, 'epoch': 1.23} {'loss': 0.2358, 'learning_rate': 6.777719059558783e-06, 'epoch': 1.23} {'loss': 0.4043, 'learning_rate': 6.777401004079329e-06, 'epoch': 1.23} {'loss': 0.2555, 'learning_rate': 6.777082952237577e-06, 'epoch': 1.23} {'loss': 0.2851, 'learning_rate': 6.7767649040338845e-06, 'epoch': 1.23} {'loss': 0.4754, 'learning_rate': 6.7764468594686115e-06, 'epoch': 1.23} {'loss': 0.3591, 'learning_rate': 6.776128818542118e-06, 'epoch': 1.23} {'loss': 0.3567, 'learning_rate': 6.775810781254762e-06, 'epoch': 1.23} {'loss': 0.3206, 'learning_rate': 6.775492747606902e-06, 'epoch': 1.23} {'loss': 0.4474, 'learning_rate': 6.775174717598898e-06, 'epoch': 1.23} {'loss': 0.3132, 'learning_rate': 6.774856691231108e-06, 'epoch': 1.23} {'loss': 0.3223, 'learning_rate': 6.774538668503894e-06, 'epoch': 1.23} {'loss': 0.3218, 'learning_rate': 6.7742206494176085e-06, 'epoch': 1.23} {'loss': 0.3763, 'learning_rate': 6.773902633972618e-06, 'epoch': 1.23} {'loss': 0.381, 'learning_rate': 6.773584622169271e-06, 'epoch': 1.23} {'loss': 0.2498, 'learning_rate': 6.773266614007939e-06, 'epoch': 1.23} {'loss': 0.3399, 'learning_rate': 6.772948609488974e-06, 'epoch': 1.23} {'loss': 0.3192, 'learning_rate': 6.772630608612738e-06, 'epoch': 1.23} {'loss': 0.4445, 'learning_rate': 6.77231261137959e-06, 'epoch': 1.23} {'loss': 0.4181, 'learning_rate': 6.7719946177898845e-06, 'epoch': 1.23} {'loss': 0.2649, 'learning_rate': 6.7716766278439835e-06, 'epoch': 1.23} {'loss': 0.4198, 'learning_rate': 6.771358641542245e-06, 'epoch': 1.23} {'loss': 0.2613, 'learning_rate': 6.771040658885031e-06, 'epoch': 1.23} {'loss': 0.2887, 'learning_rate': 6.7707226798726955e-06, 'epoch': 1.23} {'loss': 0.2434, 'learning_rate': 6.770404704505602e-06, 'epoch': 1.23} {'loss': 0.3176, 'learning_rate': 6.7700867327841055e-06, 'epoch': 1.23} {'loss': 0.2624, 'learning_rate': 6.769768764708568e-06, 'epoch': 1.23} {'loss': 0.2737, 'learning_rate': 6.769450800279347e-06, 'epoch': 1.23} {'loss': 0.2824, 'learning_rate': 6.769132839496803e-06, 'epoch': 1.23} {'loss': 0.3046, 'learning_rate': 6.768814882361292e-06, 'epoch': 1.23} {'loss': 0.327, 'learning_rate': 6.768496928873175e-06, 'epoch': 1.23} {'loss': 0.1697, 'learning_rate': 6.768178979032813e-06, 'epoch': 1.23} {'loss': 0.457, 'learning_rate': 6.767861032840559e-06, 'epoch': 1.23} {'loss': 0.3027, 'learning_rate': 6.767543090296778e-06, 'epoch': 1.23} {'loss': 0.3788, 'learning_rate': 6.767225151401824e-06, 'epoch': 1.23} {'loss': 0.4015, 'learning_rate': 6.766907216156058e-06, 'epoch': 1.23} {'loss': 0.3008, 'learning_rate': 6.766589284559839e-06, 'epoch': 1.23} {'loss': 0.203, 'learning_rate': 6.766271356613528e-06, 'epoch': 1.23} {'loss': 0.1645, 'learning_rate': 6.7659534323174795e-06, 'epoch': 1.23} {'loss': 0.2797, 'learning_rate': 6.765635511672055e-06, 'epoch': 1.23} {'loss': 0.2408, 'learning_rate': 6.765317594677613e-06, 'epoch': 1.23} {'loss': 0.3594, 'learning_rate': 6.764999681334512e-06, 'epoch': 1.23} {'loss': 0.317, 'learning_rate': 6.764681771643111e-06, 'epoch': 1.23} {'loss': 0.4382, 'learning_rate': 6.76436386560377e-06, 'epoch': 1.23} {'loss': 0.3438, 'learning_rate': 6.764045963216848e-06, 'epoch': 1.23} {'loss': 0.3584, 'learning_rate': 6.7637280644827015e-06, 'epoch': 1.23} {'loss': 0.2521, 'learning_rate': 6.763410169401692e-06, 'epoch': 1.23} {'loss': 0.4059, 'learning_rate': 6.763092277974175e-06, 'epoch': 1.23} {'loss': 0.3329, 'learning_rate': 6.762774390200511e-06, 'epoch': 1.23} {'loss': 0.2468, 'learning_rate': 6.76245650608106e-06, 'epoch': 1.23} {'loss': 0.4627, 'learning_rate': 6.762138625616179e-06, 'epoch': 1.23} {'loss': 0.1938, 'learning_rate': 6.761820748806229e-06, 'epoch': 1.23} {'loss': 0.2629, 'learning_rate': 6.761502875651567e-06, 'epoch': 1.23} {'loss': 0.413, 'learning_rate': 6.761185006152553e-06, 'epoch': 1.23} {'loss': 0.377, 'learning_rate': 6.7608671403095445e-06, 'epoch': 1.23} {'loss': 0.2667, 'learning_rate': 6.760549278122902e-06, 'epoch': 1.23} {'loss': 0.3539, 'learning_rate': 6.760231419592982e-06, 'epoch': 1.23} {'loss': 0.3642, 'learning_rate': 6.7599135647201465e-06, 'epoch': 1.23} {'loss': 0.2865, 'learning_rate': 6.759595713504753e-06, 'epoch': 1.23} {'loss': 0.3734, 'learning_rate': 6.7592778659471585e-06, 'epoch': 1.23} {'loss': 0.3369, 'learning_rate': 6.758960022047723e-06, 'epoch': 1.23} {'loss': 0.3205, 'learning_rate': 6.7586421818068035e-06, 'epoch': 1.23} {'loss': 0.4092, 'learning_rate': 6.758324345224763e-06, 'epoch': 1.23} {'loss': 0.3065, 'learning_rate': 6.7580065123019565e-06, 'epoch': 1.23} {'loss': 0.2706, 'learning_rate': 6.757688683038744e-06, 'epoch': 1.23} {'loss': 0.3819, 'learning_rate': 6.757370857435485e-06, 'epoch': 1.23} {'loss': 0.3237, 'learning_rate': 6.757053035492538e-06, 'epoch': 1.23} {'loss': 0.3316, 'learning_rate': 6.756735217210262e-06, 'epoch': 1.23} {'loss': 0.2718, 'learning_rate': 6.756417402589014e-06, 'epoch': 1.23} {'loss': 0.2212, 'learning_rate': 6.7560995916291535e-06, 'epoch': 1.23} {'loss': 0.3369, 'learning_rate': 6.755781784331041e-06, 'epoch': 1.23} {'loss': 0.4093, 'learning_rate': 6.7554639806950364e-06, 'epoch': 1.23} {'loss': 0.3989, 'learning_rate': 6.755146180721493e-06, 'epoch': 1.23} {'loss': 0.2173, 'learning_rate': 6.754828384410772e-06, 'epoch': 1.23} {'loss': 0.3796, 'learning_rate': 6.754510591763233e-06, 'epoch': 1.23} {'loss': 0.3828, 'learning_rate': 6.754192802779234e-06, 'epoch': 1.23} {'loss': 0.3407, 'learning_rate': 6.753875017459135e-06, 'epoch': 1.24} {'loss': 0.315, 'learning_rate': 6.753557235803294e-06, 'epoch': 1.24} {'loss': 0.3074, 'learning_rate': 6.7532394578120686e-06, 'epoch': 1.24} {'loss': 0.2532, 'learning_rate': 6.75292168348582e-06, 'epoch': 1.24} {'loss': 0.2167, 'learning_rate': 6.752603912824904e-06, 'epoch': 1.24} {'loss': 0.3127, 'learning_rate': 6.75228614582968e-06, 'epoch': 1.24} {'loss': 0.2598, 'learning_rate': 6.751968382500509e-06, 'epoch': 1.24} {'loss': 0.2661, 'learning_rate': 6.751650622837748e-06, 'epoch': 1.24} {'loss': 0.3702, 'learning_rate': 6.751332866841756e-06, 'epoch': 1.24} {'loss': 0.3373, 'learning_rate': 6.751015114512891e-06, 'epoch': 1.24} {'loss': 0.3533, 'learning_rate': 6.750697365851512e-06, 'epoch': 1.24} {'loss': 0.3341, 'learning_rate': 6.7503796208579774e-06, 'epoch': 1.24} {'loss': 0.2293, 'learning_rate': 6.750061879532646e-06, 'epoch': 1.24} {'loss': 0.3211, 'learning_rate': 6.749744141875878e-06, 'epoch': 1.24} {'loss': 0.449, 'learning_rate': 6.749426407888029e-06, 'epoch': 1.24} {'loss': 0.3263, 'learning_rate': 6.749108677569461e-06, 'epoch': 1.24} {'loss': 0.268, 'learning_rate': 6.748790950920529e-06, 'epoch': 1.24} {'loss': 0.423, 'learning_rate': 6.748473227941597e-06, 'epoch': 1.24} {'loss': 0.5124, 'learning_rate': 6.748155508633017e-06, 'epoch': 1.24} {'loss': 0.3928, 'learning_rate': 6.7478377929951535e-06, 'epoch': 1.24} {'loss': 0.2357, 'learning_rate': 6.7475200810283626e-06, 'epoch': 1.24} {'loss': 0.4309, 'learning_rate': 6.747202372733004e-06, 'epoch': 1.24} {'loss': 0.3051, 'learning_rate': 6.746884668109434e-06, 'epoch': 1.24} {'loss': 0.2973, 'learning_rate': 6.7465669671580115e-06, 'epoch': 1.24} {'loss': 0.3152, 'learning_rate': 6.746249269879097e-06, 'epoch': 1.24} {'loss': 0.2694, 'learning_rate': 6.745931576273048e-06, 'epoch': 1.24} {'loss': 0.2093, 'learning_rate': 6.745613886340224e-06, 'epoch': 1.24} {'loss': 0.2413, 'learning_rate': 6.745296200080984e-06, 'epoch': 1.24} {'loss': 0.2918, 'learning_rate': 6.744978517495684e-06, 'epoch': 1.24} {'loss': 0.2098, 'learning_rate': 6.744660838584684e-06, 'epoch': 1.24} {'loss': 0.3184, 'learning_rate': 6.744343163348345e-06, 'epoch': 1.24} {'loss': 0.4074, 'learning_rate': 6.744025491787022e-06, 'epoch': 1.24} {'loss': 0.3334, 'learning_rate': 6.743707823901076e-06, 'epoch': 1.24} {'loss': 0.524, 'learning_rate': 6.743390159690864e-06, 'epoch': 1.24} {'loss': 0.4069, 'learning_rate': 6.743072499156746e-06, 'epoch': 1.24} {'loss': 0.2945, 'learning_rate': 6.742754842299079e-06, 'epoch': 1.24} {'loss': 0.3404, 'learning_rate': 6.742437189118223e-06, 'epoch': 1.24} {'loss': 0.34, 'learning_rate': 6.742119539614531e-06, 'epoch': 1.24} {'loss': 0.2877, 'learning_rate': 6.741801893788371e-06, 'epoch': 1.24} {'loss': 0.4044, 'learning_rate': 6.741484251640097e-06, 'epoch': 1.24} {'loss': 0.2598, 'learning_rate': 6.741166613170067e-06, 'epoch': 1.24} {'loss': 0.3571, 'learning_rate': 6.740848978378641e-06, 'epoch': 1.24} {'loss': 0.2717, 'learning_rate': 6.74053134726618e-06, 'epoch': 1.24} {'loss': 0.3542, 'learning_rate': 6.7402137198330355e-06, 'epoch': 1.24} {'loss': 0.2885, 'learning_rate': 6.73989609607957e-06, 'epoch': 1.24} {'loss': 0.3746, 'learning_rate': 6.739578476006141e-06, 'epoch': 1.24} {'loss': 0.2793, 'learning_rate': 6.739260859613109e-06, 'epoch': 1.24} {'loss': 0.4309, 'learning_rate': 6.738943246900832e-06, 'epoch': 1.24} {'loss': 0.3738, 'learning_rate': 6.738625637869667e-06, 'epoch': 1.24} {'loss': 0.3066, 'learning_rate': 6.738308032519973e-06, 'epoch': 1.24} {'loss': 0.3524, 'learning_rate': 6.737990430852111e-06, 'epoch': 1.24} {'loss': 0.2836, 'learning_rate': 6.7376728328664355e-06, 'epoch': 1.24} {'loss': 0.415, 'learning_rate': 6.737355238563308e-06, 'epoch': 1.24} {'loss': 0.2055, 'learning_rate': 6.737037647943086e-06, 'epoch': 1.24} {'loss': 0.1797, 'learning_rate': 6.7367200610061275e-06, 'epoch': 1.24} {'loss': 0.4036, 'learning_rate': 6.736402477752795e-06, 'epoch': 1.24} {'loss': 0.2545, 'learning_rate': 6.736084898183439e-06, 'epoch': 1.24} {'loss': 0.198, 'learning_rate': 6.735767322298426e-06, 'epoch': 1.24} {'loss': 0.2656, 'learning_rate': 6.735449750098108e-06, 'epoch': 1.24} {'loss': 0.1712, 'learning_rate': 6.735132181582847e-06, 'epoch': 1.24} {'loss': 0.3865, 'learning_rate': 6.734814616753e-06, 'epoch': 1.24} {'loss': 0.2674, 'learning_rate': 6.734497055608928e-06, 'epoch': 1.24} {'loss': 0.2807, 'learning_rate': 6.734179498150988e-06, 'epoch': 1.24} {'loss': 0.3056, 'learning_rate': 6.7338619443795386e-06, 'epoch': 1.24} {'loss': 0.3356, 'learning_rate': 6.733544394294937e-06, 'epoch': 1.24} {'loss': 0.3848, 'learning_rate': 6.733226847897543e-06, 'epoch': 1.24} {'loss': 0.3716, 'learning_rate': 6.732909305187714e-06, 'epoch': 1.24} {'loss': 0.3446, 'learning_rate': 6.732591766165811e-06, 'epoch': 1.24} {'loss': 0.4583, 'learning_rate': 6.73227423083219e-06, 'epoch': 1.24} {'loss': 0.3183, 'learning_rate': 6.7319566991872085e-06, 'epoch': 1.24} {'loss': 0.2766, 'learning_rate': 6.731639171231228e-06, 'epoch': 1.24} {'loss': 0.2876, 'learning_rate': 6.731321646964604e-06, 'epoch': 1.24} {'loss': 0.4502, 'learning_rate': 6.731004126387697e-06, 'epoch': 1.24} {'loss': 0.3531, 'learning_rate': 6.730686609500865e-06, 'epoch': 1.24} {'loss': 0.487, 'learning_rate': 6.730369096304466e-06, 'epoch': 1.24} {'loss': 0.2903, 'learning_rate': 6.730051586798857e-06, 'epoch': 1.24} {'loss': 0.2461, 'learning_rate': 6.729734080984399e-06, 'epoch': 1.24} {'loss': 0.3428, 'learning_rate': 6.7294165788614496e-06, 'epoch': 1.24} {'loss': 0.184, 'learning_rate': 6.729099080430367e-06, 'epoch': 1.24} {'loss': 0.2679, 'learning_rate': 6.7287815856915095e-06, 'epoch': 1.24} {'loss': 0.2337, 'learning_rate': 6.728464094645235e-06, 'epoch': 1.24} {'loss': 0.3978, 'learning_rate': 6.7281466072919055e-06, 'epoch': 1.24} {'loss': 0.3354, 'learning_rate': 6.727829123631873e-06, 'epoch': 1.24} {'loss': 0.2651, 'learning_rate': 6.727511643665501e-06, 'epoch': 1.24} {'loss': 0.3712, 'learning_rate': 6.727194167393144e-06, 'epoch': 1.24} {'loss': 0.2843, 'learning_rate': 6.726876694815163e-06, 'epoch': 1.24} {'loss': 0.4654, 'learning_rate': 6.7265592259319166e-06, 'epoch': 1.24} {'loss': 0.3008, 'learning_rate': 6.726241760743761e-06, 'epoch': 1.24} {'loss': 0.2256, 'learning_rate': 6.725924299251058e-06, 'epoch': 1.24} {'loss': 0.3519, 'learning_rate': 6.725606841454162e-06, 'epoch': 1.24} {'loss': 0.3576, 'learning_rate': 6.725289387353434e-06, 'epoch': 1.24} {'loss': 0.4511, 'learning_rate': 6.7249719369492315e-06, 'epoch': 1.24} {'loss': 0.4607, 'learning_rate': 6.724654490241913e-06, 'epoch': 1.24} {'loss': 0.3189, 'learning_rate': 6.724337047231837e-06, 'epoch': 1.24} {'loss': 0.4767, 'learning_rate': 6.724019607919363e-06, 'epoch': 1.24} {'loss': 0.2417, 'learning_rate': 6.723702172304847e-06, 'epoch': 1.24} {'loss': 0.268, 'learning_rate': 6.723384740388647e-06, 'epoch': 1.24} {'loss': 0.3813, 'learning_rate': 6.723067312171122e-06, 'epoch': 1.24} {'loss': 0.1639, 'learning_rate': 6.722749887652632e-06, 'epoch': 1.24} {'loss': 0.3094, 'learning_rate': 6.722432466833534e-06, 'epoch': 1.24} {'loss': 0.2757, 'learning_rate': 6.722115049714186e-06, 'epoch': 1.24} {'loss': 0.2792, 'learning_rate': 6.721797636294948e-06, 'epoch': 1.24} {'loss': 0.3828, 'learning_rate': 6.7214802265761755e-06, 'epoch': 1.24} {'loss': 0.2362, 'learning_rate': 6.721162820558229e-06, 'epoch': 1.24} {'loss': 0.3704, 'learning_rate': 6.7208454182414665e-06, 'epoch': 1.24} {'loss': 0.2421, 'learning_rate': 6.7205280196262466e-06, 'epoch': 1.24} {'loss': 0.2506, 'learning_rate': 6.7202106247129265e-06, 'epoch': 1.24} {'loss': 0.3885, 'learning_rate': 6.719893233501866e-06, 'epoch': 1.24} {'loss': 0.3404, 'learning_rate': 6.71957584599342e-06, 'epoch': 1.24} {'loss': 0.2677, 'learning_rate': 6.719258462187951e-06, 'epoch': 1.24} {'loss': 0.303, 'learning_rate': 6.7189410820858145e-06, 'epoch': 1.24} {'loss': 0.3276, 'learning_rate': 6.718623705687368e-06, 'epoch': 1.24} {'loss': 0.2783, 'learning_rate': 6.718306332992974e-06, 'epoch': 1.24} {'loss': 0.329, 'learning_rate': 6.717988964002986e-06, 'epoch': 1.24} {'loss': 0.3294, 'learning_rate': 6.717671598717765e-06, 'epoch': 1.24} {'loss': 0.3971, 'learning_rate': 6.71735423713767e-06, 'epoch': 1.24} {'loss': 0.2688, 'learning_rate': 6.717036879263057e-06, 'epoch': 1.24} {'loss': 0.1975, 'learning_rate': 6.716719525094284e-06, 'epoch': 1.24} {'loss': 0.2516, 'learning_rate': 6.716402174631711e-06, 'epoch': 1.24} {'loss': 0.3399, 'learning_rate': 6.716084827875695e-06, 'epoch': 1.24} {'loss': 0.4687, 'learning_rate': 6.715767484826599e-06, 'epoch': 1.24} {'loss': 0.3736, 'learning_rate': 6.715450145484772e-06, 'epoch': 1.24} {'loss': 0.3782, 'learning_rate': 6.71513280985058e-06, 'epoch': 1.24} {'loss': 0.3565, 'learning_rate': 6.714815477924375e-06, 'epoch': 1.24} {'loss': 0.2999, 'learning_rate': 6.714498149706521e-06, 'epoch': 1.24} {'loss': 0.4157, 'learning_rate': 6.714180825197374e-06, 'epoch': 1.24} {'loss': 0.3034, 'learning_rate': 6.7138635043972914e-06, 'epoch': 1.24} {'loss': 0.3168, 'learning_rate': 6.713546187306632e-06, 'epoch': 1.24} {'loss': 0.2914, 'learning_rate': 6.713228873925755e-06, 'epoch': 1.24} {'loss': 0.353, 'learning_rate': 6.712911564255016e-06, 'epoch': 1.24} {'loss': 0.4409, 'learning_rate': 6.712594258294776e-06, 'epoch': 1.24} {'loss': 0.2767, 'learning_rate': 6.712276956045391e-06, 'epoch': 1.24} {'loss': 0.3014, 'learning_rate': 6.71195965750722e-06, 'epoch': 1.24} {'loss': 0.3145, 'learning_rate': 6.711642362680622e-06, 'epoch': 1.24} {'loss': 0.4299, 'learning_rate': 6.711325071565955e-06, 'epoch': 1.24} {'loss': 0.3098, 'learning_rate': 6.7110077841635765e-06, 'epoch': 1.24} {'loss': 0.226, 'learning_rate': 6.71069050047384e-06, 'epoch': 1.24} {'loss': 0.3953, 'learning_rate': 6.710373220497113e-06, 'epoch': 1.24} {'loss': 0.2088, 'learning_rate': 6.710055944233749e-06, 'epoch': 1.24} {'loss': 0.3353, 'learning_rate': 6.709738671684105e-06, 'epoch': 1.24} {'loss': 0.2621, 'learning_rate': 6.7094214028485415e-06, 'epoch': 1.24} {'loss': 0.2385, 'learning_rate': 6.709104137727418e-06, 'epoch': 1.24} {'loss': 0.3973, 'learning_rate': 6.708786876321088e-06, 'epoch': 1.24} {'loss': 0.377, 'learning_rate': 6.7084696186299095e-06, 'epoch': 1.24} {'loss': 0.2622, 'learning_rate': 6.708152364654246e-06, 'epoch': 1.24} {'loss': 0.2185, 'learning_rate': 6.70783511439445e-06, 'epoch': 1.24} {'loss': 0.4089, 'learning_rate': 6.707517867850884e-06, 'epoch': 1.24} {'loss': 0.3025, 'learning_rate': 6.7072006250239015e-06, 'epoch': 1.24} {'loss': 0.3022, 'learning_rate': 6.7068833859138675e-06, 'epoch': 1.24} {'loss': 0.4058, 'learning_rate': 6.7065661505211325e-06, 'epoch': 1.24} {'loss': 0.3069, 'learning_rate': 6.706248918846059e-06, 'epoch': 1.24} {'loss': 0.3643, 'learning_rate': 6.705931690889005e-06, 'epoch': 1.24} {'loss': 0.3526, 'learning_rate': 6.705614466650326e-06, 'epoch': 1.24} {'loss': 0.2521, 'learning_rate': 6.705297246130383e-06, 'epoch': 1.24} {'loss': 0.287, 'learning_rate': 6.704980029329535e-06, 'epoch': 1.24} {'loss': 0.3807, 'learning_rate': 6.704662816248137e-06, 'epoch': 1.24} {'loss': 0.3639, 'learning_rate': 6.704345606886546e-06, 'epoch': 1.24} {'loss': 0.2629, 'learning_rate': 6.7040284012451225e-06, 'epoch': 1.24} {'loss': 0.4571, 'learning_rate': 6.703711199324225e-06, 'epoch': 1.24} {'loss': 0.3291, 'learning_rate': 6.70339400112421e-06, 'epoch': 1.24} {'loss': 0.5171, 'learning_rate': 6.703076806645437e-06, 'epoch': 1.24} {'loss': 0.4018, 'learning_rate': 6.702759615888263e-06, 'epoch': 1.24} {'loss': 0.4075, 'learning_rate': 6.702442428853047e-06, 'epoch': 1.24} {'loss': 0.3763, 'learning_rate': 6.702125245540145e-06, 'epoch': 1.24} {'loss': 0.4229, 'learning_rate': 6.701808065949918e-06, 'epoch': 1.24} {'loss': 0.3725, 'learning_rate': 6.701490890082721e-06, 'epoch': 1.24} {'loss': 0.4365, 'learning_rate': 6.701173717938915e-06, 'epoch': 1.24} {'loss': 0.3661, 'learning_rate': 6.700856549518857e-06, 'epoch': 1.24} {'loss': 0.4923, 'learning_rate': 6.700539384822904e-06, 'epoch': 1.24} {'loss': 0.3615, 'learning_rate': 6.7002222238514134e-06, 'epoch': 1.24} {'loss': 0.3356, 'learning_rate': 6.699905066604746e-06, 'epoch': 1.24} {'loss': 0.3036, 'learning_rate': 6.699587913083257e-06, 'epoch': 1.24} {'loss': 0.3725, 'learning_rate': 6.699270763287306e-06, 'epoch': 1.24} {'loss': 0.316, 'learning_rate': 6.698953617217251e-06, 'epoch': 1.24} {'loss': 0.2473, 'learning_rate': 6.69863647487345e-06, 'epoch': 1.24} {'loss': 0.3579, 'learning_rate': 6.698319336256259e-06, 'epoch': 1.24} {'loss': 0.5151, 'learning_rate': 6.698002201366038e-06, 'epoch': 1.24} {'loss': 0.3707, 'learning_rate': 6.697685070203146e-06, 'epoch': 1.24} {'loss': 0.3141, 'learning_rate': 6.697367942767938e-06, 'epoch': 1.24} {'loss': 0.3473, 'learning_rate': 6.697050819060775e-06, 'epoch': 1.24} {'loss': 0.2769, 'learning_rate': 6.696733699082015e-06, 'epoch': 1.24} {'loss': 0.3324, 'learning_rate': 6.696416582832013e-06, 'epoch': 1.24} {'loss': 0.3287, 'learning_rate': 6.696099470311128e-06, 'epoch': 1.24} {'loss': 0.2442, 'learning_rate': 6.6957823615197184e-06, 'epoch': 1.24} {'loss': 0.2197, 'learning_rate': 6.695465256458142e-06, 'epoch': 1.24} {'loss': 0.3644, 'learning_rate': 6.695148155126756e-06, 'epoch': 1.24} {'loss': 0.2728, 'learning_rate': 6.694831057525921e-06, 'epoch': 1.24} {'loss': 0.2858, 'learning_rate': 6.694513963655993e-06, 'epoch': 1.24} {'loss': 0.2677, 'learning_rate': 6.694196873517329e-06, 'epoch': 1.24} {'loss': 0.2906, 'learning_rate': 6.693879787110289e-06, 'epoch': 1.24} {'loss': 0.4055, 'learning_rate': 6.69356270443523e-06, 'epoch': 1.24} {'loss': 0.2578, 'learning_rate': 6.69324562549251e-06, 'epoch': 1.24} {'loss': 0.3695, 'learning_rate': 6.692928550282487e-06, 'epoch': 1.24} {'loss': 0.4519, 'learning_rate': 6.692611478805518e-06, 'epoch': 1.24} {'loss': 0.4298, 'learning_rate': 6.6922944110619634e-06, 'epoch': 1.24} {'loss': 0.3306, 'learning_rate': 6.691977347052179e-06, 'epoch': 1.24} {'loss': 0.3408, 'learning_rate': 6.6916602867765225e-06, 'epoch': 1.24} {'loss': 0.2847, 'learning_rate': 6.6913432302353525e-06, 'epoch': 1.24} {'loss': 0.2629, 'learning_rate': 6.691026177429027e-06, 'epoch': 1.24} {'loss': 0.3967, 'learning_rate': 6.690709128357903e-06, 'epoch': 1.24} {'loss': 0.4128, 'learning_rate': 6.690392083022339e-06, 'epoch': 1.24} {'loss': 0.4341, 'learning_rate': 6.690075041422693e-06, 'epoch': 1.24} {'loss': 0.1968, 'learning_rate': 6.689758003559323e-06, 'epoch': 1.24} {'loss': 0.4369, 'learning_rate': 6.689440969432588e-06, 'epoch': 1.24} {'loss': 0.2622, 'learning_rate': 6.689123939042843e-06, 'epoch': 1.24} {'loss': 0.2877, 'learning_rate': 6.688806912390449e-06, 'epoch': 1.24} {'loss': 0.2961, 'learning_rate': 6.688489889475761e-06, 'epoch': 1.24} {'loss': 0.319, 'learning_rate': 6.688172870299141e-06, 'epoch': 1.24} {'loss': 0.3153, 'learning_rate': 6.687855854860942e-06, 'epoch': 1.24} {'loss': 0.2045, 'learning_rate': 6.687538843161523e-06, 'epoch': 1.24} {'loss': 0.4393, 'learning_rate': 6.687221835201243e-06, 'epoch': 1.24} {'loss': 0.3581, 'learning_rate': 6.68690483098046e-06, 'epoch': 1.24} {'loss': 0.3304, 'learning_rate': 6.6865878304995315e-06, 'epoch': 1.24} {'loss': 0.3595, 'learning_rate': 6.6862708337588155e-06, 'epoch': 1.24} {'loss': 0.34, 'learning_rate': 6.68595384075867e-06, 'epoch': 1.24} {'loss': 0.4172, 'learning_rate': 6.68563685149945e-06, 'epoch': 1.24} {'loss': 0.3738, 'learning_rate': 6.685319865981519e-06, 'epoch': 1.24} {'loss': 0.3684, 'learning_rate': 6.6850028842052296e-06, 'epoch': 1.24} {'loss': 0.2258, 'learning_rate': 6.684685906170942e-06, 'epoch': 1.24} {'loss': 0.3906, 'learning_rate': 6.684368931879013e-06, 'epoch': 1.24} {'loss': 0.3382, 'learning_rate': 6.684051961329804e-06, 'epoch': 1.24} {'loss': 0.331, 'learning_rate': 6.683734994523668e-06, 'epoch': 1.24} {'loss': 0.3677, 'learning_rate': 6.683418031460963e-06, 'epoch': 1.24} {'loss': 0.4643, 'learning_rate': 6.683101072142048e-06, 'epoch': 1.24} {'loss': 0.1638, 'learning_rate': 6.6827841165672836e-06, 'epoch': 1.24} {'loss': 0.2997, 'learning_rate': 6.6824671647370236e-06, 'epoch': 1.24} {'loss': 0.326, 'learning_rate': 6.682150216651628e-06, 'epoch': 1.24} {'loss': 0.24, 'learning_rate': 6.681833272311453e-06, 'epoch': 1.24} {'loss': 0.2096, 'learning_rate': 6.681516331716857e-06, 'epoch': 1.24} {'loss': 0.3455, 'learning_rate': 6.681199394868201e-06, 'epoch': 1.24} {'loss': 0.3412, 'learning_rate': 6.680882461765836e-06, 'epoch': 1.24} {'loss': 0.3705, 'learning_rate': 6.680565532410126e-06, 'epoch': 1.24} {'loss': 0.3308, 'learning_rate': 6.680248606801425e-06, 'epoch': 1.24} {'loss': 0.2379, 'learning_rate': 6.679931684940095e-06, 'epoch': 1.24} {'loss': 0.2491, 'learning_rate': 6.679614766826487e-06, 'epoch': 1.24} {'loss': 0.2443, 'learning_rate': 6.679297852460964e-06, 'epoch': 1.24} {'loss': 0.1895, 'learning_rate': 6.678980941843878e-06, 'epoch': 1.24} {'loss': 0.4234, 'learning_rate': 6.678664034975595e-06, 'epoch': 1.24} {'loss': 0.1682, 'learning_rate': 6.678347131856469e-06, 'epoch': 1.24} {'loss': 0.3613, 'learning_rate': 6.678030232486857e-06, 'epoch': 1.24} {'loss': 0.465, 'learning_rate': 6.67771333686712e-06, 'epoch': 1.24} {'loss': 0.5406, 'learning_rate': 6.67739644499761e-06, 'epoch': 1.24} {'loss': 0.3143, 'learning_rate': 6.677079556878687e-06, 'epoch': 1.24} {'loss': 0.3133, 'learning_rate': 6.67676267251071e-06, 'epoch': 1.24} {'loss': 0.2917, 'learning_rate': 6.676445791894037e-06, 'epoch': 1.24} {'loss': 0.2007, 'learning_rate': 6.676128915029024e-06, 'epoch': 1.24} {'loss': 0.2226, 'learning_rate': 6.67581204191603e-06, 'epoch': 1.24} {'loss': 0.4294, 'learning_rate': 6.675495172555411e-06, 'epoch': 1.24} {'loss': 0.5475, 'learning_rate': 6.675178306947525e-06, 'epoch': 1.24} {'loss': 0.2124, 'learning_rate': 6.674861445092733e-06, 'epoch': 1.24} {'loss': 0.4301, 'learning_rate': 6.674544586991387e-06, 'epoch': 1.24} {'loss': 0.2603, 'learning_rate': 6.67422773264385e-06, 'epoch': 1.24} {'loss': 0.3356, 'learning_rate': 6.673910882050477e-06, 'epoch': 1.24} {'loss': 0.4149, 'learning_rate': 6.673594035211626e-06, 'epoch': 1.24} {'loss': 0.5108, 'learning_rate': 6.673277192127658e-06, 'epoch': 1.24} {'loss': 0.4115, 'learning_rate': 6.672960352798923e-06, 'epoch': 1.24} {'loss': 0.3481, 'learning_rate': 6.672643517225786e-06, 'epoch': 1.24} {'loss': 0.2954, 'learning_rate': 6.672326685408599e-06, 'epoch': 1.24} {'loss': 0.3005, 'learning_rate': 6.6720098573477234e-06, 'epoch': 1.24} {'loss': 0.4159, 'learning_rate': 6.671693033043516e-06, 'epoch': 1.24} {'loss': 0.3357, 'learning_rate': 6.671376212496334e-06, 'epoch': 1.24} {'loss': 0.2802, 'learning_rate': 6.671059395706536e-06, 'epoch': 1.24} {'loss': 0.2316, 'learning_rate': 6.670742582674479e-06, 'epoch': 1.24} {'loss': 0.2867, 'learning_rate': 6.6704257734005194e-06, 'epoch': 1.24} {'loss': 0.3074, 'learning_rate': 6.670108967885016e-06, 'epoch': 1.24} {'loss': 0.25, 'learning_rate': 6.669792166128326e-06, 'epoch': 1.24} {'loss': 0.4936, 'learning_rate': 6.669475368130809e-06, 'epoch': 1.24} {'loss': 0.3047, 'learning_rate': 6.669158573892822e-06, 'epoch': 1.24} {'loss': 0.4366, 'learning_rate': 6.66884178341472e-06, 'epoch': 1.24} {'loss': 0.3096, 'learning_rate': 6.668524996696861e-06, 'epoch': 1.24} {'loss': 0.3811, 'learning_rate': 6.668208213739606e-06, 'epoch': 1.24} {'loss': 0.3425, 'learning_rate': 6.667891434543309e-06, 'epoch': 1.24} {'loss': 0.2778, 'learning_rate': 6.667574659108329e-06, 'epoch': 1.24} {'loss': 0.3321, 'learning_rate': 6.667257887435023e-06, 'epoch': 1.24} {'loss': 0.4088, 'learning_rate': 6.6669411195237495e-06, 'epoch': 1.24} {'loss': 0.2991, 'learning_rate': 6.6666243553748665e-06, 'epoch': 1.24} {'loss': 0.4227, 'learning_rate': 6.66630759498873e-06, 'epoch': 1.24} {'loss': 0.4144, 'learning_rate': 6.665990838365699e-06, 'epoch': 1.24} {'loss': 0.2779, 'learning_rate': 6.665674085506129e-06, 'epoch': 1.24} {'loss': 0.3454, 'learning_rate': 6.66535733641038e-06, 'epoch': 1.24} {'loss': 0.4278, 'learning_rate': 6.66504059107881e-06, 'epoch': 1.24} {'loss': 0.3507, 'learning_rate': 6.6647238495117726e-06, 'epoch': 1.24} {'loss': 0.2411, 'learning_rate': 6.664407111709627e-06, 'epoch': 1.24} {'loss': 0.446, 'learning_rate': 6.664090377672734e-06, 'epoch': 1.24} {'loss': 0.3574, 'learning_rate': 6.663773647401448e-06, 'epoch': 1.24} {'loss': 0.2302, 'learning_rate': 6.6634569208961255e-06, 'epoch': 1.24} {'loss': 0.3234, 'learning_rate': 6.663140198157127e-06, 'epoch': 1.24} {'loss': 0.3967, 'learning_rate': 6.6628234791848075e-06, 'epoch': 1.24} {'loss': 0.3451, 'learning_rate': 6.662506763979527e-06, 'epoch': 1.24} {'loss': 0.3289, 'learning_rate': 6.662190052541641e-06, 'epoch': 1.24} {'loss': 0.2832, 'learning_rate': 6.6618733448715075e-06, 'epoch': 1.24} {'loss': 0.2669, 'learning_rate': 6.661556640969485e-06, 'epoch': 1.24} {'loss': 0.3765, 'learning_rate': 6.66123994083593e-06, 'epoch': 1.24} {'loss': 0.256, 'learning_rate': 6.660923244471203e-06, 'epoch': 1.24} {'loss': 0.4733, 'learning_rate': 6.660606551875655e-06, 'epoch': 1.24} {'loss': 0.3321, 'learning_rate': 6.660289863049647e-06, 'epoch': 1.24} {'loss': 0.2275, 'learning_rate': 6.6599731779935385e-06, 'epoch': 1.24} {'loss': 0.3032, 'learning_rate': 6.659656496707685e-06, 'epoch': 1.24} {'loss': 0.3077, 'learning_rate': 6.659339819192443e-06, 'epoch': 1.24} {'loss': 0.2766, 'learning_rate': 6.659023145448172e-06, 'epoch': 1.24} {'loss': 0.4375, 'learning_rate': 6.658706475475227e-06, 'epoch': 1.24} {'loss': 0.3322, 'learning_rate': 6.658389809273969e-06, 'epoch': 1.24} {'loss': 0.3709, 'learning_rate': 6.658073146844752e-06, 'epoch': 1.24} {'loss': 0.2919, 'learning_rate': 6.657756488187935e-06, 'epoch': 1.24} {'loss': 0.2342, 'learning_rate': 6.6574398333038756e-06, 'epoch': 1.24} {'loss': 0.3108, 'learning_rate': 6.657123182192932e-06, 'epoch': 1.24} {'loss': 0.5425, 'learning_rate': 6.6568065348554615e-06, 'epoch': 1.24} {'loss': 0.2726, 'learning_rate': 6.656489891291819e-06, 'epoch': 1.24} {'loss': 0.2452, 'learning_rate': 6.656173251502364e-06, 'epoch': 1.24} {'loss': 0.1865, 'learning_rate': 6.655856615487453e-06, 'epoch': 1.24} {'loss': 0.1969, 'learning_rate': 6.655539983247443e-06, 'epoch': 1.24} {'loss': 0.3928, 'learning_rate': 6.655223354782694e-06, 'epoch': 1.24} {'loss': 0.3996, 'learning_rate': 6.6549067300935625e-06, 'epoch': 1.24} {'loss': 0.3783, 'learning_rate': 6.654590109180403e-06, 'epoch': 1.24} {'loss': 0.3056, 'learning_rate': 6.654273492043577e-06, 'epoch': 1.24} {'loss': 0.2667, 'learning_rate': 6.6539568786834385e-06, 'epoch': 1.24} {'loss': 0.2299, 'learning_rate': 6.6536402691003476e-06, 'epoch': 1.24} {'loss': 0.4114, 'learning_rate': 6.653323663294659e-06, 'epoch': 1.24} {'loss': 0.3602, 'learning_rate': 6.653007061266733e-06, 'epoch': 1.24} {'loss': 0.3926, 'learning_rate': 6.652690463016927e-06, 'epoch': 1.24} {'loss': 0.1413, 'learning_rate': 6.652373868545595e-06, 'epoch': 1.24} {'loss': 0.4112, 'learning_rate': 6.652057277853097e-06, 'epoch': 1.24} {'loss': 0.3178, 'learning_rate': 6.651740690939788e-06, 'epoch': 1.24} {'loss': 0.3152, 'learning_rate': 6.651424107806028e-06, 'epoch': 1.24} {'loss': 0.4686, 'learning_rate': 6.651107528452174e-06, 'epoch': 1.24} {'loss': 0.2593, 'learning_rate': 6.650790952878583e-06, 'epoch': 1.24} {'loss': 0.4645, 'learning_rate': 6.650474381085611e-06, 'epoch': 1.24} {'loss': 0.3742, 'learning_rate': 6.650157813073617e-06, 'epoch': 1.24} {'loss': 0.2727, 'learning_rate': 6.649841248842958e-06, 'epoch': 1.24} {'loss': 0.2519, 'learning_rate': 6.649524688393991e-06, 'epoch': 1.24} {'loss': 0.4494, 'learning_rate': 6.6492081317270725e-06, 'epoch': 1.24} {'loss': 0.1594, 'learning_rate': 6.648891578842562e-06, 'epoch': 1.24} {'loss': 0.3617, 'learning_rate': 6.648575029740818e-06, 'epoch': 1.24} {'loss': 0.3464, 'learning_rate': 6.648258484422192e-06, 'epoch': 1.24} {'loss': 0.1714, 'learning_rate': 6.647941942887046e-06, 'epoch': 1.24} {'loss': 0.3224, 'learning_rate': 6.647625405135731e-06, 'epoch': 1.24} {'loss': 0.3084, 'learning_rate': 6.647308871168616e-06, 'epoch': 1.24} {'loss': 0.2166, 'learning_rate': 6.6469923409860495e-06, 'epoch': 1.24} {'loss': 0.2886, 'learning_rate': 6.646675814588391e-06, 'epoch': 1.24} {'loss': 0.2916, 'learning_rate': 6.646359291975999e-06, 'epoch': 1.24} {'loss': 0.3539, 'learning_rate': 6.646042773149231e-06, 'epoch': 1.24} {'loss': 0.5428, 'learning_rate': 6.645726258108441e-06, 'epoch': 1.24} {'loss': 0.1676, 'learning_rate': 6.645409746853988e-06, 'epoch': 1.24} {'loss': 0.2343, 'learning_rate': 6.64509323938623e-06, 'epoch': 1.24} {'loss': 0.403, 'learning_rate': 6.644776735705524e-06, 'epoch': 1.24} {'loss': 0.2463, 'learning_rate': 6.644460235812227e-06, 'epoch': 1.24} {'loss': 0.2844, 'learning_rate': 6.644143739706694e-06, 'epoch': 1.24} {'loss': 0.2161, 'learning_rate': 6.643827247389287e-06, 'epoch': 1.24} {'loss': 0.3329, 'learning_rate': 6.643510758860361e-06, 'epoch': 1.24} {'loss': 0.2427, 'learning_rate': 6.6431942741202714e-06, 'epoch': 1.24} {'loss': 0.3973, 'learning_rate': 6.6428777931693776e-06, 'epoch': 1.24} {'loss': 0.261, 'learning_rate': 6.642561316008038e-06, 'epoch': 1.24} {'loss': 0.4223, 'learning_rate': 6.6422448426366075e-06, 'epoch': 1.24} {'loss': 0.3448, 'learning_rate': 6.6419283730554444e-06, 'epoch': 1.24} {'loss': 0.4396, 'learning_rate': 6.641611907264905e-06, 'epoch': 1.24} {'loss': 0.2691, 'learning_rate': 6.641295445265348e-06, 'epoch': 1.24} {'loss': 0.3875, 'learning_rate': 6.640978987057127e-06, 'epoch': 1.24} {'loss': 0.3405, 'learning_rate': 6.640662532640605e-06, 'epoch': 1.24} {'loss': 0.1917, 'learning_rate': 6.640346082016133e-06, 'epoch': 1.24} {'loss': 0.3547, 'learning_rate': 6.640029635184075e-06, 'epoch': 1.24} {'loss': 0.4776, 'learning_rate': 6.639713192144782e-06, 'epoch': 1.24} {'loss': 0.2575, 'learning_rate': 6.639396752898615e-06, 'epoch': 1.24} {'loss': 0.3936, 'learning_rate': 6.639080317445929e-06, 'epoch': 1.24} {'loss': 0.2951, 'learning_rate': 6.638763885787084e-06, 'epoch': 1.24} {'loss': 0.4468, 'learning_rate': 6.6384474579224345e-06, 'epoch': 1.24} {'loss': 0.3146, 'learning_rate': 6.638131033852337e-06, 'epoch': 1.24} {'loss': 0.209, 'learning_rate': 6.6378146135771544e-06, 'epoch': 1.24} {'loss': 0.3391, 'learning_rate': 6.637498197097237e-06, 'epoch': 1.24} {'loss': 0.3178, 'learning_rate': 6.637181784412945e-06, 'epoch': 1.24} {'loss': 0.2353, 'learning_rate': 6.636865375524635e-06, 'epoch': 1.24} {'loss': 0.3596, 'learning_rate': 6.636548970432665e-06, 'epoch': 1.24} {'loss': 0.4505, 'learning_rate': 6.63623256913739e-06, 'epoch': 1.24} {'loss': 0.3363, 'learning_rate': 6.635916171639171e-06, 'epoch': 1.24} {'loss': 0.3151, 'learning_rate': 6.635599777938362e-06, 'epoch': 1.24} {'loss': 0.2333, 'learning_rate': 6.6352833880353205e-06, 'epoch': 1.24} {'loss': 0.2369, 'learning_rate': 6.634967001930405e-06, 'epoch': 1.24} {'loss': 0.3297, 'learning_rate': 6.634650619623971e-06, 'epoch': 1.24} {'loss': 0.3753, 'learning_rate': 6.634334241116378e-06, 'epoch': 1.24} {'loss': 0.2843, 'learning_rate': 6.63401786640798e-06, 'epoch': 1.24} {'loss': 0.4021, 'learning_rate': 6.6337014954991384e-06, 'epoch': 1.24} {'loss': 0.3629, 'learning_rate': 6.633385128390206e-06, 'epoch': 1.24} {'loss': 0.2328, 'learning_rate': 6.633068765081541e-06, 'epoch': 1.24} {'loss': 0.3057, 'learning_rate': 6.632752405573502e-06, 'epoch': 1.24} {'loss': 0.3191, 'learning_rate': 6.6324360498664444e-06, 'epoch': 1.24} {'loss': 0.307, 'learning_rate': 6.632119697960726e-06, 'epoch': 1.24} {'loss': 0.3687, 'learning_rate': 6.631803349856704e-06, 'epoch': 1.24} {'loss': 0.2538, 'learning_rate': 6.631487005554736e-06, 'epoch': 1.24} {'loss': 0.3953, 'learning_rate': 6.63117066505518e-06, 'epoch': 1.24} {'loss': 0.3609, 'learning_rate': 6.63085432835839e-06, 'epoch': 1.24} {'loss': 0.35, 'learning_rate': 6.630537995464726e-06, 'epoch': 1.24} {'loss': 0.2816, 'learning_rate': 6.630221666374541e-06, 'epoch': 1.24} {'loss': 0.3984, 'learning_rate': 6.629905341088198e-06, 'epoch': 1.24} {'loss': 0.2795, 'learning_rate': 6.6295890196060505e-06, 'epoch': 1.24} {'loss': 0.3154, 'learning_rate': 6.629272701928457e-06, 'epoch': 1.24} {'loss': 0.3996, 'learning_rate': 6.628956388055771e-06, 'epoch': 1.24} {'loss': 0.4481, 'learning_rate': 6.628640077988353e-06, 'epoch': 1.24} {'loss': 0.1896, 'learning_rate': 6.62832377172656e-06, 'epoch': 1.24} {'loss': 0.3742, 'learning_rate': 6.628007469270747e-06, 'epoch': 1.24} {'loss': 0.3079, 'learning_rate': 6.627691170621274e-06, 'epoch': 1.24} {'loss': 0.2627, 'learning_rate': 6.627374875778496e-06, 'epoch': 1.24} {'loss': 0.3313, 'learning_rate': 6.627058584742769e-06, 'epoch': 1.24} {'loss': 0.3917, 'learning_rate': 6.626742297514453e-06, 'epoch': 1.24} {'loss': 0.3161, 'learning_rate': 6.626426014093903e-06, 'epoch': 1.24} {'loss': 0.3801, 'learning_rate': 6.626109734481477e-06, 'epoch': 1.24} {'loss': 0.2497, 'learning_rate': 6.625793458677532e-06, 'epoch': 1.24} {'loss': 0.2082, 'learning_rate': 6.625477186682423e-06, 'epoch': 1.24} {'loss': 0.3656, 'learning_rate': 6.625160918496512e-06, 'epoch': 1.24} {'loss': 0.392, 'learning_rate': 6.624844654120148e-06, 'epoch': 1.24} {'loss': 0.2884, 'learning_rate': 6.624528393553695e-06, 'epoch': 1.24} {'loss': 0.3649, 'learning_rate': 6.624212136797508e-06, 'epoch': 1.24} {'loss': 0.2738, 'learning_rate': 6.6238958838519405e-06, 'epoch': 1.24} {'loss': 0.4016, 'learning_rate': 6.623579634717356e-06, 'epoch': 1.24} {'loss': 0.3171, 'learning_rate': 6.623263389394106e-06, 'epoch': 1.24} {'loss': 0.3284, 'learning_rate': 6.6229471478825505e-06, 'epoch': 1.24} {'loss': 0.3178, 'learning_rate': 6.622630910183044e-06, 'epoch': 1.24} {'loss': 0.407, 'learning_rate': 6.622314676295947e-06, 'epoch': 1.24} {'loss': 0.4404, 'learning_rate': 6.621998446221613e-06, 'epoch': 1.24} {'loss': 0.3011, 'learning_rate': 6.621682219960401e-06, 'epoch': 1.24} {'loss': 0.2867, 'learning_rate': 6.621365997512668e-06, 'epoch': 1.24} {'loss': 0.3662, 'learning_rate': 6.621049778878771e-06, 'epoch': 1.24} {'loss': 0.3291, 'learning_rate': 6.620733564059064e-06, 'epoch': 1.24} {'loss': 0.3005, 'learning_rate': 6.620417353053908e-06, 'epoch': 1.24} {'loss': 0.3229, 'learning_rate': 6.6201011458636566e-06, 'epoch': 1.24} {'loss': 0.3577, 'learning_rate': 6.61978494248867e-06, 'epoch': 1.24} {'loss': 0.334, 'learning_rate': 6.6194687429293e-06, 'epoch': 1.24} {'loss': 0.4283, 'learning_rate': 6.619152547185909e-06, 'epoch': 1.24} {'loss': 0.318, 'learning_rate': 6.618836355258853e-06, 'epoch': 1.24} {'loss': 0.3016, 'learning_rate': 6.618520167148488e-06, 'epoch': 1.24} {'loss': 0.2415, 'learning_rate': 6.618203982855169e-06, 'epoch': 1.24} {'loss': 0.3326, 'learning_rate': 6.617887802379255e-06, 'epoch': 1.24} {'loss': 0.358, 'learning_rate': 6.617571625721102e-06, 'epoch': 1.24} {'loss': 0.3133, 'learning_rate': 6.617255452881068e-06, 'epoch': 1.24} {'loss': 0.3757, 'learning_rate': 6.616939283859513e-06, 'epoch': 1.24} {'loss': 0.3137, 'learning_rate': 6.6166231186567865e-06, 'epoch': 1.24} {'loss': 0.2669, 'learning_rate': 6.616306957273244e-06, 'epoch': 1.24} {'loss': 0.3215, 'learning_rate': 6.615990799709253e-06, 'epoch': 1.24} {'loss': 0.2644, 'learning_rate': 6.6156746459651655e-06, 'epoch': 1.24} {'loss': 0.349, 'learning_rate': 6.615358496041337e-06, 'epoch': 1.24} {'loss': 0.1607, 'learning_rate': 6.615042349938126e-06, 'epoch': 1.24} {'loss': 0.3587, 'learning_rate': 6.614726207655888e-06, 'epoch': 1.24} {'loss': 0.2737, 'learning_rate': 6.614410069194981e-06, 'epoch': 1.24} {'loss': 0.2284, 'learning_rate': 6.6140939345557605e-06, 'epoch': 1.24} {'loss': 0.4426, 'learning_rate': 6.613777803738583e-06, 'epoch': 1.24} {'loss': 0.3707, 'learning_rate': 6.613461676743809e-06, 'epoch': 1.24} {'loss': 0.4436, 'learning_rate': 6.61314555357179e-06, 'epoch': 1.24} {'loss': 0.2605, 'learning_rate': 6.612829434222887e-06, 'epoch': 1.24} {'loss': 0.2882, 'learning_rate': 6.6125133186974554e-06, 'epoch': 1.24} {'loss': 0.3355, 'learning_rate': 6.612197206995852e-06, 'epoch': 1.24} {'loss': 0.2737, 'learning_rate': 6.611881099118433e-06, 'epoch': 1.24} {'loss': 0.3897, 'learning_rate': 6.611564995065557e-06, 'epoch': 1.24} {'loss': 0.3317, 'learning_rate': 6.611248894837578e-06, 'epoch': 1.24} {'loss': 0.4382, 'learning_rate': 6.610932798434857e-06, 'epoch': 1.24} {'loss': 0.1947, 'learning_rate': 6.610616705857749e-06, 'epoch': 1.24} {'loss': 0.3786, 'learning_rate': 6.6103006171066085e-06, 'epoch': 1.24} {'loss': 0.2411, 'learning_rate': 6.609984532181795e-06, 'epoch': 1.24} {'loss': 0.414, 'learning_rate': 6.609668451083663e-06, 'epoch': 1.24} {'loss': 0.2478, 'learning_rate': 6.609352373812571e-06, 'epoch': 1.24} {'loss': 0.2064, 'learning_rate': 6.609036300368877e-06, 'epoch': 1.24} {'loss': 0.444, 'learning_rate': 6.608720230752933e-06, 'epoch': 1.24} {'loss': 0.2334, 'learning_rate': 6.608404164965101e-06, 'epoch': 1.24} {'loss': 0.3313, 'learning_rate': 6.608088103005735e-06, 'epoch': 1.24} {'loss': 0.3201, 'learning_rate': 6.607772044875194e-06, 'epoch': 1.24} {'loss': 0.3365, 'learning_rate': 6.607455990573832e-06, 'epoch': 1.24} {'loss': 0.375, 'learning_rate': 6.607139940102008e-06, 'epoch': 1.24} {'loss': 0.4687, 'learning_rate': 6.606823893460076e-06, 'epoch': 1.24} {'loss': 0.2635, 'learning_rate': 6.606507850648396e-06, 'epoch': 1.24} {'loss': 0.1976, 'learning_rate': 6.606191811667324e-06, 'epoch': 1.24} {'loss': 0.268, 'learning_rate': 6.605875776517217e-06, 'epoch': 1.24} {'loss': 0.1449, 'learning_rate': 6.6055597451984275e-06, 'epoch': 1.24} {'loss': 0.2593, 'learning_rate': 6.605243717711317e-06, 'epoch': 1.24} {'loss': 0.2871, 'learning_rate': 6.604927694056241e-06, 'epoch': 1.24} {'loss': 0.3104, 'learning_rate': 6.604611674233557e-06, 'epoch': 1.24} {'loss': 0.358, 'learning_rate': 6.604295658243618e-06, 'epoch': 1.24} {'loss': 0.3771, 'learning_rate': 6.603979646086785e-06, 'epoch': 1.24} {'loss': 0.3736, 'learning_rate': 6.603663637763413e-06, 'epoch': 1.24} {'loss': 0.3819, 'learning_rate': 6.6033476332738596e-06, 'epoch': 1.24} {'loss': 0.2106, 'learning_rate': 6.60303163261848e-06, 'epoch': 1.24} {'loss': 0.1836, 'learning_rate': 6.602715635797633e-06, 'epoch': 1.24} {'loss': 0.5026, 'learning_rate': 6.602399642811673e-06, 'epoch': 1.24} {'loss': 0.3019, 'learning_rate': 6.60208365366096e-06, 'epoch': 1.24} {'loss': 0.3818, 'learning_rate': 6.601767668345846e-06, 'epoch': 1.24} {'loss': 0.2979, 'learning_rate': 6.601451686866691e-06, 'epoch': 1.24} {'loss': 0.3578, 'learning_rate': 6.60113570922385e-06, 'epoch': 1.25} {'loss': 0.3643, 'learning_rate': 6.600819735417681e-06, 'epoch': 1.25} {'loss': 0.3793, 'learning_rate': 6.600503765448539e-06, 'epoch': 1.25} {'loss': 0.3648, 'learning_rate': 6.600187799316783e-06, 'epoch': 1.25} {'loss': 0.386, 'learning_rate': 6.599871837022768e-06, 'epoch': 1.25} {'loss': 0.3169, 'learning_rate': 6.59955587856685e-06, 'epoch': 1.25} {'loss': 0.3697, 'learning_rate': 6.599239923949389e-06, 'epoch': 1.25} {'loss': 0.2784, 'learning_rate': 6.598923973170739e-06, 'epoch': 1.25} {'loss': 0.3685, 'learning_rate': 6.598608026231256e-06, 'epoch': 1.25} {'loss': 0.2691, 'learning_rate': 6.598292083131298e-06, 'epoch': 1.25} {'loss': 0.1966, 'learning_rate': 6.597976143871223e-06, 'epoch': 1.25} {'loss': 0.2844, 'learning_rate': 6.597660208451386e-06, 'epoch': 1.25} {'loss': 0.2615, 'learning_rate': 6.597344276872142e-06, 'epoch': 1.25} {'loss': 0.3779, 'learning_rate': 6.59702834913385e-06, 'epoch': 1.25} {'loss': 0.3023, 'learning_rate': 6.596712425236864e-06, 'epoch': 1.25} {'loss': 0.3148, 'learning_rate': 6.596396505181544e-06, 'epoch': 1.25} {'loss': 0.3368, 'learning_rate': 6.596080588968246e-06, 'epoch': 1.25} {'loss': 0.2107, 'learning_rate': 6.595764676597324e-06, 'epoch': 1.25} {'loss': 0.3822, 'learning_rate': 6.595448768069137e-06, 'epoch': 1.25} {'loss': 0.2709, 'learning_rate': 6.595132863384041e-06, 'epoch': 1.25} {'loss': 0.2735, 'learning_rate': 6.594816962542392e-06, 'epoch': 1.25} {'loss': 0.198, 'learning_rate': 6.594501065544548e-06, 'epoch': 1.25} {'loss': 0.2781, 'learning_rate': 6.5941851723908645e-06, 'epoch': 1.25} {'loss': 0.3304, 'learning_rate': 6.5938692830817e-06, 'epoch': 1.25} {'loss': 0.3125, 'learning_rate': 6.593553397617408e-06, 'epoch': 1.25} {'loss': 0.3259, 'learning_rate': 6.593237515998345e-06, 'epoch': 1.25} {'loss': 0.5105, 'learning_rate': 6.592921638224872e-06, 'epoch': 1.25} {'loss': 0.4037, 'learning_rate': 6.592605764297339e-06, 'epoch': 1.25} {'loss': 0.2885, 'learning_rate': 6.592289894216108e-06, 'epoch': 1.25} {'loss': 0.3569, 'learning_rate': 6.591974027981534e-06, 'epoch': 1.25} {'loss': 0.2649, 'learning_rate': 6.591658165593973e-06, 'epoch': 1.25} {'loss': 0.3876, 'learning_rate': 6.591342307053781e-06, 'epoch': 1.25} {'loss': 0.3306, 'learning_rate': 6.591026452361315e-06, 'epoch': 1.25} {'loss': 0.2251, 'learning_rate': 6.590710601516934e-06, 'epoch': 1.25} {'loss': 0.469, 'learning_rate': 6.59039475452099e-06, 'epoch': 1.25} {'loss': 0.2014, 'learning_rate': 6.590078911373844e-06, 'epoch': 1.25} {'loss': 0.3559, 'learning_rate': 6.589763072075852e-06, 'epoch': 1.25} {'loss': 0.2712, 'learning_rate': 6.589447236627367e-06, 'epoch': 1.25} {'loss': 0.4431, 'learning_rate': 6.589131405028746e-06, 'epoch': 1.25} {'loss': 0.3054, 'learning_rate': 6.588815577280349e-06, 'epoch': 1.25} {'loss': 0.4739, 'learning_rate': 6.588499753382529e-06, 'epoch': 1.25} {'loss': 0.2244, 'learning_rate': 6.588183933335646e-06, 'epoch': 1.25} {'loss': 0.3645, 'learning_rate': 6.587868117140053e-06, 'epoch': 1.25} {'loss': 0.4045, 'learning_rate': 6.587552304796108e-06, 'epoch': 1.25} {'loss': 0.2542, 'learning_rate': 6.587236496304168e-06, 'epoch': 1.25} {'loss': 0.3219, 'learning_rate': 6.586920691664589e-06, 'epoch': 1.25} {'loss': 0.3505, 'learning_rate': 6.586604890877728e-06, 'epoch': 1.25} {'loss': 0.2729, 'learning_rate': 6.58628909394394e-06, 'epoch': 1.25} {'loss': 0.3383, 'learning_rate': 6.5859733008635825e-06, 'epoch': 1.25} {'loss': 0.3013, 'learning_rate': 6.5856575116370146e-06, 'epoch': 1.25} {'loss': 0.3934, 'learning_rate': 6.585341726264588e-06, 'epoch': 1.25} {'loss': 0.3019, 'learning_rate': 6.585025944746661e-06, 'epoch': 1.25} {'loss': 0.3869, 'learning_rate': 6.584710167083585e-06, 'epoch': 1.25} {'loss': 0.3733, 'learning_rate': 6.584394393275728e-06, 'epoch': 1.25} {'loss': 0.42, 'learning_rate': 6.58407862332344e-06, 'epoch': 1.25} {'loss': 0.3873, 'learning_rate': 6.5837628572270775e-06, 'epoch': 1.25} {'loss': 0.259, 'learning_rate': 6.583447094986997e-06, 'epoch': 1.25} {'loss': 0.2197, 'learning_rate': 6.583131336603557e-06, 'epoch': 1.25} {'loss': 0.2833, 'learning_rate': 6.582815582077109e-06, 'epoch': 1.25} {'loss': 0.4019, 'learning_rate': 6.582499831408013e-06, 'epoch': 1.25} {'loss': 0.2626, 'learning_rate': 6.582184084596626e-06, 'epoch': 1.25} {'loss': 0.4897, 'learning_rate': 6.5818683416433e-06, 'epoch': 1.25} {'loss': 0.3378, 'learning_rate': 6.5815526025483975e-06, 'epoch': 1.25} {'loss': 0.2453, 'learning_rate': 6.581236867312273e-06, 'epoch': 1.25} {'loss': 0.3046, 'learning_rate': 6.580921135935279e-06, 'epoch': 1.25} {'loss': 0.2539, 'learning_rate': 6.580605408417777e-06, 'epoch': 1.25} {'loss': 0.3591, 'learning_rate': 6.5802896847601195e-06, 'epoch': 1.25} {'loss': 0.3572, 'learning_rate': 6.579973964962667e-06, 'epoch': 1.25} {'loss': 0.3914, 'learning_rate': 6.579658249025771e-06, 'epoch': 1.25} {'loss': 0.2823, 'learning_rate': 6.579342536949792e-06, 'epoch': 1.25} {'loss': 0.2359, 'learning_rate': 6.579026828735087e-06, 'epoch': 1.25} {'loss': 0.2997, 'learning_rate': 6.578711124382007e-06, 'epoch': 1.25} {'loss': 0.317, 'learning_rate': 6.578395423890913e-06, 'epoch': 1.25} {'loss': 0.3277, 'learning_rate': 6.578079727262159e-06, 'epoch': 1.25} {'loss': 0.3818, 'learning_rate': 6.577764034496103e-06, 'epoch': 1.25} {'loss': 0.2761, 'learning_rate': 6.5774483455930995e-06, 'epoch': 1.25} {'loss': 0.481, 'learning_rate': 6.577132660553507e-06, 'epoch': 1.25} {'loss': 0.4622, 'learning_rate': 6.57681697937768e-06, 'epoch': 1.25} {'loss': 0.3669, 'learning_rate': 6.5765013020659766e-06, 'epoch': 1.25} {'loss': 0.3124, 'learning_rate': 6.5761856286187506e-06, 'epoch': 1.25} {'loss': 0.3094, 'learning_rate': 6.5758699590363606e-06, 'epoch': 1.25} {'loss': 0.3303, 'learning_rate': 6.575554293319164e-06, 'epoch': 1.25} {'loss': 0.3058, 'learning_rate': 6.575238631467513e-06, 'epoch': 1.25} {'loss': 0.3677, 'learning_rate': 6.57492297348177e-06, 'epoch': 1.25} {'loss': 0.4158, 'learning_rate': 6.574607319362285e-06, 'epoch': 1.25} {'loss': 0.3048, 'learning_rate': 6.574291669109417e-06, 'epoch': 1.25} {'loss': 0.3726, 'learning_rate': 6.5739760227235225e-06, 'epoch': 1.25} {'loss': 0.332, 'learning_rate': 6.573660380204958e-06, 'epoch': 1.25} {'loss': 0.2474, 'learning_rate': 6.573344741554079e-06, 'epoch': 1.25} {'loss': 0.3278, 'learning_rate': 6.573029106771241e-06, 'epoch': 1.25} {'loss': 0.3343, 'learning_rate': 6.572713475856802e-06, 'epoch': 1.25} {'loss': 0.4299, 'learning_rate': 6.5723978488111185e-06, 'epoch': 1.25} {'loss': 0.4537, 'learning_rate': 6.572082225634547e-06, 'epoch': 1.25} {'loss': 0.3734, 'learning_rate': 6.571766606327441e-06, 'epoch': 1.25} {'loss': 0.3526, 'learning_rate': 6.571450990890159e-06, 'epoch': 1.25} {'loss': 0.5074, 'learning_rate': 6.571135379323057e-06, 'epoch': 1.25} {'loss': 0.3215, 'learning_rate': 6.570819771626493e-06, 'epoch': 1.25} {'loss': 0.4526, 'learning_rate': 6.570504167800819e-06, 'epoch': 1.25} {'loss': 0.1767, 'learning_rate': 6.570188567846395e-06, 'epoch': 1.25} {'loss': 0.4003, 'learning_rate': 6.5698729717635755e-06, 'epoch': 1.25} {'loss': 0.4024, 'learning_rate': 6.569557379552716e-06, 'epoch': 1.25} {'loss': 0.3459, 'learning_rate': 6.569241791214176e-06, 'epoch': 1.25} {'loss': 0.2867, 'learning_rate': 6.568926206748307e-06, 'epoch': 1.25} {'loss': 0.3192, 'learning_rate': 6.56861062615547e-06, 'epoch': 1.25} {'loss': 0.3808, 'learning_rate': 6.568295049436017e-06, 'epoch': 1.25} {'loss': 0.2732, 'learning_rate': 6.567979476590309e-06, 'epoch': 1.25} {'loss': 0.3426, 'learning_rate': 6.567663907618698e-06, 'epoch': 1.25} {'loss': 0.3981, 'learning_rate': 6.567348342521542e-06, 'epoch': 1.25} {'loss': 0.3044, 'learning_rate': 6.567032781299196e-06, 'epoch': 1.25} {'loss': 0.4178, 'learning_rate': 6.566717223952021e-06, 'epoch': 1.25} {'loss': 0.3699, 'learning_rate': 6.566401670480366e-06, 'epoch': 1.25} {'loss': 0.3228, 'learning_rate': 6.566086120884591e-06, 'epoch': 1.25} {'loss': 0.2626, 'learning_rate': 6.5657705751650515e-06, 'epoch': 1.25} {'loss': 0.3199, 'learning_rate': 6.5654550333221045e-06, 'epoch': 1.25} {'loss': 0.3649, 'learning_rate': 6.565139495356105e-06, 'epoch': 1.25} {'loss': 0.3335, 'learning_rate': 6.56482396126741e-06, 'epoch': 1.25} {'loss': 0.2677, 'learning_rate': 6.564508431056375e-06, 'epoch': 1.25} {'loss': 0.294, 'learning_rate': 6.564192904723359e-06, 'epoch': 1.25} {'loss': 0.2885, 'learning_rate': 6.563877382268714e-06, 'epoch': 1.25} {'loss': 0.1552, 'learning_rate': 6.563561863692798e-06, 'epoch': 1.25} {'loss': 0.3171, 'learning_rate': 6.5632463489959685e-06, 'epoch': 1.25} {'loss': 0.3017, 'learning_rate': 6.562930838178578e-06, 'epoch': 1.25} {'loss': 0.3595, 'learning_rate': 6.562615331240989e-06, 'epoch': 1.25} {'loss': 0.313, 'learning_rate': 6.562299828183552e-06, 'epoch': 1.25} {'loss': 0.3967, 'learning_rate': 6.561984329006623e-06, 'epoch': 1.25} {'loss': 0.2988, 'learning_rate': 6.561668833710561e-06, 'epoch': 1.25} {'loss': 0.3138, 'learning_rate': 6.5613533422957195e-06, 'epoch': 1.25} {'loss': 0.2577, 'learning_rate': 6.561037854762457e-06, 'epoch': 1.25} {'loss': 0.4059, 'learning_rate': 6.56072237111113e-06, 'epoch': 1.25} {'loss': 0.2047, 'learning_rate': 6.5604068913420925e-06, 'epoch': 1.25} {'loss': 0.2647, 'learning_rate': 6.560091415455703e-06, 'epoch': 1.25} {'loss': 0.3773, 'learning_rate': 6.559775943452315e-06, 'epoch': 1.25} {'loss': 0.3191, 'learning_rate': 6.5594604753322854e-06, 'epoch': 1.25} {'loss': 0.3902, 'learning_rate': 6.559145011095971e-06, 'epoch': 1.25} {'loss': 0.3446, 'learning_rate': 6.5588295507437276e-06, 'epoch': 1.25} {'loss': 0.3133, 'learning_rate': 6.558514094275913e-06, 'epoch': 1.25} {'loss': 0.3091, 'learning_rate': 6.55819864169288e-06, 'epoch': 1.25} {'loss': 0.417, 'learning_rate': 6.557883192994986e-06, 'epoch': 1.25} {'loss': 0.3524, 'learning_rate': 6.557567748182587e-06, 'epoch': 1.25} {'loss': 0.3908, 'learning_rate': 6.55725230725604e-06, 'epoch': 1.25} {'loss': 0.2562, 'learning_rate': 6.5569368702157e-06, 'epoch': 1.25} {'loss': 0.3621, 'learning_rate': 6.556621437061924e-06, 'epoch': 1.25} {'loss': 0.3699, 'learning_rate': 6.556306007795068e-06, 'epoch': 1.25} {'loss': 0.3432, 'learning_rate': 6.555990582415486e-06, 'epoch': 1.25} {'loss': 0.3312, 'learning_rate': 6.555675160923537e-06, 'epoch': 1.25} {'loss': 0.2204, 'learning_rate': 6.5553597433195755e-06, 'epoch': 1.25} {'loss': 0.3467, 'learning_rate': 6.5550443296039575e-06, 'epoch': 1.25} {'loss': 0.2466, 'learning_rate': 6.554728919777041e-06, 'epoch': 1.25} {'loss': 0.3708, 'learning_rate': 6.554413513839178e-06, 'epoch': 1.25} {'loss': 0.4039, 'learning_rate': 6.55409811179073e-06, 'epoch': 1.25} {'loss': 0.4451, 'learning_rate': 6.5537827136320485e-06, 'epoch': 1.25} {'loss': 0.2162, 'learning_rate': 6.553467319363487e-06, 'epoch': 1.25} {'loss': 0.3438, 'learning_rate': 6.553151928985409e-06, 'epoch': 1.25} {'loss': 0.3285, 'learning_rate': 6.552836542498166e-06, 'epoch': 1.25} {'loss': 0.2683, 'learning_rate': 6.552521159902117e-06, 'epoch': 1.25} {'loss': 0.2977, 'learning_rate': 6.552205781197615e-06, 'epoch': 1.25} {'loss': 0.3531, 'learning_rate': 6.55189040638502e-06, 'epoch': 1.25} {'loss': 0.3092, 'learning_rate': 6.551575035464681e-06, 'epoch': 1.25} {'loss': 0.203, 'learning_rate': 6.55125966843696e-06, 'epoch': 1.25} {'loss': 0.4457, 'learning_rate': 6.550944305302209e-06, 'epoch': 1.25} {'loss': 0.2219, 'learning_rate': 6.550628946060788e-06, 'epoch': 1.25} {'loss': 0.3424, 'learning_rate': 6.550313590713051e-06, 'epoch': 1.25} {'loss': 0.3493, 'learning_rate': 6.549998239259352e-06, 'epoch': 1.25} {'loss': 0.3837, 'learning_rate': 6.549682891700051e-06, 'epoch': 1.25} {'loss': 0.3129, 'learning_rate': 6.549367548035502e-06, 'epoch': 1.25} {'loss': 0.3949, 'learning_rate': 6.549052208266059e-06, 'epoch': 1.25} {'loss': 0.3137, 'learning_rate': 6.548736872392081e-06, 'epoch': 1.25} {'loss': 0.3057, 'learning_rate': 6.548421540413923e-06, 'epoch': 1.25} {'loss': 0.2367, 'learning_rate': 6.54810621233194e-06, 'epoch': 1.25} {'loss': 0.2412, 'learning_rate': 6.54779088814649e-06, 'epoch': 1.25} {'loss': 0.198, 'learning_rate': 6.547475567857927e-06, 'epoch': 1.25} {'loss': 0.2797, 'learning_rate': 6.547160251466606e-06, 'epoch': 1.25} {'loss': 0.3094, 'learning_rate': 6.5468449389728875e-06, 'epoch': 1.25} {'loss': 0.4338, 'learning_rate': 6.546529630377122e-06, 'epoch': 1.25} {'loss': 0.4284, 'learning_rate': 6.546214325679668e-06, 'epoch': 1.25} {'loss': 0.3134, 'learning_rate': 6.545899024880882e-06, 'epoch': 1.25} {'loss': 0.2325, 'learning_rate': 6.5455837279811195e-06, 'epoch': 1.25} {'loss': 0.3643, 'learning_rate': 6.545268434980735e-06, 'epoch': 1.25} {'loss': 0.2825, 'learning_rate': 6.5449531458800865e-06, 'epoch': 1.25} {'loss': 0.3753, 'learning_rate': 6.544637860679528e-06, 'epoch': 1.25} {'loss': 0.332, 'learning_rate': 6.5443225793794166e-06, 'epoch': 1.25} {'loss': 0.3131, 'learning_rate': 6.544007301980107e-06, 'epoch': 1.25} {'loss': 0.3031, 'learning_rate': 6.543692028481959e-06, 'epoch': 1.25} {'loss': 0.229, 'learning_rate': 6.5433767588853236e-06, 'epoch': 1.25} {'loss': 0.2683, 'learning_rate': 6.543061493190559e-06, 'epoch': 1.25} {'loss': 0.4291, 'learning_rate': 6.542746231398018e-06, 'epoch': 1.25} {'loss': 0.3323, 'learning_rate': 6.542430973508063e-06, 'epoch': 1.25} {'loss': 0.2848, 'learning_rate': 6.5421157195210425e-06, 'epoch': 1.25} {'loss': 0.2455, 'learning_rate': 6.5418004694373186e-06, 'epoch': 1.25} {'loss': 0.3618, 'learning_rate': 6.5414852232572425e-06, 'epoch': 1.25} {'loss': 0.3521, 'learning_rate': 6.5411699809811726e-06, 'epoch': 1.25} {'loss': 0.3108, 'learning_rate': 6.540854742609464e-06, 'epoch': 1.25} {'loss': 0.2626, 'learning_rate': 6.540539508142472e-06, 'epoch': 1.25} {'loss': 0.3563, 'learning_rate': 6.540224277580553e-06, 'epoch': 1.25} {'loss': 0.2057, 'learning_rate': 6.539909050924062e-06, 'epoch': 1.25} {'loss': 0.342, 'learning_rate': 6.539593828173361e-06, 'epoch': 1.25} {'loss': 0.3112, 'learning_rate': 6.539278609328796e-06, 'epoch': 1.25} {'loss': 0.3534, 'learning_rate': 6.538963394390727e-06, 'epoch': 1.25} {'loss': 0.168, 'learning_rate': 6.5386481833595125e-06, 'epoch': 1.25} {'loss': 0.2943, 'learning_rate': 6.538332976235504e-06, 'epoch': 1.25} {'loss': 0.3169, 'learning_rate': 6.538017773019061e-06, 'epoch': 1.25} {'loss': 0.2902, 'learning_rate': 6.537702573710536e-06, 'epoch': 1.25} {'loss': 0.2617, 'learning_rate': 6.537387378310287e-06, 'epoch': 1.25} {'loss': 0.278, 'learning_rate': 6.537072186818669e-06, 'epoch': 1.25} {'loss': 0.3466, 'learning_rate': 6.536756999236038e-06, 'epoch': 1.25} {'loss': 0.357, 'learning_rate': 6.5364418155627504e-06, 'epoch': 1.25} {'loss': 0.3226, 'learning_rate': 6.5361266357991605e-06, 'epoch': 1.25} {'loss': 0.2518, 'learning_rate': 6.5358114599456245e-06, 'epoch': 1.25} {'loss': 0.2962, 'learning_rate': 6.535496288002501e-06, 'epoch': 1.25} {'loss': 0.3631, 'learning_rate': 6.535181119970143e-06, 'epoch': 1.25} {'loss': 0.447, 'learning_rate': 6.534865955848906e-06, 'epoch': 1.25} {'loss': 0.3491, 'learning_rate': 6.534550795639145e-06, 'epoch': 1.25} {'loss': 0.2774, 'learning_rate': 6.534235639341219e-06, 'epoch': 1.25} {'loss': 0.3706, 'learning_rate': 6.5339204869554805e-06, 'epoch': 1.25} {'loss': 0.3318, 'learning_rate': 6.533605338482287e-06, 'epoch': 1.25} {'loss': 0.4289, 'learning_rate': 6.5332901939219955e-06, 'epoch': 1.25} {'loss': 0.42, 'learning_rate': 6.532975053274957e-06, 'epoch': 1.25} {'loss': 0.3619, 'learning_rate': 6.532659916541533e-06, 'epoch': 1.25} {'loss': 0.3633, 'learning_rate': 6.532344783722076e-06, 'epoch': 1.25} {'loss': 0.3456, 'learning_rate': 6.532029654816942e-06, 'epoch': 1.25} {'loss': 0.2428, 'learning_rate': 6.5317145298264875e-06, 'epoch': 1.25} {'loss': 0.2997, 'learning_rate': 6.531399408751067e-06, 'epoch': 1.25} {'loss': 0.3092, 'learning_rate': 6.531084291591039e-06, 'epoch': 1.25} {'loss': 0.4431, 'learning_rate': 6.530769178346755e-06, 'epoch': 1.25} {'loss': 0.2804, 'learning_rate': 6.530454069018574e-06, 'epoch': 1.25} {'loss': 0.3143, 'learning_rate': 6.53013896360685e-06, 'epoch': 1.25} {'loss': 0.4271, 'learning_rate': 6.529823862111939e-06, 'epoch': 1.25} {'loss': 0.2524, 'learning_rate': 6.529508764534198e-06, 'epoch': 1.25} {'loss': 0.2541, 'learning_rate': 6.5291936708739815e-06, 'epoch': 1.25} {'loss': 0.3214, 'learning_rate': 6.528878581131644e-06, 'epoch': 1.25} {'loss': 0.3525, 'learning_rate': 6.528563495307543e-06, 'epoch': 1.25} {'loss': 0.3138, 'learning_rate': 6.528248413402034e-06, 'epoch': 1.25} {'loss': 0.3801, 'learning_rate': 6.527933335415473e-06, 'epoch': 1.25} {'loss': 0.2185, 'learning_rate': 6.5276182613482144e-06, 'epoch': 1.25} {'loss': 0.4115, 'learning_rate': 6.527303191200613e-06, 'epoch': 1.25} {'loss': 0.2226, 'learning_rate': 6.526988124973031e-06, 'epoch': 1.25} {'loss': 0.2688, 'learning_rate': 6.526673062665815e-06, 'epoch': 1.25} {'loss': 0.4283, 'learning_rate': 6.526358004279325e-06, 'epoch': 1.25} {'loss': 0.3813, 'learning_rate': 6.526042949813915e-06, 'epoch': 1.25} {'loss': 0.4759, 'learning_rate': 6.525727899269945e-06, 'epoch': 1.25} {'loss': 0.3938, 'learning_rate': 6.525412852647766e-06, 'epoch': 1.25} {'loss': 0.3844, 'learning_rate': 6.525097809947734e-06, 'epoch': 1.25} {'loss': 0.4452, 'learning_rate': 6.524782771170206e-06, 'epoch': 1.25} {'loss': 0.4146, 'learning_rate': 6.524467736315538e-06, 'epoch': 1.25} {'loss': 0.2511, 'learning_rate': 6.524152705384086e-06, 'epoch': 1.25} {'loss': 0.3585, 'learning_rate': 6.5238376783762035e-06, 'epoch': 1.25} {'loss': 0.312, 'learning_rate': 6.523522655292247e-06, 'epoch': 1.25} {'loss': 0.3743, 'learning_rate': 6.523207636132573e-06, 'epoch': 1.25} {'loss': 0.3407, 'learning_rate': 6.522892620897539e-06, 'epoch': 1.25} {'loss': 0.2807, 'learning_rate': 6.522577609587495e-06, 'epoch': 1.25} {'loss': 0.3971, 'learning_rate': 6.522262602202796e-06, 'epoch': 1.25} {'loss': 0.3158, 'learning_rate': 6.521947598743805e-06, 'epoch': 1.25} {'loss': 0.3474, 'learning_rate': 6.5216325992108745e-06, 'epoch': 1.25} {'loss': 0.2888, 'learning_rate': 6.521317603604358e-06, 'epoch': 1.25} {'loss': 0.3736, 'learning_rate': 6.521002611924613e-06, 'epoch': 1.25} {'loss': 0.2277, 'learning_rate': 6.520687624171996e-06, 'epoch': 1.25} {'loss': 0.3929, 'learning_rate': 6.52037264034686e-06, 'epoch': 1.25} {'loss': 0.3891, 'learning_rate': 6.520057660449562e-06, 'epoch': 1.25} {'loss': 0.493, 'learning_rate': 6.519742684480456e-06, 'epoch': 1.25} {'loss': 0.3585, 'learning_rate': 6.5194277124398985e-06, 'epoch': 1.25} {'loss': 0.3124, 'learning_rate': 6.519112744328246e-06, 'epoch': 1.25} {'loss': 0.468, 'learning_rate': 6.518797780145853e-06, 'epoch': 1.25} {'loss': 0.4248, 'learning_rate': 6.518482819893076e-06, 'epoch': 1.25} {'loss': 0.4569, 'learning_rate': 6.5181678635702706e-06, 'epoch': 1.25} {'loss': 0.3924, 'learning_rate': 6.517852911177789e-06, 'epoch': 1.25} {'loss': 0.3741, 'learning_rate': 6.517537962715992e-06, 'epoch': 1.25} {'loss': 0.3277, 'learning_rate': 6.51722301818523e-06, 'epoch': 1.25} {'loss': 0.2513, 'learning_rate': 6.516908077585862e-06, 'epoch': 1.25} {'loss': 0.3241, 'learning_rate': 6.516593140918243e-06, 'epoch': 1.25} {'loss': 0.2489, 'learning_rate': 6.516278208182729e-06, 'epoch': 1.25} {'loss': 0.3782, 'learning_rate': 6.5159632793796735e-06, 'epoch': 1.25} {'loss': 0.2661, 'learning_rate': 6.515648354509432e-06, 'epoch': 1.25} {'loss': 0.3674, 'learning_rate': 6.515333433572362e-06, 'epoch': 1.25} {'loss': 0.1451, 'learning_rate': 6.515018516568817e-06, 'epoch': 1.25} {'loss': 0.3658, 'learning_rate': 6.514703603499153e-06, 'epoch': 1.25} {'loss': 0.1595, 'learning_rate': 6.514388694363727e-06, 'epoch': 1.25} {'loss': 0.4285, 'learning_rate': 6.514073789162892e-06, 'epoch': 1.25} {'loss': 0.2787, 'learning_rate': 6.513758887897006e-06, 'epoch': 1.25} {'loss': 0.3501, 'learning_rate': 6.513443990566422e-06, 'epoch': 1.25} {'loss': 0.5185, 'learning_rate': 6.5131290971714974e-06, 'epoch': 1.25} {'loss': 0.3802, 'learning_rate': 6.512814207712588e-06, 'epoch': 1.25} {'loss': 0.3816, 'learning_rate': 6.512499322190047e-06, 'epoch': 1.25} {'loss': 0.2979, 'learning_rate': 6.512184440604233e-06, 'epoch': 1.25} {'loss': 0.3489, 'learning_rate': 6.511869562955499e-06, 'epoch': 1.25} {'loss': 0.4073, 'learning_rate': 6.5115546892441995e-06, 'epoch': 1.25} {'loss': 0.2702, 'learning_rate': 6.511239819470691e-06, 'epoch': 1.25} {'loss': 0.3453, 'learning_rate': 6.5109249536353314e-06, 'epoch': 1.25} {'loss': 0.387, 'learning_rate': 6.5106100917384715e-06, 'epoch': 1.25} {'loss': 0.3109, 'learning_rate': 6.5102952337804715e-06, 'epoch': 1.25} {'loss': 0.4118, 'learning_rate': 6.509980379761685e-06, 'epoch': 1.25} {'loss': 0.5549, 'learning_rate': 6.509665529682465e-06, 'epoch': 1.25} {'loss': 0.4242, 'learning_rate': 6.50935068354317e-06, 'epoch': 1.25} {'loss': 0.4039, 'learning_rate': 6.5090358413441535e-06, 'epoch': 1.25} {'loss': 0.3078, 'learning_rate': 6.5087210030857715e-06, 'epoch': 1.25} {'loss': 0.3902, 'learning_rate': 6.50840616876838e-06, 'epoch': 1.25} {'loss': 0.4343, 'learning_rate': 6.508091338392337e-06, 'epoch': 1.25} {'loss': 0.3604, 'learning_rate': 6.5077765119579915e-06, 'epoch': 1.25} {'loss': 0.3571, 'learning_rate': 6.507461689465703e-06, 'epoch': 1.25} {'loss': 0.4615, 'learning_rate': 6.5071468709158255e-06, 'epoch': 1.25} {'loss': 0.3584, 'learning_rate': 6.506832056308716e-06, 'epoch': 1.25} {'loss': 0.2395, 'learning_rate': 6.506517245644728e-06, 'epoch': 1.25} {'loss': 0.3501, 'learning_rate': 6.506202438924218e-06, 'epoch': 1.25} {'loss': 0.2454, 'learning_rate': 6.505887636147541e-06, 'epoch': 1.25} {'loss': 0.4267, 'learning_rate': 6.505572837315053e-06, 'epoch': 1.25} {'loss': 0.3048, 'learning_rate': 6.505258042427107e-06, 'epoch': 1.25} {'loss': 0.3221, 'learning_rate': 6.504943251484061e-06, 'epoch': 1.25} {'loss': 0.4195, 'learning_rate': 6.504628464486271e-06, 'epoch': 1.25} {'loss': 0.3343, 'learning_rate': 6.504313681434089e-06, 'epoch': 1.25} {'loss': 0.359, 'learning_rate': 6.503998902327875e-06, 'epoch': 1.25} {'loss': 0.4192, 'learning_rate': 6.50368412716798e-06, 'epoch': 1.25} {'loss': 0.2988, 'learning_rate': 6.503369355954759e-06, 'epoch': 1.25} {'loss': 0.4222, 'learning_rate': 6.50305458868857e-06, 'epoch': 1.25} {'loss': 0.3738, 'learning_rate': 6.5027398253697675e-06, 'epoch': 1.25} {'loss': 0.3223, 'learning_rate': 6.5024250659987064e-06, 'epoch': 1.25} {'loss': 0.3427, 'learning_rate': 6.502110310575742e-06, 'epoch': 1.25} {'loss': 0.3186, 'learning_rate': 6.5017955591012304e-06, 'epoch': 1.25} {'loss': 0.2187, 'learning_rate': 6.501480811575527e-06, 'epoch': 1.25} {'loss': 0.2491, 'learning_rate': 6.501166067998985e-06, 'epoch': 1.25} {'loss': 0.2196, 'learning_rate': 6.500851328371962e-06, 'epoch': 1.25} {'loss': 0.3446, 'learning_rate': 6.500536592694813e-06, 'epoch': 1.25} {'loss': 0.3329, 'learning_rate': 6.500221860967893e-06, 'epoch': 1.25} {'loss': 0.3244, 'learning_rate': 6.499907133191558e-06, 'epoch': 1.25} {'loss': 0.3518, 'learning_rate': 6.49959240936616e-06, 'epoch': 1.25} {'loss': 0.2794, 'learning_rate': 6.499277689492057e-06, 'epoch': 1.25} {'loss': 0.4154, 'learning_rate': 6.4989629735696045e-06, 'epoch': 1.25} {'loss': 0.4199, 'learning_rate': 6.498648261599157e-06, 'epoch': 1.25} {'loss': 0.2212, 'learning_rate': 6.498333553581069e-06, 'epoch': 1.25} {'loss': 0.3399, 'learning_rate': 6.498018849515696e-06, 'epoch': 1.25} {'loss': 0.2121, 'learning_rate': 6.4977041494033945e-06, 'epoch': 1.25} {'loss': 0.2663, 'learning_rate': 6.497389453244518e-06, 'epoch': 1.25} {'loss': 0.2652, 'learning_rate': 6.4970747610394246e-06, 'epoch': 1.25} {'loss': 0.3077, 'learning_rate': 6.496760072788468e-06, 'epoch': 1.25} {'loss': 0.5111, 'learning_rate': 6.496445388492001e-06, 'epoch': 1.25} {'loss': 0.2856, 'learning_rate': 6.496130708150381e-06, 'epoch': 1.25} {'loss': 0.3405, 'learning_rate': 6.495816031763966e-06, 'epoch': 1.25} {'loss': 0.4205, 'learning_rate': 6.495501359333107e-06, 'epoch': 1.25} {'loss': 0.258, 'learning_rate': 6.4951866908581594e-06, 'epoch': 1.25} {'loss': 0.3086, 'learning_rate': 6.49487202633948e-06, 'epoch': 1.25} {'loss': 0.288, 'learning_rate': 6.494557365777425e-06, 'epoch': 1.25} {'loss': 0.2883, 'learning_rate': 6.494242709172347e-06, 'epoch': 1.25} {'loss': 0.2995, 'learning_rate': 6.493928056524601e-06, 'epoch': 1.25} {'loss': 0.2371, 'learning_rate': 6.493613407834545e-06, 'epoch': 1.25} {'loss': 0.3519, 'learning_rate': 6.493298763102533e-06, 'epoch': 1.25} {'loss': 0.2545, 'learning_rate': 6.492984122328918e-06, 'epoch': 1.25} {'loss': 0.3809, 'learning_rate': 6.492669485514059e-06, 'epoch': 1.25} {'loss': 0.287, 'learning_rate': 6.492354852658309e-06, 'epoch': 1.25} {'loss': 0.277, 'learning_rate': 6.492040223762022e-06, 'epoch': 1.25} {'loss': 0.2927, 'learning_rate': 6.491725598825558e-06, 'epoch': 1.25} {'loss': 0.3023, 'learning_rate': 6.491410977849266e-06, 'epoch': 1.25} {'loss': 0.2274, 'learning_rate': 6.4910963608335e-06, 'epoch': 1.25} {'loss': 0.253, 'learning_rate': 6.490781747778623e-06, 'epoch': 1.25} {'loss': 0.3477, 'learning_rate': 6.4904671386849845e-06, 'epoch': 1.25} {'loss': 0.3149, 'learning_rate': 6.490152533552943e-06, 'epoch': 1.25} {'loss': 0.4473, 'learning_rate': 6.489837932382852e-06, 'epoch': 1.25} {'loss': 0.3885, 'learning_rate': 6.4895233351750655e-06, 'epoch': 1.25} {'loss': 0.302, 'learning_rate': 6.489208741929942e-06, 'epoch': 1.25} {'loss': 0.2906, 'learning_rate': 6.4888941526478335e-06, 'epoch': 1.25} {'loss': 0.3587, 'learning_rate': 6.4885795673290944e-06, 'epoch': 1.25} {'loss': 0.3269, 'learning_rate': 6.488264985974081e-06, 'epoch': 1.25} {'loss': 0.3547, 'learning_rate': 6.487950408583149e-06, 'epoch': 1.25} {'loss': 0.3508, 'learning_rate': 6.487635835156654e-06, 'epoch': 1.25} {'loss': 0.2293, 'learning_rate': 6.487321265694948e-06, 'epoch': 1.25} {'loss': 0.544, 'learning_rate': 6.48700670019839e-06, 'epoch': 1.25} {'loss': 0.228, 'learning_rate': 6.486692138667334e-06, 'epoch': 1.25} {'loss': 0.3685, 'learning_rate': 6.486377581102134e-06, 'epoch': 1.25} {'loss': 0.3193, 'learning_rate': 6.486063027503145e-06, 'epoch': 1.25} {'loss': 0.3391, 'learning_rate': 6.485748477870723e-06, 'epoch': 1.25} {'loss': 0.2337, 'learning_rate': 6.485433932205223e-06, 'epoch': 1.25} {'loss': 0.2713, 'learning_rate': 6.485119390506999e-06, 'epoch': 1.25} {'loss': 0.1584, 'learning_rate': 6.4848048527764086e-06, 'epoch': 1.25} {'loss': 0.4052, 'learning_rate': 6.484490319013803e-06, 'epoch': 1.25} {'loss': 0.461, 'learning_rate': 6.48417578921954e-06, 'epoch': 1.25} {'loss': 0.3954, 'learning_rate': 6.483861263393975e-06, 'epoch': 1.25} {'loss': 0.3181, 'learning_rate': 6.483546741537461e-06, 'epoch': 1.25} {'loss': 0.329, 'learning_rate': 6.483232223650353e-06, 'epoch': 1.25} {'loss': 0.2517, 'learning_rate': 6.482917709733009e-06, 'epoch': 1.25} {'loss': 0.2788, 'learning_rate': 6.4826031997857804e-06, 'epoch': 1.25} {'loss': 0.3584, 'learning_rate': 6.482288693809024e-06, 'epoch': 1.25} {'loss': 0.2091, 'learning_rate': 6.481974191803097e-06, 'epoch': 1.25} {'loss': 0.3173, 'learning_rate': 6.481659693768351e-06, 'epoch': 1.25} {'loss': 0.4642, 'learning_rate': 6.481345199705142e-06, 'epoch': 1.25} {'loss': 0.4167, 'learning_rate': 6.481030709613827e-06, 'epoch': 1.25} {'loss': 0.2705, 'learning_rate': 6.480716223494756e-06, 'epoch': 1.25} {'loss': 0.2512, 'learning_rate': 6.480401741348288e-06, 'epoch': 1.25} {'loss': 0.2379, 'learning_rate': 6.480087263174778e-06, 'epoch': 1.25} {'loss': 0.3024, 'learning_rate': 6.47977278897458e-06, 'epoch': 1.25} {'loss': 0.3392, 'learning_rate': 6.479458318748049e-06, 'epoch': 1.25} {'loss': 0.3177, 'learning_rate': 6.4791438524955395e-06, 'epoch': 1.25} {'loss': 0.3462, 'learning_rate': 6.478829390217407e-06, 'epoch': 1.25} {'loss': 0.3217, 'learning_rate': 6.478514931914006e-06, 'epoch': 1.25} {'loss': 0.5171, 'learning_rate': 6.4782004775856945e-06, 'epoch': 1.25} {'loss': 0.3208, 'learning_rate': 6.477886027232823e-06, 'epoch': 1.25} {'loss': 0.2548, 'learning_rate': 6.477571580855748e-06, 'epoch': 1.25} {'loss': 0.4135, 'learning_rate': 6.477257138454827e-06, 'epoch': 1.25} {'loss': 0.353, 'learning_rate': 6.476942700030413e-06, 'epoch': 1.25} {'loss': 0.1684, 'learning_rate': 6.476628265582858e-06, 'epoch': 1.25} {'loss': 0.3443, 'learning_rate': 6.476313835112522e-06, 'epoch': 1.25} {'loss': 0.2624, 'learning_rate': 6.475999408619755e-06, 'epoch': 1.25} {'loss': 0.2506, 'learning_rate': 6.475684986104918e-06, 'epoch': 1.25} {'loss': 0.365, 'learning_rate': 6.4753705675683595e-06, 'epoch': 1.25} {'loss': 0.3681, 'learning_rate': 6.4750561530104386e-06, 'epoch': 1.25} {'loss': 0.2264, 'learning_rate': 6.474741742431508e-06, 'epoch': 1.25} {'loss': 0.242, 'learning_rate': 6.474427335831925e-06, 'epoch': 1.25} {'loss': 0.3096, 'learning_rate': 6.474112933212043e-06, 'epoch': 1.25} {'loss': 0.4763, 'learning_rate': 6.473798534572215e-06, 'epoch': 1.25} {'loss': 0.3402, 'learning_rate': 6.4734841399128e-06, 'epoch': 1.25} {'loss': 0.324, 'learning_rate': 6.473169749234152e-06, 'epoch': 1.25} {'loss': 0.303, 'learning_rate': 6.472855362536624e-06, 'epoch': 1.25} {'loss': 0.276, 'learning_rate': 6.472540979820571e-06, 'epoch': 1.25} {'loss': 0.2353, 'learning_rate': 6.472226601086348e-06, 'epoch': 1.25} {'loss': 0.3564, 'learning_rate': 6.471912226334309e-06, 'epoch': 1.25} {'loss': 0.3584, 'learning_rate': 6.471597855564813e-06, 'epoch': 1.25} {'loss': 0.2919, 'learning_rate': 6.47128348877821e-06, 'epoch': 1.25} {'loss': 0.4016, 'learning_rate': 6.470969125974857e-06, 'epoch': 1.25} {'loss': 0.3879, 'learning_rate': 6.47065476715511e-06, 'epoch': 1.25} {'loss': 0.3538, 'learning_rate': 6.470340412319322e-06, 'epoch': 1.25} {'loss': 0.3401, 'learning_rate': 6.470026061467849e-06, 'epoch': 1.25} {'loss': 0.2602, 'learning_rate': 6.4697117146010436e-06, 'epoch': 1.25} {'loss': 0.3685, 'learning_rate': 6.469397371719264e-06, 'epoch': 1.25} {'loss': 0.3457, 'learning_rate': 6.469083032822863e-06, 'epoch': 1.25} {'loss': 0.2641, 'learning_rate': 6.468768697912195e-06, 'epoch': 1.25} {'loss': 0.3437, 'learning_rate': 6.46845436698762e-06, 'epoch': 1.25} {'loss': 0.3734, 'learning_rate': 6.468140040049484e-06, 'epoch': 1.25} {'loss': 0.2723, 'learning_rate': 6.467825717098146e-06, 'epoch': 1.25} {'loss': 0.1608, 'learning_rate': 6.467511398133963e-06, 'epoch': 1.25} {'loss': 0.3121, 'learning_rate': 6.4671970831572875e-06, 'epoch': 1.25} {'loss': 0.2006, 'learning_rate': 6.4668827721684745e-06, 'epoch': 1.25} {'loss': 0.3995, 'learning_rate': 6.466568465167878e-06, 'epoch': 1.25} {'loss': 0.3699, 'learning_rate': 6.466254162155855e-06, 'epoch': 1.25} {'loss': 0.3236, 'learning_rate': 6.4659398631327585e-06, 'epoch': 1.25} {'loss': 0.372, 'learning_rate': 6.4656255680989444e-06, 'epoch': 1.25} {'loss': 0.2018, 'learning_rate': 6.4653112770547665e-06, 'epoch': 1.25} {'loss': 0.4062, 'learning_rate': 6.4649969900005805e-06, 'epoch': 1.25} {'loss': 0.3141, 'learning_rate': 6.46468270693674e-06, 'epoch': 1.25} {'loss': 0.3076, 'learning_rate': 6.464368427863603e-06, 'epoch': 1.25} {'loss': 0.41, 'learning_rate': 6.464054152781519e-06, 'epoch': 1.25} {'loss': 0.3677, 'learning_rate': 6.463739881690846e-06, 'epoch': 1.25} {'loss': 0.3015, 'learning_rate': 6.463425614591939e-06, 'epoch': 1.25} {'loss': 0.2828, 'learning_rate': 6.463111351485149e-06, 'epoch': 1.25} {'loss': 0.4022, 'learning_rate': 6.462797092370837e-06, 'epoch': 1.25} {'loss': 0.2079, 'learning_rate': 6.462482837249353e-06, 'epoch': 1.25} {'loss': 0.405, 'learning_rate': 6.462168586121054e-06, 'epoch': 1.25} {'loss': 0.296, 'learning_rate': 6.461854338986293e-06, 'epoch': 1.25} {'loss': 0.4421, 'learning_rate': 6.461540095845426e-06, 'epoch': 1.25} {'loss': 0.2612, 'learning_rate': 6.461225856698807e-06, 'epoch': 1.25} {'loss': 0.2853, 'learning_rate': 6.460911621546793e-06, 'epoch': 1.25} {'loss': 0.2549, 'learning_rate': 6.460597390389733e-06, 'epoch': 1.25} {'loss': 0.3508, 'learning_rate': 6.4602831632279914e-06, 'epoch': 1.25} {'loss': 0.2619, 'learning_rate': 6.459968940061913e-06, 'epoch': 1.25} {'loss': 0.3035, 'learning_rate': 6.459654720891852e-06, 'epoch': 1.25} {'loss': 0.2958, 'learning_rate': 6.459340505718172e-06, 'epoch': 1.25} {'loss': 0.3704, 'learning_rate': 6.459026294541224e-06, 'epoch': 1.25} {'loss': 0.3488, 'learning_rate': 6.458712087361363e-06, 'epoch': 1.25} {'loss': 0.3637, 'learning_rate': 6.458397884178941e-06, 'epoch': 1.25} {'loss': 0.2604, 'learning_rate': 6.4580836849943165e-06, 'epoch': 1.25} {'loss': 0.4135, 'learning_rate': 6.45776948980784e-06, 'epoch': 1.25} {'loss': 0.3898, 'learning_rate': 6.457455298619868e-06, 'epoch': 1.25} {'loss': 0.4348, 'learning_rate': 6.457141111430756e-06, 'epoch': 1.25} {'loss': 0.2836, 'learning_rate': 6.456826928240858e-06, 'epoch': 1.25} {'loss': 0.3348, 'learning_rate': 6.4565127490505275e-06, 'epoch': 1.25} {'loss': 0.2567, 'learning_rate': 6.456198573860122e-06, 'epoch': 1.25} {'loss': 0.2836, 'learning_rate': 6.455884402669993e-06, 'epoch': 1.25} {'loss': 0.3723, 'learning_rate': 6.4555702354804974e-06, 'epoch': 1.25} {'loss': 0.2067, 'learning_rate': 6.455256072291989e-06, 'epoch': 1.25} {'loss': 0.3389, 'learning_rate': 6.454941913104822e-06, 'epoch': 1.25} {'loss': 0.3445, 'learning_rate': 6.4546277579193516e-06, 'epoch': 1.25} {'loss': 0.3655, 'learning_rate': 6.454313606735932e-06, 'epoch': 1.25} {'loss': 0.2622, 'learning_rate': 6.45399945955492e-06, 'epoch': 1.25} {'loss': 0.2961, 'learning_rate': 6.4536853163766665e-06, 'epoch': 1.25} {'loss': 0.282, 'learning_rate': 6.4533711772015285e-06, 'epoch': 1.25} {'loss': 0.3751, 'learning_rate': 6.453057042029859e-06, 'epoch': 1.25} {'loss': 0.4676, 'learning_rate': 6.4527429108620145e-06, 'epoch': 1.25} {'loss': 0.2698, 'learning_rate': 6.4524287836983475e-06, 'epoch': 1.25} {'loss': 0.2438, 'learning_rate': 6.452114660539215e-06, 'epoch': 1.25} {'loss': 0.2353, 'learning_rate': 6.45180054138497e-06, 'epoch': 1.25} {'loss': 0.4409, 'learning_rate': 6.451486426235968e-06, 'epoch': 1.25} {'loss': 0.3094, 'learning_rate': 6.451172315092562e-06, 'epoch': 1.25} {'loss': 0.3304, 'learning_rate': 6.4508582079551085e-06, 'epoch': 1.25} {'loss': 0.2619, 'learning_rate': 6.450544104823962e-06, 'epoch': 1.25} {'loss': 0.2454, 'learning_rate': 6.450230005699474e-06, 'epoch': 1.25} {'loss': 0.2247, 'learning_rate': 6.449915910582002e-06, 'epoch': 1.25} {'loss': 0.3556, 'learning_rate': 6.449601819471902e-06, 'epoch': 1.25} {'loss': 0.316, 'learning_rate': 6.449287732369524e-06, 'epoch': 1.25} {'loss': 0.4133, 'learning_rate': 6.448973649275227e-06, 'epoch': 1.26} {'loss': 0.27, 'learning_rate': 6.448659570189362e-06, 'epoch': 1.26} {'loss': 0.2901, 'learning_rate': 6.4483454951122845e-06, 'epoch': 1.26} {'loss': 0.5368, 'learning_rate': 6.448031424044351e-06, 'epoch': 1.26} {'loss': 0.4685, 'learning_rate': 6.447717356985914e-06, 'epoch': 1.26} {'loss': 0.1685, 'learning_rate': 6.447403293937328e-06, 'epoch': 1.26} {'loss': 0.3341, 'learning_rate': 6.447089234898949e-06, 'epoch': 1.26} {'loss': 0.4524, 'learning_rate': 6.44677517987113e-06, 'epoch': 1.26} {'loss': 0.3116, 'learning_rate': 6.446461128854226e-06, 'epoch': 1.26} {'loss': 0.4461, 'learning_rate': 6.4461470818485915e-06, 'epoch': 1.26} {'loss': 0.5212, 'learning_rate': 6.445833038854582e-06, 'epoch': 1.26} {'loss': 0.2863, 'learning_rate': 6.445518999872553e-06, 'epoch': 1.26} {'loss': 0.417, 'learning_rate': 6.445204964902854e-06, 'epoch': 1.26} {'loss': 0.3893, 'learning_rate': 6.444890933945844e-06, 'epoch': 1.26} {'loss': 0.3053, 'learning_rate': 6.444576907001876e-06, 'epoch': 1.26} {'loss': 0.2449, 'learning_rate': 6.444262884071304e-06, 'epoch': 1.26} {'loss': 0.2566, 'learning_rate': 6.4439488651544835e-06, 'epoch': 1.26} {'loss': 0.2931, 'learning_rate': 6.4436348502517674e-06, 'epoch': 1.26} {'loss': 0.3769, 'learning_rate': 6.4433208393635115e-06, 'epoch': 1.26} {'loss': 0.2141, 'learning_rate': 6.443006832490071e-06, 'epoch': 1.26} {'loss': 0.4008, 'learning_rate': 6.442692829631799e-06, 'epoch': 1.26} {'loss': 0.3167, 'learning_rate': 6.442378830789051e-06, 'epoch': 1.26} {'loss': 0.3185, 'learning_rate': 6.4420648359621804e-06, 'epoch': 1.26} {'loss': 0.2818, 'learning_rate': 6.441750845151542e-06, 'epoch': 1.26} {'loss': 0.3012, 'learning_rate': 6.4414368583574915e-06, 'epoch': 1.26} {'loss': 0.4166, 'learning_rate': 6.441122875580381e-06, 'epoch': 1.26} {'loss': 0.3461, 'learning_rate': 6.440808896820565e-06, 'epoch': 1.26} {'loss': 0.2429, 'learning_rate': 6.440494922078399e-06, 'epoch': 1.26} {'loss': 0.1992, 'learning_rate': 6.440180951354239e-06, 'epoch': 1.26} {'loss': 0.3231, 'learning_rate': 6.439866984648437e-06, 'epoch': 1.26} {'loss': 0.4388, 'learning_rate': 6.4395530219613475e-06, 'epoch': 1.26} {'loss': 0.3602, 'learning_rate': 6.439239063293326e-06, 'epoch': 1.26} {'loss': 0.2891, 'learning_rate': 6.438925108644727e-06, 'epoch': 1.26} {'loss': 0.2842, 'learning_rate': 6.4386111580159036e-06, 'epoch': 1.26} {'loss': 0.3601, 'learning_rate': 6.438297211407212e-06, 'epoch': 1.26} {'loss': 0.2567, 'learning_rate': 6.437983268819004e-06, 'epoch': 1.26} {'loss': 0.4156, 'learning_rate': 6.437669330251637e-06, 'epoch': 1.26} {'loss': 0.3354, 'learning_rate': 6.437355395705465e-06, 'epoch': 1.26} {'loss': 0.2497, 'learning_rate': 6.43704146518084e-06, 'epoch': 1.26} {'loss': 0.3997, 'learning_rate': 6.436727538678116e-06, 'epoch': 1.26} {'loss': 0.3255, 'learning_rate': 6.436413616197651e-06, 'epoch': 1.26} {'loss': 0.2871, 'learning_rate': 6.436099697739797e-06, 'epoch': 1.26} {'loss': 0.2751, 'learning_rate': 6.435785783304909e-06, 'epoch': 1.26} {'loss': 0.3418, 'learning_rate': 6.4354718728933395e-06, 'epoch': 1.26} {'loss': 0.2956, 'learning_rate': 6.435157966505446e-06, 'epoch': 1.26} {'loss': 0.505, 'learning_rate': 6.43484406414158e-06, 'epoch': 1.26} {'loss': 0.3168, 'learning_rate': 6.434530165802098e-06, 'epoch': 1.26} {'loss': 0.3623, 'learning_rate': 6.434216271487353e-06, 'epoch': 1.26} {'loss': 0.2577, 'learning_rate': 6.4339023811977e-06, 'epoch': 1.26} {'loss': 0.2731, 'learning_rate': 6.4335884949334935e-06, 'epoch': 1.26} {'loss': 0.429, 'learning_rate': 6.4332746126950885e-06, 'epoch': 1.26} {'loss': 0.381, 'learning_rate': 6.432960734482836e-06, 'epoch': 1.26} {'loss': 0.2999, 'learning_rate': 6.432646860297094e-06, 'epoch': 1.26} {'loss': 0.2246, 'learning_rate': 6.4323329901382144e-06, 'epoch': 1.26} {'loss': 0.4492, 'learning_rate': 6.4320191240065526e-06, 'epoch': 1.26} {'loss': 0.2953, 'learning_rate': 6.431705261902464e-06, 'epoch': 1.26} {'loss': 0.3241, 'learning_rate': 6.4313914038262995e-06, 'epoch': 1.26} {'loss': 0.1805, 'learning_rate': 6.431077549778415e-06, 'epoch': 1.26} {'loss': 0.2007, 'learning_rate': 6.430763699759167e-06, 'epoch': 1.26} {'loss': 0.5848, 'learning_rate': 6.4304498537689075e-06, 'epoch': 1.26} {'loss': 0.2778, 'learning_rate': 6.430136011807992e-06, 'epoch': 1.26} {'loss': 0.3824, 'learning_rate': 6.4298221738767745e-06, 'epoch': 1.26} {'loss': 0.2455, 'learning_rate': 6.429508339975607e-06, 'epoch': 1.26} {'loss': 0.3296, 'learning_rate': 6.429194510104848e-06, 'epoch': 1.26} {'loss': 0.3692, 'learning_rate': 6.428880684264849e-06, 'epoch': 1.26} {'loss': 0.3847, 'learning_rate': 6.428566862455959e-06, 'epoch': 1.26} {'loss': 0.2921, 'learning_rate': 6.428253044678543e-06, 'epoch': 1.26} {'loss': 0.3526, 'learning_rate': 6.427939230932949e-06, 'epoch': 1.26} {'loss': 0.3235, 'learning_rate': 6.427625421219533e-06, 'epoch': 1.26} {'loss': 0.2533, 'learning_rate': 6.427311615538648e-06, 'epoch': 1.26} {'loss': 0.3657, 'learning_rate': 6.42699781389065e-06, 'epoch': 1.26} {'loss': 0.2856, 'learning_rate': 6.4266840162758925e-06, 'epoch': 1.26} {'loss': 0.3127, 'learning_rate': 6.4263702226947286e-06, 'epoch': 1.26} {'loss': 0.4538, 'learning_rate': 6.4260564331475125e-06, 'epoch': 1.26} {'loss': 0.2184, 'learning_rate': 6.4257426476346e-06, 'epoch': 1.26} {'loss': 0.2352, 'learning_rate': 6.4254288661563435e-06, 'epoch': 1.26} {'loss': 0.2301, 'learning_rate': 6.425115088713099e-06, 'epoch': 1.26} {'loss': 0.3765, 'learning_rate': 6.424801315305218e-06, 'epoch': 1.26} {'loss': 0.369, 'learning_rate': 6.424487545933058e-06, 'epoch': 1.26} {'loss': 0.5082, 'learning_rate': 6.424173780596971e-06, 'epoch': 1.26} {'loss': 0.3052, 'learning_rate': 6.4238600192973115e-06, 'epoch': 1.26} {'loss': 0.3616, 'learning_rate': 6.423546262034434e-06, 'epoch': 1.26} {'loss': 0.3967, 'learning_rate': 6.423232508808693e-06, 'epoch': 1.26} {'loss': 0.3963, 'learning_rate': 6.422918759620442e-06, 'epoch': 1.26} {'loss': 0.3209, 'learning_rate': 6.422605014470038e-06, 'epoch': 1.26} {'loss': 0.2173, 'learning_rate': 6.422291273357831e-06, 'epoch': 1.26} {'loss': 0.2983, 'learning_rate': 6.4219775362841765e-06, 'epoch': 1.26} {'loss': 0.3743, 'learning_rate': 6.421663803249429e-06, 'epoch': 1.26} {'loss': 0.1826, 'learning_rate': 6.421350074253942e-06, 'epoch': 1.26} {'loss': 0.1855, 'learning_rate': 6.421036349298071e-06, 'epoch': 1.26} {'loss': 0.3401, 'learning_rate': 6.42072262838217e-06, 'epoch': 1.26} {'loss': 0.2, 'learning_rate': 6.42040891150659e-06, 'epoch': 1.26} {'loss': 0.3408, 'learning_rate': 6.42009519867169e-06, 'epoch': 1.26} {'loss': 0.4037, 'learning_rate': 6.419781489877821e-06, 'epoch': 1.26} {'loss': 0.2565, 'learning_rate': 6.4194677851253385e-06, 'epoch': 1.26} {'loss': 0.2738, 'learning_rate': 6.419154084414595e-06, 'epoch': 1.26} {'loss': 0.2669, 'learning_rate': 6.418840387745946e-06, 'epoch': 1.26} {'loss': 0.3622, 'learning_rate': 6.418526695119748e-06, 'epoch': 1.26} {'loss': 0.2833, 'learning_rate': 6.418213006536349e-06, 'epoch': 1.26} {'loss': 0.3838, 'learning_rate': 6.417899321996107e-06, 'epoch': 1.26} {'loss': 0.2983, 'learning_rate': 6.417585641499375e-06, 'epoch': 1.26} {'loss': 0.2886, 'learning_rate': 6.417271965046509e-06, 'epoch': 1.26} {'loss': 0.3191, 'learning_rate': 6.41695829263786e-06, 'epoch': 1.26} {'loss': 0.6044, 'learning_rate': 6.4166446242737845e-06, 'epoch': 1.26} {'loss': 0.3557, 'learning_rate': 6.416330959954637e-06, 'epoch': 1.26} {'loss': 0.2374, 'learning_rate': 6.416017299680768e-06, 'epoch': 1.26} {'loss': 0.3393, 'learning_rate': 6.415703643452536e-06, 'epoch': 1.26} {'loss': 0.3107, 'learning_rate': 6.415389991270291e-06, 'epoch': 1.26} {'loss': 0.2393, 'learning_rate': 6.415076343134391e-06, 'epoch': 1.26} {'loss': 0.2287, 'learning_rate': 6.414762699045187e-06, 'epoch': 1.26} {'loss': 0.3296, 'learning_rate': 6.414449059003036e-06, 'epoch': 1.26} {'loss': 0.2806, 'learning_rate': 6.4141354230082895e-06, 'epoch': 1.26} {'loss': 0.4009, 'learning_rate': 6.413821791061301e-06, 'epoch': 1.26} {'loss': 0.3795, 'learning_rate': 6.413508163162426e-06, 'epoch': 1.26} {'loss': 0.3359, 'learning_rate': 6.413194539312019e-06, 'epoch': 1.26} {'loss': 0.2917, 'learning_rate': 6.412880919510432e-06, 'epoch': 1.26} {'loss': 0.2559, 'learning_rate': 6.4125673037580215e-06, 'epoch': 1.26} {'loss': 0.3323, 'learning_rate': 6.412253692055139e-06, 'epoch': 1.26} {'loss': 0.3777, 'learning_rate': 6.411940084402142e-06, 'epoch': 1.26} {'loss': 0.2545, 'learning_rate': 6.41162648079938e-06, 'epoch': 1.26} {'loss': 0.3783, 'learning_rate': 6.41131288124721e-06, 'epoch': 1.26} {'loss': 0.4503, 'learning_rate': 6.410999285745987e-06, 'epoch': 1.26} {'loss': 0.4058, 'learning_rate': 6.410685694296061e-06, 'epoch': 1.26} {'loss': 0.2453, 'learning_rate': 6.410372106897791e-06, 'epoch': 1.26} {'loss': 0.3928, 'learning_rate': 6.410058523551528e-06, 'epoch': 1.26} {'loss': 0.314, 'learning_rate': 6.4097449442576244e-06, 'epoch': 1.26} {'loss': 0.295, 'learning_rate': 6.4094313690164364e-06, 'epoch': 1.26} {'loss': 0.35, 'learning_rate': 6.409117797828317e-06, 'epoch': 1.26} {'loss': 0.3965, 'learning_rate': 6.4088042306936216e-06, 'epoch': 1.26} {'loss': 0.4936, 'learning_rate': 6.408490667612704e-06, 'epoch': 1.26} {'loss': 0.4649, 'learning_rate': 6.408177108585917e-06, 'epoch': 1.26} {'loss': 0.2753, 'learning_rate': 6.407863553613614e-06, 'epoch': 1.26} {'loss': 0.4304, 'learning_rate': 6.407550002696151e-06, 'epoch': 1.26} {'loss': 0.5005, 'learning_rate': 6.40723645583388e-06, 'epoch': 1.26} {'loss': 0.3445, 'learning_rate': 6.406922913027157e-06, 'epoch': 1.26} {'loss': 0.3632, 'learning_rate': 6.406609374276334e-06, 'epoch': 1.26} {'loss': 0.3754, 'learning_rate': 6.406295839581768e-06, 'epoch': 1.26} {'loss': 0.3963, 'learning_rate': 6.405982308943809e-06, 'epoch': 1.26} {'loss': 0.2243, 'learning_rate': 6.405668782362813e-06, 'epoch': 1.26} {'loss': 0.3872, 'learning_rate': 6.405355259839132e-06, 'epoch': 1.26} {'loss': 0.3485, 'learning_rate': 6.405041741373122e-06, 'epoch': 1.26} {'loss': 0.3572, 'learning_rate': 6.404728226965136e-06, 'epoch': 1.26} {'loss': 0.3506, 'learning_rate': 6.404414716615528e-06, 'epoch': 1.26} {'loss': 0.2876, 'learning_rate': 6.404101210324653e-06, 'epoch': 1.26} {'loss': 0.3302, 'learning_rate': 6.403787708092863e-06, 'epoch': 1.26} {'loss': 0.3776, 'learning_rate': 6.403474209920513e-06, 'epoch': 1.26} {'loss': 0.3777, 'learning_rate': 6.403160715807957e-06, 'epoch': 1.26} {'loss': 0.2498, 'learning_rate': 6.402847225755549e-06, 'epoch': 1.26} {'loss': 0.2428, 'learning_rate': 6.4025337397636415e-06, 'epoch': 1.26} {'loss': 0.3348, 'learning_rate': 6.402220257832592e-06, 'epoch': 1.26} {'loss': 0.2017, 'learning_rate': 6.4019067799627484e-06, 'epoch': 1.26} {'loss': 0.4224, 'learning_rate': 6.40159330615447e-06, 'epoch': 1.26} {'loss': 0.3216, 'learning_rate': 6.401279836408107e-06, 'epoch': 1.26} {'loss': 0.2946, 'learning_rate': 6.400966370724016e-06, 'epoch': 1.26} {'loss': 0.2355, 'learning_rate': 6.4006529091025475e-06, 'epoch': 1.26} {'loss': 0.2704, 'learning_rate': 6.400339451544059e-06, 'epoch': 1.26} {'loss': 0.3084, 'learning_rate': 6.400025998048902e-06, 'epoch': 1.26} {'loss': 0.3922, 'learning_rate': 6.399712548617431e-06, 'epoch': 1.26} {'loss': 0.2788, 'learning_rate': 6.39939910325e-06, 'epoch': 1.26} {'loss': 0.2423, 'learning_rate': 6.399085661946963e-06, 'epoch': 1.26} {'loss': 0.28, 'learning_rate': 6.398772224708674e-06, 'epoch': 1.26} {'loss': 0.4127, 'learning_rate': 6.3984587915354865e-06, 'epoch': 1.26} {'loss': 0.2756, 'learning_rate': 6.398145362427752e-06, 'epoch': 1.26} {'loss': 0.3739, 'learning_rate': 6.397831937385831e-06, 'epoch': 1.26} {'loss': 0.2494, 'learning_rate': 6.397518516410066e-06, 'epoch': 1.26} {'loss': 0.4398, 'learning_rate': 6.39720509950082e-06, 'epoch': 1.26} {'loss': 0.2654, 'learning_rate': 6.396891686658446e-06, 'epoch': 1.26} {'loss': 0.2861, 'learning_rate': 6.396578277883297e-06, 'epoch': 1.26} {'loss': 0.3184, 'learning_rate': 6.396264873175724e-06, 'epoch': 1.26} {'loss': 0.2484, 'learning_rate': 6.395951472536084e-06, 'epoch': 1.26} {'loss': 0.3499, 'learning_rate': 6.395638075964731e-06, 'epoch': 1.26} {'loss': 0.3908, 'learning_rate': 6.395324683462014e-06, 'epoch': 1.26} {'loss': 0.3493, 'learning_rate': 6.3950112950282915e-06, 'epoch': 1.26} {'loss': 0.2109, 'learning_rate': 6.3946979106639165e-06, 'epoch': 1.26} {'loss': 0.4187, 'learning_rate': 6.39438453036924e-06, 'epoch': 1.26} {'loss': 0.2036, 'learning_rate': 6.394071154144619e-06, 'epoch': 1.26} {'loss': 0.4462, 'learning_rate': 6.393757781990404e-06, 'epoch': 1.26} {'loss': 0.3136, 'learning_rate': 6.393444413906953e-06, 'epoch': 1.26} {'loss': 0.3063, 'learning_rate': 6.393131049894617e-06, 'epoch': 1.26} {'loss': 0.2622, 'learning_rate': 6.39281768995375e-06, 'epoch': 1.26} {'loss': 0.3484, 'learning_rate': 6.392504334084705e-06, 'epoch': 1.26} {'loss': 0.2609, 'learning_rate': 6.392190982287837e-06, 'epoch': 1.26} {'loss': 0.3355, 'learning_rate': 6.391877634563499e-06, 'epoch': 1.26} {'loss': 0.2517, 'learning_rate': 6.391564290912049e-06, 'epoch': 1.26} {'loss': 0.4037, 'learning_rate': 6.391250951333832e-06, 'epoch': 1.26} {'loss': 0.2866, 'learning_rate': 6.3909376158292095e-06, 'epoch': 1.26} {'loss': 0.414, 'learning_rate': 6.39062428439853e-06, 'epoch': 1.26} {'loss': 0.5028, 'learning_rate': 6.3903109570421495e-06, 'epoch': 1.26} {'loss': 0.4526, 'learning_rate': 6.3899976337604204e-06, 'epoch': 1.26} {'loss': 0.3411, 'learning_rate': 6.389684314553699e-06, 'epoch': 1.26} {'loss': 0.2869, 'learning_rate': 6.389370999422337e-06, 'epoch': 1.26} {'loss': 0.5034, 'learning_rate': 6.38905768836669e-06, 'epoch': 1.26} {'loss': 0.3625, 'learning_rate': 6.388744381387109e-06, 'epoch': 1.26} {'loss': 0.3678, 'learning_rate': 6.38843107848395e-06, 'epoch': 1.26} {'loss': 0.3111, 'learning_rate': 6.388117779657564e-06, 'epoch': 1.26} {'loss': 0.2972, 'learning_rate': 6.387804484908306e-06, 'epoch': 1.26} {'loss': 0.326, 'learning_rate': 6.3874911942365325e-06, 'epoch': 1.26} {'loss': 0.4192, 'learning_rate': 6.387177907642593e-06, 'epoch': 1.26} {'loss': 0.2484, 'learning_rate': 6.386864625126843e-06, 'epoch': 1.26} {'loss': 0.2713, 'learning_rate': 6.386551346689634e-06, 'epoch': 1.26} {'loss': 0.2097, 'learning_rate': 6.386238072331324e-06, 'epoch': 1.26} {'loss': 0.2186, 'learning_rate': 6.385924802052261e-06, 'epoch': 1.26} {'loss': 0.1887, 'learning_rate': 6.3856115358528024e-06, 'epoch': 1.26} {'loss': 0.3399, 'learning_rate': 6.385298273733302e-06, 'epoch': 1.26} {'loss': 0.3265, 'learning_rate': 6.3849850156941115e-06, 'epoch': 1.26} {'loss': 0.5817, 'learning_rate': 6.384671761735588e-06, 'epoch': 1.26} {'loss': 0.3907, 'learning_rate': 6.38435851185808e-06, 'epoch': 1.26} {'loss': 0.3155, 'learning_rate': 6.384045266061944e-06, 'epoch': 1.26} {'loss': 0.3284, 'learning_rate': 6.383732024347534e-06, 'epoch': 1.26} {'loss': 0.3042, 'learning_rate': 6.383418786715206e-06, 'epoch': 1.26} {'loss': 0.3456, 'learning_rate': 6.383105553165306e-06, 'epoch': 1.26} {'loss': 0.2486, 'learning_rate': 6.382792323698193e-06, 'epoch': 1.26} {'loss': 0.3122, 'learning_rate': 6.38247909831422e-06, 'epoch': 1.26} {'loss': 0.344, 'learning_rate': 6.38216587701374e-06, 'epoch': 1.26} {'loss': 0.4887, 'learning_rate': 6.3818526597971064e-06, 'epoch': 1.26} {'loss': 0.274, 'learning_rate': 6.381539446664673e-06, 'epoch': 1.26} {'loss': 0.3534, 'learning_rate': 6.381226237616795e-06, 'epoch': 1.26} {'loss': 0.3671, 'learning_rate': 6.380913032653824e-06, 'epoch': 1.26} {'loss': 0.3223, 'learning_rate': 6.380599831776113e-06, 'epoch': 1.26} {'loss': 0.3843, 'learning_rate': 6.380286634984016e-06, 'epoch': 1.26} {'loss': 0.4069, 'learning_rate': 6.379973442277888e-06, 'epoch': 1.26} {'loss': 0.3596, 'learning_rate': 6.379660253658082e-06, 'epoch': 1.26} {'loss': 0.2188, 'learning_rate': 6.3793470691249505e-06, 'epoch': 1.26} {'loss': 0.329, 'learning_rate': 6.37903388867885e-06, 'epoch': 1.26} {'loss': 0.4815, 'learning_rate': 6.37872071232013e-06, 'epoch': 1.26} {'loss': 0.3347, 'learning_rate': 6.378407540049145e-06, 'epoch': 1.26} {'loss': 0.3726, 'learning_rate': 6.378094371866249e-06, 'epoch': 1.26} {'loss': 0.407, 'learning_rate': 6.377781207771796e-06, 'epoch': 1.26} {'loss': 0.4025, 'learning_rate': 6.37746804776614e-06, 'epoch': 1.26} {'loss': 0.4269, 'learning_rate': 6.377154891849633e-06, 'epoch': 1.26} {'loss': 0.4071, 'learning_rate': 6.376841740022629e-06, 'epoch': 1.26} {'loss': 0.3044, 'learning_rate': 6.3765285922854825e-06, 'epoch': 1.26} {'loss': 0.3129, 'learning_rate': 6.376215448638545e-06, 'epoch': 1.26} {'loss': 0.2127, 'learning_rate': 6.3759023090821715e-06, 'epoch': 1.26} {'loss': 0.3118, 'learning_rate': 6.375589173616716e-06, 'epoch': 1.26} {'loss': 0.1938, 'learning_rate': 6.375276042242531e-06, 'epoch': 1.26} {'loss': 0.2905, 'learning_rate': 6.374962914959972e-06, 'epoch': 1.26} {'loss': 0.3331, 'learning_rate': 6.374649791769387e-06, 'epoch': 1.26} {'loss': 0.2984, 'learning_rate': 6.374336672671136e-06, 'epoch': 1.26} {'loss': 0.4073, 'learning_rate': 6.374023557665567e-06, 'epoch': 1.26} {'loss': 0.3585, 'learning_rate': 6.3737104467530365e-06, 'epoch': 1.26} {'loss': 0.2951, 'learning_rate': 6.3733973399338975e-06, 'epoch': 1.26} {'loss': 0.2434, 'learning_rate': 6.3730842372085026e-06, 'epoch': 1.26} {'loss': 0.3303, 'learning_rate': 6.3727711385772075e-06, 'epoch': 1.26} {'loss': 0.3631, 'learning_rate': 6.372458044040361e-06, 'epoch': 1.26} {'loss': 0.459, 'learning_rate': 6.372144953598322e-06, 'epoch': 1.26} {'loss': 0.3324, 'learning_rate': 6.371831867251441e-06, 'epoch': 1.26} {'loss': 0.3259, 'learning_rate': 6.371518785000073e-06, 'epoch': 1.26} {'loss': 0.3742, 'learning_rate': 6.37120570684457e-06, 'epoch': 1.26} {'loss': 0.2732, 'learning_rate': 6.370892632785286e-06, 'epoch': 1.26} {'loss': 0.3688, 'learning_rate': 6.370579562822573e-06, 'epoch': 1.26} {'loss': 0.2465, 'learning_rate': 6.370266496956785e-06, 'epoch': 1.26} {'loss': 0.291, 'learning_rate': 6.3699534351882765e-06, 'epoch': 1.26} {'loss': 0.2343, 'learning_rate': 6.369640377517401e-06, 'epoch': 1.26} {'loss': 0.3983, 'learning_rate': 6.36932732394451e-06, 'epoch': 1.26} {'loss': 0.2066, 'learning_rate': 6.369014274469959e-06, 'epoch': 1.26} {'loss': 0.3191, 'learning_rate': 6.3687012290941e-06, 'epoch': 1.26} {'loss': 0.248, 'learning_rate': 6.368388187817287e-06, 'epoch': 1.26} {'loss': 0.4426, 'learning_rate': 6.368075150639872e-06, 'epoch': 1.26} {'loss': 0.5171, 'learning_rate': 6.3677621175622104e-06, 'epoch': 1.26} {'loss': 0.2726, 'learning_rate': 6.367449088584654e-06, 'epoch': 1.26} {'loss': 0.4037, 'learning_rate': 6.367136063707558e-06, 'epoch': 1.26} {'loss': 0.4841, 'learning_rate': 6.3668230429312764e-06, 'epoch': 1.26} {'loss': 0.4159, 'learning_rate': 6.366510026256154e-06, 'epoch': 1.26} {'loss': 0.2692, 'learning_rate': 6.3661970136825554e-06, 'epoch': 1.26} {'loss': 0.2876, 'learning_rate': 6.36588400521083e-06, 'epoch': 1.26} {'loss': 0.1635, 'learning_rate': 6.3655710008413285e-06, 'epoch': 1.26} {'loss': 0.2938, 'learning_rate': 6.365258000574408e-06, 'epoch': 1.26} {'loss': 0.2921, 'learning_rate': 6.364945004410419e-06, 'epoch': 1.26} {'loss': 0.2855, 'learning_rate': 6.364632012349717e-06, 'epoch': 1.26} {'loss': 0.3689, 'learning_rate': 6.364319024392655e-06, 'epoch': 1.26} {'loss': 0.3775, 'learning_rate': 6.364006040539583e-06, 'epoch': 1.26} {'loss': 0.2903, 'learning_rate': 6.363693060790859e-06, 'epoch': 1.26} {'loss': 0.2909, 'learning_rate': 6.363380085146831e-06, 'epoch': 1.26} {'loss': 0.3178, 'learning_rate': 6.363067113607857e-06, 'epoch': 1.26} {'loss': 0.4354, 'learning_rate': 6.3627541461742895e-06, 'epoch': 1.26} {'loss': 0.3399, 'learning_rate': 6.36244118284648e-06, 'epoch': 1.26} {'loss': 0.3653, 'learning_rate': 6.3621282236247825e-06, 'epoch': 1.26} {'loss': 0.3462, 'learning_rate': 6.36181526850955e-06, 'epoch': 1.26} {'loss': 0.3058, 'learning_rate': 6.361502317501138e-06, 'epoch': 1.26} {'loss': 0.419, 'learning_rate': 6.361189370599896e-06, 'epoch': 1.26} {'loss': 0.3955, 'learning_rate': 6.360876427806181e-06, 'epoch': 1.26} {'loss': 0.3182, 'learning_rate': 6.360563489120344e-06, 'epoch': 1.26} {'loss': 0.3811, 'learning_rate': 6.36025055454274e-06, 'epoch': 1.26} {'loss': 0.3919, 'learning_rate': 6.35993762407372e-06, 'epoch': 1.26} {'loss': 0.4011, 'learning_rate': 6.359624697713638e-06, 'epoch': 1.26} {'loss': 0.3631, 'learning_rate': 6.359311775462846e-06, 'epoch': 1.26} {'loss': 0.3411, 'learning_rate': 6.3589988573217006e-06, 'epoch': 1.26} {'loss': 0.3072, 'learning_rate': 6.358685943290552e-06, 'epoch': 1.26} {'loss': 0.3272, 'learning_rate': 6.358373033369756e-06, 'epoch': 1.26} {'loss': 0.4046, 'learning_rate': 6.358060127559662e-06, 'epoch': 1.26} {'loss': 0.2954, 'learning_rate': 6.357747225860627e-06, 'epoch': 1.26} {'loss': 0.4296, 'learning_rate': 6.3574343282730024e-06, 'epoch': 1.26} {'loss': 0.3034, 'learning_rate': 6.357121434797142e-06, 'epoch': 1.26} {'loss': 0.3386, 'learning_rate': 6.3568085454333995e-06, 'epoch': 1.26} {'loss': 0.2544, 'learning_rate': 6.356495660182126e-06, 'epoch': 1.26} {'loss': 0.3218, 'learning_rate': 6.356182779043678e-06, 'epoch': 1.26} {'loss': 0.2518, 'learning_rate': 6.355869902018406e-06, 'epoch': 1.26} {'loss': 0.2388, 'learning_rate': 6.355557029106664e-06, 'epoch': 1.26} {'loss': 0.3403, 'learning_rate': 6.355244160308804e-06, 'epoch': 1.26} {'loss': 0.3593, 'learning_rate': 6.354931295625181e-06, 'epoch': 1.26} {'loss': 0.3802, 'learning_rate': 6.354618435056147e-06, 'epoch': 1.26} {'loss': 0.3469, 'learning_rate': 6.354305578602056e-06, 'epoch': 1.26} {'loss': 0.4668, 'learning_rate': 6.353992726263261e-06, 'epoch': 1.26} {'loss': 0.3616, 'learning_rate': 6.353679878040113e-06, 'epoch': 1.26} {'loss': 0.2864, 'learning_rate': 6.353367033932969e-06, 'epoch': 1.26} {'loss': 0.2318, 'learning_rate': 6.353054193942179e-06, 'epoch': 1.26} {'loss': 0.2337, 'learning_rate': 6.352741358068098e-06, 'epoch': 1.26} {'loss': 0.2326, 'learning_rate': 6.352428526311079e-06, 'epoch': 1.26} {'loss': 0.3124, 'learning_rate': 6.352115698671475e-06, 'epoch': 1.26} {'loss': 0.3329, 'learning_rate': 6.351802875149637e-06, 'epoch': 1.26} {'loss': 0.373, 'learning_rate': 6.351490055745921e-06, 'epoch': 1.26} {'loss': 0.3005, 'learning_rate': 6.351177240460678e-06, 'epoch': 1.26} {'loss': 0.3565, 'learning_rate': 6.3508644292942636e-06, 'epoch': 1.26} {'loss': 0.2827, 'learning_rate': 6.350551622247028e-06, 'epoch': 1.26} {'loss': 0.3134, 'learning_rate': 6.350238819319326e-06, 'epoch': 1.26} {'loss': 0.3082, 'learning_rate': 6.3499260205115096e-06, 'epoch': 1.26} {'loss': 0.3317, 'learning_rate': 6.349613225823933e-06, 'epoch': 1.26} {'loss': 0.3054, 'learning_rate': 6.349300435256949e-06, 'epoch': 1.26} {'loss': 0.2383, 'learning_rate': 6.348987648810912e-06, 'epoch': 1.26} {'loss': 0.4694, 'learning_rate': 6.348674866486171e-06, 'epoch': 1.26} {'loss': 0.4099, 'learning_rate': 6.348362088283083e-06, 'epoch': 1.26} {'loss': 0.3475, 'learning_rate': 6.348049314202003e-06, 'epoch': 1.26} {'loss': 0.5798, 'learning_rate': 6.347736544243277e-06, 'epoch': 1.26} {'loss': 0.2943, 'learning_rate': 6.347423778407262e-06, 'epoch': 1.26} {'loss': 0.3172, 'learning_rate': 6.347111016694312e-06, 'epoch': 1.26} {'loss': 0.258, 'learning_rate': 6.3467982591047785e-06, 'epoch': 1.26} {'loss': 0.3457, 'learning_rate': 6.346485505639015e-06, 'epoch': 1.26} {'loss': 0.4124, 'learning_rate': 6.346172756297375e-06, 'epoch': 1.26} {'loss': 0.3795, 'learning_rate': 6.345860011080212e-06, 'epoch': 1.26} {'loss': 0.4343, 'learning_rate': 6.3455472699878775e-06, 'epoch': 1.26} {'loss': 0.4181, 'learning_rate': 6.345234533020724e-06, 'epoch': 1.26} {'loss': 0.2572, 'learning_rate': 6.344921800179107e-06, 'epoch': 1.26} {'loss': 0.211, 'learning_rate': 6.344609071463378e-06, 'epoch': 1.26} {'loss': 0.4062, 'learning_rate': 6.34429634687389e-06, 'epoch': 1.26} {'loss': 0.3449, 'learning_rate': 6.3439836264109984e-06, 'epoch': 1.26} {'loss': 0.287, 'learning_rate': 6.343670910075053e-06, 'epoch': 1.26} {'loss': 0.4616, 'learning_rate': 6.343358197866406e-06, 'epoch': 1.26} {'loss': 0.2859, 'learning_rate': 6.343045489785413e-06, 'epoch': 1.26} {'loss': 0.2972, 'learning_rate': 6.342732785832426e-06, 'epoch': 1.26} {'loss': 0.2405, 'learning_rate': 6.342420086007799e-06, 'epoch': 1.26} {'loss': 0.223, 'learning_rate': 6.342107390311885e-06, 'epoch': 1.26} {'loss': 0.3659, 'learning_rate': 6.341794698745034e-06, 'epoch': 1.26} {'loss': 0.3623, 'learning_rate': 6.341482011307603e-06, 'epoch': 1.26} {'loss': 0.2896, 'learning_rate': 6.341169327999942e-06, 'epoch': 1.26} {'loss': 0.3157, 'learning_rate': 6.3408566488224055e-06, 'epoch': 1.26} {'loss': 0.2751, 'learning_rate': 6.340543973775346e-06, 'epoch': 1.26} {'loss': 0.3095, 'learning_rate': 6.340231302859117e-06, 'epoch': 1.26} {'loss': 0.2581, 'learning_rate': 6.339918636074072e-06, 'epoch': 1.26} {'loss': 0.3545, 'learning_rate': 6.339605973420561e-06, 'epoch': 1.26} {'loss': 0.406, 'learning_rate': 6.339293314898938e-06, 'epoch': 1.26} {'loss': 0.4108, 'learning_rate': 6.3389806605095584e-06, 'epoch': 1.26} {'loss': 0.299, 'learning_rate': 6.338668010252773e-06, 'epoch': 1.26} {'loss': 0.1791, 'learning_rate': 6.338355364128934e-06, 'epoch': 1.26} {'loss': 0.4232, 'learning_rate': 6.338042722138397e-06, 'epoch': 1.26} {'loss': 0.2895, 'learning_rate': 6.337730084281513e-06, 'epoch': 1.26} {'loss': 0.2413, 'learning_rate': 6.337417450558635e-06, 'epoch': 1.26} {'loss': 0.3676, 'learning_rate': 6.337104820970117e-06, 'epoch': 1.26} {'loss': 0.3363, 'learning_rate': 6.33679219551631e-06, 'epoch': 1.26} {'loss': 0.2163, 'learning_rate': 6.336479574197568e-06, 'epoch': 1.26} {'loss': 0.3391, 'learning_rate': 6.3361669570142444e-06, 'epoch': 1.26} {'loss': 0.2653, 'learning_rate': 6.335854343966694e-06, 'epoch': 1.26} {'loss': 0.398, 'learning_rate': 6.335541735055265e-06, 'epoch': 1.26} {'loss': 0.3707, 'learning_rate': 6.335229130280308e-06, 'epoch': 1.26} {'loss': 0.2429, 'learning_rate': 6.334916529642186e-06, 'epoch': 1.26} {'loss': 0.4709, 'learning_rate': 6.3346039331412445e-06, 'epoch': 1.26} {'loss': 0.3398, 'learning_rate': 6.334291340777838e-06, 'epoch': 1.26} {'loss': 0.2638, 'learning_rate': 6.333978752552321e-06, 'epoch': 1.26} {'loss': 0.3041, 'learning_rate': 6.333666168465045e-06, 'epoch': 1.26} {'loss': 0.2311, 'learning_rate': 6.333353588516363e-06, 'epoch': 1.26} {'loss': 0.303, 'learning_rate': 6.3330410127066265e-06, 'epoch': 1.26} {'loss': 0.3461, 'learning_rate': 6.332728441036189e-06, 'epoch': 1.26} {'loss': 0.3771, 'learning_rate': 6.332415873505404e-06, 'epoch': 1.26} {'loss': 0.3602, 'learning_rate': 6.332103310114626e-06, 'epoch': 1.26} {'loss': 0.2341, 'learning_rate': 6.331790750864203e-06, 'epoch': 1.26} {'loss': 0.3242, 'learning_rate': 6.331478195754492e-06, 'epoch': 1.26} {'loss': 0.1937, 'learning_rate': 6.331165644785844e-06, 'epoch': 1.26} {'loss': 0.3966, 'learning_rate': 6.330853097958613e-06, 'epoch': 1.26} {'loss': 0.3692, 'learning_rate': 6.33054055527315e-06, 'epoch': 1.26} {'loss': 0.247, 'learning_rate': 6.3302280167298095e-06, 'epoch': 1.26} {'loss': 0.3861, 'learning_rate': 6.329915482328945e-06, 'epoch': 1.26} {'loss': 0.2714, 'learning_rate': 6.329602952070906e-06, 'epoch': 1.26} {'loss': 0.2586, 'learning_rate': 6.3292904259560495e-06, 'epoch': 1.26} {'loss': 0.351, 'learning_rate': 6.328977903984726e-06, 'epoch': 1.26} {'loss': 0.2816, 'learning_rate': 6.328665386157287e-06, 'epoch': 1.26} {'loss': 0.3694, 'learning_rate': 6.3283528724740864e-06, 'epoch': 1.26} {'loss': 0.2233, 'learning_rate': 6.328040362935477e-06, 'epoch': 1.26} {'loss': 0.3599, 'learning_rate': 6.327727857541813e-06, 'epoch': 1.26} {'loss': 0.3258, 'learning_rate': 6.327415356293445e-06, 'epoch': 1.26} {'loss': 0.2441, 'learning_rate': 6.327102859190728e-06, 'epoch': 1.26} {'loss': 0.3054, 'learning_rate': 6.3267903662340125e-06, 'epoch': 1.26} {'loss': 0.4413, 'learning_rate': 6.326477877423652e-06, 'epoch': 1.26} {'loss': 0.3071, 'learning_rate': 6.32616539276e-06, 'epoch': 1.26} {'loss': 0.3371, 'learning_rate': 6.325852912243406e-06, 'epoch': 1.26} {'loss': 0.4119, 'learning_rate': 6.325540435874229e-06, 'epoch': 1.26} {'loss': 0.3449, 'learning_rate': 6.325227963652818e-06, 'epoch': 1.26} {'loss': 0.3467, 'learning_rate': 6.324915495579524e-06, 'epoch': 1.26} {'loss': 0.2479, 'learning_rate': 6.324603031654703e-06, 'epoch': 1.26} {'loss': 0.4011, 'learning_rate': 6.324290571878706e-06, 'epoch': 1.26} {'loss': 0.2014, 'learning_rate': 6.323978116251885e-06, 'epoch': 1.26} {'loss': 0.3417, 'learning_rate': 6.323665664774594e-06, 'epoch': 1.26} {'loss': 0.3878, 'learning_rate': 6.3233532174471854e-06, 'epoch': 1.26} {'loss': 0.3777, 'learning_rate': 6.323040774270011e-06, 'epoch': 1.26} {'loss': 0.3974, 'learning_rate': 6.322728335243427e-06, 'epoch': 1.26} {'loss': 0.4068, 'learning_rate': 6.322415900367781e-06, 'epoch': 1.26} {'loss': 0.274, 'learning_rate': 6.322103469643428e-06, 'epoch': 1.26} {'loss': 0.1436, 'learning_rate': 6.321791043070722e-06, 'epoch': 1.26} {'loss': 0.3497, 'learning_rate': 6.321478620650014e-06, 'epoch': 1.26} {'loss': 0.2482, 'learning_rate': 6.32116620238166e-06, 'epoch': 1.26} {'loss': 0.3404, 'learning_rate': 6.320853788266006e-06, 'epoch': 1.26} {'loss': 0.3244, 'learning_rate': 6.320541378303411e-06, 'epoch': 1.26} {'loss': 0.318, 'learning_rate': 6.320228972494222e-06, 'epoch': 1.26} {'loss': 0.2584, 'learning_rate': 6.319916570838798e-06, 'epoch': 1.26} {'loss': 0.2902, 'learning_rate': 6.319604173337486e-06, 'epoch': 1.26} {'loss': 0.3358, 'learning_rate': 6.319291779990642e-06, 'epoch': 1.26} {'loss': 0.4989, 'learning_rate': 6.3189793907986165e-06, 'epoch': 1.26} {'loss': 0.182, 'learning_rate': 6.318667005761765e-06, 'epoch': 1.26} {'loss': 0.3374, 'learning_rate': 6.3183546248804375e-06, 'epoch': 1.26} {'loss': 0.2418, 'learning_rate': 6.318042248154988e-06, 'epoch': 1.26} {'loss': 0.1955, 'learning_rate': 6.317729875585767e-06, 'epoch': 1.26} {'loss': 0.2971, 'learning_rate': 6.317417507173132e-06, 'epoch': 1.26} {'loss': 0.3964, 'learning_rate': 6.317105142917431e-06, 'epoch': 1.26} {'loss': 0.3966, 'learning_rate': 6.316792782819017e-06, 'epoch': 1.26} {'loss': 0.433, 'learning_rate': 6.316480426878244e-06, 'epoch': 1.26} {'loss': 0.3663, 'learning_rate': 6.316168075095465e-06, 'epoch': 1.26} {'loss': 0.3247, 'learning_rate': 6.31585572747103e-06, 'epoch': 1.26} {'loss': 0.3558, 'learning_rate': 6.315543384005294e-06, 'epoch': 1.26} {'loss': 0.3091, 'learning_rate': 6.315231044698609e-06, 'epoch': 1.26} {'loss': 0.3853, 'learning_rate': 6.314918709551327e-06, 'epoch': 1.26} {'loss': 0.2327, 'learning_rate': 6.314606378563803e-06, 'epoch': 1.26} {'loss': 0.3148, 'learning_rate': 6.3142940517363846e-06, 'epoch': 1.26} {'loss': 0.3563, 'learning_rate': 6.31398172906943e-06, 'epoch': 1.26} {'loss': 0.2335, 'learning_rate': 6.313669410563288e-06, 'epoch': 1.26} {'loss': 0.3126, 'learning_rate': 6.313357096218311e-06, 'epoch': 1.26} {'loss': 0.358, 'learning_rate': 6.3130447860348546e-06, 'epoch': 1.26} {'loss': 0.3732, 'learning_rate': 6.31273248001327e-06, 'epoch': 1.26} {'loss': 0.2899, 'learning_rate': 6.3124201781539085e-06, 'epoch': 1.26} {'loss': 0.2201, 'learning_rate': 6.312107880457123e-06, 'epoch': 1.26} {'loss': 0.3065, 'learning_rate': 6.311795586923266e-06, 'epoch': 1.26} {'loss': 0.4908, 'learning_rate': 6.311483297552692e-06, 'epoch': 1.26} {'loss': 0.3726, 'learning_rate': 6.3111710123457505e-06, 'epoch': 1.26} {'loss': 0.3276, 'learning_rate': 6.310858731302796e-06, 'epoch': 1.26} {'loss': 0.3151, 'learning_rate': 6.31054645442418e-06, 'epoch': 1.26} {'loss': 0.1837, 'learning_rate': 6.310234181710255e-06, 'epoch': 1.26} {'loss': 0.2501, 'learning_rate': 6.309921913161376e-06, 'epoch': 1.26} {'loss': 0.3188, 'learning_rate': 6.309609648777892e-06, 'epoch': 1.26} {'loss': 0.3367, 'learning_rate': 6.3092973885601574e-06, 'epoch': 1.26} {'loss': 0.4159, 'learning_rate': 6.308985132508523e-06, 'epoch': 1.26} {'loss': 0.3532, 'learning_rate': 6.308672880623345e-06, 'epoch': 1.26} {'loss': 0.5109, 'learning_rate': 6.308360632904973e-06, 'epoch': 1.26} {'loss': 0.3927, 'learning_rate': 6.308048389353758e-06, 'epoch': 1.26} {'loss': 0.3097, 'learning_rate': 6.307736149970056e-06, 'epoch': 1.26} {'loss': 0.232, 'learning_rate': 6.307423914754216e-06, 'epoch': 1.26} {'loss': 0.3968, 'learning_rate': 6.307111683706593e-06, 'epoch': 1.26} {'loss': 0.4535, 'learning_rate': 6.306799456827539e-06, 'epoch': 1.26} {'loss': 0.3389, 'learning_rate': 6.306487234117405e-06, 'epoch': 1.26} {'loss': 0.3973, 'learning_rate': 6.306175015576545e-06, 'epoch': 1.26} {'loss': 0.4742, 'learning_rate': 6.3058628012053124e-06, 'epoch': 1.26} {'loss': 0.2696, 'learning_rate': 6.305550591004057e-06, 'epoch': 1.26} {'loss': 0.2765, 'learning_rate': 6.305238384973132e-06, 'epoch': 1.26} {'loss': 0.3996, 'learning_rate': 6.304926183112892e-06, 'epoch': 1.26} {'loss': 0.3124, 'learning_rate': 6.304613985423688e-06, 'epoch': 1.26} {'loss': 0.239, 'learning_rate': 6.304301791905867e-06, 'epoch': 1.26} {'loss': 0.4468, 'learning_rate': 6.30398960255979e-06, 'epoch': 1.26} {'loss': 0.4144, 'learning_rate': 6.303677417385807e-06, 'epoch': 1.26} {'loss': 0.2537, 'learning_rate': 6.303365236384267e-06, 'epoch': 1.26} {'loss': 0.4063, 'learning_rate': 6.3030530595555265e-06, 'epoch': 1.26} {'loss': 0.363, 'learning_rate': 6.302740886899936e-06, 'epoch': 1.26} {'loss': 0.4401, 'learning_rate': 6.30242871841785e-06, 'epoch': 1.26} {'loss': 0.3851, 'learning_rate': 6.302116554109616e-06, 'epoch': 1.26} {'loss': 0.3211, 'learning_rate': 6.30180439397559e-06, 'epoch': 1.26} {'loss': 0.214, 'learning_rate': 6.301492238016122e-06, 'epoch': 1.26} {'loss': 0.4381, 'learning_rate': 6.3011800862315685e-06, 'epoch': 1.26} {'loss': 0.4523, 'learning_rate': 6.300867938622278e-06, 'epoch': 1.26} {'loss': 0.3315, 'learning_rate': 6.300555795188604e-06, 'epoch': 1.26} {'loss': 0.3438, 'learning_rate': 6.3002436559309e-06, 'epoch': 1.26} {'loss': 0.2102, 'learning_rate': 6.299931520849516e-06, 'epoch': 1.26} {'loss': 0.2999, 'learning_rate': 6.2996193899448065e-06, 'epoch': 1.26} {'loss': 0.3586, 'learning_rate': 6.299307263217122e-06, 'epoch': 1.26} {'loss': 0.4034, 'learning_rate': 6.298995140666817e-06, 'epoch': 1.26} {'loss': 0.2834, 'learning_rate': 6.298683022294243e-06, 'epoch': 1.26} {'loss': 0.3852, 'learning_rate': 6.298370908099754e-06, 'epoch': 1.26} {'loss': 0.3712, 'learning_rate': 6.298058798083697e-06, 'epoch': 1.26} {'loss': 0.3444, 'learning_rate': 6.297746692246429e-06, 'epoch': 1.27} {'loss': 0.2473, 'learning_rate': 6.2974345905883e-06, 'epoch': 1.27} {'loss': 0.2267, 'learning_rate': 6.297122493109664e-06, 'epoch': 1.27} {'loss': 0.2661, 'learning_rate': 6.296810399810873e-06, 'epoch': 1.27} {'loss': 0.3936, 'learning_rate': 6.296498310692278e-06, 'epoch': 1.27} {'loss': 0.3214, 'learning_rate': 6.296186225754233e-06, 'epoch': 1.27} {'loss': 0.3493, 'learning_rate': 6.2958741449970894e-06, 'epoch': 1.27} {'loss': 0.4164, 'learning_rate': 6.2955620684211985e-06, 'epoch': 1.27} {'loss': 0.3604, 'learning_rate': 6.295249996026913e-06, 'epoch': 1.27} {'loss': 0.2635, 'learning_rate': 6.294937927814589e-06, 'epoch': 1.27} {'loss': 0.2911, 'learning_rate': 6.294625863784571e-06, 'epoch': 1.27} {'loss': 0.2401, 'learning_rate': 6.29431380393722e-06, 'epoch': 1.27} {'loss': 0.2521, 'learning_rate': 6.294001748272883e-06, 'epoch': 1.27} {'loss': 0.3531, 'learning_rate': 6.293689696791913e-06, 'epoch': 1.27} {'loss': 0.296, 'learning_rate': 6.293377649494662e-06, 'epoch': 1.27} {'loss': 0.2849, 'learning_rate': 6.293065606381483e-06, 'epoch': 1.27} {'loss': 0.375, 'learning_rate': 6.292753567452727e-06, 'epoch': 1.27} {'loss': 0.2428, 'learning_rate': 6.2924415327087484e-06, 'epoch': 1.27} {'loss': 0.3563, 'learning_rate': 6.292129502149898e-06, 'epoch': 1.27} {'loss': 0.3151, 'learning_rate': 6.291817475776528e-06, 'epoch': 1.27} {'loss': 0.4282, 'learning_rate': 6.291505453588992e-06, 'epoch': 1.27} {'loss': 0.4253, 'learning_rate': 6.29119343558764e-06, 'epoch': 1.27} {'loss': 0.4319, 'learning_rate': 6.290881421772826e-06, 'epoch': 1.27} {'loss': 0.1591, 'learning_rate': 6.290569412144901e-06, 'epoch': 1.27} {'loss': 0.2687, 'learning_rate': 6.2902574067042185e-06, 'epoch': 1.27} {'loss': 0.2601, 'learning_rate': 6.289945405451131e-06, 'epoch': 1.27} {'loss': 0.2946, 'learning_rate': 6.289633408385989e-06, 'epoch': 1.27} {'loss': 0.3263, 'learning_rate': 6.289321415509144e-06, 'epoch': 1.27} {'loss': 0.3552, 'learning_rate': 6.289009426820949e-06, 'epoch': 1.27} {'loss': 0.3084, 'learning_rate': 6.2886974423217585e-06, 'epoch': 1.27} {'loss': 0.3238, 'learning_rate': 6.288385462011921e-06, 'epoch': 1.27} {'loss': 0.349, 'learning_rate': 6.288073485891792e-06, 'epoch': 1.27} {'loss': 0.2763, 'learning_rate': 6.287761513961721e-06, 'epoch': 1.27} {'loss': 0.2827, 'learning_rate': 6.287449546222062e-06, 'epoch': 1.27} {'loss': 0.3083, 'learning_rate': 6.287137582673167e-06, 'epoch': 1.27} {'loss': 0.3214, 'learning_rate': 6.286825623315387e-06, 'epoch': 1.27} {'loss': 0.2794, 'learning_rate': 6.286513668149074e-06, 'epoch': 1.27} {'loss': 0.6002, 'learning_rate': 6.286201717174582e-06, 'epoch': 1.27} {'loss': 0.2198, 'learning_rate': 6.285889770392265e-06, 'epoch': 1.27} {'loss': 0.3051, 'learning_rate': 6.2855778278024694e-06, 'epoch': 1.27} {'loss': 0.2755, 'learning_rate': 6.285265889405549e-06, 'epoch': 1.27} {'loss': 0.2655, 'learning_rate': 6.284953955201858e-06, 'epoch': 1.27} {'loss': 0.1796, 'learning_rate': 6.284642025191747e-06, 'epoch': 1.27} {'loss': 0.379, 'learning_rate': 6.284330099375569e-06, 'epoch': 1.27} {'loss': 0.235, 'learning_rate': 6.284018177753676e-06, 'epoch': 1.27} {'loss': 0.5206, 'learning_rate': 6.2837062603264185e-06, 'epoch': 1.27} {'loss': 0.2757, 'learning_rate': 6.283394347094152e-06, 'epoch': 1.27} {'loss': 0.2531, 'learning_rate': 6.283082438057226e-06, 'epoch': 1.27} {'loss': 0.3658, 'learning_rate': 6.282770533215992e-06, 'epoch': 1.27} {'loss': 0.4066, 'learning_rate': 6.282458632570805e-06, 'epoch': 1.27} {'loss': 0.326, 'learning_rate': 6.282146736122012e-06, 'epoch': 1.27} {'loss': 0.2893, 'learning_rate': 6.281834843869974e-06, 'epoch': 1.27} {'loss': 0.3158, 'learning_rate': 6.281522955815034e-06, 'epoch': 1.27} {'loss': 0.3699, 'learning_rate': 6.281211071957547e-06, 'epoch': 1.27} {'loss': 0.2227, 'learning_rate': 6.280899192297866e-06, 'epoch': 1.27} {'loss': 0.3882, 'learning_rate': 6.2805873168363415e-06, 'epoch': 1.27} {'loss': 0.2803, 'learning_rate': 6.280275445573328e-06, 'epoch': 1.27} {'loss': 0.1759, 'learning_rate': 6.279963578509176e-06, 'epoch': 1.27} {'loss': 0.4183, 'learning_rate': 6.2796517156442385e-06, 'epoch': 1.27} {'loss': 0.3358, 'learning_rate': 6.279339856978866e-06, 'epoch': 1.27} {'loss': 0.4305, 'learning_rate': 6.27902800251341e-06, 'epoch': 1.27} {'loss': 0.3334, 'learning_rate': 6.278716152248225e-06, 'epoch': 1.27} {'loss': 0.4571, 'learning_rate': 6.278404306183662e-06, 'epoch': 1.27} {'loss': 0.3101, 'learning_rate': 6.2780924643200724e-06, 'epoch': 1.27} {'loss': 0.3489, 'learning_rate': 6.277780626657811e-06, 'epoch': 1.27} {'loss': 0.3172, 'learning_rate': 6.277468793197226e-06, 'epoch': 1.27} {'loss': 0.2849, 'learning_rate': 6.27715696393867e-06, 'epoch': 1.27} {'loss': 0.394, 'learning_rate': 6.2768451388824955e-06, 'epoch': 1.27} {'loss': 0.2329, 'learning_rate': 6.276533318029056e-06, 'epoch': 1.27} {'loss': 0.3123, 'learning_rate': 6.276221501378701e-06, 'epoch': 1.27} {'loss': 0.3615, 'learning_rate': 6.275909688931785e-06, 'epoch': 1.27} {'loss': 0.4108, 'learning_rate': 6.275597880688658e-06, 'epoch': 1.27} {'loss': 0.3587, 'learning_rate': 6.275286076649674e-06, 'epoch': 1.27} {'loss': 0.3666, 'learning_rate': 6.274974276815182e-06, 'epoch': 1.27} {'loss': 0.2296, 'learning_rate': 6.274662481185536e-06, 'epoch': 1.27} {'loss': 0.3351, 'learning_rate': 6.2743506897610885e-06, 'epoch': 1.27} {'loss': 0.3884, 'learning_rate': 6.27403890254219e-06, 'epoch': 1.27} {'loss': 0.4497, 'learning_rate': 6.273727119529196e-06, 'epoch': 1.27} {'loss': 0.3233, 'learning_rate': 6.273415340722449e-06, 'epoch': 1.27} {'loss': 0.2376, 'learning_rate': 6.273103566122311e-06, 'epoch': 1.27} {'loss': 0.326, 'learning_rate': 6.2727917957291305e-06, 'epoch': 1.27} {'loss': 0.4069, 'learning_rate': 6.27248002954326e-06, 'epoch': 1.27} {'loss': 0.3112, 'learning_rate': 6.27216826756505e-06, 'epoch': 1.27} {'loss': 0.3626, 'learning_rate': 6.271856509794854e-06, 'epoch': 1.27} {'loss': 0.3598, 'learning_rate': 6.2715447562330215e-06, 'epoch': 1.27} {'loss': 0.2482, 'learning_rate': 6.271233006879909e-06, 'epoch': 1.27} {'loss': 0.4693, 'learning_rate': 6.270921261735863e-06, 'epoch': 1.27} {'loss': 0.3418, 'learning_rate': 6.2706095208012385e-06, 'epoch': 1.27} {'loss': 0.2381, 'learning_rate': 6.270297784076386e-06, 'epoch': 1.27} {'loss': 0.4817, 'learning_rate': 6.269986051561659e-06, 'epoch': 1.27} {'loss': 0.2469, 'learning_rate': 6.269674323257406e-06, 'epoch': 1.27} {'loss': 0.1986, 'learning_rate': 6.269362599163984e-06, 'epoch': 1.27} {'loss': 0.3217, 'learning_rate': 6.269050879281741e-06, 'epoch': 1.27} {'loss': 0.2465, 'learning_rate': 6.268739163611031e-06, 'epoch': 1.27} {'loss': 0.3385, 'learning_rate': 6.268427452152203e-06, 'epoch': 1.27} {'loss': 0.2883, 'learning_rate': 6.268115744905612e-06, 'epoch': 1.27} {'loss': 0.3687, 'learning_rate': 6.267804041871609e-06, 'epoch': 1.27} {'loss': 0.2526, 'learning_rate': 6.267492343050545e-06, 'epoch': 1.27} {'loss': 0.3141, 'learning_rate': 6.2671806484427755e-06, 'epoch': 1.27} {'loss': 0.2939, 'learning_rate': 6.266868958048646e-06, 'epoch': 1.27} {'loss': 0.314, 'learning_rate': 6.266557271868512e-06, 'epoch': 1.27} {'loss': 0.3381, 'learning_rate': 6.266245589902724e-06, 'epoch': 1.27} {'loss': 0.2882, 'learning_rate': 6.265933912151636e-06, 'epoch': 1.27} {'loss': 0.2771, 'learning_rate': 6.265622238615598e-06, 'epoch': 1.27} {'loss': 0.3156, 'learning_rate': 6.265310569294962e-06, 'epoch': 1.27} {'loss': 0.247, 'learning_rate': 6.264998904190081e-06, 'epoch': 1.27} {'loss': 0.3437, 'learning_rate': 6.2646872433013065e-06, 'epoch': 1.27} {'loss': 0.2575, 'learning_rate': 6.264375586628989e-06, 'epoch': 1.27} {'loss': 0.2833, 'learning_rate': 6.264063934173481e-06, 'epoch': 1.27} {'loss': 0.2984, 'learning_rate': 6.263752285935134e-06, 'epoch': 1.27} {'loss': 0.3127, 'learning_rate': 6.263440641914301e-06, 'epoch': 1.27} {'loss': 0.3336, 'learning_rate': 6.263129002111334e-06, 'epoch': 1.27} {'loss': 0.4105, 'learning_rate': 6.2628173665265835e-06, 'epoch': 1.27} {'loss': 0.3766, 'learning_rate': 6.2625057351604e-06, 'epoch': 1.27} {'loss': 0.3357, 'learning_rate': 6.262194108013138e-06, 'epoch': 1.27} {'loss': 0.2895, 'learning_rate': 6.261882485085146e-06, 'epoch': 1.27} {'loss': 0.3817, 'learning_rate': 6.26157086637678e-06, 'epoch': 1.27} {'loss': 0.3935, 'learning_rate': 6.261259251888389e-06, 'epoch': 1.27} {'loss': 0.3364, 'learning_rate': 6.260947641620325e-06, 'epoch': 1.27} {'loss': 0.2688, 'learning_rate': 6.26063603557294e-06, 'epoch': 1.27} {'loss': 0.3297, 'learning_rate': 6.260324433746585e-06, 'epoch': 1.27} {'loss': 0.2606, 'learning_rate': 6.260012836141614e-06, 'epoch': 1.27} {'loss': 0.4831, 'learning_rate': 6.259701242758377e-06, 'epoch': 1.27} {'loss': 0.2448, 'learning_rate': 6.259389653597226e-06, 'epoch': 1.27} {'loss': 0.4428, 'learning_rate': 6.259078068658515e-06, 'epoch': 1.27} {'loss': 0.2917, 'learning_rate': 6.258766487942591e-06, 'epoch': 1.27} {'loss': 0.3203, 'learning_rate': 6.258454911449809e-06, 'epoch': 1.27} {'loss': 0.2843, 'learning_rate': 6.258143339180519e-06, 'epoch': 1.27} {'loss': 0.3287, 'learning_rate': 6.257831771135074e-06, 'epoch': 1.27} {'loss': 0.3513, 'learning_rate': 6.257520207313826e-06, 'epoch': 1.27} {'loss': 0.2948, 'learning_rate': 6.257208647717125e-06, 'epoch': 1.27} {'loss': 0.3626, 'learning_rate': 6.2568970923453245e-06, 'epoch': 1.27} {'loss': 0.3982, 'learning_rate': 6.256585541198774e-06, 'epoch': 1.27} {'loss': 0.2866, 'learning_rate': 6.2562739942778285e-06, 'epoch': 1.27} {'loss': 0.287, 'learning_rate': 6.255962451582835e-06, 'epoch': 1.27} {'loss': 0.2694, 'learning_rate': 6.255650913114151e-06, 'epoch': 1.27} {'loss': 0.2962, 'learning_rate': 6.2553393788721225e-06, 'epoch': 1.27} {'loss': 0.3604, 'learning_rate': 6.255027848857108e-06, 'epoch': 1.27} {'loss': 0.3132, 'learning_rate': 6.254716323069452e-06, 'epoch': 1.27} {'loss': 0.2316, 'learning_rate': 6.2544048015095095e-06, 'epoch': 1.27} {'loss': 0.2554, 'learning_rate': 6.254093284177631e-06, 'epoch': 1.27} {'loss': 0.2855, 'learning_rate': 6.253781771074169e-06, 'epoch': 1.27} {'loss': 0.4261, 'learning_rate': 6.253470262199475e-06, 'epoch': 1.27} {'loss': 0.3235, 'learning_rate': 6.253158757553901e-06, 'epoch': 1.27} {'loss': 0.358, 'learning_rate': 6.252847257137797e-06, 'epoch': 1.27} {'loss': 0.3538, 'learning_rate': 6.252535760951518e-06, 'epoch': 1.27} {'loss': 0.3465, 'learning_rate': 6.252224268995412e-06, 'epoch': 1.27} {'loss': 0.389, 'learning_rate': 6.251912781269833e-06, 'epoch': 1.27} {'loss': 0.5001, 'learning_rate': 6.251601297775132e-06, 'epoch': 1.27} {'loss': 0.3197, 'learning_rate': 6.251289818511659e-06, 'epoch': 1.27} {'loss': 0.3169, 'learning_rate': 6.25097834347977e-06, 'epoch': 1.27} {'loss': 0.3668, 'learning_rate': 6.250666872679811e-06, 'epoch': 1.27} {'loss': 0.283, 'learning_rate': 6.250355406112137e-06, 'epoch': 1.27} {'loss': 0.2957, 'learning_rate': 6.250043943777098e-06, 'epoch': 1.27} {'loss': 0.3222, 'learning_rate': 6.249732485675046e-06, 'epoch': 1.27} {'loss': 0.3168, 'learning_rate': 6.2494210318063334e-06, 'epoch': 1.27} {'loss': 0.3477, 'learning_rate': 6.249109582171311e-06, 'epoch': 1.27} {'loss': 0.3387, 'learning_rate': 6.24879813677033e-06, 'epoch': 1.27} {'loss': 0.4943, 'learning_rate': 6.248486695603744e-06, 'epoch': 1.27} {'loss': 0.2209, 'learning_rate': 6.2481752586719025e-06, 'epoch': 1.27} {'loss': 0.3194, 'learning_rate': 6.247863825975156e-06, 'epoch': 1.27} {'loss': 0.3261, 'learning_rate': 6.247552397513861e-06, 'epoch': 1.27} {'loss': 0.339, 'learning_rate': 6.2472409732883634e-06, 'epoch': 1.27} {'loss': 0.2621, 'learning_rate': 6.246929553299019e-06, 'epoch': 1.27} {'loss': 0.3382, 'learning_rate': 6.246618137546177e-06, 'epoch': 1.27} {'loss': 0.4134, 'learning_rate': 6.246306726030189e-06, 'epoch': 1.27} {'loss': 0.3972, 'learning_rate': 6.245995318751406e-06, 'epoch': 1.27} {'loss': 0.4228, 'learning_rate': 6.245683915710181e-06, 'epoch': 1.27} {'loss': 0.3435, 'learning_rate': 6.245372516906865e-06, 'epoch': 1.27} {'loss': 0.4718, 'learning_rate': 6.245061122341809e-06, 'epoch': 1.27} {'loss': 0.3722, 'learning_rate': 6.244749732015365e-06, 'epoch': 1.27} {'loss': 0.4208, 'learning_rate': 6.244438345927886e-06, 'epoch': 1.27} {'loss': 0.3235, 'learning_rate': 6.244126964079719e-06, 'epoch': 1.27} {'loss': 0.3454, 'learning_rate': 6.243815586471221e-06, 'epoch': 1.27} {'loss': 0.2886, 'learning_rate': 6.24350421310274e-06, 'epoch': 1.27} {'loss': 0.5224, 'learning_rate': 6.243192843974629e-06, 'epoch': 1.27} {'loss': 0.3939, 'learning_rate': 6.2428814790872395e-06, 'epoch': 1.27} {'loss': 0.3079, 'learning_rate': 6.242570118440918e-06, 'epoch': 1.27} {'loss': 0.3739, 'learning_rate': 6.242258762036024e-06, 'epoch': 1.27} {'loss': 0.2813, 'learning_rate': 6.2419474098729045e-06, 'epoch': 1.27} {'loss': 0.309, 'learning_rate': 6.2416360619519125e-06, 'epoch': 1.27} {'loss': 0.4358, 'learning_rate': 6.2413247182733985e-06, 'epoch': 1.27} {'loss': 0.3367, 'learning_rate': 6.241013378837715e-06, 'epoch': 1.27} {'loss': 0.3671, 'learning_rate': 6.2407020436452105e-06, 'epoch': 1.27} {'loss': 0.3004, 'learning_rate': 6.240390712696241e-06, 'epoch': 1.27} {'loss': 0.4441, 'learning_rate': 6.240079385991155e-06, 'epoch': 1.27} {'loss': 0.499, 'learning_rate': 6.239768063530303e-06, 'epoch': 1.27} {'loss': 0.3546, 'learning_rate': 6.2394567453140386e-06, 'epoch': 1.27} {'loss': 0.2869, 'learning_rate': 6.239145431342712e-06, 'epoch': 1.27} {'loss': 0.2539, 'learning_rate': 6.238834121616675e-06, 'epoch': 1.27} {'loss': 0.222, 'learning_rate': 6.2385228161362785e-06, 'epoch': 1.27} {'loss': 0.2939, 'learning_rate': 6.2382115149018765e-06, 'epoch': 1.27} {'loss': 0.3035, 'learning_rate': 6.237900217913817e-06, 'epoch': 1.27} {'loss': 0.1975, 'learning_rate': 6.237588925172453e-06, 'epoch': 1.27} {'loss': 0.2094, 'learning_rate': 6.237277636678135e-06, 'epoch': 1.27} {'loss': 0.2639, 'learning_rate': 6.236966352431215e-06, 'epoch': 1.27} {'loss': 0.3647, 'learning_rate': 6.236655072432045e-06, 'epoch': 1.27} {'loss': 0.161, 'learning_rate': 6.236343796680978e-06, 'epoch': 1.27} {'loss': 0.2643, 'learning_rate': 6.236032525178362e-06, 'epoch': 1.27} {'loss': 0.3266, 'learning_rate': 6.235721257924547e-06, 'epoch': 1.27} {'loss': 0.3357, 'learning_rate': 6.235409994919889e-06, 'epoch': 1.27} {'loss': 0.2164, 'learning_rate': 6.235098736164736e-06, 'epoch': 1.27} {'loss': 0.2297, 'learning_rate': 6.234787481659441e-06, 'epoch': 1.27} {'loss': 0.2031, 'learning_rate': 6.234476231404356e-06, 'epoch': 1.27} {'loss': 0.2596, 'learning_rate': 6.23416498539983e-06, 'epoch': 1.27} {'loss': 0.4099, 'learning_rate': 6.233853743646217e-06, 'epoch': 1.27} {'loss': 0.2834, 'learning_rate': 6.233542506143865e-06, 'epoch': 1.27} {'loss': 0.3237, 'learning_rate': 6.2332312728931275e-06, 'epoch': 1.27} {'loss': 0.2674, 'learning_rate': 6.232920043894357e-06, 'epoch': 1.27} {'loss': 0.3832, 'learning_rate': 6.232608819147903e-06, 'epoch': 1.27} {'loss': 0.2257, 'learning_rate': 6.232297598654119e-06, 'epoch': 1.27} {'loss': 0.4162, 'learning_rate': 6.231986382413353e-06, 'epoch': 1.27} {'loss': 0.2615, 'learning_rate': 6.231675170425957e-06, 'epoch': 1.27} {'loss': 0.4175, 'learning_rate': 6.231363962692283e-06, 'epoch': 1.27} {'loss': 0.3417, 'learning_rate': 6.231052759212684e-06, 'epoch': 1.27} {'loss': 0.2222, 'learning_rate': 6.2307415599875074e-06, 'epoch': 1.27} {'loss': 0.404, 'learning_rate': 6.230430365017108e-06, 'epoch': 1.27} {'loss': 0.3329, 'learning_rate': 6.230119174301836e-06, 'epoch': 1.27} {'loss': 0.293, 'learning_rate': 6.229807987842043e-06, 'epoch': 1.27} {'loss': 0.424, 'learning_rate': 6.22949680563808e-06, 'epoch': 1.27} {'loss': 0.3599, 'learning_rate': 6.229185627690297e-06, 'epoch': 1.27} {'loss': 0.3188, 'learning_rate': 6.228874453999048e-06, 'epoch': 1.27} {'loss': 0.2353, 'learning_rate': 6.2285632845646815e-06, 'epoch': 1.27} {'loss': 0.3967, 'learning_rate': 6.22825211938755e-06, 'epoch': 1.27} {'loss': 0.4084, 'learning_rate': 6.227940958468006e-06, 'epoch': 1.27} {'loss': 0.4493, 'learning_rate': 6.2276298018063985e-06, 'epoch': 1.27} {'loss': 0.3045, 'learning_rate': 6.227318649403079e-06, 'epoch': 1.27} {'loss': 0.2412, 'learning_rate': 6.2270075012584e-06, 'epoch': 1.27} {'loss': 0.2618, 'learning_rate': 6.226696357372711e-06, 'epoch': 1.27} {'loss': 0.2892, 'learning_rate': 6.226385217746364e-06, 'epoch': 1.27} {'loss': 0.2181, 'learning_rate': 6.2260740823797115e-06, 'epoch': 1.27} {'loss': 0.3636, 'learning_rate': 6.225762951273104e-06, 'epoch': 1.27} {'loss': 0.3293, 'learning_rate': 6.2254518244268916e-06, 'epoch': 1.27} {'loss': 0.466, 'learning_rate': 6.225140701841428e-06, 'epoch': 1.27} {'loss': 0.3017, 'learning_rate': 6.224829583517061e-06, 'epoch': 1.27} {'loss': 0.2683, 'learning_rate': 6.224518469454144e-06, 'epoch': 1.27} {'loss': 0.2701, 'learning_rate': 6.2242073596530274e-06, 'epoch': 1.27} {'loss': 0.277, 'learning_rate': 6.223896254114065e-06, 'epoch': 1.27} {'loss': 0.3435, 'learning_rate': 6.223585152837603e-06, 'epoch': 1.27} {'loss': 0.3719, 'learning_rate': 6.223274055823996e-06, 'epoch': 1.27} {'loss': 0.2081, 'learning_rate': 6.2229629630735944e-06, 'epoch': 1.27} {'loss': 0.3309, 'learning_rate': 6.222651874586749e-06, 'epoch': 1.27} {'loss': 0.3568, 'learning_rate': 6.222340790363812e-06, 'epoch': 1.27} {'loss': 0.4123, 'learning_rate': 6.222029710405133e-06, 'epoch': 1.27} {'loss': 0.421, 'learning_rate': 6.221718634711064e-06, 'epoch': 1.27} {'loss': 0.3805, 'learning_rate': 6.221407563281957e-06, 'epoch': 1.27} {'loss': 0.3836, 'learning_rate': 6.2210964961181615e-06, 'epoch': 1.27} {'loss': 0.2957, 'learning_rate': 6.220785433220031e-06, 'epoch': 1.27} {'loss': 0.3303, 'learning_rate': 6.220474374587913e-06, 'epoch': 1.27} {'loss': 0.4917, 'learning_rate': 6.2201633202221624e-06, 'epoch': 1.27} {'loss': 0.4081, 'learning_rate': 6.21985227012313e-06, 'epoch': 1.27} {'loss': 0.3577, 'learning_rate': 6.219541224291163e-06, 'epoch': 1.27} {'loss': 0.3482, 'learning_rate': 6.219230182726616e-06, 'epoch': 1.27} {'loss': 0.2251, 'learning_rate': 6.218919145429839e-06, 'epoch': 1.27} {'loss': 0.3399, 'learning_rate': 6.2186081124011834e-06, 'epoch': 1.27} {'loss': 0.2133, 'learning_rate': 6.218297083641e-06, 'epoch': 1.27} {'loss': 0.2756, 'learning_rate': 6.2179860591496385e-06, 'epoch': 1.27} {'loss': 0.3504, 'learning_rate': 6.2176750389274546e-06, 'epoch': 1.27} {'loss': 0.3967, 'learning_rate': 6.2173640229747944e-06, 'epoch': 1.27} {'loss': 0.2294, 'learning_rate': 6.217053011292011e-06, 'epoch': 1.27} {'loss': 0.3716, 'learning_rate': 6.216742003879456e-06, 'epoch': 1.27} {'loss': 0.5504, 'learning_rate': 6.2164310007374795e-06, 'epoch': 1.27} {'loss': 0.2892, 'learning_rate': 6.216120001866432e-06, 'epoch': 1.27} {'loss': 0.3054, 'learning_rate': 6.215809007266669e-06, 'epoch': 1.27} {'loss': 0.273, 'learning_rate': 6.215498016938535e-06, 'epoch': 1.27} {'loss': 0.3209, 'learning_rate': 6.2151870308823855e-06, 'epoch': 1.27} {'loss': 0.3164, 'learning_rate': 6.214876049098569e-06, 'epoch': 1.27} {'loss': 0.3392, 'learning_rate': 6.2145650715874375e-06, 'epoch': 1.27} {'loss': 0.336, 'learning_rate': 6.214254098349343e-06, 'epoch': 1.27} {'loss': 0.1912, 'learning_rate': 6.213943129384634e-06, 'epoch': 1.27} {'loss': 0.2653, 'learning_rate': 6.213632164693666e-06, 'epoch': 1.27} {'loss': 0.2656, 'learning_rate': 6.2133212042767855e-06, 'epoch': 1.27} {'loss': 0.4575, 'learning_rate': 6.213010248134346e-06, 'epoch': 1.27} {'loss': 0.3468, 'learning_rate': 6.212699296266697e-06, 'epoch': 1.27} {'loss': 0.3022, 'learning_rate': 6.21238834867419e-06, 'epoch': 1.27} {'loss': 0.3841, 'learning_rate': 6.212077405357177e-06, 'epoch': 1.27} {'loss': 0.389, 'learning_rate': 6.211766466316011e-06, 'epoch': 1.27} {'loss': 0.3225, 'learning_rate': 6.2114555315510325e-06, 'epoch': 1.27} {'loss': 0.2947, 'learning_rate': 6.211144601062607e-06, 'epoch': 1.27} {'loss': 0.4221, 'learning_rate': 6.210833674851076e-06, 'epoch': 1.27} {'loss': 0.3435, 'learning_rate': 6.210522752916794e-06, 'epoch': 1.27} {'loss': 0.2252, 'learning_rate': 6.210211835260111e-06, 'epoch': 1.27} {'loss': 0.4065, 'learning_rate': 6.20990092188138e-06, 'epoch': 1.27} {'loss': 0.4008, 'learning_rate': 6.209590012780949e-06, 'epoch': 1.27} {'loss': 0.2086, 'learning_rate': 6.209279107959172e-06, 'epoch': 1.27} {'loss': 0.5312, 'learning_rate': 6.208968207416395e-06, 'epoch': 1.27} {'loss': 0.3147, 'learning_rate': 6.2086573111529735e-06, 'epoch': 1.27} {'loss': 0.3221, 'learning_rate': 6.208346419169257e-06, 'epoch': 1.27} {'loss': 0.3979, 'learning_rate': 6.208035531465595e-06, 'epoch': 1.27} {'loss': 0.3217, 'learning_rate': 6.207724648042342e-06, 'epoch': 1.27} {'loss': 0.4189, 'learning_rate': 6.207413768899844e-06, 'epoch': 1.27} {'loss': 0.4283, 'learning_rate': 6.207102894038457e-06, 'epoch': 1.27} {'loss': 0.4685, 'learning_rate': 6.206792023458528e-06, 'epoch': 1.27} {'loss': 0.3708, 'learning_rate': 6.20648115716041e-06, 'epoch': 1.27} {'loss': 0.2922, 'learning_rate': 6.206170295144453e-06, 'epoch': 1.27} {'loss': 0.1736, 'learning_rate': 6.2058594374110095e-06, 'epoch': 1.27} {'loss': 0.2983, 'learning_rate': 6.205548583960428e-06, 'epoch': 1.27} {'loss': 0.362, 'learning_rate': 6.205237734793064e-06, 'epoch': 1.27} {'loss': 0.4292, 'learning_rate': 6.204926889909262e-06, 'epoch': 1.27} {'loss': 0.3241, 'learning_rate': 6.204616049309375e-06, 'epoch': 1.27} {'loss': 0.2161, 'learning_rate': 6.204305212993757e-06, 'epoch': 1.27} {'loss': 0.3215, 'learning_rate': 6.203994380962754e-06, 'epoch': 1.27} {'loss': 0.2749, 'learning_rate': 6.203683553216721e-06, 'epoch': 1.27} {'loss': 0.2464, 'learning_rate': 6.203372729756008e-06, 'epoch': 1.27} {'loss': 0.2656, 'learning_rate': 6.2030619105809656e-06, 'epoch': 1.27} {'loss': 0.416, 'learning_rate': 6.202751095691942e-06, 'epoch': 1.27} {'loss': 0.4527, 'learning_rate': 6.202440285089292e-06, 'epoch': 1.27} {'loss': 0.2491, 'learning_rate': 6.202129478773365e-06, 'epoch': 1.27} {'loss': 0.2982, 'learning_rate': 6.20181867674451e-06, 'epoch': 1.27} {'loss': 0.2604, 'learning_rate': 6.20150787900308e-06, 'epoch': 1.27} {'loss': 0.2011, 'learning_rate': 6.201197085549428e-06, 'epoch': 1.27} {'loss': 0.423, 'learning_rate': 6.200886296383899e-06, 'epoch': 1.27} {'loss': 0.3641, 'learning_rate': 6.200575511506848e-06, 'epoch': 1.27} {'loss': 0.336, 'learning_rate': 6.2002647309186245e-06, 'epoch': 1.27} {'loss': 0.2268, 'learning_rate': 6.19995395461958e-06, 'epoch': 1.27} {'loss': 0.2961, 'learning_rate': 6.1996431826100645e-06, 'epoch': 1.27} {'loss': 0.2583, 'learning_rate': 6.199332414890429e-06, 'epoch': 1.27} {'loss': 0.4976, 'learning_rate': 6.199021651461023e-06, 'epoch': 1.27} {'loss': 0.2929, 'learning_rate': 6.198710892322202e-06, 'epoch': 1.27} {'loss': 0.2583, 'learning_rate': 6.198400137474312e-06, 'epoch': 1.27} {'loss': 0.4418, 'learning_rate': 6.198089386917705e-06, 'epoch': 1.27} {'loss': 0.3304, 'learning_rate': 6.197778640652732e-06, 'epoch': 1.27} {'loss': 0.4743, 'learning_rate': 6.1974678986797445e-06, 'epoch': 1.27} {'loss': 0.3554, 'learning_rate': 6.197157160999094e-06, 'epoch': 1.27} {'loss': 0.2505, 'learning_rate': 6.196846427611129e-06, 'epoch': 1.27} {'loss': 0.3505, 'learning_rate': 6.196535698516199e-06, 'epoch': 1.27} {'loss': 0.1896, 'learning_rate': 6.196224973714659e-06, 'epoch': 1.27} {'loss': 0.2828, 'learning_rate': 6.1959142532068575e-06, 'epoch': 1.27} {'loss': 0.4608, 'learning_rate': 6.195603536993144e-06, 'epoch': 1.27} {'loss': 0.3665, 'learning_rate': 6.1952928250738735e-06, 'epoch': 1.27} {'loss': 0.319, 'learning_rate': 6.194982117449391e-06, 'epoch': 1.27} {'loss': 0.2708, 'learning_rate': 6.194671414120052e-06, 'epoch': 1.27} {'loss': 0.2843, 'learning_rate': 6.194360715086204e-06, 'epoch': 1.27} {'loss': 0.3468, 'learning_rate': 6.194050020348199e-06, 'epoch': 1.27} {'loss': 0.2763, 'learning_rate': 6.19373932990639e-06, 'epoch': 1.27} {'loss': 0.3255, 'learning_rate': 6.193428643761123e-06, 'epoch': 1.27} {'loss': 0.2996, 'learning_rate': 6.193117961912754e-06, 'epoch': 1.27} {'loss': 0.3706, 'learning_rate': 6.192807284361628e-06, 'epoch': 1.27} {'loss': 0.2292, 'learning_rate': 6.192496611108101e-06, 'epoch': 1.27} {'loss': 0.2182, 'learning_rate': 6.19218594215252e-06, 'epoch': 1.27} {'loss': 0.3391, 'learning_rate': 6.191875277495236e-06, 'epoch': 1.27} {'loss': 0.1744, 'learning_rate': 6.191564617136603e-06, 'epoch': 1.27} {'loss': 0.2091, 'learning_rate': 6.191253961076967e-06, 'epoch': 1.27} {'loss': 0.3892, 'learning_rate': 6.190943309316682e-06, 'epoch': 1.27} {'loss': 0.3679, 'learning_rate': 6.190632661856097e-06, 'epoch': 1.27} {'loss': 0.4174, 'learning_rate': 6.190322018695565e-06, 'epoch': 1.27} {'loss': 0.2081, 'learning_rate': 6.1900113798354344e-06, 'epoch': 1.27} {'loss': 0.3796, 'learning_rate': 6.189700745276055e-06, 'epoch': 1.27} {'loss': 0.3267, 'learning_rate': 6.18939011501778e-06, 'epoch': 1.27} {'loss': 0.4312, 'learning_rate': 6.18907948906096e-06, 'epoch': 1.27} {'loss': 0.388, 'learning_rate': 6.1887688674059445e-06, 'epoch': 1.27} {'loss': 0.2627, 'learning_rate': 6.188458250053083e-06, 'epoch': 1.27} {'loss': 0.3686, 'learning_rate': 6.188147637002728e-06, 'epoch': 1.27} {'loss': 0.3453, 'learning_rate': 6.187837028255228e-06, 'epoch': 1.27} {'loss': 0.3355, 'learning_rate': 6.187526423810937e-06, 'epoch': 1.27} {'loss': 0.3713, 'learning_rate': 6.187215823670203e-06, 'epoch': 1.27} {'loss': 0.4063, 'learning_rate': 6.186905227833377e-06, 'epoch': 1.27} {'loss': 0.3872, 'learning_rate': 6.186594636300809e-06, 'epoch': 1.27} {'loss': 0.4907, 'learning_rate': 6.186284049072851e-06, 'epoch': 1.27} {'loss': 0.2809, 'learning_rate': 6.185973466149855e-06, 'epoch': 1.27} {'loss': 0.3698, 'learning_rate': 6.185662887532167e-06, 'epoch': 1.27} {'loss': 0.2585, 'learning_rate': 6.185352313220142e-06, 'epoch': 1.27} {'loss': 0.3706, 'learning_rate': 6.18504174321413e-06, 'epoch': 1.27} {'loss': 0.2875, 'learning_rate': 6.1847311775144795e-06, 'epoch': 1.27} {'loss': 0.3109, 'learning_rate': 6.184420616121541e-06, 'epoch': 1.27} {'loss': 0.3378, 'learning_rate': 6.184110059035666e-06, 'epoch': 1.27} {'loss': 0.3606, 'learning_rate': 6.1837995062572055e-06, 'epoch': 1.27} {'loss': 0.1399, 'learning_rate': 6.18348895778651e-06, 'epoch': 1.27} {'loss': 0.4334, 'learning_rate': 6.1831784136239294e-06, 'epoch': 1.27} {'loss': 0.3978, 'learning_rate': 6.1828678737698136e-06, 'epoch': 1.27} {'loss': 0.3258, 'learning_rate': 6.182557338224515e-06, 'epoch': 1.27} {'loss': 0.2377, 'learning_rate': 6.182246806988384e-06, 'epoch': 1.27} {'loss': 0.3811, 'learning_rate': 6.1819362800617686e-06, 'epoch': 1.27} {'loss': 0.4436, 'learning_rate': 6.181625757445022e-06, 'epoch': 1.27} {'loss': 0.215, 'learning_rate': 6.1813152391384945e-06, 'epoch': 1.27} {'loss': 0.3067, 'learning_rate': 6.181004725142538e-06, 'epoch': 1.27} {'loss': 0.387, 'learning_rate': 6.180694215457494e-06, 'epoch': 1.27} {'loss': 0.4652, 'learning_rate': 6.180383710083724e-06, 'epoch': 1.27} {'loss': 0.2957, 'learning_rate': 6.180073209021576e-06, 'epoch': 1.27} {'loss': 0.3656, 'learning_rate': 6.179762712271397e-06, 'epoch': 1.27} {'loss': 0.1136, 'learning_rate': 6.179452219833539e-06, 'epoch': 1.27} {'loss': 0.402, 'learning_rate': 6.179141731708355e-06, 'epoch': 1.27} {'loss': 0.3534, 'learning_rate': 6.178831247896192e-06, 'epoch': 1.27} {'loss': 0.3247, 'learning_rate': 6.178520768397404e-06, 'epoch': 1.27} {'loss': 0.2347, 'learning_rate': 6.178210293212339e-06, 'epoch': 1.27} {'loss': 0.2669, 'learning_rate': 6.177899822341347e-06, 'epoch': 1.27} {'loss': 0.2506, 'learning_rate': 6.177589355784778e-06, 'epoch': 1.27} {'loss': 0.3515, 'learning_rate': 6.177278893542984e-06, 'epoch': 1.27} {'loss': 0.3651, 'learning_rate': 6.176968435616316e-06, 'epoch': 1.27} {'loss': 0.2476, 'learning_rate': 6.176657982005123e-06, 'epoch': 1.27} {'loss': 0.2723, 'learning_rate': 6.1763475327097565e-06, 'epoch': 1.27} {'loss': 0.4187, 'learning_rate': 6.176037087730568e-06, 'epoch': 1.27} {'loss': 0.421, 'learning_rate': 6.175726647067905e-06, 'epoch': 1.27} {'loss': 0.4381, 'learning_rate': 6.175416210722118e-06, 'epoch': 1.27} {'loss': 0.1221, 'learning_rate': 6.175105778693562e-06, 'epoch': 1.27} {'loss': 0.3736, 'learning_rate': 6.174795350982582e-06, 'epoch': 1.27} {'loss': 0.2934, 'learning_rate': 6.174484927589532e-06, 'epoch': 1.27} {'loss': 0.4406, 'learning_rate': 6.174174508514761e-06, 'epoch': 1.27} {'loss': 0.3658, 'learning_rate': 6.173864093758619e-06, 'epoch': 1.27} {'loss': 0.2091, 'learning_rate': 6.173553683321456e-06, 'epoch': 1.27} {'loss': 0.3709, 'learning_rate': 6.173243277203624e-06, 'epoch': 1.27} {'loss': 0.222, 'learning_rate': 6.172932875405473e-06, 'epoch': 1.27} {'loss': 0.3437, 'learning_rate': 6.172622477927352e-06, 'epoch': 1.27} {'loss': 0.2963, 'learning_rate': 6.172312084769614e-06, 'epoch': 1.27} {'loss': 0.3069, 'learning_rate': 6.1720016959326056e-06, 'epoch': 1.27} {'loss': 0.2323, 'learning_rate': 6.171691311416681e-06, 'epoch': 1.27} {'loss': 0.4155, 'learning_rate': 6.171380931222188e-06, 'epoch': 1.27} {'loss': 0.2886, 'learning_rate': 6.171070555349479e-06, 'epoch': 1.27} {'loss': 0.4669, 'learning_rate': 6.170760183798903e-06, 'epoch': 1.27} {'loss': 0.3451, 'learning_rate': 6.170449816570812e-06, 'epoch': 1.27} {'loss': 0.408, 'learning_rate': 6.170139453665553e-06, 'epoch': 1.27} {'loss': 0.2639, 'learning_rate': 6.1698290950834785e-06, 'epoch': 1.27} {'loss': 0.2329, 'learning_rate': 6.169518740824938e-06, 'epoch': 1.27} {'loss': 0.357, 'learning_rate': 6.169208390890282e-06, 'epoch': 1.27} {'loss': 0.5061, 'learning_rate': 6.168898045279863e-06, 'epoch': 1.27} {'loss': 0.2676, 'learning_rate': 6.168587703994029e-06, 'epoch': 1.27} {'loss': 0.2446, 'learning_rate': 6.1682773670331305e-06, 'epoch': 1.27} {'loss': 0.3365, 'learning_rate': 6.167967034397518e-06, 'epoch': 1.27} {'loss': 0.4512, 'learning_rate': 6.167656706087542e-06, 'epoch': 1.27} {'loss': 0.333, 'learning_rate': 6.167346382103554e-06, 'epoch': 1.27} {'loss': 0.2822, 'learning_rate': 6.167036062445903e-06, 'epoch': 1.27} {'loss': 0.4459, 'learning_rate': 6.166725747114937e-06, 'epoch': 1.27} {'loss': 0.4282, 'learning_rate': 6.166415436111013e-06, 'epoch': 1.27} {'loss': 0.3237, 'learning_rate': 6.166105129434474e-06, 'epoch': 1.27} {'loss': 0.2445, 'learning_rate': 6.1657948270856734e-06, 'epoch': 1.27} {'loss': 0.2693, 'learning_rate': 6.165484529064962e-06, 'epoch': 1.27} {'loss': 0.3964, 'learning_rate': 6.165174235372691e-06, 'epoch': 1.27} {'loss': 0.3198, 'learning_rate': 6.164863946009205e-06, 'epoch': 1.27} {'loss': 0.4289, 'learning_rate': 6.1645536609748615e-06, 'epoch': 1.27} {'loss': 0.3122, 'learning_rate': 6.164243380270007e-06, 'epoch': 1.27} {'loss': 0.2768, 'learning_rate': 6.163933103894991e-06, 'epoch': 1.27} {'loss': 0.2931, 'learning_rate': 6.163622831850167e-06, 'epoch': 1.27} {'loss': 0.3507, 'learning_rate': 6.163312564135881e-06, 'epoch': 1.27} {'loss': 0.214, 'learning_rate': 6.1630023007524875e-06, 'epoch': 1.27} {'loss': 0.4046, 'learning_rate': 6.162692041700333e-06, 'epoch': 1.27} {'loss': 0.3639, 'learning_rate': 6.1623817869797735e-06, 'epoch': 1.27} {'loss': 0.3712, 'learning_rate': 6.162071536591152e-06, 'epoch': 1.27} {'loss': 0.2345, 'learning_rate': 6.1617612905348225e-06, 'epoch': 1.27} {'loss': 0.1951, 'learning_rate': 6.161451048811134e-06, 'epoch': 1.27} {'loss': 0.3861, 'learning_rate': 6.161140811420436e-06, 'epoch': 1.27} {'loss': 0.2926, 'learning_rate': 6.160830578363082e-06, 'epoch': 1.27} {'loss': 0.1645, 'learning_rate': 6.160520349639421e-06, 'epoch': 1.27} {'loss': 0.3538, 'learning_rate': 6.1602101252498e-06, 'epoch': 1.27} {'loss': 0.2537, 'learning_rate': 6.159899905194573e-06, 'epoch': 1.27} {'loss': 0.2911, 'learning_rate': 6.159589689474088e-06, 'epoch': 1.27} {'loss': 0.261, 'learning_rate': 6.159279478088698e-06, 'epoch': 1.27} {'loss': 0.331, 'learning_rate': 6.158969271038748e-06, 'epoch': 1.27} {'loss': 0.3043, 'learning_rate': 6.158659068324594e-06, 'epoch': 1.27} {'loss': 0.2936, 'learning_rate': 6.158348869946582e-06, 'epoch': 1.27} {'loss': 0.4311, 'learning_rate': 6.158038675905067e-06, 'epoch': 1.27} {'loss': 0.4503, 'learning_rate': 6.157728486200392e-06, 'epoch': 1.27} {'loss': 0.4055, 'learning_rate': 6.157418300832912e-06, 'epoch': 1.27} {'loss': 0.3336, 'learning_rate': 6.157108119802976e-06, 'epoch': 1.27} {'loss': 0.3287, 'learning_rate': 6.156797943110934e-06, 'epoch': 1.27} {'loss': 0.166, 'learning_rate': 6.156487770757135e-06, 'epoch': 1.27} {'loss': 0.3222, 'learning_rate': 6.1561776027419326e-06, 'epoch': 1.27} {'loss': 0.305, 'learning_rate': 6.155867439065674e-06, 'epoch': 1.27} {'loss': 0.3169, 'learning_rate': 6.15555727972871e-06, 'epoch': 1.27} {'loss': 0.2851, 'learning_rate': 6.1552471247313895e-06, 'epoch': 1.27} {'loss': 0.271, 'learning_rate': 6.154936974074066e-06, 'epoch': 1.27} {'loss': 0.1704, 'learning_rate': 6.154626827757086e-06, 'epoch': 1.27} {'loss': 0.3623, 'learning_rate': 6.154316685780801e-06, 'epoch': 1.27} {'loss': 0.2133, 'learning_rate': 6.154006548145564e-06, 'epoch': 1.27} {'loss': 0.4201, 'learning_rate': 6.1536964148517195e-06, 'epoch': 1.27} {'loss': 0.3171, 'learning_rate': 6.1533862858996205e-06, 'epoch': 1.27} {'loss': 0.4348, 'learning_rate': 6.153076161289618e-06, 'epoch': 1.27} {'loss': 0.3002, 'learning_rate': 6.15276604102206e-06, 'epoch': 1.27} {'loss': 0.3991, 'learning_rate': 6.152455925097298e-06, 'epoch': 1.27} {'loss': 0.3974, 'learning_rate': 6.152145813515682e-06, 'epoch': 1.27} {'loss': 0.3296, 'learning_rate': 6.15183570627756e-06, 'epoch': 1.27} {'loss': 0.3748, 'learning_rate': 6.151525603383286e-06, 'epoch': 1.27} {'loss': 0.4883, 'learning_rate': 6.151215504833206e-06, 'epoch': 1.27} {'loss': 0.3598, 'learning_rate': 6.150905410627672e-06, 'epoch': 1.27} {'loss': 0.2138, 'learning_rate': 6.150595320767034e-06, 'epoch': 1.27} {'loss': 0.3359, 'learning_rate': 6.150285235251643e-06, 'epoch': 1.27} {'loss': 0.4126, 'learning_rate': 6.149975154081844e-06, 'epoch': 1.27} {'loss': 0.3531, 'learning_rate': 6.149665077257994e-06, 'epoch': 1.27} {'loss': 0.2575, 'learning_rate': 6.149355004780441e-06, 'epoch': 1.27} {'loss': 0.3807, 'learning_rate': 6.149044936649533e-06, 'epoch': 1.27} {'loss': 0.3422, 'learning_rate': 6.148734872865621e-06, 'epoch': 1.27} {'loss': 0.3269, 'learning_rate': 6.148424813429055e-06, 'epoch': 1.27} {'loss': 0.2368, 'learning_rate': 6.1481147583401845e-06, 'epoch': 1.27} {'loss': 0.2028, 'learning_rate': 6.147804707599362e-06, 'epoch': 1.28} {'loss': 0.2525, 'learning_rate': 6.147494661206934e-06, 'epoch': 1.28} {'loss': 0.438, 'learning_rate': 6.147184619163251e-06, 'epoch': 1.28} {'loss': 0.2818, 'learning_rate': 6.146874581468665e-06, 'epoch': 1.28} {'loss': 0.3805, 'learning_rate': 6.146564548123524e-06, 'epoch': 1.28} {'loss': 0.4229, 'learning_rate': 6.146254519128179e-06, 'epoch': 1.28} {'loss': 0.209, 'learning_rate': 6.1459444944829804e-06, 'epoch': 1.28} {'loss': 0.2615, 'learning_rate': 6.145634474188278e-06, 'epoch': 1.28} {'loss': 0.3389, 'learning_rate': 6.1453244582444205e-06, 'epoch': 1.28} {'loss': 0.3561, 'learning_rate': 6.145014446651758e-06, 'epoch': 1.28} {'loss': 0.3503, 'learning_rate': 6.144704439410643e-06, 'epoch': 1.28} {'loss': 0.2322, 'learning_rate': 6.144394436521421e-06, 'epoch': 1.28} {'loss': 0.1926, 'learning_rate': 6.1440844379844475e-06, 'epoch': 1.28} {'loss': 0.2035, 'learning_rate': 6.14377444380007e-06, 'epoch': 1.28} {'loss': 0.3543, 'learning_rate': 6.143464453968635e-06, 'epoch': 1.28} {'loss': 0.3427, 'learning_rate': 6.143154468490498e-06, 'epoch': 1.28} {'loss': 0.5536, 'learning_rate': 6.142844487366003e-06, 'epoch': 1.28} {'loss': 0.2399, 'learning_rate': 6.142534510595505e-06, 'epoch': 1.28} {'loss': 0.2344, 'learning_rate': 6.142224538179351e-06, 'epoch': 1.28} {'loss': 0.2938, 'learning_rate': 6.141914570117893e-06, 'epoch': 1.28} {'loss': 0.3661, 'learning_rate': 6.141604606411479e-06, 'epoch': 1.28} {'loss': 0.232, 'learning_rate': 6.141294647060459e-06, 'epoch': 1.28} {'loss': 0.3934, 'learning_rate': 6.140984692065185e-06, 'epoch': 1.28} {'loss': 0.2132, 'learning_rate': 6.140674741426005e-06, 'epoch': 1.28} {'loss': 0.3843, 'learning_rate': 6.140364795143269e-06, 'epoch': 1.28} {'loss': 0.3725, 'learning_rate': 6.140054853217328e-06, 'epoch': 1.28} {'loss': 0.2957, 'learning_rate': 6.13974491564853e-06, 'epoch': 1.28} {'loss': 0.3093, 'learning_rate': 6.139434982437229e-06, 'epoch': 1.28} {'loss': 0.4479, 'learning_rate': 6.139125053583768e-06, 'epoch': 1.28} {'loss': 0.2818, 'learning_rate': 6.138815129088502e-06, 'epoch': 1.28} {'loss': 0.2649, 'learning_rate': 6.13850520895178e-06, 'epoch': 1.28} {'loss': 0.3501, 'learning_rate': 6.13819529317395e-06, 'epoch': 1.28} {'loss': 0.4543, 'learning_rate': 6.137885381755364e-06, 'epoch': 1.28} {'loss': 0.3501, 'learning_rate': 6.137575474696371e-06, 'epoch': 1.28} {'loss': 0.3378, 'learning_rate': 6.1372655719973206e-06, 'epoch': 1.28} {'loss': 0.3368, 'learning_rate': 6.1369556736585625e-06, 'epoch': 1.28} {'loss': 0.3445, 'learning_rate': 6.136645779680448e-06, 'epoch': 1.28} {'loss': 0.2856, 'learning_rate': 6.136335890063324e-06, 'epoch': 1.28} {'loss': 0.3671, 'learning_rate': 6.136026004807543e-06, 'epoch': 1.28} {'loss': 0.433, 'learning_rate': 6.1357161239134544e-06, 'epoch': 1.28} {'loss': 0.3352, 'learning_rate': 6.135406247381409e-06, 'epoch': 1.28} {'loss': 0.4661, 'learning_rate': 6.135096375211753e-06, 'epoch': 1.28} {'loss': 0.3, 'learning_rate': 6.134786507404837e-06, 'epoch': 1.28} {'loss': 0.2864, 'learning_rate': 6.1344766439610135e-06, 'epoch': 1.28} {'loss': 0.3315, 'learning_rate': 6.134166784880631e-06, 'epoch': 1.28} {'loss': 0.274, 'learning_rate': 6.133856930164039e-06, 'epoch': 1.28} {'loss': 0.2879, 'learning_rate': 6.133547079811587e-06, 'epoch': 1.28} {'loss': 0.336, 'learning_rate': 6.133237233823626e-06, 'epoch': 1.28} {'loss': 0.2824, 'learning_rate': 6.1329273922005025e-06, 'epoch': 1.28} {'loss': 0.2329, 'learning_rate': 6.13261755494257e-06, 'epoch': 1.28} {'loss': 0.2679, 'learning_rate': 6.132307722050178e-06, 'epoch': 1.28} {'loss': 0.2246, 'learning_rate': 6.131997893523674e-06, 'epoch': 1.28} {'loss': 0.2227, 'learning_rate': 6.131688069363408e-06, 'epoch': 1.28} {'loss': 0.2595, 'learning_rate': 6.131378249569735e-06, 'epoch': 1.28} {'loss': 0.3395, 'learning_rate': 6.131068434142997e-06, 'epoch': 1.28} {'loss': 0.3384, 'learning_rate': 6.1307586230835456e-06, 'epoch': 1.28} {'loss': 0.3625, 'learning_rate': 6.130448816391734e-06, 'epoch': 1.28} {'loss': 0.4028, 'learning_rate': 6.130139014067909e-06, 'epoch': 1.28} {'loss': 0.3436, 'learning_rate': 6.129829216112422e-06, 'epoch': 1.28} {'loss': 0.4279, 'learning_rate': 6.12951942252562e-06, 'epoch': 1.28} {'loss': 0.2659, 'learning_rate': 6.129209633307855e-06, 'epoch': 1.28} {'loss': 0.4778, 'learning_rate': 6.1288998484594774e-06, 'epoch': 1.28} {'loss': 0.3339, 'learning_rate': 6.128590067980835e-06, 'epoch': 1.28} {'loss': 0.2462, 'learning_rate': 6.12828029187228e-06, 'epoch': 1.28} {'loss': 0.3987, 'learning_rate': 6.1279705201341576e-06, 'epoch': 1.28} {'loss': 0.4564, 'learning_rate': 6.127660752766822e-06, 'epoch': 1.28} {'loss': 0.3002, 'learning_rate': 6.127350989770622e-06, 'epoch': 1.28} {'loss': 0.2893, 'learning_rate': 6.127041231145905e-06, 'epoch': 1.28} {'loss': 0.3051, 'learning_rate': 6.126731476893022e-06, 'epoch': 1.28} {'loss': 0.3738, 'learning_rate': 6.126421727012322e-06, 'epoch': 1.28} {'loss': 0.4018, 'learning_rate': 6.126111981504155e-06, 'epoch': 1.28} {'loss': 0.3173, 'learning_rate': 6.125802240368872e-06, 'epoch': 1.28} {'loss': 0.2123, 'learning_rate': 6.125492503606822e-06, 'epoch': 1.28} {'loss': 0.3088, 'learning_rate': 6.125182771218352e-06, 'epoch': 1.28} {'loss': 0.2801, 'learning_rate': 6.124873043203816e-06, 'epoch': 1.28} {'loss': 0.3331, 'learning_rate': 6.12456331956356e-06, 'epoch': 1.28} {'loss': 0.2415, 'learning_rate': 6.1242536002979356e-06, 'epoch': 1.28} {'loss': 0.2871, 'learning_rate': 6.123943885407292e-06, 'epoch': 1.28} {'loss': 0.4684, 'learning_rate': 6.123634174891979e-06, 'epoch': 1.28} {'loss': 0.3187, 'learning_rate': 6.123324468752347e-06, 'epoch': 1.28} {'loss': 0.4757, 'learning_rate': 6.123014766988743e-06, 'epoch': 1.28} {'loss': 0.3151, 'learning_rate': 6.122705069601517e-06, 'epoch': 1.28} {'loss': 0.2446, 'learning_rate': 6.122395376591022e-06, 'epoch': 1.28} {'loss': 0.26, 'learning_rate': 6.122085687957604e-06, 'epoch': 1.28} {'loss': 0.4172, 'learning_rate': 6.121776003701614e-06, 'epoch': 1.28} {'loss': 0.2662, 'learning_rate': 6.1214663238234e-06, 'epoch': 1.28} {'loss': 0.409, 'learning_rate': 6.121156648323314e-06, 'epoch': 1.28} {'loss': 0.2424, 'learning_rate': 6.120846977201707e-06, 'epoch': 1.28} {'loss': 0.4073, 'learning_rate': 6.120537310458923e-06, 'epoch': 1.28} {'loss': 0.4479, 'learning_rate': 6.120227648095315e-06, 'epoch': 1.28} {'loss': 0.343, 'learning_rate': 6.119917990111232e-06, 'epoch': 1.28} {'loss': 0.3395, 'learning_rate': 6.119608336507026e-06, 'epoch': 1.28} {'loss': 0.3439, 'learning_rate': 6.1192986872830395e-06, 'epoch': 1.28} {'loss': 0.3534, 'learning_rate': 6.118989042439631e-06, 'epoch': 1.28} {'loss': 0.3475, 'learning_rate': 6.118679401977145e-06, 'epoch': 1.28} {'loss': 0.2751, 'learning_rate': 6.118369765895931e-06, 'epoch': 1.28} {'loss': 0.3105, 'learning_rate': 6.118060134196341e-06, 'epoch': 1.28} {'loss': 0.4354, 'learning_rate': 6.117750506878722e-06, 'epoch': 1.28} {'loss': 0.3571, 'learning_rate': 6.117440883943424e-06, 'epoch': 1.28} {'loss': 0.3556, 'learning_rate': 6.117131265390799e-06, 'epoch': 1.28} {'loss': 0.2484, 'learning_rate': 6.1168216512211945e-06, 'epoch': 1.28} {'loss': 0.4186, 'learning_rate': 6.116512041434959e-06, 'epoch': 1.28} {'loss': 0.2548, 'learning_rate': 6.116202436032441e-06, 'epoch': 1.28} {'loss': 0.2755, 'learning_rate': 6.115892835013994e-06, 'epoch': 1.28} {'loss': 0.3907, 'learning_rate': 6.115583238379965e-06, 'epoch': 1.28} {'loss': 0.3173, 'learning_rate': 6.115273646130704e-06, 'epoch': 1.28} {'loss': 0.3082, 'learning_rate': 6.114964058266559e-06, 'epoch': 1.28} {'loss': 0.4431, 'learning_rate': 6.114654474787882e-06, 'epoch': 1.28} {'loss': 0.3678, 'learning_rate': 6.114344895695021e-06, 'epoch': 1.28} {'loss': 0.4534, 'learning_rate': 6.114035320988325e-06, 'epoch': 1.28} {'loss': 0.2621, 'learning_rate': 6.1137257506681456e-06, 'epoch': 1.28} {'loss': 0.3132, 'learning_rate': 6.113416184734831e-06, 'epoch': 1.28} {'loss': 0.373, 'learning_rate': 6.113106623188729e-06, 'epoch': 1.28} {'loss': 0.2831, 'learning_rate': 6.112797066030193e-06, 'epoch': 1.28} {'loss': 0.3278, 'learning_rate': 6.1124875132595684e-06, 'epoch': 1.28} {'loss': 0.3482, 'learning_rate': 6.112177964877205e-06, 'epoch': 1.28} {'loss': 0.2474, 'learning_rate': 6.111868420883455e-06, 'epoch': 1.28} {'loss': 0.3522, 'learning_rate': 6.111558881278666e-06, 'epoch': 1.28} {'loss': 0.3149, 'learning_rate': 6.111249346063186e-06, 'epoch': 1.28} {'loss': 0.2748, 'learning_rate': 6.110939815237367e-06, 'epoch': 1.28} {'loss': 0.2148, 'learning_rate': 6.110630288801557e-06, 'epoch': 1.28} {'loss': 0.2654, 'learning_rate': 6.1103207667561056e-06, 'epoch': 1.28} {'loss': 0.177, 'learning_rate': 6.110011249101363e-06, 'epoch': 1.28} {'loss': 0.3885, 'learning_rate': 6.1097017358376785e-06, 'epoch': 1.28} {'loss': 0.2701, 'learning_rate': 6.109392226965401e-06, 'epoch': 1.28} {'loss': 0.4391, 'learning_rate': 6.109082722484878e-06, 'epoch': 1.28} {'loss': 0.3319, 'learning_rate': 6.108773222396464e-06, 'epoch': 1.28} {'loss': 0.2671, 'learning_rate': 6.108463726700503e-06, 'epoch': 1.28} {'loss': 0.2063, 'learning_rate': 6.108154235397347e-06, 'epoch': 1.28} {'loss': 0.215, 'learning_rate': 6.107844748487344e-06, 'epoch': 1.28} {'loss': 0.354, 'learning_rate': 6.1075352659708445e-06, 'epoch': 1.28} {'loss': 0.338, 'learning_rate': 6.107225787848197e-06, 'epoch': 1.28} {'loss': 0.308, 'learning_rate': 6.1069163141197514e-06, 'epoch': 1.28} {'loss': 0.2217, 'learning_rate': 6.1066068447858585e-06, 'epoch': 1.28} {'loss': 0.3051, 'learning_rate': 6.106297379846864e-06, 'epoch': 1.28} {'loss': 0.2549, 'learning_rate': 6.1059879193031205e-06, 'epoch': 1.28} {'loss': 0.2518, 'learning_rate': 6.105678463154976e-06, 'epoch': 1.28} {'loss': 0.4163, 'learning_rate': 6.10536901140278e-06, 'epoch': 1.28} {'loss': 0.3421, 'learning_rate': 6.105059564046881e-06, 'epoch': 1.28} {'loss': 0.3597, 'learning_rate': 6.1047501210876325e-06, 'epoch': 1.28} {'loss': 0.3252, 'learning_rate': 6.104440682525377e-06, 'epoch': 1.28} {'loss': 0.3645, 'learning_rate': 6.104131248360467e-06, 'epoch': 1.28} {'loss': 0.3043, 'learning_rate': 6.103821818593254e-06, 'epoch': 1.28} {'loss': 0.2064, 'learning_rate': 6.103512393224085e-06, 'epoch': 1.28} {'loss': 0.3481, 'learning_rate': 6.103202972253308e-06, 'epoch': 1.28} {'loss': 0.2937, 'learning_rate': 6.1028935556812754e-06, 'epoch': 1.28} {'loss': 0.3137, 'learning_rate': 6.102584143508332e-06, 'epoch': 1.28} {'loss': 0.2565, 'learning_rate': 6.102274735734832e-06, 'epoch': 1.28} {'loss': 0.1911, 'learning_rate': 6.101965332361124e-06, 'epoch': 1.28} {'loss': 0.2382, 'learning_rate': 6.101655933387554e-06, 'epoch': 1.28} {'loss': 0.3062, 'learning_rate': 6.101346538814474e-06, 'epoch': 1.28} {'loss': 0.3073, 'learning_rate': 6.1010371486422324e-06, 'epoch': 1.28} {'loss': 0.3998, 'learning_rate': 6.100727762871179e-06, 'epoch': 1.28} {'loss': 0.202, 'learning_rate': 6.100418381501663e-06, 'epoch': 1.28} {'loss': 0.3169, 'learning_rate': 6.100109004534032e-06, 'epoch': 1.28} {'loss': 0.3153, 'learning_rate': 6.099799631968635e-06, 'epoch': 1.28} {'loss': 0.3747, 'learning_rate': 6.099490263805823e-06, 'epoch': 1.28} {'loss': 0.402, 'learning_rate': 6.099180900045947e-06, 'epoch': 1.28} {'loss': 0.3954, 'learning_rate': 6.098871540689351e-06, 'epoch': 1.28} {'loss': 0.5208, 'learning_rate': 6.09856218573639e-06, 'epoch': 1.28} {'loss': 0.2703, 'learning_rate': 6.098252835187408e-06, 'epoch': 1.28} {'loss': 0.4232, 'learning_rate': 6.097943489042757e-06, 'epoch': 1.28} {'loss': 0.2857, 'learning_rate': 6.0976341473027865e-06, 'epoch': 1.28} {'loss': 0.2528, 'learning_rate': 6.097324809967845e-06, 'epoch': 1.28} {'loss': 0.3131, 'learning_rate': 6.097015477038282e-06, 'epoch': 1.28} {'loss': 0.3512, 'learning_rate': 6.0967061485144474e-06, 'epoch': 1.28} {'loss': 0.3559, 'learning_rate': 6.096396824396688e-06, 'epoch': 1.28} {'loss': 0.3834, 'learning_rate': 6.096087504685354e-06, 'epoch': 1.28} {'loss': 0.3267, 'learning_rate': 6.095778189380794e-06, 'epoch': 1.28} {'loss': 0.3451, 'learning_rate': 6.09546887848336e-06, 'epoch': 1.28} {'loss': 0.2992, 'learning_rate': 6.095159571993397e-06, 'epoch': 1.28} {'loss': 0.3554, 'learning_rate': 6.094850269911257e-06, 'epoch': 1.28} {'loss': 0.322, 'learning_rate': 6.094540972237289e-06, 'epoch': 1.28} {'loss': 0.1744, 'learning_rate': 6.094231678971842e-06, 'epoch': 1.28} {'loss': 0.3445, 'learning_rate': 6.093922390115264e-06, 'epoch': 1.28} {'loss': 0.4082, 'learning_rate': 6.093613105667905e-06, 'epoch': 1.28} {'loss': 0.3488, 'learning_rate': 6.093303825630113e-06, 'epoch': 1.28} {'loss': 0.3711, 'learning_rate': 6.09299455000224e-06, 'epoch': 1.28} {'loss': 0.349, 'learning_rate': 6.0926852787846315e-06, 'epoch': 1.28} {'loss': 0.268, 'learning_rate': 6.092376011977641e-06, 'epoch': 1.28} {'loss': 0.3285, 'learning_rate': 6.0920667495816135e-06, 'epoch': 1.28} {'loss': 0.3548, 'learning_rate': 6.091757491596899e-06, 'epoch': 1.28} {'loss': 0.4034, 'learning_rate': 6.091448238023847e-06, 'epoch': 1.28} {'loss': 0.3156, 'learning_rate': 6.091138988862806e-06, 'epoch': 1.28} {'loss': 0.4159, 'learning_rate': 6.090829744114127e-06, 'epoch': 1.28} {'loss': 0.5423, 'learning_rate': 6.090520503778156e-06, 'epoch': 1.28} {'loss': 0.3857, 'learning_rate': 6.090211267855246e-06, 'epoch': 1.28} {'loss': 0.1978, 'learning_rate': 6.089902036345744e-06, 'epoch': 1.28} {'loss': 0.272, 'learning_rate': 6.089592809249998e-06, 'epoch': 1.28} {'loss': 0.3624, 'learning_rate': 6.089283586568359e-06, 'epoch': 1.28} {'loss': 0.2936, 'learning_rate': 6.088974368301175e-06, 'epoch': 1.28} {'loss': 0.3568, 'learning_rate': 6.088665154448794e-06, 'epoch': 1.28} {'loss': 0.3899, 'learning_rate': 6.088355945011566e-06, 'epoch': 1.28} {'loss': 0.2683, 'learning_rate': 6.088046739989841e-06, 'epoch': 1.28} {'loss': 0.5135, 'learning_rate': 6.087737539383968e-06, 'epoch': 1.28} {'loss': 0.4863, 'learning_rate': 6.0874283431942945e-06, 'epoch': 1.28} {'loss': 0.4057, 'learning_rate': 6.087119151421171e-06, 'epoch': 1.28} {'loss': 0.3363, 'learning_rate': 6.0868099640649454e-06, 'epoch': 1.28} {'loss': 0.2676, 'learning_rate': 6.086500781125968e-06, 'epoch': 1.28} {'loss': 0.2764, 'learning_rate': 6.086191602604589e-06, 'epoch': 1.28} {'loss': 0.2424, 'learning_rate': 6.085882428501153e-06, 'epoch': 1.28} {'loss': 0.256, 'learning_rate': 6.085573258816012e-06, 'epoch': 1.28} {'loss': 0.2443, 'learning_rate': 6.085264093549514e-06, 'epoch': 1.28} {'loss': 0.3018, 'learning_rate': 6.08495493270201e-06, 'epoch': 1.28} {'loss': 0.4147, 'learning_rate': 6.084645776273845e-06, 'epoch': 1.28} {'loss': 0.423, 'learning_rate': 6.084336624265371e-06, 'epoch': 1.28} {'loss': 0.2861, 'learning_rate': 6.084027476676937e-06, 'epoch': 1.28} {'loss': 0.2544, 'learning_rate': 6.08371833350889e-06, 'epoch': 1.28} {'loss': 0.3928, 'learning_rate': 6.083409194761583e-06, 'epoch': 1.28} {'loss': 0.3341, 'learning_rate': 6.08310006043536e-06, 'epoch': 1.28} {'loss': 0.2393, 'learning_rate': 6.0827909305305725e-06, 'epoch': 1.28} {'loss': 0.3842, 'learning_rate': 6.082481805047568e-06, 'epoch': 1.28} {'loss': 0.3807, 'learning_rate': 6.0821726839867e-06, 'epoch': 1.28} {'loss': 0.283, 'learning_rate': 6.0818635673483125e-06, 'epoch': 1.28} {'loss': 0.2848, 'learning_rate': 6.081554455132756e-06, 'epoch': 1.28} {'loss': 0.3584, 'learning_rate': 6.081245347340379e-06, 'epoch': 1.28} {'loss': 0.3486, 'learning_rate': 6.080936243971531e-06, 'epoch': 1.28} {'loss': 0.5004, 'learning_rate': 6.08062714502656e-06, 'epoch': 1.28} {'loss': 0.4011, 'learning_rate': 6.080318050505816e-06, 'epoch': 1.28} {'loss': 0.2595, 'learning_rate': 6.080008960409647e-06, 'epoch': 1.28} {'loss': 0.3561, 'learning_rate': 6.079699874738402e-06, 'epoch': 1.28} {'loss': 0.342, 'learning_rate': 6.0793907934924325e-06, 'epoch': 1.28} {'loss': 0.3605, 'learning_rate': 6.0790817166720835e-06, 'epoch': 1.28} {'loss': 0.3337, 'learning_rate': 6.078772644277707e-06, 'epoch': 1.28} {'loss': 0.2201, 'learning_rate': 6.07846357630965e-06, 'epoch': 1.28} {'loss': 0.3261, 'learning_rate': 6.078154512768264e-06, 'epoch': 1.28} {'loss': 0.3708, 'learning_rate': 6.0778454536538934e-06, 'epoch': 1.28} {'loss': 0.2822, 'learning_rate': 6.07753639896689e-06, 'epoch': 1.28} {'loss': 0.3587, 'learning_rate': 6.077227348707602e-06, 'epoch': 1.28} {'loss': 0.3607, 'learning_rate': 6.0769183028763775e-06, 'epoch': 1.28} {'loss': 0.3164, 'learning_rate': 6.076609261473567e-06, 'epoch': 1.28} {'loss': 0.3098, 'learning_rate': 6.076300224499519e-06, 'epoch': 1.28} {'loss': 0.3609, 'learning_rate': 6.07599119195458e-06, 'epoch': 1.28} {'loss': 0.262, 'learning_rate': 6.075682163839103e-06, 'epoch': 1.28} {'loss': 0.2909, 'learning_rate': 6.075373140153433e-06, 'epoch': 1.28} {'loss': 0.4078, 'learning_rate': 6.075064120897921e-06, 'epoch': 1.28} {'loss': 0.2302, 'learning_rate': 6.074755106072916e-06, 'epoch': 1.28} {'loss': 0.3593, 'learning_rate': 6.0744460956787655e-06, 'epoch': 1.28} {'loss': 0.3853, 'learning_rate': 6.074137089715818e-06, 'epoch': 1.28} {'loss': 0.2736, 'learning_rate': 6.073828088184426e-06, 'epoch': 1.28} {'loss': 0.399, 'learning_rate': 6.073519091084934e-06, 'epoch': 1.28} {'loss': 0.2027, 'learning_rate': 6.073210098417691e-06, 'epoch': 1.28} {'loss': 0.2723, 'learning_rate': 6.072901110183048e-06, 'epoch': 1.28} {'loss': 0.2676, 'learning_rate': 6.0725921263813526e-06, 'epoch': 1.28} {'loss': 0.401, 'learning_rate': 6.072283147012954e-06, 'epoch': 1.28} {'loss': 0.2492, 'learning_rate': 6.071974172078201e-06, 'epoch': 1.28} {'loss': 0.3527, 'learning_rate': 6.071665201577441e-06, 'epoch': 1.28} {'loss': 0.4739, 'learning_rate': 6.071356235511026e-06, 'epoch': 1.28} {'loss': 0.2489, 'learning_rate': 6.071047273879301e-06, 'epoch': 1.28} {'loss': 0.2975, 'learning_rate': 6.070738316682619e-06, 'epoch': 1.28} {'loss': 0.2909, 'learning_rate': 6.070429363921324e-06, 'epoch': 1.28} {'loss': 0.2401, 'learning_rate': 6.070120415595766e-06, 'epoch': 1.28} {'loss': 0.3035, 'learning_rate': 6.0698114717063e-06, 'epoch': 1.28} {'loss': 0.2881, 'learning_rate': 6.069502532253264e-06, 'epoch': 1.28} {'loss': 0.3036, 'learning_rate': 6.069193597237015e-06, 'epoch': 1.28} {'loss': 0.3559, 'learning_rate': 6.068884666657897e-06, 'epoch': 1.28} {'loss': 0.2546, 'learning_rate': 6.068575740516263e-06, 'epoch': 1.28} {'loss': 0.3168, 'learning_rate': 6.068266818812457e-06, 'epoch': 1.28} {'loss': 0.3373, 'learning_rate': 6.067957901546832e-06, 'epoch': 1.28} {'loss': 0.413, 'learning_rate': 6.067648988719733e-06, 'epoch': 1.28} {'loss': 0.2226, 'learning_rate': 6.067340080331512e-06, 'epoch': 1.28} {'loss': 0.3252, 'learning_rate': 6.067031176382515e-06, 'epoch': 1.28} {'loss': 0.4346, 'learning_rate': 6.0667222768730925e-06, 'epoch': 1.28} {'loss': 0.1881, 'learning_rate': 6.066413381803593e-06, 'epoch': 1.28} {'loss': 0.2894, 'learning_rate': 6.066104491174365e-06, 'epoch': 1.28} {'loss': 0.3723, 'learning_rate': 6.065795604985758e-06, 'epoch': 1.28} {'loss': 0.3876, 'learning_rate': 6.065486723238119e-06, 'epoch': 1.28} {'loss': 0.307, 'learning_rate': 6.0651778459317955e-06, 'epoch': 1.28} {'loss': 0.2524, 'learning_rate': 6.0648689730671385e-06, 'epoch': 1.28} {'loss': 0.2378, 'learning_rate': 6.064560104644497e-06, 'epoch': 1.28} {'loss': 0.3135, 'learning_rate': 6.0642512406642185e-06, 'epoch': 1.28} {'loss': 0.3178, 'learning_rate': 6.063942381126651e-06, 'epoch': 1.28} {'loss': 0.2425, 'learning_rate': 6.063633526032145e-06, 'epoch': 1.28} {'loss': 0.2549, 'learning_rate': 6.063324675381048e-06, 'epoch': 1.28} {'loss': 0.3198, 'learning_rate': 6.063015829173709e-06, 'epoch': 1.28} {'loss': 0.3374, 'learning_rate': 6.062706987410476e-06, 'epoch': 1.28} {'loss': 0.2295, 'learning_rate': 6.062398150091698e-06, 'epoch': 1.28} {'loss': 0.5594, 'learning_rate': 6.062089317217724e-06, 'epoch': 1.28} {'loss': 0.3419, 'learning_rate': 6.061780488788904e-06, 'epoch': 1.28} {'loss': 0.5104, 'learning_rate': 6.061471664805585e-06, 'epoch': 1.28} {'loss': 0.3844, 'learning_rate': 6.061162845268113e-06, 'epoch': 1.28} {'loss': 0.6651, 'learning_rate': 6.06085403017684e-06, 'epoch': 1.28} {'loss': 0.2607, 'learning_rate': 6.060545219532114e-06, 'epoch': 1.28} {'loss': 0.3795, 'learning_rate': 6.060236413334284e-06, 'epoch': 1.28} {'loss': 0.1873, 'learning_rate': 6.059927611583696e-06, 'epoch': 1.28} {'loss': 0.333, 'learning_rate': 6.059618814280701e-06, 'epoch': 1.28} {'loss': 0.3683, 'learning_rate': 6.059310021425648e-06, 'epoch': 1.28} {'loss': 0.2091, 'learning_rate': 6.059001233018884e-06, 'epoch': 1.28} {'loss': 0.3353, 'learning_rate': 6.058692449060759e-06, 'epoch': 1.28} {'loss': 0.2915, 'learning_rate': 6.0583836695516194e-06, 'epoch': 1.28} {'loss': 0.3588, 'learning_rate': 6.058074894491816e-06, 'epoch': 1.28} {'loss': 0.4421, 'learning_rate': 6.057766123881694e-06, 'epoch': 1.28} {'loss': 0.3342, 'learning_rate': 6.057457357721608e-06, 'epoch': 1.28} {'loss': 0.2863, 'learning_rate': 6.057148596011901e-06, 'epoch': 1.28} {'loss': 0.2252, 'learning_rate': 6.056839838752923e-06, 'epoch': 1.28} {'loss': 0.3449, 'learning_rate': 6.056531085945026e-06, 'epoch': 1.28} {'loss': 0.3367, 'learning_rate': 6.056222337588553e-06, 'epoch': 1.28} {'loss': 0.3366, 'learning_rate': 6.055913593683855e-06, 'epoch': 1.28} {'loss': 0.2167, 'learning_rate': 6.055604854231282e-06, 'epoch': 1.28} {'loss': 0.3115, 'learning_rate': 6.055296119231182e-06, 'epoch': 1.28} {'loss': 0.3052, 'learning_rate': 6.054987388683902e-06, 'epoch': 1.28} {'loss': 0.5399, 'learning_rate': 6.054678662589789e-06, 'epoch': 1.28} {'loss': 0.4854, 'learning_rate': 6.054369940949194e-06, 'epoch': 1.28} {'loss': 0.2835, 'learning_rate': 6.054061223762467e-06, 'epoch': 1.28} {'loss': 0.3209, 'learning_rate': 6.0537525110299525e-06, 'epoch': 1.28} {'loss': 0.4829, 'learning_rate': 6.0534438027520016e-06, 'epoch': 1.28} {'loss': 0.2401, 'learning_rate': 6.053135098928962e-06, 'epoch': 1.28} {'loss': 0.1306, 'learning_rate': 6.052826399561183e-06, 'epoch': 1.28} {'loss': 0.1883, 'learning_rate': 6.05251770464901e-06, 'epoch': 1.28} {'loss': 0.2872, 'learning_rate': 6.052209014192796e-06, 'epoch': 1.28} {'loss': 0.3933, 'learning_rate': 6.051900328192888e-06, 'epoch': 1.28} {'loss': 0.4223, 'learning_rate': 6.051591646649633e-06, 'epoch': 1.28} {'loss': 0.2328, 'learning_rate': 6.0512829695633814e-06, 'epoch': 1.28} {'loss': 0.2879, 'learning_rate': 6.05097429693448e-06, 'epoch': 1.28} {'loss': 0.3697, 'learning_rate': 6.0506656287632756e-06, 'epoch': 1.28} {'loss': 0.2775, 'learning_rate': 6.050356965050119e-06, 'epoch': 1.28} {'loss': 0.2771, 'learning_rate': 6.05004830579536e-06, 'epoch': 1.28} {'loss': 0.2665, 'learning_rate': 6.049739650999344e-06, 'epoch': 1.28} {'loss': 0.3167, 'learning_rate': 6.049431000662423e-06, 'epoch': 1.28} {'loss': 0.2461, 'learning_rate': 6.04912235478494e-06, 'epoch': 1.28} {'loss': 0.3988, 'learning_rate': 6.048813713367248e-06, 'epoch': 1.28} {'loss': 0.2692, 'learning_rate': 6.0485050764096946e-06, 'epoch': 1.28} {'loss': 0.2437, 'learning_rate': 6.048196443912626e-06, 'epoch': 1.28} {'loss': 0.4375, 'learning_rate': 6.047887815876394e-06, 'epoch': 1.28} {'loss': 0.3795, 'learning_rate': 6.047579192301344e-06, 'epoch': 1.28} {'loss': 0.3141, 'learning_rate': 6.0472705731878266e-06, 'epoch': 1.28} {'loss': 0.3435, 'learning_rate': 6.046961958536188e-06, 'epoch': 1.28} {'loss': 0.2834, 'learning_rate': 6.0466533483467785e-06, 'epoch': 1.28} {'loss': 0.3775, 'learning_rate': 6.046344742619945e-06, 'epoch': 1.28} {'loss': 0.3877, 'learning_rate': 6.046036141356037e-06, 'epoch': 1.28} {'loss': 0.3552, 'learning_rate': 6.045727544555402e-06, 'epoch': 1.28} {'loss': 0.3287, 'learning_rate': 6.045418952218387e-06, 'epoch': 1.28} {'loss': 0.2173, 'learning_rate': 6.045110364345344e-06, 'epoch': 1.28} {'loss': 0.2117, 'learning_rate': 6.044801780936619e-06, 'epoch': 1.28} {'loss': 0.351, 'learning_rate': 6.0444932019925605e-06, 'epoch': 1.28} {'loss': 0.3561, 'learning_rate': 6.044184627513516e-06, 'epoch': 1.28} {'loss': 0.2605, 'learning_rate': 6.0438760574998355e-06, 'epoch': 1.28} {'loss': 0.3845, 'learning_rate': 6.043567491951867e-06, 'epoch': 1.28} {'loss': 0.3208, 'learning_rate': 6.0432589308699605e-06, 'epoch': 1.28} {'loss': 0.32, 'learning_rate': 6.042950374254461e-06, 'epoch': 1.28} {'loss': 0.3047, 'learning_rate': 6.042641822105717e-06, 'epoch': 1.28} {'loss': 0.2135, 'learning_rate': 6.042333274424077e-06, 'epoch': 1.28} {'loss': 0.4949, 'learning_rate': 6.042024731209891e-06, 'epoch': 1.28} {'loss': 0.2867, 'learning_rate': 6.041716192463507e-06, 'epoch': 1.28} {'loss': 0.4768, 'learning_rate': 6.041407658185272e-06, 'epoch': 1.28} {'loss': 0.2353, 'learning_rate': 6.041099128375536e-06, 'epoch': 1.28} {'loss': 0.3101, 'learning_rate': 6.040790603034645e-06, 'epoch': 1.28} {'loss': 0.2463, 'learning_rate': 6.040482082162948e-06, 'epoch': 1.28} {'loss': 0.3668, 'learning_rate': 6.0401735657607964e-06, 'epoch': 1.28} {'loss': 0.3548, 'learning_rate': 6.0398650538285335e-06, 'epoch': 1.28} {'loss': 0.4433, 'learning_rate': 6.0395565463665114e-06, 'epoch': 1.28} {'loss': 0.4514, 'learning_rate': 6.039248043375078e-06, 'epoch': 1.28} {'loss': 0.3332, 'learning_rate': 6.0389395448545785e-06, 'epoch': 1.28} {'loss': 0.4633, 'learning_rate': 6.038631050805364e-06, 'epoch': 1.28} {'loss': 0.3618, 'learning_rate': 6.038322561227779e-06, 'epoch': 1.28} {'loss': 0.1195, 'learning_rate': 6.038014076122176e-06, 'epoch': 1.28} {'loss': 0.42, 'learning_rate': 6.037705595488903e-06, 'epoch': 1.28} {'loss': 0.3329, 'learning_rate': 6.037397119328305e-06, 'epoch': 1.28} {'loss': 0.2886, 'learning_rate': 6.037088647640734e-06, 'epoch': 1.28} {'loss': 0.5131, 'learning_rate': 6.036780180426536e-06, 'epoch': 1.28} {'loss': 0.174, 'learning_rate': 6.036471717686059e-06, 'epoch': 1.28} {'loss': 0.2415, 'learning_rate': 6.03616325941965e-06, 'epoch': 1.28} {'loss': 0.228, 'learning_rate': 6.035854805627661e-06, 'epoch': 1.28} {'loss': 0.2138, 'learning_rate': 6.035546356310438e-06, 'epoch': 1.28} {'loss': 0.3591, 'learning_rate': 6.03523791146833e-06, 'epoch': 1.28} {'loss': 0.2115, 'learning_rate': 6.034929471101685e-06, 'epoch': 1.28} {'loss': 0.2693, 'learning_rate': 6.0346210352108485e-06, 'epoch': 1.28} {'loss': 0.3146, 'learning_rate': 6.03431260379617e-06, 'epoch': 1.28} {'loss': 0.273, 'learning_rate': 6.034004176858001e-06, 'epoch': 1.28} {'loss': 0.3185, 'learning_rate': 6.033695754396687e-06, 'epoch': 1.28} {'loss': 0.2158, 'learning_rate': 6.033387336412574e-06, 'epoch': 1.28} {'loss': 0.1749, 'learning_rate': 6.033078922906014e-06, 'epoch': 1.28} {'loss': 0.2911, 'learning_rate': 6.032770513877353e-06, 'epoch': 1.28} {'loss': 0.2853, 'learning_rate': 6.032462109326939e-06, 'epoch': 1.28} {'loss': 0.2732, 'learning_rate': 6.032153709255122e-06, 'epoch': 1.28} {'loss': 0.2503, 'learning_rate': 6.031845313662249e-06, 'epoch': 1.28} {'loss': 0.5645, 'learning_rate': 6.031536922548668e-06, 'epoch': 1.28} {'loss': 0.2218, 'learning_rate': 6.0312285359147285e-06, 'epoch': 1.28} {'loss': 0.4307, 'learning_rate': 6.030920153760775e-06, 'epoch': 1.28} {'loss': 0.3052, 'learning_rate': 6.030611776087159e-06, 'epoch': 1.28} {'loss': 0.2264, 'learning_rate': 6.030303402894226e-06, 'epoch': 1.28} {'loss': 0.2692, 'learning_rate': 6.0299950341823275e-06, 'epoch': 1.28} {'loss': 0.3161, 'learning_rate': 6.029686669951808e-06, 'epoch': 1.28} {'loss': 0.3953, 'learning_rate': 6.029378310203019e-06, 'epoch': 1.28} {'loss': 0.2227, 'learning_rate': 6.0290699549363065e-06, 'epoch': 1.28} {'loss': 0.2717, 'learning_rate': 6.028761604152018e-06, 'epoch': 1.28} {'loss': 0.2307, 'learning_rate': 6.028453257850502e-06, 'epoch': 1.28} {'loss': 0.4335, 'learning_rate': 6.028144916032108e-06, 'epoch': 1.28} {'loss': 0.4086, 'learning_rate': 6.027836578697184e-06, 'epoch': 1.28} {'loss': 0.2413, 'learning_rate': 6.027528245846075e-06, 'epoch': 1.28} {'loss': 0.2602, 'learning_rate': 6.02721991747913e-06, 'epoch': 1.28} {'loss': 0.193, 'learning_rate': 6.026911593596701e-06, 'epoch': 1.28} {'loss': 0.4073, 'learning_rate': 6.026603274199133e-06, 'epoch': 1.28} {'loss': 0.3164, 'learning_rate': 6.026294959286773e-06, 'epoch': 1.28} {'loss': 0.3693, 'learning_rate': 6.0259866488599725e-06, 'epoch': 1.28} {'loss': 0.5786, 'learning_rate': 6.025678342919077e-06, 'epoch': 1.28} {'loss': 0.2774, 'learning_rate': 6.025370041464433e-06, 'epoch': 1.28} {'loss': 0.2696, 'learning_rate': 6.025061744496392e-06, 'epoch': 1.28} {'loss': 0.5346, 'learning_rate': 6.024753452015303e-06, 'epoch': 1.28} {'loss': 0.1463, 'learning_rate': 6.024445164021508e-06, 'epoch': 1.28} {'loss': 0.3178, 'learning_rate': 6.024136880515359e-06, 'epoch': 1.28} {'loss': 0.3606, 'learning_rate': 6.023828601497204e-06, 'epoch': 1.28} {'loss': 0.3848, 'learning_rate': 6.023520326967389e-06, 'epoch': 1.28} {'loss': 0.2354, 'learning_rate': 6.023212056926264e-06, 'epoch': 1.28} {'loss': 0.465, 'learning_rate': 6.022903791374177e-06, 'epoch': 1.28} {'loss': 0.4347, 'learning_rate': 6.022595530311475e-06, 'epoch': 1.28} {'loss': 0.2734, 'learning_rate': 6.022287273738507e-06, 'epoch': 1.28} {'loss': 0.336, 'learning_rate': 6.021979021655618e-06, 'epoch': 1.28} {'loss': 0.2831, 'learning_rate': 6.021670774063159e-06, 'epoch': 1.28} {'loss': 0.2484, 'learning_rate': 6.021362530961479e-06, 'epoch': 1.28} {'loss': 0.3044, 'learning_rate': 6.021054292350923e-06, 'epoch': 1.28} {'loss': 0.2111, 'learning_rate': 6.020746058231842e-06, 'epoch': 1.28} {'loss': 0.5293, 'learning_rate': 6.02043782860458e-06, 'epoch': 1.28} {'loss': 0.3864, 'learning_rate': 6.020129603469488e-06, 'epoch': 1.28} {'loss': 0.3778, 'learning_rate': 6.019821382826911e-06, 'epoch': 1.28} {'loss': 0.5292, 'learning_rate': 6.0195131666772e-06, 'epoch': 1.28} {'loss': 0.377, 'learning_rate': 6.019204955020701e-06, 'epoch': 1.28} {'loss': 0.2725, 'learning_rate': 6.018896747857763e-06, 'epoch': 1.28} {'loss': 0.3596, 'learning_rate': 6.018588545188735e-06, 'epoch': 1.28} {'loss': 0.2742, 'learning_rate': 6.01828034701396e-06, 'epoch': 1.28} {'loss': 0.2909, 'learning_rate': 6.017972153333793e-06, 'epoch': 1.28} {'loss': 0.3086, 'learning_rate': 6.0176639641485765e-06, 'epoch': 1.28} {'loss': 0.2334, 'learning_rate': 6.01735577945866e-06, 'epoch': 1.28} {'loss': 0.3601, 'learning_rate': 6.017047599264392e-06, 'epoch': 1.28} {'loss': 0.3642, 'learning_rate': 6.01673942356612e-06, 'epoch': 1.28} {'loss': 0.4309, 'learning_rate': 6.016431252364192e-06, 'epoch': 1.28} {'loss': 0.2087, 'learning_rate': 6.016123085658956e-06, 'epoch': 1.28} {'loss': 0.2963, 'learning_rate': 6.015814923450758e-06, 'epoch': 1.28} {'loss': 0.3736, 'learning_rate': 6.015506765739947e-06, 'epoch': 1.28} {'loss': 0.4388, 'learning_rate': 6.0151986125268715e-06, 'epoch': 1.28} {'loss': 0.2326, 'learning_rate': 6.01489046381188e-06, 'epoch': 1.28} {'loss': 0.3604, 'learning_rate': 6.014582319595319e-06, 'epoch': 1.28} {'loss': 0.3474, 'learning_rate': 6.014274179877536e-06, 'epoch': 1.28} {'loss': 0.3843, 'learning_rate': 6.01396604465888e-06, 'epoch': 1.28} {'loss': 0.2138, 'learning_rate': 6.013657913939699e-06, 'epoch': 1.28} {'loss': 0.4242, 'learning_rate': 6.013349787720339e-06, 'epoch': 1.28} {'loss': 0.4005, 'learning_rate': 6.0130416660011494e-06, 'epoch': 1.28} {'loss': 0.2861, 'learning_rate': 6.012733548782479e-06, 'epoch': 1.28} {'loss': 0.3618, 'learning_rate': 6.012425436064672e-06, 'epoch': 1.28} {'loss': 0.2764, 'learning_rate': 6.01211732784808e-06, 'epoch': 1.28} {'loss': 0.2388, 'learning_rate': 6.01180922413305e-06, 'epoch': 1.28} {'loss': 0.3116, 'learning_rate': 6.011501124919927e-06, 'epoch': 1.28} {'loss': 0.3438, 'learning_rate': 6.011193030209062e-06, 'epoch': 1.28} {'loss': 0.27, 'learning_rate': 6.0108849400008e-06, 'epoch': 1.28} {'loss': 0.4015, 'learning_rate': 6.0105768542954915e-06, 'epoch': 1.28} {'loss': 0.336, 'learning_rate': 6.010268773093482e-06, 'epoch': 1.28} {'loss': 0.3005, 'learning_rate': 6.00996069639512e-06, 'epoch': 1.28} {'loss': 0.3238, 'learning_rate': 6.009652624200757e-06, 'epoch': 1.28} {'loss': 0.3508, 'learning_rate': 6.009344556510734e-06, 'epoch': 1.28} {'loss': 0.2748, 'learning_rate': 6.009036493325404e-06, 'epoch': 1.28} {'loss': 0.3671, 'learning_rate': 6.008728434645115e-06, 'epoch': 1.28} {'loss': 0.2637, 'learning_rate': 6.008420380470209e-06, 'epoch': 1.28} {'loss': 0.422, 'learning_rate': 6.008112330801038e-06, 'epoch': 1.28} {'loss': 0.35, 'learning_rate': 6.007804285637949e-06, 'epoch': 1.28} {'loss': 0.3338, 'learning_rate': 6.00749624498129e-06, 'epoch': 1.28} {'loss': 0.2854, 'learning_rate': 6.00718820883141e-06, 'epoch': 1.28} {'loss': 0.3283, 'learning_rate': 6.006880177188652e-06, 'epoch': 1.28} {'loss': 0.3891, 'learning_rate': 6.006572150053369e-06, 'epoch': 1.28} {'loss': 0.481, 'learning_rate': 6.006264127425907e-06, 'epoch': 1.28} {'loss': 0.3689, 'learning_rate': 6.005956109306612e-06, 'epoch': 1.28} {'loss': 0.3384, 'learning_rate': 6.005648095695835e-06, 'epoch': 1.28} {'loss': 0.3469, 'learning_rate': 6.005340086593921e-06, 'epoch': 1.28} {'loss': 0.374, 'learning_rate': 6.005032082001217e-06, 'epoch': 1.28} {'loss': 0.3849, 'learning_rate': 6.004724081918074e-06, 'epoch': 1.28} {'loss': 0.3281, 'learning_rate': 6.004416086344839e-06, 'epoch': 1.28} {'loss': 0.312, 'learning_rate': 6.004108095281855e-06, 'epoch': 1.28} {'loss': 0.2244, 'learning_rate': 6.003800108729475e-06, 'epoch': 1.28} {'loss': 0.4308, 'learning_rate': 6.003492126688044e-06, 'epoch': 1.28} {'loss': 0.5064, 'learning_rate': 6.003184149157911e-06, 'epoch': 1.28} {'loss': 0.2891, 'learning_rate': 6.002876176139423e-06, 'epoch': 1.28} {'loss': 0.3257, 'learning_rate': 6.002568207632927e-06, 'epoch': 1.28} {'loss': 0.2355, 'learning_rate': 6.002260243638772e-06, 'epoch': 1.28} {'loss': 0.335, 'learning_rate': 6.001952284157304e-06, 'epoch': 1.28} {'loss': 0.308, 'learning_rate': 6.0016443291888736e-06, 'epoch': 1.28} {'loss': 0.4338, 'learning_rate': 6.0013363787338245e-06, 'epoch': 1.28} {'loss': 0.3933, 'learning_rate': 6.001028432792507e-06, 'epoch': 1.28} {'loss': 0.2592, 'learning_rate': 6.0007204913652684e-06, 'epoch': 1.28} {'loss': 0.3239, 'learning_rate': 6.000412554452457e-06, 'epoch': 1.28} {'loss': 0.2597, 'learning_rate': 6.000104622054418e-06, 'epoch': 1.28} {'loss': 0.5037, 'learning_rate': 5.9997966941715e-06, 'epoch': 1.28} {'loss': 0.3854, 'learning_rate': 5.999488770804051e-06, 'epoch': 1.28} {'loss': 0.2517, 'learning_rate': 5.999180851952418e-06, 'epoch': 1.28} {'loss': 0.2714, 'learning_rate': 5.998872937616948e-06, 'epoch': 1.28} {'loss': 0.3033, 'learning_rate': 5.998565027797991e-06, 'epoch': 1.29} {'loss': 0.3466, 'learning_rate': 5.9982571224958945e-06, 'epoch': 1.29} {'loss': 0.3134, 'learning_rate': 5.997949221711002e-06, 'epoch': 1.29} {'loss': 0.2239, 'learning_rate': 5.997641325443666e-06, 'epoch': 1.29} {'loss': 0.3247, 'learning_rate': 5.9973334336942305e-06, 'epoch': 1.29} {'loss': 0.4037, 'learning_rate': 5.997025546463045e-06, 'epoch': 1.29} {'loss': 0.3159, 'learning_rate': 5.996717663750455e-06, 'epoch': 1.29} {'loss': 0.2607, 'learning_rate': 5.996409785556809e-06, 'epoch': 1.29} {'loss': 0.224, 'learning_rate': 5.9961019118824575e-06, 'epoch': 1.29} {'loss': 0.4043, 'learning_rate': 5.995794042727745e-06, 'epoch': 1.29} {'loss': 0.2736, 'learning_rate': 5.9954861780930195e-06, 'epoch': 1.29} {'loss': 0.3293, 'learning_rate': 5.995178317978629e-06, 'epoch': 1.29} {'loss': 0.2764, 'learning_rate': 5.9948704623849195e-06, 'epoch': 1.29} {'loss': 0.1935, 'learning_rate': 5.99456261131224e-06, 'epoch': 1.29} {'loss': 0.3847, 'learning_rate': 5.994254764760941e-06, 'epoch': 1.29} {'loss': 0.2063, 'learning_rate': 5.993946922731363e-06, 'epoch': 1.29} {'loss': 0.2566, 'learning_rate': 5.993639085223858e-06, 'epoch': 1.29} {'loss': 0.3078, 'learning_rate': 5.993331252238772e-06, 'epoch': 1.29} {'loss': 0.2719, 'learning_rate': 5.993023423776454e-06, 'epoch': 1.29} {'loss': 0.3685, 'learning_rate': 5.99271559983725e-06, 'epoch': 1.29} {'loss': 0.4446, 'learning_rate': 5.992407780421508e-06, 'epoch': 1.29} {'loss': 0.3679, 'learning_rate': 5.992099965529576e-06, 'epoch': 1.29} {'loss': 0.3418, 'learning_rate': 5.991792155161801e-06, 'epoch': 1.29} {'loss': 0.3719, 'learning_rate': 5.99148434931853e-06, 'epoch': 1.29} {'loss': 0.244, 'learning_rate': 5.9911765480001105e-06, 'epoch': 1.29} {'loss': 0.2106, 'learning_rate': 5.990868751206891e-06, 'epoch': 1.29} {'loss': 0.1633, 'learning_rate': 5.990560958939218e-06, 'epoch': 1.29} {'loss': 0.4095, 'learning_rate': 5.990253171197442e-06, 'epoch': 1.29} {'loss': 0.4065, 'learning_rate': 5.989945387981906e-06, 'epoch': 1.29} {'loss': 0.2689, 'learning_rate': 5.989637609292958e-06, 'epoch': 1.29} {'loss': 0.26, 'learning_rate': 5.989329835130946e-06, 'epoch': 1.29} {'loss': 0.4448, 'learning_rate': 5.9890220654962195e-06, 'epoch': 1.29} {'loss': 0.3034, 'learning_rate': 5.988714300389123e-06, 'epoch': 1.29} {'loss': 0.4359, 'learning_rate': 5.988406539810005e-06, 'epoch': 1.29} {'loss': 0.402, 'learning_rate': 5.988098783759215e-06, 'epoch': 1.29} {'loss': 0.2803, 'learning_rate': 5.987791032237098e-06, 'epoch': 1.29} {'loss': 0.2575, 'learning_rate': 5.987483285244002e-06, 'epoch': 1.29} {'loss': 0.329, 'learning_rate': 5.987175542780274e-06, 'epoch': 1.29} {'loss': 0.2853, 'learning_rate': 5.986867804846261e-06, 'epoch': 1.29} {'loss': 0.3064, 'learning_rate': 5.986560071442312e-06, 'epoch': 1.29} {'loss': 0.2992, 'learning_rate': 5.986252342568773e-06, 'epoch': 1.29} {'loss': 0.4143, 'learning_rate': 5.985944618225995e-06, 'epoch': 1.29} {'loss': 0.2874, 'learning_rate': 5.98563689841432e-06, 'epoch': 1.29} {'loss': 0.5075, 'learning_rate': 5.985329183134096e-06, 'epoch': 1.29} {'loss': 0.3161, 'learning_rate': 5.985021472385672e-06, 'epoch': 1.29} {'loss': 0.4967, 'learning_rate': 5.984713766169398e-06, 'epoch': 1.29} {'loss': 0.2661, 'learning_rate': 5.9844060644856165e-06, 'epoch': 1.29} {'loss': 0.3242, 'learning_rate': 5.984098367334677e-06, 'epoch': 1.29} {'loss': 0.3041, 'learning_rate': 5.983790674716927e-06, 'epoch': 1.29} {'loss': 0.2957, 'learning_rate': 5.983482986632714e-06, 'epoch': 1.29} {'loss': 0.2676, 'learning_rate': 5.983175303082385e-06, 'epoch': 1.29} {'loss': 0.3342, 'learning_rate': 5.9828676240662865e-06, 'epoch': 1.29} {'loss': 0.2856, 'learning_rate': 5.9825599495847666e-06, 'epoch': 1.29} {'loss': 0.2662, 'learning_rate': 5.982252279638172e-06, 'epoch': 1.29} {'loss': 0.2197, 'learning_rate': 5.981944614226855e-06, 'epoch': 1.29} {'loss': 0.4444, 'learning_rate': 5.981636953351155e-06, 'epoch': 1.29} {'loss': 0.4009, 'learning_rate': 5.981329297011422e-06, 'epoch': 1.29} {'loss': 0.2905, 'learning_rate': 5.981021645208005e-06, 'epoch': 1.29} {'loss': 0.3534, 'learning_rate': 5.98071399794125e-06, 'epoch': 1.29} {'loss': 0.3193, 'learning_rate': 5.980406355211505e-06, 'epoch': 1.29} {'loss': 0.3711, 'learning_rate': 5.980098717019116e-06, 'epoch': 1.29} {'loss': 0.3733, 'learning_rate': 5.9797910833644315e-06, 'epoch': 1.29} {'loss': 0.2537, 'learning_rate': 5.979483454247798e-06, 'epoch': 1.29} {'loss': 0.3808, 'learning_rate': 5.979175829669563e-06, 'epoch': 1.29} {'loss': 0.2695, 'learning_rate': 5.9788682096300754e-06, 'epoch': 1.29} {'loss': 0.4463, 'learning_rate': 5.97856059412968e-06, 'epoch': 1.29} {'loss': 0.287, 'learning_rate': 5.978252983168725e-06, 'epoch': 1.29} {'loss': 0.4487, 'learning_rate': 5.97794537674756e-06, 'epoch': 1.29} {'loss': 0.2583, 'learning_rate': 5.977637774866527e-06, 'epoch': 1.29} {'loss': 0.2803, 'learning_rate': 5.977330177525977e-06, 'epoch': 1.29} {'loss': 0.3167, 'learning_rate': 5.977022584726256e-06, 'epoch': 1.29} {'loss': 0.2825, 'learning_rate': 5.976714996467712e-06, 'epoch': 1.29} {'loss': 0.2578, 'learning_rate': 5.97640741275069e-06, 'epoch': 1.29} {'loss': 0.2837, 'learning_rate': 5.976099833575539e-06, 'epoch': 1.29} {'loss': 0.2727, 'learning_rate': 5.975792258942608e-06, 'epoch': 1.29} {'loss': 0.2982, 'learning_rate': 5.975484688852242e-06, 'epoch': 1.29} {'loss': 0.3319, 'learning_rate': 5.975177123304787e-06, 'epoch': 1.29} {'loss': 0.3531, 'learning_rate': 5.974869562300592e-06, 'epoch': 1.29} {'loss': 0.3326, 'learning_rate': 5.974562005840006e-06, 'epoch': 1.29} {'loss': 0.2757, 'learning_rate': 5.974254453923371e-06, 'epoch': 1.29} {'loss': 0.34, 'learning_rate': 5.973946906551042e-06, 'epoch': 1.29} {'loss': 0.2612, 'learning_rate': 5.973639363723357e-06, 'epoch': 1.29} {'loss': 0.2792, 'learning_rate': 5.9733318254406695e-06, 'epoch': 1.29} {'loss': 0.5188, 'learning_rate': 5.973024291703322e-06, 'epoch': 1.29} {'loss': 0.2503, 'learning_rate': 5.972716762511666e-06, 'epoch': 1.29} {'loss': 0.2249, 'learning_rate': 5.972409237866048e-06, 'epoch': 1.29} {'loss': 0.3723, 'learning_rate': 5.9721017177668115e-06, 'epoch': 1.29} {'loss': 0.2273, 'learning_rate': 5.97179420221431e-06, 'epoch': 1.29} {'loss': 0.3577, 'learning_rate': 5.971486691208883e-06, 'epoch': 1.29} {'loss': 0.2106, 'learning_rate': 5.971179184750884e-06, 'epoch': 1.29} {'loss': 0.1933, 'learning_rate': 5.970871682840655e-06, 'epoch': 1.29} {'loss': 0.2637, 'learning_rate': 5.970564185478548e-06, 'epoch': 1.29} {'loss': 0.2651, 'learning_rate': 5.970256692664908e-06, 'epoch': 1.29} {'loss': 0.2467, 'learning_rate': 5.969949204400083e-06, 'epoch': 1.29} {'loss': 0.3927, 'learning_rate': 5.969641720684416e-06, 'epoch': 1.29} {'loss': 0.3835, 'learning_rate': 5.9693342415182586e-06, 'epoch': 1.29} {'loss': 0.2691, 'learning_rate': 5.969026766901955e-06, 'epoch': 1.29} {'loss': 0.3475, 'learning_rate': 5.9687192968358545e-06, 'epoch': 1.29} {'loss': 0.3679, 'learning_rate': 5.968411831320304e-06, 'epoch': 1.29} {'loss': 0.4518, 'learning_rate': 5.96810437035565e-06, 'epoch': 1.29} {'loss': 0.3268, 'learning_rate': 5.967796913942238e-06, 'epoch': 1.29} {'loss': 0.3363, 'learning_rate': 5.967489462080417e-06, 'epoch': 1.29} {'loss': 0.2786, 'learning_rate': 5.967182014770534e-06, 'epoch': 1.29} {'loss': 0.2182, 'learning_rate': 5.966874572012935e-06, 'epoch': 1.29} {'loss': 0.342, 'learning_rate': 5.966567133807968e-06, 'epoch': 1.29} {'loss': 0.3314, 'learning_rate': 5.966259700155981e-06, 'epoch': 1.29} {'loss': 0.1658, 'learning_rate': 5.965952271057316e-06, 'epoch': 1.29} {'loss': 0.4379, 'learning_rate': 5.9656448465123266e-06, 'epoch': 1.29} {'loss': 0.2469, 'learning_rate': 5.965337426521356e-06, 'epoch': 1.29} {'loss': 0.3278, 'learning_rate': 5.9650300110847535e-06, 'epoch': 1.29} {'loss': 0.3906, 'learning_rate': 5.964722600202863e-06, 'epoch': 1.29} {'loss': 0.434, 'learning_rate': 5.964415193876037e-06, 'epoch': 1.29} {'loss': 0.3458, 'learning_rate': 5.964107792104615e-06, 'epoch': 1.29} {'loss': 0.2207, 'learning_rate': 5.96380039488895e-06, 'epoch': 1.29} {'loss': 0.4587, 'learning_rate': 5.963493002229388e-06, 'epoch': 1.29} {'loss': 0.3016, 'learning_rate': 5.963185614126272e-06, 'epoch': 1.29} {'loss': 0.3553, 'learning_rate': 5.9628782305799534e-06, 'epoch': 1.29} {'loss': 0.2287, 'learning_rate': 5.962570851590776e-06, 'epoch': 1.29} {'loss': 0.2412, 'learning_rate': 5.962263477159091e-06, 'epoch': 1.29} {'loss': 0.153, 'learning_rate': 5.961956107285241e-06, 'epoch': 1.29} {'loss': 0.2961, 'learning_rate': 5.961648741969574e-06, 'epoch': 1.29} {'loss': 0.3505, 'learning_rate': 5.9613413812124385e-06, 'epoch': 1.29} {'loss': 0.2801, 'learning_rate': 5.9610340250141804e-06, 'epoch': 1.29} {'loss': 0.2737, 'learning_rate': 5.9607266733751475e-06, 'epoch': 1.29} {'loss': 0.3676, 'learning_rate': 5.960419326295685e-06, 'epoch': 1.29} {'loss': 0.3733, 'learning_rate': 5.960111983776142e-06, 'epoch': 1.29} {'loss': 0.2589, 'learning_rate': 5.959804645816863e-06, 'epoch': 1.29} {'loss': 0.243, 'learning_rate': 5.9594973124181995e-06, 'epoch': 1.29} {'loss': 0.3066, 'learning_rate': 5.959189983580493e-06, 'epoch': 1.29} {'loss': 0.459, 'learning_rate': 5.958882659304093e-06, 'epoch': 1.29} {'loss': 0.2199, 'learning_rate': 5.958575339589346e-06, 'epoch': 1.29} {'loss': 0.2794, 'learning_rate': 5.9582680244365974e-06, 'epoch': 1.29} {'loss': 0.3984, 'learning_rate': 5.957960713846196e-06, 'epoch': 1.29} {'loss': 0.2526, 'learning_rate': 5.957653407818489e-06, 'epoch': 1.29} {'loss': 0.2294, 'learning_rate': 5.957346106353823e-06, 'epoch': 1.29} {'loss': 0.3214, 'learning_rate': 5.957038809452543e-06, 'epoch': 1.29} {'loss': 0.4473, 'learning_rate': 5.956731517114998e-06, 'epoch': 1.29} {'loss': 0.3973, 'learning_rate': 5.9564242293415355e-06, 'epoch': 1.29} {'loss': 0.3007, 'learning_rate': 5.9561169461324995e-06, 'epoch': 1.29} {'loss': 0.4887, 'learning_rate': 5.955809667488239e-06, 'epoch': 1.29} {'loss': 0.2795, 'learning_rate': 5.955502393409103e-06, 'epoch': 1.29} {'loss': 0.336, 'learning_rate': 5.9551951238954345e-06, 'epoch': 1.29} {'loss': 0.3114, 'learning_rate': 5.95488785894758e-06, 'epoch': 1.29} {'loss': 0.2643, 'learning_rate': 5.954580598565888e-06, 'epoch': 1.29} {'loss': 0.392, 'learning_rate': 5.954273342750705e-06, 'epoch': 1.29} {'loss': 0.2915, 'learning_rate': 5.953966091502379e-06, 'epoch': 1.29} {'loss': 0.3146, 'learning_rate': 5.953658844821255e-06, 'epoch': 1.29} {'loss': 0.3504, 'learning_rate': 5.9533516027076825e-06, 'epoch': 1.29} {'loss': 0.2572, 'learning_rate': 5.953044365162004e-06, 'epoch': 1.29} {'loss': 0.3689, 'learning_rate': 5.9527371321845695e-06, 'epoch': 1.29} {'loss': 0.2758, 'learning_rate': 5.952429903775726e-06, 'epoch': 1.29} {'loss': 0.2849, 'learning_rate': 5.952122679935819e-06, 'epoch': 1.29} {'loss': 0.4325, 'learning_rate': 5.951815460665195e-06, 'epoch': 1.29} {'loss': 0.2993, 'learning_rate': 5.951508245964206e-06, 'epoch': 1.29} {'loss': 0.2822, 'learning_rate': 5.95120103583319e-06, 'epoch': 1.29} {'loss': 0.3555, 'learning_rate': 5.9508938302725e-06, 'epoch': 1.29} {'loss': 0.3969, 'learning_rate': 5.9505866292824795e-06, 'epoch': 1.29} {'loss': 0.2811, 'learning_rate': 5.950279432863478e-06, 'epoch': 1.29} {'loss': 0.3988, 'learning_rate': 5.949972241015838e-06, 'epoch': 1.29} {'loss': 0.2554, 'learning_rate': 5.949665053739911e-06, 'epoch': 1.29} {'loss': 0.1788, 'learning_rate': 5.949357871036043e-06, 'epoch': 1.29} {'loss': 0.2349, 'learning_rate': 5.9490506929045785e-06, 'epoch': 1.29} {'loss': 0.3696, 'learning_rate': 5.948743519345865e-06, 'epoch': 1.29} {'loss': 0.2744, 'learning_rate': 5.948436350360251e-06, 'epoch': 1.29} {'loss': 0.4111, 'learning_rate': 5.948129185948082e-06, 'epoch': 1.29} {'loss': 0.3406, 'learning_rate': 5.947822026109703e-06, 'epoch': 1.29} {'loss': 0.3527, 'learning_rate': 5.947514870845465e-06, 'epoch': 1.29} {'loss': 0.367, 'learning_rate': 5.947207720155711e-06, 'epoch': 1.29} {'loss': 0.3707, 'learning_rate': 5.946900574040788e-06, 'epoch': 1.29} {'loss': 0.3074, 'learning_rate': 5.946593432501044e-06, 'epoch': 1.29} {'loss': 0.2066, 'learning_rate': 5.946286295536825e-06, 'epoch': 1.29} {'loss': 0.2917, 'learning_rate': 5.9459791631484775e-06, 'epoch': 1.29} {'loss': 0.4492, 'learning_rate': 5.945672035336349e-06, 'epoch': 1.29} {'loss': 0.2216, 'learning_rate': 5.945364912100786e-06, 'epoch': 1.29} {'loss': 0.4366, 'learning_rate': 5.945057793442135e-06, 'epoch': 1.29} {'loss': 0.4604, 'learning_rate': 5.944750679360743e-06, 'epoch': 1.29} {'loss': 0.3421, 'learning_rate': 5.944443569856954e-06, 'epoch': 1.29} {'loss': 0.4333, 'learning_rate': 5.944136464931119e-06, 'epoch': 1.29} {'loss': 0.2897, 'learning_rate': 5.943829364583583e-06, 'epoch': 1.29} {'loss': 0.439, 'learning_rate': 5.943522268814694e-06, 'epoch': 1.29} {'loss': 0.3661, 'learning_rate': 5.943215177624795e-06, 'epoch': 1.29} {'loss': 0.4217, 'learning_rate': 5.9429080910142345e-06, 'epoch': 1.29} {'loss': 0.4308, 'learning_rate': 5.942601008983359e-06, 'epoch': 1.29} {'loss': 0.3005, 'learning_rate': 5.942293931532514e-06, 'epoch': 1.29} {'loss': 0.256, 'learning_rate': 5.94198685866205e-06, 'epoch': 1.29} {'loss': 0.4553, 'learning_rate': 5.94167979037231e-06, 'epoch': 1.29} {'loss': 0.3161, 'learning_rate': 5.9413727266636435e-06, 'epoch': 1.29} {'loss': 0.2763, 'learning_rate': 5.941065667536393e-06, 'epoch': 1.29} {'loss': 0.3106, 'learning_rate': 5.940758612990909e-06, 'epoch': 1.29} {'loss': 0.4259, 'learning_rate': 5.940451563027536e-06, 'epoch': 1.29} {'loss': 0.3546, 'learning_rate': 5.940144517646622e-06, 'epoch': 1.29} {'loss': 0.324, 'learning_rate': 5.939837476848511e-06, 'epoch': 1.29} {'loss': 0.2572, 'learning_rate': 5.939530440633554e-06, 'epoch': 1.29} {'loss': 0.3088, 'learning_rate': 5.939223409002095e-06, 'epoch': 1.29} {'loss': 0.3301, 'learning_rate': 5.938916381954479e-06, 'epoch': 1.29} {'loss': 0.4031, 'learning_rate': 5.938609359491055e-06, 'epoch': 1.29} {'loss': 0.4217, 'learning_rate': 5.938302341612168e-06, 'epoch': 1.29} {'loss': 0.394, 'learning_rate': 5.937995328318165e-06, 'epoch': 1.29} {'loss': 0.3338, 'learning_rate': 5.937688319609394e-06, 'epoch': 1.29} {'loss': 0.3848, 'learning_rate': 5.9373813154862e-06, 'epoch': 1.29} {'loss': 0.4023, 'learning_rate': 5.937074315948929e-06, 'epoch': 1.29} {'loss': 0.3956, 'learning_rate': 5.936767320997928e-06, 'epoch': 1.29} {'loss': 0.4164, 'learning_rate': 5.936460330633546e-06, 'epoch': 1.29} {'loss': 0.3882, 'learning_rate': 5.936153344856126e-06, 'epoch': 1.29} {'loss': 0.1952, 'learning_rate': 5.935846363666017e-06, 'epoch': 1.29} {'loss': 0.3898, 'learning_rate': 5.935539387063562e-06, 'epoch': 1.29} {'loss': 0.4021, 'learning_rate': 5.9352324150491126e-06, 'epoch': 1.29} {'loss': 0.3947, 'learning_rate': 5.9349254476230124e-06, 'epoch': 1.29} {'loss': 0.3119, 'learning_rate': 5.934618484785609e-06, 'epoch': 1.29} {'loss': 0.3327, 'learning_rate': 5.934311526537249e-06, 'epoch': 1.29} {'loss': 0.2705, 'learning_rate': 5.934004572878276e-06, 'epoch': 1.29} {'loss': 0.2981, 'learning_rate': 5.93369762380904e-06, 'epoch': 1.29} {'loss': 0.2736, 'learning_rate': 5.933390679329887e-06, 'epoch': 1.29} {'loss': 0.2885, 'learning_rate': 5.933083739441163e-06, 'epoch': 1.29} {'loss': 0.2494, 'learning_rate': 5.932776804143212e-06, 'epoch': 1.29} {'loss': 0.3837, 'learning_rate': 5.932469873436384e-06, 'epoch': 1.29} {'loss': 0.2239, 'learning_rate': 5.932162947321023e-06, 'epoch': 1.29} {'loss': 0.3378, 'learning_rate': 5.931856025797478e-06, 'epoch': 1.29} {'loss': 0.3193, 'learning_rate': 5.931549108866092e-06, 'epoch': 1.29} {'loss': 0.2479, 'learning_rate': 5.931242196527214e-06, 'epoch': 1.29} {'loss': 0.2502, 'learning_rate': 5.93093528878119e-06, 'epoch': 1.29} {'loss': 0.1913, 'learning_rate': 5.930628385628367e-06, 'epoch': 1.29} {'loss': 0.2936, 'learning_rate': 5.9303214870690886e-06, 'epoch': 1.29} {'loss': 0.1408, 'learning_rate': 5.9300145931037055e-06, 'epoch': 1.29} {'loss': 0.3083, 'learning_rate': 5.929707703732561e-06, 'epoch': 1.29} {'loss': 0.3901, 'learning_rate': 5.929400818956003e-06, 'epoch': 1.29} {'loss': 0.1936, 'learning_rate': 5.92909393877438e-06, 'epoch': 1.29} {'loss': 0.4813, 'learning_rate': 5.928787063188032e-06, 'epoch': 1.29} {'loss': 0.3456, 'learning_rate': 5.92848019219731e-06, 'epoch': 1.29} {'loss': 0.411, 'learning_rate': 5.9281733258025594e-06, 'epoch': 1.29} {'loss': 0.3782, 'learning_rate': 5.927866464004128e-06, 'epoch': 1.29} {'loss': 0.253, 'learning_rate': 5.92755960680236e-06, 'epoch': 1.29} {'loss': 0.3678, 'learning_rate': 5.927252754197603e-06, 'epoch': 1.29} {'loss': 0.3373, 'learning_rate': 5.926945906190203e-06, 'epoch': 1.29} {'loss': 0.2274, 'learning_rate': 5.926639062780507e-06, 'epoch': 1.29} {'loss': 0.2945, 'learning_rate': 5.92633222396886e-06, 'epoch': 1.29} {'loss': 0.1872, 'learning_rate': 5.926025389755611e-06, 'epoch': 1.29} {'loss': 0.179, 'learning_rate': 5.925718560141104e-06, 'epoch': 1.29} {'loss': 0.3195, 'learning_rate': 5.925411735125686e-06, 'epoch': 1.29} {'loss': 0.28, 'learning_rate': 5.9251049147097036e-06, 'epoch': 1.29} {'loss': 0.3514, 'learning_rate': 5.924798098893503e-06, 'epoch': 1.29} {'loss': 0.2874, 'learning_rate': 5.92449128767743e-06, 'epoch': 1.29} {'loss': 0.2319, 'learning_rate': 5.92418448106183e-06, 'epoch': 1.29} {'loss': 0.3437, 'learning_rate': 5.923877679047052e-06, 'epoch': 1.29} {'loss': 0.387, 'learning_rate': 5.92357088163344e-06, 'epoch': 1.29} {'loss': 0.2341, 'learning_rate': 5.923264088821343e-06, 'epoch': 1.29} {'loss': 0.3795, 'learning_rate': 5.922957300611104e-06, 'epoch': 1.29} {'loss': 0.4565, 'learning_rate': 5.922650517003071e-06, 'epoch': 1.29} {'loss': 0.2129, 'learning_rate': 5.922343737997591e-06, 'epoch': 1.29} {'loss': 0.362, 'learning_rate': 5.922036963595009e-06, 'epoch': 1.29} {'loss': 0.3233, 'learning_rate': 5.9217301937956715e-06, 'epoch': 1.29} {'loss': 0.3259, 'learning_rate': 5.921423428599926e-06, 'epoch': 1.29} {'loss': 0.3611, 'learning_rate': 5.921116668008118e-06, 'epoch': 1.29} {'loss': 0.3713, 'learning_rate': 5.920809912020595e-06, 'epoch': 1.29} {'loss': 0.1903, 'learning_rate': 5.9205031606377005e-06, 'epoch': 1.29} {'loss': 0.3964, 'learning_rate': 5.920196413859781e-06, 'epoch': 1.29} {'loss': 0.3123, 'learning_rate': 5.9198896716871845e-06, 'epoch': 1.29} {'loss': 0.2893, 'learning_rate': 5.9195829341202585e-06, 'epoch': 1.29} {'loss': 0.2395, 'learning_rate': 5.919276201159345e-06, 'epoch': 1.29} {'loss': 0.2864, 'learning_rate': 5.918969472804793e-06, 'epoch': 1.29} {'loss': 0.1927, 'learning_rate': 5.9186627490569495e-06, 'epoch': 1.29} {'loss': 0.2491, 'learning_rate': 5.918356029916159e-06, 'epoch': 1.29} {'loss': 0.2883, 'learning_rate': 5.918049315382768e-06, 'epoch': 1.29} {'loss': 0.3358, 'learning_rate': 5.917742605457124e-06, 'epoch': 1.29} {'loss': 0.4769, 'learning_rate': 5.917435900139572e-06, 'epoch': 1.29} {'loss': 0.2732, 'learning_rate': 5.917129199430458e-06, 'epoch': 1.29} {'loss': 0.2874, 'learning_rate': 5.916822503330131e-06, 'epoch': 1.29} {'loss': 0.3133, 'learning_rate': 5.9165158118389335e-06, 'epoch': 1.29} {'loss': 0.2601, 'learning_rate': 5.916209124957213e-06, 'epoch': 1.29} {'loss': 0.4602, 'learning_rate': 5.9159024426853155e-06, 'epoch': 1.29} {'loss': 0.3997, 'learning_rate': 5.915595765023588e-06, 'epoch': 1.29} {'loss': 0.3406, 'learning_rate': 5.915289091972374e-06, 'epoch': 1.29} {'loss': 0.2461, 'learning_rate': 5.914982423532024e-06, 'epoch': 1.29} {'loss': 0.1609, 'learning_rate': 5.914675759702882e-06, 'epoch': 1.29} {'loss': 0.4113, 'learning_rate': 5.914369100485293e-06, 'epoch': 1.29} {'loss': 0.3441, 'learning_rate': 5.9140624458796055e-06, 'epoch': 1.29} {'loss': 0.3357, 'learning_rate': 5.913755795886165e-06, 'epoch': 1.29} {'loss': 0.4393, 'learning_rate': 5.913449150505316e-06, 'epoch': 1.29} {'loss': 0.3487, 'learning_rate': 5.913142509737406e-06, 'epoch': 1.29} {'loss': 0.0953, 'learning_rate': 5.912835873582783e-06, 'epoch': 1.29} {'loss': 0.3152, 'learning_rate': 5.91252924204179e-06, 'epoch': 1.29} {'loss': 0.3937, 'learning_rate': 5.912222615114773e-06, 'epoch': 1.29} {'loss': 0.2769, 'learning_rate': 5.91191599280208e-06, 'epoch': 1.29} {'loss': 0.4126, 'learning_rate': 5.911609375104057e-06, 'epoch': 1.29} {'loss': 0.3973, 'learning_rate': 5.911302762021048e-06, 'epoch': 1.29} {'loss': 0.389, 'learning_rate': 5.910996153553402e-06, 'epoch': 1.29} {'loss': 0.3337, 'learning_rate': 5.910689549701463e-06, 'epoch': 1.29} {'loss': 0.2574, 'learning_rate': 5.910382950465579e-06, 'epoch': 1.29} {'loss': 0.251, 'learning_rate': 5.910076355846094e-06, 'epoch': 1.29} {'loss': 0.2929, 'learning_rate': 5.909769765843355e-06, 'epoch': 1.29} {'loss': 0.2988, 'learning_rate': 5.909463180457708e-06, 'epoch': 1.29} {'loss': 0.4779, 'learning_rate': 5.909156599689501e-06, 'epoch': 1.29} {'loss': 0.3644, 'learning_rate': 5.908850023539078e-06, 'epoch': 1.29} {'loss': 0.2714, 'learning_rate': 5.908543452006784e-06, 'epoch': 1.29} {'loss': 0.3585, 'learning_rate': 5.908236885092967e-06, 'epoch': 1.29} {'loss': 0.2553, 'learning_rate': 5.907930322797972e-06, 'epoch': 1.29} {'loss': 0.2475, 'learning_rate': 5.907623765122146e-06, 'epoch': 1.29} {'loss': 0.3335, 'learning_rate': 5.907317212065834e-06, 'epoch': 1.29} {'loss': 0.3231, 'learning_rate': 5.9070106636293825e-06, 'epoch': 1.29} {'loss': 0.2862, 'learning_rate': 5.906704119813138e-06, 'epoch': 1.29} {'loss': 0.5182, 'learning_rate': 5.906397580617446e-06, 'epoch': 1.29} {'loss': 0.2494, 'learning_rate': 5.906091046042653e-06, 'epoch': 1.29} {'loss': 0.4042, 'learning_rate': 5.905784516089105e-06, 'epoch': 1.29} {'loss': 0.2047, 'learning_rate': 5.905477990757147e-06, 'epoch': 1.29} {'loss': 0.2962, 'learning_rate': 5.905171470047124e-06, 'epoch': 1.29} {'loss': 0.2488, 'learning_rate': 5.904864953959386e-06, 'epoch': 1.29} {'loss': 0.3785, 'learning_rate': 5.904558442494277e-06, 'epoch': 1.29} {'loss': 0.2961, 'learning_rate': 5.904251935652142e-06, 'epoch': 1.29} {'loss': 0.2727, 'learning_rate': 5.903945433433328e-06, 'epoch': 1.29} {'loss': 0.4455, 'learning_rate': 5.903638935838181e-06, 'epoch': 1.29} {'loss': 0.3305, 'learning_rate': 5.903332442867045e-06, 'epoch': 1.29} {'loss': 0.1695, 'learning_rate': 5.90302595452027e-06, 'epoch': 1.29} {'loss': 0.3141, 'learning_rate': 5.9027194707982e-06, 'epoch': 1.29} {'loss': 0.3738, 'learning_rate': 5.90241299170118e-06, 'epoch': 1.29} {'loss': 0.323, 'learning_rate': 5.902106517229556e-06, 'epoch': 1.29} {'loss': 0.2822, 'learning_rate': 5.901800047383674e-06, 'epoch': 1.29} {'loss': 0.43, 'learning_rate': 5.9014935821638805e-06, 'epoch': 1.29} {'loss': 0.3472, 'learning_rate': 5.901187121570522e-06, 'epoch': 1.29} {'loss': 0.4045, 'learning_rate': 5.900880665603943e-06, 'epoch': 1.29} {'loss': 0.3478, 'learning_rate': 5.900574214264491e-06, 'epoch': 1.29} {'loss': 0.2753, 'learning_rate': 5.90026776755251e-06, 'epoch': 1.29} {'loss': 0.3241, 'learning_rate': 5.899961325468349e-06, 'epoch': 1.29} {'loss': 0.4755, 'learning_rate': 5.899654888012351e-06, 'epoch': 1.29} {'loss': 0.2146, 'learning_rate': 5.899348455184862e-06, 'epoch': 1.29} {'loss': 0.3138, 'learning_rate': 5.8990420269862305e-06, 'epoch': 1.29} {'loss': 0.2938, 'learning_rate': 5.898735603416798e-06, 'epoch': 1.29} {'loss': 0.3562, 'learning_rate': 5.898429184476918e-06, 'epoch': 1.29} {'loss': 0.3744, 'learning_rate': 5.898122770166929e-06, 'epoch': 1.29} {'loss': 0.3023, 'learning_rate': 5.897816360487178e-06, 'epoch': 1.29} {'loss': 0.3723, 'learning_rate': 5.897509955438015e-06, 'epoch': 1.29} {'loss': 0.315, 'learning_rate': 5.897203555019779e-06, 'epoch': 1.29} {'loss': 0.2337, 'learning_rate': 5.896897159232824e-06, 'epoch': 1.29} {'loss': 0.2495, 'learning_rate': 5.896590768077489e-06, 'epoch': 1.29} {'loss': 0.3813, 'learning_rate': 5.8962843815541245e-06, 'epoch': 1.29} {'loss': 0.3131, 'learning_rate': 5.895977999663074e-06, 'epoch': 1.29} {'loss': 0.4094, 'learning_rate': 5.895671622404684e-06, 'epoch': 1.29} {'loss': 0.3185, 'learning_rate': 5.895365249779299e-06, 'epoch': 1.29} {'loss': 0.3191, 'learning_rate': 5.895058881787268e-06, 'epoch': 1.29} {'loss': 0.3017, 'learning_rate': 5.894752518428935e-06, 'epoch': 1.29} {'loss': 0.3745, 'learning_rate': 5.894446159704645e-06, 'epoch': 1.29} {'loss': 0.3905, 'learning_rate': 5.894139805614745e-06, 'epoch': 1.29} {'loss': 0.432, 'learning_rate': 5.8938334561595815e-06, 'epoch': 1.29} {'loss': 0.3398, 'learning_rate': 5.893527111339497e-06, 'epoch': 1.29} {'loss': 0.2234, 'learning_rate': 5.893220771154839e-06, 'epoch': 1.29} {'loss': 0.4043, 'learning_rate': 5.892914435605955e-06, 'epoch': 1.29} {'loss': 0.2838, 'learning_rate': 5.89260810469319e-06, 'epoch': 1.29} {'loss': 0.4045, 'learning_rate': 5.892301778416889e-06, 'epoch': 1.29} {'loss': 0.4579, 'learning_rate': 5.891995456777398e-06, 'epoch': 1.29} {'loss': 0.2962, 'learning_rate': 5.8916891397750635e-06, 'epoch': 1.29} {'loss': 0.3134, 'learning_rate': 5.8913828274102304e-06, 'epoch': 1.29} {'loss': 0.3428, 'learning_rate': 5.891076519683244e-06, 'epoch': 1.29} {'loss': 0.369, 'learning_rate': 5.890770216594453e-06, 'epoch': 1.29} {'loss': 0.2794, 'learning_rate': 5.8904639181442e-06, 'epoch': 1.29} {'loss': 0.2939, 'learning_rate': 5.890157624332832e-06, 'epoch': 1.29} {'loss': 0.2777, 'learning_rate': 5.8898513351606935e-06, 'epoch': 1.29} {'loss': 0.2635, 'learning_rate': 5.8895450506281315e-06, 'epoch': 1.29} {'loss': 0.1891, 'learning_rate': 5.8892387707354915e-06, 'epoch': 1.29} {'loss': 0.3973, 'learning_rate': 5.888932495483119e-06, 'epoch': 1.29} {'loss': 0.3797, 'learning_rate': 5.888626224871361e-06, 'epoch': 1.29} {'loss': 0.3244, 'learning_rate': 5.888319958900561e-06, 'epoch': 1.29} {'loss': 0.2185, 'learning_rate': 5.8880136975710665e-06, 'epoch': 1.29} {'loss': 0.3111, 'learning_rate': 5.887707440883223e-06, 'epoch': 1.29} {'loss': 0.3011, 'learning_rate': 5.887401188837375e-06, 'epoch': 1.29} {'loss': 0.3771, 'learning_rate': 5.887094941433868e-06, 'epoch': 1.29} {'loss': 0.341, 'learning_rate': 5.886788698673052e-06, 'epoch': 1.29} {'loss': 0.2109, 'learning_rate': 5.886482460555268e-06, 'epoch': 1.29} {'loss': 0.3976, 'learning_rate': 5.886176227080863e-06, 'epoch': 1.29} {'loss': 0.3291, 'learning_rate': 5.885869998250182e-06, 'epoch': 1.29} {'loss': 0.3476, 'learning_rate': 5.885563774063572e-06, 'epoch': 1.29} {'loss': 0.2703, 'learning_rate': 5.885257554521378e-06, 'epoch': 1.29} {'loss': 0.4013, 'learning_rate': 5.884951339623946e-06, 'epoch': 1.29} {'loss': 0.3223, 'learning_rate': 5.88464512937162e-06, 'epoch': 1.29} {'loss': 0.4303, 'learning_rate': 5.8843389237647475e-06, 'epoch': 1.29} {'loss': 0.2824, 'learning_rate': 5.884032722803674e-06, 'epoch': 1.29} {'loss': 0.4162, 'learning_rate': 5.8837265264887465e-06, 'epoch': 1.29} {'loss': 0.2385, 'learning_rate': 5.883420334820307e-06, 'epoch': 1.29} {'loss': 0.2505, 'learning_rate': 5.883114147798704e-06, 'epoch': 1.29} {'loss': 0.2935, 'learning_rate': 5.882807965424282e-06, 'epoch': 1.29} {'loss': 0.261, 'learning_rate': 5.882501787697389e-06, 'epoch': 1.29} {'loss': 0.3257, 'learning_rate': 5.882195614618367e-06, 'epoch': 1.29} {'loss': 0.2551, 'learning_rate': 5.881889446187562e-06, 'epoch': 1.29} {'loss': 0.2996, 'learning_rate': 5.881583282405321e-06, 'epoch': 1.29} {'loss': 0.3204, 'learning_rate': 5.88127712327199e-06, 'epoch': 1.29} {'loss': 0.2849, 'learning_rate': 5.880970968787913e-06, 'epoch': 1.29} {'loss': 0.3498, 'learning_rate': 5.880664818953438e-06, 'epoch': 1.29} {'loss': 0.2855, 'learning_rate': 5.880358673768908e-06, 'epoch': 1.29} {'loss': 0.3246, 'learning_rate': 5.880052533234669e-06, 'epoch': 1.29} {'loss': 0.1837, 'learning_rate': 5.879746397351068e-06, 'epoch': 1.29} {'loss': 0.1597, 'learning_rate': 5.87944026611845e-06, 'epoch': 1.29} {'loss': 0.311, 'learning_rate': 5.879134139537161e-06, 'epoch': 1.29} {'loss': 0.2366, 'learning_rate': 5.878828017607545e-06, 'epoch': 1.29} {'loss': 0.275, 'learning_rate': 5.87852190032995e-06, 'epoch': 1.29} {'loss': 0.3413, 'learning_rate': 5.87821578770472e-06, 'epoch': 1.29} {'loss': 0.2278, 'learning_rate': 5.877909679732199e-06, 'epoch': 1.29} {'loss': 0.3359, 'learning_rate': 5.8776035764127334e-06, 'epoch': 1.29} {'loss': 0.0909, 'learning_rate': 5.877297477746671e-06, 'epoch': 1.29} {'loss': 0.3581, 'learning_rate': 5.876991383734355e-06, 'epoch': 1.29} {'loss': 0.3993, 'learning_rate': 5.876685294376132e-06, 'epoch': 1.29} {'loss': 0.3189, 'learning_rate': 5.876379209672347e-06, 'epoch': 1.29} {'loss': 0.3349, 'learning_rate': 5.876073129623346e-06, 'epoch': 1.29} {'loss': 0.402, 'learning_rate': 5.875767054229475e-06, 'epoch': 1.29} {'loss': 0.4254, 'learning_rate': 5.875460983491077e-06, 'epoch': 1.29} {'loss': 0.305, 'learning_rate': 5.8751549174085e-06, 'epoch': 1.29} {'loss': 0.2633, 'learning_rate': 5.874848855982089e-06, 'epoch': 1.29} {'loss': 0.3368, 'learning_rate': 5.874542799212186e-06, 'epoch': 1.29} {'loss': 0.3324, 'learning_rate': 5.8742367470991435e-06, 'epoch': 1.29} {'loss': 0.3143, 'learning_rate': 5.873930699643302e-06, 'epoch': 1.29} {'loss': 0.2082, 'learning_rate': 5.87362465684501e-06, 'epoch': 1.29} {'loss': 0.3396, 'learning_rate': 5.873318618704608e-06, 'epoch': 1.29} {'loss': 0.2563, 'learning_rate': 5.873012585222446e-06, 'epoch': 1.29} {'loss': 0.2715, 'learning_rate': 5.872706556398868e-06, 'epoch': 1.29} {'loss': 0.2699, 'learning_rate': 5.87240053223422e-06, 'epoch': 1.29} {'loss': 0.3447, 'learning_rate': 5.872094512728849e-06, 'epoch': 1.29} {'loss': 0.3734, 'learning_rate': 5.871788497883095e-06, 'epoch': 1.29} {'loss': 0.4453, 'learning_rate': 5.871482487697309e-06, 'epoch': 1.29} {'loss': 0.2808, 'learning_rate': 5.871176482171832e-06, 'epoch': 1.29} {'loss': 0.4093, 'learning_rate': 5.870870481307013e-06, 'epoch': 1.29} {'loss': 0.3146, 'learning_rate': 5.870564485103195e-06, 'epoch': 1.29} {'loss': 0.3802, 'learning_rate': 5.870258493560725e-06, 'epoch': 1.29} {'loss': 0.3209, 'learning_rate': 5.869952506679948e-06, 'epoch': 1.29} {'loss': 0.1977, 'learning_rate': 5.869646524461209e-06, 'epoch': 1.29} {'loss': 0.268, 'learning_rate': 5.869340546904853e-06, 'epoch': 1.29} {'loss': 0.3008, 'learning_rate': 5.869034574011228e-06, 'epoch': 1.29} {'loss': 0.397, 'learning_rate': 5.868728605780676e-06, 'epoch': 1.29} {'loss': 0.3289, 'learning_rate': 5.868422642213542e-06, 'epoch': 1.29} {'loss': 0.3969, 'learning_rate': 5.868116683310179e-06, 'epoch': 1.29} {'loss': 0.2796, 'learning_rate': 5.8678107290709215e-06, 'epoch': 1.29} {'loss': 0.2704, 'learning_rate': 5.867504779496122e-06, 'epoch': 1.29} {'loss': 0.1597, 'learning_rate': 5.867198834586123e-06, 'epoch': 1.29} {'loss': 0.301, 'learning_rate': 5.866892894341269e-06, 'epoch': 1.29} {'loss': 0.3265, 'learning_rate': 5.86658695876191e-06, 'epoch': 1.29} {'loss': 0.3, 'learning_rate': 5.8662810278483865e-06, 'epoch': 1.29} {'loss': 0.3009, 'learning_rate': 5.865975101601046e-06, 'epoch': 1.29} {'loss': 0.2939, 'learning_rate': 5.865669180020234e-06, 'epoch': 1.29} {'loss': 0.2966, 'learning_rate': 5.865363263106294e-06, 'epoch': 1.29} {'loss': 0.3573, 'learning_rate': 5.865057350859573e-06, 'epoch': 1.29} {'loss': 0.2825, 'learning_rate': 5.8647514432804165e-06, 'epoch': 1.29} {'loss': 0.3123, 'learning_rate': 5.8644455403691706e-06, 'epoch': 1.29} {'loss': 0.3437, 'learning_rate': 5.864139642126179e-06, 'epoch': 1.29} {'loss': 0.4428, 'learning_rate': 5.863833748551786e-06, 'epoch': 1.29} {'loss': 0.2359, 'learning_rate': 5.863527859646339e-06, 'epoch': 1.29} {'loss': 0.4423, 'learning_rate': 5.863221975410181e-06, 'epoch': 1.29} {'loss': 0.2732, 'learning_rate': 5.862916095843659e-06, 'epoch': 1.29} {'loss': 0.4397, 'learning_rate': 5.862610220947118e-06, 'epoch': 1.29} {'loss': 0.327, 'learning_rate': 5.862304350720904e-06, 'epoch': 1.29} {'loss': 0.2382, 'learning_rate': 5.8619984851653614e-06, 'epoch': 1.29} {'loss': 0.3704, 'learning_rate': 5.861692624280836e-06, 'epoch': 1.29} {'loss': 0.4799, 'learning_rate': 5.861386768067672e-06, 'epoch': 1.29} {'loss': 0.2963, 'learning_rate': 5.861080916526216e-06, 'epoch': 1.29} {'loss': 0.2442, 'learning_rate': 5.860775069656812e-06, 'epoch': 1.29} {'loss': 0.2949, 'learning_rate': 5.860469227459806e-06, 'epoch': 1.29} {'loss': 0.3747, 'learning_rate': 5.860163389935545e-06, 'epoch': 1.29} {'loss': 0.2043, 'learning_rate': 5.859857557084371e-06, 'epoch': 1.29} {'loss': 0.3215, 'learning_rate': 5.859551728906629e-06, 'epoch': 1.29} {'loss': 0.23, 'learning_rate': 5.859245905402667e-06, 'epoch': 1.29} {'loss': 0.4661, 'learning_rate': 5.858940086572829e-06, 'epoch': 1.29} {'loss': 0.3437, 'learning_rate': 5.85863427241746e-06, 'epoch': 1.29} {'loss': 0.3515, 'learning_rate': 5.858328462936905e-06, 'epoch': 1.29} {'loss': 0.4629, 'learning_rate': 5.858022658131511e-06, 'epoch': 1.29} {'loss': 0.1737, 'learning_rate': 5.857716858001619e-06, 'epoch': 1.29} {'loss': 0.416, 'learning_rate': 5.85741106254758e-06, 'epoch': 1.29} {'loss': 0.3534, 'learning_rate': 5.857105271769734e-06, 'epoch': 1.29} {'loss': 0.3351, 'learning_rate': 5.856799485668429e-06, 'epoch': 1.29} {'loss': 0.1532, 'learning_rate': 5.8564937042440105e-06, 'epoch': 1.29} {'loss': 0.429, 'learning_rate': 5.856187927496824e-06, 'epoch': 1.29} {'loss': 0.2912, 'learning_rate': 5.85588215542721e-06, 'epoch': 1.29} {'loss': 0.3623, 'learning_rate': 5.855576388035518e-06, 'epoch': 1.29} {'loss': 0.0716, 'learning_rate': 5.855270625322094e-06, 'epoch': 1.29} {'loss': 0.3153, 'learning_rate': 5.854964867287278e-06, 'epoch': 1.29} {'loss': 0.4302, 'learning_rate': 5.8546591139314206e-06, 'epoch': 1.29} {'loss': 0.416, 'learning_rate': 5.854353365254865e-06, 'epoch': 1.29} {'loss': 0.2867, 'learning_rate': 5.854047621257955e-06, 'epoch': 1.29} {'loss': 0.3057, 'learning_rate': 5.853741881941038e-06, 'epoch': 1.29} {'loss': 0.2584, 'learning_rate': 5.853436147304456e-06, 'epoch': 1.29} {'loss': 0.4795, 'learning_rate': 5.853130417348558e-06, 'epoch': 1.29} {'loss': 0.3584, 'learning_rate': 5.852824692073686e-06, 'epoch': 1.29} {'loss': 0.3878, 'learning_rate': 5.852518971480187e-06, 'epoch': 1.29} {'loss': 0.3228, 'learning_rate': 5.852213255568404e-06, 'epoch': 1.29} {'loss': 0.3637, 'learning_rate': 5.851907544338687e-06, 'epoch': 1.29} {'loss': 0.2338, 'learning_rate': 5.851601837791377e-06, 'epoch': 1.29} {'loss': 0.3192, 'learning_rate': 5.851296135926816e-06, 'epoch': 1.29} {'loss': 0.2926, 'learning_rate': 5.850990438745355e-06, 'epoch': 1.29} {'loss': 0.363, 'learning_rate': 5.850684746247337e-06, 'epoch': 1.3} {'loss': 0.3199, 'learning_rate': 5.8503790584331066e-06, 'epoch': 1.3} {'loss': 0.3575, 'learning_rate': 5.850073375303009e-06, 'epoch': 1.3} {'loss': 0.385, 'learning_rate': 5.849767696857389e-06, 'epoch': 1.3} {'loss': 0.2624, 'learning_rate': 5.849462023096593e-06, 'epoch': 1.3} {'loss': 0.3215, 'learning_rate': 5.849156354020964e-06, 'epoch': 1.3} {'loss': 0.2742, 'learning_rate': 5.848850689630849e-06, 'epoch': 1.3} {'loss': 0.316, 'learning_rate': 5.848545029926591e-06, 'epoch': 1.3} {'loss': 0.4022, 'learning_rate': 5.848239374908538e-06, 'epoch': 1.3} {'loss': 0.1953, 'learning_rate': 5.847933724577035e-06, 'epoch': 1.3} {'loss': 0.3484, 'learning_rate': 5.847628078932422e-06, 'epoch': 1.3} {'loss': 0.3058, 'learning_rate': 5.847322437975048e-06, 'epoch': 1.3} {'loss': 0.3281, 'learning_rate': 5.847016801705258e-06, 'epoch': 1.3} {'loss': 0.3186, 'learning_rate': 5.846711170123395e-06, 'epoch': 1.3} {'loss': 0.4067, 'learning_rate': 5.846405543229805e-06, 'epoch': 1.3} {'loss': 0.2236, 'learning_rate': 5.846099921024835e-06, 'epoch': 1.3} {'loss': 0.3442, 'learning_rate': 5.845794303508827e-06, 'epoch': 1.3} {'loss': 0.3055, 'learning_rate': 5.845488690682129e-06, 'epoch': 1.3} {'loss': 0.2755, 'learning_rate': 5.8451830825450824e-06, 'epoch': 1.3} {'loss': 0.4096, 'learning_rate': 5.844877479098035e-06, 'epoch': 1.3} {'loss': 0.2831, 'learning_rate': 5.84457188034133e-06, 'epoch': 1.3} {'loss': 0.3519, 'learning_rate': 5.844266286275311e-06, 'epoch': 1.3} {'loss': 0.2544, 'learning_rate': 5.843960696900328e-06, 'epoch': 1.3} {'loss': 0.4691, 'learning_rate': 5.843655112216722e-06, 'epoch': 1.3} {'loss': 0.1902, 'learning_rate': 5.84334953222484e-06, 'epoch': 1.3} {'loss': 0.3082, 'learning_rate': 5.843043956925026e-06, 'epoch': 1.3} {'loss': 0.3283, 'learning_rate': 5.842738386317625e-06, 'epoch': 1.3} {'loss': 0.2152, 'learning_rate': 5.842432820402981e-06, 'epoch': 1.3} {'loss': 0.4249, 'learning_rate': 5.842127259181441e-06, 'epoch': 1.3} {'loss': 0.268, 'learning_rate': 5.841821702653349e-06, 'epoch': 1.3} {'loss': 0.325, 'learning_rate': 5.841516150819049e-06, 'epoch': 1.3} {'loss': 0.3058, 'learning_rate': 5.841210603678885e-06, 'epoch': 1.3} {'loss': 0.3141, 'learning_rate': 5.840905061233204e-06, 'epoch': 1.3} {'loss': 0.2963, 'learning_rate': 5.840599523482351e-06, 'epoch': 1.3} {'loss': 0.2493, 'learning_rate': 5.840293990426671e-06, 'epoch': 1.3} {'loss': 0.2759, 'learning_rate': 5.839988462066506e-06, 'epoch': 1.3} {'loss': 0.3818, 'learning_rate': 5.839682938402203e-06, 'epoch': 1.3} {'loss': 0.3686, 'learning_rate': 5.839377419434109e-06, 'epoch': 1.3} {'loss': 0.2829, 'learning_rate': 5.839071905162566e-06, 'epoch': 1.3} {'loss': 0.2093, 'learning_rate': 5.838766395587918e-06, 'epoch': 1.3} {'loss': 0.154, 'learning_rate': 5.838460890710514e-06, 'epoch': 1.3} {'loss': 0.3813, 'learning_rate': 5.838155390530693e-06, 'epoch': 1.3} {'loss': 0.3851, 'learning_rate': 5.837849895048807e-06, 'epoch': 1.3} {'loss': 0.1677, 'learning_rate': 5.837544404265193e-06, 'epoch': 1.3} {'loss': 0.3201, 'learning_rate': 5.8372389181802034e-06, 'epoch': 1.3} {'loss': 0.2905, 'learning_rate': 5.836933436794177e-06, 'epoch': 1.3} {'loss': 0.3049, 'learning_rate': 5.836627960107463e-06, 'epoch': 1.3} {'loss': 0.2462, 'learning_rate': 5.8363224881204e-06, 'epoch': 1.3} {'loss': 0.3953, 'learning_rate': 5.836017020833343e-06, 'epoch': 1.3} {'loss': 0.3518, 'learning_rate': 5.83571155824663e-06, 'epoch': 1.3} {'loss': 0.3668, 'learning_rate': 5.835406100360604e-06, 'epoch': 1.3} {'loss': 0.4036, 'learning_rate': 5.835100647175616e-06, 'epoch': 1.3} {'loss': 0.2548, 'learning_rate': 5.834795198692002e-06, 'epoch': 1.3} {'loss': 0.3428, 'learning_rate': 5.834489754910118e-06, 'epoch': 1.3} {'loss': 0.235, 'learning_rate': 5.834184315830298e-06, 'epoch': 1.3} {'loss': 0.4943, 'learning_rate': 5.833878881452897e-06, 'epoch': 1.3} {'loss': 0.2256, 'learning_rate': 5.8335734517782495e-06, 'epoch': 1.3} {'loss': 0.3528, 'learning_rate': 5.833268026806709e-06, 'epoch': 1.3} {'loss': 0.3959, 'learning_rate': 5.832962606538612e-06, 'epoch': 1.3} {'loss': 0.3529, 'learning_rate': 5.832657190974313e-06, 'epoch': 1.3} {'loss': 0.4893, 'learning_rate': 5.832351780114147e-06, 'epoch': 1.3} {'loss': 0.3179, 'learning_rate': 5.8320463739584675e-06, 'epoch': 1.3} {'loss': 0.272, 'learning_rate': 5.831740972507615e-06, 'epoch': 1.3} {'loss': 0.229, 'learning_rate': 5.8314355757619304e-06, 'epoch': 1.3} {'loss': 0.3147, 'learning_rate': 5.831130183721767e-06, 'epoch': 1.3} {'loss': 0.4164, 'learning_rate': 5.83082479638746e-06, 'epoch': 1.3} {'loss': 0.2227, 'learning_rate': 5.830519413759364e-06, 'epoch': 1.3} {'loss': 0.2949, 'learning_rate': 5.830214035837814e-06, 'epoch': 1.3} {'loss': 0.3819, 'learning_rate': 5.829908662623162e-06, 'epoch': 1.3} {'loss': 0.2945, 'learning_rate': 5.829603294115749e-06, 'epoch': 1.3} {'loss': 0.4459, 'learning_rate': 5.829297930315922e-06, 'epoch': 1.3} {'loss': 0.3091, 'learning_rate': 5.8289925712240214e-06, 'epoch': 1.3} {'loss': 0.177, 'learning_rate': 5.828687216840401e-06, 'epoch': 1.3} {'loss': 0.3212, 'learning_rate': 5.828381867165394e-06, 'epoch': 1.3} {'loss': 0.3346, 'learning_rate': 5.828076522199354e-06, 'epoch': 1.3} {'loss': 0.2135, 'learning_rate': 5.827771181942623e-06, 'epoch': 1.3} {'loss': 0.3561, 'learning_rate': 5.827465846395541e-06, 'epoch': 1.3} {'loss': 0.2829, 'learning_rate': 5.827160515558461e-06, 'epoch': 1.3} {'loss': 0.2705, 'learning_rate': 5.826855189431718e-06, 'epoch': 1.3} {'loss': 0.3164, 'learning_rate': 5.826549868015668e-06, 'epoch': 1.3} {'loss': 0.3597, 'learning_rate': 5.826244551310644e-06, 'epoch': 1.3} {'loss': 0.4659, 'learning_rate': 5.825939239317e-06, 'epoch': 1.3} {'loss': 0.3747, 'learning_rate': 5.825633932035073e-06, 'epoch': 1.3} {'loss': 0.257, 'learning_rate': 5.825328629465217e-06, 'epoch': 1.3} {'loss': 0.2836, 'learning_rate': 5.825023331607765e-06, 'epoch': 1.3} {'loss': 0.3863, 'learning_rate': 5.824718038463073e-06, 'epoch': 1.3} {'loss': 0.4152, 'learning_rate': 5.824412750031476e-06, 'epoch': 1.3} {'loss': 0.303, 'learning_rate': 5.8241074663133264e-06, 'epoch': 1.3} {'loss': 0.3986, 'learning_rate': 5.823802187308967e-06, 'epoch': 1.3} {'loss': 0.1975, 'learning_rate': 5.823496913018736e-06, 'epoch': 1.3} {'loss': 0.2853, 'learning_rate': 5.823191643442987e-06, 'epoch': 1.3} {'loss': 0.3728, 'learning_rate': 5.822886378582056e-06, 'epoch': 1.3} {'loss': 0.4496, 'learning_rate': 5.822581118436296e-06, 'epoch': 1.3} {'loss': 0.1313, 'learning_rate': 5.822275863006044e-06, 'epoch': 1.3} {'loss': 0.3495, 'learning_rate': 5.82197061229165e-06, 'epoch': 1.3} {'loss': 0.2471, 'learning_rate': 5.821665366293455e-06, 'epoch': 1.3} {'loss': 0.3629, 'learning_rate': 5.821360125011809e-06, 'epoch': 1.3} {'loss': 0.2001, 'learning_rate': 5.821054888447049e-06, 'epoch': 1.3} {'loss': 0.2766, 'learning_rate': 5.820749656599527e-06, 'epoch': 1.3} {'loss': 0.3188, 'learning_rate': 5.8204444294695785e-06, 'epoch': 1.3} {'loss': 0.2225, 'learning_rate': 5.820139207057559e-06, 'epoch': 1.3} {'loss': 0.3086, 'learning_rate': 5.819833989363803e-06, 'epoch': 1.3} {'loss': 0.4729, 'learning_rate': 5.819528776388665e-06, 'epoch': 1.3} {'loss': 0.3182, 'learning_rate': 5.819223568132482e-06, 'epoch': 1.3} {'loss': 0.3542, 'learning_rate': 5.818918364595597e-06, 'epoch': 1.3} {'loss': 0.3078, 'learning_rate': 5.818613165778363e-06, 'epoch': 1.3} {'loss': 0.2326, 'learning_rate': 5.8183079716811145e-06, 'epoch': 1.3} {'loss': 0.3052, 'learning_rate': 5.818002782304206e-06, 'epoch': 1.3} {'loss': 0.4612, 'learning_rate': 5.817697597647973e-06, 'epoch': 1.3} {'loss': 0.2869, 'learning_rate': 5.817392417712768e-06, 'epoch': 1.3} {'loss': 0.4033, 'learning_rate': 5.817087242498927e-06, 'epoch': 1.3} {'loss': 0.2909, 'learning_rate': 5.8167820720068035e-06, 'epoch': 1.3} {'loss': 0.2538, 'learning_rate': 5.816476906236735e-06, 'epoch': 1.3} {'loss': 0.354, 'learning_rate': 5.816171745189069e-06, 'epoch': 1.3} {'loss': 0.4098, 'learning_rate': 5.81586658886415e-06, 'epoch': 1.3} {'loss': 0.4574, 'learning_rate': 5.815561437262322e-06, 'epoch': 1.3} {'loss': 0.3888, 'learning_rate': 5.815256290383932e-06, 'epoch': 1.3} {'loss': 0.3454, 'learning_rate': 5.814951148229318e-06, 'epoch': 1.3} {'loss': 0.2107, 'learning_rate': 5.81464601079883e-06, 'epoch': 1.3} {'loss': 0.3329, 'learning_rate': 5.8143408780928075e-06, 'epoch': 1.3} {'loss': 0.433, 'learning_rate': 5.8140357501116e-06, 'epoch': 1.3} {'loss': 0.2661, 'learning_rate': 5.813730626855548e-06, 'epoch': 1.3} {'loss': 0.4419, 'learning_rate': 5.813425508325004e-06, 'epoch': 1.3} {'loss': 0.3071, 'learning_rate': 5.813120394520304e-06, 'epoch': 1.3} {'loss': 0.4089, 'learning_rate': 5.812815285441793e-06, 'epoch': 1.3} {'loss': 0.3248, 'learning_rate': 5.812510181089821e-06, 'epoch': 1.3} {'loss': 0.1843, 'learning_rate': 5.812205081464725e-06, 'epoch': 1.3} {'loss': 0.1802, 'learning_rate': 5.8118999865668556e-06, 'epoch': 1.3} {'loss': 0.2174, 'learning_rate': 5.811594896396552e-06, 'epoch': 1.3} {'loss': 0.4534, 'learning_rate': 5.811289810954165e-06, 'epoch': 1.3} {'loss': 0.3751, 'learning_rate': 5.810984730240032e-06, 'epoch': 1.3} {'loss': 0.1903, 'learning_rate': 5.810679654254503e-06, 'epoch': 1.3} {'loss': 0.4363, 'learning_rate': 5.810374582997917e-06, 'epoch': 1.3} {'loss': 0.3207, 'learning_rate': 5.8100695164706255e-06, 'epoch': 1.3} {'loss': 0.2545, 'learning_rate': 5.809764454672965e-06, 'epoch': 1.3} {'loss': 0.3933, 'learning_rate': 5.809459397605287e-06, 'epoch': 1.3} {'loss': 0.2932, 'learning_rate': 5.8091543452679336e-06, 'epoch': 1.3} {'loss': 0.4733, 'learning_rate': 5.808849297661242e-06, 'epoch': 1.3} {'loss': 0.3044, 'learning_rate': 5.808544254785567e-06, 'epoch': 1.3} {'loss': 0.4706, 'learning_rate': 5.808239216641246e-06, 'epoch': 1.3} {'loss': 0.471, 'learning_rate': 5.807934183228629e-06, 'epoch': 1.3} {'loss': 0.2082, 'learning_rate': 5.807629154548054e-06, 'epoch': 1.3} {'loss': 0.2751, 'learning_rate': 5.807324130599871e-06, 'epoch': 1.3} {'loss': 0.1596, 'learning_rate': 5.8070191113844175e-06, 'epoch': 1.3} {'loss': 0.3081, 'learning_rate': 5.806714096902048e-06, 'epoch': 1.3} {'loss': 0.2628, 'learning_rate': 5.806409087153096e-06, 'epoch': 1.3} {'loss': 0.2694, 'learning_rate': 5.8061040821379134e-06, 'epoch': 1.3} {'loss': 0.3346, 'learning_rate': 5.80579908185684e-06, 'epoch': 1.3} {'loss': 0.4794, 'learning_rate': 5.805494086310224e-06, 'epoch': 1.3} {'loss': 0.3503, 'learning_rate': 5.805189095498409e-06, 'epoch': 1.3} {'loss': 0.2871, 'learning_rate': 5.804884109421733e-06, 'epoch': 1.3} {'loss': 0.4046, 'learning_rate': 5.804579128080549e-06, 'epoch': 1.3} {'loss': 0.4357, 'learning_rate': 5.804274151475194e-06, 'epoch': 1.3} {'loss': 0.3829, 'learning_rate': 5.803969179606019e-06, 'epoch': 1.3} {'loss': 0.3308, 'learning_rate': 5.803664212473361e-06, 'epoch': 1.3} {'loss': 0.2329, 'learning_rate': 5.803359250077573e-06, 'epoch': 1.3} {'loss': 0.2241, 'learning_rate': 5.80305429241899e-06, 'epoch': 1.3} {'loss': 0.2633, 'learning_rate': 5.802749339497964e-06, 'epoch': 1.3} {'loss': 0.2379, 'learning_rate': 5.802444391314832e-06, 'epoch': 1.3} {'loss': 0.3409, 'learning_rate': 5.802139447869946e-06, 'epoch': 1.3} {'loss': 0.2626, 'learning_rate': 5.801834509163643e-06, 'epoch': 1.3} {'loss': 0.2971, 'learning_rate': 5.801529575196274e-06, 'epoch': 1.3} {'loss': 0.4052, 'learning_rate': 5.80122464596818e-06, 'epoch': 1.3} {'loss': 0.3227, 'learning_rate': 5.800919721479701e-06, 'epoch': 1.3} {'loss': 0.3949, 'learning_rate': 5.800614801731188e-06, 'epoch': 1.3} {'loss': 0.341, 'learning_rate': 5.80030988672298e-06, 'epoch': 1.3} {'loss': 0.2115, 'learning_rate': 5.8000049764554265e-06, 'epoch': 1.3} {'loss': 0.4288, 'learning_rate': 5.799700070928865e-06, 'epoch': 1.3} {'loss': 0.2744, 'learning_rate': 5.799395170143648e-06, 'epoch': 1.3} {'loss': 0.3528, 'learning_rate': 5.79909027410011e-06, 'epoch': 1.3} {'loss': 0.3363, 'learning_rate': 5.798785382798604e-06, 'epoch': 1.3} {'loss': 0.4295, 'learning_rate': 5.798480496239468e-06, 'epoch': 1.3} {'loss': 0.3275, 'learning_rate': 5.798175614423052e-06, 'epoch': 1.3} {'loss': 0.3702, 'learning_rate': 5.797870737349691e-06, 'epoch': 1.3} {'loss': 0.28, 'learning_rate': 5.7975658650197405e-06, 'epoch': 1.3} {'loss': 0.3581, 'learning_rate': 5.7972609974335405e-06, 'epoch': 1.3} {'loss': 0.4549, 'learning_rate': 5.796956134591427e-06, 'epoch': 1.3} {'loss': 0.3207, 'learning_rate': 5.796651276493756e-06, 'epoch': 1.3} {'loss': 0.5034, 'learning_rate': 5.796346423140862e-06, 'epoch': 1.3} {'loss': 0.3389, 'learning_rate': 5.7960415745330974e-06, 'epoch': 1.3} {'loss': 0.4191, 'learning_rate': 5.795736730670798e-06, 'epoch': 1.3} {'loss': 0.2658, 'learning_rate': 5.795431891554317e-06, 'epoch': 1.3} {'loss': 0.1921, 'learning_rate': 5.795127057183992e-06, 'epoch': 1.3} {'loss': 0.3907, 'learning_rate': 5.794822227560169e-06, 'epoch': 1.3} {'loss': 0.3377, 'learning_rate': 5.794517402683191e-06, 'epoch': 1.3} {'loss': 0.2505, 'learning_rate': 5.794212582553404e-06, 'epoch': 1.3} {'loss': 0.5021, 'learning_rate': 5.793907767171151e-06, 'epoch': 1.3} {'loss': 0.2992, 'learning_rate': 5.793602956536778e-06, 'epoch': 1.3} {'loss': 0.2941, 'learning_rate': 5.793298150650628e-06, 'epoch': 1.3} {'loss': 0.3458, 'learning_rate': 5.792993349513041e-06, 'epoch': 1.3} {'loss': 0.3295, 'learning_rate': 5.792688553124368e-06, 'epoch': 1.3} {'loss': 0.3139, 'learning_rate': 5.7923837614849455e-06, 'epoch': 1.3} {'loss': 0.3014, 'learning_rate': 5.7920789745951255e-06, 'epoch': 1.3} {'loss': 0.2627, 'learning_rate': 5.791774192455244e-06, 'epoch': 1.3} {'loss': 0.435, 'learning_rate': 5.791469415065654e-06, 'epoch': 1.3} {'loss': 0.4021, 'learning_rate': 5.7911646424266894e-06, 'epoch': 1.3} {'loss': 0.3733, 'learning_rate': 5.790859874538704e-06, 'epoch': 1.3} {'loss': 0.4914, 'learning_rate': 5.7905551114020344e-06, 'epoch': 1.3} {'loss': 0.3243, 'learning_rate': 5.7902503530170305e-06, 'epoch': 1.3} {'loss': 0.2412, 'learning_rate': 5.7899455993840305e-06, 'epoch': 1.3} {'loss': 0.311, 'learning_rate': 5.789640850503384e-06, 'epoch': 1.3} {'loss': 0.2968, 'learning_rate': 5.789336106375434e-06, 'epoch': 1.3} {'loss': 0.3634, 'learning_rate': 5.7890313670005175e-06, 'epoch': 1.3} {'loss': 0.3152, 'learning_rate': 5.788726632378988e-06, 'epoch': 1.3} {'loss': 0.3555, 'learning_rate': 5.788421902511182e-06, 'epoch': 1.3} {'loss': 0.2821, 'learning_rate': 5.7881171773974495e-06, 'epoch': 1.3} {'loss': 0.2671, 'learning_rate': 5.787812457038129e-06, 'epoch': 1.3} {'loss': 0.4135, 'learning_rate': 5.787507741433571e-06, 'epoch': 1.3} {'loss': 0.3175, 'learning_rate': 5.787203030584112e-06, 'epoch': 1.3} {'loss': 0.3861, 'learning_rate': 5.786898324490103e-06, 'epoch': 1.3} {'loss': 0.2327, 'learning_rate': 5.7865936231518815e-06, 'epoch': 1.3} {'loss': 0.2048, 'learning_rate': 5.786288926569799e-06, 'epoch': 1.3} {'loss': 0.3065, 'learning_rate': 5.785984234744188e-06, 'epoch': 1.3} {'loss': 0.1621, 'learning_rate': 5.785679547675407e-06, 'epoch': 1.3} {'loss': 0.4305, 'learning_rate': 5.785374865363791e-06, 'epoch': 1.3} {'loss': 0.2414, 'learning_rate': 5.785070187809681e-06, 'epoch': 1.3} {'loss': 0.3167, 'learning_rate': 5.7847655150134285e-06, 'epoch': 1.3} {'loss': 0.3298, 'learning_rate': 5.784460846975373e-06, 'epoch': 1.3} {'loss': 0.273, 'learning_rate': 5.784156183695862e-06, 'epoch': 1.3} {'loss': 0.4064, 'learning_rate': 5.783851525175228e-06, 'epoch': 1.3} {'loss': 0.3556, 'learning_rate': 5.783546871413832e-06, 'epoch': 1.3} {'loss': 0.3401, 'learning_rate': 5.783242222412007e-06, 'epoch': 1.3} {'loss': 0.436, 'learning_rate': 5.782937578170103e-06, 'epoch': 1.3} {'loss': 0.237, 'learning_rate': 5.782632938688461e-06, 'epoch': 1.3} {'loss': 0.1873, 'learning_rate': 5.78232830396742e-06, 'epoch': 1.3} {'loss': 0.3671, 'learning_rate': 5.782023674007332e-06, 'epoch': 1.3} {'loss': 0.2985, 'learning_rate': 5.781719048808534e-06, 'epoch': 1.3} {'loss': 0.346, 'learning_rate': 5.781414428371377e-06, 'epoch': 1.3} {'loss': 0.364, 'learning_rate': 5.781109812696196e-06, 'epoch': 1.3} {'loss': 0.2546, 'learning_rate': 5.780805201783344e-06, 'epoch': 1.3} {'loss': 0.2356, 'learning_rate': 5.780500595633158e-06, 'epoch': 1.3} {'loss': 0.2558, 'learning_rate': 5.7801959942459875e-06, 'epoch': 1.3} {'loss': 0.3949, 'learning_rate': 5.779891397622168e-06, 'epoch': 1.3} {'loss': 0.1772, 'learning_rate': 5.779586805762054e-06, 'epoch': 1.3} {'loss': 0.3863, 'learning_rate': 5.77928221866598e-06, 'epoch': 1.3} {'loss': 0.3903, 'learning_rate': 5.7789776363342975e-06, 'epoch': 1.3} {'loss': 0.4469, 'learning_rate': 5.778673058767346e-06, 'epoch': 1.3} {'loss': 0.3836, 'learning_rate': 5.778368485965466e-06, 'epoch': 1.3} {'loss': 0.3146, 'learning_rate': 5.778063917929011e-06, 'epoch': 1.3} {'loss': 0.358, 'learning_rate': 5.7777593546583146e-06, 'epoch': 1.3} {'loss': 0.3659, 'learning_rate': 5.777454796153727e-06, 'epoch': 1.3} {'loss': 0.354, 'learning_rate': 5.7771502424155875e-06, 'epoch': 1.3} {'loss': 0.3751, 'learning_rate': 5.776845693444246e-06, 'epoch': 1.3} {'loss': 0.2941, 'learning_rate': 5.776541149240038e-06, 'epoch': 1.3} {'loss': 0.3897, 'learning_rate': 5.776236609803316e-06, 'epoch': 1.3} {'loss': 0.3582, 'learning_rate': 5.775932075134417e-06, 'epoch': 1.3} {'loss': 0.1826, 'learning_rate': 5.775627545233691e-06, 'epoch': 1.3} {'loss': 0.4247, 'learning_rate': 5.775323020101473e-06, 'epoch': 1.3} {'loss': 0.3478, 'learning_rate': 5.775018499738117e-06, 'epoch': 1.3} {'loss': 0.2754, 'learning_rate': 5.7747139841439624e-06, 'epoch': 1.3} {'loss': 0.3474, 'learning_rate': 5.774409473319347e-06, 'epoch': 1.3} {'loss': 0.4783, 'learning_rate': 5.774104967264624e-06, 'epoch': 1.3} {'loss': 0.3727, 'learning_rate': 5.773800465980128e-06, 'epoch': 1.3} {'loss': 0.2358, 'learning_rate': 5.773495969466214e-06, 'epoch': 1.3} {'loss': 0.3575, 'learning_rate': 5.773191477723213e-06, 'epoch': 1.3} {'loss': 0.3035, 'learning_rate': 5.772886990751481e-06, 'epoch': 1.3} {'loss': 0.2073, 'learning_rate': 5.77258250855135e-06, 'epoch': 1.3} {'loss': 0.3555, 'learning_rate': 5.772278031123175e-06, 'epoch': 1.3} {'loss': 0.398, 'learning_rate': 5.771973558467289e-06, 'epoch': 1.3} {'loss': 0.3146, 'learning_rate': 5.771669090584046e-06, 'epoch': 1.3} {'loss': 0.3633, 'learning_rate': 5.771364627473779e-06, 'epoch': 1.3} {'loss': 0.3454, 'learning_rate': 5.771060169136842e-06, 'epoch': 1.3} {'loss': 0.2974, 'learning_rate': 5.7707557155735746e-06, 'epoch': 1.3} {'loss': 0.3119, 'learning_rate': 5.7704512667843145e-06, 'epoch': 1.3} {'loss': 0.2741, 'learning_rate': 5.770146822769416e-06, 'epoch': 1.3} {'loss': 0.3661, 'learning_rate': 5.769842383529211e-06, 'epoch': 1.3} {'loss': 0.4588, 'learning_rate': 5.769537949064057e-06, 'epoch': 1.3} {'loss': 0.4232, 'learning_rate': 5.769233519374284e-06, 'epoch': 1.3} {'loss': 0.315, 'learning_rate': 5.768929094460246e-06, 'epoch': 1.3} {'loss': 0.509, 'learning_rate': 5.768624674322279e-06, 'epoch': 1.3} {'loss': 0.2964, 'learning_rate': 5.7683202589607335e-06, 'epoch': 1.3} {'loss': 0.3192, 'learning_rate': 5.768015848375947e-06, 'epoch': 1.3} {'loss': 0.5057, 'learning_rate': 5.767711442568268e-06, 'epoch': 1.3} {'loss': 0.3186, 'learning_rate': 5.767407041538036e-06, 'epoch': 1.3} {'loss': 0.3121, 'learning_rate': 5.767102645285598e-06, 'epoch': 1.3} {'loss': 0.3446, 'learning_rate': 5.766798253811299e-06, 'epoch': 1.3} {'loss': 0.2679, 'learning_rate': 5.766493867115474e-06, 'epoch': 1.3} {'loss': 0.367, 'learning_rate': 5.766189485198477e-06, 'epoch': 1.3} {'loss': 0.3555, 'learning_rate': 5.765885108060642e-06, 'epoch': 1.3} {'loss': 0.2212, 'learning_rate': 5.765580735702323e-06, 'epoch': 1.3} {'loss': 0.4697, 'learning_rate': 5.7652763681238535e-06, 'epoch': 1.3} {'loss': 0.2669, 'learning_rate': 5.764972005325585e-06, 'epoch': 1.3} {'loss': 0.3806, 'learning_rate': 5.764667647307856e-06, 'epoch': 1.3} {'loss': 0.4104, 'learning_rate': 5.764363294071014e-06, 'epoch': 1.3} {'loss': 0.3628, 'learning_rate': 5.764058945615396e-06, 'epoch': 1.3} {'loss': 0.3459, 'learning_rate': 5.763754601941355e-06, 'epoch': 1.3} {'loss': 0.1771, 'learning_rate': 5.763450263049224e-06, 'epoch': 1.3} {'loss': 0.3458, 'learning_rate': 5.7631459289393575e-06, 'epoch': 1.3} {'loss': 0.3814, 'learning_rate': 5.762841599612095e-06, 'epoch': 1.3} {'loss': 0.4302, 'learning_rate': 5.762537275067772e-06, 'epoch': 1.3} {'loss': 0.3095, 'learning_rate': 5.7622329553067435e-06, 'epoch': 1.3} {'loss': 0.348, 'learning_rate': 5.761928640329344e-06, 'epoch': 1.3} {'loss': 0.1322, 'learning_rate': 5.761624330135925e-06, 'epoch': 1.3} {'loss': 0.42, 'learning_rate': 5.761320024726822e-06, 'epoch': 1.3} {'loss': 0.2391, 'learning_rate': 5.761015724102388e-06, 'epoch': 1.3} {'loss': 0.3617, 'learning_rate': 5.760711428262956e-06, 'epoch': 1.3} {'loss': 0.2585, 'learning_rate': 5.760407137208879e-06, 'epoch': 1.3} {'loss': 0.2296, 'learning_rate': 5.760102850940492e-06, 'epoch': 1.3} {'loss': 0.3138, 'learning_rate': 5.759798569458147e-06, 'epoch': 1.3} {'loss': 0.4798, 'learning_rate': 5.759494292762179e-06, 'epoch': 1.3} {'loss': 0.238, 'learning_rate': 5.75919002085294e-06, 'epoch': 1.3} {'loss': 0.3323, 'learning_rate': 5.758885753730767e-06, 'epoch': 1.3} {'loss': 0.34, 'learning_rate': 5.758581491396003e-06, 'epoch': 1.3} {'loss': 0.3019, 'learning_rate': 5.758277233848999e-06, 'epoch': 1.3} {'loss': 0.3396, 'learning_rate': 5.757972981090088e-06, 'epoch': 1.3} {'loss': 0.2558, 'learning_rate': 5.757668733119624e-06, 'epoch': 1.3} {'loss': 0.3547, 'learning_rate': 5.75736448993794e-06, 'epoch': 1.3} {'loss': 0.2962, 'learning_rate': 5.757060251545389e-06, 'epoch': 1.3} {'loss': 0.33, 'learning_rate': 5.756756017942307e-06, 'epoch': 1.3} {'loss': 0.3613, 'learning_rate': 5.756451789129043e-06, 'epoch': 1.3} {'loss': 0.353, 'learning_rate': 5.756147565105935e-06, 'epoch': 1.3} {'loss': 0.2842, 'learning_rate': 5.755843345873333e-06, 'epoch': 1.3} {'loss': 0.3819, 'learning_rate': 5.755539131431573e-06, 'epoch': 1.3} {'loss': 0.3005, 'learning_rate': 5.755234921781006e-06, 'epoch': 1.3} {'loss': 0.3223, 'learning_rate': 5.754930716921972e-06, 'epoch': 1.3} {'loss': 0.5211, 'learning_rate': 5.754626516854811e-06, 'epoch': 1.3} {'loss': 0.3021, 'learning_rate': 5.754322321579871e-06, 'epoch': 1.3} {'loss': 0.3388, 'learning_rate': 5.754018131097492e-06, 'epoch': 1.3} {'loss': 0.4352, 'learning_rate': 5.7537139454080214e-06, 'epoch': 1.3} {'loss': 0.339, 'learning_rate': 5.753409764511793e-06, 'epoch': 1.3} {'loss': 0.4857, 'learning_rate': 5.753105588409166e-06, 'epoch': 1.3} {'loss': 0.2599, 'learning_rate': 5.752801417100474e-06, 'epoch': 1.3} {'loss': 0.2705, 'learning_rate': 5.752497250586057e-06, 'epoch': 1.3} {'loss': 0.3307, 'learning_rate': 5.752193088866269e-06, 'epoch': 1.3} {'loss': 0.3598, 'learning_rate': 5.751888931941443e-06, 'epoch': 1.3} {'loss': 0.164, 'learning_rate': 5.7515847798119294e-06, 'epoch': 1.3} {'loss': 0.3545, 'learning_rate': 5.751280632478066e-06, 'epoch': 1.3} {'loss': 0.3689, 'learning_rate': 5.750976489940201e-06, 'epoch': 1.3} {'loss': 0.303, 'learning_rate': 5.750672352198674e-06, 'epoch': 1.3} {'loss': 0.2327, 'learning_rate': 5.750368219253832e-06, 'epoch': 1.3} {'loss': 0.153, 'learning_rate': 5.750064091106013e-06, 'epoch': 1.3} {'loss': 0.2866, 'learning_rate': 5.749759967755566e-06, 'epoch': 1.3} {'loss': 0.275, 'learning_rate': 5.74945584920283e-06, 'epoch': 1.3} {'loss': 0.3815, 'learning_rate': 5.749151735448153e-06, 'epoch': 1.3} {'loss': 0.3809, 'learning_rate': 5.748847626491874e-06, 'epoch': 1.3} {'loss': 0.2982, 'learning_rate': 5.748543522334335e-06, 'epoch': 1.3} {'loss': 0.293, 'learning_rate': 5.7482394229758865e-06, 'epoch': 1.3} {'loss': 0.4565, 'learning_rate': 5.747935328416863e-06, 'epoch': 1.3} {'loss': 0.2302, 'learning_rate': 5.747631238657615e-06, 'epoch': 1.3} {'loss': 0.2925, 'learning_rate': 5.747327153698478e-06, 'epoch': 1.3} {'loss': 0.3692, 'learning_rate': 5.747023073539806e-06, 'epoch': 1.3} {'loss': 0.4365, 'learning_rate': 5.7467189981819326e-06, 'epoch': 1.3} {'loss': 0.3347, 'learning_rate': 5.746414927625207e-06, 'epoch': 1.3} {'loss': 0.3707, 'learning_rate': 5.746110861869967e-06, 'epoch': 1.3} {'loss': 0.3409, 'learning_rate': 5.745806800916563e-06, 'epoch': 1.3} {'loss': 0.4289, 'learning_rate': 5.745502744765327e-06, 'epoch': 1.3} {'loss': 0.3739, 'learning_rate': 5.745198693416618e-06, 'epoch': 1.3} {'loss': 0.3344, 'learning_rate': 5.744894646870768e-06, 'epoch': 1.3} {'loss': 0.2824, 'learning_rate': 5.744590605128119e-06, 'epoch': 1.3} {'loss': 0.2273, 'learning_rate': 5.744286568189023e-06, 'epoch': 1.3} {'loss': 0.3301, 'learning_rate': 5.7439825360538134e-06, 'epoch': 1.3} {'loss': 0.2172, 'learning_rate': 5.743678508722842e-06, 'epoch': 1.3} {'loss': 0.386, 'learning_rate': 5.743374486196445e-06, 'epoch': 1.3} {'loss': 0.2749, 'learning_rate': 5.743070468474971e-06, 'epoch': 1.3} {'loss': 0.2965, 'learning_rate': 5.742766455558759e-06, 'epoch': 1.3} {'loss': 0.3759, 'learning_rate': 5.742462447448159e-06, 'epoch': 1.3} {'loss': 0.3078, 'learning_rate': 5.742158444143502e-06, 'epoch': 1.3} {'loss': 0.2834, 'learning_rate': 5.741854445645145e-06, 'epoch': 1.3} {'loss': 0.2198, 'learning_rate': 5.74155045195342e-06, 'epoch': 1.3} {'loss': 0.3258, 'learning_rate': 5.741246463068677e-06, 'epoch': 1.3} {'loss': 0.3332, 'learning_rate': 5.7409424789912595e-06, 'epoch': 1.3} {'loss': 0.3918, 'learning_rate': 5.740638499721502e-06, 'epoch': 1.3} {'loss': 0.2828, 'learning_rate': 5.7403345252597584e-06, 'epoch': 1.3} {'loss': 0.3709, 'learning_rate': 5.740030555606364e-06, 'epoch': 1.3} {'loss': 0.2572, 'learning_rate': 5.7397265907616685e-06, 'epoch': 1.3} {'loss': 0.2741, 'learning_rate': 5.739422630726008e-06, 'epoch': 1.3} {'loss': 0.2651, 'learning_rate': 5.7391186754997316e-06, 'epoch': 1.3} {'loss': 0.2949, 'learning_rate': 5.738814725083177e-06, 'epoch': 1.3} {'loss': 0.3224, 'learning_rate': 5.7385107794766945e-06, 'epoch': 1.3} {'loss': 0.443, 'learning_rate': 5.738206838680619e-06, 'epoch': 1.3} {'loss': 0.4178, 'learning_rate': 5.7379029026953e-06, 'epoch': 1.3} {'loss': 0.3464, 'learning_rate': 5.7375989715210766e-06, 'epoch': 1.3} {'loss': 0.2545, 'learning_rate': 5.737295045158295e-06, 'epoch': 1.3} {'loss': 0.3072, 'learning_rate': 5.736991123607295e-06, 'epoch': 1.3} {'loss': 0.3121, 'learning_rate': 5.736687206868424e-06, 'epoch': 1.3} {'loss': 0.289, 'learning_rate': 5.736383294942023e-06, 'epoch': 1.3} {'loss': 0.3862, 'learning_rate': 5.73607938782843e-06, 'epoch': 1.3} {'loss': 0.273, 'learning_rate': 5.735775485527996e-06, 'epoch': 1.3} {'loss': 0.3604, 'learning_rate': 5.7354715880410585e-06, 'epoch': 1.3} {'loss': 0.2631, 'learning_rate': 5.7351676953679655e-06, 'epoch': 1.3} {'loss': 0.3199, 'learning_rate': 5.734863807509054e-06, 'epoch': 1.3} {'loss': 0.3749, 'learning_rate': 5.734559924464673e-06, 'epoch': 1.3} {'loss': 0.1626, 'learning_rate': 5.734256046235158e-06, 'epoch': 1.3} {'loss': 0.3422, 'learning_rate': 5.733952172820862e-06, 'epoch': 1.3} {'loss': 0.3208, 'learning_rate': 5.7336483042221195e-06, 'epoch': 1.3} {'loss': 0.2152, 'learning_rate': 5.733344440439279e-06, 'epoch': 1.3} {'loss': 0.302, 'learning_rate': 5.73304058147268e-06, 'epoch': 1.3} {'loss': 0.4641, 'learning_rate': 5.732736727322667e-06, 'epoch': 1.3} {'loss': 0.4875, 'learning_rate': 5.732432877989587e-06, 'epoch': 1.3} {'loss': 0.2095, 'learning_rate': 5.732129033473772e-06, 'epoch': 1.3} {'loss': 0.3281, 'learning_rate': 5.731825193775576e-06, 'epoch': 1.3} {'loss': 0.3978, 'learning_rate': 5.731521358895333e-06, 'epoch': 1.3} {'loss': 0.3591, 'learning_rate': 5.731217528833397e-06, 'epoch': 1.3} {'loss': 0.4523, 'learning_rate': 5.7309137035901e-06, 'epoch': 1.3} {'loss': 0.1664, 'learning_rate': 5.730609883165792e-06, 'epoch': 1.3} {'loss': 0.3373, 'learning_rate': 5.730306067560811e-06, 'epoch': 1.3} {'loss': 0.2046, 'learning_rate': 5.730002256775507e-06, 'epoch': 1.3} {'loss': 0.2717, 'learning_rate': 5.729698450810213e-06, 'epoch': 1.3} {'loss': 0.2805, 'learning_rate': 5.729394649665281e-06, 'epoch': 1.3} {'loss': 0.447, 'learning_rate': 5.729090853341048e-06, 'epoch': 1.3} {'loss': 0.3323, 'learning_rate': 5.728787061837863e-06, 'epoch': 1.3} {'loss': 0.3359, 'learning_rate': 5.728483275156065e-06, 'epoch': 1.3} {'loss': 0.4074, 'learning_rate': 5.728179493295992e-06, 'epoch': 1.3} {'loss': 0.3305, 'learning_rate': 5.727875716257998e-06, 'epoch': 1.3} {'loss': 0.5899, 'learning_rate': 5.727571944042413e-06, 'epoch': 1.3} {'loss': 0.2364, 'learning_rate': 5.727268176649594e-06, 'epoch': 1.3} {'loss': 0.279, 'learning_rate': 5.726964414079872e-06, 'epoch': 1.3} {'loss': 0.4166, 'learning_rate': 5.726660656333598e-06, 'epoch': 1.3} {'loss': 0.3065, 'learning_rate': 5.726356903411107e-06, 'epoch': 1.3} {'loss': 0.4214, 'learning_rate': 5.726053155312752e-06, 'epoch': 1.3} {'loss': 0.2565, 'learning_rate': 5.725749412038865e-06, 'epoch': 1.3} {'loss': 0.3918, 'learning_rate': 5.725445673589798e-06, 'epoch': 1.3} {'loss': 0.261, 'learning_rate': 5.7251419399658855e-06, 'epoch': 1.3} {'loss': 0.3755, 'learning_rate': 5.724838211167481e-06, 'epoch': 1.3} {'loss': 0.4285, 'learning_rate': 5.7245344871949195e-06, 'epoch': 1.3} {'loss': 0.2997, 'learning_rate': 5.724230768048542e-06, 'epoch': 1.3} {'loss': 0.3394, 'learning_rate': 5.723927053728699e-06, 'epoch': 1.3} {'loss': 0.3585, 'learning_rate': 5.723623344235725e-06, 'epoch': 1.3} {'loss': 0.3055, 'learning_rate': 5.7233196395699665e-06, 'epoch': 1.3} {'loss': 0.2832, 'learning_rate': 5.723015939731768e-06, 'epoch': 1.3} {'loss': 0.3193, 'learning_rate': 5.722712244721476e-06, 'epoch': 1.3} {'loss': 0.3002, 'learning_rate': 5.722408554539426e-06, 'epoch': 1.3} {'loss': 0.4002, 'learning_rate': 5.722104869185961e-06, 'epoch': 1.3} {'loss': 0.3122, 'learning_rate': 5.721801188661429e-06, 'epoch': 1.3} {'loss': 0.2969, 'learning_rate': 5.721497512966168e-06, 'epoch': 1.3} {'loss': 0.3991, 'learning_rate': 5.721193842100524e-06, 'epoch': 1.3} {'loss': 0.4274, 'learning_rate': 5.720890176064836e-06, 'epoch': 1.3} {'loss': 0.4267, 'learning_rate': 5.720586514859453e-06, 'epoch': 1.3} {'loss': 0.3078, 'learning_rate': 5.72028285848471e-06, 'epoch': 1.3} {'loss': 0.3889, 'learning_rate': 5.7199792069409575e-06, 'epoch': 1.3} {'loss': 0.4021, 'learning_rate': 5.719675560228533e-06, 'epoch': 1.3} {'loss': 0.289, 'learning_rate': 5.719371918347782e-06, 'epoch': 1.3} {'loss': 0.25, 'learning_rate': 5.719068281299043e-06, 'epoch': 1.3} {'loss': 0.4061, 'learning_rate': 5.718764649082666e-06, 'epoch': 1.3} {'loss': 0.2908, 'learning_rate': 5.718461021698989e-06, 'epoch': 1.3} {'loss': 0.3675, 'learning_rate': 5.718157399148352e-06, 'epoch': 1.3} {'loss': 0.2896, 'learning_rate': 5.717853781431104e-06, 'epoch': 1.3} {'loss': 0.3297, 'learning_rate': 5.717550168547583e-06, 'epoch': 1.3} {'loss': 0.1901, 'learning_rate': 5.717246560498135e-06, 'epoch': 1.3} {'loss': 0.3999, 'learning_rate': 5.716942957283099e-06, 'epoch': 1.3} {'loss': 0.1879, 'learning_rate': 5.716639358902824e-06, 'epoch': 1.3} {'loss': 0.3032, 'learning_rate': 5.716335765357643e-06, 'epoch': 1.3} {'loss': 0.4228, 'learning_rate': 5.71603217664791e-06, 'epoch': 1.3} {'loss': 0.2711, 'learning_rate': 5.715728592773957e-06, 'epoch': 1.3} {'loss': 0.1871, 'learning_rate': 5.7154250137361355e-06, 'epoch': 1.3} {'loss': 0.4173, 'learning_rate': 5.715121439534782e-06, 'epoch': 1.3} {'loss': 0.1712, 'learning_rate': 5.714817870170244e-06, 'epoch': 1.3} {'loss': 0.3399, 'learning_rate': 5.714514305642863e-06, 'epoch': 1.3} {'loss': 0.2948, 'learning_rate': 5.714210745952975e-06, 'epoch': 1.3} {'loss': 0.3662, 'learning_rate': 5.713907191100933e-06, 'epoch': 1.3} {'loss': 0.4437, 'learning_rate': 5.713603641087071e-06, 'epoch': 1.3} {'loss': 0.3436, 'learning_rate': 5.713300095911739e-06, 'epoch': 1.3} {'loss': 0.211, 'learning_rate': 5.712996555575272e-06, 'epoch': 1.3} {'loss': 0.4222, 'learning_rate': 5.712693020078022e-06, 'epoch': 1.3} {'loss': 0.3426, 'learning_rate': 5.712389489420321e-06, 'epoch': 1.3} {'loss': 0.3188, 'learning_rate': 5.712085963602521e-06, 'epoch': 1.3} {'loss': 0.3376, 'learning_rate': 5.711782442624956e-06, 'epoch': 1.3} {'loss': 0.3215, 'learning_rate': 5.711478926487977e-06, 'epoch': 1.3} {'loss': 0.469, 'learning_rate': 5.71117541519192e-06, 'epoch': 1.3} {'loss': 0.3273, 'learning_rate': 5.710871908737135e-06, 'epoch': 1.3} {'loss': 0.354, 'learning_rate': 5.710568407123958e-06, 'epoch': 1.3} {'loss': 0.3242, 'learning_rate': 5.710264910352729e-06, 'epoch': 1.3} {'loss': 0.2457, 'learning_rate': 5.709961418423802e-06, 'epoch': 1.3} {'loss': 0.2586, 'learning_rate': 5.709657931337507e-06, 'epoch': 1.3} {'loss': 0.3902, 'learning_rate': 5.709354449094198e-06, 'epoch': 1.3} {'loss': 0.3269, 'learning_rate': 5.7090509716942056e-06, 'epoch': 1.3} {'loss': 0.3615, 'learning_rate': 5.708747499137885e-06, 'epoch': 1.3} {'loss': 0.3874, 'learning_rate': 5.708444031425566e-06, 'epoch': 1.3} {'loss': 0.2128, 'learning_rate': 5.708140568557603e-06, 'epoch': 1.3} {'loss': 0.3317, 'learning_rate': 5.707837110534329e-06, 'epoch': 1.3} {'loss': 0.2383, 'learning_rate': 5.707533657356095e-06, 'epoch': 1.3} {'loss': 0.2233, 'learning_rate': 5.707230209023236e-06, 'epoch': 1.3} {'loss': 0.361, 'learning_rate': 5.706926765536101e-06, 'epoch': 1.3} {'loss': 0.5093, 'learning_rate': 5.706623326895029e-06, 'epoch': 1.3} {'loss': 0.2592, 'learning_rate': 5.706319893100358e-06, 'epoch': 1.3} {'loss': 0.2794, 'learning_rate': 5.706016464152441e-06, 'epoch': 1.3} {'loss': 0.3723, 'learning_rate': 5.705713040051611e-06, 'epoch': 1.3} {'loss': 0.2807, 'learning_rate': 5.705409620798217e-06, 'epoch': 1.3} {'loss': 0.3146, 'learning_rate': 5.705106206392594e-06, 'epoch': 1.3} {'loss': 0.2827, 'learning_rate': 5.704802796835096e-06, 'epoch': 1.3} {'loss': 0.3306, 'learning_rate': 5.704499392126053e-06, 'epoch': 1.3} {'loss': 0.2801, 'learning_rate': 5.704195992265819e-06, 'epoch': 1.3} {'loss': 0.2524, 'learning_rate': 5.7038925972547255e-06, 'epoch': 1.3} {'loss': 0.0984, 'learning_rate': 5.703589207093126e-06, 'epoch': 1.31} {'loss': 0.3435, 'learning_rate': 5.70328582178135e-06, 'epoch': 1.31} {'loss': 0.1568, 'learning_rate': 5.7029824413197545e-06, 'epoch': 1.31} {'loss': 0.3668, 'learning_rate': 5.702679065708674e-06, 'epoch': 1.31} {'loss': 0.2478, 'learning_rate': 5.7023756949484465e-06, 'epoch': 1.31} {'loss': 0.3827, 'learning_rate': 5.702072329039424e-06, 'epoch': 1.31} {'loss': 0.2915, 'learning_rate': 5.701768967981941e-06, 'epoch': 1.31} {'loss': 0.2567, 'learning_rate': 5.701465611776347e-06, 'epoch': 1.31} {'loss': 0.1861, 'learning_rate': 5.7011622604229765e-06, 'epoch': 1.31} {'loss': 0.3358, 'learning_rate': 5.700858913922183e-06, 'epoch': 1.31} {'loss': 0.4275, 'learning_rate': 5.700555572274296e-06, 'epoch': 1.31} {'loss': 0.364, 'learning_rate': 5.700252235479669e-06, 'epoch': 1.31} {'loss': 0.2733, 'learning_rate': 5.6999489035386345e-06, 'epoch': 1.31} {'loss': 0.3133, 'learning_rate': 5.6996455764515446e-06, 'epoch': 1.31} {'loss': 0.3281, 'learning_rate': 5.699342254218733e-06, 'epoch': 1.31} {'loss': 0.3651, 'learning_rate': 5.6990389368405495e-06, 'epoch': 1.31} {'loss': 0.3441, 'learning_rate': 5.698735624317334e-06, 'epoch': 1.31} {'loss': 0.333, 'learning_rate': 5.698432316649425e-06, 'epoch': 1.31} {'loss': 0.3886, 'learning_rate': 5.69812901383717e-06, 'epoch': 1.31} {'loss': 0.2864, 'learning_rate': 5.697825715880907e-06, 'epoch': 1.31} {'loss': 0.5066, 'learning_rate': 5.697522422780983e-06, 'epoch': 1.31} {'loss': 0.2946, 'learning_rate': 5.697219134537735e-06, 'epoch': 1.31} {'loss': 0.2254, 'learning_rate': 5.696915851151512e-06, 'epoch': 1.31} {'loss': 0.2504, 'learning_rate': 5.69661257262265e-06, 'epoch': 1.31} {'loss': 0.2577, 'learning_rate': 5.696309298951497e-06, 'epoch': 1.31} {'loss': 0.24, 'learning_rate': 5.696006030138388e-06, 'epoch': 1.31} {'loss': 0.3536, 'learning_rate': 5.695702766183675e-06, 'epoch': 1.31} {'loss': 0.3281, 'learning_rate': 5.695399507087691e-06, 'epoch': 1.31} {'loss': 0.3266, 'learning_rate': 5.695096252850785e-06, 'epoch': 1.31} {'loss': 0.243, 'learning_rate': 5.694793003473298e-06, 'epoch': 1.31} {'loss': 0.3368, 'learning_rate': 5.694489758955566e-06, 'epoch': 1.31} {'loss': 0.3443, 'learning_rate': 5.694186519297942e-06, 'epoch': 1.31} {'loss': 0.3957, 'learning_rate': 5.693883284500756e-06, 'epoch': 1.31} {'loss': 0.2949, 'learning_rate': 5.693580054564363e-06, 'epoch': 1.31} {'loss': 0.3207, 'learning_rate': 5.69327682948909e-06, 'epoch': 1.31} {'loss': 0.3606, 'learning_rate': 5.692973609275298e-06, 'epoch': 1.31} {'loss': 0.2539, 'learning_rate': 5.692670393923314e-06, 'epoch': 1.31} {'loss': 0.3553, 'learning_rate': 5.692367183433491e-06, 'epoch': 1.31} {'loss': 0.2985, 'learning_rate': 5.692063977806167e-06, 'epoch': 1.31} {'loss': 0.2701, 'learning_rate': 5.69176077704168e-06, 'epoch': 1.31} {'loss': 0.4885, 'learning_rate': 5.691457581140379e-06, 'epoch': 1.31} {'loss': 0.2812, 'learning_rate': 5.6911543901025975e-06, 'epoch': 1.31} {'loss': 0.4495, 'learning_rate': 5.690851203928689e-06, 'epoch': 1.31} {'loss': 0.3872, 'learning_rate': 5.6905480226189845e-06, 'epoch': 1.31} {'loss': 0.2664, 'learning_rate': 5.690244846173838e-06, 'epoch': 1.31} {'loss': 0.4653, 'learning_rate': 5.68994167459358e-06, 'epoch': 1.31} {'loss': 0.3199, 'learning_rate': 5.6896385078785635e-06, 'epoch': 1.31} {'loss': 0.2408, 'learning_rate': 5.68933534602912e-06, 'epoch': 1.31} {'loss': 0.066, 'learning_rate': 5.689032189045602e-06, 'epoch': 1.31} {'loss': 0.2298, 'learning_rate': 5.688729036928342e-06, 'epoch': 1.31} {'loss': 0.2388, 'learning_rate': 5.688425889677693e-06, 'epoch': 1.31} {'loss': 0.2106, 'learning_rate': 5.688122747293989e-06, 'epoch': 1.31} {'loss': 0.3772, 'learning_rate': 5.687819609777573e-06, 'epoch': 1.31} {'loss': 0.4694, 'learning_rate': 5.687516477128792e-06, 'epoch': 1.31} {'loss': 0.251, 'learning_rate': 5.687213349347979e-06, 'epoch': 1.31} {'loss': 0.354, 'learning_rate': 5.686910226435487e-06, 'epoch': 1.31} {'loss': 0.1868, 'learning_rate': 5.686607108391649e-06, 'epoch': 1.31} {'loss': 0.2971, 'learning_rate': 5.686303995216816e-06, 'epoch': 1.31} {'loss': 0.5322, 'learning_rate': 5.686000886911321e-06, 'epoch': 1.31} {'loss': 0.3166, 'learning_rate': 5.6856977834755156e-06, 'epoch': 1.31} {'loss': 0.3544, 'learning_rate': 5.685394684909733e-06, 'epoch': 1.31} {'loss': 0.3067, 'learning_rate': 5.685091591214323e-06, 'epoch': 1.31} {'loss': 0.3762, 'learning_rate': 5.684788502389618e-06, 'epoch': 1.31} {'loss': 0.2923, 'learning_rate': 5.684485418435972e-06, 'epoch': 1.31} {'loss': 0.3058, 'learning_rate': 5.684182339353721e-06, 'epoch': 1.31} {'loss': 0.3073, 'learning_rate': 5.683879265143204e-06, 'epoch': 1.31} {'loss': 0.3657, 'learning_rate': 5.68357619580477e-06, 'epoch': 1.31} {'loss': 0.2779, 'learning_rate': 5.683273131338754e-06, 'epoch': 1.31} {'loss': 0.4122, 'learning_rate': 5.682970071745506e-06, 'epoch': 1.31} {'loss': 0.3346, 'learning_rate': 5.682667017025359e-06, 'epoch': 1.31} {'loss': 0.3492, 'learning_rate': 5.682363967178666e-06, 'epoch': 1.31} {'loss': 0.3263, 'learning_rate': 5.682060922205757e-06, 'epoch': 1.31} {'loss': 0.3923, 'learning_rate': 5.681757882106984e-06, 'epoch': 1.31} {'loss': 0.3389, 'learning_rate': 5.6814548468826825e-06, 'epoch': 1.31} {'loss': 0.393, 'learning_rate': 5.6811518165332e-06, 'epoch': 1.31} {'loss': 0.3982, 'learning_rate': 5.6808487910588726e-06, 'epoch': 1.31} {'loss': 0.2776, 'learning_rate': 5.68054577046005e-06, 'epoch': 1.31} {'loss': 0.2951, 'learning_rate': 5.680242754737069e-06, 'epoch': 1.31} {'loss': 0.4191, 'learning_rate': 5.679939743890268e-06, 'epoch': 1.31} {'loss': 0.2347, 'learning_rate': 5.679636737919999e-06, 'epoch': 1.31} {'loss': 0.2439, 'learning_rate': 5.679333736826594e-06, 'epoch': 1.31} {'loss': 0.4312, 'learning_rate': 5.679030740610403e-06, 'epoch': 1.31} {'loss': 0.3702, 'learning_rate': 5.678727749271762e-06, 'epoch': 1.31} {'loss': 0.3159, 'learning_rate': 5.678424762811019e-06, 'epoch': 1.31} {'loss': 0.2447, 'learning_rate': 5.6781217812285075e-06, 'epoch': 1.31} {'loss': 0.3376, 'learning_rate': 5.6778188045245795e-06, 'epoch': 1.31} {'loss': 0.3139, 'learning_rate': 5.67751583269957e-06, 'epoch': 1.31} {'loss': 0.2058, 'learning_rate': 5.677212865753824e-06, 'epoch': 1.31} {'loss': 0.3351, 'learning_rate': 5.67690990368768e-06, 'epoch': 1.31} {'loss': 0.313, 'learning_rate': 5.676606946501487e-06, 'epoch': 1.31} {'loss': 0.4113, 'learning_rate': 5.6763039941955825e-06, 'epoch': 1.31} {'loss': 0.3023, 'learning_rate': 5.676001046770304e-06, 'epoch': 1.31} {'loss': 0.4177, 'learning_rate': 5.675698104226003e-06, 'epoch': 1.31} {'loss': 0.3259, 'learning_rate': 5.675395166563011e-06, 'epoch': 1.31} {'loss': 0.3517, 'learning_rate': 5.675092233781682e-06, 'epoch': 1.31} {'loss': 0.3321, 'learning_rate': 5.674789305882346e-06, 'epoch': 1.31} {'loss': 0.3322, 'learning_rate': 5.674486382865354e-06, 'epoch': 1.31} {'loss': 0.4503, 'learning_rate': 5.67418346473104e-06, 'epoch': 1.31} {'loss': 0.4471, 'learning_rate': 5.6738805514797555e-06, 'epoch': 1.31} {'loss': 0.4291, 'learning_rate': 5.673577643111833e-06, 'epoch': 1.31} {'loss': 0.4233, 'learning_rate': 5.673274739627622e-06, 'epoch': 1.31} {'loss': 0.3217, 'learning_rate': 5.672971841027457e-06, 'epoch': 1.31} {'loss': 0.2676, 'learning_rate': 5.6726689473116895e-06, 'epoch': 1.31} {'loss': 0.3801, 'learning_rate': 5.6723660584806535e-06, 'epoch': 1.31} {'loss': 0.2761, 'learning_rate': 5.672063174534692e-06, 'epoch': 1.31} {'loss': 0.3803, 'learning_rate': 5.6717602954741505e-06, 'epoch': 1.31} {'loss': 0.234, 'learning_rate': 5.671457421299365e-06, 'epoch': 1.31} {'loss': 0.3144, 'learning_rate': 5.671154552010685e-06, 'epoch': 1.31} {'loss': 0.2727, 'learning_rate': 5.670851687608443e-06, 'epoch': 1.31} {'loss': 0.2166, 'learning_rate': 5.670548828092992e-06, 'epoch': 1.31} {'loss': 0.2423, 'learning_rate': 5.670245973464663e-06, 'epoch': 1.31} {'loss': 0.3326, 'learning_rate': 5.669943123723807e-06, 'epoch': 1.31} {'loss': 0.4119, 'learning_rate': 5.669640278870758e-06, 'epoch': 1.31} {'loss': 0.4146, 'learning_rate': 5.669337438905867e-06, 'epoch': 1.31} {'loss': 0.2608, 'learning_rate': 5.669034603829464e-06, 'epoch': 1.31} {'loss': 0.3552, 'learning_rate': 5.668731773641903e-06, 'epoch': 1.31} {'loss': 0.3425, 'learning_rate': 5.66842894834352e-06, 'epoch': 1.31} {'loss': 0.2364, 'learning_rate': 5.668126127934653e-06, 'epoch': 1.31} {'loss': 0.3197, 'learning_rate': 5.667823312415653e-06, 'epoch': 1.31} {'loss': 0.4111, 'learning_rate': 5.6675205017868505e-06, 'epoch': 1.31} {'loss': 0.3628, 'learning_rate': 5.667217696048599e-06, 'epoch': 1.31} {'loss': 0.5228, 'learning_rate': 5.66691489520123e-06, 'epoch': 1.31} {'loss': 0.3385, 'learning_rate': 5.666612099245095e-06, 'epoch': 1.31} {'loss': 0.3887, 'learning_rate': 5.666309308180526e-06, 'epoch': 1.31} {'loss': 0.3249, 'learning_rate': 5.666006522007874e-06, 'epoch': 1.31} {'loss': 0.3844, 'learning_rate': 5.665703740727473e-06, 'epoch': 1.31} {'loss': 0.3068, 'learning_rate': 5.665400964339671e-06, 'epoch': 1.31} {'loss': 0.4207, 'learning_rate': 5.665098192844805e-06, 'epoch': 1.31} {'loss': 0.3803, 'learning_rate': 5.664795426243222e-06, 'epoch': 1.31} {'loss': 0.3656, 'learning_rate': 5.664492664535259e-06, 'epoch': 1.31} {'loss': 0.2759, 'learning_rate': 5.664189907721256e-06, 'epoch': 1.31} {'loss': 0.3174, 'learning_rate': 5.663887155801564e-06, 'epoch': 1.31} {'loss': 0.3845, 'learning_rate': 5.663584408776512e-06, 'epoch': 1.31} {'loss': 0.3238, 'learning_rate': 5.663281666646451e-06, 'epoch': 1.31} {'loss': 0.429, 'learning_rate': 5.66297892941172e-06, 'epoch': 1.31} {'loss': 0.3335, 'learning_rate': 5.662676197072664e-06, 'epoch': 1.31} {'loss': 0.2674, 'learning_rate': 5.662373469629623e-06, 'epoch': 1.31} {'loss': 0.2851, 'learning_rate': 5.662070747082932e-06, 'epoch': 1.31} {'loss': 0.284, 'learning_rate': 5.661768029432944e-06, 'epoch': 1.31} {'loss': 0.2495, 'learning_rate': 5.6614653166799895e-06, 'epoch': 1.31} {'loss': 0.3048, 'learning_rate': 5.66116260882442e-06, 'epoch': 1.31} {'loss': 0.2766, 'learning_rate': 5.660859905866569e-06, 'epoch': 1.31} {'loss': 0.2961, 'learning_rate': 5.660557207806786e-06, 'epoch': 1.31} {'loss': 0.2901, 'learning_rate': 5.660254514645405e-06, 'epoch': 1.31} {'loss': 0.4394, 'learning_rate': 5.659951826382775e-06, 'epoch': 1.31} {'loss': 0.3394, 'learning_rate': 5.65964914301923e-06, 'epoch': 1.31} {'loss': 0.4179, 'learning_rate': 5.65934646455512e-06, 'epoch': 1.31} {'loss': 0.3372, 'learning_rate': 5.659043790990779e-06, 'epoch': 1.31} {'loss': 0.3287, 'learning_rate': 5.658741122326555e-06, 'epoch': 1.31} {'loss': 0.3076, 'learning_rate': 5.658438458562787e-06, 'epoch': 1.31} {'loss': 0.3072, 'learning_rate': 5.6581357996998136e-06, 'epoch': 1.31} {'loss': 0.3033, 'learning_rate': 5.657833145737982e-06, 'epoch': 1.31} {'loss': 0.3316, 'learning_rate': 5.657530496677628e-06, 'epoch': 1.31} {'loss': 0.3434, 'learning_rate': 5.6572278525190995e-06, 'epoch': 1.31} {'loss': 0.2741, 'learning_rate': 5.656925213262732e-06, 'epoch': 1.31} {'loss': 0.2523, 'learning_rate': 5.656622578908873e-06, 'epoch': 1.31} {'loss': 0.3076, 'learning_rate': 5.656319949457857e-06, 'epoch': 1.31} {'loss': 0.4118, 'learning_rate': 5.656017324910034e-06, 'epoch': 1.31} {'loss': 0.2732, 'learning_rate': 5.655714705265738e-06, 'epoch': 1.31} {'loss': 0.2558, 'learning_rate': 5.655412090525318e-06, 'epoch': 1.31} {'loss': 0.3733, 'learning_rate': 5.655109480689106e-06, 'epoch': 1.31} {'loss': 0.2165, 'learning_rate': 5.654806875757455e-06, 'epoch': 1.31} {'loss': 0.3116, 'learning_rate': 5.654504275730699e-06, 'epoch': 1.31} {'loss': 0.2912, 'learning_rate': 5.6542016806091795e-06, 'epoch': 1.31} {'loss': 0.3806, 'learning_rate': 5.653899090393242e-06, 'epoch': 1.31} {'loss': 0.2388, 'learning_rate': 5.653596505083223e-06, 'epoch': 1.31} {'loss': 0.3297, 'learning_rate': 5.653293924679471e-06, 'epoch': 1.31} {'loss': 0.4592, 'learning_rate': 5.652991349182319e-06, 'epoch': 1.31} {'loss': 0.2349, 'learning_rate': 5.652688778592119e-06, 'epoch': 1.31} {'loss': 0.4356, 'learning_rate': 5.6523862129092e-06, 'epoch': 1.31} {'loss': 0.2179, 'learning_rate': 5.652083652133916e-06, 'epoch': 1.31} {'loss': 0.4889, 'learning_rate': 5.651781096266598e-06, 'epoch': 1.31} {'loss': 0.3533, 'learning_rate': 5.651478545307597e-06, 'epoch': 1.31} {'loss': 0.2456, 'learning_rate': 5.651175999257246e-06, 'epoch': 1.31} {'loss': 0.2526, 'learning_rate': 5.650873458115893e-06, 'epoch': 1.31} {'loss': 0.2558, 'learning_rate': 5.650570921883873e-06, 'epoch': 1.31} {'loss': 0.4212, 'learning_rate': 5.650268390561538e-06, 'epoch': 1.31} {'loss': 0.251, 'learning_rate': 5.649965864149219e-06, 'epoch': 1.31} {'loss': 0.2983, 'learning_rate': 5.64966334264726e-06, 'epoch': 1.31} {'loss': 0.4176, 'learning_rate': 5.649360826056007e-06, 'epoch': 1.31} {'loss': 0.3275, 'learning_rate': 5.649058314375794e-06, 'epoch': 1.31} {'loss': 0.391, 'learning_rate': 5.6487558076069714e-06, 'epoch': 1.31} {'loss': 0.2658, 'learning_rate': 5.648453305749871e-06, 'epoch': 1.31} {'loss': 0.2224, 'learning_rate': 5.648150808804845e-06, 'epoch': 1.31} {'loss': 0.2953, 'learning_rate': 5.6478483167722246e-06, 'epoch': 1.31} {'loss': 0.3588, 'learning_rate': 5.647545829652359e-06, 'epoch': 1.31} {'loss': 0.4385, 'learning_rate': 5.647243347445582e-06, 'epoch': 1.31} {'loss': 0.2075, 'learning_rate': 5.646940870152244e-06, 'epoch': 1.31} {'loss': 0.3714, 'learning_rate': 5.646638397772679e-06, 'epoch': 1.31} {'loss': 0.3, 'learning_rate': 5.646335930307236e-06, 'epoch': 1.31} {'loss': 0.3412, 'learning_rate': 5.6460334677562515e-06, 'epoch': 1.31} {'loss': 0.3227, 'learning_rate': 5.6457310101200615e-06, 'epoch': 1.31} {'loss': 0.4014, 'learning_rate': 5.645428557399017e-06, 'epoch': 1.31} {'loss': 0.3947, 'learning_rate': 5.645126109593454e-06, 'epoch': 1.31} {'loss': 0.3317, 'learning_rate': 5.644823666703718e-06, 'epoch': 1.31} {'loss': 0.297, 'learning_rate': 5.644521228730144e-06, 'epoch': 1.31} {'loss': 0.2891, 'learning_rate': 5.644218795673082e-06, 'epoch': 1.31} {'loss': 0.3809, 'learning_rate': 5.643916367532864e-06, 'epoch': 1.31} {'loss': 0.2793, 'learning_rate': 5.643613944309841e-06, 'epoch': 1.31} {'loss': 0.3807, 'learning_rate': 5.643311526004345e-06, 'epoch': 1.31} {'loss': 0.2688, 'learning_rate': 5.6430091126167256e-06, 'epoch': 1.31} {'loss': 0.2592, 'learning_rate': 5.642706704147316e-06, 'epoch': 1.31} {'loss': 0.3862, 'learning_rate': 5.6424043005964665e-06, 'epoch': 1.31} {'loss': 0.4407, 'learning_rate': 5.642101901964514e-06, 'epoch': 1.31} {'loss': 0.3499, 'learning_rate': 5.641799508251795e-06, 'epoch': 1.31} {'loss': 0.3641, 'learning_rate': 5.641497119458661e-06, 'epoch': 1.31} {'loss': 0.1962, 'learning_rate': 5.6411947355854424e-06, 'epoch': 1.31} {'loss': 0.2486, 'learning_rate': 5.64089235663249e-06, 'epoch': 1.31} {'loss': 0.3683, 'learning_rate': 5.640589982600139e-06, 'epoch': 1.31} {'loss': 0.2533, 'learning_rate': 5.640287613488735e-06, 'epoch': 1.31} {'loss': 0.3851, 'learning_rate': 5.639985249298614e-06, 'epoch': 1.31} {'loss': 0.3113, 'learning_rate': 5.639682890030125e-06, 'epoch': 1.31} {'loss': 0.32, 'learning_rate': 5.6393805356836004e-06, 'epoch': 1.31} {'loss': 0.3991, 'learning_rate': 5.6390781862593905e-06, 'epoch': 1.31} {'loss': 0.3604, 'learning_rate': 5.6387758417578286e-06, 'epoch': 1.31} {'loss': 0.3776, 'learning_rate': 5.638473502179263e-06, 'epoch': 1.31} {'loss': 0.2757, 'learning_rate': 5.638171167524029e-06, 'epoch': 1.31} {'loss': 0.2144, 'learning_rate': 5.637868837792468e-06, 'epoch': 1.31} {'loss': 0.2642, 'learning_rate': 5.637566512984929e-06, 'epoch': 1.31} {'loss': 0.2967, 'learning_rate': 5.637264193101743e-06, 'epoch': 1.31} {'loss': 0.2704, 'learning_rate': 5.636961878143259e-06, 'epoch': 1.31} {'loss': 0.4138, 'learning_rate': 5.636659568109812e-06, 'epoch': 1.31} {'loss': 0.2613, 'learning_rate': 5.636357263001751e-06, 'epoch': 1.31} {'loss': 0.3096, 'learning_rate': 5.6360549628194095e-06, 'epoch': 1.31} {'loss': 0.2747, 'learning_rate': 5.6357526675631344e-06, 'epoch': 1.31} {'loss': 0.2466, 'learning_rate': 5.635450377233262e-06, 'epoch': 1.31} {'loss': 0.3377, 'learning_rate': 5.63514809183014e-06, 'epoch': 1.31} {'loss': 0.2888, 'learning_rate': 5.634845811354101e-06, 'epoch': 1.31} {'loss': 0.3469, 'learning_rate': 5.634543535805497e-06, 'epoch': 1.31} {'loss': 0.4511, 'learning_rate': 5.634241265184661e-06, 'epoch': 1.31} {'loss': 0.3591, 'learning_rate': 5.633938999491932e-06, 'epoch': 1.31} {'loss': 0.3008, 'learning_rate': 5.633636738727661e-06, 'epoch': 1.31} {'loss': 0.2915, 'learning_rate': 5.63333448289218e-06, 'epoch': 1.31} {'loss': 0.2991, 'learning_rate': 5.6330322319858335e-06, 'epoch': 1.31} {'loss': 0.311, 'learning_rate': 5.632729986008964e-06, 'epoch': 1.31} {'loss': 0.3724, 'learning_rate': 5.632427744961915e-06, 'epoch': 1.31} {'loss': 0.3311, 'learning_rate': 5.632125508845024e-06, 'epoch': 1.31} {'loss': 0.2927, 'learning_rate': 5.6318232776586304e-06, 'epoch': 1.31} {'loss': 0.2102, 'learning_rate': 5.63152105140308e-06, 'epoch': 1.31} {'loss': 0.3332, 'learning_rate': 5.631218830078708e-06, 'epoch': 1.31} {'loss': 0.318, 'learning_rate': 5.630916613685864e-06, 'epoch': 1.31} {'loss': 0.3511, 'learning_rate': 5.63061440222488e-06, 'epoch': 1.31} {'loss': 0.2057, 'learning_rate': 5.630312195696105e-06, 'epoch': 1.31} {'loss': 0.2605, 'learning_rate': 5.630009994099872e-06, 'epoch': 1.31} {'loss': 0.3023, 'learning_rate': 5.629707797436532e-06, 'epoch': 1.31} {'loss': 0.2592, 'learning_rate': 5.629405605706418e-06, 'epoch': 1.31} {'loss': 0.28, 'learning_rate': 5.6291034189098755e-06, 'epoch': 1.31} {'loss': 0.5074, 'learning_rate': 5.628801237047241e-06, 'epoch': 1.31} {'loss': 0.365, 'learning_rate': 5.628499060118862e-06, 'epoch': 1.31} {'loss': 0.4369, 'learning_rate': 5.6281968881250774e-06, 'epoch': 1.31} {'loss': 0.4076, 'learning_rate': 5.6278947210662225e-06, 'epoch': 1.31} {'loss': 0.2471, 'learning_rate': 5.627592558942647e-06, 'epoch': 1.31} {'loss': 0.2396, 'learning_rate': 5.627290401754685e-06, 'epoch': 1.31} {'loss': 0.1861, 'learning_rate': 5.626988249502684e-06, 'epoch': 1.31} {'loss': 0.3983, 'learning_rate': 5.626686102186978e-06, 'epoch': 1.31} {'loss': 0.3636, 'learning_rate': 5.626383959807915e-06, 'epoch': 1.31} {'loss': 0.3389, 'learning_rate': 5.62608182236583e-06, 'epoch': 1.31} {'loss': 0.2508, 'learning_rate': 5.62577968986107e-06, 'epoch': 1.31} {'loss': 0.3374, 'learning_rate': 5.625477562293968e-06, 'epoch': 1.31} {'loss': 0.3524, 'learning_rate': 5.625175439664876e-06, 'epoch': 1.31} {'loss': 0.2757, 'learning_rate': 5.624873321974124e-06, 'epoch': 1.31} {'loss': 0.3353, 'learning_rate': 5.624571209222062e-06, 'epoch': 1.31} {'loss': 0.162, 'learning_rate': 5.624269101409028e-06, 'epoch': 1.31} {'loss': 0.2859, 'learning_rate': 5.623966998535356e-06, 'epoch': 1.31} {'loss': 0.1841, 'learning_rate': 5.623664900601399e-06, 'epoch': 1.31} {'loss': 0.4267, 'learning_rate': 5.6233628076074875e-06, 'epoch': 1.31} {'loss': 0.2727, 'learning_rate': 5.623060719553971e-06, 'epoch': 1.31} {'loss': 0.3123, 'learning_rate': 5.622758636441183e-06, 'epoch': 1.31} {'loss': 0.3237, 'learning_rate': 5.622456558269471e-06, 'epoch': 1.31} {'loss': 0.4789, 'learning_rate': 5.62215448503917e-06, 'epoch': 1.31} {'loss': 0.4187, 'learning_rate': 5.621852416750628e-06, 'epoch': 1.31} {'loss': 0.1778, 'learning_rate': 5.621550353404179e-06, 'epoch': 1.31} {'loss': 0.3823, 'learning_rate': 5.62124829500017e-06, 'epoch': 1.31} {'loss': 0.2927, 'learning_rate': 5.620946241538936e-06, 'epoch': 1.31} {'loss': 0.295, 'learning_rate': 5.620644193020824e-06, 'epoch': 1.31} {'loss': 0.2409, 'learning_rate': 5.620342149446172e-06, 'epoch': 1.31} {'loss': 0.434, 'learning_rate': 5.620040110815317e-06, 'epoch': 1.31} {'loss': 0.4237, 'learning_rate': 5.619738077128609e-06, 'epoch': 1.31} {'loss': 0.3181, 'learning_rate': 5.619436048386378e-06, 'epoch': 1.31} {'loss': 0.1932, 'learning_rate': 5.619134024588976e-06, 'epoch': 1.31} {'loss': 0.3321, 'learning_rate': 5.618832005736734e-06, 'epoch': 1.31} {'loss': 0.4702, 'learning_rate': 5.618529991830002e-06, 'epoch': 1.31} {'loss': 0.2237, 'learning_rate': 5.618227982869111e-06, 'epoch': 1.31} {'loss': 0.1467, 'learning_rate': 5.617925978854412e-06, 'epoch': 1.31} {'loss': 0.2226, 'learning_rate': 5.617623979786239e-06, 'epoch': 1.31} {'loss': 0.3161, 'learning_rate': 5.617321985664938e-06, 'epoch': 1.31} {'loss': 0.2884, 'learning_rate': 5.617019996490842e-06, 'epoch': 1.31} {'loss': 0.4548, 'learning_rate': 5.616718012264302e-06, 'epoch': 1.31} {'loss': 0.211, 'learning_rate': 5.616416032985654e-06, 'epoch': 1.31} {'loss': 0.2915, 'learning_rate': 5.6161140586552345e-06, 'epoch': 1.31} {'loss': 0.2691, 'learning_rate': 5.615812089273392e-06, 'epoch': 1.31} {'loss': 0.2314, 'learning_rate': 5.6155101248404605e-06, 'epoch': 1.31} {'loss': 0.3528, 'learning_rate': 5.615208165356789e-06, 'epoch': 1.31} {'loss': 0.3176, 'learning_rate': 5.614906210822708e-06, 'epoch': 1.31} {'loss': 0.2652, 'learning_rate': 5.61460426123857e-06, 'epoch': 1.31} {'loss': 0.336, 'learning_rate': 5.614302316604705e-06, 'epoch': 1.31} {'loss': 0.2485, 'learning_rate': 5.614000376921462e-06, 'epoch': 1.31} {'loss': 0.4469, 'learning_rate': 5.613698442189175e-06, 'epoch': 1.31} {'loss': 0.3635, 'learning_rate': 5.613396512408193e-06, 'epoch': 1.31} {'loss': 0.1961, 'learning_rate': 5.6130945875788475e-06, 'epoch': 1.31} {'loss': 0.2946, 'learning_rate': 5.612792667701489e-06, 'epoch': 1.31} {'loss': 0.3348, 'learning_rate': 5.612490752776452e-06, 'epoch': 1.31} {'loss': 0.4499, 'learning_rate': 5.612188842804076e-06, 'epoch': 1.31} {'loss': 0.3703, 'learning_rate': 5.611886937784707e-06, 'epoch': 1.31} {'loss': 0.3981, 'learning_rate': 5.61158503771868e-06, 'epoch': 1.31} {'loss': 0.4188, 'learning_rate': 5.611283142606343e-06, 'epoch': 1.31} {'loss': 0.2925, 'learning_rate': 5.610981252448028e-06, 'epoch': 1.31} {'loss': 0.3887, 'learning_rate': 5.610679367244085e-06, 'epoch': 1.31} {'loss': 0.324, 'learning_rate': 5.6103774869948465e-06, 'epoch': 1.31} {'loss': 0.3668, 'learning_rate': 5.61007561170066e-06, 'epoch': 1.31} {'loss': 0.4445, 'learning_rate': 5.609773741361861e-06, 'epoch': 1.31} {'loss': 0.3888, 'learning_rate': 5.609471875978796e-06, 'epoch': 1.31} {'loss': 0.4358, 'learning_rate': 5.609170015551799e-06, 'epoch': 1.31} {'loss': 0.3405, 'learning_rate': 5.608868160081218e-06, 'epoch': 1.31} {'loss': 0.2137, 'learning_rate': 5.608566309567389e-06, 'epoch': 1.31} {'loss': 0.3766, 'learning_rate': 5.608264464010649e-06, 'epoch': 1.31} {'loss': 0.353, 'learning_rate': 5.60796262341135e-06, 'epoch': 1.31} {'loss': 0.2889, 'learning_rate': 5.607660787769819e-06, 'epoch': 1.31} {'loss': 0.3887, 'learning_rate': 5.607358957086408e-06, 'epoch': 1.31} {'loss': 0.3086, 'learning_rate': 5.607057131361451e-06, 'epoch': 1.31} {'loss': 0.3289, 'learning_rate': 5.606755310595294e-06, 'epoch': 1.31} {'loss': 0.319, 'learning_rate': 5.6064534947882706e-06, 'epoch': 1.31} {'loss': 0.3122, 'learning_rate': 5.606151683940732e-06, 'epoch': 1.31} {'loss': 0.3526, 'learning_rate': 5.605849878053007e-06, 'epoch': 1.31} {'loss': 0.5183, 'learning_rate': 5.605548077125445e-06, 'epoch': 1.31} {'loss': 0.3974, 'learning_rate': 5.6052462811583805e-06, 'epoch': 1.31} {'loss': 0.3109, 'learning_rate': 5.604944490152162e-06, 'epoch': 1.31} {'loss': 0.3652, 'learning_rate': 5.6046427041071204e-06, 'epoch': 1.31} {'loss': 0.3346, 'learning_rate': 5.604340923023605e-06, 'epoch': 1.31} {'loss': 0.2659, 'learning_rate': 5.604039146901954e-06, 'epoch': 1.31} {'loss': 0.3748, 'learning_rate': 5.603737375742503e-06, 'epoch': 1.31} {'loss': 0.4478, 'learning_rate': 5.6034356095456e-06, 'epoch': 1.31} {'loss': 0.4029, 'learning_rate': 5.603133848311574e-06, 'epoch': 1.31} {'loss': 0.3223, 'learning_rate': 5.602832092040782e-06, 'epoch': 1.31} {'loss': 0.2852, 'learning_rate': 5.602530340733552e-06, 'epoch': 1.31} {'loss': 0.1988, 'learning_rate': 5.602228594390234e-06, 'epoch': 1.31} {'loss': 0.1941, 'learning_rate': 5.601926853011162e-06, 'epoch': 1.31} {'loss': 0.2844, 'learning_rate': 5.601625116596675e-06, 'epoch': 1.31} {'loss': 0.2512, 'learning_rate': 5.601323385147122e-06, 'epoch': 1.31} {'loss': 0.2932, 'learning_rate': 5.601021658662833e-06, 'epoch': 1.31} {'loss': 0.2116, 'learning_rate': 5.600719937144158e-06, 'epoch': 1.31} {'loss': 0.2733, 'learning_rate': 5.60041822059143e-06, 'epoch': 1.31} {'loss': 0.4667, 'learning_rate': 5.600116509004998e-06, 'epoch': 1.31} {'loss': 0.2021, 'learning_rate': 5.599814802385193e-06, 'epoch': 1.31} {'loss': 0.3457, 'learning_rate': 5.599513100732363e-06, 'epoch': 1.31} {'loss': 0.3198, 'learning_rate': 5.599211404046845e-06, 'epoch': 1.31} {'loss': 0.464, 'learning_rate': 5.598909712328981e-06, 'epoch': 1.31} {'loss': 0.3377, 'learning_rate': 5.5986080255791095e-06, 'epoch': 1.31} {'loss': 0.3437, 'learning_rate': 5.598306343797577e-06, 'epoch': 1.31} {'loss': 0.4788, 'learning_rate': 5.5980046669847175e-06, 'epoch': 1.31} {'loss': 0.3443, 'learning_rate': 5.5977029951408715e-06, 'epoch': 1.31} {'loss': 0.1971, 'learning_rate': 5.597401328266386e-06, 'epoch': 1.31} {'loss': 0.2343, 'learning_rate': 5.59709966636159e-06, 'epoch': 1.31} {'loss': 0.3543, 'learning_rate': 5.596798009426838e-06, 'epoch': 1.31} {'loss': 0.3223, 'learning_rate': 5.59649635746246e-06, 'epoch': 1.31} {'loss': 0.4103, 'learning_rate': 5.596194710468803e-06, 'epoch': 1.31} {'loss': 0.38, 'learning_rate': 5.595893068446201e-06, 'epoch': 1.31} {'loss': 0.2459, 'learning_rate': 5.595591431395002e-06, 'epoch': 1.31} {'loss': 0.2348, 'learning_rate': 5.59528979931554e-06, 'epoch': 1.31} {'loss': 0.3455, 'learning_rate': 5.59498817220816e-06, 'epoch': 1.31} {'loss': 0.5131, 'learning_rate': 5.594686550073199e-06, 'epoch': 1.31} {'loss': 0.2769, 'learning_rate': 5.594384932911001e-06, 'epoch': 1.31} {'loss': 0.3399, 'learning_rate': 5.594083320721906e-06, 'epoch': 1.31} {'loss': 0.5646, 'learning_rate': 5.59378171350625e-06, 'epoch': 1.31} {'loss': 0.2548, 'learning_rate': 5.593480111264379e-06, 'epoch': 1.31} {'loss': 0.3336, 'learning_rate': 5.593178513996628e-06, 'epoch': 1.31} {'loss': 0.3465, 'learning_rate': 5.592876921703343e-06, 'epoch': 1.31} {'loss': 0.3023, 'learning_rate': 5.59257533438486e-06, 'epoch': 1.31} {'loss': 0.3652, 'learning_rate': 5.5922737520415236e-06, 'epoch': 1.31} {'loss': 0.2182, 'learning_rate': 5.591972174673667e-06, 'epoch': 1.31} {'loss': 0.3799, 'learning_rate': 5.591670602281643e-06, 'epoch': 1.31} {'loss': 0.3681, 'learning_rate': 5.591369034865779e-06, 'epoch': 1.31} {'loss': 0.2497, 'learning_rate': 5.591067472426424e-06, 'epoch': 1.31} {'loss': 0.3741, 'learning_rate': 5.590765914963913e-06, 'epoch': 1.31} {'loss': 0.4683, 'learning_rate': 5.590464362478592e-06, 'epoch': 1.31} {'loss': 0.3577, 'learning_rate': 5.5901628149707974e-06, 'epoch': 1.31} {'loss': 0.2659, 'learning_rate': 5.5898612724408685e-06, 'epoch': 1.31} {'loss': 0.4154, 'learning_rate': 5.58955973488915e-06, 'epoch': 1.31} {'loss': 0.2771, 'learning_rate': 5.589258202315976e-06, 'epoch': 1.31} {'loss': 0.3173, 'learning_rate': 5.588956674721695e-06, 'epoch': 1.31} {'loss': 0.3439, 'learning_rate': 5.588655152106639e-06, 'epoch': 1.31} {'loss': 0.3189, 'learning_rate': 5.588353634471156e-06, 'epoch': 1.31} {'loss': 0.2396, 'learning_rate': 5.588052121815579e-06, 'epoch': 1.31} {'loss': 0.2099, 'learning_rate': 5.587750614140257e-06, 'epoch': 1.31} {'loss': 0.4124, 'learning_rate': 5.587449111445522e-06, 'epoch': 1.31} {'loss': 0.2193, 'learning_rate': 5.5871476137317205e-06, 'epoch': 1.31} {'loss': 0.2356, 'learning_rate': 5.586846120999187e-06, 'epoch': 1.31} {'loss': 0.3347, 'learning_rate': 5.586544633248269e-06, 'epoch': 1.31} {'loss': 0.173, 'learning_rate': 5.586243150479302e-06, 'epoch': 1.31} {'loss': 0.3184, 'learning_rate': 5.5859416726926245e-06, 'epoch': 1.31} {'loss': 0.1917, 'learning_rate': 5.585640199888583e-06, 'epoch': 1.31} {'loss': 0.4147, 'learning_rate': 5.585338732067509e-06, 'epoch': 1.31} {'loss': 0.2933, 'learning_rate': 5.585037269229754e-06, 'epoch': 1.31} {'loss': 0.3891, 'learning_rate': 5.584735811375648e-06, 'epoch': 1.31} {'loss': 0.4243, 'learning_rate': 5.584434358505539e-06, 'epoch': 1.31} {'loss': 0.3497, 'learning_rate': 5.584132910619759e-06, 'epoch': 1.31} {'loss': 0.3389, 'learning_rate': 5.583831467718659e-06, 'epoch': 1.31} {'loss': 0.3125, 'learning_rate': 5.583530029802568e-06, 'epoch': 1.31} {'loss': 0.3633, 'learning_rate': 5.583228596871837e-06, 'epoch': 1.31} {'loss': 0.2863, 'learning_rate': 5.582927168926797e-06, 'epoch': 1.31} {'loss': 0.5213, 'learning_rate': 5.5826257459677955e-06, 'epoch': 1.31} {'loss': 0.3227, 'learning_rate': 5.58232432799517e-06, 'epoch': 1.31} {'loss': 0.2691, 'learning_rate': 5.582022915009257e-06, 'epoch': 1.31} {'loss': 0.2755, 'learning_rate': 5.581721507010403e-06, 'epoch': 1.31} {'loss': 0.3161, 'learning_rate': 5.581420103998941e-06, 'epoch': 1.31} {'loss': 0.3381, 'learning_rate': 5.581118705975221e-06, 'epoch': 1.31} {'loss': 0.2833, 'learning_rate': 5.580817312939571e-06, 'epoch': 1.31} {'loss': 0.4559, 'learning_rate': 5.580515924892345e-06, 'epoch': 1.31} {'loss': 0.255, 'learning_rate': 5.5802145418338706e-06, 'epoch': 1.31} {'loss': 0.2954, 'learning_rate': 5.5799131637644965e-06, 'epoch': 1.31} {'loss': 0.3709, 'learning_rate': 5.579611790684558e-06, 'epoch': 1.31} {'loss': 0.3594, 'learning_rate': 5.5793104225943994e-06, 'epoch': 1.31} {'loss': 0.3192, 'learning_rate': 5.579009059494356e-06, 'epoch': 1.31} {'loss': 0.2468, 'learning_rate': 5.5787077013847735e-06, 'epoch': 1.31} {'loss': 0.2537, 'learning_rate': 5.57840634826599e-06, 'epoch': 1.31} {'loss': 0.3532, 'learning_rate': 5.578105000138341e-06, 'epoch': 1.31} {'loss': 0.1945, 'learning_rate': 5.5778036570021746e-06, 'epoch': 1.31} {'loss': 0.1357, 'learning_rate': 5.577502318857824e-06, 'epoch': 1.31} {'loss': 0.299, 'learning_rate': 5.577200985705635e-06, 'epoch': 1.31} {'loss': 0.3622, 'learning_rate': 5.57689965754594e-06, 'epoch': 1.31} {'loss': 0.2483, 'learning_rate': 5.57659833437909e-06, 'epoch': 1.31} {'loss': 0.4555, 'learning_rate': 5.5762970162054144e-06, 'epoch': 1.31} {'loss': 0.3162, 'learning_rate': 5.5759957030252634e-06, 'epoch': 1.31} {'loss': 0.3852, 'learning_rate': 5.575694394838966e-06, 'epoch': 1.31} {'loss': 0.2609, 'learning_rate': 5.5753930916468745e-06, 'epoch': 1.31} {'loss': 0.2463, 'learning_rate': 5.575091793449317e-06, 'epoch': 1.31} {'loss': 0.2631, 'learning_rate': 5.574790500246645e-06, 'epoch': 1.31} {'loss': 0.3152, 'learning_rate': 5.574489212039191e-06, 'epoch': 1.31} {'loss': 0.4701, 'learning_rate': 5.574187928827295e-06, 'epoch': 1.31} {'loss': 0.3095, 'learning_rate': 5.573886650611302e-06, 'epoch': 1.31} {'loss': 0.2854, 'learning_rate': 5.573585377391546e-06, 'epoch': 1.31} {'loss': 0.2327, 'learning_rate': 5.573284109168371e-06, 'epoch': 1.31} {'loss': 0.1798, 'learning_rate': 5.572982845942117e-06, 'epoch': 1.31} {'loss': 0.3471, 'learning_rate': 5.572681587713125e-06, 'epoch': 1.31} {'loss': 0.3059, 'learning_rate': 5.572380334481735e-06, 'epoch': 1.31} {'loss': 0.2323, 'learning_rate': 5.572079086248281e-06, 'epoch': 1.31} {'loss': 0.24, 'learning_rate': 5.571777843013113e-06, 'epoch': 1.31} {'loss': 0.4931, 'learning_rate': 5.57147660477656e-06, 'epoch': 1.31} {'loss': 0.2809, 'learning_rate': 5.571175371538974e-06, 'epoch': 1.31} {'loss': 0.3215, 'learning_rate': 5.570874143300684e-06, 'epoch': 1.31} {'loss': 0.4358, 'learning_rate': 5.570572920062038e-06, 'epoch': 1.31} {'loss': 0.3848, 'learning_rate': 5.570271701823369e-06, 'epoch': 1.31} {'loss': 0.3478, 'learning_rate': 5.569970488585026e-06, 'epoch': 1.31} {'loss': 0.2339, 'learning_rate': 5.569669280347338e-06, 'epoch': 1.31} {'loss': 0.3899, 'learning_rate': 5.569368077110657e-06, 'epoch': 1.31} {'loss': 0.3892, 'learning_rate': 5.569066878875311e-06, 'epoch': 1.31} {'loss': 0.3507, 'learning_rate': 5.568765685641652e-06, 'epoch': 1.31} {'loss': 0.3784, 'learning_rate': 5.568464497410009e-06, 'epoch': 1.31} {'loss': 0.3068, 'learning_rate': 5.56816331418073e-06, 'epoch': 1.31} {'loss': 0.338, 'learning_rate': 5.567862135954152e-06, 'epoch': 1.31} {'loss': 0.3933, 'learning_rate': 5.567560962730611e-06, 'epoch': 1.31} {'loss': 0.3131, 'learning_rate': 5.567259794510456e-06, 'epoch': 1.31} {'loss': 0.3252, 'learning_rate': 5.566958631294017e-06, 'epoch': 1.31} {'loss': 0.334, 'learning_rate': 5.566657473081643e-06, 'epoch': 1.31} {'loss': 0.3363, 'learning_rate': 5.566356319873665e-06, 'epoch': 1.31} {'loss': 0.2825, 'learning_rate': 5.566055171670433e-06, 'epoch': 1.31} {'loss': 0.208, 'learning_rate': 5.565754028472277e-06, 'epoch': 1.31} {'loss': 0.3606, 'learning_rate': 5.565452890279543e-06, 'epoch': 1.31} {'loss': 0.2782, 'learning_rate': 5.565151757092569e-06, 'epoch': 1.31} {'loss': 0.4988, 'learning_rate': 5.564850628911698e-06, 'epoch': 1.31} {'loss': 0.3287, 'learning_rate': 5.564549505737262e-06, 'epoch': 1.31} {'loss': 0.2687, 'learning_rate': 5.5642483875696105e-06, 'epoch': 1.31} {'loss': 0.3681, 'learning_rate': 5.563947274409081e-06, 'epoch': 1.31} {'loss': 0.2655, 'learning_rate': 5.563646166256006e-06, 'epoch': 1.31} {'loss': 0.3947, 'learning_rate': 5.563345063110735e-06, 'epoch': 1.31} {'loss': 0.2789, 'learning_rate': 5.5630439649736e-06, 'epoch': 1.31} {'loss': 0.4238, 'learning_rate': 5.562742871844949e-06, 'epoch': 1.31} {'loss': 0.4576, 'learning_rate': 5.562441783725112e-06, 'epoch': 1.31} {'loss': 0.3281, 'learning_rate': 5.56214070061444e-06, 'epoch': 1.31} {'loss': 0.3724, 'learning_rate': 5.561839622513263e-06, 'epoch': 1.31} {'loss': 0.3066, 'learning_rate': 5.561538549421929e-06, 'epoch': 1.31} {'loss': 0.3838, 'learning_rate': 5.561237481340769e-06, 'epoch': 1.31} {'loss': 0.3214, 'learning_rate': 5.560936418270133e-06, 'epoch': 1.31} {'loss': 0.3532, 'learning_rate': 5.5606353602103514e-06, 'epoch': 1.31} {'loss': 0.2998, 'learning_rate': 5.560334307161772e-06, 'epoch': 1.31} {'loss': 0.2122, 'learning_rate': 5.5600332591247304e-06, 'epoch': 1.31} {'loss': 0.3395, 'learning_rate': 5.559732216099565e-06, 'epoch': 1.31} {'loss': 0.3454, 'learning_rate': 5.559431178086619e-06, 'epoch': 1.31} {'loss': 0.3607, 'learning_rate': 5.559130145086229e-06, 'epoch': 1.31} {'loss': 0.2931, 'learning_rate': 5.558829117098738e-06, 'epoch': 1.31} {'loss': 0.2502, 'learning_rate': 5.558528094124482e-06, 'epoch': 1.31} {'loss': 0.2234, 'learning_rate': 5.558227076163808e-06, 'epoch': 1.31} {'loss': 0.2225, 'learning_rate': 5.557926063217046e-06, 'epoch': 1.32} {'loss': 0.392, 'learning_rate': 5.557625055284545e-06, 'epoch': 1.32} {'loss': 0.3364, 'learning_rate': 5.557324052366637e-06, 'epoch': 1.32} {'loss': 0.2969, 'learning_rate': 5.557023054463669e-06, 'epoch': 1.32} {'loss': 0.3423, 'learning_rate': 5.556722061575972e-06, 'epoch': 1.32} {'loss': 0.3353, 'learning_rate': 5.5564210737038975e-06, 'epoch': 1.32} {'loss': 0.2612, 'learning_rate': 5.5561200908477765e-06, 'epoch': 1.32} {'loss': 0.3549, 'learning_rate': 5.5558191130079464e-06, 'epoch': 1.32} {'loss': 0.2802, 'learning_rate': 5.555518140184757e-06, 'epoch': 1.32} {'loss': 0.253, 'learning_rate': 5.555217172378537e-06, 'epoch': 1.32} {'loss': 0.4614, 'learning_rate': 5.5549162095896355e-06, 'epoch': 1.32} {'loss': 0.3712, 'learning_rate': 5.554615251818386e-06, 'epoch': 1.32} {'loss': 0.4688, 'learning_rate': 5.554314299065133e-06, 'epoch': 1.32} {'loss': 0.4078, 'learning_rate': 5.554013351330212e-06, 'epoch': 1.32} {'loss': 0.2417, 'learning_rate': 5.553712408613967e-06, 'epoch': 1.32} {'loss': 0.433, 'learning_rate': 5.553411470916731e-06, 'epoch': 1.32} {'loss': 0.2519, 'learning_rate': 5.553110538238852e-06, 'epoch': 1.32} {'loss': 0.3432, 'learning_rate': 5.552809610580661e-06, 'epoch': 1.32} {'loss': 0.3822, 'learning_rate': 5.552508687942508e-06, 'epoch': 1.32} {'loss': 0.3414, 'learning_rate': 5.5522077703247245e-06, 'epoch': 1.32} {'loss': 0.2337, 'learning_rate': 5.551906857727651e-06, 'epoch': 1.32} {'loss': 0.1781, 'learning_rate': 5.551605950151632e-06, 'epoch': 1.32} {'loss': 0.2322, 'learning_rate': 5.551305047597e-06, 'epoch': 1.32} {'loss': 0.2561, 'learning_rate': 5.5510041500641025e-06, 'epoch': 1.32} {'loss': 0.254, 'learning_rate': 5.55070325755327e-06, 'epoch': 1.32} {'loss': 0.331, 'learning_rate': 5.550402370064853e-06, 'epoch': 1.32} {'loss': 0.3731, 'learning_rate': 5.550101487599182e-06, 'epoch': 1.32} {'loss': 0.3955, 'learning_rate': 5.549800610156604e-06, 'epoch': 1.32} {'loss': 0.3013, 'learning_rate': 5.549499737737449e-06, 'epoch': 1.32} {'loss': 0.3684, 'learning_rate': 5.549198870342069e-06, 'epoch': 1.32} {'loss': 0.4087, 'learning_rate': 5.548898007970791e-06, 'epoch': 1.32} {'loss': 0.2288, 'learning_rate': 5.5485971506239666e-06, 'epoch': 1.32} {'loss': 0.3535, 'learning_rate': 5.548296298301928e-06, 'epoch': 1.32} {'loss': 0.2993, 'learning_rate': 5.547995451005014e-06, 'epoch': 1.32} {'loss': 0.3338, 'learning_rate': 5.547694608733569e-06, 'epoch': 1.32} {'loss': 0.2041, 'learning_rate': 5.547393771487927e-06, 'epoch': 1.32} {'loss': 0.2847, 'learning_rate': 5.547092939268435e-06, 'epoch': 1.32} {'loss': 0.4577, 'learning_rate': 5.546792112075423e-06, 'epoch': 1.32} {'loss': 0.3779, 'learning_rate': 5.546491289909242e-06, 'epoch': 1.32} {'loss': 0.3074, 'learning_rate': 5.546190472770219e-06, 'epoch': 1.32} {'loss': 0.3386, 'learning_rate': 5.545889660658705e-06, 'epoch': 1.32} {'loss': 0.3399, 'learning_rate': 5.545588853575031e-06, 'epoch': 1.32} {'loss': 0.2784, 'learning_rate': 5.545288051519544e-06, 'epoch': 1.32} {'loss': 0.3956, 'learning_rate': 5.544987254492575e-06, 'epoch': 1.32} {'loss': 0.2789, 'learning_rate': 5.544686462494473e-06, 'epoch': 1.32} {'loss': 0.3515, 'learning_rate': 5.544385675525573e-06, 'epoch': 1.32} {'loss': 0.3917, 'learning_rate': 5.5440848935862105e-06, 'epoch': 1.32} {'loss': 0.3126, 'learning_rate': 5.543784116676732e-06, 'epoch': 1.32} {'loss': 0.2756, 'learning_rate': 5.5434833447974655e-06, 'epoch': 1.32} {'loss': 0.192, 'learning_rate': 5.543182577948767e-06, 'epoch': 1.32} {'loss': 0.434, 'learning_rate': 5.542881816130965e-06, 'epoch': 1.32} {'loss': 0.2636, 'learning_rate': 5.542581059344405e-06, 'epoch': 1.32} {'loss': 0.3572, 'learning_rate': 5.542280307589422e-06, 'epoch': 1.32} {'loss': 0.3763, 'learning_rate': 5.5419795608663555e-06, 'epoch': 1.32} {'loss': 0.3612, 'learning_rate': 5.541678819175549e-06, 'epoch': 1.32} {'loss': 0.2787, 'learning_rate': 5.5413780825173354e-06, 'epoch': 1.32} {'loss': 0.1673, 'learning_rate': 5.541077350892063e-06, 'epoch': 1.32} {'loss': 0.3038, 'learning_rate': 5.540776624300062e-06, 'epoch': 1.32} {'loss': 0.404, 'learning_rate': 5.54047590274168e-06, 'epoch': 1.32} {'loss': 0.3851, 'learning_rate': 5.540175186217247e-06, 'epoch': 1.32} {'loss': 0.1938, 'learning_rate': 5.539874474727114e-06, 'epoch': 1.32} {'loss': 0.231, 'learning_rate': 5.539573768271611e-06, 'epoch': 1.32} {'loss': 0.367, 'learning_rate': 5.539273066851084e-06, 'epoch': 1.32} {'loss': 0.3592, 'learning_rate': 5.538972370465866e-06, 'epoch': 1.32} {'loss': 0.359, 'learning_rate': 5.538671679116303e-06, 'epoch': 1.32} {'loss': 0.2116, 'learning_rate': 5.538370992802733e-06, 'epoch': 1.32} {'loss': 0.4188, 'learning_rate': 5.538070311525487e-06, 'epoch': 1.32} {'loss': 0.312, 'learning_rate': 5.537769635284917e-06, 'epoch': 1.32} {'loss': 0.3642, 'learning_rate': 5.537468964081354e-06, 'epoch': 1.32} {'loss': 0.3877, 'learning_rate': 5.537168297915141e-06, 'epoch': 1.32} {'loss': 0.3521, 'learning_rate': 5.5368676367866135e-06, 'epoch': 1.32} {'loss': 0.3114, 'learning_rate': 5.5365669806961185e-06, 'epoch': 1.32} {'loss': 0.3149, 'learning_rate': 5.5362663296439864e-06, 'epoch': 1.32} {'loss': 0.3195, 'learning_rate': 5.5359656836305645e-06, 'epoch': 1.32} {'loss': 0.1883, 'learning_rate': 5.535665042656184e-06, 'epoch': 1.32} {'loss': 0.3224, 'learning_rate': 5.535364406721193e-06, 'epoch': 1.32} {'loss': 0.342, 'learning_rate': 5.5350637758259225e-06, 'epoch': 1.32} {'loss': 0.3057, 'learning_rate': 5.534763149970721e-06, 'epoch': 1.32} {'loss': 0.5156, 'learning_rate': 5.534462529155922e-06, 'epoch': 1.32} {'loss': 0.3031, 'learning_rate': 5.534161913381862e-06, 'epoch': 1.32} {'loss': 0.2912, 'learning_rate': 5.533861302648887e-06, 'epoch': 1.32} {'loss': 0.3301, 'learning_rate': 5.53356069695733e-06, 'epoch': 1.32} {'loss': 0.2626, 'learning_rate': 5.5332600963075375e-06, 'epoch': 1.32} {'loss': 0.2711, 'learning_rate': 5.53295950069984e-06, 'epoch': 1.32} {'loss': 0.2132, 'learning_rate': 5.532658910134587e-06, 'epoch': 1.32} {'loss': 0.3712, 'learning_rate': 5.532358324612108e-06, 'epoch': 1.32} {'loss': 0.2818, 'learning_rate': 5.532057744132752e-06, 'epoch': 1.32} {'loss': 0.4756, 'learning_rate': 5.531757168696849e-06, 'epoch': 1.32} {'loss': 0.4369, 'learning_rate': 5.531456598304745e-06, 'epoch': 1.32} {'loss': 0.3273, 'learning_rate': 5.531156032956774e-06, 'epoch': 1.32} {'loss': 0.2409, 'learning_rate': 5.530855472653282e-06, 'epoch': 1.32} {'loss': 0.2725, 'learning_rate': 5.530554917394604e-06, 'epoch': 1.32} {'loss': 0.4199, 'learning_rate': 5.530254367181076e-06, 'epoch': 1.32} {'loss': 0.3652, 'learning_rate': 5.5299538220130434e-06, 'epoch': 1.32} {'loss': 0.3088, 'learning_rate': 5.529653281890841e-06, 'epoch': 1.32} {'loss': 0.2087, 'learning_rate': 5.529352746814814e-06, 'epoch': 1.32} {'loss': 0.3899, 'learning_rate': 5.5290522167852915e-06, 'epoch': 1.32} {'loss': 0.3419, 'learning_rate': 5.528751691802623e-06, 'epoch': 1.32} {'loss': 0.3433, 'learning_rate': 5.528451171867142e-06, 'epoch': 1.32} {'loss': 0.3323, 'learning_rate': 5.528150656979191e-06, 'epoch': 1.32} {'loss': 0.4249, 'learning_rate': 5.5278501471391046e-06, 'epoch': 1.32} {'loss': 0.2794, 'learning_rate': 5.527549642347229e-06, 'epoch': 1.32} {'loss': 0.2677, 'learning_rate': 5.527249142603895e-06, 'epoch': 1.32} {'loss': 0.259, 'learning_rate': 5.52694864790945e-06, 'epoch': 1.32} {'loss': 0.2612, 'learning_rate': 5.5266481582642295e-06, 'epoch': 1.32} {'loss': 0.2506, 'learning_rate': 5.526347673668569e-06, 'epoch': 1.32} {'loss': 0.266, 'learning_rate': 5.5260471941228155e-06, 'epoch': 1.32} {'loss': 0.2779, 'learning_rate': 5.5257467196273e-06, 'epoch': 1.32} {'loss': 0.2442, 'learning_rate': 5.525446250182369e-06, 'epoch': 1.32} {'loss': 0.356, 'learning_rate': 5.525145785788355e-06, 'epoch': 1.32} {'loss': 0.443, 'learning_rate': 5.524845326445602e-06, 'epoch': 1.32} {'loss': 0.3995, 'learning_rate': 5.524544872154447e-06, 'epoch': 1.32} {'loss': 0.2764, 'learning_rate': 5.524244422915233e-06, 'epoch': 1.32} {'loss': 0.4334, 'learning_rate': 5.52394397872829e-06, 'epoch': 1.32} {'loss': 0.2886, 'learning_rate': 5.523643539593969e-06, 'epoch': 1.32} {'loss': 0.4099, 'learning_rate': 5.5233431055126e-06, 'epoch': 1.32} {'loss': 0.2123, 'learning_rate': 5.523042676484527e-06, 'epoch': 1.32} {'loss': 0.2147, 'learning_rate': 5.522742252510088e-06, 'epoch': 1.32} {'loss': 0.3453, 'learning_rate': 5.522441833589618e-06, 'epoch': 1.32} {'loss': 0.3173, 'learning_rate': 5.522141419723463e-06, 'epoch': 1.32} {'loss': 0.2977, 'learning_rate': 5.521841010911957e-06, 'epoch': 1.32} {'loss': 0.4189, 'learning_rate': 5.521540607155443e-06, 'epoch': 1.32} {'loss': 0.3982, 'learning_rate': 5.521240208454255e-06, 'epoch': 1.32} {'loss': 0.3136, 'learning_rate': 5.520939814808739e-06, 'epoch': 1.32} {'loss': 0.347, 'learning_rate': 5.5206394262192255e-06, 'epoch': 1.32} {'loss': 0.3572, 'learning_rate': 5.520339042686062e-06, 'epoch': 1.32} {'loss': 0.2071, 'learning_rate': 5.5200386642095815e-06, 'epoch': 1.32} {'loss': 0.3778, 'learning_rate': 5.519738290790129e-06, 'epoch': 1.32} {'loss': 0.2909, 'learning_rate': 5.5194379224280356e-06, 'epoch': 1.32} {'loss': 0.354, 'learning_rate': 5.519137559123649e-06, 'epoch': 1.32} {'loss': 0.2907, 'learning_rate': 5.518837200877301e-06, 'epoch': 1.32} {'loss': 0.2994, 'learning_rate': 5.518536847689335e-06, 'epoch': 1.32} {'loss': 0.2921, 'learning_rate': 5.51823649956009e-06, 'epoch': 1.32} {'loss': 0.4027, 'learning_rate': 5.5179361564899006e-06, 'epoch': 1.32} {'loss': 0.3939, 'learning_rate': 5.517635818479112e-06, 'epoch': 1.32} {'loss': 0.408, 'learning_rate': 5.517335485528057e-06, 'epoch': 1.32} {'loss': 0.2472, 'learning_rate': 5.517035157637081e-06, 'epoch': 1.32} {'loss': 0.4082, 'learning_rate': 5.516734834806517e-06, 'epoch': 1.32} {'loss': 0.3638, 'learning_rate': 5.516434517036709e-06, 'epoch': 1.32} {'loss': 0.3589, 'learning_rate': 5.516134204327991e-06, 'epoch': 1.32} {'loss': 0.3173, 'learning_rate': 5.515833896680709e-06, 'epoch': 1.32} {'loss': 0.1837, 'learning_rate': 5.515533594095193e-06, 'epoch': 1.32} {'loss': 0.3277, 'learning_rate': 5.515233296571791e-06, 'epoch': 1.32} {'loss': 0.4075, 'learning_rate': 5.514933004110834e-06, 'epoch': 1.32} {'loss': 0.4293, 'learning_rate': 5.514632716712669e-06, 'epoch': 1.32} {'loss': 0.3316, 'learning_rate': 5.5143324343776314e-06, 'epoch': 1.32} {'loss': 0.3002, 'learning_rate': 5.514032157106055e-06, 'epoch': 1.32} {'loss': 0.3638, 'learning_rate': 5.5137318848982855e-06, 'epoch': 1.32} {'loss': 0.4003, 'learning_rate': 5.513431617754654e-06, 'epoch': 1.32} {'loss': 0.4182, 'learning_rate': 5.5131313556755114e-06, 'epoch': 1.32} {'loss': 0.3659, 'learning_rate': 5.512831098661188e-06, 'epoch': 1.32} {'loss': 0.3697, 'learning_rate': 5.512530846712027e-06, 'epoch': 1.32} {'loss': 0.2234, 'learning_rate': 5.512230599828368e-06, 'epoch': 1.32} {'loss': 0.3467, 'learning_rate': 5.5119303580105395e-06, 'epoch': 1.32} {'loss': 0.3857, 'learning_rate': 5.511630121258895e-06, 'epoch': 1.32} {'loss': 0.4963, 'learning_rate': 5.511329889573762e-06, 'epoch': 1.32} {'loss': 0.3265, 'learning_rate': 5.5110296629554875e-06, 'epoch': 1.32} {'loss': 0.3416, 'learning_rate': 5.510729441404403e-06, 'epoch': 1.32} {'loss': 0.4763, 'learning_rate': 5.510429224920857e-06, 'epoch': 1.32} {'loss': 0.3185, 'learning_rate': 5.5101290135051765e-06, 'epoch': 1.32} {'loss': 0.2375, 'learning_rate': 5.509828807157711e-06, 'epoch': 1.32} {'loss': 0.2667, 'learning_rate': 5.5095286058787914e-06, 'epoch': 1.32} {'loss': 0.3674, 'learning_rate': 5.509228409668763e-06, 'epoch': 1.32} {'loss': 0.3573, 'learning_rate': 5.50892821852796e-06, 'epoch': 1.32} {'loss': 0.3881, 'learning_rate': 5.508628032456725e-06, 'epoch': 1.32} {'loss': 0.2912, 'learning_rate': 5.508327851455395e-06, 'epoch': 1.32} {'loss': 0.3211, 'learning_rate': 5.508027675524306e-06, 'epoch': 1.32} {'loss': 0.3105, 'learning_rate': 5.507727504663802e-06, 'epoch': 1.32} {'loss': 0.3859, 'learning_rate': 5.5074273388742175e-06, 'epoch': 1.32} {'loss': 0.3297, 'learning_rate': 5.507127178155896e-06, 'epoch': 1.32} {'loss': 0.3117, 'learning_rate': 5.506827022509169e-06, 'epoch': 1.32} {'loss': 0.4638, 'learning_rate': 5.506526871934385e-06, 'epoch': 1.32} {'loss': 0.4345, 'learning_rate': 5.506226726431874e-06, 'epoch': 1.32} {'loss': 0.2651, 'learning_rate': 5.505926586001981e-06, 'epoch': 1.32} {'loss': 0.2911, 'learning_rate': 5.505626450645039e-06, 'epoch': 1.32} {'loss': 0.4023, 'learning_rate': 5.505326320361393e-06, 'epoch': 1.32} {'loss': 0.2149, 'learning_rate': 5.505026195151376e-06, 'epoch': 1.32} {'loss': 0.2569, 'learning_rate': 5.5047260750153345e-06, 'epoch': 1.32} {'loss': 0.4093, 'learning_rate': 5.504425959953601e-06, 'epoch': 1.32} {'loss': 0.1968, 'learning_rate': 5.5041258499665125e-06, 'epoch': 1.32} {'loss': 0.4978, 'learning_rate': 5.5038257450544145e-06, 'epoch': 1.32} {'loss': 0.215, 'learning_rate': 5.503525645217638e-06, 'epoch': 1.32} {'loss': 0.3246, 'learning_rate': 5.50322555045653e-06, 'epoch': 1.32} {'loss': 0.4008, 'learning_rate': 5.5029254607714224e-06, 'epoch': 1.32} {'loss': 0.3784, 'learning_rate': 5.50262537616266e-06, 'epoch': 1.32} {'loss': 0.1875, 'learning_rate': 5.5023252966305755e-06, 'epoch': 1.32} {'loss': 0.269, 'learning_rate': 5.502025222175513e-06, 'epoch': 1.32} {'loss': 0.137, 'learning_rate': 5.501725152797804e-06, 'epoch': 1.32} {'loss': 0.2619, 'learning_rate': 5.501425088497799e-06, 'epoch': 1.32} {'loss': 0.5036, 'learning_rate': 5.5011250292758225e-06, 'epoch': 1.32} {'loss': 0.3242, 'learning_rate': 5.500824975132225e-06, 'epoch': 1.32} {'loss': 0.4156, 'learning_rate': 5.500524926067341e-06, 'epoch': 1.32} {'loss': 0.4816, 'learning_rate': 5.5002248820815055e-06, 'epoch': 1.32} {'loss': 0.4057, 'learning_rate': 5.499924843175064e-06, 'epoch': 1.32} {'loss': 0.4367, 'learning_rate': 5.499624809348347e-06, 'epoch': 1.32} {'loss': 0.3501, 'learning_rate': 5.499324780601702e-06, 'epoch': 1.32} {'loss': 0.3951, 'learning_rate': 5.49902475693546e-06, 'epoch': 1.32} {'loss': 0.204, 'learning_rate': 5.498724738349966e-06, 'epoch': 1.32} {'loss': 0.2185, 'learning_rate': 5.498424724845552e-06, 'epoch': 1.32} {'loss': 0.1998, 'learning_rate': 5.498124716422566e-06, 'epoch': 1.32} {'loss': 0.2897, 'learning_rate': 5.497824713081337e-06, 'epoch': 1.32} {'loss': 0.3208, 'learning_rate': 5.49752471482221e-06, 'epoch': 1.32} {'loss': 0.4964, 'learning_rate': 5.497224721645518e-06, 'epoch': 1.32} {'loss': 0.3539, 'learning_rate': 5.496924733551607e-06, 'epoch': 1.32} {'loss': 0.3648, 'learning_rate': 5.496624750540813e-06, 'epoch': 1.32} {'loss': 0.3774, 'learning_rate': 5.4963247726134686e-06, 'epoch': 1.32} {'loss': 0.2868, 'learning_rate': 5.496024799769921e-06, 'epoch': 1.32} {'loss': 0.3719, 'learning_rate': 5.495724832010501e-06, 'epoch': 1.32} {'loss': 0.2818, 'learning_rate': 5.495424869335555e-06, 'epoch': 1.32} {'loss': 0.3004, 'learning_rate': 5.495124911745413e-06, 'epoch': 1.32} {'loss': 0.3305, 'learning_rate': 5.4948249592404234e-06, 'epoch': 1.32} {'loss': 0.3172, 'learning_rate': 5.4945250118209145e-06, 'epoch': 1.32} {'loss': 0.4155, 'learning_rate': 5.494225069487235e-06, 'epoch': 1.32} {'loss': 0.366, 'learning_rate': 5.493925132239715e-06, 'epoch': 1.32} {'loss': 0.1749, 'learning_rate': 5.4936252000787005e-06, 'epoch': 1.32} {'loss': 0.3015, 'learning_rate': 5.4933252730045215e-06, 'epoch': 1.32} {'loss': 0.3172, 'learning_rate': 5.493025351017527e-06, 'epoch': 1.32} {'loss': 0.1852, 'learning_rate': 5.492725434118047e-06, 'epoch': 1.32} {'loss': 0.293, 'learning_rate': 5.492425522306422e-06, 'epoch': 1.32} {'loss': 0.4921, 'learning_rate': 5.492125615582993e-06, 'epoch': 1.32} {'loss': 0.3383, 'learning_rate': 5.491825713948093e-06, 'epoch': 1.32} {'loss': 0.2768, 'learning_rate': 5.49152581740207e-06, 'epoch': 1.32} {'loss': 0.2839, 'learning_rate': 5.491225925945252e-06, 'epoch': 1.32} {'loss': 0.2516, 'learning_rate': 5.490926039577988e-06, 'epoch': 1.32} {'loss': 0.3755, 'learning_rate': 5.490626158300605e-06, 'epoch': 1.32} {'loss': 0.3195, 'learning_rate': 5.4903262821134525e-06, 'epoch': 1.32} {'loss': 0.4313, 'learning_rate': 5.49002641101686e-06, 'epoch': 1.32} {'loss': 0.3556, 'learning_rate': 5.489726545011175e-06, 'epoch': 1.32} {'loss': 0.3033, 'learning_rate': 5.489426684096726e-06, 'epoch': 1.32} {'loss': 0.244, 'learning_rate': 5.489126828273861e-06, 'epoch': 1.32} {'loss': 0.2127, 'learning_rate': 5.488826977542914e-06, 'epoch': 1.32} {'loss': 0.3663, 'learning_rate': 5.48852713190422e-06, 'epoch': 1.32} {'loss': 0.4048, 'learning_rate': 5.488227291358123e-06, 'epoch': 1.32} {'loss': 0.2752, 'learning_rate': 5.487927455904958e-06, 'epoch': 1.32} {'loss': 0.2552, 'learning_rate': 5.487627625545067e-06, 'epoch': 1.32} {'loss': 0.1699, 'learning_rate': 5.487327800278783e-06, 'epoch': 1.32} {'loss': 0.247, 'learning_rate': 5.487027980106452e-06, 'epoch': 1.32} {'loss': 0.3355, 'learning_rate': 5.4867281650284035e-06, 'epoch': 1.32} {'loss': 0.4085, 'learning_rate': 5.486428355044986e-06, 'epoch': 1.32} {'loss': 0.3579, 'learning_rate': 5.486128550156526e-06, 'epoch': 1.32} {'loss': 0.406, 'learning_rate': 5.485828750363376e-06, 'epoch': 1.32} {'loss': 0.403, 'learning_rate': 5.485528955665861e-06, 'epoch': 1.32} {'loss': 0.4221, 'learning_rate': 5.485229166064329e-06, 'epoch': 1.32} {'loss': 0.3514, 'learning_rate': 5.484929381559115e-06, 'epoch': 1.32} {'loss': 0.4288, 'learning_rate': 5.484629602150554e-06, 'epoch': 1.32} {'loss': 0.3029, 'learning_rate': 5.48432982783899e-06, 'epoch': 1.32} {'loss': 0.2952, 'learning_rate': 5.484030058624756e-06, 'epoch': 1.32} {'loss': 0.3093, 'learning_rate': 5.483730294508194e-06, 'epoch': 1.32} {'loss': 0.2154, 'learning_rate': 5.483430535489641e-06, 'epoch': 1.32} {'loss': 0.3155, 'learning_rate': 5.48313078156944e-06, 'epoch': 1.32} {'loss': 0.2846, 'learning_rate': 5.482831032747922e-06, 'epoch': 1.32} {'loss': 0.206, 'learning_rate': 5.482531289025432e-06, 'epoch': 1.32} {'loss': 0.396, 'learning_rate': 5.482231550402305e-06, 'epoch': 1.32} {'loss': 0.3027, 'learning_rate': 5.481931816878876e-06, 'epoch': 1.32} {'loss': 0.4611, 'learning_rate': 5.481632088455491e-06, 'epoch': 1.32} {'loss': 0.305, 'learning_rate': 5.481332365132479e-06, 'epoch': 1.32} {'loss': 0.256, 'learning_rate': 5.481032646910189e-06, 'epoch': 1.32} {'loss': 0.4823, 'learning_rate': 5.480732933788948e-06, 'epoch': 1.32} {'loss': 0.3001, 'learning_rate': 5.4804332257691066e-06, 'epoch': 1.32} {'loss': 0.2392, 'learning_rate': 5.48013352285099e-06, 'epoch': 1.32} {'loss': 0.3502, 'learning_rate': 5.479833825034949e-06, 'epoch': 1.32} {'loss': 0.4455, 'learning_rate': 5.479534132321311e-06, 'epoch': 1.32} {'loss': 0.3996, 'learning_rate': 5.479234444710424e-06, 'epoch': 1.32} {'loss': 0.4309, 'learning_rate': 5.478934762202618e-06, 'epoch': 1.32} {'loss': 0.4256, 'learning_rate': 5.478635084798238e-06, 'epoch': 1.32} {'loss': 0.3892, 'learning_rate': 5.47833541249762e-06, 'epoch': 1.32} {'loss': 0.3689, 'learning_rate': 5.478035745301098e-06, 'epoch': 1.32} {'loss': 0.3209, 'learning_rate': 5.477736083209016e-06, 'epoch': 1.32} {'loss': 0.2782, 'learning_rate': 5.4774364262217075e-06, 'epoch': 1.32} {'loss': 0.2386, 'learning_rate': 5.4771367743395165e-06, 'epoch': 1.32} {'loss': 0.2995, 'learning_rate': 5.476837127562775e-06, 'epoch': 1.32} {'loss': 0.2826, 'learning_rate': 5.476537485891826e-06, 'epoch': 1.32} {'loss': 0.3568, 'learning_rate': 5.4762378493270044e-06, 'epoch': 1.32} {'loss': 0.2803, 'learning_rate': 5.475938217868653e-06, 'epoch': 1.32} {'loss': 0.4176, 'learning_rate': 5.475638591517103e-06, 'epoch': 1.32} {'loss': 0.3567, 'learning_rate': 5.475338970272701e-06, 'epoch': 1.32} {'loss': 0.3242, 'learning_rate': 5.475039354135777e-06, 'epoch': 1.32} {'loss': 0.2775, 'learning_rate': 5.474739743106676e-06, 'epoch': 1.32} {'loss': 0.3402, 'learning_rate': 5.474440137185735e-06, 'epoch': 1.32} {'loss': 0.2967, 'learning_rate': 5.474140536373286e-06, 'epoch': 1.32} {'loss': 0.3262, 'learning_rate': 5.473840940669674e-06, 'epoch': 1.32} {'loss': 0.42, 'learning_rate': 5.473541350075233e-06, 'epoch': 1.32} {'loss': 0.2726, 'learning_rate': 5.473241764590307e-06, 'epoch': 1.32} {'loss': 0.3192, 'learning_rate': 5.472942184215226e-06, 'epoch': 1.32} {'loss': 0.2628, 'learning_rate': 5.472642608950336e-06, 'epoch': 1.32} {'loss': 0.2421, 'learning_rate': 5.472343038795968e-06, 'epoch': 1.32} {'loss': 0.2862, 'learning_rate': 5.472043473752467e-06, 'epoch': 1.32} {'loss': 0.4982, 'learning_rate': 5.471743913820164e-06, 'epoch': 1.32} {'loss': 0.2853, 'learning_rate': 5.471444358999405e-06, 'epoch': 1.32} {'loss': 0.3823, 'learning_rate': 5.471144809290521e-06, 'epoch': 1.32} {'loss': 0.2378, 'learning_rate': 5.470845264693856e-06, 'epoch': 1.32} {'loss': 0.2794, 'learning_rate': 5.470545725209746e-06, 'epoch': 1.32} {'loss': 0.346, 'learning_rate': 5.470246190838525e-06, 'epoch': 1.32} {'loss': 0.3157, 'learning_rate': 5.469946661580538e-06, 'epoch': 1.32} {'loss': 0.4979, 'learning_rate': 5.469647137436117e-06, 'epoch': 1.32} {'loss': 0.278, 'learning_rate': 5.469347618405606e-06, 'epoch': 1.32} {'loss': 0.3217, 'learning_rate': 5.4690481044893365e-06, 'epoch': 1.32} {'loss': 0.227, 'learning_rate': 5.468748595687654e-06, 'epoch': 1.32} {'loss': 0.2814, 'learning_rate': 5.468449092000887e-06, 'epoch': 1.32} {'loss': 0.3012, 'learning_rate': 5.468149593429386e-06, 'epoch': 1.32} {'loss': 0.2896, 'learning_rate': 5.4678500999734765e-06, 'epoch': 1.32} {'loss': 0.2752, 'learning_rate': 5.4675506116335074e-06, 'epoch': 1.32} {'loss': 0.2782, 'learning_rate': 5.467251128409807e-06, 'epoch': 1.32} {'loss': 0.2789, 'learning_rate': 5.466951650302722e-06, 'epoch': 1.32} {'loss': 0.3256, 'learning_rate': 5.466652177312587e-06, 'epoch': 1.32} {'loss': 0.2985, 'learning_rate': 5.466352709439735e-06, 'epoch': 1.32} {'loss': 0.3518, 'learning_rate': 5.466053246684514e-06, 'epoch': 1.32} {'loss': 0.2098, 'learning_rate': 5.465753789047252e-06, 'epoch': 1.32} {'loss': 0.2956, 'learning_rate': 5.465454336528295e-06, 'epoch': 1.32} {'loss': 0.2371, 'learning_rate': 5.465154889127975e-06, 'epoch': 1.32} {'loss': 0.4986, 'learning_rate': 5.464855446846638e-06, 'epoch': 1.32} {'loss': 0.3185, 'learning_rate': 5.4645560096846094e-06, 'epoch': 1.32} {'loss': 0.4323, 'learning_rate': 5.4642565776422406e-06, 'epoch': 1.32} {'loss': 0.1212, 'learning_rate': 5.46395715071986e-06, 'epoch': 1.32} {'loss': 0.4011, 'learning_rate': 5.4636577289178126e-06, 'epoch': 1.32} {'loss': 0.3233, 'learning_rate': 5.4633583122364285e-06, 'epoch': 1.32} {'loss': 0.4226, 'learning_rate': 5.463058900676055e-06, 'epoch': 1.32} {'loss': 0.3394, 'learning_rate': 5.462759494237025e-06, 'epoch': 1.32} {'loss': 0.25, 'learning_rate': 5.462460092919672e-06, 'epoch': 1.32} {'loss': 0.327, 'learning_rate': 5.462160696724343e-06, 'epoch': 1.32} {'loss': 0.2822, 'learning_rate': 5.461861305651368e-06, 'epoch': 1.32} {'loss': 0.2601, 'learning_rate': 5.4615619197010925e-06, 'epoch': 1.32} {'loss': 0.3099, 'learning_rate': 5.4612625388738474e-06, 'epoch': 1.32} {'loss': 0.2804, 'learning_rate': 5.460963163169977e-06, 'epoch': 1.32} {'loss': 0.2087, 'learning_rate': 5.460663792589812e-06, 'epoch': 1.32} {'loss': 0.2495, 'learning_rate': 5.460364427133698e-06, 'epoch': 1.32} {'loss': 0.3694, 'learning_rate': 5.460065066801967e-06, 'epoch': 1.32} {'loss': 0.2509, 'learning_rate': 5.459765711594962e-06, 'epoch': 1.32} {'loss': 0.3475, 'learning_rate': 5.459466361513014e-06, 'epoch': 1.32} {'loss': 0.3693, 'learning_rate': 5.459167016556469e-06, 'epoch': 1.32} {'loss': 0.2447, 'learning_rate': 5.458867676725661e-06, 'epoch': 1.32} {'loss': 0.3083, 'learning_rate': 5.4585683420209245e-06, 'epoch': 1.32} {'loss': 0.4217, 'learning_rate': 5.458269012442605e-06, 'epoch': 1.32} {'loss': 0.3593, 'learning_rate': 5.457969687991032e-06, 'epoch': 1.32} {'loss': 0.2447, 'learning_rate': 5.45767036866655e-06, 'epoch': 1.32} {'loss': 0.2641, 'learning_rate': 5.457371054469492e-06, 'epoch': 1.32} {'loss': 0.3449, 'learning_rate': 5.457071745400201e-06, 'epoch': 1.32} {'loss': 0.3535, 'learning_rate': 5.456772441459008e-06, 'epoch': 1.32} {'loss': 0.2094, 'learning_rate': 5.45647314264626e-06, 'epoch': 1.32} {'loss': 0.381, 'learning_rate': 5.4561738489622866e-06, 'epoch': 1.32} {'loss': 0.4049, 'learning_rate': 5.455874560407431e-06, 'epoch': 1.32} {'loss': 0.4098, 'learning_rate': 5.455575276982026e-06, 'epoch': 1.32} {'loss': 0.3539, 'learning_rate': 5.455275998686416e-06, 'epoch': 1.32} {'loss': 0.3493, 'learning_rate': 5.454976725520935e-06, 'epoch': 1.32} {'loss': 0.2236, 'learning_rate': 5.454677457485918e-06, 'epoch': 1.32} {'loss': 0.2785, 'learning_rate': 5.4543781945817085e-06, 'epoch': 1.32} {'loss': 0.3491, 'learning_rate': 5.454078936808636e-06, 'epoch': 1.32} {'loss': 0.3671, 'learning_rate': 5.453779684167049e-06, 'epoch': 1.32} {'loss': 0.398, 'learning_rate': 5.4534804366572765e-06, 'epoch': 1.32} {'loss': 0.2639, 'learning_rate': 5.4531811942796665e-06, 'epoch': 1.32} {'loss': 0.3238, 'learning_rate': 5.452881957034548e-06, 'epoch': 1.32} {'loss': 0.3928, 'learning_rate': 5.452582724922258e-06, 'epoch': 1.32} {'loss': 0.2973, 'learning_rate': 5.452283497943141e-06, 'epoch': 1.32} {'loss': 0.2885, 'learning_rate': 5.451984276097528e-06, 'epoch': 1.32} {'loss': 0.3741, 'learning_rate': 5.4516850593857625e-06, 'epoch': 1.32} {'loss': 0.1885, 'learning_rate': 5.451385847808177e-06, 'epoch': 1.32} {'loss': 0.4957, 'learning_rate': 5.451086641365116e-06, 'epoch': 1.32} {'loss': 0.2024, 'learning_rate': 5.4507874400569085e-06, 'epoch': 1.32} {'loss': 0.563, 'learning_rate': 5.4504882438839005e-06, 'epoch': 1.32} {'loss': 0.4222, 'learning_rate': 5.450189052846422e-06, 'epoch': 1.32} {'loss': 0.2511, 'learning_rate': 5.44988986694482e-06, 'epoch': 1.32} {'loss': 0.3563, 'learning_rate': 5.4495906861794225e-06, 'epoch': 1.32} {'loss': 0.2937, 'learning_rate': 5.449291510550576e-06, 'epoch': 1.32} {'loss': 0.3525, 'learning_rate': 5.448992340058614e-06, 'epoch': 1.32} {'loss': 0.2546, 'learning_rate': 5.44869317470387e-06, 'epoch': 1.32} {'loss': 0.2365, 'learning_rate': 5.44839401448669e-06, 'epoch': 1.32} {'loss': 0.3317, 'learning_rate': 5.448094859407404e-06, 'epoch': 1.32} {'loss': 0.303, 'learning_rate': 5.447795709466357e-06, 'epoch': 1.32} {'loss': 0.3144, 'learning_rate': 5.447496564663879e-06, 'epoch': 1.32} {'loss': 0.2949, 'learning_rate': 5.447197425000315e-06, 'epoch': 1.32} {'loss': 0.3138, 'learning_rate': 5.446898290475997e-06, 'epoch': 1.32} {'loss': 0.2275, 'learning_rate': 5.446599161091267e-06, 'epoch': 1.32} {'loss': 0.2537, 'learning_rate': 5.446300036846458e-06, 'epoch': 1.32} {'loss': 0.1798, 'learning_rate': 5.4460009177419135e-06, 'epoch': 1.32} {'loss': 0.2625, 'learning_rate': 5.445701803777965e-06, 'epoch': 1.32} {'loss': 0.3801, 'learning_rate': 5.445402694954958e-06, 'epoch': 1.32} {'loss': 0.4161, 'learning_rate': 5.445103591273222e-06, 'epoch': 1.32} {'loss': 0.2281, 'learning_rate': 5.4448044927330966e-06, 'epoch': 1.32} {'loss': 0.2644, 'learning_rate': 5.4445053993349235e-06, 'epoch': 1.32} {'loss': 0.2642, 'learning_rate': 5.444206311079034e-06, 'epoch': 1.32} {'loss': 0.3758, 'learning_rate': 5.443907227965775e-06, 'epoch': 1.32} {'loss': 0.4433, 'learning_rate': 5.443608149995472e-06, 'epoch': 1.32} {'loss': 0.188, 'learning_rate': 5.443309077168473e-06, 'epoch': 1.32} {'loss': 0.2632, 'learning_rate': 5.443010009485108e-06, 'epoch': 1.32} {'loss': 0.2212, 'learning_rate': 5.442710946945722e-06, 'epoch': 1.32} {'loss': 0.3129, 'learning_rate': 5.442411889550645e-06, 'epoch': 1.32} {'loss': 0.4605, 'learning_rate': 5.442112837300222e-06, 'epoch': 1.32} {'loss': 0.3047, 'learning_rate': 5.441813790194783e-06, 'epoch': 1.32} {'loss': 0.3408, 'learning_rate': 5.441514748234676e-06, 'epoch': 1.32} {'loss': 0.2841, 'learning_rate': 5.441215711420228e-06, 'epoch': 1.32} {'loss': 0.2391, 'learning_rate': 5.440916679751777e-06, 'epoch': 1.32} {'loss': 0.3342, 'learning_rate': 5.440617653229671e-06, 'epoch': 1.32} {'loss': 0.3242, 'learning_rate': 5.440318631854234e-06, 'epoch': 1.32} {'loss': 0.4331, 'learning_rate': 5.440019615625816e-06, 'epoch': 1.32} {'loss': 0.246, 'learning_rate': 5.439720604544743e-06, 'epoch': 1.32} {'loss': 0.4814, 'learning_rate': 5.439421598611364e-06, 'epoch': 1.32} {'loss': 0.3037, 'learning_rate': 5.439122597826005e-06, 'epoch': 1.32} {'loss': 0.2754, 'learning_rate': 5.4388236021890164e-06, 'epoch': 1.32} {'loss': 0.2591, 'learning_rate': 5.438524611700722e-06, 'epoch': 1.32} {'loss': 0.2555, 'learning_rate': 5.43822562636147e-06, 'epoch': 1.32} {'loss': 0.376, 'learning_rate': 5.43792664617159e-06, 'epoch': 1.32} {'loss': 0.3763, 'learning_rate': 5.437627671131427e-06, 'epoch': 1.32} {'loss': 0.2967, 'learning_rate': 5.4373287012413115e-06, 'epoch': 1.32} {'loss': 0.4345, 'learning_rate': 5.437029736501589e-06, 'epoch': 1.32} {'loss': 0.2268, 'learning_rate': 5.436730776912591e-06, 'epoch': 1.32} {'loss': 0.3365, 'learning_rate': 5.4364318224746525e-06, 'epoch': 1.32} {'loss': 0.2603, 'learning_rate': 5.436132873188118e-06, 'epoch': 1.32} {'loss': 0.4239, 'learning_rate': 5.435833929053318e-06, 'epoch': 1.32} {'loss': 0.3612, 'learning_rate': 5.435534990070599e-06, 'epoch': 1.32} {'loss': 0.3597, 'learning_rate': 5.4352360562402876e-06, 'epoch': 1.32} {'loss': 0.266, 'learning_rate': 5.434937127562731e-06, 'epoch': 1.32} {'loss': 0.2446, 'learning_rate': 5.4346382040382585e-06, 'epoch': 1.32} {'loss': 0.3133, 'learning_rate': 5.434339285667215e-06, 'epoch': 1.32} {'loss': 0.2751, 'learning_rate': 5.43404037244993e-06, 'epoch': 1.32} {'loss': 0.3901, 'learning_rate': 5.43374146438675e-06, 'epoch': 1.32} {'loss': 0.4258, 'learning_rate': 5.433442561478003e-06, 'epoch': 1.32} {'loss': 0.2782, 'learning_rate': 5.433143663724034e-06, 'epoch': 1.32} {'loss': 0.4076, 'learning_rate': 5.4328447711251785e-06, 'epoch': 1.32} {'loss': 0.3172, 'learning_rate': 5.432545883681769e-06, 'epoch': 1.32} {'loss': 0.324, 'learning_rate': 5.432247001394151e-06, 'epoch': 1.32} {'loss': 0.3122, 'learning_rate': 5.431948124262652e-06, 'epoch': 1.32} {'loss': 0.3503, 'learning_rate': 5.43164925228762e-06, 'epoch': 1.32} {'loss': 0.2211, 'learning_rate': 5.431350385469383e-06, 'epoch': 1.32} {'loss': 0.3635, 'learning_rate': 5.431051523808287e-06, 'epoch': 1.32} {'loss': 0.3773, 'learning_rate': 5.430752667304661e-06, 'epoch': 1.32} {'loss': 0.3511, 'learning_rate': 5.4304538159588496e-06, 'epoch': 1.32} {'loss': 0.1751, 'learning_rate': 5.430154969771184e-06, 'epoch': 1.32} {'loss': 0.3926, 'learning_rate': 5.429856128742008e-06, 'epoch': 1.32} {'loss': 0.415, 'learning_rate': 5.42955729287165e-06, 'epoch': 1.32} {'loss': 0.3472, 'learning_rate': 5.429258462160459e-06, 'epoch': 1.32} {'loss': 0.3655, 'learning_rate': 5.428959636608765e-06, 'epoch': 1.32} {'loss': 0.1942, 'learning_rate': 5.428660816216902e-06, 'epoch': 1.32} {'loss': 0.3078, 'learning_rate': 5.428362000985217e-06, 'epoch': 1.32} {'loss': 0.2752, 'learning_rate': 5.428063190914036e-06, 'epoch': 1.32} {'loss': 0.3135, 'learning_rate': 5.427764386003707e-06, 'epoch': 1.32} {'loss': 0.4211, 'learning_rate': 5.427465586254559e-06, 'epoch': 1.32} {'loss': 0.3308, 'learning_rate': 5.427166791666936e-06, 'epoch': 1.32} {'loss': 0.3241, 'learning_rate': 5.426868002241169e-06, 'epoch': 1.32} {'loss': 0.4439, 'learning_rate': 5.426569217977602e-06, 'epoch': 1.32} {'loss': 0.3635, 'learning_rate': 5.4262704388765645e-06, 'epoch': 1.32} {'loss': 0.4164, 'learning_rate': 5.425971664938403e-06, 'epoch': 1.32} {'loss': 0.2774, 'learning_rate': 5.4256728961634455e-06, 'epoch': 1.32} {'loss': 0.3209, 'learning_rate': 5.425374132552036e-06, 'epoch': 1.32} {'loss': 0.2223, 'learning_rate': 5.425075374104509e-06, 'epoch': 1.32} {'loss': 0.3603, 'learning_rate': 5.4247766208212e-06, 'epoch': 1.32} {'loss': 0.3428, 'learning_rate': 5.424477872702452e-06, 'epoch': 1.32} {'loss': 0.2712, 'learning_rate': 5.424179129748589e-06, 'epoch': 1.32} {'loss': 0.3502, 'learning_rate': 5.423880391959966e-06, 'epoch': 1.32} {'loss': 0.3641, 'learning_rate': 5.423581659336909e-06, 'epoch': 1.32} {'loss': 0.1854, 'learning_rate': 5.423282931879761e-06, 'epoch': 1.32} {'loss': 0.2428, 'learning_rate': 5.422984209588855e-06, 'epoch': 1.32} {'loss': 0.2876, 'learning_rate': 5.422685492464528e-06, 'epoch': 1.32} {'loss': 0.423, 'learning_rate': 5.422386780507121e-06, 'epoch': 1.32} {'loss': 0.287, 'learning_rate': 5.4220880737169655e-06, 'epoch': 1.32} {'loss': 0.3359, 'learning_rate': 5.4217893720944055e-06, 'epoch': 1.32} {'loss': 0.3082, 'learning_rate': 5.4214906756397714e-06, 'epoch': 1.32} {'loss': 0.4963, 'learning_rate': 5.421191984353408e-06, 'epoch': 1.32} {'loss': 0.192, 'learning_rate': 5.420893298235643e-06, 'epoch': 1.32} {'loss': 0.3212, 'learning_rate': 5.420594617286823e-06, 'epoch': 1.32} {'loss': 0.4504, 'learning_rate': 5.420295941507278e-06, 'epoch': 1.32} {'loss': 0.2784, 'learning_rate': 5.41999727089735e-06, 'epoch': 1.32} {'loss': 0.2583, 'learning_rate': 5.419698605457373e-06, 'epoch': 1.32} {'loss': 0.3841, 'learning_rate': 5.419399945187687e-06, 'epoch': 1.32} {'loss': 0.3289, 'learning_rate': 5.419101290088627e-06, 'epoch': 1.32} {'loss': 0.4046, 'learning_rate': 5.418802640160528e-06, 'epoch': 1.32} {'loss': 0.3632, 'learning_rate': 5.418503995403734e-06, 'epoch': 1.32} {'loss': 0.3956, 'learning_rate': 5.418205355818574e-06, 'epoch': 1.32} {'loss': 0.3021, 'learning_rate': 5.41790672140539e-06, 'epoch': 1.32} {'loss': 0.3218, 'learning_rate': 5.417608092164517e-06, 'epoch': 1.32} {'loss': 0.3919, 'learning_rate': 5.417309468096295e-06, 'epoch': 1.32} {'loss': 0.4295, 'learning_rate': 5.417010849201057e-06, 'epoch': 1.32} {'loss': 0.378, 'learning_rate': 5.416712235479144e-06, 'epoch': 1.32} {'loss': 0.2561, 'learning_rate': 5.41641362693089e-06, 'epoch': 1.32} {'loss': 0.2095, 'learning_rate': 5.416115023556636e-06, 'epoch': 1.32} {'loss': 0.3038, 'learning_rate': 5.415816425356712e-06, 'epoch': 1.32} {'loss': 0.378, 'learning_rate': 5.415517832331465e-06, 'epoch': 1.32} {'loss': 0.2213, 'learning_rate': 5.415219244481225e-06, 'epoch': 1.32} {'loss': 0.2858, 'learning_rate': 5.414920661806328e-06, 'epoch': 1.32} {'loss': 0.4478, 'learning_rate': 5.414622084307117e-06, 'epoch': 1.32} {'loss': 0.3831, 'learning_rate': 5.414323511983921e-06, 'epoch': 1.32} {'loss': 0.2071, 'learning_rate': 5.414024944837086e-06, 'epoch': 1.32} {'loss': 0.3728, 'learning_rate': 5.413726382866941e-06, 'epoch': 1.32} {'loss': 0.2841, 'learning_rate': 5.413427826073831e-06, 'epoch': 1.32} {'loss': 0.2153, 'learning_rate': 5.413129274458086e-06, 'epoch': 1.33} {'loss': 0.3032, 'learning_rate': 5.412830728020049e-06, 'epoch': 1.33} {'loss': 0.2215, 'learning_rate': 5.4125321867600485e-06, 'epoch': 1.33} {'loss': 0.2695, 'learning_rate': 5.412233650678433e-06, 'epoch': 1.33} {'loss': 0.271, 'learning_rate': 5.411935119775528e-06, 'epoch': 1.33} {'loss': 0.3486, 'learning_rate': 5.411636594051679e-06, 'epoch': 1.33} {'loss': 0.3029, 'learning_rate': 5.411338073507222e-06, 'epoch': 1.33} {'loss': 0.2929, 'learning_rate': 5.4110395581424854e-06, 'epoch': 1.33} {'loss': 0.3569, 'learning_rate': 5.410741047957818e-06, 'epoch': 1.33} {'loss': 0.3359, 'learning_rate': 5.410442542953547e-06, 'epoch': 1.33} {'loss': 0.2606, 'learning_rate': 5.410144043130017e-06, 'epoch': 1.33} {'loss': 0.3426, 'learning_rate': 5.409845548487558e-06, 'epoch': 1.33} {'loss': 0.222, 'learning_rate': 5.409547059026514e-06, 'epoch': 1.33} {'loss': 0.2917, 'learning_rate': 5.409248574747215e-06, 'epoch': 1.33} {'loss': 0.2561, 'learning_rate': 5.4089500956500064e-06, 'epoch': 1.33} {'loss': 0.2403, 'learning_rate': 5.408651621735215e-06, 'epoch': 1.33} {'loss': 0.5042, 'learning_rate': 5.408353153003188e-06, 'epoch': 1.33} {'loss': 0.1491, 'learning_rate': 5.4080546894542504e-06, 'epoch': 1.33} {'loss': 0.2373, 'learning_rate': 5.407756231088752e-06, 'epoch': 1.33} {'loss': 0.2835, 'learning_rate': 5.407457777907024e-06, 'epoch': 1.33} {'loss': 0.4326, 'learning_rate': 5.407159329909397e-06, 'epoch': 1.33} {'loss': 0.3573, 'learning_rate': 5.4068608870962195e-06, 'epoch': 1.33} {'loss': 0.2507, 'learning_rate': 5.406562449467817e-06, 'epoch': 1.33} {'loss': 0.3816, 'learning_rate': 5.4062640170245365e-06, 'epoch': 1.33} {'loss': 0.3156, 'learning_rate': 5.405965589766706e-06, 'epoch': 1.33} {'loss': 0.3771, 'learning_rate': 5.405667167694673e-06, 'epoch': 1.33} {'loss': 0.4915, 'learning_rate': 5.405368750808762e-06, 'epoch': 1.33} {'loss': 0.3077, 'learning_rate': 5.405070339109321e-06, 'epoch': 1.33} {'loss': 0.269, 'learning_rate': 5.404771932596678e-06, 'epoch': 1.33} {'loss': 0.2369, 'learning_rate': 5.404473531271176e-06, 'epoch': 1.33} {'loss': 0.2402, 'learning_rate': 5.404175135133148e-06, 'epoch': 1.33} {'loss': 0.4104, 'learning_rate': 5.403876744182934e-06, 'epoch': 1.33} {'loss': 0.2966, 'learning_rate': 5.403578358420869e-06, 'epoch': 1.33} {'loss': 0.3535, 'learning_rate': 5.403279977847288e-06, 'epoch': 1.33} {'loss': 0.2507, 'learning_rate': 5.402981602462532e-06, 'epoch': 1.33} {'loss': 0.2157, 'learning_rate': 5.402683232266933e-06, 'epoch': 1.33} {'loss': 0.3196, 'learning_rate': 5.402384867260834e-06, 'epoch': 1.33} {'loss': 0.2999, 'learning_rate': 5.402086507444564e-06, 'epoch': 1.33} {'loss': 0.2542, 'learning_rate': 5.4017881528184675e-06, 'epoch': 1.33} {'loss': 0.378, 'learning_rate': 5.401489803382874e-06, 'epoch': 1.33} {'loss': 0.2636, 'learning_rate': 5.401191459138129e-06, 'epoch': 1.33} {'loss': 0.3483, 'learning_rate': 5.400893120084561e-06, 'epoch': 1.33} {'loss': 0.2397, 'learning_rate': 5.400594786222511e-06, 'epoch': 1.33} {'loss': 0.3103, 'learning_rate': 5.4002964575523146e-06, 'epoch': 1.33} {'loss': 0.2968, 'learning_rate': 5.399998134074309e-06, 'epoch': 1.33} {'loss': 0.3191, 'learning_rate': 5.399699815788833e-06, 'epoch': 1.33} {'loss': 0.3625, 'learning_rate': 5.399401502696218e-06, 'epoch': 1.33} {'loss': 0.3867, 'learning_rate': 5.3991031947968065e-06, 'epoch': 1.33} {'loss': 0.3141, 'learning_rate': 5.398804892090928e-06, 'epoch': 1.33} {'loss': 0.3844, 'learning_rate': 5.398506594578929e-06, 'epoch': 1.33} {'loss': 0.1891, 'learning_rate': 5.398208302261136e-06, 'epoch': 1.33} {'loss': 0.3062, 'learning_rate': 5.397910015137896e-06, 'epoch': 1.33} {'loss': 0.3255, 'learning_rate': 5.3976117332095355e-06, 'epoch': 1.33} {'loss': 0.2981, 'learning_rate': 5.397313456476401e-06, 'epoch': 1.33} {'loss': 0.2429, 'learning_rate': 5.397015184938819e-06, 'epoch': 1.33} {'loss': 0.2789, 'learning_rate': 5.396716918597138e-06, 'epoch': 1.33} {'loss': 0.2935, 'learning_rate': 5.396418657451682e-06, 'epoch': 1.33} {'loss': 0.3384, 'learning_rate': 5.396120401502798e-06, 'epoch': 1.33} {'loss': 0.3953, 'learning_rate': 5.39582215075082e-06, 'epoch': 1.33} {'loss': 0.3454, 'learning_rate': 5.395523905196078e-06, 'epoch': 1.33} {'loss': 0.3331, 'learning_rate': 5.395225664838919e-06, 'epoch': 1.33} {'loss': 0.4761, 'learning_rate': 5.39492742967967e-06, 'epoch': 1.33} {'loss': 0.3485, 'learning_rate': 5.3946291997186724e-06, 'epoch': 1.33} {'loss': 0.3386, 'learning_rate': 5.394330974956262e-06, 'epoch': 1.33} {'loss': 0.4239, 'learning_rate': 5.394032755392782e-06, 'epoch': 1.33} {'loss': 0.3415, 'learning_rate': 5.393734541028557e-06, 'epoch': 1.33} {'loss': 0.5023, 'learning_rate': 5.393436331863935e-06, 'epoch': 1.33} {'loss': 0.3658, 'learning_rate': 5.393138127899247e-06, 'epoch': 1.33} {'loss': 0.2896, 'learning_rate': 5.392839929134825e-06, 'epoch': 1.33} {'loss': 0.2708, 'learning_rate': 5.392541735571016e-06, 'epoch': 1.33} {'loss': 0.3045, 'learning_rate': 5.392243547208147e-06, 'epoch': 1.33} {'loss': 0.3036, 'learning_rate': 5.391945364046562e-06, 'epoch': 1.33} {'loss': 0.3279, 'learning_rate': 5.391647186086593e-06, 'epoch': 1.33} {'loss': 0.2023, 'learning_rate': 5.3913490133285795e-06, 'epoch': 1.33} {'loss': 0.175, 'learning_rate': 5.391050845772853e-06, 'epoch': 1.33} {'loss': 0.2198, 'learning_rate': 5.390752683419758e-06, 'epoch': 1.33} {'loss': 0.2701, 'learning_rate': 5.3904545262696215e-06, 'epoch': 1.33} {'loss': 0.3945, 'learning_rate': 5.3901563743227916e-06, 'epoch': 1.33} {'loss': 0.2462, 'learning_rate': 5.389858227579593e-06, 'epoch': 1.33} {'loss': 0.3552, 'learning_rate': 5.389560086040373e-06, 'epoch': 1.33} {'loss': 0.3293, 'learning_rate': 5.389261949705461e-06, 'epoch': 1.33} {'loss': 0.3169, 'learning_rate': 5.388963818575192e-06, 'epoch': 1.33} {'loss': 0.2491, 'learning_rate': 5.388665692649912e-06, 'epoch': 1.33} {'loss': 0.3491, 'learning_rate': 5.388367571929946e-06, 'epoch': 1.33} {'loss': 0.3599, 'learning_rate': 5.38806945641564e-06, 'epoch': 1.33} {'loss': 0.3895, 'learning_rate': 5.387771346107322e-06, 'epoch': 1.33} {'loss': 0.2646, 'learning_rate': 5.387473241005339e-06, 'epoch': 1.33} {'loss': 0.4289, 'learning_rate': 5.387175141110017e-06, 'epoch': 1.33} {'loss': 0.4134, 'learning_rate': 5.386877046421699e-06, 'epoch': 1.33} {'loss': 0.28, 'learning_rate': 5.386578956940718e-06, 'epoch': 1.33} {'loss': 0.4335, 'learning_rate': 5.386280872667415e-06, 'epoch': 1.33} {'loss': 0.3046, 'learning_rate': 5.3859827936021205e-06, 'epoch': 1.33} {'loss': 0.2613, 'learning_rate': 5.3856847197451765e-06, 'epoch': 1.33} {'loss': 0.4567, 'learning_rate': 5.385386651096918e-06, 'epoch': 1.33} {'loss': 0.1988, 'learning_rate': 5.385088587657677e-06, 'epoch': 1.33} {'loss': 0.401, 'learning_rate': 5.384790529427797e-06, 'epoch': 1.33} {'loss': 0.4688, 'learning_rate': 5.384492476407606e-06, 'epoch': 1.33} {'loss': 0.3119, 'learning_rate': 5.38419442859745e-06, 'epoch': 1.33} {'loss': 0.3799, 'learning_rate': 5.383896385997657e-06, 'epoch': 1.33} {'loss': 0.383, 'learning_rate': 5.383598348608571e-06, 'epoch': 1.33} {'loss': 0.2269, 'learning_rate': 5.383300316430519e-06, 'epoch': 1.33} {'loss': 0.4875, 'learning_rate': 5.38300228946385e-06, 'epoch': 1.33} {'loss': 0.4566, 'learning_rate': 5.382704267708887e-06, 'epoch': 1.33} {'loss': 0.324, 'learning_rate': 5.382406251165979e-06, 'epoch': 1.33} {'loss': 0.3604, 'learning_rate': 5.382108239835451e-06, 'epoch': 1.33} {'loss': 0.2555, 'learning_rate': 5.381810233717648e-06, 'epoch': 1.33} {'loss': 0.3509, 'learning_rate': 5.381512232812905e-06, 'epoch': 1.33} {'loss': 0.2222, 'learning_rate': 5.38121423712155e-06, 'epoch': 1.33} {'loss': 0.4245, 'learning_rate': 5.3809162466439325e-06, 'epoch': 1.33} {'loss': 0.4349, 'learning_rate': 5.380618261380376e-06, 'epoch': 1.33} {'loss': 0.3054, 'learning_rate': 5.380320281331228e-06, 'epoch': 1.33} {'loss': 0.3239, 'learning_rate': 5.380022306496815e-06, 'epoch': 1.33} {'loss': 0.2424, 'learning_rate': 5.3797243368774835e-06, 'epoch': 1.33} {'loss': 0.3252, 'learning_rate': 5.379426372473561e-06, 'epoch': 1.33} {'loss': 0.2646, 'learning_rate': 5.37912841328539e-06, 'epoch': 1.33} {'loss': 0.368, 'learning_rate': 5.378830459313301e-06, 'epoch': 1.33} {'loss': 0.2621, 'learning_rate': 5.378532510557638e-06, 'epoch': 1.33} {'loss': 0.4019, 'learning_rate': 5.378234567018729e-06, 'epoch': 1.33} {'loss': 0.2675, 'learning_rate': 5.3779366286969185e-06, 'epoch': 1.33} {'loss': 0.3439, 'learning_rate': 5.377638695592537e-06, 'epoch': 1.33} {'loss': 0.3266, 'learning_rate': 5.37734076770592e-06, 'epoch': 1.33} {'loss': 0.4619, 'learning_rate': 5.37704284503741e-06, 'epoch': 1.33} {'loss': 0.5427, 'learning_rate': 5.376744927587334e-06, 'epoch': 1.33} {'loss': 0.2648, 'learning_rate': 5.37644701535604e-06, 'epoch': 1.33} {'loss': 0.2924, 'learning_rate': 5.376149108343853e-06, 'epoch': 1.33} {'loss': 0.3577, 'learning_rate': 5.375851206551119e-06, 'epoch': 1.33} {'loss': 0.3282, 'learning_rate': 5.375553309978165e-06, 'epoch': 1.33} {'loss': 0.4073, 'learning_rate': 5.3752554186253355e-06, 'epoch': 1.33} {'loss': 0.1885, 'learning_rate': 5.37495753249296e-06, 'epoch': 1.33} {'loss': 0.3015, 'learning_rate': 5.374659651581382e-06, 'epoch': 1.33} {'loss': 0.2987, 'learning_rate': 5.374361775890931e-06, 'epoch': 1.33} {'loss': 0.4655, 'learning_rate': 5.374063905421947e-06, 'epoch': 1.33} {'loss': 0.1804, 'learning_rate': 5.373766040174767e-06, 'epoch': 1.33} {'loss': 0.1952, 'learning_rate': 5.373468180149721e-06, 'epoch': 1.33} {'loss': 0.3407, 'learning_rate': 5.373170325347154e-06, 'epoch': 1.33} {'loss': 0.2859, 'learning_rate': 5.372872475767394e-06, 'epoch': 1.33} {'loss': 0.3516, 'learning_rate': 5.372574631410786e-06, 'epoch': 1.33} {'loss': 0.3084, 'learning_rate': 5.372276792277656e-06, 'epoch': 1.33} {'loss': 0.3074, 'learning_rate': 5.371978958368348e-06, 'epoch': 1.33} {'loss': 0.2904, 'learning_rate': 5.3716811296831924e-06, 'epoch': 1.33} {'loss': 0.3449, 'learning_rate': 5.371383306222535e-06, 'epoch': 1.33} {'loss': 0.2003, 'learning_rate': 5.3710854879867e-06, 'epoch': 1.33} {'loss': 0.3593, 'learning_rate': 5.370787674976032e-06, 'epoch': 1.33} {'loss': 0.3728, 'learning_rate': 5.370489867190862e-06, 'epoch': 1.33} {'loss': 0.2138, 'learning_rate': 5.370192064631534e-06, 'epoch': 1.33} {'loss': 0.2131, 'learning_rate': 5.369894267298376e-06, 'epoch': 1.33} {'loss': 0.1682, 'learning_rate': 5.369596475191725e-06, 'epoch': 1.33} {'loss': 0.4403, 'learning_rate': 5.3692986883119215e-06, 'epoch': 1.33} {'loss': 0.2725, 'learning_rate': 5.369000906659296e-06, 'epoch': 1.33} {'loss': 0.3352, 'learning_rate': 5.368703130234192e-06, 'epoch': 1.33} {'loss': 0.3416, 'learning_rate': 5.368405359036938e-06, 'epoch': 1.33} {'loss': 0.3013, 'learning_rate': 5.368107593067877e-06, 'epoch': 1.33} {'loss': 0.2758, 'learning_rate': 5.367809832327337e-06, 'epoch': 1.33} {'loss': 0.4059, 'learning_rate': 5.367512076815664e-06, 'epoch': 1.33} {'loss': 0.2524, 'learning_rate': 5.367214326533183e-06, 'epoch': 1.33} {'loss': 0.2867, 'learning_rate': 5.366916581480242e-06, 'epoch': 1.33} {'loss': 0.4492, 'learning_rate': 5.366618841657168e-06, 'epoch': 1.33} {'loss': 0.3376, 'learning_rate': 5.366321107064302e-06, 'epoch': 1.33} {'loss': 0.3446, 'learning_rate': 5.366023377701979e-06, 'epoch': 1.33} {'loss': 0.3343, 'learning_rate': 5.365725653570531e-06, 'epoch': 1.33} {'loss': 0.356, 'learning_rate': 5.365427934670301e-06, 'epoch': 1.33} {'loss': 0.3311, 'learning_rate': 5.3651302210016135e-06, 'epoch': 1.33} {'loss': 0.2452, 'learning_rate': 5.364832512564821e-06, 'epoch': 1.33} {'loss': 0.2669, 'learning_rate': 5.364534809360247e-06, 'epoch': 1.33} {'loss': 0.3387, 'learning_rate': 5.364237111388235e-06, 'epoch': 1.33} {'loss': 0.3735, 'learning_rate': 5.363939418649119e-06, 'epoch': 1.33} {'loss': 0.3504, 'learning_rate': 5.3636417311432295e-06, 'epoch': 1.33} {'loss': 0.262, 'learning_rate': 5.363344048870911e-06, 'epoch': 1.33} {'loss': 0.2017, 'learning_rate': 5.36304637183249e-06, 'epoch': 1.33} {'loss': 0.2629, 'learning_rate': 5.362748700028313e-06, 'epoch': 1.33} {'loss': 0.4337, 'learning_rate': 5.362451033458707e-06, 'epoch': 1.33} {'loss': 0.2673, 'learning_rate': 5.362153372124016e-06, 'epoch': 1.33} {'loss': 0.3083, 'learning_rate': 5.3618557160245675e-06, 'epoch': 1.33} {'loss': 0.3589, 'learning_rate': 5.361558065160706e-06, 'epoch': 1.33} {'loss': 0.2976, 'learning_rate': 5.361260419532759e-06, 'epoch': 1.33} {'loss': 0.3672, 'learning_rate': 5.360962779141072e-06, 'epoch': 1.33} {'loss': 0.2453, 'learning_rate': 5.360665143985971e-06, 'epoch': 1.33} {'loss': 0.3731, 'learning_rate': 5.360367514067802e-06, 'epoch': 1.33} {'loss': 0.1863, 'learning_rate': 5.360069889386894e-06, 'epoch': 1.33} {'loss': 0.4246, 'learning_rate': 5.359772269943582e-06, 'epoch': 1.33} {'loss': 0.4079, 'learning_rate': 5.359474655738208e-06, 'epoch': 1.33} {'loss': 0.2571, 'learning_rate': 5.359177046771101e-06, 'epoch': 1.33} {'loss': 0.3183, 'learning_rate': 5.358879443042604e-06, 'epoch': 1.33} {'loss': 0.3614, 'learning_rate': 5.358581844553047e-06, 'epoch': 1.33} {'loss': 0.4225, 'learning_rate': 5.3582842513027725e-06, 'epoch': 1.33} {'loss': 0.4416, 'learning_rate': 5.3579866632921076e-06, 'epoch': 1.33} {'loss': 0.3034, 'learning_rate': 5.357689080521395e-06, 'epoch': 1.33} {'loss': 0.3896, 'learning_rate': 5.357391502990967e-06, 'epoch': 1.33} {'loss': 0.3803, 'learning_rate': 5.357093930701165e-06, 'epoch': 1.33} {'loss': 0.4637, 'learning_rate': 5.356796363652318e-06, 'epoch': 1.33} {'loss': 0.3552, 'learning_rate': 5.356498801844768e-06, 'epoch': 1.33} {'loss': 0.345, 'learning_rate': 5.356201245278847e-06, 'epoch': 1.33} {'loss': 0.2827, 'learning_rate': 5.3559036939548895e-06, 'epoch': 1.33} {'loss': 0.3143, 'learning_rate': 5.3556061478732355e-06, 'epoch': 1.33} {'loss': 0.3016, 'learning_rate': 5.3553086070342165e-06, 'epoch': 1.33} {'loss': 0.3774, 'learning_rate': 5.355011071438174e-06, 'epoch': 1.33} {'loss': 0.2778, 'learning_rate': 5.3547135410854365e-06, 'epoch': 1.33} {'loss': 0.4583, 'learning_rate': 5.3544160159763496e-06, 'epoch': 1.33} {'loss': 0.3172, 'learning_rate': 5.3541184961112394e-06, 'epoch': 1.33} {'loss': 0.4354, 'learning_rate': 5.353820981490448e-06, 'epoch': 1.33} {'loss': 0.3718, 'learning_rate': 5.353523472114307e-06, 'epoch': 1.33} {'loss': 0.2763, 'learning_rate': 5.353225967983158e-06, 'epoch': 1.33} {'loss': 0.201, 'learning_rate': 5.352928469097329e-06, 'epoch': 1.33} {'loss': 0.3828, 'learning_rate': 5.3526309754571645e-06, 'epoch': 1.33} {'loss': 0.1991, 'learning_rate': 5.352333487062992e-06, 'epoch': 1.33} {'loss': 0.3619, 'learning_rate': 5.352036003915156e-06, 'epoch': 1.33} {'loss': 0.2912, 'learning_rate': 5.3517385260139855e-06, 'epoch': 1.33} {'loss': 0.3778, 'learning_rate': 5.351441053359815e-06, 'epoch': 1.33} {'loss': 0.5346, 'learning_rate': 5.351143585952987e-06, 'epoch': 1.33} {'loss': 0.2816, 'learning_rate': 5.350846123793831e-06, 'epoch': 1.33} {'loss': 0.2988, 'learning_rate': 5.350548666882689e-06, 'epoch': 1.33} {'loss': 0.3136, 'learning_rate': 5.350251215219891e-06, 'epoch': 1.33} {'loss': 0.3563, 'learning_rate': 5.349953768805777e-06, 'epoch': 1.33} {'loss': 0.2861, 'learning_rate': 5.349656327640677e-06, 'epoch': 1.33} {'loss': 0.4472, 'learning_rate': 5.3493588917249366e-06, 'epoch': 1.33} {'loss': 0.2915, 'learning_rate': 5.34906146105888e-06, 'epoch': 1.33} {'loss': 0.3675, 'learning_rate': 5.348764035642853e-06, 'epoch': 1.33} {'loss': 0.3191, 'learning_rate': 5.348466615477184e-06, 'epoch': 1.33} {'loss': 0.4689, 'learning_rate': 5.348169200562215e-06, 'epoch': 1.33} {'loss': 0.4789, 'learning_rate': 5.347871790898278e-06, 'epoch': 1.33} {'loss': 0.2086, 'learning_rate': 5.347574386485704e-06, 'epoch': 1.33} {'loss': 0.3444, 'learning_rate': 5.34727698732484e-06, 'epoch': 1.33} {'loss': 0.437, 'learning_rate': 5.346979593416011e-06, 'epoch': 1.33} {'loss': 0.3453, 'learning_rate': 5.34668220475956e-06, 'epoch': 1.33} {'loss': 0.342, 'learning_rate': 5.346384821355817e-06, 'epoch': 1.33} {'loss': 0.3871, 'learning_rate': 5.346087443205123e-06, 'epoch': 1.33} {'loss': 0.2409, 'learning_rate': 5.34579007030781e-06, 'epoch': 1.33} {'loss': 0.3378, 'learning_rate': 5.345492702664217e-06, 'epoch': 1.33} {'loss': 0.3517, 'learning_rate': 5.345195340274675e-06, 'epoch': 1.33} {'loss': 0.3071, 'learning_rate': 5.344897983139525e-06, 'epoch': 1.33} {'loss': 0.3687, 'learning_rate': 5.344600631259097e-06, 'epoch': 1.33} {'loss': 0.2569, 'learning_rate': 5.3443032846337325e-06, 'epoch': 1.33} {'loss': 0.3471, 'learning_rate': 5.344005943263766e-06, 'epoch': 1.33} {'loss': 0.4369, 'learning_rate': 5.343708607149526e-06, 'epoch': 1.33} {'loss': 0.3965, 'learning_rate': 5.343411276291357e-06, 'epoch': 1.33} {'loss': 0.2677, 'learning_rate': 5.343113950689589e-06, 'epoch': 1.33} {'loss': 0.3322, 'learning_rate': 5.342816630344563e-06, 'epoch': 1.33} {'loss': 0.4665, 'learning_rate': 5.342519315256607e-06, 'epoch': 1.33} {'loss': 0.2361, 'learning_rate': 5.3422220054260656e-06, 'epoch': 1.33} {'loss': 0.2653, 'learning_rate': 5.341924700853265e-06, 'epoch': 1.33} {'loss': 0.219, 'learning_rate': 5.341627401538551e-06, 'epoch': 1.33} {'loss': 0.3446, 'learning_rate': 5.341330107482247e-06, 'epoch': 1.33} {'loss': 0.2586, 'learning_rate': 5.341032818684703e-06, 'epoch': 1.33} {'loss': 0.3268, 'learning_rate': 5.340735535146242e-06, 'epoch': 1.33} {'loss': 0.3091, 'learning_rate': 5.340438256867207e-06, 'epoch': 1.33} {'loss': 0.2851, 'learning_rate': 5.3401409838479325e-06, 'epoch': 1.33} {'loss': 0.2411, 'learning_rate': 5.339843716088749e-06, 'epoch': 1.33} {'loss': 0.2929, 'learning_rate': 5.339546453589998e-06, 'epoch': 1.33} {'loss': 0.3587, 'learning_rate': 5.33924919635201e-06, 'epoch': 1.33} {'loss': 0.2897, 'learning_rate': 5.338951944375128e-06, 'epoch': 1.33} {'loss': 0.2344, 'learning_rate': 5.338654697659677e-06, 'epoch': 1.33} {'loss': 0.4168, 'learning_rate': 5.338357456206005e-06, 'epoch': 1.33} {'loss': 0.3517, 'learning_rate': 5.338060220014436e-06, 'epoch': 1.33} {'loss': 0.3874, 'learning_rate': 5.3377629890853134e-06, 'epoch': 1.33} {'loss': 0.377, 'learning_rate': 5.337465763418968e-06, 'epoch': 1.33} {'loss': 0.326, 'learning_rate': 5.337168543015738e-06, 'epoch': 1.33} {'loss': 0.3801, 'learning_rate': 5.336871327875956e-06, 'epoch': 1.33} {'loss': 0.3076, 'learning_rate': 5.336574117999964e-06, 'epoch': 1.33} {'loss': 0.3724, 'learning_rate': 5.336276913388092e-06, 'epoch': 1.33} {'loss': 0.2183, 'learning_rate': 5.335979714040673e-06, 'epoch': 1.33} {'loss': 0.3141, 'learning_rate': 5.335682519958046e-06, 'epoch': 1.33} {'loss': 0.3897, 'learning_rate': 5.3353853311405465e-06, 'epoch': 1.33} {'loss': 0.374, 'learning_rate': 5.3350881475885145e-06, 'epoch': 1.33} {'loss': 0.2751, 'learning_rate': 5.334790969302276e-06, 'epoch': 1.33} {'loss': 0.4169, 'learning_rate': 5.334493796282177e-06, 'epoch': 1.33} {'loss': 0.4576, 'learning_rate': 5.334196628528545e-06, 'epoch': 1.33} {'loss': 0.3457, 'learning_rate': 5.333899466041714e-06, 'epoch': 1.33} {'loss': 0.2433, 'learning_rate': 5.333602308822028e-06, 'epoch': 1.33} {'loss': 0.283, 'learning_rate': 5.333305156869814e-06, 'epoch': 1.33} {'loss': 0.4019, 'learning_rate': 5.333008010185414e-06, 'epoch': 1.33} {'loss': 0.2685, 'learning_rate': 5.332710868769157e-06, 'epoch': 1.33} {'loss': 0.365, 'learning_rate': 5.332413732621386e-06, 'epoch': 1.33} {'loss': 0.3947, 'learning_rate': 5.332116601742428e-06, 'epoch': 1.33} {'loss': 0.4582, 'learning_rate': 5.331819476132627e-06, 'epoch': 1.33} {'loss': 0.3928, 'learning_rate': 5.331522355792312e-06, 'epoch': 1.33} {'loss': 0.2532, 'learning_rate': 5.331225240721821e-06, 'epoch': 1.33} {'loss': 0.3211, 'learning_rate': 5.3309281309214866e-06, 'epoch': 1.33} {'loss': 0.3156, 'learning_rate': 5.33063102639165e-06, 'epoch': 1.33} {'loss': 0.2011, 'learning_rate': 5.330333927132645e-06, 'epoch': 1.33} {'loss': 0.3075, 'learning_rate': 5.3300368331447985e-06, 'epoch': 1.33} {'loss': 0.3679, 'learning_rate': 5.329739744428457e-06, 'epoch': 1.33} {'loss': 0.4092, 'learning_rate': 5.329442660983948e-06, 'epoch': 1.33} {'loss': 0.3082, 'learning_rate': 5.329145582811613e-06, 'epoch': 1.33} {'loss': 0.2434, 'learning_rate': 5.328848509911781e-06, 'epoch': 1.33} {'loss': 0.4618, 'learning_rate': 5.328551442284795e-06, 'epoch': 1.33} {'loss': 0.2471, 'learning_rate': 5.3282543799309825e-06, 'epoch': 1.33} {'loss': 0.3137, 'learning_rate': 5.327957322850685e-06, 'epoch': 1.33} {'loss': 0.2225, 'learning_rate': 5.327660271044232e-06, 'epoch': 1.33} {'loss': 0.3101, 'learning_rate': 5.3273632245119675e-06, 'epoch': 1.33} {'loss': 0.3704, 'learning_rate': 5.327066183254217e-06, 'epoch': 1.33} {'loss': 0.266, 'learning_rate': 5.326769147271322e-06, 'epoch': 1.33} {'loss': 0.2855, 'learning_rate': 5.326472116563618e-06, 'epoch': 1.33} {'loss': 0.3006, 'learning_rate': 5.3261750911314336e-06, 'epoch': 1.33} {'loss': 0.4867, 'learning_rate': 5.325878070975112e-06, 'epoch': 1.33} {'loss': 0.3672, 'learning_rate': 5.325581056094981e-06, 'epoch': 1.33} {'loss': 0.3817, 'learning_rate': 5.325284046491385e-06, 'epoch': 1.33} {'loss': 0.3244, 'learning_rate': 5.324987042164651e-06, 'epoch': 1.33} {'loss': 0.3625, 'learning_rate': 5.3246900431151215e-06, 'epoch': 1.33} {'loss': 0.4782, 'learning_rate': 5.324393049343124e-06, 'epoch': 1.33} {'loss': 0.2489, 'learning_rate': 5.324096060849e-06, 'epoch': 1.33} {'loss': 0.3339, 'learning_rate': 5.323799077633081e-06, 'epoch': 1.33} {'loss': 0.2998, 'learning_rate': 5.3235020996957055e-06, 'epoch': 1.33} {'loss': 0.2735, 'learning_rate': 5.323205127037203e-06, 'epoch': 1.33} {'loss': 0.2035, 'learning_rate': 5.3229081596579175e-06, 'epoch': 1.33} {'loss': 0.3231, 'learning_rate': 5.322611197558178e-06, 'epoch': 1.33} {'loss': 0.3503, 'learning_rate': 5.322314240738318e-06, 'epoch': 1.33} {'loss': 0.3437, 'learning_rate': 5.32201728919868e-06, 'epoch': 1.33} {'loss': 0.2156, 'learning_rate': 5.3217203429395905e-06, 'epoch': 1.33} {'loss': 0.3228, 'learning_rate': 5.3214234019613935e-06, 'epoch': 1.33} {'loss': 0.2502, 'learning_rate': 5.321126466264415e-06, 'epoch': 1.33} {'loss': 0.2378, 'learning_rate': 5.320829535848999e-06, 'epoch': 1.33} {'loss': 0.2843, 'learning_rate': 5.320532610715473e-06, 'epoch': 1.33} {'loss': 0.3422, 'learning_rate': 5.320235690864179e-06, 'epoch': 1.33} {'loss': 0.2758, 'learning_rate': 5.319938776295448e-06, 'epoch': 1.33} {'loss': 0.3798, 'learning_rate': 5.3196418670096174e-06, 'epoch': 1.33} {'loss': 0.272, 'learning_rate': 5.319344963007018e-06, 'epoch': 1.33} {'loss': 0.3318, 'learning_rate': 5.319048064287991e-06, 'epoch': 1.33} {'loss': 0.3148, 'learning_rate': 5.318751170852869e-06, 'epoch': 1.33} {'loss': 0.3479, 'learning_rate': 5.318454282701984e-06, 'epoch': 1.33} {'loss': 0.3272, 'learning_rate': 5.318157399835677e-06, 'epoch': 1.33} {'loss': 0.4064, 'learning_rate': 5.317860522254277e-06, 'epoch': 1.33} {'loss': 0.2475, 'learning_rate': 5.317563649958124e-06, 'epoch': 1.33} {'loss': 0.2773, 'learning_rate': 5.3172667829475485e-06, 'epoch': 1.33} {'loss': 0.1392, 'learning_rate': 5.316969921222892e-06, 'epoch': 1.33} {'loss': 0.2716, 'learning_rate': 5.316673064784483e-06, 'epoch': 1.33} {'loss': 0.4603, 'learning_rate': 5.316376213632662e-06, 'epoch': 1.33} {'loss': 0.3739, 'learning_rate': 5.316079367767759e-06, 'epoch': 1.33} {'loss': 0.3084, 'learning_rate': 5.3157825271901155e-06, 'epoch': 1.33} {'loss': 0.2854, 'learning_rate': 5.315485691900057e-06, 'epoch': 1.33} {'loss': 0.3709, 'learning_rate': 5.315188861897931e-06, 'epoch': 1.33} {'loss': 0.2147, 'learning_rate': 5.314892037184065e-06, 'epoch': 1.33} {'loss': 0.2324, 'learning_rate': 5.31459521775879e-06, 'epoch': 1.33} {'loss': 0.3198, 'learning_rate': 5.314298403622451e-06, 'epoch': 1.33} {'loss': 0.2962, 'learning_rate': 5.314001594775373e-06, 'epoch': 1.33} {'loss': 0.2057, 'learning_rate': 5.3137047912179015e-06, 'epoch': 1.33} {'loss': 0.3795, 'learning_rate': 5.313407992950362e-06, 'epoch': 1.33} {'loss': 0.329, 'learning_rate': 5.313111199973096e-06, 'epoch': 1.33} {'loss': 0.2702, 'learning_rate': 5.312814412286433e-06, 'epoch': 1.33} {'loss': 0.3424, 'learning_rate': 5.312517629890717e-06, 'epoch': 1.33} {'loss': 0.2899, 'learning_rate': 5.3122208527862714e-06, 'epoch': 1.33} {'loss': 0.3206, 'learning_rate': 5.311924080973441e-06, 'epoch': 1.33} {'loss': 0.2809, 'learning_rate': 5.311627314452554e-06, 'epoch': 1.33} {'loss': 0.4203, 'learning_rate': 5.311330553223951e-06, 'epoch': 1.33} {'loss': 0.2895, 'learning_rate': 5.311033797287964e-06, 'epoch': 1.33} {'loss': 0.2098, 'learning_rate': 5.310737046644925e-06, 'epoch': 1.33} {'loss': 0.4032, 'learning_rate': 5.310440301295177e-06, 'epoch': 1.33} {'loss': 0.343, 'learning_rate': 5.310143561239045e-06, 'epoch': 1.33} {'loss': 0.3274, 'learning_rate': 5.309846826476873e-06, 'epoch': 1.33} {'loss': 0.3889, 'learning_rate': 5.309550097008988e-06, 'epoch': 1.33} {'loss': 0.3248, 'learning_rate': 5.309253372835734e-06, 'epoch': 1.33} {'loss': 0.2881, 'learning_rate': 5.308956653957437e-06, 'epoch': 1.33} {'loss': 0.3662, 'learning_rate': 5.308659940374439e-06, 'epoch': 1.33} {'loss': 0.4143, 'learning_rate': 5.3083632320870685e-06, 'epoch': 1.33} {'loss': 0.3389, 'learning_rate': 5.3080665290956665e-06, 'epoch': 1.33} {'loss': 0.224, 'learning_rate': 5.3077698314005625e-06, 'epoch': 1.33} {'loss': 0.3238, 'learning_rate': 5.307473139002097e-06, 'epoch': 1.33} {'loss': 0.3202, 'learning_rate': 5.307176451900599e-06, 'epoch': 1.33} {'loss': 0.4008, 'learning_rate': 5.306879770096409e-06, 'epoch': 1.33} {'loss': 0.273, 'learning_rate': 5.306583093589861e-06, 'epoch': 1.33} {'loss': 0.27, 'learning_rate': 5.306286422381284e-06, 'epoch': 1.33} {'loss': 0.4463, 'learning_rate': 5.305989756471016e-06, 'epoch': 1.33} {'loss': 0.2356, 'learning_rate': 5.3056930958593945e-06, 'epoch': 1.33} {'loss': 0.1983, 'learning_rate': 5.305396440546755e-06, 'epoch': 1.33} {'loss': 0.2216, 'learning_rate': 5.305099790533428e-06, 'epoch': 1.33} {'loss': 0.2294, 'learning_rate': 5.304803145819752e-06, 'epoch': 1.33} {'loss': 0.2862, 'learning_rate': 5.304506506406063e-06, 'epoch': 1.33} {'loss': 0.3327, 'learning_rate': 5.304209872292688e-06, 'epoch': 1.33} {'loss': 0.2635, 'learning_rate': 5.303913243479972e-06, 'epoch': 1.33} {'loss': 0.4542, 'learning_rate': 5.3036166199682406e-06, 'epoch': 1.33} {'loss': 0.3768, 'learning_rate': 5.303320001757837e-06, 'epoch': 1.33} {'loss': 0.4226, 'learning_rate': 5.303023388849087e-06, 'epoch': 1.33} {'loss': 0.3459, 'learning_rate': 5.302726781242336e-06, 'epoch': 1.33} {'loss': 0.309, 'learning_rate': 5.302430178937907e-06, 'epoch': 1.33} {'loss': 0.3546, 'learning_rate': 5.302133581936146e-06, 'epoch': 1.33} {'loss': 0.2956, 'learning_rate': 5.301836990237381e-06, 'epoch': 1.33} {'loss': 0.2071, 'learning_rate': 5.301540403841951e-06, 'epoch': 1.33} {'loss': 0.2903, 'learning_rate': 5.301243822750184e-06, 'epoch': 1.33} {'loss': 0.295, 'learning_rate': 5.300947246962423e-06, 'epoch': 1.33} {'loss': 0.2057, 'learning_rate': 5.300650676479e-06, 'epoch': 1.33} {'loss': 0.4199, 'learning_rate': 5.3003541113002446e-06, 'epoch': 1.33} {'loss': 0.3505, 'learning_rate': 5.300057551426498e-06, 'epoch': 1.33} {'loss': 0.2835, 'learning_rate': 5.299760996858091e-06, 'epoch': 1.33} {'loss': 0.248, 'learning_rate': 5.2994644475953635e-06, 'epoch': 1.33} {'loss': 0.3218, 'learning_rate': 5.299167903638643e-06, 'epoch': 1.33} {'loss': 0.3707, 'learning_rate': 5.2988713649882715e-06, 'epoch': 1.33} {'loss': 0.2454, 'learning_rate': 5.298574831644576e-06, 'epoch': 1.33} {'loss': 0.385, 'learning_rate': 5.2982783036079e-06, 'epoch': 1.33} {'loss': 0.3703, 'learning_rate': 5.297981780878569e-06, 'epoch': 1.33} {'loss': 0.2951, 'learning_rate': 5.2976852634569265e-06, 'epoch': 1.33} {'loss': 0.361, 'learning_rate': 5.2973887513433e-06, 'epoch': 1.33} {'loss': 0.3702, 'learning_rate': 5.297092244538031e-06, 'epoch': 1.33} {'loss': 0.4103, 'learning_rate': 5.2967957430414506e-06, 'epoch': 1.33} {'loss': 0.3178, 'learning_rate': 5.29649924685389e-06, 'epoch': 1.33} {'loss': 0.4032, 'learning_rate': 5.29620275597569e-06, 'epoch': 1.33} {'loss': 0.4025, 'learning_rate': 5.295906270407179e-06, 'epoch': 1.33} {'loss': 0.1822, 'learning_rate': 5.2956097901487e-06, 'epoch': 1.33} {'loss': 0.2535, 'learning_rate': 5.295313315200578e-06, 'epoch': 1.33} {'loss': 0.3129, 'learning_rate': 5.295016845563158e-06, 'epoch': 1.33} {'loss': 0.3933, 'learning_rate': 5.294720381236764e-06, 'epoch': 1.33} {'loss': 0.5612, 'learning_rate': 5.294423922221741e-06, 'epoch': 1.33} {'loss': 0.3832, 'learning_rate': 5.294127468518414e-06, 'epoch': 1.33} {'loss': 0.3777, 'learning_rate': 5.2938310201271256e-06, 'epoch': 1.33} {'loss': 0.4003, 'learning_rate': 5.293534577048205e-06, 'epoch': 1.33} {'loss': 0.1728, 'learning_rate': 5.293238139281991e-06, 'epoch': 1.33} {'loss': 0.3772, 'learning_rate': 5.292941706828816e-06, 'epoch': 1.33} {'loss': 0.3782, 'learning_rate': 5.2926452796890126e-06, 'epoch': 1.33} {'loss': 0.2801, 'learning_rate': 5.292348857862919e-06, 'epoch': 1.33} {'loss': 0.2825, 'learning_rate': 5.292052441350867e-06, 'epoch': 1.33} {'loss': 0.3943, 'learning_rate': 5.291756030153194e-06, 'epoch': 1.33} {'loss': 0.3857, 'learning_rate': 5.291459624270231e-06, 'epoch': 1.33} {'loss': 0.2735, 'learning_rate': 5.291163223702318e-06, 'epoch': 1.33} {'loss': 0.2082, 'learning_rate': 5.290866828449783e-06, 'epoch': 1.33} {'loss': 0.3188, 'learning_rate': 5.290570438512968e-06, 'epoch': 1.33} {'loss': 0.3269, 'learning_rate': 5.290274053892197e-06, 'epoch': 1.33} {'loss': 0.2142, 'learning_rate': 5.2899776745878174e-06, 'epoch': 1.33} {'loss': 0.2883, 'learning_rate': 5.289681300600152e-06, 'epoch': 1.33} {'loss': 0.2885, 'learning_rate': 5.289384931929547e-06, 'epoch': 1.33} {'loss': 0.3231, 'learning_rate': 5.289088568576328e-06, 'epoch': 1.33} {'loss': 0.2539, 'learning_rate': 5.288792210540829e-06, 'epoch': 1.33} {'loss': 0.3671, 'learning_rate': 5.288495857823392e-06, 'epoch': 1.33} {'loss': 0.2517, 'learning_rate': 5.288199510424343e-06, 'epoch': 1.33} {'loss': 0.378, 'learning_rate': 5.287903168344025e-06, 'epoch': 1.33} {'loss': 0.3716, 'learning_rate': 5.287606831582764e-06, 'epoch': 1.33} {'loss': 0.3305, 'learning_rate': 5.287310500140903e-06, 'epoch': 1.33} {'loss': 0.191, 'learning_rate': 5.287014174018769e-06, 'epoch': 1.33} {'loss': 0.3248, 'learning_rate': 5.286717853216703e-06, 'epoch': 1.33} {'loss': 0.2688, 'learning_rate': 5.286421537735031e-06, 'epoch': 1.33} {'loss': 0.2839, 'learning_rate': 5.2861252275741e-06, 'epoch': 1.33} {'loss': 0.3754, 'learning_rate': 5.285828922734231e-06, 'epoch': 1.33} {'loss': 0.3531, 'learning_rate': 5.285532623215768e-06, 'epoch': 1.33} {'loss': 0.2432, 'learning_rate': 5.285236329019044e-06, 'epoch': 1.33} {'loss': 0.4963, 'learning_rate': 5.2849400401443865e-06, 'epoch': 1.33} {'loss': 0.3785, 'learning_rate': 5.284643756592138e-06, 'epoch': 1.33} {'loss': 0.1824, 'learning_rate': 5.284347478362628e-06, 'epoch': 1.33} {'loss': 0.353, 'learning_rate': 5.2840512054561966e-06, 'epoch': 1.33} {'loss': 0.3013, 'learning_rate': 5.283754937873171e-06, 'epoch': 1.33} {'loss': 0.3713, 'learning_rate': 5.283458675613893e-06, 'epoch': 1.33} {'loss': 0.2769, 'learning_rate': 5.283162418678688e-06, 'epoch': 1.33} {'loss': 0.289, 'learning_rate': 5.2828661670679e-06, 'epoch': 1.33} {'loss': 0.3259, 'learning_rate': 5.282569920781857e-06, 'epoch': 1.33} {'loss': 0.3756, 'learning_rate': 5.282273679820897e-06, 'epoch': 1.33} {'loss': 0.3087, 'learning_rate': 5.2819774441853515e-06, 'epoch': 1.33} {'loss': 0.309, 'learning_rate': 5.281681213875558e-06, 'epoch': 1.33} {'loss': 0.4513, 'learning_rate': 5.2813849888918504e-06, 'epoch': 1.33} {'loss': 0.3183, 'learning_rate': 5.281088769234557e-06, 'epoch': 1.33} {'loss': 0.2261, 'learning_rate': 5.2807925549040215e-06, 'epoch': 1.33} {'loss': 0.2709, 'learning_rate': 5.28049634590057e-06, 'epoch': 1.33} {'loss': 0.3795, 'learning_rate': 5.280200142224546e-06, 'epoch': 1.33} {'loss': 0.2173, 'learning_rate': 5.279903943876272e-06, 'epoch': 1.33} {'loss': 0.2395, 'learning_rate': 5.279607750856093e-06, 'epoch': 1.33} {'loss': 0.2388, 'learning_rate': 5.279311563164336e-06, 'epoch': 1.33} {'loss': 0.3199, 'learning_rate': 5.279015380801343e-06, 'epoch': 1.33} {'loss': 0.3386, 'learning_rate': 5.278719203767439e-06, 'epoch': 1.33} {'loss': 0.2433, 'learning_rate': 5.278423032062969e-06, 'epoch': 1.33} {'loss': 0.2264, 'learning_rate': 5.278126865688256e-06, 'epoch': 1.33} {'loss': 0.2906, 'learning_rate': 5.277830704643645e-06, 'epoch': 1.33} {'loss': 0.172, 'learning_rate': 5.277534548929464e-06, 'epoch': 1.33} {'loss': 0.4471, 'learning_rate': 5.2772383985460455e-06, 'epoch': 1.33} {'loss': 0.2644, 'learning_rate': 5.27694225349373e-06, 'epoch': 1.33} {'loss': 0.3026, 'learning_rate': 5.276646113772841e-06, 'epoch': 1.33} {'loss': 0.2988, 'learning_rate': 5.276349979383728e-06, 'epoch': 1.33} {'loss': 0.3709, 'learning_rate': 5.276053850326714e-06, 'epoch': 1.33} {'loss': 0.2983, 'learning_rate': 5.27575772660214e-06, 'epoch': 1.33} {'loss': 0.3119, 'learning_rate': 5.275461608210337e-06, 'epoch': 1.33} {'loss': 0.478, 'learning_rate': 5.275165495151637e-06, 'epoch': 1.33} {'loss': 0.2804, 'learning_rate': 5.27486938742638e-06, 'epoch': 1.33} {'loss': 0.2225, 'learning_rate': 5.274573285034892e-06, 'epoch': 1.33} {'loss': 0.2203, 'learning_rate': 5.2742771879775175e-06, 'epoch': 1.33} {'loss': 0.289, 'learning_rate': 5.2739810962545815e-06, 'epoch': 1.33} {'loss': 0.4112, 'learning_rate': 5.273685009866425e-06, 'epoch': 1.33} {'loss': 0.2809, 'learning_rate': 5.273388928813377e-06, 'epoch': 1.33} {'loss': 0.2101, 'learning_rate': 5.273092853095776e-06, 'epoch': 1.33} {'loss': 0.4202, 'learning_rate': 5.2727967827139515e-06, 'epoch': 1.33} {'loss': 0.3088, 'learning_rate': 5.272500717668245e-06, 'epoch': 1.33} {'loss': 0.1384, 'learning_rate': 5.2722046579589814e-06, 'epoch': 1.33} {'loss': 0.3182, 'learning_rate': 5.2719086035865045e-06, 'epoch': 1.33} {'loss': 0.3014, 'learning_rate': 5.271612554551137e-06, 'epoch': 1.33} {'loss': 0.5347, 'learning_rate': 5.271316510853227e-06, 'epoch': 1.33} {'loss': 0.2283, 'learning_rate': 5.2710204724931e-06, 'epoch': 1.33} {'loss': 0.1998, 'learning_rate': 5.270724439471089e-06, 'epoch': 1.33} {'loss': 0.3844, 'learning_rate': 5.270428411787533e-06, 'epoch': 1.33} {'loss': 0.2153, 'learning_rate': 5.270132389442761e-06, 'epoch': 1.33} {'loss': 0.3336, 'learning_rate': 5.269836372437114e-06, 'epoch': 1.34} {'loss': 0.3724, 'learning_rate': 5.269540360770917e-06, 'epoch': 1.34} {'loss': 0.4718, 'learning_rate': 5.269244354444516e-06, 'epoch': 1.34} {'loss': 0.2666, 'learning_rate': 5.268948353458232e-06, 'epoch': 1.34} {'loss': 0.3445, 'learning_rate': 5.268652357812411e-06, 'epoch': 1.34} {'loss': 0.2988, 'learning_rate': 5.268356367507378e-06, 'epoch': 1.34} {'loss': 0.4138, 'learning_rate': 5.268060382543474e-06, 'epoch': 1.34} {'loss': 0.3126, 'learning_rate': 5.267764402921026e-06, 'epoch': 1.34} {'loss': 0.2762, 'learning_rate': 5.267468428640377e-06, 'epoch': 1.34} {'loss': 0.2962, 'learning_rate': 5.267172459701854e-06, 'epoch': 1.34} {'loss': 0.3703, 'learning_rate': 5.2668764961057925e-06, 'epoch': 1.34} {'loss': 0.4902, 'learning_rate': 5.26658053785253e-06, 'epoch': 1.34} {'loss': 0.2346, 'learning_rate': 5.2662845849423935e-06, 'epoch': 1.34} {'loss': 0.38, 'learning_rate': 5.265988637375726e-06, 'epoch': 1.34} {'loss': 0.3907, 'learning_rate': 5.265692695152853e-06, 'epoch': 1.34} {'loss': 0.3408, 'learning_rate': 5.2653967582741176e-06, 'epoch': 1.34} {'loss': 0.2699, 'learning_rate': 5.265100826739844e-06, 'epoch': 1.34} {'loss': 0.3196, 'learning_rate': 5.2648049005503744e-06, 'epoch': 1.34} {'loss': 0.2863, 'learning_rate': 5.2645089797060365e-06, 'epoch': 1.34} {'loss': 0.267, 'learning_rate': 5.264213064207171e-06, 'epoch': 1.34} {'loss': 0.2081, 'learning_rate': 5.263917154054106e-06, 'epoch': 1.34} {'loss': 0.3564, 'learning_rate': 5.26362124924718e-06, 'epoch': 1.34} {'loss': 0.3811, 'learning_rate': 5.2633253497867255e-06, 'epoch': 1.34} {'loss': 0.3333, 'learning_rate': 5.263029455673072e-06, 'epoch': 1.34} {'loss': 0.3017, 'learning_rate': 5.262733566906561e-06, 'epoch': 1.34} {'loss': 0.2915, 'learning_rate': 5.26243768348752e-06, 'epoch': 1.34} {'loss': 0.4058, 'learning_rate': 5.2621418054162895e-06, 'epoch': 1.34} {'loss': 0.2668, 'learning_rate': 5.261845932693197e-06, 'epoch': 1.34} {'loss': 0.2448, 'learning_rate': 5.261550065318581e-06, 'epoch': 1.34} {'loss': 0.3077, 'learning_rate': 5.261254203292773e-06, 'epoch': 1.34} {'loss': 0.2698, 'learning_rate': 5.260958346616109e-06, 'epoch': 1.34} {'loss': 0.2684, 'learning_rate': 5.26066249528892e-06, 'epoch': 1.34} {'loss': 0.2214, 'learning_rate': 5.260366649311545e-06, 'epoch': 1.34} {'loss': 0.3146, 'learning_rate': 5.26007080868431e-06, 'epoch': 1.34} {'loss': 0.3245, 'learning_rate': 5.259774973407559e-06, 'epoch': 1.34} {'loss': 0.3481, 'learning_rate': 5.259479143481621e-06, 'epoch': 1.34} {'loss': 0.4761, 'learning_rate': 5.259183318906824e-06, 'epoch': 1.34} {'loss': 0.3909, 'learning_rate': 5.258887499683512e-06, 'epoch': 1.34} {'loss': 0.2721, 'learning_rate': 5.258591685812011e-06, 'epoch': 1.34} {'loss': 0.2273, 'learning_rate': 5.25829587729266e-06, 'epoch': 1.34} {'loss': 0.4715, 'learning_rate': 5.258000074125791e-06, 'epoch': 1.34} {'loss': 0.3611, 'learning_rate': 5.257704276311741e-06, 'epoch': 1.34} {'loss': 0.462, 'learning_rate': 5.257408483850836e-06, 'epoch': 1.34} {'loss': 0.4042, 'learning_rate': 5.257112696743419e-06, 'epoch': 1.34} {'loss': 0.4163, 'learning_rate': 5.256816914989818e-06, 'epoch': 1.34} {'loss': 0.3221, 'learning_rate': 5.256521138590369e-06, 'epoch': 1.34} {'loss': 0.3671, 'learning_rate': 5.2562253675454045e-06, 'epoch': 1.34} {'loss': 0.3829, 'learning_rate': 5.255929601855263e-06, 'epoch': 1.34} {'loss': 0.331, 'learning_rate': 5.255633841520274e-06, 'epoch': 1.34} {'loss': 0.3618, 'learning_rate': 5.2553380865407685e-06, 'epoch': 1.34} {'loss': 0.4386, 'learning_rate': 5.255042336917089e-06, 'epoch': 1.34} {'loss': 0.3271, 'learning_rate': 5.25474659264956e-06, 'epoch': 1.34} {'loss': 0.1654, 'learning_rate': 5.254450853738524e-06, 'epoch': 1.34} {'loss': 0.4316, 'learning_rate': 5.254155120184305e-06, 'epoch': 1.34} {'loss': 0.29, 'learning_rate': 5.253859391987249e-06, 'epoch': 1.34} {'loss': 0.3027, 'learning_rate': 5.253563669147676e-06, 'epoch': 1.34} {'loss': 0.2786, 'learning_rate': 5.2532679516659336e-06, 'epoch': 1.34} {'loss': 0.3838, 'learning_rate': 5.252972239542344e-06, 'epoch': 1.34} {'loss': 0.3584, 'learning_rate': 5.25267653277725e-06, 'epoch': 1.34} {'loss': 0.2531, 'learning_rate': 5.252380831370978e-06, 'epoch': 1.34} {'loss': 0.4251, 'learning_rate': 5.25208513532387e-06, 'epoch': 1.34} {'loss': 0.4306, 'learning_rate': 5.251789444636253e-06, 'epoch': 1.34} {'loss': 0.4182, 'learning_rate': 5.251493759308459e-06, 'epoch': 1.34} {'loss': 0.3358, 'learning_rate': 5.251198079340831e-06, 'epoch': 1.34} {'loss': 0.3693, 'learning_rate': 5.250902404733693e-06, 'epoch': 1.34} {'loss': 0.1887, 'learning_rate': 5.250606735487387e-06, 'epoch': 1.34} {'loss': 0.3042, 'learning_rate': 5.250311071602239e-06, 'epoch': 1.34} {'loss': 0.3199, 'learning_rate': 5.25001541307859e-06, 'epoch': 1.34} {'loss': 0.2218, 'learning_rate': 5.249719759916767e-06, 'epoch': 1.34} {'loss': 0.1808, 'learning_rate': 5.249424112117109e-06, 'epoch': 1.34} {'loss': 0.248, 'learning_rate': 5.249128469679947e-06, 'epoch': 1.34} {'loss': 0.3833, 'learning_rate': 5.248832832605617e-06, 'epoch': 1.34} {'loss': 0.3429, 'learning_rate': 5.248537200894449e-06, 'epoch': 1.34} {'loss': 0.2652, 'learning_rate': 5.248241574546782e-06, 'epoch': 1.34} {'loss': 0.283, 'learning_rate': 5.247945953562948e-06, 'epoch': 1.34} {'loss': 0.4622, 'learning_rate': 5.247650337943273e-06, 'epoch': 1.34} {'loss': 0.2671, 'learning_rate': 5.247354727688099e-06, 'epoch': 1.34} {'loss': 0.3316, 'learning_rate': 5.2470591227977575e-06, 'epoch': 1.34} {'loss': 0.2016, 'learning_rate': 5.2467635232725865e-06, 'epoch': 1.34} {'loss': 0.314, 'learning_rate': 5.246467929112911e-06, 'epoch': 1.34} {'loss': 0.2021, 'learning_rate': 5.246172340319074e-06, 'epoch': 1.34} {'loss': 0.3886, 'learning_rate': 5.245876756891404e-06, 'epoch': 1.34} {'loss': 0.3317, 'learning_rate': 5.24558117883023e-06, 'epoch': 1.34} {'loss': 0.268, 'learning_rate': 5.2452856061358955e-06, 'epoch': 1.34} {'loss': 0.335, 'learning_rate': 5.244990038808726e-06, 'epoch': 1.34} {'loss': 0.3263, 'learning_rate': 5.244694476849062e-06, 'epoch': 1.34} {'loss': 0.2317, 'learning_rate': 5.24439892025723e-06, 'epoch': 1.34} {'loss': 0.3906, 'learning_rate': 5.244103369033571e-06, 'epoch': 1.34} {'loss': 0.4117, 'learning_rate': 5.243807823178412e-06, 'epoch': 1.34} {'loss': 0.3261, 'learning_rate': 5.243512282692092e-06, 'epoch': 1.34} {'loss': 0.2246, 'learning_rate': 5.24321674757494e-06, 'epoch': 1.34} {'loss': 0.3039, 'learning_rate': 5.242921217827293e-06, 'epoch': 1.34} {'loss': 0.2965, 'learning_rate': 5.242625693449481e-06, 'epoch': 1.34} {'loss': 0.1915, 'learning_rate': 5.242330174441844e-06, 'epoch': 1.34} {'loss': 0.248, 'learning_rate': 5.242034660804711e-06, 'epoch': 1.34} {'loss': 0.5202, 'learning_rate': 5.241739152538413e-06, 'epoch': 1.34} {'loss': 0.3942, 'learning_rate': 5.24144364964329e-06, 'epoch': 1.34} {'loss': 0.5334, 'learning_rate': 5.241148152119669e-06, 'epoch': 1.34} {'loss': 0.3278, 'learning_rate': 5.24085265996789e-06, 'epoch': 1.34} {'loss': 0.2907, 'learning_rate': 5.240557173188278e-06, 'epoch': 1.34} {'loss': 0.3082, 'learning_rate': 5.240261691781179e-06, 'epoch': 1.34} {'loss': 0.4428, 'learning_rate': 5.239966215746914e-06, 'epoch': 1.34} {'loss': 0.2725, 'learning_rate': 5.239670745085826e-06, 'epoch': 1.34} {'loss': 0.3403, 'learning_rate': 5.23937527979824e-06, 'epoch': 1.34} {'loss': 0.2572, 'learning_rate': 5.239079819884498e-06, 'epoch': 1.34} {'loss': 0.1621, 'learning_rate': 5.238784365344927e-06, 'epoch': 1.34} {'loss': 0.2416, 'learning_rate': 5.238488916179865e-06, 'epoch': 1.34} {'loss': 0.2451, 'learning_rate': 5.2381934723896455e-06, 'epoch': 1.34} {'loss': 0.2901, 'learning_rate': 5.237898033974595e-06, 'epoch': 1.34} {'loss': 0.2747, 'learning_rate': 5.2376026009350555e-06, 'epoch': 1.34} {'loss': 0.222, 'learning_rate': 5.237307173271354e-06, 'epoch': 1.34} {'loss': 0.3718, 'learning_rate': 5.237011750983832e-06, 'epoch': 1.34} {'loss': 0.3219, 'learning_rate': 5.236716334072811e-06, 'epoch': 1.34} {'loss': 0.4801, 'learning_rate': 5.236420922538638e-06, 'epoch': 1.34} {'loss': 0.2671, 'learning_rate': 5.236125516381636e-06, 'epoch': 1.34} {'loss': 0.4432, 'learning_rate': 5.2358301156021456e-06, 'epoch': 1.34} {'loss': 0.2284, 'learning_rate': 5.2355347202004925e-06, 'epoch': 1.34} {'loss': 0.2499, 'learning_rate': 5.23523933017702e-06, 'epoch': 1.34} {'loss': 0.216, 'learning_rate': 5.23494394553205e-06, 'epoch': 1.34} {'loss': 0.4314, 'learning_rate': 5.2346485662659286e-06, 'epoch': 1.34} {'loss': 0.3701, 'learning_rate': 5.234353192378981e-06, 'epoch': 1.34} {'loss': 0.3134, 'learning_rate': 5.23405782387154e-06, 'epoch': 1.34} {'loss': 0.2569, 'learning_rate': 5.233762460743945e-06, 'epoch': 1.34} {'loss': 0.3019, 'learning_rate': 5.233467102996521e-06, 'epoch': 1.34} {'loss': 0.369, 'learning_rate': 5.233171750629611e-06, 'epoch': 1.34} {'loss': 0.3765, 'learning_rate': 5.23287640364354e-06, 'epoch': 1.34} {'loss': 0.3905, 'learning_rate': 5.232581062038648e-06, 'epoch': 1.34} {'loss': 0.3362, 'learning_rate': 5.232285725815263e-06, 'epoch': 1.34} {'loss': 0.2518, 'learning_rate': 5.2319903949737225e-06, 'epoch': 1.34} {'loss': 0.2456, 'learning_rate': 5.231695069514356e-06, 'epoch': 1.34} {'loss': 0.3689, 'learning_rate': 5.231399749437502e-06, 'epoch': 1.34} {'loss': 0.1987, 'learning_rate': 5.231104434743488e-06, 'epoch': 1.34} {'loss': 0.3234, 'learning_rate': 5.230809125432652e-06, 'epoch': 1.34} {'loss': 0.3962, 'learning_rate': 5.230513821505327e-06, 'epoch': 1.34} {'loss': 0.4514, 'learning_rate': 5.230218522961842e-06, 'epoch': 1.34} {'loss': 0.4476, 'learning_rate': 5.229923229802536e-06, 'epoch': 1.34} {'loss': 0.3183, 'learning_rate': 5.229627942027736e-06, 'epoch': 1.34} {'loss': 0.2349, 'learning_rate': 5.229332659637783e-06, 'epoch': 1.34} {'loss': 0.3418, 'learning_rate': 5.229037382633002e-06, 'epoch': 1.34} {'loss': 0.4935, 'learning_rate': 5.228742111013735e-06, 'epoch': 1.34} {'loss': 0.4138, 'learning_rate': 5.228446844780306e-06, 'epoch': 1.34} {'loss': 0.2807, 'learning_rate': 5.228151583933059e-06, 'epoch': 1.34} {'loss': 0.2693, 'learning_rate': 5.227856328472315e-06, 'epoch': 1.34} {'loss': 0.2386, 'learning_rate': 5.227561078398419e-06, 'epoch': 1.34} {'loss': 0.2609, 'learning_rate': 5.227265833711694e-06, 'epoch': 1.34} {'loss': 0.3015, 'learning_rate': 5.226970594412484e-06, 'epoch': 1.34} {'loss': 0.2834, 'learning_rate': 5.2266753605011155e-06, 'epoch': 1.34} {'loss': 0.3655, 'learning_rate': 5.2263801319779195e-06, 'epoch': 1.34} {'loss': 0.2691, 'learning_rate': 5.226084908843236e-06, 'epoch': 1.34} {'loss': 0.2497, 'learning_rate': 5.225789691097392e-06, 'epoch': 1.34} {'loss': 0.2192, 'learning_rate': 5.225494478740726e-06, 'epoch': 1.34} {'loss': 0.4628, 'learning_rate': 5.225199271773565e-06, 'epoch': 1.34} {'loss': 0.3812, 'learning_rate': 5.22490407019625e-06, 'epoch': 1.34} {'loss': 0.4236, 'learning_rate': 5.224608874009107e-06, 'epoch': 1.34} {'loss': 0.2047, 'learning_rate': 5.224313683212476e-06, 'epoch': 1.34} {'loss': 0.3382, 'learning_rate': 5.224018497806684e-06, 'epoch': 1.34} {'loss': 0.1649, 'learning_rate': 5.223723317792068e-06, 'epoch': 1.34} {'loss': 0.2696, 'learning_rate': 5.223428143168959e-06, 'epoch': 1.34} {'loss': 0.3751, 'learning_rate': 5.223132973937694e-06, 'epoch': 1.34} {'loss': 0.3394, 'learning_rate': 5.2228378100986e-06, 'epoch': 1.34} {'loss': 0.3089, 'learning_rate': 5.222542651652018e-06, 'epoch': 1.34} {'loss': 0.3437, 'learning_rate': 5.222247498598276e-06, 'epoch': 1.34} {'loss': 0.2949, 'learning_rate': 5.221952350937705e-06, 'epoch': 1.34} {'loss': 0.3283, 'learning_rate': 5.221657208670644e-06, 'epoch': 1.34} {'loss': 0.3277, 'learning_rate': 5.22136207179742e-06, 'epoch': 1.34} {'loss': 0.3531, 'learning_rate': 5.221066940318373e-06, 'epoch': 1.34} {'loss': 0.3586, 'learning_rate': 5.220771814233831e-06, 'epoch': 1.34} {'loss': 0.3031, 'learning_rate': 5.22047669354413e-06, 'epoch': 1.34} {'loss': 0.3697, 'learning_rate': 5.220181578249599e-06, 'epoch': 1.34} {'loss': 0.3397, 'learning_rate': 5.219886468350578e-06, 'epoch': 1.34} {'loss': 0.4344, 'learning_rate': 5.219591363847391e-06, 'epoch': 1.34} {'loss': 0.2956, 'learning_rate': 5.219296264740383e-06, 'epoch': 1.34} {'loss': 0.1986, 'learning_rate': 5.219001171029875e-06, 'epoch': 1.34} {'loss': 0.3952, 'learning_rate': 5.218706082716209e-06, 'epoch': 1.34} {'loss': 0.3681, 'learning_rate': 5.218410999799715e-06, 'epoch': 1.34} {'loss': 0.344, 'learning_rate': 5.218115922280718e-06, 'epoch': 1.34} {'loss': 0.3747, 'learning_rate': 5.217820850159567e-06, 'epoch': 1.34} {'loss': 0.2912, 'learning_rate': 5.217525783436583e-06, 'epoch': 1.34} {'loss': 0.2748, 'learning_rate': 5.217230722112106e-06, 'epoch': 1.34} {'loss': 0.2392, 'learning_rate': 5.216935666186462e-06, 'epoch': 1.34} {'loss': 0.3438, 'learning_rate': 5.2166406156599935e-06, 'epoch': 1.34} {'loss': 0.1673, 'learning_rate': 5.216345570533027e-06, 'epoch': 1.34} {'loss': 0.3641, 'learning_rate': 5.216050530805893e-06, 'epoch': 1.34} {'loss': 0.3765, 'learning_rate': 5.2157554964789315e-06, 'epoch': 1.34} {'loss': 0.3854, 'learning_rate': 5.215460467552469e-06, 'epoch': 1.34} {'loss': 0.2784, 'learning_rate': 5.215165444026846e-06, 'epoch': 1.34} {'loss': 0.1948, 'learning_rate': 5.214870425902388e-06, 'epoch': 1.34} {'loss': 0.248, 'learning_rate': 5.214575413179434e-06, 'epoch': 1.34} {'loss': 0.3575, 'learning_rate': 5.2142804058583105e-06, 'epoch': 1.34} {'loss': 0.4434, 'learning_rate': 5.213985403939359e-06, 'epoch': 1.34} {'loss': 0.3174, 'learning_rate': 5.213690407422903e-06, 'epoch': 1.34} {'loss': 0.3477, 'learning_rate': 5.213395416309286e-06, 'epoch': 1.34} {'loss': 0.2966, 'learning_rate': 5.21310043059883e-06, 'epoch': 1.34} {'loss': 0.198, 'learning_rate': 5.212805450291878e-06, 'epoch': 1.34} {'loss': 0.2452, 'learning_rate': 5.212510475388756e-06, 'epoch': 1.34} {'loss': 0.2089, 'learning_rate': 5.212215505889799e-06, 'epoch': 1.34} {'loss': 0.2534, 'learning_rate': 5.211920541795343e-06, 'epoch': 1.34} {'loss': 0.2937, 'learning_rate': 5.211625583105713e-06, 'epoch': 1.34} {'loss': 0.2697, 'learning_rate': 5.211330629821251e-06, 'epoch': 1.34} {'loss': 0.2587, 'learning_rate': 5.211035681942285e-06, 'epoch': 1.34} {'loss': 0.3367, 'learning_rate': 5.21074073946915e-06, 'epoch': 1.34} {'loss': 0.3498, 'learning_rate': 5.2104458024021755e-06, 'epoch': 1.34} {'loss': 0.2936, 'learning_rate': 5.2101508707417006e-06, 'epoch': 1.34} {'loss': 0.3918, 'learning_rate': 5.2098559444880495e-06, 'epoch': 1.34} {'loss': 0.3106, 'learning_rate': 5.2095610236415654e-06, 'epoch': 1.34} {'loss': 0.2085, 'learning_rate': 5.209266108202572e-06, 'epoch': 1.34} {'loss': 0.4276, 'learning_rate': 5.208971198171409e-06, 'epoch': 1.34} {'loss': 0.3926, 'learning_rate': 5.208676293548407e-06, 'epoch': 1.34} {'loss': 0.4198, 'learning_rate': 5.208381394333895e-06, 'epoch': 1.34} {'loss': 0.3078, 'learning_rate': 5.208086500528213e-06, 'epoch': 1.34} {'loss': 0.3579, 'learning_rate': 5.2077916121316865e-06, 'epoch': 1.34} {'loss': 0.3224, 'learning_rate': 5.207496729144655e-06, 'epoch': 1.34} {'loss': 0.2275, 'learning_rate': 5.207201851567445e-06, 'epoch': 1.34} {'loss': 0.3042, 'learning_rate': 5.206906979400397e-06, 'epoch': 1.34} {'loss': 0.3547, 'learning_rate': 5.206612112643834e-06, 'epoch': 1.34} {'loss': 0.4297, 'learning_rate': 5.206317251298101e-06, 'epoch': 1.34} {'loss': 0.3179, 'learning_rate': 5.206022395363518e-06, 'epoch': 1.34} {'loss': 0.3133, 'learning_rate': 5.205727544840429e-06, 'epoch': 1.34} {'loss': 0.3334, 'learning_rate': 5.2054326997291585e-06, 'epoch': 1.34} {'loss': 0.2703, 'learning_rate': 5.205137860030045e-06, 'epoch': 1.34} {'loss': 0.2842, 'learning_rate': 5.20484302574342e-06, 'epoch': 1.34} {'loss': 0.2758, 'learning_rate': 5.204548196869612e-06, 'epoch': 1.34} {'loss': 0.2699, 'learning_rate': 5.204253373408961e-06, 'epoch': 1.34} {'loss': 0.3566, 'learning_rate': 5.203958555361791e-06, 'epoch': 1.34} {'loss': 0.3207, 'learning_rate': 5.203663742728444e-06, 'epoch': 1.34} {'loss': 0.3475, 'learning_rate': 5.203368935509245e-06, 'epoch': 1.34} {'loss': 0.349, 'learning_rate': 5.203074133704535e-06, 'epoch': 1.34} {'loss': 0.3721, 'learning_rate': 5.2027793373146375e-06, 'epoch': 1.34} {'loss': 0.3594, 'learning_rate': 5.202484546339894e-06, 'epoch': 1.34} {'loss': 0.2627, 'learning_rate': 5.202189760780629e-06, 'epoch': 1.34} {'loss': 0.4067, 'learning_rate': 5.201894980637183e-06, 'epoch': 1.34} {'loss': 0.2374, 'learning_rate': 5.201600205909882e-06, 'epoch': 1.34} {'loss': 0.2754, 'learning_rate': 5.201305436599065e-06, 'epoch': 1.34} {'loss': 0.2777, 'learning_rate': 5.201010672705062e-06, 'epoch': 1.34} {'loss': 0.2771, 'learning_rate': 5.2007159142282025e-06, 'epoch': 1.34} {'loss': 0.289, 'learning_rate': 5.200421161168825e-06, 'epoch': 1.34} {'loss': 0.3205, 'learning_rate': 5.2001264135272555e-06, 'epoch': 1.34} {'loss': 0.3648, 'learning_rate': 5.199831671303834e-06, 'epoch': 1.34} {'loss': 0.3919, 'learning_rate': 5.1995369344988875e-06, 'epoch': 1.34} {'loss': 0.3964, 'learning_rate': 5.199242203112753e-06, 'epoch': 1.34} {'loss': 0.2313, 'learning_rate': 5.198947477145758e-06, 'epoch': 1.34} {'loss': 0.3498, 'learning_rate': 5.1986527565982425e-06, 'epoch': 1.34} {'loss': 0.2582, 'learning_rate': 5.19835804147053e-06, 'epoch': 1.34} {'loss': 0.2774, 'learning_rate': 5.1980633317629636e-06, 'epoch': 1.34} {'loss': 0.3556, 'learning_rate': 5.197768627475865e-06, 'epoch': 1.34} {'loss': 0.3078, 'learning_rate': 5.1974739286095775e-06, 'epoch': 1.34} {'loss': 0.3524, 'learning_rate': 5.197179235164429e-06, 'epoch': 1.34} {'loss': 0.2141, 'learning_rate': 5.196884547140748e-06, 'epoch': 1.34} {'loss': 0.4274, 'learning_rate': 5.196589864538875e-06, 'epoch': 1.34} {'loss': 0.3333, 'learning_rate': 5.196295187359133e-06, 'epoch': 1.34} {'loss': 0.3657, 'learning_rate': 5.196000515601865e-06, 'epoch': 1.34} {'loss': 0.2803, 'learning_rate': 5.195705849267396e-06, 'epoch': 1.34} {'loss': 0.438, 'learning_rate': 5.1954111883560645e-06, 'epoch': 1.34} {'loss': 0.4307, 'learning_rate': 5.195116532868196e-06, 'epoch': 1.34} {'loss': 0.2004, 'learning_rate': 5.194821882804132e-06, 'epoch': 1.34} {'loss': 0.2641, 'learning_rate': 5.1945272381641955e-06, 'epoch': 1.34} {'loss': 0.3435, 'learning_rate': 5.194232598948729e-06, 'epoch': 1.34} {'loss': 0.221, 'learning_rate': 5.193937965158055e-06, 'epoch': 1.34} {'loss': 0.3004, 'learning_rate': 5.1936433367925156e-06, 'epoch': 1.34} {'loss': 0.3359, 'learning_rate': 5.1933487138524394e-06, 'epoch': 1.34} {'loss': 0.4223, 'learning_rate': 5.193054096338154e-06, 'epoch': 1.34} {'loss': 0.2665, 'learning_rate': 5.1927594842500006e-06, 'epoch': 1.34} {'loss': 0.3994, 'learning_rate': 5.192464877588303e-06, 'epoch': 1.34} {'loss': 0.179, 'learning_rate': 5.192170276353402e-06, 'epoch': 1.34} {'loss': 0.2257, 'learning_rate': 5.191875680545624e-06, 'epoch': 1.34} {'loss': 0.4969, 'learning_rate': 5.191581090165307e-06, 'epoch': 1.34} {'loss': 0.294, 'learning_rate': 5.191286505212777e-06, 'epoch': 1.34} {'loss': 0.3526, 'learning_rate': 5.190991925688374e-06, 'epoch': 1.34} {'loss': 0.2307, 'learning_rate': 5.190697351592422e-06, 'epoch': 1.34} {'loss': 0.3105, 'learning_rate': 5.190402782925264e-06, 'epoch': 1.34} {'loss': 0.3036, 'learning_rate': 5.19010821968722e-06, 'epoch': 1.34} {'loss': 0.2838, 'learning_rate': 5.189813661878635e-06, 'epoch': 1.34} {'loss': 0.3335, 'learning_rate': 5.189519109499836e-06, 'epoch': 1.34} {'loss': 0.3226, 'learning_rate': 5.189224562551149e-06, 'epoch': 1.34} {'loss': 0.3439, 'learning_rate': 5.188930021032918e-06, 'epoch': 1.34} {'loss': 0.3467, 'learning_rate': 5.188635484945463e-06, 'epoch': 1.34} {'loss': 0.2142, 'learning_rate': 5.1883409542891305e-06, 'epoch': 1.34} {'loss': 0.3466, 'learning_rate': 5.188046429064244e-06, 'epoch': 1.34} {'loss': 0.2314, 'learning_rate': 5.187751909271139e-06, 'epoch': 1.34} {'loss': 0.3763, 'learning_rate': 5.187457394910145e-06, 'epoch': 1.34} {'loss': 0.4079, 'learning_rate': 5.1871628859816e-06, 'epoch': 1.34} {'loss': 0.2651, 'learning_rate': 5.186868382485832e-06, 'epoch': 1.34} {'loss': 0.3226, 'learning_rate': 5.186573884423172e-06, 'epoch': 1.34} {'loss': 0.3678, 'learning_rate': 5.186279391793958e-06, 'epoch': 1.34} {'loss': 0.1513, 'learning_rate': 5.1859849045985155e-06, 'epoch': 1.34} {'loss': 0.2677, 'learning_rate': 5.185690422837184e-06, 'epoch': 1.34} {'loss': 0.3333, 'learning_rate': 5.18539594651029e-06, 'epoch': 1.34} {'loss': 0.4037, 'learning_rate': 5.185101475618171e-06, 'epoch': 1.34} {'loss': 0.3798, 'learning_rate': 5.184807010161153e-06, 'epoch': 1.34} {'loss': 0.3486, 'learning_rate': 5.184512550139576e-06, 'epoch': 1.34} {'loss': 0.2932, 'learning_rate': 5.184218095553764e-06, 'epoch': 1.34} {'loss': 0.3235, 'learning_rate': 5.18392364640406e-06, 'epoch': 1.34} {'loss': 0.3365, 'learning_rate': 5.1836292026907855e-06, 'epoch': 1.34} {'loss': 0.3135, 'learning_rate': 5.183334764414281e-06, 'epoch': 1.34} {'loss': 0.3255, 'learning_rate': 5.183040331574875e-06, 'epoch': 1.34} {'loss': 0.3722, 'learning_rate': 5.182745904172899e-06, 'epoch': 1.34} {'loss': 0.3428, 'learning_rate': 5.18245148220869e-06, 'epoch': 1.34} {'loss': 0.2882, 'learning_rate': 5.182157065682573e-06, 'epoch': 1.34} {'loss': 0.2346, 'learning_rate': 5.181862654594887e-06, 'epoch': 1.34} {'loss': 0.2636, 'learning_rate': 5.181568248945959e-06, 'epoch': 1.34} {'loss': 0.2274, 'learning_rate': 5.181273848736129e-06, 'epoch': 1.34} {'loss': 0.2089, 'learning_rate': 5.18097945396572e-06, 'epoch': 1.34} {'loss': 0.4069, 'learning_rate': 5.1806850646350725e-06, 'epoch': 1.34} {'loss': 0.2683, 'learning_rate': 5.180390680744511e-06, 'epoch': 1.34} {'loss': 0.3825, 'learning_rate': 5.180096302294376e-06, 'epoch': 1.34} {'loss': 0.2927, 'learning_rate': 5.179801929284992e-06, 'epoch': 1.34} {'loss': 0.3062, 'learning_rate': 5.179507561716699e-06, 'epoch': 1.34} {'loss': 0.3849, 'learning_rate': 5.179213199589825e-06, 'epoch': 1.34} {'loss': 0.3188, 'learning_rate': 5.178918842904699e-06, 'epoch': 1.34} {'loss': 0.39, 'learning_rate': 5.178624491661661e-06, 'epoch': 1.34} {'loss': 0.3614, 'learning_rate': 5.178330145861035e-06, 'epoch': 1.34} {'loss': 0.427, 'learning_rate': 5.178035805503161e-06, 'epoch': 1.34} {'loss': 0.1719, 'learning_rate': 5.177741470588363e-06, 'epoch': 1.34} {'loss': 0.2251, 'learning_rate': 5.1774471411169824e-06, 'epoch': 1.34} {'loss': 0.3018, 'learning_rate': 5.177152817089344e-06, 'epoch': 1.34} {'loss': 0.3644, 'learning_rate': 5.176858498505786e-06, 'epoch': 1.34} {'loss': 0.4793, 'learning_rate': 5.176564185366634e-06, 'epoch': 1.34} {'loss': 0.4047, 'learning_rate': 5.176269877672226e-06, 'epoch': 1.34} {'loss': 0.3345, 'learning_rate': 5.1759755754228915e-06, 'epoch': 1.34} {'loss': 0.2442, 'learning_rate': 5.1756812786189646e-06, 'epoch': 1.34} {'loss': 0.3796, 'learning_rate': 5.175386987260778e-06, 'epoch': 1.34} {'loss': 0.3809, 'learning_rate': 5.175092701348656e-06, 'epoch': 1.34} {'loss': 0.4517, 'learning_rate': 5.174798420882942e-06, 'epoch': 1.34} {'loss': 0.3633, 'learning_rate': 5.174504145863959e-06, 'epoch': 1.34} {'loss': 0.3001, 'learning_rate': 5.174209876292047e-06, 'epoch': 1.34} {'loss': 0.3097, 'learning_rate': 5.1739156121675304e-06, 'epoch': 1.34} {'loss': 0.2311, 'learning_rate': 5.173621353490749e-06, 'epoch': 1.34} {'loss': 0.3638, 'learning_rate': 5.173327100262027e-06, 'epoch': 1.34} {'loss': 0.2593, 'learning_rate': 5.1730328524817055e-06, 'epoch': 1.34} {'loss': 0.3987, 'learning_rate': 5.172738610150108e-06, 'epoch': 1.34} {'loss': 0.231, 'learning_rate': 5.172444373267576e-06, 'epoch': 1.34} {'loss': 0.3875, 'learning_rate': 5.17215014183443e-06, 'epoch': 1.34} {'loss': 0.3265, 'learning_rate': 5.171855915851014e-06, 'epoch': 1.34} {'loss': 0.3331, 'learning_rate': 5.171561695317653e-06, 'epoch': 1.34} {'loss': 0.3346, 'learning_rate': 5.171267480234679e-06, 'epoch': 1.34} {'loss': 0.3701, 'learning_rate': 5.170973270602428e-06, 'epoch': 1.34} {'loss': 0.2676, 'learning_rate': 5.170679066421227e-06, 'epoch': 1.34} {'loss': 0.308, 'learning_rate': 5.1703848676914134e-06, 'epoch': 1.34} {'loss': 0.2605, 'learning_rate': 5.170090674413314e-06, 'epoch': 1.34} {'loss': 0.2428, 'learning_rate': 5.169796486587268e-06, 'epoch': 1.34} {'loss': 0.2995, 'learning_rate': 5.169502304213598e-06, 'epoch': 1.34} {'loss': 0.3104, 'learning_rate': 5.1692081272926464e-06, 'epoch': 1.34} {'loss': 0.2763, 'learning_rate': 5.168913955824737e-06, 'epoch': 1.34} {'loss': 0.2341, 'learning_rate': 5.168619789810208e-06, 'epoch': 1.34} {'loss': 0.2663, 'learning_rate': 5.168325629249384e-06, 'epoch': 1.34} {'loss': 0.262, 'learning_rate': 5.168031474142606e-06, 'epoch': 1.34} {'loss': 0.2904, 'learning_rate': 5.167737324490203e-06, 'epoch': 1.34} {'loss': 0.3511, 'learning_rate': 5.167443180292499e-06, 'epoch': 1.34} {'loss': 0.4204, 'learning_rate': 5.167149041549839e-06, 'epoch': 1.34} {'loss': 0.3688, 'learning_rate': 5.166854908262544e-06, 'epoch': 1.34} {'loss': 0.4471, 'learning_rate': 5.166560780430954e-06, 'epoch': 1.34} {'loss': 0.3329, 'learning_rate': 5.166266658055394e-06, 'epoch': 1.34} {'loss': 0.4187, 'learning_rate': 5.165972541136205e-06, 'epoch': 1.34} {'loss': 0.2214, 'learning_rate': 5.165678429673709e-06, 'epoch': 1.34} {'loss': 0.2845, 'learning_rate': 5.165384323668247e-06, 'epoch': 1.34} {'loss': 0.2259, 'learning_rate': 5.165090223120142e-06, 'epoch': 1.34} {'loss': 0.3248, 'learning_rate': 5.1647961280297355e-06, 'epoch': 1.34} {'loss': 0.3256, 'learning_rate': 5.16450203839735e-06, 'epoch': 1.34} {'loss': 0.3582, 'learning_rate': 5.164207954223327e-06, 'epoch': 1.34} {'loss': 0.2176, 'learning_rate': 5.163913875507993e-06, 'epoch': 1.34} {'loss': 0.3891, 'learning_rate': 5.163619802251677e-06, 'epoch': 1.34} {'loss': 0.3875, 'learning_rate': 5.163325734454718e-06, 'epoch': 1.34} {'loss': 0.3059, 'learning_rate': 5.163031672117442e-06, 'epoch': 1.34} {'loss': 0.364, 'learning_rate': 5.162737615240185e-06, 'epoch': 1.34} {'loss': 0.4071, 'learning_rate': 5.162443563823276e-06, 'epoch': 1.34} {'loss': 0.4271, 'learning_rate': 5.162149517867051e-06, 'epoch': 1.34} {'loss': 0.3435, 'learning_rate': 5.1618554773718354e-06, 'epoch': 1.34} {'loss': 0.2931, 'learning_rate': 5.161561442337969e-06, 'epoch': 1.34} {'loss': 0.3885, 'learning_rate': 5.161267412765776e-06, 'epoch': 1.34} {'loss': 0.4159, 'learning_rate': 5.160973388655595e-06, 'epoch': 1.34} {'loss': 0.3241, 'learning_rate': 5.16067937000775e-06, 'epoch': 1.34} {'loss': 0.2838, 'learning_rate': 5.160385356822584e-06, 'epoch': 1.34} {'loss': 0.3433, 'learning_rate': 5.160091349100422e-06, 'epoch': 1.34} {'loss': 0.2866, 'learning_rate': 5.159797346841593e-06, 'epoch': 1.34} {'loss': 0.283, 'learning_rate': 5.159503350046431e-06, 'epoch': 1.34} {'loss': 0.3412, 'learning_rate': 5.15920935871527e-06, 'epoch': 1.34} {'loss': 0.2573, 'learning_rate': 5.158915372848445e-06, 'epoch': 1.34} {'loss': 0.5767, 'learning_rate': 5.15862139244628e-06, 'epoch': 1.34} {'loss': 0.2367, 'learning_rate': 5.158327417509114e-06, 'epoch': 1.34} {'loss': 0.2688, 'learning_rate': 5.158033448037278e-06, 'epoch': 1.34} {'loss': 0.5018, 'learning_rate': 5.157739484031096e-06, 'epoch': 1.34} {'loss': 0.2872, 'learning_rate': 5.15744552549091e-06, 'epoch': 1.34} {'loss': 0.2906, 'learning_rate': 5.1571515724170405e-06, 'epoch': 1.34} {'loss': 0.368, 'learning_rate': 5.156857624809832e-06, 'epoch': 1.34} {'loss': 0.2244, 'learning_rate': 5.156563682669607e-06, 'epoch': 1.34} {'loss': 0.3173, 'learning_rate': 5.156269745996704e-06, 'epoch': 1.34} {'loss': 0.3508, 'learning_rate': 5.155975814791447e-06, 'epoch': 1.34} {'loss': 0.2484, 'learning_rate': 5.155681889054176e-06, 'epoch': 1.34} {'loss': 0.2804, 'learning_rate': 5.155387968785215e-06, 'epoch': 1.34} {'loss': 0.3559, 'learning_rate': 5.155094053984904e-06, 'epoch': 1.34} {'loss': 0.1926, 'learning_rate': 5.154800144653567e-06, 'epoch': 1.34} {'loss': 0.2917, 'learning_rate': 5.154506240791542e-06, 'epoch': 1.34} {'loss': 0.2271, 'learning_rate': 5.15421234239916e-06, 'epoch': 1.34} {'loss': 0.2941, 'learning_rate': 5.153918449476745e-06, 'epoch': 1.34} {'loss': 0.2443, 'learning_rate': 5.153624562024639e-06, 'epoch': 1.34} {'loss': 0.2019, 'learning_rate': 5.153330680043166e-06, 'epoch': 1.34} {'loss': 0.2792, 'learning_rate': 5.153036803532665e-06, 'epoch': 1.34} {'loss': 0.347, 'learning_rate': 5.152742932493459e-06, 'epoch': 1.34} {'loss': 0.3809, 'learning_rate': 5.152449066925888e-06, 'epoch': 1.34} {'loss': 0.2889, 'learning_rate': 5.1521552068302785e-06, 'epoch': 1.34} {'loss': 0.4156, 'learning_rate': 5.151861352206966e-06, 'epoch': 1.34} {'loss': 0.2729, 'learning_rate': 5.151567503056276e-06, 'epoch': 1.34} {'loss': 0.2616, 'learning_rate': 5.151273659378549e-06, 'epoch': 1.34} {'loss': 0.4374, 'learning_rate': 5.150979821174107e-06, 'epoch': 1.34} {'loss': 0.2637, 'learning_rate': 5.150685988443291e-06, 'epoch': 1.34} {'loss': 0.2079, 'learning_rate': 5.150392161186431e-06, 'epoch': 1.34} {'loss': 0.2713, 'learning_rate': 5.150098339403848e-06, 'epoch': 1.34} {'loss': 0.3711, 'learning_rate': 5.149804523095888e-06, 'epoch': 1.34} {'loss': 0.4205, 'learning_rate': 5.149510712262873e-06, 'epoch': 1.34} {'loss': 0.4287, 'learning_rate': 5.149216906905141e-06, 'epoch': 1.34} {'loss': 0.3839, 'learning_rate': 5.1489231070230164e-06, 'epoch': 1.34} {'loss': 0.3855, 'learning_rate': 5.14862931261684e-06, 'epoch': 1.34} {'loss': 0.3546, 'learning_rate': 5.148335523686934e-06, 'epoch': 1.34} {'loss': 0.3274, 'learning_rate': 5.148041740233638e-06, 'epoch': 1.34} {'loss': 0.3976, 'learning_rate': 5.147747962257277e-06, 'epoch': 1.34} {'loss': 0.2856, 'learning_rate': 5.147454189758189e-06, 'epoch': 1.34} {'loss': 0.2295, 'learning_rate': 5.1471604227367e-06, 'epoch': 1.34} {'loss': 0.4663, 'learning_rate': 5.146866661193148e-06, 'epoch': 1.34} {'loss': 0.3257, 'learning_rate': 5.14657290512786e-06, 'epoch': 1.34} {'loss': 0.3447, 'learning_rate': 5.146279154541164e-06, 'epoch': 1.34} {'loss': 0.3218, 'learning_rate': 5.145985409433401e-06, 'epoch': 1.34} {'loss': 0.4276, 'learning_rate': 5.145691669804891e-06, 'epoch': 1.34} {'loss': 0.4301, 'learning_rate': 5.145397935655978e-06, 'epoch': 1.34} {'loss': 0.3726, 'learning_rate': 5.145104206986984e-06, 'epoch': 1.34} {'loss': 0.3782, 'learning_rate': 5.144810483798246e-06, 'epoch': 1.34} {'loss': 0.3605, 'learning_rate': 5.144516766090092e-06, 'epoch': 1.34} {'loss': 0.3156, 'learning_rate': 5.1442230538628575e-06, 'epoch': 1.34} {'loss': 0.3905, 'learning_rate': 5.143929347116869e-06, 'epoch': 1.34} {'loss': 0.2664, 'learning_rate': 5.143635645852465e-06, 'epoch': 1.34} {'loss': 0.3466, 'learning_rate': 5.143341950069968e-06, 'epoch': 1.34} {'loss': 0.1865, 'learning_rate': 5.143048259769719e-06, 'epoch': 1.34} {'loss': 0.2597, 'learning_rate': 5.14275457495204e-06, 'epoch': 1.34} {'loss': 0.3763, 'learning_rate': 5.1424608956172715e-06, 'epoch': 1.34} {'loss': 0.3179, 'learning_rate': 5.142167221765742e-06, 'epoch': 1.34} {'loss': 0.2946, 'learning_rate': 5.1418735533977785e-06, 'epoch': 1.34} {'loss': 0.3876, 'learning_rate': 5.1415798905137184e-06, 'epoch': 1.34} {'loss': 0.1938, 'learning_rate': 5.141286233113887e-06, 'epoch': 1.34} {'loss': 0.4393, 'learning_rate': 5.140992581198624e-06, 'epoch': 1.34} {'loss': 0.3479, 'learning_rate': 5.140698934768252e-06, 'epoch': 1.34} {'loss': 0.3682, 'learning_rate': 5.140405293823111e-06, 'epoch': 1.34} {'loss': 0.3238, 'learning_rate': 5.140111658363524e-06, 'epoch': 1.34} {'loss': 0.243, 'learning_rate': 5.139818028389832e-06, 'epoch': 1.34} {'loss': 0.2731, 'learning_rate': 5.139524403902356e-06, 'epoch': 1.34} {'loss': 0.4233, 'learning_rate': 5.139230784901437e-06, 'epoch': 1.34} {'loss': 0.2731, 'learning_rate': 5.1389371713873985e-06, 'epoch': 1.34} {'loss': 0.5088, 'learning_rate': 5.138643563360579e-06, 'epoch': 1.34} {'loss': 0.414, 'learning_rate': 5.138349960821306e-06, 'epoch': 1.34} {'loss': 0.3415, 'learning_rate': 5.138056363769909e-06, 'epoch': 1.34} {'loss': 0.3455, 'learning_rate': 5.1377627722067246e-06, 'epoch': 1.34} {'loss': 0.4191, 'learning_rate': 5.137469186132078e-06, 'epoch': 1.34} {'loss': 0.2979, 'learning_rate': 5.1371756055463075e-06, 'epoch': 1.34} {'loss': 0.4202, 'learning_rate': 5.1368820304497365e-06, 'epoch': 1.34} {'loss': 0.2247, 'learning_rate': 5.1365884608427065e-06, 'epoch': 1.34} {'loss': 0.2097, 'learning_rate': 5.136294896725539e-06, 'epoch': 1.34} {'loss': 0.307, 'learning_rate': 5.136001338098573e-06, 'epoch': 1.34} {'loss': 0.2774, 'learning_rate': 5.135707784962133e-06, 'epoch': 1.34} {'loss': 0.1602, 'learning_rate': 5.135414237316558e-06, 'epoch': 1.34} {'loss': 0.3849, 'learning_rate': 5.13512069516217e-06, 'epoch': 1.34} {'loss': 0.3008, 'learning_rate': 5.1348271584993115e-06, 'epoch': 1.34} {'loss': 0.3943, 'learning_rate': 5.134533627328306e-06, 'epoch': 1.34} {'loss': 0.3578, 'learning_rate': 5.134240101649486e-06, 'epoch': 1.34} {'loss': 0.4591, 'learning_rate': 5.133946581463185e-06, 'epoch': 1.34} {'loss': 0.2656, 'learning_rate': 5.13365306676973e-06, 'epoch': 1.34} {'loss': 0.2903, 'learning_rate': 5.133359557569458e-06, 'epoch': 1.34} {'loss': 0.2642, 'learning_rate': 5.133066053862694e-06, 'epoch': 1.34} {'loss': 0.337, 'learning_rate': 5.132772555649778e-06, 'epoch': 1.34} {'loss': 0.2355, 'learning_rate': 5.132479062931032e-06, 'epoch': 1.34} {'loss': 0.233, 'learning_rate': 5.132185575706795e-06, 'epoch': 1.34} {'loss': 0.2918, 'learning_rate': 5.131892093977391e-06, 'epoch': 1.34} {'loss': 0.2927, 'learning_rate': 5.13159861774316e-06, 'epoch': 1.34} {'loss': 0.3292, 'learning_rate': 5.131305147004424e-06, 'epoch': 1.34} {'loss': 0.2959, 'learning_rate': 5.131011681761522e-06, 'epoch': 1.34} {'loss': 0.4998, 'learning_rate': 5.130718222014781e-06, 'epoch': 1.34} {'loss': 0.3623, 'learning_rate': 5.130424767764528e-06, 'epoch': 1.34} {'loss': 0.2731, 'learning_rate': 5.130131319011105e-06, 'epoch': 1.34} {'loss': 0.2123, 'learning_rate': 5.129837875754835e-06, 'epoch': 1.34} {'loss': 0.3111, 'learning_rate': 5.129544437996055e-06, 'epoch': 1.34} {'loss': 0.2232, 'learning_rate': 5.12925100573509e-06, 'epoch': 1.34} {'loss': 0.2626, 'learning_rate': 5.128957578972278e-06, 'epoch': 1.34} {'loss': 0.2277, 'learning_rate': 5.128664157707947e-06, 'epoch': 1.34} {'loss': 0.2062, 'learning_rate': 5.128370741942424e-06, 'epoch': 1.34} {'loss': 0.309, 'learning_rate': 5.128077331676047e-06, 'epoch': 1.34} {'loss': 0.3564, 'learning_rate': 5.12778392690914e-06, 'epoch': 1.34} {'loss': 0.2597, 'learning_rate': 5.127490527642043e-06, 'epoch': 1.35} {'loss': 0.4859, 'learning_rate': 5.127197133875079e-06, 'epoch': 1.35} {'loss': 0.3675, 'learning_rate': 5.126903745608587e-06, 'epoch': 1.35} {'loss': 0.334, 'learning_rate': 5.1266103628428895e-06, 'epoch': 1.35} {'loss': 0.347, 'learning_rate': 5.126316985578327e-06, 'epoch': 1.35} {'loss': 0.3451, 'learning_rate': 5.126023613815221e-06, 'epoch': 1.35} {'loss': 0.321, 'learning_rate': 5.125730247553911e-06, 'epoch': 1.35} {'loss': 0.3186, 'learning_rate': 5.125436886794722e-06, 'epoch': 1.35} {'loss': 0.3378, 'learning_rate': 5.125143531537991e-06, 'epoch': 1.35} {'loss': 0.3761, 'learning_rate': 5.124850181784047e-06, 'epoch': 1.35} {'loss': 0.2987, 'learning_rate': 5.124556837533214e-06, 'epoch': 1.35} {'loss': 0.3219, 'learning_rate': 5.124263498785835e-06, 'epoch': 1.35} {'loss': 0.2643, 'learning_rate': 5.123970165542231e-06, 'epoch': 1.35} {'loss': 0.2977, 'learning_rate': 5.123676837802743e-06, 'epoch': 1.35} {'loss': 0.3502, 'learning_rate': 5.12338351556769e-06, 'epoch': 1.35} {'loss': 0.4543, 'learning_rate': 5.123090198837415e-06, 'epoch': 1.35} {'loss': 0.3745, 'learning_rate': 5.122796887612238e-06, 'epoch': 1.35} {'loss': 0.1464, 'learning_rate': 5.1225035818925015e-06, 'epoch': 1.35} {'loss': 0.3285, 'learning_rate': 5.122210281678528e-06, 'epoch': 1.35} {'loss': 0.1856, 'learning_rate': 5.1219169869706545e-06, 'epoch': 1.35} {'loss': 0.3321, 'learning_rate': 5.121623697769204e-06, 'epoch': 1.35} {'loss': 0.5294, 'learning_rate': 5.121330414074517e-06, 'epoch': 1.35} {'loss': 0.4183, 'learning_rate': 5.121037135886922e-06, 'epoch': 1.35} {'loss': 0.2636, 'learning_rate': 5.120743863206743e-06, 'epoch': 1.35} {'loss': 0.239, 'learning_rate': 5.1204505960343195e-06, 'epoch': 1.35} {'loss': 0.3006, 'learning_rate': 5.1201573343699765e-06, 'epoch': 1.35} {'loss': 0.3283, 'learning_rate': 5.119864078214052e-06, 'epoch': 1.35} {'loss': 0.3809, 'learning_rate': 5.1195708275668686e-06, 'epoch': 1.35} {'loss': 0.545, 'learning_rate': 5.119277582428765e-06, 'epoch': 1.35} {'loss': 0.3271, 'learning_rate': 5.1189843428000664e-06, 'epoch': 1.35} {'loss': 0.2904, 'learning_rate': 5.118691108681109e-06, 'epoch': 1.35} {'loss': 0.4151, 'learning_rate': 5.118397880072218e-06, 'epoch': 1.35} {'loss': 0.3688, 'learning_rate': 5.118104656973731e-06, 'epoch': 1.35} {'loss': 0.3442, 'learning_rate': 5.117811439385971e-06, 'epoch': 1.35} {'loss': 0.2778, 'learning_rate': 5.1175182273092795e-06, 'epoch': 1.35} {'loss': 0.3983, 'learning_rate': 5.11722502074398e-06, 'epoch': 1.35} {'loss': 0.3241, 'learning_rate': 5.116931819690401e-06, 'epoch': 1.35} {'loss': 0.2425, 'learning_rate': 5.116638624148882e-06, 'epoch': 1.35} {'loss': 0.327, 'learning_rate': 5.116345434119745e-06, 'epoch': 1.35} {'loss': 0.3123, 'learning_rate': 5.11605224960333e-06, 'epoch': 1.35} {'loss': 0.4272, 'learning_rate': 5.115759070599957e-06, 'epoch': 1.35} {'loss': 0.2685, 'learning_rate': 5.115465897109969e-06, 'epoch': 1.35} {'loss': 0.2598, 'learning_rate': 5.115172729133686e-06, 'epoch': 1.35} {'loss': 0.2991, 'learning_rate': 5.11487956667145e-06, 'epoch': 1.35} {'loss': 0.4319, 'learning_rate': 5.114586409723581e-06, 'epoch': 1.35} {'loss': 0.36, 'learning_rate': 5.114293258290419e-06, 'epoch': 1.35} {'loss': 0.4073, 'learning_rate': 5.114000112372287e-06, 'epoch': 1.35} {'loss': 0.3853, 'learning_rate': 5.113706971969523e-06, 'epoch': 1.35} {'loss': 0.3327, 'learning_rate': 5.1134138370824546e-06, 'epoch': 1.35} {'loss': 0.3481, 'learning_rate': 5.1131207077114095e-06, 'epoch': 1.35} {'loss': 0.2969, 'learning_rate': 5.112827583856727e-06, 'epoch': 1.35} {'loss': 0.302, 'learning_rate': 5.112534465518728e-06, 'epoch': 1.35} {'loss': 0.3567, 'learning_rate': 5.112241352697751e-06, 'epoch': 1.35} {'loss': 0.2851, 'learning_rate': 5.111948245394121e-06, 'epoch': 1.35} {'loss': 0.2752, 'learning_rate': 5.1116551436081766e-06, 'epoch': 1.35} {'loss': 0.334, 'learning_rate': 5.111362047340238e-06, 'epoch': 1.35} {'loss': 0.3278, 'learning_rate': 5.111068956590648e-06, 'epoch': 1.35} {'loss': 0.4416, 'learning_rate': 5.110775871359725e-06, 'epoch': 1.35} {'loss': 0.3673, 'learning_rate': 5.110482791647813e-06, 'epoch': 1.35} {'loss': 0.3842, 'learning_rate': 5.110189717455232e-06, 'epoch': 1.35} {'loss': 0.3703, 'learning_rate': 5.10989664878232e-06, 'epoch': 1.35} {'loss': 0.2252, 'learning_rate': 5.109603585629404e-06, 'epoch': 1.35} {'loss': 0.3028, 'learning_rate': 5.109310527996812e-06, 'epoch': 1.35} {'loss': 0.3582, 'learning_rate': 5.109017475884883e-06, 'epoch': 1.35} {'loss': 0.3572, 'learning_rate': 5.1087244292939385e-06, 'epoch': 1.35} {'loss': 0.3108, 'learning_rate': 5.10843138822432e-06, 'epoch': 1.35} {'loss': 0.4744, 'learning_rate': 5.108138352676346e-06, 'epoch': 1.35} {'loss': 0.3175, 'learning_rate': 5.107845322650359e-06, 'epoch': 1.35} {'loss': 0.3234, 'learning_rate': 5.107552298146679e-06, 'epoch': 1.35} {'loss': 0.2712, 'learning_rate': 5.107259279165647e-06, 'epoch': 1.35} {'loss': 0.2463, 'learning_rate': 5.1069662657075845e-06, 'epoch': 1.35} {'loss': 0.2303, 'learning_rate': 5.106673257772832e-06, 'epoch': 1.35} {'loss': 0.3131, 'learning_rate': 5.106380255361709e-06, 'epoch': 1.35} {'loss': 0.3299, 'learning_rate': 5.106087258474557e-06, 'epoch': 1.35} {'loss': 0.3701, 'learning_rate': 5.105794267111701e-06, 'epoch': 1.35} {'loss': 0.4616, 'learning_rate': 5.105501281273471e-06, 'epoch': 1.35} {'loss': 0.3096, 'learning_rate': 5.105208300960201e-06, 'epoch': 1.35} {'loss': 0.3152, 'learning_rate': 5.104915326172217e-06, 'epoch': 1.35} {'loss': 0.2159, 'learning_rate': 5.104622356909856e-06, 'epoch': 1.35} {'loss': 0.3357, 'learning_rate': 5.104329393173442e-06, 'epoch': 1.35} {'loss': 0.2522, 'learning_rate': 5.104036434963313e-06, 'epoch': 1.35} {'loss': 0.2564, 'learning_rate': 5.103743482279793e-06, 'epoch': 1.35} {'loss': 0.1828, 'learning_rate': 5.103450535123218e-06, 'epoch': 1.35} {'loss': 0.2722, 'learning_rate': 5.103157593493913e-06, 'epoch': 1.35} {'loss': 0.3683, 'learning_rate': 5.102864657392215e-06, 'epoch': 1.35} {'loss': 0.3883, 'learning_rate': 5.102571726818448e-06, 'epoch': 1.35} {'loss': 0.2187, 'learning_rate': 5.1022788017729505e-06, 'epoch': 1.35} {'loss': 0.4461, 'learning_rate': 5.101985882256049e-06, 'epoch': 1.35} {'loss': 0.3848, 'learning_rate': 5.10169296826807e-06, 'epoch': 1.35} {'loss': 0.3103, 'learning_rate': 5.101400059809347e-06, 'epoch': 1.35} {'loss': 0.323, 'learning_rate': 5.101107156880214e-06, 'epoch': 1.35} {'loss': 0.3587, 'learning_rate': 5.100814259481002e-06, 'epoch': 1.35} {'loss': 0.366, 'learning_rate': 5.1005213676120345e-06, 'epoch': 1.35} {'loss': 0.3147, 'learning_rate': 5.100228481273653e-06, 'epoch': 1.35} {'loss': 0.368, 'learning_rate': 5.099935600466176e-06, 'epoch': 1.35} {'loss': 0.4419, 'learning_rate': 5.099642725189944e-06, 'epoch': 1.35} {'loss': 0.2851, 'learning_rate': 5.099349855445283e-06, 'epoch': 1.35} {'loss': 0.509, 'learning_rate': 5.099056991232523e-06, 'epoch': 1.35} {'loss': 0.2934, 'learning_rate': 5.098764132551996e-06, 'epoch': 1.35} {'loss': 0.2393, 'learning_rate': 5.0984712794040306e-06, 'epoch': 1.35} {'loss': 0.3642, 'learning_rate': 5.098178431788963e-06, 'epoch': 1.35} {'loss': 0.3602, 'learning_rate': 5.097885589707114e-06, 'epoch': 1.35} {'loss': 0.2822, 'learning_rate': 5.097592753158825e-06, 'epoch': 1.35} {'loss': 0.3546, 'learning_rate': 5.097299922144419e-06, 'epoch': 1.35} {'loss': 0.306, 'learning_rate': 5.0970070966642305e-06, 'epoch': 1.35} {'loss': 0.3136, 'learning_rate': 5.096714276718586e-06, 'epoch': 1.35} {'loss': 0.4691, 'learning_rate': 5.096421462307824e-06, 'epoch': 1.35} {'loss': 0.3458, 'learning_rate': 5.096128653432264e-06, 'epoch': 1.35} {'loss': 0.2414, 'learning_rate': 5.095835850092246e-06, 'epoch': 1.35} {'loss': 0.2857, 'learning_rate': 5.0955430522880976e-06, 'epoch': 1.35} {'loss': 0.3484, 'learning_rate': 5.095250260020144e-06, 'epoch': 1.35} {'loss': 0.2854, 'learning_rate': 5.0949574732887244e-06, 'epoch': 1.35} {'loss': 0.2996, 'learning_rate': 5.094664692094161e-06, 'epoch': 1.35} {'loss': 0.3015, 'learning_rate': 5.094371916436793e-06, 'epoch': 1.35} {'loss': 0.2554, 'learning_rate': 5.0940791463169415e-06, 'epoch': 1.35} {'loss': 0.2974, 'learning_rate': 5.093786381734947e-06, 'epoch': 1.35} {'loss': 0.4218, 'learning_rate': 5.093493622691128e-06, 'epoch': 1.35} {'loss': 0.3435, 'learning_rate': 5.093200869185828e-06, 'epoch': 1.35} {'loss': 0.3686, 'learning_rate': 5.092908121219366e-06, 'epoch': 1.35} {'loss': 0.3884, 'learning_rate': 5.092615378792083e-06, 'epoch': 1.35} {'loss': 0.3973, 'learning_rate': 5.092322641904299e-06, 'epoch': 1.35} {'loss': 0.312, 'learning_rate': 5.092029910556353e-06, 'epoch': 1.35} {'loss': 0.3425, 'learning_rate': 5.091737184748573e-06, 'epoch': 1.35} {'loss': 0.2389, 'learning_rate': 5.091444464481283e-06, 'epoch': 1.35} {'loss': 0.3941, 'learning_rate': 5.091151749754825e-06, 'epoch': 1.35} {'loss': 0.3567, 'learning_rate': 5.090859040569518e-06, 'epoch': 1.35} {'loss': 0.1918, 'learning_rate': 5.090566336925702e-06, 'epoch': 1.35} {'loss': 0.3083, 'learning_rate': 5.090273638823698e-06, 'epoch': 1.35} {'loss': 0.3928, 'learning_rate': 5.089980946263846e-06, 'epoch': 1.35} {'loss': 0.2987, 'learning_rate': 5.089688259246468e-06, 'epoch': 1.35} {'loss': 0.2865, 'learning_rate': 5.089395577771901e-06, 'epoch': 1.35} {'loss': 0.332, 'learning_rate': 5.0891029018404705e-06, 'epoch': 1.35} {'loss': 0.484, 'learning_rate': 5.088810231452512e-06, 'epoch': 1.35} {'loss': 0.2413, 'learning_rate': 5.08851756660835e-06, 'epoch': 1.35} {'loss': 0.3259, 'learning_rate': 5.0882249073083205e-06, 'epoch': 1.35} {'loss': 0.317, 'learning_rate': 5.087932253552751e-06, 'epoch': 1.35} {'loss': 0.2729, 'learning_rate': 5.087639605341967e-06, 'epoch': 1.35} {'loss': 0.3548, 'learning_rate': 5.0873469626763095e-06, 'epoch': 1.35} {'loss': 0.3419, 'learning_rate': 5.0870543255561e-06, 'epoch': 1.35} {'loss': 0.2738, 'learning_rate': 5.086761693981675e-06, 'epoch': 1.35} {'loss': 0.4117, 'learning_rate': 5.086469067953356e-06, 'epoch': 1.35} {'loss': 0.3437, 'learning_rate': 5.086176447471485e-06, 'epoch': 1.35} {'loss': 0.2539, 'learning_rate': 5.08588383253638e-06, 'epoch': 1.35} {'loss': 0.3151, 'learning_rate': 5.085591223148385e-06, 'epoch': 1.35} {'loss': 0.2813, 'learning_rate': 5.085298619307817e-06, 'epoch': 1.35} {'loss': 0.3776, 'learning_rate': 5.085006021015016e-06, 'epoch': 1.35} {'loss': 0.4268, 'learning_rate': 5.084713428270306e-06, 'epoch': 1.35} {'loss': 0.4284, 'learning_rate': 5.084420841074023e-06, 'epoch': 1.35} {'loss': 0.3269, 'learning_rate': 5.084128259426494e-06, 'epoch': 1.35} {'loss': 0.3271, 'learning_rate': 5.083835683328045e-06, 'epoch': 1.35} {'loss': 0.3763, 'learning_rate': 5.083543112779016e-06, 'epoch': 1.35} {'loss': 0.2287, 'learning_rate': 5.083250547779728e-06, 'epoch': 1.35} {'loss': 0.3356, 'learning_rate': 5.082957988330517e-06, 'epoch': 1.35} {'loss': 0.3141, 'learning_rate': 5.082665434431709e-06, 'epoch': 1.35} {'loss': 0.2853, 'learning_rate': 5.082372886083641e-06, 'epoch': 1.35} {'loss': 0.2411, 'learning_rate': 5.082080343286634e-06, 'epoch': 1.35} {'loss': 0.5086, 'learning_rate': 5.081787806041027e-06, 'epoch': 1.35} {'loss': 0.241, 'learning_rate': 5.081495274347144e-06, 'epoch': 1.35} {'loss': 0.4459, 'learning_rate': 5.081202748205319e-06, 'epoch': 1.35} {'loss': 0.3045, 'learning_rate': 5.080910227615878e-06, 'epoch': 1.35} {'loss': 0.2611, 'learning_rate': 5.080617712579159e-06, 'epoch': 1.35} {'loss': 0.3731, 'learning_rate': 5.0803252030954855e-06, 'epoch': 1.35} {'loss': 0.3925, 'learning_rate': 5.0800326991651865e-06, 'epoch': 1.35} {'loss': 0.3352, 'learning_rate': 5.079740200788598e-06, 'epoch': 1.35} {'loss': 0.3387, 'learning_rate': 5.079447707966043e-06, 'epoch': 1.35} {'loss': 0.388, 'learning_rate': 5.079155220697861e-06, 'epoch': 1.35} {'loss': 0.4187, 'learning_rate': 5.0788627389843725e-06, 'epoch': 1.35} {'loss': 0.3351, 'learning_rate': 5.078570262825916e-06, 'epoch': 1.35} {'loss': 0.3886, 'learning_rate': 5.078277792222815e-06, 'epoch': 1.35} {'loss': 0.2478, 'learning_rate': 5.0779853271754054e-06, 'epoch': 1.35} {'loss': 0.3149, 'learning_rate': 5.07769286768401e-06, 'epoch': 1.35} {'loss': 0.3274, 'learning_rate': 5.077400413748967e-06, 'epoch': 1.35} {'loss': 0.2802, 'learning_rate': 5.0771079653706e-06, 'epoch': 1.35} {'loss': 0.3109, 'learning_rate': 5.076815522549245e-06, 'epoch': 1.35} {'loss': 0.5283, 'learning_rate': 5.07652308528523e-06, 'epoch': 1.35} {'loss': 0.3103, 'learning_rate': 5.07623065357888e-06, 'epoch': 1.35} {'loss': 0.2984, 'learning_rate': 5.075938227430534e-06, 'epoch': 1.35} {'loss': 0.3578, 'learning_rate': 5.075645806840512e-06, 'epoch': 1.35} {'loss': 0.2625, 'learning_rate': 5.075353391809155e-06, 'epoch': 1.35} {'loss': 0.355, 'learning_rate': 5.075060982336781e-06, 'epoch': 1.35} {'loss': 0.2324, 'learning_rate': 5.0747685784237336e-06, 'epoch': 1.35} {'loss': 0.2804, 'learning_rate': 5.07447618007033e-06, 'epoch': 1.35} {'loss': 0.3151, 'learning_rate': 5.0741837872769105e-06, 'epoch': 1.35} {'loss': 0.2065, 'learning_rate': 5.0738914000437975e-06, 'epoch': 1.35} {'loss': 0.3472, 'learning_rate': 5.073599018371328e-06, 'epoch': 1.35} {'loss': 0.243, 'learning_rate': 5.073306642259824e-06, 'epoch': 1.35} {'loss': 0.2514, 'learning_rate': 5.073014271709624e-06, 'epoch': 1.35} {'loss': 0.306, 'learning_rate': 5.072721906721054e-06, 'epoch': 1.35} {'loss': 0.3081, 'learning_rate': 5.072429547294441e-06, 'epoch': 1.35} {'loss': 0.417, 'learning_rate': 5.072137193430118e-06, 'epoch': 1.35} {'loss': 0.2396, 'learning_rate': 5.071844845128413e-06, 'epoch': 1.35} {'loss': 0.4287, 'learning_rate': 5.071552502389664e-06, 'epoch': 1.35} {'loss': 0.2227, 'learning_rate': 5.07126016521419e-06, 'epoch': 1.35} {'loss': 0.2547, 'learning_rate': 5.07096783360233e-06, 'epoch': 1.35} {'loss': 0.333, 'learning_rate': 5.07067550755441e-06, 'epoch': 1.35} {'loss': 0.2966, 'learning_rate': 5.070383187070758e-06, 'epoch': 1.35} {'loss': 0.3312, 'learning_rate': 5.070090872151707e-06, 'epoch': 1.35} {'loss': 0.2524, 'learning_rate': 5.069798562797585e-06, 'epoch': 1.35} {'loss': 0.3305, 'learning_rate': 5.069506259008724e-06, 'epoch': 1.35} {'loss': 0.3375, 'learning_rate': 5.069213960785451e-06, 'epoch': 1.35} {'loss': 0.3355, 'learning_rate': 5.0689216681280995e-06, 'epoch': 1.35} {'loss': 0.3848, 'learning_rate': 5.068629381036996e-06, 'epoch': 1.35} {'loss': 0.3894, 'learning_rate': 5.068337099512475e-06, 'epoch': 1.35} {'loss': 0.2679, 'learning_rate': 5.068044823554861e-06, 'epoch': 1.35} {'loss': 0.3344, 'learning_rate': 5.067752553164489e-06, 'epoch': 1.35} {'loss': 0.303, 'learning_rate': 5.067460288341682e-06, 'epoch': 1.35} {'loss': 0.4389, 'learning_rate': 5.06716802908678e-06, 'epoch': 1.35} {'loss': 0.2833, 'learning_rate': 5.066875775400107e-06, 'epoch': 1.35} {'loss': 0.3523, 'learning_rate': 5.066583527281987e-06, 'epoch': 1.35} {'loss': 0.2485, 'learning_rate': 5.0662912847327625e-06, 'epoch': 1.35} {'loss': 0.4371, 'learning_rate': 5.065999047752752e-06, 'epoch': 1.35} {'loss': 0.2242, 'learning_rate': 5.065706816342295e-06, 'epoch': 1.35} {'loss': 0.331, 'learning_rate': 5.0654145905017125e-06, 'epoch': 1.35} {'loss': 0.3554, 'learning_rate': 5.065122370231342e-06, 'epoch': 1.35} {'loss': 0.4351, 'learning_rate': 5.064830155531507e-06, 'epoch': 1.35} {'loss': 0.2968, 'learning_rate': 5.064537946402544e-06, 'epoch': 1.35} {'loss': 0.2666, 'learning_rate': 5.064245742844775e-06, 'epoch': 1.35} {'loss': 0.4245, 'learning_rate': 5.0639535448585375e-06, 'epoch': 1.35} {'loss': 0.3781, 'learning_rate': 5.0636613524441535e-06, 'epoch': 1.35} {'loss': 0.4607, 'learning_rate': 5.063369165601961e-06, 'epoch': 1.35} {'loss': 0.3662, 'learning_rate': 5.063076984332284e-06, 'epoch': 1.35} {'loss': 0.4246, 'learning_rate': 5.062784808635457e-06, 'epoch': 1.35} {'loss': 0.2751, 'learning_rate': 5.062492638511807e-06, 'epoch': 1.35} {'loss': 0.2093, 'learning_rate': 5.062200473961659e-06, 'epoch': 1.35} {'loss': 0.2989, 'learning_rate': 5.0619083149853535e-06, 'epoch': 1.35} {'loss': 0.3953, 'learning_rate': 5.06161616158321e-06, 'epoch': 1.35} {'loss': 0.382, 'learning_rate': 5.061324013755565e-06, 'epoch': 1.35} {'loss': 0.3906, 'learning_rate': 5.061031871502744e-06, 'epoch': 1.35} {'loss': 0.468, 'learning_rate': 5.060739734825082e-06, 'epoch': 1.35} {'loss': 0.1647, 'learning_rate': 5.060447603722902e-06, 'epoch': 1.35} {'loss': 0.2999, 'learning_rate': 5.060155478196541e-06, 'epoch': 1.35} {'loss': 0.2704, 'learning_rate': 5.059863358246322e-06, 'epoch': 1.35} {'loss': 0.3415, 'learning_rate': 5.059571243872581e-06, 'epoch': 1.35} {'loss': 0.4268, 'learning_rate': 5.059279135075641e-06, 'epoch': 1.35} {'loss': 0.2006, 'learning_rate': 5.058987031855839e-06, 'epoch': 1.35} {'loss': 0.1872, 'learning_rate': 5.058694934213501e-06, 'epoch': 1.35} {'loss': 0.3789, 'learning_rate': 5.058402842148953e-06, 'epoch': 1.35} {'loss': 0.1937, 'learning_rate': 5.058110755662533e-06, 'epoch': 1.35} {'loss': 0.3743, 'learning_rate': 5.057818674754561e-06, 'epoch': 1.35} {'loss': 0.4199, 'learning_rate': 5.0575265994253764e-06, 'epoch': 1.35} {'loss': 0.3636, 'learning_rate': 5.057234529675301e-06, 'epoch': 1.35} {'loss': 0.4087, 'learning_rate': 5.0569424655046716e-06, 'epoch': 1.35} {'loss': 0.3466, 'learning_rate': 5.05665040691381e-06, 'epoch': 1.35} {'loss': 0.2793, 'learning_rate': 5.0563583539030544e-06, 'epoch': 1.35} {'loss': 0.3302, 'learning_rate': 5.056066306472726e-06, 'epoch': 1.35} {'loss': 0.3337, 'learning_rate': 5.055774264623162e-06, 'epoch': 1.35} {'loss': 0.2571, 'learning_rate': 5.055482228354685e-06, 'epoch': 1.35} {'loss': 0.3606, 'learning_rate': 5.055190197667633e-06, 'epoch': 1.35} {'loss': 0.4288, 'learning_rate': 5.05489817256233e-06, 'epoch': 1.35} {'loss': 0.4436, 'learning_rate': 5.054606153039103e-06, 'epoch': 1.35} {'loss': 0.3889, 'learning_rate': 5.054314139098291e-06, 'epoch': 1.35} {'loss': 0.2805, 'learning_rate': 5.054022130740212e-06, 'epoch': 1.35} {'loss': 0.3969, 'learning_rate': 5.053730127965205e-06, 'epoch': 1.35} {'loss': 0.2606, 'learning_rate': 5.053438130773593e-06, 'epoch': 1.35} {'loss': 0.2814, 'learning_rate': 5.053146139165712e-06, 'epoch': 1.35} {'loss': 0.3558, 'learning_rate': 5.052854153141886e-06, 'epoch': 1.35} {'loss': 0.2837, 'learning_rate': 5.052562172702449e-06, 'epoch': 1.35} {'loss': 0.3485, 'learning_rate': 5.052270197847726e-06, 'epoch': 1.35} {'loss': 0.3934, 'learning_rate': 5.051978228578052e-06, 'epoch': 1.35} {'loss': 0.3431, 'learning_rate': 5.051686264893749e-06, 'epoch': 1.35} {'loss': 0.2839, 'learning_rate': 5.051394306795156e-06, 'epoch': 1.35} {'loss': 0.3893, 'learning_rate': 5.0511023542825995e-06, 'epoch': 1.35} {'loss': 0.3254, 'learning_rate': 5.050810407356401e-06, 'epoch': 1.35} {'loss': 0.3053, 'learning_rate': 5.050518466016903e-06, 'epoch': 1.35} {'loss': 0.3391, 'learning_rate': 5.0502265302644215e-06, 'epoch': 1.35} {'loss': 0.423, 'learning_rate': 5.049934600099299e-06, 'epoch': 1.35} {'loss': 0.2333, 'learning_rate': 5.049642675521854e-06, 'epoch': 1.35} {'loss': 0.3641, 'learning_rate': 5.049350756532425e-06, 'epoch': 1.35} {'loss': 0.3241, 'learning_rate': 5.0490588431313345e-06, 'epoch': 1.35} {'loss': 0.1928, 'learning_rate': 5.048766935318919e-06, 'epoch': 1.35} {'loss': 0.4139, 'learning_rate': 5.0484750330955e-06, 'epoch': 1.35} {'loss': 0.4633, 'learning_rate': 5.048183136461415e-06, 'epoch': 1.35} {'loss': 0.4194, 'learning_rate': 5.047891245416985e-06, 'epoch': 1.35} {'loss': 0.4799, 'learning_rate': 5.047599359962549e-06, 'epoch': 1.35} {'loss': 0.4119, 'learning_rate': 5.047307480098431e-06, 'epoch': 1.35} {'loss': 0.237, 'learning_rate': 5.047015605824957e-06, 'epoch': 1.35} {'loss': 0.4114, 'learning_rate': 5.0467237371424645e-06, 'epoch': 1.35} {'loss': 0.4862, 'learning_rate': 5.046431874051277e-06, 'epoch': 1.35} {'loss': 0.3605, 'learning_rate': 5.046140016551727e-06, 'epoch': 1.35} {'loss': 0.2739, 'learning_rate': 5.0458481646441404e-06, 'epoch': 1.35} {'loss': 0.2714, 'learning_rate': 5.045556318328853e-06, 'epoch': 1.35} {'loss': 0.2016, 'learning_rate': 5.045264477606186e-06, 'epoch': 1.35} {'loss': 0.4461, 'learning_rate': 5.044972642476478e-06, 'epoch': 1.35} {'loss': 0.3844, 'learning_rate': 5.044680812940048e-06, 'epoch': 1.35} {'loss': 0.5715, 'learning_rate': 5.044388988997236e-06, 'epoch': 1.35} {'loss': 0.3064, 'learning_rate': 5.044097170648363e-06, 'epoch': 1.35} {'loss': 0.3131, 'learning_rate': 5.043805357893765e-06, 'epoch': 1.35} {'loss': 0.4532, 'learning_rate': 5.04351355073377e-06, 'epoch': 1.35} {'loss': 0.2611, 'learning_rate': 5.043221749168696e-06, 'epoch': 1.35} {'loss': 0.2207, 'learning_rate': 5.04292995319889e-06, 'epoch': 1.35} {'loss': 0.2968, 'learning_rate': 5.042638162824671e-06, 'epoch': 1.35} {'loss': 0.2981, 'learning_rate': 5.042346378046374e-06, 'epoch': 1.35} {'loss': 0.2671, 'learning_rate': 5.042054598864321e-06, 'epoch': 1.35} {'loss': 0.3439, 'learning_rate': 5.041762825278849e-06, 'epoch': 1.35} {'loss': 0.1708, 'learning_rate': 5.041471057290284e-06, 'epoch': 1.35} {'loss': 0.4776, 'learning_rate': 5.0411792948989524e-06, 'epoch': 1.35} {'loss': 0.3234, 'learning_rate': 5.04088753810519e-06, 'epoch': 1.35} {'loss': 0.4593, 'learning_rate': 5.040595786909318e-06, 'epoch': 1.35} {'loss': 0.2632, 'learning_rate': 5.040304041311675e-06, 'epoch': 1.35} {'loss': 0.4315, 'learning_rate': 5.040012301312581e-06, 'epoch': 1.35} {'loss': 0.208, 'learning_rate': 5.0397205669123736e-06, 'epoch': 1.35} {'loss': 0.3833, 'learning_rate': 5.039428838111376e-06, 'epoch': 1.35} {'loss': 0.3236, 'learning_rate': 5.039137114909922e-06, 'epoch': 1.35} {'loss': 0.2709, 'learning_rate': 5.038845397308336e-06, 'epoch': 1.35} {'loss': 0.2397, 'learning_rate': 5.038553685306955e-06, 'epoch': 1.35} {'loss': 0.3833, 'learning_rate': 5.038261978906098e-06, 'epoch': 1.35} {'loss': 0.2574, 'learning_rate': 5.0379702781061034e-06, 'epoch': 1.35} {'loss': 0.2396, 'learning_rate': 5.037678582907297e-06, 'epoch': 1.35} {'loss': 0.3558, 'learning_rate': 5.037386893310006e-06, 'epoch': 1.35} {'loss': 0.3395, 'learning_rate': 5.037095209314563e-06, 'epoch': 1.35} {'loss': 0.2979, 'learning_rate': 5.036803530921293e-06, 'epoch': 1.35} {'loss': 0.3921, 'learning_rate': 5.036511858130531e-06, 'epoch': 1.35} {'loss': 0.3804, 'learning_rate': 5.0362201909426e-06, 'epoch': 1.35} {'loss': 0.4537, 'learning_rate': 5.035928529357837e-06, 'epoch': 1.35} {'loss': 0.2126, 'learning_rate': 5.035636873376561e-06, 'epoch': 1.35} {'loss': 0.3177, 'learning_rate': 5.035345222999113e-06, 'epoch': 1.35} {'loss': 0.2701, 'learning_rate': 5.03505357822581e-06, 'epoch': 1.35} {'loss': 0.3178, 'learning_rate': 5.034761939056993e-06, 'epoch': 1.35} {'loss': 0.3263, 'learning_rate': 5.0344703054929825e-06, 'epoch': 1.35} {'loss': 0.2567, 'learning_rate': 5.034178677534113e-06, 'epoch': 1.35} {'loss': 0.3171, 'learning_rate': 5.0338870551807115e-06, 'epoch': 1.35} {'loss': 0.382, 'learning_rate': 5.033595438433103e-06, 'epoch': 1.35} {'loss': 0.2859, 'learning_rate': 5.033303827291627e-06, 'epoch': 1.35} {'loss': 0.3369, 'learning_rate': 5.0330122217566004e-06, 'epoch': 1.35} {'loss': 0.1667, 'learning_rate': 5.032720621828363e-06, 'epoch': 1.35} {'loss': 0.4167, 'learning_rate': 5.032429027507235e-06, 'epoch': 1.35} {'loss': 0.4695, 'learning_rate': 5.032137438793555e-06, 'epoch': 1.35} {'loss': 0.324, 'learning_rate': 5.031845855687642e-06, 'epoch': 1.35} {'loss': 0.2506, 'learning_rate': 5.031554278189836e-06, 'epoch': 1.35} {'loss': 0.3322, 'learning_rate': 5.031262706300455e-06, 'epoch': 1.35} {'loss': 0.3037, 'learning_rate': 5.030971140019838e-06, 'epoch': 1.35} {'loss': 0.4022, 'learning_rate': 5.0306795793483056e-06, 'epoch': 1.35} {'loss': 0.2749, 'learning_rate': 5.0303880242861946e-06, 'epoch': 1.35} {'loss': 0.2205, 'learning_rate': 5.030096474833831e-06, 'epoch': 1.35} {'loss': 0.2393, 'learning_rate': 5.02980493099154e-06, 'epoch': 1.35} {'loss': 0.2866, 'learning_rate': 5.0295133927596574e-06, 'epoch': 1.35} {'loss': 0.4118, 'learning_rate': 5.0292218601385044e-06, 'epoch': 1.35} {'loss': 0.4202, 'learning_rate': 5.028930333128419e-06, 'epoch': 1.35} {'loss': 0.3883, 'learning_rate': 5.028638811729722e-06, 'epoch': 1.35} {'loss': 0.2465, 'learning_rate': 5.028347295942752e-06, 'epoch': 1.35} {'loss': 0.3366, 'learning_rate': 5.028055785767827e-06, 'epoch': 1.35} {'loss': 0.3469, 'learning_rate': 5.027764281205285e-06, 'epoch': 1.35} {'loss': 0.3518, 'learning_rate': 5.027472782255449e-06, 'epoch': 1.35} {'loss': 0.241, 'learning_rate': 5.0271812889186545e-06, 'epoch': 1.35} {'loss': 0.3986, 'learning_rate': 5.026889801195223e-06, 'epoch': 1.35} {'loss': 0.3868, 'learning_rate': 5.026598319085489e-06, 'epoch': 1.35} {'loss': 0.4951, 'learning_rate': 5.026306842589781e-06, 'epoch': 1.35} {'loss': 0.3165, 'learning_rate': 5.026015371708423e-06, 'epoch': 1.35} {'loss': 0.3506, 'learning_rate': 5.025723906441753e-06, 'epoch': 1.35} {'loss': 0.245, 'learning_rate': 5.025432446790088e-06, 'epoch': 1.35} {'loss': 0.1406, 'learning_rate': 5.0251409927537695e-06, 'epoch': 1.35} {'loss': 0.3049, 'learning_rate': 5.024849544333118e-06, 'epoch': 1.35} {'loss': 0.4082, 'learning_rate': 5.024558101528467e-06, 'epoch': 1.35} {'loss': 0.2843, 'learning_rate': 5.024266664340142e-06, 'epoch': 1.35} {'loss': 0.3535, 'learning_rate': 5.023975232768476e-06, 'epoch': 1.35} {'loss': 0.3572, 'learning_rate': 5.023683806813793e-06, 'epoch': 1.35} {'loss': 0.3094, 'learning_rate': 5.023392386476427e-06, 'epoch': 1.35} {'loss': 0.3359, 'learning_rate': 5.0231009717567024e-06, 'epoch': 1.35} {'loss': 0.3844, 'learning_rate': 5.022809562654953e-06, 'epoch': 1.35} {'loss': 0.4144, 'learning_rate': 5.022518159171506e-06, 'epoch': 1.35} {'loss': 0.3593, 'learning_rate': 5.022226761306685e-06, 'epoch': 1.35} {'loss': 0.3031, 'learning_rate': 5.021935369060829e-06, 'epoch': 1.35} {'loss': 0.3284, 'learning_rate': 5.021643982434255e-06, 'epoch': 1.35} {'loss': 0.3845, 'learning_rate': 5.021352601427303e-06, 'epoch': 1.35} {'loss': 0.2833, 'learning_rate': 5.021061226040293e-06, 'epoch': 1.35} {'loss': 0.236, 'learning_rate': 5.020769856273564e-06, 'epoch': 1.35} {'loss': 0.3267, 'learning_rate': 5.020478492127434e-06, 'epoch': 1.35} {'loss': 0.2672, 'learning_rate': 5.02018713360224e-06, 'epoch': 1.35} {'loss': 0.3072, 'learning_rate': 5.019895780698304e-06, 'epoch': 1.35} {'loss': 0.3595, 'learning_rate': 5.019604433415963e-06, 'epoch': 1.35} {'loss': 0.3485, 'learning_rate': 5.019313091755538e-06, 'epoch': 1.35} {'loss': 0.3421, 'learning_rate': 5.019021755717364e-06, 'epoch': 1.35} {'loss': 0.3245, 'learning_rate': 5.018730425301768e-06, 'epoch': 1.35} {'loss': 0.4138, 'learning_rate': 5.018439100509074e-06, 'epoch': 1.35} {'loss': 0.3123, 'learning_rate': 5.018147781339619e-06, 'epoch': 1.35} {'loss': 0.2895, 'learning_rate': 5.0178564677937245e-06, 'epoch': 1.35} {'loss': 0.4681, 'learning_rate': 5.017565159871727e-06, 'epoch': 1.35} {'loss': 0.2873, 'learning_rate': 5.017273857573946e-06, 'epoch': 1.35} {'loss': 0.4375, 'learning_rate': 5.0169825609007186e-06, 'epoch': 1.35} {'loss': 0.3266, 'learning_rate': 5.016691269852368e-06, 'epoch': 1.35} {'loss': 0.3347, 'learning_rate': 5.016399984429228e-06, 'epoch': 1.35} {'loss': 0.3476, 'learning_rate': 5.016108704631622e-06, 'epoch': 1.35} {'loss': 0.4507, 'learning_rate': 5.015817430459884e-06, 'epoch': 1.35} {'loss': 0.3809, 'learning_rate': 5.015526161914337e-06, 'epoch': 1.35} {'loss': 0.303, 'learning_rate': 5.015234898995317e-06, 'epoch': 1.35} {'loss': 0.2292, 'learning_rate': 5.014943641703145e-06, 'epoch': 1.35} {'loss': 0.204, 'learning_rate': 5.014652390038157e-06, 'epoch': 1.35} {'loss': 0.4182, 'learning_rate': 5.014361144000677e-06, 'epoch': 1.35} {'loss': 0.2282, 'learning_rate': 5.014069903591032e-06, 'epoch': 1.35} {'loss': 0.3839, 'learning_rate': 5.0137786688095605e-06, 'epoch': 1.35} {'loss': 0.4352, 'learning_rate': 5.0134874396565795e-06, 'epoch': 1.35} {'loss': 0.461, 'learning_rate': 5.013196216132426e-06, 'epoch': 1.35} {'loss': 0.2669, 'learning_rate': 5.012904998237425e-06, 'epoch': 1.35} {'loss': 0.3182, 'learning_rate': 5.012613785971907e-06, 'epoch': 1.35} {'loss': 0.2787, 'learning_rate': 5.012322579336199e-06, 'epoch': 1.35} {'loss': 0.3687, 'learning_rate': 5.012031378330629e-06, 'epoch': 1.35} {'loss': 0.5271, 'learning_rate': 5.011740182955529e-06, 'epoch': 1.35} {'loss': 0.3238, 'learning_rate': 5.011448993211223e-06, 'epoch': 1.35} {'loss': 0.1347, 'learning_rate': 5.011157809098046e-06, 'epoch': 1.35} {'loss': 0.3091, 'learning_rate': 5.010866630616318e-06, 'epoch': 1.35} {'loss': 0.3237, 'learning_rate': 5.010575457766378e-06, 'epoch': 1.35} {'loss': 0.4247, 'learning_rate': 5.010284290548546e-06, 'epoch': 1.35} {'loss': 0.2131, 'learning_rate': 5.009993128963158e-06, 'epoch': 1.35} {'loss': 0.3309, 'learning_rate': 5.0097019730105345e-06, 'epoch': 1.35} {'loss': 0.2673, 'learning_rate': 5.009410822691012e-06, 'epoch': 1.35} {'loss': 0.1879, 'learning_rate': 5.009119678004912e-06, 'epoch': 1.35} {'loss': 0.3633, 'learning_rate': 5.008828538952573e-06, 'epoch': 1.35} {'loss': 0.3944, 'learning_rate': 5.008537405534315e-06, 'epoch': 1.35} {'loss': 0.2167, 'learning_rate': 5.008246277750466e-06, 'epoch': 1.35} {'loss': 0.2857, 'learning_rate': 5.007955155601361e-06, 'epoch': 1.35} {'loss': 0.2425, 'learning_rate': 5.007664039087321e-06, 'epoch': 1.35} {'loss': 0.2594, 'learning_rate': 5.007372928208685e-06, 'epoch': 1.35} {'loss': 0.3128, 'learning_rate': 5.007081822965769e-06, 'epoch': 1.35} {'loss': 0.3215, 'learning_rate': 5.0067907233589145e-06, 'epoch': 1.35} {'loss': 0.2349, 'learning_rate': 5.006499629388437e-06, 'epoch': 1.35} {'loss': 0.3391, 'learning_rate': 5.006208541054678e-06, 'epoch': 1.35} {'loss': 0.3225, 'learning_rate': 5.005917458357956e-06, 'epoch': 1.35} {'loss': 0.502, 'learning_rate': 5.005626381298607e-06, 'epoch': 1.35} {'loss': 0.3672, 'learning_rate': 5.005335309876953e-06, 'epoch': 1.35} {'loss': 0.3726, 'learning_rate': 5.005044244093328e-06, 'epoch': 1.35} {'loss': 0.254, 'learning_rate': 5.004753183948059e-06, 'epoch': 1.35} {'loss': 0.4344, 'learning_rate': 5.00446212944147e-06, 'epoch': 1.35} {'loss': 0.2212, 'learning_rate': 5.004171080573897e-06, 'epoch': 1.35} {'loss': 0.3997, 'learning_rate': 5.0038800373456606e-06, 'epoch': 1.35} {'loss': 0.3997, 'learning_rate': 5.003588999757099e-06, 'epoch': 1.35} {'loss': 0.3177, 'learning_rate': 5.003297967808529e-06, 'epoch': 1.35} {'loss': 0.2203, 'learning_rate': 5.0030069415002906e-06, 'epoch': 1.35} {'loss': 0.3865, 'learning_rate': 5.002715920832703e-06, 'epoch': 1.35} {'loss': 0.3974, 'learning_rate': 5.002424905806103e-06, 'epoch': 1.35} {'loss': 0.3057, 'learning_rate': 5.002133896420811e-06, 'epoch': 1.35} {'loss': 0.2669, 'learning_rate': 5.001842892677164e-06, 'epoch': 1.35} {'loss': 0.2049, 'learning_rate': 5.001551894575482e-06, 'epoch': 1.35} {'loss': 0.3878, 'learning_rate': 5.001260902116101e-06, 'epoch': 1.35} {'loss': 0.4142, 'learning_rate': 5.000969915299345e-06, 'epoch': 1.35} {'loss': 0.337, 'learning_rate': 5.00067893412554e-06, 'epoch': 1.35} {'loss': 0.4739, 'learning_rate': 5.000387958595021e-06, 'epoch': 1.35} {'loss': 0.3198, 'learning_rate': 5.0000969887081105e-06, 'epoch': 1.35} {'loss': 0.3522, 'learning_rate': 4.999806024465144e-06, 'epoch': 1.35} {'loss': 0.2931, 'learning_rate': 4.99951506586644e-06, 'epoch': 1.35} {'loss': 0.2866, 'learning_rate': 4.999224112912339e-06, 'epoch': 1.35} {'loss': 0.3827, 'learning_rate': 4.998933165603157e-06, 'epoch': 1.35} {'loss': 0.3178, 'learning_rate': 4.998642223939233e-06, 'epoch': 1.35} {'loss': 0.3088, 'learning_rate': 4.998351287920887e-06, 'epoch': 1.35} {'loss': 0.3089, 'learning_rate': 4.998060357548455e-06, 'epoch': 1.35} {'loss': 0.2752, 'learning_rate': 4.997769432822258e-06, 'epoch': 1.35} {'loss': 0.3673, 'learning_rate': 4.997478513742632e-06, 'epoch': 1.35} {'loss': 0.4908, 'learning_rate': 4.9971876003099015e-06, 'epoch': 1.35} {'loss': 0.2735, 'learning_rate': 4.996896692524391e-06, 'epoch': 1.35} {'loss': 0.252, 'learning_rate': 4.996605790386437e-06, 'epoch': 1.35} {'loss': 0.407, 'learning_rate': 4.996314893896359e-06, 'epoch': 1.35} {'loss': 0.2006, 'learning_rate': 4.996024003054495e-06, 'epoch': 1.35} {'loss': 0.2403, 'learning_rate': 4.995733117861163e-06, 'epoch': 1.35} {'loss': 0.3906, 'learning_rate': 4.995442238316701e-06, 'epoch': 1.35} {'loss': 0.3629, 'learning_rate': 4.99515136442143e-06, 'epoch': 1.35} {'loss': 0.2596, 'learning_rate': 4.994860496175684e-06, 'epoch': 1.35} {'loss': 0.3077, 'learning_rate': 4.994569633579786e-06, 'epoch': 1.35} {'loss': 0.2098, 'learning_rate': 4.994278776634071e-06, 'epoch': 1.35} {'loss': 0.3755, 'learning_rate': 4.993987925338859e-06, 'epoch': 1.35} {'loss': 0.3675, 'learning_rate': 4.993697079694486e-06, 'epoch': 1.35} {'loss': 0.4057, 'learning_rate': 4.993406239701279e-06, 'epoch': 1.35} {'loss': 0.3539, 'learning_rate': 4.993115405359557e-06, 'epoch': 1.35} {'loss': 0.3403, 'learning_rate': 4.992824576669663e-06, 'epoch': 1.35} {'loss': 0.3836, 'learning_rate': 4.992533753631912e-06, 'epoch': 1.35} {'loss': 0.1455, 'learning_rate': 4.992242936246643e-06, 'epoch': 1.35} {'loss': 0.1611, 'learning_rate': 4.991952124514175e-06, 'epoch': 1.35} {'loss': 0.2892, 'learning_rate': 4.9916613184348435e-06, 'epoch': 1.35} {'loss': 0.4194, 'learning_rate': 4.991370518008972e-06, 'epoch': 1.35} {'loss': 0.2315, 'learning_rate': 4.9910797232368946e-06, 'epoch': 1.35} {'loss': 0.4364, 'learning_rate': 4.990788934118931e-06, 'epoch': 1.35} {'loss': 0.2287, 'learning_rate': 4.990498150655418e-06, 'epoch': 1.35} {'loss': 0.2931, 'learning_rate': 4.990207372846677e-06, 'epoch': 1.35} {'loss': 0.2855, 'learning_rate': 4.989916600693042e-06, 'epoch': 1.35} {'loss': 0.2731, 'learning_rate': 4.989625834194839e-06, 'epoch': 1.35} {'loss': 0.252, 'learning_rate': 4.9893350733523914e-06, 'epoch': 1.35} {'loss': 0.3129, 'learning_rate': 4.989044318166036e-06, 'epoch': 1.35} {'loss': 0.3997, 'learning_rate': 4.9887535686360935e-06, 'epoch': 1.35} {'loss': 0.4337, 'learning_rate': 4.988462824762898e-06, 'epoch': 1.35} {'loss': 0.3222, 'learning_rate': 4.9881720865467705e-06, 'epoch': 1.35} {'loss': 0.4417, 'learning_rate': 4.987881353988049e-06, 'epoch': 1.35} {'loss': 0.2865, 'learning_rate': 4.9875906270870524e-06, 'epoch': 1.35} {'loss': 0.2513, 'learning_rate': 4.987299905844116e-06, 'epoch': 1.35} {'loss': 0.2126, 'learning_rate': 4.987009190259561e-06, 'epoch': 1.35} {'loss': 0.3248, 'learning_rate': 4.9867184803337235e-06, 'epoch': 1.36} {'loss': 0.2225, 'learning_rate': 4.986427776066923e-06, 'epoch': 1.36} {'loss': 0.3589, 'learning_rate': 4.986137077459498e-06, 'epoch': 1.36} {'loss': 0.3835, 'learning_rate': 4.985846384511769e-06, 'epoch': 1.36} {'loss': 0.3515, 'learning_rate': 4.985555697224058e-06, 'epoch': 1.36} {'loss': 0.2679, 'learning_rate': 4.9852650155967095e-06, 'epoch': 1.36} {'loss': 0.2585, 'learning_rate': 4.98497433963004e-06, 'epoch': 1.36} {'loss': 0.3291, 'learning_rate': 4.984683669324384e-06, 'epoch': 1.36} {'loss': 0.3205, 'learning_rate': 4.984393004680061e-06, 'epoch': 1.36} {'loss': 0.3099, 'learning_rate': 4.984102345697411e-06, 'epoch': 1.36} {'loss': 0.308, 'learning_rate': 4.9838116923767544e-06, 'epoch': 1.36} {'loss': 0.3381, 'learning_rate': 4.983521044718416e-06, 'epoch': 1.36} {'loss': 0.4026, 'learning_rate': 4.983230402722734e-06, 'epoch': 1.36} {'loss': 0.1801, 'learning_rate': 4.9829397663900254e-06, 'epoch': 1.36} {'loss': 0.3511, 'learning_rate': 4.982649135720629e-06, 'epoch': 1.36} {'loss': 0.3274, 'learning_rate': 4.982358510714863e-06, 'epoch': 1.36} {'loss': 0.2546, 'learning_rate': 4.9820678913730644e-06, 'epoch': 1.36} {'loss': 0.3643, 'learning_rate': 4.981777277695553e-06, 'epoch': 1.36} {'loss': 0.4209, 'learning_rate': 4.981486669682664e-06, 'epoch': 1.36} {'loss': 0.1971, 'learning_rate': 4.9811960673347196e-06, 'epoch': 1.36} {'loss': 0.301, 'learning_rate': 4.980905470652053e-06, 'epoch': 1.36} {'loss': 0.2817, 'learning_rate': 4.980614879634986e-06, 'epoch': 1.36} {'loss': 0.3423, 'learning_rate': 4.980324294283855e-06, 'epoch': 1.36} {'loss': 0.3308, 'learning_rate': 4.980033714598978e-06, 'epoch': 1.36} {'loss': 0.2534, 'learning_rate': 4.979743140580694e-06, 'epoch': 1.36} {'loss': 0.2475, 'learning_rate': 4.979452572229324e-06, 'epoch': 1.36} {'loss': 0.2563, 'learning_rate': 4.979162009545194e-06, 'epoch': 1.36} {'loss': 0.3473, 'learning_rate': 4.978871452528639e-06, 'epoch': 1.36} {'loss': 0.4132, 'learning_rate': 4.97858090117998e-06, 'epoch': 1.36} {'loss': 0.4297, 'learning_rate': 4.978290355499552e-06, 'epoch': 1.36} {'loss': 0.2352, 'learning_rate': 4.977999815487676e-06, 'epoch': 1.36} {'loss': 0.3094, 'learning_rate': 4.977709281144686e-06, 'epoch': 1.36} {'loss': 0.1213, 'learning_rate': 4.977418752470904e-06, 'epoch': 1.36} {'loss': 0.3536, 'learning_rate': 4.977128229466664e-06, 'epoch': 1.36} {'loss': 0.2861, 'learning_rate': 4.976837712132289e-06, 'epoch': 1.36} {'loss': 0.3447, 'learning_rate': 4.976547200468112e-06, 'epoch': 1.36} {'loss': 0.2163, 'learning_rate': 4.976256694474453e-06, 'epoch': 1.36} {'loss': 0.366, 'learning_rate': 4.9759661941516505e-06, 'epoch': 1.36} {'loss': 0.2496, 'learning_rate': 4.975675699500025e-06, 'epoch': 1.36} {'loss': 0.2728, 'learning_rate': 4.975385210519904e-06, 'epoch': 1.36} {'loss': 0.3833, 'learning_rate': 4.97509472721162e-06, 'epoch': 1.36} {'loss': 0.3137, 'learning_rate': 4.974804249575495e-06, 'epoch': 1.36} {'loss': 0.4593, 'learning_rate': 4.974513777611866e-06, 'epoch': 1.36} {'loss': 0.3267, 'learning_rate': 4.97422331132105e-06, 'epoch': 1.36} {'loss': 0.1395, 'learning_rate': 4.973932850703385e-06, 'epoch': 1.36} {'loss': 0.4412, 'learning_rate': 4.973642395759189e-06, 'epoch': 1.36} {'loss': 0.3552, 'learning_rate': 4.9733519464887995e-06, 'epoch': 1.36} {'loss': 0.3402, 'learning_rate': 4.973061502892534e-06, 'epoch': 1.36} {'loss': 0.3388, 'learning_rate': 4.972771064970733e-06, 'epoch': 1.36} {'loss': 0.3577, 'learning_rate': 4.972480632723712e-06, 'epoch': 1.36} {'loss': 0.1884, 'learning_rate': 4.972190206151808e-06, 'epoch': 1.36} {'loss': 0.377, 'learning_rate': 4.971899785255347e-06, 'epoch': 1.36} {'loss': 0.4393, 'learning_rate': 4.9716093700346494e-06, 'epoch': 1.36} {'loss': 0.3169, 'learning_rate': 4.971318960490052e-06, 'epoch': 1.36} {'loss': 0.2831, 'learning_rate': 4.9710285566218765e-06, 'epoch': 1.36} {'loss': 0.3225, 'learning_rate': 4.970738158430457e-06, 'epoch': 1.36} {'loss': 0.4029, 'learning_rate': 4.970447765916115e-06, 'epoch': 1.36} {'loss': 0.3136, 'learning_rate': 4.970157379079183e-06, 'epoch': 1.36} {'loss': 0.3204, 'learning_rate': 4.969866997919985e-06, 'epoch': 1.36} {'loss': 0.3478, 'learning_rate': 4.969576622438853e-06, 'epoch': 1.36} {'loss': 0.4353, 'learning_rate': 4.969286252636109e-06, 'epoch': 1.36} {'loss': 0.3562, 'learning_rate': 4.968995888512087e-06, 'epoch': 1.36} {'loss': 0.3489, 'learning_rate': 4.9687055300671095e-06, 'epoch': 1.36} {'loss': 0.358, 'learning_rate': 4.96841517730151e-06, 'epoch': 1.36} {'loss': 0.2757, 'learning_rate': 4.9681248302156135e-06, 'epoch': 1.36} {'loss': 0.2483, 'learning_rate': 4.967834488809743e-06, 'epoch': 1.36} {'loss': 0.2727, 'learning_rate': 4.967544153084234e-06, 'epoch': 1.36} {'loss': 0.3905, 'learning_rate': 4.967253823039407e-06, 'epoch': 1.36} {'loss': 0.166, 'learning_rate': 4.966963498675597e-06, 'epoch': 1.36} {'loss': 0.3253, 'learning_rate': 4.966673179993125e-06, 'epoch': 1.36} {'loss': 0.3019, 'learning_rate': 4.966382866992326e-06, 'epoch': 1.36} {'loss': 0.312, 'learning_rate': 4.966092559673519e-06, 'epoch': 1.36} {'loss': 0.3119, 'learning_rate': 4.96580225803704e-06, 'epoch': 1.36} {'loss': 0.3717, 'learning_rate': 4.965511962083209e-06, 'epoch': 1.36} {'loss': 0.3151, 'learning_rate': 4.965221671812363e-06, 'epoch': 1.36} {'loss': 0.1497, 'learning_rate': 4.964931387224819e-06, 'epoch': 1.36} {'loss': 0.3184, 'learning_rate': 4.964641108320913e-06, 'epoch': 1.36} {'loss': 0.359, 'learning_rate': 4.964350835100971e-06, 'epoch': 1.36} {'loss': 0.1721, 'learning_rate': 4.964060567565317e-06, 'epoch': 1.36} {'loss': 0.2802, 'learning_rate': 4.963770305714282e-06, 'epoch': 1.36} {'loss': 0.3453, 'learning_rate': 4.9634800495481895e-06, 'epoch': 1.36} {'loss': 0.4712, 'learning_rate': 4.963189799067375e-06, 'epoch': 1.36} {'loss': 0.364, 'learning_rate': 4.962899554272157e-06, 'epoch': 1.36} {'loss': 0.3156, 'learning_rate': 4.9626093151628715e-06, 'epoch': 1.36} {'loss': 0.3176, 'learning_rate': 4.962319081739838e-06, 'epoch': 1.36} {'loss': 0.179, 'learning_rate': 4.962028854003393e-06, 'epoch': 1.36} {'loss': 0.3003, 'learning_rate': 4.961738631953855e-06, 'epoch': 1.36} {'loss': 0.3244, 'learning_rate': 4.96144841559156e-06, 'epoch': 1.36} {'loss': 0.2764, 'learning_rate': 4.961158204916827e-06, 'epoch': 1.36} {'loss': 0.3321, 'learning_rate': 4.960867999929994e-06, 'epoch': 1.36} {'loss': 0.3033, 'learning_rate': 4.960577800631381e-06, 'epoch': 1.36} {'loss': 0.4532, 'learning_rate': 4.960287607021313e-06, 'epoch': 1.36} {'loss': 0.3606, 'learning_rate': 4.959997419100128e-06, 'epoch': 1.36} {'loss': 0.2077, 'learning_rate': 4.959707236868142e-06, 'epoch': 1.36} {'loss': 0.3143, 'learning_rate': 4.9594170603256934e-06, 'epoch': 1.36} {'loss': 0.1984, 'learning_rate': 4.959126889473099e-06, 'epoch': 1.36} {'loss': 0.471, 'learning_rate': 4.9588367243106964e-06, 'epoch': 1.36} {'loss': 0.3121, 'learning_rate': 4.958546564838804e-06, 'epoch': 1.36} {'loss': 0.344, 'learning_rate': 4.958256411057759e-06, 'epoch': 1.36} {'loss': 0.3477, 'learning_rate': 4.95796626296788e-06, 'epoch': 1.36} {'loss': 0.2522, 'learning_rate': 4.9576761205695e-06, 'epoch': 1.36} {'loss': 0.327, 'learning_rate': 4.957385983862943e-06, 'epoch': 1.36} {'loss': 0.3289, 'learning_rate': 4.957095852848542e-06, 'epoch': 1.36} {'loss': 0.3973, 'learning_rate': 4.956805727526619e-06, 'epoch': 1.36} {'loss': 0.2365, 'learning_rate': 4.956515607897498e-06, 'epoch': 1.36} {'loss': 0.3376, 'learning_rate': 4.956225493961517e-06, 'epoch': 1.36} {'loss': 0.2752, 'learning_rate': 4.9559353857189965e-06, 'epoch': 1.36} {'loss': 0.3055, 'learning_rate': 4.9556452831702685e-06, 'epoch': 1.36} {'loss': 0.4135, 'learning_rate': 4.955355186315654e-06, 'epoch': 1.36} {'loss': 0.3557, 'learning_rate': 4.955065095155489e-06, 'epoch': 1.36} {'loss': 0.4852, 'learning_rate': 4.954775009690096e-06, 'epoch': 1.36} {'loss': 0.3354, 'learning_rate': 4.954484929919799e-06, 'epoch': 1.36} {'loss': 0.2714, 'learning_rate': 4.954194855844932e-06, 'epoch': 1.36} {'loss': 0.3147, 'learning_rate': 4.953904787465815e-06, 'epoch': 1.36} {'loss': 0.3606, 'learning_rate': 4.953614724782785e-06, 'epoch': 1.36} {'loss': 0.3331, 'learning_rate': 4.953324667796161e-06, 'epoch': 1.36} {'loss': 0.3587, 'learning_rate': 4.953034616506277e-06, 'epoch': 1.36} {'loss': 0.4295, 'learning_rate': 4.952744570913453e-06, 'epoch': 1.36} {'loss': 0.2918, 'learning_rate': 4.952454531018025e-06, 'epoch': 1.36} {'loss': 0.2761, 'learning_rate': 4.9521644968203105e-06, 'epoch': 1.36} {'loss': 0.3827, 'learning_rate': 4.951874468320649e-06, 'epoch': 1.36} {'loss': 0.4311, 'learning_rate': 4.951584445519355e-06, 'epoch': 1.36} {'loss': 0.2438, 'learning_rate': 4.951294428416767e-06, 'epoch': 1.36} {'loss': 0.2861, 'learning_rate': 4.951004417013208e-06, 'epoch': 1.36} {'loss': 0.3696, 'learning_rate': 4.950714411309001e-06, 'epoch': 1.36} {'loss': 0.3432, 'learning_rate': 4.950424411304481e-06, 'epoch': 1.36} {'loss': 0.4235, 'learning_rate': 4.950134416999966e-06, 'epoch': 1.36} {'loss': 0.2743, 'learning_rate': 4.949844428395795e-06, 'epoch': 1.36} {'loss': 0.2412, 'learning_rate': 4.949554445492285e-06, 'epoch': 1.36} {'loss': 0.31, 'learning_rate': 4.949264468289771e-06, 'epoch': 1.36} {'loss': 0.3777, 'learning_rate': 4.9489744967885735e-06, 'epoch': 1.36} {'loss': 0.209, 'learning_rate': 4.948684530989027e-06, 'epoch': 1.36} {'loss': 0.243, 'learning_rate': 4.948394570891452e-06, 'epoch': 1.36} {'loss': 0.3074, 'learning_rate': 4.948104616496181e-06, 'epoch': 1.36} {'loss': 0.2665, 'learning_rate': 4.947814667803536e-06, 'epoch': 1.36} {'loss': 0.2855, 'learning_rate': 4.947524724813852e-06, 'epoch': 1.36} {'loss': 0.3952, 'learning_rate': 4.947234787527453e-06, 'epoch': 1.36} {'loss': 0.3367, 'learning_rate': 4.94694485594466e-06, 'epoch': 1.36} {'loss': 0.4238, 'learning_rate': 4.946654930065809e-06, 'epoch': 1.36} {'loss': 0.2701, 'learning_rate': 4.9463650098912195e-06, 'epoch': 1.36} {'loss': 0.2544, 'learning_rate': 4.946075095421227e-06, 'epoch': 1.36} {'loss': 0.4185, 'learning_rate': 4.945785186656151e-06, 'epoch': 1.36} {'loss': 0.2078, 'learning_rate': 4.945495283596327e-06, 'epoch': 1.36} {'loss': 0.2703, 'learning_rate': 4.945205386242072e-06, 'epoch': 1.36} {'loss': 0.1961, 'learning_rate': 4.944915494593724e-06, 'epoch': 1.36} {'loss': 0.3552, 'learning_rate': 4.944625608651601e-06, 'epoch': 1.36} {'loss': 0.2878, 'learning_rate': 4.944335728416039e-06, 'epoch': 1.36} {'loss': 0.3195, 'learning_rate': 4.944045853887356e-06, 'epoch': 1.36} {'loss': 0.3575, 'learning_rate': 4.943755985065888e-06, 'epoch': 1.36} {'loss': 0.2465, 'learning_rate': 4.943466121951958e-06, 'epoch': 1.36} {'loss': 0.2938, 'learning_rate': 4.943176264545888e-06, 'epoch': 1.36} {'loss': 0.2616, 'learning_rate': 4.9428864128480155e-06, 'epoch': 1.36} {'loss': 0.4232, 'learning_rate': 4.942596566858658e-06, 'epoch': 1.36} {'loss': 0.333, 'learning_rate': 4.942306726578152e-06, 'epoch': 1.36} {'loss': 0.2548, 'learning_rate': 4.942016892006815e-06, 'epoch': 1.36} {'loss': 0.3316, 'learning_rate': 4.941727063144984e-06, 'epoch': 1.36} {'loss': 0.3591, 'learning_rate': 4.9414372399929775e-06, 'epoch': 1.36} {'loss': 0.433, 'learning_rate': 4.94114742255113e-06, 'epoch': 1.36} {'loss': 0.179, 'learning_rate': 4.940857610819762e-06, 'epoch': 1.36} {'loss': 0.5075, 'learning_rate': 4.9405678047992055e-06, 'epoch': 1.36} {'loss': 0.4183, 'learning_rate': 4.9402780044897835e-06, 'epoch': 1.36} {'loss': 0.2012, 'learning_rate': 4.939988209891829e-06, 'epoch': 1.36} {'loss': 0.2671, 'learning_rate': 4.939698421005666e-06, 'epoch': 1.36} {'loss': 0.3897, 'learning_rate': 4.939408637831617e-06, 'epoch': 1.36} {'loss': 0.3331, 'learning_rate': 4.939118860370017e-06, 'epoch': 1.36} {'loss': 0.2258, 'learning_rate': 4.9388290886211865e-06, 'epoch': 1.36} {'loss': 0.2392, 'learning_rate': 4.9385393225854585e-06, 'epoch': 1.36} {'loss': 0.4551, 'learning_rate': 4.938249562263153e-06, 'epoch': 1.36} {'loss': 0.329, 'learning_rate': 4.937959807654605e-06, 'epoch': 1.36} {'loss': 0.3032, 'learning_rate': 4.937670058760135e-06, 'epoch': 1.36} {'loss': 0.4327, 'learning_rate': 4.937380315580076e-06, 'epoch': 1.36} {'loss': 0.3616, 'learning_rate': 4.9370905781147484e-06, 'epoch': 1.36} {'loss': 0.3441, 'learning_rate': 4.9368008463644865e-06, 'epoch': 1.36} {'loss': 0.33, 'learning_rate': 4.93651112032961e-06, 'epoch': 1.36} {'loss': 0.2753, 'learning_rate': 4.936221400010452e-06, 'epoch': 1.36} {'loss': 0.3084, 'learning_rate': 4.935931685407336e-06, 'epoch': 1.36} {'loss': 0.4062, 'learning_rate': 4.935641976520592e-06, 'epoch': 1.36} {'loss': 0.3408, 'learning_rate': 4.935352273350546e-06, 'epoch': 1.36} {'loss': 0.2665, 'learning_rate': 4.935062575897519e-06, 'epoch': 1.36} {'loss': 0.4919, 'learning_rate': 4.934772884161848e-06, 'epoch': 1.36} {'loss': 0.2093, 'learning_rate': 4.934483198143851e-06, 'epoch': 1.36} {'loss': 0.166, 'learning_rate': 4.9341935178438636e-06, 'epoch': 1.36} {'loss': 0.2045, 'learning_rate': 4.933903843262206e-06, 'epoch': 1.36} {'loss': 0.4448, 'learning_rate': 4.933614174399208e-06, 'epoch': 1.36} {'loss': 0.4148, 'learning_rate': 4.933324511255195e-06, 'epoch': 1.36} {'loss': 0.3766, 'learning_rate': 4.933034853830498e-06, 'epoch': 1.36} {'loss': 0.3019, 'learning_rate': 4.932745202125438e-06, 'epoch': 1.36} {'loss': 0.4145, 'learning_rate': 4.932455556140347e-06, 'epoch': 1.36} {'loss': 0.2129, 'learning_rate': 4.932165915875548e-06, 'epoch': 1.36} {'loss': 0.2444, 'learning_rate': 4.931876281331374e-06, 'epoch': 1.36} {'loss': 0.458, 'learning_rate': 4.9315866525081476e-06, 'epoch': 1.36} {'loss': 0.2785, 'learning_rate': 4.931297029406193e-06, 'epoch': 1.36} {'loss': 0.3578, 'learning_rate': 4.931007412025842e-06, 'epoch': 1.36} {'loss': 0.314, 'learning_rate': 4.930717800367417e-06, 'epoch': 1.36} {'loss': 0.361, 'learning_rate': 4.930428194431251e-06, 'epoch': 1.36} {'loss': 0.3543, 'learning_rate': 4.930138594217664e-06, 'epoch': 1.36} {'loss': 0.3196, 'learning_rate': 4.929848999726991e-06, 'epoch': 1.36} {'loss': 0.1867, 'learning_rate': 4.929559410959549e-06, 'epoch': 1.36} {'loss': 0.2722, 'learning_rate': 4.929269827915676e-06, 'epoch': 1.36} {'loss': 0.3142, 'learning_rate': 4.928980250595688e-06, 'epoch': 1.36} {'loss': 0.4001, 'learning_rate': 4.928690678999921e-06, 'epoch': 1.36} {'loss': 0.2816, 'learning_rate': 4.928401113128693e-06, 'epoch': 1.36} {'loss': 0.3276, 'learning_rate': 4.928111552982341e-06, 'epoch': 1.36} {'loss': 0.3779, 'learning_rate': 4.927821998561183e-06, 'epoch': 1.36} {'loss': 0.2492, 'learning_rate': 4.927532449865548e-06, 'epoch': 1.36} {'loss': 0.4262, 'learning_rate': 4.927242906895769e-06, 'epoch': 1.36} {'loss': 0.36, 'learning_rate': 4.9269533696521655e-06, 'epoch': 1.36} {'loss': 0.378, 'learning_rate': 4.92666383813507e-06, 'epoch': 1.36} {'loss': 0.3925, 'learning_rate': 4.926374312344802e-06, 'epoch': 1.36} {'loss': 0.3073, 'learning_rate': 4.926084792281696e-06, 'epoch': 1.36} {'loss': 0.4592, 'learning_rate': 4.925795277946076e-06, 'epoch': 1.36} {'loss': 0.4562, 'learning_rate': 4.925505769338263e-06, 'epoch': 1.36} {'loss': 0.2517, 'learning_rate': 4.925216266458595e-06, 'epoch': 1.36} {'loss': 0.4384, 'learning_rate': 4.9249267693073875e-06, 'epoch': 1.36} {'loss': 0.2637, 'learning_rate': 4.924637277884977e-06, 'epoch': 1.36} {'loss': 0.242, 'learning_rate': 4.924347792191683e-06, 'epoch': 1.36} {'loss': 0.3652, 'learning_rate': 4.924058312227839e-06, 'epoch': 1.36} {'loss': 0.4482, 'learning_rate': 4.923768837993762e-06, 'epoch': 1.36} {'loss': 0.3597, 'learning_rate': 4.9234793694897896e-06, 'epoch': 1.36} {'loss': 0.3264, 'learning_rate': 4.92318990671624e-06, 'epoch': 1.36} {'loss': 0.2699, 'learning_rate': 4.922900449673448e-06, 'epoch': 1.36} {'loss': 0.4295, 'learning_rate': 4.922610998361731e-06, 'epoch': 1.36} {'loss': 0.282, 'learning_rate': 4.922321552781425e-06, 'epoch': 1.36} {'loss': 0.332, 'learning_rate': 4.922032112932853e-06, 'epoch': 1.36} {'loss': 0.3376, 'learning_rate': 4.9217426788163355e-06, 'epoch': 1.36} {'loss': 0.344, 'learning_rate': 4.921453250432211e-06, 'epoch': 1.36} {'loss': 0.2946, 'learning_rate': 4.921163827780795e-06, 'epoch': 1.36} {'loss': 0.2658, 'learning_rate': 4.920874410862423e-06, 'epoch': 1.36} {'loss': 0.279, 'learning_rate': 4.920584999677415e-06, 'epoch': 1.36} {'loss': 0.3569, 'learning_rate': 4.920295594226104e-06, 'epoch': 1.36} {'loss': 0.2906, 'learning_rate': 4.920006194508808e-06, 'epoch': 1.36} {'loss': 0.2661, 'learning_rate': 4.919716800525865e-06, 'epoch': 1.36} {'loss': 0.2855, 'learning_rate': 4.919427412277589e-06, 'epoch': 1.36} {'loss': 0.4923, 'learning_rate': 4.919138029764321e-06, 'epoch': 1.36} {'loss': 0.2941, 'learning_rate': 4.918848652986373e-06, 'epoch': 1.36} {'loss': 0.4347, 'learning_rate': 4.918559281944084e-06, 'epoch': 1.36} {'loss': 0.5112, 'learning_rate': 4.918269916637776e-06, 'epoch': 1.36} {'loss': 0.3398, 'learning_rate': 4.917980557067769e-06, 'epoch': 1.36} {'loss': 0.3008, 'learning_rate': 4.917691203234402e-06, 'epoch': 1.36} {'loss': 0.5097, 'learning_rate': 4.917401855137989e-06, 'epoch': 1.36} {'loss': 0.3501, 'learning_rate': 4.9171125127788675e-06, 'epoch': 1.36} {'loss': 0.3948, 'learning_rate': 4.916823176157356e-06, 'epoch': 1.36} {'loss': 0.19, 'learning_rate': 4.9165338452737874e-06, 'epoch': 1.36} {'loss': 0.2838, 'learning_rate': 4.916244520128482e-06, 'epoch': 1.36} {'loss': 0.4667, 'learning_rate': 4.915955200721774e-06, 'epoch': 1.36} {'loss': 0.3152, 'learning_rate': 4.915665887053982e-06, 'epoch': 1.36} {'loss': 0.3095, 'learning_rate': 4.915376579125441e-06, 'epoch': 1.36} {'loss': 0.2182, 'learning_rate': 4.915087276936467e-06, 'epoch': 1.36} {'loss': 0.3101, 'learning_rate': 4.914797980487398e-06, 'epoch': 1.36} {'loss': 0.2581, 'learning_rate': 4.914508689778554e-06, 'epoch': 1.36} {'loss': 0.3677, 'learning_rate': 4.91421940481026e-06, 'epoch': 1.36} {'loss': 0.2415, 'learning_rate': 4.913930125582847e-06, 'epoch': 1.36} {'loss': 0.2323, 'learning_rate': 4.913640852096638e-06, 'epoch': 1.36} {'loss': 0.3642, 'learning_rate': 4.913351584351964e-06, 'epoch': 1.36} {'loss': 0.3614, 'learning_rate': 4.913062322349146e-06, 'epoch': 1.36} {'loss': 0.3719, 'learning_rate': 4.912773066088517e-06, 'epoch': 1.36} {'loss': 0.3144, 'learning_rate': 4.912483815570395e-06, 'epoch': 1.36} {'loss': 0.3203, 'learning_rate': 4.9121945707951155e-06, 'epoch': 1.36} {'loss': 0.22, 'learning_rate': 4.9119053317629974e-06, 'epoch': 1.36} {'loss': 0.2231, 'learning_rate': 4.9116160984743735e-06, 'epoch': 1.36} {'loss': 0.2941, 'learning_rate': 4.911326870929565e-06, 'epoch': 1.36} {'loss': 0.3503, 'learning_rate': 4.911037649128904e-06, 'epoch': 1.36} {'loss': 0.4252, 'learning_rate': 4.910748433072713e-06, 'epoch': 1.36} {'loss': 0.3948, 'learning_rate': 4.910459222761317e-06, 'epoch': 1.36} {'loss': 0.4025, 'learning_rate': 4.9101700181950474e-06, 'epoch': 1.36} {'loss': 0.3643, 'learning_rate': 4.9098808193742244e-06, 'epoch': 1.36} {'loss': 0.2599, 'learning_rate': 4.909591626299182e-06, 'epoch': 1.36} {'loss': 0.361, 'learning_rate': 4.9093024389702384e-06, 'epoch': 1.36} {'loss': 0.3565, 'learning_rate': 4.909013257387728e-06, 'epoch': 1.36} {'loss': 0.275, 'learning_rate': 4.9087240815519696e-06, 'epoch': 1.36} {'loss': 0.2737, 'learning_rate': 4.908434911463299e-06, 'epoch': 1.36} {'loss': 0.2674, 'learning_rate': 4.908145747122032e-06, 'epoch': 1.36} {'loss': 0.1935, 'learning_rate': 4.907856588528504e-06, 'epoch': 1.36} {'loss': 0.3781, 'learning_rate': 4.907567435683035e-06, 'epoch': 1.36} {'loss': 0.1912, 'learning_rate': 4.907278288585956e-06, 'epoch': 1.36} {'loss': 0.3651, 'learning_rate': 4.906989147237593e-06, 'epoch': 1.36} {'loss': 0.3185, 'learning_rate': 4.906700011638266e-06, 'epoch': 1.36} {'loss': 0.2542, 'learning_rate': 4.906410881788311e-06, 'epoch': 1.36} {'loss': 0.203, 'learning_rate': 4.9061217576880436e-06, 'epoch': 1.36} {'loss': 0.1989, 'learning_rate': 4.905832639337802e-06, 'epoch': 1.36} {'loss': 0.3853, 'learning_rate': 4.905543526737902e-06, 'epoch': 1.36} {'loss': 0.3214, 'learning_rate': 4.905254419888678e-06, 'epoch': 1.36} {'loss': 0.2371, 'learning_rate': 4.90496531879045e-06, 'epoch': 1.36} {'loss': 0.297, 'learning_rate': 4.904676223443551e-06, 'epoch': 1.36} {'loss': 0.4501, 'learning_rate': 4.9043871338483e-06, 'epoch': 1.36} {'loss': 0.4113, 'learning_rate': 4.904098050005029e-06, 'epoch': 1.36} {'loss': 0.3842, 'learning_rate': 4.90380897191406e-06, 'epoch': 1.36} {'loss': 0.2674, 'learning_rate': 4.903519899575725e-06, 'epoch': 1.36} {'loss': 0.4069, 'learning_rate': 4.9032308329903475e-06, 'epoch': 1.36} {'loss': 0.4558, 'learning_rate': 4.902941772158248e-06, 'epoch': 1.36} {'loss': 0.339, 'learning_rate': 4.902652717079763e-06, 'epoch': 1.36} {'loss': 0.4123, 'learning_rate': 4.90236366775521e-06, 'epoch': 1.36} {'loss': 0.301, 'learning_rate': 4.902074624184923e-06, 'epoch': 1.36} {'loss': 0.4387, 'learning_rate': 4.90178558636922e-06, 'epoch': 1.36} {'loss': 0.3213, 'learning_rate': 4.901496554308436e-06, 'epoch': 1.36} {'loss': 0.279, 'learning_rate': 4.901207528002888e-06, 'epoch': 1.36} {'loss': 0.2923, 'learning_rate': 4.900918507452912e-06, 'epoch': 1.36} {'loss': 0.2874, 'learning_rate': 4.900629492658825e-06, 'epoch': 1.36} {'loss': 0.356, 'learning_rate': 4.9003404836209615e-06, 'epoch': 1.36} {'loss': 0.1968, 'learning_rate': 4.900051480339639e-06, 'epoch': 1.36} {'loss': 0.2983, 'learning_rate': 4.899762482815195e-06, 'epoch': 1.36} {'loss': 0.2967, 'learning_rate': 4.899473491047947e-06, 'epoch': 1.36} {'loss': 0.2431, 'learning_rate': 4.899184505038216e-06, 'epoch': 1.36} {'loss': 0.3281, 'learning_rate': 4.898895524786345e-06, 'epoch': 1.36} {'loss': 0.2055, 'learning_rate': 4.898606550292645e-06, 'epoch': 1.36} {'loss': 0.1936, 'learning_rate': 4.898317581557454e-06, 'epoch': 1.36} {'loss': 0.2797, 'learning_rate': 4.898028618581086e-06, 'epoch': 1.36} {'loss': 0.3057, 'learning_rate': 4.89773966136388e-06, 'epoch': 1.36} {'loss': 0.3338, 'learning_rate': 4.897450709906151e-06, 'epoch': 1.36} {'loss': 0.2241, 'learning_rate': 4.897161764208232e-06, 'epoch': 1.36} {'loss': 0.4173, 'learning_rate': 4.8968728242704485e-06, 'epoch': 1.36} {'loss': 0.4586, 'learning_rate': 4.896583890093122e-06, 'epoch': 1.36} {'loss': 0.1874, 'learning_rate': 4.896294961676585e-06, 'epoch': 1.36} {'loss': 0.1984, 'learning_rate': 4.896006039021156e-06, 'epoch': 1.36} {'loss': 0.1557, 'learning_rate': 4.895717122127171e-06, 'epoch': 1.36} {'loss': 0.404, 'learning_rate': 4.8954282109949455e-06, 'epoch': 1.36} {'loss': 0.3177, 'learning_rate': 4.895139305624815e-06, 'epoch': 1.36} {'loss': 0.3792, 'learning_rate': 4.894850406017098e-06, 'epoch': 1.36} {'loss': 0.2761, 'learning_rate': 4.894561512172128e-06, 'epoch': 1.36} {'loss': 0.2729, 'learning_rate': 4.894272624090223e-06, 'epoch': 1.36} {'loss': 0.2384, 'learning_rate': 4.893983741771718e-06, 'epoch': 1.36} {'loss': 0.3075, 'learning_rate': 4.893694865216929e-06, 'epoch': 1.36} {'loss': 0.1537, 'learning_rate': 4.893405994426191e-06, 'epoch': 1.36} {'loss': 0.2039, 'learning_rate': 4.893117129399828e-06, 'epoch': 1.36} {'loss': 0.3099, 'learning_rate': 4.8928282701381615e-06, 'epoch': 1.36} {'loss': 0.3284, 'learning_rate': 4.892539416641523e-06, 'epoch': 1.36} {'loss': 0.3654, 'learning_rate': 4.892250568910233e-06, 'epoch': 1.36} {'loss': 0.3088, 'learning_rate': 4.891961726944625e-06, 'epoch': 1.36} {'loss': 0.3368, 'learning_rate': 4.891672890745016e-06, 'epoch': 1.36} {'loss': 0.3277, 'learning_rate': 4.8913840603117425e-06, 'epoch': 1.36} {'loss': 0.3925, 'learning_rate': 4.891095235645119e-06, 'epoch': 1.36} {'loss': 0.2829, 'learning_rate': 4.890806416745482e-06, 'epoch': 1.36} {'loss': 0.3471, 'learning_rate': 4.890517603613151e-06, 'epoch': 1.36} {'loss': 0.3689, 'learning_rate': 4.890228796248455e-06, 'epoch': 1.36} {'loss': 0.5774, 'learning_rate': 4.889939994651717e-06, 'epoch': 1.36} {'loss': 0.3622, 'learning_rate': 4.889651198823269e-06, 'epoch': 1.36} {'loss': 0.3258, 'learning_rate': 4.889362408763432e-06, 'epoch': 1.36} {'loss': 0.2927, 'learning_rate': 4.88907362447253e-06, 'epoch': 1.36} {'loss': 0.1668, 'learning_rate': 4.888784845950895e-06, 'epoch': 1.36} {'loss': 0.5271, 'learning_rate': 4.888496073198846e-06, 'epoch': 1.36} {'loss': 0.2144, 'learning_rate': 4.888207306216718e-06, 'epoch': 1.36} {'loss': 0.4569, 'learning_rate': 4.887918545004827e-06, 'epoch': 1.36} {'loss': 0.2851, 'learning_rate': 4.887629789563508e-06, 'epoch': 1.36} {'loss': 0.3021, 'learning_rate': 4.8873410398930794e-06, 'epoch': 1.36} {'loss': 0.5086, 'learning_rate': 4.887052295993873e-06, 'epoch': 1.36} {'loss': 0.5065, 'learning_rate': 4.886763557866211e-06, 'epoch': 1.36} {'loss': 0.2459, 'learning_rate': 4.886474825510422e-06, 'epoch': 1.36} {'loss': 0.3506, 'learning_rate': 4.886186098926829e-06, 'epoch': 1.36} {'loss': 0.3265, 'learning_rate': 4.885897378115761e-06, 'epoch': 1.36} {'loss': 0.289, 'learning_rate': 4.885608663077543e-06, 'epoch': 1.36} {'loss': 0.2793, 'learning_rate': 4.885319953812497e-06, 'epoch': 1.36} {'loss': 0.2788, 'learning_rate': 4.885031250320956e-06, 'epoch': 1.36} {'loss': 0.312, 'learning_rate': 4.884742552603238e-06, 'epoch': 1.36} {'loss': 0.2654, 'learning_rate': 4.884453860659677e-06, 'epoch': 1.36} {'loss': 0.4541, 'learning_rate': 4.88416517449059e-06, 'epoch': 1.36} {'loss': 0.3451, 'learning_rate': 4.883876494096312e-06, 'epoch': 1.36} {'loss': 0.1225, 'learning_rate': 4.883587819477162e-06, 'epoch': 1.36} {'loss': 0.296, 'learning_rate': 4.883299150633471e-06, 'epoch': 1.36} {'loss': 0.4865, 'learning_rate': 4.883010487565558e-06, 'epoch': 1.36} {'loss': 0.2264, 'learning_rate': 4.882721830273758e-06, 'epoch': 1.36} {'loss': 0.3419, 'learning_rate': 4.8824331787583875e-06, 'epoch': 1.36} {'loss': 0.4219, 'learning_rate': 4.8821445330197815e-06, 'epoch': 1.36} {'loss': 0.3794, 'learning_rate': 4.88185589305826e-06, 'epoch': 1.36} {'loss': 0.315, 'learning_rate': 4.881567258874147e-06, 'epoch': 1.36} {'loss': 0.3576, 'learning_rate': 4.881278630467775e-06, 'epoch': 1.36} {'loss': 0.3007, 'learning_rate': 4.880990007839462e-06, 'epoch': 1.36} {'loss': 0.2394, 'learning_rate': 4.880701390989542e-06, 'epoch': 1.36} {'loss': 0.3217, 'learning_rate': 4.880412779918332e-06, 'epoch': 1.36} {'loss': 0.3489, 'learning_rate': 4.8801241746261665e-06, 'epoch': 1.36} {'loss': 0.2525, 'learning_rate': 4.879835575113364e-06, 'epoch': 1.36} {'loss': 0.4021, 'learning_rate': 4.8795469813802565e-06, 'epoch': 1.36} {'loss': 0.3532, 'learning_rate': 4.879258393427163e-06, 'epoch': 1.36} {'loss': 0.3728, 'learning_rate': 4.878969811254418e-06, 'epoch': 1.36} {'loss': 0.3216, 'learning_rate': 4.878681234862337e-06, 'epoch': 1.36} {'loss': 0.3939, 'learning_rate': 4.878392664251256e-06, 'epoch': 1.36} {'loss': 0.2413, 'learning_rate': 4.878104099421496e-06, 'epoch': 1.36} {'loss': 0.3428, 'learning_rate': 4.877815540373377e-06, 'epoch': 1.36} {'loss': 0.2843, 'learning_rate': 4.877526987107235e-06, 'epoch': 1.36} {'loss': 0.2501, 'learning_rate': 4.877238439623387e-06, 'epoch': 1.36} {'loss': 0.4272, 'learning_rate': 4.876949897922166e-06, 'epoch': 1.36} {'loss': 0.2199, 'learning_rate': 4.876661362003892e-06, 'epoch': 1.36} {'loss': 0.2704, 'learning_rate': 4.876372831868896e-06, 'epoch': 1.36} {'loss': 0.2019, 'learning_rate': 4.876084307517497e-06, 'epoch': 1.36} {'loss': 0.0975, 'learning_rate': 4.875795788950028e-06, 'epoch': 1.36} {'loss': 0.2568, 'learning_rate': 4.875507276166808e-06, 'epoch': 1.36} {'loss': 0.2848, 'learning_rate': 4.875218769168169e-06, 'epoch': 1.36} {'loss': 0.2325, 'learning_rate': 4.8749302679544294e-06, 'epoch': 1.36} {'loss': 0.3041, 'learning_rate': 4.874641772525925e-06, 'epoch': 1.36} {'loss': 0.5098, 'learning_rate': 4.874353282882972e-06, 'epoch': 1.36} {'loss': 0.301, 'learning_rate': 4.874064799025898e-06, 'epoch': 1.36} {'loss': 0.2706, 'learning_rate': 4.8737763209550325e-06, 'epoch': 1.36} {'loss': 0.2857, 'learning_rate': 4.873487848670696e-06, 'epoch': 1.36} {'loss': 0.1129, 'learning_rate': 4.873199382173221e-06, 'epoch': 1.36} {'loss': 0.3227, 'learning_rate': 4.872910921462924e-06, 'epoch': 1.36} {'loss': 0.319, 'learning_rate': 4.87262246654014e-06, 'epoch': 1.36} {'loss': 0.3349, 'learning_rate': 4.872334017405186e-06, 'epoch': 1.36} {'loss': 0.2772, 'learning_rate': 4.872045574058396e-06, 'epoch': 1.36} {'loss': 0.2126, 'learning_rate': 4.871757136500088e-06, 'epoch': 1.36} {'loss': 0.3484, 'learning_rate': 4.8714687047305946e-06, 'epoch': 1.36} {'loss': 0.4076, 'learning_rate': 4.871180278750234e-06, 'epoch': 1.36} {'loss': 0.4408, 'learning_rate': 4.870891858559339e-06, 'epoch': 1.36} {'loss': 0.3551, 'learning_rate': 4.8706034441582315e-06, 'epoch': 1.36} {'loss': 0.239, 'learning_rate': 4.870315035547231e-06, 'epoch': 1.36} {'loss': 0.2637, 'learning_rate': 4.8700266327266755e-06, 'epoch': 1.36} {'loss': 0.3658, 'learning_rate': 4.869738235696881e-06, 'epoch': 1.36} {'loss': 0.4163, 'learning_rate': 4.869449844458181e-06, 'epoch': 1.36} {'loss': 0.3845, 'learning_rate': 4.869161459010892e-06, 'epoch': 1.36} {'loss': 0.3835, 'learning_rate': 4.8688730793553485e-06, 'epoch': 1.36} {'loss': 0.3558, 'learning_rate': 4.868584705491871e-06, 'epoch': 1.36} {'loss': 0.2496, 'learning_rate': 4.868296337420782e-06, 'epoch': 1.36} {'loss': 0.3511, 'learning_rate': 4.868007975142414e-06, 'epoch': 1.36} {'loss': 0.3509, 'learning_rate': 4.867719618657086e-06, 'epoch': 1.36} {'loss': 0.3443, 'learning_rate': 4.867431267965129e-06, 'epoch': 1.36} {'loss': 0.3397, 'learning_rate': 4.867142923066863e-06, 'epoch': 1.36} {'loss': 0.3571, 'learning_rate': 4.866854583962622e-06, 'epoch': 1.36} {'loss': 0.2165, 'learning_rate': 4.86656625065272e-06, 'epoch': 1.36} {'loss': 0.2369, 'learning_rate': 4.866277923137494e-06, 'epoch': 1.36} {'loss': 0.4088, 'learning_rate': 4.865989601417259e-06, 'epoch': 1.36} {'loss': 0.2357, 'learning_rate': 4.86570128549235e-06, 'epoch': 1.36} {'loss': 0.3368, 'learning_rate': 4.865412975363084e-06, 'epoch': 1.36} {'loss': 0.3168, 'learning_rate': 4.865124671029794e-06, 'epoch': 1.36} {'loss': 0.3182, 'learning_rate': 4.864836372492802e-06, 'epoch': 1.36} {'loss': 0.2505, 'learning_rate': 4.864548079752429e-06, 'epoch': 1.36} {'loss': 0.24, 'learning_rate': 4.864259792809009e-06, 'epoch': 1.36} {'loss': 0.3108, 'learning_rate': 4.863971511662858e-06, 'epoch': 1.36} {'loss': 0.2367, 'learning_rate': 4.863683236314311e-06, 'epoch': 1.36} {'loss': 0.305, 'learning_rate': 4.863394966763686e-06, 'epoch': 1.36} {'loss': 0.3168, 'learning_rate': 4.863106703011316e-06, 'epoch': 1.36} {'loss': 0.2669, 'learning_rate': 4.862818445057515e-06, 'epoch': 1.36} {'loss': 0.3145, 'learning_rate': 4.86253019290262e-06, 'epoch': 1.36} {'loss': 0.3017, 'learning_rate': 4.862241946546949e-06, 'epoch': 1.36} {'loss': 0.2317, 'learning_rate': 4.861953705990833e-06, 'epoch': 1.36} {'loss': 0.4303, 'learning_rate': 4.86166547123459e-06, 'epoch': 1.36} {'loss': 0.1848, 'learning_rate': 4.8613772422785535e-06, 'epoch': 1.36} {'loss': 0.2772, 'learning_rate': 4.861089019123044e-06, 'epoch': 1.36} {'loss': 0.2574, 'learning_rate': 4.860800801768385e-06, 'epoch': 1.36} {'loss': 0.3162, 'learning_rate': 4.860512590214909e-06, 'epoch': 1.36} {'loss': 0.2782, 'learning_rate': 4.860224384462932e-06, 'epoch': 1.36} {'loss': 0.194, 'learning_rate': 4.859936184512789e-06, 'epoch': 1.36} {'loss': 0.3193, 'learning_rate': 4.859647990364797e-06, 'epoch': 1.36} {'loss': 0.3813, 'learning_rate': 4.859359802019288e-06, 'epoch': 1.36} {'loss': 0.3857, 'learning_rate': 4.85907161947658e-06, 'epoch': 1.36} {'loss': 0.3862, 'learning_rate': 4.8587834427370074e-06, 'epoch': 1.36} {'loss': 0.2163, 'learning_rate': 4.858495271800886e-06, 'epoch': 1.36} {'loss': 0.4615, 'learning_rate': 4.85820710666855e-06, 'epoch': 1.36} {'loss': 0.3991, 'learning_rate': 4.8579189473403166e-06, 'epoch': 1.36} {'loss': 0.2703, 'learning_rate': 4.857630793816519e-06, 'epoch': 1.36} {'loss': 0.3562, 'learning_rate': 4.857342646097478e-06, 'epoch': 1.36} {'loss': 0.4353, 'learning_rate': 4.8570545041835145e-06, 'epoch': 1.36} {'loss': 0.3539, 'learning_rate': 4.856766368074965e-06, 'epoch': 1.36} {'loss': 0.3352, 'learning_rate': 4.856478237772142e-06, 'epoch': 1.36} {'loss': 0.3823, 'learning_rate': 4.856190113275381e-06, 'epoch': 1.36} {'loss': 0.3208, 'learning_rate': 4.855901994585e-06, 'epoch': 1.36} {'loss': 0.2167, 'learning_rate': 4.855613881701331e-06, 'epoch': 1.36} {'loss': 0.2688, 'learning_rate': 4.8553257746246915e-06, 'epoch': 1.36} {'loss': 0.3945, 'learning_rate': 4.855037673355416e-06, 'epoch': 1.36} {'loss': 0.2436, 'learning_rate': 4.8547495778938205e-06, 'epoch': 1.36} {'loss': 0.1819, 'learning_rate': 4.854461488240237e-06, 'epoch': 1.36} {'loss': 0.444, 'learning_rate': 4.854173404394985e-06, 'epoch': 1.36} {'loss': 0.2311, 'learning_rate': 4.853885326358396e-06, 'epoch': 1.36} {'loss': 0.1939, 'learning_rate': 4.853597254130789e-06, 'epoch': 1.36} {'loss': 0.3279, 'learning_rate': 4.853309187712495e-06, 'epoch': 1.36} {'loss': 0.2916, 'learning_rate': 4.853021127103836e-06, 'epoch': 1.36} {'loss': 0.2368, 'learning_rate': 4.852733072305135e-06, 'epoch': 1.36} {'loss': 0.3299, 'learning_rate': 4.8524450233167216e-06, 'epoch': 1.36} {'loss': 0.4513, 'learning_rate': 4.852156980138917e-06, 'epoch': 1.36} {'loss': 0.2764, 'learning_rate': 4.851868942772051e-06, 'epoch': 1.36} {'loss': 0.2665, 'learning_rate': 4.8515809112164425e-06, 'epoch': 1.36} {'loss': 0.3184, 'learning_rate': 4.851292885472422e-06, 'epoch': 1.36} {'loss': 0.3506, 'learning_rate': 4.851004865540312e-06, 'epoch': 1.36} {'loss': 0.4534, 'learning_rate': 4.85071685142044e-06, 'epoch': 1.36} {'loss': 0.3014, 'learning_rate': 4.850428843113127e-06, 'epoch': 1.36} {'loss': 0.3325, 'learning_rate': 4.8501408406187045e-06, 'epoch': 1.36} {'loss': 0.2288, 'learning_rate': 4.849852843937489e-06, 'epoch': 1.36} {'loss': 0.4048, 'learning_rate': 4.8495648530698146e-06, 'epoch': 1.36} {'loss': 0.4146, 'learning_rate': 4.849276868016002e-06, 'epoch': 1.36} {'loss': 0.3871, 'learning_rate': 4.848988888776373e-06, 'epoch': 1.36} {'loss': 0.3577, 'learning_rate': 4.8487009153512585e-06, 'epoch': 1.36} {'loss': 0.3759, 'learning_rate': 4.848412947740978e-06, 'epoch': 1.36} {'loss': 0.3038, 'learning_rate': 4.8481249859458644e-06, 'epoch': 1.36} {'loss': 0.3374, 'learning_rate': 4.847837029966233e-06, 'epoch': 1.36} {'loss': 0.3116, 'learning_rate': 4.8475490798024185e-06, 'epoch': 1.36} {'loss': 0.2956, 'learning_rate': 4.8472611354547376e-06, 'epoch': 1.36} {'loss': 0.2523, 'learning_rate': 4.846973196923521e-06, 'epoch': 1.37} {'loss': 0.4315, 'learning_rate': 4.84668526420909e-06, 'epoch': 1.37} {'loss': 0.2797, 'learning_rate': 4.846397337311775e-06, 'epoch': 1.37} {'loss': 0.2723, 'learning_rate': 4.8461094162318926e-06, 'epoch': 1.37} {'loss': 0.2749, 'learning_rate': 4.845821500969776e-06, 'epoch': 1.37} {'loss': 0.2598, 'learning_rate': 4.845533591525748e-06, 'epoch': 1.37} {'loss': 0.3573, 'learning_rate': 4.845245687900128e-06, 'epoch': 1.37} {'loss': 0.3876, 'learning_rate': 4.84495779009325e-06, 'epoch': 1.37} {'loss': 0.3159, 'learning_rate': 4.8446698981054304e-06, 'epoch': 1.37} {'loss': 0.309, 'learning_rate': 4.844382011937002e-06, 'epoch': 1.37} {'loss': 0.3783, 'learning_rate': 4.844094131588282e-06, 'epoch': 1.37} {'loss': 0.3377, 'learning_rate': 4.8438062570596026e-06, 'epoch': 1.37} {'loss': 0.3305, 'learning_rate': 4.843518388351281e-06, 'epoch': 1.37} {'loss': 0.1893, 'learning_rate': 4.843230525463652e-06, 'epoch': 1.37} {'loss': 0.3685, 'learning_rate': 4.842942668397031e-06, 'epoch': 1.37} {'loss': 0.5077, 'learning_rate': 4.8426548171517495e-06, 'epoch': 1.37} {'loss': 0.4295, 'learning_rate': 4.8423669717281275e-06, 'epoch': 1.37} {'loss': 0.3844, 'learning_rate': 4.842079132126496e-06, 'epoch': 1.37} {'loss': 0.2242, 'learning_rate': 4.841791298347173e-06, 'epoch': 1.37} {'loss': 0.2722, 'learning_rate': 4.841503470390486e-06, 'epoch': 1.37} {'loss': 0.2715, 'learning_rate': 4.841215648256764e-06, 'epoch': 1.37} {'loss': 0.424, 'learning_rate': 4.840927831946326e-06, 'epoch': 1.37} {'loss': 0.3286, 'learning_rate': 4.840640021459503e-06, 'epoch': 1.37} {'loss': 0.2601, 'learning_rate': 4.840352216796611e-06, 'epoch': 1.37} {'loss': 0.3935, 'learning_rate': 4.840064417957986e-06, 'epoch': 1.37} {'loss': 0.1441, 'learning_rate': 4.839776624943946e-06, 'epoch': 1.37} {'loss': 0.2584, 'learning_rate': 4.839488837754813e-06, 'epoch': 1.37} {'loss': 0.3366, 'learning_rate': 4.83920105639092e-06, 'epoch': 1.37} {'loss': 0.3209, 'learning_rate': 4.838913280852584e-06, 'epoch': 1.37} {'loss': 0.4185, 'learning_rate': 4.838625511140137e-06, 'epoch': 1.37} {'loss': 0.1901, 'learning_rate': 4.838337747253896e-06, 'epoch': 1.37} {'loss': 0.3147, 'learning_rate': 4.838049989194194e-06, 'epoch': 1.37} {'loss': 0.3979, 'learning_rate': 4.83776223696135e-06, 'epoch': 1.37} {'loss': 0.2803, 'learning_rate': 4.837474490555693e-06, 'epoch': 1.37} {'loss': 0.3205, 'learning_rate': 4.837186749977541e-06, 'epoch': 1.37} {'loss': 0.3527, 'learning_rate': 4.836899015227229e-06, 'epoch': 1.37} {'loss': 0.4415, 'learning_rate': 4.836611286305072e-06, 'epoch': 1.37} {'loss': 0.4853, 'learning_rate': 4.836323563211402e-06, 'epoch': 1.37} {'loss': 0.3056, 'learning_rate': 4.836035845946542e-06, 'epoch': 1.37} {'loss': 0.3476, 'learning_rate': 4.8357481345108105e-06, 'epoch': 1.37} {'loss': 0.3327, 'learning_rate': 4.835460428904541e-06, 'epoch': 1.37} {'loss': 0.2001, 'learning_rate': 4.835172729128052e-06, 'epoch': 1.37} {'loss': 0.4763, 'learning_rate': 4.834885035181674e-06, 'epoch': 1.37} {'loss': 0.3631, 'learning_rate': 4.834597347065725e-06, 'epoch': 1.37} {'loss': 0.3441, 'learning_rate': 4.8343096647805366e-06, 'epoch': 1.37} {'loss': 0.4303, 'learning_rate': 4.834021988326427e-06, 'epoch': 1.37} {'loss': 0.2967, 'learning_rate': 4.833734317703729e-06, 'epoch': 1.37} {'loss': 0.2819, 'learning_rate': 4.833446652912756e-06, 'epoch': 1.37} {'loss': 0.3035, 'learning_rate': 4.833158993953846e-06, 'epoch': 1.37} {'loss': 0.3975, 'learning_rate': 4.832871340827312e-06, 'epoch': 1.37} {'loss': 0.2717, 'learning_rate': 4.832583693533487e-06, 'epoch': 1.37} {'loss': 0.391, 'learning_rate': 4.832296052072692e-06, 'epoch': 1.37} {'loss': 0.3485, 'learning_rate': 4.832008416445249e-06, 'epoch': 1.37} {'loss': 0.1866, 'learning_rate': 4.83172078665149e-06, 'epoch': 1.37} {'loss': 0.4548, 'learning_rate': 4.831433162691732e-06, 'epoch': 1.37} {'loss': 0.3832, 'learning_rate': 4.831145544566306e-06, 'epoch': 1.37} {'loss': 0.4068, 'learning_rate': 4.83085793227553e-06, 'epoch': 1.37} {'loss': 0.1777, 'learning_rate': 4.830570325819737e-06, 'epoch': 1.37} {'loss': 0.2534, 'learning_rate': 4.8302827251992425e-06, 'epoch': 1.37} {'loss': 0.2438, 'learning_rate': 4.829995130414379e-06, 'epoch': 1.37} {'loss': 0.3847, 'learning_rate': 4.829707541465465e-06, 'epoch': 1.37} {'loss': 0.2744, 'learning_rate': 4.829419958352831e-06, 'epoch': 1.37} {'loss': 0.357, 'learning_rate': 4.829132381076797e-06, 'epoch': 1.37} {'loss': 0.3485, 'learning_rate': 4.828844809637691e-06, 'epoch': 1.37} {'loss': 0.2697, 'learning_rate': 4.828557244035836e-06, 'epoch': 1.37} {'loss': 0.2674, 'learning_rate': 4.8282696842715526e-06, 'epoch': 1.37} {'loss': 0.2316, 'learning_rate': 4.827982130345173e-06, 'epoch': 1.37} {'loss': 0.1958, 'learning_rate': 4.827694582257016e-06, 'epoch': 1.37} {'loss': 0.2635, 'learning_rate': 4.8274070400074105e-06, 'epoch': 1.37} {'loss': 0.2175, 'learning_rate': 4.8271195035966755e-06, 'epoch': 1.37} {'loss': 0.2695, 'learning_rate': 4.826831973025142e-06, 'epoch': 1.37} {'loss': 0.3314, 'learning_rate': 4.826544448293129e-06, 'epoch': 1.37} {'loss': 0.2838, 'learning_rate': 4.8262569294009665e-06, 'epoch': 1.37} {'loss': 0.2406, 'learning_rate': 4.8259694163489726e-06, 'epoch': 1.37} {'loss': 0.2394, 'learning_rate': 4.825681909137478e-06, 'epoch': 1.37} {'loss': 0.4397, 'learning_rate': 4.825394407766802e-06, 'epoch': 1.37} {'loss': 0.3501, 'learning_rate': 4.825106912237275e-06, 'epoch': 1.37} {'loss': 0.4075, 'learning_rate': 4.824819422549218e-06, 'epoch': 1.37} {'loss': 0.2972, 'learning_rate': 4.824531938702953e-06, 'epoch': 1.37} {'loss': 0.4573, 'learning_rate': 4.82424446069881e-06, 'epoch': 1.37} {'loss': 0.3882, 'learning_rate': 4.823956988537109e-06, 'epoch': 1.37} {'loss': 0.3652, 'learning_rate': 4.823669522218178e-06, 'epoch': 1.37} {'loss': 0.2278, 'learning_rate': 4.823382061742337e-06, 'epoch': 1.37} {'loss': 0.327, 'learning_rate': 4.823094607109916e-06, 'epoch': 1.37} {'loss': 0.4451, 'learning_rate': 4.822807158321234e-06, 'epoch': 1.37} {'loss': 0.396, 'learning_rate': 4.822519715376621e-06, 'epoch': 1.37} {'loss': 0.4082, 'learning_rate': 4.822232278276397e-06, 'epoch': 1.37} {'loss': 0.3935, 'learning_rate': 4.82194484702089e-06, 'epoch': 1.37} {'loss': 0.3082, 'learning_rate': 4.821657421610418e-06, 'epoch': 1.37} {'loss': 0.2594, 'learning_rate': 4.821370002045316e-06, 'epoch': 1.37} {'loss': 0.4227, 'learning_rate': 4.821082588325901e-06, 'epoch': 1.37} {'loss': 0.4476, 'learning_rate': 4.820795180452496e-06, 'epoch': 1.37} {'loss': 0.3607, 'learning_rate': 4.820507778425433e-06, 'epoch': 1.37} {'loss': 0.2697, 'learning_rate': 4.820220382245027e-06, 'epoch': 1.37} {'loss': 0.2175, 'learning_rate': 4.81993299191161e-06, 'epoch': 1.37} {'loss': 0.2562, 'learning_rate': 4.8196456074255014e-06, 'epoch': 1.37} {'loss': 0.3854, 'learning_rate': 4.819358228787031e-06, 'epoch': 1.37} {'loss': 0.3887, 'learning_rate': 4.819070855996516e-06, 'epoch': 1.37} {'loss': 0.3333, 'learning_rate': 4.81878348905429e-06, 'epoch': 1.37} {'loss': 0.3443, 'learning_rate': 4.818496127960666e-06, 'epoch': 1.37} {'loss': 0.3315, 'learning_rate': 4.81820877271598e-06, 'epoch': 1.37} {'loss': 0.3635, 'learning_rate': 4.8179214233205464e-06, 'epoch': 1.37} {'loss': 0.4653, 'learning_rate': 4.817634079774699e-06, 'epoch': 1.37} {'loss': 0.3193, 'learning_rate': 4.817346742078755e-06, 'epoch': 1.37} {'loss': 0.3865, 'learning_rate': 4.817059410233039e-06, 'epoch': 1.37} {'loss': 0.3863, 'learning_rate': 4.816772084237882e-06, 'epoch': 1.37} {'loss': 0.3603, 'learning_rate': 4.816484764093599e-06, 'epoch': 1.37} {'loss': 0.2782, 'learning_rate': 4.816197449800522e-06, 'epoch': 1.37} {'loss': 0.2803, 'learning_rate': 4.815910141358969e-06, 'epoch': 1.37} {'loss': 0.3779, 'learning_rate': 4.815622838769271e-06, 'epoch': 1.37} {'loss': 0.2712, 'learning_rate': 4.815335542031746e-06, 'epoch': 1.37} {'loss': 0.2519, 'learning_rate': 4.815048251146724e-06, 'epoch': 1.37} {'loss': 0.3144, 'learning_rate': 4.814760966114525e-06, 'epoch': 1.37} {'loss': 0.3142, 'learning_rate': 4.814473686935477e-06, 'epoch': 1.37} {'loss': 0.2758, 'learning_rate': 4.814186413609898e-06, 'epoch': 1.37} {'loss': 0.2944, 'learning_rate': 4.8138991461381204e-06, 'epoch': 1.37} {'loss': 0.4098, 'learning_rate': 4.813611884520465e-06, 'epoch': 1.37} {'loss': 0.2695, 'learning_rate': 4.813324628757248e-06, 'epoch': 1.37} {'loss': 0.1868, 'learning_rate': 4.8130373788488085e-06, 'epoch': 1.37} {'loss': 0.3202, 'learning_rate': 4.81275013479546e-06, 'epoch': 1.37} {'loss': 0.3698, 'learning_rate': 4.812462896597533e-06, 'epoch': 1.37} {'loss': 0.3071, 'learning_rate': 4.812175664255347e-06, 'epoch': 1.37} {'loss': 0.4195, 'learning_rate': 4.8118884377692295e-06, 'epoch': 1.37} {'loss': 0.3125, 'learning_rate': 4.811601217139501e-06, 'epoch': 1.37} {'loss': 0.4777, 'learning_rate': 4.8113140023664914e-06, 'epoch': 1.37} {'loss': 0.4298, 'learning_rate': 4.811026793450523e-06, 'epoch': 1.37} {'loss': 0.3128, 'learning_rate': 4.810739590391913e-06, 'epoch': 1.37} {'loss': 0.4397, 'learning_rate': 4.810452393190996e-06, 'epoch': 1.37} {'loss': 0.4477, 'learning_rate': 4.810165201848087e-06, 'epoch': 1.37} {'loss': 0.2228, 'learning_rate': 4.80987801636352e-06, 'epoch': 1.37} {'loss': 0.269, 'learning_rate': 4.809590836737609e-06, 'epoch': 1.37} {'loss': 0.2681, 'learning_rate': 4.809303662970686e-06, 'epoch': 1.37} {'loss': 0.2437, 'learning_rate': 4.8090164950630695e-06, 'epoch': 1.37} {'loss': 0.2892, 'learning_rate': 4.808729333015089e-06, 'epoch': 1.37} {'loss': 0.4166, 'learning_rate': 4.808442176827062e-06, 'epoch': 1.37} {'loss': 0.4971, 'learning_rate': 4.80815502649932e-06, 'epoch': 1.37} {'loss': 0.2874, 'learning_rate': 4.8078678820321825e-06, 'epoch': 1.37} {'loss': 0.2654, 'learning_rate': 4.807580743425976e-06, 'epoch': 1.37} {'loss': 0.3113, 'learning_rate': 4.807293610681024e-06, 'epoch': 1.37} {'loss': 0.4768, 'learning_rate': 4.807006483797647e-06, 'epoch': 1.37} {'loss': 0.3196, 'learning_rate': 4.806719362776175e-06, 'epoch': 1.37} {'loss': 0.2591, 'learning_rate': 4.806432247616926e-06, 'epoch': 1.37} {'loss': 0.3865, 'learning_rate': 4.806145138320233e-06, 'epoch': 1.37} {'loss': 0.2648, 'learning_rate': 4.805858034886408e-06, 'epoch': 1.37} {'loss': 0.3472, 'learning_rate': 4.805570937315787e-06, 'epoch': 1.37} {'loss': 0.3682, 'learning_rate': 4.805283845608684e-06, 'epoch': 1.37} {'loss': 0.3432, 'learning_rate': 4.804996759765433e-06, 'epoch': 1.37} {'loss': 0.2527, 'learning_rate': 4.804709679786346e-06, 'epoch': 1.37} {'loss': 0.2627, 'learning_rate': 4.8044226056717605e-06, 'epoch': 1.37} {'loss': 0.2502, 'learning_rate': 4.804135537421989e-06, 'epoch': 1.37} {'loss': 0.2015, 'learning_rate': 4.803848475037364e-06, 'epoch': 1.37} {'loss': 0.2779, 'learning_rate': 4.803561418518206e-06, 'epoch': 1.37} {'loss': 0.4169, 'learning_rate': 4.803274367864835e-06, 'epoch': 1.37} {'loss': 0.2358, 'learning_rate': 4.8029873230775834e-06, 'epoch': 1.37} {'loss': 0.5211, 'learning_rate': 4.8027002841567675e-06, 'epoch': 1.37} {'loss': 0.3145, 'learning_rate': 4.802413251102718e-06, 'epoch': 1.37} {'loss': 0.3432, 'learning_rate': 4.80212622391575e-06, 'epoch': 1.37} {'loss': 0.2424, 'learning_rate': 4.801839202596199e-06, 'epoch': 1.37} {'loss': 0.186, 'learning_rate': 4.8015521871443795e-06, 'epoch': 1.37} {'loss': 0.1977, 'learning_rate': 4.801265177560623e-06, 'epoch': 1.37} {'loss': 0.3999, 'learning_rate': 4.800978173845243e-06, 'epoch': 1.37} {'loss': 0.2764, 'learning_rate': 4.800691175998577e-06, 'epoch': 1.37} {'loss': 0.3614, 'learning_rate': 4.800404184020936e-06, 'epoch': 1.37} {'loss': 0.2715, 'learning_rate': 4.800117197912655e-06, 'epoch': 1.37} {'loss': 0.342, 'learning_rate': 4.799830217674052e-06, 'epoch': 1.37} {'loss': 0.341, 'learning_rate': 4.799543243305449e-06, 'epoch': 1.37} {'loss': 0.451, 'learning_rate': 4.799256274807176e-06, 'epoch': 1.37} {'loss': 0.3336, 'learning_rate': 4.79896931217955e-06, 'epoch': 1.37} {'loss': 0.4128, 'learning_rate': 4.798682355422902e-06, 'epoch': 1.37} {'loss': 0.3175, 'learning_rate': 4.7983954045375495e-06, 'epoch': 1.37} {'loss': 0.2995, 'learning_rate': 4.798108459523822e-06, 'epoch': 1.37} {'loss': 0.2097, 'learning_rate': 4.7978215203820374e-06, 'epoch': 1.37} {'loss': 0.454, 'learning_rate': 4.797534587112528e-06, 'epoch': 1.37} {'loss': 0.2145, 'learning_rate': 4.797247659715608e-06, 'epoch': 1.37} {'loss': 0.283, 'learning_rate': 4.79696073819161e-06, 'epoch': 1.37} {'loss': 0.3088, 'learning_rate': 4.79667382254085e-06, 'epoch': 1.37} {'loss': 0.2449, 'learning_rate': 4.796386912763661e-06, 'epoch': 1.37} {'loss': 0.5061, 'learning_rate': 4.796100008860361e-06, 'epoch': 1.37} {'loss': 0.3089, 'learning_rate': 4.79581311083127e-06, 'epoch': 1.37} {'loss': 0.3994, 'learning_rate': 4.79552621867672e-06, 'epoch': 1.37} {'loss': 0.1481, 'learning_rate': 4.795239332397028e-06, 'epoch': 1.37} {'loss': 0.4605, 'learning_rate': 4.794952451992525e-06, 'epoch': 1.37} {'loss': 0.2143, 'learning_rate': 4.794665577463526e-06, 'epoch': 1.37} {'loss': 0.2892, 'learning_rate': 4.7943787088103645e-06, 'epoch': 1.37} {'loss': 0.2675, 'learning_rate': 4.794091846033356e-06, 'epoch': 1.37} {'loss': 0.3625, 'learning_rate': 4.793804989132831e-06, 'epoch': 1.37} {'loss': 0.3489, 'learning_rate': 4.793518138109107e-06, 'epoch': 1.37} {'loss': 0.3262, 'learning_rate': 4.793231292962515e-06, 'epoch': 1.37} {'loss': 0.362, 'learning_rate': 4.79294445369337e-06, 'epoch': 1.37} {'loss': 0.3409, 'learning_rate': 4.792657620302004e-06, 'epoch': 1.37} {'loss': 0.2117, 'learning_rate': 4.7923707927887384e-06, 'epoch': 1.37} {'loss': 0.3231, 'learning_rate': 4.792083971153891e-06, 'epoch': 1.37} {'loss': 0.251, 'learning_rate': 4.791797155397796e-06, 'epoch': 1.37} {'loss': 0.3851, 'learning_rate': 4.791510345520766e-06, 'epoch': 1.37} {'loss': 0.2526, 'learning_rate': 4.791223541523136e-06, 'epoch': 1.37} {'loss': 0.2686, 'learning_rate': 4.790936743405219e-06, 'epoch': 1.37} {'loss': 0.2518, 'learning_rate': 4.790649951167347e-06, 'epoch': 1.37} {'loss': 0.3124, 'learning_rate': 4.790363164809838e-06, 'epoch': 1.37} {'loss': 0.3267, 'learning_rate': 4.790076384333022e-06, 'epoch': 1.37} {'loss': 0.3919, 'learning_rate': 4.789789609737215e-06, 'epoch': 1.37} {'loss': 0.3151, 'learning_rate': 4.78950284102275e-06, 'epoch': 1.37} {'loss': 0.3386, 'learning_rate': 4.78921607818994e-06, 'epoch': 1.37} {'loss': 0.1319, 'learning_rate': 4.788929321239118e-06, 'epoch': 1.37} {'loss': 0.4413, 'learning_rate': 4.788642570170604e-06, 'epoch': 1.37} {'loss': 0.267, 'learning_rate': 4.788355824984719e-06, 'epoch': 1.37} {'loss': 0.3419, 'learning_rate': 4.7880690856817916e-06, 'epoch': 1.37} {'loss': 0.3223, 'learning_rate': 4.787782352262139e-06, 'epoch': 1.37} {'loss': 0.27, 'learning_rate': 4.787495624726094e-06, 'epoch': 1.37} {'loss': 0.4906, 'learning_rate': 4.787208903073971e-06, 'epoch': 1.37} {'loss': 0.3581, 'learning_rate': 4.786922187306101e-06, 'epoch': 1.37} {'loss': 0.2436, 'learning_rate': 4.7866354774228015e-06, 'epoch': 1.37} {'loss': 0.4231, 'learning_rate': 4.786348773424403e-06, 'epoch': 1.37} {'loss': 0.3042, 'learning_rate': 4.786062075311222e-06, 'epoch': 1.37} {'loss': 0.2905, 'learning_rate': 4.785775383083589e-06, 'epoch': 1.37} {'loss': 0.2727, 'learning_rate': 4.7854886967418194e-06, 'epoch': 1.37} {'loss': 0.3797, 'learning_rate': 4.7852020162862455e-06, 'epoch': 1.37} {'loss': 0.3459, 'learning_rate': 4.784915341717184e-06, 'epoch': 1.37} {'loss': 0.3948, 'learning_rate': 4.78462867303496e-06, 'epoch': 1.37} {'loss': 0.2992, 'learning_rate': 4.784342010239903e-06, 'epoch': 1.37} {'loss': 0.4348, 'learning_rate': 4.784055353332329e-06, 'epoch': 1.37} {'loss': 0.4186, 'learning_rate': 4.783768702312567e-06, 'epoch': 1.37} {'loss': 0.4783, 'learning_rate': 4.783482057180935e-06, 'epoch': 1.37} {'loss': 0.3225, 'learning_rate': 4.783195417937764e-06, 'epoch': 1.37} {'loss': 0.3543, 'learning_rate': 4.782908784583373e-06, 'epoch': 1.37} {'loss': 0.3196, 'learning_rate': 4.782622157118082e-06, 'epoch': 1.37} {'loss': 0.1526, 'learning_rate': 4.782335535542223e-06, 'epoch': 1.37} {'loss': 0.3186, 'learning_rate': 4.782048919856111e-06, 'epoch': 1.37} {'loss': 0.4178, 'learning_rate': 4.781762310060076e-06, 'epoch': 1.37} {'loss': 0.2499, 'learning_rate': 4.781475706154436e-06, 'epoch': 1.37} {'loss': 0.1928, 'learning_rate': 4.781189108139522e-06, 'epoch': 1.37} {'loss': 0.4127, 'learning_rate': 4.7809025160156486e-06, 'epoch': 1.37} {'loss': 0.3671, 'learning_rate': 4.780615929783148e-06, 'epoch': 1.37} {'loss': 0.379, 'learning_rate': 4.780329349442335e-06, 'epoch': 1.37} {'loss': 0.2985, 'learning_rate': 4.780042774993543e-06, 'epoch': 1.37} {'loss': 0.29, 'learning_rate': 4.779756206437085e-06, 'epoch': 1.37} {'loss': 0.2266, 'learning_rate': 4.7794696437732935e-06, 'epoch': 1.37} {'loss': 0.2069, 'learning_rate': 4.779183087002488e-06, 'epoch': 1.37} {'loss': 0.2226, 'learning_rate': 4.7788965361249884e-06, 'epoch': 1.37} {'loss': 0.2611, 'learning_rate': 4.778609991141126e-06, 'epoch': 1.37} {'loss': 0.3938, 'learning_rate': 4.7783234520512154e-06, 'epoch': 1.37} {'loss': 0.2488, 'learning_rate': 4.77803691885559e-06, 'epoch': 1.37} {'loss': 0.3433, 'learning_rate': 4.777750391554562e-06, 'epoch': 1.37} {'loss': 0.3273, 'learning_rate': 4.777463870148465e-06, 'epoch': 1.37} {'loss': 0.3658, 'learning_rate': 4.7771773546376155e-06, 'epoch': 1.37} {'loss': 0.1801, 'learning_rate': 4.776890845022343e-06, 'epoch': 1.37} {'loss': 0.316, 'learning_rate': 4.776604341302964e-06, 'epoch': 1.37} {'loss': 0.3737, 'learning_rate': 4.7763178434798085e-06, 'epoch': 1.37} {'loss': 0.3292, 'learning_rate': 4.776031351553193e-06, 'epoch': 1.37} {'loss': 0.265, 'learning_rate': 4.77574486552345e-06, 'epoch': 1.37} {'loss': 0.275, 'learning_rate': 4.775458385390892e-06, 'epoch': 1.37} {'loss': 0.3851, 'learning_rate': 4.775171911155852e-06, 'epoch': 1.37} {'loss': 0.292, 'learning_rate': 4.77488544281865e-06, 'epoch': 1.37} {'loss': 0.2965, 'learning_rate': 4.774598980379605e-06, 'epoch': 1.37} {'loss': 0.4043, 'learning_rate': 4.774312523839048e-06, 'epoch': 1.37} {'loss': 0.4364, 'learning_rate': 4.774026073197293e-06, 'epoch': 1.37} {'loss': 0.4717, 'learning_rate': 4.7737396284546745e-06, 'epoch': 1.37} {'loss': 0.3166, 'learning_rate': 4.773453189611506e-06, 'epoch': 1.37} {'loss': 0.3284, 'learning_rate': 4.773166756668118e-06, 'epoch': 1.37} {'loss': 0.2547, 'learning_rate': 4.772880329624827e-06, 'epoch': 1.37} {'loss': 0.2347, 'learning_rate': 4.772593908481965e-06, 'epoch': 1.37} {'loss': 0.179, 'learning_rate': 4.772307493239846e-06, 'epoch': 1.37} {'loss': 0.3026, 'learning_rate': 4.772021083898802e-06, 'epoch': 1.37} {'loss': 0.2293, 'learning_rate': 4.771734680459148e-06, 'epoch': 1.37} {'loss': 0.297, 'learning_rate': 4.771448282921215e-06, 'epoch': 1.37} {'loss': 0.2712, 'learning_rate': 4.771161891285322e-06, 'epoch': 1.37} {'loss': 0.2657, 'learning_rate': 4.770875505551789e-06, 'epoch': 1.37} {'loss': 0.3267, 'learning_rate': 4.770589125720948e-06, 'epoch': 1.37} {'loss': 0.3618, 'learning_rate': 4.7703027517931144e-06, 'epoch': 1.37} {'loss': 0.3317, 'learning_rate': 4.770016383768616e-06, 'epoch': 1.37} {'loss': 0.2237, 'learning_rate': 4.7697300216477725e-06, 'epoch': 1.37} {'loss': 0.2648, 'learning_rate': 4.769443665430913e-06, 'epoch': 1.37} {'loss': 0.2907, 'learning_rate': 4.769157315118352e-06, 'epoch': 1.37} {'loss': 0.2945, 'learning_rate': 4.768870970710423e-06, 'epoch': 1.37} {'loss': 0.2786, 'learning_rate': 4.768584632207439e-06, 'epoch': 1.37} {'loss': 0.3374, 'learning_rate': 4.768298299609733e-06, 'epoch': 1.37} {'loss': 0.286, 'learning_rate': 4.7680119729176185e-06, 'epoch': 1.37} {'loss': 0.2998, 'learning_rate': 4.767725652131429e-06, 'epoch': 1.37} {'loss': 0.3817, 'learning_rate': 4.767439337251481e-06, 'epoch': 1.37} {'loss': 0.4112, 'learning_rate': 4.767153028278095e-06, 'epoch': 1.37} {'loss': 0.404, 'learning_rate': 4.766866725211602e-06, 'epoch': 1.37} {'loss': 0.277, 'learning_rate': 4.766580428052318e-06, 'epoch': 1.37} {'loss': 0.3748, 'learning_rate': 4.766294136800572e-06, 'epoch': 1.37} {'loss': 0.3782, 'learning_rate': 4.7660078514566825e-06, 'epoch': 1.37} {'loss': 0.2976, 'learning_rate': 4.765721572020978e-06, 'epoch': 1.37} {'loss': 0.3227, 'learning_rate': 4.7654352984937745e-06, 'epoch': 1.37} {'loss': 0.3336, 'learning_rate': 4.765149030875403e-06, 'epoch': 1.37} {'loss': 0.4161, 'learning_rate': 4.76486276916618e-06, 'epoch': 1.37} {'loss': 0.2771, 'learning_rate': 4.764576513366435e-06, 'epoch': 1.37} {'loss': 0.2866, 'learning_rate': 4.764290263476482e-06, 'epoch': 1.37} {'loss': 0.3055, 'learning_rate': 4.764004019496655e-06, 'epoch': 1.37} {'loss': 0.4138, 'learning_rate': 4.763717781427272e-06, 'epoch': 1.37} {'loss': 0.3743, 'learning_rate': 4.763431549268651e-06, 'epoch': 1.37} {'loss': 0.239, 'learning_rate': 4.7631453230211245e-06, 'epoch': 1.37} {'loss': 0.2284, 'learning_rate': 4.762859102685008e-06, 'epoch': 1.37} {'loss': 0.3346, 'learning_rate': 4.76257288826063e-06, 'epoch': 1.37} {'loss': 0.3144, 'learning_rate': 4.762286679748308e-06, 'epoch': 1.37} {'loss': 0.4309, 'learning_rate': 4.762000477148373e-06, 'epoch': 1.37} {'loss': 0.3075, 'learning_rate': 4.761714280461138e-06, 'epoch': 1.37} {'loss': 0.4457, 'learning_rate': 4.7614280896869365e-06, 'epoch': 1.37} {'loss': 0.431, 'learning_rate': 4.761141904826082e-06, 'epoch': 1.37} {'loss': 0.3717, 'learning_rate': 4.760855725878907e-06, 'epoch': 1.37} {'loss': 0.251, 'learning_rate': 4.7605695528457254e-06, 'epoch': 1.37} {'loss': 0.3359, 'learning_rate': 4.760283385726867e-06, 'epoch': 1.37} {'loss': 0.3364, 'learning_rate': 4.7599972245226535e-06, 'epoch': 1.37} {'loss': 0.1907, 'learning_rate': 4.759711069233402e-06, 'epoch': 1.37} {'loss': 0.1793, 'learning_rate': 4.759424919859445e-06, 'epoch': 1.37} {'loss': 0.2604, 'learning_rate': 4.759138776401096e-06, 'epoch': 1.37} {'loss': 0.3415, 'learning_rate': 4.758852638858688e-06, 'epoch': 1.37} {'loss': 0.3381, 'learning_rate': 4.758566507232534e-06, 'epoch': 1.37} {'loss': 0.3561, 'learning_rate': 4.758280381522965e-06, 'epoch': 1.37} {'loss': 0.3205, 'learning_rate': 4.757994261730298e-06, 'epoch': 1.37} {'loss': 0.3344, 'learning_rate': 4.7577081478548614e-06, 'epoch': 1.37} {'loss': 0.3152, 'learning_rate': 4.757422039896973e-06, 'epoch': 1.37} {'loss': 0.398, 'learning_rate': 4.75713593785696e-06, 'epoch': 1.37} {'loss': 0.2888, 'learning_rate': 4.756849841735141e-06, 'epoch': 1.37} {'loss': 0.2969, 'learning_rate': 4.756563751531845e-06, 'epoch': 1.37} {'loss': 0.3482, 'learning_rate': 4.756277667247389e-06, 'epoch': 1.37} {'loss': 0.4802, 'learning_rate': 4.755991588882096e-06, 'epoch': 1.37} {'loss': 0.2436, 'learning_rate': 4.755705516436297e-06, 'epoch': 1.37} {'loss': 0.17, 'learning_rate': 4.7554194499103046e-06, 'epoch': 1.37} {'loss': 0.4668, 'learning_rate': 4.75513338930445e-06, 'epoch': 1.37} {'loss': 0.386, 'learning_rate': 4.7548473346190495e-06, 'epoch': 1.37} {'loss': 0.3361, 'learning_rate': 4.754561285854431e-06, 'epoch': 1.37} {'loss': 0.2746, 'learning_rate': 4.754275243010917e-06, 'epoch': 1.37} {'loss': 0.3712, 'learning_rate': 4.753989206088825e-06, 'epoch': 1.37} {'loss': 0.2451, 'learning_rate': 4.7537031750884845e-06, 'epoch': 1.37} {'loss': 0.3828, 'learning_rate': 4.7534171500102125e-06, 'epoch': 1.37} {'loss': 0.3852, 'learning_rate': 4.753131130854337e-06, 'epoch': 1.37} {'loss': 0.4185, 'learning_rate': 4.752845117621176e-06, 'epoch': 1.37} {'loss': 0.3581, 'learning_rate': 4.7525591103110594e-06, 'epoch': 1.37} {'loss': 0.4028, 'learning_rate': 4.7522731089243015e-06, 'epoch': 1.37} {'loss': 0.4021, 'learning_rate': 4.751987113461233e-06, 'epoch': 1.37} {'loss': 0.2096, 'learning_rate': 4.751701123922169e-06, 'epoch': 1.37} {'loss': 0.3556, 'learning_rate': 4.75141514030744e-06, 'epoch': 1.37} {'loss': 0.3489, 'learning_rate': 4.751129162617363e-06, 'epoch': 1.37} {'loss': 0.1796, 'learning_rate': 4.7508431908522656e-06, 'epoch': 1.37} {'loss': 0.2309, 'learning_rate': 4.750557225012468e-06, 'epoch': 1.37} {'loss': 0.2775, 'learning_rate': 4.750271265098291e-06, 'epoch': 1.37} {'loss': 0.4594, 'learning_rate': 4.749985311110061e-06, 'epoch': 1.37} {'loss': 0.2202, 'learning_rate': 4.749699363048097e-06, 'epoch': 1.37} {'loss': 0.3585, 'learning_rate': 4.749413420912726e-06, 'epoch': 1.37} {'loss': 0.3739, 'learning_rate': 4.7491274847042665e-06, 'epoch': 1.37} {'loss': 0.3235, 'learning_rate': 4.748841554423047e-06, 'epoch': 1.37} {'loss': 0.436, 'learning_rate': 4.748555630069384e-06, 'epoch': 1.37} {'loss': 0.3039, 'learning_rate': 4.748269711643606e-06, 'epoch': 1.37} {'loss': 0.2632, 'learning_rate': 4.747983799146029e-06, 'epoch': 1.37} {'loss': 0.3873, 'learning_rate': 4.7476978925769835e-06, 'epoch': 1.37} {'loss': 0.2462, 'learning_rate': 4.747411991936783e-06, 'epoch': 1.37} {'loss': 0.1572, 'learning_rate': 4.747126097225761e-06, 'epoch': 1.37} {'loss': 0.3531, 'learning_rate': 4.746840208444236e-06, 'epoch': 1.37} {'loss': 0.3667, 'learning_rate': 4.746554325592523e-06, 'epoch': 1.37} {'loss': 0.3414, 'learning_rate': 4.7462684486709565e-06, 'epoch': 1.37} {'loss': 0.2251, 'learning_rate': 4.74598257767985e-06, 'epoch': 1.37} {'loss': 0.4104, 'learning_rate': 4.745696712619533e-06, 'epoch': 1.37} {'loss': 0.4065, 'learning_rate': 4.745410853490322e-06, 'epoch': 1.37} {'loss': 0.3446, 'learning_rate': 4.745125000292546e-06, 'epoch': 1.37} {'loss': 0.2873, 'learning_rate': 4.744839153026522e-06, 'epoch': 1.37} {'loss': 0.298, 'learning_rate': 4.744553311692579e-06, 'epoch': 1.37} {'loss': 0.2307, 'learning_rate': 4.744267476291033e-06, 'epoch': 1.37} {'loss': 0.3706, 'learning_rate': 4.743981646822211e-06, 'epoch': 1.37} {'loss': 0.3122, 'learning_rate': 4.743695823286432e-06, 'epoch': 1.37} {'loss': 0.3582, 'learning_rate': 4.743410005684024e-06, 'epoch': 1.37} {'loss': 0.4203, 'learning_rate': 4.743124194015307e-06, 'epoch': 1.37} {'loss': 0.3397, 'learning_rate': 4.7428383882806e-06, 'epoch': 1.37} {'loss': 0.398, 'learning_rate': 4.742552588480232e-06, 'epoch': 1.37} {'loss': 0.3747, 'learning_rate': 4.742266794614517e-06, 'epoch': 1.37} {'loss': 0.3038, 'learning_rate': 4.741981006683789e-06, 'epoch': 1.37} {'loss': 0.3827, 'learning_rate': 4.7416952246883594e-06, 'epoch': 1.37} {'loss': 0.245, 'learning_rate': 4.74140944862856e-06, 'epoch': 1.37} {'loss': 0.3919, 'learning_rate': 4.741123678504706e-06, 'epoch': 1.37} {'loss': 0.3224, 'learning_rate': 4.740837914317127e-06, 'epoch': 1.37} {'loss': 0.2583, 'learning_rate': 4.7405521560661385e-06, 'epoch': 1.37} {'loss': 0.426, 'learning_rate': 4.74026640375207e-06, 'epoch': 1.37} {'loss': 0.3682, 'learning_rate': 4.739980657375236e-06, 'epoch': 1.37} {'loss': 0.2345, 'learning_rate': 4.739694916935968e-06, 'epoch': 1.37} {'loss': 0.3201, 'learning_rate': 4.739409182434584e-06, 'epoch': 1.37} {'loss': 0.4148, 'learning_rate': 4.739123453871404e-06, 'epoch': 1.37} {'loss': 0.4096, 'learning_rate': 4.738837731246756e-06, 'epoch': 1.37} {'loss': 0.3129, 'learning_rate': 4.7385520145609565e-06, 'epoch': 1.37} {'loss': 0.3167, 'learning_rate': 4.7382663038143335e-06, 'epoch': 1.37} {'loss': 0.2816, 'learning_rate': 4.737980599007205e-06, 'epoch': 1.37} {'loss': 0.5131, 'learning_rate': 4.7376949001398995e-06, 'epoch': 1.37} {'loss': 0.4005, 'learning_rate': 4.737409207212732e-06, 'epoch': 1.37} {'loss': 0.2744, 'learning_rate': 4.737123520226031e-06, 'epoch': 1.37} {'loss': 0.2976, 'learning_rate': 4.7368378391801155e-06, 'epoch': 1.37} {'loss': 0.2304, 'learning_rate': 4.736552164075311e-06, 'epoch': 1.37} {'loss': 0.342, 'learning_rate': 4.736266494911936e-06, 'epoch': 1.37} {'loss': 0.2912, 'learning_rate': 4.735980831690318e-06, 'epoch': 1.37} {'loss': 0.3166, 'learning_rate': 4.735695174410776e-06, 'epoch': 1.37} {'loss': 0.2755, 'learning_rate': 4.73540952307363e-06, 'epoch': 1.37} {'loss': 0.3189, 'learning_rate': 4.735123877679209e-06, 'epoch': 1.37} {'loss': 0.3974, 'learning_rate': 4.734838238227829e-06, 'epoch': 1.37} {'loss': 0.3138, 'learning_rate': 4.734552604719819e-06, 'epoch': 1.37} {'loss': 0.2388, 'learning_rate': 4.734266977155494e-06, 'epoch': 1.37} {'loss': 0.2771, 'learning_rate': 4.733981355535184e-06, 'epoch': 1.37} {'loss': 0.2659, 'learning_rate': 4.733695739859204e-06, 'epoch': 1.37} {'loss': 0.2567, 'learning_rate': 4.733410130127884e-06, 'epoch': 1.37} {'loss': 0.2617, 'learning_rate': 4.733124526341538e-06, 'epoch': 1.37} {'loss': 0.3492, 'learning_rate': 4.732838928500497e-06, 'epoch': 1.37} {'loss': 0.2955, 'learning_rate': 4.732553336605076e-06, 'epoch': 1.37} {'loss': 0.2509, 'learning_rate': 4.732267750655604e-06, 'epoch': 1.37} {'loss': 0.3345, 'learning_rate': 4.731982170652399e-06, 'epoch': 1.37} {'loss': 0.2717, 'learning_rate': 4.731696596595782e-06, 'epoch': 1.37} {'loss': 0.2803, 'learning_rate': 4.731411028486081e-06, 'epoch': 1.37} {'loss': 0.4519, 'learning_rate': 4.731125466323611e-06, 'epoch': 1.37} {'loss': 0.3706, 'learning_rate': 4.730839910108702e-06, 'epoch': 1.37} {'loss': 0.3446, 'learning_rate': 4.730554359841669e-06, 'epoch': 1.37} {'loss': 0.2686, 'learning_rate': 4.730268815522842e-06, 'epoch': 1.37} {'loss': 0.4039, 'learning_rate': 4.729983277152537e-06, 'epoch': 1.37} {'loss': 0.3609, 'learning_rate': 4.729697744731081e-06, 'epoch': 1.37} {'loss': 0.3366, 'learning_rate': 4.729412218258791e-06, 'epoch': 1.37} {'loss': 0.2201, 'learning_rate': 4.729126697735996e-06, 'epoch': 1.37} {'loss': 0.3936, 'learning_rate': 4.728841183163011e-06, 'epoch': 1.37} {'loss': 0.307, 'learning_rate': 4.7285556745401655e-06, 'epoch': 1.37} {'loss': 0.353, 'learning_rate': 4.728270171867775e-06, 'epoch': 1.37} {'loss': 0.2452, 'learning_rate': 4.727984675146165e-06, 'epoch': 1.37} {'loss': 0.555, 'learning_rate': 4.72769918437566e-06, 'epoch': 1.37} {'loss': 0.2804, 'learning_rate': 4.727413699556577e-06, 'epoch': 1.37} {'loss': 0.4168, 'learning_rate': 4.7271282206892454e-06, 'epoch': 1.37} {'loss': 0.3945, 'learning_rate': 4.72684274777398e-06, 'epoch': 1.37} {'loss': 0.1899, 'learning_rate': 4.726557280811109e-06, 'epoch': 1.37} {'loss': 0.2922, 'learning_rate': 4.72627181980095e-06, 'epoch': 1.37} {'loss': 0.2764, 'learning_rate': 4.72598636474383e-06, 'epoch': 1.37} {'loss': 0.3457, 'learning_rate': 4.725700915640068e-06, 'epoch': 1.37} {'loss': 0.2927, 'learning_rate': 4.725415472489984e-06, 'epoch': 1.37} {'loss': 0.1686, 'learning_rate': 4.725130035293906e-06, 'epoch': 1.37} {'loss': 0.3558, 'learning_rate': 4.72484460405215e-06, 'epoch': 1.37} {'loss': 0.4535, 'learning_rate': 4.724559178765045e-06, 'epoch': 1.37} {'loss': 0.2186, 'learning_rate': 4.724273759432905e-06, 'epoch': 1.37} {'loss': 0.4249, 'learning_rate': 4.723988346056061e-06, 'epoch': 1.37} {'loss': 0.4171, 'learning_rate': 4.723702938634826e-06, 'epoch': 1.37} {'loss': 0.285, 'learning_rate': 4.723417537169533e-06, 'epoch': 1.37} {'loss': 0.2461, 'learning_rate': 4.723132141660493e-06, 'epoch': 1.37} {'loss': 0.4101, 'learning_rate': 4.722846752108037e-06, 'epoch': 1.37} {'loss': 0.2947, 'learning_rate': 4.72256136851248e-06, 'epoch': 1.37} {'loss': 0.4167, 'learning_rate': 4.722275990874151e-06, 'epoch': 1.37} {'loss': 0.3181, 'learning_rate': 4.72199061919337e-06, 'epoch': 1.37} {'loss': 0.1081, 'learning_rate': 4.7217052534704535e-06, 'epoch': 1.37} {'loss': 0.2815, 'learning_rate': 4.721419893705732e-06, 'epoch': 1.37} {'loss': 0.2274, 'learning_rate': 4.721134539899519e-06, 'epoch': 1.37} {'loss': 0.2706, 'learning_rate': 4.720849192052146e-06, 'epoch': 1.37} {'loss': 0.3566, 'learning_rate': 4.720563850163926e-06, 'epoch': 1.37} {'loss': 0.5256, 'learning_rate': 4.720278514235191e-06, 'epoch': 1.37} {'loss': 0.3566, 'learning_rate': 4.719993184266252e-06, 'epoch': 1.37} {'loss': 0.3563, 'learning_rate': 4.719707860257441e-06, 'epoch': 1.37} {'loss': 0.302, 'learning_rate': 4.719422542209071e-06, 'epoch': 1.37} {'loss': 0.2805, 'learning_rate': 4.719137230121475e-06, 'epoch': 1.37} {'loss': 0.2863, 'learning_rate': 4.718851923994962e-06, 'epoch': 1.37} {'loss': 0.2096, 'learning_rate': 4.718566623829867e-06, 'epoch': 1.37} {'loss': 0.3111, 'learning_rate': 4.718281329626505e-06, 'epoch': 1.37} {'loss': 0.4123, 'learning_rate': 4.717996041385196e-06, 'epoch': 1.37} {'loss': 0.4168, 'learning_rate': 4.717710759106267e-06, 'epoch': 1.37} {'loss': 0.3232, 'learning_rate': 4.717425482790036e-06, 'epoch': 1.37} {'loss': 0.4254, 'learning_rate': 4.71714021243683e-06, 'epoch': 1.37} {'loss': 0.3226, 'learning_rate': 4.716854948046965e-06, 'epoch': 1.37} {'loss': 0.2597, 'learning_rate': 4.7165696896207705e-06, 'epoch': 1.37} {'loss': 0.2368, 'learning_rate': 4.716284437158559e-06, 'epoch': 1.37} {'loss': 0.3135, 'learning_rate': 4.715999190660662e-06, 'epoch': 1.37} {'loss': 0.3322, 'learning_rate': 4.715713950127393e-06, 'epoch': 1.37} {'loss': 0.287, 'learning_rate': 4.715428715559083e-06, 'epoch': 1.37} {'loss': 0.406, 'learning_rate': 4.715143486956044e-06, 'epoch': 1.37} {'loss': 0.4064, 'learning_rate': 4.714858264318607e-06, 'epoch': 1.37} {'loss': 0.3105, 'learning_rate': 4.714573047647091e-06, 'epoch': 1.37} {'loss': 0.3154, 'learning_rate': 4.714287836941812e-06, 'epoch': 1.37} {'loss': 0.3041, 'learning_rate': 4.714002632203101e-06, 'epoch': 1.37} {'loss': 0.2014, 'learning_rate': 4.713717433431272e-06, 'epoch': 1.37} {'loss': 0.3664, 'learning_rate': 4.713432240626655e-06, 'epoch': 1.37} {'loss': 0.1424, 'learning_rate': 4.7131470537895644e-06, 'epoch': 1.37} {'loss': 0.3412, 'learning_rate': 4.7128618729203275e-06, 'epoch': 1.37} {'loss': 0.3363, 'learning_rate': 4.712576698019261e-06, 'epoch': 1.37} {'loss': 0.2503, 'learning_rate': 4.7122915290866945e-06, 'epoch': 1.37} {'loss': 0.2376, 'learning_rate': 4.712006366122941e-06, 'epoch': 1.37} {'loss': 0.3692, 'learning_rate': 4.711721209128332e-06, 'epoch': 1.37} {'loss': 0.2021, 'learning_rate': 4.711436058103178e-06, 'epoch': 1.37} {'loss': 0.3402, 'learning_rate': 4.711150913047812e-06, 'epoch': 1.37} {'loss': 0.2346, 'learning_rate': 4.710865773962551e-06, 'epoch': 1.37} {'loss': 0.4033, 'learning_rate': 4.710580640847713e-06, 'epoch': 1.37} {'loss': 0.2009, 'learning_rate': 4.710295513703627e-06, 'epoch': 1.37} {'loss': 0.2417, 'learning_rate': 4.710010392530607e-06, 'epoch': 1.37} {'loss': 0.4081, 'learning_rate': 4.709725277328985e-06, 'epoch': 1.37} {'loss': 0.3893, 'learning_rate': 4.709440168099072e-06, 'epoch': 1.37} {'loss': 0.4428, 'learning_rate': 4.7091550648412e-06, 'epoch': 1.37} {'loss': 0.308, 'learning_rate': 4.708869967555681e-06, 'epoch': 1.38} {'loss': 0.4474, 'learning_rate': 4.708584876242845e-06, 'epoch': 1.38} {'loss': 0.3832, 'learning_rate': 4.708299790903008e-06, 'epoch': 1.38} {'loss': 0.3122, 'learning_rate': 4.708014711536497e-06, 'epoch': 1.38} {'loss': 0.286, 'learning_rate': 4.707729638143628e-06, 'epoch': 1.38} {'loss': 0.2163, 'learning_rate': 4.7074445707247296e-06, 'epoch': 1.38} {'loss': 0.2323, 'learning_rate': 4.707159509280119e-06, 'epoch': 1.38} {'loss': 0.2441, 'learning_rate': 4.706874453810115e-06, 'epoch': 1.38} {'loss': 0.2868, 'learning_rate': 4.706589404315048e-06, 'epoch': 1.38} {'loss': 0.2883, 'learning_rate': 4.706304360795231e-06, 'epoch': 1.38} {'loss': 0.2889, 'learning_rate': 4.706019323250993e-06, 'epoch': 1.38} {'loss': 0.3244, 'learning_rate': 4.70573429168265e-06, 'epoch': 1.38} {'loss': 0.2248, 'learning_rate': 4.705449266090528e-06, 'epoch': 1.38} {'loss': 0.297, 'learning_rate': 4.7051642464749445e-06, 'epoch': 1.38} {'loss': 0.3356, 'learning_rate': 4.704879232836228e-06, 'epoch': 1.38} {'loss': 0.2863, 'learning_rate': 4.704594225174692e-06, 'epoch': 1.38} {'loss': 0.2445, 'learning_rate': 4.704309223490664e-06, 'epoch': 1.38} {'loss': 0.2799, 'learning_rate': 4.704024227784462e-06, 'epoch': 1.38} {'loss': 0.4243, 'learning_rate': 4.703739238056413e-06, 'epoch': 1.38} {'loss': 0.3913, 'learning_rate': 4.703454254306835e-06, 'epoch': 1.38} {'loss': 0.3125, 'learning_rate': 4.703169276536046e-06, 'epoch': 1.38} {'loss': 0.4807, 'learning_rate': 4.702884304744375e-06, 'epoch': 1.38} {'loss': 0.307, 'learning_rate': 4.702599338932138e-06, 'epoch': 1.38} {'loss': 0.3009, 'learning_rate': 4.7023143790996615e-06, 'epoch': 1.38} {'loss': 0.3084, 'learning_rate': 4.702029425247262e-06, 'epoch': 1.38} {'loss': 0.4016, 'learning_rate': 4.701744477375267e-06, 'epoch': 1.38} {'loss': 0.2458, 'learning_rate': 4.701459535483991e-06, 'epoch': 1.38} {'loss': 0.4063, 'learning_rate': 4.701174599573763e-06, 'epoch': 1.38} {'loss': 0.2062, 'learning_rate': 4.700889669644898e-06, 'epoch': 1.38} {'loss': 0.3299, 'learning_rate': 4.700604745697726e-06, 'epoch': 1.38} {'loss': 0.3505, 'learning_rate': 4.700319827732558e-06, 'epoch': 1.38} {'loss': 0.3351, 'learning_rate': 4.7000349157497246e-06, 'epoch': 1.38} {'loss': 0.2754, 'learning_rate': 4.699750009749541e-06, 'epoch': 1.38} {'loss': 0.3994, 'learning_rate': 4.699465109732332e-06, 'epoch': 1.38} {'loss': 0.4394, 'learning_rate': 4.6991802156984225e-06, 'epoch': 1.38} {'loss': 0.3339, 'learning_rate': 4.6988953276481264e-06, 'epoch': 1.38} {'loss': 0.2022, 'learning_rate': 4.6986104455817734e-06, 'epoch': 1.38} {'loss': 0.1762, 'learning_rate': 4.698325569499678e-06, 'epoch': 1.38} {'loss': 0.3215, 'learning_rate': 4.698040699402168e-06, 'epoch': 1.38} {'loss': 0.1967, 'learning_rate': 4.697755835289562e-06, 'epoch': 1.38} {'loss': 0.2123, 'learning_rate': 4.6974709771621776e-06, 'epoch': 1.38} {'loss': 0.2015, 'learning_rate': 4.697186125020343e-06, 'epoch': 1.38} {'loss': 0.3083, 'learning_rate': 4.696901278864374e-06, 'epoch': 1.38} {'loss': 0.1595, 'learning_rate': 4.696616438694599e-06, 'epoch': 1.38} {'loss': 0.4126, 'learning_rate': 4.696331604511332e-06, 'epoch': 1.38} {'loss': 0.2977, 'learning_rate': 4.696046776314901e-06, 'epoch': 1.38} {'loss': 0.3649, 'learning_rate': 4.695761954105621e-06, 'epoch': 1.38} {'loss': 0.4982, 'learning_rate': 4.69547713788382e-06, 'epoch': 1.38} {'loss': 0.4051, 'learning_rate': 4.695192327649814e-06, 'epoch': 1.38} {'loss': 0.2372, 'learning_rate': 4.694907523403932e-06, 'epoch': 1.38} {'loss': 0.1558, 'learning_rate': 4.694622725146485e-06, 'epoch': 1.38} {'loss': 0.2712, 'learning_rate': 4.694337932877805e-06, 'epoch': 1.38} {'loss': 0.274, 'learning_rate': 4.694053146598204e-06, 'epoch': 1.38} {'loss': 0.2091, 'learning_rate': 4.693768366308012e-06, 'epoch': 1.38} {'loss': 0.3304, 'learning_rate': 4.693483592007546e-06, 'epoch': 1.38} {'loss': 0.2344, 'learning_rate': 4.693198823697125e-06, 'epoch': 1.38} {'loss': 0.1608, 'learning_rate': 4.6929140613770775e-06, 'epoch': 1.38} {'loss': 0.2563, 'learning_rate': 4.6926293050477156e-06, 'epoch': 1.38} {'loss': 0.2836, 'learning_rate': 4.69234455470937e-06, 'epoch': 1.38} {'loss': 0.2827, 'learning_rate': 4.692059810362356e-06, 'epoch': 1.38} {'loss': 0.4674, 'learning_rate': 4.691775072007e-06, 'epoch': 1.38} {'loss': 0.4108, 'learning_rate': 4.691490339643616e-06, 'epoch': 1.38} {'loss': 0.2356, 'learning_rate': 4.6912056132725346e-06, 'epoch': 1.38} {'loss': 0.2089, 'learning_rate': 4.690920892894069e-06, 'epoch': 1.38} {'loss': 0.2915, 'learning_rate': 4.690636178508546e-06, 'epoch': 1.38} {'loss': 0.2482, 'learning_rate': 4.690351470116284e-06, 'epoch': 1.38} {'loss': 0.2445, 'learning_rate': 4.690066767717607e-06, 'epoch': 1.38} {'loss': 0.3011, 'learning_rate': 4.689782071312836e-06, 'epoch': 1.38} {'loss': 0.4855, 'learning_rate': 4.689497380902288e-06, 'epoch': 1.38} {'loss': 0.5282, 'learning_rate': 4.68921269648629e-06, 'epoch': 1.38} {'loss': 0.2268, 'learning_rate': 4.688928018065159e-06, 'epoch': 1.38} {'loss': 0.3981, 'learning_rate': 4.688643345639221e-06, 'epoch': 1.38} {'loss': 0.3445, 'learning_rate': 4.688358679208791e-06, 'epoch': 1.38} {'loss': 0.3106, 'learning_rate': 4.688074018774197e-06, 'epoch': 1.38} {'loss': 0.3527, 'learning_rate': 4.687789364335754e-06, 'epoch': 1.38} {'loss': 0.2791, 'learning_rate': 4.6875047158937916e-06, 'epoch': 1.38} {'loss': 0.2049, 'learning_rate': 4.687220073448622e-06, 'epoch': 1.38} {'loss': 0.3013, 'learning_rate': 4.686935437000574e-06, 'epoch': 1.38} {'loss': 0.3297, 'learning_rate': 4.686650806549961e-06, 'epoch': 1.38} {'loss': 0.268, 'learning_rate': 4.686366182097113e-06, 'epoch': 1.38} {'loss': 0.3643, 'learning_rate': 4.6860815636423475e-06, 'epoch': 1.38} {'loss': 0.469, 'learning_rate': 4.685796951185983e-06, 'epoch': 1.38} {'loss': 0.4704, 'learning_rate': 4.685512344728344e-06, 'epoch': 1.38} {'loss': 0.3799, 'learning_rate': 4.685227744269749e-06, 'epoch': 1.38} {'loss': 0.2685, 'learning_rate': 4.684943149810525e-06, 'epoch': 1.38} {'loss': 0.425, 'learning_rate': 4.684658561350985e-06, 'epoch': 1.38} {'loss': 0.3034, 'learning_rate': 4.68437397889146e-06, 'epoch': 1.38} {'loss': 0.2371, 'learning_rate': 4.684089402432261e-06, 'epoch': 1.38} {'loss': 0.304, 'learning_rate': 4.683804831973719e-06, 'epoch': 1.38} {'loss': 0.2253, 'learning_rate': 4.683520267516145e-06, 'epoch': 1.38} {'loss': 0.2599, 'learning_rate': 4.68323570905987e-06, 'epoch': 1.38} {'loss': 0.1848, 'learning_rate': 4.682951156605208e-06, 'epoch': 1.38} {'loss': 0.2989, 'learning_rate': 4.682666610152485e-06, 'epoch': 1.38} {'loss': 0.3197, 'learning_rate': 4.682382069702023e-06, 'epoch': 1.38} {'loss': 0.2888, 'learning_rate': 4.682097535254134e-06, 'epoch': 1.38} {'loss': 0.2687, 'learning_rate': 4.681813006809151e-06, 'epoch': 1.38} {'loss': 0.2804, 'learning_rate': 4.681528484367386e-06, 'epoch': 1.38} {'loss': 0.2942, 'learning_rate': 4.6812439679291664e-06, 'epoch': 1.38} {'loss': 0.3736, 'learning_rate': 4.680959457494808e-06, 'epoch': 1.38} {'loss': 0.3381, 'learning_rate': 4.680674953064639e-06, 'epoch': 1.38} {'loss': 0.1872, 'learning_rate': 4.680390454638973e-06, 'epoch': 1.38} {'loss': 0.2694, 'learning_rate': 4.680105962218138e-06, 'epoch': 1.38} {'loss': 0.2945, 'learning_rate': 4.679821475802447e-06, 'epoch': 1.38} {'loss': 0.2606, 'learning_rate': 4.679536995392231e-06, 'epoch': 1.38} {'loss': 0.3764, 'learning_rate': 4.679252520987801e-06, 'epoch': 1.38} {'loss': 0.2878, 'learning_rate': 4.6789680525894885e-06, 'epoch': 1.38} {'loss': 0.3415, 'learning_rate': 4.678683590197608e-06, 'epoch': 1.38} {'loss': 0.3112, 'learning_rate': 4.678399133812479e-06, 'epoch': 1.38} {'loss': 0.3892, 'learning_rate': 4.678114683434428e-06, 'epoch': 1.38} {'loss': 0.419, 'learning_rate': 4.677830239063771e-06, 'epoch': 1.38} {'loss': 0.2789, 'learning_rate': 4.677545800700835e-06, 'epoch': 1.38} {'loss': 0.2522, 'learning_rate': 4.677261368345932e-06, 'epoch': 1.38} {'loss': 0.3615, 'learning_rate': 4.676976941999395e-06, 'epoch': 1.38} {'loss': 0.2078, 'learning_rate': 4.676692521661534e-06, 'epoch': 1.38} {'loss': 0.223, 'learning_rate': 4.676408107332679e-06, 'epoch': 1.38} {'loss': 0.3054, 'learning_rate': 4.676123699013143e-06, 'epoch': 1.38} {'loss': 0.2395, 'learning_rate': 4.6758392967032555e-06, 'epoch': 1.38} {'loss': 0.2139, 'learning_rate': 4.6755549004033275e-06, 'epoch': 1.38} {'loss': 0.4026, 'learning_rate': 4.6752705101136895e-06, 'epoch': 1.38} {'loss': 0.2329, 'learning_rate': 4.67498612583466e-06, 'epoch': 1.38} {'loss': 0.3289, 'learning_rate': 4.674701747566555e-06, 'epoch': 1.38} {'loss': 0.3008, 'learning_rate': 4.674417375309701e-06, 'epoch': 1.38} {'loss': 0.3016, 'learning_rate': 4.674133009064414e-06, 'epoch': 1.38} {'loss': 0.2732, 'learning_rate': 4.673848648831022e-06, 'epoch': 1.38} {'loss': 0.3071, 'learning_rate': 4.673564294609839e-06, 'epoch': 1.38} {'loss': 0.3665, 'learning_rate': 4.673279946401191e-06, 'epoch': 1.38} {'loss': 0.3238, 'learning_rate': 4.672995604205395e-06, 'epoch': 1.38} {'loss': 0.3385, 'learning_rate': 4.672711268022777e-06, 'epoch': 1.38} {'loss': 0.3673, 'learning_rate': 4.672426937853651e-06, 'epoch': 1.38} {'loss': 0.3438, 'learning_rate': 4.672142613698347e-06, 'epoch': 1.38} {'loss': 0.2622, 'learning_rate': 4.671858295557176e-06, 'epoch': 1.38} {'loss': 0.2913, 'learning_rate': 4.671573983430464e-06, 'epoch': 1.38} {'loss': 0.3282, 'learning_rate': 4.671289677318535e-06, 'epoch': 1.38} {'loss': 0.4839, 'learning_rate': 4.6710053772217034e-06, 'epoch': 1.38} {'loss': 0.396, 'learning_rate': 4.670721083140297e-06, 'epoch': 1.38} {'loss': 0.2478, 'learning_rate': 4.6704367950746295e-06, 'epoch': 1.38} {'loss': 0.268, 'learning_rate': 4.670152513025029e-06, 'epoch': 1.38} {'loss': 0.2929, 'learning_rate': 4.669868236991809e-06, 'epoch': 1.38} {'loss': 0.3118, 'learning_rate': 4.669583966975298e-06, 'epoch': 1.38} {'loss': 0.2719, 'learning_rate': 4.669299702975814e-06, 'epoch': 1.38} {'loss': 0.3363, 'learning_rate': 4.669015444993671e-06, 'epoch': 1.38} {'loss': 0.2954, 'learning_rate': 4.668731193029201e-06, 'epoch': 1.38} {'loss': 0.307, 'learning_rate': 4.668446947082716e-06, 'epoch': 1.38} {'loss': 0.2239, 'learning_rate': 4.6681627071545445e-06, 'epoch': 1.38} {'loss': 0.2939, 'learning_rate': 4.667878473244999e-06, 'epoch': 1.38} {'loss': 0.4149, 'learning_rate': 4.667594245354409e-06, 'epoch': 1.38} {'loss': 0.2941, 'learning_rate': 4.667310023483087e-06, 'epoch': 1.38} {'loss': 0.3712, 'learning_rate': 4.667025807631361e-06, 'epoch': 1.38} {'loss': 0.3836, 'learning_rate': 4.666741597799546e-06, 'epoch': 1.38} {'loss': 0.2868, 'learning_rate': 4.66645739398797e-06, 'epoch': 1.38} {'loss': 0.249, 'learning_rate': 4.666173196196944e-06, 'epoch': 1.38} {'loss': 0.2119, 'learning_rate': 4.665889004426799e-06, 'epoch': 1.38} {'loss': 0.3479, 'learning_rate': 4.66560481867785e-06, 'epoch': 1.38} {'loss': 0.2866, 'learning_rate': 4.665320638950416e-06, 'epoch': 1.38} {'loss': 0.2439, 'learning_rate': 4.6650364652448245e-06, 'epoch': 1.38} {'loss': 0.4594, 'learning_rate': 4.664752297561388e-06, 'epoch': 1.38} {'loss': 0.3166, 'learning_rate': 4.664468135900435e-06, 'epoch': 1.38} {'loss': 0.2665, 'learning_rate': 4.6641839802622804e-06, 'epoch': 1.38} {'loss': 0.3584, 'learning_rate': 4.663899830647249e-06, 'epoch': 1.38} {'loss': 0.297, 'learning_rate': 4.663615687055658e-06, 'epoch': 1.38} {'loss': 0.3078, 'learning_rate': 4.663331549487834e-06, 'epoch': 1.38} {'loss': 0.512, 'learning_rate': 4.66304741794409e-06, 'epoch': 1.38} {'loss': 0.3615, 'learning_rate': 4.662763292424753e-06, 'epoch': 1.38} {'loss': 0.2628, 'learning_rate': 4.662479172930139e-06, 'epoch': 1.38} {'loss': 0.4757, 'learning_rate': 4.662195059460573e-06, 'epoch': 1.38} {'loss': 0.3241, 'learning_rate': 4.661910952016377e-06, 'epoch': 1.38} {'loss': 0.3156, 'learning_rate': 4.661626850597862e-06, 'epoch': 1.38} {'loss': 0.3662, 'learning_rate': 4.661342755205359e-06, 'epoch': 1.38} {'loss': 0.2403, 'learning_rate': 4.661058665839182e-06, 'epoch': 1.38} {'loss': 0.3246, 'learning_rate': 4.660774582499659e-06, 'epoch': 1.38} {'loss': 0.2051, 'learning_rate': 4.6604905051871005e-06, 'epoch': 1.38} {'loss': 0.2956, 'learning_rate': 4.660206433901838e-06, 'epoch': 1.38} {'loss': 0.3909, 'learning_rate': 4.659922368644183e-06, 'epoch': 1.38} {'loss': 0.3833, 'learning_rate': 4.659638309414464e-06, 'epoch': 1.38} {'loss': 0.4074, 'learning_rate': 4.659354256212993e-06, 'epoch': 1.38} {'loss': 0.4089, 'learning_rate': 4.659070209040101e-06, 'epoch': 1.38} {'loss': 0.3172, 'learning_rate': 4.658786167896098e-06, 'epoch': 1.38} {'loss': 0.3139, 'learning_rate': 4.658502132781314e-06, 'epoch': 1.38} {'loss': 0.362, 'learning_rate': 4.658218103696065e-06, 'epoch': 1.38} {'loss': 0.1851, 'learning_rate': 4.6579340806406685e-06, 'epoch': 1.38} {'loss': 0.2144, 'learning_rate': 4.657650063615452e-06, 'epoch': 1.38} {'loss': 0.3713, 'learning_rate': 4.65736605262073e-06, 'epoch': 1.38} {'loss': 0.3067, 'learning_rate': 4.657082047656828e-06, 'epoch': 1.38} {'loss': 0.4041, 'learning_rate': 4.656798048724061e-06, 'epoch': 1.38} {'loss': 0.3685, 'learning_rate': 4.656514055822759e-06, 'epoch': 1.38} {'loss': 0.2927, 'learning_rate': 4.65623006895323e-06, 'epoch': 1.38} {'loss': 0.2587, 'learning_rate': 4.6559460881158056e-06, 'epoch': 1.38} {'loss': 0.3646, 'learning_rate': 4.655662113310798e-06, 'epoch': 1.38} {'loss': 0.2075, 'learning_rate': 4.655378144538536e-06, 'epoch': 1.38} {'loss': 0.3401, 'learning_rate': 4.655094181799331e-06, 'epoch': 1.38} {'loss': 0.2737, 'learning_rate': 4.654810225093513e-06, 'epoch': 1.38} {'loss': 0.2317, 'learning_rate': 4.654526274421397e-06, 'epoch': 1.38} {'loss': 0.3815, 'learning_rate': 4.654242329783301e-06, 'epoch': 1.38} {'loss': 0.2543, 'learning_rate': 4.6539583911795525e-06, 'epoch': 1.38} {'loss': 0.2734, 'learning_rate': 4.6536744586104654e-06, 'epoch': 1.38} {'loss': 0.2758, 'learning_rate': 4.653390532076366e-06, 'epoch': 1.38} {'loss': 0.2473, 'learning_rate': 4.653106611577569e-06, 'epoch': 1.38} {'loss': 0.2641, 'learning_rate': 4.6528226971144005e-06, 'epoch': 1.38} {'loss': 0.387, 'learning_rate': 4.652538788687175e-06, 'epoch': 1.38} {'loss': 0.1696, 'learning_rate': 4.652254886296221e-06, 'epoch': 1.38} {'loss': 0.3154, 'learning_rate': 4.65197098994185e-06, 'epoch': 1.38} {'loss': 0.2812, 'learning_rate': 4.65168709962439e-06, 'epoch': 1.38} {'loss': 0.1134, 'learning_rate': 4.651403215344156e-06, 'epoch': 1.38} {'loss': 0.3902, 'learning_rate': 4.651119337101473e-06, 'epoch': 1.38} {'loss': 0.2915, 'learning_rate': 4.650835464896656e-06, 'epoch': 1.38} {'loss': 0.3471, 'learning_rate': 4.650551598730032e-06, 'epoch': 1.38} {'loss': 0.2563, 'learning_rate': 4.6502677386019175e-06, 'epoch': 1.38} {'loss': 0.3064, 'learning_rate': 4.649983884512631e-06, 'epoch': 1.38} {'loss': 0.3257, 'learning_rate': 4.649700036462498e-06, 'epoch': 1.38} {'loss': 0.2281, 'learning_rate': 4.649416194451834e-06, 'epoch': 1.38} {'loss': 0.4045, 'learning_rate': 4.649132358480963e-06, 'epoch': 1.38} {'loss': 0.2673, 'learning_rate': 4.648848528550201e-06, 'epoch': 1.38} {'loss': 0.4461, 'learning_rate': 4.648564704659877e-06, 'epoch': 1.38} {'loss': 0.3017, 'learning_rate': 4.6482808868103e-06, 'epoch': 1.38} {'loss': 0.3218, 'learning_rate': 4.647997075001801e-06, 'epoch': 1.38} {'loss': 0.4272, 'learning_rate': 4.647713269234692e-06, 'epoch': 1.38} {'loss': 0.3408, 'learning_rate': 4.6474294695093e-06, 'epoch': 1.38} {'loss': 0.3628, 'learning_rate': 4.647145675825939e-06, 'epoch': 1.38} {'loss': 0.3144, 'learning_rate': 4.646861888184936e-06, 'epoch': 1.38} {'loss': 0.2649, 'learning_rate': 4.646578106586609e-06, 'epoch': 1.38} {'loss': 0.3263, 'learning_rate': 4.646294331031272e-06, 'epoch': 1.38} {'loss': 0.3102, 'learning_rate': 4.6460105615192555e-06, 'epoch': 1.38} {'loss': 0.45, 'learning_rate': 4.645726798050871e-06, 'epoch': 1.38} {'loss': 0.3605, 'learning_rate': 4.645443040626446e-06, 'epoch': 1.38} {'loss': 0.2665, 'learning_rate': 4.645159289246295e-06, 'epoch': 1.38} {'loss': 0.3107, 'learning_rate': 4.644875543910744e-06, 'epoch': 1.38} {'loss': 0.1868, 'learning_rate': 4.644591804620106e-06, 'epoch': 1.38} {'loss': 0.2635, 'learning_rate': 4.6443080713747095e-06, 'epoch': 1.38} {'loss': 0.2564, 'learning_rate': 4.644024344174867e-06, 'epoch': 1.38} {'loss': 0.2798, 'learning_rate': 4.643740623020906e-06, 'epoch': 1.38} {'loss': 0.2837, 'learning_rate': 4.643456907913141e-06, 'epoch': 1.38} {'loss': 0.431, 'learning_rate': 4.643173198851893e-06, 'epoch': 1.38} {'loss': 0.1956, 'learning_rate': 4.642889495837488e-06, 'epoch': 1.38} {'loss': 0.4274, 'learning_rate': 4.642605798870238e-06, 'epoch': 1.38} {'loss': 0.2185, 'learning_rate': 4.642322107950472e-06, 'epoch': 1.38} {'loss': 0.3451, 'learning_rate': 4.642038423078501e-06, 'epoch': 1.38} {'loss': 0.389, 'learning_rate': 4.641754744254653e-06, 'epoch': 1.38} {'loss': 0.3134, 'learning_rate': 4.641471071479242e-06, 'epoch': 1.38} {'loss': 0.489, 'learning_rate': 4.641187404752595e-06, 'epoch': 1.38} {'loss': 0.4341, 'learning_rate': 4.640903744075028e-06, 'epoch': 1.38} {'loss': 0.3415, 'learning_rate': 4.640620089446859e-06, 'epoch': 1.38} {'loss': 0.4349, 'learning_rate': 4.640336440868412e-06, 'epoch': 1.38} {'loss': 0.285, 'learning_rate': 4.640052798340005e-06, 'epoch': 1.38} {'loss': 0.3659, 'learning_rate': 4.639769161861962e-06, 'epoch': 1.38} {'loss': 0.324, 'learning_rate': 4.639485531434595e-06, 'epoch': 1.38} {'loss': 0.3536, 'learning_rate': 4.639201907058235e-06, 'epoch': 1.38} {'loss': 0.4938, 'learning_rate': 4.638918288733193e-06, 'epoch': 1.38} {'loss': 0.2334, 'learning_rate': 4.638634676459796e-06, 'epoch': 1.38} {'loss': 0.2995, 'learning_rate': 4.638351070238357e-06, 'epoch': 1.38} {'loss': 0.2778, 'learning_rate': 4.638067470069204e-06, 'epoch': 1.38} {'loss': 0.2607, 'learning_rate': 4.637783875952649e-06, 'epoch': 1.38} {'loss': 0.3298, 'learning_rate': 4.63750028788902e-06, 'epoch': 1.38} {'loss': 0.4009, 'learning_rate': 4.637216705878635e-06, 'epoch': 1.38} {'loss': 0.477, 'learning_rate': 4.636933129921808e-06, 'epoch': 1.38} {'loss': 0.2142, 'learning_rate': 4.636649560018868e-06, 'epoch': 1.38} {'loss': 0.229, 'learning_rate': 4.636365996170126e-06, 'epoch': 1.38} {'loss': 0.2629, 'learning_rate': 4.63608243837591e-06, 'epoch': 1.38} {'loss': 0.359, 'learning_rate': 4.635798886636534e-06, 'epoch': 1.38} {'loss': 0.213, 'learning_rate': 4.635515340952324e-06, 'epoch': 1.38} {'loss': 0.3257, 'learning_rate': 4.635231801323595e-06, 'epoch': 1.38} {'loss': 0.2209, 'learning_rate': 4.634948267750672e-06, 'epoch': 1.38} {'loss': 0.3137, 'learning_rate': 4.634664740233869e-06, 'epoch': 1.38} {'loss': 0.2933, 'learning_rate': 4.634381218773512e-06, 'epoch': 1.38} {'loss': 0.3155, 'learning_rate': 4.6340977033699154e-06, 'epoch': 1.38} {'loss': 0.3847, 'learning_rate': 4.633814194023405e-06, 'epoch': 1.38} {'loss': 0.3694, 'learning_rate': 4.633530690734298e-06, 'epoch': 1.38} {'loss': 0.3726, 'learning_rate': 4.633247193502911e-06, 'epoch': 1.38} {'loss': 0.2435, 'learning_rate': 4.632963702329571e-06, 'epoch': 1.38} {'loss': 0.4292, 'learning_rate': 4.632680217214591e-06, 'epoch': 1.38} {'loss': 0.2758, 'learning_rate': 4.632396738158298e-06, 'epoch': 1.38} {'loss': 0.2613, 'learning_rate': 4.632113265161004e-06, 'epoch': 1.38} {'loss': 0.4044, 'learning_rate': 4.631829798223038e-06, 'epoch': 1.38} {'loss': 0.3687, 'learning_rate': 4.631546337344711e-06, 'epoch': 1.38} {'loss': 0.1938, 'learning_rate': 4.631262882526352e-06, 'epoch': 1.38} {'loss': 0.2652, 'learning_rate': 4.630979433768271e-06, 'epoch': 1.38} {'loss': 0.3855, 'learning_rate': 4.630695991070798e-06, 'epoch': 1.38} {'loss': 0.2934, 'learning_rate': 4.630412554434245e-06, 'epoch': 1.38} {'loss': 0.3002, 'learning_rate': 4.630129123858939e-06, 'epoch': 1.38} {'loss': 0.2707, 'learning_rate': 4.629845699345195e-06, 'epoch': 1.38} {'loss': 0.3791, 'learning_rate': 4.62956228089333e-06, 'epoch': 1.38} {'loss': 0.1663, 'learning_rate': 4.629278868503673e-06, 'epoch': 1.38} {'loss': 0.3764, 'learning_rate': 4.628995462176534e-06, 'epoch': 1.38} {'loss': 0.3586, 'learning_rate': 4.628712061912242e-06, 'epoch': 1.38} {'loss': 0.3992, 'learning_rate': 4.628428667711109e-06, 'epoch': 1.38} {'loss': 0.4056, 'learning_rate': 4.628145279573462e-06, 'epoch': 1.38} {'loss': 0.4012, 'learning_rate': 4.6278618974996134e-06, 'epoch': 1.38} {'loss': 0.4166, 'learning_rate': 4.6275785214898915e-06, 'epoch': 1.38} {'loss': 0.4067, 'learning_rate': 4.627295151544609e-06, 'epoch': 1.38} {'loss': 0.3417, 'learning_rate': 4.62701178766409e-06, 'epoch': 1.38} {'loss': 0.4089, 'learning_rate': 4.626728429848651e-06, 'epoch': 1.38} {'loss': 0.3739, 'learning_rate': 4.626445078098618e-06, 'epoch': 1.38} {'loss': 0.3341, 'learning_rate': 4.626161732414306e-06, 'epoch': 1.38} {'loss': 0.5596, 'learning_rate': 4.625878392796032e-06, 'epoch': 1.38} {'loss': 0.3452, 'learning_rate': 4.625595059244123e-06, 'epoch': 1.38} {'loss': 0.339, 'learning_rate': 4.625311731758891e-06, 'epoch': 1.38} {'loss': 0.3039, 'learning_rate': 4.625028410340663e-06, 'epoch': 1.38} {'loss': 0.3637, 'learning_rate': 4.624745094989753e-06, 'epoch': 1.38} {'loss': 0.3101, 'learning_rate': 4.6244617857064874e-06, 'epoch': 1.38} {'loss': 0.249, 'learning_rate': 4.6241784824911785e-06, 'epoch': 1.38} {'loss': 0.4246, 'learning_rate': 4.623895185344153e-06, 'epoch': 1.38} {'loss': 0.3598, 'learning_rate': 4.623611894265725e-06, 'epoch': 1.38} {'loss': 0.404, 'learning_rate': 4.62332860925622e-06, 'epoch': 1.38} {'loss': 0.2612, 'learning_rate': 4.6230453303159504e-06, 'epoch': 1.38} {'loss': 0.4358, 'learning_rate': 4.6227620574452445e-06, 'epoch': 1.38} {'loss': 0.2084, 'learning_rate': 4.622478790644418e-06, 'epoch': 1.38} {'loss': 0.3355, 'learning_rate': 4.622195529913786e-06, 'epoch': 1.38} {'loss': 0.2367, 'learning_rate': 4.621912275253676e-06, 'epoch': 1.38} {'loss': 0.2524, 'learning_rate': 4.621629026664402e-06, 'epoch': 1.38} {'loss': 0.3685, 'learning_rate': 4.621345784146289e-06, 'epoch': 1.38} {'loss': 0.3054, 'learning_rate': 4.6210625476996495e-06, 'epoch': 1.38} {'loss': 0.3627, 'learning_rate': 4.620779317324812e-06, 'epoch': 1.38} {'loss': 0.2416, 'learning_rate': 4.6204960930220866e-06, 'epoch': 1.38} {'loss': 0.226, 'learning_rate': 4.620212874791803e-06, 'epoch': 1.38} {'loss': 0.3034, 'learning_rate': 4.6199296626342725e-06, 'epoch': 1.38} {'loss': 0.3021, 'learning_rate': 4.619646456549822e-06, 'epoch': 1.38} {'loss': 0.4432, 'learning_rate': 4.619363256538764e-06, 'epoch': 1.38} {'loss': 0.3677, 'learning_rate': 4.619080062601425e-06, 'epoch': 1.38} {'loss': 0.1884, 'learning_rate': 4.6187968747381215e-06, 'epoch': 1.38} {'loss': 0.3043, 'learning_rate': 4.618513692949169e-06, 'epoch': 1.38} {'loss': 0.2904, 'learning_rate': 4.6182305172348955e-06, 'epoch': 1.38} {'loss': 0.253, 'learning_rate': 4.617947347595613e-06, 'epoch': 1.38} {'loss': 0.3155, 'learning_rate': 4.617664184031647e-06, 'epoch': 1.38} {'loss': 0.2333, 'learning_rate': 4.617381026543312e-06, 'epoch': 1.38} {'loss': 0.4273, 'learning_rate': 4.617097875130934e-06, 'epoch': 1.38} {'loss': 0.29, 'learning_rate': 4.616814729794824e-06, 'epoch': 1.38} {'loss': 0.2649, 'learning_rate': 4.616531590535311e-06, 'epoch': 1.38} {'loss': 0.3314, 'learning_rate': 4.616248457352705e-06, 'epoch': 1.38} {'loss': 0.3954, 'learning_rate': 4.615965330247338e-06, 'epoch': 1.38} {'loss': 0.3291, 'learning_rate': 4.615682209219515e-06, 'epoch': 1.38} {'loss': 0.3744, 'learning_rate': 4.6153990942695684e-06, 'epoch': 1.38} {'loss': 0.3158, 'learning_rate': 4.615115985397808e-06, 'epoch': 1.38} {'loss': 0.3667, 'learning_rate': 4.614832882604558e-06, 'epoch': 1.38} {'loss': 0.4725, 'learning_rate': 4.614549785890141e-06, 'epoch': 1.38} {'loss': 0.4146, 'learning_rate': 4.61426669525487e-06, 'epoch': 1.38} {'loss': 0.1966, 'learning_rate': 4.613983610699071e-06, 'epoch': 1.38} {'loss': 0.1753, 'learning_rate': 4.613700532223056e-06, 'epoch': 1.38} {'loss': 0.423, 'learning_rate': 4.6134174598271544e-06, 'epoch': 1.38} {'loss': 0.3414, 'learning_rate': 4.6131343935116745e-06, 'epoch': 1.38} {'loss': 0.3746, 'learning_rate': 4.612851333276947e-06, 'epoch': 1.38} {'loss': 0.3523, 'learning_rate': 4.612568279123284e-06, 'epoch': 1.38} {'loss': 0.3434, 'learning_rate': 4.612285231051004e-06, 'epoch': 1.38} {'loss': 0.2868, 'learning_rate': 4.6120021890604335e-06, 'epoch': 1.38} {'loss': 0.2843, 'learning_rate': 4.611719153151885e-06, 'epoch': 1.38} {'loss': 0.2972, 'learning_rate': 4.611436123325684e-06, 'epoch': 1.38} {'loss': 0.3686, 'learning_rate': 4.611153099582143e-06, 'epoch': 1.38} {'loss': 0.2269, 'learning_rate': 4.610870081921589e-06, 'epoch': 1.38} {'loss': 0.3714, 'learning_rate': 4.610587070344334e-06, 'epoch': 1.38} {'loss': 0.3344, 'learning_rate': 4.610304064850706e-06, 'epoch': 1.38} {'loss': 0.2427, 'learning_rate': 4.610021065441015e-06, 'epoch': 1.38} {'loss': 0.2585, 'learning_rate': 4.60973807211559e-06, 'epoch': 1.38} {'loss': 0.2394, 'learning_rate': 4.609455084874741e-06, 'epoch': 1.38} {'loss': 0.3967, 'learning_rate': 4.609172103718796e-06, 'epoch': 1.38} {'loss': 0.2593, 'learning_rate': 4.608889128648072e-06, 'epoch': 1.38} {'loss': 0.3779, 'learning_rate': 4.6086061596628814e-06, 'epoch': 1.38} {'loss': 0.3113, 'learning_rate': 4.608323196763555e-06, 'epoch': 1.38} {'loss': 0.2903, 'learning_rate': 4.608040239950401e-06, 'epoch': 1.38} {'loss': 0.2728, 'learning_rate': 4.607757289223748e-06, 'epoch': 1.38} {'loss': 0.3899, 'learning_rate': 4.6074743445839086e-06, 'epoch': 1.38} {'loss': 0.2438, 'learning_rate': 4.607191406031208e-06, 'epoch': 1.38} {'loss': 0.2905, 'learning_rate': 4.606908473565961e-06, 'epoch': 1.38} {'loss': 0.3525, 'learning_rate': 4.606625547188492e-06, 'epoch': 1.38} {'loss': 0.4035, 'learning_rate': 4.606342626899112e-06, 'epoch': 1.38} {'loss': 0.2706, 'learning_rate': 4.60605971269815e-06, 'epoch': 1.38} {'loss': 0.3458, 'learning_rate': 4.6057768045859166e-06, 'epoch': 1.38} {'loss': 0.3814, 'learning_rate': 4.60549390256274e-06, 'epoch': 1.38} {'loss': 0.3463, 'learning_rate': 4.6052110066289345e-06, 'epoch': 1.38} {'loss': 0.2336, 'learning_rate': 4.604928116784817e-06, 'epoch': 1.38} {'loss': 0.2658, 'learning_rate': 4.6046452330307126e-06, 'epoch': 1.38} {'loss': 0.2707, 'learning_rate': 4.604362355366933e-06, 'epoch': 1.38} {'loss': 0.3556, 'learning_rate': 4.604079483793809e-06, 'epoch': 1.38} {'loss': 0.1483, 'learning_rate': 4.603796618311646e-06, 'epoch': 1.38} {'loss': 0.2039, 'learning_rate': 4.603513758920777e-06, 'epoch': 1.38} {'loss': 0.198, 'learning_rate': 4.60323090562151e-06, 'epoch': 1.38} {'loss': 0.3329, 'learning_rate': 4.602948058414173e-06, 'epoch': 1.38} {'loss': 0.4334, 'learning_rate': 4.6026652172990775e-06, 'epoch': 1.38} {'loss': 0.3783, 'learning_rate': 4.60238238227655e-06, 'epoch': 1.38} {'loss': 0.3281, 'learning_rate': 4.602099553346902e-06, 'epoch': 1.38} {'loss': 0.197, 'learning_rate': 4.601816730510462e-06, 'epoch': 1.38} {'loss': 0.2866, 'learning_rate': 4.601533913767544e-06, 'epoch': 1.38} {'loss': 0.2608, 'learning_rate': 4.601251103118465e-06, 'epoch': 1.38} {'loss': 0.2799, 'learning_rate': 4.600968298563549e-06, 'epoch': 1.38} {'loss': 0.2737, 'learning_rate': 4.60068550010311e-06, 'epoch': 1.38} {'loss': 0.4395, 'learning_rate': 4.600402707737475e-06, 'epoch': 1.38} {'loss': 0.2798, 'learning_rate': 4.600119921466953e-06, 'epoch': 1.38} {'loss': 0.4784, 'learning_rate': 4.599837141291874e-06, 'epoch': 1.38} {'loss': 0.2676, 'learning_rate': 4.599554367212548e-06, 'epoch': 1.38} {'loss': 0.2384, 'learning_rate': 4.599271599229301e-06, 'epoch': 1.38} {'loss': 0.3868, 'learning_rate': 4.598988837342447e-06, 'epoch': 1.38} {'loss': 0.346, 'learning_rate': 4.598706081552311e-06, 'epoch': 1.38} {'loss': 0.2527, 'learning_rate': 4.598423331859204e-06, 'epoch': 1.38} {'loss': 0.321, 'learning_rate': 4.598140588263455e-06, 'epoch': 1.38} {'loss': 0.4906, 'learning_rate': 4.597857850765377e-06, 'epoch': 1.38} {'loss': 0.3003, 'learning_rate': 4.597575119365286e-06, 'epoch': 1.38} {'loss': 0.2727, 'learning_rate': 4.597292394063511e-06, 'epoch': 1.38} {'loss': 0.2355, 'learning_rate': 4.59700967486036e-06, 'epoch': 1.38} {'loss': 0.3053, 'learning_rate': 4.596726961756162e-06, 'epoch': 1.38} {'loss': 0.3075, 'learning_rate': 4.596444254751228e-06, 'epoch': 1.38} {'loss': 0.3536, 'learning_rate': 4.596161553845885e-06, 'epoch': 1.38} {'loss': 0.274, 'learning_rate': 4.595878859040443e-06, 'epoch': 1.38} {'loss': 0.4546, 'learning_rate': 4.595596170335231e-06, 'epoch': 1.38} {'loss': 0.2687, 'learning_rate': 4.59531348773056e-06, 'epoch': 1.38} {'loss': 0.4296, 'learning_rate': 4.595030811226755e-06, 'epoch': 1.38} {'loss': 0.3917, 'learning_rate': 4.594748140824129e-06, 'epoch': 1.38} {'loss': 0.4388, 'learning_rate': 4.594465476523009e-06, 'epoch': 1.38} {'loss': 0.2543, 'learning_rate': 4.594182818323709e-06, 'epoch': 1.38} {'loss': 0.3201, 'learning_rate': 4.593900166226545e-06, 'epoch': 1.38} {'loss': 0.3948, 'learning_rate': 4.593617520231843e-06, 'epoch': 1.38} {'loss': 0.3859, 'learning_rate': 4.593334880339914e-06, 'epoch': 1.38} {'loss': 0.181, 'learning_rate': 4.593052246551087e-06, 'epoch': 1.38} {'loss': 0.1899, 'learning_rate': 4.592769618865672e-06, 'epoch': 1.38} {'loss': 0.3373, 'learning_rate': 4.5924869972839956e-06, 'epoch': 1.38} {'loss': 0.2152, 'learning_rate': 4.59220438180637e-06, 'epoch': 1.38} {'loss': 0.346, 'learning_rate': 4.59192177243312e-06, 'epoch': 1.38} {'loss': 0.334, 'learning_rate': 4.591639169164559e-06, 'epoch': 1.38} {'loss': 0.3947, 'learning_rate': 4.591356572001011e-06, 'epoch': 1.38} {'loss': 0.2115, 'learning_rate': 4.591073980942791e-06, 'epoch': 1.38} {'loss': 0.3669, 'learning_rate': 4.5907913959902226e-06, 'epoch': 1.38} {'loss': 0.2178, 'learning_rate': 4.590508817143623e-06, 'epoch': 1.38} {'loss': 0.4148, 'learning_rate': 4.590226244403307e-06, 'epoch': 1.38} {'loss': 0.2695, 'learning_rate': 4.589943677769598e-06, 'epoch': 1.38} {'loss': 0.3673, 'learning_rate': 4.589661117242812e-06, 'epoch': 1.38} {'loss': 0.331, 'learning_rate': 4.589378562823273e-06, 'epoch': 1.38} {'loss': 0.3322, 'learning_rate': 4.589096014511294e-06, 'epoch': 1.38} {'loss': 0.3048, 'learning_rate': 4.5888134723072e-06, 'epoch': 1.38} {'loss': 0.2941, 'learning_rate': 4.5885309362113014e-06, 'epoch': 1.38} {'loss': 0.2894, 'learning_rate': 4.5882484062239276e-06, 'epoch': 1.38} {'loss': 0.2469, 'learning_rate': 4.5879658823453875e-06, 'epoch': 1.38} {'loss': 0.24, 'learning_rate': 4.58768336457601e-06, 'epoch': 1.38} {'loss': 0.2707, 'learning_rate': 4.587400852916104e-06, 'epoch': 1.38} {'loss': 0.3422, 'learning_rate': 4.587118347365993e-06, 'epoch': 1.38} {'loss': 0.378, 'learning_rate': 4.586835847926e-06, 'epoch': 1.38} {'loss': 0.1917, 'learning_rate': 4.586553354596437e-06, 'epoch': 1.38} {'loss': 0.3542, 'learning_rate': 4.586270867377629e-06, 'epoch': 1.38} {'loss': 0.1271, 'learning_rate': 4.585988386269887e-06, 'epoch': 1.38} {'loss': 0.2284, 'learning_rate': 4.58570591127354e-06, 'epoch': 1.38} {'loss': 0.225, 'learning_rate': 4.585423442388897e-06, 'epoch': 1.38} {'loss': 0.2835, 'learning_rate': 4.585140979616285e-06, 'epoch': 1.38} {'loss': 0.3243, 'learning_rate': 4.584858522956019e-06, 'epoch': 1.38} {'loss': 0.2549, 'learning_rate': 4.5845760724084144e-06, 'epoch': 1.38} {'loss': 0.4807, 'learning_rate': 4.584293627973797e-06, 'epoch': 1.38} {'loss': 0.4036, 'learning_rate': 4.58401118965248e-06, 'epoch': 1.38} {'loss': 0.4279, 'learning_rate': 4.583728757444786e-06, 'epoch': 1.38} {'loss': 0.2814, 'learning_rate': 4.58344633135103e-06, 'epoch': 1.38} {'loss': 0.1723, 'learning_rate': 4.583163911371536e-06, 'epoch': 1.38} {'loss': 0.2598, 'learning_rate': 4.582881497506617e-06, 'epoch': 1.38} {'loss': 0.4077, 'learning_rate': 4.582599089756599e-06, 'epoch': 1.38} {'loss': 0.3235, 'learning_rate': 4.58231668812179e-06, 'epoch': 1.38} {'loss': 0.267, 'learning_rate': 4.5820342926025214e-06, 'epoch': 1.38} {'loss': 0.3342, 'learning_rate': 4.581751903199102e-06, 'epoch': 1.38} {'loss': 0.169, 'learning_rate': 4.581469519911857e-06, 'epoch': 1.38} {'loss': 0.2491, 'learning_rate': 4.5811871427411034e-06, 'epoch': 1.38} {'loss': 0.3029, 'learning_rate': 4.580904771687155e-06, 'epoch': 1.38} {'loss': 0.3291, 'learning_rate': 4.580622406750338e-06, 'epoch': 1.38} {'loss': 0.2954, 'learning_rate': 4.580340047930965e-06, 'epoch': 1.38} {'loss': 0.2643, 'learning_rate': 4.58005769522936e-06, 'epoch': 1.38} {'loss': 0.3782, 'learning_rate': 4.579775348645836e-06, 'epoch': 1.38} {'loss': 0.3857, 'learning_rate': 4.5794930081807196e-06, 'epoch': 1.38} {'loss': 0.1997, 'learning_rate': 4.57921067383432e-06, 'epoch': 1.38} {'loss': 0.4323, 'learning_rate': 4.5789283456069645e-06, 'epoch': 1.38} {'loss': 0.2927, 'learning_rate': 4.5786460234989645e-06, 'epoch': 1.38} {'loss': 0.412, 'learning_rate': 4.5783637075106455e-06, 'epoch': 1.38} {'loss': 0.3277, 'learning_rate': 4.57808139764232e-06, 'epoch': 1.38} {'loss': 0.2949, 'learning_rate': 4.577799093894313e-06, 'epoch': 1.38} {'loss': 0.3929, 'learning_rate': 4.57751679626694e-06, 'epoch': 1.38} {'loss': 0.4477, 'learning_rate': 4.577234504760515e-06, 'epoch': 1.38} {'loss': 0.1718, 'learning_rate': 4.576952219375366e-06, 'epoch': 1.38} {'loss': 0.2065, 'learning_rate': 4.576669940111802e-06, 'epoch': 1.38} {'loss': 0.4144, 'learning_rate': 4.57638766697015e-06, 'epoch': 1.38} {'loss': 0.393, 'learning_rate': 4.576105399950721e-06, 'epoch': 1.38} {'loss': 0.4536, 'learning_rate': 4.575823139053842e-06, 'epoch': 1.38} {'loss': 0.2752, 'learning_rate': 4.575540884279823e-06, 'epoch': 1.38} {'loss': 0.147, 'learning_rate': 4.5752586356289915e-06, 'epoch': 1.38} {'loss': 0.2941, 'learning_rate': 4.574976393101656e-06, 'epoch': 1.38} {'loss': 0.4312, 'learning_rate': 4.5746941566981466e-06, 'epoch': 1.38} {'loss': 0.3841, 'learning_rate': 4.574411926418771e-06, 'epoch': 1.38} {'loss': 0.3079, 'learning_rate': 4.574129702263855e-06, 'epoch': 1.38} {'loss': 0.3035, 'learning_rate': 4.573847484233717e-06, 'epoch': 1.38} {'loss': 0.2913, 'learning_rate': 4.573565272328668e-06, 'epoch': 1.38} {'loss': 0.2158, 'learning_rate': 4.573283066549037e-06, 'epoch': 1.38} {'loss': 0.4354, 'learning_rate': 4.573000866895132e-06, 'epoch': 1.38} {'loss': 0.243, 'learning_rate': 4.5727186733672825e-06, 'epoch': 1.38} {'loss': 0.3548, 'learning_rate': 4.572436485965797e-06, 'epoch': 1.38} {'loss': 0.2472, 'learning_rate': 4.572154304691002e-06, 'epoch': 1.38} {'loss': 0.3321, 'learning_rate': 4.57187212954321e-06, 'epoch': 1.39} {'loss': 0.3125, 'learning_rate': 4.571589960522744e-06, 'epoch': 1.39} {'loss': 0.3978, 'learning_rate': 4.571307797629919e-06, 'epoch': 1.39} {'loss': 0.2485, 'learning_rate': 4.571025640865058e-06, 'epoch': 1.39} {'loss': 0.2476, 'learning_rate': 4.570743490228473e-06, 'epoch': 1.39} {'loss': 0.2343, 'learning_rate': 4.570461345720491e-06, 'epoch': 1.39} {'loss': 0.4213, 'learning_rate': 4.57017920734142e-06, 'epoch': 1.39} {'loss': 0.2193, 'learning_rate': 4.5698970750915886e-06, 'epoch': 1.39} {'loss': 0.4098, 'learning_rate': 4.569614948971311e-06, 'epoch': 1.39} {'loss': 0.2673, 'learning_rate': 4.569332828980901e-06, 'epoch': 1.39} {'loss': 0.2599, 'learning_rate': 4.569050715120686e-06, 'epoch': 1.39} {'loss': 0.2852, 'learning_rate': 4.568768607390977e-06, 'epoch': 1.39} {'loss': 0.3302, 'learning_rate': 4.568486505792099e-06, 'epoch': 1.39} {'loss': 0.319, 'learning_rate': 4.568204410324363e-06, 'epoch': 1.39} {'loss': 0.2537, 'learning_rate': 4.567922320988094e-06, 'epoch': 1.39} {'loss': 0.3742, 'learning_rate': 4.567640237783605e-06, 'epoch': 1.39} {'loss': 0.2361, 'learning_rate': 4.567358160711221e-06, 'epoch': 1.39} {'loss': 0.1845, 'learning_rate': 4.567076089771252e-06, 'epoch': 1.39} {'loss': 0.3705, 'learning_rate': 4.5667940249640255e-06, 'epoch': 1.39} {'loss': 0.2808, 'learning_rate': 4.56651196628985e-06, 'epoch': 1.39} {'loss': 0.2738, 'learning_rate': 4.566229913749055e-06, 'epoch': 1.39} {'loss': 0.3479, 'learning_rate': 4.565947867341952e-06, 'epoch': 1.39} {'loss': 0.2051, 'learning_rate': 4.565665827068857e-06, 'epoch': 1.39} {'loss': 0.219, 'learning_rate': 4.5653837929300956e-06, 'epoch': 1.39} {'loss': 0.1497, 'learning_rate': 4.5651017649259796e-06, 'epoch': 1.39} {'loss': 0.3835, 'learning_rate': 4.564819743056833e-06, 'epoch': 1.39} {'loss': 0.3966, 'learning_rate': 4.564537727322969e-06, 'epoch': 1.39} {'loss': 0.3251, 'learning_rate': 4.56425571772471e-06, 'epoch': 1.39} {'loss': 0.398, 'learning_rate': 4.563973714262369e-06, 'epoch': 1.39} {'loss': 0.6576, 'learning_rate': 4.563691716936274e-06, 'epoch': 1.39} {'loss': 0.21, 'learning_rate': 4.563409725746732e-06, 'epoch': 1.39} {'loss': 0.2322, 'learning_rate': 4.56312774069407e-06, 'epoch': 1.39} {'loss': 0.442, 'learning_rate': 4.5628457617786e-06, 'epoch': 1.39} {'loss': 0.3802, 'learning_rate': 4.562563789000647e-06, 'epoch': 1.39} {'loss': 0.3301, 'learning_rate': 4.562281822360525e-06, 'epoch': 1.39} {'loss': 0.279, 'learning_rate': 4.561999861858549e-06, 'epoch': 1.39} {'loss': 0.2923, 'learning_rate': 4.561717907495045e-06, 'epoch': 1.39} {'loss': 0.2425, 'learning_rate': 4.5614359592703235e-06, 'epoch': 1.39} {'loss': 0.3176, 'learning_rate': 4.56115401718471e-06, 'epoch': 1.39} {'loss': 0.4123, 'learning_rate': 4.5608720812385165e-06, 'epoch': 1.39} {'loss': 0.2356, 'learning_rate': 4.560590151432067e-06, 'epoch': 1.39} {'loss': 0.3463, 'learning_rate': 4.560308227765674e-06, 'epoch': 1.39} {'loss': 0.309, 'learning_rate': 4.5600263102396615e-06, 'epoch': 1.39} {'loss': 0.3586, 'learning_rate': 4.559744398854342e-06, 'epoch': 1.39} {'loss': 0.2239, 'learning_rate': 4.559462493610039e-06, 'epoch': 1.39} {'loss': 0.2538, 'learning_rate': 4.559180594507065e-06, 'epoch': 1.39} {'loss': 0.4065, 'learning_rate': 4.558898701545743e-06, 'epoch': 1.39} {'loss': 0.3686, 'learning_rate': 4.558616814726392e-06, 'epoch': 1.39} {'loss': 0.2636, 'learning_rate': 4.558334934049324e-06, 'epoch': 1.39} {'loss': 0.3215, 'learning_rate': 4.558053059514865e-06, 'epoch': 1.39} {'loss': 0.2443, 'learning_rate': 4.557771191123327e-06, 'epoch': 1.39} {'loss': 0.3, 'learning_rate': 4.557489328875032e-06, 'epoch': 1.39} {'loss': 0.2669, 'learning_rate': 4.5572074727702945e-06, 'epoch': 1.39} {'loss': 0.3256, 'learning_rate': 4.556925622809437e-06, 'epoch': 1.39} {'loss': 0.286, 'learning_rate': 4.556643778992777e-06, 'epoch': 1.39} {'loss': 0.3776, 'learning_rate': 4.5563619413206266e-06, 'epoch': 1.39} {'loss': 0.2839, 'learning_rate': 4.556080109793312e-06, 'epoch': 1.39} {'loss': 0.1185, 'learning_rate': 4.555798284411144e-06, 'epoch': 1.39} {'loss': 0.2366, 'learning_rate': 4.555516465174449e-06, 'epoch': 1.39} {'loss': 0.1316, 'learning_rate': 4.555234652083535e-06, 'epoch': 1.39} {'loss': 0.2669, 'learning_rate': 4.554952845138732e-06, 'epoch': 1.39} {'loss': 0.3796, 'learning_rate': 4.5546710443403465e-06, 'epoch': 1.39} {'loss': 0.2665, 'learning_rate': 4.554389249688706e-06, 'epoch': 1.39} {'loss': 0.3457, 'learning_rate': 4.5541074611841196e-06, 'epoch': 1.39} {'loss': 0.4277, 'learning_rate': 4.553825678826916e-06, 'epoch': 1.39} {'loss': 0.2954, 'learning_rate': 4.553543902617402e-06, 'epoch': 1.39} {'loss': 0.3073, 'learning_rate': 4.553262132555906e-06, 'epoch': 1.39} {'loss': 0.3588, 'learning_rate': 4.552980368642741e-06, 'epoch': 1.39} {'loss': 0.3493, 'learning_rate': 4.552698610878223e-06, 'epoch': 1.39} {'loss': 0.2254, 'learning_rate': 4.5524168592626735e-06, 'epoch': 1.39} {'loss': 0.2742, 'learning_rate': 4.552135113796407e-06, 'epoch': 1.39} {'loss': 0.3964, 'learning_rate': 4.5518533744797485e-06, 'epoch': 1.39} {'loss': 0.5503, 'learning_rate': 4.551571641313007e-06, 'epoch': 1.39} {'loss': 0.3288, 'learning_rate': 4.551289914296509e-06, 'epoch': 1.39} {'loss': 0.2615, 'learning_rate': 4.551008193430565e-06, 'epoch': 1.39} {'loss': 0.4903, 'learning_rate': 4.550726478715501e-06, 'epoch': 1.39} {'loss': 0.3108, 'learning_rate': 4.550444770151625e-06, 'epoch': 1.39} {'loss': 0.304, 'learning_rate': 4.550163067739266e-06, 'epoch': 1.39} {'loss': 0.4026, 'learning_rate': 4.549881371478732e-06, 'epoch': 1.39} {'loss': 0.2199, 'learning_rate': 4.5495996813703495e-06, 'epoch': 1.39} {'loss': 0.3527, 'learning_rate': 4.549317997414432e-06, 'epoch': 1.39} {'loss': 0.4621, 'learning_rate': 4.549036319611295e-06, 'epoch': 1.39} {'loss': 0.265, 'learning_rate': 4.548754647961263e-06, 'epoch': 1.39} {'loss': 0.4372, 'learning_rate': 4.548472982464647e-06, 'epoch': 1.39} {'loss': 0.3722, 'learning_rate': 4.548191323121771e-06, 'epoch': 1.39} {'loss': 0.307, 'learning_rate': 4.547909669932947e-06, 'epoch': 1.39} {'loss': 0.3661, 'learning_rate': 4.5476280228985e-06, 'epoch': 1.39} {'loss': 0.3761, 'learning_rate': 4.547346382018741e-06, 'epoch': 1.39} {'loss': 0.2941, 'learning_rate': 4.547064747293994e-06, 'epoch': 1.39} {'loss': 0.188, 'learning_rate': 4.54678311872457e-06, 'epoch': 1.39} {'loss': 0.3147, 'learning_rate': 4.546501496310796e-06, 'epoch': 1.39} {'loss': 0.4338, 'learning_rate': 4.54621988005298e-06, 'epoch': 1.39} {'loss': 0.2854, 'learning_rate': 4.545938269951449e-06, 'epoch': 1.39} {'loss': 0.3474, 'learning_rate': 4.545656666006516e-06, 'epoch': 1.39} {'loss': 0.3244, 'learning_rate': 4.545375068218496e-06, 'epoch': 1.39} {'loss': 0.3448, 'learning_rate': 4.545093476587714e-06, 'epoch': 1.39} {'loss': 0.4474, 'learning_rate': 4.54481189111448e-06, 'epoch': 1.39} {'loss': 0.3461, 'learning_rate': 4.54453031179912e-06, 'epoch': 1.39} {'loss': 0.2455, 'learning_rate': 4.544248738641944e-06, 'epoch': 1.39} {'loss': 0.3432, 'learning_rate': 4.543967171643279e-06, 'epoch': 1.39} {'loss': 0.3852, 'learning_rate': 4.543685610803432e-06, 'epoch': 1.39} {'loss': 0.2992, 'learning_rate': 4.54340405612273e-06, 'epoch': 1.39} {'loss': 0.3417, 'learning_rate': 4.543122507601485e-06, 'epoch': 1.39} {'loss': 0.4069, 'learning_rate': 4.54284096524002e-06, 'epoch': 1.39} {'loss': 0.3398, 'learning_rate': 4.5425594290386455e-06, 'epoch': 1.39} {'loss': 0.347, 'learning_rate': 4.542277898997688e-06, 'epoch': 1.39} {'loss': 0.405, 'learning_rate': 4.54199637511746e-06, 'epoch': 1.39} {'loss': 0.4298, 'learning_rate': 4.5417148573982775e-06, 'epoch': 1.39} {'loss': 0.3836, 'learning_rate': 4.541433345840465e-06, 'epoch': 1.39} {'loss': 0.3124, 'learning_rate': 4.541151840444331e-06, 'epoch': 1.39} {'loss': 0.2698, 'learning_rate': 4.540870341210204e-06, 'epoch': 1.39} {'loss': 0.263, 'learning_rate': 4.540588848138391e-06, 'epoch': 1.39} {'loss': 0.1557, 'learning_rate': 4.54030736122922e-06, 'epoch': 1.39} {'loss': 0.4408, 'learning_rate': 4.540025880483e-06, 'epoch': 1.39} {'loss': 0.3062, 'learning_rate': 4.5397444059000555e-06, 'epoch': 1.39} {'loss': 0.311, 'learning_rate': 4.539462937480697e-06, 'epoch': 1.39} {'loss': 0.4081, 'learning_rate': 4.539181475225252e-06, 'epoch': 1.39} {'loss': 0.2599, 'learning_rate': 4.538900019134029e-06, 'epoch': 1.39} {'loss': 0.3242, 'learning_rate': 4.53861856920735e-06, 'epoch': 1.39} {'loss': 0.3689, 'learning_rate': 4.538337125445535e-06, 'epoch': 1.39} {'loss': 0.2027, 'learning_rate': 4.538055687848894e-06, 'epoch': 1.39} {'loss': 0.3005, 'learning_rate': 4.537774256417754e-06, 'epoch': 1.39} {'loss': 0.2117, 'learning_rate': 4.537492831152424e-06, 'epoch': 1.39} {'loss': 0.27, 'learning_rate': 4.53721141205323e-06, 'epoch': 1.39} {'loss': 0.3685, 'learning_rate': 4.536929999120481e-06, 'epoch': 1.39} {'loss': 0.3416, 'learning_rate': 4.536648592354504e-06, 'epoch': 1.39} {'loss': 0.2602, 'learning_rate': 4.536367191755606e-06, 'epoch': 1.39} {'loss': 0.323, 'learning_rate': 4.536085797324116e-06, 'epoch': 1.39} {'loss': 0.4466, 'learning_rate': 4.535804409060342e-06, 'epoch': 1.39} {'loss': 0.2613, 'learning_rate': 4.535523026964609e-06, 'epoch': 1.39} {'loss': 0.2166, 'learning_rate': 4.535241651037229e-06, 'epoch': 1.39} {'loss': 0.3638, 'learning_rate': 4.534960281278524e-06, 'epoch': 1.39} {'loss': 0.4071, 'learning_rate': 4.534678917688811e-06, 'epoch': 1.39} {'loss': 0.2419, 'learning_rate': 4.534397560268402e-06, 'epoch': 1.39} {'loss': 0.2968, 'learning_rate': 4.534116209017623e-06, 'epoch': 1.39} {'loss': 0.2927, 'learning_rate': 4.5338348639367825e-06, 'epoch': 1.39} {'loss': 0.3741, 'learning_rate': 4.533553525026207e-06, 'epoch': 1.39} {'loss': 0.3718, 'learning_rate': 4.5332721922862076e-06, 'epoch': 1.39} {'loss': 0.3976, 'learning_rate': 4.532990865717107e-06, 'epoch': 1.39} {'loss': 0.4862, 'learning_rate': 4.532709545319216e-06, 'epoch': 1.39} {'loss': 0.3209, 'learning_rate': 4.5324282310928615e-06, 'epoch': 1.39} {'loss': 0.4019, 'learning_rate': 4.5321469230383505e-06, 'epoch': 1.39} {'loss': 0.3809, 'learning_rate': 4.531865621156011e-06, 'epoch': 1.39} {'loss': 0.2623, 'learning_rate': 4.5315843254461515e-06, 'epoch': 1.39} {'loss': 0.3, 'learning_rate': 4.531303035909096e-06, 'epoch': 1.39} {'loss': 0.4102, 'learning_rate': 4.531021752545156e-06, 'epoch': 1.39} {'loss': 0.3718, 'learning_rate': 4.530740475354654e-06, 'epoch': 1.39} {'loss': 0.1886, 'learning_rate': 4.5304592043379084e-06, 'epoch': 1.39} {'loss': 0.2631, 'learning_rate': 4.53017793949523e-06, 'epoch': 1.39} {'loss': 0.3043, 'learning_rate': 4.529896680826945e-06, 'epoch': 1.39} {'loss': 0.3268, 'learning_rate': 4.529615428333363e-06, 'epoch': 1.39} {'loss': 0.5498, 'learning_rate': 4.529334182014808e-06, 'epoch': 1.39} {'loss': 0.3285, 'learning_rate': 4.529052941871591e-06, 'epoch': 1.39} {'loss': 0.4264, 'learning_rate': 4.528771707904037e-06, 'epoch': 1.39} {'loss': 0.2219, 'learning_rate': 4.528490480112458e-06, 'epoch': 1.39} {'loss': 0.1886, 'learning_rate': 4.5282092584971715e-06, 'epoch': 1.39} {'loss': 0.3414, 'learning_rate': 4.527928043058498e-06, 'epoch': 1.39} {'loss': 0.4157, 'learning_rate': 4.52764683379675e-06, 'epoch': 1.39} {'loss': 0.3559, 'learning_rate': 4.5273656307122515e-06, 'epoch': 1.39} {'loss': 0.3429, 'learning_rate': 4.527084433805313e-06, 'epoch': 1.39} {'loss': 0.1965, 'learning_rate': 4.52680324307626e-06, 'epoch': 1.39} {'loss': 0.3474, 'learning_rate': 4.526522058525401e-06, 'epoch': 1.39} {'loss': 0.3118, 'learning_rate': 4.526240880153061e-06, 'epoch': 1.39} {'loss': 0.5144, 'learning_rate': 4.525959707959551e-06, 'epoch': 1.39} {'loss': 0.203, 'learning_rate': 4.525678541945195e-06, 'epoch': 1.39} {'loss': 0.2585, 'learning_rate': 4.525397382110304e-06, 'epoch': 1.39} {'loss': 0.2652, 'learning_rate': 4.525116228455201e-06, 'epoch': 1.39} {'loss': 0.3834, 'learning_rate': 4.524835080980201e-06, 'epoch': 1.39} {'loss': 0.3054, 'learning_rate': 4.524553939685618e-06, 'epoch': 1.39} {'loss': 0.393, 'learning_rate': 4.524272804571775e-06, 'epoch': 1.39} {'loss': 0.4267, 'learning_rate': 4.523991675638984e-06, 'epoch': 1.39} {'loss': 0.312, 'learning_rate': 4.523710552887568e-06, 'epoch': 1.39} {'loss': 0.4473, 'learning_rate': 4.523429436317839e-06, 'epoch': 1.39} {'loss': 0.319, 'learning_rate': 4.523148325930119e-06, 'epoch': 1.39} {'loss': 0.1913, 'learning_rate': 4.52286722172472e-06, 'epoch': 1.39} {'loss': 0.2729, 'learning_rate': 4.522586123701965e-06, 'epoch': 1.39} {'loss': 0.369, 'learning_rate': 4.522305031862166e-06, 'epoch': 1.39} {'loss': 0.3182, 'learning_rate': 4.522023946205647e-06, 'epoch': 1.39} {'loss': 0.321, 'learning_rate': 4.521742866732718e-06, 'epoch': 1.39} {'loss': 0.4668, 'learning_rate': 4.5214617934437026e-06, 'epoch': 1.39} {'loss': 0.2553, 'learning_rate': 4.521180726338914e-06, 'epoch': 1.39} {'loss': 0.3825, 'learning_rate': 4.520899665418669e-06, 'epoch': 1.39} {'loss': 0.3134, 'learning_rate': 4.520618610683289e-06, 'epoch': 1.39} {'loss': 0.2951, 'learning_rate': 4.5203375621330835e-06, 'epoch': 1.39} {'loss': 0.2163, 'learning_rate': 4.52005651976838e-06, 'epoch': 1.39} {'loss': 0.2772, 'learning_rate': 4.519775483589487e-06, 'epoch': 1.39} {'loss': 0.416, 'learning_rate': 4.5194944535967286e-06, 'epoch': 1.39} {'loss': 0.3725, 'learning_rate': 4.519213429790416e-06, 'epoch': 1.39} {'loss': 0.3827, 'learning_rate': 4.518932412170872e-06, 'epoch': 1.39} {'loss': 0.3059, 'learning_rate': 4.518651400738407e-06, 'epoch': 1.39} {'loss': 0.3136, 'learning_rate': 4.518370395493347e-06, 'epoch': 1.39} {'loss': 0.1609, 'learning_rate': 4.518089396436001e-06, 'epoch': 1.39} {'loss': 0.1792, 'learning_rate': 4.517808403566692e-06, 'epoch': 1.39} {'loss': 0.2972, 'learning_rate': 4.5175274168857354e-06, 'epoch': 1.39} {'loss': 0.273, 'learning_rate': 4.517246436393444e-06, 'epoch': 1.39} {'loss': 0.4238, 'learning_rate': 4.5169654620901425e-06, 'epoch': 1.39} {'loss': 0.3064, 'learning_rate': 4.516684493976141e-06, 'epoch': 1.39} {'loss': 0.2917, 'learning_rate': 4.516403532051764e-06, 'epoch': 1.39} {'loss': 0.2609, 'learning_rate': 4.51612257631732e-06, 'epoch': 1.39} {'loss': 0.366, 'learning_rate': 4.515841626773135e-06, 'epoch': 1.39} {'loss': 0.2573, 'learning_rate': 4.515560683419519e-06, 'epoch': 1.39} {'loss': 0.3224, 'learning_rate': 4.515279746256794e-06, 'epoch': 1.39} {'loss': 0.2746, 'learning_rate': 4.514998815285273e-06, 'epoch': 1.39} {'loss': 0.4237, 'learning_rate': 4.514717890505278e-06, 'epoch': 1.39} {'loss': 0.363, 'learning_rate': 4.5144369719171214e-06, 'epoch': 1.39} {'loss': 0.5656, 'learning_rate': 4.514156059521124e-06, 'epoch': 1.39} {'loss': 0.3279, 'learning_rate': 4.513875153317602e-06, 'epoch': 1.39} {'loss': 0.4637, 'learning_rate': 4.513594253306868e-06, 'epoch': 1.39} {'loss': 0.3507, 'learning_rate': 4.5133133594892466e-06, 'epoch': 1.39} {'loss': 0.2567, 'learning_rate': 4.513032471865047e-06, 'epoch': 1.39} {'loss': 0.3336, 'learning_rate': 4.512751590434595e-06, 'epoch': 1.39} {'loss': 0.4259, 'learning_rate': 4.512470715198198e-06, 'epoch': 1.39} {'loss': 0.3017, 'learning_rate': 4.512189846156183e-06, 'epoch': 1.39} {'loss': 0.3264, 'learning_rate': 4.511908983308858e-06, 'epoch': 1.39} {'loss': 0.3043, 'learning_rate': 4.511628126656548e-06, 'epoch': 1.39} {'loss': 0.3248, 'learning_rate': 4.511347276199562e-06, 'epoch': 1.39} {'loss': 0.2471, 'learning_rate': 4.511066431938226e-06, 'epoch': 1.39} {'loss': 0.2369, 'learning_rate': 4.510785593872847e-06, 'epoch': 1.39} {'loss': 0.3925, 'learning_rate': 4.510504762003751e-06, 'epoch': 1.39} {'loss': 0.3978, 'learning_rate': 4.510223936331253e-06, 'epoch': 1.39} {'loss': 0.346, 'learning_rate': 4.509943116855663e-06, 'epoch': 1.39} {'loss': 0.258, 'learning_rate': 4.509662303577307e-06, 'epoch': 1.39} {'loss': 0.4608, 'learning_rate': 4.509381496496495e-06, 'epoch': 1.39} {'loss': 0.2594, 'learning_rate': 4.509100695613551e-06, 'epoch': 1.39} {'loss': 0.5566, 'learning_rate': 4.508819900928784e-06, 'epoch': 1.39} {'loss': 0.2687, 'learning_rate': 4.508539112442519e-06, 'epoch': 1.39} {'loss': 0.3532, 'learning_rate': 4.508258330155065e-06, 'epoch': 1.39} {'loss': 0.3457, 'learning_rate': 4.507977554066748e-06, 'epoch': 1.39} {'loss': 0.4058, 'learning_rate': 4.5076967841778755e-06, 'epoch': 1.39} {'loss': 0.2443, 'learning_rate': 4.507416020488773e-06, 'epoch': 1.39} {'loss': 0.3233, 'learning_rate': 4.5071352629997486e-06, 'epoch': 1.39} {'loss': 0.3156, 'learning_rate': 4.506854511711128e-06, 'epoch': 1.39} {'loss': 0.2734, 'learning_rate': 4.506573766623225e-06, 'epoch': 1.39} {'loss': 0.4053, 'learning_rate': 4.506293027736352e-06, 'epoch': 1.39} {'loss': 0.445, 'learning_rate': 4.506012295050832e-06, 'epoch': 1.39} {'loss': 0.3509, 'learning_rate': 4.505731568566976e-06, 'epoch': 1.39} {'loss': 0.3192, 'learning_rate': 4.505450848285108e-06, 'epoch': 1.39} {'loss': 0.1693, 'learning_rate': 4.505170134205538e-06, 'epoch': 1.39} {'loss': 0.1364, 'learning_rate': 4.504889426328589e-06, 'epoch': 1.39} {'loss': 0.3663, 'learning_rate': 4.504608724654573e-06, 'epoch': 1.39} {'loss': 0.2055, 'learning_rate': 4.50432802918381e-06, 'epoch': 1.39} {'loss': 0.4273, 'learning_rate': 4.504047339916613e-06, 'epoch': 1.39} {'loss': 0.5569, 'learning_rate': 4.5037666568533045e-06, 'epoch': 1.39} {'loss': 0.232, 'learning_rate': 4.503485979994196e-06, 'epoch': 1.39} {'loss': 0.4452, 'learning_rate': 4.503205309339605e-06, 'epoch': 1.39} {'loss': 0.3234, 'learning_rate': 4.5029246448898544e-06, 'epoch': 1.39} {'loss': 0.326, 'learning_rate': 4.502643986645253e-06, 'epoch': 1.39} {'loss': 0.2654, 'learning_rate': 4.5023633346061246e-06, 'epoch': 1.39} {'loss': 0.2849, 'learning_rate': 4.50208268877278e-06, 'epoch': 1.39} {'loss': 0.4866, 'learning_rate': 4.5018020491455405e-06, 'epoch': 1.39} {'loss': 0.2582, 'learning_rate': 4.5015214157247175e-06, 'epoch': 1.39} {'loss': 0.2374, 'learning_rate': 4.501240788510636e-06, 'epoch': 1.39} {'loss': 0.4137, 'learning_rate': 4.5009601675036075e-06, 'epoch': 1.39} {'loss': 0.4375, 'learning_rate': 4.500679552703946e-06, 'epoch': 1.39} {'loss': 0.2414, 'learning_rate': 4.500398944111974e-06, 'epoch': 1.39} {'loss': 0.2679, 'learning_rate': 4.5001183417280035e-06, 'epoch': 1.39} {'loss': 0.5135, 'learning_rate': 4.499837745552357e-06, 'epoch': 1.39} {'loss': 0.3004, 'learning_rate': 4.499557155585344e-06, 'epoch': 1.39} {'loss': 0.3372, 'learning_rate': 4.499276571827288e-06, 'epoch': 1.39} {'loss': 0.4618, 'learning_rate': 4.498995994278499e-06, 'epoch': 1.39} {'loss': 0.3356, 'learning_rate': 4.498715422939301e-06, 'epoch': 1.39} {'loss': 0.3725, 'learning_rate': 4.4984348578100054e-06, 'epoch': 1.39} {'loss': 0.3882, 'learning_rate': 4.498154298890933e-06, 'epoch': 1.39} {'loss': 0.4413, 'learning_rate': 4.497873746182394e-06, 'epoch': 1.39} {'loss': 0.3881, 'learning_rate': 4.497593199684715e-06, 'epoch': 1.39} {'loss': 0.4661, 'learning_rate': 4.497312659398204e-06, 'epoch': 1.39} {'loss': 0.2667, 'learning_rate': 4.4970321253231785e-06, 'epoch': 1.39} {'loss': 0.3071, 'learning_rate': 4.4967515974599604e-06, 'epoch': 1.39} {'loss': 0.4695, 'learning_rate': 4.496471075808862e-06, 'epoch': 1.39} {'loss': 0.3016, 'learning_rate': 4.4961905603702016e-06, 'epoch': 1.39} {'loss': 0.4246, 'learning_rate': 4.4959100511442935e-06, 'epoch': 1.39} {'loss': 0.4008, 'learning_rate': 4.495629548131459e-06, 'epoch': 1.39} {'loss': 0.408, 'learning_rate': 4.49534905133201e-06, 'epoch': 1.39} {'loss': 0.4942, 'learning_rate': 4.495068560746267e-06, 'epoch': 1.39} {'loss': 0.4833, 'learning_rate': 4.494788076374542e-06, 'epoch': 1.39} {'loss': 0.3784, 'learning_rate': 4.494507598217158e-06, 'epoch': 1.39} {'loss': 0.4008, 'learning_rate': 4.494227126274424e-06, 'epoch': 1.39} {'loss': 0.428, 'learning_rate': 4.4939466605466655e-06, 'epoch': 1.39} {'loss': 0.3736, 'learning_rate': 4.493666201034189e-06, 'epoch': 1.39} {'loss': 0.3778, 'learning_rate': 4.493385747737321e-06, 'epoch': 1.39} {'loss': 0.3356, 'learning_rate': 4.493105300656373e-06, 'epoch': 1.39} {'loss': 0.3086, 'learning_rate': 4.492824859791658e-06, 'epoch': 1.39} {'loss': 0.3382, 'learning_rate': 4.4925444251435e-06, 'epoch': 1.39} {'loss': 0.4396, 'learning_rate': 4.4922639967122095e-06, 'epoch': 1.39} {'loss': 0.2242, 'learning_rate': 4.491983574498107e-06, 'epoch': 1.39} {'loss': 0.3334, 'learning_rate': 4.4917031585015065e-06, 'epoch': 1.39} {'loss': 0.3015, 'learning_rate': 4.491422748722728e-06, 'epoch': 1.39} {'loss': 0.3147, 'learning_rate': 4.491142345162083e-06, 'epoch': 1.39} {'loss': 0.3193, 'learning_rate': 4.490861947819894e-06, 'epoch': 1.39} {'loss': 0.3434, 'learning_rate': 4.4905815566964706e-06, 'epoch': 1.39} {'loss': 0.3969, 'learning_rate': 4.490301171792136e-06, 'epoch': 1.39} {'loss': 0.3923, 'learning_rate': 4.4900207931072e-06, 'epoch': 1.39} {'loss': 0.2987, 'learning_rate': 4.489740420641987e-06, 'epoch': 1.39} {'loss': 0.4635, 'learning_rate': 4.489460054396809e-06, 'epoch': 1.39} {'loss': 0.2482, 'learning_rate': 4.489179694371979e-06, 'epoch': 1.39} {'loss': 0.4075, 'learning_rate': 4.488899340567821e-06, 'epoch': 1.39} {'loss': 0.2995, 'learning_rate': 4.4886189929846444e-06, 'epoch': 1.39} {'loss': 0.3485, 'learning_rate': 4.488338651622772e-06, 'epoch': 1.39} {'loss': 0.3232, 'learning_rate': 4.4880583164825134e-06, 'epoch': 1.39} {'loss': 0.2361, 'learning_rate': 4.487777987564193e-06, 'epoch': 1.39} {'loss': 0.3541, 'learning_rate': 4.487497664868119e-06, 'epoch': 1.39} {'loss': 0.3859, 'learning_rate': 4.4872173483946155e-06, 'epoch': 1.39} {'loss': 0.34, 'learning_rate': 4.486937038143992e-06, 'epoch': 1.39} {'loss': 0.2546, 'learning_rate': 4.486656734116573e-06, 'epoch': 1.39} {'loss': 0.2415, 'learning_rate': 4.486376436312664e-06, 'epoch': 1.39} {'loss': 0.2703, 'learning_rate': 4.4860961447325926e-06, 'epoch': 1.39} {'loss': 0.3763, 'learning_rate': 4.48581585937667e-06, 'epoch': 1.39} {'loss': 0.247, 'learning_rate': 4.485535580245208e-06, 'epoch': 1.39} {'loss': 0.2381, 'learning_rate': 4.485255307338533e-06, 'epoch': 1.39} {'loss': 0.3946, 'learning_rate': 4.4849750406569515e-06, 'epoch': 1.39} {'loss': 0.324, 'learning_rate': 4.484694780200789e-06, 'epoch': 1.39} {'loss': 0.2954, 'learning_rate': 4.484414525970353e-06, 'epoch': 1.39} {'loss': 0.4696, 'learning_rate': 4.484134277965968e-06, 'epoch': 1.39} {'loss': 0.2243, 'learning_rate': 4.483854036187942e-06, 'epoch': 1.39} {'loss': 0.2266, 'learning_rate': 4.483573800636601e-06, 'epoch': 1.39} {'loss': 0.2944, 'learning_rate': 4.4832935713122515e-06, 'epoch': 1.39} {'loss': 0.3325, 'learning_rate': 4.483013348215218e-06, 'epoch': 1.39} {'loss': 0.4414, 'learning_rate': 4.48273313134581e-06, 'epoch': 1.39} {'loss': 0.2392, 'learning_rate': 4.482452920704351e-06, 'epoch': 1.39} {'loss': 0.4135, 'learning_rate': 4.482172716291153e-06, 'epoch': 1.39} {'loss': 0.3691, 'learning_rate': 4.48189251810653e-06, 'epoch': 1.39} {'loss': 0.47, 'learning_rate': 4.481612326150804e-06, 'epoch': 1.39} {'loss': 0.2456, 'learning_rate': 4.481332140424285e-06, 'epoch': 1.39} {'loss': 0.3953, 'learning_rate': 4.4810519609272965e-06, 'epoch': 1.39} {'loss': 0.3865, 'learning_rate': 4.480771787660147e-06, 'epoch': 1.39} {'loss': 0.2083, 'learning_rate': 4.480491620623159e-06, 'epoch': 1.39} {'loss': 0.5451, 'learning_rate': 4.480211459816643e-06, 'epoch': 1.39} {'loss': 0.1885, 'learning_rate': 4.479931305240923e-06, 'epoch': 1.39} {'loss': 0.2082, 'learning_rate': 4.479651156896307e-06, 'epoch': 1.39} {'loss': 0.3964, 'learning_rate': 4.47937101478312e-06, 'epoch': 1.39} {'loss': 0.3786, 'learning_rate': 4.4790908789016684e-06, 'epoch': 1.39} {'loss': 0.2817, 'learning_rate': 4.478810749252277e-06, 'epoch': 1.39} {'loss': 0.3398, 'learning_rate': 4.478530625835259e-06, 'epoch': 1.39} {'loss': 0.3684, 'learning_rate': 4.478250508650926e-06, 'epoch': 1.39} {'loss': 0.3363, 'learning_rate': 4.477970397699601e-06, 'epoch': 1.39} {'loss': 0.3613, 'learning_rate': 4.4776902929815946e-06, 'epoch': 1.39} {'loss': 0.3103, 'learning_rate': 4.4774101944972295e-06, 'epoch': 1.39} {'loss': 0.398, 'learning_rate': 4.4771301022468136e-06, 'epoch': 1.39} {'loss': 0.3492, 'learning_rate': 4.476850016230673e-06, 'epoch': 1.39} {'loss': 0.2777, 'learning_rate': 4.476569936449114e-06, 'epoch': 1.39} {'loss': 0.3245, 'learning_rate': 4.47628986290246e-06, 'epoch': 1.39} {'loss': 0.3088, 'learning_rate': 4.476009795591021e-06, 'epoch': 1.39} {'loss': 0.5032, 'learning_rate': 4.47572973451512e-06, 'epoch': 1.39} {'loss': 0.3968, 'learning_rate': 4.4754496796750665e-06, 'epoch': 1.39} {'loss': 0.3047, 'learning_rate': 4.47516963107118e-06, 'epoch': 1.39} {'loss': 0.3424, 'learning_rate': 4.474889588703779e-06, 'epoch': 1.39} {'loss': 0.4211, 'learning_rate': 4.474609552573175e-06, 'epoch': 1.39} {'loss': 0.4262, 'learning_rate': 4.474329522679688e-06, 'epoch': 1.39} {'loss': 0.3488, 'learning_rate': 4.47404949902363e-06, 'epoch': 1.39} {'loss': 0.2746, 'learning_rate': 4.473769481605322e-06, 'epoch': 1.39} {'loss': 0.2316, 'learning_rate': 4.473489470425074e-06, 'epoch': 1.39} {'loss': 0.2766, 'learning_rate': 4.473209465483209e-06, 'epoch': 1.39} {'loss': 0.2499, 'learning_rate': 4.47292946678004e-06, 'epoch': 1.39} {'loss': 0.1463, 'learning_rate': 4.472649474315879e-06, 'epoch': 1.39} {'loss': 0.1987, 'learning_rate': 4.4723694880910484e-06, 'epoch': 1.39} {'loss': 0.309, 'learning_rate': 4.472089508105859e-06, 'epoch': 1.39} {'loss': 0.3668, 'learning_rate': 4.471809534360633e-06, 'epoch': 1.39} {'loss': 0.2491, 'learning_rate': 4.471529566855678e-06, 'epoch': 1.39} {'loss': 0.3504, 'learning_rate': 4.471249605591319e-06, 'epoch': 1.39} {'loss': 0.38, 'learning_rate': 4.470969650567864e-06, 'epoch': 1.39} {'loss': 0.375, 'learning_rate': 4.4706897017856375e-06, 'epoch': 1.39} {'loss': 0.3593, 'learning_rate': 4.470409759244947e-06, 'epoch': 1.39} {'loss': 0.2255, 'learning_rate': 4.470129822946115e-06, 'epoch': 1.39} {'loss': 0.2863, 'learning_rate': 4.469849892889452e-06, 'epoch': 1.39} {'loss': 0.5161, 'learning_rate': 4.46956996907528e-06, 'epoch': 1.39} {'loss': 0.354, 'learning_rate': 4.469290051503913e-06, 'epoch': 1.39} {'loss': 0.321, 'learning_rate': 4.469010140175662e-06, 'epoch': 1.39} {'loss': 0.3592, 'learning_rate': 4.468730235090849e-06, 'epoch': 1.39} {'loss': 0.1805, 'learning_rate': 4.468450336249784e-06, 'epoch': 1.39} {'loss': 0.3677, 'learning_rate': 4.468170443652792e-06, 'epoch': 1.39} {'loss': 0.4596, 'learning_rate': 4.4678905573001796e-06, 'epoch': 1.39} {'loss': 0.2066, 'learning_rate': 4.4676106771922704e-06, 'epoch': 1.39} {'loss': 0.4269, 'learning_rate': 4.467330803329372e-06, 'epoch': 1.39} {'loss': 0.3766, 'learning_rate': 4.46705093571181e-06, 'epoch': 1.39} {'loss': 0.1925, 'learning_rate': 4.466771074339891e-06, 'epoch': 1.39} {'loss': 0.2332, 'learning_rate': 4.4664912192139384e-06, 'epoch': 1.39} {'loss': 0.3443, 'learning_rate': 4.466211370334262e-06, 'epoch': 1.39} {'loss': 0.5094, 'learning_rate': 4.465931527701185e-06, 'epoch': 1.39} {'loss': 0.2358, 'learning_rate': 4.465651691315018e-06, 'epoch': 1.39} {'loss': 0.2894, 'learning_rate': 4.465371861176074e-06, 'epoch': 1.39} {'loss': 0.2376, 'learning_rate': 4.465092037284677e-06, 'epoch': 1.39} {'loss': 0.1936, 'learning_rate': 4.464812219641135e-06, 'epoch': 1.39} {'loss': 0.3431, 'learning_rate': 4.464532408245771e-06, 'epoch': 1.39} {'loss': 0.1754, 'learning_rate': 4.464252603098893e-06, 'epoch': 1.39} {'loss': 0.2997, 'learning_rate': 4.4639728042008256e-06, 'epoch': 1.39} {'loss': 0.244, 'learning_rate': 4.463693011551876e-06, 'epoch': 1.39} {'loss': 0.3402, 'learning_rate': 4.463413225152368e-06, 'epoch': 1.39} {'loss': 0.3373, 'learning_rate': 4.4631334450026095e-06, 'epoch': 1.39} {'loss': 0.3343, 'learning_rate': 4.462853671102925e-06, 'epoch': 1.39} {'loss': 0.4066, 'learning_rate': 4.462573903453622e-06, 'epoch': 1.39} {'loss': 0.2072, 'learning_rate': 4.462294142055024e-06, 'epoch': 1.39} {'loss': 0.4346, 'learning_rate': 4.462014386907442e-06, 'epoch': 1.39} {'loss': 0.2886, 'learning_rate': 4.461734638011189e-06, 'epoch': 1.39} {'loss': 0.374, 'learning_rate': 4.461454895366588e-06, 'epoch': 1.39} {'loss': 0.3807, 'learning_rate': 4.461175158973949e-06, 'epoch': 1.39} {'loss': 0.1942, 'learning_rate': 4.460895428833593e-06, 'epoch': 1.39} {'loss': 0.4183, 'learning_rate': 4.460615704945828e-06, 'epoch': 1.39} {'loss': 0.2249, 'learning_rate': 4.4603359873109785e-06, 'epoch': 1.39} {'loss': 0.2406, 'learning_rate': 4.460056275929353e-06, 'epoch': 1.39} {'loss': 0.3487, 'learning_rate': 4.459776570801274e-06, 'epoch': 1.39} {'loss': 0.4462, 'learning_rate': 4.45949687192705e-06, 'epoch': 1.39} {'loss': 0.365, 'learning_rate': 4.459217179307005e-06, 'epoch': 1.39} {'loss': 0.2871, 'learning_rate': 4.4589374929414465e-06, 'epoch': 1.39} {'loss': 0.376, 'learning_rate': 4.458657812830697e-06, 'epoch': 1.39} {'loss': 0.2519, 'learning_rate': 4.458378138975069e-06, 'epoch': 1.39} {'loss': 0.4284, 'learning_rate': 4.4580984713748745e-06, 'epoch': 1.39} {'loss': 0.2482, 'learning_rate': 4.457818810030437e-06, 'epoch': 1.39} {'loss': 0.2174, 'learning_rate': 4.457539154942065e-06, 'epoch': 1.39} {'loss': 0.2783, 'learning_rate': 4.457259506110079e-06, 'epoch': 1.39} {'loss': 0.2535, 'learning_rate': 4.4569798635347905e-06, 'epoch': 1.39} {'loss': 0.3162, 'learning_rate': 4.456700227216521e-06, 'epoch': 1.39} {'loss': 0.4824, 'learning_rate': 4.456420597155581e-06, 'epoch': 1.39} {'loss': 0.2359, 'learning_rate': 4.45614097335229e-06, 'epoch': 1.39} {'loss': 0.3587, 'learning_rate': 4.455861355806959e-06, 'epoch': 1.39} {'loss': 0.2216, 'learning_rate': 4.455581744519909e-06, 'epoch': 1.39} {'loss': 0.2602, 'learning_rate': 4.455302139491448e-06, 'epoch': 1.39} {'loss': 0.1841, 'learning_rate': 4.455022540721903e-06, 'epoch': 1.39} {'loss': 0.4223, 'learning_rate': 4.4547429482115815e-06, 'epoch': 1.39} {'loss': 0.3423, 'learning_rate': 4.454463361960797e-06, 'epoch': 1.39} {'loss': 0.2652, 'learning_rate': 4.454183781969873e-06, 'epoch': 1.39} {'loss': 0.293, 'learning_rate': 4.453904208239117e-06, 'epoch': 1.39} {'loss': 0.3677, 'learning_rate': 4.453624640768852e-06, 'epoch': 1.39} {'loss': 0.4141, 'learning_rate': 4.453345079559387e-06, 'epoch': 1.39} {'loss': 0.2886, 'learning_rate': 4.453065524611044e-06, 'epoch': 1.39} {'loss': 0.2867, 'learning_rate': 4.452785975924132e-06, 'epoch': 1.39} {'loss': 0.2401, 'learning_rate': 4.452506433498973e-06, 'epoch': 1.39} {'loss': 0.281, 'learning_rate': 4.452226897335875e-06, 'epoch': 1.39} {'loss': 0.409, 'learning_rate': 4.451947367435162e-06, 'epoch': 1.39} {'loss': 0.4208, 'learning_rate': 4.451667843797143e-06, 'epoch': 1.39} {'loss': 0.3579, 'learning_rate': 4.451388326422138e-06, 'epoch': 1.39} {'loss': 0.205, 'learning_rate': 4.451108815310461e-06, 'epoch': 1.39} {'loss': 0.3474, 'learning_rate': 4.450829310462424e-06, 'epoch': 1.39} {'loss': 0.1577, 'learning_rate': 4.450549811878349e-06, 'epoch': 1.39} {'loss': 0.2287, 'learning_rate': 4.450270319558543e-06, 'epoch': 1.39} {'loss': 0.4219, 'learning_rate': 4.4499908335033305e-06, 'epoch': 1.39} {'loss': 0.3654, 'learning_rate': 4.4497113537130196e-06, 'epoch': 1.39} {'loss': 0.2079, 'learning_rate': 4.4494318801879335e-06, 'epoch': 1.39} {'loss': 0.2581, 'learning_rate': 4.449152412928379e-06, 'epoch': 1.39} {'loss': 0.3534, 'learning_rate': 4.448872951934679e-06, 'epoch': 1.39} {'loss': 0.3039, 'learning_rate': 4.448593497207143e-06, 'epoch': 1.39} {'loss': 0.3347, 'learning_rate': 4.448314048746093e-06, 'epoch': 1.39} {'loss': 0.3597, 'learning_rate': 4.448034606551838e-06, 'epoch': 1.39} {'loss': 0.2175, 'learning_rate': 4.447755170624694e-06, 'epoch': 1.39} {'loss': 0.2258, 'learning_rate': 4.447475740964984e-06, 'epoch': 1.39} {'loss': 0.3944, 'learning_rate': 4.447196317573014e-06, 'epoch': 1.39} {'loss': 0.3919, 'learning_rate': 4.446916900449107e-06, 'epoch': 1.39} {'loss': 0.3417, 'learning_rate': 4.44663748959357e-06, 'epoch': 1.39} {'loss': 0.1526, 'learning_rate': 4.446358085006728e-06, 'epoch': 1.39} {'loss': 0.3243, 'learning_rate': 4.446078686688888e-06, 'epoch': 1.39} {'loss': 0.4416, 'learning_rate': 4.445799294640373e-06, 'epoch': 1.39} {'loss': 0.304, 'learning_rate': 4.44551990886149e-06, 'epoch': 1.39} {'loss': 0.3875, 'learning_rate': 4.445240529352562e-06, 'epoch': 1.39} {'loss': 0.4609, 'learning_rate': 4.444961156113903e-06, 'epoch': 1.39} {'loss': 0.3426, 'learning_rate': 4.444681789145822e-06, 'epoch': 1.39} {'loss': 0.3009, 'learning_rate': 4.444402428448642e-06, 'epoch': 1.39} {'loss': 0.3235, 'learning_rate': 4.444123074022672e-06, 'epoch': 1.39} {'loss': 0.1494, 'learning_rate': 4.443843725868234e-06, 'epoch': 1.39} {'loss': 0.3671, 'learning_rate': 4.443564383985636e-06, 'epoch': 1.39} {'loss': 0.1534, 'learning_rate': 4.443285048375201e-06, 'epoch': 1.39} {'loss': 0.327, 'learning_rate': 4.443005719037238e-06, 'epoch': 1.39} {'loss': 0.3449, 'learning_rate': 4.442726395972067e-06, 'epoch': 1.39} {'loss': 0.3378, 'learning_rate': 4.442447079179998e-06, 'epoch': 1.39} {'loss': 0.2892, 'learning_rate': 4.442167768661353e-06, 'epoch': 1.39} {'loss': 0.3506, 'learning_rate': 4.441888464416441e-06, 'epoch': 1.39} {'loss': 0.4158, 'learning_rate': 4.441609166445582e-06, 'epoch': 1.39} {'loss': 0.2878, 'learning_rate': 4.44132987474909e-06, 'epoch': 1.39} {'loss': 0.271, 'learning_rate': 4.441050589327276e-06, 'epoch': 1.39} {'loss': 0.2327, 'learning_rate': 4.440771310180463e-06, 'epoch': 1.39} {'loss': 0.3468, 'learning_rate': 4.440492037308958e-06, 'epoch': 1.39} {'loss': 0.2692, 'learning_rate': 4.440212770713084e-06, 'epoch': 1.39} {'loss': 0.4248, 'learning_rate': 4.439933510393148e-06, 'epoch': 1.39} {'loss': 0.3419, 'learning_rate': 4.439654256349474e-06, 'epoch': 1.39} {'loss': 0.2063, 'learning_rate': 4.439375008582369e-06, 'epoch': 1.39} {'loss': 0.264, 'learning_rate': 4.439095767092156e-06, 'epoch': 1.39} {'loss': 0.2523, 'learning_rate': 4.4388165318791445e-06, 'epoch': 1.39} {'loss': 0.4134, 'learning_rate': 4.438537302943653e-06, 'epoch': 1.39} {'loss': 0.262, 'learning_rate': 4.438258080285993e-06, 'epoch': 1.39} {'loss': 0.4485, 'learning_rate': 4.437978863906484e-06, 'epoch': 1.39} {'loss': 0.3982, 'learning_rate': 4.437699653805442e-06, 'epoch': 1.39} {'loss': 0.2639, 'learning_rate': 4.437420449983174e-06, 'epoch': 1.39} {'loss': 0.2822, 'learning_rate': 4.4371412524400035e-06, 'epoch': 1.39} {'loss': 0.3064, 'learning_rate': 4.436862061176241e-06, 'epoch': 1.39} {'loss': 0.3057, 'learning_rate': 4.436582876192205e-06, 'epoch': 1.4} {'loss': 0.2393, 'learning_rate': 4.4363036974882064e-06, 'epoch': 1.4} {'loss': 0.401, 'learning_rate': 4.436024525064566e-06, 'epoch': 1.4} {'loss': 0.281, 'learning_rate': 4.435745358921592e-06, 'epoch': 1.4} {'loss': 0.3398, 'learning_rate': 4.435466199059609e-06, 'epoch': 1.4} {'loss': 0.3122, 'learning_rate': 4.4351870454789216e-06, 'epoch': 1.4} {'loss': 0.1961, 'learning_rate': 4.434907898179853e-06, 'epoch': 1.4} {'loss': 0.212, 'learning_rate': 4.434628757162712e-06, 'epoch': 1.4} {'loss': 0.2197, 'learning_rate': 4.43434962242782e-06, 'epoch': 1.4} {'loss': 0.275, 'learning_rate': 4.43407049397549e-06, 'epoch': 1.4} {'loss': 0.3484, 'learning_rate': 4.433791371806031e-06, 'epoch': 1.4} {'loss': 0.4801, 'learning_rate': 4.433512255919768e-06, 'epoch': 1.4} {'loss': 0.1832, 'learning_rate': 4.433233146317006e-06, 'epoch': 1.4} {'loss': 0.3303, 'learning_rate': 4.43295404299807e-06, 'epoch': 1.4} {'loss': 0.2772, 'learning_rate': 4.432674945963267e-06, 'epoch': 1.4} {'loss': 0.1878, 'learning_rate': 4.432395855212919e-06, 'epoch': 1.4} {'loss': 0.3975, 'learning_rate': 4.432116770747332e-06, 'epoch': 1.4} {'loss': 0.273, 'learning_rate': 4.4318376925668315e-06, 'epoch': 1.4} {'loss': 0.2209, 'learning_rate': 4.431558620671723e-06, 'epoch': 1.4} {'loss': 0.2849, 'learning_rate': 4.43127955506233e-06, 'epoch': 1.4} {'loss': 0.3364, 'learning_rate': 4.431000495738959e-06, 'epoch': 1.4} {'loss': 0.2106, 'learning_rate': 4.430721442701934e-06, 'epoch': 1.4} {'loss': 0.1367, 'learning_rate': 4.430442395951565e-06, 'epoch': 1.4} {'loss': 0.3141, 'learning_rate': 4.430163355488165e-06, 'epoch': 1.4} {'loss': 0.2946, 'learning_rate': 4.429884321312054e-06, 'epoch': 1.4} {'loss': 0.3367, 'learning_rate': 4.42960529342354e-06, 'epoch': 1.4} {'loss': 0.2557, 'learning_rate': 4.429326271822947e-06, 'epoch': 1.4} {'loss': 0.2749, 'learning_rate': 4.429047256510583e-06, 'epoch': 1.4} {'loss': 0.3608, 'learning_rate': 4.4287682474867665e-06, 'epoch': 1.4} {'loss': 0.3618, 'learning_rate': 4.428489244751808e-06, 'epoch': 1.4} {'loss': 0.2949, 'learning_rate': 4.428210248306031e-06, 'epoch': 1.4} {'loss': 0.5711, 'learning_rate': 4.427931258149739e-06, 'epoch': 1.4} {'loss': 0.4156, 'learning_rate': 4.427652274283258e-06, 'epoch': 1.4} {'loss': 0.4359, 'learning_rate': 4.427373296706895e-06, 'epoch': 1.4} {'loss': 0.3479, 'learning_rate': 4.427094325420971e-06, 'epoch': 1.4} {'loss': 0.2837, 'learning_rate': 4.426815360425797e-06, 'epoch': 1.4} {'loss': 0.4099, 'learning_rate': 4.426536401721686e-06, 'epoch': 1.4} {'loss': 0.2773, 'learning_rate': 4.426257449308958e-06, 'epoch': 1.4} {'loss': 0.3271, 'learning_rate': 4.425978503187923e-06, 'epoch': 1.4} {'loss': 0.256, 'learning_rate': 4.4256995633589015e-06, 'epoch': 1.4} {'loss': 0.2418, 'learning_rate': 4.4254206298222015e-06, 'epoch': 1.4} {'loss': 0.4319, 'learning_rate': 4.425141702578145e-06, 'epoch': 1.4} {'loss': 0.4946, 'learning_rate': 4.424862781627041e-06, 'epoch': 1.4} {'loss': 0.3012, 'learning_rate': 4.424583866969209e-06, 'epoch': 1.4} {'loss': 0.4907, 'learning_rate': 4.424304958604959e-06, 'epoch': 1.4} {'loss': 0.3731, 'learning_rate': 4.424026056534612e-06, 'epoch': 1.4} {'loss': 0.4302, 'learning_rate': 4.4237471607584745e-06, 'epoch': 1.4} {'loss': 0.273, 'learning_rate': 4.42346827127687e-06, 'epoch': 1.4} {'loss': 0.3055, 'learning_rate': 4.42318938809011e-06, 'epoch': 1.4} {'loss': 0.4457, 'learning_rate': 4.422910511198505e-06, 'epoch': 1.4} {'loss': 0.306, 'learning_rate': 4.422631640602376e-06, 'epoch': 1.4} {'loss': 0.2351, 'learning_rate': 4.422352776302033e-06, 'epoch': 1.4} {'loss': 0.3309, 'learning_rate': 4.4220739182977965e-06, 'epoch': 1.4} {'loss': 0.3022, 'learning_rate': 4.421795066589975e-06, 'epoch': 1.4} {'loss': 0.3423, 'learning_rate': 4.421516221178888e-06, 'epoch': 1.4} {'loss': 0.3295, 'learning_rate': 4.421237382064846e-06, 'epoch': 1.4} {'loss': 0.3759, 'learning_rate': 4.420958549248169e-06, 'epoch': 1.4} {'loss': 0.3984, 'learning_rate': 4.4206797227291656e-06, 'epoch': 1.4} {'loss': 0.2313, 'learning_rate': 4.420400902508157e-06, 'epoch': 1.4} {'loss': 0.2784, 'learning_rate': 4.420122088585452e-06, 'epoch': 1.4} {'loss': 0.3167, 'learning_rate': 4.419843280961368e-06, 'epoch': 1.4} {'loss': 0.3409, 'learning_rate': 4.419564479636222e-06, 'epoch': 1.4} {'loss': 0.3002, 'learning_rate': 4.419285684610325e-06, 'epoch': 1.4} {'loss': 0.1701, 'learning_rate': 4.419006895883996e-06, 'epoch': 1.4} {'loss': 0.2427, 'learning_rate': 4.418728113457543e-06, 'epoch': 1.4} {'loss': 0.4504, 'learning_rate': 4.418449337331289e-06, 'epoch': 1.4} {'loss': 0.2845, 'learning_rate': 4.41817056750554e-06, 'epoch': 1.4} {'loss': 0.2718, 'learning_rate': 4.417891803980618e-06, 'epoch': 1.4} {'loss': 0.3598, 'learning_rate': 4.417613046756832e-06, 'epoch': 1.4} {'loss': 0.2879, 'learning_rate': 4.417334295834503e-06, 'epoch': 1.4} {'loss': 0.259, 'learning_rate': 4.4170555512139426e-06, 'epoch': 1.4} {'loss': 0.2265, 'learning_rate': 4.4167768128954595e-06, 'epoch': 1.4} {'loss': 0.3703, 'learning_rate': 4.416498080879379e-06, 'epoch': 1.4} {'loss': 0.3375, 'learning_rate': 4.416219355166005e-06, 'epoch': 1.4} {'loss': 0.3582, 'learning_rate': 4.415940635755662e-06, 'epoch': 1.4} {'loss': 0.3063, 'learning_rate': 4.4156619226486575e-06, 'epoch': 1.4} {'loss': 0.2604, 'learning_rate': 4.415383215845312e-06, 'epoch': 1.4} {'loss': 0.3837, 'learning_rate': 4.415104515345932e-06, 'epoch': 1.4} {'loss': 0.2085, 'learning_rate': 4.414825821150842e-06, 'epoch': 1.4} {'loss': 0.384, 'learning_rate': 4.414547133260347e-06, 'epoch': 1.4} {'loss': 0.2176, 'learning_rate': 4.41426845167477e-06, 'epoch': 1.4} {'loss': 0.1675, 'learning_rate': 4.413989776394418e-06, 'epoch': 1.4} {'loss': 0.3269, 'learning_rate': 4.413711107419614e-06, 'epoch': 1.4} {'loss': 0.4101, 'learning_rate': 4.413432444750667e-06, 'epoch': 1.4} {'loss': 0.3698, 'learning_rate': 4.4131537883878894e-06, 'epoch': 1.4} {'loss': 0.3008, 'learning_rate': 4.4128751383316015e-06, 'epoch': 1.4} {'loss': 0.2332, 'learning_rate': 4.412596494582112e-06, 'epoch': 1.4} {'loss': 0.278, 'learning_rate': 4.412317857139743e-06, 'epoch': 1.4} {'loss': 0.2576, 'learning_rate': 4.412039226004799e-06, 'epoch': 1.4} {'loss': 0.3468, 'learning_rate': 4.411760601177606e-06, 'epoch': 1.4} {'loss': 0.3089, 'learning_rate': 4.411481982658467e-06, 'epoch': 1.4} {'loss': 0.319, 'learning_rate': 4.411203370447707e-06, 'epoch': 1.4} {'loss': 0.3481, 'learning_rate': 4.410924764545632e-06, 'epoch': 1.4} {'loss': 0.2802, 'learning_rate': 4.410646164952563e-06, 'epoch': 1.4} {'loss': 0.239, 'learning_rate': 4.410367571668809e-06, 'epoch': 1.4} {'loss': 0.4284, 'learning_rate': 4.410088984694689e-06, 'epoch': 1.4} {'loss': 0.2306, 'learning_rate': 4.4098104040305175e-06, 'epoch': 1.4} {'loss': 0.3412, 'learning_rate': 4.409531829676602e-06, 'epoch': 1.4} {'loss': 0.2495, 'learning_rate': 4.4092532616332664e-06, 'epoch': 1.4} {'loss': 0.4058, 'learning_rate': 4.408974699900817e-06, 'epoch': 1.4} {'loss': 0.3618, 'learning_rate': 4.408696144479576e-06, 'epoch': 1.4} {'loss': 0.2385, 'learning_rate': 4.40841759536985e-06, 'epoch': 1.4} {'loss': 0.2358, 'learning_rate': 4.408139052571961e-06, 'epoch': 1.4} {'loss': 0.3309, 'learning_rate': 4.4078605160862145e-06, 'epoch': 1.4} {'loss': 0.2782, 'learning_rate': 4.407581985912936e-06, 'epoch': 1.4} {'loss': 0.2912, 'learning_rate': 4.407303462052428e-06, 'epoch': 1.4} {'loss': 0.2408, 'learning_rate': 4.4070249445050165e-06, 'epoch': 1.4} {'loss': 0.4326, 'learning_rate': 4.4067464332710055e-06, 'epoch': 1.4} {'loss': 0.2889, 'learning_rate': 4.406467928350718e-06, 'epoch': 1.4} {'loss': 0.379, 'learning_rate': 4.406189429744465e-06, 'epoch': 1.4} {'loss': 0.2998, 'learning_rate': 4.405910937452557e-06, 'epoch': 1.4} {'loss': 0.2563, 'learning_rate': 4.405632451475315e-06, 'epoch': 1.4} {'loss': 0.4016, 'learning_rate': 4.405353971813046e-06, 'epoch': 1.4} {'loss': 0.2154, 'learning_rate': 4.4050754984660725e-06, 'epoch': 1.4} {'loss': 0.3107, 'learning_rate': 4.404797031434701e-06, 'epoch': 1.4} {'loss': 0.3232, 'learning_rate': 4.404518570719254e-06, 'epoch': 1.4} {'loss': 0.1678, 'learning_rate': 4.4042401163200365e-06, 'epoch': 1.4} {'loss': 0.3923, 'learning_rate': 4.403961668237373e-06, 'epoch': 1.4} {'loss': 0.3112, 'learning_rate': 4.403683226471568e-06, 'epoch': 1.4} {'loss': 0.2882, 'learning_rate': 4.403404791022945e-06, 'epoch': 1.4} {'loss': 0.4158, 'learning_rate': 4.403126361891809e-06, 'epoch': 1.4} {'loss': 0.3906, 'learning_rate': 4.402847939078484e-06, 'epoch': 1.4} {'loss': 0.2091, 'learning_rate': 4.402569522583279e-06, 'epoch': 1.4} {'loss': 0.289, 'learning_rate': 4.402291112406504e-06, 'epoch': 1.4} {'loss': 0.4297, 'learning_rate': 4.402012708548482e-06, 'epoch': 1.4} {'loss': 0.3547, 'learning_rate': 4.40173431100952e-06, 'epoch': 1.4} {'loss': 0.3529, 'learning_rate': 4.401455919789939e-06, 'epoch': 1.4} {'loss': 0.3168, 'learning_rate': 4.401177534890046e-06, 'epoch': 1.4} {'loss': 0.4592, 'learning_rate': 4.400899156310161e-06, 'epoch': 1.4} {'loss': 0.281, 'learning_rate': 4.400620784050594e-06, 'epoch': 1.4} {'loss': 0.2631, 'learning_rate': 4.400342418111665e-06, 'epoch': 1.4} {'loss': 0.3975, 'learning_rate': 4.400064058493681e-06, 'epoch': 1.4} {'loss': 0.289, 'learning_rate': 4.399785705196963e-06, 'epoch': 1.4} {'loss': 0.4361, 'learning_rate': 4.399507358221818e-06, 'epoch': 1.4} {'loss': 0.2687, 'learning_rate': 4.399229017568568e-06, 'epoch': 1.4} {'loss': 0.2823, 'learning_rate': 4.398950683237524e-06, 'epoch': 1.4} {'loss': 0.359, 'learning_rate': 4.398672355228996e-06, 'epoch': 1.4} {'loss': 0.3085, 'learning_rate': 4.398394033543305e-06, 'epoch': 1.4} {'loss': 0.1778, 'learning_rate': 4.3981157181807584e-06, 'epoch': 1.4} {'loss': 0.3187, 'learning_rate': 4.397837409141677e-06, 'epoch': 1.4} {'loss': 0.3305, 'learning_rate': 4.397559106426369e-06, 'epoch': 1.4} {'loss': 0.3938, 'learning_rate': 4.397280810035155e-06, 'epoch': 1.4} {'loss': 0.3411, 'learning_rate': 4.3970025199683415e-06, 'epoch': 1.4} {'loss': 0.2956, 'learning_rate': 4.396724236226251e-06, 'epoch': 1.4} {'loss': 0.3237, 'learning_rate': 4.396445958809189e-06, 'epoch': 1.4} {'loss': 0.414, 'learning_rate': 4.396167687717479e-06, 'epoch': 1.4} {'loss': 0.4353, 'learning_rate': 4.395889422951425e-06, 'epoch': 1.4} {'loss': 0.3235, 'learning_rate': 4.39561116451135e-06, 'epoch': 1.4} {'loss': 0.2207, 'learning_rate': 4.395332912397564e-06, 'epoch': 1.4} {'loss': 0.2131, 'learning_rate': 4.395054666610378e-06, 'epoch': 1.4} {'loss': 0.3278, 'learning_rate': 4.394776427150114e-06, 'epoch': 1.4} {'loss': 0.2244, 'learning_rate': 4.394498194017076e-06, 'epoch': 1.4} {'loss': 0.2913, 'learning_rate': 4.394219967211589e-06, 'epoch': 1.4} {'loss': 0.2486, 'learning_rate': 4.3939417467339574e-06, 'epoch': 1.4} {'loss': 0.4265, 'learning_rate': 4.393663532584502e-06, 'epoch': 1.4} {'loss': 0.346, 'learning_rate': 4.393385324763533e-06, 'epoch': 1.4} {'loss': 0.282, 'learning_rate': 4.393107123271368e-06, 'epoch': 1.4} {'loss': 0.2217, 'learning_rate': 4.392828928108316e-06, 'epoch': 1.4} {'loss': 0.3801, 'learning_rate': 4.392550739274697e-06, 'epoch': 1.4} {'loss': 0.4208, 'learning_rate': 4.392272556770818e-06, 'epoch': 1.4} {'loss': 0.4049, 'learning_rate': 4.3919943805969964e-06, 'epoch': 1.4} {'loss': 0.2828, 'learning_rate': 4.391716210753552e-06, 'epoch': 1.4} {'loss': 0.2221, 'learning_rate': 4.391438047240789e-06, 'epoch': 1.4} {'loss': 0.3805, 'learning_rate': 4.39115989005903e-06, 'epoch': 1.4} {'loss': 0.3961, 'learning_rate': 4.3908817392085815e-06, 'epoch': 1.4} {'loss': 0.2665, 'learning_rate': 4.390603594689763e-06, 'epoch': 1.4} {'loss': 0.4558, 'learning_rate': 4.3903254565028845e-06, 'epoch': 1.4} {'loss': 0.382, 'learning_rate': 4.3900473246482644e-06, 'epoch': 1.4} {'loss': 0.2995, 'learning_rate': 4.3897691991262135e-06, 'epoch': 1.4} {'loss': 0.4013, 'learning_rate': 4.389491079937044e-06, 'epoch': 1.4} {'loss': 0.2798, 'learning_rate': 4.389212967081076e-06, 'epoch': 1.4} {'loss': 0.2392, 'learning_rate': 4.388934860558614e-06, 'epoch': 1.4} {'loss': 0.2965, 'learning_rate': 4.388656760369984e-06, 'epoch': 1.4} {'loss': 0.4385, 'learning_rate': 4.388378666515488e-06, 'epoch': 1.4} {'loss': 0.4048, 'learning_rate': 4.388100578995449e-06, 'epoch': 1.4} {'loss': 0.4367, 'learning_rate': 4.387822497810175e-06, 'epoch': 1.4} {'loss': 0.3789, 'learning_rate': 4.387544422959984e-06, 'epoch': 1.4} {'loss': 0.3584, 'learning_rate': 4.387266354445185e-06, 'epoch': 1.4} {'loss': 0.2821, 'learning_rate': 4.3869882922661e-06, 'epoch': 1.4} {'loss': 0.3086, 'learning_rate': 4.386710236423033e-06, 'epoch': 1.4} {'loss': 0.2123, 'learning_rate': 4.386432186916306e-06, 'epoch': 1.4} {'loss': 0.4169, 'learning_rate': 4.386154143746231e-06, 'epoch': 1.4} {'loss': 0.4288, 'learning_rate': 4.385876106913116e-06, 'epoch': 1.4} {'loss': 0.3374, 'learning_rate': 4.3855980764172825e-06, 'epoch': 1.4} {'loss': 0.2228, 'learning_rate': 4.3853200522590376e-06, 'epoch': 1.4} {'loss': 0.3213, 'learning_rate': 4.385042034438703e-06, 'epoch': 1.4} {'loss': 0.4244, 'learning_rate': 4.384764022956585e-06, 'epoch': 1.4} {'loss': 0.3586, 'learning_rate': 4.384486017813003e-06, 'epoch': 1.4} {'loss': 0.3148, 'learning_rate': 4.384208019008264e-06, 'epoch': 1.4} {'loss': 0.2865, 'learning_rate': 4.383930026542692e-06, 'epoch': 1.4} {'loss': 0.3961, 'learning_rate': 4.383652040416591e-06, 'epoch': 1.4} {'loss': 0.3411, 'learning_rate': 4.383374060630282e-06, 'epoch': 1.4} {'loss': 0.2941, 'learning_rate': 4.3830960871840724e-06, 'epoch': 1.4} {'loss': 0.3306, 'learning_rate': 4.382818120078283e-06, 'epoch': 1.4} {'loss': 0.3442, 'learning_rate': 4.382540159313222e-06, 'epoch': 1.4} {'loss': 0.2488, 'learning_rate': 4.3822622048892026e-06, 'epoch': 1.4} {'loss': 0.2589, 'learning_rate': 4.381984256806545e-06, 'epoch': 1.4} {'loss': 0.318, 'learning_rate': 4.3817063150655545e-06, 'epoch': 1.4} {'loss': 0.2383, 'learning_rate': 4.381428379666554e-06, 'epoch': 1.4} {'loss': 0.3352, 'learning_rate': 4.381150450609848e-06, 'epoch': 1.4} {'loss': 0.2606, 'learning_rate': 4.3808725278957575e-06, 'epoch': 1.4} {'loss': 0.3269, 'learning_rate': 4.380594611524591e-06, 'epoch': 1.4} {'loss': 0.3242, 'learning_rate': 4.380316701496668e-06, 'epoch': 1.4} {'loss': 0.2087, 'learning_rate': 4.380038797812295e-06, 'epoch': 1.4} {'loss': 0.2662, 'learning_rate': 4.379760900471792e-06, 'epoch': 1.4} {'loss': 0.3545, 'learning_rate': 4.379483009475468e-06, 'epoch': 1.4} {'loss': 0.3665, 'learning_rate': 4.379205124823642e-06, 'epoch': 1.4} {'loss': 0.512, 'learning_rate': 4.378927246516625e-06, 'epoch': 1.4} {'loss': 0.2683, 'learning_rate': 4.378649374554727e-06, 'epoch': 1.4} {'loss': 0.2408, 'learning_rate': 4.3783715089382676e-06, 'epoch': 1.4} {'loss': 0.3009, 'learning_rate': 4.378093649667554e-06, 'epoch': 1.4} {'loss': 0.2404, 'learning_rate': 4.377815796742908e-06, 'epoch': 1.4} {'loss': 0.2305, 'learning_rate': 4.377537950164634e-06, 'epoch': 1.4} {'loss': 0.2953, 'learning_rate': 4.3772601099330555e-06, 'epoch': 1.4} {'loss': 0.342, 'learning_rate': 4.376982276048477e-06, 'epoch': 1.4} {'loss': 0.2536, 'learning_rate': 4.37670444851122e-06, 'epoch': 1.4} {'loss': 0.3024, 'learning_rate': 4.376426627321591e-06, 'epoch': 1.4} {'loss': 0.2771, 'learning_rate': 4.37614881247991e-06, 'epoch': 1.4} {'loss': 0.3314, 'learning_rate': 4.375871003986484e-06, 'epoch': 1.4} {'loss': 0.3181, 'learning_rate': 4.375593201841633e-06, 'epoch': 1.4} {'loss': 0.3369, 'learning_rate': 4.375315406045669e-06, 'epoch': 1.4} {'loss': 0.4489, 'learning_rate': 4.375037616598902e-06, 'epoch': 1.4} {'loss': 0.4246, 'learning_rate': 4.37475983350165e-06, 'epoch': 1.4} {'loss': 0.2666, 'learning_rate': 4.3744820567542205e-06, 'epoch': 1.4} {'loss': 0.3363, 'learning_rate': 4.374204286356935e-06, 'epoch': 1.4} {'loss': 0.2969, 'learning_rate': 4.373926522310098e-06, 'epoch': 1.4} {'loss': 0.2326, 'learning_rate': 4.373648764614034e-06, 'epoch': 1.4} {'loss': 0.2857, 'learning_rate': 4.373371013269046e-06, 'epoch': 1.4} {'loss': 0.299, 'learning_rate': 4.373093268275455e-06, 'epoch': 1.4} {'loss': 0.4473, 'learning_rate': 4.372815529633569e-06, 'epoch': 1.4} {'loss': 0.2952, 'learning_rate': 4.372537797343708e-06, 'epoch': 1.4} {'loss': 0.2545, 'learning_rate': 4.372260071406178e-06, 'epoch': 1.4} {'loss': 0.2632, 'learning_rate': 4.3719823518213e-06, 'epoch': 1.4} {'loss': 0.3396, 'learning_rate': 4.371704638589379e-06, 'epoch': 1.4} {'loss': 0.2027, 'learning_rate': 4.371426931710738e-06, 'epoch': 1.4} {'loss': 0.3494, 'learning_rate': 4.371149231185685e-06, 'epoch': 1.4} {'loss': 0.1801, 'learning_rate': 4.370871537014531e-06, 'epoch': 1.4} {'loss': 0.304, 'learning_rate': 4.370593849197596e-06, 'epoch': 1.4} {'loss': 0.3207, 'learning_rate': 4.370316167735187e-06, 'epoch': 1.4} {'loss': 0.2652, 'learning_rate': 4.3700384926276226e-06, 'epoch': 1.4} {'loss': 0.303, 'learning_rate': 4.369760823875212e-06, 'epoch': 1.4} {'loss': 0.2785, 'learning_rate': 4.369483161478274e-06, 'epoch': 1.4} {'loss': 0.3472, 'learning_rate': 4.369205505437115e-06, 'epoch': 1.4} {'loss': 0.2386, 'learning_rate': 4.3689278557520566e-06, 'epoch': 1.4} {'loss': 0.4422, 'learning_rate': 4.368650212423403e-06, 'epoch': 1.4} {'loss': 0.393, 'learning_rate': 4.3683725754514776e-06, 'epoch': 1.4} {'loss': 0.2406, 'learning_rate': 4.368094944836584e-06, 'epoch': 1.4} {'loss': 0.3022, 'learning_rate': 4.3678173205790445e-06, 'epoch': 1.4} {'loss': 0.3832, 'learning_rate': 4.367539702679167e-06, 'epoch': 1.4} {'loss': 0.3677, 'learning_rate': 4.367262091137263e-06, 'epoch': 1.4} {'loss': 0.3496, 'learning_rate': 4.3669844859536534e-06, 'epoch': 1.4} {'loss': 0.2027, 'learning_rate': 4.3667068871286424e-06, 'epoch': 1.4} {'loss': 0.3045, 'learning_rate': 4.366429294662553e-06, 'epoch': 1.4} {'loss': 0.2342, 'learning_rate': 4.3661517085556896e-06, 'epoch': 1.4} {'loss': 0.3783, 'learning_rate': 4.365874128808373e-06, 'epoch': 1.4} {'loss': 0.3289, 'learning_rate': 4.365596555420909e-06, 'epoch': 1.4} {'loss': 0.3255, 'learning_rate': 4.365318988393619e-06, 'epoch': 1.4} {'loss': 0.363, 'learning_rate': 4.3650414277268095e-06, 'epoch': 1.4} {'loss': 0.3461, 'learning_rate': 4.364763873420796e-06, 'epoch': 1.4} {'loss': 0.2427, 'learning_rate': 4.364486325475896e-06, 'epoch': 1.4} {'loss': 0.4476, 'learning_rate': 4.364208783892415e-06, 'epoch': 1.4} {'loss': 0.1352, 'learning_rate': 4.363931248670675e-06, 'epoch': 1.4} {'loss': 0.3505, 'learning_rate': 4.363653719810982e-06, 'epoch': 1.4} {'loss': 0.4035, 'learning_rate': 4.363376197313656e-06, 'epoch': 1.4} {'loss': 0.2875, 'learning_rate': 4.363098681179001e-06, 'epoch': 1.4} {'loss': 0.3579, 'learning_rate': 4.36282117140734e-06, 'epoch': 1.4} {'loss': 0.3098, 'learning_rate': 4.362543667998978e-06, 'epoch': 1.4} {'loss': 0.3839, 'learning_rate': 4.362266170954237e-06, 'epoch': 1.4} {'loss': 0.4381, 'learning_rate': 4.361988680273424e-06, 'epoch': 1.4} {'loss': 0.3662, 'learning_rate': 4.361711195956852e-06, 'epoch': 1.4} {'loss': 0.378, 'learning_rate': 4.361433718004838e-06, 'epoch': 1.4} {'loss': 0.3676, 'learning_rate': 4.36115624641769e-06, 'epoch': 1.4} {'loss': 0.1971, 'learning_rate': 4.360878781195727e-06, 'epoch': 1.4} {'loss': 0.4192, 'learning_rate': 4.360601322339258e-06, 'epoch': 1.4} {'loss': 0.3412, 'learning_rate': 4.3603238698486e-06, 'epoch': 1.4} {'loss': 0.3544, 'learning_rate': 4.36004642372406e-06, 'epoch': 1.4} {'loss': 0.3917, 'learning_rate': 4.359768983965959e-06, 'epoch': 1.4} {'loss': 0.2164, 'learning_rate': 4.359491550574603e-06, 'epoch': 1.4} {'loss': 0.4361, 'learning_rate': 4.359214123550312e-06, 'epoch': 1.4} {'loss': 0.3285, 'learning_rate': 4.358936702893391e-06, 'epoch': 1.4} {'loss': 0.2454, 'learning_rate': 4.358659288604162e-06, 'epoch': 1.4} {'loss': 0.2259, 'learning_rate': 4.358381880682935e-06, 'epoch': 1.4} {'loss': 0.4729, 'learning_rate': 4.358104479130017e-06, 'epoch': 1.4} {'loss': 0.2985, 'learning_rate': 4.35782708394573e-06, 'epoch': 1.4} {'loss': 0.307, 'learning_rate': 4.35754969513038e-06, 'epoch': 1.4} {'loss': 0.2906, 'learning_rate': 4.3572723126842876e-06, 'epoch': 1.4} {'loss': 0.4206, 'learning_rate': 4.3569949366077565e-06, 'epoch': 1.4} {'loss': 0.2179, 'learning_rate': 4.356717566901111e-06, 'epoch': 1.4} {'loss': 0.3106, 'learning_rate': 4.356440203564652e-06, 'epoch': 1.4} {'loss': 0.2878, 'learning_rate': 4.356162846598705e-06, 'epoch': 1.4} {'loss': 0.4552, 'learning_rate': 4.355885496003571e-06, 'epoch': 1.4} {'loss': 0.319, 'learning_rate': 4.355608151779574e-06, 'epoch': 1.4} {'loss': 0.3657, 'learning_rate': 4.355330813927019e-06, 'epoch': 1.4} {'loss': 0.5115, 'learning_rate': 4.355053482446224e-06, 'epoch': 1.4} {'loss': 0.2968, 'learning_rate': 4.354776157337501e-06, 'epoch': 1.4} {'loss': 0.3069, 'learning_rate': 4.35449883860116e-06, 'epoch': 1.4} {'loss': 0.4279, 'learning_rate': 4.3542215262375175e-06, 'epoch': 1.4} {'loss': 0.2124, 'learning_rate': 4.353944220246883e-06, 'epoch': 1.4} {'loss': 0.2035, 'learning_rate': 4.353666920629576e-06, 'epoch': 1.4} {'loss': 0.4863, 'learning_rate': 4.353389627385901e-06, 'epoch': 1.4} {'loss': 0.3433, 'learning_rate': 4.353112340516179e-06, 'epoch': 1.4} {'loss': 0.2537, 'learning_rate': 4.352835060020715e-06, 'epoch': 1.4} {'loss': 0.4234, 'learning_rate': 4.352557785899831e-06, 'epoch': 1.4} {'loss': 0.3626, 'learning_rate': 4.352280518153832e-06, 'epoch': 1.4} {'loss': 0.3514, 'learning_rate': 4.352003256783037e-06, 'epoch': 1.4} {'loss': 0.3244, 'learning_rate': 4.3517260017877525e-06, 'epoch': 1.4} {'loss': 0.3409, 'learning_rate': 4.3514487531683e-06, 'epoch': 1.4} {'loss': 0.4373, 'learning_rate': 4.351171510924987e-06, 'epoch': 1.4} {'loss': 0.2715, 'learning_rate': 4.350894275058124e-06, 'epoch': 1.4} {'loss': 0.3136, 'learning_rate': 4.35061704556803e-06, 'epoch': 1.4} {'loss': 0.2286, 'learning_rate': 4.350339822455012e-06, 'epoch': 1.4} {'loss': 0.2312, 'learning_rate': 4.350062605719389e-06, 'epoch': 1.4} {'loss': 0.3206, 'learning_rate': 4.349785395361469e-06, 'epoch': 1.4} {'loss': 0.2457, 'learning_rate': 4.34950819138157e-06, 'epoch': 1.4} {'loss': 0.2251, 'learning_rate': 4.349230993779997e-06, 'epoch': 1.4} {'loss': 0.3177, 'learning_rate': 4.348953802557071e-06, 'epoch': 1.4} {'loss': 0.3984, 'learning_rate': 4.348676617713099e-06, 'epoch': 1.4} {'loss': 0.3046, 'learning_rate': 4.3483994392484e-06, 'epoch': 1.4} {'loss': 0.4273, 'learning_rate': 4.3481222671632795e-06, 'epoch': 1.4} {'loss': 0.4388, 'learning_rate': 4.347845101458058e-06, 'epoch': 1.4} {'loss': 0.3495, 'learning_rate': 4.347567942133044e-06, 'epoch': 1.4} {'loss': 0.3455, 'learning_rate': 4.347290789188549e-06, 'epoch': 1.4} {'loss': 0.2967, 'learning_rate': 4.347013642624889e-06, 'epoch': 1.4} {'loss': 0.4705, 'learning_rate': 4.346736502442374e-06, 'epoch': 1.4} {'loss': 0.2329, 'learning_rate': 4.346459368641321e-06, 'epoch': 1.4} {'loss': 0.3224, 'learning_rate': 4.346182241222036e-06, 'epoch': 1.4} {'loss': 0.3578, 'learning_rate': 4.345905120184841e-06, 'epoch': 1.4} {'loss': 0.3355, 'learning_rate': 4.34562800553004e-06, 'epoch': 1.4} {'loss': 0.3813, 'learning_rate': 4.345350897257954e-06, 'epoch': 1.4} {'loss': 0.3001, 'learning_rate': 4.345073795368887e-06, 'epoch': 1.4} {'loss': 0.1953, 'learning_rate': 4.34479669986316e-06, 'epoch': 1.4} {'loss': 0.3804, 'learning_rate': 4.3445196107410796e-06, 'epoch': 1.4} {'loss': 0.3095, 'learning_rate': 4.344242528002963e-06, 'epoch': 1.4} {'loss': 0.4293, 'learning_rate': 4.343965451649122e-06, 'epoch': 1.4} {'loss': 0.4143, 'learning_rate': 4.343688381679865e-06, 'epoch': 1.4} {'loss': 0.2566, 'learning_rate': 4.343411318095512e-06, 'epoch': 1.4} {'loss': 0.3044, 'learning_rate': 4.343134260896368e-06, 'epoch': 1.4} {'loss': 0.2389, 'learning_rate': 4.342857210082753e-06, 'epoch': 1.4} {'loss': 0.4005, 'learning_rate': 4.342580165654974e-06, 'epoch': 1.4} {'loss': 0.3252, 'learning_rate': 4.342303127613348e-06, 'epoch': 1.4} {'loss': 0.1749, 'learning_rate': 4.3420260959581836e-06, 'epoch': 1.4} {'loss': 0.2364, 'learning_rate': 4.3417490706898005e-06, 'epoch': 1.4} {'loss': 0.1497, 'learning_rate': 4.341472051808501e-06, 'epoch': 1.4} {'loss': 0.3043, 'learning_rate': 4.341195039314607e-06, 'epoch': 1.4} {'loss': 0.3604, 'learning_rate': 4.340918033208426e-06, 'epoch': 1.4} {'loss': 0.3042, 'learning_rate': 4.340641033490275e-06, 'epoch': 1.4} {'loss': 0.2728, 'learning_rate': 4.3403640401604644e-06, 'epoch': 1.4} {'loss': 0.388, 'learning_rate': 4.340087053219303e-06, 'epoch': 1.4} {'loss': 0.2385, 'learning_rate': 4.33981007266711e-06, 'epoch': 1.4} {'loss': 0.401, 'learning_rate': 4.339533098504191e-06, 'epoch': 1.4} {'loss': 0.372, 'learning_rate': 4.3392561307308675e-06, 'epoch': 1.4} {'loss': 0.2682, 'learning_rate': 4.338979169347444e-06, 'epoch': 1.4} {'loss': 0.2952, 'learning_rate': 4.3387022143542405e-06, 'epoch': 1.4} {'loss': 0.2641, 'learning_rate': 4.33842526575156e-06, 'epoch': 1.4} {'loss': 0.3331, 'learning_rate': 4.338148323539726e-06, 'epoch': 1.4} {'loss': 0.4951, 'learning_rate': 4.337871387719041e-06, 'epoch': 1.4} {'loss': 0.282, 'learning_rate': 4.337594458289827e-06, 'epoch': 1.4} {'loss': 0.3724, 'learning_rate': 4.3373175352523884e-06, 'epoch': 1.4} {'loss': 0.2631, 'learning_rate': 4.337040618607042e-06, 'epoch': 1.4} {'loss': 0.2879, 'learning_rate': 4.336763708354104e-06, 'epoch': 1.4} {'loss': 0.3617, 'learning_rate': 4.336486804493878e-06, 'epoch': 1.4} {'loss': 0.3226, 'learning_rate': 4.336209907026685e-06, 'epoch': 1.4} {'loss': 0.3854, 'learning_rate': 4.335933015952831e-06, 'epoch': 1.4} {'loss': 0.1956, 'learning_rate': 4.335656131272635e-06, 'epoch': 1.4} {'loss': 0.3726, 'learning_rate': 4.335379252986403e-06, 'epoch': 1.4} {'loss': 0.3298, 'learning_rate': 4.335102381094453e-06, 'epoch': 1.4} {'loss': 0.1702, 'learning_rate': 4.334825515597092e-06, 'epoch': 1.4} {'loss': 0.226, 'learning_rate': 4.334548656494639e-06, 'epoch': 1.4} {'loss': 0.2948, 'learning_rate': 4.334271803787404e-06, 'epoch': 1.4} {'loss': 0.278, 'learning_rate': 4.333994957475696e-06, 'epoch': 1.4} {'loss': 0.322, 'learning_rate': 4.333718117559832e-06, 'epoch': 1.4} {'loss': 0.2658, 'learning_rate': 4.33344128404012e-06, 'epoch': 1.4} {'loss': 0.4434, 'learning_rate': 4.3331644569168785e-06, 'epoch': 1.4} {'loss': 0.2736, 'learning_rate': 4.332887636190414e-06, 'epoch': 1.4} {'loss': 0.2521, 'learning_rate': 4.332610821861044e-06, 'epoch': 1.4} {'loss': 0.1633, 'learning_rate': 4.332334013929076e-06, 'epoch': 1.4} {'loss': 0.1647, 'learning_rate': 4.332057212394829e-06, 'epoch': 1.4} {'loss': 0.3158, 'learning_rate': 4.331780417258608e-06, 'epoch': 1.4} {'loss': 0.418, 'learning_rate': 4.331503628520731e-06, 'epoch': 1.4} {'loss': 0.2773, 'learning_rate': 4.331226846181507e-06, 'epoch': 1.4} {'loss': 0.3997, 'learning_rate': 4.330950070241252e-06, 'epoch': 1.4} {'loss': 0.4646, 'learning_rate': 4.330673300700277e-06, 'epoch': 1.4} {'loss': 0.4661, 'learning_rate': 4.33039653755889e-06, 'epoch': 1.4} {'loss': 0.5314, 'learning_rate': 4.330119780817411e-06, 'epoch': 1.4} {'loss': 0.2892, 'learning_rate': 4.329843030476144e-06, 'epoch': 1.4} {'loss': 0.384, 'learning_rate': 4.329566286535412e-06, 'epoch': 1.4} {'loss': 0.2996, 'learning_rate': 4.329289548995515e-06, 'epoch': 1.4} {'loss': 0.4364, 'learning_rate': 4.329012817856777e-06, 'epoch': 1.4} {'loss': 0.2837, 'learning_rate': 4.328736093119501e-06, 'epoch': 1.4} {'loss': 0.2912, 'learning_rate': 4.328459374784007e-06, 'epoch': 1.4} {'loss': 0.2499, 'learning_rate': 4.328182662850601e-06, 'epoch': 1.4} {'loss': 0.2136, 'learning_rate': 4.327905957319602e-06, 'epoch': 1.4} {'loss': 0.3299, 'learning_rate': 4.327629258191314e-06, 'epoch': 1.4} {'loss': 0.3131, 'learning_rate': 4.327352565466058e-06, 'epoch': 1.4} {'loss': 0.4457, 'learning_rate': 4.327075879144141e-06, 'epoch': 1.4} {'loss': 0.2269, 'learning_rate': 4.326799199225874e-06, 'epoch': 1.4} {'loss': 0.2857, 'learning_rate': 4.3265225257115766e-06, 'epoch': 1.4} {'loss': 0.3281, 'learning_rate': 4.326245858601551e-06, 'epoch': 1.4} {'loss': 0.388, 'learning_rate': 4.325969197896119e-06, 'epoch': 1.4} {'loss': 0.2292, 'learning_rate': 4.325692543595587e-06, 'epoch': 1.4} {'loss': 0.4419, 'learning_rate': 4.32541589570027e-06, 'epoch': 1.4} {'loss': 0.2573, 'learning_rate': 4.325139254210477e-06, 'epoch': 1.4} {'loss': 0.3739, 'learning_rate': 4.324862619126526e-06, 'epoch': 1.4} {'loss': 0.3232, 'learning_rate': 4.324585990448723e-06, 'epoch': 1.4} {'loss': 0.5481, 'learning_rate': 4.324309368177386e-06, 'epoch': 1.4} {'loss': 0.3806, 'learning_rate': 4.324032752312821e-06, 'epoch': 1.4} {'loss': 0.3429, 'learning_rate': 4.323756142855348e-06, 'epoch': 1.4} {'loss': 0.4132, 'learning_rate': 4.323479539805274e-06, 'epoch': 1.4} {'loss': 0.3059, 'learning_rate': 4.32320294316291e-06, 'epoch': 1.4} {'loss': 0.303, 'learning_rate': 4.322926352928572e-06, 'epoch': 1.4} {'loss': 0.3777, 'learning_rate': 4.322649769102568e-06, 'epoch': 1.4} {'loss': 0.1398, 'learning_rate': 4.322373191685216e-06, 'epoch': 1.4} {'loss': 0.3149, 'learning_rate': 4.322096620676822e-06, 'epoch': 1.4} {'loss': 0.3078, 'learning_rate': 4.321820056077705e-06, 'epoch': 1.4} {'loss': 0.1828, 'learning_rate': 4.32154349788817e-06, 'epoch': 1.4} {'loss': 0.2932, 'learning_rate': 4.321266946108535e-06, 'epoch': 1.4} {'loss': 0.4104, 'learning_rate': 4.320990400739107e-06, 'epoch': 1.4} {'loss': 0.3228, 'learning_rate': 4.320713861780204e-06, 'epoch': 1.4} {'loss': 0.3305, 'learning_rate': 4.320437329232132e-06, 'epoch': 1.4} {'loss': 0.3563, 'learning_rate': 4.320160803095209e-06, 'epoch': 1.4} {'loss': 0.2086, 'learning_rate': 4.319884283369745e-06, 'epoch': 1.4} {'loss': 0.3109, 'learning_rate': 4.319607770056048e-06, 'epoch': 1.4} {'loss': 0.3337, 'learning_rate': 4.319331263154437e-06, 'epoch': 1.4} {'loss': 0.3108, 'learning_rate': 4.319054762665218e-06, 'epoch': 1.4} {'loss': 0.2475, 'learning_rate': 4.318778268588708e-06, 'epoch': 1.4} {'loss': 0.4325, 'learning_rate': 4.318501780925215e-06, 'epoch': 1.4} {'loss': 0.4569, 'learning_rate': 4.318225299675055e-06, 'epoch': 1.4} {'loss': 0.3109, 'learning_rate': 4.317948824838536e-06, 'epoch': 1.4} {'loss': 0.458, 'learning_rate': 4.317672356415975e-06, 'epoch': 1.4} {'loss': 0.2433, 'learning_rate': 4.317395894407679e-06, 'epoch': 1.4} {'loss': 0.2457, 'learning_rate': 4.317119438813965e-06, 'epoch': 1.4} {'loss': 0.2653, 'learning_rate': 4.316842989635139e-06, 'epoch': 1.4} {'loss': 0.2006, 'learning_rate': 4.31656654687152e-06, 'epoch': 1.4} {'loss': 0.5153, 'learning_rate': 4.316290110523417e-06, 'epoch': 1.4} {'loss': 0.265, 'learning_rate': 4.316013680591138e-06, 'epoch': 1.4} {'loss': 0.2165, 'learning_rate': 4.315737257075002e-06, 'epoch': 1.4} {'loss': 0.3396, 'learning_rate': 4.315460839975315e-06, 'epoch': 1.4} {'loss': 0.4074, 'learning_rate': 4.315184429292394e-06, 'epoch': 1.4} {'loss': 0.3866, 'learning_rate': 4.314908025026547e-06, 'epoch': 1.4} {'loss': 0.3243, 'learning_rate': 4.314631627178089e-06, 'epoch': 1.4} {'loss': 0.3177, 'learning_rate': 4.314355235747329e-06, 'epoch': 1.4} {'loss': 0.3842, 'learning_rate': 4.3140788507345835e-06, 'epoch': 1.4} {'loss': 0.295, 'learning_rate': 4.313802472140158e-06, 'epoch': 1.4} {'loss': 0.3262, 'learning_rate': 4.313526099964373e-06, 'epoch': 1.4} {'loss': 0.2455, 'learning_rate': 4.3132497342075305e-06, 'epoch': 1.4} {'loss': 0.3061, 'learning_rate': 4.312973374869953e-06, 'epoch': 1.4} {'loss': 0.3287, 'learning_rate': 4.312697021951946e-06, 'epoch': 1.4} {'loss': 0.2523, 'learning_rate': 4.312420675453819e-06, 'epoch': 1.4} {'loss': 0.4224, 'learning_rate': 4.312144335375892e-06, 'epoch': 1.4} {'loss': 0.2878, 'learning_rate': 4.311868001718467e-06, 'epoch': 1.4} {'loss': 0.2598, 'learning_rate': 4.3115916744818665e-06, 'epoch': 1.4} {'loss': 0.3572, 'learning_rate': 4.311315353666393e-06, 'epoch': 1.4} {'loss': 0.3626, 'learning_rate': 4.3110390392723666e-06, 'epoch': 1.4} {'loss': 0.2753, 'learning_rate': 4.310762731300092e-06, 'epoch': 1.4} {'loss': 0.3771, 'learning_rate': 4.310486429749888e-06, 'epoch': 1.4} {'loss': 0.3286, 'learning_rate': 4.31021013462206e-06, 'epoch': 1.4} {'loss': 0.3228, 'learning_rate': 4.309933845916925e-06, 'epoch': 1.4} {'loss': 0.5027, 'learning_rate': 4.309657563634789e-06, 'epoch': 1.4} {'loss': 0.3966, 'learning_rate': 4.309381287775969e-06, 'epoch': 1.4} {'loss': 0.3485, 'learning_rate': 4.309105018340778e-06, 'epoch': 1.4} {'loss': 0.3648, 'learning_rate': 4.308828755329522e-06, 'epoch': 1.4} {'loss': 0.2838, 'learning_rate': 4.308552498742518e-06, 'epoch': 1.4} {'loss': 0.2855, 'learning_rate': 4.3082762485800746e-06, 'epoch': 1.4} {'loss': 0.2415, 'learning_rate': 4.308000004842508e-06, 'epoch': 1.4} {'loss': 0.2477, 'learning_rate': 4.307723767530123e-06, 'epoch': 1.4} {'loss': 0.3134, 'learning_rate': 4.307447536643239e-06, 'epoch': 1.4} {'loss': 0.2945, 'learning_rate': 4.307171312182165e-06, 'epoch': 1.4} {'loss': 0.2758, 'learning_rate': 4.306895094147208e-06, 'epoch': 1.4} {'loss': 0.3334, 'learning_rate': 4.306618882538687e-06, 'epoch': 1.4} {'loss': 0.2737, 'learning_rate': 4.306342677356907e-06, 'epoch': 1.4} {'loss': 0.2167, 'learning_rate': 4.306066478602188e-06, 'epoch': 1.4} {'loss': 0.3404, 'learning_rate': 4.3057902862748334e-06, 'epoch': 1.4} {'loss': 0.186, 'learning_rate': 4.305514100375162e-06, 'epoch': 1.4} {'loss': 0.336, 'learning_rate': 4.305237920903479e-06, 'epoch': 1.4} {'loss': 0.3049, 'learning_rate': 4.304961747860102e-06, 'epoch': 1.4} {'loss': 0.3691, 'learning_rate': 4.304685581245338e-06, 'epoch': 1.4} {'loss': 0.403, 'learning_rate': 4.304409421059503e-06, 'epoch': 1.4} {'loss': 0.4734, 'learning_rate': 4.3041332673029046e-06, 'epoch': 1.4} {'loss': 0.3004, 'learning_rate': 4.30385711997586e-06, 'epoch': 1.4} {'loss': 0.3589, 'learning_rate': 4.303580979078678e-06, 'epoch': 1.4} {'loss': 0.2757, 'learning_rate': 4.303304844611665e-06, 'epoch': 1.4} {'loss': 0.276, 'learning_rate': 4.303028716575142e-06, 'epoch': 1.4} {'loss': 0.3368, 'learning_rate': 4.302752594969412e-06, 'epoch': 1.4} {'loss': 0.2857, 'learning_rate': 4.3024764797947945e-06, 'epoch': 1.41} {'loss': 0.2047, 'learning_rate': 4.302200371051594e-06, 'epoch': 1.41} {'loss': 0.3622, 'learning_rate': 4.30192426874013e-06, 'epoch': 1.41} {'loss': 0.262, 'learning_rate': 4.301648172860706e-06, 'epoch': 1.41} {'loss': 0.476, 'learning_rate': 4.301372083413642e-06, 'epoch': 1.41} {'loss': 0.3165, 'learning_rate': 4.301096000399241e-06, 'epoch': 1.41} {'loss': 0.3399, 'learning_rate': 4.300819923817823e-06, 'epoch': 1.41} {'loss': 0.1907, 'learning_rate': 4.300543853669691e-06, 'epoch': 1.41} {'loss': 0.2792, 'learning_rate': 4.300267789955164e-06, 'epoch': 1.41} {'loss': 0.3772, 'learning_rate': 4.299991732674553e-06, 'epoch': 1.41} {'loss': 0.2747, 'learning_rate': 4.299715681828164e-06, 'epoch': 1.41} {'loss': 0.2356, 'learning_rate': 4.299439637416314e-06, 'epoch': 1.41} {'loss': 0.2121, 'learning_rate': 4.29916359943931e-06, 'epoch': 1.41} {'loss': 0.2955, 'learning_rate': 4.298887567897469e-06, 'epoch': 1.41} {'loss': 0.2941, 'learning_rate': 4.298611542791097e-06, 'epoch': 1.41} {'loss': 0.1851, 'learning_rate': 4.298335524120511e-06, 'epoch': 1.41} {'loss': 0.1822, 'learning_rate': 4.2980595118860165e-06, 'epoch': 1.41} {'loss': 0.299, 'learning_rate': 4.297783506087934e-06, 'epoch': 1.41} {'loss': 0.2741, 'learning_rate': 4.2975075067265635e-06, 'epoch': 1.41} {'loss': 0.1847, 'learning_rate': 4.297231513802228e-06, 'epoch': 1.41} {'loss': 0.4088, 'learning_rate': 4.29695552731523e-06, 'epoch': 1.41} {'loss': 0.3518, 'learning_rate': 4.296679547265887e-06, 'epoch': 1.41} {'loss': 0.3883, 'learning_rate': 4.296403573654506e-06, 'epoch': 1.41} {'loss': 0.3018, 'learning_rate': 4.296127606481404e-06, 'epoch': 1.41} {'loss': 0.3768, 'learning_rate': 4.295851645746889e-06, 'epoch': 1.41} {'loss': 0.2707, 'learning_rate': 4.2955756914512695e-06, 'epoch': 1.41} {'loss': 0.3107, 'learning_rate': 4.295299743594864e-06, 'epoch': 1.41} {'loss': 0.2749, 'learning_rate': 4.295023802177975e-06, 'epoch': 1.41} {'loss': 0.3261, 'learning_rate': 4.294747867200925e-06, 'epoch': 1.41} {'loss': 0.3149, 'learning_rate': 4.294471938664015e-06, 'epoch': 1.41} {'loss': 0.2483, 'learning_rate': 4.294196016567566e-06, 'epoch': 1.41} {'loss': 0.2633, 'learning_rate': 4.29392010091188e-06, 'epoch': 1.41} {'loss': 0.2304, 'learning_rate': 4.293644191697277e-06, 'epoch': 1.41} {'loss': 0.3034, 'learning_rate': 4.293368288924062e-06, 'epoch': 1.41} {'loss': 0.3689, 'learning_rate': 4.293092392592552e-06, 'epoch': 1.41} {'loss': 0.3362, 'learning_rate': 4.2928165027030515e-06, 'epoch': 1.41} {'loss': 0.1754, 'learning_rate': 4.292540619255879e-06, 'epoch': 1.41} {'loss': 0.4022, 'learning_rate': 4.292264742251344e-06, 'epoch': 1.41} {'loss': 0.2772, 'learning_rate': 4.291988871689751e-06, 'epoch': 1.41} {'loss': 0.4057, 'learning_rate': 4.291713007571423e-06, 'epoch': 1.41} {'loss': 0.3462, 'learning_rate': 4.291437149896662e-06, 'epoch': 1.41} {'loss': 0.4411, 'learning_rate': 4.291161298665786e-06, 'epoch': 1.41} {'loss': 0.4693, 'learning_rate': 4.290885453879099e-06, 'epoch': 1.41} {'loss': 0.3007, 'learning_rate': 4.2906096155369205e-06, 'epoch': 1.41} {'loss': 0.2999, 'learning_rate': 4.290333783639555e-06, 'epoch': 1.41} {'loss': 0.165, 'learning_rate': 4.2900579581873205e-06, 'epoch': 1.41} {'loss': 0.2043, 'learning_rate': 4.28978213918052e-06, 'epoch': 1.41} {'loss': 0.3451, 'learning_rate': 4.289506326619475e-06, 'epoch': 1.41} {'loss': 0.3227, 'learning_rate': 4.289230520504487e-06, 'epoch': 1.41} {'loss': 0.2882, 'learning_rate': 4.288954720835875e-06, 'epoch': 1.41} {'loss': 0.2359, 'learning_rate': 4.288678927613948e-06, 'epoch': 1.41} {'loss': 0.2923, 'learning_rate': 4.288403140839012e-06, 'epoch': 1.41} {'loss': 0.3689, 'learning_rate': 4.2881273605113875e-06, 'epoch': 1.41} {'loss': 0.2485, 'learning_rate': 4.287851586631375e-06, 'epoch': 1.41} {'loss': 0.4099, 'learning_rate': 4.287575819199297e-06, 'epoch': 1.41} {'loss': 0.2897, 'learning_rate': 4.287300058215457e-06, 'epoch': 1.41} {'loss': 0.3765, 'learning_rate': 4.287024303680172e-06, 'epoch': 1.41} {'loss': 0.4541, 'learning_rate': 4.286748555593746e-06, 'epoch': 1.41} {'loss': 0.2381, 'learning_rate': 4.286472813956498e-06, 'epoch': 1.41} {'loss': 0.3211, 'learning_rate': 4.286197078768733e-06, 'epoch': 1.41} {'loss': 0.2617, 'learning_rate': 4.285921350030767e-06, 'epoch': 1.41} {'loss': 0.34, 'learning_rate': 4.285645627742907e-06, 'epoch': 1.41} {'loss': 0.2406, 'learning_rate': 4.285369911905469e-06, 'epoch': 1.41} {'loss': 0.3555, 'learning_rate': 4.2850942025187626e-06, 'epoch': 1.41} {'loss': 0.3185, 'learning_rate': 4.2848184995830944e-06, 'epoch': 1.41} {'loss': 0.2417, 'learning_rate': 4.2845428030987824e-06, 'epoch': 1.41} {'loss': 0.2596, 'learning_rate': 4.2842671130661315e-06, 'epoch': 1.41} {'loss': 0.4448, 'learning_rate': 4.28399142948546e-06, 'epoch': 1.41} {'loss': 0.276, 'learning_rate': 4.283715752357071e-06, 'epoch': 1.41} {'loss': 0.2304, 'learning_rate': 4.283440081681283e-06, 'epoch': 1.41} {'loss': 0.326, 'learning_rate': 4.283164417458402e-06, 'epoch': 1.41} {'loss': 0.3098, 'learning_rate': 4.282888759688745e-06, 'epoch': 1.41} {'loss': 0.3303, 'learning_rate': 4.282613108372614e-06, 'epoch': 1.41} {'loss': 0.358, 'learning_rate': 4.282337463510327e-06, 'epoch': 1.41} {'loss': 0.4685, 'learning_rate': 4.282061825102197e-06, 'epoch': 1.41} {'loss': 0.3381, 'learning_rate': 4.2817861931485285e-06, 'epoch': 1.41} {'loss': 0.2372, 'learning_rate': 4.281510567649638e-06, 'epoch': 1.41} {'loss': 0.2133, 'learning_rate': 4.2812349486058335e-06, 'epoch': 1.41} {'loss': 0.2576, 'learning_rate': 4.2809593360174295e-06, 'epoch': 1.41} {'loss': 0.2853, 'learning_rate': 4.280683729884731e-06, 'epoch': 1.41} {'loss': 0.3465, 'learning_rate': 4.280408130208058e-06, 'epoch': 1.41} {'loss': 0.4581, 'learning_rate': 4.280132536987711e-06, 'epoch': 1.41} {'loss': 0.4552, 'learning_rate': 4.279856950224012e-06, 'epoch': 1.41} {'loss': 0.346, 'learning_rate': 4.2795813699172665e-06, 'epoch': 1.41} {'loss': 0.3649, 'learning_rate': 4.279305796067782e-06, 'epoch': 1.41} {'loss': 0.4114, 'learning_rate': 4.279030228675876e-06, 'epoch': 1.41} {'loss': 0.3825, 'learning_rate': 4.278754667741855e-06, 'epoch': 1.41} {'loss': 0.4536, 'learning_rate': 4.278479113266035e-06, 'epoch': 1.41} {'loss': 0.3243, 'learning_rate': 4.278203565248721e-06, 'epoch': 1.41} {'loss': 0.4516, 'learning_rate': 4.27792802369023e-06, 'epoch': 1.41} {'loss': 0.3901, 'learning_rate': 4.277652488590867e-06, 'epoch': 1.41} {'loss': 0.283, 'learning_rate': 4.2773769599509485e-06, 'epoch': 1.41} {'loss': 0.2605, 'learning_rate': 4.277101437770781e-06, 'epoch': 1.41} {'loss': 0.3754, 'learning_rate': 4.276825922050681e-06, 'epoch': 1.41} {'loss': 0.3349, 'learning_rate': 4.276550412790952e-06, 'epoch': 1.41} {'loss': 0.2474, 'learning_rate': 4.276274909991913e-06, 'epoch': 1.41} {'loss': 0.4682, 'learning_rate': 4.275999413653872e-06, 'epoch': 1.41} {'loss': 0.3388, 'learning_rate': 4.275723923777135e-06, 'epoch': 1.41} {'loss': 0.349, 'learning_rate': 4.275448440362021e-06, 'epoch': 1.41} {'loss': 0.3244, 'learning_rate': 4.275172963408834e-06, 'epoch': 1.41} {'loss': 0.422, 'learning_rate': 4.274897492917891e-06, 'epoch': 1.41} {'loss': 0.3814, 'learning_rate': 4.274622028889497e-06, 'epoch': 1.41} {'loss': 0.2299, 'learning_rate': 4.2743465713239684e-06, 'epoch': 1.41} {'loss': 0.2848, 'learning_rate': 4.2740711202216115e-06, 'epoch': 1.41} {'loss': 0.4452, 'learning_rate': 4.273795675582743e-06, 'epoch': 1.41} {'loss': 0.2993, 'learning_rate': 4.273520237407665e-06, 'epoch': 1.41} {'loss': 0.1953, 'learning_rate': 4.273244805696699e-06, 'epoch': 1.41} {'loss': 0.3347, 'learning_rate': 4.272969380450147e-06, 'epoch': 1.41} {'loss': 0.4557, 'learning_rate': 4.272693961668326e-06, 'epoch': 1.41} {'loss': 0.3245, 'learning_rate': 4.272418549351546e-06, 'epoch': 1.41} {'loss': 0.3717, 'learning_rate': 4.272143143500112e-06, 'epoch': 1.41} {'loss': 0.2419, 'learning_rate': 4.271867744114342e-06, 'epoch': 1.41} {'loss': 0.3353, 'learning_rate': 4.271592351194541e-06, 'epoch': 1.41} {'loss': 0.2368, 'learning_rate': 4.271316964741027e-06, 'epoch': 1.41} {'loss': 0.2254, 'learning_rate': 4.271041584754102e-06, 'epoch': 1.41} {'loss': 0.2358, 'learning_rate': 4.270766211234086e-06, 'epoch': 1.41} {'loss': 0.3779, 'learning_rate': 4.270490844181282e-06, 'epoch': 1.41} {'loss': 0.3193, 'learning_rate': 4.2702154835960085e-06, 'epoch': 1.41} {'loss': 0.3233, 'learning_rate': 4.269940129478568e-06, 'epoch': 1.41} {'loss': 0.3365, 'learning_rate': 4.269664781829279e-06, 'epoch': 1.41} {'loss': 0.3046, 'learning_rate': 4.269389440648445e-06, 'epoch': 1.41} {'loss': 0.2435, 'learning_rate': 4.269114105936384e-06, 'epoch': 1.41} {'loss': 0.3128, 'learning_rate': 4.268838777693404e-06, 'epoch': 1.41} {'loss': 0.3913, 'learning_rate': 4.268563455919811e-06, 'epoch': 1.41} {'loss': 0.3547, 'learning_rate': 4.2682881406159234e-06, 'epoch': 1.41} {'loss': 0.2755, 'learning_rate': 4.268012831782046e-06, 'epoch': 1.41} {'loss': 0.4134, 'learning_rate': 4.267737529418495e-06, 'epoch': 1.41} {'loss': 0.309, 'learning_rate': 4.267462233525575e-06, 'epoch': 1.41} {'loss': 0.2728, 'learning_rate': 4.267186944103604e-06, 'epoch': 1.41} {'loss': 0.3948, 'learning_rate': 4.266911661152884e-06, 'epoch': 1.41} {'loss': 0.2412, 'learning_rate': 4.266636384673736e-06, 'epoch': 1.41} {'loss': 0.2767, 'learning_rate': 4.26636111466646e-06, 'epoch': 1.41} {'loss': 0.32, 'learning_rate': 4.266085851131377e-06, 'epoch': 1.41} {'loss': 0.2554, 'learning_rate': 4.265810594068787e-06, 'epoch': 1.41} {'loss': 0.24, 'learning_rate': 4.265535343479012e-06, 'epoch': 1.41} {'loss': 0.4389, 'learning_rate': 4.265260099362356e-06, 'epoch': 1.41} {'loss': 0.2709, 'learning_rate': 4.264984861719127e-06, 'epoch': 1.41} {'loss': 0.413, 'learning_rate': 4.2647096305496435e-06, 'epoch': 1.41} {'loss': 0.2984, 'learning_rate': 4.264434405854209e-06, 'epoch': 1.41} {'loss': 0.2952, 'learning_rate': 4.264159187633141e-06, 'epoch': 1.41} {'loss': 0.2162, 'learning_rate': 4.2638839758867435e-06, 'epoch': 1.41} {'loss': 0.3496, 'learning_rate': 4.2636087706153326e-06, 'epoch': 1.41} {'loss': 0.3504, 'learning_rate': 4.263333571819214e-06, 'epoch': 1.41} {'loss': 0.2801, 'learning_rate': 4.263058379498703e-06, 'epoch': 1.41} {'loss': 0.4263, 'learning_rate': 4.262783193654106e-06, 'epoch': 1.41} {'loss': 0.4042, 'learning_rate': 4.26250801428574e-06, 'epoch': 1.41} {'loss': 0.2915, 'learning_rate': 4.262232841393906e-06, 'epoch': 1.41} {'loss': 0.3163, 'learning_rate': 4.261957674978925e-06, 'epoch': 1.41} {'loss': 0.269, 'learning_rate': 4.261682515041103e-06, 'epoch': 1.41} {'loss': 0.4284, 'learning_rate': 4.261407361580745e-06, 'epoch': 1.41} {'loss': 0.4086, 'learning_rate': 4.26113221459817e-06, 'epoch': 1.41} {'loss': 0.2699, 'learning_rate': 4.260857074093684e-06, 'epoch': 1.41} {'loss': 0.2845, 'learning_rate': 4.260581940067602e-06, 'epoch': 1.41} {'loss': 0.3009, 'learning_rate': 4.2603068125202276e-06, 'epoch': 1.41} {'loss': 0.187, 'learning_rate': 4.260031691451878e-06, 'epoch': 1.41} {'loss': 0.408, 'learning_rate': 4.259756576862859e-06, 'epoch': 1.41} {'loss': 0.2972, 'learning_rate': 4.259481468753487e-06, 'epoch': 1.41} {'loss': 0.3065, 'learning_rate': 4.259206367124064e-06, 'epoch': 1.41} {'loss': 0.2573, 'learning_rate': 4.25893127197491e-06, 'epoch': 1.41} {'loss': 0.3133, 'learning_rate': 4.2586561833063265e-06, 'epoch': 1.41} {'loss': 0.3051, 'learning_rate': 4.258381101118633e-06, 'epoch': 1.41} {'loss': 0.2455, 'learning_rate': 4.258106025412134e-06, 'epoch': 1.41} {'loss': 0.3141, 'learning_rate': 4.2578309561871386e-06, 'epoch': 1.41} {'loss': 0.4052, 'learning_rate': 4.2575558934439635e-06, 'epoch': 1.41} {'loss': 0.224, 'learning_rate': 4.257280837182912e-06, 'epoch': 1.41} {'loss': 0.1849, 'learning_rate': 4.257005787404302e-06, 'epoch': 1.41} {'loss': 0.522, 'learning_rate': 4.256730744108438e-06, 'epoch': 1.41} {'loss': 0.3155, 'learning_rate': 4.256455707295636e-06, 'epoch': 1.41} {'loss': 0.3315, 'learning_rate': 4.256180676966199e-06, 'epoch': 1.41} {'loss': 0.2186, 'learning_rate': 4.255905653120446e-06, 'epoch': 1.41} {'loss': 0.3215, 'learning_rate': 4.25563063575868e-06, 'epoch': 1.41} {'loss': 0.3011, 'learning_rate': 4.2553556248812166e-06, 'epoch': 1.41} {'loss': 0.234, 'learning_rate': 4.2550806204883625e-06, 'epoch': 1.41} {'loss': 0.3349, 'learning_rate': 4.254805622580429e-06, 'epoch': 1.41} {'loss': 0.4492, 'learning_rate': 4.254530631157731e-06, 'epoch': 1.41} {'loss': 0.3039, 'learning_rate': 4.254255646220572e-06, 'epoch': 1.41} {'loss': 0.2608, 'learning_rate': 4.25398066776927e-06, 'epoch': 1.41} {'loss': 0.2365, 'learning_rate': 4.253705695804127e-06, 'epoch': 1.41} {'loss': 0.432, 'learning_rate': 4.253430730325461e-06, 'epoch': 1.41} {'loss': 0.3812, 'learning_rate': 4.253155771333575e-06, 'epoch': 1.41} {'loss': 0.3597, 'learning_rate': 4.252880818828787e-06, 'epoch': 1.41} {'loss': 0.3554, 'learning_rate': 4.252605872811401e-06, 'epoch': 1.41} {'loss': 0.2686, 'learning_rate': 4.252330933281733e-06, 'epoch': 1.41} {'loss': 0.2792, 'learning_rate': 4.25205600024009e-06, 'epoch': 1.41} {'loss': 0.2336, 'learning_rate': 4.25178107368678e-06, 'epoch': 1.41} {'loss': 0.1801, 'learning_rate': 4.251506153622119e-06, 'epoch': 1.41} {'loss': 0.2931, 'learning_rate': 4.251231240046411e-06, 'epoch': 1.41} {'loss': 0.2946, 'learning_rate': 4.250956332959975e-06, 'epoch': 1.41} {'loss': 0.3489, 'learning_rate': 4.2506814323631105e-06, 'epoch': 1.41} {'loss': 0.3801, 'learning_rate': 4.2504065382561375e-06, 'epoch': 1.41} {'loss': 0.4666, 'learning_rate': 4.250131650639359e-06, 'epoch': 1.41} {'loss': 0.3139, 'learning_rate': 4.249856769513091e-06, 'epoch': 1.41} {'loss': 0.3481, 'learning_rate': 4.249581894877638e-06, 'epoch': 1.41} {'loss': 0.1909, 'learning_rate': 4.249307026733318e-06, 'epoch': 1.41} {'loss': 0.2669, 'learning_rate': 4.2490321650804326e-06, 'epoch': 1.41} {'loss': 0.3684, 'learning_rate': 4.2487573099193e-06, 'epoch': 1.41} {'loss': 0.3677, 'learning_rate': 4.248482461250226e-06, 'epoch': 1.41} {'loss': 0.3499, 'learning_rate': 4.248207619073519e-06, 'epoch': 1.41} {'loss': 0.3705, 'learning_rate': 4.247932783389496e-06, 'epoch': 1.41} {'loss': 0.2636, 'learning_rate': 4.247657954198459e-06, 'epoch': 1.41} {'loss': 0.3261, 'learning_rate': 4.247383131500725e-06, 'epoch': 1.41} {'loss': 0.2999, 'learning_rate': 4.247108315296599e-06, 'epoch': 1.41} {'loss': 0.318, 'learning_rate': 4.246833505586396e-06, 'epoch': 1.41} {'loss': 0.1786, 'learning_rate': 4.2465587023704215e-06, 'epoch': 1.41} {'loss': 0.2604, 'learning_rate': 4.246283905648991e-06, 'epoch': 1.41} {'loss': 0.3026, 'learning_rate': 4.246009115422409e-06, 'epoch': 1.41} {'loss': 0.2348, 'learning_rate': 4.245734331690992e-06, 'epoch': 1.41} {'loss': 0.3459, 'learning_rate': 4.245459554455043e-06, 'epoch': 1.41} {'loss': 0.3261, 'learning_rate': 4.24518478371488e-06, 'epoch': 1.41} {'loss': 0.2689, 'learning_rate': 4.244910019470808e-06, 'epoch': 1.41} {'loss': 0.3813, 'learning_rate': 4.244635261723135e-06, 'epoch': 1.41} {'loss': 0.4814, 'learning_rate': 4.244360510472178e-06, 'epoch': 1.41} {'loss': 0.4066, 'learning_rate': 4.2440857657182396e-06, 'epoch': 1.41} {'loss': 0.3377, 'learning_rate': 4.243811027461638e-06, 'epoch': 1.41} {'loss': 0.265, 'learning_rate': 4.243536295702676e-06, 'epoch': 1.41} {'loss': 0.4002, 'learning_rate': 4.243261570441669e-06, 'epoch': 1.41} {'loss': 0.4109, 'learning_rate': 4.242986851678923e-06, 'epoch': 1.41} {'loss': 0.3663, 'learning_rate': 4.242712139414753e-06, 'epoch': 1.41} {'loss': 0.1628, 'learning_rate': 4.2424374336494625e-06, 'epoch': 1.41} {'loss': 0.3246, 'learning_rate': 4.242162734383369e-06, 'epoch': 1.41} {'loss': 0.268, 'learning_rate': 4.241888041616775e-06, 'epoch': 1.41} {'loss': 0.3336, 'learning_rate': 4.241613355349999e-06, 'epoch': 1.41} {'loss': 0.4483, 'learning_rate': 4.241338675583345e-06, 'epoch': 1.41} {'loss': 0.3687, 'learning_rate': 4.241064002317121e-06, 'epoch': 1.41} {'loss': 0.2392, 'learning_rate': 4.240789335551646e-06, 'epoch': 1.41} {'loss': 0.3207, 'learning_rate': 4.24051467528722e-06, 'epoch': 1.41} {'loss': 0.2439, 'learning_rate': 4.240240021524162e-06, 'epoch': 1.41} {'loss': 0.3271, 'learning_rate': 4.2399653742627725e-06, 'epoch': 1.41} {'loss': 0.3936, 'learning_rate': 4.239690733503371e-06, 'epoch': 1.41} {'loss': 0.5335, 'learning_rate': 4.239416099246261e-06, 'epoch': 1.41} {'loss': 0.3673, 'learning_rate': 4.239141471491757e-06, 'epoch': 1.41} {'loss': 0.3137, 'learning_rate': 4.238866850240164e-06, 'epoch': 1.41} {'loss': 0.2453, 'learning_rate': 4.238592235491798e-06, 'epoch': 1.41} {'loss': 0.3355, 'learning_rate': 4.238317627246962e-06, 'epoch': 1.41} {'loss': 0.2608, 'learning_rate': 4.238043025505974e-06, 'epoch': 1.41} {'loss': 0.1816, 'learning_rate': 4.237768430269139e-06, 'epoch': 1.41} {'loss': 0.3698, 'learning_rate': 4.237493841536764e-06, 'epoch': 1.41} {'loss': 0.3373, 'learning_rate': 4.237219259309167e-06, 'epoch': 1.41} {'loss': 0.2369, 'learning_rate': 4.23694468358665e-06, 'epoch': 1.41} {'loss': 0.2316, 'learning_rate': 4.23667011436953e-06, 'epoch': 1.41} {'loss': 0.283, 'learning_rate': 4.236395551658109e-06, 'epoch': 1.41} {'loss': 0.2223, 'learning_rate': 4.236120995452706e-06, 'epoch': 1.41} {'loss': 0.2432, 'learning_rate': 4.235846445753623e-06, 'epoch': 1.41} {'loss': 0.4212, 'learning_rate': 4.235571902561176e-06, 'epoch': 1.41} {'loss': 0.3374, 'learning_rate': 4.235297365875669e-06, 'epoch': 1.41} {'loss': 0.1627, 'learning_rate': 4.235022835697419e-06, 'epoch': 1.41} {'loss': 0.3898, 'learning_rate': 4.2347483120267275e-06, 'epoch': 1.41} {'loss': 0.2185, 'learning_rate': 4.234473794863914e-06, 'epoch': 1.41} {'loss': 0.3606, 'learning_rate': 4.234199284209282e-06, 'epoch': 1.41} {'loss': 0.1392, 'learning_rate': 4.233924780063139e-06, 'epoch': 1.41} {'loss': 0.3945, 'learning_rate': 4.233650282425802e-06, 'epoch': 1.41} {'loss': 0.3106, 'learning_rate': 4.233375791297574e-06, 'epoch': 1.41} {'loss': 0.4027, 'learning_rate': 4.233101306678772e-06, 'epoch': 1.41} {'loss': 0.3518, 'learning_rate': 4.232826828569697e-06, 'epoch': 1.41} {'loss': 0.4143, 'learning_rate': 4.23255235697067e-06, 'epoch': 1.41} {'loss': 0.2906, 'learning_rate': 4.232277891881989e-06, 'epoch': 1.41} {'loss': 0.3259, 'learning_rate': 4.2320034333039725e-06, 'epoch': 1.41} {'loss': 0.3437, 'learning_rate': 4.231728981236926e-06, 'epoch': 1.41} {'loss': 0.262, 'learning_rate': 4.231454535681162e-06, 'epoch': 1.41} {'loss': 0.4161, 'learning_rate': 4.231180096636987e-06, 'epoch': 1.41} {'loss': 0.2783, 'learning_rate': 4.230905664104715e-06, 'epoch': 1.41} {'loss': 0.187, 'learning_rate': 4.230631238084655e-06, 'epoch': 1.41} {'loss': 0.4104, 'learning_rate': 4.230356818577111e-06, 'epoch': 1.41} {'loss': 0.3207, 'learning_rate': 4.2300824055823995e-06, 'epoch': 1.41} {'loss': 0.3281, 'learning_rate': 4.2298079991008245e-06, 'epoch': 1.41} {'loss': 0.299, 'learning_rate': 4.229533599132703e-06, 'epoch': 1.41} {'loss': 0.122, 'learning_rate': 4.2292592056783375e-06, 'epoch': 1.41} {'loss': 0.3961, 'learning_rate': 4.228984818738045e-06, 'epoch': 1.41} {'loss': 0.357, 'learning_rate': 4.228710438312127e-06, 'epoch': 1.41} {'loss': 0.1993, 'learning_rate': 4.2284360644009e-06, 'epoch': 1.41} {'loss': 0.3314, 'learning_rate': 4.228161697004669e-06, 'epoch': 1.41} {'loss': 0.3175, 'learning_rate': 4.227887336123749e-06, 'epoch': 1.41} {'loss': 0.4344, 'learning_rate': 4.227612981758443e-06, 'epoch': 1.41} {'loss': 0.2966, 'learning_rate': 4.2273386339090646e-06, 'epoch': 1.41} {'loss': 0.2674, 'learning_rate': 4.227064292575927e-06, 'epoch': 1.41} {'loss': 0.3341, 'learning_rate': 4.226789957759331e-06, 'epoch': 1.41} {'loss': 0.3077, 'learning_rate': 4.226515629459597e-06, 'epoch': 1.41} {'loss': 0.3068, 'learning_rate': 4.226241307677024e-06, 'epoch': 1.41} {'loss': 0.4185, 'learning_rate': 4.2259669924119295e-06, 'epoch': 1.41} {'loss': 0.2975, 'learning_rate': 4.2256926836646175e-06, 'epoch': 1.41} {'loss': 0.268, 'learning_rate': 4.2254183814354045e-06, 'epoch': 1.41} {'loss': 0.3625, 'learning_rate': 4.225144085724596e-06, 'epoch': 1.41} {'loss': 0.1572, 'learning_rate': 4.224869796532497e-06, 'epoch': 1.41} {'loss': 0.3613, 'learning_rate': 4.224595513859426e-06, 'epoch': 1.41} {'loss': 0.2128, 'learning_rate': 4.224321237705685e-06, 'epoch': 1.41} {'loss': 0.3778, 'learning_rate': 4.224046968071591e-06, 'epoch': 1.41} {'loss': 0.2575, 'learning_rate': 4.2237727049574464e-06, 'epoch': 1.41} {'loss': 0.2115, 'learning_rate': 4.223498448363567e-06, 'epoch': 1.41} {'loss': 0.4224, 'learning_rate': 4.223224198290256e-06, 'epoch': 1.41} {'loss': 0.2656, 'learning_rate': 4.222949954737828e-06, 'epoch': 1.41} {'loss': 0.3967, 'learning_rate': 4.22267571770659e-06, 'epoch': 1.41} {'loss': 0.3301, 'learning_rate': 4.222401487196855e-06, 'epoch': 1.41} {'loss': 0.4092, 'learning_rate': 4.222127263208926e-06, 'epoch': 1.41} {'loss': 0.3615, 'learning_rate': 4.2218530457431215e-06, 'epoch': 1.41} {'loss': 0.3256, 'learning_rate': 4.221578834799745e-06, 'epoch': 1.41} {'loss': 0.2405, 'learning_rate': 4.221304630379104e-06, 'epoch': 1.41} {'loss': 0.2179, 'learning_rate': 4.2210304324815155e-06, 'epoch': 1.41} {'loss': 0.2891, 'learning_rate': 4.22075624110728e-06, 'epoch': 1.41} {'loss': 0.4087, 'learning_rate': 4.220482056256716e-06, 'epoch': 1.41} {'loss': 0.2579, 'learning_rate': 4.220207877930125e-06, 'epoch': 1.41} {'loss': 0.4058, 'learning_rate': 4.219933706127823e-06, 'epoch': 1.41} {'loss': 0.3614, 'learning_rate': 4.219659540850114e-06, 'epoch': 1.41} {'loss': 0.4497, 'learning_rate': 4.219385382097314e-06, 'epoch': 1.41} {'loss': 0.2571, 'learning_rate': 4.219111229869725e-06, 'epoch': 1.41} {'loss': 0.2298, 'learning_rate': 4.218837084167663e-06, 'epoch': 1.41} {'loss': 0.4387, 'learning_rate': 4.218562944991431e-06, 'epoch': 1.41} {'loss': 0.2637, 'learning_rate': 4.218288812341347e-06, 'epoch': 1.41} {'loss': 0.3118, 'learning_rate': 4.2180146862177106e-06, 'epoch': 1.41} {'loss': 0.3544, 'learning_rate': 4.217740566620841e-06, 'epoch': 1.41} {'loss': 0.298, 'learning_rate': 4.2174664535510415e-06, 'epoch': 1.41} {'loss': 0.2761, 'learning_rate': 4.217192347008618e-06, 'epoch': 1.41} {'loss': 0.4215, 'learning_rate': 4.21691824699389e-06, 'epoch': 1.41} {'loss': 0.286, 'learning_rate': 4.216644153507159e-06, 'epoch': 1.41} {'loss': 0.2705, 'learning_rate': 4.216370066548738e-06, 'epoch': 1.41} {'loss': 0.3005, 'learning_rate': 4.216095986118934e-06, 'epoch': 1.41} {'loss': 0.4806, 'learning_rate': 4.215821912218061e-06, 'epoch': 1.41} {'loss': 0.3579, 'learning_rate': 4.215547844846421e-06, 'epoch': 1.41} {'loss': 0.3069, 'learning_rate': 4.215273784004331e-06, 'epoch': 1.41} {'loss': 0.3545, 'learning_rate': 4.214999729692093e-06, 'epoch': 1.41} {'loss': 0.4894, 'learning_rate': 4.214725681910025e-06, 'epoch': 1.41} {'loss': 0.3729, 'learning_rate': 4.214451640658427e-06, 'epoch': 1.41} {'loss': 0.2499, 'learning_rate': 4.214177605937617e-06, 'epoch': 1.41} {'loss': 0.2696, 'learning_rate': 4.2139035777479e-06, 'epoch': 1.41} {'loss': 0.4557, 'learning_rate': 4.213629556089582e-06, 'epoch': 1.41} {'loss': 0.375, 'learning_rate': 4.21335554096298e-06, 'epoch': 1.41} {'loss': 0.3094, 'learning_rate': 4.213081532368395e-06, 'epoch': 1.41} {'loss': 0.2618, 'learning_rate': 4.2128075303061445e-06, 'epoch': 1.41} {'loss': 0.3103, 'learning_rate': 4.212533534776529e-06, 'epoch': 1.41} {'loss': 0.318, 'learning_rate': 4.212259545779868e-06, 'epoch': 1.41} {'loss': 0.3359, 'learning_rate': 4.211985563316461e-06, 'epoch': 1.41} {'loss': 0.2639, 'learning_rate': 4.211711587386625e-06, 'epoch': 1.41} {'loss': 0.3768, 'learning_rate': 4.211437617990664e-06, 'epoch': 1.41} {'loss': 0.1727, 'learning_rate': 4.21116365512889e-06, 'epoch': 1.41} {'loss': 0.2784, 'learning_rate': 4.21088969880161e-06, 'epoch': 1.41} {'loss': 0.2441, 'learning_rate': 4.210615749009137e-06, 'epoch': 1.41} {'loss': 0.3023, 'learning_rate': 4.210341805751778e-06, 'epoch': 1.41} {'loss': 0.2999, 'learning_rate': 4.210067869029839e-06, 'epoch': 1.41} {'loss': 0.3753, 'learning_rate': 4.209793938843636e-06, 'epoch': 1.41} {'loss': 0.2645, 'learning_rate': 4.209520015193471e-06, 'epoch': 1.41} {'loss': 0.2701, 'learning_rate': 4.209246098079661e-06, 'epoch': 1.41} {'loss': 0.2583, 'learning_rate': 4.208972187502507e-06, 'epoch': 1.41} {'loss': 0.3638, 'learning_rate': 4.208698283462325e-06, 'epoch': 1.41} {'loss': 0.4037, 'learning_rate': 4.208424385959419e-06, 'epoch': 1.41} {'loss': 0.2113, 'learning_rate': 4.208150494994102e-06, 'epoch': 1.41} {'loss': 0.3933, 'learning_rate': 4.20787661056668e-06, 'epoch': 1.41} {'loss': 0.3422, 'learning_rate': 4.2076027326774675e-06, 'epoch': 1.41} {'loss': 0.1722, 'learning_rate': 4.207328861326766e-06, 'epoch': 1.41} {'loss': 0.2846, 'learning_rate': 4.207054996514892e-06, 'epoch': 1.41} {'loss': 0.3427, 'learning_rate': 4.2067811382421516e-06, 'epoch': 1.41} {'loss': 0.4282, 'learning_rate': 4.20650728650885e-06, 'epoch': 1.41} {'loss': 0.403, 'learning_rate': 4.206233441315304e-06, 'epoch': 1.41} {'loss': 0.165, 'learning_rate': 4.205959602661815e-06, 'epoch': 1.41} {'loss': 0.2511, 'learning_rate': 4.205685770548699e-06, 'epoch': 1.41} {'loss': 0.3659, 'learning_rate': 4.205411944976258e-06, 'epoch': 1.41} {'loss': 0.3239, 'learning_rate': 4.205138125944808e-06, 'epoch': 1.41} {'loss': 0.2402, 'learning_rate': 4.204864313454654e-06, 'epoch': 1.41} {'loss': 0.179, 'learning_rate': 4.204590507506108e-06, 'epoch': 1.41} {'loss': 0.2571, 'learning_rate': 4.204316708099474e-06, 'epoch': 1.41} {'loss': 0.2998, 'learning_rate': 4.204042915235068e-06, 'epoch': 1.41} {'loss': 0.3048, 'learning_rate': 4.203769128913192e-06, 'epoch': 1.41} {'loss': 0.2337, 'learning_rate': 4.203495349134162e-06, 'epoch': 1.41} {'loss': 0.2407, 'learning_rate': 4.203221575898283e-06, 'epoch': 1.41} {'loss': 0.3198, 'learning_rate': 4.202947809205862e-06, 'epoch': 1.41} {'loss': 0.2341, 'learning_rate': 4.202674049057213e-06, 'epoch': 1.41} {'loss': 0.2303, 'learning_rate': 4.20240029545264e-06, 'epoch': 1.41} {'loss': 0.2995, 'learning_rate': 4.202126548392457e-06, 'epoch': 1.41} {'loss': 0.3831, 'learning_rate': 4.201852807876968e-06, 'epoch': 1.41} {'loss': 0.361, 'learning_rate': 4.201579073906487e-06, 'epoch': 1.41} {'loss': 0.273, 'learning_rate': 4.201305346481319e-06, 'epoch': 1.41} {'loss': 0.3653, 'learning_rate': 4.201031625601777e-06, 'epoch': 1.41} {'loss': 0.3768, 'learning_rate': 4.200757911268164e-06, 'epoch': 1.41} {'loss': 0.3449, 'learning_rate': 4.200484203480792e-06, 'epoch': 1.41} {'loss': 0.3372, 'learning_rate': 4.200210502239976e-06, 'epoch': 1.41} {'loss': 0.3235, 'learning_rate': 4.199936807546013e-06, 'epoch': 1.41} {'loss': 0.3041, 'learning_rate': 4.199663119399224e-06, 'epoch': 1.41} {'loss': 0.3732, 'learning_rate': 4.199389437799909e-06, 'epoch': 1.41} {'loss': 0.2677, 'learning_rate': 4.199115762748383e-06, 'epoch': 1.41} {'loss': 0.1601, 'learning_rate': 4.198842094244948e-06, 'epoch': 1.41} {'loss': 0.3814, 'learning_rate': 4.198568432289922e-06, 'epoch': 1.41} {'loss': 0.3079, 'learning_rate': 4.198294776883604e-06, 'epoch': 1.41} {'loss': 0.2047, 'learning_rate': 4.198021128026314e-06, 'epoch': 1.41} {'loss': 0.3928, 'learning_rate': 4.197747485718353e-06, 'epoch': 1.41} {'loss': 0.3131, 'learning_rate': 4.197473849960028e-06, 'epoch': 1.41} {'loss': 0.2135, 'learning_rate': 4.197200220751656e-06, 'epoch': 1.41} {'loss': 0.3533, 'learning_rate': 4.196926598093538e-06, 'epoch': 1.41} {'loss': 0.2061, 'learning_rate': 4.196652981985989e-06, 'epoch': 1.41} {'loss': 0.303, 'learning_rate': 4.196379372429313e-06, 'epoch': 1.41} {'loss': 0.4281, 'learning_rate': 4.1961057694238235e-06, 'epoch': 1.41} {'loss': 0.2278, 'learning_rate': 4.195832172969824e-06, 'epoch': 1.41} {'loss': 0.2719, 'learning_rate': 4.195558583067629e-06, 'epoch': 1.41} {'loss': 0.3651, 'learning_rate': 4.1952849997175426e-06, 'epoch': 1.41} {'loss': 0.4148, 'learning_rate': 4.1950114229198776e-06, 'epoch': 1.41} {'loss': 0.422, 'learning_rate': 4.194737852674938e-06, 'epoch': 1.41} {'loss': 0.3929, 'learning_rate': 4.194464288983039e-06, 'epoch': 1.41} {'loss': 0.2727, 'learning_rate': 4.194190731844487e-06, 'epoch': 1.41} {'loss': 0.2054, 'learning_rate': 4.1939171812595836e-06, 'epoch': 1.41} {'loss': 0.3653, 'learning_rate': 4.193643637228648e-06, 'epoch': 1.41} {'loss': 0.1917, 'learning_rate': 4.193370099751982e-06, 'epoch': 1.41} {'loss': 0.4344, 'learning_rate': 4.1930965688299e-06, 'epoch': 1.41} {'loss': 0.4342, 'learning_rate': 4.192823044462704e-06, 'epoch': 1.41} {'loss': 0.3493, 'learning_rate': 4.19254952665071e-06, 'epoch': 1.41} {'loss': 0.3541, 'learning_rate': 4.19227601539422e-06, 'epoch': 1.41} {'loss': 0.3248, 'learning_rate': 4.19200251069355e-06, 'epoch': 1.41} {'loss': 0.3362, 'learning_rate': 4.191729012549001e-06, 'epoch': 1.41} {'loss': 0.1958, 'learning_rate': 4.191455520960888e-06, 'epoch': 1.41} {'loss': 0.3505, 'learning_rate': 4.191182035929514e-06, 'epoch': 1.41} {'loss': 0.4039, 'learning_rate': 4.190908557455194e-06, 'epoch': 1.41} {'loss': 0.2731, 'learning_rate': 4.190635085538235e-06, 'epoch': 1.41} {'loss': 0.3064, 'learning_rate': 4.19036162017894e-06, 'epoch': 1.41} {'loss': 0.3038, 'learning_rate': 4.1900881613776256e-06, 'epoch': 1.41} {'loss': 0.3014, 'learning_rate': 4.189814709134593e-06, 'epoch': 1.41} {'loss': 0.3305, 'learning_rate': 4.189541263450159e-06, 'epoch': 1.41} {'loss': 0.5315, 'learning_rate': 4.1892678243246246e-06, 'epoch': 1.41} {'loss': 0.3919, 'learning_rate': 4.188994391758304e-06, 'epoch': 1.41} {'loss': 0.3131, 'learning_rate': 4.188720965751502e-06, 'epoch': 1.41} {'loss': 0.3907, 'learning_rate': 4.18844754630453e-06, 'epoch': 1.41} {'loss': 0.2812, 'learning_rate': 4.188174133417694e-06, 'epoch': 1.41} {'loss': 0.354, 'learning_rate': 4.1879007270913076e-06, 'epoch': 1.41} {'loss': 0.226, 'learning_rate': 4.1876273273256715e-06, 'epoch': 1.41} {'loss': 0.5061, 'learning_rate': 4.187353934121104e-06, 'epoch': 1.41} {'loss': 0.2523, 'learning_rate': 4.187080547477908e-06, 'epoch': 1.41} {'loss': 0.2666, 'learning_rate': 4.186807167396388e-06, 'epoch': 1.41} {'loss': 0.3619, 'learning_rate': 4.186533793876863e-06, 'epoch': 1.41} {'loss': 0.4186, 'learning_rate': 4.186260426919631e-06, 'epoch': 1.41} {'loss': 0.4068, 'learning_rate': 4.185987066525008e-06, 'epoch': 1.41} {'loss': 0.3656, 'learning_rate': 4.1857137126932975e-06, 'epoch': 1.41} {'loss': 0.5245, 'learning_rate': 4.1854403654248145e-06, 'epoch': 1.41} {'loss': 0.336, 'learning_rate': 4.185167024719859e-06, 'epoch': 1.41} {'loss': 0.2618, 'learning_rate': 4.184893690578748e-06, 'epoch': 1.41} {'loss': 0.2777, 'learning_rate': 4.184620363001784e-06, 'epoch': 1.41} {'loss': 0.2012, 'learning_rate': 4.184347041989281e-06, 'epoch': 1.41} {'loss': 0.2668, 'learning_rate': 4.18407372754154e-06, 'epoch': 1.41} {'loss': 0.1777, 'learning_rate': 4.183800419658877e-06, 'epoch': 1.41} {'loss': 0.2858, 'learning_rate': 4.183527118341598e-06, 'epoch': 1.41} {'loss': 0.3615, 'learning_rate': 4.183253823590007e-06, 'epoch': 1.41} {'loss': 0.3698, 'learning_rate': 4.182980535404421e-06, 'epoch': 1.41} {'loss': 0.394, 'learning_rate': 4.182707253785139e-06, 'epoch': 1.41} {'loss': 0.4941, 'learning_rate': 4.182433978732478e-06, 'epoch': 1.41} {'loss': 0.3466, 'learning_rate': 4.1821607102467385e-06, 'epoch': 1.41} {'loss': 0.4701, 'learning_rate': 4.181887448328238e-06, 'epoch': 1.41} {'loss': 0.3646, 'learning_rate': 4.181614192977277e-06, 'epoch': 1.41} {'loss': 0.3706, 'learning_rate': 4.18134094419417e-06, 'epoch': 1.41} {'loss': 0.3242, 'learning_rate': 4.181067701979219e-06, 'epoch': 1.41} {'loss': 0.2124, 'learning_rate': 4.180794466332739e-06, 'epoch': 1.41} {'loss': 0.3195, 'learning_rate': 4.180521237255033e-06, 'epoch': 1.41} {'loss': 0.2922, 'learning_rate': 4.180248014746415e-06, 'epoch': 1.41} {'loss': 0.3402, 'learning_rate': 4.17997479880719e-06, 'epoch': 1.41} {'loss': 0.3912, 'learning_rate': 4.179701589437663e-06, 'epoch': 1.41} {'loss': 0.266, 'learning_rate': 4.179428386638152e-06, 'epoch': 1.41} {'loss': 0.2493, 'learning_rate': 4.1791551904089535e-06, 'epoch': 1.41} {'loss': 0.347, 'learning_rate': 4.178882000750386e-06, 'epoch': 1.41} {'loss': 0.3403, 'learning_rate': 4.17860881766275e-06, 'epoch': 1.41} {'loss': 0.4013, 'learning_rate': 4.178335641146362e-06, 'epoch': 1.41} {'loss': 0.2756, 'learning_rate': 4.178062471201522e-06, 'epoch': 1.41} {'loss': 0.2559, 'learning_rate': 4.177789307828546e-06, 'epoch': 1.41} {'loss': 0.328, 'learning_rate': 4.177516151027735e-06, 'epoch': 1.41} {'loss': 0.3674, 'learning_rate': 4.177243000799405e-06, 'epoch': 1.41} {'loss': 0.3533, 'learning_rate': 4.176969857143857e-06, 'epoch': 1.41} {'loss': 0.4197, 'learning_rate': 4.176696720061405e-06, 'epoch': 1.41} {'loss': 0.2707, 'learning_rate': 4.176423589552353e-06, 'epoch': 1.41} {'loss': 0.2796, 'learning_rate': 4.176150465617014e-06, 'epoch': 1.41} {'loss': 0.3051, 'learning_rate': 4.1758773482556935e-06, 'epoch': 1.41} {'loss': 0.4216, 'learning_rate': 4.1756042374686975e-06, 'epoch': 1.41} {'loss': 0.272, 'learning_rate': 4.17533113325634e-06, 'epoch': 1.41} {'loss': 0.3005, 'learning_rate': 4.1750580356189214e-06, 'epoch': 1.41} {'loss': 0.2908, 'learning_rate': 4.174784944556759e-06, 'epoch': 1.41} {'loss': 0.4076, 'learning_rate': 4.174511860070154e-06, 'epoch': 1.41} {'loss': 0.2727, 'learning_rate': 4.17423878215942e-06, 'epoch': 1.41} {'loss': 0.3896, 'learning_rate': 4.173965710824859e-06, 'epoch': 1.41} {'loss': 0.2585, 'learning_rate': 4.173692646066786e-06, 'epoch': 1.41} {'loss': 0.5133, 'learning_rate': 4.173419587885503e-06, 'epoch': 1.41} {'loss': 0.3045, 'learning_rate': 4.173146536281321e-06, 'epoch': 1.41} {'loss': 0.3699, 'learning_rate': 4.172873491254552e-06, 'epoch': 1.41} {'loss': 0.2628, 'learning_rate': 4.172600452805498e-06, 'epoch': 1.41} {'loss': 0.2851, 'learning_rate': 4.172327420934474e-06, 'epoch': 1.41} {'loss': 0.2713, 'learning_rate': 4.172054395641779e-06, 'epoch': 1.41} {'loss': 0.2427, 'learning_rate': 4.1717813769277304e-06, 'epoch': 1.41} {'loss': 0.3013, 'learning_rate': 4.171508364792629e-06, 'epoch': 1.41} {'loss': 0.5319, 'learning_rate': 4.171235359236789e-06, 'epoch': 1.41} {'loss': 0.2085, 'learning_rate': 4.1709623602605145e-06, 'epoch': 1.41} {'loss': 0.3995, 'learning_rate': 4.1706893678641166e-06, 'epoch': 1.41} {'loss': 0.3313, 'learning_rate': 4.1704163820479025e-06, 'epoch': 1.41} {'loss': 0.3138, 'learning_rate': 4.1701434028121765e-06, 'epoch': 1.42} {'loss': 0.2896, 'learning_rate': 4.1698704301572535e-06, 'epoch': 1.42} {'loss': 0.3162, 'learning_rate': 4.1695974640834336e-06, 'epoch': 1.42} {'loss': 0.2798, 'learning_rate': 4.169324504591035e-06, 'epoch': 1.42} {'loss': 0.2271, 'learning_rate': 4.169051551680355e-06, 'epoch': 1.42} {'loss': 0.3524, 'learning_rate': 4.168778605351711e-06, 'epoch': 1.42} {'loss': 0.3369, 'learning_rate': 4.168505665605404e-06, 'epoch': 1.42} {'loss': 0.3194, 'learning_rate': 4.168232732441748e-06, 'epoch': 1.42} {'loss': 0.2958, 'learning_rate': 4.167959805861045e-06, 'epoch': 1.42} {'loss': 0.4241, 'learning_rate': 4.16768688586361e-06, 'epoch': 1.42} {'loss': 0.3919, 'learning_rate': 4.167413972449744e-06, 'epoch': 1.42} {'loss': 0.3719, 'learning_rate': 4.167141065619762e-06, 'epoch': 1.42} {'loss': 0.4836, 'learning_rate': 4.166868165373969e-06, 'epoch': 1.42} {'loss': 0.2737, 'learning_rate': 4.166595271712668e-06, 'epoch': 1.42} {'loss': 0.1918, 'learning_rate': 4.166322384636177e-06, 'epoch': 1.42} {'loss': 0.2954, 'learning_rate': 4.166049504144793e-06, 'epoch': 1.42} {'loss': 0.3486, 'learning_rate': 4.165776630238835e-06, 'epoch': 1.42} {'loss': 0.4339, 'learning_rate': 4.165503762918601e-06, 'epoch': 1.42} {'loss': 0.3576, 'learning_rate': 4.1652309021844076e-06, 'epoch': 1.42} {'loss': 0.2806, 'learning_rate': 4.164958048036556e-06, 'epoch': 1.42} {'loss': 0.2168, 'learning_rate': 4.16468520047536e-06, 'epoch': 1.42} {'loss': 0.3367, 'learning_rate': 4.164412359501122e-06, 'epoch': 1.42} {'loss': 0.4095, 'learning_rate': 4.164139525114156e-06, 'epoch': 1.42} {'loss': 0.4633, 'learning_rate': 4.163866697314762e-06, 'epoch': 1.42} {'loss': 0.2297, 'learning_rate': 4.163593876103258e-06, 'epoch': 1.42} {'loss': 0.394, 'learning_rate': 4.1633210614799455e-06, 'epoch': 1.42} {'loss': 0.383, 'learning_rate': 4.163048253445131e-06, 'epoch': 1.42} {'loss': 0.1828, 'learning_rate': 4.162775451999128e-06, 'epoch': 1.42} {'loss': 0.2001, 'learning_rate': 4.162502657142239e-06, 'epoch': 1.42} {'loss': 0.2736, 'learning_rate': 4.162229868874777e-06, 'epoch': 1.42} {'loss': 0.2824, 'learning_rate': 4.161957087197044e-06, 'epoch': 1.42} {'loss': 0.2565, 'learning_rate': 4.161684312109354e-06, 'epoch': 1.42} {'loss': 0.3773, 'learning_rate': 4.161411543612011e-06, 'epoch': 1.42} {'loss': 0.3257, 'learning_rate': 4.161138781705325e-06, 'epoch': 1.42} {'loss': 0.3535, 'learning_rate': 4.160866026389601e-06, 'epoch': 1.42} {'loss': 0.3862, 'learning_rate': 4.160593277665153e-06, 'epoch': 1.42} {'loss': 0.5123, 'learning_rate': 4.160320535532279e-06, 'epoch': 1.42} {'loss': 0.4498, 'learning_rate': 4.160047799991298e-06, 'epoch': 1.42} {'loss': 0.2537, 'learning_rate': 4.159775071042512e-06, 'epoch': 1.42} {'loss': 0.3815, 'learning_rate': 4.159502348686225e-06, 'epoch': 1.42} {'loss': 0.1854, 'learning_rate': 4.159229632922754e-06, 'epoch': 1.42} {'loss': 0.2857, 'learning_rate': 4.158956923752398e-06, 'epoch': 1.42} {'loss': 0.3476, 'learning_rate': 4.158684221175473e-06, 'epoch': 1.42} {'loss': 0.328, 'learning_rate': 4.158411525192278e-06, 'epoch': 1.42} {'loss': 0.3906, 'learning_rate': 4.158138835803131e-06, 'epoch': 1.42} {'loss': 0.3018, 'learning_rate': 4.15786615300833e-06, 'epoch': 1.42} {'loss': 0.2949, 'learning_rate': 4.157593476808189e-06, 'epoch': 1.42} {'loss': 0.2506, 'learning_rate': 4.157320807203012e-06, 'epoch': 1.42} {'loss': 0.2367, 'learning_rate': 4.157048144193113e-06, 'epoch': 1.42} {'loss': 0.3377, 'learning_rate': 4.156775487778791e-06, 'epoch': 1.42} {'loss': 0.2494, 'learning_rate': 4.1565028379603625e-06, 'epoch': 1.42} {'loss': 0.3571, 'learning_rate': 4.15623019473813e-06, 'epoch': 1.42} {'loss': 0.3222, 'learning_rate': 4.1559575581124e-06, 'epoch': 1.42} {'loss': 0.3806, 'learning_rate': 4.1556849280834855e-06, 'epoch': 1.42} {'loss': 0.1972, 'learning_rate': 4.155412304651688e-06, 'epoch': 1.42} {'loss': 0.332, 'learning_rate': 4.155139687817322e-06, 'epoch': 1.42} {'loss': 0.3712, 'learning_rate': 4.154867077580689e-06, 'epoch': 1.42} {'loss': 0.2846, 'learning_rate': 4.154594473942102e-06, 'epoch': 1.42} {'loss': 0.2683, 'learning_rate': 4.1543218769018634e-06, 'epoch': 1.42} {'loss': 0.2052, 'learning_rate': 4.154049286460288e-06, 'epoch': 1.42} {'loss': 0.2695, 'learning_rate': 4.1537767026176746e-06, 'epoch': 1.42} {'loss': 0.2747, 'learning_rate': 4.153504125374339e-06, 'epoch': 1.42} {'loss': 0.3019, 'learning_rate': 4.153231554730582e-06, 'epoch': 1.42} {'loss': 0.287, 'learning_rate': 4.15295899068672e-06, 'epoch': 1.42} {'loss': 0.4211, 'learning_rate': 4.152686433243054e-06, 'epoch': 1.42} {'loss': 0.24, 'learning_rate': 4.15241388239989e-06, 'epoch': 1.42} {'loss': 0.1875, 'learning_rate': 4.152141338157542e-06, 'epoch': 1.42} {'loss': 0.3226, 'learning_rate': 4.15186880051631e-06, 'epoch': 1.42} {'loss': 0.39, 'learning_rate': 4.151596269476511e-06, 'epoch': 1.42} {'loss': 0.3191, 'learning_rate': 4.151323745038444e-06, 'epoch': 1.42} {'loss': 0.3629, 'learning_rate': 4.151051227202422e-06, 'epoch': 1.42} {'loss': 0.4335, 'learning_rate': 4.15077871596875e-06, 'epoch': 1.42} {'loss': 0.3115, 'learning_rate': 4.150506211337739e-06, 'epoch': 1.42} {'loss': 0.4394, 'learning_rate': 4.150233713309691e-06, 'epoch': 1.42} {'loss': 0.3141, 'learning_rate': 4.14996122188492e-06, 'epoch': 1.42} {'loss': 0.3297, 'learning_rate': 4.149688737063726e-06, 'epoch': 1.42} {'loss': 0.3801, 'learning_rate': 4.149416258846425e-06, 'epoch': 1.42} {'loss': 0.2801, 'learning_rate': 4.149143787233321e-06, 'epoch': 1.42} {'loss': 0.2681, 'learning_rate': 4.148871322224717e-06, 'epoch': 1.42} {'loss': 0.4083, 'learning_rate': 4.1485988638209284e-06, 'epoch': 1.42} {'loss': 0.3856, 'learning_rate': 4.148326412022255e-06, 'epoch': 1.42} {'loss': 0.354, 'learning_rate': 4.148053966829013e-06, 'epoch': 1.42} {'loss': 0.4136, 'learning_rate': 4.147781528241501e-06, 'epoch': 1.42} {'loss': 0.2579, 'learning_rate': 4.147509096260034e-06, 'epoch': 1.42} {'loss': 0.4221, 'learning_rate': 4.147236670884913e-06, 'epoch': 1.42} {'loss': 0.3109, 'learning_rate': 4.146964252116453e-06, 'epoch': 1.42} {'loss': 0.4776, 'learning_rate': 4.146691839954954e-06, 'epoch': 1.42} {'loss': 0.4346, 'learning_rate': 4.146419434400726e-06, 'epoch': 1.42} {'loss': 0.4377, 'learning_rate': 4.146147035454081e-06, 'epoch': 1.42} {'loss': 0.2957, 'learning_rate': 4.1458746431153185e-06, 'epoch': 1.42} {'loss': 0.3895, 'learning_rate': 4.145602257384755e-06, 'epoch': 1.42} {'loss': 0.2459, 'learning_rate': 4.14532987826269e-06, 'epoch': 1.42} {'loss': 0.2931, 'learning_rate': 4.145057505749437e-06, 'epoch': 1.42} {'loss': 0.3576, 'learning_rate': 4.1447851398452975e-06, 'epoch': 1.42} {'loss': 0.4022, 'learning_rate': 4.144512780550586e-06, 'epoch': 1.42} {'loss': 0.4091, 'learning_rate': 4.144240427865603e-06, 'epoch': 1.42} {'loss': 0.3621, 'learning_rate': 4.143968081790661e-06, 'epoch': 1.42} {'loss': 0.3266, 'learning_rate': 4.143695742326063e-06, 'epoch': 1.42} {'loss': 0.3779, 'learning_rate': 4.1434234094721215e-06, 'epoch': 1.42} {'loss': 0.245, 'learning_rate': 4.143151083229142e-06, 'epoch': 1.42} {'loss': 0.4002, 'learning_rate': 4.1428787635974275e-06, 'epoch': 1.42} {'loss': 0.2994, 'learning_rate': 4.142606450577293e-06, 'epoch': 1.42} {'loss': 0.2144, 'learning_rate': 4.142334144169038e-06, 'epoch': 1.42} {'loss': 0.3526, 'learning_rate': 4.142061844372978e-06, 'epoch': 1.42} {'loss': 0.4528, 'learning_rate': 4.1417895511894124e-06, 'epoch': 1.42} {'loss': 0.3193, 'learning_rate': 4.141517264618655e-06, 'epoch': 1.42} {'loss': 0.4128, 'learning_rate': 4.141244984661008e-06, 'epoch': 1.42} {'loss': 0.3298, 'learning_rate': 4.140972711316785e-06, 'epoch': 1.42} {'loss': 0.3378, 'learning_rate': 4.140700444586285e-06, 'epoch': 1.42} {'loss': 0.4149, 'learning_rate': 4.1404281844698246e-06, 'epoch': 1.42} {'loss': 0.2528, 'learning_rate': 4.140155930967703e-06, 'epoch': 1.42} {'loss': 0.4945, 'learning_rate': 4.139883684080235e-06, 'epoch': 1.42} {'loss': 0.434, 'learning_rate': 4.139611443807723e-06, 'epoch': 1.42} {'loss': 0.3581, 'learning_rate': 4.139339210150471e-06, 'epoch': 1.42} {'loss': 0.3784, 'learning_rate': 4.1390669831087955e-06, 'epoch': 1.42} {'loss': 0.4011, 'learning_rate': 4.138794762682996e-06, 'epoch': 1.42} {'loss': 0.2035, 'learning_rate': 4.138522548873385e-06, 'epoch': 1.42} {'loss': 0.3159, 'learning_rate': 4.138250341680263e-06, 'epoch': 1.42} {'loss': 0.2799, 'learning_rate': 4.137978141103947e-06, 'epoch': 1.42} {'loss': 0.4343, 'learning_rate': 4.137705947144734e-06, 'epoch': 1.42} {'loss': 0.2788, 'learning_rate': 4.137433759802941e-06, 'epoch': 1.42} {'loss': 0.3467, 'learning_rate': 4.137161579078867e-06, 'epoch': 1.42} {'loss': 0.3616, 'learning_rate': 4.136889404972826e-06, 'epoch': 1.42} {'loss': 0.3922, 'learning_rate': 4.136617237485118e-06, 'epoch': 1.42} {'loss': 0.0796, 'learning_rate': 4.136345076616057e-06, 'epoch': 1.42} {'loss': 0.264, 'learning_rate': 4.136072922365949e-06, 'epoch': 1.42} {'loss': 0.3365, 'learning_rate': 4.135800774735095e-06, 'epoch': 1.42} {'loss': 0.195, 'learning_rate': 4.135528633723811e-06, 'epoch': 1.42} {'loss': 0.2807, 'learning_rate': 4.135256499332395e-06, 'epoch': 1.42} {'loss': 0.2442, 'learning_rate': 4.134984371561164e-06, 'epoch': 1.42} {'loss': 0.2563, 'learning_rate': 4.134712250410417e-06, 'epoch': 1.42} {'loss': 0.2399, 'learning_rate': 4.134440135880467e-06, 'epoch': 1.42} {'loss': 0.2742, 'learning_rate': 4.134168027971616e-06, 'epoch': 1.42} {'loss': 0.1993, 'learning_rate': 4.1338959266841775e-06, 'epoch': 1.42} {'loss': 0.4131, 'learning_rate': 4.133623832018451e-06, 'epoch': 1.42} {'loss': 0.2818, 'learning_rate': 4.133351743974752e-06, 'epoch': 1.42} {'loss': 0.3469, 'learning_rate': 4.133079662553379e-06, 'epoch': 1.42} {'loss': 0.2702, 'learning_rate': 4.132807587754647e-06, 'epoch': 1.42} {'loss': 0.2672, 'learning_rate': 4.1325355195788585e-06, 'epoch': 1.42} {'loss': 0.281, 'learning_rate': 4.13226345802632e-06, 'epoch': 1.42} {'loss': 0.3297, 'learning_rate': 4.1319914030973426e-06, 'epoch': 1.42} {'loss': 0.2906, 'learning_rate': 4.1317193547922285e-06, 'epoch': 1.42} {'loss': 0.372, 'learning_rate': 4.13144731311129e-06, 'epoch': 1.42} {'loss': 0.4479, 'learning_rate': 4.1311752780548274e-06, 'epoch': 1.42} {'loss': 0.215, 'learning_rate': 4.130903249623157e-06, 'epoch': 1.42} {'loss': 0.3348, 'learning_rate': 4.130631227816576e-06, 'epoch': 1.42} {'loss': 0.2667, 'learning_rate': 4.130359212635401e-06, 'epoch': 1.42} {'loss': 0.3456, 'learning_rate': 4.13008720407993e-06, 'epoch': 1.42} {'loss': 0.3305, 'learning_rate': 4.129815202150478e-06, 'epoch': 1.42} {'loss': 0.3475, 'learning_rate': 4.129543206847344e-06, 'epoch': 1.42} {'loss': 0.2975, 'learning_rate': 4.129271218170844e-06, 'epoch': 1.42} {'loss': 0.3458, 'learning_rate': 4.128999236121281e-06, 'epoch': 1.42} {'loss': 0.4236, 'learning_rate': 4.128727260698956e-06, 'epoch': 1.42} {'loss': 0.3746, 'learning_rate': 4.1284552919041866e-06, 'epoch': 1.42} {'loss': 0.397, 'learning_rate': 4.128183329737271e-06, 'epoch': 1.42} {'loss': 0.2931, 'learning_rate': 4.127911374198522e-06, 'epoch': 1.42} {'loss': 0.2646, 'learning_rate': 4.127639425288242e-06, 'epoch': 1.42} {'loss': 0.4183, 'learning_rate': 4.127367483006744e-06, 'epoch': 1.42} {'loss': 0.2794, 'learning_rate': 4.127095547354327e-06, 'epoch': 1.42} {'loss': 0.3189, 'learning_rate': 4.126823618331307e-06, 'epoch': 1.42} {'loss': 0.4386, 'learning_rate': 4.1265516959379825e-06, 'epoch': 1.42} {'loss': 0.2724, 'learning_rate': 4.126279780174667e-06, 'epoch': 1.42} {'loss': 0.3198, 'learning_rate': 4.1260078710416616e-06, 'epoch': 1.42} {'loss': 0.2594, 'learning_rate': 4.125735968539281e-06, 'epoch': 1.42} {'loss': 0.2623, 'learning_rate': 4.125464072667825e-06, 'epoch': 1.42} {'loss': 0.3015, 'learning_rate': 4.125192183427601e-06, 'epoch': 1.42} {'loss': 0.3939, 'learning_rate': 4.124920300818922e-06, 'epoch': 1.42} {'loss': 0.2439, 'learning_rate': 4.124648424842086e-06, 'epoch': 1.42} {'loss': 0.2294, 'learning_rate': 4.124376555497409e-06, 'epoch': 1.42} {'loss': 0.3514, 'learning_rate': 4.124104692785189e-06, 'epoch': 1.42} {'loss': 0.3207, 'learning_rate': 4.123832836705742e-06, 'epoch': 1.42} {'loss': 0.2815, 'learning_rate': 4.123560987259366e-06, 'epoch': 1.42} {'loss': 0.3281, 'learning_rate': 4.123289144446377e-06, 'epoch': 1.42} {'loss': 0.3228, 'learning_rate': 4.123017308267072e-06, 'epoch': 1.42} {'loss': 0.3212, 'learning_rate': 4.122745478721768e-06, 'epoch': 1.42} {'loss': 0.3426, 'learning_rate': 4.122473655810763e-06, 'epoch': 1.42} {'loss': 0.3212, 'learning_rate': 4.12220183953437e-06, 'epoch': 1.42} {'loss': 0.4504, 'learning_rate': 4.121930029892893e-06, 'epoch': 1.42} {'loss': 0.3604, 'learning_rate': 4.1216582268866365e-06, 'epoch': 1.42} {'loss': 0.4132, 'learning_rate': 4.121386430515914e-06, 'epoch': 1.42} {'loss': 0.2663, 'learning_rate': 4.1211146407810245e-06, 'epoch': 1.42} {'loss': 0.2579, 'learning_rate': 4.120842857682282e-06, 'epoch': 1.42} {'loss': 0.4045, 'learning_rate': 4.120571081219988e-06, 'epoch': 1.42} {'loss': 0.2643, 'learning_rate': 4.120299311394452e-06, 'epoch': 1.42} {'loss': 0.2335, 'learning_rate': 4.120027548205978e-06, 'epoch': 1.42} {'loss': 0.1549, 'learning_rate': 4.119755791654878e-06, 'epoch': 1.42} {'loss': 0.3221, 'learning_rate': 4.119484041741451e-06, 'epoch': 1.42} {'loss': 0.4127, 'learning_rate': 4.119212298466011e-06, 'epoch': 1.42} {'loss': 0.3688, 'learning_rate': 4.118940561828864e-06, 'epoch': 1.42} {'loss': 0.3235, 'learning_rate': 4.11866883183031e-06, 'epoch': 1.42} {'loss': 0.3075, 'learning_rate': 4.118397108470666e-06, 'epoch': 1.42} {'loss': 0.2778, 'learning_rate': 4.118125391750228e-06, 'epoch': 1.42} {'loss': 0.442, 'learning_rate': 4.117853681669314e-06, 'epoch': 1.42} {'loss': 0.4147, 'learning_rate': 4.117581978228219e-06, 'epoch': 1.42} {'loss': 0.301, 'learning_rate': 4.117310281427259e-06, 'epoch': 1.42} {'loss': 0.2458, 'learning_rate': 4.1170385912667345e-06, 'epoch': 1.42} {'loss': 0.2164, 'learning_rate': 4.116766907746957e-06, 'epoch': 1.42} {'loss': 0.3711, 'learning_rate': 4.116495230868232e-06, 'epoch': 1.42} {'loss': 0.4475, 'learning_rate': 4.116223560630861e-06, 'epoch': 1.42} {'loss': 0.3738, 'learning_rate': 4.115951897035159e-06, 'epoch': 1.42} {'loss': 0.3738, 'learning_rate': 4.115680240081423e-06, 'epoch': 1.42} {'loss': 0.3108, 'learning_rate': 4.11540858976997e-06, 'epoch': 1.42} {'loss': 0.4095, 'learning_rate': 4.115136946101098e-06, 'epoch': 1.42} {'loss': 0.3205, 'learning_rate': 4.114865309075121e-06, 'epoch': 1.42} {'loss': 0.4171, 'learning_rate': 4.114593678692339e-06, 'epoch': 1.42} {'loss': 0.3529, 'learning_rate': 4.114322054953064e-06, 'epoch': 1.42} {'loss': 0.3276, 'learning_rate': 4.114050437857598e-06, 'epoch': 1.42} {'loss': 0.4107, 'learning_rate': 4.113778827406252e-06, 'epoch': 1.42} {'loss': 0.3275, 'learning_rate': 4.113507223599327e-06, 'epoch': 1.42} {'loss': 0.3611, 'learning_rate': 4.113235626437137e-06, 'epoch': 1.42} {'loss': 0.1982, 'learning_rate': 4.112964035919984e-06, 'epoch': 1.42} {'loss': 0.4102, 'learning_rate': 4.112692452048172e-06, 'epoch': 1.42} {'loss': 0.2935, 'learning_rate': 4.112420874822014e-06, 'epoch': 1.42} {'loss': 0.2807, 'learning_rate': 4.11214930424181e-06, 'epoch': 1.42} {'loss': 0.2907, 'learning_rate': 4.111877740307873e-06, 'epoch': 1.42} {'loss': 0.4141, 'learning_rate': 4.111606183020503e-06, 'epoch': 1.42} {'loss': 0.2652, 'learning_rate': 4.111334632380014e-06, 'epoch': 1.42} {'loss': 0.4565, 'learning_rate': 4.111063088386704e-06, 'epoch': 1.42} {'loss': 0.4071, 'learning_rate': 4.110791551040888e-06, 'epoch': 1.42} {'loss': 0.3311, 'learning_rate': 4.1105200203428654e-06, 'epoch': 1.42} {'loss': 0.3687, 'learning_rate': 4.110248496292948e-06, 'epoch': 1.42} {'loss': 0.3907, 'learning_rate': 4.1099769788914375e-06, 'epoch': 1.42} {'loss': 0.2767, 'learning_rate': 4.109705468138646e-06, 'epoch': 1.42} {'loss': 0.3552, 'learning_rate': 4.1094339640348765e-06, 'epoch': 1.42} {'loss': 0.279, 'learning_rate': 4.109162466580434e-06, 'epoch': 1.42} {'loss': 0.3472, 'learning_rate': 4.108890975775629e-06, 'epoch': 1.42} {'loss': 0.3893, 'learning_rate': 4.108619491620762e-06, 'epoch': 1.42} {'loss': 0.1872, 'learning_rate': 4.108348014116148e-06, 'epoch': 1.42} {'loss': 0.3566, 'learning_rate': 4.108076543262085e-06, 'epoch': 1.42} {'loss': 0.3677, 'learning_rate': 4.107805079058887e-06, 'epoch': 1.42} {'loss': 0.3198, 'learning_rate': 4.107533621506852e-06, 'epoch': 1.42} {'loss': 0.2093, 'learning_rate': 4.107262170606295e-06, 'epoch': 1.42} {'loss': 0.3301, 'learning_rate': 4.106990726357515e-06, 'epoch': 1.42} {'loss': 0.2961, 'learning_rate': 4.106719288760825e-06, 'epoch': 1.42} {'loss': 0.2875, 'learning_rate': 4.106447857816526e-06, 'epoch': 1.42} {'loss': 0.3762, 'learning_rate': 4.1061764335249285e-06, 'epoch': 1.42} {'loss': 0.3192, 'learning_rate': 4.105905015886339e-06, 'epoch': 1.42} {'loss': 0.4157, 'learning_rate': 4.105633604901057e-06, 'epoch': 1.42} {'loss': 0.574, 'learning_rate': 4.105362200569397e-06, 'epoch': 1.42} {'loss': 0.3128, 'learning_rate': 4.105090802891659e-06, 'epoch': 1.42} {'loss': 0.2704, 'learning_rate': 4.104819411868157e-06, 'epoch': 1.42} {'loss': 0.3605, 'learning_rate': 4.104548027499189e-06, 'epoch': 1.42} {'loss': 0.1956, 'learning_rate': 4.104276649785068e-06, 'epoch': 1.42} {'loss': 0.3508, 'learning_rate': 4.104005278726094e-06, 'epoch': 1.42} {'loss': 0.3728, 'learning_rate': 4.103733914322581e-06, 'epoch': 1.42} {'loss': 0.3178, 'learning_rate': 4.103462556574828e-06, 'epoch': 1.42} {'loss': 0.4713, 'learning_rate': 4.103191205483147e-06, 'epoch': 1.42} {'loss': 0.4001, 'learning_rate': 4.102919861047838e-06, 'epoch': 1.42} {'loss': 0.311, 'learning_rate': 4.102648523269216e-06, 'epoch': 1.42} {'loss': 0.2946, 'learning_rate': 4.102377192147582e-06, 'epoch': 1.42} {'loss': 0.3618, 'learning_rate': 4.102105867683238e-06, 'epoch': 1.42} {'loss': 0.2141, 'learning_rate': 4.1018345498765e-06, 'epoch': 1.42} {'loss': 0.3696, 'learning_rate': 4.101563238727665e-06, 'epoch': 1.42} {'loss': 0.4552, 'learning_rate': 4.101291934237047e-06, 'epoch': 1.42} {'loss': 0.2985, 'learning_rate': 4.101020636404945e-06, 'epoch': 1.42} {'loss': 0.2779, 'learning_rate': 4.100749345231673e-06, 'epoch': 1.42} {'loss': 0.3731, 'learning_rate': 4.100478060717529e-06, 'epoch': 1.42} {'loss': 0.3052, 'learning_rate': 4.100206782862828e-06, 'epoch': 1.42} {'loss': 0.4507, 'learning_rate': 4.099935511667866e-06, 'epoch': 1.42} {'loss': 0.3555, 'learning_rate': 4.099664247132961e-06, 'epoch': 1.42} {'loss': 0.206, 'learning_rate': 4.0993929892584085e-06, 'epoch': 1.42} {'loss': 0.2902, 'learning_rate': 4.099121738044523e-06, 'epoch': 1.42} {'loss': 0.2776, 'learning_rate': 4.0988504934916015e-06, 'epoch': 1.42} {'loss': 0.1933, 'learning_rate': 4.098579255599962e-06, 'epoch': 1.42} {'loss': 0.2755, 'learning_rate': 4.098308024369902e-06, 'epoch': 1.42} {'loss': 0.3109, 'learning_rate': 4.0980367998017274e-06, 'epoch': 1.42} {'loss': 0.5164, 'learning_rate': 4.09776558189575e-06, 'epoch': 1.42} {'loss': 0.3041, 'learning_rate': 4.097494370652271e-06, 'epoch': 1.42} {'loss': 0.3215, 'learning_rate': 4.097223166071601e-06, 'epoch': 1.42} {'loss': 0.4241, 'learning_rate': 4.096951968154039e-06, 'epoch': 1.42} {'loss': 0.3096, 'learning_rate': 4.0966807768999e-06, 'epoch': 1.42} {'loss': 0.2097, 'learning_rate': 4.096409592309484e-06, 'epoch': 1.42} {'loss': 0.3625, 'learning_rate': 4.0961384143831006e-06, 'epoch': 1.42} {'loss': 0.2592, 'learning_rate': 4.095867243121051e-06, 'epoch': 1.42} {'loss': 0.1302, 'learning_rate': 4.095596078523648e-06, 'epoch': 1.42} {'loss': 0.3259, 'learning_rate': 4.09532492059119e-06, 'epoch': 1.42} {'loss': 0.3636, 'learning_rate': 4.095053769323992e-06, 'epoch': 1.42} {'loss': 0.4327, 'learning_rate': 4.0947826247223554e-06, 'epoch': 1.42} {'loss': 0.3645, 'learning_rate': 4.0945114867865835e-06, 'epoch': 1.42} {'loss': 0.3337, 'learning_rate': 4.094240355516987e-06, 'epoch': 1.42} {'loss': 0.3212, 'learning_rate': 4.093969230913868e-06, 'epoch': 1.42} {'loss': 0.2394, 'learning_rate': 4.093698112977536e-06, 'epoch': 1.42} {'loss': 0.3166, 'learning_rate': 4.0934270017082945e-06, 'epoch': 1.42} {'loss': 0.4231, 'learning_rate': 4.093155897106453e-06, 'epoch': 1.42} {'loss': 0.2909, 'learning_rate': 4.0928847991723134e-06, 'epoch': 1.42} {'loss': 0.3621, 'learning_rate': 4.092613707906186e-06, 'epoch': 1.42} {'loss': 0.3067, 'learning_rate': 4.09234262330837e-06, 'epoch': 1.42} {'loss': 0.1932, 'learning_rate': 4.092071545379176e-06, 'epoch': 1.42} {'loss': 0.2573, 'learning_rate': 4.091800474118914e-06, 'epoch': 1.42} {'loss': 0.3219, 'learning_rate': 4.091529409527883e-06, 'epoch': 1.42} {'loss': 0.2198, 'learning_rate': 4.091258351606394e-06, 'epoch': 1.42} {'loss': 0.2531, 'learning_rate': 4.090987300354747e-06, 'epoch': 1.42} {'loss': 0.3411, 'learning_rate': 4.090716255773256e-06, 'epoch': 1.42} {'loss': 0.3884, 'learning_rate': 4.090445217862219e-06, 'epoch': 1.42} {'loss': 0.4288, 'learning_rate': 4.090174186621949e-06, 'epoch': 1.42} {'loss': 0.2837, 'learning_rate': 4.089903162052745e-06, 'epoch': 1.42} {'loss': 0.2744, 'learning_rate': 4.089632144154919e-06, 'epoch': 1.42} {'loss': 0.2819, 'learning_rate': 4.089361132928776e-06, 'epoch': 1.42} {'loss': 0.3664, 'learning_rate': 4.0890901283746166e-06, 'epoch': 1.42} {'loss': 0.3452, 'learning_rate': 4.088819130492752e-06, 'epoch': 1.42} {'loss': 0.2643, 'learning_rate': 4.088548139283486e-06, 'epoch': 1.42} {'loss': 0.3044, 'learning_rate': 4.0882771547471265e-06, 'epoch': 1.42} {'loss': 0.3075, 'learning_rate': 4.0880061768839755e-06, 'epoch': 1.42} {'loss': 0.2952, 'learning_rate': 4.087735205694345e-06, 'epoch': 1.42} {'loss': 0.248, 'learning_rate': 4.087464241178533e-06, 'epoch': 1.42} {'loss': 0.3786, 'learning_rate': 4.087193283336852e-06, 'epoch': 1.42} {'loss': 0.4075, 'learning_rate': 4.086922332169603e-06, 'epoch': 1.42} {'loss': 0.261, 'learning_rate': 4.086651387677099e-06, 'epoch': 1.42} {'loss': 0.2135, 'learning_rate': 4.086380449859635e-06, 'epoch': 1.42} {'loss': 0.2337, 'learning_rate': 4.086109518717528e-06, 'epoch': 1.42} {'loss': 0.4157, 'learning_rate': 4.085838594251079e-06, 'epoch': 1.42} {'loss': 0.2867, 'learning_rate': 4.085567676460589e-06, 'epoch': 1.42} {'loss': 0.3714, 'learning_rate': 4.085296765346373e-06, 'epoch': 1.42} {'loss': 0.3889, 'learning_rate': 4.0850258609087275e-06, 'epoch': 1.42} {'loss': 0.5098, 'learning_rate': 4.084754963147968e-06, 'epoch': 1.42} {'loss': 0.4692, 'learning_rate': 4.084484072064391e-06, 'epoch': 1.42} {'loss': 0.2842, 'learning_rate': 4.08421318765831e-06, 'epoch': 1.42} {'loss': 0.2907, 'learning_rate': 4.0839423099300244e-06, 'epoch': 1.42} {'loss': 0.2559, 'learning_rate': 4.083671438879846e-06, 'epoch': 1.42} {'loss': 0.4915, 'learning_rate': 4.083400574508074e-06, 'epoch': 1.42} {'loss': 0.1772, 'learning_rate': 4.083129716815022e-06, 'epoch': 1.42} {'loss': 0.5213, 'learning_rate': 4.082858865800987e-06, 'epoch': 1.42} {'loss': 0.3736, 'learning_rate': 4.0825880214662825e-06, 'epoch': 1.42} {'loss': 0.1706, 'learning_rate': 4.082317183811212e-06, 'epoch': 1.42} {'loss': 0.3199, 'learning_rate': 4.082046352836075e-06, 'epoch': 1.42} {'loss': 0.3896, 'learning_rate': 4.081775528541188e-06, 'epoch': 1.42} {'loss': 0.2595, 'learning_rate': 4.081504710926846e-06, 'epoch': 1.42} {'loss': 0.324, 'learning_rate': 4.081233899993363e-06, 'epoch': 1.42} {'loss': 0.2329, 'learning_rate': 4.080963095741039e-06, 'epoch': 1.42} {'loss': 0.3089, 'learning_rate': 4.080692298170184e-06, 'epoch': 1.42} {'loss': 0.3431, 'learning_rate': 4.080421507281099e-06, 'epoch': 1.42} {'loss': 0.3815, 'learning_rate': 4.080150723074096e-06, 'epoch': 1.42} {'loss': 0.2329, 'learning_rate': 4.079879945549475e-06, 'epoch': 1.42} {'loss': 0.4084, 'learning_rate': 4.079609174707545e-06, 'epoch': 1.42} {'loss': 0.2503, 'learning_rate': 4.079338410548607e-06, 'epoch': 1.42} {'loss': 0.2292, 'learning_rate': 4.079067653072975e-06, 'epoch': 1.42} {'loss': 0.2326, 'learning_rate': 4.0787969022809505e-06, 'epoch': 1.42} {'loss': 0.1438, 'learning_rate': 4.078526158172833e-06, 'epoch': 1.42} {'loss': 0.438, 'learning_rate': 4.078255420748938e-06, 'epoch': 1.42} {'loss': 0.1831, 'learning_rate': 4.077984690009562e-06, 'epoch': 1.42} {'loss': 0.3223, 'learning_rate': 4.07771396595502e-06, 'epoch': 1.42} {'loss': 0.3961, 'learning_rate': 4.077443248585608e-06, 'epoch': 1.42} {'loss': 0.1605, 'learning_rate': 4.077172537901641e-06, 'epoch': 1.42} {'loss': 0.4291, 'learning_rate': 4.076901833903415e-06, 'epoch': 1.42} {'loss': 0.3396, 'learning_rate': 4.076631136591245e-06, 'epoch': 1.42} {'loss': 0.3624, 'learning_rate': 4.076360445965428e-06, 'epoch': 1.42} {'loss': 0.3124, 'learning_rate': 4.076089762026278e-06, 'epoch': 1.42} {'loss': 0.2038, 'learning_rate': 4.075819084774092e-06, 'epoch': 1.42} {'loss': 0.2868, 'learning_rate': 4.075548414209184e-06, 'epoch': 1.42} {'loss': 0.4438, 'learning_rate': 4.0752777503318545e-06, 'epoch': 1.42} {'loss': 0.3421, 'learning_rate': 4.075007093142407e-06, 'epoch': 1.42} {'loss': 0.3961, 'learning_rate': 4.074736442641151e-06, 'epoch': 1.42} {'loss': 0.3235, 'learning_rate': 4.07446579882839e-06, 'epoch': 1.42} {'loss': 0.1798, 'learning_rate': 4.074195161704433e-06, 'epoch': 1.42} {'loss': 0.2728, 'learning_rate': 4.0739245312695795e-06, 'epoch': 1.42} {'loss': 0.2958, 'learning_rate': 4.073653907524141e-06, 'epoch': 1.42} {'loss': 0.314, 'learning_rate': 4.073383290468418e-06, 'epoch': 1.42} {'loss': 0.4327, 'learning_rate': 4.073112680102721e-06, 'epoch': 1.42} {'loss': 0.4488, 'learning_rate': 4.072842076427349e-06, 'epoch': 1.42} {'loss': 0.386, 'learning_rate': 4.0725714794426155e-06, 'epoch': 1.42} {'loss': 0.3513, 'learning_rate': 4.072300889148817e-06, 'epoch': 1.42} {'loss': 0.3514, 'learning_rate': 4.072030305546267e-06, 'epoch': 1.42} {'loss': 0.3724, 'learning_rate': 4.07175972863527e-06, 'epoch': 1.42} {'loss': 0.3213, 'learning_rate': 4.071489158416123e-06, 'epoch': 1.42} {'loss': 0.177, 'learning_rate': 4.071218594889141e-06, 'epoch': 1.42} {'loss': 0.3135, 'learning_rate': 4.070948038054623e-06, 'epoch': 1.42} {'loss': 0.3535, 'learning_rate': 4.0706774879128805e-06, 'epoch': 1.42} {'loss': 0.2369, 'learning_rate': 4.070406944464213e-06, 'epoch': 1.42} {'loss': 0.2676, 'learning_rate': 4.070136407708931e-06, 'epoch': 1.42} {'loss': 0.3977, 'learning_rate': 4.069865877647334e-06, 'epoch': 1.42} {'loss': 0.3491, 'learning_rate': 4.069595354279734e-06, 'epoch': 1.42} {'loss': 0.3355, 'learning_rate': 4.06932483760643e-06, 'epoch': 1.42} {'loss': 0.2631, 'learning_rate': 4.069054327627734e-06, 'epoch': 1.42} {'loss': 0.3245, 'learning_rate': 4.068783824343945e-06, 'epoch': 1.42} {'loss': 0.3756, 'learning_rate': 4.068513327755374e-06, 'epoch': 1.42} {'loss': 0.4676, 'learning_rate': 4.068242837862323e-06, 'epoch': 1.42} {'loss': 0.2765, 'learning_rate': 4.0679723546650955e-06, 'epoch': 1.42} {'loss': 0.2897, 'learning_rate': 4.067701878164001e-06, 'epoch': 1.42} {'loss': 0.2388, 'learning_rate': 4.067431408359342e-06, 'epoch': 1.42} {'loss': 0.3205, 'learning_rate': 4.067160945251426e-06, 'epoch': 1.42} {'loss': 0.3964, 'learning_rate': 4.066890488840555e-06, 'epoch': 1.42} {'loss': 0.3935, 'learning_rate': 4.0666200391270385e-06, 'epoch': 1.42} {'loss': 0.1432, 'learning_rate': 4.066349596111178e-06, 'epoch': 1.42} {'loss': 0.3345, 'learning_rate': 4.066079159793282e-06, 'epoch': 1.42} {'loss': 0.545, 'learning_rate': 4.065808730173653e-06, 'epoch': 1.42} {'loss': 0.2953, 'learning_rate': 4.065538307252596e-06, 'epoch': 1.42} {'loss': 0.2699, 'learning_rate': 4.065267891030421e-06, 'epoch': 1.42} {'loss': 0.3233, 'learning_rate': 4.064997481507427e-06, 'epoch': 1.42} {'loss': 0.1835, 'learning_rate': 4.064727078683925e-06, 'epoch': 1.42} {'loss': 0.285, 'learning_rate': 4.064456682560216e-06, 'epoch': 1.42} {'loss': 0.3254, 'learning_rate': 4.064186293136608e-06, 'epoch': 1.42} {'loss': 0.3235, 'learning_rate': 4.0639159104134026e-06, 'epoch': 1.42} {'loss': 0.409, 'learning_rate': 4.0636455343909105e-06, 'epoch': 1.42} {'loss': 0.4052, 'learning_rate': 4.063375165069431e-06, 'epoch': 1.42} {'loss': 0.2743, 'learning_rate': 4.063104802449275e-06, 'epoch': 1.42} {'loss': 0.2682, 'learning_rate': 4.062834446530742e-06, 'epoch': 1.42} {'loss': 0.2998, 'learning_rate': 4.062564097314142e-06, 'epoch': 1.42} {'loss': 0.2144, 'learning_rate': 4.062293754799779e-06, 'epoch': 1.42} {'loss': 0.2396, 'learning_rate': 4.062023418987952e-06, 'epoch': 1.42} {'loss': 0.3064, 'learning_rate': 4.061753089878977e-06, 'epoch': 1.42} {'loss': 0.358, 'learning_rate': 4.061482767473149e-06, 'epoch': 1.42} {'loss': 0.4667, 'learning_rate': 4.061212451770782e-06, 'epoch': 1.42} {'loss': 0.4193, 'learning_rate': 4.060942142772173e-06, 'epoch': 1.42} {'loss': 0.2768, 'learning_rate': 4.0606718404776345e-06, 'epoch': 1.42} {'loss': 0.3569, 'learning_rate': 4.060401544887464e-06, 'epoch': 1.42} {'loss': 0.4287, 'learning_rate': 4.0601312560019755e-06, 'epoch': 1.42} {'loss': 0.3724, 'learning_rate': 4.059860973821465e-06, 'epoch': 1.42} {'loss': 0.4489, 'learning_rate': 4.059590698346245e-06, 'epoch': 1.42} {'loss': 0.4402, 'learning_rate': 4.059320429576614e-06, 'epoch': 1.42} {'loss': 0.3487, 'learning_rate': 4.059050167512884e-06, 'epoch': 1.42} {'loss': 0.2753, 'learning_rate': 4.058779912155358e-06, 'epoch': 1.42} {'loss': 0.2254, 'learning_rate': 4.058509663504334e-06, 'epoch': 1.42} {'loss': 0.2783, 'learning_rate': 4.058239421560129e-06, 'epoch': 1.42} {'loss': 0.3397, 'learning_rate': 4.057969186323036e-06, 'epoch': 1.42} {'loss': 0.376, 'learning_rate': 4.0576989577933705e-06, 'epoch': 1.42} {'loss': 0.2578, 'learning_rate': 4.057428735971428e-06, 'epoch': 1.42} {'loss': 0.4211, 'learning_rate': 4.057158520857524e-06, 'epoch': 1.42} {'loss': 0.4259, 'learning_rate': 4.056888312451953e-06, 'epoch': 1.42} {'loss': 0.372, 'learning_rate': 4.056618110755028e-06, 'epoch': 1.42} {'loss': 0.3059, 'learning_rate': 4.056347915767049e-06, 'epoch': 1.42} {'loss': 0.3067, 'learning_rate': 4.056077727488326e-06, 'epoch': 1.42} {'loss': 0.2264, 'learning_rate': 4.055807545919157e-06, 'epoch': 1.42} {'loss': 0.2878, 'learning_rate': 4.055537371059854e-06, 'epoch': 1.42} {'loss': 0.2548, 'learning_rate': 4.055267202910721e-06, 'epoch': 1.42} {'loss': 0.3637, 'learning_rate': 4.054997041472056e-06, 'epoch': 1.42} {'loss': 0.3018, 'learning_rate': 4.054726886744172e-06, 'epoch': 1.42} {'loss': 0.2094, 'learning_rate': 4.054456738727367e-06, 'epoch': 1.42} {'loss': 0.4279, 'learning_rate': 4.054186597421954e-06, 'epoch': 1.42} {'loss': 0.3705, 'learning_rate': 4.0539164628282306e-06, 'epoch': 1.42} {'loss': 0.2098, 'learning_rate': 4.053646334946507e-06, 'epoch': 1.42} {'loss': 0.4142, 'learning_rate': 4.053376213777084e-06, 'epoch': 1.42} {'loss': 0.2344, 'learning_rate': 4.053106099320271e-06, 'epoch': 1.42} {'loss': 0.3715, 'learning_rate': 4.052835991576367e-06, 'epoch': 1.42} {'loss': 0.2242, 'learning_rate': 4.052565890545683e-06, 'epoch': 1.42} {'loss': 0.2525, 'learning_rate': 4.052295796228519e-06, 'epoch': 1.42} {'loss': 0.1666, 'learning_rate': 4.052025708625186e-06, 'epoch': 1.42} {'loss': 0.2873, 'learning_rate': 4.051755627735983e-06, 'epoch': 1.42} {'loss': 0.2519, 'learning_rate': 4.051485553561214e-06, 'epoch': 1.42} {'loss': 0.2505, 'learning_rate': 4.051215486101191e-06, 'epoch': 1.42} {'loss': 0.385, 'learning_rate': 4.05094542535621e-06, 'epoch': 1.42} {'loss': 0.4752, 'learning_rate': 4.050675371326584e-06, 'epoch': 1.42} {'loss': 0.2419, 'learning_rate': 4.05040532401261e-06, 'epoch': 1.42} {'loss': 0.4375, 'learning_rate': 4.050135283414602e-06, 'epoch': 1.42} {'loss': 0.2695, 'learning_rate': 4.049865249532856e-06, 'epoch': 1.42} {'loss': 0.2761, 'learning_rate': 4.0495952223676834e-06, 'epoch': 1.42} {'loss': 0.2739, 'learning_rate': 4.049325201919384e-06, 'epoch': 1.42} {'loss': 0.3133, 'learning_rate': 4.049055188188268e-06, 'epoch': 1.42} {'loss': 0.3244, 'learning_rate': 4.048785181174632e-06, 'epoch': 1.42} {'loss': 0.1756, 'learning_rate': 4.0485151808787915e-06, 'epoch': 1.42} {'loss': 0.2262, 'learning_rate': 4.048245187301044e-06, 'epoch': 1.42} {'loss': 0.3956, 'learning_rate': 4.047975200441694e-06, 'epoch': 1.42} {'loss': 0.2422, 'learning_rate': 4.04770522030105e-06, 'epoch': 1.42} {'loss': 0.3814, 'learning_rate': 4.047435246879413e-06, 'epoch': 1.42} {'loss': 0.3476, 'learning_rate': 4.047165280177092e-06, 'epoch': 1.42} {'loss': 0.3268, 'learning_rate': 4.046895320194386e-06, 'epoch': 1.42} {'loss': 0.3281, 'learning_rate': 4.046625366931607e-06, 'epoch': 1.42} {'loss': 0.3706, 'learning_rate': 4.046355420389053e-06, 'epoch': 1.42} {'loss': 0.3719, 'learning_rate': 4.046085480567034e-06, 'epoch': 1.42} {'loss': 0.2758, 'learning_rate': 4.045815547465849e-06, 'epoch': 1.42} {'loss': 0.3571, 'learning_rate': 4.04554562108581e-06, 'epoch': 1.42} {'loss': 0.2603, 'learning_rate': 4.045275701427214e-06, 'epoch': 1.42} {'loss': 0.3025, 'learning_rate': 4.045005788490372e-06, 'epoch': 1.42} {'loss': 0.343, 'learning_rate': 4.044735882275588e-06, 'epoch': 1.42} {'loss': 0.3678, 'learning_rate': 4.04446598278316e-06, 'epoch': 1.42} {'loss': 0.2025, 'learning_rate': 4.044196090013401e-06, 'epoch': 1.42} {'loss': 0.3015, 'learning_rate': 4.043926203966608e-06, 'epoch': 1.42} {'loss': 0.3258, 'learning_rate': 4.043656324643095e-06, 'epoch': 1.42} {'loss': 0.2598, 'learning_rate': 4.043386452043157e-06, 'epoch': 1.42} {'loss': 0.287, 'learning_rate': 4.043116586167105e-06, 'epoch': 1.42} {'loss': 0.2573, 'learning_rate': 4.042846727015239e-06, 'epoch': 1.42} {'loss': 0.3575, 'learning_rate': 4.04257687458787e-06, 'epoch': 1.42} {'loss': 0.2752, 'learning_rate': 4.042307028885296e-06, 'epoch': 1.42} {'loss': 0.4997, 'learning_rate': 4.042037189907827e-06, 'epoch': 1.42} {'loss': 0.1839, 'learning_rate': 4.041767357655763e-06, 'epoch': 1.42} {'loss': 0.3438, 'learning_rate': 4.041497532129412e-06, 'epoch': 1.42} {'loss': 0.3965, 'learning_rate': 4.041227713329079e-06, 'epoch': 1.42} {'loss': 0.3896, 'learning_rate': 4.0409579012550615e-06, 'epoch': 1.42} {'loss': 0.3624, 'learning_rate': 4.040688095907674e-06, 'epoch': 1.42} {'loss': 0.3487, 'learning_rate': 4.040418297287213e-06, 'epoch': 1.42} {'loss': 0.4527, 'learning_rate': 4.04014850539399e-06, 'epoch': 1.42} {'loss': 0.2642, 'learning_rate': 4.039878720228303e-06, 'epoch': 1.42} {'loss': 0.3953, 'learning_rate': 4.039608941790462e-06, 'epoch': 1.42} {'loss': 0.3392, 'learning_rate': 4.039339170080766e-06, 'epoch': 1.42} {'loss': 0.3464, 'learning_rate': 4.039069405099526e-06, 'epoch': 1.43} {'loss': 0.4186, 'learning_rate': 4.0387996468470405e-06, 'epoch': 1.43} {'loss': 0.3378, 'learning_rate': 4.038529895323615e-06, 'epoch': 1.43} {'loss': 0.1882, 'learning_rate': 4.03826015052956e-06, 'epoch': 1.43} {'loss': 0.2544, 'learning_rate': 4.037990412465172e-06, 'epoch': 1.43} {'loss': 0.3706, 'learning_rate': 4.037720681130763e-06, 'epoch': 1.43} {'loss': 0.287, 'learning_rate': 4.0374509565266295e-06, 'epoch': 1.43} {'loss': 0.3651, 'learning_rate': 4.0371812386530836e-06, 'epoch': 1.43} {'loss': 0.2048, 'learning_rate': 4.036911527510423e-06, 'epoch': 1.43} {'loss': 0.3549, 'learning_rate': 4.036641823098959e-06, 'epoch': 1.43} {'loss': 0.2447, 'learning_rate': 4.036372125418988e-06, 'epoch': 1.43} {'loss': 0.2976, 'learning_rate': 4.036102434470824e-06, 'epoch': 1.43} {'loss': 0.3529, 'learning_rate': 4.035832750254765e-06, 'epoch': 1.43} {'loss': 0.3681, 'learning_rate': 4.035563072771112e-06, 'epoch': 1.43} {'loss': 0.4028, 'learning_rate': 4.03529340202018e-06, 'epoch': 1.43} {'loss': 0.5217, 'learning_rate': 4.035023738002263e-06, 'epoch': 1.43} {'loss': 0.2818, 'learning_rate': 4.034754080717673e-06, 'epoch': 1.43} {'loss': 0.2704, 'learning_rate': 4.0344844301667085e-06, 'epoch': 1.43} {'loss': 0.3574, 'learning_rate': 4.034214786349681e-06, 'epoch': 1.43} {'loss': 0.3609, 'learning_rate': 4.0339451492668855e-06, 'epoch': 1.43} {'loss': 0.3359, 'learning_rate': 4.033675518918635e-06, 'epoch': 1.43} {'loss': 0.3165, 'learning_rate': 4.033405895305227e-06, 'epoch': 1.43} {'loss': 0.4827, 'learning_rate': 4.033136278426973e-06, 'epoch': 1.43} {'loss': 0.181, 'learning_rate': 4.03286666828417e-06, 'epoch': 1.43} {'loss': 0.2991, 'learning_rate': 4.032597064877129e-06, 'epoch': 1.43} {'loss': 0.2332, 'learning_rate': 4.032327468206152e-06, 'epoch': 1.43} {'loss': 0.2117, 'learning_rate': 4.032057878271538e-06, 'epoch': 1.43} {'loss': 0.1722, 'learning_rate': 4.0317882950736e-06, 'epoch': 1.43} {'loss': 0.2553, 'learning_rate': 4.031518718612633e-06, 'epoch': 1.43} {'loss': 0.2915, 'learning_rate': 4.031249148888951e-06, 'epoch': 1.43} {'loss': 0.4238, 'learning_rate': 4.030979585902851e-06, 'epoch': 1.43} {'loss': 0.1928, 'learning_rate': 4.030710029654643e-06, 'epoch': 1.43} {'loss': 0.5095, 'learning_rate': 4.030440480144624e-06, 'epoch': 1.43} {'loss': 0.3235, 'learning_rate': 4.030170937373107e-06, 'epoch': 1.43} {'loss': 0.2513, 'learning_rate': 4.029901401340388e-06, 'epoch': 1.43} {'loss': 0.4164, 'learning_rate': 4.029631872046779e-06, 'epoch': 1.43} {'loss': 0.4096, 'learning_rate': 4.029362349492576e-06, 'epoch': 1.43} {'loss': 0.3977, 'learning_rate': 4.029092833678091e-06, 'epoch': 1.43} {'loss': 0.233, 'learning_rate': 4.028823324603624e-06, 'epoch': 1.43} {'loss': 0.3284, 'learning_rate': 4.028553822269479e-06, 'epoch': 1.43} {'loss': 0.4174, 'learning_rate': 4.028284326675963e-06, 'epoch': 1.43} {'loss': 0.3029, 'learning_rate': 4.028014837823375e-06, 'epoch': 1.43} {'loss': 0.3698, 'learning_rate': 4.027745355712026e-06, 'epoch': 1.43} {'loss': 0.3217, 'learning_rate': 4.027475880342215e-06, 'epoch': 1.43} {'loss': 0.3002, 'learning_rate': 4.027206411714249e-06, 'epoch': 1.43} {'loss': 0.3306, 'learning_rate': 4.026936949828429e-06, 'epoch': 1.43} {'loss': 0.3516, 'learning_rate': 4.026667494685065e-06, 'epoch': 1.43} {'loss': 0.4106, 'learning_rate': 4.026398046284453e-06, 'epoch': 1.43} {'loss': 0.3927, 'learning_rate': 4.026128604626906e-06, 'epoch': 1.43} {'loss': 0.1665, 'learning_rate': 4.02585916971272e-06, 'epoch': 1.43} {'loss': 0.3619, 'learning_rate': 4.025589741542207e-06, 'epoch': 1.43} {'loss': 0.2572, 'learning_rate': 4.0253203201156635e-06, 'epoch': 1.43} {'loss': 0.2328, 'learning_rate': 4.0250509054333996e-06, 'epoch': 1.43} {'loss': 0.3109, 'learning_rate': 4.0247814974957185e-06, 'epoch': 1.43} {'loss': 0.419, 'learning_rate': 4.0245120963029185e-06, 'epoch': 1.43} {'loss': 0.3488, 'learning_rate': 4.024242701855312e-06, 'epoch': 1.43} {'loss': 0.3174, 'learning_rate': 4.0239733141531955e-06, 'epoch': 1.43} {'loss': 0.3483, 'learning_rate': 4.023703933196881e-06, 'epoch': 1.43} {'loss': 0.3513, 'learning_rate': 4.023434558986663e-06, 'epoch': 1.43} {'loss': 0.2969, 'learning_rate': 4.023165191522855e-06, 'epoch': 1.43} {'loss': 0.2875, 'learning_rate': 4.022895830805754e-06, 'epoch': 1.43} {'loss': 0.1351, 'learning_rate': 4.02262647683567e-06, 'epoch': 1.43} {'loss': 0.2494, 'learning_rate': 4.022357129612902e-06, 'epoch': 1.43} {'loss': 0.3509, 'learning_rate': 4.0220877891377585e-06, 'epoch': 1.43} {'loss': 0.2682, 'learning_rate': 4.021818455410538e-06, 'epoch': 1.43} {'loss': 0.2201, 'learning_rate': 4.02154912843155e-06, 'epoch': 1.43} {'loss': 0.2469, 'learning_rate': 4.021279808201097e-06, 'epoch': 1.43} {'loss': 0.2739, 'learning_rate': 4.0210104947194785e-06, 'epoch': 1.43} {'loss': 0.3509, 'learning_rate': 4.020741187987006e-06, 'epoch': 1.43} {'loss': 0.1912, 'learning_rate': 4.020471888003976e-06, 'epoch': 1.43} {'loss': 0.396, 'learning_rate': 4.0202025947707e-06, 'epoch': 1.43} {'loss': 0.0921, 'learning_rate': 4.019933308287475e-06, 'epoch': 1.43} {'loss': 0.2743, 'learning_rate': 4.01966402855461e-06, 'epoch': 1.43} {'loss': 0.2309, 'learning_rate': 4.019394755572404e-06, 'epoch': 1.43} {'loss': 0.3305, 'learning_rate': 4.0191254893411694e-06, 'epoch': 1.43} {'loss': 0.4663, 'learning_rate': 4.0188562298612e-06, 'epoch': 1.43} {'loss': 0.2466, 'learning_rate': 4.018586977132808e-06, 'epoch': 1.43} {'loss': 0.2048, 'learning_rate': 4.0183177311562905e-06, 'epoch': 1.43} {'loss': 0.4531, 'learning_rate': 4.018048491931958e-06, 'epoch': 1.43} {'loss': 0.4383, 'learning_rate': 4.017779259460112e-06, 'epoch': 1.43} {'loss': 0.3084, 'learning_rate': 4.0175100337410525e-06, 'epoch': 1.43} {'loss': 0.3935, 'learning_rate': 4.017240814775089e-06, 'epoch': 1.43} {'loss': 0.1586, 'learning_rate': 4.01697160256252e-06, 'epoch': 1.43} {'loss': 0.4068, 'learning_rate': 4.016702397103654e-06, 'epoch': 1.43} {'loss': 0.3081, 'learning_rate': 4.016433198398791e-06, 'epoch': 1.43} {'loss': 0.2816, 'learning_rate': 4.016164006448242e-06, 'epoch': 1.43} {'loss': 0.3102, 'learning_rate': 4.015894821252301e-06, 'epoch': 1.43} {'loss': 0.2297, 'learning_rate': 4.01562564281128e-06, 'epoch': 1.43} {'loss': 0.3347, 'learning_rate': 4.015356471125478e-06, 'epoch': 1.43} {'loss': 0.3068, 'learning_rate': 4.015087306195202e-06, 'epoch': 1.43} {'loss': 0.4814, 'learning_rate': 4.014818148020752e-06, 'epoch': 1.43} {'loss': 0.3935, 'learning_rate': 4.0145489966024375e-06, 'epoch': 1.43} {'loss': 0.5759, 'learning_rate': 4.014279851940559e-06, 'epoch': 1.43} {'loss': 0.3903, 'learning_rate': 4.014010714035417e-06, 'epoch': 1.43} {'loss': 0.3921, 'learning_rate': 4.013741582887321e-06, 'epoch': 1.43} {'loss': 0.2076, 'learning_rate': 4.01347245849657e-06, 'epoch': 1.43} {'loss': 0.3679, 'learning_rate': 4.013203340863473e-06, 'epoch': 1.43} {'loss': 0.3255, 'learning_rate': 4.012934229988328e-06, 'epoch': 1.43} {'loss': 0.3318, 'learning_rate': 4.0126651258714454e-06, 'epoch': 1.43} {'loss': 0.2526, 'learning_rate': 4.012396028513121e-06, 'epoch': 1.43} {'loss': 0.357, 'learning_rate': 4.012126937913667e-06, 'epoch': 1.43} {'loss': 0.1653, 'learning_rate': 4.01185785407338e-06, 'epoch': 1.43} {'loss': 0.2994, 'learning_rate': 4.011588776992566e-06, 'epoch': 1.43} {'loss': 0.3458, 'learning_rate': 4.011319706671534e-06, 'epoch': 1.43} {'loss': 0.3482, 'learning_rate': 4.011050643110578e-06, 'epoch': 1.43} {'loss': 0.4121, 'learning_rate': 4.010781586310012e-06, 'epoch': 1.43} {'loss': 0.2166, 'learning_rate': 4.01051253627013e-06, 'epoch': 1.43} {'loss': 0.2733, 'learning_rate': 4.0102434929912445e-06, 'epoch': 1.43} {'loss': 0.3541, 'learning_rate': 4.009974456473652e-06, 'epoch': 1.43} {'loss': 0.3026, 'learning_rate': 4.009705426717663e-06, 'epoch': 1.43} {'loss': 0.2153, 'learning_rate': 4.009436403723573e-06, 'epoch': 1.43} {'loss': 0.2149, 'learning_rate': 4.009167387491693e-06, 'epoch': 1.43} {'loss': 0.3907, 'learning_rate': 4.008898378022326e-06, 'epoch': 1.43} {'loss': 0.2703, 'learning_rate': 4.008629375315769e-06, 'epoch': 1.43} {'loss': 0.2584, 'learning_rate': 4.008360379372334e-06, 'epoch': 1.43} {'loss': 0.421, 'learning_rate': 4.0080913901923156e-06, 'epoch': 1.43} {'loss': 0.4998, 'learning_rate': 4.0078224077760275e-06, 'epoch': 1.43} {'loss': 0.3358, 'learning_rate': 4.007553432123765e-06, 'epoch': 1.43} {'loss': 0.3129, 'learning_rate': 4.007284463235838e-06, 'epoch': 1.43} {'loss': 0.313, 'learning_rate': 4.0070155011125446e-06, 'epoch': 1.43} {'loss': 0.3094, 'learning_rate': 4.006746545754195e-06, 'epoch': 1.43} {'loss': 0.4162, 'learning_rate': 4.006477597161083e-06, 'epoch': 1.43} {'loss': 0.3224, 'learning_rate': 4.006208655333523e-06, 'epoch': 1.43} {'loss': 0.2943, 'learning_rate': 4.0059397202718105e-06, 'epoch': 1.43} {'loss': 0.2984, 'learning_rate': 4.005670791976256e-06, 'epoch': 1.43} {'loss': 0.2534, 'learning_rate': 4.005401870447159e-06, 'epoch': 1.43} {'loss': 0.2291, 'learning_rate': 4.0051329556848196e-06, 'epoch': 1.43} {'loss': 0.1673, 'learning_rate': 4.0048640476895485e-06, 'epoch': 1.43} {'loss': 0.4105, 'learning_rate': 4.004595146461642e-06, 'epoch': 1.43} {'loss': 0.3116, 'learning_rate': 4.004326252001412e-06, 'epoch': 1.43} {'loss': 0.3043, 'learning_rate': 4.004057364309153e-06, 'epoch': 1.43} {'loss': 0.2629, 'learning_rate': 4.003788483385177e-06, 'epoch': 1.43} {'loss': 0.2912, 'learning_rate': 4.00351960922978e-06, 'epoch': 1.43} {'loss': 0.358, 'learning_rate': 4.003250741843273e-06, 'epoch': 1.43} {'loss': 0.3189, 'learning_rate': 4.002981881225951e-06, 'epoch': 1.43} {'loss': 0.3352, 'learning_rate': 4.002713027378127e-06, 'epoch': 1.43} {'loss': 0.3167, 'learning_rate': 4.002444180300096e-06, 'epoch': 1.43} {'loss': 0.4106, 'learning_rate': 4.002175339992168e-06, 'epoch': 1.43} {'loss': 0.3035, 'learning_rate': 4.0019065064546435e-06, 'epoch': 1.43} {'loss': 0.3489, 'learning_rate': 4.001637679687822e-06, 'epoch': 1.43} {'loss': 0.3415, 'learning_rate': 4.001368859692015e-06, 'epoch': 1.43} {'loss': 0.2737, 'learning_rate': 4.001100046467517e-06, 'epoch': 1.43} {'loss': 0.1813, 'learning_rate': 4.000831240014642e-06, 'epoch': 1.43} {'loss': 0.2155, 'learning_rate': 4.000562440333683e-06, 'epoch': 1.43} {'loss': 0.3208, 'learning_rate': 4.000293647424952e-06, 'epoch': 1.43} {'loss': 0.2223, 'learning_rate': 4.000024861288745e-06, 'epoch': 1.43} {'loss': 0.3758, 'learning_rate': 3.999756081925372e-06, 'epoch': 1.43} {'loss': 0.4881, 'learning_rate': 3.999487309335132e-06, 'epoch': 1.43} {'loss': 0.3599, 'learning_rate': 3.999218543518331e-06, 'epoch': 1.43} {'loss': 0.1536, 'learning_rate': 3.998949784475268e-06, 'epoch': 1.43} {'loss': 0.3613, 'learning_rate': 3.998681032206253e-06, 'epoch': 1.43} {'loss': 0.2061, 'learning_rate': 3.998412286711587e-06, 'epoch': 1.43} {'loss': 0.4038, 'learning_rate': 3.998143547991568e-06, 'epoch': 1.43} {'loss': 0.2779, 'learning_rate': 3.997874816046507e-06, 'epoch': 1.43} {'loss': 0.3082, 'learning_rate': 3.9976060908767e-06, 'epoch': 1.43} {'loss': 0.2431, 'learning_rate': 3.997337372482459e-06, 'epoch': 1.43} {'loss': 0.3386, 'learning_rate': 3.997068660864078e-06, 'epoch': 1.43} {'loss': 0.3087, 'learning_rate': 3.996799956021869e-06, 'epoch': 1.43} {'loss': 0.3776, 'learning_rate': 3.996531257956129e-06, 'epoch': 1.43} {'loss': 0.2683, 'learning_rate': 3.996262566667165e-06, 'epoch': 1.43} {'loss': 0.3763, 'learning_rate': 3.995993882155277e-06, 'epoch': 1.43} {'loss': 0.2936, 'learning_rate': 3.995725204420773e-06, 'epoch': 1.43} {'loss': 0.3562, 'learning_rate': 3.9954565334639495e-06, 'epoch': 1.43} {'loss': 0.4384, 'learning_rate': 3.9951878692851175e-06, 'epoch': 1.43} {'loss': 0.5096, 'learning_rate': 3.994919211884577e-06, 'epoch': 1.43} {'loss': 0.3648, 'learning_rate': 3.994650561262627e-06, 'epoch': 1.43} {'loss': 0.3142, 'learning_rate': 3.994381917419578e-06, 'epoch': 1.43} {'loss': 0.2002, 'learning_rate': 3.994113280355727e-06, 'epoch': 1.43} {'loss': 0.2292, 'learning_rate': 3.9938446500713835e-06, 'epoch': 1.43} {'loss': 0.2691, 'learning_rate': 3.993576026566843e-06, 'epoch': 1.43} {'loss': 0.1637, 'learning_rate': 3.993307409842416e-06, 'epoch': 1.43} {'loss': 0.1706, 'learning_rate': 3.993038799898401e-06, 'epoch': 1.43} {'loss': 0.3868, 'learning_rate': 3.992770196735105e-06, 'epoch': 1.43} {'loss': 0.318, 'learning_rate': 3.992501600352826e-06, 'epoch': 1.43} {'loss': 0.3622, 'learning_rate': 3.992233010751874e-06, 'epoch': 1.43} {'loss': 0.2736, 'learning_rate': 3.991964427932544e-06, 'epoch': 1.43} {'loss': 0.4063, 'learning_rate': 3.991695851895148e-06, 'epoch': 1.43} {'loss': 0.3367, 'learning_rate': 3.991427282639986e-06, 'epoch': 1.43} {'loss': 0.4019, 'learning_rate': 3.991158720167355e-06, 'epoch': 1.43} {'loss': 0.4256, 'learning_rate': 3.990890164477567e-06, 'epoch': 1.43} {'loss': 0.2899, 'learning_rate': 3.990621615570918e-06, 'epoch': 1.43} {'loss': 0.3713, 'learning_rate': 3.990353073447717e-06, 'epoch': 1.43} {'loss': 0.3641, 'learning_rate': 3.990084538108262e-06, 'epoch': 1.43} {'loss': 0.365, 'learning_rate': 3.989816009552863e-06, 'epoch': 1.43} {'loss': 0.2059, 'learning_rate': 3.9895474877818145e-06, 'epoch': 1.43} {'loss': 0.2127, 'learning_rate': 3.989278972795427e-06, 'epoch': 1.43} {'loss': 0.285, 'learning_rate': 3.989010464593997e-06, 'epoch': 1.43} {'loss': 0.4129, 'learning_rate': 3.988741963177836e-06, 'epoch': 1.43} {'loss': 0.4371, 'learning_rate': 3.988473468547237e-06, 'epoch': 1.43} {'loss': 0.432, 'learning_rate': 3.988204980702512e-06, 'epoch': 1.43} {'loss': 0.4667, 'learning_rate': 3.987936499643962e-06, 'epoch': 1.43} {'loss': 0.3625, 'learning_rate': 3.987668025371883e-06, 'epoch': 1.43} {'loss': 0.2033, 'learning_rate': 3.987399557886589e-06, 'epoch': 1.43} {'loss': 0.3442, 'learning_rate': 3.9871310971883725e-06, 'epoch': 1.43} {'loss': 0.3151, 'learning_rate': 3.986862643277546e-06, 'epoch': 1.43} {'loss': 0.49, 'learning_rate': 3.986594196154404e-06, 'epoch': 1.43} {'loss': 0.2851, 'learning_rate': 3.986325755819257e-06, 'epoch': 1.43} {'loss': 0.3362, 'learning_rate': 3.986057322272402e-06, 'epoch': 1.43} {'loss': 0.3095, 'learning_rate': 3.985788895514147e-06, 'epoch': 1.43} {'loss': 0.3188, 'learning_rate': 3.9855204755447905e-06, 'epoch': 1.43} {'loss': 0.325, 'learning_rate': 3.985252062364637e-06, 'epoch': 1.43} {'loss': 0.3946, 'learning_rate': 3.984983655973994e-06, 'epoch': 1.43} {'loss': 0.285, 'learning_rate': 3.984715256373157e-06, 'epoch': 1.43} {'loss': 0.425, 'learning_rate': 3.9844468635624356e-06, 'epoch': 1.43} {'loss': 0.2649, 'learning_rate': 3.984178477542127e-06, 'epoch': 1.43} {'loss': 0.2902, 'learning_rate': 3.98391009831254e-06, 'epoch': 1.43} {'loss': 0.3321, 'learning_rate': 3.983641725873971e-06, 'epoch': 1.43} {'loss': 0.404, 'learning_rate': 3.98337336022673e-06, 'epoch': 1.43} {'loss': 0.3911, 'learning_rate': 3.983105001371113e-06, 'epoch': 1.43} {'loss': 0.1888, 'learning_rate': 3.98283664930743e-06, 'epoch': 1.43} {'loss': 0.3969, 'learning_rate': 3.982568304035976e-06, 'epoch': 1.43} {'loss': 0.3381, 'learning_rate': 3.982299965557063e-06, 'epoch': 1.43} {'loss': 0.3559, 'learning_rate': 3.982031633870987e-06, 'epoch': 1.43} {'loss': 0.3408, 'learning_rate': 3.98176330897805e-06, 'epoch': 1.43} {'loss': 0.3225, 'learning_rate': 3.981494990878563e-06, 'epoch': 1.43} {'loss': 0.3067, 'learning_rate': 3.981226679572818e-06, 'epoch': 1.43} {'loss': 0.5571, 'learning_rate': 3.980958375061128e-06, 'epoch': 1.43} {'loss': 0.476, 'learning_rate': 3.980690077343789e-06, 'epoch': 1.43} {'loss': 0.2919, 'learning_rate': 3.9804217864211084e-06, 'epoch': 1.43} {'loss': 0.3318, 'learning_rate': 3.980153502293383e-06, 'epoch': 1.43} {'loss': 0.2449, 'learning_rate': 3.9798852249609246e-06, 'epoch': 1.43} {'loss': 0.3141, 'learning_rate': 3.979616954424026e-06, 'epoch': 1.43} {'loss': 0.3606, 'learning_rate': 3.9793486906829995e-06, 'epoch': 1.43} {'loss': 0.1565, 'learning_rate': 3.9790804337381395e-06, 'epoch': 1.43} {'loss': 0.3457, 'learning_rate': 3.978812183589757e-06, 'epoch': 1.43} {'loss': 0.2554, 'learning_rate': 3.97854394023815e-06, 'epoch': 1.43} {'loss': 0.261, 'learning_rate': 3.978275703683618e-06, 'epoch': 1.43} {'loss': 0.3163, 'learning_rate': 3.978007473926472e-06, 'epoch': 1.43} {'loss': 0.2151, 'learning_rate': 3.977739250967007e-06, 'epoch': 1.43} {'loss': 0.5014, 'learning_rate': 3.977471034805531e-06, 'epoch': 1.43} {'loss': 0.336, 'learning_rate': 3.977202825442342e-06, 'epoch': 1.43} {'loss': 0.3654, 'learning_rate': 3.97693462287775e-06, 'epoch': 1.43} {'loss': 0.3148, 'learning_rate': 3.9766664271120504e-06, 'epoch': 1.43} {'loss': 0.3198, 'learning_rate': 3.976398238145553e-06, 'epoch': 1.43} {'loss': 0.4242, 'learning_rate': 3.976130055978551e-06, 'epoch': 1.43} {'loss': 0.364, 'learning_rate': 3.975861880611357e-06, 'epoch': 1.43} {'loss': 0.2964, 'learning_rate': 3.975593712044266e-06, 'epoch': 1.43} {'loss': 0.5037, 'learning_rate': 3.9753255502775875e-06, 'epoch': 1.43} {'loss': 0.3724, 'learning_rate': 3.975057395311621e-06, 'epoch': 1.43} {'loss': 0.2976, 'learning_rate': 3.9747892471466656e-06, 'epoch': 1.43} {'loss': 0.2137, 'learning_rate': 3.974521105783032e-06, 'epoch': 1.43} {'loss': 0.4088, 'learning_rate': 3.974252971221012e-06, 'epoch': 1.43} {'loss': 0.3931, 'learning_rate': 3.9739848434609195e-06, 'epoch': 1.43} {'loss': 0.2019, 'learning_rate': 3.9737167225030495e-06, 'epoch': 1.43} {'loss': 0.32, 'learning_rate': 3.97344860834771e-06, 'epoch': 1.43} {'loss': 0.4151, 'learning_rate': 3.973180500995197e-06, 'epoch': 1.43} {'loss': 0.3614, 'learning_rate': 3.972912400445822e-06, 'epoch': 1.43} {'loss': 0.4245, 'learning_rate': 3.972644306699879e-06, 'epoch': 1.43} {'loss': 0.2552, 'learning_rate': 3.972376219757677e-06, 'epoch': 1.43} {'loss': 0.4058, 'learning_rate': 3.972108139619513e-06, 'epoch': 1.43} {'loss': 0.3607, 'learning_rate': 3.971840066285696e-06, 'epoch': 1.43} {'loss': 0.3172, 'learning_rate': 3.971571999756526e-06, 'epoch': 1.43} {'loss': 0.3384, 'learning_rate': 3.971303940032301e-06, 'epoch': 1.43} {'loss': 0.4042, 'learning_rate': 3.9710358871133305e-06, 'epoch': 1.43} {'loss': 0.266, 'learning_rate': 3.970767840999911e-06, 'epoch': 1.43} {'loss': 0.3354, 'learning_rate': 3.970499801692351e-06, 'epoch': 1.43} {'loss': 0.1933, 'learning_rate': 3.9702317691909475e-06, 'epoch': 1.43} {'loss': 0.4533, 'learning_rate': 3.9699637434960085e-06, 'epoch': 1.43} {'loss': 0.3277, 'learning_rate': 3.9696957246078305e-06, 'epoch': 1.43} {'loss': 0.338, 'learning_rate': 3.969427712526723e-06, 'epoch': 1.43} {'loss': 0.2255, 'learning_rate': 3.9691597072529805e-06, 'epoch': 1.43} {'loss': 0.3929, 'learning_rate': 3.968891708786915e-06, 'epoch': 1.43} {'loss': 0.2429, 'learning_rate': 3.968623717128819e-06, 'epoch': 1.43} {'loss': 0.3517, 'learning_rate': 3.968355732279004e-06, 'epoch': 1.43} {'loss': 0.417, 'learning_rate': 3.9680877542377685e-06, 'epoch': 1.43} {'loss': 0.3089, 'learning_rate': 3.967819783005411e-06, 'epoch': 1.43} {'loss': 0.2227, 'learning_rate': 3.967551818582241e-06, 'epoch': 1.43} {'loss': 0.2738, 'learning_rate': 3.967283860968556e-06, 'epoch': 1.43} {'loss': 0.3367, 'learning_rate': 3.967015910164663e-06, 'epoch': 1.43} {'loss': 0.3574, 'learning_rate': 3.966747966170858e-06, 'epoch': 1.43} {'loss': 0.2825, 'learning_rate': 3.966480028987451e-06, 'epoch': 1.43} {'loss': 0.2288, 'learning_rate': 3.9662120986147366e-06, 'epoch': 1.43} {'loss': 0.4918, 'learning_rate': 3.965944175053026e-06, 'epoch': 1.43} {'loss': 0.1827, 'learning_rate': 3.965676258302613e-06, 'epoch': 1.43} {'loss': 0.2977, 'learning_rate': 3.965408348363807e-06, 'epoch': 1.43} {'loss': 0.5842, 'learning_rate': 3.9651404452369045e-06, 'epoch': 1.43} {'loss': 0.2849, 'learning_rate': 3.964872548922214e-06, 'epoch': 1.43} {'loss': 0.3169, 'learning_rate': 3.9646046594200345e-06, 'epoch': 1.43} {'loss': 0.3969, 'learning_rate': 3.964336776730667e-06, 'epoch': 1.43} {'loss': 0.3059, 'learning_rate': 3.9640689008544175e-06, 'epoch': 1.43} {'loss': 0.2817, 'learning_rate': 3.963801031791583e-06, 'epoch': 1.43} {'loss': 0.3408, 'learning_rate': 3.963533169542473e-06, 'epoch': 1.43} {'loss': 0.3373, 'learning_rate': 3.963265314107382e-06, 'epoch': 1.43} {'loss': 0.2368, 'learning_rate': 3.962997465486621e-06, 'epoch': 1.43} {'loss': 0.3287, 'learning_rate': 3.962729623680483e-06, 'epoch': 1.43} {'loss': 0.2539, 'learning_rate': 3.96246178868928e-06, 'epoch': 1.43} {'loss': 0.2533, 'learning_rate': 3.962193960513306e-06, 'epoch': 1.43} {'loss': 0.3055, 'learning_rate': 3.961926139152871e-06, 'epoch': 1.43} {'loss': 0.2827, 'learning_rate': 3.9616583246082685e-06, 'epoch': 1.43} {'loss': 0.3389, 'learning_rate': 3.961390516879809e-06, 'epoch': 1.43} {'loss': 0.5024, 'learning_rate': 3.9611227159677915e-06, 'epoch': 1.43} {'loss': 0.2462, 'learning_rate': 3.960854921872514e-06, 'epoch': 1.43} {'loss': 0.3076, 'learning_rate': 3.9605871345942884e-06, 'epoch': 1.43} {'loss': 0.3495, 'learning_rate': 3.9603193541334065e-06, 'epoch': 1.43} {'loss': 0.3531, 'learning_rate': 3.9600515804901785e-06, 'epoch': 1.43} {'loss': 0.4653, 'learning_rate': 3.959783813664902e-06, 'epoch': 1.43} {'loss': 0.3742, 'learning_rate': 3.9595160536578825e-06, 'epoch': 1.43} {'loss': 0.3988, 'learning_rate': 3.9592483004694185e-06, 'epoch': 1.43} {'loss': 0.3142, 'learning_rate': 3.958980554099817e-06, 'epoch': 1.43} {'loss': 0.3375, 'learning_rate': 3.958712814549376e-06, 'epoch': 1.43} {'loss': 0.3841, 'learning_rate': 3.958445081818397e-06, 'epoch': 1.43} {'loss': 0.1009, 'learning_rate': 3.95817735590719e-06, 'epoch': 1.43} {'loss': 0.3572, 'learning_rate': 3.957909636816047e-06, 'epoch': 1.43} {'loss': 0.3723, 'learning_rate': 3.95764192454528e-06, 'epoch': 1.43} {'loss': 0.1987, 'learning_rate': 3.957374219095182e-06, 'epoch': 1.43} {'loss': 0.3294, 'learning_rate': 3.957106520466063e-06, 'epoch': 1.43} {'loss': 0.3646, 'learning_rate': 3.956838828658218e-06, 'epoch': 1.43} {'loss': 0.4517, 'learning_rate': 3.956571143671957e-06, 'epoch': 1.43} {'loss': 0.3338, 'learning_rate': 3.956303465507574e-06, 'epoch': 1.43} {'loss': 0.5105, 'learning_rate': 3.956035794165378e-06, 'epoch': 1.43} {'loss': 0.4267, 'learning_rate': 3.95576812964567e-06, 'epoch': 1.43} {'loss': 0.2118, 'learning_rate': 3.955500471948746e-06, 'epoch': 1.43} {'loss': 0.3355, 'learning_rate': 3.955232821074914e-06, 'epoch': 1.43} {'loss': 0.1748, 'learning_rate': 3.954965177024475e-06, 'epoch': 1.43} {'loss': 0.3054, 'learning_rate': 3.9546975397977315e-06, 'epoch': 1.43} {'loss': 0.1978, 'learning_rate': 3.954429909394982e-06, 'epoch': 1.43} {'loss': 0.3636, 'learning_rate': 3.954162285816535e-06, 'epoch': 1.43} {'loss': 0.3049, 'learning_rate': 3.953894669062687e-06, 'epoch': 1.43} {'loss': 0.3456, 'learning_rate': 3.9536270591337445e-06, 'epoch': 1.43} {'loss': 0.1361, 'learning_rate': 3.953359456030004e-06, 'epoch': 1.43} {'loss': 0.2675, 'learning_rate': 3.953091859751773e-06, 'epoch': 1.43} {'loss': 0.2389, 'learning_rate': 3.952824270299349e-06, 'epoch': 1.43} {'loss': 0.2108, 'learning_rate': 3.952556687673041e-06, 'epoch': 1.43} {'loss': 0.2676, 'learning_rate': 3.9522891118731455e-06, 'epoch': 1.43} {'loss': 0.3715, 'learning_rate': 3.952021542899962e-06, 'epoch': 1.43} {'loss': 0.1803, 'learning_rate': 3.9517539807537995e-06, 'epoch': 1.43} {'loss': 0.4061, 'learning_rate': 3.9514864254349535e-06, 'epoch': 1.43} {'loss': 0.265, 'learning_rate': 3.951218876943732e-06, 'epoch': 1.43} {'loss': 0.2329, 'learning_rate': 3.9509513352804316e-06, 'epoch': 1.43} {'loss': 0.3287, 'learning_rate': 3.95068380044536e-06, 'epoch': 1.43} {'loss': 0.3839, 'learning_rate': 3.950416272438813e-06, 'epoch': 1.43} {'loss': 0.2076, 'learning_rate': 3.950148751261098e-06, 'epoch': 1.43} {'loss': 0.1922, 'learning_rate': 3.949881236912511e-06, 'epoch': 1.43} {'loss': 0.2369, 'learning_rate': 3.949613729393363e-06, 'epoch': 1.43} {'loss': 0.3829, 'learning_rate': 3.949346228703946e-06, 'epoch': 1.43} {'loss': 0.2691, 'learning_rate': 3.94907873484457e-06, 'epoch': 1.43} {'loss': 0.2382, 'learning_rate': 3.948811247815529e-06, 'epoch': 1.43} {'loss': 0.2799, 'learning_rate': 3.948543767617134e-06, 'epoch': 1.43} {'loss': 0.384, 'learning_rate': 3.948276294249683e-06, 'epoch': 1.43} {'loss': 0.2471, 'learning_rate': 3.948008827713473e-06, 'epoch': 1.43} {'loss': 0.2964, 'learning_rate': 3.947741368008814e-06, 'epoch': 1.43} {'loss': 0.2954, 'learning_rate': 3.947473915136e-06, 'epoch': 1.43} {'loss': 0.3133, 'learning_rate': 3.94720646909534e-06, 'epoch': 1.43} {'loss': 0.2743, 'learning_rate': 3.946939029887131e-06, 'epoch': 1.43} {'loss': 0.3294, 'learning_rate': 3.94667159751168e-06, 'epoch': 1.43} {'loss': 0.3529, 'learning_rate': 3.946404171969281e-06, 'epoch': 1.43} {'loss': 0.4093, 'learning_rate': 3.946136753260245e-06, 'epoch': 1.43} {'loss': 0.2411, 'learning_rate': 3.945869341384866e-06, 'epoch': 1.43} {'loss': 0.3113, 'learning_rate': 3.945601936343452e-06, 'epoch': 1.43} {'loss': 0.4131, 'learning_rate': 3.945334538136299e-06, 'epoch': 1.43} {'loss': 0.4134, 'learning_rate': 3.945067146763716e-06, 'epoch': 1.43} {'loss': 0.5471, 'learning_rate': 3.944799762226001e-06, 'epoch': 1.43} {'loss': 0.2957, 'learning_rate': 3.944532384523451e-06, 'epoch': 1.43} {'loss': 0.3095, 'learning_rate': 3.944265013656376e-06, 'epoch': 1.43} {'loss': 0.377, 'learning_rate': 3.943997649625071e-06, 'epoch': 1.43} {'loss': 0.3944, 'learning_rate': 3.943730292429844e-06, 'epoch': 1.43} {'loss': 0.3042, 'learning_rate': 3.943462942070992e-06, 'epoch': 1.43} {'loss': 0.2879, 'learning_rate': 3.94319559854882e-06, 'epoch': 1.43} {'loss': 0.4835, 'learning_rate': 3.942928261863627e-06, 'epoch': 1.43} {'loss': 0.349, 'learning_rate': 3.942660932015718e-06, 'epoch': 1.43} {'loss': 0.3298, 'learning_rate': 3.94239360900539e-06, 'epoch': 1.43} {'loss': 0.3706, 'learning_rate': 3.942126292832952e-06, 'epoch': 1.43} {'loss': 0.4469, 'learning_rate': 3.941858983498696e-06, 'epoch': 1.43} {'loss': 0.3442, 'learning_rate': 3.941591681002935e-06, 'epoch': 1.43} {'loss': 0.2473, 'learning_rate': 3.9413243853459635e-06, 'epoch': 1.43} {'loss': 0.2527, 'learning_rate': 3.941057096528082e-06, 'epoch': 1.43} {'loss': 0.228, 'learning_rate': 3.940789814549598e-06, 'epoch': 1.43} {'loss': 0.4998, 'learning_rate': 3.940522539410807e-06, 'epoch': 1.43} {'loss': 0.2505, 'learning_rate': 3.940255271112017e-06, 'epoch': 1.43} {'loss': 0.4139, 'learning_rate': 3.939988009653523e-06, 'epoch': 1.43} {'loss': 0.2344, 'learning_rate': 3.939720755035633e-06, 'epoch': 1.43} {'loss': 0.2061, 'learning_rate': 3.9394535072586425e-06, 'epoch': 1.43} {'loss': 0.2578, 'learning_rate': 3.9391862663228604e-06, 'epoch': 1.43} {'loss': 0.3515, 'learning_rate': 3.938919032228582e-06, 'epoch': 1.43} {'loss': 0.2756, 'learning_rate': 3.938651804976113e-06, 'epoch': 1.43} {'loss': 0.342, 'learning_rate': 3.9383845845657505e-06, 'epoch': 1.43} {'loss': 0.2163, 'learning_rate': 3.938117370997804e-06, 'epoch': 1.43} {'loss': 0.3595, 'learning_rate': 3.937850164272569e-06, 'epoch': 1.43} {'loss': 0.1998, 'learning_rate': 3.937582964390345e-06, 'epoch': 1.43} {'loss': 0.3567, 'learning_rate': 3.937315771351441e-06, 'epoch': 1.43} {'loss': 0.2086, 'learning_rate': 3.9370485851561515e-06, 'epoch': 1.43} {'loss': 0.2823, 'learning_rate': 3.936781405804784e-06, 'epoch': 1.43} {'loss': 0.4867, 'learning_rate': 3.936514233297634e-06, 'epoch': 1.43} {'loss': 0.1836, 'learning_rate': 3.93624706763501e-06, 'epoch': 1.43} {'loss': 0.2994, 'learning_rate': 3.935979908817206e-06, 'epoch': 1.43} {'loss': 0.3315, 'learning_rate': 3.935712756844531e-06, 'epoch': 1.43} {'loss': 0.2241, 'learning_rate': 3.93544561171728e-06, 'epoch': 1.43} {'loss': 0.3817, 'learning_rate': 3.935178473435761e-06, 'epoch': 1.43} {'loss': 0.3737, 'learning_rate': 3.9349113420002694e-06, 'epoch': 1.43} {'loss': 0.24, 'learning_rate': 3.934644217411112e-06, 'epoch': 1.43} {'loss': 0.4463, 'learning_rate': 3.934377099668589e-06, 'epoch': 1.43} {'loss': 0.3901, 'learning_rate': 3.934109988772996e-06, 'epoch': 1.43} {'loss': 0.2871, 'learning_rate': 3.933842884724645e-06, 'epoch': 1.43} {'loss': 0.2943, 'learning_rate': 3.933575787523827e-06, 'epoch': 1.43} {'loss': 0.371, 'learning_rate': 3.933308697170851e-06, 'epoch': 1.43} {'loss': 0.2631, 'learning_rate': 3.933041613666013e-06, 'epoch': 1.43} {'loss': 0.3146, 'learning_rate': 3.932774537009622e-06, 'epoch': 1.43} {'loss': 0.3668, 'learning_rate': 3.932507467201969e-06, 'epoch': 1.43} {'loss': 0.2092, 'learning_rate': 3.9322404042433626e-06, 'epoch': 1.43} {'loss': 0.3429, 'learning_rate': 3.9319733481341074e-06, 'epoch': 1.43} {'loss': 0.149, 'learning_rate': 3.931706298874496e-06, 'epoch': 1.43} {'loss': 0.2869, 'learning_rate': 3.9314392564648376e-06, 'epoch': 1.43} {'loss': 0.291, 'learning_rate': 3.931172220905426e-06, 'epoch': 1.43} {'loss': 0.3944, 'learning_rate': 3.930905192196571e-06, 'epoch': 1.43} {'loss': 0.3663, 'learning_rate': 3.930638170338568e-06, 'epoch': 1.43} {'loss': 0.2933, 'learning_rate': 3.930371155331723e-06, 'epoch': 1.43} {'loss': 0.2453, 'learning_rate': 3.93010414717633e-06, 'epoch': 1.43} {'loss': 0.4372, 'learning_rate': 3.929837145872699e-06, 'epoch': 1.43} {'loss': 0.1882, 'learning_rate': 3.929570151421125e-06, 'epoch': 1.43} {'loss': 0.3888, 'learning_rate': 3.9293031638219146e-06, 'epoch': 1.43} {'loss': 0.3674, 'learning_rate': 3.929036183075368e-06, 'epoch': 1.43} {'loss': 0.323, 'learning_rate': 3.928769209181781e-06, 'epoch': 1.43} {'loss': 0.3206, 'learning_rate': 3.928502242141462e-06, 'epoch': 1.43} {'loss': 0.2386, 'learning_rate': 3.9282352819547056e-06, 'epoch': 1.43} {'loss': 0.4055, 'learning_rate': 3.92796832862182e-06, 'epoch': 1.43} {'loss': 0.3456, 'learning_rate': 3.927701382143102e-06, 'epoch': 1.43} {'loss': 0.2537, 'learning_rate': 3.927434442518857e-06, 'epoch': 1.43} {'loss': 0.2719, 'learning_rate': 3.92716750974938e-06, 'epoch': 1.43} {'loss': 0.2416, 'learning_rate': 3.926900583834979e-06, 'epoch': 1.43} {'loss': 0.3309, 'learning_rate': 3.926633664775951e-06, 'epoch': 1.43} {'loss': 0.2854, 'learning_rate': 3.9263667525726e-06, 'epoch': 1.43} {'loss': 0.3387, 'learning_rate': 3.926099847225223e-06, 'epoch': 1.43} {'loss': 0.2998, 'learning_rate': 3.925832948734129e-06, 'epoch': 1.43} {'loss': 0.2456, 'learning_rate': 3.925566057099614e-06, 'epoch': 1.43} {'loss': 0.3615, 'learning_rate': 3.925299172321976e-06, 'epoch': 1.43} {'loss': 0.3046, 'learning_rate': 3.9250322944015226e-06, 'epoch': 1.43} {'loss': 0.2981, 'learning_rate': 3.92476542333855e-06, 'epoch': 1.43} {'loss': 0.3403, 'learning_rate': 3.924498559133365e-06, 'epoch': 1.43} {'loss': 0.4714, 'learning_rate': 3.924231701786263e-06, 'epoch': 1.43} {'loss': 0.2941, 'learning_rate': 3.923964851297551e-06, 'epoch': 1.43} {'loss': 0.3115, 'learning_rate': 3.923698007667525e-06, 'epoch': 1.43} {'loss': 0.3391, 'learning_rate': 3.923431170896491e-06, 'epoch': 1.43} {'loss': 0.286, 'learning_rate': 3.923164340984744e-06, 'epoch': 1.43} {'loss': 0.2953, 'learning_rate': 3.922897517932592e-06, 'epoch': 1.43} {'loss': 0.2141, 'learning_rate': 3.922630701740331e-06, 'epoch': 1.43} {'loss': 0.2344, 'learning_rate': 3.922363892408267e-06, 'epoch': 1.43} {'loss': 0.3661, 'learning_rate': 3.922097089936698e-06, 'epoch': 1.43} {'loss': 0.373, 'learning_rate': 3.921830294325923e-06, 'epoch': 1.43} {'loss': 0.2555, 'learning_rate': 3.921563505576249e-06, 'epoch': 1.43} {'loss': 0.3078, 'learning_rate': 3.9212967236879704e-06, 'epoch': 1.43} {'loss': 0.2025, 'learning_rate': 3.921029948661395e-06, 'epoch': 1.43} {'loss': 0.3029, 'learning_rate': 3.9207631804968175e-06, 'epoch': 1.43} {'loss': 0.2249, 'learning_rate': 3.920496419194546e-06, 'epoch': 1.43} {'loss': 0.3995, 'learning_rate': 3.920229664754874e-06, 'epoch': 1.43} {'loss': 0.402, 'learning_rate': 3.9199629171781105e-06, 'epoch': 1.43} {'loss': 0.3344, 'learning_rate': 3.919696176464549e-06, 'epoch': 1.43} {'loss': 0.3927, 'learning_rate': 3.919429442614499e-06, 'epoch': 1.43} {'loss': 0.5279, 'learning_rate': 3.919162715628252e-06, 'epoch': 1.43} {'loss': 0.2732, 'learning_rate': 3.918895995506118e-06, 'epoch': 1.43} {'loss': 0.279, 'learning_rate': 3.918629282248394e-06, 'epoch': 1.43} {'loss': 0.3643, 'learning_rate': 3.918362575855377e-06, 'epoch': 1.43} {'loss': 0.381, 'learning_rate': 3.918095876327377e-06, 'epoch': 1.43} {'loss': 0.2588, 'learning_rate': 3.917829183664685e-06, 'epoch': 1.43} {'loss': 0.25, 'learning_rate': 3.917562497867612e-06, 'epoch': 1.43} {'loss': 0.3958, 'learning_rate': 3.9172958189364504e-06, 'epoch': 1.43} {'loss': 0.309, 'learning_rate': 3.917029146871509e-06, 'epoch': 1.43} {'loss': 0.383, 'learning_rate': 3.916762481673081e-06, 'epoch': 1.43} {'loss': 0.315, 'learning_rate': 3.916495823341475e-06, 'epoch': 1.43} {'loss': 0.2155, 'learning_rate': 3.916229171876985e-06, 'epoch': 1.43} {'loss': 0.2093, 'learning_rate': 3.9159625272799185e-06, 'epoch': 1.43} {'loss': 0.3143, 'learning_rate': 3.91569588955057e-06, 'epoch': 1.43} {'loss': 0.2982, 'learning_rate': 3.915429258689248e-06, 'epoch': 1.43} {'loss': 0.2139, 'learning_rate': 3.915162634696249e-06, 'epoch': 1.43} {'loss': 0.3752, 'learning_rate': 3.914896017571871e-06, 'epoch': 1.43} {'loss': 0.2636, 'learning_rate': 3.914629407316421e-06, 'epoch': 1.43} {'loss': 0.3197, 'learning_rate': 3.914362803930194e-06, 'epoch': 1.43} {'loss': 0.1612, 'learning_rate': 3.9140962074134984e-06, 'epoch': 1.43} {'loss': 0.3656, 'learning_rate': 3.9138296177666265e-06, 'epoch': 1.43} {'loss': 0.2516, 'learning_rate': 3.913563034989888e-06, 'epoch': 1.43} {'loss': 0.2295, 'learning_rate': 3.913296459083575e-06, 'epoch': 1.43} {'loss': 0.2536, 'learning_rate': 3.9130298900479966e-06, 'epoch': 1.43} {'loss': 0.1928, 'learning_rate': 3.9127633278834466e-06, 'epoch': 1.43} {'loss': 0.2639, 'learning_rate': 3.912496772590233e-06, 'epoch': 1.43} {'loss': 0.3014, 'learning_rate': 3.912230224168649e-06, 'epoch': 1.43} {'loss': 0.3078, 'learning_rate': 3.911963682619003e-06, 'epoch': 1.43} {'loss': 0.1645, 'learning_rate': 3.911697147941593e-06, 'epoch': 1.43} {'loss': 0.2432, 'learning_rate': 3.9114306201367146e-06, 'epoch': 1.43} {'loss': 0.2755, 'learning_rate': 3.911164099204677e-06, 'epoch': 1.43} {'loss': 0.2897, 'learning_rate': 3.910897585145775e-06, 'epoch': 1.43} {'loss': 0.3112, 'learning_rate': 3.910631077960314e-06, 'epoch': 1.43} {'loss': 0.1946, 'learning_rate': 3.91036457764859e-06, 'epoch': 1.43} {'loss': 0.2605, 'learning_rate': 3.910098084210909e-06, 'epoch': 1.43} {'loss': 0.1886, 'learning_rate': 3.9098315976475656e-06, 'epoch': 1.43} {'loss': 0.2805, 'learning_rate': 3.909565117958868e-06, 'epoch': 1.44} {'loss': 0.5392, 'learning_rate': 3.9092986451451095e-06, 'epoch': 1.44} {'loss': 0.2907, 'learning_rate': 3.909032179206599e-06, 'epoch': 1.44} {'loss': 0.2749, 'learning_rate': 3.908765720143629e-06, 'epoch': 1.44} {'loss': 0.3191, 'learning_rate': 3.9084992679565085e-06, 'epoch': 1.44} {'loss': 0.3124, 'learning_rate': 3.908232822645529e-06, 'epoch': 1.44} {'loss': 0.2697, 'learning_rate': 3.907966384211001e-06, 'epoch': 1.44} {'loss': 0.3539, 'learning_rate': 3.907699952653219e-06, 'epoch': 1.44} {'loss': 0.4082, 'learning_rate': 3.907433527972483e-06, 'epoch': 1.44} {'loss': 0.3041, 'learning_rate': 3.907167110169099e-06, 'epoch': 1.44} {'loss': 0.3884, 'learning_rate': 3.906900699243361e-06, 'epoch': 1.44} {'loss': 0.2467, 'learning_rate': 3.906634295195577e-06, 'epoch': 1.44} {'loss': 0.3637, 'learning_rate': 3.906367898026041e-06, 'epoch': 1.44} {'loss': 0.288, 'learning_rate': 3.9061015077350605e-06, 'epoch': 1.44} {'loss': 0.3977, 'learning_rate': 3.905835124322929e-06, 'epoch': 1.44} {'loss': 0.2362, 'learning_rate': 3.90556874778995e-06, 'epoch': 1.44} {'loss': 0.2464, 'learning_rate': 3.9053023781364295e-06, 'epoch': 1.44} {'loss': 0.4615, 'learning_rate': 3.9050360153626595e-06, 'epoch': 1.44} {'loss': 0.2762, 'learning_rate': 3.904769659468949e-06, 'epoch': 1.44} {'loss': 0.4526, 'learning_rate': 3.904503310455591e-06, 'epoch': 1.44} {'loss': 0.3949, 'learning_rate': 3.904236968322892e-06, 'epoch': 1.44} {'loss': 0.3505, 'learning_rate': 3.903970633071148e-06, 'epoch': 1.44} {'loss': 0.2273, 'learning_rate': 3.903704304700665e-06, 'epoch': 1.44} {'loss': 0.2757, 'learning_rate': 3.903437983211736e-06, 'epoch': 1.44} {'loss': 0.2661, 'learning_rate': 3.903171668604672e-06, 'epoch': 1.44} {'loss': 0.375, 'learning_rate': 3.902905360879763e-06, 'epoch': 1.44} {'loss': 0.1848, 'learning_rate': 3.902639060037317e-06, 'epoch': 1.44} {'loss': 0.2314, 'learning_rate': 3.902372766077634e-06, 'epoch': 1.44} {'loss': 0.3875, 'learning_rate': 3.902106479001008e-06, 'epoch': 1.44} {'loss': 0.266, 'learning_rate': 3.901840198807748e-06, 'epoch': 1.44} {'loss': 0.4091, 'learning_rate': 3.901573925498146e-06, 'epoch': 1.44} {'loss': 0.3451, 'learning_rate': 3.901307659072513e-06, 'epoch': 1.44} {'loss': 0.397, 'learning_rate': 3.90104139953114e-06, 'epoch': 1.44} {'loss': 0.2281, 'learning_rate': 3.900775146874334e-06, 'epoch': 1.44} {'loss': 0.2634, 'learning_rate': 3.90050890110239e-06, 'epoch': 1.44} {'loss': 0.3013, 'learning_rate': 3.900242662215615e-06, 'epoch': 1.44} {'loss': 0.2728, 'learning_rate': 3.899976430214303e-06, 'epoch': 1.44} {'loss': 0.3473, 'learning_rate': 3.899710205098761e-06, 'epoch': 1.44} {'loss': 0.2115, 'learning_rate': 3.899443986869282e-06, 'epoch': 1.44} {'loss': 0.3004, 'learning_rate': 3.899177775526175e-06, 'epoch': 1.44} {'loss': 0.3087, 'learning_rate': 3.898911571069737e-06, 'epoch': 1.44} {'loss': 0.2674, 'learning_rate': 3.898645373500263e-06, 'epoch': 1.44} {'loss': 0.2952, 'learning_rate': 3.898379182818061e-06, 'epoch': 1.44} {'loss': 0.3729, 'learning_rate': 3.898112999023426e-06, 'epoch': 1.44} {'loss': 0.2477, 'learning_rate': 3.897846822116664e-06, 'epoch': 1.44} {'loss': 0.3838, 'learning_rate': 3.89758065209807e-06, 'epoch': 1.44} {'loss': 0.2591, 'learning_rate': 3.897314488967949e-06, 'epoch': 1.44} {'loss': 0.3016, 'learning_rate': 3.897048332726597e-06, 'epoch': 1.44} {'loss': 0.3516, 'learning_rate': 3.896782183374322e-06, 'epoch': 1.44} {'loss': 0.4014, 'learning_rate': 3.896516040911413e-06, 'epoch': 1.44} {'loss': 0.2135, 'learning_rate': 3.896249905338182e-06, 'epoch': 1.44} {'loss': 0.4478, 'learning_rate': 3.895983776654919e-06, 'epoch': 1.44} {'loss': 0.3095, 'learning_rate': 3.8957176548619345e-06, 'epoch': 1.44} {'loss': 0.2941, 'learning_rate': 3.895451539959524e-06, 'epoch': 1.44} {'loss': 0.4347, 'learning_rate': 3.895185431947985e-06, 'epoch': 1.44} {'loss': 0.37, 'learning_rate': 3.8949193308276225e-06, 'epoch': 1.44} {'loss': 0.3833, 'learning_rate': 3.894653236598732e-06, 'epoch': 1.44} {'loss': 0.2049, 'learning_rate': 3.894387149261622e-06, 'epoch': 1.44} {'loss': 0.2621, 'learning_rate': 3.894121068816583e-06, 'epoch': 1.44} {'loss': 0.2551, 'learning_rate': 3.893854995263924e-06, 'epoch': 1.44} {'loss': 0.3596, 'learning_rate': 3.893588928603938e-06, 'epoch': 1.44} {'loss': 0.2574, 'learning_rate': 3.893322868836933e-06, 'epoch': 1.44} {'loss': 0.4071, 'learning_rate': 3.893056815963201e-06, 'epoch': 1.44} {'loss': 0.4097, 'learning_rate': 3.8927907699830504e-06, 'epoch': 1.44} {'loss': 0.3281, 'learning_rate': 3.892524730896774e-06, 'epoch': 1.44} {'loss': 0.3508, 'learning_rate': 3.89225869870468e-06, 'epoch': 1.44} {'loss': 0.159, 'learning_rate': 3.891992673407063e-06, 'epoch': 1.44} {'loss': 0.3132, 'learning_rate': 3.891726655004222e-06, 'epoch': 1.44} {'loss': 0.3981, 'learning_rate': 3.891460643496464e-06, 'epoch': 1.44} {'loss': 0.3231, 'learning_rate': 3.891194638884082e-06, 'epoch': 1.44} {'loss': 0.3003, 'learning_rate': 3.890928641167383e-06, 'epoch': 1.44} {'loss': 0.4292, 'learning_rate': 3.890662650346659e-06, 'epoch': 1.44} {'loss': 0.2368, 'learning_rate': 3.89039666642222e-06, 'epoch': 1.44} {'loss': 0.3573, 'learning_rate': 3.890130689394358e-06, 'epoch': 1.44} {'loss': 0.2632, 'learning_rate': 3.88986471926338e-06, 'epoch': 1.44} {'loss': 0.287, 'learning_rate': 3.8895987560295785e-06, 'epoch': 1.44} {'loss': 0.3261, 'learning_rate': 3.889332799693262e-06, 'epoch': 1.44} {'loss': 0.1124, 'learning_rate': 3.8890668502547235e-06, 'epoch': 1.44} {'loss': 0.2858, 'learning_rate': 3.88880090771427e-06, 'epoch': 1.44} {'loss': 0.3401, 'learning_rate': 3.888534972072198e-06, 'epoch': 1.44} {'loss': 0.2195, 'learning_rate': 3.888269043328804e-06, 'epoch': 1.44} {'loss': 0.1405, 'learning_rate': 3.888003121484396e-06, 'epoch': 1.44} {'loss': 0.5308, 'learning_rate': 3.8877372065392675e-06, 'epoch': 1.44} {'loss': 0.3221, 'learning_rate': 3.887471298493723e-06, 'epoch': 1.44} {'loss': 0.251, 'learning_rate': 3.887205397348059e-06, 'epoch': 1.44} {'loss': 0.2247, 'learning_rate': 3.8869395031025815e-06, 'epoch': 1.44} {'loss': 0.1722, 'learning_rate': 3.886673615757582e-06, 'epoch': 1.44} {'loss': 0.278, 'learning_rate': 3.88640773531337e-06, 'epoch': 1.44} {'loss': 0.3166, 'learning_rate': 3.886141861770238e-06, 'epoch': 1.44} {'loss': 0.3524, 'learning_rate': 3.8858759951284904e-06, 'epoch': 1.44} {'loss': 0.2367, 'learning_rate': 3.8856101353884245e-06, 'epoch': 1.44} {'loss': 0.2321, 'learning_rate': 3.8853442825503455e-06, 'epoch': 1.44} {'loss': 0.4589, 'learning_rate': 3.88507843661455e-06, 'epoch': 1.44} {'loss': 0.2668, 'learning_rate': 3.884812597581334e-06, 'epoch': 1.44} {'loss': 0.3781, 'learning_rate': 3.884546765451006e-06, 'epoch': 1.44} {'loss': 0.2948, 'learning_rate': 3.884280940223858e-06, 'epoch': 1.44} {'loss': 0.3849, 'learning_rate': 3.8840151219001975e-06, 'epoch': 1.44} {'loss': 0.3491, 'learning_rate': 3.883749310480317e-06, 'epoch': 1.44} {'loss': 0.3874, 'learning_rate': 3.883483505964525e-06, 'epoch': 1.44} {'loss': 0.2436, 'learning_rate': 3.883217708353112e-06, 'epoch': 1.44} {'loss': 0.3853, 'learning_rate': 3.8829519176463885e-06, 'epoch': 1.44} {'loss': 0.2404, 'learning_rate': 3.882686133844643e-06, 'epoch': 1.44} {'loss': 0.4097, 'learning_rate': 3.8824203569481865e-06, 'epoch': 1.44} {'loss': 0.2183, 'learning_rate': 3.882154586957311e-06, 'epoch': 1.44} {'loss': 0.2284, 'learning_rate': 3.881888823872323e-06, 'epoch': 1.44} {'loss': 0.3109, 'learning_rate': 3.8816230676935186e-06, 'epoch': 1.44} {'loss': 0.3395, 'learning_rate': 3.881357318421195e-06, 'epoch': 1.44} {'loss': 0.2142, 'learning_rate': 3.881091576055659e-06, 'epoch': 1.44} {'loss': 0.2976, 'learning_rate': 3.880825840597203e-06, 'epoch': 1.44} {'loss': 0.4895, 'learning_rate': 3.880560112046135e-06, 'epoch': 1.44} {'loss': 0.2724, 'learning_rate': 3.880294390402748e-06, 'epoch': 1.44} {'loss': 0.4245, 'learning_rate': 3.880028675667348e-06, 'epoch': 1.44} {'loss': 0.3362, 'learning_rate': 3.8797629678402284e-06, 'epoch': 1.44} {'loss': 0.4046, 'learning_rate': 3.879497266921695e-06, 'epoch': 1.44} {'loss': 0.2444, 'learning_rate': 3.879231572912043e-06, 'epoch': 1.44} {'loss': 0.3106, 'learning_rate': 3.878965885811576e-06, 'epoch': 1.44} {'loss': 0.4031, 'learning_rate': 3.8787002056205935e-06, 'epoch': 1.44} {'loss': 0.2541, 'learning_rate': 3.878434532339392e-06, 'epoch': 1.44} {'loss': 0.3521, 'learning_rate': 3.878168865968277e-06, 'epoch': 1.44} {'loss': 0.3193, 'learning_rate': 3.877903206507543e-06, 'epoch': 1.44} {'loss': 0.1873, 'learning_rate': 3.877637553957494e-06, 'epoch': 1.44} {'loss': 0.3583, 'learning_rate': 3.877371908318425e-06, 'epoch': 1.44} {'loss': 0.3799, 'learning_rate': 3.877106269590642e-06, 'epoch': 1.44} {'loss': 0.37, 'learning_rate': 3.8768406377744395e-06, 'epoch': 1.44} {'loss': 0.2605, 'learning_rate': 3.876575012870122e-06, 'epoch': 1.44} {'loss': 0.3605, 'learning_rate': 3.876309394877983e-06, 'epoch': 1.44} {'loss': 0.3516, 'learning_rate': 3.876043783798331e-06, 'epoch': 1.44} {'loss': 0.2728, 'learning_rate': 3.87577817963146e-06, 'epoch': 1.44} {'loss': 0.3823, 'learning_rate': 3.875512582377667e-06, 'epoch': 1.44} {'loss': 0.3702, 'learning_rate': 3.87524699203726e-06, 'epoch': 1.44} {'loss': 0.3153, 'learning_rate': 3.874981408610531e-06, 'epoch': 1.44} {'loss': 0.1345, 'learning_rate': 3.874715832097788e-06, 'epoch': 1.44} {'loss': 0.4004, 'learning_rate': 3.874450262499319e-06, 'epoch': 1.44} {'loss': 0.3298, 'learning_rate': 3.8741846998154375e-06, 'epoch': 1.44} {'loss': 0.2607, 'learning_rate': 3.873919144046432e-06, 'epoch': 1.44} {'loss': 0.3935, 'learning_rate': 3.87365359519261e-06, 'epoch': 1.44} {'loss': 0.3132, 'learning_rate': 3.8733880532542655e-06, 'epoch': 1.44} {'loss': 0.2769, 'learning_rate': 3.873122518231704e-06, 'epoch': 1.44} {'loss': 0.3557, 'learning_rate': 3.872856990125219e-06, 'epoch': 1.44} {'loss': 0.2704, 'learning_rate': 3.872591468935117e-06, 'epoch': 1.44} {'loss': 0.4, 'learning_rate': 3.872325954661692e-06, 'epoch': 1.44} {'loss': 0.3628, 'learning_rate': 3.8720604473052435e-06, 'epoch': 1.44} {'loss': 0.2703, 'learning_rate': 3.871794946866078e-06, 'epoch': 1.44} {'loss': 0.3478, 'learning_rate': 3.871529453344486e-06, 'epoch': 1.44} {'loss': 0.2862, 'learning_rate': 3.871263966740776e-06, 'epoch': 1.44} {'loss': 0.2627, 'learning_rate': 3.870998487055238e-06, 'epoch': 1.44} {'loss': 0.2815, 'learning_rate': 3.870733014288184e-06, 'epoch': 1.44} {'loss': 0.3017, 'learning_rate': 3.8704675484399015e-06, 'epoch': 1.44} {'loss': 0.2773, 'learning_rate': 3.870202089510699e-06, 'epoch': 1.44} {'loss': 0.447, 'learning_rate': 3.86993663750087e-06, 'epoch': 1.44} {'loss': 0.375, 'learning_rate': 3.86967119241072e-06, 'epoch': 1.44} {'loss': 0.3935, 'learning_rate': 3.869405754240541e-06, 'epoch': 1.44} {'loss': 0.3987, 'learning_rate': 3.869140322990642e-06, 'epoch': 1.44} {'loss': 0.1791, 'learning_rate': 3.868874898661318e-06, 'epoch': 1.44} {'loss': 0.2258, 'learning_rate': 3.868609481252864e-06, 'epoch': 1.44} {'loss': 0.3093, 'learning_rate': 3.868344070765587e-06, 'epoch': 1.44} {'loss': 0.1546, 'learning_rate': 3.8680786671997804e-06, 'epoch': 1.44} {'loss': 0.2767, 'learning_rate': 3.8678132705557516e-06, 'epoch': 1.44} {'loss': 0.3255, 'learning_rate': 3.867547880833791e-06, 'epoch': 1.44} {'loss': 0.3605, 'learning_rate': 3.867282498034206e-06, 'epoch': 1.44} {'loss': 0.3234, 'learning_rate': 3.867017122157289e-06, 'epoch': 1.44} {'loss': 0.3541, 'learning_rate': 3.866751753203349e-06, 'epoch': 1.44} {'loss': 0.3212, 'learning_rate': 3.866486391172675e-06, 'epoch': 1.44} {'loss': 0.399, 'learning_rate': 3.866221036065575e-06, 'epoch': 1.44} {'loss': 0.1488, 'learning_rate': 3.865955687882341e-06, 'epoch': 1.44} {'loss': 0.3178, 'learning_rate': 3.865690346623281e-06, 'epoch': 1.44} {'loss': 0.3649, 'learning_rate': 3.865425012288691e-06, 'epoch': 1.44} {'loss': 0.2027, 'learning_rate': 3.865159684878864e-06, 'epoch': 1.44} {'loss': 0.4341, 'learning_rate': 3.8648943643941095e-06, 'epoch': 1.44} {'loss': 0.3169, 'learning_rate': 3.864629050834719e-06, 'epoch': 1.44} {'loss': 0.2696, 'learning_rate': 3.864363744201e-06, 'epoch': 1.44} {'loss': 0.3412, 'learning_rate': 3.864098444493242e-06, 'epoch': 1.44} {'loss': 0.43, 'learning_rate': 3.8638331517117565e-06, 'epoch': 1.44} {'loss': 0.3023, 'learning_rate': 3.863567865856831e-06, 'epoch': 1.44} {'loss': 0.4439, 'learning_rate': 3.863302586928774e-06, 'epoch': 1.44} {'loss': 0.2448, 'learning_rate': 3.863037314927879e-06, 'epoch': 1.44} {'loss': 0.2193, 'learning_rate': 3.862772049854451e-06, 'epoch': 1.44} {'loss': 0.3368, 'learning_rate': 3.862506791708782e-06, 'epoch': 1.44} {'loss': 0.3211, 'learning_rate': 3.86224154049118e-06, 'epoch': 1.44} {'loss': 0.4089, 'learning_rate': 3.86197629620194e-06, 'epoch': 1.44} {'loss': 0.3044, 'learning_rate': 3.8617110588413586e-06, 'epoch': 1.44} {'loss': 0.4718, 'learning_rate': 3.861445828409741e-06, 'epoch': 1.44} {'loss': 0.3537, 'learning_rate': 3.861180604907381e-06, 'epoch': 1.44} {'loss': 0.3305, 'learning_rate': 3.860915388334583e-06, 'epoch': 1.44} {'loss': 0.281, 'learning_rate': 3.860650178691642e-06, 'epoch': 1.44} {'loss': 0.3261, 'learning_rate': 3.8603849759788615e-06, 'epoch': 1.44} {'loss': 0.4119, 'learning_rate': 3.860119780196536e-06, 'epoch': 1.44} {'loss': 0.5143, 'learning_rate': 3.859854591344971e-06, 'epoch': 1.44} {'loss': 0.255, 'learning_rate': 3.85958940942446e-06, 'epoch': 1.44} {'loss': 0.3764, 'learning_rate': 3.859324234435308e-06, 'epoch': 1.44} {'loss': 0.1888, 'learning_rate': 3.859059066377807e-06, 'epoch': 1.44} {'loss': 0.364, 'learning_rate': 3.858793905252265e-06, 'epoch': 1.44} {'loss': 0.2199, 'learning_rate': 3.8585287510589766e-06, 'epoch': 1.44} {'loss': 0.4226, 'learning_rate': 3.858263603798238e-06, 'epoch': 1.44} {'loss': 0.2257, 'learning_rate': 3.857998463470355e-06, 'epoch': 1.44} {'loss': 0.2592, 'learning_rate': 3.8577333300756205e-06, 'epoch': 1.44} {'loss': 0.3647, 'learning_rate': 3.857468203614341e-06, 'epoch': 1.44} {'loss': 0.2486, 'learning_rate': 3.857203084086807e-06, 'epoch': 1.44} {'loss': 0.3733, 'learning_rate': 3.856937971493327e-06, 'epoch': 1.44} {'loss': 0.3163, 'learning_rate': 3.856672865834192e-06, 'epoch': 1.44} {'loss': 0.2108, 'learning_rate': 3.8564077671097085e-06, 'epoch': 1.44} {'loss': 0.3301, 'learning_rate': 3.85614267532017e-06, 'epoch': 1.44} {'loss': 0.289, 'learning_rate': 3.855877590465881e-06, 'epoch': 1.44} {'loss': 0.2307, 'learning_rate': 3.855612512547135e-06, 'epoch': 1.44} {'loss': 0.3099, 'learning_rate': 3.855347441564236e-06, 'epoch': 1.44} {'loss': 0.3567, 'learning_rate': 3.8550823775174826e-06, 'epoch': 1.44} {'loss': 0.3327, 'learning_rate': 3.854817320407168e-06, 'epoch': 1.44} {'loss': 0.3786, 'learning_rate': 3.8545522702336e-06, 'epoch': 1.44} {'loss': 0.3336, 'learning_rate': 3.854287226997071e-06, 'epoch': 1.44} {'loss': 0.2931, 'learning_rate': 3.854022190697887e-06, 'epoch': 1.44} {'loss': 0.3508, 'learning_rate': 3.853757161336339e-06, 'epoch': 1.44} {'loss': 0.2522, 'learning_rate': 3.853492138912734e-06, 'epoch': 1.44} {'loss': 0.3352, 'learning_rate': 3.853227123427363e-06, 'epoch': 1.44} {'loss': 0.3709, 'learning_rate': 3.85296211488053e-06, 'epoch': 1.44} {'loss': 0.2701, 'learning_rate': 3.852697113272539e-06, 'epoch': 1.44} {'loss': 0.3946, 'learning_rate': 3.852432118603679e-06, 'epoch': 1.44} {'loss': 0.2901, 'learning_rate': 3.852167130874259e-06, 'epoch': 1.44} {'loss': 0.3012, 'learning_rate': 3.8519021500845685e-06, 'epoch': 1.44} {'loss': 0.2165, 'learning_rate': 3.851637176234916e-06, 'epoch': 1.44} {'loss': 0.3237, 'learning_rate': 3.851372209325591e-06, 'epoch': 1.44} {'loss': 0.2774, 'learning_rate': 3.851107249356901e-06, 'epoch': 1.44} {'loss': 0.2555, 'learning_rate': 3.850842296329139e-06, 'epoch': 1.44} {'loss': 0.3057, 'learning_rate': 3.85057735024261e-06, 'epoch': 1.44} {'loss': 0.2783, 'learning_rate': 3.8503124110976074e-06, 'epoch': 1.44} {'loss': 0.3968, 'learning_rate': 3.8500474788944355e-06, 'epoch': 1.44} {'loss': 0.3456, 'learning_rate': 3.84978255363339e-06, 'epoch': 1.44} {'loss': 0.419, 'learning_rate': 3.849517635314767e-06, 'epoch': 1.44} {'loss': 0.2723, 'learning_rate': 3.849252723938874e-06, 'epoch': 1.44} {'loss': 0.2643, 'learning_rate': 3.8489878195059996e-06, 'epoch': 1.44} {'loss': 0.3183, 'learning_rate': 3.848722922016452e-06, 'epoch': 1.44} {'loss': 0.4033, 'learning_rate': 3.848458031470523e-06, 'epoch': 1.44} {'loss': 0.4085, 'learning_rate': 3.84819314786852e-06, 'epoch': 1.44} {'loss': 0.4169, 'learning_rate': 3.847928271210732e-06, 'epoch': 1.44} {'loss': 0.3308, 'learning_rate': 3.847663401497468e-06, 'epoch': 1.44} {'loss': 0.2635, 'learning_rate': 3.847398538729018e-06, 'epoch': 1.44} {'loss': 0.2335, 'learning_rate': 3.847133682905688e-06, 'epoch': 1.44} {'loss': 0.2718, 'learning_rate': 3.8468688340277714e-06, 'epoch': 1.44} {'loss': 0.4904, 'learning_rate': 3.846603992095572e-06, 'epoch': 1.44} {'loss': 0.3112, 'learning_rate': 3.846339157109388e-06, 'epoch': 1.44} {'loss': 0.1698, 'learning_rate': 3.846074329069513e-06, 'epoch': 1.44} {'loss': 0.3346, 'learning_rate': 3.845809507976253e-06, 'epoch': 1.44} {'loss': 0.2895, 'learning_rate': 3.845544693829901e-06, 'epoch': 1.44} {'loss': 0.3944, 'learning_rate': 3.845279886630762e-06, 'epoch': 1.44} {'loss': 0.3189, 'learning_rate': 3.845015086379128e-06, 'epoch': 1.44} {'loss': 0.1733, 'learning_rate': 3.844750293075305e-06, 'epoch': 1.44} {'loss': 0.2812, 'learning_rate': 3.844485506719585e-06, 'epoch': 1.44} {'loss': 0.2218, 'learning_rate': 3.844220727312273e-06, 'epoch': 1.44} {'loss': 0.2789, 'learning_rate': 3.843955954853663e-06, 'epoch': 1.44} {'loss': 0.2316, 'learning_rate': 3.84369118934406e-06, 'epoch': 1.44} {'loss': 0.2741, 'learning_rate': 3.843426430783754e-06, 'epoch': 1.44} {'loss': 0.3738, 'learning_rate': 3.843161679173053e-06, 'epoch': 1.44} {'loss': 0.2525, 'learning_rate': 3.842896934512251e-06, 'epoch': 1.44} {'loss': 0.2887, 'learning_rate': 3.842632196801645e-06, 'epoch': 1.44} {'loss': 0.1415, 'learning_rate': 3.84236746604154e-06, 'epoch': 1.44} {'loss': 0.3299, 'learning_rate': 3.842102742232227e-06, 'epoch': 1.44} {'loss': 0.3364, 'learning_rate': 3.841838025374013e-06, 'epoch': 1.44} {'loss': 0.3436, 'learning_rate': 3.841573315467188e-06, 'epoch': 1.44} {'loss': 0.4981, 'learning_rate': 3.841308612512061e-06, 'epoch': 1.44} {'loss': 0.3358, 'learning_rate': 3.841043916508921e-06, 'epoch': 1.44} {'loss': 0.2091, 'learning_rate': 3.8407792274580744e-06, 'epoch': 1.44} {'loss': 0.2553, 'learning_rate': 3.840514545359815e-06, 'epoch': 1.44} {'loss': 0.3906, 'learning_rate': 3.840249870214445e-06, 'epoch': 1.44} {'loss': 0.3339, 'learning_rate': 3.839985202022259e-06, 'epoch': 1.44} {'loss': 0.2357, 'learning_rate': 3.839720540783562e-06, 'epoch': 1.44} {'loss': 0.2538, 'learning_rate': 3.839455886498649e-06, 'epoch': 1.44} {'loss': 0.3694, 'learning_rate': 3.839191239167815e-06, 'epoch': 1.44} {'loss': 0.3272, 'learning_rate': 3.838926598791366e-06, 'epoch': 1.44} {'loss': 0.3055, 'learning_rate': 3.838661965369594e-06, 'epoch': 1.44} {'loss': 0.3664, 'learning_rate': 3.838397338902804e-06, 'epoch': 1.44} {'loss': 0.1466, 'learning_rate': 3.838132719391289e-06, 'epoch': 1.44} {'loss': 0.4585, 'learning_rate': 3.837868106835353e-06, 'epoch': 1.44} {'loss': 0.4133, 'learning_rate': 3.837603501235288e-06, 'epoch': 1.44} {'loss': 0.2925, 'learning_rate': 3.837338902591402e-06, 'epoch': 1.44} {'loss': 0.3861, 'learning_rate': 3.837074310903985e-06, 'epoch': 1.44} {'loss': 0.1898, 'learning_rate': 3.836809726173342e-06, 'epoch': 1.44} {'loss': 0.3975, 'learning_rate': 3.836545148399765e-06, 'epoch': 1.44} {'loss': 0.2838, 'learning_rate': 3.836280577583561e-06, 'epoch': 1.44} {'loss': 0.3318, 'learning_rate': 3.8360160137250235e-06, 'epoch': 1.44} {'loss': 0.3133, 'learning_rate': 3.835751456824449e-06, 'epoch': 1.44} {'loss': 0.2206, 'learning_rate': 3.835486906882141e-06, 'epoch': 1.44} {'loss': 0.3307, 'learning_rate': 3.8352223638983945e-06, 'epoch': 1.44} {'loss': 0.2869, 'learning_rate': 3.834957827873511e-06, 'epoch': 1.44} {'loss': 0.4477, 'learning_rate': 3.834693298807786e-06, 'epoch': 1.44} {'loss': 0.3471, 'learning_rate': 3.834428776701522e-06, 'epoch': 1.44} {'loss': 0.2695, 'learning_rate': 3.834164261555014e-06, 'epoch': 1.44} {'loss': 0.3489, 'learning_rate': 3.833899753368563e-06, 'epoch': 1.44} {'loss': 0.4038, 'learning_rate': 3.833635252142465e-06, 'epoch': 1.44} {'loss': 0.254, 'learning_rate': 3.833370757877023e-06, 'epoch': 1.44} {'loss': 0.2897, 'learning_rate': 3.833106270572529e-06, 'epoch': 1.44} {'loss': 0.3093, 'learning_rate': 3.8328417902292894e-06, 'epoch': 1.44} {'loss': 0.317, 'learning_rate': 3.832577316847594e-06, 'epoch': 1.44} {'loss': 0.3085, 'learning_rate': 3.83231285042775e-06, 'epoch': 1.44} {'loss': 0.3829, 'learning_rate': 3.832048390970054e-06, 'epoch': 1.44} {'loss': 0.2763, 'learning_rate': 3.831783938474797e-06, 'epoch': 1.44} {'loss': 0.2651, 'learning_rate': 3.831519492942287e-06, 'epoch': 1.44} {'loss': 0.4231, 'learning_rate': 3.831255054372815e-06, 'epoch': 1.44} {'loss': 0.3653, 'learning_rate': 3.830990622766686e-06, 'epoch': 1.44} {'loss': 0.3846, 'learning_rate': 3.830726198124193e-06, 'epoch': 1.44} {'loss': 0.3457, 'learning_rate': 3.83046178044564e-06, 'epoch': 1.44} {'loss': 0.2764, 'learning_rate': 3.830197369731319e-06, 'epoch': 1.44} {'loss': 0.406, 'learning_rate': 3.829932965981535e-06, 'epoch': 1.44} {'loss': 0.3557, 'learning_rate': 3.82966856919658e-06, 'epoch': 1.44} {'loss': 0.2844, 'learning_rate': 3.829404179376759e-06, 'epoch': 1.44} {'loss': 0.3462, 'learning_rate': 3.829139796522365e-06, 'epoch': 1.44} {'loss': 0.406, 'learning_rate': 3.828875420633701e-06, 'epoch': 1.44} {'loss': 0.2857, 'learning_rate': 3.828611051711064e-06, 'epoch': 1.44} {'loss': 0.3694, 'learning_rate': 3.8283466897547475e-06, 'epoch': 1.44} {'loss': 0.3329, 'learning_rate': 3.828082334765057e-06, 'epoch': 1.44} {'loss': 0.2978, 'learning_rate': 3.827817986742286e-06, 'epoch': 1.44} {'loss': 0.3654, 'learning_rate': 3.827553645686738e-06, 'epoch': 1.44} {'loss': 0.3248, 'learning_rate': 3.827289311598703e-06, 'epoch': 1.44} {'loss': 0.2046, 'learning_rate': 3.8270249844784906e-06, 'epoch': 1.44} {'loss': 0.2978, 'learning_rate': 3.826760664326388e-06, 'epoch': 1.44} {'loss': 0.3853, 'learning_rate': 3.8264963511426985e-06, 'epoch': 1.44} {'loss': 0.1372, 'learning_rate': 3.826232044927724e-06, 'epoch': 1.44} {'loss': 0.1994, 'learning_rate': 3.825967745681757e-06, 'epoch': 1.44} {'loss': 0.2262, 'learning_rate': 3.825703453405102e-06, 'epoch': 1.44} {'loss': 0.3623, 'learning_rate': 3.82543916809805e-06, 'epoch': 1.44} {'loss': 0.3111, 'learning_rate': 3.825174889760905e-06, 'epoch': 1.44} {'loss': 0.3072, 'learning_rate': 3.824910618393962e-06, 'epoch': 1.44} {'loss': 0.2451, 'learning_rate': 3.824646353997523e-06, 'epoch': 1.44} {'loss': 0.2706, 'learning_rate': 3.8243820965718815e-06, 'epoch': 1.44} {'loss': 0.2238, 'learning_rate': 3.82411784611734e-06, 'epoch': 1.44} {'loss': 0.3303, 'learning_rate': 3.823853602634193e-06, 'epoch': 1.44} {'loss': 0.2587, 'learning_rate': 3.823589366122744e-06, 'epoch': 1.44} {'loss': 0.198, 'learning_rate': 3.823325136583288e-06, 'epoch': 1.44} {'loss': 0.298, 'learning_rate': 3.82306091401612e-06, 'epoch': 1.44} {'loss': 0.3096, 'learning_rate': 3.822796698421545e-06, 'epoch': 1.44} {'loss': 0.2896, 'learning_rate': 3.822532489799854e-06, 'epoch': 1.44} {'loss': 0.2749, 'learning_rate': 3.822268288151353e-06, 'epoch': 1.44} {'loss': 0.2232, 'learning_rate': 3.8220040934763336e-06, 'epoch': 1.44} {'loss': 0.4525, 'learning_rate': 3.821739905775099e-06, 'epoch': 1.44} {'loss': 0.2736, 'learning_rate': 3.821475725047943e-06, 'epoch': 1.44} {'loss': 0.3174, 'learning_rate': 3.821211551295169e-06, 'epoch': 1.44} {'loss': 0.3361, 'learning_rate': 3.820947384517067e-06, 'epoch': 1.44} {'loss': 0.424, 'learning_rate': 3.820683224713946e-06, 'epoch': 1.44} {'loss': 0.352, 'learning_rate': 3.820419071886095e-06, 'epoch': 1.44} {'loss': 0.2939, 'learning_rate': 3.820154926033817e-06, 'epoch': 1.44} {'loss': 0.1983, 'learning_rate': 3.819890787157412e-06, 'epoch': 1.44} {'loss': 0.3002, 'learning_rate': 3.819626655257171e-06, 'epoch': 1.44} {'loss': 0.2113, 'learning_rate': 3.819362530333398e-06, 'epoch': 1.44} {'loss': 0.209, 'learning_rate': 3.819098412386387e-06, 'epoch': 1.44} {'loss': 0.2625, 'learning_rate': 3.818834301416442e-06, 'epoch': 1.44} {'loss': 0.3483, 'learning_rate': 3.818570197423854e-06, 'epoch': 1.44} {'loss': 0.3839, 'learning_rate': 3.818306100408928e-06, 'epoch': 1.44} {'loss': 0.4242, 'learning_rate': 3.818042010371956e-06, 'epoch': 1.44} {'loss': 0.3272, 'learning_rate': 3.817777927313243e-06, 'epoch': 1.44} {'loss': 0.3454, 'learning_rate': 3.817513851233079e-06, 'epoch': 1.44} {'loss': 0.4408, 'learning_rate': 3.81724978213177e-06, 'epoch': 1.44} {'loss': 0.1934, 'learning_rate': 3.816985720009606e-06, 'epoch': 1.44} {'loss': 0.1503, 'learning_rate': 3.816721664866893e-06, 'epoch': 1.44} {'loss': 0.4136, 'learning_rate': 3.816457616703926e-06, 'epoch': 1.44} {'loss': 0.3182, 'learning_rate': 3.816193575520999e-06, 'epoch': 1.44} {'loss': 0.0948, 'learning_rate': 3.815929541318416e-06, 'epoch': 1.44} {'loss': 0.4148, 'learning_rate': 3.81566551409647e-06, 'epoch': 1.44} {'loss': 0.2486, 'learning_rate': 3.815401493855465e-06, 'epoch': 1.44} {'loss': 0.4241, 'learning_rate': 3.815137480595693e-06, 'epoch': 1.44} {'loss': 0.3903, 'learning_rate': 3.814873474317458e-06, 'epoch': 1.44} {'loss': 0.3271, 'learning_rate': 3.8146094750210492e-06, 'epoch': 1.44} {'loss': 0.4841, 'learning_rate': 3.814345482706775e-06, 'epoch': 1.44} {'loss': 0.3416, 'learning_rate': 3.8140814973749253e-06, 'epoch': 1.44} {'loss': 0.3313, 'learning_rate': 3.8138175190258044e-06, 'epoch': 1.44} {'loss': 0.2472, 'learning_rate': 3.813553547659704e-06, 'epoch': 1.44} {'loss': 0.3304, 'learning_rate': 3.813289583276928e-06, 'epoch': 1.44} {'loss': 0.2285, 'learning_rate': 3.813025625877772e-06, 'epoch': 1.44} {'loss': 0.1865, 'learning_rate': 3.8127616754625305e-06, 'epoch': 1.44} {'loss': 0.4372, 'learning_rate': 3.8124977320315072e-06, 'epoch': 1.44} {'loss': 0.3585, 'learning_rate': 3.812233795584994e-06, 'epoch': 1.44} {'loss': 0.3287, 'learning_rate': 3.811969866123296e-06, 'epoch': 1.44} {'loss': 0.2642, 'learning_rate': 3.811705943646704e-06, 'epoch': 1.44} {'loss': 0.337, 'learning_rate': 3.811442028155523e-06, 'epoch': 1.44} {'loss': 0.3021, 'learning_rate': 3.811178119650043e-06, 'epoch': 1.44} {'loss': 0.2685, 'learning_rate': 3.810914218130569e-06, 'epoch': 1.44} {'loss': 0.3596, 'learning_rate': 3.8106503235973934e-06, 'epoch': 1.44} {'loss': 0.1952, 'learning_rate': 3.81038643605082e-06, 'epoch': 1.44} {'loss': 0.3985, 'learning_rate': 3.81012255549114e-06, 'epoch': 1.44} {'loss': 0.3977, 'learning_rate': 3.8098586819186577e-06, 'epoch': 1.44} {'loss': 0.2513, 'learning_rate': 3.809594815333668e-06, 'epoch': 1.44} {'loss': 0.2778, 'learning_rate': 3.8093309557364645e-06, 'epoch': 1.44} {'loss': 0.3525, 'learning_rate': 3.809067103127353e-06, 'epoch': 1.44} {'loss': 0.3863, 'learning_rate': 3.8088032575066245e-06, 'epoch': 1.44} {'loss': 0.3065, 'learning_rate': 3.808539418874583e-06, 'epoch': 1.44} {'loss': 0.2098, 'learning_rate': 3.808275587231519e-06, 'epoch': 1.44} {'loss': 0.3749, 'learning_rate': 3.808011762577739e-06, 'epoch': 1.44} {'loss': 0.4291, 'learning_rate': 3.8077479449135325e-06, 'epoch': 1.44} {'loss': 0.2847, 'learning_rate': 3.8074841342392044e-06, 'epoch': 1.44} {'loss': 0.3969, 'learning_rate': 3.8072203305550446e-06, 'epoch': 1.44} {'loss': 0.352, 'learning_rate': 3.80695653386136e-06, 'epoch': 1.44} {'loss': 0.2111, 'learning_rate': 3.806692744158441e-06, 'epoch': 1.44} {'loss': 0.194, 'learning_rate': 3.806428961446591e-06, 'epoch': 1.44} {'loss': 0.5351, 'learning_rate': 3.806165185726104e-06, 'epoch': 1.44} {'loss': 0.417, 'learning_rate': 3.805901416997276e-06, 'epoch': 1.44} {'loss': 0.3984, 'learning_rate': 3.8056376552604113e-06, 'epoch': 1.44} {'loss': 0.3564, 'learning_rate': 3.8053739005157997e-06, 'epoch': 1.44} {'loss': 0.3622, 'learning_rate': 3.805110152763747e-06, 'epoch': 1.44} {'loss': 0.4327, 'learning_rate': 3.8048464120045437e-06, 'epoch': 1.44} {'loss': 0.1929, 'learning_rate': 3.804582678238493e-06, 'epoch': 1.44} {'loss': 0.4493, 'learning_rate': 3.8043189514658876e-06, 'epoch': 1.44} {'loss': 0.2012, 'learning_rate': 3.8040552316870314e-06, 'epoch': 1.44} {'loss': 0.5293, 'learning_rate': 3.8037915189022157e-06, 'epoch': 1.44} {'loss': 0.3232, 'learning_rate': 3.8035278131117436e-06, 'epoch': 1.44} {'loss': 0.3076, 'learning_rate': 3.8032641143159066e-06, 'epoch': 1.44} {'loss': 0.2822, 'learning_rate': 3.8030004225150107e-06, 'epoch': 1.44} {'loss': 0.2616, 'learning_rate': 3.8027367377093484e-06, 'epoch': 1.44} {'loss': 0.2945, 'learning_rate': 3.8024730598992142e-06, 'epoch': 1.44} {'loss': 0.2898, 'learning_rate': 3.8022093890849132e-06, 'epoch': 1.44} {'loss': 0.3483, 'learning_rate': 3.801945725266736e-06, 'epoch': 1.44} {'loss': 0.4081, 'learning_rate': 3.8016820684449863e-06, 'epoch': 1.44} {'loss': 0.2579, 'learning_rate': 3.8014184186199555e-06, 'epoch': 1.44} {'loss': 0.3864, 'learning_rate': 3.8011547757919475e-06, 'epoch': 1.44} {'loss': 0.384, 'learning_rate': 3.8008911399612545e-06, 'epoch': 1.44} {'loss': 0.2056, 'learning_rate': 3.80062751112818e-06, 'epoch': 1.44} {'loss': 0.2497, 'learning_rate': 3.8003638892930152e-06, 'epoch': 1.44} {'loss': 0.3725, 'learning_rate': 3.800100274456059e-06, 'epoch': 1.44} {'loss': 0.3658, 'learning_rate': 3.7998366666176156e-06, 'epoch': 1.44} {'loss': 0.2473, 'learning_rate': 3.7995730657779727e-06, 'epoch': 1.44} {'loss': 0.2757, 'learning_rate': 3.799309471937438e-06, 'epoch': 1.44} {'loss': 0.3229, 'learning_rate': 3.7990458850962986e-06, 'epoch': 1.44} {'loss': 0.3146, 'learning_rate': 3.798782305254862e-06, 'epoch': 1.44} {'loss': 0.3555, 'learning_rate': 3.7985187324134164e-06, 'epoch': 1.44} {'loss': 0.27, 'learning_rate': 3.7982551665722676e-06, 'epoch': 1.44} {'loss': 0.287, 'learning_rate': 3.797991607731707e-06, 'epoch': 1.44} {'loss': 0.2952, 'learning_rate': 3.797728055892037e-06, 'epoch': 1.44} {'loss': 0.3529, 'learning_rate': 3.797464511053549e-06, 'epoch': 1.44} {'loss': 0.2258, 'learning_rate': 3.797200973216548e-06, 'epoch': 1.44} {'loss': 0.3367, 'learning_rate': 3.7969374423813276e-06, 'epoch': 1.44} {'loss': 0.2693, 'learning_rate': 3.796673918548183e-06, 'epoch': 1.44} {'loss': 0.3616, 'learning_rate': 3.7964104017174154e-06, 'epoch': 1.44} {'loss': 0.3655, 'learning_rate': 3.7961468918893184e-06, 'epoch': 1.44} {'loss': 0.179, 'learning_rate': 3.7958833890641942e-06, 'epoch': 1.44} {'loss': 0.1774, 'learning_rate': 3.795619893242335e-06, 'epoch': 1.44} {'loss': 0.4651, 'learning_rate': 3.7953564044240454e-06, 'epoch': 1.44} {'loss': 0.3928, 'learning_rate': 3.7950929226096145e-06, 'epoch': 1.44} {'loss': 0.2544, 'learning_rate': 3.7948294477993474e-06, 'epoch': 1.44} {'loss': 0.2357, 'learning_rate': 3.794565979993534e-06, 'epoch': 1.44} {'loss': 0.3759, 'learning_rate': 3.7943025191924787e-06, 'epoch': 1.44} {'loss': 0.3498, 'learning_rate': 3.794039065396473e-06, 'epoch': 1.44} {'loss': 0.3714, 'learning_rate': 3.7937756186058207e-06, 'epoch': 1.44} {'loss': 0.3796, 'learning_rate': 3.7935121788208153e-06, 'epoch': 1.44} {'loss': 0.2851, 'learning_rate': 3.793248746041751e-06, 'epoch': 1.44} {'loss': 0.4008, 'learning_rate': 3.7929853202689313e-06, 'epoch': 1.44} {'loss': 0.3974, 'learning_rate': 3.7927219015026483e-06, 'epoch': 1.44} {'loss': 0.3511, 'learning_rate': 3.792458489743206e-06, 'epoch': 1.44} {'loss': 0.3309, 'learning_rate': 3.792195084990893e-06, 'epoch': 1.44} {'loss': 0.2709, 'learning_rate': 3.7919316872460156e-06, 'epoch': 1.44} {'loss': 0.2899, 'learning_rate': 3.7916682965088625e-06, 'epoch': 1.44} {'loss': 0.2451, 'learning_rate': 3.7914049127797394e-06, 'epoch': 1.44} {'loss': 0.1909, 'learning_rate': 3.7911415360589356e-06, 'epoch': 1.44} {'loss': 0.5398, 'learning_rate': 3.790878166346755e-06, 'epoch': 1.44} {'loss': 0.2924, 'learning_rate': 3.7906148036434907e-06, 'epoch': 1.44} {'loss': 0.3082, 'learning_rate': 3.7903514479494442e-06, 'epoch': 1.44} {'loss': 0.3808, 'learning_rate': 3.790088099264909e-06, 'epoch': 1.44} {'loss': 0.4615, 'learning_rate': 3.7898247575901813e-06, 'epoch': 1.44} {'loss': 0.3111, 'learning_rate': 3.789561422925564e-06, 'epoch': 1.44} {'loss': 0.4854, 'learning_rate': 3.7892980952713477e-06, 'epoch': 1.44} {'loss': 0.296, 'learning_rate': 3.7890347746278354e-06, 'epoch': 1.44} {'loss': 0.2858, 'learning_rate': 3.7887714609953186e-06, 'epoch': 1.44} {'loss': 0.3722, 'learning_rate': 3.788508154374101e-06, 'epoch': 1.44} {'loss': 0.3315, 'learning_rate': 3.7882448547644734e-06, 'epoch': 1.44} {'loss': 0.2981, 'learning_rate': 3.787981562166739e-06, 'epoch': 1.44} {'loss': 0.3723, 'learning_rate': 3.787718276581189e-06, 'epoch': 1.44} {'loss': 0.3268, 'learning_rate': 3.7874549980081275e-06, 'epoch': 1.44} {'loss': 0.384, 'learning_rate': 3.7871917264478443e-06, 'epoch': 1.44} {'loss': 0.3214, 'learning_rate': 3.786928461900643e-06, 'epoch': 1.44} {'loss': 0.2157, 'learning_rate': 3.7866652043668196e-06, 'epoch': 1.44} {'loss': 0.3743, 'learning_rate': 3.7864019538466646e-06, 'epoch': 1.44} {'loss': 0.2665, 'learning_rate': 3.7861387103404845e-06, 'epoch': 1.44} {'loss': 0.3495, 'learning_rate': 3.785875473848568e-06, 'epoch': 1.44} {'loss': 0.1362, 'learning_rate': 3.785612244371221e-06, 'epoch': 1.44} {'loss': 0.1262, 'learning_rate': 3.785349021908732e-06, 'epoch': 1.44} {'loss': 0.2126, 'learning_rate': 3.785085806461406e-06, 'epoch': 1.44} {'loss': 0.4291, 'learning_rate': 3.784822598029533e-06, 'epoch': 1.44} {'loss': 0.2265, 'learning_rate': 3.784559396613415e-06, 'epoch': 1.44} {'loss': 0.4298, 'learning_rate': 3.7842962022133455e-06, 'epoch': 1.44} {'loss': 0.3974, 'learning_rate': 3.784033014829628e-06, 'epoch': 1.44} {'loss': 0.2622, 'learning_rate': 3.7837698344625504e-06, 'epoch': 1.44} {'loss': 0.3024, 'learning_rate': 3.7835066611124184e-06, 'epoch': 1.44} {'loss': 0.3266, 'learning_rate': 3.783243494779525e-06, 'epoch': 1.44} {'loss': 0.332, 'learning_rate': 3.7829803354641647e-06, 'epoch': 1.44} {'loss': 0.3668, 'learning_rate': 3.782717183166641e-06, 'epoch': 1.44} {'loss': 0.3027, 'learning_rate': 3.782454037887243e-06, 'epoch': 1.44} {'loss': 0.1184, 'learning_rate': 3.782190899626276e-06, 'epoch': 1.44} {'loss': 0.2111, 'learning_rate': 3.7819277683840296e-06, 'epoch': 1.45} {'loss': 0.3224, 'learning_rate': 3.7816646441608073e-06, 'epoch': 1.45} {'loss': 0.1921, 'learning_rate': 3.7814015269569005e-06, 'epoch': 1.45} {'loss': 0.3936, 'learning_rate': 3.781138416772612e-06, 'epoch': 1.45} {'loss': 0.249, 'learning_rate': 3.780875313608232e-06, 'epoch': 1.45} {'loss': 0.5177, 'learning_rate': 3.780612217464065e-06, 'epoch': 1.45} {'loss': 0.2226, 'learning_rate': 3.7803491283404005e-06, 'epoch': 1.45} {'loss': 0.2769, 'learning_rate': 3.7800860462375424e-06, 'epoch': 1.45} {'loss': 0.2144, 'learning_rate': 3.7798229711557844e-06, 'epoch': 1.45} {'loss': 0.2606, 'learning_rate': 3.77955990309542e-06, 'epoch': 1.45} {'loss': 0.3694, 'learning_rate': 3.7792968420567522e-06, 'epoch': 1.45} {'loss': 0.361, 'learning_rate': 3.779033788040073e-06, 'epoch': 1.45} {'loss': 0.3794, 'learning_rate': 3.7787707410456853e-06, 'epoch': 1.45} {'loss': 0.4285, 'learning_rate': 3.778507701073878e-06, 'epoch': 1.45} {'loss': 0.362, 'learning_rate': 3.778244668124957e-06, 'epoch': 1.45} {'loss': 0.2279, 'learning_rate': 3.777981642199211e-06, 'epoch': 1.45} {'loss': 0.4354, 'learning_rate': 3.7777186232969432e-06, 'epoch': 1.45} {'loss': 0.3685, 'learning_rate': 3.7774556114184447e-06, 'epoch': 1.45} {'loss': 0.365, 'learning_rate': 3.77719260656402e-06, 'epoch': 1.45} {'loss': 0.1467, 'learning_rate': 3.776929608733957e-06, 'epoch': 1.45} {'loss': 0.1567, 'learning_rate': 3.7766666179285604e-06, 'epoch': 1.45} {'loss': 0.2598, 'learning_rate': 3.7764036341481247e-06, 'epoch': 1.45} {'loss': 0.4461, 'learning_rate': 3.7761406573929417e-06, 'epoch': 1.45} {'loss': 0.1855, 'learning_rate': 3.7758776876633164e-06, 'epoch': 1.45} {'loss': 0.3273, 'learning_rate': 3.7756147249595375e-06, 'epoch': 1.45} {'loss': 0.2713, 'learning_rate': 3.7753517692819097e-06, 'epoch': 1.45} {'loss': 0.2945, 'learning_rate': 3.7750888206307225e-06, 'epoch': 1.45} {'loss': 0.2907, 'learning_rate': 3.7748258790062797e-06, 'epoch': 1.45} {'loss': 0.3907, 'learning_rate': 3.7745629444088718e-06, 'epoch': 1.45} {'loss': 0.4988, 'learning_rate': 3.7743000168387977e-06, 'epoch': 1.45} {'loss': 0.2444, 'learning_rate': 3.774037096296359e-06, 'epoch': 1.45} {'loss': 0.286, 'learning_rate': 3.7737741827818444e-06, 'epoch': 1.45} {'loss': 0.3322, 'learning_rate': 3.7735112762955584e-06, 'epoch': 1.45} {'loss': 0.405, 'learning_rate': 3.7732483768377913e-06, 'epoch': 1.45} {'loss': 0.3269, 'learning_rate': 3.7729854844088467e-06, 'epoch': 1.45} {'loss': 0.2704, 'learning_rate': 3.7727225990090122e-06, 'epoch': 1.45} {'loss': 0.3047, 'learning_rate': 3.772459720638595e-06, 'epoch': 1.45} {'loss': 0.3828, 'learning_rate': 3.772196849297881e-06, 'epoch': 1.45} {'loss': 0.28, 'learning_rate': 3.7719339849871774e-06, 'epoch': 1.45} {'loss': 0.4856, 'learning_rate': 3.771671127706773e-06, 'epoch': 1.45} {'loss': 0.399, 'learning_rate': 3.7714082774569695e-06, 'epoch': 1.45} {'loss': 0.3236, 'learning_rate': 3.7711454342380625e-06, 'epoch': 1.45} {'loss': 0.5374, 'learning_rate': 3.770882598050345e-06, 'epoch': 1.45} {'loss': 0.3175, 'learning_rate': 3.7706197688941183e-06, 'epoch': 1.45} {'loss': 0.2502, 'learning_rate': 3.7703569467696754e-06, 'epoch': 1.45} {'loss': 0.4519, 'learning_rate': 3.7700941316773177e-06, 'epoch': 1.45} {'loss': 0.3492, 'learning_rate': 3.7698313236173355e-06, 'epoch': 1.45} {'loss': 0.2855, 'learning_rate': 3.7695685225900324e-06, 'epoch': 1.45} {'loss': 0.2971, 'learning_rate': 3.7693057285956993e-06, 'epoch': 1.45} {'loss': 0.2124, 'learning_rate': 3.7690429416346374e-06, 'epoch': 1.45} {'loss': 0.2918, 'learning_rate': 3.768780161707137e-06, 'epoch': 1.45} {'loss': 0.2748, 'learning_rate': 3.768517388813504e-06, 'epoch': 1.45} {'loss': 0.3438, 'learning_rate': 3.7682546229540263e-06, 'epoch': 1.45} {'loss': 0.2702, 'learning_rate': 3.767991864129007e-06, 'epoch': 1.45} {'loss': 0.3184, 'learning_rate': 3.7677291123387396e-06, 'epoch': 1.45} {'loss': 0.4011, 'learning_rate': 3.7674663675835176e-06, 'epoch': 1.45} {'loss': 0.3117, 'learning_rate': 3.767203629863645e-06, 'epoch': 1.45} {'loss': 0.4621, 'learning_rate': 3.7669408991794097e-06, 'epoch': 1.45} {'loss': 0.3033, 'learning_rate': 3.7666781755311176e-06, 'epoch': 1.45} {'loss': 0.3196, 'learning_rate': 3.766415458919056e-06, 'epoch': 1.45} {'loss': 0.2444, 'learning_rate': 3.76615274934353e-06, 'epoch': 1.45} {'loss': 0.2889, 'learning_rate': 3.7658900468048286e-06, 'epoch': 1.45} {'loss': 0.3437, 'learning_rate': 3.765627351303256e-06, 'epoch': 1.45} {'loss': 0.2382, 'learning_rate': 3.7653646628391004e-06, 'epoch': 1.45} {'loss': 0.4428, 'learning_rate': 3.7651019814126656e-06, 'epoch': 1.45} {'loss': 0.2024, 'learning_rate': 3.7648393070242416e-06, 'epoch': 1.45} {'loss': 0.4093, 'learning_rate': 3.7645766396741323e-06, 'epoch': 1.45} {'loss': 0.3009, 'learning_rate': 3.7643139793626306e-06, 'epoch': 1.45} {'loss': 0.285, 'learning_rate': 3.764051326090029e-06, 'epoch': 1.45} {'loss': 0.3798, 'learning_rate': 3.7637886798566302e-06, 'epoch': 1.45} {'loss': 0.2893, 'learning_rate': 3.7635260406627263e-06, 'epoch': 1.45} {'loss': 0.3167, 'learning_rate': 3.7632634085086173e-06, 'epoch': 1.45} {'loss': 0.1772, 'learning_rate': 3.7630007833945947e-06, 'epoch': 1.45} {'loss': 0.2975, 'learning_rate': 3.7627381653209626e-06, 'epoch': 1.45} {'loss': 0.3326, 'learning_rate': 3.7624755542880086e-06, 'epoch': 1.45} {'loss': 0.32, 'learning_rate': 3.762212950296038e-06, 'epoch': 1.45} {'loss': 0.3714, 'learning_rate': 3.7619503533453395e-06, 'epoch': 1.45} {'loss': 0.2832, 'learning_rate': 3.7616877634362157e-06, 'epoch': 1.45} {'loss': 0.3657, 'learning_rate': 3.7614251805689562e-06, 'epoch': 1.45} {'loss': 0.2642, 'learning_rate': 3.7611626047438656e-06, 'epoch': 1.45} {'loss': 0.3411, 'learning_rate': 3.7609000359612326e-06, 'epoch': 1.45} {'loss': 0.4285, 'learning_rate': 3.7606374742213604e-06, 'epoch': 1.45} {'loss': 0.2354, 'learning_rate': 3.760374919524541e-06, 'epoch': 1.45} {'loss': 0.2766, 'learning_rate': 3.7601123718710695e-06, 'epoch': 1.45} {'loss': 0.3983, 'learning_rate': 3.7598498312612474e-06, 'epoch': 1.45} {'loss': 0.3962, 'learning_rate': 3.7595872976953653e-06, 'epoch': 1.45} {'loss': 0.268, 'learning_rate': 3.759324771173726e-06, 'epoch': 1.45} {'loss': 0.3853, 'learning_rate': 3.759062251696618e-06, 'epoch': 1.45} {'loss': 0.1669, 'learning_rate': 3.758799739264346e-06, 'epoch': 1.45} {'loss': 0.3679, 'learning_rate': 3.7585372338771987e-06, 'epoch': 1.45} {'loss': 0.2991, 'learning_rate': 3.75827473553548e-06, 'epoch': 1.45} {'loss': 0.2197, 'learning_rate': 3.7580122442394785e-06, 'epoch': 1.45} {'loss': 0.3902, 'learning_rate': 3.7577497599894973e-06, 'epoch': 1.45} {'loss': 0.3852, 'learning_rate': 3.7574872827858253e-06, 'epoch': 1.45} {'loss': 0.169, 'learning_rate': 3.7572248126287682e-06, 'epoch': 1.45} {'loss': 0.3276, 'learning_rate': 3.7569623495186157e-06, 'epoch': 1.45} {'loss': 0.5637, 'learning_rate': 3.756699893455663e-06, 'epoch': 1.45} {'loss': 0.2898, 'learning_rate': 3.756437444440213e-06, 'epoch': 1.45} {'loss': 0.3231, 'learning_rate': 3.7561750024725528e-06, 'epoch': 1.45} {'loss': 0.4179, 'learning_rate': 3.7559125675529883e-06, 'epoch': 1.45} {'loss': 0.1274, 'learning_rate': 3.755650139681808e-06, 'epoch': 1.45} {'loss': 0.3784, 'learning_rate': 3.7553877188593134e-06, 'epoch': 1.45} {'loss': 0.3538, 'learning_rate': 3.755125305085796e-06, 'epoch': 1.45} {'loss': 0.2636, 'learning_rate': 3.7548628983615587e-06, 'epoch': 1.45} {'loss': 0.2765, 'learning_rate': 3.754600498686889e-06, 'epoch': 1.45} {'loss': 0.2358, 'learning_rate': 3.754338106062091e-06, 'epoch': 1.45} {'loss': 0.2828, 'learning_rate': 3.754075720487456e-06, 'epoch': 1.45} {'loss': 0.3024, 'learning_rate': 3.7538133419632827e-06, 'epoch': 1.45} {'loss': 0.3392, 'learning_rate': 3.7535509704898677e-06, 'epoch': 1.45} {'loss': 0.4886, 'learning_rate': 3.7532886060675023e-06, 'epoch': 1.45} {'loss': 0.3004, 'learning_rate': 3.7530262486964896e-06, 'epoch': 1.45} {'loss': 0.3171, 'learning_rate': 3.75276389837712e-06, 'epoch': 1.45} {'loss': 0.2237, 'learning_rate': 3.752501555109693e-06, 'epoch': 1.45} {'loss': 0.2623, 'learning_rate': 3.7522392188945024e-06, 'epoch': 1.45} {'loss': 0.2498, 'learning_rate': 3.751976889731849e-06, 'epoch': 1.45} {'loss': 0.251, 'learning_rate': 3.751714567622021e-06, 'epoch': 1.45} {'loss': 0.3148, 'learning_rate': 3.751452252565323e-06, 'epoch': 1.45} {'loss': 0.23, 'learning_rate': 3.7511899445620438e-06, 'epoch': 1.45} {'loss': 0.2074, 'learning_rate': 3.7509276436124865e-06, 'epoch': 1.45} {'loss': 0.2613, 'learning_rate': 3.75066534971694e-06, 'epoch': 1.45} {'loss': 0.3114, 'learning_rate': 3.750403062875707e-06, 'epoch': 1.45} {'loss': 0.3889, 'learning_rate': 3.7501407830890813e-06, 'epoch': 1.45} {'loss': 0.2698, 'learning_rate': 3.7498785103573544e-06, 'epoch': 1.45} {'loss': 0.3501, 'learning_rate': 3.749616244680829e-06, 'epoch': 1.45} {'loss': 0.2794, 'learning_rate': 3.749353986059796e-06, 'epoch': 1.45} {'loss': 0.2926, 'learning_rate': 3.7490917344945564e-06, 'epoch': 1.45} {'loss': 0.2411, 'learning_rate': 3.7488294899854006e-06, 'epoch': 1.45} {'loss': 0.3037, 'learning_rate': 3.74856725253263e-06, 'epoch': 1.45} {'loss': 0.2917, 'learning_rate': 3.7483050221365358e-06, 'epoch': 1.45} {'loss': 0.3283, 'learning_rate': 3.7480427987974154e-06, 'epoch': 1.45} {'loss': 0.3255, 'learning_rate': 3.74778058251557e-06, 'epoch': 1.45} {'loss': 0.2657, 'learning_rate': 3.747518373291288e-06, 'epoch': 1.45} {'loss': 0.4187, 'learning_rate': 3.747256171124872e-06, 'epoch': 1.45} {'loss': 0.3182, 'learning_rate': 3.746993976016612e-06, 'epoch': 1.45} {'loss': 0.2661, 'learning_rate': 3.7467317879668096e-06, 'epoch': 1.45} {'loss': 0.2645, 'learning_rate': 3.7464696069757545e-06, 'epoch': 1.45} {'loss': 0.2764, 'learning_rate': 3.7462074330437492e-06, 'epoch': 1.45} {'loss': 0.3063, 'learning_rate': 3.745945266171084e-06, 'epoch': 1.45} {'loss': 0.3238, 'learning_rate': 3.74568310635806e-06, 'epoch': 1.45} {'loss': 0.2826, 'learning_rate': 3.745420953604967e-06, 'epoch': 1.45} {'loss': 0.4567, 'learning_rate': 3.7451588079121083e-06, 'epoch': 1.45} {'loss': 0.3302, 'learning_rate': 3.744896669279775e-06, 'epoch': 1.45} {'loss': 0.3627, 'learning_rate': 3.7446345377082618e-06, 'epoch': 1.45} {'loss': 0.257, 'learning_rate': 3.744372413197869e-06, 'epoch': 1.45} {'loss': 0.4474, 'learning_rate': 3.7441102957488873e-06, 'epoch': 1.45} {'loss': 0.183, 'learning_rate': 3.743848185361618e-06, 'epoch': 1.45} {'loss': 0.4087, 'learning_rate': 3.7435860820363523e-06, 'epoch': 1.45} {'loss': 0.4242, 'learning_rate': 3.7433239857733905e-06, 'epoch': 1.45} {'loss': 0.3608, 'learning_rate': 3.7430618965730238e-06, 'epoch': 1.45} {'loss': 0.4449, 'learning_rate': 3.7427998144355527e-06, 'epoch': 1.45} {'loss': 0.3067, 'learning_rate': 3.7425377393612684e-06, 'epoch': 1.45} {'loss': 0.3563, 'learning_rate': 3.7422756713504714e-06, 'epoch': 1.45} {'loss': 0.335, 'learning_rate': 3.742013610403453e-06, 'epoch': 1.45} {'loss': 0.3956, 'learning_rate': 3.7417515565205144e-06, 'epoch': 1.45} {'loss': 0.2007, 'learning_rate': 3.7414895097019477e-06, 'epoch': 1.45} {'loss': 0.3898, 'learning_rate': 3.7412274699480457e-06, 'epoch': 1.45} {'loss': 0.4236, 'learning_rate': 3.740965437259112e-06, 'epoch': 1.45} {'loss': 0.4295, 'learning_rate': 3.7407034116354333e-06, 'epoch': 1.45} {'loss': 0.2908, 'learning_rate': 3.7404413930773154e-06, 'epoch': 1.45} {'loss': 0.201, 'learning_rate': 3.740179381585044e-06, 'epoch': 1.45} {'loss': 0.2568, 'learning_rate': 3.7399173771589235e-06, 'epoch': 1.45} {'loss': 0.3048, 'learning_rate': 3.739655379799243e-06, 'epoch': 1.45} {'loss': 0.1671, 'learning_rate': 3.739393389506304e-06, 'epoch': 1.45} {'loss': 0.4895, 'learning_rate': 3.7391314062803964e-06, 'epoch': 1.45} {'loss': 0.4045, 'learning_rate': 3.738869430121821e-06, 'epoch': 1.45} {'loss': 0.2152, 'learning_rate': 3.7386074610308696e-06, 'epoch': 1.45} {'loss': 0.242, 'learning_rate': 3.7383454990078425e-06, 'epoch': 1.45} {'loss': 0.2732, 'learning_rate': 3.7380835440530326e-06, 'epoch': 1.45} {'loss': 0.264, 'learning_rate': 3.737821596166732e-06, 'epoch': 1.45} {'loss': 0.319, 'learning_rate': 3.7375596553492434e-06, 'epoch': 1.45} {'loss': 0.2462, 'learning_rate': 3.7372977216008567e-06, 'epoch': 1.45} {'loss': 0.2129, 'learning_rate': 3.7370357949218717e-06, 'epoch': 1.45} {'loss': 0.2453, 'learning_rate': 3.7367738753125803e-06, 'epoch': 1.45} {'loss': 0.4724, 'learning_rate': 3.7365119627732828e-06, 'epoch': 1.45} {'loss': 0.3816, 'learning_rate': 3.736250057304269e-06, 'epoch': 1.45} {'loss': 0.3884, 'learning_rate': 3.735988158905841e-06, 'epoch': 1.45} {'loss': 0.1928, 'learning_rate': 3.735726267578289e-06, 'epoch': 1.45} {'loss': 0.2227, 'learning_rate': 3.735464383321913e-06, 'epoch': 1.45} {'loss': 0.3928, 'learning_rate': 3.7352025061370036e-06, 'epoch': 1.45} {'loss': 0.3734, 'learning_rate': 3.7349406360238627e-06, 'epoch': 1.45} {'loss': 0.2411, 'learning_rate': 3.7346787729827815e-06, 'epoch': 1.45} {'loss': 0.224, 'learning_rate': 3.7344169170140544e-06, 'epoch': 1.45} {'loss': 0.3838, 'learning_rate': 3.7341550681179818e-06, 'epoch': 1.45} {'loss': 0.3931, 'learning_rate': 3.7338932262948536e-06, 'epoch': 1.45} {'loss': 0.2791, 'learning_rate': 3.733631391544972e-06, 'epoch': 1.45} {'loss': 0.3008, 'learning_rate': 3.733369563868625e-06, 'epoch': 1.45} {'loss': 0.2047, 'learning_rate': 3.7331077432661154e-06, 'epoch': 1.45} {'loss': 0.3852, 'learning_rate': 3.732845929737733e-06, 'epoch': 1.45} {'loss': 0.2282, 'learning_rate': 3.732584123283778e-06, 'epoch': 1.45} {'loss': 0.361, 'learning_rate': 3.7323223239045414e-06, 'epoch': 1.45} {'loss': 0.4113, 'learning_rate': 3.7320605316003235e-06, 'epoch': 1.45} {'loss': 0.3134, 'learning_rate': 3.7317987463714145e-06, 'epoch': 1.45} {'loss': 0.2221, 'learning_rate': 3.7315369682181157e-06, 'epoch': 1.45} {'loss': 0.2248, 'learning_rate': 3.73127519714072e-06, 'epoch': 1.45} {'loss': 0.3999, 'learning_rate': 3.7310134331395197e-06, 'epoch': 1.45} {'loss': 0.4624, 'learning_rate': 3.7307516762148156e-06, 'epoch': 1.45} {'loss': 0.2867, 'learning_rate': 3.730489926366898e-06, 'epoch': 1.45} {'loss': 0.2622, 'learning_rate': 3.7302281835960687e-06, 'epoch': 1.45} {'loss': 0.3786, 'learning_rate': 3.7299664479026155e-06, 'epoch': 1.45} {'loss': 0.3793, 'learning_rate': 3.729704719286841e-06, 'epoch': 1.45} {'loss': 0.2451, 'learning_rate': 3.7294429977490345e-06, 'epoch': 1.45} {'loss': 0.2757, 'learning_rate': 3.729181283289498e-06, 'epoch': 1.45} {'loss': 0.2749, 'learning_rate': 3.7289195759085194e-06, 'epoch': 1.45} {'loss': 0.2117, 'learning_rate': 3.7286578756064016e-06, 'epoch': 1.45} {'loss': 0.1879, 'learning_rate': 3.7283961823834337e-06, 'epoch': 1.45} {'loss': 0.339, 'learning_rate': 3.7281344962399167e-06, 'epoch': 1.45} {'loss': 0.3456, 'learning_rate': 3.7278728171761446e-06, 'epoch': 1.45} {'loss': 0.2839, 'learning_rate': 3.7276111451924067e-06, 'epoch': 1.45} {'loss': 0.2859, 'learning_rate': 3.7273494802890066e-06, 'epoch': 1.45} {'loss': 0.4327, 'learning_rate': 3.727087822466233e-06, 'epoch': 1.45} {'loss': 0.1733, 'learning_rate': 3.726826171724387e-06, 'epoch': 1.45} {'loss': 0.2451, 'learning_rate': 3.7265645280637584e-06, 'epoch': 1.45} {'loss': 0.3601, 'learning_rate': 3.72630289148465e-06, 'epoch': 1.45} {'loss': 0.3453, 'learning_rate': 3.726041261987348e-06, 'epoch': 1.45} {'loss': 0.289, 'learning_rate': 3.725779639572156e-06, 'epoch': 1.45} {'loss': 0.4294, 'learning_rate': 3.725518024239363e-06, 'epoch': 1.45} {'loss': 0.3902, 'learning_rate': 3.725256415989269e-06, 'epoch': 1.45} {'loss': 0.4019, 'learning_rate': 3.724994814822165e-06, 'epoch': 1.45} {'loss': 0.4622, 'learning_rate': 3.7247332207383526e-06, 'epoch': 1.45} {'loss': 0.3135, 'learning_rate': 3.7244716337381214e-06, 'epoch': 1.45} {'loss': 0.2934, 'learning_rate': 3.724210053821766e-06, 'epoch': 1.45} {'loss': 0.4976, 'learning_rate': 3.7239484809895875e-06, 'epoch': 1.45} {'loss': 0.3746, 'learning_rate': 3.723686915241874e-06, 'epoch': 1.45} {'loss': 0.388, 'learning_rate': 3.723425356578928e-06, 'epoch': 1.45} {'loss': 0.239, 'learning_rate': 3.7231638050010377e-06, 'epoch': 1.45} {'loss': 0.2926, 'learning_rate': 3.7229022605085053e-06, 'epoch': 1.45} {'loss': 0.2539, 'learning_rate': 3.722640723101619e-06, 'epoch': 1.45} {'loss': 0.1156, 'learning_rate': 3.7223791927806807e-06, 'epoch': 1.45} {'loss': 0.3473, 'learning_rate': 3.7221176695459804e-06, 'epoch': 1.45} {'loss': 0.3105, 'learning_rate': 3.721856153397815e-06, 'epoch': 1.45} {'loss': 0.3561, 'learning_rate': 3.7215946443364827e-06, 'epoch': 1.45} {'loss': 0.4124, 'learning_rate': 3.7213331423622735e-06, 'epoch': 1.45} {'loss': 0.4084, 'learning_rate': 3.7210716474754883e-06, 'epoch': 1.45} {'loss': 0.311, 'learning_rate': 3.720810159676417e-06, 'epoch': 1.45} {'loss': 0.3623, 'learning_rate': 3.7205486789653588e-06, 'epoch': 1.45} {'loss': 0.231, 'learning_rate': 3.7202872053426043e-06, 'epoch': 1.45} {'loss': 0.489, 'learning_rate': 3.7200257388084548e-06, 'epoch': 1.45} {'loss': 0.4112, 'learning_rate': 3.7197642793631985e-06, 'epoch': 1.45} {'loss': 0.254, 'learning_rate': 3.7195028270071374e-06, 'epoch': 1.45} {'loss': 0.3742, 'learning_rate': 3.7192413817405605e-06, 'epoch': 1.45} {'loss': 0.2565, 'learning_rate': 3.7189799435637687e-06, 'epoch': 1.45} {'loss': 0.2564, 'learning_rate': 3.7187185124770543e-06, 'epoch': 1.45} {'loss': 0.4731, 'learning_rate': 3.7184570884807092e-06, 'epoch': 1.45} {'loss': 0.2287, 'learning_rate': 3.7181956715750345e-06, 'epoch': 1.45} {'loss': 0.2538, 'learning_rate': 3.717934261760319e-06, 'epoch': 1.45} {'loss': 0.2427, 'learning_rate': 3.7176728590368636e-06, 'epoch': 1.45} {'loss': 0.2838, 'learning_rate': 3.7174114634049584e-06, 'epoch': 1.45} {'loss': 0.2011, 'learning_rate': 3.7171500748649046e-06, 'epoch': 1.45} {'loss': 0.2973, 'learning_rate': 3.71688869341699e-06, 'epoch': 1.45} {'loss': 0.2437, 'learning_rate': 3.7166273190615164e-06, 'epoch': 1.45} {'loss': 0.3976, 'learning_rate': 3.7163659517987728e-06, 'epoch': 1.45} {'loss': 0.3471, 'learning_rate': 3.7161045916290606e-06, 'epoch': 1.45} {'loss': 0.3273, 'learning_rate': 3.715843238552668e-06, 'epoch': 1.45} {'loss': 0.2126, 'learning_rate': 3.715581892569896e-06, 'epoch': 1.45} {'loss': 0.3902, 'learning_rate': 3.7153205536810375e-06, 'epoch': 1.45} {'loss': 0.4139, 'learning_rate': 3.7150592218863844e-06, 'epoch': 1.45} {'loss': 0.3873, 'learning_rate': 3.7147978971862366e-06, 'epoch': 1.45} {'loss': 0.4524, 'learning_rate': 3.714536579580884e-06, 'epoch': 1.45} {'loss': 0.3058, 'learning_rate': 3.7142752690706274e-06, 'epoch': 1.45} {'loss': 0.374, 'learning_rate': 3.714013965655755e-06, 'epoch': 1.45} {'loss': 0.3485, 'learning_rate': 3.71375266933657e-06, 'epoch': 1.45} {'loss': 0.4555, 'learning_rate': 3.7134913801133586e-06, 'epoch': 1.45} {'loss': 0.2973, 'learning_rate': 3.7132300979864233e-06, 'epoch': 1.45} {'loss': 0.2923, 'learning_rate': 3.7129688229560533e-06, 'epoch': 1.45} {'loss': 0.231, 'learning_rate': 3.7127075550225476e-06, 'epoch': 1.45} {'loss': 0.2636, 'learning_rate': 3.7124462941861984e-06, 'epoch': 1.45} {'loss': 0.4083, 'learning_rate': 3.712185040447304e-06, 'epoch': 1.45} {'loss': 0.2545, 'learning_rate': 3.7119237938061558e-06, 'epoch': 1.45} {'loss': 0.185, 'learning_rate': 3.711662554263048e-06, 'epoch': 1.45} {'loss': 0.2895, 'learning_rate': 3.711401321818281e-06, 'epoch': 1.45} {'loss': 0.3137, 'learning_rate': 3.711140096472141e-06, 'epoch': 1.45} {'loss': 0.2847, 'learning_rate': 3.7108788782249327e-06, 'epoch': 1.45} {'loss': 0.3245, 'learning_rate': 3.7106176670769423e-06, 'epoch': 1.45} {'loss': 0.2752, 'learning_rate': 3.710356463028473e-06, 'epoch': 1.45} {'loss': 0.3805, 'learning_rate': 3.7100952660798107e-06, 'epoch': 1.45} {'loss': 0.5727, 'learning_rate': 3.7098340762312578e-06, 'epoch': 1.45} {'loss': 0.2239, 'learning_rate': 3.7095728934831042e-06, 'epoch': 1.45} {'loss': 0.4139, 'learning_rate': 3.7093117178356487e-06, 'epoch': 1.45} {'loss': 0.3217, 'learning_rate': 3.7090505492891816e-06, 'epoch': 1.45} {'loss': 0.1972, 'learning_rate': 3.708789387844003e-06, 'epoch': 1.45} {'loss': 0.2647, 'learning_rate': 3.7085282335004046e-06, 'epoch': 1.45} {'loss': 0.2673, 'learning_rate': 3.7082670862586787e-06, 'epoch': 1.45} {'loss': 0.3058, 'learning_rate': 3.7080059461191264e-06, 'epoch': 1.45} {'loss': 0.1614, 'learning_rate': 3.7077448130820346e-06, 'epoch': 1.45} {'loss': 0.3322, 'learning_rate': 3.707483687147706e-06, 'epoch': 1.45} {'loss': 0.5181, 'learning_rate': 3.7072225683164286e-06, 'epoch': 1.45} {'loss': 0.3032, 'learning_rate': 3.706961456588504e-06, 'epoch': 1.45} {'loss': 0.4013, 'learning_rate': 3.7067003519642197e-06, 'epoch': 1.45} {'loss': 0.2672, 'learning_rate': 3.7064392544438767e-06, 'epoch': 1.45} {'loss': 0.2182, 'learning_rate': 3.706178164027764e-06, 'epoch': 1.45} {'loss': 0.1779, 'learning_rate': 3.7059170807161825e-06, 'epoch': 1.45} {'loss': 0.2408, 'learning_rate': 3.7056560045094213e-06, 'epoch': 1.45} {'loss': 0.1959, 'learning_rate': 3.70539493540778e-06, 'epoch': 1.45} {'loss': 0.4408, 'learning_rate': 3.7051338734115516e-06, 'epoch': 1.45} {'loss': 0.2559, 'learning_rate': 3.704872818521026e-06, 'epoch': 1.45} {'loss': 0.3437, 'learning_rate': 3.7046117707365047e-06, 'epoch': 1.45} {'loss': 0.3928, 'learning_rate': 3.704350730058277e-06, 'epoch': 1.45} {'loss': 0.3811, 'learning_rate': 3.7040896964866447e-06, 'epoch': 1.45} {'loss': 0.2978, 'learning_rate': 3.703828670021893e-06, 'epoch': 1.45} {'loss': 0.4564, 'learning_rate': 3.7035676506643247e-06, 'epoch': 1.45} {'loss': 0.2997, 'learning_rate': 3.703306638414228e-06, 'epoch': 1.45} {'loss': 0.2222, 'learning_rate': 3.7030456332719046e-06, 'epoch': 1.45} {'loss': 0.2743, 'learning_rate': 3.7027846352376417e-06, 'epoch': 1.45} {'loss': 0.2382, 'learning_rate': 3.7025236443117407e-06, 'epoch': 1.45} {'loss': 0.285, 'learning_rate': 3.70226266049449e-06, 'epoch': 1.45} {'loss': 0.3115, 'learning_rate': 3.7020016837861903e-06, 'epoch': 1.45} {'loss': 0.3581, 'learning_rate': 3.701740714187133e-06, 'epoch': 1.45} {'loss': 0.2423, 'learning_rate': 3.70147975169761e-06, 'epoch': 1.45} {'loss': 0.3074, 'learning_rate': 3.7012187963179213e-06, 'epoch': 1.45} {'loss': 0.2484, 'learning_rate': 3.7009578480483556e-06, 'epoch': 1.45} {'loss': 0.369, 'learning_rate': 3.700696906889214e-06, 'epoch': 1.45} {'loss': 0.27, 'learning_rate': 3.7004359728407846e-06, 'epoch': 1.45} {'loss': 0.308, 'learning_rate': 3.700175045903368e-06, 'epoch': 1.45} {'loss': 0.2753, 'learning_rate': 3.699914126077253e-06, 'epoch': 1.45} {'loss': 0.4296, 'learning_rate': 3.6996532133627405e-06, 'epoch': 1.45} {'loss': 0.195, 'learning_rate': 3.6993923077601166e-06, 'epoch': 1.45} {'loss': 0.32, 'learning_rate': 3.699131409269686e-06, 'epoch': 1.45} {'loss': 0.177, 'learning_rate': 3.698870517891733e-06, 'epoch': 1.45} {'loss': 0.2765, 'learning_rate': 3.698609633626561e-06, 'epoch': 1.45} {'loss': 0.3236, 'learning_rate': 3.69834875647446e-06, 'epoch': 1.45} {'loss': 0.3182, 'learning_rate': 3.6980878864357228e-06, 'epoch': 1.45} {'loss': 0.2405, 'learning_rate': 3.6978270235106485e-06, 'epoch': 1.45} {'loss': 0.3567, 'learning_rate': 3.6975661676995257e-06, 'epoch': 1.45} {'loss': 0.5591, 'learning_rate': 3.6973053190026555e-06, 'epoch': 1.45} {'loss': 0.2396, 'learning_rate': 3.697044477420325e-06, 'epoch': 1.45} {'loss': 0.4381, 'learning_rate': 3.696783642952837e-06, 'epoch': 1.45} {'loss': 0.2492, 'learning_rate': 3.6965228156004786e-06, 'epoch': 1.45} {'loss': 0.2448, 'learning_rate': 3.696261995363547e-06, 'epoch': 1.45} {'loss': 0.242, 'learning_rate': 3.6960011822423405e-06, 'epoch': 1.45} {'loss': 0.4972, 'learning_rate': 3.695740376237146e-06, 'epoch': 1.45} {'loss': 0.3737, 'learning_rate': 3.6954795773482656e-06, 'epoch': 1.45} {'loss': 0.3037, 'learning_rate': 3.695218785575986e-06, 'epoch': 1.45} {'loss': 0.3421, 'learning_rate': 3.6949580009206087e-06, 'epoch': 1.45} {'loss': 0.2829, 'learning_rate': 3.694697223382422e-06, 'epoch': 1.45} {'loss': 0.2198, 'learning_rate': 3.694436452961727e-06, 'epoch': 1.45} {'loss': 0.2969, 'learning_rate': 3.69417568965881e-06, 'epoch': 1.45} {'loss': 0.3958, 'learning_rate': 3.693914933473973e-06, 'epoch': 1.45} {'loss': 0.3659, 'learning_rate': 3.6936541844075034e-06, 'epoch': 1.45} {'loss': 0.3908, 'learning_rate': 3.6933934424597028e-06, 'epoch': 1.45} {'loss': 0.4587, 'learning_rate': 3.693132707630862e-06, 'epoch': 1.45} {'loss': 0.3254, 'learning_rate': 3.692871979921271e-06, 'epoch': 1.45} {'loss': 0.289, 'learning_rate': 3.6926112593312325e-06, 'epoch': 1.45} {'loss': 0.296, 'learning_rate': 3.692350545861032e-06, 'epoch': 1.45} {'loss': 0.2328, 'learning_rate': 3.6920898395109716e-06, 'epoch': 1.45} {'loss': 0.4442, 'learning_rate': 3.69182914028134e-06, 'epoch': 1.45} {'loss': 0.3544, 'learning_rate': 3.6915684481724367e-06, 'epoch': 1.45} {'loss': 0.3539, 'learning_rate': 3.6913077631845494e-06, 'epoch': 1.45} {'loss': 0.2516, 'learning_rate': 3.691047085317979e-06, 'epoch': 1.45} {'loss': 0.3543, 'learning_rate': 3.6907864145730143e-06, 'epoch': 1.45} {'loss': 0.2396, 'learning_rate': 3.6905257509499547e-06, 'epoch': 1.45} {'loss': 0.4147, 'learning_rate': 3.6902650944490883e-06, 'epoch': 1.45} {'loss': 0.3252, 'learning_rate': 3.6900044450707164e-06, 'epoch': 1.45} {'loss': 0.4129, 'learning_rate': 3.6897438028151255e-06, 'epoch': 1.45} {'loss': 0.2744, 'learning_rate': 3.689483167682618e-06, 'epoch': 1.45} {'loss': 0.387, 'learning_rate': 3.6892225396734847e-06, 'epoch': 1.45} {'loss': 0.4844, 'learning_rate': 3.6889619187880145e-06, 'epoch': 1.45} {'loss': 0.2401, 'learning_rate': 3.6887013050265095e-06, 'epoch': 1.45} {'loss': 0.2753, 'learning_rate': 3.6884406983892584e-06, 'epoch': 1.45} {'loss': 0.454, 'learning_rate': 3.6881800988765602e-06, 'epoch': 1.45} {'loss': 0.3373, 'learning_rate': 3.687919506488703e-06, 'epoch': 1.45} {'loss': 0.3292, 'learning_rate': 3.687658921225988e-06, 'epoch': 1.45} {'loss': 0.4332, 'learning_rate': 3.687398343088702e-06, 'epoch': 1.45} {'loss': 0.255, 'learning_rate': 3.687137772077146e-06, 'epoch': 1.45} {'loss': 0.3193, 'learning_rate': 3.6868772081916083e-06, 'epoch': 1.45} {'loss': 0.3449, 'learning_rate': 3.68661665143239e-06, 'epoch': 1.45} {'loss': 0.5036, 'learning_rate': 3.686356101799776e-06, 'epoch': 1.45} {'loss': 0.4316, 'learning_rate': 3.6860955592940693e-06, 'epoch': 1.45} {'loss': 0.4928, 'learning_rate': 3.685835023915559e-06, 'epoch': 1.45} {'loss': 0.452, 'learning_rate': 3.685574495664539e-06, 'epoch': 1.45} {'loss': 0.3842, 'learning_rate': 3.6853139745413068e-06, 'epoch': 1.45} {'loss': 0.3475, 'learning_rate': 3.6850534605461506e-06, 'epoch': 1.45} {'loss': 0.3709, 'learning_rate': 3.6847929536793725e-06, 'epoch': 1.45} {'loss': 0.2138, 'learning_rate': 3.6845324539412585e-06, 'epoch': 1.45} {'loss': 0.2507, 'learning_rate': 3.68427196133211e-06, 'epoch': 1.45} {'loss': 0.3841, 'learning_rate': 3.6840114758522126e-06, 'epoch': 1.45} {'loss': 0.3152, 'learning_rate': 3.68375099750187e-06, 'epoch': 1.45} {'loss': 0.3349, 'learning_rate': 3.683490526281368e-06, 'epoch': 1.45} {'loss': 0.3946, 'learning_rate': 3.6832300621910078e-06, 'epoch': 1.45} {'loss': 0.3697, 'learning_rate': 3.682969605231076e-06, 'epoch': 1.45} {'loss': 0.4413, 'learning_rate': 3.6827091554018724e-06, 'epoch': 1.45} {'loss': 0.2687, 'learning_rate': 3.68244871270369e-06, 'epoch': 1.45} {'loss': 0.2298, 'learning_rate': 3.682188277136819e-06, 'epoch': 1.45} {'loss': 0.2564, 'learning_rate': 3.6819278487015585e-06, 'epoch': 1.45} {'loss': 0.2194, 'learning_rate': 3.681667427398197e-06, 'epoch': 1.45} {'loss': 0.3587, 'learning_rate': 3.681407013227034e-06, 'epoch': 1.45} {'loss': 0.5275, 'learning_rate': 3.681146606188358e-06, 'epoch': 1.45} {'loss': 0.4144, 'learning_rate': 3.68088620628247e-06, 'epoch': 1.45} {'loss': 0.2773, 'learning_rate': 3.6806258135096562e-06, 'epoch': 1.45} {'loss': 0.3646, 'learning_rate': 3.680365427870217e-06, 'epoch': 1.45} {'loss': 0.281, 'learning_rate': 3.68010504936444e-06, 'epoch': 1.45} {'loss': 0.4566, 'learning_rate': 3.6798446779926266e-06, 'epoch': 1.45} {'loss': 0.3913, 'learning_rate': 3.6795843137550634e-06, 'epoch': 1.45} {'loss': 0.2855, 'learning_rate': 3.67932395665205e-06, 'epoch': 1.45} {'loss': 0.3033, 'learning_rate': 3.679063606683879e-06, 'epoch': 1.45} {'loss': 0.2945, 'learning_rate': 3.67880326385084e-06, 'epoch': 1.45} {'loss': 0.4245, 'learning_rate': 3.6785429281532324e-06, 'epoch': 1.45} {'loss': 0.2383, 'learning_rate': 3.678282599591345e-06, 'epoch': 1.45} {'loss': 0.2807, 'learning_rate': 3.6780222781654784e-06, 'epoch': 1.45} {'loss': 0.2426, 'learning_rate': 3.6777619638759176e-06, 'epoch': 1.45} {'loss': 0.3007, 'learning_rate': 3.677501656722966e-06, 'epoch': 1.45} {'loss': 0.397, 'learning_rate': 3.677241356706909e-06, 'epoch': 1.45} {'loss': 0.3232, 'learning_rate': 3.676981063828047e-06, 'epoch': 1.45} {'loss': 0.282, 'learning_rate': 3.676720778086669e-06, 'epoch': 1.45} {'loss': 0.3651, 'learning_rate': 3.676460499483072e-06, 'epoch': 1.45} {'loss': 0.3315, 'learning_rate': 3.6762002280175467e-06, 'epoch': 1.45} {'loss': 0.3245, 'learning_rate': 3.6759399636903925e-06, 'epoch': 1.45} {'loss': 0.2552, 'learning_rate': 3.675679706501899e-06, 'epoch': 1.45} {'loss': 0.2334, 'learning_rate': 3.675419456452357e-06, 'epoch': 1.45} {'loss': 0.3308, 'learning_rate': 3.6751592135420678e-06, 'epoch': 1.45} {'loss': 0.5061, 'learning_rate': 3.6748989777713164e-06, 'epoch': 1.45} {'loss': 0.21, 'learning_rate': 3.6746387491404057e-06, 'epoch': 1.45} {'loss': 0.261, 'learning_rate': 3.6743785276496214e-06, 'epoch': 1.45} {'loss': 0.3439, 'learning_rate': 3.6741183132992643e-06, 'epoch': 1.45} {'loss': 0.2797, 'learning_rate': 3.6738581060896215e-06, 'epoch': 1.45} {'loss': 0.3016, 'learning_rate': 3.6735979060209925e-06, 'epoch': 1.45} {'loss': 0.3728, 'learning_rate': 3.6733377130936653e-06, 'epoch': 1.45} {'loss': 0.24, 'learning_rate': 3.6730775273079413e-06, 'epoch': 1.45} {'loss': 0.4379, 'learning_rate': 3.672817348664105e-06, 'epoch': 1.45} {'loss': 0.2219, 'learning_rate': 3.672557177162459e-06, 'epoch': 1.45} {'loss': 0.3315, 'learning_rate': 3.672297012803292e-06, 'epoch': 1.45} {'loss': 0.2821, 'learning_rate': 3.6720368555868957e-06, 'epoch': 1.45} {'loss': 0.3495, 'learning_rate': 3.671776705513569e-06, 'epoch': 1.45} {'loss': 0.424, 'learning_rate': 3.6715165625836003e-06, 'epoch': 1.45} {'loss': 0.2807, 'learning_rate': 3.6712564267972893e-06, 'epoch': 1.45} {'loss': 0.3323, 'learning_rate': 3.670996298154923e-06, 'epoch': 1.45} {'loss': 0.2407, 'learning_rate': 3.670736176656802e-06, 'epoch': 1.45} {'loss': 0.3252, 'learning_rate': 3.670476062303212e-06, 'epoch': 1.45} {'loss': 0.2265, 'learning_rate': 3.6702159550944518e-06, 'epoch': 1.45} {'loss': 0.2579, 'learning_rate': 3.669955855030817e-06, 'epoch': 1.45} {'loss': 0.3175, 'learning_rate': 3.669695762112595e-06, 'epoch': 1.45} {'loss': 0.3041, 'learning_rate': 3.669435676340086e-06, 'epoch': 1.45} {'loss': 0.3209, 'learning_rate': 3.669175597713577e-06, 'epoch': 1.45} {'loss': 0.3022, 'learning_rate': 3.6689155262333685e-06, 'epoch': 1.45} {'loss': 0.296, 'learning_rate': 3.668655461899747e-06, 'epoch': 1.45} {'loss': 0.4442, 'learning_rate': 3.668395404713012e-06, 'epoch': 1.45} {'loss': 0.3162, 'learning_rate': 3.668135354673452e-06, 'epoch': 1.45} {'loss': 0.2625, 'learning_rate': 3.667875311781367e-06, 'epoch': 1.45} {'loss': 0.3216, 'learning_rate': 3.667615276037043e-06, 'epoch': 1.45} {'loss': 0.4416, 'learning_rate': 3.6673552474407805e-06, 'epoch': 1.45} {'loss': 0.1929, 'learning_rate': 3.6670952259928695e-06, 'epoch': 1.45} {'loss': 0.4676, 'learning_rate': 3.6668352116936003e-06, 'epoch': 1.45} {'loss': 0.2109, 'learning_rate': 3.6665752045432734e-06, 'epoch': 1.45} {'loss': 0.2383, 'learning_rate': 3.6663152045421757e-06, 'epoch': 1.45} {'loss': 0.2286, 'learning_rate': 3.666055211690607e-06, 'epoch': 1.45} {'loss': 0.3087, 'learning_rate': 3.6657952259888543e-06, 'epoch': 1.45} {'loss': 0.1324, 'learning_rate': 3.6655352474372163e-06, 'epoch': 1.45} {'loss': 0.299, 'learning_rate': 3.6652752760359824e-06, 'epoch': 1.45} {'loss': 0.368, 'learning_rate': 3.6650153117854513e-06, 'epoch': 1.45} {'loss': 0.3458, 'learning_rate': 3.6647553546859096e-06, 'epoch': 1.45} {'loss': 0.4475, 'learning_rate': 3.6644954047376578e-06, 'epoch': 1.45} {'loss': 0.3317, 'learning_rate': 3.6642354619409827e-06, 'epoch': 1.45} {'loss': 0.2421, 'learning_rate': 3.663975526296184e-06, 'epoch': 1.45} {'loss': 0.3414, 'learning_rate': 3.6637155978035534e-06, 'epoch': 1.45} {'loss': 0.2408, 'learning_rate': 3.6634556764633777e-06, 'epoch': 1.45} {'loss': 0.4514, 'learning_rate': 3.6631957622759595e-06, 'epoch': 1.45} {'loss': 0.3229, 'learning_rate': 3.662935855241586e-06, 'epoch': 1.45} {'loss': 0.312, 'learning_rate': 3.662675955360555e-06, 'epoch': 1.45} {'loss': 0.4121, 'learning_rate': 3.662416062633155e-06, 'epoch': 1.45} {'loss': 0.264, 'learning_rate': 3.6621561770596858e-06, 'epoch': 1.45} {'loss': 0.5095, 'learning_rate': 3.6618962986404327e-06, 'epoch': 1.45} {'loss': 0.4359, 'learning_rate': 3.6616364273756976e-06, 'epoch': 1.45} {'loss': 0.2327, 'learning_rate': 3.661376563265766e-06, 'epoch': 1.45} {'loss': 0.2004, 'learning_rate': 3.661116706310939e-06, 'epoch': 1.45} {'loss': 0.2682, 'learning_rate': 3.660856856511501e-06, 'epoch': 1.45} {'loss': 0.3689, 'learning_rate': 3.660597013867755e-06, 'epoch': 1.45} {'loss': 0.2, 'learning_rate': 3.660337178379989e-06, 'epoch': 1.45} {'loss': 0.3355, 'learning_rate': 3.660077350048493e-06, 'epoch': 1.45} {'loss': 0.3182, 'learning_rate': 3.659817528873568e-06, 'epoch': 1.45} {'loss': 0.3914, 'learning_rate': 3.6595577148554997e-06, 'epoch': 1.45} {'loss': 0.3188, 'learning_rate': 3.6592979079945878e-06, 'epoch': 1.45} {'loss': 0.2029, 'learning_rate': 3.6590381082911208e-06, 'epoch': 1.45} {'loss': 0.2458, 'learning_rate': 3.658778315745396e-06, 'epoch': 1.45} {'loss': 0.2594, 'learning_rate': 3.658518530357702e-06, 'epoch': 1.45} {'loss': 0.1689, 'learning_rate': 3.6582587521283387e-06, 'epoch': 1.45} {'loss': 0.2638, 'learning_rate': 3.657998981057591e-06, 'epoch': 1.45} {'loss': 0.3453, 'learning_rate': 3.6577392171457604e-06, 'epoch': 1.45} {'loss': 0.3228, 'learning_rate': 3.657479460393132e-06, 'epoch': 1.45} {'loss': 0.3028, 'learning_rate': 3.6572197108000074e-06, 'epoch': 1.45} {'loss': 0.3851, 'learning_rate': 3.6569599683666746e-06, 'epoch': 1.45} {'loss': 0.3801, 'learning_rate': 3.656700233093425e-06, 'epoch': 1.45} {'loss': 0.4957, 'learning_rate': 3.6564405049805586e-06, 'epoch': 1.45} {'loss': 0.4309, 'learning_rate': 3.6561807840283604e-06, 'epoch': 1.45} {'loss': 0.3639, 'learning_rate': 3.6559210702371315e-06, 'epoch': 1.45} {'loss': 0.357, 'learning_rate': 3.655661363607158e-06, 'epoch': 1.46} {'loss': 0.2849, 'learning_rate': 3.65540166413874e-06, 'epoch': 1.46} {'loss': 0.262, 'learning_rate': 3.6551419718321636e-06, 'epoch': 1.46} {'loss': 0.3635, 'learning_rate': 3.6548822866877288e-06, 'epoch': 1.46} {'loss': 0.3555, 'learning_rate': 3.654622608705721e-06, 'epoch': 1.46} {'loss': 0.2218, 'learning_rate': 3.6543629378864422e-06, 'epoch': 1.46} {'loss': 0.2643, 'learning_rate': 3.6541032742301762e-06, 'epoch': 1.46} {'loss': 0.2539, 'learning_rate': 3.653843617737225e-06, 'epoch': 1.46} {'loss': 0.4844, 'learning_rate': 3.6535839684078776e-06, 'epoch': 1.46} {'loss': 0.2733, 'learning_rate': 3.6533243262424244e-06, 'epoch': 1.46} {'loss': 0.2413, 'learning_rate': 3.653064691241164e-06, 'epoch': 1.46} {'loss': 0.2914, 'learning_rate': 3.652805063404383e-06, 'epoch': 1.46} {'loss': 0.4105, 'learning_rate': 3.6525454427323816e-06, 'epoch': 1.46} {'loss': 0.2478, 'learning_rate': 3.6522858292254458e-06, 'epoch': 1.46} {'loss': 0.355, 'learning_rate': 3.6520262228838767e-06, 'epoch': 1.46} {'loss': 0.3681, 'learning_rate': 3.6517666237079587e-06, 'epoch': 1.46} {'loss': 0.2184, 'learning_rate': 3.651507031697992e-06, 'epoch': 1.46} {'loss': 0.3397, 'learning_rate': 3.6512474468542635e-06, 'epoch': 1.46} {'loss': 0.2432, 'learning_rate': 3.650987869177073e-06, 'epoch': 1.46} {'loss': 0.4967, 'learning_rate': 3.650728298666706e-06, 'epoch': 1.46} {'loss': 0.3699, 'learning_rate': 3.6504687353234635e-06, 'epoch': 1.46} {'loss': 0.3148, 'learning_rate': 3.6502091791476333e-06, 'epoch': 1.46} {'loss': 0.2349, 'learning_rate': 3.649949630139508e-06, 'epoch': 1.46} {'loss': 0.3156, 'learning_rate': 3.6496900882993834e-06, 'epoch': 1.46} {'loss': 0.2517, 'learning_rate': 3.649430553627549e-06, 'epoch': 1.46} {'loss': 0.3367, 'learning_rate': 3.649171026124302e-06, 'epoch': 1.46} {'loss': 0.4273, 'learning_rate': 3.6489115057899315e-06, 'epoch': 1.46} {'loss': 0.3714, 'learning_rate': 3.6486519926247345e-06, 'epoch': 1.46} {'loss': 0.3178, 'learning_rate': 3.6483924866289988e-06, 'epoch': 1.46} {'loss': 0.3428, 'learning_rate': 3.6481329878030226e-06, 'epoch': 1.46} {'loss': 0.2562, 'learning_rate': 3.647873496147094e-06, 'epoch': 1.46} {'loss': 0.1749, 'learning_rate': 3.6476140116615113e-06, 'epoch': 1.46} {'loss': 0.3446, 'learning_rate': 3.647354534346561e-06, 'epoch': 1.46} {'loss': 0.2741, 'learning_rate': 3.6470950642025426e-06, 'epoch': 1.46} {'loss': 0.2977, 'learning_rate': 3.6468356012297435e-06, 'epoch': 1.46} {'loss': 0.3509, 'learning_rate': 3.6465761454284607e-06, 'epoch': 1.46} {'loss': 0.2211, 'learning_rate': 3.646316696798986e-06, 'epoch': 1.46} {'loss': 0.3095, 'learning_rate': 3.6460572553416086e-06, 'epoch': 1.46} {'loss': 0.3973, 'learning_rate': 3.645797821056627e-06, 'epoch': 1.46} {'loss': 0.3033, 'learning_rate': 3.645538393944329e-06, 'epoch': 1.46} {'loss': 0.2651, 'learning_rate': 3.645278974005012e-06, 'epoch': 1.46} {'loss': 0.3068, 'learning_rate': 3.645019561238964e-06, 'epoch': 1.46} {'loss': 0.3815, 'learning_rate': 3.6447601556464795e-06, 'epoch': 1.46} {'loss': 0.3423, 'learning_rate': 3.6445007572278566e-06, 'epoch': 1.46} {'loss': 0.3987, 'learning_rate': 3.644241365983381e-06, 'epoch': 1.46} {'loss': 0.2576, 'learning_rate': 3.6439819819133505e-06, 'epoch': 1.46} {'loss': 0.3854, 'learning_rate': 3.643722605018053e-06, 'epoch': 1.46} {'loss': 0.4359, 'learning_rate': 3.643463235297786e-06, 'epoch': 1.46} {'loss': 0.4514, 'learning_rate': 3.6432038727528384e-06, 'epoch': 1.46} {'loss': 0.3772, 'learning_rate': 3.6429445173835076e-06, 'epoch': 1.46} {'loss': 0.388, 'learning_rate': 3.64268516919008e-06, 'epoch': 1.46} {'loss': 0.2887, 'learning_rate': 3.6424258281728563e-06, 'epoch': 1.46} {'loss': 0.2764, 'learning_rate': 3.64216649433212e-06, 'epoch': 1.46} {'loss': 0.2287, 'learning_rate': 3.641907167668174e-06, 'epoch': 1.46} {'loss': 0.2579, 'learning_rate': 3.641647848181301e-06, 'epoch': 1.46} {'loss': 0.2697, 'learning_rate': 3.6413885358718015e-06, 'epoch': 1.46} {'loss': 0.3806, 'learning_rate': 3.641129230739966e-06, 'epoch': 1.46} {'loss': 0.3428, 'learning_rate': 3.640869932786083e-06, 'epoch': 1.46} {'loss': 0.3695, 'learning_rate': 3.6406106420104526e-06, 'epoch': 1.46} {'loss': 0.516, 'learning_rate': 3.6403513584133587e-06, 'epoch': 1.46} {'loss': 0.2739, 'learning_rate': 3.6400920819951037e-06, 'epoch': 1.46} {'loss': 0.2374, 'learning_rate': 3.63983281275597e-06, 'epoch': 1.46} {'loss': 0.3333, 'learning_rate': 3.6395735506962605e-06, 'epoch': 1.46} {'loss': 0.3325, 'learning_rate': 3.6393142958162597e-06, 'epoch': 1.46} {'loss': 0.231, 'learning_rate': 3.6390550481162654e-06, 'epoch': 1.46} {'loss': 0.2418, 'learning_rate': 3.638795807596567e-06, 'epoch': 1.46} {'loss': 0.3616, 'learning_rate': 3.6385365742574606e-06, 'epoch': 1.46} {'loss': 0.4969, 'learning_rate': 3.638277348099234e-06, 'epoch': 1.46} {'loss': 0.2404, 'learning_rate': 3.638018129122185e-06, 'epoch': 1.46} {'loss': 0.263, 'learning_rate': 3.637758917326605e-06, 'epoch': 1.46} {'loss': 0.1336, 'learning_rate': 3.637499712712781e-06, 'epoch': 1.46} {'loss': 0.2604, 'learning_rate': 3.637240515281013e-06, 'epoch': 1.46} {'loss': 0.4059, 'learning_rate': 3.6369813250315875e-06, 'epoch': 1.46} {'loss': 0.3465, 'learning_rate': 3.6367221419648036e-06, 'epoch': 1.46} {'loss': 0.2664, 'learning_rate': 3.636462966080948e-06, 'epoch': 1.46} {'loss': 0.3385, 'learning_rate': 3.6362037973803175e-06, 'epoch': 1.46} {'loss': 0.3824, 'learning_rate': 3.6359446358632e-06, 'epoch': 1.46} {'loss': 0.2569, 'learning_rate': 3.635685481529895e-06, 'epoch': 1.46} {'loss': 0.415, 'learning_rate': 3.6354263343806862e-06, 'epoch': 1.46} {'loss': 0.4086, 'learning_rate': 3.635167194415874e-06, 'epoch': 1.46} {'loss': 0.4334, 'learning_rate': 3.6349080616357457e-06, 'epoch': 1.46} {'loss': 0.2325, 'learning_rate': 3.634648936040598e-06, 'epoch': 1.46} {'loss': 0.2905, 'learning_rate': 3.634389817630721e-06, 'epoch': 1.46} {'loss': 0.2859, 'learning_rate': 3.634130706406406e-06, 'epoch': 1.46} {'loss': 0.4155, 'learning_rate': 3.6338716023679487e-06, 'epoch': 1.46} {'loss': 0.3336, 'learning_rate': 3.633612505515637e-06, 'epoch': 1.46} {'loss': 0.4212, 'learning_rate': 3.6333534158497683e-06, 'epoch': 1.46} {'loss': 0.2613, 'learning_rate': 3.6330943333706316e-06, 'epoch': 1.46} {'loss': 0.375, 'learning_rate': 3.632835258078522e-06, 'epoch': 1.46} {'loss': 0.2899, 'learning_rate': 3.632576189973729e-06, 'epoch': 1.46} {'loss': 0.2719, 'learning_rate': 3.6323171290565485e-06, 'epoch': 1.46} {'loss': 0.2588, 'learning_rate': 3.632058075327268e-06, 'epoch': 1.46} {'loss': 0.3146, 'learning_rate': 3.631799028786188e-06, 'epoch': 1.46} {'loss': 0.3663, 'learning_rate': 3.631539989433591e-06, 'epoch': 1.46} {'loss': 0.224, 'learning_rate': 3.6312809572697784e-06, 'epoch': 1.46} {'loss': 0.362, 'learning_rate': 3.631021932295038e-06, 'epoch': 1.46} {'loss': 0.2286, 'learning_rate': 3.630762914509659e-06, 'epoch': 1.46} {'loss': 0.3298, 'learning_rate': 3.6305039039139423e-06, 'epoch': 1.46} {'loss': 0.3441, 'learning_rate': 3.630244900508171e-06, 'epoch': 1.46} {'loss': 0.2024, 'learning_rate': 3.6299859042926457e-06, 'epoch': 1.46} {'loss': 0.2967, 'learning_rate': 3.629726915267652e-06, 'epoch': 1.46} {'loss': 0.4115, 'learning_rate': 3.629467933433487e-06, 'epoch': 1.46} {'loss': 0.3846, 'learning_rate': 3.62920895879044e-06, 'epoch': 1.46} {'loss': 0.3475, 'learning_rate': 3.628949991338806e-06, 'epoch': 1.46} {'loss': 0.3314, 'learning_rate': 3.628691031078874e-06, 'epoch': 1.46} {'loss': 0.3266, 'learning_rate': 3.6284320780109415e-06, 'epoch': 1.46} {'loss': 0.2433, 'learning_rate': 3.6281731321352942e-06, 'epoch': 1.46} {'loss': 0.3613, 'learning_rate': 3.627914193452231e-06, 'epoch': 1.46} {'loss': 0.3282, 'learning_rate': 3.6276552619620408e-06, 'epoch': 1.46} {'loss': 0.2669, 'learning_rate': 3.6273963376650123e-06, 'epoch': 1.46} {'loss': 0.3305, 'learning_rate': 3.627137420561445e-06, 'epoch': 1.46} {'loss': 0.3729, 'learning_rate': 3.6268785106516247e-06, 'epoch': 1.46} {'loss': 0.3038, 'learning_rate': 3.6266196079358505e-06, 'epoch': 1.46} {'loss': 0.3382, 'learning_rate': 3.6263607124144074e-06, 'epoch': 1.46} {'loss': 0.3481, 'learning_rate': 3.6261018240875935e-06, 'epoch': 1.46} {'loss': 0.2258, 'learning_rate': 3.625842942955695e-06, 'epoch': 1.46} {'loss': 0.4164, 'learning_rate': 3.6255840690190127e-06, 'epoch': 1.46} {'loss': 0.2948, 'learning_rate': 3.6253252022778298e-06, 'epoch': 1.46} {'loss': 0.3632, 'learning_rate': 3.625066342732445e-06, 'epoch': 1.46} {'loss': 0.4008, 'learning_rate': 3.6248074903831455e-06, 'epoch': 1.46} {'loss': 0.1327, 'learning_rate': 3.624548645230229e-06, 'epoch': 1.46} {'loss': 0.2858, 'learning_rate': 3.6242898072739852e-06, 'epoch': 1.46} {'loss': 0.2453, 'learning_rate': 3.6240309765147018e-06, 'epoch': 1.46} {'loss': 0.2337, 'learning_rate': 3.6237721529526793e-06, 'epoch': 1.46} {'loss': 0.385, 'learning_rate': 3.6235133365882015e-06, 'epoch': 1.46} {'loss': 0.3751, 'learning_rate': 3.623254527421568e-06, 'epoch': 1.46} {'loss': 0.2275, 'learning_rate': 3.6229957254530647e-06, 'epoch': 1.46} {'loss': 0.39, 'learning_rate': 3.6227369306829898e-06, 'epoch': 1.46} {'loss': 0.3651, 'learning_rate': 3.6224781431116284e-06, 'epoch': 1.46} {'loss': 0.2435, 'learning_rate': 3.6222193627392797e-06, 'epoch': 1.46} {'loss': 0.254, 'learning_rate': 3.621960589566229e-06, 'epoch': 1.46} {'loss': 0.2535, 'learning_rate': 3.621701823592776e-06, 'epoch': 1.46} {'loss': 0.3233, 'learning_rate': 3.6214430648192055e-06, 'epoch': 1.46} {'loss': 0.4209, 'learning_rate': 3.6211843132458156e-06, 'epoch': 1.46} {'loss': 0.3247, 'learning_rate': 3.620925568872896e-06, 'epoch': 1.46} {'loss': 0.2459, 'learning_rate': 3.6206668317007355e-06, 'epoch': 1.46} {'loss': 0.3984, 'learning_rate': 3.620408101729631e-06, 'epoch': 1.46} {'loss': 0.35, 'learning_rate': 3.620149378959871e-06, 'epoch': 1.46} {'loss': 0.235, 'learning_rate': 3.6198906633917506e-06, 'epoch': 1.46} {'loss': 0.1829, 'learning_rate': 3.619631955025559e-06, 'epoch': 1.46} {'loss': 0.3441, 'learning_rate': 3.619373253861592e-06, 'epoch': 1.46} {'loss': 0.3883, 'learning_rate': 3.6191145599001353e-06, 'epoch': 1.46} {'loss': 0.2314, 'learning_rate': 3.618855873141486e-06, 'epoch': 1.46} {'loss': 0.2443, 'learning_rate': 3.618597193585938e-06, 'epoch': 1.46} {'loss': 0.445, 'learning_rate': 3.6183385212337765e-06, 'epoch': 1.46} {'loss': 0.2364, 'learning_rate': 3.6180798560853016e-06, 'epoch': 1.46} {'loss': 0.3609, 'learning_rate': 3.6178211981407963e-06, 'epoch': 1.46} {'loss': 0.2486, 'learning_rate': 3.6175625474005615e-06, 'epoch': 1.46} {'loss': 0.2283, 'learning_rate': 3.6173039038648816e-06, 'epoch': 1.46} {'loss': 0.268, 'learning_rate': 3.617045267534055e-06, 'epoch': 1.46} {'loss': 0.1921, 'learning_rate': 3.616786638408367e-06, 'epoch': 1.46} {'loss': 0.2634, 'learning_rate': 3.6165280164881167e-06, 'epoch': 1.46} {'loss': 0.3338, 'learning_rate': 3.6162694017735887e-06, 'epoch': 1.46} {'loss': 0.3038, 'learning_rate': 3.6160107942650825e-06, 'epoch': 1.46} {'loss': 0.3889, 'learning_rate': 3.6157521939628828e-06, 'epoch': 1.46} {'loss': 0.2391, 'learning_rate': 3.615493600867287e-06, 'epoch': 1.46} {'loss': 0.2797, 'learning_rate': 3.6152350149785864e-06, 'epoch': 1.46} {'loss': 0.32, 'learning_rate': 3.6149764362970673e-06, 'epoch': 1.46} {'loss': 0.3006, 'learning_rate': 3.6147178648230288e-06, 'epoch': 1.46} {'loss': 0.42, 'learning_rate': 3.6144593005567565e-06, 'epoch': 1.46} {'loss': 0.5108, 'learning_rate': 3.6142007434985482e-06, 'epoch': 1.46} {'loss': 0.2877, 'learning_rate': 3.6139421936486907e-06, 'epoch': 1.46} {'loss': 0.4312, 'learning_rate': 3.61368365100748e-06, 'epoch': 1.46} {'loss': 0.3449, 'learning_rate': 3.613425115575204e-06, 'epoch': 1.46} {'loss': 0.469, 'learning_rate': 3.6131665873521595e-06, 'epoch': 1.46} {'loss': 0.3342, 'learning_rate': 3.612908066338632e-06, 'epoch': 1.46} {'loss': 0.2927, 'learning_rate': 3.6126495525349205e-06, 'epoch': 1.46} {'loss': 0.2927, 'learning_rate': 3.6123910459413094e-06, 'epoch': 1.46} {'loss': 0.3601, 'learning_rate': 3.612132546558097e-06, 'epoch': 1.46} {'loss': 0.1883, 'learning_rate': 3.6118740543855726e-06, 'epoch': 1.46} {'loss': 0.3469, 'learning_rate': 3.611615569424024e-06, 'epoch': 1.46} {'loss': 0.4347, 'learning_rate': 3.6113570916737505e-06, 'epoch': 1.46} {'loss': 0.3586, 'learning_rate': 3.611098621135036e-06, 'epoch': 1.46} {'loss': 0.1386, 'learning_rate': 3.610840157808181e-06, 'epoch': 1.46} {'loss': 0.2704, 'learning_rate': 3.6105817016934674e-06, 'epoch': 1.46} {'loss': 0.1712, 'learning_rate': 3.610323252791197e-06, 'epoch': 1.46} {'loss': 0.3345, 'learning_rate': 3.6100648111016523e-06, 'epoch': 1.46} {'loss': 0.1943, 'learning_rate': 3.6098063766251323e-06, 'epoch': 1.46} {'loss': 0.3462, 'learning_rate': 3.6095479493619233e-06, 'epoch': 1.46} {'loss': 0.3064, 'learning_rate': 3.609289529312322e-06, 'epoch': 1.46} {'loss': 0.4442, 'learning_rate': 3.6090311164766156e-06, 'epoch': 1.46} {'loss': 0.4778, 'learning_rate': 3.6087727108550996e-06, 'epoch': 1.46} {'loss': 0.3302, 'learning_rate': 3.608514312448065e-06, 'epoch': 1.46} {'loss': 0.348, 'learning_rate': 3.6082559212557975e-06, 'epoch': 1.46} {'loss': 0.2609, 'learning_rate': 3.607997537278598e-06, 'epoch': 1.46} {'loss': 0.2782, 'learning_rate': 3.607739160516751e-06, 'epoch': 1.46} {'loss': 0.1429, 'learning_rate': 3.6074807909705534e-06, 'epoch': 1.46} {'loss': 0.1568, 'learning_rate': 3.6072224286402913e-06, 'epoch': 1.46} {'loss': 0.3391, 'learning_rate': 3.6069640735262636e-06, 'epoch': 1.46} {'loss': 0.3595, 'learning_rate': 3.606705725628753e-06, 'epoch': 1.46} {'loss': 0.3658, 'learning_rate': 3.6064473849480597e-06, 'epoch': 1.46} {'loss': 0.3181, 'learning_rate': 3.6061890514844678e-06, 'epoch': 1.46} {'loss': 0.2689, 'learning_rate': 3.6059307252382768e-06, 'epoch': 1.46} {'loss': 0.3214, 'learning_rate': 3.6056724062097704e-06, 'epoch': 1.46} {'loss': 0.4083, 'learning_rate': 3.6054140943992476e-06, 'epoch': 1.46} {'loss': 0.2783, 'learning_rate': 3.6051557898069957e-06, 'epoch': 1.46} {'loss': 0.2876, 'learning_rate': 3.6048974924333037e-06, 'epoch': 1.46} {'loss': 0.2873, 'learning_rate': 3.6046392022784704e-06, 'epoch': 1.46} {'loss': 0.319, 'learning_rate': 3.604380919342779e-06, 'epoch': 1.46} {'loss': 0.2875, 'learning_rate': 3.60412264362653e-06, 'epoch': 1.46} {'loss': 0.2121, 'learning_rate': 3.603864375130005e-06, 'epoch': 1.46} {'loss': 0.4121, 'learning_rate': 3.603606113853506e-06, 'epoch': 1.46} {'loss': 0.3055, 'learning_rate': 3.603347859797315e-06, 'epoch': 1.46} {'loss': 0.2812, 'learning_rate': 3.603089612961731e-06, 'epoch': 1.46} {'loss': 0.3473, 'learning_rate': 3.60283137334704e-06, 'epoch': 1.46} {'loss': 0.4608, 'learning_rate': 3.6025731409535393e-06, 'epoch': 1.46} {'loss': 0.357, 'learning_rate': 3.602314915781513e-06, 'epoch': 1.46} {'loss': 0.2323, 'learning_rate': 3.60205669783126e-06, 'epoch': 1.46} {'loss': 0.3433, 'learning_rate': 3.6017984871030688e-06, 'epoch': 1.46} {'loss': 0.3619, 'learning_rate': 3.601540283597226e-06, 'epoch': 1.46} {'loss': 0.4608, 'learning_rate': 3.601282087314032e-06, 'epoch': 1.46} {'loss': 0.3476, 'learning_rate': 3.6010238982537694e-06, 'epoch': 1.46} {'loss': 0.2379, 'learning_rate': 3.6007657164167386e-06, 'epoch': 1.46} {'loss': 0.4293, 'learning_rate': 3.600507541803222e-06, 'epoch': 1.46} {'loss': 0.1827, 'learning_rate': 3.6002493744135194e-06, 'epoch': 1.46} {'loss': 0.1766, 'learning_rate': 3.599991214247914e-06, 'epoch': 1.46} {'loss': 0.3488, 'learning_rate': 3.599733061306706e-06, 'epoch': 1.46} {'loss': 0.3626, 'learning_rate': 3.599474915590179e-06, 'epoch': 1.46} {'loss': 0.4335, 'learning_rate': 3.599216777098631e-06, 'epoch': 1.46} {'loss': 0.283, 'learning_rate': 3.5989586458323454e-06, 'epoch': 1.46} {'loss': 0.159, 'learning_rate': 3.5987005217916226e-06, 'epoch': 1.46} {'loss': 0.2003, 'learning_rate': 3.5984424049767495e-06, 'epoch': 1.46} {'loss': 0.2173, 'learning_rate': 3.5981842953880152e-06, 'epoch': 1.46} {'loss': 0.3087, 'learning_rate': 3.597926193025716e-06, 'epoch': 1.46} {'loss': 0.4506, 'learning_rate': 3.597668097890137e-06, 'epoch': 1.46} {'loss': 0.2851, 'learning_rate': 3.5974100099815768e-06, 'epoch': 1.46} {'loss': 0.4806, 'learning_rate': 3.59715192930032e-06, 'epoch': 1.46} {'loss': 0.2938, 'learning_rate': 3.596893855846665e-06, 'epoch': 1.46} {'loss': 0.4764, 'learning_rate': 3.5966357896208948e-06, 'epoch': 1.46} {'loss': 0.2713, 'learning_rate': 3.5963777306233094e-06, 'epoch': 1.46} {'loss': 0.2642, 'learning_rate': 3.596119678854192e-06, 'epoch': 1.46} {'loss': 0.3623, 'learning_rate': 3.595861634313842e-06, 'epoch': 1.46} {'loss': 0.3189, 'learning_rate': 3.5956035970025417e-06, 'epoch': 1.46} {'loss': 0.4678, 'learning_rate': 3.595345566920592e-06, 'epoch': 1.46} {'loss': 0.2837, 'learning_rate': 3.5950875440682774e-06, 'epoch': 1.46} {'loss': 0.2171, 'learning_rate': 3.594829528445889e-06, 'epoch': 1.46} {'loss': 0.3884, 'learning_rate': 3.5945715200537225e-06, 'epoch': 1.46} {'loss': 0.3499, 'learning_rate': 3.5943135188920643e-06, 'epoch': 1.46} {'loss': 0.2756, 'learning_rate': 3.594055524961211e-06, 'epoch': 1.46} {'loss': 0.3612, 'learning_rate': 3.5937975382614464e-06, 'epoch': 1.46} {'loss': 0.2837, 'learning_rate': 3.593539558793071e-06, 'epoch': 1.46} {'loss': 0.2612, 'learning_rate': 3.5932815865563675e-06, 'epoch': 1.46} {'loss': 0.3168, 'learning_rate': 3.5930236215516312e-06, 'epoch': 1.46} {'loss': 0.19, 'learning_rate': 3.5927656637791553e-06, 'epoch': 1.46} {'loss': 0.3431, 'learning_rate': 3.592507713239226e-06, 'epoch': 1.46} {'loss': 0.2077, 'learning_rate': 3.59224976993214e-06, 'epoch': 1.46} {'loss': 0.2632, 'learning_rate': 3.5919918338581816e-06, 'epoch': 1.46} {'loss': 0.2913, 'learning_rate': 3.5917339050176504e-06, 'epoch': 1.46} {'loss': 0.3126, 'learning_rate': 3.5914759834108293e-06, 'epoch': 1.46} {'loss': 0.2546, 'learning_rate': 3.591218069038016e-06, 'epoch': 1.46} {'loss': 0.27, 'learning_rate': 3.590960161899496e-06, 'epoch': 1.46} {'loss': 0.4331, 'learning_rate': 3.5907022619955668e-06, 'epoch': 1.46} {'loss': 0.455, 'learning_rate': 3.5904443693265124e-06, 'epoch': 1.46} {'loss': 0.4349, 'learning_rate': 3.59018648389263e-06, 'epoch': 1.46} {'loss': 0.2119, 'learning_rate': 3.5899286056942083e-06, 'epoch': 1.46} {'loss': 0.306, 'learning_rate': 3.5896707347315362e-06, 'epoch': 1.46} {'loss': 0.2049, 'learning_rate': 3.589412871004909e-06, 'epoch': 1.46} {'loss': 0.3417, 'learning_rate': 3.5891550145146135e-06, 'epoch': 1.46} {'loss': 0.313, 'learning_rate': 3.588897165260945e-06, 'epoch': 1.46} {'loss': 0.2813, 'learning_rate': 3.5886393232441897e-06, 'epoch': 1.46} {'loss': 0.379, 'learning_rate': 3.588381488464645e-06, 'epoch': 1.46} {'loss': 0.3879, 'learning_rate': 3.5881236609225945e-06, 'epoch': 1.46} {'loss': 0.4289, 'learning_rate': 3.5878658406183363e-06, 'epoch': 1.46} {'loss': 0.5123, 'learning_rate': 3.5876080275521564e-06, 'epoch': 1.46} {'loss': 0.3507, 'learning_rate': 3.5873502217243494e-06, 'epoch': 1.46} {'loss': 0.3954, 'learning_rate': 3.587092423135202e-06, 'epoch': 1.46} {'loss': 0.3019, 'learning_rate': 3.586834631785011e-06, 'epoch': 1.46} {'loss': 0.3135, 'learning_rate': 3.586576847674064e-06, 'epoch': 1.46} {'loss': 0.2179, 'learning_rate': 3.5863190708026486e-06, 'epoch': 1.46} {'loss': 0.2771, 'learning_rate': 3.5860613011710634e-06, 'epoch': 1.46} {'loss': 0.1966, 'learning_rate': 3.585803538779591e-06, 'epoch': 1.46} {'loss': 0.2918, 'learning_rate': 3.585545783628531e-06, 'epoch': 1.46} {'loss': 0.235, 'learning_rate': 3.5852880357181663e-06, 'epoch': 1.46} {'loss': 0.4856, 'learning_rate': 3.585030295048795e-06, 'epoch': 1.46} {'loss': 0.2681, 'learning_rate': 3.584772561620701e-06, 'epoch': 1.46} {'loss': 0.2243, 'learning_rate': 3.584514835434183e-06, 'epoch': 1.46} {'loss': 0.1903, 'learning_rate': 3.5842571164895236e-06, 'epoch': 1.46} {'loss': 0.3853, 'learning_rate': 3.583999404787022e-06, 'epoch': 1.46} {'loss': 0.2311, 'learning_rate': 3.5837417003269604e-06, 'epoch': 1.46} {'loss': 0.2812, 'learning_rate': 3.5834840031096384e-06, 'epoch': 1.46} {'loss': 0.297, 'learning_rate': 3.583226313135343e-06, 'epoch': 1.46} {'loss': 0.2174, 'learning_rate': 3.582968630404362e-06, 'epoch': 1.46} {'loss': 0.1882, 'learning_rate': 3.5827109549169912e-06, 'epoch': 1.46} {'loss': 0.4103, 'learning_rate': 3.582453286673517e-06, 'epoch': 1.46} {'loss': 0.3958, 'learning_rate': 3.5821956256742364e-06, 'epoch': 1.46} {'loss': 0.2187, 'learning_rate': 3.5819379719194324e-06, 'epoch': 1.46} {'loss': 0.2061, 'learning_rate': 3.5816803254094037e-06, 'epoch': 1.46} {'loss': 0.3434, 'learning_rate': 3.5814226861444336e-06, 'epoch': 1.46} {'loss': 0.2346, 'learning_rate': 3.58116505412482e-06, 'epoch': 1.46} {'loss': 0.3429, 'learning_rate': 3.5809074293508483e-06, 'epoch': 1.46} {'loss': 0.4189, 'learning_rate': 3.5806498118228138e-06, 'epoch': 1.46} {'loss': 0.2394, 'learning_rate': 3.580392201541002e-06, 'epoch': 1.46} {'loss': 0.3492, 'learning_rate': 3.58013459850571e-06, 'epoch': 1.46} {'loss': 0.3916, 'learning_rate': 3.5798770027172248e-06, 'epoch': 1.46} {'loss': 0.4505, 'learning_rate': 3.5796194141758346e-06, 'epoch': 1.46} {'loss': 0.4258, 'learning_rate': 3.579361832881837e-06, 'epoch': 1.46} {'loss': 0.2712, 'learning_rate': 3.579104258835514e-06, 'epoch': 1.46} {'loss': 0.3475, 'learning_rate': 3.578846692037167e-06, 'epoch': 1.46} {'loss': 0.2549, 'learning_rate': 3.578589132487076e-06, 'epoch': 1.46} {'loss': 0.3049, 'learning_rate': 3.57833158018554e-06, 'epoch': 1.46} {'loss': 0.3458, 'learning_rate': 3.5780740351328436e-06, 'epoch': 1.46} {'loss': 0.3784, 'learning_rate': 3.577816497329284e-06, 'epoch': 1.46} {'loss': 0.3171, 'learning_rate': 3.5775589667751455e-06, 'epoch': 1.46} {'loss': 0.3824, 'learning_rate': 3.5773014434707245e-06, 'epoch': 1.46} {'loss': 0.3403, 'learning_rate': 3.577043927416305e-06, 'epoch': 1.46} {'loss': 0.334, 'learning_rate': 3.5767864186121857e-06, 'epoch': 1.46} {'loss': 0.4056, 'learning_rate': 3.576528917058649e-06, 'epoch': 1.46} {'loss': 0.2835, 'learning_rate': 3.5762714227559937e-06, 'epoch': 1.46} {'loss': 0.3699, 'learning_rate': 3.5760139357045052e-06, 'epoch': 1.46} {'loss': 0.3762, 'learning_rate': 3.5757564559044735e-06, 'epoch': 1.46} {'loss': 0.1998, 'learning_rate': 3.5754989833561936e-06, 'epoch': 1.46} {'loss': 0.2971, 'learning_rate': 3.575241518059951e-06, 'epoch': 1.46} {'loss': 0.3187, 'learning_rate': 3.5749840600160422e-06, 'epoch': 1.46} {'loss': 0.2599, 'learning_rate': 3.5747266092247514e-06, 'epoch': 1.46} {'loss': 0.3557, 'learning_rate': 3.574469165686375e-06, 'epoch': 1.46} {'loss': 0.2917, 'learning_rate': 3.574211729401198e-06, 'epoch': 1.46} {'loss': 0.3657, 'learning_rate': 3.5739543003695175e-06, 'epoch': 1.46} {'loss': 0.2946, 'learning_rate': 3.573696878591617e-06, 'epoch': 1.46} {'loss': 0.3929, 'learning_rate': 3.5734394640677948e-06, 'epoch': 1.46} {'loss': 0.2179, 'learning_rate': 3.5731820567983333e-06, 'epoch': 1.46} {'loss': 0.3295, 'learning_rate': 3.5729246567835307e-06, 'epoch': 1.46} {'loss': 0.1975, 'learning_rate': 3.572667264023675e-06, 'epoch': 1.46} {'loss': 0.4013, 'learning_rate': 3.5724098785190507e-06, 'epoch': 1.46} {'loss': 0.2138, 'learning_rate': 3.5721525002699574e-06, 'epoch': 1.46} {'loss': 0.3747, 'learning_rate': 3.571895129276679e-06, 'epoch': 1.46} {'loss': 0.5001, 'learning_rate': 3.5716377655395108e-06, 'epoch': 1.46} {'loss': 0.2316, 'learning_rate': 3.571380409058739e-06, 'epoch': 1.46} {'loss': 0.3157, 'learning_rate': 3.571123059834659e-06, 'epoch': 1.46} {'loss': 0.3497, 'learning_rate': 3.5708657178675553e-06, 'epoch': 1.46} {'loss': 0.3587, 'learning_rate': 3.570608383157724e-06, 'epoch': 1.46} {'loss': 0.336, 'learning_rate': 3.570351055705451e-06, 'epoch': 1.46} {'loss': 0.2903, 'learning_rate': 3.570093735511032e-06, 'epoch': 1.46} {'loss': 0.2768, 'learning_rate': 3.5698364225747515e-06, 'epoch': 1.46} {'loss': 0.2985, 'learning_rate': 3.5695791168969064e-06, 'epoch': 1.46} {'loss': 0.282, 'learning_rate': 3.5693218184777834e-06, 'epoch': 1.46} {'loss': 0.2285, 'learning_rate': 3.5690645273176696e-06, 'epoch': 1.46} {'loss': 0.2563, 'learning_rate': 3.568807243416863e-06, 'epoch': 1.46} {'loss': 0.2152, 'learning_rate': 3.5685499667756463e-06, 'epoch': 1.46} {'loss': 0.2483, 'learning_rate': 3.5682926973943166e-06, 'epoch': 1.46} {'loss': 0.3757, 'learning_rate': 3.5680354352731583e-06, 'epoch': 1.46} {'loss': 0.2329, 'learning_rate': 3.5677781804124657e-06, 'epoch': 1.46} {'loss': 0.3365, 'learning_rate': 3.5675209328125306e-06, 'epoch': 1.46} {'loss': 0.3744, 'learning_rate': 3.567263692473638e-06, 'epoch': 1.46} {'loss': 0.3363, 'learning_rate': 3.567006459396085e-06, 'epoch': 1.46} {'loss': 0.3277, 'learning_rate': 3.5667492335801556e-06, 'epoch': 1.46} {'loss': 0.2082, 'learning_rate': 3.5664920150261462e-06, 'epoch': 1.46} {'loss': 0.3052, 'learning_rate': 3.56623480373434e-06, 'epoch': 1.46} {'loss': 0.3112, 'learning_rate': 3.565977599705035e-06, 'epoch': 1.46} {'loss': 0.2669, 'learning_rate': 3.565720402938514e-06, 'epoch': 1.46} {'loss': 0.266, 'learning_rate': 3.5654632134350754e-06, 'epoch': 1.46} {'loss': 0.3463, 'learning_rate': 3.565206031195001e-06, 'epoch': 1.46} {'loss': 0.4579, 'learning_rate': 3.5649488562185897e-06, 'epoch': 1.46} {'loss': 0.4334, 'learning_rate': 3.5646916885061232e-06, 'epoch': 1.46} {'loss': 0.3238, 'learning_rate': 3.5644345280578994e-06, 'epoch': 1.46} {'loss': 0.4264, 'learning_rate': 3.5641773748742058e-06, 'epoch': 1.46} {'loss': 0.4164, 'learning_rate': 3.5639202289553286e-06, 'epoch': 1.46} {'loss': 0.3471, 'learning_rate': 3.5636630903015645e-06, 'epoch': 1.46} {'loss': 0.2208, 'learning_rate': 3.5634059589131988e-06, 'epoch': 1.46} {'loss': 0.3936, 'learning_rate': 3.5631488347905254e-06, 'epoch': 1.46} {'loss': 0.3141, 'learning_rate': 3.5628917179338307e-06, 'epoch': 1.46} {'loss': 0.3348, 'learning_rate': 3.5626346083434106e-06, 'epoch': 1.46} {'loss': 0.2658, 'learning_rate': 3.5623775060195477e-06, 'epoch': 1.46} {'loss': 0.2928, 'learning_rate': 3.5621204109625397e-06, 'epoch': 1.46} {'loss': 0.2418, 'learning_rate': 3.561863323172671e-06, 'epoch': 1.46} {'loss': 0.3269, 'learning_rate': 3.5616062426502374e-06, 'epoch': 1.46} {'loss': 0.2145, 'learning_rate': 3.5613491693955225e-06, 'epoch': 1.46} {'loss': 0.302, 'learning_rate': 3.561092103408824e-06, 'epoch': 1.46} {'loss': 0.291, 'learning_rate': 3.560835044690427e-06, 'epoch': 1.46} {'loss': 0.3665, 'learning_rate': 3.5605779932406204e-06, 'epoch': 1.46} {'loss': 0.1838, 'learning_rate': 3.5603209490597003e-06, 'epoch': 1.46} {'loss': 0.3848, 'learning_rate': 3.5600639121479495e-06, 'epoch': 1.46} {'loss': 0.3752, 'learning_rate': 3.5598068825056655e-06, 'epoch': 1.46} {'loss': 0.2734, 'learning_rate': 3.5595498601331303e-06, 'epoch': 1.46} {'loss': 0.2476, 'learning_rate': 3.559292845030643e-06, 'epoch': 1.46} {'loss': 0.3497, 'learning_rate': 3.5590358371984857e-06, 'epoch': 1.46} {'loss': 0.3458, 'learning_rate': 3.5587788366369557e-06, 'epoch': 1.46} {'loss': 0.3532, 'learning_rate': 3.5585218433463366e-06, 'epoch': 1.46} {'loss': 0.2384, 'learning_rate': 3.558264857326924e-06, 'epoch': 1.46} {'loss': 0.3924, 'learning_rate': 3.558007878579003e-06, 'epoch': 1.46} {'loss': 0.3441, 'learning_rate': 3.5577509071028683e-06, 'epoch': 1.46} {'loss': 0.2807, 'learning_rate': 3.5574939428988088e-06, 'epoch': 1.46} {'loss': 0.2347, 'learning_rate': 3.5572369859671086e-06, 'epoch': 1.46} {'loss': 0.3395, 'learning_rate': 3.5569800363080676e-06, 'epoch': 1.46} {'loss': 0.3024, 'learning_rate': 3.5567230939219666e-06, 'epoch': 1.46} {'loss': 0.2698, 'learning_rate': 3.556466158809104e-06, 'epoch': 1.46} {'loss': 0.2101, 'learning_rate': 3.5562092309697627e-06, 'epoch': 1.46} {'loss': 0.3437, 'learning_rate': 3.555952310404239e-06, 'epoch': 1.46} {'loss': 0.4366, 'learning_rate': 3.555695397112816e-06, 'epoch': 1.46} {'loss': 0.2903, 'learning_rate': 3.555438491095791e-06, 'epoch': 1.46} {'loss': 0.3375, 'learning_rate': 3.5551815923534474e-06, 'epoch': 1.46} {'loss': 0.1883, 'learning_rate': 3.554924700886081e-06, 'epoch': 1.46} {'loss': 0.3347, 'learning_rate': 3.5546678166939764e-06, 'epoch': 1.46} {'loss': 0.2343, 'learning_rate': 3.5544109397774286e-06, 'epoch': 1.46} {'loss': 0.353, 'learning_rate': 3.554154070136726e-06, 'epoch': 1.46} {'loss': 0.2027, 'learning_rate': 3.5538972077721532e-06, 'epoch': 1.46} {'loss': 0.3342, 'learning_rate': 3.553640352684009e-06, 'epoch': 1.46} {'loss': 0.3639, 'learning_rate': 3.553383504872576e-06, 'epoch': 1.46} {'loss': 0.2298, 'learning_rate': 3.55312666433815e-06, 'epoch': 1.46} {'loss': 0.1976, 'learning_rate': 3.552869831081015e-06, 'epoch': 1.46} {'loss': 0.3448, 'learning_rate': 3.5526130051014675e-06, 'epoch': 1.46} {'loss': 0.2649, 'learning_rate': 3.55235618639979e-06, 'epoch': 1.46} {'loss': 0.1827, 'learning_rate': 3.55209937497628e-06, 'epoch': 1.46} {'loss': 0.3305, 'learning_rate': 3.5518425708312198e-06, 'epoch': 1.46} {'loss': 0.4176, 'learning_rate': 3.551585773964906e-06, 'epoch': 1.46} {'loss': 0.2852, 'learning_rate': 3.5513289843776233e-06, 'epoch': 1.46} {'loss': 0.2652, 'learning_rate': 3.5510722020696675e-06, 'epoch': 1.46} {'loss': 0.3587, 'learning_rate': 3.5508154270413243e-06, 'epoch': 1.46} {'loss': 0.279, 'learning_rate': 3.5505586592928807e-06, 'epoch': 1.46} {'loss': 0.2416, 'learning_rate': 3.550301898824634e-06, 'epoch': 1.46} {'loss': 0.3787, 'learning_rate': 3.5500451456368655e-06, 'epoch': 1.46} {'loss': 0.3556, 'learning_rate': 3.549788399729874e-06, 'epoch': 1.46} {'loss': 0.2697, 'learning_rate': 3.549531661103941e-06, 'epoch': 1.46} {'loss': 0.367, 'learning_rate': 3.549274929759363e-06, 'epoch': 1.46} {'loss': 0.3204, 'learning_rate': 3.549018205696424e-06, 'epoch': 1.46} {'loss': 0.2225, 'learning_rate': 3.548761488915421e-06, 'epoch': 1.46} {'loss': 0.25, 'learning_rate': 3.548504779416635e-06, 'epoch': 1.46} {'loss': 0.4154, 'learning_rate': 3.5482480772003635e-06, 'epoch': 1.46} {'loss': 0.2095, 'learning_rate': 3.547991382266891e-06, 'epoch': 1.46} {'loss': 0.2619, 'learning_rate': 3.5477346946165114e-06, 'epoch': 1.46} {'loss': 0.3051, 'learning_rate': 3.5474780142495126e-06, 'epoch': 1.46} {'loss': 0.3913, 'learning_rate': 3.5472213411661814e-06, 'epoch': 1.46} {'loss': 0.346, 'learning_rate': 3.546964675366813e-06, 'epoch': 1.46} {'loss': 0.2277, 'learning_rate': 3.546708016851691e-06, 'epoch': 1.46} {'loss': 0.3544, 'learning_rate': 3.546451365621112e-06, 'epoch': 1.46} {'loss': 0.3245, 'learning_rate': 3.546194721675359e-06, 'epoch': 1.46} {'loss': 0.3186, 'learning_rate': 3.5459380850147284e-06, 'epoch': 1.46} {'loss': 0.1534, 'learning_rate': 3.5456814556395026e-06, 'epoch': 1.46} {'loss': 0.2051, 'learning_rate': 3.5454248335499787e-06, 'epoch': 1.46} {'loss': 0.2619, 'learning_rate': 3.54516821874644e-06, 'epoch': 1.46} {'loss': 0.1818, 'learning_rate': 3.5449116112291813e-06, 'epoch': 1.46} {'loss': 0.3317, 'learning_rate': 3.544655010998487e-06, 'epoch': 1.46} {'loss': 0.3335, 'learning_rate': 3.544398418054653e-06, 'epoch': 1.46} {'loss': 0.2729, 'learning_rate': 3.544141832397966e-06, 'epoch': 1.46} {'loss': 0.136, 'learning_rate': 3.5438852540287103e-06, 'epoch': 1.46} {'loss': 0.1677, 'learning_rate': 3.5436286829471856e-06, 'epoch': 1.46} {'loss': 0.3612, 'learning_rate': 3.543372119153673e-06, 'epoch': 1.46} {'loss': 0.2615, 'learning_rate': 3.543115562648468e-06, 'epoch': 1.46} {'loss': 0.332, 'learning_rate': 3.542859013431854e-06, 'epoch': 1.46} {'loss': 0.1798, 'learning_rate': 3.5426024715041285e-06, 'epoch': 1.46} {'loss': 0.3614, 'learning_rate': 3.54234593686557e-06, 'epoch': 1.46} {'loss': 0.347, 'learning_rate': 3.5420894095164817e-06, 'epoch': 1.46} {'loss': 0.2875, 'learning_rate': 3.541832889457146e-06, 'epoch': 1.46} {'loss': 0.2904, 'learning_rate': 3.5415763766878496e-06, 'epoch': 1.46} {'loss': 0.2503, 'learning_rate': 3.5413198712088894e-06, 'epoch': 1.46} {'loss': 0.1374, 'learning_rate': 3.5410633730205468e-06, 'epoch': 1.46} {'loss': 0.2736, 'learning_rate': 3.540806882123119e-06, 'epoch': 1.46} {'loss': 0.277, 'learning_rate': 3.5405503985168886e-06, 'epoch': 1.46} {'loss': 0.4184, 'learning_rate': 3.5402939222021516e-06, 'epoch': 1.46} {'loss': 0.1998, 'learning_rate': 3.5400374531791913e-06, 'epoch': 1.46} {'loss': 0.3271, 'learning_rate': 3.5397809914483038e-06, 'epoch': 1.46} {'loss': 0.2182, 'learning_rate': 3.539524537009772e-06, 'epoch': 1.46} {'loss': 0.3108, 'learning_rate': 3.539268089863891e-06, 'epoch': 1.46} {'loss': 0.3806, 'learning_rate': 3.539011650010945e-06, 'epoch': 1.46} {'loss': 0.4623, 'learning_rate': 3.5387552174512297e-06, 'epoch': 1.46} {'loss': 0.2594, 'learning_rate': 3.5384987921850313e-06, 'epoch': 1.46} {'loss': 0.1578, 'learning_rate': 3.538242374212635e-06, 'epoch': 1.46} {'loss': 0.2155, 'learning_rate': 3.537985963534337e-06, 'epoch': 1.46} {'loss': 0.3383, 'learning_rate': 3.5377295601504226e-06, 'epoch': 1.46} {'loss': 0.3385, 'learning_rate': 3.5374731640611847e-06, 'epoch': 1.46} {'loss': 0.3253, 'learning_rate': 3.5372167752669075e-06, 'epoch': 1.46} {'loss': 0.3318, 'learning_rate': 3.5369603937678874e-06, 'epoch': 1.46} {'loss': 0.1924, 'learning_rate': 3.5367040195644067e-06, 'epoch': 1.46} {'loss': 0.343, 'learning_rate': 3.5364476526567603e-06, 'epoch': 1.46} {'loss': 0.2987, 'learning_rate': 3.5361912930452326e-06, 'epoch': 1.46} {'loss': 0.4029, 'learning_rate': 3.5359349407301204e-06, 'epoch': 1.46} {'loss': 0.2386, 'learning_rate': 3.5356785957117036e-06, 'epoch': 1.46} {'loss': 0.3809, 'learning_rate': 3.5354222579902796e-06, 'epoch': 1.46} {'loss': 0.4185, 'learning_rate': 3.5351659275661354e-06, 'epoch': 1.46} {'loss': 0.2225, 'learning_rate': 3.534909604439556e-06, 'epoch': 1.46} {'loss': 0.3246, 'learning_rate': 3.5346532886108376e-06, 'epoch': 1.46} {'loss': 0.4081, 'learning_rate': 3.5343969800802636e-06, 'epoch': 1.46} {'loss': 0.3167, 'learning_rate': 3.534140678848128e-06, 'epoch': 1.46} {'loss': 0.2335, 'learning_rate': 3.5338843849147154e-06, 'epoch': 1.46} {'loss': 0.2589, 'learning_rate': 3.5336280982803205e-06, 'epoch': 1.46} {'loss': 0.1802, 'learning_rate': 3.533371818945227e-06, 'epoch': 1.46} {'loss': 0.2602, 'learning_rate': 3.533115546909731e-06, 'epoch': 1.46} {'loss': 0.3673, 'learning_rate': 3.5328592821741135e-06, 'epoch': 1.46} {'loss': 0.2665, 'learning_rate': 3.532603024738671e-06, 'epoch': 1.46} {'loss': 0.1973, 'learning_rate': 3.5323467746036877e-06, 'epoch': 1.46} {'loss': 0.3119, 'learning_rate': 3.5320905317694575e-06, 'epoch': 1.46} {'loss': 0.1769, 'learning_rate': 3.5318342962362685e-06, 'epoch': 1.46} {'loss': 0.2918, 'learning_rate': 3.5315780680044044e-06, 'epoch': 1.46} {'loss': 0.4596, 'learning_rate': 3.5313218470741617e-06, 'epoch': 1.47} {'loss': 0.2869, 'learning_rate': 3.5310656334458228e-06, 'epoch': 1.47} {'loss': 0.3883, 'learning_rate': 3.5308094271196846e-06, 'epoch': 1.47} {'loss': 0.1901, 'learning_rate': 3.5305532280960284e-06, 'epoch': 1.47} {'loss': 0.4425, 'learning_rate': 3.530297036375152e-06, 'epoch': 1.47} {'loss': 0.2611, 'learning_rate': 3.530040851957336e-06, 'epoch': 1.47} {'loss': 0.4336, 'learning_rate': 3.5297846748428767e-06, 'epoch': 1.47} {'loss': 0.3289, 'learning_rate': 3.529528505032057e-06, 'epoch': 1.47} {'loss': 0.3385, 'learning_rate': 3.5292723425251728e-06, 'epoch': 1.47} {'loss': 0.3902, 'learning_rate': 3.529016187322506e-06, 'epoch': 1.47} {'loss': 0.4996, 'learning_rate': 3.5287600394243525e-06, 'epoch': 1.47} {'loss': 0.4749, 'learning_rate': 3.5285038988309983e-06, 'epoch': 1.47} {'loss': 0.4133, 'learning_rate': 3.5282477655427303e-06, 'epoch': 1.47} {'loss': 0.5059, 'learning_rate': 3.5279916395598424e-06, 'epoch': 1.47} {'loss': 0.2498, 'learning_rate': 3.527735520882618e-06, 'epoch': 1.47} {'loss': 0.209, 'learning_rate': 3.527479409511353e-06, 'epoch': 1.47} {'loss': 0.3334, 'learning_rate': 3.527223305446329e-06, 'epoch': 1.47} {'loss': 0.2808, 'learning_rate': 3.5269672086878428e-06, 'epoch': 1.47} {'loss': 0.3419, 'learning_rate': 3.5267111192361768e-06, 'epoch': 1.47} {'loss': 0.2991, 'learning_rate': 3.526455037091626e-06, 'epoch': 1.47} {'loss': 0.232, 'learning_rate': 3.5261989622544725e-06, 'epoch': 1.47} {'loss': 0.3118, 'learning_rate': 3.525942894725013e-06, 'epoch': 1.47} {'loss': 0.3745, 'learning_rate': 3.52568683450353e-06, 'epoch': 1.47} {'loss': 0.4032, 'learning_rate': 3.5254307815903188e-06, 'epoch': 1.47} {'loss': 0.3595, 'learning_rate': 3.525174735985665e-06, 'epoch': 1.47} {'loss': 0.3283, 'learning_rate': 3.524918697689853e-06, 'epoch': 1.47} {'loss': 0.3496, 'learning_rate': 3.5246626667031815e-06, 'epoch': 1.47} {'loss': 0.4135, 'learning_rate': 3.5244066430259304e-06, 'epoch': 1.47} {'loss': 0.2306, 'learning_rate': 3.5241506266583956e-06, 'epoch': 1.47} {'loss': 0.3365, 'learning_rate': 3.5238946176008616e-06, 'epoch': 1.47} {'loss': 0.2963, 'learning_rate': 3.5236386158536216e-06, 'epoch': 1.47} {'loss': 0.2983, 'learning_rate': 3.5233826214169587e-06, 'epoch': 1.47} {'loss': 0.3358, 'learning_rate': 3.5231266342911685e-06, 'epoch': 1.47} {'loss': 0.2904, 'learning_rate': 3.5228706544765334e-06, 'epoch': 1.47} {'loss': 0.3194, 'learning_rate': 3.5226146819733486e-06, 'epoch': 1.47} {'loss': 0.2616, 'learning_rate': 3.5223587167818975e-06, 'epoch': 1.47} {'loss': 0.2936, 'learning_rate': 3.5221027589024735e-06, 'epoch': 1.47} {'loss': 0.2994, 'learning_rate': 3.521846808335365e-06, 'epoch': 1.47} {'loss': 0.4069, 'learning_rate': 3.521590865080856e-06, 'epoch': 1.47} {'loss': 0.3343, 'learning_rate': 3.521334929139243e-06, 'epoch': 1.47} {'loss': 0.4157, 'learning_rate': 3.5210790005108063e-06, 'epoch': 1.47} {'loss': 0.2226, 'learning_rate': 3.520823079195843e-06, 'epoch': 1.47} {'loss': 0.2543, 'learning_rate': 3.520567165194636e-06, 'epoch': 1.47} {'loss': 0.3012, 'learning_rate': 3.520311258507478e-06, 'epoch': 1.47} {'loss': 0.2674, 'learning_rate': 3.5200553591346553e-06, 'epoch': 1.47} {'loss': 0.3869, 'learning_rate': 3.51979946707646e-06, 'epoch': 1.47} {'loss': 0.427, 'learning_rate': 3.519543582333176e-06, 'epoch': 1.47} {'loss': 0.3642, 'learning_rate': 3.5192877049050977e-06, 'epoch': 1.47} {'loss': 0.3369, 'learning_rate': 3.519031834792508e-06, 'epoch': 1.47} {'loss': 0.28, 'learning_rate': 3.5187759719957028e-06, 'epoch': 1.47} {'loss': 0.3986, 'learning_rate': 3.5185201165149664e-06, 'epoch': 1.47} {'loss': 0.299, 'learning_rate': 3.518264268350585e-06, 'epoch': 1.47} {'loss': 0.3244, 'learning_rate': 3.518008427502855e-06, 'epoch': 1.47} {'loss': 0.2223, 'learning_rate': 3.517752593972057e-06, 'epoch': 1.47} {'loss': 0.269, 'learning_rate': 3.517496767758486e-06, 'epoch': 1.47} {'loss': 0.3418, 'learning_rate': 3.517240948862426e-06, 'epoch': 1.47} {'loss': 0.3984, 'learning_rate': 3.5169851372841725e-06, 'epoch': 1.47} {'loss': 0.3671, 'learning_rate': 3.516729333024005e-06, 'epoch': 1.47} {'loss': 0.4296, 'learning_rate': 3.516473536082218e-06, 'epoch': 1.47} {'loss': 0.4001, 'learning_rate': 3.516217746459103e-06, 'epoch': 1.47} {'loss': 0.3575, 'learning_rate': 3.5159619641549414e-06, 'epoch': 1.47} {'loss': 0.2192, 'learning_rate': 3.5157061891700295e-06, 'epoch': 1.47} {'loss': 0.141, 'learning_rate': 3.515450421504648e-06, 'epoch': 1.47} {'loss': 0.3258, 'learning_rate': 3.515194661159094e-06, 'epoch': 1.47} {'loss': 0.4247, 'learning_rate': 3.5149389081336484e-06, 'epoch': 1.47} {'loss': 0.2884, 'learning_rate': 3.5146831624286073e-06, 'epoch': 1.47} {'loss': 0.2822, 'learning_rate': 3.514427424044252e-06, 'epoch': 1.47} {'loss': 0.3206, 'learning_rate': 3.514171692980879e-06, 'epoch': 1.47} {'loss': 0.3598, 'learning_rate': 3.513915969238768e-06, 'epoch': 1.47} {'loss': 0.2625, 'learning_rate': 3.5136602528182175e-06, 'epoch': 1.47} {'loss': 0.2791, 'learning_rate': 3.5134045437195098e-06, 'epoch': 1.47} {'loss': 0.3303, 'learning_rate': 3.5131488419429327e-06, 'epoch': 1.47} {'loss': 0.2456, 'learning_rate': 3.5128931474887796e-06, 'epoch': 1.47} {'loss': 0.3262, 'learning_rate': 3.512637460357333e-06, 'epoch': 1.47} {'loss': 0.2843, 'learning_rate': 3.5123817805488892e-06, 'epoch': 1.47} {'loss': 0.2956, 'learning_rate': 3.5121261080637283e-06, 'epoch': 1.47} {'loss': 0.4614, 'learning_rate': 3.5118704429021476e-06, 'epoch': 1.47} {'loss': 0.3784, 'learning_rate': 3.5116147850644276e-06, 'epoch': 1.47} {'loss': 0.2224, 'learning_rate': 3.5113591345508646e-06, 'epoch': 1.47} {'loss': 0.25, 'learning_rate': 3.511103491361739e-06, 'epoch': 1.47} {'loss': 0.3778, 'learning_rate': 3.510847855497348e-06, 'epoch': 1.47} {'loss': 0.4174, 'learning_rate': 3.5105922269579717e-06, 'epoch': 1.47} {'loss': 0.3129, 'learning_rate': 3.510336605743906e-06, 'epoch': 1.47} {'loss': 0.4685, 'learning_rate': 3.5100809918554366e-06, 'epoch': 1.47} {'loss': 0.4, 'learning_rate': 3.509825385292849e-06, 'epoch': 1.47} {'loss': 0.373, 'learning_rate': 3.509569786056436e-06, 'epoch': 1.47} {'loss': 0.36, 'learning_rate': 3.5093141941464825e-06, 'epoch': 1.47} {'loss': 0.322, 'learning_rate': 3.5090586095632817e-06, 'epoch': 1.47} {'loss': 0.4038, 'learning_rate': 3.5088030323071165e-06, 'epoch': 1.47} {'loss': 0.4057, 'learning_rate': 3.508547462378281e-06, 'epoch': 1.47} {'loss': 0.3196, 'learning_rate': 3.5082918997770586e-06, 'epoch': 1.47} {'loss': 0.4, 'learning_rate': 3.5080363445037434e-06, 'epoch': 1.47} {'loss': 0.3048, 'learning_rate': 3.5077807965586164e-06, 'epoch': 1.47} {'loss': 0.4539, 'learning_rate': 3.507525255941975e-06, 'epoch': 1.47} {'loss': 0.2025, 'learning_rate': 3.5072697226540987e-06, 'epoch': 1.47} {'loss': 0.4309, 'learning_rate': 3.5070141966952843e-06, 'epoch': 1.47} {'loss': 0.345, 'learning_rate': 3.5067586780658147e-06, 'epoch': 1.47} {'loss': 0.4326, 'learning_rate': 3.506503166765978e-06, 'epoch': 1.47} {'loss': 0.2924, 'learning_rate': 3.5062476627960673e-06, 'epoch': 1.47} {'loss': 0.4684, 'learning_rate': 3.5059921661563645e-06, 'epoch': 1.47} {'loss': 0.3457, 'learning_rate': 3.5057366768471657e-06, 'epoch': 1.47} {'loss': 0.2591, 'learning_rate': 3.5054811948687508e-06, 'epoch': 1.47} {'loss': 0.2317, 'learning_rate': 3.505225720221417e-06, 'epoch': 1.47} {'loss': 0.291, 'learning_rate': 3.5049702529054443e-06, 'epoch': 1.47} {'loss': 0.3641, 'learning_rate': 3.504714792921129e-06, 'epoch': 1.47} {'loss': 0.2249, 'learning_rate': 3.504459340268752e-06, 'epoch': 1.47} {'loss': 0.3194, 'learning_rate': 3.504203894948608e-06, 'epoch': 1.47} {'loss': 0.3104, 'learning_rate': 3.5039484569609793e-06, 'epoch': 1.47} {'loss': 0.3583, 'learning_rate': 3.503693026306162e-06, 'epoch': 1.47} {'loss': 0.3152, 'learning_rate': 3.5034376029844353e-06, 'epoch': 1.47} {'loss': 0.372, 'learning_rate': 3.503182186996097e-06, 'epoch': 1.47} {'loss': 0.3453, 'learning_rate': 3.5029267783414287e-06, 'epoch': 1.47} {'loss': 0.2402, 'learning_rate': 3.5026713770207186e-06, 'epoch': 1.47} {'loss': 0.4152, 'learning_rate': 3.5024159830342597e-06, 'epoch': 1.47} {'loss': 0.3348, 'learning_rate': 3.5021605963823345e-06, 'epoch': 1.47} {'loss': 0.2893, 'learning_rate': 3.5019052170652377e-06, 'epoch': 1.47} {'loss': 0.3051, 'learning_rate': 3.5016498450832514e-06, 'epoch': 1.47} {'loss': 0.2549, 'learning_rate': 3.5013944804366696e-06, 'epoch': 1.47} {'loss': 0.1306, 'learning_rate': 3.501139123125774e-06, 'epoch': 1.47} {'loss': 0.3218, 'learning_rate': 3.5008837731508605e-06, 'epoch': 1.47} {'loss': 0.3312, 'learning_rate': 3.5006284305122097e-06, 'epoch': 1.47} {'loss': 0.3209, 'learning_rate': 3.5003730952101166e-06, 'epoch': 1.47} {'loss': 0.3505, 'learning_rate': 3.5001177672448627e-06, 'epoch': 1.47} {'loss': 0.429, 'learning_rate': 3.4998624466167443e-06, 'epoch': 1.47} {'loss': 0.2388, 'learning_rate': 3.499607133326044e-06, 'epoch': 1.47} {'loss': 0.3459, 'learning_rate': 3.4993518273730487e-06, 'epoch': 1.47} {'loss': 0.3541, 'learning_rate': 3.4990965287580523e-06, 'epoch': 1.47} {'loss': 0.3128, 'learning_rate': 3.498841237481335e-06, 'epoch': 1.47} {'loss': 0.255, 'learning_rate': 3.498585953543194e-06, 'epoch': 1.47} {'loss': 0.2723, 'learning_rate': 3.4983306769439106e-06, 'epoch': 1.47} {'loss': 0.3179, 'learning_rate': 3.4980754076837786e-06, 'epoch': 1.47} {'loss': 0.3858, 'learning_rate': 3.4978201457630788e-06, 'epoch': 1.47} {'loss': 0.2852, 'learning_rate': 3.497564891182107e-06, 'epoch': 1.47} {'loss': 0.2875, 'learning_rate': 3.497309643941146e-06, 'epoch': 1.47} {'loss': 0.3547, 'learning_rate': 3.4970544040404875e-06, 'epoch': 1.47} {'loss': 0.375, 'learning_rate': 3.496799171480415e-06, 'epoch': 1.47} {'loss': 0.3479, 'learning_rate': 3.496543946261224e-06, 'epoch': 1.47} {'loss': 0.2571, 'learning_rate': 3.496288728383197e-06, 'epoch': 1.47} {'loss': 0.2953, 'learning_rate': 3.496033517846621e-06, 'epoch': 1.47} {'loss': 0.2476, 'learning_rate': 3.495778314651789e-06, 'epoch': 1.47} {'loss': 0.282, 'learning_rate': 3.4955231187989833e-06, 'epoch': 1.47} {'loss': 0.3642, 'learning_rate': 3.4952679302884983e-06, 'epoch': 1.47} {'loss': 0.2493, 'learning_rate': 3.4950127491206153e-06, 'epoch': 1.47} {'loss': 0.3827, 'learning_rate': 3.4947575752956297e-06, 'epoch': 1.47} {'loss': 0.2836, 'learning_rate': 3.4945024088138225e-06, 'epoch': 1.47} {'loss': 0.3691, 'learning_rate': 3.4942472496754886e-06, 'epoch': 1.47} {'loss': 0.2641, 'learning_rate': 3.4939920978809083e-06, 'epoch': 1.47} {'loss': 0.4501, 'learning_rate': 3.4937369534303777e-06, 'epoch': 1.47} {'loss': 0.3159, 'learning_rate': 3.4934818163241767e-06, 'epoch': 1.47} {'loss': 0.2427, 'learning_rate': 3.4932266865626017e-06, 'epoch': 1.47} {'loss': 0.2799, 'learning_rate': 3.492971564145936e-06, 'epoch': 1.47} {'loss': 0.2458, 'learning_rate': 3.4927164490744647e-06, 'epoch': 1.47} {'loss': 0.3207, 'learning_rate': 3.492461341348483e-06, 'epoch': 1.47} {'loss': 0.3615, 'learning_rate': 3.4922062409682713e-06, 'epoch': 1.47} {'loss': 0.326, 'learning_rate': 3.491951147934125e-06, 'epoch': 1.47} {'loss': 0.2482, 'learning_rate': 3.491696062246324e-06, 'epoch': 1.47} {'loss': 0.4204, 'learning_rate': 3.4914409839051613e-06, 'epoch': 1.47} {'loss': 0.3509, 'learning_rate': 3.491185912910927e-06, 'epoch': 1.47} {'loss': 0.4348, 'learning_rate': 3.4909308492639027e-06, 'epoch': 1.47} {'loss': 0.3175, 'learning_rate': 3.490675792964383e-06, 'epoch': 1.47} {'loss': 0.193, 'learning_rate': 3.490420744012649e-06, 'epoch': 1.47} {'loss': 0.2897, 'learning_rate': 3.490165702408996e-06, 'epoch': 1.47} {'loss': 0.4825, 'learning_rate': 3.4899106681537055e-06, 'epoch': 1.47} {'loss': 0.3499, 'learning_rate': 3.4896556412470695e-06, 'epoch': 1.47} {'loss': 0.4144, 'learning_rate': 3.4894006216893718e-06, 'epoch': 1.47} {'loss': 0.3106, 'learning_rate': 3.4891456094809063e-06, 'epoch': 1.47} {'loss': 0.3487, 'learning_rate': 3.488890604621954e-06, 'epoch': 1.47} {'loss': 0.2854, 'learning_rate': 3.488635607112809e-06, 'epoch': 1.47} {'loss': 0.2629, 'learning_rate': 3.4883806169537527e-06, 'epoch': 1.47} {'loss': 0.254, 'learning_rate': 3.48812563414508e-06, 'epoch': 1.47} {'loss': 0.349, 'learning_rate': 3.4878706586870748e-06, 'epoch': 1.47} {'loss': 0.3591, 'learning_rate': 3.487615690580023e-06, 'epoch': 1.47} {'loss': 0.3541, 'learning_rate': 3.4873607298242173e-06, 'epoch': 1.47} {'loss': 0.2928, 'learning_rate': 3.48710577641994e-06, 'epoch': 1.47} {'loss': 0.2165, 'learning_rate': 3.486850830367484e-06, 'epoch': 1.47} {'loss': 0.3882, 'learning_rate': 3.4865958916671327e-06, 'epoch': 1.47} {'loss': 0.4484, 'learning_rate': 3.486340960319179e-06, 'epoch': 1.47} {'loss': 0.2376, 'learning_rate': 3.4860860363239047e-06, 'epoch': 1.47} {'loss': 0.2427, 'learning_rate': 3.4858311196816032e-06, 'epoch': 1.47} {'loss': 0.3438, 'learning_rate': 3.485576210392557e-06, 'epoch': 1.47} {'loss': 0.1624, 'learning_rate': 3.485321308457059e-06, 'epoch': 1.47} {'loss': 0.446, 'learning_rate': 3.485066413875392e-06, 'epoch': 1.47} {'loss': 0.2674, 'learning_rate': 3.4848115266478487e-06, 'epoch': 1.47} {'loss': 0.3314, 'learning_rate': 3.484556646774715e-06, 'epoch': 1.47} {'loss': 0.2664, 'learning_rate': 3.4843017742562746e-06, 'epoch': 1.47} {'loss': 0.5409, 'learning_rate': 3.484046909092822e-06, 'epoch': 1.47} {'loss': 0.1314, 'learning_rate': 3.483792051284637e-06, 'epoch': 1.47} {'loss': 0.3385, 'learning_rate': 3.4835372008320155e-06, 'epoch': 1.47} {'loss': 0.3832, 'learning_rate': 3.483282357735238e-06, 'epoch': 1.47} {'loss': 0.2009, 'learning_rate': 3.4830275219945985e-06, 'epoch': 1.47} {'loss': 0.2509, 'learning_rate': 3.482772693610379e-06, 'epoch': 1.47} {'loss': 0.1712, 'learning_rate': 3.4825178725828723e-06, 'epoch': 1.47} {'loss': 0.2296, 'learning_rate': 3.4822630589123618e-06, 'epoch': 1.47} {'loss': 0.4223, 'learning_rate': 3.4820082525991383e-06, 'epoch': 1.47} {'loss': 0.3608, 'learning_rate': 3.481753453643486e-06, 'epoch': 1.47} {'loss': 0.376, 'learning_rate': 3.481498662045697e-06, 'epoch': 1.47} {'loss': 0.1872, 'learning_rate': 3.4812438778060573e-06, 'epoch': 1.47} {'loss': 0.409, 'learning_rate': 3.48098910092485e-06, 'epoch': 1.47} {'loss': 0.2684, 'learning_rate': 3.48073433140237e-06, 'epoch': 1.47} {'loss': 0.1955, 'learning_rate': 3.480479569238897e-06, 'epoch': 1.47} {'loss': 0.1728, 'learning_rate': 3.480224814434727e-06, 'epoch': 1.47} {'loss': 0.4318, 'learning_rate': 3.47997006699014e-06, 'epoch': 1.47} {'loss': 0.3192, 'learning_rate': 3.4797153269054297e-06, 'epoch': 1.47} {'loss': 0.4365, 'learning_rate': 3.479460594180878e-06, 'epoch': 1.47} {'loss': 0.3256, 'learning_rate': 3.4792058688167784e-06, 'epoch': 1.47} {'loss': 0.2285, 'learning_rate': 3.4789511508134135e-06, 'epoch': 1.47} {'loss': 0.2503, 'learning_rate': 3.4786964401710744e-06, 'epoch': 1.47} {'loss': 0.4168, 'learning_rate': 3.478441736890044e-06, 'epoch': 1.47} {'loss': 0.3252, 'learning_rate': 3.4781870409706155e-06, 'epoch': 1.47} {'loss': 0.2184, 'learning_rate': 3.477932352413075e-06, 'epoch': 1.47} {'loss': 0.2403, 'learning_rate': 3.477677671217704e-06, 'epoch': 1.47} {'loss': 0.3552, 'learning_rate': 3.4774229973847984e-06, 'epoch': 1.47} {'loss': 0.242, 'learning_rate': 3.4771683309146385e-06, 'epoch': 1.47} {'loss': 0.2074, 'learning_rate': 3.476913671807519e-06, 'epoch': 1.47} {'loss': 0.275, 'learning_rate': 3.4766590200637207e-06, 'epoch': 1.47} {'loss': 0.3724, 'learning_rate': 3.4764043756835363e-06, 'epoch': 1.47} {'loss': 0.2826, 'learning_rate': 3.476149738667247e-06, 'epoch': 1.47} {'loss': 0.3309, 'learning_rate': 3.4758951090151483e-06, 'epoch': 1.47} {'loss': 0.3497, 'learning_rate': 3.4756404867275208e-06, 'epoch': 1.47} {'loss': 0.3942, 'learning_rate': 3.475385871804656e-06, 'epoch': 1.47} {'loss': 0.3143, 'learning_rate': 3.4751312642468384e-06, 'epoch': 1.47} {'loss': 0.3623, 'learning_rate': 3.4748766640543584e-06, 'epoch': 1.47} {'loss': 0.4446, 'learning_rate': 3.4746220712275023e-06, 'epoch': 1.47} {'loss': 0.2315, 'learning_rate': 3.4743674857665545e-06, 'epoch': 1.47} {'loss': 0.3097, 'learning_rate': 3.4741129076718083e-06, 'epoch': 1.47} {'loss': 0.2531, 'learning_rate': 3.473858336943543e-06, 'epoch': 1.47} {'loss': 0.328, 'learning_rate': 3.473603773582055e-06, 'epoch': 1.47} {'loss': 0.3758, 'learning_rate': 3.4733492175876236e-06, 'epoch': 1.47} {'loss': 0.3539, 'learning_rate': 3.473094668960544e-06, 'epoch': 1.47} {'loss': 0.1529, 'learning_rate': 3.4728401277010947e-06, 'epoch': 1.47} {'loss': 0.3507, 'learning_rate': 3.4725855938095722e-06, 'epoch': 1.47} {'loss': 0.3528, 'learning_rate': 3.4723310672862555e-06, 'epoch': 1.47} {'loss': 0.4008, 'learning_rate': 3.472076548131439e-06, 'epoch': 1.47} {'loss': 0.2595, 'learning_rate': 3.4718220363454038e-06, 'epoch': 1.47} {'loss': 0.3036, 'learning_rate': 3.4715675319284425e-06, 'epoch': 1.47} {'loss': 0.2597, 'learning_rate': 3.471313034880841e-06, 'epoch': 1.47} {'loss': 0.3882, 'learning_rate': 3.4710585452028813e-06, 'epoch': 1.47} {'loss': 0.2809, 'learning_rate': 3.470804062894859e-06, 'epoch': 1.47} {'loss': 0.2445, 'learning_rate': 3.4705495879570537e-06, 'epoch': 1.47} {'loss': 0.3032, 'learning_rate': 3.4702951203897606e-06, 'epoch': 1.47} {'loss': 0.4046, 'learning_rate': 3.470040660193258e-06, 'epoch': 1.47} {'loss': 0.3732, 'learning_rate': 3.4697862073678413e-06, 'epoch': 1.47} {'loss': 0.2803, 'learning_rate': 3.4695317619137913e-06, 'epoch': 1.47} {'loss': 0.1808, 'learning_rate': 3.4692773238314014e-06, 'epoch': 1.47} {'loss': 0.2867, 'learning_rate': 3.4690228931209526e-06, 'epoch': 1.47} {'loss': 0.3727, 'learning_rate': 3.4687684697827372e-06, 'epoch': 1.47} {'loss': 0.375, 'learning_rate': 3.468514053817038e-06, 'epoch': 1.47} {'loss': 0.3687, 'learning_rate': 3.468259645224147e-06, 'epoch': 1.47} {'loss': 0.3338, 'learning_rate': 3.4680052440043487e-06, 'epoch': 1.47} {'loss': 0.2494, 'learning_rate': 3.4677508501579283e-06, 'epoch': 1.47} {'loss': 0.31, 'learning_rate': 3.467496463685177e-06, 'epoch': 1.47} {'loss': 0.2411, 'learning_rate': 3.4672420845863774e-06, 'epoch': 1.47} {'loss': 0.295, 'learning_rate': 3.4669877128618225e-06, 'epoch': 1.47} {'loss': 0.3948, 'learning_rate': 3.4667333485117926e-06, 'epoch': 1.47} {'loss': 0.299, 'learning_rate': 3.4664789915365817e-06, 'epoch': 1.47} {'loss': 0.3201, 'learning_rate': 3.4662246419364664e-06, 'epoch': 1.47} {'loss': 0.2619, 'learning_rate': 3.4659702997117485e-06, 'epoch': 1.47} {'loss': 0.168, 'learning_rate': 3.465715964862707e-06, 'epoch': 1.47} {'loss': 0.2398, 'learning_rate': 3.4654616373896264e-06, 'epoch': 1.47} {'loss': 0.2571, 'learning_rate': 3.4652073172928016e-06, 'epoch': 1.47} {'loss': 0.3793, 'learning_rate': 3.464953004572511e-06, 'epoch': 1.47} {'loss': 0.4246, 'learning_rate': 3.464698699229049e-06, 'epoch': 1.47} {'loss': 0.3686, 'learning_rate': 3.4644444012626952e-06, 'epoch': 1.47} {'loss': 0.1783, 'learning_rate': 3.4641901106737454e-06, 'epoch': 1.47} {'loss': 0.403, 'learning_rate': 3.463935827462478e-06, 'epoch': 1.47} {'loss': 0.333, 'learning_rate': 3.4636815516291876e-06, 'epoch': 1.47} {'loss': 0.3061, 'learning_rate': 3.4634272831741556e-06, 'epoch': 1.47} {'loss': 0.2503, 'learning_rate': 3.4631730220976734e-06, 'epoch': 1.47} {'loss': 0.4322, 'learning_rate': 3.462918768400023e-06, 'epoch': 1.47} {'loss': 0.3928, 'learning_rate': 3.462664522081497e-06, 'epoch': 1.47} {'loss': 0.2956, 'learning_rate': 3.46241028314238e-06, 'epoch': 1.47} {'loss': 0.3201, 'learning_rate': 3.4621560515829556e-06, 'epoch': 1.47} {'loss': 0.4162, 'learning_rate': 3.4619018274035166e-06, 'epoch': 1.47} {'loss': 0.3134, 'learning_rate': 3.4616476106043438e-06, 'epoch': 1.47} {'loss': 0.42, 'learning_rate': 3.4613934011857307e-06, 'epoch': 1.47} {'loss': 0.3859, 'learning_rate': 3.4611391991479582e-06, 'epoch': 1.47} {'loss': 0.4047, 'learning_rate': 3.46088500449132e-06, 'epoch': 1.47} {'loss': 0.3355, 'learning_rate': 3.4606308172160953e-06, 'epoch': 1.47} {'loss': 0.3939, 'learning_rate': 3.460376637322578e-06, 'epoch': 1.47} {'loss': 0.2586, 'learning_rate': 3.4601224648110475e-06, 'epoch': 1.47} {'loss': 0.3201, 'learning_rate': 3.4598682996818e-06, 'epoch': 1.47} {'loss': 0.2887, 'learning_rate': 3.4596141419351136e-06, 'epoch': 1.47} {'loss': 0.3061, 'learning_rate': 3.4593599915712827e-06, 'epoch': 1.47} {'loss': 0.2871, 'learning_rate': 3.4591058485905917e-06, 'epoch': 1.47} {'loss': 0.2451, 'learning_rate': 3.458851712993321e-06, 'epoch': 1.47} {'loss': 0.3709, 'learning_rate': 3.458597584779767e-06, 'epoch': 1.47} {'loss': 0.2451, 'learning_rate': 3.4583434639502102e-06, 'epoch': 1.47} {'loss': 0.296, 'learning_rate': 3.458089350504942e-06, 'epoch': 1.47} {'loss': 0.2827, 'learning_rate': 3.457835244444243e-06, 'epoch': 1.47} {'loss': 0.2993, 'learning_rate': 3.4575811457684082e-06, 'epoch': 1.47} {'loss': 0.3007, 'learning_rate': 3.457327054477716e-06, 'epoch': 1.47} {'loss': 0.2927, 'learning_rate': 3.4570729705724616e-06, 'epoch': 1.47} {'loss': 0.4028, 'learning_rate': 3.4568188940529245e-06, 'epoch': 1.47} {'loss': 0.288, 'learning_rate': 3.4565648249193975e-06, 'epoch': 1.47} {'loss': 0.5105, 'learning_rate': 3.4563107631721603e-06, 'epoch': 1.47} {'loss': 0.283, 'learning_rate': 3.4560567088115083e-06, 'epoch': 1.47} {'loss': 0.3191, 'learning_rate': 3.455802661837724e-06, 'epoch': 1.47} {'loss': 0.4107, 'learning_rate': 3.4555486222510904e-06, 'epoch': 1.47} {'loss': 0.3124, 'learning_rate': 3.455294590051901e-06, 'epoch': 1.47} {'loss': 0.3911, 'learning_rate': 3.4550405652404363e-06, 'epoch': 1.47} {'loss': 0.1546, 'learning_rate': 3.4547865478169895e-06, 'epoch': 1.47} {'loss': 0.27, 'learning_rate': 3.454532537781842e-06, 'epoch': 1.47} {'loss': 0.3163, 'learning_rate': 3.4542785351352837e-06, 'epoch': 1.47} {'loss': 0.2956, 'learning_rate': 3.4540245398775986e-06, 'epoch': 1.47} {'loss': 0.45, 'learning_rate': 3.453770552009077e-06, 'epoch': 1.47} {'loss': 0.2795, 'learning_rate': 3.4535165715300014e-06, 'epoch': 1.47} {'loss': 0.2247, 'learning_rate': 3.4532625984406643e-06, 'epoch': 1.47} {'loss': 0.2907, 'learning_rate': 3.4530086327413446e-06, 'epoch': 1.47} {'loss': 0.2493, 'learning_rate': 3.452754674432336e-06, 'epoch': 1.47} {'loss': 0.2286, 'learning_rate': 3.4525007235139243e-06, 'epoch': 1.47} {'loss': 0.2208, 'learning_rate': 3.452246779986389e-06, 'epoch': 1.47} {'loss': 0.3658, 'learning_rate': 3.451992843850026e-06, 'epoch': 1.47} {'loss': 0.3108, 'learning_rate': 3.4517389151051153e-06, 'epoch': 1.47} {'loss': 0.3564, 'learning_rate': 3.451484993751948e-06, 'epoch': 1.47} {'loss': 0.2642, 'learning_rate': 3.4512310797908068e-06, 'epoch': 1.47} {'loss': 0.2335, 'learning_rate': 3.4509771732219834e-06, 'epoch': 1.47} {'loss': 0.2627, 'learning_rate': 3.4507232740457573e-06, 'epoch': 1.47} {'loss': 0.3261, 'learning_rate': 3.4504693822624234e-06, 'epoch': 1.47} {'loss': 0.251, 'learning_rate': 3.4502154978722604e-06, 'epoch': 1.47} {'loss': 0.29, 'learning_rate': 3.449961620875563e-06, 'epoch': 1.47} {'loss': 0.2662, 'learning_rate': 3.4497077512726083e-06, 'epoch': 1.47} {'loss': 0.3878, 'learning_rate': 3.449453889063692e-06, 'epoch': 1.47} {'loss': 0.2996, 'learning_rate': 3.4492000342490974e-06, 'epoch': 1.47} {'loss': 0.293, 'learning_rate': 3.4489461868291065e-06, 'epoch': 1.47} {'loss': 0.3526, 'learning_rate': 3.4486923468040122e-06, 'epoch': 1.47} {'loss': 0.3581, 'learning_rate': 3.4484385141740962e-06, 'epoch': 1.47} {'loss': 0.3077, 'learning_rate': 3.44818468893965e-06, 'epoch': 1.47} {'loss': 0.3508, 'learning_rate': 3.447930871100954e-06, 'epoch': 1.47} {'loss': 0.2866, 'learning_rate': 3.447677060658301e-06, 'epoch': 1.47} {'loss': 0.2356, 'learning_rate': 3.4474232576119726e-06, 'epoch': 1.47} {'loss': 0.3026, 'learning_rate': 3.44716946196226e-06, 'epoch': 1.47} {'loss': 0.2317, 'learning_rate': 3.4469156737094434e-06, 'epoch': 1.47} {'loss': 0.2717, 'learning_rate': 3.4466618928538166e-06, 'epoch': 1.47} {'loss': 0.3088, 'learning_rate': 3.446408119395659e-06, 'epoch': 1.47} {'loss': 0.3255, 'learning_rate': 3.4461543533352637e-06, 'epoch': 1.47} {'loss': 0.3172, 'learning_rate': 3.4459005946729128e-06, 'epoch': 1.47} {'loss': 0.1976, 'learning_rate': 3.445646843408892e-06, 'epoch': 1.47} {'loss': 0.2452, 'learning_rate': 3.4453930995434925e-06, 'epoch': 1.47} {'loss': 0.3015, 'learning_rate': 3.4451393630769936e-06, 'epoch': 1.47} {'loss': 0.425, 'learning_rate': 3.4448856340096905e-06, 'epoch': 1.47} {'loss': 0.4419, 'learning_rate': 3.4446319123418605e-06, 'epoch': 1.47} {'loss': 0.2915, 'learning_rate': 3.444378198073799e-06, 'epoch': 1.47} {'loss': 0.3372, 'learning_rate': 3.4441244912057835e-06, 'epoch': 1.47} {'loss': 0.2594, 'learning_rate': 3.4438707917381085e-06, 'epoch': 1.47} {'loss': 0.2412, 'learning_rate': 3.443617099671054e-06, 'epoch': 1.47} {'loss': 0.3664, 'learning_rate': 3.443363415004911e-06, 'epoch': 1.47} {'loss': 0.3023, 'learning_rate': 3.4431097377399614e-06, 'epoch': 1.47} {'loss': 0.2932, 'learning_rate': 3.442856067876498e-06, 'epoch': 1.47} {'loss': 0.5075, 'learning_rate': 3.4426024054148022e-06, 'epoch': 1.47} {'loss': 0.2267, 'learning_rate': 3.442348750355159e-06, 'epoch': 1.47} {'loss': 0.2998, 'learning_rate': 3.442095102697859e-06, 'epoch': 1.47} {'loss': 0.3781, 'learning_rate': 3.441841462443184e-06, 'epoch': 1.47} {'loss': 0.3172, 'learning_rate': 3.4415878295914264e-06, 'epoch': 1.47} {'loss': 0.2298, 'learning_rate': 3.4413342041428656e-06, 'epoch': 1.47} {'loss': 0.3004, 'learning_rate': 3.4410805860977913e-06, 'epoch': 1.47} {'loss': 0.3333, 'learning_rate': 3.4408269754564926e-06, 'epoch': 1.47} {'loss': 0.382, 'learning_rate': 3.4405733722192504e-06, 'epoch': 1.47} {'loss': 0.225, 'learning_rate': 3.440319776386356e-06, 'epoch': 1.47} {'loss': 0.2524, 'learning_rate': 3.440066187958091e-06, 'epoch': 1.47} {'loss': 0.3451, 'learning_rate': 3.439812606934747e-06, 'epoch': 1.47} {'loss': 0.5484, 'learning_rate': 3.4395590333166027e-06, 'epoch': 1.47} {'loss': 0.2273, 'learning_rate': 3.439305467103953e-06, 'epoch': 1.47} {'loss': 0.2347, 'learning_rate': 3.4390519082970763e-06, 'epoch': 1.47} {'loss': 0.3455, 'learning_rate': 3.438798356896266e-06, 'epoch': 1.47} {'loss': 0.4089, 'learning_rate': 3.4385448129018005e-06, 'epoch': 1.47} {'loss': 0.2665, 'learning_rate': 3.4382912763139742e-06, 'epoch': 1.47} {'loss': 0.3272, 'learning_rate': 3.4380377471330652e-06, 'epoch': 1.47} {'loss': 0.3146, 'learning_rate': 3.4377842253593675e-06, 'epoch': 1.47} {'loss': 0.2996, 'learning_rate': 3.4375307109931643e-06, 'epoch': 1.47} {'loss': 0.2968, 'learning_rate': 3.437277204034737e-06, 'epoch': 1.47} {'loss': 0.3592, 'learning_rate': 3.437023704484379e-06, 'epoch': 1.47} {'loss': 0.1926, 'learning_rate': 3.4367702123423697e-06, 'epoch': 1.47} {'loss': 0.4197, 'learning_rate': 3.436516727609003e-06, 'epoch': 1.47} {'loss': 0.3858, 'learning_rate': 3.436263250284556e-06, 'epoch': 1.47} {'loss': 0.3378, 'learning_rate': 3.4360097803693247e-06, 'epoch': 1.47} {'loss': 0.2333, 'learning_rate': 3.4357563178635857e-06, 'epoch': 1.47} {'loss': 0.147, 'learning_rate': 3.4355028627676333e-06, 'epoch': 1.47} {'loss': 0.3663, 'learning_rate': 3.4352494150817463e-06, 'epoch': 1.47} {'loss': 0.3178, 'learning_rate': 3.434995974806218e-06, 'epoch': 1.47} {'loss': 0.2386, 'learning_rate': 3.434742541941327e-06, 'epoch': 1.47} {'loss': 0.4604, 'learning_rate': 3.4344891164873673e-06, 'epoch': 1.47} {'loss': 0.3294, 'learning_rate': 3.434235698444618e-06, 'epoch': 1.47} {'loss': 0.3008, 'learning_rate': 3.43398228781337e-06, 'epoch': 1.47} {'loss': 0.2402, 'learning_rate': 3.4337288845939086e-06, 'epoch': 1.47} {'loss': 0.1984, 'learning_rate': 3.433475488786514e-06, 'epoch': 1.47} {'loss': 0.4326, 'learning_rate': 3.433222100391481e-06, 'epoch': 1.47} {'loss': 0.2765, 'learning_rate': 3.4329687194090887e-06, 'epoch': 1.47} {'loss': 0.3449, 'learning_rate': 3.432715345839629e-06, 'epoch': 1.47} {'loss': 0.1326, 'learning_rate': 3.4324619796833815e-06, 'epoch': 1.47} {'loss': 0.3201, 'learning_rate': 3.432208620940638e-06, 'epoch': 1.47} {'loss': 0.2967, 'learning_rate': 3.43195526961168e-06, 'epoch': 1.47} {'loss': 0.3779, 'learning_rate': 3.4317019256967975e-06, 'epoch': 1.47} {'loss': 0.3615, 'learning_rate': 3.431448589196272e-06, 'epoch': 1.47} {'loss': 0.2903, 'learning_rate': 3.4311952601103947e-06, 'epoch': 1.47} {'loss': 0.3324, 'learning_rate': 3.430941938439446e-06, 'epoch': 1.47} {'loss': 0.2263, 'learning_rate': 3.4306886241837188e-06, 'epoch': 1.47} {'loss': 0.4651, 'learning_rate': 3.4304353173434934e-06, 'epoch': 1.47} {'loss': 0.1694, 'learning_rate': 3.430182017919055e-06, 'epoch': 1.47} {'loss': 0.4282, 'learning_rate': 3.429928725910695e-06, 'epoch': 1.47} {'loss': 0.4884, 'learning_rate': 3.429675441318693e-06, 'epoch': 1.47} {'loss': 0.2413, 'learning_rate': 3.42942216414334e-06, 'epoch': 1.47} {'loss': 0.2352, 'learning_rate': 3.4291688943849178e-06, 'epoch': 1.47} {'loss': 0.2787, 'learning_rate': 3.4289156320437178e-06, 'epoch': 1.47} {'loss': 0.2199, 'learning_rate': 3.4286623771200187e-06, 'epoch': 1.47} {'loss': 0.3046, 'learning_rate': 3.428409129614114e-06, 'epoch': 1.47} {'loss': 0.42, 'learning_rate': 3.428155889526281e-06, 'epoch': 1.47} {'loss': 0.3271, 'learning_rate': 3.427902656856815e-06, 'epoch': 1.47} {'loss': 0.3116, 'learning_rate': 3.427649431605994e-06, 'epoch': 1.47} {'loss': 0.3025, 'learning_rate': 3.4273962137741103e-06, 'epoch': 1.47} {'loss': 0.3826, 'learning_rate': 3.427143003361446e-06, 'epoch': 1.47} {'loss': 0.1482, 'learning_rate': 3.4268898003682836e-06, 'epoch': 1.47} {'loss': 0.3459, 'learning_rate': 3.426636604794916e-06, 'epoch': 1.47} {'loss': 0.4287, 'learning_rate': 3.426383416641623e-06, 'epoch': 1.47} {'loss': 0.3298, 'learning_rate': 3.4261302359086967e-06, 'epoch': 1.47} {'loss': 0.3355, 'learning_rate': 3.4258770625964155e-06, 'epoch': 1.47} {'loss': 0.2193, 'learning_rate': 3.4256238967050725e-06, 'epoch': 1.47} {'loss': 0.3606, 'learning_rate': 3.4253707382349464e-06, 'epoch': 1.47} {'loss': 0.3013, 'learning_rate': 3.4251175871863295e-06, 'epoch': 1.47} {'loss': 0.2819, 'learning_rate': 3.424864443559501e-06, 'epoch': 1.47} {'loss': 0.3172, 'learning_rate': 3.424611307354755e-06, 'epoch': 1.47} {'loss': 0.3375, 'learning_rate': 3.424358178572368e-06, 'epoch': 1.47} {'loss': 0.3789, 'learning_rate': 3.4241050572126345e-06, 'epoch': 1.47} {'loss': 0.2098, 'learning_rate': 3.4238519432758344e-06, 'epoch': 1.47} {'loss': 0.5093, 'learning_rate': 3.423598836762253e-06, 'epoch': 1.47} {'loss': 0.2731, 'learning_rate': 3.42334573767218e-06, 'epoch': 1.47} {'loss': 0.502, 'learning_rate': 3.4230926460058967e-06, 'epoch': 1.47} {'loss': 0.4684, 'learning_rate': 3.4228395617636946e-06, 'epoch': 1.47} {'loss': 0.3121, 'learning_rate': 3.422586484945852e-06, 'epoch': 1.47} {'loss': 0.3064, 'learning_rate': 3.4223334155526623e-06, 'epoch': 1.47} {'loss': 0.1851, 'learning_rate': 3.4220803535844036e-06, 'epoch': 1.47} {'loss': 0.2383, 'learning_rate': 3.421827299041369e-06, 'epoch': 1.47} {'loss': 0.2893, 'learning_rate': 3.421574251923837e-06, 'epoch': 1.47} {'loss': 0.1645, 'learning_rate': 3.4213212122321006e-06, 'epoch': 1.47} {'loss': 0.1885, 'learning_rate': 3.421068179966437e-06, 'epoch': 1.47} {'loss': 0.3431, 'learning_rate': 3.420815155127141e-06, 'epoch': 1.47} {'loss': 0.369, 'learning_rate': 3.4205621377144927e-06, 'epoch': 1.47} {'loss': 0.24, 'learning_rate': 3.420309127728776e-06, 'epoch': 1.47} {'loss': 0.2798, 'learning_rate': 3.4200561251702812e-06, 'epoch': 1.47} {'loss': 0.3785, 'learning_rate': 3.4198031300392896e-06, 'epoch': 1.47} {'loss': 0.243, 'learning_rate': 3.419550142336092e-06, 'epoch': 1.47} {'loss': 0.179, 'learning_rate': 3.4192971620609683e-06, 'epoch': 1.47} {'loss': 0.2495, 'learning_rate': 3.419044189214209e-06, 'epoch': 1.47} {'loss': 0.2122, 'learning_rate': 3.418791223796095e-06, 'epoch': 1.47} {'loss': 0.3062, 'learning_rate': 3.418538265806917e-06, 'epoch': 1.47} {'loss': 0.3912, 'learning_rate': 3.4182853152469543e-06, 'epoch': 1.47} {'loss': 0.3658, 'learning_rate': 3.4180323721165e-06, 'epoch': 1.47} {'loss': 0.434, 'learning_rate': 3.4177794364158314e-06, 'epoch': 1.47} {'loss': 0.152, 'learning_rate': 3.4175265081452415e-06, 'epoch': 1.47} {'loss': 0.2058, 'learning_rate': 3.4172735873050122e-06, 'epoch': 1.47} {'loss': 0.3061, 'learning_rate': 3.417020673895427e-06, 'epoch': 1.47} {'loss': 0.4261, 'learning_rate': 3.4167677679167765e-06, 'epoch': 1.47} {'loss': 0.4362, 'learning_rate': 3.4165148693693397e-06, 'epoch': 1.47} {'loss': 0.285, 'learning_rate': 3.416261978253409e-06, 'epoch': 1.47} {'loss': 0.3309, 'learning_rate': 3.4160090945692635e-06, 'epoch': 1.47} {'loss': 0.2225, 'learning_rate': 3.415756218317191e-06, 'epoch': 1.47} {'loss': 0.3124, 'learning_rate': 3.4155033494974823e-06, 'epoch': 1.47} {'loss': 0.2317, 'learning_rate': 3.4152504881104142e-06, 'epoch': 1.47} {'loss': 0.2534, 'learning_rate': 3.4149976341562797e-06, 'epoch': 1.47} {'loss': 0.3752, 'learning_rate': 3.414744787635357e-06, 'epoch': 1.47} {'loss': 0.3587, 'learning_rate': 3.414491948547939e-06, 'epoch': 1.47} {'loss': 0.212, 'learning_rate': 3.4142391168943036e-06, 'epoch': 1.47} {'loss': 0.1921, 'learning_rate': 3.4139862926747436e-06, 'epoch': 1.47} {'loss': 0.2567, 'learning_rate': 3.4137334758895367e-06, 'epoch': 1.47} {'loss': 0.3426, 'learning_rate': 3.4134806665389764e-06, 'epoch': 1.47} {'loss': 0.3665, 'learning_rate': 3.4132278646233397e-06, 'epoch': 1.47} {'loss': 0.3016, 'learning_rate': 3.41297507014292e-06, 'epoch': 1.47} {'loss': 0.241, 'learning_rate': 3.4127222830979958e-06, 'epoch': 1.47} {'loss': 0.3279, 'learning_rate': 3.4124695034888587e-06, 'epoch': 1.47} {'loss': 0.3794, 'learning_rate': 3.4122167313157908e-06, 'epoch': 1.47} {'loss': 0.3008, 'learning_rate': 3.4119639665790737e-06, 'epoch': 1.47} {'loss': 0.4859, 'learning_rate': 3.4117112092790006e-06, 'epoch': 1.47} {'loss': 0.2017, 'learning_rate': 3.4114584594158483e-06, 'epoch': 1.47} {'loss': 0.2556, 'learning_rate': 3.4112057169899113e-06, 'epoch': 1.47} {'loss': 0.2813, 'learning_rate': 3.4109529820014666e-06, 'epoch': 1.47} {'loss': 0.2617, 'learning_rate': 3.410700254450805e-06, 'epoch': 1.47} {'loss': 0.3207, 'learning_rate': 3.410447534338207e-06, 'epoch': 1.47} {'loss': 0.2759, 'learning_rate': 3.4101948216639647e-06, 'epoch': 1.47} {'loss': 0.2638, 'learning_rate': 3.4099421164283565e-06, 'epoch': 1.47} {'loss': 0.2128, 'learning_rate': 3.409689418631672e-06, 'epoch': 1.47} {'loss': 0.2759, 'learning_rate': 3.4094367282741924e-06, 'epoch': 1.47} {'loss': 0.3713, 'learning_rate': 3.40918404535621e-06, 'epoch': 1.47} {'loss': 0.2765, 'learning_rate': 3.4089313698780037e-06, 'epoch': 1.47} {'loss': 0.2139, 'learning_rate': 3.4086787018398584e-06, 'epoch': 1.47} {'loss': 0.2412, 'learning_rate': 3.4084260412420644e-06, 'epoch': 1.48} {'loss': 0.3987, 'learning_rate': 3.4081733880849e-06, 'epoch': 1.48} {'loss': 0.3121, 'learning_rate': 3.407920742368659e-06, 'epoch': 1.48} {'loss': 0.2698, 'learning_rate': 3.407668104093618e-06, 'epoch': 1.48} {'loss': 0.3428, 'learning_rate': 3.4074154732600695e-06, 'epoch': 1.48} {'loss': 0.2515, 'learning_rate': 3.4071628498682918e-06, 'epoch': 1.48} {'loss': 0.3762, 'learning_rate': 3.406910233918577e-06, 'epoch': 1.48} {'loss': 0.1794, 'learning_rate': 3.4066576254112026e-06, 'epoch': 1.48} {'loss': 0.2446, 'learning_rate': 3.406405024346462e-06, 'epoch': 1.48} {'loss': 0.3185, 'learning_rate': 3.406152430724633e-06, 'epoch': 1.48} {'loss': 0.3706, 'learning_rate': 3.4058998445460077e-06, 'epoch': 1.48} {'loss': 0.3634, 'learning_rate': 3.4056472658108675e-06, 'epoch': 1.48} {'loss': 0.2729, 'learning_rate': 3.405394694519494e-06, 'epoch': 1.48} {'loss': 0.2694, 'learning_rate': 3.4051421306721786e-06, 'epoch': 1.48} {'loss': 0.2815, 'learning_rate': 3.4048895742692013e-06, 'epoch': 1.48} {'loss': 0.3516, 'learning_rate': 3.404637025310853e-06, 'epoch': 1.48} {'loss': 0.3897, 'learning_rate': 3.4043844837974105e-06, 'epoch': 1.48} {'loss': 0.4671, 'learning_rate': 3.4041319497291682e-06, 'epoch': 1.48} {'loss': 0.4672, 'learning_rate': 3.403879423106403e-06, 'epoch': 1.48} {'loss': 0.3062, 'learning_rate': 3.403626903929408e-06, 'epoch': 1.48} {'loss': 0.2569, 'learning_rate': 3.4033743921984596e-06, 'epoch': 1.48} {'loss': 0.329, 'learning_rate': 3.4031218879138507e-06, 'epoch': 1.48} {'loss': 0.3061, 'learning_rate': 3.4028693910758583e-06, 'epoch': 1.48} {'loss': 0.2858, 'learning_rate': 3.4026169016847766e-06, 'epoch': 1.48} {'loss': 0.2892, 'learning_rate': 3.4023644197408858e-06, 'epoch': 1.48} {'loss': 0.3307, 'learning_rate': 3.402111945244466e-06, 'epoch': 1.48} {'loss': 0.4768, 'learning_rate': 3.4018594781958126e-06, 'epoch': 1.48} {'loss': 0.2262, 'learning_rate': 3.401607018595201e-06, 'epoch': 1.48} {'loss': 0.3587, 'learning_rate': 3.4013545664429227e-06, 'epoch': 1.48} {'loss': 0.3503, 'learning_rate': 3.401102121739258e-06, 'epoch': 1.48} {'loss': 0.2001, 'learning_rate': 3.4008496844844973e-06, 'epoch': 1.48} {'loss': 0.266, 'learning_rate': 3.400597254678919e-06, 'epoch': 1.48} {'loss': 0.435, 'learning_rate': 3.400344832322815e-06, 'epoch': 1.48} {'loss': 0.4578, 'learning_rate': 3.400092417416464e-06, 'epoch': 1.48} {'loss': 0.3675, 'learning_rate': 3.3998400099601557e-06, 'epoch': 1.48} {'loss': 0.4491, 'learning_rate': 3.39958760995417e-06, 'epoch': 1.48} {'loss': 0.3754, 'learning_rate': 3.399335217398799e-06, 'epoch': 1.48} {'loss': 0.4468, 'learning_rate': 3.3990828322943225e-06, 'epoch': 1.48} {'loss': 0.2033, 'learning_rate': 3.3988304546410232e-06, 'epoch': 1.48} {'loss': 0.3003, 'learning_rate': 3.3985780844391926e-06, 'epoch': 1.48} {'loss': 0.2234, 'learning_rate': 3.3983257216891076e-06, 'epoch': 1.48} {'loss': 0.3434, 'learning_rate': 3.3980733663910614e-06, 'epoch': 1.48} {'loss': 0.3011, 'learning_rate': 3.3978210185453318e-06, 'epoch': 1.48} {'loss': 0.1834, 'learning_rate': 3.397568678152211e-06, 'epoch': 1.48} {'loss': 0.2972, 'learning_rate': 3.397316345211975e-06, 'epoch': 1.48} {'loss': 0.3817, 'learning_rate': 3.397064019724917e-06, 'epoch': 1.48} {'loss': 0.2382, 'learning_rate': 3.396811701691315e-06, 'epoch': 1.48} {'loss': 0.4055, 'learning_rate': 3.39655939111146e-06, 'epoch': 1.48} {'loss': 0.2939, 'learning_rate': 3.396307087985631e-06, 'epoch': 1.48} {'loss': 0.2925, 'learning_rate': 3.3960547923141187e-06, 'epoch': 1.48} {'loss': 0.2275, 'learning_rate': 3.395802504097204e-06, 'epoch': 1.48} {'loss': 0.3729, 'learning_rate': 3.395550223335169e-06, 'epoch': 1.48} {'loss': 0.164, 'learning_rate': 3.3952979500283056e-06, 'epoch': 1.48} {'loss': 0.3279, 'learning_rate': 3.395045684176892e-06, 'epoch': 1.48} {'loss': 0.2884, 'learning_rate': 3.3947934257812188e-06, 'epoch': 1.48} {'loss': 0.3918, 'learning_rate': 3.394541174841565e-06, 'epoch': 1.48} {'loss': 0.3172, 'learning_rate': 3.3942889313582204e-06, 'epoch': 1.48} {'loss': 0.3007, 'learning_rate': 3.394036695331465e-06, 'epoch': 1.48} {'loss': 0.256, 'learning_rate': 3.3937844667615896e-06, 'epoch': 1.48} {'loss': 0.2144, 'learning_rate': 3.393532245648872e-06, 'epoch': 1.48} {'loss': 0.2163, 'learning_rate': 3.393280031993602e-06, 'epoch': 1.48} {'loss': 0.2966, 'learning_rate': 3.39302782579606e-06, 'epoch': 1.48} {'loss': 0.1784, 'learning_rate': 3.392775627056537e-06, 'epoch': 1.48} {'loss': 0.4781, 'learning_rate': 3.39252343577531e-06, 'epoch': 1.48} {'loss': 0.258, 'learning_rate': 3.392271251952671e-06, 'epoch': 1.48} {'loss': 0.325, 'learning_rate': 3.3920190755889015e-06, 'epoch': 1.48} {'loss': 0.2406, 'learning_rate': 3.391766906684283e-06, 'epoch': 1.48} {'loss': 0.1899, 'learning_rate': 3.391514745239106e-06, 'epoch': 1.48} {'loss': 0.1974, 'learning_rate': 3.391262591253649e-06, 'epoch': 1.48} {'loss': 0.3415, 'learning_rate': 3.3910104447282023e-06, 'epoch': 1.48} {'loss': 0.3089, 'learning_rate': 3.390758305663042e-06, 'epoch': 1.48} {'loss': 0.3422, 'learning_rate': 3.3905061740584653e-06, 'epoch': 1.48} {'loss': 0.318, 'learning_rate': 3.3902540499147507e-06, 'epoch': 1.48} {'loss': 0.3789, 'learning_rate': 3.390001933232179e-06, 'epoch': 1.48} {'loss': 0.2369, 'learning_rate': 3.3897498240110405e-06, 'epoch': 1.48} {'loss': 0.3939, 'learning_rate': 3.3894977222516157e-06, 'epoch': 1.48} {'loss': 0.2169, 'learning_rate': 3.389245627954193e-06, 'epoch': 1.48} {'loss': 0.2911, 'learning_rate': 3.388993541119052e-06, 'epoch': 1.48} {'loss': 0.2772, 'learning_rate': 3.388741461746483e-06, 'epoch': 1.48} {'loss': 0.3034, 'learning_rate': 3.3884893898367654e-06, 'epoch': 1.48} {'loss': 0.3038, 'learning_rate': 3.388237325390189e-06, 'epoch': 1.48} {'loss': 0.2524, 'learning_rate': 3.3879852684070314e-06, 'epoch': 1.48} {'loss': 0.3292, 'learning_rate': 3.3877332188875857e-06, 'epoch': 1.48} {'loss': 0.238, 'learning_rate': 3.387481176832127e-06, 'epoch': 1.48} {'loss': 0.3872, 'learning_rate': 3.3872291422409487e-06, 'epoch': 1.48} {'loss': 0.2237, 'learning_rate': 3.3869771151143317e-06, 'epoch': 1.48} {'loss': 0.3041, 'learning_rate': 3.3867250954525555e-06, 'epoch': 1.48} {'loss': 0.3383, 'learning_rate': 3.386473083255913e-06, 'epoch': 1.48} {'loss': 0.2765, 'learning_rate': 3.3862210785246817e-06, 'epoch': 1.48} {'loss': 0.2399, 'learning_rate': 3.3859690812591517e-06, 'epoch': 1.48} {'loss': 0.2828, 'learning_rate': 3.3857170914596025e-06, 'epoch': 1.48} {'loss': 0.3381, 'learning_rate': 3.3854651091263235e-06, 'epoch': 1.48} {'loss': 0.325, 'learning_rate': 3.385213134259594e-06, 'epoch': 1.48} {'loss': 0.3418, 'learning_rate': 3.384961166859704e-06, 'epoch': 1.48} {'loss': 0.3599, 'learning_rate': 3.3847092069269316e-06, 'epoch': 1.48} {'loss': 0.1962, 'learning_rate': 3.3844572544615674e-06, 'epoch': 1.48} {'loss': 0.2522, 'learning_rate': 3.3842053094638905e-06, 'epoch': 1.48} {'loss': 0.3341, 'learning_rate': 3.383953371934191e-06, 'epoch': 1.48} {'loss': 0.414, 'learning_rate': 3.3837014418727496e-06, 'epoch': 1.48} {'loss': 0.3341, 'learning_rate': 3.3834495192798476e-06, 'epoch': 1.48} {'loss': 0.3756, 'learning_rate': 3.383197604155777e-06, 'epoch': 1.48} {'loss': 0.3795, 'learning_rate': 3.3829456965008133e-06, 'epoch': 1.48} {'loss': 0.1988, 'learning_rate': 3.3826937963152506e-06, 'epoch': 1.48} {'loss': 0.2943, 'learning_rate': 3.382441903599364e-06, 'epoch': 1.48} {'loss': 0.3487, 'learning_rate': 3.382190018353446e-06, 'epoch': 1.48} {'loss': 0.2618, 'learning_rate': 3.381938140577773e-06, 'epoch': 1.48} {'loss': 0.3353, 'learning_rate': 3.381686270272637e-06, 'epoch': 1.48} {'loss': 0.1944, 'learning_rate': 3.3814344074383153e-06, 'epoch': 1.48} {'loss': 0.2576, 'learning_rate': 3.3811825520750998e-06, 'epoch': 1.48} {'loss': 0.289, 'learning_rate': 3.3809307041832663e-06, 'epoch': 1.48} {'loss': 0.2727, 'learning_rate': 3.380678863763107e-06, 'epoch': 1.48} {'loss': 0.3298, 'learning_rate': 3.3804270308149023e-06, 'epoch': 1.48} {'loss': 0.2394, 'learning_rate': 3.3801752053389335e-06, 'epoch': 1.48} {'loss': 0.3711, 'learning_rate': 3.379923387335491e-06, 'epoch': 1.48} {'loss': 0.3237, 'learning_rate': 3.379671576804854e-06, 'epoch': 1.48} {'loss': 0.2779, 'learning_rate': 3.379419773747311e-06, 'epoch': 1.48} {'loss': 0.3467, 'learning_rate': 3.3791679781631405e-06, 'epoch': 1.48} {'loss': 0.4497, 'learning_rate': 3.3789161900526347e-06, 'epoch': 1.48} {'loss': 0.1933, 'learning_rate': 3.3786644094160705e-06, 'epoch': 1.48} {'loss': 0.3074, 'learning_rate': 3.3784126362537374e-06, 'epoch': 1.48} {'loss': 0.3316, 'learning_rate': 3.378160870565914e-06, 'epoch': 1.48} {'loss': 0.4015, 'learning_rate': 3.3779091123528916e-06, 'epoch': 1.48} {'loss': 0.2266, 'learning_rate': 3.3776573616149464e-06, 'epoch': 1.48} {'loss': 0.2498, 'learning_rate': 3.3774056183523707e-06, 'epoch': 1.48} {'loss': 0.2979, 'learning_rate': 3.3771538825654447e-06, 'epoch': 1.48} {'loss': 0.3437, 'learning_rate': 3.376902154254449e-06, 'epoch': 1.48} {'loss': 0.3692, 'learning_rate': 3.3766504334196746e-06, 'epoch': 1.48} {'loss': 0.3905, 'learning_rate': 3.3763987200614e-06, 'epoch': 1.48} {'loss': 0.172, 'learning_rate': 3.3761470141799147e-06, 'epoch': 1.48} {'loss': 0.3326, 'learning_rate': 3.3758953157754957e-06, 'epoch': 1.48} {'loss': 0.2857, 'learning_rate': 3.375643624848435e-06, 'epoch': 1.48} {'loss': 0.3677, 'learning_rate': 3.37539194139901e-06, 'epoch': 1.48} {'loss': 0.327, 'learning_rate': 3.37514026542751e-06, 'epoch': 1.48} {'loss': 0.3279, 'learning_rate': 3.374888596934215e-06, 'epoch': 1.48} {'loss': 0.334, 'learning_rate': 3.3746369359194133e-06, 'epoch': 1.48} {'loss': 0.3636, 'learning_rate': 3.3743852823833832e-06, 'epoch': 1.48} {'loss': 0.3121, 'learning_rate': 3.3741336363264165e-06, 'epoch': 1.48} {'loss': 0.4095, 'learning_rate': 3.3738819977487926e-06, 'epoch': 1.48} {'loss': 0.2867, 'learning_rate': 3.373630366650792e-06, 'epoch': 1.48} {'loss': 0.2871, 'learning_rate': 3.373378743032707e-06, 'epoch': 1.48} {'loss': 0.4101, 'learning_rate': 3.373127126894813e-06, 'epoch': 1.48} {'loss': 0.3131, 'learning_rate': 3.3728755182374016e-06, 'epoch': 1.48} {'loss': 0.4056, 'learning_rate': 3.3726239170607513e-06, 'epoch': 1.48} {'loss': 0.2567, 'learning_rate': 3.3723723233651506e-06, 'epoch': 1.48} {'loss': 0.1469, 'learning_rate': 3.3721207371508778e-06, 'epoch': 1.48} {'loss': 0.268, 'learning_rate': 3.3718691584182238e-06, 'epoch': 1.48} {'loss': 0.354, 'learning_rate': 3.3716175871674673e-06, 'epoch': 1.48} {'loss': 0.3838, 'learning_rate': 3.3713660233988955e-06, 'epoch': 1.48} {'loss': 0.2695, 'learning_rate': 3.3711144671127882e-06, 'epoch': 1.48} {'loss': 0.3151, 'learning_rate': 3.3708629183094365e-06, 'epoch': 1.48} {'loss': 0.3746, 'learning_rate': 3.370611376989119e-06, 'epoch': 1.48} {'loss': 0.2327, 'learning_rate': 3.3703598431521166e-06, 'epoch': 1.48} {'loss': 0.234, 'learning_rate': 3.3701083167987214e-06, 'epoch': 1.48} {'loss': 0.3586, 'learning_rate': 3.369856797929211e-06, 'epoch': 1.48} {'loss': 0.3267, 'learning_rate': 3.3696052865438733e-06, 'epoch': 1.48} {'loss': 0.3574, 'learning_rate': 3.3693537826429867e-06, 'epoch': 1.48} {'loss': 0.3725, 'learning_rate': 3.369102286226843e-06, 'epoch': 1.48} {'loss': 0.2193, 'learning_rate': 3.3688507972957184e-06, 'epoch': 1.48} {'loss': 0.2323, 'learning_rate': 3.3685993158499044e-06, 'epoch': 1.48} {'loss': 0.2968, 'learning_rate': 3.3683478418896766e-06, 'epoch': 1.48} {'loss': 0.2616, 'learning_rate': 3.368096375415326e-06, 'epoch': 1.48} {'loss': 0.2434, 'learning_rate': 3.367844916427131e-06, 'epoch': 1.48} {'loss': 0.1751, 'learning_rate': 3.3675934649253807e-06, 'epoch': 1.48} {'loss': 0.305, 'learning_rate': 3.3673420209103558e-06, 'epoch': 1.48} {'loss': 0.2973, 'learning_rate': 3.3670905843823376e-06, 'epoch': 1.48} {'loss': 0.3036, 'learning_rate': 3.366839155341617e-06, 'epoch': 1.48} {'loss': 0.1822, 'learning_rate': 3.366587733788469e-06, 'epoch': 1.48} {'loss': 0.298, 'learning_rate': 3.3663363197231857e-06, 'epoch': 1.48} {'loss': 0.2651, 'learning_rate': 3.366084913146045e-06, 'epoch': 1.48} {'loss': 0.402, 'learning_rate': 3.3658335140573317e-06, 'epoch': 1.48} {'loss': 0.3113, 'learning_rate': 3.3655821224573336e-06, 'epoch': 1.48} {'loss': 0.3636, 'learning_rate': 3.3653307383463294e-06, 'epoch': 1.48} {'loss': 0.3121, 'learning_rate': 3.3650793617246093e-06, 'epoch': 1.48} {'loss': 0.3968, 'learning_rate': 3.3648279925924486e-06, 'epoch': 1.48} {'loss': 0.3063, 'learning_rate': 3.364576630950138e-06, 'epoch': 1.48} {'loss': 0.2997, 'learning_rate': 3.364325276797956e-06, 'epoch': 1.48} {'loss': 0.1064, 'learning_rate': 3.3640739301361925e-06, 'epoch': 1.48} {'loss': 0.2959, 'learning_rate': 3.3638225909651245e-06, 'epoch': 1.48} {'loss': 0.3777, 'learning_rate': 3.3635712592850413e-06, 'epoch': 1.48} {'loss': 0.2542, 'learning_rate': 3.363319935096222e-06, 'epoch': 1.48} {'loss': 0.2126, 'learning_rate': 3.3630686183989546e-06, 'epoch': 1.48} {'loss': 0.2139, 'learning_rate': 3.362817309193518e-06, 'epoch': 1.48} {'loss': 0.4732, 'learning_rate': 3.3625660074802014e-06, 'epoch': 1.48} {'loss': 0.3461, 'learning_rate': 3.3623147132592826e-06, 'epoch': 1.48} {'loss': 0.2691, 'learning_rate': 3.3620634265310516e-06, 'epoch': 1.48} {'loss': 0.2287, 'learning_rate': 3.361812147295789e-06, 'epoch': 1.48} {'loss': 0.2496, 'learning_rate': 3.3615608755537742e-06, 'epoch': 1.48} {'loss': 0.2169, 'learning_rate': 3.3613096113052988e-06, 'epoch': 1.48} {'loss': 0.2781, 'learning_rate': 3.3610583545506394e-06, 'epoch': 1.48} {'loss': 0.3273, 'learning_rate': 3.360807105290085e-06, 'epoch': 1.48} {'loss': 0.3033, 'learning_rate': 3.3605558635239146e-06, 'epoch': 1.48} {'loss': 0.2667, 'learning_rate': 3.3603046292524167e-06, 'epoch': 1.48} {'loss': 0.4198, 'learning_rate': 3.360053402475868e-06, 'epoch': 1.48} {'loss': 0.2465, 'learning_rate': 3.3598021831945613e-06, 'epoch': 1.48} {'loss': 0.2571, 'learning_rate': 3.3595509714087714e-06, 'epoch': 1.48} {'loss': 0.4322, 'learning_rate': 3.3592997671187886e-06, 'epoch': 1.48} {'loss': 0.2827, 'learning_rate': 3.359048570324891e-06, 'epoch': 1.48} {'loss': 0.4659, 'learning_rate': 3.3587973810273677e-06, 'epoch': 1.48} {'loss': 0.3084, 'learning_rate': 3.358546199226499e-06, 'epoch': 1.48} {'loss': 0.4175, 'learning_rate': 3.3582950249225653e-06, 'epoch': 1.48} {'loss': 0.3897, 'learning_rate': 3.358043858115858e-06, 'epoch': 1.48} {'loss': 0.2899, 'learning_rate': 3.357792698806652e-06, 'epoch': 1.48} {'loss': 0.3364, 'learning_rate': 3.3575415469952376e-06, 'epoch': 1.48} {'loss': 0.3724, 'learning_rate': 3.3572904026818943e-06, 'epoch': 1.48} {'loss': 0.2518, 'learning_rate': 3.3570392658669084e-06, 'epoch': 1.48} {'loss': 0.4891, 'learning_rate': 3.3567881365505595e-06, 'epoch': 1.48} {'loss': 0.334, 'learning_rate': 3.356537014733137e-06, 'epoch': 1.48} {'loss': 0.3155, 'learning_rate': 3.3562859004149174e-06, 'epoch': 1.48} {'loss': 0.2687, 'learning_rate': 3.35603479359619e-06, 'epoch': 1.48} {'loss': 0.3708, 'learning_rate': 3.3557836942772335e-06, 'epoch': 1.48} {'loss': 0.3014, 'learning_rate': 3.355532602458337e-06, 'epoch': 1.48} {'loss': 0.2546, 'learning_rate': 3.355281518139781e-06, 'epoch': 1.48} {'loss': 0.3454, 'learning_rate': 3.355030441321845e-06, 'epoch': 1.48} {'loss': 0.3223, 'learning_rate': 3.3547793720048194e-06, 'epoch': 1.48} {'loss': 0.2347, 'learning_rate': 3.3545283101889805e-06, 'epoch': 1.48} {'loss': 0.1642, 'learning_rate': 3.3542772558746195e-06, 'epoch': 1.48} {'loss': 0.259, 'learning_rate': 3.3540262090620114e-06, 'epoch': 1.48} {'loss': 0.4079, 'learning_rate': 3.3537751697514487e-06, 'epoch': 1.48} {'loss': 0.3899, 'learning_rate': 3.353524137943205e-06, 'epoch': 1.48} {'loss': 0.3377, 'learning_rate': 3.353273113637573e-06, 'epoch': 1.48} {'loss': 0.3949, 'learning_rate': 3.353022096834828e-06, 'epoch': 1.48} {'loss': 0.3051, 'learning_rate': 3.3527710875352615e-06, 'epoch': 1.48} {'loss': 0.2407, 'learning_rate': 3.352520085739148e-06, 'epoch': 1.48} {'loss': 0.2337, 'learning_rate': 3.352269091446778e-06, 'epoch': 1.48} {'loss': 0.3234, 'learning_rate': 3.3520181046584333e-06, 'epoch': 1.48} {'loss': 0.2384, 'learning_rate': 3.3517671253743923e-06, 'epoch': 1.48} {'loss': 0.3351, 'learning_rate': 3.3515161535949446e-06, 'epoch': 1.48} {'loss': 0.3516, 'learning_rate': 3.3512651893203684e-06, 'epoch': 1.48} {'loss': 0.2585, 'learning_rate': 3.351014232550953e-06, 'epoch': 1.48} {'loss': 0.3637, 'learning_rate': 3.350763283286974e-06, 'epoch': 1.48} {'loss': 0.3158, 'learning_rate': 3.350512341528723e-06, 'epoch': 1.48} {'loss': 0.3905, 'learning_rate': 3.350261407276476e-06, 'epoch': 1.48} {'loss': 0.1938, 'learning_rate': 3.350010480530522e-06, 'epoch': 1.48} {'loss': 0.3366, 'learning_rate': 3.349759561291138e-06, 'epoch': 1.48} {'loss': 0.3393, 'learning_rate': 3.349508649558615e-06, 'epoch': 1.48} {'loss': 0.3014, 'learning_rate': 3.3492577453332276e-06, 'epoch': 1.48} {'loss': 0.2922, 'learning_rate': 3.349006848615268e-06, 'epoch': 1.48} {'loss': 0.3081, 'learning_rate': 3.3487559594050143e-06, 'epoch': 1.48} {'loss': 0.3094, 'learning_rate': 3.348505077702747e-06, 'epoch': 1.48} {'loss': 0.1927, 'learning_rate': 3.348254203508756e-06, 'epoch': 1.48} {'loss': 0.3695, 'learning_rate': 3.3480033368233188e-06, 'epoch': 1.48} {'loss': 0.3255, 'learning_rate': 3.347752477646723e-06, 'epoch': 1.48} {'loss': 0.538, 'learning_rate': 3.347501625979247e-06, 'epoch': 1.48} {'loss': 0.3104, 'learning_rate': 3.3472507818211796e-06, 'epoch': 1.48} {'loss': 0.2909, 'learning_rate': 3.3469999451727973e-06, 'epoch': 1.48} {'loss': 0.227, 'learning_rate': 3.346749116034391e-06, 'epoch': 1.48} {'loss': 0.3138, 'learning_rate': 3.346498294406236e-06, 'epoch': 1.48} {'loss': 0.3209, 'learning_rate': 3.3462474802886224e-06, 'epoch': 1.48} {'loss': 0.2987, 'learning_rate': 3.345996673681827e-06, 'epoch': 1.48} {'loss': 0.3843, 'learning_rate': 3.3457458745861394e-06, 'epoch': 1.48} {'loss': 0.2053, 'learning_rate': 3.3454950830018394e-06, 'epoch': 1.48} {'loss': 0.263, 'learning_rate': 3.3452442989292067e-06, 'epoch': 1.48} {'loss': 0.4138, 'learning_rate': 3.3449935223685315e-06, 'epoch': 1.48} {'loss': 0.3764, 'learning_rate': 3.3447427533200894e-06, 'epoch': 1.48} {'loss': 0.4088, 'learning_rate': 3.34449199178417e-06, 'epoch': 1.48} {'loss': 0.2976, 'learning_rate': 3.344241237761051e-06, 'epoch': 1.48} {'loss': 0.2974, 'learning_rate': 3.343990491251021e-06, 'epoch': 1.48} {'loss': 0.2519, 'learning_rate': 3.343739752254357e-06, 'epoch': 1.48} {'loss': 0.3028, 'learning_rate': 3.343489020771348e-06, 'epoch': 1.48} {'loss': 0.4672, 'learning_rate': 3.3432382968022703e-06, 'epoch': 1.48} {'loss': 0.3858, 'learning_rate': 3.3429875803474142e-06, 'epoch': 1.48} {'loss': 0.354, 'learning_rate': 3.3427368714070576e-06, 'epoch': 1.48} {'loss': 0.3883, 'learning_rate': 3.3424861699814858e-06, 'epoch': 1.48} {'loss': 0.1801, 'learning_rate': 3.342235476070983e-06, 'epoch': 1.48} {'loss': 0.1604, 'learning_rate': 3.341984789675826e-06, 'epoch': 1.48} {'loss': 0.2938, 'learning_rate': 3.3417341107963062e-06, 'epoch': 1.48} {'loss': 0.2689, 'learning_rate': 3.341483439432699e-06, 'epoch': 1.48} {'loss': 0.436, 'learning_rate': 3.3412327755852937e-06, 'epoch': 1.48} {'loss': 0.4469, 'learning_rate': 3.3409821192543677e-06, 'epoch': 1.48} {'loss': 0.271, 'learning_rate': 3.340731470440206e-06, 'epoch': 1.48} {'loss': 0.2989, 'learning_rate': 3.3404808291430955e-06, 'epoch': 1.48} {'loss': 0.498, 'learning_rate': 3.3402301953633134e-06, 'epoch': 1.48} {'loss': 0.3461, 'learning_rate': 3.3399795691011473e-06, 'epoch': 1.48} {'loss': 0.298, 'learning_rate': 3.3397289503568755e-06, 'epoch': 1.48} {'loss': 0.4531, 'learning_rate': 3.339478339130785e-06, 'epoch': 1.48} {'loss': 0.3541, 'learning_rate': 3.339227735423155e-06, 'epoch': 1.48} {'loss': 0.2447, 'learning_rate': 3.338977139234273e-06, 'epoch': 1.48} {'loss': 0.2851, 'learning_rate': 3.338726550564415e-06, 'epoch': 1.48} {'loss': 0.2987, 'learning_rate': 3.3384759694138724e-06, 'epoch': 1.48} {'loss': 0.3251, 'learning_rate': 3.33822539578292e-06, 'epoch': 1.48} {'loss': 0.292, 'learning_rate': 3.3379748296718484e-06, 'epoch': 1.48} {'loss': 0.2071, 'learning_rate': 3.337724271080932e-06, 'epoch': 1.48} {'loss': 0.2619, 'learning_rate': 3.3374737200104623e-06, 'epoch': 1.48} {'loss': 0.4568, 'learning_rate': 3.3372231764607167e-06, 'epoch': 1.48} {'loss': 0.3739, 'learning_rate': 3.336972640431977e-06, 'epoch': 1.48} {'loss': 0.3336, 'learning_rate': 3.336722111924531e-06, 'epoch': 1.48} {'loss': 0.3126, 'learning_rate': 3.3364715909386546e-06, 'epoch': 1.48} {'loss': 0.3664, 'learning_rate': 3.3362210774746383e-06, 'epoch': 1.48} {'loss': 0.313, 'learning_rate': 3.3359705715327583e-06, 'epoch': 1.48} {'loss': 0.2346, 'learning_rate': 3.335720073113304e-06, 'epoch': 1.48} {'loss': 0.4097, 'learning_rate': 3.3354695822165504e-06, 'epoch': 1.48} {'loss': 0.3695, 'learning_rate': 3.335219098842788e-06, 'epoch': 1.48} {'loss': 0.3384, 'learning_rate': 3.334968622992293e-06, 'epoch': 1.48} {'loss': 0.3147, 'learning_rate': 3.334718154665353e-06, 'epoch': 1.48} {'loss': 0.3422, 'learning_rate': 3.3344676938622465e-06, 'epoch': 1.48} {'loss': 0.3929, 'learning_rate': 3.334217240583262e-06, 'epoch': 1.48} {'loss': 0.1838, 'learning_rate': 3.333966794828678e-06, 'epoch': 1.48} {'loss': 0.3322, 'learning_rate': 3.333716356598775e-06, 'epoch': 1.48} {'loss': 0.4936, 'learning_rate': 3.3334659258938416e-06, 'epoch': 1.48} {'loss': 0.3095, 'learning_rate': 3.3332155027141545e-06, 'epoch': 1.48} {'loss': 0.26, 'learning_rate': 3.3329650870600015e-06, 'epoch': 1.48} {'loss': 0.2982, 'learning_rate': 3.3327146789316612e-06, 'epoch': 1.48} {'loss': 0.4527, 'learning_rate': 3.3324642783294205e-06, 'epoch': 1.48} {'loss': 0.2694, 'learning_rate': 3.3322138852535567e-06, 'epoch': 1.48} {'loss': 0.3034, 'learning_rate': 3.3319634997043594e-06, 'epoch': 1.48} {'loss': 0.4485, 'learning_rate': 3.331713121682104e-06, 'epoch': 1.48} {'loss': 0.2532, 'learning_rate': 3.331462751187079e-06, 'epoch': 1.48} {'loss': 0.3973, 'learning_rate': 3.331212388219561e-06, 'epoch': 1.48} {'loss': 0.2661, 'learning_rate': 3.330962032779841e-06, 'epoch': 1.48} {'loss': 0.4262, 'learning_rate': 3.3307116848681954e-06, 'epoch': 1.48} {'loss': 0.2466, 'learning_rate': 3.3304613444849044e-06, 'epoch': 1.48} {'loss': 0.3393, 'learning_rate': 3.3302110116302587e-06, 'epoch': 1.48} {'loss': 0.2948, 'learning_rate': 3.329960686304532e-06, 'epoch': 1.48} {'loss': 0.3585, 'learning_rate': 3.3297103685080156e-06, 'epoch': 1.48} {'loss': 0.392, 'learning_rate': 3.329460058240984e-06, 'epoch': 1.48} {'loss': 0.3377, 'learning_rate': 3.3292097555037273e-06, 'epoch': 1.48} {'loss': 0.2847, 'learning_rate': 3.32895946029652e-06, 'epoch': 1.48} {'loss': 0.3647, 'learning_rate': 3.328709172619653e-06, 'epoch': 1.48} {'loss': 0.2584, 'learning_rate': 3.328458892473402e-06, 'epoch': 1.48} {'loss': 0.2316, 'learning_rate': 3.3282086198580543e-06, 'epoch': 1.48} {'loss': 0.4514, 'learning_rate': 3.327958354773888e-06, 'epoch': 1.48} {'loss': 0.3192, 'learning_rate': 3.3277080972211908e-06, 'epoch': 1.48} {'loss': 0.2275, 'learning_rate': 3.327457847200243e-06, 'epoch': 1.48} {'loss': 0.2656, 'learning_rate': 3.3272076047113223e-06, 'epoch': 1.48} {'loss': 0.3951, 'learning_rate': 3.3269573697547186e-06, 'epoch': 1.48} {'loss': 0.2291, 'learning_rate': 3.3267071423307085e-06, 'epoch': 1.48} {'loss': 0.3645, 'learning_rate': 3.3264569224395792e-06, 'epoch': 1.48} {'loss': 0.2054, 'learning_rate': 3.3262067100816087e-06, 'epoch': 1.48} {'loss': 0.3284, 'learning_rate': 3.325956505257085e-06, 'epoch': 1.48} {'loss': 0.2242, 'learning_rate': 3.3257063079662845e-06, 'epoch': 1.48} {'loss': 0.2871, 'learning_rate': 3.3254561182094946e-06, 'epoch': 1.48} {'loss': 0.325, 'learning_rate': 3.3252059359869924e-06, 'epoch': 1.48} {'loss': 0.4058, 'learning_rate': 3.324955761299067e-06, 'epoch': 1.48} {'loss': 0.2722, 'learning_rate': 3.3247055941459936e-06, 'epoch': 1.48} {'loss': 0.3467, 'learning_rate': 3.3244554345280624e-06, 'epoch': 1.48} {'loss': 0.2901, 'learning_rate': 3.324205282445547e-06, 'epoch': 1.48} {'loss': 0.2767, 'learning_rate': 3.323955137898739e-06, 'epoch': 1.48} {'loss': 0.2486, 'learning_rate': 3.323705000887916e-06, 'epoch': 1.48} {'loss': 0.266, 'learning_rate': 3.3234548714133562e-06, 'epoch': 1.48} {'loss': 0.3373, 'learning_rate': 3.3232047494753494e-06, 'epoch': 1.48} {'loss': 0.2908, 'learning_rate': 3.3229546350741726e-06, 'epoch': 1.48} {'loss': 0.2677, 'learning_rate': 3.322704528210113e-06, 'epoch': 1.48} {'loss': 0.2647, 'learning_rate': 3.322454428883447e-06, 'epoch': 1.48} {'loss': 0.2538, 'learning_rate': 3.3222043370944633e-06, 'epoch': 1.48} {'loss': 0.3957, 'learning_rate': 3.321954252843439e-06, 'epoch': 1.48} {'loss': 0.2917, 'learning_rate': 3.32170417613066e-06, 'epoch': 1.48} {'loss': 0.3142, 'learning_rate': 3.3214541069564044e-06, 'epoch': 1.48} {'loss': 0.338, 'learning_rate': 3.3212040453209605e-06, 'epoch': 1.48} {'loss': 0.188, 'learning_rate': 3.320953991224605e-06, 'epoch': 1.48} {'loss': 0.4949, 'learning_rate': 3.320703944667624e-06, 'epoch': 1.48} {'loss': 0.2456, 'learning_rate': 3.3204539056502983e-06, 'epoch': 1.48} {'loss': 0.3863, 'learning_rate': 3.320203874172908e-06, 'epoch': 1.48} {'loss': 0.2702, 'learning_rate': 3.31995385023574e-06, 'epoch': 1.48} {'loss': 0.3072, 'learning_rate': 3.3197038338390696e-06, 'epoch': 1.48} {'loss': 0.3923, 'learning_rate': 3.3194538249831875e-06, 'epoch': 1.48} {'loss': 0.3421, 'learning_rate': 3.3192038236683678e-06, 'epoch': 1.48} {'loss': 0.3315, 'learning_rate': 3.3189538298948996e-06, 'epoch': 1.48} {'loss': 0.2815, 'learning_rate': 3.3187038436630605e-06, 'epoch': 1.48} {'loss': 0.1663, 'learning_rate': 3.318453864973136e-06, 'epoch': 1.48} {'loss': 0.1692, 'learning_rate': 3.3182038938254034e-06, 'epoch': 1.48} {'loss': 0.4619, 'learning_rate': 3.3179539302201513e-06, 'epoch': 1.48} {'loss': 0.3045, 'learning_rate': 3.3177039741576555e-06, 'epoch': 1.48} {'loss': 0.2429, 'learning_rate': 3.317454025638205e-06, 'epoch': 1.48} {'loss': 0.3214, 'learning_rate': 3.3172040846620767e-06, 'epoch': 1.48} {'loss': 0.234, 'learning_rate': 3.3169541512295523e-06, 'epoch': 1.48} {'loss': 0.3491, 'learning_rate': 3.316704225340919e-06, 'epoch': 1.48} {'loss': 0.2622, 'learning_rate': 3.3164543069964517e-06, 'epoch': 1.48} {'loss': 0.2587, 'learning_rate': 3.316204396196441e-06, 'epoch': 1.48} {'loss': 0.227, 'learning_rate': 3.3159544929411567e-06, 'epoch': 1.48} {'loss': 0.4333, 'learning_rate': 3.3157045972308956e-06, 'epoch': 1.48} {'loss': 0.4127, 'learning_rate': 3.315454709065933e-06, 'epoch': 1.48} {'loss': 0.3084, 'learning_rate': 3.3152048284465475e-06, 'epoch': 1.48} {'loss': 0.2236, 'learning_rate': 3.314954955373029e-06, 'epoch': 1.48} {'loss': 0.3155, 'learning_rate': 3.3147050898456514e-06, 'epoch': 1.48} {'loss': 0.2158, 'learning_rate': 3.3144552318647026e-06, 'epoch': 1.48} {'loss': 0.2236, 'learning_rate': 3.31420538143046e-06, 'epoch': 1.48} {'loss': 0.3752, 'learning_rate': 3.313955538543212e-06, 'epoch': 1.48} {'loss': 0.3606, 'learning_rate': 3.3137057032032326e-06, 'epoch': 1.48} {'loss': 0.2723, 'learning_rate': 3.3134558754108117e-06, 'epoch': 1.48} {'loss': 0.4109, 'learning_rate': 3.3132060551662246e-06, 'epoch': 1.48} {'loss': 0.3751, 'learning_rate': 3.312956242469759e-06, 'epoch': 1.48} {'loss': 0.2712, 'learning_rate': 3.3127064373216913e-06, 'epoch': 1.48} {'loss': 0.2732, 'learning_rate': 3.3124566397223103e-06, 'epoch': 1.48} {'loss': 0.2228, 'learning_rate': 3.3122068496718928e-06, 'epoch': 1.48} {'loss': 0.4031, 'learning_rate': 3.311957067170719e-06, 'epoch': 1.48} {'loss': 0.2384, 'learning_rate': 3.311707292219077e-06, 'epoch': 1.48} {'loss': 0.2999, 'learning_rate': 3.3114575248172433e-06, 'epoch': 1.48} {'loss': 0.2628, 'learning_rate': 3.311207764965505e-06, 'epoch': 1.48} {'loss': 0.3164, 'learning_rate': 3.3109580126641385e-06, 'epoch': 1.48} {'loss': 0.3271, 'learning_rate': 3.3107082679134305e-06, 'epoch': 1.48} {'loss': 0.3567, 'learning_rate': 3.3104585307136583e-06, 'epoch': 1.48} {'loss': 0.3315, 'learning_rate': 3.310208801065109e-06, 'epoch': 1.48} {'loss': 0.225, 'learning_rate': 3.309959078968059e-06, 'epoch': 1.48} {'loss': 0.3178, 'learning_rate': 3.3097093644227964e-06, 'epoch': 1.48} {'loss': 0.23, 'learning_rate': 3.309459657429597e-06, 'epoch': 1.48} {'loss': 0.253, 'learning_rate': 3.309209957988747e-06, 'epoch': 1.48} {'loss': 0.2349, 'learning_rate': 3.308960266100528e-06, 'epoch': 1.48} {'loss': 0.2908, 'learning_rate': 3.3087105817652175e-06, 'epoch': 1.48} {'loss': 0.2821, 'learning_rate': 3.308460904983103e-06, 'epoch': 1.48} {'loss': 0.3195, 'learning_rate': 3.3082112357544604e-06, 'epoch': 1.48} {'loss': 0.3924, 'learning_rate': 3.307961574079578e-06, 'epoch': 1.48} {'loss': 0.3163, 'learning_rate': 3.3077119199587314e-06, 'epoch': 1.48} {'loss': 0.3467, 'learning_rate': 3.307462273392208e-06, 'epoch': 1.48} {'loss': 0.3494, 'learning_rate': 3.3072126343802845e-06, 'epoch': 1.48} {'loss': 0.4932, 'learning_rate': 3.306963002923248e-06, 'epoch': 1.48} {'loss': 0.4829, 'learning_rate': 3.3067133790213744e-06, 'epoch': 1.48} {'loss': 0.2825, 'learning_rate': 3.3064637626749528e-06, 'epoch': 1.48} {'loss': 0.2881, 'learning_rate': 3.3062141538842564e-06, 'epoch': 1.48} {'loss': 0.4266, 'learning_rate': 3.3059645526495755e-06, 'epoch': 1.48} {'loss': 0.2337, 'learning_rate': 3.3057149589711866e-06, 'epoch': 1.48} {'loss': 0.2557, 'learning_rate': 3.30546537284937e-06, 'epoch': 1.48} {'loss': 0.2178, 'learning_rate': 3.3052157942844134e-06, 'epoch': 1.48} {'loss': 0.2879, 'learning_rate': 3.3049662232765924e-06, 'epoch': 1.48} {'loss': 0.3619, 'learning_rate': 3.3047166598261937e-06, 'epoch': 1.48} {'loss': 0.2247, 'learning_rate': 3.304467103933493e-06, 'epoch': 1.48} {'loss': 0.3233, 'learning_rate': 3.3042175555987798e-06, 'epoch': 1.48} {'loss': 0.3335, 'learning_rate': 3.3039680148223287e-06, 'epoch': 1.48} {'loss': 0.4176, 'learning_rate': 3.3037184816044264e-06, 'epoch': 1.48} {'loss': 0.3003, 'learning_rate': 3.30346895594535e-06, 'epoch': 1.48} {'loss': 0.1908, 'learning_rate': 3.3032194378453872e-06, 'epoch': 1.48} {'loss': 0.2085, 'learning_rate': 3.302969927304813e-06, 'epoch': 1.48} {'loss': 0.3448, 'learning_rate': 3.3027204243239153e-06, 'epoch': 1.48} {'loss': 0.2286, 'learning_rate': 3.3024709289029733e-06, 'epoch': 1.48} {'loss': 0.2176, 'learning_rate': 3.3022214410422636e-06, 'epoch': 1.48} {'loss': 0.3351, 'learning_rate': 3.3019719607420765e-06, 'epoch': 1.48} {'loss': 0.2223, 'learning_rate': 3.3017224880026854e-06, 'epoch': 1.48} {'loss': 0.2441, 'learning_rate': 3.3014730228243797e-06, 'epoch': 1.48} {'loss': 0.3993, 'learning_rate': 3.3012235652074342e-06, 'epoch': 1.48} {'loss': 0.4885, 'learning_rate': 3.3009741151521356e-06, 'epoch': 1.48} {'loss': 0.3864, 'learning_rate': 3.3007246726587605e-06, 'epoch': 1.48} {'loss': 0.2743, 'learning_rate': 3.3004752377275973e-06, 'epoch': 1.48} {'loss': 0.3898, 'learning_rate': 3.30022581035892e-06, 'epoch': 1.48} {'loss': 0.2653, 'learning_rate': 3.299976390553017e-06, 'epoch': 1.48} {'loss': 0.3875, 'learning_rate': 3.2997269783101625e-06, 'epoch': 1.48} {'loss': 0.4059, 'learning_rate': 3.2994775736306463e-06, 'epoch': 1.48} {'loss': 0.4879, 'learning_rate': 3.299228176514746e-06, 'epoch': 1.48} {'loss': 0.2766, 'learning_rate': 3.298978786962739e-06, 'epoch': 1.48} {'loss': 0.3085, 'learning_rate': 3.298729404974914e-06, 'epoch': 1.48} {'loss': 0.2842, 'learning_rate': 3.298480030551545e-06, 'epoch': 1.48} {'loss': 0.1743, 'learning_rate': 3.298230663692923e-06, 'epoch': 1.48} {'loss': 0.2859, 'learning_rate': 3.2979813043993192e-06, 'epoch': 1.48} {'loss': 0.4151, 'learning_rate': 3.297731952671024e-06, 'epoch': 1.48} {'loss': 0.2992, 'learning_rate': 3.2974826085083123e-06, 'epoch': 1.48} {'loss': 0.4179, 'learning_rate': 3.2972332719114706e-06, 'epoch': 1.48} {'loss': 0.3361, 'learning_rate': 3.296983942880775e-06, 'epoch': 1.48} {'loss': 0.2824, 'learning_rate': 3.296734621416513e-06, 'epoch': 1.48} {'loss': 0.4203, 'learning_rate': 3.2964853075189596e-06, 'epoch': 1.48} {'loss': 0.2412, 'learning_rate': 3.2962360011884033e-06, 'epoch': 1.48} {'loss': 0.3553, 'learning_rate': 3.2959867024251213e-06, 'epoch': 1.48} {'loss': 0.3582, 'learning_rate': 3.2957374112293917e-06, 'epoch': 1.48} {'loss': 0.3827, 'learning_rate': 3.2954881276015038e-06, 'epoch': 1.48} {'loss': 0.3697, 'learning_rate': 3.295238851541732e-06, 'epoch': 1.48} {'loss': 0.4564, 'learning_rate': 3.294989583050363e-06, 'epoch': 1.48} {'loss': 0.3466, 'learning_rate': 3.294740322127673e-06, 'epoch': 1.48} {'loss': 0.3695, 'learning_rate': 3.2944910687739486e-06, 'epoch': 1.48} {'loss': 0.3643, 'learning_rate': 3.294241822989466e-06, 'epoch': 1.48} {'loss': 0.3781, 'learning_rate': 3.2939925847745124e-06, 'epoch': 1.48} {'loss': 0.3538, 'learning_rate': 3.293743354129363e-06, 'epoch': 1.48} {'loss': 0.2719, 'learning_rate': 3.2934941310543044e-06, 'epoch': 1.48} {'loss': 0.4281, 'learning_rate': 3.293244915549614e-06, 'epoch': 1.48} {'loss': 0.3089, 'learning_rate': 3.292995707615576e-06, 'epoch': 1.48} {'loss': 0.2972, 'learning_rate': 3.2927465072524722e-06, 'epoch': 1.48} {'loss': 0.5538, 'learning_rate': 3.2924973144605776e-06, 'epoch': 1.48} {'loss': 0.403, 'learning_rate': 3.292248129240182e-06, 'epoch': 1.48} {'loss': 0.4439, 'learning_rate': 3.2919989515915594e-06, 'epoch': 1.48} {'loss': 0.2021, 'learning_rate': 3.291749781514998e-06, 'epoch': 1.48} {'loss': 0.1265, 'learning_rate': 3.2915006190107713e-06, 'epoch': 1.48} {'loss': 0.3013, 'learning_rate': 3.291251464079166e-06, 'epoch': 1.48} {'loss': 0.3517, 'learning_rate': 3.2910023167204607e-06, 'epoch': 1.48} {'loss': 0.343, 'learning_rate': 3.290753176934942e-06, 'epoch': 1.48} {'loss': 0.2525, 'learning_rate': 3.2905040447228862e-06, 'epoch': 1.48} {'loss': 0.3368, 'learning_rate': 3.2902549200845733e-06, 'epoch': 1.48} {'loss': 0.192, 'learning_rate': 3.2900058030202896e-06, 'epoch': 1.48} {'loss': 0.3987, 'learning_rate': 3.2897566935303106e-06, 'epoch': 1.48} {'loss': 0.295, 'learning_rate': 3.289507591614923e-06, 'epoch': 1.48} {'loss': 0.4464, 'learning_rate': 3.2892584972744024e-06, 'epoch': 1.48} {'loss': 0.2899, 'learning_rate': 3.2890094105090353e-06, 'epoch': 1.48} {'loss': 0.2411, 'learning_rate': 3.2887603313190984e-06, 'epoch': 1.48} {'loss': 0.4639, 'learning_rate': 3.2885112597048773e-06, 'epoch': 1.48} {'loss': 0.362, 'learning_rate': 3.2882621956666472e-06, 'epoch': 1.48} {'loss': 0.2343, 'learning_rate': 3.2880131392046965e-06, 'epoch': 1.48} {'loss': 0.3153, 'learning_rate': 3.2877640903192997e-06, 'epoch': 1.48} {'loss': 0.4292, 'learning_rate': 3.287515049010743e-06, 'epoch': 1.49} {'loss': 0.3271, 'learning_rate': 3.287266015279307e-06, 'epoch': 1.49} {'loss': 0.3069, 'learning_rate': 3.2870169891252666e-06, 'epoch': 1.49} {'loss': 0.4308, 'learning_rate': 3.286767970548911e-06, 'epoch': 1.49} {'loss': 0.2801, 'learning_rate': 3.2865189595505156e-06, 'epoch': 1.49} {'loss': 0.2827, 'learning_rate': 3.2862699561303656e-06, 'epoch': 1.49} {'loss': 0.219, 'learning_rate': 3.286020960288737e-06, 'epoch': 1.49} {'loss': 0.2468, 'learning_rate': 3.2857719720259174e-06, 'epoch': 1.49} {'loss': 0.2033, 'learning_rate': 3.2855229913421816e-06, 'epoch': 1.49} {'loss': 0.2707, 'learning_rate': 3.285274018237816e-06, 'epoch': 1.49} {'loss': 0.3553, 'learning_rate': 3.285025052713097e-06, 'epoch': 1.49} {'loss': 0.3136, 'learning_rate': 3.2847760947683103e-06, 'epoch': 1.49} {'loss': 0.2239, 'learning_rate': 3.2845271444037317e-06, 'epoch': 1.49} {'loss': 0.4782, 'learning_rate': 3.2842782016196483e-06, 'epoch': 1.49} {'loss': 0.2561, 'learning_rate': 3.2840292664163378e-06, 'epoch': 1.49} {'loss': 0.2181, 'learning_rate': 3.283780338794077e-06, 'epoch': 1.49} {'loss': 0.2579, 'learning_rate': 3.2835314187531553e-06, 'epoch': 1.49} {'loss': 0.2129, 'learning_rate': 3.2832825062938457e-06, 'epoch': 1.49} {'loss': 0.2359, 'learning_rate': 3.2830336014164352e-06, 'epoch': 1.49} {'loss': 0.2967, 'learning_rate': 3.2827847041212004e-06, 'epoch': 1.49} {'loss': 0.3628, 'learning_rate': 3.2825358144084274e-06, 'epoch': 1.49} {'loss': 0.242, 'learning_rate': 3.2822869322783913e-06, 'epoch': 1.49} {'loss': 0.3704, 'learning_rate': 3.282038057731378e-06, 'epoch': 1.49} {'loss': 0.4852, 'learning_rate': 3.2817891907676635e-06, 'epoch': 1.49} {'loss': 0.2038, 'learning_rate': 3.281540331387535e-06, 'epoch': 1.49} {'loss': 0.3342, 'learning_rate': 3.2812914795912666e-06, 'epoch': 1.49} {'loss': 0.2562, 'learning_rate': 3.2810426353791457e-06, 'epoch': 1.49} {'loss': 0.1816, 'learning_rate': 3.2807937987514492e-06, 'epoch': 1.49} {'loss': 0.3256, 'learning_rate': 3.280544969708457e-06, 'epoch': 1.49} {'loss': 0.156, 'learning_rate': 3.2802961482504534e-06, 'epoch': 1.49} {'loss': 0.2624, 'learning_rate': 3.280047334377716e-06, 'epoch': 1.49} {'loss': 0.254, 'learning_rate': 3.2797985280905297e-06, 'epoch': 1.49} {'loss': 0.2726, 'learning_rate': 3.2795497293891697e-06, 'epoch': 1.49} {'loss': 0.2943, 'learning_rate': 3.279300938273924e-06, 'epoch': 1.49} {'loss': 0.2509, 'learning_rate': 3.279052154745065e-06, 'epoch': 1.49} {'loss': 0.4597, 'learning_rate': 3.278803378802882e-06, 'epoch': 1.49} {'loss': 0.2093, 'learning_rate': 3.2785546104476486e-06, 'epoch': 1.49} {'loss': 0.251, 'learning_rate': 3.278305849679653e-06, 'epoch': 1.49} {'loss': 0.4448, 'learning_rate': 3.2780570964991678e-06, 'epoch': 1.49} {'loss': 0.4367, 'learning_rate': 3.2778083509064805e-06, 'epoch': 1.49} {'loss': 0.5094, 'learning_rate': 3.2775596129018705e-06, 'epoch': 1.49} {'loss': 0.4227, 'learning_rate': 3.2773108824856136e-06, 'epoch': 1.49} {'loss': 0.4226, 'learning_rate': 3.2770621596579976e-06, 'epoch': 1.49} {'loss': 0.4762, 'learning_rate': 3.2768134444192967e-06, 'epoch': 1.49} {'loss': 0.3485, 'learning_rate': 3.2765647367697985e-06, 'epoch': 1.49} {'loss': 0.2591, 'learning_rate': 3.2763160367097768e-06, 'epoch': 1.49} {'loss': 0.3738, 'learning_rate': 3.2760673442395185e-06, 'epoch': 1.49} {'loss': 0.3366, 'learning_rate': 3.2758186593592987e-06, 'epoch': 1.49} {'loss': 0.335, 'learning_rate': 3.2755699820694044e-06, 'epoch': 1.49} {'loss': 0.3225, 'learning_rate': 3.275321312370109e-06, 'epoch': 1.49} {'loss': 0.3092, 'learning_rate': 3.2750726502617013e-06, 'epoch': 1.49} {'loss': 0.31, 'learning_rate': 3.2748239957444537e-06, 'epoch': 1.49} {'loss': 0.3434, 'learning_rate': 3.274575348818655e-06, 'epoch': 1.49} {'loss': 0.3782, 'learning_rate': 3.274326709484581e-06, 'epoch': 1.49} {'loss': 0.3128, 'learning_rate': 3.2740780777425096e-06, 'epoch': 1.49} {'loss': 0.3701, 'learning_rate': 3.2738294535927294e-06, 'epoch': 1.49} {'loss': 0.2533, 'learning_rate': 3.2735808370355137e-06, 'epoch': 1.49} {'loss': 0.1827, 'learning_rate': 3.2733322280711487e-06, 'epoch': 1.49} {'loss': 0.2761, 'learning_rate': 3.273083626699909e-06, 'epoch': 1.49} {'loss': 0.3554, 'learning_rate': 3.2728350329220824e-06, 'epoch': 1.49} {'loss': 0.3201, 'learning_rate': 3.272586446737942e-06, 'epoch': 1.49} {'loss': 0.3559, 'learning_rate': 3.2723378681477756e-06, 'epoch': 1.49} {'loss': 0.4397, 'learning_rate': 3.272089297151858e-06, 'epoch': 1.49} {'loss': 0.4619, 'learning_rate': 3.271840733750474e-06, 'epoch': 1.49} {'loss': 0.3392, 'learning_rate': 3.271592177943901e-06, 'epoch': 1.49} {'loss': 0.3518, 'learning_rate': 3.271343629732423e-06, 'epoch': 1.49} {'loss': 0.3973, 'learning_rate': 3.2710950891163186e-06, 'epoch': 1.49} {'loss': 0.2671, 'learning_rate': 3.270846556095866e-06, 'epoch': 1.49} {'loss': 0.31, 'learning_rate': 3.27059803067135e-06, 'epoch': 1.49} {'loss': 0.4142, 'learning_rate': 3.2703495128430463e-06, 'epoch': 1.49} {'loss': 0.2793, 'learning_rate': 3.270101002611242e-06, 'epoch': 1.49} {'loss': 0.3523, 'learning_rate': 3.2698524999762105e-06, 'epoch': 1.49} {'loss': 0.3702, 'learning_rate': 3.269604004938238e-06, 'epoch': 1.49} {'loss': 0.2174, 'learning_rate': 3.2693555174976012e-06, 'epoch': 1.49} {'loss': 0.3715, 'learning_rate': 3.2691070376545843e-06, 'epoch': 1.49} {'loss': 0.2828, 'learning_rate': 3.268858565409463e-06, 'epoch': 1.49} {'loss': 0.3174, 'learning_rate': 3.2686101007625225e-06, 'epoch': 1.49} {'loss': 0.2612, 'learning_rate': 3.268361643714039e-06, 'epoch': 1.49} {'loss': 0.2357, 'learning_rate': 3.2681131942642983e-06, 'epoch': 1.49} {'loss': 0.3387, 'learning_rate': 3.2678647524135775e-06, 'epoch': 1.49} {'loss': 0.2248, 'learning_rate': 3.2676163181621534e-06, 'epoch': 1.49} {'loss': 0.4608, 'learning_rate': 3.2673678915103136e-06, 'epoch': 1.49} {'loss': 0.2674, 'learning_rate': 3.267119472458332e-06, 'epoch': 1.49} {'loss': 0.2855, 'learning_rate': 3.2668710610064967e-06, 'epoch': 1.49} {'loss': 0.3757, 'learning_rate': 3.266622657155076e-06, 'epoch': 1.49} {'loss': 0.4134, 'learning_rate': 3.2663742609043648e-06, 'epoch': 1.49} {'loss': 0.3782, 'learning_rate': 3.266125872254636e-06, 'epoch': 1.49} {'loss': 0.2424, 'learning_rate': 3.2658774912061675e-06, 'epoch': 1.49} {'loss': 0.2801, 'learning_rate': 3.265629117759247e-06, 'epoch': 1.49} {'loss': 0.334, 'learning_rate': 3.2653807519141458e-06, 'epoch': 1.49} {'loss': 0.3054, 'learning_rate': 3.2651323936711533e-06, 'epoch': 1.49} {'loss': 0.4358, 'learning_rate': 3.2648840430305416e-06, 'epoch': 1.49} {'loss': 0.3342, 'learning_rate': 3.2646356999926e-06, 'epoch': 1.49} {'loss': 0.5131, 'learning_rate': 3.2643873645575996e-06, 'epoch': 1.49} {'loss': 0.3153, 'learning_rate': 3.2641390367258276e-06, 'epoch': 1.49} {'loss': 0.3817, 'learning_rate': 3.26389071649756e-06, 'epoch': 1.49} {'loss': 0.3272, 'learning_rate': 3.2636424038730806e-06, 'epoch': 1.49} {'loss': 0.3466, 'learning_rate': 3.2633940988526657e-06, 'epoch': 1.49} {'loss': 0.3034, 'learning_rate': 3.2631458014366003e-06, 'epoch': 1.49} {'loss': 0.2954, 'learning_rate': 3.2628975116251625e-06, 'epoch': 1.49} {'loss': 0.4081, 'learning_rate': 3.2626492294186296e-06, 'epoch': 1.49} {'loss': 0.3212, 'learning_rate': 3.2624009548172874e-06, 'epoch': 1.49} {'loss': 0.2909, 'learning_rate': 3.2621526878214105e-06, 'epoch': 1.49} {'loss': 0.2898, 'learning_rate': 3.261904428431284e-06, 'epoch': 1.49} {'loss': 0.3586, 'learning_rate': 3.2616561766471843e-06, 'epoch': 1.49} {'loss': 0.1562, 'learning_rate': 3.261407932469396e-06, 'epoch': 1.49} {'loss': 0.2733, 'learning_rate': 3.2611596958981927e-06, 'epoch': 1.49} {'loss': 0.4689, 'learning_rate': 3.2609114669338626e-06, 'epoch': 1.49} {'loss': 0.394, 'learning_rate': 3.2606632455766795e-06, 'epoch': 1.49} {'loss': 0.3178, 'learning_rate': 3.260415031826928e-06, 'epoch': 1.49} {'loss': 0.4016, 'learning_rate': 3.260166825684884e-06, 'epoch': 1.49} {'loss': 0.2859, 'learning_rate': 3.259918627150833e-06, 'epoch': 1.49} {'loss': 0.3104, 'learning_rate': 3.259670436225052e-06, 'epoch': 1.49} {'loss': 0.3095, 'learning_rate': 3.259422252907818e-06, 'epoch': 1.49} {'loss': 0.4038, 'learning_rate': 3.2591740771994186e-06, 'epoch': 1.49} {'loss': 0.2834, 'learning_rate': 3.2589259091001258e-06, 'epoch': 1.49} {'loss': 0.2327, 'learning_rate': 3.258677748610227e-06, 'epoch': 1.49} {'loss': 0.3681, 'learning_rate': 3.258429595729996e-06, 'epoch': 1.49} {'loss': 0.2682, 'learning_rate': 3.2581814504597198e-06, 'epoch': 1.49} {'loss': 0.5008, 'learning_rate': 3.2579333127996706e-06, 'epoch': 1.49} {'loss': 0.3534, 'learning_rate': 3.2576851827501366e-06, 'epoch': 1.49} {'loss': 0.3276, 'learning_rate': 3.25743706031139e-06, 'epoch': 1.49} {'loss': 0.3546, 'learning_rate': 3.257188945483718e-06, 'epoch': 1.49} {'loss': 0.3099, 'learning_rate': 3.256940838267395e-06, 'epoch': 1.49} {'loss': 0.2867, 'learning_rate': 3.256692738662707e-06, 'epoch': 1.49} {'loss': 0.3408, 'learning_rate': 3.2564446466699296e-06, 'epoch': 1.49} {'loss': 0.2887, 'learning_rate': 3.256196562289341e-06, 'epoch': 1.49} {'loss': 0.2987, 'learning_rate': 3.2559484855212277e-06, 'epoch': 1.49} {'loss': 0.2926, 'learning_rate': 3.255700416365862e-06, 'epoch': 1.49} {'loss': 0.4481, 'learning_rate': 3.2554523548235318e-06, 'epoch': 1.49} {'loss': 0.2544, 'learning_rate': 3.25520430089451e-06, 'epoch': 1.49} {'loss': 0.4644, 'learning_rate': 3.2549562545790835e-06, 'epoch': 1.49} {'loss': 0.3729, 'learning_rate': 3.2547082158775255e-06, 'epoch': 1.49} {'loss': 0.364, 'learning_rate': 3.2544601847901224e-06, 'epoch': 1.49} {'loss': 0.286, 'learning_rate': 3.2542121613171474e-06, 'epoch': 1.49} {'loss': 0.2944, 'learning_rate': 3.2539641454588877e-06, 'epoch': 1.49} {'loss': 0.3485, 'learning_rate': 3.2537161372156155e-06, 'epoch': 1.49} {'loss': 0.372, 'learning_rate': 3.2534681365876197e-06, 'epoch': 1.49} {'loss': 0.2061, 'learning_rate': 3.253220143575172e-06, 'epoch': 1.49} {'loss': 0.2265, 'learning_rate': 3.252972158178558e-06, 'epoch': 1.49} {'loss': 0.3211, 'learning_rate': 3.2527241803980558e-06, 'epoch': 1.49} {'loss': 0.2123, 'learning_rate': 3.2524762102339425e-06, 'epoch': 1.49} {'loss': 0.2507, 'learning_rate': 3.252228247686503e-06, 'epoch': 1.49} {'loss': 0.2699, 'learning_rate': 3.2519802927560117e-06, 'epoch': 1.49} {'loss': 0.2895, 'learning_rate': 3.251732345442754e-06, 'epoch': 1.49} {'loss': 0.2563, 'learning_rate': 3.2514844057470053e-06, 'epoch': 1.49} {'loss': 0.2992, 'learning_rate': 3.2512364736690493e-06, 'epoch': 1.49} {'loss': 0.2588, 'learning_rate': 3.250988549209162e-06, 'epoch': 1.49} {'loss': 0.2408, 'learning_rate': 3.250740632367627e-06, 'epoch': 1.49} {'loss': 0.3019, 'learning_rate': 3.2504927231447203e-06, 'epoch': 1.49} {'loss': 0.2612, 'learning_rate': 3.250244821540727e-06, 'epoch': 1.49} {'loss': 0.2845, 'learning_rate': 3.2499969275559194e-06, 'epoch': 1.49} {'loss': 0.4435, 'learning_rate': 3.249749041190586e-06, 'epoch': 1.49} {'loss': 0.4319, 'learning_rate': 3.2495011624450025e-06, 'epoch': 1.49} {'loss': 0.2657, 'learning_rate': 3.2492532913194454e-06, 'epoch': 1.49} {'loss': 0.3537, 'learning_rate': 3.2490054278142003e-06, 'epoch': 1.49} {'loss': 0.3687, 'learning_rate': 3.2487575719295404e-06, 'epoch': 1.49} {'loss': 0.3462, 'learning_rate': 3.2485097236657536e-06, 'epoch': 1.49} {'loss': 0.1668, 'learning_rate': 3.2482618830231115e-06, 'epoch': 1.49} {'loss': 0.3212, 'learning_rate': 3.248014050001902e-06, 'epoch': 1.49} {'loss': 0.3632, 'learning_rate': 3.247766224602398e-06, 'epoch': 1.49} {'loss': 0.2686, 'learning_rate': 3.2475184068248833e-06, 'epoch': 1.49} {'loss': 0.2971, 'learning_rate': 3.247270596669634e-06, 'epoch': 1.49} {'loss': 0.2063, 'learning_rate': 3.247022794136936e-06, 'epoch': 1.49} {'loss': 0.1606, 'learning_rate': 3.2467749992270603e-06, 'epoch': 1.49} {'loss': 0.2523, 'learning_rate': 3.246527211940296e-06, 'epoch': 1.49} {'loss': 0.4325, 'learning_rate': 3.2462794322769176e-06, 'epoch': 1.49} {'loss': 0.2128, 'learning_rate': 3.2460316602372023e-06, 'epoch': 1.49} {'loss': 0.1766, 'learning_rate': 3.245783895821436e-06, 'epoch': 1.49} {'loss': 0.3075, 'learning_rate': 3.2455361390298922e-06, 'epoch': 1.49} {'loss': 0.3002, 'learning_rate': 3.2452883898628574e-06, 'epoch': 1.49} {'loss': 0.4348, 'learning_rate': 3.2450406483206044e-06, 'epoch': 1.49} {'loss': 0.3411, 'learning_rate': 3.2447929144034187e-06, 'epoch': 1.49} {'loss': 0.2877, 'learning_rate': 3.244545188111574e-06, 'epoch': 1.49} {'loss': 0.1519, 'learning_rate': 3.2442974694453564e-06, 'epoch': 1.49} {'loss': 0.2698, 'learning_rate': 3.244049758405039e-06, 'epoch': 1.49} {'loss': 0.2988, 'learning_rate': 3.243802054990909e-06, 'epoch': 1.49} {'loss': 0.2837, 'learning_rate': 3.243554359203237e-06, 'epoch': 1.49} {'loss': 0.1303, 'learning_rate': 3.243306671042311e-06, 'epoch': 1.49} {'loss': 0.3047, 'learning_rate': 3.2430589905084074e-06, 'epoch': 1.49} {'loss': 0.4316, 'learning_rate': 3.2428113176018016e-06, 'epoch': 1.49} {'loss': 0.3822, 'learning_rate': 3.24256365232278e-06, 'epoch': 1.49} {'loss': 0.3496, 'learning_rate': 3.2423159946716163e-06, 'epoch': 1.49} {'loss': 0.35, 'learning_rate': 3.2420683446485958e-06, 'epoch': 1.49} {'loss': 0.2096, 'learning_rate': 3.2418207022539896e-06, 'epoch': 1.49} {'loss': 0.2224, 'learning_rate': 3.2415730674880873e-06, 'epoch': 1.49} {'loss': 0.2283, 'learning_rate': 3.241325440351165e-06, 'epoch': 1.49} {'loss': 0.4015, 'learning_rate': 3.241077820843498e-06, 'epoch': 1.49} {'loss': 0.2478, 'learning_rate': 3.240830208965371e-06, 'epoch': 1.49} {'loss': 0.3885, 'learning_rate': 3.2405826047170595e-06, 'epoch': 1.49} {'loss': 0.2794, 'learning_rate': 3.240335008098847e-06, 'epoch': 1.49} {'loss': 0.3124, 'learning_rate': 3.240087419111008e-06, 'epoch': 1.49} {'loss': 0.2399, 'learning_rate': 3.2398398377538287e-06, 'epoch': 1.49} {'loss': 0.2891, 'learning_rate': 3.23959226402758e-06, 'epoch': 1.49} {'loss': 0.1911, 'learning_rate': 3.2393446979325505e-06, 'epoch': 1.49} {'loss': 0.2488, 'learning_rate': 3.239097139469012e-06, 'epoch': 1.49} {'loss': 0.4223, 'learning_rate': 3.2388495886372505e-06, 'epoch': 1.49} {'loss': 0.2355, 'learning_rate': 3.238602045437539e-06, 'epoch': 1.49} {'loss': 0.3875, 'learning_rate': 3.238354509870162e-06, 'epoch': 1.49} {'loss': 0.2981, 'learning_rate': 3.238106981935398e-06, 'epoch': 1.49} {'loss': 0.2208, 'learning_rate': 3.2378594616335224e-06, 'epoch': 1.49} {'loss': 0.3745, 'learning_rate': 3.2376119489648204e-06, 'epoch': 1.49} {'loss': 0.3959, 'learning_rate': 3.237364443929565e-06, 'epoch': 1.49} {'loss': 0.3913, 'learning_rate': 3.2371169465280426e-06, 'epoch': 1.49} {'loss': 0.2122, 'learning_rate': 3.2368694567605264e-06, 'epoch': 1.49} {'loss': 0.2154, 'learning_rate': 3.2366219746273007e-06, 'epoch': 1.49} {'loss': 0.2788, 'learning_rate': 3.2363745001286405e-06, 'epoch': 1.49} {'loss': 0.3936, 'learning_rate': 3.2361270332648307e-06, 'epoch': 1.49} {'loss': 0.2678, 'learning_rate': 3.2358795740361438e-06, 'epoch': 1.49} {'loss': 0.2688, 'learning_rate': 3.2356321224428655e-06, 'epoch': 1.49} {'loss': 0.3618, 'learning_rate': 3.2353846784852682e-06, 'epoch': 1.49} {'loss': 0.4416, 'learning_rate': 3.2351372421636395e-06, 'epoch': 1.49} {'loss': 0.2898, 'learning_rate': 3.2348898134782546e-06, 'epoch': 1.49} {'loss': 0.3275, 'learning_rate': 3.234642392429389e-06, 'epoch': 1.49} {'loss': 0.2541, 'learning_rate': 3.234394979017329e-06, 'epoch': 1.49} {'loss': 0.4144, 'learning_rate': 3.2341475732423477e-06, 'epoch': 1.49} {'loss': 0.3154, 'learning_rate': 3.2339001751047292e-06, 'epoch': 1.49} {'loss': 0.351, 'learning_rate': 3.2336527846047492e-06, 'epoch': 1.49} {'loss': 0.3467, 'learning_rate': 3.2334054017426906e-06, 'epoch': 1.49} {'loss': 0.4009, 'learning_rate': 3.233158026518828e-06, 'epoch': 1.49} {'loss': 0.2863, 'learning_rate': 3.232910658933446e-06, 'epoch': 1.49} {'loss': 0.4424, 'learning_rate': 3.232663298986818e-06, 'epoch': 1.49} {'loss': 0.3934, 'learning_rate': 3.232415946679229e-06, 'epoch': 1.49} {'loss': 0.3904, 'learning_rate': 3.2321686020109534e-06, 'epoch': 1.49} {'loss': 0.2311, 'learning_rate': 3.2319212649822753e-06, 'epoch': 1.49} {'loss': 0.4642, 'learning_rate': 3.23167393559347e-06, 'epoch': 1.49} {'loss': 0.442, 'learning_rate': 3.231426613844816e-06, 'epoch': 1.49} {'loss': 0.1895, 'learning_rate': 3.2311792997365964e-06, 'epoch': 1.49} {'loss': 0.3204, 'learning_rate': 3.230931993269085e-06, 'epoch': 1.49} {'loss': 0.1653, 'learning_rate': 3.2306846944425684e-06, 'epoch': 1.49} {'loss': 0.2655, 'learning_rate': 3.230437403257317e-06, 'epoch': 1.49} {'loss': 0.3112, 'learning_rate': 3.2301901197136187e-06, 'epoch': 1.49} {'loss': 0.3275, 'learning_rate': 3.2299428438117454e-06, 'epoch': 1.49} {'loss': 0.3853, 'learning_rate': 3.229695575551982e-06, 'epoch': 1.49} {'loss': 0.3477, 'learning_rate': 3.2294483149346014e-06, 'epoch': 1.49} {'loss': 0.166, 'learning_rate': 3.22920106195989e-06, 'epoch': 1.49} {'loss': 0.4462, 'learning_rate': 3.22895381662812e-06, 'epoch': 1.49} {'loss': 0.2903, 'learning_rate': 3.2287065789395756e-06, 'epoch': 1.49} {'loss': 0.4734, 'learning_rate': 3.228459348894535e-06, 'epoch': 1.49} {'loss': 0.3075, 'learning_rate': 3.228212126493272e-06, 'epoch': 1.49} {'loss': 0.2802, 'learning_rate': 3.2279649117360735e-06, 'epoch': 1.49} {'loss': 0.3724, 'learning_rate': 3.227717704623211e-06, 'epoch': 1.49} {'loss': 0.3564, 'learning_rate': 3.2274705051549715e-06, 'epoch': 1.49} {'loss': 0.2826, 'learning_rate': 3.2272233133316265e-06, 'epoch': 1.49} {'loss': 0.2475, 'learning_rate': 3.226976129153462e-06, 'epoch': 1.49} {'loss': 0.2239, 'learning_rate': 3.22672895262075e-06, 'epoch': 1.49} {'loss': 0.3894, 'learning_rate': 3.2264817837337758e-06, 'epoch': 1.49} {'loss': 0.4341, 'learning_rate': 3.2262346224928132e-06, 'epoch': 1.49} {'loss': 0.2415, 'learning_rate': 3.2259874688981463e-06, 'epoch': 1.49} {'loss': 0.392, 'learning_rate': 3.2257403229500485e-06, 'epoch': 1.49} {'loss': 0.2447, 'learning_rate': 3.2254931846488045e-06, 'epoch': 1.49} {'loss': 0.3815, 'learning_rate': 3.2252460539946904e-06, 'epoch': 1.49} {'loss': 0.3347, 'learning_rate': 3.2249989309879824e-06, 'epoch': 1.49} {'loss': 0.501, 'learning_rate': 3.2247518156289646e-06, 'epoch': 1.49} {'loss': 0.3168, 'learning_rate': 3.2245047079179114e-06, 'epoch': 1.49} {'loss': 0.3655, 'learning_rate': 3.2242576078551067e-06, 'epoch': 1.49} {'loss': 0.314, 'learning_rate': 3.224010515440824e-06, 'epoch': 1.49} {'loss': 0.4097, 'learning_rate': 3.2237634306753483e-06, 'epoch': 1.49} {'loss': 0.3523, 'learning_rate': 3.2235163535589507e-06, 'epoch': 1.49} {'loss': 0.3976, 'learning_rate': 3.223269284091919e-06, 'epoch': 1.49} {'loss': 0.3732, 'learning_rate': 3.2230222222745245e-06, 'epoch': 1.49} {'loss': 0.3476, 'learning_rate': 3.222775168107052e-06, 'epoch': 1.49} {'loss': 0.2202, 'learning_rate': 3.222528121589774e-06, 'epoch': 1.49} {'loss': 0.326, 'learning_rate': 3.2222810827229755e-06, 'epoch': 1.49} {'loss': 0.4275, 'learning_rate': 3.2220340515069337e-06, 'epoch': 1.49} {'loss': 0.2431, 'learning_rate': 3.2217870279419238e-06, 'epoch': 1.49} {'loss': 0.2339, 'learning_rate': 3.22154001202823e-06, 'epoch': 1.49} {'loss': 0.2286, 'learning_rate': 3.221293003766126e-06, 'epoch': 1.49} {'loss': 0.3489, 'learning_rate': 3.2210460031558954e-06, 'epoch': 1.49} {'loss': 0.3402, 'learning_rate': 3.2207990101978124e-06, 'epoch': 1.49} {'loss': 0.3655, 'learning_rate': 3.2205520248921605e-06, 'epoch': 1.49} {'loss': 0.2498, 'learning_rate': 3.220305047239214e-06, 'epoch': 1.49} {'loss': 0.3217, 'learning_rate': 3.2200580772392565e-06, 'epoch': 1.49} {'loss': 0.2319, 'learning_rate': 3.2198111148925613e-06, 'epoch': 1.49} {'loss': 0.383, 'learning_rate': 3.2195641601994132e-06, 'epoch': 1.49} {'loss': 0.2529, 'learning_rate': 3.219317213160085e-06, 'epoch': 1.49} {'loss': 0.2805, 'learning_rate': 3.21907027377486e-06, 'epoch': 1.49} {'loss': 0.3301, 'learning_rate': 3.2188233420440162e-06, 'epoch': 1.49} {'loss': 0.4636, 'learning_rate': 3.218576417967828e-06, 'epoch': 1.49} {'loss': 0.3218, 'learning_rate': 3.218329501546581e-06, 'epoch': 1.49} {'loss': 0.3453, 'learning_rate': 3.218082592780547e-06, 'epoch': 1.49} {'loss': 0.3461, 'learning_rate': 3.2178356916700114e-06, 'epoch': 1.49} {'loss': 0.3607, 'learning_rate': 3.2175887982152465e-06, 'epoch': 1.49} {'loss': 0.3382, 'learning_rate': 3.2173419124165328e-06, 'epoch': 1.49} {'loss': 0.3031, 'learning_rate': 3.217095034274151e-06, 'epoch': 1.49} {'loss': 0.3673, 'learning_rate': 3.216848163788383e-06, 'epoch': 1.49} {'loss': 0.4727, 'learning_rate': 3.2166013009595044e-06, 'epoch': 1.49} {'loss': 0.3689, 'learning_rate': 3.216354445787788e-06, 'epoch': 1.49} {'loss': 0.2395, 'learning_rate': 3.216107598273521e-06, 'epoch': 1.49} {'loss': 0.3383, 'learning_rate': 3.2158607584169754e-06, 'epoch': 1.49} {'loss': 0.2894, 'learning_rate': 3.215613926218437e-06, 'epoch': 1.49} {'loss': 0.4263, 'learning_rate': 3.2153671016781762e-06, 'epoch': 1.49} {'loss': 0.2713, 'learning_rate': 3.215120284796479e-06, 'epoch': 1.49} {'loss': 0.4108, 'learning_rate': 3.214873475573618e-06, 'epoch': 1.49} {'loss': 0.253, 'learning_rate': 3.2146266740098773e-06, 'epoch': 1.49} {'loss': 0.3623, 'learning_rate': 3.2143798801055305e-06, 'epoch': 1.49} {'loss': 0.4425, 'learning_rate': 3.2141330938608615e-06, 'epoch': 1.49} {'loss': 0.2447, 'learning_rate': 3.2138863152761423e-06, 'epoch': 1.49} {'loss': 0.3076, 'learning_rate': 3.213639544351658e-06, 'epoch': 1.49} {'loss': 0.3806, 'learning_rate': 3.213392781087684e-06, 'epoch': 1.49} {'loss': 0.3666, 'learning_rate': 3.213146025484496e-06, 'epoch': 1.49} {'loss': 0.3269, 'learning_rate': 3.2128992775423793e-06, 'epoch': 1.49} {'loss': 0.3148, 'learning_rate': 3.2126525372616047e-06, 'epoch': 1.49} {'loss': 0.2762, 'learning_rate': 3.212405804642459e-06, 'epoch': 1.49} {'loss': 0.4203, 'learning_rate': 3.212159079685212e-06, 'epoch': 1.49} {'loss': 0.4076, 'learning_rate': 3.2119123623901504e-06, 'epoch': 1.49} {'loss': 0.3363, 'learning_rate': 3.2116656527575465e-06, 'epoch': 1.49} {'loss': 0.3854, 'learning_rate': 3.2114189507876824e-06, 'epoch': 1.49} {'loss': 0.2395, 'learning_rate': 3.2111722564808344e-06, 'epoch': 1.49} {'loss': 0.296, 'learning_rate': 3.2109255698372844e-06, 'epoch': 1.49} {'loss': 0.3192, 'learning_rate': 3.210678890857305e-06, 'epoch': 1.49} {'loss': 0.2989, 'learning_rate': 3.2104322195411807e-06, 'epoch': 1.49} {'loss': 0.3683, 'learning_rate': 3.210185555889188e-06, 'epoch': 1.49} {'loss': 0.2612, 'learning_rate': 3.209938899901601e-06, 'epoch': 1.49} {'loss': 0.241, 'learning_rate': 3.2096922515787055e-06, 'epoch': 1.49} {'loss': 0.4557, 'learning_rate': 3.209445610920773e-06, 'epoch': 1.49} {'loss': 0.228, 'learning_rate': 3.2091989779280886e-06, 'epoch': 1.49} {'loss': 0.384, 'learning_rate': 3.2089523526009238e-06, 'epoch': 1.49} {'loss': 0.2797, 'learning_rate': 3.2087057349395634e-06, 'epoch': 1.49} {'loss': 0.4804, 'learning_rate': 3.2084591249442798e-06, 'epoch': 1.49} {'loss': 0.2209, 'learning_rate': 3.208212522615357e-06, 'epoch': 1.49} {'loss': 0.3531, 'learning_rate': 3.2079659279530685e-06, 'epoch': 1.49} {'loss': 0.2577, 'learning_rate': 3.2077193409576966e-06, 'epoch': 1.49} {'loss': 0.3479, 'learning_rate': 3.2074727616295166e-06, 'epoch': 1.49} {'loss': 0.298, 'learning_rate': 3.2072261899688105e-06, 'epoch': 1.49} {'loss': 0.2499, 'learning_rate': 3.2069796259758544e-06, 'epoch': 1.49} {'loss': 0.2472, 'learning_rate': 3.2067330696509225e-06, 'epoch': 1.49} {'loss': 0.2526, 'learning_rate': 3.206486520994302e-06, 'epoch': 1.49} {'loss': 0.3163, 'learning_rate': 3.2062399800062618e-06, 'epoch': 1.49} {'loss': 0.2569, 'learning_rate': 3.205993446687089e-06, 'epoch': 1.49} {'loss': 0.359, 'learning_rate': 3.205746921037054e-06, 'epoch': 1.49} {'loss': 0.3116, 'learning_rate': 3.205500403056442e-06, 'epoch': 1.49} {'loss': 0.4352, 'learning_rate': 3.2052538927455246e-06, 'epoch': 1.49} {'loss': 0.2857, 'learning_rate': 3.2050073901045863e-06, 'epoch': 1.49} {'loss': 0.2982, 'learning_rate': 3.2047608951339006e-06, 'epoch': 1.49} {'loss': 0.3308, 'learning_rate': 3.2045144078337496e-06, 'epoch': 1.49} {'loss': 0.3403, 'learning_rate': 3.2042679282044065e-06, 'epoch': 1.49} {'loss': 0.2656, 'learning_rate': 3.2040214562461567e-06, 'epoch': 1.49} {'loss': 0.3725, 'learning_rate': 3.2037749919592743e-06, 'epoch': 1.49} {'loss': 0.3208, 'learning_rate': 3.2035285353440336e-06, 'epoch': 1.49} {'loss': 0.4159, 'learning_rate': 3.2032820864007206e-06, 'epoch': 1.49} {'loss': 0.2597, 'learning_rate': 3.2030356451296063e-06, 'epoch': 1.49} {'loss': 0.4448, 'learning_rate': 3.2027892115309757e-06, 'epoch': 1.49} {'loss': 0.2434, 'learning_rate': 3.2025427856050995e-06, 'epoch': 1.49} {'loss': 0.4176, 'learning_rate': 3.2022963673522635e-06, 'epoch': 1.49} {'loss': 0.3819, 'learning_rate': 3.2020499567727392e-06, 'epoch': 1.49} {'loss': 0.4019, 'learning_rate': 3.2018035538668112e-06, 'epoch': 1.49} {'loss': 0.3128, 'learning_rate': 3.2015571586347506e-06, 'epoch': 1.49} {'loss': 0.3432, 'learning_rate': 3.201310771076843e-06, 'epoch': 1.49} {'loss': 0.2536, 'learning_rate': 3.2010643911933592e-06, 'epoch': 1.49} {'loss': 0.2587, 'learning_rate': 3.2008180189845837e-06, 'epoch': 1.49} {'loss': 0.4294, 'learning_rate': 3.2005716544507924e-06, 'epoch': 1.49} {'loss': 0.2913, 'learning_rate': 3.2003252975922584e-06, 'epoch': 1.49} {'loss': 0.3926, 'learning_rate': 3.200078948409269e-06, 'epoch': 1.49} {'loss': 0.2639, 'learning_rate': 3.1998326069020924e-06, 'epoch': 1.49} {'loss': 0.3215, 'learning_rate': 3.199586273071016e-06, 'epoch': 1.49} {'loss': 0.2399, 'learning_rate': 3.19933994691631e-06, 'epoch': 1.49} {'loss': 0.3078, 'learning_rate': 3.199093628438259e-06, 'epoch': 1.49} {'loss': 0.2437, 'learning_rate': 3.198847317637136e-06, 'epoch': 1.49} {'loss': 0.4341, 'learning_rate': 3.198601014513223e-06, 'epoch': 1.49} {'loss': 0.2946, 'learning_rate': 3.198354719066793e-06, 'epoch': 1.49} {'loss': 0.3391, 'learning_rate': 3.1981084312981303e-06, 'epoch': 1.49} {'loss': 0.3684, 'learning_rate': 3.197862151207507e-06, 'epoch': 1.49} {'loss': 0.2811, 'learning_rate': 3.197615878795207e-06, 'epoch': 1.49} {'loss': 0.1891, 'learning_rate': 3.197369614061505e-06, 'epoch': 1.49} {'loss': 0.2842, 'learning_rate': 3.197123357006676e-06, 'epoch': 1.49} {'loss': 0.3091, 'learning_rate': 3.1968771076310047e-06, 'epoch': 1.49} {'loss': 0.3929, 'learning_rate': 3.1966308659347623e-06, 'epoch': 1.49} {'loss': 0.4387, 'learning_rate': 3.1963846319182323e-06, 'epoch': 1.49} {'loss': 0.4813, 'learning_rate': 3.196138405581687e-06, 'epoch': 1.49} {'loss': 0.2999, 'learning_rate': 3.195892186925411e-06, 'epoch': 1.49} {'loss': 0.3861, 'learning_rate': 3.195645975949676e-06, 'epoch': 1.49} {'loss': 0.4483, 'learning_rate': 3.195399772654767e-06, 'epoch': 1.49} {'loss': 0.4568, 'learning_rate': 3.1951535770409523e-06, 'epoch': 1.49} {'loss': 0.3404, 'learning_rate': 3.1949073891085203e-06, 'epoch': 1.49} {'loss': 0.2681, 'learning_rate': 3.19466120885774e-06, 'epoch': 1.49} {'loss': 0.2817, 'learning_rate': 3.194415036288896e-06, 'epoch': 1.49} {'loss': 0.406, 'learning_rate': 3.1941688714022633e-06, 'epoch': 1.49} {'loss': 0.3177, 'learning_rate': 3.193922714198117e-06, 'epoch': 1.49} {'loss': 0.2357, 'learning_rate': 3.193676564676741e-06, 'epoch': 1.49} {'loss': 0.2767, 'learning_rate': 3.193430422838406e-06, 'epoch': 1.49} {'loss': 0.2428, 'learning_rate': 3.1931842886833976e-06, 'epoch': 1.49} {'loss': 0.2605, 'learning_rate': 3.192938162211983e-06, 'epoch': 1.49} {'loss': 0.3178, 'learning_rate': 3.1926920434244524e-06, 'epoch': 1.49} {'loss': 0.4035, 'learning_rate': 3.1924459323210787e-06, 'epoch': 1.49} {'loss': 0.4018, 'learning_rate': 3.192199828902136e-06, 'epoch': 1.49} {'loss': 0.2343, 'learning_rate': 3.1919537331679085e-06, 'epoch': 1.49} {'loss': 0.2657, 'learning_rate': 3.1917076451186667e-06, 'epoch': 1.49} {'loss': 0.475, 'learning_rate': 3.1914615647546964e-06, 'epoch': 1.49} {'loss': 0.2077, 'learning_rate': 3.191215492076267e-06, 'epoch': 1.49} {'loss': 0.3713, 'learning_rate': 3.1909694270836654e-06, 'epoch': 1.49} {'loss': 0.2826, 'learning_rate': 3.19072336977716e-06, 'epoch': 1.49} {'loss': 0.1611, 'learning_rate': 3.190477320157037e-06, 'epoch': 1.49} {'loss': 0.2975, 'learning_rate': 3.190231278223567e-06, 'epoch': 1.49} {'loss': 0.338, 'learning_rate': 3.189985243977033e-06, 'epoch': 1.49} {'loss': 0.3705, 'learning_rate': 3.1897392174177088e-06, 'epoch': 1.49} {'loss': 0.1744, 'learning_rate': 3.1894931985458765e-06, 'epoch': 1.49} {'loss': 0.2777, 'learning_rate': 3.1892471873618115e-06, 'epoch': 1.49} {'loss': 0.3148, 'learning_rate': 3.1890011838657876e-06, 'epoch': 1.49} {'loss': 0.2142, 'learning_rate': 3.1887551880580903e-06, 'epoch': 1.49} {'loss': 0.2728, 'learning_rate': 3.1885091999389895e-06, 'epoch': 1.49} {'loss': 0.2783, 'learning_rate': 3.188263219508769e-06, 'epoch': 1.49} {'loss': 0.3029, 'learning_rate': 3.188017246767702e-06, 'epoch': 1.49} {'loss': 0.2534, 'learning_rate': 3.187771281716071e-06, 'epoch': 1.49} {'loss': 0.347, 'learning_rate': 3.1875253243541482e-06, 'epoch': 1.49} {'loss': 0.3397, 'learning_rate': 3.1872793746822163e-06, 'epoch': 1.49} {'loss': 0.2983, 'learning_rate': 3.187033432700547e-06, 'epoch': 1.49} {'loss': 0.3198, 'learning_rate': 3.186787498409425e-06, 'epoch': 1.49} {'loss': 0.2025, 'learning_rate': 3.186541571809122e-06, 'epoch': 1.49} {'loss': 0.2715, 'learning_rate': 3.18629565289992e-06, 'epoch': 1.49} {'loss': 0.279, 'learning_rate': 3.186049741682091e-06, 'epoch': 1.49} {'loss': 0.4161, 'learning_rate': 3.18580383815592e-06, 'epoch': 1.49} {'loss': 0.3595, 'learning_rate': 3.185557942321681e-06, 'epoch': 1.49} {'loss': 0.3641, 'learning_rate': 3.1853120541796478e-06, 'epoch': 1.49} {'loss': 0.2531, 'learning_rate': 3.185066173730105e-06, 'epoch': 1.49} {'loss': 0.3983, 'learning_rate': 3.1848203009733225e-06, 'epoch': 1.49} {'loss': 0.3272, 'learning_rate': 3.1845744359095856e-06, 'epoch': 1.49} {'loss': 0.3818, 'learning_rate': 3.1843285785391643e-06, 'epoch': 1.49} {'loss': 0.4, 'learning_rate': 3.1840827288623432e-06, 'epoch': 1.49} {'loss': 0.3884, 'learning_rate': 3.1838368868793944e-06, 'epoch': 1.49} {'loss': 0.2349, 'learning_rate': 3.1835910525906e-06, 'epoch': 1.49} {'loss': 0.3127, 'learning_rate': 3.183345225996233e-06, 'epoch': 1.49} {'loss': 0.1758, 'learning_rate': 3.183099407096575e-06, 'epoch': 1.49} {'loss': 0.2546, 'learning_rate': 3.182853595891898e-06, 'epoch': 1.49} {'loss': 0.2688, 'learning_rate': 3.182607792382487e-06, 'epoch': 1.49} {'loss': 0.3314, 'learning_rate': 3.1823619965686158e-06, 'epoch': 1.49} {'loss': 0.2657, 'learning_rate': 3.1821162084505575e-06, 'epoch': 1.49} {'loss': 0.2735, 'learning_rate': 3.1818704280285974e-06, 'epoch': 1.49} {'loss': 0.3024, 'learning_rate': 3.181624655303005e-06, 'epoch': 1.49} {'loss': 0.2946, 'learning_rate': 3.181378890274065e-06, 'epoch': 1.49} {'loss': 0.3126, 'learning_rate': 3.181133132942049e-06, 'epoch': 1.49} {'loss': 0.3316, 'learning_rate': 3.180887383307241e-06, 'epoch': 1.49} {'loss': 0.3064, 'learning_rate': 3.1806416413699093e-06, 'epoch': 1.49} {'loss': 0.3535, 'learning_rate': 3.1803959071303403e-06, 'epoch': 1.49} {'loss': 0.3106, 'learning_rate': 3.1801501805888045e-06, 'epoch': 1.49} {'loss': 0.2576, 'learning_rate': 3.1799044617455866e-06, 'epoch': 1.49} {'loss': 0.3405, 'learning_rate': 3.1796587506009545e-06, 'epoch': 1.49} {'loss': 0.2577, 'learning_rate': 3.1794130471551955e-06, 'epoch': 1.49} {'loss': 0.3038, 'learning_rate': 3.179167351408581e-06, 'epoch': 1.49} {'loss': 0.2673, 'learning_rate': 3.178921663361387e-06, 'epoch': 1.49} {'loss': 0.3076, 'learning_rate': 3.178675983013897e-06, 'epoch': 1.49} {'loss': 0.1902, 'learning_rate': 3.1784303103663807e-06, 'epoch': 1.49} {'loss': 0.3563, 'learning_rate': 3.1781846454191225e-06, 'epoch': 1.49} {'loss': 0.2792, 'learning_rate': 3.177938988172394e-06, 'epoch': 1.49} {'loss': 0.1968, 'learning_rate': 3.1776933386264773e-06, 'epoch': 1.49} {'loss': 0.3229, 'learning_rate': 3.177447696781646e-06, 'epoch': 1.49} {'loss': 0.2864, 'learning_rate': 3.1772020626381804e-06, 'epoch': 1.49} {'loss': 0.375, 'learning_rate': 3.1769564361963534e-06, 'epoch': 1.49} {'loss': 0.48, 'learning_rate': 3.176710817456449e-06, 'epoch': 1.49} {'loss': 0.2803, 'learning_rate': 3.1764652064187373e-06, 'epoch': 1.49} {'loss': 0.4163, 'learning_rate': 3.176219603083501e-06, 'epoch': 1.49} {'loss': 0.5035, 'learning_rate': 3.175974007451017e-06, 'epoch': 1.49} {'loss': 0.1492, 'learning_rate': 3.1757284195215565e-06, 'epoch': 1.49} {'loss': 0.3607, 'learning_rate': 3.175482839295404e-06, 'epoch': 1.49} {'loss': 0.3926, 'learning_rate': 3.1752372667728303e-06, 'epoch': 1.49} {'loss': 0.328, 'learning_rate': 3.1749917019541186e-06, 'epoch': 1.49} {'loss': 0.387, 'learning_rate': 3.1747461448395413e-06, 'epoch': 1.49} {'loss': 0.3023, 'learning_rate': 3.1745005954293805e-06, 'epoch': 1.49} {'loss': 0.3332, 'learning_rate': 3.174255053723908e-06, 'epoch': 1.49} {'loss': 0.2908, 'learning_rate': 3.1740095197234067e-06, 'epoch': 1.49} {'loss': 0.2026, 'learning_rate': 3.173763993428146e-06, 'epoch': 1.49} {'loss': 0.2234, 'learning_rate': 3.173518474838412e-06, 'epoch': 1.49} {'loss': 0.2693, 'learning_rate': 3.1732729639544745e-06, 'epoch': 1.49} {'loss': 0.3059, 'learning_rate': 3.1730274607766166e-06, 'epoch': 1.49} {'loss': 0.3898, 'learning_rate': 3.1727819653051127e-06, 'epoch': 1.49} {'loss': 0.1851, 'learning_rate': 3.1725364775402357e-06, 'epoch': 1.49} {'loss': 0.2969, 'learning_rate': 3.17229099748227e-06, 'epoch': 1.49} {'loss': 0.2578, 'learning_rate': 3.1720455251314876e-06, 'epoch': 1.49} {'loss': 0.3358, 'learning_rate': 3.1718000604881693e-06, 'epoch': 1.49} {'loss': 0.25, 'learning_rate': 3.171554603552588e-06, 'epoch': 1.49} {'loss': 0.3298, 'learning_rate': 3.171309154325025e-06, 'epoch': 1.49} {'loss': 0.3352, 'learning_rate': 3.171063712805753e-06, 'epoch': 1.49} {'loss': 0.2445, 'learning_rate': 3.1708182789950547e-06, 'epoch': 1.49} {'loss': 0.2899, 'learning_rate': 3.1705728528932013e-06, 'epoch': 1.49} {'loss': 0.2614, 'learning_rate': 3.1703274345004755e-06, 'epoch': 1.49} {'loss': 0.237, 'learning_rate': 3.170082023817147e-06, 'epoch': 1.49} {'loss': 0.3965, 'learning_rate': 3.1698366208435004e-06, 'epoch': 1.49} {'loss': 0.379, 'learning_rate': 3.169591225579811e-06, 'epoch': 1.49} {'loss': 0.2132, 'learning_rate': 3.16934583802635e-06, 'epoch': 1.49} {'loss': 0.3278, 'learning_rate': 3.1691004581834017e-06, 'epoch': 1.49} {'loss': 0.1304, 'learning_rate': 3.1688550860512368e-06, 'epoch': 1.49} {'loss': 0.2767, 'learning_rate': 3.168609721630136e-06, 'epoch': 1.49} {'loss': 0.1994, 'learning_rate': 3.1683643649203753e-06, 'epoch': 1.49} {'loss': 0.2835, 'learning_rate': 3.1681190159222353e-06, 'epoch': 1.5} {'loss': 0.1985, 'learning_rate': 3.1678736746359907e-06, 'epoch': 1.5} {'loss': 0.3004, 'learning_rate': 3.1676283410619136e-06, 'epoch': 1.5} {'loss': 0.2759, 'learning_rate': 3.1673830152002884e-06, 'epoch': 1.5} {'loss': 0.2914, 'learning_rate': 3.1671376970513844e-06, 'epoch': 1.5} {'loss': 0.3183, 'learning_rate': 3.1668923866154866e-06, 'epoch': 1.5} {'loss': 0.2558, 'learning_rate': 3.1666470838928643e-06, 'epoch': 1.5} {'loss': 0.2874, 'learning_rate': 3.166401788883802e-06, 'epoch': 1.5} {'loss': 0.3093, 'learning_rate': 3.166156501588569e-06, 'epoch': 1.5} {'loss': 0.3234, 'learning_rate': 3.1659112220074483e-06, 'epoch': 1.5} {'loss': 0.3147, 'learning_rate': 3.1656659501407116e-06, 'epoch': 1.5} {'loss': 0.3108, 'learning_rate': 3.1654206859886426e-06, 'epoch': 1.5} {'loss': 0.4432, 'learning_rate': 3.165175429551509e-06, 'epoch': 1.5} {'loss': 0.2257, 'learning_rate': 3.1649301808295974e-06, 'epoch': 1.5} {'loss': 0.4, 'learning_rate': 3.1646849398231793e-06, 'epoch': 1.5} {'loss': 0.3437, 'learning_rate': 3.1644397065325283e-06, 'epoch': 1.5} {'loss': 0.3311, 'learning_rate': 3.1641944809579295e-06, 'epoch': 1.5} {'loss': 0.2487, 'learning_rate': 3.1639492630996504e-06, 'epoch': 1.5} {'loss': 0.3042, 'learning_rate': 3.1637040529579775e-06, 'epoch': 1.5} {'loss': 0.473, 'learning_rate': 3.1634588505331787e-06, 'epoch': 1.5} {'loss': 0.2053, 'learning_rate': 3.163213655825538e-06, 'epoch': 1.5} {'loss': 0.4295, 'learning_rate': 3.1629684688353257e-06, 'epoch': 1.5} {'loss': 0.2541, 'learning_rate': 3.1627232895628258e-06, 'epoch': 1.5} {'loss': 0.335, 'learning_rate': 3.1624781180083075e-06, 'epoch': 1.5} {'loss': 0.264, 'learning_rate': 3.1622329541720543e-06, 'epoch': 1.5} {'loss': 0.4583, 'learning_rate': 3.1619877980543367e-06, 'epoch': 1.5} {'loss': 0.5144, 'learning_rate': 3.1617426496554372e-06, 'epoch': 1.5} {'loss': 0.2245, 'learning_rate': 3.1614975089756308e-06, 'epoch': 1.5} {'loss': 0.2858, 'learning_rate': 3.161252376015189e-06, 'epoch': 1.5} {'loss': 0.43, 'learning_rate': 3.161007250774397e-06, 'epoch': 1.5} {'loss': 0.4595, 'learning_rate': 3.160762133253524e-06, 'epoch': 1.5} {'loss': 0.3534, 'learning_rate': 3.1605170234528535e-06, 'epoch': 1.5} {'loss': 0.1843, 'learning_rate': 3.1602719213726553e-06, 'epoch': 1.5} {'loss': 0.1815, 'learning_rate': 3.160026827013212e-06, 'epoch': 1.5} {'loss': 0.336, 'learning_rate': 3.1597817403747956e-06, 'epoch': 1.5} {'loss': 0.3164, 'learning_rate': 3.1595366614576874e-06, 'epoch': 1.5} {'loss': 0.3351, 'learning_rate': 3.1592915902621577e-06, 'epoch': 1.5} {'loss': 0.277, 'learning_rate': 3.159046526788491e-06, 'epoch': 1.5} {'loss': 0.2271, 'learning_rate': 3.158801471036956e-06, 'epoch': 1.5} {'loss': 0.4501, 'learning_rate': 3.158556423007838e-06, 'epoch': 1.5} {'loss': 0.2634, 'learning_rate': 3.158311382701408e-06, 'epoch': 1.5} {'loss': 0.3108, 'learning_rate': 3.15806635011794e-06, 'epoch': 1.5} {'loss': 0.4019, 'learning_rate': 3.1578213252577172e-06, 'epoch': 1.5} {'loss': 0.217, 'learning_rate': 3.1575763081210098e-06, 'epoch': 1.5} {'loss': 0.2667, 'learning_rate': 3.1573312987081006e-06, 'epoch': 1.5} {'loss': 0.3564, 'learning_rate': 3.1570862970192607e-06, 'epoch': 1.5} {'loss': 0.2681, 'learning_rate': 3.1568413030547717e-06, 'epoch': 1.5} {'loss': 0.3309, 'learning_rate': 3.156596316814905e-06, 'epoch': 1.5} {'loss': 0.3381, 'learning_rate': 3.1563513382999423e-06, 'epoch': 1.5} {'loss': 0.2414, 'learning_rate': 3.1561063675101545e-06, 'epoch': 1.5} {'loss': 0.1899, 'learning_rate': 3.1558614044458247e-06, 'epoch': 1.5} {'loss': 0.2092, 'learning_rate': 3.1556164491072227e-06, 'epoch': 1.5} {'loss': 0.3814, 'learning_rate': 3.1553715014946306e-06, 'epoch': 1.5} {'loss': 0.3092, 'learning_rate': 3.1551265616083236e-06, 'epoch': 1.5} {'loss': 0.2394, 'learning_rate': 3.154881629448574e-06, 'epoch': 1.5} {'loss': 0.3493, 'learning_rate': 3.1546367050156636e-06, 'epoch': 1.5} {'loss': 0.3678, 'learning_rate': 3.1543917883098642e-06, 'epoch': 1.5} {'loss': 0.317, 'learning_rate': 3.1541468793314566e-06, 'epoch': 1.5} {'loss': 0.3431, 'learning_rate': 3.1539019780807135e-06, 'epoch': 1.5} {'loss': 0.3281, 'learning_rate': 3.153657084557916e-06, 'epoch': 1.5} {'loss': 0.2962, 'learning_rate': 3.153412198763335e-06, 'epoch': 1.5} {'loss': 0.3182, 'learning_rate': 3.1531673206972523e-06, 'epoch': 1.5} {'loss': 0.2499, 'learning_rate': 3.152922450359939e-06, 'epoch': 1.5} {'loss': 0.3088, 'learning_rate': 3.152677587751677e-06, 'epoch': 1.5} {'loss': 0.3977, 'learning_rate': 3.152432732872737e-06, 'epoch': 1.5} {'loss': 0.3351, 'learning_rate': 3.1521878857234014e-06, 'epoch': 1.5} {'loss': 0.2634, 'learning_rate': 3.1519430463039437e-06, 'epoch': 1.5} {'loss': 0.3667, 'learning_rate': 3.1516982146146367e-06, 'epoch': 1.5} {'loss': 0.3906, 'learning_rate': 3.151453390655763e-06, 'epoch': 1.5} {'loss': 0.3047, 'learning_rate': 3.1512085744275932e-06, 'epoch': 1.5} {'loss': 0.1865, 'learning_rate': 3.1509637659304104e-06, 'epoch': 1.5} {'loss': 0.363, 'learning_rate': 3.150718965164483e-06, 'epoch': 1.5} {'loss': 0.3977, 'learning_rate': 3.1504741721300946e-06, 'epoch': 1.5} {'loss': 0.343, 'learning_rate': 3.1502293868275156e-06, 'epoch': 1.5} {'loss': 0.3581, 'learning_rate': 3.1499846092570286e-06, 'epoch': 1.5} {'loss': 0.2252, 'learning_rate': 3.1497398394189026e-06, 'epoch': 1.5} {'loss': 0.286, 'learning_rate': 3.1494950773134216e-06, 'epoch': 1.5} {'loss': 0.1511, 'learning_rate': 3.1492503229408534e-06, 'epoch': 1.5} {'loss': 0.2811, 'learning_rate': 3.1490055763014837e-06, 'epoch': 1.5} {'loss': 0.2109, 'learning_rate': 3.1487608373955825e-06, 'epoch': 1.5} {'loss': 0.2725, 'learning_rate': 3.148516106223425e-06, 'epoch': 1.5} {'loss': 0.2244, 'learning_rate': 3.148271382785293e-06, 'epoch': 1.5} {'loss': 0.2162, 'learning_rate': 3.1480266670814562e-06, 'epoch': 1.5} {'loss': 0.3909, 'learning_rate': 3.1477819591121985e-06, 'epoch': 1.5} {'loss': 0.2358, 'learning_rate': 3.1475372588777885e-06, 'epoch': 1.5} {'loss': 0.3722, 'learning_rate': 3.147292566378508e-06, 'epoch': 1.5} {'loss': 0.3746, 'learning_rate': 3.1470478816146288e-06, 'epoch': 1.5} {'loss': 0.22, 'learning_rate': 3.1468032045864325e-06, 'epoch': 1.5} {'loss': 0.3746, 'learning_rate': 3.1465585352941886e-06, 'epoch': 1.5} {'loss': 0.307, 'learning_rate': 3.1463138737381804e-06, 'epoch': 1.5} {'loss': 0.3326, 'learning_rate': 3.146069219918678e-06, 'epoch': 1.5} {'loss': 0.3233, 'learning_rate': 3.1458245738359628e-06, 'epoch': 1.5} {'loss': 0.4076, 'learning_rate': 3.1455799354903048e-06, 'epoch': 1.5} {'loss': 0.4028, 'learning_rate': 3.145335304881987e-06, 'epoch': 1.5} {'loss': 0.2327, 'learning_rate': 3.1450906820112813e-06, 'epoch': 1.5} {'loss': 0.275, 'learning_rate': 3.144846066878463e-06, 'epoch': 1.5} {'loss': 0.3523, 'learning_rate': 3.1446014594838128e-06, 'epoch': 1.5} {'loss': 0.3514, 'learning_rate': 3.1443568598275997e-06, 'epoch': 1.5} {'loss': 0.4334, 'learning_rate': 3.1441122679101045e-06, 'epoch': 1.5} {'loss': 0.2852, 'learning_rate': 3.143867683731603e-06, 'epoch': 1.5} {'loss': 0.4338, 'learning_rate': 3.143623107292375e-06, 'epoch': 1.5} {'loss': 0.2651, 'learning_rate': 3.143378538592692e-06, 'epoch': 1.5} {'loss': 0.425, 'learning_rate': 3.143133977632827e-06, 'epoch': 1.5} {'loss': 0.3172, 'learning_rate': 3.1428894244130647e-06, 'epoch': 1.5} {'loss': 0.3651, 'learning_rate': 3.1426448789336714e-06, 'epoch': 1.5} {'loss': 0.2267, 'learning_rate': 3.1424003411949324e-06, 'epoch': 1.5} {'loss': 0.3087, 'learning_rate': 3.1421558111971152e-06, 'epoch': 1.5} {'loss': 0.2796, 'learning_rate': 3.1419112889405045e-06, 'epoch': 1.5} {'loss': 0.2741, 'learning_rate': 3.141666774425367e-06, 'epoch': 1.5} {'loss': 0.284, 'learning_rate': 3.141422267651988e-06, 'epoch': 1.5} {'loss': 0.3527, 'learning_rate': 3.1411777686206358e-06, 'epoch': 1.5} {'loss': 0.5144, 'learning_rate': 3.1409332773315924e-06, 'epoch': 1.5} {'loss': 0.505, 'learning_rate': 3.140688793785128e-06, 'epoch': 1.5} {'loss': 0.3704, 'learning_rate': 3.1404443179815246e-06, 'epoch': 1.5} {'loss': 0.3285, 'learning_rate': 3.140199849921055e-06, 'epoch': 1.5} {'loss': 0.2212, 'learning_rate': 3.1399553896039924e-06, 'epoch': 1.5} {'loss': 0.2633, 'learning_rate': 3.139710937030619e-06, 'epoch': 1.5} {'loss': 0.2461, 'learning_rate': 3.139466492201204e-06, 'epoch': 1.5} {'loss': 0.341, 'learning_rate': 3.13922205511603e-06, 'epoch': 1.5} {'loss': 0.2289, 'learning_rate': 3.1389776257753667e-06, 'epoch': 1.5} {'loss': 0.5735, 'learning_rate': 3.138733204179496e-06, 'epoch': 1.5} {'loss': 0.3215, 'learning_rate': 3.1384887903286876e-06, 'epoch': 1.5} {'loss': 0.2441, 'learning_rate': 3.1382443842232236e-06, 'epoch': 1.5} {'loss': 0.4245, 'learning_rate': 3.1379999858633736e-06, 'epoch': 1.5} {'loss': 0.3404, 'learning_rate': 3.137755595249421e-06, 'epoch': 1.5} {'loss': 0.4345, 'learning_rate': 3.1375112123816333e-06, 'epoch': 1.5} {'loss': 0.186, 'learning_rate': 3.137266837260293e-06, 'epoch': 1.5} {'loss': 0.28, 'learning_rate': 3.1370224698856745e-06, 'epoch': 1.5} {'loss': 0.2389, 'learning_rate': 3.1367781102580488e-06, 'epoch': 1.5} {'loss': 0.3055, 'learning_rate': 3.136533758377699e-06, 'epoch': 1.5} {'loss': 0.2604, 'learning_rate': 3.136289414244894e-06, 'epoch': 1.5} {'loss': 0.2883, 'learning_rate': 3.1360450778599172e-06, 'epoch': 1.5} {'loss': 0.4279, 'learning_rate': 3.135800749223036e-06, 'epoch': 1.5} {'loss': 0.3713, 'learning_rate': 3.135556428334534e-06, 'epoch': 1.5} {'loss': 0.4213, 'learning_rate': 3.13531211519468e-06, 'epoch': 1.5} {'loss': 0.1845, 'learning_rate': 3.1350678098037566e-06, 'epoch': 1.5} {'loss': 0.4175, 'learning_rate': 3.134823512162033e-06, 'epoch': 1.5} {'loss': 0.3888, 'learning_rate': 3.1345792222697913e-06, 'epoch': 1.5} {'loss': 0.2766, 'learning_rate': 3.1343349401273018e-06, 'epoch': 1.5} {'loss': 0.2697, 'learning_rate': 3.134090665734845e-06, 'epoch': 1.5} {'loss': 0.3243, 'learning_rate': 3.1338463990926936e-06, 'epoch': 1.5} {'loss': 0.3819, 'learning_rate': 3.1336021402011217e-06, 'epoch': 1.5} {'loss': 0.2508, 'learning_rate': 3.133357889060411e-06, 'epoch': 1.5} {'loss': 0.2055, 'learning_rate': 3.133113645670829e-06, 'epoch': 1.5} {'loss': 0.3202, 'learning_rate': 3.1328694100326594e-06, 'epoch': 1.5} {'loss': 0.2834, 'learning_rate': 3.1326251821461716e-06, 'epoch': 1.5} {'loss': 0.4409, 'learning_rate': 3.1323809620116476e-06, 'epoch': 1.5} {'loss': 0.3616, 'learning_rate': 3.1321367496293555e-06, 'epoch': 1.5} {'loss': 0.3251, 'learning_rate': 3.1318925449995786e-06, 'epoch': 1.5} {'loss': 0.3898, 'learning_rate': 3.131648348122586e-06, 'epoch': 1.5} {'loss': 0.3167, 'learning_rate': 3.1314041589986597e-06, 'epoch': 1.5} {'loss': 0.2941, 'learning_rate': 3.1311599776280675e-06, 'epoch': 1.5} {'loss': 0.3227, 'learning_rate': 3.130915804011094e-06, 'epoch': 1.5} {'loss': 0.2903, 'learning_rate': 3.1306716381480107e-06, 'epoch': 1.5} {'loss': 0.2287, 'learning_rate': 3.1304274800390887e-06, 'epoch': 1.5} {'loss': 0.3272, 'learning_rate': 3.1301833296846107e-06, 'epoch': 1.5} {'loss': 0.3253, 'learning_rate': 3.129939187084847e-06, 'epoch': 1.5} {'loss': 0.2162, 'learning_rate': 3.129695052240078e-06, 'epoch': 1.5} {'loss': 0.29, 'learning_rate': 3.1294509251505745e-06, 'epoch': 1.5} {'loss': 0.3467, 'learning_rate': 3.129206805816617e-06, 'epoch': 1.5} {'loss': 0.2684, 'learning_rate': 3.1289626942384754e-06, 'epoch': 1.5} {'loss': 0.3464, 'learning_rate': 3.128718590416432e-06, 'epoch': 1.5} {'loss': 0.1886, 'learning_rate': 3.128474494350755e-06, 'epoch': 1.5} {'loss': 0.5134, 'learning_rate': 3.128230406041727e-06, 'epoch': 1.5} {'loss': 0.3986, 'learning_rate': 3.1279863254896158e-06, 'epoch': 1.5} {'loss': 0.4112, 'learning_rate': 3.1277422526947056e-06, 'epoch': 1.5} {'loss': 0.3538, 'learning_rate': 3.1274981876572675e-06, 'epoch': 1.5} {'loss': 0.3555, 'learning_rate': 3.1272541303775738e-06, 'epoch': 1.5} {'loss': 0.3041, 'learning_rate': 3.127010080855907e-06, 'epoch': 1.5} {'loss': 0.2677, 'learning_rate': 3.1267660390925346e-06, 'epoch': 1.5} {'loss': 0.2709, 'learning_rate': 3.126522005087741e-06, 'epoch': 1.5} {'loss': 0.2855, 'learning_rate': 3.126277978841792e-06, 'epoch': 1.5} {'loss': 0.371, 'learning_rate': 3.1260339603549726e-06, 'epoch': 1.5} {'loss': 0.3411, 'learning_rate': 3.1257899496275503e-06, 'epoch': 1.5} {'loss': 0.2603, 'learning_rate': 3.125545946659807e-06, 'epoch': 1.5} {'loss': 0.2748, 'learning_rate': 3.125301951452011e-06, 'epoch': 1.5} {'loss': 0.2968, 'learning_rate': 3.1250579640044464e-06, 'epoch': 1.5} {'loss': 0.4407, 'learning_rate': 3.12481398431738e-06, 'epoch': 1.5} {'loss': 0.1637, 'learning_rate': 3.1245700123910948e-06, 'epoch': 1.5} {'loss': 0.3192, 'learning_rate': 3.124326048225863e-06, 'epoch': 1.5} {'loss': 0.2582, 'learning_rate': 3.124082091821955e-06, 'epoch': 1.5} {'loss': 0.2642, 'learning_rate': 3.123838143179655e-06, 'epoch': 1.5} {'loss': 0.2077, 'learning_rate': 3.1235942022992317e-06, 'epoch': 1.5} {'loss': 0.3833, 'learning_rate': 3.1233502691809647e-06, 'epoch': 1.5} {'loss': 0.1525, 'learning_rate': 3.1231063438251253e-06, 'epoch': 1.5} {'loss': 0.2775, 'learning_rate': 3.122862426231994e-06, 'epoch': 1.5} {'loss': 0.3201, 'learning_rate': 3.1226185164018407e-06, 'epoch': 1.5} {'loss': 0.4167, 'learning_rate': 3.122374614334945e-06, 'epoch': 1.5} {'loss': 0.3664, 'learning_rate': 3.122130720031579e-06, 'epoch': 1.5} {'loss': 0.3982, 'learning_rate': 3.1218868334920217e-06, 'epoch': 1.5} {'loss': 0.298, 'learning_rate': 3.1216429547165438e-06, 'epoch': 1.5} {'loss': 0.3793, 'learning_rate': 3.121399083705425e-06, 'epoch': 1.5} {'loss': 0.3464, 'learning_rate': 3.1211552204589403e-06, 'epoch': 1.5} {'loss': 0.2935, 'learning_rate': 3.1209113649773593e-06, 'epoch': 1.5} {'loss': 0.3439, 'learning_rate': 3.1206675172609635e-06, 'epoch': 1.5} {'loss': 0.2869, 'learning_rate': 3.120423677310024e-06, 'epoch': 1.5} {'loss': 0.3178, 'learning_rate': 3.12017984512482e-06, 'epoch': 1.5} {'loss': 0.3603, 'learning_rate': 3.1199360207056197e-06, 'epoch': 1.5} {'loss': 0.1786, 'learning_rate': 3.119692204052709e-06, 'epoch': 1.5} {'loss': 0.3583, 'learning_rate': 3.1194483951663544e-06, 'epoch': 1.5} {'loss': 0.3594, 'learning_rate': 3.1192045940468376e-06, 'epoch': 1.5} {'loss': 0.3216, 'learning_rate': 3.1189608006944296e-06, 'epoch': 1.5} {'loss': 0.3024, 'learning_rate': 3.118717015109404e-06, 'epoch': 1.5} {'loss': 0.3112, 'learning_rate': 3.11847323729204e-06, 'epoch': 1.5} {'loss': 0.3249, 'learning_rate': 3.1182294672426096e-06, 'epoch': 1.5} {'loss': 0.2567, 'learning_rate': 3.1179857049613916e-06, 'epoch': 1.5} {'loss': 0.3879, 'learning_rate': 3.1177419504486574e-06, 'epoch': 1.5} {'loss': 0.2564, 'learning_rate': 3.1174982037046854e-06, 'epoch': 1.5} {'loss': 0.283, 'learning_rate': 3.1172544647297466e-06, 'epoch': 1.5} {'loss': 0.3735, 'learning_rate': 3.117010733524122e-06, 'epoch': 1.5} {'loss': 0.5043, 'learning_rate': 3.11676701008808e-06, 'epoch': 1.5} {'loss': 0.2119, 'learning_rate': 3.1165232944219026e-06, 'epoch': 1.5} {'loss': 0.2411, 'learning_rate': 3.1162795865258575e-06, 'epoch': 1.5} {'loss': 0.3387, 'learning_rate': 3.1160358864002284e-06, 'epoch': 1.5} {'loss': 0.3509, 'learning_rate': 3.115792194045284e-06, 'epoch': 1.5} {'loss': 0.3509, 'learning_rate': 3.115548509461299e-06, 'epoch': 1.5} {'loss': 0.5123, 'learning_rate': 3.1153048326485534e-06, 'epoch': 1.5} {'loss': 0.3545, 'learning_rate': 3.115061163607317e-06, 'epoch': 1.5} {'loss': 0.19, 'learning_rate': 3.11481750233787e-06, 'epoch': 1.5} {'loss': 0.1908, 'learning_rate': 3.114573848840481e-06, 'epoch': 1.5} {'loss': 0.2475, 'learning_rate': 3.114330203115433e-06, 'epoch': 1.5} {'loss': 0.3256, 'learning_rate': 3.1140865651629927e-06, 'epoch': 1.5} {'loss': 0.1465, 'learning_rate': 3.113842934983443e-06, 'epoch': 1.5} {'loss': 0.319, 'learning_rate': 3.1135993125770524e-06, 'epoch': 1.5} {'loss': 0.4062, 'learning_rate': 3.1133556979441015e-06, 'epoch': 1.5} {'loss': 0.4302, 'learning_rate': 3.113112091084859e-06, 'epoch': 1.5} {'loss': 0.3064, 'learning_rate': 3.1128684919996065e-06, 'epoch': 1.5} {'loss': 0.3704, 'learning_rate': 3.1126249006886155e-06, 'epoch': 1.5} {'loss': 0.188, 'learning_rate': 3.112381317152159e-06, 'epoch': 1.5} {'loss': 0.2708, 'learning_rate': 3.1121377413905176e-06, 'epoch': 1.5} {'loss': 0.315, 'learning_rate': 3.1118941734039586e-06, 'epoch': 1.5} {'loss': 0.2747, 'learning_rate': 3.111650613192765e-06, 'epoch': 1.5} {'loss': 0.318, 'learning_rate': 3.1114070607572044e-06, 'epoch': 1.5} {'loss': 0.295, 'learning_rate': 3.1111635160975593e-06, 'epoch': 1.5} {'loss': 0.4365, 'learning_rate': 3.1109199792140964e-06, 'epoch': 1.5} {'loss': 0.2949, 'learning_rate': 3.1106764501070985e-06, 'epoch': 1.5} {'loss': 0.3848, 'learning_rate': 3.110432928776834e-06, 'epoch': 1.5} {'loss': 0.3414, 'learning_rate': 3.1101894152235834e-06, 'epoch': 1.5} {'loss': 0.3693, 'learning_rate': 3.109945909447616e-06, 'epoch': 1.5} {'loss': 0.3908, 'learning_rate': 3.1097024114492125e-06, 'epoch': 1.5} {'loss': 0.2595, 'learning_rate': 3.1094589212286443e-06, 'epoch': 1.5} {'loss': 0.3086, 'learning_rate': 3.109215438786184e-06, 'epoch': 1.5} {'loss': 0.2837, 'learning_rate': 3.108971964122112e-06, 'epoch': 1.5} {'loss': 0.3727, 'learning_rate': 3.108728497236697e-06, 'epoch': 1.5} {'loss': 0.2201, 'learning_rate': 3.1084850381302213e-06, 'epoch': 1.5} {'loss': 0.3946, 'learning_rate': 3.1082415868029504e-06, 'epoch': 1.5} {'loss': 0.3124, 'learning_rate': 3.1079981432551685e-06, 'epoch': 1.5} {'loss': 0.3007, 'learning_rate': 3.1077547074871437e-06, 'epoch': 1.5} {'loss': 0.4151, 'learning_rate': 3.107511279499156e-06, 'epoch': 1.5} {'loss': 0.3599, 'learning_rate': 3.107267859291473e-06, 'epoch': 1.5} {'loss': 0.3113, 'learning_rate': 3.1070244468643785e-06, 'epoch': 1.5} {'loss': 0.4484, 'learning_rate': 3.1067810422181386e-06, 'epoch': 1.5} {'loss': 0.3087, 'learning_rate': 3.1065376453530348e-06, 'epoch': 1.5} {'loss': 0.3051, 'learning_rate': 3.106294256269341e-06, 'epoch': 1.5} {'loss': 0.3182, 'learning_rate': 3.1060508749673257e-06, 'epoch': 1.5} {'loss': 0.3073, 'learning_rate': 3.105807501447271e-06, 'epoch': 1.5} {'loss': 0.4634, 'learning_rate': 3.1055641357094456e-06, 'epoch': 1.5} {'loss': 0.3918, 'learning_rate': 3.1053207777541304e-06, 'epoch': 1.5} {'loss': 0.2588, 'learning_rate': 3.105077427581594e-06, 'epoch': 1.5} {'loss': 0.3954, 'learning_rate': 3.104834085192118e-06, 'epoch': 1.5} {'loss': 0.3624, 'learning_rate': 3.1045907505859685e-06, 'epoch': 1.5} {'loss': 0.2107, 'learning_rate': 3.1043474237634285e-06, 'epoch': 1.5} {'loss': 0.4018, 'learning_rate': 3.104104104724767e-06, 'epoch': 1.5} {'loss': 0.3439, 'learning_rate': 3.1038607934702625e-06, 'epoch': 1.5} {'loss': 0.1781, 'learning_rate': 3.1036174900001846e-06, 'epoch': 1.5} {'loss': 0.2538, 'learning_rate': 3.103374194314814e-06, 'epoch': 1.5} {'loss': 0.279, 'learning_rate': 3.1031309064144232e-06, 'epoch': 1.5} {'loss': 0.2914, 'learning_rate': 3.1028876262992836e-06, 'epoch': 1.5} {'loss': 0.2794, 'learning_rate': 3.102644353969675e-06, 'epoch': 1.5} {'loss': 0.263, 'learning_rate': 3.102401089425865e-06, 'epoch': 1.5} {'loss': 0.2505, 'learning_rate': 3.1021578326681367e-06, 'epoch': 1.5} {'loss': 0.3002, 'learning_rate': 3.101914583696758e-06, 'epoch': 1.5} {'loss': 0.2571, 'learning_rate': 3.101671342512008e-06, 'epoch': 1.5} {'loss': 0.3053, 'learning_rate': 3.101428109114156e-06, 'epoch': 1.5} {'loss': 0.3328, 'learning_rate': 3.101184883503484e-06, 'epoch': 1.5} {'loss': 0.3298, 'learning_rate': 3.1009416656802594e-06, 'epoch': 1.5} {'loss': 0.1929, 'learning_rate': 3.1006984556447617e-06, 'epoch': 1.5} {'loss': 0.3216, 'learning_rate': 3.100455253397261e-06, 'epoch': 1.5} {'loss': 0.2401, 'learning_rate': 3.1002120589380368e-06, 'epoch': 1.5} {'loss': 0.2795, 'learning_rate': 3.0999688722673627e-06, 'epoch': 1.5} {'loss': 0.3592, 'learning_rate': 3.099725693385507e-06, 'epoch': 1.5} {'loss': 0.4777, 'learning_rate': 3.099482522292753e-06, 'epoch': 1.5} {'loss': 0.2631, 'learning_rate': 3.0992393589893664e-06, 'epoch': 1.5} {'loss': 0.3011, 'learning_rate': 3.0989962034756316e-06, 'epoch': 1.5} {'loss': 0.4096, 'learning_rate': 3.0987530557518133e-06, 'epoch': 1.5} {'loss': 0.2974, 'learning_rate': 3.098509915818193e-06, 'epoch': 1.5} {'loss': 0.2942, 'learning_rate': 3.098266783675041e-06, 'epoch': 1.5} {'loss': 0.1483, 'learning_rate': 3.0980236593226355e-06, 'epoch': 1.5} {'loss': 0.3435, 'learning_rate': 3.097780542761246e-06, 'epoch': 1.5} {'loss': 0.2449, 'learning_rate': 3.0975374339911536e-06, 'epoch': 1.5} {'loss': 0.3253, 'learning_rate': 3.0972943330126247e-06, 'epoch': 1.5} {'loss': 0.3781, 'learning_rate': 3.097051239825941e-06, 'epoch': 1.5} {'loss': 0.2707, 'learning_rate': 3.0968081544313743e-06, 'epoch': 1.5} {'loss': 0.3503, 'learning_rate': 3.0965650768291954e-06, 'epoch': 1.5} {'loss': 0.2817, 'learning_rate': 3.0963220070196844e-06, 'epoch': 1.5} {'loss': 0.3565, 'learning_rate': 3.0960789450031104e-06, 'epoch': 1.5} {'loss': 0.4104, 'learning_rate': 3.09583589077975e-06, 'epoch': 1.5} {'loss': 0.3042, 'learning_rate': 3.0955928443498783e-06, 'epoch': 1.5} {'loss': 0.2563, 'learning_rate': 3.095349805713773e-06, 'epoch': 1.5} {'loss': 0.2417, 'learning_rate': 3.0951067748717032e-06, 'epoch': 1.5} {'loss': 0.252, 'learning_rate': 3.0948637518239434e-06, 'epoch': 1.5} {'loss': 0.3164, 'learning_rate': 3.0946207365707713e-06, 'epoch': 1.5} {'loss': 0.222, 'learning_rate': 3.0943777291124576e-06, 'epoch': 1.5} {'loss': 0.3259, 'learning_rate': 3.0941347294492797e-06, 'epoch': 1.5} {'loss': 0.3503, 'learning_rate': 3.093891737581508e-06, 'epoch': 1.5} {'loss': 0.2895, 'learning_rate': 3.093648753509423e-06, 'epoch': 1.5} {'loss': 0.2467, 'learning_rate': 3.0934057772332915e-06, 'epoch': 1.5} {'loss': 0.3139, 'learning_rate': 3.093162808753395e-06, 'epoch': 1.5} {'loss': 0.3759, 'learning_rate': 3.0929198480700006e-06, 'epoch': 1.5} {'loss': 0.4714, 'learning_rate': 3.0926768951833896e-06, 'epoch': 1.5} {'loss': 0.4765, 'learning_rate': 3.0924339500938304e-06, 'epoch': 1.5} {'loss': 0.3861, 'learning_rate': 3.092191012801602e-06, 'epoch': 1.5} {'loss': 0.2776, 'learning_rate': 3.091948083306977e-06, 'epoch': 1.5} {'loss': 0.2509, 'learning_rate': 3.0917051616102258e-06, 'epoch': 1.5} {'loss': 0.3331, 'learning_rate': 3.0914622477116287e-06, 'epoch': 1.5} {'loss': 0.2727, 'learning_rate': 3.0912193416114544e-06, 'epoch': 1.5} {'loss': 0.2424, 'learning_rate': 3.090976443309982e-06, 'epoch': 1.5} {'loss': 0.2778, 'learning_rate': 3.09073355280748e-06, 'epoch': 1.5} {'loss': 0.3133, 'learning_rate': 3.0904906701042305e-06, 'epoch': 1.5} {'loss': 0.3205, 'learning_rate': 3.0902477952004985e-06, 'epoch': 1.5} {'loss': 0.4546, 'learning_rate': 3.090004928096567e-06, 'epoch': 1.5} {'loss': 0.2581, 'learning_rate': 3.0897620687927022e-06, 'epoch': 1.5} {'loss': 0.2198, 'learning_rate': 3.089519217289185e-06, 'epoch': 1.5} {'loss': 0.2366, 'learning_rate': 3.089276373586284e-06, 'epoch': 1.5} {'loss': 0.1629, 'learning_rate': 3.0890335376842785e-06, 'epoch': 1.5} {'loss': 0.3224, 'learning_rate': 3.08879070958344e-06, 'epoch': 1.5} {'loss': 0.3771, 'learning_rate': 3.0885478892840403e-06, 'epoch': 1.5} {'loss': 0.3609, 'learning_rate': 3.0883050767863578e-06, 'epoch': 1.5} {'loss': 0.3075, 'learning_rate': 3.088062272090662e-06, 'epoch': 1.5} {'loss': 0.3845, 'learning_rate': 3.0878194751972324e-06, 'epoch': 1.5} {'loss': 0.2343, 'learning_rate': 3.087576686106337e-06, 'epoch': 1.5} {'loss': 0.3109, 'learning_rate': 3.087333904818256e-06, 'epoch': 1.5} {'loss': 0.368, 'learning_rate': 3.0870911313332572e-06, 'epoch': 1.5} {'loss': 0.3856, 'learning_rate': 3.0868483656516223e-06, 'epoch': 1.5} {'loss': 0.2683, 'learning_rate': 3.086605607773617e-06, 'epoch': 1.5} {'loss': 0.3564, 'learning_rate': 3.086362857699523e-06, 'epoch': 1.5} {'loss': 0.28, 'learning_rate': 3.0861201154296073e-06, 'epoch': 1.5} {'loss': 0.19, 'learning_rate': 3.0858773809641497e-06, 'epoch': 1.5} {'loss': 0.258, 'learning_rate': 3.0856346543034223e-06, 'epoch': 1.5} {'loss': 0.3036, 'learning_rate': 3.0853919354476957e-06, 'epoch': 1.5} {'loss': 0.2305, 'learning_rate': 3.0851492243972493e-06, 'epoch': 1.5} {'loss': 0.3598, 'learning_rate': 3.084906521152352e-06, 'epoch': 1.5} {'loss': 0.4543, 'learning_rate': 3.0846638257132833e-06, 'epoch': 1.5} {'loss': 0.327, 'learning_rate': 3.08442113808031e-06, 'epoch': 1.5} {'loss': 0.2775, 'learning_rate': 3.084178458253714e-06, 'epoch': 1.5} {'loss': 0.2182, 'learning_rate': 3.0839357862337627e-06, 'epoch': 1.5} {'loss': 0.2699, 'learning_rate': 3.0836931220207354e-06, 'epoch': 1.5} {'loss': 0.3325, 'learning_rate': 3.0834504656149e-06, 'epoch': 1.5} {'loss': 0.1268, 'learning_rate': 3.083207817016537e-06, 'epoch': 1.5} {'loss': 0.4246, 'learning_rate': 3.082965176225915e-06, 'epoch': 1.5} {'loss': 0.3618, 'learning_rate': 3.0827225432433118e-06, 'epoch': 1.5} {'loss': 0.3059, 'learning_rate': 3.082479918069e-06, 'epoch': 1.5} {'loss': 0.3048, 'learning_rate': 3.08223730070325e-06, 'epoch': 1.5} {'loss': 0.2518, 'learning_rate': 3.0819946911463417e-06, 'epoch': 1.5} {'loss': 0.2826, 'learning_rate': 3.081752089398542e-06, 'epoch': 1.5} {'loss': 0.4466, 'learning_rate': 3.081509495460133e-06, 'epoch': 1.5} {'loss': 0.3295, 'learning_rate': 3.08126690933138e-06, 'epoch': 1.5} {'loss': 0.3165, 'learning_rate': 3.081024331012564e-06, 'epoch': 1.5} {'loss': 0.2552, 'learning_rate': 3.080781760503954e-06, 'epoch': 1.5} {'loss': 0.3589, 'learning_rate': 3.0805391978058275e-06, 'epoch': 1.5} {'loss': 0.2999, 'learning_rate': 3.0802966429184546e-06, 'epoch': 1.5} {'loss': 0.3954, 'learning_rate': 3.0800540958421134e-06, 'epoch': 1.5} {'loss': 0.3576, 'learning_rate': 3.0798115565770714e-06, 'epoch': 1.5} {'loss': 0.3821, 'learning_rate': 3.07956902512361e-06, 'epoch': 1.5} {'loss': 0.3337, 'learning_rate': 3.0793265014819963e-06, 'epoch': 1.5} {'loss': 0.2877, 'learning_rate': 3.079083985652509e-06, 'epoch': 1.5} {'loss': 0.3745, 'learning_rate': 3.0788414776354213e-06, 'epoch': 1.5} {'loss': 0.216, 'learning_rate': 3.078598977431001e-06, 'epoch': 1.5} {'loss': 0.329, 'learning_rate': 3.078356485039531e-06, 'epoch': 1.5} {'loss': 0.2854, 'learning_rate': 3.0781140004612753e-06, 'epoch': 1.5} {'loss': 0.3845, 'learning_rate': 3.0778715236965172e-06, 'epoch': 1.5} {'loss': 0.3019, 'learning_rate': 3.077629054745522e-06, 'epoch': 1.5} {'loss': 0.3541, 'learning_rate': 3.0773865936085702e-06, 'epoch': 1.5} {'loss': 0.4134, 'learning_rate': 3.07714414028593e-06, 'epoch': 1.5} {'loss': 0.3835, 'learning_rate': 3.076901694777881e-06, 'epoch': 1.5} {'loss': 0.384, 'learning_rate': 3.0766592570846898e-06, 'epoch': 1.5} {'loss': 0.3389, 'learning_rate': 3.0764168272066363e-06, 'epoch': 1.5} {'loss': 0.3402, 'learning_rate': 3.07617440514399e-06, 'epoch': 1.5} {'loss': 0.3597, 'learning_rate': 3.0759319908970285e-06, 'epoch': 1.5} {'loss': 0.41, 'learning_rate': 3.0756895844660227e-06, 'epoch': 1.5} {'loss': 0.2412, 'learning_rate': 3.0754471858512437e-06, 'epoch': 1.5} {'loss': 0.3223, 'learning_rate': 3.0752047950529717e-06, 'epoch': 1.5} {'loss': 0.3053, 'learning_rate': 3.074962412071473e-06, 'epoch': 1.5} {'loss': 0.2445, 'learning_rate': 3.0747200369070285e-06, 'epoch': 1.5} {'loss': 0.2682, 'learning_rate': 3.074477669559904e-06, 'epoch': 1.5} {'loss': 0.4756, 'learning_rate': 3.0742353100303823e-06, 'epoch': 1.5} {'loss': 0.3568, 'learning_rate': 3.0739929583187277e-06, 'epoch': 1.5} {'loss': 0.3166, 'learning_rate': 3.0737506144252206e-06, 'epoch': 1.5} {'loss': 0.2093, 'learning_rate': 3.07350827835013e-06, 'epoch': 1.5} {'loss': 0.2094, 'learning_rate': 3.0732659500937333e-06, 'epoch': 1.5} {'loss': 0.4204, 'learning_rate': 3.0730236296563e-06, 'epoch': 1.5} {'loss': 0.4486, 'learning_rate': 3.0727813170381084e-06, 'epoch': 1.5} {'loss': 0.287, 'learning_rate': 3.0725390122394294e-06, 'epoch': 1.5} {'loss': 0.3474, 'learning_rate': 3.0722967152605345e-06, 'epoch': 1.5} {'loss': 0.3455, 'learning_rate': 3.0720544261017014e-06, 'epoch': 1.5} {'loss': 0.2862, 'learning_rate': 3.0718121447631953e-06, 'epoch': 1.5} {'loss': 0.4665, 'learning_rate': 3.071569871245301e-06, 'epoch': 1.5} {'loss': 0.276, 'learning_rate': 3.0713276055482855e-06, 'epoch': 1.5} {'loss': 0.2682, 'learning_rate': 3.0710853476724256e-06, 'epoch': 1.5} {'loss': 0.3341, 'learning_rate': 3.070843097617994e-06, 'epoch': 1.5} {'loss': 0.4172, 'learning_rate': 3.0706008553852582e-06, 'epoch': 1.5} {'loss': 0.3261, 'learning_rate': 3.0703586209745005e-06, 'epoch': 1.5} {'loss': 0.3336, 'learning_rate': 3.070116394385987e-06, 'epoch': 1.5} {'loss': 0.2849, 'learning_rate': 3.069874175619997e-06, 'epoch': 1.5} {'loss': 0.3938, 'learning_rate': 3.069631964676798e-06, 'epoch': 1.5} {'loss': 0.2621, 'learning_rate': 3.0693897615566703e-06, 'epoch': 1.5} {'loss': 0.153, 'learning_rate': 3.0691475662598802e-06, 'epoch': 1.5} {'loss': 0.4022, 'learning_rate': 3.0689053787867075e-06, 'epoch': 1.5} {'loss': 0.2404, 'learning_rate': 3.0686631991374205e-06, 'epoch': 1.5} {'loss': 0.3931, 'learning_rate': 3.068421027312297e-06, 'epoch': 1.5} {'loss': 0.3386, 'learning_rate': 3.068178863311605e-06, 'epoch': 1.5} {'loss': 0.261, 'learning_rate': 3.0679367071356237e-06, 'epoch': 1.5} {'loss': 0.2588, 'learning_rate': 3.0676945587846242e-06, 'epoch': 1.5} {'loss': 0.3782, 'learning_rate': 3.067452418258876e-06, 'epoch': 1.5} {'loss': 0.4006, 'learning_rate': 3.0672102855586584e-06, 'epoch': 1.5} {'loss': 0.4105, 'learning_rate': 3.0669681606842393e-06, 'epoch': 1.5} {'loss': 0.2643, 'learning_rate': 3.066726043635898e-06, 'epoch': 1.5} {'loss': 0.2791, 'learning_rate': 3.066483934413902e-06, 'epoch': 1.5} {'loss': 0.2223, 'learning_rate': 3.0662418330185297e-06, 'epoch': 1.5} {'loss': 0.2867, 'learning_rate': 3.0659997394500485e-06, 'epoch': 1.5} {'loss': 0.4217, 'learning_rate': 3.0657576537087387e-06, 'epoch': 1.5} {'loss': 0.2637, 'learning_rate': 3.0655155757948663e-06, 'epoch': 1.5} {'loss': 0.2369, 'learning_rate': 3.0652735057087112e-06, 'epoch': 1.5} {'loss': 0.4025, 'learning_rate': 3.0650314434505403e-06, 'epoch': 1.5} {'loss': 0.264, 'learning_rate': 3.0647893890206335e-06, 'epoch': 1.5} {'loss': 0.2903, 'learning_rate': 3.064547342419262e-06, 'epoch': 1.5} {'loss': 0.3364, 'learning_rate': 3.064305303646693e-06, 'epoch': 1.5} {'loss': 0.2301, 'learning_rate': 3.0640632727032082e-06, 'epoch': 1.5} {'loss': 0.4101, 'learning_rate': 3.063821249589074e-06, 'epoch': 1.5} {'loss': 0.1513, 'learning_rate': 3.063579234304569e-06, 'epoch': 1.5} {'loss': 0.2685, 'learning_rate': 3.0633372268499617e-06, 'epoch': 1.5} {'loss': 0.3377, 'learning_rate': 3.063095227225531e-06, 'epoch': 1.5} {'loss': 0.3766, 'learning_rate': 3.062853235431542e-06, 'epoch': 1.5} {'loss': 0.3896, 'learning_rate': 3.062611251468277e-06, 'epoch': 1.5} {'loss': 0.2249, 'learning_rate': 3.062369275336001e-06, 'epoch': 1.5} {'loss': 0.2763, 'learning_rate': 3.0621273070349942e-06, 'epoch': 1.5} {'loss': 0.3859, 'learning_rate': 3.061885346565524e-06, 'epoch': 1.5} {'loss': 0.4063, 'learning_rate': 3.0616433939278676e-06, 'epoch': 1.5} {'loss': 0.3311, 'learning_rate': 3.0614014491222977e-06, 'epoch': 1.5} {'loss': 0.3361, 'learning_rate': 3.061159512149082e-06, 'epoch': 1.5} {'loss': 0.3063, 'learning_rate': 3.0609175830085014e-06, 'epoch': 1.5} {'loss': 0.3299, 'learning_rate': 3.0606756617008214e-06, 'epoch': 1.5} {'loss': 0.3285, 'learning_rate': 3.0604337482263234e-06, 'epoch': 1.5} {'loss': 0.3463, 'learning_rate': 3.060191842585273e-06, 'epoch': 1.5} {'loss': 0.269, 'learning_rate': 3.059949944777948e-06, 'epoch': 1.5} {'loss': 0.3555, 'learning_rate': 3.0597080548046177e-06, 'epoch': 1.5} {'loss': 0.2253, 'learning_rate': 3.0594661726655606e-06, 'epoch': 1.5} {'loss': 0.438, 'learning_rate': 3.059224298361042e-06, 'epoch': 1.5} {'loss': 0.3131, 'learning_rate': 3.058982431891343e-06, 'epoch': 1.5} {'loss': 0.3406, 'learning_rate': 3.058740573256731e-06, 'epoch': 1.5} {'loss': 0.4121, 'learning_rate': 3.0584987224574823e-06, 'epoch': 1.5} {'loss': 0.357, 'learning_rate': 3.0582568794938693e-06, 'epoch': 1.5} {'loss': 0.4139, 'learning_rate': 3.0580150443661615e-06, 'epoch': 1.5} {'loss': 0.2283, 'learning_rate': 3.057773217074638e-06, 'epoch': 1.5} {'loss': 0.4779, 'learning_rate': 3.057531397619564e-06, 'epoch': 1.5} {'loss': 0.437, 'learning_rate': 3.057289586001222e-06, 'epoch': 1.5} {'loss': 0.2022, 'learning_rate': 3.0570477822198754e-06, 'epoch': 1.5} {'loss': 0.249, 'learning_rate': 3.056805986275805e-06, 'epoch': 1.5} {'loss': 0.2415, 'learning_rate': 3.056564198169276e-06, 'epoch': 1.5} {'loss': 0.3524, 'learning_rate': 3.0563224179005703e-06, 'epoch': 1.5} {'loss': 0.3672, 'learning_rate': 3.056080645469952e-06, 'epoch': 1.5} {'loss': 0.2401, 'learning_rate': 3.0558388808777028e-06, 'epoch': 1.5} {'loss': 0.345, 'learning_rate': 3.0555971241240867e-06, 'epoch': 1.5} {'loss': 0.3998, 'learning_rate': 3.0553553752093844e-06, 'epoch': 1.5} {'loss': 0.3664, 'learning_rate': 3.055113634133865e-06, 'epoch': 1.5} {'loss': 0.2739, 'learning_rate': 3.054871900897799e-06, 'epoch': 1.5} {'loss': 0.4808, 'learning_rate': 3.054630175501465e-06, 'epoch': 1.5} {'loss': 0.4739, 'learning_rate': 3.054388457945129e-06, 'epoch': 1.5} {'loss': 0.291, 'learning_rate': 3.054146748229071e-06, 'epoch': 1.5} {'loss': 0.3302, 'learning_rate': 3.053905046353558e-06, 'epoch': 1.5} {'loss': 0.2496, 'learning_rate': 3.0536633523188686e-06, 'epoch': 1.5} {'loss': 0.2986, 'learning_rate': 3.053421666125268e-06, 'epoch': 1.5} {'loss': 0.3918, 'learning_rate': 3.0531799877730385e-06, 'epoch': 1.5} {'loss': 0.2979, 'learning_rate': 3.0529383172624426e-06, 'epoch': 1.5} {'loss': 0.343, 'learning_rate': 3.0526966545937633e-06, 'epoch': 1.5} {'loss': 0.3182, 'learning_rate': 3.0524549997672635e-06, 'epoch': 1.5} {'loss': 0.4195, 'learning_rate': 3.0522133527832254e-06, 'epoch': 1.5} {'loss': 0.3772, 'learning_rate': 3.051971713641916e-06, 'epoch': 1.5} {'loss': 0.2881, 'learning_rate': 3.051730082343607e-06, 'epoch': 1.5} {'loss': 0.5497, 'learning_rate': 3.0514884588885763e-06, 'epoch': 1.5} {'loss': 0.2612, 'learning_rate': 3.05124684327709e-06, 'epoch': 1.5} {'loss': 0.3909, 'learning_rate': 3.051005235509429e-06, 'epoch': 1.5} {'loss': 0.3274, 'learning_rate': 3.0507636355858584e-06, 'epoch': 1.51} {'loss': 0.4212, 'learning_rate': 3.0505220435066573e-06, 'epoch': 1.51} {'loss': 0.2535, 'learning_rate': 3.0502804592720913e-06, 'epoch': 1.51} {'loss': 0.3838, 'learning_rate': 3.0500388828824413e-06, 'epoch': 1.51} {'loss': 0.2558, 'learning_rate': 3.0497973143379723e-06, 'epoch': 1.51} {'loss': 0.1264, 'learning_rate': 3.049555753638963e-06, 'epoch': 1.51} {'loss': 0.3049, 'learning_rate': 3.049314200785681e-06, 'epoch': 1.51} {'loss': 0.3229, 'learning_rate': 3.0490726557784044e-06, 'epoch': 1.51} {'loss': 0.3827, 'learning_rate': 3.0488311186174035e-06, 'epoch': 1.51} {'loss': 0.3089, 'learning_rate': 3.048589589302947e-06, 'epoch': 1.51} {'loss': 0.3937, 'learning_rate': 3.048348067835314e-06, 'epoch': 1.51} {'loss': 0.2817, 'learning_rate': 3.0481065542147715e-06, 'epoch': 1.51} {'loss': 0.3433, 'learning_rate': 3.047865048441597e-06, 'epoch': 1.51} {'loss': 0.1801, 'learning_rate': 3.0476235505160556e-06, 'epoch': 1.51} {'loss': 0.3111, 'learning_rate': 3.0473820604384306e-06, 'epoch': 1.51} {'loss': 0.2784, 'learning_rate': 3.0471405782089868e-06, 'epoch': 1.51} {'loss': 0.2575, 'learning_rate': 3.0468991038280016e-06, 'epoch': 1.51} {'loss': 0.3743, 'learning_rate': 3.0466576372957457e-06, 'epoch': 1.51} {'loss': 0.2319, 'learning_rate': 3.0464161786124868e-06, 'epoch': 1.51} {'loss': 0.373, 'learning_rate': 3.046174727778506e-06, 'epoch': 1.51} {'loss': 0.2643, 'learning_rate': 3.045933284794068e-06, 'epoch': 1.51} {'loss': 0.2641, 'learning_rate': 3.0456918496594523e-06, 'epoch': 1.51} {'loss': 0.2325, 'learning_rate': 3.045450422374925e-06, 'epoch': 1.51} {'loss': 0.3027, 'learning_rate': 3.0452090029407643e-06, 'epoch': 1.51} {'loss': 0.2936, 'learning_rate': 3.0449675913572373e-06, 'epoch': 1.51} {'loss': 0.2767, 'learning_rate': 3.0447261876246225e-06, 'epoch': 1.51} {'loss': 0.283, 'learning_rate': 3.0444847917431865e-06, 'epoch': 1.51} {'loss': 0.1614, 'learning_rate': 3.0442434037132073e-06, 'epoch': 1.51} {'loss': 0.2155, 'learning_rate': 3.044002023534952e-06, 'epoch': 1.51} {'loss': 0.2443, 'learning_rate': 3.043760651208698e-06, 'epoch': 1.51} {'loss': 0.3286, 'learning_rate': 3.043519286734715e-06, 'epoch': 1.51} {'loss': 0.2197, 'learning_rate': 3.043277930113274e-06, 'epoch': 1.51} {'loss': 0.2252, 'learning_rate': 3.0430365813446517e-06, 'epoch': 1.51} {'loss': 0.2741, 'learning_rate': 3.042795240429115e-06, 'epoch': 1.51} {'loss': 0.2606, 'learning_rate': 3.042553907366943e-06, 'epoch': 1.51} {'loss': 0.286, 'learning_rate': 3.042312582158402e-06, 'epoch': 1.51} {'loss': 0.3547, 'learning_rate': 3.04207126480377e-06, 'epoch': 1.51} {'loss': 0.189, 'learning_rate': 3.0418299553033125e-06, 'epoch': 1.51} {'loss': 0.4059, 'learning_rate': 3.041588653657309e-06, 'epoch': 1.51} {'loss': 0.3997, 'learning_rate': 3.041347359866026e-06, 'epoch': 1.51} {'loss': 0.4515, 'learning_rate': 3.0411060739297414e-06, 'epoch': 1.51} {'loss': 0.3353, 'learning_rate': 3.0408647958487214e-06, 'epoch': 1.51} {'loss': 0.3314, 'learning_rate': 3.0406235256232454e-06, 'epoch': 1.51} {'loss': 0.3978, 'learning_rate': 3.0403822632535816e-06, 'epoch': 1.51} {'loss': 0.3377, 'learning_rate': 3.0401410087400006e-06, 'epoch': 1.51} {'loss': 0.1732, 'learning_rate': 3.0398997620827798e-06, 'epoch': 1.51} {'loss': 0.2372, 'learning_rate': 3.039658523282185e-06, 'epoch': 1.51} {'loss': 0.2078, 'learning_rate': 3.0394172923384944e-06, 'epoch': 1.51} {'loss': 0.2153, 'learning_rate': 3.0391760692519766e-06, 'epoch': 1.51} {'loss': 0.4495, 'learning_rate': 3.038934854022908e-06, 'epoch': 1.51} {'loss': 0.2893, 'learning_rate': 3.038693646651555e-06, 'epoch': 1.51} {'loss': 0.3995, 'learning_rate': 3.038452447138196e-06, 'epoch': 1.51} {'loss': 0.154, 'learning_rate': 3.038211255483098e-06, 'epoch': 1.51} {'loss': 0.3091, 'learning_rate': 3.037970071686538e-06, 'epoch': 1.51} {'loss': 0.3387, 'learning_rate': 3.0377288957487827e-06, 'epoch': 1.51} {'loss': 0.2635, 'learning_rate': 3.037487727670111e-06, 'epoch': 1.51} {'loss': 0.3973, 'learning_rate': 3.0372465674507913e-06, 'epoch': 1.51} {'loss': 0.2531, 'learning_rate': 3.037005415091093e-06, 'epoch': 1.51} {'loss': 0.2677, 'learning_rate': 3.036764270591296e-06, 'epoch': 1.51} {'loss': 0.3267, 'learning_rate': 3.036523133951663e-06, 'epoch': 1.51} {'loss': 0.2589, 'learning_rate': 3.036282005172476e-06, 'epoch': 1.51} {'loss': 0.4122, 'learning_rate': 3.036040884253999e-06, 'epoch': 1.51} {'loss': 0.2939, 'learning_rate': 3.0357997711965094e-06, 'epoch': 1.51} {'loss': 0.2747, 'learning_rate': 3.0355586660002757e-06, 'epoch': 1.51} {'loss': 0.2663, 'learning_rate': 3.0353175686655745e-06, 'epoch': 1.51} {'loss': 0.301, 'learning_rate': 3.0350764791926723e-06, 'epoch': 1.51} {'loss': 0.3113, 'learning_rate': 3.034835397581848e-06, 'epoch': 1.51} {'loss': 0.2209, 'learning_rate': 3.0345943238333665e-06, 'epoch': 1.51} {'loss': 0.272, 'learning_rate': 3.0343532579475066e-06, 'epoch': 1.51} {'loss': 0.4346, 'learning_rate': 3.034112199924537e-06, 'epoch': 1.51} {'loss': 0.2538, 'learning_rate': 3.0338711497647265e-06, 'epoch': 1.51} {'loss': 0.3562, 'learning_rate': 3.033630107468355e-06, 'epoch': 1.51} {'loss': 0.3518, 'learning_rate': 3.0333890730356873e-06, 'epoch': 1.51} {'loss': 0.2598, 'learning_rate': 3.0331480464670017e-06, 'epoch': 1.51} {'loss': 0.3027, 'learning_rate': 3.0329070277625626e-06, 'epoch': 1.51} {'loss': 0.229, 'learning_rate': 3.032666016922652e-06, 'epoch': 1.51} {'loss': 0.2668, 'learning_rate': 3.032425013947532e-06, 'epoch': 1.51} {'loss': 0.3235, 'learning_rate': 3.032184018837482e-06, 'epoch': 1.51} {'loss': 0.2414, 'learning_rate': 3.031943031592769e-06, 'epoch': 1.51} {'loss': 0.3645, 'learning_rate': 3.03170205221367e-06, 'epoch': 1.51} {'loss': 0.3179, 'learning_rate': 3.031461080700451e-06, 'epoch': 1.51} {'loss': 0.2046, 'learning_rate': 3.0312201170533905e-06, 'epoch': 1.51} {'loss': 0.3496, 'learning_rate': 3.030979161272758e-06, 'epoch': 1.51} {'loss': 0.3749, 'learning_rate': 3.0307382133588214e-06, 'epoch': 1.51} {'loss': 0.3886, 'learning_rate': 3.0304972733118587e-06, 'epoch': 1.51} {'loss': 0.3944, 'learning_rate': 3.0302563411321362e-06, 'epoch': 1.51} {'loss': 0.2386, 'learning_rate': 3.0300154168199324e-06, 'epoch': 1.51} {'loss': 0.1817, 'learning_rate': 3.029774500375513e-06, 'epoch': 1.51} {'loss': 0.2233, 'learning_rate': 3.029533591799155e-06, 'epoch': 1.51} {'loss': 0.2326, 'learning_rate': 3.0292926910911257e-06, 'epoch': 1.51} {'loss': 0.2709, 'learning_rate': 3.029051798251702e-06, 'epoch': 1.51} {'loss': 0.2598, 'learning_rate': 3.0288109132811504e-06, 'epoch': 1.51} {'loss': 0.3036, 'learning_rate': 3.0285700361797487e-06, 'epoch': 1.51} {'loss': 0.3288, 'learning_rate': 3.028329166947762e-06, 'epoch': 1.51} {'loss': 0.3535, 'learning_rate': 3.0280883055854705e-06, 'epoch': 1.51} {'loss': 0.3458, 'learning_rate': 3.0278474520931412e-06, 'epoch': 1.51} {'loss': 0.1409, 'learning_rate': 3.027606606471042e-06, 'epoch': 1.51} {'loss': 0.3659, 'learning_rate': 3.0273657687194536e-06, 'epoch': 1.51} {'loss': 0.3861, 'learning_rate': 3.027124938838639e-06, 'epoch': 1.51} {'loss': 0.2654, 'learning_rate': 3.026884116828878e-06, 'epoch': 1.51} {'loss': 0.2442, 'learning_rate': 3.026643302690436e-06, 'epoch': 1.51} {'loss': 0.266, 'learning_rate': 3.0264024964235907e-06, 'epoch': 1.51} {'loss': 0.3207, 'learning_rate': 3.026161698028607e-06, 'epoch': 1.51} {'loss': 0.2166, 'learning_rate': 3.025920907505765e-06, 'epoch': 1.51} {'loss': 0.5281, 'learning_rate': 3.025680124855328e-06, 'epoch': 1.51} {'loss': 0.2455, 'learning_rate': 3.025439350077576e-06, 'epoch': 1.51} {'loss': 0.272, 'learning_rate': 3.0251985831727726e-06, 'epoch': 1.51} {'loss': 0.2091, 'learning_rate': 3.024957824141197e-06, 'epoch': 1.51} {'loss': 0.3944, 'learning_rate': 3.024717072983118e-06, 'epoch': 1.51} {'loss': 0.2441, 'learning_rate': 3.0244763296988035e-06, 'epoch': 1.51} {'loss': 0.2105, 'learning_rate': 3.024235594288533e-06, 'epoch': 1.51} {'loss': 0.2577, 'learning_rate': 3.023994866752569e-06, 'epoch': 1.51} {'loss': 0.3417, 'learning_rate': 3.023754147091189e-06, 'epoch': 1.51} {'loss': 0.261, 'learning_rate': 3.0235134353046647e-06, 'epoch': 1.51} {'loss': 0.299, 'learning_rate': 3.0232727313932696e-06, 'epoch': 1.51} {'loss': 0.2693, 'learning_rate': 3.023032035357273e-06, 'epoch': 1.51} {'loss': 0.2409, 'learning_rate': 3.022791347196943e-06, 'epoch': 1.51} {'loss': 0.308, 'learning_rate': 3.022550666912558e-06, 'epoch': 1.51} {'loss': 0.2728, 'learning_rate': 3.0223099945043843e-06, 'epoch': 1.51} {'loss': 0.1961, 'learning_rate': 3.0220693299726978e-06, 'epoch': 1.51} {'loss': 0.258, 'learning_rate': 3.021828673317766e-06, 'epoch': 1.51} {'loss': 0.3144, 'learning_rate': 3.0215880245398655e-06, 'epoch': 1.51} {'loss': 0.2635, 'learning_rate': 3.0213473836392615e-06, 'epoch': 1.51} {'loss': 0.3212, 'learning_rate': 3.021106750616233e-06, 'epoch': 1.51} {'loss': 0.4093, 'learning_rate': 3.0208661254710435e-06, 'epoch': 1.51} {'loss': 0.3228, 'learning_rate': 3.0206255082039737e-06, 'epoch': 1.51} {'loss': 0.3821, 'learning_rate': 3.020384898815286e-06, 'epoch': 1.51} {'loss': 0.2509, 'learning_rate': 3.0201442973052607e-06, 'epoch': 1.51} {'loss': 0.2529, 'learning_rate': 3.019903703674164e-06, 'epoch': 1.51} {'loss': 0.2809, 'learning_rate': 3.019663117922267e-06, 'epoch': 1.51} {'loss': 0.3093, 'learning_rate': 3.0194225400498456e-06, 'epoch': 1.51} {'loss': 0.2413, 'learning_rate': 3.0191819700571657e-06, 'epoch': 1.51} {'loss': 0.2732, 'learning_rate': 3.0189414079445044e-06, 'epoch': 1.51} {'loss': 0.5048, 'learning_rate': 3.0187008537121277e-06, 'epoch': 1.51} {'loss': 0.2843, 'learning_rate': 3.0184603073603135e-06, 'epoch': 1.51} {'loss': 0.2833, 'learning_rate': 3.0182197688893277e-06, 'epoch': 1.51} {'loss': 0.3234, 'learning_rate': 3.0179792382994465e-06, 'epoch': 1.51} {'loss': 0.2939, 'learning_rate': 3.0177387155909354e-06, 'epoch': 1.51} {'loss': 0.3259, 'learning_rate': 3.0174982007640743e-06, 'epoch': 1.51} {'loss': 0.3254, 'learning_rate': 3.0172576938191245e-06, 'epoch': 1.51} {'loss': 0.3289, 'learning_rate': 3.0170171947563674e-06, 'epoch': 1.51} {'loss': 0.2813, 'learning_rate': 3.016776703576071e-06, 'epoch': 1.51} {'loss': 0.4548, 'learning_rate': 3.016536220278501e-06, 'epoch': 1.51} {'loss': 0.3532, 'learning_rate': 3.0162957448639372e-06, 'epoch': 1.51} {'loss': 0.2793, 'learning_rate': 3.0160552773326448e-06, 'epoch': 1.51} {'loss': 0.2967, 'learning_rate': 3.015814817684901e-06, 'epoch': 1.51} {'loss': 0.4193, 'learning_rate': 3.01557436592097e-06, 'epoch': 1.51} {'loss': 0.2028, 'learning_rate': 3.0153339220411317e-06, 'epoch': 1.51} {'loss': 0.3079, 'learning_rate': 3.0150934860456504e-06, 'epoch': 1.51} {'loss': 0.1948, 'learning_rate': 3.0148530579348025e-06, 'epoch': 1.51} {'loss': 0.4096, 'learning_rate': 3.0146126377088547e-06, 'epoch': 1.51} {'loss': 0.2784, 'learning_rate': 3.014372225368083e-06, 'epoch': 1.51} {'loss': 0.2597, 'learning_rate': 3.0141318209127545e-06, 'epoch': 1.51} {'loss': 0.2002, 'learning_rate': 3.013891424343146e-06, 'epoch': 1.51} {'loss': 0.2735, 'learning_rate': 3.013651035659522e-06, 'epoch': 1.51} {'loss': 0.3177, 'learning_rate': 3.01341065486216e-06, 'epoch': 1.51} {'loss': 0.3214, 'learning_rate': 3.0131702819513297e-06, 'epoch': 1.51} {'loss': 0.4214, 'learning_rate': 3.0129299169272987e-06, 'epoch': 1.51} {'loss': 0.3027, 'learning_rate': 3.012689559790344e-06, 'epoch': 1.51} {'loss': 0.2078, 'learning_rate': 3.01244921054073e-06, 'epoch': 1.51} {'loss': 0.2735, 'learning_rate': 3.0122088691787367e-06, 'epoch': 1.51} {'loss': 0.2832, 'learning_rate': 3.011968535704627e-06, 'epoch': 1.51} {'loss': 0.1864, 'learning_rate': 3.0117282101186786e-06, 'epoch': 1.51} {'loss': 0.2335, 'learning_rate': 3.0114878924211575e-06, 'epoch': 1.51} {'loss': 0.3716, 'learning_rate': 3.011247582612341e-06, 'epoch': 1.51} {'loss': 0.2735, 'learning_rate': 3.011007280692494e-06, 'epoch': 1.51} {'loss': 0.291, 'learning_rate': 3.010766986661894e-06, 'epoch': 1.51} {'loss': 0.3297, 'learning_rate': 3.010526700520805e-06, 'epoch': 1.51} {'loss': 0.2022, 'learning_rate': 3.0102864222695063e-06, 'epoch': 1.51} {'loss': 0.2718, 'learning_rate': 3.0100461519082635e-06, 'epoch': 1.51} {'loss': 0.2208, 'learning_rate': 3.0098058894373473e-06, 'epoch': 1.51} {'loss': 0.5661, 'learning_rate': 3.0095656348570347e-06, 'epoch': 1.51} {'loss': 0.3432, 'learning_rate': 3.00932538816759e-06, 'epoch': 1.51} {'loss': 0.3205, 'learning_rate': 3.0090851493692898e-06, 'epoch': 1.51} {'loss': 0.3119, 'learning_rate': 3.0088449184624004e-06, 'epoch': 1.51} {'loss': 0.3506, 'learning_rate': 3.008604695447199e-06, 'epoch': 1.51} {'loss': 0.4319, 'learning_rate': 3.0083644803239496e-06, 'epoch': 1.51} {'loss': 0.1975, 'learning_rate': 3.0081242730929317e-06, 'epoch': 1.51} {'loss': 0.2418, 'learning_rate': 3.007884073754408e-06, 'epoch': 1.51} {'loss': 0.4499, 'learning_rate': 3.0076438823086562e-06, 'epoch': 1.51} {'loss': 0.4131, 'learning_rate': 3.007403698755942e-06, 'epoch': 1.51} {'loss': 0.2224, 'learning_rate': 3.0071635230965424e-06, 'epoch': 1.51} {'loss': 0.3991, 'learning_rate': 3.0069233553307266e-06, 'epoch': 1.51} {'loss': 0.3387, 'learning_rate': 3.0066831954587595e-06, 'epoch': 1.51} {'loss': 0.251, 'learning_rate': 3.0064430434809213e-06, 'epoch': 1.51} {'loss': 0.2519, 'learning_rate': 3.006202899397476e-06, 'epoch': 1.51} {'loss': 0.3528, 'learning_rate': 3.0059627632087007e-06, 'epoch': 1.51} {'loss': 0.5016, 'learning_rate': 3.0057226349148604e-06, 'epoch': 1.51} {'loss': 0.3245, 'learning_rate': 3.0054825145162324e-06, 'epoch': 1.51} {'loss': 0.3039, 'learning_rate': 3.005242402013081e-06, 'epoch': 1.51} {'loss': 0.4252, 'learning_rate': 3.0050022974056845e-06, 'epoch': 1.51} {'loss': 0.4021, 'learning_rate': 3.0047622006943067e-06, 'epoch': 1.51} {'loss': 0.2592, 'learning_rate': 3.0045221118792258e-06, 'epoch': 1.51} {'loss': 0.2966, 'learning_rate': 3.0042820309607056e-06, 'epoch': 1.51} {'loss': 0.273, 'learning_rate': 3.0040419579390233e-06, 'epoch': 1.51} {'loss': 0.2952, 'learning_rate': 3.0038018928144485e-06, 'epoch': 1.51} {'loss': 0.4351, 'learning_rate': 3.0035618355872476e-06, 'epoch': 1.51} {'loss': 0.3628, 'learning_rate': 3.003321786257698e-06, 'epoch': 1.51} {'loss': 0.3141, 'learning_rate': 3.003081744826064e-06, 'epoch': 1.51} {'loss': 0.2416, 'learning_rate': 3.0028417112926233e-06, 'epoch': 1.51} {'loss': 0.3044, 'learning_rate': 3.0026016856576414e-06, 'epoch': 1.51} {'loss': 0.4915, 'learning_rate': 3.002361667921394e-06, 'epoch': 1.51} {'loss': 0.3777, 'learning_rate': 3.002121658084146e-06, 'epoch': 1.51} {'loss': 0.2604, 'learning_rate': 3.0018816561461762e-06, 'epoch': 1.51} {'loss': 0.4095, 'learning_rate': 3.001641662107748e-06, 'epoch': 1.51} {'loss': 0.3805, 'learning_rate': 3.001401675969138e-06, 'epoch': 1.51} {'loss': 0.2626, 'learning_rate': 3.0011616977306125e-06, 'epoch': 1.51} {'loss': 0.3516, 'learning_rate': 3.000921727392446e-06, 'epoch': 1.51} {'loss': 0.3282, 'learning_rate': 3.000681764954909e-06, 'epoch': 1.51} {'loss': 0.3201, 'learning_rate': 3.0004418104182686e-06, 'epoch': 1.51} {'loss': 0.3784, 'learning_rate': 3.0002018637828013e-06, 'epoch': 1.51} {'loss': 0.3225, 'learning_rate': 2.9999619250487687e-06, 'epoch': 1.51} {'loss': 0.2592, 'learning_rate': 2.9997219942164536e-06, 'epoch': 1.51} {'loss': 0.272, 'learning_rate': 2.9994820712861185e-06, 'epoch': 1.51} {'loss': 0.2942, 'learning_rate': 2.999242156258041e-06, 'epoch': 1.51} {'loss': 0.379, 'learning_rate': 2.9990022491324865e-06, 'epoch': 1.51} {'loss': 0.243, 'learning_rate': 2.998762349909724e-06, 'epoch': 1.51} {'loss': 0.2913, 'learning_rate': 2.998522458590032e-06, 'epoch': 1.51} {'loss': 0.3312, 'learning_rate': 2.998282575173672e-06, 'epoch': 1.51} {'loss': 0.432, 'learning_rate': 2.9980426996609236e-06, 'epoch': 1.51} {'loss': 0.379, 'learning_rate': 2.99780283205205e-06, 'epoch': 1.51} {'loss': 0.2119, 'learning_rate': 2.9975629723473287e-06, 'epoch': 1.51} {'loss': 0.306, 'learning_rate': 2.997323120547024e-06, 'epoch': 1.51} {'loss': 0.2864, 'learning_rate': 2.9970832766514136e-06, 'epoch': 1.51} {'loss': 0.454, 'learning_rate': 2.996843440660762e-06, 'epoch': 1.51} {'loss': 0.2396, 'learning_rate': 2.996603612575344e-06, 'epoch': 1.51} {'loss': 0.3675, 'learning_rate': 2.9963637923954256e-06, 'epoch': 1.51} {'loss': 0.3117, 'learning_rate': 2.996123980121285e-06, 'epoch': 1.51} {'loss': 0.4144, 'learning_rate': 2.9958841757531875e-06, 'epoch': 1.51} {'loss': 0.3103, 'learning_rate': 2.9956443792914025e-06, 'epoch': 1.51} {'loss': 0.2495, 'learning_rate': 2.995404590736205e-06, 'epoch': 1.51} {'loss': 0.3553, 'learning_rate': 2.9951648100878616e-06, 'epoch': 1.51} {'loss': 0.3564, 'learning_rate': 2.9949250373466486e-06, 'epoch': 1.51} {'loss': 0.3756, 'learning_rate': 2.9946852725128296e-06, 'epoch': 1.51} {'loss': 0.281, 'learning_rate': 2.9944455155866814e-06, 'epoch': 1.51} {'loss': 0.4159, 'learning_rate': 2.9942057665684697e-06, 'epoch': 1.51} {'loss': 0.26, 'learning_rate': 2.99396602545847e-06, 'epoch': 1.51} {'loss': 0.2794, 'learning_rate': 2.9937262922569478e-06, 'epoch': 1.51} {'loss': 0.3114, 'learning_rate': 2.993486566964179e-06, 'epoch': 1.51} {'loss': 0.321, 'learning_rate': 2.993246849580429e-06, 'epoch': 1.51} {'loss': 0.3231, 'learning_rate': 2.9930071401059736e-06, 'epoch': 1.51} {'loss': 0.3607, 'learning_rate': 2.992767438541081e-06, 'epoch': 1.51} {'loss': 0.1959, 'learning_rate': 2.992527744886018e-06, 'epoch': 1.51} {'loss': 0.4199, 'learning_rate': 2.992288059141062e-06, 'epoch': 1.51} {'loss': 0.2393, 'learning_rate': 2.992048381306476e-06, 'epoch': 1.51} {'loss': 0.2443, 'learning_rate': 2.991808711382539e-06, 'epoch': 1.51} {'loss': 0.4826, 'learning_rate': 2.991569049369515e-06, 'epoch': 1.51} {'loss': 0.4584, 'learning_rate': 2.991329395267678e-06, 'epoch': 1.51} {'loss': 0.3828, 'learning_rate': 2.991089749077295e-06, 'epoch': 1.51} {'loss': 0.1885, 'learning_rate': 2.990850110798642e-06, 'epoch': 1.51} {'loss': 0.2709, 'learning_rate': 2.9906104804319835e-06, 'epoch': 1.51} {'loss': 0.2492, 'learning_rate': 2.9903708579775957e-06, 'epoch': 1.51} {'loss': 0.2628, 'learning_rate': 2.990131243435744e-06, 'epoch': 1.51} {'loss': 0.3614, 'learning_rate': 2.9898916368067033e-06, 'epoch': 1.51} {'loss': 0.2507, 'learning_rate': 2.9896520380907424e-06, 'epoch': 1.51} {'loss': 0.3878, 'learning_rate': 2.989412447288128e-06, 'epoch': 1.51} {'loss': 0.2996, 'learning_rate': 2.989172864399137e-06, 'epoch': 1.51} {'loss': 0.3947, 'learning_rate': 2.988933289424033e-06, 'epoch': 1.51} {'loss': 0.1761, 'learning_rate': 2.988693722363094e-06, 'epoch': 1.51} {'loss': 0.4472, 'learning_rate': 2.988454163216583e-06, 'epoch': 1.51} {'loss': 0.2354, 'learning_rate': 2.9882146119847776e-06, 'epoch': 1.51} {'loss': 0.228, 'learning_rate': 2.9879750686679407e-06, 'epoch': 1.51} {'loss': 0.431, 'learning_rate': 2.9877355332663493e-06, 'epoch': 1.51} {'loss': 0.3628, 'learning_rate': 2.9874960057802694e-06, 'epoch': 1.51} {'loss': 0.2278, 'learning_rate': 2.987256486209975e-06, 'epoch': 1.51} {'loss': 0.3613, 'learning_rate': 2.987016974555732e-06, 'epoch': 1.51} {'loss': 0.2858, 'learning_rate': 2.9867774708178155e-06, 'epoch': 1.51} {'loss': 0.2596, 'learning_rate': 2.986537974996494e-06, 'epoch': 1.51} {'loss': 0.3116, 'learning_rate': 2.9862984870920354e-06, 'epoch': 1.51} {'loss': 0.4803, 'learning_rate': 2.9860590071047133e-06, 'epoch': 1.51} {'loss': 0.3764, 'learning_rate': 2.9858195350347954e-06, 'epoch': 1.51} {'loss': 0.475, 'learning_rate': 2.9855800708825556e-06, 'epoch': 1.51} {'loss': 0.2764, 'learning_rate': 2.985340614648259e-06, 'epoch': 1.51} {'loss': 0.3972, 'learning_rate': 2.985101166332183e-06, 'epoch': 1.51} {'loss': 0.1695, 'learning_rate': 2.984861725934589e-06, 'epoch': 1.51} {'loss': 0.3707, 'learning_rate': 2.9846222934557567e-06, 'epoch': 1.51} {'loss': 0.2629, 'learning_rate': 2.9843828688959485e-06, 'epoch': 1.51} {'loss': 0.3078, 'learning_rate': 2.98414345225544e-06, 'epoch': 1.51} {'loss': 0.424, 'learning_rate': 2.983904043534498e-06, 'epoch': 1.51} {'loss': 0.2771, 'learning_rate': 2.983664642733396e-06, 'epoch': 1.51} {'loss': 0.2327, 'learning_rate': 2.983425249852403e-06, 'epoch': 1.51} {'loss': 0.3818, 'learning_rate': 2.9831858648917843e-06, 'epoch': 1.51} {'loss': 0.1476, 'learning_rate': 2.9829464878518187e-06, 'epoch': 1.51} {'loss': 0.2599, 'learning_rate': 2.9827071187327695e-06, 'epoch': 1.51} {'loss': 0.3084, 'learning_rate': 2.9824677575349115e-06, 'epoch': 1.51} {'loss': 0.3428, 'learning_rate': 2.9822284042585104e-06, 'epoch': 1.51} {'loss': 0.3001, 'learning_rate': 2.9819890589038425e-06, 'epoch': 1.51} {'loss': 0.3163, 'learning_rate': 2.981749721471171e-06, 'epoch': 1.51} {'loss': 0.3407, 'learning_rate': 2.9815103919607724e-06, 'epoch': 1.51} {'loss': 0.3497, 'learning_rate': 2.981271070372911e-06, 'epoch': 1.51} {'loss': 0.3323, 'learning_rate': 2.981031756707863e-06, 'epoch': 1.51} {'loss': 0.3757, 'learning_rate': 2.9807924509658914e-06, 'epoch': 1.51} {'loss': 0.1913, 'learning_rate': 2.980553153147274e-06, 'epoch': 1.51} {'loss': 0.244, 'learning_rate': 2.980313863252278e-06, 'epoch': 1.51} {'loss': 0.3635, 'learning_rate': 2.9800745812811693e-06, 'epoch': 1.51} {'loss': 0.3377, 'learning_rate': 2.9798353072342246e-06, 'epoch': 1.51} {'loss': 0.4108, 'learning_rate': 2.9795960411117077e-06, 'epoch': 1.51} {'loss': 0.3666, 'learning_rate': 2.9793567829138947e-06, 'epoch': 1.51} {'loss': 0.3992, 'learning_rate': 2.9791175326410503e-06, 'epoch': 1.51} {'loss': 0.2352, 'learning_rate': 2.9788782902934497e-06, 'epoch': 1.51} {'loss': 0.2431, 'learning_rate': 2.9786390558713573e-06, 'epoch': 1.51} {'loss': 0.4286, 'learning_rate': 2.9783998293750504e-06, 'epoch': 1.51} {'loss': 0.2319, 'learning_rate': 2.978160610804791e-06, 'epoch': 1.51} {'loss': 0.3037, 'learning_rate': 2.977921400160856e-06, 'epoch': 1.51} {'loss': 0.4527, 'learning_rate': 2.977682197443509e-06, 'epoch': 1.51} {'loss': 0.1308, 'learning_rate': 2.9774430026530264e-06, 'epoch': 1.51} {'loss': 0.2991, 'learning_rate': 2.9772038157896766e-06, 'epoch': 1.51} {'loss': 0.3428, 'learning_rate': 2.976964636853724e-06, 'epoch': 1.51} {'loss': 0.3048, 'learning_rate': 2.976725465845447e-06, 'epoch': 1.51} {'loss': 0.4946, 'learning_rate': 2.976486302765107e-06, 'epoch': 1.51} {'loss': 0.1651, 'learning_rate': 2.9762471476129795e-06, 'epoch': 1.51} {'loss': 0.2498, 'learning_rate': 2.976008000389332e-06, 'epoch': 1.51} {'loss': 0.331, 'learning_rate': 2.9757688610944403e-06, 'epoch': 1.51} {'loss': 0.3031, 'learning_rate': 2.9755297297285655e-06, 'epoch': 1.51} {'loss': 0.3301, 'learning_rate': 2.9752906062919864e-06, 'epoch': 1.51} {'loss': 0.23, 'learning_rate': 2.975051490784967e-06, 'epoch': 1.51} {'loss': 0.3527, 'learning_rate': 2.974812383207776e-06, 'epoch': 1.51} {'loss': 0.2566, 'learning_rate': 2.97457328356069e-06, 'epoch': 1.51} {'loss': 0.2506, 'learning_rate': 2.9743341918439706e-06, 'epoch': 1.51} {'loss': 0.3183, 'learning_rate': 2.974095108057895e-06, 'epoch': 1.51} {'loss': 0.3335, 'learning_rate': 2.9738560322027265e-06, 'epoch': 1.51} {'loss': 0.2502, 'learning_rate': 2.9736169642787428e-06, 'epoch': 1.51} {'loss': 0.4804, 'learning_rate': 2.9733779042862053e-06, 'epoch': 1.51} {'loss': 0.4325, 'learning_rate': 2.9731388522253924e-06, 'epoch': 1.51} {'loss': 0.3652, 'learning_rate': 2.9728998080965652e-06, 'epoch': 1.51} {'loss': 0.2608, 'learning_rate': 2.9726607719000013e-06, 'epoch': 1.51} {'loss': 0.3948, 'learning_rate': 2.9724217436359637e-06, 'epoch': 1.51} {'loss': 0.3634, 'learning_rate': 2.9721827233047284e-06, 'epoch': 1.51} {'loss': 0.2727, 'learning_rate': 2.971943710906564e-06, 'epoch': 1.51} {'loss': 0.2652, 'learning_rate': 2.971704706441734e-06, 'epoch': 1.51} {'loss': 0.4556, 'learning_rate': 2.971465709910517e-06, 'epoch': 1.51} {'loss': 0.3662, 'learning_rate': 2.971226721313175e-06, 'epoch': 1.51} {'loss': 0.3119, 'learning_rate': 2.9709877406499843e-06, 'epoch': 1.51} {'loss': 0.4171, 'learning_rate': 2.9707487679212087e-06, 'epoch': 1.51} {'loss': 0.2663, 'learning_rate': 2.970509803127125e-06, 'epoch': 1.51} {'loss': 0.4668, 'learning_rate': 2.9702708462679954e-06, 'epoch': 1.51} {'loss': 0.3964, 'learning_rate': 2.970031897344097e-06, 'epoch': 1.51} {'loss': 0.2979, 'learning_rate': 2.9697929563556914e-06, 'epoch': 1.51} {'loss': 0.4233, 'learning_rate': 2.969554023303056e-06, 'epoch': 1.51} {'loss': 0.336, 'learning_rate': 2.969315098186455e-06, 'epoch': 1.51} {'loss': 0.1858, 'learning_rate': 2.969076181006163e-06, 'epoch': 1.51} {'loss': 0.3124, 'learning_rate': 2.968837271762447e-06, 'epoch': 1.51} {'loss': 0.3803, 'learning_rate': 2.968598370455574e-06, 'epoch': 1.51} {'loss': 0.4453, 'learning_rate': 2.9683594770858194e-06, 'epoch': 1.51} {'loss': 0.2983, 'learning_rate': 2.968120591653446e-06, 'epoch': 1.51} {'loss': 0.3215, 'learning_rate': 2.96788171415873e-06, 'epoch': 1.51} {'loss': 0.512, 'learning_rate': 2.967642844601937e-06, 'epoch': 1.51} {'loss': 0.1578, 'learning_rate': 2.96740398298334e-06, 'epoch': 1.51} {'loss': 0.3592, 'learning_rate': 2.9671651293032033e-06, 'epoch': 1.51} {'loss': 0.2532, 'learning_rate': 2.9669262835618027e-06, 'epoch': 1.51} {'loss': 0.2842, 'learning_rate': 2.966687445759403e-06, 'epoch': 1.51} {'loss': 0.4291, 'learning_rate': 2.966448615896278e-06, 'epoch': 1.51} {'loss': 0.3658, 'learning_rate': 2.966209793972692e-06, 'epoch': 1.51} {'loss': 0.2891, 'learning_rate': 2.96597097998892e-06, 'epoch': 1.51} {'loss': 0.3933, 'learning_rate': 2.9657321739452303e-06, 'epoch': 1.51} {'loss': 0.162, 'learning_rate': 2.965493375841888e-06, 'epoch': 1.51} {'loss': 0.3564, 'learning_rate': 2.9652545856791693e-06, 'epoch': 1.51} {'loss': 0.3448, 'learning_rate': 2.965015803457336e-06, 'epoch': 1.51} {'loss': 0.4782, 'learning_rate': 2.9647770291766665e-06, 'epoch': 1.51} {'loss': 0.3613, 'learning_rate': 2.964538262837423e-06, 'epoch': 1.51} {'loss': 0.2889, 'learning_rate': 2.9642995044398803e-06, 'epoch': 1.51} {'loss': 0.2598, 'learning_rate': 2.9640607539843026e-06, 'epoch': 1.51} {'loss': 0.3741, 'learning_rate': 2.963822011470966e-06, 'epoch': 1.51} {'loss': 0.32, 'learning_rate': 2.963583276900133e-06, 'epoch': 1.51} {'loss': 0.4164, 'learning_rate': 2.9633445502720794e-06, 'epoch': 1.51} {'loss': 0.3328, 'learning_rate': 2.9631058315870685e-06, 'epoch': 1.51} {'loss': 0.2556, 'learning_rate': 2.9628671208453764e-06, 'epoch': 1.51} {'loss': 0.2862, 'learning_rate': 2.9626284180472684e-06, 'epoch': 1.51} {'loss': 0.2082, 'learning_rate': 2.962389723193012e-06, 'epoch': 1.51} {'loss': 0.3892, 'learning_rate': 2.962151036282883e-06, 'epoch': 1.51} {'loss': 0.2583, 'learning_rate': 2.9619123573171438e-06, 'epoch': 1.51} {'loss': 0.2193, 'learning_rate': 2.9616736862960706e-06, 'epoch': 1.51} {'loss': 0.342, 'learning_rate': 2.961435023219925e-06, 'epoch': 1.51} {'loss': 0.3931, 'learning_rate': 2.9611963680889855e-06, 'epoch': 1.51} {'loss': 0.1661, 'learning_rate': 2.9609577209035123e-06, 'epoch': 1.51} {'loss': 0.2797, 'learning_rate': 2.9607190816637833e-06, 'epoch': 1.51} {'loss': 0.2846, 'learning_rate': 2.9604804503700614e-06, 'epoch': 1.51} {'loss': 0.343, 'learning_rate': 2.9602418270226194e-06, 'epoch': 1.51} {'loss': 0.2497, 'learning_rate': 2.9600032116217247e-06, 'epoch': 1.51} {'loss': 0.2862, 'learning_rate': 2.95976460416765e-06, 'epoch': 1.51} {'loss': 0.3444, 'learning_rate': 2.959526004660662e-06, 'epoch': 1.51} {'loss': 0.2341, 'learning_rate': 2.9592874131010275e-06, 'epoch': 1.51} {'loss': 0.2613, 'learning_rate': 2.9590488294890217e-06, 'epoch': 1.51} {'loss': 0.3812, 'learning_rate': 2.9588102538249086e-06, 'epoch': 1.51} {'loss': 0.3202, 'learning_rate': 2.958571686108962e-06, 'epoch': 1.51} {'loss': 0.3343, 'learning_rate': 2.958333126341446e-06, 'epoch': 1.51} {'loss': 0.3263, 'learning_rate': 2.958094574522635e-06, 'epoch': 1.51} {'loss': 0.4019, 'learning_rate': 2.9578560306527948e-06, 'epoch': 1.51} {'loss': 0.2961, 'learning_rate': 2.9576174947321977e-06, 'epoch': 1.51} {'loss': 0.323, 'learning_rate': 2.9573789667611095e-06, 'epoch': 1.51} {'loss': 0.3833, 'learning_rate': 2.9571404467398037e-06, 'epoch': 1.51} {'loss': 0.2884, 'learning_rate': 2.9569019346685437e-06, 'epoch': 1.51} {'loss': 0.2342, 'learning_rate': 2.956663430547605e-06, 'epoch': 1.51} {'loss': 0.4334, 'learning_rate': 2.9564249343772543e-06, 'epoch': 1.51} {'loss': 0.4695, 'learning_rate': 2.956186446157758e-06, 'epoch': 1.51} {'loss': 0.3626, 'learning_rate': 2.9559479658893907e-06, 'epoch': 1.51} {'loss': 0.1754, 'learning_rate': 2.955709493572415e-06, 'epoch': 1.51} {'loss': 0.3495, 'learning_rate': 2.9554710292071065e-06, 'epoch': 1.51} {'loss': 0.2572, 'learning_rate': 2.9552325727937293e-06, 'epoch': 1.51} {'loss': 0.3606, 'learning_rate': 2.9549941243325574e-06, 'epoch': 1.51} {'loss': 0.3644, 'learning_rate': 2.9547556838238547e-06, 'epoch': 1.51} {'loss': 0.3547, 'learning_rate': 2.9545172512678965e-06, 'epoch': 1.51} {'loss': 0.2855, 'learning_rate': 2.954278826664945e-06, 'epoch': 1.51} {'loss': 0.1716, 'learning_rate': 2.9540404100152765e-06, 'epoch': 1.51} {'loss': 0.3927, 'learning_rate': 2.9538020013191526e-06, 'epoch': 1.51} {'loss': 0.2953, 'learning_rate': 2.95356360057685e-06, 'epoch': 1.51} {'loss': 0.3329, 'learning_rate': 2.9533252077886345e-06, 'epoch': 1.51} {'loss': 0.2801, 'learning_rate': 2.9530868229547717e-06, 'epoch': 1.51} {'loss': 0.3763, 'learning_rate': 2.952848446075536e-06, 'epoch': 1.51} {'loss': 0.2758, 'learning_rate': 2.952610077151191e-06, 'epoch': 1.51} {'loss': 0.3248, 'learning_rate': 2.952371716182011e-06, 'epoch': 1.51} {'loss': 0.3342, 'learning_rate': 2.9521333631682615e-06, 'epoch': 1.51} {'loss': 0.2831, 'learning_rate': 2.9518950181102168e-06, 'epoch': 1.51} {'loss': 0.1789, 'learning_rate': 2.9516566810081425e-06, 'epoch': 1.51} {'loss': 0.3277, 'learning_rate': 2.951418351862304e-06, 'epoch': 1.51} {'loss': 0.3683, 'learning_rate': 2.951180030672978e-06, 'epoch': 1.51} {'loss': 0.2071, 'learning_rate': 2.9509417174404254e-06, 'epoch': 1.51} {'loss': 0.2342, 'learning_rate': 2.9507034121649225e-06, 'epoch': 1.51} {'loss': 0.2253, 'learning_rate': 2.9504651148467312e-06, 'epoch': 1.51} {'loss': 0.2053, 'learning_rate': 2.9502268254861287e-06, 'epoch': 1.51} {'loss': 0.2638, 'learning_rate': 2.9499885440833752e-06, 'epoch': 1.51} {'loss': 0.3977, 'learning_rate': 2.9497502706387483e-06, 'epoch': 1.51} {'loss': 0.3667, 'learning_rate': 2.9495120051525084e-06, 'epoch': 1.51} {'loss': 0.2961, 'learning_rate': 2.949273747624932e-06, 'epoch': 1.51} {'loss': 0.4058, 'learning_rate': 2.949035498056282e-06, 'epoch': 1.51} {'loss': 0.2957, 'learning_rate': 2.948797256446834e-06, 'epoch': 1.51} {'loss': 0.3548, 'learning_rate': 2.948559022796852e-06, 'epoch': 1.51} {'loss': 0.2413, 'learning_rate': 2.948320797106603e-06, 'epoch': 1.51} {'loss': 0.3752, 'learning_rate': 2.9480825793763624e-06, 'epoch': 1.51} {'loss': 0.2526, 'learning_rate': 2.947844369606392e-06, 'epoch': 1.51} {'loss': 0.3149, 'learning_rate': 2.947606167796967e-06, 'epoch': 1.51} {'loss': 0.3133, 'learning_rate': 2.947367973948351e-06, 'epoch': 1.51} {'loss': 0.4047, 'learning_rate': 2.9471297880608184e-06, 'epoch': 1.51} {'loss': 0.2867, 'learning_rate': 2.9468916101346325e-06, 'epoch': 1.51} {'loss': 0.2805, 'learning_rate': 2.9466534401700675e-06, 'epoch': 1.51} {'loss': 0.3748, 'learning_rate': 2.946415278167386e-06, 'epoch': 1.51} {'loss': 0.3142, 'learning_rate': 2.9461771241268642e-06, 'epoch': 1.51} {'loss': 0.2391, 'learning_rate': 2.9459389780487634e-06, 'epoch': 1.51} {'loss': 0.6128, 'learning_rate': 2.9457008399333598e-06, 'epoch': 1.51} {'loss': 0.3732, 'learning_rate': 2.9454627097809154e-06, 'epoch': 1.51} {'loss': 0.3217, 'learning_rate': 2.945224587591704e-06, 'epoch': 1.51} {'loss': 0.3912, 'learning_rate': 2.9449864733659938e-06, 'epoch': 1.51} {'loss': 0.1647, 'learning_rate': 2.944748367104049e-06, 'epoch': 1.51} {'loss': 0.2038, 'learning_rate': 2.9445102688061445e-06, 'epoch': 1.51} {'loss': 0.3369, 'learning_rate': 2.9442721784725436e-06, 'epoch': 1.51} {'loss': 0.2537, 'learning_rate': 2.94403409610352e-06, 'epoch': 1.51} {'loss': 0.1791, 'learning_rate': 2.943796021699338e-06, 'epoch': 1.51} {'loss': 0.4929, 'learning_rate': 2.943557955260271e-06, 'epoch': 1.51} {'loss': 0.2173, 'learning_rate': 2.9433198967865815e-06, 'epoch': 1.51} {'loss': 0.3928, 'learning_rate': 2.943081846278546e-06, 'epoch': 1.51} {'loss': 0.3104, 'learning_rate': 2.942843803736426e-06, 'epoch': 1.51} {'loss': 0.3068, 'learning_rate': 2.942605769160496e-06, 'epoch': 1.51} {'loss': 0.2845, 'learning_rate': 2.9423677425510187e-06, 'epoch': 1.51} {'loss': 0.244, 'learning_rate': 2.94212972390827e-06, 'epoch': 1.51} {'loss': 0.2092, 'learning_rate': 2.9418917132325153e-06, 'epoch': 1.51} {'loss': 0.1721, 'learning_rate': 2.9416537105240184e-06, 'epoch': 1.51} {'loss': 0.4242, 'learning_rate': 2.941415715783056e-06, 'epoch': 1.51} {'loss': 0.3332, 'learning_rate': 2.94117772900989e-06, 'epoch': 1.51} {'loss': 0.2957, 'learning_rate': 2.9409397502047944e-06, 'epoch': 1.51} {'loss': 0.3815, 'learning_rate': 2.9407017793680327e-06, 'epoch': 1.51} {'loss': 0.1826, 'learning_rate': 2.94046381649988e-06, 'epoch': 1.51} {'loss': 0.1749, 'learning_rate': 2.9402258616005975e-06, 'epoch': 1.51} {'loss': 0.2246, 'learning_rate': 2.9399879146704603e-06, 'epoch': 1.51} {'loss': 0.2636, 'learning_rate': 2.9397499757097316e-06, 'epoch': 1.51} {'loss': 0.3474, 'learning_rate': 2.9395120447186855e-06, 'epoch': 1.51} {'loss': 0.3341, 'learning_rate': 2.939274121697585e-06, 'epoch': 1.51} {'loss': 0.3695, 'learning_rate': 2.9390362066467037e-06, 'epoch': 1.51} {'loss': 0.3294, 'learning_rate': 2.938798299566309e-06, 'epoch': 1.51} {'loss': 0.2473, 'learning_rate': 2.9385604004566647e-06, 'epoch': 1.51} {'loss': 0.1842, 'learning_rate': 2.9383225093180457e-06, 'epoch': 1.51} {'loss': 0.2972, 'learning_rate': 2.9380846261507145e-06, 'epoch': 1.51} {'loss': 0.2099, 'learning_rate': 2.937846750954946e-06, 'epoch': 1.51} {'loss': 0.4021, 'learning_rate': 2.9376088837310036e-06, 'epoch': 1.51} {'loss': 0.4006, 'learning_rate': 2.9373710244791597e-06, 'epoch': 1.51} {'loss': 0.2518, 'learning_rate': 2.9371331731996776e-06, 'epoch': 1.51} {'loss': 0.4375, 'learning_rate': 2.9368953298928325e-06, 'epoch': 1.51} {'loss': 0.3234, 'learning_rate': 2.9366574945588867e-06, 'epoch': 1.51} {'loss': 0.3874, 'learning_rate': 2.936419667198115e-06, 'epoch': 1.51} {'loss': 0.3649, 'learning_rate': 2.9361818478107785e-06, 'epoch': 1.51} {'loss': 0.2977, 'learning_rate': 2.9359440363971524e-06, 'epoch': 1.51} {'loss': 0.385, 'learning_rate': 2.9357062329575024e-06, 'epoch': 1.51} {'loss': 0.4551, 'learning_rate': 2.935468437492094e-06, 'epoch': 1.51} {'loss': 0.2383, 'learning_rate': 2.9352306500012005e-06, 'epoch': 1.51} {'loss': 0.2541, 'learning_rate': 2.934992870485086e-06, 'epoch': 1.52} {'loss': 0.3318, 'learning_rate': 2.9347550989440244e-06, 'epoch': 1.52} {'loss': 0.3607, 'learning_rate': 2.9345173353782764e-06, 'epoch': 1.52} {'loss': 0.286, 'learning_rate': 2.9342795797881186e-06, 'epoch': 1.52} {'loss': 0.3266, 'learning_rate': 2.9340418321738128e-06, 'epoch': 1.52} {'loss': 0.3378, 'learning_rate': 2.9338040925356325e-06, 'epoch': 1.52} {'loss': 0.4145, 'learning_rate': 2.933566360873841e-06, 'epoch': 1.52} {'loss': 0.4507, 'learning_rate': 2.9333286371887125e-06, 'epoch': 1.52} {'loss': 0.3074, 'learning_rate': 2.9330909214805094e-06, 'epoch': 1.52} {'loss': 0.1886, 'learning_rate': 2.9328532137495046e-06, 'epoch': 1.52} {'loss': 0.407, 'learning_rate': 2.9326155139959654e-06, 'epoch': 1.52} {'loss': 0.3453, 'learning_rate': 2.9323778222201573e-06, 'epoch': 1.52} {'loss': 0.2267, 'learning_rate': 2.9321401384223526e-06, 'epoch': 1.52} {'loss': 0.4337, 'learning_rate': 2.931902462602815e-06, 'epoch': 1.52} {'loss': 0.2623, 'learning_rate': 2.9316647947618183e-06, 'epoch': 1.52} {'loss': 0.3399, 'learning_rate': 2.9314271348996248e-06, 'epoch': 1.52} {'loss': 0.4326, 'learning_rate': 2.9311894830165087e-06, 'epoch': 1.52} {'loss': 0.3951, 'learning_rate': 2.9309518391127336e-06, 'epoch': 1.52} {'loss': 0.3006, 'learning_rate': 2.9307142031885717e-06, 'epoch': 1.52} {'loss': 0.213, 'learning_rate': 2.9304765752442856e-06, 'epoch': 1.52} {'loss': 0.1867, 'learning_rate': 2.9302389552801514e-06, 'epoch': 1.52} {'loss': 0.3111, 'learning_rate': 2.930001343296429e-06, 'epoch': 1.52} {'loss': 0.2124, 'learning_rate': 2.929763739293394e-06, 'epoch': 1.52} {'loss': 0.3463, 'learning_rate': 2.929526143271312e-06, 'epoch': 1.52} {'loss': 0.3765, 'learning_rate': 2.9292885552304473e-06, 'epoch': 1.52} {'loss': 0.4545, 'learning_rate': 2.9290509751710737e-06, 'epoch': 1.52} {'loss': 0.2577, 'learning_rate': 2.92881340309345e-06, 'epoch': 1.52} {'loss': 0.3254, 'learning_rate': 2.928575838997859e-06, 'epoch': 1.52} {'loss': 0.2424, 'learning_rate': 2.9283382828845575e-06, 'epoch': 1.52} {'loss': 0.3358, 'learning_rate': 2.9281007347538202e-06, 'epoch': 1.52} {'loss': 0.2522, 'learning_rate': 2.9278631946059132e-06, 'epoch': 1.52} {'loss': 0.3303, 'learning_rate': 2.9276256624411003e-06, 'epoch': 1.52} {'loss': 0.2053, 'learning_rate': 2.927388138259656e-06, 'epoch': 1.52} {'loss': 0.3299, 'learning_rate': 2.9271506220618427e-06, 'epoch': 1.52} {'loss': 0.2875, 'learning_rate': 2.9269131138479345e-06, 'epoch': 1.52} {'loss': 0.332, 'learning_rate': 2.926675613618193e-06, 'epoch': 1.52} {'loss': 0.3185, 'learning_rate': 2.9264381213728933e-06, 'epoch': 1.52} {'loss': 0.3164, 'learning_rate': 2.9262006371122964e-06, 'epoch': 1.52} {'loss': 0.1845, 'learning_rate': 2.925963160836677e-06, 'epoch': 1.52} {'loss': 0.4094, 'learning_rate': 2.9257256925462975e-06, 'epoch': 1.52} {'loss': 0.2862, 'learning_rate': 2.92548823224143e-06, 'epoch': 1.52} {'loss': 0.3281, 'learning_rate': 2.9252507799223397e-06, 'epoch': 1.52} {'loss': 0.0974, 'learning_rate': 2.9250133355892975e-06, 'epoch': 1.52} {'loss': 0.3176, 'learning_rate': 2.924775899242571e-06, 'epoch': 1.52} {'loss': 0.3043, 'learning_rate': 2.924538470882423e-06, 'epoch': 1.52} {'loss': 0.3473, 'learning_rate': 2.92430105050913e-06, 'epoch': 1.52} {'loss': 0.3086, 'learning_rate': 2.9240636381229516e-06, 'epoch': 1.52} {'loss': 0.3264, 'learning_rate': 2.923826233724163e-06, 'epoch': 1.52} {'loss': 0.3041, 'learning_rate': 2.923588837313026e-06, 'epoch': 1.52} {'loss': 0.2867, 'learning_rate': 2.923351448889815e-06, 'epoch': 1.52} {'loss': 0.2819, 'learning_rate': 2.923114068454791e-06, 'epoch': 1.52} {'loss': 0.3282, 'learning_rate': 2.9228766960082287e-06, 'epoch': 1.52} {'loss': 0.2471, 'learning_rate': 2.92263933155039e-06, 'epoch': 1.52} {'loss': 0.2608, 'learning_rate': 2.922401975081548e-06, 'epoch': 1.52} {'loss': 0.4102, 'learning_rate': 2.9221646266019655e-06, 'epoch': 1.52} {'loss': 0.2805, 'learning_rate': 2.9219272861119164e-06, 'epoch': 1.52} {'loss': 0.4285, 'learning_rate': 2.921689953611666e-06, 'epoch': 1.52} {'loss': 0.3576, 'learning_rate': 2.921452629101478e-06, 'epoch': 1.52} {'loss': 0.2805, 'learning_rate': 2.9212153125816268e-06, 'epoch': 1.52} {'loss': 0.3768, 'learning_rate': 2.920978004052375e-06, 'epoch': 1.52} {'loss': 0.4116, 'learning_rate': 2.9207407035139955e-06, 'epoch': 1.52} {'loss': 0.4191, 'learning_rate': 2.9205034109667506e-06, 'epoch': 1.52} {'loss': 0.3615, 'learning_rate': 2.9202661264109143e-06, 'epoch': 1.52} {'loss': 0.1824, 'learning_rate': 2.920028849846748e-06, 'epoch': 1.52} {'loss': 0.3212, 'learning_rate': 2.9197915812745257e-06, 'epoch': 1.52} {'loss': 0.2679, 'learning_rate': 2.9195543206945097e-06, 'epoch': 1.52} {'loss': 0.3883, 'learning_rate': 2.919317068106973e-06, 'epoch': 1.52} {'loss': 0.2895, 'learning_rate': 2.9190798235121787e-06, 'epoch': 1.52} {'loss': 0.4463, 'learning_rate': 2.9188425869103986e-06, 'epoch': 1.52} {'loss': 0.3035, 'learning_rate': 2.9186053583019004e-06, 'epoch': 1.52} {'loss': 0.336, 'learning_rate': 2.9183681376869456e-06, 'epoch': 1.52} {'loss': 0.3296, 'learning_rate': 2.9181309250658097e-06, 'epoch': 1.52} {'loss': 0.3082, 'learning_rate': 2.9178937204387547e-06, 'epoch': 1.52} {'loss': 0.2966, 'learning_rate': 2.917656523806054e-06, 'epoch': 1.52} {'loss': 0.3779, 'learning_rate': 2.9174193351679693e-06, 'epoch': 1.52} {'loss': 0.4284, 'learning_rate': 2.9171821545247747e-06, 'epoch': 1.52} {'loss': 0.2968, 'learning_rate': 2.9169449818767303e-06, 'epoch': 1.52} {'loss': 0.2375, 'learning_rate': 2.9167078172241125e-06, 'epoch': 1.52} {'loss': 0.3564, 'learning_rate': 2.916470660567181e-06, 'epoch': 1.52} {'loss': 0.4316, 'learning_rate': 2.9162335119062103e-06, 'epoch': 1.52} {'loss': 0.4018, 'learning_rate': 2.9159963712414618e-06, 'epoch': 1.52} {'loss': 0.4117, 'learning_rate': 2.915759238573209e-06, 'epoch': 1.52} {'loss': 0.4347, 'learning_rate': 2.9155221139017178e-06, 'epoch': 1.52} {'loss': 0.3178, 'learning_rate': 2.9152849972272513e-06, 'epoch': 1.52} {'loss': 0.3259, 'learning_rate': 2.9150478885500845e-06, 'epoch': 1.52} {'loss': 0.4375, 'learning_rate': 2.914810787870478e-06, 'epoch': 1.52} {'loss': 0.3714, 'learning_rate': 2.914573695188705e-06, 'epoch': 1.52} {'loss': 0.1947, 'learning_rate': 2.9143366105050284e-06, 'epoch': 1.52} {'loss': 0.3788, 'learning_rate': 2.914099533819722e-06, 'epoch': 1.52} {'loss': 0.2672, 'learning_rate': 2.913862465133046e-06, 'epoch': 1.52} {'loss': 0.3332, 'learning_rate': 2.913625404445276e-06, 'epoch': 1.52} {'loss': 0.2715, 'learning_rate': 2.9133883517566707e-06, 'epoch': 1.52} {'loss': 0.167, 'learning_rate': 2.9131513070675064e-06, 'epoch': 1.52} {'loss': 0.2352, 'learning_rate': 2.9129142703780435e-06, 'epoch': 1.52} {'loss': 0.3154, 'learning_rate': 2.912677241688555e-06, 'epoch': 1.52} {'loss': 0.3405, 'learning_rate': 2.9124402209993075e-06, 'epoch': 1.52} {'loss': 0.3777, 'learning_rate': 2.9122032083105634e-06, 'epoch': 1.52} {'loss': 0.3296, 'learning_rate': 2.911966203622597e-06, 'epoch': 1.52} {'loss': 0.2183, 'learning_rate': 2.9117292069356706e-06, 'epoch': 1.52} {'loss': 0.222, 'learning_rate': 2.911492218250056e-06, 'epoch': 1.52} {'loss': 0.2306, 'learning_rate': 2.9112552375660163e-06, 'epoch': 1.52} {'loss': 0.2348, 'learning_rate': 2.9110182648838246e-06, 'epoch': 1.52} {'loss': 0.2907, 'learning_rate': 2.910781300203742e-06, 'epoch': 1.52} {'loss': 0.3266, 'learning_rate': 2.9105443435260426e-06, 'epoch': 1.52} {'loss': 0.3998, 'learning_rate': 2.9103073948509876e-06, 'epoch': 1.52} {'loss': 0.2047, 'learning_rate': 2.9100704541788494e-06, 'epoch': 1.52} {'loss': 0.3344, 'learning_rate': 2.909833521509892e-06, 'epoch': 1.52} {'loss': 0.2851, 'learning_rate': 2.9095965968443864e-06, 'epoch': 1.52} {'loss': 0.2254, 'learning_rate': 2.909359680182594e-06, 'epoch': 1.52} {'loss': 0.3081, 'learning_rate': 2.9091227715247906e-06, 'epoch': 1.52} {'loss': 0.3413, 'learning_rate': 2.9088858708712386e-06, 'epoch': 1.52} {'loss': 0.2786, 'learning_rate': 2.9086489782222026e-06, 'epoch': 1.52} {'loss': 0.2685, 'learning_rate': 2.908412093577957e-06, 'epoch': 1.52} {'loss': 0.2856, 'learning_rate': 2.9081752169387622e-06, 'epoch': 1.52} {'loss': 0.4094, 'learning_rate': 2.907938348304893e-06, 'epoch': 1.52} {'loss': 0.3056, 'learning_rate': 2.9077014876766083e-06, 'epoch': 1.52} {'loss': 0.3003, 'learning_rate': 2.9074646350541845e-06, 'epoch': 1.52} {'loss': 0.3093, 'learning_rate': 2.907227790437881e-06, 'epoch': 1.52} {'loss': 0.155, 'learning_rate': 2.9069909538279704e-06, 'epoch': 1.52} {'loss': 0.2641, 'learning_rate': 2.9067541252247168e-06, 'epoch': 1.52} {'loss': 0.3937, 'learning_rate': 2.906517304628391e-06, 'epoch': 1.52} {'loss': 0.3866, 'learning_rate': 2.906280492039256e-06, 'epoch': 1.52} {'loss': 0.3316, 'learning_rate': 2.9060436874575837e-06, 'epoch': 1.52} {'loss': 0.377, 'learning_rate': 2.905806890883639e-06, 'epoch': 1.52} {'loss': 0.3318, 'learning_rate': 2.9055701023176864e-06, 'epoch': 1.52} {'loss': 0.3871, 'learning_rate': 2.9053333217599965e-06, 'epoch': 1.52} {'loss': 0.198, 'learning_rate': 2.9050965492108363e-06, 'epoch': 1.52} {'loss': 0.1669, 'learning_rate': 2.904859784670475e-06, 'epoch': 1.52} {'loss': 0.2733, 'learning_rate': 2.904623028139176e-06, 'epoch': 1.52} {'loss': 0.3194, 'learning_rate': 2.9043862796172104e-06, 'epoch': 1.52} {'loss': 0.1823, 'learning_rate': 2.9041495391048437e-06, 'epoch': 1.52} {'loss': 0.1894, 'learning_rate': 2.9039128066023403e-06, 'epoch': 1.52} {'loss': 0.1954, 'learning_rate': 2.903676082109973e-06, 'epoch': 1.52} {'loss': 0.3913, 'learning_rate': 2.9034393656280012e-06, 'epoch': 1.52} {'loss': 0.3129, 'learning_rate': 2.9032026571567017e-06, 'epoch': 1.52} {'loss': 0.2441, 'learning_rate': 2.9029659566963332e-06, 'epoch': 1.52} {'loss': 0.2318, 'learning_rate': 2.9027292642471706e-06, 'epoch': 1.52} {'loss': 0.4065, 'learning_rate': 2.9024925798094726e-06, 'epoch': 1.52} {'loss': 0.2825, 'learning_rate': 2.9022559033835153e-06, 'epoch': 1.52} {'loss': 0.4276, 'learning_rate': 2.9020192349695563e-06, 'epoch': 1.52} {'loss': 0.2849, 'learning_rate': 2.901782574567873e-06, 'epoch': 1.52} {'loss': 0.2488, 'learning_rate': 2.9015459221787235e-06, 'epoch': 1.52} {'loss': 0.2207, 'learning_rate': 2.901309277802381e-06, 'epoch': 1.52} {'loss': 0.355, 'learning_rate': 2.901072641439111e-06, 'epoch': 1.52} {'loss': 0.308, 'learning_rate': 2.9008360130891777e-06, 'epoch': 1.52} {'loss': 0.3376, 'learning_rate': 2.900599392752853e-06, 'epoch': 1.52} {'loss': 0.2924, 'learning_rate': 2.900362780430399e-06, 'epoch': 1.52} {'loss': 0.2397, 'learning_rate': 2.900126176122088e-06, 'epoch': 1.52} {'loss': 0.1536, 'learning_rate': 2.8998895798281813e-06, 'epoch': 1.52} {'loss': 0.3181, 'learning_rate': 2.8996529915489525e-06, 'epoch': 1.52} {'loss': 0.3417, 'learning_rate': 2.8994164112846624e-06, 'epoch': 1.52} {'loss': 0.2797, 'learning_rate': 2.8991798390355842e-06, 'epoch': 1.52} {'loss': 0.255, 'learning_rate': 2.8989432748019775e-06, 'epoch': 1.52} {'loss': 0.2731, 'learning_rate': 2.8987067185841168e-06, 'epoch': 1.52} {'loss': 0.3058, 'learning_rate': 2.8984701703822637e-06, 'epoch': 1.52} {'loss': 0.3344, 'learning_rate': 2.8982336301966894e-06, 'epoch': 1.52} {'loss': 0.3273, 'learning_rate': 2.8979970980276593e-06, 'epoch': 1.52} {'loss': 0.3662, 'learning_rate': 2.897760573875438e-06, 'epoch': 1.52} {'loss': 0.2998, 'learning_rate': 2.8975240577402963e-06, 'epoch': 1.52} {'loss': 0.2463, 'learning_rate': 2.897287549622496e-06, 'epoch': 1.52} {'loss': 0.3738, 'learning_rate': 2.8970510495223114e-06, 'epoch': 1.52} {'loss': 0.3992, 'learning_rate': 2.896814557440002e-06, 'epoch': 1.52} {'loss': 0.3431, 'learning_rate': 2.8965780733758407e-06, 'epoch': 1.52} {'loss': 0.4591, 'learning_rate': 2.896341597330089e-06, 'epoch': 1.52} {'loss': 0.4681, 'learning_rate': 2.8961051293030205e-06, 'epoch': 1.52} {'loss': 0.347, 'learning_rate': 2.8958686692948956e-06, 'epoch': 1.52} {'loss': 0.2709, 'learning_rate': 2.895632217305987e-06, 'epoch': 1.52} {'loss': 0.4422, 'learning_rate': 2.8953957733365546e-06, 'epoch': 1.52} {'loss': 0.2056, 'learning_rate': 2.8951593373868734e-06, 'epoch': 1.52} {'loss': 0.3068, 'learning_rate': 2.8949229094572064e-06, 'epoch': 1.52} {'loss': 0.2511, 'learning_rate': 2.8946864895478165e-06, 'epoch': 1.52} {'loss': 0.2729, 'learning_rate': 2.8944500776589777e-06, 'epoch': 1.52} {'loss': 0.3084, 'learning_rate': 2.894213673790951e-06, 'epoch': 1.52} {'loss': 0.2034, 'learning_rate': 2.893977277944009e-06, 'epoch': 1.52} {'loss': 0.3253, 'learning_rate': 2.8937408901184116e-06, 'epoch': 1.52} {'loss': 0.2685, 'learning_rate': 2.8935045103144334e-06, 'epoch': 1.52} {'loss': 0.3152, 'learning_rate': 2.8932681385323337e-06, 'epoch': 1.52} {'loss': 0.2371, 'learning_rate': 2.8930317747723856e-06, 'epoch': 1.52} {'loss': 0.3323, 'learning_rate': 2.8927954190348496e-06, 'epoch': 1.52} {'loss': 0.2643, 'learning_rate': 2.89255907132e-06, 'epoch': 1.52} {'loss': 0.3277, 'learning_rate': 2.8923227316280967e-06, 'epoch': 1.52} {'loss': 0.2829, 'learning_rate': 2.8920863999594127e-06, 'epoch': 1.52} {'loss': 0.2223, 'learning_rate': 2.891850076314211e-06, 'epoch': 1.52} {'loss': 0.2655, 'learning_rate': 2.891613760692755e-06, 'epoch': 1.52} {'loss': 0.3947, 'learning_rate': 2.89137745309532e-06, 'epoch': 1.52} {'loss': 0.2381, 'learning_rate': 2.8911411535221647e-06, 'epoch': 1.52} {'loss': 0.2942, 'learning_rate': 2.8909048619735613e-06, 'epoch': 1.52} {'loss': 0.3719, 'learning_rate': 2.8906685784497722e-06, 'epoch': 1.52} {'loss': 0.3881, 'learning_rate': 2.8904323029510693e-06, 'epoch': 1.52} {'loss': 0.3619, 'learning_rate': 2.8901960354777134e-06, 'epoch': 1.52} {'loss': 0.3711, 'learning_rate': 2.889959776029977e-06, 'epoch': 1.52} {'loss': 0.3559, 'learning_rate': 2.889723524608121e-06, 'epoch': 1.52} {'loss': 0.2367, 'learning_rate': 2.8894872812124185e-06, 'epoch': 1.52} {'loss': 0.374, 'learning_rate': 2.8892510458431288e-06, 'epoch': 1.52} {'loss': 0.408, 'learning_rate': 2.889014818500526e-06, 'epoch': 1.52} {'loss': 0.233, 'learning_rate': 2.888778599184874e-06, 'epoch': 1.52} {'loss': 0.4631, 'learning_rate': 2.8885423878964345e-06, 'epoch': 1.52} {'loss': 0.277, 'learning_rate': 2.888306184635482e-06, 'epoch': 1.52} {'loss': 0.2915, 'learning_rate': 2.888069989402277e-06, 'epoch': 1.52} {'loss': 0.2405, 'learning_rate': 2.8878338021970907e-06, 'epoch': 1.52} {'loss': 0.4123, 'learning_rate': 2.8875976230201853e-06, 'epoch': 1.52} {'loss': 0.1863, 'learning_rate': 2.8873614518718316e-06, 'epoch': 1.52} {'loss': 0.5283, 'learning_rate': 2.8871252887522916e-06, 'epoch': 1.52} {'loss': 0.261, 'learning_rate': 2.8868891336618386e-06, 'epoch': 1.52} {'loss': 0.2988, 'learning_rate': 2.8866529866007308e-06, 'epoch': 1.52} {'loss': 0.3711, 'learning_rate': 2.8864168475692432e-06, 'epoch': 1.52} {'loss': 0.3452, 'learning_rate': 2.886180716567635e-06, 'epoch': 1.52} {'loss': 0.2321, 'learning_rate': 2.8859445935961783e-06, 'epoch': 1.52} {'loss': 0.2112, 'learning_rate': 2.8857084786551383e-06, 'epoch': 1.52} {'loss': 0.3118, 'learning_rate': 2.8854723717447774e-06, 'epoch': 1.52} {'loss': 0.2197, 'learning_rate': 2.885236272865368e-06, 'epoch': 1.52} {'loss': 0.2616, 'learning_rate': 2.88500018201717e-06, 'epoch': 1.52} {'loss': 0.2861, 'learning_rate': 2.884764099200459e-06, 'epoch': 1.52} {'loss': 0.282, 'learning_rate': 2.8845280244154918e-06, 'epoch': 1.52} {'loss': 0.2959, 'learning_rate': 2.884291957662543e-06, 'epoch': 1.52} {'loss': 0.2921, 'learning_rate': 2.884055898941872e-06, 'epoch': 1.52} {'loss': 0.3028, 'learning_rate': 2.8838198482537514e-06, 'epoch': 1.52} {'loss': 0.3361, 'learning_rate': 2.8835838055984434e-06, 'epoch': 1.52} {'loss': 0.4651, 'learning_rate': 2.883347770976218e-06, 'epoch': 1.52} {'loss': 0.2567, 'learning_rate': 2.883111744387337e-06, 'epoch': 1.52} {'loss': 0.239, 'learning_rate': 2.8828757258320717e-06, 'epoch': 1.52} {'loss': 0.2343, 'learning_rate': 2.8826397153106865e-06, 'epoch': 1.52} {'loss': 0.3371, 'learning_rate': 2.882403712823445e-06, 'epoch': 1.52} {'loss': 0.3549, 'learning_rate': 2.88216771837062e-06, 'epoch': 1.52} {'loss': 0.3362, 'learning_rate': 2.88193173195247e-06, 'epoch': 1.52} {'loss': 0.2972, 'learning_rate': 2.881695753569266e-06, 'epoch': 1.52} {'loss': 0.4045, 'learning_rate': 2.8814597832212744e-06, 'epoch': 1.52} {'loss': 0.3674, 'learning_rate': 2.8812238209087626e-06, 'epoch': 1.52} {'loss': 0.2944, 'learning_rate': 2.8809878666319936e-06, 'epoch': 1.52} {'loss': 0.3177, 'learning_rate': 2.8807519203912383e-06, 'epoch': 1.52} {'loss': 0.2654, 'learning_rate': 2.88051598218676e-06, 'epoch': 1.52} {'loss': 0.209, 'learning_rate': 2.880280052018822e-06, 'epoch': 1.52} {'loss': 0.2605, 'learning_rate': 2.880044129887698e-06, 'epoch': 1.52} {'loss': 0.2255, 'learning_rate': 2.8798082157936468e-06, 'epoch': 1.52} {'loss': 0.2902, 'learning_rate': 2.879572309736941e-06, 'epoch': 1.52} {'loss': 0.2679, 'learning_rate': 2.879336411717841e-06, 'epoch': 1.52} {'loss': 0.4691, 'learning_rate': 2.87910052173662e-06, 'epoch': 1.52} {'loss': 0.2181, 'learning_rate': 2.878864639793536e-06, 'epoch': 1.52} {'loss': 0.439, 'learning_rate': 2.8786287658888636e-06, 'epoch': 1.52} {'loss': 0.3168, 'learning_rate': 2.8783929000228618e-06, 'epoch': 1.52} {'loss': 0.3019, 'learning_rate': 2.878157042195804e-06, 'epoch': 1.52} {'loss': 0.1945, 'learning_rate': 2.8779211924079487e-06, 'epoch': 1.52} {'loss': 0.2736, 'learning_rate': 2.8776853506595693e-06, 'epoch': 1.52} {'loss': 0.2239, 'learning_rate': 2.8774495169509285e-06, 'epoch': 1.52} {'loss': 0.3188, 'learning_rate': 2.87721369128229e-06, 'epoch': 1.52} {'loss': 0.2248, 'learning_rate': 2.8769778736539254e-06, 'epoch': 1.52} {'loss': 0.327, 'learning_rate': 2.8767420640660957e-06, 'epoch': 1.52} {'loss': 0.3072, 'learning_rate': 2.876506262519073e-06, 'epoch': 1.52} {'loss': 0.2473, 'learning_rate': 2.876270469013117e-06, 'epoch': 1.52} {'loss': 0.3655, 'learning_rate': 2.8760346835484998e-06, 'epoch': 1.52} {'loss': 0.4193, 'learning_rate': 2.875798906125482e-06, 'epoch': 1.52} {'loss': 0.2633, 'learning_rate': 2.875563136744335e-06, 'epoch': 1.52} {'loss': 0.3968, 'learning_rate': 2.875327375405319e-06, 'epoch': 1.52} {'loss': 0.4098, 'learning_rate': 2.875091622108708e-06, 'epoch': 1.52} {'loss': 0.1815, 'learning_rate': 2.87485587685476e-06, 'epoch': 1.52} {'loss': 0.2846, 'learning_rate': 2.874620139643748e-06, 'epoch': 1.52} {'loss': 0.3067, 'learning_rate': 2.8743844104759346e-06, 'epoch': 1.52} {'loss': 0.4388, 'learning_rate': 2.8741486893515823e-06, 'epoch': 1.52} {'loss': 0.2094, 'learning_rate': 2.873912976270966e-06, 'epoch': 1.52} {'loss': 0.3492, 'learning_rate': 2.873677271234343e-06, 'epoch': 1.52} {'loss': 0.3321, 'learning_rate': 2.873441574241985e-06, 'epoch': 1.52} {'loss': 0.3178, 'learning_rate': 2.8732058852941546e-06, 'epoch': 1.52} {'loss': 0.3071, 'learning_rate': 2.8729702043911236e-06, 'epoch': 1.52} {'loss': 0.3319, 'learning_rate': 2.872734531533149e-06, 'epoch': 1.52} {'loss': 0.4307, 'learning_rate': 2.8724988667205056e-06, 'epoch': 1.52} {'loss': 0.1522, 'learning_rate': 2.872263209953452e-06, 'epoch': 1.52} {'loss': 0.2673, 'learning_rate': 2.8720275612322625e-06, 'epoch': 1.52} {'loss': 0.1637, 'learning_rate': 2.871791920557193e-06, 'epoch': 1.52} {'loss': 0.3303, 'learning_rate': 2.8715562879285197e-06, 'epoch': 1.52} {'loss': 0.3839, 'learning_rate': 2.871320663346504e-06, 'epoch': 1.52} {'loss': 0.3806, 'learning_rate': 2.871085046811408e-06, 'epoch': 1.52} {'loss': 0.2101, 'learning_rate': 2.870849438323504e-06, 'epoch': 1.52} {'loss': 0.3269, 'learning_rate': 2.870613837883053e-06, 'epoch': 1.52} {'loss': 0.176, 'learning_rate': 2.870378245490326e-06, 'epoch': 1.52} {'loss': 0.2966, 'learning_rate': 2.870142661145583e-06, 'epoch': 1.52} {'loss': 0.4027, 'learning_rate': 2.869907084849096e-06, 'epoch': 1.52} {'loss': 0.1997, 'learning_rate': 2.8696715166011256e-06, 'epoch': 1.52} {'loss': 0.1603, 'learning_rate': 2.869435956401944e-06, 'epoch': 1.52} {'loss': 0.254, 'learning_rate': 2.8692004042518083e-06, 'epoch': 1.52} {'loss': 0.2253, 'learning_rate': 2.8689648601509933e-06, 'epoch': 1.52} {'loss': 0.3839, 'learning_rate': 2.8687293240997583e-06, 'epoch': 1.52} {'loss': 0.3641, 'learning_rate': 2.8684937960983737e-06, 'epoch': 1.52} {'loss': 0.2453, 'learning_rate': 2.8682582761471046e-06, 'epoch': 1.52} {'loss': 0.1888, 'learning_rate': 2.868022764246212e-06, 'epoch': 1.52} {'loss': 0.2887, 'learning_rate': 2.8677872603959687e-06, 'epoch': 1.52} {'loss': 0.3178, 'learning_rate': 2.8675517645966354e-06, 'epoch': 1.52} {'loss': 0.1992, 'learning_rate': 2.867316276848482e-06, 'epoch': 1.52} {'loss': 0.443, 'learning_rate': 2.867080797151769e-06, 'epoch': 1.52} {'loss': 0.169, 'learning_rate': 2.8668453255067686e-06, 'epoch': 1.52} {'loss': 0.2698, 'learning_rate': 2.8666098619137396e-06, 'epoch': 1.52} {'loss': 0.4031, 'learning_rate': 2.866374406372956e-06, 'epoch': 1.52} {'loss': 0.3282, 'learning_rate': 2.8661389588846756e-06, 'epoch': 1.52} {'loss': 0.3223, 'learning_rate': 2.8659035194491703e-06, 'epoch': 1.52} {'loss': 0.3357, 'learning_rate': 2.865668088066701e-06, 'epoch': 1.52} {'loss': 0.3904, 'learning_rate': 2.8654326647375387e-06, 'epoch': 1.52} {'loss': 0.3663, 'learning_rate': 2.8651972494619453e-06, 'epoch': 1.52} {'loss': 0.4522, 'learning_rate': 2.8649618422401846e-06, 'epoch': 1.52} {'loss': 0.4185, 'learning_rate': 2.8647264430725295e-06, 'epoch': 1.52} {'loss': 0.1349, 'learning_rate': 2.8644910519592374e-06, 'epoch': 1.52} {'loss': 0.2929, 'learning_rate': 2.8642556689005806e-06, 'epoch': 1.52} {'loss': 0.4723, 'learning_rate': 2.864020293896821e-06, 'epoch': 1.52} {'loss': 0.2575, 'learning_rate': 2.8637849269482265e-06, 'epoch': 1.52} {'loss': 0.1655, 'learning_rate': 2.8635495680550597e-06, 'epoch': 1.52} {'loss': 0.142, 'learning_rate': 2.863314217217592e-06, 'epoch': 1.52} {'loss': 0.265, 'learning_rate': 2.8630788744360818e-06, 'epoch': 1.52} {'loss': 0.3238, 'learning_rate': 2.8628435397108013e-06, 'epoch': 1.52} {'loss': 0.2104, 'learning_rate': 2.86260821304201e-06, 'epoch': 1.52} {'loss': 0.4019, 'learning_rate': 2.86237289442998e-06, 'epoch': 1.52} {'loss': 0.3059, 'learning_rate': 2.862137583874974e-06, 'epoch': 1.52} {'loss': 0.2079, 'learning_rate': 2.8619022813772547e-06, 'epoch': 1.52} {'loss': 0.2983, 'learning_rate': 2.861666986937093e-06, 'epoch': 1.52} {'loss': 0.2605, 'learning_rate': 2.8614317005547478e-06, 'epoch': 1.52} {'loss': 0.204, 'learning_rate': 2.8611964222304935e-06, 'epoch': 1.52} {'loss': 0.3157, 'learning_rate': 2.8609611519645863e-06, 'epoch': 1.52} {'loss': 0.3677, 'learning_rate': 2.860725889757301e-06, 'epoch': 1.52} {'loss': 0.2889, 'learning_rate': 2.8604906356088947e-06, 'epoch': 1.52} {'loss': 0.3143, 'learning_rate': 2.8602553895196393e-06, 'epoch': 1.52} {'loss': 0.3291, 'learning_rate': 2.860020151489795e-06, 'epoch': 1.52} {'loss': 0.4306, 'learning_rate': 2.8597849215196348e-06, 'epoch': 1.52} {'loss': 0.3004, 'learning_rate': 2.859549699609415e-06, 'epoch': 1.52} {'loss': 0.3572, 'learning_rate': 2.859314485759409e-06, 'epoch': 1.52} {'loss': 0.2464, 'learning_rate': 2.8590792799698796e-06, 'epoch': 1.52} {'loss': 0.3259, 'learning_rate': 2.858844082241089e-06, 'epoch': 1.52} {'loss': 0.2233, 'learning_rate': 2.858608892573308e-06, 'epoch': 1.52} {'loss': 0.2873, 'learning_rate': 2.858373710966793e-06, 'epoch': 1.52} {'loss': 0.148, 'learning_rate': 2.858138537421823e-06, 'epoch': 1.52} {'loss': 0.2204, 'learning_rate': 2.857903371938654e-06, 'epoch': 1.52} {'loss': 0.3044, 'learning_rate': 2.857668214517556e-06, 'epoch': 1.52} {'loss': 0.3505, 'learning_rate': 2.8574330651587924e-06, 'epoch': 1.52} {'loss': 0.2087, 'learning_rate': 2.8571979238626257e-06, 'epoch': 1.52} {'loss': 0.2042, 'learning_rate': 2.8569627906293275e-06, 'epoch': 1.52} {'loss': 0.2988, 'learning_rate': 2.856727665459157e-06, 'epoch': 1.52} {'loss': 0.2631, 'learning_rate': 2.8564925483523854e-06, 'epoch': 1.52} {'loss': 0.3571, 'learning_rate': 2.8562574393092724e-06, 'epoch': 1.52} {'loss': 0.2949, 'learning_rate': 2.856022338330089e-06, 'epoch': 1.52} {'loss': 0.2827, 'learning_rate': 2.855787245415095e-06, 'epoch': 1.52} {'loss': 0.3834, 'learning_rate': 2.8555521605645618e-06, 'epoch': 1.52} {'loss': 0.4144, 'learning_rate': 2.855317083778749e-06, 'epoch': 1.52} {'loss': 0.2416, 'learning_rate': 2.8550820150579274e-06, 'epoch': 1.52} {'loss': 0.287, 'learning_rate': 2.854846954402356e-06, 'epoch': 1.52} {'loss': 0.437, 'learning_rate': 2.8546119018123076e-06, 'epoch': 1.52} {'loss': 0.2351, 'learning_rate': 2.8543768572880424e-06, 'epoch': 1.52} {'loss': 0.4346, 'learning_rate': 2.8541418208298255e-06, 'epoch': 1.52} {'loss': 0.2325, 'learning_rate': 2.853906792437926e-06, 'epoch': 1.52} {'loss': 0.2321, 'learning_rate': 2.853671772112603e-06, 'epoch': 1.52} {'loss': 0.2083, 'learning_rate': 2.853436759854129e-06, 'epoch': 1.52} {'loss': 0.1955, 'learning_rate': 2.8532017556627632e-06, 'epoch': 1.52} {'loss': 0.2325, 'learning_rate': 2.8529667595387768e-06, 'epoch': 1.52} {'loss': 0.2228, 'learning_rate': 2.852731771482429e-06, 'epoch': 1.52} {'loss': 0.2951, 'learning_rate': 2.8524967914939906e-06, 'epoch': 1.52} {'loss': 0.3873, 'learning_rate': 2.8522618195737207e-06, 'epoch': 1.52} {'loss': 0.3381, 'learning_rate': 2.852026855721891e-06, 'epoch': 1.52} {'loss': 0.3168, 'learning_rate': 2.851791899938762e-06, 'epoch': 1.52} {'loss': 0.383, 'learning_rate': 2.8515569522246023e-06, 'epoch': 1.52} {'loss': 0.3156, 'learning_rate': 2.851322012579676e-06, 'epoch': 1.52} {'loss': 0.431, 'learning_rate': 2.8510870810042446e-06, 'epoch': 1.52} {'loss': 0.2968, 'learning_rate': 2.8508521574985793e-06, 'epoch': 1.52} {'loss': 0.3398, 'learning_rate': 2.8506172420629396e-06, 'epoch': 1.52} {'loss': 0.2749, 'learning_rate': 2.8503823346975968e-06, 'epoch': 1.52} {'loss': 0.2494, 'learning_rate': 2.8501474354028093e-06, 'epoch': 1.52} {'loss': 0.3368, 'learning_rate': 2.8499125441788487e-06, 'epoch': 1.52} {'loss': 0.4295, 'learning_rate': 2.8496776610259744e-06, 'epoch': 1.52} {'loss': 0.2727, 'learning_rate': 2.8494427859444585e-06, 'epoch': 1.52} {'loss': 0.2598, 'learning_rate': 2.849207918934558e-06, 'epoch': 1.52} {'loss': 0.3894, 'learning_rate': 2.848973059996545e-06, 'epoch': 1.52} {'loss': 0.2166, 'learning_rate': 2.848738209130678e-06, 'epoch': 1.52} {'loss': 0.351, 'learning_rate': 2.8485033663372284e-06, 'epoch': 1.52} {'loss': 0.2688, 'learning_rate': 2.8482685316164606e-06, 'epoch': 1.52} {'loss': 0.3665, 'learning_rate': 2.8480337049686325e-06, 'epoch': 1.52} {'loss': 0.2574, 'learning_rate': 2.8477988863940186e-06, 'epoch': 1.52} {'loss': 0.3112, 'learning_rate': 2.847564075892876e-06, 'epoch': 1.52} {'loss': 0.2322, 'learning_rate': 2.847329273465477e-06, 'epoch': 1.52} {'loss': 0.3481, 'learning_rate': 2.8470944791120805e-06, 'epoch': 1.52} {'loss': 0.3586, 'learning_rate': 2.8468596928329562e-06, 'epoch': 1.52} {'loss': 0.2107, 'learning_rate': 2.846624914628364e-06, 'epoch': 1.52} {'loss': 0.3819, 'learning_rate': 2.8463901444985752e-06, 'epoch': 1.52} {'loss': 0.2637, 'learning_rate': 2.846155382443849e-06, 'epoch': 1.52} {'loss': 0.3842, 'learning_rate': 2.8459206284644557e-06, 'epoch': 1.52} {'loss': 0.2833, 'learning_rate': 2.845685882560655e-06, 'epoch': 1.52} {'loss': 0.2959, 'learning_rate': 2.8454511447327173e-06, 'epoch': 1.52} {'loss': 0.2408, 'learning_rate': 2.8452164149809047e-06, 'epoch': 1.52} {'loss': 0.1959, 'learning_rate': 2.8449816933054785e-06, 'epoch': 1.52} {'loss': 0.4001, 'learning_rate': 2.8447469797067117e-06, 'epoch': 1.52} {'loss': 0.2943, 'learning_rate': 2.8445122741848606e-06, 'epoch': 1.52} {'loss': 0.3383, 'learning_rate': 2.844277576740199e-06, 'epoch': 1.52} {'loss': 0.3631, 'learning_rate': 2.844042887372983e-06, 'epoch': 1.52} {'loss': 0.3244, 'learning_rate': 2.843808206083485e-06, 'epoch': 1.52} {'loss': 0.3118, 'learning_rate': 2.843573532871964e-06, 'epoch': 1.52} {'loss': 0.2552, 'learning_rate': 2.8433388677386907e-06, 'epoch': 1.52} {'loss': 0.3077, 'learning_rate': 2.8431042106839234e-06, 'epoch': 1.52} {'loss': 0.2948, 'learning_rate': 2.842869561707935e-06, 'epoch': 1.52} {'loss': 0.3639, 'learning_rate': 2.8426349208109817e-06, 'epoch': 1.52} {'loss': 0.3918, 'learning_rate': 2.8424002879933354e-06, 'epoch': 1.52} {'loss': 0.2864, 'learning_rate': 2.8421656632552552e-06, 'epoch': 1.52} {'loss': 0.4165, 'learning_rate': 2.8419310465970117e-06, 'epoch': 1.52} {'loss': 0.3853, 'learning_rate': 2.841696438018867e-06, 'epoch': 1.52} {'loss': 0.1938, 'learning_rate': 2.8414618375210834e-06, 'epoch': 1.52} {'loss': 0.2665, 'learning_rate': 2.84122724510393e-06, 'epoch': 1.52} {'loss': 0.3114, 'learning_rate': 2.8409926607676685e-06, 'epoch': 1.52} {'loss': 0.223, 'learning_rate': 2.840758084512566e-06, 'epoch': 1.52} {'loss': 0.1811, 'learning_rate': 2.8405235163388842e-06, 'epoch': 1.52} {'loss': 0.3822, 'learning_rate': 2.8402889562468926e-06, 'epoch': 1.52} {'loss': 0.3332, 'learning_rate': 2.8400544042368506e-06, 'epoch': 1.52} {'loss': 0.2753, 'learning_rate': 2.839819860309029e-06, 'epoch': 1.52} {'loss': 0.3131, 'learning_rate': 2.839585324463685e-06, 'epoch': 1.52} {'loss': 0.3979, 'learning_rate': 2.8393507967010927e-06, 'epoch': 1.52} {'loss': 0.3769, 'learning_rate': 2.8391162770215063e-06, 'epoch': 1.52} {'loss': 0.3951, 'learning_rate': 2.8388817654252e-06, 'epoch': 1.52} {'loss': 0.2337, 'learning_rate': 2.838647261912435e-06, 'epoch': 1.52} {'loss': 0.2895, 'learning_rate': 2.8384127664834717e-06, 'epoch': 1.52} {'loss': 0.3195, 'learning_rate': 2.8381782791385817e-06, 'epoch': 1.52} {'loss': 0.166, 'learning_rate': 2.8379437998780235e-06, 'epoch': 1.52} {'loss': 0.3516, 'learning_rate': 2.8377093287020674e-06, 'epoch': 1.52} {'loss': 0.3618, 'learning_rate': 2.837474865610973e-06, 'epoch': 1.52} {'loss': 0.3937, 'learning_rate': 2.83724041060501e-06, 'epoch': 1.52} {'loss': 0.4053, 'learning_rate': 2.8370059636844384e-06, 'epoch': 1.52} {'loss': 0.2102, 'learning_rate': 2.8367715248495276e-06, 'epoch': 1.52} {'loss': 0.3168, 'learning_rate': 2.8365370941005356e-06, 'epoch': 1.52} {'loss': 0.283, 'learning_rate': 2.836302671437735e-06, 'epoch': 1.52} {'loss': 0.3258, 'learning_rate': 2.836068256861384e-06, 'epoch': 1.52} {'loss': 0.4976, 'learning_rate': 2.835833850371752e-06, 'epoch': 1.52} {'loss': 0.3606, 'learning_rate': 2.8355994519691012e-06, 'epoch': 1.52} {'loss': 0.3933, 'learning_rate': 2.8353650616536932e-06, 'epoch': 1.52} {'loss': 0.3168, 'learning_rate': 2.8351306794257948e-06, 'epoch': 1.52} {'loss': 0.3459, 'learning_rate': 2.8348963052856727e-06, 'epoch': 1.52} {'loss': 0.377, 'learning_rate': 2.834661939233593e-06, 'epoch': 1.52} {'loss': 0.3758, 'learning_rate': 2.834427581269814e-06, 'epoch': 1.52} {'loss': 0.2886, 'learning_rate': 2.8341932313946064e-06, 'epoch': 1.52} {'loss': 0.34, 'learning_rate': 2.8339588896082325e-06, 'epoch': 1.52} {'loss': 0.2671, 'learning_rate': 2.8337245559109538e-06, 'epoch': 1.52} {'loss': 0.3034, 'learning_rate': 2.83349023030304e-06, 'epoch': 1.52} {'loss': 0.3009, 'learning_rate': 2.833255912784749e-06, 'epoch': 1.52} {'loss': 0.2391, 'learning_rate': 2.833021603356353e-06, 'epoch': 1.52} {'loss': 0.3257, 'learning_rate': 2.8327873020181097e-06, 'epoch': 1.52} {'loss': 0.3162, 'learning_rate': 2.83255300877029e-06, 'epoch': 1.52} {'loss': 0.3317, 'learning_rate': 2.832318723613152e-06, 'epoch': 1.52} {'loss': 0.1832, 'learning_rate': 2.8320844465469657e-06, 'epoch': 1.52} {'loss': 0.4621, 'learning_rate': 2.83185017757199e-06, 'epoch': 1.52} {'loss': 0.3194, 'learning_rate': 2.831615916688496e-06, 'epoch': 1.52} {'loss': 0.2546, 'learning_rate': 2.8313816638967404e-06, 'epoch': 1.52} {'loss': 0.4011, 'learning_rate': 2.8311474191969958e-06, 'epoch': 1.52} {'loss': 0.4167, 'learning_rate': 2.830913182589522e-06, 'epoch': 1.52} {'loss': 0.2173, 'learning_rate': 2.8306789540745804e-06, 'epoch': 1.52} {'loss': 0.2169, 'learning_rate': 2.8304447336524432e-06, 'epoch': 1.52} {'loss': 0.2798, 'learning_rate': 2.8302105213233667e-06, 'epoch': 1.52} {'loss': 0.3695, 'learning_rate': 2.8299763170876226e-06, 'epoch': 1.52} {'loss': 0.3427, 'learning_rate': 2.829742120945469e-06, 'epoch': 1.52} {'loss': 0.3611, 'learning_rate': 2.8295079328971753e-06, 'epoch': 1.52} {'loss': 0.3451, 'learning_rate': 2.8292737529430003e-06, 'epoch': 1.52} {'loss': 0.3384, 'learning_rate': 2.829039581083216e-06, 'epoch': 1.52} {'loss': 0.2357, 'learning_rate': 2.828805417318079e-06, 'epoch': 1.52} {'loss': 0.4625, 'learning_rate': 2.828571261647859e-06, 'epoch': 1.52} {'loss': 0.4035, 'learning_rate': 2.8283371140728167e-06, 'epoch': 1.52} {'loss': 0.2623, 'learning_rate': 2.82810297459322e-06, 'epoch': 1.52} {'loss': 0.3499, 'learning_rate': 2.8278688432093317e-06, 'epoch': 1.52} {'loss': 0.4086, 'learning_rate': 2.8276347199214127e-06, 'epoch': 1.52} {'loss': 0.3868, 'learning_rate': 2.827400604729733e-06, 'epoch': 1.52} {'loss': 0.2804, 'learning_rate': 2.8271664976345515e-06, 'epoch': 1.52} {'loss': 0.3294, 'learning_rate': 2.8269323986361374e-06, 'epoch': 1.52} {'loss': 0.3459, 'learning_rate': 2.8266983077347497e-06, 'epoch': 1.52} {'loss': 0.3292, 'learning_rate': 2.8264642249306586e-06, 'epoch': 1.52} {'loss': 0.353, 'learning_rate': 2.826230150224123e-06, 'epoch': 1.52} {'loss': 0.3448, 'learning_rate': 2.8259960836154122e-06, 'epoch': 1.52} {'loss': 0.3973, 'learning_rate': 2.8257620251047834e-06, 'epoch': 1.52} {'loss': 0.3327, 'learning_rate': 2.825527974692509e-06, 'epoch': 1.52} {'loss': 0.2396, 'learning_rate': 2.8252939323788464e-06, 'epoch': 1.52} {'loss': 0.2591, 'learning_rate': 2.8250598981640655e-06, 'epoch': 1.52} {'loss': 0.2761, 'learning_rate': 2.824825872048427e-06, 'epoch': 1.52} {'loss': 0.2791, 'learning_rate': 2.8245918540321935e-06, 'epoch': 1.52} {'loss': 0.2658, 'learning_rate': 2.824357844115634e-06, 'epoch': 1.52} {'loss': 0.3261, 'learning_rate': 2.824123842299007e-06, 'epoch': 1.52} {'loss': 0.3259, 'learning_rate': 2.8238898485825827e-06, 'epoch': 1.52} {'loss': 0.3788, 'learning_rate': 2.8236558629666187e-06, 'epoch': 1.52} {'loss': 0.1888, 'learning_rate': 2.823421885451386e-06, 'epoch': 1.52} {'loss': 0.2221, 'learning_rate': 2.823187916037142e-06, 'epoch': 1.52} {'loss': 0.27, 'learning_rate': 2.822953954724157e-06, 'epoch': 1.52} {'loss': 0.3573, 'learning_rate': 2.8227200015126897e-06, 'epoch': 1.52} {'loss': 0.323, 'learning_rate': 2.8224860564030097e-06, 'epoch': 1.52} {'loss': 0.2331, 'learning_rate': 2.8222521193953744e-06, 'epoch': 1.52} {'loss': 0.4784, 'learning_rate': 2.8220181904900555e-06, 'epoch': 1.52} {'loss': 0.3124, 'learning_rate': 2.821784269687312e-06, 'epoch': 1.52} {'loss': 0.3657, 'learning_rate': 2.8215503569874068e-06, 'epoch': 1.52} {'loss': 0.2895, 'learning_rate': 2.82131645239061e-06, 'epoch': 1.53} {'loss': 0.4483, 'learning_rate': 2.8210825558971776e-06, 'epoch': 1.53} {'loss': 0.3913, 'learning_rate': 2.820848667507381e-06, 'epoch': 1.53} {'loss': 0.1929, 'learning_rate': 2.8206147872214785e-06, 'epoch': 1.53} {'loss': 0.2195, 'learning_rate': 2.8203809150397386e-06, 'epoch': 1.53} {'loss': 0.3249, 'learning_rate': 2.820147050962422e-06, 'epoch': 1.53} {'loss': 0.3134, 'learning_rate': 2.8199131949897962e-06, 'epoch': 1.53} {'loss': 0.3793, 'learning_rate': 2.8196793471221197e-06, 'epoch': 1.53} {'loss': 0.3857, 'learning_rate': 2.819445507359664e-06, 'epoch': 1.53} {'loss': 0.3648, 'learning_rate': 2.8192116757026843e-06, 'epoch': 1.53} {'loss': 0.3155, 'learning_rate': 2.8189778521514535e-06, 'epoch': 1.53} {'loss': 0.4355, 'learning_rate': 2.81874403670623e-06, 'epoch': 1.53} {'loss': 0.3659, 'learning_rate': 2.8185102293672772e-06, 'epoch': 1.53} {'loss': 0.3631, 'learning_rate': 2.818276430134863e-06, 'epoch': 1.53} {'loss': 0.4582, 'learning_rate': 2.8180426390092464e-06, 'epoch': 1.53} {'loss': 0.295, 'learning_rate': 2.817808855990697e-06, 'epoch': 1.53} {'loss': 0.268, 'learning_rate': 2.817575081079472e-06, 'epoch': 1.53} {'loss': 0.1585, 'learning_rate': 2.817341314275842e-06, 'epoch': 1.53} {'loss': 0.3188, 'learning_rate': 2.817107555580065e-06, 'epoch': 1.53} {'loss': 0.3566, 'learning_rate': 2.8168738049924104e-06, 'epoch': 1.53} {'loss': 0.1533, 'learning_rate': 2.8166400625131373e-06, 'epoch': 1.53} {'loss': 0.3388, 'learning_rate': 2.8164063281425136e-06, 'epoch': 1.53} {'loss': 0.2738, 'learning_rate': 2.816172601880799e-06, 'epoch': 1.53} {'loss': 0.3118, 'learning_rate': 2.815938883728262e-06, 'epoch': 1.53} {'loss': 0.3688, 'learning_rate': 2.8157051736851637e-06, 'epoch': 1.53} {'loss': 0.3637, 'learning_rate': 2.815471471751765e-06, 'epoch': 1.53} {'loss': 0.3707, 'learning_rate': 2.8152377779283357e-06, 'epoch': 1.53} {'loss': 0.3067, 'learning_rate': 2.8150040922151347e-06, 'epoch': 1.53} {'loss': 0.229, 'learning_rate': 2.81477041461243e-06, 'epoch': 1.53} {'loss': 0.3419, 'learning_rate': 2.8145367451204795e-06, 'epoch': 1.53} {'loss': 0.456, 'learning_rate': 2.8143030837395556e-06, 'epoch': 1.53} {'loss': 0.3032, 'learning_rate': 2.8140694304699124e-06, 'epoch': 1.53} {'loss': 0.3705, 'learning_rate': 2.8138357853118226e-06, 'epoch': 1.53} {'loss': 0.2326, 'learning_rate': 2.8136021482655417e-06, 'epoch': 1.53} {'loss': 0.2495, 'learning_rate': 2.813368519331341e-06, 'epoch': 1.53} {'loss': 0.4713, 'learning_rate': 2.8131348985094763e-06, 'epoch': 1.53} {'loss': 0.386, 'learning_rate': 2.81290128580022e-06, 'epoch': 1.53} {'loss': 0.1645, 'learning_rate': 2.812667681203831e-06, 'epoch': 1.53} {'loss': 0.2943, 'learning_rate': 2.8124340847205713e-06, 'epoch': 1.53} {'loss': 0.3641, 'learning_rate': 2.812200496350709e-06, 'epoch': 1.53} {'loss': 0.3505, 'learning_rate': 2.8119669160944994e-06, 'epoch': 1.53} {'loss': 0.2738, 'learning_rate': 2.811733343952219e-06, 'epoch': 1.53} {'loss': 0.2895, 'learning_rate': 2.8114997799241204e-06, 'epoch': 1.53} {'loss': 0.4049, 'learning_rate': 2.811266224010476e-06, 'epoch': 1.53} {'loss': 0.2477, 'learning_rate': 2.8110326762115416e-06, 'epoch': 1.53} {'loss': 0.2791, 'learning_rate': 2.8107991365275864e-06, 'epoch': 1.53} {'loss': 0.2223, 'learning_rate': 2.8105656049588726e-06, 'epoch': 1.53} {'loss': 0.3835, 'learning_rate': 2.81033208150566e-06, 'epoch': 1.53} {'loss': 0.2624, 'learning_rate': 2.810098566168219e-06, 'epoch': 1.53} {'loss': 0.2519, 'learning_rate': 2.809865058946806e-06, 'epoch': 1.53} {'loss': 0.4798, 'learning_rate': 2.8096315598416903e-06, 'epoch': 1.53} {'loss': 0.2648, 'learning_rate': 2.8093980688531307e-06, 'epoch': 1.53} {'loss': 0.2685, 'learning_rate': 2.8091645859813964e-06, 'epoch': 1.53} {'loss': 0.2851, 'learning_rate': 2.8089311112267446e-06, 'epoch': 1.53} {'loss': 0.2868, 'learning_rate': 2.8086976445894467e-06, 'epoch': 1.53} {'loss': 0.2788, 'learning_rate': 2.808464186069757e-06, 'epoch': 1.53} {'loss': 0.4568, 'learning_rate': 2.808230735667947e-06, 'epoch': 1.53} {'loss': 0.1673, 'learning_rate': 2.8079972933842746e-06, 'epoch': 1.53} {'loss': 0.3436, 'learning_rate': 2.8077638592190083e-06, 'epoch': 1.53} {'loss': 0.3412, 'learning_rate': 2.8075304331724085e-06, 'epoch': 1.53} {'loss': 0.3169, 'learning_rate': 2.8072970152447367e-06, 'epoch': 1.53} {'loss': 0.3999, 'learning_rate': 2.807063605436261e-06, 'epoch': 1.53} {'loss': 0.3859, 'learning_rate': 2.8068302037472405e-06, 'epoch': 1.53} {'loss': 0.2222, 'learning_rate': 2.806596810177944e-06, 'epoch': 1.53} {'loss': 0.2879, 'learning_rate': 2.8063634247286277e-06, 'epoch': 1.53} {'loss': 0.3855, 'learning_rate': 2.8061300473995636e-06, 'epoch': 1.53} {'loss': 0.2741, 'learning_rate': 2.805896678191007e-06, 'epoch': 1.53} {'loss': 0.4196, 'learning_rate': 2.805663317103228e-06, 'epoch': 1.53} {'loss': 0.2606, 'learning_rate': 2.8054299641364834e-06, 'epoch': 1.53} {'loss': 0.1742, 'learning_rate': 2.805196619291044e-06, 'epoch': 1.53} {'loss': 0.2517, 'learning_rate': 2.8049632825671667e-06, 'epoch': 1.53} {'loss': 0.3249, 'learning_rate': 2.804729953965121e-06, 'epoch': 1.53} {'loss': 0.2679, 'learning_rate': 2.804496633485165e-06, 'epoch': 1.53} {'loss': 0.4315, 'learning_rate': 2.8042633211275625e-06, 'epoch': 1.53} {'loss': 0.2174, 'learning_rate': 2.8040300168925815e-06, 'epoch': 1.53} {'loss': 0.3744, 'learning_rate': 2.8037967207804783e-06, 'epoch': 1.53} {'loss': 0.3289, 'learning_rate': 2.803563432791524e-06, 'epoch': 1.53} {'loss': 0.3175, 'learning_rate': 2.8033301529259747e-06, 'epoch': 1.53} {'loss': 0.4156, 'learning_rate': 2.803096881184101e-06, 'epoch': 1.53} {'loss': 0.2473, 'learning_rate': 2.8028636175661584e-06, 'epoch': 1.53} {'loss': 0.363, 'learning_rate': 2.802630362072417e-06, 'epoch': 1.53} {'loss': 0.2773, 'learning_rate': 2.8023971147031347e-06, 'epoch': 1.53} {'loss': 0.2243, 'learning_rate': 2.802163875458581e-06, 'epoch': 1.53} {'loss': 0.3723, 'learning_rate': 2.8019306443390114e-06, 'epoch': 1.53} {'loss': 0.2792, 'learning_rate': 2.801697421344698e-06, 'epoch': 1.53} {'loss': 0.1607, 'learning_rate': 2.801464206475898e-06, 'epoch': 1.53} {'loss': 0.2814, 'learning_rate': 2.8012309997328735e-06, 'epoch': 1.53} {'loss': 0.2088, 'learning_rate': 2.8009978011158935e-06, 'epoch': 1.53} {'loss': 0.2967, 'learning_rate': 2.800764610625214e-06, 'epoch': 1.53} {'loss': 0.464, 'learning_rate': 2.800531428261106e-06, 'epoch': 1.53} {'loss': 0.3961, 'learning_rate': 2.8002982540238257e-06, 'epoch': 1.53} {'loss': 0.2407, 'learning_rate': 2.8000650879136425e-06, 'epoch': 1.53} {'loss': 0.3325, 'learning_rate': 2.799831929930814e-06, 'epoch': 1.53} {'loss': 0.4055, 'learning_rate': 2.7995987800756096e-06, 'epoch': 1.53} {'loss': 0.2683, 'learning_rate': 2.7993656383482846e-06, 'epoch': 1.53} {'loss': 0.2841, 'learning_rate': 2.7991325047491115e-06, 'epoch': 1.53} {'loss': 0.2824, 'learning_rate': 2.7988993792783435e-06, 'epoch': 1.53} {'loss': 0.316, 'learning_rate': 2.7986662619362525e-06, 'epoch': 1.53} {'loss': 0.3535, 'learning_rate': 2.798433152723099e-06, 'epoch': 1.53} {'loss': 0.2613, 'learning_rate': 2.7982000516391406e-06, 'epoch': 1.53} {'loss': 0.2768, 'learning_rate': 2.797966958684648e-06, 'epoch': 1.53} {'loss': 0.2332, 'learning_rate': 2.797733873859878e-06, 'epoch': 1.53} {'loss': 0.3742, 'learning_rate': 2.7975007971651013e-06, 'epoch': 1.53} {'loss': 0.4645, 'learning_rate': 2.7972677286005723e-06, 'epoch': 1.53} {'loss': 0.2638, 'learning_rate': 2.7970346681665615e-06, 'epoch': 1.53} {'loss': 0.2754, 'learning_rate': 2.796801615863326e-06, 'epoch': 1.53} {'loss': 0.2395, 'learning_rate': 2.796568571691135e-06, 'epoch': 1.53} {'loss': 0.3978, 'learning_rate': 2.7963355356502452e-06, 'epoch': 1.53} {'loss': 0.2023, 'learning_rate': 2.7961025077409252e-06, 'epoch': 1.53} {'loss': 0.2345, 'learning_rate': 2.795869487963433e-06, 'epoch': 1.53} {'loss': 0.2931, 'learning_rate': 2.7956364763180377e-06, 'epoch': 1.53} {'loss': 0.2934, 'learning_rate': 2.7954034728049984e-06, 'epoch': 1.53} {'loss': 0.376, 'learning_rate': 2.7951704774245747e-06, 'epoch': 1.53} {'loss': 0.3026, 'learning_rate': 2.7949374901770375e-06, 'epoch': 1.53} {'loss': 0.2926, 'learning_rate': 2.7947045110626424e-06, 'epoch': 1.53} {'loss': 0.3606, 'learning_rate': 2.7944715400816593e-06, 'epoch': 1.53} {'loss': 0.3024, 'learning_rate': 2.794238577234344e-06, 'epoch': 1.53} {'loss': 0.1969, 'learning_rate': 2.7940056225209665e-06, 'epoch': 1.53} {'loss': 0.1895, 'learning_rate': 2.793772675941783e-06, 'epoch': 1.53} {'loss': 0.3493, 'learning_rate': 2.793539737497063e-06, 'epoch': 1.53} {'loss': 0.3114, 'learning_rate': 2.793306807187063e-06, 'epoch': 1.53} {'loss': 0.4454, 'learning_rate': 2.7930738850120533e-06, 'epoch': 1.53} {'loss': 0.4641, 'learning_rate': 2.7928409709722883e-06, 'epoch': 1.53} {'loss': 0.4719, 'learning_rate': 2.792608065068039e-06, 'epoch': 1.53} {'loss': 0.504, 'learning_rate': 2.7923751672995646e-06, 'epoch': 1.53} {'loss': 0.2137, 'learning_rate': 2.7921422776671247e-06, 'epoch': 1.53} {'loss': 0.2593, 'learning_rate': 2.79190939617099e-06, 'epoch': 1.53} {'loss': 0.2018, 'learning_rate': 2.791676522811414e-06, 'epoch': 1.53} {'loss': 0.2251, 'learning_rate': 2.7914436575886684e-06, 'epoch': 1.53} {'loss': 0.2406, 'learning_rate': 2.791210800503009e-06, 'epoch': 1.53} {'loss': 0.3286, 'learning_rate': 2.790977951554705e-06, 'epoch': 1.53} {'loss': 0.2871, 'learning_rate': 2.790745110744013e-06, 'epoch': 1.53} {'loss': 0.2919, 'learning_rate': 2.7905122780712012e-06, 'epoch': 1.53} {'loss': 0.2923, 'learning_rate': 2.7902794535365273e-06, 'epoch': 1.53} {'loss': 0.2766, 'learning_rate': 2.7900466371402602e-06, 'epoch': 1.53} {'loss': 0.3125, 'learning_rate': 2.789813828882657e-06, 'epoch': 1.53} {'loss': 0.3792, 'learning_rate': 2.7895810287639858e-06, 'epoch': 1.53} {'loss': 0.2205, 'learning_rate': 2.789348236784506e-06, 'epoch': 1.53} {'loss': 0.3325, 'learning_rate': 2.7891154529444776e-06, 'epoch': 1.53} {'loss': 0.3183, 'learning_rate': 2.78888267724417e-06, 'epoch': 1.53} {'loss': 0.2776, 'learning_rate': 2.788649909683836e-06, 'epoch': 1.53} {'loss': 0.1715, 'learning_rate': 2.7884171502637513e-06, 'epoch': 1.53} {'loss': 0.2495, 'learning_rate': 2.7881843989841695e-06, 'epoch': 1.53} {'loss': 0.3371, 'learning_rate': 2.787951655845359e-06, 'epoch': 1.53} {'loss': 0.3647, 'learning_rate': 2.7877189208475797e-06, 'epoch': 1.53} {'loss': 0.3134, 'learning_rate': 2.7874861939910914e-06, 'epoch': 1.53} {'loss': 0.3164, 'learning_rate': 2.7872534752761627e-06, 'epoch': 1.53} {'loss': 0.1692, 'learning_rate': 2.78702076470305e-06, 'epoch': 1.53} {'loss': 0.2459, 'learning_rate': 2.7867880622720223e-06, 'epoch': 1.53} {'loss': 0.4134, 'learning_rate': 2.7865553679833368e-06, 'epoch': 1.53} {'loss': 0.2017, 'learning_rate': 2.7863226818372615e-06, 'epoch': 1.53} {'loss': 0.2779, 'learning_rate': 2.7860900038340523e-06, 'epoch': 1.53} {'loss': 0.3723, 'learning_rate': 2.785857333973979e-06, 'epoch': 1.53} {'loss': 0.4194, 'learning_rate': 2.785624672257298e-06, 'epoch': 1.53} {'loss': 0.3491, 'learning_rate': 2.7853920186842774e-06, 'epoch': 1.53} {'loss': 0.3802, 'learning_rate': 2.785159373255175e-06, 'epoch': 1.53} {'loss': 0.2779, 'learning_rate': 2.784926735970259e-06, 'epoch': 1.53} {'loss': 0.3215, 'learning_rate': 2.7846941068297884e-06, 'epoch': 1.53} {'loss': 0.307, 'learning_rate': 2.7844614858340222e-06, 'epoch': 1.53} {'loss': 0.3006, 'learning_rate': 2.7842288729832313e-06, 'epoch': 1.53} {'loss': 0.2247, 'learning_rate': 2.78399626827767e-06, 'epoch': 1.53} {'loss': 0.2801, 'learning_rate': 2.7837636717176075e-06, 'epoch': 1.53} {'loss': 0.3351, 'learning_rate': 2.7835310833033012e-06, 'epoch': 1.53} {'loss': 0.3525, 'learning_rate': 2.783298503035019e-06, 'epoch': 1.53} {'loss': 0.318, 'learning_rate': 2.783065930913017e-06, 'epoch': 1.53} {'loss': 0.3888, 'learning_rate': 2.782833366937565e-06, 'epoch': 1.53} {'loss': 0.3834, 'learning_rate': 2.7826008111089173e-06, 'epoch': 1.53} {'loss': 0.2455, 'learning_rate': 2.782368263427345e-06, 'epoch': 1.53} {'loss': 0.434, 'learning_rate': 2.7821357238931036e-06, 'epoch': 1.53} {'loss': 0.199, 'learning_rate': 2.781903192506461e-06, 'epoch': 1.53} {'loss': 0.2906, 'learning_rate': 2.7816706692676774e-06, 'epoch': 1.53} {'loss': 0.2292, 'learning_rate': 2.781438154177012e-06, 'epoch': 1.53} {'loss': 0.2899, 'learning_rate': 2.7812056472347327e-06, 'epoch': 1.53} {'loss': 0.2331, 'learning_rate': 2.7809731484410964e-06, 'epoch': 1.53} {'loss': 0.2668, 'learning_rate': 2.7807406577963727e-06, 'epoch': 1.53} {'loss': 0.4612, 'learning_rate': 2.7805081753008157e-06, 'epoch': 1.53} {'loss': 0.2586, 'learning_rate': 2.7802757009546953e-06, 'epoch': 1.53} {'loss': 0.3782, 'learning_rate': 2.7800432347582685e-06, 'epoch': 1.53} {'loss': 0.2793, 'learning_rate': 2.779810776711803e-06, 'epoch': 1.53} {'loss': 0.3307, 'learning_rate': 2.7795783268155542e-06, 'epoch': 1.53} {'loss': 0.2819, 'learning_rate': 2.779345885069792e-06, 'epoch': 1.53} {'loss': 0.3065, 'learning_rate': 2.779113451474772e-06, 'epoch': 1.53} {'loss': 0.2063, 'learning_rate': 2.778881026030763e-06, 'epoch': 1.53} {'loss': 0.1748, 'learning_rate': 2.7786486087380216e-06, 'epoch': 1.53} {'loss': 0.3642, 'learning_rate': 2.778416199596815e-06, 'epoch': 1.53} {'loss': 0.3049, 'learning_rate': 2.7781837986074046e-06, 'epoch': 1.53} {'loss': 0.3582, 'learning_rate': 2.7779514057700475e-06, 'epoch': 1.53} {'loss': 0.2241, 'learning_rate': 2.7777190210850124e-06, 'epoch': 1.53} {'loss': 0.271, 'learning_rate': 2.777486644552556e-06, 'epoch': 1.53} {'loss': 0.3871, 'learning_rate': 2.7772542761729483e-06, 'epoch': 1.53} {'loss': 0.2637, 'learning_rate': 2.7770219159464427e-06, 'epoch': 1.53} {'loss': 0.3128, 'learning_rate': 2.776789563873309e-06, 'epoch': 1.53} {'loss': 0.3594, 'learning_rate': 2.7765572199538037e-06, 'epoch': 1.53} {'loss': 0.3145, 'learning_rate': 2.776324884188194e-06, 'epoch': 1.53} {'loss': 0.4724, 'learning_rate': 2.776092556576737e-06, 'epoch': 1.53} {'loss': 0.3543, 'learning_rate': 2.775860237119702e-06, 'epoch': 1.53} {'loss': 0.3495, 'learning_rate': 2.7756279258173437e-06, 'epoch': 1.53} {'loss': 0.2881, 'learning_rate': 2.7753956226699295e-06, 'epoch': 1.53} {'loss': 0.358, 'learning_rate': 2.7751633276777214e-06, 'epoch': 1.53} {'loss': 0.3908, 'learning_rate': 2.7749310408409757e-06, 'epoch': 1.53} {'loss': 0.3969, 'learning_rate': 2.774698762159963e-06, 'epoch': 1.53} {'loss': 0.2456, 'learning_rate': 2.774466491634937e-06, 'epoch': 1.53} {'loss': 0.4256, 'learning_rate': 2.7742342292661683e-06, 'epoch': 1.53} {'loss': 0.215, 'learning_rate': 2.7740019750539125e-06, 'epoch': 1.53} {'loss': 0.3072, 'learning_rate': 2.7737697289984366e-06, 'epoch': 1.53} {'loss': 0.3125, 'learning_rate': 2.773537491099998e-06, 'epoch': 1.53} {'loss': 0.3146, 'learning_rate': 2.773305261358864e-06, 'epoch': 1.53} {'loss': 0.17, 'learning_rate': 2.7730730397752913e-06, 'epoch': 1.53} {'loss': 0.1736, 'learning_rate': 2.772840826349549e-06, 'epoch': 1.53} {'loss': 0.2719, 'learning_rate': 2.7726086210818905e-06, 'epoch': 1.53} {'loss': 0.2732, 'learning_rate': 2.7723764239725857e-06, 'epoch': 1.53} {'loss': 0.4474, 'learning_rate': 2.7721442350218943e-06, 'epoch': 1.53} {'loss': 0.283, 'learning_rate': 2.771912054230075e-06, 'epoch': 1.53} {'loss': 0.2668, 'learning_rate': 2.7716798815973944e-06, 'epoch': 1.53} {'loss': 0.3977, 'learning_rate': 2.7714477171241094e-06, 'epoch': 1.53} {'loss': 0.2747, 'learning_rate': 2.7712155608104898e-06, 'epoch': 1.53} {'loss': 0.3537, 'learning_rate': 2.770983412656789e-06, 'epoch': 1.53} {'loss': 0.3988, 'learning_rate': 2.770751272663277e-06, 'epoch': 1.53} {'loss': 0.2411, 'learning_rate': 2.770519140830209e-06, 'epoch': 1.53} {'loss': 0.3454, 'learning_rate': 2.770287017157852e-06, 'epoch': 1.53} {'loss': 0.2022, 'learning_rate': 2.770054901646465e-06, 'epoch': 1.53} {'loss': 0.3439, 'learning_rate': 2.769822794296313e-06, 'epoch': 1.53} {'loss': 0.3124, 'learning_rate': 2.7695906951076536e-06, 'epoch': 1.53} {'loss': 0.3561, 'learning_rate': 2.769358604080754e-06, 'epoch': 1.53} {'loss': 0.2848, 'learning_rate': 2.7691265212158734e-06, 'epoch': 1.53} {'loss': 0.4774, 'learning_rate': 2.7688944465132717e-06, 'epoch': 1.53} {'loss': 0.378, 'learning_rate': 2.768662379973216e-06, 'epoch': 1.53} {'loss': 0.345, 'learning_rate': 2.7684303215959616e-06, 'epoch': 1.53} {'loss': 0.2381, 'learning_rate': 2.768198271381778e-06, 'epoch': 1.53} {'loss': 0.297, 'learning_rate': 2.7679662293309207e-06, 'epoch': 1.53} {'loss': 0.333, 'learning_rate': 2.7677341954436566e-06, 'epoch': 1.53} {'loss': 0.1987, 'learning_rate': 2.767502169720242e-06, 'epoch': 1.53} {'loss': 0.2732, 'learning_rate': 2.767270152160946e-06, 'epoch': 1.53} {'loss': 0.3176, 'learning_rate': 2.767038142766023e-06, 'epoch': 1.53} {'loss': 0.4181, 'learning_rate': 2.7668061415357416e-06, 'epoch': 1.53} {'loss': 0.2517, 'learning_rate': 2.766574148470358e-06, 'epoch': 1.53} {'loss': 0.249, 'learning_rate': 2.7663421635701394e-06, 'epoch': 1.53} {'loss': 0.3412, 'learning_rate': 2.7661101868353447e-06, 'epoch': 1.53} {'loss': 0.4037, 'learning_rate': 2.7658782182662335e-06, 'epoch': 1.53} {'loss': 0.4126, 'learning_rate': 2.765646257863069e-06, 'epoch': 1.53} {'loss': 0.3971, 'learning_rate': 2.7654143056261153e-06, 'epoch': 1.53} {'loss': 0.1968, 'learning_rate': 2.7651823615556363e-06, 'epoch': 1.53} {'loss': 0.2847, 'learning_rate': 2.764950425651888e-06, 'epoch': 1.53} {'loss': 0.2669, 'learning_rate': 2.7647184979151366e-06, 'epoch': 1.53} {'loss': 0.2531, 'learning_rate': 2.764486578345643e-06, 'epoch': 1.53} {'loss': 0.4228, 'learning_rate': 2.764254666943664e-06, 'epoch': 1.53} {'loss': 0.4135, 'learning_rate': 2.7640227637094695e-06, 'epoch': 1.53} {'loss': 0.3722, 'learning_rate': 2.7637908686433148e-06, 'epoch': 1.53} {'loss': 0.3826, 'learning_rate': 2.7635589817454668e-06, 'epoch': 1.53} {'loss': 0.3145, 'learning_rate': 2.7633271030161813e-06, 'epoch': 1.53} {'loss': 0.3035, 'learning_rate': 2.763095232455727e-06, 'epoch': 1.53} {'loss': 0.3198, 'learning_rate': 2.762863370064358e-06, 'epoch': 1.53} {'loss': 0.3052, 'learning_rate': 2.7626315158423435e-06, 'epoch': 1.53} {'loss': 0.2845, 'learning_rate': 2.762399669789939e-06, 'epoch': 1.53} {'loss': 0.3425, 'learning_rate': 2.762167831907412e-06, 'epoch': 1.53} {'loss': 0.2588, 'learning_rate': 2.761936002195018e-06, 'epoch': 1.53} {'loss': 0.3751, 'learning_rate': 2.7617041806530252e-06, 'epoch': 1.53} {'loss': 0.1141, 'learning_rate': 2.7614723672816914e-06, 'epoch': 1.53} {'loss': 0.4132, 'learning_rate': 2.7612405620812765e-06, 'epoch': 1.53} {'loss': 0.1947, 'learning_rate': 2.7610087650520466e-06, 'epoch': 1.53} {'loss': 0.3239, 'learning_rate': 2.760776976194259e-06, 'epoch': 1.53} {'loss': 0.3568, 'learning_rate': 2.7605451955081806e-06, 'epoch': 1.53} {'loss': 0.3014, 'learning_rate': 2.7603134229940663e-06, 'epoch': 1.53} {'loss': 0.3405, 'learning_rate': 2.760081658652185e-06, 'epoch': 1.53} {'loss': 0.495, 'learning_rate': 2.7598499024827916e-06, 'epoch': 1.53} {'loss': 0.2706, 'learning_rate': 2.7596181544861544e-06, 'epoch': 1.53} {'loss': 0.3638, 'learning_rate': 2.7593864146625283e-06, 'epoch': 1.53} {'loss': 0.3078, 'learning_rate': 2.7591546830121806e-06, 'epoch': 1.53} {'loss': 0.2769, 'learning_rate': 2.758922959535367e-06, 'epoch': 1.53} {'loss': 0.3312, 'learning_rate': 2.7586912442323568e-06, 'epoch': 1.53} {'loss': 0.2677, 'learning_rate': 2.7584595371034062e-06, 'epoch': 1.53} {'loss': 0.2681, 'learning_rate': 2.7582278381487747e-06, 'epoch': 1.53} {'loss': 0.3872, 'learning_rate': 2.75799614736873e-06, 'epoch': 1.53} {'loss': 0.3307, 'learning_rate': 2.757764464763528e-06, 'epoch': 1.53} {'loss': 0.3701, 'learning_rate': 2.757532790333435e-06, 'epoch': 1.53} {'loss': 0.3307, 'learning_rate': 2.7573011240787073e-06, 'epoch': 1.53} {'loss': 0.1302, 'learning_rate': 2.757069465999613e-06, 'epoch': 1.53} {'loss': 0.3139, 'learning_rate': 2.756837816096407e-06, 'epoch': 1.53} {'loss': 0.3881, 'learning_rate': 2.756606174369356e-06, 'epoch': 1.53} {'loss': 0.3384, 'learning_rate': 2.756374540818717e-06, 'epoch': 1.53} {'loss': 0.3383, 'learning_rate': 2.756142915444756e-06, 'epoch': 1.53} {'loss': 0.3106, 'learning_rate': 2.75591129824773e-06, 'epoch': 1.53} {'loss': 0.4426, 'learning_rate': 2.755679689227905e-06, 'epoch': 1.53} {'loss': 0.3931, 'learning_rate': 2.7554480883855405e-06, 'epoch': 1.53} {'loss': 0.3681, 'learning_rate': 2.7552164957208938e-06, 'epoch': 1.53} {'loss': 0.3656, 'learning_rate': 2.754984911234234e-06, 'epoch': 1.53} {'loss': 0.3779, 'learning_rate': 2.754753334925815e-06, 'epoch': 1.53} {'loss': 0.3134, 'learning_rate': 2.7545217667959044e-06, 'epoch': 1.53} {'loss': 0.4133, 'learning_rate': 2.7542902068447585e-06, 'epoch': 1.53} {'loss': 0.3872, 'learning_rate': 2.7540586550726433e-06, 'epoch': 1.53} {'loss': 0.2401, 'learning_rate': 2.7538271114798154e-06, 'epoch': 1.53} {'loss': 0.4052, 'learning_rate': 2.7535955760665423e-06, 'epoch': 1.53} {'loss': 0.2102, 'learning_rate': 2.7533640488330783e-06, 'epoch': 1.53} {'loss': 0.3568, 'learning_rate': 2.753132529779692e-06, 'epoch': 1.53} {'loss': 0.3862, 'learning_rate': 2.7529010189066374e-06, 'epoch': 1.53} {'loss': 0.3654, 'learning_rate': 2.7526695162141827e-06, 'epoch': 1.53} {'loss': 0.213, 'learning_rate': 2.7524380217025857e-06, 'epoch': 1.53} {'loss': 0.3973, 'learning_rate': 2.752206535372105e-06, 'epoch': 1.53} {'loss': 0.3333, 'learning_rate': 2.7519750572230074e-06, 'epoch': 1.53} {'loss': 0.2863, 'learning_rate': 2.75174358725555e-06, 'epoch': 1.53} {'loss': 0.2804, 'learning_rate': 2.751512125469997e-06, 'epoch': 1.53} {'loss': 0.351, 'learning_rate': 2.7512806718666076e-06, 'epoch': 1.53} {'loss': 0.2212, 'learning_rate': 2.7510492264456457e-06, 'epoch': 1.53} {'loss': 0.2654, 'learning_rate': 2.7508177892073673e-06, 'epoch': 1.53} {'loss': 0.21, 'learning_rate': 2.750586360152041e-06, 'epoch': 1.53} {'loss': 0.4223, 'learning_rate': 2.75035493927992e-06, 'epoch': 1.53} {'loss': 0.2923, 'learning_rate': 2.750123526591274e-06, 'epoch': 1.53} {'loss': 0.2176, 'learning_rate': 2.749892122086356e-06, 'epoch': 1.53} {'loss': 0.3796, 'learning_rate': 2.749660725765435e-06, 'epoch': 1.53} {'loss': 0.2969, 'learning_rate': 2.7494293376287685e-06, 'epoch': 1.53} {'loss': 0.3536, 'learning_rate': 2.7491979576766137e-06, 'epoch': 1.53} {'loss': 0.3923, 'learning_rate': 2.7489665859092383e-06, 'epoch': 1.53} {'loss': 0.2709, 'learning_rate': 2.748735222326898e-06, 'epoch': 1.53} {'loss': 0.2153, 'learning_rate': 2.7485038669298604e-06, 'epoch': 1.53} {'loss': 0.3248, 'learning_rate': 2.74827251971838e-06, 'epoch': 1.53} {'loss': 0.317, 'learning_rate': 2.748041180692723e-06, 'epoch': 1.53} {'loss': 0.4206, 'learning_rate': 2.747809849853146e-06, 'epoch': 1.53} {'loss': 0.2637, 'learning_rate': 2.7475785271999158e-06, 'epoch': 1.53} {'loss': 0.2857, 'learning_rate': 2.7473472127332867e-06, 'epoch': 1.53} {'loss': 0.3455, 'learning_rate': 2.747115906453528e-06, 'epoch': 1.53} {'loss': 0.3943, 'learning_rate': 2.7468846083608915e-06, 'epoch': 1.53} {'loss': 0.3252, 'learning_rate': 2.7466533184556467e-06, 'epoch': 1.53} {'loss': 0.3058, 'learning_rate': 2.746422036738051e-06, 'epoch': 1.53} {'loss': 0.2966, 'learning_rate': 2.746190763208363e-06, 'epoch': 1.53} {'loss': 0.3309, 'learning_rate': 2.745959497866848e-06, 'epoch': 1.53} {'loss': 0.3686, 'learning_rate': 2.745728240713763e-06, 'epoch': 1.53} {'loss': 0.3256, 'learning_rate': 2.7454969917493747e-06, 'epoch': 1.53} {'loss': 0.426, 'learning_rate': 2.745265750973938e-06, 'epoch': 1.53} {'loss': 0.349, 'learning_rate': 2.745034518387719e-06, 'epoch': 1.53} {'loss': 0.3204, 'learning_rate': 2.7448032939909743e-06, 'epoch': 1.53} {'loss': 0.2958, 'learning_rate': 2.744572077783969e-06, 'epoch': 1.53} {'loss': 0.3413, 'learning_rate': 2.744340869766959e-06, 'epoch': 1.53} {'loss': 0.4442, 'learning_rate': 2.7441096699402124e-06, 'epoch': 1.53} {'loss': 0.4492, 'learning_rate': 2.743878478303983e-06, 'epoch': 1.53} {'loss': 0.2224, 'learning_rate': 2.743647294858538e-06, 'epoch': 1.53} {'loss': 0.3316, 'learning_rate': 2.7434161196041344e-06, 'epoch': 1.53} {'loss': 0.4331, 'learning_rate': 2.7431849525410324e-06, 'epoch': 1.53} {'loss': 0.3469, 'learning_rate': 2.742953793669497e-06, 'epoch': 1.53} {'loss': 0.2408, 'learning_rate': 2.7427226429897802e-06, 'epoch': 1.53} {'loss': 0.4327, 'learning_rate': 2.742491500502157e-06, 'epoch': 1.53} {'loss': 0.3965, 'learning_rate': 2.7422603662068768e-06, 'epoch': 1.53} {'loss': 0.361, 'learning_rate': 2.742029240104207e-06, 'epoch': 1.53} {'loss': 0.2455, 'learning_rate': 2.7417981221944046e-06, 'epoch': 1.53} {'loss': 0.4321, 'learning_rate': 2.7415670124777337e-06, 'epoch': 1.53} {'loss': 0.3299, 'learning_rate': 2.7413359109544536e-06, 'epoch': 1.53} {'loss': 0.2868, 'learning_rate': 2.7411048176248222e-06, 'epoch': 1.53} {'loss': 0.2984, 'learning_rate': 2.7408737324891055e-06, 'epoch': 1.53} {'loss': 0.3985, 'learning_rate': 2.7406426555475597e-06, 'epoch': 1.53} {'loss': 0.4049, 'learning_rate': 2.740411586800451e-06, 'epoch': 1.53} {'loss': 0.4145, 'learning_rate': 2.740180526248033e-06, 'epoch': 1.53} {'loss': 0.2766, 'learning_rate': 2.739949473890575e-06, 'epoch': 1.53} {'loss': 0.3345, 'learning_rate': 2.73971842972833e-06, 'epoch': 1.53} {'loss': 0.2375, 'learning_rate': 2.7394873937615653e-06, 'epoch': 1.53} {'loss': 0.2775, 'learning_rate': 2.7392563659905358e-06, 'epoch': 1.53} {'loss': 0.2987, 'learning_rate': 2.739025346415508e-06, 'epoch': 1.53} {'loss': 0.2886, 'learning_rate': 2.7387943350367365e-06, 'epoch': 1.53} {'loss': 0.3037, 'learning_rate': 2.738563331854489e-06, 'epoch': 1.53} {'loss': 0.2024, 'learning_rate': 2.7383323368690216e-06, 'epoch': 1.53} {'loss': 0.1684, 'learning_rate': 2.738101350080594e-06, 'epoch': 1.53} {'loss': 0.2752, 'learning_rate': 2.7378703714894727e-06, 'epoch': 1.53} {'loss': 0.3812, 'learning_rate': 2.7376394010959108e-06, 'epoch': 1.53} {'loss': 0.2166, 'learning_rate': 2.7374084389001764e-06, 'epoch': 1.53} {'loss': 0.337, 'learning_rate': 2.7371774849025236e-06, 'epoch': 1.53} {'loss': 0.3813, 'learning_rate': 2.7369465391032202e-06, 'epoch': 1.53} {'loss': 0.3419, 'learning_rate': 2.7367156015025185e-06, 'epoch': 1.53} {'loss': 0.2638, 'learning_rate': 2.7364846721006875e-06, 'epoch': 1.53} {'loss': 0.3663, 'learning_rate': 2.7362537508979812e-06, 'epoch': 1.53} {'loss': 0.3177, 'learning_rate': 2.736022837894666e-06, 'epoch': 1.53} {'loss': 0.2971, 'learning_rate': 2.7357919330909967e-06, 'epoch': 1.53} {'loss': 0.1233, 'learning_rate': 2.73556103648724e-06, 'epoch': 1.53} {'loss': 0.3013, 'learning_rate': 2.735330148083654e-06, 'epoch': 1.53} {'loss': 0.1822, 'learning_rate': 2.7350992678804957e-06, 'epoch': 1.53} {'loss': 0.3153, 'learning_rate': 2.734868395878031e-06, 'epoch': 1.53} {'loss': 0.3906, 'learning_rate': 2.734637532076516e-06, 'epoch': 1.53} {'loss': 0.2451, 'learning_rate': 2.7344066764762156e-06, 'epoch': 1.53} {'loss': 0.3587, 'learning_rate': 2.734175829077387e-06, 'epoch': 1.53} {'loss': 0.2188, 'learning_rate': 2.733944989880294e-06, 'epoch': 1.53} {'loss': 0.2761, 'learning_rate': 2.7337141588851936e-06, 'epoch': 1.53} {'loss': 0.2805, 'learning_rate': 2.7334833360923506e-06, 'epoch': 1.53} {'loss': 0.251, 'learning_rate': 2.73325252150202e-06, 'epoch': 1.53} {'loss': 0.4308, 'learning_rate': 2.7330217151144676e-06, 'epoch': 1.53} {'loss': 0.2579, 'learning_rate': 2.7327909169299503e-06, 'epoch': 1.53} {'loss': 0.2461, 'learning_rate': 2.7325601269487323e-06, 'epoch': 1.53} {'loss': 0.3502, 'learning_rate': 2.732329345171072e-06, 'epoch': 1.53} {'loss': 0.2593, 'learning_rate': 2.732098571597227e-06, 'epoch': 1.53} {'loss': 0.3521, 'learning_rate': 2.731867806227464e-06, 'epoch': 1.53} {'loss': 0.2422, 'learning_rate': 2.731637049062037e-06, 'epoch': 1.53} {'loss': 0.2365, 'learning_rate': 2.7314063001012126e-06, 'epoch': 1.53} {'loss': 0.3696, 'learning_rate': 2.731175559345245e-06, 'epoch': 1.53} {'loss': 0.2758, 'learning_rate': 2.7309448267944014e-06, 'epoch': 1.53} {'loss': 0.2437, 'learning_rate': 2.730714102448936e-06, 'epoch': 1.53} {'loss': 0.3167, 'learning_rate': 2.730483386309114e-06, 'epoch': 1.53} {'loss': 0.3256, 'learning_rate': 2.7302526783751916e-06, 'epoch': 1.53} {'loss': 0.2729, 'learning_rate': 2.7300219786474347e-06, 'epoch': 1.53} {'loss': 0.2026, 'learning_rate': 2.729791287126097e-06, 'epoch': 1.53} {'loss': 0.3843, 'learning_rate': 2.7295606038114453e-06, 'epoch': 1.53} {'loss': 0.3273, 'learning_rate': 2.729329928703738e-06, 'epoch': 1.53} {'loss': 0.3593, 'learning_rate': 2.7290992618032308e-06, 'epoch': 1.53} {'loss': 0.305, 'learning_rate': 2.7288686031101918e-06, 'epoch': 1.53} {'loss': 0.3949, 'learning_rate': 2.728637952624874e-06, 'epoch': 1.53} {'loss': 0.3517, 'learning_rate': 2.728407310347544e-06, 'epoch': 1.53} {'loss': 0.3105, 'learning_rate': 2.7281766762784567e-06, 'epoch': 1.53} {'loss': 0.3946, 'learning_rate': 2.727946050417878e-06, 'epoch': 1.53} {'loss': 0.2848, 'learning_rate': 2.7277154327660628e-06, 'epoch': 1.53} {'loss': 0.4664, 'learning_rate': 2.7274848233232763e-06, 'epoch': 1.53} {'loss': 0.2602, 'learning_rate': 2.7272542220897735e-06, 'epoch': 1.53} {'loss': 0.3596, 'learning_rate': 2.7270236290658216e-06, 'epoch': 1.53} {'loss': 0.3303, 'learning_rate': 2.726793044251673e-06, 'epoch': 1.53} {'loss': 0.2163, 'learning_rate': 2.7265624676475954e-06, 'epoch': 1.53} {'loss': 0.3222, 'learning_rate': 2.726331899253846e-06, 'epoch': 1.53} {'loss': 0.3841, 'learning_rate': 2.7261013390706814e-06, 'epoch': 1.53} {'loss': 0.2791, 'learning_rate': 2.725870787098368e-06, 'epoch': 1.53} {'loss': 0.3107, 'learning_rate': 2.72564024333716e-06, 'epoch': 1.53} {'loss': 0.3533, 'learning_rate': 2.7254097077873243e-06, 'epoch': 1.53} {'loss': 0.3132, 'learning_rate': 2.7251791804491147e-06, 'epoch': 1.53} {'loss': 0.2277, 'learning_rate': 2.724948661322798e-06, 'epoch': 1.53} {'loss': 0.3961, 'learning_rate': 2.7247181504086272e-06, 'epoch': 1.53} {'loss': 0.3399, 'learning_rate': 2.7244876477068694e-06, 'epoch': 1.53} {'loss': 0.3364, 'learning_rate': 2.7242571532177787e-06, 'epoch': 1.53} {'loss': 0.3461, 'learning_rate': 2.7240266669416203e-06, 'epoch': 1.53} {'loss': 0.3273, 'learning_rate': 2.7237961888786504e-06, 'epoch': 1.53} {'loss': 0.2604, 'learning_rate': 2.723565719029132e-06, 'epoch': 1.53} {'loss': 0.2912, 'learning_rate': 2.723335257393326e-06, 'epoch': 1.53} {'loss': 0.4183, 'learning_rate': 2.723104803971487e-06, 'epoch': 1.53} {'loss': 0.4196, 'learning_rate': 2.722874358763883e-06, 'epoch': 1.53} {'loss': 0.2665, 'learning_rate': 2.7226439217707656e-06, 'epoch': 1.53} {'loss': 0.3159, 'learning_rate': 2.722413492992403e-06, 'epoch': 1.53} {'loss': 0.2088, 'learning_rate': 2.722183072429049e-06, 'epoch': 1.53} {'loss': 0.2121, 'learning_rate': 2.721952660080969e-06, 'epoch': 1.53} {'loss': 0.3955, 'learning_rate': 2.7217222559484178e-06, 'epoch': 1.53} {'loss': 0.4428, 'learning_rate': 2.721491860031661e-06, 'epoch': 1.53} {'loss': 0.5987, 'learning_rate': 2.721261472330953e-06, 'epoch': 1.53} {'loss': 0.3022, 'learning_rate': 2.721031092846559e-06, 'epoch': 1.53} {'loss': 0.2304, 'learning_rate': 2.7208007215787334e-06, 'epoch': 1.53} {'loss': 0.345, 'learning_rate': 2.720570358527743e-06, 'epoch': 1.53} {'loss': 0.2297, 'learning_rate': 2.7203400036938453e-06, 'epoch': 1.53} {'loss': 0.4758, 'learning_rate': 2.7201096570772958e-06, 'epoch': 1.53} {'loss': 0.3418, 'learning_rate': 2.719879318678358e-06, 'epoch': 1.53} {'loss': 0.2752, 'learning_rate': 2.719648988497292e-06, 'epoch': 1.53} {'loss': 0.3304, 'learning_rate': 2.7194186665343612e-06, 'epoch': 1.53} {'loss': 0.4017, 'learning_rate': 2.71918835278982e-06, 'epoch': 1.53} {'loss': 0.4089, 'learning_rate': 2.718958047263932e-06, 'epoch': 1.53} {'loss': 0.3243, 'learning_rate': 2.7187277499569576e-06, 'epoch': 1.53} {'loss': 0.3512, 'learning_rate': 2.7184974608691507e-06, 'epoch': 1.53} {'loss': 0.3801, 'learning_rate': 2.7182671800007787e-06, 'epoch': 1.53} {'loss': 0.2867, 'learning_rate': 2.7180369073520953e-06, 'epoch': 1.53} {'loss': 0.3852, 'learning_rate': 2.7178066429233673e-06, 'epoch': 1.53} {'loss': 0.1163, 'learning_rate': 2.7175763867148464e-06, 'epoch': 1.53} {'loss': 0.3487, 'learning_rate': 2.717346138726801e-06, 'epoch': 1.53} {'loss': 0.347, 'learning_rate': 2.717115898959484e-06, 'epoch': 1.53} {'loss': 0.2112, 'learning_rate': 2.7168856674131606e-06, 'epoch': 1.53} {'loss': 0.2254, 'learning_rate': 2.7166554440880867e-06, 'epoch': 1.53} {'loss': 0.36, 'learning_rate': 2.716425228984525e-06, 'epoch': 1.53} {'loss': 0.3481, 'learning_rate': 2.7161950221027323e-06, 'epoch': 1.53} {'loss': 0.3112, 'learning_rate': 2.7159648234429727e-06, 'epoch': 1.53} {'loss': 0.3588, 'learning_rate': 2.7157346330055013e-06, 'epoch': 1.53} {'loss': 0.2335, 'learning_rate': 2.7155044507905824e-06, 'epoch': 1.53} {'loss': 0.4151, 'learning_rate': 2.715274276798475e-06, 'epoch': 1.53} {'loss': 0.3619, 'learning_rate': 2.7150441110294347e-06, 'epoch': 1.53} {'loss': 0.3177, 'learning_rate': 2.714813953483726e-06, 'epoch': 1.53} {'loss': 0.2404, 'learning_rate': 2.7145838041616045e-06, 'epoch': 1.53} {'loss': 0.3812, 'learning_rate': 2.714353663063336e-06, 'epoch': 1.53} {'loss': 0.3675, 'learning_rate': 2.7141235301891734e-06, 'epoch': 1.53} {'loss': 0.2961, 'learning_rate': 2.713893405539383e-06, 'epoch': 1.53} {'loss': 0.3219, 'learning_rate': 2.713663289114219e-06, 'epoch': 1.53} {'loss': 0.324, 'learning_rate': 2.713433180913946e-06, 'epoch': 1.53} {'loss': 0.2787, 'learning_rate': 2.7132030809388177e-06, 'epoch': 1.53} {'loss': 0.2672, 'learning_rate': 2.712972989189101e-06, 'epoch': 1.53} {'loss': 0.3994, 'learning_rate': 2.71274290566505e-06, 'epoch': 1.53} {'loss': 0.3116, 'learning_rate': 2.712512830366928e-06, 'epoch': 1.53} {'loss': 0.3683, 'learning_rate': 2.7122827632949946e-06, 'epoch': 1.53} {'loss': 0.2196, 'learning_rate': 2.712052704449505e-06, 'epoch': 1.53} {'loss': 0.2426, 'learning_rate': 2.7118226538307237e-06, 'epoch': 1.53} {'loss': 0.2443, 'learning_rate': 2.7115926114389066e-06, 'epoch': 1.53} {'loss': 0.2885, 'learning_rate': 2.711362577274319e-06, 'epoch': 1.53} {'loss': 0.4029, 'learning_rate': 2.7111325513372133e-06, 'epoch': 1.53} {'loss': 0.539, 'learning_rate': 2.710902533627856e-06, 'epoch': 1.53} {'loss': 0.3031, 'learning_rate': 2.7106725241465003e-06, 'epoch': 1.53} {'loss': 0.2695, 'learning_rate': 2.710442522893413e-06, 'epoch': 1.53} {'loss': 0.4116, 'learning_rate': 2.7102125298688465e-06, 'epoch': 1.53} {'loss': 0.275, 'learning_rate': 2.7099825450730667e-06, 'epoch': 1.53} {'loss': 0.3854, 'learning_rate': 2.7097525685063277e-06, 'epoch': 1.53} {'loss': 0.3288, 'learning_rate': 2.7095226001688944e-06, 'epoch': 1.53} {'loss': 0.3259, 'learning_rate': 2.709292640061024e-06, 'epoch': 1.54} {'loss': 0.3905, 'learning_rate': 2.709062688182973e-06, 'epoch': 1.54} {'loss': 0.3866, 'learning_rate': 2.708832744535006e-06, 'epoch': 1.54} {'loss': 0.3879, 'learning_rate': 2.708602809117379e-06, 'epoch': 1.54} {'loss': 0.2829, 'learning_rate': 2.7083728819303547e-06, 'epoch': 1.54} {'loss': 0.3185, 'learning_rate': 2.708142962974187e-06, 'epoch': 1.54} {'loss': 0.3538, 'learning_rate': 2.7079130522491436e-06, 'epoch': 1.54} {'loss': 0.2942, 'learning_rate': 2.707683149755477e-06, 'epoch': 1.54} {'loss': 0.1847, 'learning_rate': 2.7074532554934508e-06, 'epoch': 1.54} {'loss': 0.2572, 'learning_rate': 2.707223369463321e-06, 'epoch': 1.54} {'loss': 0.3832, 'learning_rate': 2.7069934916653527e-06, 'epoch': 1.54} {'loss': 0.2782, 'learning_rate': 2.7067636220997983e-06, 'epoch': 1.54} {'loss': 0.2614, 'learning_rate': 2.706533760766924e-06, 'epoch': 1.54} {'loss': 0.2706, 'learning_rate': 2.7063039076669873e-06, 'epoch': 1.54} {'loss': 0.2493, 'learning_rate': 2.7060740628002424e-06, 'epoch': 1.54} {'loss': 0.1848, 'learning_rate': 2.705844226166956e-06, 'epoch': 1.54} {'loss': 0.2838, 'learning_rate': 2.705614397767381e-06, 'epoch': 1.54} {'loss': 0.3214, 'learning_rate': 2.705384577601784e-06, 'epoch': 1.54} {'loss': 0.2283, 'learning_rate': 2.705154765670417e-06, 'epoch': 1.54} {'loss': 0.278, 'learning_rate': 2.704924961973546e-06, 'epoch': 1.54} {'loss': 0.3204, 'learning_rate': 2.704695166511425e-06, 'epoch': 1.54} {'loss': 0.391, 'learning_rate': 2.704465379284319e-06, 'epoch': 1.54} {'loss': 0.4091, 'learning_rate': 2.704235600292482e-06, 'epoch': 1.54} {'loss': 0.3847, 'learning_rate': 2.704005829536177e-06, 'epoch': 1.54} {'loss': 0.371, 'learning_rate': 2.70377606701566e-06, 'epoch': 1.54} {'loss': 0.2534, 'learning_rate': 2.7035463127311956e-06, 'epoch': 1.54} {'loss': 0.185, 'learning_rate': 2.7033165666830395e-06, 'epoch': 1.54} {'loss': 0.3754, 'learning_rate': 2.7030868288714483e-06, 'epoch': 1.54} {'loss': 0.357, 'learning_rate': 2.7028570992966876e-06, 'epoch': 1.54} {'loss': 0.4627, 'learning_rate': 2.7026273779590106e-06, 'epoch': 1.54} {'loss': 0.3325, 'learning_rate': 2.7023976648586824e-06, 'epoch': 1.54} {'loss': 0.3916, 'learning_rate': 2.702167959995957e-06, 'epoch': 1.54} {'loss': 0.4404, 'learning_rate': 2.701938263371099e-06, 'epoch': 1.54} {'loss': 0.2589, 'learning_rate': 2.701708574984362e-06, 'epoch': 1.54} {'loss': 0.2784, 'learning_rate': 2.7014788948360115e-06, 'epoch': 1.54} {'loss': 0.3049, 'learning_rate': 2.7012492229262997e-06, 'epoch': 1.54} {'loss': 0.3499, 'learning_rate': 2.7010195592554935e-06, 'epoch': 1.54} {'loss': 0.4281, 'learning_rate': 2.700789903823845e-06, 'epoch': 1.54} {'loss': 0.2606, 'learning_rate': 2.700560256631619e-06, 'epoch': 1.54} {'loss': 0.3093, 'learning_rate': 2.7003306176790733e-06, 'epoch': 1.54} {'loss': 0.2081, 'learning_rate': 2.700100986966463e-06, 'epoch': 1.54} {'loss': 0.4331, 'learning_rate': 2.6998713644940532e-06, 'epoch': 1.54} {'loss': 0.3454, 'learning_rate': 2.6996417502620974e-06, 'epoch': 1.54} {'loss': 0.2942, 'learning_rate': 2.6994121442708608e-06, 'epoch': 1.54} {'loss': 0.3166, 'learning_rate': 2.6991825465205965e-06, 'epoch': 1.54} {'loss': 0.4091, 'learning_rate': 2.698952957011571e-06, 'epoch': 1.54} {'loss': 0.5378, 'learning_rate': 2.6987233757440357e-06, 'epoch': 1.54} {'loss': 0.2943, 'learning_rate': 2.6984938027182562e-06, 'epoch': 1.54} {'loss': 0.2394, 'learning_rate': 2.6982642379344847e-06, 'epoch': 1.54} {'loss': 0.2928, 'learning_rate': 2.698034681392988e-06, 'epoch': 1.54} {'loss': 0.2762, 'learning_rate': 2.697805133094019e-06, 'epoch': 1.54} {'loss': 0.3272, 'learning_rate': 2.6975755930378434e-06, 'epoch': 1.54} {'loss': 0.2613, 'learning_rate': 2.697346061224715e-06, 'epoch': 1.54} {'loss': 0.3451, 'learning_rate': 2.6971165376548913e-06, 'epoch': 1.54} {'loss': 0.3653, 'learning_rate': 2.696887022328635e-06, 'epoch': 1.54} {'loss': 0.2748, 'learning_rate': 2.6966575152462038e-06, 'epoch': 1.54} {'loss': 0.3936, 'learning_rate': 2.6964280164078605e-06, 'epoch': 1.54} {'loss': 0.5227, 'learning_rate': 2.696198525813858e-06, 'epoch': 1.54} {'loss': 0.3871, 'learning_rate': 2.6959690434644613e-06, 'epoch': 1.54} {'loss': 0.3946, 'learning_rate': 2.6957395693599273e-06, 'epoch': 1.54} {'loss': 0.3591, 'learning_rate': 2.6955101035005115e-06, 'epoch': 1.54} {'loss': 0.3095, 'learning_rate': 2.6952806458864787e-06, 'epoch': 1.54} {'loss': 0.3956, 'learning_rate': 2.6950511965180816e-06, 'epoch': 1.54} {'loss': 0.2832, 'learning_rate': 2.694821755395586e-06, 'epoch': 1.54} {'loss': 0.393, 'learning_rate': 2.694592322519244e-06, 'epoch': 1.54} {'loss': 0.2567, 'learning_rate': 2.694362897889321e-06, 'epoch': 1.54} {'loss': 0.3305, 'learning_rate': 2.6941334815060704e-06, 'epoch': 1.54} {'loss': 0.3542, 'learning_rate': 2.6939040733697574e-06, 'epoch': 1.54} {'loss': 0.3958, 'learning_rate': 2.693674673480633e-06, 'epoch': 1.54} {'loss': 0.404, 'learning_rate': 2.6934452818389643e-06, 'epoch': 1.54} {'loss': 0.3283, 'learning_rate': 2.693215898445004e-06, 'epoch': 1.54} {'loss': 0.4066, 'learning_rate': 2.692986523299016e-06, 'epoch': 1.54} {'loss': 0.3575, 'learning_rate': 2.6927571564012568e-06, 'epoch': 1.54} {'loss': 0.288, 'learning_rate': 2.6925277977519814e-06, 'epoch': 1.54} {'loss': 0.3532, 'learning_rate': 2.692298447351457e-06, 'epoch': 1.54} {'loss': 0.4997, 'learning_rate': 2.6920691051999337e-06, 'epoch': 1.54} {'loss': 0.4319, 'learning_rate': 2.6918397712976785e-06, 'epoch': 1.54} {'loss': 0.3379, 'learning_rate': 2.691610445644943e-06, 'epoch': 1.54} {'loss': 0.3584, 'learning_rate': 2.6913811282419934e-06, 'epoch': 1.54} {'loss': 0.1507, 'learning_rate': 2.6911518190890816e-06, 'epoch': 1.54} {'loss': 0.3471, 'learning_rate': 2.690922518186472e-06, 'epoch': 1.54} {'loss': 0.338, 'learning_rate': 2.6906932255344175e-06, 'epoch': 1.54} {'loss': 0.293, 'learning_rate': 2.6904639411331844e-06, 'epoch': 1.54} {'loss': 0.3613, 'learning_rate': 2.6902346649830246e-06, 'epoch': 1.54} {'loss': 0.454, 'learning_rate': 2.6900053970842023e-06, 'epoch': 1.54} {'loss': 0.2719, 'learning_rate': 2.6897761374369735e-06, 'epoch': 1.54} {'loss': 0.3188, 'learning_rate': 2.689546886041595e-06, 'epoch': 1.54} {'loss': 0.3819, 'learning_rate': 2.6893176428983315e-06, 'epoch': 1.54} {'loss': 0.3933, 'learning_rate': 2.689088408007434e-06, 'epoch': 1.54} {'loss': 0.4223, 'learning_rate': 2.688859181369169e-06, 'epoch': 1.54} {'loss': 0.2706, 'learning_rate': 2.6886299629837886e-06, 'epoch': 1.54} {'loss': 0.2591, 'learning_rate': 2.6884007528515575e-06, 'epoch': 1.54} {'loss': 0.2708, 'learning_rate': 2.688171550972729e-06, 'epoch': 1.54} {'loss': 0.3628, 'learning_rate': 2.687942357347567e-06, 'epoch': 1.54} {'loss': 0.3256, 'learning_rate': 2.687713171976325e-06, 'epoch': 1.54} {'loss': 0.3762, 'learning_rate': 2.687483994859267e-06, 'epoch': 1.54} {'loss': 0.317, 'learning_rate': 2.6872548259966457e-06, 'epoch': 1.54} {'loss': 0.2876, 'learning_rate': 2.687025665388726e-06, 'epoch': 1.54} {'loss': 0.2344, 'learning_rate': 2.6867965130357653e-06, 'epoch': 1.54} {'loss': 0.2585, 'learning_rate': 2.6865673689380166e-06, 'epoch': 1.54} {'loss': 0.3156, 'learning_rate': 2.6863382330957453e-06, 'epoch': 1.54} {'loss': 0.4232, 'learning_rate': 2.6861091055092048e-06, 'epoch': 1.54} {'loss': 0.1645, 'learning_rate': 2.6858799861786587e-06, 'epoch': 1.54} {'loss': 0.2504, 'learning_rate': 2.685650875104361e-06, 'epoch': 1.54} {'loss': 0.3361, 'learning_rate': 2.685421772286576e-06, 'epoch': 1.54} {'loss': 0.3121, 'learning_rate': 2.685192677725554e-06, 'epoch': 1.54} {'loss': 0.2758, 'learning_rate': 2.684963591421563e-06, 'epoch': 1.54} {'loss': 0.2854, 'learning_rate': 2.684734513374855e-06, 'epoch': 1.54} {'loss': 0.3045, 'learning_rate': 2.684505443585692e-06, 'epoch': 1.54} {'loss': 0.3492, 'learning_rate': 2.6842763820543282e-06, 'epoch': 1.54} {'loss': 0.23, 'learning_rate': 2.68404732878103e-06, 'epoch': 1.54} {'loss': 0.2969, 'learning_rate': 2.6838182837660485e-06, 'epoch': 1.54} {'loss': 0.4294, 'learning_rate': 2.6835892470096436e-06, 'epoch': 1.54} {'loss': 0.3735, 'learning_rate': 2.6833602185120788e-06, 'epoch': 1.54} {'loss': 0.3427, 'learning_rate': 2.6831311982736053e-06, 'epoch': 1.54} {'loss': 0.2637, 'learning_rate': 2.682902186294487e-06, 'epoch': 1.54} {'loss': 0.2941, 'learning_rate': 2.6826731825749796e-06, 'epoch': 1.54} {'loss': 0.316, 'learning_rate': 2.682444187115345e-06, 'epoch': 1.54} {'loss': 0.3849, 'learning_rate': 2.6822151999158363e-06, 'epoch': 1.54} {'loss': 0.2183, 'learning_rate': 2.681986220976718e-06, 'epoch': 1.54} {'loss': 0.2294, 'learning_rate': 2.6817572502982424e-06, 'epoch': 1.54} {'loss': 0.3216, 'learning_rate': 2.681528287880675e-06, 'epoch': 1.54} {'loss': 0.2525, 'learning_rate': 2.6812993337242675e-06, 'epoch': 1.54} {'loss': 0.3854, 'learning_rate': 2.681070387829284e-06, 'epoch': 1.54} {'loss': 0.3151, 'learning_rate': 2.68084145019598e-06, 'epoch': 1.54} {'loss': 0.1704, 'learning_rate': 2.6806125208246115e-06, 'epoch': 1.54} {'loss': 0.3077, 'learning_rate': 2.6803835997154427e-06, 'epoch': 1.54} {'loss': 0.2879, 'learning_rate': 2.6801546868687254e-06, 'epoch': 1.54} {'loss': 0.2205, 'learning_rate': 2.679925782284726e-06, 'epoch': 1.54} {'loss': 0.371, 'learning_rate': 2.679696885963694e-06, 'epoch': 1.54} {'loss': 0.3902, 'learning_rate': 2.6794679979058956e-06, 'epoch': 1.54} {'loss': 0.5055, 'learning_rate': 2.679239118111583e-06, 'epoch': 1.54} {'loss': 0.2711, 'learning_rate': 2.67901024658102e-06, 'epoch': 1.54} {'loss': 0.3815, 'learning_rate': 2.6787813833144593e-06, 'epoch': 1.54} {'loss': 0.314, 'learning_rate': 2.678552528312165e-06, 'epoch': 1.54} {'loss': 0.3381, 'learning_rate': 2.678323681574391e-06, 'epoch': 1.54} {'loss': 0.257, 'learning_rate': 2.6780948431013986e-06, 'epoch': 1.54} {'loss': 0.2974, 'learning_rate': 2.677866012893442e-06, 'epoch': 1.54} {'loss': 0.2303, 'learning_rate': 2.677637190950786e-06, 'epoch': 1.54} {'loss': 0.4149, 'learning_rate': 2.6774083772736846e-06, 'epoch': 1.54} {'loss': 0.2493, 'learning_rate': 2.677179571862394e-06, 'epoch': 1.54} {'loss': 0.2532, 'learning_rate': 2.6769507747171785e-06, 'epoch': 1.54} {'loss': 0.2895, 'learning_rate': 2.6767219858382896e-06, 'epoch': 1.54} {'loss': 0.4036, 'learning_rate': 2.6764932052259917e-06, 'epoch': 1.54} {'loss': 0.3823, 'learning_rate': 2.676264432880539e-06, 'epoch': 1.54} {'loss': 0.1869, 'learning_rate': 2.676035668802193e-06, 'epoch': 1.54} {'loss': 0.3034, 'learning_rate': 2.6758069129912055e-06, 'epoch': 1.54} {'loss': 0.3312, 'learning_rate': 2.6755781654478443e-06, 'epoch': 1.54} {'loss': 0.2064, 'learning_rate': 2.675349426172359e-06, 'epoch': 1.54} {'loss': 0.3949, 'learning_rate': 2.6751206951650145e-06, 'epoch': 1.54} {'loss': 0.2351, 'learning_rate': 2.6748919724260615e-06, 'epoch': 1.54} {'loss': 0.3803, 'learning_rate': 2.6746632579557674e-06, 'epoch': 1.54} {'loss': 0.2585, 'learning_rate': 2.6744345517543847e-06, 'epoch': 1.54} {'loss': 0.3164, 'learning_rate': 2.674205853822166e-06, 'epoch': 1.54} {'loss': 0.457, 'learning_rate': 2.6739771641593814e-06, 'epoch': 1.54} {'loss': 0.1967, 'learning_rate': 2.6737484827662817e-06, 'epoch': 1.54} {'loss': 0.4107, 'learning_rate': 2.6735198096431293e-06, 'epoch': 1.54} {'loss': 0.3908, 'learning_rate': 2.6732911447901767e-06, 'epoch': 1.54} {'loss': 0.2012, 'learning_rate': 2.6730624882076884e-06, 'epoch': 1.54} {'loss': 0.2979, 'learning_rate': 2.6728338398959195e-06, 'epoch': 1.54} {'loss': 0.3045, 'learning_rate': 2.672605199855125e-06, 'epoch': 1.54} {'loss': 0.3407, 'learning_rate': 2.6723765680855683e-06, 'epoch': 1.54} {'loss': 0.2809, 'learning_rate': 2.672147944587502e-06, 'epoch': 1.54} {'loss': 0.2876, 'learning_rate': 2.67191932936119e-06, 'epoch': 1.54} {'loss': 0.2923, 'learning_rate': 2.6716907224068856e-06, 'epoch': 1.54} {'loss': 0.3513, 'learning_rate': 2.6714621237248507e-06, 'epoch': 1.54} {'loss': 0.3504, 'learning_rate': 2.6712335333153393e-06, 'epoch': 1.54} {'loss': 0.3608, 'learning_rate': 2.671004951178614e-06, 'epoch': 1.54} {'loss': 0.278, 'learning_rate': 2.6707763773149286e-06, 'epoch': 1.54} {'loss': 0.2691, 'learning_rate': 2.6705478117245444e-06, 'epoch': 1.54} {'loss': 0.3018, 'learning_rate': 2.670319254407716e-06, 'epoch': 1.54} {'loss': 0.3768, 'learning_rate': 2.6700907053647063e-06, 'epoch': 1.54} {'loss': 0.2406, 'learning_rate': 2.66986216459577e-06, 'epoch': 1.54} {'loss': 0.2288, 'learning_rate': 2.669633632101162e-06, 'epoch': 1.54} {'loss': 0.3055, 'learning_rate': 2.669405107881148e-06, 'epoch': 1.54} {'loss': 0.3659, 'learning_rate': 2.669176591935977e-06, 'epoch': 1.54} {'loss': 0.3621, 'learning_rate': 2.6689480842659153e-06, 'epoch': 1.54} {'loss': 0.3631, 'learning_rate': 2.6687195848712143e-06, 'epoch': 1.54} {'loss': 0.4362, 'learning_rate': 2.668491093752138e-06, 'epoch': 1.54} {'loss': 0.2952, 'learning_rate': 2.6682626109089384e-06, 'epoch': 1.54} {'loss': 0.4554, 'learning_rate': 2.6680341363418784e-06, 'epoch': 1.54} {'loss': 0.1725, 'learning_rate': 2.6678056700512113e-06, 'epoch': 1.54} {'loss': 0.3934, 'learning_rate': 2.667577212037199e-06, 'epoch': 1.54} {'loss': 0.2948, 'learning_rate': 2.667348762300096e-06, 'epoch': 1.54} {'loss': 0.2435, 'learning_rate': 2.6671203208401642e-06, 'epoch': 1.54} {'loss': 0.417, 'learning_rate': 2.66689188765766e-06, 'epoch': 1.54} {'loss': 0.3494, 'learning_rate': 2.6666634627528366e-06, 'epoch': 1.54} {'loss': 0.4099, 'learning_rate': 2.666435046125958e-06, 'epoch': 1.54} {'loss': 0.2577, 'learning_rate': 2.666206637777278e-06, 'epoch': 1.54} {'loss': 0.2968, 'learning_rate': 2.6659782377070588e-06, 'epoch': 1.54} {'loss': 0.3406, 'learning_rate': 2.665749845915553e-06, 'epoch': 1.54} {'loss': 0.347, 'learning_rate': 2.6655214624030224e-06, 'epoch': 1.54} {'loss': 0.2519, 'learning_rate': 2.6652930871697214e-06, 'epoch': 1.54} {'loss': 0.276, 'learning_rate': 2.665064720215913e-06, 'epoch': 1.54} {'loss': 0.2809, 'learning_rate': 2.664836361541848e-06, 'epoch': 1.54} {'loss': 0.2427, 'learning_rate': 2.6646080111477914e-06, 'epoch': 1.54} {'loss': 0.2829, 'learning_rate': 2.664379669033994e-06, 'epoch': 1.54} {'loss': 0.2584, 'learning_rate': 2.664151335200721e-06, 'epoch': 1.54} {'loss': 0.3758, 'learning_rate': 2.663923009648225e-06, 'epoch': 1.54} {'loss': 0.2303, 'learning_rate': 2.6636946923767626e-06, 'epoch': 1.54} {'loss': 0.3847, 'learning_rate': 2.663466383386597e-06, 'epoch': 1.54} {'loss': 0.3532, 'learning_rate': 2.663238082677979e-06, 'epoch': 1.54} {'loss': 0.1797, 'learning_rate': 2.6630097902511744e-06, 'epoch': 1.54} {'loss': 0.2348, 'learning_rate': 2.662781506106432e-06, 'epoch': 1.54} {'loss': 0.3497, 'learning_rate': 2.662553230244017e-06, 'epoch': 1.54} {'loss': 0.3154, 'learning_rate': 2.6623249626641823e-06, 'epoch': 1.54} {'loss': 0.3667, 'learning_rate': 2.6620967033671895e-06, 'epoch': 1.54} {'loss': 0.3635, 'learning_rate': 2.661868452353292e-06, 'epoch': 1.54} {'loss': 0.4228, 'learning_rate': 2.6616402096227523e-06, 'epoch': 1.54} {'loss': 0.2597, 'learning_rate': 2.6614119751758216e-06, 'epoch': 1.54} {'loss': 0.2565, 'learning_rate': 2.6611837490127655e-06, 'epoch': 1.54} {'loss': 0.1611, 'learning_rate': 2.6609555311338365e-06, 'epoch': 1.54} {'loss': 0.2848, 'learning_rate': 2.6607273215392903e-06, 'epoch': 1.54} {'loss': 0.424, 'learning_rate': 2.6604991202293905e-06, 'epoch': 1.54} {'loss': 0.3214, 'learning_rate': 2.6602709272043893e-06, 'epoch': 1.54} {'loss': 0.429, 'learning_rate': 2.6600427424645482e-06, 'epoch': 1.54} {'loss': 0.3283, 'learning_rate': 2.6598145660101204e-06, 'epoch': 1.54} {'loss': 0.2333, 'learning_rate': 2.6595863978413693e-06, 'epoch': 1.54} {'loss': 0.2256, 'learning_rate': 2.659358237958547e-06, 'epoch': 1.54} {'loss': 0.3181, 'learning_rate': 2.6591300863619153e-06, 'epoch': 1.54} {'loss': 0.3429, 'learning_rate': 2.658901943051727e-06, 'epoch': 1.54} {'loss': 0.3033, 'learning_rate': 2.658673808028246e-06, 'epoch': 1.54} {'loss': 0.3095, 'learning_rate': 2.6584456812917226e-06, 'epoch': 1.54} {'loss': 0.3689, 'learning_rate': 2.658217562842421e-06, 'epoch': 1.54} {'loss': 0.2691, 'learning_rate': 2.657989452680596e-06, 'epoch': 1.54} {'loss': 0.3174, 'learning_rate': 2.6577613508065015e-06, 'epoch': 1.54} {'loss': 0.2216, 'learning_rate': 2.6575332572204016e-06, 'epoch': 1.54} {'loss': 0.3885, 'learning_rate': 2.6573051719225474e-06, 'epoch': 1.54} {'loss': 0.3214, 'learning_rate': 2.657077094913202e-06, 'epoch': 1.54} {'loss': 0.3417, 'learning_rate': 2.6568490261926173e-06, 'epoch': 1.54} {'loss': 0.3657, 'learning_rate': 2.6566209657610577e-06, 'epoch': 1.54} {'loss': 0.1866, 'learning_rate': 2.6563929136187725e-06, 'epoch': 1.54} {'loss': 0.315, 'learning_rate': 2.6561648697660257e-06, 'epoch': 1.54} {'loss': 0.2835, 'learning_rate': 2.65593683420307e-06, 'epoch': 1.54} {'loss': 0.3827, 'learning_rate': 2.6557088069301686e-06, 'epoch': 1.54} {'loss': 0.3032, 'learning_rate': 2.655480787947572e-06, 'epoch': 1.54} {'loss': 0.2826, 'learning_rate': 2.655252777255544e-06, 'epoch': 1.54} {'loss': 0.3755, 'learning_rate': 2.655024774854339e-06, 'epoch': 1.54} {'loss': 0.2654, 'learning_rate': 2.654796780744211e-06, 'epoch': 1.54} {'loss': 0.2882, 'learning_rate': 2.6545687949254238e-06, 'epoch': 1.54} {'loss': 0.3279, 'learning_rate': 2.6543408173982286e-06, 'epoch': 1.54} {'loss': 0.358, 'learning_rate': 2.6541128481628884e-06, 'epoch': 1.54} {'loss': 0.2232, 'learning_rate': 2.6538848872196556e-06, 'epoch': 1.54} {'loss': 0.292, 'learning_rate': 2.6536569345687923e-06, 'epoch': 1.54} {'loss': 0.361, 'learning_rate': 2.6534289902105514e-06, 'epoch': 1.54} {'loss': 0.301, 'learning_rate': 2.6532010541451947e-06, 'epoch': 1.54} {'loss': 0.2212, 'learning_rate': 2.652973126372973e-06, 'epoch': 1.54} {'loss': 0.3688, 'learning_rate': 2.6527452068941516e-06, 'epoch': 1.54} {'loss': 0.3792, 'learning_rate': 2.6525172957089807e-06, 'epoch': 1.54} {'loss': 0.4006, 'learning_rate': 2.6522893928177227e-06, 'epoch': 1.54} {'loss': 0.2466, 'learning_rate': 2.652061498220633e-06, 'epoch': 1.54} {'loss': 0.3229, 'learning_rate': 2.6518336119179654e-06, 'epoch': 1.54} {'loss': 0.3343, 'learning_rate': 2.651605733909981e-06, 'epoch': 1.54} {'loss': 0.395, 'learning_rate': 2.6513778641969367e-06, 'epoch': 1.54} {'loss': 0.3468, 'learning_rate': 2.6511500027790914e-06, 'epoch': 1.54} {'loss': 0.2489, 'learning_rate': 2.6509221496566984e-06, 'epoch': 1.54} {'loss': 0.425, 'learning_rate': 2.650694304830018e-06, 'epoch': 1.54} {'loss': 0.2966, 'learning_rate': 2.6504664682993052e-06, 'epoch': 1.54} {'loss': 0.3368, 'learning_rate': 2.6502386400648205e-06, 'epoch': 1.54} {'loss': 0.1207, 'learning_rate': 2.650010820126818e-06, 'epoch': 1.54} {'loss': 0.3326, 'learning_rate': 2.6497830084855534e-06, 'epoch': 1.54} {'loss': 0.2426, 'learning_rate': 2.6495552051412885e-06, 'epoch': 1.54} {'loss': 0.3735, 'learning_rate': 2.6493274100942755e-06, 'epoch': 1.54} {'loss': 0.2597, 'learning_rate': 2.6490996233447773e-06, 'epoch': 1.54} {'loss': 0.4428, 'learning_rate': 2.648871844893044e-06, 'epoch': 1.54} {'loss': 0.2894, 'learning_rate': 2.6486440747393407e-06, 'epoch': 1.54} {'loss': 0.2621, 'learning_rate': 2.648416312883916e-06, 'epoch': 1.54} {'loss': 0.219, 'learning_rate': 2.648188559327035e-06, 'epoch': 1.54} {'loss': 0.2776, 'learning_rate': 2.647960814068947e-06, 'epoch': 1.54} {'loss': 0.3904, 'learning_rate': 2.6477330771099175e-06, 'epoch': 1.54} {'loss': 0.305, 'learning_rate': 2.6475053484501967e-06, 'epoch': 1.54} {'loss': 0.3185, 'learning_rate': 2.6472776280900457e-06, 'epoch': 1.54} {'loss': 0.5551, 'learning_rate': 2.6470499160297216e-06, 'epoch': 1.54} {'loss': 0.3369, 'learning_rate': 2.6468222122694754e-06, 'epoch': 1.54} {'loss': 0.268, 'learning_rate': 2.646594516809573e-06, 'epoch': 1.54} {'loss': 0.2159, 'learning_rate': 2.646366829650263e-06, 'epoch': 1.54} {'loss': 0.3452, 'learning_rate': 2.64613915079181e-06, 'epoch': 1.54} {'loss': 0.3091, 'learning_rate': 2.6459114802344643e-06, 'epoch': 1.54} {'loss': 0.2562, 'learning_rate': 2.6456838179784895e-06, 'epoch': 1.54} {'loss': 0.3071, 'learning_rate': 2.645456164024136e-06, 'epoch': 1.54} {'loss': 0.223, 'learning_rate': 2.645228518371666e-06, 'epoch': 1.54} {'loss': 0.2581, 'learning_rate': 2.6450008810213323e-06, 'epoch': 1.54} {'loss': 0.2412, 'learning_rate': 2.6447732519733973e-06, 'epoch': 1.54} {'loss': 0.3006, 'learning_rate': 2.6445456312281114e-06, 'epoch': 1.54} {'loss': 0.3203, 'learning_rate': 2.6443180187857376e-06, 'epoch': 1.54} {'loss': 0.2566, 'learning_rate': 2.644090414646531e-06, 'epoch': 1.54} {'loss': 0.4274, 'learning_rate': 2.643862818810743e-06, 'epoch': 1.54} {'loss': 0.3806, 'learning_rate': 2.6436352312786382e-06, 'epoch': 1.54} {'loss': 0.4228, 'learning_rate': 2.643407652050468e-06, 'epoch': 1.54} {'loss': 0.3265, 'learning_rate': 2.643180081126495e-06, 'epoch': 1.54} {'loss': 0.3715, 'learning_rate': 2.6429525185069694e-06, 'epoch': 1.54} {'loss': 0.3942, 'learning_rate': 2.6427249641921537e-06, 'epoch': 1.54} {'loss': 0.3998, 'learning_rate': 2.6424974181823004e-06, 'epoch': 1.54} {'loss': 0.221, 'learning_rate': 2.6422698804776704e-06, 'epoch': 1.54} {'loss': 0.4291, 'learning_rate': 2.6420423510785164e-06, 'epoch': 1.54} {'loss': 0.2037, 'learning_rate': 2.6418148299851e-06, 'epoch': 1.54} {'loss': 0.3552, 'learning_rate': 2.6415873171976724e-06, 'epoch': 1.54} {'loss': 0.4011, 'learning_rate': 2.6413598127164973e-06, 'epoch': 1.54} {'loss': 0.2731, 'learning_rate': 2.641132316541827e-06, 'epoch': 1.54} {'loss': 0.2267, 'learning_rate': 2.6409048286739156e-06, 'epoch': 1.54} {'loss': 0.3399, 'learning_rate': 2.6406773491130267e-06, 'epoch': 1.54} {'loss': 0.3352, 'learning_rate': 2.64044987785941e-06, 'epoch': 1.54} {'loss': 0.3447, 'learning_rate': 2.6402224149133306e-06, 'epoch': 1.54} {'loss': 0.1831, 'learning_rate': 2.639994960275035e-06, 'epoch': 1.54} {'loss': 0.3209, 'learning_rate': 2.639767513944791e-06, 'epoch': 1.54} {'loss': 0.4634, 'learning_rate': 2.639540075922845e-06, 'epoch': 1.54} {'loss': 0.2107, 'learning_rate': 2.639312646209463e-06, 'epoch': 1.54} {'loss': 0.2864, 'learning_rate': 2.6390852248048935e-06, 'epoch': 1.54} {'loss': 0.3042, 'learning_rate': 2.6388578117094e-06, 'epoch': 1.54} {'loss': 0.3102, 'learning_rate': 2.6386304069232337e-06, 'epoch': 1.54} {'loss': 0.3479, 'learning_rate': 2.6384030104466575e-06, 'epoch': 1.54} {'loss': 0.2155, 'learning_rate': 2.6381756222799227e-06, 'epoch': 1.54} {'loss': 0.4376, 'learning_rate': 2.637948242423286e-06, 'epoch': 1.54} {'loss': 0.3424, 'learning_rate': 2.6377208708770085e-06, 'epoch': 1.54} {'loss': 0.2567, 'learning_rate': 2.637493507641341e-06, 'epoch': 1.54} {'loss': 0.2955, 'learning_rate': 2.6372661527165456e-06, 'epoch': 1.54} {'loss': 0.311, 'learning_rate': 2.637038806102875e-06, 'epoch': 1.54} {'loss': 0.1908, 'learning_rate': 2.63681146780059e-06, 'epoch': 1.54} {'loss': 0.3195, 'learning_rate': 2.636584137809941e-06, 'epoch': 1.54} {'loss': 0.2719, 'learning_rate': 2.6363568161311913e-06, 'epoch': 1.54} {'loss': 0.299, 'learning_rate': 2.6361295027645926e-06, 'epoch': 1.54} {'loss': 0.2355, 'learning_rate': 2.635902197710406e-06, 'epoch': 1.54} {'loss': 0.3226, 'learning_rate': 2.635674900968882e-06, 'epoch': 1.54} {'loss': 0.336, 'learning_rate': 2.635447612540284e-06, 'epoch': 1.54} {'loss': 0.2399, 'learning_rate': 2.6352203324248648e-06, 'epoch': 1.54} {'loss': 0.3018, 'learning_rate': 2.634993060622878e-06, 'epoch': 1.54} {'loss': 0.2484, 'learning_rate': 2.6347657971345873e-06, 'epoch': 1.54} {'loss': 0.3118, 'learning_rate': 2.634538541960242e-06, 'epoch': 1.54} {'loss': 0.2822, 'learning_rate': 2.634311295100106e-06, 'epoch': 1.54} {'loss': 0.2043, 'learning_rate': 2.634084056554428e-06, 'epoch': 1.54} {'loss': 0.3728, 'learning_rate': 2.633856826323472e-06, 'epoch': 1.54} {'loss': 0.2224, 'learning_rate': 2.633629604407487e-06, 'epoch': 1.54} {'loss': 0.4896, 'learning_rate': 2.6334023908067375e-06, 'epoch': 1.54} {'loss': 0.2347, 'learning_rate': 2.6331751855214726e-06, 'epoch': 1.54} {'loss': 0.3617, 'learning_rate': 2.632947988551955e-06, 'epoch': 1.54} {'loss': 0.3216, 'learning_rate': 2.632720799898435e-06, 'epoch': 1.54} {'loss': 0.4113, 'learning_rate': 2.632493619561175e-06, 'epoch': 1.54} {'loss': 0.3935, 'learning_rate': 2.632266447540429e-06, 'epoch': 1.54} {'loss': 0.3663, 'learning_rate': 2.6320392838364495e-06, 'epoch': 1.54} {'loss': 0.3418, 'learning_rate': 2.6318121284495004e-06, 'epoch': 1.54} {'loss': 0.3426, 'learning_rate': 2.631584981379831e-06, 'epoch': 1.54} {'loss': 0.3549, 'learning_rate': 2.631357842627704e-06, 'epoch': 1.54} {'loss': 0.2789, 'learning_rate': 2.6311307121933705e-06, 'epoch': 1.54} {'loss': 0.4239, 'learning_rate': 2.6309035900770908e-06, 'epoch': 1.54} {'loss': 0.1973, 'learning_rate': 2.630676476279118e-06, 'epoch': 1.54} {'loss': 0.3121, 'learning_rate': 2.6304493707997126e-06, 'epoch': 1.54} {'loss': 0.2538, 'learning_rate': 2.630222273639125e-06, 'epoch': 1.54} {'loss': 0.3145, 'learning_rate': 2.629995184797618e-06, 'epoch': 1.54} {'loss': 0.3533, 'learning_rate': 2.629768104275443e-06, 'epoch': 1.54} {'loss': 0.3985, 'learning_rate': 2.62954103207286e-06, 'epoch': 1.54} {'loss': 0.4246, 'learning_rate': 2.629313968190125e-06, 'epoch': 1.54} {'loss': 0.2593, 'learning_rate': 2.6290869126274853e-06, 'epoch': 1.54} {'loss': 0.3195, 'learning_rate': 2.6288598653852127e-06, 'epoch': 1.54} {'loss': 0.3245, 'learning_rate': 2.6286328264635506e-06, 'epoch': 1.54} {'loss': 0.3733, 'learning_rate': 2.628405795862765e-06, 'epoch': 1.54} {'loss': 0.3767, 'learning_rate': 2.628178773583103e-06, 'epoch': 1.54} {'loss': 0.2805, 'learning_rate': 2.6279517596248305e-06, 'epoch': 1.54} {'loss': 0.3963, 'learning_rate': 2.6277247539881967e-06, 'epoch': 1.54} {'loss': 0.3192, 'learning_rate': 2.627497756673457e-06, 'epoch': 1.54} {'loss': 0.3508, 'learning_rate': 2.627270767680874e-06, 'epoch': 1.54} {'loss': 0.3294, 'learning_rate': 2.627043787010697e-06, 'epoch': 1.54} {'loss': 0.4231, 'learning_rate': 2.626816814663189e-06, 'epoch': 1.54} {'loss': 0.3964, 'learning_rate': 2.626589850638599e-06, 'epoch': 1.54} {'loss': 0.3392, 'learning_rate': 2.62636289493719e-06, 'epoch': 1.54} {'loss': 0.3614, 'learning_rate': 2.626135947559213e-06, 'epoch': 1.54} {'loss': 0.3358, 'learning_rate': 2.625909008504929e-06, 'epoch': 1.54} {'loss': 0.2516, 'learning_rate': 2.6256820777745873e-06, 'epoch': 1.54} {'loss': 0.251, 'learning_rate': 2.6254551553684527e-06, 'epoch': 1.54} {'loss': 0.3725, 'learning_rate': 2.6252282412867737e-06, 'epoch': 1.54} {'loss': 0.3469, 'learning_rate': 2.625001335529812e-06, 'epoch': 1.54} {'loss': 0.3386, 'learning_rate': 2.6247744380978214e-06, 'epoch': 1.54} {'loss': 0.2627, 'learning_rate': 2.6245475489910554e-06, 'epoch': 1.54} {'loss': 0.2406, 'learning_rate': 2.6243206682097754e-06, 'epoch': 1.54} {'loss': 0.3963, 'learning_rate': 2.6240937957542325e-06, 'epoch': 1.54} {'loss': 0.3706, 'learning_rate': 2.6238669316246868e-06, 'epoch': 1.54} {'loss': 0.2897, 'learning_rate': 2.623640075821391e-06, 'epoch': 1.54} {'loss': 0.2699, 'learning_rate': 2.6234132283446046e-06, 'epoch': 1.54} {'loss': 0.3333, 'learning_rate': 2.6231863891945798e-06, 'epoch': 1.54} {'loss': 0.2398, 'learning_rate': 2.6229595583715783e-06, 'epoch': 1.54} {'loss': 0.2973, 'learning_rate': 2.622732735875848e-06, 'epoch': 1.54} {'loss': 0.2839, 'learning_rate': 2.622505921707654e-06, 'epoch': 1.54} {'loss': 0.331, 'learning_rate': 2.6222791158672444e-06, 'epoch': 1.54} {'loss': 0.52, 'learning_rate': 2.6220523183548817e-06, 'epoch': 1.54} {'loss': 0.4196, 'learning_rate': 2.6218255291708197e-06, 'epoch': 1.54} {'loss': 0.4368, 'learning_rate': 2.6215987483153103e-06, 'epoch': 1.54} {'loss': 0.1613, 'learning_rate': 2.6213719757886157e-06, 'epoch': 1.54} {'loss': 0.3253, 'learning_rate': 2.621145211590985e-06, 'epoch': 1.54} {'loss': 0.2669, 'learning_rate': 2.620918455722683e-06, 'epoch': 1.54} {'loss': 0.411, 'learning_rate': 2.6206917081839567e-06, 'epoch': 1.54} {'loss': 0.284, 'learning_rate': 2.6204649689750693e-06, 'epoch': 1.54} {'loss': 0.3213, 'learning_rate': 2.620238238096271e-06, 'epoch': 1.54} {'loss': 0.2066, 'learning_rate': 2.6200115155478235e-06, 'epoch': 1.54} {'loss': 0.3675, 'learning_rate': 2.6197848013299766e-06, 'epoch': 1.54} {'loss': 0.389, 'learning_rate': 2.6195580954429923e-06, 'epoch': 1.54} {'loss': 0.2759, 'learning_rate': 2.6193313978871204e-06, 'epoch': 1.54} {'loss': 0.3316, 'learning_rate': 2.619104708662622e-06, 'epoch': 1.54} {'loss': 0.2398, 'learning_rate': 2.6188780277697523e-06, 'epoch': 1.54} {'loss': 0.2582, 'learning_rate': 2.6186513552087613e-06, 'epoch': 1.54} {'loss': 0.4258, 'learning_rate': 2.618424690979914e-06, 'epoch': 1.54} {'loss': 0.2744, 'learning_rate': 2.618198035083457e-06, 'epoch': 1.54} {'loss': 0.4074, 'learning_rate': 2.6179713875196545e-06, 'epoch': 1.54} {'loss': 0.3143, 'learning_rate': 2.6177447482887553e-06, 'epoch': 1.54} {'loss': 0.3557, 'learning_rate': 2.6175181173910212e-06, 'epoch': 1.54} {'loss': 0.3345, 'learning_rate': 2.6172914948267026e-06, 'epoch': 1.54} {'loss': 0.3885, 'learning_rate': 2.617064880596061e-06, 'epoch': 1.54} {'loss': 0.3836, 'learning_rate': 2.6168382746993458e-06, 'epoch': 1.54} {'loss': 0.3425, 'learning_rate': 2.61661167713682e-06, 'epoch': 1.54} {'loss': 0.4018, 'learning_rate': 2.6163850879087315e-06, 'epoch': 1.54} {'loss': 0.3271, 'learning_rate': 2.616158507015344e-06, 'epoch': 1.54} {'loss': 0.4054, 'learning_rate': 2.6159319344569068e-06, 'epoch': 1.54} {'loss': 0.3765, 'learning_rate': 2.615705370233681e-06, 'epoch': 1.54} {'loss': 0.2442, 'learning_rate': 2.6154788143459187e-06, 'epoch': 1.54} {'loss': 0.2867, 'learning_rate': 2.6152522667938753e-06, 'epoch': 1.54} {'loss': 0.3434, 'learning_rate': 2.6150257275778092e-06, 'epoch': 1.54} {'loss': 0.4127, 'learning_rate': 2.6147991966979725e-06, 'epoch': 1.54} {'loss': 0.2866, 'learning_rate': 2.6145726741546264e-06, 'epoch': 1.54} {'loss': 0.2741, 'learning_rate': 2.6143461599480204e-06, 'epoch': 1.54} {'loss': 0.3414, 'learning_rate': 2.6141196540784154e-06, 'epoch': 1.54} {'loss': 0.2902, 'learning_rate': 2.6138931565460625e-06, 'epoch': 1.54} {'loss': 0.3322, 'learning_rate': 2.6136666673512213e-06, 'epoch': 1.54} {'loss': 0.3106, 'learning_rate': 2.613440186494144e-06, 'epoch': 1.54} {'loss': 0.3823, 'learning_rate': 2.613213713975091e-06, 'epoch': 1.54} {'loss': 0.283, 'learning_rate': 2.612987249794312e-06, 'epoch': 1.54} {'loss': 0.3771, 'learning_rate': 2.6127607939520694e-06, 'epoch': 1.54} {'loss': 0.3026, 'learning_rate': 2.6125343464486143e-06, 'epoch': 1.54} {'loss': 0.3031, 'learning_rate': 2.6123079072842007e-06, 'epoch': 1.54} {'loss': 0.3379, 'learning_rate': 2.6120814764590886e-06, 'epoch': 1.54} {'loss': 0.3988, 'learning_rate': 2.61185505397353e-06, 'epoch': 1.54} {'loss': 0.3543, 'learning_rate': 2.6116286398277845e-06, 'epoch': 1.54} {'loss': 0.3423, 'learning_rate': 2.611402234022101e-06, 'epoch': 1.54} {'loss': 0.3973, 'learning_rate': 2.6111758365567443e-06, 'epoch': 1.54} {'loss': 0.3593, 'learning_rate': 2.610949447431962e-06, 'epoch': 1.54} {'loss': 0.2625, 'learning_rate': 2.6107230666480144e-06, 'epoch': 1.54} {'loss': 0.3011, 'learning_rate': 2.6104966942051526e-06, 'epoch': 1.54} {'loss': 0.3052, 'learning_rate': 2.6102703301036383e-06, 'epoch': 1.54} {'loss': 0.2168, 'learning_rate': 2.610043974343721e-06, 'epoch': 1.54} {'loss': 0.4773, 'learning_rate': 2.6098176269256615e-06, 'epoch': 1.54} {'loss': 0.2644, 'learning_rate': 2.609591287849712e-06, 'epoch': 1.54} {'loss': 0.3126, 'learning_rate': 2.6093649571161263e-06, 'epoch': 1.54} {'loss': 0.2254, 'learning_rate': 2.6091386347251647e-06, 'epoch': 1.54} {'loss': 0.3747, 'learning_rate': 2.6089123206770774e-06, 'epoch': 1.54} {'loss': 0.4761, 'learning_rate': 2.608686014972125e-06, 'epoch': 1.54} {'loss': 0.4744, 'learning_rate': 2.6084597176105574e-06, 'epoch': 1.54} {'loss': 0.3069, 'learning_rate': 2.6082334285926368e-06, 'epoch': 1.54} {'loss': 0.5243, 'learning_rate': 2.608007147918612e-06, 'epoch': 1.54} {'loss': 0.2829, 'learning_rate': 2.6077808755887447e-06, 'epoch': 1.54} {'loss': 0.3187, 'learning_rate': 2.6075546116032844e-06, 'epoch': 1.54} {'loss': 0.3185, 'learning_rate': 2.6073283559624916e-06, 'epoch': 1.54} {'loss': 0.4631, 'learning_rate': 2.607102108666616e-06, 'epoch': 1.54} {'loss': 0.2729, 'learning_rate': 2.6068758697159203e-06, 'epoch': 1.54} {'loss': 0.223, 'learning_rate': 2.6066496391106555e-06, 'epoch': 1.54} {'loss': 0.2391, 'learning_rate': 2.6064234168510703e-06, 'epoch': 1.54} {'loss': 0.3691, 'learning_rate': 2.606197202937435e-06, 'epoch': 1.54} {'loss': 0.293, 'learning_rate': 2.605970997369993e-06, 'epoch': 1.54} {'loss': 0.3119, 'learning_rate': 2.605744800149006e-06, 'epoch': 1.54} {'loss': 0.2573, 'learning_rate': 2.6055186112747255e-06, 'epoch': 1.54} {'loss': 0.2172, 'learning_rate': 2.60529243074741e-06, 'epoch': 1.54} {'loss': 0.3926, 'learning_rate': 2.6050662585673148e-06, 'epoch': 1.54} {'loss': 0.3594, 'learning_rate': 2.6048400947346884e-06, 'epoch': 1.54} {'loss': 0.2832, 'learning_rate': 2.604613939249796e-06, 'epoch': 1.54} {'loss': 0.2857, 'learning_rate': 2.6043877921128847e-06, 'epoch': 1.54} {'loss': 0.4133, 'learning_rate': 2.6041616533242164e-06, 'epoch': 1.54} {'loss': 0.2582, 'learning_rate': 2.6039355228840403e-06, 'epoch': 1.54} {'loss': 0.2797, 'learning_rate': 2.6037094007926165e-06, 'epoch': 1.54} {'loss': 0.3243, 'learning_rate': 2.603483287050197e-06, 'epoch': 1.54} {'loss': 0.4132, 'learning_rate': 2.6032571816570394e-06, 'epoch': 1.54} {'loss': 0.2627, 'learning_rate': 2.6030310846133967e-06, 'epoch': 1.54} {'loss': 0.2652, 'learning_rate': 2.602804995919528e-06, 'epoch': 1.54} {'loss': 0.4566, 'learning_rate': 2.602578915575682e-06, 'epoch': 1.54} {'loss': 0.2411, 'learning_rate': 2.602352843582121e-06, 'epoch': 1.54} {'loss': 0.2338, 'learning_rate': 2.602126779939097e-06, 'epoch': 1.54} {'loss': 0.2532, 'learning_rate': 2.601900724646862e-06, 'epoch': 1.54} {'loss': 0.134, 'learning_rate': 2.601674677705678e-06, 'epoch': 1.54} {'loss': 0.141, 'learning_rate': 2.601448639115792e-06, 'epoch': 1.54} {'loss': 0.313, 'learning_rate': 2.6012226088774673e-06, 'epoch': 1.54} {'loss': 0.3697, 'learning_rate': 2.6009965869909526e-06, 'epoch': 1.54} {'loss': 0.3452, 'learning_rate': 2.6007705734565093e-06, 'epoch': 1.54} {'loss': 0.3051, 'learning_rate': 2.6005445682743847e-06, 'epoch': 1.54} {'loss': 0.4812, 'learning_rate': 2.600318571444842e-06, 'epoch': 1.54} {'loss': 0.3466, 'learning_rate': 2.600092582968129e-06, 'epoch': 1.54} {'loss': 0.2437, 'learning_rate': 2.5998666028445076e-06, 'epoch': 1.54} {'loss': 0.3595, 'learning_rate': 2.5996406310742274e-06, 'epoch': 1.54} {'loss': 0.3598, 'learning_rate': 2.599414667657547e-06, 'epoch': 1.55} {'loss': 0.1381, 'learning_rate': 2.5991887125947215e-06, 'epoch': 1.55} {'loss': 0.548, 'learning_rate': 2.5989627658860006e-06, 'epoch': 1.55} {'loss': 0.2516, 'learning_rate': 2.598736827531647e-06, 'epoch': 1.55} {'loss': 0.3885, 'learning_rate': 2.5985108975319094e-06, 'epoch': 1.55} {'loss': 0.3149, 'learning_rate': 2.5982849758870476e-06, 'epoch': 1.55} {'loss': 0.477, 'learning_rate': 2.5980590625973125e-06, 'epoch': 1.55} {'loss': 0.4338, 'learning_rate': 2.5978331576629645e-06, 'epoch': 1.55} {'loss': 0.3422, 'learning_rate': 2.5976072610842517e-06, 'epoch': 1.55} {'loss': 0.3811, 'learning_rate': 2.597381372861435e-06, 'epoch': 1.55} {'loss': 0.178, 'learning_rate': 2.597155492994765e-06, 'epoch': 1.55} {'loss': 0.4036, 'learning_rate': 2.596929621484501e-06, 'epoch': 1.55} {'loss': 0.2928, 'learning_rate': 2.596703758330893e-06, 'epoch': 1.55} {'loss': 0.2822, 'learning_rate': 2.5964779035342025e-06, 'epoch': 1.55} {'loss': 0.2727, 'learning_rate': 2.5962520570946793e-06, 'epoch': 1.55} {'loss': 0.3746, 'learning_rate': 2.5960262190125773e-06, 'epoch': 1.55} {'loss': 0.3144, 'learning_rate': 2.5958003892881566e-06, 'epoch': 1.55} {'loss': 0.2837, 'learning_rate': 2.595574567921666e-06, 'epoch': 1.55} {'loss': 0.1968, 'learning_rate': 2.595348754913367e-06, 'epoch': 1.55} {'loss': 0.3416, 'learning_rate': 2.595122950263509e-06, 'epoch': 1.55} {'loss': 0.2732, 'learning_rate': 2.594897153972351e-06, 'epoch': 1.55} {'loss': 0.3277, 'learning_rate': 2.5946713660401434e-06, 'epoch': 1.55} {'loss': 0.4602, 'learning_rate': 2.594445586467146e-06, 'epoch': 1.55} {'loss': 0.3585, 'learning_rate': 2.594219815253609e-06, 'epoch': 1.55} {'loss': 0.2199, 'learning_rate': 2.593994052399792e-06, 'epoch': 1.55} {'loss': 0.3345, 'learning_rate': 2.5937682979059455e-06, 'epoch': 1.55} {'loss': 0.4056, 'learning_rate': 2.5935425517723277e-06, 'epoch': 1.55} {'loss': 0.125, 'learning_rate': 2.5933168139991936e-06, 'epoch': 1.55} {'loss': 0.337, 'learning_rate': 2.593091084586792e-06, 'epoch': 1.55} {'loss': 0.2957, 'learning_rate': 2.5928653635353862e-06, 'epoch': 1.55} {'loss': 0.3585, 'learning_rate': 2.5926396508452233e-06, 'epoch': 1.55} {'loss': 0.2899, 'learning_rate': 2.5924139465165642e-06, 'epoch': 1.55} {'loss': 0.3533, 'learning_rate': 2.5921882505496586e-06, 'epoch': 1.55} {'loss': 0.154, 'learning_rate': 2.5919625629447664e-06, 'epoch': 1.55} {'loss': 0.239, 'learning_rate': 2.591736883702137e-06, 'epoch': 1.55} {'loss': 0.3714, 'learning_rate': 2.591511212822032e-06, 'epoch': 1.55} {'loss': 0.3267, 'learning_rate': 2.5912855503046976e-06, 'epoch': 1.55} {'loss': 0.3665, 'learning_rate': 2.5910598961503965e-06, 'epoch': 1.55} {'loss': 0.2724, 'learning_rate': 2.5908342503593776e-06, 'epoch': 1.55} {'loss': 0.3121, 'learning_rate': 2.5906086129319e-06, 'epoch': 1.55} {'loss': 0.3161, 'learning_rate': 2.590382983868216e-06, 'epoch': 1.55} {'loss': 0.2492, 'learning_rate': 2.5901573631685784e-06, 'epoch': 1.55} {'loss': 0.3332, 'learning_rate': 2.589931750833247e-06, 'epoch': 1.55} {'loss': 0.1944, 'learning_rate': 2.5897061468624697e-06, 'epoch': 1.55} {'loss': 0.334, 'learning_rate': 2.589480551256509e-06, 'epoch': 1.55} {'loss': 0.1767, 'learning_rate': 2.589254964015613e-06, 'epoch': 1.55} {'loss': 0.2825, 'learning_rate': 2.5890293851400407e-06, 'epoch': 1.55} {'loss': 0.2938, 'learning_rate': 2.588803814630042e-06, 'epoch': 1.55} {'loss': 0.2504, 'learning_rate': 2.5885782524858784e-06, 'epoch': 1.55} {'loss': 0.2752, 'learning_rate': 2.5883526987077966e-06, 'epoch': 1.55} {'loss': 0.3719, 'learning_rate': 2.5881271532960596e-06, 'epoch': 1.55} {'loss': 0.2457, 'learning_rate': 2.587901616250914e-06, 'epoch': 1.55} {'loss': 0.3113, 'learning_rate': 2.5876760875726205e-06, 'epoch': 1.55} {'loss': 0.4012, 'learning_rate': 2.5874505672614314e-06, 'epoch': 1.55} {'loss': 0.2817, 'learning_rate': 2.5872250553175983e-06, 'epoch': 1.55} {'loss': 0.4239, 'learning_rate': 2.5869995517413814e-06, 'epoch': 1.55} {'loss': 0.3174, 'learning_rate': 2.5867740565330292e-06, 'epoch': 1.55} {'loss': 0.2705, 'learning_rate': 2.5865485696928027e-06, 'epoch': 1.55} {'loss': 0.4683, 'learning_rate': 2.5863230912209504e-06, 'epoch': 1.55} {'loss': 0.4335, 'learning_rate': 2.5860976211177315e-06, 'epoch': 1.55} {'loss': 0.3398, 'learning_rate': 2.585872159383396e-06, 'epoch': 1.55} {'loss': 0.4703, 'learning_rate': 2.5856467060182045e-06, 'epoch': 1.55} {'loss': 0.3696, 'learning_rate': 2.585421261022404e-06, 'epoch': 1.55} {'loss': 0.2151, 'learning_rate': 2.585195824396257e-06, 'epoch': 1.55} {'loss': 0.3638, 'learning_rate': 2.5849703961400107e-06, 'epoch': 1.55} {'loss': 0.3294, 'learning_rate': 2.5847449762539258e-06, 'epoch': 1.55} {'loss': 0.2312, 'learning_rate': 2.5845195647382525e-06, 'epoch': 1.55} {'loss': 0.2847, 'learning_rate': 2.584294161593245e-06, 'epoch': 1.55} {'loss': 0.1805, 'learning_rate': 2.5840687668191587e-06, 'epoch': 1.55} {'loss': 0.2829, 'learning_rate': 2.583843380416249e-06, 'epoch': 1.55} {'loss': 0.291, 'learning_rate': 2.5836180023847723e-06, 'epoch': 1.55} {'loss': 0.3204, 'learning_rate': 2.583392632724978e-06, 'epoch': 1.55} {'loss': 0.2733, 'learning_rate': 2.583167271437126e-06, 'epoch': 1.55} {'loss': 0.3166, 'learning_rate': 2.5829419185214645e-06, 'epoch': 1.55} {'loss': 0.3745, 'learning_rate': 2.5827165739782533e-06, 'epoch': 1.55} {'loss': 0.2329, 'learning_rate': 2.582491237807746e-06, 'epoch': 1.55} {'loss': 0.3251, 'learning_rate': 2.582265910010192e-06, 'epoch': 1.55} {'loss': 0.2451, 'learning_rate': 2.5820405905858525e-06, 'epoch': 1.55} {'loss': 0.2376, 'learning_rate': 2.581815279534976e-06, 'epoch': 1.55} {'loss': 0.2762, 'learning_rate': 2.5815899768578212e-06, 'epoch': 1.55} {'loss': 0.2617, 'learning_rate': 2.581364682554639e-06, 'epoch': 1.55} {'loss': 0.1551, 'learning_rate': 2.581139396625687e-06, 'epoch': 1.55} {'loss': 0.2761, 'learning_rate': 2.580914119071216e-06, 'epoch': 1.55} {'loss': 0.3495, 'learning_rate': 2.580688849891485e-06, 'epoch': 1.55} {'loss': 0.2853, 'learning_rate': 2.5804635890867426e-06, 'epoch': 1.55} {'loss': 0.2538, 'learning_rate': 2.580238336657248e-06, 'epoch': 1.55} {'loss': 0.2831, 'learning_rate': 2.580013092603251e-06, 'epoch': 1.55} {'loss': 0.3644, 'learning_rate': 2.579787856925011e-06, 'epoch': 1.55} {'loss': 0.3267, 'learning_rate': 2.5795626296227794e-06, 'epoch': 1.55} {'loss': 0.2266, 'learning_rate': 2.5793374106968083e-06, 'epoch': 1.55} {'loss': 0.3727, 'learning_rate': 2.579112200147357e-06, 'epoch': 1.55} {'loss': 0.3814, 'learning_rate': 2.578886997974672e-06, 'epoch': 1.55} {'loss': 0.4128, 'learning_rate': 2.5786618041790178e-06, 'epoch': 1.55} {'loss': 0.2712, 'learning_rate': 2.578436618760639e-06, 'epoch': 1.55} {'loss': 0.3089, 'learning_rate': 2.578211441719798e-06, 'epoch': 1.55} {'loss': 0.3772, 'learning_rate': 2.577986273056741e-06, 'epoch': 1.55} {'loss': 0.4596, 'learning_rate': 2.5777611127717293e-06, 'epoch': 1.55} {'loss': 0.3946, 'learning_rate': 2.5775359608650107e-06, 'epoch': 1.55} {'loss': 0.2627, 'learning_rate': 2.5773108173368456e-06, 'epoch': 1.55} {'loss': 0.2595, 'learning_rate': 2.5770856821874825e-06, 'epoch': 1.55} {'loss': 0.3434, 'learning_rate': 2.576860555417181e-06, 'epoch': 1.55} {'loss': 0.41, 'learning_rate': 2.5766354370261925e-06, 'epoch': 1.55} {'loss': 0.3358, 'learning_rate': 2.576410327014768e-06, 'epoch': 1.55} {'loss': 0.3208, 'learning_rate': 2.5761852253831664e-06, 'epoch': 1.55} {'loss': 0.3112, 'learning_rate': 2.5759601321316384e-06, 'epoch': 1.55} {'loss': 0.4021, 'learning_rate': 2.5757350472604427e-06, 'epoch': 1.55} {'loss': 0.4076, 'learning_rate': 2.575509970769826e-06, 'epoch': 1.55} {'loss': 0.3283, 'learning_rate': 2.575284902660051e-06, 'epoch': 1.55} {'loss': 0.3597, 'learning_rate': 2.5750598429313635e-06, 'epoch': 1.55} {'loss': 0.3227, 'learning_rate': 2.5748347915840254e-06, 'epoch': 1.55} {'loss': 0.3109, 'learning_rate': 2.574609748618283e-06, 'epoch': 1.55} {'loss': 0.3286, 'learning_rate': 2.574384714034398e-06, 'epoch': 1.55} {'loss': 0.4272, 'learning_rate': 2.574159687832617e-06, 'epoch': 1.55} {'loss': 0.3307, 'learning_rate': 2.5739346700132017e-06, 'epoch': 1.55} {'loss': 0.3403, 'learning_rate': 2.573709660576401e-06, 'epoch': 1.55} {'loss': 0.3892, 'learning_rate': 2.5734846595224672e-06, 'epoch': 1.55} {'loss': 0.253, 'learning_rate': 2.5732596668516594e-06, 'epoch': 1.55} {'loss': 0.191, 'learning_rate': 2.5730346825642273e-06, 'epoch': 1.55} {'loss': 0.2591, 'learning_rate': 2.5728097066604295e-06, 'epoch': 1.55} {'loss': 0.3919, 'learning_rate': 2.5725847391405134e-06, 'epoch': 1.55} {'loss': 0.2784, 'learning_rate': 2.5723597800047408e-06, 'epoch': 1.55} {'loss': 0.3566, 'learning_rate': 2.5721348292533577e-06, 'epoch': 1.55} {'loss': 0.2792, 'learning_rate': 2.5719098868866253e-06, 'epoch': 1.55} {'loss': 0.3623, 'learning_rate': 2.5716849529047904e-06, 'epoch': 1.55} {'loss': 0.4043, 'learning_rate': 2.571460027308115e-06, 'epoch': 1.55} {'loss': 0.3084, 'learning_rate': 2.571235110096845e-06, 'epoch': 1.55} {'loss': 0.3386, 'learning_rate': 2.57101020127124e-06, 'epoch': 1.55} {'loss': 0.3731, 'learning_rate': 2.570785300831553e-06, 'epoch': 1.55} {'loss': 0.3305, 'learning_rate': 2.570560408778033e-06, 'epoch': 1.55} {'loss': 0.3067, 'learning_rate': 2.5703355251109408e-06, 'epoch': 1.55} {'loss': 0.205, 'learning_rate': 2.570110649830524e-06, 'epoch': 1.55} {'loss': 0.3365, 'learning_rate': 2.5698857829370425e-06, 'epoch': 1.55} {'loss': 0.3276, 'learning_rate': 2.5696609244307436e-06, 'epoch': 1.55} {'loss': 0.2573, 'learning_rate': 2.5694360743118887e-06, 'epoch': 1.55} {'loss': 0.4007, 'learning_rate': 2.569211232580724e-06, 'epoch': 1.55} {'loss': 0.3756, 'learning_rate': 2.5689863992375087e-06, 'epoch': 1.55} {'loss': 0.311, 'learning_rate': 2.5687615742824923e-06, 'epoch': 1.55} {'loss': 0.3729, 'learning_rate': 2.568536757715935e-06, 'epoch': 1.55} {'loss': 0.3047, 'learning_rate': 2.5683119495380824e-06, 'epoch': 1.55} {'loss': 0.3259, 'learning_rate': 2.5680871497491955e-06, 'epoch': 1.55} {'loss': 0.304, 'learning_rate': 2.5678623583495257e-06, 'epoch': 1.55} {'loss': 0.2965, 'learning_rate': 2.5676375753393225e-06, 'epoch': 1.55} {'loss': 0.299, 'learning_rate': 2.567412800718846e-06, 'epoch': 1.55} {'loss': 0.2676, 'learning_rate': 2.567188034488344e-06, 'epoch': 1.55} {'loss': 0.3552, 'learning_rate': 2.566963276648076e-06, 'epoch': 1.55} {'loss': 0.3221, 'learning_rate': 2.5667385271982904e-06, 'epoch': 1.55} {'loss': 0.3422, 'learning_rate': 2.5665137861392464e-06, 'epoch': 1.55} {'loss': 0.2442, 'learning_rate': 2.5662890534711925e-06, 'epoch': 1.55} {'loss': 0.2163, 'learning_rate': 2.5660643291943864e-06, 'epoch': 1.55} {'loss': 0.4048, 'learning_rate': 2.5658396133090777e-06, 'epoch': 1.55} {'loss': 0.3031, 'learning_rate': 2.5656149058155265e-06, 'epoch': 1.55} {'loss': 0.4399, 'learning_rate': 2.565390206713978e-06, 'epoch': 1.55} {'loss': 0.2453, 'learning_rate': 2.565165516004694e-06, 'epoch': 1.55} {'loss': 0.4022, 'learning_rate': 2.5649408336879233e-06, 'epoch': 1.55} {'loss': 0.2519, 'learning_rate': 2.564716159763918e-06, 'epoch': 1.55} {'loss': 0.1563, 'learning_rate': 2.564491494232938e-06, 'epoch': 1.55} {'loss': 0.4261, 'learning_rate': 2.5642668370952294e-06, 'epoch': 1.55} {'loss': 0.3181, 'learning_rate': 2.5640421883510525e-06, 'epoch': 1.55} {'loss': 0.2664, 'learning_rate': 2.5638175480006556e-06, 'epoch': 1.55} {'loss': 0.2608, 'learning_rate': 2.5635929160442973e-06, 'epoch': 1.55} {'loss': 0.2583, 'learning_rate': 2.5633682924822257e-06, 'epoch': 1.55} {'loss': 0.2085, 'learning_rate': 2.5631436773147e-06, 'epoch': 1.55} {'loss': 0.3225, 'learning_rate': 2.5629190705419672e-06, 'epoch': 1.55} {'loss': 0.3945, 'learning_rate': 2.5626944721642887e-06, 'epoch': 1.55} {'loss': 0.1914, 'learning_rate': 2.5624698821819103e-06, 'epoch': 1.55} {'loss': 0.2941, 'learning_rate': 2.562245300595092e-06, 'epoch': 1.55} {'loss': 0.365, 'learning_rate': 2.5620207274040844e-06, 'epoch': 1.55} {'loss': 0.2703, 'learning_rate': 2.5617961626091357e-06, 'epoch': 1.55} {'loss': 0.2764, 'learning_rate': 2.56157160621051e-06, 'epoch': 1.55} {'loss': 0.2861, 'learning_rate': 2.561347058208452e-06, 'epoch': 1.55} {'loss': 0.3066, 'learning_rate': 2.561122518603223e-06, 'epoch': 1.55} {'loss': 0.2722, 'learning_rate': 2.560897987395068e-06, 'epoch': 1.55} {'loss': 0.2736, 'learning_rate': 2.560673464584248e-06, 'epoch': 1.55} {'loss': 0.2581, 'learning_rate': 2.560448950171013e-06, 'epoch': 1.55} {'loss': 0.3858, 'learning_rate': 2.5602244441556133e-06, 'epoch': 1.55} {'loss': 0.3038, 'learning_rate': 2.5599999465383086e-06, 'epoch': 1.55} {'loss': 0.302, 'learning_rate': 2.5597754573193457e-06, 'epoch': 1.55} {'loss': 0.1643, 'learning_rate': 2.5595509764989855e-06, 'epoch': 1.55} {'loss': 0.3347, 'learning_rate': 2.559326504077474e-06, 'epoch': 1.55} {'loss': 0.1368, 'learning_rate': 2.5591020400550702e-06, 'epoch': 1.55} {'loss': 0.3436, 'learning_rate': 2.5588775844320226e-06, 'epoch': 1.55} {'loss': 0.2839, 'learning_rate': 2.558653137208591e-06, 'epoch': 1.55} {'loss': 0.4164, 'learning_rate': 2.5584286983850214e-06, 'epoch': 1.55} {'loss': 0.3594, 'learning_rate': 2.5582042679615737e-06, 'epoch': 1.55} {'loss': 0.3354, 'learning_rate': 2.557979845938495e-06, 'epoch': 1.55} {'loss': 0.3082, 'learning_rate': 2.557755432316045e-06, 'epoch': 1.55} {'loss': 0.3645, 'learning_rate': 2.5575310270944743e-06, 'epoch': 1.55} {'loss': 0.2737, 'learning_rate': 2.5573066302740323e-06, 'epoch': 1.55} {'loss': 0.3143, 'learning_rate': 2.557082241854979e-06, 'epoch': 1.55} {'loss': 0.4932, 'learning_rate': 2.556857861837562e-06, 'epoch': 1.55} {'loss': 0.1808, 'learning_rate': 2.556633490222039e-06, 'epoch': 1.55} {'loss': 0.3509, 'learning_rate': 2.55640912700866e-06, 'epoch': 1.55} {'loss': 0.3123, 'learning_rate': 2.556184772197682e-06, 'epoch': 1.55} {'loss': 0.347, 'learning_rate': 2.555960425789352e-06, 'epoch': 1.55} {'loss': 0.2132, 'learning_rate': 2.555736087783931e-06, 'epoch': 1.55} {'loss': 0.3969, 'learning_rate': 2.5555117581816644e-06, 'epoch': 1.55} {'loss': 0.2539, 'learning_rate': 2.555287436982813e-06, 'epoch': 1.55} {'loss': 0.3693, 'learning_rate': 2.5550631241876245e-06, 'epoch': 1.55} {'loss': 0.3151, 'learning_rate': 2.554838819796356e-06, 'epoch': 1.55} {'loss': 0.4018, 'learning_rate': 2.5546145238092577e-06, 'epoch': 1.55} {'loss': 0.2881, 'learning_rate': 2.554390236226583e-06, 'epoch': 1.55} {'loss': 0.5296, 'learning_rate': 2.5541659570485868e-06, 'epoch': 1.55} {'loss': 0.2269, 'learning_rate': 2.5539416862755195e-06, 'epoch': 1.55} {'loss': 0.3444, 'learning_rate': 2.553717423907639e-06, 'epoch': 1.55} {'loss': 0.3239, 'learning_rate': 2.5534931699451925e-06, 'epoch': 1.55} {'loss': 0.2195, 'learning_rate': 2.553268924388439e-06, 'epoch': 1.55} {'loss': 0.2773, 'learning_rate': 2.5530446872376257e-06, 'epoch': 1.55} {'loss': 0.4561, 'learning_rate': 2.5528204584930115e-06, 'epoch': 1.55} {'loss': 0.2978, 'learning_rate': 2.5525962381548453e-06, 'epoch': 1.55} {'loss': 0.3016, 'learning_rate': 2.552372026223383e-06, 'epoch': 1.55} {'loss': 0.2027, 'learning_rate': 2.552147822698875e-06, 'epoch': 1.55} {'loss': 0.424, 'learning_rate': 2.5519236275815774e-06, 'epoch': 1.55} {'loss': 0.2839, 'learning_rate': 2.5516994408717398e-06, 'epoch': 1.55} {'loss': 0.3688, 'learning_rate': 2.5514752625696202e-06, 'epoch': 1.55} {'loss': 0.3433, 'learning_rate': 2.5512510926754673e-06, 'epoch': 1.55} {'loss': 0.2414, 'learning_rate': 2.551026931189534e-06, 'epoch': 1.55} {'loss': 0.3283, 'learning_rate': 2.550802778112077e-06, 'epoch': 1.55} {'loss': 0.2069, 'learning_rate': 2.5505786334433448e-06, 'epoch': 1.55} {'loss': 0.2483, 'learning_rate': 2.5503544971835946e-06, 'epoch': 1.55} {'loss': 0.2319, 'learning_rate': 2.5501303693330757e-06, 'epoch': 1.55} {'loss': 0.3292, 'learning_rate': 2.5499062498920456e-06, 'epoch': 1.55} {'loss': 0.332, 'learning_rate': 2.5496821388607516e-06, 'epoch': 1.55} {'loss': 0.4523, 'learning_rate': 2.549458036239453e-06, 'epoch': 1.55} {'loss': 0.3577, 'learning_rate': 2.549233942028396e-06, 'epoch': 1.55} {'loss': 0.248, 'learning_rate': 2.54900985622784e-06, 'epoch': 1.55} {'loss': 0.231, 'learning_rate': 2.5487857788380323e-06, 'epoch': 1.55} {'loss': 0.2023, 'learning_rate': 2.548561709859232e-06, 'epoch': 1.55} {'loss': 0.289, 'learning_rate': 2.548337649291688e-06, 'epoch': 1.55} {'loss': 0.384, 'learning_rate': 2.548113597135651e-06, 'epoch': 1.55} {'loss': 0.2127, 'learning_rate': 2.5478895533913795e-06, 'epoch': 1.55} {'loss': 0.2268, 'learning_rate': 2.54766551805912e-06, 'epoch': 1.55} {'loss': 0.3024, 'learning_rate': 2.547441491139133e-06, 'epoch': 1.55} {'loss': 0.3504, 'learning_rate': 2.5472174726316644e-06, 'epoch': 1.55} {'loss': 0.2336, 'learning_rate': 2.546993462536972e-06, 'epoch': 1.55} {'loss': 0.2308, 'learning_rate': 2.546769460855305e-06, 'epoch': 1.55} {'loss': 0.2201, 'learning_rate': 2.5465454675869205e-06, 'epoch': 1.55} {'loss': 0.2897, 'learning_rate': 2.546321482732066e-06, 'epoch': 1.55} {'loss': 0.2943, 'learning_rate': 2.546097506291e-06, 'epoch': 1.55} {'loss': 0.4655, 'learning_rate': 2.545873538263969e-06, 'epoch': 1.55} {'loss': 0.3353, 'learning_rate': 2.5456495786512327e-06, 'epoch': 1.55} {'loss': 0.4081, 'learning_rate': 2.54542562745304e-06, 'epoch': 1.55} {'loss': 0.3381, 'learning_rate': 2.5452016846696426e-06, 'epoch': 1.55} {'loss': 0.3178, 'learning_rate': 2.544977750301296e-06, 'epoch': 1.55} {'loss': 0.3151, 'learning_rate': 2.5447538243482508e-06, 'epoch': 1.55} {'loss': 0.4372, 'learning_rate': 2.544529906810762e-06, 'epoch': 1.55} {'loss': 0.3899, 'learning_rate': 2.5443059976890795e-06, 'epoch': 1.55} {'loss': 0.2134, 'learning_rate': 2.5440820969834613e-06, 'epoch': 1.55} {'loss': 0.3597, 'learning_rate': 2.543858204694152e-06, 'epoch': 1.55} {'loss': 0.2637, 'learning_rate': 2.5436343208214132e-06, 'epoch': 1.55} {'loss': 0.3054, 'learning_rate': 2.5434104453654894e-06, 'epoch': 1.55} {'loss': 0.2827, 'learning_rate': 2.5431865783266408e-06, 'epoch': 1.55} {'loss': 0.4647, 'learning_rate': 2.542962719705113e-06, 'epoch': 1.55} {'loss': 0.3224, 'learning_rate': 2.5427388695011666e-06, 'epoch': 1.55} {'loss': 0.224, 'learning_rate': 2.542515027715049e-06, 'epoch': 1.55} {'loss': 0.3223, 'learning_rate': 2.5422911943470106e-06, 'epoch': 1.55} {'loss': 0.2659, 'learning_rate': 2.542067369397311e-06, 'epoch': 1.55} {'loss': 0.3174, 'learning_rate': 2.5418435528661953e-06, 'epoch': 1.55} {'loss': 0.2956, 'learning_rate': 2.5416197447539237e-06, 'epoch': 1.55} {'loss': 0.3581, 'learning_rate': 2.5413959450607415e-06, 'epoch': 1.55} {'loss': 0.3563, 'learning_rate': 2.5411721537869093e-06, 'epoch': 1.55} {'loss': 0.2803, 'learning_rate': 2.540948370932671e-06, 'epoch': 1.55} {'loss': 0.2068, 'learning_rate': 2.5407245964982874e-06, 'epoch': 1.55} {'loss': 0.3516, 'learning_rate': 2.540500830484004e-06, 'epoch': 1.55} {'loss': 0.2493, 'learning_rate': 2.5402770728900795e-06, 'epoch': 1.55} {'loss': 0.2742, 'learning_rate': 2.540053323716761e-06, 'epoch': 1.55} {'loss': 0.3822, 'learning_rate': 2.539829582964306e-06, 'epoch': 1.55} {'loss': 0.4358, 'learning_rate': 2.5396058506329624e-06, 'epoch': 1.55} {'loss': 0.2971, 'learning_rate': 2.5393821267229858e-06, 'epoch': 1.55} {'loss': 0.5307, 'learning_rate': 2.53915841123463e-06, 'epoch': 1.55} {'loss': 0.4869, 'learning_rate': 2.5389347041681424e-06, 'epoch': 1.55} {'loss': 0.3527, 'learning_rate': 2.538711005523782e-06, 'epoch': 1.55} {'loss': 0.3252, 'learning_rate': 2.5384873153017955e-06, 'epoch': 1.55} {'loss': 0.2632, 'learning_rate': 2.5382636335024413e-06, 'epoch': 1.55} {'loss': 0.415, 'learning_rate': 2.5380399601259676e-06, 'epoch': 1.55} {'loss': 0.3185, 'learning_rate': 2.537816295172625e-06, 'epoch': 1.55} {'loss': 0.1734, 'learning_rate': 2.537592638642672e-06, 'epoch': 1.55} {'loss': 0.3146, 'learning_rate': 2.5373689905363552e-06, 'epoch': 1.55} {'loss': 0.3022, 'learning_rate': 2.5371453508539322e-06, 'epoch': 1.55} {'loss': 0.3191, 'learning_rate': 2.5369217195956496e-06, 'epoch': 1.55} {'loss': 0.1754, 'learning_rate': 2.5366980967617673e-06, 'epoch': 1.55} {'loss': 0.2842, 'learning_rate': 2.53647448235253e-06, 'epoch': 1.55} {'loss': 0.2152, 'learning_rate': 2.536250876368197e-06, 'epoch': 1.55} {'loss': 0.3564, 'learning_rate': 2.5360272788090147e-06, 'epoch': 1.55} {'loss': 0.3166, 'learning_rate': 2.5358036896752403e-06, 'epoch': 1.55} {'loss': 0.2999, 'learning_rate': 2.5355801089671216e-06, 'epoch': 1.55} {'loss': 0.3836, 'learning_rate': 2.5353565366849166e-06, 'epoch': 1.55} {'loss': 0.3237, 'learning_rate': 2.5351329728288754e-06, 'epoch': 1.55} {'loss': 0.3068, 'learning_rate': 2.534909417399245e-06, 'epoch': 1.55} {'loss': 0.2617, 'learning_rate': 2.5346858703962863e-06, 'epoch': 1.55} {'loss': 0.2888, 'learning_rate': 2.5344623318202446e-06, 'epoch': 1.55} {'loss': 0.3405, 'learning_rate': 2.534238801671378e-06, 'epoch': 1.55} {'loss': 0.313, 'learning_rate': 2.534015279949934e-06, 'epoch': 1.55} {'loss': 0.3578, 'learning_rate': 2.5337917666561695e-06, 'epoch': 1.55} {'loss': 0.1989, 'learning_rate': 2.533568261790331e-06, 'epoch': 1.55} {'loss': 0.3277, 'learning_rate': 2.5333447653526766e-06, 'epoch': 1.55} {'loss': 0.3566, 'learning_rate': 2.5331212773434544e-06, 'epoch': 1.55} {'loss': 0.2791, 'learning_rate': 2.532897797762921e-06, 'epoch': 1.55} {'loss': 0.4342, 'learning_rate': 2.532674326611323e-06, 'epoch': 1.55} {'loss': 0.3719, 'learning_rate': 2.532450863888918e-06, 'epoch': 1.55} {'loss': 0.2988, 'learning_rate': 2.5322274095959566e-06, 'epoch': 1.55} {'loss': 0.481, 'learning_rate': 2.5320039637326875e-06, 'epoch': 1.55} {'loss': 0.3218, 'learning_rate': 2.531780526299369e-06, 'epoch': 1.55} {'loss': 0.2867, 'learning_rate': 2.5315570972962465e-06, 'epoch': 1.55} {'loss': 0.3225, 'learning_rate': 2.5313336767235787e-06, 'epoch': 1.55} {'loss': 0.0846, 'learning_rate': 2.531110264581612e-06, 'epoch': 1.55} {'loss': 0.301, 'learning_rate': 2.530886860870605e-06, 'epoch': 1.55} {'loss': 0.3012, 'learning_rate': 2.5306634655908035e-06, 'epoch': 1.55} {'loss': 0.3339, 'learning_rate': 2.5304400787424653e-06, 'epoch': 1.55} {'loss': 0.4165, 'learning_rate': 2.530216700325837e-06, 'epoch': 1.55} {'loss': 0.4272, 'learning_rate': 2.5299933303411773e-06, 'epoch': 1.55} {'loss': 0.2438, 'learning_rate': 2.52976996878873e-06, 'epoch': 1.55} {'loss': 0.3387, 'learning_rate': 2.5295466156687565e-06, 'epoch': 1.55} {'loss': 0.304, 'learning_rate': 2.529323270981503e-06, 'epoch': 1.55} {'loss': 0.2703, 'learning_rate': 2.5290999347272206e-06, 'epoch': 1.55} {'loss': 0.3633, 'learning_rate': 2.5288766069061665e-06, 'epoch': 1.55} {'loss': 0.2318, 'learning_rate': 2.5286532875185875e-06, 'epoch': 1.55} {'loss': 0.3371, 'learning_rate': 2.5284299765647403e-06, 'epoch': 1.55} {'loss': 0.2475, 'learning_rate': 2.528206674044873e-06, 'epoch': 1.55} {'loss': 0.2521, 'learning_rate': 2.5279833799592412e-06, 'epoch': 1.55} {'loss': 0.3084, 'learning_rate': 2.527760094308094e-06, 'epoch': 1.55} {'loss': 0.3011, 'learning_rate': 2.527536817091686e-06, 'epoch': 1.55} {'loss': 0.4048, 'learning_rate': 2.5273135483102664e-06, 'epoch': 1.55} {'loss': 0.3678, 'learning_rate': 2.5270902879640903e-06, 'epoch': 1.55} {'loss': 0.3511, 'learning_rate': 2.5268670360534064e-06, 'epoch': 1.55} {'loss': 0.4145, 'learning_rate': 2.5266437925784715e-06, 'epoch': 1.55} {'loss': 0.423, 'learning_rate': 2.526420557539534e-06, 'epoch': 1.55} {'loss': 0.2923, 'learning_rate': 2.5261973309368437e-06, 'epoch': 1.55} {'loss': 0.2337, 'learning_rate': 2.5259741127706583e-06, 'epoch': 1.55} {'loss': 0.2237, 'learning_rate': 2.525750903041224e-06, 'epoch': 1.55} {'loss': 0.2856, 'learning_rate': 2.525527701748799e-06, 'epoch': 1.55} {'loss': 0.2663, 'learning_rate': 2.525304508893629e-06, 'epoch': 1.55} {'loss': 0.2452, 'learning_rate': 2.525081324475971e-06, 'epoch': 1.55} {'loss': 0.3421, 'learning_rate': 2.5248581484960733e-06, 'epoch': 1.55} {'loss': 0.2121, 'learning_rate': 2.5246349809541904e-06, 'epoch': 1.55} {'loss': 0.2789, 'learning_rate': 2.524411821850571e-06, 'epoch': 1.55} {'loss': 0.2411, 'learning_rate': 2.5241886711854723e-06, 'epoch': 1.55} {'loss': 0.2223, 'learning_rate': 2.5239655289591392e-06, 'epoch': 1.55} {'loss': 0.1744, 'learning_rate': 2.523742395171831e-06, 'epoch': 1.55} {'loss': 0.2552, 'learning_rate': 2.5235192698237963e-06, 'epoch': 1.55} {'loss': 0.4334, 'learning_rate': 2.523296152915283e-06, 'epoch': 1.55} {'loss': 0.3749, 'learning_rate': 2.52307304444655e-06, 'epoch': 1.55} {'loss': 0.2711, 'learning_rate': 2.5228499444178423e-06, 'epoch': 1.55} {'loss': 0.3573, 'learning_rate': 2.5226268528294183e-06, 'epoch': 1.55} {'loss': 0.2971, 'learning_rate': 2.522403769681524e-06, 'epoch': 1.55} {'loss': 0.1428, 'learning_rate': 2.5221806949744164e-06, 'epoch': 1.55} {'loss': 0.3567, 'learning_rate': 2.5219576287083425e-06, 'epoch': 1.55} {'loss': 0.2348, 'learning_rate': 2.5217345708835593e-06, 'epoch': 1.55} {'loss': 0.2105, 'learning_rate': 2.521511521500313e-06, 'epoch': 1.55} {'loss': 0.4066, 'learning_rate': 2.52128848055886e-06, 'epoch': 1.55} {'loss': 0.3474, 'learning_rate': 2.5210654480594476e-06, 'epoch': 1.55} {'loss': 0.4417, 'learning_rate': 2.5208424240023334e-06, 'epoch': 1.55} {'loss': 0.3631, 'learning_rate': 2.5206194083877655e-06, 'epoch': 1.55} {'loss': 0.3677, 'learning_rate': 2.520396401215993e-06, 'epoch': 1.55} {'loss': 0.2458, 'learning_rate': 2.520173402487274e-06, 'epoch': 1.55} {'loss': 0.3705, 'learning_rate': 2.5199504122018536e-06, 'epoch': 1.55} {'loss': 0.4166, 'learning_rate': 2.5197274303599907e-06, 'epoch': 1.55} {'loss': 0.2491, 'learning_rate': 2.5195044569619286e-06, 'epoch': 1.55} {'loss': 0.2934, 'learning_rate': 2.5192814920079278e-06, 'epoch': 1.55} {'loss': 0.2996, 'learning_rate': 2.519058535498232e-06, 'epoch': 1.55} {'loss': 0.3474, 'learning_rate': 2.5188355874330993e-06, 'epoch': 1.55} {'loss': 0.3412, 'learning_rate': 2.518612647812776e-06, 'epoch': 1.55} {'loss': 0.316, 'learning_rate': 2.518389716637519e-06, 'epoch': 1.55} {'loss': 0.2166, 'learning_rate': 2.518166793907575e-06, 'epoch': 1.55} {'loss': 0.3303, 'learning_rate': 2.5179438796232004e-06, 'epoch': 1.55} {'loss': 0.2362, 'learning_rate': 2.517720973784642e-06, 'epoch': 1.55} {'loss': 0.3864, 'learning_rate': 2.517498076392156e-06, 'epoch': 1.55} {'loss': 0.3958, 'learning_rate': 2.51727518744599e-06, 'epoch': 1.55} {'loss': 0.2526, 'learning_rate': 2.517052306946396e-06, 'epoch': 1.55} {'loss': 0.4023, 'learning_rate': 2.516829434893631e-06, 'epoch': 1.55} {'loss': 0.18, 'learning_rate': 2.5166065712879395e-06, 'epoch': 1.55} {'loss': 0.2804, 'learning_rate': 2.516383716129578e-06, 'epoch': 1.55} {'loss': 0.1928, 'learning_rate': 2.5161608694187942e-06, 'epoch': 1.55} {'loss': 0.3665, 'learning_rate': 2.5159380311558447e-06, 'epoch': 1.55} {'loss': 0.2088, 'learning_rate': 2.515715201340978e-06, 'epoch': 1.55} {'loss': 0.2857, 'learning_rate': 2.5154923799744422e-06, 'epoch': 1.55} {'loss': 0.284, 'learning_rate': 2.515269567056495e-06, 'epoch': 1.55} {'loss': 0.3018, 'learning_rate': 2.515046762587383e-06, 'epoch': 1.55} {'loss': 0.1899, 'learning_rate': 2.5148239665673625e-06, 'epoch': 1.55} {'loss': 0.3489, 'learning_rate': 2.5146011789966794e-06, 'epoch': 1.55} {'loss': 0.1954, 'learning_rate': 2.514378399875591e-06, 'epoch': 1.55} {'loss': 0.2574, 'learning_rate': 2.5141556292043436e-06, 'epoch': 1.55} {'loss': 0.3295, 'learning_rate': 2.5139328669831933e-06, 'epoch': 1.55} {'loss': 0.2684, 'learning_rate': 2.5137101132123866e-06, 'epoch': 1.55} {'loss': 0.2776, 'learning_rate': 2.51348736789218e-06, 'epoch': 1.55} {'loss': 0.2978, 'learning_rate': 2.51326463102282e-06, 'epoch': 1.55} {'loss': 0.2307, 'learning_rate': 2.513041902604564e-06, 'epoch': 1.55} {'loss': 0.3782, 'learning_rate': 2.512819182637659e-06, 'epoch': 1.55} {'loss': 0.2616, 'learning_rate': 2.512596471122355e-06, 'epoch': 1.55} {'loss': 0.4397, 'learning_rate': 2.512373768058909e-06, 'epoch': 1.55} {'loss': 0.3377, 'learning_rate': 2.5121510734475664e-06, 'epoch': 1.55} {'loss': 0.2198, 'learning_rate': 2.5119283872885835e-06, 'epoch': 1.55} {'loss': 0.2632, 'learning_rate': 2.511705709582207e-06, 'epoch': 1.55} {'loss': 0.2915, 'learning_rate': 2.511483040328694e-06, 'epoch': 1.55} {'loss': 0.2959, 'learning_rate': 2.5112603795282885e-06, 'epoch': 1.55} {'loss': 0.3182, 'learning_rate': 2.51103772718125e-06, 'epoch': 1.55} {'loss': 0.3518, 'learning_rate': 2.510815083287823e-06, 'epoch': 1.55} {'loss': 0.3288, 'learning_rate': 2.5105924478482637e-06, 'epoch': 1.55} {'loss': 0.273, 'learning_rate': 2.510369820862819e-06, 'epoch': 1.55} {'loss': 0.2981, 'learning_rate': 2.5101472023317454e-06, 'epoch': 1.55} {'loss': 0.3318, 'learning_rate': 2.5099245922552917e-06, 'epoch': 1.55} {'loss': 0.3054, 'learning_rate': 2.509701990633705e-06, 'epoch': 1.55} {'loss': 0.341, 'learning_rate': 2.5094793974672437e-06, 'epoch': 1.55} {'loss': 0.3669, 'learning_rate': 2.5092568127561534e-06, 'epoch': 1.55} {'loss': 0.3723, 'learning_rate': 2.50903423650069e-06, 'epoch': 1.55} {'loss': 0.2629, 'learning_rate': 2.5088116687010998e-06, 'epoch': 1.55} {'loss': 0.2315, 'learning_rate': 2.50858910935764e-06, 'epoch': 1.55} {'loss': 0.3376, 'learning_rate': 2.508366558470555e-06, 'epoch': 1.55} {'loss': 0.4593, 'learning_rate': 2.5081440160401025e-06, 'epoch': 1.55} {'loss': 0.2895, 'learning_rate': 2.507921482066529e-06, 'epoch': 1.55} {'loss': 0.3196, 'learning_rate': 2.5076989565500896e-06, 'epoch': 1.55} {'loss': 0.2867, 'learning_rate': 2.50747643949103e-06, 'epoch': 1.55} {'loss': 0.4441, 'learning_rate': 2.5072539308896083e-06, 'epoch': 1.55} {'loss': 0.3215, 'learning_rate': 2.507031430746072e-06, 'epoch': 1.55} {'loss': 0.5284, 'learning_rate': 2.5068089390606685e-06, 'epoch': 1.55} {'loss': 0.2445, 'learning_rate': 2.506586455833656e-06, 'epoch': 1.55} {'loss': 0.3244, 'learning_rate': 2.5063639810652808e-06, 'epoch': 1.55} {'loss': 0.3599, 'learning_rate': 2.506141514755798e-06, 'epoch': 1.55} {'loss': 0.3307, 'learning_rate': 2.5059190569054525e-06, 'epoch': 1.55} {'loss': 0.2622, 'learning_rate': 2.505696607514504e-06, 'epoch': 1.55} {'loss': 0.2483, 'learning_rate': 2.5054741665831937e-06, 'epoch': 1.55} {'loss': 0.2953, 'learning_rate': 2.5052517341117834e-06, 'epoch': 1.55} {'loss': 0.2361, 'learning_rate': 2.505029310100514e-06, 'epoch': 1.55} {'loss': 0.397, 'learning_rate': 2.504806894549645e-06, 'epoch': 1.55} {'loss': 0.4073, 'learning_rate': 2.5045844874594204e-06, 'epoch': 1.55} {'loss': 0.3057, 'learning_rate': 2.504362088830098e-06, 'epoch': 1.55} {'loss': 0.3408, 'learning_rate': 2.504139698661925e-06, 'epoch': 1.55} {'loss': 0.2713, 'learning_rate': 2.50391731695515e-06, 'epoch': 1.55} {'loss': 0.2671, 'learning_rate': 2.50369494371003e-06, 'epoch': 1.55} {'loss': 0.3815, 'learning_rate': 2.50347257892681e-06, 'epoch': 1.55} {'loss': 0.4521, 'learning_rate': 2.5032502226057466e-06, 'epoch': 1.55} {'loss': 0.2097, 'learning_rate': 2.503027874747085e-06, 'epoch': 1.55} {'loss': 0.2455, 'learning_rate': 2.5028055353510827e-06, 'epoch': 1.55} {'loss': 0.271, 'learning_rate': 2.502583204417984e-06, 'epoch': 1.55} {'loss': 0.2724, 'learning_rate': 2.502360881948046e-06, 'epoch': 1.55} {'loss': 0.2139, 'learning_rate': 2.5021385679415144e-06, 'epoch': 1.55} {'loss': 0.3068, 'learning_rate': 2.501916262398646e-06, 'epoch': 1.55} {'loss': 0.2908, 'learning_rate': 2.5016939653196848e-06, 'epoch': 1.55} {'loss': 0.3455, 'learning_rate': 2.5014716767048875e-06, 'epoch': 1.55} {'loss': 0.2768, 'learning_rate': 2.5012493965545037e-06, 'epoch': 1.55} {'loss': 0.1582, 'learning_rate': 2.50102712486878e-06, 'epoch': 1.55} {'loss': 0.4389, 'learning_rate': 2.5008048616479743e-06, 'epoch': 1.55} {'loss': 0.3689, 'learning_rate': 2.50058260689233e-06, 'epoch': 1.55} {'loss': 0.3033, 'learning_rate': 2.5003603606021053e-06, 'epoch': 1.55} {'loss': 0.4296, 'learning_rate': 2.5001381227775445e-06, 'epoch': 1.55} {'loss': 0.292, 'learning_rate': 2.499915893418904e-06, 'epoch': 1.55} {'loss': 0.3292, 'learning_rate': 2.49969367252643e-06, 'epoch': 1.55} {'loss': 0.2408, 'learning_rate': 2.499471460100379e-06, 'epoch': 1.55} {'loss': 0.331, 'learning_rate': 2.4992492561409942e-06, 'epoch': 1.55} {'loss': 0.2438, 'learning_rate': 2.4990270606485346e-06, 'epoch': 1.55} {'loss': 0.3402, 'learning_rate': 2.4988048736232438e-06, 'epoch': 1.55} {'loss': 0.4414, 'learning_rate': 2.498582695065379e-06, 'epoch': 1.55} {'loss': 0.3537, 'learning_rate': 2.4983605249751874e-06, 'epoch': 1.55} {'loss': 0.4395, 'learning_rate': 2.4981383633529178e-06, 'epoch': 1.55} {'loss': 0.1911, 'learning_rate': 2.497916210198826e-06, 'epoch': 1.55} {'loss': 0.4671, 'learning_rate': 2.4976940655131578e-06, 'epoch': 1.55} {'loss': 0.3161, 'learning_rate': 2.4974719292961692e-06, 'epoch': 1.55} {'loss': 0.2879, 'learning_rate': 2.497249801548105e-06, 'epoch': 1.55} {'loss': 0.2376, 'learning_rate': 2.497027682269222e-06, 'epoch': 1.55} {'loss': 0.3057, 'learning_rate': 2.496805571459765e-06, 'epoch': 1.55} {'loss': 0.2474, 'learning_rate': 2.4965834691199907e-06, 'epoch': 1.55} {'loss': 0.485, 'learning_rate': 2.4963613752501438e-06, 'epoch': 1.55} {'loss': 0.2652, 'learning_rate': 2.496139289850481e-06, 'epoch': 1.55} {'loss': 0.2057, 'learning_rate': 2.4959172129212473e-06, 'epoch': 1.55} {'loss': 0.2804, 'learning_rate': 2.495695144462699e-06, 'epoch': 1.55} {'loss': 0.2711, 'learning_rate': 2.495473084475084e-06, 'epoch': 1.55} {'loss': 0.3441, 'learning_rate': 2.4952510329586464e-06, 'epoch': 1.55} {'loss': 0.2697, 'learning_rate': 2.4950289899136494e-06, 'epoch': 1.55} {'loss': 0.1783, 'learning_rate': 2.494806955340334e-06, 'epoch': 1.55} {'loss': 0.2875, 'learning_rate': 2.494584929238959e-06, 'epoch': 1.55} {'loss': 0.2556, 'learning_rate': 2.4943629116097668e-06, 'epoch': 1.55} {'loss': 0.3152, 'learning_rate': 2.494140902453014e-06, 'epoch': 1.55} {'loss': 0.4756, 'learning_rate': 2.493918901768949e-06, 'epoch': 1.55} {'loss': 0.3759, 'learning_rate': 2.493696909557819e-06, 'epoch': 1.55} {'loss': 0.3117, 'learning_rate': 2.493474925819881e-06, 'epoch': 1.55} {'loss': 0.3217, 'learning_rate': 2.4932529505553793e-06, 'epoch': 1.55} {'loss': 0.4532, 'learning_rate': 2.4930309837645704e-06, 'epoch': 1.55} {'loss': 0.2571, 'learning_rate': 2.4928090254477e-06, 'epoch': 1.55} {'loss': 0.3201, 'learning_rate': 2.492587075605023e-06, 'epoch': 1.55} {'loss': 0.4936, 'learning_rate': 2.492365134236784e-06, 'epoch': 1.55} {'loss': 0.3744, 'learning_rate': 2.492143201343241e-06, 'epoch': 1.55} {'loss': 0.1931, 'learning_rate': 2.491921276924637e-06, 'epoch': 1.55} {'loss': 0.2898, 'learning_rate': 2.491699360981229e-06, 'epoch': 1.55} {'loss': 0.3358, 'learning_rate': 2.4914774535132626e-06, 'epoch': 1.55} {'loss': 0.3891, 'learning_rate': 2.4912555545209927e-06, 'epoch': 1.56} {'loss': 0.2123, 'learning_rate': 2.491033664004665e-06, 'epoch': 1.56} {'loss': 0.3598, 'learning_rate': 2.490811781964535e-06, 'epoch': 1.56} {'loss': 0.3625, 'learning_rate': 2.49058990840085e-06, 'epoch': 1.56} {'loss': 0.3308, 'learning_rate': 2.490368043313859e-06, 'epoch': 1.56} {'loss': 0.3011, 'learning_rate': 2.4901461867038168e-06, 'epoch': 1.56} {'loss': 0.2616, 'learning_rate': 2.489924338570968e-06, 'epoch': 1.56} {'loss': 0.2574, 'learning_rate': 2.4897024989155706e-06, 'epoch': 1.56} {'loss': 0.4725, 'learning_rate': 2.489480667737868e-06, 'epoch': 1.56} {'loss': 0.2746, 'learning_rate': 2.489258845038116e-06, 'epoch': 1.56} {'loss': 0.3205, 'learning_rate': 2.489037030816559e-06, 'epoch': 1.56} {'loss': 0.3646, 'learning_rate': 2.488815225073454e-06, 'epoch': 1.56} {'loss': 0.1917, 'learning_rate': 2.4885934278090462e-06, 'epoch': 1.56} {'loss': 0.3102, 'learning_rate': 2.488371639023591e-06, 'epoch': 1.56} {'loss': 0.1401, 'learning_rate': 2.4881498587173325e-06, 'epoch': 1.56} {'loss': 0.385, 'learning_rate': 2.4879280868905276e-06, 'epoch': 1.56} {'loss': 0.2196, 'learning_rate': 2.487706323543423e-06, 'epoch': 1.56} {'loss': 0.2912, 'learning_rate': 2.4874845686762663e-06, 'epoch': 1.56} {'loss': 0.292, 'learning_rate': 2.4872628222893146e-06, 'epoch': 1.56} {'loss': 0.3389, 'learning_rate': 2.4870410843828106e-06, 'epoch': 1.56} {'loss': 0.2456, 'learning_rate': 2.486819354957013e-06, 'epoch': 1.56} {'loss': 0.1742, 'learning_rate': 2.4865976340121635e-06, 'epoch': 1.56} {'loss': 0.3905, 'learning_rate': 2.4863759215485193e-06, 'epoch': 1.56} {'loss': 0.2492, 'learning_rate': 2.4861542175663257e-06, 'epoch': 1.56} {'loss': 0.4481, 'learning_rate': 2.485932522065838e-06, 'epoch': 1.56} {'loss': 0.3843, 'learning_rate': 2.4857108350473002e-06, 'epoch': 1.56} {'loss': 0.3149, 'learning_rate': 2.4854891565109695e-06, 'epoch': 1.56} {'loss': 0.3788, 'learning_rate': 2.4852674864570892e-06, 'epoch': 1.56} {'loss': 0.3113, 'learning_rate': 2.4850458248859166e-06, 'epoch': 1.56} {'loss': 0.2879, 'learning_rate': 2.484824171797697e-06, 'epoch': 1.56} {'loss': 0.2459, 'learning_rate': 2.48460252719268e-06, 'epoch': 1.56} {'loss': 0.3534, 'learning_rate': 2.48438089107112e-06, 'epoch': 1.56} {'loss': 0.3785, 'learning_rate': 2.4841592634332624e-06, 'epoch': 1.56} {'loss': 0.3232, 'learning_rate': 2.4839376442793627e-06, 'epoch': 1.56} {'loss': 0.2169, 'learning_rate': 2.4837160336096643e-06, 'epoch': 1.56} {'loss': 0.3525, 'learning_rate': 2.4834944314244247e-06, 'epoch': 1.56} {'loss': 0.3366, 'learning_rate': 2.483272837723888e-06, 'epoch': 1.56} {'loss': 0.3001, 'learning_rate': 2.4830512525083093e-06, 'epoch': 1.56} {'loss': 0.4275, 'learning_rate': 2.4828296757779336e-06, 'epoch': 1.56} {'loss': 0.3776, 'learning_rate': 2.4826081075330167e-06, 'epoch': 1.56} {'loss': 0.3235, 'learning_rate': 2.482386547773803e-06, 'epoch': 1.56} {'loss': 0.2224, 'learning_rate': 2.482164996500548e-06, 'epoch': 1.56} {'loss': 0.2286, 'learning_rate': 2.481943453713499e-06, 'epoch': 1.56} {'loss': 0.2997, 'learning_rate': 2.481721919412904e-06, 'epoch': 1.56} {'loss': 0.5101, 'learning_rate': 2.4815003935990165e-06, 'epoch': 1.56} {'loss': 0.387, 'learning_rate': 2.4812788762720842e-06, 'epoch': 1.56} {'loss': 0.2606, 'learning_rate': 2.4810573674323602e-06, 'epoch': 1.56} {'loss': 0.3748, 'learning_rate': 2.48083586708009e-06, 'epoch': 1.56} {'loss': 0.3936, 'learning_rate': 2.48061437521553e-06, 'epoch': 1.56} {'loss': 0.2617, 'learning_rate': 2.480392891838923e-06, 'epoch': 1.56} {'loss': 0.2063, 'learning_rate': 2.480171416950525e-06, 'epoch': 1.56} {'loss': 0.3783, 'learning_rate': 2.479949950550581e-06, 'epoch': 1.56} {'loss': 0.4141, 'learning_rate': 2.479728492639346e-06, 'epoch': 1.56} {'loss': 0.3893, 'learning_rate': 2.4795070432170653e-06, 'epoch': 1.56} {'loss': 0.2622, 'learning_rate': 2.479285602283994e-06, 'epoch': 1.56} {'loss': 0.3309, 'learning_rate': 2.4790641698403783e-06, 'epoch': 1.56} {'loss': 0.3797, 'learning_rate': 2.478842745886466e-06, 'epoch': 1.56} {'loss': 0.324, 'learning_rate': 2.4786213304225135e-06, 'epoch': 1.56} {'loss': 0.4815, 'learning_rate': 2.4783999234487645e-06, 'epoch': 1.56} {'loss': 0.3731, 'learning_rate': 2.4781785249654743e-06, 'epoch': 1.56} {'loss': 0.2205, 'learning_rate': 2.477957134972887e-06, 'epoch': 1.56} {'loss': 0.4074, 'learning_rate': 2.47773575347126e-06, 'epoch': 1.56} {'loss': 0.2944, 'learning_rate': 2.4775143804608347e-06, 'epoch': 1.56} {'loss': 0.1908, 'learning_rate': 2.4772930159418686e-06, 'epoch': 1.56} {'loss': 0.3999, 'learning_rate': 2.4770716599146048e-06, 'epoch': 1.56} {'loss': 0.3493, 'learning_rate': 2.4768503123792998e-06, 'epoch': 1.56} {'loss': 0.3044, 'learning_rate': 2.476628973336197e-06, 'epoch': 1.56} {'loss': 0.3746, 'learning_rate': 2.476407642785552e-06, 'epoch': 1.56} {'loss': 0.2457, 'learning_rate': 2.4761863207276128e-06, 'epoch': 1.56} {'loss': 0.3785, 'learning_rate': 2.4759650071626264e-06, 'epoch': 1.56} {'loss': 0.4815, 'learning_rate': 2.4757437020908458e-06, 'epoch': 1.56} {'loss': 0.4204, 'learning_rate': 2.475522405512518e-06, 'epoch': 1.56} {'loss': 0.2376, 'learning_rate': 2.4753011174278973e-06, 'epoch': 1.56} {'loss': 0.2623, 'learning_rate': 2.4750798378372275e-06, 'epoch': 1.56} {'loss': 0.3126, 'learning_rate': 2.4748585667407655e-06, 'epoch': 1.56} {'loss': 0.193, 'learning_rate': 2.4746373041387527e-06, 'epoch': 1.56} {'loss': 0.4582, 'learning_rate': 2.4744160500314473e-06, 'epoch': 1.56} {'loss': 0.2551, 'learning_rate': 2.474194804419092e-06, 'epoch': 1.56} {'loss': 0.3174, 'learning_rate': 2.473973567301944e-06, 'epoch': 1.56} {'loss': 0.3893, 'learning_rate': 2.473752338680244e-06, 'epoch': 1.56} {'loss': 0.217, 'learning_rate': 2.47353111855425e-06, 'epoch': 1.56} {'loss': 0.3329, 'learning_rate': 2.473309906924205e-06, 'epoch': 1.56} {'loss': 0.229, 'learning_rate': 2.4730887037903617e-06, 'epoch': 1.56} {'loss': 0.2647, 'learning_rate': 2.472867509152973e-06, 'epoch': 1.56} {'loss': 0.2791, 'learning_rate': 2.472646323012283e-06, 'epoch': 1.56} {'loss': 0.3423, 'learning_rate': 2.4724251453685465e-06, 'epoch': 1.56} {'loss': 0.3915, 'learning_rate': 2.472203976222007e-06, 'epoch': 1.56} {'loss': 0.2746, 'learning_rate': 2.471982815572922e-06, 'epoch': 1.56} {'loss': 0.309, 'learning_rate': 2.471761663421536e-06, 'epoch': 1.56} {'loss': 0.2702, 'learning_rate': 2.4715405197680964e-06, 'epoch': 1.56} {'loss': 0.2816, 'learning_rate': 2.4713193846128592e-06, 'epoch': 1.56} {'loss': 0.2543, 'learning_rate': 2.4710982579560684e-06, 'epoch': 1.56} {'loss': 0.4069, 'learning_rate': 2.470877139797978e-06, 'epoch': 1.56} {'loss': 0.3388, 'learning_rate': 2.4706560301388336e-06, 'epoch': 1.56} {'loss': 0.5526, 'learning_rate': 2.4704349289788886e-06, 'epoch': 1.56} {'loss': 0.4267, 'learning_rate': 2.470213836318389e-06, 'epoch': 1.56} {'loss': 0.1671, 'learning_rate': 2.4699927521575884e-06, 'epoch': 1.56} {'loss': 0.3188, 'learning_rate': 2.4697716764967317e-06, 'epoch': 1.56} {'loss': 0.2605, 'learning_rate': 2.4695506093360734e-06, 'epoch': 1.56} {'loss': 0.3474, 'learning_rate': 2.4693295506758574e-06, 'epoch': 1.56} {'loss': 0.2853, 'learning_rate': 2.4691085005163383e-06, 'epoch': 1.56} {'loss': 0.1372, 'learning_rate': 2.468887458857765e-06, 'epoch': 1.56} {'loss': 0.1926, 'learning_rate': 2.468666425700382e-06, 'epoch': 1.56} {'loss': 0.1322, 'learning_rate': 2.4684454010444457e-06, 'epoch': 1.56} {'loss': 0.278, 'learning_rate': 2.4682243848901997e-06, 'epoch': 1.56} {'loss': 0.1598, 'learning_rate': 2.4680033772378987e-06, 'epoch': 1.56} {'loss': 0.293, 'learning_rate': 2.4677823780877875e-06, 'epoch': 1.56} {'loss': 0.1277, 'learning_rate': 2.4675613874401193e-06, 'epoch': 1.56} {'loss': 0.3262, 'learning_rate': 2.46734040529514e-06, 'epoch': 1.56} {'loss': 0.2771, 'learning_rate': 2.4671194316531034e-06, 'epoch': 1.56} {'loss': 0.3097, 'learning_rate': 2.466898466514254e-06, 'epoch': 1.56} {'loss': 0.2359, 'learning_rate': 2.4666775098788463e-06, 'epoch': 1.56} {'loss': 0.4032, 'learning_rate': 2.466456561747125e-06, 'epoch': 1.56} {'loss': 0.3315, 'learning_rate': 2.4662356221193427e-06, 'epoch': 1.56} {'loss': 0.3934, 'learning_rate': 2.4660146909957494e-06, 'epoch': 1.56} {'loss': 0.3949, 'learning_rate': 2.4657937683765896e-06, 'epoch': 1.56} {'loss': 0.2401, 'learning_rate': 2.465572854262119e-06, 'epoch': 1.56} {'loss': 0.2216, 'learning_rate': 2.465351948652581e-06, 'epoch': 1.56} {'loss': 0.1956, 'learning_rate': 2.4651310515482306e-06, 'epoch': 1.56} {'loss': 0.2788, 'learning_rate': 2.464910162949311e-06, 'epoch': 1.56} {'loss': 0.3952, 'learning_rate': 2.4646892828560786e-06, 'epoch': 1.56} {'loss': 0.2485, 'learning_rate': 2.4644684112687756e-06, 'epoch': 1.56} {'loss': 0.2617, 'learning_rate': 2.464247548187658e-06, 'epoch': 1.56} {'loss': 0.3057, 'learning_rate': 2.4640266936129696e-06, 'epoch': 1.56} {'loss': 0.3961, 'learning_rate': 2.4638058475449642e-06, 'epoch': 1.56} {'loss': 0.2347, 'learning_rate': 2.4635850099838865e-06, 'epoch': 1.56} {'loss': 0.2196, 'learning_rate': 2.4633641809299914e-06, 'epoch': 1.56} {'loss': 0.2784, 'learning_rate': 2.463143360383524e-06, 'epoch': 1.56} {'loss': 0.2231, 'learning_rate': 2.4629225483447316e-06, 'epoch': 1.56} {'loss': 0.3186, 'learning_rate': 2.46270174481387e-06, 'epoch': 1.56} {'loss': 0.3296, 'learning_rate': 2.4624809497911817e-06, 'epoch': 1.56} {'loss': 0.2885, 'learning_rate': 2.4622601632769227e-06, 'epoch': 1.56} {'loss': 0.2714, 'learning_rate': 2.4620393852713342e-06, 'epoch': 1.56} {'loss': 0.269, 'learning_rate': 2.4618186157746736e-06, 'epoch': 1.56} {'loss': 0.3078, 'learning_rate': 2.461597854787183e-06, 'epoch': 1.56} {'loss': 0.3484, 'learning_rate': 2.461377102309119e-06, 'epoch': 1.56} {'loss': 0.3094, 'learning_rate': 2.461156358340723e-06, 'epoch': 1.56} {'loss': 0.2999, 'learning_rate': 2.460935622882251e-06, 'epoch': 1.56} {'loss': 0.377, 'learning_rate': 2.4607148959339457e-06, 'epoch': 1.56} {'loss': 0.2218, 'learning_rate': 2.4604941774960635e-06, 'epoch': 1.56} {'loss': 0.3081, 'learning_rate': 2.460273467568849e-06, 'epoch': 1.56} {'loss': 0.3568, 'learning_rate': 2.4600527661525484e-06, 'epoch': 1.56} {'loss': 0.225, 'learning_rate': 2.459832073247418e-06, 'epoch': 1.56} {'loss': 0.2676, 'learning_rate': 2.459611388853701e-06, 'epoch': 1.56} {'loss': 0.2219, 'learning_rate': 2.459390712971651e-06, 'epoch': 1.56} {'loss': 0.3232, 'learning_rate': 2.459170045601512e-06, 'epoch': 1.56} {'loss': 0.1996, 'learning_rate': 2.45894938674354e-06, 'epoch': 1.56} {'loss': 0.3568, 'learning_rate': 2.4587287363979762e-06, 'epoch': 1.56} {'loss': 0.3307, 'learning_rate': 2.458508094565076e-06, 'epoch': 1.56} {'loss': 0.3925, 'learning_rate': 2.4582874612450847e-06, 'epoch': 1.56} {'loss': 0.3275, 'learning_rate': 2.4580668364382555e-06, 'epoch': 1.56} {'loss': 0.1863, 'learning_rate': 2.4578462201448307e-06, 'epoch': 1.56} {'loss': 0.3838, 'learning_rate': 2.4576256123650667e-06, 'epoch': 1.56} {'loss': 0.3369, 'learning_rate': 2.45740501309921e-06, 'epoch': 1.56} {'loss': 0.1766, 'learning_rate': 2.457184422347505e-06, 'epoch': 1.56} {'loss': 0.3866, 'learning_rate': 2.456963840110207e-06, 'epoch': 1.56} {'loss': 0.3544, 'learning_rate': 2.45674326638756e-06, 'epoch': 1.56} {'loss': 0.2375, 'learning_rate': 2.456522701179819e-06, 'epoch': 1.56} {'loss': 0.3111, 'learning_rate': 2.4563021444872246e-06, 'epoch': 1.56} {'loss': 0.2021, 'learning_rate': 2.456081596310035e-06, 'epoch': 1.56} {'loss': 0.3094, 'learning_rate': 2.455861056648492e-06, 'epoch': 1.56} {'loss': 0.3006, 'learning_rate': 2.4556405255028494e-06, 'epoch': 1.56} {'loss': 0.2981, 'learning_rate': 2.455420002873351e-06, 'epoch': 1.56} {'loss': 0.1647, 'learning_rate': 2.455199488760253e-06, 'epoch': 1.56} {'loss': 0.4456, 'learning_rate': 2.454978983163796e-06, 'epoch': 1.56} {'loss': 0.4231, 'learning_rate': 2.4547584860842355e-06, 'epoch': 1.56} {'loss': 0.3326, 'learning_rate': 2.4545379975218164e-06, 'epoch': 1.56} {'loss': 0.3523, 'learning_rate': 2.454317517476791e-06, 'epoch': 1.56} {'loss': 0.4102, 'learning_rate': 2.4540970459494063e-06, 'epoch': 1.56} {'loss': 0.2676, 'learning_rate': 2.453876582939908e-06, 'epoch': 1.56} {'loss': 0.2596, 'learning_rate': 2.453656128448552e-06, 'epoch': 1.56} {'loss': 0.4017, 'learning_rate': 2.453435682475579e-06, 'epoch': 1.56} {'loss': 0.2572, 'learning_rate': 2.4532152450212455e-06, 'epoch': 1.56} {'loss': 0.3467, 'learning_rate': 2.452994816085794e-06, 'epoch': 1.56} {'loss': 0.3504, 'learning_rate': 2.452774395669479e-06, 'epoch': 1.56} {'loss': 0.4138, 'learning_rate': 2.452553983772544e-06, 'epoch': 1.56} {'loss': 0.3528, 'learning_rate': 2.452333580395243e-06, 'epoch': 1.56} {'loss': 0.3544, 'learning_rate': 2.45211318553782e-06, 'epoch': 1.56} {'loss': 0.3081, 'learning_rate': 2.4518927992005283e-06, 'epoch': 1.56} {'loss': 0.2466, 'learning_rate': 2.4516724213836106e-06, 'epoch': 1.56} {'loss': 0.3685, 'learning_rate': 2.451452052087323e-06, 'epoch': 1.56} {'loss': 0.3124, 'learning_rate': 2.4512316913119082e-06, 'epoch': 1.56} {'loss': 0.2229, 'learning_rate': 2.451011339057616e-06, 'epoch': 1.56} {'loss': 0.2522, 'learning_rate': 2.450790995324701e-06, 'epoch': 1.56} {'loss': 0.2149, 'learning_rate': 2.450570660113404e-06, 'epoch': 1.56} {'loss': 0.4391, 'learning_rate': 2.4503503334239785e-06, 'epoch': 1.56} {'loss': 0.2491, 'learning_rate': 2.450130015256671e-06, 'epoch': 1.56} {'loss': 0.2576, 'learning_rate': 2.4499097056117327e-06, 'epoch': 1.56} {'loss': 0.2657, 'learning_rate': 2.4496894044894115e-06, 'epoch': 1.56} {'loss': 0.3504, 'learning_rate': 2.4494691118899516e-06, 'epoch': 1.56} {'loss': 0.1703, 'learning_rate': 2.4492488278136086e-06, 'epoch': 1.56} {'loss': 0.2697, 'learning_rate': 2.449028552260625e-06, 'epoch': 1.56} {'loss': 0.304, 'learning_rate': 2.4488082852312544e-06, 'epoch': 1.56} {'loss': 0.2925, 'learning_rate': 2.4485880267257413e-06, 'epoch': 1.56} {'loss': 0.1909, 'learning_rate': 2.448367776744338e-06, 'epoch': 1.56} {'loss': 0.3635, 'learning_rate': 2.4481475352872895e-06, 'epoch': 1.56} {'loss': 0.3047, 'learning_rate': 2.44792730235485e-06, 'epoch': 1.56} {'loss': 0.3544, 'learning_rate': 2.44770707794726e-06, 'epoch': 1.56} {'loss': 0.2698, 'learning_rate': 2.4474868620647763e-06, 'epoch': 1.56} {'loss': 0.2738, 'learning_rate': 2.4472666547076416e-06, 'epoch': 1.56} {'loss': 0.3595, 'learning_rate': 2.4470464558761087e-06, 'epoch': 1.56} {'loss': 0.3691, 'learning_rate': 2.4468262655704245e-06, 'epoch': 1.56} {'loss': 0.4104, 'learning_rate': 2.4466060837908333e-06, 'epoch': 1.56} {'loss': 0.2107, 'learning_rate': 2.446385910537591e-06, 'epoch': 1.56} {'loss': 0.2931, 'learning_rate': 2.44616574581094e-06, 'epoch': 1.56} {'loss': 0.312, 'learning_rate': 2.445945589611134e-06, 'epoch': 1.56} {'loss': 0.3877, 'learning_rate': 2.445725441938416e-06, 'epoch': 1.56} {'loss': 0.3969, 'learning_rate': 2.445505302793041e-06, 'epoch': 1.56} {'loss': 0.1872, 'learning_rate': 2.4452851721752504e-06, 'epoch': 1.56} {'loss': 0.2174, 'learning_rate': 2.445065050085299e-06, 'epoch': 1.56} {'loss': 0.3963, 'learning_rate': 2.4448449365234293e-06, 'epoch': 1.56} {'loss': 0.1907, 'learning_rate': 2.444624831489897e-06, 'epoch': 1.56} {'loss': 0.4123, 'learning_rate': 2.4444047349849433e-06, 'epoch': 1.56} {'loss': 0.1438, 'learning_rate': 2.444184647008823e-06, 'epoch': 1.56} {'loss': 0.3539, 'learning_rate': 2.4439645675617808e-06, 'epoch': 1.56} {'loss': 0.3656, 'learning_rate': 2.4437444966440627e-06, 'epoch': 1.56} {'loss': 0.3063, 'learning_rate': 2.4435244342559237e-06, 'epoch': 1.56} {'loss': 0.2692, 'learning_rate': 2.4433043803976055e-06, 'epoch': 1.56} {'loss': 0.2788, 'learning_rate': 2.4430843350693635e-06, 'epoch': 1.56} {'loss': 0.2497, 'learning_rate': 2.442864298271438e-06, 'epoch': 1.56} {'loss': 0.457, 'learning_rate': 2.4426442700040852e-06, 'epoch': 1.56} {'loss': 0.3061, 'learning_rate': 2.4424242502675466e-06, 'epoch': 1.56} {'loss': 0.5026, 'learning_rate': 2.442204239062077e-06, 'epoch': 1.56} {'loss': 0.3771, 'learning_rate': 2.4419842363879187e-06, 'epoch': 1.56} {'loss': 0.2183, 'learning_rate': 2.4417642422453267e-06, 'epoch': 1.56} {'loss': 0.395, 'learning_rate': 2.4415442566345415e-06, 'epoch': 1.56} {'loss': 0.2755, 'learning_rate': 2.441324279555819e-06, 'epoch': 1.56} {'loss': 0.2734, 'learning_rate': 2.4411043110094045e-06, 'epoch': 1.56} {'loss': 0.2832, 'learning_rate': 2.440884350995543e-06, 'epoch': 1.56} {'loss': 0.2201, 'learning_rate': 2.4406643995144873e-06, 'epoch': 1.56} {'loss': 0.3332, 'learning_rate': 2.440444456566482e-06, 'epoch': 1.56} {'loss': 0.2108, 'learning_rate': 2.4402245221517796e-06, 'epoch': 1.56} {'loss': 0.3399, 'learning_rate': 2.440004596270624e-06, 'epoch': 1.56} {'loss': 0.2556, 'learning_rate': 2.439784678923268e-06, 'epoch': 1.56} {'loss': 0.28, 'learning_rate': 2.4395647701099544e-06, 'epoch': 1.56} {'loss': 0.2487, 'learning_rate': 2.4393448698309386e-06, 'epoch': 1.56} {'loss': 0.3378, 'learning_rate': 2.439124978086461e-06, 'epoch': 1.56} {'loss': 0.2521, 'learning_rate': 2.4389050948767766e-06, 'epoch': 1.56} {'loss': 0.2943, 'learning_rate': 2.4386852202021273e-06, 'epoch': 1.56} {'loss': 0.4301, 'learning_rate': 2.438465354062768e-06, 'epoch': 1.56} {'loss': 0.3971, 'learning_rate': 2.438245496458942e-06, 'epoch': 1.56} {'loss': 0.19, 'learning_rate': 2.438025647390897e-06, 'epoch': 1.56} {'loss': 0.3295, 'learning_rate': 2.437805806858886e-06, 'epoch': 1.56} {'loss': 0.3297, 'learning_rate': 2.4375859748631515e-06, 'epoch': 1.56} {'loss': 0.241, 'learning_rate': 2.437366151403947e-06, 'epoch': 1.56} {'loss': 0.4714, 'learning_rate': 2.437146336481516e-06, 'epoch': 1.56} {'loss': 0.2935, 'learning_rate': 2.436926530096111e-06, 'epoch': 1.56} {'loss': 0.2316, 'learning_rate': 2.436706732247974e-06, 'epoch': 1.56} {'loss': 0.1334, 'learning_rate': 2.4364869429373607e-06, 'epoch': 1.56} {'loss': 0.3953, 'learning_rate': 2.4362671621645116e-06, 'epoch': 1.56} {'loss': 0.307, 'learning_rate': 2.436047389929682e-06, 'epoch': 1.56} {'loss': 0.3041, 'learning_rate': 2.4358276262331137e-06, 'epoch': 1.56} {'loss': 0.3055, 'learning_rate': 2.435607871075061e-06, 'epoch': 1.56} {'loss': 0.2448, 'learning_rate': 2.4353881244557687e-06, 'epoch': 1.56} {'loss': 0.2583, 'learning_rate': 2.4351683863754803e-06, 'epoch': 1.56} {'loss': 0.3544, 'learning_rate': 2.434948656834453e-06, 'epoch': 1.56} {'loss': 0.2651, 'learning_rate': 2.4347289358329262e-06, 'epoch': 1.56} {'loss': 0.3628, 'learning_rate': 2.4345092233711544e-06, 'epoch': 1.56} {'loss': 0.1941, 'learning_rate': 2.434289519449381e-06, 'epoch': 1.56} {'loss': 0.2434, 'learning_rate': 2.4340698240678583e-06, 'epoch': 1.56} {'loss': 0.3591, 'learning_rate': 2.4338501372268286e-06, 'epoch': 1.56} {'loss': 0.2179, 'learning_rate': 2.433630458926548e-06, 'epoch': 1.56} {'loss': 0.4445, 'learning_rate': 2.4334107891672555e-06, 'epoch': 1.56} {'loss': 0.2235, 'learning_rate': 2.433191127949207e-06, 'epoch': 1.56} {'loss': 0.3486, 'learning_rate': 2.432971475272643e-06, 'epoch': 1.56} {'loss': 0.4103, 'learning_rate': 2.4327518311378183e-06, 'epoch': 1.56} {'loss': 0.2744, 'learning_rate': 2.432532195544979e-06, 'epoch': 1.56} {'loss': 0.3472, 'learning_rate': 2.432312568494368e-06, 'epoch': 1.56} {'loss': 0.2573, 'learning_rate': 2.43209294998624e-06, 'epoch': 1.56} {'loss': 0.3574, 'learning_rate': 2.4318733400208372e-06, 'epoch': 1.56} {'loss': 0.2283, 'learning_rate': 2.4316537385984127e-06, 'epoch': 1.56} {'loss': 0.318, 'learning_rate': 2.4314341457192104e-06, 'epoch': 1.56} {'loss': 0.3337, 'learning_rate': 2.4312145613834814e-06, 'epoch': 1.56} {'loss': 0.4218, 'learning_rate': 2.4309949855914696e-06, 'epoch': 1.56} {'loss': 0.3381, 'learning_rate': 2.4307754183434275e-06, 'epoch': 1.56} {'loss': 0.4024, 'learning_rate': 2.4305558596395973e-06, 'epoch': 1.56} {'loss': 0.3964, 'learning_rate': 2.4303363094802344e-06, 'epoch': 1.56} {'loss': 0.2386, 'learning_rate': 2.430116767865579e-06, 'epoch': 1.56} {'loss': 0.2539, 'learning_rate': 2.429897234795885e-06, 'epoch': 1.56} {'loss': 0.3735, 'learning_rate': 2.4296777102713966e-06, 'epoch': 1.56} {'loss': 0.4198, 'learning_rate': 2.429458194292358e-06, 'epoch': 1.56} {'loss': 0.3769, 'learning_rate': 2.429238686859027e-06, 'epoch': 1.56} {'loss': 0.2847, 'learning_rate': 2.429019187971643e-06, 'epoch': 1.56} {'loss': 0.2339, 'learning_rate': 2.4287996976304585e-06, 'epoch': 1.56} {'loss': 0.3603, 'learning_rate': 2.4285802158357173e-06, 'epoch': 1.56} {'loss': 0.2643, 'learning_rate': 2.428360742587672e-06, 'epoch': 1.56} {'loss': 0.3664, 'learning_rate': 2.4281412778865655e-06, 'epoch': 1.56} {'loss': 0.2978, 'learning_rate': 2.4279218217326504e-06, 'epoch': 1.56} {'loss': 0.282, 'learning_rate': 2.4277023741261706e-06, 'epoch': 1.56} {'loss': 0.3532, 'learning_rate': 2.4274829350673735e-06, 'epoch': 1.56} {'loss': 0.2199, 'learning_rate': 2.4272635045565097e-06, 'epoch': 1.56} {'loss': 0.2216, 'learning_rate': 2.4270440825938224e-06, 'epoch': 1.56} {'loss': 0.2543, 'learning_rate': 2.426824669179566e-06, 'epoch': 1.56} {'loss': 0.2397, 'learning_rate': 2.4266052643139814e-06, 'epoch': 1.56} {'loss': 0.39, 'learning_rate': 2.426385867997322e-06, 'epoch': 1.56} {'loss': 0.3465, 'learning_rate': 2.4261664802298302e-06, 'epoch': 1.56} {'loss': 0.3066, 'learning_rate': 2.4259471010117585e-06, 'epoch': 1.56} {'loss': 0.3315, 'learning_rate': 2.4257277303433502e-06, 'epoch': 1.56} {'loss': 0.2228, 'learning_rate': 2.425508368224857e-06, 'epoch': 1.56} {'loss': 0.1812, 'learning_rate': 2.425289014656522e-06, 'epoch': 1.56} {'loss': 0.5622, 'learning_rate': 2.4250696696385987e-06, 'epoch': 1.56} {'loss': 0.313, 'learning_rate': 2.4248503331713315e-06, 'epoch': 1.56} {'loss': 0.3106, 'learning_rate': 2.424631005254964e-06, 'epoch': 1.56} {'loss': 0.4167, 'learning_rate': 2.4244116858897505e-06, 'epoch': 1.56} {'loss': 0.3481, 'learning_rate': 2.4241923750759323e-06, 'epoch': 1.56} {'loss': 0.335, 'learning_rate': 2.4239730728137646e-06, 'epoch': 1.56} {'loss': 0.268, 'learning_rate': 2.4237537791034872e-06, 'epoch': 1.56} {'loss': 0.4269, 'learning_rate': 2.423534493945353e-06, 'epoch': 1.56} {'loss': 0.3234, 'learning_rate': 2.4233152173396058e-06, 'epoch': 1.56} {'loss': 0.1399, 'learning_rate': 2.423095949286498e-06, 'epoch': 1.56} {'loss': 0.3811, 'learning_rate': 2.42287668978627e-06, 'epoch': 1.56} {'loss': 0.4317, 'learning_rate': 2.4226574388391777e-06, 'epoch': 1.56} {'loss': 0.3977, 'learning_rate': 2.42243819644546e-06, 'epoch': 1.56} {'loss': 0.2753, 'learning_rate': 2.4222189626053726e-06, 'epoch': 1.56} {'loss': 0.4002, 'learning_rate': 2.4219997373191583e-06, 'epoch': 1.56} {'loss': 0.2148, 'learning_rate': 2.4217805205870628e-06, 'epoch': 1.56} {'loss': 0.4084, 'learning_rate': 2.4215613124093385e-06, 'epoch': 1.56} {'loss': 0.4513, 'learning_rate': 2.421342112786228e-06, 'epoch': 1.56} {'loss': 0.2304, 'learning_rate': 2.4211229217179833e-06, 'epoch': 1.56} {'loss': 0.3247, 'learning_rate': 2.4209037392048474e-06, 'epoch': 1.56} {'loss': 0.2958, 'learning_rate': 2.420684565247072e-06, 'epoch': 1.56} {'loss': 0.3382, 'learning_rate': 2.4204653998449013e-06, 'epoch': 1.56} {'loss': 0.3, 'learning_rate': 2.4202462429985853e-06, 'epoch': 1.56} {'loss': 0.3082, 'learning_rate': 2.4200270947083672e-06, 'epoch': 1.56} {'loss': 0.2733, 'learning_rate': 2.4198079549745003e-06, 'epoch': 1.56} {'loss': 0.3121, 'learning_rate': 2.419588823797225e-06, 'epoch': 1.56} {'loss': 0.2385, 'learning_rate': 2.419369701176797e-06, 'epoch': 1.56} {'loss': 0.3821, 'learning_rate': 2.419150587113458e-06, 'epoch': 1.56} {'loss': 0.4111, 'learning_rate': 2.418931481607454e-06, 'epoch': 1.56} {'loss': 0.3886, 'learning_rate': 2.4187123846590376e-06, 'epoch': 1.56} {'loss': 0.3766, 'learning_rate': 2.4184932962684493e-06, 'epoch': 1.56} {'loss': 0.3327, 'learning_rate': 2.4182742164359453e-06, 'epoch': 1.56} {'loss': 0.2095, 'learning_rate': 2.418055145161763e-06, 'epoch': 1.56} {'loss': 0.3863, 'learning_rate': 2.4178360824461587e-06, 'epoch': 1.56} {'loss': 0.3477, 'learning_rate': 2.417617028289373e-06, 'epoch': 1.56} {'loss': 0.2005, 'learning_rate': 2.4173979826916583e-06, 'epoch': 1.56} {'loss': 0.1897, 'learning_rate': 2.4171789456532556e-06, 'epoch': 1.56} {'loss': 0.2868, 'learning_rate': 2.4169599171744194e-06, 'epoch': 1.56} {'loss': 0.3256, 'learning_rate': 2.4167408972553907e-06, 'epoch': 1.56} {'loss': 0.3352, 'learning_rate': 2.4165218858964236e-06, 'epoch': 1.56} {'loss': 0.4634, 'learning_rate': 2.41630288309776e-06, 'epoch': 1.56} {'loss': 0.3068, 'learning_rate': 2.416083888859645e-06, 'epoch': 1.56} {'loss': 0.2975, 'learning_rate': 2.4158649031823335e-06, 'epoch': 1.56} {'loss': 0.4357, 'learning_rate': 2.4156459260660636e-06, 'epoch': 1.56} {'loss': 0.2999, 'learning_rate': 2.4154269575110913e-06, 'epoch': 1.56} {'loss': 0.2845, 'learning_rate': 2.415207997517657e-06, 'epoch': 1.56} {'loss': 0.1539, 'learning_rate': 2.4149890460860124e-06, 'epoch': 1.56} {'loss': 0.3603, 'learning_rate': 2.4147701032164006e-06, 'epoch': 1.56} {'loss': 0.3681, 'learning_rate': 2.414551168909074e-06, 'epoch': 1.56} {'loss': 0.4204, 'learning_rate': 2.4143322431642737e-06, 'epoch': 1.56} {'loss': 0.2945, 'learning_rate': 2.4141133259822523e-06, 'epoch': 1.56} {'loss': 0.2484, 'learning_rate': 2.4138944173632516e-06, 'epoch': 1.56} {'loss': 0.3183, 'learning_rate': 2.4136755173075254e-06, 'epoch': 1.56} {'loss': 0.2842, 'learning_rate': 2.4134566258153157e-06, 'epoch': 1.56} {'loss': 0.3346, 'learning_rate': 2.413237742886868e-06, 'epoch': 1.56} {'loss': 0.2739, 'learning_rate': 2.4130188685224366e-06, 'epoch': 1.56} {'loss': 0.2387, 'learning_rate': 2.4128000027222597e-06, 'epoch': 1.56} {'loss': 0.3137, 'learning_rate': 2.412581145486592e-06, 'epoch': 1.56} {'loss': 0.2577, 'learning_rate': 2.4123622968156745e-06, 'epoch': 1.56} {'loss': 0.2511, 'learning_rate': 2.41214345670976e-06, 'epoch': 1.56} {'loss': 0.2183, 'learning_rate': 2.411924625169091e-06, 'epoch': 1.56} {'loss': 0.3541, 'learning_rate': 2.411705802193918e-06, 'epoch': 1.56} {'loss': 0.3688, 'learning_rate': 2.4114869877844826e-06, 'epoch': 1.56} {'loss': 0.2201, 'learning_rate': 2.411268181941039e-06, 'epoch': 1.56} {'loss': 0.4264, 'learning_rate': 2.411049384663827e-06, 'epoch': 1.56} {'loss': 0.3995, 'learning_rate': 2.410830595953101e-06, 'epoch': 1.56} {'loss': 0.4009, 'learning_rate': 2.410611815809104e-06, 'epoch': 1.56} {'loss': 0.3042, 'learning_rate': 2.41039304423208e-06, 'epoch': 1.56} {'loss': 0.2753, 'learning_rate': 2.4101742812222818e-06, 'epoch': 1.56} {'loss': 0.2988, 'learning_rate': 2.4099555267799514e-06, 'epoch': 1.56} {'loss': 0.3204, 'learning_rate': 2.4097367809053397e-06, 'epoch': 1.56} {'loss': 0.2916, 'learning_rate': 2.4095180435986887e-06, 'epoch': 1.56} {'loss': 0.2585, 'learning_rate': 2.409299314860253e-06, 'epoch': 1.56} {'loss': 0.3756, 'learning_rate': 2.4090805946902705e-06, 'epoch': 1.56} {'loss': 0.2182, 'learning_rate': 2.4088618830889955e-06, 'epoch': 1.56} {'loss': 0.4244, 'learning_rate': 2.40864318005667e-06, 'epoch': 1.56} {'loss': 0.289, 'learning_rate': 2.4084244855935447e-06, 'epoch': 1.56} {'loss': 0.2201, 'learning_rate': 2.408205799699862e-06, 'epoch': 1.56} {'loss': 0.3482, 'learning_rate': 2.4079871223758744e-06, 'epoch': 1.56} {'loss': 0.3243, 'learning_rate': 2.407768453621823e-06, 'epoch': 1.56} {'loss': 0.3089, 'learning_rate': 2.4075497934379566e-06, 'epoch': 1.56} {'loss': 0.2937, 'learning_rate': 2.407331141824526e-06, 'epoch': 1.56} {'loss': 0.3374, 'learning_rate': 2.4071124987817716e-06, 'epoch': 1.56} {'loss': 0.2904, 'learning_rate': 2.406893864309946e-06, 'epoch': 1.56} {'loss': 0.3681, 'learning_rate': 2.4066752384092918e-06, 'epoch': 1.56} {'loss': 0.2009, 'learning_rate': 2.406456621080059e-06, 'epoch': 1.56} {'loss': 0.2303, 'learning_rate': 2.4062380123224927e-06, 'epoch': 1.56} {'loss': 0.3483, 'learning_rate': 2.4060194121368374e-06, 'epoch': 1.56} {'loss': 0.1692, 'learning_rate': 2.405800820523344e-06, 'epoch': 1.56} {'loss': 0.3857, 'learning_rate': 2.405582237482256e-06, 'epoch': 1.56} {'loss': 0.3836, 'learning_rate': 2.4053636630138235e-06, 'epoch': 1.56} {'loss': 0.3952, 'learning_rate': 2.405145097118288e-06, 'epoch': 1.56} {'loss': 0.3636, 'learning_rate': 2.404926539795902e-06, 'epoch': 1.56} {'loss': 0.2154, 'learning_rate': 2.4047079910469073e-06, 'epoch': 1.56} {'loss': 0.2368, 'learning_rate': 2.4044894508715567e-06, 'epoch': 1.56} {'loss': 0.301, 'learning_rate': 2.4042709192700897e-06, 'epoch': 1.56} {'loss': 0.234, 'learning_rate': 2.4040523962427585e-06, 'epoch': 1.56} {'loss': 0.395, 'learning_rate': 2.4038338817898054e-06, 'epoch': 1.56} {'loss': 0.2933, 'learning_rate': 2.4036153759114834e-06, 'epoch': 1.56} {'loss': 0.2912, 'learning_rate': 2.403396878608034e-06, 'epoch': 1.56} {'loss': 0.3284, 'learning_rate': 2.403178389879702e-06, 'epoch': 1.56} {'loss': 0.3041, 'learning_rate': 2.4029599097267397e-06, 'epoch': 1.56} {'loss': 0.2109, 'learning_rate': 2.4027414381493887e-06, 'epoch': 1.56} {'loss': 0.3589, 'learning_rate': 2.4025229751479007e-06, 'epoch': 1.56} {'loss': 0.3317, 'learning_rate': 2.402304520722517e-06, 'epoch': 1.56} {'loss': 0.269, 'learning_rate': 2.4020860748734887e-06, 'epoch': 1.56} {'loss': 0.3573, 'learning_rate': 2.4018676376010584e-06, 'epoch': 1.56} {'loss': 0.3155, 'learning_rate': 2.4016492089054767e-06, 'epoch': 1.56} {'loss': 0.2843, 'learning_rate': 2.401430788786986e-06, 'epoch': 1.56} {'loss': 0.2582, 'learning_rate': 2.4012123772458372e-06, 'epoch': 1.56} {'loss': 0.3643, 'learning_rate': 2.400993974282273e-06, 'epoch': 1.56} {'loss': 0.3158, 'learning_rate': 2.4007755798965437e-06, 'epoch': 1.56} {'loss': 0.315, 'learning_rate': 2.400557194088894e-06, 'epoch': 1.56} {'loss': 0.2873, 'learning_rate': 2.4003388168595664e-06, 'epoch': 1.56} {'loss': 0.2717, 'learning_rate': 2.4001204482088145e-06, 'epoch': 1.56} {'loss': 0.4069, 'learning_rate': 2.3999020881368785e-06, 'epoch': 1.56} {'loss': 0.4147, 'learning_rate': 2.3996837366440105e-06, 'epoch': 1.56} {'loss': 0.2804, 'learning_rate': 2.399465393730452e-06, 'epoch': 1.56} {'loss': 0.3636, 'learning_rate': 2.3992470593964546e-06, 'epoch': 1.56} {'loss': 0.4137, 'learning_rate': 2.399028733642259e-06, 'epoch': 1.56} {'loss': 0.3252, 'learning_rate': 2.398810416468117e-06, 'epoch': 1.56} {'loss': 0.2754, 'learning_rate': 2.39859210787427e-06, 'epoch': 1.56} {'loss': 0.2809, 'learning_rate': 2.3983738078609698e-06, 'epoch': 1.56} {'loss': 0.2952, 'learning_rate': 2.3981555164284574e-06, 'epoch': 1.56} {'loss': 0.3974, 'learning_rate': 2.3979372335769847e-06, 'epoch': 1.56} {'loss': 0.2684, 'learning_rate': 2.397718959306795e-06, 'epoch': 1.56} {'loss': 0.2766, 'learning_rate': 2.3975006936181322e-06, 'epoch': 1.56} {'loss': 0.267, 'learning_rate': 2.397282436511248e-06, 'epoch': 1.56} {'loss': 0.2381, 'learning_rate': 2.3970641879863844e-06, 'epoch': 1.56} {'loss': 0.2805, 'learning_rate': 2.396845948043791e-06, 'epoch': 1.56} {'loss': 0.5755, 'learning_rate': 2.3966277166837104e-06, 'epoch': 1.56} {'loss': 0.4225, 'learning_rate': 2.396409493906395e-06, 'epoch': 1.56} {'loss': 0.37, 'learning_rate': 2.3961912797120835e-06, 'epoch': 1.56} {'loss': 0.3514, 'learning_rate': 2.3959730741010302e-06, 'epoch': 1.56} {'loss': 0.4481, 'learning_rate': 2.395754877073473e-06, 'epoch': 1.56} {'loss': 0.2534, 'learning_rate': 2.395536688629666e-06, 'epoch': 1.56} {'loss': 0.3797, 'learning_rate': 2.3953185087698496e-06, 'epoch': 1.56} {'loss': 0.2471, 'learning_rate': 2.395100337494274e-06, 'epoch': 1.56} {'loss': 0.3102, 'learning_rate': 2.3948821748031825e-06, 'epoch': 1.56} {'loss': 0.39, 'learning_rate': 2.3946640206968253e-06, 'epoch': 1.56} {'loss': 0.3989, 'learning_rate': 2.3944458751754463e-06, 'epoch': 1.56} {'loss': 0.3289, 'learning_rate': 2.394227738239289e-06, 'epoch': 1.56} {'loss': 0.1805, 'learning_rate': 2.3940096098886044e-06, 'epoch': 1.56} {'loss': 0.3364, 'learning_rate': 2.3937914901236335e-06, 'epoch': 1.56} {'loss': 0.4697, 'learning_rate': 2.393573378944629e-06, 'epoch': 1.56} {'loss': 0.2658, 'learning_rate': 2.393355276351831e-06, 'epoch': 1.56} {'loss': 0.2766, 'learning_rate': 2.393137182345492e-06, 'epoch': 1.56} {'loss': 0.3573, 'learning_rate': 2.392919096925851e-06, 'epoch': 1.56} {'loss': 0.3532, 'learning_rate': 2.39270102009316e-06, 'epoch': 1.56} {'loss': 0.5325, 'learning_rate': 2.392482951847661e-06, 'epoch': 1.56} {'loss': 0.3475, 'learning_rate': 2.392264892189604e-06, 'epoch': 1.56} {'loss': 0.2115, 'learning_rate': 2.392046841119231e-06, 'epoch': 1.56} {'loss': 0.3868, 'learning_rate': 2.391828798636794e-06, 'epoch': 1.56} {'loss': 0.3046, 'learning_rate': 2.3916107647425347e-06, 'epoch': 1.56} {'loss': 0.3765, 'learning_rate': 2.3913927394366977e-06, 'epoch': 1.56} {'loss': 0.2865, 'learning_rate': 2.391174722719534e-06, 'epoch': 1.56} {'loss': 0.3079, 'learning_rate': 2.3909567145912836e-06, 'epoch': 1.56} {'loss': 0.2833, 'learning_rate': 2.3907387150522e-06, 'epoch': 1.56} {'loss': 0.3351, 'learning_rate': 2.390520724102522e-06, 'epoch': 1.56} {'loss': 0.3758, 'learning_rate': 2.390302741742503e-06, 'epoch': 1.56} {'loss': 0.1874, 'learning_rate': 2.3900847679723804e-06, 'epoch': 1.56} {'loss': 0.4733, 'learning_rate': 2.3898668027924097e-06, 'epoch': 1.56} {'loss': 0.3181, 'learning_rate': 2.3896488462028287e-06, 'epoch': 1.56} {'loss': 0.4015, 'learning_rate': 2.3894308982038893e-06, 'epoch': 1.56} {'loss': 0.3642, 'learning_rate': 2.3892129587958333e-06, 'epoch': 1.56} {'loss': 0.3054, 'learning_rate': 2.388995027978911e-06, 'epoch': 1.56} {'loss': 0.2505, 'learning_rate': 2.388777105753366e-06, 'epoch': 1.56} {'loss': 0.1567, 'learning_rate': 2.3885591921194406e-06, 'epoch': 1.56} {'loss': 0.3498, 'learning_rate': 2.388341287077389e-06, 'epoch': 1.56} {'loss': 0.3036, 'learning_rate': 2.3881233906274494e-06, 'epoch': 1.56} {'loss': 0.4021, 'learning_rate': 2.3879055027698728e-06, 'epoch': 1.56} {'loss': 0.2478, 'learning_rate': 2.3876876235049016e-06, 'epoch': 1.56} {'loss': 0.382, 'learning_rate': 2.3874697528327863e-06, 'epoch': 1.56} {'loss': 0.1476, 'learning_rate': 2.3872518907537668e-06, 'epoch': 1.56} {'loss': 0.266, 'learning_rate': 2.3870340372680943e-06, 'epoch': 1.56} {'loss': 0.2355, 'learning_rate': 2.3868161923760115e-06, 'epoch': 1.56} {'loss': 0.3259, 'learning_rate': 2.386598356077767e-06, 'epoch': 1.56} {'loss': 0.3087, 'learning_rate': 2.386380528373603e-06, 'epoch': 1.56} {'loss': 0.2648, 'learning_rate': 2.386162709263767e-06, 'epoch': 1.56} {'loss': 0.3119, 'learning_rate': 2.3859448987485102e-06, 'epoch': 1.56} {'loss': 0.1813, 'learning_rate': 2.3857270968280686e-06, 'epoch': 1.56} {'loss': 0.4145, 'learning_rate': 2.385509303502698e-06, 'epoch': 1.56} {'loss': 0.1843, 'learning_rate': 2.3852915187726357e-06, 'epoch': 1.57} {'loss': 0.4229, 'learning_rate': 2.385073742638133e-06, 'epoch': 1.57} {'loss': 0.2391, 'learning_rate': 2.3848559750994327e-06, 'epoch': 1.57} {'loss': 0.3398, 'learning_rate': 2.384638216156784e-06, 'epoch': 1.57} {'loss': 0.1605, 'learning_rate': 2.384420465810431e-06, 'epoch': 1.57} {'loss': 0.385, 'learning_rate': 2.384202724060616e-06, 'epoch': 1.57} {'loss': 0.3701, 'learning_rate': 2.3839849909075907e-06, 'epoch': 1.57} {'loss': 0.4207, 'learning_rate': 2.3837672663515953e-06, 'epoch': 1.57} {'loss': 0.3056, 'learning_rate': 2.383549550392882e-06, 'epoch': 1.57} {'loss': 0.1305, 'learning_rate': 2.383331843031689e-06, 'epoch': 1.57} {'loss': 0.1967, 'learning_rate': 2.383114144268269e-06, 'epoch': 1.57} {'loss': 0.2353, 'learning_rate': 2.382896454102863e-06, 'epoch': 1.57} {'loss': 0.2627, 'learning_rate': 2.3826787725357205e-06, 'epoch': 1.57} {'loss': 0.5068, 'learning_rate': 2.3824610995670814e-06, 'epoch': 1.57} {'loss': 0.1657, 'learning_rate': 2.382243435197199e-06, 'epoch': 1.57} {'loss': 0.3118, 'learning_rate': 2.3820257794263124e-06, 'epoch': 1.57} {'loss': 0.2871, 'learning_rate': 2.381808132254673e-06, 'epoch': 1.57} {'loss': 0.2375, 'learning_rate': 2.381590493682523e-06, 'epoch': 1.57} {'loss': 0.4319, 'learning_rate': 2.3813728637101064e-06, 'epoch': 1.57} {'loss': 0.2516, 'learning_rate': 2.381155242337673e-06, 'epoch': 1.57} {'loss': 0.2095, 'learning_rate': 2.380937629565464e-06, 'epoch': 1.57} {'loss': 0.3162, 'learning_rate': 2.3807200253937314e-06, 'epoch': 1.57} {'loss': 0.2841, 'learning_rate': 2.380502429822713e-06, 'epoch': 1.57} {'loss': 0.2396, 'learning_rate': 2.3802848428526617e-06, 'epoch': 1.57} {'loss': 0.1948, 'learning_rate': 2.3800672644838173e-06, 'epoch': 1.57} {'loss': 0.3209, 'learning_rate': 2.3798496947164308e-06, 'epoch': 1.57} {'loss': 0.2201, 'learning_rate': 2.379632133550742e-06, 'epoch': 1.57} {'loss': 0.2244, 'learning_rate': 2.3794145809870017e-06, 'epoch': 1.57} {'loss': 0.4237, 'learning_rate': 2.3791970370254514e-06, 'epoch': 1.57} {'loss': 0.2459, 'learning_rate': 2.378979501666341e-06, 'epoch': 1.57} {'loss': 0.3276, 'learning_rate': 2.3787619749099123e-06, 'epoch': 1.57} {'loss': 0.4002, 'learning_rate': 2.3785444567564107e-06, 'epoch': 1.57} {'loss': 0.359, 'learning_rate': 2.3783269472060854e-06, 'epoch': 1.57} {'loss': 0.2247, 'learning_rate': 2.3781094462591767e-06, 'epoch': 1.57} {'loss': 0.2847, 'learning_rate': 2.377891953915936e-06, 'epoch': 1.57} {'loss': 0.2716, 'learning_rate': 2.3776744701766043e-06, 'epoch': 1.57} {'loss': 0.2019, 'learning_rate': 2.3774569950414293e-06, 'epoch': 1.57} {'loss': 0.1532, 'learning_rate': 2.3772395285106543e-06, 'epoch': 1.57} {'loss': 0.2225, 'learning_rate': 2.3770220705845295e-06, 'epoch': 1.57} {'loss': 0.3506, 'learning_rate': 2.3768046212632934e-06, 'epoch': 1.57} {'loss': 0.481, 'learning_rate': 2.3765871805471984e-06, 'epoch': 1.57} {'loss': 0.4761, 'learning_rate': 2.3763697484364843e-06, 'epoch': 1.57} {'loss': 0.3547, 'learning_rate': 2.376152324931402e-06, 'epoch': 1.57} {'loss': 0.3587, 'learning_rate': 2.375934910032194e-06, 'epoch': 1.57} {'loss': 0.2912, 'learning_rate': 2.3757175037391024e-06, 'epoch': 1.57} {'loss': 0.3037, 'learning_rate': 2.3755001060523785e-06, 'epoch': 1.57} {'loss': 0.3023, 'learning_rate': 2.3752827169722625e-06, 'epoch': 1.57} {'loss': 0.3382, 'learning_rate': 2.375065336499006e-06, 'epoch': 1.57} {'loss': 0.2392, 'learning_rate': 2.374847964632847e-06, 'epoch': 1.57} {'loss': 0.3287, 'learning_rate': 2.3746306013740384e-06, 'epoch': 1.57} {'loss': 0.4118, 'learning_rate': 2.3744132467228177e-06, 'epoch': 1.57} {'loss': 0.4108, 'learning_rate': 2.3741959006794378e-06, 'epoch': 1.57} {'loss': 0.3919, 'learning_rate': 2.373978563244138e-06, 'epoch': 1.57} {'loss': 0.2923, 'learning_rate': 2.37376123441717e-06, 'epoch': 1.57} {'loss': 0.2188, 'learning_rate': 2.3735439141987716e-06, 'epoch': 1.57} {'loss': 0.4499, 'learning_rate': 2.3733266025891944e-06, 'epoch': 1.57} {'loss': 0.3116, 'learning_rate': 2.3731092995886817e-06, 'epoch': 1.57} {'loss': 0.4293, 'learning_rate': 2.3728920051974746e-06, 'epoch': 1.57} {'loss': 0.3728, 'learning_rate': 2.3726747194158263e-06, 'epoch': 1.57} {'loss': 0.2649, 'learning_rate': 2.372457442243974e-06, 'epoch': 1.57} {'loss': 0.3587, 'learning_rate': 2.3722401736821697e-06, 'epoch': 1.57} {'loss': 0.5319, 'learning_rate': 2.3720229137306526e-06, 'epoch': 1.57} {'loss': 0.2925, 'learning_rate': 2.3718056623896744e-06, 'epoch': 1.57} {'loss': 0.3215, 'learning_rate': 2.371588419659474e-06, 'epoch': 1.57} {'loss': 0.3176, 'learning_rate': 2.371371185540303e-06, 'epoch': 1.57} {'loss': 0.3114, 'learning_rate': 2.371153960032401e-06, 'epoch': 1.57} {'loss': 0.1593, 'learning_rate': 2.3709367431360174e-06, 'epoch': 1.57} {'loss': 0.2719, 'learning_rate': 2.370719534851392e-06, 'epoch': 1.57} {'loss': 0.3093, 'learning_rate': 2.370502335178777e-06, 'epoch': 1.57} {'loss': 0.2502, 'learning_rate': 2.370285144118415e-06, 'epoch': 1.57} {'loss': 0.155, 'learning_rate': 2.3700679616705457e-06, 'epoch': 1.57} {'loss': 0.306, 'learning_rate': 2.3698507878354225e-06, 'epoch': 1.57} {'loss': 0.4129, 'learning_rate': 2.3696336226132844e-06, 'epoch': 1.57} {'loss': 0.408, 'learning_rate': 2.3694164660043804e-06, 'epoch': 1.57} {'loss': 0.3678, 'learning_rate': 2.3691993180089523e-06, 'epoch': 1.57} {'loss': 0.2355, 'learning_rate': 2.3689821786272504e-06, 'epoch': 1.57} {'loss': 0.3573, 'learning_rate': 2.3687650478595136e-06, 'epoch': 1.57} {'loss': 0.2226, 'learning_rate': 2.3685479257059918e-06, 'epoch': 1.57} {'loss': 0.2881, 'learning_rate': 2.368330812166926e-06, 'epoch': 1.57} {'loss': 0.4808, 'learning_rate': 2.368113707242566e-06, 'epoch': 1.57} {'loss': 0.2594, 'learning_rate': 2.3678966109331512e-06, 'epoch': 1.57} {'loss': 0.2387, 'learning_rate': 2.3676795232389338e-06, 'epoch': 1.57} {'loss': 0.2164, 'learning_rate': 2.367462444160155e-06, 'epoch': 1.57} {'loss': 0.2867, 'learning_rate': 2.3672453736970557e-06, 'epoch': 1.57} {'loss': 0.4978, 'learning_rate': 2.367028311849888e-06, 'epoch': 1.57} {'loss': 0.3505, 'learning_rate': 2.366811258618891e-06, 'epoch': 1.57} {'loss': 0.2013, 'learning_rate': 2.366594214004315e-06, 'epoch': 1.57} {'loss': 0.3138, 'learning_rate': 2.3663771780064005e-06, 'epoch': 1.57} {'loss': 0.3255, 'learning_rate': 2.3661601506253974e-06, 'epoch': 1.57} {'loss': 0.3087, 'learning_rate': 2.3659431318615455e-06, 'epoch': 1.57} {'loss': 0.4445, 'learning_rate': 2.365726121715094e-06, 'epoch': 1.57} {'loss': 0.3422, 'learning_rate': 2.3655091201862834e-06, 'epoch': 1.57} {'loss': 0.3262, 'learning_rate': 2.3652921272753636e-06, 'epoch': 1.57} {'loss': 0.2875, 'learning_rate': 2.365075142982576e-06, 'epoch': 1.57} {'loss': 0.3738, 'learning_rate': 2.3648581673081684e-06, 'epoch': 1.57} {'loss': 0.2234, 'learning_rate': 2.3646412002523834e-06, 'epoch': 1.57} {'loss': 0.276, 'learning_rate': 2.364424241815462e-06, 'epoch': 1.57} {'loss': 0.1833, 'learning_rate': 2.3642072919976587e-06, 'epoch': 1.57} {'loss': 0.2055, 'learning_rate': 2.36399035079921e-06, 'epoch': 1.57} {'loss': 0.1792, 'learning_rate': 2.363773418220369e-06, 'epoch': 1.57} {'loss': 0.2622, 'learning_rate': 2.3635564942613707e-06, 'epoch': 1.57} {'loss': 0.3297, 'learning_rate': 2.363339578922469e-06, 'epoch': 1.57} {'loss': 0.3407, 'learning_rate': 2.3631226722039015e-06, 'epoch': 1.57} {'loss': 0.2793, 'learning_rate': 2.362905774105919e-06, 'epoch': 1.57} {'loss': 0.3672, 'learning_rate': 2.362688884628764e-06, 'epoch': 1.57} {'loss': 0.2588, 'learning_rate': 2.362472003772678e-06, 'epoch': 1.57} {'loss': 0.2769, 'learning_rate': 2.3622551315379114e-06, 'epoch': 1.57} {'loss': 0.2573, 'learning_rate': 2.3620382679247033e-06, 'epoch': 1.57} {'loss': 0.2483, 'learning_rate': 2.361821412933305e-06, 'epoch': 1.57} {'loss': 0.1658, 'learning_rate': 2.361604566563955e-06, 'epoch': 1.57} {'loss': 0.2166, 'learning_rate': 2.361387728816904e-06, 'epoch': 1.57} {'loss': 0.2293, 'learning_rate': 2.36117089969239e-06, 'epoch': 1.57} {'loss': 0.3495, 'learning_rate': 2.360954079190665e-06, 'epoch': 1.57} {'loss': 0.291, 'learning_rate': 2.3607372673119668e-06, 'epoch': 1.57} {'loss': 0.3417, 'learning_rate': 2.3605204640565473e-06, 'epoch': 1.57} {'loss': 0.3105, 'learning_rate': 2.360303669424644e-06, 'epoch': 1.57} {'loss': 0.3071, 'learning_rate': 2.360086883416508e-06, 'epoch': 1.57} {'loss': 0.142, 'learning_rate': 2.35987010603238e-06, 'epoch': 1.57} {'loss': 0.1842, 'learning_rate': 2.359653337272505e-06, 'epoch': 1.57} {'loss': 0.4237, 'learning_rate': 2.3594365771371306e-06, 'epoch': 1.57} {'loss': 0.3987, 'learning_rate': 2.3592198256264965e-06, 'epoch': 1.57} {'loss': 0.3238, 'learning_rate': 2.359003082740853e-06, 'epoch': 1.57} {'loss': 0.3078, 'learning_rate': 2.3587863484804386e-06, 'epoch': 1.57} {'loss': 0.2673, 'learning_rate': 2.3585696228455048e-06, 'epoch': 1.57} {'loss': 0.2317, 'learning_rate': 2.35835290583629e-06, 'epoch': 1.57} {'loss': 0.5109, 'learning_rate': 2.3581361974530447e-06, 'epoch': 1.57} {'loss': 0.2989, 'learning_rate': 2.357919497696007e-06, 'epoch': 1.57} {'loss': 0.308, 'learning_rate': 2.3577028065654285e-06, 'epoch': 1.57} {'loss': 0.3601, 'learning_rate': 2.3574861240615466e-06, 'epoch': 1.57} {'loss': 0.2652, 'learning_rate': 2.3572694501846127e-06, 'epoch': 1.57} {'loss': 0.4187, 'learning_rate': 2.357052784934869e-06, 'epoch': 1.57} {'loss': 0.2422, 'learning_rate': 2.3568361283125562e-06, 'epoch': 1.57} {'loss': 0.3846, 'learning_rate': 2.3566194803179245e-06, 'epoch': 1.57} {'loss': 0.3339, 'learning_rate': 2.356402840951213e-06, 'epoch': 1.57} {'loss': 0.2317, 'learning_rate': 2.356186210212672e-06, 'epoch': 1.57} {'loss': 0.2762, 'learning_rate': 2.355969588102541e-06, 'epoch': 1.57} {'loss': 0.3173, 'learning_rate': 2.3557529746210694e-06, 'epoch': 1.57} {'loss': 0.3036, 'learning_rate': 2.355536369768495e-06, 'epoch': 1.57} {'loss': 0.3271, 'learning_rate': 2.3553197735450705e-06, 'epoch': 1.57} {'loss': 0.1328, 'learning_rate': 2.355103185951033e-06, 'epoch': 1.57} {'loss': 0.3613, 'learning_rate': 2.3548866069866337e-06, 'epoch': 1.57} {'loss': 0.4514, 'learning_rate': 2.35467003665211e-06, 'epoch': 1.57} {'loss': 0.2395, 'learning_rate': 2.3544534749477143e-06, 'epoch': 1.57} {'loss': 0.3618, 'learning_rate': 2.354236921873685e-06, 'epoch': 1.57} {'loss': 0.2431, 'learning_rate': 2.354020377430266e-06, 'epoch': 1.57} {'loss': 0.3692, 'learning_rate': 2.3538038416177078e-06, 'epoch': 1.57} {'loss': 0.2767, 'learning_rate': 2.3535873144362475e-06, 'epoch': 1.57} {'loss': 0.4047, 'learning_rate': 2.3533707958861365e-06, 'epoch': 1.57} {'loss': 0.2954, 'learning_rate': 2.3531542859676113e-06, 'epoch': 1.57} {'loss': 0.3831, 'learning_rate': 2.3529377846809253e-06, 'epoch': 1.57} {'loss': 0.2703, 'learning_rate': 2.3527212920263144e-06, 'epoch': 1.57} {'loss': 0.4458, 'learning_rate': 2.35250480800403e-06, 'epoch': 1.57} {'loss': 0.3734, 'learning_rate': 2.352288332614312e-06, 'epoch': 1.57} {'loss': 0.394, 'learning_rate': 2.352071865857408e-06, 'epoch': 1.57} {'loss': 0.2405, 'learning_rate': 2.3518554077335576e-06, 'epoch': 1.57} {'loss': 0.2802, 'learning_rate': 2.351638958243011e-06, 'epoch': 1.57} {'loss': 0.2725, 'learning_rate': 2.3514225173860093e-06, 'epoch': 1.57} {'loss': 0.3426, 'learning_rate': 2.351206085162795e-06, 'epoch': 1.57} {'loss': 0.3723, 'learning_rate': 2.350989661573617e-06, 'epoch': 1.57} {'loss': 0.2978, 'learning_rate': 2.3507732466187137e-06, 'epoch': 1.57} {'loss': 0.2888, 'learning_rate': 2.350556840298337e-06, 'epoch': 1.57} {'loss': 0.294, 'learning_rate': 2.350340442612723e-06, 'epoch': 1.57} {'loss': 0.3137, 'learning_rate': 2.3501240535621237e-06, 'epoch': 1.57} {'loss': 0.2698, 'learning_rate': 2.3499076731467763e-06, 'epoch': 1.57} {'loss': 0.2691, 'learning_rate': 2.349691301366931e-06, 'epoch': 1.57} {'loss': 0.4663, 'learning_rate': 2.3494749382228277e-06, 'epoch': 1.57} {'loss': 0.245, 'learning_rate': 2.349258583714714e-06, 'epoch': 1.57} {'loss': 0.4725, 'learning_rate': 2.34904223784283e-06, 'epoch': 1.57} {'loss': 0.2417, 'learning_rate': 2.3488259006074253e-06, 'epoch': 1.57} {'loss': 0.2943, 'learning_rate': 2.348609572008742e-06, 'epoch': 1.57} {'loss': 0.4375, 'learning_rate': 2.34839325204702e-06, 'epoch': 1.57} {'loss': 0.4658, 'learning_rate': 2.34817694072251e-06, 'epoch': 1.57} {'loss': 0.354, 'learning_rate': 2.347960638035449e-06, 'epoch': 1.57} {'loss': 0.3183, 'learning_rate': 2.3477443439860904e-06, 'epoch': 1.57} {'loss': 0.3989, 'learning_rate': 2.3475280585746694e-06, 'epoch': 1.57} {'loss': 0.2989, 'learning_rate': 2.347311781801437e-06, 'epoch': 1.57} {'loss': 0.2502, 'learning_rate': 2.3470955136666307e-06, 'epoch': 1.57} {'loss': 0.2546, 'learning_rate': 2.346879254170502e-06, 'epoch': 1.57} {'loss': 0.2311, 'learning_rate': 2.3466630033132888e-06, 'epoch': 1.57} {'loss': 0.4447, 'learning_rate': 2.34644676109524e-06, 'epoch': 1.57} {'loss': 0.4121, 'learning_rate': 2.3462305275165943e-06, 'epoch': 1.57} {'loss': 0.3572, 'learning_rate': 2.346014302577603e-06, 'epoch': 1.57} {'loss': 0.2882, 'learning_rate': 2.3457980862785045e-06, 'epoch': 1.57} {'loss': 0.3157, 'learning_rate': 2.345581878619543e-06, 'epoch': 1.57} {'loss': 0.3273, 'learning_rate': 2.345365679600965e-06, 'epoch': 1.57} {'loss': 0.2092, 'learning_rate': 2.345149489223012e-06, 'epoch': 1.57} {'loss': 0.2283, 'learning_rate': 2.3449333074859326e-06, 'epoch': 1.57} {'loss': 0.3826, 'learning_rate': 2.3447171343899645e-06, 'epoch': 1.57} {'loss': 0.2716, 'learning_rate': 2.3445009699353583e-06, 'epoch': 1.57} {'loss': 0.285, 'learning_rate': 2.3442848141223517e-06, 'epoch': 1.57} {'loss': 0.3507, 'learning_rate': 2.344068666951195e-06, 'epoch': 1.57} {'loss': 0.3826, 'learning_rate': 2.3438525284221247e-06, 'epoch': 1.57} {'loss': 0.4206, 'learning_rate': 2.3436363985353926e-06, 'epoch': 1.57} {'loss': 0.264, 'learning_rate': 2.3434202772912375e-06, 'epoch': 1.57} {'loss': 0.3666, 'learning_rate': 2.3432041646899064e-06, 'epoch': 1.57} {'loss': 0.3517, 'learning_rate': 2.3429880607316393e-06, 'epoch': 1.57} {'loss': 0.2937, 'learning_rate': 2.3427719654166827e-06, 'epoch': 1.57} {'loss': 0.2713, 'learning_rate': 2.3425558787452828e-06, 'epoch': 1.57} {'loss': 0.3555, 'learning_rate': 2.342339800717679e-06, 'epoch': 1.57} {'loss': 0.1916, 'learning_rate': 2.3421237313341196e-06, 'epoch': 1.57} {'loss': 0.3285, 'learning_rate': 2.341907670594844e-06, 'epoch': 1.57} {'loss': 0.3447, 'learning_rate': 2.3416916185001004e-06, 'epoch': 1.57} {'loss': 0.462, 'learning_rate': 2.3414755750501316e-06, 'epoch': 1.57} {'loss': 0.3373, 'learning_rate': 2.3412595402451776e-06, 'epoch': 1.57} {'loss': 0.3023, 'learning_rate': 2.3410435140854883e-06, 'epoch': 1.57} {'loss': 0.3925, 'learning_rate': 2.3408274965713007e-06, 'epoch': 1.57} {'loss': 0.211, 'learning_rate': 2.340611487702866e-06, 'epoch': 1.57} {'loss': 0.479, 'learning_rate': 2.3403954874804213e-06, 'epoch': 1.57} {'loss': 0.2549, 'learning_rate': 2.340179495904217e-06, 'epoch': 1.57} {'loss': 0.2928, 'learning_rate': 2.339963512974489e-06, 'epoch': 1.57} {'loss': 0.2896, 'learning_rate': 2.339747538691489e-06, 'epoch': 1.57} {'loss': 0.2182, 'learning_rate': 2.339531573055456e-06, 'epoch': 1.57} {'loss': 0.4147, 'learning_rate': 2.339315616066636e-06, 'epoch': 1.57} {'loss': 0.165, 'learning_rate': 2.339099667725271e-06, 'epoch': 1.57} {'loss': 0.3463, 'learning_rate': 2.3388837280316066e-06, 'epoch': 1.57} {'loss': 0.2439, 'learning_rate': 2.3386677969858873e-06, 'epoch': 1.57} {'loss': 0.2887, 'learning_rate': 2.338451874588351e-06, 'epoch': 1.57} {'loss': 0.3838, 'learning_rate': 2.3382359608392503e-06, 'epoch': 1.57} {'loss': 0.3143, 'learning_rate': 2.33802005573882e-06, 'epoch': 1.57} {'loss': 0.2106, 'learning_rate': 2.3378041592873113e-06, 'epoch': 1.57} {'loss': 0.255, 'learning_rate': 2.337588271484961e-06, 'epoch': 1.57} {'loss': 0.4035, 'learning_rate': 2.33737239233202e-06, 'epoch': 1.57} {'loss': 0.311, 'learning_rate': 2.337156521828726e-06, 'epoch': 1.57} {'loss': 0.3488, 'learning_rate': 2.3369406599753273e-06, 'epoch': 1.57} {'loss': 0.1934, 'learning_rate': 2.336724806772063e-06, 'epoch': 1.57} {'loss': 0.32, 'learning_rate': 2.3365089622191817e-06, 'epoch': 1.57} {'loss': 0.2082, 'learning_rate': 2.336293126316922e-06, 'epoch': 1.57} {'loss': 0.4075, 'learning_rate': 2.3360772990655323e-06, 'epoch': 1.57} {'loss': 0.2229, 'learning_rate': 2.3358614804652544e-06, 'epoch': 1.57} {'loss': 0.3581, 'learning_rate': 2.335645670516329e-06, 'epoch': 1.57} {'loss': 0.3055, 'learning_rate': 2.3354298692190037e-06, 'epoch': 1.57} {'loss': 0.3432, 'learning_rate': 2.3352140765735187e-06, 'epoch': 1.57} {'loss': 0.384, 'learning_rate': 2.334998292580123e-06, 'epoch': 1.57} {'loss': 0.2224, 'learning_rate': 2.3347825172390527e-06, 'epoch': 1.57} {'loss': 0.2777, 'learning_rate': 2.3345667505505586e-06, 'epoch': 1.57} {'loss': 0.2765, 'learning_rate': 2.3343509925148776e-06, 'epoch': 1.57} {'loss': 0.4438, 'learning_rate': 2.3341352431322607e-06, 'epoch': 1.57} {'loss': 0.3723, 'learning_rate': 2.3339195024029438e-06, 'epoch': 1.57} {'loss': 0.2145, 'learning_rate': 2.333703770327177e-06, 'epoch': 1.57} {'loss': 0.2049, 'learning_rate': 2.333488046905198e-06, 'epoch': 1.57} {'loss': 0.3925, 'learning_rate': 2.333272332137255e-06, 'epoch': 1.57} {'loss': 0.2876, 'learning_rate': 2.3330566260235875e-06, 'epoch': 1.57} {'loss': 0.3082, 'learning_rate': 2.3328409285644447e-06, 'epoch': 1.57} {'loss': 0.3084, 'learning_rate': 2.3326252397600656e-06, 'epoch': 1.57} {'loss': 0.2275, 'learning_rate': 2.332409559610692e-06, 'epoch': 1.57} {'loss': 0.3314, 'learning_rate': 2.332193888116573e-06, 'epoch': 1.57} {'loss': 0.379, 'learning_rate': 2.3319782252779466e-06, 'epoch': 1.57} {'loss': 0.1567, 'learning_rate': 2.331762571095061e-06, 'epoch': 1.57} {'loss': 0.2728, 'learning_rate': 2.331546925568153e-06, 'epoch': 1.57} {'loss': 0.3738, 'learning_rate': 2.331331288697475e-06, 'epoch': 1.57} {'loss': 0.3978, 'learning_rate': 2.331115660483263e-06, 'epoch': 1.57} {'loss': 0.2613, 'learning_rate': 2.3309000409257652e-06, 'epoch': 1.57} {'loss': 0.2946, 'learning_rate': 2.3306844300252196e-06, 'epoch': 1.57} {'loss': 0.246, 'learning_rate': 2.3304688277818767e-06, 'epoch': 1.57} {'loss': 0.4303, 'learning_rate': 2.330253234195973e-06, 'epoch': 1.57} {'loss': 0.437, 'learning_rate': 2.330037649267758e-06, 'epoch': 1.57} {'loss': 0.3868, 'learning_rate': 2.329822072997471e-06, 'epoch': 1.57} {'loss': 0.3183, 'learning_rate': 2.3296065053853546e-06, 'epoch': 1.57} {'loss': 0.2455, 'learning_rate': 2.3293909464316557e-06, 'epoch': 1.57} {'loss': 0.3217, 'learning_rate': 2.329175396136614e-06, 'epoch': 1.57} {'loss': 0.4894, 'learning_rate': 2.3289598545004765e-06, 'epoch': 1.57} {'loss': 0.2084, 'learning_rate': 2.3287443215234816e-06, 'epoch': 1.57} {'loss': 0.3701, 'learning_rate': 2.328528797205879e-06, 'epoch': 1.57} {'loss': 0.3047, 'learning_rate': 2.328313281547906e-06, 'epoch': 1.57} {'loss': 0.2163, 'learning_rate': 2.328097774549811e-06, 'epoch': 1.57} {'loss': 0.2267, 'learning_rate': 2.3278822762118326e-06, 'epoch': 1.57} {'loss': 0.2297, 'learning_rate': 2.327666786534217e-06, 'epoch': 1.57} {'loss': 0.315, 'learning_rate': 2.3274513055172055e-06, 'epoch': 1.57} {'loss': 0.3822, 'learning_rate': 2.3272358331610457e-06, 'epoch': 1.57} {'loss': 0.3101, 'learning_rate': 2.3270203694659765e-06, 'epoch': 1.57} {'loss': 0.3265, 'learning_rate': 2.3268049144322402e-06, 'epoch': 1.57} {'loss': 0.2951, 'learning_rate': 2.326589468060084e-06, 'epoch': 1.57} {'loss': 0.3123, 'learning_rate': 2.3263740303497474e-06, 'epoch': 1.57} {'loss': 0.2976, 'learning_rate': 2.326158601301477e-06, 'epoch': 1.57} {'loss': 0.3062, 'learning_rate': 2.325943180915512e-06, 'epoch': 1.57} {'loss': 0.4024, 'learning_rate': 2.325727769192101e-06, 'epoch': 1.57} {'loss': 0.3585, 'learning_rate': 2.3255123661314805e-06, 'epoch': 1.57} {'loss': 0.2875, 'learning_rate': 2.3252969717339004e-06, 'epoch': 1.57} {'loss': 0.2854, 'learning_rate': 2.3250815859995967e-06, 'epoch': 1.57} {'loss': 0.3499, 'learning_rate': 2.324866208928821e-06, 'epoch': 1.57} {'loss': 0.1121, 'learning_rate': 2.3246508405218082e-06, 'epoch': 1.57} {'loss': 0.2069, 'learning_rate': 2.3244354807788084e-06, 'epoch': 1.57} {'loss': 0.401, 'learning_rate': 2.32422012970006e-06, 'epoch': 1.57} {'loss': 0.2332, 'learning_rate': 2.324004787285806e-06, 'epoch': 1.57} {'loss': 0.2845, 'learning_rate': 2.3237894535362937e-06, 'epoch': 1.57} {'loss': 0.1629, 'learning_rate': 2.3235741284517598e-06, 'epoch': 1.57} {'loss': 0.2517, 'learning_rate': 2.3233588120324546e-06, 'epoch': 1.57} {'loss': 0.1642, 'learning_rate': 2.3231435042786142e-06, 'epoch': 1.57} {'loss': 0.3278, 'learning_rate': 2.322928205190488e-06, 'epoch': 1.57} {'loss': 0.3735, 'learning_rate': 2.3227129147683125e-06, 'epoch': 1.57} {'loss': 0.2989, 'learning_rate': 2.322497633012337e-06, 'epoch': 1.57} {'loss': 0.3058, 'learning_rate': 2.3222823599228007e-06, 'epoch': 1.57} {'loss': 0.2973, 'learning_rate': 2.3220670954999493e-06, 'epoch': 1.57} {'loss': 0.2385, 'learning_rate': 2.3218518397440202e-06, 'epoch': 1.57} {'loss': 0.2605, 'learning_rate': 2.321636592655262e-06, 'epoch': 1.57} {'loss': 0.3492, 'learning_rate': 2.321421354233918e-06, 'epoch': 1.57} {'loss': 0.2779, 'learning_rate': 2.3212061244802263e-06, 'epoch': 1.57} {'loss': 0.4736, 'learning_rate': 2.3209909033944357e-06, 'epoch': 1.57} {'loss': 0.1727, 'learning_rate': 2.320775690976783e-06, 'epoch': 1.57} {'loss': 0.2567, 'learning_rate': 2.320560487227518e-06, 'epoch': 1.57} {'loss': 0.373, 'learning_rate': 2.320345292146876e-06, 'epoch': 1.57} {'loss': 0.2244, 'learning_rate': 2.3201301057351076e-06, 'epoch': 1.57} {'loss': 0.3139, 'learning_rate': 2.3199149279924516e-06, 'epoch': 1.57} {'loss': 0.4099, 'learning_rate': 2.3196997589191482e-06, 'epoch': 1.57} {'loss': 0.3317, 'learning_rate': 2.3194845985154456e-06, 'epoch': 1.57} {'loss': 0.3207, 'learning_rate': 2.3192694467815826e-06, 'epoch': 1.57} {'loss': 0.2599, 'learning_rate': 2.319054303717806e-06, 'epoch': 1.57} {'loss': 0.378, 'learning_rate': 2.3188391693243537e-06, 'epoch': 1.57} {'loss': 0.1911, 'learning_rate': 2.318624043601474e-06, 'epoch': 1.57} {'loss': 0.3625, 'learning_rate': 2.3184089265494047e-06, 'epoch': 1.57} {'loss': 0.2152, 'learning_rate': 2.318193818168394e-06, 'epoch': 1.57} {'loss': 0.3421, 'learning_rate': 2.3179787184586787e-06, 'epoch': 1.57} {'loss': 0.4142, 'learning_rate': 2.3177636274205073e-06, 'epoch': 1.57} {'loss': 0.2117, 'learning_rate': 2.317548545054117e-06, 'epoch': 1.57} {'loss': 0.357, 'learning_rate': 2.3173334713597563e-06, 'epoch': 1.57} {'loss': 0.2779, 'learning_rate': 2.317118406337665e-06, 'epoch': 1.57} {'loss': 0.3283, 'learning_rate': 2.3169033499880834e-06, 'epoch': 1.57} {'loss': 0.4192, 'learning_rate': 2.316688302311261e-06, 'epoch': 1.57} {'loss': 0.3748, 'learning_rate': 2.3164732633074317e-06, 'epoch': 1.57} {'loss': 0.2046, 'learning_rate': 2.316258232976847e-06, 'epoch': 1.57} {'loss': 0.3572, 'learning_rate': 2.316043211319742e-06, 'epoch': 1.57} {'loss': 0.2463, 'learning_rate': 2.315828198336366e-06, 'epoch': 1.57} {'loss': 0.2973, 'learning_rate': 2.3156131940269565e-06, 'epoch': 1.57} {'loss': 0.3385, 'learning_rate': 2.3153981983917607e-06, 'epoch': 1.57} {'loss': 0.2311, 'learning_rate': 2.315183211431017e-06, 'epoch': 1.57} {'loss': 0.2876, 'learning_rate': 2.314968233144972e-06, 'epoch': 1.57} {'loss': 0.5117, 'learning_rate': 2.3147532635338644e-06, 'epoch': 1.57} {'loss': 0.4975, 'learning_rate': 2.3145383025979416e-06, 'epoch': 1.57} {'loss': 0.3611, 'learning_rate': 2.314323350337443e-06, 'epoch': 1.57} {'loss': 0.4464, 'learning_rate': 2.3141084067526097e-06, 'epoch': 1.57} {'loss': 0.2052, 'learning_rate': 2.313893471843689e-06, 'epoch': 1.57} {'loss': 0.3225, 'learning_rate': 2.313678545610919e-06, 'epoch': 1.57} {'loss': 0.3308, 'learning_rate': 2.3134636280545465e-06, 'epoch': 1.57} {'loss': 0.3659, 'learning_rate': 2.313248719174809e-06, 'epoch': 1.57} {'loss': 0.2457, 'learning_rate': 2.313033818971955e-06, 'epoch': 1.57} {'loss': 0.2465, 'learning_rate': 2.3128189274462198e-06, 'epoch': 1.57} {'loss': 0.356, 'learning_rate': 2.312604044597855e-06, 'epoch': 1.57} {'loss': 0.4597, 'learning_rate': 2.312389170427095e-06, 'epoch': 1.57} {'loss': 0.2933, 'learning_rate': 2.3121743049341884e-06, 'epoch': 1.57} {'loss': 0.4379, 'learning_rate': 2.311959448119372e-06, 'epoch': 1.57} {'loss': 0.3005, 'learning_rate': 2.311744599982895e-06, 'epoch': 1.57} {'loss': 0.291, 'learning_rate': 2.3115297605249954e-06, 'epoch': 1.57} {'loss': 0.3439, 'learning_rate': 2.3113149297459146e-06, 'epoch': 1.57} {'loss': 0.3002, 'learning_rate': 2.3111001076458993e-06, 'epoch': 1.57} {'loss': 0.4232, 'learning_rate': 2.310885294225188e-06, 'epoch': 1.57} {'loss': 0.3455, 'learning_rate': 2.3106704894840282e-06, 'epoch': 1.57} {'loss': 0.2474, 'learning_rate': 2.3104556934226553e-06, 'epoch': 1.57} {'loss': 0.3119, 'learning_rate': 2.310240906041319e-06, 'epoch': 1.57} {'loss': 0.3882, 'learning_rate': 2.3100261273402547e-06, 'epoch': 1.57} {'loss': 0.208, 'learning_rate': 2.3098113573197125e-06, 'epoch': 1.57} {'loss': 0.4498, 'learning_rate': 2.309596595979928e-06, 'epoch': 1.57} {'loss': 0.2922, 'learning_rate': 2.309381843321149e-06, 'epoch': 1.57} {'loss': 0.3033, 'learning_rate': 2.309167099343612e-06, 'epoch': 1.57} {'loss': 0.4582, 'learning_rate': 2.3089523640475675e-06, 'epoch': 1.57} {'loss': 0.3272, 'learning_rate': 2.3087376374332515e-06, 'epoch': 1.57} {'loss': 0.2779, 'learning_rate': 2.3085229195009063e-06, 'epoch': 1.57} {'loss': 0.3967, 'learning_rate': 2.3083082102507793e-06, 'epoch': 1.57} {'loss': 0.3186, 'learning_rate': 2.308093509683106e-06, 'epoch': 1.57} {'loss': 0.2662, 'learning_rate': 2.3078788177981347e-06, 'epoch': 1.57} {'loss': 0.4552, 'learning_rate': 2.3076641345961037e-06, 'epoch': 1.57} {'loss': 0.3085, 'learning_rate': 2.30744946007726e-06, 'epoch': 1.57} {'loss': 0.3616, 'learning_rate': 2.3072347942418405e-06, 'epoch': 1.57} {'loss': 0.173, 'learning_rate': 2.3070201370900923e-06, 'epoch': 1.57} {'loss': 0.3307, 'learning_rate': 2.3068054886222525e-06, 'epoch': 1.57} {'loss': 0.138, 'learning_rate': 2.3065908488385693e-06, 'epoch': 1.57} {'loss': 0.3526, 'learning_rate': 2.306376217739279e-06, 'epoch': 1.57} {'loss': 0.2834, 'learning_rate': 2.3061615953246306e-06, 'epoch': 1.57} {'loss': 0.2398, 'learning_rate': 2.3059469815948622e-06, 'epoch': 1.57} {'loss': 0.1969, 'learning_rate': 2.305732376550214e-06, 'epoch': 1.57} {'loss': 0.3696, 'learning_rate': 2.3055177801909334e-06, 'epoch': 1.57} {'loss': 0.3148, 'learning_rate': 2.3053031925172575e-06, 'epoch': 1.57} {'loss': 0.2114, 'learning_rate': 2.3050886135294336e-06, 'epoch': 1.57} {'loss': 0.3105, 'learning_rate': 2.3048740432276983e-06, 'epoch': 1.57} {'loss': 0.3944, 'learning_rate': 2.3046594816123002e-06, 'epoch': 1.57} {'loss': 0.3089, 'learning_rate': 2.3044449286834745e-06, 'epoch': 1.57} {'loss': 0.4197, 'learning_rate': 2.3042303844414715e-06, 'epoch': 1.57} {'loss': 0.2637, 'learning_rate': 2.3040158488865248e-06, 'epoch': 1.57} {'loss': 0.4413, 'learning_rate': 2.303801322018885e-06, 'epoch': 1.57} {'loss': 0.2623, 'learning_rate': 2.3035868038387853e-06, 'epoch': 1.57} {'loss': 0.374, 'learning_rate': 2.3033722943464766e-06, 'epoch': 1.57} {'loss': 0.2633, 'learning_rate': 2.3031577935421967e-06, 'epoch': 1.57} {'loss': 0.4378, 'learning_rate': 2.3029433014261857e-06, 'epoch': 1.57} {'loss': 0.3593, 'learning_rate': 2.3027288179986906e-06, 'epoch': 1.57} {'loss': 0.3103, 'learning_rate': 2.3025143432599472e-06, 'epoch': 1.57} {'loss': 0.2534, 'learning_rate': 2.3022998772102055e-06, 'epoch': 1.57} {'loss': 0.382, 'learning_rate': 2.3020854198497e-06, 'epoch': 1.57} {'loss': 0.2173, 'learning_rate': 2.3018709711786793e-06, 'epoch': 1.57} {'loss': 0.3587, 'learning_rate': 2.3016565311973793e-06, 'epoch': 1.57} {'loss': 0.2802, 'learning_rate': 2.3014420999060483e-06, 'epoch': 1.57} {'loss': 0.4432, 'learning_rate': 2.3012276773049226e-06, 'epoch': 1.57} {'loss': 0.2797, 'learning_rate': 2.3010132633942485e-06, 'epoch': 1.57} {'loss': 0.3783, 'learning_rate': 2.3007988581742647e-06, 'epoch': 1.57} {'loss': 0.2225, 'learning_rate': 2.300584461645218e-06, 'epoch': 1.57} {'loss': 0.3773, 'learning_rate': 2.3003700738073433e-06, 'epoch': 1.57} {'loss': 0.3243, 'learning_rate': 2.3001556946608873e-06, 'epoch': 1.57} {'loss': 0.2709, 'learning_rate': 2.2999413242060943e-06, 'epoch': 1.57} {'loss': 0.3509, 'learning_rate': 2.2997269624432006e-06, 'epoch': 1.57} {'loss': 0.2499, 'learning_rate': 2.2995126093724527e-06, 'epoch': 1.57} {'loss': 0.2629, 'learning_rate': 2.2992982649940887e-06, 'epoch': 1.57} {'loss': 0.3511, 'learning_rate': 2.2990839293083558e-06, 'epoch': 1.57} {'loss': 0.291, 'learning_rate': 2.298869602315489e-06, 'epoch': 1.57} {'loss': 0.4535, 'learning_rate': 2.298655284015737e-06, 'epoch': 1.57} {'loss': 0.3452, 'learning_rate': 2.2984409744093393e-06, 'epoch': 1.57} {'loss': 0.3189, 'learning_rate': 2.298226673496534e-06, 'epoch': 1.57} {'loss': 0.2093, 'learning_rate': 2.29801238127757e-06, 'epoch': 1.57} {'loss': 0.249, 'learning_rate': 2.2977980977526816e-06, 'epoch': 1.57} {'loss': 0.1887, 'learning_rate': 2.297583822922117e-06, 'epoch': 1.57} {'loss': 0.2814, 'learning_rate': 2.297369556786113e-06, 'epoch': 1.57} {'loss': 0.261, 'learning_rate': 2.2971552993449177e-06, 'epoch': 1.57} {'loss': 0.4285, 'learning_rate': 2.2969410505987655e-06, 'epoch': 1.57} {'loss': 0.3154, 'learning_rate': 2.296726810547906e-06, 'epoch': 1.57} {'loss': 0.2077, 'learning_rate': 2.2965125791925737e-06, 'epoch': 1.57} {'loss': 0.3751, 'learning_rate': 2.2962983565330153e-06, 'epoch': 1.57} {'loss': 0.2855, 'learning_rate': 2.29608414256947e-06, 'epoch': 1.57} {'loss': 0.3612, 'learning_rate': 2.2958699373021833e-06, 'epoch': 1.57} {'loss': 0.2483, 'learning_rate': 2.295655740731394e-06, 'epoch': 1.57} {'loss': 0.4406, 'learning_rate': 2.2954415528573414e-06, 'epoch': 1.57} {'loss': 0.1845, 'learning_rate': 2.295227373680273e-06, 'epoch': 1.57} {'loss': 0.2674, 'learning_rate': 2.2950132032004256e-06, 'epoch': 1.57} {'loss': 0.334, 'learning_rate': 2.2947990414180453e-06, 'epoch': 1.57} {'loss': 0.4825, 'learning_rate': 2.29458488833337e-06, 'epoch': 1.57} {'loss': 0.3839, 'learning_rate': 2.2943707439466443e-06, 'epoch': 1.57} {'loss': 0.2873, 'learning_rate': 2.2941566082581067e-06, 'epoch': 1.57} {'loss': 0.3267, 'learning_rate': 2.2939424812680046e-06, 'epoch': 1.57} {'loss': 0.396, 'learning_rate': 2.2937283629765717e-06, 'epoch': 1.57} {'loss': 0.3907, 'learning_rate': 2.2935142533840584e-06, 'epoch': 1.57} {'loss': 0.3638, 'learning_rate': 2.2933001524906975e-06, 'epoch': 1.57} {'loss': 0.3525, 'learning_rate': 2.2930860602967385e-06, 'epoch': 1.57} {'loss': 0.4122, 'learning_rate': 2.292871976802421e-06, 'epoch': 1.57} {'loss': 0.2661, 'learning_rate': 2.292657902007982e-06, 'epoch': 1.57} {'loss': 0.3504, 'learning_rate': 2.292443835913669e-06, 'epoch': 1.57} {'loss': 0.4275, 'learning_rate': 2.292229778519719e-06, 'epoch': 1.57} {'loss': 0.314, 'learning_rate': 2.292015729826378e-06, 'epoch': 1.57} {'loss': 0.3458, 'learning_rate': 2.2918016898338835e-06, 'epoch': 1.57} {'loss': 0.3532, 'learning_rate': 2.291587658542481e-06, 'epoch': 1.57} {'loss': 0.2846, 'learning_rate': 2.2913736359524085e-06, 'epoch': 1.57} {'loss': 0.3699, 'learning_rate': 2.291159622063912e-06, 'epoch': 1.57} {'loss': 0.1847, 'learning_rate': 2.290945616877227e-06, 'epoch': 1.57} {'loss': 0.3221, 'learning_rate': 2.290731620392601e-06, 'epoch': 1.57} {'loss': 0.3381, 'learning_rate': 2.2905176326102707e-06, 'epoch': 1.57} {'loss': 0.1921, 'learning_rate': 2.2903036535304823e-06, 'epoch': 1.57} {'loss': 0.2905, 'learning_rate': 2.290089683153476e-06, 'epoch': 1.57} {'loss': 0.4209, 'learning_rate': 2.2898757214794886e-06, 'epoch': 1.57} {'loss': 0.2633, 'learning_rate': 2.2896617685087687e-06, 'epoch': 1.57} {'loss': 0.3449, 'learning_rate': 2.2894478242415517e-06, 'epoch': 1.57} {'loss': 0.1803, 'learning_rate': 2.289233888678084e-06, 'epoch': 1.57} {'loss': 0.3963, 'learning_rate': 2.2890199618186026e-06, 'epoch': 1.57} {'loss': 0.4799, 'learning_rate': 2.2888060436633543e-06, 'epoch': 1.57} {'loss': 0.2567, 'learning_rate': 2.288592134212575e-06, 'epoch': 1.57} {'loss': 0.3829, 'learning_rate': 2.2883782334665116e-06, 'epoch': 1.57} {'loss': 0.3309, 'learning_rate': 2.2881643414253995e-06, 'epoch': 1.57} {'loss': 0.463, 'learning_rate': 2.287950458089486e-06, 'epoch': 1.57} {'loss': 0.2836, 'learning_rate': 2.287736583459008e-06, 'epoch': 1.57} {'loss': 0.2772, 'learning_rate': 2.287522717534211e-06, 'epoch': 1.57} {'loss': 0.3726, 'learning_rate': 2.287308860315334e-06, 'epoch': 1.57} {'loss': 0.2461, 'learning_rate': 2.2870950118026157e-06, 'epoch': 1.57} {'loss': 0.3967, 'learning_rate': 2.2868811719963048e-06, 'epoch': 1.57} {'loss': 0.3706, 'learning_rate': 2.2866673408966345e-06, 'epoch': 1.57} {'loss': 0.1628, 'learning_rate': 2.2864535185038527e-06, 'epoch': 1.57} {'loss': 0.417, 'learning_rate': 2.286239704818195e-06, 'epoch': 1.57} {'loss': 0.2656, 'learning_rate': 2.286025899839909e-06, 'epoch': 1.57} {'loss': 0.3049, 'learning_rate': 2.2858121035692305e-06, 'epoch': 1.57} {'loss': 0.4258, 'learning_rate': 2.2855983160064053e-06, 'epoch': 1.57} {'loss': 0.1989, 'learning_rate': 2.2853845371516704e-06, 'epoch': 1.57} {'loss': 0.1469, 'learning_rate': 2.2851707670052716e-06, 'epoch': 1.57} {'loss': 0.4351, 'learning_rate': 2.284957005567445e-06, 'epoch': 1.57} {'loss': 0.3006, 'learning_rate': 2.284743252838438e-06, 'epoch': 1.57} {'loss': 0.3057, 'learning_rate': 2.2845295088184894e-06, 'epoch': 1.57} {'loss': 0.295, 'learning_rate': 2.284315773507837e-06, 'epoch': 1.57} {'loss': 0.3898, 'learning_rate': 2.2841020469067266e-06, 'epoch': 1.57} {'loss': 0.215, 'learning_rate': 2.283888329015396e-06, 'epoch': 1.57} {'loss': 0.2553, 'learning_rate': 2.283674619834091e-06, 'epoch': 1.57} {'loss': 0.3747, 'learning_rate': 2.2834609193630464e-06, 'epoch': 1.57} {'loss': 0.2257, 'learning_rate': 2.2832472276025097e-06, 'epoch': 1.57} {'loss': 0.3074, 'learning_rate': 2.2830335445527175e-06, 'epoch': 1.57} {'loss': 0.4898, 'learning_rate': 2.282819870213916e-06, 'epoch': 1.57} {'loss': 0.3116, 'learning_rate': 2.2826062045863395e-06, 'epoch': 1.57} {'loss': 0.303, 'learning_rate': 2.282392547670237e-06, 'epoch': 1.57} {'loss': 0.2978, 'learning_rate': 2.2821788994658424e-06, 'epoch': 1.57} {'loss': 0.3406, 'learning_rate': 2.281965259973402e-06, 'epoch': 1.57} {'loss': 0.4107, 'learning_rate': 2.2817516291931562e-06, 'epoch': 1.57} {'loss': 0.3964, 'learning_rate': 2.2815380071253422e-06, 'epoch': 1.57} {'loss': 0.254, 'learning_rate': 2.281324393770208e-06, 'epoch': 1.57} {'loss': 0.3449, 'learning_rate': 2.281110789127986e-06, 'epoch': 1.58} {'loss': 0.1681, 'learning_rate': 2.2808971931989265e-06, 'epoch': 1.58} {'loss': 0.3241, 'learning_rate': 2.2806836059832627e-06, 'epoch': 1.58} {'loss': 0.3649, 'learning_rate': 2.280470027481242e-06, 'epoch': 1.58} {'loss': 0.3087, 'learning_rate': 2.2802564576931e-06, 'epoch': 1.58} {'loss': 0.3256, 'learning_rate': 2.2800428966190823e-06, 'epoch': 1.58} {'loss': 0.316, 'learning_rate': 2.2798293442594266e-06, 'epoch': 1.58} {'loss': 0.2296, 'learning_rate': 2.2796158006143774e-06, 'epoch': 1.58} {'loss': 0.2643, 'learning_rate': 2.279402265684172e-06, 'epoch': 1.58} {'loss': 0.2421, 'learning_rate': 2.279188739469056e-06, 'epoch': 1.58} {'loss': 0.2827, 'learning_rate': 2.2789752219692652e-06, 'epoch': 1.58} {'loss': 0.4025, 'learning_rate': 2.2787617131850424e-06, 'epoch': 1.58} {'loss': 0.2987, 'learning_rate': 2.2785482131166324e-06, 'epoch': 1.58} {'loss': 0.245, 'learning_rate': 2.2783347217642705e-06, 'epoch': 1.58} {'loss': 0.3387, 'learning_rate': 2.2781212391282026e-06, 'epoch': 1.58} {'loss': 0.297, 'learning_rate': 2.2779077652086657e-06, 'epoch': 1.58} {'loss': 0.4127, 'learning_rate': 2.2776943000059037e-06, 'epoch': 1.58} {'loss': 0.226, 'learning_rate': 2.2774808435201577e-06, 'epoch': 1.58} {'loss': 0.1856, 'learning_rate': 2.2772673957516644e-06, 'epoch': 1.58} {'loss': 0.3168, 'learning_rate': 2.27705395670067e-06, 'epoch': 1.58} {'loss': 0.5443, 'learning_rate': 2.276840526367411e-06, 'epoch': 1.58} {'loss': 0.3425, 'learning_rate': 2.2766271047521326e-06, 'epoch': 1.58} {'loss': 0.3084, 'learning_rate': 2.2764136918550706e-06, 'epoch': 1.58} {'loss': 0.3219, 'learning_rate': 2.276200287676472e-06, 'epoch': 1.58} {'loss': 0.3743, 'learning_rate': 2.2759868922165717e-06, 'epoch': 1.58} {'loss': 0.1756, 'learning_rate': 2.275773505475616e-06, 'epoch': 1.58} {'loss': 0.4425, 'learning_rate': 2.275560127453841e-06, 'epoch': 1.58} {'loss': 0.3772, 'learning_rate': 2.275346758151492e-06, 'epoch': 1.58} {'loss': 0.3058, 'learning_rate': 2.2751333975688038e-06, 'epoch': 1.58} {'loss': 0.166, 'learning_rate': 2.274920045706026e-06, 'epoch': 1.58} {'loss': 0.1719, 'learning_rate': 2.274706702563391e-06, 'epoch': 1.58} {'loss': 0.209, 'learning_rate': 2.274493368141145e-06, 'epoch': 1.58} {'loss': 0.3103, 'learning_rate': 2.2742800424395273e-06, 'epoch': 1.58} {'loss': 0.492, 'learning_rate': 2.2740667254587758e-06, 'epoch': 1.58} {'loss': 0.165, 'learning_rate': 2.2738534171991356e-06, 'epoch': 1.58} {'loss': 0.3259, 'learning_rate': 2.273640117660845e-06, 'epoch': 1.58} {'loss': 0.2048, 'learning_rate': 2.273426826844146e-06, 'epoch': 1.58} {'loss': 0.2629, 'learning_rate': 2.2732135447492774e-06, 'epoch': 1.58} {'loss': 0.1828, 'learning_rate': 2.2730002713764845e-06, 'epoch': 1.58} {'loss': 0.3996, 'learning_rate': 2.2727870067260006e-06, 'epoch': 1.58} {'loss': 0.3823, 'learning_rate': 2.2725737507980748e-06, 'epoch': 1.58} {'loss': 0.3085, 'learning_rate': 2.272360503592941e-06, 'epoch': 1.58} {'loss': 0.3898, 'learning_rate': 2.2721472651108445e-06, 'epoch': 1.58} {'loss': 0.3674, 'learning_rate': 2.2719340353520224e-06, 'epoch': 1.58} {'loss': 0.4654, 'learning_rate': 2.2717208143167193e-06, 'epoch': 1.58} {'loss': 0.2835, 'learning_rate': 2.271507602005174e-06, 'epoch': 1.58} {'loss': 0.2158, 'learning_rate': 2.271294398417625e-06, 'epoch': 1.58} {'loss': 0.4287, 'learning_rate': 2.2710812035543173e-06, 'epoch': 1.58} {'loss': 0.3454, 'learning_rate': 2.2708680174154862e-06, 'epoch': 1.58} {'loss': 0.3778, 'learning_rate': 2.2706548400013783e-06, 'epoch': 1.58} {'loss': 0.2801, 'learning_rate': 2.2704416713122277e-06, 'epoch': 1.58} {'loss': 0.377, 'learning_rate': 2.2702285113482827e-06, 'epoch': 1.58} {'loss': 0.2608, 'learning_rate': 2.2700153601097764e-06, 'epoch': 1.58} {'loss': 0.2962, 'learning_rate': 2.2698022175969547e-06, 'epoch': 1.58} {'loss': 0.3161, 'learning_rate': 2.2695890838100555e-06, 'epoch': 1.58} {'loss': 0.4, 'learning_rate': 2.2693759587493214e-06, 'epoch': 1.58} {'loss': 0.2267, 'learning_rate': 2.2691628424149893e-06, 'epoch': 1.58} {'loss': 0.2378, 'learning_rate': 2.268949734807305e-06, 'epoch': 1.58} {'loss': 0.4221, 'learning_rate': 2.268736635926507e-06, 'epoch': 1.58} {'loss': 0.2939, 'learning_rate': 2.2685235457728326e-06, 'epoch': 1.58} {'loss': 0.2718, 'learning_rate': 2.268310464346527e-06, 'epoch': 1.58} {'loss': 0.236, 'learning_rate': 2.2680973916478255e-06, 'epoch': 1.58} {'loss': 0.2555, 'learning_rate': 2.2678843276769758e-06, 'epoch': 1.58} {'loss': 0.3189, 'learning_rate': 2.2676712724342097e-06, 'epoch': 1.58} {'loss': 0.3482, 'learning_rate': 2.2674582259197764e-06, 'epoch': 1.58} {'loss': 0.2415, 'learning_rate': 2.2672451881339097e-06, 'epoch': 1.58} {'loss': 0.3509, 'learning_rate': 2.267032159076855e-06, 'epoch': 1.58} {'loss': 0.3276, 'learning_rate': 2.266819138748848e-06, 'epoch': 1.58} {'loss': 0.2553, 'learning_rate': 2.266606127150135e-06, 'epoch': 1.58} {'loss': 0.2802, 'learning_rate': 2.26639312428095e-06, 'epoch': 1.58} {'loss': 0.2893, 'learning_rate': 2.2661801301415385e-06, 'epoch': 1.58} {'loss': 0.3351, 'learning_rate': 2.2659671447321395e-06, 'epoch': 1.58} {'loss': 0.3085, 'learning_rate': 2.2657541680529905e-06, 'epoch': 1.58} {'loss': 0.2306, 'learning_rate': 2.2655412001043364e-06, 'epoch': 1.58} {'loss': 0.2708, 'learning_rate': 2.265328240886413e-06, 'epoch': 1.58} {'loss': 0.3477, 'learning_rate': 2.2651152903994666e-06, 'epoch': 1.58} {'loss': 0.3148, 'learning_rate': 2.2649023486437304e-06, 'epoch': 1.58} {'loss': 0.3604, 'learning_rate': 2.264689415619452e-06, 'epoch': 1.58} {'loss': 0.295, 'learning_rate': 2.264476491326866e-06, 'epoch': 1.58} {'loss': 0.3154, 'learning_rate': 2.264263575766217e-06, 'epoch': 1.58} {'loss': 0.3704, 'learning_rate': 2.2640506689377407e-06, 'epoch': 1.58} {'loss': 0.4852, 'learning_rate': 2.2638377708416825e-06, 'epoch': 1.58} {'loss': 0.3517, 'learning_rate': 2.263624881478278e-06, 'epoch': 1.58} {'loss': 0.1184, 'learning_rate': 2.2634120008477734e-06, 'epoch': 1.58} {'loss': 0.3693, 'learning_rate': 2.263199128950404e-06, 'epoch': 1.58} {'loss': 0.2682, 'learning_rate': 2.2629862657864098e-06, 'epoch': 1.58} {'loss': 0.1606, 'learning_rate': 2.262773411356035e-06, 'epoch': 1.58} {'loss': 0.317, 'learning_rate': 2.262560565659516e-06, 'epoch': 1.58} {'loss': 0.3114, 'learning_rate': 2.262347728697096e-06, 'epoch': 1.58} {'loss': 0.3933, 'learning_rate': 2.262134900469013e-06, 'epoch': 1.58} {'loss': 0.1577, 'learning_rate': 2.2619220809755104e-06, 'epoch': 1.58} {'loss': 0.3789, 'learning_rate': 2.261709270216823e-06, 'epoch': 1.58} {'loss': 0.2533, 'learning_rate': 2.2614964681931974e-06, 'epoch': 1.58} {'loss': 0.3007, 'learning_rate': 2.2612836749048685e-06, 'epoch': 1.58} {'loss': 0.3611, 'learning_rate': 2.2610708903520806e-06, 'epoch': 1.58} {'loss': 0.1477, 'learning_rate': 2.2608581145350696e-06, 'epoch': 1.58} {'loss': 0.3574, 'learning_rate': 2.260645347454081e-06, 'epoch': 1.58} {'loss': 0.1971, 'learning_rate': 2.2604325891093527e-06, 'epoch': 1.58} {'loss': 0.3273, 'learning_rate': 2.260219839501121e-06, 'epoch': 1.58} {'loss': 0.3405, 'learning_rate': 2.260007098629632e-06, 'epoch': 1.58} {'loss': 0.3344, 'learning_rate': 2.2597943664951205e-06, 'epoch': 1.58} {'loss': 0.4696, 'learning_rate': 2.2595816430978314e-06, 'epoch': 1.58} {'loss': 0.2731, 'learning_rate': 2.2593689284380006e-06, 'epoch': 1.58} {'loss': 0.2397, 'learning_rate': 2.2591562225158724e-06, 'epoch': 1.58} {'loss': 0.3252, 'learning_rate': 2.2589435253316828e-06, 'epoch': 1.58} {'loss': 0.2473, 'learning_rate': 2.2587308368856764e-06, 'epoch': 1.58} {'loss': 0.3404, 'learning_rate': 2.258518157178089e-06, 'epoch': 1.58} {'loss': 0.2395, 'learning_rate': 2.258305486209165e-06, 'epoch': 1.58} {'loss': 0.4642, 'learning_rate': 2.258092823979138e-06, 'epoch': 1.58} {'loss': 0.1926, 'learning_rate': 2.2578801704882525e-06, 'epoch': 1.58} {'loss': 0.3449, 'learning_rate': 2.2576675257367508e-06, 'epoch': 1.58} {'loss': 0.2797, 'learning_rate': 2.2574548897248672e-06, 'epoch': 1.58} {'loss': 0.3312, 'learning_rate': 2.257242262452848e-06, 'epoch': 1.58} {'loss': 0.3534, 'learning_rate': 2.257029643920927e-06, 'epoch': 1.58} {'loss': 0.2968, 'learning_rate': 2.2568170341293503e-06, 'epoch': 1.58} {'loss': 0.3946, 'learning_rate': 2.2566044330783523e-06, 'epoch': 1.58} {'loss': 0.3094, 'learning_rate': 2.2563918407681773e-06, 'epoch': 1.58} {'loss': 0.3724, 'learning_rate': 2.256179257199064e-06, 'epoch': 1.58} {'loss': 0.362, 'learning_rate': 2.255966682371248e-06, 'epoch': 1.58} {'loss': 0.1395, 'learning_rate': 2.2557541162849763e-06, 'epoch': 1.58} {'loss': 0.3395, 'learning_rate': 2.2555415589404827e-06, 'epoch': 1.58} {'loss': 0.2716, 'learning_rate': 2.2553290103380134e-06, 'epoch': 1.58} {'loss': 0.306, 'learning_rate': 2.2551164704778016e-06, 'epoch': 1.58} {'loss': 0.2964, 'learning_rate': 2.2549039393600934e-06, 'epoch': 1.58} {'loss': 0.3412, 'learning_rate': 2.254691416985123e-06, 'epoch': 1.58} {'loss': 0.3487, 'learning_rate': 2.2544789033531357e-06, 'epoch': 1.58} {'loss': 0.3461, 'learning_rate': 2.2542663984643664e-06, 'epoch': 1.58} {'loss': 0.3457, 'learning_rate': 2.25405390231906e-06, 'epoch': 1.58} {'loss': 0.4504, 'learning_rate': 2.2538414149174515e-06, 'epoch': 1.58} {'loss': 0.3875, 'learning_rate': 2.2536289362597853e-06, 'epoch': 1.58} {'loss': 0.2949, 'learning_rate': 2.2534164663463e-06, 'epoch': 1.58} {'loss': 0.258, 'learning_rate': 2.253204005177231e-06, 'epoch': 1.58} {'loss': 0.3328, 'learning_rate': 2.2529915527528235e-06, 'epoch': 1.58} {'loss': 0.3305, 'learning_rate': 2.252779109073313e-06, 'epoch': 1.58} {'loss': 0.2804, 'learning_rate': 2.252566674138945e-06, 'epoch': 1.58} {'loss': 0.2587, 'learning_rate': 2.2523542479499538e-06, 'epoch': 1.58} {'loss': 0.1923, 'learning_rate': 2.2521418305065824e-06, 'epoch': 1.58} {'loss': 0.2849, 'learning_rate': 2.251929421809068e-06, 'epoch': 1.58} {'loss': 0.2382, 'learning_rate': 2.2517170218576545e-06, 'epoch': 1.58} {'loss': 0.2639, 'learning_rate': 2.2515046306525767e-06, 'epoch': 1.58} {'loss': 0.3921, 'learning_rate': 2.251292248194078e-06, 'epoch': 1.58} {'loss': 0.2399, 'learning_rate': 2.251079874482396e-06, 'epoch': 1.58} {'loss': 0.2977, 'learning_rate': 2.2508675095177723e-06, 'epoch': 1.58} {'loss': 0.1858, 'learning_rate': 2.2506551533004474e-06, 'epoch': 1.58} {'loss': 0.3764, 'learning_rate': 2.250442805830655e-06, 'epoch': 1.58} {'loss': 0.2097, 'learning_rate': 2.2502304671086427e-06, 'epoch': 1.58} {'loss': 0.3643, 'learning_rate': 2.250018137134643e-06, 'epoch': 1.58} {'loss': 0.3364, 'learning_rate': 2.249805815908902e-06, 'epoch': 1.58} {'loss': 0.4377, 'learning_rate': 2.249593503431654e-06, 'epoch': 1.58} {'loss': 0.26, 'learning_rate': 2.2493811997031446e-06, 'epoch': 1.58} {'loss': 0.2856, 'learning_rate': 2.2491689047236065e-06, 'epoch': 1.58} {'loss': 0.2209, 'learning_rate': 2.2489566184932853e-06, 'epoch': 1.58} {'loss': 0.224, 'learning_rate': 2.2487443410124154e-06, 'epoch': 1.58} {'loss': 0.2524, 'learning_rate': 2.248532072281242e-06, 'epoch': 1.58} {'loss': 0.3288, 'learning_rate': 2.2483198122999996e-06, 'epoch': 1.58} {'loss': 0.2818, 'learning_rate': 2.248107561068932e-06, 'epoch': 1.58} {'loss': 0.343, 'learning_rate': 2.247895318588278e-06, 'epoch': 1.58} {'loss': 0.3871, 'learning_rate': 2.247683084858272e-06, 'epoch': 1.58} {'loss': 0.4339, 'learning_rate': 2.2474708598791617e-06, 'epoch': 1.58} {'loss': 0.2397, 'learning_rate': 2.247258643651179e-06, 'epoch': 1.58} {'loss': 0.2298, 'learning_rate': 2.2470464361745702e-06, 'epoch': 1.58} {'loss': 0.3383, 'learning_rate': 2.246834237449569e-06, 'epoch': 1.58} {'loss': 0.4734, 'learning_rate': 2.24662204747642e-06, 'epoch': 1.58} {'loss': 0.3463, 'learning_rate': 2.246409866255357e-06, 'epoch': 1.58} {'loss': 0.3003, 'learning_rate': 2.246197693786627e-06, 'epoch': 1.58} {'loss': 0.2821, 'learning_rate': 2.2459855300704613e-06, 'epoch': 1.58} {'loss': 0.3396, 'learning_rate': 2.2457733751071063e-06, 'epoch': 1.58} {'loss': 0.2603, 'learning_rate': 2.2455612288967967e-06, 'epoch': 1.58} {'loss': 0.3458, 'learning_rate': 2.2453490914397768e-06, 'epoch': 1.58} {'loss': 0.3547, 'learning_rate': 2.245136962736283e-06, 'epoch': 1.58} {'loss': 0.3787, 'learning_rate': 2.244924842786551e-06, 'epoch': 1.58} {'loss': 0.2732, 'learning_rate': 2.244712731590828e-06, 'epoch': 1.58} {'loss': 0.3343, 'learning_rate': 2.2445006291493466e-06, 'epoch': 1.58} {'loss': 0.3336, 'learning_rate': 2.2442885354623524e-06, 'epoch': 1.58} {'loss': 0.3248, 'learning_rate': 2.2440764505300785e-06, 'epoch': 1.58} {'loss': 0.4275, 'learning_rate': 2.243864374352769e-06, 'epoch': 1.58} {'loss': 0.2342, 'learning_rate': 2.2436523069306603e-06, 'epoch': 1.58} {'loss': 0.2823, 'learning_rate': 2.243440248263996e-06, 'epoch': 1.58} {'loss': 0.2331, 'learning_rate': 2.243228198353009e-06, 'epoch': 1.58} {'loss': 0.3476, 'learning_rate': 2.2430161571979457e-06, 'epoch': 1.58} {'loss': 0.2495, 'learning_rate': 2.2428041247990397e-06, 'epoch': 1.58} {'loss': 0.1948, 'learning_rate': 2.2425921011565355e-06, 'epoch': 1.58} {'loss': 0.4711, 'learning_rate': 2.2423800862706693e-06, 'epoch': 1.58} {'loss': 0.3078, 'learning_rate': 2.242168080141678e-06, 'epoch': 1.58} {'loss': 0.4147, 'learning_rate': 2.2419560827698073e-06, 'epoch': 1.58} {'loss': 0.2043, 'learning_rate': 2.2417440941552892e-06, 'epoch': 1.58} {'loss': 0.2991, 'learning_rate': 2.2415321142983693e-06, 'epoch': 1.58} {'loss': 0.3188, 'learning_rate': 2.2413201431992827e-06, 'epoch': 1.58} {'loss': 0.491, 'learning_rate': 2.2411081808582714e-06, 'epoch': 1.58} {'loss': 0.3177, 'learning_rate': 2.240896227275572e-06, 'epoch': 1.58} {'loss': 0.2312, 'learning_rate': 2.2406842824514274e-06, 'epoch': 1.58} {'loss': 0.3537, 'learning_rate': 2.2404723463860724e-06, 'epoch': 1.58} {'loss': 0.1736, 'learning_rate': 2.2402604190797516e-06, 'epoch': 1.58} {'loss': 0.353, 'learning_rate': 2.2400485005326977e-06, 'epoch': 1.58} {'loss': 0.1917, 'learning_rate': 2.239836590745157e-06, 'epoch': 1.58} {'loss': 0.3566, 'learning_rate': 2.239624689717362e-06, 'epoch': 1.58} {'loss': 0.4352, 'learning_rate': 2.239412797449557e-06, 'epoch': 1.58} {'loss': 0.3822, 'learning_rate': 2.2392009139419814e-06, 'epoch': 1.58} {'loss': 0.2951, 'learning_rate': 2.2389890391948678e-06, 'epoch': 1.58} {'loss': 0.3075, 'learning_rate': 2.2387771732084617e-06, 'epoch': 1.58} {'loss': 0.3291, 'learning_rate': 2.238565315982999e-06, 'epoch': 1.58} {'loss': 0.2345, 'learning_rate': 2.2383534675187225e-06, 'epoch': 1.58} {'loss': 0.2452, 'learning_rate': 2.2381416278158665e-06, 'epoch': 1.58} {'loss': 0.354, 'learning_rate': 2.237929796874675e-06, 'epoch': 1.58} {'loss': 0.1367, 'learning_rate': 2.2377179746953814e-06, 'epoch': 1.58} {'loss': 0.4193, 'learning_rate': 2.237506161278232e-06, 'epoch': 1.58} {'loss': 0.3524, 'learning_rate': 2.237294356623458e-06, 'epoch': 1.58} {'loss': 0.3762, 'learning_rate': 2.2370825607313075e-06, 'epoch': 1.58} {'loss': 0.4713, 'learning_rate': 2.23687077360201e-06, 'epoch': 1.58} {'loss': 0.4481, 'learning_rate': 2.23665899523581e-06, 'epoch': 1.58} {'loss': 0.2439, 'learning_rate': 2.236447225632947e-06, 'epoch': 1.58} {'loss': 0.3863, 'learning_rate': 2.2362354647936578e-06, 'epoch': 1.58} {'loss': 0.316, 'learning_rate': 2.236023712718184e-06, 'epoch': 1.58} {'loss': 0.3432, 'learning_rate': 2.2358119694067617e-06, 'epoch': 1.58} {'loss': 0.4991, 'learning_rate': 2.235600234859633e-06, 'epoch': 1.58} {'loss': 0.2703, 'learning_rate': 2.235388509077032e-06, 'epoch': 1.58} {'loss': 0.3426, 'learning_rate': 2.2351767920592037e-06, 'epoch': 1.58} {'loss': 0.2161, 'learning_rate': 2.2349650838063854e-06, 'epoch': 1.58} {'loss': 0.342, 'learning_rate': 2.2347533843188106e-06, 'epoch': 1.58} {'loss': 0.334, 'learning_rate': 2.234541693596727e-06, 'epoch': 1.58} {'loss': 0.1659, 'learning_rate': 2.2343300116403654e-06, 'epoch': 1.58} {'loss': 0.296, 'learning_rate': 2.2341183384499707e-06, 'epoch': 1.58} {'loss': 0.2578, 'learning_rate': 2.2339066740257788e-06, 'epoch': 1.58} {'loss': 0.296, 'learning_rate': 2.2336950183680306e-06, 'epoch': 1.58} {'loss': 0.3399, 'learning_rate': 2.2334833714769624e-06, 'epoch': 1.58} {'loss': 0.4652, 'learning_rate': 2.233271733352815e-06, 'epoch': 1.58} {'loss': 0.1922, 'learning_rate': 2.2330601039958266e-06, 'epoch': 1.58} {'loss': 0.4041, 'learning_rate': 2.232848483406238e-06, 'epoch': 1.58} {'loss': 0.3461, 'learning_rate': 2.232636871584284e-06, 'epoch': 1.58} {'loss': 0.3693, 'learning_rate': 2.2324252685302094e-06, 'epoch': 1.58} {'loss': 0.1771, 'learning_rate': 2.232213674244248e-06, 'epoch': 1.58} {'loss': 0.4235, 'learning_rate': 2.232002088726639e-06, 'epoch': 1.58} {'loss': 0.2395, 'learning_rate': 2.2317905119776238e-06, 'epoch': 1.58} {'loss': 0.3446, 'learning_rate': 2.231578943997439e-06, 'epoch': 1.58} {'loss': 0.2772, 'learning_rate': 2.231367384786326e-06, 'epoch': 1.58} {'loss': 0.4023, 'learning_rate': 2.2311558343445196e-06, 'epoch': 1.58} {'loss': 0.5463, 'learning_rate': 2.2309442926722624e-06, 'epoch': 1.58} {'loss': 0.1495, 'learning_rate': 2.2307327597697903e-06, 'epoch': 1.58} {'loss': 0.2852, 'learning_rate': 2.2305212356373463e-06, 'epoch': 1.58} {'loss': 0.29, 'learning_rate': 2.2303097202751635e-06, 'epoch': 1.58} {'loss': 0.3855, 'learning_rate': 2.230098213683486e-06, 'epoch': 1.58} {'loss': 0.3434, 'learning_rate': 2.229886715862547e-06, 'epoch': 1.58} {'loss': 0.244, 'learning_rate': 2.229675226812592e-06, 'epoch': 1.58} {'loss': 0.3171, 'learning_rate': 2.229463746533855e-06, 'epoch': 1.58} {'loss': 0.3102, 'learning_rate': 2.2292522750265733e-06, 'epoch': 1.58} {'loss': 0.332, 'learning_rate': 2.2290408122909914e-06, 'epoch': 1.58} {'loss': 0.3075, 'learning_rate': 2.2288293583273424e-06, 'epoch': 1.58} {'loss': 0.381, 'learning_rate': 2.2286179131358685e-06, 'epoch': 1.58} {'loss': 0.1344, 'learning_rate': 2.2284064767168058e-06, 'epoch': 1.58} {'loss': 0.5146, 'learning_rate': 2.2281950490703963e-06, 'epoch': 1.58} {'loss': 0.2229, 'learning_rate': 2.227983630196875e-06, 'epoch': 1.58} {'loss': 0.3199, 'learning_rate': 2.2277722200964848e-06, 'epoch': 1.58} {'loss': 0.4278, 'learning_rate': 2.2275608187694575e-06, 'epoch': 1.58} {'loss': 0.2348, 'learning_rate': 2.22734942621604e-06, 'epoch': 1.58} {'loss': 0.2434, 'learning_rate': 2.227138042436464e-06, 'epoch': 1.58} {'loss': 0.4062, 'learning_rate': 2.2269266674309743e-06, 'epoch': 1.58} {'loss': 0.4064, 'learning_rate': 2.2267153011998055e-06, 'epoch': 1.58} {'loss': 0.2939, 'learning_rate': 2.2265039437431945e-06, 'epoch': 1.58} {'loss': 0.2165, 'learning_rate': 2.2262925950613854e-06, 'epoch': 1.58} {'loss': 0.3662, 'learning_rate': 2.2260812551546107e-06, 'epoch': 1.58} {'loss': 0.3481, 'learning_rate': 2.225869924023115e-06, 'epoch': 1.58} {'loss': 0.2755, 'learning_rate': 2.225658601667131e-06, 'epoch': 1.58} {'loss': 0.4122, 'learning_rate': 2.2254472880869025e-06, 'epoch': 1.58} {'loss': 0.4254, 'learning_rate': 2.225235983282663e-06, 'epoch': 1.58} {'loss': 0.3925, 'learning_rate': 2.2250246872546564e-06, 'epoch': 1.58} {'loss': 0.2088, 'learning_rate': 2.2248134000031164e-06, 'epoch': 1.58} {'loss': 0.3246, 'learning_rate': 2.2246021215282854e-06, 'epoch': 1.58} {'loss': 0.1877, 'learning_rate': 2.224390851830397e-06, 'epoch': 1.58} {'loss': 0.2406, 'learning_rate': 2.2241795909096965e-06, 'epoch': 1.58} {'loss': 0.2461, 'learning_rate': 2.2239683387664178e-06, 'epoch': 1.58} {'loss': 0.2036, 'learning_rate': 2.223757095400798e-06, 'epoch': 1.58} {'loss': 0.3228, 'learning_rate': 2.22354586081308e-06, 'epoch': 1.58} {'loss': 0.3764, 'learning_rate': 2.2233346350034977e-06, 'epoch': 1.58} {'loss': 0.2919, 'learning_rate': 2.223123417972294e-06, 'epoch': 1.58} {'loss': 0.2898, 'learning_rate': 2.222912209719703e-06, 'epoch': 1.58} {'loss': 0.2523, 'learning_rate': 2.2227010102459678e-06, 'epoch': 1.58} {'loss': 0.2126, 'learning_rate': 2.222489819551321e-06, 'epoch': 1.58} {'loss': 0.1994, 'learning_rate': 2.222278637636007e-06, 'epoch': 1.58} {'loss': 0.2968, 'learning_rate': 2.2220674645002594e-06, 'epoch': 1.58} {'loss': 0.3216, 'learning_rate': 2.2218563001443206e-06, 'epoch': 1.58} {'loss': 0.4131, 'learning_rate': 2.221645144568425e-06, 'epoch': 1.58} {'loss': 0.1799, 'learning_rate': 2.221433997772815e-06, 'epoch': 1.58} {'loss': 0.2878, 'learning_rate': 2.221222859757727e-06, 'epoch': 1.58} {'loss': 0.3793, 'learning_rate': 2.221011730523397e-06, 'epoch': 1.58} {'loss': 0.3297, 'learning_rate': 2.2208006100700673e-06, 'epoch': 1.58} {'loss': 0.319, 'learning_rate': 2.2205894983979727e-06, 'epoch': 1.58} {'loss': 0.3583, 'learning_rate': 2.220378395507354e-06, 'epoch': 1.58} {'loss': 0.2286, 'learning_rate': 2.2201673013984483e-06, 'epoch': 1.58} {'loss': 0.408, 'learning_rate': 2.219956216071496e-06, 'epoch': 1.58} {'loss': 0.3986, 'learning_rate': 2.2197451395267313e-06, 'epoch': 1.58} {'loss': 0.2613, 'learning_rate': 2.219534071764398e-06, 'epoch': 1.58} {'loss': 0.2672, 'learning_rate': 2.2193230127847266e-06, 'epoch': 1.58} {'loss': 0.4011, 'learning_rate': 2.219111962587964e-06, 'epoch': 1.58} {'loss': 0.2375, 'learning_rate': 2.2189009211743417e-06, 'epoch': 1.58} {'loss': 0.3216, 'learning_rate': 2.2186898885441032e-06, 'epoch': 1.58} {'loss': 0.3247, 'learning_rate': 2.218478864697484e-06, 'epoch': 1.58} {'loss': 0.2382, 'learning_rate': 2.21826784963472e-06, 'epoch': 1.58} {'loss': 0.2709, 'learning_rate': 2.2180568433560544e-06, 'epoch': 1.58} {'loss': 0.4192, 'learning_rate': 2.2178458458617204e-06, 'epoch': 1.58} {'loss': 0.3601, 'learning_rate': 2.2176348571519614e-06, 'epoch': 1.58} {'loss': 0.2535, 'learning_rate': 2.2174238772270097e-06, 'epoch': 1.58} {'loss': 0.214, 'learning_rate': 2.2172129060871094e-06, 'epoch': 1.58} {'loss': 0.4203, 'learning_rate': 2.2170019437324917e-06, 'epoch': 1.58} {'loss': 0.443, 'learning_rate': 2.216790990163403e-06, 'epoch': 1.58} {'loss': 0.2127, 'learning_rate': 2.2165800453800747e-06, 'epoch': 1.58} {'loss': 0.2463, 'learning_rate': 2.2163691093827498e-06, 'epoch': 1.58} {'loss': 0.3568, 'learning_rate': 2.2161581821716603e-06, 'epoch': 1.58} {'loss': 0.2713, 'learning_rate': 2.215947263747049e-06, 'epoch': 1.58} {'loss': 0.3235, 'learning_rate': 2.215736354109156e-06, 'epoch': 1.58} {'loss': 0.3182, 'learning_rate': 2.215525453258214e-06, 'epoch': 1.58} {'loss': 0.1812, 'learning_rate': 2.2153145611944648e-06, 'epoch': 1.58} {'loss': 0.231, 'learning_rate': 2.2151036779181433e-06, 'epoch': 1.58} {'loss': 0.2977, 'learning_rate': 2.2148928034294927e-06, 'epoch': 1.58} {'loss': 0.5002, 'learning_rate': 2.214681937728744e-06, 'epoch': 1.58} {'loss': 0.1697, 'learning_rate': 2.214471080816142e-06, 'epoch': 1.58} {'loss': 0.3381, 'learning_rate': 2.2142602326919195e-06, 'epoch': 1.58} {'loss': 0.3099, 'learning_rate': 2.2140493933563178e-06, 'epoch': 1.58} {'loss': 0.1571, 'learning_rate': 2.213838562809575e-06, 'epoch': 1.58} {'loss': 0.3252, 'learning_rate': 2.213627741051925e-06, 'epoch': 1.58} {'loss': 0.2788, 'learning_rate': 2.2134169280836117e-06, 'epoch': 1.58} {'loss': 0.2159, 'learning_rate': 2.2132061239048664e-06, 'epoch': 1.58} {'loss': 0.3849, 'learning_rate': 2.2129953285159344e-06, 'epoch': 1.58} {'loss': 0.2969, 'learning_rate': 2.2127845419170457e-06, 'epoch': 1.58} {'loss': 0.2991, 'learning_rate': 2.212573764108447e-06, 'epoch': 1.58} {'loss': 0.4437, 'learning_rate': 2.212362995090368e-06, 'epoch': 1.58} {'loss': 0.3794, 'learning_rate': 2.2121522348630532e-06, 'epoch': 1.58} {'loss': 0.2959, 'learning_rate': 2.2119414834267337e-06, 'epoch': 1.58} {'loss': 0.2781, 'learning_rate': 2.2117307407816556e-06, 'epoch': 1.58} {'loss': 0.3015, 'learning_rate': 2.2115200069280485e-06, 'epoch': 1.58} {'loss': 0.4748, 'learning_rate': 2.2113092818661585e-06, 'epoch': 1.58} {'loss': 0.2778, 'learning_rate': 2.211098565596218e-06, 'epoch': 1.58} {'loss': 0.3962, 'learning_rate': 2.2108878581184636e-06, 'epoch': 1.58} {'loss': 0.3859, 'learning_rate': 2.210677159433139e-06, 'epoch': 1.58} {'loss': 0.2963, 'learning_rate': 2.2104664695404753e-06, 'epoch': 1.58} {'loss': 0.23, 'learning_rate': 2.210255788440717e-06, 'epoch': 1.58} {'loss': 0.2773, 'learning_rate': 2.2100451161340953e-06, 'epoch': 1.58} {'loss': 0.2013, 'learning_rate': 2.209834452620855e-06, 'epoch': 1.58} {'loss': 0.2853, 'learning_rate': 2.209623797901226e-06, 'epoch': 1.58} {'loss': 0.2493, 'learning_rate': 2.2094131519754537e-06, 'epoch': 1.58} {'loss': 0.2738, 'learning_rate': 2.20920251484377e-06, 'epoch': 1.58} {'loss': 0.3975, 'learning_rate': 2.2089918865064185e-06, 'epoch': 1.58} {'loss': 0.2895, 'learning_rate': 2.20878126696363e-06, 'epoch': 1.58} {'loss': 0.3536, 'learning_rate': 2.2085706562156484e-06, 'epoch': 1.58} {'loss': 0.4862, 'learning_rate': 2.2083600542627094e-06, 'epoch': 1.58} {'loss': 0.3654, 'learning_rate': 2.208149461105048e-06, 'epoch': 1.58} {'loss': 0.2651, 'learning_rate': 2.207938876742907e-06, 'epoch': 1.58} {'loss': 0.2275, 'learning_rate': 2.207728301176517e-06, 'epoch': 1.58} {'loss': 0.2882, 'learning_rate': 2.2075177344061237e-06, 'epoch': 1.58} {'loss': 0.3907, 'learning_rate': 2.2073071764319586e-06, 'epoch': 1.58} {'loss': 0.2463, 'learning_rate': 2.2070966272542638e-06, 'epoch': 1.58} {'loss': 0.3828, 'learning_rate': 2.2068860868732733e-06, 'epoch': 1.58} {'loss': 0.3513, 'learning_rate': 2.2066755552892282e-06, 'epoch': 1.58} {'loss': 0.2643, 'learning_rate': 2.2064650325023627e-06, 'epoch': 1.58} {'loss': 0.3005, 'learning_rate': 2.206254518512918e-06, 'epoch': 1.58} {'loss': 0.3093, 'learning_rate': 2.206044013321128e-06, 'epoch': 1.58} {'loss': 0.209, 'learning_rate': 2.205833516927234e-06, 'epoch': 1.58} {'loss': 0.334, 'learning_rate': 2.205623029331473e-06, 'epoch': 1.58} {'loss': 0.1189, 'learning_rate': 2.2054125505340772e-06, 'epoch': 1.58} {'loss': 0.1922, 'learning_rate': 2.2052020805352926e-06, 'epoch': 1.58} {'loss': 0.3257, 'learning_rate': 2.2049916193353495e-06, 'epoch': 1.58} {'loss': 0.2371, 'learning_rate': 2.204781166934491e-06, 'epoch': 1.58} {'loss': 0.3264, 'learning_rate': 2.2045707233329494e-06, 'epoch': 1.58} {'loss': 0.3973, 'learning_rate': 2.2043602885309676e-06, 'epoch': 1.58} {'loss': 0.2918, 'learning_rate': 2.204149862528778e-06, 'epoch': 1.58} {'loss': 0.2995, 'learning_rate': 2.203939445326624e-06, 'epoch': 1.58} {'loss': 0.3283, 'learning_rate': 2.2037290369247364e-06, 'epoch': 1.58} {'loss': 0.2151, 'learning_rate': 2.20351863732336e-06, 'epoch': 1.58} {'loss': 0.3028, 'learning_rate': 2.203308246522725e-06, 'epoch': 1.58} {'loss': 0.4951, 'learning_rate': 2.203097864523075e-06, 'epoch': 1.58} {'loss': 0.2436, 'learning_rate': 2.2028874913246454e-06, 'epoch': 1.58} {'loss': 0.2828, 'learning_rate': 2.2026771269276704e-06, 'epoch': 1.58} {'loss': 0.286, 'learning_rate': 2.202466771332392e-06, 'epoch': 1.58} {'loss': 0.3075, 'learning_rate': 2.202256424539044e-06, 'epoch': 1.58} {'loss': 0.3538, 'learning_rate': 2.202046086547869e-06, 'epoch': 1.58} {'loss': 0.3174, 'learning_rate': 2.2018357573590978e-06, 'epoch': 1.58} {'loss': 0.3321, 'learning_rate': 2.201625436972973e-06, 'epoch': 1.58} {'loss': 0.2228, 'learning_rate': 2.2014151253897287e-06, 'epoch': 1.58} {'loss': 0.3445, 'learning_rate': 2.201204822609605e-06, 'epoch': 1.58} {'loss': 0.1812, 'learning_rate': 2.200994528632836e-06, 'epoch': 1.58} {'loss': 0.3886, 'learning_rate': 2.2007842434596647e-06, 'epoch': 1.58} {'loss': 0.2473, 'learning_rate': 2.2005739670903215e-06, 'epoch': 1.58} {'loss': 0.2704, 'learning_rate': 2.2003636995250497e-06, 'epoch': 1.58} {'loss': 0.3315, 'learning_rate': 2.2001534407640845e-06, 'epoch': 1.58} {'loss': 0.3166, 'learning_rate': 2.1999431908076595e-06, 'epoch': 1.58} {'loss': 0.2994, 'learning_rate': 2.1997329496560193e-06, 'epoch': 1.58} {'loss': 0.1819, 'learning_rate': 2.1995227173093936e-06, 'epoch': 1.58} {'loss': 0.3455, 'learning_rate': 2.1993124937680265e-06, 'epoch': 1.58} {'loss': 0.3046, 'learning_rate': 2.1991022790321493e-06, 'epoch': 1.58} {'loss': 0.3043, 'learning_rate': 2.1988920731020045e-06, 'epoch': 1.58} {'loss': 0.3475, 'learning_rate': 2.198681875977825e-06, 'epoch': 1.58} {'loss': 0.4058, 'learning_rate': 2.198471687659853e-06, 'epoch': 1.58} {'loss': 0.4862, 'learning_rate': 2.1982615081483205e-06, 'epoch': 1.58} {'loss': 0.2738, 'learning_rate': 2.1980513374434698e-06, 'epoch': 1.58} {'loss': 0.4997, 'learning_rate': 2.197841175545532e-06, 'epoch': 1.58} {'loss': 0.3163, 'learning_rate': 2.1976310224547513e-06, 'epoch': 1.58} {'loss': 0.2208, 'learning_rate': 2.197420878171361e-06, 'epoch': 1.58} {'loss': 0.2565, 'learning_rate': 2.197210742695596e-06, 'epoch': 1.58} {'loss': 0.3382, 'learning_rate': 2.1970006160276993e-06, 'epoch': 1.58} {'loss': 0.3281, 'learning_rate': 2.196790498167902e-06, 'epoch': 1.58} {'loss': 0.2318, 'learning_rate': 2.196580389116448e-06, 'epoch': 1.58} {'loss': 0.2239, 'learning_rate': 2.1963702888735684e-06, 'epoch': 1.58} {'loss': 0.4247, 'learning_rate': 2.196160197439504e-06, 'epoch': 1.58} {'loss': 0.3275, 'learning_rate': 2.195950114814489e-06, 'epoch': 1.58} {'loss': 0.3276, 'learning_rate': 2.195740040998765e-06, 'epoch': 1.58} {'loss': 0.4302, 'learning_rate': 2.195529975992563e-06, 'epoch': 1.58} {'loss': 0.2463, 'learning_rate': 2.1953199197961274e-06, 'epoch': 1.58} {'loss': 0.3054, 'learning_rate': 2.195109872409689e-06, 'epoch': 1.58} {'loss': 0.3143, 'learning_rate': 2.194899833833486e-06, 'epoch': 1.58} {'loss': 0.2553, 'learning_rate': 2.19468980406776e-06, 'epoch': 1.58} {'loss': 0.3687, 'learning_rate': 2.194479783112743e-06, 'epoch': 1.58} {'loss': 0.3346, 'learning_rate': 2.1942697709686755e-06, 'epoch': 1.58} {'loss': 0.5329, 'learning_rate': 2.194059767635791e-06, 'epoch': 1.58} {'loss': 0.2536, 'learning_rate': 2.1938497731143318e-06, 'epoch': 1.58} {'loss': 0.4689, 'learning_rate': 2.193639787404529e-06, 'epoch': 1.58} {'loss': 0.2233, 'learning_rate': 2.1934298105066243e-06, 'epoch': 1.58} {'loss': 0.2483, 'learning_rate': 2.193219842420854e-06, 'epoch': 1.58} {'loss': 0.3412, 'learning_rate': 2.19300988314745e-06, 'epoch': 1.58} {'loss': 0.5169, 'learning_rate': 2.1927999326866576e-06, 'epoch': 1.58} {'loss': 0.2719, 'learning_rate': 2.1925899910387062e-06, 'epoch': 1.58} {'loss': 0.1972, 'learning_rate': 2.192380058203838e-06, 'epoch': 1.58} {'loss': 0.2812, 'learning_rate': 2.1921701341822855e-06, 'epoch': 1.58} {'loss': 0.2173, 'learning_rate': 2.191960218974292e-06, 'epoch': 1.58} {'loss': 0.495, 'learning_rate': 2.1917503125800864e-06, 'epoch': 1.58} {'loss': 0.2213, 'learning_rate': 2.191540414999913e-06, 'epoch': 1.58} {'loss': 0.31, 'learning_rate': 2.1913305262340035e-06, 'epoch': 1.58} {'loss': 0.374, 'learning_rate': 2.1911206462825996e-06, 'epoch': 1.58} {'loss': 0.2468, 'learning_rate': 2.190910775145932e-06, 'epoch': 1.58} {'loss': 0.3008, 'learning_rate': 2.190700912824245e-06, 'epoch': 1.58} {'loss': 0.3688, 'learning_rate': 2.1904910593177707e-06, 'epoch': 1.58} {'loss': 0.3777, 'learning_rate': 2.190281214626745e-06, 'epoch': 1.58} {'loss': 0.331, 'learning_rate': 2.1900713787514094e-06, 'epoch': 1.58} {'loss': 0.2102, 'learning_rate': 2.189861551691994e-06, 'epoch': 1.58} {'loss': 0.4188, 'learning_rate': 2.189651733448744e-06, 'epoch': 1.58} {'loss': 0.3549, 'learning_rate': 2.189441924021889e-06, 'epoch': 1.58} {'loss': 0.2138, 'learning_rate': 2.189232123411671e-06, 'epoch': 1.58} {'loss': 0.201, 'learning_rate': 2.1890223316183225e-06, 'epoch': 1.58} {'loss': 0.3635, 'learning_rate': 2.188812548642085e-06, 'epoch': 1.58} {'loss': 0.3041, 'learning_rate': 2.1886027744831906e-06, 'epoch': 1.58} {'loss': 0.2944, 'learning_rate': 2.18839300914188e-06, 'epoch': 1.58} {'loss': 0.3743, 'learning_rate': 2.1881832526183856e-06, 'epoch': 1.58} {'loss': 0.3288, 'learning_rate': 2.1879735049129504e-06, 'epoch': 1.58} {'loss': 0.2339, 'learning_rate': 2.1877637660258067e-06, 'epoch': 1.58} {'loss': 0.3118, 'learning_rate': 2.1875540359571903e-06, 'epoch': 1.58} {'loss': 0.5144, 'learning_rate': 2.1873443147073414e-06, 'epoch': 1.58} {'loss': 0.3522, 'learning_rate': 2.187134602276493e-06, 'epoch': 1.58} {'loss': 0.236, 'learning_rate': 2.186924898664887e-06, 'epoch': 1.58} {'loss': 0.3105, 'learning_rate': 2.1867152038727535e-06, 'epoch': 1.58} {'loss': 0.3112, 'learning_rate': 2.186505517900337e-06, 'epoch': 1.58} {'loss': 0.2754, 'learning_rate': 2.186295840747865e-06, 'epoch': 1.58} {'loss': 0.2818, 'learning_rate': 2.1860861724155835e-06, 'epoch': 1.58} {'loss': 0.295, 'learning_rate': 2.185876512903722e-06, 'epoch': 1.58} {'loss': 0.2784, 'learning_rate': 2.1856668622125222e-06, 'epoch': 1.58} {'loss': 0.3155, 'learning_rate': 2.1854572203422165e-06, 'epoch': 1.58} {'loss': 0.2899, 'learning_rate': 2.1852475872930457e-06, 'epoch': 1.58} {'loss': 0.2093, 'learning_rate': 2.185037963065244e-06, 'epoch': 1.58} {'loss': 0.3649, 'learning_rate': 2.184828347659047e-06, 'epoch': 1.58} {'loss': 0.3539, 'learning_rate': 2.1846187410746942e-06, 'epoch': 1.58} {'loss': 0.4053, 'learning_rate': 2.184409143312418e-06, 'epoch': 1.58} {'loss': 0.285, 'learning_rate': 2.1841995543724616e-06, 'epoch': 1.58} {'loss': 0.2186, 'learning_rate': 2.183989974255053e-06, 'epoch': 1.58} {'loss': 0.2454, 'learning_rate': 2.183780402960438e-06, 'epoch': 1.58} {'loss': 0.2137, 'learning_rate': 2.1835708404888446e-06, 'epoch': 1.58} {'loss': 0.3696, 'learning_rate': 2.1833612868405164e-06, 'epoch': 1.58} {'loss': 0.2719, 'learning_rate': 2.1831517420156843e-06, 'epoch': 1.58} {'loss': 0.2923, 'learning_rate': 2.182942206014591e-06, 'epoch': 1.58} {'loss': 0.2858, 'learning_rate': 2.1827326788374657e-06, 'epoch': 1.58} {'loss': 0.4927, 'learning_rate': 2.182523160484552e-06, 'epoch': 1.58} {'loss': 0.1869, 'learning_rate': 2.1823136509560796e-06, 'epoch': 1.58} {'loss': 0.3388, 'learning_rate': 2.182104150252291e-06, 'epoch': 1.58} {'loss': 0.2446, 'learning_rate': 2.1818946583734214e-06, 'epoch': 1.58} {'loss': 0.3041, 'learning_rate': 2.1816851753197023e-06, 'epoch': 1.58} {'loss': 0.3299, 'learning_rate': 2.181475701091378e-06, 'epoch': 1.58} {'loss': 0.4292, 'learning_rate': 2.181266235688677e-06, 'epoch': 1.58} {'loss': 0.3001, 'learning_rate': 2.181056779111842e-06, 'epoch': 1.58} {'loss': 0.2539, 'learning_rate': 2.1808473313611056e-06, 'epoch': 1.58} {'loss': 0.2479, 'learning_rate': 2.180637892436708e-06, 'epoch': 1.58} {'loss': 0.2596, 'learning_rate': 2.1804284623388793e-06, 'epoch': 1.58} {'loss': 0.3757, 'learning_rate': 2.1802190410678637e-06, 'epoch': 1.58} {'loss': 0.4005, 'learning_rate': 2.1800096286238915e-06, 'epoch': 1.58} {'loss': 0.3637, 'learning_rate': 2.1798002250072037e-06, 'epoch': 1.58} {'loss': 0.3223, 'learning_rate': 2.179590830218031e-06, 'epoch': 1.58} {'loss': 0.207, 'learning_rate': 2.1793814442566165e-06, 'epoch': 1.58} {'loss': 0.2511, 'learning_rate': 2.179172067123193e-06, 'epoch': 1.58} {'loss': 0.3001, 'learning_rate': 2.1789626988179948e-06, 'epoch': 1.59} {'loss': 0.2154, 'learning_rate': 2.178753339341263e-06, 'epoch': 1.59} {'loss': 0.2365, 'learning_rate': 2.178543988693228e-06, 'epoch': 1.59} {'loss': 0.2285, 'learning_rate': 2.178334646874133e-06, 'epoch': 1.59} {'loss': 0.3546, 'learning_rate': 2.1781253138842073e-06, 'epoch': 1.59} {'loss': 0.3067, 'learning_rate': 2.1779159897236946e-06, 'epoch': 1.59} {'loss': 0.2487, 'learning_rate': 2.177706674392823e-06, 'epoch': 1.59} {'loss': 0.4136, 'learning_rate': 2.177497367891838e-06, 'epoch': 1.59} {'loss': 0.2712, 'learning_rate': 2.1772880702209664e-06, 'epoch': 1.59} {'loss': 0.5083, 'learning_rate': 2.1770787813804528e-06, 'epoch': 1.59} {'loss': 0.281, 'learning_rate': 2.1768695013705253e-06, 'epoch': 1.59} {'loss': 0.2853, 'learning_rate': 2.1766602301914284e-06, 'epoch': 1.59} {'loss': 0.4619, 'learning_rate': 2.1764509678433953e-06, 'epoch': 1.59} {'loss': 0.2535, 'learning_rate': 2.1762417143266578e-06, 'epoch': 1.59} {'loss': 0.3621, 'learning_rate': 2.176032469641458e-06, 'epoch': 1.59} {'loss': 0.2707, 'learning_rate': 2.175823233788027e-06, 'epoch': 1.59} {'loss': 0.3132, 'learning_rate': 2.1756140067666078e-06, 'epoch': 1.59} {'loss': 0.2761, 'learning_rate': 2.175404788577428e-06, 'epoch': 1.59} {'loss': 0.377, 'learning_rate': 2.1751955792207322e-06, 'epoch': 1.59} {'loss': 0.2836, 'learning_rate': 2.1749863786967497e-06, 'epoch': 1.59} {'loss': 0.1895, 'learning_rate': 2.174777187005722e-06, 'epoch': 1.59} {'loss': 0.3358, 'learning_rate': 2.17456800414788e-06, 'epoch': 1.59} {'loss': 0.3002, 'learning_rate': 2.1743588301234655e-06, 'epoch': 1.59} {'loss': 0.3014, 'learning_rate': 2.174149664932709e-06, 'epoch': 1.59} {'loss': 0.393, 'learning_rate': 2.173940508575849e-06, 'epoch': 1.59} {'loss': 0.4242, 'learning_rate': 2.1737313610531253e-06, 'epoch': 1.59} {'loss': 0.3703, 'learning_rate': 2.173522222364768e-06, 'epoch': 1.59} {'loss': 0.3301, 'learning_rate': 2.173313092511018e-06, 'epoch': 1.59} {'loss': 0.238, 'learning_rate': 2.1731039714921076e-06, 'epoch': 1.59} {'loss': 0.2261, 'learning_rate': 2.1728948593082764e-06, 'epoch': 1.59} {'loss': 0.4121, 'learning_rate': 2.1726857559597557e-06, 'epoch': 1.59} {'loss': 0.3145, 'learning_rate': 2.1724766614467873e-06, 'epoch': 1.59} {'loss': 0.3038, 'learning_rate': 2.172267575769604e-06, 'epoch': 1.59} {'loss': 0.4725, 'learning_rate': 2.17205849892844e-06, 'epoch': 1.59} {'loss': 0.268, 'learning_rate': 2.171849430923535e-06, 'epoch': 1.59} {'loss': 0.3463, 'learning_rate': 2.1716403717551215e-06, 'epoch': 1.59} {'loss': 0.2914, 'learning_rate': 2.1714313214234408e-06, 'epoch': 1.59} {'loss': 0.4125, 'learning_rate': 2.171222279928721e-06, 'epoch': 1.59} {'loss': 0.4826, 'learning_rate': 2.1710132472712063e-06, 'epoch': 1.59} {'loss': 0.3554, 'learning_rate': 2.170804223451126e-06, 'epoch': 1.59} {'loss': 0.2605, 'learning_rate': 2.170595208468722e-06, 'epoch': 1.59} {'loss': 0.1872, 'learning_rate': 2.170386202324224e-06, 'epoch': 1.59} {'loss': 0.3242, 'learning_rate': 2.170177205017874e-06, 'epoch': 1.59} {'loss': 0.3257, 'learning_rate': 2.1699682165499026e-06, 'epoch': 1.59} {'loss': 0.26, 'learning_rate': 2.1697592369205502e-06, 'epoch': 1.59} {'loss': 0.3642, 'learning_rate': 2.1695502661300515e-06, 'epoch': 1.59} {'loss': 0.2703, 'learning_rate': 2.169341304178638e-06, 'epoch': 1.59} {'loss': 0.2688, 'learning_rate': 2.1691323510665516e-06, 'epoch': 1.59} {'loss': 0.2688, 'learning_rate': 2.1689234067940236e-06, 'epoch': 1.59} {'loss': 0.2996, 'learning_rate': 2.1687144713612953e-06, 'epoch': 1.59} {'loss': 0.2099, 'learning_rate': 2.1685055447685954e-06, 'epoch': 1.59} {'loss': 0.178, 'learning_rate': 2.1682966270161667e-06, 'epoch': 1.59} {'loss': 0.4079, 'learning_rate': 2.168087718104238e-06, 'epoch': 1.59} {'loss': 0.4306, 'learning_rate': 2.1678788180330534e-06, 'epoch': 1.59} {'loss': 0.3185, 'learning_rate': 2.1676699268028403e-06, 'epoch': 1.59} {'loss': 0.2795, 'learning_rate': 2.1674610444138422e-06, 'epoch': 1.59} {'loss': 0.1803, 'learning_rate': 2.1672521708662876e-06, 'epoch': 1.59} {'loss': 0.4436, 'learning_rate': 2.167043306160419e-06, 'epoch': 1.59} {'loss': 0.2589, 'learning_rate': 2.1668344502964687e-06, 'epoch': 1.59} {'loss': 0.1874, 'learning_rate': 2.1666256032746703e-06, 'epoch': 1.59} {'loss': 0.2997, 'learning_rate': 2.166416765095264e-06, 'epoch': 1.59} {'loss': 0.3201, 'learning_rate': 2.1662079357584818e-06, 'epoch': 1.59} {'loss': 0.2004, 'learning_rate': 2.165999115264563e-06, 'epoch': 1.59} {'loss': 0.1636, 'learning_rate': 2.1657903036137395e-06, 'epoch': 1.59} {'loss': 0.3277, 'learning_rate': 2.165581500806252e-06, 'epoch': 1.59} {'loss': 0.4486, 'learning_rate': 2.16537270684233e-06, 'epoch': 1.59} {'loss': 0.4, 'learning_rate': 2.1651639217222154e-06, 'epoch': 1.59} {'loss': 0.2645, 'learning_rate': 2.164955145446137e-06, 'epoch': 1.59} {'loss': 0.2872, 'learning_rate': 2.1647463780143387e-06, 'epoch': 1.59} {'loss': 0.2494, 'learning_rate': 2.1645376194270473e-06, 'epoch': 1.59} {'loss': 0.327, 'learning_rate': 2.164328869684508e-06, 'epoch': 1.59} {'loss': 0.2958, 'learning_rate': 2.1641201287869494e-06, 'epoch': 1.59} {'loss': 0.3794, 'learning_rate': 2.163911396734607e-06, 'epoch': 1.59} {'loss': 0.3045, 'learning_rate': 2.163702673527721e-06, 'epoch': 1.59} {'loss': 0.3877, 'learning_rate': 2.1634939591665228e-06, 'epoch': 1.59} {'loss': 0.2135, 'learning_rate': 2.1632852536512517e-06, 'epoch': 1.59} {'loss': 0.4066, 'learning_rate': 2.1630765569821387e-06, 'epoch': 1.59} {'loss': 0.2241, 'learning_rate': 2.162867869159424e-06, 'epoch': 1.59} {'loss': 0.3795, 'learning_rate': 2.1626591901833395e-06, 'epoch': 1.59} {'loss': 0.4155, 'learning_rate': 2.1624505200541247e-06, 'epoch': 1.59} {'loss': 0.4317, 'learning_rate': 2.1622418587720106e-06, 'epoch': 1.59} {'loss': 0.387, 'learning_rate': 2.1620332063372375e-06, 'epoch': 1.59} {'loss': 0.3598, 'learning_rate': 2.1618245627500355e-06, 'epoch': 1.59} {'loss': 0.2648, 'learning_rate': 2.1616159280106463e-06, 'epoch': 1.59} {'loss': 0.1467, 'learning_rate': 2.1614073021193014e-06, 'epoch': 1.59} {'loss': 0.4182, 'learning_rate': 2.1611986850762346e-06, 'epoch': 1.59} {'loss': 0.2986, 'learning_rate': 2.1609900768816873e-06, 'epoch': 1.59} {'loss': 0.3522, 'learning_rate': 2.1607814775358883e-06, 'epoch': 1.59} {'loss': 0.298, 'learning_rate': 2.1605728870390784e-06, 'epoch': 1.59} {'loss': 0.5475, 'learning_rate': 2.160364305391489e-06, 'epoch': 1.59} {'loss': 0.2657, 'learning_rate': 2.160155732593361e-06, 'epoch': 1.59} {'loss': 0.3701, 'learning_rate': 2.1599471686449227e-06, 'epoch': 1.59} {'loss': 0.2957, 'learning_rate': 2.159738613546416e-06, 'epoch': 1.59} {'loss': 0.2275, 'learning_rate': 2.15953006729807e-06, 'epoch': 1.59} {'loss': 0.3781, 'learning_rate': 2.159321529900127e-06, 'epoch': 1.59} {'loss': 0.4214, 'learning_rate': 2.159113001352817e-06, 'epoch': 1.59} {'loss': 0.207, 'learning_rate': 2.1589044816563796e-06, 'epoch': 1.59} {'loss': 0.2577, 'learning_rate': 2.1586959708110478e-06, 'epoch': 1.59} {'loss': 0.2192, 'learning_rate': 2.1584874688170544e-06, 'epoch': 1.59} {'loss': 0.219, 'learning_rate': 2.1582789756746404e-06, 'epoch': 1.59} {'loss': 0.2937, 'learning_rate': 2.1580704913840358e-06, 'epoch': 1.59} {'loss': 0.274, 'learning_rate': 2.157862015945481e-06, 'epoch': 1.59} {'loss': 0.4365, 'learning_rate': 2.1576535493592056e-06, 'epoch': 1.59} {'loss': 0.3011, 'learning_rate': 2.157445091625451e-06, 'epoch': 1.59} {'loss': 0.4608, 'learning_rate': 2.1572366427444467e-06, 'epoch': 1.59} {'loss': 0.3156, 'learning_rate': 2.1570282027164347e-06, 'epoch': 1.59} {'loss': 0.2883, 'learning_rate': 2.156819771541643e-06, 'epoch': 1.59} {'loss': 0.2722, 'learning_rate': 2.1566113492203122e-06, 'epoch': 1.59} {'loss': 0.4345, 'learning_rate': 2.156402935752674e-06, 'epoch': 1.59} {'loss': 0.2017, 'learning_rate': 2.1561945311389676e-06, 'epoch': 1.59} {'loss': 0.3177, 'learning_rate': 2.1559861353794263e-06, 'epoch': 1.59} {'loss': 0.31, 'learning_rate': 2.1557777484742816e-06, 'epoch': 1.59} {'loss': 0.2737, 'learning_rate': 2.1555693704237755e-06, 'epoch': 1.59} {'loss': 0.4804, 'learning_rate': 2.1553610012281378e-06, 'epoch': 1.59} {'loss': 0.1564, 'learning_rate': 2.155152640887608e-06, 'epoch': 1.59} {'loss': 0.1633, 'learning_rate': 2.154944289402415e-06, 'epoch': 1.59} {'loss': 0.3335, 'learning_rate': 2.1547359467728024e-06, 'epoch': 1.59} {'loss': 0.329, 'learning_rate': 2.154527612998998e-06, 'epoch': 1.59} {'loss': 0.2937, 'learning_rate': 2.1543192880812435e-06, 'epoch': 1.59} {'loss': 0.3459, 'learning_rate': 2.154110972019766e-06, 'epoch': 1.59} {'loss': 0.2755, 'learning_rate': 2.15390266481481e-06, 'epoch': 1.59} {'loss': 0.2954, 'learning_rate': 2.153694366466602e-06, 'epoch': 1.59} {'loss': 0.3501, 'learning_rate': 2.153486076975382e-06, 'epoch': 1.59} {'loss': 0.5324, 'learning_rate': 2.1532777963413853e-06, 'epoch': 1.59} {'loss': 0.4023, 'learning_rate': 2.1530695245648437e-06, 'epoch': 1.59} {'loss': 0.3257, 'learning_rate': 2.1528612616459975e-06, 'epoch': 1.59} {'loss': 0.2313, 'learning_rate': 2.152653007585076e-06, 'epoch': 1.59} {'loss': 0.3153, 'learning_rate': 2.1524447623823196e-06, 'epoch': 1.59} {'loss': 0.3542, 'learning_rate': 2.1522365260379586e-06, 'epoch': 1.59} {'loss': 0.2013, 'learning_rate': 2.1520282985522323e-06, 'epoch': 1.59} {'loss': 0.4257, 'learning_rate': 2.1518200799253708e-06, 'epoch': 1.59} {'loss': 0.2951, 'learning_rate': 2.1516118701576162e-06, 'epoch': 1.59} {'loss': 0.3214, 'learning_rate': 2.151403669249198e-06, 'epoch': 1.59} {'loss': 0.3862, 'learning_rate': 2.15119547720035e-06, 'epoch': 1.59} {'loss': 0.3265, 'learning_rate': 2.150987294011313e-06, 'epoch': 1.59} {'loss': 0.4813, 'learning_rate': 2.150779119682316e-06, 'epoch': 1.59} {'loss': 0.2436, 'learning_rate': 2.150570954213599e-06, 'epoch': 1.59} {'loss': 0.3455, 'learning_rate': 2.150362797605392e-06, 'epoch': 1.59} {'loss': 0.3601, 'learning_rate': 2.150154649857935e-06, 'epoch': 1.59} {'loss': 0.4133, 'learning_rate': 2.149946510971459e-06, 'epoch': 1.59} {'loss': 0.3608, 'learning_rate': 2.1497383809462034e-06, 'epoch': 1.59} {'loss': 0.2949, 'learning_rate': 2.1495302597823977e-06, 'epoch': 1.59} {'loss': 0.2084, 'learning_rate': 2.1493221474802807e-06, 'epoch': 1.59} {'loss': 0.1791, 'learning_rate': 2.149114044040085e-06, 'epoch': 1.59} {'loss': 0.4165, 'learning_rate': 2.148905949462049e-06, 'epoch': 1.59} {'loss': 0.3043, 'learning_rate': 2.1486978637464053e-06, 'epoch': 1.59} {'loss': 0.3401, 'learning_rate': 2.148489786893385e-06, 'epoch': 1.59} {'loss': 0.224, 'learning_rate': 2.14828171890323e-06, 'epoch': 1.59} {'loss': 0.2431, 'learning_rate': 2.14807365977617e-06, 'epoch': 1.59} {'loss': 0.2828, 'learning_rate': 2.147865609512444e-06, 'epoch': 1.59} {'loss': 0.2894, 'learning_rate': 2.1476575681122814e-06, 'epoch': 1.59} {'loss': 0.3077, 'learning_rate': 2.147449535575923e-06, 'epoch': 1.59} {'loss': 0.2583, 'learning_rate': 2.147241511903598e-06, 'epoch': 1.59} {'loss': 0.3088, 'learning_rate': 2.1470334970955477e-06, 'epoch': 1.59} {'loss': 0.3632, 'learning_rate': 2.1468254911519994e-06, 'epoch': 1.59} {'loss': 0.3435, 'learning_rate': 2.1466174940731956e-06, 'epoch': 1.59} {'loss': 0.3195, 'learning_rate': 2.1464095058593636e-06, 'epoch': 1.59} {'loss': 0.2351, 'learning_rate': 2.146201526510745e-06, 'epoch': 1.59} {'loss': 0.4495, 'learning_rate': 2.145993556027571e-06, 'epoch': 1.59} {'loss': 0.2088, 'learning_rate': 2.145785594410075e-06, 'epoch': 1.59} {'loss': 0.1484, 'learning_rate': 2.145577641658495e-06, 'epoch': 1.59} {'loss': 0.1562, 'learning_rate': 2.145369697773062e-06, 'epoch': 1.59} {'loss': 0.2246, 'learning_rate': 2.1451617627540154e-06, 'epoch': 1.59} {'loss': 0.324, 'learning_rate': 2.1449538366015853e-06, 'epoch': 1.59} {'loss': 0.1799, 'learning_rate': 2.1447459193160113e-06, 'epoch': 1.59} {'loss': 0.4591, 'learning_rate': 2.1445380108975233e-06, 'epoch': 1.59} {'loss': 0.3727, 'learning_rate': 2.14433011134636e-06, 'epoch': 1.59} {'loss': 0.3549, 'learning_rate': 2.144122220662752e-06, 'epoch': 1.59} {'loss': 0.298, 'learning_rate': 2.1439143388469386e-06, 'epoch': 1.59} {'loss': 0.3501, 'learning_rate': 2.143706465899149e-06, 'epoch': 1.59} {'loss': 0.2248, 'learning_rate': 2.1434986018196236e-06, 'epoch': 1.59} {'loss': 0.3191, 'learning_rate': 2.143290746608594e-06, 'epoch': 1.59} {'loss': 0.3726, 'learning_rate': 2.1430829002662933e-06, 'epoch': 1.59} {'loss': 0.3233, 'learning_rate': 2.1428750627929607e-06, 'epoch': 1.59} {'loss': 0.3028, 'learning_rate': 2.1426672341888246e-06, 'epoch': 1.59} {'loss': 0.3278, 'learning_rate': 2.1424594144541255e-06, 'epoch': 1.59} {'loss': 0.3833, 'learning_rate': 2.1422516035890937e-06, 'epoch': 1.59} {'loss': 0.3664, 'learning_rate': 2.1420438015939683e-06, 'epoch': 1.59} {'loss': 0.3968, 'learning_rate': 2.141836008468978e-06, 'epoch': 1.59} {'loss': 0.4041, 'learning_rate': 2.1416282242143627e-06, 'epoch': 1.59} {'loss': 0.346, 'learning_rate': 2.1414204488303536e-06, 'epoch': 1.59} {'loss': 0.3319, 'learning_rate': 2.1412126823171884e-06, 'epoch': 1.59} {'loss': 0.3476, 'learning_rate': 2.1410049246750963e-06, 'epoch': 1.59} {'loss': 0.2675, 'learning_rate': 2.140797175904319e-06, 'epoch': 1.59} {'loss': 0.3249, 'learning_rate': 2.140589436005086e-06, 'epoch': 1.59} {'loss': 0.2748, 'learning_rate': 2.140381704977631e-06, 'epoch': 1.59} {'loss': 0.3612, 'learning_rate': 2.1401739828221934e-06, 'epoch': 1.59} {'loss': 0.3047, 'learning_rate': 2.1399662695390024e-06, 'epoch': 1.59} {'loss': 0.2127, 'learning_rate': 2.139758565128297e-06, 'epoch': 1.59} {'loss': 0.2717, 'learning_rate': 2.1395508695903068e-06, 'epoch': 1.59} {'loss': 0.3959, 'learning_rate': 2.139343182925271e-06, 'epoch': 1.59} {'loss': 0.195, 'learning_rate': 2.1391355051334195e-06, 'epoch': 1.59} {'loss': 0.3694, 'learning_rate': 2.1389278362149924e-06, 'epoch': 1.59} {'loss': 0.3613, 'learning_rate': 2.138720176170218e-06, 'epoch': 1.59} {'loss': 0.3585, 'learning_rate': 2.1385125249993367e-06, 'epoch': 1.59} {'loss': 0.2606, 'learning_rate': 2.1383048827025766e-06, 'epoch': 1.59} {'loss': 0.1924, 'learning_rate': 2.138097249280179e-06, 'epoch': 1.59} {'loss': 0.269, 'learning_rate': 2.1378896247323734e-06, 'epoch': 1.59} {'loss': 0.3219, 'learning_rate': 2.1376820090593933e-06, 'epoch': 1.59} {'loss': 0.2718, 'learning_rate': 2.1374744022614778e-06, 'epoch': 1.59} {'loss': 0.314, 'learning_rate': 2.1372668043388557e-06, 'epoch': 1.59} {'loss': 0.3074, 'learning_rate': 2.1370592152917667e-06, 'epoch': 1.59} {'loss': 0.3397, 'learning_rate': 2.1368516351204403e-06, 'epoch': 1.59} {'loss': 0.239, 'learning_rate': 2.136644063825115e-06, 'epoch': 1.59} {'loss': 0.2978, 'learning_rate': 2.1364365014060216e-06, 'epoch': 1.59} {'loss': 0.2861, 'learning_rate': 2.136228947863399e-06, 'epoch': 1.59} {'loss': 0.3042, 'learning_rate': 2.1360214031974745e-06, 'epoch': 1.59} {'loss': 0.2487, 'learning_rate': 2.1358138674084905e-06, 'epoch': 1.59} {'loss': 0.4271, 'learning_rate': 2.1356063404966743e-06, 'epoch': 1.59} {'loss': 0.1853, 'learning_rate': 2.1353988224622645e-06, 'epoch': 1.59} {'loss': 0.2989, 'learning_rate': 2.1351913133054956e-06, 'epoch': 1.59} {'loss': 0.3261, 'learning_rate': 2.1349838130265963e-06, 'epoch': 1.59} {'loss': 0.3397, 'learning_rate': 2.1347763216258077e-06, 'epoch': 1.59} {'loss': 0.47, 'learning_rate': 2.134568839103358e-06, 'epoch': 1.59} {'loss': 0.3739, 'learning_rate': 2.1343613654594876e-06, 'epoch': 1.59} {'loss': 0.2454, 'learning_rate': 2.1341539006944246e-06, 'epoch': 1.59} {'loss': 0.2509, 'learning_rate': 2.133946444808409e-06, 'epoch': 1.59} {'loss': 0.3238, 'learning_rate': 2.1337389978016687e-06, 'epoch': 1.59} {'loss': 0.3077, 'learning_rate': 2.1335315596744443e-06, 'epoch': 1.59} {'loss': 0.2574, 'learning_rate': 2.133324130426965e-06, 'epoch': 1.59} {'loss': 0.2391, 'learning_rate': 2.1331167100594687e-06, 'epoch': 1.59} {'loss': 0.3639, 'learning_rate': 2.1329092985721856e-06, 'epoch': 1.59} {'loss': 0.3328, 'learning_rate': 2.1327018959653513e-06, 'epoch': 1.59} {'loss': 0.4309, 'learning_rate': 2.132494502239203e-06, 'epoch': 1.59} {'loss': 0.5113, 'learning_rate': 2.1322871173939695e-06, 'epoch': 1.59} {'loss': 0.3299, 'learning_rate': 2.1320797414298912e-06, 'epoch': 1.59} {'loss': 0.3352, 'learning_rate': 2.1318723743471957e-06, 'epoch': 1.59} {'loss': 0.2591, 'learning_rate': 2.131665016146123e-06, 'epoch': 1.59} {'loss': 0.3571, 'learning_rate': 2.1314576668269017e-06, 'epoch': 1.59} {'loss': 0.372, 'learning_rate': 2.13125032638977e-06, 'epoch': 1.59} {'loss': 0.2797, 'learning_rate': 2.131042994834961e-06, 'epoch': 1.59} {'loss': 0.4062, 'learning_rate': 2.1308356721627055e-06, 'epoch': 1.59} {'loss': 0.2363, 'learning_rate': 2.1306283583732435e-06, 'epoch': 1.59} {'loss': 0.279, 'learning_rate': 2.1304210534668024e-06, 'epoch': 1.59} {'loss': 0.2879, 'learning_rate': 2.1302137574436223e-06, 'epoch': 1.59} {'loss': 0.2531, 'learning_rate': 2.1300064703039314e-06, 'epoch': 1.59} {'loss': 0.2729, 'learning_rate': 2.1297991920479687e-06, 'epoch': 1.59} {'loss': 0.3382, 'learning_rate': 2.129591922675964e-06, 'epoch': 1.59} {'loss': 0.4511, 'learning_rate': 2.1293846621881565e-06, 'epoch': 1.59} {'loss': 0.2583, 'learning_rate': 2.129177410584774e-06, 'epoch': 1.59} {'loss': 0.2812, 'learning_rate': 2.1289701678660566e-06, 'epoch': 1.59} {'loss': 0.3692, 'learning_rate': 2.1287629340322324e-06, 'epoch': 1.59} {'loss': 0.2275, 'learning_rate': 2.1285557090835407e-06, 'epoch': 1.59} {'loss': 0.3132, 'learning_rate': 2.1283484930202124e-06, 'epoch': 1.59} {'loss': 0.5146, 'learning_rate': 2.1281412858424786e-06, 'epoch': 1.59} {'loss': 0.2742, 'learning_rate': 2.1279340875505804e-06, 'epoch': 1.59} {'loss': 0.2671, 'learning_rate': 2.127726898144744e-06, 'epoch': 1.59} {'loss': 0.4565, 'learning_rate': 2.1275197176252105e-06, 'epoch': 1.59} {'loss': 0.2878, 'learning_rate': 2.1273125459922072e-06, 'epoch': 1.59} {'loss': 0.4178, 'learning_rate': 2.1271053832459734e-06, 'epoch': 1.59} {'loss': 0.3822, 'learning_rate': 2.126898229386738e-06, 'epoch': 1.59} {'loss': 0.2222, 'learning_rate': 2.1266910844147393e-06, 'epoch': 1.59} {'loss': 0.3448, 'learning_rate': 2.126483948330207e-06, 'epoch': 1.59} {'loss': 0.2294, 'learning_rate': 2.1262768211333805e-06, 'epoch': 1.59} {'loss': 0.1838, 'learning_rate': 2.126069702824487e-06, 'epoch': 1.59} {'loss': 0.1437, 'learning_rate': 2.1258625934037658e-06, 'epoch': 1.59} {'loss': 0.3625, 'learning_rate': 2.125655492871446e-06, 'epoch': 1.59} {'loss': 0.2876, 'learning_rate': 2.1254484012277665e-06, 'epoch': 1.59} {'loss': 0.319, 'learning_rate': 2.125241318472958e-06, 'epoch': 1.59} {'loss': 0.339, 'learning_rate': 2.1250342446072524e-06, 'epoch': 1.59} {'loss': 0.4388, 'learning_rate': 2.1248271796308883e-06, 'epoch': 1.59} {'loss': 0.3868, 'learning_rate': 2.1246201235440944e-06, 'epoch': 1.59} {'loss': 0.1828, 'learning_rate': 2.1244130763471094e-06, 'epoch': 1.59} {'loss': 0.2719, 'learning_rate': 2.124206038040161e-06, 'epoch': 1.59} {'loss': 0.2098, 'learning_rate': 2.1239990086234896e-06, 'epoch': 1.59} {'loss': 0.3552, 'learning_rate': 2.1237919880973224e-06, 'epoch': 1.59} {'loss': 0.2805, 'learning_rate': 2.1235849764618998e-06, 'epoch': 1.59} {'loss': 0.3174, 'learning_rate': 2.1233779737174487e-06, 'epoch': 1.59} {'loss': 0.3943, 'learning_rate': 2.123170979864209e-06, 'epoch': 1.59} {'loss': 0.2245, 'learning_rate': 2.1229639949024084e-06, 'epoch': 1.59} {'loss': 0.2205, 'learning_rate': 2.1227570188322865e-06, 'epoch': 1.59} {'loss': 0.3901, 'learning_rate': 2.122550051654074e-06, 'epoch': 1.59} {'loss': 0.3669, 'learning_rate': 2.1223430933680023e-06, 'epoch': 1.59} {'loss': 0.3942, 'learning_rate': 2.1221361439743093e-06, 'epoch': 1.59} {'loss': 0.269, 'learning_rate': 2.1219292034732243e-06, 'epoch': 1.59} {'loss': 0.4912, 'learning_rate': 2.1217222718649853e-06, 'epoch': 1.59} {'loss': 0.2924, 'learning_rate': 2.121515349149822e-06, 'epoch': 1.59} {'loss': 0.2651, 'learning_rate': 2.1213084353279713e-06, 'epoch': 1.59} {'loss': 0.2474, 'learning_rate': 2.121101530399663e-06, 'epoch': 1.59} {'loss': 0.2632, 'learning_rate': 2.120894634365135e-06, 'epoch': 1.59} {'loss': 0.4294, 'learning_rate': 2.1206877472246166e-06, 'epoch': 1.59} {'loss': 0.2131, 'learning_rate': 2.1204808689783463e-06, 'epoch': 1.59} {'loss': 0.4581, 'learning_rate': 2.1202739996265508e-06, 'epoch': 1.59} {'loss': 0.2111, 'learning_rate': 2.1200671391694715e-06, 'epoch': 1.59} {'loss': 0.3681, 'learning_rate': 2.119860287607338e-06, 'epoch': 1.59} {'loss': 0.2473, 'learning_rate': 2.1196534449403805e-06, 'epoch': 1.59} {'loss': 0.142, 'learning_rate': 2.1194466111688384e-06, 'epoch': 1.59} {'loss': 0.2697, 'learning_rate': 2.1192397862929405e-06, 'epoch': 1.59} {'loss': 0.2169, 'learning_rate': 2.1190329703129244e-06, 'epoch': 1.59} {'loss': 0.2526, 'learning_rate': 2.1188261632290187e-06, 'epoch': 1.59} {'loss': 0.343, 'learning_rate': 2.118619365041462e-06, 'epoch': 1.59} {'loss': 0.1884, 'learning_rate': 2.118412575750484e-06, 'epoch': 1.59} {'loss': 0.3277, 'learning_rate': 2.1182057953563208e-06, 'epoch': 1.59} {'loss': 0.2459, 'learning_rate': 2.1179990238592017e-06, 'epoch': 1.59} {'loss': 0.281, 'learning_rate': 2.1177922612593658e-06, 'epoch': 1.59} {'loss': 0.29, 'learning_rate': 2.117585507557042e-06, 'epoch': 1.59} {'loss': 0.2218, 'learning_rate': 2.117378762752467e-06, 'epoch': 1.59} {'loss': 0.3388, 'learning_rate': 2.117172026845872e-06, 'epoch': 1.59} {'loss': 0.3313, 'learning_rate': 2.116965299837489e-06, 'epoch': 1.59} {'loss': 0.4843, 'learning_rate': 2.116758581727555e-06, 'epoch': 1.59} {'loss': 0.3369, 'learning_rate': 2.1165518725162993e-06, 'epoch': 1.59} {'loss': 0.238, 'learning_rate': 2.1163451722039595e-06, 'epoch': 1.59} {'loss': 0.2067, 'learning_rate': 2.116138480790766e-06, 'epoch': 1.59} {'loss': 0.4722, 'learning_rate': 2.1159317982769534e-06, 'epoch': 1.59} {'loss': 0.2514, 'learning_rate': 2.115725124662753e-06, 'epoch': 1.59} {'loss': 0.255, 'learning_rate': 2.1155184599484025e-06, 'epoch': 1.59} {'loss': 0.3689, 'learning_rate': 2.1153118041341293e-06, 'epoch': 1.59} {'loss': 0.3989, 'learning_rate': 2.115105157220172e-06, 'epoch': 1.59} {'loss': 0.313, 'learning_rate': 2.1148985192067596e-06, 'epoch': 1.59} {'loss': 0.2314, 'learning_rate': 2.1146918900941306e-06, 'epoch': 1.59} {'loss': 0.1822, 'learning_rate': 2.1144852698825135e-06, 'epoch': 1.59} {'loss': 0.2712, 'learning_rate': 2.114278658572141e-06, 'epoch': 1.59} {'loss': 0.3013, 'learning_rate': 2.114072056163251e-06, 'epoch': 1.59} {'loss': 0.2354, 'learning_rate': 2.1138654626560716e-06, 'epoch': 1.59} {'loss': 0.3276, 'learning_rate': 2.1136588780508418e-06, 'epoch': 1.59} {'loss': 0.3762, 'learning_rate': 2.113452302347788e-06, 'epoch': 1.59} {'loss': 0.4126, 'learning_rate': 2.1132457355471493e-06, 'epoch': 1.59} {'loss': 0.2455, 'learning_rate': 2.1130391776491543e-06, 'epoch': 1.59} {'loss': 0.2718, 'learning_rate': 2.11283262865404e-06, 'epoch': 1.59} {'loss': 0.3189, 'learning_rate': 2.1126260885620365e-06, 'epoch': 1.59} {'loss': 0.3187, 'learning_rate': 2.1124195573733806e-06, 'epoch': 1.59} {'loss': 0.445, 'learning_rate': 2.1122130350882996e-06, 'epoch': 1.59} {'loss': 0.3964, 'learning_rate': 2.112006521707031e-06, 'epoch': 1.59} {'loss': 0.3595, 'learning_rate': 2.111800017229809e-06, 'epoch': 1.59} {'loss': 0.2508, 'learning_rate': 2.111593521656863e-06, 'epoch': 1.59} {'loss': 0.2592, 'learning_rate': 2.1113870349884303e-06, 'epoch': 1.59} {'loss': 0.2513, 'learning_rate': 2.111180557224739e-06, 'epoch': 1.59} {'loss': 0.4028, 'learning_rate': 2.110974088366027e-06, 'epoch': 1.59} {'loss': 0.2361, 'learning_rate': 2.110767628412522e-06, 'epoch': 1.59} {'loss': 0.2812, 'learning_rate': 2.110561177364464e-06, 'epoch': 1.59} {'loss': 0.2809, 'learning_rate': 2.110354735222081e-06, 'epoch': 1.59} {'loss': 0.2774, 'learning_rate': 2.110148301985605e-06, 'epoch': 1.59} {'loss': 0.4385, 'learning_rate': 2.1099418776552737e-06, 'epoch': 1.59} {'loss': 0.1518, 'learning_rate': 2.109735462231316e-06, 'epoch': 1.59} {'loss': 0.4506, 'learning_rate': 2.1095290557139682e-06, 'epoch': 1.59} {'loss': 0.1939, 'learning_rate': 2.1093226581034597e-06, 'epoch': 1.59} {'loss': 0.2841, 'learning_rate': 2.1091162694000277e-06, 'epoch': 1.59} {'loss': 0.4086, 'learning_rate': 2.1089098896038994e-06, 'epoch': 1.59} {'loss': 0.2367, 'learning_rate': 2.1087035187153148e-06, 'epoch': 1.59} {'loss': 0.3509, 'learning_rate': 2.1084971567345013e-06, 'epoch': 1.59} {'loss': 0.3415, 'learning_rate': 2.1082908036616958e-06, 'epoch': 1.59} {'loss': 0.2707, 'learning_rate': 2.108084459497126e-06, 'epoch': 1.59} {'loss': 0.256, 'learning_rate': 2.1078781242410317e-06, 'epoch': 1.59} {'loss': 0.3012, 'learning_rate': 2.1076717978936425e-06, 'epoch': 1.59} {'loss': 0.4078, 'learning_rate': 2.1074654804551873e-06, 'epoch': 1.59} {'loss': 0.3228, 'learning_rate': 2.1072591719259073e-06, 'epoch': 1.59} {'loss': 0.2339, 'learning_rate': 2.107052872306027e-06, 'epoch': 1.59} {'loss': 0.301, 'learning_rate': 2.106846581595785e-06, 'epoch': 1.59} {'loss': 0.2272, 'learning_rate': 2.1066402997954106e-06, 'epoch': 1.59} {'loss': 0.3089, 'learning_rate': 2.1064340269051397e-06, 'epoch': 1.59} {'loss': 0.2676, 'learning_rate': 2.1062277629252026e-06, 'epoch': 1.59} {'loss': 0.3602, 'learning_rate': 2.1060215078558353e-06, 'epoch': 1.59} {'loss': 0.2022, 'learning_rate': 2.105815261697266e-06, 'epoch': 1.59} {'loss': 0.3275, 'learning_rate': 2.105609024449733e-06, 'epoch': 1.59} {'loss': 0.2789, 'learning_rate': 2.1054027961134628e-06, 'epoch': 1.59} {'loss': 0.2086, 'learning_rate': 2.105196576688695e-06, 'epoch': 1.59} {'loss': 0.3143, 'learning_rate': 2.1049903661756587e-06, 'epoch': 1.59} {'loss': 0.2257, 'learning_rate': 2.1047841645745847e-06, 'epoch': 1.59} {'loss': 0.2975, 'learning_rate': 2.1045779718857106e-06, 'epoch': 1.59} {'loss': 0.1678, 'learning_rate': 2.104371788109264e-06, 'epoch': 1.59} {'loss': 0.3376, 'learning_rate': 2.1041656132454822e-06, 'epoch': 1.59} {'loss': 0.1631, 'learning_rate': 2.1039594472945935e-06, 'epoch': 1.59} {'loss': 0.3759, 'learning_rate': 2.103753290256836e-06, 'epoch': 1.59} {'loss': 0.3892, 'learning_rate': 2.103547142132437e-06, 'epoch': 1.59} {'loss': 0.407, 'learning_rate': 2.103341002921634e-06, 'epoch': 1.59} {'loss': 0.2842, 'learning_rate': 2.1031348726246547e-06, 'epoch': 1.59} {'loss': 0.3233, 'learning_rate': 2.1029287512417386e-06, 'epoch': 1.59} {'loss': 0.4316, 'learning_rate': 2.1027226387731094e-06, 'epoch': 1.59} {'loss': 0.408, 'learning_rate': 2.102516535219008e-06, 'epoch': 1.59} {'loss': 0.3559, 'learning_rate': 2.1023104405796644e-06, 'epoch': 1.59} {'loss': 0.2554, 'learning_rate': 2.1021043548553077e-06, 'epoch': 1.59} {'loss': 0.3638, 'learning_rate': 2.1018982780461748e-06, 'epoch': 1.59} {'loss': 0.4137, 'learning_rate': 2.101692210152495e-06, 'epoch': 1.59} {'loss': 0.4134, 'learning_rate': 2.1014861511745057e-06, 'epoch': 1.59} {'loss': 0.227, 'learning_rate': 2.101280101112434e-06, 'epoch': 1.59} {'loss': 0.4299, 'learning_rate': 2.101074059966517e-06, 'epoch': 1.59} {'loss': 0.2672, 'learning_rate': 2.100868027736983e-06, 'epoch': 1.59} {'loss': 0.379, 'learning_rate': 2.100662004424069e-06, 'epoch': 1.59} {'loss': 0.2318, 'learning_rate': 2.100455990028004e-06, 'epoch': 1.59} {'loss': 0.342, 'learning_rate': 2.100249984549024e-06, 'epoch': 1.59} {'loss': 0.4855, 'learning_rate': 2.100043987987357e-06, 'epoch': 1.59} {'loss': 0.3376, 'learning_rate': 2.0998380003432406e-06, 'epoch': 1.59} {'loss': 0.4222, 'learning_rate': 2.0996320216169053e-06, 'epoch': 1.59} {'loss': 0.4189, 'learning_rate': 2.0994260518085797e-06, 'epoch': 1.59} {'loss': 0.1995, 'learning_rate': 2.099220090918502e-06, 'epoch': 1.59} {'loss': 0.4003, 'learning_rate': 2.099014138946901e-06, 'epoch': 1.59} {'loss': 0.2142, 'learning_rate': 2.098808195894013e-06, 'epoch': 1.59} {'loss': 0.3831, 'learning_rate': 2.0986022617600653e-06, 'epoch': 1.59} {'loss': 0.2346, 'learning_rate': 2.098396336545295e-06, 'epoch': 1.59} {'loss': 0.2445, 'learning_rate': 2.0981904202499315e-06, 'epoch': 1.59} {'loss': 0.098, 'learning_rate': 2.0979845128742094e-06, 'epoch': 1.59} {'loss': 0.2731, 'learning_rate': 2.0977786144183587e-06, 'epoch': 1.59} {'loss': 0.4256, 'learning_rate': 2.097572724882616e-06, 'epoch': 1.59} {'loss': 0.3438, 'learning_rate': 2.097366844267208e-06, 'epoch': 1.59} {'loss': 0.2668, 'learning_rate': 2.097160972572372e-06, 'epoch': 1.59} {'loss': 0.3378, 'learning_rate': 2.0969551097983397e-06, 'epoch': 1.59} {'loss': 0.313, 'learning_rate': 2.0967492559453386e-06, 'epoch': 1.59} {'loss': 0.2859, 'learning_rate': 2.0965434110136074e-06, 'epoch': 1.59} {'loss': 0.3804, 'learning_rate': 2.0963375750033743e-06, 'epoch': 1.59} {'loss': 0.2141, 'learning_rate': 2.0961317479148746e-06, 'epoch': 1.59} {'loss': 0.4621, 'learning_rate': 2.095925929748337e-06, 'epoch': 1.59} {'loss': 0.4461, 'learning_rate': 2.095720120503998e-06, 'epoch': 1.59} {'loss': 0.3264, 'learning_rate': 2.095514320182086e-06, 'epoch': 1.59} {'loss': 0.2827, 'learning_rate': 2.0953085287828377e-06, 'epoch': 1.59} {'loss': 0.3767, 'learning_rate': 2.09510274630648e-06, 'epoch': 1.59} {'loss': 0.2893, 'learning_rate': 2.094896972753251e-06, 'epoch': 1.59} {'loss': 0.2666, 'learning_rate': 2.094691208123377e-06, 'epoch': 1.59} {'loss': 0.3436, 'learning_rate': 2.094485452417098e-06, 'epoch': 1.59} {'loss': 0.4578, 'learning_rate': 2.09427970563464e-06, 'epoch': 1.59} {'loss': 0.2729, 'learning_rate': 2.0940739677762334e-06, 'epoch': 1.59} {'loss': 0.3345, 'learning_rate': 2.0938682388421174e-06, 'epoch': 1.59} {'loss': 0.5267, 'learning_rate': 2.0936625188325188e-06, 'epoch': 1.59} {'loss': 0.3293, 'learning_rate': 2.0934568077476735e-06, 'epoch': 1.59} {'loss': 0.3468, 'learning_rate': 2.093251105587809e-06, 'epoch': 1.59} {'loss': 0.2354, 'learning_rate': 2.093045412353164e-06, 'epoch': 1.59} {'loss': 0.2352, 'learning_rate': 2.0928397280439638e-06, 'epoch': 1.59} {'loss': 0.3014, 'learning_rate': 2.092634052660447e-06, 'epoch': 1.59} {'loss': 0.2255, 'learning_rate': 2.0924283862028406e-06, 'epoch': 1.59} {'loss': 0.4356, 'learning_rate': 2.0922227286713815e-06, 'epoch': 1.59} {'loss': 0.402, 'learning_rate': 2.0920170800662953e-06, 'epoch': 1.59} {'loss': 0.3286, 'learning_rate': 2.0918114403878187e-06, 'epoch': 1.59} {'loss': 0.3796, 'learning_rate': 2.091605809636186e-06, 'epoch': 1.59} {'loss': 0.2704, 'learning_rate': 2.091400187811624e-06, 'epoch': 1.59} {'loss': 0.3714, 'learning_rate': 2.091194574914369e-06, 'epoch': 1.59} {'loss': 0.3645, 'learning_rate': 2.0909889709446497e-06, 'epoch': 1.59} {'loss': 0.2796, 'learning_rate': 2.090783375902702e-06, 'epoch': 1.59} {'loss': 0.3048, 'learning_rate': 2.0905777897887534e-06, 'epoch': 1.59} {'loss': 0.3566, 'learning_rate': 2.0903722126030412e-06, 'epoch': 1.59} {'loss': 0.3011, 'learning_rate': 2.0901666443457923e-06, 'epoch': 1.59} {'loss': 0.3436, 'learning_rate': 2.0899610850172436e-06, 'epoch': 1.59} {'loss': 0.3175, 'learning_rate': 2.0897555346176244e-06, 'epoch': 1.59} {'loss': 0.2579, 'learning_rate': 2.089549993147164e-06, 'epoch': 1.59} {'loss': 0.3217, 'learning_rate': 2.0893444606061008e-06, 'epoch': 1.59} {'loss': 0.1854, 'learning_rate': 2.08913893699466e-06, 'epoch': 1.59} {'loss': 0.3603, 'learning_rate': 2.0889334223130807e-06, 'epoch': 1.59} {'loss': 0.3381, 'learning_rate': 2.088727916561588e-06, 'epoch': 1.59} {'loss': 0.4483, 'learning_rate': 2.0885224197404196e-06, 'epoch': 1.59} {'loss': 0.3095, 'learning_rate': 2.0883169318498033e-06, 'epoch': 1.59} {'loss': 0.2515, 'learning_rate': 2.0881114528899737e-06, 'epoch': 1.59} {'loss': 0.2887, 'learning_rate': 2.0879059828611604e-06, 'epoch': 1.59} {'loss': 0.3201, 'learning_rate': 2.087700521763598e-06, 'epoch': 1.59} {'loss': 0.3713, 'learning_rate': 2.087495069597516e-06, 'epoch': 1.59} {'loss': 0.3836, 'learning_rate': 2.087289626363149e-06, 'epoch': 1.59} {'loss': 0.3358, 'learning_rate': 2.0870841920607277e-06, 'epoch': 1.59} {'loss': 0.356, 'learning_rate': 2.086878766690481e-06, 'epoch': 1.59} {'loss': 0.3537, 'learning_rate': 2.086673350252647e-06, 'epoch': 1.59} {'loss': 0.4083, 'learning_rate': 2.08646794274745e-06, 'epoch': 1.59} {'loss': 0.3574, 'learning_rate': 2.0862625441751295e-06, 'epoch': 1.59} {'loss': 0.2406, 'learning_rate': 2.0860571545359097e-06, 'epoch': 1.59} {'loss': 0.3865, 'learning_rate': 2.0858517738300297e-06, 'epoch': 1.59} {'loss': 0.3571, 'learning_rate': 2.085646402057716e-06, 'epoch': 1.59} {'loss': 0.2588, 'learning_rate': 2.085441039219206e-06, 'epoch': 1.59} {'loss': 0.3784, 'learning_rate': 2.0852356853147237e-06, 'epoch': 1.59} {'loss': 0.3346, 'learning_rate': 2.085030340344508e-06, 'epoch': 1.59} {'loss': 0.3643, 'learning_rate': 2.084825004308786e-06, 'epoch': 1.59} {'loss': 0.3651, 'learning_rate': 2.084619677207794e-06, 'epoch': 1.59} {'loss': 0.2825, 'learning_rate': 2.084414359041761e-06, 'epoch': 1.59} {'loss': 0.2926, 'learning_rate': 2.0842090498109167e-06, 'epoch': 1.59} {'loss': 0.343, 'learning_rate': 2.0840037495154973e-06, 'epoch': 1.59} {'loss': 0.2462, 'learning_rate': 2.0837984581557304e-06, 'epoch': 1.59} {'loss': 0.2613, 'learning_rate': 2.083593175731852e-06, 'epoch': 1.59} {'loss': 0.3249, 'learning_rate': 2.0833879022440884e-06, 'epoch': 1.59} {'loss': 0.2378, 'learning_rate': 2.083182637692678e-06, 'epoch': 1.59} {'loss': 0.3466, 'learning_rate': 2.0829773820778454e-06, 'epoch': 1.59} {'loss': 0.2436, 'learning_rate': 2.082772135399829e-06, 'epoch': 1.59} {'loss': 0.3464, 'learning_rate': 2.0825668976588543e-06, 'epoch': 1.59} {'loss': 0.3278, 'learning_rate': 2.0823616688551586e-06, 'epoch': 1.59} {'loss': 0.284, 'learning_rate': 2.082156448988969e-06, 'epoch': 1.59} {'loss': 0.415, 'learning_rate': 2.081951238060521e-06, 'epoch': 1.59} {'loss': 0.1862, 'learning_rate': 2.0817460360700446e-06, 'epoch': 1.59} {'loss': 0.2943, 'learning_rate': 2.0815408430177686e-06, 'epoch': 1.59} {'loss': 0.3216, 'learning_rate': 2.08133565890393e-06, 'epoch': 1.59} {'loss': 0.4092, 'learning_rate': 2.081130483728755e-06, 'epoch': 1.59} {'loss': 0.2301, 'learning_rate': 2.0809253174924803e-06, 'epoch': 1.59} {'loss': 0.3668, 'learning_rate': 2.080720160195333e-06, 'epoch': 1.59} {'loss': 0.308, 'learning_rate': 2.0805150118375485e-06, 'epoch': 1.59} {'loss': 0.2142, 'learning_rate': 2.0803098724193538e-06, 'epoch': 1.59} {'loss': 0.219, 'learning_rate': 2.080104741940987e-06, 'epoch': 1.59} {'loss': 0.3658, 'learning_rate': 2.0798996204026724e-06, 'epoch': 1.59} {'loss': 0.3767, 'learning_rate': 2.079694507804648e-06, 'epoch': 1.59} {'loss': 0.3484, 'learning_rate': 2.0794894041471405e-06, 'epoch': 1.59} {'loss': 0.3662, 'learning_rate': 2.079284309430385e-06, 'epoch': 1.59} {'loss': 0.2183, 'learning_rate': 2.079079223654611e-06, 'epoch': 1.6} {'loss': 0.3559, 'learning_rate': 2.078874146820048e-06, 'epoch': 1.6} {'loss': 0.2604, 'learning_rate': 2.0786690789269327e-06, 'epoch': 1.6} {'loss': 0.2695, 'learning_rate': 2.078464019975491e-06, 'epoch': 1.6} {'loss': 0.1997, 'learning_rate': 2.0782589699659604e-06, 'epoch': 1.6} {'loss': 0.2934, 'learning_rate': 2.078053928898566e-06, 'epoch': 1.6} {'loss': 0.3416, 'learning_rate': 2.0778488967735445e-06, 'epoch': 1.6} {'loss': 0.1989, 'learning_rate': 2.077643873591122e-06, 'epoch': 1.6} {'loss': 0.3904, 'learning_rate': 2.077438859351536e-06, 'epoch': 1.6} {'loss': 0.3352, 'learning_rate': 2.077233854055013e-06, 'epoch': 1.6} {'loss': 0.2851, 'learning_rate': 2.077028857701788e-06, 'epoch': 1.6} {'loss': 0.2675, 'learning_rate': 2.0768238702920897e-06, 'epoch': 1.6} {'loss': 0.3129, 'learning_rate': 2.076618891826152e-06, 'epoch': 1.6} {'loss': 0.2614, 'learning_rate': 2.0764139223042056e-06, 'epoch': 1.6} {'loss': 0.3975, 'learning_rate': 2.076208961726478e-06, 'epoch': 1.6} {'loss': 0.3272, 'learning_rate': 2.0760040100932067e-06, 'epoch': 1.6} {'loss': 0.2386, 'learning_rate': 2.075799067404617e-06, 'epoch': 1.6} {'loss': 0.1994, 'learning_rate': 2.0755941336609465e-06, 'epoch': 1.6} {'loss': 0.3108, 'learning_rate': 2.0753892088624205e-06, 'epoch': 1.6} {'loss': 0.4241, 'learning_rate': 2.075184293009276e-06, 'epoch': 1.6} {'loss': 0.3038, 'learning_rate': 2.0749793861017376e-06, 'epoch': 1.6} {'loss': 0.3992, 'learning_rate': 2.0747744881400444e-06, 'epoch': 1.6} {'loss': 0.2048, 'learning_rate': 2.0745695991244206e-06, 'epoch': 1.6} {'loss': 0.3301, 'learning_rate': 2.074364719055103e-06, 'epoch': 1.6} {'loss': 0.2771, 'learning_rate': 2.0741598479323187e-06, 'epoch': 1.6} {'loss': 0.2621, 'learning_rate': 2.073954985756302e-06, 'epoch': 1.6} {'loss': 0.2788, 'learning_rate': 2.0737501325272847e-06, 'epoch': 1.6} {'loss': 0.2906, 'learning_rate': 2.0735452882454923e-06, 'epoch': 1.6} {'loss': 0.2731, 'learning_rate': 2.0733404529111634e-06, 'epoch': 1.6} {'loss': 0.219, 'learning_rate': 2.073135626524523e-06, 'epoch': 1.6} {'loss': 0.2544, 'learning_rate': 2.072930809085807e-06, 'epoch': 1.6} {'loss': 0.3797, 'learning_rate': 2.072726000595243e-06, 'epoch': 1.6} {'loss': 0.2926, 'learning_rate': 2.072521201053066e-06, 'epoch': 1.6} {'loss': 0.2702, 'learning_rate': 2.0723164104595027e-06, 'epoch': 1.6} {'loss': 0.4502, 'learning_rate': 2.0721116288147892e-06, 'epoch': 1.6} {'loss': 0.3439, 'learning_rate': 2.071906856119151e-06, 'epoch': 1.6} {'loss': 0.3855, 'learning_rate': 2.0717020923728258e-06, 'epoch': 1.6} {'loss': 0.3835, 'learning_rate': 2.0714973375760395e-06, 'epoch': 1.6} {'loss': 0.2465, 'learning_rate': 2.071292591729023e-06, 'epoch': 1.6} {'loss': 0.2445, 'learning_rate': 2.0710878548320135e-06, 'epoch': 1.6} {'loss': 0.321, 'learning_rate': 2.070883126885235e-06, 'epoch': 1.6} {'loss': 0.4345, 'learning_rate': 2.0706784078889243e-06, 'epoch': 1.6} {'loss': 0.342, 'learning_rate': 2.070473697843307e-06, 'epoch': 1.6} {'loss': 0.3591, 'learning_rate': 2.07026899674862e-06, 'epoch': 1.6} {'loss': 0.237, 'learning_rate': 2.070064304605088e-06, 'epoch': 1.6} {'loss': 0.3031, 'learning_rate': 2.0698596214129483e-06, 'epoch': 1.6} {'loss': 0.5282, 'learning_rate': 2.0696549471724305e-06, 'epoch': 1.6} {'loss': 0.2884, 'learning_rate': 2.06945028188376e-06, 'epoch': 1.6} {'loss': 0.3905, 'learning_rate': 2.069245625547175e-06, 'epoch': 1.6} {'loss': 0.3652, 'learning_rate': 2.0690409781629016e-06, 'epoch': 1.6} {'loss': 0.1554, 'learning_rate': 2.068836339731175e-06, 'epoch': 1.6} {'loss': 0.3156, 'learning_rate': 2.0686317102522214e-06, 'epoch': 1.6} {'loss': 0.3076, 'learning_rate': 2.068427089726277e-06, 'epoch': 1.6} {'loss': 0.2669, 'learning_rate': 2.0682224781535675e-06, 'epoch': 1.6} {'loss': 0.2724, 'learning_rate': 2.0680178755343292e-06, 'epoch': 1.6} {'loss': 0.3632, 'learning_rate': 2.067813281868788e-06, 'epoch': 1.6} {'loss': 0.3547, 'learning_rate': 2.0676086971571797e-06, 'epoch': 1.6} {'loss': 0.3541, 'learning_rate': 2.0674041213997296e-06, 'epoch': 1.6} {'loss': 0.359, 'learning_rate': 2.067199554596675e-06, 'epoch': 1.6} {'loss': 0.3085, 'learning_rate': 2.0669949967482405e-06, 'epoch': 1.6} {'loss': 0.3823, 'learning_rate': 2.066790447854663e-06, 'epoch': 1.6} {'loss': 0.271, 'learning_rate': 2.066585907916171e-06, 'epoch': 1.6} {'loss': 0.5552, 'learning_rate': 2.066381376932992e-06, 'epoch': 1.6} {'loss': 0.2842, 'learning_rate': 2.066176854905363e-06, 'epoch': 1.6} {'loss': 0.2399, 'learning_rate': 2.0659723418335077e-06, 'epoch': 1.6} {'loss': 0.3605, 'learning_rate': 2.065767837717664e-06, 'epoch': 1.6} {'loss': 0.1718, 'learning_rate': 2.0655633425580566e-06, 'epoch': 1.6} {'loss': 0.1658, 'learning_rate': 2.0653588563549233e-06, 'epoch': 1.6} {'loss': 0.1943, 'learning_rate': 2.065154379108487e-06, 'epoch': 1.6} {'loss': 0.3152, 'learning_rate': 2.0649499108189863e-06, 'epoch': 1.6} {'loss': 0.3602, 'learning_rate': 2.064745451486645e-06, 'epoch': 1.6} {'loss': 0.27, 'learning_rate': 2.0645410011117006e-06, 'epoch': 1.6} {'loss': 0.2501, 'learning_rate': 2.0643365596943765e-06, 'epoch': 1.6} {'loss': 0.2621, 'learning_rate': 2.0641321272349102e-06, 'epoch': 1.6} {'loss': 0.2358, 'learning_rate': 2.06392770373353e-06, 'epoch': 1.6} {'loss': 0.2661, 'learning_rate': 2.0637232891904646e-06, 'epoch': 1.6} {'loss': 0.4731, 'learning_rate': 2.063518883605948e-06, 'epoch': 1.6} {'loss': 0.3259, 'learning_rate': 2.063314486980207e-06, 'epoch': 1.6} {'loss': 0.4101, 'learning_rate': 2.063110099313477e-06, 'epoch': 1.6} {'loss': 0.2932, 'learning_rate': 2.0629057206059845e-06, 'epoch': 1.6} {'loss': 0.3625, 'learning_rate': 2.062701350857964e-06, 'epoch': 1.6} {'loss': 0.1971, 'learning_rate': 2.0624969900696422e-06, 'epoch': 1.6} {'loss': 0.3143, 'learning_rate': 2.0622926382412544e-06, 'epoch': 1.6} {'loss': 0.1381, 'learning_rate': 2.062088295373026e-06, 'epoch': 1.6} {'loss': 0.3147, 'learning_rate': 2.0618839614651933e-06, 'epoch': 1.6} {'loss': 0.2403, 'learning_rate': 2.0616796365179813e-06, 'epoch': 1.6} {'loss': 0.3624, 'learning_rate': 2.061475320531626e-06, 'epoch': 1.6} {'loss': 0.2952, 'learning_rate': 2.061271013506356e-06, 'epoch': 1.6} {'loss': 0.2849, 'learning_rate': 2.061066715442398e-06, 'epoch': 1.6} {'loss': 0.3593, 'learning_rate': 2.060862426339989e-06, 'epoch': 1.6} {'loss': 0.3386, 'learning_rate': 2.0606581461993547e-06, 'epoch': 1.6} {'loss': 0.2936, 'learning_rate': 2.060453875020729e-06, 'epoch': 1.6} {'loss': 0.2435, 'learning_rate': 2.0602496128043393e-06, 'epoch': 1.6} {'loss': 0.3133, 'learning_rate': 2.060045359550421e-06, 'epoch': 1.6} {'loss': 0.4195, 'learning_rate': 2.059841115259198e-06, 'epoch': 1.6} {'loss': 0.4257, 'learning_rate': 2.0596368799309076e-06, 'epoch': 1.6} {'loss': 0.327, 'learning_rate': 2.059432653565775e-06, 'epoch': 1.6} {'loss': 0.103, 'learning_rate': 2.0592284361640346e-06, 'epoch': 1.6} {'loss': 0.3045, 'learning_rate': 2.059024227725913e-06, 'epoch': 1.6} {'loss': 0.3605, 'learning_rate': 2.058820028251647e-06, 'epoch': 1.6} {'loss': 0.357, 'learning_rate': 2.058615837741461e-06, 'epoch': 1.6} {'loss': 0.3196, 'learning_rate': 2.058411656195586e-06, 'epoch': 1.6} {'loss': 0.3281, 'learning_rate': 2.058207483614256e-06, 'epoch': 1.6} {'loss': 0.2972, 'learning_rate': 2.058003319997698e-06, 'epoch': 1.6} {'loss': 0.3215, 'learning_rate': 2.057799165346146e-06, 'epoch': 1.6} {'loss': 0.2593, 'learning_rate': 2.0575950196598258e-06, 'epoch': 1.6} {'loss': 0.3923, 'learning_rate': 2.0573908829389743e-06, 'epoch': 1.6} {'loss': 0.4342, 'learning_rate': 2.057186755183814e-06, 'epoch': 1.6} {'loss': 0.3696, 'learning_rate': 2.056982636394583e-06, 'epoch': 1.6} {'loss': 0.4357, 'learning_rate': 2.0567785265715047e-06, 'epoch': 1.6} {'loss': 0.3214, 'learning_rate': 2.056574425714817e-06, 'epoch': 1.6} {'loss': 0.2816, 'learning_rate': 2.056370333824742e-06, 'epoch': 1.6} {'loss': 0.3498, 'learning_rate': 2.056166250901518e-06, 'epoch': 1.6} {'loss': 0.2942, 'learning_rate': 2.055962176945371e-06, 'epoch': 1.6} {'loss': 0.2705, 'learning_rate': 2.0557581119565307e-06, 'epoch': 1.6} {'loss': 0.3163, 'learning_rate': 2.0555540559352304e-06, 'epoch': 1.6} {'loss': 0.2196, 'learning_rate': 2.055350008881696e-06, 'epoch': 1.6} {'loss': 0.2085, 'learning_rate': 2.055145970796164e-06, 'epoch': 1.6} {'loss': 0.3275, 'learning_rate': 2.0549419416788584e-06, 'epoch': 1.6} {'loss': 0.1788, 'learning_rate': 2.0547379215300154e-06, 'epoch': 1.6} {'loss': 0.1885, 'learning_rate': 2.0545339103498597e-06, 'epoch': 1.6} {'loss': 0.2601, 'learning_rate': 2.054329908138627e-06, 'epoch': 1.6} {'loss': 0.3962, 'learning_rate': 2.054125914896542e-06, 'epoch': 1.6} {'loss': 0.3071, 'learning_rate': 2.053921930623841e-06, 'epoch': 1.6} {'loss': 0.2759, 'learning_rate': 2.0537179553207476e-06, 'epoch': 1.6} {'loss': 0.2562, 'learning_rate': 2.0535139889874988e-06, 'epoch': 1.6} {'loss': 0.4444, 'learning_rate': 2.0533100316243217e-06, 'epoch': 1.6} {'loss': 0.2764, 'learning_rate': 2.053106083231444e-06, 'epoch': 1.6} {'loss': 0.3931, 'learning_rate': 2.0529021438091012e-06, 'epoch': 1.6} {'loss': 0.2837, 'learning_rate': 2.052698213357517e-06, 'epoch': 1.6} {'loss': 0.3431, 'learning_rate': 2.0524942918769285e-06, 'epoch': 1.6} {'loss': 0.3216, 'learning_rate': 2.0522903793675595e-06, 'epoch': 1.6} {'loss': 0.2459, 'learning_rate': 2.0520864758296467e-06, 'epoch': 1.6} {'loss': 0.4142, 'learning_rate': 2.0518825812634146e-06, 'epoch': 1.6} {'loss': 0.3241, 'learning_rate': 2.0516786956690973e-06, 'epoch': 1.6} {'loss': 0.1985, 'learning_rate': 2.0514748190469214e-06, 'epoch': 1.6} {'loss': 0.4036, 'learning_rate': 2.0512709513971207e-06, 'epoch': 1.6} {'loss': 0.3336, 'learning_rate': 2.0510670927199215e-06, 'epoch': 1.6} {'loss': 0.3724, 'learning_rate': 2.050863243015556e-06, 'epoch': 1.6} {'loss': 0.5999, 'learning_rate': 2.0506594022842575e-06, 'epoch': 1.6} {'loss': 0.2274, 'learning_rate': 2.05045557052625e-06, 'epoch': 1.6} {'loss': 0.3201, 'learning_rate': 2.0502517477417684e-06, 'epoch': 1.6} {'loss': 0.4132, 'learning_rate': 2.0500479339310387e-06, 'epoch': 1.6} {'loss': 0.3067, 'learning_rate': 2.049844129094295e-06, 'epoch': 1.6} {'loss': 0.3734, 'learning_rate': 2.049640333231764e-06, 'epoch': 1.6} {'loss': 0.3192, 'learning_rate': 2.0494365463436794e-06, 'epoch': 1.6} {'loss': 0.339, 'learning_rate': 2.049232768430269e-06, 'epoch': 1.6} {'loss': 0.4041, 'learning_rate': 2.04902899949176e-06, 'epoch': 1.6} {'loss': 0.1742, 'learning_rate': 2.0488252395283893e-06, 'epoch': 1.6} {'loss': 0.27, 'learning_rate': 2.048621488540379e-06, 'epoch': 1.6} {'loss': 0.2752, 'learning_rate': 2.0484177465279666e-06, 'epoch': 1.6} {'loss': 0.2639, 'learning_rate': 2.048214013491374e-06, 'epoch': 1.6} {'loss': 0.4348, 'learning_rate': 2.0480102894308396e-06, 'epoch': 1.6} {'loss': 0.3285, 'learning_rate': 2.047806574346587e-06, 'epoch': 1.6} {'loss': 0.3551, 'learning_rate': 2.0476028682388518e-06, 'epoch': 1.6} {'loss': 0.3616, 'learning_rate': 2.0473991711078567e-06, 'epoch': 1.6} {'loss': 0.2986, 'learning_rate': 2.0471954829538387e-06, 'epoch': 1.6} {'loss': 0.357, 'learning_rate': 2.046991803777022e-06, 'epoch': 1.6} {'loss': 0.4312, 'learning_rate': 2.046788133577643e-06, 'epoch': 1.6} {'loss': 0.3376, 'learning_rate': 2.046584472355927e-06, 'epoch': 1.6} {'loss': 0.3127, 'learning_rate': 2.0463808201121017e-06, 'epoch': 1.6} {'loss': 0.2372, 'learning_rate': 2.046177176846402e-06, 'epoch': 1.6} {'loss': 0.3414, 'learning_rate': 2.0459735425590544e-06, 'epoch': 1.6} {'loss': 0.3034, 'learning_rate': 2.045769917250293e-06, 'epoch': 1.6} {'loss': 0.2585, 'learning_rate': 2.045566300920342e-06, 'epoch': 1.6} {'loss': 0.4111, 'learning_rate': 2.045362693569436e-06, 'epoch': 1.6} {'loss': 0.3439, 'learning_rate': 2.0451590951978007e-06, 'epoch': 1.6} {'loss': 0.4421, 'learning_rate': 2.0449555058056704e-06, 'epoch': 1.6} {'loss': 0.3088, 'learning_rate': 2.04475192539327e-06, 'epoch': 1.6} {'loss': 0.19, 'learning_rate': 2.044548353960835e-06, 'epoch': 1.6} {'loss': 0.302, 'learning_rate': 2.044344791508589e-06, 'epoch': 1.6} {'loss': 0.4129, 'learning_rate': 2.0441412380367675e-06, 'epoch': 1.6} {'loss': 0.2695, 'learning_rate': 2.043937693545598e-06, 'epoch': 1.6} {'loss': 0.2451, 'learning_rate': 2.0437341580353078e-06, 'epoch': 1.6} {'loss': 0.3118, 'learning_rate': 2.043530631506131e-06, 'epoch': 1.6} {'loss': 0.3485, 'learning_rate': 2.0433271139582924e-06, 'epoch': 1.6} {'loss': 0.3276, 'learning_rate': 2.0431236053920267e-06, 'epoch': 1.6} {'loss': 0.3487, 'learning_rate': 2.0429201058075586e-06, 'epoch': 1.6} {'loss': 0.4111, 'learning_rate': 2.0427166152051236e-06, 'epoch': 1.6} {'loss': 0.2503, 'learning_rate': 2.0425131335849457e-06, 'epoch': 1.6} {'loss': 0.461, 'learning_rate': 2.0423096609472605e-06, 'epoch': 1.6} {'loss': 0.2986, 'learning_rate': 2.0421061972922906e-06, 'epoch': 1.6} {'loss': 0.4687, 'learning_rate': 2.041902742620273e-06, 'epoch': 1.6} {'loss': 0.3006, 'learning_rate': 2.041699296931432e-06, 'epoch': 1.6} {'loss': 0.1936, 'learning_rate': 2.0414958602260003e-06, 'epoch': 1.6} {'loss': 0.4211, 'learning_rate': 2.0412924325042073e-06, 'epoch': 1.6} {'loss': 0.2812, 'learning_rate': 2.0410890137662786e-06, 'epoch': 1.6} {'loss': 0.3519, 'learning_rate': 2.0408856040124502e-06, 'epoch': 1.6} {'loss': 0.4061, 'learning_rate': 2.040682203242946e-06, 'epoch': 1.6} {'loss': 0.3595, 'learning_rate': 2.0404788114579997e-06, 'epoch': 1.6} {'loss': 0.1937, 'learning_rate': 2.0402754286578375e-06, 'epoch': 1.6} {'loss': 0.2559, 'learning_rate': 2.0400720548426934e-06, 'epoch': 1.6} {'loss': 0.3214, 'learning_rate': 2.0398686900127905e-06, 'epoch': 1.6} {'loss': 0.3921, 'learning_rate': 2.039665334168366e-06, 'epoch': 1.6} {'loss': 0.4391, 'learning_rate': 2.039461987309642e-06, 'epoch': 1.6} {'loss': 0.3264, 'learning_rate': 2.039258649436855e-06, 'epoch': 1.6} {'loss': 0.3654, 'learning_rate': 2.039055320550228e-06, 'epoch': 1.6} {'loss': 0.3332, 'learning_rate': 2.0388520006499966e-06, 'epoch': 1.6} {'loss': 0.398, 'learning_rate': 2.0386486897363877e-06, 'epoch': 1.6} {'loss': 0.1743, 'learning_rate': 2.038445387809628e-06, 'epoch': 1.6} {'loss': 0.3619, 'learning_rate': 2.0382420948699522e-06, 'epoch': 1.6} {'loss': 0.428, 'learning_rate': 2.038038810917583e-06, 'epoch': 1.6} {'loss': 0.3973, 'learning_rate': 2.037835535952758e-06, 'epoch': 1.6} {'loss': 0.2413, 'learning_rate': 2.0376322699757e-06, 'epoch': 1.6} {'loss': 0.4449, 'learning_rate': 2.0374290129866426e-06, 'epoch': 1.6} {'loss': 0.2914, 'learning_rate': 2.0372257649858117e-06, 'epoch': 1.6} {'loss': 0.3548, 'learning_rate': 2.037022525973442e-06, 'epoch': 1.6} {'loss': 0.3314, 'learning_rate': 2.036819295949757e-06, 'epoch': 1.6} {'loss': 0.2885, 'learning_rate': 2.0366160749149897e-06, 'epoch': 1.6} {'loss': 0.2696, 'learning_rate': 2.036412862869367e-06, 'epoch': 1.6} {'loss': 0.3519, 'learning_rate': 2.0362096598131233e-06, 'epoch': 1.6} {'loss': 0.276, 'learning_rate': 2.0360064657464805e-06, 'epoch': 1.6} {'loss': 0.3247, 'learning_rate': 2.035803280669675e-06, 'epoch': 1.6} {'loss': 0.2512, 'learning_rate': 2.035600104582933e-06, 'epoch': 1.6} {'loss': 0.2782, 'learning_rate': 2.035396937486482e-06, 'epoch': 1.6} {'loss': 0.289, 'learning_rate': 2.0351937793805554e-06, 'epoch': 1.6} {'loss': 0.3297, 'learning_rate': 2.0349906302653776e-06, 'epoch': 1.6} {'loss': 0.2517, 'learning_rate': 2.0347874901411844e-06, 'epoch': 1.6} {'loss': 0.3985, 'learning_rate': 2.034584359008198e-06, 'epoch': 1.6} {'loss': 0.2728, 'learning_rate': 2.0343812368666537e-06, 'epoch': 1.6} {'loss': 0.2977, 'learning_rate': 2.034178123716777e-06, 'epoch': 1.6} {'loss': 0.2907, 'learning_rate': 2.033975019558799e-06, 'epoch': 1.6} {'loss': 0.3635, 'learning_rate': 2.0337719243929476e-06, 'epoch': 1.6} {'loss': 0.3001, 'learning_rate': 2.033568838219454e-06, 'epoch': 1.6} {'loss': 0.2707, 'learning_rate': 2.0333657610385447e-06, 'epoch': 1.6} {'loss': 0.31, 'learning_rate': 2.033162692850452e-06, 'epoch': 1.6} {'loss': 0.2318, 'learning_rate': 2.0329596336554047e-06, 'epoch': 1.6} {'loss': 0.3216, 'learning_rate': 2.032756583453629e-06, 'epoch': 1.6} {'loss': 0.2665, 'learning_rate': 2.0325535422453567e-06, 'epoch': 1.6} {'loss': 0.3287, 'learning_rate': 2.032350510030815e-06, 'epoch': 1.6} {'loss': 0.2668, 'learning_rate': 2.0321474868102375e-06, 'epoch': 1.6} {'loss': 0.2293, 'learning_rate': 2.0319444725838466e-06, 'epoch': 1.6} {'loss': 0.385, 'learning_rate': 2.031741467351879e-06, 'epoch': 1.6} {'loss': 0.2857, 'learning_rate': 2.031538471114556e-06, 'epoch': 1.6} {'loss': 0.2431, 'learning_rate': 2.0313354838721144e-06, 'epoch': 1.6} {'loss': 0.231, 'learning_rate': 2.0311325056247766e-06, 'epoch': 1.6} {'loss': 0.2386, 'learning_rate': 2.0309295363727753e-06, 'epoch': 1.6} {'loss': 0.3394, 'learning_rate': 2.030726576116342e-06, 'epoch': 1.6} {'loss': 0.3143, 'learning_rate': 2.0305236248556994e-06, 'epoch': 1.6} {'loss': 0.413, 'learning_rate': 2.030320682591084e-06, 'epoch': 1.6} {'loss': 0.3741, 'learning_rate': 2.0301177493227176e-06, 'epoch': 1.6} {'loss': 0.3095, 'learning_rate': 2.029914825050835e-06, 'epoch': 1.6} {'loss': 0.4281, 'learning_rate': 2.0297119097756612e-06, 'epoch': 1.6} {'loss': 0.2103, 'learning_rate': 2.02950900349743e-06, 'epoch': 1.6} {'loss': 0.4245, 'learning_rate': 2.0293061062163633e-06, 'epoch': 1.6} {'loss': 0.3473, 'learning_rate': 2.0291032179326975e-06, 'epoch': 1.6} {'loss': 0.3827, 'learning_rate': 2.0289003386466588e-06, 'epoch': 1.6} {'loss': 0.2971, 'learning_rate': 2.0286974683584735e-06, 'epoch': 1.6} {'loss': 0.4557, 'learning_rate': 2.028494607068375e-06, 'epoch': 1.6} {'loss': 0.3944, 'learning_rate': 2.028291754776588e-06, 'epoch': 1.6} {'loss': 0.3003, 'learning_rate': 2.0280889114833456e-06, 'epoch': 1.6} {'loss': 0.4523, 'learning_rate': 2.027886077188873e-06, 'epoch': 1.6} {'loss': 0.2448, 'learning_rate': 2.027683251893404e-06, 'epoch': 1.6} {'loss': 0.4439, 'learning_rate': 2.027480435597161e-06, 'epoch': 1.6} {'loss': 0.328, 'learning_rate': 2.02727762830038e-06, 'epoch': 1.6} {'loss': 0.4094, 'learning_rate': 2.027074830003284e-06, 'epoch': 1.6} {'loss': 0.3775, 'learning_rate': 2.026872040706106e-06, 'epoch': 1.6} {'loss': 0.3092, 'learning_rate': 2.026669260409071e-06, 'epoch': 1.6} {'loss': 0.3018, 'learning_rate': 2.026466489112413e-06, 'epoch': 1.6} {'loss': 0.2553, 'learning_rate': 2.026263726816359e-06, 'epoch': 1.6} {'loss': 0.4751, 'learning_rate': 2.0260609735211334e-06, 'epoch': 1.6} {'loss': 0.2765, 'learning_rate': 2.0258582292269713e-06, 'epoch': 1.6} {'loss': 0.4653, 'learning_rate': 2.0256554939340954e-06, 'epoch': 1.6} {'loss': 0.1701, 'learning_rate': 2.025452767642743e-06, 'epoch': 1.6} {'loss': 0.3246, 'learning_rate': 2.0252500503531337e-06, 'epoch': 1.6} {'loss': 0.2434, 'learning_rate': 2.0250473420655024e-06, 'epoch': 1.6} {'loss': 0.4326, 'learning_rate': 2.024844642780075e-06, 'epoch': 1.6} {'loss': 0.3061, 'learning_rate': 2.024641952497084e-06, 'epoch': 1.6} {'loss': 0.3757, 'learning_rate': 2.0244392712167527e-06, 'epoch': 1.6} {'loss': 0.3379, 'learning_rate': 2.0242365989393155e-06, 'epoch': 1.6} {'loss': 0.4225, 'learning_rate': 2.0240339356649962e-06, 'epoch': 1.6} {'loss': 0.4904, 'learning_rate': 2.0238312813940286e-06, 'epoch': 1.6} {'loss': 0.3223, 'learning_rate': 2.023628636126638e-06, 'epoch': 1.6} {'loss': 0.4143, 'learning_rate': 2.023425999863051e-06, 'epoch': 1.6} {'loss': 0.4817, 'learning_rate': 2.0232233726035034e-06, 'epoch': 1.6} {'loss': 0.3461, 'learning_rate': 2.023020754348216e-06, 'epoch': 1.6} {'loss': 0.2906, 'learning_rate': 2.0228181450974236e-06, 'epoch': 1.6} {'loss': 0.4746, 'learning_rate': 2.0226155448513507e-06, 'epoch': 1.6} {'loss': 0.3763, 'learning_rate': 2.022412953610231e-06, 'epoch': 1.6} {'loss': 0.2612, 'learning_rate': 2.022210371374287e-06, 'epoch': 1.6} {'loss': 0.3316, 'learning_rate': 2.0220077981437525e-06, 'epoch': 1.6} {'loss': 0.4547, 'learning_rate': 2.021805233918852e-06, 'epoch': 1.6} {'loss': 0.224, 'learning_rate': 2.0216026786998186e-06, 'epoch': 1.6} {'loss': 0.1821, 'learning_rate': 2.021400132486876e-06, 'epoch': 1.6} {'loss': 0.3888, 'learning_rate': 2.0211975952802575e-06, 'epoch': 1.6} {'loss': 0.235, 'learning_rate': 2.0209950670801914e-06, 'epoch': 1.6} {'loss': 0.2259, 'learning_rate': 2.0207925478869006e-06, 'epoch': 1.6} {'loss': 0.4029, 'learning_rate': 2.0205900377006203e-06, 'epoch': 1.6} {'loss': 0.4202, 'learning_rate': 2.0203875365215744e-06, 'epoch': 1.6} {'loss': 0.3329, 'learning_rate': 2.020185044349996e-06, 'epoch': 1.6} {'loss': 0.2325, 'learning_rate': 2.019982561186109e-06, 'epoch': 1.6} {'loss': 0.3409, 'learning_rate': 2.0197800870301463e-06, 'epoch': 1.6} {'loss': 0.179, 'learning_rate': 2.0195776218823315e-06, 'epoch': 1.6} {'loss': 0.2865, 'learning_rate': 2.0193751657428997e-06, 'epoch': 1.6} {'loss': 0.2259, 'learning_rate': 2.0191727186120724e-06, 'epoch': 1.6} {'loss': 0.2701, 'learning_rate': 2.0189702804900834e-06, 'epoch': 1.6} {'loss': 0.2719, 'learning_rate': 2.018767851377158e-06, 'epoch': 1.6} {'loss': 0.3097, 'learning_rate': 2.0185654312735282e-06, 'epoch': 1.6} {'loss': 0.3054, 'learning_rate': 2.0183630201794203e-06, 'epoch': 1.6} {'loss': 0.3257, 'learning_rate': 2.0181606180950596e-06, 'epoch': 1.6} {'loss': 0.287, 'learning_rate': 2.0179582250206807e-06, 'epoch': 1.6} {'loss': 0.3618, 'learning_rate': 2.0177558409565067e-06, 'epoch': 1.6} {'loss': 0.1465, 'learning_rate': 2.0175534659027707e-06, 'epoch': 1.6} {'loss': 0.2418, 'learning_rate': 2.0173510998596966e-06, 'epoch': 1.6} {'loss': 0.1593, 'learning_rate': 2.0171487428275183e-06, 'epoch': 1.6} {'loss': 0.4255, 'learning_rate': 2.016946394806457e-06, 'epoch': 1.6} {'loss': 0.3262, 'learning_rate': 2.0167440557967488e-06, 'epoch': 1.6} {'loss': 0.3334, 'learning_rate': 2.0165417257986163e-06, 'epoch': 1.6} {'loss': 0.3189, 'learning_rate': 2.0163394048122918e-06, 'epoch': 1.6} {'loss': 0.3997, 'learning_rate': 2.0161370928379997e-06, 'epoch': 1.6} {'loss': 0.4542, 'learning_rate': 2.015934789875973e-06, 'epoch': 1.6} {'loss': 0.369, 'learning_rate': 2.015732495926438e-06, 'epoch': 1.6} {'loss': 0.2574, 'learning_rate': 2.01553021098962e-06, 'epoch': 1.6} {'loss': 0.3434, 'learning_rate': 2.015327935065753e-06, 'epoch': 1.6} {'loss': 0.2347, 'learning_rate': 2.015125668155059e-06, 'epoch': 1.6} {'loss': 0.3451, 'learning_rate': 2.014923410257773e-06, 'epoch': 1.6} {'loss': 0.248, 'learning_rate': 2.014721161374117e-06, 'epoch': 1.6} {'loss': 0.2948, 'learning_rate': 2.014518921504325e-06, 'epoch': 1.6} {'loss': 0.3169, 'learning_rate': 2.01431669064862e-06, 'epoch': 1.6} {'loss': 0.3668, 'learning_rate': 2.0141144688072354e-06, 'epoch': 1.6} {'loss': 0.3617, 'learning_rate': 2.013912255980395e-06, 'epoch': 1.6} {'loss': 0.2427, 'learning_rate': 2.0137100521683316e-06, 'epoch': 1.6} {'loss': 0.3958, 'learning_rate': 2.0135078573712676e-06, 'epoch': 1.6} {'loss': 0.2477, 'learning_rate': 2.0133056715894373e-06, 'epoch': 1.6} {'loss': 0.3071, 'learning_rate': 2.0131034948230666e-06, 'epoch': 1.6} {'loss': 0.3644, 'learning_rate': 2.0129013270723807e-06, 'epoch': 1.6} {'loss': 0.4079, 'learning_rate': 2.012699168337613e-06, 'epoch': 1.6} {'loss': 0.3166, 'learning_rate': 2.0124970186189865e-06, 'epoch': 1.6} {'loss': 0.2304, 'learning_rate': 2.0122948779167337e-06, 'epoch': 1.6} {'loss': 0.4677, 'learning_rate': 2.012092746231079e-06, 'epoch': 1.6} {'loss': 0.2619, 'learning_rate': 2.0118906235622547e-06, 'epoch': 1.6} {'loss': 0.247, 'learning_rate': 2.0116885099104853e-06, 'epoch': 1.6} {'loss': 0.2636, 'learning_rate': 2.011486405276003e-06, 'epoch': 1.6} {'loss': 0.2596, 'learning_rate': 2.0112843096590304e-06, 'epoch': 1.6} {'loss': 0.2475, 'learning_rate': 2.0110822230598015e-06, 'epoch': 1.6} {'loss': 0.4527, 'learning_rate': 2.010880145478539e-06, 'epoch': 1.6} {'loss': 0.3029, 'learning_rate': 2.0106780769154734e-06, 'epoch': 1.6} {'loss': 0.336, 'learning_rate': 2.010476017370836e-06, 'epoch': 1.6} {'loss': 0.372, 'learning_rate': 2.010273966844849e-06, 'epoch': 1.6} {'loss': 0.3781, 'learning_rate': 2.0100719253377452e-06, 'epoch': 1.6} {'loss': 0.3179, 'learning_rate': 2.0098698928497495e-06, 'epoch': 1.6} {'loss': 0.1839, 'learning_rate': 2.0096678693810935e-06, 'epoch': 1.6} {'loss': 0.3877, 'learning_rate': 2.009465854932e-06, 'epoch': 1.6} {'loss': 0.3689, 'learning_rate': 2.009263849502704e-06, 'epoch': 1.6} {'loss': 0.1903, 'learning_rate': 2.009061853093426e-06, 'epoch': 1.6} {'loss': 0.3785, 'learning_rate': 2.0088598657044e-06, 'epoch': 1.6} {'loss': 0.1624, 'learning_rate': 2.008657887335852e-06, 'epoch': 1.6} {'loss': 0.2245, 'learning_rate': 2.008455917988007e-06, 'epoch': 1.6} {'loss': 0.3715, 'learning_rate': 2.0082539576610983e-06, 'epoch': 1.6} {'loss': 0.3359, 'learning_rate': 2.0080520063553477e-06, 'epoch': 1.6} {'loss': 0.3035, 'learning_rate': 2.0078500640709907e-06, 'epoch': 1.6} {'loss': 0.3419, 'learning_rate': 2.0076481308082473e-06, 'epoch': 1.6} {'loss': 0.383, 'learning_rate': 2.007446206567353e-06, 'epoch': 1.6} {'loss': 0.3699, 'learning_rate': 2.007244291348529e-06, 'epoch': 1.6} {'loss': 0.2552, 'learning_rate': 2.0070423851520093e-06, 'epoch': 1.6} {'loss': 0.2745, 'learning_rate': 2.0068404879780156e-06, 'epoch': 1.6} {'loss': 0.3088, 'learning_rate': 2.006638599826781e-06, 'epoch': 1.6} {'loss': 0.248, 'learning_rate': 2.00643672069853e-06, 'epoch': 1.6} {'loss': 0.3933, 'learning_rate': 2.0062348505934948e-06, 'epoch': 1.6} {'loss': 0.38, 'learning_rate': 2.006032989511899e-06, 'epoch': 1.6} {'loss': 0.4372, 'learning_rate': 2.005831137453971e-06, 'epoch': 1.6} {'loss': 0.22, 'learning_rate': 2.005629294419941e-06, 'epoch': 1.6} {'loss': 0.3414, 'learning_rate': 2.005427460410032e-06, 'epoch': 1.6} {'loss': 0.4742, 'learning_rate': 2.0052256354244793e-06, 'epoch': 1.6} {'loss': 0.373, 'learning_rate': 2.005023819463503e-06, 'epoch': 1.6} {'loss': 0.334, 'learning_rate': 2.0048220125273365e-06, 'epoch': 1.6} {'loss': 0.2463, 'learning_rate': 2.0046202146162043e-06, 'epoch': 1.6} {'loss': 0.17, 'learning_rate': 2.0044184257303377e-06, 'epoch': 1.6} {'loss': 0.3911, 'learning_rate': 2.0042166458699595e-06, 'epoch': 1.6} {'loss': 0.1832, 'learning_rate': 2.0040148750353027e-06, 'epoch': 1.6} {'loss': 0.2886, 'learning_rate': 2.0038131132265904e-06, 'epoch': 1.6} {'loss': 0.2668, 'learning_rate': 2.0036113604440556e-06, 'epoch': 1.6} {'loss': 0.4324, 'learning_rate': 2.0034096166879215e-06, 'epoch': 1.6} {'loss': 0.3994, 'learning_rate': 2.0032078819584155e-06, 'epoch': 1.6} {'loss': 0.2084, 'learning_rate': 2.00300615625577e-06, 'epoch': 1.6} {'loss': 0.2978, 'learning_rate': 2.0028044395802072e-06, 'epoch': 1.6} {'loss': 0.2806, 'learning_rate': 2.00260273193196e-06, 'epoch': 1.6} {'loss': 0.3993, 'learning_rate': 2.002401033311251e-06, 'epoch': 1.6} {'loss': 0.327, 'learning_rate': 2.002199343718313e-06, 'epoch': 1.6} {'loss': 0.2403, 'learning_rate': 2.0019976631533678e-06, 'epoch': 1.6} {'loss': 0.4339, 'learning_rate': 2.0017959916166497e-06, 'epoch': 1.6} {'loss': 0.2746, 'learning_rate': 2.0015943291083805e-06, 'epoch': 1.6} {'loss': 0.3351, 'learning_rate': 2.0013926756287926e-06, 'epoch': 1.6} {'loss': 0.3328, 'learning_rate': 2.001191031178109e-06, 'epoch': 1.6} {'loss': 0.3161, 'learning_rate': 2.000989395756562e-06, 'epoch': 1.6} {'loss': 0.2698, 'learning_rate': 2.000787769364376e-06, 'epoch': 1.6} {'loss': 0.2672, 'learning_rate': 2.000586152001779e-06, 'epoch': 1.6} {'loss': 0.3637, 'learning_rate': 2.0003845436690005e-06, 'epoch': 1.6} {'loss': 0.2996, 'learning_rate': 2.0001829443662633e-06, 'epoch': 1.6} {'loss': 0.257, 'learning_rate': 1.999981354093802e-06, 'epoch': 1.6} {'loss': 0.2389, 'learning_rate': 1.9997797728518375e-06, 'epoch': 1.6} {'loss': 0.1087, 'learning_rate': 1.999578200640603e-06, 'epoch': 1.6} {'loss': 0.3538, 'learning_rate': 1.9993766374603206e-06, 'epoch': 1.6} {'loss': 0.2574, 'learning_rate': 1.9991750833112234e-06, 'epoch': 1.6} {'loss': 0.3785, 'learning_rate': 1.9989735381935337e-06, 'epoch': 1.6} {'loss': 0.2262, 'learning_rate': 1.998772002107484e-06, 'epoch': 1.6} {'loss': 0.2034, 'learning_rate': 1.9985704750532965e-06, 'epoch': 1.6} {'loss': 0.4047, 'learning_rate': 1.9983689570312036e-06, 'epoch': 1.6} {'loss': 0.3417, 'learning_rate': 1.9981674480414316e-06, 'epoch': 1.6} {'loss': 0.1699, 'learning_rate': 1.997965948084203e-06, 'epoch': 1.6} {'loss': 0.4374, 'learning_rate': 1.997764457159752e-06, 'epoch': 1.6} {'loss': 0.348, 'learning_rate': 1.9975629752683013e-06, 'epoch': 1.6} {'loss': 0.3595, 'learning_rate': 1.997361502410082e-06, 'epoch': 1.6} {'loss': 0.3566, 'learning_rate': 1.9971600385853186e-06, 'epoch': 1.6} {'loss': 0.2856, 'learning_rate': 1.996958583794242e-06, 'epoch': 1.6} {'loss': 0.2588, 'learning_rate': 1.996757138037073e-06, 'epoch': 1.6} {'loss': 0.3619, 'learning_rate': 1.996555701314048e-06, 'epoch': 1.6} {'loss': 0.332, 'learning_rate': 1.996354273625386e-06, 'epoch': 1.6} {'loss': 0.2988, 'learning_rate': 1.9961528549713205e-06, 'epoch': 1.6} {'loss': 0.3018, 'learning_rate': 1.9959514453520747e-06, 'epoch': 1.6} {'loss': 0.3849, 'learning_rate': 1.995750044767879e-06, 'epoch': 1.6} {'loss': 0.2017, 'learning_rate': 1.9955486532189605e-06, 'epoch': 1.6} {'loss': 0.2521, 'learning_rate': 1.995347270705542e-06, 'epoch': 1.6} {'loss': 0.256, 'learning_rate': 1.995145897227858e-06, 'epoch': 1.6} {'loss': 0.2388, 'learning_rate': 1.9949445327861282e-06, 'epoch': 1.6} {'loss': 0.2774, 'learning_rate': 1.994743177380588e-06, 'epoch': 1.6} {'loss': 0.3557, 'learning_rate': 1.994541831011456e-06, 'epoch': 1.6} {'loss': 0.2402, 'learning_rate': 1.994340493678968e-06, 'epoch': 1.6} {'loss': 0.3604, 'learning_rate': 1.994139165383344e-06, 'epoch': 1.6} {'loss': 0.371, 'learning_rate': 1.993937846124817e-06, 'epoch': 1.6} {'loss': 0.238, 'learning_rate': 1.99373653590361e-06, 'epoch': 1.6} {'loss': 0.2792, 'learning_rate': 1.9935352347199545e-06, 'epoch': 1.6} {'loss': 0.1777, 'learning_rate': 1.9933339425740716e-06, 'epoch': 1.6} {'loss': 0.3987, 'learning_rate': 1.9931326594661947e-06, 'epoch': 1.6} {'loss': 0.355, 'learning_rate': 1.9929313853965493e-06, 'epoch': 1.6} {'loss': 0.2887, 'learning_rate': 1.992730120365359e-06, 'epoch': 1.6} {'loss': 0.3135, 'learning_rate': 1.9925288643728568e-06, 'epoch': 1.6} {'loss': 0.2928, 'learning_rate': 1.9923276174192628e-06, 'epoch': 1.6} {'loss': 0.2203, 'learning_rate': 1.9921263795048118e-06, 'epoch': 1.6} {'loss': 0.2533, 'learning_rate': 1.9919251506297244e-06, 'epoch': 1.6} {'loss': 0.2915, 'learning_rate': 1.9917239307942337e-06, 'epoch': 1.6} {'loss': 0.233, 'learning_rate': 1.991522719998561e-06, 'epoch': 1.6} {'loss': 0.3409, 'learning_rate': 1.991321518242939e-06, 'epoch': 1.6} {'loss': 0.2239, 'learning_rate': 1.991120325527589e-06, 'epoch': 1.6} {'loss': 0.2248, 'learning_rate': 1.9909191418527417e-06, 'epoch': 1.6} {'loss': 0.3488, 'learning_rate': 1.990717967218626e-06, 'epoch': 1.6} {'loss': 0.3198, 'learning_rate': 1.990516801625465e-06, 'epoch': 1.6} {'loss': 0.2871, 'learning_rate': 1.9903156450734883e-06, 'epoch': 1.6} {'loss': 0.3427, 'learning_rate': 1.9901144975629218e-06, 'epoch': 1.6} {'loss': 0.238, 'learning_rate': 1.9899133590939936e-06, 'epoch': 1.6} {'loss': 0.3999, 'learning_rate': 1.989712229666928e-06, 'epoch': 1.6} {'loss': 0.2765, 'learning_rate': 1.9895111092819562e-06, 'epoch': 1.6} {'loss': 0.3176, 'learning_rate': 1.9893099979393014e-06, 'epoch': 1.6} {'loss': 0.2836, 'learning_rate': 1.9891088956391947e-06, 'epoch': 1.6} {'loss': 0.2903, 'learning_rate': 1.988907802381861e-06, 'epoch': 1.6} {'loss': 0.4663, 'learning_rate': 1.9887067181675233e-06, 'epoch': 1.6} {'loss': 0.1833, 'learning_rate': 1.9885056429964157e-06, 'epoch': 1.6} {'loss': 0.3051, 'learning_rate': 1.988304576868759e-06, 'epoch': 1.6} {'loss': 0.3219, 'learning_rate': 1.988103519784785e-06, 'epoch': 1.6} {'loss': 0.3831, 'learning_rate': 1.987902471744717e-06, 'epoch': 1.6} {'loss': 0.343, 'learning_rate': 1.9877014327487853e-06, 'epoch': 1.6} {'loss': 0.3726, 'learning_rate': 1.9875004027972134e-06, 'epoch': 1.6} {'loss': 0.3535, 'learning_rate': 1.987299381890232e-06, 'epoch': 1.6} {'loss': 0.3018, 'learning_rate': 1.9870983700280633e-06, 'epoch': 1.6} {'loss': 0.393, 'learning_rate': 1.9868973672109394e-06, 'epoch': 1.6} {'loss': 0.22, 'learning_rate': 1.986696373439081e-06, 'epoch': 1.6} {'loss': 0.3997, 'learning_rate': 1.9864953887127225e-06, 'epoch': 1.6} {'loss': 0.1714, 'learning_rate': 1.986294413032087e-06, 'epoch': 1.6} {'loss': 0.2648, 'learning_rate': 1.986093446397398e-06, 'epoch': 1.6} {'loss': 0.4163, 'learning_rate': 1.9858924888088883e-06, 'epoch': 1.6} {'loss': 0.3034, 'learning_rate': 1.98569154026678e-06, 'epoch': 1.6} {'loss': 0.2128, 'learning_rate': 1.9854906007713036e-06, 'epoch': 1.6} {'loss': 0.231, 'learning_rate': 1.985289670322682e-06, 'epoch': 1.6} {'loss': 0.2222, 'learning_rate': 1.9850887489211467e-06, 'epoch': 1.6} {'loss': 0.1804, 'learning_rate': 1.98488783656692e-06, 'epoch': 1.6} {'loss': 0.2938, 'learning_rate': 1.9846869332602337e-06, 'epoch': 1.6} {'loss': 0.3357, 'learning_rate': 1.9844860390013075e-06, 'epoch': 1.6} {'loss': 0.3866, 'learning_rate': 1.9842851537903762e-06, 'epoch': 1.6} {'loss': 0.1884, 'learning_rate': 1.98408427762766e-06, 'epoch': 1.6} {'loss': 0.2574, 'learning_rate': 1.983883410513391e-06, 'epoch': 1.6} {'loss': 0.2582, 'learning_rate': 1.9836825524477933e-06, 'epoch': 1.6} {'loss': 0.4953, 'learning_rate': 1.9834817034310914e-06, 'epoch': 1.6} {'loss': 0.2141, 'learning_rate': 1.9832808634635158e-06, 'epoch': 1.6} {'loss': 0.3557, 'learning_rate': 1.9830800325452903e-06, 'epoch': 1.6} {'loss': 0.3952, 'learning_rate': 1.982879210676645e-06, 'epoch': 1.6} {'loss': 0.3996, 'learning_rate': 1.9826783978578012e-06, 'epoch': 1.6} {'loss': 0.2924, 'learning_rate': 1.9824775940889917e-06, 'epoch': 1.6} {'loss': 0.3273, 'learning_rate': 1.9822767993704383e-06, 'epoch': 1.6} {'loss': 0.3515, 'learning_rate': 1.982076013702373e-06, 'epoch': 1.6} {'loss': 0.2569, 'learning_rate': 1.9818752370850157e-06, 'epoch': 1.6} {'loss': 0.3869, 'learning_rate': 1.9816744695185998e-06, 'epoch': 1.6} {'loss': 0.2963, 'learning_rate': 1.9814737110033445e-06, 'epoch': 1.6} {'loss': 0.5193, 'learning_rate': 1.9812729615394842e-06, 'epoch': 1.6} {'loss': 0.3923, 'learning_rate': 1.9810722211272425e-06, 'epoch': 1.61} {'loss': 0.3774, 'learning_rate': 1.9808714897668424e-06, 'epoch': 1.61} {'loss': 0.1798, 'learning_rate': 1.9806707674585158e-06, 'epoch': 1.61} {'loss': 0.4578, 'learning_rate': 1.9804700542024844e-06, 'epoch': 1.61} {'loss': 0.3367, 'learning_rate': 1.98026934999898e-06, 'epoch': 1.61} {'loss': 0.2067, 'learning_rate': 1.9800686548482238e-06, 'epoch': 1.61} {'loss': 0.2592, 'learning_rate': 1.9798679687504485e-06, 'epoch': 1.61} {'loss': 0.302, 'learning_rate': 1.9796672917058735e-06, 'epoch': 1.61} {'loss': 0.4306, 'learning_rate': 1.979466623714732e-06, 'epoch': 1.61} {'loss': 0.4688, 'learning_rate': 1.979265964777245e-06, 'epoch': 1.61} {'loss': 0.3967, 'learning_rate': 1.9790653148936435e-06, 'epoch': 1.61} {'loss': 0.2864, 'learning_rate': 1.9788646740641494e-06, 'epoch': 1.61} {'loss': 0.4557, 'learning_rate': 1.9786640422889945e-06, 'epoch': 1.61} {'loss': 0.4024, 'learning_rate': 1.9784634195684004e-06, 'epoch': 1.61} {'loss': 0.3716, 'learning_rate': 1.978262805902599e-06, 'epoch': 1.61} {'loss': 0.5672, 'learning_rate': 1.9780622012918128e-06, 'epoch': 1.61} {'loss': 0.2581, 'learning_rate': 1.9778616057362666e-06, 'epoch': 1.61} {'loss': 0.2906, 'learning_rate': 1.977661019236191e-06, 'epoch': 1.61} {'loss': 0.4247, 'learning_rate': 1.9774604417918086e-06, 'epoch': 1.61} {'loss': 0.3466, 'learning_rate': 1.97725987340335e-06, 'epoch': 1.61} {'loss': 0.2806, 'learning_rate': 1.977059314071037e-06, 'epoch': 1.61} {'loss': 0.3247, 'learning_rate': 1.976858763795101e-06, 'epoch': 1.61} {'loss': 0.2139, 'learning_rate': 1.9766582225757634e-06, 'epoch': 1.61} {'loss': 0.3739, 'learning_rate': 1.9764576904132548e-06, 'epoch': 1.61} {'loss': 0.3257, 'learning_rate': 1.976257167307798e-06, 'epoch': 1.61} {'loss': 0.3836, 'learning_rate': 1.976056653259624e-06, 'epoch': 1.61} {'loss': 0.4098, 'learning_rate': 1.975856148268952e-06, 'epoch': 1.61} {'loss': 0.2528, 'learning_rate': 1.975655652336016e-06, 'epoch': 1.61} {'loss': 0.2432, 'learning_rate': 1.97545516546104e-06, 'epoch': 1.61} {'loss': 0.3313, 'learning_rate': 1.975254687644245e-06, 'epoch': 1.61} {'loss': 0.2529, 'learning_rate': 1.9750542188858644e-06, 'epoch': 1.61} {'loss': 0.2573, 'learning_rate': 1.9748537591861194e-06, 'epoch': 1.61} {'loss': 0.3055, 'learning_rate': 1.9746533085452414e-06, 'epoch': 1.61} {'loss': 0.3408, 'learning_rate': 1.97445286696345e-06, 'epoch': 1.61} {'loss': 0.3055, 'learning_rate': 1.9742524344409784e-06, 'epoch': 1.61} {'loss': 0.3727, 'learning_rate': 1.974052010978047e-06, 'epoch': 1.61} {'loss': 0.2776, 'learning_rate': 1.9738515965748872e-06, 'epoch': 1.61} {'loss': 0.3232, 'learning_rate': 1.97365119123172e-06, 'epoch': 1.61} {'loss': 0.2018, 'learning_rate': 1.973450794948778e-06, 'epoch': 1.61} {'loss': 0.3054, 'learning_rate': 1.9732504077262804e-06, 'epoch': 1.61} {'loss': 0.3481, 'learning_rate': 1.973050029564458e-06, 'epoch': 1.61} {'loss': 0.4042, 'learning_rate': 1.9728496604635372e-06, 'epoch': 1.61} {'loss': 0.3994, 'learning_rate': 1.97264930042374e-06, 'epoch': 1.61} {'loss': 0.2725, 'learning_rate': 1.972448949445298e-06, 'epoch': 1.61} {'loss': 0.1549, 'learning_rate': 1.972248607528432e-06, 'epoch': 1.61} {'loss': 0.4481, 'learning_rate': 1.9720482746733725e-06, 'epoch': 1.61} {'loss': 0.4362, 'learning_rate': 1.9718479508803425e-06, 'epoch': 1.61} {'loss': 0.308, 'learning_rate': 1.971647636149572e-06, 'epoch': 1.61} {'loss': 0.335, 'learning_rate': 1.971447330481281e-06, 'epoch': 1.61} {'loss': 0.1446, 'learning_rate': 1.971247033875703e-06, 'epoch': 1.61} {'loss': 0.3108, 'learning_rate': 1.971046746333056e-06, 'epoch': 1.61} {'loss': 0.3086, 'learning_rate': 1.970846467853572e-06, 'epoch': 1.61} {'loss': 0.1367, 'learning_rate': 1.970646198437478e-06, 'epoch': 1.61} {'loss': 0.3569, 'learning_rate': 1.970445938084995e-06, 'epoch': 1.61} {'loss': 0.2837, 'learning_rate': 1.970245686796354e-06, 'epoch': 1.61} {'loss': 0.2586, 'learning_rate': 1.9700454445717763e-06, 'epoch': 1.61} {'loss': 0.3015, 'learning_rate': 1.969845211411493e-06, 'epoch': 1.61} {'loss': 0.3847, 'learning_rate': 1.9696449873157243e-06, 'epoch': 1.61} {'loss': 0.5069, 'learning_rate': 1.969444772284702e-06, 'epoch': 1.61} {'loss': 0.3499, 'learning_rate': 1.9692445663186477e-06, 'epoch': 1.61} {'loss': 0.1496, 'learning_rate': 1.9690443694177906e-06, 'epoch': 1.61} {'loss': 0.3057, 'learning_rate': 1.9688441815823557e-06, 'epoch': 1.61} {'loss': 0.3569, 'learning_rate': 1.9686440028125666e-06, 'epoch': 1.61} {'loss': 0.2284, 'learning_rate': 1.968443833108653e-06, 'epoch': 1.61} {'loss': 0.4048, 'learning_rate': 1.9682436724708365e-06, 'epoch': 1.61} {'loss': 0.3288, 'learning_rate': 1.9680435208993486e-06, 'epoch': 1.61} {'loss': 0.3065, 'learning_rate': 1.9678433783944095e-06, 'epoch': 1.61} {'loss': 0.2583, 'learning_rate': 1.96764324495625e-06, 'epoch': 1.61} {'loss': 0.2879, 'learning_rate': 1.967443120585092e-06, 'epoch': 1.61} {'loss': 0.1983, 'learning_rate': 1.9672430052811654e-06, 'epoch': 1.61} {'loss': 0.2267, 'learning_rate': 1.967042899044691e-06, 'epoch': 1.61} {'loss': 0.3267, 'learning_rate': 1.966842801875901e-06, 'epoch': 1.61} {'loss': 0.2837, 'learning_rate': 1.9666427137750154e-06, 'epoch': 1.61} {'loss': 0.2503, 'learning_rate': 1.966442634742265e-06, 'epoch': 1.61} {'loss': 0.3157, 'learning_rate': 1.966242564777873e-06, 'epoch': 1.61} {'loss': 0.3127, 'learning_rate': 1.966042503882062e-06, 'epoch': 1.61} {'loss': 0.2167, 'learning_rate': 1.9658424520550645e-06, 'epoch': 1.61} {'loss': 0.3031, 'learning_rate': 1.9656424092971018e-06, 'epoch': 1.61} {'loss': 0.321, 'learning_rate': 1.9654423756084017e-06, 'epoch': 1.61} {'loss': 0.2422, 'learning_rate': 1.965242350989187e-06, 'epoch': 1.61} {'loss': 0.3681, 'learning_rate': 1.96504233543969e-06, 'epoch': 1.61} {'loss': 0.3886, 'learning_rate': 1.964842328960128e-06, 'epoch': 1.61} {'loss': 0.3495, 'learning_rate': 1.9646423315507346e-06, 'epoch': 1.61} {'loss': 0.2069, 'learning_rate': 1.9644423432117288e-06, 'epoch': 1.61} {'loss': 0.2203, 'learning_rate': 1.964242363943343e-06, 'epoch': 1.61} {'loss': 0.2409, 'learning_rate': 1.9640423937457953e-06, 'epoch': 1.61} {'loss': 0.2905, 'learning_rate': 1.9638424326193195e-06, 'epoch': 1.61} {'loss': 0.3562, 'learning_rate': 1.9636424805641376e-06, 'epoch': 1.61} {'loss': 0.2696, 'learning_rate': 1.9634425375804723e-06, 'epoch': 1.61} {'loss': 0.3263, 'learning_rate': 1.963242603668555e-06, 'epoch': 1.61} {'loss': 0.2657, 'learning_rate': 1.963042678828605e-06, 'epoch': 1.61} {'loss': 0.3537, 'learning_rate': 1.962842763060855e-06, 'epoch': 1.61} {'loss': 0.184, 'learning_rate': 1.962642856365524e-06, 'epoch': 1.61} {'loss': 0.2584, 'learning_rate': 1.962442958742844e-06, 'epoch': 1.61} {'loss': 0.3939, 'learning_rate': 1.962243070193034e-06, 'epoch': 1.61} {'loss': 0.2371, 'learning_rate': 1.9620431907163262e-06, 'epoch': 1.61} {'loss': 0.3374, 'learning_rate': 1.961843320312942e-06, 'epoch': 1.61} {'loss': 0.2522, 'learning_rate': 1.961643458983109e-06, 'epoch': 1.61} {'loss': 0.3463, 'learning_rate': 1.9614436067270494e-06, 'epoch': 1.61} {'loss': 0.1939, 'learning_rate': 1.9612437635449945e-06, 'epoch': 1.61} {'loss': 0.3886, 'learning_rate': 1.9610439294371664e-06, 'epoch': 1.61} {'loss': 0.329, 'learning_rate': 1.9608441044037885e-06, 'epoch': 1.61} {'loss': 0.3347, 'learning_rate': 1.9606442884450917e-06, 'epoch': 1.61} {'loss': 0.2873, 'learning_rate': 1.9604444815612968e-06, 'epoch': 1.61} {'loss': 0.2983, 'learning_rate': 1.9602446837526323e-06, 'epoch': 1.61} {'loss': 0.3475, 'learning_rate': 1.960044895019322e-06, 'epoch': 1.61} {'loss': 0.1948, 'learning_rate': 1.9598451153615926e-06, 'epoch': 1.61} {'loss': 0.3425, 'learning_rate': 1.959645344779668e-06, 'epoch': 1.61} {'loss': 0.4624, 'learning_rate': 1.959445583273778e-06, 'epoch': 1.61} {'loss': 0.2458, 'learning_rate': 1.959245830844141e-06, 'epoch': 1.61} {'loss': 0.2577, 'learning_rate': 1.95904608749099e-06, 'epoch': 1.61} {'loss': 0.389, 'learning_rate': 1.958846353214543e-06, 'epoch': 1.61} {'loss': 0.3933, 'learning_rate': 1.958646628015033e-06, 'epoch': 1.61} {'loss': 0.267, 'learning_rate': 1.958446911892682e-06, 'epoch': 1.61} {'loss': 0.361, 'learning_rate': 1.9582472048477117e-06, 'epoch': 1.61} {'loss': 0.2273, 'learning_rate': 1.958047506880355e-06, 'epoch': 1.61} {'loss': 0.3192, 'learning_rate': 1.95784781799083e-06, 'epoch': 1.61} {'loss': 0.3751, 'learning_rate': 1.957648138179369e-06, 'epoch': 1.61} {'loss': 0.3642, 'learning_rate': 1.95744846744619e-06, 'epoch': 1.61} {'loss': 0.1645, 'learning_rate': 1.957248805791525e-06, 'epoch': 1.61} {'loss': 0.4517, 'learning_rate': 1.9570491532155957e-06, 'epoch': 1.61} {'loss': 0.3261, 'learning_rate': 1.956849509718629e-06, 'epoch': 1.61} {'loss': 0.4069, 'learning_rate': 1.956649875300849e-06, 'epoch': 1.61} {'loss': 0.1676, 'learning_rate': 1.9564502499624828e-06, 'epoch': 1.61} {'loss': 0.2769, 'learning_rate': 1.9562506337037533e-06, 'epoch': 1.61} {'loss': 0.4652, 'learning_rate': 1.9560510265248888e-06, 'epoch': 1.61} {'loss': 0.2786, 'learning_rate': 1.9558514284261145e-06, 'epoch': 1.61} {'loss': 0.3628, 'learning_rate': 1.9556518394076508e-06, 'epoch': 1.61} {'loss': 0.3475, 'learning_rate': 1.9554522594697288e-06, 'epoch': 1.61} {'loss': 0.3205, 'learning_rate': 1.9552526886125688e-06, 'epoch': 1.61} {'loss': 0.3336, 'learning_rate': 1.9550531268364016e-06, 'epoch': 1.61} {'loss': 0.403, 'learning_rate': 1.9548535741414478e-06, 'epoch': 1.61} {'loss': 0.2986, 'learning_rate': 1.954654030527936e-06, 'epoch': 1.61} {'loss': 0.2447, 'learning_rate': 1.9544544959960878e-06, 'epoch': 1.61} {'loss': 0.3128, 'learning_rate': 1.954254970546132e-06, 'epoch': 1.61} {'loss': 0.3826, 'learning_rate': 1.9540554541782907e-06, 'epoch': 1.61} {'loss': 0.4696, 'learning_rate': 1.953855946892794e-06, 'epoch': 1.61} {'loss': 0.4057, 'learning_rate': 1.95365644868986e-06, 'epoch': 1.61} {'loss': 0.3342, 'learning_rate': 1.953456959569722e-06, 'epoch': 1.61} {'loss': 0.3043, 'learning_rate': 1.9532574795326e-06, 'epoch': 1.61} {'loss': 0.2904, 'learning_rate': 1.9530580085787176e-06, 'epoch': 1.61} {'loss': 0.2286, 'learning_rate': 1.952858546708305e-06, 'epoch': 1.61} {'loss': 0.1518, 'learning_rate': 1.952659093921583e-06, 'epoch': 1.61} {'loss': 0.2801, 'learning_rate': 1.9524596502187796e-06, 'epoch': 1.61} {'loss': 0.2892, 'learning_rate': 1.952260215600118e-06, 'epoch': 1.61} {'loss': 0.414, 'learning_rate': 1.952060790065826e-06, 'epoch': 1.61} {'loss': 0.2475, 'learning_rate': 1.9518613736161253e-06, 'epoch': 1.61} {'loss': 0.4038, 'learning_rate': 1.9516619662512437e-06, 'epoch': 1.61} {'loss': 0.4411, 'learning_rate': 1.9514625679714038e-06, 'epoch': 1.61} {'loss': 0.3105, 'learning_rate': 1.951263178776834e-06, 'epoch': 1.61} {'loss': 0.4541, 'learning_rate': 1.951063798667756e-06, 'epoch': 1.61} {'loss': 0.2631, 'learning_rate': 1.9508644276443956e-06, 'epoch': 1.61} {'loss': 0.2998, 'learning_rate': 1.9506650657069816e-06, 'epoch': 1.61} {'loss': 0.2169, 'learning_rate': 1.9504657128557336e-06, 'epoch': 1.61} {'loss': 0.2533, 'learning_rate': 1.950266369090882e-06, 'epoch': 1.61} {'loss': 0.2425, 'learning_rate': 1.950067034412645e-06, 'epoch': 1.61} {'loss': 0.2512, 'learning_rate': 1.949867708821256e-06, 'epoch': 1.61} {'loss': 0.4123, 'learning_rate': 1.949668392316931e-06, 'epoch': 1.61} {'loss': 0.3339, 'learning_rate': 1.9494690848999033e-06, 'epoch': 1.61} {'loss': 0.3776, 'learning_rate': 1.949269786570391e-06, 'epoch': 1.61} {'loss': 0.3638, 'learning_rate': 1.9490704973286256e-06, 'epoch': 1.61} {'loss': 0.2868, 'learning_rate': 1.948871217174828e-06, 'epoch': 1.61} {'loss': 0.2868, 'learning_rate': 1.9486719461092217e-06, 'epoch': 1.61} {'loss': 0.1563, 'learning_rate': 1.9484726841320356e-06, 'epoch': 1.61} {'loss': 0.2464, 'learning_rate': 1.9482734312434914e-06, 'epoch': 1.61} {'loss': 0.2982, 'learning_rate': 1.948074187443817e-06, 'epoch': 1.61} {'loss': 0.2516, 'learning_rate': 1.947874952733233e-06, 'epoch': 1.61} {'loss': 0.1882, 'learning_rate': 1.9476757271119707e-06, 'epoch': 1.61} {'loss': 0.226, 'learning_rate': 1.9474765105802473e-06, 'epoch': 1.61} {'loss': 0.295, 'learning_rate': 1.9472773031382954e-06, 'epoch': 1.61} {'loss': 0.3486, 'learning_rate': 1.9470781047863318e-06, 'epoch': 1.61} {'loss': 0.3411, 'learning_rate': 1.9468789155245906e-06, 'epoch': 1.61} {'loss': 0.3032, 'learning_rate': 1.9466797353532875e-06, 'epoch': 1.61} {'loss': 0.2753, 'learning_rate': 1.946480564272655e-06, 'epoch': 1.61} {'loss': 0.3067, 'learning_rate': 1.9462814022829136e-06, 'epoch': 1.61} {'loss': 0.3983, 'learning_rate': 1.9460822493842868e-06, 'epoch': 1.61} {'loss': 0.4092, 'learning_rate': 1.9458831055770042e-06, 'epoch': 1.61} {'loss': 0.3049, 'learning_rate': 1.9456839708612863e-06, 'epoch': 1.61} {'loss': 0.2864, 'learning_rate': 1.945484845237361e-06, 'epoch': 1.61} {'loss': 0.2946, 'learning_rate': 1.9452857287054494e-06, 'epoch': 1.61} {'loss': 0.2773, 'learning_rate': 1.9450866212657814e-06, 'epoch': 1.61} {'loss': 0.295, 'learning_rate': 1.9448875229185772e-06, 'epoch': 1.61} {'loss': 0.3075, 'learning_rate': 1.9446884336640637e-06, 'epoch': 1.61} {'loss': 0.2994, 'learning_rate': 1.9444893535024646e-06, 'epoch': 1.61} {'loss': 0.337, 'learning_rate': 1.944290282434006e-06, 'epoch': 1.61} {'loss': 0.3092, 'learning_rate': 1.9440912204589102e-06, 'epoch': 1.61} {'loss': 0.261, 'learning_rate': 1.943892167577407e-06, 'epoch': 1.61} {'loss': 0.2849, 'learning_rate': 1.943693123789716e-06, 'epoch': 1.61} {'loss': 0.3754, 'learning_rate': 1.9434940890960617e-06, 'epoch': 1.61} {'loss': 0.4324, 'learning_rate': 1.943295063496673e-06, 'epoch': 1.61} {'loss': 0.2204, 'learning_rate': 1.943096046991769e-06, 'epoch': 1.61} {'loss': 0.2253, 'learning_rate': 1.9428970395815805e-06, 'epoch': 1.61} {'loss': 0.447, 'learning_rate': 1.9426980412663267e-06, 'epoch': 1.61} {'loss': 0.2909, 'learning_rate': 1.9424990520462374e-06, 'epoch': 1.61} {'loss': 0.2073, 'learning_rate': 1.942300071921531e-06, 'epoch': 1.61} {'loss': 0.339, 'learning_rate': 1.9421011008924396e-06, 'epoch': 1.61} {'loss': 0.3876, 'learning_rate': 1.9419021389591796e-06, 'epoch': 1.61} {'loss': 0.2713, 'learning_rate': 1.9417031861219836e-06, 'epoch': 1.61} {'loss': 0.3155, 'learning_rate': 1.9415042423810694e-06, 'epoch': 1.61} {'loss': 0.4165, 'learning_rate': 1.9413053077366673e-06, 'epoch': 1.61} {'loss': 0.3408, 'learning_rate': 1.9411063821889985e-06, 'epoch': 1.61} {'loss': 0.4043, 'learning_rate': 1.9409074657382856e-06, 'epoch': 1.61} {'loss': 0.2348, 'learning_rate': 1.9407085583847586e-06, 'epoch': 1.61} {'loss': 0.5091, 'learning_rate': 1.9405096601286366e-06, 'epoch': 1.61} {'loss': 0.2528, 'learning_rate': 1.9403107709701485e-06, 'epoch': 1.61} {'loss': 0.4206, 'learning_rate': 1.940111890909515e-06, 'epoch': 1.61} {'loss': 0.2039, 'learning_rate': 1.939913019946965e-06, 'epoch': 1.61} {'loss': 0.3701, 'learning_rate': 1.939714158082717e-06, 'epoch': 1.61} {'loss': 0.3439, 'learning_rate': 1.9395153053170022e-06, 'epoch': 1.61} {'loss': 0.2887, 'learning_rate': 1.9393164616500403e-06, 'epoch': 1.61} {'loss': 0.3337, 'learning_rate': 1.9391176270820587e-06, 'epoch': 1.61} {'loss': 0.3067, 'learning_rate': 1.9389188016132786e-06, 'epoch': 1.61} {'loss': 0.2585, 'learning_rate': 1.9387199852439274e-06, 'epoch': 1.61} {'loss': 0.4136, 'learning_rate': 1.9385211779742296e-06, 'epoch': 1.61} {'loss': 0.4053, 'learning_rate': 1.938322379804406e-06, 'epoch': 1.61} {'loss': 0.2532, 'learning_rate': 1.9381235907346862e-06, 'epoch': 1.61} {'loss': 0.272, 'learning_rate': 1.937924810765288e-06, 'epoch': 1.61} {'loss': 0.3367, 'learning_rate': 1.9377260398964436e-06, 'epoch': 1.61} {'loss': 0.3201, 'learning_rate': 1.9375272781283705e-06, 'epoch': 1.61} {'loss': 0.318, 'learning_rate': 1.9373285254612985e-06, 'epoch': 1.61} {'loss': 0.2487, 'learning_rate': 1.937129781895446e-06, 'epoch': 1.61} {'loss': 0.2969, 'learning_rate': 1.9369310474310433e-06, 'epoch': 1.61} {'loss': 0.3695, 'learning_rate': 1.936732322068311e-06, 'epoch': 1.61} {'loss': 0.2886, 'learning_rate': 1.936533605807476e-06, 'epoch': 1.61} {'loss': 0.4003, 'learning_rate': 1.9363348986487584e-06, 'epoch': 1.61} {'loss': 0.2876, 'learning_rate': 1.936136200592389e-06, 'epoch': 1.61} {'loss': 0.4208, 'learning_rate': 1.935937511638588e-06, 'epoch': 1.61} {'loss': 0.2491, 'learning_rate': 1.935738831787577e-06, 'epoch': 1.61} {'loss': 0.3093, 'learning_rate': 1.9355401610395876e-06, 'epoch': 1.61} {'loss': 0.4171, 'learning_rate': 1.935341499394835e-06, 'epoch': 1.61} {'loss': 0.318, 'learning_rate': 1.9351428468535527e-06, 'epoch': 1.61} {'loss': 0.3001, 'learning_rate': 1.934944203415957e-06, 'epoch': 1.61} {'loss': 0.3196, 'learning_rate': 1.934745569082278e-06, 'epoch': 1.61} {'loss': 0.2989, 'learning_rate': 1.934546943852735e-06, 'epoch': 1.61} {'loss': 0.3522, 'learning_rate': 1.9343483277275576e-06, 'epoch': 1.61} {'loss': 0.3035, 'learning_rate': 1.934149720706965e-06, 'epoch': 1.61} {'loss': 0.3221, 'learning_rate': 1.9339511227911868e-06, 'epoch': 1.61} {'loss': 0.2723, 'learning_rate': 1.93375253398044e-06, 'epoch': 1.61} {'loss': 0.5058, 'learning_rate': 1.933553954274956e-06, 'epoch': 1.61} {'loss': 0.1708, 'learning_rate': 1.9333553836749553e-06, 'epoch': 1.61} {'loss': 0.3213, 'learning_rate': 1.9331568221806597e-06, 'epoch': 1.61} {'loss': 0.2994, 'learning_rate': 1.932958269792299e-06, 'epoch': 1.61} {'loss': 0.2787, 'learning_rate': 1.932759726510092e-06, 'epoch': 1.61} {'loss': 0.3151, 'learning_rate': 1.932561192334268e-06, 'epoch': 1.61} {'loss': 0.2256, 'learning_rate': 1.9323626672650444e-06, 'epoch': 1.61} {'loss': 0.4019, 'learning_rate': 1.9321641513026533e-06, 'epoch': 1.61} {'loss': 0.4136, 'learning_rate': 1.931965644447311e-06, 'epoch': 1.61} {'loss': 0.1893, 'learning_rate': 1.931767146699248e-06, 'epoch': 1.61} {'loss': 0.281, 'learning_rate': 1.9315686580586844e-06, 'epoch': 1.61} {'loss': 0.2589, 'learning_rate': 1.9313701785258443e-06, 'epoch': 1.61} {'loss': 0.2984, 'learning_rate': 1.931171708100955e-06, 'epoch': 1.61} {'loss': 0.2936, 'learning_rate': 1.930973246784237e-06, 'epoch': 1.61} {'loss': 0.2335, 'learning_rate': 1.930774794575918e-06, 'epoch': 1.61} {'loss': 0.195, 'learning_rate': 1.9305763514762177e-06, 'epoch': 1.61} {'loss': 0.2506, 'learning_rate': 1.9303779174853643e-06, 'epoch': 1.61} {'loss': 0.2556, 'learning_rate': 1.9301794926035778e-06, 'epoch': 1.61} {'loss': 0.2851, 'learning_rate': 1.9299810768310856e-06, 'epoch': 1.61} {'loss': 0.1573, 'learning_rate': 1.929782670168108e-06, 'epoch': 1.61} {'loss': 0.2041, 'learning_rate': 1.9295842726148737e-06, 'epoch': 1.61} {'loss': 0.4968, 'learning_rate': 1.9293858841716052e-06, 'epoch': 1.61} {'loss': 0.2688, 'learning_rate': 1.929187504838521e-06, 'epoch': 1.61} {'loss': 0.3888, 'learning_rate': 1.928989134615853e-06, 'epoch': 1.61} {'loss': 0.2853, 'learning_rate': 1.928790773503819e-06, 'epoch': 1.61} {'loss': 0.1829, 'learning_rate': 1.9285924215026475e-06, 'epoch': 1.61} {'loss': 0.448, 'learning_rate': 1.9283940786125577e-06, 'epoch': 1.61} {'loss': 0.2744, 'learning_rate': 1.9281957448337797e-06, 'epoch': 1.61} {'loss': 0.2735, 'learning_rate': 1.9279974201665296e-06, 'epoch': 1.61} {'loss': 0.2438, 'learning_rate': 1.927799104611039e-06, 'epoch': 1.61} {'loss': 0.3088, 'learning_rate': 1.927600798167525e-06, 'epoch': 1.61} {'loss': 0.155, 'learning_rate': 1.9274025008362186e-06, 'epoch': 1.61} {'loss': 0.2912, 'learning_rate': 1.9272042126173362e-06, 'epoch': 1.61} {'loss': 0.2008, 'learning_rate': 1.927005933511107e-06, 'epoch': 1.61} {'loss': 0.2078, 'learning_rate': 1.9268076635177534e-06, 'epoch': 1.61} {'loss': 0.1766, 'learning_rate': 1.9266094026374972e-06, 'epoch': 1.61} {'loss': 0.1612, 'learning_rate': 1.926411150870565e-06, 'epoch': 1.61} {'loss': 0.3012, 'learning_rate': 1.9262129082171777e-06, 'epoch': 1.61} {'loss': 0.3322, 'learning_rate': 1.926014674677563e-06, 'epoch': 1.61} {'loss': 0.3112, 'learning_rate': 1.9258164502519394e-06, 'epoch': 1.61} {'loss': 0.2251, 'learning_rate': 1.925618234940537e-06, 'epoch': 1.61} {'loss': 0.2862, 'learning_rate': 1.925420028743573e-06, 'epoch': 1.61} {'loss': 0.317, 'learning_rate': 1.925221831661277e-06, 'epoch': 1.61} {'loss': 0.3041, 'learning_rate': 1.9250236436938675e-06, 'epoch': 1.61} {'loss': 0.3454, 'learning_rate': 1.9248254648415745e-06, 'epoch': 1.61} {'loss': 0.2883, 'learning_rate': 1.9246272951046143e-06, 'epoch': 1.61} {'loss': 0.1829, 'learning_rate': 1.924429134483217e-06, 'epoch': 1.61} {'loss': 0.2835, 'learning_rate': 1.9242309829776006e-06, 'epoch': 1.61} {'loss': 0.2986, 'learning_rate': 1.924032840587995e-06, 'epoch': 1.61} {'loss': 0.4376, 'learning_rate': 1.92383470731462e-06, 'epoch': 1.61} {'loss': 0.3459, 'learning_rate': 1.9236365831576976e-06, 'epoch': 1.61} {'loss': 0.2333, 'learning_rate': 1.923438468117456e-06, 'epoch': 1.61} {'loss': 0.3346, 'learning_rate': 1.9232403621941143e-06, 'epoch': 1.61} {'loss': 0.2453, 'learning_rate': 1.9230422653879012e-06, 'epoch': 1.61} {'loss': 0.3142, 'learning_rate': 1.9228441776990335e-06, 'epoch': 1.61} {'loss': 0.3366, 'learning_rate': 1.922646099127743e-06, 'epoch': 1.61} {'loss': 0.2697, 'learning_rate': 1.9224480296742455e-06, 'epoch': 1.61} {'loss': 0.3364, 'learning_rate': 1.922249969338772e-06, 'epoch': 1.61} {'loss': 0.4556, 'learning_rate': 1.922051918121538e-06, 'epoch': 1.61} {'loss': 0.252, 'learning_rate': 1.9218538760227743e-06, 'epoch': 1.61} {'loss': 0.2171, 'learning_rate': 1.9216558430427e-06, 'epoch': 1.61} {'loss': 0.4175, 'learning_rate': 1.9214578191815413e-06, 'epoch': 1.61} {'loss': 0.2999, 'learning_rate': 1.9212598044395216e-06, 'epoch': 1.61} {'loss': 0.3386, 'learning_rate': 1.92106179881686e-06, 'epoch': 1.61} {'loss': 0.4261, 'learning_rate': 1.920863802313786e-06, 'epoch': 1.61} {'loss': 0.2062, 'learning_rate': 1.9206658149305177e-06, 'epoch': 1.61} {'loss': 0.4131, 'learning_rate': 1.920467836667285e-06, 'epoch': 1.61} {'loss': 0.3537, 'learning_rate': 1.9202698675243046e-06, 'epoch': 1.61} {'loss': 0.3975, 'learning_rate': 1.9200719075018047e-06, 'epoch': 1.61} {'loss': 0.4066, 'learning_rate': 1.919873956600006e-06, 'epoch': 1.61} {'loss': 0.4814, 'learning_rate': 1.919676014819135e-06, 'epoch': 1.61} {'loss': 0.3616, 'learning_rate': 1.9194780821594107e-06, 'epoch': 1.61} {'loss': 0.4216, 'learning_rate': 1.9192801586210617e-06, 'epoch': 1.61} {'loss': 0.3888, 'learning_rate': 1.9190822442043056e-06, 'epoch': 1.61} {'loss': 0.2239, 'learning_rate': 1.9188843389093726e-06, 'epoch': 1.61} {'loss': 0.2562, 'learning_rate': 1.9186864427364817e-06, 'epoch': 1.61} {'loss': 0.3809, 'learning_rate': 1.9184885556858545e-06, 'epoch': 1.61} {'loss': 0.2996, 'learning_rate': 1.9182906777577204e-06, 'epoch': 1.61} {'loss': 0.2419, 'learning_rate': 1.9180928089522963e-06, 'epoch': 1.61} {'loss': 0.3429, 'learning_rate': 1.9178949492698106e-06, 'epoch': 1.61} {'loss': 0.363, 'learning_rate': 1.9176970987104825e-06, 'epoch': 1.61} {'loss': 0.2525, 'learning_rate': 1.91749925727454e-06, 'epoch': 1.61} {'loss': 0.3645, 'learning_rate': 1.9173014249622014e-06, 'epoch': 1.61} {'loss': 0.2841, 'learning_rate': 1.9171036017736944e-06, 'epoch': 1.61} {'loss': 0.3302, 'learning_rate': 1.916905787709239e-06, 'epoch': 1.61} {'loss': 0.1785, 'learning_rate': 1.9167079827690616e-06, 'epoch': 1.61} {'loss': 0.2461, 'learning_rate': 1.916510186953382e-06, 'epoch': 1.61} {'loss': 0.3551, 'learning_rate': 1.9163124002624268e-06, 'epoch': 1.61} {'loss': 0.3147, 'learning_rate': 1.916114622696418e-06, 'epoch': 1.61} {'loss': 0.2282, 'learning_rate': 1.915916854255576e-06, 'epoch': 1.61} {'loss': 0.3927, 'learning_rate': 1.9157190949401292e-06, 'epoch': 1.61} {'loss': 0.3218, 'learning_rate': 1.9155213447502963e-06, 'epoch': 1.61} {'loss': 0.3266, 'learning_rate': 1.9153236036863045e-06, 'epoch': 1.61} {'loss': 0.1862, 'learning_rate': 1.9151258717483723e-06, 'epoch': 1.61} {'loss': 0.2636, 'learning_rate': 1.9149281489367288e-06, 'epoch': 1.61} {'loss': 0.2656, 'learning_rate': 1.9147304352515904e-06, 'epoch': 1.61} {'loss': 0.4086, 'learning_rate': 1.914532730693187e-06, 'epoch': 1.61} {'loss': 0.1908, 'learning_rate': 1.9143350352617363e-06, 'epoch': 1.61} {'loss': 0.4531, 'learning_rate': 1.9141373489574665e-06, 'epoch': 1.61} {'loss': 0.1722, 'learning_rate': 1.9139396717805947e-06, 'epoch': 1.61} {'loss': 0.2764, 'learning_rate': 1.9137420037313503e-06, 'epoch': 1.61} {'loss': 0.4126, 'learning_rate': 1.913544344809953e-06, 'epoch': 1.61} {'loss': 0.4133, 'learning_rate': 1.9133466950166248e-06, 'epoch': 1.61} {'loss': 0.2602, 'learning_rate': 1.913149054351593e-06, 'epoch': 1.61} {'loss': 0.2722, 'learning_rate': 1.9129514228150747e-06, 'epoch': 1.61} {'loss': 0.3519, 'learning_rate': 1.9127538004073e-06, 'epoch': 1.61} {'loss': 0.3627, 'learning_rate': 1.912556187128485e-06, 'epoch': 1.61} {'loss': 0.2906, 'learning_rate': 1.9123585829788584e-06, 'epoch': 1.61} {'loss': 0.3098, 'learning_rate': 1.912160987958639e-06, 'epoch': 1.61} {'loss': 0.2614, 'learning_rate': 1.9119634020680545e-06, 'epoch': 1.61} {'loss': 0.2261, 'learning_rate': 1.9117658253073235e-06, 'epoch': 1.61} {'loss': 0.4782, 'learning_rate': 1.911568257676669e-06, 'epoch': 1.61} {'loss': 0.17, 'learning_rate': 1.9113706991763202e-06, 'epoch': 1.61} {'loss': 0.2606, 'learning_rate': 1.911173149806492e-06, 'epoch': 1.61} {'loss': 0.3365, 'learning_rate': 1.9109756095674146e-06, 'epoch': 1.61} {'loss': 0.4288, 'learning_rate': 1.9107780784593043e-06, 'epoch': 1.61} {'loss': 0.2612, 'learning_rate': 1.9105805564823897e-06, 'epoch': 1.61} {'loss': 0.3633, 'learning_rate': 1.91038304363689e-06, 'epoch': 1.61} {'loss': 0.4137, 'learning_rate': 1.9101855399230305e-06, 'epoch': 1.61} {'loss': 0.2165, 'learning_rate': 1.9099880453410325e-06, 'epoch': 1.61} {'loss': 0.2455, 'learning_rate': 1.9097905598911202e-06, 'epoch': 1.61} {'loss': 0.3934, 'learning_rate': 1.909593083573518e-06, 'epoch': 1.61} {'loss': 0.3118, 'learning_rate': 1.9093956163884418e-06, 'epoch': 1.61} {'loss': 0.207, 'learning_rate': 1.909198158336124e-06, 'epoch': 1.61} {'loss': 0.2998, 'learning_rate': 1.9090007094167794e-06, 'epoch': 1.61} {'loss': 0.1959, 'learning_rate': 1.908803269630637e-06, 'epoch': 1.61} {'loss': 0.3092, 'learning_rate': 1.908605838977915e-06, 'epoch': 1.61} {'loss': 0.3769, 'learning_rate': 1.90840841745884e-06, 'epoch': 1.61} {'loss': 0.3957, 'learning_rate': 1.9082110050736324e-06, 'epoch': 1.61} {'loss': 0.395, 'learning_rate': 1.908013601822517e-06, 'epoch': 1.61} {'loss': 0.2575, 'learning_rate': 1.907816207705713e-06, 'epoch': 1.61} {'loss': 0.1533, 'learning_rate': 1.9076188227234483e-06, 'epoch': 1.61} {'loss': 0.2732, 'learning_rate': 1.907421446875941e-06, 'epoch': 1.61} {'loss': 0.2006, 'learning_rate': 1.907224080163419e-06, 'epoch': 1.61} {'loss': 0.3461, 'learning_rate': 1.9070267225861005e-06, 'epoch': 1.61} {'loss': 0.3404, 'learning_rate': 1.906829374144209e-06, 'epoch': 1.61} {'loss': 0.3759, 'learning_rate': 1.9066320348379697e-06, 'epoch': 1.61} {'loss': 0.2587, 'learning_rate': 1.9064347046676013e-06, 'epoch': 1.61} {'loss': 0.3202, 'learning_rate': 1.9062373836333325e-06, 'epoch': 1.61} {'loss': 0.3515, 'learning_rate': 1.9060400717353788e-06, 'epoch': 1.61} {'loss': 0.3759, 'learning_rate': 1.90584276897397e-06, 'epoch': 1.61} {'loss': 0.2675, 'learning_rate': 1.9056454753493224e-06, 'epoch': 1.61} {'loss': 0.2472, 'learning_rate': 1.9054481908616651e-06, 'epoch': 1.61} {'loss': 0.4023, 'learning_rate': 1.9052509155112152e-06, 'epoch': 1.61} {'loss': 0.2696, 'learning_rate': 1.9050536492981997e-06, 'epoch': 1.61} {'loss': 0.369, 'learning_rate': 1.904856392222837e-06, 'epoch': 1.61} {'loss': 0.462, 'learning_rate': 1.9046591442853546e-06, 'epoch': 1.61} {'loss': 0.2716, 'learning_rate': 1.9044619054859726e-06, 'epoch': 1.61} {'loss': 0.3256, 'learning_rate': 1.9042646758249106e-06, 'epoch': 1.61} {'loss': 0.3961, 'learning_rate': 1.9040674553023974e-06, 'epoch': 1.61} {'loss': 0.3974, 'learning_rate': 1.9038702439186496e-06, 'epoch': 1.61} {'loss': 0.3413, 'learning_rate': 1.9036730416738958e-06, 'epoch': 1.61} {'loss': 0.4238, 'learning_rate': 1.9034758485683525e-06, 'epoch': 1.61} {'loss': 0.3293, 'learning_rate': 1.9032786646022482e-06, 'epoch': 1.61} {'loss': 0.342, 'learning_rate': 1.9030814897758e-06, 'epoch': 1.61} {'loss': 0.2349, 'learning_rate': 1.9028843240892359e-06, 'epoch': 1.61} {'loss': 0.3784, 'learning_rate': 1.9026871675427727e-06, 'epoch': 1.61} {'loss': 0.2564, 'learning_rate': 1.9024900201366391e-06, 'epoch': 1.61} {'loss': 0.2704, 'learning_rate': 1.9022928818710507e-06, 'epoch': 1.61} {'loss': 0.3372, 'learning_rate': 1.902095752746238e-06, 'epoch': 1.61} {'loss': 0.1785, 'learning_rate': 1.9018986327624178e-06, 'epoch': 1.61} {'loss': 0.3228, 'learning_rate': 1.901701521919812e-06, 'epoch': 1.61} {'loss': 0.3877, 'learning_rate': 1.9015044202186483e-06, 'epoch': 1.61} {'loss': 0.3039, 'learning_rate': 1.9013073276591432e-06, 'epoch': 1.61} {'loss': 0.3008, 'learning_rate': 1.901110244241524e-06, 'epoch': 1.61} {'loss': 0.3292, 'learning_rate': 1.9009131699660098e-06, 'epoch': 1.61} {'loss': 0.2203, 'learning_rate': 1.9007161048328272e-06, 'epoch': 1.61} {'loss': 0.2332, 'learning_rate': 1.900519048842192e-06, 'epoch': 1.61} {'loss': 0.2588, 'learning_rate': 1.9003220019943346e-06, 'epoch': 1.61} {'loss': 0.3878, 'learning_rate': 1.9001249642894703e-06, 'epoch': 1.61} {'loss': 0.2512, 'learning_rate': 1.8999279357278266e-06, 'epoch': 1.61} {'loss': 0.25, 'learning_rate': 1.8997309163096222e-06, 'epoch': 1.61} {'loss': 0.3961, 'learning_rate': 1.8995339060350836e-06, 'epoch': 1.61} {'loss': 0.2225, 'learning_rate': 1.8993369049044309e-06, 'epoch': 1.61} {'loss': 0.4579, 'learning_rate': 1.8991399129178844e-06, 'epoch': 1.61} {'loss': 0.3575, 'learning_rate': 1.8989429300756701e-06, 'epoch': 1.61} {'loss': 0.3119, 'learning_rate': 1.8987459563780064e-06, 'epoch': 1.61} {'loss': 0.2831, 'learning_rate': 1.898548991825121e-06, 'epoch': 1.61} {'loss': 0.2819, 'learning_rate': 1.8983520364172304e-06, 'epoch': 1.61} {'loss': 0.1817, 'learning_rate': 1.898155090154562e-06, 'epoch': 1.61} {'loss': 0.4693, 'learning_rate': 1.8979581530373336e-06, 'epoch': 1.61} {'loss': 0.3439, 'learning_rate': 1.8977612250657729e-06, 'epoch': 1.61} {'loss': 0.2262, 'learning_rate': 1.897564306240095e-06, 'epoch': 1.61} {'loss': 0.1833, 'learning_rate': 1.89736739656053e-06, 'epoch': 1.61} {'loss': 0.3171, 'learning_rate': 1.897170496027294e-06, 'epoch': 1.61} {'loss': 0.2068, 'learning_rate': 1.896973604640614e-06, 'epoch': 1.61} {'loss': 0.4315, 'learning_rate': 1.8967767224007095e-06, 'epoch': 1.61} {'loss': 0.4369, 'learning_rate': 1.8965798493078002e-06, 'epoch': 1.61} {'loss': 0.2778, 'learning_rate': 1.8963829853621152e-06, 'epoch': 1.61} {'loss': 0.2472, 'learning_rate': 1.8961861305638697e-06, 'epoch': 1.61} {'loss': 0.2352, 'learning_rate': 1.895989284913291e-06, 'epoch': 1.61} {'loss': 0.3671, 'learning_rate': 1.8957924484105982e-06, 'epoch': 1.61} {'loss': 0.162, 'learning_rate': 1.8955956210560156e-06, 'epoch': 1.61} {'loss': 0.4086, 'learning_rate': 1.8953988028497627e-06, 'epoch': 1.61} {'loss': 0.316, 'learning_rate': 1.8952019937920662e-06, 'epoch': 1.61} {'loss': 0.4244, 'learning_rate': 1.8950051938831426e-06, 'epoch': 1.61} {'loss': 0.2611, 'learning_rate': 1.8948084031232195e-06, 'epoch': 1.61} {'loss': 0.2957, 'learning_rate': 1.8946116215125131e-06, 'epoch': 1.61} {'loss': 0.4802, 'learning_rate': 1.8944148490512527e-06, 'epoch': 1.61} {'loss': 0.2153, 'learning_rate': 1.8942180857396563e-06, 'epoch': 1.61} {'loss': 0.396, 'learning_rate': 1.8940213315779433e-06, 'epoch': 1.61} {'loss': 0.2404, 'learning_rate': 1.893824586566342e-06, 'epoch': 1.61} {'loss': 0.4128, 'learning_rate': 1.8936278507050677e-06, 'epoch': 1.61} {'loss': 0.1515, 'learning_rate': 1.8934311239943492e-06, 'epoch': 1.61} {'loss': 0.2768, 'learning_rate': 1.8932344064344021e-06, 'epoch': 1.61} {'loss': 0.3346, 'learning_rate': 1.893037698025455e-06, 'epoch': 1.61} {'loss': 0.3002, 'learning_rate': 1.8928409987677244e-06, 'epoch': 1.61} {'loss': 0.2974, 'learning_rate': 1.8926443086614378e-06, 'epoch': 1.61} {'loss': 0.2593, 'learning_rate': 1.8924476277068104e-06, 'epoch': 1.61} {'loss': 0.3973, 'learning_rate': 1.8922509559040702e-06, 'epoch': 1.61} {'loss': 0.242, 'learning_rate': 1.8920542932534358e-06, 'epoch': 1.61} {'loss': 0.4696, 'learning_rate': 1.8918576397551293e-06, 'epoch': 1.61} {'loss': 0.3779, 'learning_rate': 1.8916609954093768e-06, 'epoch': 1.61} {'loss': 0.3325, 'learning_rate': 1.891464360216394e-06, 'epoch': 1.61} {'loss': 0.1986, 'learning_rate': 1.8912677341764084e-06, 'epoch': 1.61} {'loss': 0.3818, 'learning_rate': 1.891071117289638e-06, 'epoch': 1.61} {'loss': 0.2688, 'learning_rate': 1.8908745095563085e-06, 'epoch': 1.61} {'loss': 0.2836, 'learning_rate': 1.8906779109766371e-06, 'epoch': 1.61} {'loss': 0.3524, 'learning_rate': 1.89048132155085e-06, 'epoch': 1.61} {'loss': 0.2509, 'learning_rate': 1.890284741279166e-06, 'epoch': 1.61} {'loss': 0.2304, 'learning_rate': 1.8900881701618102e-06, 'epoch': 1.61} {'loss': 0.5185, 'learning_rate': 1.8898916081990027e-06, 'epoch': 1.61} {'loss': 0.4109, 'learning_rate': 1.8896950553909631e-06, 'epoch': 1.61} {'loss': 0.3741, 'learning_rate': 1.8894985117379182e-06, 'epoch': 1.61} {'loss': 0.191, 'learning_rate': 1.8893019772400844e-06, 'epoch': 1.61} {'loss': 0.3414, 'learning_rate': 1.8891054518976891e-06, 'epoch': 1.61} {'loss': 0.244, 'learning_rate': 1.8889089357109492e-06, 'epoch': 1.61} {'loss': 0.3226, 'learning_rate': 1.8887124286800906e-06, 'epoch': 1.61} {'loss': 0.2926, 'learning_rate': 1.8885159308053303e-06, 'epoch': 1.61} {'loss': 0.3138, 'learning_rate': 1.8883194420868967e-06, 'epoch': 1.61} {'loss': 0.4138, 'learning_rate': 1.8881229625250053e-06, 'epoch': 1.61} {'loss': 0.3095, 'learning_rate': 1.8879264921198826e-06, 'epoch': 1.61} {'loss': 0.3305, 'learning_rate': 1.887730030871745e-06, 'epoch': 1.61} {'loss': 0.4251, 'learning_rate': 1.8875335787808214e-06, 'epoch': 1.61} {'loss': 0.3467, 'learning_rate': 1.887337135847329e-06, 'epoch': 1.61} {'loss': 0.3797, 'learning_rate': 1.8871407020714883e-06, 'epoch': 1.61} {'loss': 0.3475, 'learning_rate': 1.8869442774535252e-06, 'epoch': 1.61} {'loss': 0.2093, 'learning_rate': 1.8867478619936564e-06, 'epoch': 1.61} {'loss': 0.2992, 'learning_rate': 1.8865514556921094e-06, 'epoch': 1.61} {'loss': 0.3098, 'learning_rate': 1.8863550585491008e-06, 'epoch': 1.61} {'loss': 0.2504, 'learning_rate': 1.886158670564857e-06, 'epoch': 1.61} {'loss': 0.2463, 'learning_rate': 1.8859622917395937e-06, 'epoch': 1.61} {'loss': 0.2534, 'learning_rate': 1.8857659220735392e-06, 'epoch': 1.61} {'loss': 0.3892, 'learning_rate': 1.885569561566909e-06, 'epoch': 1.61} {'loss': 0.3804, 'learning_rate': 1.8853732102199306e-06, 'epoch': 1.62} {'loss': 0.4244, 'learning_rate': 1.885176868032821e-06, 'epoch': 1.62} {'loss': 0.3465, 'learning_rate': 1.8849805350058049e-06, 'epoch': 1.62} {'loss': 0.421, 'learning_rate': 1.8847842111391035e-06, 'epoch': 1.62} {'loss': 0.2921, 'learning_rate': 1.8845878964329345e-06, 'epoch': 1.62} {'loss': 0.2427, 'learning_rate': 1.8843915908875244e-06, 'epoch': 1.62} {'loss': 0.3204, 'learning_rate': 1.8841952945030916e-06, 'epoch': 1.62} {'loss': 0.3958, 'learning_rate': 1.883999007279861e-06, 'epoch': 1.62} {'loss': 0.335, 'learning_rate': 1.8838027292180505e-06, 'epoch': 1.62} {'loss': 0.3387, 'learning_rate': 1.8836064603178849e-06, 'epoch': 1.62} {'loss': 0.2246, 'learning_rate': 1.8834102005795819e-06, 'epoch': 1.62} {'loss': 0.2034, 'learning_rate': 1.8832139500033674e-06, 'epoch': 1.62} {'loss': 0.2689, 'learning_rate': 1.8830177085894596e-06, 'epoch': 1.62} {'loss': 0.2839, 'learning_rate': 1.8828214763380826e-06, 'epoch': 1.62} {'loss': 0.2946, 'learning_rate': 1.8826252532494548e-06, 'epoch': 1.62} {'loss': 0.4055, 'learning_rate': 1.882429039323802e-06, 'epoch': 1.62} {'loss': 0.4299, 'learning_rate': 1.8822328345613428e-06, 'epoch': 1.62} {'loss': 0.2537, 'learning_rate': 1.8820366389622968e-06, 'epoch': 1.62} {'loss': 0.2388, 'learning_rate': 1.8818404525268896e-06, 'epoch': 1.62} {'loss': 0.4225, 'learning_rate': 1.8816442752553399e-06, 'epoch': 1.62} {'loss': 0.3838, 'learning_rate': 1.8814481071478708e-06, 'epoch': 1.62} {'loss': 0.3279, 'learning_rate': 1.8812519482047008e-06, 'epoch': 1.62} {'loss': 0.2291, 'learning_rate': 1.881055798426057e-06, 'epoch': 1.62} {'loss': 0.408, 'learning_rate': 1.880859657812154e-06, 'epoch': 1.62} {'loss': 0.291, 'learning_rate': 1.8806635263632188e-06, 'epoch': 1.62} {'loss': 0.3867, 'learning_rate': 1.880467404079469e-06, 'epoch': 1.62} {'loss': 0.3798, 'learning_rate': 1.8802712909611298e-06, 'epoch': 1.62} {'loss': 0.2338, 'learning_rate': 1.8800751870084166e-06, 'epoch': 1.62} {'loss': 0.3535, 'learning_rate': 1.8798790922215582e-06, 'epoch': 1.62} {'loss': 0.2157, 'learning_rate': 1.879683006600772e-06, 'epoch': 1.62} {'loss': 0.3106, 'learning_rate': 1.879486930146277e-06, 'epoch': 1.62} {'loss': 0.3069, 'learning_rate': 1.8792908628582985e-06, 'epoch': 1.62} {'loss': 0.2284, 'learning_rate': 1.879094804737055e-06, 'epoch': 1.62} {'loss': 0.2616, 'learning_rate': 1.8788987557827721e-06, 'epoch': 1.62} {'loss': 0.2687, 'learning_rate': 1.8787027159956651e-06, 'epoch': 1.62} {'loss': 0.2566, 'learning_rate': 1.8785066853759603e-06, 'epoch': 1.62} {'loss': 0.4376, 'learning_rate': 1.8783106639238746e-06, 'epoch': 1.62} {'loss': 0.2994, 'learning_rate': 1.8781146516396354e-06, 'epoch': 1.62} {'loss': 0.2811, 'learning_rate': 1.8779186485234568e-06, 'epoch': 1.62} {'loss': 0.3497, 'learning_rate': 1.8777226545755668e-06, 'epoch': 1.62} {'loss': 0.2542, 'learning_rate': 1.8775266697961802e-06, 'epoch': 1.62} {'loss': 0.2364, 'learning_rate': 1.8773306941855241e-06, 'epoch': 1.62} {'loss': 0.2978, 'learning_rate': 1.8771347277438178e-06, 'epoch': 1.62} {'loss': 0.3759, 'learning_rate': 1.8769387704712783e-06, 'epoch': 1.62} {'loss': 0.2131, 'learning_rate': 1.876742822368134e-06, 'epoch': 1.62} {'loss': 0.3534, 'learning_rate': 1.8765468834345979e-06, 'epoch': 1.62} {'loss': 0.2003, 'learning_rate': 1.8763509536709e-06, 'epoch': 1.62} {'loss': 0.3422, 'learning_rate': 1.8761550330772538e-06, 'epoch': 1.62} {'loss': 0.234, 'learning_rate': 1.8759591216538863e-06, 'epoch': 1.62} {'loss': 0.3721, 'learning_rate': 1.8757632194010133e-06, 'epoch': 1.62} {'loss': 0.3501, 'learning_rate': 1.8755673263188613e-06, 'epoch': 1.62} {'loss': 0.2818, 'learning_rate': 1.8753714424076463e-06, 'epoch': 1.62} {'loss': 0.3339, 'learning_rate': 1.8751755676675954e-06, 'epoch': 1.62} {'loss': 0.2133, 'learning_rate': 1.8749797020989223e-06, 'epoch': 1.62} {'loss': 0.5227, 'learning_rate': 1.8747838457018564e-06, 'epoch': 1.62} {'loss': 0.2252, 'learning_rate': 1.8745879984766124e-06, 'epoch': 1.62} {'loss': 0.3896, 'learning_rate': 1.8743921604234129e-06, 'epoch': 1.62} {'loss': 0.3025, 'learning_rate': 1.8741963315424805e-06, 'epoch': 1.62} {'loss': 0.286, 'learning_rate': 1.8740005118340331e-06, 'epoch': 1.62} {'loss': 0.3568, 'learning_rate': 1.8738047012982974e-06, 'epoch': 1.62} {'loss': 0.3992, 'learning_rate': 1.8736088999354873e-06, 'epoch': 1.62} {'loss': 0.4099, 'learning_rate': 1.8734131077458296e-06, 'epoch': 1.62} {'loss': 0.2629, 'learning_rate': 1.8732173247295415e-06, 'epoch': 1.62} {'loss': 0.2908, 'learning_rate': 1.8730215508868477e-06, 'epoch': 1.62} {'loss': 0.2343, 'learning_rate': 1.8728257862179655e-06, 'epoch': 1.62} {'loss': 0.289, 'learning_rate': 1.872630030723117e-06, 'epoch': 1.62} {'loss': 0.2695, 'learning_rate': 1.8724342844025256e-06, 'epoch': 1.62} {'loss': 0.3224, 'learning_rate': 1.8722385472564085e-06, 'epoch': 1.62} {'loss': 0.2968, 'learning_rate': 1.8720428192849915e-06, 'epoch': 1.62} {'loss': 0.3217, 'learning_rate': 1.8718471004884898e-06, 'epoch': 1.62} {'loss': 0.3559, 'learning_rate': 1.8716513908671285e-06, 'epoch': 1.62} {'loss': 0.2932, 'learning_rate': 1.8714556904211257e-06, 'epoch': 1.62} {'loss': 0.2676, 'learning_rate': 1.8712599991507063e-06, 'epoch': 1.62} {'loss': 0.4325, 'learning_rate': 1.871064317056085e-06, 'epoch': 1.62} {'loss': 0.3685, 'learning_rate': 1.87086864413749e-06, 'epoch': 1.62} {'loss': 0.4649, 'learning_rate': 1.8706729803951372e-06, 'epoch': 1.62} {'loss': 0.267, 'learning_rate': 1.8704773258292475e-06, 'epoch': 1.62} {'loss': 0.4191, 'learning_rate': 1.8702816804400448e-06, 'epoch': 1.62} {'loss': 0.3418, 'learning_rate': 1.8700860442277459e-06, 'epoch': 1.62} {'loss': 0.2707, 'learning_rate': 1.869890417192577e-06, 'epoch': 1.62} {'loss': 0.3742, 'learning_rate': 1.8696947993347524e-06, 'epoch': 1.62} {'loss': 0.3056, 'learning_rate': 1.869499190654499e-06, 'epoch': 1.62} {'loss': 0.3107, 'learning_rate': 1.869303591152033e-06, 'epoch': 1.62} {'loss': 0.3017, 'learning_rate': 1.8691080008275785e-06, 'epoch': 1.62} {'loss': 0.3917, 'learning_rate': 1.8689124196813536e-06, 'epoch': 1.62} {'loss': 0.3739, 'learning_rate': 1.868716847713582e-06, 'epoch': 1.62} {'loss': 0.2072, 'learning_rate': 1.8685212849244805e-06, 'epoch': 1.62} {'loss': 0.2964, 'learning_rate': 1.8683257313142755e-06, 'epoch': 1.62} {'loss': 0.3347, 'learning_rate': 1.8681301868831813e-06, 'epoch': 1.62} {'loss': 0.5549, 'learning_rate': 1.8679346516314234e-06, 'epoch': 1.62} {'loss': 0.2531, 'learning_rate': 1.8677391255592225e-06, 'epoch': 1.62} {'loss': 0.2567, 'learning_rate': 1.8675436086667942e-06, 'epoch': 1.62} {'loss': 0.316, 'learning_rate': 1.8673481009543659e-06, 'epoch': 1.62} {'loss': 0.299, 'learning_rate': 1.867152602422152e-06, 'epoch': 1.62} {'loss': 0.2586, 'learning_rate': 1.866957113070379e-06, 'epoch': 1.62} {'loss': 0.2245, 'learning_rate': 1.866761632899262e-06, 'epoch': 1.62} {'loss': 0.3113, 'learning_rate': 1.8665661619090282e-06, 'epoch': 1.62} {'loss': 0.3133, 'learning_rate': 1.8663707000998909e-06, 'epoch': 1.62} {'loss': 0.2728, 'learning_rate': 1.8661752474720774e-06, 'epoch': 1.62} {'loss': 0.2548, 'learning_rate': 1.8659798040258025e-06, 'epoch': 1.62} {'loss': 0.3461, 'learning_rate': 1.865784369761292e-06, 'epoch': 1.62} {'loss': 0.2171, 'learning_rate': 1.8655889446787623e-06, 'epoch': 1.62} {'loss': 0.1996, 'learning_rate': 1.8653935287784375e-06, 'epoch': 1.62} {'loss': 0.232, 'learning_rate': 1.8651981220605376e-06, 'epoch': 1.62} {'loss': 0.3296, 'learning_rate': 1.8650027245252789e-06, 'epoch': 1.62} {'loss': 0.2966, 'learning_rate': 1.8648073361728869e-06, 'epoch': 1.62} {'loss': 0.1745, 'learning_rate': 1.8646119570035793e-06, 'epoch': 1.62} {'loss': 0.197, 'learning_rate': 1.8644165870175802e-06, 'epoch': 1.62} {'loss': 0.239, 'learning_rate': 1.8642212262151049e-06, 'epoch': 1.62} {'loss': 0.3878, 'learning_rate': 1.864025874596379e-06, 'epoch': 1.62} {'loss': 0.3042, 'learning_rate': 1.863830532161618e-06, 'epoch': 1.62} {'loss': 0.3134, 'learning_rate': 1.863635198911048e-06, 'epoch': 1.62} {'loss': 0.2595, 'learning_rate': 1.8634398748448845e-06, 'epoch': 1.62} {'loss': 0.2979, 'learning_rate': 1.863244559963353e-06, 'epoch': 1.62} {'loss': 0.2414, 'learning_rate': 1.863049254266668e-06, 'epoch': 1.62} {'loss': 0.399, 'learning_rate': 1.8628539577550553e-06, 'epoch': 1.62} {'loss': 0.2212, 'learning_rate': 1.8626586704287331e-06, 'epoch': 1.62} {'loss': 0.4237, 'learning_rate': 1.8624633922879198e-06, 'epoch': 1.62} {'loss': 0.2253, 'learning_rate': 1.862268123332841e-06, 'epoch': 1.62} {'loss': 0.3582, 'learning_rate': 1.8620728635637109e-06, 'epoch': 1.62} {'loss': 0.1719, 'learning_rate': 1.8618776129807547e-06, 'epoch': 1.62} {'loss': 0.3785, 'learning_rate': 1.8616823715841904e-06, 'epoch': 1.62} {'loss': 0.3039, 'learning_rate': 1.8614871393742407e-06, 'epoch': 1.62} {'loss': 0.2935, 'learning_rate': 1.8612919163511212e-06, 'epoch': 1.62} {'loss': 0.3955, 'learning_rate': 1.8610967025150595e-06, 'epoch': 1.62} {'loss': 0.3271, 'learning_rate': 1.8609014978662677e-06, 'epoch': 1.62} {'loss': 0.3763, 'learning_rate': 1.8607063024049743e-06, 'epoch': 1.62} {'loss': 0.4149, 'learning_rate': 1.8605111161313927e-06, 'epoch': 1.62} {'loss': 0.2225, 'learning_rate': 1.8603159390457482e-06, 'epoch': 1.62} {'loss': 0.3686, 'learning_rate': 1.8601207711482605e-06, 'epoch': 1.62} {'loss': 0.2343, 'learning_rate': 1.8599256124391452e-06, 'epoch': 1.62} {'loss': 0.3631, 'learning_rate': 1.8597304629186285e-06, 'epoch': 1.62} {'loss': 0.4503, 'learning_rate': 1.8595353225869262e-06, 'epoch': 1.62} {'loss': 0.1727, 'learning_rate': 1.8593401914442621e-06, 'epoch': 1.62} {'loss': 0.3389, 'learning_rate': 1.859145069490853e-06, 'epoch': 1.62} {'loss': 0.3447, 'learning_rate': 1.858949956726923e-06, 'epoch': 1.62} {'loss': 0.4614, 'learning_rate': 1.8587548531526888e-06, 'epoch': 1.62} {'loss': 0.2707, 'learning_rate': 1.8585597587683745e-06, 'epoch': 1.62} {'loss': 0.2103, 'learning_rate': 1.8583646735741955e-06, 'epoch': 1.62} {'loss': 0.3154, 'learning_rate': 1.8581695975703774e-06, 'epoch': 1.62} {'loss': 0.3033, 'learning_rate': 1.857974530757134e-06, 'epoch': 1.62} {'loss': 0.2042, 'learning_rate': 1.857779473134692e-06, 'epoch': 1.62} {'loss': 0.4563, 'learning_rate': 1.8575844247032693e-06, 'epoch': 1.62} {'loss': 0.2591, 'learning_rate': 1.857389385463082e-06, 'epoch': 1.62} {'loss': 0.2214, 'learning_rate': 1.8571943554143568e-06, 'epoch': 1.62} {'loss': 0.3447, 'learning_rate': 1.856999334557309e-06, 'epoch': 1.62} {'loss': 0.313, 'learning_rate': 1.8568043228921618e-06, 'epoch': 1.62} {'loss': 0.1575, 'learning_rate': 1.8566093204191315e-06, 'epoch': 1.62} {'loss': 0.3914, 'learning_rate': 1.8564143271384438e-06, 'epoch': 1.62} {'loss': 0.1536, 'learning_rate': 1.8562193430503128e-06, 'epoch': 1.62} {'loss': 0.2712, 'learning_rate': 1.856024368154965e-06, 'epoch': 1.62} {'loss': 0.4055, 'learning_rate': 1.8558294024526136e-06, 'epoch': 1.62} {'loss': 0.3004, 'learning_rate': 1.855634445943485e-06, 'epoch': 1.62} {'loss': 0.2743, 'learning_rate': 1.8554394986277935e-06, 'epoch': 1.62} {'loss': 0.2631, 'learning_rate': 1.8552445605057656e-06, 'epoch': 1.62} {'loss': 0.382, 'learning_rate': 1.8550496315776167e-06, 'epoch': 1.62} {'loss': 0.5715, 'learning_rate': 1.8548547118435656e-06, 'epoch': 1.62} {'loss': 0.3623, 'learning_rate': 1.8546598013038375e-06, 'epoch': 1.62} {'loss': 0.3907, 'learning_rate': 1.8544648999586467e-06, 'epoch': 1.62} {'loss': 0.216, 'learning_rate': 1.8542700078082188e-06, 'epoch': 1.62} {'loss': 0.1772, 'learning_rate': 1.8540751248527688e-06, 'epoch': 1.62} {'loss': 0.1761, 'learning_rate': 1.8538802510925214e-06, 'epoch': 1.62} {'loss': 0.2209, 'learning_rate': 1.8536853865276916e-06, 'epoch': 1.62} {'loss': 0.2475, 'learning_rate': 1.8534905311585038e-06, 'epoch': 1.62} {'loss': 0.3624, 'learning_rate': 1.8532956849851736e-06, 'epoch': 1.62} {'loss': 0.4489, 'learning_rate': 1.8531008480079238e-06, 'epoch': 1.62} {'loss': 0.4038, 'learning_rate': 1.8529060202269766e-06, 'epoch': 1.62} {'loss': 0.1499, 'learning_rate': 1.8527112016425464e-06, 'epoch': 1.62} {'loss': 0.3297, 'learning_rate': 1.8525163922548595e-06, 'epoch': 1.62} {'loss': 0.3006, 'learning_rate': 1.852321592064129e-06, 'epoch': 1.62} {'loss': 0.1615, 'learning_rate': 1.8521268010705807e-06, 'epoch': 1.62} {'loss': 0.372, 'learning_rate': 1.8519320192744283e-06, 'epoch': 1.62} {'loss': 0.4161, 'learning_rate': 1.8517372466758986e-06, 'epoch': 1.62} {'loss': 0.3231, 'learning_rate': 1.8515424832752061e-06, 'epoch': 1.62} {'loss': 0.2726, 'learning_rate': 1.8513477290725746e-06, 'epoch': 1.62} {'loss': 0.2527, 'learning_rate': 1.8511529840682218e-06, 'epoch': 1.62} {'loss': 0.3437, 'learning_rate': 1.8509582482623656e-06, 'epoch': 1.62} {'loss': 0.3278, 'learning_rate': 1.85076352165523e-06, 'epoch': 1.62} {'loss': 0.1888, 'learning_rate': 1.8505688042470304e-06, 'epoch': 1.62} {'loss': 0.3194, 'learning_rate': 1.8503740960379923e-06, 'epoch': 1.62} {'loss': 0.2756, 'learning_rate': 1.8501793970283288e-06, 'epoch': 1.62} {'loss': 0.3824, 'learning_rate': 1.8499847072182653e-06, 'epoch': 1.62} {'loss': 0.368, 'learning_rate': 1.849790026608017e-06, 'epoch': 1.62} {'loss': 0.3224, 'learning_rate': 1.8495953551978085e-06, 'epoch': 1.62} {'loss': 0.2341, 'learning_rate': 1.849400692987855e-06, 'epoch': 1.62} {'loss': 0.3828, 'learning_rate': 1.8492060399783796e-06, 'epoch': 1.62} {'loss': 0.2526, 'learning_rate': 1.8490113961695987e-06, 'epoch': 1.62} {'loss': 0.3992, 'learning_rate': 1.848816761561737e-06, 'epoch': 1.62} {'loss': 0.3118, 'learning_rate': 1.8486221361550104e-06, 'epoch': 1.62} {'loss': 0.2841, 'learning_rate': 1.8484275199496372e-06, 'epoch': 1.62} {'loss': 0.3739, 'learning_rate': 1.848232912945841e-06, 'epoch': 1.62} {'loss': 0.327, 'learning_rate': 1.8480383151438375e-06, 'epoch': 1.62} {'loss': 0.4777, 'learning_rate': 1.847843726543852e-06, 'epoch': 1.62} {'loss': 0.1956, 'learning_rate': 1.8476491471460977e-06, 'epoch': 1.62} {'loss': 0.3106, 'learning_rate': 1.847454576950799e-06, 'epoch': 1.62} {'loss': 0.3386, 'learning_rate': 1.8472600159581721e-06, 'epoch': 1.62} {'loss': 0.2285, 'learning_rate': 1.8470654641684405e-06, 'epoch': 1.62} {'loss': 0.2271, 'learning_rate': 1.8468709215818192e-06, 'epoch': 1.62} {'loss': 0.3021, 'learning_rate': 1.8466763881985339e-06, 'epoch': 1.62} {'loss': 0.4329, 'learning_rate': 1.8464818640187964e-06, 'epoch': 1.62} {'loss': 0.345, 'learning_rate': 1.8462873490428334e-06, 'epoch': 1.62} {'loss': 0.2324, 'learning_rate': 1.8460928432708614e-06, 'epoch': 1.62} {'loss': 0.2526, 'learning_rate': 1.8458983467030978e-06, 'epoch': 1.62} {'loss': 0.3451, 'learning_rate': 1.8457038593397668e-06, 'epoch': 1.62} {'loss': 0.2781, 'learning_rate': 1.8455093811810831e-06, 'epoch': 1.62} {'loss': 0.274, 'learning_rate': 1.8453149122272717e-06, 'epoch': 1.62} {'loss': 0.2664, 'learning_rate': 1.845120452478546e-06, 'epoch': 1.62} {'loss': 0.4123, 'learning_rate': 1.8449260019351312e-06, 'epoch': 1.62} {'loss': 0.4345, 'learning_rate': 1.8447315605972415e-06, 'epoch': 1.62} {'loss': 0.2701, 'learning_rate': 1.8445371284651014e-06, 'epoch': 1.62} {'loss': 0.2598, 'learning_rate': 1.8443427055389263e-06, 'epoch': 1.62} {'loss': 0.3709, 'learning_rate': 1.844148291818939e-06, 'epoch': 1.62} {'loss': 0.3788, 'learning_rate': 1.8439538873053553e-06, 'epoch': 1.62} {'loss': 0.4111, 'learning_rate': 1.8437594919983992e-06, 'epoch': 1.62} {'loss': 0.3221, 'learning_rate': 1.8435651058982873e-06, 'epoch': 1.62} {'loss': 0.3453, 'learning_rate': 1.8433707290052372e-06, 'epoch': 1.62} {'loss': 0.2108, 'learning_rate': 1.843176361319473e-06, 'epoch': 1.62} {'loss': 0.3038, 'learning_rate': 1.8429820028412093e-06, 'epoch': 1.62} {'loss': 0.3444, 'learning_rate': 1.8427876535706702e-06, 'epoch': 1.62} {'loss': 0.2039, 'learning_rate': 1.8425933135080698e-06, 'epoch': 1.62} {'loss': 0.1952, 'learning_rate': 1.8423989826536338e-06, 'epoch': 1.62} {'loss': 0.3338, 'learning_rate': 1.842204661007575e-06, 'epoch': 1.62} {'loss': 0.3725, 'learning_rate': 1.842010348570118e-06, 'epoch': 1.62} {'loss': 0.2872, 'learning_rate': 1.841816045341478e-06, 'epoch': 1.62} {'loss': 0.3175, 'learning_rate': 1.8416217513218781e-06, 'epoch': 1.62} {'loss': 0.3446, 'learning_rate': 1.841427466511534e-06, 'epoch': 1.62} {'loss': 0.369, 'learning_rate': 1.8412331909106696e-06, 'epoch': 1.62} {'loss': 0.3553, 'learning_rate': 1.8410389245195016e-06, 'epoch': 1.62} {'loss': 0.2698, 'learning_rate': 1.8408446673382462e-06, 'epoch': 1.62} {'loss': 0.2635, 'learning_rate': 1.8406504193671283e-06, 'epoch': 1.62} {'loss': 0.298, 'learning_rate': 1.8404561806063615e-06, 'epoch': 1.62} {'loss': 0.2423, 'learning_rate': 1.8402619510561703e-06, 'epoch': 1.62} {'loss': 0.2602, 'learning_rate': 1.8400677307167703e-06, 'epoch': 1.62} {'loss': 0.3832, 'learning_rate': 1.8398735195883844e-06, 'epoch': 1.62} {'loss': 0.3369, 'learning_rate': 1.8396793176712268e-06, 'epoch': 1.62} {'loss': 0.2509, 'learning_rate': 1.839485124965522e-06, 'epoch': 1.62} {'loss': 0.3265, 'learning_rate': 1.8392909414714843e-06, 'epoch': 1.62} {'loss': 0.3733, 'learning_rate': 1.8390967671893378e-06, 'epoch': 1.62} {'loss': 0.3921, 'learning_rate': 1.8389026021192968e-06, 'epoch': 1.62} {'loss': 0.2011, 'learning_rate': 1.8387084462615845e-06, 'epoch': 1.62} {'loss': 0.3132, 'learning_rate': 1.8385142996164174e-06, 'epoch': 1.62} {'loss': 0.3421, 'learning_rate': 1.8383201621840163e-06, 'epoch': 1.62} {'loss': 0.2578, 'learning_rate': 1.8381260339646012e-06, 'epoch': 1.62} {'loss': 0.2495, 'learning_rate': 1.8379319149583874e-06, 'epoch': 1.62} {'loss': 0.318, 'learning_rate': 1.8377378051655981e-06, 'epoch': 1.62} {'loss': 0.393, 'learning_rate': 1.8375437045864487e-06, 'epoch': 1.62} {'loss': 0.266, 'learning_rate': 1.837349613221162e-06, 'epoch': 1.62} {'loss': 0.4189, 'learning_rate': 1.837155531069954e-06, 'epoch': 1.62} {'loss': 0.4091, 'learning_rate': 1.8369614581330463e-06, 'epoch': 1.62} {'loss': 0.2444, 'learning_rate': 1.8367673944106556e-06, 'epoch': 1.62} {'loss': 0.3564, 'learning_rate': 1.836573339903004e-06, 'epoch': 1.62} {'loss': 0.259, 'learning_rate': 1.8363792946103065e-06, 'epoch': 1.62} {'loss': 0.163, 'learning_rate': 1.8361852585327867e-06, 'epoch': 1.62} {'loss': 0.2978, 'learning_rate': 1.8359912316706597e-06, 'epoch': 1.62} {'loss': 0.2616, 'learning_rate': 1.8357972140241476e-06, 'epoch': 1.62} {'loss': 0.2906, 'learning_rate': 1.835603205593468e-06, 'epoch': 1.62} {'loss': 0.5212, 'learning_rate': 1.8354092063788376e-06, 'epoch': 1.62} {'loss': 0.2412, 'learning_rate': 1.8352152163804804e-06, 'epoch': 1.62} {'loss': 0.3468, 'learning_rate': 1.8350212355986097e-06, 'epoch': 1.62} {'loss': 0.3061, 'learning_rate': 1.8348272640334508e-06, 'epoch': 1.62} {'loss': 0.2831, 'learning_rate': 1.8346333016852157e-06, 'epoch': 1.62} {'loss': 0.1735, 'learning_rate': 1.834439348554129e-06, 'epoch': 1.62} {'loss': 0.2117, 'learning_rate': 1.8342454046404057e-06, 'epoch': 1.62} {'loss': 0.2562, 'learning_rate': 1.8340514699442668e-06, 'epoch': 1.62} {'loss': 0.336, 'learning_rate': 1.8338575444659334e-06, 'epoch': 1.62} {'loss': 0.2135, 'learning_rate': 1.8336636282056197e-06, 'epoch': 1.62} {'loss': 0.4198, 'learning_rate': 1.8334697211635488e-06, 'epoch': 1.62} {'loss': 0.3398, 'learning_rate': 1.833275823339935e-06, 'epoch': 1.62} {'loss': 0.2812, 'learning_rate': 1.8330819347350027e-06, 'epoch': 1.62} {'loss': 0.2717, 'learning_rate': 1.8328880553489658e-06, 'epoch': 1.62} {'loss': 0.2557, 'learning_rate': 1.8326941851820469e-06, 'epoch': 1.62} {'loss': 0.2569, 'learning_rate': 1.8325003242344608e-06, 'epoch': 1.62} {'loss': 0.2864, 'learning_rate': 1.832306472506432e-06, 'epoch': 1.62} {'loss': 0.2254, 'learning_rate': 1.8321126299981728e-06, 'epoch': 1.62} {'loss': 0.2385, 'learning_rate': 1.8319187967099072e-06, 'epoch': 1.62} {'loss': 0.1823, 'learning_rate': 1.831724972641853e-06, 'epoch': 1.62} {'loss': 0.3903, 'learning_rate': 1.8315311577942251e-06, 'epoch': 1.62} {'loss': 0.2062, 'learning_rate': 1.8313373521672485e-06, 'epoch': 1.62} {'loss': 0.2991, 'learning_rate': 1.8311435557611356e-06, 'epoch': 1.62} {'loss': 0.307, 'learning_rate': 1.8309497685761114e-06, 'epoch': 1.62} {'loss': 0.2441, 'learning_rate': 1.8307559906123874e-06, 'epoch': 1.62} {'loss': 0.3028, 'learning_rate': 1.8305622218701902e-06, 'epoch': 1.62} {'loss': 0.2467, 'learning_rate': 1.8303684623497319e-06, 'epoch': 1.62} {'loss': 0.379, 'learning_rate': 1.830174712051237e-06, 'epoch': 1.62} {'loss': 0.3862, 'learning_rate': 1.8299809709749183e-06, 'epoch': 1.62} {'loss': 0.2519, 'learning_rate': 1.8297872391210004e-06, 'epoch': 1.62} {'loss': 0.3073, 'learning_rate': 1.829593516489696e-06, 'epoch': 1.62} {'loss': 0.3685, 'learning_rate': 1.8293998030812299e-06, 'epoch': 1.62} {'loss': 0.2149, 'learning_rate': 1.829206098895817e-06, 'epoch': 1.62} {'loss': 0.2345, 'learning_rate': 1.8290124039336742e-06, 'epoch': 1.62} {'loss': 0.3306, 'learning_rate': 1.8288187181950256e-06, 'epoch': 1.62} {'loss': 0.3907, 'learning_rate': 1.8286250416800843e-06, 'epoch': 1.62} {'loss': 0.2125, 'learning_rate': 1.8284313743890747e-06, 'epoch': 1.62} {'loss': 0.2701, 'learning_rate': 1.8282377163222087e-06, 'epoch': 1.62} {'loss': 0.4059, 'learning_rate': 1.8280440674797107e-06, 'epoch': 1.62} {'loss': 0.2126, 'learning_rate': 1.8278504278617948e-06, 'epoch': 1.62} {'loss': 0.3406, 'learning_rate': 1.8276567974686843e-06, 'epoch': 1.62} {'loss': 0.3439, 'learning_rate': 1.8274631763005935e-06, 'epoch': 1.62} {'loss': 0.2767, 'learning_rate': 1.8272695643577443e-06, 'epoch': 1.62} {'loss': 0.3123, 'learning_rate': 1.827075961640351e-06, 'epoch': 1.62} {'loss': 0.2222, 'learning_rate': 1.826882368148638e-06, 'epoch': 1.62} {'loss': 0.2832, 'learning_rate': 1.8266887838828195e-06, 'epoch': 1.62} {'loss': 0.2878, 'learning_rate': 1.826495208843113e-06, 'epoch': 1.62} {'loss': 0.361, 'learning_rate': 1.826301643029743e-06, 'epoch': 1.62} {'loss': 0.4352, 'learning_rate': 1.8261080864429204e-06, 'epoch': 1.62} {'loss': 0.2494, 'learning_rate': 1.8259145390828704e-06, 'epoch': 1.62} {'loss': 0.2959, 'learning_rate': 1.825721000949805e-06, 'epoch': 1.62} {'loss': 0.321, 'learning_rate': 1.8255274720439498e-06, 'epoch': 1.62} {'loss': 0.3014, 'learning_rate': 1.8253339523655168e-06, 'epoch': 1.62} {'loss': 0.3862, 'learning_rate': 1.82514044191473e-06, 'epoch': 1.62} {'loss': 0.345, 'learning_rate': 1.824946940691802e-06, 'epoch': 1.62} {'loss': 0.3254, 'learning_rate': 1.8247534486969575e-06, 'epoch': 1.62} {'loss': 0.2638, 'learning_rate': 1.8245599659304092e-06, 'epoch': 1.62} {'loss': 0.2981, 'learning_rate': 1.8243664923923798e-06, 'epoch': 1.62} {'loss': 0.3452, 'learning_rate': 1.8241730280830872e-06, 'epoch': 1.62} {'loss': 0.459, 'learning_rate': 1.8239795730027454e-06, 'epoch': 1.62} {'loss': 0.4776, 'learning_rate': 1.8237861271515778e-06, 'epoch': 1.62} {'loss': 0.2444, 'learning_rate': 1.8235926905297996e-06, 'epoch': 1.62} {'loss': 0.2823, 'learning_rate': 1.8233992631376318e-06, 'epoch': 1.62} {'loss': 0.4008, 'learning_rate': 1.8232058449752898e-06, 'epoch': 1.62} {'loss': 0.1119, 'learning_rate': 1.8230124360429958e-06, 'epoch': 1.62} {'loss': 0.1318, 'learning_rate': 1.8228190363409625e-06, 'epoch': 1.62} {'loss': 0.3874, 'learning_rate': 1.8226256458694146e-06, 'epoch': 1.62} {'loss': 0.4662, 'learning_rate': 1.8224322646285652e-06, 'epoch': 1.62} {'loss': 0.3655, 'learning_rate': 1.8222388926186374e-06, 'epoch': 1.62} {'loss': 0.3572, 'learning_rate': 1.8220455298398444e-06, 'epoch': 1.62} {'loss': 0.3223, 'learning_rate': 1.8218521762924079e-06, 'epoch': 1.62} {'loss': 0.261, 'learning_rate': 1.8216588319765472e-06, 'epoch': 1.62} {'loss': 0.3497, 'learning_rate': 1.821465496892474e-06, 'epoch': 1.62} {'loss': 0.349, 'learning_rate': 1.8212721710404147e-06, 'epoch': 1.62} {'loss': 0.2935, 'learning_rate': 1.8210788544205815e-06, 'epoch': 1.62} {'loss': 0.252, 'learning_rate': 1.8208855470331965e-06, 'epoch': 1.62} {'loss': 0.3165, 'learning_rate': 1.820692248878475e-06, 'epoch': 1.62} {'loss': 0.3198, 'learning_rate': 1.820498959956638e-06, 'epoch': 1.62} {'loss': 0.1729, 'learning_rate': 1.8203056802679009e-06, 'epoch': 1.62} {'loss': 0.3162, 'learning_rate': 1.8201124098124856e-06, 'epoch': 1.62} {'loss': 0.2765, 'learning_rate': 1.8199191485906042e-06, 'epoch': 1.62} {'loss': 0.2946, 'learning_rate': 1.8197258966024823e-06, 'epoch': 1.62} {'loss': 0.2657, 'learning_rate': 1.8195326538483315e-06, 'epoch': 1.62} {'loss': 0.355, 'learning_rate': 1.8193394203283753e-06, 'epoch': 1.62} {'loss': 0.4622, 'learning_rate': 1.8191461960428291e-06, 'epoch': 1.62} {'loss': 0.492, 'learning_rate': 1.8189529809919082e-06, 'epoch': 1.62} {'loss': 0.2533, 'learning_rate': 1.8187597751758368e-06, 'epoch': 1.62} {'loss': 0.5089, 'learning_rate': 1.818566578594827e-06, 'epoch': 1.62} {'loss': 0.1866, 'learning_rate': 1.818373391249103e-06, 'epoch': 1.62} {'loss': 0.2713, 'learning_rate': 1.8181802131388758e-06, 'epoch': 1.62} {'loss': 0.3283, 'learning_rate': 1.817987044264371e-06, 'epoch': 1.62} {'loss': 0.3692, 'learning_rate': 1.8177938846258003e-06, 'epoch': 1.62} {'loss': 0.2784, 'learning_rate': 1.817600734223387e-06, 'epoch': 1.62} {'loss': 0.4329, 'learning_rate': 1.8174075930573431e-06, 'epoch': 1.62} {'loss': 0.294, 'learning_rate': 1.8172144611278941e-06, 'epoch': 1.62} {'loss': 0.2914, 'learning_rate': 1.8170213384352498e-06, 'epoch': 1.62} {'loss': 0.2813, 'learning_rate': 1.8168282249796353e-06, 'epoch': 1.62} {'loss': 0.4231, 'learning_rate': 1.8166351207612664e-06, 'epoch': 1.62} {'loss': 0.3449, 'learning_rate': 1.8164420257803572e-06, 'epoch': 1.62} {'loss': 0.2713, 'learning_rate': 1.816248940037131e-06, 'epoch': 1.62} {'loss': 0.3876, 'learning_rate': 1.8160558635318015e-06, 'epoch': 1.62} {'loss': 0.387, 'learning_rate': 1.8158627962645915e-06, 'epoch': 1.62} {'loss': 0.2425, 'learning_rate': 1.8156697382357125e-06, 'epoch': 1.62} {'loss': 0.3512, 'learning_rate': 1.81547668944539e-06, 'epoch': 1.62} {'loss': 0.4215, 'learning_rate': 1.8152836498938342e-06, 'epoch': 1.62} {'loss': 0.2985, 'learning_rate': 1.8150906195812702e-06, 'epoch': 1.62} {'loss': 0.4041, 'learning_rate': 1.8148975985079086e-06, 'epoch': 1.62} {'loss': 0.3763, 'learning_rate': 1.8147045866739721e-06, 'epoch': 1.62} {'loss': 0.4007, 'learning_rate': 1.81451158407968e-06, 'epoch': 1.62} {'loss': 0.2565, 'learning_rate': 1.814318590725246e-06, 'epoch': 1.62} {'loss': 0.4218, 'learning_rate': 1.8141256066108914e-06, 'epoch': 1.62} {'loss': 0.2876, 'learning_rate': 1.81393263173683e-06, 'epoch': 1.62} {'loss': 0.3625, 'learning_rate': 1.8137396661032846e-06, 'epoch': 1.62} {'loss': 0.3186, 'learning_rate': 1.8135467097104675e-06, 'epoch': 1.62} {'loss': 0.3001, 'learning_rate': 1.8133537625586028e-06, 'epoch': 1.62} {'loss': 0.2094, 'learning_rate': 1.8131608246479015e-06, 'epoch': 1.62} {'loss': 0.3231, 'learning_rate': 1.812967895978588e-06, 'epoch': 1.62} {'loss': 0.2925, 'learning_rate': 1.812774976550874e-06, 'epoch': 1.62} {'loss': 0.161, 'learning_rate': 1.8125820663649829e-06, 'epoch': 1.62} {'loss': 0.1517, 'learning_rate': 1.8123891654211302e-06, 'epoch': 1.62} {'loss': 0.3197, 'learning_rate': 1.8121962737195298e-06, 'epoch': 1.62} {'loss': 0.2174, 'learning_rate': 1.8120033912604062e-06, 'epoch': 1.62} {'loss': 0.1575, 'learning_rate': 1.8118105180439705e-06, 'epoch': 1.62} {'loss': 0.5281, 'learning_rate': 1.8116176540704467e-06, 'epoch': 1.62} {'loss': 0.3115, 'learning_rate': 1.8114247993400469e-06, 'epoch': 1.62} {'loss': 0.2499, 'learning_rate': 1.8112319538529932e-06, 'epoch': 1.62} {'loss': 0.2094, 'learning_rate': 1.8110391176095e-06, 'epoch': 1.62} {'loss': 0.2699, 'learning_rate': 1.8108462906097878e-06, 'epoch': 1.62} {'loss': 0.28, 'learning_rate': 1.8106534728540714e-06, 'epoch': 1.62} {'loss': 0.148, 'learning_rate': 1.8104606643425726e-06, 'epoch': 1.62} {'loss': 0.3789, 'learning_rate': 1.8102678650755022e-06, 'epoch': 1.62} {'loss': 0.3585, 'learning_rate': 1.810075075053086e-06, 'epoch': 1.62} {'loss': 0.423, 'learning_rate': 1.8098822942755379e-06, 'epoch': 1.62} {'loss': 0.422, 'learning_rate': 1.8096895227430723e-06, 'epoch': 1.62} {'loss': 0.2914, 'learning_rate': 1.8094967604559122e-06, 'epoch': 1.62} {'loss': 0.2887, 'learning_rate': 1.8093040074142699e-06, 'epoch': 1.62} {'loss': 0.2542, 'learning_rate': 1.8091112636183682e-06, 'epoch': 1.62} {'loss': 0.3702, 'learning_rate': 1.8089185290684207e-06, 'epoch': 1.62} {'loss': 0.2058, 'learning_rate': 1.8087258037646482e-06, 'epoch': 1.62} {'loss': 0.409, 'learning_rate': 1.8085330877072649e-06, 'epoch': 1.62} {'loss': 0.387, 'learning_rate': 1.8083403808964927e-06, 'epoch': 1.62} {'loss': 0.3086, 'learning_rate': 1.8081476833325428e-06, 'epoch': 1.62} {'loss': 0.2977, 'learning_rate': 1.8079549950156405e-06, 'epoch': 1.62} {'loss': 0.3053, 'learning_rate': 1.8077623159459957e-06, 'epoch': 1.62} {'loss': 0.2484, 'learning_rate': 1.8075696461238323e-06, 'epoch': 1.62} {'loss': 0.3472, 'learning_rate': 1.8073769855493639e-06, 'epoch': 1.62} {'loss': 0.268, 'learning_rate': 1.807184334222808e-06, 'epoch': 1.62} {'loss': 0.2421, 'learning_rate': 1.8069916921443841e-06, 'epoch': 1.62} {'loss': 0.3439, 'learning_rate': 1.806799059314307e-06, 'epoch': 1.62} {'loss': 0.2871, 'learning_rate': 1.8066064357327984e-06, 'epoch': 1.62} {'loss': 0.2202, 'learning_rate': 1.8064138214000704e-06, 'epoch': 1.62} {'loss': 0.5109, 'learning_rate': 1.806221216316345e-06, 'epoch': 1.62} {'loss': 0.2336, 'learning_rate': 1.8060286204818366e-06, 'epoch': 1.62} {'loss': 0.1397, 'learning_rate': 1.805836033896765e-06, 'epoch': 1.62} {'loss': 0.3363, 'learning_rate': 1.8056434565613446e-06, 'epoch': 1.62} {'loss': 0.1797, 'learning_rate': 1.805450888475796e-06, 'epoch': 1.62} {'loss': 0.3436, 'learning_rate': 1.8052583296403336e-06, 'epoch': 1.62} {'loss': 0.2199, 'learning_rate': 1.8050657800551785e-06, 'epoch': 1.62} {'loss': 0.2468, 'learning_rate': 1.8048732397205448e-06, 'epoch': 1.62} {'loss': 0.4589, 'learning_rate': 1.8046807086366492e-06, 'epoch': 1.62} {'loss': 0.4105, 'learning_rate': 1.8044881868037133e-06, 'epoch': 1.62} {'loss': 0.2326, 'learning_rate': 1.8042956742219497e-06, 'epoch': 1.62} {'loss': 0.3843, 'learning_rate': 1.8041031708915791e-06, 'epoch': 1.62} {'loss': 0.2744, 'learning_rate': 1.8039106768128155e-06, 'epoch': 1.62} {'loss': 0.2588, 'learning_rate': 1.8037181919858816e-06, 'epoch': 1.62} {'loss': 0.2387, 'learning_rate': 1.8035257164109877e-06, 'epoch': 1.62} {'loss': 0.2432, 'learning_rate': 1.803333250088357e-06, 'epoch': 1.62} {'loss': 0.3094, 'learning_rate': 1.803140793018202e-06, 'epoch': 1.62} {'loss': 0.3352, 'learning_rate': 1.8029483452007456e-06, 'epoch': 1.62} {'loss': 0.3453, 'learning_rate': 1.8027559066361989e-06, 'epoch': 1.62} {'loss': 0.4192, 'learning_rate': 1.8025634773247847e-06, 'epoch': 1.62} {'loss': 0.2912, 'learning_rate': 1.8023710572667174e-06, 'epoch': 1.62} {'loss': 0.2453, 'learning_rate': 1.8021786464622116e-06, 'epoch': 1.62} {'loss': 0.2475, 'learning_rate': 1.80198624491149e-06, 'epoch': 1.62} {'loss': 0.3023, 'learning_rate': 1.8017938526147638e-06, 'epoch': 1.62} {'loss': 0.1522, 'learning_rate': 1.801601469572256e-06, 'epoch': 1.62} {'loss': 0.3774, 'learning_rate': 1.801409095784179e-06, 'epoch': 1.62} {'loss': 0.1894, 'learning_rate': 1.8012167312507557e-06, 'epoch': 1.62} {'loss': 0.3676, 'learning_rate': 1.8010243759721956e-06, 'epoch': 1.62} {'loss': 0.2268, 'learning_rate': 1.8008320299487224e-06, 'epoch': 1.62} {'loss': 0.3189, 'learning_rate': 1.8006396931805492e-06, 'epoch': 1.62} {'loss': 0.1794, 'learning_rate': 1.8004473656678966e-06, 'epoch': 1.62} {'loss': 0.2267, 'learning_rate': 1.800255047410977e-06, 'epoch': 1.62} {'loss': 0.3605, 'learning_rate': 1.8000627384100123e-06, 'epoch': 1.62} {'loss': 0.2626, 'learning_rate': 1.7998704386652188e-06, 'epoch': 1.62} {'loss': 0.1805, 'learning_rate': 1.7996781481768088e-06, 'epoch': 1.62} {'loss': 0.4034, 'learning_rate': 1.7994858669450055e-06, 'epoch': 1.62} {'loss': 0.3347, 'learning_rate': 1.7992935949700208e-06, 'epoch': 1.62} {'loss': 0.231, 'learning_rate': 1.7991013322520768e-06, 'epoch': 1.62} {'loss': 0.3429, 'learning_rate': 1.7989090787913843e-06, 'epoch': 1.62} {'loss': 0.2344, 'learning_rate': 1.7987168345881677e-06, 'epoch': 1.62} {'loss': 0.2514, 'learning_rate': 1.7985245996426371e-06, 'epoch': 1.62} {'loss': 0.3111, 'learning_rate': 1.7983323739550163e-06, 'epoch': 1.62} {'loss': 0.3126, 'learning_rate': 1.7981401575255152e-06, 'epoch': 1.62} {'loss': 0.3082, 'learning_rate': 1.7979479503543563e-06, 'epoch': 1.62} {'loss': 0.1803, 'learning_rate': 1.7977557524417533e-06, 'epoch': 1.62} {'loss': 0.3082, 'learning_rate': 1.797563563787925e-06, 'epoch': 1.62} {'loss': 0.3384, 'learning_rate': 1.7973713843930895e-06, 'epoch': 1.62} {'loss': 0.4131, 'learning_rate': 1.7971792142574585e-06, 'epoch': 1.62} {'loss': 0.4025, 'learning_rate': 1.796987053381255e-06, 'epoch': 1.62} {'loss': 0.193, 'learning_rate': 1.7967949017646903e-06, 'epoch': 1.62} {'loss': 0.2778, 'learning_rate': 1.7966027594079872e-06, 'epoch': 1.62} {'loss': 0.4176, 'learning_rate': 1.7964106263113567e-06, 'epoch': 1.62} {'loss': 0.3867, 'learning_rate': 1.7962185024750223e-06, 'epoch': 1.62} {'loss': 0.2606, 'learning_rate': 1.7960263878991934e-06, 'epoch': 1.62} {'loss': 0.3183, 'learning_rate': 1.7958342825840935e-06, 'epoch': 1.62} {'loss': 0.2962, 'learning_rate': 1.7956421865299345e-06, 'epoch': 1.62} {'loss': 0.382, 'learning_rate': 1.7954500997369351e-06, 'epoch': 1.62} {'loss': 0.3347, 'learning_rate': 1.795258022205315e-06, 'epoch': 1.62} {'loss': 0.2667, 'learning_rate': 1.7950659539352856e-06, 'epoch': 1.62} {'loss': 0.3833, 'learning_rate': 1.7948738949270694e-06, 'epoch': 1.62} {'loss': 0.3603, 'learning_rate': 1.7946818451808767e-06, 'epoch': 1.62} {'loss': 0.297, 'learning_rate': 1.7944898046969317e-06, 'epoch': 1.62} {'loss': 0.3813, 'learning_rate': 1.794297773475444e-06, 'epoch': 1.62} {'loss': 0.4517, 'learning_rate': 1.794105751516637e-06, 'epoch': 1.62} {'loss': 0.3859, 'learning_rate': 1.7939137388207207e-06, 'epoch': 1.62} {'loss': 0.2418, 'learning_rate': 1.793721735387919e-06, 'epoch': 1.62} {'loss': 0.3144, 'learning_rate': 1.7935297412184437e-06, 'epoch': 1.62} {'loss': 0.3976, 'learning_rate': 1.793337756312511e-06, 'epoch': 1.62} {'loss': 0.2736, 'learning_rate': 1.7931457806703424e-06, 'epoch': 1.62} {'loss': 0.3258, 'learning_rate': 1.7929538142921489e-06, 'epoch': 1.62} {'loss': 0.2969, 'learning_rate': 1.7927618571781514e-06, 'epoch': 1.62} {'loss': 0.3433, 'learning_rate': 1.792569909328563e-06, 'epoch': 1.62} {'loss': 0.2744, 'learning_rate': 1.792377970743605e-06, 'epoch': 1.62} {'loss': 0.2861, 'learning_rate': 1.7921860414234892e-06, 'epoch': 1.62} {'loss': 0.2383, 'learning_rate': 1.7919941213684379e-06, 'epoch': 1.62} {'loss': 0.3267, 'learning_rate': 1.7918022105786615e-06, 'epoch': 1.62} {'loss': 0.1839, 'learning_rate': 1.7916103090543814e-06, 'epoch': 1.63} {'loss': 0.2886, 'learning_rate': 1.7914184167958093e-06, 'epoch': 1.63} {'loss': 0.362, 'learning_rate': 1.7912265338031686e-06, 'epoch': 1.63} {'loss': 0.2737, 'learning_rate': 1.7910346600766716e-06, 'epoch': 1.63} {'loss': 0.3438, 'learning_rate': 1.790842795616533e-06, 'epoch': 1.63} {'loss': 0.4004, 'learning_rate': 1.7906509404229754e-06, 'epoch': 1.63} {'loss': 0.3854, 'learning_rate': 1.7904590944962075e-06, 'epoch': 1.63} {'loss': 0.3884, 'learning_rate': 1.7902672578364543e-06, 'epoch': 1.63} {'loss': 0.2083, 'learning_rate': 1.790075430443925e-06, 'epoch': 1.63} {'loss': 0.4856, 'learning_rate': 1.7898836123188413e-06, 'epoch': 1.63} {'loss': 0.3845, 'learning_rate': 1.7896918034614163e-06, 'epoch': 1.63} {'loss': 0.3146, 'learning_rate': 1.7895000038718702e-06, 'epoch': 1.63} {'loss': 0.3289, 'learning_rate': 1.7893082135504137e-06, 'epoch': 1.63} {'loss': 0.2821, 'learning_rate': 1.7891164324972709e-06, 'epoch': 1.63} {'loss': 0.3547, 'learning_rate': 1.788924660712651e-06, 'epoch': 1.63} {'loss': 0.4093, 'learning_rate': 1.7887328981967766e-06, 'epoch': 1.63} {'loss': 0.289, 'learning_rate': 1.7885411449498613e-06, 'epoch': 1.63} {'loss': 0.2237, 'learning_rate': 1.788349400972118e-06, 'epoch': 1.63} {'loss': 0.3665, 'learning_rate': 1.7881576662637701e-06, 'epoch': 1.63} {'loss': 0.2689, 'learning_rate': 1.7879659408250283e-06, 'epoch': 1.63} {'loss': 0.1705, 'learning_rate': 1.7877742246561136e-06, 'epoch': 1.63} {'loss': 0.2345, 'learning_rate': 1.7875825177572382e-06, 'epoch': 1.63} {'loss': 0.3147, 'learning_rate': 1.7873908201286228e-06, 'epoch': 1.63} {'loss': 0.3128, 'learning_rate': 1.7871991317704785e-06, 'epoch': 1.63} {'loss': 0.3564, 'learning_rate': 1.7870074526830272e-06, 'epoch': 1.63} {'loss': 0.3253, 'learning_rate': 1.78681578286648e-06, 'epoch': 1.63} {'loss': 0.4241, 'learning_rate': 1.786624122321059e-06, 'epoch': 1.63} {'loss': 0.2607, 'learning_rate': 1.7864324710469749e-06, 'epoch': 1.63} {'loss': 0.2173, 'learning_rate': 1.7862408290444488e-06, 'epoch': 1.63} {'loss': 0.293, 'learning_rate': 1.7860491963136962e-06, 'epoch': 1.63} {'loss': 0.4803, 'learning_rate': 1.7858575728549277e-06, 'epoch': 1.63} {'loss': 0.3368, 'learning_rate': 1.7856659586683677e-06, 'epoch': 1.63} {'loss': 0.3874, 'learning_rate': 1.7854743537542262e-06, 'epoch': 1.63} {'loss': 0.3307, 'learning_rate': 1.7852827581127242e-06, 'epoch': 1.63} {'loss': 0.3554, 'learning_rate': 1.7850911717440733e-06, 'epoch': 1.63} {'loss': 0.0699, 'learning_rate': 1.784899594648496e-06, 'epoch': 1.63} {'loss': 0.5064, 'learning_rate': 1.7847080268262007e-06, 'epoch': 1.63} {'loss': 0.2985, 'learning_rate': 1.7845164682774118e-06, 'epoch': 1.63} {'loss': 0.2035, 'learning_rate': 1.7843249190023381e-06, 'epoch': 1.63} {'loss': 0.2689, 'learning_rate': 1.7841333790012016e-06, 'epoch': 1.63} {'loss': 0.415, 'learning_rate': 1.7839418482742144e-06, 'epoch': 1.63} {'loss': 0.4424, 'learning_rate': 1.7837503268215972e-06, 'epoch': 1.63} {'loss': 0.3437, 'learning_rate': 1.78355881464356e-06, 'epoch': 1.63} {'loss': 0.1807, 'learning_rate': 1.7833673117403261e-06, 'epoch': 1.63} {'loss': 0.3154, 'learning_rate': 1.7831758181121072e-06, 'epoch': 1.63} {'loss': 0.2785, 'learning_rate': 1.7829843337591179e-06, 'epoch': 1.63} {'loss': 0.332, 'learning_rate': 1.782792858681579e-06, 'epoch': 1.63} {'loss': 0.3703, 'learning_rate': 1.7826013928797026e-06, 'epoch': 1.63} {'loss': 0.4114, 'learning_rate': 1.7824099363537094e-06, 'epoch': 1.63} {'loss': 0.2886, 'learning_rate': 1.7822184891038097e-06, 'epoch': 1.63} {'loss': 0.3513, 'learning_rate': 1.7820270511302252e-06, 'epoch': 1.63} {'loss': 0.2944, 'learning_rate': 1.7818356224331668e-06, 'epoch': 1.63} {'loss': 0.3114, 'learning_rate': 1.7816442030128556e-06, 'epoch': 1.63} {'loss': 0.2408, 'learning_rate': 1.7814527928695025e-06, 'epoch': 1.63} {'loss': 0.2395, 'learning_rate': 1.7812613920033294e-06, 'epoch': 1.63} {'loss': 0.2661, 'learning_rate': 1.7810700004145464e-06, 'epoch': 1.63} {'loss': 0.3305, 'learning_rate': 1.7808786181033754e-06, 'epoch': 1.63} {'loss': 0.4503, 'learning_rate': 1.7806872450700297e-06, 'epoch': 1.63} {'loss': 0.3707, 'learning_rate': 1.7804958813147222e-06, 'epoch': 1.63} {'loss': 0.297, 'learning_rate': 1.7803045268376752e-06, 'epoch': 1.63} {'loss': 0.4396, 'learning_rate': 1.7801131816390982e-06, 'epoch': 1.63} {'loss': 0.24, 'learning_rate': 1.7799218457192125e-06, 'epoch': 1.63} {'loss': 0.2935, 'learning_rate': 1.77973051907823e-06, 'epoch': 1.63} {'loss': 0.2772, 'learning_rate': 1.7795392017163704e-06, 'epoch': 1.63} {'loss': 0.2662, 'learning_rate': 1.779347893633846e-06, 'epoch': 1.63} {'loss': 0.2922, 'learning_rate': 1.7791565948308764e-06, 'epoch': 1.63} {'loss': 0.2928, 'learning_rate': 1.7789653053076738e-06, 'epoch': 1.63} {'loss': 0.4189, 'learning_rate': 1.778774025064458e-06, 'epoch': 1.63} {'loss': 0.2721, 'learning_rate': 1.778582754101441e-06, 'epoch': 1.63} {'loss': 0.2868, 'learning_rate': 1.7783914924188439e-06, 'epoch': 1.63} {'loss': 0.3468, 'learning_rate': 1.7782002400168786e-06, 'epoch': 1.63} {'loss': 0.2987, 'learning_rate': 1.7780089968957591e-06, 'epoch': 1.63} {'loss': 0.25, 'learning_rate': 1.7778177630557059e-06, 'epoch': 1.63} {'loss': 0.341, 'learning_rate': 1.7776265384969316e-06, 'epoch': 1.63} {'loss': 0.1697, 'learning_rate': 1.7774353232196552e-06, 'epoch': 1.63} {'loss': 0.2614, 'learning_rate': 1.7772441172240884e-06, 'epoch': 1.63} {'loss': 0.3614, 'learning_rate': 1.7770529205104525e-06, 'epoch': 1.63} {'loss': 0.2844, 'learning_rate': 1.7768617330789573e-06, 'epoch': 1.63} {'loss': 0.3465, 'learning_rate': 1.7766705549298213e-06, 'epoch': 1.63} {'loss': 0.3406, 'learning_rate': 1.7764793860632624e-06, 'epoch': 1.63} {'loss': 0.3081, 'learning_rate': 1.7762882264794934e-06, 'epoch': 1.63} {'loss': 0.3323, 'learning_rate': 1.7760970761787322e-06, 'epoch': 1.63} {'loss': 0.25, 'learning_rate': 1.775905935161192e-06, 'epoch': 1.63} {'loss': 0.2235, 'learning_rate': 1.775714803427092e-06, 'epoch': 1.63} {'loss': 0.3298, 'learning_rate': 1.7755236809766441e-06, 'epoch': 1.63} {'loss': 0.3237, 'learning_rate': 1.7753325678100685e-06, 'epoch': 1.63} {'loss': 0.2448, 'learning_rate': 1.7751414639275766e-06, 'epoch': 1.63} {'loss': 0.2561, 'learning_rate': 1.7749503693293868e-06, 'epoch': 1.63} {'loss': 0.3191, 'learning_rate': 1.7747592840157125e-06, 'epoch': 1.63} {'loss': 0.2102, 'learning_rate': 1.7745682079867732e-06, 'epoch': 1.63} {'loss': 0.1662, 'learning_rate': 1.7743771412427824e-06, 'epoch': 1.63} {'loss': 0.2435, 'learning_rate': 1.774186083783953e-06, 'epoch': 1.63} {'loss': 0.2097, 'learning_rate': 1.7739950356105062e-06, 'epoch': 1.63} {'loss': 0.4289, 'learning_rate': 1.7738039967226516e-06, 'epoch': 1.63} {'loss': 0.1896, 'learning_rate': 1.7736129671206105e-06, 'epoch': 1.63} {'loss': 0.2649, 'learning_rate': 1.7734219468045943e-06, 'epoch': 1.63} {'loss': 0.2611, 'learning_rate': 1.7732309357748222e-06, 'epoch': 1.63} {'loss': 0.4458, 'learning_rate': 1.7730399340315052e-06, 'epoch': 1.63} {'loss': 0.2798, 'learning_rate': 1.7728489415748651e-06, 'epoch': 1.63} {'loss': 0.2138, 'learning_rate': 1.7726579584051106e-06, 'epoch': 1.63} {'loss': 0.3763, 'learning_rate': 1.772466984522464e-06, 'epoch': 1.63} {'loss': 0.3612, 'learning_rate': 1.7722760199271348e-06, 'epoch': 1.63} {'loss': 0.2188, 'learning_rate': 1.7720850646193443e-06, 'epoch': 1.63} {'loss': 0.2677, 'learning_rate': 1.7718941185993044e-06, 'epoch': 1.63} {'loss': 0.3566, 'learning_rate': 1.7717031818672304e-06, 'epoch': 1.63} {'loss': 0.2825, 'learning_rate': 1.7715122544233397e-06, 'epoch': 1.63} {'loss': 0.4341, 'learning_rate': 1.771321336267845e-06, 'epoch': 1.63} {'loss': 0.3709, 'learning_rate': 1.7711304274009666e-06, 'epoch': 1.63} {'loss': 0.4136, 'learning_rate': 1.7709395278229137e-06, 'epoch': 1.63} {'loss': 0.3719, 'learning_rate': 1.770748637533909e-06, 'epoch': 1.63} {'loss': 0.3751, 'learning_rate': 1.7705577565341613e-06, 'epoch': 1.63} {'loss': 0.3027, 'learning_rate': 1.770366884823891e-06, 'epoch': 1.63} {'loss': 0.1832, 'learning_rate': 1.7701760224033093e-06, 'epoch': 1.63} {'loss': 0.3552, 'learning_rate': 1.7699851692726367e-06, 'epoch': 1.63} {'loss': 0.2401, 'learning_rate': 1.7697943254320826e-06, 'epoch': 1.63} {'loss': 0.3096, 'learning_rate': 1.7696034908818694e-06, 'epoch': 1.63} {'loss': 0.2568, 'learning_rate': 1.7694126656222078e-06, 'epoch': 1.63} {'loss': 0.2074, 'learning_rate': 1.769221849653312e-06, 'epoch': 1.63} {'loss': 0.2687, 'learning_rate': 1.7690310429754021e-06, 'epoch': 1.63} {'loss': 0.3485, 'learning_rate': 1.7688402455886878e-06, 'epoch': 1.63} {'loss': 0.281, 'learning_rate': 1.768649457493391e-06, 'epoch': 1.63} {'loss': 0.1887, 'learning_rate': 1.7684586786897206e-06, 'epoch': 1.63} {'loss': 0.2882, 'learning_rate': 1.7682679091778975e-06, 'epoch': 1.63} {'loss': 0.2159, 'learning_rate': 1.7680771489581327e-06, 'epoch': 1.63} {'loss': 0.3589, 'learning_rate': 1.767886398030646e-06, 'epoch': 1.63} {'loss': 0.3072, 'learning_rate': 1.7676956563956471e-06, 'epoch': 1.63} {'loss': 0.3163, 'learning_rate': 1.767504924053357e-06, 'epoch': 1.63} {'loss': 0.2927, 'learning_rate': 1.7673142010039857e-06, 'epoch': 1.63} {'loss': 0.275, 'learning_rate': 1.767123487247754e-06, 'epoch': 1.63} {'loss': 0.4953, 'learning_rate': 1.7669327827848748e-06, 'epoch': 1.63} {'loss': 0.2998, 'learning_rate': 1.7667420876155594e-06, 'epoch': 1.63} {'loss': 0.3137, 'learning_rate': 1.7665514017400298e-06, 'epoch': 1.63} {'loss': 0.2071, 'learning_rate': 1.7663607251584946e-06, 'epoch': 1.63} {'loss': 0.3488, 'learning_rate': 1.766170057871176e-06, 'epoch': 1.63} {'loss': 0.2934, 'learning_rate': 1.7659793998782826e-06, 'epoch': 1.63} {'loss': 0.3619, 'learning_rate': 1.7657887511800354e-06, 'epoch': 1.63} {'loss': 0.1386, 'learning_rate': 1.765598111776644e-06, 'epoch': 1.63} {'loss': 0.373, 'learning_rate': 1.7654074816683297e-06, 'epoch': 1.63} {'loss': 0.3079, 'learning_rate': 1.765216860855301e-06, 'epoch': 1.63} {'loss': 0.3385, 'learning_rate': 1.76502624933778e-06, 'epoch': 1.63} {'loss': 0.2319, 'learning_rate': 1.7648356471159756e-06, 'epoch': 1.63} {'loss': 0.2948, 'learning_rate': 1.7646450541901072e-06, 'epoch': 1.63} {'loss': 0.1545, 'learning_rate': 1.7644544705603894e-06, 'epoch': 1.63} {'loss': 0.3755, 'learning_rate': 1.7642638962270342e-06, 'epoch': 1.63} {'loss': 0.3385, 'learning_rate': 1.7640733311902613e-06, 'epoch': 1.63} {'loss': 0.3482, 'learning_rate': 1.7638827754502806e-06, 'epoch': 1.63} {'loss': 0.3813, 'learning_rate': 1.7636922290073133e-06, 'epoch': 1.63} {'loss': 0.346, 'learning_rate': 1.763501691861569e-06, 'epoch': 1.63} {'loss': 0.1831, 'learning_rate': 1.763311164013266e-06, 'epoch': 1.63} {'loss': 0.2499, 'learning_rate': 1.7631206454626171e-06, 'epoch': 1.63} {'loss': 0.2211, 'learning_rate': 1.7629301362098418e-06, 'epoch': 1.63} {'loss': 0.3014, 'learning_rate': 1.7627396362551486e-06, 'epoch': 1.63} {'loss': 0.2397, 'learning_rate': 1.7625491455987576e-06, 'epoch': 1.63} {'loss': 0.2907, 'learning_rate': 1.7623586642408807e-06, 'epoch': 1.63} {'loss': 0.2488, 'learning_rate': 1.762168192181737e-06, 'epoch': 1.63} {'loss': 0.2767, 'learning_rate': 1.761977729421539e-06, 'epoch': 1.63} {'loss': 0.2303, 'learning_rate': 1.7617872759604993e-06, 'epoch': 1.63} {'loss': 0.3492, 'learning_rate': 1.7615968317988364e-06, 'epoch': 1.63} {'loss': 0.2517, 'learning_rate': 1.7614063969367622e-06, 'epoch': 1.63} {'loss': 0.3269, 'learning_rate': 1.761215971374497e-06, 'epoch': 1.63} {'loss': 0.2479, 'learning_rate': 1.761025555112249e-06, 'epoch': 1.63} {'loss': 0.2739, 'learning_rate': 1.7608351481502384e-06, 'epoch': 1.63} {'loss': 0.1757, 'learning_rate': 1.760644750488677e-06, 'epoch': 1.63} {'loss': 0.335, 'learning_rate': 1.7604543621277825e-06, 'epoch': 1.63} {'loss': 0.37, 'learning_rate': 1.7602639830677658e-06, 'epoch': 1.63} {'loss': 0.5319, 'learning_rate': 1.760073613308847e-06, 'epoch': 1.63} {'loss': 0.3677, 'learning_rate': 1.7598832528512356e-06, 'epoch': 1.63} {'loss': 0.3862, 'learning_rate': 1.7596929016951513e-06, 'epoch': 1.63} {'loss': 0.2924, 'learning_rate': 1.7595025598408067e-06, 'epoch': 1.63} {'loss': 0.3471, 'learning_rate': 1.7593122272884145e-06, 'epoch': 1.63} {'loss': 0.3392, 'learning_rate': 1.7591219040381934e-06, 'epoch': 1.63} {'loss': 0.4857, 'learning_rate': 1.7589315900903547e-06, 'epoch': 1.63} {'loss': 0.2902, 'learning_rate': 1.758741285445118e-06, 'epoch': 1.63} {'loss': 0.4112, 'learning_rate': 1.758550990102693e-06, 'epoch': 1.63} {'loss': 0.2795, 'learning_rate': 1.758360704063299e-06, 'epoch': 1.63} {'loss': 0.2214, 'learning_rate': 1.758170427327145e-06, 'epoch': 1.63} {'loss': 0.1728, 'learning_rate': 1.7579801598944525e-06, 'epoch': 1.63} {'loss': 0.3375, 'learning_rate': 1.7577899017654309e-06, 'epoch': 1.63} {'loss': 0.2382, 'learning_rate': 1.7575996529402971e-06, 'epoch': 1.63} {'loss': 0.4089, 'learning_rate': 1.7574094134192687e-06, 'epoch': 1.63} {'loss': 0.2649, 'learning_rate': 1.7572191832025543e-06, 'epoch': 1.63} {'loss': 0.3974, 'learning_rate': 1.7570289622903757e-06, 'epoch': 1.63} {'loss': 0.2324, 'learning_rate': 1.7568387506829398e-06, 'epoch': 1.63} {'loss': 0.2217, 'learning_rate': 1.7566485483804696e-06, 'epoch': 1.63} {'loss': 0.4525, 'learning_rate': 1.7564583553831726e-06, 'epoch': 1.63} {'loss': 0.3875, 'learning_rate': 1.7562681716912687e-06, 'epoch': 1.63} {'loss': 0.2571, 'learning_rate': 1.756077997304968e-06, 'epoch': 1.63} {'loss': 0.3663, 'learning_rate': 1.7558878322244899e-06, 'epoch': 1.63} {'loss': 0.366, 'learning_rate': 1.7556976764500445e-06, 'epoch': 1.63} {'loss': 0.2439, 'learning_rate': 1.7555075299818514e-06, 'epoch': 1.63} {'loss': 0.2296, 'learning_rate': 1.7553173928201218e-06, 'epoch': 1.63} {'loss': 0.3701, 'learning_rate': 1.7551272649650697e-06, 'epoch': 1.63} {'loss': 0.3344, 'learning_rate': 1.754937146416913e-06, 'epoch': 1.63} {'loss': 0.3789, 'learning_rate': 1.7547470371758612e-06, 'epoch': 1.63} {'loss': 0.2964, 'learning_rate': 1.7545569372421357e-06, 'epoch': 1.63} {'loss': 0.1174, 'learning_rate': 1.7543668466159447e-06, 'epoch': 1.63} {'loss': 0.3655, 'learning_rate': 1.7541767652975084e-06, 'epoch': 1.63} {'loss': 0.3377, 'learning_rate': 1.7539866932870353e-06, 'epoch': 1.63} {'loss': 0.1956, 'learning_rate': 1.7537966305847453e-06, 'epoch': 1.63} {'loss': 0.2519, 'learning_rate': 1.7536065771908495e-06, 'epoch': 1.63} {'loss': 0.2322, 'learning_rate': 1.7534165331055653e-06, 'epoch': 1.63} {'loss': 0.2755, 'learning_rate': 1.7532264983291036e-06, 'epoch': 1.63} {'loss': 0.2305, 'learning_rate': 1.7530364728616834e-06, 'epoch': 1.63} {'loss': 0.3643, 'learning_rate': 1.7528464567035165e-06, 'epoch': 1.63} {'loss': 0.2845, 'learning_rate': 1.752656449854816e-06, 'epoch': 1.63} {'loss': 0.2524, 'learning_rate': 1.7524664523157997e-06, 'epoch': 1.63} {'loss': 0.2353, 'learning_rate': 1.7522764640866785e-06, 'epoch': 1.63} {'loss': 0.3319, 'learning_rate': 1.7520864851676711e-06, 'epoch': 1.63} {'loss': 0.3224, 'learning_rate': 1.7518965155589874e-06, 'epoch': 1.63} {'loss': 0.3038, 'learning_rate': 1.751706555260846e-06, 'epoch': 1.63} {'loss': 0.2703, 'learning_rate': 1.7515166042734565e-06, 'epoch': 1.63} {'loss': 0.2885, 'learning_rate': 1.7513266625970405e-06, 'epoch': 1.63} {'loss': 0.2441, 'learning_rate': 1.7511367302318038e-06, 'epoch': 1.63} {'loss': 0.2409, 'learning_rate': 1.750946807177969e-06, 'epoch': 1.63} {'loss': 0.2225, 'learning_rate': 1.7507568934357432e-06, 'epoch': 1.63} {'loss': 0.2838, 'learning_rate': 1.7505669890053467e-06, 'epoch': 1.63} {'loss': 0.2313, 'learning_rate': 1.7503770938869924e-06, 'epoch': 1.63} {'loss': 0.2534, 'learning_rate': 1.7501872080808901e-06, 'epoch': 1.63} {'loss': 0.4314, 'learning_rate': 1.749997331587261e-06, 'epoch': 1.63} {'loss': 0.2186, 'learning_rate': 1.7498074644063123e-06, 'epoch': 1.63} {'loss': 0.1697, 'learning_rate': 1.7496176065382664e-06, 'epoch': 1.63} {'loss': 0.4133, 'learning_rate': 1.7494277579833296e-06, 'epoch': 1.63} {'loss': 0.3478, 'learning_rate': 1.749237918741723e-06, 'epoch': 1.63} {'loss': 0.251, 'learning_rate': 1.7490480888136553e-06, 'epoch': 1.63} {'loss': 0.3532, 'learning_rate': 1.7488582681993449e-06, 'epoch': 1.63} {'loss': 0.2773, 'learning_rate': 1.748668456899003e-06, 'epoch': 1.63} {'loss': 0.2747, 'learning_rate': 1.7484786549128473e-06, 'epoch': 1.63} {'loss': 0.3336, 'learning_rate': 1.7482888622410877e-06, 'epoch': 1.63} {'loss': 0.3224, 'learning_rate': 1.7480990788839436e-06, 'epoch': 1.63} {'loss': 0.3732, 'learning_rate': 1.7479093048416262e-06, 'epoch': 1.63} {'loss': 0.4236, 'learning_rate': 1.7477195401143477e-06, 'epoch': 1.63} {'loss': 0.2587, 'learning_rate': 1.7475297847023265e-06, 'epoch': 1.63} {'loss': 0.3081, 'learning_rate': 1.7473400386057738e-06, 'epoch': 1.63} {'loss': 0.3076, 'learning_rate': 1.747150301824906e-06, 'epoch': 1.63} {'loss': 0.3578, 'learning_rate': 1.7469605743599338e-06, 'epoch': 1.63} {'loss': 0.0738, 'learning_rate': 1.7467708562110775e-06, 'epoch': 1.63} {'loss': 0.2723, 'learning_rate': 1.7465811473785433e-06, 'epoch': 1.63} {'loss': 0.3014, 'learning_rate': 1.7463914478625533e-06, 'epoch': 1.63} {'loss': 0.3845, 'learning_rate': 1.746201757663315e-06, 'epoch': 1.63} {'loss': 0.2299, 'learning_rate': 1.7460120767810472e-06, 'epoch': 1.63} {'loss': 0.3039, 'learning_rate': 1.74582240521596e-06, 'epoch': 1.63} {'loss': 0.3537, 'learning_rate': 1.7456327429682728e-06, 'epoch': 1.63} {'loss': 0.3358, 'learning_rate': 1.7454430900381958e-06, 'epoch': 1.63} {'loss': 0.3003, 'learning_rate': 1.7452534464259419e-06, 'epoch': 1.63} {'loss': 0.1696, 'learning_rate': 1.7450638121317298e-06, 'epoch': 1.63} {'loss': 0.3332, 'learning_rate': 1.7448741871557684e-06, 'epoch': 1.63} {'loss': 0.222, 'learning_rate': 1.7446845714982763e-06, 'epoch': 1.63} {'loss': 0.2759, 'learning_rate': 1.7444949651594633e-06, 'epoch': 1.63} {'loss': 0.3197, 'learning_rate': 1.7443053681395482e-06, 'epoch': 1.63} {'loss': 0.3355, 'learning_rate': 1.7441157804387398e-06, 'epoch': 1.63} {'loss': 0.4159, 'learning_rate': 1.7439262020572568e-06, 'epoch': 1.63} {'loss': 0.3292, 'learning_rate': 1.7437366329953086e-06, 'epoch': 1.63} {'loss': 0.3446, 'learning_rate': 1.7435470732531158e-06, 'epoch': 1.63} {'loss': 0.3235, 'learning_rate': 1.743357522830884e-06, 'epoch': 1.63} {'loss': 0.2975, 'learning_rate': 1.7431679817288349e-06, 'epoch': 1.63} {'loss': 0.263, 'learning_rate': 1.742978449947179e-06, 'epoch': 1.63} {'loss': 0.2222, 'learning_rate': 1.7427889274861277e-06, 'epoch': 1.63} {'loss': 0.2934, 'learning_rate': 1.7425994143459001e-06, 'epoch': 1.63} {'loss': 0.3825, 'learning_rate': 1.7424099105267046e-06, 'epoch': 1.63} {'loss': 0.2093, 'learning_rate': 1.7422204160287614e-06, 'epoch': 1.63} {'loss': 0.3038, 'learning_rate': 1.7420309308522775e-06, 'epoch': 1.63} {'loss': 0.1906, 'learning_rate': 1.7418414549974739e-06, 'epoch': 1.63} {'loss': 0.3088, 'learning_rate': 1.7416519884645576e-06, 'epoch': 1.63} {'loss': 0.218, 'learning_rate': 1.741462531253748e-06, 'epoch': 1.63} {'loss': 0.2734, 'learning_rate': 1.7412730833652559e-06, 'epoch': 1.63} {'loss': 0.3413, 'learning_rate': 1.7410836447992975e-06, 'epoch': 1.63} {'loss': 0.3803, 'learning_rate': 1.7408942155560826e-06, 'epoch': 1.63} {'loss': 0.4475, 'learning_rate': 1.7407047956358302e-06, 'epoch': 1.63} {'loss': 0.3191, 'learning_rate': 1.7405153850387512e-06, 'epoch': 1.63} {'loss': 0.183, 'learning_rate': 1.7403259837650577e-06, 'epoch': 1.63} {'loss': 0.254, 'learning_rate': 1.7401365918149672e-06, 'epoch': 1.63} {'loss': 0.2167, 'learning_rate': 1.7399472091886905e-06, 'epoch': 1.63} {'loss': 0.4266, 'learning_rate': 1.7397578358864442e-06, 'epoch': 1.63} {'loss': 0.2984, 'learning_rate': 1.7395684719084383e-06, 'epoch': 1.63} {'loss': 0.4524, 'learning_rate': 1.7393791172548912e-06, 'epoch': 1.63} {'loss': 0.3171, 'learning_rate': 1.7391897719260131e-06, 'epoch': 1.63} {'loss': 0.2806, 'learning_rate': 1.7390004359220203e-06, 'epoch': 1.63} {'loss': 0.2764, 'learning_rate': 1.7388111092431225e-06, 'epoch': 1.63} {'loss': 0.3928, 'learning_rate': 1.7386217918895355e-06, 'epoch': 1.63} {'loss': 0.287, 'learning_rate': 1.7384324838614763e-06, 'epoch': 1.63} {'loss': 0.3068, 'learning_rate': 1.738243185159154e-06, 'epoch': 1.63} {'loss': 0.1347, 'learning_rate': 1.7380538957827864e-06, 'epoch': 1.63} {'loss': 0.2333, 'learning_rate': 1.7378646157325818e-06, 'epoch': 1.63} {'loss': 0.3546, 'learning_rate': 1.7376753450087602e-06, 'epoch': 1.63} {'loss': 0.4038, 'learning_rate': 1.7374860836115293e-06, 'epoch': 1.63} {'loss': 0.3002, 'learning_rate': 1.7372968315411076e-06, 'epoch': 1.63} {'loss': 0.3363, 'learning_rate': 1.737107588797704e-06, 'epoch': 1.63} {'loss': 0.2928, 'learning_rate': 1.7369183553815371e-06, 'epoch': 1.63} {'loss': 0.3648, 'learning_rate': 1.7367291312928192e-06, 'epoch': 1.63} {'loss': 0.369, 'learning_rate': 1.7365399165317588e-06, 'epoch': 1.63} {'loss': 0.2642, 'learning_rate': 1.7363507110985767e-06, 'epoch': 1.63} {'loss': 0.3698, 'learning_rate': 1.7361615149934806e-06, 'epoch': 1.63} {'loss': 0.4314, 'learning_rate': 1.7359723282166896e-06, 'epoch': 1.63} {'loss': 0.2695, 'learning_rate': 1.735783150768411e-06, 'epoch': 1.63} {'loss': 0.1807, 'learning_rate': 1.7355939826488655e-06, 'epoch': 1.63} {'loss': 0.2337, 'learning_rate': 1.7354048238582588e-06, 'epoch': 1.63} {'loss': 0.1942, 'learning_rate': 1.7352156743968119e-06, 'epoch': 1.63} {'loss': 0.3052, 'learning_rate': 1.7350265342647321e-06, 'epoch': 1.63} {'loss': 0.2683, 'learning_rate': 1.7348374034622383e-06, 'epoch': 1.63} {'loss': 0.4683, 'learning_rate': 1.7346482819895395e-06, 'epoch': 1.63} {'loss': 0.2733, 'learning_rate': 1.7344591698468526e-06, 'epoch': 1.63} {'loss': 0.3207, 'learning_rate': 1.7342700670343904e-06, 'epoch': 1.63} {'loss': 0.1681, 'learning_rate': 1.7340809735523622e-06, 'epoch': 1.63} {'loss': 0.3442, 'learning_rate': 1.733891889400987e-06, 'epoch': 1.63} {'loss': 0.3153, 'learning_rate': 1.7337028145804747e-06, 'epoch': 1.63} {'loss': 0.2708, 'learning_rate': 1.7335137490910414e-06, 'epoch': 1.63} {'loss': 0.2437, 'learning_rate': 1.7333246929328973e-06, 'epoch': 1.63} {'loss': 0.2356, 'learning_rate': 1.7331356461062598e-06, 'epoch': 1.63} {'loss': 0.3574, 'learning_rate': 1.7329466086113378e-06, 'epoch': 1.63} {'loss': 0.4592, 'learning_rate': 1.7327575804483487e-06, 'epoch': 1.63} {'loss': 0.3679, 'learning_rate': 1.7325685616175026e-06, 'epoch': 1.63} {'loss': 0.3172, 'learning_rate': 1.7323795521190167e-06, 'epoch': 1.63} {'loss': 0.3024, 'learning_rate': 1.7321905519531001e-06, 'epoch': 1.63} {'loss': 0.3445, 'learning_rate': 1.7320015611199703e-06, 'epoch': 1.63} {'loss': 0.303, 'learning_rate': 1.731812579619836e-06, 'epoch': 1.63} {'loss': 0.1852, 'learning_rate': 1.7316236074529158e-06, 'epoch': 1.63} {'loss': 0.2481, 'learning_rate': 1.7314346446194197e-06, 'epoch': 1.63} {'loss': 0.2861, 'learning_rate': 1.7312456911195596e-06, 'epoch': 1.63} {'loss': 0.2808, 'learning_rate': 1.7310567469535533e-06, 'epoch': 1.63} {'loss': 0.2552, 'learning_rate': 1.7308678121216082e-06, 'epoch': 1.63} {'loss': 0.3295, 'learning_rate': 1.7306788866239444e-06, 'epoch': 1.63} {'loss': 0.2919, 'learning_rate': 1.730489970460768e-06, 'epoch': 1.63} {'loss': 0.2816, 'learning_rate': 1.7303010636322992e-06, 'epoch': 1.63} {'loss': 0.3786, 'learning_rate': 1.7301121661387455e-06, 'epoch': 1.63} {'loss': 0.3723, 'learning_rate': 1.7299232779803244e-06, 'epoch': 1.63} {'loss': 0.3143, 'learning_rate': 1.7297343991572458e-06, 'epoch': 1.63} {'loss': 0.4167, 'learning_rate': 1.729545529669726e-06, 'epoch': 1.63} {'loss': 0.382, 'learning_rate': 1.7293566695179742e-06, 'epoch': 1.63} {'loss': 0.3756, 'learning_rate': 1.7291678187022088e-06, 'epoch': 1.63} {'loss': 0.3942, 'learning_rate': 1.7289789772226407e-06, 'epoch': 1.63} {'loss': 0.3534, 'learning_rate': 1.7287901450794796e-06, 'epoch': 1.63} {'loss': 0.2528, 'learning_rate': 1.7286013222729436e-06, 'epoch': 1.63} {'loss': 0.3046, 'learning_rate': 1.728412508803242e-06, 'epoch': 1.63} {'loss': 0.347, 'learning_rate': 1.7282237046705918e-06, 'epoch': 1.63} {'loss': 0.1719, 'learning_rate': 1.7280349098752014e-06, 'epoch': 1.63} {'loss': 0.2658, 'learning_rate': 1.7278461244172895e-06, 'epoch': 1.63} {'loss': 0.3468, 'learning_rate': 1.7276573482970638e-06, 'epoch': 1.63} {'loss': 0.3976, 'learning_rate': 1.7274685815147417e-06, 'epoch': 1.63} {'loss': 0.3572, 'learning_rate': 1.7272798240705335e-06, 'epoch': 1.63} {'loss': 0.3911, 'learning_rate': 1.7270910759646541e-06, 'epoch': 1.63} {'loss': 0.3135, 'learning_rate': 1.7269023371973136e-06, 'epoch': 1.63} {'loss': 0.3283, 'learning_rate': 1.7267136077687307e-06, 'epoch': 1.63} {'loss': 0.2886, 'learning_rate': 1.726524887679114e-06, 'epoch': 1.63} {'loss': 0.2064, 'learning_rate': 1.7263361769286757e-06, 'epoch': 1.63} {'loss': 0.1934, 'learning_rate': 1.7261474755176322e-06, 'epoch': 1.63} {'loss': 0.2934, 'learning_rate': 1.7259587834461921e-06, 'epoch': 1.63} {'loss': 0.357, 'learning_rate': 1.7257701007145744e-06, 'epoch': 1.63} {'loss': 0.2402, 'learning_rate': 1.7255814273229865e-06, 'epoch': 1.63} {'loss': 0.3523, 'learning_rate': 1.7253927632716462e-06, 'epoch': 1.63} {'loss': 0.1688, 'learning_rate': 1.7252041085607607e-06, 'epoch': 1.63} {'loss': 0.2382, 'learning_rate': 1.725015463190549e-06, 'epoch': 1.63} {'loss': 0.1238, 'learning_rate': 1.724826827161219e-06, 'epoch': 1.63} {'loss': 0.2069, 'learning_rate': 1.7246382004729877e-06, 'epoch': 1.63} {'loss': 0.5464, 'learning_rate': 1.7244495831260643e-06, 'epoch': 1.63} {'loss': 0.2943, 'learning_rate': 1.7242609751206664e-06, 'epoch': 1.63} {'loss': 0.4048, 'learning_rate': 1.7240723764570044e-06, 'epoch': 1.63} {'loss': 0.3058, 'learning_rate': 1.7238837871352875e-06, 'epoch': 1.63} {'loss': 0.3835, 'learning_rate': 1.7236952071557357e-06, 'epoch': 1.63} {'loss': 0.2602, 'learning_rate': 1.7235066365185549e-06, 'epoch': 1.63} {'loss': 0.2785, 'learning_rate': 1.7233180752239643e-06, 'epoch': 1.63} {'loss': 0.2711, 'learning_rate': 1.72312952327217e-06, 'epoch': 1.63} {'loss': 0.2164, 'learning_rate': 1.7229409806633922e-06, 'epoch': 1.63} {'loss': 0.2473, 'learning_rate': 1.7227524473978374e-06, 'epoch': 1.63} {'loss': 0.3046, 'learning_rate': 1.722563923475723e-06, 'epoch': 1.63} {'loss': 0.2489, 'learning_rate': 1.7223754088972588e-06, 'epoch': 1.63} {'loss': 0.4397, 'learning_rate': 1.7221869036626604e-06, 'epoch': 1.63} {'loss': 0.3245, 'learning_rate': 1.7219984077721352e-06, 'epoch': 1.63} {'loss': 0.3417, 'learning_rate': 1.7218099212259031e-06, 'epoch': 1.63} {'loss': 0.3798, 'learning_rate': 1.7216214440241741e-06, 'epoch': 1.63} {'loss': 0.2248, 'learning_rate': 1.7214329761671578e-06, 'epoch': 1.63} {'loss': 0.3676, 'learning_rate': 1.7212445176550707e-06, 'epoch': 1.63} {'loss': 0.294, 'learning_rate': 1.7210560684881229e-06, 'epoch': 1.63} {'loss': 0.2757, 'learning_rate': 1.7208676286665304e-06, 'epoch': 1.63} {'loss': 0.2691, 'learning_rate': 1.7206791981905013e-06, 'epoch': 1.63} {'loss': 0.3267, 'learning_rate': 1.720490777060254e-06, 'epoch': 1.63} {'loss': 0.3205, 'learning_rate': 1.7203023652759954e-06, 'epoch': 1.63} {'loss': 0.1892, 'learning_rate': 1.7201139628379416e-06, 'epoch': 1.63} {'loss': 0.3246, 'learning_rate': 1.7199255697463058e-06, 'epoch': 1.63} {'loss': 0.3674, 'learning_rate': 1.719737186001298e-06, 'epoch': 1.63} {'loss': 0.2607, 'learning_rate': 1.7195488116031344e-06, 'epoch': 1.63} {'loss': 0.2949, 'learning_rate': 1.7193604465520242e-06, 'epoch': 1.63} {'loss': 0.1979, 'learning_rate': 1.7191720908481823e-06, 'epoch': 1.63} {'loss': 0.2826, 'learning_rate': 1.718983744491819e-06, 'epoch': 1.63} {'loss': 0.418, 'learning_rate': 1.7187954074831503e-06, 'epoch': 1.63} {'loss': 0.4944, 'learning_rate': 1.7186070798223852e-06, 'epoch': 1.63} {'loss': 0.4063, 'learning_rate': 1.7184187615097392e-06, 'epoch': 1.63} {'loss': 0.3286, 'learning_rate': 1.718230452545422e-06, 'epoch': 1.63} {'loss': 0.2533, 'learning_rate': 1.71804215292965e-06, 'epoch': 1.63} {'loss': 0.2653, 'learning_rate': 1.717853862662634e-06, 'epoch': 1.63} {'loss': 0.212, 'learning_rate': 1.7176655817445831e-06, 'epoch': 1.63} {'loss': 0.4436, 'learning_rate': 1.7174773101757148e-06, 'epoch': 1.63} {'loss': 0.2288, 'learning_rate': 1.7172890479562375e-06, 'epoch': 1.63} {'loss': 0.3812, 'learning_rate': 1.7171007950863682e-06, 'epoch': 1.63} {'loss': 0.2654, 'learning_rate': 1.7169125515663154e-06, 'epoch': 1.63} {'loss': 0.2578, 'learning_rate': 1.7167243173962943e-06, 'epoch': 1.63} {'loss': 0.393, 'learning_rate': 1.716536092576515e-06, 'epoch': 1.63} {'loss': 0.3528, 'learning_rate': 1.716347877107194e-06, 'epoch': 1.63} {'loss': 0.2226, 'learning_rate': 1.7161596709885374e-06, 'epoch': 1.63} {'loss': 0.1449, 'learning_rate': 1.7159714742207646e-06, 'epoch': 1.63} {'loss': 0.3851, 'learning_rate': 1.7157832868040813e-06, 'epoch': 1.63} {'loss': 0.269, 'learning_rate': 1.7155951087387067e-06, 'epoch': 1.63} {'loss': 0.324, 'learning_rate': 1.7154069400248497e-06, 'epoch': 1.63} {'loss': 0.2104, 'learning_rate': 1.7152187806627207e-06, 'epoch': 1.63} {'loss': 0.2398, 'learning_rate': 1.7150306306525366e-06, 'epoch': 1.63} {'loss': 0.379, 'learning_rate': 1.714842489994505e-06, 'epoch': 1.63} {'loss': 0.3252, 'learning_rate': 1.714654358688843e-06, 'epoch': 1.63} {'loss': 0.3521, 'learning_rate': 1.7144662367357578e-06, 'epoch': 1.63} {'loss': 0.2678, 'learning_rate': 1.7142781241354678e-06, 'epoch': 1.63} {'loss': 0.2839, 'learning_rate': 1.7140900208881795e-06, 'epoch': 1.63} {'loss': 0.4045, 'learning_rate': 1.7139019269941105e-06, 'epoch': 1.63} {'loss': 0.2744, 'learning_rate': 1.7137138424534672e-06, 'epoch': 1.63} {'loss': 0.3662, 'learning_rate': 1.7135257672664685e-06, 'epoch': 1.63} {'loss': 0.465, 'learning_rate': 1.7133377014333207e-06, 'epoch': 1.63} {'loss': 0.3622, 'learning_rate': 1.7131496449542417e-06, 'epoch': 1.63} {'loss': 0.3961, 'learning_rate': 1.7129615978294412e-06, 'epoch': 1.63} {'loss': 0.3055, 'learning_rate': 1.7127735600591288e-06, 'epoch': 1.63} {'loss': 0.4491, 'learning_rate': 1.7125855316435215e-06, 'epoch': 1.63} {'loss': 0.4118, 'learning_rate': 1.7123975125828262e-06, 'epoch': 1.63} {'loss': 0.265, 'learning_rate': 1.71220950287726e-06, 'epoch': 1.63} {'loss': 0.2468, 'learning_rate': 1.7120215025270325e-06, 'epoch': 1.63} {'loss': 0.3145, 'learning_rate': 1.711833511532358e-06, 'epoch': 1.63} {'loss': 0.2664, 'learning_rate': 1.7116455298934454e-06, 'epoch': 1.63} {'loss': 0.4576, 'learning_rate': 1.7114575576105108e-06, 'epoch': 1.63} {'loss': 0.3828, 'learning_rate': 1.7112695946837632e-06, 'epoch': 1.63} {'loss': 0.271, 'learning_rate': 1.711081641113418e-06, 'epoch': 1.63} {'loss': 0.3827, 'learning_rate': 1.7108936968996826e-06, 'epoch': 1.63} {'loss': 0.241, 'learning_rate': 1.7107057620427736e-06, 'epoch': 1.63} {'loss': 0.136, 'learning_rate': 1.710517836542903e-06, 'epoch': 1.63} {'loss': 0.2184, 'learning_rate': 1.7103299204002788e-06, 'epoch': 1.63} {'loss': 0.3996, 'learning_rate': 1.710142013615117e-06, 'epoch': 1.63} {'loss': 0.2625, 'learning_rate': 1.7099541161876277e-06, 'epoch': 1.63} {'loss': 0.3965, 'learning_rate': 1.709766228118025e-06, 'epoch': 1.63} {'loss': 0.2521, 'learning_rate': 1.7095783494065176e-06, 'epoch': 1.63} {'loss': 0.2757, 'learning_rate': 1.7093904800533223e-06, 'epoch': 1.63} {'loss': 0.3179, 'learning_rate': 1.7092026200586465e-06, 'epoch': 1.63} {'loss': 0.2153, 'learning_rate': 1.7090147694227067e-06, 'epoch': 1.63} {'loss': 0.254, 'learning_rate': 1.7088269281457093e-06, 'epoch': 1.63} {'loss': 0.2647, 'learning_rate': 1.7086390962278732e-06, 'epoch': 1.63} {'loss': 0.3459, 'learning_rate': 1.7084512736694036e-06, 'epoch': 1.63} {'loss': 0.2877, 'learning_rate': 1.7082634604705194e-06, 'epoch': 1.63} {'loss': 0.3395, 'learning_rate': 1.7080756566314283e-06, 'epoch': 1.63} {'loss': 0.1756, 'learning_rate': 1.7078878621523397e-06, 'epoch': 1.63} {'loss': 0.3299, 'learning_rate': 1.7077000770334728e-06, 'epoch': 1.63} {'loss': 0.3043, 'learning_rate': 1.7075123012750327e-06, 'epoch': 1.63} {'loss': 0.4254, 'learning_rate': 1.707324534877236e-06, 'epoch': 1.63} {'loss': 0.3512, 'learning_rate': 1.7071367778402914e-06, 'epoch': 1.63} {'loss': 0.2573, 'learning_rate': 1.7069490301644153e-06, 'epoch': 1.63} {'loss': 0.4534, 'learning_rate': 1.7067612918498133e-06, 'epoch': 1.63} {'loss': 0.2718, 'learning_rate': 1.706573562896704e-06, 'epoch': 1.63} {'loss': 0.3651, 'learning_rate': 1.7063858433052926e-06, 'epoch': 1.63} {'loss': 0.2587, 'learning_rate': 1.7061981330757982e-06, 'epoch': 1.63} {'loss': 0.4731, 'learning_rate': 1.7060104322084258e-06, 'epoch': 1.63} {'loss': 0.3144, 'learning_rate': 1.7058227407033922e-06, 'epoch': 1.63} {'loss': 0.4242, 'learning_rate': 1.7056350585609083e-06, 'epoch': 1.63} {'loss': 0.2015, 'learning_rate': 1.7054473857811825e-06, 'epoch': 1.63} {'loss': 0.2921, 'learning_rate': 1.705259722364433e-06, 'epoch': 1.63} {'loss': 0.2169, 'learning_rate': 1.7050720683108635e-06, 'epoch': 1.63} {'loss': 0.2779, 'learning_rate': 1.704884423620694e-06, 'epoch': 1.63} {'loss': 0.2795, 'learning_rate': 1.70469678829413e-06, 'epoch': 1.63} {'loss': 0.4676, 'learning_rate': 1.704509162331388e-06, 'epoch': 1.63} {'loss': 0.3042, 'learning_rate': 1.7043215457326757e-06, 'epoch': 1.63} {'loss': 0.331, 'learning_rate': 1.704133938498209e-06, 'epoch': 1.63} {'loss': 0.3371, 'learning_rate': 1.7039463406281953e-06, 'epoch': 1.63} {'loss': 0.1591, 'learning_rate': 1.7037587521228505e-06, 'epoch': 1.63} {'loss': 0.3212, 'learning_rate': 1.7035711729823834e-06, 'epoch': 1.63} {'loss': 0.2718, 'learning_rate': 1.7033836032070083e-06, 'epoch': 1.63} {'loss': 0.2687, 'learning_rate': 1.7031960427969353e-06, 'epoch': 1.63} {'loss': 0.3327, 'learning_rate': 1.7030084917523737e-06, 'epoch': 1.63} {'loss': 0.3326, 'learning_rate': 1.7028209500735405e-06, 'epoch': 1.63} {'loss': 0.3145, 'learning_rate': 1.702633417760642e-06, 'epoch': 1.63} {'loss': 0.31, 'learning_rate': 1.7024458948138956e-06, 'epoch': 1.63} {'loss': 0.2778, 'learning_rate': 1.702258381233507e-06, 'epoch': 1.63} {'loss': 0.2637, 'learning_rate': 1.7020708770196936e-06, 'epoch': 1.63} {'loss': 0.3105, 'learning_rate': 1.701883382172661e-06, 'epoch': 1.63} {'loss': 0.2753, 'learning_rate': 1.7016958966926268e-06, 'epoch': 1.63} {'loss': 0.3745, 'learning_rate': 1.7015084205797983e-06, 'epoch': 1.63} {'loss': 0.3632, 'learning_rate': 1.7013209538343878e-06, 'epoch': 1.63} {'loss': 0.2956, 'learning_rate': 1.7011334964566105e-06, 'epoch': 1.63} {'loss': 0.3728, 'learning_rate': 1.7009460484466734e-06, 'epoch': 1.63} {'loss': 0.384, 'learning_rate': 1.7007586098047924e-06, 'epoch': 1.63} {'loss': 0.4575, 'learning_rate': 1.7005711805311743e-06, 'epoch': 1.63} {'loss': 0.2533, 'learning_rate': 1.7003837606260353e-06, 'epoch': 1.63} {'loss': 0.4215, 'learning_rate': 1.7001963500895834e-06, 'epoch': 1.64} {'loss': 0.4406, 'learning_rate': 1.700008948922033e-06, 'epoch': 1.64} {'loss': 0.3286, 'learning_rate': 1.699821557123592e-06, 'epoch': 1.64} {'loss': 0.2852, 'learning_rate': 1.6996341746944756e-06, 'epoch': 1.64} {'loss': 0.2596, 'learning_rate': 1.6994468016348932e-06, 'epoch': 1.64} {'loss': 0.476, 'learning_rate': 1.6992594379450579e-06, 'epoch': 1.64} {'loss': 0.3529, 'learning_rate': 1.6990720836251806e-06, 'epoch': 1.64} {'loss': 0.243, 'learning_rate': 1.6988847386754703e-06, 'epoch': 1.64} {'loss': 0.2631, 'learning_rate': 1.6986974030961422e-06, 'epoch': 1.64} {'loss': 0.3369, 'learning_rate': 1.6985100768874051e-06, 'epoch': 1.64} {'loss': 0.3882, 'learning_rate': 1.6983227600494734e-06, 'epoch': 1.64} {'loss': 0.3073, 'learning_rate': 1.6981354525825532e-06, 'epoch': 1.64} {'loss': 0.3206, 'learning_rate': 1.6979481544868636e-06, 'epoch': 1.64} {'loss': 0.3761, 'learning_rate': 1.6977608657626076e-06, 'epoch': 1.64} {'loss': 0.3345, 'learning_rate': 1.6975735864100052e-06, 'epoch': 1.64} {'loss': 0.1794, 'learning_rate': 1.6973863164292593e-06, 'epoch': 1.64} {'loss': 0.4458, 'learning_rate': 1.6971990558205887e-06, 'epoch': 1.64} {'loss': 0.269, 'learning_rate': 1.6970118045841987e-06, 'epoch': 1.64} {'loss': 0.3284, 'learning_rate': 1.6968245627203062e-06, 'epoch': 1.64} {'loss': 0.4011, 'learning_rate': 1.6966373302291206e-06, 'epoch': 1.64} {'loss': 0.2284, 'learning_rate': 1.6964501071108486e-06, 'epoch': 1.64} {'loss': 0.228, 'learning_rate': 1.6962628933657087e-06, 'epoch': 1.64} {'loss': 0.2228, 'learning_rate': 1.6960756889939068e-06, 'epoch': 1.64} {'loss': 0.3388, 'learning_rate': 1.6958884939956576e-06, 'epoch': 1.64} {'loss': 0.3038, 'learning_rate': 1.6957013083711705e-06, 'epoch': 1.64} {'loss': 0.351, 'learning_rate': 1.695514132120658e-06, 'epoch': 1.64} {'loss': 0.3185, 'learning_rate': 1.6953269652443294e-06, 'epoch': 1.64} {'loss': 0.3052, 'learning_rate': 1.6951398077423998e-06, 'epoch': 1.64} {'loss': 0.3301, 'learning_rate': 1.6949526596150768e-06, 'epoch': 1.64} {'loss': 0.3182, 'learning_rate': 1.6947655208625736e-06, 'epoch': 1.64} {'loss': 0.2169, 'learning_rate': 1.6945783914850989e-06, 'epoch': 1.64} {'loss': 0.2794, 'learning_rate': 1.6943912714828692e-06, 'epoch': 1.64} {'loss': 0.3412, 'learning_rate': 1.694204160856091e-06, 'epoch': 1.64} {'loss': 0.2973, 'learning_rate': 1.6940170596049754e-06, 'epoch': 1.64} {'loss': 0.382, 'learning_rate': 1.6938299677297377e-06, 'epoch': 1.64} {'loss': 0.3455, 'learning_rate': 1.6936428852305831e-06, 'epoch': 1.64} {'loss': 0.1952, 'learning_rate': 1.6934558121077294e-06, 'epoch': 1.64} {'loss': 0.3217, 'learning_rate': 1.6932687483613818e-06, 'epoch': 1.64} {'loss': 0.2482, 'learning_rate': 1.6930816939917571e-06, 'epoch': 1.64} {'loss': 0.2679, 'learning_rate': 1.6928946489990605e-06, 'epoch': 1.64} {'loss': 0.308, 'learning_rate': 1.6927076133835085e-06, 'epoch': 1.64} {'loss': 0.3389, 'learning_rate': 1.6925205871453076e-06, 'epoch': 1.64} {'loss': 0.2465, 'learning_rate': 1.6923335702846733e-06, 'epoch': 1.64} {'loss': 0.3291, 'learning_rate': 1.692146562801813e-06, 'epoch': 1.64} {'loss': 0.1927, 'learning_rate': 1.6919595646969412e-06, 'epoch': 1.64} {'loss': 0.2308, 'learning_rate': 1.6917725759702675e-06, 'epoch': 1.64} {'loss': 0.3778, 'learning_rate': 1.6915855966220007e-06, 'epoch': 1.64} {'loss': 0.2787, 'learning_rate': 1.6913986266523552e-06, 'epoch': 1.64} {'loss': 0.2175, 'learning_rate': 1.6912116660615397e-06, 'epoch': 1.64} {'loss': 0.2731, 'learning_rate': 1.6910247148497672e-06, 'epoch': 1.64} {'loss': 0.3299, 'learning_rate': 1.6908377730172465e-06, 'epoch': 1.64} {'loss': 0.373, 'learning_rate': 1.6906508405641919e-06, 'epoch': 1.64} {'loss': 0.2338, 'learning_rate': 1.6904639174908099e-06, 'epoch': 1.64} {'loss': 0.3721, 'learning_rate': 1.690277003797316e-06, 'epoch': 1.64} {'loss': 0.2444, 'learning_rate': 1.6900900994839177e-06, 'epoch': 1.64} {'loss': 0.4085, 'learning_rate': 1.689903204550829e-06, 'epoch': 1.64} {'loss': 0.2862, 'learning_rate': 1.689716318998258e-06, 'epoch': 1.64} {'loss': 0.3338, 'learning_rate': 1.6895294428264187e-06, 'epoch': 1.64} {'loss': 0.361, 'learning_rate': 1.6893425760355198e-06, 'epoch': 1.64} {'loss': 0.4014, 'learning_rate': 1.6891557186257712e-06, 'epoch': 1.64} {'loss': 0.2669, 'learning_rate': 1.6889688705973871e-06, 'epoch': 1.64} {'loss': 0.2251, 'learning_rate': 1.6887820319505755e-06, 'epoch': 1.64} {'loss': 0.3611, 'learning_rate': 1.6885952026855501e-06, 'epoch': 1.64} {'loss': 0.2158, 'learning_rate': 1.6884083828025177e-06, 'epoch': 1.64} {'loss': 0.3478, 'learning_rate': 1.6882215723016948e-06, 'epoch': 1.64} {'loss': 0.3395, 'learning_rate': 1.6880347711832857e-06, 'epoch': 1.64} {'loss': 0.2771, 'learning_rate': 1.6878479794475079e-06, 'epoch': 1.64} {'loss': 0.3544, 'learning_rate': 1.6876611970945667e-06, 'epoch': 1.64} {'loss': 0.4141, 'learning_rate': 1.6874744241246777e-06, 'epoch': 1.64} {'loss': 0.3034, 'learning_rate': 1.6872876605380472e-06, 'epoch': 1.64} {'loss': 0.2404, 'learning_rate': 1.6871009063348908e-06, 'epoch': 1.64} {'loss': 0.4412, 'learning_rate': 1.686914161515416e-06, 'epoch': 1.64} {'loss': 0.3771, 'learning_rate': 1.6867274260798316e-06, 'epoch': 1.64} {'loss': 0.3692, 'learning_rate': 1.6865407000283541e-06, 'epoch': 1.64} {'loss': 0.3451, 'learning_rate': 1.6863539833611898e-06, 'epoch': 1.64} {'loss': 0.4354, 'learning_rate': 1.6861672760785519e-06, 'epoch': 1.64} {'loss': 0.3054, 'learning_rate': 1.6859805781806483e-06, 'epoch': 1.64} {'loss': 0.3115, 'learning_rate': 1.685793889667694e-06, 'epoch': 1.64} {'loss': 0.2613, 'learning_rate': 1.6856072105398947e-06, 'epoch': 1.64} {'loss': 0.2949, 'learning_rate': 1.6854205407974667e-06, 'epoch': 1.64} {'loss': 0.2093, 'learning_rate': 1.6852338804406154e-06, 'epoch': 1.64} {'loss': 0.4847, 'learning_rate': 1.6850472294695564e-06, 'epoch': 1.64} {'loss': 0.2756, 'learning_rate': 1.6848605878844947e-06, 'epoch': 1.64} {'loss': 0.3407, 'learning_rate': 1.6846739556856473e-06, 'epoch': 1.64} {'loss': 0.4099, 'learning_rate': 1.6844873328732214e-06, 'epoch': 1.64} {'loss': 0.4251, 'learning_rate': 1.684300719447426e-06, 'epoch': 1.64} {'loss': 0.3983, 'learning_rate': 1.684114115408476e-06, 'epoch': 1.64} {'loss': 0.374, 'learning_rate': 1.6839275207565774e-06, 'epoch': 1.64} {'loss': 0.2249, 'learning_rate': 1.6837409354919466e-06, 'epoch': 1.64} {'loss': 0.302, 'learning_rate': 1.6835543596147875e-06, 'epoch': 1.64} {'loss': 0.3641, 'learning_rate': 1.6833677931253156e-06, 'epoch': 1.64} {'loss': 0.3775, 'learning_rate': 1.6831812360237387e-06, 'epoch': 1.64} {'loss': 0.3883, 'learning_rate': 1.682994688310271e-06, 'epoch': 1.64} {'loss': 0.3038, 'learning_rate': 1.682808149985119e-06, 'epoch': 1.64} {'loss': 0.2105, 'learning_rate': 1.6826216210484937e-06, 'epoch': 1.64} {'loss': 0.2996, 'learning_rate': 1.6824351015006102e-06, 'epoch': 1.64} {'loss': 0.2393, 'learning_rate': 1.6822485913416731e-06, 'epoch': 1.64} {'loss': 0.2395, 'learning_rate': 1.6820620905718987e-06, 'epoch': 1.64} {'loss': 0.3394, 'learning_rate': 1.6818755991914915e-06, 'epoch': 1.64} {'loss': 0.3748, 'learning_rate': 1.6816891172006667e-06, 'epoch': 1.64} {'loss': 0.5349, 'learning_rate': 1.681502644599632e-06, 'epoch': 1.64} {'loss': 0.3739, 'learning_rate': 1.6813161813886003e-06, 'epoch': 1.64} {'loss': 0.3786, 'learning_rate': 1.6811297275677785e-06, 'epoch': 1.64} {'loss': 0.4205, 'learning_rate': 1.6809432831373829e-06, 'epoch': 1.64} {'loss': 0.3653, 'learning_rate': 1.6807568480976165e-06, 'epoch': 1.64} {'loss': 0.2588, 'learning_rate': 1.6805704224486963e-06, 'epoch': 1.64} {'loss': 0.387, 'learning_rate': 1.6803840061908304e-06, 'epoch': 1.64} {'loss': 0.2946, 'learning_rate': 1.680197599324227e-06, 'epoch': 1.64} {'loss': 0.1677, 'learning_rate': 1.680011201849101e-06, 'epoch': 1.64} {'loss': 0.365, 'learning_rate': 1.679824813765657e-06, 'epoch': 1.64} {'loss': 0.2986, 'learning_rate': 1.6796384350741113e-06, 'epoch': 1.64} {'loss': 0.2598, 'learning_rate': 1.6794520657746693e-06, 'epoch': 1.64} {'loss': 0.1335, 'learning_rate': 1.6792657058675455e-06, 'epoch': 1.64} {'loss': 0.3401, 'learning_rate': 1.679079355352946e-06, 'epoch': 1.64} {'loss': 0.1975, 'learning_rate': 1.6788930142310867e-06, 'epoch': 1.64} {'loss': 0.3246, 'learning_rate': 1.6787066825021726e-06, 'epoch': 1.64} {'loss': 0.4406, 'learning_rate': 1.6785203601664192e-06, 'epoch': 1.64} {'loss': 0.3049, 'learning_rate': 1.6783340472240295e-06, 'epoch': 1.64} {'loss': 0.334, 'learning_rate': 1.6781477436752224e-06, 'epoch': 1.64} {'loss': 0.2863, 'learning_rate': 1.6779614495202035e-06, 'epoch': 1.64} {'loss': 0.331, 'learning_rate': 1.6777751647591812e-06, 'epoch': 1.64} {'loss': 0.4725, 'learning_rate': 1.677588889392371e-06, 'epoch': 1.64} {'loss': 0.3172, 'learning_rate': 1.677402623419977e-06, 'epoch': 1.64} {'loss': 0.3071, 'learning_rate': 1.677216366842216e-06, 'epoch': 1.64} {'loss': 0.3414, 'learning_rate': 1.677030119659292e-06, 'epoch': 1.64} {'loss': 0.2319, 'learning_rate': 1.6768438818714216e-06, 'epoch': 1.64} {'loss': 0.4008, 'learning_rate': 1.6766576534788082e-06, 'epoch': 1.64} {'loss': 0.4476, 'learning_rate': 1.676471434481669e-06, 'epoch': 1.64} {'loss': 0.3051, 'learning_rate': 1.6762852248802075e-06, 'epoch': 1.64} {'loss': 0.3128, 'learning_rate': 1.6760990246746401e-06, 'epoch': 1.64} {'loss': 0.2589, 'learning_rate': 1.675912833865172e-06, 'epoch': 1.64} {'loss': 0.2988, 'learning_rate': 1.6757266524520177e-06, 'epoch': 1.64} {'loss': 0.3146, 'learning_rate': 1.6755404804353847e-06, 'epoch': 1.64} {'loss': 0.3146, 'learning_rate': 1.6753543178154808e-06, 'epoch': 1.64} {'loss': 0.3282, 'learning_rate': 1.6751681645925222e-06, 'epoch': 1.64} {'loss': 0.3451, 'learning_rate': 1.6749820207667123e-06, 'epoch': 1.64} {'loss': 0.3467, 'learning_rate': 1.6747958863382674e-06, 'epoch': 1.64} {'loss': 0.3441, 'learning_rate': 1.674609761307393e-06, 'epoch': 1.64} {'loss': 0.2614, 'learning_rate': 1.6744236456743023e-06, 'epoch': 1.64} {'loss': 0.3256, 'learning_rate': 1.674237539439203e-06, 'epoch': 1.64} {'loss': 0.2339, 'learning_rate': 1.674051442602308e-06, 'epoch': 1.64} {'loss': 0.3867, 'learning_rate': 1.673865355163823e-06, 'epoch': 1.64} {'loss': 0.131, 'learning_rate': 1.673679277123964e-06, 'epoch': 1.64} {'loss': 0.2968, 'learning_rate': 1.6734932084829346e-06, 'epoch': 1.64} {'loss': 0.2889, 'learning_rate': 1.6733071492409503e-06, 'epoch': 1.64} {'loss': 0.3171, 'learning_rate': 1.6731210993982195e-06, 'epoch': 1.64} {'loss': 0.2836, 'learning_rate': 1.6729350589549488e-06, 'epoch': 1.64} {'loss': 0.4615, 'learning_rate': 1.6727490279113534e-06, 'epoch': 1.64} {'loss': 0.2097, 'learning_rate': 1.672563006267638e-06, 'epoch': 1.64} {'loss': 0.2284, 'learning_rate': 1.6723769940240187e-06, 'epoch': 1.64} {'loss': 0.3236, 'learning_rate': 1.672190991180699e-06, 'epoch': 1.64} {'loss': 0.3886, 'learning_rate': 1.672004997737895e-06, 'epoch': 1.64} {'loss': 0.3409, 'learning_rate': 1.6718190136958112e-06, 'epoch': 1.64} {'loss': 0.4471, 'learning_rate': 1.6716330390546621e-06, 'epoch': 1.64} {'loss': 0.3378, 'learning_rate': 1.6714470738146538e-06, 'epoch': 1.64} {'loss': 0.3172, 'learning_rate': 1.6712611179760008e-06, 'epoch': 1.64} {'loss': 0.2998, 'learning_rate': 1.671075171538906e-06, 'epoch': 1.64} {'loss': 0.4278, 'learning_rate': 1.6708892345035876e-06, 'epoch': 1.64} {'loss': 0.4388, 'learning_rate': 1.6707033068702504e-06, 'epoch': 1.64} {'loss': 0.2205, 'learning_rate': 1.6705173886391034e-06, 'epoch': 1.64} {'loss': 0.3471, 'learning_rate': 1.670331479810361e-06, 'epoch': 1.64} {'loss': 0.4111, 'learning_rate': 1.6701455803842282e-06, 'epoch': 1.64} {'loss': 0.276, 'learning_rate': 1.6699596903609184e-06, 'epoch': 1.64} {'loss': 0.1812, 'learning_rate': 1.669773809740638e-06, 'epoch': 1.64} {'loss': 0.3481, 'learning_rate': 1.6695879385236014e-06, 'epoch': 1.64} {'loss': 0.4333, 'learning_rate': 1.669402076710014e-06, 'epoch': 1.64} {'loss': 0.205, 'learning_rate': 1.6692162243000898e-06, 'epoch': 1.64} {'loss': 0.2604, 'learning_rate': 1.6690303812940333e-06, 'epoch': 1.64} {'loss': 0.3472, 'learning_rate': 1.6688445476920602e-06, 'epoch': 1.64} {'loss': 0.211, 'learning_rate': 1.668658723494374e-06, 'epoch': 1.64} {'loss': 0.4004, 'learning_rate': 1.6684729087011918e-06, 'epoch': 1.64} {'loss': 0.2771, 'learning_rate': 1.668287103312719e-06, 'epoch': 1.64} {'loss': 0.1766, 'learning_rate': 1.6681013073291618e-06, 'epoch': 1.64} {'loss': 0.1424, 'learning_rate': 1.6679155207507381e-06, 'epoch': 1.64} {'loss': 0.321, 'learning_rate': 1.6677297435776495e-06, 'epoch': 1.64} {'loss': 0.3388, 'learning_rate': 1.667543975810113e-06, 'epoch': 1.64} {'loss': 0.4154, 'learning_rate': 1.6673582174483327e-06, 'epoch': 1.64} {'loss': 0.2449, 'learning_rate': 1.6671724684925217e-06, 'epoch': 1.64} {'loss': 0.3219, 'learning_rate': 1.6669867289428864e-06, 'epoch': 1.64} {'loss': 0.3876, 'learning_rate': 1.6668009987996413e-06, 'epoch': 1.64} {'loss': 0.3478, 'learning_rate': 1.6666152780629907e-06, 'epoch': 1.64} {'loss': 0.475, 'learning_rate': 1.6664295667331497e-06, 'epoch': 1.64} {'loss': 0.2776, 'learning_rate': 1.6662438648103218e-06, 'epoch': 1.64} {'loss': 0.3724, 'learning_rate': 1.6660581722947223e-06, 'epoch': 1.64} {'loss': 0.2984, 'learning_rate': 1.6658724891865584e-06, 'epoch': 1.64} {'loss': 0.3004, 'learning_rate': 1.6656868154860374e-06, 'epoch': 1.64} {'loss': 0.2855, 'learning_rate': 1.6655011511933738e-06, 'epoch': 1.64} {'loss': 0.2197, 'learning_rate': 1.6653154963087715e-06, 'epoch': 1.64} {'loss': 0.3319, 'learning_rate': 1.6651298508324464e-06, 'epoch': 1.64} {'loss': 0.2934, 'learning_rate': 1.6649442147646012e-06, 'epoch': 1.64} {'loss': 0.3289, 'learning_rate': 1.6647585881054518e-06, 'epoch': 1.64} {'loss': 0.1856, 'learning_rate': 1.6645729708552027e-06, 'epoch': 1.64} {'loss': 0.3417, 'learning_rate': 1.6643873630140662e-06, 'epoch': 1.64} {'loss': 0.2908, 'learning_rate': 1.6642017645822527e-06, 'epoch': 1.64} {'loss': 0.433, 'learning_rate': 1.6640161755599682e-06, 'epoch': 1.64} {'loss': 0.2041, 'learning_rate': 1.6638305959474277e-06, 'epoch': 1.64} {'loss': 0.4038, 'learning_rate': 1.6636450257448333e-06, 'epoch': 1.64} {'loss': 0.2568, 'learning_rate': 1.6634594649524017e-06, 'epoch': 1.64} {'loss': 0.3097, 'learning_rate': 1.6632739135703369e-06, 'epoch': 1.64} {'loss': 0.3338, 'learning_rate': 1.6630883715988522e-06, 'epoch': 1.64} {'loss': 0.2862, 'learning_rate': 1.662902839038153e-06, 'epoch': 1.64} {'loss': 0.2619, 'learning_rate': 1.6627173158884546e-06, 'epoch': 1.64} {'loss': 0.1496, 'learning_rate': 1.6625318021499593e-06, 'epoch': 1.64} {'loss': 0.2843, 'learning_rate': 1.6623462978228833e-06, 'epoch': 1.64} {'loss': 0.289, 'learning_rate': 1.6621608029074332e-06, 'epoch': 1.64} {'loss': 0.3004, 'learning_rate': 1.6619753174038146e-06, 'epoch': 1.64} {'loss': 0.2191, 'learning_rate': 1.6617898413122435e-06, 'epoch': 1.64} {'loss': 0.2332, 'learning_rate': 1.6616043746329237e-06, 'epoch': 1.64} {'loss': 0.2204, 'learning_rate': 1.6614189173660688e-06, 'epoch': 1.64} {'loss': 0.2767, 'learning_rate': 1.6612334695118837e-06, 'epoch': 1.64} {'loss': 0.2621, 'learning_rate': 1.6610480310705834e-06, 'epoch': 1.64} {'loss': 0.4355, 'learning_rate': 1.6608626020423713e-06, 'epoch': 1.64} {'loss': 0.346, 'learning_rate': 1.6606771824274627e-06, 'epoch': 1.64} {'loss': 0.2842, 'learning_rate': 1.6604917722260604e-06, 'epoch': 1.64} {'loss': 0.1826, 'learning_rate': 1.6603063714383793e-06, 'epoch': 1.64} {'loss': 0.2365, 'learning_rate': 1.6601209800646245e-06, 'epoch': 1.64} {'loss': 0.2426, 'learning_rate': 1.6599355981050102e-06, 'epoch': 1.64} {'loss': 0.2281, 'learning_rate': 1.659750225559742e-06, 'epoch': 1.64} {'loss': 0.349, 'learning_rate': 1.6595648624290283e-06, 'epoch': 1.64} {'loss': 0.3817, 'learning_rate': 1.6593795087130816e-06, 'epoch': 1.64} {'loss': 0.3111, 'learning_rate': 1.6591941644121069e-06, 'epoch': 1.64} {'loss': 0.3603, 'learning_rate': 1.6590088295263184e-06, 'epoch': 1.64} {'loss': 0.29, 'learning_rate': 1.6588235040559197e-06, 'epoch': 1.64} {'loss': 0.2816, 'learning_rate': 1.6586381880011271e-06, 'epoch': 1.64} {'loss': 0.4132, 'learning_rate': 1.6584528813621415e-06, 'epoch': 1.64} {'loss': 0.3291, 'learning_rate': 1.6582675841391804e-06, 'epoch': 1.64} {'loss': 0.2602, 'learning_rate': 1.658082296332446e-06, 'epoch': 1.64} {'loss': 0.404, 'learning_rate': 1.6578970179421528e-06, 'epoch': 1.64} {'loss': 0.3781, 'learning_rate': 1.6577117489685045e-06, 'epoch': 1.64} {'loss': 0.2869, 'learning_rate': 1.6575264894117172e-06, 'epoch': 1.64} {'loss': 0.255, 'learning_rate': 1.6573412392719945e-06, 'epoch': 1.64} {'loss': 0.3062, 'learning_rate': 1.6571559985495455e-06, 'epoch': 1.64} {'loss': 0.2532, 'learning_rate': 1.6569707672445834e-06, 'epoch': 1.64} {'loss': 0.2562, 'learning_rate': 1.6567855453573123e-06, 'epoch': 1.64} {'loss': 0.3246, 'learning_rate': 1.6566003328879454e-06, 'epoch': 1.64} {'loss': 0.4012, 'learning_rate': 1.6564151298366893e-06, 'epoch': 1.64} {'loss': 0.2635, 'learning_rate': 1.656229936203755e-06, 'epoch': 1.64} {'loss': 0.4204, 'learning_rate': 1.6560447519893486e-06, 'epoch': 1.64} {'loss': 0.2988, 'learning_rate': 1.6558595771936837e-06, 'epoch': 1.64} {'loss': 0.2446, 'learning_rate': 1.6556744118169632e-06, 'epoch': 1.64} {'loss': 0.2088, 'learning_rate': 1.6554892558594028e-06, 'epoch': 1.64} {'loss': 0.5264, 'learning_rate': 1.6553041093212053e-06, 'epoch': 1.64} {'loss': 0.4477, 'learning_rate': 1.6551189722025851e-06, 'epoch': 1.64} {'loss': 0.2068, 'learning_rate': 1.65493384450375e-06, 'epoch': 1.64} {'loss': 0.3232, 'learning_rate': 1.654748726224904e-06, 'epoch': 1.64} {'loss': 0.3744, 'learning_rate': 1.6545636173662626e-06, 'epoch': 1.64} {'loss': 0.3335, 'learning_rate': 1.654378517928029e-06, 'epoch': 1.64} {'loss': 0.1768, 'learning_rate': 1.6541934279104176e-06, 'epoch': 1.64} {'loss': 0.3515, 'learning_rate': 1.6540083473136326e-06, 'epoch': 1.64} {'loss': 0.3339, 'learning_rate': 1.6538232761378882e-06, 'epoch': 1.64} {'loss': 0.2196, 'learning_rate': 1.6536382143833873e-06, 'epoch': 1.64} {'loss': 0.4432, 'learning_rate': 1.6534531620503435e-06, 'epoch': 1.64} {'loss': 0.3815, 'learning_rate': 1.653268119138962e-06, 'epoch': 1.64} {'loss': 0.2884, 'learning_rate': 1.6530830856494562e-06, 'epoch': 1.64} {'loss': 0.2016, 'learning_rate': 1.65289806158203e-06, 'epoch': 1.64} {'loss': 0.3352, 'learning_rate': 1.6527130469368968e-06, 'epoch': 1.64} {'loss': 0.426, 'learning_rate': 1.652528041714263e-06, 'epoch': 1.64} {'loss': 0.1926, 'learning_rate': 1.6523430459143352e-06, 'epoch': 1.64} {'loss': 0.2054, 'learning_rate': 1.6521580595373277e-06, 'epoch': 1.64} {'loss': 0.2333, 'learning_rate': 1.6519730825834435e-06, 'epoch': 1.64} {'loss': 0.2895, 'learning_rate': 1.651788115052897e-06, 'epoch': 1.64} {'loss': 0.3126, 'learning_rate': 1.6516031569458912e-06, 'epoch': 1.64} {'loss': 0.1856, 'learning_rate': 1.6514182082626407e-06, 'epoch': 1.64} {'loss': 0.3621, 'learning_rate': 1.6512332690033494e-06, 'epoch': 1.64} {'loss': 0.2452, 'learning_rate': 1.6510483391682308e-06, 'epoch': 1.64} {'loss': 0.0965, 'learning_rate': 1.6508634187574878e-06, 'epoch': 1.64} {'loss': 0.1564, 'learning_rate': 1.650678507771335e-06, 'epoch': 1.64} {'loss': 0.3095, 'learning_rate': 1.6504936062099763e-06, 'epoch': 1.64} {'loss': 0.423, 'learning_rate': 1.6503087140736251e-06, 'epoch': 1.64} {'loss': 0.3734, 'learning_rate': 1.6501238313624846e-06, 'epoch': 1.64} {'loss': 0.2232, 'learning_rate': 1.6499389580767689e-06, 'epoch': 1.64} {'loss': 0.2046, 'learning_rate': 1.6497540942166846e-06, 'epoch': 1.64} {'loss': 0.3639, 'learning_rate': 1.6495692397824382e-06, 'epoch': 1.64} {'loss': 0.3228, 'learning_rate': 1.6493843947742417e-06, 'epoch': 1.64} {'loss': 0.3366, 'learning_rate': 1.6491995591923004e-06, 'epoch': 1.64} {'loss': 0.2496, 'learning_rate': 1.6490147330368266e-06, 'epoch': 1.64} {'loss': 0.2201, 'learning_rate': 1.6488299163080257e-06, 'epoch': 1.64} {'loss': 0.4248, 'learning_rate': 1.6486451090061095e-06, 'epoch': 1.64} {'loss': 0.3445, 'learning_rate': 1.6484603111312824e-06, 'epoch': 1.64} {'loss': 0.3013, 'learning_rate': 1.6482755226837588e-06, 'epoch': 1.64} {'loss': 0.3493, 'learning_rate': 1.6480907436637407e-06, 'epoch': 1.64} {'loss': 0.2722, 'learning_rate': 1.647905974071442e-06, 'epoch': 1.64} {'loss': 0.2115, 'learning_rate': 1.6477212139070676e-06, 'epoch': 1.64} {'loss': 0.2749, 'learning_rate': 1.6475364631708302e-06, 'epoch': 1.64} {'loss': 0.2338, 'learning_rate': 1.6473517218629353e-06, 'epoch': 1.64} {'loss': 0.2458, 'learning_rate': 1.6471669899835896e-06, 'epoch': 1.64} {'loss': 0.2818, 'learning_rate': 1.6469822675330071e-06, 'epoch': 1.64} {'loss': 0.3296, 'learning_rate': 1.64679755451139e-06, 'epoch': 1.64} {'loss': 0.2536, 'learning_rate': 1.6466128509189527e-06, 'epoch': 1.64} {'loss': 0.2272, 'learning_rate': 1.6464281567558993e-06, 'epoch': 1.64} {'loss': 0.3766, 'learning_rate': 1.6462434720224419e-06, 'epoch': 1.64} {'loss': 0.2604, 'learning_rate': 1.6460587967187846e-06, 'epoch': 1.64} {'loss': 0.4402, 'learning_rate': 1.6458741308451377e-06, 'epoch': 1.64} {'loss': 0.3293, 'learning_rate': 1.6456894744017138e-06, 'epoch': 1.64} {'loss': 0.3789, 'learning_rate': 1.6455048273887142e-06, 'epoch': 1.64} {'loss': 0.1801, 'learning_rate': 1.6453201898063542e-06, 'epoch': 1.64} {'loss': 0.3095, 'learning_rate': 1.645135561654837e-06, 'epoch': 1.64} {'loss': 0.1698, 'learning_rate': 1.6449509429343746e-06, 'epoch': 1.64} {'loss': 0.2714, 'learning_rate': 1.6447663336451724e-06, 'epoch': 1.64} {'loss': 0.4166, 'learning_rate': 1.6445817337874414e-06, 'epoch': 1.64} {'loss': 0.3692, 'learning_rate': 1.644397143361387e-06, 'epoch': 1.64} {'loss': 0.3076, 'learning_rate': 1.644212562367221e-06, 'epoch': 1.64} {'loss': 0.2893, 'learning_rate': 1.6440279908051492e-06, 'epoch': 1.64} {'loss': 0.2171, 'learning_rate': 1.6438434286753824e-06, 'epoch': 1.64} {'loss': 0.2547, 'learning_rate': 1.643658875978127e-06, 'epoch': 1.64} {'loss': 0.1776, 'learning_rate': 1.6434743327135893e-06, 'epoch': 1.64} {'loss': 0.3502, 'learning_rate': 1.6432897988819829e-06, 'epoch': 1.64} {'loss': 0.4011, 'learning_rate': 1.6431052744835108e-06, 'epoch': 1.64} {'loss': 0.281, 'learning_rate': 1.642920759518386e-06, 'epoch': 1.64} {'loss': 0.3195, 'learning_rate': 1.6427362539868119e-06, 'epoch': 1.64} {'loss': 0.1768, 'learning_rate': 1.6425517578890015e-06, 'epoch': 1.64} {'loss': 0.2694, 'learning_rate': 1.6423672712251593e-06, 'epoch': 1.64} {'loss': 0.3751, 'learning_rate': 1.6421827939954971e-06, 'epoch': 1.64} {'loss': 0.389, 'learning_rate': 1.6419983262002193e-06, 'epoch': 1.64} {'loss': 0.5025, 'learning_rate': 1.6418138678395379e-06, 'epoch': 1.64} {'loss': 0.3745, 'learning_rate': 1.6416294189136572e-06, 'epoch': 1.64} {'loss': 0.2898, 'learning_rate': 1.6414449794227894e-06, 'epoch': 1.64} {'loss': 0.3325, 'learning_rate': 1.6412605493671418e-06, 'epoch': 1.64} {'loss': 0.3214, 'learning_rate': 1.641076128746918e-06, 'epoch': 1.64} {'loss': 0.3597, 'learning_rate': 1.6408917175623328e-06, 'epoch': 1.64} {'loss': 0.4844, 'learning_rate': 1.6407073158135878e-06, 'epoch': 1.64} {'loss': 0.1687, 'learning_rate': 1.6405229235008978e-06, 'epoch': 1.64} {'loss': 0.4308, 'learning_rate': 1.6403385406244666e-06, 'epoch': 1.64} {'loss': 0.32, 'learning_rate': 1.6401541671845046e-06, 'epoch': 1.64} {'loss': 0.2333, 'learning_rate': 1.6399698031812161e-06, 'epoch': 1.64} {'loss': 0.3895, 'learning_rate': 1.6397854486148145e-06, 'epoch': 1.64} {'loss': 0.1544, 'learning_rate': 1.639601103485504e-06, 'epoch': 1.64} {'loss': 0.3164, 'learning_rate': 1.6394167677934959e-06, 'epoch': 1.64} {'loss': 0.2824, 'learning_rate': 1.6392324415389937e-06, 'epoch': 1.64} {'loss': 0.3631, 'learning_rate': 1.6390481247222112e-06, 'epoch': 1.64} {'loss': 0.3512, 'learning_rate': 1.6388638173433525e-06, 'epoch': 1.64} {'loss': 0.2112, 'learning_rate': 1.638679519402625e-06, 'epoch': 1.64} {'loss': 0.3664, 'learning_rate': 1.6384952309002411e-06, 'epoch': 1.64} {'loss': 0.3581, 'learning_rate': 1.6383109518364028e-06, 'epoch': 1.64} {'loss': 0.3173, 'learning_rate': 1.638126682211324e-06, 'epoch': 1.64} {'loss': 0.2156, 'learning_rate': 1.6379424220252083e-06, 'epoch': 1.64} {'loss': 0.183, 'learning_rate': 1.6377581712782675e-06, 'epoch': 1.64} {'loss': 0.3215, 'learning_rate': 1.637573929970705e-06, 'epoch': 1.64} {'loss': 0.44, 'learning_rate': 1.6373896981027338e-06, 'epoch': 1.64} {'loss': 0.2042, 'learning_rate': 1.637205475674557e-06, 'epoch': 1.64} {'loss': 0.3137, 'learning_rate': 1.6370212626863868e-06, 'epoch': 1.64} {'loss': 0.2889, 'learning_rate': 1.6368370591384274e-06, 'epoch': 1.64} {'loss': 0.3632, 'learning_rate': 1.636652865030891e-06, 'epoch': 1.64} {'loss': 0.3961, 'learning_rate': 1.636468680363984e-06, 'epoch': 1.64} {'loss': 0.4471, 'learning_rate': 1.6362845051379106e-06, 'epoch': 1.64} {'loss': 0.2685, 'learning_rate': 1.636100339352883e-06, 'epoch': 1.64} {'loss': 0.239, 'learning_rate': 1.6359161830091065e-06, 'epoch': 1.64} {'loss': 0.2576, 'learning_rate': 1.6357320361067918e-06, 'epoch': 1.64} {'loss': 0.3439, 'learning_rate': 1.6355478986461425e-06, 'epoch': 1.64} {'loss': 0.2876, 'learning_rate': 1.6353637706273718e-06, 'epoch': 1.64} {'loss': 0.2768, 'learning_rate': 1.6351796520506823e-06, 'epoch': 1.64} {'loss': 0.3606, 'learning_rate': 1.6349955429162867e-06, 'epoch': 1.64} {'loss': 0.3979, 'learning_rate': 1.6348114432243889e-06, 'epoch': 1.64} {'loss': 0.2255, 'learning_rate': 1.6346273529752e-06, 'epoch': 1.64} {'loss': 0.2973, 'learning_rate': 1.634443272168923e-06, 'epoch': 1.64} {'loss': 0.3313, 'learning_rate': 1.6342592008057723e-06, 'epoch': 1.64} {'loss': 0.367, 'learning_rate': 1.6340751388859511e-06, 'epoch': 1.64} {'loss': 0.2098, 'learning_rate': 1.6338910864096668e-06, 'epoch': 1.64} {'loss': 0.3819, 'learning_rate': 1.6337070433771308e-06, 'epoch': 1.64} {'loss': 0.3784, 'learning_rate': 1.6335230097885458e-06, 'epoch': 1.64} {'loss': 0.4037, 'learning_rate': 1.633338985644125e-06, 'epoch': 1.64} {'loss': 0.2493, 'learning_rate': 1.6331549709440707e-06, 'epoch': 1.64} {'loss': 0.28, 'learning_rate': 1.6329709656885962e-06, 'epoch': 1.64} {'loss': 0.3126, 'learning_rate': 1.6327869698779042e-06, 'epoch': 1.64} {'loss': 0.2569, 'learning_rate': 1.6326029835122059e-06, 'epoch': 1.64} {'loss': 0.2646, 'learning_rate': 1.6324190065917067e-06, 'epoch': 1.64} {'loss': 0.2057, 'learning_rate': 1.6322350391166165e-06, 'epoch': 1.64} {'loss': 0.3351, 'learning_rate': 1.6320510810871403e-06, 'epoch': 1.64} {'loss': 0.4138, 'learning_rate': 1.6318671325034895e-06, 'epoch': 1.64} {'loss': 0.3196, 'learning_rate': 1.6316831933658694e-06, 'epoch': 1.64} {'loss': 0.4175, 'learning_rate': 1.6314992636744842e-06, 'epoch': 1.64} {'loss': 0.3717, 'learning_rate': 1.6313153434295482e-06, 'epoch': 1.64} {'loss': 0.4265, 'learning_rate': 1.6311314326312632e-06, 'epoch': 1.64} {'loss': 0.203, 'learning_rate': 1.6309475312798428e-06, 'epoch': 1.64} {'loss': 0.1664, 'learning_rate': 1.6307636393754878e-06, 'epoch': 1.64} {'loss': 0.2505, 'learning_rate': 1.6305797569184124e-06, 'epoch': 1.64} {'loss': 0.3715, 'learning_rate': 1.6303958839088175e-06, 'epoch': 1.64} {'loss': 0.3833, 'learning_rate': 1.6302120203469164e-06, 'epoch': 1.64} {'loss': 0.3797, 'learning_rate': 1.630028166232913e-06, 'epoch': 1.64} {'loss': 0.2203, 'learning_rate': 1.6298443215670178e-06, 'epoch': 1.64} {'loss': 0.2578, 'learning_rate': 1.6296604863494348e-06, 'epoch': 1.64} {'loss': 0.4573, 'learning_rate': 1.6294766605803748e-06, 'epoch': 1.64} {'loss': 0.3636, 'learning_rate': 1.6292928442600454e-06, 'epoch': 1.64} {'loss': 0.2234, 'learning_rate': 1.6291090373886486e-06, 'epoch': 1.64} {'loss': 0.2584, 'learning_rate': 1.6289252399664002e-06, 'epoch': 1.64} {'loss': 0.3335, 'learning_rate': 1.6287414519934996e-06, 'epoch': 1.64} {'loss': 0.3156, 'learning_rate': 1.6285576734701603e-06, 'epoch': 1.64} {'loss': 0.3436, 'learning_rate': 1.6283739043965863e-06, 'epoch': 1.64} {'loss': 0.3698, 'learning_rate': 1.6281901447729876e-06, 'epoch': 1.64} {'loss': 0.2904, 'learning_rate': 1.6280063945995683e-06, 'epoch': 1.64} {'loss': 0.3565, 'learning_rate': 1.6278226538765375e-06, 'epoch': 1.64} {'loss': 0.2757, 'learning_rate': 1.6276389226041056e-06, 'epoch': 1.64} {'loss': 0.1604, 'learning_rate': 1.627455200782474e-06, 'epoch': 1.64} {'loss': 0.3784, 'learning_rate': 1.6272714884118568e-06, 'epoch': 1.64} {'loss': 0.3022, 'learning_rate': 1.627087785492455e-06, 'epoch': 1.64} {'loss': 0.296, 'learning_rate': 1.6269040920244816e-06, 'epoch': 1.64} {'loss': 0.3773, 'learning_rate': 1.6267204080081389e-06, 'epoch': 1.64} {'loss': 0.351, 'learning_rate': 1.6265367334436388e-06, 'epoch': 1.64} {'loss': 0.3797, 'learning_rate': 1.6263530683311846e-06, 'epoch': 1.64} {'loss': 0.344, 'learning_rate': 1.626169412670987e-06, 'epoch': 1.64} {'loss': 0.2225, 'learning_rate': 1.6259857664632495e-06, 'epoch': 1.64} {'loss': 0.4592, 'learning_rate': 1.625802129708185e-06, 'epoch': 1.64} {'loss': 0.3356, 'learning_rate': 1.6256185024059934e-06, 'epoch': 1.64} {'loss': 0.3558, 'learning_rate': 1.6254348845568901e-06, 'epoch': 1.64} {'loss': 0.3266, 'learning_rate': 1.6252512761610773e-06, 'epoch': 1.64} {'loss': 0.2628, 'learning_rate': 1.6250676772187612e-06, 'epoch': 1.64} {'loss': 0.4091, 'learning_rate': 1.6248840877301541e-06, 'epoch': 1.64} {'loss': 0.3587, 'learning_rate': 1.624700507695457e-06, 'epoch': 1.64} {'loss': 0.2467, 'learning_rate': 1.6245169371148829e-06, 'epoch': 1.64} {'loss': 0.3955, 'learning_rate': 1.6243333759886347e-06, 'epoch': 1.64} {'loss': 0.3152, 'learning_rate': 1.6241498243169228e-06, 'epoch': 1.64} {'loss': 0.3289, 'learning_rate': 1.6239662820999513e-06, 'epoch': 1.64} {'loss': 0.3022, 'learning_rate': 1.623782749337932e-06, 'epoch': 1.64} {'loss': 0.1932, 'learning_rate': 1.6235992260310662e-06, 'epoch': 1.64} {'loss': 0.1851, 'learning_rate': 1.6234157121795668e-06, 'epoch': 1.64} {'loss': 0.2552, 'learning_rate': 1.6232322077836349e-06, 'epoch': 1.64} {'loss': 0.3062, 'learning_rate': 1.6230487128434835e-06, 'epoch': 1.64} {'loss': 0.3881, 'learning_rate': 1.622865227359318e-06, 'epoch': 1.64} {'loss': 0.242, 'learning_rate': 1.622681751331342e-06, 'epoch': 1.64} {'loss': 0.3587, 'learning_rate': 1.622498284759767e-06, 'epoch': 1.64} {'loss': 0.3769, 'learning_rate': 1.6223148276447964e-06, 'epoch': 1.64} {'loss': 0.3505, 'learning_rate': 1.6221313799866423e-06, 'epoch': 1.64} {'loss': 0.3887, 'learning_rate': 1.6219479417855056e-06, 'epoch': 1.64} {'loss': 0.325, 'learning_rate': 1.6217645130415982e-06, 'epoch': 1.64} {'loss': 0.2988, 'learning_rate': 1.6215810937551246e-06, 'epoch': 1.64} {'loss': 0.3413, 'learning_rate': 1.6213976839262945e-06, 'epoch': 1.64} {'loss': 0.3016, 'learning_rate': 1.6212142835553102e-06, 'epoch': 1.64} {'loss': 0.402, 'learning_rate': 1.6210308926423846e-06, 'epoch': 1.64} {'loss': 0.2171, 'learning_rate': 1.6208475111877197e-06, 'epoch': 1.64} {'loss': 0.3146, 'learning_rate': 1.6206641391915267e-06, 'epoch': 1.64} {'loss': 0.3375, 'learning_rate': 1.6204807766540097e-06, 'epoch': 1.64} {'loss': 0.2658, 'learning_rate': 1.6202974235753756e-06, 'epoch': 1.64} {'loss': 0.2443, 'learning_rate': 1.6201140799558334e-06, 'epoch': 1.64} {'loss': 0.2364, 'learning_rate': 1.6199307457955871e-06, 'epoch': 1.64} {'loss': 0.3026, 'learning_rate': 1.6197474210948473e-06, 'epoch': 1.64} {'loss': 0.3584, 'learning_rate': 1.6195641058538169e-06, 'epoch': 1.64} {'loss': 0.3067, 'learning_rate': 1.6193808000727084e-06, 'epoch': 1.64} {'loss': 0.3853, 'learning_rate': 1.6191975037517217e-06, 'epoch': 1.64} {'loss': 0.2449, 'learning_rate': 1.6190142168910706e-06, 'epoch': 1.64} {'loss': 0.1505, 'learning_rate': 1.618830939490955e-06, 'epoch': 1.64} {'loss': 0.2806, 'learning_rate': 1.6186476715515886e-06, 'epoch': 1.64} {'loss': 0.2281, 'learning_rate': 1.618464413073173e-06, 'epoch': 1.64} {'loss': 0.241, 'learning_rate': 1.6182811640559204e-06, 'epoch': 1.64} {'loss': 0.4249, 'learning_rate': 1.618097924500034e-06, 'epoch': 1.64} {'loss': 0.3417, 'learning_rate': 1.6179146944057177e-06, 'epoch': 1.64} {'loss': 0.1714, 'learning_rate': 1.6177314737731853e-06, 'epoch': 1.64} {'loss': 0.2648, 'learning_rate': 1.6175482626026374e-06, 'epoch': 1.64} {'loss': 0.2394, 'learning_rate': 1.617365060894286e-06, 'epoch': 1.64} {'loss': 0.318, 'learning_rate': 1.6171818686483332e-06, 'epoch': 1.64} {'loss': 0.3568, 'learning_rate': 1.61699868586499e-06, 'epoch': 1.64} {'loss': 0.4099, 'learning_rate': 1.6168155125444585e-06, 'epoch': 1.64} {'loss': 0.2328, 'learning_rate': 1.6166323486869506e-06, 'epoch': 1.64} {'loss': 0.3622, 'learning_rate': 1.6164491942926686e-06, 'epoch': 1.64} {'loss': 0.2593, 'learning_rate': 1.6162660493618244e-06, 'epoch': 1.64} {'loss': 0.4081, 'learning_rate': 1.6160829138946176e-06, 'epoch': 1.64} {'loss': 0.2609, 'learning_rate': 1.6158997878912619e-06, 'epoch': 1.64} {'loss': 0.2094, 'learning_rate': 1.615716671351961e-06, 'epoch': 1.64} {'loss': 0.3326, 'learning_rate': 1.6155335642769199e-06, 'epoch': 1.64} {'loss': 0.3703, 'learning_rate': 1.6153504666663489e-06, 'epoch': 1.64} {'loss': 0.2779, 'learning_rate': 1.6151673785204514e-06, 'epoch': 1.64} {'loss': 0.4078, 'learning_rate': 1.614984299839436e-06, 'epoch': 1.64} {'loss': 0.2863, 'learning_rate': 1.6148012306235084e-06, 'epoch': 1.64} {'loss': 0.4294, 'learning_rate': 1.614618170872877e-06, 'epoch': 1.64} {'loss': 0.4647, 'learning_rate': 1.614435120587744e-06, 'epoch': 1.64} {'loss': 0.3664, 'learning_rate': 1.6142520797683225e-06, 'epoch': 1.64} {'loss': 0.2958, 'learning_rate': 1.6140690484148135e-06, 'epoch': 1.64} {'loss': 0.2708, 'learning_rate': 1.6138860265274282e-06, 'epoch': 1.64} {'loss': 0.2466, 'learning_rate': 1.613703014106368e-06, 'epoch': 1.64} {'loss': 0.3359, 'learning_rate': 1.6135200111518456e-06, 'epoch': 1.64} {'loss': 0.263, 'learning_rate': 1.6133370176640639e-06, 'epoch': 1.64} {'loss': 0.3335, 'learning_rate': 1.6131540336432272e-06, 'epoch': 1.64} {'loss': 0.3019, 'learning_rate': 1.6129710590895475e-06, 'epoch': 1.64} {'loss': 0.2187, 'learning_rate': 1.612788094003226e-06, 'epoch': 1.64} {'loss': 0.2812, 'learning_rate': 1.6126051383844742e-06, 'epoch': 1.64} {'loss': 0.3111, 'learning_rate': 1.6124221922334948e-06, 'epoch': 1.64} {'loss': 0.4164, 'learning_rate': 1.6122392555504973e-06, 'epoch': 1.64} {'loss': 0.315, 'learning_rate': 1.6120563283356838e-06, 'epoch': 1.64} {'loss': 0.3143, 'learning_rate': 1.6118734105892676e-06, 'epoch': 1.64} {'loss': 0.2116, 'learning_rate': 1.611690502311447e-06, 'epoch': 1.64} {'loss': 0.2412, 'learning_rate': 1.6115076035024368e-06, 'epoch': 1.64} {'loss': 0.3564, 'learning_rate': 1.6113247141624355e-06, 'epoch': 1.64} {'loss': 0.4602, 'learning_rate': 1.6111418342916564e-06, 'epoch': 1.64} {'loss': 0.2948, 'learning_rate': 1.6109589638903034e-06, 'epoch': 1.64} {'loss': 0.1831, 'learning_rate': 1.61077610295858e-06, 'epoch': 1.65} {'loss': 0.3719, 'learning_rate': 1.610593251496697e-06, 'epoch': 1.65} {'loss': 0.2899, 'learning_rate': 1.6104104095048567e-06, 'epoch': 1.65} {'loss': 0.2788, 'learning_rate': 1.6102275769832699e-06, 'epoch': 1.65} {'loss': 0.302, 'learning_rate': 1.6100447539321384e-06, 'epoch': 1.65} {'loss': 0.4644, 'learning_rate': 1.6098619403516746e-06, 'epoch': 1.65} {'loss': 0.3957, 'learning_rate': 1.609679136242077e-06, 'epoch': 1.65} {'loss': 0.2611, 'learning_rate': 1.609496341603557e-06, 'epoch': 1.65} {'loss': 0.2562, 'learning_rate': 1.6093135564363228e-06, 'epoch': 1.65} {'loss': 0.443, 'learning_rate': 1.6091307807405753e-06, 'epoch': 1.65} {'loss': 0.3031, 'learning_rate': 1.6089480145165258e-06, 'epoch': 1.65} {'loss': 0.5369, 'learning_rate': 1.6087652577643763e-06, 'epoch': 1.65} {'loss': 0.3664, 'learning_rate': 1.6085825104843366e-06, 'epoch': 1.65} {'loss': 0.3639, 'learning_rate': 1.6083997726766099e-06, 'epoch': 1.65} {'loss': 0.206, 'learning_rate': 1.608217044341407e-06, 'epoch': 1.65} {'loss': 0.3242, 'learning_rate': 1.6080343254789287e-06, 'epoch': 1.65} {'loss': 0.3145, 'learning_rate': 1.6078516160893854e-06, 'epoch': 1.65} {'loss': 0.3225, 'learning_rate': 1.6076689161729798e-06, 'epoch': 1.65} {'loss': 0.3669, 'learning_rate': 1.6074862257299228e-06, 'epoch': 1.65} {'loss': 0.1855, 'learning_rate': 1.6073035447604179e-06, 'epoch': 1.65} {'loss': 0.19, 'learning_rate': 1.6071208732646693e-06, 'epoch': 1.65} {'loss': 0.2664, 'learning_rate': 1.6069382112428865e-06, 'epoch': 1.65} {'loss': 0.3291, 'learning_rate': 1.6067555586952732e-06, 'epoch': 1.65} {'loss': 0.2218, 'learning_rate': 1.6065729156220389e-06, 'epoch': 1.65} {'loss': 0.3686, 'learning_rate': 1.6063902820233846e-06, 'epoch': 1.65} {'loss': 0.3245, 'learning_rate': 1.6062076578995222e-06, 'epoch': 1.65} {'loss': 0.3196, 'learning_rate': 1.606025043250654e-06, 'epoch': 1.65} {'loss': 0.2511, 'learning_rate': 1.6058424380769889e-06, 'epoch': 1.65} {'loss': 0.3253, 'learning_rate': 1.6056598423787285e-06, 'epoch': 1.65} {'loss': 0.4285, 'learning_rate': 1.6054772561560849e-06, 'epoch': 1.65} {'loss': 0.3376, 'learning_rate': 1.6052946794092583e-06, 'epoch': 1.65} {'loss': 0.3598, 'learning_rate': 1.6051121121384604e-06, 'epoch': 1.65} {'loss': 0.2255, 'learning_rate': 1.6049295543438947e-06, 'epoch': 1.65} {'loss': 0.3223, 'learning_rate': 1.6047470060257654e-06, 'epoch': 1.65} {'loss': 0.3486, 'learning_rate': 1.604564467184282e-06, 'epoch': 1.65} {'loss': 0.445, 'learning_rate': 1.6043819378196457e-06, 'epoch': 1.65} {'loss': 0.5005, 'learning_rate': 1.6041994179320697e-06, 'epoch': 1.65} {'loss': 0.319, 'learning_rate': 1.6040169075217526e-06, 'epoch': 1.65} {'loss': 0.3792, 'learning_rate': 1.6038344065889055e-06, 'epoch': 1.65} {'loss': 0.2215, 'learning_rate': 1.6036519151337316e-06, 'epoch': 1.65} {'loss': 0.3361, 'learning_rate': 1.6034694331564404e-06, 'epoch': 1.65} {'loss': 0.3674, 'learning_rate': 1.603286960657232e-06, 'epoch': 1.65} {'loss': 0.2956, 'learning_rate': 1.6031044976363198e-06, 'epoch': 1.65} {'loss': 0.4049, 'learning_rate': 1.602922044093903e-06, 'epoch': 1.65} {'loss': 0.3829, 'learning_rate': 1.602739600030192e-06, 'epoch': 1.65} {'loss': 0.2749, 'learning_rate': 1.602557165445392e-06, 'epoch': 1.65} {'loss': 0.2193, 'learning_rate': 1.6023747403397061e-06, 'epoch': 1.65} {'loss': 0.3408, 'learning_rate': 1.6021923247133442e-06, 'epoch': 1.65} {'loss': 0.1899, 'learning_rate': 1.6020099185665071e-06, 'epoch': 1.65} {'loss': 0.3015, 'learning_rate': 1.6018275218994072e-06, 'epoch': 1.65} {'loss': 0.2562, 'learning_rate': 1.601645134712244e-06, 'epoch': 1.65} {'loss': 0.1998, 'learning_rate': 1.6014627570052289e-06, 'epoch': 1.65} {'loss': 0.1929, 'learning_rate': 1.6012803887785633e-06, 'epoch': 1.65} {'loss': 0.4026, 'learning_rate': 1.6010980300324575e-06, 'epoch': 1.65} {'loss': 0.227, 'learning_rate': 1.6009156807671123e-06, 'epoch': 1.65} {'loss': 0.283, 'learning_rate': 1.6007333409827386e-06, 'epoch': 1.65} {'loss': 0.3707, 'learning_rate': 1.6005510106795374e-06, 'epoch': 1.65} {'loss': 0.4026, 'learning_rate': 1.6003686898577187e-06, 'epoch': 1.65} {'loss': 0.2933, 'learning_rate': 1.6001863785174843e-06, 'epoch': 1.65} {'loss': 0.2158, 'learning_rate': 1.6000040766590453e-06, 'epoch': 1.65} {'loss': 0.3462, 'learning_rate': 1.5998217842826036e-06, 'epoch': 1.65} {'loss': 0.2648, 'learning_rate': 1.5996395013883637e-06, 'epoch': 1.65} {'loss': 0.3358, 'learning_rate': 1.5994572279765352e-06, 'epoch': 1.65} {'loss': 0.2864, 'learning_rate': 1.5992749640473205e-06, 'epoch': 1.65} {'loss': 0.2092, 'learning_rate': 1.599092709600929e-06, 'epoch': 1.65} {'loss': 0.4655, 'learning_rate': 1.598910464637562e-06, 'epoch': 1.65} {'loss': 0.4437, 'learning_rate': 1.5987282291574302e-06, 'epoch': 1.65} {'loss': 0.2375, 'learning_rate': 1.5985460031607335e-06, 'epoch': 1.65} {'loss': 0.3325, 'learning_rate': 1.598363786647683e-06, 'epoch': 1.65} {'loss': 0.3162, 'learning_rate': 1.5981815796184808e-06, 'epoch': 1.65} {'loss': 0.3646, 'learning_rate': 1.5979993820733364e-06, 'epoch': 1.65} {'loss': 0.1932, 'learning_rate': 1.5978171940124498e-06, 'epoch': 1.65} {'loss': 0.2694, 'learning_rate': 1.597635015436032e-06, 'epoch': 1.65} {'loss': 0.4551, 'learning_rate': 1.5974528463442873e-06, 'epoch': 1.65} {'loss': 0.3154, 'learning_rate': 1.5972706867374177e-06, 'epoch': 1.65} {'loss': 0.2981, 'learning_rate': 1.5970885366156342e-06, 'epoch': 1.65} {'loss': 0.2744, 'learning_rate': 1.5969063959791376e-06, 'epoch': 1.65} {'loss': 0.4438, 'learning_rate': 1.5967242648281378e-06, 'epoch': 1.65} {'loss': 0.3611, 'learning_rate': 1.596542143162836e-06, 'epoch': 1.65} {'loss': 0.3243, 'learning_rate': 1.5963600309834427e-06, 'epoch': 1.65} {'loss': 0.3576, 'learning_rate': 1.596177928290158e-06, 'epoch': 1.65} {'loss': 0.3447, 'learning_rate': 1.5959958350831927e-06, 'epoch': 1.65} {'loss': 0.4345, 'learning_rate': 1.595813751362748e-06, 'epoch': 1.65} {'loss': 0.2164, 'learning_rate': 1.5956316771290337e-06, 'epoch': 1.65} {'loss': 0.2988, 'learning_rate': 1.5954496123822515e-06, 'epoch': 1.65} {'loss': 0.2985, 'learning_rate': 1.5952675571226094e-06, 'epoch': 1.65} {'loss': 0.2774, 'learning_rate': 1.5950855113503138e-06, 'epoch': 1.65} {'loss': 0.302, 'learning_rate': 1.5949034750655646e-06, 'epoch': 1.65} {'loss': 0.3512, 'learning_rate': 1.5947214482685736e-06, 'epoch': 1.65} {'loss': 0.2738, 'learning_rate': 1.5945394309595418e-06, 'epoch': 1.65} {'loss': 0.4332, 'learning_rate': 1.5943574231386794e-06, 'epoch': 1.65} {'loss': 0.3483, 'learning_rate': 1.5941754248061858e-06, 'epoch': 1.65} {'loss': 0.3035, 'learning_rate': 1.5939934359622721e-06, 'epoch': 1.65} {'loss': 0.25, 'learning_rate': 1.5938114566071394e-06, 'epoch': 1.65} {'loss': 0.3084, 'learning_rate': 1.5936294867409974e-06, 'epoch': 1.65} {'loss': 0.2361, 'learning_rate': 1.593447526364047e-06, 'epoch': 1.65} {'loss': 0.4112, 'learning_rate': 1.593265575476498e-06, 'epoch': 1.65} {'loss': 0.2602, 'learning_rate': 1.5930836340785504e-06, 'epoch': 1.65} {'loss': 0.2253, 'learning_rate': 1.5929017021704163e-06, 'epoch': 1.65} {'loss': 0.3168, 'learning_rate': 1.5927197797522964e-06, 'epoch': 1.65} {'loss': 0.2744, 'learning_rate': 1.592537866824395e-06, 'epoch': 1.65} {'loss': 0.2748, 'learning_rate': 1.5923559633869223e-06, 'epoch': 1.65} {'loss': 0.2953, 'learning_rate': 1.592174069440079e-06, 'epoch': 1.65} {'loss': 0.2257, 'learning_rate': 1.5919921849840735e-06, 'epoch': 1.65} {'loss': 0.4756, 'learning_rate': 1.5918103100191085e-06, 'epoch': 1.65} {'loss': 0.3071, 'learning_rate': 1.5916284445453933e-06, 'epoch': 1.65} {'loss': 0.2173, 'learning_rate': 1.591446588563128e-06, 'epoch': 1.65} {'loss': 0.264, 'learning_rate': 1.5912647420725203e-06, 'epoch': 1.65} {'loss': 0.2835, 'learning_rate': 1.5910829050737785e-06, 'epoch': 1.65} {'loss': 0.2857, 'learning_rate': 1.590901077567103e-06, 'epoch': 1.65} {'loss': 0.3076, 'learning_rate': 1.590719259552702e-06, 'epoch': 1.65} {'loss': 0.2539, 'learning_rate': 1.5905374510307791e-06, 'epoch': 1.65} {'loss': 0.2788, 'learning_rate': 1.5903556520015417e-06, 'epoch': 1.65} {'loss': 0.3547, 'learning_rate': 1.5901738624651919e-06, 'epoch': 1.65} {'loss': 0.422, 'learning_rate': 1.5899920824219383e-06, 'epoch': 1.65} {'loss': 0.2805, 'learning_rate': 1.5898103118719821e-06, 'epoch': 1.65} {'loss': 0.3276, 'learning_rate': 1.589628550815534e-06, 'epoch': 1.65} {'loss': 0.3722, 'learning_rate': 1.589446799252793e-06, 'epoch': 1.65} {'loss': 0.3229, 'learning_rate': 1.5892650571839696e-06, 'epoch': 1.65} {'loss': 0.2577, 'learning_rate': 1.5890833246092664e-06, 'epoch': 1.65} {'loss': 0.3779, 'learning_rate': 1.588901601528886e-06, 'epoch': 1.65} {'loss': 0.2439, 'learning_rate': 1.5887198879430399e-06, 'epoch': 1.65} {'loss': 0.213, 'learning_rate': 1.5885381838519265e-06, 'epoch': 1.65} {'loss': 0.3248, 'learning_rate': 1.5883564892557556e-06, 'epoch': 1.65} {'loss': 0.3037, 'learning_rate': 1.5881748041547296e-06, 'epoch': 1.65} {'loss': 0.4545, 'learning_rate': 1.5879931285490558e-06, 'epoch': 1.65} {'loss': 0.308, 'learning_rate': 1.5878114624389373e-06, 'epoch': 1.65} {'loss': 0.3146, 'learning_rate': 1.587629805824581e-06, 'epoch': 1.65} {'loss': 0.2535, 'learning_rate': 1.5874481587061896e-06, 'epoch': 1.65} {'loss': 0.4799, 'learning_rate': 1.587266521083971e-06, 'epoch': 1.65} {'loss': 0.1979, 'learning_rate': 1.5870848929581262e-06, 'epoch': 1.65} {'loss': 0.4073, 'learning_rate': 1.5869032743288659e-06, 'epoch': 1.65} {'loss': 0.2438, 'learning_rate': 1.5867216651963923e-06, 'epoch': 1.65} {'loss': 0.3666, 'learning_rate': 1.5865400655609064e-06, 'epoch': 1.65} {'loss': 0.3135, 'learning_rate': 1.5863584754226203e-06, 'epoch': 1.65} {'loss': 0.3225, 'learning_rate': 1.5861768947817324e-06, 'epoch': 1.65} {'loss': 0.3046, 'learning_rate': 1.585995323638454e-06, 'epoch': 1.65} {'loss': 0.31, 'learning_rate': 1.5858137619929847e-06, 'epoch': 1.65} {'loss': 0.2566, 'learning_rate': 1.5856322098455334e-06, 'epoch': 1.65} {'loss': 0.303, 'learning_rate': 1.585450667196301e-06, 'epoch': 1.65} {'loss': 0.2536, 'learning_rate': 1.5852691340454973e-06, 'epoch': 1.65} {'loss': 0.3899, 'learning_rate': 1.585087610393321e-06, 'epoch': 1.65} {'loss': 0.3039, 'learning_rate': 1.5849060962399843e-06, 'epoch': 1.65} {'loss': 0.2921, 'learning_rate': 1.5847245915856858e-06, 'epoch': 1.65} {'loss': 0.2236, 'learning_rate': 1.5845430964306352e-06, 'epoch': 1.65} {'loss': 0.3438, 'learning_rate': 1.5843616107750359e-06, 'epoch': 1.65} {'loss': 0.2673, 'learning_rate': 1.584180134619089e-06, 'epoch': 1.65} {'loss': 0.2094, 'learning_rate': 1.5839986679630048e-06, 'epoch': 1.65} {'loss': 0.2958, 'learning_rate': 1.5838172108069826e-06, 'epoch': 1.65} {'loss': 0.1669, 'learning_rate': 1.5836357631512333e-06, 'epoch': 1.65} {'loss': 0.3213, 'learning_rate': 1.5834543249959567e-06, 'epoch': 1.65} {'loss': 0.2635, 'learning_rate': 1.5832728963413624e-06, 'epoch': 1.65} {'loss': 0.338, 'learning_rate': 1.5830914771876494e-06, 'epoch': 1.65} {'loss': 0.1317, 'learning_rate': 1.5829100675350285e-06, 'epoch': 1.65} {'loss': 0.1993, 'learning_rate': 1.5827286673836983e-06, 'epoch': 1.65} {'loss': 0.2767, 'learning_rate': 1.58254727673387e-06, 'epoch': 1.65} {'loss': 0.3482, 'learning_rate': 1.5823658955857425e-06, 'epoch': 1.65} {'loss': 0.3542, 'learning_rate': 1.5821845239395261e-06, 'epoch': 1.65} {'loss': 0.172, 'learning_rate': 1.5820031617954224e-06, 'epoch': 1.65} {'loss': 0.2377, 'learning_rate': 1.581821809153633e-06, 'epoch': 1.65} {'loss': 0.2631, 'learning_rate': 1.5816404660143702e-06, 'epoch': 1.65} {'loss': 0.2764, 'learning_rate': 1.5814591323778305e-06, 'epoch': 1.65} {'loss': 0.417, 'learning_rate': 1.581277808244226e-06, 'epoch': 1.65} {'loss': 0.3437, 'learning_rate': 1.581096493613755e-06, 'epoch': 1.65} {'loss': 0.3676, 'learning_rate': 1.580915188486627e-06, 'epoch': 1.65} {'loss': 0.31, 'learning_rate': 1.5807338928630434e-06, 'epoch': 1.65} {'loss': 0.3775, 'learning_rate': 1.5805526067432119e-06, 'epoch': 1.65} {'loss': 0.2871, 'learning_rate': 1.5803713301273337e-06, 'epoch': 1.65} {'loss': 0.275, 'learning_rate': 1.5801900630156176e-06, 'epoch': 1.65} {'loss': 0.2895, 'learning_rate': 1.5800088054082629e-06, 'epoch': 1.65} {'loss': 0.3375, 'learning_rate': 1.57982755730548e-06, 'epoch': 1.65} {'loss': 0.32, 'learning_rate': 1.5796463187074707e-06, 'epoch': 1.65} {'loss': 0.2778, 'learning_rate': 1.579465089614437e-06, 'epoch': 1.65} {'loss': 0.2722, 'learning_rate': 1.5792838700265877e-06, 'epoch': 1.65} {'loss': 0.1839, 'learning_rate': 1.579102659944124e-06, 'epoch': 1.65} {'loss': 0.1951, 'learning_rate': 1.578921459367254e-06, 'epoch': 1.65} {'loss': 0.3202, 'learning_rate': 1.5787402682961784e-06, 'epoch': 1.65} {'loss': 0.3265, 'learning_rate': 1.578559086731105e-06, 'epoch': 1.65} {'loss': 0.3737, 'learning_rate': 1.5783779146722356e-06, 'epoch': 1.65} {'loss': 0.1809, 'learning_rate': 1.5781967521197784e-06, 'epoch': 1.65} {'loss': 0.1878, 'learning_rate': 1.5780155990739332e-06, 'epoch': 1.65} {'loss': 0.2957, 'learning_rate': 1.577834455534909e-06, 'epoch': 1.65} {'loss': 0.1423, 'learning_rate': 1.5776533215029067e-06, 'epoch': 1.65} {'loss': 0.3389, 'learning_rate': 1.5774721969781336e-06, 'epoch': 1.65} {'loss': 0.157, 'learning_rate': 1.5772910819607923e-06, 'epoch': 1.65} {'loss': 0.2396, 'learning_rate': 1.5771099764510866e-06, 'epoch': 1.65} {'loss': 0.2112, 'learning_rate': 1.5769288804492233e-06, 'epoch': 1.65} {'loss': 0.3804, 'learning_rate': 1.5767477939554044e-06, 'epoch': 1.65} {'loss': 0.2648, 'learning_rate': 1.5765667169698373e-06, 'epoch': 1.65} {'loss': 0.151, 'learning_rate': 1.576385649492722e-06, 'epoch': 1.65} {'loss': 0.3307, 'learning_rate': 1.5762045915242675e-06, 'epoch': 1.65} {'loss': 0.3408, 'learning_rate': 1.5760235430646741e-06, 'epoch': 1.65} {'loss': 0.3283, 'learning_rate': 1.5758425041141513e-06, 'epoch': 1.65} {'loss': 0.345, 'learning_rate': 1.5756614746728972e-06, 'epoch': 1.65} {'loss': 0.3865, 'learning_rate': 1.5754804547411217e-06, 'epoch': 1.65} {'loss': 0.4003, 'learning_rate': 1.575299444319025e-06, 'epoch': 1.65} {'loss': 0.2476, 'learning_rate': 1.5751184434068156e-06, 'epoch': 1.65} {'loss': 0.2181, 'learning_rate': 1.5749374520046945e-06, 'epoch': 1.65} {'loss': 0.1916, 'learning_rate': 1.5747564701128648e-06, 'epoch': 1.65} {'loss': 0.4371, 'learning_rate': 1.5745754977315365e-06, 'epoch': 1.65} {'loss': 0.2838, 'learning_rate': 1.574394534860907e-06, 'epoch': 1.65} {'loss': 0.3299, 'learning_rate': 1.5742135815011861e-06, 'epoch': 1.65} {'loss': 0.3275, 'learning_rate': 1.5740326376525739e-06, 'epoch': 1.65} {'loss': 0.2735, 'learning_rate': 1.5738517033152779e-06, 'epoch': 1.65} {'loss': 0.2487, 'learning_rate': 1.5736707784895e-06, 'epoch': 1.65} {'loss': 0.309, 'learning_rate': 1.5734898631754447e-06, 'epoch': 1.65} {'loss': 0.291, 'learning_rate': 1.5733089573733196e-06, 'epoch': 1.65} {'loss': 0.112, 'learning_rate': 1.5731280610833233e-06, 'epoch': 1.65} {'loss': 0.3098, 'learning_rate': 1.5729471743056656e-06, 'epoch': 1.65} {'loss': 0.3352, 'learning_rate': 1.5727662970405467e-06, 'epoch': 1.65} {'loss': 0.4029, 'learning_rate': 1.5725854292881737e-06, 'epoch': 1.65} {'loss': 0.2423, 'learning_rate': 1.5724045710487467e-06, 'epoch': 1.65} {'loss': 0.3647, 'learning_rate': 1.5722237223224746e-06, 'epoch': 1.65} {'loss': 0.3656, 'learning_rate': 1.572042883109557e-06, 'epoch': 1.65} {'loss': 0.1536, 'learning_rate': 1.5718620534102037e-06, 'epoch': 1.65} {'loss': 0.3169, 'learning_rate': 1.5716812332246123e-06, 'epoch': 1.65} {'loss': 0.2137, 'learning_rate': 1.5715004225529918e-06, 'epoch': 1.65} {'loss': 0.3488, 'learning_rate': 1.5713196213955428e-06, 'epoch': 1.65} {'loss': 0.3494, 'learning_rate': 1.5711388297524744e-06, 'epoch': 1.65} {'loss': 0.4289, 'learning_rate': 1.5709580476239861e-06, 'epoch': 1.65} {'loss': 0.2708, 'learning_rate': 1.5707772750102812e-06, 'epoch': 1.65} {'loss': 0.1514, 'learning_rate': 1.5705965119115684e-06, 'epoch': 1.65} {'loss': 0.1943, 'learning_rate': 1.5704157583280476e-06, 'epoch': 1.65} {'loss': 0.2902, 'learning_rate': 1.5702350142599264e-06, 'epoch': 1.65} {'loss': 0.1494, 'learning_rate': 1.5700542797074037e-06, 'epoch': 1.65} {'loss': 0.4154, 'learning_rate': 1.56987355467069e-06, 'epoch': 1.65} {'loss': 0.3376, 'learning_rate': 1.5696928391499832e-06, 'epoch': 1.65} {'loss': 0.2109, 'learning_rate': 1.5695121331454921e-06, 'epoch': 1.65} {'loss': 0.2993, 'learning_rate': 1.5693314366574175e-06, 'epoch': 1.65} {'loss': 0.3099, 'learning_rate': 1.569150749685966e-06, 'epoch': 1.65} {'loss': 0.3507, 'learning_rate': 1.5689700722313372e-06, 'epoch': 1.65} {'loss': 0.3735, 'learning_rate': 1.5687894042937413e-06, 'epoch': 1.65} {'loss': 0.3099, 'learning_rate': 1.568608745873379e-06, 'epoch': 1.65} {'loss': 0.3349, 'learning_rate': 1.5684280969704513e-06, 'epoch': 1.65} {'loss': 0.2432, 'learning_rate': 1.568247457585167e-06, 'epoch': 1.65} {'loss': 0.3164, 'learning_rate': 1.5680668277177259e-06, 'epoch': 1.65} {'loss': 0.3676, 'learning_rate': 1.5678862073683366e-06, 'epoch': 1.65} {'loss': 0.2753, 'learning_rate': 1.5677055965371978e-06, 'epoch': 1.65} {'loss': 0.3748, 'learning_rate': 1.5675249952245185e-06, 'epoch': 1.65} {'loss': 0.3175, 'learning_rate': 1.5673444034304973e-06, 'epoch': 1.65} {'loss': 0.2816, 'learning_rate': 1.567163821155343e-06, 'epoch': 1.65} {'loss': 0.3705, 'learning_rate': 1.5669832483992543e-06, 'epoch': 1.65} {'loss': 0.3727, 'learning_rate': 1.5668026851624417e-06, 'epoch': 1.65} {'loss': 0.32, 'learning_rate': 1.5666221314451013e-06, 'epoch': 1.65} {'loss': 0.313, 'learning_rate': 1.5664415872474447e-06, 'epoch': 1.65} {'loss': 0.2963, 'learning_rate': 1.5662610525696708e-06, 'epoch': 1.65} {'loss': 0.2402, 'learning_rate': 1.5660805274119817e-06, 'epoch': 1.65} {'loss': 0.4046, 'learning_rate': 1.5659000117745871e-06, 'epoch': 1.65} {'loss': 0.4194, 'learning_rate': 1.5657195056576857e-06, 'epoch': 1.65} {'loss': 0.469, 'learning_rate': 1.5655390090614842e-06, 'epoch': 1.65} {'loss': 0.3199, 'learning_rate': 1.5653585219861834e-06, 'epoch': 1.65} {'loss': 0.4337, 'learning_rate': 1.565178044431992e-06, 'epoch': 1.65} {'loss': 0.3126, 'learning_rate': 1.5649975763991077e-06, 'epoch': 1.65} {'loss': 0.3153, 'learning_rate': 1.5648171178877392e-06, 'epoch': 1.65} {'loss': 0.3451, 'learning_rate': 1.5646366688980852e-06, 'epoch': 1.65} {'loss': 0.3202, 'learning_rate': 1.5644562294303556e-06, 'epoch': 1.65} {'loss': 0.3788, 'learning_rate': 1.564275799484749e-06, 'epoch': 1.65} {'loss': 0.126, 'learning_rate': 1.5640953790614722e-06, 'epoch': 1.65} {'loss': 0.451, 'learning_rate': 1.563914968160728e-06, 'epoch': 1.65} {'loss': 0.3215, 'learning_rate': 1.5637345667827175e-06, 'epoch': 1.65} {'loss': 0.2866, 'learning_rate': 1.5635541749276484e-06, 'epoch': 1.65} {'loss': 0.2224, 'learning_rate': 1.5633737925957203e-06, 'epoch': 1.65} {'loss': 0.3499, 'learning_rate': 1.5631934197871412e-06, 'epoch': 1.65} {'loss': 0.3234, 'learning_rate': 1.5630130565021095e-06, 'epoch': 1.65} {'loss': 0.1617, 'learning_rate': 1.5628327027408353e-06, 'epoch': 1.65} {'loss': 0.2397, 'learning_rate': 1.5626523585035148e-06, 'epoch': 1.65} {'loss': 0.2259, 'learning_rate': 1.562472023790359e-06, 'epoch': 1.65} {'loss': 0.2547, 'learning_rate': 1.5622916986015645e-06, 'epoch': 1.65} {'loss': 0.2753, 'learning_rate': 1.5621113829373403e-06, 'epoch': 1.65} {'loss': 0.4691, 'learning_rate': 1.5619310767978867e-06, 'epoch': 1.65} {'loss': 0.4315, 'learning_rate': 1.5617507801834097e-06, 'epoch': 1.65} {'loss': 0.304, 'learning_rate': 1.561570493094111e-06, 'epoch': 1.65} {'loss': 0.2575, 'learning_rate': 1.561390215530193e-06, 'epoch': 1.65} {'loss': 0.3868, 'learning_rate': 1.5612099474918642e-06, 'epoch': 1.65} {'loss': 0.284, 'learning_rate': 1.5610296889793207e-06, 'epoch': 1.65} {'loss': 0.291, 'learning_rate': 1.5608494399927733e-06, 'epoch': 1.65} {'loss': 0.3208, 'learning_rate': 1.5606692005324187e-06, 'epoch': 1.65} {'loss': 0.2632, 'learning_rate': 1.560488970598466e-06, 'epoch': 1.65} {'loss': 0.3462, 'learning_rate': 1.560308750191115e-06, 'epoch': 1.65} {'loss': 0.3886, 'learning_rate': 1.5601285393105724e-06, 'epoch': 1.65} {'loss': 0.2924, 'learning_rate': 1.559948337957038e-06, 'epoch': 1.65} {'loss': 0.3468, 'learning_rate': 1.559768146130719e-06, 'epoch': 1.65} {'loss': 0.3311, 'learning_rate': 1.5595879638318144e-06, 'epoch': 1.65} {'loss': 0.4053, 'learning_rate': 1.559407791060532e-06, 'epoch': 1.65} {'loss': 0.3674, 'learning_rate': 1.5592276278170738e-06, 'epoch': 1.65} {'loss': 0.2283, 'learning_rate': 1.5590474741016392e-06, 'epoch': 1.65} {'loss': 0.3353, 'learning_rate': 1.5588673299144385e-06, 'epoch': 1.65} {'loss': 0.3637, 'learning_rate': 1.5586871952556682e-06, 'epoch': 1.65} {'loss': 0.5122, 'learning_rate': 1.5585070701255366e-06, 'epoch': 1.65} {'loss': 0.1503, 'learning_rate': 1.558326954524244e-06, 'epoch': 1.65} {'loss': 0.3182, 'learning_rate': 1.558146848451998e-06, 'epoch': 1.65} {'loss': 0.4036, 'learning_rate': 1.5579667519089946e-06, 'epoch': 1.65} {'loss': 0.3867, 'learning_rate': 1.5577866648954454e-06, 'epoch': 1.65} {'loss': 0.3019, 'learning_rate': 1.5576065874115464e-06, 'epoch': 1.65} {'loss': 0.4377, 'learning_rate': 1.5574265194575078e-06, 'epoch': 1.65} {'loss': 0.2878, 'learning_rate': 1.5572464610335257e-06, 'epoch': 1.65} {'loss': 0.4371, 'learning_rate': 1.5570664121398094e-06, 'epoch': 1.65} {'loss': 0.2595, 'learning_rate': 1.5568863727765594e-06, 'epoch': 1.65} {'loss': 0.408, 'learning_rate': 1.5567063429439778e-06, 'epoch': 1.65} {'loss': 0.4165, 'learning_rate': 1.556526322642271e-06, 'epoch': 1.65} {'loss': 0.5237, 'learning_rate': 1.5563463118716371e-06, 'epoch': 1.65} {'loss': 0.225, 'learning_rate': 1.5561663106322866e-06, 'epoch': 1.65} {'loss': 0.3766, 'learning_rate': 1.555986318924415e-06, 'epoch': 1.65} {'loss': 0.2902, 'learning_rate': 1.5558063367482324e-06, 'epoch': 1.65} {'loss': 0.2928, 'learning_rate': 1.5556263641039349e-06, 'epoch': 1.65} {'loss': 0.2655, 'learning_rate': 1.5554464009917313e-06, 'epoch': 1.65} {'loss': 0.2326, 'learning_rate': 1.555266447411824e-06, 'epoch': 1.65} {'loss': 0.3601, 'learning_rate': 1.5550865033644135e-06, 'epoch': 1.65} {'loss': 0.2861, 'learning_rate': 1.5549065688497066e-06, 'epoch': 1.65} {'loss': 0.3719, 'learning_rate': 1.554726643867901e-06, 'epoch': 1.65} {'loss': 0.1458, 'learning_rate': 1.5545467284192061e-06, 'epoch': 1.65} {'loss': 0.1828, 'learning_rate': 1.5543668225038199e-06, 'epoch': 1.65} {'loss': 0.2326, 'learning_rate': 1.55418692612195e-06, 'epoch': 1.65} {'loss': 0.2273, 'learning_rate': 1.5540070392737937e-06, 'epoch': 1.65} {'loss': 0.2462, 'learning_rate': 1.5538271619595613e-06, 'epoch': 1.65} {'loss': 0.2807, 'learning_rate': 1.5536472941794478e-06, 'epoch': 1.65} {'loss': 0.3148, 'learning_rate': 1.5534674359336643e-06, 'epoch': 1.65} {'loss': 0.3665, 'learning_rate': 1.5532875872224084e-06, 'epoch': 1.65} {'loss': 0.3679, 'learning_rate': 1.5531077480458833e-06, 'epoch': 1.65} {'loss': 0.4068, 'learning_rate': 1.5529279184042956e-06, 'epoch': 1.65} {'loss': 0.1941, 'learning_rate': 1.5527480982978438e-06, 'epoch': 1.65} {'loss': 0.3718, 'learning_rate': 1.5525682877267346e-06, 'epoch': 1.65} {'loss': 0.344, 'learning_rate': 1.5523884866911676e-06, 'epoch': 1.65} {'loss': 0.3322, 'learning_rate': 1.5522086951913494e-06, 'epoch': 1.65} {'loss': 0.457, 'learning_rate': 1.55202891322748e-06, 'epoch': 1.65} {'loss': 0.2351, 'learning_rate': 1.551849140799765e-06, 'epoch': 1.65} {'loss': 0.2614, 'learning_rate': 1.5516693779084035e-06, 'epoch': 1.65} {'loss': 0.0976, 'learning_rate': 1.5514896245536027e-06, 'epoch': 1.65} {'loss': 0.2642, 'learning_rate': 1.551309880735562e-06, 'epoch': 1.65} {'loss': 0.3249, 'learning_rate': 1.5511301464544882e-06, 'epoch': 1.65} {'loss': 0.2212, 'learning_rate': 1.550950421710582e-06, 'epoch': 1.65} {'loss': 0.3287, 'learning_rate': 1.5507707065040433e-06, 'epoch': 1.65} {'loss': 0.3912, 'learning_rate': 1.55059100083508e-06, 'epoch': 1.65} {'loss': 0.2842, 'learning_rate': 1.5504113047038905e-06, 'epoch': 1.65} {'loss': 0.306, 'learning_rate': 1.5502316181106826e-06, 'epoch': 1.65} {'loss': 0.2754, 'learning_rate': 1.5500519410556535e-06, 'epoch': 1.65} {'loss': 0.2094, 'learning_rate': 1.5498722735390114e-06, 'epoch': 1.65} {'loss': 0.3702, 'learning_rate': 1.5496926155609537e-06, 'epoch': 1.65} {'loss': 0.2053, 'learning_rate': 1.549512967121689e-06, 'epoch': 1.65} {'loss': 0.5965, 'learning_rate': 1.5493333282214152e-06, 'epoch': 1.65} {'loss': 0.1287, 'learning_rate': 1.5491536988603395e-06, 'epoch': 1.65} {'loss': 0.2121, 'learning_rate': 1.5489740790386599e-06, 'epoch': 1.65} {'loss': 0.2798, 'learning_rate': 1.5487944687565837e-06, 'epoch': 1.65} {'loss': 0.4869, 'learning_rate': 1.5486148680143087e-06, 'epoch': 1.65} {'loss': 0.2847, 'learning_rate': 1.5484352768120436e-06, 'epoch': 1.65} {'loss': 0.2735, 'learning_rate': 1.5482556951499873e-06, 'epoch': 1.65} {'loss': 0.2728, 'learning_rate': 1.5480761230283415e-06, 'epoch': 1.65} {'loss': 0.3628, 'learning_rate': 1.5478965604473129e-06, 'epoch': 1.65} {'loss': 0.2855, 'learning_rate': 1.547717007407098e-06, 'epoch': 1.65} {'loss': 0.3227, 'learning_rate': 1.5475374639079065e-06, 'epoch': 1.65} {'loss': 0.3676, 'learning_rate': 1.5473579299499364e-06, 'epoch': 1.65} {'loss': 0.2982, 'learning_rate': 1.547178405533394e-06, 'epoch': 1.65} {'loss': 0.2042, 'learning_rate': 1.5469988906584766e-06, 'epoch': 1.65} {'loss': 0.354, 'learning_rate': 1.546819385325392e-06, 'epoch': 1.65} {'loss': 0.3196, 'learning_rate': 1.5466398895343405e-06, 'epoch': 1.65} {'loss': 0.2133, 'learning_rate': 1.5464604032855257e-06, 'epoch': 1.65} {'loss': 0.3521, 'learning_rate': 1.546280926579148e-06, 'epoch': 1.65} {'loss': 0.282, 'learning_rate': 1.5461014594154133e-06, 'epoch': 1.65} {'loss': 0.202, 'learning_rate': 1.5459220017945232e-06, 'epoch': 1.65} {'loss': 0.2095, 'learning_rate': 1.545742553716677e-06, 'epoch': 1.65} {'loss': 0.3185, 'learning_rate': 1.5455631151820816e-06, 'epoch': 1.65} {'loss': 0.3001, 'learning_rate': 1.5453836861909356e-06, 'epoch': 1.65} {'loss': 0.2236, 'learning_rate': 1.5452042667434464e-06, 'epoch': 1.65} {'loss': 0.2946, 'learning_rate': 1.5450248568398118e-06, 'epoch': 1.65} {'loss': 0.3102, 'learning_rate': 1.5448454564802384e-06, 'epoch': 1.65} {'loss': 0.2154, 'learning_rate': 1.5446660656649237e-06, 'epoch': 1.65} {'loss': 0.2303, 'learning_rate': 1.5444866843940765e-06, 'epoch': 1.65} {'loss': 0.325, 'learning_rate': 1.5443073126678931e-06, 'epoch': 1.65} {'loss': 0.2781, 'learning_rate': 1.5441279504865803e-06, 'epoch': 1.65} {'loss': 0.2569, 'learning_rate': 1.5439485978503376e-06, 'epoch': 1.65} {'loss': 0.3163, 'learning_rate': 1.5437692547593718e-06, 'epoch': 1.65} {'loss': 0.4397, 'learning_rate': 1.5435899212138816e-06, 'epoch': 1.65} {'loss': 0.2237, 'learning_rate': 1.5434105972140689e-06, 'epoch': 1.65} {'loss': 0.2694, 'learning_rate': 1.5432312827601393e-06, 'epoch': 1.65} {'loss': 0.2636, 'learning_rate': 1.5430519778522912e-06, 'epoch': 1.65} {'loss': 0.2816, 'learning_rate': 1.5428726824907314e-06, 'epoch': 1.65} {'loss': 0.3265, 'learning_rate': 1.5426933966756575e-06, 'epoch': 1.65} {'loss': 0.1938, 'learning_rate': 1.542514120407277e-06, 'epoch': 1.65} {'loss': 0.2589, 'learning_rate': 1.5423348536857885e-06, 'epoch': 1.65} {'loss': 0.295, 'learning_rate': 1.5421555965113967e-06, 'epoch': 1.65} {'loss': 0.302, 'learning_rate': 1.541976348884301e-06, 'epoch': 1.65} {'loss': 0.3351, 'learning_rate': 1.541797110804708e-06, 'epoch': 1.65} {'loss': 0.2223, 'learning_rate': 1.5416178822728156e-06, 'epoch': 1.65} {'loss': 0.3726, 'learning_rate': 1.5414386632888301e-06, 'epoch': 1.65} {'loss': 0.3587, 'learning_rate': 1.5412594538529524e-06, 'epoch': 1.65} {'loss': 0.3226, 'learning_rate': 1.5410802539653812e-06, 'epoch': 1.65} {'loss': 0.2522, 'learning_rate': 1.5409010636263244e-06, 'epoch': 1.65} {'loss': 0.3787, 'learning_rate': 1.5407218828359805e-06, 'epoch': 1.65} {'loss': 0.3928, 'learning_rate': 1.5405427115945538e-06, 'epoch': 1.65} {'loss': 0.3513, 'learning_rate': 1.540363549902244e-06, 'epoch': 1.65} {'loss': 0.2372, 'learning_rate': 1.5401843977592578e-06, 'epoch': 1.65} {'loss': 0.2477, 'learning_rate': 1.5400052551657919e-06, 'epoch': 1.65} {'loss': 0.2524, 'learning_rate': 1.5398261221220534e-06, 'epoch': 1.65} {'loss': 0.3165, 'learning_rate': 1.5396469986282414e-06, 'epoch': 1.65} {'loss': 0.2921, 'learning_rate': 1.5394678846845602e-06, 'epoch': 1.65} {'loss': 0.2752, 'learning_rate': 1.5392887802912082e-06, 'epoch': 1.65} {'loss': 0.3485, 'learning_rate': 1.5391096854483933e-06, 'epoch': 1.65} {'loss': 0.1606, 'learning_rate': 1.5389306001563153e-06, 'epoch': 1.65} {'loss': 0.3947, 'learning_rate': 1.5387515244151729e-06, 'epoch': 1.65} {'loss': 0.3349, 'learning_rate': 1.5385724582251727e-06, 'epoch': 1.65} {'loss': 0.3018, 'learning_rate': 1.5383934015865143e-06, 'epoch': 1.65} {'loss': 0.323, 'learning_rate': 1.538214354499402e-06, 'epoch': 1.65} {'loss': 0.2517, 'learning_rate': 1.538035316964034e-06, 'epoch': 1.65} {'loss': 0.3075, 'learning_rate': 1.537856288980618e-06, 'epoch': 1.65} {'loss': 0.1919, 'learning_rate': 1.5376772705493502e-06, 'epoch': 1.65} {'loss': 0.3603, 'learning_rate': 1.537498261670436e-06, 'epoch': 1.65} {'loss': 0.4084, 'learning_rate': 1.537319262344079e-06, 'epoch': 1.65} {'loss': 0.4269, 'learning_rate': 1.5371402725704776e-06, 'epoch': 1.65} {'loss': 0.2922, 'learning_rate': 1.5369612923498378e-06, 'epoch': 1.65} {'loss': 0.3455, 'learning_rate': 1.5367823216823564e-06, 'epoch': 1.65} {'loss': 0.2971, 'learning_rate': 1.5366033605682407e-06, 'epoch': 1.65} {'loss': 0.4147, 'learning_rate': 1.5364244090076885e-06, 'epoch': 1.65} {'loss': 0.2845, 'learning_rate': 1.5362454670009064e-06, 'epoch': 1.65} {'loss': 0.451, 'learning_rate': 1.5360665345480908e-06, 'epoch': 1.65} {'loss': 0.2722, 'learning_rate': 1.5358876116494492e-06, 'epoch': 1.65} {'loss': 0.2421, 'learning_rate': 1.5357086983051783e-06, 'epoch': 1.65} {'loss': 0.3791, 'learning_rate': 1.5355297945154857e-06, 'epoch': 1.65} {'loss': 0.1906, 'learning_rate': 1.53535090028057e-06, 'epoch': 1.65} {'loss': 0.3015, 'learning_rate': 1.535172015600631e-06, 'epoch': 1.65} {'loss': 0.2622, 'learning_rate': 1.5349931404758756e-06, 'epoch': 1.65} {'loss': 0.4117, 'learning_rate': 1.534814274906501e-06, 'epoch': 1.65} {'loss': 0.2589, 'learning_rate': 1.5346354188927137e-06, 'epoch': 1.65} {'loss': 0.2111, 'learning_rate': 1.5344565724347105e-06, 'epoch': 1.65} {'loss': 0.3132, 'learning_rate': 1.5342777355326987e-06, 'epoch': 1.65} {'loss': 0.3012, 'learning_rate': 1.534098908186875e-06, 'epoch': 1.65} {'loss': 0.2426, 'learning_rate': 1.5339200903974472e-06, 'epoch': 1.65} {'loss': 0.2534, 'learning_rate': 1.5337412821646103e-06, 'epoch': 1.65} {'loss': 0.2326, 'learning_rate': 1.533562483488572e-06, 'epoch': 1.65} {'loss': 0.3846, 'learning_rate': 1.533383694369529e-06, 'epoch': 1.65} {'loss': 0.2351, 'learning_rate': 1.533204914807689e-06, 'epoch': 1.65} {'loss': 0.3183, 'learning_rate': 1.5330261448032502e-06, 'epoch': 1.65} {'loss': 0.1775, 'learning_rate': 1.5328473843564119e-06, 'epoch': 1.65} {'loss': 0.325, 'learning_rate': 1.5326686334673824e-06, 'epoch': 1.65} {'loss': 0.1968, 'learning_rate': 1.5324898921363563e-06, 'epoch': 1.65} {'loss': 0.3688, 'learning_rate': 1.532311160363542e-06, 'epoch': 1.65} {'loss': 0.2898, 'learning_rate': 1.5321324381491354e-06, 'epoch': 1.65} {'loss': 0.3793, 'learning_rate': 1.5319537254933436e-06, 'epoch': 1.65} {'loss': 0.2224, 'learning_rate': 1.5317750223963635e-06, 'epoch': 1.65} {'loss': 0.4641, 'learning_rate': 1.5315963288584013e-06, 'epoch': 1.65} {'loss': 0.4615, 'learning_rate': 1.5314176448796546e-06, 'epoch': 1.65} {'loss': 0.2291, 'learning_rate': 1.5312389704603291e-06, 'epoch': 1.65} {'loss': 0.4138, 'learning_rate': 1.5310603056006223e-06, 'epoch': 1.65} {'loss': 0.4595, 'learning_rate': 1.5308816503007396e-06, 'epoch': 1.65} {'loss': 0.3111, 'learning_rate': 1.5307030045608818e-06, 'epoch': 1.65} {'loss': 0.3873, 'learning_rate': 1.5305243683812464e-06, 'epoch': 1.65} {'loss': 0.2121, 'learning_rate': 1.5303457417620414e-06, 'epoch': 1.65} {'loss': 0.2166, 'learning_rate': 1.5301671247034633e-06, 'epoch': 1.65} {'loss': 0.4854, 'learning_rate': 1.5299885172057184e-06, 'epoch': 1.65} {'loss': 0.3473, 'learning_rate': 1.529809919269003e-06, 'epoch': 1.65} {'loss': 0.3113, 'learning_rate': 1.529631330893524e-06, 'epoch': 1.65} {'loss': 0.317, 'learning_rate': 1.5294527520794789e-06, 'epoch': 1.65} {'loss': 0.2218, 'learning_rate': 1.5292741828270729e-06, 'epoch': 1.65} {'loss': 0.1972, 'learning_rate': 1.5290956231365028e-06, 'epoch': 1.65} {'loss': 0.3122, 'learning_rate': 1.528917073007975e-06, 'epoch': 1.65} {'loss': 0.2973, 'learning_rate': 1.5287385324416871e-06, 'epoch': 1.65} {'loss': 0.1778, 'learning_rate': 1.5285600014378444e-06, 'epoch': 1.65} {'loss': 0.2876, 'learning_rate': 1.5283814799966468e-06, 'epoch': 1.65} {'loss': 0.3082, 'learning_rate': 1.528202968118294e-06, 'epoch': 1.65} {'loss': 0.4943, 'learning_rate': 1.5280244658029908e-06, 'epoch': 1.65} {'loss': 0.4785, 'learning_rate': 1.5278459730509342e-06, 'epoch': 1.65} {'loss': 0.294, 'learning_rate': 1.5276674898623311e-06, 'epoch': 1.65} {'loss': 0.4276, 'learning_rate': 1.527489016237378e-06, 'epoch': 1.65} {'loss': 0.2946, 'learning_rate': 1.527310552176281e-06, 'epoch': 1.65} {'loss': 0.334, 'learning_rate': 1.527132097679237e-06, 'epoch': 1.65} {'loss': 0.4183, 'learning_rate': 1.5269536527464524e-06, 'epoch': 1.65} {'loss': 0.3341, 'learning_rate': 1.5267752173781224e-06, 'epoch': 1.65} {'loss': 0.2684, 'learning_rate': 1.526596791574455e-06, 'epoch': 1.65} {'loss': 0.2943, 'learning_rate': 1.5264183753356465e-06, 'epoch': 1.65} {'loss': 0.26, 'learning_rate': 1.5262399686619023e-06, 'epoch': 1.65} {'loss': 0.3275, 'learning_rate': 1.5260615715534222e-06, 'epoch': 1.65} {'loss': 0.1634, 'learning_rate': 1.5258831840104037e-06, 'epoch': 1.65} {'loss': 0.1752, 'learning_rate': 1.5257048060330547e-06, 'epoch': 1.65} {'loss': 0.2761, 'learning_rate': 1.5255264376215718e-06, 'epoch': 1.65} {'loss': 0.3612, 'learning_rate': 1.52534807877616e-06, 'epoch': 1.65} {'loss': 0.1605, 'learning_rate': 1.5251697294970159e-06, 'epoch': 1.65} {'loss': 0.2023, 'learning_rate': 1.524991389784346e-06, 'epoch': 1.65} {'loss': 0.4427, 'learning_rate': 1.524813059638347e-06, 'epoch': 1.65} {'loss': 0.354, 'learning_rate': 1.5246347390592253e-06, 'epoch': 1.65} {'loss': 0.2142, 'learning_rate': 1.5244564280471762e-06, 'epoch': 1.65} {'loss': 0.2563, 'learning_rate': 1.5242781266024075e-06, 'epoch': 1.65} {'loss': 0.3386, 'learning_rate': 1.5240998347251135e-06, 'epoch': 1.65} {'loss': 0.3566, 'learning_rate': 1.5239215524155016e-06, 'epoch': 1.65} {'loss': 0.2844, 'learning_rate': 1.5237432796737716e-06, 'epoch': 1.66} {'loss': 0.1989, 'learning_rate': 1.5235650165001203e-06, 'epoch': 1.66} {'loss': 0.351, 'learning_rate': 1.523386762894754e-06, 'epoch': 1.66} {'loss': 0.315, 'learning_rate': 1.5232085188578704e-06, 'epoch': 1.66} {'loss': 0.2791, 'learning_rate': 1.523030284389675e-06, 'epoch': 1.66} {'loss': 0.2736, 'learning_rate': 1.522852059490364e-06, 'epoch': 1.66} {'loss': 0.2963, 'learning_rate': 1.5226738441601441e-06, 'epoch': 1.66} {'loss': 0.289, 'learning_rate': 1.5224956383992095e-06, 'epoch': 1.66} {'loss': 0.2255, 'learning_rate': 1.5223174422077691e-06, 'epoch': 1.66} {'loss': 0.2312, 'learning_rate': 1.522139255586017e-06, 'epoch': 1.66} {'loss': 0.3153, 'learning_rate': 1.5219610785341598e-06, 'epoch': 1.66} {'loss': 0.4106, 'learning_rate': 1.521782911052394e-06, 'epoch': 1.66} {'loss': 0.3416, 'learning_rate': 1.5216047531409261e-06, 'epoch': 1.66} {'loss': 0.3111, 'learning_rate': 1.5214266047999516e-06, 'epoch': 1.66} {'loss': 0.345, 'learning_rate': 1.5212484660296756e-06, 'epoch': 1.66} {'loss': 0.2994, 'learning_rate': 1.5210703368302993e-06, 'epoch': 1.66} {'loss': 0.2763, 'learning_rate': 1.520892217202019e-06, 'epoch': 1.66} {'loss': 0.3405, 'learning_rate': 1.5207141071450416e-06, 'epoch': 1.66} {'loss': 0.3669, 'learning_rate': 1.5205360066595632e-06, 'epoch': 1.66} {'loss': 0.1246, 'learning_rate': 1.5203579157457892e-06, 'epoch': 1.66} {'loss': 0.324, 'learning_rate': 1.5201798344039165e-06, 'epoch': 1.66} {'loss': 0.2914, 'learning_rate': 1.5200017626341478e-06, 'epoch': 1.66} {'loss': 0.388, 'learning_rate': 1.5198237004366879e-06, 'epoch': 1.66} {'loss': 0.4089, 'learning_rate': 1.5196456478117317e-06, 'epoch': 1.66} {'loss': 0.322, 'learning_rate': 1.5194676047594847e-06, 'epoch': 1.66} {'loss': 0.2194, 'learning_rate': 1.5192895712801447e-06, 'epoch': 1.66} {'loss': 0.3486, 'learning_rate': 1.519111547373916e-06, 'epoch': 1.66} {'loss': 0.2348, 'learning_rate': 1.518933533040996e-06, 'epoch': 1.66} {'loss': 0.1421, 'learning_rate': 1.518755528281588e-06, 'epoch': 1.66} {'loss': 0.3107, 'learning_rate': 1.5185775330958918e-06, 'epoch': 1.66} {'loss': 0.2704, 'learning_rate': 1.5183995474841095e-06, 'epoch': 1.66} {'loss': 0.3273, 'learning_rate': 1.5182215714464399e-06, 'epoch': 1.66} {'loss': 0.2749, 'learning_rate': 1.518043604983087e-06, 'epoch': 1.66} {'loss': 0.3655, 'learning_rate': 1.5178656480942477e-06, 'epoch': 1.66} {'loss': 0.2624, 'learning_rate': 1.5176877007801283e-06, 'epoch': 1.66} {'loss': 0.3446, 'learning_rate': 1.5175097630409253e-06, 'epoch': 1.66} {'loss': 0.3569, 'learning_rate': 1.5173318348768395e-06, 'epoch': 1.66} {'loss': 0.3886, 'learning_rate': 1.5171539162880744e-06, 'epoch': 1.66} {'loss': 0.191, 'learning_rate': 1.5169760072748274e-06, 'epoch': 1.66} {'loss': 0.3409, 'learning_rate': 1.516798107837304e-06, 'epoch': 1.66} {'loss': 0.381, 'learning_rate': 1.5166202179757006e-06, 'epoch': 1.66} {'loss': 0.3448, 'learning_rate': 1.5164423376902215e-06, 'epoch': 1.66} {'loss': 0.3308, 'learning_rate': 1.5162644669810633e-06, 'epoch': 1.66} {'loss': 0.4172, 'learning_rate': 1.5160866058484314e-06, 'epoch': 1.66} {'loss': 0.3421, 'learning_rate': 1.5159087542925221e-06, 'epoch': 1.66} {'loss': 0.204, 'learning_rate': 1.5157309123135412e-06, 'epoch': 1.66} {'loss': 0.2959, 'learning_rate': 1.5155530799116847e-06, 'epoch': 1.66} {'loss': 0.3783, 'learning_rate': 1.5153752570871572e-06, 'epoch': 1.66} {'loss': 0.2328, 'learning_rate': 1.5151974438401574e-06, 'epoch': 1.66} {'loss': 0.2743, 'learning_rate': 1.5150196401708838e-06, 'epoch': 1.66} {'loss': 0.2671, 'learning_rate': 1.5148418460795422e-06, 'epoch': 1.66} {'loss': 0.2018, 'learning_rate': 1.5146640615663288e-06, 'epoch': 1.66} {'loss': 0.2503, 'learning_rate': 1.5144862866314481e-06, 'epoch': 1.66} {'loss': 0.2754, 'learning_rate': 1.5143085212750963e-06, 'epoch': 1.66} {'loss': 0.2047, 'learning_rate': 1.5141307654974791e-06, 'epoch': 1.66} {'loss': 0.3831, 'learning_rate': 1.5139530192987917e-06, 'epoch': 1.66} {'loss': 0.2506, 'learning_rate': 1.5137752826792407e-06, 'epoch': 1.66} {'loss': 0.3743, 'learning_rate': 1.5135975556390204e-06, 'epoch': 1.66} {'loss': 0.2843, 'learning_rate': 1.5134198381783383e-06, 'epoch': 1.66} {'loss': 0.3012, 'learning_rate': 1.5132421302973887e-06, 'epoch': 1.66} {'loss': 0.3347, 'learning_rate': 1.513064431996376e-06, 'epoch': 1.66} {'loss': 0.2277, 'learning_rate': 1.5128867432755013e-06, 'epoch': 1.66} {'loss': 0.378, 'learning_rate': 1.5127090641349607e-06, 'epoch': 1.66} {'loss': 0.3359, 'learning_rate': 1.5125313945749597e-06, 'epoch': 1.66} {'loss': 0.3219, 'learning_rate': 1.5123537345956952e-06, 'epoch': 1.66} {'loss': 0.2208, 'learning_rate': 1.512176084197371e-06, 'epoch': 1.66} {'loss': 0.399, 'learning_rate': 1.5119984433801838e-06, 'epoch': 1.66} {'loss': 0.4161, 'learning_rate': 1.5118208121443378e-06, 'epoch': 1.66} {'loss': 0.2475, 'learning_rate': 1.5116431904900308e-06, 'epoch': 1.66} {'loss': 0.2577, 'learning_rate': 1.5114655784174658e-06, 'epoch': 1.66} {'loss': 0.3099, 'learning_rate': 1.5112879759268405e-06, 'epoch': 1.66} {'loss': 0.1821, 'learning_rate': 1.5111103830183593e-06, 'epoch': 1.66} {'loss': 0.2546, 'learning_rate': 1.5109327996922174e-06, 'epoch': 1.66} {'loss': 0.2974, 'learning_rate': 1.5107552259486213e-06, 'epoch': 1.66} {'loss': 0.3285, 'learning_rate': 1.5105776617877677e-06, 'epoch': 1.66} {'loss': 0.416, 'learning_rate': 1.510400107209855e-06, 'epoch': 1.66} {'loss': 0.3177, 'learning_rate': 1.510222562215088e-06, 'epoch': 1.66} {'loss': 0.4018, 'learning_rate': 1.5100450268036638e-06, 'epoch': 1.66} {'loss': 0.2935, 'learning_rate': 1.5098675009757868e-06, 'epoch': 1.66} {'loss': 0.1834, 'learning_rate': 1.5096899847316527e-06, 'epoch': 1.66} {'loss': 0.4328, 'learning_rate': 1.5095124780714653e-06, 'epoch': 1.66} {'loss': 0.4115, 'learning_rate': 1.5093349809954227e-06, 'epoch': 1.66} {'loss': 0.268, 'learning_rate': 1.509157493503728e-06, 'epoch': 1.66} {'loss': 0.3355, 'learning_rate': 1.5089800155965773e-06, 'epoch': 1.66} {'loss': 0.2527, 'learning_rate': 1.5088025472741764e-06, 'epoch': 1.66} {'loss': 0.2791, 'learning_rate': 1.5086250885367203e-06, 'epoch': 1.66} {'loss': 0.2183, 'learning_rate': 1.5084476393844138e-06, 'epoch': 1.66} {'loss': 0.2468, 'learning_rate': 1.5082701998174565e-06, 'epoch': 1.66} {'loss': 0.3584, 'learning_rate': 1.5080927698360437e-06, 'epoch': 1.66} {'loss': 0.3886, 'learning_rate': 1.507915349440382e-06, 'epoch': 1.66} {'loss': 0.2287, 'learning_rate': 1.5077379386306668e-06, 'epoch': 1.66} {'loss': 0.2506, 'learning_rate': 1.5075605374071023e-06, 'epoch': 1.66} {'loss': 0.3052, 'learning_rate': 1.507383145769885e-06, 'epoch': 1.66} {'loss': 0.4349, 'learning_rate': 1.5072057637192205e-06, 'epoch': 1.66} {'loss': 0.3761, 'learning_rate': 1.5070283912553018e-06, 'epoch': 1.66} {'loss': 0.3522, 'learning_rate': 1.5068510283783367e-06, 'epoch': 1.66} {'loss': 0.2261, 'learning_rate': 1.5066736750885192e-06, 'epoch': 1.66} {'loss': 0.1919, 'learning_rate': 1.5064963313860537e-06, 'epoch': 1.66} {'loss': 0.45, 'learning_rate': 1.5063189972711368e-06, 'epoch': 1.66} {'loss': 0.3035, 'learning_rate': 1.5061416727439726e-06, 'epoch': 1.66} {'loss': 0.4582, 'learning_rate': 1.5059643578047601e-06, 'epoch': 1.66} {'loss': 0.2355, 'learning_rate': 1.5057870524536955e-06, 'epoch': 1.66} {'loss': 0.2417, 'learning_rate': 1.5056097566909843e-06, 'epoch': 1.66} {'loss': 0.3631, 'learning_rate': 1.505432470516822e-06, 'epoch': 1.66} {'loss': 0.2486, 'learning_rate': 1.5052551939314142e-06, 'epoch': 1.66} {'loss': 0.1649, 'learning_rate': 1.5050779269349558e-06, 'epoch': 1.66} {'loss': 0.3218, 'learning_rate': 1.5049006695276503e-06, 'epoch': 1.66} {'loss': 0.2087, 'learning_rate': 1.5047234217096951e-06, 'epoch': 1.66} {'loss': 0.2618, 'learning_rate': 1.5045461834812935e-06, 'epoch': 1.66} {'loss': 0.1991, 'learning_rate': 1.5043689548426421e-06, 'epoch': 1.66} {'loss': 0.3899, 'learning_rate': 1.504191735793944e-06, 'epoch': 1.66} {'loss': 0.2769, 'learning_rate': 1.5040145263353955e-06, 'epoch': 1.66} {'loss': 0.3325, 'learning_rate': 1.5038373264672024e-06, 'epoch': 1.66} {'loss': 0.2153, 'learning_rate': 1.5036601361895608e-06, 'epoch': 1.66} {'loss': 0.4675, 'learning_rate': 1.5034829555026687e-06, 'epoch': 1.66} {'loss': 0.2819, 'learning_rate': 1.5033057844067311e-06, 'epoch': 1.66} {'loss': 0.2858, 'learning_rate': 1.5031286229019437e-06, 'epoch': 1.66} {'loss': 0.3982, 'learning_rate': 1.5029514709885107e-06, 'epoch': 1.66} {'loss': 0.3533, 'learning_rate': 1.5027743286666262e-06, 'epoch': 1.66} {'loss': 0.3045, 'learning_rate': 1.5025971959364971e-06, 'epoch': 1.66} {'loss': 0.4447, 'learning_rate': 1.5024200727983173e-06, 'epoch': 1.66} {'loss': 0.4983, 'learning_rate': 1.502242959252289e-06, 'epoch': 1.66} {'loss': 0.301, 'learning_rate': 1.5020658552986156e-06, 'epoch': 1.66} {'loss': 0.3521, 'learning_rate': 1.501888760937491e-06, 'epoch': 1.66} {'loss': 0.3048, 'learning_rate': 1.5017116761691209e-06, 'epoch': 1.66} {'loss': 0.291, 'learning_rate': 1.5015346009936993e-06, 'epoch': 1.66} {'loss': 0.3855, 'learning_rate': 1.5013575354114307e-06, 'epoch': 1.66} {'loss': 0.3608, 'learning_rate': 1.5011804794225127e-06, 'epoch': 1.66} {'loss': 0.1732, 'learning_rate': 1.5010034330271472e-06, 'epoch': 1.66} {'loss': 0.3379, 'learning_rate': 1.5008263962255299e-06, 'epoch': 1.66} {'loss': 0.3095, 'learning_rate': 1.500649369017867e-06, 'epoch': 1.66} {'loss': 0.256, 'learning_rate': 1.5004723514043518e-06, 'epoch': 1.66} {'loss': 0.329, 'learning_rate': 1.5002953433851887e-06, 'epoch': 1.66} {'loss': 0.3663, 'learning_rate': 1.5001183449605738e-06, 'epoch': 1.66} {'loss': 0.3322, 'learning_rate': 1.499941356130712e-06, 'epoch': 1.66} {'loss': 0.4003, 'learning_rate': 1.4997643768957991e-06, 'epoch': 1.66} {'loss': 0.1824, 'learning_rate': 1.4995874072560345e-06, 'epoch': 1.66} {'loss': 0.2718, 'learning_rate': 1.4994104472116211e-06, 'epoch': 1.66} {'loss': 0.3602, 'learning_rate': 1.4992334967627552e-06, 'epoch': 1.66} {'loss': 0.387, 'learning_rate': 1.4990565559096393e-06, 'epoch': 1.66} {'loss': 0.2916, 'learning_rate': 1.4988796246524707e-06, 'epoch': 1.66} {'loss': 0.3282, 'learning_rate': 1.4987027029914525e-06, 'epoch': 1.66} {'loss': 0.3828, 'learning_rate': 1.4985257909267793e-06, 'epoch': 1.66} {'loss': 0.2691, 'learning_rate': 1.4983488884586571e-06, 'epoch': 1.66} {'loss': 0.3572, 'learning_rate': 1.4981719955872798e-06, 'epoch': 1.66} {'loss': 0.3317, 'learning_rate': 1.4979951123128522e-06, 'epoch': 1.66} {'loss': 0.4035, 'learning_rate': 1.4978182386355688e-06, 'epoch': 1.66} {'loss': 0.286, 'learning_rate': 1.497641374555634e-06, 'epoch': 1.66} {'loss': 0.3646, 'learning_rate': 1.4974645200732452e-06, 'epoch': 1.66} {'loss': 0.3332, 'learning_rate': 1.4972876751886e-06, 'epoch': 1.66} {'loss': 0.3201, 'learning_rate': 1.497110839901902e-06, 'epoch': 1.66} {'loss': 0.2314, 'learning_rate': 1.496934014213347e-06, 'epoch': 1.66} {'loss': 0.3743, 'learning_rate': 1.4967571981231389e-06, 'epoch': 1.66} {'loss': 0.2866, 'learning_rate': 1.4965803916314725e-06, 'epoch': 1.66} {'loss': 0.3355, 'learning_rate': 1.4964035947385525e-06, 'epoch': 1.66} {'loss': 0.3889, 'learning_rate': 1.496226807444574e-06, 'epoch': 1.66} {'loss': 0.4524, 'learning_rate': 1.4960500297497394e-06, 'epoch': 1.66} {'loss': 0.3001, 'learning_rate': 1.495873261654246e-06, 'epoch': 1.66} {'loss': 0.2495, 'learning_rate': 1.495696503158296e-06, 'epoch': 1.66} {'loss': 0.3086, 'learning_rate': 1.4955197542620858e-06, 'epoch': 1.66} {'loss': 0.4338, 'learning_rate': 1.4953430149658188e-06, 'epoch': 1.66} {'loss': 0.3384, 'learning_rate': 1.4951662852696924e-06, 'epoch': 1.66} {'loss': 0.2045, 'learning_rate': 1.4949895651739033e-06, 'epoch': 1.66} {'loss': 0.3826, 'learning_rate': 1.4948128546786556e-06, 'epoch': 1.66} {'loss': 0.2296, 'learning_rate': 1.4946361537841458e-06, 'epoch': 1.66} {'loss': 0.2248, 'learning_rate': 1.4944594624905762e-06, 'epoch': 1.66} {'loss': 0.3541, 'learning_rate': 1.494282780798142e-06, 'epoch': 1.66} {'loss': 0.2598, 'learning_rate': 1.4941061087070474e-06, 'epoch': 1.66} {'loss': 0.1782, 'learning_rate': 1.493929446217487e-06, 'epoch': 1.66} {'loss': 0.3679, 'learning_rate': 1.4937527933296648e-06, 'epoch': 1.66} {'loss': 0.2024, 'learning_rate': 1.4935761500437762e-06, 'epoch': 1.66} {'loss': 0.4482, 'learning_rate': 1.4933995163600258e-06, 'epoch': 1.66} {'loss': 0.4264, 'learning_rate': 1.4932228922786063e-06, 'epoch': 1.66} {'loss': 0.391, 'learning_rate': 1.4930462777997234e-06, 'epoch': 1.66} {'loss': 0.2764, 'learning_rate': 1.4928696729235726e-06, 'epoch': 1.66} {'loss': 0.302, 'learning_rate': 1.4926930776503535e-06, 'epoch': 1.66} {'loss': 0.325, 'learning_rate': 1.492516491980267e-06, 'epoch': 1.66} {'loss': 0.3619, 'learning_rate': 1.49233991591351e-06, 'epoch': 1.66} {'loss': 0.4169, 'learning_rate': 1.4921633494502863e-06, 'epoch': 1.66} {'loss': 0.3111, 'learning_rate': 1.4919867925907894e-06, 'epoch': 1.66} {'loss': 0.3306, 'learning_rate': 1.4918102453352235e-06, 'epoch': 1.66} {'loss': 0.3803, 'learning_rate': 1.4916337076837839e-06, 'epoch': 1.66} {'loss': 0.3099, 'learning_rate': 1.4914571796366738e-06, 'epoch': 1.66} {'loss': 0.2645, 'learning_rate': 1.4912806611940888e-06, 'epoch': 1.66} {'loss': 0.3718, 'learning_rate': 1.491104152356232e-06, 'epoch': 1.66} {'loss': 0.3293, 'learning_rate': 1.4909276531232986e-06, 'epoch': 1.66} {'loss': 0.3586, 'learning_rate': 1.4907511634954918e-06, 'epoch': 1.66} {'loss': 0.3953, 'learning_rate': 1.4905746834730094e-06, 'epoch': 1.66} {'loss': 0.3815, 'learning_rate': 1.4903982130560479e-06, 'epoch': 1.66} {'loss': 0.4611, 'learning_rate': 1.4902217522448104e-06, 'epoch': 1.66} {'loss': 0.2204, 'learning_rate': 1.490045301039491e-06, 'epoch': 1.66} {'loss': 0.2177, 'learning_rate': 1.4898688594402955e-06, 'epoch': 1.66} {'loss': 0.3928, 'learning_rate': 1.489692427447418e-06, 'epoch': 1.66} {'loss': 0.372, 'learning_rate': 1.4895160050610614e-06, 'epoch': 1.66} {'loss': 0.2868, 'learning_rate': 1.4893395922814203e-06, 'epoch': 1.66} {'loss': 0.3209, 'learning_rate': 1.4891631891086987e-06, 'epoch': 1.66} {'loss': 0.2467, 'learning_rate': 1.4889867955430914e-06, 'epoch': 1.66} {'loss': 0.3025, 'learning_rate': 1.4888104115848013e-06, 'epoch': 1.66} {'loss': 0.3704, 'learning_rate': 1.4886340372340248e-06, 'epoch': 1.66} {'loss': 0.226, 'learning_rate': 1.4884576724909627e-06, 'epoch': 1.66} {'loss': 0.2901, 'learning_rate': 1.488281317355814e-06, 'epoch': 1.66} {'loss': 0.3927, 'learning_rate': 1.4881049718287755e-06, 'epoch': 1.66} {'loss': 0.2927, 'learning_rate': 1.4879286359100486e-06, 'epoch': 1.66} {'loss': 0.2492, 'learning_rate': 1.4877523095998303e-06, 'epoch': 1.66} {'loss': 0.4614, 'learning_rate': 1.4875759928983237e-06, 'epoch': 1.66} {'loss': 0.3179, 'learning_rate': 1.4873996858057227e-06, 'epoch': 1.66} {'loss': 0.1458, 'learning_rate': 1.4872233883222298e-06, 'epoch': 1.66} {'loss': 0.1983, 'learning_rate': 1.4870471004480413e-06, 'epoch': 1.66} {'loss': 0.214, 'learning_rate': 1.4868708221833605e-06, 'epoch': 1.66} {'loss': 0.3009, 'learning_rate': 1.4866945535283816e-06, 'epoch': 1.66} {'loss': 0.3174, 'learning_rate': 1.4865182944833078e-06, 'epoch': 1.66} {'loss': 0.4874, 'learning_rate': 1.4863420450483323e-06, 'epoch': 1.66} {'loss': 0.3266, 'learning_rate': 1.4861658052236616e-06, 'epoch': 1.66} {'loss': 0.2689, 'learning_rate': 1.48598957500949e-06, 'epoch': 1.66} {'loss': 0.3208, 'learning_rate': 1.4858133544060148e-06, 'epoch': 1.66} {'loss': 0.4149, 'learning_rate': 1.4856371434134397e-06, 'epoch': 1.66} {'loss': 0.2895, 'learning_rate': 1.4854609420319598e-06, 'epoch': 1.66} {'loss': 0.4511, 'learning_rate': 1.4852847502617761e-06, 'epoch': 1.66} {'loss': 0.3719, 'learning_rate': 1.4851085681030853e-06, 'epoch': 1.66} {'loss': 0.3517, 'learning_rate': 1.484932395556088e-06, 'epoch': 1.66} {'loss': 0.3293, 'learning_rate': 1.4847562326209853e-06, 'epoch': 1.66} {'loss': 0.3052, 'learning_rate': 1.4845800792979703e-06, 'epoch': 1.66} {'loss': 0.16, 'learning_rate': 1.4844039355872474e-06, 'epoch': 1.66} {'loss': 0.3514, 'learning_rate': 1.484227801489011e-06, 'epoch': 1.66} {'loss': 0.2477, 'learning_rate': 1.4840516770034653e-06, 'epoch': 1.66} {'loss': 0.265, 'learning_rate': 1.4838755621308032e-06, 'epoch': 1.66} {'loss': 0.2859, 'learning_rate': 1.4836994568712282e-06, 'epoch': 1.66} {'loss': 0.2954, 'learning_rate': 1.4835233612249345e-06, 'epoch': 1.66} {'loss': 0.3012, 'learning_rate': 1.4833472751921263e-06, 'epoch': 1.66} {'loss': 0.222, 'learning_rate': 1.483171198772997e-06, 'epoch': 1.66} {'loss': 0.3103, 'learning_rate': 1.4829951319677494e-06, 'epoch': 1.66} {'loss': 0.3326, 'learning_rate': 1.4828190747765793e-06, 'epoch': 1.66} {'loss': 0.324, 'learning_rate': 1.4826430271996894e-06, 'epoch': 1.66} {'loss': 0.2087, 'learning_rate': 1.4824669892372755e-06, 'epoch': 1.66} {'loss': 0.2528, 'learning_rate': 1.482290960889534e-06, 'epoch': 1.66} {'loss': 0.3757, 'learning_rate': 1.4821149421566682e-06, 'epoch': 1.66} {'loss': 0.3002, 'learning_rate': 1.4819389330388733e-06, 'epoch': 1.66} {'loss': 0.3709, 'learning_rate': 1.4817629335363525e-06, 'epoch': 1.66} {'loss': 0.3266, 'learning_rate': 1.481586943649298e-06, 'epoch': 1.66} {'loss': 0.3232, 'learning_rate': 1.481410963377915e-06, 'epoch': 1.66} {'loss': 0.2595, 'learning_rate': 1.4812349927223967e-06, 'epoch': 1.66} {'loss': 0.2847, 'learning_rate': 1.4810590316829466e-06, 'epoch': 1.66} {'loss': 0.2726, 'learning_rate': 1.4808830802597584e-06, 'epoch': 1.66} {'loss': 0.2767, 'learning_rate': 1.480707138453036e-06, 'epoch': 1.66} {'loss': 0.2794, 'learning_rate': 1.4805312062629728e-06, 'epoch': 1.66} {'loss': 0.4087, 'learning_rate': 1.4803552836897717e-06, 'epoch': 1.66} {'loss': 0.2316, 'learning_rate': 1.4801793707336298e-06, 'epoch': 1.66} {'loss': 0.3334, 'learning_rate': 1.4800034673947417e-06, 'epoch': 1.66} {'loss': 0.2172, 'learning_rate': 1.4798275736733137e-06, 'epoch': 1.66} {'loss': 0.3512, 'learning_rate': 1.4796516895695367e-06, 'epoch': 1.66} {'loss': 0.2145, 'learning_rate': 1.4794758150836153e-06, 'epoch': 1.66} {'loss': 0.4745, 'learning_rate': 1.4792999502157435e-06, 'epoch': 1.66} {'loss': 0.3286, 'learning_rate': 1.4791240949661233e-06, 'epoch': 1.66} {'loss': 0.3674, 'learning_rate': 1.4789482493349504e-06, 'epoch': 1.66} {'loss': 0.3297, 'learning_rate': 1.4787724133224258e-06, 'epoch': 1.66} {'loss': 0.3697, 'learning_rate': 1.4785965869287456e-06, 'epoch': 1.66} {'loss': 0.3255, 'learning_rate': 1.478420770154111e-06, 'epoch': 1.66} {'loss': 0.384, 'learning_rate': 1.4782449629987161e-06, 'epoch': 1.66} {'loss': 0.3351, 'learning_rate': 1.4780691654627654e-06, 'epoch': 1.66} {'loss': 0.2371, 'learning_rate': 1.4778933775464532e-06, 'epoch': 1.66} {'loss': 0.2579, 'learning_rate': 1.477717599249977e-06, 'epoch': 1.66} {'loss': 0.3041, 'learning_rate': 1.4775418305735401e-06, 'epoch': 1.66} {'loss': 0.3064, 'learning_rate': 1.4773660715173344e-06, 'epoch': 1.66} {'loss': 0.3154, 'learning_rate': 1.4771903220815653e-06, 'epoch': 1.66} {'loss': 0.304, 'learning_rate': 1.477014582266424e-06, 'epoch': 1.66} {'loss': 0.249, 'learning_rate': 1.4768388520721154e-06, 'epoch': 1.66} {'loss': 0.382, 'learning_rate': 1.4766631314988333e-06, 'epoch': 1.66} {'loss': 0.248, 'learning_rate': 1.4764874205467793e-06, 'epoch': 1.66} {'loss': 0.3194, 'learning_rate': 1.476311719216148e-06, 'epoch': 1.66} {'loss': 0.374, 'learning_rate': 1.4761360275071424e-06, 'epoch': 1.66} {'loss': 0.2571, 'learning_rate': 1.4759603454199555e-06, 'epoch': 1.66} {'loss': 0.2936, 'learning_rate': 1.4757846729547908e-06, 'epoch': 1.66} {'loss': 0.2584, 'learning_rate': 1.4756090101118447e-06, 'epoch': 1.66} {'loss': 0.2657, 'learning_rate': 1.4754333568913126e-06, 'epoch': 1.66} {'loss': 0.3524, 'learning_rate': 1.4752577132933977e-06, 'epoch': 1.66} {'loss': 0.3596, 'learning_rate': 1.475082079318293e-06, 'epoch': 1.66} {'loss': 0.3477, 'learning_rate': 1.4749064549662018e-06, 'epoch': 1.66} {'loss': 0.3979, 'learning_rate': 1.4747308402373184e-06, 'epoch': 1.66} {'loss': 0.1223, 'learning_rate': 1.4745552351318449e-06, 'epoch': 1.66} {'loss': 0.2021, 'learning_rate': 1.4743796396499743e-06, 'epoch': 1.66} {'loss': 0.2826, 'learning_rate': 1.4742040537919112e-06, 'epoch': 1.66} {'loss': 0.3184, 'learning_rate': 1.4740284775578483e-06, 'epoch': 1.66} {'loss': 0.3334, 'learning_rate': 1.473852910947987e-06, 'epoch': 1.66} {'loss': 0.2328, 'learning_rate': 1.4736773539625226e-06, 'epoch': 1.66} {'loss': 0.3316, 'learning_rate': 1.4735018066016582e-06, 'epoch': 1.66} {'loss': 0.2972, 'learning_rate': 1.473326268865588e-06, 'epoch': 1.66} {'loss': 0.2412, 'learning_rate': 1.4731507407545098e-06, 'epoch': 1.66} {'loss': 0.3457, 'learning_rate': 1.4729752222686245e-06, 'epoch': 1.66} {'loss': 0.3285, 'learning_rate': 1.4727997134081261e-06, 'epoch': 1.66} {'loss': 0.3703, 'learning_rate': 1.4726242141732183e-06, 'epoch': 1.66} {'loss': 0.2992, 'learning_rate': 1.4724487245640928e-06, 'epoch': 1.66} {'loss': 0.4351, 'learning_rate': 1.472273244580954e-06, 'epoch': 1.66} {'loss': 0.3638, 'learning_rate': 1.472097774223995e-06, 'epoch': 1.66} {'loss': 0.3423, 'learning_rate': 1.471922313493418e-06, 'epoch': 1.66} {'loss': 0.3511, 'learning_rate': 1.471746862389417e-06, 'epoch': 1.66} {'loss': 0.335, 'learning_rate': 1.4715714209121945e-06, 'epoch': 1.66} {'loss': 0.2996, 'learning_rate': 1.4713959890619433e-06, 'epoch': 1.66} {'loss': 0.4228, 'learning_rate': 1.4712205668388668e-06, 'epoch': 1.66} {'loss': 0.3681, 'learning_rate': 1.471045154243158e-06, 'epoch': 1.66} {'loss': 0.4635, 'learning_rate': 1.4708697512750202e-06, 'epoch': 1.66} {'loss': 0.4643, 'learning_rate': 1.4706943579346478e-06, 'epoch': 1.66} {'loss': 0.2647, 'learning_rate': 1.470518974222238e-06, 'epoch': 1.66} {'loss': 0.3418, 'learning_rate': 1.4703436001379924e-06, 'epoch': 1.66} {'loss': 0.2833, 'learning_rate': 1.4701682356821046e-06, 'epoch': 1.66} {'loss': 0.2214, 'learning_rate': 1.469992880854777e-06, 'epoch': 1.66} {'loss': 0.2849, 'learning_rate': 1.4698175356562029e-06, 'epoch': 1.66} {'loss': 0.2367, 'learning_rate': 1.469642200086585e-06, 'epoch': 1.66} {'loss': 0.2231, 'learning_rate': 1.4694668741461172e-06, 'epoch': 1.66} {'loss': 0.256, 'learning_rate': 1.4692915578350009e-06, 'epoch': 1.66} {'loss': 0.2522, 'learning_rate': 1.4691162511534297e-06, 'epoch': 1.66} {'loss': 0.3951, 'learning_rate': 1.4689409541016064e-06, 'epoch': 1.66} {'loss': 0.2151, 'learning_rate': 1.4687656666797244e-06, 'epoch': 1.66} {'loss': 0.3286, 'learning_rate': 1.468590388887987e-06, 'epoch': 1.66} {'loss': 0.3128, 'learning_rate': 1.4684151207265874e-06, 'epoch': 1.66} {'loss': 0.1937, 'learning_rate': 1.4682398621957228e-06, 'epoch': 1.66} {'loss': 0.3215, 'learning_rate': 1.4680646132955955e-06, 'epoch': 1.66} {'loss': 0.203, 'learning_rate': 1.4678893740263988e-06, 'epoch': 1.66} {'loss': 0.2302, 'learning_rate': 1.4677141443883348e-06, 'epoch': 1.66} {'loss': 0.4278, 'learning_rate': 1.4675389243815963e-06, 'epoch': 1.66} {'loss': 0.2865, 'learning_rate': 1.4673637140063835e-06, 'epoch': 1.66} {'loss': 0.3147, 'learning_rate': 1.467188513262897e-06, 'epoch': 1.66} {'loss': 0.2484, 'learning_rate': 1.4670133221513304e-06, 'epoch': 1.66} {'loss': 0.3409, 'learning_rate': 1.4668381406718845e-06, 'epoch': 1.66} {'loss': 0.283, 'learning_rate': 1.4666629688247547e-06, 'epoch': 1.66} {'loss': 0.3088, 'learning_rate': 1.4664878066101406e-06, 'epoch': 1.66} {'loss': 0.35, 'learning_rate': 1.466312654028238e-06, 'epoch': 1.66} {'loss': 0.309, 'learning_rate': 1.4661375110792476e-06, 'epoch': 1.66} {'loss': 0.4136, 'learning_rate': 1.4659623777633624e-06, 'epoch': 1.66} {'loss': 0.3471, 'learning_rate': 1.4657872540807849e-06, 'epoch': 1.66} {'loss': 0.4536, 'learning_rate': 1.465612140031709e-06, 'epoch': 1.66} {'loss': 0.3017, 'learning_rate': 1.4654370356163371e-06, 'epoch': 1.66} {'loss': 0.1334, 'learning_rate': 1.46526194083486e-06, 'epoch': 1.66} {'loss': 0.45, 'learning_rate': 1.465086855687483e-06, 'epoch': 1.66} {'loss': 0.2607, 'learning_rate': 1.4649117801743995e-06, 'epoch': 1.66} {'loss': 0.4163, 'learning_rate': 1.4647367142958046e-06, 'epoch': 1.66} {'loss': 0.3074, 'learning_rate': 1.4645616580519017e-06, 'epoch': 1.66} {'loss': 0.2665, 'learning_rate': 1.4643866114428828e-06, 'epoch': 1.66} {'loss': 0.4311, 'learning_rate': 1.464211574468951e-06, 'epoch': 1.66} {'loss': 0.3617, 'learning_rate': 1.4640365471302997e-06, 'epoch': 1.66} {'loss': 0.3232, 'learning_rate': 1.4638615294271297e-06, 'epoch': 1.66} {'loss': 0.3804, 'learning_rate': 1.463686521359634e-06, 'epoch': 1.66} {'loss': 0.3009, 'learning_rate': 1.463511522928015e-06, 'epoch': 1.66} {'loss': 0.4333, 'learning_rate': 1.4633365341324668e-06, 'epoch': 1.66} {'loss': 0.2437, 'learning_rate': 1.4631615549731904e-06, 'epoch': 1.66} {'loss': 0.2107, 'learning_rate': 1.4629865854503788e-06, 'epoch': 1.66} {'loss': 0.2645, 'learning_rate': 1.4628116255642344e-06, 'epoch': 1.66} {'loss': 0.2389, 'learning_rate': 1.4626366753149524e-06, 'epoch': 1.66} {'loss': 0.2629, 'learning_rate': 1.462461734702727e-06, 'epoch': 1.66} {'loss': 0.3813, 'learning_rate': 1.4622868037277617e-06, 'epoch': 1.66} {'loss': 0.3234, 'learning_rate': 1.462111882390249e-06, 'epoch': 1.66} {'loss': 0.3008, 'learning_rate': 1.4619369706903907e-06, 'epoch': 1.66} {'loss': 0.4881, 'learning_rate': 1.4617620686283796e-06, 'epoch': 1.66} {'loss': 0.332, 'learning_rate': 1.4615871762044176e-06, 'epoch': 1.66} {'loss': 0.2674, 'learning_rate': 1.461412293418698e-06, 'epoch': 1.66} {'loss': 0.311, 'learning_rate': 1.4612374202714218e-06, 'epoch': 1.66} {'loss': 0.2391, 'learning_rate': 1.4610625567627834e-06, 'epoch': 1.66} {'loss': 0.3358, 'learning_rate': 1.4608877028929836e-06, 'epoch': 1.66} {'loss': 0.3776, 'learning_rate': 1.4607128586622155e-06, 'epoch': 1.66} {'loss': 0.2854, 'learning_rate': 1.4605380240706812e-06, 'epoch': 1.66} {'loss': 0.341, 'learning_rate': 1.4603631991185751e-06, 'epoch': 1.66} {'loss': 0.3018, 'learning_rate': 1.4601883838060926e-06, 'epoch': 1.66} {'loss': 0.4078, 'learning_rate': 1.4600135781334368e-06, 'epoch': 1.66} {'loss': 0.2883, 'learning_rate': 1.4598387821007987e-06, 'epoch': 1.66} {'loss': 0.2946, 'learning_rate': 1.4596639957083814e-06, 'epoch': 1.66} {'loss': 0.2924, 'learning_rate': 1.4594892189563769e-06, 'epoch': 1.66} {'loss': 0.1419, 'learning_rate': 1.4593144518449875e-06, 'epoch': 1.66} {'loss': 0.2608, 'learning_rate': 1.4591396943744052e-06, 'epoch': 1.66} {'loss': 0.4663, 'learning_rate': 1.458964946544833e-06, 'epoch': 1.66} {'loss': 0.2587, 'learning_rate': 1.458790208356462e-06, 'epoch': 1.66} {'loss': 0.3794, 'learning_rate': 1.4586154798094965e-06, 'epoch': 1.66} {'loss': 0.3307, 'learning_rate': 1.4584407609041263e-06, 'epoch': 1.66} {'loss': 0.3725, 'learning_rate': 1.4582660516405545e-06, 'epoch': 1.66} {'loss': 0.414, 'learning_rate': 1.4580913520189765e-06, 'epoch': 1.66} {'loss': 0.288, 'learning_rate': 1.4579166620395869e-06, 'epoch': 1.66} {'loss': 0.2764, 'learning_rate': 1.4577419817025873e-06, 'epoch': 1.66} {'loss': 0.2404, 'learning_rate': 1.45756731100817e-06, 'epoch': 1.66} {'loss': 0.2787, 'learning_rate': 1.457392649956537e-06, 'epoch': 1.66} {'loss': 0.2978, 'learning_rate': 1.4572179985478817e-06, 'epoch': 1.66} {'loss': 0.362, 'learning_rate': 1.4570433567824049e-06, 'epoch': 1.66} {'loss': 0.3296, 'learning_rate': 1.4568687246602986e-06, 'epoch': 1.66} {'loss': 0.3124, 'learning_rate': 1.456694102181766e-06, 'epoch': 1.66} {'loss': 0.1974, 'learning_rate': 1.456519489346998e-06, 'epoch': 1.66} {'loss': 0.2746, 'learning_rate': 1.4563448861561979e-06, 'epoch': 1.66} {'loss': 0.2467, 'learning_rate': 1.4561702926095577e-06, 'epoch': 1.66} {'loss': 0.3327, 'learning_rate': 1.4559957087072784e-06, 'epoch': 1.66} {'loss': 0.2844, 'learning_rate': 1.4558211344495554e-06, 'epoch': 1.66} {'loss': 0.2659, 'learning_rate': 1.4556465698365828e-06, 'epoch': 1.66} {'loss': 0.2917, 'learning_rate': 1.455472014868563e-06, 'epoch': 1.66} {'loss': 0.3066, 'learning_rate': 1.455297469545689e-06, 'epoch': 1.66} {'loss': 0.3797, 'learning_rate': 1.4551229338681604e-06, 'epoch': 1.66} {'loss': 0.298, 'learning_rate': 1.4549484078361708e-06, 'epoch': 1.66} {'loss': 0.3471, 'learning_rate': 1.4547738914499232e-06, 'epoch': 1.66} {'loss': 0.2496, 'learning_rate': 1.4545993847096075e-06, 'epoch': 1.66} {'loss': 0.2501, 'learning_rate': 1.4544248876154266e-06, 'epoch': 1.66} {'loss': 0.2186, 'learning_rate': 1.4542504001675728e-06, 'epoch': 1.66} {'loss': 0.3784, 'learning_rate': 1.454075922366247e-06, 'epoch': 1.66} {'loss': 0.3477, 'learning_rate': 1.4539014542116436e-06, 'epoch': 1.66} {'loss': 0.2985, 'learning_rate': 1.4537269957039612e-06, 'epoch': 1.66} {'loss': 0.2784, 'learning_rate': 1.4535525468433964e-06, 'epoch': 1.66} {'loss': 0.3802, 'learning_rate': 1.4533781076301434e-06, 'epoch': 1.66} {'loss': 0.2702, 'learning_rate': 1.4532036780644032e-06, 'epoch': 1.66} {'loss': 0.3279, 'learning_rate': 1.453029258146369e-06, 'epoch': 1.66} {'loss': 0.3261, 'learning_rate': 1.4528548478762417e-06, 'epoch': 1.66} {'loss': 0.234, 'learning_rate': 1.4526804472542132e-06, 'epoch': 1.66} {'loss': 0.3064, 'learning_rate': 1.452506056280486e-06, 'epoch': 1.66} {'loss': 0.2056, 'learning_rate': 1.4523316749552507e-06, 'epoch': 1.66} {'loss': 0.3938, 'learning_rate': 1.4521573032787105e-06, 'epoch': 1.66} {'loss': 0.3364, 'learning_rate': 1.4519829412510577e-06, 'epoch': 1.66} {'loss': 0.3285, 'learning_rate': 1.451808588872492e-06, 'epoch': 1.66} {'loss': 0.2332, 'learning_rate': 1.4516342461432076e-06, 'epoch': 1.66} {'loss': 0.3498, 'learning_rate': 1.4514599130634044e-06, 'epoch': 1.66} {'loss': 0.3404, 'learning_rate': 1.4512855896332767e-06, 'epoch': 1.66} {'loss': 0.2513, 'learning_rate': 1.4511112758530199e-06, 'epoch': 1.66} {'loss': 0.3838, 'learning_rate': 1.450936971722836e-06, 'epoch': 1.66} {'loss': 0.1651, 'learning_rate': 1.450762677242915e-06, 'epoch': 1.66} {'loss': 0.328, 'learning_rate': 1.450588392413461e-06, 'epoch': 1.66} {'loss': 0.3881, 'learning_rate': 1.450414117234663e-06, 'epoch': 1.66} {'loss': 0.2398, 'learning_rate': 1.450239851706725e-06, 'epoch': 1.66} {'loss': 0.3651, 'learning_rate': 1.450065595829836e-06, 'epoch': 1.66} {'loss': 0.3201, 'learning_rate': 1.449891349604201e-06, 'epoch': 1.66} {'loss': 0.3079, 'learning_rate': 1.4497171130300136e-06, 'epoch': 1.66} {'loss': 0.2428, 'learning_rate': 1.4495428861074667e-06, 'epoch': 1.66} {'loss': 0.3755, 'learning_rate': 1.4493686688367626e-06, 'epoch': 1.66} {'loss': 0.3497, 'learning_rate': 1.449194461218093e-06, 'epoch': 1.66} {'loss': 0.3366, 'learning_rate': 1.4490202632516591e-06, 'epoch': 1.66} {'loss': 0.2414, 'learning_rate': 1.4488460749376532e-06, 'epoch': 1.66} {'loss': 0.4077, 'learning_rate': 1.4486718962762758e-06, 'epoch': 1.66} {'loss': 0.2627, 'learning_rate': 1.4484977272677193e-06, 'epoch': 1.66} {'loss': 0.4413, 'learning_rate': 1.4483235679121855e-06, 'epoch': 1.66} {'loss': 0.3338, 'learning_rate': 1.4481494182098654e-06, 'epoch': 1.66} {'loss': 0.4574, 'learning_rate': 1.4479752781609613e-06, 'epoch': 1.66} {'loss': 0.427, 'learning_rate': 1.447801147765664e-06, 'epoch': 1.66} {'loss': 0.3036, 'learning_rate': 1.4476270270241754e-06, 'epoch': 1.66} {'loss': 0.3188, 'learning_rate': 1.4474529159366902e-06, 'epoch': 1.66} {'loss': 0.499, 'learning_rate': 1.4472788145034011e-06, 'epoch': 1.66} {'loss': 0.2647, 'learning_rate': 1.4471047227245105e-06, 'epoch': 1.66} {'loss': 0.2287, 'learning_rate': 1.4469306406002103e-06, 'epoch': 1.66} {'loss': 0.202, 'learning_rate': 1.4467565681307006e-06, 'epoch': 1.66} {'loss': 0.3133, 'learning_rate': 1.4465825053161741e-06, 'epoch': 1.66} {'loss': 0.3082, 'learning_rate': 1.4464084521568322e-06, 'epoch': 1.66} {'loss': 0.2315, 'learning_rate': 1.4462344086528668e-06, 'epoch': 1.66} {'loss': 0.3189, 'learning_rate': 1.4460603748044776e-06, 'epoch': 1.66} {'loss': 0.3548, 'learning_rate': 1.445886350611857e-06, 'epoch': 1.66} {'loss': 0.2853, 'learning_rate': 1.4457123360752068e-06, 'epoch': 1.66} {'loss': 0.2295, 'learning_rate': 1.445538331194719e-06, 'epoch': 1.66} {'loss': 0.3803, 'learning_rate': 1.4453643359705937e-06, 'epoch': 1.66} {'loss': 0.352, 'learning_rate': 1.4451903504030251e-06, 'epoch': 1.66} {'loss': 0.2835, 'learning_rate': 1.4450163744922075e-06, 'epoch': 1.66} {'loss': 0.2406, 'learning_rate': 1.4448424082383417e-06, 'epoch': 1.66} {'loss': 0.2452, 'learning_rate': 1.4446684516416198e-06, 'epoch': 1.66} {'loss': 0.3758, 'learning_rate': 1.444494504702243e-06, 'epoch': 1.66} {'loss': 0.3077, 'learning_rate': 1.444320567420402e-06, 'epoch': 1.66} {'loss': 0.3258, 'learning_rate': 1.4441466397962988e-06, 'epoch': 1.66} {'loss': 0.2435, 'learning_rate': 1.4439727218301259e-06, 'epoch': 1.66} {'loss': 0.3775, 'learning_rate': 1.4437988135220815e-06, 'epoch': 1.66} {'loss': 0.3886, 'learning_rate': 1.4436249148723603e-06, 'epoch': 1.66} {'loss': 0.1879, 'learning_rate': 1.4434510258811607e-06, 'epoch': 1.66} {'loss': 0.2137, 'learning_rate': 1.443277146548675e-06, 'epoch': 1.66} {'loss': 0.4642, 'learning_rate': 1.4431032768751064e-06, 'epoch': 1.66} {'loss': 0.3061, 'learning_rate': 1.4429294168606456e-06, 'epoch': 1.66} {'loss': 0.2066, 'learning_rate': 1.4427555665054882e-06, 'epoch': 1.66} {'loss': 0.2701, 'learning_rate': 1.4425817258098351e-06, 'epoch': 1.66} {'loss': 0.3299, 'learning_rate': 1.4424078947738772e-06, 'epoch': 1.66} {'loss': 0.2627, 'learning_rate': 1.4422340733978168e-06, 'epoch': 1.66} {'loss': 0.2757, 'learning_rate': 1.4420602616818436e-06, 'epoch': 1.66} {'loss': 0.3518, 'learning_rate': 1.4418864596261594e-06, 'epoch': 1.66} {'loss': 0.3169, 'learning_rate': 1.4417126672309556e-06, 'epoch': 1.66} {'loss': 0.2754, 'learning_rate': 1.441538884496434e-06, 'epoch': 1.66} {'loss': 0.166, 'learning_rate': 1.4413651114227845e-06, 'epoch': 1.66} {'loss': 0.3814, 'learning_rate': 1.441191348010208e-06, 'epoch': 1.66} {'loss': 0.2733, 'learning_rate': 1.4410175942588977e-06, 'epoch': 1.66} {'loss': 0.3343, 'learning_rate': 1.4408438501690524e-06, 'epoch': 1.66} {'loss': 0.2876, 'learning_rate': 1.4406701157408675e-06, 'epoch': 1.66} {'loss': 0.3543, 'learning_rate': 1.4404963909745362e-06, 'epoch': 1.66} {'loss': 0.3901, 'learning_rate': 1.4403226758702582e-06, 'epoch': 1.66} {'loss': 0.3576, 'learning_rate': 1.4401489704282268e-06, 'epoch': 1.66} {'loss': 0.4802, 'learning_rate': 1.4399752746486418e-06, 'epoch': 1.66} {'loss': 0.2401, 'learning_rate': 1.439801588531694e-06, 'epoch': 1.66} {'loss': 0.2321, 'learning_rate': 1.4396279120775846e-06, 'epoch': 1.66} {'loss': 0.277, 'learning_rate': 1.4394542452865056e-06, 'epoch': 1.66} {'loss': 0.2675, 'learning_rate': 1.439280588158657e-06, 'epoch': 1.66} {'loss': 0.3623, 'learning_rate': 1.4391069406942315e-06, 'epoch': 1.66} {'loss': 0.2439, 'learning_rate': 1.438933302893427e-06, 'epoch': 1.66} {'loss': 0.2628, 'learning_rate': 1.438759674756437e-06, 'epoch': 1.67} {'loss': 0.4183, 'learning_rate': 1.438586056283462e-06, 'epoch': 1.67} {'loss': 0.3261, 'learning_rate': 1.4384124474746953e-06, 'epoch': 1.67} {'loss': 0.3117, 'learning_rate': 1.4382388483303311e-06, 'epoch': 1.67} {'loss': 0.4614, 'learning_rate': 1.4380652588505683e-06, 'epoch': 1.67} {'loss': 0.3603, 'learning_rate': 1.4378916790356002e-06, 'epoch': 1.67} {'loss': 0.2737, 'learning_rate': 1.4377181088856262e-06, 'epoch': 1.67} {'loss': 0.3465, 'learning_rate': 1.4375445484008376e-06, 'epoch': 1.67} {'loss': 0.2041, 'learning_rate': 1.4373709975814366e-06, 'epoch': 1.67} {'loss': 0.3882, 'learning_rate': 1.4371974564276115e-06, 'epoch': 1.67} {'loss': 0.3687, 'learning_rate': 1.4370239249395657e-06, 'epoch': 1.67} {'loss': 0.3088, 'learning_rate': 1.4368504031174891e-06, 'epoch': 1.67} {'loss': 0.4, 'learning_rate': 1.4366768909615814e-06, 'epoch': 1.67} {'loss': 0.2755, 'learning_rate': 1.436503388472036e-06, 'epoch': 1.67} {'loss': 0.2551, 'learning_rate': 1.4363298956490513e-06, 'epoch': 1.67} {'loss': 0.3239, 'learning_rate': 1.4361564124928217e-06, 'epoch': 1.67} {'loss': 0.3008, 'learning_rate': 1.4359829390035418e-06, 'epoch': 1.67} {'loss': 0.1763, 'learning_rate': 1.43580947518141e-06, 'epoch': 1.67} {'loss': 0.3632, 'learning_rate': 1.4356360210266184e-06, 'epoch': 1.67} {'loss': 0.3543, 'learning_rate': 1.4354625765393671e-06, 'epoch': 1.67} {'loss': 0.3468, 'learning_rate': 1.435289141719849e-06, 'epoch': 1.67} {'loss': 0.283, 'learning_rate': 1.4351157165682616e-06, 'epoch': 1.67} {'loss': 0.2506, 'learning_rate': 1.4349423010847984e-06, 'epoch': 1.67} {'loss': 0.2443, 'learning_rate': 1.4347688952696592e-06, 'epoch': 1.67} {'loss': 0.2781, 'learning_rate': 1.4345954991230337e-06, 'epoch': 1.67} {'loss': 0.2778, 'learning_rate': 1.4344221126451252e-06, 'epoch': 1.67} {'loss': 0.424, 'learning_rate': 1.4342487358361213e-06, 'epoch': 1.67} {'loss': 0.305, 'learning_rate': 1.434075368696225e-06, 'epoch': 1.67} {'loss': 0.2962, 'learning_rate': 1.4339020112256285e-06, 'epoch': 1.67} {'loss': 0.4731, 'learning_rate': 1.4337286634245251e-06, 'epoch': 1.67} {'loss': 0.33, 'learning_rate': 1.4335553252931155e-06, 'epoch': 1.67} {'loss': 0.3366, 'learning_rate': 1.433381996831591e-06, 'epoch': 1.67} {'loss': 0.3908, 'learning_rate': 1.433208678040151e-06, 'epoch': 1.67} {'loss': 0.349, 'learning_rate': 1.433035368918988e-06, 'epoch': 1.67} {'loss': 0.4514, 'learning_rate': 1.4328620694682983e-06, 'epoch': 1.67} {'loss': 0.324, 'learning_rate': 1.4326887796882805e-06, 'epoch': 1.67} {'loss': 0.3016, 'learning_rate': 1.4325154995791245e-06, 'epoch': 1.67} {'loss': 0.3461, 'learning_rate': 1.4323422291410338e-06, 'epoch': 1.67} {'loss': 0.2379, 'learning_rate': 1.4321689683741958e-06, 'epoch': 1.67} {'loss': 0.3409, 'learning_rate': 1.4319957172788124e-06, 'epoch': 1.67} {'loss': 0.2917, 'learning_rate': 1.4318224758550748e-06, 'epoch': 1.67} {'loss': 0.3464, 'learning_rate': 1.4316492441031814e-06, 'epoch': 1.67} {'loss': 0.3896, 'learning_rate': 1.4314760220233248e-06, 'epoch': 1.67} {'loss': 0.379, 'learning_rate': 1.4313028096157056e-06, 'epoch': 1.67} {'loss': 0.2501, 'learning_rate': 1.4311296068805125e-06, 'epoch': 1.67} {'loss': 0.3774, 'learning_rate': 1.4309564138179476e-06, 'epoch': 1.67} {'loss': 0.4114, 'learning_rate': 1.4307832304282021e-06, 'epoch': 1.67} {'loss': 0.2868, 'learning_rate': 1.4306100567114733e-06, 'epoch': 1.67} {'loss': 0.2665, 'learning_rate': 1.430436892667958e-06, 'epoch': 1.67} {'loss': 0.2734, 'learning_rate': 1.4302637382978456e-06, 'epoch': 1.67} {'loss': 0.3162, 'learning_rate': 1.4300905936013398e-06, 'epoch': 1.67} {'loss': 0.2151, 'learning_rate': 1.429917458578629e-06, 'epoch': 1.67} {'loss': 0.2434, 'learning_rate': 1.4297443332299144e-06, 'epoch': 1.67} {'loss': 0.3008, 'learning_rate': 1.4295712175553855e-06, 'epoch': 1.67} {'loss': 0.418, 'learning_rate': 1.4293981115552448e-06, 'epoch': 1.67} {'loss': 0.2878, 'learning_rate': 1.4292250152296804e-06, 'epoch': 1.67} {'loss': 0.2182, 'learning_rate': 1.429051928578894e-06, 'epoch': 1.67} {'loss': 0.2288, 'learning_rate': 1.428878851603075e-06, 'epoch': 1.67} {'loss': 0.2865, 'learning_rate': 1.4287057843024255e-06, 'epoch': 1.67} {'loss': 0.3181, 'learning_rate': 1.4285327266771333e-06, 'epoch': 1.67} {'loss': 0.4245, 'learning_rate': 1.4283596787274012e-06, 'epoch': 1.67} {'loss': 0.2877, 'learning_rate': 1.4281866404534205e-06, 'epoch': 1.67} {'loss': 0.3013, 'learning_rate': 1.4280136118553856e-06, 'epoch': 1.67} {'loss': 0.2755, 'learning_rate': 1.4278405929334949e-06, 'epoch': 1.67} {'loss': 0.2483, 'learning_rate': 1.4276675836879406e-06, 'epoch': 1.67} {'loss': 0.3183, 'learning_rate': 1.4274945841189202e-06, 'epoch': 1.67} {'loss': 0.4342, 'learning_rate': 1.4273215942266271e-06, 'epoch': 1.67} {'loss': 0.3806, 'learning_rate': 1.42714861401126e-06, 'epoch': 1.67} {'loss': 0.3582, 'learning_rate': 1.4269756434730098e-06, 'epoch': 1.67} {'loss': 0.2271, 'learning_rate': 1.4268026826120762e-06, 'epoch': 1.67} {'loss': 0.4152, 'learning_rate': 1.4266297314286493e-06, 'epoch': 1.67} {'loss': 0.49, 'learning_rate': 1.4264567899229297e-06, 'epoch': 1.67} {'loss': 0.23, 'learning_rate': 1.4262838580951077e-06, 'epoch': 1.67} {'loss': 0.2043, 'learning_rate': 1.426110935945383e-06, 'epoch': 1.67} {'loss': 0.2972, 'learning_rate': 1.4259380234739483e-06, 'epoch': 1.67} {'loss': 0.3436, 'learning_rate': 1.4257651206809974e-06, 'epoch': 1.67} {'loss': 0.4364, 'learning_rate': 1.42559222756673e-06, 'epoch': 1.67} {'loss': 0.236, 'learning_rate': 1.4254193441313359e-06, 'epoch': 1.67} {'loss': 0.2208, 'learning_rate': 1.4252464703750147e-06, 'epoch': 1.67} {'loss': 0.3462, 'learning_rate': 1.4250736062979564e-06, 'epoch': 1.67} {'loss': 0.2016, 'learning_rate': 1.4249007519003632e-06, 'epoch': 1.67} {'loss': 0.2857, 'learning_rate': 1.4247279071824238e-06, 'epoch': 1.67} {'loss': 0.3528, 'learning_rate': 1.424555072144338e-06, 'epoch': 1.67} {'loss': 0.2602, 'learning_rate': 1.4243822467862967e-06, 'epoch': 1.67} {'loss': 0.3749, 'learning_rate': 1.4242094311084997e-06, 'epoch': 1.67} {'loss': 0.4022, 'learning_rate': 1.424036625111137e-06, 'epoch': 1.67} {'loss': 0.374, 'learning_rate': 1.4238638287944084e-06, 'epoch': 1.67} {'loss': 0.1739, 'learning_rate': 1.4236910421585037e-06, 'epoch': 1.67} {'loss': 0.2506, 'learning_rate': 1.4235182652036238e-06, 'epoch': 1.67} {'loss': 0.3601, 'learning_rate': 1.423345497929961e-06, 'epoch': 1.67} {'loss': 0.2496, 'learning_rate': 1.4231727403377082e-06, 'epoch': 1.67} {'loss': 0.2574, 'learning_rate': 1.4229999924270644e-06, 'epoch': 1.67} {'loss': 0.2945, 'learning_rate': 1.4228272541982202e-06, 'epoch': 1.67} {'loss': 0.2371, 'learning_rate': 1.4226545256513758e-06, 'epoch': 1.67} {'loss': 0.2786, 'learning_rate': 1.4224818067867208e-06, 'epoch': 1.67} {'loss': 0.2594, 'learning_rate': 1.4223090976044552e-06, 'epoch': 1.67} {'loss': 0.5048, 'learning_rate': 1.4221363981047687e-06, 'epoch': 1.67} {'loss': 0.3447, 'learning_rate': 1.4219637082878611e-06, 'epoch': 1.67} {'loss': 0.2465, 'learning_rate': 1.4217910281539238e-06, 'epoch': 1.67} {'loss': 0.241, 'learning_rate': 1.421618357703155e-06, 'epoch': 1.67} {'loss': 0.1669, 'learning_rate': 1.421445696935746e-06, 'epoch': 1.67} {'loss': 0.3316, 'learning_rate': 1.4212730458518953e-06, 'epoch': 1.67} {'loss': 0.2884, 'learning_rate': 1.4211004044517962e-06, 'epoch': 1.67} {'loss': 0.3386, 'learning_rate': 1.420927772735642e-06, 'epoch': 1.67} {'loss': 0.2984, 'learning_rate': 1.4207551507036298e-06, 'epoch': 1.67} {'loss': 0.2158, 'learning_rate': 1.4205825383559524e-06, 'epoch': 1.67} {'loss': 0.4423, 'learning_rate': 1.420409935692808e-06, 'epoch': 1.67} {'loss': 0.3181, 'learning_rate': 1.4202373427143866e-06, 'epoch': 1.67} {'loss': 0.2359, 'learning_rate': 1.4200647594208883e-06, 'epoch': 1.67} {'loss': 0.2694, 'learning_rate': 1.4198921858125025e-06, 'epoch': 1.67} {'loss': 0.2972, 'learning_rate': 1.4197196218894293e-06, 'epoch': 1.67} {'loss': 0.2931, 'learning_rate': 1.4195470676518586e-06, 'epoch': 1.67} {'loss': 0.3274, 'learning_rate': 1.4193745230999911e-06, 'epoch': 1.67} {'loss': 0.275, 'learning_rate': 1.4192019882340146e-06, 'epoch': 1.67} {'loss': 0.2899, 'learning_rate': 1.4190294630541302e-06, 'epoch': 1.67} {'loss': 0.2517, 'learning_rate': 1.4188569475605296e-06, 'epoch': 1.67} {'loss': 0.3496, 'learning_rate': 1.4186844417534052e-06, 'epoch': 1.67} {'loss': 0.4706, 'learning_rate': 1.4185119456329567e-06, 'epoch': 1.67} {'loss': 0.1958, 'learning_rate': 1.4183394591993737e-06, 'epoch': 1.67} {'loss': 0.2537, 'learning_rate': 1.4181669824528565e-06, 'epoch': 1.67} {'loss': 0.3429, 'learning_rate': 1.4179945153935947e-06, 'epoch': 1.67} {'loss': 0.2894, 'learning_rate': 1.4178220580217871e-06, 'epoch': 1.67} {'loss': 0.3214, 'learning_rate': 1.4176496103376237e-06, 'epoch': 1.67} {'loss': 0.3108, 'learning_rate': 1.417477172341305e-06, 'epoch': 1.67} {'loss': 0.2521, 'learning_rate': 1.4173047440330201e-06, 'epoch': 1.67} {'loss': 0.4083, 'learning_rate': 1.4171323254129677e-06, 'epoch': 1.67} {'loss': 0.2121, 'learning_rate': 1.4169599164813386e-06, 'epoch': 1.67} {'loss': 0.2767, 'learning_rate': 1.4167875172383327e-06, 'epoch': 1.67} {'loss': 0.305, 'learning_rate': 1.4166151276841411e-06, 'epoch': 1.67} {'loss': 0.2811, 'learning_rate': 1.4164427478189558e-06, 'epoch': 1.67} {'loss': 0.2633, 'learning_rate': 1.4162703776429775e-06, 'epoch': 1.67} {'loss': 0.4274, 'learning_rate': 1.4160980171563953e-06, 'epoch': 1.67} {'loss': 0.2647, 'learning_rate': 1.415925666359409e-06, 'epoch': 1.67} {'loss': 0.354, 'learning_rate': 1.415753325252205e-06, 'epoch': 1.67} {'loss': 0.4418, 'learning_rate': 1.4155809938349873e-06, 'epoch': 1.67} {'loss': 0.1785, 'learning_rate': 1.4154086721079462e-06, 'epoch': 1.67} {'loss': 0.3304, 'learning_rate': 1.4152363600712748e-06, 'epoch': 1.67} {'loss': 0.4028, 'learning_rate': 1.4150640577251718e-06, 'epoch': 1.67} {'loss': 0.1909, 'learning_rate': 1.4148917650698257e-06, 'epoch': 1.67} {'loss': 0.2914, 'learning_rate': 1.4147194821054367e-06, 'epoch': 1.67} {'loss': 0.3765, 'learning_rate': 1.4145472088321943e-06, 'epoch': 1.67} {'loss': 0.3746, 'learning_rate': 1.4143749452502987e-06, 'epoch': 1.67} {'loss': 0.2817, 'learning_rate': 1.4142026913599383e-06, 'epoch': 1.67} {'loss': 0.2746, 'learning_rate': 1.414030447161312e-06, 'epoch': 1.67} {'loss': 0.2781, 'learning_rate': 1.4138582126546118e-06, 'epoch': 1.67} {'loss': 0.2154, 'learning_rate': 1.4136859878400343e-06, 'epoch': 1.67} {'loss': 0.2475, 'learning_rate': 1.4135137727177705e-06, 'epoch': 1.67} {'loss': 0.2334, 'learning_rate': 1.4133415672880191e-06, 'epoch': 1.67} {'loss': 0.3359, 'learning_rate': 1.413169371550972e-06, 'epoch': 1.67} {'loss': 0.4693, 'learning_rate': 1.4129971855068214e-06, 'epoch': 1.67} {'loss': 0.3555, 'learning_rate': 1.412825009155767e-06, 'epoch': 1.67} {'loss': 0.245, 'learning_rate': 1.4126528424979979e-06, 'epoch': 1.67} {'loss': 0.366, 'learning_rate': 1.4124806855337124e-06, 'epoch': 1.67} {'loss': 0.248, 'learning_rate': 1.4123085382631018e-06, 'epoch': 1.67} {'loss': 0.284, 'learning_rate': 1.4121364006863636e-06, 'epoch': 1.67} {'loss': 0.206, 'learning_rate': 1.4119642728036886e-06, 'epoch': 1.67} {'loss': 0.2982, 'learning_rate': 1.4117921546152747e-06, 'epoch': 1.67} {'loss': 0.1293, 'learning_rate': 1.4116200461213115e-06, 'epoch': 1.67} {'loss': 0.2974, 'learning_rate': 1.4114479473219989e-06, 'epoch': 1.67} {'loss': 0.3526, 'learning_rate': 1.4112758582175268e-06, 'epoch': 1.67} {'loss': 0.2701, 'learning_rate': 1.4111037788080928e-06, 'epoch': 1.67} {'loss': 0.385, 'learning_rate': 1.410931709093889e-06, 'epoch': 1.67} {'loss': 0.3035, 'learning_rate': 1.4107596490751074e-06, 'epoch': 1.67} {'loss': 0.4097, 'learning_rate': 1.410587598751948e-06, 'epoch': 1.67} {'loss': 0.3725, 'learning_rate': 1.4104155581245994e-06, 'epoch': 1.67} {'loss': 0.3307, 'learning_rate': 1.4102435271932602e-06, 'epoch': 1.67} {'loss': 0.2854, 'learning_rate': 1.4100715059581204e-06, 'epoch': 1.67} {'loss': 0.197, 'learning_rate': 1.4098994944193788e-06, 'epoch': 1.67} {'loss': 0.244, 'learning_rate': 1.4097274925772252e-06, 'epoch': 1.67} {'loss': 0.3617, 'learning_rate': 1.4095555004318584e-06, 'epoch': 1.67} {'loss': 0.3157, 'learning_rate': 1.409383517983467e-06, 'epoch': 1.67} {'loss': 0.153, 'learning_rate': 1.4092115452322497e-06, 'epoch': 1.67} {'loss': 0.2502, 'learning_rate': 1.4090395821783976e-06, 'epoch': 1.67} {'loss': 0.2895, 'learning_rate': 1.4088676288221082e-06, 'epoch': 1.67} {'loss': 0.2332, 'learning_rate': 1.4086956851635736e-06, 'epoch': 1.67} {'loss': 0.1114, 'learning_rate': 1.4085237512029847e-06, 'epoch': 1.67} {'loss': 0.22, 'learning_rate': 1.4083518269405427e-06, 'epoch': 1.67} {'loss': 0.4029, 'learning_rate': 1.4081799123764338e-06, 'epoch': 1.67} {'loss': 0.306, 'learning_rate': 1.4080080075108594e-06, 'epoch': 1.67} {'loss': 0.3622, 'learning_rate': 1.4078361123440076e-06, 'epoch': 1.67} {'loss': 0.4121, 'learning_rate': 1.4076642268760766e-06, 'epoch': 1.67} {'loss': 0.461, 'learning_rate': 1.407492351107257e-06, 'epoch': 1.67} {'loss': 0.3718, 'learning_rate': 1.4073204850377475e-06, 'epoch': 1.67} {'loss': 0.4073, 'learning_rate': 1.407148628667736e-06, 'epoch': 1.67} {'loss': 0.2661, 'learning_rate': 1.4069767819974224e-06, 'epoch': 1.67} {'loss': 0.4483, 'learning_rate': 1.406804945026995e-06, 'epoch': 1.67} {'loss': 0.261, 'learning_rate': 1.4066331177566539e-06, 'epoch': 1.67} {'loss': 0.2607, 'learning_rate': 1.406461300186589e-06, 'epoch': 1.67} {'loss': 0.2595, 'learning_rate': 1.4062894923169934e-06, 'epoch': 1.67} {'loss': 0.4012, 'learning_rate': 1.4061176941480658e-06, 'epoch': 1.67} {'loss': 0.2947, 'learning_rate': 1.405945905679994e-06, 'epoch': 1.67} {'loss': 0.3062, 'learning_rate': 1.4057741269129778e-06, 'epoch': 1.67} {'loss': 0.3606, 'learning_rate': 1.4056023578472056e-06, 'epoch': 1.67} {'loss': 0.2916, 'learning_rate': 1.4054305984828765e-06, 'epoch': 1.67} {'loss': 0.3654, 'learning_rate': 1.405258848820179e-06, 'epoch': 1.67} {'loss': 0.2384, 'learning_rate': 1.4050871088593132e-06, 'epoch': 1.67} {'loss': 0.2648, 'learning_rate': 1.4049153786004665e-06, 'epoch': 1.67} {'loss': 0.3302, 'learning_rate': 1.4047436580438389e-06, 'epoch': 1.67} {'loss': 0.3207, 'learning_rate': 1.404571947189618e-06, 'epoch': 1.67} {'loss': 0.2512, 'learning_rate': 1.4044002460380046e-06, 'epoch': 1.67} {'loss': 0.3407, 'learning_rate': 1.4042285545891875e-06, 'epoch': 1.67} {'loss': 0.3008, 'learning_rate': 1.40405687284336e-06, 'epoch': 1.67} {'loss': 0.2224, 'learning_rate': 1.4038852008007198e-06, 'epoch': 1.67} {'loss': 0.2857, 'learning_rate': 1.4037135384614576e-06, 'epoch': 1.67} {'loss': 0.257, 'learning_rate': 1.4035418858257688e-06, 'epoch': 1.67} {'loss': 0.2896, 'learning_rate': 1.4033702428938445e-06, 'epoch': 1.67} {'loss': 0.4099, 'learning_rate': 1.4031986096658834e-06, 'epoch': 1.67} {'loss': 0.4385, 'learning_rate': 1.403026986142073e-06, 'epoch': 1.67} {'loss': 0.3618, 'learning_rate': 1.4028553723226135e-06, 'epoch': 1.67} {'loss': 0.1657, 'learning_rate': 1.4026837682076932e-06, 'epoch': 1.67} {'loss': 0.2437, 'learning_rate': 1.40251217379751e-06, 'epoch': 1.67} {'loss': 0.2047, 'learning_rate': 1.4023405890922536e-06, 'epoch': 1.67} {'loss': 0.1653, 'learning_rate': 1.4021690140921218e-06, 'epoch': 1.67} {'loss': 0.1346, 'learning_rate': 1.4019974487973065e-06, 'epoch': 1.67} {'loss': 0.2818, 'learning_rate': 1.4018258932079988e-06, 'epoch': 1.67} {'loss': 0.358, 'learning_rate': 1.401654347324397e-06, 'epoch': 1.67} {'loss': 0.2475, 'learning_rate': 1.4014828111466905e-06, 'epoch': 1.67} {'loss': 0.2881, 'learning_rate': 1.4013112846750765e-06, 'epoch': 1.67} {'loss': 0.3683, 'learning_rate': 1.401139767909745e-06, 'epoch': 1.67} {'loss': 0.2453, 'learning_rate': 1.4009682608508934e-06, 'epoch': 1.67} {'loss': 0.3342, 'learning_rate': 1.4007967634987108e-06, 'epoch': 1.67} {'loss': 0.192, 'learning_rate': 1.4006252758533968e-06, 'epoch': 1.67} {'loss': 0.2052, 'learning_rate': 1.4004537979151388e-06, 'epoch': 1.67} {'loss': 0.2674, 'learning_rate': 1.400282329684135e-06, 'epoch': 1.67} {'loss': 0.3581, 'learning_rate': 1.4001108711605749e-06, 'epoch': 1.67} {'loss': 0.2994, 'learning_rate': 1.3999394223446573e-06, 'epoch': 1.67} {'loss': 0.3037, 'learning_rate': 1.3997679832365728e-06, 'epoch': 1.67} {'loss': 0.2815, 'learning_rate': 1.399596553836512e-06, 'epoch': 1.67} {'loss': 0.358, 'learning_rate': 1.399425134144674e-06, 'epoch': 1.67} {'loss': 0.3931, 'learning_rate': 1.3992537241612469e-06, 'epoch': 1.67} {'loss': 0.2367, 'learning_rate': 1.3990823238864293e-06, 'epoch': 1.67} {'loss': 0.2617, 'learning_rate': 1.39891093332041e-06, 'epoch': 1.67} {'loss': 0.3719, 'learning_rate': 1.3987395524633863e-06, 'epoch': 1.67} {'loss': 0.3607, 'learning_rate': 1.398568181315546e-06, 'epoch': 1.67} {'loss': 0.175, 'learning_rate': 1.3983968198770904e-06, 'epoch': 1.67} {'loss': 0.3408, 'learning_rate': 1.3982254681482099e-06, 'epoch': 1.67} {'loss': 0.3939, 'learning_rate': 1.3980541261290948e-06, 'epoch': 1.67} {'loss': 0.2929, 'learning_rate': 1.3978827938199435e-06, 'epoch': 1.67} {'loss': 0.2878, 'learning_rate': 1.3977114712209439e-06, 'epoch': 1.67} {'loss': 0.3535, 'learning_rate': 1.3975401583322946e-06, 'epoch': 1.67} {'loss': 0.1834, 'learning_rate': 1.397368855154184e-06, 'epoch': 1.67} {'loss': 0.3809, 'learning_rate': 1.3971975616868117e-06, 'epoch': 1.67} {'loss': 0.3451, 'learning_rate': 1.3970262779303645e-06, 'epoch': 1.67} {'loss': 0.3632, 'learning_rate': 1.3968550038850404e-06, 'epoch': 1.67} {'loss': 0.184, 'learning_rate': 1.3966837395510291e-06, 'epoch': 1.67} {'loss': 0.3425, 'learning_rate': 1.3965124849285284e-06, 'epoch': 1.67} {'loss': 0.3389, 'learning_rate': 1.3963412400177267e-06, 'epoch': 1.67} {'loss': 0.283, 'learning_rate': 1.396170004818822e-06, 'epoch': 1.67} {'loss': 0.4275, 'learning_rate': 1.3959987793320051e-06, 'epoch': 1.67} {'loss': 0.2096, 'learning_rate': 1.3958275635574669e-06, 'epoch': 1.67} {'loss': 0.2689, 'learning_rate': 1.3956563574954063e-06, 'epoch': 1.67} {'loss': 0.1767, 'learning_rate': 1.3954851611460108e-06, 'epoch': 1.67} {'loss': 0.2803, 'learning_rate': 1.395313974509478e-06, 'epoch': 1.67} {'loss': 0.2122, 'learning_rate': 1.3951427975859976e-06, 'epoch': 1.67} {'loss': 0.3158, 'learning_rate': 1.3949716303757677e-06, 'epoch': 1.67} {'loss': 0.2148, 'learning_rate': 1.3948004728789754e-06, 'epoch': 1.67} {'loss': 0.4063, 'learning_rate': 1.3946293250958186e-06, 'epoch': 1.67} {'loss': 0.4054, 'learning_rate': 1.3944581870264884e-06, 'epoch': 1.67} {'loss': 0.2881, 'learning_rate': 1.3942870586711798e-06, 'epoch': 1.67} {'loss': 0.3681, 'learning_rate': 1.3941159400300819e-06, 'epoch': 1.67} {'loss': 0.3556, 'learning_rate': 1.3939448311033943e-06, 'epoch': 1.67} {'loss': 0.4323, 'learning_rate': 1.3937737318913048e-06, 'epoch': 1.67} {'loss': 0.2179, 'learning_rate': 1.3936026423940075e-06, 'epoch': 1.67} {'loss': 0.333, 'learning_rate': 1.393431562611698e-06, 'epoch': 1.67} {'loss': 0.2279, 'learning_rate': 1.3932604925445648e-06, 'epoch': 1.67} {'loss': 0.3382, 'learning_rate': 1.3930894321928057e-06, 'epoch': 1.67} {'loss': 0.1721, 'learning_rate': 1.3929183815566105e-06, 'epoch': 1.67} {'loss': 0.2168, 'learning_rate': 1.3927473406361768e-06, 'epoch': 1.67} {'loss': 0.3762, 'learning_rate': 1.3925763094316913e-06, 'epoch': 1.67} {'loss': 0.3674, 'learning_rate': 1.3924052879433525e-06, 'epoch': 1.67} {'loss': 0.2006, 'learning_rate': 1.3922342761713493e-06, 'epoch': 1.67} {'loss': 0.1729, 'learning_rate': 1.3920632741158791e-06, 'epoch': 1.67} {'loss': 0.3312, 'learning_rate': 1.3918922817771307e-06, 'epoch': 1.67} {'loss': 0.2743, 'learning_rate': 1.3917212991553008e-06, 'epoch': 1.67} {'loss': 0.1873, 'learning_rate': 1.3915503262505813e-06, 'epoch': 1.67} {'loss': 0.2516, 'learning_rate': 1.391379363063161e-06, 'epoch': 1.67} {'loss': 0.1774, 'learning_rate': 1.3912084095932399e-06, 'epoch': 1.67} {'loss': 0.2915, 'learning_rate': 1.3910374658410041e-06, 'epoch': 1.67} {'loss': 0.3102, 'learning_rate': 1.3908665318066527e-06, 'epoch': 1.67} {'loss': 0.3569, 'learning_rate': 1.3906956074903744e-06, 'epoch': 1.67} {'loss': 0.4404, 'learning_rate': 1.3905246928923643e-06, 'epoch': 1.67} {'loss': 0.2915, 'learning_rate': 1.3903537880128136e-06, 'epoch': 1.67} {'loss': 0.1911, 'learning_rate': 1.3901828928519178e-06, 'epoch': 1.67} {'loss': 0.2524, 'learning_rate': 1.3900120074098666e-06, 'epoch': 1.67} {'loss': 0.2181, 'learning_rate': 1.3898411316868565e-06, 'epoch': 1.67} {'loss': 0.2355, 'learning_rate': 1.3896702656830762e-06, 'epoch': 1.67} {'loss': 0.3145, 'learning_rate': 1.3894994093987235e-06, 'epoch': 1.67} {'loss': 0.4435, 'learning_rate': 1.389328562833988e-06, 'epoch': 1.67} {'loss': 0.2537, 'learning_rate': 1.389157725989062e-06, 'epoch': 1.67} {'loss': 0.2668, 'learning_rate': 1.3889868988641408e-06, 'epoch': 1.67} {'loss': 0.2688, 'learning_rate': 1.3888160814594143e-06, 'epoch': 1.67} {'loss': 0.2454, 'learning_rate': 1.388645273775079e-06, 'epoch': 1.67} {'loss': 0.2165, 'learning_rate': 1.3884744758113222e-06, 'epoch': 1.67} {'loss': 0.3099, 'learning_rate': 1.3883036875683441e-06, 'epoch': 1.67} {'loss': 0.2962, 'learning_rate': 1.3881329090463303e-06, 'epoch': 1.67} {'loss': 0.296, 'learning_rate': 1.387962140245479e-06, 'epoch': 1.67} {'loss': 0.3066, 'learning_rate': 1.3877913811659793e-06, 'epoch': 1.67} {'loss': 0.3613, 'learning_rate': 1.3876206318080275e-06, 'epoch': 1.67} {'loss': 0.3189, 'learning_rate': 1.3874498921718115e-06, 'epoch': 1.67} {'loss': 0.2823, 'learning_rate': 1.3872791622575298e-06, 'epoch': 1.67} {'loss': 0.1556, 'learning_rate': 1.3871084420653714e-06, 'epoch': 1.67} {'loss': 0.3709, 'learning_rate': 1.3869377315955279e-06, 'epoch': 1.67} {'loss': 0.3316, 'learning_rate': 1.3867670308481962e-06, 'epoch': 1.67} {'loss': 0.3537, 'learning_rate': 1.386596339823565e-06, 'epoch': 1.67} {'loss': 0.3491, 'learning_rate': 1.3864256585218293e-06, 'epoch': 1.67} {'loss': 0.3819, 'learning_rate': 1.3862549869431796e-06, 'epoch': 1.67} {'loss': 0.3234, 'learning_rate': 1.3860843250878131e-06, 'epoch': 1.67} {'loss': 0.2863, 'learning_rate': 1.3859136729559165e-06, 'epoch': 1.67} {'loss': 0.346, 'learning_rate': 1.385743030547687e-06, 'epoch': 1.67} {'loss': 0.4133, 'learning_rate': 1.385572397863314e-06, 'epoch': 1.67} {'loss': 0.257, 'learning_rate': 1.3854017749029936e-06, 'epoch': 1.67} {'loss': 0.3299, 'learning_rate': 1.3852311616669145e-06, 'epoch': 1.67} {'loss': 0.4431, 'learning_rate': 1.3850605581552723e-06, 'epoch': 1.67} {'loss': 0.291, 'learning_rate': 1.3848899643682602e-06, 'epoch': 1.67} {'loss': 0.3482, 'learning_rate': 1.3847193803060655e-06, 'epoch': 1.67} {'loss': 0.319, 'learning_rate': 1.3845488059688873e-06, 'epoch': 1.67} {'loss': 0.3355, 'learning_rate': 1.384378241356913e-06, 'epoch': 1.67} {'loss': 0.4494, 'learning_rate': 1.3842076864703391e-06, 'epoch': 1.67} {'loss': 0.3619, 'learning_rate': 1.3840371413093546e-06, 'epoch': 1.67} {'loss': 0.2497, 'learning_rate': 1.3838666058741557e-06, 'epoch': 1.67} {'loss': 0.2446, 'learning_rate': 1.3836960801649312e-06, 'epoch': 1.67} {'loss': 0.2222, 'learning_rate': 1.3835255641818778e-06, 'epoch': 1.67} {'loss': 0.4254, 'learning_rate': 1.383355057925182e-06, 'epoch': 1.67} {'loss': 0.3836, 'learning_rate': 1.3831845613950434e-06, 'epoch': 1.67} {'loss': 0.4092, 'learning_rate': 1.3830140745916476e-06, 'epoch': 1.67} {'loss': 0.3087, 'learning_rate': 1.3828435975151932e-06, 'epoch': 1.67} {'loss': 0.4047, 'learning_rate': 1.3826731301658703e-06, 'epoch': 1.67} {'loss': 0.3488, 'learning_rate': 1.3825026725438672e-06, 'epoch': 1.67} {'loss': 0.3243, 'learning_rate': 1.3823322246493832e-06, 'epoch': 1.67} {'loss': 0.2965, 'learning_rate': 1.3821617864826042e-06, 'epoch': 1.67} {'loss': 0.3243, 'learning_rate': 1.3819913580437283e-06, 'epoch': 1.67} {'loss': 0.2862, 'learning_rate': 1.381820939332944e-06, 'epoch': 1.67} {'loss': 0.2469, 'learning_rate': 1.3816505303504446e-06, 'epoch': 1.67} {'loss': 0.4055, 'learning_rate': 1.3814801310964244e-06, 'epoch': 1.67} {'loss': 0.3702, 'learning_rate': 1.381309741571073e-06, 'epoch': 1.67} {'loss': 0.2684, 'learning_rate': 1.381139361774585e-06, 'epoch': 1.67} {'loss': 0.31, 'learning_rate': 1.38096899170715e-06, 'epoch': 1.67} {'loss': 0.3513, 'learning_rate': 1.3807986313689648e-06, 'epoch': 1.67} {'loss': 0.3422, 'learning_rate': 1.3806282807602168e-06, 'epoch': 1.67} {'loss': 0.1898, 'learning_rate': 1.3804579398811025e-06, 'epoch': 1.67} {'loss': 0.2655, 'learning_rate': 1.3802876087318095e-06, 'epoch': 1.67} {'loss': 0.2612, 'learning_rate': 1.3801172873125347e-06, 'epoch': 1.67} {'loss': 0.3229, 'learning_rate': 1.3799469756234662e-06, 'epoch': 1.67} {'loss': 0.2541, 'learning_rate': 1.379776673664801e-06, 'epoch': 1.67} {'loss': 0.1006, 'learning_rate': 1.3796063814367266e-06, 'epoch': 1.67} {'loss': 0.2558, 'learning_rate': 1.3794360989394395e-06, 'epoch': 1.67} {'loss': 0.2631, 'learning_rate': 1.3792658261731295e-06, 'epoch': 1.67} {'loss': 0.4022, 'learning_rate': 1.3790955631379865e-06, 'epoch': 1.67} {'loss': 0.5128, 'learning_rate': 1.378925309834208e-06, 'epoch': 1.67} {'loss': 0.2812, 'learning_rate': 1.3787550662619808e-06, 'epoch': 1.67} {'loss': 0.2506, 'learning_rate': 1.3785848324215023e-06, 'epoch': 1.67} {'loss': 0.3172, 'learning_rate': 1.37841460831296e-06, 'epoch': 1.67} {'loss': 0.2626, 'learning_rate': 1.3782443939365508e-06, 'epoch': 1.67} {'loss': 0.3217, 'learning_rate': 1.378074189292461e-06, 'epoch': 1.67} {'loss': 0.3966, 'learning_rate': 1.3779039943808881e-06, 'epoch': 1.67} {'loss': 0.2955, 'learning_rate': 1.3777338092020208e-06, 'epoch': 1.67} {'loss': 0.2608, 'learning_rate': 1.3775636337560538e-06, 'epoch': 1.67} {'loss': 0.1864, 'learning_rate': 1.3773934680431756e-06, 'epoch': 1.67} {'loss': 0.3393, 'learning_rate': 1.3772233120635836e-06, 'epoch': 1.67} {'loss': 0.1832, 'learning_rate': 1.3770531658174657e-06, 'epoch': 1.67} {'loss': 0.4339, 'learning_rate': 1.3768830293050139e-06, 'epoch': 1.67} {'loss': 0.3062, 'learning_rate': 1.3767129025264226e-06, 'epoch': 1.67} {'loss': 0.2223, 'learning_rate': 1.3765427854818814e-06, 'epoch': 1.67} {'loss': 0.2924, 'learning_rate': 1.3763726781715848e-06, 'epoch': 1.67} {'loss': 0.2125, 'learning_rate': 1.3762025805957213e-06, 'epoch': 1.67} {'loss': 0.1997, 'learning_rate': 1.3760324927544888e-06, 'epoch': 1.67} {'loss': 0.3683, 'learning_rate': 1.3758624146480726e-06, 'epoch': 1.67} {'loss': 0.3493, 'learning_rate': 1.3756923462766691e-06, 'epoch': 1.67} {'loss': 0.438, 'learning_rate': 1.3755222876404684e-06, 'epoch': 1.67} {'loss': 0.293, 'learning_rate': 1.3753522387396645e-06, 'epoch': 1.67} {'loss': 0.3097, 'learning_rate': 1.3751821995744451e-06, 'epoch': 1.67} {'loss': 0.2581, 'learning_rate': 1.375012170145008e-06, 'epoch': 1.67} {'loss': 0.2097, 'learning_rate': 1.3748421504515397e-06, 'epoch': 1.67} {'loss': 0.2637, 'learning_rate': 1.3746721404942364e-06, 'epoch': 1.67} {'loss': 0.389, 'learning_rate': 1.3745021402732883e-06, 'epoch': 1.67} {'loss': 0.3039, 'learning_rate': 1.3743321497888839e-06, 'epoch': 1.67} {'loss': 0.2495, 'learning_rate': 1.374162169041221e-06, 'epoch': 1.67} {'loss': 0.289, 'learning_rate': 1.373992198030487e-06, 'epoch': 1.67} {'loss': 0.3081, 'learning_rate': 1.3738222367568776e-06, 'epoch': 1.67} {'loss': 0.3515, 'learning_rate': 1.3736522852205802e-06, 'epoch': 1.67} {'loss': 0.2992, 'learning_rate': 1.3734823434217913e-06, 'epoch': 1.67} {'loss': 0.115, 'learning_rate': 1.3733124113606976e-06, 'epoch': 1.67} {'loss': 0.3856, 'learning_rate': 1.3731424890374968e-06, 'epoch': 1.67} {'loss': 0.33, 'learning_rate': 1.372972576452375e-06, 'epoch': 1.67} {'loss': 0.3635, 'learning_rate': 1.37280267360553e-06, 'epoch': 1.67} {'loss': 0.2077, 'learning_rate': 1.3726327804971462e-06, 'epoch': 1.67} {'loss': 0.1726, 'learning_rate': 1.3724628971274223e-06, 'epoch': 1.67} {'loss': 0.1512, 'learning_rate': 1.372293023496548e-06, 'epoch': 1.67} {'loss': 0.2208, 'learning_rate': 1.3721231596047112e-06, 'epoch': 1.67} {'loss': 0.274, 'learning_rate': 1.3719533054521094e-06, 'epoch': 1.67} {'loss': 0.2004, 'learning_rate': 1.3717834610389292e-06, 'epoch': 1.67} {'loss': 0.1511, 'learning_rate': 1.3716136263653668e-06, 'epoch': 1.67} {'loss': 0.4168, 'learning_rate': 1.371443801431609e-06, 'epoch': 1.67} {'loss': 0.3176, 'learning_rate': 1.3712739862378532e-06, 'epoch': 1.67} {'loss': 0.2294, 'learning_rate': 1.3711041807842862e-06, 'epoch': 1.67} {'loss': 0.2899, 'learning_rate': 1.3709343850711044e-06, 'epoch': 1.67} {'loss': 0.1819, 'learning_rate': 1.3707645990984941e-06, 'epoch': 1.67} {'loss': 0.4231, 'learning_rate': 1.370594822866651e-06, 'epoch': 1.67} {'loss': 0.2555, 'learning_rate': 1.3704250563757649e-06, 'epoch': 1.67} {'loss': 0.133, 'learning_rate': 1.3702552996260287e-06, 'epoch': 1.67} {'loss': 0.2352, 'learning_rate': 1.3700855526176337e-06, 'epoch': 1.67} {'loss': 0.1674, 'learning_rate': 1.3699158153507685e-06, 'epoch': 1.67} {'loss': 0.4481, 'learning_rate': 1.3697460878256297e-06, 'epoch': 1.67} {'loss': 0.3023, 'learning_rate': 1.3695763700424048e-06, 'epoch': 1.67} {'loss': 0.2202, 'learning_rate': 1.3694066620012892e-06, 'epoch': 1.67} {'loss': 0.3413, 'learning_rate': 1.3692369637024693e-06, 'epoch': 1.67} {'loss': 0.2723, 'learning_rate': 1.3690672751461421e-06, 'epoch': 1.67} {'loss': 0.1476, 'learning_rate': 1.3688975963324946e-06, 'epoch': 1.67} {'loss': 0.2347, 'learning_rate': 1.3687279272617227e-06, 'epoch': 1.67} {'loss': 0.2111, 'learning_rate': 1.3685582679340137e-06, 'epoch': 1.67} {'loss': 0.3368, 'learning_rate': 1.3683886183495632e-06, 'epoch': 1.67} {'loss': 0.3034, 'learning_rate': 1.3682189785085576e-06, 'epoch': 1.67} {'loss': 0.3426, 'learning_rate': 1.3680493484111946e-06, 'epoch': 1.67} {'loss': 0.32, 'learning_rate': 1.3678797280576616e-06, 'epoch': 1.67} {'loss': 0.2619, 'learning_rate': 1.36771011744815e-06, 'epoch': 1.67} {'loss': 0.3667, 'learning_rate': 1.3675405165828525e-06, 'epoch': 1.67} {'loss': 0.2854, 'learning_rate': 1.3673709254619594e-06, 'epoch': 1.67} {'loss': 0.3966, 'learning_rate': 1.3672013440856647e-06, 'epoch': 1.67} {'loss': 0.2426, 'learning_rate': 1.367031772454156e-06, 'epoch': 1.67} {'loss': 0.3511, 'learning_rate': 1.3668622105676289e-06, 'epoch': 1.67} {'loss': 0.3418, 'learning_rate': 1.3666926584262708e-06, 'epoch': 1.67} {'loss': 0.1227, 'learning_rate': 1.3665231160302772e-06, 'epoch': 1.67} {'loss': 0.3465, 'learning_rate': 1.3663535833798348e-06, 'epoch': 1.67} {'loss': 0.3795, 'learning_rate': 1.3661840604751386e-06, 'epoch': 1.67} {'loss': 0.3355, 'learning_rate': 1.3660145473163777e-06, 'epoch': 1.67} {'loss': 0.1526, 'learning_rate': 1.3658450439037475e-06, 'epoch': 1.67} {'loss': 0.1464, 'learning_rate': 1.3656755502374353e-06, 'epoch': 1.67} {'loss': 0.4093, 'learning_rate': 1.365506066317631e-06, 'epoch': 1.67} {'loss': 0.2364, 'learning_rate': 1.3653365921445316e-06, 'epoch': 1.67} {'loss': 0.1678, 'learning_rate': 1.365167127718323e-06, 'epoch': 1.67} {'loss': 0.2813, 'learning_rate': 1.3649976730392e-06, 'epoch': 1.67} {'loss': 0.4449, 'learning_rate': 1.3648282281073489e-06, 'epoch': 1.67} {'loss': 0.2427, 'learning_rate': 1.3646587929229693e-06, 'epoch': 1.67} {'loss': 0.3123, 'learning_rate': 1.364489367486247e-06, 'epoch': 1.67} {'loss': 0.271, 'learning_rate': 1.3643199517973727e-06, 'epoch': 1.67} {'loss': 0.2262, 'learning_rate': 1.3641505458565407e-06, 'epoch': 1.67} {'loss': 0.4269, 'learning_rate': 1.3639811496639388e-06, 'epoch': 1.67} {'loss': 0.4907, 'learning_rate': 1.3638117632197622e-06, 'epoch': 1.67} {'loss': 0.2959, 'learning_rate': 1.3636423865241965e-06, 'epoch': 1.67} {'loss': 0.2951, 'learning_rate': 1.3634730195774404e-06, 'epoch': 1.67} {'loss': 0.3981, 'learning_rate': 1.3633036623796769e-06, 'epoch': 1.67} {'loss': 0.3338, 'learning_rate': 1.3631343149311049e-06, 'epoch': 1.67} {'loss': 0.3295, 'learning_rate': 1.3629649772319088e-06, 'epoch': 1.67} {'loss': 0.1535, 'learning_rate': 1.3627956492822846e-06, 'epoch': 1.67} {'loss': 0.3955, 'learning_rate': 1.3626263310824205e-06, 'epoch': 1.67} {'loss': 0.2793, 'learning_rate': 1.3624570226325107e-06, 'epoch': 1.67} {'loss': 0.1573, 'learning_rate': 1.3622877239327447e-06, 'epoch': 1.67} {'loss': 0.3315, 'learning_rate': 1.3621184349833106e-06, 'epoch': 1.67} {'loss': 0.2834, 'learning_rate': 1.3619491557844045e-06, 'epoch': 1.67} {'loss': 0.2154, 'learning_rate': 1.3617798863362131e-06, 'epoch': 1.67} {'loss': 0.3623, 'learning_rate': 1.3616106266389318e-06, 'epoch': 1.67} {'loss': 0.2634, 'learning_rate': 1.361441376692747e-06, 'epoch': 1.67} {'loss': 0.2617, 'learning_rate': 1.3612721364978543e-06, 'epoch': 1.67} {'loss': 0.2937, 'learning_rate': 1.3611029060544413e-06, 'epoch': 1.67} {'loss': 0.3802, 'learning_rate': 1.360933685362702e-06, 'epoch': 1.67} {'loss': 0.1849, 'learning_rate': 1.3607644744228232e-06, 'epoch': 1.67} {'loss': 0.3504, 'learning_rate': 1.3605952732350013e-06, 'epoch': 1.67} {'loss': 0.3534, 'learning_rate': 1.3604260817994218e-06, 'epoch': 1.67} {'loss': 0.4082, 'learning_rate': 1.3602569001162801e-06, 'epoch': 1.67} {'loss': 0.4533, 'learning_rate': 1.360087728185766e-06, 'epoch': 1.67} {'loss': 0.2722, 'learning_rate': 1.3599185660080683e-06, 'epoch': 1.67} {'loss': 0.3495, 'learning_rate': 1.359749413583381e-06, 'epoch': 1.67} {'loss': 0.2509, 'learning_rate': 1.3595802709118922e-06, 'epoch': 1.67} {'loss': 0.1671, 'learning_rate': 1.3594111379937957e-06, 'epoch': 1.67} {'loss': 0.2658, 'learning_rate': 1.3592420148292785e-06, 'epoch': 1.67} {'loss': 0.1588, 'learning_rate': 1.3590729014185367e-06, 'epoch': 1.67} {'loss': 0.1958, 'learning_rate': 1.358903797761756e-06, 'epoch': 1.67} {'loss': 0.2676, 'learning_rate': 1.3587347038591326e-06, 'epoch': 1.67} {'loss': 0.3084, 'learning_rate': 1.358565619710851e-06, 'epoch': 1.67} {'loss': 0.3426, 'learning_rate': 1.3583965453171089e-06, 'epoch': 1.67} {'loss': 0.2821, 'learning_rate': 1.3582274806780915e-06, 'epoch': 1.67} {'loss': 0.2977, 'learning_rate': 1.3580584257939933e-06, 'epoch': 1.67} {'loss': 0.3157, 'learning_rate': 1.3578893806650051e-06, 'epoch': 1.67} {'loss': 0.3864, 'learning_rate': 1.3577203452913134e-06, 'epoch': 1.67} {'loss': 0.2779, 'learning_rate': 1.3575513196731138e-06, 'epoch': 1.67} {'loss': 0.3261, 'learning_rate': 1.3573823038105938e-06, 'epoch': 1.67} {'loss': 0.2605, 'learning_rate': 1.3572132977039477e-06, 'epoch': 1.67} {'loss': 0.3048, 'learning_rate': 1.357044301353363e-06, 'epoch': 1.67} {'loss': 0.2923, 'learning_rate': 1.356875314759033e-06, 'epoch': 1.67} {'loss': 0.2982, 'learning_rate': 1.3567063379211442e-06, 'epoch': 1.67} {'loss': 0.2531, 'learning_rate': 1.3565373708398942e-06, 'epoch': 1.67} {'loss': 0.2997, 'learning_rate': 1.3563684135154665e-06, 'epoch': 1.67} {'loss': 0.2913, 'learning_rate': 1.3561994659480582e-06, 'epoch': 1.68} {'loss': 0.3301, 'learning_rate': 1.3560305281378538e-06, 'epoch': 1.68} {'loss': 0.4525, 'learning_rate': 1.35586160008505e-06, 'epoch': 1.68} {'loss': 0.3414, 'learning_rate': 1.3556926817898352e-06, 'epoch': 1.68} {'loss': 0.1421, 'learning_rate': 1.3555237732523973e-06, 'epoch': 1.68} {'loss': 0.2598, 'learning_rate': 1.3553548744729307e-06, 'epoch': 1.68} {'loss': 0.3405, 'learning_rate': 1.3551859854516226e-06, 'epoch': 1.68} {'loss': 0.321, 'learning_rate': 1.3550171061886685e-06, 'epoch': 1.68} {'loss': 0.4334, 'learning_rate': 1.3548482366842531e-06, 'epoch': 1.68} {'loss': 0.3349, 'learning_rate': 1.3546793769385725e-06, 'epoch': 1.68} {'loss': 0.3251, 'learning_rate': 1.3545105269518132e-06, 'epoch': 1.68} {'loss': 0.2311, 'learning_rate': 1.3543416867241688e-06, 'epoch': 1.68} {'loss': 0.2528, 'learning_rate': 1.3541728562558276e-06, 'epoch': 1.68} {'loss': 0.2881, 'learning_rate': 1.354004035546982e-06, 'epoch': 1.68} {'loss': 0.4092, 'learning_rate': 1.3538352245978203e-06, 'epoch': 1.68} {'loss': 0.301, 'learning_rate': 1.3536664234085372e-06, 'epoch': 1.68} {'loss': 0.2731, 'learning_rate': 1.3534976319793202e-06, 'epoch': 1.68} {'loss': 0.3647, 'learning_rate': 1.353328850310357e-06, 'epoch': 1.68} {'loss': 0.258, 'learning_rate': 1.353160078401844e-06, 'epoch': 1.68} {'loss': 0.2852, 'learning_rate': 1.3529913162539676e-06, 'epoch': 1.68} {'loss': 0.387, 'learning_rate': 1.3528225638669213e-06, 'epoch': 1.68} {'loss': 0.1632, 'learning_rate': 1.3526538212408914e-06, 'epoch': 1.68} {'loss': 0.3342, 'learning_rate': 1.3524850883760742e-06, 'epoch': 1.68} {'loss': 0.2418, 'learning_rate': 1.3523163652726535e-06, 'epoch': 1.68} {'loss': 0.2506, 'learning_rate': 1.3521476519308262e-06, 'epoch': 1.68} {'loss': 0.2164, 'learning_rate': 1.3519789483507773e-06, 'epoch': 1.68} {'loss': 0.274, 'learning_rate': 1.3518102545327016e-06, 'epoch': 1.68} {'loss': 0.3817, 'learning_rate': 1.351641570476786e-06, 'epoch': 1.68} {'loss': 0.3672, 'learning_rate': 1.3514728961832247e-06, 'epoch': 1.68} {'loss': 0.292, 'learning_rate': 1.351304231652205e-06, 'epoch': 1.68} {'loss': 0.3035, 'learning_rate': 1.3511355768839174e-06, 'epoch': 1.68} {'loss': 0.2904, 'learning_rate': 1.3509669318785534e-06, 'epoch': 1.68} {'loss': 0.283, 'learning_rate': 1.350798296636302e-06, 'epoch': 1.68} {'loss': 0.1897, 'learning_rate': 1.3506296711573575e-06, 'epoch': 1.68} {'loss': 0.3326, 'learning_rate': 1.350461055441904e-06, 'epoch': 1.68} {'loss': 0.308, 'learning_rate': 1.3502924494901382e-06, 'epoch': 1.68} {'loss': 0.3129, 'learning_rate': 1.3501238533022442e-06, 'epoch': 1.68} {'loss': 0.2554, 'learning_rate': 1.3499552668784188e-06, 'epoch': 1.68} {'loss': 0.3265, 'learning_rate': 1.3497866902188462e-06, 'epoch': 1.68} {'loss': 0.3521, 'learning_rate': 1.3496181233237215e-06, 'epoch': 1.68} {'loss': 0.2708, 'learning_rate': 1.3494495661932317e-06, 'epoch': 1.68} {'loss': 0.2389, 'learning_rate': 1.3492810188275695e-06, 'epoch': 1.68} {'loss': 0.3071, 'learning_rate': 1.3491124812269218e-06, 'epoch': 1.68} {'loss': 0.188, 'learning_rate': 1.3489439533914838e-06, 'epoch': 1.68} {'loss': 0.3008, 'learning_rate': 1.3487754353214433e-06, 'epoch': 1.68} {'loss': 0.3164, 'learning_rate': 1.3486069270169878e-06, 'epoch': 1.68} {'loss': 0.2905, 'learning_rate': 1.3484384284783124e-06, 'epoch': 1.68} {'loss': 0.2325, 'learning_rate': 1.3482699397056021e-06, 'epoch': 1.68} {'loss': 0.3446, 'learning_rate': 1.3481014606990517e-06, 'epoch': 1.68} {'loss': 0.2655, 'learning_rate': 1.3479329914588458e-06, 'epoch': 1.68} {'loss': 0.4293, 'learning_rate': 1.3477645319851828e-06, 'epoch': 1.68} {'loss': 0.3053, 'learning_rate': 1.3475960822782474e-06, 'epoch': 1.68} {'loss': 0.2717, 'learning_rate': 1.3474276423382293e-06, 'epoch': 1.68} {'loss': 0.3978, 'learning_rate': 1.3472592121653227e-06, 'epoch': 1.68} {'loss': 0.2959, 'learning_rate': 1.347090791759712e-06, 'epoch': 1.68} {'loss': 0.2953, 'learning_rate': 1.3469223811215926e-06, 'epoch': 1.68} {'loss': 0.3322, 'learning_rate': 1.3467539802511509e-06, 'epoch': 1.68} {'loss': 0.4096, 'learning_rate': 1.3465855891485802e-06, 'epoch': 1.68} {'loss': 0.4448, 'learning_rate': 1.3464172078140658e-06, 'epoch': 1.68} {'loss': 0.2963, 'learning_rate': 1.3462488362478044e-06, 'epoch': 1.68} {'loss': 0.4737, 'learning_rate': 1.34608047444998e-06, 'epoch': 1.68} {'loss': 0.2872, 'learning_rate': 1.345912122420786e-06, 'epoch': 1.68} {'loss': 0.3395, 'learning_rate': 1.3457437801604112e-06, 'epoch': 1.68} {'loss': 0.254, 'learning_rate': 1.3455754476690475e-06, 'epoch': 1.68} {'loss': 0.4583, 'learning_rate': 1.3454071249468825e-06, 'epoch': 1.68} {'loss': 0.2994, 'learning_rate': 1.3452388119941062e-06, 'epoch': 1.68} {'loss': 0.2999, 'learning_rate': 1.3450705088109106e-06, 'epoch': 1.68} {'loss': 0.2159, 'learning_rate': 1.3449022153974833e-06, 'epoch': 1.68} {'loss': 0.4275, 'learning_rate': 1.3447339317540175e-06, 'epoch': 1.68} {'loss': 0.2754, 'learning_rate': 1.3445656578806987e-06, 'epoch': 1.68} {'loss': 0.366, 'learning_rate': 1.3443973937777221e-06, 'epoch': 1.68} {'loss': 0.2534, 'learning_rate': 1.3442291394452722e-06, 'epoch': 1.68} {'loss': 0.3577, 'learning_rate': 1.3440608948835443e-06, 'epoch': 1.68} {'loss': 0.2865, 'learning_rate': 1.3438926600927226e-06, 'epoch': 1.68} {'loss': 0.3019, 'learning_rate': 1.3437244350730038e-06, 'epoch': 1.68} {'loss': 0.3346, 'learning_rate': 1.3435562198245699e-06, 'epoch': 1.68} {'loss': 0.3461, 'learning_rate': 1.3433880143476186e-06, 'epoch': 1.68} {'loss': 0.3663, 'learning_rate': 1.3432198186423362e-06, 'epoch': 1.68} {'loss': 0.3813, 'learning_rate': 1.3430516327089094e-06, 'epoch': 1.68} {'loss': 0.2188, 'learning_rate': 1.3428834565475335e-06, 'epoch': 1.68} {'loss': 0.2892, 'learning_rate': 1.342715290158394e-06, 'epoch': 1.68} {'loss': 0.2346, 'learning_rate': 1.342547133541684e-06, 'epoch': 1.68} {'loss': 0.3085, 'learning_rate': 1.3423789866975912e-06, 'epoch': 1.68} {'loss': 0.4151, 'learning_rate': 1.3422108496263075e-06, 'epoch': 1.68} {'loss': 0.2826, 'learning_rate': 1.3420427223280196e-06, 'epoch': 1.68} {'loss': 0.2748, 'learning_rate': 1.3418746048029208e-06, 'epoch': 1.68} {'loss': 0.2469, 'learning_rate': 1.3417064970511972e-06, 'epoch': 1.68} {'loss': 0.426, 'learning_rate': 1.3415383990730435e-06, 'epoch': 1.68} {'loss': 0.3474, 'learning_rate': 1.3413703108686427e-06, 'epoch': 1.68} {'loss': 0.364, 'learning_rate': 1.3412022324381913e-06, 'epoch': 1.68} {'loss': 0.3639, 'learning_rate': 1.341034163781877e-06, 'epoch': 1.68} {'loss': 0.3413, 'learning_rate': 1.340866104899885e-06, 'epoch': 1.68} {'loss': 0.3725, 'learning_rate': 1.340698055792411e-06, 'epoch': 1.68} {'loss': 0.3054, 'learning_rate': 1.3405300164596403e-06, 'epoch': 1.68} {'loss': 0.4143, 'learning_rate': 1.340361986901767e-06, 'epoch': 1.68} {'loss': 0.303, 'learning_rate': 1.3401939671189757e-06, 'epoch': 1.68} {'loss': 0.2127, 'learning_rate': 1.3400259571114603e-06, 'epoch': 1.68} {'loss': 0.1677, 'learning_rate': 1.3398579568794078e-06, 'epoch': 1.68} {'loss': 0.3125, 'learning_rate': 1.33968996642301e-06, 'epoch': 1.68} {'loss': 0.403, 'learning_rate': 1.3395219857424545e-06, 'epoch': 1.68} {'loss': 0.2855, 'learning_rate': 1.3393540148379325e-06, 'epoch': 1.68} {'loss': 0.2578, 'learning_rate': 1.3391860537096325e-06, 'epoch': 1.68} {'loss': 0.2923, 'learning_rate': 1.3390181023577452e-06, 'epoch': 1.68} {'loss': 0.326, 'learning_rate': 1.33885016078246e-06, 'epoch': 1.68} {'loss': 0.3614, 'learning_rate': 1.338682228983964e-06, 'epoch': 1.68} {'loss': 0.2862, 'learning_rate': 1.3385143069624507e-06, 'epoch': 1.68} {'loss': 0.4884, 'learning_rate': 1.3383463947181053e-06, 'epoch': 1.68} {'loss': 0.1463, 'learning_rate': 1.338178492251122e-06, 'epoch': 1.68} {'loss': 0.2065, 'learning_rate': 1.3380105995616866e-06, 'epoch': 1.68} {'loss': 0.257, 'learning_rate': 1.3378427166499907e-06, 'epoch': 1.68} {'loss': 0.273, 'learning_rate': 1.3376748435162224e-06, 'epoch': 1.68} {'loss': 0.3853, 'learning_rate': 1.3375069801605733e-06, 'epoch': 1.68} {'loss': 0.2341, 'learning_rate': 1.3373391265832302e-06, 'epoch': 1.68} {'loss': 0.3684, 'learning_rate': 1.3371712827843863e-06, 'epoch': 1.68} {'loss': 0.2408, 'learning_rate': 1.3370034487642258e-06, 'epoch': 1.68} {'loss': 0.3038, 'learning_rate': 1.336835624522943e-06, 'epoch': 1.68} {'loss': 0.237, 'learning_rate': 1.3366678100607254e-06, 'epoch': 1.68} {'loss': 0.3586, 'learning_rate': 1.336500005377761e-06, 'epoch': 1.68} {'loss': 0.2633, 'learning_rate': 1.3363322104742427e-06, 'epoch': 1.68} {'loss': 0.2318, 'learning_rate': 1.336164425350356e-06, 'epoch': 1.68} {'loss': 0.1439, 'learning_rate': 1.3359966500062938e-06, 'epoch': 1.68} {'loss': 0.2946, 'learning_rate': 1.3358288844422418e-06, 'epoch': 1.68} {'loss': 0.3138, 'learning_rate': 1.3356611286583932e-06, 'epoch': 1.68} {'loss': 0.2853, 'learning_rate': 1.3354933826549332e-06, 'epoch': 1.68} {'loss': 0.2927, 'learning_rate': 1.3353256464320563e-06, 'epoch': 1.68} {'loss': 0.2853, 'learning_rate': 1.3351579199899467e-06, 'epoch': 1.68} {'loss': 0.3544, 'learning_rate': 1.3349902033287988e-06, 'epoch': 1.68} {'loss': 0.2422, 'learning_rate': 1.3348224964487966e-06, 'epoch': 1.68} {'loss': 0.4655, 'learning_rate': 1.3346547993501346e-06, 'epoch': 1.68} {'loss': 0.364, 'learning_rate': 1.3344871120329995e-06, 'epoch': 1.68} {'loss': 0.4204, 'learning_rate': 1.3343194344975773e-06, 'epoch': 1.68} {'loss': 0.246, 'learning_rate': 1.334151766744064e-06, 'epoch': 1.68} {'loss': 0.2425, 'learning_rate': 1.3339841087726436e-06, 'epoch': 1.68} {'loss': 0.4408, 'learning_rate': 1.333816460583508e-06, 'epoch': 1.68} {'loss': 0.3112, 'learning_rate': 1.333648822176844e-06, 'epoch': 1.68} {'loss': 0.2817, 'learning_rate': 1.3334811935528458e-06, 'epoch': 1.68} {'loss': 0.1965, 'learning_rate': 1.3333135747116954e-06, 'epoch': 1.68} {'loss': 0.3938, 'learning_rate': 1.3331459656535894e-06, 'epoch': 1.68} {'loss': 0.3013, 'learning_rate': 1.332978366378711e-06, 'epoch': 1.68} {'loss': 0.3582, 'learning_rate': 1.3328107768872544e-06, 'epoch': 1.68} {'loss': 0.3289, 'learning_rate': 1.332643197179403e-06, 'epoch': 1.68} {'loss': 0.2193, 'learning_rate': 1.332475627255353e-06, 'epoch': 1.68} {'loss': 0.305, 'learning_rate': 1.3323080671152889e-06, 'epoch': 1.68} {'loss': 0.3523, 'learning_rate': 1.3321405167593982e-06, 'epoch': 1.68} {'loss': 0.2948, 'learning_rate': 1.3319729761878752e-06, 'epoch': 1.68} {'loss': 0.2638, 'learning_rate': 1.3318054454009044e-06, 'epoch': 1.68} {'loss': 0.368, 'learning_rate': 1.3316379243986787e-06, 'epoch': 1.68} {'loss': 0.3884, 'learning_rate': 1.3314704131813839e-06, 'epoch': 1.68} {'loss': 0.3247, 'learning_rate': 1.3313029117492093e-06, 'epoch': 1.68} {'loss': 0.3636, 'learning_rate': 1.3311354201023485e-06, 'epoch': 1.68} {'loss': 0.4578, 'learning_rate': 1.3309679382409857e-06, 'epoch': 1.68} {'loss': 0.3478, 'learning_rate': 1.330800466165313e-06, 'epoch': 1.68} {'loss': 0.3107, 'learning_rate': 1.3306330038755155e-06, 'epoch': 1.68} {'loss': 0.3496, 'learning_rate': 1.3304655513717878e-06, 'epoch': 1.68} {'loss': 0.2392, 'learning_rate': 1.3302981086543132e-06, 'epoch': 1.68} {'loss': 0.2474, 'learning_rate': 1.3301306757232856e-06, 'epoch': 1.68} {'loss': 0.3807, 'learning_rate': 1.3299632525788897e-06, 'epoch': 1.68} {'loss': 0.2516, 'learning_rate': 1.3297958392213195e-06, 'epoch': 1.68} {'loss': 0.27, 'learning_rate': 1.3296284356507583e-06, 'epoch': 1.68} {'loss': 0.3265, 'learning_rate': 1.3294610418674002e-06, 'epoch': 1.68} {'loss': 0.3037, 'learning_rate': 1.3292936578714289e-06, 'epoch': 1.68} {'loss': 0.4185, 'learning_rate': 1.3291262836630392e-06, 'epoch': 1.68} {'loss': 0.3075, 'learning_rate': 1.3289589192424145e-06, 'epoch': 1.68} {'loss': 0.2474, 'learning_rate': 1.3287915646097483e-06, 'epoch': 1.68} {'loss': 0.3305, 'learning_rate': 1.3286242197652288e-06, 'epoch': 1.68} {'loss': 0.3454, 'learning_rate': 1.3284568847090396e-06, 'epoch': 1.68} {'loss': 0.4249, 'learning_rate': 1.328289559441377e-06, 'epoch': 1.68} {'loss': 0.3764, 'learning_rate': 1.3281222439624242e-06, 'epoch': 1.68} {'loss': 0.363, 'learning_rate': 1.3279549382723745e-06, 'epoch': 1.68} {'loss': 0.3163, 'learning_rate': 1.327787642371412e-06, 'epoch': 1.68} {'loss': 0.1932, 'learning_rate': 1.3276203562597312e-06, 'epoch': 1.68} {'loss': 0.2935, 'learning_rate': 1.327453079937514e-06, 'epoch': 1.68} {'loss': 0.2694, 'learning_rate': 1.327285813404957e-06, 'epoch': 1.68} {'loss': 0.2714, 'learning_rate': 1.3271185566622425e-06, 'epoch': 1.68} {'loss': 0.3178, 'learning_rate': 1.3269513097095644e-06, 'epoch': 1.68} {'loss': 0.2314, 'learning_rate': 1.326784072547106e-06, 'epoch': 1.68} {'loss': 0.2565, 'learning_rate': 1.3266168451750615e-06, 'epoch': 1.68} {'loss': 0.2585, 'learning_rate': 1.3264496275936179e-06, 'epoch': 1.68} {'loss': 0.2411, 'learning_rate': 1.32628241980296e-06, 'epoch': 1.68} {'loss': 0.3142, 'learning_rate': 1.3261152218032824e-06, 'epoch': 1.68} {'loss': 0.2606, 'learning_rate': 1.3259480335947693e-06, 'epoch': 1.68} {'loss': 0.189, 'learning_rate': 1.3257808551776141e-06, 'epoch': 1.68} {'loss': 0.2529, 'learning_rate': 1.325613686552001e-06, 'epoch': 1.68} {'loss': 0.2524, 'learning_rate': 1.3254465277181217e-06, 'epoch': 1.68} {'loss': 0.1843, 'learning_rate': 1.325279378676162e-06, 'epoch': 1.68} {'loss': 0.4136, 'learning_rate': 1.3251122394263139e-06, 'epoch': 1.68} {'loss': 0.2831, 'learning_rate': 1.3249451099687627e-06, 'epoch': 1.68} {'loss': 0.2654, 'learning_rate': 1.3247779903037018e-06, 'epoch': 1.68} {'loss': 0.1487, 'learning_rate': 1.3246108804313128e-06, 'epoch': 1.68} {'loss': 0.3708, 'learning_rate': 1.3244437803517929e-06, 'epoch': 1.68} {'loss': 0.3143, 'learning_rate': 1.3242766900653248e-06, 'epoch': 1.68} {'loss': 0.3123, 'learning_rate': 1.3241096095720962e-06, 'epoch': 1.68} {'loss': 0.1392, 'learning_rate': 1.3239425388723015e-06, 'epoch': 1.68} {'loss': 0.216, 'learning_rate': 1.3237754779661226e-06, 'epoch': 1.68} {'loss': 0.29, 'learning_rate': 1.323608426853753e-06, 'epoch': 1.68} {'loss': 0.2501, 'learning_rate': 1.323441385535379e-06, 'epoch': 1.68} {'loss': 0.3111, 'learning_rate': 1.3232743540111904e-06, 'epoch': 1.68} {'loss': 0.2526, 'learning_rate': 1.3231073322813738e-06, 'epoch': 1.68} {'loss': 0.2743, 'learning_rate': 1.3229403203461212e-06, 'epoch': 1.68} {'loss': 0.3796, 'learning_rate': 1.3227733182056169e-06, 'epoch': 1.68} {'loss': 0.2181, 'learning_rate': 1.322606325860053e-06, 'epoch': 1.68} {'loss': 0.3398, 'learning_rate': 1.322439343309615e-06, 'epoch': 1.68} {'loss': 0.1678, 'learning_rate': 1.3222723705544948e-06, 'epoch': 1.68} {'loss': 0.2603, 'learning_rate': 1.3221054075948791e-06, 'epoch': 1.68} {'loss': 0.1821, 'learning_rate': 1.3219384544309532e-06, 'epoch': 1.68} {'loss': 0.2556, 'learning_rate': 1.3217715110629116e-06, 'epoch': 1.68} {'loss': 0.3501, 'learning_rate': 1.3216045774909369e-06, 'epoch': 1.68} {'loss': 0.3081, 'learning_rate': 1.3214376537152228e-06, 'epoch': 1.68} {'loss': 0.2646, 'learning_rate': 1.3212707397359537e-06, 'epoch': 1.68} {'loss': 0.2752, 'learning_rate': 1.3211038355533213e-06, 'epoch': 1.68} {'loss': 0.2848, 'learning_rate': 1.3209369411675099e-06, 'epoch': 1.68} {'loss': 0.3012, 'learning_rate': 1.320770056578713e-06, 'epoch': 1.68} {'loss': 0.3446, 'learning_rate': 1.3206031817871135e-06, 'epoch': 1.68} {'loss': 0.3721, 'learning_rate': 1.3204363167929058e-06, 'epoch': 1.68} {'loss': 0.2643, 'learning_rate': 1.320269461596272e-06, 'epoch': 1.68} {'loss': 0.4041, 'learning_rate': 1.320102616197405e-06, 'epoch': 1.68} {'loss': 0.301, 'learning_rate': 1.319935780596493e-06, 'epoch': 1.68} {'loss': 0.3374, 'learning_rate': 1.3197689547937197e-06, 'epoch': 1.68} {'loss': 0.4153, 'learning_rate': 1.3196021387892788e-06, 'epoch': 1.68} {'loss': 0.2577, 'learning_rate': 1.3194353325833553e-06, 'epoch': 1.68} {'loss': 0.3132, 'learning_rate': 1.3192685361761403e-06, 'epoch': 1.68} {'loss': 0.1727, 'learning_rate': 1.319101749567817e-06, 'epoch': 1.68} {'loss': 0.2482, 'learning_rate': 1.318934972758581e-06, 'epoch': 1.68} {'loss': 0.2579, 'learning_rate': 1.318768205748614e-06, 'epoch': 1.68} {'loss': 0.5359, 'learning_rate': 1.3186014485381083e-06, 'epoch': 1.68} {'loss': 0.3256, 'learning_rate': 1.318434701127249e-06, 'epoch': 1.68} {'loss': 0.4104, 'learning_rate': 1.3182679635162288e-06, 'epoch': 1.68} {'loss': 0.1665, 'learning_rate': 1.3181012357052304e-06, 'epoch': 1.68} {'loss': 0.4259, 'learning_rate': 1.3179345176944468e-06, 'epoch': 1.68} {'loss': 0.2894, 'learning_rate': 1.317767809484064e-06, 'epoch': 1.68} {'loss': 0.2742, 'learning_rate': 1.317601111074268e-06, 'epoch': 1.68} {'loss': 0.2186, 'learning_rate': 1.3174344224652523e-06, 'epoch': 1.68} {'loss': 0.3036, 'learning_rate': 1.3172677436572002e-06, 'epoch': 1.68} {'loss': 0.3865, 'learning_rate': 1.3171010746503033e-06, 'epoch': 1.68} {'loss': 0.3555, 'learning_rate': 1.3169344154447461e-06, 'epoch': 1.68} {'loss': 0.3519, 'learning_rate': 1.3167677660407207e-06, 'epoch': 1.68} {'loss': 0.368, 'learning_rate': 1.3166011264384116e-06, 'epoch': 1.68} {'loss': 0.3439, 'learning_rate': 1.3164344966380093e-06, 'epoch': 1.68} {'loss': 0.3562, 'learning_rate': 1.3162678766397008e-06, 'epoch': 1.68} {'loss': 0.3954, 'learning_rate': 1.3161012664436756e-06, 'epoch': 1.68} {'loss': 0.388, 'learning_rate': 1.3159346660501193e-06, 'epoch': 1.68} {'loss': 0.3612, 'learning_rate': 1.3157680754592239e-06, 'epoch': 1.68} {'loss': 0.2199, 'learning_rate': 1.3156014946711737e-06, 'epoch': 1.68} {'loss': 0.3167, 'learning_rate': 1.3154349236861573e-06, 'epoch': 1.68} {'loss': 0.2971, 'learning_rate': 1.3152683625043649e-06, 'epoch': 1.68} {'loss': 0.3686, 'learning_rate': 1.3151018111259805e-06, 'epoch': 1.68} {'loss': 0.2952, 'learning_rate': 1.3149352695511974e-06, 'epoch': 1.68} {'loss': 0.2253, 'learning_rate': 1.3147687377801954e-06, 'epoch': 1.68} {'loss': 0.2911, 'learning_rate': 1.3146022158131732e-06, 'epoch': 1.68} {'loss': 0.3079, 'learning_rate': 1.314435703650314e-06, 'epoch': 1.68} {'loss': 0.2693, 'learning_rate': 1.3142692012918023e-06, 'epoch': 1.68} {'loss': 0.3276, 'learning_rate': 1.314102708737831e-06, 'epoch': 1.68} {'loss': 0.3019, 'learning_rate': 1.3139362259885847e-06, 'epoch': 1.68} {'loss': 0.2096, 'learning_rate': 1.313769753044254e-06, 'epoch': 1.68} {'loss': 0.1845, 'learning_rate': 1.3136032899050244e-06, 'epoch': 1.68} {'loss': 0.2124, 'learning_rate': 1.313436836571086e-06, 'epoch': 1.68} {'loss': 0.2764, 'learning_rate': 1.3132703930426238e-06, 'epoch': 1.68} {'loss': 0.3881, 'learning_rate': 1.313103959319829e-06, 'epoch': 1.68} {'loss': 0.3533, 'learning_rate': 1.3129375354028873e-06, 'epoch': 1.68} {'loss': 0.2935, 'learning_rate': 1.312771121291988e-06, 'epoch': 1.68} {'loss': 0.3704, 'learning_rate': 1.3126047169873167e-06, 'epoch': 1.68} {'loss': 0.2152, 'learning_rate': 1.3124383224890646e-06, 'epoch': 1.68} {'loss': 0.2829, 'learning_rate': 1.312271937797417e-06, 'epoch': 1.68} {'loss': 0.3551, 'learning_rate': 1.3121055629125613e-06, 'epoch': 1.68} {'loss': 0.4175, 'learning_rate': 1.3119391978346873e-06, 'epoch': 1.68} {'loss': 0.3015, 'learning_rate': 1.3117728425639808e-06, 'epoch': 1.68} {'loss': 0.3124, 'learning_rate': 1.3116064971006326e-06, 'epoch': 1.68} {'loss': 0.4184, 'learning_rate': 1.3114401614448259e-06, 'epoch': 1.68} {'loss': 0.3822, 'learning_rate': 1.3112738355967537e-06, 'epoch': 1.68} {'loss': 0.2455, 'learning_rate': 1.3111075195565982e-06, 'epoch': 1.68} {'loss': 0.2929, 'learning_rate': 1.3109412133245524e-06, 'epoch': 1.68} {'loss': 0.257, 'learning_rate': 1.3107749169008e-06, 'epoch': 1.68} {'loss': 0.3425, 'learning_rate': 1.3106086302855324e-06, 'epoch': 1.68} {'loss': 0.2626, 'learning_rate': 1.3104423534789323e-06, 'epoch': 1.68} {'loss': 0.2846, 'learning_rate': 1.3102760864811937e-06, 'epoch': 1.68} {'loss': 0.3153, 'learning_rate': 1.3101098292925007e-06, 'epoch': 1.68} {'loss': 0.459, 'learning_rate': 1.309943581913039e-06, 'epoch': 1.68} {'loss': 0.3963, 'learning_rate': 1.3097773443430006e-06, 'epoch': 1.68} {'loss': 0.3421, 'learning_rate': 1.3096111165825687e-06, 'epoch': 1.68} {'loss': 0.2884, 'learning_rate': 1.3094448986319352e-06, 'epoch': 1.68} {'loss': 0.4293, 'learning_rate': 1.3092786904912847e-06, 'epoch': 1.68} {'loss': 0.3251, 'learning_rate': 1.3091124921608078e-06, 'epoch': 1.68} {'loss': 0.1756, 'learning_rate': 1.3089463036406868e-06, 'epoch': 1.68} {'loss': 0.3538, 'learning_rate': 1.308780124931116e-06, 'epoch': 1.68} {'loss': 0.3737, 'learning_rate': 1.3086139560322775e-06, 'epoch': 1.68} {'loss': 0.2905, 'learning_rate': 1.3084477969443632e-06, 'epoch': 1.68} {'loss': 0.2329, 'learning_rate': 1.3082816476675565e-06, 'epoch': 1.68} {'loss': 0.3119, 'learning_rate': 1.308115508202049e-06, 'epoch': 1.68} {'loss': 0.3438, 'learning_rate': 1.307949378548027e-06, 'epoch': 1.68} {'loss': 0.2483, 'learning_rate': 1.3077832587056738e-06, 'epoch': 1.68} {'loss': 0.3959, 'learning_rate': 1.3076171486751832e-06, 'epoch': 1.68} {'loss': 0.246, 'learning_rate': 1.3074510484567382e-06, 'epoch': 1.68} {'loss': 0.3171, 'learning_rate': 1.3072849580505298e-06, 'epoch': 1.68} {'loss': 0.3017, 'learning_rate': 1.3071188774567413e-06, 'epoch': 1.68} {'loss': 0.1586, 'learning_rate': 1.3069528066755654e-06, 'epoch': 1.68} {'loss': 0.4137, 'learning_rate': 1.3067867457071836e-06, 'epoch': 1.68} {'loss': 0.2971, 'learning_rate': 1.306620694551789e-06, 'epoch': 1.68} {'loss': 0.2923, 'learning_rate': 1.3064546532095645e-06, 'epoch': 1.68} {'loss': 0.3057, 'learning_rate': 1.3062886216807013e-06, 'epoch': 1.68} {'loss': 0.1933, 'learning_rate': 1.3061225999653838e-06, 'epoch': 1.68} {'loss': 0.3502, 'learning_rate': 1.3059565880638025e-06, 'epoch': 1.68} {'loss': 0.2101, 'learning_rate': 1.3057905859761423e-06, 'epoch': 1.68} {'loss': 0.4191, 'learning_rate': 1.3056245937025901e-06, 'epoch': 1.68} {'loss': 0.1488, 'learning_rate': 1.3054586112433353e-06, 'epoch': 1.68} {'loss': 0.3215, 'learning_rate': 1.3052926385985632e-06, 'epoch': 1.68} {'loss': 0.3119, 'learning_rate': 1.3051266757684644e-06, 'epoch': 1.68} {'loss': 0.3379, 'learning_rate': 1.3049607227532213e-06, 'epoch': 1.68} {'loss': 0.2713, 'learning_rate': 1.304794779553027e-06, 'epoch': 1.68} {'loss': 0.4313, 'learning_rate': 1.3046288461680634e-06, 'epoch': 1.68} {'loss': 0.4503, 'learning_rate': 1.3044629225985227e-06, 'epoch': 1.68} {'loss': 0.3547, 'learning_rate': 1.3042970088445883e-06, 'epoch': 1.68} {'loss': 0.4303, 'learning_rate': 1.3041311049064499e-06, 'epoch': 1.68} {'loss': 0.2116, 'learning_rate': 1.3039652107842925e-06, 'epoch': 1.68} {'loss': 0.4571, 'learning_rate': 1.3037993264783066e-06, 'epoch': 1.68} {'loss': 0.4042, 'learning_rate': 1.3036334519886785e-06, 'epoch': 1.68} {'loss': 0.3441, 'learning_rate': 1.303467587315591e-06, 'epoch': 1.68} {'loss': 0.1916, 'learning_rate': 1.3033017324592378e-06, 'epoch': 1.68} {'loss': 0.2499, 'learning_rate': 1.3031358874198009e-06, 'epoch': 1.68} {'loss': 0.3845, 'learning_rate': 1.302970052197472e-06, 'epoch': 1.68} {'loss': 0.3727, 'learning_rate': 1.3028042267924335e-06, 'epoch': 1.68} {'loss': 0.4029, 'learning_rate': 1.3026384112048783e-06, 'epoch': 1.68} {'loss': 0.237, 'learning_rate': 1.302472605434988e-06, 'epoch': 1.68} {'loss': 0.2807, 'learning_rate': 1.3023068094829539e-06, 'epoch': 1.68} {'loss': 0.2843, 'learning_rate': 1.3021410233489596e-06, 'epoch': 1.68} {'loss': 0.3679, 'learning_rate': 1.301975247033196e-06, 'epoch': 1.68} {'loss': 0.2453, 'learning_rate': 1.301809480535846e-06, 'epoch': 1.68} {'loss': 0.2961, 'learning_rate': 1.3016437238571023e-06, 'epoch': 1.68} {'loss': 0.3034, 'learning_rate': 1.3014779769971453e-06, 'epoch': 1.68} {'loss': 0.2534, 'learning_rate': 1.3013122399561685e-06, 'epoch': 1.68} {'loss': 0.2825, 'learning_rate': 1.3011465127343558e-06, 'epoch': 1.68} {'loss': 0.2332, 'learning_rate': 1.300980795331892e-06, 'epoch': 1.68} {'loss': 0.2045, 'learning_rate': 1.3008150877489701e-06, 'epoch': 1.68} {'loss': 0.3147, 'learning_rate': 1.3006493899857697e-06, 'epoch': 1.68} {'loss': 0.1536, 'learning_rate': 1.3004837020424855e-06, 'epoch': 1.68} {'loss': 0.3298, 'learning_rate': 1.3003180239192981e-06, 'epoch': 1.68} {'loss': 0.2693, 'learning_rate': 1.3001523556163998e-06, 'epoch': 1.68} {'loss': 0.2877, 'learning_rate': 1.2999866971339737e-06, 'epoch': 1.68} {'loss': 0.2052, 'learning_rate': 1.2998210484722096e-06, 'epoch': 1.68} {'loss': 0.3238, 'learning_rate': 1.2996554096312909e-06, 'epoch': 1.68} {'loss': 0.3479, 'learning_rate': 1.2994897806114083e-06, 'epoch': 1.68} {'loss': 0.3041, 'learning_rate': 1.299324161412746e-06, 'epoch': 1.68} {'loss': 0.4164, 'learning_rate': 1.2991585520354943e-06, 'epoch': 1.68} {'loss': 0.4975, 'learning_rate': 1.2989929524798383e-06, 'epoch': 1.68} {'loss': 0.3961, 'learning_rate': 1.2988273627459613e-06, 'epoch': 1.68} {'loss': 0.365, 'learning_rate': 1.2986617828340575e-06, 'epoch': 1.68} {'loss': 0.2876, 'learning_rate': 1.2984962127443069e-06, 'epoch': 1.68} {'loss': 0.4671, 'learning_rate': 1.298330652476899e-06, 'epoch': 1.68} {'loss': 0.3177, 'learning_rate': 1.2981651020320218e-06, 'epoch': 1.68} {'loss': 0.3366, 'learning_rate': 1.2979995614098628e-06, 'epoch': 1.68} {'loss': 0.3113, 'learning_rate': 1.2978340306106086e-06, 'epoch': 1.68} {'loss': 0.3267, 'learning_rate': 1.2976685096344422e-06, 'epoch': 1.68} {'loss': 0.2241, 'learning_rate': 1.2975029984815557e-06, 'epoch': 1.68} {'loss': 0.3525, 'learning_rate': 1.29733749715213e-06, 'epoch': 1.68} {'loss': 0.3283, 'learning_rate': 1.2971720056463588e-06, 'epoch': 1.68} {'loss': 0.3406, 'learning_rate': 1.2970065239644235e-06, 'epoch': 1.68} {'loss': 0.2861, 'learning_rate': 1.2968410521065145e-06, 'epoch': 1.68} {'loss': 0.3282, 'learning_rate': 1.2966755900728156e-06, 'epoch': 1.68} {'loss': 0.2138, 'learning_rate': 1.2965101378635158e-06, 'epoch': 1.68} {'loss': 0.3986, 'learning_rate': 1.2963446954787996e-06, 'epoch': 1.68} {'loss': 0.3001, 'learning_rate': 1.2961792629188575e-06, 'epoch': 1.68} {'loss': 0.3052, 'learning_rate': 1.2960138401838718e-06, 'epoch': 1.68} {'loss': 0.2636, 'learning_rate': 1.2958484272740335e-06, 'epoch': 1.68} {'loss': 0.2166, 'learning_rate': 1.2956830241895268e-06, 'epoch': 1.68} {'loss': 0.2562, 'learning_rate': 1.2955176309305361e-06, 'epoch': 1.68} {'loss': 0.296, 'learning_rate': 1.2953522474972535e-06, 'epoch': 1.68} {'loss': 0.3417, 'learning_rate': 1.2951868738898609e-06, 'epoch': 1.68} {'loss': 0.3323, 'learning_rate': 1.2950215101085496e-06, 'epoch': 1.68} {'loss': 0.3764, 'learning_rate': 1.294856156153501e-06, 'epoch': 1.68} {'loss': 0.2878, 'learning_rate': 1.2946908120249057e-06, 'epoch': 1.68} {'loss': 0.3134, 'learning_rate': 1.2945254777229488e-06, 'epoch': 1.68} {'loss': 0.4292, 'learning_rate': 1.2943601532478177e-06, 'epoch': 1.68} {'loss': 0.3132, 'learning_rate': 1.2941948385996972e-06, 'epoch': 1.68} {'loss': 0.2373, 'learning_rate': 1.2940295337787779e-06, 'epoch': 1.68} {'loss': 0.2926, 'learning_rate': 1.2938642387852407e-06, 'epoch': 1.68} {'loss': 0.3519, 'learning_rate': 1.2936989536192767e-06, 'epoch': 1.68} {'loss': 0.2077, 'learning_rate': 1.2935336782810726e-06, 'epoch': 1.68} {'loss': 0.3358, 'learning_rate': 1.29336841277081e-06, 'epoch': 1.68} {'loss': 0.2242, 'learning_rate': 1.2932031570886817e-06, 'epoch': 1.68} {'loss': 0.3089, 'learning_rate': 1.293037911234869e-06, 'epoch': 1.68} {'loss': 0.3092, 'learning_rate': 1.2928726752095632e-06, 'epoch': 1.68} {'loss': 0.4233, 'learning_rate': 1.2927074490129466e-06, 'epoch': 1.68} {'loss': 0.2637, 'learning_rate': 1.2925422326452087e-06, 'epoch': 1.68} {'loss': 0.269, 'learning_rate': 1.2923770261065328e-06, 'epoch': 1.68} {'loss': 0.2894, 'learning_rate': 1.2922118293971097e-06, 'epoch': 1.68} {'loss': 0.3311, 'learning_rate': 1.292046642517122e-06, 'epoch': 1.68} {'loss': 0.2199, 'learning_rate': 1.29188146546676e-06, 'epoch': 1.68} {'loss': 0.2835, 'learning_rate': 1.291716298246205e-06, 'epoch': 1.68} {'loss': 0.2739, 'learning_rate': 1.291551140855648e-06, 'epoch': 1.68} {'loss': 0.4213, 'learning_rate': 1.2913859932952744e-06, 'epoch': 1.68} {'loss': 0.1788, 'learning_rate': 1.2912208555652683e-06, 'epoch': 1.68} {'loss': 0.3658, 'learning_rate': 1.2910557276658198e-06, 'epoch': 1.68} {'loss': 0.2633, 'learning_rate': 1.2908906095971107e-06, 'epoch': 1.68} {'loss': 0.247, 'learning_rate': 1.2907255013593322e-06, 'epoch': 1.68} {'loss': 0.2176, 'learning_rate': 1.2905604029526663e-06, 'epoch': 1.68} {'loss': 0.3033, 'learning_rate': 1.290395314377304e-06, 'epoch': 1.68} {'loss': 0.1504, 'learning_rate': 1.2902302356334274e-06, 'epoch': 1.68} {'loss': 0.3313, 'learning_rate': 1.2900651667212261e-06, 'epoch': 1.68} {'loss': 0.2403, 'learning_rate': 1.2899001076408835e-06, 'epoch': 1.68} {'loss': 0.3512, 'learning_rate': 1.2897350583925884e-06, 'epoch': 1.68} {'loss': 0.4055, 'learning_rate': 1.2895700189765248e-06, 'epoch': 1.68} {'loss': 0.3795, 'learning_rate': 1.2894049893928817e-06, 'epoch': 1.68} {'loss': 0.338, 'learning_rate': 1.2892399696418444e-06, 'epoch': 1.68} {'loss': 0.3171, 'learning_rate': 1.2890749597235974e-06, 'epoch': 1.68} {'loss': 0.2852, 'learning_rate': 1.2889099596383292e-06, 'epoch': 1.68} {'loss': 0.3537, 'learning_rate': 1.2887449693862242e-06, 'epoch': 1.68} {'loss': 0.2395, 'learning_rate': 1.2885799889674712e-06, 'epoch': 1.68} {'loss': 0.5593, 'learning_rate': 1.2884150183822519e-06, 'epoch': 1.68} {'loss': 0.3164, 'learning_rate': 1.2882500576307588e-06, 'epoch': 1.68} {'loss': 0.2986, 'learning_rate': 1.2880851067131716e-06, 'epoch': 1.68} {'loss': 0.3772, 'learning_rate': 1.2879201656296826e-06, 'epoch': 1.68} {'loss': 0.2316, 'learning_rate': 1.2877552343804722e-06, 'epoch': 1.68} {'loss': 0.2318, 'learning_rate': 1.2875903129657319e-06, 'epoch': 1.68} {'loss': 0.381, 'learning_rate': 1.2874254013856436e-06, 'epoch': 1.68} {'loss': 0.2468, 'learning_rate': 1.287260499640397e-06, 'epoch': 1.68} {'loss': 0.3304, 'learning_rate': 1.2870956077301767e-06, 'epoch': 1.68} {'loss': 0.1618, 'learning_rate': 1.2869307256551667e-06, 'epoch': 1.68} {'loss': 0.3784, 'learning_rate': 1.286765853415557e-06, 'epoch': 1.68} {'loss': 0.338, 'learning_rate': 1.2866009910115296e-06, 'epoch': 1.68} {'loss': 0.1894, 'learning_rate': 1.2864361384432745e-06, 'epoch': 1.68} {'loss': 0.4407, 'learning_rate': 1.2862712957109747e-06, 'epoch': 1.68} {'loss': 0.2339, 'learning_rate': 1.286106462814819e-06, 'epoch': 1.68} {'loss': 0.2947, 'learning_rate': 1.2859416397549895e-06, 'epoch': 1.68} {'loss': 0.4156, 'learning_rate': 1.2857768265316784e-06, 'epoch': 1.68} {'loss': 0.2542, 'learning_rate': 1.2856120231450653e-06, 'epoch': 1.68} {'loss': 0.2206, 'learning_rate': 1.2854472295953413e-06, 'epoch': 1.68} {'loss': 0.2513, 'learning_rate': 1.2852824458826873e-06, 'epoch': 1.68} {'loss': 0.3385, 'learning_rate': 1.2851176720072956e-06, 'epoch': 1.68} {'loss': 0.3996, 'learning_rate': 1.2849529079693478e-06, 'epoch': 1.68} {'loss': 0.3208, 'learning_rate': 1.28478815376903e-06, 'epoch': 1.68} {'loss': 0.2155, 'learning_rate': 1.2846234094065301e-06, 'epoch': 1.68} {'loss': 0.3846, 'learning_rate': 1.284458674882032e-06, 'epoch': 1.68} {'loss': 0.3567, 'learning_rate': 1.2842939501957241e-06, 'epoch': 1.68} {'loss': 0.3803, 'learning_rate': 1.2841292353477896e-06, 'epoch': 1.68} {'loss': 0.3208, 'learning_rate': 1.2839645303384174e-06, 'epoch': 1.68} {'loss': 0.4079, 'learning_rate': 1.2837998351677894e-06, 'epoch': 1.68} {'loss': 0.3958, 'learning_rate': 1.2836351498360954e-06, 'epoch': 1.68} {'loss': 0.342, 'learning_rate': 1.283470474343519e-06, 'epoch': 1.68} {'loss': 0.3999, 'learning_rate': 1.2833058086902484e-06, 'epoch': 1.68} {'loss': 0.2229, 'learning_rate': 1.283141152876466e-06, 'epoch': 1.68} {'loss': 0.2731, 'learning_rate': 1.2829765069023626e-06, 'epoch': 1.68} {'loss': 0.402, 'learning_rate': 1.2828118707681203e-06, 'epoch': 1.68} {'loss': 0.4384, 'learning_rate': 1.2826472444739235e-06, 'epoch': 1.68} {'loss': 0.3336, 'learning_rate': 1.2824826280199621e-06, 'epoch': 1.68} {'loss': 0.2268, 'learning_rate': 1.282318021406419e-06, 'epoch': 1.68} {'loss': 0.2626, 'learning_rate': 1.2821534246334822e-06, 'epoch': 1.68} {'loss': 0.3957, 'learning_rate': 1.2819888377013357e-06, 'epoch': 1.68} {'loss': 0.2297, 'learning_rate': 1.281824260610165e-06, 'epoch': 1.68} {'loss': 0.3275, 'learning_rate': 1.2816596933601567e-06, 'epoch': 1.68} {'loss': 0.3352, 'learning_rate': 1.2814951359514994e-06, 'epoch': 1.68} {'loss': 0.3749, 'learning_rate': 1.2813305883843752e-06, 'epoch': 1.68} {'loss': 0.2847, 'learning_rate': 1.2811660506589696e-06, 'epoch': 1.68} {'loss': 0.3337, 'learning_rate': 1.2810015227754713e-06, 'epoch': 1.68} {'loss': 0.3718, 'learning_rate': 1.2808370047340623e-06, 'epoch': 1.68} {'loss': 0.2441, 'learning_rate': 1.2806724965349327e-06, 'epoch': 1.68} {'loss': 0.3259, 'learning_rate': 1.280507998178263e-06, 'epoch': 1.68} {'loss': 0.4563, 'learning_rate': 1.2803435096642447e-06, 'epoch': 1.68} {'loss': 0.2764, 'learning_rate': 1.2801790309930585e-06, 'epoch': 1.68} {'loss': 0.2556, 'learning_rate': 1.2800145621648929e-06, 'epoch': 1.68} {'loss': 0.3274, 'learning_rate': 1.2798501031799316e-06, 'epoch': 1.68} {'loss': 0.241, 'learning_rate': 1.2796856540383628e-06, 'epoch': 1.68} {'loss': 0.2332, 'learning_rate': 1.2795212147403691e-06, 'epoch': 1.68} {'loss': 0.277, 'learning_rate': 1.2793567852861388e-06, 'epoch': 1.68} {'loss': 0.4978, 'learning_rate': 1.2791923656758577e-06, 'epoch': 1.68} {'loss': 0.2951, 'learning_rate': 1.2790279559097075e-06, 'epoch': 1.68} {'loss': 0.3564, 'learning_rate': 1.2788635559878782e-06, 'epoch': 1.68} {'loss': 0.4246, 'learning_rate': 1.2786991659105509e-06, 'epoch': 1.68} {'loss': 0.3281, 'learning_rate': 1.2785347856779173e-06, 'epoch': 1.68} {'loss': 0.2378, 'learning_rate': 1.2783704152901567e-06, 'epoch': 1.68} {'loss': 0.3904, 'learning_rate': 1.2782060547474583e-06, 'epoch': 1.68} {'loss': 0.2948, 'learning_rate': 1.278041704050006e-06, 'epoch': 1.68} {'loss': 0.3407, 'learning_rate': 1.277877363197988e-06, 'epoch': 1.68} {'loss': 0.3559, 'learning_rate': 1.2777130321915854e-06, 'epoch': 1.68} {'loss': 0.2696, 'learning_rate': 1.2775487110309892e-06, 'epoch': 1.68} {'loss': 0.3442, 'learning_rate': 1.2773843997163793e-06, 'epoch': 1.68} {'loss': 0.2875, 'learning_rate': 1.2772200982479455e-06, 'epoch': 1.68} {'loss': 0.328, 'learning_rate': 1.277055806625872e-06, 'epoch': 1.68} {'loss': 0.4411, 'learning_rate': 1.276891524850341e-06, 'epoch': 1.68} {'loss': 0.3204, 'learning_rate': 1.2767272529215424e-06, 'epoch': 1.68} {'loss': 0.1956, 'learning_rate': 1.2765629908396593e-06, 'epoch': 1.68} {'loss': 0.3286, 'learning_rate': 1.2763987386048792e-06, 'epoch': 1.68} {'loss': 0.2657, 'learning_rate': 1.2762344962173833e-06, 'epoch': 1.68} {'loss': 0.2974, 'learning_rate': 1.2760702636773625e-06, 'epoch': 1.68} {'loss': 0.2618, 'learning_rate': 1.2759060409849966e-06, 'epoch': 1.68} {'loss': 0.3185, 'learning_rate': 1.2757418281404766e-06, 'epoch': 1.69} {'loss': 0.195, 'learning_rate': 1.2755776251439833e-06, 'epoch': 1.69} {'loss': 0.2034, 'learning_rate': 1.2754134319957057e-06, 'epoch': 1.69} {'loss': 0.3712, 'learning_rate': 1.2752492486958247e-06, 'epoch': 1.69} {'loss': 0.355, 'learning_rate': 1.275085075244531e-06, 'epoch': 1.69} {'loss': 0.243, 'learning_rate': 1.274920911642007e-06, 'epoch': 1.69} {'loss': 0.2625, 'learning_rate': 1.2747567578884357e-06, 'epoch': 1.69} {'loss': 0.3226, 'learning_rate': 1.274592613984007e-06, 'epoch': 1.69} {'loss': 0.3016, 'learning_rate': 1.274428479928902e-06, 'epoch': 1.69} {'loss': 0.1525, 'learning_rate': 1.2742643557233102e-06, 'epoch': 1.69} {'loss': 0.4071, 'learning_rate': 1.274100241367412e-06, 'epoch': 1.69} {'loss': 0.2127, 'learning_rate': 1.2739361368613978e-06, 'epoch': 1.69} {'loss': 0.1404, 'learning_rate': 1.273772042205449e-06, 'epoch': 1.69} {'loss': 0.4518, 'learning_rate': 1.2736079573997529e-06, 'epoch': 1.69} {'loss': 0.1735, 'learning_rate': 1.2734438824444927e-06, 'epoch': 1.69} {'loss': 0.3553, 'learning_rate': 1.2732798173398575e-06, 'epoch': 1.69} {'loss': 0.3458, 'learning_rate': 1.273115762086027e-06, 'epoch': 1.69} {'loss': 0.0998, 'learning_rate': 1.2729517166831917e-06, 'epoch': 1.69} {'loss': 0.3561, 'learning_rate': 1.2727876811315343e-06, 'epoch': 1.69} {'loss': 0.3156, 'learning_rate': 1.2726236554312376e-06, 'epoch': 1.69} {'loss': 0.3075, 'learning_rate': 1.2724596395824918e-06, 'epoch': 1.69} {'loss': 0.2922, 'learning_rate': 1.2722956335854774e-06, 'epoch': 1.69} {'loss': 0.3285, 'learning_rate': 1.2721316374403836e-06, 'epoch': 1.69} {'loss': 0.2415, 'learning_rate': 1.271967651147391e-06, 'epoch': 1.69} {'loss': 0.2659, 'learning_rate': 1.2718036747066898e-06, 'epoch': 1.69} {'loss': 0.2782, 'learning_rate': 1.2716397081184606e-06, 'epoch': 1.69} {'loss': 0.2192, 'learning_rate': 1.2714757513828924e-06, 'epoch': 1.69} {'loss': 0.2513, 'learning_rate': 1.271311804500166e-06, 'epoch': 1.69} {'loss': 0.2886, 'learning_rate': 1.2711478674704704e-06, 'epoch': 1.69} {'loss': 0.2514, 'learning_rate': 1.270983940293987e-06, 'epoch': 1.69} {'loss': 0.4009, 'learning_rate': 1.2708200229709056e-06, 'epoch': 1.69} {'loss': 0.3346, 'learning_rate': 1.2706561155014085e-06, 'epoch': 1.69} {'loss': 0.2355, 'learning_rate': 1.2704922178856782e-06, 'epoch': 1.69} {'loss': 0.2748, 'learning_rate': 1.2703283301239044e-06, 'epoch': 1.69} {'loss': 0.257, 'learning_rate': 1.2701644522162671e-06, 'epoch': 1.69} {'loss': 0.3548, 'learning_rate': 1.270000584162957e-06, 'epoch': 1.69} {'loss': 0.3396, 'learning_rate': 1.2698367259641541e-06, 'epoch': 1.69} {'loss': 0.3506, 'learning_rate': 1.2696728776200472e-06, 'epoch': 1.69} {'loss': 0.2883, 'learning_rate': 1.2695090391308174e-06, 'epoch': 1.69} {'loss': 0.318, 'learning_rate': 1.269345210496653e-06, 'epoch': 1.69} {'loss': 0.3188, 'learning_rate': 1.2691813917177365e-06, 'epoch': 1.69} {'loss': 0.3, 'learning_rate': 1.2690175827942563e-06, 'epoch': 1.69} {'loss': 0.2478, 'learning_rate': 1.2688537837263926e-06, 'epoch': 1.69} {'loss': 0.2455, 'learning_rate': 1.2686899945143338e-06, 'epoch': 1.69} {'loss': 0.2906, 'learning_rate': 1.2685262151582655e-06, 'epoch': 1.69} {'loss': 0.2916, 'learning_rate': 1.2683624456583676e-06, 'epoch': 1.69} {'loss': 0.3185, 'learning_rate': 1.26819868601483e-06, 'epoch': 1.69} {'loss': 0.3566, 'learning_rate': 1.2680349362278333e-06, 'epoch': 1.69} {'loss': 0.2816, 'learning_rate': 1.2678711962975676e-06, 'epoch': 1.69} {'loss': 0.2378, 'learning_rate': 1.2677074662242127e-06, 'epoch': 1.69} {'loss': 0.1726, 'learning_rate': 1.2675437460079577e-06, 'epoch': 1.69} {'loss': 0.2997, 'learning_rate': 1.267380035648983e-06, 'epoch': 1.69} {'loss': 0.3277, 'learning_rate': 1.2672163351474775e-06, 'epoch': 1.69} {'loss': 0.3618, 'learning_rate': 1.2670526445036213e-06, 'epoch': 1.69} {'loss': 0.2837, 'learning_rate': 1.2668889637176052e-06, 'epoch': 1.69} {'loss': 0.2982, 'learning_rate': 1.266725292789609e-06, 'epoch': 1.69} {'loss': 0.4381, 'learning_rate': 1.2665616317198204e-06, 'epoch': 1.69} {'loss': 0.278, 'learning_rate': 1.2663979805084236e-06, 'epoch': 1.69} {'loss': 0.4257, 'learning_rate': 1.2662343391555997e-06, 'epoch': 1.69} {'loss': 0.2874, 'learning_rate': 1.2660707076615397e-06, 'epoch': 1.69} {'loss': 0.3554, 'learning_rate': 1.2659070860264222e-06, 'epoch': 1.69} {'loss': 0.4084, 'learning_rate': 1.265743474250437e-06, 'epoch': 1.69} {'loss': 0.3189, 'learning_rate': 1.2655798723337632e-06, 'epoch': 1.69} {'loss': 0.2992, 'learning_rate': 1.2654162802765912e-06, 'epoch': 1.69} {'loss': 0.3263, 'learning_rate': 1.2652526980791047e-06, 'epoch': 1.69} {'loss': 0.242, 'learning_rate': 1.2650891257414844e-06, 'epoch': 1.69} {'loss': 0.271, 'learning_rate': 1.26492556326392e-06, 'epoch': 1.69} {'loss': 0.1758, 'learning_rate': 1.2647620106465908e-06, 'epoch': 1.69} {'loss': 0.4168, 'learning_rate': 1.2645984678896861e-06, 'epoch': 1.69} {'loss': 0.2875, 'learning_rate': 1.2644349349933871e-06, 'epoch': 1.69} {'loss': 0.3072, 'learning_rate': 1.2642714119578825e-06, 'epoch': 1.69} {'loss': 0.4463, 'learning_rate': 1.264107898783351e-06, 'epoch': 1.69} {'loss': 0.2963, 'learning_rate': 1.2639443954699827e-06, 'epoch': 1.69} {'loss': 0.2856, 'learning_rate': 1.2637809020179593e-06, 'epoch': 1.69} {'loss': 0.3679, 'learning_rate': 1.2636174184274663e-06, 'epoch': 1.69} {'loss': 0.3903, 'learning_rate': 1.263453944698687e-06, 'epoch': 1.69} {'loss': 0.162, 'learning_rate': 1.263290480831808e-06, 'epoch': 1.69} {'loss': 0.158, 'learning_rate': 1.2631270268270136e-06, 'epoch': 1.69} {'loss': 0.4438, 'learning_rate': 1.2629635826844855e-06, 'epoch': 1.69} {'loss': 0.1967, 'learning_rate': 1.2628001484044118e-06, 'epoch': 1.69} {'loss': 0.3694, 'learning_rate': 1.2626367239869718e-06, 'epoch': 1.69} {'loss': 0.3517, 'learning_rate': 1.2624733094323572e-06, 'epoch': 1.69} {'loss': 0.3081, 'learning_rate': 1.262309904740746e-06, 'epoch': 1.69} {'loss': 0.5464, 'learning_rate': 1.2621465099123275e-06, 'epoch': 1.69} {'loss': 0.3299, 'learning_rate': 1.2619831249472824e-06, 'epoch': 1.69} {'loss': 0.313, 'learning_rate': 1.2618197498457985e-06, 'epoch': 1.69} {'loss': 0.3505, 'learning_rate': 1.2616563846080565e-06, 'epoch': 1.69} {'loss': 0.2371, 'learning_rate': 1.2614930292342454e-06, 'epoch': 1.69} {'loss': 0.403, 'learning_rate': 1.2613296837245436e-06, 'epoch': 1.69} {'loss': 0.3047, 'learning_rate': 1.2611663480791415e-06, 'epoch': 1.69} {'loss': 0.2854, 'learning_rate': 1.2610030222982206e-06, 'epoch': 1.69} {'loss': 0.3377, 'learning_rate': 1.2608397063819643e-06, 'epoch': 1.69} {'loss': 0.3352, 'learning_rate': 1.2606764003305595e-06, 'epoch': 1.69} {'loss': 0.282, 'learning_rate': 1.2605131041441876e-06, 'epoch': 1.69} {'loss': 0.3175, 'learning_rate': 1.2603498178230357e-06, 'epoch': 1.69} {'loss': 0.3395, 'learning_rate': 1.2601865413672854e-06, 'epoch': 1.69} {'loss': 0.1615, 'learning_rate': 1.2600232747771245e-06, 'epoch': 1.69} {'loss': 0.3237, 'learning_rate': 1.2598600180527331e-06, 'epoch': 1.69} {'loss': 0.3735, 'learning_rate': 1.259696771194301e-06, 'epoch': 1.69} {'loss': 0.1286, 'learning_rate': 1.2595335342020054e-06, 'epoch': 1.69} {'loss': 0.4042, 'learning_rate': 1.2593703070760377e-06, 'epoch': 1.69} {'loss': 0.243, 'learning_rate': 1.2592070898165765e-06, 'epoch': 1.69} {'loss': 0.1604, 'learning_rate': 1.2590438824238094e-06, 'epoch': 1.69} {'loss': 0.2286, 'learning_rate': 1.2588806848979207e-06, 'epoch': 1.69} {'loss': 0.4918, 'learning_rate': 1.2587174972390915e-06, 'epoch': 1.69} {'loss': 0.409, 'learning_rate': 1.2585543194475092e-06, 'epoch': 1.69} {'loss': 0.3393, 'learning_rate': 1.2583911515233548e-06, 'epoch': 1.69} {'loss': 0.291, 'learning_rate': 1.2582279934668173e-06, 'epoch': 1.69} {'loss': 0.3076, 'learning_rate': 1.2580648452780764e-06, 'epoch': 1.69} {'loss': 0.145, 'learning_rate': 1.2579017069573184e-06, 'epoch': 1.69} {'loss': 0.3445, 'learning_rate': 1.2577385785047268e-06, 'epoch': 1.69} {'loss': 0.3173, 'learning_rate': 1.257575459920487e-06, 'epoch': 1.69} {'loss': 0.3412, 'learning_rate': 1.2574123512047798e-06, 'epoch': 1.69} {'loss': 0.3754, 'learning_rate': 1.2572492523577939e-06, 'epoch': 1.69} {'loss': 0.2542, 'learning_rate': 1.2570861633797082e-06, 'epoch': 1.69} {'loss': 0.31, 'learning_rate': 1.2569230842707137e-06, 'epoch': 1.69} {'loss': 0.2455, 'learning_rate': 1.2567600150309867e-06, 'epoch': 1.69} {'loss': 0.3336, 'learning_rate': 1.256596955660717e-06, 'epoch': 1.69} {'loss': 0.2689, 'learning_rate': 1.2564339061600883e-06, 'epoch': 1.69} {'loss': 0.2991, 'learning_rate': 1.25627086652928e-06, 'epoch': 1.69} {'loss': 0.4627, 'learning_rate': 1.256107836768481e-06, 'epoch': 1.69} {'loss': 0.3715, 'learning_rate': 1.255944816877872e-06, 'epoch': 1.69} {'loss': 0.2724, 'learning_rate': 1.2557818068576399e-06, 'epoch': 1.69} {'loss': 0.3196, 'learning_rate': 1.2556188067079655e-06, 'epoch': 1.69} {'loss': 0.3007, 'learning_rate': 1.2554558164290376e-06, 'epoch': 1.69} {'loss': 0.3463, 'learning_rate': 1.2552928360210347e-06, 'epoch': 1.69} {'loss': 0.3581, 'learning_rate': 1.2551298654841448e-06, 'epoch': 1.69} {'loss': 0.3625, 'learning_rate': 1.2549669048185486e-06, 'epoch': 1.69} {'loss': 0.2698, 'learning_rate': 1.254803954024434e-06, 'epoch': 1.69} {'loss': 0.1798, 'learning_rate': 1.2546410131019805e-06, 'epoch': 1.69} {'loss': 0.4291, 'learning_rate': 1.254478082051377e-06, 'epoch': 1.69} {'loss': 0.3343, 'learning_rate': 1.2543151608728043e-06, 'epoch': 1.69} {'loss': 0.4051, 'learning_rate': 1.2541522495664439e-06, 'epoch': 1.69} {'loss': 0.3316, 'learning_rate': 1.253989348132486e-06, 'epoch': 1.69} {'loss': 0.2385, 'learning_rate': 1.2538264565711077e-06, 'epoch': 1.69} {'loss': 0.3416, 'learning_rate': 1.2536635748824988e-06, 'epoch': 1.69} {'loss': 0.2657, 'learning_rate': 1.253500703066839e-06, 'epoch': 1.69} {'loss': 0.2647, 'learning_rate': 1.2533378411243147e-06, 'epoch': 1.69} {'loss': 0.3355, 'learning_rate': 1.253174989055107e-06, 'epoch': 1.69} {'loss': 0.4196, 'learning_rate': 1.2530121468594036e-06, 'epoch': 1.69} {'loss': 0.2849, 'learning_rate': 1.2528493145373844e-06, 'epoch': 1.69} {'loss': 0.1567, 'learning_rate': 1.2526864920892368e-06, 'epoch': 1.69} {'loss': 0.3504, 'learning_rate': 1.2525236795151408e-06, 'epoch': 1.69} {'loss': 0.2829, 'learning_rate': 1.2523608768152838e-06, 'epoch': 1.69} {'loss': 0.2013, 'learning_rate': 1.2521980839898484e-06, 'epoch': 1.69} {'loss': 0.2288, 'learning_rate': 1.252035301039015e-06, 'epoch': 1.69} {'loss': 0.2491, 'learning_rate': 1.251872527962973e-06, 'epoch': 1.69} {'loss': 0.2568, 'learning_rate': 1.2517097647619013e-06, 'epoch': 1.69} {'loss': 0.4245, 'learning_rate': 1.2515470114359884e-06, 'epoch': 1.69} {'loss': 0.2709, 'learning_rate': 1.2513842679854127e-06, 'epoch': 1.69} {'loss': 0.3264, 'learning_rate': 1.2512215344103618e-06, 'epoch': 1.69} {'loss': 0.4125, 'learning_rate': 1.2510588107110167e-06, 'epoch': 1.69} {'loss': 0.3996, 'learning_rate': 1.250896096887565e-06, 'epoch': 1.69} {'loss': 0.3655, 'learning_rate': 1.2507333929401856e-06, 'epoch': 1.69} {'loss': 0.2689, 'learning_rate': 1.250570698869067e-06, 'epoch': 1.69} {'loss': 0.3495, 'learning_rate': 1.2504080146743869e-06, 'epoch': 1.69} {'loss': 0.1826, 'learning_rate': 1.2502453403563352e-06, 'epoch': 1.69} {'loss': 0.2798, 'learning_rate': 1.250082675915093e-06, 'epoch': 1.69} {'loss': 0.3113, 'learning_rate': 1.249920021350841e-06, 'epoch': 1.69} {'loss': 0.3185, 'learning_rate': 1.2497573766637673e-06, 'epoch': 1.69} {'loss': 0.2019, 'learning_rate': 1.2495947418540523e-06, 'epoch': 1.69} {'loss': 0.2329, 'learning_rate': 1.2494321169218805e-06, 'epoch': 1.69} {'loss': 0.187, 'learning_rate': 1.249269501867435e-06, 'epoch': 1.69} {'loss': 0.2608, 'learning_rate': 1.2491068966909037e-06, 'epoch': 1.69} {'loss': 0.2647, 'learning_rate': 1.2489443013924652e-06, 'epoch': 1.69} {'loss': 0.3808, 'learning_rate': 1.2487817159723037e-06, 'epoch': 1.69} {'loss': 0.3199, 'learning_rate': 1.2486191404306046e-06, 'epoch': 1.69} {'loss': 0.3774, 'learning_rate': 1.2484565747675493e-06, 'epoch': 1.69} {'loss': 0.2388, 'learning_rate': 1.2482940189833236e-06, 'epoch': 1.69} {'loss': 0.2788, 'learning_rate': 1.248131473078108e-06, 'epoch': 1.69} {'loss': 0.3404, 'learning_rate': 1.2479689370520898e-06, 'epoch': 1.69} {'loss': 0.2526, 'learning_rate': 1.2478064109054478e-06, 'epoch': 1.69} {'loss': 0.2717, 'learning_rate': 1.2476438946383707e-06, 'epoch': 1.69} {'loss': 0.2, 'learning_rate': 1.2474813882510372e-06, 'epoch': 1.69} {'loss': 0.2557, 'learning_rate': 1.2473188917436351e-06, 'epoch': 1.69} {'loss': 0.3403, 'learning_rate': 1.2471564051163432e-06, 'epoch': 1.69} {'loss': 0.264, 'learning_rate': 1.2469939283693488e-06, 'epoch': 1.69} {'loss': 0.3041, 'learning_rate': 1.2468314615028343e-06, 'epoch': 1.69} {'loss': 0.4009, 'learning_rate': 1.2466690045169805e-06, 'epoch': 1.69} {'loss': 0.2281, 'learning_rate': 1.246506557411975e-06, 'epoch': 1.69} {'loss': 0.214, 'learning_rate': 1.2463441201879977e-06, 'epoch': 1.69} {'loss': 0.2847, 'learning_rate': 1.2461816928452342e-06, 'epoch': 1.69} {'loss': 0.4513, 'learning_rate': 1.2460192753838651e-06, 'epoch': 1.69} {'loss': 0.1631, 'learning_rate': 1.2458568678040783e-06, 'epoch': 1.69} {'loss': 0.1892, 'learning_rate': 1.2456944701060524e-06, 'epoch': 1.69} {'loss': 0.2557, 'learning_rate': 1.2455320822899742e-06, 'epoch': 1.69} {'loss': 0.3086, 'learning_rate': 1.2453697043560232e-06, 'epoch': 1.69} {'loss': 0.29, 'learning_rate': 1.2452073363043882e-06, 'epoch': 1.69} {'loss': 0.3496, 'learning_rate': 1.2450449781352458e-06, 'epoch': 1.69} {'loss': 0.3836, 'learning_rate': 1.244882629848786e-06, 'epoch': 1.69} {'loss': 0.3628, 'learning_rate': 1.2447202914451884e-06, 'epoch': 1.69} {'loss': 0.2049, 'learning_rate': 1.2445579629246352e-06, 'epoch': 1.69} {'loss': 0.3626, 'learning_rate': 1.244395644287313e-06, 'epoch': 1.69} {'loss': 0.416, 'learning_rate': 1.2442333355334001e-06, 'epoch': 1.69} {'loss': 0.2179, 'learning_rate': 1.244071036663086e-06, 'epoch': 1.69} {'loss': 0.2721, 'learning_rate': 1.2439087476765476e-06, 'epoch': 1.69} {'loss': 0.3272, 'learning_rate': 1.2437464685739741e-06, 'epoch': 1.69} {'loss': 0.1274, 'learning_rate': 1.2435841993555442e-06, 'epoch': 1.69} {'loss': 0.2431, 'learning_rate': 1.243421940021443e-06, 'epoch': 1.69} {'loss': 0.2243, 'learning_rate': 1.243259690571853e-06, 'epoch': 1.69} {'loss': 0.5348, 'learning_rate': 1.2430974510069581e-06, 'epoch': 1.69} {'loss': 0.2825, 'learning_rate': 1.2429352213269396e-06, 'epoch': 1.69} {'loss': 0.2136, 'learning_rate': 1.242773001531985e-06, 'epoch': 1.69} {'loss': 0.2455, 'learning_rate': 1.242610791622273e-06, 'epoch': 1.69} {'loss': 0.2179, 'learning_rate': 1.2424485915979868e-06, 'epoch': 1.69} {'loss': 0.4052, 'learning_rate': 1.2422864014593128e-06, 'epoch': 1.69} {'loss': 0.2084, 'learning_rate': 1.24212422120643e-06, 'epoch': 1.69} {'loss': 0.2799, 'learning_rate': 1.2419620508395258e-06, 'epoch': 1.69} {'loss': 0.1571, 'learning_rate': 1.241799890358778e-06, 'epoch': 1.69} {'loss': 0.3638, 'learning_rate': 1.2416377397643764e-06, 'epoch': 1.69} {'loss': 0.3418, 'learning_rate': 1.2414755990564965e-06, 'epoch': 1.69} {'loss': 0.4076, 'learning_rate': 1.2413134682353278e-06, 'epoch': 1.69} {'loss': 0.2265, 'learning_rate': 1.2411513473010496e-06, 'epoch': 1.69} {'loss': 0.2433, 'learning_rate': 1.2409892362538466e-06, 'epoch': 1.69} {'loss': 0.3626, 'learning_rate': 1.2408271350939005e-06, 'epoch': 1.69} {'loss': 0.2217, 'learning_rate': 1.2406650438213962e-06, 'epoch': 1.69} {'loss': 0.2636, 'learning_rate': 1.240502962436515e-06, 'epoch': 1.69} {'loss': 0.2912, 'learning_rate': 1.2403408909394388e-06, 'epoch': 1.69} {'loss': 0.197, 'learning_rate': 1.240178829330354e-06, 'epoch': 1.69} {'loss': 0.3855, 'learning_rate': 1.2400167776094395e-06, 'epoch': 1.69} {'loss': 0.3318, 'learning_rate': 1.2398547357768819e-06, 'epoch': 1.69} {'loss': 0.3313, 'learning_rate': 1.239692703832861e-06, 'epoch': 1.69} {'loss': 0.276, 'learning_rate': 1.239530681777562e-06, 'epoch': 1.69} {'loss': 0.3268, 'learning_rate': 1.2393686696111661e-06, 'epoch': 1.69} {'loss': 0.2962, 'learning_rate': 1.2392066673338587e-06, 'epoch': 1.69} {'loss': 0.3326, 'learning_rate': 1.2390446749458196e-06, 'epoch': 1.69} {'loss': 0.3679, 'learning_rate': 1.2388826924472353e-06, 'epoch': 1.69} {'loss': 0.2738, 'learning_rate': 1.2387207198382833e-06, 'epoch': 1.69} {'loss': 0.4001, 'learning_rate': 1.2385587571191526e-06, 'epoch': 1.69} {'loss': 0.4236, 'learning_rate': 1.2383968042900219e-06, 'epoch': 1.69} {'loss': 0.251, 'learning_rate': 1.2382348613510742e-06, 'epoch': 1.69} {'loss': 0.2002, 'learning_rate': 1.238072928302495e-06, 'epoch': 1.69} {'loss': 0.3734, 'learning_rate': 1.2379110051444621e-06, 'epoch': 1.69} {'loss': 0.2329, 'learning_rate': 1.237749091877165e-06, 'epoch': 1.69} {'loss': 0.3082, 'learning_rate': 1.2375871885007806e-06, 'epoch': 1.69} {'loss': 0.365, 'learning_rate': 1.2374252950154952e-06, 'epoch': 1.69} {'loss': 0.427, 'learning_rate': 1.2372634114214888e-06, 'epoch': 1.69} {'loss': 0.2007, 'learning_rate': 1.2371015377189488e-06, 'epoch': 1.69} {'loss': 0.2287, 'learning_rate': 1.236939673908052e-06, 'epoch': 1.69} {'loss': 0.3484, 'learning_rate': 1.2367778199889858e-06, 'epoch': 1.69} {'loss': 0.3545, 'learning_rate': 1.236615975961929e-06, 'epoch': 1.69} {'loss': 0.3025, 'learning_rate': 1.236454141827068e-06, 'epoch': 1.69} {'loss': 0.3761, 'learning_rate': 1.2362923175845841e-06, 'epoch': 1.69} {'loss': 0.3345, 'learning_rate': 1.2361305032346583e-06, 'epoch': 1.69} {'loss': 0.2348, 'learning_rate': 1.2359686987774755e-06, 'epoch': 1.69} {'loss': 0.2355, 'learning_rate': 1.235806904213216e-06, 'epoch': 1.69} {'loss': 0.3229, 'learning_rate': 1.235645119542066e-06, 'epoch': 1.69} {'loss': 0.3179, 'learning_rate': 1.2354833447642046e-06, 'epoch': 1.69} {'loss': 0.1583, 'learning_rate': 1.2353215798798168e-06, 'epoch': 1.69} {'loss': 0.2642, 'learning_rate': 1.2351598248890828e-06, 'epoch': 1.69} {'loss': 0.2645, 'learning_rate': 1.234998079792189e-06, 'epoch': 1.69} {'loss': 0.3974, 'learning_rate': 1.234836344589313e-06, 'epoch': 1.69} {'loss': 0.2758, 'learning_rate': 1.2346746192806425e-06, 'epoch': 1.69} {'loss': 0.2156, 'learning_rate': 1.234512903866355e-06, 'epoch': 1.69} {'loss': 0.2998, 'learning_rate': 1.2343511983466383e-06, 'epoch': 1.69} {'loss': 0.357, 'learning_rate': 1.234189502721672e-06, 'epoch': 1.69} {'loss': 0.2896, 'learning_rate': 1.2340278169916364e-06, 'epoch': 1.69} {'loss': 0.3501, 'learning_rate': 1.2338661411567187e-06, 'epoch': 1.69} {'loss': 0.3802, 'learning_rate': 1.2337044752170968e-06, 'epoch': 1.69} {'loss': 0.3093, 'learning_rate': 1.2335428191729581e-06, 'epoch': 1.69} {'loss': 0.1391, 'learning_rate': 1.2333811730244783e-06, 'epoch': 1.69} {'loss': 0.3076, 'learning_rate': 1.233219536771848e-06, 'epoch': 1.69} {'loss': 0.4138, 'learning_rate': 1.233057910415244e-06, 'epoch': 1.69} {'loss': 0.3289, 'learning_rate': 1.2328962939548527e-06, 'epoch': 1.69} {'loss': 0.2889, 'learning_rate': 1.232734687390854e-06, 'epoch': 1.69} {'loss': 0.2443, 'learning_rate': 1.232573090723429e-06, 'epoch': 1.69} {'loss': 0.2688, 'learning_rate': 1.232411503952764e-06, 'epoch': 1.69} {'loss': 0.2843, 'learning_rate': 1.2322499270790366e-06, 'epoch': 1.69} {'loss': 0.3415, 'learning_rate': 1.2320883601024335e-06, 'epoch': 1.69} {'loss': 0.2436, 'learning_rate': 1.2319268030231335e-06, 'epoch': 1.69} {'loss': 0.3046, 'learning_rate': 1.231765255841324e-06, 'epoch': 1.69} {'loss': 0.3894, 'learning_rate': 1.2316037185571805e-06, 'epoch': 1.69} {'loss': 0.3455, 'learning_rate': 1.2314421911708919e-06, 'epoch': 1.69} {'loss': 0.3076, 'learning_rate': 1.2312806736826356e-06, 'epoch': 1.69} {'loss': 0.1865, 'learning_rate': 1.231119166092598e-06, 'epoch': 1.69} {'loss': 0.2846, 'learning_rate': 1.2309576684009571e-06, 'epoch': 1.69} {'loss': 0.3776, 'learning_rate': 1.2307961806078995e-06, 'epoch': 1.69} {'loss': 0.3601, 'learning_rate': 1.2306347027136056e-06, 'epoch': 1.69} {'loss': 0.3581, 'learning_rate': 1.2304732347182558e-06, 'epoch': 1.69} {'loss': 0.1772, 'learning_rate': 1.2303117766220363e-06, 'epoch': 1.69} {'loss': 0.3472, 'learning_rate': 1.230150328425125e-06, 'epoch': 1.69} {'loss': 0.2946, 'learning_rate': 1.229988890127708e-06, 'epoch': 1.69} {'loss': 0.3557, 'learning_rate': 1.2298274617299633e-06, 'epoch': 1.69} {'loss': 0.259, 'learning_rate': 1.2296660432320784e-06, 'epoch': 1.69} {'loss': 0.355, 'learning_rate': 1.229504634634231e-06, 'epoch': 1.69} {'loss': 0.3448, 'learning_rate': 1.2293432359366065e-06, 'epoch': 1.69} {'loss': 0.3364, 'learning_rate': 1.2291818471393834e-06, 'epoch': 1.69} {'loss': 0.395, 'learning_rate': 1.2290204682427498e-06, 'epoch': 1.69} {'loss': 0.2386, 'learning_rate': 1.2288590992468806e-06, 'epoch': 1.69} {'loss': 0.2769, 'learning_rate': 1.228697740151964e-06, 'epoch': 1.69} {'loss': 0.3616, 'learning_rate': 1.2285363909581794e-06, 'epoch': 1.69} {'loss': 0.3323, 'learning_rate': 1.2283750516657077e-06, 'epoch': 1.69} {'loss': 0.258, 'learning_rate': 1.2282137222747349e-06, 'epoch': 1.69} {'loss': 0.131, 'learning_rate': 1.2280524027854378e-06, 'epoch': 1.69} {'loss': 0.2962, 'learning_rate': 1.2278910931980049e-06, 'epoch': 1.69} {'loss': 0.28, 'learning_rate': 1.227729793512612e-06, 'epoch': 1.69} {'loss': 0.2481, 'learning_rate': 1.227568503729446e-06, 'epoch': 1.69} {'loss': 0.2488, 'learning_rate': 1.2274072238486846e-06, 'epoch': 1.69} {'loss': 0.3108, 'learning_rate': 1.227245953870515e-06, 'epoch': 1.69} {'loss': 0.2985, 'learning_rate': 1.2270846937951142e-06, 'epoch': 1.69} {'loss': 0.2714, 'learning_rate': 1.2269234436226684e-06, 'epoch': 1.69} {'loss': 0.2705, 'learning_rate': 1.2267622033533555e-06, 'epoch': 1.69} {'loss': 0.3809, 'learning_rate': 1.226600972987363e-06, 'epoch': 1.69} {'loss': 0.303, 'learning_rate': 1.2264397525248684e-06, 'epoch': 1.69} {'loss': 0.2565, 'learning_rate': 1.2262785419660527e-06, 'epoch': 1.69} {'loss': 0.3185, 'learning_rate': 1.2261173413111039e-06, 'epoch': 1.69} {'loss': 0.3862, 'learning_rate': 1.2259561505601968e-06, 'epoch': 1.69} {'loss': 0.2291, 'learning_rate': 1.2257949697135186e-06, 'epoch': 1.69} {'loss': 0.3746, 'learning_rate': 1.2256337987712474e-06, 'epoch': 1.69} {'loss': 0.4106, 'learning_rate': 1.2254726377335702e-06, 'epoch': 1.69} {'loss': 0.3222, 'learning_rate': 1.2253114866006631e-06, 'epoch': 1.69} {'loss': 0.3043, 'learning_rate': 1.2251503453727133e-06, 'epoch': 1.69} {'loss': 0.2158, 'learning_rate': 1.2249892140498976e-06, 'epoch': 1.69} {'loss': 0.3836, 'learning_rate': 1.224828092632402e-06, 'epoch': 1.69} {'loss': 0.296, 'learning_rate': 1.2246669811204048e-06, 'epoch': 1.69} {'loss': 0.3477, 'learning_rate': 1.224505879514093e-06, 'epoch': 1.69} {'loss': 0.2738, 'learning_rate': 1.224344787813645e-06, 'epoch': 1.69} {'loss': 0.3861, 'learning_rate': 1.2241837060192408e-06, 'epoch': 1.69} {'loss': 0.2576, 'learning_rate': 1.2240226341310656e-06, 'epoch': 1.69} {'loss': 0.3478, 'learning_rate': 1.2238615721492986e-06, 'epoch': 1.69} {'loss': 0.3721, 'learning_rate': 1.2237005200741258e-06, 'epoch': 1.69} {'loss': 0.3767, 'learning_rate': 1.223539477905723e-06, 'epoch': 1.69} {'loss': 0.213, 'learning_rate': 1.2233784456442777e-06, 'epoch': 1.69} {'loss': 0.4084, 'learning_rate': 1.2232174232899673e-06, 'epoch': 1.69} {'loss': 0.2151, 'learning_rate': 1.2230564108429776e-06, 'epoch': 1.69} {'loss': 0.2356, 'learning_rate': 1.222895408303486e-06, 'epoch': 1.69} {'loss': 0.4057, 'learning_rate': 1.222734415671678e-06, 'epoch': 1.69} {'loss': 0.2811, 'learning_rate': 1.2225734329477324e-06, 'epoch': 1.69} {'loss': 0.428, 'learning_rate': 1.2224124601318344e-06, 'epoch': 1.69} {'loss': 0.274, 'learning_rate': 1.2222514972241629e-06, 'epoch': 1.69} {'loss': 0.3717, 'learning_rate': 1.2220905442248986e-06, 'epoch': 1.69} {'loss': 0.305, 'learning_rate': 1.2219296011342274e-06, 'epoch': 1.69} {'loss': 0.2229, 'learning_rate': 1.2217686679523255e-06, 'epoch': 1.69} {'loss': 0.225, 'learning_rate': 1.2216077446793806e-06, 'epoch': 1.69} {'loss': 0.3019, 'learning_rate': 1.221446831315568e-06, 'epoch': 1.69} {'loss': 0.3014, 'learning_rate': 1.2212859278610756e-06, 'epoch': 1.69} {'loss': 0.2709, 'learning_rate': 1.2211250343160797e-06, 'epoch': 1.69} {'loss': 0.3181, 'learning_rate': 1.2209641506807667e-06, 'epoch': 1.69} {'loss': 0.251, 'learning_rate': 1.2208032769553135e-06, 'epoch': 1.69} {'loss': 0.3765, 'learning_rate': 1.2206424131399053e-06, 'epoch': 1.69} {'loss': 0.4133, 'learning_rate': 1.2204815592347208e-06, 'epoch': 1.69} {'loss': 0.1853, 'learning_rate': 1.2203207152399454e-06, 'epoch': 1.69} {'loss': 0.179, 'learning_rate': 1.220159881155758e-06, 'epoch': 1.69} {'loss': 0.2731, 'learning_rate': 1.2199990569823383e-06, 'epoch': 1.69} {'loss': 0.2936, 'learning_rate': 1.219838242719873e-06, 'epoch': 1.69} {'loss': 0.3884, 'learning_rate': 1.2196774383685384e-06, 'epoch': 1.69} {'loss': 0.2521, 'learning_rate': 1.21951664392852e-06, 'epoch': 1.69} {'loss': 0.2064, 'learning_rate': 1.2193558593999954e-06, 'epoch': 1.69} {'loss': 0.3256, 'learning_rate': 1.2191950847831502e-06, 'epoch': 1.69} {'loss': 0.2799, 'learning_rate': 1.219034320078163e-06, 'epoch': 1.69} {'loss': 0.2878, 'learning_rate': 1.218873565285218e-06, 'epoch': 1.69} {'loss': 0.3761, 'learning_rate': 1.2187128204044917e-06, 'epoch': 1.69} {'loss': 0.1432, 'learning_rate': 1.218552085436172e-06, 'epoch': 1.69} {'loss': 0.2312, 'learning_rate': 1.2183913603804354e-06, 'epoch': 1.69} {'loss': 0.3258, 'learning_rate': 1.2182306452374658e-06, 'epoch': 1.69} {'loss': 0.2069, 'learning_rate': 1.2180699400074446e-06, 'epoch': 1.69} {'loss': 0.2675, 'learning_rate': 1.2179092446905505e-06, 'epoch': 1.69} {'loss': 0.2902, 'learning_rate': 1.2177485592869687e-06, 'epoch': 1.69} {'loss': 0.1853, 'learning_rate': 1.217587883796877e-06, 'epoch': 1.69} {'loss': 0.3509, 'learning_rate': 1.2174272182204605e-06, 'epoch': 1.69} {'loss': 0.2937, 'learning_rate': 1.217266562557895e-06, 'epoch': 1.69} {'loss': 0.2532, 'learning_rate': 1.217105916809369e-06, 'epoch': 1.69} {'loss': 0.3294, 'learning_rate': 1.2169452809750604e-06, 'epoch': 1.69} {'loss': 0.238, 'learning_rate': 1.2167846550551476e-06, 'epoch': 1.69} {'loss': 0.2595, 'learning_rate': 1.2166240390498174e-06, 'epoch': 1.69} {'loss': 0.3092, 'learning_rate': 1.2164634329592462e-06, 'epoch': 1.69} {'loss': 0.2171, 'learning_rate': 1.2163028367836194e-06, 'epoch': 1.69} {'loss': 0.2641, 'learning_rate': 1.2161422505231147e-06, 'epoch': 1.69} {'loss': 0.2545, 'learning_rate': 1.2159816741779173e-06, 'epoch': 1.69} {'loss': 0.2684, 'learning_rate': 1.215821107748204e-06, 'epoch': 1.69} {'loss': 0.3767, 'learning_rate': 1.2156605512341601e-06, 'epoch': 1.69} {'loss': 0.2875, 'learning_rate': 1.2155000046359632e-06, 'epoch': 1.69} {'loss': 0.3007, 'learning_rate': 1.2153394679537989e-06, 'epoch': 1.69} {'loss': 0.4166, 'learning_rate': 1.2151789411878422e-06, 'epoch': 1.69} {'loss': 0.2987, 'learning_rate': 1.2150184243382812e-06, 'epoch': 1.69} {'loss': 0.2904, 'learning_rate': 1.2148579174052944e-06, 'epoch': 1.69} {'loss': 0.3887, 'learning_rate': 1.2146974203890593e-06, 'epoch': 1.69} {'loss': 0.2923, 'learning_rate': 1.2145369332897628e-06, 'epoch': 1.69} {'loss': 0.2993, 'learning_rate': 1.2143764561075811e-06, 'epoch': 1.69} {'loss': 0.2357, 'learning_rate': 1.2142159888427007e-06, 'epoch': 1.69} {'loss': 0.4272, 'learning_rate': 1.2140555314952963e-06, 'epoch': 1.69} {'loss': 0.3608, 'learning_rate': 1.213895084065555e-06, 'epoch': 1.69} {'loss': 0.4076, 'learning_rate': 1.2137346465536538e-06, 'epoch': 1.69} {'loss': 0.244, 'learning_rate': 1.2135742189597777e-06, 'epoch': 1.69} {'loss': 0.3748, 'learning_rate': 1.2134138012841023e-06, 'epoch': 1.69} {'loss': 0.3238, 'learning_rate': 1.2132533935268154e-06, 'epoch': 1.69} {'loss': 0.3209, 'learning_rate': 1.213092995688091e-06, 'epoch': 1.69} {'loss': 0.283, 'learning_rate': 1.2129326077681169e-06, 'epoch': 1.69} {'loss': 0.3698, 'learning_rate': 1.2127722297670686e-06, 'epoch': 1.69} {'loss': 0.2995, 'learning_rate': 1.2126118616851313e-06, 'epoch': 1.69} {'loss': 0.1915, 'learning_rate': 1.2124515035224838e-06, 'epoch': 1.69} {'loss': 0.3735, 'learning_rate': 1.212291155279306e-06, 'epoch': 1.69} {'loss': 0.3633, 'learning_rate': 1.2121308169557822e-06, 'epoch': 1.69} {'loss': 0.3698, 'learning_rate': 1.21197048855209e-06, 'epoch': 1.69} {'loss': 0.3725, 'learning_rate': 1.2118101700684138e-06, 'epoch': 1.69} {'loss': 0.4207, 'learning_rate': 1.211649861504931e-06, 'epoch': 1.69} {'loss': 0.4209, 'learning_rate': 1.2114895628618262e-06, 'epoch': 1.69} {'loss': 0.4031, 'learning_rate': 1.2113292741392758e-06, 'epoch': 1.69} {'loss': 0.2647, 'learning_rate': 1.2111689953374662e-06, 'epoch': 1.69} {'loss': 0.2271, 'learning_rate': 1.2110087264565728e-06, 'epoch': 1.69} {'loss': 0.3867, 'learning_rate': 1.2108484674967824e-06, 'epoch': 1.69} {'loss': 0.3946, 'learning_rate': 1.2106882184582691e-06, 'epoch': 1.69} {'loss': 0.2917, 'learning_rate': 1.2105279793412205e-06, 'epoch': 1.69} {'loss': 0.3212, 'learning_rate': 1.2103677501458144e-06, 'epoch': 1.69} {'loss': 0.2767, 'learning_rate': 1.2102075308722306e-06, 'epoch': 1.69} {'loss': 0.2619, 'learning_rate': 1.210047321520652e-06, 'epoch': 1.69} {'loss': 0.256, 'learning_rate': 1.2098871220912557e-06, 'epoch': 1.69} {'loss': 0.2531, 'learning_rate': 1.2097269325842286e-06, 'epoch': 1.69} {'loss': 0.3194, 'learning_rate': 1.2095667529997457e-06, 'epoch': 1.69} {'loss': 0.3313, 'learning_rate': 1.209406583337992e-06, 'epoch': 1.69} {'loss': 0.3222, 'learning_rate': 1.2092464235991453e-06, 'epoch': 1.69} {'loss': 0.3286, 'learning_rate': 1.2090862737833897e-06, 'epoch': 1.69} {'loss': 0.2282, 'learning_rate': 1.208926133890902e-06, 'epoch': 1.69} {'loss': 0.3334, 'learning_rate': 1.2087660039218675e-06, 'epoch': 1.69} {'loss': 0.3159, 'learning_rate': 1.2086058838764614e-06, 'epoch': 1.69} {'loss': 0.2708, 'learning_rate': 1.2084457737548705e-06, 'epoch': 1.69} {'loss': 0.248, 'learning_rate': 1.2082856735572712e-06, 'epoch': 1.69} {'loss': 0.4163, 'learning_rate': 1.2081255832838446e-06, 'epoch': 1.69} {'loss': 0.3169, 'learning_rate': 1.2079655029347736e-06, 'epoch': 1.69} {'loss': 0.2532, 'learning_rate': 1.2078054325102362e-06, 'epoch': 1.69} {'loss': 0.2854, 'learning_rate': 1.2076453720104176e-06, 'epoch': 1.69} {'loss': 0.2623, 'learning_rate': 1.207485321435492e-06, 'epoch': 1.69} {'loss': 0.3168, 'learning_rate': 1.2073252807856462e-06, 'epoch': 1.69} {'loss': 0.2881, 'learning_rate': 1.2071652500610554e-06, 'epoch': 1.69} {'loss': 0.3484, 'learning_rate': 1.207005229261905e-06, 'epoch': 1.69} {'loss': 0.3677, 'learning_rate': 1.2068452183883728e-06, 'epoch': 1.69} {'loss': 0.2981, 'learning_rate': 1.2066852174406408e-06, 'epoch': 1.69} {'loss': 0.2716, 'learning_rate': 1.2065252264188877e-06, 'epoch': 1.69} {'loss': 0.1471, 'learning_rate': 1.2063652453232977e-06, 'epoch': 1.69} {'loss': 0.3753, 'learning_rate': 1.2062052741540487e-06, 'epoch': 1.69} {'loss': 0.2547, 'learning_rate': 1.2060453129113202e-06, 'epoch': 1.69} {'loss': 0.273, 'learning_rate': 1.205885361595296e-06, 'epoch': 1.69} {'loss': 0.3002, 'learning_rate': 1.205725420206153e-06, 'epoch': 1.69} {'loss': 0.3979, 'learning_rate': 1.205565488744076e-06, 'epoch': 1.69} {'loss': 0.3895, 'learning_rate': 1.2054055672092414e-06, 'epoch': 1.69} {'loss': 0.2457, 'learning_rate': 1.2052456556018322e-06, 'epoch': 1.69} {'loss': 0.3686, 'learning_rate': 1.2050857539220273e-06, 'epoch': 1.69} {'loss': 0.3572, 'learning_rate': 1.20492586217001e-06, 'epoch': 1.69} {'loss': 0.3605, 'learning_rate': 1.2047659803459576e-06, 'epoch': 1.69} {'loss': 0.349, 'learning_rate': 1.2046061084500527e-06, 'epoch': 1.69} {'loss': 0.335, 'learning_rate': 1.2044462464824735e-06, 'epoch': 1.69} {'loss': 0.4071, 'learning_rate': 1.2042863944434046e-06, 'epoch': 1.69} {'loss': 0.2707, 'learning_rate': 1.2041265523330227e-06, 'epoch': 1.69} {'loss': 0.2345, 'learning_rate': 1.2039667201515082e-06, 'epoch': 1.69} {'loss': 0.2784, 'learning_rate': 1.2038068978990437e-06, 'epoch': 1.69} {'loss': 0.2834, 'learning_rate': 1.2036470855758075e-06, 'epoch': 1.69} {'loss': 0.1619, 'learning_rate': 1.2034872831819822e-06, 'epoch': 1.69} {'loss': 0.3203, 'learning_rate': 1.203327490717746e-06, 'epoch': 1.69} {'loss': 0.3207, 'learning_rate': 1.2031677081832816e-06, 'epoch': 1.69} {'loss': 0.3619, 'learning_rate': 1.203007935578766e-06, 'epoch': 1.69} {'loss': 0.3746, 'learning_rate': 1.2028481729043838e-06, 'epoch': 1.69} {'loss': 0.4036, 'learning_rate': 1.2026884201603106e-06, 'epoch': 1.69} {'loss': 0.2611, 'learning_rate': 1.2025286773467326e-06, 'epoch': 1.69} {'loss': 0.1811, 'learning_rate': 1.2023689444638241e-06, 'epoch': 1.69} {'loss': 0.2805, 'learning_rate': 1.2022092215117697e-06, 'epoch': 1.69} {'loss': 0.2585, 'learning_rate': 1.202049508490749e-06, 'epoch': 1.69} {'loss': 0.3547, 'learning_rate': 1.2018898054009387e-06, 'epoch': 1.69} {'loss': 0.3124, 'learning_rate': 1.201730112242524e-06, 'epoch': 1.69} {'loss': 0.2689, 'learning_rate': 1.2015704290156805e-06, 'epoch': 1.69} {'loss': 0.2413, 'learning_rate': 1.2014107557205913e-06, 'epoch': 1.69} {'loss': 0.3105, 'learning_rate': 1.2012510923574361e-06, 'epoch': 1.69} {'loss': 0.2593, 'learning_rate': 1.2010914389263973e-06, 'epoch': 1.69} {'loss': 0.3382, 'learning_rate': 1.2009317954276534e-06, 'epoch': 1.69} {'loss': 0.3225, 'learning_rate': 1.200772161861382e-06, 'epoch': 1.69} {'loss': 0.3452, 'learning_rate': 1.2006125382277677e-06, 'epoch': 1.69} {'loss': 0.2074, 'learning_rate': 1.2004529245269859e-06, 'epoch': 1.69} {'loss': 0.2993, 'learning_rate': 1.2002933207592226e-06, 'epoch': 1.69} {'loss': 0.3261, 'learning_rate': 1.2001337269246516e-06, 'epoch': 1.69} {'loss': 0.3638, 'learning_rate': 1.199974143023459e-06, 'epoch': 1.69} {'loss': 0.432, 'learning_rate': 1.1998145690558205e-06, 'epoch': 1.69} {'loss': 0.3439, 'learning_rate': 1.1996550050219192e-06, 'epoch': 1.69} {'loss': 0.2975, 'learning_rate': 1.1994954509219313e-06, 'epoch': 1.69} {'loss': 0.3184, 'learning_rate': 1.1993359067560429e-06, 'epoch': 1.69} {'loss': 0.2919, 'learning_rate': 1.1991763725244287e-06, 'epoch': 1.69} {'loss': 0.3034, 'learning_rate': 1.1990168482272723e-06, 'epoch': 1.69} {'loss': 0.2389, 'learning_rate': 1.1988573338647524e-06, 'epoch': 1.69} {'loss': 0.259, 'learning_rate': 1.1986978294370467e-06, 'epoch': 1.69} {'loss': 0.2954, 'learning_rate': 1.1985383349443403e-06, 'epoch': 1.69} {'loss': 0.3635, 'learning_rate': 1.1983788503868077e-06, 'epoch': 1.69} {'loss': 0.3889, 'learning_rate': 1.1982193757646333e-06, 'epoch': 1.69} {'loss': 0.2823, 'learning_rate': 1.1980599110779945e-06, 'epoch': 1.69} {'loss': 0.2468, 'learning_rate': 1.1979004563270735e-06, 'epoch': 1.69} {'loss': 0.23, 'learning_rate': 1.197741011512048e-06, 'epoch': 1.7} {'loss': 0.3794, 'learning_rate': 1.1975815766331e-06, 'epoch': 1.7} {'loss': 0.4103, 'learning_rate': 1.1974221516904072e-06, 'epoch': 1.7} {'loss': 0.3603, 'learning_rate': 1.1972627366841526e-06, 'epoch': 1.7} {'loss': 0.2689, 'learning_rate': 1.1971033316145131e-06, 'epoch': 1.7} {'loss': 0.2163, 'learning_rate': 1.1969439364816715e-06, 'epoch': 1.7} {'loss': 0.4042, 'learning_rate': 1.1967845512858055e-06, 'epoch': 1.7} {'loss': 0.317, 'learning_rate': 1.1966251760270953e-06, 'epoch': 1.7} {'loss': 0.1373, 'learning_rate': 1.1964658107057226e-06, 'epoch': 1.7} {'loss': 0.2758, 'learning_rate': 1.1963064553218629e-06, 'epoch': 1.7} {'loss': 0.4286, 'learning_rate': 1.1961471098757027e-06, 'epoch': 1.7} {'loss': 0.3809, 'learning_rate': 1.1959877743674153e-06, 'epoch': 1.7} {'loss': 0.2635, 'learning_rate': 1.195828448797185e-06, 'epoch': 1.7} {'loss': 0.3041, 'learning_rate': 1.1956691331651892e-06, 'epoch': 1.7} {'loss': 0.3726, 'learning_rate': 1.1955098274716104e-06, 'epoch': 1.7} {'loss': 0.4096, 'learning_rate': 1.1953505317166246e-06, 'epoch': 1.7} {'loss': 0.2764, 'learning_rate': 1.1951912459004167e-06, 'epoch': 1.7} {'loss': 0.3255, 'learning_rate': 1.1950319700231606e-06, 'epoch': 1.7} {'loss': 0.279, 'learning_rate': 1.1948727040850415e-06, 'epoch': 1.7} {'loss': 0.3053, 'learning_rate': 1.1947134480862365e-06, 'epoch': 1.7} {'loss': 0.4484, 'learning_rate': 1.194554202026924e-06, 'epoch': 1.7} {'loss': 0.3138, 'learning_rate': 1.1943949659072873e-06, 'epoch': 1.7} {'loss': 0.1613, 'learning_rate': 1.1942357397275016e-06, 'epoch': 1.7} {'loss': 0.3912, 'learning_rate': 1.1940765234877516e-06, 'epoch': 1.7} {'loss': 0.3961, 'learning_rate': 1.1939173171882124e-06, 'epoch': 1.7} {'loss': 0.3596, 'learning_rate': 1.1937581208290683e-06, 'epoch': 1.7} {'loss': 0.2919, 'learning_rate': 1.1935989344104949e-06, 'epoch': 1.7} {'loss': 0.3094, 'learning_rate': 1.1934397579326762e-06, 'epoch': 1.7} {'loss': 0.4003, 'learning_rate': 1.1932805913957858e-06, 'epoch': 1.7} {'loss': 0.4654, 'learning_rate': 1.1931214348000098e-06, 'epoch': 1.7} {'loss': 0.2316, 'learning_rate': 1.192962288145524e-06, 'epoch': 1.7} {'loss': 0.3029, 'learning_rate': 1.19280315143251e-06, 'epoch': 1.7} {'loss': 0.3684, 'learning_rate': 1.192644024661146e-06, 'epoch': 1.7} {'loss': 0.2769, 'learning_rate': 1.1924849078316104e-06, 'epoch': 1.7} {'loss': 0.2936, 'learning_rate': 1.1923258009440875e-06, 'epoch': 1.7} {'loss': 0.2602, 'learning_rate': 1.1921667039987505e-06, 'epoch': 1.7} {'loss': 0.1956, 'learning_rate': 1.1920076169957851e-06, 'epoch': 1.7} {'loss': 0.3313, 'learning_rate': 1.1918485399353664e-06, 'epoch': 1.7} {'loss': 0.217, 'learning_rate': 1.1916894728176776e-06, 'epoch': 1.7} {'loss': 0.2611, 'learning_rate': 1.1915304156428942e-06, 'epoch': 1.7} {'loss': 0.3468, 'learning_rate': 1.1913713684112004e-06, 'epoch': 1.7} {'loss': 0.3329, 'learning_rate': 1.1912123311227707e-06, 'epoch': 1.7} {'loss': 0.2875, 'learning_rate': 1.1910533037777893e-06, 'epoch': 1.7} {'loss': 0.2827, 'learning_rate': 1.1908942863764317e-06, 'epoch': 1.7} {'loss': 0.3502, 'learning_rate': 1.190735278918882e-06, 'epoch': 1.7} {'loss': 0.2742, 'learning_rate': 1.1905762814053158e-06, 'epoch': 1.7} {'loss': 0.3712, 'learning_rate': 1.1904172938359127e-06, 'epoch': 1.7} {'loss': 0.2631, 'learning_rate': 1.190258316210855e-06, 'epoch': 1.7} {'loss': 0.3291, 'learning_rate': 1.190099348530318e-06, 'epoch': 1.7} {'loss': 0.3132, 'learning_rate': 1.1899403907944862e-06, 'epoch': 1.7} {'loss': 0.3707, 'learning_rate': 1.1897814430035338e-06, 'epoch': 1.7} {'loss': 0.2451, 'learning_rate': 1.189622505157646e-06, 'epoch': 1.7} {'loss': 0.3251, 'learning_rate': 1.1894635772569952e-06, 'epoch': 1.7} {'loss': 0.3863, 'learning_rate': 1.1893046593017676e-06, 'epoch': 1.7} {'loss': 0.213, 'learning_rate': 1.1891457512921379e-06, 'epoch': 1.7} {'loss': 0.1842, 'learning_rate': 1.188986853228289e-06, 'epoch': 1.7} {'loss': 0.3671, 'learning_rate': 1.1888279651103962e-06, 'epoch': 1.7} {'loss': 0.3053, 'learning_rate': 1.188669086938643e-06, 'epoch': 1.7} {'loss': 0.3427, 'learning_rate': 1.188510218713207e-06, 'epoch': 1.7} {'loss': 0.3186, 'learning_rate': 1.1883513604342656e-06, 'epoch': 1.7} {'loss': 0.2668, 'learning_rate': 1.188192512102002e-06, 'epoch': 1.7} {'loss': 0.3269, 'learning_rate': 1.1880336737165909e-06, 'epoch': 1.7} {'loss': 0.3062, 'learning_rate': 1.1878748452782162e-06, 'epoch': 1.7} {'loss': 0.2055, 'learning_rate': 1.1877160267870535e-06, 'epoch': 1.7} {'loss': 0.3691, 'learning_rate': 1.187557218243286e-06, 'epoch': 1.7} {'loss': 0.4263, 'learning_rate': 1.1873984196470878e-06, 'epoch': 1.7} {'loss': 0.1879, 'learning_rate': 1.1872396309986434e-06, 'epoch': 1.7} {'loss': 0.3035, 'learning_rate': 1.187080852298127e-06, 'epoch': 1.7} {'loss': 0.3218, 'learning_rate': 1.186922083545723e-06, 'epoch': 1.7} {'loss': 0.1958, 'learning_rate': 1.1867633247416065e-06, 'epoch': 1.7} {'loss': 0.3228, 'learning_rate': 1.1866045758859602e-06, 'epoch': 1.7} {'loss': 0.3903, 'learning_rate': 1.1864458369789588e-06, 'epoch': 1.7} {'loss': 0.4302, 'learning_rate': 1.186287108020786e-06, 'epoch': 1.7} {'loss': 0.2395, 'learning_rate': 1.1861283890116193e-06, 'epoch': 1.7} {'loss': 0.1652, 'learning_rate': 1.1859696799516362e-06, 'epoch': 1.7} {'loss': 0.2887, 'learning_rate': 1.185810980841019e-06, 'epoch': 1.7} {'loss': 0.2887, 'learning_rate': 1.1856522916799406e-06, 'epoch': 1.7} {'loss': 0.2829, 'learning_rate': 1.185493612468589e-06, 'epoch': 1.7} {'loss': 0.4406, 'learning_rate': 1.185334943207136e-06, 'epoch': 1.7} {'loss': 0.2591, 'learning_rate': 1.185176283895767e-06, 'epoch': 1.7} {'loss': 0.26, 'learning_rate': 1.1850176345346575e-06, 'epoch': 1.7} {'loss': 0.496, 'learning_rate': 1.1848589951239841e-06, 'epoch': 1.7} {'loss': 0.3946, 'learning_rate': 1.1847003656639311e-06, 'epoch': 1.7} {'loss': 0.3658, 'learning_rate': 1.1845417461546738e-06, 'epoch': 1.7} {'loss': 0.2505, 'learning_rate': 1.1843831365963932e-06, 'epoch': 1.7} {'loss': 0.2983, 'learning_rate': 1.1842245369892668e-06, 'epoch': 1.7} {'loss': 0.3591, 'learning_rate': 1.1840659473334759e-06, 'epoch': 1.7} {'loss': 0.2784, 'learning_rate': 1.1839073676291957e-06, 'epoch': 1.7} {'loss': 0.3526, 'learning_rate': 1.1837487978766104e-06, 'epoch': 1.7} {'loss': 0.2808, 'learning_rate': 1.1835902380758945e-06, 'epoch': 1.7} {'loss': 0.4435, 'learning_rate': 1.18343168822723e-06, 'epoch': 1.7} {'loss': 0.3272, 'learning_rate': 1.1832731483307924e-06, 'epoch': 1.7} {'loss': 0.3314, 'learning_rate': 1.1831146183867659e-06, 'epoch': 1.7} {'loss': 0.2317, 'learning_rate': 1.1829560983953259e-06, 'epoch': 1.7} {'loss': 0.4097, 'learning_rate': 1.182797588356649e-06, 'epoch': 1.7} {'loss': 0.217, 'learning_rate': 1.1826390882709193e-06, 'epoch': 1.7} {'loss': 0.3429, 'learning_rate': 1.1824805981383125e-06, 'epoch': 1.7} {'loss': 0.4472, 'learning_rate': 1.1823221179590094e-06, 'epoch': 1.7} {'loss': 0.3009, 'learning_rate': 1.1821636477331854e-06, 'epoch': 1.7} {'loss': 0.1848, 'learning_rate': 1.182005187461025e-06, 'epoch': 1.7} {'loss': 0.312, 'learning_rate': 1.1818467371427012e-06, 'epoch': 1.7} {'loss': 0.3682, 'learning_rate': 1.1816882967783982e-06, 'epoch': 1.7} {'loss': 0.2474, 'learning_rate': 1.1815298663682895e-06, 'epoch': 1.7} {'loss': 0.2594, 'learning_rate': 1.181371445912559e-06, 'epoch': 1.7} {'loss': 0.3331, 'learning_rate': 1.1812130354113804e-06, 'epoch': 1.7} {'loss': 0.302, 'learning_rate': 1.1810546348649388e-06, 'epoch': 1.7} {'loss': 0.337, 'learning_rate': 1.1808962442734084e-06, 'epoch': 1.7} {'loss': 0.3515, 'learning_rate': 1.1807378636369681e-06, 'epoch': 1.7} {'loss': 0.2853, 'learning_rate': 1.180579492955799e-06, 'epoch': 1.7} {'loss': 0.3969, 'learning_rate': 1.1804211322300763e-06, 'epoch': 1.7} {'loss': 0.3094, 'learning_rate': 1.1802627814599833e-06, 'epoch': 1.7} {'loss': 0.3277, 'learning_rate': 1.1801044406456953e-06, 'epoch': 1.7} {'loss': 0.3249, 'learning_rate': 1.1799461097873931e-06, 'epoch': 1.7} {'loss': 0.2461, 'learning_rate': 1.1797877888852526e-06, 'epoch': 1.7} {'loss': 0.2857, 'learning_rate': 1.1796294779394567e-06, 'epoch': 1.7} {'loss': 0.3297, 'learning_rate': 1.17947117695018e-06, 'epoch': 1.7} {'loss': 0.1797, 'learning_rate': 1.1793128859176051e-06, 'epoch': 1.7} {'loss': 0.3593, 'learning_rate': 1.1791546048419066e-06, 'epoch': 1.7} {'loss': 0.4524, 'learning_rate': 1.1789963337232668e-06, 'epoch': 1.7} {'loss': 0.3586, 'learning_rate': 1.178838072561863e-06, 'epoch': 1.7} {'loss': 0.3043, 'learning_rate': 1.178679821357872e-06, 'epoch': 1.7} {'loss': 0.4067, 'learning_rate': 1.1785215801114746e-06, 'epoch': 1.7} {'loss': 0.3228, 'learning_rate': 1.1783633488228485e-06, 'epoch': 1.7} {'loss': 0.2915, 'learning_rate': 1.1782051274921734e-06, 'epoch': 1.7} {'loss': 0.449, 'learning_rate': 1.1780469161196262e-06, 'epoch': 1.7} {'loss': 0.2372, 'learning_rate': 1.1778887147053886e-06, 'epoch': 1.7} {'loss': 0.2295, 'learning_rate': 1.1777305232496338e-06, 'epoch': 1.7} {'loss': 0.2951, 'learning_rate': 1.1775723417525465e-06, 'epoch': 1.7} {'loss': 0.2605, 'learning_rate': 1.1774141702143005e-06, 'epoch': 1.7} {'loss': 0.2926, 'learning_rate': 1.1772560086350782e-06, 'epoch': 1.7} {'loss': 0.28, 'learning_rate': 1.1770978570150538e-06, 'epoch': 1.7} {'loss': 0.1348, 'learning_rate': 1.1769397153544093e-06, 'epoch': 1.7} {'loss': 0.2141, 'learning_rate': 1.1767815836533236e-06, 'epoch': 1.7} {'loss': 0.3098, 'learning_rate': 1.176623461911971e-06, 'epoch': 1.7} {'loss': 0.2187, 'learning_rate': 1.1764653501305345e-06, 'epoch': 1.7} {'loss': 0.3929, 'learning_rate': 1.1763072483091887e-06, 'epoch': 1.7} {'loss': 0.1192, 'learning_rate': 1.1761491564481165e-06, 'epoch': 1.7} {'loss': 0.3461, 'learning_rate': 1.1759910745474923e-06, 'epoch': 1.7} {'loss': 0.4389, 'learning_rate': 1.1758330026074983e-06, 'epoch': 1.7} {'loss': 0.1901, 'learning_rate': 1.1756749406283074e-06, 'epoch': 1.7} {'loss': 0.3836, 'learning_rate': 1.1755168886101044e-06, 'epoch': 1.7} {'loss': 0.3188, 'learning_rate': 1.175358846553063e-06, 'epoch': 1.7} {'loss': 0.3848, 'learning_rate': 1.1752008144573656e-06, 'epoch': 1.7} {'loss': 0.2832, 'learning_rate': 1.1750427923231856e-06, 'epoch': 1.7} {'loss': 0.4281, 'learning_rate': 1.1748847801507069e-06, 'epoch': 1.7} {'loss': 0.2593, 'learning_rate': 1.1747267779401039e-06, 'epoch': 1.7} {'loss': 0.2985, 'learning_rate': 1.1745687856915555e-06, 'epoch': 1.7} {'loss': 0.4266, 'learning_rate': 1.1744108034052416e-06, 'epoch': 1.7} {'loss': 0.2785, 'learning_rate': 1.1742528310813383e-06, 'epoch': 1.7} {'loss': 0.2896, 'learning_rate': 1.174094868720027e-06, 'epoch': 1.7} {'loss': 0.2335, 'learning_rate': 1.173936916321483e-06, 'epoch': 1.7} {'loss': 0.1822, 'learning_rate': 1.1737789738858874e-06, 'epoch': 1.7} {'loss': 0.2661, 'learning_rate': 1.1736210414134142e-06, 'epoch': 1.7} {'loss': 0.2481, 'learning_rate': 1.1734631189042478e-06, 'epoch': 1.7} {'loss': 0.308, 'learning_rate': 1.1733052063585604e-06, 'epoch': 1.7} {'loss': 0.2717, 'learning_rate': 1.173147303776535e-06, 'epoch': 1.7} {'loss': 0.3649, 'learning_rate': 1.172989411158345e-06, 'epoch': 1.7} {'loss': 0.2925, 'learning_rate': 1.1728315285041748e-06, 'epoch': 1.7} {'loss': 0.3681, 'learning_rate': 1.1726736558141982e-06, 'epoch': 1.7} {'loss': 0.3053, 'learning_rate': 1.1725157930885933e-06, 'epoch': 1.7} {'loss': 0.3435, 'learning_rate': 1.172357940327541e-06, 'epoch': 1.7} {'loss': 0.348, 'learning_rate': 1.1722000975312152e-06, 'epoch': 1.7} {'loss': 0.1932, 'learning_rate': 1.1720422646997997e-06, 'epoch': 1.7} {'loss': 0.1984, 'learning_rate': 1.1718844418334674e-06, 'epoch': 1.7} {'loss': 0.4054, 'learning_rate': 1.1717266289324013e-06, 'epoch': 1.7} {'loss': 0.3404, 'learning_rate': 1.171568825996775e-06, 'epoch': 1.7} {'loss': 0.2634, 'learning_rate': 1.1714110330267703e-06, 'epoch': 1.7} {'loss': 0.2554, 'learning_rate': 1.1712532500225615e-06, 'epoch': 1.7} {'loss': 0.2492, 'learning_rate': 1.171095476984332e-06, 'epoch': 1.7} {'loss': 0.386, 'learning_rate': 1.1709377139122536e-06, 'epoch': 1.7} {'loss': 0.3963, 'learning_rate': 1.1707799608065096e-06, 'epoch': 1.7} {'loss': 0.273, 'learning_rate': 1.1706222176672776e-06, 'epoch': 1.7} {'loss': 0.2894, 'learning_rate': 1.170464484494731e-06, 'epoch': 1.7} {'loss': 0.1936, 'learning_rate': 1.1703067612890529e-06, 'epoch': 1.7} {'loss': 0.1815, 'learning_rate': 1.1701490480504174e-06, 'epoch': 1.7} {'loss': 0.3923, 'learning_rate': 1.1699913447790045e-06, 'epoch': 1.7} {'loss': 0.3111, 'learning_rate': 1.169833651474993e-06, 'epoch': 1.7} {'loss': 0.4845, 'learning_rate': 1.1696759681385617e-06, 'epoch': 1.7} {'loss': 0.3159, 'learning_rate': 1.169518294769887e-06, 'epoch': 1.7} {'loss': 0.283, 'learning_rate': 1.1693606313691452e-06, 'epoch': 1.7} {'loss': 0.3476, 'learning_rate': 1.1692029779365178e-06, 'epoch': 1.7} {'loss': 0.2868, 'learning_rate': 1.1690453344721786e-06, 'epoch': 1.7} {'loss': 0.2596, 'learning_rate': 1.16888770097631e-06, 'epoch': 1.7} {'loss': 0.3647, 'learning_rate': 1.1687300774490861e-06, 'epoch': 1.7} {'loss': 0.2153, 'learning_rate': 1.1685724638906893e-06, 'epoch': 1.7} {'loss': 0.2392, 'learning_rate': 1.1684148603012924e-06, 'epoch': 1.7} {'loss': 0.3451, 'learning_rate': 1.1682572666810777e-06, 'epoch': 1.7} {'loss': 0.2971, 'learning_rate': 1.1680996830302182e-06, 'epoch': 1.7} {'loss': 0.2557, 'learning_rate': 1.1679421093488984e-06, 'epoch': 1.7} {'loss': 0.3543, 'learning_rate': 1.1677845456372894e-06, 'epoch': 1.7} {'loss': 0.2112, 'learning_rate': 1.167626991895574e-06, 'epoch': 1.7} {'loss': 0.2128, 'learning_rate': 1.1674694481239268e-06, 'epoch': 1.7} {'loss': 0.2951, 'learning_rate': 1.1673119143225286e-06, 'epoch': 1.7} {'loss': 0.2934, 'learning_rate': 1.167154390491556e-06, 'epoch': 1.7} {'loss': 0.3956, 'learning_rate': 1.1669968766311834e-06, 'epoch': 1.7} {'loss': 0.2894, 'learning_rate': 1.166839372741595e-06, 'epoch': 1.7} {'loss': 0.3592, 'learning_rate': 1.1666818788229627e-06, 'epoch': 1.7} {'loss': 0.2807, 'learning_rate': 1.1665243948754678e-06, 'epoch': 1.7} {'loss': 0.1574, 'learning_rate': 1.1663669208992867e-06, 'epoch': 1.7} {'loss': 0.2444, 'learning_rate': 1.166209456894599e-06, 'epoch': 1.7} {'loss': 0.2537, 'learning_rate': 1.1660520028615785e-06, 'epoch': 1.7} {'loss': 0.3487, 'learning_rate': 1.165894558800408e-06, 'epoch': 1.7} {'loss': 0.4627, 'learning_rate': 1.1657371247112602e-06, 'epoch': 1.7} {'loss': 0.4311, 'learning_rate': 1.165579700594318e-06, 'epoch': 1.7} {'loss': 0.3483, 'learning_rate': 1.1654222864497544e-06, 'epoch': 1.7} {'loss': 0.3048, 'learning_rate': 1.1652648822777501e-06, 'epoch': 1.7} {'loss': 0.2126, 'learning_rate': 1.165107488078483e-06, 'epoch': 1.7} {'loss': 0.4194, 'learning_rate': 1.164950103852126e-06, 'epoch': 1.7} {'loss': 0.2952, 'learning_rate': 1.1647927295988638e-06, 'epoch': 1.7} {'loss': 0.2336, 'learning_rate': 1.164635365318867e-06, 'epoch': 1.7} {'loss': 0.3454, 'learning_rate': 1.1644780110123199e-06, 'epoch': 1.7} {'loss': 0.2742, 'learning_rate': 1.164320666679395e-06, 'epoch': 1.7} {'loss': 0.4234, 'learning_rate': 1.1641633323202729e-06, 'epoch': 1.7} {'loss': 0.4135, 'learning_rate': 1.164006007935129e-06, 'epoch': 1.7} {'loss': 0.2611, 'learning_rate': 1.1638486935241433e-06, 'epoch': 1.7} {'loss': 0.3716, 'learning_rate': 1.1636913890874913e-06, 'epoch': 1.7} {'loss': 0.3255, 'learning_rate': 1.1635340946253525e-06, 'epoch': 1.7} {'loss': 0.2416, 'learning_rate': 1.1633768101379017e-06, 'epoch': 1.7} {'loss': 0.2758, 'learning_rate': 1.1632195356253206e-06, 'epoch': 1.7} {'loss': 0.3828, 'learning_rate': 1.1630622710877837e-06, 'epoch': 1.7} {'loss': 0.3457, 'learning_rate': 1.1629050165254674e-06, 'epoch': 1.7} {'loss': 0.251, 'learning_rate': 1.1627477719385526e-06, 'epoch': 1.7} {'loss': 0.4369, 'learning_rate': 1.1625905373272128e-06, 'epoch': 1.7} {'loss': 0.2883, 'learning_rate': 1.16243331269163e-06, 'epoch': 1.7} {'loss': 0.1998, 'learning_rate': 1.162276098031978e-06, 'epoch': 1.7} {'loss': 0.2076, 'learning_rate': 1.1621188933484373e-06, 'epoch': 1.7} {'loss': 0.3713, 'learning_rate': 1.1619616986411809e-06, 'epoch': 1.7} {'loss': 0.4188, 'learning_rate': 1.161804513910393e-06, 'epoch': 1.7} {'loss': 0.3015, 'learning_rate': 1.1616473391562432e-06, 'epoch': 1.7} {'loss': 0.2575, 'learning_rate': 1.1614901743789163e-06, 'epoch': 1.7} {'loss': 0.3698, 'learning_rate': 1.1613330195785832e-06, 'epoch': 1.7} {'loss': 0.3111, 'learning_rate': 1.161175874755427e-06, 'epoch': 1.7} {'loss': 0.3149, 'learning_rate': 1.1610187399096228e-06, 'epoch': 1.7} {'loss': 0.3774, 'learning_rate': 1.1608616150413443e-06, 'epoch': 1.7} {'loss': 0.3666, 'learning_rate': 1.1607045001507754e-06, 'epoch': 1.7} {'loss': 0.2568, 'learning_rate': 1.1605473952380885e-06, 'epoch': 1.7} {'loss': 0.2815, 'learning_rate': 1.1603903003034634e-06, 'epoch': 1.7} {'loss': 0.2306, 'learning_rate': 1.1602332153470764e-06, 'epoch': 1.7} {'loss': 0.2477, 'learning_rate': 1.1600761403691052e-06, 'epoch': 1.7} {'loss': 0.3859, 'learning_rate': 1.1599190753697264e-06, 'epoch': 1.7} {'loss': 0.3046, 'learning_rate': 1.15976202034912e-06, 'epoch': 1.7} {'loss': 0.288, 'learning_rate': 1.159604975307459e-06, 'epoch': 1.7} {'loss': 0.2859, 'learning_rate': 1.1594479402449244e-06, 'epoch': 1.7} {'loss': 0.274, 'learning_rate': 1.1592909151616904e-06, 'epoch': 1.7} {'loss': 0.5129, 'learning_rate': 1.159133900057937e-06, 'epoch': 1.7} {'loss': 0.1496, 'learning_rate': 1.158976894933841e-06, 'epoch': 1.7} {'loss': 0.3273, 'learning_rate': 1.1588198997895771e-06, 'epoch': 1.7} {'loss': 0.2293, 'learning_rate': 1.1586629146253258e-06, 'epoch': 1.7} {'loss': 0.3855, 'learning_rate': 1.1585059394412612e-06, 'epoch': 1.7} {'loss': 0.3389, 'learning_rate': 1.1583489742375641e-06, 'epoch': 1.7} {'loss': 0.3783, 'learning_rate': 1.158192019014408e-06, 'epoch': 1.7} {'loss': 0.3193, 'learning_rate': 1.1580350737719725e-06, 'epoch': 1.7} {'loss': 0.2745, 'learning_rate': 1.1578781385104331e-06, 'epoch': 1.7} {'loss': 0.331, 'learning_rate': 1.1577212132299698e-06, 'epoch': 1.7} {'loss': 0.2616, 'learning_rate': 1.1575642979307555e-06, 'epoch': 1.7} {'loss': 0.2999, 'learning_rate': 1.1574073926129726e-06, 'epoch': 1.7} {'loss': 0.23, 'learning_rate': 1.1572504972767918e-06, 'epoch': 1.7} {'loss': 0.4347, 'learning_rate': 1.1570936119223963e-06, 'epoch': 1.7} {'loss': 0.1792, 'learning_rate': 1.1569367365499607e-06, 'epoch': 1.7} {'loss': 0.2587, 'learning_rate': 1.15677987115966e-06, 'epoch': 1.7} {'loss': 0.106, 'learning_rate': 1.1566230157516744e-06, 'epoch': 1.7} {'loss': 0.1891, 'learning_rate': 1.1564661703261792e-06, 'epoch': 1.7} {'loss': 0.2986, 'learning_rate': 1.1563093348833531e-06, 'epoch': 1.7} {'loss': 0.4734, 'learning_rate': 1.1561525094233693e-06, 'epoch': 1.7} {'loss': 0.2989, 'learning_rate': 1.1559956939464113e-06, 'epoch': 1.7} {'loss': 0.3399, 'learning_rate': 1.1558388884526494e-06, 'epoch': 1.7} {'loss': 0.3042, 'learning_rate': 1.1556820929422651e-06, 'epoch': 1.7} {'loss': 0.2194, 'learning_rate': 1.1555253074154326e-06, 'epoch': 1.7} {'loss': 0.3624, 'learning_rate': 1.1553685318723328e-06, 'epoch': 1.7} {'loss': 0.2597, 'learning_rate': 1.1552117663131367e-06, 'epoch': 1.7} {'loss': 0.266, 'learning_rate': 1.1550550107380277e-06, 'epoch': 1.7} {'loss': 0.4501, 'learning_rate': 1.1548982651471797e-06, 'epoch': 1.7} {'loss': 0.2152, 'learning_rate': 1.154741529540766e-06, 'epoch': 1.7} {'loss': 0.2513, 'learning_rate': 1.1545848039189712e-06, 'epoch': 1.7} {'loss': 0.4235, 'learning_rate': 1.1544280882819647e-06, 'epoch': 1.7} {'loss': 0.3401, 'learning_rate': 1.1542713826299268e-06, 'epoch': 1.7} {'loss': 0.2897, 'learning_rate': 1.154114686963035e-06, 'epoch': 1.7} {'loss': 0.4463, 'learning_rate': 1.1539580012814677e-06, 'epoch': 1.7} {'loss': 0.1424, 'learning_rate': 1.1538013255853996e-06, 'epoch': 1.7} {'loss': 0.2026, 'learning_rate': 1.1536446598750051e-06, 'epoch': 1.7} {'loss': 0.2611, 'learning_rate': 1.1534880041504658e-06, 'epoch': 1.7} {'loss': 0.2512, 'learning_rate': 1.1533313584119543e-06, 'epoch': 1.7} {'loss': 0.3337, 'learning_rate': 1.1531747226596523e-06, 'epoch': 1.7} {'loss': 0.266, 'learning_rate': 1.1530180968937299e-06, 'epoch': 1.7} {'loss': 0.2027, 'learning_rate': 1.1528614811143712e-06, 'epoch': 1.7} {'loss': 0.2797, 'learning_rate': 1.1527048753217474e-06, 'epoch': 1.7} {'loss': 0.3557, 'learning_rate': 1.1525482795160392e-06, 'epoch': 1.7} {'loss': 0.3692, 'learning_rate': 1.1523916936974188e-06, 'epoch': 1.7} {'loss': 0.2354, 'learning_rate': 1.1522351178660696e-06, 'epoch': 1.7} {'loss': 0.2759, 'learning_rate': 1.1520785520221612e-06, 'epoch': 1.7} {'loss': 0.2828, 'learning_rate': 1.1519219961658756e-06, 'epoch': 1.7} {'loss': 0.1852, 'learning_rate': 1.1517654502973873e-06, 'epoch': 1.7} {'loss': 0.2928, 'learning_rate': 1.1516089144168718e-06, 'epoch': 1.7} {'loss': 0.3843, 'learning_rate': 1.1514523885245088e-06, 'epoch': 1.7} {'loss': 0.1651, 'learning_rate': 1.1512958726204715e-06, 'epoch': 1.7} {'loss': 0.231, 'learning_rate': 1.1511393667049408e-06, 'epoch': 1.7} {'loss': 0.3971, 'learning_rate': 1.1509828707780891e-06, 'epoch': 1.7} {'loss': 0.2439, 'learning_rate': 1.1508263848400969e-06, 'epoch': 1.7} {'loss': 0.2903, 'learning_rate': 1.1506699088911366e-06, 'epoch': 1.7} {'loss': 0.2988, 'learning_rate': 1.150513442931389e-06, 'epoch': 1.7} {'loss': 0.3296, 'learning_rate': 1.1503569869610276e-06, 'epoch': 1.7} {'loss': 0.2965, 'learning_rate': 1.150200540980233e-06, 'epoch': 1.7} {'loss': 0.461, 'learning_rate': 1.1500441049891754e-06, 'epoch': 1.7} {'loss': 0.251, 'learning_rate': 1.1498876789880387e-06, 'epoch': 1.7} {'loss': 0.2718, 'learning_rate': 1.1497312629769952e-06, 'epoch': 1.7} {'loss': 0.2464, 'learning_rate': 1.1495748569562193e-06, 'epoch': 1.7} {'loss': 0.4199, 'learning_rate': 1.149418460925894e-06, 'epoch': 1.7} {'loss': 0.3928, 'learning_rate': 1.1492620748861894e-06, 'epoch': 1.7} {'loss': 0.3506, 'learning_rate': 1.1491056988372862e-06, 'epoch': 1.7} {'loss': 0.2517, 'learning_rate': 1.1489493327793588e-06, 'epoch': 1.7} {'loss': 0.4036, 'learning_rate': 1.148792976712586e-06, 'epoch': 1.7} {'loss': 0.3025, 'learning_rate': 1.148636630637141e-06, 'epoch': 1.7} {'loss': 0.2204, 'learning_rate': 1.1484802945532035e-06, 'epoch': 1.7} {'loss': 0.2143, 'learning_rate': 1.148323968460947e-06, 'epoch': 1.7} {'loss': 0.3611, 'learning_rate': 1.1481676523605513e-06, 'epoch': 1.7} {'loss': 0.4111, 'learning_rate': 1.1480113462521892e-06, 'epoch': 1.7} {'loss': 0.3111, 'learning_rate': 1.1478550501360407e-06, 'epoch': 1.7} {'loss': 0.2705, 'learning_rate': 1.1476987640122816e-06, 'epoch': 1.7} {'loss': 0.1786, 'learning_rate': 1.1475424878810848e-06, 'epoch': 1.7} {'loss': 0.264, 'learning_rate': 1.1473862217426301e-06, 'epoch': 1.7} {'loss': 0.1952, 'learning_rate': 1.147229965597092e-06, 'epoch': 1.7} {'loss': 0.2943, 'learning_rate': 1.1470737194446492e-06, 'epoch': 1.7} {'loss': 0.3647, 'learning_rate': 1.1469174832854757e-06, 'epoch': 1.7} {'loss': 0.2513, 'learning_rate': 1.1467612571197494e-06, 'epoch': 1.7} {'loss': 0.4486, 'learning_rate': 1.1466050409476459e-06, 'epoch': 1.7} {'loss': 0.3644, 'learning_rate': 1.1464488347693425e-06, 'epoch': 1.7} {'loss': 0.2307, 'learning_rate': 1.1462926385850125e-06, 'epoch': 1.7} {'loss': 0.2988, 'learning_rate': 1.146136452394838e-06, 'epoch': 1.7} {'loss': 0.2592, 'learning_rate': 1.1459802761989892e-06, 'epoch': 1.7} {'loss': 0.2576, 'learning_rate': 1.1458241099976464e-06, 'epoch': 1.7} {'loss': 0.3673, 'learning_rate': 1.1456679537909844e-06, 'epoch': 1.7} {'loss': 0.4168, 'learning_rate': 1.1455118075791783e-06, 'epoch': 1.7} {'loss': 0.2572, 'learning_rate': 1.145355671362407e-06, 'epoch': 1.7} {'loss': 0.1595, 'learning_rate': 1.1451995451408438e-06, 'epoch': 1.7} {'loss': 0.3472, 'learning_rate': 1.1450434289146684e-06, 'epoch': 1.7} {'loss': 0.3615, 'learning_rate': 1.1448873226840528e-06, 'epoch': 1.7} {'loss': 0.1798, 'learning_rate': 1.1447312264491784e-06, 'epoch': 1.7} {'loss': 0.3301, 'learning_rate': 1.1445751402102156e-06, 'epoch': 1.7} {'loss': 0.2542, 'learning_rate': 1.1444190639673457e-06, 'epoch': 1.7} {'loss': 0.3731, 'learning_rate': 1.1442629977207409e-06, 'epoch': 1.7} {'loss': 0.2804, 'learning_rate': 1.1441069414705809e-06, 'epoch': 1.7} {'loss': 0.303, 'learning_rate': 1.1439508952170387e-06, 'epoch': 1.7} {'loss': 0.29, 'learning_rate': 1.1437948589602933e-06, 'epoch': 1.7} {'loss': 0.2876, 'learning_rate': 1.1436388327005176e-06, 'epoch': 1.7} {'loss': 0.1336, 'learning_rate': 1.143482816437892e-06, 'epoch': 1.7} {'loss': 0.2601, 'learning_rate': 1.143326810172589e-06, 'epoch': 1.7} {'loss': 0.2468, 'learning_rate': 1.1431708139047847e-06, 'epoch': 1.7} {'loss': 0.2488, 'learning_rate': 1.1430148276346587e-06, 'epoch': 1.7} {'loss': 0.4159, 'learning_rate': 1.1428588513623817e-06, 'epoch': 1.7} {'loss': 0.2618, 'learning_rate': 1.1427028850881362e-06, 'epoch': 1.7} {'loss': 0.3395, 'learning_rate': 1.1425469288120916e-06, 'epoch': 1.7} {'loss': 0.2175, 'learning_rate': 1.1423909825344303e-06, 'epoch': 1.7} {'loss': 0.3018, 'learning_rate': 1.1422350462553223e-06, 'epoch': 1.7} {'loss': 0.3518, 'learning_rate': 1.142079119974948e-06, 'epoch': 1.7} {'loss': 0.3528, 'learning_rate': 1.1419232036934814e-06, 'epoch': 1.7} {'loss': 0.3536, 'learning_rate': 1.1417672974111005e-06, 'epoch': 1.7} {'loss': 0.2863, 'learning_rate': 1.1416114011279777e-06, 'epoch': 1.7} {'loss': 0.3091, 'learning_rate': 1.141455514844293e-06, 'epoch': 1.7} {'loss': 0.385, 'learning_rate': 1.1412996385602216e-06, 'epoch': 1.7} {'loss': 0.2434, 'learning_rate': 1.1411437722759345e-06, 'epoch': 1.7} {'loss': 0.386, 'learning_rate': 1.1409879159916148e-06, 'epoch': 1.7} {'loss': 0.3592, 'learning_rate': 1.1408320697074327e-06, 'epoch': 1.7} {'loss': 0.2433, 'learning_rate': 1.1406762334235688e-06, 'epoch': 1.7} {'loss': 0.2351, 'learning_rate': 1.1405204071401943e-06, 'epoch': 1.7} {'loss': 0.266, 'learning_rate': 1.14036459085749e-06, 'epoch': 1.7} {'loss': 0.3535, 'learning_rate': 1.140208784575627e-06, 'epoch': 1.7} {'loss': 0.3491, 'learning_rate': 1.1400529882947863e-06, 'epoch': 1.7} {'loss': 0.3156, 'learning_rate': 1.1398972020151379e-06, 'epoch': 1.7} {'loss': 0.225, 'learning_rate': 1.1397414257368633e-06, 'epoch': 1.7} {'loss': 0.2778, 'learning_rate': 1.139585659460134e-06, 'epoch': 1.7} {'loss': 0.3404, 'learning_rate': 1.1394299031851286e-06, 'epoch': 1.7} {'loss': 0.2154, 'learning_rate': 1.1392741569120236e-06, 'epoch': 1.7} {'loss': 0.3252, 'learning_rate': 1.13911842064099e-06, 'epoch': 1.7} {'loss': 0.278, 'learning_rate': 1.1389626943722087e-06, 'epoch': 1.7} {'loss': 0.1871, 'learning_rate': 1.1388069781058498e-06, 'epoch': 1.7} {'loss': 0.2913, 'learning_rate': 1.1386512718420962e-06, 'epoch': 1.7} {'loss': 0.2213, 'learning_rate': 1.138495575581119e-06, 'epoch': 1.7} {'loss': 0.3101, 'learning_rate': 1.1383398893230968e-06, 'epoch': 1.7} {'loss': 0.377, 'learning_rate': 1.1381842130682041e-06, 'epoch': 1.7} {'loss': 0.2934, 'learning_rate': 1.138028546816614e-06, 'epoch': 1.7} {'loss': 0.2659, 'learning_rate': 1.1378728905685066e-06, 'epoch': 1.7} {'loss': 0.1789, 'learning_rate': 1.1377172443240536e-06, 'epoch': 1.7} {'loss': 0.3032, 'learning_rate': 1.137561608083434e-06, 'epoch': 1.7} {'loss': 0.377, 'learning_rate': 1.1374059818468209e-06, 'epoch': 1.7} {'loss': 0.4601, 'learning_rate': 1.137250365614393e-06, 'epoch': 1.7} {'loss': 0.3217, 'learning_rate': 1.1370947593863214e-06, 'epoch': 1.7} {'loss': 0.2226, 'learning_rate': 1.1369391631627868e-06, 'epoch': 1.7} {'loss': 0.2745, 'learning_rate': 1.1367835769439606e-06, 'epoch': 1.7} {'loss': 0.3041, 'learning_rate': 1.1366280007300223e-06, 'epoch': 1.7} {'loss': 0.3584, 'learning_rate': 1.1364724345211432e-06, 'epoch': 1.7} {'loss': 0.2638, 'learning_rate': 1.1363168783175038e-06, 'epoch': 1.7} {'loss': 0.3639, 'learning_rate': 1.1361613321192776e-06, 'epoch': 1.7} {'loss': 0.3011, 'learning_rate': 1.1360057959266369e-06, 'epoch': 1.7} {'loss': 0.4088, 'learning_rate': 1.1358502697397623e-06, 'epoch': 1.7} {'loss': 0.4442, 'learning_rate': 1.1356947535588248e-06, 'epoch': 1.7} {'loss': 0.3001, 'learning_rate': 1.1355392473840044e-06, 'epoch': 1.7} {'loss': 0.3041, 'learning_rate': 1.1353837512154731e-06, 'epoch': 1.7} {'loss': 0.301, 'learning_rate': 1.1352282650534098e-06, 'epoch': 1.7} {'loss': 0.3164, 'learning_rate': 1.135072788897985e-06, 'epoch': 1.7} {'loss': 0.2742, 'learning_rate': 1.1349173227493803e-06, 'epoch': 1.7} {'loss': 0.3239, 'learning_rate': 1.1347618666077663e-06, 'epoch': 1.7} {'loss': 0.3664, 'learning_rate': 1.1346064204733221e-06, 'epoch': 1.7} {'loss': 0.1661, 'learning_rate': 1.1344509843462192e-06, 'epoch': 1.7} {'loss': 0.2255, 'learning_rate': 1.1342955582266369e-06, 'epoch': 1.7} {'loss': 0.3314, 'learning_rate': 1.1341401421147503e-06, 'epoch': 1.7} {'loss': 0.4239, 'learning_rate': 1.1339847360107304e-06, 'epoch': 1.7} {'loss': 0.239, 'learning_rate': 1.1338293399147582e-06, 'epoch': 1.7} {'loss': 0.3558, 'learning_rate': 1.1336739538270048e-06, 'epoch': 1.7} {'loss': 0.2028, 'learning_rate': 1.1335185777476486e-06, 'epoch': 1.7} {'loss': 0.2555, 'learning_rate': 1.1333632116768633e-06, 'epoch': 1.7} {'loss': 0.3623, 'learning_rate': 1.1332078556148263e-06, 'epoch': 1.7} {'loss': 0.2184, 'learning_rate': 1.1330525095617095e-06, 'epoch': 1.7} {'loss': 0.226, 'learning_rate': 1.132897173517692e-06, 'epoch': 1.7} {'loss': 0.2712, 'learning_rate': 1.1327418474829454e-06, 'epoch': 1.7} {'loss': 0.273, 'learning_rate': 1.132586531457649e-06, 'epoch': 1.7} {'loss': 0.2653, 'learning_rate': 1.1324312254419744e-06, 'epoch': 1.7} {'loss': 0.2192, 'learning_rate': 1.1322759294361008e-06, 'epoch': 1.7} {'loss': 0.3114, 'learning_rate': 1.1321206434402021e-06, 'epoch': 1.7} {'loss': 0.2777, 'learning_rate': 1.1319653674544494e-06, 'epoch': 1.7} {'loss': 0.2925, 'learning_rate': 1.131810101479025e-06, 'epoch': 1.7} {'loss': 0.3387, 'learning_rate': 1.1316548455140974e-06, 'epoch': 1.7} {'loss': 0.5191, 'learning_rate': 1.1314995995598477e-06, 'epoch': 1.7} {'loss': 0.2866, 'learning_rate': 1.1313443636164468e-06, 'epoch': 1.7} {'loss': 0.3403, 'learning_rate': 1.1311891376840733e-06, 'epoch': 1.7} {'loss': 0.2486, 'learning_rate': 1.1310339217628984e-06, 'epoch': 1.7} {'loss': 0.3299, 'learning_rate': 1.130878715853102e-06, 'epoch': 1.7} {'loss': 0.1884, 'learning_rate': 1.130723519954855e-06, 'epoch': 1.7} {'loss': 0.2653, 'learning_rate': 1.130568334068337e-06, 'epoch': 1.7} {'loss': 0.4263, 'learning_rate': 1.1304131581937182e-06, 'epoch': 1.7} {'loss': 0.2876, 'learning_rate': 1.1302579923311785e-06, 'epoch': 1.7} {'loss': 0.3043, 'learning_rate': 1.1301028364808908e-06, 'epoch': 1.7} {'loss': 0.237, 'learning_rate': 1.1299476906430284e-06, 'epoch': 1.7} {'loss': 0.2768, 'learning_rate': 1.1297925548177701e-06, 'epoch': 1.7} {'loss': 0.3228, 'learning_rate': 1.1296374290052881e-06, 'epoch': 1.7} {'loss': 0.3133, 'learning_rate': 1.1294823132057598e-06, 'epoch': 1.7} {'loss': 0.4715, 'learning_rate': 1.1293272074193574e-06, 'epoch': 1.7} {'loss': 0.3128, 'learning_rate': 1.1291721116462595e-06, 'epoch': 1.7} {'loss': 0.2712, 'learning_rate': 1.1290170258866374e-06, 'epoch': 1.7} {'loss': 0.3034, 'learning_rate': 1.1288619501406705e-06, 'epoch': 1.7} {'loss': 0.4227, 'learning_rate': 1.1287068844085292e-06, 'epoch': 1.7} {'loss': 0.2273, 'learning_rate': 1.1285518286903929e-06, 'epoch': 1.7} {'loss': 0.192, 'learning_rate': 1.1283967829864328e-06, 'epoch': 1.7} {'loss': 0.2323, 'learning_rate': 1.1282417472968287e-06, 'epoch': 1.7} {'loss': 0.2813, 'learning_rate': 1.1280867216217517e-06, 'epoch': 1.7} {'loss': 0.5072, 'learning_rate': 1.1279317059613747e-06, 'epoch': 1.7} {'loss': 0.4023, 'learning_rate': 1.1277767003158791e-06, 'epoch': 1.7} {'loss': 0.4987, 'learning_rate': 1.1276217046854343e-06, 'epoch': 1.7} {'loss': 0.3738, 'learning_rate': 1.1274667190702193e-06, 'epoch': 1.7} {'loss': 0.4291, 'learning_rate': 1.127311743470405e-06, 'epoch': 1.7} {'loss': 0.2321, 'learning_rate': 1.1271567778861703e-06, 'epoch': 1.7} {'loss': 0.4, 'learning_rate': 1.1270018223176871e-06, 'epoch': 1.7} {'loss': 0.3981, 'learning_rate': 1.126846876765133e-06, 'epoch': 1.7} {'loss': 0.2119, 'learning_rate': 1.1266919412286792e-06, 'epoch': 1.7} {'loss': 0.2196, 'learning_rate': 1.1265370157085054e-06, 'epoch': 1.7} {'loss': 0.2154, 'learning_rate': 1.1263821002047825e-06, 'epoch': 1.7} {'loss': 0.2498, 'learning_rate': 1.1262271947176873e-06, 'epoch': 1.7} {'loss': 0.2197, 'learning_rate': 1.126072299247395e-06, 'epoch': 1.7} {'loss': 0.3027, 'learning_rate': 1.1259174137940776e-06, 'epoch': 1.7} {'loss': 0.3066, 'learning_rate': 1.1257625383579141e-06, 'epoch': 1.7} {'loss': 0.2567, 'learning_rate': 1.1256076729390753e-06, 'epoch': 1.7} {'loss': 0.1317, 'learning_rate': 1.12545281753774e-06, 'epoch': 1.7} {'loss': 0.4134, 'learning_rate': 1.125297972154078e-06, 'epoch': 1.7} {'loss': 0.3047, 'learning_rate': 1.1251431367882692e-06, 'epoch': 1.7} {'loss': 0.2767, 'learning_rate': 1.1249883114404847e-06, 'epoch': 1.7} {'loss': 0.4319, 'learning_rate': 1.124833496110903e-06, 'epoch': 1.7} {'loss': 0.366, 'learning_rate': 1.1246786907996942e-06, 'epoch': 1.7} {'loss': 0.3609, 'learning_rate': 1.124523895507037e-06, 'epoch': 1.7} {'loss': 0.26, 'learning_rate': 1.1243691102331034e-06, 'epoch': 1.7} {'loss': 0.4071, 'learning_rate': 1.124214334978071e-06, 'epoch': 1.7} {'loss': 0.3828, 'learning_rate': 1.124059569742112e-06, 'epoch': 1.7} {'loss': 0.2747, 'learning_rate': 1.1239048145254006e-06, 'epoch': 1.7} {'loss': 0.3198, 'learning_rate': 1.1237500693281145e-06, 'epoch': 1.7} {'loss': 0.2104, 'learning_rate': 1.1235953341504247e-06, 'epoch': 1.7} {'loss': 0.2102, 'learning_rate': 1.1234406089925088e-06, 'epoch': 1.7} {'loss': 0.3848, 'learning_rate': 1.1232858938545399e-06, 'epoch': 1.7} {'loss': 0.2697, 'learning_rate': 1.1231311887366948e-06, 'epoch': 1.7} {'loss': 0.3324, 'learning_rate': 1.1229764936391453e-06, 'epoch': 1.7} {'loss': 0.1709, 'learning_rate': 1.122821808562068e-06, 'epoch': 1.7} {'loss': 0.2824, 'learning_rate': 1.1226671335056382e-06, 'epoch': 1.7} {'loss': 0.387, 'learning_rate': 1.1225124684700262e-06, 'epoch': 1.7} {'loss': 0.2056, 'learning_rate': 1.1223578134554126e-06, 'epoch': 1.7} {'loss': 0.2959, 'learning_rate': 1.1222031684619661e-06, 'epoch': 1.7} {'loss': 0.4302, 'learning_rate': 1.1220485334898656e-06, 'epoch': 1.7} {'loss': 0.2654, 'learning_rate': 1.121893908539282e-06, 'epoch': 1.71} {'loss': 0.218, 'learning_rate': 1.1217392936103956e-06, 'epoch': 1.71} {'loss': 0.3506, 'learning_rate': 1.1215846887033733e-06, 'epoch': 1.71} {'loss': 0.3142, 'learning_rate': 1.1214300938183964e-06, 'epoch': 1.71} {'loss': 0.3652, 'learning_rate': 1.121275508955635e-06, 'epoch': 1.71} {'loss': 0.3905, 'learning_rate': 1.1211209341152662e-06, 'epoch': 1.71} {'loss': 0.2436, 'learning_rate': 1.1209663692974625e-06, 'epoch': 1.71} {'loss': 0.408, 'learning_rate': 1.1208118145024004e-06, 'epoch': 1.71} {'loss': 0.3947, 'learning_rate': 1.1206572697302542e-06, 'epoch': 1.71} {'loss': 0.3698, 'learning_rate': 1.1205027349811948e-06, 'epoch': 1.71} {'loss': 0.3821, 'learning_rate': 1.1203482102554019e-06, 'epoch': 1.71} {'loss': 0.3355, 'learning_rate': 1.1201936955530445e-06, 'epoch': 1.71} {'loss': 0.4075, 'learning_rate': 1.1200391908743025e-06, 'epoch': 1.71} {'loss': 0.363, 'learning_rate': 1.1198846962193456e-06, 'epoch': 1.71} {'loss': 0.2361, 'learning_rate': 1.1197302115883523e-06, 'epoch': 1.71} {'loss': 0.2621, 'learning_rate': 1.119575736981493e-06, 'epoch': 1.71} {'loss': 0.3536, 'learning_rate': 1.119421272398945e-06, 'epoch': 1.71} {'loss': 0.2944, 'learning_rate': 1.1192668178408806e-06, 'epoch': 1.71} {'loss': 0.2962, 'learning_rate': 1.119112373307477e-06, 'epoch': 1.71} {'loss': 0.2428, 'learning_rate': 1.1189579387989046e-06, 'epoch': 1.71} {'loss': 0.3486, 'learning_rate': 1.118803514315343e-06, 'epoch': 1.71} {'loss': 0.2867, 'learning_rate': 1.1186490998569622e-06, 'epoch': 1.71} {'loss': 0.3819, 'learning_rate': 1.1184946954239363e-06, 'epoch': 1.71} {'loss': 0.386, 'learning_rate': 1.1183403010164417e-06, 'epoch': 1.71} {'loss': 0.1639, 'learning_rate': 1.118185916634652e-06, 'epoch': 1.71} {'loss': 0.2972, 'learning_rate': 1.1180315422787424e-06, 'epoch': 1.71} {'loss': 0.2717, 'learning_rate': 1.117877177948884e-06, 'epoch': 1.71} {'loss': 0.3704, 'learning_rate': 1.1177228236452553e-06, 'epoch': 1.71} {'loss': 0.2479, 'learning_rate': 1.1175684793680263e-06, 'epoch': 1.71} {'loss': 0.3026, 'learning_rate': 1.117414145117376e-06, 'epoch': 1.71} {'loss': 0.243, 'learning_rate': 1.1172598208934737e-06, 'epoch': 1.71} {'loss': 0.3533, 'learning_rate': 1.1171055066964975e-06, 'epoch': 1.71} {'loss': 0.2283, 'learning_rate': 1.1169512025266193e-06, 'epoch': 1.71} {'loss': 0.2175, 'learning_rate': 1.1167969083840147e-06, 'epoch': 1.71} {'loss': 0.3564, 'learning_rate': 1.1166426242688576e-06, 'epoch': 1.71} {'loss': 0.2117, 'learning_rate': 1.1164883501813206e-06, 'epoch': 1.71} {'loss': 0.2183, 'learning_rate': 1.11633408612158e-06, 'epoch': 1.71} {'loss': 0.2092, 'learning_rate': 1.1161798320898066e-06, 'epoch': 1.71} {'loss': 0.3055, 'learning_rate': 1.1160255880861793e-06, 'epoch': 1.71} {'loss': 0.2257, 'learning_rate': 1.115871354110868e-06, 'epoch': 1.71} {'loss': 0.4865, 'learning_rate': 1.1157171301640502e-06, 'epoch': 1.71} {'loss': 0.2665, 'learning_rate': 1.115562916245897e-06, 'epoch': 1.71} {'loss': 0.3124, 'learning_rate': 1.115408712356585e-06, 'epoch': 1.71} {'loss': 0.4456, 'learning_rate': 1.115254518496286e-06, 'epoch': 1.71} {'loss': 0.459, 'learning_rate': 1.1151003346651757e-06, 'epoch': 1.71} {'loss': 0.2221, 'learning_rate': 1.1149461608634271e-06, 'epoch': 1.71} {'loss': 0.1861, 'learning_rate': 1.1147919970912157e-06, 'epoch': 1.71} {'loss': 0.3499, 'learning_rate': 1.1146378433487148e-06, 'epoch': 1.71} {'loss': 0.3847, 'learning_rate': 1.1144836996360965e-06, 'epoch': 1.71} {'loss': 0.31, 'learning_rate': 1.114329565953538e-06, 'epoch': 1.71} {'loss': 0.2476, 'learning_rate': 1.1141754423012097e-06, 'epoch': 1.71} {'loss': 0.371, 'learning_rate': 1.11402132867929e-06, 'epoch': 1.71} {'loss': 0.2144, 'learning_rate': 1.113867225087948e-06, 'epoch': 1.71} {'loss': 0.3776, 'learning_rate': 1.113713131527362e-06, 'epoch': 1.71} {'loss': 0.2997, 'learning_rate': 1.1135590479977032e-06, 'epoch': 1.71} {'loss': 0.2885, 'learning_rate': 1.113404974499147e-06, 'epoch': 1.71} {'loss': 0.3116, 'learning_rate': 1.1132509110318657e-06, 'epoch': 1.71} {'loss': 0.2682, 'learning_rate': 1.1130968575960354e-06, 'epoch': 1.71} {'loss': 0.3137, 'learning_rate': 1.1129428141918274e-06, 'epoch': 1.71} {'loss': 0.3054, 'learning_rate': 1.1127887808194194e-06, 'epoch': 1.71} {'loss': 0.3121, 'learning_rate': 1.112634757478982e-06, 'epoch': 1.71} {'loss': 0.2429, 'learning_rate': 1.1124807441706885e-06, 'epoch': 1.71} {'loss': 0.3879, 'learning_rate': 1.1123267408947158e-06, 'epoch': 1.71} {'loss': 0.4015, 'learning_rate': 1.1121727476512346e-06, 'epoch': 1.71} {'loss': 0.2709, 'learning_rate': 1.1120187644404224e-06, 'epoch': 1.71} {'loss': 0.2483, 'learning_rate': 1.111864791262448e-06, 'epoch': 1.71} {'loss': 0.2457, 'learning_rate': 1.1117108281174915e-06, 'epoch': 1.71} {'loss': 0.2479, 'learning_rate': 1.1115568750057205e-06, 'epoch': 1.71} {'loss': 0.2892, 'learning_rate': 1.1114029319273135e-06, 'epoch': 1.71} {'loss': 0.1255, 'learning_rate': 1.1112489988824403e-06, 'epoch': 1.71} {'loss': 0.322, 'learning_rate': 1.111095075871278e-06, 'epoch': 1.71} {'loss': 0.3161, 'learning_rate': 1.110941162893998e-06, 'epoch': 1.71} {'loss': 0.1872, 'learning_rate': 1.1107872599507774e-06, 'epoch': 1.71} {'loss': 0.3299, 'learning_rate': 1.110633367041787e-06, 'epoch': 1.71} {'loss': 0.2749, 'learning_rate': 1.1104794841671995e-06, 'epoch': 1.71} {'loss': 0.3193, 'learning_rate': 1.1103256113271921e-06, 'epoch': 1.71} {'loss': 0.3473, 'learning_rate': 1.1101717485219343e-06, 'epoch': 1.71} {'loss': 0.199, 'learning_rate': 1.1100178957516039e-06, 'epoch': 1.71} {'loss': 0.2842, 'learning_rate': 1.1098640530163718e-06, 'epoch': 1.71} {'loss': 0.2114, 'learning_rate': 1.1097102203164133e-06, 'epoch': 1.71} {'loss': 0.305, 'learning_rate': 1.1095563976519007e-06, 'epoch': 1.71} {'loss': 0.2924, 'learning_rate': 1.1094025850230095e-06, 'epoch': 1.71} {'loss': 0.3738, 'learning_rate': 1.1092487824299114e-06, 'epoch': 1.71} {'loss': 0.2802, 'learning_rate': 1.1090949898727809e-06, 'epoch': 1.71} {'loss': 0.3836, 'learning_rate': 1.1089412073517914e-06, 'epoch': 1.71} {'loss': 0.3974, 'learning_rate': 1.1087874348671168e-06, 'epoch': 1.71} {'loss': 0.4286, 'learning_rate': 1.1086336724189317e-06, 'epoch': 1.71} {'loss': 0.3528, 'learning_rate': 1.1084799200074059e-06, 'epoch': 1.71} {'loss': 0.3552, 'learning_rate': 1.1083261776327182e-06, 'epoch': 1.71} {'loss': 0.1671, 'learning_rate': 1.1081724452950338e-06, 'epoch': 1.71} {'loss': 0.3881, 'learning_rate': 1.1080187229945371e-06, 'epoch': 1.71} {'loss': 0.3052, 'learning_rate': 1.1078650107313938e-06, 'epoch': 1.71} {'loss': 0.2269, 'learning_rate': 1.1077113085057822e-06, 'epoch': 1.71} {'loss': 0.2647, 'learning_rate': 1.1075576163178737e-06, 'epoch': 1.71} {'loss': 0.1883, 'learning_rate': 1.10740393416784e-06, 'epoch': 1.71} {'loss': 0.397, 'learning_rate': 1.1072502620558578e-06, 'epoch': 1.71} {'loss': 0.3163, 'learning_rate': 1.107096599982097e-06, 'epoch': 1.71} {'loss': 0.4255, 'learning_rate': 1.1069429479467353e-06, 'epoch': 1.71} {'loss': 0.1549, 'learning_rate': 1.1067893059499413e-06, 'epoch': 1.71} {'loss': 0.2949, 'learning_rate': 1.1066356739918938e-06, 'epoch': 1.71} {'loss': 0.3319, 'learning_rate': 1.1064820520727614e-06, 'epoch': 1.71} {'loss': 0.4202, 'learning_rate': 1.106328440192721e-06, 'epoch': 1.71} {'loss': 0.2956, 'learning_rate': 1.1061748383519433e-06, 'epoch': 1.71} {'loss': 0.2561, 'learning_rate': 1.1060212465506047e-06, 'epoch': 1.71} {'loss': 0.2438, 'learning_rate': 1.1058676647888745e-06, 'epoch': 1.71} {'loss': 0.2543, 'learning_rate': 1.1057140930669307e-06, 'epoch': 1.71} {'loss': 0.2357, 'learning_rate': 1.1055605313849448e-06, 'epoch': 1.71} {'loss': 0.2858, 'learning_rate': 1.1054069797430877e-06, 'epoch': 1.71} {'loss': 0.337, 'learning_rate': 1.105253438141536e-06, 'epoch': 1.71} {'loss': 0.2967, 'learning_rate': 1.1050999065804601e-06, 'epoch': 1.71} {'loss': 0.2402, 'learning_rate': 1.1049463850600373e-06, 'epoch': 1.71} {'loss': 0.3628, 'learning_rate': 1.1047928735804358e-06, 'epoch': 1.71} {'loss': 0.2128, 'learning_rate': 1.1046393721418336e-06, 'epoch': 1.71} {'loss': 0.3917, 'learning_rate': 1.1044858807444003e-06, 'epoch': 1.71} {'loss': 0.2097, 'learning_rate': 1.1043323993883136e-06, 'epoch': 1.71} {'loss': 0.2565, 'learning_rate': 1.1041789280737414e-06, 'epoch': 1.71} {'loss': 0.2046, 'learning_rate': 1.104025466800861e-06, 'epoch': 1.71} {'loss': 0.3155, 'learning_rate': 1.1038720155698435e-06, 'epoch': 1.71} {'loss': 0.3089, 'learning_rate': 1.1037185743808643e-06, 'epoch': 1.71} {'loss': 0.2037, 'learning_rate': 1.1035651432340943e-06, 'epoch': 1.71} {'loss': 0.2689, 'learning_rate': 1.1034117221297068e-06, 'epoch': 1.71} {'loss': 0.4057, 'learning_rate': 1.1032583110678774e-06, 'epoch': 1.71} {'loss': 0.2668, 'learning_rate': 1.1031049100487746e-06, 'epoch': 1.71} {'loss': 0.364, 'learning_rate': 1.102951519072577e-06, 'epoch': 1.71} {'loss': 0.4551, 'learning_rate': 1.1027981381394537e-06, 'epoch': 1.71} {'loss': 0.4585, 'learning_rate': 1.1026447672495811e-06, 'epoch': 1.71} {'loss': 0.1892, 'learning_rate': 1.1024914064031288e-06, 'epoch': 1.71} {'loss': 0.3214, 'learning_rate': 1.102338055600274e-06, 'epoch': 1.71} {'loss': 0.291, 'learning_rate': 1.1021847148411857e-06, 'epoch': 1.71} {'loss': 0.3853, 'learning_rate': 1.10203138412604e-06, 'epoch': 1.71} {'loss': 0.3775, 'learning_rate': 1.1018780634550074e-06, 'epoch': 1.71} {'loss': 0.3929, 'learning_rate': 1.1017247528282637e-06, 'epoch': 1.71} {'loss': 0.2991, 'learning_rate': 1.101571452245982e-06, 'epoch': 1.71} {'loss': 0.4138, 'learning_rate': 1.1014181617083307e-06, 'epoch': 1.71} {'loss': 0.3382, 'learning_rate': 1.1012648812154891e-06, 'epoch': 1.71} {'loss': 0.2069, 'learning_rate': 1.1011116107676246e-06, 'epoch': 1.71} {'loss': 0.2774, 'learning_rate': 1.1009583503649158e-06, 'epoch': 1.71} {'loss': 0.4235, 'learning_rate': 1.1008051000075303e-06, 'epoch': 1.71} {'loss': 0.1915, 'learning_rate': 1.100651859695645e-06, 'epoch': 1.71} {'loss': 0.2413, 'learning_rate': 1.1004986294294295e-06, 'epoch': 1.71} {'loss': 0.2503, 'learning_rate': 1.1003454092090614e-06, 'epoch': 1.71} {'loss': 0.1821, 'learning_rate': 1.1001921990347087e-06, 'epoch': 1.71} {'loss': 0.3719, 'learning_rate': 1.1000389989065485e-06, 'epoch': 1.71} {'loss': 0.2171, 'learning_rate': 1.0998858088247511e-06, 'epoch': 1.71} {'loss': 0.5061, 'learning_rate': 1.0997326287894904e-06, 'epoch': 1.71} {'loss': 0.2602, 'learning_rate': 1.0995794588009379e-06, 'epoch': 1.71} {'loss': 0.3664, 'learning_rate': 1.0994262988592697e-06, 'epoch': 1.71} {'loss': 0.4383, 'learning_rate': 1.0992731489646568e-06, 'epoch': 1.71} {'loss': 0.3245, 'learning_rate': 1.0991200091172694e-06, 'epoch': 1.71} {'loss': 0.2579, 'learning_rate': 1.0989668793172858e-06, 'epoch': 1.71} {'loss': 0.289, 'learning_rate': 1.098813759564873e-06, 'epoch': 1.71} {'loss': 0.3619, 'learning_rate': 1.0986606498602092e-06, 'epoch': 1.71} {'loss': 0.2713, 'learning_rate': 1.0985075502034637e-06, 'epoch': 1.71} {'loss': 0.2861, 'learning_rate': 1.0983544605948116e-06, 'epoch': 1.71} {'loss': 0.4539, 'learning_rate': 1.0982013810344227e-06, 'epoch': 1.71} {'loss': 0.2273, 'learning_rate': 1.0980483115224738e-06, 'epoch': 1.71} {'loss': 0.1452, 'learning_rate': 1.0978952520591335e-06, 'epoch': 1.71} {'loss': 0.3685, 'learning_rate': 1.0977422026445784e-06, 'epoch': 1.71} {'loss': 0.2962, 'learning_rate': 1.0975891632789782e-06, 'epoch': 1.71} {'loss': 0.3242, 'learning_rate': 1.0974361339625083e-06, 'epoch': 1.71} {'loss': 0.4026, 'learning_rate': 1.09728311469534e-06, 'epoch': 1.71} {'loss': 0.3257, 'learning_rate': 1.0971301054776451e-06, 'epoch': 1.71} {'loss': 0.2957, 'learning_rate': 1.096977106309598e-06, 'epoch': 1.71} {'loss': 0.2425, 'learning_rate': 1.0968241171913697e-06, 'epoch': 1.71} {'loss': 0.2467, 'learning_rate': 1.0966711381231365e-06, 'epoch': 1.71} {'loss': 0.2951, 'learning_rate': 1.0965181691050653e-06, 'epoch': 1.71} {'loss': 0.3658, 'learning_rate': 1.0963652101373345e-06, 'epoch': 1.71} {'loss': 0.2487, 'learning_rate': 1.096212261220112e-06, 'epoch': 1.71} {'loss': 0.3828, 'learning_rate': 1.0960593223535753e-06, 'epoch': 1.71} {'loss': 0.3627, 'learning_rate': 1.0959063935378921e-06, 'epoch': 1.71} {'loss': 0.2454, 'learning_rate': 1.095753474773239e-06, 'epoch': 1.71} {'loss': 0.1836, 'learning_rate': 1.0956005660597858e-06, 'epoch': 1.71} {'loss': 0.1885, 'learning_rate': 1.0954476673977077e-06, 'epoch': 1.71} {'loss': 0.2615, 'learning_rate': 1.095294778787177e-06, 'epoch': 1.71} {'loss': 0.196, 'learning_rate': 1.0951419002283614e-06, 'epoch': 1.71} {'loss': 0.3613, 'learning_rate': 1.0949890317214406e-06, 'epoch': 1.71} {'loss': 0.2265, 'learning_rate': 1.0948361732665813e-06, 'epoch': 1.71} {'loss': 0.254, 'learning_rate': 1.094683324863961e-06, 'epoch': 1.71} {'loss': 0.3381, 'learning_rate': 1.0945304865137474e-06, 'epoch': 1.71} {'loss': 0.349, 'learning_rate': 1.094377658216118e-06, 'epoch': 1.71} {'loss': 0.2751, 'learning_rate': 1.0942248399712396e-06, 'epoch': 1.71} {'loss': 0.256, 'learning_rate': 1.0940720317792908e-06, 'epoch': 1.71} {'loss': 0.2948, 'learning_rate': 1.093919233640439e-06, 'epoch': 1.71} {'loss': 0.1563, 'learning_rate': 1.0937664455548603e-06, 'epoch': 1.71} {'loss': 0.4721, 'learning_rate': 1.0936136675227239e-06, 'epoch': 1.71} {'loss': 0.3527, 'learning_rate': 1.0934608995442065e-06, 'epoch': 1.71} {'loss': 0.3039, 'learning_rate': 1.093308141619478e-06, 'epoch': 1.71} {'loss': 0.3963, 'learning_rate': 1.0931553937487084e-06, 'epoch': 1.71} {'loss': 0.3968, 'learning_rate': 1.093002655932075e-06, 'epoch': 1.71} {'loss': 0.3168, 'learning_rate': 1.0928499281697435e-06, 'epoch': 1.71} {'loss': 0.3071, 'learning_rate': 1.0926972104618949e-06, 'epoch': 1.71} {'loss': 0.3484, 'learning_rate': 1.0925445028086956e-06, 'epoch': 1.71} {'loss': 0.3091, 'learning_rate': 1.0923918052103222e-06, 'epoch': 1.71} {'loss': 0.1602, 'learning_rate': 1.0922391176669434e-06, 'epoch': 1.71} {'loss': 0.2568, 'learning_rate': 1.0920864401787312e-06, 'epoch': 1.71} {'loss': 0.455, 'learning_rate': 1.0919337727458623e-06, 'epoch': 1.71} {'loss': 0.2914, 'learning_rate': 1.0917811153685032e-06, 'epoch': 1.71} {'loss': 0.1982, 'learning_rate': 1.0916284680468314e-06, 'epoch': 1.71} {'loss': 0.3671, 'learning_rate': 1.0914758307810146e-06, 'epoch': 1.71} {'loss': 0.23, 'learning_rate': 1.0913232035712306e-06, 'epoch': 1.71} {'loss': 0.2834, 'learning_rate': 1.0911705864176457e-06, 'epoch': 1.71} {'loss': 0.3476, 'learning_rate': 1.0910179793204378e-06, 'epoch': 1.71} {'loss': 0.2997, 'learning_rate': 1.0908653822797744e-06, 'epoch': 1.71} {'loss': 0.3122, 'learning_rate': 1.090712795295832e-06, 'epoch': 1.71} {'loss': 0.2614, 'learning_rate': 1.090560218368778e-06, 'epoch': 1.71} {'loss': 0.3549, 'learning_rate': 1.0904076514987905e-06, 'epoch': 1.71} {'loss': 0.364, 'learning_rate': 1.090255094686038e-06, 'epoch': 1.71} {'loss': 0.3722, 'learning_rate': 1.0901025479306903e-06, 'epoch': 1.71} {'loss': 0.3062, 'learning_rate': 1.0899500112329254e-06, 'epoch': 1.71} {'loss': 0.2958, 'learning_rate': 1.0897974845929105e-06, 'epoch': 1.71} {'loss': 0.1692, 'learning_rate': 1.0896449680108212e-06, 'epoch': 1.71} {'loss': 0.3896, 'learning_rate': 1.0894924614868275e-06, 'epoch': 1.71} {'loss': 0.3924, 'learning_rate': 1.0893399650211033e-06, 'epoch': 1.71} {'loss': 0.3257, 'learning_rate': 1.089187478613819e-06, 'epoch': 1.71} {'loss': 0.3305, 'learning_rate': 1.0890350022651486e-06, 'epoch': 1.71} {'loss': 0.4671, 'learning_rate': 1.088882535975262e-06, 'epoch': 1.71} {'loss': 0.2729, 'learning_rate': 1.0887300797443334e-06, 'epoch': 1.71} {'loss': 0.4469, 'learning_rate': 1.088577633572533e-06, 'epoch': 1.71} {'loss': 0.3188, 'learning_rate': 1.0884251974600357e-06, 'epoch': 1.71} {'loss': 0.2687, 'learning_rate': 1.0882727714070108e-06, 'epoch': 1.71} {'loss': 0.2852, 'learning_rate': 1.08812035541363e-06, 'epoch': 1.71} {'loss': 0.353, 'learning_rate': 1.0879679494800687e-06, 'epoch': 1.71} {'loss': 0.2802, 'learning_rate': 1.0878155536064948e-06, 'epoch': 1.71} {'loss': 0.3412, 'learning_rate': 1.0876631677930849e-06, 'epoch': 1.71} {'loss': 0.4586, 'learning_rate': 1.0875107920400064e-06, 'epoch': 1.71} {'loss': 0.2737, 'learning_rate': 1.0873584263474346e-06, 'epoch': 1.71} {'loss': 0.2383, 'learning_rate': 1.0872060707155384e-06, 'epoch': 1.71} {'loss': 0.2771, 'learning_rate': 1.0870537251444946e-06, 'epoch': 1.71} {'loss': 0.2862, 'learning_rate': 1.0869013896344704e-06, 'epoch': 1.71} {'loss': 0.2672, 'learning_rate': 1.0867490641856404e-06, 'epoch': 1.71} {'loss': 0.2256, 'learning_rate': 1.0865967487981744e-06, 'epoch': 1.71} {'loss': 0.3021, 'learning_rate': 1.0864444434722476e-06, 'epoch': 1.71} {'loss': 0.2187, 'learning_rate': 1.0862921482080302e-06, 'epoch': 1.71} {'loss': 0.3355, 'learning_rate': 1.0861398630056918e-06, 'epoch': 1.71} {'loss': 0.3103, 'learning_rate': 1.0859875878654091e-06, 'epoch': 1.71} {'loss': 0.2051, 'learning_rate': 1.0858353227873485e-06, 'epoch': 1.71} {'loss': 0.451, 'learning_rate': 1.0856830677716867e-06, 'epoch': 1.71} {'loss': 0.2315, 'learning_rate': 1.0855308228185924e-06, 'epoch': 1.71} {'loss': 0.2801, 'learning_rate': 1.0853785879282396e-06, 'epoch': 1.71} {'loss': 0.3338, 'learning_rate': 1.0852263631007976e-06, 'epoch': 1.71} {'loss': 0.2378, 'learning_rate': 1.0850741483364424e-06, 'epoch': 1.71} {'loss': 0.2558, 'learning_rate': 1.0849219436353408e-06, 'epoch': 1.71} {'loss': 0.2652, 'learning_rate': 1.0847697489976684e-06, 'epoch': 1.71} {'loss': 0.3071, 'learning_rate': 1.0846175644235945e-06, 'epoch': 1.71} {'loss': 0.34, 'learning_rate': 1.0844653899132939e-06, 'epoch': 1.71} {'loss': 0.2286, 'learning_rate': 1.0843132254669364e-06, 'epoch': 1.71} {'loss': 0.4223, 'learning_rate': 1.0841610710846917e-06, 'epoch': 1.71} {'loss': 0.3539, 'learning_rate': 1.0840089267667364e-06, 'epoch': 1.71} {'loss': 0.2614, 'learning_rate': 1.083856792513237e-06, 'epoch': 1.71} {'loss': 0.2104, 'learning_rate': 1.083704668324369e-06, 'epoch': 1.71} {'loss': 0.3545, 'learning_rate': 1.0835525542003023e-06, 'epoch': 1.71} {'loss': 0.3621, 'learning_rate': 1.083400450141211e-06, 'epoch': 1.71} {'loss': 0.3216, 'learning_rate': 1.0832483561472617e-06, 'epoch': 1.71} {'loss': 0.3582, 'learning_rate': 1.0830962722186333e-06, 'epoch': 1.71} {'loss': 0.2912, 'learning_rate': 1.08294419835549e-06, 'epoch': 1.71} {'loss': 0.4092, 'learning_rate': 1.0827921345580106e-06, 'epoch': 1.71} {'loss': 0.343, 'learning_rate': 1.0826400808263593e-06, 'epoch': 1.71} {'loss': 0.1495, 'learning_rate': 1.0824880371607149e-06, 'epoch': 1.71} {'loss': 0.1874, 'learning_rate': 1.0823360035612462e-06, 'epoch': 1.71} {'loss': 0.1902, 'learning_rate': 1.0821839800281208e-06, 'epoch': 1.71} {'loss': 0.212, 'learning_rate': 1.0820319665615175e-06, 'epoch': 1.71} {'loss': 0.3178, 'learning_rate': 1.0818799631616016e-06, 'epoch': 1.71} {'loss': 0.1738, 'learning_rate': 1.0817279698285489e-06, 'epoch': 1.71} {'loss': 0.2272, 'learning_rate': 1.0815759865625276e-06, 'epoch': 1.71} {'loss': 0.2548, 'learning_rate': 1.0814240133637133e-06, 'epoch': 1.71} {'loss': 0.3644, 'learning_rate': 1.0812720502322738e-06, 'epoch': 1.71} {'loss': 0.3127, 'learning_rate': 1.0811200971683845e-06, 'epoch': 1.71} {'loss': 0.2098, 'learning_rate': 1.0809681541722117e-06, 'epoch': 1.71} {'loss': 0.3922, 'learning_rate': 1.0808162212439321e-06, 'epoch': 1.71} {'loss': 0.3487, 'learning_rate': 1.0806642983837122e-06, 'epoch': 1.71} {'loss': 0.1676, 'learning_rate': 1.0805123855917287e-06, 'epoch': 1.71} {'loss': 0.3688, 'learning_rate': 1.0803604828681512e-06, 'epoch': 1.71} {'loss': 0.3413, 'learning_rate': 1.0802085902131477e-06, 'epoch': 1.71} {'loss': 0.3145, 'learning_rate': 1.0800567076268952e-06, 'epoch': 1.71} {'loss': 0.2126, 'learning_rate': 1.0799048351095598e-06, 'epoch': 1.71} {'loss': 0.3738, 'learning_rate': 1.0797529726613187e-06, 'epoch': 1.71} {'loss': 0.3113, 'learning_rate': 1.0796011202823375e-06, 'epoch': 1.71} {'loss': 0.3622, 'learning_rate': 1.0794492779727927e-06, 'epoch': 1.71} {'loss': 0.3287, 'learning_rate': 1.079297445732851e-06, 'epoch': 1.71} {'loss': 0.1996, 'learning_rate': 1.0791456235626874e-06, 'epoch': 1.71} {'loss': 0.3919, 'learning_rate': 1.078993811462471e-06, 'epoch': 1.71} {'loss': 0.1898, 'learning_rate': 1.078842009432376e-06, 'epoch': 1.71} {'loss': 0.2247, 'learning_rate': 1.07869021747257e-06, 'epoch': 1.71} {'loss': 0.2259, 'learning_rate': 1.0785384355832285e-06, 'epoch': 1.71} {'loss': 0.2944, 'learning_rate': 1.0783866637645202e-06, 'epoch': 1.71} {'loss': 0.2893, 'learning_rate': 1.078234902016615e-06, 'epoch': 1.71} {'loss': 0.4368, 'learning_rate': 1.0780831503396883e-06, 'epoch': 1.71} {'loss': 0.3948, 'learning_rate': 1.0779314087339065e-06, 'epoch': 1.71} {'loss': 0.202, 'learning_rate': 1.0777796771994442e-06, 'epoch': 1.71} {'loss': 0.331, 'learning_rate': 1.0776279557364712e-06, 'epoch': 1.71} {'loss': 0.3172, 'learning_rate': 1.0774762443451626e-06, 'epoch': 1.71} {'loss': 0.2526, 'learning_rate': 1.077324543025684e-06, 'epoch': 1.71} {'loss': 0.3269, 'learning_rate': 1.077172851778211e-06, 'epoch': 1.71} {'loss': 0.2482, 'learning_rate': 1.0770211706029131e-06, 'epoch': 1.71} {'loss': 0.31, 'learning_rate': 1.0768694994999595e-06, 'epoch': 1.71} {'loss': 0.2196, 'learning_rate': 1.0767178384695266e-06, 'epoch': 1.71} {'loss': 0.2649, 'learning_rate': 1.0765661875117795e-06, 'epoch': 1.71} {'loss': 0.334, 'learning_rate': 1.0764145466268938e-06, 'epoch': 1.71} {'loss': 0.2001, 'learning_rate': 1.0762629158150384e-06, 'epoch': 1.71} {'loss': 0.363, 'learning_rate': 1.0761112950763864e-06, 'epoch': 1.71} {'loss': 0.38, 'learning_rate': 1.0759596844111064e-06, 'epoch': 1.71} {'loss': 0.3353, 'learning_rate': 1.075808083819372e-06, 'epoch': 1.71} {'loss': 0.3143, 'learning_rate': 1.0756564933013514e-06, 'epoch': 1.71} {'loss': 0.2796, 'learning_rate': 1.0755049128572204e-06, 'epoch': 1.71} {'loss': 0.3449, 'learning_rate': 1.0753533424871454e-06, 'epoch': 1.71} {'loss': 0.3587, 'learning_rate': 1.0752017821913007e-06, 'epoch': 1.71} {'loss': 0.3189, 'learning_rate': 1.0750502319698564e-06, 'epoch': 1.71} {'loss': 0.2495, 'learning_rate': 1.074898691822981e-06, 'epoch': 1.71} {'loss': 0.2099, 'learning_rate': 1.0747471617508487e-06, 'epoch': 1.71} {'loss': 0.3254, 'learning_rate': 1.0745956417536296e-06, 'epoch': 1.71} {'loss': 0.3681, 'learning_rate': 1.0744441318314958e-06, 'epoch': 1.71} {'loss': 0.293, 'learning_rate': 1.0742926319846147e-06, 'epoch': 1.71} {'loss': 0.3897, 'learning_rate': 1.0741411422131632e-06, 'epoch': 1.71} {'loss': 0.3828, 'learning_rate': 1.0739896625173063e-06, 'epoch': 1.71} {'loss': 0.5509, 'learning_rate': 1.0738381928972197e-06, 'epoch': 1.71} {'loss': 0.4697, 'learning_rate': 1.073686733353071e-06, 'epoch': 1.71} {'loss': 0.241, 'learning_rate': 1.0735352838850344e-06, 'epoch': 1.71} {'loss': 0.3151, 'learning_rate': 1.0733838444932764e-06, 'epoch': 1.71} {'loss': 0.2302, 'learning_rate': 1.0732324151779727e-06, 'epoch': 1.71} {'loss': 0.3907, 'learning_rate': 1.073080995939293e-06, 'epoch': 1.71} {'loss': 0.3268, 'learning_rate': 1.0729295867774048e-06, 'epoch': 1.71} {'loss': 0.2686, 'learning_rate': 1.0727781876924826e-06, 'epoch': 1.71} {'loss': 0.2774, 'learning_rate': 1.072626798684695e-06, 'epoch': 1.71} {'loss': 0.2316, 'learning_rate': 1.0724754197542163e-06, 'epoch': 1.71} {'loss': 0.362, 'learning_rate': 1.0723240509012133e-06, 'epoch': 1.71} {'loss': 0.3068, 'learning_rate': 1.0721726921258601e-06, 'epoch': 1.71} {'loss': 0.3757, 'learning_rate': 1.0720213434283243e-06, 'epoch': 1.71} {'loss': 0.2992, 'learning_rate': 1.0718700048087815e-06, 'epoch': 1.71} {'loss': 0.3513, 'learning_rate': 1.0717186762673971e-06, 'epoch': 1.71} {'loss': 0.2016, 'learning_rate': 1.0715673578043473e-06, 'epoch': 1.71} {'loss': 0.2977, 'learning_rate': 1.0714160494197966e-06, 'epoch': 1.71} {'loss': 0.1361, 'learning_rate': 1.071264751113923e-06, 'epoch': 1.71} {'loss': 0.3382, 'learning_rate': 1.0711134628868925e-06, 'epoch': 1.71} {'loss': 0.3435, 'learning_rate': 1.0709621847388751e-06, 'epoch': 1.71} {'loss': 0.3309, 'learning_rate': 1.0708109166700465e-06, 'epoch': 1.71} {'loss': 0.3547, 'learning_rate': 1.0706596586805706e-06, 'epoch': 1.71} {'loss': 0.3775, 'learning_rate': 1.0705084107706255e-06, 'epoch': 1.71} {'loss': 0.4904, 'learning_rate': 1.0703571729403762e-06, 'epoch': 1.71} {'loss': 0.2845, 'learning_rate': 1.0702059451899971e-06, 'epoch': 1.71} {'loss': 0.2799, 'learning_rate': 1.0700547275196548e-06, 'epoch': 1.71} {'loss': 0.3318, 'learning_rate': 1.069903519929526e-06, 'epoch': 1.71} {'loss': 0.2916, 'learning_rate': 1.0697523224197749e-06, 'epoch': 1.71} {'loss': 0.303, 'learning_rate': 1.0696011349905777e-06, 'epoch': 1.71} {'loss': 0.3688, 'learning_rate': 1.0694499576421013e-06, 'epoch': 1.71} {'loss': 0.2229, 'learning_rate': 1.069298790374519e-06, 'epoch': 1.71} {'loss': 0.5239, 'learning_rate': 1.0691476331880002e-06, 'epoch': 1.71} {'loss': 0.3482, 'learning_rate': 1.068996486082713e-06, 'epoch': 1.71} {'loss': 0.2522, 'learning_rate': 1.0688453490588325e-06, 'epoch': 1.71} {'loss': 0.2474, 'learning_rate': 1.0686942221165253e-06, 'epoch': 1.71} {'loss': 0.3749, 'learning_rate': 1.068543105255967e-06, 'epoch': 1.71} {'loss': 0.2802, 'learning_rate': 1.0683919984773217e-06, 'epoch': 1.71} {'loss': 0.3085, 'learning_rate': 1.068240901780766e-06, 'epoch': 1.71} {'loss': 0.3413, 'learning_rate': 1.0680898151664665e-06, 'epoch': 1.71} {'loss': 0.2912, 'learning_rate': 1.0679387386345963e-06, 'epoch': 1.71} {'loss': 0.3904, 'learning_rate': 1.0677876721853231e-06, 'epoch': 1.71} {'loss': 0.333, 'learning_rate': 1.0676366158188211e-06, 'epoch': 1.71} {'loss': 0.3193, 'learning_rate': 1.067485569535257e-06, 'epoch': 1.71} {'loss': 0.4221, 'learning_rate': 1.0673345333348052e-06, 'epoch': 1.71} {'loss': 0.2877, 'learning_rate': 1.067183507217633e-06, 'epoch': 1.71} {'loss': 0.1778, 'learning_rate': 1.0670324911839103e-06, 'epoch': 1.71} {'loss': 0.2961, 'learning_rate': 1.0668814852338116e-06, 'epoch': 1.71} {'loss': 0.1573, 'learning_rate': 1.0667304893675035e-06, 'epoch': 1.71} {'loss': 0.1627, 'learning_rate': 1.066579503585159e-06, 'epoch': 1.71} {'loss': 0.372, 'learning_rate': 1.0664285278869457e-06, 'epoch': 1.71} {'loss': 0.2701, 'learning_rate': 1.066277562273038e-06, 'epoch': 1.71} {'loss': 0.3724, 'learning_rate': 1.0661266067436026e-06, 'epoch': 1.71} {'loss': 0.2433, 'learning_rate': 1.0659756612988126e-06, 'epoch': 1.71} {'loss': 0.2748, 'learning_rate': 1.0658247259388355e-06, 'epoch': 1.71} {'loss': 0.3265, 'learning_rate': 1.0656738006638456e-06, 'epoch': 1.71} {'loss': 0.2201, 'learning_rate': 1.0655228854740084e-06, 'epoch': 1.71} {'loss': 0.2769, 'learning_rate': 1.0653719803694995e-06, 'epoch': 1.71} {'loss': 0.3287, 'learning_rate': 1.0652210853504863e-06, 'epoch': 1.71} {'loss': 0.2701, 'learning_rate': 1.0650702004171376e-06, 'epoch': 1.71} {'loss': 0.1502, 'learning_rate': 1.0649193255696278e-06, 'epoch': 1.71} {'loss': 0.2806, 'learning_rate': 1.0647684608081233e-06, 'epoch': 1.71} {'loss': 0.3863, 'learning_rate': 1.0646176061327973e-06, 'epoch': 1.71} {'loss': 0.3559, 'learning_rate': 1.0644667615438176e-06, 'epoch': 1.71} {'loss': 0.1997, 'learning_rate': 1.0643159270413572e-06, 'epoch': 1.71} {'loss': 0.4872, 'learning_rate': 1.064165102625583e-06, 'epoch': 1.71} {'loss': 0.2802, 'learning_rate': 1.0640142882966687e-06, 'epoch': 1.71} {'loss': 0.1628, 'learning_rate': 1.0638634840547823e-06, 'epoch': 1.71} {'loss': 0.2706, 'learning_rate': 1.063712689900096e-06, 'epoch': 1.71} {'loss': 0.4825, 'learning_rate': 1.0635619058327762e-06, 'epoch': 1.71} {'loss': 0.1417, 'learning_rate': 1.0634111318529983e-06, 'epoch': 1.71} {'loss': 0.3667, 'learning_rate': 1.0632603679609298e-06, 'epoch': 1.71} {'loss': 0.2951, 'learning_rate': 1.0631096141567388e-06, 'epoch': 1.71} {'loss': 0.3211, 'learning_rate': 1.0629588704406002e-06, 'epoch': 1.71} {'loss': 0.2018, 'learning_rate': 1.0628081368126763e-06, 'epoch': 1.71} {'loss': 0.2829, 'learning_rate': 1.0626574132731482e-06, 'epoch': 1.71} {'loss': 0.4093, 'learning_rate': 1.0625066998221766e-06, 'epoch': 1.71} {'loss': 0.3642, 'learning_rate': 1.0623559964599383e-06, 'epoch': 1.71} {'loss': 0.3041, 'learning_rate': 1.0622053031866008e-06, 'epoch': 1.71} {'loss': 0.3333, 'learning_rate': 1.0620546200023318e-06, 'epoch': 1.71} {'loss': 0.2091, 'learning_rate': 1.0619039469073056e-06, 'epoch': 1.71} {'loss': 0.2167, 'learning_rate': 1.0617532839016875e-06, 'epoch': 1.71} {'loss': 0.3942, 'learning_rate': 1.061602630985653e-06, 'epoch': 1.71} {'loss': 0.3129, 'learning_rate': 1.0614519881593665e-06, 'epoch': 1.71} {'loss': 0.2764, 'learning_rate': 1.0613013554230045e-06, 'epoch': 1.71} {'loss': 0.272, 'learning_rate': 1.0611507327767302e-06, 'epoch': 1.71} {'loss': 0.264, 'learning_rate': 1.0610001202207187e-06, 'epoch': 1.71} {'loss': 0.1255, 'learning_rate': 1.060849517755137e-06, 'epoch': 1.71} {'loss': 0.4739, 'learning_rate': 1.060698925380158e-06, 'epoch': 1.71} {'loss': 0.3853, 'learning_rate': 1.0605483430959485e-06, 'epoch': 1.71} {'loss': 0.2463, 'learning_rate': 1.0603977709026813e-06, 'epoch': 1.71} {'loss': 0.3133, 'learning_rate': 1.0602472088005255e-06, 'epoch': 1.71} {'loss': 0.2411, 'learning_rate': 1.0600966567896488e-06, 'epoch': 1.71} {'loss': 0.3636, 'learning_rate': 1.0599461148702251e-06, 'epoch': 1.71} {'loss': 0.2703, 'learning_rate': 1.05979558304242e-06, 'epoch': 1.71} {'loss': 0.3948, 'learning_rate': 1.0596450613064068e-06, 'epoch': 1.71} {'loss': 0.2128, 'learning_rate': 1.0594945496623533e-06, 'epoch': 1.71} {'loss': 0.4473, 'learning_rate': 1.0593440481104322e-06, 'epoch': 1.71} {'loss': 0.3518, 'learning_rate': 1.0591935566508094e-06, 'epoch': 1.71} {'loss': 0.2879, 'learning_rate': 1.0590430752836589e-06, 'epoch': 1.71} {'loss': 0.3255, 'learning_rate': 1.0588926040091463e-06, 'epoch': 1.71} {'loss': 0.1416, 'learning_rate': 1.0587421428274458e-06, 'epoch': 1.71} {'loss': 0.3371, 'learning_rate': 1.0585916917387228e-06, 'epoch': 1.71} {'loss': 0.2683, 'learning_rate': 1.0584412507431518e-06, 'epoch': 1.71} {'loss': 0.5235, 'learning_rate': 1.0582908198408993e-06, 'epoch': 1.71} {'loss': 0.3946, 'learning_rate': 1.058140399032137e-06, 'epoch': 1.71} {'loss': 0.2412, 'learning_rate': 1.0579899883170342e-06, 'epoch': 1.71} {'loss': 0.3389, 'learning_rate': 1.0578395876957581e-06, 'epoch': 1.71} {'loss': 0.263, 'learning_rate': 1.0576891971684822e-06, 'epoch': 1.71} {'loss': 0.2776, 'learning_rate': 1.057538816735374e-06, 'epoch': 1.71} {'loss': 0.2816, 'learning_rate': 1.0573884463966054e-06, 'epoch': 1.71} {'loss': 0.2428, 'learning_rate': 1.0572380861523424e-06, 'epoch': 1.71} {'loss': 0.2184, 'learning_rate': 1.0570877360027588e-06, 'epoch': 1.71} {'loss': 0.3218, 'learning_rate': 1.056937395948021e-06, 'epoch': 1.71} {'loss': 0.3642, 'learning_rate': 1.0567870659883028e-06, 'epoch': 1.71} {'loss': 0.3902, 'learning_rate': 1.0566367461237692e-06, 'epoch': 1.71} {'loss': 0.2819, 'learning_rate': 1.0564864363545935e-06, 'epoch': 1.71} {'loss': 0.3202, 'learning_rate': 1.0563361366809422e-06, 'epoch': 1.71} {'loss': 0.3121, 'learning_rate': 1.0561858471029884e-06, 'epoch': 1.71} {'loss': 0.3055, 'learning_rate': 1.0560355676209e-06, 'epoch': 1.71} {'loss': 0.2728, 'learning_rate': 1.0558852982348456e-06, 'epoch': 1.71} {'loss': 0.1846, 'learning_rate': 1.0557350389449971e-06, 'epoch': 1.71} {'loss': 0.3474, 'learning_rate': 1.0555847897515214e-06, 'epoch': 1.71} {'loss': 0.3942, 'learning_rate': 1.0554345506545916e-06, 'epoch': 1.71} {'loss': 0.3005, 'learning_rate': 1.0552843216543728e-06, 'epoch': 1.71} {'loss': 0.2576, 'learning_rate': 1.0551341027510386e-06, 'epoch': 1.71} {'loss': 0.4105, 'learning_rate': 1.0549838939447566e-06, 'epoch': 1.71} {'loss': 0.3671, 'learning_rate': 1.0548336952356975e-06, 'epoch': 1.71} {'loss': 0.2559, 'learning_rate': 1.054683506624029e-06, 'epoch': 1.71} {'loss': 0.362, 'learning_rate': 1.0545333281099235e-06, 'epoch': 1.71} {'loss': 0.4159, 'learning_rate': 1.0543831596935462e-06, 'epoch': 1.71} {'loss': 0.3755, 'learning_rate': 1.0542330013750712e-06, 'epoch': 1.71} {'loss': 0.2957, 'learning_rate': 1.0540828531546675e-06, 'epoch': 1.71} {'loss': 0.2914, 'learning_rate': 1.0539327150324996e-06, 'epoch': 1.71} {'loss': 0.3358, 'learning_rate': 1.0537825870087437e-06, 'epoch': 1.71} {'loss': 0.3457, 'learning_rate': 1.053632469083563e-06, 'epoch': 1.71} {'loss': 0.4463, 'learning_rate': 1.0534823612571321e-06, 'epoch': 1.71} {'loss': 0.2091, 'learning_rate': 1.0533322635296173e-06, 'epoch': 1.71} {'loss': 0.1878, 'learning_rate': 1.0531821759011907e-06, 'epoch': 1.71} {'loss': 0.2948, 'learning_rate': 1.0530320983720176e-06, 'epoch': 1.71} {'loss': 0.2754, 'learning_rate': 1.0528820309422716e-06, 'epoch': 1.71} {'loss': 0.4137, 'learning_rate': 1.05273197361212e-06, 'epoch': 1.71} {'loss': 0.3134, 'learning_rate': 1.0525819263817327e-06, 'epoch': 1.71} {'loss': 0.4292, 'learning_rate': 1.0524318892512785e-06, 'epoch': 1.71} {'loss': 0.3171, 'learning_rate': 1.0522818622209286e-06, 'epoch': 1.71} {'loss': 0.2843, 'learning_rate': 1.0521318452908513e-06, 'epoch': 1.71} {'loss': 0.2927, 'learning_rate': 1.0519818384612124e-06, 'epoch': 1.71} {'loss': 0.3027, 'learning_rate': 1.0518318417321882e-06, 'epoch': 1.71} {'loss': 0.2688, 'learning_rate': 1.0516818551039409e-06, 'epoch': 1.71} {'loss': 0.3033, 'learning_rate': 1.0515318785766459e-06, 'epoch': 1.71} {'loss': 0.3516, 'learning_rate': 1.0513819121504676e-06, 'epoch': 1.71} {'loss': 0.3105, 'learning_rate': 1.0512319558255801e-06, 'epoch': 1.71} {'loss': 0.544, 'learning_rate': 1.0510820096021469e-06, 'epoch': 1.71} {'loss': 0.315, 'learning_rate': 1.050932073480343e-06, 'epoch': 1.71} {'loss': 0.3418, 'learning_rate': 1.050782147460333e-06, 'epoch': 1.71} {'loss': 0.3648, 'learning_rate': 1.05063223154229e-06, 'epoch': 1.71} {'loss': 0.1844, 'learning_rate': 1.0504823257263795e-06, 'epoch': 1.71} {'loss': 0.4261, 'learning_rate': 1.0503324300127748e-06, 'epoch': 1.71} {'loss': 0.2289, 'learning_rate': 1.0501825444016435e-06, 'epoch': 1.71} {'loss': 0.2668, 'learning_rate': 1.0500326688931516e-06, 'epoch': 1.71} {'loss': 0.4209, 'learning_rate': 1.049882803487473e-06, 'epoch': 1.71} {'loss': 0.2659, 'learning_rate': 1.0497329481847728e-06, 'epoch': 1.71} {'loss': 0.3661, 'learning_rate': 1.0495831029852232e-06, 'epoch': 1.71} {'loss': 0.3207, 'learning_rate': 1.0494332678889917e-06, 'epoch': 1.71} {'loss': 0.2214, 'learning_rate': 1.0492834428962495e-06, 'epoch': 1.71} {'loss': 0.3685, 'learning_rate': 1.0491336280071617e-06, 'epoch': 1.71} {'loss': 0.3185, 'learning_rate': 1.0489838232219018e-06, 'epoch': 1.71} {'loss': 0.2885, 'learning_rate': 1.0488340285406361e-06, 'epoch': 1.71} {'loss': 0.2139, 'learning_rate': 1.048684243963536e-06, 'epoch': 1.71} {'loss': 0.2163, 'learning_rate': 1.0485344694907673e-06, 'epoch': 1.72} {'loss': 0.4715, 'learning_rate': 1.0483847051225037e-06, 'epoch': 1.72} {'loss': 0.2414, 'learning_rate': 1.0482349508589106e-06, 'epoch': 1.72} {'loss': 0.3255, 'learning_rate': 1.0480852067001556e-06, 'epoch': 1.72} {'loss': 0.3903, 'learning_rate': 1.047935472646413e-06, 'epoch': 1.72} {'loss': 0.3844, 'learning_rate': 1.047785748697845e-06, 'epoch': 1.72} {'loss': 0.28, 'learning_rate': 1.047636034854629e-06, 'epoch': 1.72} {'loss': 0.3066, 'learning_rate': 1.047486331116926e-06, 'epoch': 1.72} {'loss': 0.3856, 'learning_rate': 1.0473366374849115e-06, 'epoch': 1.72} {'loss': 0.2515, 'learning_rate': 1.047186953958751e-06, 'epoch': 1.72} {'loss': 0.4299, 'learning_rate': 1.047037280538613e-06, 'epoch': 1.72} {'loss': 0.1955, 'learning_rate': 1.0468876172246689e-06, 'epoch': 1.72} {'loss': 0.3434, 'learning_rate': 1.0467379640170837e-06, 'epoch': 1.72} {'loss': 0.3043, 'learning_rate': 1.046588320916031e-06, 'epoch': 1.72} {'loss': 0.3798, 'learning_rate': 1.046438687921676e-06, 'epoch': 1.72} {'loss': 0.3105, 'learning_rate': 1.0462890650341906e-06, 'epoch': 1.72} {'loss': 0.288, 'learning_rate': 1.0461394522537406e-06, 'epoch': 1.72} {'loss': 0.3897, 'learning_rate': 1.0459898495804977e-06, 'epoch': 1.72} {'loss': 0.3632, 'learning_rate': 1.0458402570146287e-06, 'epoch': 1.72} {'loss': 0.2594, 'learning_rate': 1.0456906745563044e-06, 'epoch': 1.72} {'loss': 0.3324, 'learning_rate': 1.0455411022056916e-06, 'epoch': 1.72} {'loss': 0.3264, 'learning_rate': 1.0453915399629611e-06, 'epoch': 1.72} {'loss': 0.4664, 'learning_rate': 1.0452419878282817e-06, 'epoch': 1.72} {'loss': 0.2489, 'learning_rate': 1.0450924458018185e-06, 'epoch': 1.72} {'loss': 0.3423, 'learning_rate': 1.0449429138837453e-06, 'epoch': 1.72} {'loss': 0.2219, 'learning_rate': 1.044793392074226e-06, 'epoch': 1.72} {'loss': 0.3296, 'learning_rate': 1.0446438803734349e-06, 'epoch': 1.72} {'loss': 0.3317, 'learning_rate': 1.0444943787815364e-06, 'epoch': 1.72} {'loss': 0.3964, 'learning_rate': 1.0443448872987017e-06, 'epoch': 1.72} {'loss': 0.3366, 'learning_rate': 1.044195405925097e-06, 'epoch': 1.72} {'loss': 0.1926, 'learning_rate': 1.0440459346608943e-06, 'epoch': 1.72} {'loss': 0.2192, 'learning_rate': 1.0438964735062596e-06, 'epoch': 1.72} {'loss': 0.3428, 'learning_rate': 1.0437470224613644e-06, 'epoch': 1.72} {'loss': 0.361, 'learning_rate': 1.0435975815263732e-06, 'epoch': 1.72} {'loss': 0.3899, 'learning_rate': 1.0434481507014593e-06, 'epoch': 1.72} {'loss': 0.1864, 'learning_rate': 1.0432987299867902e-06, 'epoch': 1.72} {'loss': 0.3553, 'learning_rate': 1.0431493193825303e-06, 'epoch': 1.72} {'loss': 0.4028, 'learning_rate': 1.042999918888854e-06, 'epoch': 1.72} {'loss': 0.4868, 'learning_rate': 1.0428505285059265e-06, 'epoch': 1.72} {'loss': 0.3679, 'learning_rate': 1.0427011482339189e-06, 'epoch': 1.72} {'loss': 0.2308, 'learning_rate': 1.0425517780729954e-06, 'epoch': 1.72} {'loss': 0.3874, 'learning_rate': 1.0424024180233305e-06, 'epoch': 1.72} {'loss': 0.3174, 'learning_rate': 1.0422530680850884e-06, 'epoch': 1.72} {'loss': 0.2462, 'learning_rate': 1.04210372825844e-06, 'epoch': 1.72} {'loss': 0.2575, 'learning_rate': 1.0419543985435522e-06, 'epoch': 1.72} {'loss': 0.3221, 'learning_rate': 1.0418050789405953e-06, 'epoch': 1.72} {'loss': 0.3151, 'learning_rate': 1.0416557694497365e-06, 'epoch': 1.72} {'loss': 0.3455, 'learning_rate': 1.0415064700711453e-06, 'epoch': 1.72} {'loss': 0.3358, 'learning_rate': 1.0413571808049905e-06, 'epoch': 1.72} {'loss': 0.3591, 'learning_rate': 1.0412079016514376e-06, 'epoch': 1.72} {'loss': 0.4799, 'learning_rate': 1.0410586326106597e-06, 'epoch': 1.72} {'loss': 0.4115, 'learning_rate': 1.0409093736828213e-06, 'epoch': 1.72} {'loss': 0.3867, 'learning_rate': 1.0407601248680942e-06, 'epoch': 1.72} {'loss': 0.266, 'learning_rate': 1.040610886166643e-06, 'epoch': 1.72} {'loss': 0.2714, 'learning_rate': 1.0404616575786408e-06, 'epoch': 1.72} {'loss': 0.1481, 'learning_rate': 1.0403124391042506e-06, 'epoch': 1.72} {'loss': 0.2747, 'learning_rate': 1.040163230743647e-06, 'epoch': 1.72} {'loss': 0.4265, 'learning_rate': 1.0400140324969933e-06, 'epoch': 1.72} {'loss': 0.2, 'learning_rate': 1.0398648443644621e-06, 'epoch': 1.72} {'loss': 0.2814, 'learning_rate': 1.0397156663462171e-06, 'epoch': 1.72} {'loss': 0.3963, 'learning_rate': 1.0395664984424313e-06, 'epoch': 1.72} {'loss': 0.2473, 'learning_rate': 1.0394173406532703e-06, 'epoch': 1.72} {'loss': 0.2859, 'learning_rate': 1.0392681929789028e-06, 'epoch': 1.72} {'loss': 0.225, 'learning_rate': 1.0391190554194985e-06, 'epoch': 1.72} {'loss': 0.3858, 'learning_rate': 1.038969927975223e-06, 'epoch': 1.72} {'loss': 0.2356, 'learning_rate': 1.0388208106462482e-06, 'epoch': 1.72} {'loss': 0.2014, 'learning_rate': 1.0386717034327386e-06, 'epoch': 1.72} {'loss': 0.3422, 'learning_rate': 1.0385226063348674e-06, 'epoch': 1.72} {'loss': 0.4554, 'learning_rate': 1.0383735193527978e-06, 'epoch': 1.72} {'loss': 0.3295, 'learning_rate': 1.0382244424867015e-06, 'epoch': 1.72} {'loss': 0.3773, 'learning_rate': 1.0380753757367446e-06, 'epoch': 1.72} {'loss': 0.2066, 'learning_rate': 1.0379263191030976e-06, 'epoch': 1.72} {'loss': 0.3155, 'learning_rate': 1.037777272585926e-06, 'epoch': 1.72} {'loss': 0.4328, 'learning_rate': 1.0376282361854017e-06, 'epoch': 1.72} {'loss': 0.1949, 'learning_rate': 1.0374792099016906e-06, 'epoch': 1.72} {'loss': 0.2386, 'learning_rate': 1.03733019373496e-06, 'epoch': 1.72} {'loss': 0.1767, 'learning_rate': 1.037181187685381e-06, 'epoch': 1.72} {'loss': 0.274, 'learning_rate': 1.0370321917531167e-06, 'epoch': 1.72} {'loss': 0.379, 'learning_rate': 1.0368832059383426e-06, 'epoch': 1.72} {'loss': 0.3016, 'learning_rate': 1.0367342302412198e-06, 'epoch': 1.72} {'loss': 0.3194, 'learning_rate': 1.0365852646619212e-06, 'epoch': 1.72} {'loss': 0.3639, 'learning_rate': 1.0364363092006124e-06, 'epoch': 1.72} {'loss': 0.2944, 'learning_rate': 1.0362873638574645e-06, 'epoch': 1.72} {'loss': 0.3054, 'learning_rate': 1.0361384286326415e-06, 'epoch': 1.72} {'loss': 0.4061, 'learning_rate': 1.0359895035263146e-06, 'epoch': 1.72} {'loss': 0.1529, 'learning_rate': 1.0358405885386502e-06, 'epoch': 1.72} {'loss': 0.2972, 'learning_rate': 1.0356916836698183e-06, 'epoch': 1.72} {'loss': 0.2748, 'learning_rate': 1.0355427889199865e-06, 'epoch': 1.72} {'loss': 0.4501, 'learning_rate': 1.0353939042893202e-06, 'epoch': 1.72} {'loss': 0.4404, 'learning_rate': 1.0352450297779915e-06, 'epoch': 1.72} {'loss': 0.3135, 'learning_rate': 1.0350961653861636e-06, 'epoch': 1.72} {'loss': 0.4263, 'learning_rate': 1.0349473111140107e-06, 'epoch': 1.72} {'loss': 0.2493, 'learning_rate': 1.0347984669616951e-06, 'epoch': 1.72} {'loss': 0.2958, 'learning_rate': 1.0346496329293887e-06, 'epoch': 1.72} {'loss': 0.4136, 'learning_rate': 1.0345008090172558e-06, 'epoch': 1.72} {'loss': 0.1942, 'learning_rate': 1.0343519952254688e-06, 'epoch': 1.72} {'loss': 0.4125, 'learning_rate': 1.0342031915541927e-06, 'epoch': 1.72} {'loss': 0.2548, 'learning_rate': 1.0340543980035967e-06, 'epoch': 1.72} {'loss': 0.1992, 'learning_rate': 1.0339056145738468e-06, 'epoch': 1.72} {'loss': 0.4158, 'learning_rate': 1.0337568412651156e-06, 'epoch': 1.72} {'loss': 0.4433, 'learning_rate': 1.0336080780775647e-06, 'epoch': 1.72} {'loss': 0.3111, 'learning_rate': 1.033459325011368e-06, 'epoch': 1.72} {'loss': 0.2647, 'learning_rate': 1.0333105820666888e-06, 'epoch': 1.72} {'loss': 0.272, 'learning_rate': 1.0331618492436968e-06, 'epoch': 1.72} {'loss': 0.3299, 'learning_rate': 1.0330131265425592e-06, 'epoch': 1.72} {'loss': 0.1448, 'learning_rate': 1.0328644139634448e-06, 'epoch': 1.72} {'loss': 0.3535, 'learning_rate': 1.0327157115065234e-06, 'epoch': 1.72} {'loss': 0.2965, 'learning_rate': 1.0325670191719595e-06, 'epoch': 1.72} {'loss': 0.2651, 'learning_rate': 1.0324183369599228e-06, 'epoch': 1.72} {'loss': 0.248, 'learning_rate': 1.032269664870581e-06, 'epoch': 1.72} {'loss': 0.278, 'learning_rate': 1.0321210029040995e-06, 'epoch': 1.72} {'loss': 0.3001, 'learning_rate': 1.0319723510606505e-06, 'epoch': 1.72} {'loss': 0.1349, 'learning_rate': 1.031823709340397e-06, 'epoch': 1.72} {'loss': 0.3225, 'learning_rate': 1.0316750777435115e-06, 'epoch': 1.72} {'loss': 0.2093, 'learning_rate': 1.0315264562701565e-06, 'epoch': 1.72} {'loss': 0.2301, 'learning_rate': 1.0313778449205047e-06, 'epoch': 1.72} {'loss': 0.3382, 'learning_rate': 1.0312292436947212e-06, 'epoch': 1.72} {'loss': 0.2134, 'learning_rate': 1.031080652592975e-06, 'epoch': 1.72} {'loss': 0.1862, 'learning_rate': 1.0309320716154325e-06, 'epoch': 1.72} {'loss': 0.3339, 'learning_rate': 1.0307835007622636e-06, 'epoch': 1.72} {'loss': 0.3198, 'learning_rate': 1.0306349400336323e-06, 'epoch': 1.72} {'loss': 0.2775, 'learning_rate': 1.0304863894297102e-06, 'epoch': 1.72} {'loss': 0.4624, 'learning_rate': 1.0303378489506644e-06, 'epoch': 1.72} {'loss': 0.2897, 'learning_rate': 1.0301893185966584e-06, 'epoch': 1.72} {'loss': 0.3113, 'learning_rate': 1.0300407983678663e-06, 'epoch': 1.72} {'loss': 0.3621, 'learning_rate': 1.029892288264449e-06, 'epoch': 1.72} {'loss': 0.3412, 'learning_rate': 1.0297437882865801e-06, 'epoch': 1.72} {'loss': 0.3321, 'learning_rate': 1.0295952984344226e-06, 'epoch': 1.72} {'loss': 0.5066, 'learning_rate': 1.0294468187081486e-06, 'epoch': 1.72} {'loss': 0.333, 'learning_rate': 1.0292983491079212e-06, 'epoch': 1.72} {'loss': 0.3038, 'learning_rate': 1.0291498896339125e-06, 'epoch': 1.72} {'loss': 0.3897, 'learning_rate': 1.0290014402862846e-06, 'epoch': 1.72} {'loss': 0.3478, 'learning_rate': 1.0288530010652108e-06, 'epoch': 1.72} {'loss': 0.4674, 'learning_rate': 1.0287045719708543e-06, 'epoch': 1.72} {'loss': 0.4188, 'learning_rate': 1.028556153003386e-06, 'epoch': 1.72} {'loss': 0.2479, 'learning_rate': 1.0284077441629714e-06, 'epoch': 1.72} {'loss': 0.4395, 'learning_rate': 1.0282593454497768e-06, 'epoch': 1.72} {'loss': 0.3234, 'learning_rate': 1.0281109568639735e-06, 'epoch': 1.72} {'loss': 0.3255, 'learning_rate': 1.0279625784057257e-06, 'epoch': 1.72} {'loss': 0.2747, 'learning_rate': 1.0278142100752032e-06, 'epoch': 1.72} {'loss': 0.1267, 'learning_rate': 1.0276658518725691e-06, 'epoch': 1.72} {'loss': 0.2899, 'learning_rate': 1.0275175037979978e-06, 'epoch': 1.72} {'loss': 0.2956, 'learning_rate': 1.0273691658516505e-06, 'epoch': 1.72} {'loss': 0.1894, 'learning_rate': 1.027220838033699e-06, 'epoch': 1.72} {'loss': 0.1883, 'learning_rate': 1.0270725203443065e-06, 'epoch': 1.72} {'loss': 0.4284, 'learning_rate': 1.0269242127836465e-06, 'epoch': 1.72} {'loss': 0.2703, 'learning_rate': 1.0267759153518798e-06, 'epoch': 1.72} {'loss': 0.2071, 'learning_rate': 1.0266276280491782e-06, 'epoch': 1.72} {'loss': 0.3049, 'learning_rate': 1.0264793508757076e-06, 'epoch': 1.72} {'loss': 0.2846, 'learning_rate': 1.0263310838316343e-06, 'epoch': 1.72} {'loss': 0.3371, 'learning_rate': 1.026182826917128e-06, 'epoch': 1.72} {'loss': 0.2058, 'learning_rate': 1.0260345801323534e-06, 'epoch': 1.72} {'loss': 0.2398, 'learning_rate': 1.0258863434774813e-06, 'epoch': 1.72} {'loss': 0.2877, 'learning_rate': 1.0257381169526749e-06, 'epoch': 1.72} {'loss': 0.4091, 'learning_rate': 1.025589900558105e-06, 'epoch': 1.72} {'loss': 0.1653, 'learning_rate': 1.0254416942939361e-06, 'epoch': 1.72} {'loss': 0.3306, 'learning_rate': 1.025293498160339e-06, 'epoch': 1.72} {'loss': 0.2954, 'learning_rate': 1.0251453121574772e-06, 'epoch': 1.72} {'loss': 0.2741, 'learning_rate': 1.0249971362855216e-06, 'epoch': 1.72} {'loss': 0.3179, 'learning_rate': 1.024848970544635e-06, 'epoch': 1.72} {'loss': 0.4614, 'learning_rate': 1.0247008149349892e-06, 'epoch': 1.72} {'loss': 0.1676, 'learning_rate': 1.0245526694567499e-06, 'epoch': 1.72} {'loss': 0.2696, 'learning_rate': 1.0244045341100817e-06, 'epoch': 1.72} {'loss': 0.2922, 'learning_rate': 1.0242564088951556e-06, 'epoch': 1.72} {'loss': 0.2805, 'learning_rate': 1.024108293812136e-06, 'epoch': 1.72} {'loss': 0.2791, 'learning_rate': 1.0239601888611927e-06, 'epoch': 1.72} {'loss': 0.3476, 'learning_rate': 1.02381209404249e-06, 'epoch': 1.72} {'loss': 0.1344, 'learning_rate': 1.0236640093561977e-06, 'epoch': 1.72} {'loss': 0.424, 'learning_rate': 1.0235159348024803e-06, 'epoch': 1.72} {'loss': 0.3754, 'learning_rate': 1.0233678703815087e-06, 'epoch': 1.72} {'loss': 0.2048, 'learning_rate': 1.0232198160934458e-06, 'epoch': 1.72} {'loss': 0.3634, 'learning_rate': 1.0230717719384619e-06, 'epoch': 1.72} {'loss': 0.3196, 'learning_rate': 1.0229237379167224e-06, 'epoch': 1.72} {'loss': 0.3466, 'learning_rate': 1.0227757140283957e-06, 'epoch': 1.72} {'loss': 0.4982, 'learning_rate': 1.0226277002736485e-06, 'epoch': 1.72} {'loss': 0.1919, 'learning_rate': 1.0224796966526452e-06, 'epoch': 1.72} {'loss': 0.2561, 'learning_rate': 1.0223317031655577e-06, 'epoch': 1.72} {'loss': 0.1999, 'learning_rate': 1.0221837198125484e-06, 'epoch': 1.72} {'loss': 0.4004, 'learning_rate': 1.022035746593788e-06, 'epoch': 1.72} {'loss': 0.3255, 'learning_rate': 1.021887783509441e-06, 'epoch': 1.72} {'loss': 0.2713, 'learning_rate': 1.021739830559676e-06, 'epoch': 1.72} {'loss': 0.4285, 'learning_rate': 1.0215918877446584e-06, 'epoch': 1.72} {'loss': 0.2756, 'learning_rate': 1.0214439550645583e-06, 'epoch': 1.72} {'loss': 0.3452, 'learning_rate': 1.0212960325195387e-06, 'epoch': 1.72} {'loss': 0.1896, 'learning_rate': 1.0211481201097695e-06, 'epoch': 1.72} {'loss': 0.6267, 'learning_rate': 1.021000217835415e-06, 'epoch': 1.72} {'loss': 0.3795, 'learning_rate': 1.0208523256966463e-06, 'epoch': 1.72} {'loss': 0.2142, 'learning_rate': 1.0207044436936276e-06, 'epoch': 1.72} {'loss': 0.3538, 'learning_rate': 1.0205565718265243e-06, 'epoch': 1.72} {'loss': 0.2363, 'learning_rate': 1.0204087100955072e-06, 'epoch': 1.72} {'loss': 0.4236, 'learning_rate': 1.0202608585007389e-06, 'epoch': 1.72} {'loss': 0.369, 'learning_rate': 1.02011301704239e-06, 'epoch': 1.72} {'loss': 0.3571, 'learning_rate': 1.019965185720625e-06, 'epoch': 1.72} {'loss': 0.3748, 'learning_rate': 1.0198173645356135e-06, 'epoch': 1.72} {'loss': 0.2845, 'learning_rate': 1.0196695534875178e-06, 'epoch': 1.72} {'loss': 0.1916, 'learning_rate': 1.01952175257651e-06, 'epoch': 1.72} {'loss': 0.3066, 'learning_rate': 1.019373961802752e-06, 'epoch': 1.72} {'loss': 0.2967, 'learning_rate': 1.019226181166415e-06, 'epoch': 1.72} {'loss': 0.3201, 'learning_rate': 1.019078410667662e-06, 'epoch': 1.72} {'loss': 0.1666, 'learning_rate': 1.0189306503066644e-06, 'epoch': 1.72} {'loss': 0.2785, 'learning_rate': 1.0187829000835857e-06, 'epoch': 1.72} {'loss': 0.3606, 'learning_rate': 1.0186351599985911e-06, 'epoch': 1.72} {'loss': 0.2969, 'learning_rate': 1.0184874300518522e-06, 'epoch': 1.72} {'loss': 0.3395, 'learning_rate': 1.0183397102435289e-06, 'epoch': 1.72} {'loss': 0.3178, 'learning_rate': 1.0181920005737956e-06, 'epoch': 1.72} {'loss': 0.1504, 'learning_rate': 1.0180443010428132e-06, 'epoch': 1.72} {'loss': 0.3088, 'learning_rate': 1.0178966116507537e-06, 'epoch': 1.72} {'loss': 0.3711, 'learning_rate': 1.0177489323977807e-06, 'epoch': 1.72} {'loss': 0.4188, 'learning_rate': 1.0176012632840583e-06, 'epoch': 1.72} {'loss': 0.3363, 'learning_rate': 1.0174536043097594e-06, 'epoch': 1.72} {'loss': 0.3251, 'learning_rate': 1.0173059554750441e-06, 'epoch': 1.72} {'loss': 0.2384, 'learning_rate': 1.0171583167800847e-06, 'epoch': 1.72} {'loss': 0.3247, 'learning_rate': 1.017010688225043e-06, 'epoch': 1.72} {'loss': 0.3116, 'learning_rate': 1.0168630698100902e-06, 'epoch': 1.72} {'loss': 0.2749, 'learning_rate': 1.0167154615353892e-06, 'epoch': 1.72} {'loss': 0.2796, 'learning_rate': 1.01656786340111e-06, 'epoch': 1.72} {'loss': 0.2187, 'learning_rate': 1.016420275407416e-06, 'epoch': 1.72} {'loss': 0.2479, 'learning_rate': 1.0162726975544757e-06, 'epoch': 1.72} {'loss': 0.3619, 'learning_rate': 1.0161251298424546e-06, 'epoch': 1.72} {'loss': 0.257, 'learning_rate': 1.0159775722715215e-06, 'epoch': 1.72} {'loss': 0.2954, 'learning_rate': 1.0158300248418385e-06, 'epoch': 1.72} {'loss': 0.3036, 'learning_rate': 1.0156824875535775e-06, 'epoch': 1.72} {'loss': 0.3585, 'learning_rate': 1.0155349604069032e-06, 'epoch': 1.72} {'loss': 0.2388, 'learning_rate': 1.0153874434019785e-06, 'epoch': 1.72} {'loss': 0.3007, 'learning_rate': 1.0152399365389754e-06, 'epoch': 1.72} {'loss': 0.3879, 'learning_rate': 1.0150924398180562e-06, 'epoch': 1.72} {'loss': 0.343, 'learning_rate': 1.0149449532393907e-06, 'epoch': 1.72} {'loss': 0.2422, 'learning_rate': 1.014797476803141e-06, 'epoch': 1.72} {'loss': 0.2257, 'learning_rate': 1.0146500105094792e-06, 'epoch': 1.72} {'loss': 0.4027, 'learning_rate': 1.0145025543585674e-06, 'epoch': 1.72} {'loss': 0.3088, 'learning_rate': 1.0143551083505742e-06, 'epoch': 1.72} {'loss': 0.198, 'learning_rate': 1.0142076724856642e-06, 'epoch': 1.72} {'loss': 0.284, 'learning_rate': 1.014060246764007e-06, 'epoch': 1.72} {'loss': 0.3322, 'learning_rate': 1.013912831185765e-06, 'epoch': 1.72} {'loss': 0.2797, 'learning_rate': 1.0137654257511088e-06, 'epoch': 1.72} {'loss': 0.2112, 'learning_rate': 1.0136180304602018e-06, 'epoch': 1.72} {'loss': 0.382, 'learning_rate': 1.0134706453132093e-06, 'epoch': 1.72} {'loss': 0.4075, 'learning_rate': 1.0133232703103025e-06, 'epoch': 1.72} {'loss': 0.3455, 'learning_rate': 1.013175905451642e-06, 'epoch': 1.72} {'loss': 0.2952, 'learning_rate': 1.0130285507373995e-06, 'epoch': 1.72} {'loss': 0.4472, 'learning_rate': 1.0128812061677374e-06, 'epoch': 1.72} {'loss': 0.2566, 'learning_rate': 1.0127338717428238e-06, 'epoch': 1.72} {'loss': 0.2628, 'learning_rate': 1.0125865474628237e-06, 'epoch': 1.72} {'loss': 0.3754, 'learning_rate': 1.0124392333279065e-06, 'epoch': 1.72} {'loss': 0.2562, 'learning_rate': 1.0122919293382339e-06, 'epoch': 1.72} {'loss': 0.3216, 'learning_rate': 1.0121446354939767e-06, 'epoch': 1.72} {'loss': 0.2853, 'learning_rate': 1.0119973517952975e-06, 'epoch': 1.72} {'loss': 0.3019, 'learning_rate': 1.0118500782423657e-06, 'epoch': 1.72} {'loss': 0.2258, 'learning_rate': 1.0117028148353458e-06, 'epoch': 1.72} {'loss': 0.3645, 'learning_rate': 1.011555561574402e-06, 'epoch': 1.72} {'loss': 0.2439, 'learning_rate': 1.0114083184597056e-06, 'epoch': 1.72} {'loss': 0.2807, 'learning_rate': 1.0112610854914173e-06, 'epoch': 1.72} {'loss': 0.2699, 'learning_rate': 1.0111138626697092e-06, 'epoch': 1.72} {'loss': 0.4253, 'learning_rate': 1.0109666499947413e-06, 'epoch': 1.72} {'loss': 0.3011, 'learning_rate': 1.0108194474666843e-06, 'epoch': 1.72} {'loss': 0.3335, 'learning_rate': 1.0106722550857006e-06, 'epoch': 1.72} {'loss': 0.3163, 'learning_rate': 1.0105250728519612e-06, 'epoch': 1.72} {'loss': 0.2174, 'learning_rate': 1.0103779007656278e-06, 'epoch': 1.72} {'loss': 0.2782, 'learning_rate': 1.0102307388268695e-06, 'epoch': 1.72} {'loss': 0.2963, 'learning_rate': 1.0100835870358506e-06, 'epoch': 1.72} {'loss': 0.4004, 'learning_rate': 1.0099364453927385e-06, 'epoch': 1.72} {'loss': 0.276, 'learning_rate': 1.0097893138976988e-06, 'epoch': 1.72} {'loss': 0.2821, 'learning_rate': 1.0096421925508958e-06, 'epoch': 1.72} {'loss': 0.3086, 'learning_rate': 1.0094950813524983e-06, 'epoch': 1.72} {'loss': 0.2568, 'learning_rate': 1.0093479803026707e-06, 'epoch': 1.72} {'loss': 0.4265, 'learning_rate': 1.0092008894015804e-06, 'epoch': 1.72} {'loss': 0.2331, 'learning_rate': 1.0090538086493907e-06, 'epoch': 1.72} {'loss': 0.3395, 'learning_rate': 1.0089067380462724e-06, 'epoch': 1.72} {'loss': 0.3841, 'learning_rate': 1.0087596775923858e-06, 'epoch': 1.72} {'loss': 0.2258, 'learning_rate': 1.0086126272879016e-06, 'epoch': 1.72} {'loss': 0.3155, 'learning_rate': 1.0084655871329829e-06, 'epoch': 1.72} {'loss': 0.2889, 'learning_rate': 1.0083185571277987e-06, 'epoch': 1.72} {'loss': 0.4393, 'learning_rate': 1.00817153727251e-06, 'epoch': 1.72} {'loss': 0.3259, 'learning_rate': 1.0080245275672885e-06, 'epoch': 1.72} {'loss': 0.5215, 'learning_rate': 1.0078775280122965e-06, 'epoch': 1.72} {'loss': 0.2594, 'learning_rate': 1.0077305386076997e-06, 'epoch': 1.72} {'loss': 0.3193, 'learning_rate': 1.0075835593536677e-06, 'epoch': 1.72} {'loss': 0.3453, 'learning_rate': 1.0074365902503603e-06, 'epoch': 1.72} {'loss': 0.2203, 'learning_rate': 1.0072896312979507e-06, 'epoch': 1.72} {'loss': 0.2018, 'learning_rate': 1.007142682496598e-06, 'epoch': 1.72} {'loss': 0.2944, 'learning_rate': 1.0069957438464728e-06, 'epoch': 1.72} {'loss': 0.1851, 'learning_rate': 1.0068488153477386e-06, 'epoch': 1.72} {'loss': 0.2984, 'learning_rate': 1.0067018970005627e-06, 'epoch': 1.72} {'loss': 0.2838, 'learning_rate': 1.0065549888051084e-06, 'epoch': 1.72} {'loss': 0.166, 'learning_rate': 1.0064080907615459e-06, 'epoch': 1.72} {'loss': 0.2926, 'learning_rate': 1.006261202870037e-06, 'epoch': 1.72} {'loss': 0.2361, 'learning_rate': 1.0061143251307492e-06, 'epoch': 1.72} {'loss': 0.2097, 'learning_rate': 1.0059674575438493e-06, 'epoch': 1.72} {'loss': 0.2294, 'learning_rate': 1.0058206001094995e-06, 'epoch': 1.72} {'loss': 0.324, 'learning_rate': 1.0056737528278703e-06, 'epoch': 1.72} {'loss': 0.198, 'learning_rate': 1.0055269156991233e-06, 'epoch': 1.72} {'loss': 0.2988, 'learning_rate': 1.0053800887234266e-06, 'epoch': 1.72} {'loss': 0.3285, 'learning_rate': 1.005233271900945e-06, 'epoch': 1.72} {'loss': 0.2874, 'learning_rate': 1.0050864652318459e-06, 'epoch': 1.72} {'loss': 0.3708, 'learning_rate': 1.0049396687162915e-06, 'epoch': 1.72} {'loss': 0.2102, 'learning_rate': 1.0047928823544516e-06, 'epoch': 1.72} {'loss': 0.4321, 'learning_rate': 1.0046461061464885e-06, 'epoch': 1.72} {'loss': 0.4608, 'learning_rate': 1.0044993400925718e-06, 'epoch': 1.72} {'loss': 0.2015, 'learning_rate': 1.0043525841928614e-06, 'epoch': 1.72} {'loss': 0.2517, 'learning_rate': 1.0042058384475295e-06, 'epoch': 1.72} {'loss': 0.3083, 'learning_rate': 1.0040591028567382e-06, 'epoch': 1.72} {'loss': 0.381, 'learning_rate': 1.0039123774206515e-06, 'epoch': 1.72} {'loss': 0.3337, 'learning_rate': 1.0037656621394377e-06, 'epoch': 1.72} {'loss': 0.4133, 'learning_rate': 1.0036189570132604e-06, 'epoch': 1.72} {'loss': 0.2545, 'learning_rate': 1.0034722620422898e-06, 'epoch': 1.72} {'loss': 0.3394, 'learning_rate': 1.0033255772266858e-06, 'epoch': 1.72} {'loss': 0.3533, 'learning_rate': 1.0031789025666184e-06, 'epoch': 1.72} {'loss': 0.3538, 'learning_rate': 1.0030322380622514e-06, 'epoch': 1.72} {'loss': 0.2187, 'learning_rate': 1.0028855837137475e-06, 'epoch': 1.72} {'loss': 0.43, 'learning_rate': 1.0027389395212773e-06, 'epoch': 1.72} {'loss': 0.2949, 'learning_rate': 1.0025923054850018e-06, 'epoch': 1.72} {'loss': 0.2791, 'learning_rate': 1.0024456816050908e-06, 'epoch': 1.72} {'loss': 0.3538, 'learning_rate': 1.0022990678817056e-06, 'epoch': 1.72} {'loss': 0.3623, 'learning_rate': 1.002152464315016e-06, 'epoch': 1.72} {'loss': 0.304, 'learning_rate': 1.0020058709051839e-06, 'epoch': 1.72} {'loss': 0.1699, 'learning_rate': 1.0018592876523768e-06, 'epoch': 1.72} {'loss': 0.2517, 'learning_rate': 1.0017127145567584e-06, 'epoch': 1.72} {'loss': 0.3397, 'learning_rate': 1.001566151618496e-06, 'epoch': 1.72} {'loss': 0.2825, 'learning_rate': 1.001419598837754e-06, 'epoch': 1.72} {'loss': 0.2852, 'learning_rate': 1.0012730562146989e-06, 'epoch': 1.72} {'loss': 0.3585, 'learning_rate': 1.001126523749496e-06, 'epoch': 1.72} {'loss': 0.2292, 'learning_rate': 1.0009800014423077e-06, 'epoch': 1.72} {'loss': 0.3667, 'learning_rate': 1.0008334892933036e-06, 'epoch': 1.72} {'loss': 0.1447, 'learning_rate': 1.0006869873026448e-06, 'epoch': 1.72} {'loss': 0.4024, 'learning_rate': 1.0005404954705023e-06, 'epoch': 1.72} {'loss': 0.4162, 'learning_rate': 1.0003940137970357e-06, 'epoch': 1.72} {'loss': 0.3102, 'learning_rate': 1.0002475422824142e-06, 'epoch': 1.72} {'loss': 0.4124, 'learning_rate': 1.0001010809268009e-06, 'epoch': 1.72} {'loss': 0.298, 'learning_rate': 9.99954629730363e-07, 'epoch': 1.72} {'loss': 0.2663, 'learning_rate': 9.998081886932643e-07, 'epoch': 1.72} {'loss': 0.3726, 'learning_rate': 9.99661757815672e-07, 'epoch': 1.72} {'loss': 0.2012, 'learning_rate': 9.995153370977474e-07, 'epoch': 1.72} {'loss': 0.3231, 'learning_rate': 9.99368926539661e-07, 'epoch': 1.72} {'loss': 0.2926, 'learning_rate': 9.992225261415755e-07, 'epoch': 1.72} {'loss': 0.3623, 'learning_rate': 9.99076135903655e-07, 'epoch': 1.72} {'loss': 0.2143, 'learning_rate': 9.989297558260669e-07, 'epoch': 1.72} {'loss': 0.242, 'learning_rate': 9.987833859089736e-07, 'epoch': 1.72} {'loss': 0.4378, 'learning_rate': 9.986370261525446e-07, 'epoch': 1.72} {'loss': 0.3632, 'learning_rate': 9.984906765569402e-07, 'epoch': 1.72} {'loss': 0.2789, 'learning_rate': 9.98344337122331e-07, 'epoch': 1.72} {'loss': 0.2776, 'learning_rate': 9.981980078488762e-07, 'epoch': 1.72} {'loss': 0.2771, 'learning_rate': 9.980516887367464e-07, 'epoch': 1.72} {'loss': 0.2364, 'learning_rate': 9.979053797861026e-07, 'epoch': 1.72} {'loss': 0.3028, 'learning_rate': 9.977590809971139e-07, 'epoch': 1.72} {'loss': 0.4212, 'learning_rate': 9.976127923699419e-07, 'epoch': 1.72} {'loss': 0.3933, 'learning_rate': 9.974665139047546e-07, 'epoch': 1.72} {'loss': 0.1991, 'learning_rate': 9.97320245601715e-07, 'epoch': 1.72} {'loss': 0.4264, 'learning_rate': 9.971739874609877e-07, 'epoch': 1.72} {'loss': 0.3733, 'learning_rate': 9.97027739482741e-07, 'epoch': 1.72} {'loss': 0.2679, 'learning_rate': 9.968815016671363e-07, 'epoch': 1.72} {'loss': 0.4256, 'learning_rate': 9.967352740143421e-07, 'epoch': 1.72} {'loss': 0.2623, 'learning_rate': 9.965890565245195e-07, 'epoch': 1.72} {'loss': 0.2847, 'learning_rate': 9.964428491978373e-07, 'epoch': 1.72} {'loss': 0.3291, 'learning_rate': 9.962966520344575e-07, 'epoch': 1.72} {'loss': 0.4228, 'learning_rate': 9.961504650345489e-07, 'epoch': 1.72} {'loss': 0.4182, 'learning_rate': 9.960042881982724e-07, 'epoch': 1.72} {'loss': 0.2475, 'learning_rate': 9.958581215257956e-07, 'epoch': 1.72} {'loss': 0.3288, 'learning_rate': 9.95711965017282e-07, 'epoch': 1.72} {'loss': 0.2291, 'learning_rate': 9.95565818672899e-07, 'epoch': 1.72} {'loss': 0.3025, 'learning_rate': 9.954196824928098e-07, 'epoch': 1.72} {'loss': 0.1666, 'learning_rate': 9.952735564771775e-07, 'epoch': 1.72} {'loss': 0.2589, 'learning_rate': 9.951274406261712e-07, 'epoch': 1.72} {'loss': 0.3298, 'learning_rate': 9.949813349399517e-07, 'epoch': 1.72} {'loss': 0.2993, 'learning_rate': 9.948352394186878e-07, 'epoch': 1.72} {'loss': 0.2839, 'learning_rate': 9.946891540625403e-07, 'epoch': 1.72} {'loss': 0.3607, 'learning_rate': 9.945430788716792e-07, 'epoch': 1.72} {'loss': 0.2443, 'learning_rate': 9.943970138462632e-07, 'epoch': 1.72} {'loss': 0.402, 'learning_rate': 9.942509589864636e-07, 'epoch': 1.72} {'loss': 0.3256, 'learning_rate': 9.941049142924398e-07, 'epoch': 1.72} {'loss': 0.3844, 'learning_rate': 9.939588797643606e-07, 'epoch': 1.72} {'loss': 0.3622, 'learning_rate': 9.938128554023873e-07, 'epoch': 1.72} {'loss': 0.2467, 'learning_rate': 9.936668412066885e-07, 'epoch': 1.72} {'loss': 0.3308, 'learning_rate': 9.935208371774263e-07, 'epoch': 1.72} {'loss': 0.2858, 'learning_rate': 9.933748433147672e-07, 'epoch': 1.72} {'loss': 0.5045, 'learning_rate': 9.932288596188756e-07, 'epoch': 1.72} {'loss': 0.2469, 'learning_rate': 9.930828860899145e-07, 'epoch': 1.72} {'loss': 0.2675, 'learning_rate': 9.929369227280517e-07, 'epoch': 1.72} {'loss': 0.4202, 'learning_rate': 9.92790969533448e-07, 'epoch': 1.72} {'loss': 0.3108, 'learning_rate': 9.926450265062725e-07, 'epoch': 1.72} {'loss': 0.3856, 'learning_rate': 9.92499093646686e-07, 'epoch': 1.72} {'loss': 0.3166, 'learning_rate': 9.923531709548573e-07, 'epoch': 1.72} {'loss': 0.4308, 'learning_rate': 9.922072584309471e-07, 'epoch': 1.72} {'loss': 0.4107, 'learning_rate': 9.920613560751246e-07, 'epoch': 1.72} {'loss': 0.2821, 'learning_rate': 9.919154638875493e-07, 'epoch': 1.72} {'loss': 0.2146, 'learning_rate': 9.917695818683903e-07, 'epoch': 1.72} {'loss': 0.4127, 'learning_rate': 9.916237100178082e-07, 'epoch': 1.72} {'loss': 0.2657, 'learning_rate': 9.91477848335972e-07, 'epoch': 1.72} {'loss': 0.2733, 'learning_rate': 9.913319968230451e-07, 'epoch': 1.72} {'loss': 0.3097, 'learning_rate': 9.91186155479188e-07, 'epoch': 1.72} {'loss': 0.196, 'learning_rate': 9.91040324304572e-07, 'epoch': 1.72} {'loss': 0.2497, 'learning_rate': 9.908945032993556e-07, 'epoch': 1.72} {'loss': 0.2301, 'learning_rate': 9.907486924637077e-07, 'epoch': 1.72} {'loss': 0.4147, 'learning_rate': 9.906028917977906e-07, 'epoch': 1.72} {'loss': 0.2985, 'learning_rate': 9.904571013017705e-07, 'epoch': 1.72} {'loss': 0.3356, 'learning_rate': 9.903113209758098e-07, 'epoch': 1.72} {'loss': 0.3207, 'learning_rate': 9.901655508200757e-07, 'epoch': 1.72} {'loss': 0.3146, 'learning_rate': 9.900197908347298e-07, 'epoch': 1.72} {'loss': 0.2764, 'learning_rate': 9.898740410199392e-07, 'epoch': 1.72} {'loss': 0.3028, 'learning_rate': 9.897283013758674e-07, 'epoch': 1.72} {'loss': 0.2869, 'learning_rate': 9.895825719026796e-07, 'epoch': 1.72} {'loss': 0.4119, 'learning_rate': 9.894368526005394e-07, 'epoch': 1.72} {'loss': 0.2916, 'learning_rate': 9.892911434696107e-07, 'epoch': 1.72} {'loss': 0.2646, 'learning_rate': 9.89145444510058e-07, 'epoch': 1.72} {'loss': 0.3206, 'learning_rate': 9.889997557220476e-07, 'epoch': 1.72} {'loss': 0.2791, 'learning_rate': 9.888540771057442e-07, 'epoch': 1.72} {'loss': 0.3179, 'learning_rate': 9.887084086613087e-07, 'epoch': 1.72} {'loss': 0.3417, 'learning_rate': 9.885627503889107e-07, 'epoch': 1.72} {'loss': 0.2177, 'learning_rate': 9.884171022887113e-07, 'epoch': 1.72} {'loss': 0.3378, 'learning_rate': 9.882714643608726e-07, 'epoch': 1.72} {'loss': 0.4095, 'learning_rate': 9.881258366055646e-07, 'epoch': 1.72} {'loss': 0.2656, 'learning_rate': 9.87980219022947e-07, 'epoch': 1.72} {'loss': 0.3166, 'learning_rate': 9.878346116131877e-07, 'epoch': 1.72} {'loss': 0.4552, 'learning_rate': 9.876890143764473e-07, 'epoch': 1.72} {'loss': 0.2859, 'learning_rate': 9.875434273128937e-07, 'epoch': 1.72} {'loss': 0.2713, 'learning_rate': 9.873978504226888e-07, 'epoch': 1.72} {'loss': 0.3454, 'learning_rate': 9.872522837059995e-07, 'epoch': 1.72} {'loss': 0.2866, 'learning_rate': 9.871067271629865e-07, 'epoch': 1.72} {'loss': 0.3027, 'learning_rate': 9.869611807938184e-07, 'epoch': 1.72} {'loss': 0.3201, 'learning_rate': 9.868156445986554e-07, 'epoch': 1.72} {'loss': 0.421, 'learning_rate': 9.86670118577665e-07, 'epoch': 1.72} {'loss': 0.3125, 'learning_rate': 9.865246027310094e-07, 'epoch': 1.72} {'loss': 0.252, 'learning_rate': 9.863790970588528e-07, 'epoch': 1.72} {'loss': 0.2767, 'learning_rate': 9.862336015613616e-07, 'epoch': 1.72} {'loss': 0.3505, 'learning_rate': 9.860881162386971e-07, 'epoch': 1.72} {'loss': 0.3048, 'learning_rate': 9.859426410910268e-07, 'epoch': 1.72} {'loss': 0.5088, 'learning_rate': 9.857971761185114e-07, 'epoch': 1.72} {'loss': 0.3097, 'learning_rate': 9.85651721321318e-07, 'epoch': 1.72} {'loss': 0.2703, 'learning_rate': 9.855062766996082e-07, 'epoch': 1.72} {'loss': 0.2967, 'learning_rate': 9.8536084225355e-07, 'epoch': 1.72} {'loss': 0.3993, 'learning_rate': 9.852154179833028e-07, 'epoch': 1.72} {'loss': 0.2579, 'learning_rate': 9.850700038890348e-07, 'epoch': 1.72} {'loss': 0.3577, 'learning_rate': 9.849245999709067e-07, 'epoch': 1.72} {'loss': 0.2434, 'learning_rate': 9.847792062290873e-07, 'epoch': 1.72} {'loss': 0.199, 'learning_rate': 9.846338226637364e-07, 'epoch': 1.72} {'loss': 0.2807, 'learning_rate': 9.844884492750185e-07, 'epoch': 1.72} {'loss': 0.3922, 'learning_rate': 9.843430860631008e-07, 'epoch': 1.72} {'loss': 0.3112, 'learning_rate': 9.841977330281426e-07, 'epoch': 1.72} {'loss': 0.3452, 'learning_rate': 9.840523901703137e-07, 'epoch': 1.72} {'loss': 0.4031, 'learning_rate': 9.839070574897725e-07, 'epoch': 1.72} {'loss': 0.3353, 'learning_rate': 9.837617349866878e-07, 'epoch': 1.72} {'loss': 0.3275, 'learning_rate': 9.8361642266122e-07, 'epoch': 1.72} {'loss': 0.2039, 'learning_rate': 9.83471120513536e-07, 'epoch': 1.72} {'loss': 0.3126, 'learning_rate': 9.833258285437973e-07, 'epoch': 1.72} {'loss': 0.1737, 'learning_rate': 9.831805467521715e-07, 'epoch': 1.72} {'loss': 0.3795, 'learning_rate': 9.830352751388172e-07, 'epoch': 1.72} {'loss': 0.4184, 'learning_rate': 9.828900137039043e-07, 'epoch': 1.72} {'loss': 0.2866, 'learning_rate': 9.827447624475928e-07, 'epoch': 1.72} {'loss': 0.2702, 'learning_rate': 9.825995213700469e-07, 'epoch': 1.72} {'loss': 0.2561, 'learning_rate': 9.824542904714328e-07, 'epoch': 1.72} {'loss': 0.2219, 'learning_rate': 9.82309069751911e-07, 'epoch': 1.72} {'loss': 0.1514, 'learning_rate': 9.82163859211649e-07, 'epoch': 1.72} {'loss': 0.5362, 'learning_rate': 9.820186588508084e-07, 'epoch': 1.72} {'loss': 0.2043, 'learning_rate': 9.818734686695552e-07, 'epoch': 1.72} {'loss': 0.3935, 'learning_rate': 9.817282886680502e-07, 'epoch': 1.72} {'loss': 0.4247, 'learning_rate': 9.815831188464608e-07, 'epoch': 1.72} {'loss': 0.2734, 'learning_rate': 9.814379592049472e-07, 'epoch': 1.72} {'loss': 0.2187, 'learning_rate': 9.812928097436768e-07, 'epoch': 1.72} {'loss': 0.2821, 'learning_rate': 9.811476704628098e-07, 'epoch': 1.72} {'loss': 0.264, 'learning_rate': 9.810025413625147e-07, 'epoch': 1.72} {'loss': 0.3405, 'learning_rate': 9.808574224429524e-07, 'epoch': 1.72} {'loss': 0.3209, 'learning_rate': 9.80712313704285e-07, 'epoch': 1.72} {'loss': 0.3536, 'learning_rate': 9.805672151466804e-07, 'epoch': 1.72} {'loss': 0.2794, 'learning_rate': 9.804221267702985e-07, 'epoch': 1.72} {'loss': 0.3306, 'learning_rate': 9.802770485753066e-07, 'epoch': 1.72} {'loss': 0.3586, 'learning_rate': 9.801319805618648e-07, 'epoch': 1.72} {'loss': 0.3028, 'learning_rate': 9.799869227301406e-07, 'epoch': 1.72} {'loss': 0.3561, 'learning_rate': 9.79841875080294e-07, 'epoch': 1.72} {'loss': 0.236, 'learning_rate': 9.796968376124927e-07, 'epoch': 1.72} {'loss': 0.3948, 'learning_rate': 9.795518103268965e-07, 'epoch': 1.72} {'loss': 0.4478, 'learning_rate': 9.794067932236729e-07, 'epoch': 1.72} {'loss': 0.2722, 'learning_rate': 9.79261786302982e-07, 'epoch': 1.72} {'loss': 0.3356, 'learning_rate': 9.791167895649912e-07, 'epoch': 1.72} {'loss': 0.4147, 'learning_rate': 9.789718030098615e-07, 'epoch': 1.72} {'loss': 0.3417, 'learning_rate': 9.788268266377554e-07, 'epoch': 1.72} {'loss': 0.2217, 'learning_rate': 9.786818604488401e-07, 'epoch': 1.72} {'loss': 0.3244, 'learning_rate': 9.785369044432768e-07, 'epoch': 1.72} {'loss': 0.3016, 'learning_rate': 9.78391958621231e-07, 'epoch': 1.72} {'loss': 0.2558, 'learning_rate': 9.782470229828622e-07, 'epoch': 1.72} {'loss': 0.413, 'learning_rate': 9.781020975283407e-07, 'epoch': 1.72} {'loss': 0.3483, 'learning_rate': 9.779571822578227e-07, 'epoch': 1.72} {'loss': 0.346, 'learning_rate': 9.778122771714782e-07, 'epoch': 1.72} {'loss': 0.221, 'learning_rate': 9.77667382269466e-07, 'epoch': 1.72} {'loss': 0.2833, 'learning_rate': 9.775224975519537e-07, 'epoch': 1.72} {'loss': 0.2861, 'learning_rate': 9.773776230191012e-07, 'epoch': 1.73} {'loss': 0.3811, 'learning_rate': 9.77232758671075e-07, 'epoch': 1.73} {'loss': 0.2318, 'learning_rate': 9.770879045080373e-07, 'epoch': 1.73} {'loss': 0.3338, 'learning_rate': 9.7694306053015e-07, 'epoch': 1.73} {'loss': 0.2213, 'learning_rate': 9.767982267375798e-07, 'epoch': 1.73} {'loss': 0.1448, 'learning_rate': 9.766534031304864e-07, 'epoch': 1.73} {'loss': 0.2704, 'learning_rate': 9.765085897090375e-07, 'epoch': 1.73} {'loss': 0.2684, 'learning_rate': 9.763637864733921e-07, 'epoch': 1.73} {'loss': 0.3265, 'learning_rate': 9.762189934237187e-07, 'epoch': 1.73} {'loss': 0.2304, 'learning_rate': 9.760742105601762e-07, 'epoch': 1.73} {'loss': 0.3035, 'learning_rate': 9.759294378829321e-07, 'epoch': 1.73} {'loss': 0.1869, 'learning_rate': 9.757846753921452e-07, 'epoch': 1.73} {'loss': 0.2037, 'learning_rate': 9.756399230879831e-07, 'epoch': 1.73} {'loss': 0.3476, 'learning_rate': 9.754951809706058e-07, 'epoch': 1.73} {'loss': 0.364, 'learning_rate': 9.75350449040181e-07, 'epoch': 1.73} {'loss': 0.3255, 'learning_rate': 9.752057272968684e-07, 'epoch': 1.73} {'loss': 0.4182, 'learning_rate': 9.750610157408312e-07, 'epoch': 1.73} {'loss': 0.3987, 'learning_rate': 9.74916314372235e-07, 'epoch': 1.73} {'loss': 0.2773, 'learning_rate': 9.747716231912385e-07, 'epoch': 1.73} {'loss': 0.2945, 'learning_rate': 9.746269421980126e-07, 'epoch': 1.73} {'loss': 0.3472, 'learning_rate': 9.744822713927149e-07, 'epoch': 1.73} {'loss': 0.3171, 'learning_rate': 9.74337610775513e-07, 'epoch': 1.73} {'loss': 0.2874, 'learning_rate': 9.74192960346565e-07, 'epoch': 1.73} {'loss': 0.3048, 'learning_rate': 9.74048320106038e-07, 'epoch': 1.73} {'loss': 0.294, 'learning_rate': 9.739036900540955e-07, 'epoch': 1.73} {'loss': 0.2315, 'learning_rate': 9.73759070190896e-07, 'epoch': 1.73} {'loss': 0.3287, 'learning_rate': 9.736144605166086e-07, 'epoch': 1.73} {'loss': 0.2979, 'learning_rate': 9.73469861031393e-07, 'epoch': 1.73} {'loss': 0.3052, 'learning_rate': 9.733252717354147e-07, 'epoch': 1.73} {'loss': 0.197, 'learning_rate': 9.731806926288333e-07, 'epoch': 1.73} {'loss': 0.3591, 'learning_rate': 9.73036123711817e-07, 'epoch': 1.73} {'loss': 0.215, 'learning_rate': 9.72891564984524e-07, 'epoch': 1.73} {'loss': 0.2894, 'learning_rate': 9.72747016447122e-07, 'epoch': 1.73} {'loss': 0.2627, 'learning_rate': 9.72602478099769e-07, 'epoch': 1.73} {'loss': 0.3194, 'learning_rate': 9.724579499426346e-07, 'epoch': 1.73} {'loss': 0.2282, 'learning_rate': 9.723134319758755e-07, 'epoch': 1.73} {'loss': 0.4022, 'learning_rate': 9.721689241996602e-07, 'epoch': 1.73} {'loss': 0.285, 'learning_rate': 9.720244266141498e-07, 'epoch': 1.73} {'loss': 0.2893, 'learning_rate': 9.718799392195056e-07, 'epoch': 1.73} {'loss': 0.417, 'learning_rate': 9.717354620158925e-07, 'epoch': 1.73} {'loss': 0.2709, 'learning_rate': 9.71590995003473e-07, 'epoch': 1.73} {'loss': 0.3692, 'learning_rate': 9.714465381824113e-07, 'epoch': 1.73} {'loss': 0.1793, 'learning_rate': 9.713020915528681e-07, 'epoch': 1.73} {'loss': 0.2377, 'learning_rate': 9.711576551150092e-07, 'epoch': 1.73} {'loss': 0.3042, 'learning_rate': 9.710132288689955e-07, 'epoch': 1.73} {'loss': 0.2515, 'learning_rate': 9.708688128149923e-07, 'epoch': 1.73} {'loss': 0.4109, 'learning_rate': 9.707244069531597e-07, 'epoch': 1.73} {'loss': 0.4248, 'learning_rate': 9.705800112836627e-07, 'epoch': 1.73} {'loss': 0.2767, 'learning_rate': 9.704356258066638e-07, 'epoch': 1.73} {'loss': 0.3472, 'learning_rate': 9.702912505223272e-07, 'epoch': 1.73} {'loss': 0.3875, 'learning_rate': 9.70146885430815e-07, 'epoch': 1.73} {'loss': 0.351, 'learning_rate': 9.700025305322868e-07, 'epoch': 1.73} {'loss': 0.4418, 'learning_rate': 9.698581858269117e-07, 'epoch': 1.73} {'loss': 0.2761, 'learning_rate': 9.697138513148474e-07, 'epoch': 1.73} {'loss': 0.2294, 'learning_rate': 9.695695269962613e-07, 'epoch': 1.73} {'loss': 0.2444, 'learning_rate': 9.69425212871311e-07, 'epoch': 1.73} {'loss': 0.4114, 'learning_rate': 9.692809089401644e-07, 'epoch': 1.73} {'loss': 0.3696, 'learning_rate': 9.691366152029814e-07, 'epoch': 1.73} {'loss': 0.3091, 'learning_rate': 9.68992331659927e-07, 'epoch': 1.73} {'loss': 0.3834, 'learning_rate': 9.688480583111616e-07, 'epoch': 1.73} {'loss': 0.1846, 'learning_rate': 9.687037951568513e-07, 'epoch': 1.73} {'loss': 0.2548, 'learning_rate': 9.685595421971549e-07, 'epoch': 1.73} {'loss': 0.208, 'learning_rate': 9.684152994322393e-07, 'epoch': 1.73} {'loss': 0.237, 'learning_rate': 9.682710668622653e-07, 'epoch': 1.73} {'loss': 0.2519, 'learning_rate': 9.681268444873936e-07, 'epoch': 1.73} {'loss': 0.3166, 'learning_rate': 9.679826323077912e-07, 'epoch': 1.73} {'loss': 0.3595, 'learning_rate': 9.678384303236178e-07, 'epoch': 1.73} {'loss': 0.218, 'learning_rate': 9.676942385350384e-07, 'epoch': 1.73} {'loss': 0.3467, 'learning_rate': 9.675500569422136e-07, 'epoch': 1.73} {'loss': 0.297, 'learning_rate': 9.674058855453083e-07, 'epoch': 1.73} {'loss': 0.4156, 'learning_rate': 9.672617243444814e-07, 'epoch': 1.73} {'loss': 0.2704, 'learning_rate': 9.67117573339902e-07, 'epoch': 1.73} {'loss': 0.1649, 'learning_rate': 9.66973432531726e-07, 'epoch': 1.73} {'loss': 0.3487, 'learning_rate': 9.668293019201225e-07, 'epoch': 1.73} {'loss': 0.2887, 'learning_rate': 9.66685181505248e-07, 'epoch': 1.73} {'loss': 0.2717, 'learning_rate': 9.665410712872702e-07, 'epoch': 1.73} {'loss': 0.2283, 'learning_rate': 9.6639697126635e-07, 'epoch': 1.73} {'loss': 0.3287, 'learning_rate': 9.662528814426476e-07, 'epoch': 1.73} {'loss': 0.3875, 'learning_rate': 9.661088018163301e-07, 'epoch': 1.73} {'loss': 0.2153, 'learning_rate': 9.659647323875554e-07, 'epoch': 1.73} {'loss': 0.2141, 'learning_rate': 9.65820673156491e-07, 'epoch': 1.73} {'loss': 0.331, 'learning_rate': 9.65676624123295e-07, 'epoch': 1.73} {'loss': 0.3682, 'learning_rate': 9.655325852881348e-07, 'epoch': 1.73} {'loss': 0.2519, 'learning_rate': 9.65388556651168e-07, 'epoch': 1.73} {'loss': 0.3842, 'learning_rate': 9.652445382125609e-07, 'epoch': 1.73} {'loss': 0.2659, 'learning_rate': 9.651005299724726e-07, 'epoch': 1.73} {'loss': 0.1908, 'learning_rate': 9.649565319310705e-07, 'epoch': 1.73} {'loss': 0.2556, 'learning_rate': 9.648125440885127e-07, 'epoch': 1.73} {'loss': 0.3854, 'learning_rate': 9.64668566444964e-07, 'epoch': 1.73} {'loss': 0.3133, 'learning_rate': 9.64524599000587e-07, 'epoch': 1.73} {'loss': 0.2324, 'learning_rate': 9.643806417555424e-07, 'epoch': 1.73} {'loss': 0.2665, 'learning_rate': 9.642366947099946e-07, 'epoch': 1.73} {'loss': 0.3359, 'learning_rate': 9.640927578641035e-07, 'epoch': 1.73} {'loss': 0.296, 'learning_rate': 9.639488312180356e-07, 'epoch': 1.73} {'loss': 0.3408, 'learning_rate': 9.638049147719496e-07, 'epoch': 1.73} {'loss': 0.3373, 'learning_rate': 9.636610085260113e-07, 'epoch': 1.73} {'loss': 0.3546, 'learning_rate': 9.6351711248038e-07, 'epoch': 1.73} {'loss': 0.2751, 'learning_rate': 9.633732266352203e-07, 'epoch': 1.73} {'loss': 0.5208, 'learning_rate': 9.632293509906932e-07, 'epoch': 1.73} {'loss': 0.3211, 'learning_rate': 9.63085485546963e-07, 'epoch': 1.73} {'loss': 0.3473, 'learning_rate': 9.629416303041883e-07, 'epoch': 1.73} {'loss': 0.3184, 'learning_rate': 9.62797785262537e-07, 'epoch': 1.73} {'loss': 0.2249, 'learning_rate': 9.626539504221677e-07, 'epoch': 1.73} {'loss': 0.2714, 'learning_rate': 9.625101257832426e-07, 'epoch': 1.73} {'loss': 0.2191, 'learning_rate': 9.623663113459259e-07, 'epoch': 1.73} {'loss': 0.2483, 'learning_rate': 9.622225071103774e-07, 'epoch': 1.73} {'loss': 0.1552, 'learning_rate': 9.620787130767628e-07, 'epoch': 1.73} {'loss': 0.1566, 'learning_rate': 9.619349292452417e-07, 'epoch': 1.73} {'loss': 0.403, 'learning_rate': 9.617911556159787e-07, 'epoch': 1.73} {'loss': 0.3523, 'learning_rate': 9.616473921891323e-07, 'epoch': 1.73} {'loss': 0.3994, 'learning_rate': 9.615036389648701e-07, 'epoch': 1.73} {'loss': 0.2571, 'learning_rate': 9.61359895943349e-07, 'epoch': 1.73} {'loss': 0.2442, 'learning_rate': 9.612161631247363e-07, 'epoch': 1.73} {'loss': 0.3268, 'learning_rate': 9.610724405091898e-07, 'epoch': 1.73} {'loss': 0.3511, 'learning_rate': 9.60928728096875e-07, 'epoch': 1.73} {'loss': 0.3036, 'learning_rate': 9.607850258879537e-07, 'epoch': 1.73} {'loss': 0.3744, 'learning_rate': 9.60641333882585e-07, 'epoch': 1.73} {'loss': 0.2673, 'learning_rate': 9.604976520809328e-07, 'epoch': 1.73} {'loss': 0.207, 'learning_rate': 9.603539804831597e-07, 'epoch': 1.73} {'loss': 0.3237, 'learning_rate': 9.602103190894308e-07, 'epoch': 1.73} {'loss': 0.2566, 'learning_rate': 9.600666678999027e-07, 'epoch': 1.73} {'loss': 0.256, 'learning_rate': 9.59923026914742e-07, 'epoch': 1.73} {'loss': 0.3653, 'learning_rate': 9.597793961341106e-07, 'epoch': 1.73} {'loss': 0.3089, 'learning_rate': 9.596357755581665e-07, 'epoch': 1.73} {'loss': 0.3046, 'learning_rate': 9.594921651870758e-07, 'epoch': 1.73} {'loss': 0.276, 'learning_rate': 9.593485650209977e-07, 'epoch': 1.73} {'loss': 0.1523, 'learning_rate': 9.592049750600985e-07, 'epoch': 1.73} {'loss': 0.3099, 'learning_rate': 9.590613953045347e-07, 'epoch': 1.73} {'loss': 0.2358, 'learning_rate': 9.58917825754474e-07, 'epoch': 1.73} {'loss': 0.1466, 'learning_rate': 9.587742664100741e-07, 'epoch': 1.73} {'loss': 0.2617, 'learning_rate': 9.586307172715003e-07, 'epoch': 1.73} {'loss': 0.4505, 'learning_rate': 9.584871783389115e-07, 'epoch': 1.73} {'loss': 0.4116, 'learning_rate': 9.583436496124733e-07, 'epoch': 1.73} {'loss': 0.275, 'learning_rate': 9.582001310923428e-07, 'epoch': 1.73} {'loss': 0.3243, 'learning_rate': 9.580566227786882e-07, 'epoch': 1.73} {'loss': 0.2818, 'learning_rate': 9.579131246716678e-07, 'epoch': 1.73} {'loss': 0.2545, 'learning_rate': 9.577696367714418e-07, 'epoch': 1.73} {'loss': 0.3135, 'learning_rate': 9.576261590781766e-07, 'epoch': 1.73} {'loss': 0.2984, 'learning_rate': 9.57482691592031e-07, 'epoch': 1.73} {'loss': 0.2819, 'learning_rate': 9.573392343131681e-07, 'epoch': 1.73} {'loss': 0.2559, 'learning_rate': 9.571957872417491e-07, 'epoch': 1.73} {'loss': 0.3917, 'learning_rate': 9.570523503779383e-07, 'epoch': 1.73} {'loss': 0.4586, 'learning_rate': 9.569089237218931e-07, 'epoch': 1.73} {'loss': 0.3551, 'learning_rate': 9.567655072737803e-07, 'epoch': 1.73} {'loss': 0.3034, 'learning_rate': 9.566221010337584e-07, 'epoch': 1.73} {'loss': 0.1382, 'learning_rate': 9.564787050019918e-07, 'epoch': 1.73} {'loss': 0.1793, 'learning_rate': 9.563353191786384e-07, 'epoch': 1.73} {'loss': 0.2512, 'learning_rate': 9.561919435638655e-07, 'epoch': 1.73} {'loss': 0.312, 'learning_rate': 9.560485781578322e-07, 'epoch': 1.73} {'loss': 0.4342, 'learning_rate': 9.55905222960698e-07, 'epoch': 1.73} {'loss': 0.3792, 'learning_rate': 9.557618779726296e-07, 'epoch': 1.73} {'loss': 0.126, 'learning_rate': 9.556185431937836e-07, 'epoch': 1.73} {'loss': 0.425, 'learning_rate': 9.554752186243265e-07, 'epoch': 1.73} {'loss': 0.3314, 'learning_rate': 9.55331904264416e-07, 'epoch': 1.73} {'loss': 0.284, 'learning_rate': 9.551886001142174e-07, 'epoch': 1.73} {'loss': 0.3236, 'learning_rate': 9.550453061738895e-07, 'epoch': 1.73} {'loss': 0.3203, 'learning_rate': 9.549020224435967e-07, 'epoch': 1.73} {'loss': 0.3425, 'learning_rate': 9.547587489234989e-07, 'epoch': 1.73} {'loss': 0.3328, 'learning_rate': 9.546154856137591e-07, 'epoch': 1.73} {'loss': 0.124, 'learning_rate': 9.544722325145371e-07, 'epoch': 1.73} {'loss': 0.2217, 'learning_rate': 9.543289896259977e-07, 'epoch': 1.73} {'loss': 0.402, 'learning_rate': 9.541857569483003e-07, 'epoch': 1.73} {'loss': 0.3916, 'learning_rate': 9.540425344816062e-07, 'epoch': 1.73} {'loss': 0.3616, 'learning_rate': 9.538993222260783e-07, 'epoch': 1.73} {'loss': 0.3716, 'learning_rate': 9.537561201818778e-07, 'epoch': 1.73} {'loss': 0.3103, 'learning_rate': 9.536129283491668e-07, 'epoch': 1.73} {'loss': 0.3603, 'learning_rate': 9.534697467281051e-07, 'epoch': 1.73} {'loss': 0.3315, 'learning_rate': 9.533265753188581e-07, 'epoch': 1.73} {'loss': 0.2496, 'learning_rate': 9.531834141215824e-07, 'epoch': 1.73} {'loss': 0.3229, 'learning_rate': 9.530402631364455e-07, 'epoch': 1.73} {'loss': 0.3734, 'learning_rate': 9.52897122363603e-07, 'epoch': 1.73} {'loss': 0.3725, 'learning_rate': 9.527539918032203e-07, 'epoch': 1.73} {'loss': 0.362, 'learning_rate': 9.526108714554572e-07, 'epoch': 1.73} {'loss': 0.4486, 'learning_rate': 9.52467761320478e-07, 'epoch': 1.73} {'loss': 0.304, 'learning_rate': 9.523246613984394e-07, 'epoch': 1.73} {'loss': 0.3091, 'learning_rate': 9.521815716895089e-07, 'epoch': 1.73} {'loss': 0.1908, 'learning_rate': 9.520384921938442e-07, 'epoch': 1.73} {'loss': 0.3081, 'learning_rate': 9.518954229116051e-07, 'epoch': 1.73} {'loss': 0.3028, 'learning_rate': 9.517523638429582e-07, 'epoch': 1.73} {'loss': 0.3302, 'learning_rate': 9.5160931498806e-07, 'epoch': 1.73} {'loss': 0.2745, 'learning_rate': 9.514662763470761e-07, 'epoch': 1.73} {'loss': 0.2535, 'learning_rate': 9.513232479201639e-07, 'epoch': 1.73} {'loss': 0.3636, 'learning_rate': 9.511802297074902e-07, 'epoch': 1.73} {'loss': 0.2382, 'learning_rate': 9.510372217092101e-07, 'epoch': 1.73} {'loss': 0.3032, 'learning_rate': 9.508942239254903e-07, 'epoch': 1.73} {'loss': 0.3028, 'learning_rate': 9.507512363564885e-07, 'epoch': 1.73} {'loss': 0.3692, 'learning_rate': 9.506082590023702e-07, 'epoch': 1.73} {'loss': 0.3759, 'learning_rate': 9.504652918632918e-07, 'epoch': 1.73} {'loss': 0.391, 'learning_rate': 9.503223349394197e-07, 'epoch': 1.73} {'loss': 0.2567, 'learning_rate': 9.501793882309118e-07, 'epoch': 1.73} {'loss': 0.2749, 'learning_rate': 9.500364517379301e-07, 'epoch': 1.73} {'loss': 0.1815, 'learning_rate': 9.498935254606368e-07, 'epoch': 1.73} {'loss': 0.2984, 'learning_rate': 9.497506093991915e-07, 'epoch': 1.73} {'loss': 0.229, 'learning_rate': 9.496077035537588e-07, 'epoch': 1.73} {'loss': 0.2808, 'learning_rate': 9.494648079244961e-07, 'epoch': 1.73} {'loss': 0.2335, 'learning_rate': 9.49321922511568e-07, 'epoch': 1.73} {'loss': 0.2831, 'learning_rate': 9.49179047315133e-07, 'epoch': 1.73} {'loss': 0.3405, 'learning_rate': 9.490361823353544e-07, 'epoch': 1.73} {'loss': 0.33, 'learning_rate': 9.488933275723921e-07, 'epoch': 1.73} {'loss': 0.2124, 'learning_rate': 9.487504830264105e-07, 'epoch': 1.73} {'loss': 0.2391, 'learning_rate': 9.48607648697566e-07, 'epoch': 1.73} {'loss': 0.1679, 'learning_rate': 9.48464824586024e-07, 'epoch': 1.73} {'loss': 0.3234, 'learning_rate': 9.483220106919433e-07, 'epoch': 1.73} {'loss': 0.2079, 'learning_rate': 9.48179207015485e-07, 'epoch': 1.73} {'loss': 0.2981, 'learning_rate': 9.480364135568121e-07, 'epoch': 1.73} {'loss': 0.2058, 'learning_rate': 9.478936303160835e-07, 'epoch': 1.73} {'loss': 0.3114, 'learning_rate': 9.477508572934635e-07, 'epoch': 1.73} {'loss': 0.3433, 'learning_rate': 9.476080944891097e-07, 'epoch': 1.73} {'loss': 0.3094, 'learning_rate': 9.474653419031866e-07, 'epoch': 1.73} {'loss': 0.217, 'learning_rate': 9.473225995358515e-07, 'epoch': 1.73} {'loss': 0.2874, 'learning_rate': 9.471798673872701e-07, 'epoch': 1.73} {'loss': 0.3422, 'learning_rate': 9.470371454575988e-07, 'epoch': 1.73} {'loss': 0.1734, 'learning_rate': 9.468944337470031e-07, 'epoch': 1.73} {'loss': 0.2862, 'learning_rate': 9.467517322556408e-07, 'epoch': 1.73} {'loss': 0.3244, 'learning_rate': 9.466090409836759e-07, 'epoch': 1.73} {'loss': 0.2597, 'learning_rate': 9.464663599312673e-07, 'epoch': 1.73} {'loss': 0.4103, 'learning_rate': 9.463236890985727e-07, 'epoch': 1.73} {'loss': 0.3095, 'learning_rate': 9.46181028485762e-07, 'epoch': 1.73} {'loss': 0.3332, 'learning_rate': 9.460383780929882e-07, 'epoch': 1.73} {'loss': 0.4918, 'learning_rate': 9.45895737920417e-07, 'epoch': 1.73} {'loss': 0.3758, 'learning_rate': 9.45753107968207e-07, 'epoch': 1.73} {'loss': 0.4413, 'learning_rate': 9.456104882365214e-07, 'epoch': 1.73} {'loss': 0.2709, 'learning_rate': 9.454678787255201e-07, 'epoch': 1.73} {'loss': 0.3617, 'learning_rate': 9.453252794353618e-07, 'epoch': 1.73} {'loss': 0.3864, 'learning_rate': 9.45182690366211e-07, 'epoch': 1.73} {'loss': 0.3129, 'learning_rate': 9.45040111518225e-07, 'epoch': 1.73} {'loss': 0.4085, 'learning_rate': 9.448975428915686e-07, 'epoch': 1.73} {'loss': 0.3072, 'learning_rate': 9.447549844864001e-07, 'epoch': 1.73} {'loss': 0.5007, 'learning_rate': 9.446124363028819e-07, 'epoch': 1.73} {'loss': 0.2569, 'learning_rate': 9.444698983411737e-07, 'epoch': 1.73} {'loss': 0.4731, 'learning_rate': 9.443273706014377e-07, 'epoch': 1.73} {'loss': 0.3536, 'learning_rate': 9.441848530838327e-07, 'epoch': 1.73} {'loss': 0.4246, 'learning_rate': 9.440423457885228e-07, 'epoch': 1.73} {'loss': 0.2543, 'learning_rate': 9.438998487156658e-07, 'epoch': 1.73} {'loss': 0.1736, 'learning_rate': 9.43757361865425e-07, 'epoch': 1.73} {'loss': 0.4385, 'learning_rate': 9.436148852379601e-07, 'epoch': 1.73} {'loss': 0.2937, 'learning_rate': 9.434724188334299e-07, 'epoch': 1.73} {'loss': 0.2361, 'learning_rate': 9.433299626519987e-07, 'epoch': 1.73} {'loss': 0.2588, 'learning_rate': 9.431875166938242e-07, 'epoch': 1.73} {'loss': 0.3727, 'learning_rate': 9.430450809590708e-07, 'epoch': 1.73} {'loss': 0.2182, 'learning_rate': 9.42902655447896e-07, 'epoch': 1.73} {'loss': 0.3841, 'learning_rate': 9.42760240160463e-07, 'epoch': 1.73} {'loss': 0.3677, 'learning_rate': 9.426178350969295e-07, 'epoch': 1.73} {'loss': 0.3456, 'learning_rate': 9.424754402574598e-07, 'epoch': 1.73} {'loss': 0.3362, 'learning_rate': 9.423330556422117e-07, 'epoch': 1.73} {'loss': 0.2417, 'learning_rate': 9.421906812513482e-07, 'epoch': 1.73} {'loss': 0.4329, 'learning_rate': 9.420483170850281e-07, 'epoch': 1.73} {'loss': 0.343, 'learning_rate': 9.419059631434135e-07, 'epoch': 1.73} {'loss': 0.4498, 'learning_rate': 9.417636194266655e-07, 'epoch': 1.73} {'loss': 0.3699, 'learning_rate': 9.416212859349427e-07, 'epoch': 1.73} {'loss': 0.3168, 'learning_rate': 9.414789626684073e-07, 'epoch': 1.73} {'loss': 0.4245, 'learning_rate': 9.413366496272192e-07, 'epoch': 1.73} {'loss': 0.2625, 'learning_rate': 9.411943468115403e-07, 'epoch': 1.73} {'loss': 0.3648, 'learning_rate': 9.410520542215285e-07, 'epoch': 1.73} {'loss': 0.4046, 'learning_rate': 9.40909771857349e-07, 'epoch': 1.73} {'loss': 0.3674, 'learning_rate': 9.407674997191573e-07, 'epoch': 1.73} {'loss': 0.2401, 'learning_rate': 9.406252378071179e-07, 'epoch': 1.73} {'loss': 0.2663, 'learning_rate': 9.404829861213882e-07, 'epoch': 1.73} {'loss': 0.2825, 'learning_rate': 9.403407446621327e-07, 'epoch': 1.73} {'loss': 0.4569, 'learning_rate': 9.401985134295078e-07, 'epoch': 1.73} {'loss': 0.3114, 'learning_rate': 9.400562924236778e-07, 'epoch': 1.73} {'loss': 0.2687, 'learning_rate': 9.399140816448005e-07, 'epoch': 1.73} {'loss': 0.2819, 'learning_rate': 9.397718810930368e-07, 'epoch': 1.73} {'loss': 0.2763, 'learning_rate': 9.396296907685487e-07, 'epoch': 1.73} {'loss': 0.3249, 'learning_rate': 9.394875106714951e-07, 'epoch': 1.73} {'loss': 0.3909, 'learning_rate': 9.393453408020381e-07, 'epoch': 1.73} {'loss': 0.213, 'learning_rate': 9.392031811603352e-07, 'epoch': 1.73} {'loss': 0.2037, 'learning_rate': 9.390610317465509e-07, 'epoch': 1.73} {'loss': 0.237, 'learning_rate': 9.389188925608428e-07, 'epoch': 1.73} {'loss': 0.275, 'learning_rate': 9.387767636033729e-07, 'epoch': 1.73} {'loss': 0.3657, 'learning_rate': 9.386346448743e-07, 'epoch': 1.73} {'loss': 0.3742, 'learning_rate': 9.384925363737862e-07, 'epoch': 1.73} {'loss': 0.3196, 'learning_rate': 9.383504381019904e-07, 'epoch': 1.73} {'loss': 0.3774, 'learning_rate': 9.382083500590756e-07, 'epoch': 1.73} {'loss': 0.4228, 'learning_rate': 9.380662722451994e-07, 'epoch': 1.73} {'loss': 0.2493, 'learning_rate': 9.379242046605219e-07, 'epoch': 1.73} {'loss': 0.2639, 'learning_rate': 9.377821473052073e-07, 'epoch': 1.73} {'loss': 0.2651, 'learning_rate': 9.376401001794111e-07, 'epoch': 1.73} {'loss': 0.2776, 'learning_rate': 9.374980632832975e-07, 'epoch': 1.73} {'loss': 0.3004, 'learning_rate': 9.373560366170232e-07, 'epoch': 1.73} {'loss': 0.3596, 'learning_rate': 9.372140201807534e-07, 'epoch': 1.73} {'loss': 0.3566, 'learning_rate': 9.370720139746425e-07, 'epoch': 1.73} {'loss': 0.2753, 'learning_rate': 9.369300179988561e-07, 'epoch': 1.73} {'loss': 0.5497, 'learning_rate': 9.367880322535517e-07, 'epoch': 1.73} {'loss': 0.1945, 'learning_rate': 9.366460567388902e-07, 'epoch': 1.73} {'loss': 0.2299, 'learning_rate': 9.365040914550317e-07, 'epoch': 1.73} {'loss': 0.1987, 'learning_rate': 9.36362136402137e-07, 'epoch': 1.73} {'loss': 0.2005, 'learning_rate': 9.362201915803671e-07, 'epoch': 1.73} {'loss': 0.3809, 'learning_rate': 9.360782569898785e-07, 'epoch': 1.73} {'loss': 0.2123, 'learning_rate': 9.359363326308357e-07, 'epoch': 1.73} {'loss': 0.3369, 'learning_rate': 9.357944185033952e-07, 'epoch': 1.73} {'loss': 0.2105, 'learning_rate': 9.356525146077212e-07, 'epoch': 1.73} {'loss': 0.2376, 'learning_rate': 9.355106209439701e-07, 'epoch': 1.73} {'loss': 0.3453, 'learning_rate': 9.353687375123055e-07, 'epoch': 1.73} {'loss': 0.2324, 'learning_rate': 9.352268643128848e-07, 'epoch': 1.73} {'loss': 0.404, 'learning_rate': 9.350850013458701e-07, 'epoch': 1.73} {'loss': 0.2284, 'learning_rate': 9.349431486114192e-07, 'epoch': 1.73} {'loss': 0.3125, 'learning_rate': 9.348013061096961e-07, 'epoch': 1.73} {'loss': 0.3991, 'learning_rate': 9.346594738408554e-07, 'epoch': 1.73} {'loss': 0.3799, 'learning_rate': 9.345176518050636e-07, 'epoch': 1.73} {'loss': 0.2272, 'learning_rate': 9.34375840002476e-07, 'epoch': 1.73} {'loss': 0.2537, 'learning_rate': 9.342340384332538e-07, 'epoch': 1.73} {'loss': 0.2821, 'learning_rate': 9.340922470975578e-07, 'epoch': 1.73} {'loss': 0.3424, 'learning_rate': 9.339504659955467e-07, 'epoch': 1.73} {'loss': 0.3763, 'learning_rate': 9.338086951273828e-07, 'epoch': 1.73} {'loss': 0.2127, 'learning_rate': 9.336669344932236e-07, 'epoch': 1.73} {'loss': 0.3858, 'learning_rate': 9.335251840932324e-07, 'epoch': 1.73} {'loss': 0.3142, 'learning_rate': 9.333834439275646e-07, 'epoch': 1.73} {'loss': 0.3108, 'learning_rate': 9.332417139963856e-07, 'epoch': 1.73} {'loss': 0.3757, 'learning_rate': 9.330999942998498e-07, 'epoch': 1.73} {'loss': 0.3148, 'learning_rate': 9.329582848381225e-07, 'epoch': 1.73} {'loss': 0.1876, 'learning_rate': 9.328165856113592e-07, 'epoch': 1.73} {'loss': 0.3475, 'learning_rate': 9.326748966197229e-07, 'epoch': 1.73} {'loss': 0.2544, 'learning_rate': 9.325332178633739e-07, 'epoch': 1.73} {'loss': 0.2464, 'learning_rate': 9.323915493424673e-07, 'epoch': 1.73} {'loss': 0.3097, 'learning_rate': 9.322498910571687e-07, 'epoch': 1.73} {'loss': 0.3828, 'learning_rate': 9.321082430076323e-07, 'epoch': 1.73} {'loss': 0.3357, 'learning_rate': 9.319666051940246e-07, 'epoch': 1.73} {'loss': 0.3325, 'learning_rate': 9.318249776165e-07, 'epoch': 1.73} {'loss': 0.3008, 'learning_rate': 9.31683360275224e-07, 'epoch': 1.73} {'loss': 0.2721, 'learning_rate': 9.315417531703497e-07, 'epoch': 1.73} {'loss': 0.336, 'learning_rate': 9.314001563020426e-07, 'epoch': 1.73} {'loss': 0.3739, 'learning_rate': 9.312585696704602e-07, 'epoch': 1.73} {'loss': 0.489, 'learning_rate': 9.311169932757613e-07, 'epoch': 1.73} {'loss': 0.4175, 'learning_rate': 9.309754271181071e-07, 'epoch': 1.73} {'loss': 0.2149, 'learning_rate': 9.308338711976561e-07, 'epoch': 1.73} {'loss': 0.3218, 'learning_rate': 9.306923255145717e-07, 'epoch': 1.73} {'loss': 0.3188, 'learning_rate': 9.30550790069008e-07, 'epoch': 1.73} {'loss': 0.3578, 'learning_rate': 9.304092648611307e-07, 'epoch': 1.73} {'loss': 0.2918, 'learning_rate': 9.302677498910939e-07, 'epoch': 1.73} {'loss': 0.3018, 'learning_rate': 9.30126245159062e-07, 'epoch': 1.73} {'loss': 0.2158, 'learning_rate': 9.299847506651915e-07, 'epoch': 1.73} {'loss': 0.359, 'learning_rate': 9.298432664096457e-07, 'epoch': 1.73} {'loss': 0.1855, 'learning_rate': 9.297017923925788e-07, 'epoch': 1.73} {'loss': 0.3146, 'learning_rate': 9.295603286141575e-07, 'epoch': 1.73} {'loss': 0.3925, 'learning_rate': 9.29418875074537e-07, 'epoch': 1.73} {'loss': 0.2989, 'learning_rate': 9.29277431773875e-07, 'epoch': 1.73} {'loss': 0.4478, 'learning_rate': 9.29135998712336e-07, 'epoch': 1.73} {'loss': 0.3195, 'learning_rate': 9.289945758900764e-07, 'epoch': 1.73} {'loss': 0.2661, 'learning_rate': 9.288531633072584e-07, 'epoch': 1.73} {'loss': 0.2922, 'learning_rate': 9.287117609640395e-07, 'epoch': 1.73} {'loss': 0.3509, 'learning_rate': 9.285703688605807e-07, 'epoch': 1.73} {'loss': 0.2685, 'learning_rate': 9.284289869970387e-07, 'epoch': 1.73} {'loss': 0.3226, 'learning_rate': 9.282876153735787e-07, 'epoch': 1.73} {'loss': 0.4587, 'learning_rate': 9.281462539903541e-07, 'epoch': 1.73} {'loss': 0.2652, 'learning_rate': 9.28004902847529e-07, 'epoch': 1.73} {'loss': 0.1695, 'learning_rate': 9.278635619452591e-07, 'epoch': 1.73} {'loss': 0.3089, 'learning_rate': 9.277222312837086e-07, 'epoch': 1.73} {'loss': 0.358, 'learning_rate': 9.275809108630351e-07, 'epoch': 1.73} {'loss': 0.2622, 'learning_rate': 9.274396006833941e-07, 'epoch': 1.73} {'loss': 0.3341, 'learning_rate': 9.272983007449521e-07, 'epoch': 1.73} {'loss': 0.2802, 'learning_rate': 9.271570110478622e-07, 'epoch': 1.73} {'loss': 0.3129, 'learning_rate': 9.270157315922889e-07, 'epoch': 1.73} {'loss': 0.2418, 'learning_rate': 9.268744623783876e-07, 'epoch': 1.73} {'loss': 0.2798, 'learning_rate': 9.267332034063214e-07, 'epoch': 1.73} {'loss': 0.321, 'learning_rate': 9.265919546762459e-07, 'epoch': 1.73} {'loss': 0.4029, 'learning_rate': 9.264507161883252e-07, 'epoch': 1.73} {'loss': 0.2695, 'learning_rate': 9.263094879427148e-07, 'epoch': 1.73} {'loss': 0.3968, 'learning_rate': 9.261682699395758e-07, 'epoch': 1.73} {'loss': 0.414, 'learning_rate': 9.260270621790668e-07, 'epoch': 1.73} {'loss': 0.3748, 'learning_rate': 9.2588586466135e-07, 'epoch': 1.73} {'loss': 0.2965, 'learning_rate': 9.257446773865808e-07, 'epoch': 1.73} {'loss': 0.2702, 'learning_rate': 9.256035003549202e-07, 'epoch': 1.73} {'loss': 0.1519, 'learning_rate': 9.254623335665281e-07, 'epoch': 1.73} {'loss': 0.3386, 'learning_rate': 9.253211770215631e-07, 'epoch': 1.73} {'loss': 0.2498, 'learning_rate': 9.251800307201852e-07, 'epoch': 1.73} {'loss': 0.3573, 'learning_rate': 9.250388946625521e-07, 'epoch': 1.73} {'loss': 0.3293, 'learning_rate': 9.248977688488269e-07, 'epoch': 1.73} {'loss': 0.3167, 'learning_rate': 9.247566532791641e-07, 'epoch': 1.73} {'loss': 0.2148, 'learning_rate': 9.246155479537267e-07, 'epoch': 1.73} {'loss': 0.3158, 'learning_rate': 9.244744528726712e-07, 'epoch': 1.73} {'loss': 0.2386, 'learning_rate': 9.2433336803616e-07, 'epoch': 1.73} {'loss': 0.3805, 'learning_rate': 9.241922934443492e-07, 'epoch': 1.73} {'loss': 0.1828, 'learning_rate': 9.240512290974002e-07, 'epoch': 1.73} {'loss': 0.4015, 'learning_rate': 9.239101749954726e-07, 'epoch': 1.73} {'loss': 0.3669, 'learning_rate': 9.237691311387221e-07, 'epoch': 1.73} {'loss': 0.4402, 'learning_rate': 9.236280975273126e-07, 'epoch': 1.73} {'loss': 0.3435, 'learning_rate': 9.234870741613988e-07, 'epoch': 1.73} {'loss': 0.4815, 'learning_rate': 9.233460610411438e-07, 'epoch': 1.73} {'loss': 0.3524, 'learning_rate': 9.232050581667041e-07, 'epoch': 1.73} {'loss': 0.4021, 'learning_rate': 9.230640655382406e-07, 'epoch': 1.73} {'loss': 0.3394, 'learning_rate': 9.229230831559111e-07, 'epoch': 1.73} {'loss': 0.3459, 'learning_rate': 9.227821110198765e-07, 'epoch': 1.73} {'loss': 0.2763, 'learning_rate': 9.226411491302922e-07, 'epoch': 1.73} {'loss': 0.4594, 'learning_rate': 9.225001974873227e-07, 'epoch': 1.73} {'loss': 0.3599, 'learning_rate': 9.223592560911221e-07, 'epoch': 1.73} {'loss': 0.3528, 'learning_rate': 9.222183249418537e-07, 'epoch': 1.73} {'loss': 0.2699, 'learning_rate': 9.220774040396751e-07, 'epoch': 1.73} {'loss': 0.327, 'learning_rate': 9.219364933847419e-07, 'epoch': 1.73} {'loss': 0.3794, 'learning_rate': 9.217955929772193e-07, 'epoch': 1.73} {'loss': 0.257, 'learning_rate': 9.216547028172595e-07, 'epoch': 1.73} {'loss': 0.2374, 'learning_rate': 9.215138229050291e-07, 'epoch': 1.73} {'loss': 0.2755, 'learning_rate': 9.213729532406801e-07, 'epoch': 1.73} {'loss': 0.2691, 'learning_rate': 9.212320938243768e-07, 'epoch': 1.73} {'loss': 0.1754, 'learning_rate': 9.210912446562747e-07, 'epoch': 1.73} {'loss': 0.1918, 'learning_rate': 9.209504057365348e-07, 'epoch': 1.73} {'loss': 0.3457, 'learning_rate': 9.208095770653147e-07, 'epoch': 1.73} {'loss': 0.3079, 'learning_rate': 9.206687586427754e-07, 'epoch': 1.73} {'loss': 0.2584, 'learning_rate': 9.205279504690734e-07, 'epoch': 1.73} {'loss': 0.2404, 'learning_rate': 9.203871525443697e-07, 'epoch': 1.73} {'loss': 0.3363, 'learning_rate': 9.202463648688231e-07, 'epoch': 1.73} {'loss': 0.2362, 'learning_rate': 9.20105587442589e-07, 'epoch': 1.73} {'loss': 0.1842, 'learning_rate': 9.199648202658318e-07, 'epoch': 1.73} {'loss': 0.4353, 'learning_rate': 9.198240633387056e-07, 'epoch': 1.73} {'loss': 0.4488, 'learning_rate': 9.196833166613739e-07, 'epoch': 1.73} {'loss': 0.4558, 'learning_rate': 9.195425802339897e-07, 'epoch': 1.73} {'loss': 0.3374, 'learning_rate': 9.194018540567185e-07, 'epoch': 1.73} {'loss': 0.4607, 'learning_rate': 9.192611381297123e-07, 'epoch': 1.73} {'loss': 0.214, 'learning_rate': 9.191204324531366e-07, 'epoch': 1.73} {'loss': 0.313, 'learning_rate': 9.189797370271447e-07, 'epoch': 1.73} {'loss': 0.2543, 'learning_rate': 9.188390518519008e-07, 'epoch': 1.73} {'loss': 0.4076, 'learning_rate': 9.186983769275582e-07, 'epoch': 1.73} {'loss': 0.3716, 'learning_rate': 9.185577122542799e-07, 'epoch': 1.73} {'loss': 0.3609, 'learning_rate': 9.184170578322227e-07, 'epoch': 1.73} {'loss': 0.4941, 'learning_rate': 9.182764136615441e-07, 'epoch': 1.73} {'loss': 0.2578, 'learning_rate': 9.181357797424051e-07, 'epoch': 1.73} {'loss': 0.3601, 'learning_rate': 9.179951560749634e-07, 'epoch': 1.73} {'loss': 0.2549, 'learning_rate': 9.178545426593799e-07, 'epoch': 1.73} {'loss': 0.3068, 'learning_rate': 9.17713939495809e-07, 'epoch': 1.73} {'loss': 0.2941, 'learning_rate': 9.17573346584415e-07, 'epoch': 1.73} {'loss': 0.2608, 'learning_rate': 9.174327639253533e-07, 'epoch': 1.73} {'loss': 0.209, 'learning_rate': 9.172921915187805e-07, 'epoch': 1.73} {'loss': 0.3122, 'learning_rate': 9.171516293648608e-07, 'epoch': 1.73} {'loss': 0.3114, 'learning_rate': 9.170110774637464e-07, 'epoch': 1.73} {'loss': 0.2861, 'learning_rate': 9.168705358156016e-07, 'epoch': 1.73} {'loss': 0.2677, 'learning_rate': 9.167300044205818e-07, 'epoch': 1.73} {'loss': 0.1635, 'learning_rate': 9.165894832788469e-07, 'epoch': 1.73} {'loss': 0.4076, 'learning_rate': 9.164489723905545e-07, 'epoch': 1.73} {'loss': 0.2316, 'learning_rate': 9.163084717558646e-07, 'epoch': 1.73} {'loss': 0.2224, 'learning_rate': 9.161679813749347e-07, 'epoch': 1.73} {'loss': 0.3271, 'learning_rate': 9.160275012479248e-07, 'epoch': 1.73} {'loss': 0.4013, 'learning_rate': 9.158870313749901e-07, 'epoch': 1.73} {'loss': 0.183, 'learning_rate': 9.157465717562942e-07, 'epoch': 1.73} {'loss': 0.3964, 'learning_rate': 9.156061223919932e-07, 'epoch': 1.73} {'loss': 0.3319, 'learning_rate': 9.154656832822428e-07, 'epoch': 1.73} {'loss': 0.3096, 'learning_rate': 9.153252544272062e-07, 'epoch': 1.73} {'loss': 0.2539, 'learning_rate': 9.151848358270377e-07, 'epoch': 1.73} {'loss': 0.3293, 'learning_rate': 9.150444274819004e-07, 'epoch': 1.73} {'loss': 0.3482, 'learning_rate': 9.149040293919486e-07, 'epoch': 1.73} {'loss': 0.4579, 'learning_rate': 9.147636415573435e-07, 'epoch': 1.73} {'loss': 0.2971, 'learning_rate': 9.146232639782415e-07, 'epoch': 1.73} {'loss': 0.166, 'learning_rate': 9.144828966548036e-07, 'epoch': 1.73} {'loss': 0.3246, 'learning_rate': 9.143425395871852e-07, 'epoch': 1.73} {'loss': 0.2808, 'learning_rate': 9.142021927755484e-07, 'epoch': 1.73} {'loss': 0.4367, 'learning_rate': 9.140618562200476e-07, 'epoch': 1.73} {'loss': 0.3262, 'learning_rate': 9.139215299208448e-07, 'epoch': 1.73} {'loss': 0.3478, 'learning_rate': 9.137812138780955e-07, 'epoch': 1.73} {'loss': 0.3575, 'learning_rate': 9.136409080919605e-07, 'epoch': 1.73} {'loss': 0.3954, 'learning_rate': 9.135006125625978e-07, 'epoch': 1.73} {'loss': 0.2281, 'learning_rate': 9.133603272901626e-07, 'epoch': 1.73} {'loss': 0.348, 'learning_rate': 9.13220052274818e-07, 'epoch': 1.73} {'loss': 0.2152, 'learning_rate': 9.130797875167185e-07, 'epoch': 1.73} {'loss': 0.2785, 'learning_rate': 9.129395330160251e-07, 'epoch': 1.73} {'loss': 0.3028, 'learning_rate': 9.127992887728931e-07, 'epoch': 1.73} {'loss': 0.4721, 'learning_rate': 9.126590547874847e-07, 'epoch': 1.73} {'loss': 0.4169, 'learning_rate': 9.125188310599542e-07, 'epoch': 1.73} {'loss': 0.4422, 'learning_rate': 9.123786175904647e-07, 'epoch': 1.73} {'loss': 0.2801, 'learning_rate': 9.122384143791685e-07, 'epoch': 1.73} {'loss': 0.5173, 'learning_rate': 9.120982214262298e-07, 'epoch': 1.73} {'loss': 0.2025, 'learning_rate': 9.119580387318017e-07, 'epoch': 1.73} {'loss': 0.3739, 'learning_rate': 9.118178662960464e-07, 'epoch': 1.73} {'loss': 0.1872, 'learning_rate': 9.116777041191205e-07, 'epoch': 1.73} {'loss': 0.3074, 'learning_rate': 9.115375522011816e-07, 'epoch': 1.73} {'loss': 0.2549, 'learning_rate': 9.113974105423895e-07, 'epoch': 1.73} {'loss': 0.341, 'learning_rate': 9.112572791428998e-07, 'epoch': 1.73} {'loss': 0.3816, 'learning_rate': 9.111171580028733e-07, 'epoch': 1.73} {'loss': 0.4006, 'learning_rate': 9.109770471224666e-07, 'epoch': 1.73} {'loss': 0.4247, 'learning_rate': 9.108369465018396e-07, 'epoch': 1.73} {'loss': 0.2762, 'learning_rate': 9.106968561411478e-07, 'epoch': 1.73} {'loss': 0.2398, 'learning_rate': 9.10556776040552e-07, 'epoch': 1.73} {'loss': 0.2612, 'learning_rate': 9.104167062002078e-07, 'epoch': 1.73} {'loss': 0.3912, 'learning_rate': 9.102766466202772e-07, 'epoch': 1.73} {'loss': 0.3517, 'learning_rate': 9.101365973009135e-07, 'epoch': 1.73} {'loss': 0.4238, 'learning_rate': 9.099965582422787e-07, 'epoch': 1.73} {'loss': 0.2005, 'learning_rate': 9.098565294445294e-07, 'epoch': 1.73} {'loss': 0.3239, 'learning_rate': 9.09716510907821e-07, 'epoch': 1.73} {'loss': 0.2217, 'learning_rate': 9.095765026323167e-07, 'epoch': 1.73} {'loss': 0.2246, 'learning_rate': 9.094365046181697e-07, 'epoch': 1.73} {'loss': 0.3665, 'learning_rate': 9.092965168655421e-07, 'epoch': 1.73} {'loss': 0.3009, 'learning_rate': 9.091565393745883e-07, 'epoch': 1.73} {'loss': 0.4174, 'learning_rate': 9.090165721454703e-07, 'epoch': 1.73} {'loss': 0.3357, 'learning_rate': 9.088766151783413e-07, 'epoch': 1.73} {'loss': 0.2236, 'learning_rate': 9.087366684733645e-07, 'epoch': 1.74} {'loss': 0.3522, 'learning_rate': 9.085967320306921e-07, 'epoch': 1.74} {'loss': 0.2966, 'learning_rate': 9.084568058504884e-07, 'epoch': 1.74} {'loss': 0.2926, 'learning_rate': 9.083168899329054e-07, 'epoch': 1.74} {'loss': 0.2815, 'learning_rate': 9.081769842781063e-07, 'epoch': 1.74} {'loss': 0.195, 'learning_rate': 9.080370888862455e-07, 'epoch': 1.74} {'loss': 0.3016, 'learning_rate': 9.078972037574806e-07, 'epoch': 1.74} {'loss': 0.3923, 'learning_rate': 9.077573288919727e-07, 'epoch': 1.74} {'loss': 0.2425, 'learning_rate': 9.076174642898761e-07, 'epoch': 1.74} {'loss': 0.3836, 'learning_rate': 9.074776099513527e-07, 'epoch': 1.74} {'loss': 0.2627, 'learning_rate': 9.073377658765548e-07, 'epoch': 1.74} {'loss': 0.3283, 'learning_rate': 9.071979320656465e-07, 'epoch': 1.74} {'loss': 0.3047, 'learning_rate': 9.070581085187802e-07, 'epoch': 1.74} {'loss': 0.2328, 'learning_rate': 9.069182952361188e-07, 'epoch': 1.74} {'loss': 0.3446, 'learning_rate': 9.067784922178147e-07, 'epoch': 1.74} {'loss': 0.3883, 'learning_rate': 9.06638699464032e-07, 'epoch': 1.74} {'loss': 0.3936, 'learning_rate': 9.064989169749217e-07, 'epoch': 1.74} {'loss': 0.2716, 'learning_rate': 9.06359144750647e-07, 'epoch': 1.74} {'loss': 0.4415, 'learning_rate': 9.062193827913634e-07, 'epoch': 1.74} {'loss': 0.3334, 'learning_rate': 9.060796310972275e-07, 'epoch': 1.74} {'loss': 0.4644, 'learning_rate': 9.059398896684002e-07, 'epoch': 1.74} {'loss': 0.4462, 'learning_rate': 9.058001585050358e-07, 'epoch': 1.74} {'loss': 0.2957, 'learning_rate': 9.056604376072952e-07, 'epoch': 1.74} {'loss': 0.2584, 'learning_rate': 9.055207269753319e-07, 'epoch': 1.74} {'loss': 0.3875, 'learning_rate': 9.053810266093099e-07, 'epoch': 1.74} {'loss': 0.301, 'learning_rate': 9.052413365093804e-07, 'epoch': 1.74} {'loss': 0.3716, 'learning_rate': 9.051016566757054e-07, 'epoch': 1.74} {'loss': 0.2806, 'learning_rate': 9.049619871084403e-07, 'epoch': 1.74} {'loss': 0.2408, 'learning_rate': 9.04822327807745e-07, 'epoch': 1.74} {'loss': 0.3204, 'learning_rate': 9.04682678773774e-07, 'epoch': 1.74} {'loss': 0.2092, 'learning_rate': 9.045430400066879e-07, 'epoch': 1.74} {'loss': 0.4472, 'learning_rate': 9.044034115066447e-07, 'epoch': 1.74} {'loss': 0.2334, 'learning_rate': 9.042637932737952e-07, 'epoch': 1.74} {'loss': 0.4106, 'learning_rate': 9.041241853083072e-07, 'epoch': 1.74} {'loss': 0.3741, 'learning_rate': 9.039845876103304e-07, 'epoch': 1.74} {'loss': 0.3953, 'learning_rate': 9.038450001800281e-07, 'epoch': 1.74} {'loss': 0.3318, 'learning_rate': 9.037054230175523e-07, 'epoch': 1.74} {'loss': 0.2187, 'learning_rate': 9.035658561230654e-07, 'epoch': 1.74} {'loss': 0.362, 'learning_rate': 9.034262994967235e-07, 'epoch': 1.74} {'loss': 0.3379, 'learning_rate': 9.032867531386813e-07, 'epoch': 1.74} {'loss': 0.1374, 'learning_rate': 9.031472170490996e-07, 'epoch': 1.74} {'loss': 0.2353, 'learning_rate': 9.030076912281338e-07, 'epoch': 1.74} {'loss': 0.284, 'learning_rate': 9.02868175675945e-07, 'epoch': 1.74} {'loss': 0.203, 'learning_rate': 9.027286703926852e-07, 'epoch': 1.74} {'loss': 0.2804, 'learning_rate': 9.025891753785165e-07, 'epoch': 1.74} {'loss': 0.3019, 'learning_rate': 9.024496906335933e-07, 'epoch': 1.74} {'loss': 0.1985, 'learning_rate': 9.023102161580766e-07, 'epoch': 1.74} {'loss': 0.3703, 'learning_rate': 9.021707519521195e-07, 'epoch': 1.74} {'loss': 0.2849, 'learning_rate': 9.02031298015883e-07, 'epoch': 1.74} {'loss': 0.2814, 'learning_rate': 9.018918543495225e-07, 'epoch': 1.74} {'loss': 0.3244, 'learning_rate': 9.01752420953197e-07, 'epoch': 1.74} {'loss': 0.256, 'learning_rate': 9.016129978270627e-07, 'epoch': 1.74} {'loss': 0.3989, 'learning_rate': 9.014735849712753e-07, 'epoch': 1.74} {'loss': 0.2635, 'learning_rate': 9.013341823859967e-07, 'epoch': 1.74} {'loss': 0.3, 'learning_rate': 9.011947900713791e-07, 'epoch': 1.74} {'loss': 0.1648, 'learning_rate': 9.010554080275846e-07, 'epoch': 1.74} {'loss': 0.4122, 'learning_rate': 9.009160362547653e-07, 'epoch': 1.74} {'loss': 0.3709, 'learning_rate': 9.007766747530844e-07, 'epoch': 1.74} {'loss': 0.2134, 'learning_rate': 9.006373235226951e-07, 'epoch': 1.74} {'loss': 0.1761, 'learning_rate': 9.004979825637572e-07, 'epoch': 1.74} {'loss': 0.3026, 'learning_rate': 9.003586518764241e-07, 'epoch': 1.74} {'loss': 0.3885, 'learning_rate': 9.002193314608587e-07, 'epoch': 1.74} {'loss': 0.4045, 'learning_rate': 9.000800213172123e-07, 'epoch': 1.74} {'loss': 0.4668, 'learning_rate': 8.999407214456479e-07, 'epoch': 1.74} {'loss': 0.2715, 'learning_rate': 8.9980143184632e-07, 'epoch': 1.74} {'loss': 0.3722, 'learning_rate': 8.996621525193827e-07, 'epoch': 1.74} {'loss': 0.3814, 'learning_rate': 8.995228834649994e-07, 'epoch': 1.74} {'loss': 0.3393, 'learning_rate': 8.99383624683322e-07, 'epoch': 1.74} {'loss': 0.3719, 'learning_rate': 8.992443761745118e-07, 'epoch': 1.74} {'loss': 0.2109, 'learning_rate': 8.991051379387228e-07, 'epoch': 1.74} {'loss': 0.1843, 'learning_rate': 8.98965909976115e-07, 'epoch': 1.74} {'loss': 0.2212, 'learning_rate': 8.988266922868416e-07, 'epoch': 1.74} {'loss': 0.2785, 'learning_rate': 8.986874848710647e-07, 'epoch': 1.74} {'loss': 0.2789, 'learning_rate': 8.985482877289364e-07, 'epoch': 1.74} {'loss': 0.3389, 'learning_rate': 8.984091008606189e-07, 'epoch': 1.74} {'loss': 0.2373, 'learning_rate': 8.982699242662651e-07, 'epoch': 1.74} {'loss': 0.1733, 'learning_rate': 8.981307579460352e-07, 'epoch': 1.74} {'loss': 0.2753, 'learning_rate': 8.979916019000845e-07, 'epoch': 1.74} {'loss': 0.2053, 'learning_rate': 8.978524561285696e-07, 'epoch': 1.74} {'loss': 0.3735, 'learning_rate': 8.97713320631649e-07, 'epoch': 1.74} {'loss': 0.4217, 'learning_rate': 8.975741954094786e-07, 'epoch': 1.74} {'loss': 0.4139, 'learning_rate': 8.974350804622167e-07, 'epoch': 1.74} {'loss': 0.3014, 'learning_rate': 8.97295975790019e-07, 'epoch': 1.74} {'loss': 0.2759, 'learning_rate': 8.971568813930443e-07, 'epoch': 1.74} {'loss': 0.2996, 'learning_rate': 8.970177972714467e-07, 'epoch': 1.74} {'loss': 0.2938, 'learning_rate': 8.968787234253873e-07, 'epoch': 1.74} {'loss': 0.3435, 'learning_rate': 8.967396598550182e-07, 'epoch': 1.74} {'loss': 0.4944, 'learning_rate': 8.966006065605015e-07, 'epoch': 1.74} {'loss': 0.389, 'learning_rate': 8.964615635419893e-07, 'epoch': 1.74} {'loss': 0.3107, 'learning_rate': 8.963225307996426e-07, 'epoch': 1.74} {'loss': 0.2784, 'learning_rate': 8.961835083336168e-07, 'epoch': 1.74} {'loss': 0.3986, 'learning_rate': 8.960444961440673e-07, 'epoch': 1.74} {'loss': 0.3847, 'learning_rate': 8.95905494231154e-07, 'epoch': 1.74} {'loss': 0.3047, 'learning_rate': 8.957665025950302e-07, 'epoch': 1.74} {'loss': 0.3445, 'learning_rate': 8.956275212358567e-07, 'epoch': 1.74} {'loss': 0.3826, 'learning_rate': 8.954885501537857e-07, 'epoch': 1.74} {'loss': 0.2337, 'learning_rate': 8.953495893489794e-07, 'epoch': 1.74} {'loss': 0.4156, 'learning_rate': 8.952106388215909e-07, 'epoch': 1.74} {'loss': 0.3341, 'learning_rate': 8.950716985717788e-07, 'epoch': 1.74} {'loss': 0.2881, 'learning_rate': 8.949327685996989e-07, 'epoch': 1.74} {'loss': 0.2682, 'learning_rate': 8.947938489055097e-07, 'epoch': 1.74} {'loss': 0.295, 'learning_rate': 8.946549394893644e-07, 'epoch': 1.74} {'loss': 0.4304, 'learning_rate': 8.945160403514242e-07, 'epoch': 1.74} {'loss': 0.4226, 'learning_rate': 8.943771514918443e-07, 'epoch': 1.74} {'loss': 0.3492, 'learning_rate': 8.94238272910779e-07, 'epoch': 1.74} {'loss': 0.2588, 'learning_rate': 8.940994046083895e-07, 'epoch': 1.74} {'loss': 0.4353, 'learning_rate': 8.939605465848278e-07, 'epoch': 1.74} {'loss': 0.3989, 'learning_rate': 8.938216988402559e-07, 'epoch': 1.74} {'loss': 0.2864, 'learning_rate': 8.93682861374825e-07, 'epoch': 1.74} {'loss': 0.4562, 'learning_rate': 8.935440341886958e-07, 'epoch': 1.74} {'loss': 0.1876, 'learning_rate': 8.934052172820229e-07, 'epoch': 1.74} {'loss': 0.2801, 'learning_rate': 8.932664106549648e-07, 'epoch': 1.74} {'loss': 0.3779, 'learning_rate': 8.931276143076761e-07, 'epoch': 1.74} {'loss': 0.289, 'learning_rate': 8.929888282403165e-07, 'epoch': 1.74} {'loss': 0.388, 'learning_rate': 8.928500524530381e-07, 'epoch': 1.74} {'loss': 0.3042, 'learning_rate': 8.92711286946003e-07, 'epoch': 1.74} {'loss': 0.322, 'learning_rate': 8.925725317193646e-07, 'epoch': 1.74} {'loss': 0.2185, 'learning_rate': 8.92433786773278e-07, 'epoch': 1.74} {'loss': 0.3169, 'learning_rate': 8.922950521079033e-07, 'epoch': 1.74} {'loss': 0.4916, 'learning_rate': 8.921563277233935e-07, 'epoch': 1.74} {'loss': 0.3158, 'learning_rate': 8.920176136199099e-07, 'epoch': 1.74} {'loss': 0.2235, 'learning_rate': 8.918789097976044e-07, 'epoch': 1.74} {'loss': 0.2946, 'learning_rate': 8.91740216256638e-07, 'epoch': 1.74} {'loss': 0.3457, 'learning_rate': 8.916015329971617e-07, 'epoch': 1.74} {'loss': 0.171, 'learning_rate': 8.914628600193376e-07, 'epoch': 1.74} {'loss': 0.2876, 'learning_rate': 8.913241973233189e-07, 'epoch': 1.74} {'loss': 0.2881, 'learning_rate': 8.911855449092644e-07, 'epoch': 1.74} {'loss': 0.4327, 'learning_rate': 8.910469027773272e-07, 'epoch': 1.74} {'loss': 0.2377, 'learning_rate': 8.909082709276673e-07, 'epoch': 1.74} {'loss': 0.322, 'learning_rate': 8.90769649360439e-07, 'epoch': 1.74} {'loss': 0.3707, 'learning_rate': 8.90631038075801e-07, 'epoch': 1.74} {'loss': 0.2302, 'learning_rate': 8.904924370739066e-07, 'epoch': 1.74} {'loss': 0.3761, 'learning_rate': 8.903538463549133e-07, 'epoch': 1.74} {'loss': 0.34, 'learning_rate': 8.902152659189812e-07, 'epoch': 1.74} {'loss': 0.3727, 'learning_rate': 8.90076695766261e-07, 'epoch': 1.74} {'loss': 0.2477, 'learning_rate': 8.899381358969139e-07, 'epoch': 1.74} {'loss': 0.2478, 'learning_rate': 8.897995863110931e-07, 'epoch': 1.74} {'loss': 0.3834, 'learning_rate': 8.896610470089572e-07, 'epoch': 1.74} {'loss': 0.2445, 'learning_rate': 8.89522517990662e-07, 'epoch': 1.74} {'loss': 0.3305, 'learning_rate': 8.893839992563613e-07, 'epoch': 1.74} {'loss': 0.3214, 'learning_rate': 8.892454908062153e-07, 'epoch': 1.74} {'loss': 0.1732, 'learning_rate': 8.891069926403773e-07, 'epoch': 1.74} {'loss': 0.3168, 'learning_rate': 8.889685047590068e-07, 'epoch': 1.74} {'loss': 0.2255, 'learning_rate': 8.888300271622563e-07, 'epoch': 1.74} {'loss': 0.3644, 'learning_rate': 8.886915598502854e-07, 'epoch': 1.74} {'loss': 0.2141, 'learning_rate': 8.885531028232486e-07, 'epoch': 1.74} {'loss': 0.3523, 'learning_rate': 8.884146560813034e-07, 'epoch': 1.74} {'loss': 0.4434, 'learning_rate': 8.882762196246042e-07, 'epoch': 1.74} {'loss': 0.2611, 'learning_rate': 8.881377934533098e-07, 'epoch': 1.74} {'loss': 0.3192, 'learning_rate': 8.879993775675732e-07, 'epoch': 1.74} {'loss': 0.3476, 'learning_rate': 8.878609719675558e-07, 'epoch': 1.74} {'loss': 0.3207, 'learning_rate': 8.877225766534092e-07, 'epoch': 1.74} {'loss': 0.1427, 'learning_rate': 8.875841916252892e-07, 'epoch': 1.74} {'loss': 0.2777, 'learning_rate': 8.874458168833566e-07, 'epoch': 1.74} {'loss': 0.2893, 'learning_rate': 8.873074524277625e-07, 'epoch': 1.74} {'loss': 0.3931, 'learning_rate': 8.871690982586667e-07, 'epoch': 1.74} {'loss': 0.2511, 'learning_rate': 8.870307543762236e-07, 'epoch': 1.74} {'loss': 0.4611, 'learning_rate': 8.868924207805907e-07, 'epoch': 1.74} {'loss': 0.2338, 'learning_rate': 8.867540974719213e-07, 'epoch': 1.74} {'loss': 0.2711, 'learning_rate': 8.866157844503764e-07, 'epoch': 1.74} {'loss': 0.1314, 'learning_rate': 8.86477481716107e-07, 'epoch': 1.74} {'loss': 0.2187, 'learning_rate': 8.86339189269273e-07, 'epoch': 1.74} {'loss': 0.2401, 'learning_rate': 8.862009071100275e-07, 'epoch': 1.74} {'loss': 0.2901, 'learning_rate': 8.860626352385293e-07, 'epoch': 1.74} {'loss': 0.4524, 'learning_rate': 8.859243736549339e-07, 'epoch': 1.74} {'loss': 0.4431, 'learning_rate': 8.857861223593956e-07, 'epoch': 1.74} {'loss': 0.3242, 'learning_rate': 8.856478813520719e-07, 'epoch': 1.74} {'loss': 0.1847, 'learning_rate': 8.855096506331185e-07, 'epoch': 1.74} {'loss': 0.3501, 'learning_rate': 8.853714302026916e-07, 'epoch': 1.74} {'loss': 0.2485, 'learning_rate': 8.85233220060946e-07, 'epoch': 1.74} {'loss': 0.3326, 'learning_rate': 8.850950202080411e-07, 'epoch': 1.74} {'loss': 0.2477, 'learning_rate': 8.849568306441281e-07, 'epoch': 1.74} {'loss': 0.4961, 'learning_rate': 8.84818651369368e-07, 'epoch': 1.74} {'loss': 0.3158, 'learning_rate': 8.846804823839128e-07, 'epoch': 1.74} {'loss': 0.2266, 'learning_rate': 8.845423236879214e-07, 'epoch': 1.74} {'loss': 0.3758, 'learning_rate': 8.844041752815458e-07, 'epoch': 1.74} {'loss': 0.2253, 'learning_rate': 8.84266037164947e-07, 'epoch': 1.74} {'loss': 0.4063, 'learning_rate': 8.841279093382782e-07, 'epoch': 1.74} {'loss': 0.3761, 'learning_rate': 8.839897918016938e-07, 'epoch': 1.74} {'loss': 0.3301, 'learning_rate': 8.838516845553535e-07, 'epoch': 1.74} {'loss': 0.246, 'learning_rate': 8.837135875994085e-07, 'epoch': 1.74} {'loss': 0.2552, 'learning_rate': 8.835755009340197e-07, 'epoch': 1.74} {'loss': 0.3756, 'learning_rate': 8.834374245593392e-07, 'epoch': 1.74} {'loss': 0.3752, 'learning_rate': 8.832993584755256e-07, 'epoch': 1.74} {'loss': 0.3808, 'learning_rate': 8.831613026827313e-07, 'epoch': 1.74} {'loss': 0.3705, 'learning_rate': 8.830232571811159e-07, 'epoch': 1.74} {'loss': 0.2187, 'learning_rate': 8.828852219708329e-07, 'epoch': 1.74} {'loss': 0.2653, 'learning_rate': 8.827471970520396e-07, 'epoch': 1.74} {'loss': 0.2476, 'learning_rate': 8.826091824248895e-07, 'epoch': 1.74} {'loss': 0.4034, 'learning_rate': 8.824711780895412e-07, 'epoch': 1.74} {'loss': 0.3316, 'learning_rate': 8.823331840461502e-07, 'epoch': 1.74} {'loss': 0.3336, 'learning_rate': 8.821952002948686e-07, 'epoch': 1.74} {'loss': 0.2077, 'learning_rate': 8.820572268358573e-07, 'epoch': 1.74} {'loss': 0.2734, 'learning_rate': 8.819192636692664e-07, 'epoch': 1.74} {'loss': 0.2469, 'learning_rate': 8.817813107952578e-07, 'epoch': 1.74} {'loss': 0.3009, 'learning_rate': 8.816433682139825e-07, 'epoch': 1.74} {'loss': 0.3651, 'learning_rate': 8.815054359255992e-07, 'epoch': 1.74} {'loss': 0.321, 'learning_rate': 8.813675139302602e-07, 'epoch': 1.74} {'loss': 0.3799, 'learning_rate': 8.812296022281253e-07, 'epoch': 1.74} {'loss': 0.1981, 'learning_rate': 8.810917008193465e-07, 'epoch': 1.74} {'loss': 0.2335, 'learning_rate': 8.809538097040826e-07, 'epoch': 1.74} {'loss': 0.2523, 'learning_rate': 8.808159288824869e-07, 'epoch': 1.74} {'loss': 0.2978, 'learning_rate': 8.80678058354717e-07, 'epoch': 1.74} {'loss': 0.3247, 'learning_rate': 8.805401981209272e-07, 'epoch': 1.74} {'loss': 0.2157, 'learning_rate': 8.804023481812729e-07, 'epoch': 1.74} {'loss': 0.3943, 'learning_rate': 8.802645085359107e-07, 'epoch': 1.74} {'loss': 0.3128, 'learning_rate': 8.801266791849939e-07, 'epoch': 1.74} {'loss': 0.3854, 'learning_rate': 8.799888601286822e-07, 'epoch': 1.74} {'loss': 0.3347, 'learning_rate': 8.798510513671266e-07, 'epoch': 1.74} {'loss': 0.3666, 'learning_rate': 8.79713252900487e-07, 'epoch': 1.74} {'loss': 0.277, 'learning_rate': 8.795754647289146e-07, 'epoch': 1.74} {'loss': 0.2571, 'learning_rate': 8.7943768685257e-07, 'epoch': 1.74} {'loss': 0.2217, 'learning_rate': 8.792999192716035e-07, 'epoch': 1.74} {'loss': 0.2627, 'learning_rate': 8.791621619861746e-07, 'epoch': 1.74} {'loss': 0.237, 'learning_rate': 8.790244149964355e-07, 'epoch': 1.74} {'loss': 0.221, 'learning_rate': 8.788866783025452e-07, 'epoch': 1.74} {'loss': 0.3198, 'learning_rate': 8.787489519046566e-07, 'epoch': 1.74} {'loss': 0.2394, 'learning_rate': 8.786112358029253e-07, 'epoch': 1.74} {'loss': 0.1284, 'learning_rate': 8.784735299975089e-07, 'epoch': 1.74} {'loss': 0.3245, 'learning_rate': 8.783358344885595e-07, 'epoch': 1.74} {'loss': 0.2716, 'learning_rate': 8.781981492762359e-07, 'epoch': 1.74} {'loss': 0.339, 'learning_rate': 8.780604743606902e-07, 'epoch': 1.74} {'loss': 0.1914, 'learning_rate': 8.779228097420822e-07, 'epoch': 1.74} {'loss': 0.4154, 'learning_rate': 8.777851554205618e-07, 'epoch': 1.74} {'loss': 0.4025, 'learning_rate': 8.776475113962901e-07, 'epoch': 1.74} {'loss': 0.2026, 'learning_rate': 8.77509877669418e-07, 'epoch': 1.74} {'loss': 0.1763, 'learning_rate': 8.773722542401031e-07, 'epoch': 1.74} {'loss': 0.4022, 'learning_rate': 8.772346411084998e-07, 'epoch': 1.74} {'loss': 0.3214, 'learning_rate': 8.770970382747646e-07, 'epoch': 1.74} {'loss': 0.3665, 'learning_rate': 8.769594457390518e-07, 'epoch': 1.74} {'loss': 0.2405, 'learning_rate': 8.768218635015157e-07, 'epoch': 1.74} {'loss': 0.2506, 'learning_rate': 8.766842915623131e-07, 'epoch': 1.74} {'loss': 0.1395, 'learning_rate': 8.76546729921599e-07, 'epoch': 1.74} {'loss': 0.3695, 'learning_rate': 8.764091785795303e-07, 'epoch': 1.74} {'loss': 0.3702, 'learning_rate': 8.76271637536259e-07, 'epoch': 1.74} {'loss': 0.31, 'learning_rate': 8.761341067919437e-07, 'epoch': 1.74} {'loss': 0.349, 'learning_rate': 8.759965863467356e-07, 'epoch': 1.74} {'loss': 0.2661, 'learning_rate': 8.758590762007957e-07, 'epoch': 1.74} {'loss': 0.3728, 'learning_rate': 8.757215763542748e-07, 'epoch': 1.74} {'loss': 0.3194, 'learning_rate': 8.755840868073273e-07, 'epoch': 1.74} {'loss': 0.3526, 'learning_rate': 8.75446607560112e-07, 'epoch': 1.74} {'loss': 0.2422, 'learning_rate': 8.75309138612781e-07, 'epoch': 1.74} {'loss': 0.3423, 'learning_rate': 8.75171679965493e-07, 'epoch': 1.74} {'loss': 0.1352, 'learning_rate': 8.75034231618399e-07, 'epoch': 1.74} {'loss': 0.217, 'learning_rate': 8.748967935716579e-07, 'epoch': 1.74} {'loss': 0.2756, 'learning_rate': 8.747593658254205e-07, 'epoch': 1.74} {'loss': 0.2448, 'learning_rate': 8.746219483798468e-07, 'epoch': 1.74} {'loss': 0.2752, 'learning_rate': 8.744845412350889e-07, 'epoch': 1.74} {'loss': 0.2089, 'learning_rate': 8.743471443913032e-07, 'epoch': 1.74} {'loss': 0.1286, 'learning_rate': 8.74209757848643e-07, 'epoch': 1.74} {'loss': 0.2775, 'learning_rate': 8.740723816072661e-07, 'epoch': 1.74} {'loss': 0.277, 'learning_rate': 8.739350156673265e-07, 'epoch': 1.74} {'loss': 0.2798, 'learning_rate': 8.737976600289766e-07, 'epoch': 1.74} {'loss': 0.2885, 'learning_rate': 8.736603146923761e-07, 'epoch': 1.74} {'loss': 0.3832, 'learning_rate': 8.735229796576749e-07, 'epoch': 1.74} {'loss': 0.3222, 'learning_rate': 8.733856549250341e-07, 'epoch': 1.74} {'loss': 0.2956, 'learning_rate': 8.732483404946024e-07, 'epoch': 1.74} {'loss': 0.2732, 'learning_rate': 8.731110363665396e-07, 'epoch': 1.74} {'loss': 0.2736, 'learning_rate': 8.729737425409979e-07, 'epoch': 1.74} {'loss': 0.3952, 'learning_rate': 8.728364590181337e-07, 'epoch': 1.74} {'loss': 0.3143, 'learning_rate': 8.726991857981004e-07, 'epoch': 1.74} {'loss': 0.2853, 'learning_rate': 8.725619228810566e-07, 'epoch': 1.74} {'loss': 0.3621, 'learning_rate': 8.724246702671524e-07, 'epoch': 1.74} {'loss': 0.4702, 'learning_rate': 8.722874279565463e-07, 'epoch': 1.74} {'loss': 0.3353, 'learning_rate': 8.721501959493928e-07, 'epoch': 1.74} {'loss': 0.1691, 'learning_rate': 8.720129742458438e-07, 'epoch': 1.74} {'loss': 0.2167, 'learning_rate': 8.718757628460584e-07, 'epoch': 1.74} {'loss': 0.3021, 'learning_rate': 8.717385617501872e-07, 'epoch': 1.74} {'loss': 0.1382, 'learning_rate': 8.716013709583904e-07, 'epoch': 1.74} {'loss': 0.2208, 'learning_rate': 8.714641904708165e-07, 'epoch': 1.74} {'loss': 0.3924, 'learning_rate': 8.713270202876268e-07, 'epoch': 1.74} {'loss': 0.3358, 'learning_rate': 8.711898604089697e-07, 'epoch': 1.74} {'loss': 0.3702, 'learning_rate': 8.710527108350064e-07, 'epoch': 1.74} {'loss': 0.2083, 'learning_rate': 8.709155715658857e-07, 'epoch': 1.74} {'loss': 0.3885, 'learning_rate': 8.707784426017684e-07, 'epoch': 1.74} {'loss': 0.2513, 'learning_rate': 8.706413239428035e-07, 'epoch': 1.74} {'loss': 0.3587, 'learning_rate': 8.705042155891508e-07, 'epoch': 1.74} {'loss': 0.4005, 'learning_rate': 8.703671175409623e-07, 'epoch': 1.74} {'loss': 0.2684, 'learning_rate': 8.702300297983923e-07, 'epoch': 1.74} {'loss': 0.3354, 'learning_rate': 8.700929523615975e-07, 'epoch': 1.74} {'loss': 0.2285, 'learning_rate': 8.6995588523073e-07, 'epoch': 1.74} {'loss': 0.216, 'learning_rate': 8.698188284059483e-07, 'epoch': 1.74} {'loss': 0.1971, 'learning_rate': 8.696817818874026e-07, 'epoch': 1.74} {'loss': 0.3296, 'learning_rate': 8.695447456752515e-07, 'epoch': 1.74} {'loss': 0.3, 'learning_rate': 8.694077197696471e-07, 'epoch': 1.74} {'loss': 0.1622, 'learning_rate': 8.692707041707471e-07, 'epoch': 1.74} {'loss': 0.3249, 'learning_rate': 8.691336988787013e-07, 'epoch': 1.74} {'loss': 0.3933, 'learning_rate': 8.689967038936697e-07, 'epoch': 1.74} {'loss': 0.276, 'learning_rate': 8.688597192158033e-07, 'epoch': 1.74} {'loss': 0.2735, 'learning_rate': 8.687227448452584e-07, 'epoch': 1.74} {'loss': 0.508, 'learning_rate': 8.685857807821907e-07, 'epoch': 1.74} {'loss': 0.5216, 'learning_rate': 8.684488270267499e-07, 'epoch': 1.74} {'loss': 0.2648, 'learning_rate': 8.683118835790971e-07, 'epoch': 1.74} {'loss': 0.2304, 'learning_rate': 8.681749504393811e-07, 'epoch': 1.74} {'loss': 0.1986, 'learning_rate': 8.680380276077604e-07, 'epoch': 1.74} {'loss': 0.2068, 'learning_rate': 8.679011150843875e-07, 'epoch': 1.74} {'loss': 0.2932, 'learning_rate': 8.677642128694186e-07, 'epoch': 1.74} {'loss': 0.1261, 'learning_rate': 8.676273209630059e-07, 'epoch': 1.74} {'loss': 0.2559, 'learning_rate': 8.674904393653083e-07, 'epoch': 1.74} {'loss': 0.3399, 'learning_rate': 8.673535680764744e-07, 'epoch': 1.74} {'loss': 0.3976, 'learning_rate': 8.672167070966631e-07, 'epoch': 1.74} {'loss': 0.2851, 'learning_rate': 8.670798564260264e-07, 'epoch': 1.74} {'loss': 0.3641, 'learning_rate': 8.669430160647207e-07, 'epoch': 1.74} {'loss': 0.371, 'learning_rate': 8.668061860129006e-07, 'epoch': 1.74} {'loss': 0.3708, 'learning_rate': 8.666693662707171e-07, 'epoch': 1.74} {'loss': 0.3225, 'learning_rate': 8.665325568383298e-07, 'epoch': 1.74} {'loss': 0.2603, 'learning_rate': 8.663957577158877e-07, 'epoch': 1.74} {'loss': 0.3229, 'learning_rate': 8.662589689035506e-07, 'epoch': 1.74} {'loss': 0.2296, 'learning_rate': 8.661221904014683e-07, 'epoch': 1.74} {'loss': 0.246, 'learning_rate': 8.659854222097985e-07, 'epoch': 1.74} {'loss': 0.5346, 'learning_rate': 8.658486643286923e-07, 'epoch': 1.74} {'loss': 0.4574, 'learning_rate': 8.657119167583083e-07, 'epoch': 1.74} {'loss': 0.2004, 'learning_rate': 8.655751794987965e-07, 'epoch': 1.74} {'loss': 0.4653, 'learning_rate': 8.654384525503146e-07, 'epoch': 1.74} {'loss': 0.2995, 'learning_rate': 8.653017359130144e-07, 'epoch': 1.74} {'loss': 0.4238, 'learning_rate': 8.65165029587054e-07, 'epoch': 1.74} {'loss': 0.4511, 'learning_rate': 8.65028333572584e-07, 'epoch': 1.74} {'loss': 0.425, 'learning_rate': 8.648916478697589e-07, 'epoch': 1.74} {'loss': 0.313, 'learning_rate': 8.647549724787363e-07, 'epoch': 1.74} {'loss': 0.2977, 'learning_rate': 8.646183073996651e-07, 'epoch': 1.74} {'loss': 0.2696, 'learning_rate': 8.644816526327049e-07, 'epoch': 1.74} {'loss': 0.3624, 'learning_rate': 8.64345008178007e-07, 'epoch': 1.74} {'loss': 0.4184, 'learning_rate': 8.642083740357266e-07, 'epoch': 1.74} {'loss': 0.3351, 'learning_rate': 8.64071750206017e-07, 'epoch': 1.74} {'loss': 0.3814, 'learning_rate': 8.639351366890347e-07, 'epoch': 1.74} {'loss': 0.332, 'learning_rate': 8.637985334849297e-07, 'epoch': 1.74} {'loss': 0.3693, 'learning_rate': 8.636619405938618e-07, 'epoch': 1.74} {'loss': 0.5078, 'learning_rate': 8.635253580159796e-07, 'epoch': 1.74} {'loss': 0.1511, 'learning_rate': 8.633887857514423e-07, 'epoch': 1.74} {'loss': 0.2194, 'learning_rate': 8.632522238004004e-07, 'epoch': 1.74} {'loss': 0.2792, 'learning_rate': 8.631156721630074e-07, 'epoch': 1.74} {'loss': 0.2752, 'learning_rate': 8.62979130839422e-07, 'epoch': 1.74} {'loss': 0.3979, 'learning_rate': 8.62842599829794e-07, 'epoch': 1.74} {'loss': 0.2354, 'learning_rate': 8.627060791342811e-07, 'epoch': 1.74} {'loss': 0.2892, 'learning_rate': 8.625695687530333e-07, 'epoch': 1.74} {'loss': 0.2541, 'learning_rate': 8.624330686862092e-07, 'epoch': 1.74} {'loss': 0.433, 'learning_rate': 8.622965789339599e-07, 'epoch': 1.74} {'loss': 0.2444, 'learning_rate': 8.621600994964386e-07, 'epoch': 1.74} {'loss': 0.3624, 'learning_rate': 8.620236303738039e-07, 'epoch': 1.74} {'loss': 0.341, 'learning_rate': 8.618871715662036e-07, 'epoch': 1.74} {'loss': 0.1684, 'learning_rate': 8.617507230737976e-07, 'epoch': 1.74} {'loss': 0.5608, 'learning_rate': 8.616142848967346e-07, 'epoch': 1.74} {'loss': 0.2739, 'learning_rate': 8.614778570351745e-07, 'epoch': 1.74} {'loss': 0.2792, 'learning_rate': 8.61341439489265e-07, 'epoch': 1.74} {'loss': 0.2256, 'learning_rate': 8.612050322591659e-07, 'epoch': 1.74} {'loss': 0.3722, 'learning_rate': 8.610686353450259e-07, 'epoch': 1.74} {'loss': 0.3514, 'learning_rate': 8.609322487470039e-07, 'epoch': 1.74} {'loss': 0.2492, 'learning_rate': 8.607958724652498e-07, 'epoch': 1.74} {'loss': 0.3433, 'learning_rate': 8.606595064999212e-07, 'epoch': 1.74} {'loss': 0.3722, 'learning_rate': 8.605231508511691e-07, 'epoch': 1.74} {'loss': 0.3535, 'learning_rate': 8.603868055191478e-07, 'epoch': 1.74} {'loss': 0.2259, 'learning_rate': 8.602504705040127e-07, 'epoch': 1.74} {'loss': 0.2092, 'learning_rate': 8.60114145805916e-07, 'epoch': 1.74} {'loss': 0.1428, 'learning_rate': 8.59977831425014e-07, 'epoch': 1.74} {'loss': 0.3256, 'learning_rate': 8.598415273614569e-07, 'epoch': 1.74} {'loss': 0.3275, 'learning_rate': 8.597052336154022e-07, 'epoch': 1.74} {'loss': 0.2744, 'learning_rate': 8.595689501869997e-07, 'epoch': 1.74} {'loss': 0.404, 'learning_rate': 8.594326770764094e-07, 'epoch': 1.74} {'loss': 0.2947, 'learning_rate': 8.592964142837778e-07, 'epoch': 1.74} {'loss': 0.3994, 'learning_rate': 8.591601618092649e-07, 'epoch': 1.74} {'loss': 0.3145, 'learning_rate': 8.590239196530204e-07, 'epoch': 1.74} {'loss': 0.2693, 'learning_rate': 8.588876878152019e-07, 'epoch': 1.74} {'loss': 0.3416, 'learning_rate': 8.587514662959595e-07, 'epoch': 1.74} {'loss': 0.142, 'learning_rate': 8.586152550954474e-07, 'epoch': 1.74} {'loss': 0.3, 'learning_rate': 8.584790542138233e-07, 'epoch': 1.74} {'loss': 0.369, 'learning_rate': 8.583428636512348e-07, 'epoch': 1.74} {'loss': 0.3156, 'learning_rate': 8.582066834078406e-07, 'epoch': 1.74} {'loss': 0.3201, 'learning_rate': 8.580705134837919e-07, 'epoch': 1.74} {'loss': 0.4316, 'learning_rate': 8.57934353879244e-07, 'epoch': 1.74} {'loss': 0.3352, 'learning_rate': 8.577982045943478e-07, 'epoch': 1.74} {'loss': 0.4675, 'learning_rate': 8.576620656292611e-07, 'epoch': 1.74} {'loss': 0.303, 'learning_rate': 8.575259369841338e-07, 'epoch': 1.74} {'loss': 0.3335, 'learning_rate': 8.573898186591234e-07, 'epoch': 1.74} {'loss': 0.196, 'learning_rate': 8.572537106543788e-07, 'epoch': 1.74} {'loss': 0.3339, 'learning_rate': 8.571176129700587e-07, 'epoch': 1.74} {'loss': 0.3558, 'learning_rate': 8.569815256063141e-07, 'epoch': 1.74} {'loss': 0.3854, 'learning_rate': 8.56845448563296e-07, 'epoch': 1.74} {'loss': 0.2364, 'learning_rate': 8.567093818411631e-07, 'epoch': 1.74} {'loss': 0.4244, 'learning_rate': 8.565733254400655e-07, 'epoch': 1.74} {'loss': 0.3941, 'learning_rate': 8.564372793601583e-07, 'epoch': 1.74} {'loss': 0.2124, 'learning_rate': 8.563012436015938e-07, 'epoch': 1.74} {'loss': 0.2899, 'learning_rate': 8.561652181645286e-07, 'epoch': 1.74} {'loss': 0.2155, 'learning_rate': 8.560292030491113e-07, 'epoch': 1.74} {'loss': 0.2536, 'learning_rate': 8.558931982555007e-07, 'epoch': 1.74} {'loss': 0.3049, 'learning_rate': 8.557572037838468e-07, 'epoch': 1.74} {'loss': 0.3266, 'learning_rate': 8.55621219634305e-07, 'epoch': 1.74} {'loss': 0.3422, 'learning_rate': 8.554852458070262e-07, 'epoch': 1.74} {'loss': 0.3028, 'learning_rate': 8.55349282302167e-07, 'epoch': 1.74} {'loss': 0.2768, 'learning_rate': 8.552133291198805e-07, 'epoch': 1.74} {'loss': 0.245, 'learning_rate': 8.550773862603167e-07, 'epoch': 1.74} {'loss': 0.3486, 'learning_rate': 8.549414537236334e-07, 'epoch': 1.74} {'loss': 0.3264, 'learning_rate': 8.548055315099801e-07, 'epoch': 1.74} {'loss': 0.3389, 'learning_rate': 8.546696196195148e-07, 'epoch': 1.74} {'loss': 0.2763, 'learning_rate': 8.545337180523861e-07, 'epoch': 1.74} {'loss': 0.2969, 'learning_rate': 8.543978268087528e-07, 'epoch': 1.74} {'loss': 0.2856, 'learning_rate': 8.542619458887613e-07, 'epoch': 1.74} {'loss': 0.4164, 'learning_rate': 8.541260752925728e-07, 'epoch': 1.74} {'loss': 0.3511, 'learning_rate': 8.539902150203338e-07, 'epoch': 1.74} {'loss': 0.2553, 'learning_rate': 8.538543650722031e-07, 'epoch': 1.74} {'loss': 0.418, 'learning_rate': 8.537185254483293e-07, 'epoch': 1.74} {'loss': 0.4131, 'learning_rate': 8.535826961488691e-07, 'epoch': 1.74} {'loss': 0.3357, 'learning_rate': 8.534468771739746e-07, 'epoch': 1.74} {'loss': 0.4183, 'learning_rate': 8.533110685238e-07, 'epoch': 1.74} {'loss': 0.2098, 'learning_rate': 8.531752701984986e-07, 'epoch': 1.74} {'loss': 0.283, 'learning_rate': 8.530394821982202e-07, 'epoch': 1.74} {'loss': 0.2588, 'learning_rate': 8.529037045231236e-07, 'epoch': 1.74} {'loss': 0.1762, 'learning_rate': 8.527679371733566e-07, 'epoch': 1.74} {'loss': 0.2892, 'learning_rate': 8.526321801490777e-07, 'epoch': 1.74} {'loss': 0.1837, 'learning_rate': 8.52496433450436e-07, 'epoch': 1.74} {'loss': 0.3126, 'learning_rate': 8.523606970775877e-07, 'epoch': 1.74} {'loss': 0.4447, 'learning_rate': 8.522249710306829e-07, 'epoch': 1.74} {'loss': 0.2971, 'learning_rate': 8.520892553098781e-07, 'epoch': 1.74} {'loss': 0.2958, 'learning_rate': 8.519535499153241e-07, 'epoch': 1.74} {'loss': 0.3413, 'learning_rate': 8.518178548471756e-07, 'epoch': 1.74} {'loss': 0.3935, 'learning_rate': 8.516821701055844e-07, 'epoch': 1.74} {'loss': 0.3552, 'learning_rate': 8.515464956907049e-07, 'epoch': 1.74} {'loss': 0.138, 'learning_rate': 8.514108316026915e-07, 'epoch': 1.74} {'loss': 0.3932, 'learning_rate': 8.512751778416928e-07, 'epoch': 1.74} {'loss': 0.3237, 'learning_rate': 8.511395344078665e-07, 'epoch': 1.74} {'loss': 0.1887, 'learning_rate': 8.510039013013616e-07, 'epoch': 1.74} {'loss': 0.4077, 'learning_rate': 8.508682785223355e-07, 'epoch': 1.74} {'loss': 0.2822, 'learning_rate': 8.50732666070938e-07, 'epoch': 1.74} {'loss': 0.204, 'learning_rate': 8.50597063947326e-07, 'epoch': 1.74} {'loss': 0.2593, 'learning_rate': 8.504614721516469e-07, 'epoch': 1.74} {'loss': 0.2219, 'learning_rate': 8.503258906840595e-07, 'epoch': 1.74} {'loss': 0.2869, 'learning_rate': 8.501903195447126e-07, 'epoch': 1.74} {'loss': 0.4171, 'learning_rate': 8.500547587337626e-07, 'epoch': 1.74} {'loss': 0.3652, 'learning_rate': 8.499192082513585e-07, 'epoch': 1.74} {'loss': 0.2417, 'learning_rate': 8.497836680976579e-07, 'epoch': 1.74} {'loss': 0.2724, 'learning_rate': 8.496481382728094e-07, 'epoch': 1.74} {'loss': 0.3227, 'learning_rate': 8.495126187769687e-07, 'epoch': 1.74} {'loss': 0.2912, 'learning_rate': 8.493771096102898e-07, 'epoch': 1.74} {'loss': 0.3583, 'learning_rate': 8.492416107729218e-07, 'epoch': 1.74} {'loss': 0.2996, 'learning_rate': 8.491061222650221e-07, 'epoch': 1.74} {'loss': 0.5121, 'learning_rate': 8.489706440867395e-07, 'epoch': 1.74} {'loss': 0.3094, 'learning_rate': 8.488351762382307e-07, 'epoch': 1.74} {'loss': 0.2766, 'learning_rate': 8.486997187196477e-07, 'epoch': 1.74} {'loss': 0.3218, 'learning_rate': 8.485642715311393e-07, 'epoch': 1.74} {'loss': 0.3924, 'learning_rate': 8.484288346728642e-07, 'epoch': 1.74} {'loss': 0.2445, 'learning_rate': 8.482934081449712e-07, 'epoch': 1.74} {'loss': 0.3305, 'learning_rate': 8.481579919476157e-07, 'epoch': 1.74} {'loss': 0.2194, 'learning_rate': 8.480225860809488e-07, 'epoch': 1.74} {'loss': 0.3287, 'learning_rate': 8.478871905451247e-07, 'epoch': 1.74} {'loss': 0.3368, 'learning_rate': 8.477518053402945e-07, 'epoch': 1.74} {'loss': 0.3046, 'learning_rate': 8.476164304666134e-07, 'epoch': 1.74} {'loss': 0.4273, 'learning_rate': 8.474810659242316e-07, 'epoch': 1.74} {'loss': 0.3289, 'learning_rate': 8.473457117133044e-07, 'epoch': 1.74} {'loss': 0.2244, 'learning_rate': 8.472103678339827e-07, 'epoch': 1.74} {'loss': 0.4502, 'learning_rate': 8.470750342864209e-07, 'epoch': 1.74} {'loss': 0.4239, 'learning_rate': 8.469397110707711e-07, 'epoch': 1.74} {'loss': 0.3566, 'learning_rate': 8.468043981871843e-07, 'epoch': 1.74} {'loss': 0.3913, 'learning_rate': 8.46669095635817e-07, 'epoch': 1.74} {'loss': 0.3456, 'learning_rate': 8.46533803416817e-07, 'epoch': 1.74} {'loss': 0.2094, 'learning_rate': 8.463985215303416e-07, 'epoch': 1.74} {'loss': 0.2743, 'learning_rate': 8.4626324997654e-07, 'epoch': 1.74} {'loss': 0.1483, 'learning_rate': 8.461279887555685e-07, 'epoch': 1.74} {'loss': 0.1866, 'learning_rate': 8.459927378675759e-07, 'epoch': 1.74} {'loss': 0.3313, 'learning_rate': 8.458574973127187e-07, 'epoch': 1.74} {'loss': 0.2905, 'learning_rate': 8.457222670911458e-07, 'epoch': 1.74} {'loss': 0.1193, 'learning_rate': 8.455870472030137e-07, 'epoch': 1.74} {'loss': 0.3282, 'learning_rate': 8.45451837648471e-07, 'epoch': 1.74} {'loss': 0.3891, 'learning_rate': 8.453166384276734e-07, 'epoch': 1.74} {'loss': 0.3334, 'learning_rate': 8.45181449540774e-07, 'epoch': 1.74} {'loss': 0.286, 'learning_rate': 8.450462709879215e-07, 'epoch': 1.74} {'loss': 0.3017, 'learning_rate': 8.449111027692725e-07, 'epoch': 1.74} {'loss': 0.2458, 'learning_rate': 8.447759448849757e-07, 'epoch': 1.74} {'loss': 0.3424, 'learning_rate': 8.446407973351878e-07, 'epoch': 1.74} {'loss': 0.3711, 'learning_rate': 8.445056601200586e-07, 'epoch': 1.74} {'loss': 0.3088, 'learning_rate': 8.443705332397423e-07, 'epoch': 1.74} {'loss': 0.3936, 'learning_rate': 8.442354166943889e-07, 'epoch': 1.74} {'loss': 0.1545, 'learning_rate': 8.44100310484155e-07, 'epoch': 1.74} {'loss': 0.2672, 'learning_rate': 8.439652146091893e-07, 'epoch': 1.74} {'loss': 0.3656, 'learning_rate': 8.43830129069646e-07, 'epoch': 1.74} {'loss': 0.305, 'learning_rate': 8.436950538656774e-07, 'epoch': 1.74} {'loss': 0.3826, 'learning_rate': 8.435599889974366e-07, 'epoch': 1.74} {'loss': 0.1947, 'learning_rate': 8.434249344650758e-07, 'epoch': 1.74} {'loss': 0.2044, 'learning_rate': 8.432898902687447e-07, 'epoch': 1.74} {'loss': 0.2398, 'learning_rate': 8.431548564086011e-07, 'epoch': 1.74} {'loss': 0.4569, 'learning_rate': 8.430198328847916e-07, 'epoch': 1.74} {'loss': 0.1889, 'learning_rate': 8.428848196974737e-07, 'epoch': 1.74} {'loss': 0.1799, 'learning_rate': 8.427498168467951e-07, 'epoch': 1.74} {'loss': 0.3281, 'learning_rate': 8.426148243329136e-07, 'epoch': 1.74} {'loss': 0.1967, 'learning_rate': 8.424798421559754e-07, 'epoch': 1.74} {'loss': 0.244, 'learning_rate': 8.423448703161385e-07, 'epoch': 1.75} {'loss': 0.3188, 'learning_rate': 8.422099088135515e-07, 'epoch': 1.75} {'loss': 0.2859, 'learning_rate': 8.420749576483688e-07, 'epoch': 1.75} {'loss': 0.3326, 'learning_rate': 8.419400168207414e-07, 'epoch': 1.75} {'loss': 0.3986, 'learning_rate': 8.418050863308236e-07, 'epoch': 1.75} {'loss': 0.189, 'learning_rate': 8.416701661787663e-07, 'epoch': 1.75} {'loss': 0.2506, 'learning_rate': 8.415352563647195e-07, 'epoch': 1.75} {'loss': 0.405, 'learning_rate': 8.414003568888407e-07, 'epoch': 1.75} {'loss': 0.1783, 'learning_rate': 8.412654677512766e-07, 'epoch': 1.75} {'loss': 0.2968, 'learning_rate': 8.411305889521848e-07, 'epoch': 1.75} {'loss': 0.3921, 'learning_rate': 8.409957204917118e-07, 'epoch': 1.75} {'loss': 0.3361, 'learning_rate': 8.408608623700165e-07, 'epoch': 1.75} {'loss': 0.227, 'learning_rate': 8.407260145872442e-07, 'epoch': 1.75} {'loss': 0.3549, 'learning_rate': 8.405911771435538e-07, 'epoch': 1.75} {'loss': 0.3295, 'learning_rate': 8.404563500390916e-07, 'epoch': 1.75} {'loss': 0.2843, 'learning_rate': 8.403215332740134e-07, 'epoch': 1.75} {'loss': 0.4051, 'learning_rate': 8.401867268484698e-07, 'epoch': 1.75} {'loss': 0.2975, 'learning_rate': 8.400519307626153e-07, 'epoch': 1.75} {'loss': 0.4684, 'learning_rate': 8.399171450166e-07, 'epoch': 1.75} {'loss': 0.2531, 'learning_rate': 8.397823696105745e-07, 'epoch': 1.75} {'loss': 0.4006, 'learning_rate': 8.396476045446945e-07, 'epoch': 1.75} {'loss': 0.3553, 'learning_rate': 8.395128498191096e-07, 'epoch': 1.75} {'loss': 0.3005, 'learning_rate': 8.393781054339734e-07, 'epoch': 1.75} {'loss': 0.3603, 'learning_rate': 8.392433713894355e-07, 'epoch': 1.75} {'loss': 0.2585, 'learning_rate': 8.391086476856525e-07, 'epoch': 1.75} {'loss': 0.3146, 'learning_rate': 8.389739343227721e-07, 'epoch': 1.75} {'loss': 0.3288, 'learning_rate': 8.388392313009486e-07, 'epoch': 1.75} {'loss': 0.3157, 'learning_rate': 8.38704538620333e-07, 'epoch': 1.75} {'loss': 0.1614, 'learning_rate': 8.385698562810785e-07, 'epoch': 1.75} {'loss': 0.3045, 'learning_rate': 8.38435184283336e-07, 'epoch': 1.75} {'loss': 0.3943, 'learning_rate': 8.383005226272589e-07, 'epoch': 1.75} {'loss': 0.5406, 'learning_rate': 8.381658713129992e-07, 'epoch': 1.75} {'loss': 0.239, 'learning_rate': 8.380312303407056e-07, 'epoch': 1.75} {'loss': 0.2893, 'learning_rate': 8.378965997105337e-07, 'epoch': 1.75} {'loss': 0.2062, 'learning_rate': 8.377619794226332e-07, 'epoch': 1.75} {'loss': 0.3711, 'learning_rate': 8.376273694771597e-07, 'epoch': 1.75} {'loss': 0.2758, 'learning_rate': 8.374927698742596e-07, 'epoch': 1.75} {'loss': 0.2543, 'learning_rate': 8.373581806140896e-07, 'epoch': 1.75} {'loss': 0.2772, 'learning_rate': 8.372236016967994e-07, 'epoch': 1.75} {'loss': 0.1751, 'learning_rate': 8.370890331225423e-07, 'epoch': 1.75} {'loss': 0.3728, 'learning_rate': 8.36954474891467e-07, 'epoch': 1.75} {'loss': 0.388, 'learning_rate': 8.368199270037303e-07, 'epoch': 1.75} {'loss': 0.3373, 'learning_rate': 8.366853894594795e-07, 'epoch': 1.75} {'loss': 0.3994, 'learning_rate': 8.365508622588692e-07, 'epoch': 1.75} {'loss': 0.2766, 'learning_rate': 8.364163454020513e-07, 'epoch': 1.75} {'loss': 0.2609, 'learning_rate': 8.362818388891736e-07, 'epoch': 1.75} {'loss': 0.4044, 'learning_rate': 8.361473427203937e-07, 'epoch': 1.75} {'loss': 0.2239, 'learning_rate': 8.360128568958603e-07, 'epoch': 1.75} {'loss': 0.4286, 'learning_rate': 8.358783814157268e-07, 'epoch': 1.75} {'loss': 0.3541, 'learning_rate': 8.357439162801417e-07, 'epoch': 1.75} {'loss': 0.4029, 'learning_rate': 8.356094614892618e-07, 'epoch': 1.75} {'loss': 0.2851, 'learning_rate': 8.354750170432347e-07, 'epoch': 1.75} {'loss': 0.4148, 'learning_rate': 8.353405829422146e-07, 'epoch': 1.75} {'loss': 0.3075, 'learning_rate': 8.352061591863514e-07, 'epoch': 1.75} {'loss': 0.3622, 'learning_rate': 8.350717457757973e-07, 'epoch': 1.75} {'loss': 0.3353, 'learning_rate': 8.349373427107055e-07, 'epoch': 1.75} {'loss': 0.2618, 'learning_rate': 8.348029499912247e-07, 'epoch': 1.75} {'loss': 0.1873, 'learning_rate': 8.346685676175115e-07, 'epoch': 1.75} {'loss': 0.2765, 'learning_rate': 8.345341955897113e-07, 'epoch': 1.75} {'loss': 0.3356, 'learning_rate': 8.343998339079818e-07, 'epoch': 1.75} {'loss': 0.4058, 'learning_rate': 8.342654825724705e-07, 'epoch': 1.75} {'loss': 0.1565, 'learning_rate': 8.341311415833308e-07, 'epoch': 1.75} {'loss': 0.2762, 'learning_rate': 8.339968109407137e-07, 'epoch': 1.75} {'loss': 0.396, 'learning_rate': 8.338624906447723e-07, 'epoch': 1.75} {'loss': 0.1949, 'learning_rate': 8.337281806956555e-07, 'epoch': 1.75} {'loss': 0.4593, 'learning_rate': 8.335938810935185e-07, 'epoch': 1.75} {'loss': 0.2602, 'learning_rate': 8.334595918385114e-07, 'epoch': 1.75} {'loss': 0.3307, 'learning_rate': 8.333253129307827e-07, 'epoch': 1.75} {'loss': 0.352, 'learning_rate': 8.331910443704882e-07, 'epoch': 1.75} {'loss': 0.3075, 'learning_rate': 8.330567861577765e-07, 'epoch': 1.75} {'loss': 0.2659, 'learning_rate': 8.32922538292803e-07, 'epoch': 1.75} {'loss': 0.2924, 'learning_rate': 8.327883007757143e-07, 'epoch': 1.75} {'loss': 0.3283, 'learning_rate': 8.326540736066657e-07, 'epoch': 1.75} {'loss': 0.3059, 'learning_rate': 8.325198567858061e-07, 'epoch': 1.75} {'loss': 0.2448, 'learning_rate': 8.32385650313291e-07, 'epoch': 1.75} {'loss': 0.2458, 'learning_rate': 8.322514541892656e-07, 'epoch': 1.75} {'loss': 0.3603, 'learning_rate': 8.321172684138878e-07, 'epoch': 1.75} {'loss': 0.1339, 'learning_rate': 8.31983092987304e-07, 'epoch': 1.75} {'loss': 0.3407, 'learning_rate': 8.318489279096709e-07, 'epoch': 1.75} {'loss': 0.1847, 'learning_rate': 8.317147731811359e-07, 'epoch': 1.75} {'loss': 0.2826, 'learning_rate': 8.315806288018502e-07, 'epoch': 1.75} {'loss': 0.348, 'learning_rate': 8.31446494771968e-07, 'epoch': 1.75} {'loss': 0.3369, 'learning_rate': 8.313123710916371e-07, 'epoch': 1.75} {'loss': 0.1429, 'learning_rate': 8.311782577610128e-07, 'epoch': 1.75} {'loss': 0.3336, 'learning_rate': 8.310441547802439e-07, 'epoch': 1.75} {'loss': 0.2219, 'learning_rate': 8.309100621494837e-07, 'epoch': 1.75} {'loss': 0.1414, 'learning_rate': 8.307759798688808e-07, 'epoch': 1.75} {'loss': 0.2416, 'learning_rate': 8.306419079385897e-07, 'epoch': 1.75} {'loss': 0.1973, 'learning_rate': 8.30507846358759e-07, 'epoch': 1.75} {'loss': 0.2524, 'learning_rate': 8.303737951295421e-07, 'epoch': 1.75} {'loss': 0.2919, 'learning_rate': 8.302397542510887e-07, 'epoch': 1.75} {'loss': 0.3075, 'learning_rate': 8.301057237235522e-07, 'epoch': 1.75} {'loss': 0.4506, 'learning_rate': 8.299717035470822e-07, 'epoch': 1.75} {'loss': 0.317, 'learning_rate': 8.2983769372183e-07, 'epoch': 1.75} {'loss': 0.173, 'learning_rate': 8.297036942479475e-07, 'epoch': 1.75} {'loss': 0.2567, 'learning_rate': 8.295697051255847e-07, 'epoch': 1.75} {'loss': 0.3625, 'learning_rate': 8.294357263548957e-07, 'epoch': 1.75} {'loss': 0.3842, 'learning_rate': 8.293017579360285e-07, 'epoch': 1.75} {'loss': 0.2843, 'learning_rate': 8.291677998691372e-07, 'epoch': 1.75} {'loss': 0.3204, 'learning_rate': 8.290338521543695e-07, 'epoch': 1.75} {'loss': 0.2259, 'learning_rate': 8.288999147918797e-07, 'epoch': 1.75} {'loss': 0.3322, 'learning_rate': 8.287659877818177e-07, 'epoch': 1.75} {'loss': 0.4155, 'learning_rate': 8.286320711243356e-07, 'epoch': 1.75} {'loss': 0.2849, 'learning_rate': 8.284981648195822e-07, 'epoch': 1.75} {'loss': 0.3013, 'learning_rate': 8.283642688677129e-07, 'epoch': 1.75} {'loss': 0.3061, 'learning_rate': 8.282303832688754e-07, 'epoch': 1.75} {'loss': 0.3422, 'learning_rate': 8.280965080232207e-07, 'epoch': 1.75} {'loss': 0.3228, 'learning_rate': 8.279626431309018e-07, 'epoch': 1.75} {'loss': 0.2245, 'learning_rate': 8.278287885920677e-07, 'epoch': 1.75} {'loss': 0.2386, 'learning_rate': 8.276949444068727e-07, 'epoch': 1.75} {'loss': 0.2678, 'learning_rate': 8.275611105754633e-07, 'epoch': 1.75} {'loss': 0.4997, 'learning_rate': 8.27427287097996e-07, 'epoch': 1.75} {'loss': 0.3663, 'learning_rate': 8.272934739746164e-07, 'epoch': 1.75} {'loss': 0.378, 'learning_rate': 8.271596712054808e-07, 'epoch': 1.75} {'loss': 0.1498, 'learning_rate': 8.270258787907348e-07, 'epoch': 1.75} {'loss': 0.4668, 'learning_rate': 8.26892096730535e-07, 'epoch': 1.75} {'loss': 0.2665, 'learning_rate': 8.267583250250277e-07, 'epoch': 1.75} {'loss': 0.1384, 'learning_rate': 8.266245636743675e-07, 'epoch': 1.75} {'loss': 0.4134, 'learning_rate': 8.264908126787042e-07, 'epoch': 1.75} {'loss': 0.3506, 'learning_rate': 8.263570720381853e-07, 'epoch': 1.75} {'loss': 0.2434, 'learning_rate': 8.262233417529675e-07, 'epoch': 1.75} {'loss': 0.3212, 'learning_rate': 8.260896218231973e-07, 'epoch': 1.75} {'loss': 0.1613, 'learning_rate': 8.25955912249029e-07, 'epoch': 1.75} {'loss': 0.358, 'learning_rate': 8.258222130306104e-07, 'epoch': 1.75} {'loss': 0.238, 'learning_rate': 8.256885241680957e-07, 'epoch': 1.75} {'loss': 0.3174, 'learning_rate': 8.255548456616324e-07, 'epoch': 1.75} {'loss': 0.3478, 'learning_rate': 8.254211775113752e-07, 'epoch': 1.75} {'loss': 0.3984, 'learning_rate': 8.252875197174704e-07, 'epoch': 1.75} {'loss': 0.3577, 'learning_rate': 8.251538722800734e-07, 'epoch': 1.75} {'loss': 0.2341, 'learning_rate': 8.250202351993309e-07, 'epoch': 1.75} {'loss': 0.3786, 'learning_rate': 8.248866084753981e-07, 'epoch': 1.75} {'loss': 0.3234, 'learning_rate': 8.247529921084229e-07, 'epoch': 1.75} {'loss': 0.2523, 'learning_rate': 8.246193860985563e-07, 'epoch': 1.75} {'loss': 0.3997, 'learning_rate': 8.244857904459503e-07, 'epoch': 1.75} {'loss': 0.3178, 'learning_rate': 8.243522051507535e-07, 'epoch': 1.75} {'loss': 0.2755, 'learning_rate': 8.242186302131194e-07, 'epoch': 1.75} {'loss': 0.3533, 'learning_rate': 8.240850656331966e-07, 'epoch': 1.75} {'loss': 0.3566, 'learning_rate': 8.239515114111396e-07, 'epoch': 1.75} {'loss': 0.3459, 'learning_rate': 8.238179675470936e-07, 'epoch': 1.75} {'loss': 0.4877, 'learning_rate': 8.236844340412131e-07, 'epoch': 1.75} {'loss': 0.2912, 'learning_rate': 8.235509108936479e-07, 'epoch': 1.75} {'loss': 0.3366, 'learning_rate': 8.23417398104549e-07, 'epoch': 1.75} {'loss': 0.4404, 'learning_rate': 8.232838956740663e-07, 'epoch': 1.75} {'loss': 0.3269, 'learning_rate': 8.231504036023519e-07, 'epoch': 1.75} {'loss': 0.3006, 'learning_rate': 8.230169218895557e-07, 'epoch': 1.75} {'loss': 0.2374, 'learning_rate': 8.228834505358252e-07, 'epoch': 1.75} {'loss': 0.2939, 'learning_rate': 8.227499895413183e-07, 'epoch': 1.75} {'loss': 0.2511, 'learning_rate': 8.226165389061791e-07, 'epoch': 1.75} {'loss': 0.3312, 'learning_rate': 8.224830986305621e-07, 'epoch': 1.75} {'loss': 0.2067, 'learning_rate': 8.223496687146148e-07, 'epoch': 1.75} {'loss': 0.3458, 'learning_rate': 8.222162491584917e-07, 'epoch': 1.75} {'loss': 0.2705, 'learning_rate': 8.220828399623404e-07, 'epoch': 1.75} {'loss': 0.2241, 'learning_rate': 8.219494411263118e-07, 'epoch': 1.75} {'loss': 0.3525, 'learning_rate': 8.21816052650558e-07, 'epoch': 1.75} {'loss': 0.2941, 'learning_rate': 8.216826745352268e-07, 'epoch': 1.75} {'loss': 0.2273, 'learning_rate': 8.215493067804725e-07, 'epoch': 1.75} {'loss': 0.3868, 'learning_rate': 8.214159493864416e-07, 'epoch': 1.75} {'loss': 0.269, 'learning_rate': 8.212826023532883e-07, 'epoch': 1.75} {'loss': 0.3356, 'learning_rate': 8.211492656811603e-07, 'epoch': 1.75} {'loss': 0.2322, 'learning_rate': 8.210159393702111e-07, 'epoch': 1.75} {'loss': 0.3987, 'learning_rate': 8.20882623420588e-07, 'epoch': 1.75} {'loss': 0.3224, 'learning_rate': 8.207493178324444e-07, 'epoch': 1.75} {'loss': 0.2946, 'learning_rate': 8.206160226059267e-07, 'epoch': 1.75} {'loss': 0.2034, 'learning_rate': 8.204827377411905e-07, 'epoch': 1.75} {'loss': 0.2649, 'learning_rate': 8.203494632383835e-07, 'epoch': 1.75} {'loss': 0.4001, 'learning_rate': 8.202161990976542e-07, 'epoch': 1.75} {'loss': 0.2273, 'learning_rate': 8.200829453191584e-07, 'epoch': 1.75} {'loss': 0.3851, 'learning_rate': 8.1994970190304e-07, 'epoch': 1.75} {'loss': 0.364, 'learning_rate': 8.198164688494559e-07, 'epoch': 1.75} {'loss': 0.2328, 'learning_rate': 8.196832461585502e-07, 'epoch': 1.75} {'loss': 0.3118, 'learning_rate': 8.195500338304785e-07, 'epoch': 1.75} {'loss': 0.3876, 'learning_rate': 8.194168318653884e-07, 'epoch': 1.75} {'loss': 0.3745, 'learning_rate': 8.192836402634307e-07, 'epoch': 1.75} {'loss': 0.3085, 'learning_rate': 8.191504590247557e-07, 'epoch': 1.75} {'loss': 0.3702, 'learning_rate': 8.190172881495151e-07, 'epoch': 1.75} {'loss': 0.3844, 'learning_rate': 8.188841276378567e-07, 'epoch': 1.75} {'loss': 0.2904, 'learning_rate': 8.187509774899349e-07, 'epoch': 1.75} {'loss': 0.4638, 'learning_rate': 8.186178377058962e-07, 'epoch': 1.75} {'loss': 0.2902, 'learning_rate': 8.184847082858904e-07, 'epoch': 1.75} {'loss': 0.3731, 'learning_rate': 8.183515892300709e-07, 'epoch': 1.75} {'loss': 0.2806, 'learning_rate': 8.182184805385851e-07, 'epoch': 1.75} {'loss': 0.2976, 'learning_rate': 8.180853822115864e-07, 'epoch': 1.75} {'loss': 0.2144, 'learning_rate': 8.179522942492224e-07, 'epoch': 1.75} {'loss': 0.267, 'learning_rate': 8.178192166516452e-07, 'epoch': 1.75} {'loss': 0.3278, 'learning_rate': 8.176861494190013e-07, 'epoch': 1.75} {'loss': 0.2699, 'learning_rate': 8.175530925514463e-07, 'epoch': 1.75} {'loss': 0.3087, 'learning_rate': 8.174200460491266e-07, 'epoch': 1.75} {'loss': 0.3396, 'learning_rate': 8.172870099121943e-07, 'epoch': 1.75} {'loss': 0.3605, 'learning_rate': 8.171539841407971e-07, 'epoch': 1.75} {'loss': 0.4101, 'learning_rate': 8.170209687350894e-07, 'epoch': 1.75} {'loss': 0.3073, 'learning_rate': 8.168879636952165e-07, 'epoch': 1.75} {'loss': 0.2814, 'learning_rate': 8.167549690213328e-07, 'epoch': 1.75} {'loss': 0.1864, 'learning_rate': 8.166219847135859e-07, 'epoch': 1.75} {'loss': 0.4387, 'learning_rate': 8.164890107721257e-07, 'epoch': 1.75} {'loss': 0.2083, 'learning_rate': 8.163560471971044e-07, 'epoch': 1.75} {'loss': 0.3663, 'learning_rate': 8.162230939886684e-07, 'epoch': 1.75} {'loss': 0.3356, 'learning_rate': 8.160901511469721e-07, 'epoch': 1.75} {'loss': 0.3761, 'learning_rate': 8.159572186721621e-07, 'epoch': 1.75} {'loss': 0.2475, 'learning_rate': 8.158242965643926e-07, 'epoch': 1.75} {'loss': 0.2562, 'learning_rate': 8.156913848238079e-07, 'epoch': 1.75} {'loss': 0.222, 'learning_rate': 8.155584834505636e-07, 'epoch': 1.75} {'loss': 0.2292, 'learning_rate': 8.154255924448051e-07, 'epoch': 1.75} {'loss': 0.3489, 'learning_rate': 8.152927118066866e-07, 'epoch': 1.75} {'loss': 0.4792, 'learning_rate': 8.151598415363549e-07, 'epoch': 1.75} {'loss': 0.465, 'learning_rate': 8.150269816339618e-07, 'epoch': 1.75} {'loss': 0.4228, 'learning_rate': 8.148941320996573e-07, 'epoch': 1.75} {'loss': 0.4687, 'learning_rate': 8.147612929335891e-07, 'epoch': 1.75} {'loss': 0.3377, 'learning_rate': 8.146284641359104e-07, 'epoch': 1.75} {'loss': 0.3362, 'learning_rate': 8.144956457067677e-07, 'epoch': 1.75} {'loss': 0.2466, 'learning_rate': 8.143628376463142e-07, 'epoch': 1.75} {'loss': 0.3395, 'learning_rate': 8.142300399546965e-07, 'epoch': 1.75} {'loss': 0.3231, 'learning_rate': 8.140972526320679e-07, 'epoch': 1.75} {'loss': 0.2267, 'learning_rate': 8.139644756785758e-07, 'epoch': 1.75} {'loss': 0.2852, 'learning_rate': 8.138317090943726e-07, 'epoch': 1.75} {'loss': 0.2754, 'learning_rate': 8.136989528796035e-07, 'epoch': 1.75} {'loss': 0.28, 'learning_rate': 8.135662070344253e-07, 'epoch': 1.75} {'loss': 0.2457, 'learning_rate': 8.134334715589809e-07, 'epoch': 1.75} {'loss': 0.3938, 'learning_rate': 8.133007464534249e-07, 'epoch': 1.75} {'loss': 0.4245, 'learning_rate': 8.131680317179058e-07, 'epoch': 1.75} {'loss': 0.2829, 'learning_rate': 8.130353273525716e-07, 'epoch': 1.75} {'loss': 0.2908, 'learning_rate': 8.12902633357574e-07, 'epoch': 1.75} {'loss': 0.2706, 'learning_rate': 8.127699497330621e-07, 'epoch': 1.75} {'loss': 0.2754, 'learning_rate': 8.126372764791867e-07, 'epoch': 1.75} {'loss': 0.2758, 'learning_rate': 8.125046135960957e-07, 'epoch': 1.75} {'loss': 0.3111, 'learning_rate': 8.123719610839409e-07, 'epoch': 1.75} {'loss': 0.3061, 'learning_rate': 8.12239318942869e-07, 'epoch': 1.75} {'loss': 0.3085, 'learning_rate': 8.121066871730344e-07, 'epoch': 1.75} {'loss': 0.3398, 'learning_rate': 8.119740657745823e-07, 'epoch': 1.75} {'loss': 0.321, 'learning_rate': 8.118414547476661e-07, 'epoch': 1.75} {'loss': 0.3622, 'learning_rate': 8.117088540924323e-07, 'epoch': 1.75} {'loss': 0.3432, 'learning_rate': 8.11576263809033e-07, 'epoch': 1.75} {'loss': 0.2468, 'learning_rate': 8.114436838976169e-07, 'epoch': 1.75} {'loss': 0.3523, 'learning_rate': 8.113111143583318e-07, 'epoch': 1.75} {'loss': 0.3331, 'learning_rate': 8.11178555191331e-07, 'epoch': 1.75} {'loss': 0.3418, 'learning_rate': 8.110460063967607e-07, 'epoch': 1.75} {'loss': 0.2898, 'learning_rate': 8.109134679747743e-07, 'epoch': 1.75} {'loss': 0.4187, 'learning_rate': 8.107809399255162e-07, 'epoch': 1.75} {'loss': 0.1971, 'learning_rate': 8.106484222491417e-07, 'epoch': 1.75} {'loss': 0.35, 'learning_rate': 8.105159149457964e-07, 'epoch': 1.75} {'loss': 0.317, 'learning_rate': 8.103834180156323e-07, 'epoch': 1.75} {'loss': 0.325, 'learning_rate': 8.102509314587958e-07, 'epoch': 1.75} {'loss': 0.3018, 'learning_rate': 8.101184552754404e-07, 'epoch': 1.75} {'loss': 0.2512, 'learning_rate': 8.099859894657114e-07, 'epoch': 1.75} {'loss': 0.4978, 'learning_rate': 8.098535340297631e-07, 'epoch': 1.75} {'loss': 0.205, 'learning_rate': 8.09721088967741e-07, 'epoch': 1.75} {'loss': 0.23, 'learning_rate': 8.095886542797959e-07, 'epoch': 1.75} {'loss': 0.1922, 'learning_rate': 8.094562299660802e-07, 'epoch': 1.75} {'loss': 0.2817, 'learning_rate': 8.09323816026738e-07, 'epoch': 1.75} {'loss': 0.3518, 'learning_rate': 8.091914124619238e-07, 'epoch': 1.75} {'loss': 0.2487, 'learning_rate': 8.090590192717818e-07, 'epoch': 1.75} {'loss': 0.2155, 'learning_rate': 8.089266364564674e-07, 'epoch': 1.75} {'loss': 0.354, 'learning_rate': 8.087942640161272e-07, 'epoch': 1.75} {'loss': 0.371, 'learning_rate': 8.086619019509078e-07, 'epoch': 1.75} {'loss': 0.2703, 'learning_rate': 8.085295502609636e-07, 'epoch': 1.75} {'loss': 0.1696, 'learning_rate': 8.083972089464398e-07, 'epoch': 1.75} {'loss': 0.357, 'learning_rate': 8.082648780074898e-07, 'epoch': 1.75} {'loss': 0.3851, 'learning_rate': 8.081325574442589e-07, 'epoch': 1.75} {'loss': 0.3305, 'learning_rate': 8.080002472569004e-07, 'epoch': 1.75} {'loss': 0.3704, 'learning_rate': 8.078679474455586e-07, 'epoch': 1.75} {'loss': 0.3261, 'learning_rate': 8.07735658010389e-07, 'epoch': 1.75} {'loss': 0.2843, 'learning_rate': 8.076033789515358e-07, 'epoch': 1.75} {'loss': 0.2805, 'learning_rate': 8.074711102691524e-07, 'epoch': 1.75} {'loss': 0.2208, 'learning_rate': 8.07338851963384e-07, 'epoch': 1.75} {'loss': 0.3074, 'learning_rate': 8.07206604034384e-07, 'epoch': 1.75} {'loss': 0.3335, 'learning_rate': 8.070743664822989e-07, 'epoch': 1.75} {'loss': 0.3371, 'learning_rate': 8.069421393072785e-07, 'epoch': 1.75} {'loss': 0.2894, 'learning_rate': 8.068099225094728e-07, 'epoch': 1.75} {'loss': 0.3769, 'learning_rate': 8.066777160890293e-07, 'epoch': 1.75} {'loss': 0.3688, 'learning_rate': 8.065455200460992e-07, 'epoch': 1.75} {'loss': 0.3904, 'learning_rate': 8.0641333438083e-07, 'epoch': 1.75} {'loss': 0.2415, 'learning_rate': 8.062811590933739e-07, 'epoch': 1.75} {'loss': 0.3495, 'learning_rate': 8.061489941838763e-07, 'epoch': 1.75} {'loss': 0.3127, 'learning_rate': 8.060168396524893e-07, 'epoch': 1.75} {'loss': 0.3054, 'learning_rate': 8.058846954993604e-07, 'epoch': 1.75} {'loss': 0.3277, 'learning_rate': 8.057525617246398e-07, 'epoch': 1.75} {'loss': 0.3454, 'learning_rate': 8.056204383284749e-07, 'epoch': 1.75} {'loss': 0.2419, 'learning_rate': 8.05488325311018e-07, 'epoch': 1.75} {'loss': 0.1789, 'learning_rate': 8.053562226724165e-07, 'epoch': 1.75} {'loss': 0.4056, 'learning_rate': 8.052241304128172e-07, 'epoch': 1.75} {'loss': 0.266, 'learning_rate': 8.050920485323744e-07, 'epoch': 1.75} {'loss': 0.2491, 'learning_rate': 8.049599770312311e-07, 'epoch': 1.75} {'loss': 0.1973, 'learning_rate': 8.048279159095418e-07, 'epoch': 1.75} {'loss': 0.3893, 'learning_rate': 8.046958651674508e-07, 'epoch': 1.75} {'loss': 0.2, 'learning_rate': 8.045638248051124e-07, 'epoch': 1.75} {'loss': 0.182, 'learning_rate': 8.044317948226699e-07, 'epoch': 1.75} {'loss': 0.4625, 'learning_rate': 8.042997752202775e-07, 'epoch': 1.75} {'loss': 0.3256, 'learning_rate': 8.041677659980807e-07, 'epoch': 1.75} {'loss': 0.29, 'learning_rate': 8.040357671562315e-07, 'epoch': 1.75} {'loss': 0.2638, 'learning_rate': 8.039037786948755e-07, 'epoch': 1.75} {'loss': 0.2241, 'learning_rate': 8.037718006141649e-07, 'epoch': 1.75} {'loss': 0.1723, 'learning_rate': 8.03639832914247e-07, 'epoch': 1.75} {'loss': 0.3755, 'learning_rate': 8.035078755952697e-07, 'epoch': 1.75} {'loss': 0.2467, 'learning_rate': 8.033759286573839e-07, 'epoch': 1.75} {'loss': 0.3373, 'learning_rate': 8.032439921007373e-07, 'epoch': 1.75} {'loss': 0.3579, 'learning_rate': 8.031120659254809e-07, 'epoch': 1.75} {'loss': 0.335, 'learning_rate': 8.029801501317602e-07, 'epoch': 1.75} {'loss': 0.4066, 'learning_rate': 8.028482447197272e-07, 'epoch': 1.75} {'loss': 0.3006, 'learning_rate': 8.027163496895285e-07, 'epoch': 1.75} {'loss': 0.4255, 'learning_rate': 8.025844650413162e-07, 'epoch': 1.75} {'loss': 0.3859, 'learning_rate': 8.024525907752345e-07, 'epoch': 1.75} {'loss': 0.2536, 'learning_rate': 8.02320726891438e-07, 'epoch': 1.75} {'loss': 0.3145, 'learning_rate': 8.021888733900696e-07, 'epoch': 1.75} {'loss': 0.2932, 'learning_rate': 8.020570302712816e-07, 'epoch': 1.75} {'loss': 0.3359, 'learning_rate': 8.019251975352238e-07, 'epoch': 1.75} {'loss': 0.4305, 'learning_rate': 8.017933751820406e-07, 'epoch': 1.75} {'loss': 0.2447, 'learning_rate': 8.016615632118862e-07, 'epoch': 1.75} {'loss': 0.2528, 'learning_rate': 8.01529761624904e-07, 'epoch': 1.75} {'loss': 0.1973, 'learning_rate': 8.013979704212482e-07, 'epoch': 1.75} {'loss': 0.2324, 'learning_rate': 8.012661896010632e-07, 'epoch': 1.75} {'loss': 0.3161, 'learning_rate': 8.01134419164501e-07, 'epoch': 1.75} {'loss': 0.3612, 'learning_rate': 8.010026591117059e-07, 'epoch': 1.75} {'loss': 0.3803, 'learning_rate': 8.008709094428324e-07, 'epoch': 1.75} {'loss': 0.4641, 'learning_rate': 8.007391701580247e-07, 'epoch': 1.75} {'loss': 0.3077, 'learning_rate': 8.006074412574349e-07, 'epoch': 1.75} {'loss': 0.3769, 'learning_rate': 8.004757227412074e-07, 'epoch': 1.75} {'loss': 0.2692, 'learning_rate': 8.003440146094953e-07, 'epoch': 1.75} {'loss': 0.2606, 'learning_rate': 8.002123168624465e-07, 'epoch': 1.75} {'loss': 0.1915, 'learning_rate': 8.000806295002061e-07, 'epoch': 1.75} {'loss': 0.2705, 'learning_rate': 7.999489525229265e-07, 'epoch': 1.75} {'loss': 0.2647, 'learning_rate': 7.998172859307541e-07, 'epoch': 1.75} {'loss': 0.4047, 'learning_rate': 7.996856297238397e-07, 'epoch': 1.75} {'loss': 0.3398, 'learning_rate': 7.995539839023291e-07, 'epoch': 1.75} {'loss': 0.2707, 'learning_rate': 7.994223484663755e-07, 'epoch': 1.75} {'loss': 0.1856, 'learning_rate': 7.992907234161206e-07, 'epoch': 1.75} {'loss': 0.2733, 'learning_rate': 7.991591087517204e-07, 'epoch': 1.75} {'loss': 0.2592, 'learning_rate': 7.990275044733176e-07, 'epoch': 1.75} {'loss': 0.184, 'learning_rate': 7.988959105810646e-07, 'epoch': 1.75} {'loss': 0.2791, 'learning_rate': 7.987643270751067e-07, 'epoch': 1.75} {'loss': 0.2519, 'learning_rate': 7.986327539555961e-07, 'epoch': 1.75} {'loss': 0.3012, 'learning_rate': 7.985011912226792e-07, 'epoch': 1.75} {'loss': 0.3543, 'learning_rate': 7.983696388765027e-07, 'epoch': 1.75} {'loss': 0.2351, 'learning_rate': 7.982380969172199e-07, 'epoch': 1.75} {'loss': 0.3591, 'learning_rate': 7.981065653449738e-07, 'epoch': 1.75} {'loss': 0.37, 'learning_rate': 7.979750441599176e-07, 'epoch': 1.75} {'loss': 0.216, 'learning_rate': 7.978435333621959e-07, 'epoch': 1.75} {'loss': 0.2972, 'learning_rate': 7.977120329519606e-07, 'epoch': 1.75} {'loss': 0.2516, 'learning_rate': 7.975805429293571e-07, 'epoch': 1.75} {'loss': 0.4652, 'learning_rate': 7.974490632945376e-07, 'epoch': 1.75} {'loss': 0.3718, 'learning_rate': 7.973175940476452e-07, 'epoch': 1.75} {'loss': 0.3123, 'learning_rate': 7.971861351888333e-07, 'epoch': 1.75} {'loss': 0.525, 'learning_rate': 7.970546867182471e-07, 'epoch': 1.75} {'loss': 0.321, 'learning_rate': 7.969232486360367e-07, 'epoch': 1.75} {'loss': 0.3936, 'learning_rate': 7.967918209423508e-07, 'epoch': 1.75} {'loss': 0.3244, 'learning_rate': 7.966604036373338e-07, 'epoch': 1.75} {'loss': 0.1562, 'learning_rate': 7.965289967211398e-07, 'epoch': 1.75} {'loss': 0.4122, 'learning_rate': 7.963976001939134e-07, 'epoch': 1.75} {'loss': 0.3467, 'learning_rate': 7.962662140558053e-07, 'epoch': 1.75} {'loss': 0.3381, 'learning_rate': 7.961348383069612e-07, 'epoch': 1.75} {'loss': 0.3229, 'learning_rate': 7.960034729475319e-07, 'epoch': 1.75} {'loss': 0.2763, 'learning_rate': 7.958721179776619e-07, 'epoch': 1.75} {'loss': 0.2731, 'learning_rate': 7.957407733975053e-07, 'epoch': 1.75} {'loss': 0.254, 'learning_rate': 7.956094392072055e-07, 'epoch': 1.75} {'loss': 0.2574, 'learning_rate': 7.954781154069125e-07, 'epoch': 1.75} {'loss': 0.4457, 'learning_rate': 7.953468019967747e-07, 'epoch': 1.75} {'loss': 0.2827, 'learning_rate': 7.952154989769389e-07, 'epoch': 1.75} {'loss': 0.3768, 'learning_rate': 7.950842063475562e-07, 'epoch': 1.75} {'loss': 0.3981, 'learning_rate': 7.949529241087706e-07, 'epoch': 1.75} {'loss': 0.375, 'learning_rate': 7.948216522607355e-07, 'epoch': 1.75} {'loss': 0.2702, 'learning_rate': 7.946903908035941e-07, 'epoch': 1.75} {'loss': 0.3766, 'learning_rate': 7.945591397374986e-07, 'epoch': 1.75} {'loss': 0.2486, 'learning_rate': 7.944278990625931e-07, 'epoch': 1.75} {'loss': 0.2401, 'learning_rate': 7.942966687790299e-07, 'epoch': 1.75} {'loss': 0.2643, 'learning_rate': 7.941654488869533e-07, 'epoch': 1.75} {'loss': 0.4389, 'learning_rate': 7.940342393865163e-07, 'epoch': 1.75} {'loss': 0.5025, 'learning_rate': 7.939030402778624e-07, 'epoch': 1.75} {'loss': 0.3207, 'learning_rate': 7.937718515611404e-07, 'epoch': 1.75} {'loss': 0.3578, 'learning_rate': 7.93640673236501e-07, 'epoch': 1.75} {'loss': 0.2719, 'learning_rate': 7.935095053040898e-07, 'epoch': 1.75} {'loss': 0.4239, 'learning_rate': 7.933783477640555e-07, 'epoch': 1.75} {'loss': 0.2985, 'learning_rate': 7.93247200616546e-07, 'epoch': 1.75} {'loss': 0.2595, 'learning_rate': 7.931160638617108e-07, 'epoch': 1.75} {'loss': 0.3255, 'learning_rate': 7.929849374996956e-07, 'epoch': 1.75} {'loss': 0.263, 'learning_rate': 7.928538215306514e-07, 'epoch': 1.75} {'loss': 0.2775, 'learning_rate': 7.927227159547224e-07, 'epoch': 1.75} {'loss': 0.4021, 'learning_rate': 7.925916207720597e-07, 'epoch': 1.75} {'loss': 0.2635, 'learning_rate': 7.924605359828097e-07, 'epoch': 1.75} {'loss': 0.3583, 'learning_rate': 7.923294615871214e-07, 'epoch': 1.75} {'loss': 0.3755, 'learning_rate': 7.921983975851433e-07, 'epoch': 1.75} {'loss': 0.3354, 'learning_rate': 7.920673439770199e-07, 'epoch': 1.75} {'loss': 0.2597, 'learning_rate': 7.919363007629033e-07, 'epoch': 1.75} {'loss': 0.2988, 'learning_rate': 7.918052679429378e-07, 'epoch': 1.75} {'loss': 0.2973, 'learning_rate': 7.916742455172744e-07, 'epoch': 1.75} {'loss': 0.3078, 'learning_rate': 7.915432334860584e-07, 'epoch': 1.75} {'loss': 0.2543, 'learning_rate': 7.91412231849441e-07, 'epoch': 1.75} {'loss': 0.4393, 'learning_rate': 7.912812406075665e-07, 'epoch': 1.75} {'loss': 0.2686, 'learning_rate': 7.911502597605857e-07, 'epoch': 1.75} {'loss': 0.4778, 'learning_rate': 7.910192893086443e-07, 'epoch': 1.75} {'loss': 0.4385, 'learning_rate': 7.908883292518921e-07, 'epoch': 1.75} {'loss': 0.2675, 'learning_rate': 7.907573795904732e-07, 'epoch': 1.75} {'loss': 0.2375, 'learning_rate': 7.906264403245412e-07, 'epoch': 1.75} {'loss': 0.3403, 'learning_rate': 7.90495511454239e-07, 'epoch': 1.75} {'loss': 0.3769, 'learning_rate': 7.903645929797154e-07, 'epoch': 1.75} {'loss': 0.2351, 'learning_rate': 7.902336849011205e-07, 'epoch': 1.75} {'loss': 0.3225, 'learning_rate': 7.901027872185995e-07, 'epoch': 1.75} {'loss': 0.2359, 'learning_rate': 7.899718999323014e-07, 'epoch': 1.75} {'loss': 0.2929, 'learning_rate': 7.898410230423725e-07, 'epoch': 1.75} {'loss': 0.2811, 'learning_rate': 7.89710156548964e-07, 'epoch': 1.75} {'loss': 0.3111, 'learning_rate': 7.895793004522189e-07, 'epoch': 1.75} {'loss': 0.1813, 'learning_rate': 7.894484547522896e-07, 'epoch': 1.75} {'loss': 0.3707, 'learning_rate': 7.893176194493191e-07, 'epoch': 1.75} {'loss': 0.3815, 'learning_rate': 7.891867945434595e-07, 'epoch': 1.75} {'loss': 0.1974, 'learning_rate': 7.890559800348552e-07, 'epoch': 1.75} {'loss': 0.151, 'learning_rate': 7.88925175923656e-07, 'epoch': 1.75} {'loss': 0.296, 'learning_rate': 7.887943822100097e-07, 'epoch': 1.75} {'loss': 0.3462, 'learning_rate': 7.886635988940605e-07, 'epoch': 1.75} {'loss': 0.2359, 'learning_rate': 7.885328259759606e-07, 'epoch': 1.75} {'loss': 0.2453, 'learning_rate': 7.884020634558542e-07, 'epoch': 1.75} {'loss': 0.2941, 'learning_rate': 7.882713113338913e-07, 'epoch': 1.75} {'loss': 0.2765, 'learning_rate': 7.881405696102162e-07, 'epoch': 1.75} {'loss': 0.2227, 'learning_rate': 7.88009838284981e-07, 'epoch': 1.75} {'loss': 0.4048, 'learning_rate': 7.8787911735833e-07, 'epoch': 1.75} {'loss': 0.2966, 'learning_rate': 7.87748406830412e-07, 'epoch': 1.75} {'loss': 0.2924, 'learning_rate': 7.876177067013735e-07, 'epoch': 1.75} {'loss': 0.1934, 'learning_rate': 7.874870169713645e-07, 'epoch': 1.75} {'loss': 0.3236, 'learning_rate': 7.873563376405292e-07, 'epoch': 1.75} {'loss': 0.4043, 'learning_rate': 7.872256687090174e-07, 'epoch': 1.75} {'loss': 0.2467, 'learning_rate': 7.87095010176977e-07, 'epoch': 1.75} {'loss': 0.2618, 'learning_rate': 7.869643620445522e-07, 'epoch': 1.75} {'loss': 0.3728, 'learning_rate': 7.86833724311894e-07, 'epoch': 1.75} {'loss': 0.3595, 'learning_rate': 7.867030969791478e-07, 'epoch': 1.75} {'loss': 0.2864, 'learning_rate': 7.865724800464624e-07, 'epoch': 1.75} {'loss': 0.2874, 'learning_rate': 7.864418735139845e-07, 'epoch': 1.75} {'loss': 0.3923, 'learning_rate': 7.863112773818615e-07, 'epoch': 1.75} {'loss': 0.4677, 'learning_rate': 7.861806916502413e-07, 'epoch': 1.75} {'loss': 0.3739, 'learning_rate': 7.860501163192713e-07, 'epoch': 1.75} {'loss': 0.2627, 'learning_rate': 7.859195513890971e-07, 'epoch': 1.75} {'loss': 0.2399, 'learning_rate': 7.857889968598698e-07, 'epoch': 1.75} {'loss': 0.1968, 'learning_rate': 7.856584527317324e-07, 'epoch': 1.75} {'loss': 0.2728, 'learning_rate': 7.855279190048359e-07, 'epoch': 1.75} {'loss': 0.3252, 'learning_rate': 7.85397395679327e-07, 'epoch': 1.75} {'loss': 0.2932, 'learning_rate': 7.852668827553501e-07, 'epoch': 1.75} {'loss': 0.4634, 'learning_rate': 7.851363802330569e-07, 'epoch': 1.75} {'loss': 0.3029, 'learning_rate': 7.850058881125899e-07, 'epoch': 1.75} {'loss': 0.3125, 'learning_rate': 7.848754063941011e-07, 'epoch': 1.75} {'loss': 0.2899, 'learning_rate': 7.847449350777336e-07, 'epoch': 1.75} {'loss': 0.2972, 'learning_rate': 7.846144741636386e-07, 'epoch': 1.75} {'loss': 0.19, 'learning_rate': 7.844840236519591e-07, 'epoch': 1.75} {'loss': 0.3588, 'learning_rate': 7.843535835428472e-07, 'epoch': 1.75} {'loss': 0.264, 'learning_rate': 7.842231538364453e-07, 'epoch': 1.75} {'loss': 0.1903, 'learning_rate': 7.840927345329052e-07, 'epoch': 1.75} {'loss': 0.3473, 'learning_rate': 7.839623256323703e-07, 'epoch': 1.75} {'loss': 0.2075, 'learning_rate': 7.838319271349914e-07, 'epoch': 1.75} {'loss': 0.2323, 'learning_rate': 7.83701539040913e-07, 'epoch': 1.75} {'loss': 0.2626, 'learning_rate': 7.835711613502805e-07, 'epoch': 1.75} {'loss': 0.2852, 'learning_rate': 7.83440794063246e-07, 'epoch': 1.75} {'loss': 0.3849, 'learning_rate': 7.833104371799527e-07, 'epoch': 1.75} {'loss': 0.4563, 'learning_rate': 7.831800907005516e-07, 'epoch': 1.75} {'loss': 0.3217, 'learning_rate': 7.830497546251858e-07, 'epoch': 1.75} {'loss': 0.2008, 'learning_rate': 7.829194289540054e-07, 'epoch': 1.75} {'loss': 0.2227, 'learning_rate': 7.827891136871557e-07, 'epoch': 1.75} {'loss': 0.3229, 'learning_rate': 7.826588088247833e-07, 'epoch': 1.75} {'loss': 0.241, 'learning_rate': 7.82528514367038e-07, 'epoch': 1.75} {'loss': 0.43, 'learning_rate': 7.823982303140642e-07, 'epoch': 1.75} {'loss': 0.2232, 'learning_rate': 7.822679566660107e-07, 'epoch': 1.75} {'loss': 0.3201, 'learning_rate': 7.821376934230229e-07, 'epoch': 1.75} {'loss': 0.3291, 'learning_rate': 7.820074405852496e-07, 'epoch': 1.75} {'loss': 0.2225, 'learning_rate': 7.818771981528361e-07, 'epoch': 1.75} {'loss': 0.3695, 'learning_rate': 7.817469661259313e-07, 'epoch': 1.75} {'loss': 0.3464, 'learning_rate': 7.816167445046807e-07, 'epoch': 1.75} {'loss': 0.3701, 'learning_rate': 7.81486533289233e-07, 'epoch': 1.75} {'loss': 0.4063, 'learning_rate': 7.813563324797324e-07, 'epoch': 1.75} {'loss': 0.3727, 'learning_rate': 7.81226142076329e-07, 'epoch': 1.75} {'loss': 0.5722, 'learning_rate': 7.81095962079168e-07, 'epoch': 1.75} {'loss': 0.3438, 'learning_rate': 7.809657924883951e-07, 'epoch': 1.75} {'loss': 0.1958, 'learning_rate': 7.8083563330416e-07, 'epoch': 1.75} {'loss': 0.2196, 'learning_rate': 7.807054845266071e-07, 'epoch': 1.75} {'loss': 0.3095, 'learning_rate': 7.805753461558863e-07, 'epoch': 1.75} {'loss': 0.1995, 'learning_rate': 7.804452181921418e-07, 'epoch': 1.75} {'loss': 0.2415, 'learning_rate': 7.803151006355225e-07, 'epoch': 1.75} {'loss': 0.2505, 'learning_rate': 7.801849934861717e-07, 'epoch': 1.75} {'loss': 0.2422, 'learning_rate': 7.800548967442412e-07, 'epoch': 1.75} {'loss': 0.2417, 'learning_rate': 7.799248104098744e-07, 'epoch': 1.75} {'loss': 0.2096, 'learning_rate': 7.797947344832202e-07, 'epoch': 1.75} {'loss': 0.2515, 'learning_rate': 7.796646689644227e-07, 'epoch': 1.75} {'loss': 0.2634, 'learning_rate': 7.79534613853633e-07, 'epoch': 1.75} {'loss': 0.3765, 'learning_rate': 7.794045691509933e-07, 'epoch': 1.75} {'loss': 0.2659, 'learning_rate': 7.792745348566533e-07, 'epoch': 1.75} {'loss': 0.3781, 'learning_rate': 7.791445109707596e-07, 'epoch': 1.75} {'loss': 0.3464, 'learning_rate': 7.790144974934566e-07, 'epoch': 1.75} {'loss': 0.2743, 'learning_rate': 7.788844944248941e-07, 'epoch': 1.75} {'loss': 0.2748, 'learning_rate': 7.787545017652165e-07, 'epoch': 1.75} {'loss': 0.2599, 'learning_rate': 7.786245195145736e-07, 'epoch': 1.75} {'loss': 0.3238, 'learning_rate': 7.784945476731076e-07, 'epoch': 1.75} {'loss': 0.2227, 'learning_rate': 7.783645862409694e-07, 'epoch': 1.76} {'loss': 0.3257, 'learning_rate': 7.782346352183023e-07, 'epoch': 1.76} {'loss': 0.2165, 'learning_rate': 7.781046946052572e-07, 'epoch': 1.76} {'loss': 0.3211, 'learning_rate': 7.779747644019753e-07, 'epoch': 1.76} {'loss': 0.2116, 'learning_rate': 7.778448446086085e-07, 'epoch': 1.76} {'loss': 0.3538, 'learning_rate': 7.777149352252999e-07, 'epoch': 1.76} {'loss': 0.4071, 'learning_rate': 7.775850362521986e-07, 'epoch': 1.76} {'loss': 0.3156, 'learning_rate': 7.774551476894509e-07, 'epoch': 1.76} {'loss': 0.4837, 'learning_rate': 7.773252695372002e-07, 'epoch': 1.76} {'loss': 0.277, 'learning_rate': 7.771954017955974e-07, 'epoch': 1.76} {'loss': 0.2218, 'learning_rate': 7.770655444647857e-07, 'epoch': 1.76} {'loss': 0.5606, 'learning_rate': 7.769356975449138e-07, 'epoch': 1.76} {'loss': 0.3389, 'learning_rate': 7.768058610361273e-07, 'epoch': 1.76} {'loss': 0.2242, 'learning_rate': 7.766760349385738e-07, 'epoch': 1.76} {'loss': 0.307, 'learning_rate': 7.765462192523976e-07, 'epoch': 1.76} {'loss': 0.2853, 'learning_rate': 7.764164139777497e-07, 'epoch': 1.76} {'loss': 0.3192, 'learning_rate': 7.762866191147711e-07, 'epoch': 1.76} {'loss': 0.2547, 'learning_rate': 7.761568346636117e-07, 'epoch': 1.76} {'loss': 0.3634, 'learning_rate': 7.760270606244169e-07, 'epoch': 1.76} {'loss': 0.3531, 'learning_rate': 7.758972969973344e-07, 'epoch': 1.76} {'loss': 0.3248, 'learning_rate': 7.757675437825107e-07, 'epoch': 1.76} {'loss': 0.3071, 'learning_rate': 7.756378009800892e-07, 'epoch': 1.76} {'loss': 0.2776, 'learning_rate': 7.755080685902206e-07, 'epoch': 1.76} {'loss': 0.3512, 'learning_rate': 7.753783466130471e-07, 'epoch': 1.76} {'loss': 0.3023, 'learning_rate': 7.752486350487187e-07, 'epoch': 1.76} {'loss': 0.2982, 'learning_rate': 7.751189338973797e-07, 'epoch': 1.76} {'loss': 0.2442, 'learning_rate': 7.749892431591776e-07, 'epoch': 1.76} {'loss': 0.291, 'learning_rate': 7.748595628342581e-07, 'epoch': 1.76} {'loss': 0.3252, 'learning_rate': 7.747298929227687e-07, 'epoch': 1.76} {'loss': 0.2582, 'learning_rate': 7.746002334248537e-07, 'epoch': 1.76} {'loss': 0.2874, 'learning_rate': 7.744705843406631e-07, 'epoch': 1.76} {'loss': 0.2744, 'learning_rate': 7.743409456703377e-07, 'epoch': 1.76} {'loss': 0.3869, 'learning_rate': 7.742113174140298e-07, 'epoch': 1.76} {'loss': 0.3049, 'learning_rate': 7.740816995718825e-07, 'epoch': 1.76} {'loss': 0.3879, 'learning_rate': 7.739520921440413e-07, 'epoch': 1.76} {'loss': 0.3141, 'learning_rate': 7.73822495130655e-07, 'epoch': 1.76} {'loss': 0.2722, 'learning_rate': 7.736929085318667e-07, 'epoch': 1.76} {'loss': 0.2445, 'learning_rate': 7.735633323478276e-07, 'epoch': 1.76} {'loss': 0.1826, 'learning_rate': 7.734337665786784e-07, 'epoch': 1.76} {'loss': 0.439, 'learning_rate': 7.733042112245692e-07, 'epoch': 1.76} {'loss': 0.3945, 'learning_rate': 7.731746662856443e-07, 'epoch': 1.76} {'loss': 0.3666, 'learning_rate': 7.730451317620513e-07, 'epoch': 1.76} {'loss': 0.2857, 'learning_rate': 7.729156076539345e-07, 'epoch': 1.76} {'loss': 0.2087, 'learning_rate': 7.72786093961444e-07, 'epoch': 1.76} {'loss': 0.2435, 'learning_rate': 7.726565906847206e-07, 'epoch': 1.76} {'loss': 0.3988, 'learning_rate': 7.725270978239152e-07, 'epoch': 1.76} {'loss': 0.2179, 'learning_rate': 7.723976153791723e-07, 'epoch': 1.76} {'loss': 0.2899, 'learning_rate': 7.722681433506362e-07, 'epoch': 1.76} {'loss': 0.4183, 'learning_rate': 7.721386817384557e-07, 'epoch': 1.76} {'loss': 0.4092, 'learning_rate': 7.72009230542774e-07, 'epoch': 1.76} {'loss': 0.3969, 'learning_rate': 7.71879789763742e-07, 'epoch': 1.76} {'loss': 0.3653, 'learning_rate': 7.717503594014996e-07, 'epoch': 1.76} {'loss': 0.3178, 'learning_rate': 7.716209394561991e-07, 'epoch': 1.76} {'loss': 0.2378, 'learning_rate': 7.714915299279824e-07, 'epoch': 1.76} {'loss': 0.339, 'learning_rate': 7.713621308169971e-07, 'epoch': 1.76} {'loss': 0.4224, 'learning_rate': 7.712327421233878e-07, 'epoch': 1.76} {'loss': 0.325, 'learning_rate': 7.711033638473042e-07, 'epoch': 1.76} {'loss': 0.3727, 'learning_rate': 7.709739959888884e-07, 'epoch': 1.76} {'loss': 0.3623, 'learning_rate': 7.708446385482893e-07, 'epoch': 1.76} {'loss': 0.2957, 'learning_rate': 7.707152915256488e-07, 'epoch': 1.76} {'loss': 0.2743, 'learning_rate': 7.705859549211169e-07, 'epoch': 1.76} {'loss': 0.2425, 'learning_rate': 7.704566287348402e-07, 'epoch': 1.76} {'loss': 0.4643, 'learning_rate': 7.703273129669609e-07, 'epoch': 1.76} {'loss': 0.3459, 'learning_rate': 7.701980076176285e-07, 'epoch': 1.76} {'loss': 0.1107, 'learning_rate': 7.700687126869855e-07, 'epoch': 1.76} {'loss': 0.2314, 'learning_rate': 7.699394281751816e-07, 'epoch': 1.76} {'loss': 0.2525, 'learning_rate': 7.69810154082361e-07, 'epoch': 1.76} {'loss': 0.2451, 'learning_rate': 7.696808904086683e-07, 'epoch': 1.76} {'loss': 0.281, 'learning_rate': 7.695516371542522e-07, 'epoch': 1.76} {'loss': 0.2633, 'learning_rate': 7.694223943192547e-07, 'epoch': 1.76} {'loss': 0.357, 'learning_rate': 7.692931619038269e-07, 'epoch': 1.76} {'loss': 0.5314, 'learning_rate': 7.691639399081097e-07, 'epoch': 1.76} {'loss': 0.1987, 'learning_rate': 7.690347283322519e-07, 'epoch': 1.76} {'loss': 0.2519, 'learning_rate': 7.689055271763979e-07, 'epoch': 1.76} {'loss': 0.3303, 'learning_rate': 7.687763364406952e-07, 'epoch': 1.76} {'loss': 0.3224, 'learning_rate': 7.686471561252873e-07, 'epoch': 1.76} {'loss': 0.313, 'learning_rate': 7.685179862303227e-07, 'epoch': 1.76} {'loss': 0.2448, 'learning_rate': 7.683888267559436e-07, 'epoch': 1.76} {'loss': 0.2627, 'learning_rate': 7.68259677702301e-07, 'epoch': 1.76} {'loss': 0.378, 'learning_rate': 7.681305390695371e-07, 'epoch': 1.76} {'loss': 0.2972, 'learning_rate': 7.680014108577971e-07, 'epoch': 1.76} {'loss': 0.2461, 'learning_rate': 7.678722930672289e-07, 'epoch': 1.76} {'loss': 0.2929, 'learning_rate': 7.677431856979756e-07, 'epoch': 1.76} {'loss': 0.3992, 'learning_rate': 7.67614088750187e-07, 'epoch': 1.76} {'loss': 0.344, 'learning_rate': 7.674850022240044e-07, 'epoch': 1.76} {'loss': 0.3091, 'learning_rate': 7.673559261195773e-07, 'epoch': 1.76} {'loss': 0.3318, 'learning_rate': 7.672268604370481e-07, 'epoch': 1.76} {'loss': 0.4002, 'learning_rate': 7.670978051765665e-07, 'epoch': 1.76} {'loss': 0.3459, 'learning_rate': 7.669687603382724e-07, 'epoch': 1.76} {'loss': 0.2427, 'learning_rate': 7.668397259223181e-07, 'epoch': 1.76} {'loss': 0.215, 'learning_rate': 7.667107019288434e-07, 'epoch': 1.76} {'loss': 0.3855, 'learning_rate': 7.665816883579991e-07, 'epoch': 1.76} {'loss': 0.3051, 'learning_rate': 7.664526852099275e-07, 'epoch': 1.76} {'loss': 0.3523, 'learning_rate': 7.663236924847728e-07, 'epoch': 1.76} {'loss': 0.2471, 'learning_rate': 7.661947101826849e-07, 'epoch': 1.76} {'loss': 0.4765, 'learning_rate': 7.660657383038061e-07, 'epoch': 1.76} {'loss': 0.394, 'learning_rate': 7.65936776848285e-07, 'epoch': 1.76} {'loss': 0.2831, 'learning_rate': 7.658078258162626e-07, 'epoch': 1.76} {'loss': 0.294, 'learning_rate': 7.6567888520789e-07, 'epoch': 1.76} {'loss': 0.1613, 'learning_rate': 7.65549955023307e-07, 'epoch': 1.76} {'loss': 0.484, 'learning_rate': 7.654210352626646e-07, 'epoch': 1.76} {'loss': 0.3826, 'learning_rate': 7.652921259261048e-07, 'epoch': 1.76} {'loss': 0.3439, 'learning_rate': 7.651632270137744e-07, 'epoch': 1.76} {'loss': 0.4893, 'learning_rate': 7.650343385258174e-07, 'epoch': 1.76} {'loss': 0.2148, 'learning_rate': 7.649054604623829e-07, 'epoch': 1.76} {'loss': 0.406, 'learning_rate': 7.647765928236129e-07, 'epoch': 1.76} {'loss': 0.338, 'learning_rate': 7.646477356096538e-07, 'epoch': 1.76} {'loss': 0.365, 'learning_rate': 7.645188888206512e-07, 'epoch': 1.76} {'loss': 0.3263, 'learning_rate': 7.643900524567505e-07, 'epoch': 1.76} {'loss': 0.3145, 'learning_rate': 7.642612265180971e-07, 'epoch': 1.76} {'loss': 0.2177, 'learning_rate': 7.641324110048365e-07, 'epoch': 1.76} {'loss': 0.2299, 'learning_rate': 7.640036059171152e-07, 'epoch': 1.76} {'loss': 0.2195, 'learning_rate': 7.638748112550753e-07, 'epoch': 1.76} {'loss': 0.1958, 'learning_rate': 7.637460270188668e-07, 'epoch': 1.76} {'loss': 0.2504, 'learning_rate': 7.636172532086306e-07, 'epoch': 1.76} {'loss': 0.3158, 'learning_rate': 7.634884898245165e-07, 'epoch': 1.76} {'loss': 0.1946, 'learning_rate': 7.633597368666645e-07, 'epoch': 1.76} {'loss': 0.461, 'learning_rate': 7.632309943352256e-07, 'epoch': 1.76} {'loss': 0.2721, 'learning_rate': 7.631022622303419e-07, 'epoch': 1.76} {'loss': 0.3045, 'learning_rate': 7.629735405521587e-07, 'epoch': 1.76} {'loss': 0.2496, 'learning_rate': 7.628448293008228e-07, 'epoch': 1.76} {'loss': 0.2441, 'learning_rate': 7.627161284764761e-07, 'epoch': 1.76} {'loss': 0.4132, 'learning_rate': 7.625874380792698e-07, 'epoch': 1.76} {'loss': 0.4441, 'learning_rate': 7.624587581093423e-07, 'epoch': 1.76} {'loss': 0.2768, 'learning_rate': 7.62330088566845e-07, 'epoch': 1.76} {'loss': 0.2738, 'learning_rate': 7.622014294519186e-07, 'epoch': 1.76} {'loss': 0.4855, 'learning_rate': 7.62072780764711e-07, 'epoch': 1.76} {'loss': 0.2613, 'learning_rate': 7.619441425053653e-07, 'epoch': 1.76} {'loss': 0.2638, 'learning_rate': 7.618155146740303e-07, 'epoch': 1.76} {'loss': 0.3136, 'learning_rate': 7.616868972708469e-07, 'epoch': 1.76} {'loss': 0.2719, 'learning_rate': 7.615582902959639e-07, 'epoch': 1.76} {'loss': 0.2551, 'learning_rate': 7.614296937495247e-07, 'epoch': 1.76} {'loss': 0.1955, 'learning_rate': 7.613011076316723e-07, 'epoch': 1.76} {'loss': 0.3652, 'learning_rate': 7.611725319425567e-07, 'epoch': 1.76} {'loss': 0.1829, 'learning_rate': 7.610439666823188e-07, 'epoch': 1.76} {'loss': 0.2847, 'learning_rate': 7.609154118511064e-07, 'epoch': 1.76} {'loss': 0.3691, 'learning_rate': 7.607868674490626e-07, 'epoch': 1.76} {'loss': 0.2952, 'learning_rate': 7.60658333476334e-07, 'epoch': 1.76} {'loss': 0.2616, 'learning_rate': 7.605298099330649e-07, 'epoch': 1.76} {'loss': 0.3691, 'learning_rate': 7.604012968194019e-07, 'epoch': 1.76} {'loss': 0.2891, 'learning_rate': 7.602727941354871e-07, 'epoch': 1.76} {'loss': 0.2879, 'learning_rate': 7.601443018814692e-07, 'epoch': 1.76} {'loss': 0.248, 'learning_rate': 7.600158200574892e-07, 'epoch': 1.76} {'loss': 0.2162, 'learning_rate': 7.598873486636959e-07, 'epoch': 1.76} {'loss': 0.1477, 'learning_rate': 7.597588877002315e-07, 'epoch': 1.76} {'loss': 0.2843, 'learning_rate': 7.596304371672436e-07, 'epoch': 1.76} {'loss': 0.3699, 'learning_rate': 7.595019970648753e-07, 'epoch': 1.76} {'loss': 0.2492, 'learning_rate': 7.593735673932712e-07, 'epoch': 1.76} {'loss': 0.2082, 'learning_rate': 7.592451481525786e-07, 'epoch': 1.76} {'loss': 0.3307, 'learning_rate': 7.591167393429399e-07, 'epoch': 1.76} {'loss': 0.3223, 'learning_rate': 7.589883409645027e-07, 'epoch': 1.76} {'loss': 0.3348, 'learning_rate': 7.588599530174078e-07, 'epoch': 1.76} {'loss': 0.3926, 'learning_rate': 7.587315755018054e-07, 'epoch': 1.76} {'loss': 0.278, 'learning_rate': 7.586032084178352e-07, 'epoch': 1.76} {'loss': 0.3913, 'learning_rate': 7.58474851765647e-07, 'epoch': 1.76} {'loss': 0.2858, 'learning_rate': 7.583465055453809e-07, 'epoch': 1.76} {'loss': 0.3609, 'learning_rate': 7.582181697571866e-07, 'epoch': 1.76} {'loss': 0.3225, 'learning_rate': 7.580898444012041e-07, 'epoch': 1.76} {'loss': 0.2592, 'learning_rate': 7.579615294775821e-07, 'epoch': 1.76} {'loss': 0.2096, 'learning_rate': 7.57833224986465e-07, 'epoch': 1.76} {'loss': 0.3024, 'learning_rate': 7.57704930927995e-07, 'epoch': 1.76} {'loss': 0.3733, 'learning_rate': 7.575766473023205e-07, 'epoch': 1.76} {'loss': 0.1787, 'learning_rate': 7.574483741095817e-07, 'epoch': 1.76} {'loss': 0.1773, 'learning_rate': 7.573201113499296e-07, 'epoch': 1.76} {'loss': 0.251, 'learning_rate': 7.571918590235028e-07, 'epoch': 1.76} {'loss': 0.2292, 'learning_rate': 7.570636171304501e-07, 'epoch': 1.76} {'loss': 0.3015, 'learning_rate': 7.569353856709161e-07, 'epoch': 1.76} {'loss': 0.264, 'learning_rate': 7.568071646450415e-07, 'epoch': 1.76} {'loss': 0.3863, 'learning_rate': 7.566789540529762e-07, 'epoch': 1.76} {'loss': 0.3931, 'learning_rate': 7.565507538948614e-07, 'epoch': 1.76} {'loss': 0.342, 'learning_rate': 7.564225641708445e-07, 'epoch': 1.76} {'loss': 0.2421, 'learning_rate': 7.562943848810667e-07, 'epoch': 1.76} {'loss': 0.4346, 'learning_rate': 7.561662160256767e-07, 'epoch': 1.76} {'loss': 0.2053, 'learning_rate': 7.560380576048154e-07, 'epoch': 1.76} {'loss': 0.2966, 'learning_rate': 7.559099096186306e-07, 'epoch': 1.76} {'loss': 0.3245, 'learning_rate': 7.557817720672655e-07, 'epoch': 1.76} {'loss': 0.262, 'learning_rate': 7.556536449508655e-07, 'epoch': 1.76} {'loss': 0.4523, 'learning_rate': 7.555255282695729e-07, 'epoch': 1.76} {'loss': 0.3336, 'learning_rate': 7.55397422023536e-07, 'epoch': 1.76} {'loss': 0.3843, 'learning_rate': 7.552693262128974e-07, 'epoch': 1.76} {'loss': 0.2816, 'learning_rate': 7.551412408378e-07, 'epoch': 1.76} {'loss': 0.2923, 'learning_rate': 7.550131658983917e-07, 'epoch': 1.76} {'loss': 0.2352, 'learning_rate': 7.548851013948144e-07, 'epoch': 1.76} {'loss': 0.1901, 'learning_rate': 7.547570473272148e-07, 'epoch': 1.76} {'loss': 0.2749, 'learning_rate': 7.546290036957349e-07, 'epoch': 1.76} {'loss': 0.3029, 'learning_rate': 7.545009705005224e-07, 'epoch': 1.76} {'loss': 0.3454, 'learning_rate': 7.543729477417195e-07, 'epoch': 1.76} {'loss': 0.3039, 'learning_rate': 7.542449354194714e-07, 'epoch': 1.76} {'loss': 0.3945, 'learning_rate': 7.541169335339227e-07, 'epoch': 1.76} {'loss': 0.311, 'learning_rate': 7.539889420852186e-07, 'epoch': 1.76} {'loss': 0.2532, 'learning_rate': 7.538609610735004e-07, 'epoch': 1.76} {'loss': 0.3605, 'learning_rate': 7.537329904989177e-07, 'epoch': 1.76} {'loss': 0.2854, 'learning_rate': 7.536050303616116e-07, 'epoch': 1.76} {'loss': 0.4578, 'learning_rate': 7.534770806617253e-07, 'epoch': 1.76} {'loss': 0.2295, 'learning_rate': 7.533491413994076e-07, 'epoch': 1.76} {'loss': 0.3836, 'learning_rate': 7.532212125747984e-07, 'epoch': 1.76} {'loss': 0.3243, 'learning_rate': 7.530932941880453e-07, 'epoch': 1.76} {'loss': 0.3446, 'learning_rate': 7.529653862392905e-07, 'epoch': 1.76} {'loss': 0.4557, 'learning_rate': 7.528374887286805e-07, 'epoch': 1.76} {'loss': 0.4087, 'learning_rate': 7.527096016563574e-07, 'epoch': 1.76} {'loss': 0.3492, 'learning_rate': 7.525817250224676e-07, 'epoch': 1.76} {'loss': 0.3209, 'learning_rate': 7.524538588271535e-07, 'epoch': 1.76} {'loss': 0.3546, 'learning_rate': 7.523260030705615e-07, 'epoch': 1.76} {'loss': 0.3175, 'learning_rate': 7.521981577528336e-07, 'epoch': 1.76} {'loss': 0.2488, 'learning_rate': 7.520703228741178e-07, 'epoch': 1.76} {'loss': 0.2472, 'learning_rate': 7.519424984345546e-07, 'epoch': 1.76} {'loss': 0.3413, 'learning_rate': 7.518146844342899e-07, 'epoch': 1.76} {'loss': 0.3742, 'learning_rate': 7.516868808734679e-07, 'epoch': 1.76} {'loss': 0.2793, 'learning_rate': 7.515590877522316e-07, 'epoch': 1.76} {'loss': 0.4045, 'learning_rate': 7.514313050707289e-07, 'epoch': 1.76} {'loss': 0.2774, 'learning_rate': 7.513035328290985e-07, 'epoch': 1.76} {'loss': 0.3893, 'learning_rate': 7.511757710274902e-07, 'epoch': 1.76} {'loss': 0.3601, 'learning_rate': 7.510480196660441e-07, 'epoch': 1.76} {'loss': 0.316, 'learning_rate': 7.509202787449066e-07, 'epoch': 1.76} {'loss': 0.2599, 'learning_rate': 7.507925482642209e-07, 'epoch': 1.76} {'loss': 0.2997, 'learning_rate': 7.506648282241324e-07, 'epoch': 1.76} {'loss': 0.2164, 'learning_rate': 7.505371186247834e-07, 'epoch': 1.76} {'loss': 0.3846, 'learning_rate': 7.504094194663214e-07, 'epoch': 1.76} {'loss': 0.2779, 'learning_rate': 7.502817307488874e-07, 'epoch': 1.76} {'loss': 0.3349, 'learning_rate': 7.501540524726247e-07, 'epoch': 1.76} {'loss': 0.2813, 'learning_rate': 7.500263846376809e-07, 'epoch': 1.76} {'loss': 0.2994, 'learning_rate': 7.498987272441959e-07, 'epoch': 1.76} {'loss': 0.4315, 'learning_rate': 7.497710802923197e-07, 'epoch': 1.76} {'loss': 0.3598, 'learning_rate': 7.496434437821897e-07, 'epoch': 1.76} {'loss': 0.348, 'learning_rate': 7.495158177139561e-07, 'epoch': 1.76} {'loss': 0.2386, 'learning_rate': 7.493882020877574e-07, 'epoch': 1.76} {'loss': 0.2288, 'learning_rate': 7.492605969037425e-07, 'epoch': 1.76} {'loss': 0.3325, 'learning_rate': 7.491330021620513e-07, 'epoch': 1.76} {'loss': 0.4718, 'learning_rate': 7.490054178628314e-07, 'epoch': 1.76} {'loss': 0.1803, 'learning_rate': 7.488778440062239e-07, 'epoch': 1.76} {'loss': 0.2858, 'learning_rate': 7.487502805923763e-07, 'epoch': 1.76} {'loss': 0.4476, 'learning_rate': 7.486227276214297e-07, 'epoch': 1.76} {'loss': 0.3841, 'learning_rate': 7.484951850935274e-07, 'epoch': 1.76} {'loss': 0.2609, 'learning_rate': 7.483676530088169e-07, 'epoch': 1.76} {'loss': 0.2757, 'learning_rate': 7.48240131367437e-07, 'epoch': 1.76} {'loss': 0.3021, 'learning_rate': 7.481126201695377e-07, 'epoch': 1.76} {'loss': 0.3596, 'learning_rate': 7.479851194152577e-07, 'epoch': 1.76} {'loss': 0.283, 'learning_rate': 7.478576291047446e-07, 'epoch': 1.76} {'loss': 0.3356, 'learning_rate': 7.477301492381394e-07, 'epoch': 1.76} {'loss': 0.2869, 'learning_rate': 7.4760267981559e-07, 'epoch': 1.76} {'loss': 0.2997, 'learning_rate': 7.474752208372349e-07, 'epoch': 1.76} {'loss': 0.2296, 'learning_rate': 7.47347772303223e-07, 'epoch': 1.76} {'loss': 0.3364, 'learning_rate': 7.472203342136941e-07, 'epoch': 1.76} {'loss': 0.3053, 'learning_rate': 7.47092906568796e-07, 'epoch': 1.76} {'loss': 0.4017, 'learning_rate': 7.469654893686696e-07, 'epoch': 1.76} {'loss': 0.3021, 'learning_rate': 7.468380826134591e-07, 'epoch': 1.76} {'loss': 0.3093, 'learning_rate': 7.467106863033092e-07, 'epoch': 1.76} {'loss': 0.1655, 'learning_rate': 7.465833004383627e-07, 'epoch': 1.76} {'loss': 0.3002, 'learning_rate': 7.464559250187653e-07, 'epoch': 1.76} {'loss': 0.2143, 'learning_rate': 7.463285600446579e-07, 'epoch': 1.76} {'loss': 0.2143, 'learning_rate': 7.462012055161882e-07, 'epoch': 1.76} {'loss': 0.2758, 'learning_rate': 7.46073861433495e-07, 'epoch': 1.76} {'loss': 0.2155, 'learning_rate': 7.459465277967271e-07, 'epoch': 1.76} {'loss': 0.3242, 'learning_rate': 7.458192046060242e-07, 'epoch': 1.76} {'loss': 0.303, 'learning_rate': 7.45691891861533e-07, 'epoch': 1.76} {'loss': 0.2952, 'learning_rate': 7.455645895633934e-07, 'epoch': 1.76} {'loss': 0.3886, 'learning_rate': 7.454372977117541e-07, 'epoch': 1.76} {'loss': 0.3597, 'learning_rate': 7.45310016306755e-07, 'epoch': 1.76} {'loss': 0.2708, 'learning_rate': 7.451827453485405e-07, 'epoch': 1.76} {'loss': 0.176, 'learning_rate': 7.45055484837256e-07, 'epoch': 1.76} {'loss': 0.3892, 'learning_rate': 7.449282347730435e-07, 'epoch': 1.76} {'loss': 0.2983, 'learning_rate': 7.448009951560476e-07, 'epoch': 1.76} {'loss': 0.344, 'learning_rate': 7.446737659864101e-07, 'epoch': 1.76} {'loss': 0.454, 'learning_rate': 7.445465472642777e-07, 'epoch': 1.76} {'loss': 0.3839, 'learning_rate': 7.444193389897903e-07, 'epoch': 1.76} {'loss': 0.4594, 'learning_rate': 7.442921411630954e-07, 'epoch': 1.76} {'loss': 0.4031, 'learning_rate': 7.441649537843343e-07, 'epoch': 1.76} {'loss': 0.427, 'learning_rate': 7.4403777685365e-07, 'epoch': 1.76} {'loss': 0.2139, 'learning_rate': 7.43910610371188e-07, 'epoch': 1.76} {'loss': 0.3006, 'learning_rate': 7.437834543370892e-07, 'epoch': 1.76} {'loss': 0.2542, 'learning_rate': 7.436563087515003e-07, 'epoch': 1.76} {'loss': 0.3749, 'learning_rate': 7.435291736145622e-07, 'epoch': 1.76} {'loss': 0.3963, 'learning_rate': 7.434020489264204e-07, 'epoch': 1.76} {'loss': 0.2695, 'learning_rate': 7.432749346872159e-07, 'epoch': 1.76} {'loss': 0.2853, 'learning_rate': 7.431478308970963e-07, 'epoch': 1.76} {'loss': 0.3238, 'learning_rate': 7.430207375561993e-07, 'epoch': 1.76} {'loss': 0.3192, 'learning_rate': 7.428936546646748e-07, 'epoch': 1.76} {'loss': 0.4671, 'learning_rate': 7.427665822226604e-07, 'epoch': 1.76} {'loss': 0.3232, 'learning_rate': 7.426395202303038e-07, 'epoch': 1.76} {'loss': 0.2959, 'learning_rate': 7.425124686877471e-07, 'epoch': 1.76} {'loss': 0.3297, 'learning_rate': 7.423854275951325e-07, 'epoch': 1.76} {'loss': 0.3827, 'learning_rate': 7.422583969526054e-07, 'epoch': 1.76} {'loss': 0.2003, 'learning_rate': 7.421313767603055e-07, 'epoch': 1.76} {'loss': 0.2171, 'learning_rate': 7.420043670183819e-07, 'epoch': 1.76} {'loss': 0.1619, 'learning_rate': 7.41877367726973e-07, 'epoch': 1.76} {'loss': 0.3823, 'learning_rate': 7.417503788862246e-07, 'epoch': 1.76} {'loss': 0.282, 'learning_rate': 7.416234004962786e-07, 'epoch': 1.76} {'loss': 0.3197, 'learning_rate': 7.414964325572815e-07, 'epoch': 1.76} {'loss': 0.3168, 'learning_rate': 7.413694750693722e-07, 'epoch': 1.76} {'loss': 0.2811, 'learning_rate': 7.412425280326974e-07, 'epoch': 1.76} {'loss': 0.2862, 'learning_rate': 7.411155914473977e-07, 'epoch': 1.76} {'loss': 0.2025, 'learning_rate': 7.4098866531362e-07, 'epoch': 1.76} {'loss': 0.2691, 'learning_rate': 7.408617496315041e-07, 'epoch': 1.76} {'loss': 0.3672, 'learning_rate': 7.407348444011941e-07, 'epoch': 1.76} {'loss': 0.2595, 'learning_rate': 7.406079496228346e-07, 'epoch': 1.76} {'loss': 0.324, 'learning_rate': 7.404810652965677e-07, 'epoch': 1.76} {'loss': 0.4163, 'learning_rate': 7.403541914225376e-07, 'epoch': 1.76} {'loss': 0.3085, 'learning_rate': 7.402273280008854e-07, 'epoch': 1.76} {'loss': 0.2614, 'learning_rate': 7.401004750317564e-07, 'epoch': 1.76} {'loss': 0.4804, 'learning_rate': 7.399736325152929e-07, 'epoch': 1.76} {'loss': 0.3123, 'learning_rate': 7.398468004516391e-07, 'epoch': 1.76} {'loss': 0.3251, 'learning_rate': 7.397199788409359e-07, 'epoch': 1.76} {'loss': 0.2619, 'learning_rate': 7.39593167683329e-07, 'epoch': 1.76} {'loss': 0.3817, 'learning_rate': 7.394663669789592e-07, 'epoch': 1.76} {'loss': 0.3241, 'learning_rate': 7.393395767279732e-07, 'epoch': 1.76} {'loss': 0.1932, 'learning_rate': 7.392127969305118e-07, 'epoch': 1.76} {'loss': 0.2406, 'learning_rate': 7.390860275867162e-07, 'epoch': 1.76} {'loss': 0.2729, 'learning_rate': 7.389592686967329e-07, 'epoch': 1.76} {'loss': 0.3136, 'learning_rate': 7.388325202607016e-07, 'epoch': 1.76} {'loss': 0.2387, 'learning_rate': 7.38705782278769e-07, 'epoch': 1.76} {'loss': 0.3449, 'learning_rate': 7.385790547510752e-07, 'epoch': 1.76} {'loss': 0.3493, 'learning_rate': 7.384523376777663e-07, 'epoch': 1.76} {'loss': 0.3345, 'learning_rate': 7.383256310589814e-07, 'epoch': 1.76} {'loss': 0.2505, 'learning_rate': 7.38198934894867e-07, 'epoch': 1.76} {'loss': 0.2752, 'learning_rate': 7.380722491855641e-07, 'epoch': 1.76} {'loss': 0.2412, 'learning_rate': 7.379455739312181e-07, 'epoch': 1.76} {'loss': 0.297, 'learning_rate': 7.378189091319677e-07, 'epoch': 1.76} {'loss': 0.3106, 'learning_rate': 7.376922547879606e-07, 'epoch': 1.76} {'loss': 0.3306, 'learning_rate': 7.375656108993379e-07, 'epoch': 1.76} {'loss': 0.2778, 'learning_rate': 7.374389774662394e-07, 'epoch': 1.76} {'loss': 0.2842, 'learning_rate': 7.373123544888139e-07, 'epoch': 1.76} {'loss': 0.1651, 'learning_rate': 7.37185741967199e-07, 'epoch': 1.76} {'loss': 0.3113, 'learning_rate': 7.370591399015425e-07, 'epoch': 1.76} {'loss': 0.2584, 'learning_rate': 7.369325482919832e-07, 'epoch': 1.76} {'loss': 0.3436, 'learning_rate': 7.368059671386663e-07, 'epoch': 1.76} {'loss': 0.3439, 'learning_rate': 7.36679396441733e-07, 'epoch': 1.76} {'loss': 0.2923, 'learning_rate': 7.365528362013286e-07, 'epoch': 1.76} {'loss': 0.2872, 'learning_rate': 7.364262864175919e-07, 'epoch': 1.76} {'loss': 0.3726, 'learning_rate': 7.362997470906707e-07, 'epoch': 1.76} {'loss': 0.2885, 'learning_rate': 7.361732182207049e-07, 'epoch': 1.76} {'loss': 0.3456, 'learning_rate': 7.360466998078386e-07, 'epoch': 1.76} {'loss': 0.2867, 'learning_rate': 7.359201918522141e-07, 'epoch': 1.76} {'loss': 0.4499, 'learning_rate': 7.357936943539723e-07, 'epoch': 1.76} {'loss': 0.3394, 'learning_rate': 7.356672073132598e-07, 'epoch': 1.76} {'loss': 0.2881, 'learning_rate': 7.355407307302154e-07, 'epoch': 1.76} {'loss': 0.3061, 'learning_rate': 7.354142646049855e-07, 'epoch': 1.76} {'loss': 0.3749, 'learning_rate': 7.352878089377091e-07, 'epoch': 1.76} {'loss': 0.2705, 'learning_rate': 7.351613637285338e-07, 'epoch': 1.76} {'loss': 0.2509, 'learning_rate': 7.350349289775971e-07, 'epoch': 1.76} {'loss': 0.3428, 'learning_rate': 7.349085046850457e-07, 'epoch': 1.76} {'loss': 0.3971, 'learning_rate': 7.347820908510183e-07, 'epoch': 1.76} {'loss': 0.2649, 'learning_rate': 7.346556874756627e-07, 'epoch': 1.76} {'loss': 0.3286, 'learning_rate': 7.345292945591176e-07, 'epoch': 1.76} {'loss': 0.2148, 'learning_rate': 7.344029121015283e-07, 'epoch': 1.76} {'loss': 0.3564, 'learning_rate': 7.342765401030361e-07, 'epoch': 1.76} {'loss': 0.2524, 'learning_rate': 7.341501785637828e-07, 'epoch': 1.76} {'loss': 0.348, 'learning_rate': 7.340238274839129e-07, 'epoch': 1.76} {'loss': 0.2241, 'learning_rate': 7.338974868635662e-07, 'epoch': 1.76} {'loss': 0.3874, 'learning_rate': 7.337711567028894e-07, 'epoch': 1.76} {'loss': 0.2513, 'learning_rate': 7.336448370020211e-07, 'epoch': 1.76} {'loss': 0.2777, 'learning_rate': 7.335185277611068e-07, 'epoch': 1.76} {'loss': 0.255, 'learning_rate': 7.333922289802864e-07, 'epoch': 1.76} {'loss': 0.2129, 'learning_rate': 7.332659406597065e-07, 'epoch': 1.76} {'loss': 0.5439, 'learning_rate': 7.331396627995047e-07, 'epoch': 1.76} {'loss': 0.3063, 'learning_rate': 7.330133953998287e-07, 'epoch': 1.76} {'loss': 0.3129, 'learning_rate': 7.32887138460816e-07, 'epoch': 1.76} {'loss': 0.3406, 'learning_rate': 7.327608919826135e-07, 'epoch': 1.76} {'loss': 0.3354, 'learning_rate': 7.326346559653597e-07, 'epoch': 1.76} {'loss': 0.2996, 'learning_rate': 7.325084304091989e-07, 'epoch': 1.76} {'loss': 0.3032, 'learning_rate': 7.323822153142756e-07, 'epoch': 1.76} {'loss': 0.1972, 'learning_rate': 7.322560106807297e-07, 'epoch': 1.76} {'loss': 0.3494, 'learning_rate': 7.321298165087054e-07, 'epoch': 1.76} {'loss': 0.2543, 'learning_rate': 7.320036327983426e-07, 'epoch': 1.76} {'loss': 0.2788, 'learning_rate': 7.318774595497869e-07, 'epoch': 1.76} {'loss': 0.3121, 'learning_rate': 7.31751296763179e-07, 'epoch': 1.76} {'loss': 0.2912, 'learning_rate': 7.316251444386602e-07, 'epoch': 1.76} {'loss': 0.3121, 'learning_rate': 7.314990025763747e-07, 'epoch': 1.76} {'loss': 0.1958, 'learning_rate': 7.313728711764645e-07, 'epoch': 1.76} {'loss': 0.3205, 'learning_rate': 7.312467502390719e-07, 'epoch': 1.76} {'loss': 0.2133, 'learning_rate': 7.311206397643377e-07, 'epoch': 1.76} {'loss': 0.3113, 'learning_rate': 7.309945397524087e-07, 'epoch': 1.76} {'loss': 0.3955, 'learning_rate': 7.308684502034214e-07, 'epoch': 1.76} {'loss': 0.2587, 'learning_rate': 7.307423711175232e-07, 'epoch': 1.76} {'loss': 0.3421, 'learning_rate': 7.306163024948521e-07, 'epoch': 1.76} {'loss': 0.3975, 'learning_rate': 7.304902443355543e-07, 'epoch': 1.76} {'loss': 0.2052, 'learning_rate': 7.30364196639769e-07, 'epoch': 1.76} {'loss': 0.3708, 'learning_rate': 7.302381594076413e-07, 'epoch': 1.76} {'loss': 0.2289, 'learning_rate': 7.301121326393124e-07, 'epoch': 1.76} {'loss': 0.3215, 'learning_rate': 7.29986116334922e-07, 'epoch': 1.76} {'loss': 0.4143, 'learning_rate': 7.298601104946157e-07, 'epoch': 1.76} {'loss': 0.1913, 'learning_rate': 7.297341151185333e-07, 'epoch': 1.76} {'loss': 0.2749, 'learning_rate': 7.296081302068203e-07, 'epoch': 1.76} {'loss': 0.2823, 'learning_rate': 7.294821557596155e-07, 'epoch': 1.76} {'loss': 0.2996, 'learning_rate': 7.293561917770631e-07, 'epoch': 1.76} {'loss': 0.2318, 'learning_rate': 7.292302382593041e-07, 'epoch': 1.76} {'loss': 0.3461, 'learning_rate': 7.291042952064819e-07, 'epoch': 1.76} {'loss': 0.3507, 'learning_rate': 7.289783626187364e-07, 'epoch': 1.76} {'loss': 0.165, 'learning_rate': 7.288524404962138e-07, 'epoch': 1.76} {'loss': 0.2481, 'learning_rate': 7.287265288390522e-07, 'epoch': 1.76} {'loss': 0.3522, 'learning_rate': 7.286006276473956e-07, 'epoch': 1.76} {'loss': 0.2409, 'learning_rate': 7.284747369213873e-07, 'epoch': 1.76} {'loss': 0.2757, 'learning_rate': 7.283488566611652e-07, 'epoch': 1.76} {'loss': 0.2321, 'learning_rate': 7.282229868668766e-07, 'epoch': 1.76} {'loss': 0.3362, 'learning_rate': 7.280971275386595e-07, 'epoch': 1.76} {'loss': 0.2852, 'learning_rate': 7.279712786766591e-07, 'epoch': 1.76} {'loss': 0.2532, 'learning_rate': 7.278454402810142e-07, 'epoch': 1.76} {'loss': 0.2662, 'learning_rate': 7.277196123518704e-07, 'epoch': 1.76} {'loss': 0.2925, 'learning_rate': 7.275937948893663e-07, 'epoch': 1.76} {'loss': 0.2012, 'learning_rate': 7.274679878936474e-07, 'epoch': 1.76} {'loss': 0.1942, 'learning_rate': 7.273421913648516e-07, 'epoch': 1.76} {'loss': 0.265, 'learning_rate': 7.272164053031249e-07, 'epoch': 1.76} {'loss': 0.3684, 'learning_rate': 7.270906297086067e-07, 'epoch': 1.76} {'loss': 0.3855, 'learning_rate': 7.269648645814409e-07, 'epoch': 1.76} {'loss': 0.35, 'learning_rate': 7.268391099217686e-07, 'epoch': 1.76} {'loss': 0.2457, 'learning_rate': 7.267133657297298e-07, 'epoch': 1.76} {'loss': 0.2774, 'learning_rate': 7.265876320054699e-07, 'epoch': 1.76} {'loss': 0.1983, 'learning_rate': 7.264619087491276e-07, 'epoch': 1.76} {'loss': 0.4478, 'learning_rate': 7.263361959608484e-07, 'epoch': 1.76} {'loss': 0.4821, 'learning_rate': 7.262104936407699e-07, 'epoch': 1.76} {'loss': 0.3229, 'learning_rate': 7.260848017890388e-07, 'epoch': 1.76} {'loss': 0.2593, 'learning_rate': 7.259591204057914e-07, 'epoch': 1.76} {'loss': 0.2623, 'learning_rate': 7.258334494911757e-07, 'epoch': 1.76} {'loss': 0.3024, 'learning_rate': 7.257077890453279e-07, 'epoch': 1.76} {'loss': 0.3322, 'learning_rate': 7.255821390683937e-07, 'epoch': 1.76} {'loss': 0.307, 'learning_rate': 7.254564995605129e-07, 'epoch': 1.76} {'loss': 0.1756, 'learning_rate': 7.253308705218298e-07, 'epoch': 1.76} {'loss': 0.2947, 'learning_rate': 7.252052519524833e-07, 'epoch': 1.76} {'loss': 0.3669, 'learning_rate': 7.250796438526153e-07, 'epoch': 1.76} {'loss': 0.3367, 'learning_rate': 7.249540462223715e-07, 'epoch': 1.76} {'loss': 0.392, 'learning_rate': 7.248284590618882e-07, 'epoch': 1.76} {'loss': 0.2019, 'learning_rate': 7.24702882371311e-07, 'epoch': 1.76} {'loss': 0.3142, 'learning_rate': 7.245773161507796e-07, 'epoch': 1.76} {'loss': 0.3815, 'learning_rate': 7.244517604004375e-07, 'epoch': 1.76} {'loss': 0.3482, 'learning_rate': 7.243262151204245e-07, 'epoch': 1.76} {'loss': 0.2968, 'learning_rate': 7.242006803108847e-07, 'epoch': 1.76} {'loss': 0.2735, 'learning_rate': 7.240751559719572e-07, 'epoch': 1.76} {'loss': 0.3852, 'learning_rate': 7.239496421037861e-07, 'epoch': 1.76} {'loss': 0.3108, 'learning_rate': 7.238241387065103e-07, 'epoch': 1.76} {'loss': 0.2427, 'learning_rate': 7.236986457802752e-07, 'epoch': 1.76} {'loss': 0.2189, 'learning_rate': 7.235731633252185e-07, 'epoch': 1.76} {'loss': 0.3562, 'learning_rate': 7.234476913414856e-07, 'epoch': 1.76} {'loss': 0.2232, 'learning_rate': 7.233222298292164e-07, 'epoch': 1.76} {'loss': 0.2948, 'learning_rate': 7.231967787885496e-07, 'epoch': 1.76} {'loss': 0.2848, 'learning_rate': 7.23071338219633e-07, 'epoch': 1.76} {'loss': 0.3943, 'learning_rate': 7.22945908122602e-07, 'epoch': 1.76} {'loss': 0.289, 'learning_rate': 7.22820488497602e-07, 'epoch': 1.76} {'loss': 0.275, 'learning_rate': 7.226950793447729e-07, 'epoch': 1.76} {'loss': 0.286, 'learning_rate': 7.22569680664258e-07, 'epoch': 1.76} {'loss': 0.3595, 'learning_rate': 7.224442924561959e-07, 'epoch': 1.76} {'loss': 0.2776, 'learning_rate': 7.223189147207321e-07, 'epoch': 1.76} {'loss': 0.2768, 'learning_rate': 7.221935474580044e-07, 'epoch': 1.76} {'loss': 0.3373, 'learning_rate': 7.220681906681582e-07, 'epoch': 1.76} {'loss': 0.3354, 'learning_rate': 7.219428443513299e-07, 'epoch': 1.76} {'loss': 0.2486, 'learning_rate': 7.218175085076662e-07, 'epoch': 1.76} {'loss': 0.2066, 'learning_rate': 7.216921831373059e-07, 'epoch': 1.76} {'loss': 0.3322, 'learning_rate': 7.215668682403887e-07, 'epoch': 1.76} {'loss': 0.25, 'learning_rate': 7.214415638170602e-07, 'epoch': 1.76} {'loss': 0.3581, 'learning_rate': 7.213162698674581e-07, 'epoch': 1.76} {'loss': 0.2632, 'learning_rate': 7.211909863917276e-07, 'epoch': 1.76} {'loss': 0.3155, 'learning_rate': 7.210657133900056e-07, 'epoch': 1.76} {'loss': 0.4618, 'learning_rate': 7.209404508624385e-07, 'epoch': 1.76} {'loss': 0.2908, 'learning_rate': 7.208151988091628e-07, 'epoch': 1.76} {'loss': 0.314, 'learning_rate': 7.206899572303239e-07, 'epoch': 1.76} {'loss': 0.3763, 'learning_rate': 7.205647261260606e-07, 'epoch': 1.76} {'loss': 0.2591, 'learning_rate': 7.204395054965163e-07, 'epoch': 1.76} {'loss': 0.2972, 'learning_rate': 7.203142953418297e-07, 'epoch': 1.76} {'loss': 0.224, 'learning_rate': 7.201890956621426e-07, 'epoch': 1.76} {'loss': 0.3619, 'learning_rate': 7.200639064575998e-07, 'epoch': 1.76} {'loss': 0.3582, 'learning_rate': 7.199387277283387e-07, 'epoch': 1.76} {'loss': 0.306, 'learning_rate': 7.198135594745038e-07, 'epoch': 1.76} {'loss': 0.2472, 'learning_rate': 7.196884016962324e-07, 'epoch': 1.76} {'loss': 0.1518, 'learning_rate': 7.195632543936704e-07, 'epoch': 1.76} {'loss': 0.2525, 'learning_rate': 7.194381175669552e-07, 'epoch': 1.76} {'loss': 0.2325, 'learning_rate': 7.193129912162312e-07, 'epoch': 1.76} {'loss': 0.281, 'learning_rate': 7.191878753416371e-07, 'epoch': 1.76} {'loss': 0.2194, 'learning_rate': 7.190627699433139e-07, 'epoch': 1.76} {'loss': 0.2218, 'learning_rate': 7.189376750214061e-07, 'epoch': 1.76} {'loss': 0.2318, 'learning_rate': 7.188125905760513e-07, 'epoch': 1.76} {'loss': 0.2384, 'learning_rate': 7.186875166073925e-07, 'epoch': 1.76} {'loss': 0.3869, 'learning_rate': 7.1856245311557e-07, 'epoch': 1.76} {'loss': 0.2748, 'learning_rate': 7.184374001007266e-07, 'epoch': 1.76} {'loss': 0.2937, 'learning_rate': 7.183123575630013e-07, 'epoch': 1.76} {'loss': 0.2708, 'learning_rate': 7.181873255025384e-07, 'epoch': 1.76} {'loss': 0.1248, 'learning_rate': 7.180623039194745e-07, 'epoch': 1.76} {'loss': 0.2982, 'learning_rate': 7.179372928139549e-07, 'epoch': 1.76} {'loss': 0.2382, 'learning_rate': 7.178122921861174e-07, 'epoch': 1.76} {'loss': 0.182, 'learning_rate': 7.176873020361064e-07, 'epoch': 1.76} {'loss': 0.1944, 'learning_rate': 7.175623223640616e-07, 'epoch': 1.76} {'loss': 0.2566, 'learning_rate': 7.174373531701228e-07, 'epoch': 1.76} {'loss': 0.3063, 'learning_rate': 7.173123944544325e-07, 'epoch': 1.76} {'loss': 0.3776, 'learning_rate': 7.171874462171302e-07, 'epoch': 1.76} {'loss': 0.3305, 'learning_rate': 7.170625084583593e-07, 'epoch': 1.76} {'loss': 0.3238, 'learning_rate': 7.169375811782586e-07, 'epoch': 1.77} {'loss': 0.147, 'learning_rate': 7.168126643769713e-07, 'epoch': 1.77} {'loss': 0.3514, 'learning_rate': 7.166877580546361e-07, 'epoch': 1.77} {'loss': 0.1702, 'learning_rate': 7.165628622113962e-07, 'epoch': 1.77} {'loss': 0.3059, 'learning_rate': 7.164379768473905e-07, 'epoch': 1.77} {'loss': 0.4042, 'learning_rate': 7.163131019627622e-07, 'epoch': 1.77} {'loss': 0.2949, 'learning_rate': 7.16188237557649e-07, 'epoch': 1.77} {'loss': 0.265, 'learning_rate': 7.160633836321962e-07, 'epoch': 1.77} {'loss': 0.3497, 'learning_rate': 7.159385401865415e-07, 'epoch': 1.77} {'loss': 0.2628, 'learning_rate': 7.15813707220826e-07, 'epoch': 1.77} {'loss': 0.255, 'learning_rate': 7.156888847351928e-07, 'epoch': 1.77} {'loss': 0.2987, 'learning_rate': 7.155640727297796e-07, 'epoch': 1.77} {'loss': 0.2123, 'learning_rate': 7.154392712047309e-07, 'epoch': 1.77} {'loss': 0.355, 'learning_rate': 7.153144801601842e-07, 'epoch': 1.77} {'loss': 0.3254, 'learning_rate': 7.151896995962826e-07, 'epoch': 1.77} {'loss': 0.2828, 'learning_rate': 7.15064929513165e-07, 'epoch': 1.77} {'loss': 0.2464, 'learning_rate': 7.149401699109759e-07, 'epoch': 1.77} {'loss': 0.2154, 'learning_rate': 7.148154207898517e-07, 'epoch': 1.77} {'loss': 0.2883, 'learning_rate': 7.146906821499367e-07, 'epoch': 1.77} {'loss': 0.2987, 'learning_rate': 7.145659539913685e-07, 'epoch': 1.77} {'loss': 0.2519, 'learning_rate': 7.144412363142916e-07, 'epoch': 1.77} {'loss': 0.3896, 'learning_rate': 7.143165291188436e-07, 'epoch': 1.77} {'loss': 0.1837, 'learning_rate': 7.141918324051667e-07, 'epoch': 1.77} {'loss': 0.2795, 'learning_rate': 7.140671461734016e-07, 'epoch': 1.77} {'loss': 0.277, 'learning_rate': 7.139424704236886e-07, 'epoch': 1.77} {'loss': 0.2938, 'learning_rate': 7.138178051561695e-07, 'epoch': 1.77} {'loss': 0.282, 'learning_rate': 7.136931503709821e-07, 'epoch': 1.77} {'loss': 0.3422, 'learning_rate': 7.135685060682717e-07, 'epoch': 1.77} {'loss': 0.3792, 'learning_rate': 7.134438722481752e-07, 'epoch': 1.77} {'loss': 0.4234, 'learning_rate': 7.133192489108353e-07, 'epoch': 1.77} {'loss': 0.2663, 'learning_rate': 7.131946360563912e-07, 'epoch': 1.77} {'loss': 0.2682, 'learning_rate': 7.13070033684986e-07, 'epoch': 1.77} {'loss': 0.3018, 'learning_rate': 7.129454417967563e-07, 'epoch': 1.77} {'loss': 0.2601, 'learning_rate': 7.128208603918474e-07, 'epoch': 1.77} {'loss': 0.2403, 'learning_rate': 7.126962894703981e-07, 'epoch': 1.77} {'loss': 0.2552, 'learning_rate': 7.125717290325462e-07, 'epoch': 1.77} {'loss': 0.2668, 'learning_rate': 7.12447179078437e-07, 'epoch': 1.77} {'loss': 0.2224, 'learning_rate': 7.123226396082072e-07, 'epoch': 1.77} {'loss': 0.3474, 'learning_rate': 7.12198110622e-07, 'epoch': 1.77} {'loss': 0.1797, 'learning_rate': 7.12073592119954e-07, 'epoch': 1.77} {'loss': 0.3761, 'learning_rate': 7.119490841022114e-07, 'epoch': 1.77} {'loss': 0.5981, 'learning_rate': 7.118245865689122e-07, 'epoch': 1.77} {'loss': 0.3166, 'learning_rate': 7.117000995201973e-07, 'epoch': 1.77} {'loss': 0.3508, 'learning_rate': 7.115756229562043e-07, 'epoch': 1.77} {'loss': 0.289, 'learning_rate': 7.114511568770787e-07, 'epoch': 1.77} {'loss': 0.2974, 'learning_rate': 7.113267012829572e-07, 'epoch': 1.77} {'loss': 0.3139, 'learning_rate': 7.112022561739829e-07, 'epoch': 1.77} {'loss': 0.3224, 'learning_rate': 7.110778215502945e-07, 'epoch': 1.77} {'loss': 0.3091, 'learning_rate': 7.10953397412032e-07, 'epoch': 1.77} {'loss': 0.4044, 'learning_rate': 7.108289837593374e-07, 'epoch': 1.77} {'loss': 0.1584, 'learning_rate': 7.107045805923496e-07, 'epoch': 1.77} {'loss': 0.1849, 'learning_rate': 7.105801879112107e-07, 'epoch': 1.77} {'loss': 0.3712, 'learning_rate': 7.104558057160593e-07, 'epoch': 1.77} {'loss': 0.29, 'learning_rate': 7.103314340070388e-07, 'epoch': 1.77} {'loss': 0.3707, 'learning_rate': 7.102070727842847e-07, 'epoch': 1.77} {'loss': 0.2107, 'learning_rate': 7.100827220479433e-07, 'epoch': 1.77} {'loss': 0.2551, 'learning_rate': 7.099583817981493e-07, 'epoch': 1.77} {'loss': 0.3315, 'learning_rate': 7.098340520350477e-07, 'epoch': 1.77} {'loss': 0.2123, 'learning_rate': 7.097097327587754e-07, 'epoch': 1.77} {'loss': 0.3914, 'learning_rate': 7.095854239694755e-07, 'epoch': 1.77} {'loss': 0.2059, 'learning_rate': 7.094611256672879e-07, 'epoch': 1.77} {'loss': 0.3452, 'learning_rate': 7.093368378523491e-07, 'epoch': 1.77} {'loss': 0.2476, 'learning_rate': 7.092125605248046e-07, 'epoch': 1.77} {'loss': 0.406, 'learning_rate': 7.090882936847909e-07, 'epoch': 1.77} {'loss': 0.3023, 'learning_rate': 7.089640373324513e-07, 'epoch': 1.77} {'loss': 0.2851, 'learning_rate': 7.088397914679224e-07, 'epoch': 1.77} {'loss': 0.3503, 'learning_rate': 7.087155560913484e-07, 'epoch': 1.77} {'loss': 0.2723, 'learning_rate': 7.085913312028659e-07, 'epoch': 1.77} {'loss': 0.2747, 'learning_rate': 7.084671168026191e-07, 'epoch': 1.77} {'loss': 0.2471, 'learning_rate': 7.083429128907449e-07, 'epoch': 1.77} {'loss': 0.316, 'learning_rate': 7.08218719467385e-07, 'epoch': 1.77} {'loss': 0.4541, 'learning_rate': 7.080945365326786e-07, 'epoch': 1.77} {'loss': 0.3391, 'learning_rate': 7.079703640867674e-07, 'epoch': 1.77} {'loss': 0.2332, 'learning_rate': 7.078462021297894e-07, 'epoch': 1.77} {'loss': 0.3545, 'learning_rate': 7.077220506618864e-07, 'epoch': 1.77} {'loss': 0.3603, 'learning_rate': 7.075979096831998e-07, 'epoch': 1.77} {'loss': 0.3575, 'learning_rate': 7.074737791938657e-07, 'epoch': 1.77} {'loss': 0.3129, 'learning_rate': 7.073496591940299e-07, 'epoch': 1.77} {'loss': 0.4537, 'learning_rate': 7.072255496838265e-07, 'epoch': 1.77} {'loss': 0.2752, 'learning_rate': 7.071014506634e-07, 'epoch': 1.77} {'loss': 0.3305, 'learning_rate': 7.069773621328868e-07, 'epoch': 1.77} {'loss': 0.2871, 'learning_rate': 7.068532840924314e-07, 'epoch': 1.77} {'loss': 0.4232, 'learning_rate': 7.067292165421713e-07, 'epoch': 1.77} {'loss': 0.3417, 'learning_rate': 7.066051594822442e-07, 'epoch': 1.77} {'loss': 0.2049, 'learning_rate': 7.064811129127958e-07, 'epoch': 1.77} {'loss': 0.4187, 'learning_rate': 7.0635707683396e-07, 'epoch': 1.77} {'loss': 0.3141, 'learning_rate': 7.062330512458826e-07, 'epoch': 1.77} {'loss': 0.429, 'learning_rate': 7.061090361486988e-07, 'epoch': 1.77} {'loss': 0.3547, 'learning_rate': 7.05985031542552e-07, 'epoch': 1.77} {'loss': 0.2181, 'learning_rate': 7.058610374275787e-07, 'epoch': 1.77} {'loss': 0.1671, 'learning_rate': 7.057370538039232e-07, 'epoch': 1.77} {'loss': 0.3351, 'learning_rate': 7.056130806717209e-07, 'epoch': 1.77} {'loss': 0.2162, 'learning_rate': 7.054891180311163e-07, 'epoch': 1.77} {'loss': 0.2832, 'learning_rate': 7.053651658822458e-07, 'epoch': 1.77} {'loss': 0.394, 'learning_rate': 7.052412242252516e-07, 'epoch': 1.77} {'loss': 0.2668, 'learning_rate': 7.051172930602723e-07, 'epoch': 1.77} {'loss': 0.3109, 'learning_rate': 7.04993372387447e-07, 'epoch': 1.77} {'loss': 0.3504, 'learning_rate': 7.048694622069174e-07, 'epoch': 1.77} {'loss': 0.2169, 'learning_rate': 7.047455625188216e-07, 'epoch': 1.77} {'loss': 0.2411, 'learning_rate': 7.046216733233025e-07, 'epoch': 1.77} {'loss': 0.1756, 'learning_rate': 7.044977946204956e-07, 'epoch': 1.77} {'loss': 0.3303, 'learning_rate': 7.043739264105454e-07, 'epoch': 1.77} {'loss': 0.2914, 'learning_rate': 7.042500686935871e-07, 'epoch': 1.77} {'loss': 0.1924, 'learning_rate': 7.041262214697653e-07, 'epoch': 1.77} {'loss': 0.3545, 'learning_rate': 7.040023847392152e-07, 'epoch': 1.77} {'loss': 0.3854, 'learning_rate': 7.038785585020802e-07, 'epoch': 1.77} {'loss': 0.2586, 'learning_rate': 7.037547427584967e-07, 'epoch': 1.77} {'loss': 0.3393, 'learning_rate': 7.036309375086082e-07, 'epoch': 1.77} {'loss': 0.3124, 'learning_rate': 7.035071427525531e-07, 'epoch': 1.77} {'loss': 0.3035, 'learning_rate': 7.033833584904682e-07, 'epoch': 1.77} {'loss': 0.2498, 'learning_rate': 7.032595847224976e-07, 'epoch': 1.77} {'loss': 0.3376, 'learning_rate': 7.031358214487771e-07, 'epoch': 1.77} {'loss': 0.2156, 'learning_rate': 7.030120686694508e-07, 'epoch': 1.77} {'loss': 0.3567, 'learning_rate': 7.028883263846531e-07, 'epoch': 1.77} {'loss': 0.2267, 'learning_rate': 7.027645945945294e-07, 'epoch': 1.77} {'loss': 0.289, 'learning_rate': 7.026408732992141e-07, 'epoch': 1.77} {'loss': 0.2903, 'learning_rate': 7.025171624988514e-07, 'epoch': 1.77} {'loss': 0.282, 'learning_rate': 7.02393462193578e-07, 'epoch': 1.77} {'loss': 0.2849, 'learning_rate': 7.022697723835348e-07, 'epoch': 1.77} {'loss': 0.1836, 'learning_rate': 7.021460930688595e-07, 'epoch': 1.77} {'loss': 0.4245, 'learning_rate': 7.020224242496942e-07, 'epoch': 1.77} {'loss': 0.3152, 'learning_rate': 7.018987659261789e-07, 'epoch': 1.77} {'loss': 0.2001, 'learning_rate': 7.017751180984489e-07, 'epoch': 1.77} {'loss': 0.1811, 'learning_rate': 7.016514807666497e-07, 'epoch': 1.77} {'loss': 0.1679, 'learning_rate': 7.015278539309145e-07, 'epoch': 1.77} {'loss': 0.4311, 'learning_rate': 7.014042375913888e-07, 'epoch': 1.77} {'loss': 0.2979, 'learning_rate': 7.012806317482079e-07, 'epoch': 1.77} {'loss': 0.3149, 'learning_rate': 7.011570364015141e-07, 'epoch': 1.77} {'loss': 0.4669, 'learning_rate': 7.01033451551445e-07, 'epoch': 1.77} {'loss': 0.3011, 'learning_rate': 7.009098771981415e-07, 'epoch': 1.77} {'loss': 0.2592, 'learning_rate': 7.007863133417414e-07, 'epoch': 1.77} {'loss': 0.2471, 'learning_rate': 7.006627599823867e-07, 'epoch': 1.77} {'loss': 0.3008, 'learning_rate': 7.005392171202142e-07, 'epoch': 1.77} {'loss': 0.3671, 'learning_rate': 7.004156847553656e-07, 'epoch': 1.77} {'loss': 0.4618, 'learning_rate': 7.002921628879789e-07, 'epoch': 1.77} {'loss': 0.2707, 'learning_rate': 7.001686515181927e-07, 'epoch': 1.77} {'loss': 0.2063, 'learning_rate': 7.000451506461504e-07, 'epoch': 1.77} {'loss': 0.2482, 'learning_rate': 6.999216602719849e-07, 'epoch': 1.77} {'loss': 0.3347, 'learning_rate': 6.997981803958431e-07, 'epoch': 1.77} {'loss': 0.1764, 'learning_rate': 6.99674711017857e-07, 'epoch': 1.77} {'loss': 0.2657, 'learning_rate': 6.995512521381731e-07, 'epoch': 1.77} {'loss': 0.1072, 'learning_rate': 6.994278037569246e-07, 'epoch': 1.77} {'loss': 0.3907, 'learning_rate': 6.993043658742549e-07, 'epoch': 1.77} {'loss': 0.267, 'learning_rate': 6.991809384903014e-07, 'epoch': 1.77} {'loss': 0.3077, 'learning_rate': 6.990575216052043e-07, 'epoch': 1.77} {'loss': 0.3695, 'learning_rate': 6.989341152191021e-07, 'epoch': 1.77} {'loss': 0.4399, 'learning_rate': 6.988107193321358e-07, 'epoch': 1.77} {'loss': 0.3057, 'learning_rate': 6.986873339444433e-07, 'epoch': 1.77} {'loss': 0.2634, 'learning_rate': 6.985639590561633e-07, 'epoch': 1.77} {'loss': 0.3609, 'learning_rate': 6.984405946674366e-07, 'epoch': 1.77} {'loss': 0.2558, 'learning_rate': 6.983172407784e-07, 'epoch': 1.77} {'loss': 0.3367, 'learning_rate': 6.981938973891966e-07, 'epoch': 1.77} {'loss': 0.3853, 'learning_rate': 6.980705644999619e-07, 'epoch': 1.77} {'loss': 0.3115, 'learning_rate': 6.979472421108379e-07, 'epoch': 1.77} {'loss': 0.4382, 'learning_rate': 6.978239302219602e-07, 'epoch': 1.77} {'loss': 0.3687, 'learning_rate': 6.977006288334731e-07, 'epoch': 1.77} {'loss': 0.2351, 'learning_rate': 6.97577337945512e-07, 'epoch': 1.77} {'loss': 0.233, 'learning_rate': 6.974540575582178e-07, 'epoch': 1.77} {'loss': 0.4875, 'learning_rate': 6.973307876717273e-07, 'epoch': 1.77} {'loss': 0.3623, 'learning_rate': 6.972075282861834e-07, 'epoch': 1.77} {'loss': 0.2683, 'learning_rate': 6.97084279401723e-07, 'epoch': 1.77} {'loss': 0.4135, 'learning_rate': 6.969610410184835e-07, 'epoch': 1.77} {'loss': 0.0714, 'learning_rate': 6.968378131366083e-07, 'epoch': 1.77} {'loss': 0.3177, 'learning_rate': 6.967145957562326e-07, 'epoch': 1.77} {'loss': 0.3287, 'learning_rate': 6.965913888774978e-07, 'epoch': 1.77} {'loss': 0.4005, 'learning_rate': 6.964681925005413e-07, 'epoch': 1.77} {'loss': 0.2248, 'learning_rate': 6.96345006625504e-07, 'epoch': 1.77} {'loss': 0.365, 'learning_rate': 6.962218312525226e-07, 'epoch': 1.77} {'loss': 0.1342, 'learning_rate': 6.960986663817392e-07, 'epoch': 1.77} {'loss': 0.4348, 'learning_rate': 6.959755120132894e-07, 'epoch': 1.77} {'loss': 0.3982, 'learning_rate': 6.958523681473162e-07, 'epoch': 1.77} {'loss': 0.2854, 'learning_rate': 6.957292347839551e-07, 'epoch': 1.77} {'loss': 0.3193, 'learning_rate': 6.95606111923346e-07, 'epoch': 1.77} {'loss': 0.2958, 'learning_rate': 6.954829995656287e-07, 'epoch': 1.77} {'loss': 0.3924, 'learning_rate': 6.953598977109421e-07, 'epoch': 1.77} {'loss': 0.3126, 'learning_rate': 6.95236806359425e-07, 'epoch': 1.77} {'loss': 0.3648, 'learning_rate': 6.95113725511215e-07, 'epoch': 1.77} {'loss': 0.2596, 'learning_rate': 6.949906551664543e-07, 'epoch': 1.77} {'loss': 0.2804, 'learning_rate': 6.94867595325277e-07, 'epoch': 1.77} {'loss': 0.2868, 'learning_rate': 6.947445459878277e-07, 'epoch': 1.77} {'loss': 0.3321, 'learning_rate': 6.946215071542417e-07, 'epoch': 1.77} {'loss': 0.3415, 'learning_rate': 6.944984788246567e-07, 'epoch': 1.77} {'loss': 0.3766, 'learning_rate': 6.943754609992148e-07, 'epoch': 1.77} {'loss': 0.3889, 'learning_rate': 6.942524536780526e-07, 'epoch': 1.77} {'loss': 0.2162, 'learning_rate': 6.94129456861311e-07, 'epoch': 1.77} {'loss': 0.2093, 'learning_rate': 6.940064705491256e-07, 'epoch': 1.77} {'loss': 0.254, 'learning_rate': 6.938834947416395e-07, 'epoch': 1.77} {'loss': 0.389, 'learning_rate': 6.937605294389871e-07, 'epoch': 1.77} {'loss': 0.331, 'learning_rate': 6.936375746413116e-07, 'epoch': 1.77} {'loss': 0.3085, 'learning_rate': 6.935146303487484e-07, 'epoch': 1.77} {'loss': 0.3138, 'learning_rate': 6.933916965614385e-07, 'epoch': 1.77} {'loss': 0.1851, 'learning_rate': 6.932687732795174e-07, 'epoch': 1.77} {'loss': 0.2611, 'learning_rate': 6.931458605031283e-07, 'epoch': 1.77} {'loss': 0.2078, 'learning_rate': 6.930229582324078e-07, 'epoch': 1.77} {'loss': 0.2405, 'learning_rate': 6.929000664674935e-07, 'epoch': 1.77} {'loss': 0.4227, 'learning_rate': 6.927771852085264e-07, 'epoch': 1.77} {'loss': 0.3361, 'learning_rate': 6.926543144556419e-07, 'epoch': 1.77} {'loss': 0.4429, 'learning_rate': 6.925314542089834e-07, 'epoch': 1.77} {'loss': 0.3949, 'learning_rate': 6.92408604468684e-07, 'epoch': 1.77} {'loss': 0.4287, 'learning_rate': 6.92285765234888e-07, 'epoch': 1.77} {'loss': 0.4066, 'learning_rate': 6.921629365077298e-07, 'epoch': 1.77} {'loss': 0.4376, 'learning_rate': 6.920401182873504e-07, 'epoch': 1.77} {'loss': 0.2194, 'learning_rate': 6.919173105738875e-07, 'epoch': 1.77} {'loss': 0.3328, 'learning_rate': 6.917945133674808e-07, 'epoch': 1.77} {'loss': 0.437, 'learning_rate': 6.91671726668266e-07, 'epoch': 1.77} {'loss': 0.1384, 'learning_rate': 6.915489504763861e-07, 'epoch': 1.77} {'loss': 0.3676, 'learning_rate': 6.914261847919767e-07, 'epoch': 1.77} {'loss': 0.4978, 'learning_rate': 6.913034296151755e-07, 'epoch': 1.77} {'loss': 0.2844, 'learning_rate': 6.911806849461244e-07, 'epoch': 1.77} {'loss': 0.3444, 'learning_rate': 6.910579507849591e-07, 'epoch': 1.77} {'loss': 0.2573, 'learning_rate': 6.909352271318204e-07, 'epoch': 1.77} {'loss': 0.2943, 'learning_rate': 6.908125139868438e-07, 'epoch': 1.77} {'loss': 0.2337, 'learning_rate': 6.906898113501715e-07, 'epoch': 1.77} {'loss': 0.4898, 'learning_rate': 6.905671192219388e-07, 'epoch': 1.77} {'loss': 0.4616, 'learning_rate': 6.904444376022867e-07, 'epoch': 1.77} {'loss': 0.3391, 'learning_rate': 6.903217664913508e-07, 'epoch': 1.77} {'loss': 0.4074, 'learning_rate': 6.901991058892732e-07, 'epoch': 1.77} {'loss': 0.4044, 'learning_rate': 6.900764557961892e-07, 'epoch': 1.77} {'loss': 0.2918, 'learning_rate': 6.899538162122399e-07, 'epoch': 1.77} {'loss': 0.3208, 'learning_rate': 6.898311871375607e-07, 'epoch': 1.77} {'loss': 0.2483, 'learning_rate': 6.897085685722926e-07, 'epoch': 1.77} {'loss': 0.362, 'learning_rate': 6.895859605165744e-07, 'epoch': 1.77} {'loss': 0.3346, 'learning_rate': 6.894633629705405e-07, 'epoch': 1.77} {'loss': 0.2635, 'learning_rate': 6.89340775934334e-07, 'epoch': 1.77} {'loss': 0.3479, 'learning_rate': 6.892181994080893e-07, 'epoch': 1.77} {'loss': 0.2688, 'learning_rate': 6.890956333919496e-07, 'epoch': 1.77} {'loss': 0.3648, 'learning_rate': 6.88973077886047e-07, 'epoch': 1.77} {'loss': 0.3584, 'learning_rate': 6.88850532890526e-07, 'epoch': 1.77} {'loss': 0.4205, 'learning_rate': 6.887279984055206e-07, 'epoch': 1.77} {'loss': 0.3434, 'learning_rate': 6.88605474431171e-07, 'epoch': 1.77} {'loss': 0.241, 'learning_rate': 6.884829609676147e-07, 'epoch': 1.77} {'loss': 0.4083, 'learning_rate': 6.883604580149916e-07, 'epoch': 1.77} {'loss': 0.2061, 'learning_rate': 6.882379655734383e-07, 'epoch': 1.77} {'loss': 0.3974, 'learning_rate': 6.881154836430936e-07, 'epoch': 1.77} {'loss': 0.3462, 'learning_rate': 6.879930122240975e-07, 'epoch': 1.77} {'loss': 0.3083, 'learning_rate': 6.87870551316584e-07, 'epoch': 1.77} {'loss': 0.2295, 'learning_rate': 6.877481009206955e-07, 'epoch': 1.77} {'loss': 0.1478, 'learning_rate': 6.876256610365661e-07, 'epoch': 1.77} {'loss': 0.3332, 'learning_rate': 6.875032316643393e-07, 'epoch': 1.77} {'loss': 0.2935, 'learning_rate': 6.873808128041493e-07, 'epoch': 1.77} {'loss': 0.4161, 'learning_rate': 6.872584044561359e-07, 'epoch': 1.77} {'loss': 0.3241, 'learning_rate': 6.871360066204358e-07, 'epoch': 1.77} {'loss': 0.2674, 'learning_rate': 6.870136192971899e-07, 'epoch': 1.77} {'loss': 0.2763, 'learning_rate': 6.868912424865326e-07, 'epoch': 1.77} {'loss': 0.3522, 'learning_rate': 6.86768876188606e-07, 'epoch': 1.77} {'loss': 0.1974, 'learning_rate': 6.866465204035444e-07, 'epoch': 1.77} {'loss': 0.3637, 'learning_rate': 6.865241751314899e-07, 'epoch': 1.77} {'loss': 0.2985, 'learning_rate': 6.864018403725792e-07, 'epoch': 1.77} {'loss': 0.2397, 'learning_rate': 6.862795161269475e-07, 'epoch': 1.77} {'loss': 0.2009, 'learning_rate': 6.861572023947361e-07, 'epoch': 1.77} {'loss': 0.2995, 'learning_rate': 6.860348991760813e-07, 'epoch': 1.77} {'loss': 0.2311, 'learning_rate': 6.859126064711241e-07, 'epoch': 1.77} {'loss': 0.2791, 'learning_rate': 6.857903242799979e-07, 'epoch': 1.77} {'loss': 0.4728, 'learning_rate': 6.856680526028448e-07, 'epoch': 1.77} {'loss': 0.314, 'learning_rate': 6.855457914398001e-07, 'epoch': 1.77} {'loss': 0.4137, 'learning_rate': 6.854235407910048e-07, 'epoch': 1.77} {'loss': 0.2903, 'learning_rate': 6.853013006565923e-07, 'epoch': 1.77} {'loss': 0.3332, 'learning_rate': 6.851790710367057e-07, 'epoch': 1.77} {'loss': 0.4288, 'learning_rate': 6.850568519314793e-07, 'epoch': 1.77} {'loss': 0.2164, 'learning_rate': 6.849346433410542e-07, 'epoch': 1.77} {'loss': 0.2197, 'learning_rate': 6.848124452655658e-07, 'epoch': 1.77} {'loss': 0.3147, 'learning_rate': 6.846902577051518e-07, 'epoch': 1.77} {'loss': 0.3059, 'learning_rate': 6.84568080659952e-07, 'epoch': 1.77} {'loss': 0.2273, 'learning_rate': 6.844459141301019e-07, 'epoch': 1.77} {'loss': 0.2606, 'learning_rate': 6.843237581157436e-07, 'epoch': 1.77} {'loss': 0.346, 'learning_rate': 6.842016126170093e-07, 'epoch': 1.77} {'loss': 0.3125, 'learning_rate': 6.840794776340432e-07, 'epoch': 1.77} {'loss': 0.3251, 'learning_rate': 6.839573531669763e-07, 'epoch': 1.77} {'loss': 0.3177, 'learning_rate': 6.838352392159531e-07, 'epoch': 1.77} {'loss': 0.1983, 'learning_rate': 6.837131357811055e-07, 'epoch': 1.77} {'loss': 0.2238, 'learning_rate': 6.83591042862577e-07, 'epoch': 1.77} {'loss': 0.4197, 'learning_rate': 6.834689604605005e-07, 'epoch': 1.77} {'loss': 0.3419, 'learning_rate': 6.833468885750161e-07, 'epoch': 1.77} {'loss': 0.3631, 'learning_rate': 6.832248272062625e-07, 'epoch': 1.77} {'loss': 0.356, 'learning_rate': 6.831027763543752e-07, 'epoch': 1.77} {'loss': 0.3573, 'learning_rate': 6.829807360194951e-07, 'epoch': 1.77} {'loss': 0.5036, 'learning_rate': 6.828587062017567e-07, 'epoch': 1.77} {'loss': 0.3509, 'learning_rate': 6.827366869012997e-07, 'epoch': 1.77} {'loss': 0.4718, 'learning_rate': 6.826146781182597e-07, 'epoch': 1.77} {'loss': 0.2854, 'learning_rate': 6.824926798527786e-07, 'epoch': 1.77} {'loss': 0.3027, 'learning_rate': 6.8237069210499e-07, 'epoch': 1.77} {'loss': 0.1972, 'learning_rate': 6.822487148750323e-07, 'epoch': 1.77} {'loss': 0.3502, 'learning_rate': 6.821267481630456e-07, 'epoch': 1.77} {'loss': 0.2916, 'learning_rate': 6.820047919691641e-07, 'epoch': 1.77} {'loss': 0.373, 'learning_rate': 6.81882846293529e-07, 'epoch': 1.77} {'loss': 0.2973, 'learning_rate': 6.817609111362744e-07, 'epoch': 1.77} {'loss': 0.1961, 'learning_rate': 6.816389864975415e-07, 'epoch': 1.77} {'loss': 0.3213, 'learning_rate': 6.815170723774656e-07, 'epoch': 1.77} {'loss': 0.2919, 'learning_rate': 6.813951687761855e-07, 'epoch': 1.77} {'loss': 0.5469, 'learning_rate': 6.812732756938367e-07, 'epoch': 1.77} {'loss': 0.3209, 'learning_rate': 6.811513931305602e-07, 'epoch': 1.77} {'loss': 0.1842, 'learning_rate': 6.810295210864892e-07, 'epoch': 1.77} {'loss': 0.3979, 'learning_rate': 6.809076595617659e-07, 'epoch': 1.77} {'loss': 0.3138, 'learning_rate': 6.807858085565267e-07, 'epoch': 1.77} {'loss': 0.2539, 'learning_rate': 6.806639680709059e-07, 'epoch': 1.77} {'loss': 0.2873, 'learning_rate': 6.805421381050447e-07, 'epoch': 1.77} {'loss': 0.3585, 'learning_rate': 6.804203186590774e-07, 'epoch': 1.77} {'loss': 0.1813, 'learning_rate': 6.80298509733146e-07, 'epoch': 1.77} {'loss': 0.2003, 'learning_rate': 6.801767113273828e-07, 'epoch': 1.77} {'loss': 0.3702, 'learning_rate': 6.800549234419296e-07, 'epoch': 1.77} {'loss': 0.3285, 'learning_rate': 6.79933146076921e-07, 'epoch': 1.77} {'loss': 0.2677, 'learning_rate': 6.798113792324967e-07, 'epoch': 1.77} {'loss': 0.2929, 'learning_rate': 6.796896229087923e-07, 'epoch': 1.77} {'loss': 0.3164, 'learning_rate': 6.795678771059466e-07, 'epoch': 1.77} {'loss': 0.3746, 'learning_rate': 6.79446141824095e-07, 'epoch': 1.77} {'loss': 0.2918, 'learning_rate': 6.793244170633783e-07, 'epoch': 1.77} {'loss': 0.3525, 'learning_rate': 6.792027028239312e-07, 'epoch': 1.77} {'loss': 0.4437, 'learning_rate': 6.790809991058911e-07, 'epoch': 1.77} {'loss': 0.3716, 'learning_rate': 6.789593059093969e-07, 'epoch': 1.77} {'loss': 0.3947, 'learning_rate': 6.788376232345839e-07, 'epoch': 1.77} {'loss': 0.3842, 'learning_rate': 6.787159510815922e-07, 'epoch': 1.77} {'loss': 0.3267, 'learning_rate': 6.78594289450557e-07, 'epoch': 1.77} {'loss': 0.2503, 'learning_rate': 6.784726383416174e-07, 'epoch': 1.77} {'loss': 0.3366, 'learning_rate': 6.783509977549075e-07, 'epoch': 1.77} {'loss': 0.2124, 'learning_rate': 6.782293676905682e-07, 'epoch': 1.77} {'loss': 0.3979, 'learning_rate': 6.781077481487342e-07, 'epoch': 1.77} {'loss': 0.2881, 'learning_rate': 6.77986139129545e-07, 'epoch': 1.77} {'loss': 0.2544, 'learning_rate': 6.778645406331363e-07, 'epoch': 1.77} {'loss': 0.3242, 'learning_rate': 6.777429526596469e-07, 'epoch': 1.77} {'loss': 0.2686, 'learning_rate': 6.776213752092131e-07, 'epoch': 1.77} {'loss': 0.3376, 'learning_rate': 6.774998082819694e-07, 'epoch': 1.77} {'loss': 0.4571, 'learning_rate': 6.77378251878058e-07, 'epoch': 1.77} {'loss': 0.1844, 'learning_rate': 6.772567059976132e-07, 'epoch': 1.77} {'loss': 0.3635, 'learning_rate': 6.771351706407725e-07, 'epoch': 1.77} {'loss': 0.2603, 'learning_rate': 6.770136458076726e-07, 'epoch': 1.77} {'loss': 0.1624, 'learning_rate': 6.768921314984533e-07, 'epoch': 1.77} {'loss': 0.2656, 'learning_rate': 6.76770627713248e-07, 'epoch': 1.77} {'loss': 0.3103, 'learning_rate': 6.766491344521975e-07, 'epoch': 1.77} {'loss': 0.317, 'learning_rate': 6.765276517154363e-07, 'epoch': 1.77} {'loss': 0.3131, 'learning_rate': 6.764061795031029e-07, 'epoch': 1.77} {'loss': 0.3042, 'learning_rate': 6.762847178153331e-07, 'epoch': 1.77} {'loss': 0.2443, 'learning_rate': 6.761632666522666e-07, 'epoch': 1.77} {'loss': 0.2904, 'learning_rate': 6.760418260140377e-07, 'epoch': 1.77} {'loss': 0.2839, 'learning_rate': 6.759203959007843e-07, 'epoch': 1.77} {'loss': 0.2134, 'learning_rate': 6.757989763126438e-07, 'epoch': 1.77} {'loss': 0.2729, 'learning_rate': 6.756775672497528e-07, 'epoch': 1.77} {'loss': 0.4443, 'learning_rate': 6.755561687122503e-07, 'epoch': 1.77} {'loss': 0.2982, 'learning_rate': 6.754347807002692e-07, 'epoch': 1.77} {'loss': 0.2548, 'learning_rate': 6.753134032139519e-07, 'epoch': 1.77} {'loss': 0.23, 'learning_rate': 6.751920362534304e-07, 'epoch': 1.77} {'loss': 0.2875, 'learning_rate': 6.750706798188455e-07, 'epoch': 1.77} {'loss': 0.3372, 'learning_rate': 6.749493339103308e-07, 'epoch': 1.77} {'loss': 0.2094, 'learning_rate': 6.74827998528027e-07, 'epoch': 1.77} {'loss': 0.217, 'learning_rate': 6.747066736720665e-07, 'epoch': 1.77} {'loss': 0.3052, 'learning_rate': 6.745853593425922e-07, 'epoch': 1.77} {'loss': 0.2495, 'learning_rate': 6.744640555397364e-07, 'epoch': 1.77} {'loss': 0.4555, 'learning_rate': 6.743427622636367e-07, 'epoch': 1.77} {'loss': 0.3601, 'learning_rate': 6.742214795144309e-07, 'epoch': 1.77} {'loss': 0.3208, 'learning_rate': 6.741002072922553e-07, 'epoch': 1.77} {'loss': 0.3121, 'learning_rate': 6.73978945597249e-07, 'epoch': 1.77} {'loss': 0.4202, 'learning_rate': 6.738576944295438e-07, 'epoch': 1.77} {'loss': 0.2934, 'learning_rate': 6.737364537892832e-07, 'epoch': 1.77} {'loss': 0.439, 'learning_rate': 6.73615223676598e-07, 'epoch': 1.77} {'loss': 0.322, 'learning_rate': 6.734940040916293e-07, 'epoch': 1.77} {'loss': 0.1789, 'learning_rate': 6.733727950345115e-07, 'epoch': 1.77} {'loss': 0.3383, 'learning_rate': 6.732515965053832e-07, 'epoch': 1.77} {'loss': 0.414, 'learning_rate': 6.731304085043788e-07, 'epoch': 1.77} {'loss': 0.3175, 'learning_rate': 6.730092310316394e-07, 'epoch': 1.77} {'loss': 0.3434, 'learning_rate': 6.72888064087297e-07, 'epoch': 1.77} {'loss': 0.3731, 'learning_rate': 6.727669076714904e-07, 'epoch': 1.77} {'loss': 0.2679, 'learning_rate': 6.726457617843574e-07, 'epoch': 1.77} {'loss': 0.4113, 'learning_rate': 6.72524626426031e-07, 'epoch': 1.77} {'loss': 0.2785, 'learning_rate': 6.724035015966535e-07, 'epoch': 1.77} {'loss': 0.3057, 'learning_rate': 6.722823872963569e-07, 'epoch': 1.77} {'loss': 0.3161, 'learning_rate': 6.721612835252811e-07, 'epoch': 1.77} {'loss': 0.3115, 'learning_rate': 6.720401902835594e-07, 'epoch': 1.77} {'loss': 0.3579, 'learning_rate': 6.719191075713328e-07, 'epoch': 1.77} {'loss': 0.2552, 'learning_rate': 6.717980353887332e-07, 'epoch': 1.77} {'loss': 0.3246, 'learning_rate': 6.716769737359019e-07, 'epoch': 1.77} {'loss': 0.3121, 'learning_rate': 6.71555922612972e-07, 'epoch': 1.77} {'loss': 0.3771, 'learning_rate': 6.714348820200833e-07, 'epoch': 1.77} {'loss': 0.4257, 'learning_rate': 6.713138519573692e-07, 'epoch': 1.77} {'loss': 0.2813, 'learning_rate': 6.711928324249672e-07, 'epoch': 1.77} {'loss': 0.1905, 'learning_rate': 6.710718234230173e-07, 'epoch': 1.77} {'loss': 0.2721, 'learning_rate': 6.709508249516505e-07, 'epoch': 1.77} {'loss': 0.2645, 'learning_rate': 6.708298370110089e-07, 'epoch': 1.77} {'loss': 0.2413, 'learning_rate': 6.707088596012235e-07, 'epoch': 1.77} {'loss': 0.3254, 'learning_rate': 6.705878927224363e-07, 'epoch': 1.77} {'loss': 0.2514, 'learning_rate': 6.704669363747796e-07, 'epoch': 1.77} {'loss': 0.3112, 'learning_rate': 6.703459905583932e-07, 'epoch': 1.77} {'loss': 0.3151, 'learning_rate': 6.702250552734113e-07, 'epoch': 1.77} {'loss': 0.2597, 'learning_rate': 6.701041305199707e-07, 'epoch': 1.77} {'loss': 0.2817, 'learning_rate': 6.69983216298209e-07, 'epoch': 1.77} {'loss': 0.3797, 'learning_rate': 6.698623126082615e-07, 'epoch': 1.77} {'loss': 0.2581, 'learning_rate': 6.69741419450266e-07, 'epoch': 1.77} {'loss': 0.2855, 'learning_rate': 6.696205368243569e-07, 'epoch': 1.77} {'loss': 0.351, 'learning_rate': 6.69499664730674e-07, 'epoch': 1.77} {'loss': 0.5443, 'learning_rate': 6.693788031693493e-07, 'epoch': 1.77} {'loss': 0.2019, 'learning_rate': 6.692579521405241e-07, 'epoch': 1.77} {'loss': 0.2888, 'learning_rate': 6.691371116443302e-07, 'epoch': 1.77} {'loss': 0.2954, 'learning_rate': 6.690162816809076e-07, 'epoch': 1.77} {'loss': 0.3221, 'learning_rate': 6.688954622503896e-07, 'epoch': 1.77} {'loss': 0.2235, 'learning_rate': 6.68774653352916e-07, 'epoch': 1.77} {'loss': 0.2294, 'learning_rate': 6.686538549886212e-07, 'epoch': 1.77} {'loss': 0.281, 'learning_rate': 6.685330671576407e-07, 'epoch': 1.77} {'loss': 0.3076, 'learning_rate': 6.684122898601131e-07, 'epoch': 1.77} {'loss': 0.2947, 'learning_rate': 6.682915230961728e-07, 'epoch': 1.77} {'loss': 0.2268, 'learning_rate': 6.681707668659576e-07, 'epoch': 1.77} {'loss': 0.4012, 'learning_rate': 6.680500211696017e-07, 'epoch': 1.77} {'loss': 0.2904, 'learning_rate': 6.67929286007244e-07, 'epoch': 1.77} {'loss': 0.2415, 'learning_rate': 6.678085613790186e-07, 'epoch': 1.77} {'loss': 0.3754, 'learning_rate': 6.676878472850634e-07, 'epoch': 1.77} {'loss': 0.3389, 'learning_rate': 6.675671437255138e-07, 'epoch': 1.77} {'loss': 0.4235, 'learning_rate': 6.674464507005063e-07, 'epoch': 1.77} {'loss': 0.2828, 'learning_rate': 6.673257682101763e-07, 'epoch': 1.77} {'loss': 0.2136, 'learning_rate': 6.672050962546628e-07, 'epoch': 1.77} {'loss': 0.2792, 'learning_rate': 6.670844348340999e-07, 'epoch': 1.77} {'loss': 0.1607, 'learning_rate': 6.66963783948622e-07, 'epoch': 1.77} {'loss': 0.3035, 'learning_rate': 6.66843143598368e-07, 'epoch': 1.77} {'loss': 0.3123, 'learning_rate': 6.667225137834732e-07, 'epoch': 1.77} {'loss': 0.2672, 'learning_rate': 6.666018945040742e-07, 'epoch': 1.77} {'loss': 0.3638, 'learning_rate': 6.664812857603065e-07, 'epoch': 1.77} {'loss': 0.265, 'learning_rate': 6.663606875523076e-07, 'epoch': 1.77} {'loss': 0.237, 'learning_rate': 6.66240099880211e-07, 'epoch': 1.77} {'loss': 0.32, 'learning_rate': 6.661195227441564e-07, 'epoch': 1.77} {'loss': 0.4067, 'learning_rate': 6.65998956144276e-07, 'epoch': 1.77} {'loss': 0.2397, 'learning_rate': 6.658784000807083e-07, 'epoch': 1.77} {'loss': 0.3223, 'learning_rate': 6.657578545535892e-07, 'epoch': 1.77} {'loss': 0.2149, 'learning_rate': 6.65637319563055e-07, 'epoch': 1.77} {'loss': 0.2573, 'learning_rate': 6.655167951092412e-07, 'epoch': 1.77} {'loss': 0.3695, 'learning_rate': 6.653962811922831e-07, 'epoch': 1.77} {'loss': 0.4509, 'learning_rate': 6.652757778123187e-07, 'epoch': 1.77} {'loss': 0.3718, 'learning_rate': 6.651552849694809e-07, 'epoch': 1.77} {'loss': 0.1717, 'learning_rate': 6.650348026639097e-07, 'epoch': 1.77} {'loss': 0.3475, 'learning_rate': 6.649143308957373e-07, 'epoch': 1.77} {'loss': 0.3242, 'learning_rate': 6.647938696651035e-07, 'epoch': 1.77} {'loss': 0.2997, 'learning_rate': 6.646734189721404e-07, 'epoch': 1.77} {'loss': 0.2922, 'learning_rate': 6.645529788169868e-07, 'epoch': 1.77} {'loss': 0.3755, 'learning_rate': 6.644325491997771e-07, 'epoch': 1.77} {'loss': 0.266, 'learning_rate': 6.64312130120649e-07, 'epoch': 1.77} {'loss': 0.2798, 'learning_rate': 6.641917215797356e-07, 'epoch': 1.77} {'loss': 0.3682, 'learning_rate': 6.640713235771767e-07, 'epoch': 1.77} {'loss': 0.1908, 'learning_rate': 6.639509361131046e-07, 'epoch': 1.77} {'loss': 0.1958, 'learning_rate': 6.638305591876559e-07, 'epoch': 1.77} {'loss': 0.2657, 'learning_rate': 6.637101928009681e-07, 'epoch': 1.77} {'loss': 0.3324, 'learning_rate': 6.635898369531757e-07, 'epoch': 1.77} {'loss': 0.2388, 'learning_rate': 6.634694916444151e-07, 'epoch': 1.77} {'loss': 0.3851, 'learning_rate': 6.633491568748219e-07, 'epoch': 1.77} {'loss': 0.3094, 'learning_rate': 6.632288326445324e-07, 'epoch': 1.77} {'loss': 0.2648, 'learning_rate': 6.631085189536812e-07, 'epoch': 1.77} {'loss': 0.5407, 'learning_rate': 6.629882158024059e-07, 'epoch': 1.77} {'loss': 0.3351, 'learning_rate': 6.628679231908408e-07, 'epoch': 1.77} {'loss': 0.2998, 'learning_rate': 6.627476411191236e-07, 'epoch': 1.77} {'loss': 0.3837, 'learning_rate': 6.626273695873864e-07, 'epoch': 1.77} {'loss': 0.2476, 'learning_rate': 6.625071085957691e-07, 'epoch': 1.77} {'loss': 0.3767, 'learning_rate': 6.62386858144406e-07, 'epoch': 1.77} {'loss': 0.339, 'learning_rate': 6.622666182334314e-07, 'epoch': 1.77} {'loss': 0.2604, 'learning_rate': 6.621463888629831e-07, 'epoch': 1.77} {'loss': 0.2896, 'learning_rate': 6.620261700331942e-07, 'epoch': 1.77} {'loss': 0.2694, 'learning_rate': 6.619059617442037e-07, 'epoch': 1.77} {'loss': 0.4061, 'learning_rate': 6.617857639961445e-07, 'epoch': 1.77} {'loss': 0.3093, 'learning_rate': 6.616655767891545e-07, 'epoch': 1.77} {'loss': 0.3897, 'learning_rate': 6.615454001233667e-07, 'epoch': 1.77} {'loss': 0.3392, 'learning_rate': 6.614252339989202e-07, 'epoch': 1.77} {'loss': 0.2695, 'learning_rate': 6.61305078415948e-07, 'epoch': 1.77} {'loss': 0.3573, 'learning_rate': 6.611849333745868e-07, 'epoch': 1.77} {'loss': 0.2817, 'learning_rate': 6.610647988749707e-07, 'epoch': 1.77} {'loss': 0.3106, 'learning_rate': 6.609446749172388e-07, 'epoch': 1.77} {'loss': 0.349, 'learning_rate': 6.608245615015241e-07, 'epoch': 1.77} {'loss': 0.4412, 'learning_rate': 6.60704458627961e-07, 'epoch': 1.77} {'loss': 0.2202, 'learning_rate': 6.605843662966871e-07, 'epoch': 1.77} {'loss': 0.1954, 'learning_rate': 6.604642845078368e-07, 'epoch': 1.77} {'loss': 0.2351, 'learning_rate': 6.603442132615478e-07, 'epoch': 1.77} {'loss': 0.2695, 'learning_rate': 6.602241525579534e-07, 'epoch': 1.77} {'loss': 0.4311, 'learning_rate': 6.60104102397191e-07, 'epoch': 1.77} {'loss': 0.4491, 'learning_rate': 6.59984062779393e-07, 'epoch': 1.77} {'loss': 0.3073, 'learning_rate': 6.598640337046991e-07, 'epoch': 1.77} {'loss': 0.3426, 'learning_rate': 6.597440151732404e-07, 'epoch': 1.77} {'loss': 0.2791, 'learning_rate': 6.596240071851556e-07, 'epoch': 1.77} {'loss': 0.2329, 'learning_rate': 6.595040097405792e-07, 'epoch': 1.77} {'loss': 0.3802, 'learning_rate': 6.593840228396453e-07, 'epoch': 1.77} {'loss': 0.289, 'learning_rate': 6.592640464824928e-07, 'epoch': 1.77} {'loss': 0.2689, 'learning_rate': 6.591440806692528e-07, 'epoch': 1.77} {'loss': 0.2909, 'learning_rate': 6.590241254000651e-07, 'epoch': 1.77} {'loss': 0.3244, 'learning_rate': 6.589041806750618e-07, 'epoch': 1.77} {'loss': 0.3118, 'learning_rate': 6.587842464943794e-07, 'epoch': 1.77} {'loss': 0.4357, 'learning_rate': 6.586643228581524e-07, 'epoch': 1.77} {'loss': 0.3403, 'learning_rate': 6.585444097665195e-07, 'epoch': 1.77} {'loss': 0.1489, 'learning_rate': 6.584245072196128e-07, 'epoch': 1.77} {'loss': 0.2606, 'learning_rate': 6.583046152175665e-07, 'epoch': 1.77} {'loss': 0.3016, 'learning_rate': 6.581847337605207e-07, 'epoch': 1.77} {'loss': 0.2665, 'learning_rate': 6.580648628486053e-07, 'epoch': 1.77} {'loss': 0.3102, 'learning_rate': 6.5794500248196e-07, 'epoch': 1.77} {'loss': 0.2197, 'learning_rate': 6.578251526607171e-07, 'epoch': 1.78} {'loss': 0.2991, 'learning_rate': 6.577053133850142e-07, 'epoch': 1.78} {'loss': 0.3609, 'learning_rate': 6.575854846549845e-07, 'epoch': 1.78} {'loss': 0.3496, 'learning_rate': 6.574656664707646e-07, 'epoch': 1.78} {'loss': 0.355, 'learning_rate': 6.573458588324888e-07, 'epoch': 1.78} {'loss': 0.2379, 'learning_rate': 6.572260617402947e-07, 'epoch': 1.78} {'loss': 0.1994, 'learning_rate': 6.571062751943136e-07, 'epoch': 1.78} {'loss': 0.2039, 'learning_rate': 6.569864991946851e-07, 'epoch': 1.78} {'loss': 0.4413, 'learning_rate': 6.568667337415413e-07, 'epoch': 1.78} {'loss': 0.1781, 'learning_rate': 6.567469788350178e-07, 'epoch': 1.78} {'loss': 0.1444, 'learning_rate': 6.566272344752511e-07, 'epoch': 1.78} {'loss': 0.147, 'learning_rate': 6.565075006623734e-07, 'epoch': 1.78} {'loss': 0.3745, 'learning_rate': 6.563877773965244e-07, 'epoch': 1.78} {'loss': 0.208, 'learning_rate': 6.562680646778352e-07, 'epoch': 1.78} {'loss': 0.2336, 'learning_rate': 6.561483625064446e-07, 'epoch': 1.78} {'loss': 0.2398, 'learning_rate': 6.560286708824837e-07, 'epoch': 1.78} {'loss': 0.2233, 'learning_rate': 6.5590898980609e-07, 'epoch': 1.78} {'loss': 0.3497, 'learning_rate': 6.557893192773978e-07, 'epoch': 1.78} {'loss': 0.3353, 'learning_rate': 6.556696592965439e-07, 'epoch': 1.78} {'loss': 0.2915, 'learning_rate': 6.555500098636613e-07, 'epoch': 1.78} {'loss': 0.2323, 'learning_rate': 6.554303709788867e-07, 'epoch': 1.78} {'loss': 0.1926, 'learning_rate': 6.553107426423522e-07, 'epoch': 1.78} {'loss': 0.3437, 'learning_rate': 6.551911248541965e-07, 'epoch': 1.78} {'loss': 0.3167, 'learning_rate': 6.550715176145538e-07, 'epoch': 1.78} {'loss': 0.3132, 'learning_rate': 6.549519209235566e-07, 'epoch': 1.78} {'loss': 0.4018, 'learning_rate': 6.548323347813423e-07, 'epoch': 1.78} {'loss': 0.3217, 'learning_rate': 6.547127591880453e-07, 'epoch': 1.78} {'loss': 0.2313, 'learning_rate': 6.54593194143801e-07, 'epoch': 1.78} {'loss': 0.3845, 'learning_rate': 6.544736396487417e-07, 'epoch': 1.78} {'loss': 0.1801, 'learning_rate': 6.54354095703007e-07, 'epoch': 1.78} {'loss': 0.2297, 'learning_rate': 6.542345623067281e-07, 'epoch': 1.78} {'loss': 0.3382, 'learning_rate': 6.541150394600426e-07, 'epoch': 1.78} {'loss': 0.2694, 'learning_rate': 6.539955271630816e-07, 'epoch': 1.78} {'loss': 0.292, 'learning_rate': 6.538760254159848e-07, 'epoch': 1.78} {'loss': 0.2235, 'learning_rate': 6.537565342188823e-07, 'epoch': 1.78} {'loss': 0.2722, 'learning_rate': 6.536370535719139e-07, 'epoch': 1.78} {'loss': 0.4488, 'learning_rate': 6.535175834752116e-07, 'epoch': 1.78} {'loss': 0.4606, 'learning_rate': 6.533981239289089e-07, 'epoch': 1.78} {'loss': 0.2559, 'learning_rate': 6.532786749331443e-07, 'epoch': 1.78} {'loss': 0.2029, 'learning_rate': 6.53159236488049e-07, 'epoch': 1.78} {'loss': 0.4127, 'learning_rate': 6.530398085937618e-07, 'epoch': 1.78} {'loss': 0.2253, 'learning_rate': 6.529203912504123e-07, 'epoch': 1.78} {'loss': 0.1809, 'learning_rate': 6.528009844581406e-07, 'epoch': 1.78} {'loss': 0.3219, 'learning_rate': 6.526815882170779e-07, 'epoch': 1.78} {'loss': 0.3149, 'learning_rate': 6.525622025273615e-07, 'epoch': 1.78} {'loss': 0.3656, 'learning_rate': 6.524428273891226e-07, 'epoch': 1.78} {'loss': 0.2167, 'learning_rate': 6.52323462802501e-07, 'epoch': 1.78} {'loss': 0.3414, 'learning_rate': 6.522041087676257e-07, 'epoch': 1.78} {'loss': 0.2706, 'learning_rate': 6.520847652846373e-07, 'epoch': 1.78} {'loss': 0.3442, 'learning_rate': 6.519654323536673e-07, 'epoch': 1.78} {'loss': 0.3139, 'learning_rate': 6.518461099748485e-07, 'epoch': 1.78} {'loss': 0.3881, 'learning_rate': 6.5172679814832e-07, 'epoch': 1.78} {'loss': 0.2518, 'learning_rate': 6.516074968742126e-07, 'epoch': 1.78} {'loss': 0.1928, 'learning_rate': 6.51488206152664e-07, 'epoch': 1.78} {'loss': 0.3982, 'learning_rate': 6.513689259838052e-07, 'epoch': 1.78} {'loss': 0.3605, 'learning_rate': 6.512496563677761e-07, 'epoch': 1.78} {'loss': 0.3674, 'learning_rate': 6.511303973047067e-07, 'epoch': 1.78} {'loss': 0.367, 'learning_rate': 6.510111487947346e-07, 'epoch': 1.78} {'loss': 0.3829, 'learning_rate': 6.508919108379907e-07, 'epoch': 1.78} {'loss': 0.3687, 'learning_rate': 6.507726834346151e-07, 'epoch': 1.78} {'loss': 0.3427, 'learning_rate': 6.506534665847364e-07, 'epoch': 1.78} {'loss': 0.4439, 'learning_rate': 6.505342602884945e-07, 'epoch': 1.78} {'loss': 0.2258, 'learning_rate': 6.504150645460206e-07, 'epoch': 1.78} {'loss': 0.4053, 'learning_rate': 6.502958793574498e-07, 'epoch': 1.78} {'loss': 0.28, 'learning_rate': 6.50176704722918e-07, 'epoch': 1.78} {'loss': 0.5097, 'learning_rate': 6.500575406425569e-07, 'epoch': 1.78} {'loss': 0.284, 'learning_rate': 6.499383871165055e-07, 'epoch': 1.78} {'loss': 0.4583, 'learning_rate': 6.498192441448925e-07, 'epoch': 1.78} {'loss': 0.2024, 'learning_rate': 6.497001117278578e-07, 'epoch': 1.78} {'loss': 0.2987, 'learning_rate': 6.495809898655325e-07, 'epoch': 1.78} {'loss': 0.3321, 'learning_rate': 6.494618785580542e-07, 'epoch': 1.78} {'loss': 0.3533, 'learning_rate': 6.493427778055528e-07, 'epoch': 1.78} {'loss': 0.2489, 'learning_rate': 6.49223687608167e-07, 'epoch': 1.78} {'loss': 0.2756, 'learning_rate': 6.491046079660279e-07, 'epoch': 1.78} {'loss': 0.3422, 'learning_rate': 6.489855388792731e-07, 'epoch': 1.78} {'loss': 0.2438, 'learning_rate': 6.48866480348036e-07, 'epoch': 1.78} {'loss': 0.3131, 'learning_rate': 6.487474323724486e-07, 'epoch': 1.78} {'loss': 0.237, 'learning_rate': 6.486283949526484e-07, 'epoch': 1.78} {'loss': 0.3662, 'learning_rate': 6.485093680887678e-07, 'epoch': 1.78} {'loss': 0.2628, 'learning_rate': 6.483903517809431e-07, 'epoch': 1.78} {'loss': 0.3373, 'learning_rate': 6.482713460293056e-07, 'epoch': 1.78} {'loss': 0.3313, 'learning_rate': 6.481523508339926e-07, 'epoch': 1.78} {'loss': 0.2445, 'learning_rate': 6.480333661951354e-07, 'epoch': 1.78} {'loss': 0.2457, 'learning_rate': 6.479143921128727e-07, 'epoch': 1.78} {'loss': 0.3024, 'learning_rate': 6.477954285873344e-07, 'epoch': 1.78} {'loss': 0.2217, 'learning_rate': 6.476764756186582e-07, 'epoch': 1.78} {'loss': 0.44, 'learning_rate': 6.47557533206975e-07, 'epoch': 1.78} {'loss': 0.3063, 'learning_rate': 6.474386013524214e-07, 'epoch': 1.78} {'loss': 0.2779, 'learning_rate': 6.473196800551329e-07, 'epoch': 1.78} {'loss': 0.4403, 'learning_rate': 6.472007693152394e-07, 'epoch': 1.78} {'loss': 0.2728, 'learning_rate': 6.470818691328806e-07, 'epoch': 1.78} {'loss': 0.3973, 'learning_rate': 6.469629795081855e-07, 'epoch': 1.78} {'loss': 0.2728, 'learning_rate': 6.468441004412918e-07, 'epoch': 1.78} {'loss': 0.345, 'learning_rate': 6.467252319323314e-07, 'epoch': 1.78} {'loss': 0.2403, 'learning_rate': 6.46606373981441e-07, 'epoch': 1.78} {'loss': 0.2492, 'learning_rate': 6.464875265887538e-07, 'epoch': 1.78} {'loss': 0.3825, 'learning_rate': 6.463686897544019e-07, 'epoch': 1.78} {'loss': 0.2702, 'learning_rate': 6.46249863478523e-07, 'epoch': 1.78} {'loss': 0.379, 'learning_rate': 6.461310477612471e-07, 'epoch': 1.78} {'loss': 0.2306, 'learning_rate': 6.460122426027116e-07, 'epoch': 1.78} {'loss': 0.2931, 'learning_rate': 6.458934480030488e-07, 'epoch': 1.78} {'loss': 0.2299, 'learning_rate': 6.457746639623951e-07, 'epoch': 1.78} {'loss': 0.2931, 'learning_rate': 6.456558904808807e-07, 'epoch': 1.78} {'loss': 0.2959, 'learning_rate': 6.455371275586442e-07, 'epoch': 1.78} {'loss': 0.2792, 'learning_rate': 6.454183751958165e-07, 'epoch': 1.78} {'loss': 0.2881, 'learning_rate': 6.452996333925332e-07, 'epoch': 1.78} {'loss': 0.3441, 'learning_rate': 6.451809021489263e-07, 'epoch': 1.78} {'loss': 0.2746, 'learning_rate': 6.450621814651326e-07, 'epoch': 1.78} {'loss': 0.3772, 'learning_rate': 6.44943471341285e-07, 'epoch': 1.78} {'loss': 0.3372, 'learning_rate': 6.448247717775158e-07, 'epoch': 1.78} {'loss': 0.3208, 'learning_rate': 6.447060827739627e-07, 'epoch': 1.78} {'loss': 0.4071, 'learning_rate': 6.445874043307543e-07, 'epoch': 1.78} {'loss': 0.3464, 'learning_rate': 6.444687364480307e-07, 'epoch': 1.78} {'loss': 0.371, 'learning_rate': 6.443500791259205e-07, 'epoch': 1.78} {'loss': 0.414, 'learning_rate': 6.442314323645627e-07, 'epoch': 1.78} {'loss': 0.2552, 'learning_rate': 6.441127961640859e-07, 'epoch': 1.78} {'loss': 0.1553, 'learning_rate': 6.439941705246278e-07, 'epoch': 1.78} {'loss': 0.313, 'learning_rate': 6.438755554463205e-07, 'epoch': 1.78} {'loss': 0.3634, 'learning_rate': 6.437569509292995e-07, 'epoch': 1.78} {'loss': 0.3676, 'learning_rate': 6.436383569736971e-07, 'epoch': 1.78} {'loss': 0.3558, 'learning_rate': 6.435197735796484e-07, 'epoch': 1.78} {'loss': 0.4431, 'learning_rate': 6.434012007472867e-07, 'epoch': 1.78} {'loss': 0.3262, 'learning_rate': 6.432826384767455e-07, 'epoch': 1.78} {'loss': 0.2862, 'learning_rate': 6.431640867681588e-07, 'epoch': 1.78} {'loss': 0.2231, 'learning_rate': 6.4304554562166e-07, 'epoch': 1.78} {'loss': 0.3161, 'learning_rate': 6.429270150373845e-07, 'epoch': 1.78} {'loss': 0.3368, 'learning_rate': 6.428084950154645e-07, 'epoch': 1.78} {'loss': 0.3144, 'learning_rate': 6.426899855560353e-07, 'epoch': 1.78} {'loss': 0.4278, 'learning_rate': 6.425714866592281e-07, 'epoch': 1.78} {'loss': 0.3141, 'learning_rate': 6.424529983251793e-07, 'epoch': 1.78} {'loss': 0.3293, 'learning_rate': 6.42334520554021e-07, 'epoch': 1.78} {'loss': 0.2745, 'learning_rate': 6.422160533458887e-07, 'epoch': 1.78} {'loss': 0.3979, 'learning_rate': 6.420975967009135e-07, 'epoch': 1.78} {'loss': 0.2906, 'learning_rate': 6.419791506192319e-07, 'epoch': 1.78} {'loss': 0.1251, 'learning_rate': 6.418607151009771e-07, 'epoch': 1.78} {'loss': 0.332, 'learning_rate': 6.4174229014628e-07, 'epoch': 1.78} {'loss': 0.4205, 'learning_rate': 6.416238757552773e-07, 'epoch': 1.78} {'loss': 0.2916, 'learning_rate': 6.415054719281011e-07, 'epoch': 1.78} {'loss': 0.2968, 'learning_rate': 6.413870786648868e-07, 'epoch': 1.78} {'loss': 0.2981, 'learning_rate': 6.412686959657654e-07, 'epoch': 1.78} {'loss': 0.2876, 'learning_rate': 6.411503238308736e-07, 'epoch': 1.78} {'loss': 0.1896, 'learning_rate': 6.410319622603412e-07, 'epoch': 1.78} {'loss': 0.2439, 'learning_rate': 6.409136112543058e-07, 'epoch': 1.78} {'loss': 0.3496, 'learning_rate': 6.407952708128984e-07, 'epoch': 1.78} {'loss': 0.3533, 'learning_rate': 6.406769409362546e-07, 'epoch': 1.78} {'loss': 0.2129, 'learning_rate': 6.405586216245052e-07, 'epoch': 1.78} {'loss': 0.247, 'learning_rate': 6.40440312877787e-07, 'epoch': 1.78} {'loss': 0.1758, 'learning_rate': 6.403220146962308e-07, 'epoch': 1.78} {'loss': 0.365, 'learning_rate': 6.40203727079971e-07, 'epoch': 1.78} {'loss': 0.2477, 'learning_rate': 6.40085450029142e-07, 'epoch': 1.78} {'loss': 0.2336, 'learning_rate': 6.399671835438759e-07, 'epoch': 1.78} {'loss': 0.3306, 'learning_rate': 6.398489276243081e-07, 'epoch': 1.78} {'loss': 0.3713, 'learning_rate': 6.397306822705695e-07, 'epoch': 1.78} {'loss': 0.4702, 'learning_rate': 6.39612447482797e-07, 'epoch': 1.78} {'loss': 0.3181, 'learning_rate': 6.394942232611201e-07, 'epoch': 1.78} {'loss': 0.2455, 'learning_rate': 6.393760096056755e-07, 'epoch': 1.78} {'loss': 0.1899, 'learning_rate': 6.392578065165944e-07, 'epoch': 1.78} {'loss': 0.3021, 'learning_rate': 6.391396139940121e-07, 'epoch': 1.78} {'loss': 0.5552, 'learning_rate': 6.390214320380605e-07, 'epoch': 1.78} {'loss': 0.3122, 'learning_rate': 6.389032606488744e-07, 'epoch': 1.78} {'loss': 0.2895, 'learning_rate': 6.387850998265865e-07, 'epoch': 1.78} {'loss': 0.3762, 'learning_rate': 6.386669495713283e-07, 'epoch': 1.78} {'loss': 0.172, 'learning_rate': 6.385488098832371e-07, 'epoch': 1.78} {'loss': 0.2041, 'learning_rate': 6.38430680762443e-07, 'epoch': 1.78} {'loss': 0.28, 'learning_rate': 6.383125622090813e-07, 'epoch': 1.78} {'loss': 0.3052, 'learning_rate': 6.381944542232832e-07, 'epoch': 1.78} {'loss': 0.3269, 'learning_rate': 6.38076356805184e-07, 'epoch': 1.78} {'loss': 0.2985, 'learning_rate': 6.379582699549158e-07, 'epoch': 1.78} {'loss': 0.2906, 'learning_rate': 6.378401936726142e-07, 'epoch': 1.78} {'loss': 0.384, 'learning_rate': 6.37722127958409e-07, 'epoch': 1.78} {'loss': 0.3238, 'learning_rate': 6.376040728124356e-07, 'epoch': 1.78} {'loss': 0.3052, 'learning_rate': 6.374860282348261e-07, 'epoch': 1.78} {'loss': 0.3405, 'learning_rate': 6.37367994225716e-07, 'epoch': 1.78} {'loss': 0.3083, 'learning_rate': 6.372499707852364e-07, 'epoch': 1.78} {'loss': 0.2911, 'learning_rate': 6.371319579135215e-07, 'epoch': 1.78} {'loss': 0.352, 'learning_rate': 6.370139556107046e-07, 'epoch': 1.78} {'loss': 0.3798, 'learning_rate': 6.368959638769179e-07, 'epoch': 1.78} {'loss': 0.338, 'learning_rate': 6.367779827122955e-07, 'epoch': 1.78} {'loss': 0.3299, 'learning_rate': 6.366600121169686e-07, 'epoch': 1.78} {'loss': 0.3377, 'learning_rate': 6.365420520910748e-07, 'epoch': 1.78} {'loss': 0.2761, 'learning_rate': 6.364241026347417e-07, 'epoch': 1.78} {'loss': 0.3335, 'learning_rate': 6.363061637481072e-07, 'epoch': 1.78} {'loss': 0.3116, 'learning_rate': 6.36188235431301e-07, 'epoch': 1.78} {'loss': 0.2528, 'learning_rate': 6.360703176844596e-07, 'epoch': 1.78} {'loss': 0.2388, 'learning_rate': 6.35952410507712e-07, 'epoch': 1.78} {'loss': 0.3646, 'learning_rate': 6.358345139011945e-07, 'epoch': 1.78} {'loss': 0.4004, 'learning_rate': 6.357166278650384e-07, 'epoch': 1.78} {'loss': 0.3232, 'learning_rate': 6.355987523993779e-07, 'epoch': 1.78} {'loss': 0.3187, 'learning_rate': 6.354808875043461e-07, 'epoch': 1.78} {'loss': 0.3079, 'learning_rate': 6.353630331800753e-07, 'epoch': 1.78} {'loss': 0.2227, 'learning_rate': 6.352451894266997e-07, 'epoch': 1.78} {'loss': 0.1613, 'learning_rate': 6.351273562443505e-07, 'epoch': 1.78} {'loss': 0.3728, 'learning_rate': 6.35009533633163e-07, 'epoch': 1.78} {'loss': 0.3272, 'learning_rate': 6.34891721593267e-07, 'epoch': 1.78} {'loss': 0.2781, 'learning_rate': 6.347739201247993e-07, 'epoch': 1.78} {'loss': 0.3941, 'learning_rate': 6.346561292278908e-07, 'epoch': 1.78} {'loss': 0.2954, 'learning_rate': 6.345383489026724e-07, 'epoch': 1.78} {'loss': 0.3442, 'learning_rate': 6.344205791492818e-07, 'epoch': 1.78} {'loss': 0.2927, 'learning_rate': 6.343028199678481e-07, 'epoch': 1.78} {'loss': 0.3644, 'learning_rate': 6.341850713585062e-07, 'epoch': 1.78} {'loss': 0.2431, 'learning_rate': 6.340673333213876e-07, 'epoch': 1.78} {'loss': 0.2408, 'learning_rate': 6.339496058566264e-07, 'epoch': 1.78} {'loss': 0.4087, 'learning_rate': 6.338318889643547e-07, 'epoch': 1.78} {'loss': 0.2818, 'learning_rate': 6.337141826447069e-07, 'epoch': 1.78} {'loss': 0.3366, 'learning_rate': 6.335964868978128e-07, 'epoch': 1.78} {'loss': 0.3357, 'learning_rate': 6.334788017238092e-07, 'epoch': 1.78} {'loss': 0.3758, 'learning_rate': 6.333611271228246e-07, 'epoch': 1.78} {'loss': 0.4261, 'learning_rate': 6.332434630949968e-07, 'epoch': 1.78} {'loss': 0.3693, 'learning_rate': 6.331258096404547e-07, 'epoch': 1.78} {'loss': 0.2306, 'learning_rate': 6.330081667593324e-07, 'epoch': 1.78} {'loss': 0.2973, 'learning_rate': 6.328905344517633e-07, 'epoch': 1.78} {'loss': 0.2624, 'learning_rate': 6.327729127178773e-07, 'epoch': 1.78} {'loss': 0.3845, 'learning_rate': 6.326553015578118e-07, 'epoch': 1.78} {'loss': 0.3212, 'learning_rate': 6.32537700971696e-07, 'epoch': 1.78} {'loss': 0.1608, 'learning_rate': 6.32420110959665e-07, 'epoch': 1.78} {'loss': 0.2677, 'learning_rate': 6.32302531521849e-07, 'epoch': 1.78} {'loss': 0.3393, 'learning_rate': 6.321849626583832e-07, 'epoch': 1.78} {'loss': 0.2337, 'learning_rate': 6.320674043693975e-07, 'epoch': 1.78} {'loss': 0.3458, 'learning_rate': 6.319498566550286e-07, 'epoch': 1.78} {'loss': 0.3357, 'learning_rate': 6.318323195154042e-07, 'epoch': 1.78} {'loss': 0.4192, 'learning_rate': 6.317147929506617e-07, 'epoch': 1.78} {'loss': 0.3505, 'learning_rate': 6.315972769609324e-07, 'epoch': 1.78} {'loss': 0.285, 'learning_rate': 6.314797715463461e-07, 'epoch': 1.78} {'loss': 0.2426, 'learning_rate': 6.313622767070393e-07, 'epoch': 1.78} {'loss': 0.328, 'learning_rate': 6.31244792443142e-07, 'epoch': 1.78} {'loss': 0.3209, 'learning_rate': 6.311273187547884e-07, 'epoch': 1.78} {'loss': 0.4113, 'learning_rate': 6.310098556421096e-07, 'epoch': 1.78} {'loss': 0.2958, 'learning_rate': 6.30892403105241e-07, 'epoch': 1.78} {'loss': 0.2726, 'learning_rate': 6.307749611443104e-07, 'epoch': 1.78} {'loss': 0.327, 'learning_rate': 6.306575297594564e-07, 'epoch': 1.78} {'loss': 0.1976, 'learning_rate': 6.305401089508057e-07, 'epoch': 1.78} {'loss': 0.4081, 'learning_rate': 6.304226987184947e-07, 'epoch': 1.78} {'loss': 0.3283, 'learning_rate': 6.303052990626546e-07, 'epoch': 1.78} {'loss': 0.2814, 'learning_rate': 6.301879099834185e-07, 'epoch': 1.78} {'loss': 0.3044, 'learning_rate': 6.300705314809186e-07, 'epoch': 1.78} {'loss': 0.3246, 'learning_rate': 6.299531635552858e-07, 'epoch': 1.78} {'loss': 0.3634, 'learning_rate': 6.298358062066567e-07, 'epoch': 1.78} {'loss': 0.2214, 'learning_rate': 6.29718459435158e-07, 'epoch': 1.78} {'loss': 0.2366, 'learning_rate': 6.296011232409283e-07, 'epoch': 1.78} {'loss': 0.399, 'learning_rate': 6.294837976240941e-07, 'epoch': 1.78} {'loss': 0.3037, 'learning_rate': 6.293664825847934e-07, 'epoch': 1.78} {'loss': 0.3431, 'learning_rate': 6.292491781231547e-07, 'epoch': 1.78} {'loss': 0.2281, 'learning_rate': 6.291318842393124e-07, 'epoch': 1.78} {'loss': 0.1801, 'learning_rate': 6.290146009333975e-07, 'epoch': 1.78} {'loss': 0.3144, 'learning_rate': 6.288973282055444e-07, 'epoch': 1.78} {'loss': 0.3435, 'learning_rate': 6.287800660558819e-07, 'epoch': 1.78} {'loss': 0.334, 'learning_rate': 6.286628144845474e-07, 'epoch': 1.78} {'loss': 0.2137, 'learning_rate': 6.285455734916702e-07, 'epoch': 1.78} {'loss': 0.3034, 'learning_rate': 6.284283430773808e-07, 'epoch': 1.78} {'loss': 0.2873, 'learning_rate': 6.283111232418159e-07, 'epoch': 1.78} {'loss': 0.211, 'learning_rate': 6.281939139851035e-07, 'epoch': 1.78} {'loss': 0.3428, 'learning_rate': 6.280767153073797e-07, 'epoch': 1.78} {'loss': 0.3418, 'learning_rate': 6.279595272087747e-07, 'epoch': 1.78} {'loss': 0.36, 'learning_rate': 6.278423496894214e-07, 'epoch': 1.78} {'loss': 0.4934, 'learning_rate': 6.277251827494513e-07, 'epoch': 1.78} {'loss': 0.3944, 'learning_rate': 6.276080263889983e-07, 'epoch': 1.78} {'loss': 0.2571, 'learning_rate': 6.274908806081925e-07, 'epoch': 1.78} {'loss': 0.3073, 'learning_rate': 6.273737454071682e-07, 'epoch': 1.78} {'loss': 0.4163, 'learning_rate': 6.272566207860554e-07, 'epoch': 1.78} {'loss': 0.4425, 'learning_rate': 6.271395067449892e-07, 'epoch': 1.78} {'loss': 0.3176, 'learning_rate': 6.270224032840999e-07, 'epoch': 1.78} {'loss': 0.404, 'learning_rate': 6.269053104035183e-07, 'epoch': 1.78} {'loss': 0.3575, 'learning_rate': 6.267882281033799e-07, 'epoch': 1.78} {'loss': 0.349, 'learning_rate': 6.266711563838134e-07, 'epoch': 1.78} {'loss': 0.3819, 'learning_rate': 6.265540952449545e-07, 'epoch': 1.78} {'loss': 0.3477, 'learning_rate': 6.264370446869328e-07, 'epoch': 1.78} {'loss': 0.3432, 'learning_rate': 6.263200047098817e-07, 'epoch': 1.78} {'loss': 0.3063, 'learning_rate': 6.26202975313932e-07, 'epoch': 1.78} {'loss': 0.2372, 'learning_rate': 6.260859564992172e-07, 'epoch': 1.78} {'loss': 0.2334, 'learning_rate': 6.259689482658682e-07, 'epoch': 1.78} {'loss': 0.2779, 'learning_rate': 6.258519506140193e-07, 'epoch': 1.78} {'loss': 0.2854, 'learning_rate': 6.257349635437993e-07, 'epoch': 1.78} {'loss': 0.252, 'learning_rate': 6.256179870553436e-07, 'epoch': 1.78} {'loss': 0.2885, 'learning_rate': 6.255010211487822e-07, 'epoch': 1.78} {'loss': 0.2808, 'learning_rate': 6.25384065824246e-07, 'epoch': 1.78} {'loss': 0.3341, 'learning_rate': 6.252671210818695e-07, 'epoch': 1.78} {'loss': 0.2162, 'learning_rate': 6.251501869217835e-07, 'epoch': 1.78} {'loss': 0.2196, 'learning_rate': 6.250332633441203e-07, 'epoch': 1.78} {'loss': 0.2855, 'learning_rate': 6.249163503490108e-07, 'epoch': 1.78} {'loss': 0.2488, 'learning_rate': 6.247994479365904e-07, 'epoch': 1.78} {'loss': 0.2472, 'learning_rate': 6.246825561069858e-07, 'epoch': 1.78} {'loss': 0.2406, 'learning_rate': 6.245656748603346e-07, 'epoch': 1.78} {'loss': 0.3499, 'learning_rate': 6.244488041967633e-07, 'epoch': 1.78} {'loss': 0.2081, 'learning_rate': 6.243319441164086e-07, 'epoch': 1.78} {'loss': 0.3166, 'learning_rate': 6.242150946193992e-07, 'epoch': 1.78} {'loss': 0.2839, 'learning_rate': 6.240982557058673e-07, 'epoch': 1.78} {'loss': 0.299, 'learning_rate': 6.23981427375947e-07, 'epoch': 1.78} {'loss': 0.3551, 'learning_rate': 6.238646096297673e-07, 'epoch': 1.78} {'loss': 0.3335, 'learning_rate': 6.237478024674636e-07, 'epoch': 1.78} {'loss': 0.2576, 'learning_rate': 6.236310058891637e-07, 'epoch': 1.78} {'loss': 0.3291, 'learning_rate': 6.235142198950028e-07, 'epoch': 1.78} {'loss': 0.3268, 'learning_rate': 6.233974444851098e-07, 'epoch': 1.78} {'loss': 0.2557, 'learning_rate': 6.232806796596203e-07, 'epoch': 1.78} {'loss': 0.3195, 'learning_rate': 6.231639254186616e-07, 'epoch': 1.78} {'loss': 0.2364, 'learning_rate': 6.230471817623695e-07, 'epoch': 1.78} {'loss': 0.302, 'learning_rate': 6.229304486908739e-07, 'epoch': 1.78} {'loss': 0.3102, 'learning_rate': 6.228137262043054e-07, 'epoch': 1.78} {'loss': 0.1859, 'learning_rate': 6.226970143027989e-07, 'epoch': 1.78} {'loss': 0.3035, 'learning_rate': 6.225803129864816e-07, 'epoch': 1.78} {'loss': 0.3008, 'learning_rate': 6.224636222554903e-07, 'epoch': 1.78} {'loss': 0.3499, 'learning_rate': 6.223469421099526e-07, 'epoch': 1.78} {'loss': 0.2708, 'learning_rate': 6.22230272550004e-07, 'epoch': 1.78} {'loss': 0.3357, 'learning_rate': 6.221136135757721e-07, 'epoch': 1.78} {'loss': 0.2841, 'learning_rate': 6.219969651873914e-07, 'epoch': 1.78} {'loss': 0.3326, 'learning_rate': 6.218803273849927e-07, 'epoch': 1.78} {'loss': 0.239, 'learning_rate': 6.217637001687083e-07, 'epoch': 1.78} {'loss': 0.2675, 'learning_rate': 6.21647083538669e-07, 'epoch': 1.78} {'loss': 0.356, 'learning_rate': 6.21530477495007e-07, 'epoch': 1.78} {'loss': 0.3332, 'learning_rate': 6.214138820378546e-07, 'epoch': 1.78} {'loss': 0.4385, 'learning_rate': 6.212972971673403e-07, 'epoch': 1.78} {'loss': 0.3181, 'learning_rate': 6.211807228835997e-07, 'epoch': 1.78} {'loss': 0.218, 'learning_rate': 6.210641591867606e-07, 'epoch': 1.78} {'loss': 0.3199, 'learning_rate': 6.209476060769593e-07, 'epoch': 1.78} {'loss': 0.432, 'learning_rate': 6.208310635543225e-07, 'epoch': 1.78} {'loss': 0.3207, 'learning_rate': 6.207145316189856e-07, 'epoch': 1.78} {'loss': 0.3112, 'learning_rate': 6.205980102710763e-07, 'epoch': 1.78} {'loss': 0.3338, 'learning_rate': 6.2048149951073e-07, 'epoch': 1.78} {'loss': 0.2506, 'learning_rate': 6.203649993380756e-07, 'epoch': 1.78} {'loss': 0.3549, 'learning_rate': 6.202485097532463e-07, 'epoch': 1.78} {'loss': 0.2632, 'learning_rate': 6.201320307563707e-07, 'epoch': 1.78} {'loss': 0.1908, 'learning_rate': 6.200155623475856e-07, 'epoch': 1.78} {'loss': 0.2778, 'learning_rate': 6.198991045270186e-07, 'epoch': 1.78} {'loss': 0.31, 'learning_rate': 6.197826572947996e-07, 'epoch': 1.78} {'loss': 0.2412, 'learning_rate': 6.19666220651064e-07, 'epoch': 1.78} {'loss': 0.4667, 'learning_rate': 6.195497945959406e-07, 'epoch': 1.78} {'loss': 0.2226, 'learning_rate': 6.194333791295626e-07, 'epoch': 1.78} {'loss': 0.4667, 'learning_rate': 6.193169742520588e-07, 'epoch': 1.78} {'loss': 0.2948, 'learning_rate': 6.192005799635648e-07, 'epoch': 1.78} {'loss': 0.3831, 'learning_rate': 6.190841962642069e-07, 'epoch': 1.78} {'loss': 0.3398, 'learning_rate': 6.189678231541219e-07, 'epoch': 1.78} {'loss': 0.2943, 'learning_rate': 6.188514606334351e-07, 'epoch': 1.78} {'loss': 0.2106, 'learning_rate': 6.187351087022841e-07, 'epoch': 1.78} {'loss': 0.3498, 'learning_rate': 6.186187673607946e-07, 'epoch': 1.78} {'loss': 0.2603, 'learning_rate': 6.18502436609103e-07, 'epoch': 1.78} {'loss': 0.291, 'learning_rate': 6.183861164473381e-07, 'epoch': 1.78} {'loss': 0.2797, 'learning_rate': 6.182698068756299e-07, 'epoch': 1.78} {'loss': 0.2564, 'learning_rate': 6.181535078941114e-07, 'epoch': 1.78} {'loss': 0.3559, 'learning_rate': 6.180372195029128e-07, 'epoch': 1.78} {'loss': 0.229, 'learning_rate': 6.179209417021681e-07, 'epoch': 1.78} {'loss': 0.3271, 'learning_rate': 6.178046744920041e-07, 'epoch': 1.78} {'loss': 0.3484, 'learning_rate': 6.176884178725573e-07, 'epoch': 1.78} {'loss': 0.3011, 'learning_rate': 6.175721718439531e-07, 'epoch': 1.78} {'loss': 0.2534, 'learning_rate': 6.174559364063282e-07, 'epoch': 1.78} {'loss': 0.3326, 'learning_rate': 6.173397115598101e-07, 'epoch': 1.78} {'loss': 0.4896, 'learning_rate': 6.172234973045322e-07, 'epoch': 1.78} {'loss': 0.1855, 'learning_rate': 6.171072936406231e-07, 'epoch': 1.78} {'loss': 0.3296, 'learning_rate': 6.169911005682172e-07, 'epoch': 1.78} {'loss': 0.2862, 'learning_rate': 6.168749180874444e-07, 'epoch': 1.78} {'loss': 0.3414, 'learning_rate': 6.167587461984348e-07, 'epoch': 1.78} {'loss': 0.3744, 'learning_rate': 6.166425849013202e-07, 'epoch': 1.78} {'loss': 0.4684, 'learning_rate': 6.165264341962318e-07, 'epoch': 1.78} {'loss': 0.3372, 'learning_rate': 6.164102940833017e-07, 'epoch': 1.78} {'loss': 0.3675, 'learning_rate': 6.162941645626574e-07, 'epoch': 1.78} {'loss': 0.3654, 'learning_rate': 6.161780456344357e-07, 'epoch': 1.78} {'loss': 0.262, 'learning_rate': 6.16061937298762e-07, 'epoch': 1.78} {'loss': 0.337, 'learning_rate': 6.159458395557716e-07, 'epoch': 1.78} {'loss': 0.3268, 'learning_rate': 6.158297524055923e-07, 'epoch': 1.78} {'loss': 0.3567, 'learning_rate': 6.157136758483584e-07, 'epoch': 1.78} {'loss': 0.4002, 'learning_rate': 6.155976098841987e-07, 'epoch': 1.78} {'loss': 0.3807, 'learning_rate': 6.154815545132453e-07, 'epoch': 1.78} {'loss': 0.2675, 'learning_rate': 6.153655097356281e-07, 'epoch': 1.78} {'loss': 0.3075, 'learning_rate': 6.152494755514782e-07, 'epoch': 1.78} {'loss': 0.393, 'learning_rate': 6.151334519609287e-07, 'epoch': 1.78} {'loss': 0.3613, 'learning_rate': 6.150174389641061e-07, 'epoch': 1.78} {'loss': 0.3178, 'learning_rate': 6.149014365611472e-07, 'epoch': 1.78} {'loss': 0.3796, 'learning_rate': 6.147854447521773e-07, 'epoch': 1.78} {'loss': 0.3876, 'learning_rate': 6.146694635373319e-07, 'epoch': 1.78} {'loss': 0.2818, 'learning_rate': 6.145534929167385e-07, 'epoch': 1.78} {'loss': 0.378, 'learning_rate': 6.144375328905305e-07, 'epoch': 1.78} {'loss': 0.3984, 'learning_rate': 6.143215834588367e-07, 'epoch': 1.78} {'loss': 0.2637, 'learning_rate': 6.142056446217914e-07, 'epoch': 1.78} {'loss': 0.326, 'learning_rate': 6.1408971637952e-07, 'epoch': 1.78} {'loss': 0.294, 'learning_rate': 6.139737987321592e-07, 'epoch': 1.78} {'loss': 0.2141, 'learning_rate': 6.138578916798366e-07, 'epoch': 1.78} {'loss': 0.2503, 'learning_rate': 6.137419952226819e-07, 'epoch': 1.78} {'loss': 0.3029, 'learning_rate': 6.136261093608298e-07, 'epoch': 1.78} {'loss': 0.2268, 'learning_rate': 6.135102340944066e-07, 'epoch': 1.78} {'loss': 0.207, 'learning_rate': 6.133943694235478e-07, 'epoch': 1.78} {'loss': 0.3195, 'learning_rate': 6.1327851534838e-07, 'epoch': 1.78} {'loss': 0.3389, 'learning_rate': 6.131626718690375e-07, 'epoch': 1.78} {'loss': 0.2758, 'learning_rate': 6.13046838985647e-07, 'epoch': 1.78} {'loss': 0.2283, 'learning_rate': 6.129310166983438e-07, 'epoch': 1.78} {'loss': 0.4161, 'learning_rate': 6.128152050072545e-07, 'epoch': 1.78} {'loss': 0.26, 'learning_rate': 6.126994039125144e-07, 'epoch': 1.78} {'loss': 0.2644, 'learning_rate': 6.125836134142493e-07, 'epoch': 1.78} {'loss': 0.2825, 'learning_rate': 6.12467833512591e-07, 'epoch': 1.78} {'loss': 0.3275, 'learning_rate': 6.123520642076752e-07, 'epoch': 1.78} {'loss': 0.3064, 'learning_rate': 6.122363054996261e-07, 'epoch': 1.78} {'loss': 0.2239, 'learning_rate': 6.12120557388578e-07, 'epoch': 1.78} {'loss': 0.2938, 'learning_rate': 6.120048198746598e-07, 'epoch': 1.78} {'loss': 0.2656, 'learning_rate': 6.118890929580046e-07, 'epoch': 1.78} {'loss': 0.3848, 'learning_rate': 6.117733766387391e-07, 'epoch': 1.78} {'loss': 0.3212, 'learning_rate': 6.116576709169986e-07, 'epoch': 1.78} {'loss': 0.3527, 'learning_rate': 6.115419757929108e-07, 'epoch': 1.78} {'loss': 0.231, 'learning_rate': 6.114262912666058e-07, 'epoch': 1.78} {'loss': 0.3094, 'learning_rate': 6.113106173382166e-07, 'epoch': 1.78} {'loss': 0.2712, 'learning_rate': 6.111949540078699e-07, 'epoch': 1.78} {'loss': 0.331, 'learning_rate': 6.11079301275701e-07, 'epoch': 1.78} {'loss': 0.2739, 'learning_rate': 6.109636591418367e-07, 'epoch': 1.78} {'loss': 0.1952, 'learning_rate': 6.108480276064111e-07, 'epoch': 1.78} {'loss': 0.3215, 'learning_rate': 6.107324066695496e-07, 'epoch': 1.78} {'loss': 0.2991, 'learning_rate': 6.106167963313881e-07, 'epoch': 1.78} {'loss': 0.341, 'learning_rate': 6.105011965920537e-07, 'epoch': 1.78} {'loss': 0.2009, 'learning_rate': 6.103856074516789e-07, 'epoch': 1.78} {'loss': 0.368, 'learning_rate': 6.102700289103924e-07, 'epoch': 1.78} {'loss': 0.3395, 'learning_rate': 6.101544609683263e-07, 'epoch': 1.78} {'loss': 0.4041, 'learning_rate': 6.100389036256105e-07, 'epoch': 1.78} {'loss': 0.3122, 'learning_rate': 6.099233568823737e-07, 'epoch': 1.78} {'loss': 0.3791, 'learning_rate': 6.098078207387493e-07, 'epoch': 1.78} {'loss': 0.241, 'learning_rate': 6.096922951948648e-07, 'epoch': 1.78} {'loss': 0.2698, 'learning_rate': 6.095767802508535e-07, 'epoch': 1.78} {'loss': 0.3514, 'learning_rate': 6.09461275906843e-07, 'epoch': 1.78} {'loss': 0.2265, 'learning_rate': 6.093457821629656e-07, 'epoch': 1.78} {'loss': 0.2476, 'learning_rate': 6.09230299019351e-07, 'epoch': 1.78} {'loss': 0.3302, 'learning_rate': 6.091148264761304e-07, 'epoch': 1.78} {'loss': 0.4398, 'learning_rate': 6.089993645334325e-07, 'epoch': 1.78} {'loss': 0.2456, 'learning_rate': 6.088839131913893e-07, 'epoch': 1.78} {'loss': 0.2654, 'learning_rate': 6.087684724501286e-07, 'epoch': 1.78} {'loss': 0.353, 'learning_rate': 6.086530423097847e-07, 'epoch': 1.78} {'loss': 0.4406, 'learning_rate': 6.085376227704854e-07, 'epoch': 1.78} {'loss': 0.3376, 'learning_rate': 6.084222138323603e-07, 'epoch': 1.78} {'loss': 0.36, 'learning_rate': 6.083068154955408e-07, 'epoch': 1.78} {'loss': 0.2683, 'learning_rate': 6.081914277601564e-07, 'epoch': 1.78} {'loss': 0.3597, 'learning_rate': 6.080760506263395e-07, 'epoch': 1.78} {'loss': 0.2454, 'learning_rate': 6.079606840942176e-07, 'epoch': 1.78} {'loss': 0.4348, 'learning_rate': 6.078453281639229e-07, 'epoch': 1.78} {'loss': 0.4376, 'learning_rate': 6.077299828355831e-07, 'epoch': 1.78} {'loss': 0.2468, 'learning_rate': 6.076146481093326e-07, 'epoch': 1.78} {'loss': 0.245, 'learning_rate': 6.074993239852967e-07, 'epoch': 1.78} {'loss': 0.3813, 'learning_rate': 6.073840104636108e-07, 'epoch': 1.78} {'loss': 0.3688, 'learning_rate': 6.072687075443995e-07, 'epoch': 1.78} {'loss': 0.3803, 'learning_rate': 6.071534152277981e-07, 'epoch': 1.78} {'loss': 0.1556, 'learning_rate': 6.07038133513933e-07, 'epoch': 1.78} {'loss': 0.2373, 'learning_rate': 6.069228624029355e-07, 'epoch': 1.78} {'loss': 0.2078, 'learning_rate': 6.068076018949365e-07, 'epoch': 1.78} {'loss': 0.2324, 'learning_rate': 6.066923519900647e-07, 'epoch': 1.78} {'loss': 0.2745, 'learning_rate': 6.065771126884523e-07, 'epoch': 1.78} {'loss': 0.2496, 'learning_rate': 6.06461883990227e-07, 'epoch': 1.78} {'loss': 0.3313, 'learning_rate': 6.063466658955208e-07, 'epoch': 1.78} {'loss': 0.2148, 'learning_rate': 6.062314584044615e-07, 'epoch': 1.78} {'loss': 0.3586, 'learning_rate': 6.061162615171822e-07, 'epoch': 1.78} {'loss': 0.4216, 'learning_rate': 6.060010752338108e-07, 'epoch': 1.78} {'loss': 0.3667, 'learning_rate': 6.058858995544781e-07, 'epoch': 1.78} {'loss': 0.2711, 'learning_rate': 6.057707344793129e-07, 'epoch': 1.78} {'loss': 0.3393, 'learning_rate': 6.056555800084473e-07, 'epoch': 1.78} {'loss': 0.4601, 'learning_rate': 6.055404361420103e-07, 'epoch': 1.78} {'loss': 0.2878, 'learning_rate': 6.054253028801305e-07, 'epoch': 1.78} {'loss': 0.3294, 'learning_rate': 6.0531018022294e-07, 'epoch': 1.78} {'loss': 0.3653, 'learning_rate': 6.051950681705665e-07, 'epoch': 1.78} {'loss': 0.243, 'learning_rate': 6.050799667231422e-07, 'epoch': 1.78} {'loss': 0.3516, 'learning_rate': 6.049648758807958e-07, 'epoch': 1.78} {'loss': 0.3953, 'learning_rate': 6.048497956436583e-07, 'epoch': 1.78} {'loss': 0.3518, 'learning_rate': 6.047347260118575e-07, 'epoch': 1.78} {'loss': 0.2366, 'learning_rate': 6.046196669855264e-07, 'epoch': 1.78} {'loss': 0.5165, 'learning_rate': 6.045046185647907e-07, 'epoch': 1.78} {'loss': 0.452, 'learning_rate': 6.043895807497846e-07, 'epoch': 1.78} {'loss': 0.2945, 'learning_rate': 6.042745535406347e-07, 'epoch': 1.78} {'loss': 0.4672, 'learning_rate': 6.041595369374731e-07, 'epoch': 1.78} {'loss': 0.253, 'learning_rate': 6.040445309404286e-07, 'epoch': 1.78} {'loss': 0.2724, 'learning_rate': 6.03929535549631e-07, 'epoch': 1.78} {'loss': 0.292, 'learning_rate': 6.038145507652104e-07, 'epoch': 1.78} {'loss': 0.2307, 'learning_rate': 6.036995765872955e-07, 'epoch': 1.78} {'loss': 0.3587, 'learning_rate': 6.035846130160184e-07, 'epoch': 1.78} {'loss': 0.2398, 'learning_rate': 6.034696600515067e-07, 'epoch': 1.78} {'loss': 0.2283, 'learning_rate': 6.033547176938914e-07, 'epoch': 1.78} {'loss': 0.4038, 'learning_rate': 6.032397859433004e-07, 'epoch': 1.78} {'loss': 0.2456, 'learning_rate': 6.031248647998666e-07, 'epoch': 1.78} {'loss': 0.3751, 'learning_rate': 6.030099542637158e-07, 'epoch': 1.78} {'loss': 0.3051, 'learning_rate': 6.028950543349821e-07, 'epoch': 1.78} {'loss': 0.1821, 'learning_rate': 6.02780165013791e-07, 'epoch': 1.78} {'loss': 0.2251, 'learning_rate': 6.026652863002758e-07, 'epoch': 1.78} {'loss': 0.1937, 'learning_rate': 6.025504181945629e-07, 'epoch': 1.78} {'loss': 0.5028, 'learning_rate': 6.024355606967846e-07, 'epoch': 1.78} {'loss': 0.3332, 'learning_rate': 6.023207138070697e-07, 'epoch': 1.78} {'loss': 0.3321, 'learning_rate': 6.022058775255468e-07, 'epoch': 1.78} {'loss': 0.5728, 'learning_rate': 6.020910518523481e-07, 'epoch': 1.78} {'loss': 0.3077, 'learning_rate': 6.019762367875992e-07, 'epoch': 1.78} {'loss': 0.2465, 'learning_rate': 6.018614323314342e-07, 'epoch': 1.78} {'loss': 0.2721, 'learning_rate': 6.017466384839787e-07, 'epoch': 1.78} {'loss': 0.3031, 'learning_rate': 6.016318552453648e-07, 'epoch': 1.78} {'loss': 0.504, 'learning_rate': 6.015170826157213e-07, 'epoch': 1.78} {'loss': 0.4688, 'learning_rate': 6.01402320595178e-07, 'epoch': 1.78} {'loss': 0.3585, 'learning_rate': 6.012875691838637e-07, 'epoch': 1.79} {'loss': 0.2838, 'learning_rate': 6.011728283819074e-07, 'epoch': 1.79} {'loss': 0.2366, 'learning_rate': 6.010580981894421e-07, 'epoch': 1.79} {'loss': 0.4225, 'learning_rate': 6.009433786065933e-07, 'epoch': 1.79} {'loss': 0.3414, 'learning_rate': 6.00828669633493e-07, 'epoch': 1.79} {'loss': 0.3936, 'learning_rate': 6.007139712702693e-07, 'epoch': 1.79} {'loss': 0.3004, 'learning_rate': 6.005992835170538e-07, 'epoch': 1.79} {'loss': 0.3892, 'learning_rate': 6.004846063739722e-07, 'epoch': 1.79} {'loss': 0.3164, 'learning_rate': 6.003699398411567e-07, 'epoch': 1.79} {'loss': 0.338, 'learning_rate': 6.002552839187359e-07, 'epoch': 1.79} {'loss': 0.19, 'learning_rate': 6.001406386068409e-07, 'epoch': 1.79} {'loss': 0.4237, 'learning_rate': 6.000260039055994e-07, 'epoch': 1.79} {'loss': 0.217, 'learning_rate': 5.99911379815139e-07, 'epoch': 1.79} {'loss': 0.2746, 'learning_rate': 5.997967663355931e-07, 'epoch': 1.79} {'loss': 0.1905, 'learning_rate': 5.99682163467088e-07, 'epoch': 1.79} {'loss': 0.2964, 'learning_rate': 5.995675712097548e-07, 'epoch': 1.79} {'loss': 0.2986, 'learning_rate': 5.994529895637214e-07, 'epoch': 1.79} {'loss': 0.2426, 'learning_rate': 5.993384185291195e-07, 'epoch': 1.79} {'loss': 0.3873, 'learning_rate': 5.99223858106075e-07, 'epoch': 1.79} {'loss': 0.2642, 'learning_rate': 5.991093082947208e-07, 'epoch': 1.79} {'loss': 0.2905, 'learning_rate': 5.989947690951836e-07, 'epoch': 1.79} {'loss': 0.242, 'learning_rate': 5.988802405075944e-07, 'epoch': 1.79} {'loss': 0.3025, 'learning_rate': 5.987657225320808e-07, 'epoch': 1.79} {'loss': 0.3074, 'learning_rate': 5.98651215168774e-07, 'epoch': 1.79} {'loss': 0.3077, 'learning_rate': 5.985367184178026e-07, 'epoch': 1.79} {'loss': 0.2715, 'learning_rate': 5.984222322792932e-07, 'epoch': 1.79} {'loss': 0.1554, 'learning_rate': 5.983077567533791e-07, 'epoch': 1.79} {'loss': 0.2979, 'learning_rate': 5.981932918401867e-07, 'epoch': 1.79} {'loss': 0.2513, 'learning_rate': 5.980788375398472e-07, 'epoch': 1.79} {'loss': 0.2381, 'learning_rate': 5.979643938524882e-07, 'epoch': 1.79} {'loss': 0.4008, 'learning_rate': 5.978499607782406e-07, 'epoch': 1.79} {'loss': 0.2238, 'learning_rate': 5.977355383172301e-07, 'epoch': 1.79} {'loss': 0.2274, 'learning_rate': 5.976211264695908e-07, 'epoch': 1.79} {'loss': 0.2067, 'learning_rate': 5.975067252354471e-07, 'epoch': 1.79} {'loss': 0.3576, 'learning_rate': 5.973923346149324e-07, 'epoch': 1.79} {'loss': 0.3617, 'learning_rate': 5.972779546081719e-07, 'epoch': 1.79} {'loss': 0.2787, 'learning_rate': 5.971635852152991e-07, 'epoch': 1.79} {'loss': 0.2794, 'learning_rate': 5.970492264364391e-07, 'epoch': 1.79} {'loss': 0.158, 'learning_rate': 5.969348782717222e-07, 'epoch': 1.79} {'loss': 0.1792, 'learning_rate': 5.968205407212779e-07, 'epoch': 1.79} {'loss': 0.3434, 'learning_rate': 5.967062137852353e-07, 'epoch': 1.79} {'loss': 0.3749, 'learning_rate': 5.965918974637231e-07, 'epoch': 1.79} {'loss': 0.4066, 'learning_rate': 5.964775917568699e-07, 'epoch': 1.79} {'loss': 0.4173, 'learning_rate': 5.96363296664807e-07, 'epoch': 1.79} {'loss': 0.3832, 'learning_rate': 5.962490121876596e-07, 'epoch': 1.79} {'loss': 0.3714, 'learning_rate': 5.961347383255611e-07, 'epoch': 1.79} {'loss': 0.3958, 'learning_rate': 5.960204750786358e-07, 'epoch': 1.79} {'loss': 0.3158, 'learning_rate': 5.95906222447018e-07, 'epoch': 1.79} {'loss': 0.2369, 'learning_rate': 5.95791980430831e-07, 'epoch': 1.79} {'loss': 0.4427, 'learning_rate': 5.95677749030209e-07, 'epoch': 1.79} {'loss': 0.2815, 'learning_rate': 5.955635282452777e-07, 'epoch': 1.79} {'loss': 0.4778, 'learning_rate': 5.954493180761655e-07, 'epoch': 1.79} {'loss': 0.4142, 'learning_rate': 5.95335118523005e-07, 'epoch': 1.79} {'loss': 0.2569, 'learning_rate': 5.952209295859202e-07, 'epoch': 1.79} {'loss': 0.2624, 'learning_rate': 5.951067512650444e-07, 'epoch': 1.79} {'loss': 0.3014, 'learning_rate': 5.949925835605031e-07, 'epoch': 1.79} {'loss': 0.3453, 'learning_rate': 5.948784264724283e-07, 'epoch': 1.79} {'loss': 0.4554, 'learning_rate': 5.947642800009468e-07, 'epoch': 1.79} {'loss': 0.3816, 'learning_rate': 5.946501441461882e-07, 'epoch': 1.79} {'loss': 0.3187, 'learning_rate': 5.945360189082793e-07, 'epoch': 1.79} {'loss': 0.2847, 'learning_rate': 5.944219042873534e-07, 'epoch': 1.79} {'loss': 0.3351, 'learning_rate': 5.943078002835345e-07, 'epoch': 1.79} {'loss': 0.1706, 'learning_rate': 5.94193706896955e-07, 'epoch': 1.79} {'loss': 0.3901, 'learning_rate': 5.940796241277425e-07, 'epoch': 1.79} {'loss': 0.334, 'learning_rate': 5.939655519760235e-07, 'epoch': 1.79} {'loss': 0.3182, 'learning_rate': 5.938514904419302e-07, 'epoch': 1.79} {'loss': 0.258, 'learning_rate': 5.93737439525589e-07, 'epoch': 1.79} {'loss': 0.3293, 'learning_rate': 5.936233992271312e-07, 'epoch': 1.79} {'loss': 0.2891, 'learning_rate': 5.935093695466821e-07, 'epoch': 1.79} {'loss': 0.2325, 'learning_rate': 5.933953504843726e-07, 'epoch': 1.79} {'loss': 0.2845, 'learning_rate': 5.932813420403305e-07, 'epoch': 1.79} {'loss': 0.3782, 'learning_rate': 5.931673442146868e-07, 'epoch': 1.79} {'loss': 0.3995, 'learning_rate': 5.93053357007567e-07, 'epoch': 1.79} {'loss': 0.2031, 'learning_rate': 5.929393804191019e-07, 'epoch': 1.79} {'loss': 0.2254, 'learning_rate': 5.928254144494184e-07, 'epoch': 1.79} {'loss': 0.2744, 'learning_rate': 5.927114590986472e-07, 'epoch': 1.79} {'loss': 0.3314, 'learning_rate': 5.925975143669161e-07, 'epoch': 1.79} {'loss': 0.1871, 'learning_rate': 5.924835802543516e-07, 'epoch': 1.79} {'loss': 0.3599, 'learning_rate': 5.92369656761086e-07, 'epoch': 1.79} {'loss': 0.4038, 'learning_rate': 5.922557438872445e-07, 'epoch': 1.79} {'loss': 0.2574, 'learning_rate': 5.921418416329594e-07, 'epoch': 1.79} {'loss': 0.4033, 'learning_rate': 5.92027949998355e-07, 'epoch': 1.79} {'loss': 0.3069, 'learning_rate': 5.919140689835645e-07, 'epoch': 1.79} {'loss': 0.2931, 'learning_rate': 5.918001985887112e-07, 'epoch': 1.79} {'loss': 0.1789, 'learning_rate': 5.916863388139293e-07, 'epoch': 1.79} {'loss': 0.3767, 'learning_rate': 5.915724896593422e-07, 'epoch': 1.79} {'loss': 0.3901, 'learning_rate': 5.914586511250819e-07, 'epoch': 1.79} {'loss': 0.2164, 'learning_rate': 5.91344823211274e-07, 'epoch': 1.79} {'loss': 0.1963, 'learning_rate': 5.912310059180504e-07, 'epoch': 1.79} {'loss': 0.2871, 'learning_rate': 5.911171992455389e-07, 'epoch': 1.79} {'loss': 0.2615, 'learning_rate': 5.910034031938638e-07, 'epoch': 1.79} {'loss': 0.3094, 'learning_rate': 5.908896177631596e-07, 'epoch': 1.79} {'loss': 0.3102, 'learning_rate': 5.907758429535493e-07, 'epoch': 1.79} {'loss': 0.4526, 'learning_rate': 5.906620787651651e-07, 'epoch': 1.79} {'loss': 0.1593, 'learning_rate': 5.905483251981337e-07, 'epoch': 1.79} {'loss': 0.5035, 'learning_rate': 5.904345822525848e-07, 'epoch': 1.79} {'loss': 0.351, 'learning_rate': 5.90320849928644e-07, 'epoch': 1.79} {'loss': 0.2674, 'learning_rate': 5.902071282264443e-07, 'epoch': 1.79} {'loss': 0.3659, 'learning_rate': 5.900934171461093e-07, 'epoch': 1.79} {'loss': 0.4294, 'learning_rate': 5.899797166877708e-07, 'epoch': 1.79} {'loss': 0.2664, 'learning_rate': 5.898660268515544e-07, 'epoch': 1.79} {'loss': 0.3651, 'learning_rate': 5.8975234763759e-07, 'epoch': 1.79} {'loss': 0.5182, 'learning_rate': 5.896386790460074e-07, 'epoch': 1.79} {'loss': 0.3884, 'learning_rate': 5.89525021076931e-07, 'epoch': 1.79} {'loss': 0.2541, 'learning_rate': 5.89411373730493e-07, 'epoch': 1.79} {'loss': 0.334, 'learning_rate': 5.892977370068198e-07, 'epoch': 1.79} {'loss': 0.2224, 'learning_rate': 5.891841109060403e-07, 'epoch': 1.79} {'loss': 0.3334, 'learning_rate': 5.89070495428281e-07, 'epoch': 1.79} {'loss': 0.2126, 'learning_rate': 5.889568905736731e-07, 'epoch': 1.79} {'loss': 0.3692, 'learning_rate': 5.888432963423418e-07, 'epoch': 1.79} {'loss': 0.2992, 'learning_rate': 5.887297127344183e-07, 'epoch': 1.79} {'loss': 0.3592, 'learning_rate': 5.88616139750029e-07, 'epoch': 1.79} {'loss': 0.2551, 'learning_rate': 5.885025773893016e-07, 'epoch': 1.79} {'loss': 0.1955, 'learning_rate': 5.883890256523661e-07, 'epoch': 1.79} {'loss': 0.2405, 'learning_rate': 5.88275484539349e-07, 'epoch': 1.79} {'loss': 0.316, 'learning_rate': 5.881619540503802e-07, 'epoch': 1.79} {'loss': 0.2327, 'learning_rate': 5.880484341855852e-07, 'epoch': 1.79} {'loss': 0.3669, 'learning_rate': 5.87934924945095e-07, 'epoch': 1.79} {'loss': 0.3451, 'learning_rate': 5.878214263290349e-07, 'epoch': 1.79} {'loss': 0.2716, 'learning_rate': 5.877079383375362e-07, 'epoch': 1.79} {'loss': 0.3965, 'learning_rate': 5.87594460970724e-07, 'epoch': 1.79} {'loss': 0.3193, 'learning_rate': 5.874809942287296e-07, 'epoch': 1.79} {'loss': 0.3501, 'learning_rate': 5.873675381116784e-07, 'epoch': 1.79} {'loss': 0.2578, 'learning_rate': 5.87254092619699e-07, 'epoch': 1.79} {'loss': 0.3578, 'learning_rate': 5.871406577529215e-07, 'epoch': 1.79} {'loss': 0.1869, 'learning_rate': 5.870272335114702e-07, 'epoch': 1.79} {'loss': 0.3443, 'learning_rate': 5.86913819895476e-07, 'epoch': 1.79} {'loss': 0.3116, 'learning_rate': 5.868004169050656e-07, 'epoch': 1.79} {'loss': 0.2125, 'learning_rate': 5.866870245403689e-07, 'epoch': 1.79} {'loss': 0.286, 'learning_rate': 5.8657364280151e-07, 'epoch': 1.79} {'loss': 0.3261, 'learning_rate': 5.864602716886225e-07, 'epoch': 1.79} {'loss': 0.2457, 'learning_rate': 5.863469112018283e-07, 'epoch': 1.79} {'loss': 0.3625, 'learning_rate': 5.862335613412607e-07, 'epoch': 1.79} {'loss': 0.2545, 'learning_rate': 5.861202221070439e-07, 'epoch': 1.79} {'loss': 0.2695, 'learning_rate': 5.860068934993091e-07, 'epoch': 1.79} {'loss': 0.3551, 'learning_rate': 5.858935755181794e-07, 'epoch': 1.79} {'loss': 0.4205, 'learning_rate': 5.857802681637881e-07, 'epoch': 1.79} {'loss': 0.3612, 'learning_rate': 5.856669714362606e-07, 'epoch': 1.79} {'loss': 0.224, 'learning_rate': 5.855536853357235e-07, 'epoch': 1.79} {'loss': 0.3852, 'learning_rate': 5.854404098623079e-07, 'epoch': 1.79} {'loss': 0.2585, 'learning_rate': 5.853271450161379e-07, 'epoch': 1.79} {'loss': 0.2623, 'learning_rate': 5.852138907973448e-07, 'epoch': 1.79} {'loss': 0.2544, 'learning_rate': 5.851006472060528e-07, 'epoch': 1.79} {'loss': 0.3932, 'learning_rate': 5.849874142423939e-07, 'epoch': 1.79} {'loss': 0.3746, 'learning_rate': 5.848741919064926e-07, 'epoch': 1.79} {'loss': 0.2619, 'learning_rate': 5.847609801984788e-07, 'epoch': 1.79} {'loss': 0.2915, 'learning_rate': 5.84647779118479e-07, 'epoch': 1.79} {'loss': 0.3354, 'learning_rate': 5.84534588666622e-07, 'epoch': 1.79} {'loss': 0.2752, 'learning_rate': 5.844214088430334e-07, 'epoch': 1.79} {'loss': 0.3265, 'learning_rate': 5.84308239647845e-07, 'epoch': 1.79} {'loss': 0.2059, 'learning_rate': 5.841950810811814e-07, 'epoch': 1.79} {'loss': 0.2947, 'learning_rate': 5.840819331431702e-07, 'epoch': 1.79} {'loss': 0.1917, 'learning_rate': 5.839687958339402e-07, 'epoch': 1.79} {'loss': 0.3022, 'learning_rate': 5.83855669153619e-07, 'epoch': 1.79} {'loss': 0.4199, 'learning_rate': 5.837425531023344e-07, 'epoch': 1.79} {'loss': 0.3184, 'learning_rate': 5.836294476802129e-07, 'epoch': 1.79} {'loss': 0.3172, 'learning_rate': 5.835163528873844e-07, 'epoch': 1.79} {'loss': 0.2389, 'learning_rate': 5.834032687239743e-07, 'epoch': 1.79} {'loss': 0.4045, 'learning_rate': 5.832901951901126e-07, 'epoch': 1.79} {'loss': 0.2397, 'learning_rate': 5.831771322859236e-07, 'epoch': 1.79} {'loss': 0.369, 'learning_rate': 5.830640800115395e-07, 'epoch': 1.79} {'loss': 0.2682, 'learning_rate': 5.829510383670833e-07, 'epoch': 1.79} {'loss': 0.277, 'learning_rate': 5.828380073526863e-07, 'epoch': 1.79} {'loss': 0.1935, 'learning_rate': 5.827249869684737e-07, 'epoch': 1.79} {'loss': 0.2501, 'learning_rate': 5.826119772145733e-07, 'epoch': 1.79} {'loss': 0.325, 'learning_rate': 5.824989780911139e-07, 'epoch': 1.79} {'loss': 0.37, 'learning_rate': 5.823859895982209e-07, 'epoch': 1.79} {'loss': 0.3434, 'learning_rate': 5.822730117360253e-07, 'epoch': 1.79} {'loss': 0.4443, 'learning_rate': 5.821600445046505e-07, 'epoch': 1.79} {'loss': 0.2891, 'learning_rate': 5.820470879042283e-07, 'epoch': 1.79} {'loss': 0.1893, 'learning_rate': 5.819341419348823e-07, 'epoch': 1.79} {'loss': 0.3646, 'learning_rate': 5.818212065967422e-07, 'epoch': 1.79} {'loss': 0.2473, 'learning_rate': 5.817082818899345e-07, 'epoch': 1.79} {'loss': 0.2566, 'learning_rate': 5.815953678145891e-07, 'epoch': 1.79} {'loss': 0.1071, 'learning_rate': 5.814824643708294e-07, 'epoch': 1.79} {'loss': 0.3553, 'learning_rate': 5.813695715587864e-07, 'epoch': 1.79} {'loss': 0.3564, 'learning_rate': 5.812566893785865e-07, 'epoch': 1.79} {'loss': 0.3556, 'learning_rate': 5.811438178303552e-07, 'epoch': 1.79} {'loss': 0.32, 'learning_rate': 5.810309569142225e-07, 'epoch': 1.79} {'loss': 0.2893, 'learning_rate': 5.809181066303138e-07, 'epoch': 1.79} {'loss': 0.2542, 'learning_rate': 5.808052669787579e-07, 'epoch': 1.79} {'loss': 0.2805, 'learning_rate': 5.806924379596812e-07, 'epoch': 1.79} {'loss': 0.1764, 'learning_rate': 5.805796195732128e-07, 'epoch': 1.79} {'loss': 0.312, 'learning_rate': 5.804668118194779e-07, 'epoch': 1.79} {'loss': 0.3752, 'learning_rate': 5.803540146986053e-07, 'epoch': 1.79} {'loss': 0.2312, 'learning_rate': 5.802412282107206e-07, 'epoch': 1.79} {'loss': 0.3652, 'learning_rate': 5.801284523559547e-07, 'epoch': 1.79} {'loss': 0.2598, 'learning_rate': 5.800156871344298e-07, 'epoch': 1.79} {'loss': 0.3046, 'learning_rate': 5.799029325462779e-07, 'epoch': 1.79} {'loss': 0.2342, 'learning_rate': 5.797901885916246e-07, 'epoch': 1.79} {'loss': 0.265, 'learning_rate': 5.796774552705942e-07, 'epoch': 1.79} {'loss': 0.3143, 'learning_rate': 5.795647325833187e-07, 'epoch': 1.79} {'loss': 0.3839, 'learning_rate': 5.794520205299226e-07, 'epoch': 1.79} {'loss': 0.4573, 'learning_rate': 5.793393191105345e-07, 'epoch': 1.79} {'loss': 0.3133, 'learning_rate': 5.79226628325279e-07, 'epoch': 1.79} {'loss': 0.3598, 'learning_rate': 5.79113948174288e-07, 'epoch': 1.79} {'loss': 0.2906, 'learning_rate': 5.790012786576826e-07, 'epoch': 1.79} {'loss': 0.3184, 'learning_rate': 5.788886197755961e-07, 'epoch': 1.79} {'loss': 0.1372, 'learning_rate': 5.787759715281516e-07, 'epoch': 1.79} {'loss': 0.3939, 'learning_rate': 5.786633339154779e-07, 'epoch': 1.79} {'loss': 0.4231, 'learning_rate': 5.785507069377006e-07, 'epoch': 1.79} {'loss': 0.2721, 'learning_rate': 5.784380905949483e-07, 'epoch': 1.79} {'loss': 0.3714, 'learning_rate': 5.783254848873487e-07, 'epoch': 1.79} {'loss': 0.2817, 'learning_rate': 5.782128898150275e-07, 'epoch': 1.79} {'loss': 0.2555, 'learning_rate': 5.781003053781131e-07, 'epoch': 1.79} {'loss': 0.3044, 'learning_rate': 5.779877315767302e-07, 'epoch': 1.79} {'loss': 0.3352, 'learning_rate': 5.778751684110095e-07, 'epoch': 1.79} {'loss': 0.2954, 'learning_rate': 5.777626158810734e-07, 'epoch': 1.79} {'loss': 0.2693, 'learning_rate': 5.776500739870539e-07, 'epoch': 1.79} {'loss': 0.2709, 'learning_rate': 5.775375427290764e-07, 'epoch': 1.79} {'loss': 0.3735, 'learning_rate': 5.774250221072653e-07, 'epoch': 1.79} {'loss': 0.2257, 'learning_rate': 5.773125121217504e-07, 'epoch': 1.79} {'loss': 0.272, 'learning_rate': 5.772000127726563e-07, 'epoch': 1.79} {'loss': 0.3002, 'learning_rate': 5.770875240601137e-07, 'epoch': 1.79} {'loss': 0.15, 'learning_rate': 5.76975045984246e-07, 'epoch': 1.79} {'loss': 0.3493, 'learning_rate': 5.768625785451831e-07, 'epoch': 1.79} {'loss': 0.2507, 'learning_rate': 5.767501217430483e-07, 'epoch': 1.79} {'loss': 0.1921, 'learning_rate': 5.766376755779735e-07, 'epoch': 1.79} {'loss': 0.4916, 'learning_rate': 5.765252400500798e-07, 'epoch': 1.79} {'loss': 0.3728, 'learning_rate': 5.764128151594994e-07, 'epoch': 1.79} {'loss': 0.3325, 'learning_rate': 5.763004009063555e-07, 'epoch': 1.79} {'loss': 0.354, 'learning_rate': 5.76187997290778e-07, 'epoch': 1.79} {'loss': 0.2864, 'learning_rate': 5.760756043128924e-07, 'epoch': 1.79} {'loss': 0.3188, 'learning_rate': 5.759632219728228e-07, 'epoch': 1.79} {'loss': 0.5684, 'learning_rate': 5.758508502707016e-07, 'epoch': 1.79} {'loss': 0.3824, 'learning_rate': 5.757384892066509e-07, 'epoch': 1.79} {'loss': 0.3745, 'learning_rate': 5.756261387808005e-07, 'epoch': 1.79} {'loss': 0.3088, 'learning_rate': 5.755137989932735e-07, 'epoch': 1.79} {'loss': 0.2019, 'learning_rate': 5.754014698442023e-07, 'epoch': 1.79} {'loss': 0.351, 'learning_rate': 5.752891513337089e-07, 'epoch': 1.79} {'loss': 0.3001, 'learning_rate': 5.751768434619231e-07, 'epoch': 1.79} {'loss': 0.3786, 'learning_rate': 5.750645462289683e-07, 'epoch': 1.79} {'loss': 0.3079, 'learning_rate': 5.749522596349766e-07, 'epoch': 1.79} {'loss': 0.3778, 'learning_rate': 5.748399836800689e-07, 'epoch': 1.79} {'loss': 0.2824, 'learning_rate': 5.747277183643763e-07, 'epoch': 1.79} {'loss': 0.2802, 'learning_rate': 5.74615463688023e-07, 'epoch': 1.79} {'loss': 0.2588, 'learning_rate': 5.745032196511357e-07, 'epoch': 1.79} {'loss': 0.4196, 'learning_rate': 5.743909862538433e-07, 'epoch': 1.79} {'loss': 0.3631, 'learning_rate': 5.742787634962699e-07, 'epoch': 1.79} {'loss': 0.3983, 'learning_rate': 5.741665513785455e-07, 'epoch': 1.79} {'loss': 0.4193, 'learning_rate': 5.740543499007923e-07, 'epoch': 1.79} {'loss': 0.179, 'learning_rate': 5.739421590631411e-07, 'epoch': 1.79} {'loss': 0.3203, 'learning_rate': 5.738299788657143e-07, 'epoch': 1.79} {'loss': 0.2128, 'learning_rate': 5.737178093086437e-07, 'epoch': 1.79} {'loss': 0.4166, 'learning_rate': 5.736056503920506e-07, 'epoch': 1.79} {'loss': 0.3884, 'learning_rate': 5.73493502116067e-07, 'epoch': 1.79} {'loss': 0.3683, 'learning_rate': 5.73381364480815e-07, 'epoch': 1.79} {'loss': 0.2813, 'learning_rate': 5.732692374864235e-07, 'epoch': 1.79} {'loss': 0.2737, 'learning_rate': 5.731571211330178e-07, 'epoch': 1.79} {'loss': 0.2852, 'learning_rate': 5.730450154207257e-07, 'epoch': 1.79} {'loss': 0.3939, 'learning_rate': 5.729329203496737e-07, 'epoch': 1.79} {'loss': 0.3437, 'learning_rate': 5.72820835919986e-07, 'epoch': 1.79} {'loss': 0.2345, 'learning_rate': 5.727087621317929e-07, 'epoch': 1.79} {'loss': 0.2212, 'learning_rate': 5.725966989852172e-07, 'epoch': 1.79} {'loss': 0.4737, 'learning_rate': 5.72484646480389e-07, 'epoch': 1.79} {'loss': 0.2393, 'learning_rate': 5.723726046174316e-07, 'epoch': 1.79} {'loss': 0.2947, 'learning_rate': 5.722605733964737e-07, 'epoch': 1.79} {'loss': 0.2483, 'learning_rate': 5.721485528176385e-07, 'epoch': 1.79} {'loss': 0.2181, 'learning_rate': 5.720365428810581e-07, 'epoch': 1.79} {'loss': 0.1659, 'learning_rate': 5.719245435868526e-07, 'epoch': 1.79} {'loss': 0.2802, 'learning_rate': 5.718125549351539e-07, 'epoch': 1.79} {'loss': 0.2355, 'learning_rate': 5.717005769260841e-07, 'epoch': 1.79} {'loss': 0.3855, 'learning_rate': 5.715886095597734e-07, 'epoch': 1.79} {'loss': 0.327, 'learning_rate': 5.714766528363458e-07, 'epoch': 1.79} {'loss': 0.5727, 'learning_rate': 5.71364706755927e-07, 'epoch': 1.79} {'loss': 0.3888, 'learning_rate': 5.712527713186456e-07, 'epoch': 1.79} {'loss': 0.3714, 'learning_rate': 5.711408465246249e-07, 'epoch': 1.79} {'loss': 0.3222, 'learning_rate': 5.710289323739959e-07, 'epoch': 1.79} {'loss': 0.2616, 'learning_rate': 5.709170288668797e-07, 'epoch': 1.79} {'loss': 0.3764, 'learning_rate': 5.708051360034073e-07, 'epoch': 1.79} {'loss': 0.2604, 'learning_rate': 5.706932537837007e-07, 'epoch': 1.79} {'loss': 0.4099, 'learning_rate': 5.705813822078909e-07, 'epoch': 1.79} {'loss': 0.4533, 'learning_rate': 5.704695212760991e-07, 'epoch': 1.79} {'loss': 0.4944, 'learning_rate': 5.703576709884562e-07, 'epoch': 1.79} {'loss': 0.2942, 'learning_rate': 5.702458313450853e-07, 'epoch': 1.79} {'loss': 0.3035, 'learning_rate': 5.701340023461143e-07, 'epoch': 1.79} {'loss': 0.3454, 'learning_rate': 5.700221839916686e-07, 'epoch': 1.79} {'loss': 0.462, 'learning_rate': 5.699103762818748e-07, 'epoch': 1.79} {'loss': 0.3746, 'learning_rate': 5.697985792168592e-07, 'epoch': 1.79} {'loss': 0.3974, 'learning_rate': 5.696867927967465e-07, 'epoch': 1.79} {'loss': 0.4394, 'learning_rate': 5.695750170216652e-07, 'epoch': 1.79} {'loss': 0.4392, 'learning_rate': 5.694632518917398e-07, 'epoch': 1.79} {'loss': 0.2094, 'learning_rate': 5.693514974070979e-07, 'epoch': 1.79} {'loss': 0.247, 'learning_rate': 5.692397535678628e-07, 'epoch': 1.79} {'loss': 0.3701, 'learning_rate': 5.691280203741656e-07, 'epoch': 1.79} {'loss': 0.2056, 'learning_rate': 5.690162978261271e-07, 'epoch': 1.79} {'loss': 0.3372, 'learning_rate': 5.689045859238773e-07, 'epoch': 1.79} {'loss': 0.321, 'learning_rate': 5.687928846675406e-07, 'epoch': 1.79} {'loss': 0.333, 'learning_rate': 5.686811940572435e-07, 'epoch': 1.79} {'loss': 0.2761, 'learning_rate': 5.685695140931124e-07, 'epoch': 1.79} {'loss': 0.1993, 'learning_rate': 5.684578447752708e-07, 'epoch': 1.79} {'loss': 0.3051, 'learning_rate': 5.683461861038486e-07, 'epoch': 1.79} {'loss': 0.2677, 'learning_rate': 5.682345380789689e-07, 'epoch': 1.79} {'loss': 0.2694, 'learning_rate': 5.681229007007593e-07, 'epoch': 1.79} {'loss': 0.2435, 'learning_rate': 5.680112739693455e-07, 'epoch': 1.79} {'loss': 0.2419, 'learning_rate': 5.678996578848539e-07, 'epoch': 1.79} {'loss': 0.2256, 'learning_rate': 5.677880524474089e-07, 'epoch': 1.79} {'loss': 0.3303, 'learning_rate': 5.67676457657138e-07, 'epoch': 1.79} {'loss': 0.1507, 'learning_rate': 5.675648735141659e-07, 'epoch': 1.79} {'loss': 0.4178, 'learning_rate': 5.6745330001862e-07, 'epoch': 1.79} {'loss': 0.356, 'learning_rate': 5.673417371706269e-07, 'epoch': 1.79} {'loss': 0.3052, 'learning_rate': 5.672301849703088e-07, 'epoch': 1.79} {'loss': 0.3988, 'learning_rate': 5.671186434177967e-07, 'epoch': 1.79} {'loss': 0.4236, 'learning_rate': 5.670071125132126e-07, 'epoch': 1.79} {'loss': 0.215, 'learning_rate': 5.668955922566844e-07, 'epoch': 1.79} {'loss': 0.1913, 'learning_rate': 5.667840826483362e-07, 'epoch': 1.79} {'loss': 0.2572, 'learning_rate': 5.666725836882958e-07, 'epoch': 1.79} {'loss': 0.3558, 'learning_rate': 5.665610953766875e-07, 'epoch': 1.79} {'loss': 0.3186, 'learning_rate': 5.664496177136391e-07, 'epoch': 1.79} {'loss': 0.4151, 'learning_rate': 5.663381506992749e-07, 'epoch': 1.79} {'loss': 0.3705, 'learning_rate': 5.662266943337202e-07, 'epoch': 1.79} {'loss': 0.1725, 'learning_rate': 5.661152486171029e-07, 'epoch': 1.79} {'loss': 0.4955, 'learning_rate': 5.66003813549546e-07, 'epoch': 1.79} {'loss': 0.3603, 'learning_rate': 5.658923891311785e-07, 'epoch': 1.79} {'loss': 0.3746, 'learning_rate': 5.657809753621224e-07, 'epoch': 1.79} {'loss': 0.397, 'learning_rate': 5.656695722425076e-07, 'epoch': 1.79} {'loss': 0.2526, 'learning_rate': 5.655581797724563e-07, 'epoch': 1.79} {'loss': 0.2386, 'learning_rate': 5.654467979520973e-07, 'epoch': 1.79} {'loss': 0.3003, 'learning_rate': 5.653354267815536e-07, 'epoch': 1.79} {'loss': 0.1683, 'learning_rate': 5.652240662609531e-07, 'epoch': 1.79} {'loss': 0.3957, 'learning_rate': 5.65112716390419e-07, 'epoch': 1.79} {'loss': 0.3643, 'learning_rate': 5.650013771700802e-07, 'epoch': 1.79} {'loss': 0.2047, 'learning_rate': 5.648900486000608e-07, 'epoch': 1.79} {'loss': 0.303, 'learning_rate': 5.647787306804841e-07, 'epoch': 1.79} {'loss': 0.2424, 'learning_rate': 5.646674234114802e-07, 'epoch': 1.79} {'loss': 0.209, 'learning_rate': 5.645561267931709e-07, 'epoch': 1.79} {'loss': 0.3144, 'learning_rate': 5.644448408256853e-07, 'epoch': 1.79} {'loss': 0.2862, 'learning_rate': 5.643335655091453e-07, 'epoch': 1.79} {'loss': 0.2768, 'learning_rate': 5.642223008436809e-07, 'epoch': 1.79} {'loss': 0.4586, 'learning_rate': 5.64111046829413e-07, 'epoch': 1.79} {'loss': 0.2594, 'learning_rate': 5.639998034664706e-07, 'epoch': 1.79} {'loss': 0.3561, 'learning_rate': 5.638885707549768e-07, 'epoch': 1.79} {'loss': 0.4794, 'learning_rate': 5.637773486950604e-07, 'epoch': 1.79} {'loss': 0.259, 'learning_rate': 5.636661372868424e-07, 'epoch': 1.79} {'loss': 0.3121, 'learning_rate': 5.635549365304537e-07, 'epoch': 1.79} {'loss': 0.3539, 'learning_rate': 5.634437464260168e-07, 'epoch': 1.79} {'loss': 0.4008, 'learning_rate': 5.633325669736555e-07, 'epoch': 1.79} {'loss': 0.2891, 'learning_rate': 5.632213981734991e-07, 'epoch': 1.79} {'loss': 0.2426, 'learning_rate': 5.631102400256694e-07, 'epoch': 1.79} {'loss': 0.4185, 'learning_rate': 5.629990925302953e-07, 'epoch': 1.79} {'loss': 0.2202, 'learning_rate': 5.628879556874989e-07, 'epoch': 1.79} {'loss': 0.1946, 'learning_rate': 5.627768294974101e-07, 'epoch': 1.79} {'loss': 0.299, 'learning_rate': 5.626657139601488e-07, 'epoch': 1.79} {'loss': 0.2883, 'learning_rate': 5.62554609075846e-07, 'epoch': 1.79} {'loss': 0.2702, 'learning_rate': 5.624435148446228e-07, 'epoch': 1.79} {'loss': 0.275, 'learning_rate': 5.623324312666067e-07, 'epoch': 1.79} {'loss': 0.3612, 'learning_rate': 5.622213583419223e-07, 'epoch': 1.79} {'loss': 0.3041, 'learning_rate': 5.621102960706959e-07, 'epoch': 1.79} {'loss': 0.3355, 'learning_rate': 5.619992444530531e-07, 'epoch': 1.79} {'loss': 0.2215, 'learning_rate': 5.61888203489116e-07, 'epoch': 1.79} {'loss': 0.3909, 'learning_rate': 5.617771731790144e-07, 'epoch': 1.79} {'loss': 0.4121, 'learning_rate': 5.616661535228707e-07, 'epoch': 1.79} {'loss': 0.2767, 'learning_rate': 5.615551445208112e-07, 'epoch': 1.79} {'loss': 0.3994, 'learning_rate': 5.614441461729603e-07, 'epoch': 1.79} {'loss': 0.4521, 'learning_rate': 5.613331584794468e-07, 'epoch': 1.79} {'loss': 0.3031, 'learning_rate': 5.612221814403907e-07, 'epoch': 1.79} {'loss': 0.4039, 'learning_rate': 5.611112150559217e-07, 'epoch': 1.79} {'loss': 0.1419, 'learning_rate': 5.610002593261609e-07, 'epoch': 1.79} {'loss': 0.474, 'learning_rate': 5.608893142512384e-07, 'epoch': 1.79} {'loss': 0.2707, 'learning_rate': 5.607783798312749e-07, 'epoch': 1.79} {'loss': 0.2547, 'learning_rate': 5.606674560663994e-07, 'epoch': 1.79} {'loss': 0.286, 'learning_rate': 5.60556542956735e-07, 'epoch': 1.79} {'loss': 0.3312, 'learning_rate': 5.604456405024061e-07, 'epoch': 1.79} {'loss': 0.3015, 'learning_rate': 5.603347487035404e-07, 'epoch': 1.79} {'loss': 0.4297, 'learning_rate': 5.602238675602612e-07, 'epoch': 1.79} {'loss': 0.3404, 'learning_rate': 5.601129970726949e-07, 'epoch': 1.79} {'loss': 0.4506, 'learning_rate': 5.600021372409637e-07, 'epoch': 1.79} {'loss': 0.4233, 'learning_rate': 5.598912880651975e-07, 'epoch': 1.79} {'loss': 0.3634, 'learning_rate': 5.597804495455172e-07, 'epoch': 1.79} {'loss': 0.2179, 'learning_rate': 5.596696216820508e-07, 'epoch': 1.79} {'loss': 0.3689, 'learning_rate': 5.595588044749212e-07, 'epoch': 1.79} {'loss': 0.2414, 'learning_rate': 5.594479979242562e-07, 'epoch': 1.79} {'loss': 0.3725, 'learning_rate': 5.593372020301769e-07, 'epoch': 1.79} {'loss': 0.2253, 'learning_rate': 5.59226416792813e-07, 'epoch': 1.79} {'loss': 0.3224, 'learning_rate': 5.591156422122867e-07, 'epoch': 1.79} {'loss': 0.3114, 'learning_rate': 5.590048782887225e-07, 'epoch': 1.79} {'loss': 0.3361, 'learning_rate': 5.58894125022248e-07, 'epoch': 1.79} {'loss': 0.4569, 'learning_rate': 5.587833824129851e-07, 'epoch': 1.79} {'loss': 0.3902, 'learning_rate': 5.586726504610618e-07, 'epoch': 1.79} {'loss': 0.3889, 'learning_rate': 5.585619291666001e-07, 'epoch': 1.79} {'loss': 0.3431, 'learning_rate': 5.584512185297275e-07, 'epoch': 1.79} {'loss': 0.3117, 'learning_rate': 5.583405185505674e-07, 'epoch': 1.79} {'loss': 0.1742, 'learning_rate': 5.582298292292477e-07, 'epoch': 1.79} {'loss': 0.317, 'learning_rate': 5.581191505658878e-07, 'epoch': 1.79} {'loss': 0.1829, 'learning_rate': 5.580084825606191e-07, 'epoch': 1.79} {'loss': 0.3873, 'learning_rate': 5.578978252135603e-07, 'epoch': 1.79} {'loss': 0.4044, 'learning_rate': 5.577871785248423e-07, 'epoch': 1.79} {'loss': 0.3131, 'learning_rate': 5.576765424945862e-07, 'epoch': 1.79} {'loss': 0.3559, 'learning_rate': 5.575659171229164e-07, 'epoch': 1.79} {'loss': 0.2497, 'learning_rate': 5.574553024099605e-07, 'epoch': 1.79} {'loss': 0.297, 'learning_rate': 5.573446983558406e-07, 'epoch': 1.79} {'loss': 0.2235, 'learning_rate': 5.572341049606844e-07, 'epoch': 1.79} {'loss': 0.182, 'learning_rate': 5.571235222246141e-07, 'epoch': 1.79} {'loss': 0.2668, 'learning_rate': 5.570129501477573e-07, 'epoch': 1.79} {'loss': 0.237, 'learning_rate': 5.569023887302349e-07, 'epoch': 1.79} {'loss': 0.2441, 'learning_rate': 5.56791837972176e-07, 'epoch': 1.79} {'loss': 0.3515, 'learning_rate': 5.566812978737024e-07, 'epoch': 1.79} {'loss': 0.4019, 'learning_rate': 5.565707684349409e-07, 'epoch': 1.79} {'loss': 0.434, 'learning_rate': 5.564602496560135e-07, 'epoch': 1.79} {'loss': 0.3564, 'learning_rate': 5.563497415370467e-07, 'epoch': 1.79} {'loss': 0.2712, 'learning_rate': 5.562392440781672e-07, 'epoch': 1.79} {'loss': 0.1571, 'learning_rate': 5.56128757279496e-07, 'epoch': 1.79} {'loss': 0.3521, 'learning_rate': 5.560182811411618e-07, 'epoch': 1.79} {'loss': 0.3616, 'learning_rate': 5.559078156632846e-07, 'epoch': 1.79} {'loss': 0.3404, 'learning_rate': 5.557973608459932e-07, 'epoch': 1.79} {'loss': 0.3108, 'learning_rate': 5.556869166894096e-07, 'epoch': 1.79} {'loss': 0.1567, 'learning_rate': 5.555764831936605e-07, 'epoch': 1.79} {'loss': 0.1859, 'learning_rate': 5.55466060358869e-07, 'epoch': 1.79} {'loss': 0.2566, 'learning_rate': 5.553556481851619e-07, 'epoch': 1.79} {'loss': 0.2422, 'learning_rate': 5.55245246672661e-07, 'epoch': 1.79} {'loss': 0.264, 'learning_rate': 5.551348558214919e-07, 'epoch': 1.79} {'loss': 0.3972, 'learning_rate': 5.550244756317802e-07, 'epoch': 1.79} {'loss': 0.3291, 'learning_rate': 5.549141061036489e-07, 'epoch': 1.79} {'loss': 0.3569, 'learning_rate': 5.548037472372247e-07, 'epoch': 1.79} {'loss': 0.3336, 'learning_rate': 5.546933990326298e-07, 'epoch': 1.79} {'loss': 0.3095, 'learning_rate': 5.545830614899916e-07, 'epoch': 1.79} {'loss': 0.1447, 'learning_rate': 5.544727346094314e-07, 'epoch': 1.79} {'loss': 0.1287, 'learning_rate': 5.543624183910756e-07, 'epoch': 1.79} {'loss': 0.4851, 'learning_rate': 5.542521128350487e-07, 'epoch': 1.79} {'loss': 0.2032, 'learning_rate': 5.541418179414759e-07, 'epoch': 1.79} {'loss': 0.271, 'learning_rate': 5.540315337104785e-07, 'epoch': 1.79} {'loss': 0.2883, 'learning_rate': 5.53921260142185e-07, 'epoch': 1.79} {'loss': 0.2901, 'learning_rate': 5.538109972367189e-07, 'epoch': 1.79} {'loss': 0.2206, 'learning_rate': 5.537007449942022e-07, 'epoch': 1.79} {'loss': 0.2954, 'learning_rate': 5.535905034147626e-07, 'epoch': 1.79} {'loss': 0.3382, 'learning_rate': 5.534802724985211e-07, 'epoch': 1.79} {'loss': 0.3246, 'learning_rate': 5.533700522456053e-07, 'epoch': 1.79} {'loss': 0.3532, 'learning_rate': 5.532598426561375e-07, 'epoch': 1.79} {'loss': 0.3232, 'learning_rate': 5.531496437302442e-07, 'epoch': 1.79} {'loss': 0.4125, 'learning_rate': 5.530394554680473e-07, 'epoch': 1.79} {'loss': 0.2462, 'learning_rate': 5.529292778696738e-07, 'epoch': 1.79} {'loss': 0.3164, 'learning_rate': 5.528191109352454e-07, 'epoch': 1.79} {'loss': 0.1672, 'learning_rate': 5.52708954664889e-07, 'epoch': 1.79} {'loss': 0.3437, 'learning_rate': 5.525988090587254e-07, 'epoch': 1.79} {'loss': 0.1902, 'learning_rate': 5.524886741168844e-07, 'epoch': 1.79} {'loss': 0.2843, 'learning_rate': 5.523785498394862e-07, 'epoch': 1.79} {'loss': 0.3273, 'learning_rate': 5.522684362266539e-07, 'epoch': 1.79} {'loss': 0.4946, 'learning_rate': 5.521583332785163e-07, 'epoch': 1.79} {'loss': 0.2509, 'learning_rate': 5.520482409951944e-07, 'epoch': 1.79} {'loss': 0.3197, 'learning_rate': 5.519381593768136e-07, 'epoch': 1.79} {'loss': 0.2502, 'learning_rate': 5.518280884234972e-07, 'epoch': 1.79} {'loss': 0.323, 'learning_rate': 5.517180281353718e-07, 'epoch': 1.79} {'loss': 0.3022, 'learning_rate': 5.516079785125583e-07, 'epoch': 1.79} {'loss': 0.2774, 'learning_rate': 5.514979395551845e-07, 'epoch': 1.79} {'loss': 0.202, 'learning_rate': 5.513879112633714e-07, 'epoch': 1.79} {'loss': 0.3232, 'learning_rate': 5.512778936372465e-07, 'epoch': 1.79} {'loss': 0.3998, 'learning_rate': 5.511678866769299e-07, 'epoch': 1.79} {'loss': 0.4885, 'learning_rate': 5.510578903825492e-07, 'epoch': 1.79} {'loss': 0.2364, 'learning_rate': 5.509479047542277e-07, 'epoch': 1.79} {'loss': 0.3252, 'learning_rate': 5.508379297920874e-07, 'epoch': 1.79} {'loss': 0.3695, 'learning_rate': 5.50727965496256e-07, 'epoch': 1.79} {'loss': 0.3062, 'learning_rate': 5.506180118668547e-07, 'epoch': 1.79} {'loss': 0.2278, 'learning_rate': 5.505080689040099e-07, 'epoch': 1.79} {'loss': 0.347, 'learning_rate': 5.503981366078437e-07, 'epoch': 1.79} {'loss': 0.2271, 'learning_rate': 5.502882149784816e-07, 'epoch': 1.79} {'loss': 0.3524, 'learning_rate': 5.501783040160468e-07, 'epoch': 1.79} {'loss': 0.3083, 'learning_rate': 5.500684037206639e-07, 'epoch': 1.79} {'loss': 0.2339, 'learning_rate': 5.499585140924568e-07, 'epoch': 1.79} {'loss': 0.3633, 'learning_rate': 5.498486351315502e-07, 'epoch': 1.79} {'loss': 0.5199, 'learning_rate': 5.497387668380661e-07, 'epoch': 1.79} {'loss': 0.4395, 'learning_rate': 5.49628909212131e-07, 'epoch': 1.79} {'loss': 0.2862, 'learning_rate': 5.495190622538682e-07, 'epoch': 1.79} {'loss': 0.4021, 'learning_rate': 5.494092259633987e-07, 'epoch': 1.79} {'loss': 0.4459, 'learning_rate': 5.492994003408514e-07, 'epoch': 1.79} {'loss': 0.48, 'learning_rate': 5.491895853863472e-07, 'epoch': 1.79} {'loss': 0.3144, 'learning_rate': 5.490797811000115e-07, 'epoch': 1.79} {'loss': 0.3431, 'learning_rate': 5.489699874819665e-07, 'epoch': 1.79} {'loss': 0.3664, 'learning_rate': 5.488602045323377e-07, 'epoch': 1.79} {'loss': 0.261, 'learning_rate': 5.487504322512482e-07, 'epoch': 1.79} {'loss': 0.474, 'learning_rate': 5.486406706388226e-07, 'epoch': 1.79} {'loss': 0.2279, 'learning_rate': 5.485309196951838e-07, 'epoch': 1.79} {'loss': 0.3051, 'learning_rate': 5.484211794204575e-07, 'epoch': 1.79} {'loss': 0.288, 'learning_rate': 5.483114498147646e-07, 'epoch': 1.79} {'loss': 0.2751, 'learning_rate': 5.482017308782328e-07, 'epoch': 1.79} {'loss': 0.2297, 'learning_rate': 5.480920226109843e-07, 'epoch': 1.79} {'loss': 0.3896, 'learning_rate': 5.479823250131399e-07, 'epoch': 1.79} {'loss': 0.2349, 'learning_rate': 5.478726380848287e-07, 'epoch': 1.79} {'loss': 0.2704, 'learning_rate': 5.477629618261693e-07, 'epoch': 1.79} {'loss': 0.2558, 'learning_rate': 5.476532962372905e-07, 'epoch': 1.79} {'loss': 0.3528, 'learning_rate': 5.47543641318311e-07, 'epoch': 1.79} {'loss': 0.2206, 'learning_rate': 5.474339970693598e-07, 'epoch': 1.79} {'loss': 0.3023, 'learning_rate': 5.473243634905567e-07, 'epoch': 1.79} {'loss': 0.2731, 'learning_rate': 5.472147405820282e-07, 'epoch': 1.79} {'loss': 0.3177, 'learning_rate': 5.471051283438944e-07, 'epoch': 1.8} {'loss': 0.2235, 'learning_rate': 5.469955267762839e-07, 'epoch': 1.8} {'loss': 0.2791, 'learning_rate': 5.468859358793155e-07, 'epoch': 1.8} {'loss': 0.3588, 'learning_rate': 5.467763556531181e-07, 'epoch': 1.8} {'loss': 0.2697, 'learning_rate': 5.466667860978114e-07, 'epoch': 1.8} {'loss': 0.2622, 'learning_rate': 5.465572272135189e-07, 'epoch': 1.8} {'loss': 0.3213, 'learning_rate': 5.464476790003681e-07, 'epoch': 1.8} {'loss': 0.3113, 'learning_rate': 5.463381414584779e-07, 'epoch': 1.8} {'loss': 0.3098, 'learning_rate': 5.462286145879759e-07, 'epoch': 1.8} {'loss': 0.4167, 'learning_rate': 5.46119098388982e-07, 'epoch': 1.8} {'loss': 0.28, 'learning_rate': 5.460095928616238e-07, 'epoch': 1.8} {'loss': 0.1938, 'learning_rate': 5.459000980060214e-07, 'epoch': 1.8} {'loss': 0.2307, 'learning_rate': 5.457906138223024e-07, 'epoch': 1.8} {'loss': 0.332, 'learning_rate': 5.456811403105855e-07, 'epoch': 1.8} {'loss': 0.2003, 'learning_rate': 5.455716774709985e-07, 'epoch': 1.8} {'loss': 0.2058, 'learning_rate': 5.454622253036624e-07, 'epoch': 1.8} {'loss': 0.2424, 'learning_rate': 5.453527838087003e-07, 'epoch': 1.8} {'loss': 0.3182, 'learning_rate': 5.452433529862389e-07, 'epoch': 1.8} {'loss': 0.3028, 'learning_rate': 5.451339328363991e-07, 'epoch': 1.8} {'loss': 0.2781, 'learning_rate': 5.450245233593066e-07, 'epoch': 1.8} {'loss': 0.2387, 'learning_rate': 5.44915124555081e-07, 'epoch': 1.8} {'loss': 0.2512, 'learning_rate': 5.448057364238501e-07, 'epoch': 1.8} {'loss': 0.3674, 'learning_rate': 5.446963589657351e-07, 'epoch': 1.8} {'loss': 0.2312, 'learning_rate': 5.445869921808599e-07, 'epoch': 1.8} {'loss': 0.4144, 'learning_rate': 5.444776360693494e-07, 'epoch': 1.8} {'loss': 0.4247, 'learning_rate': 5.44368290631323e-07, 'epoch': 1.8} {'loss': 0.4282, 'learning_rate': 5.442589558669087e-07, 'epoch': 1.8} {'loss': 0.2589, 'learning_rate': 5.441496317762262e-07, 'epoch': 1.8} {'loss': 0.2842, 'learning_rate': 5.440403183594023e-07, 'epoch': 1.8} {'loss': 0.3036, 'learning_rate': 5.439310156165578e-07, 'epoch': 1.8} {'loss': 0.1517, 'learning_rate': 5.438217235478172e-07, 'epoch': 1.8} {'loss': 0.2973, 'learning_rate': 5.437124421533035e-07, 'epoch': 1.8} {'loss': 0.374, 'learning_rate': 5.436031714331413e-07, 'epoch': 1.8} {'loss': 0.333, 'learning_rate': 5.434939113874505e-07, 'epoch': 1.8} {'loss': 0.366, 'learning_rate': 5.433846620163596e-07, 'epoch': 1.8} {'loss': 0.3215, 'learning_rate': 5.432754233199877e-07, 'epoch': 1.8} {'loss': 0.3304, 'learning_rate': 5.431661952984601e-07, 'epoch': 1.8} {'loss': 0.1769, 'learning_rate': 5.430569779518991e-07, 'epoch': 1.8} {'loss': 0.3284, 'learning_rate': 5.429477712804288e-07, 'epoch': 1.8} {'loss': 0.4892, 'learning_rate': 5.428385752841725e-07, 'epoch': 1.8} {'loss': 0.3843, 'learning_rate': 5.427293899632524e-07, 'epoch': 1.8} {'loss': 0.3135, 'learning_rate': 5.426202153177928e-07, 'epoch': 1.8} {'loss': 0.2997, 'learning_rate': 5.425110513479159e-07, 'epoch': 1.8} {'loss': 0.1912, 'learning_rate': 5.424018980537471e-07, 'epoch': 1.8} {'loss': 0.25, 'learning_rate': 5.422927554354062e-07, 'epoch': 1.8} {'loss': 0.3055, 'learning_rate': 5.4218362349302e-07, 'epoch': 1.8} {'loss': 0.387, 'learning_rate': 5.420745022267082e-07, 'epoch': 1.8} {'loss': 0.4277, 'learning_rate': 5.419653916365974e-07, 'epoch': 1.8} {'loss': 0.3439, 'learning_rate': 5.418562917228076e-07, 'epoch': 1.8} {'loss': 0.3441, 'learning_rate': 5.417472024854653e-07, 'epoch': 1.8} {'loss': 0.4091, 'learning_rate': 5.416381239246903e-07, 'epoch': 1.8} {'loss': 0.2931, 'learning_rate': 5.415290560406083e-07, 'epoch': 1.8} {'loss': 0.529, 'learning_rate': 5.414199988333424e-07, 'epoch': 1.8} {'loss': 0.4073, 'learning_rate': 5.413109523030124e-07, 'epoch': 1.8} {'loss': 0.2299, 'learning_rate': 5.41201916449745e-07, 'epoch': 1.8} {'loss': 0.2859, 'learning_rate': 5.410928912736612e-07, 'epoch': 1.8} {'loss': 0.1999, 'learning_rate': 5.409838767748854e-07, 'epoch': 1.8} {'loss': 0.2056, 'learning_rate': 5.408748729535396e-07, 'epoch': 1.8} {'loss': 0.2207, 'learning_rate': 5.407658798097481e-07, 'epoch': 1.8} {'loss': 0.2492, 'learning_rate': 5.406568973436322e-07, 'epoch': 1.8} {'loss': 0.2212, 'learning_rate': 5.40547925555317e-07, 'epoch': 1.8} {'loss': 0.3208, 'learning_rate': 5.404389644449226e-07, 'epoch': 1.8} {'loss': 0.3309, 'learning_rate': 5.403300140125767e-07, 'epoch': 1.8} {'loss': 0.3863, 'learning_rate': 5.402210742583969e-07, 'epoch': 1.8} {'loss': 0.4487, 'learning_rate': 5.401121451825098e-07, 'epoch': 1.8} {'loss': 0.2954, 'learning_rate': 5.400032267850375e-07, 'epoch': 1.8} {'loss': 0.318, 'learning_rate': 5.39894319066101e-07, 'epoch': 1.8} {'loss': 0.3735, 'learning_rate': 5.397854220258269e-07, 'epoch': 1.8} {'loss': 0.244, 'learning_rate': 5.396765356643341e-07, 'epoch': 1.8} {'loss': 0.3474, 'learning_rate': 5.39567659981749e-07, 'epoch': 1.8} {'loss': 0.2628, 'learning_rate': 5.394587949781916e-07, 'epoch': 1.8} {'loss': 0.2355, 'learning_rate': 5.393499406537883e-07, 'epoch': 1.8} {'loss': 0.3235, 'learning_rate': 5.392410970086581e-07, 'epoch': 1.8} {'loss': 0.3062, 'learning_rate': 5.391322640429264e-07, 'epoch': 1.8} {'loss': 0.2773, 'learning_rate': 5.390234417567142e-07, 'epoch': 1.8} {'loss': 0.4388, 'learning_rate': 5.38914630150148e-07, 'epoch': 1.8} {'loss': 0.2312, 'learning_rate': 5.388058292233455e-07, 'epoch': 1.8} {'loss': 0.4092, 'learning_rate': 5.386970389764334e-07, 'epoch': 1.8} {'loss': 0.1759, 'learning_rate': 5.385882594095338e-07, 'epoch': 1.8} {'loss': 0.3637, 'learning_rate': 5.384794905227675e-07, 'epoch': 1.8} {'loss': 0.3819, 'learning_rate': 5.383707323162601e-07, 'epoch': 1.8} {'loss': 0.3938, 'learning_rate': 5.382619847901305e-07, 'epoch': 1.8} {'loss': 0.3592, 'learning_rate': 5.381532479445062e-07, 'epoch': 1.8} {'loss': 0.3778, 'learning_rate': 5.38044521779506e-07, 'epoch': 1.8} {'loss': 0.2451, 'learning_rate': 5.379358062952555e-07, 'epoch': 1.8} {'loss': 0.2736, 'learning_rate': 5.378271014918756e-07, 'epoch': 1.8} {'loss': 0.3285, 'learning_rate': 5.377184073694907e-07, 'epoch': 1.8} {'loss': 0.3009, 'learning_rate': 5.376097239282208e-07, 'epoch': 1.8} {'loss': 0.2786, 'learning_rate': 5.37501051168191e-07, 'epoch': 1.8} {'loss': 0.2629, 'learning_rate': 5.373923890895216e-07, 'epoch': 1.8} {'loss': 0.2848, 'learning_rate': 5.37283737692339e-07, 'epoch': 1.8} {'loss': 0.2238, 'learning_rate': 5.371750969767642e-07, 'epoch': 1.8} {'loss': 0.3717, 'learning_rate': 5.370664669429171e-07, 'epoch': 1.8} {'loss': 0.3041, 'learning_rate': 5.369578475909232e-07, 'epoch': 1.8} {'loss': 0.2833, 'learning_rate': 5.368492389209034e-07, 'epoch': 1.8} {'loss': 0.2935, 'learning_rate': 5.367406409329834e-07, 'epoch': 1.8} {'loss': 0.2443, 'learning_rate': 5.366320536272818e-07, 'epoch': 1.8} {'loss': 0.2519, 'learning_rate': 5.365234770039252e-07, 'epoch': 1.8} {'loss': 0.3157, 'learning_rate': 5.364149110630313e-07, 'epoch': 1.8} {'loss': 0.1867, 'learning_rate': 5.363063558047277e-07, 'epoch': 1.8} {'loss': 0.4416, 'learning_rate': 5.361978112291333e-07, 'epoch': 1.8} {'loss': 0.3693, 'learning_rate': 5.360892773363735e-07, 'epoch': 1.8} {'loss': 0.2595, 'learning_rate': 5.359807541265672e-07, 'epoch': 1.8} {'loss': 0.216, 'learning_rate': 5.358722415998407e-07, 'epoch': 1.8} {'loss': 0.4947, 'learning_rate': 5.357637397563142e-07, 'epoch': 1.8} {'loss': 0.3762, 'learning_rate': 5.356552485961097e-07, 'epoch': 1.8} {'loss': 0.2929, 'learning_rate': 5.355467681193527e-07, 'epoch': 1.8} {'loss': 0.3549, 'learning_rate': 5.354382983261608e-07, 'epoch': 1.8} {'loss': 0.2024, 'learning_rate': 5.353298392166617e-07, 'epoch': 1.8} {'loss': 0.2853, 'learning_rate': 5.352213907909743e-07, 'epoch': 1.8} {'loss': 0.2753, 'learning_rate': 5.351129530492227e-07, 'epoch': 1.8} {'loss': 0.3154, 'learning_rate': 5.350045259915282e-07, 'epoch': 1.8} {'loss': 0.3813, 'learning_rate': 5.34896109618015e-07, 'epoch': 1.8} {'loss': 0.4356, 'learning_rate': 5.34787703928803e-07, 'epoch': 1.8} {'loss': 0.3624, 'learning_rate': 5.346793089240143e-07, 'epoch': 1.8} {'loss': 0.3193, 'learning_rate': 5.345709246037756e-07, 'epoch': 1.8} {'loss': 0.3629, 'learning_rate': 5.344625509682044e-07, 'epoch': 1.8} {'loss': 0.2722, 'learning_rate': 5.343541880174275e-07, 'epoch': 1.8} {'loss': 0.3067, 'learning_rate': 5.342458357515623e-07, 'epoch': 1.8} {'loss': 0.2954, 'learning_rate': 5.341374941707345e-07, 'epoch': 1.8} {'loss': 0.336, 'learning_rate': 5.34029163275065e-07, 'epoch': 1.8} {'loss': 0.2983, 'learning_rate': 5.33920843064678e-07, 'epoch': 1.8} {'loss': 0.3767, 'learning_rate': 5.338125335396915e-07, 'epoch': 1.8} {'loss': 0.1571, 'learning_rate': 5.337042347002342e-07, 'epoch': 1.8} {'loss': 0.3167, 'learning_rate': 5.335959465464224e-07, 'epoch': 1.8} {'loss': 0.2714, 'learning_rate': 5.334876690783808e-07, 'epoch': 1.8} {'loss': 0.3012, 'learning_rate': 5.333794022962324e-07, 'epoch': 1.8} {'loss': 0.2432, 'learning_rate': 5.332711462000972e-07, 'epoch': 1.8} {'loss': 0.2498, 'learning_rate': 5.331629007901007e-07, 'epoch': 1.8} {'loss': 0.198, 'learning_rate': 5.330546660663605e-07, 'epoch': 1.8} {'loss': 0.3327, 'learning_rate': 5.329464420290032e-07, 'epoch': 1.8} {'loss': 0.2021, 'learning_rate': 5.328382286781475e-07, 'epoch': 1.8} {'loss': 0.3149, 'learning_rate': 5.327300260139189e-07, 'epoch': 1.8} {'loss': 0.272, 'learning_rate': 5.326218340364364e-07, 'epoch': 1.8} {'loss': 0.3173, 'learning_rate': 5.325136527458253e-07, 'epoch': 1.8} {'loss': 0.2296, 'learning_rate': 5.324054821422042e-07, 'epoch': 1.8} {'loss': 0.2077, 'learning_rate': 5.322973222256988e-07, 'epoch': 1.8} {'loss': 0.3422, 'learning_rate': 5.32189172996429e-07, 'epoch': 1.8} {'loss': 0.2485, 'learning_rate': 5.320810344545157e-07, 'epoch': 1.8} {'loss': 0.2829, 'learning_rate': 5.319729066000834e-07, 'epoch': 1.8} {'loss': 0.3275, 'learning_rate': 5.318647894332529e-07, 'epoch': 1.8} {'loss': 0.2311, 'learning_rate': 5.317566829541476e-07, 'epoch': 1.8} {'loss': 0.2374, 'learning_rate': 5.316485871628874e-07, 'epoch': 1.8} {'loss': 0.3059, 'learning_rate': 5.315405020595965e-07, 'epoch': 1.8} {'loss': 0.2471, 'learning_rate': 5.314324276443939e-07, 'epoch': 1.8} {'loss': 0.2293, 'learning_rate': 5.313243639174059e-07, 'epoch': 1.8} {'loss': 0.3231, 'learning_rate': 5.312163108787505e-07, 'epoch': 1.8} {'loss': 0.349, 'learning_rate': 5.311082685285517e-07, 'epoch': 1.8} {'loss': 0.3356, 'learning_rate': 5.310002368669309e-07, 'epoch': 1.8} {'loss': 0.3858, 'learning_rate': 5.308922158940121e-07, 'epoch': 1.8} {'loss': 0.3876, 'learning_rate': 5.307842056099144e-07, 'epoch': 1.8} {'loss': 0.2203, 'learning_rate': 5.306762060147597e-07, 'epoch': 1.8} {'loss': 0.4028, 'learning_rate': 5.305682171086712e-07, 'epoch': 1.8} {'loss': 0.3393, 'learning_rate': 5.304602388917701e-07, 'epoch': 1.8} {'loss': 0.2613, 'learning_rate': 5.303522713641795e-07, 'epoch': 1.8} {'loss': 0.2729, 'learning_rate': 5.302443145260195e-07, 'epoch': 1.8} {'loss': 0.3736, 'learning_rate': 5.301363683774152e-07, 'epoch': 1.8} {'loss': 0.3319, 'learning_rate': 5.300284329184835e-07, 'epoch': 1.8} {'loss': 0.3076, 'learning_rate': 5.299205081493508e-07, 'epoch': 1.8} {'loss': 0.3044, 'learning_rate': 5.298125940701349e-07, 'epoch': 1.8} {'loss': 0.2378, 'learning_rate': 5.297046906809622e-07, 'epoch': 1.8} {'loss': 0.1857, 'learning_rate': 5.295967979819494e-07, 'epoch': 1.8} {'loss': 0.2349, 'learning_rate': 5.294889159732231e-07, 'epoch': 1.8} {'loss': 0.2834, 'learning_rate': 5.29381044654903e-07, 'epoch': 1.8} {'loss': 0.226, 'learning_rate': 5.292731840271093e-07, 'epoch': 1.8} {'loss': 0.27, 'learning_rate': 5.291653340899672e-07, 'epoch': 1.8} {'loss': 0.2239, 'learning_rate': 5.290574948435944e-07, 'epoch': 1.8} {'loss': 0.3486, 'learning_rate': 5.289496662881155e-07, 'epoch': 1.8} {'loss': 0.2742, 'learning_rate': 5.288418484236513e-07, 'epoch': 1.8} {'loss': 0.4139, 'learning_rate': 5.287340412503239e-07, 'epoch': 1.8} {'loss': 0.3413, 'learning_rate': 5.286262447682545e-07, 'epoch': 1.8} {'loss': 0.2739, 'learning_rate': 5.285184589775649e-07, 'epoch': 1.8} {'loss': 0.4193, 'learning_rate': 5.284106838783764e-07, 'epoch': 1.8} {'loss': 0.1334, 'learning_rate': 5.283029194708134e-07, 'epoch': 1.8} {'loss': 0.2805, 'learning_rate': 5.281951657549921e-07, 'epoch': 1.8} {'loss': 0.3007, 'learning_rate': 5.280874227310395e-07, 'epoch': 1.8} {'loss': 0.3118, 'learning_rate': 5.279796903990752e-07, 'epoch': 1.8} {'loss': 0.3022, 'learning_rate': 5.278719687592193e-07, 'epoch': 1.8} {'loss': 0.4077, 'learning_rate': 5.27764257811596e-07, 'epoch': 1.8} {'loss': 0.316, 'learning_rate': 5.276565575563242e-07, 'epoch': 1.8} {'loss': 0.1722, 'learning_rate': 5.275488679935281e-07, 'epoch': 1.8} {'loss': 0.2729, 'learning_rate': 5.274411891233267e-07, 'epoch': 1.8} {'loss': 0.161, 'learning_rate': 5.273335209458452e-07, 'epoch': 1.8} {'loss': 0.4008, 'learning_rate': 5.272258634612005e-07, 'epoch': 1.8} {'loss': 0.2609, 'learning_rate': 5.271182166695177e-07, 'epoch': 1.8} {'loss': 0.3723, 'learning_rate': 5.270105805709158e-07, 'epoch': 1.8} {'loss': 0.2228, 'learning_rate': 5.269029551655203e-07, 'epoch': 1.8} {'loss': 0.4619, 'learning_rate': 5.267953404534465e-07, 'epoch': 1.8} {'loss': 0.3422, 'learning_rate': 5.266877364348222e-07, 'epoch': 1.8} {'loss': 0.3522, 'learning_rate': 5.265801431097661e-07, 'epoch': 1.8} {'loss': 0.3934, 'learning_rate': 5.264725604783972e-07, 'epoch': 1.8} {'loss': 0.3763, 'learning_rate': 5.263649885408406e-07, 'epoch': 1.8} {'loss': 0.3693, 'learning_rate': 5.262574272972165e-07, 'epoch': 1.8} {'loss': 0.3375, 'learning_rate': 5.261498767476458e-07, 'epoch': 1.8} {'loss': 0.1954, 'learning_rate': 5.260423368922507e-07, 'epoch': 1.8} {'loss': 0.2506, 'learning_rate': 5.259348077311521e-07, 'epoch': 1.8} {'loss': 0.1294, 'learning_rate': 5.258272892644711e-07, 'epoch': 1.8} {'loss': 0.2641, 'learning_rate': 5.25719781492331e-07, 'epoch': 1.8} {'loss': 0.2406, 'learning_rate': 5.256122844148492e-07, 'epoch': 1.8} {'loss': 0.2819, 'learning_rate': 5.255047980321526e-07, 'epoch': 1.8} {'loss': 0.2426, 'learning_rate': 5.253973223443565e-07, 'epoch': 1.8} {'loss': 0.2829, 'learning_rate': 5.252898573515874e-07, 'epoch': 1.8} {'loss': 0.2169, 'learning_rate': 5.251824030539621e-07, 'epoch': 1.8} {'loss': 0.2672, 'learning_rate': 5.250749594516059e-07, 'epoch': 1.8} {'loss': 0.2708, 'learning_rate': 5.249675265446386e-07, 'epoch': 1.8} {'loss': 0.4959, 'learning_rate': 5.248601043331803e-07, 'epoch': 1.8} {'loss': 0.269, 'learning_rate': 5.24752692817354e-07, 'epoch': 1.8} {'loss': 0.2349, 'learning_rate': 5.246452919972777e-07, 'epoch': 1.8} {'loss': 0.3255, 'learning_rate': 5.245379018730778e-07, 'epoch': 1.8} {'loss': 0.2599, 'learning_rate': 5.244305224448709e-07, 'epoch': 1.8} {'loss': 0.3665, 'learning_rate': 5.243231537127813e-07, 'epoch': 1.8} {'loss': 0.4037, 'learning_rate': 5.242157956769278e-07, 'epoch': 1.8} {'loss': 0.3832, 'learning_rate': 5.241084483374348e-07, 'epoch': 1.8} {'loss': 0.3473, 'learning_rate': 5.240011116944188e-07, 'epoch': 1.8} {'loss': 0.2913, 'learning_rate': 5.238937857480054e-07, 'epoch': 1.8} {'loss': 0.318, 'learning_rate': 5.237864704983131e-07, 'epoch': 1.8} {'loss': 0.2851, 'learning_rate': 5.236791659454643e-07, 'epoch': 1.8} {'loss': 0.2486, 'learning_rate': 5.2357187208958e-07, 'epoch': 1.8} {'loss': 0.1171, 'learning_rate': 5.234645889307799e-07, 'epoch': 1.8} {'loss': 0.4412, 'learning_rate': 5.233573164691885e-07, 'epoch': 1.8} {'loss': 0.2951, 'learning_rate': 5.232500547049224e-07, 'epoch': 1.8} {'loss': 0.236, 'learning_rate': 5.231428036381059e-07, 'epoch': 1.8} {'loss': 0.2747, 'learning_rate': 5.230355632688577e-07, 'epoch': 1.8} {'loss': 0.3407, 'learning_rate': 5.229283335973023e-07, 'epoch': 1.8} {'loss': 0.2325, 'learning_rate': 5.228211146235585e-07, 'epoch': 1.8} {'loss': 0.3114, 'learning_rate': 5.22713906347746e-07, 'epoch': 1.8} {'loss': 0.4311, 'learning_rate': 5.226067087699893e-07, 'epoch': 1.8} {'loss': 0.2977, 'learning_rate': 5.22499521890405e-07, 'epoch': 1.8} {'loss': 0.2829, 'learning_rate': 5.223923457091185e-07, 'epoch': 1.8} {'loss': 0.3, 'learning_rate': 5.222851802262475e-07, 'epoch': 1.8} {'loss': 0.2374, 'learning_rate': 5.22178025441915e-07, 'epoch': 1.8} {'loss': 0.2266, 'learning_rate': 5.220708813562403e-07, 'epoch': 1.8} {'loss': 0.4675, 'learning_rate': 5.219637479693462e-07, 'epoch': 1.8} {'loss': 0.3977, 'learning_rate': 5.218566252813518e-07, 'epoch': 1.8} {'loss': 0.1524, 'learning_rate': 5.217495132923811e-07, 'epoch': 1.8} {'loss': 0.3032, 'learning_rate': 5.216424120025498e-07, 'epoch': 1.8} {'loss': 0.221, 'learning_rate': 5.215353214119845e-07, 'epoch': 1.8} {'loss': 0.2238, 'learning_rate': 5.214282415208027e-07, 'epoch': 1.8} {'loss': 0.3161, 'learning_rate': 5.213211723291245e-07, 'epoch': 1.8} {'loss': 0.3299, 'learning_rate': 5.212141138370741e-07, 'epoch': 1.8} {'loss': 0.3549, 'learning_rate': 5.211070660447693e-07, 'epoch': 1.8} {'loss': 0.2549, 'learning_rate': 5.210000289523332e-07, 'epoch': 1.8} {'loss': 0.3652, 'learning_rate': 5.208930025598835e-07, 'epoch': 1.8} {'loss': 0.3313, 'learning_rate': 5.207859868675446e-07, 'epoch': 1.8} {'loss': 0.2244, 'learning_rate': 5.206789818754354e-07, 'epoch': 1.8} {'loss': 0.332, 'learning_rate': 5.205719875836779e-07, 'epoch': 1.8} {'loss': 0.2471, 'learning_rate': 5.204650039923908e-07, 'epoch': 1.8} {'loss': 0.3546, 'learning_rate': 5.203580311016965e-07, 'epoch': 1.8} {'loss': 0.444, 'learning_rate': 5.202510689117146e-07, 'epoch': 1.8} {'loss': 0.2817, 'learning_rate': 5.201441174225685e-07, 'epoch': 1.8} {'loss': 0.3925, 'learning_rate': 5.20037176634377e-07, 'epoch': 1.8} {'loss': 0.3282, 'learning_rate': 5.199302465472589e-07, 'epoch': 1.8} {'loss': 0.2889, 'learning_rate': 5.198233271613384e-07, 'epoch': 1.8} {'loss': 0.1852, 'learning_rate': 5.197164184767334e-07, 'epoch': 1.8} {'loss': 0.3115, 'learning_rate': 5.196095204935669e-07, 'epoch': 1.8} {'loss': 0.3278, 'learning_rate': 5.195026332119568e-07, 'epoch': 1.8} {'loss': 0.2377, 'learning_rate': 5.193957566320273e-07, 'epoch': 1.8} {'loss': 0.2865, 'learning_rate': 5.192888907538963e-07, 'epoch': 1.8} {'loss': 0.3849, 'learning_rate': 5.191820355776856e-07, 'epoch': 1.8} {'loss': 0.2683, 'learning_rate': 5.190751911035152e-07, 'epoch': 1.8} {'loss': 0.4125, 'learning_rate': 5.189683573315063e-07, 'epoch': 1.8} {'loss': 0.3543, 'learning_rate': 5.188615342617786e-07, 'epoch': 1.8} {'loss': 0.3854, 'learning_rate': 5.187547218944544e-07, 'epoch': 1.8} {'loss': 0.4708, 'learning_rate': 5.186479202296535e-07, 'epoch': 1.8} {'loss': 0.2546, 'learning_rate': 5.185411292674947e-07, 'epoch': 1.8} {'loss': 0.2102, 'learning_rate': 5.184343490081012e-07, 'epoch': 1.8} {'loss': 0.3767, 'learning_rate': 5.183275794515907e-07, 'epoch': 1.8} {'loss': 0.2438, 'learning_rate': 5.182208205980866e-07, 'epoch': 1.8} {'loss': 0.4214, 'learning_rate': 5.181140724477074e-07, 'epoch': 1.8} {'loss': 0.2702, 'learning_rate': 5.180073350005754e-07, 'epoch': 1.8} {'loss': 0.3978, 'learning_rate': 5.179006082568084e-07, 'epoch': 1.8} {'loss': 0.3674, 'learning_rate': 5.177938922165304e-07, 'epoch': 1.8} {'loss': 0.2675, 'learning_rate': 5.176871868798583e-07, 'epoch': 1.8} {'loss': 0.3913, 'learning_rate': 5.175804922469152e-07, 'epoch': 1.8} {'loss': 0.3897, 'learning_rate': 5.174738083178199e-07, 'epoch': 1.8} {'loss': 0.3799, 'learning_rate': 5.173671350926945e-07, 'epoch': 1.8} {'loss': 0.3331, 'learning_rate': 5.17260472571659e-07, 'epoch': 1.8} {'loss': 0.368, 'learning_rate': 5.17153820754831e-07, 'epoch': 1.8} {'loss': 0.2816, 'learning_rate': 5.170471796423349e-07, 'epoch': 1.8} {'loss': 0.3013, 'learning_rate': 5.169405492342872e-07, 'epoch': 1.8} {'loss': 0.4043, 'learning_rate': 5.168339295308123e-07, 'epoch': 1.8} {'loss': 0.4279, 'learning_rate': 5.167273205320278e-07, 'epoch': 1.8} {'loss': 0.3497, 'learning_rate': 5.166207222380559e-07, 'epoch': 1.8} {'loss': 0.3111, 'learning_rate': 5.165141346490132e-07, 'epoch': 1.8} {'loss': 0.3361, 'learning_rate': 5.164075577650252e-07, 'epoch': 1.8} {'loss': 0.34, 'learning_rate': 5.163009915862082e-07, 'epoch': 1.8} {'loss': 0.4708, 'learning_rate': 5.161944361126858e-07, 'epoch': 1.8} {'loss': 0.3738, 'learning_rate': 5.160878913445744e-07, 'epoch': 1.8} {'loss': 0.2842, 'learning_rate': 5.159813572819983e-07, 'epoch': 1.8} {'loss': 0.2965, 'learning_rate': 5.158748339250752e-07, 'epoch': 1.8} {'loss': 0.2154, 'learning_rate': 5.15768321273924e-07, 'epoch': 1.8} {'loss': 0.4618, 'learning_rate': 5.156618193286689e-07, 'epoch': 1.8} {'loss': 0.3361, 'learning_rate': 5.155553280894265e-07, 'epoch': 1.8} {'loss': 0.3659, 'learning_rate': 5.154488475563213e-07, 'epoch': 1.8} {'loss': 0.4246, 'learning_rate': 5.153423777294675e-07, 'epoch': 1.8} {'loss': 0.4424, 'learning_rate': 5.152359186089906e-07, 'epoch': 1.8} {'loss': 0.1841, 'learning_rate': 5.151294701950083e-07, 'epoch': 1.8} {'loss': 0.2338, 'learning_rate': 5.150230324876415e-07, 'epoch': 1.8} {'loss': 0.3068, 'learning_rate': 5.149166054870091e-07, 'epoch': 1.8} {'loss': 0.2655, 'learning_rate': 5.148101891932333e-07, 'epoch': 1.8} {'loss': 0.4606, 'learning_rate': 5.147037836064317e-07, 'epoch': 1.8} {'loss': 0.3195, 'learning_rate': 5.145973887267274e-07, 'epoch': 1.8} {'loss': 0.2557, 'learning_rate': 5.144910045542384e-07, 'epoch': 1.8} {'loss': 0.2208, 'learning_rate': 5.143846310890843e-07, 'epoch': 1.8} {'loss': 0.4017, 'learning_rate': 5.142782683313884e-07, 'epoch': 1.8} {'loss': 0.3153, 'learning_rate': 5.141719162812664e-07, 'epoch': 1.8} {'loss': 0.3865, 'learning_rate': 5.140655749388412e-07, 'epoch': 1.8} {'loss': 0.3972, 'learning_rate': 5.139592443042318e-07, 'epoch': 1.8} {'loss': 0.1753, 'learning_rate': 5.138529243775592e-07, 'epoch': 1.8} {'loss': 0.2463, 'learning_rate': 5.137466151589421e-07, 'epoch': 1.8} {'loss': 0.417, 'learning_rate': 5.136403166485015e-07, 'epoch': 1.8} {'loss': 0.4025, 'learning_rate': 5.135340288463564e-07, 'epoch': 1.8} {'loss': 0.4122, 'learning_rate': 5.134277517526287e-07, 'epoch': 1.8} {'loss': 0.3042, 'learning_rate': 5.133214853674361e-07, 'epoch': 1.8} {'loss': 0.2972, 'learning_rate': 5.132152296908999e-07, 'epoch': 1.8} {'loss': 0.4009, 'learning_rate': 5.131089847231407e-07, 'epoch': 1.8} {'loss': 0.2681, 'learning_rate': 5.130027504642754e-07, 'epoch': 1.8} {'loss': 0.3403, 'learning_rate': 5.128965269144282e-07, 'epoch': 1.8} {'loss': 0.2935, 'learning_rate': 5.127903140737145e-07, 'epoch': 1.8} {'loss': 0.4082, 'learning_rate': 5.126841119422588e-07, 'epoch': 1.8} {'loss': 0.3027, 'learning_rate': 5.125779205201764e-07, 'epoch': 1.8} {'loss': 0.1061, 'learning_rate': 5.124717398075907e-07, 'epoch': 1.8} {'loss': 0.3256, 'learning_rate': 5.123655698046204e-07, 'epoch': 1.8} {'loss': 0.2419, 'learning_rate': 5.122594105113854e-07, 'epoch': 1.8} {'loss': 0.3916, 'learning_rate': 5.121532619280056e-07, 'epoch': 1.8} {'loss': 0.1901, 'learning_rate': 5.120471240545988e-07, 'epoch': 1.8} {'loss': 0.2554, 'learning_rate': 5.119409968912881e-07, 'epoch': 1.8} {'loss': 0.2108, 'learning_rate': 5.118348804381901e-07, 'epoch': 1.8} {'loss': 0.3374, 'learning_rate': 5.11728774695428e-07, 'epoch': 1.8} {'loss': 0.3987, 'learning_rate': 5.116226796631196e-07, 'epoch': 1.8} {'loss': 0.215, 'learning_rate': 5.115165953413847e-07, 'epoch': 1.8} {'loss': 0.2912, 'learning_rate': 5.114105217303422e-07, 'epoch': 1.8} {'loss': 0.3488, 'learning_rate': 5.113044588301152e-07, 'epoch': 1.8} {'loss': 0.3723, 'learning_rate': 5.111984066408182e-07, 'epoch': 1.8} {'loss': 0.32, 'learning_rate': 5.110923651625765e-07, 'epoch': 1.8} {'loss': 0.3386, 'learning_rate': 5.109863343955046e-07, 'epoch': 1.8} {'loss': 0.4067, 'learning_rate': 5.108803143397267e-07, 'epoch': 1.8} {'loss': 0.33, 'learning_rate': 5.107743049953606e-07, 'epoch': 1.8} {'loss': 0.4147, 'learning_rate': 5.106683063625251e-07, 'epoch': 1.8} {'loss': 0.3574, 'learning_rate': 5.10562318441341e-07, 'epoch': 1.8} {'loss': 0.2572, 'learning_rate': 5.104563412319264e-07, 'epoch': 1.8} {'loss': 0.2187, 'learning_rate': 5.10350374734403e-07, 'epoch': 1.8} {'loss': 0.2433, 'learning_rate': 5.102444189488886e-07, 'epoch': 1.8} {'loss': 0.3267, 'learning_rate': 5.101384738755055e-07, 'epoch': 1.8} {'loss': 0.2878, 'learning_rate': 5.100325395143701e-07, 'epoch': 1.8} {'loss': 0.3384, 'learning_rate': 5.099266158656036e-07, 'epoch': 1.8} {'loss': 0.3721, 'learning_rate': 5.098207029293245e-07, 'epoch': 1.8} {'loss': 0.2359, 'learning_rate': 5.097148007056552e-07, 'epoch': 1.8} {'loss': 0.2356, 'learning_rate': 5.096089091947109e-07, 'epoch': 1.8} {'loss': 0.2685, 'learning_rate': 5.095030283966162e-07, 'epoch': 1.8} {'loss': 0.3316, 'learning_rate': 5.093971583114865e-07, 'epoch': 1.8} {'loss': 0.3331, 'learning_rate': 5.092912989394416e-07, 'epoch': 1.8} {'loss': 0.2698, 'learning_rate': 5.091854502806038e-07, 'epoch': 1.8} {'loss': 0.2961, 'learning_rate': 5.090796123350894e-07, 'epoch': 1.8} {'loss': 0.3177, 'learning_rate': 5.089737851030208e-07, 'epoch': 1.8} {'loss': 0.3893, 'learning_rate': 5.088679685845143e-07, 'epoch': 1.8} {'loss': 0.2243, 'learning_rate': 5.087621627796924e-07, 'epoch': 1.8} {'loss': 0.3823, 'learning_rate': 5.086563676886724e-07, 'epoch': 1.8} {'loss': 0.2528, 'learning_rate': 5.085505833115755e-07, 'epoch': 1.8} {'loss': 0.1294, 'learning_rate': 5.084448096485184e-07, 'epoch': 1.8} {'loss': 0.2896, 'learning_rate': 5.083390466996241e-07, 'epoch': 1.8} {'loss': 0.422, 'learning_rate': 5.082332944650081e-07, 'epoch': 1.8} {'loss': 0.3769, 'learning_rate': 5.081275529447937e-07, 'epoch': 1.8} {'loss': 0.2824, 'learning_rate': 5.080218221390987e-07, 'epoch': 1.8} {'loss': 0.3859, 'learning_rate': 5.079161020480395e-07, 'epoch': 1.8} {'loss': 0.4373, 'learning_rate': 5.078103926717404e-07, 'epoch': 1.8} {'loss': 0.3462, 'learning_rate': 5.07704694010317e-07, 'epoch': 1.8} {'loss': 0.2002, 'learning_rate': 5.075990060638902e-07, 'epoch': 1.8} {'loss': 0.2359, 'learning_rate': 5.074933288325789e-07, 'epoch': 1.8} {'loss': 0.1592, 'learning_rate': 5.073876623165042e-07, 'epoch': 1.8} {'loss': 0.4977, 'learning_rate': 5.072820065157813e-07, 'epoch': 1.8} {'loss': 0.379, 'learning_rate': 5.071763614305336e-07, 'epoch': 1.8} {'loss': 0.2614, 'learning_rate': 5.070707270608766e-07, 'epoch': 1.8} {'loss': 0.2787, 'learning_rate': 5.069651034069345e-07, 'epoch': 1.8} {'loss': 0.3052, 'learning_rate': 5.068594904688206e-07, 'epoch': 1.8} {'loss': 0.2694, 'learning_rate': 5.067538882466594e-07, 'epoch': 1.8} {'loss': 0.3298, 'learning_rate': 5.066482967405683e-07, 'epoch': 1.8} {'loss': 0.3435, 'learning_rate': 5.065427159506641e-07, 'epoch': 1.8} {'loss': 0.2695, 'learning_rate': 5.064371458770689e-07, 'epoch': 1.8} {'loss': 0.2704, 'learning_rate': 5.063315865199003e-07, 'epoch': 1.8} {'loss': 0.4016, 'learning_rate': 5.062260378792782e-07, 'epoch': 1.8} {'loss': 0.1805, 'learning_rate': 5.061204999553215e-07, 'epoch': 1.8} {'loss': 0.3551, 'learning_rate': 5.0601497274815e-07, 'epoch': 1.8} {'loss': 0.188, 'learning_rate': 5.059094562578815e-07, 'epoch': 1.8} {'loss': 0.319, 'learning_rate': 5.058039504846368e-07, 'epoch': 1.8} {'loss': 0.4341, 'learning_rate': 5.056984554285327e-07, 'epoch': 1.8} {'loss': 0.4362, 'learning_rate': 5.055929710896911e-07, 'epoch': 1.8} {'loss': 0.3086, 'learning_rate': 5.054874974682278e-07, 'epoch': 1.8} {'loss': 0.2931, 'learning_rate': 5.053820345642657e-07, 'epoch': 1.8} {'loss': 0.2623, 'learning_rate': 5.052765823779216e-07, 'epoch': 1.8} {'loss': 0.3037, 'learning_rate': 5.051711409093129e-07, 'epoch': 1.8} {'loss': 0.3716, 'learning_rate': 5.050657101585621e-07, 'epoch': 1.8} {'loss': 0.2598, 'learning_rate': 5.049602901257855e-07, 'epoch': 1.8} {'loss': 0.2392, 'learning_rate': 5.048548808111042e-07, 'epoch': 1.8} {'loss': 0.3033, 'learning_rate': 5.047494822146348e-07, 'epoch': 1.8} {'loss': 0.2865, 'learning_rate': 5.046440943364983e-07, 'epoch': 1.8} {'loss': 0.2623, 'learning_rate': 5.045387171768124e-07, 'epoch': 1.8} {'loss': 0.29, 'learning_rate': 5.04433350735698e-07, 'epoch': 1.8} {'loss': 0.2187, 'learning_rate': 5.043279950132718e-07, 'epoch': 1.8} {'loss': 0.2817, 'learning_rate': 5.042226500096548e-07, 'epoch': 1.8} {'loss': 0.1943, 'learning_rate': 5.041173157249624e-07, 'epoch': 1.8} {'loss': 0.2683, 'learning_rate': 5.040119921593178e-07, 'epoch': 1.8} {'loss': 0.2605, 'learning_rate': 5.039066793128378e-07, 'epoch': 1.8} {'loss': 0.1533, 'learning_rate': 5.038013771856409e-07, 'epoch': 1.8} {'loss': 0.3258, 'learning_rate': 5.036960857778462e-07, 'epoch': 1.8} {'loss': 0.2903, 'learning_rate': 5.035908050895732e-07, 'epoch': 1.8} {'loss': 0.5087, 'learning_rate': 5.0348553512094e-07, 'epoch': 1.8} {'loss': 0.4626, 'learning_rate': 5.033802758720651e-07, 'epoch': 1.8} {'loss': 0.3626, 'learning_rate': 5.032750273430698e-07, 'epoch': 1.8} {'loss': 0.4043, 'learning_rate': 5.031697895340704e-07, 'epoch': 1.8} {'loss': 0.4308, 'learning_rate': 5.030645624451868e-07, 'epoch': 1.8} {'loss': 0.2424, 'learning_rate': 5.029593460765359e-07, 'epoch': 1.8} {'loss': 0.365, 'learning_rate': 5.028541404282383e-07, 'epoch': 1.8} {'loss': 0.2107, 'learning_rate': 5.02748945500413e-07, 'epoch': 1.8} {'loss': 0.3253, 'learning_rate': 5.026437612931778e-07, 'epoch': 1.8} {'loss': 0.2977, 'learning_rate': 5.025385878066524e-07, 'epoch': 1.8} {'loss': 0.3774, 'learning_rate': 5.024334250409535e-07, 'epoch': 1.8} {'loss': 0.2207, 'learning_rate': 5.023282729962031e-07, 'epoch': 1.8} {'loss': 0.3986, 'learning_rate': 5.022231316725168e-07, 'epoch': 1.8} {'loss': 0.3171, 'learning_rate': 5.021180010700155e-07, 'epoch': 1.8} {'loss': 0.3012, 'learning_rate': 5.020128811888159e-07, 'epoch': 1.8} {'loss': 0.2152, 'learning_rate': 5.019077720290389e-07, 'epoch': 1.8} {'loss': 0.3065, 'learning_rate': 5.01802673590801e-07, 'epoch': 1.8} {'loss': 0.3981, 'learning_rate': 5.016975858742212e-07, 'epoch': 1.8} {'loss': 0.2124, 'learning_rate': 5.015925088794204e-07, 'epoch': 1.8} {'loss': 0.4411, 'learning_rate': 5.01487442606513e-07, 'epoch': 1.8} {'loss': 0.3023, 'learning_rate': 5.013823870556223e-07, 'epoch': 1.8} {'loss': 0.3492, 'learning_rate': 5.012773422268625e-07, 'epoch': 1.8} {'loss': 0.3476, 'learning_rate': 5.011723081203568e-07, 'epoch': 1.8} {'loss': 0.2954, 'learning_rate': 5.010672847362186e-07, 'epoch': 1.8} {'loss': 0.2591, 'learning_rate': 5.009622720745711e-07, 'epoch': 1.8} {'loss': 0.2679, 'learning_rate': 5.008572701355297e-07, 'epoch': 1.8} {'loss': 0.4264, 'learning_rate': 5.007522789192154e-07, 'epoch': 1.8} {'loss': 0.1136, 'learning_rate': 5.006472984257438e-07, 'epoch': 1.8} {'loss': 0.4135, 'learning_rate': 5.005423286552369e-07, 'epoch': 1.8} {'loss': 0.4357, 'learning_rate': 5.004373696078102e-07, 'epoch': 1.8} {'loss': 0.3129, 'learning_rate': 5.003324212835825e-07, 'epoch': 1.8} {'loss': 0.2443, 'learning_rate': 5.002274836826748e-07, 'epoch': 1.8} {'loss': 0.2071, 'learning_rate': 5.001225568052026e-07, 'epoch': 1.8} {'loss': 0.4127, 'learning_rate': 5.000176406512858e-07, 'epoch': 1.8} {'loss': 0.3457, 'learning_rate': 4.99912735221042e-07, 'epoch': 1.8} {'loss': 0.2388, 'learning_rate': 4.998078405145912e-07, 'epoch': 1.8} {'loss': 0.3993, 'learning_rate': 4.9970295653205e-07, 'epoch': 1.8} {'loss': 0.5002, 'learning_rate': 4.995980832735392e-07, 'epoch': 1.8} {'loss': 0.3695, 'learning_rate': 4.994932207391734e-07, 'epoch': 1.8} {'loss': 0.3353, 'learning_rate': 4.993883689290746e-07, 'epoch': 1.8} {'loss': 0.3277, 'learning_rate': 4.992835278433583e-07, 'epoch': 1.8} {'loss': 0.3699, 'learning_rate': 4.991786974821467e-07, 'epoch': 1.8} {'loss': 0.2895, 'learning_rate': 4.990738778455539e-07, 'epoch': 1.8} {'loss': 0.2109, 'learning_rate': 4.989690689337001e-07, 'epoch': 1.8} {'loss': 0.1637, 'learning_rate': 4.98864270746704e-07, 'epoch': 1.8} {'loss': 0.2814, 'learning_rate': 4.987594832846832e-07, 'epoch': 1.8} {'loss': 0.4045, 'learning_rate': 4.986547065477565e-07, 'epoch': 1.8} {'loss': 0.3015, 'learning_rate': 4.985499405360405e-07, 'epoch': 1.8} {'loss': 0.3172, 'learning_rate': 4.984451852496564e-07, 'epoch': 1.8} {'loss': 0.2147, 'learning_rate': 4.983404406887205e-07, 'epoch': 1.8} {'loss': 0.2335, 'learning_rate': 4.982357068533517e-07, 'epoch': 1.8} {'loss': 0.2215, 'learning_rate': 4.981309837436665e-07, 'epoch': 1.8} {'loss': 0.3909, 'learning_rate': 4.980262713597861e-07, 'epoch': 1.8} {'loss': 0.2967, 'learning_rate': 4.979215697018258e-07, 'epoch': 1.8} {'loss': 0.2318, 'learning_rate': 4.978168787699067e-07, 'epoch': 1.8} {'loss': 0.2647, 'learning_rate': 4.977121985641453e-07, 'epoch': 1.8} {'loss': 0.3535, 'learning_rate': 4.976075290846583e-07, 'epoch': 1.8} {'loss': 0.2853, 'learning_rate': 4.975028703315676e-07, 'epoch': 1.8} {'loss': 0.3345, 'learning_rate': 4.973982223049867e-07, 'epoch': 1.8} {'loss': 0.2882, 'learning_rate': 4.972935850050387e-07, 'epoch': 1.8} {'loss': 0.2257, 'learning_rate': 4.971889584318368e-07, 'epoch': 1.8} {'loss': 0.276, 'learning_rate': 4.970843425855032e-07, 'epoch': 1.8} {'loss': 0.3548, 'learning_rate': 4.969797374661534e-07, 'epoch': 1.8} {'loss': 0.2714, 'learning_rate': 4.968751430739071e-07, 'epoch': 1.8} {'loss': 0.35, 'learning_rate': 4.967705594088812e-07, 'epoch': 1.8} {'loss': 0.2294, 'learning_rate': 4.966659864711953e-07, 'epoch': 1.8} {'loss': 0.2313, 'learning_rate': 4.965614242609639e-07, 'epoch': 1.8} {'loss': 0.3639, 'learning_rate': 4.964568727783104e-07, 'epoch': 1.8} {'loss': 0.3271, 'learning_rate': 4.963523320233476e-07, 'epoch': 1.8} {'loss': 0.243, 'learning_rate': 4.962478019961969e-07, 'epoch': 1.8} {'loss': 0.3674, 'learning_rate': 4.961432826969759e-07, 'epoch': 1.8} {'loss': 0.2947, 'learning_rate': 4.960387741258011e-07, 'epoch': 1.8} {'loss': 0.4449, 'learning_rate': 4.959342762827912e-07, 'epoch': 1.8} {'loss': 0.3972, 'learning_rate': 4.958297891680641e-07, 'epoch': 1.8} {'loss': 0.3267, 'learning_rate': 4.957253127817386e-07, 'epoch': 1.8} {'loss': 0.2258, 'learning_rate': 4.956208471239299e-07, 'epoch': 1.8} {'loss': 0.1998, 'learning_rate': 4.955163921947603e-07, 'epoch': 1.81} {'loss': 0.2233, 'learning_rate': 4.954119479943442e-07, 'epoch': 1.81} {'loss': 0.324, 'learning_rate': 4.953075145228014e-07, 'epoch': 1.81} {'loss': 0.2867, 'learning_rate': 4.952030917802475e-07, 'epoch': 1.81} {'loss': 0.4014, 'learning_rate': 4.950986797668034e-07, 'epoch': 1.81} {'loss': 0.2181, 'learning_rate': 4.949942784825845e-07, 'epoch': 1.81} {'loss': 0.3256, 'learning_rate': 4.948898879277109e-07, 'epoch': 1.81} {'loss': 0.2065, 'learning_rate': 4.947855081022978e-07, 'epoch': 1.81} {'loss': 0.3192, 'learning_rate': 4.946811390064643e-07, 'epoch': 1.81} {'loss': 0.341, 'learning_rate': 4.945767806403301e-07, 'epoch': 1.81} {'loss': 0.2336, 'learning_rate': 4.944724330040085e-07, 'epoch': 1.81} {'loss': 0.3067, 'learning_rate': 4.943680960976216e-07, 'epoch': 1.81} {'loss': 0.2391, 'learning_rate': 4.942637699212849e-07, 'epoch': 1.81} {'loss': 0.2783, 'learning_rate': 4.941594544751183e-07, 'epoch': 1.81} {'loss': 0.3917, 'learning_rate': 4.940551497592361e-07, 'epoch': 1.81} {'loss': 0.3796, 'learning_rate': 4.939508557737594e-07, 'epoch': 1.81} {'loss': 0.3025, 'learning_rate': 4.938465725188024e-07, 'epoch': 1.81} {'loss': 0.2694, 'learning_rate': 4.937422999944875e-07, 'epoch': 1.81} {'loss': 0.2998, 'learning_rate': 4.936380382009288e-07, 'epoch': 1.81} {'loss': 0.364, 'learning_rate': 4.935337871382451e-07, 'epoch': 1.81} {'loss': 0.3006, 'learning_rate': 4.934295468065542e-07, 'epoch': 1.81} {'loss': 0.2735, 'learning_rate': 4.933253172059726e-07, 'epoch': 1.81} {'loss': 0.4657, 'learning_rate': 4.932210983366204e-07, 'epoch': 1.81} {'loss': 0.3375, 'learning_rate': 4.931168901986128e-07, 'epoch': 1.81} {'loss': 0.3582, 'learning_rate': 4.930126927920686e-07, 'epoch': 1.81} {'loss': 0.2506, 'learning_rate': 4.929085061171047e-07, 'epoch': 1.81} {'loss': 0.3112, 'learning_rate': 4.928043301738406e-07, 'epoch': 1.81} {'loss': 0.2305, 'learning_rate': 4.92700164962392e-07, 'epoch': 1.81} {'loss': 0.4165, 'learning_rate': 4.925960104828764e-07, 'epoch': 1.81} {'loss': 0.3429, 'learning_rate': 4.924918667354117e-07, 'epoch': 1.81} {'loss': 0.3991, 'learning_rate': 4.923877337201166e-07, 'epoch': 1.81} {'loss': 0.3645, 'learning_rate': 4.922836114371076e-07, 'epoch': 1.81} {'loss': 0.2713, 'learning_rate': 4.921794998865015e-07, 'epoch': 1.81} {'loss': 0.3368, 'learning_rate': 4.92075399068419e-07, 'epoch': 1.81} {'loss': 0.2844, 'learning_rate': 4.919713089829736e-07, 'epoch': 1.81} {'loss': 0.2475, 'learning_rate': 4.918672296302851e-07, 'epoch': 1.81} {'loss': 0.4152, 'learning_rate': 4.9176316101047e-07, 'epoch': 1.81} {'loss': 0.4254, 'learning_rate': 4.916591031236473e-07, 'epoch': 1.81} {'loss': 0.297, 'learning_rate': 4.915550559699312e-07, 'epoch': 1.81} {'loss': 0.2476, 'learning_rate': 4.914510195494438e-07, 'epoch': 1.81} {'loss': 0.175, 'learning_rate': 4.913469938622994e-07, 'epoch': 1.81} {'loss': 0.2579, 'learning_rate': 4.91242978908616e-07, 'epoch': 1.81} {'loss': 0.2713, 'learning_rate': 4.911389746885109e-07, 'epoch': 1.81} {'loss': 0.4467, 'learning_rate': 4.910349812021009e-07, 'epoch': 1.81} {'loss': 0.239, 'learning_rate': 4.909309984495059e-07, 'epoch': 1.81} {'loss': 0.3588, 'learning_rate': 4.908270264308402e-07, 'epoch': 1.81} {'loss': 0.1933, 'learning_rate': 4.907230651462236e-07, 'epoch': 1.81} {'loss': 0.3442, 'learning_rate': 4.906191145957706e-07, 'epoch': 1.81} {'loss': 0.3946, 'learning_rate': 4.905151747796022e-07, 'epoch': 1.81} {'loss': 0.1761, 'learning_rate': 4.904112456978327e-07, 'epoch': 1.81} {'loss': 0.2685, 'learning_rate': 4.90307327350581e-07, 'epoch': 1.81} {'loss': 0.3461, 'learning_rate': 4.902034197379635e-07, 'epoch': 1.81} {'loss': 0.3558, 'learning_rate': 4.900995228600991e-07, 'epoch': 1.81} {'loss': 0.3366, 'learning_rate': 4.899956367171044e-07, 'epoch': 1.81} {'loss': 0.3011, 'learning_rate': 4.898917613090937e-07, 'epoch': 1.81} {'loss': 0.2535, 'learning_rate': 4.897878966361891e-07, 'epoch': 1.81} {'loss': 0.263, 'learning_rate': 4.896840426985039e-07, 'epoch': 1.81} {'loss': 0.2802, 'learning_rate': 4.89580199496158e-07, 'epoch': 1.81} {'loss': 0.1903, 'learning_rate': 4.894763670292669e-07, 'epoch': 1.81} {'loss': 0.3929, 'learning_rate': 4.893725452979492e-07, 'epoch': 1.81} {'loss': 0.24, 'learning_rate': 4.892687343023206e-07, 'epoch': 1.81} {'loss': 0.2403, 'learning_rate': 4.891649340424997e-07, 'epoch': 1.81} {'loss': 0.3, 'learning_rate': 4.890611445186023e-07, 'epoch': 1.81} {'loss': 0.4103, 'learning_rate': 4.889573657307467e-07, 'epoch': 1.81} {'loss': 0.3067, 'learning_rate': 4.888535976790487e-07, 'epoch': 1.81} {'loss': 0.2527, 'learning_rate': 4.887498403636282e-07, 'epoch': 1.81} {'loss': 0.2722, 'learning_rate': 4.886460937846005e-07, 'epoch': 1.81} {'loss': 0.3053, 'learning_rate': 4.885423579420811e-07, 'epoch': 1.81} {'loss': 0.3099, 'learning_rate': 4.884386328361901e-07, 'epoch': 1.81} {'loss': 0.308, 'learning_rate': 4.883349184670417e-07, 'epoch': 1.81} {'loss': 0.2778, 'learning_rate': 4.882312148347556e-07, 'epoch': 1.81} {'loss': 0.3628, 'learning_rate': 4.881275219394466e-07, 'epoch': 1.81} {'loss': 0.3379, 'learning_rate': 4.880238397812343e-07, 'epoch': 1.81} {'loss': 0.3386, 'learning_rate': 4.879201683602331e-07, 'epoch': 1.81} {'loss': 0.4252, 'learning_rate': 4.878165076765617e-07, 'epoch': 1.81} {'loss': 0.138, 'learning_rate': 4.877128577303358e-07, 'epoch': 1.81} {'loss': 0.3556, 'learning_rate': 4.876092185216752e-07, 'epoch': 1.81} {'loss': 0.3483, 'learning_rate': 4.875055900506931e-07, 'epoch': 1.81} {'loss': 0.3545, 'learning_rate': 4.874019723175094e-07, 'epoch': 1.81} {'loss': 0.3823, 'learning_rate': 4.872983653222407e-07, 'epoch': 1.81} {'loss': 0.2813, 'learning_rate': 4.871947690650014e-07, 'epoch': 1.81} {'loss': 0.3009, 'learning_rate': 4.870911835459113e-07, 'epoch': 1.81} {'loss': 0.3991, 'learning_rate': 4.869876087650848e-07, 'epoch': 1.81} {'loss': 0.3672, 'learning_rate': 4.868840447226419e-07, 'epoch': 1.81} {'loss': 0.3152, 'learning_rate': 4.867804914186969e-07, 'epoch': 1.81} {'loss': 0.3365, 'learning_rate': 4.866769488533696e-07, 'epoch': 1.81} {'loss': 0.3334, 'learning_rate': 4.865734170267722e-07, 'epoch': 1.81} {'loss': 0.3156, 'learning_rate': 4.864698959390268e-07, 'epoch': 1.81} {'loss': 0.326, 'learning_rate': 4.863663855902456e-07, 'epoch': 1.81} {'loss': 0.3272, 'learning_rate': 4.862628859805496e-07, 'epoch': 1.81} {'loss': 0.2335, 'learning_rate': 4.86159397110052e-07, 'epoch': 1.81} {'loss': 0.1792, 'learning_rate': 4.860559189788738e-07, 'epoch': 1.81} {'loss': 0.2464, 'learning_rate': 4.859524515871284e-07, 'epoch': 1.81} {'loss': 0.2812, 'learning_rate': 4.858489949349321e-07, 'epoch': 1.81} {'loss': 0.2412, 'learning_rate': 4.857455490224039e-07, 'epoch': 1.81} {'loss': 0.3384, 'learning_rate': 4.856421138496592e-07, 'epoch': 1.81} {'loss': 0.3712, 'learning_rate': 4.855386894168168e-07, 'epoch': 1.81} {'loss': 0.3553, 'learning_rate': 4.8543527572399e-07, 'epoch': 1.81} {'loss': 0.3541, 'learning_rate': 4.853318727712986e-07, 'epoch': 1.81} {'loss': 0.3633, 'learning_rate': 4.85228480558858e-07, 'epoch': 1.81} {'loss': 0.3629, 'learning_rate': 4.851250990867851e-07, 'epoch': 1.81} {'loss': 0.2925, 'learning_rate': 4.850217283551961e-07, 'epoch': 1.81} {'loss': 0.3909, 'learning_rate': 4.8491836836421e-07, 'epoch': 1.81} {'loss': 0.2748, 'learning_rate': 4.848150191139401e-07, 'epoch': 1.81} {'loss': 0.2198, 'learning_rate': 4.847116806045049e-07, 'epoch': 1.81} {'loss': 0.3869, 'learning_rate': 4.846083528360224e-07, 'epoch': 1.81} {'loss': 0.1955, 'learning_rate': 4.845050358086056e-07, 'epoch': 1.81} {'loss': 0.2565, 'learning_rate': 4.844017295223735e-07, 'epoch': 1.81} {'loss': 0.299, 'learning_rate': 4.842984339774426e-07, 'epoch': 1.81} {'loss': 0.4091, 'learning_rate': 4.841951491739294e-07, 'epoch': 1.81} {'loss': 0.2152, 'learning_rate': 4.840918751119494e-07, 'epoch': 1.81} {'loss': 0.3827, 'learning_rate': 4.839886117916226e-07, 'epoch': 1.81} {'loss': 0.3547, 'learning_rate': 4.838853592130599e-07, 'epoch': 1.81} {'loss': 0.2668, 'learning_rate': 4.837821173763835e-07, 'epoch': 1.81} {'loss': 0.36, 'learning_rate': 4.836788862817065e-07, 'epoch': 1.81} {'loss': 0.2749, 'learning_rate': 4.835756659291468e-07, 'epoch': 1.81} {'loss': 0.3047, 'learning_rate': 4.834724563188197e-07, 'epoch': 1.81} {'loss': 0.4787, 'learning_rate': 4.833692574508442e-07, 'epoch': 1.81} {'loss': 0.3347, 'learning_rate': 4.832660693253344e-07, 'epoch': 1.81} {'loss': 0.2351, 'learning_rate': 4.83162891942407e-07, 'epoch': 1.81} {'loss': 0.1674, 'learning_rate': 4.830597253021796e-07, 'epoch': 1.81} {'loss': 0.2745, 'learning_rate': 4.829565694047666e-07, 'epoch': 1.81} {'loss': 0.1875, 'learning_rate': 4.828534242502881e-07, 'epoch': 1.81} {'loss': 0.2324, 'learning_rate': 4.827502898388558e-07, 'epoch': 1.81} {'loss': 0.2506, 'learning_rate': 4.826471661705912e-07, 'epoch': 1.81} {'loss': 0.2893, 'learning_rate': 4.825440532456061e-07, 'epoch': 1.81} {'loss': 0.3027, 'learning_rate': 4.824409510640205e-07, 'epoch': 1.81} {'loss': 0.3947, 'learning_rate': 4.823378596259476e-07, 'epoch': 1.81} {'loss': 0.2948, 'learning_rate': 4.822347789315062e-07, 'epoch': 1.81} {'loss': 0.3066, 'learning_rate': 4.82131708980812e-07, 'epoch': 1.81} {'loss': 0.2123, 'learning_rate': 4.820286497739812e-07, 'epoch': 1.81} {'loss': 0.2184, 'learning_rate': 4.819256013111307e-07, 'epoch': 1.81} {'loss': 0.305, 'learning_rate': 4.818225635923746e-07, 'epoch': 1.81} {'loss': 0.3207, 'learning_rate': 4.817195366178328e-07, 'epoch': 1.81} {'loss': 0.2266, 'learning_rate': 4.816165203876177e-07, 'epoch': 1.81} {'loss': 0.2309, 'learning_rate': 4.815135149018491e-07, 'epoch': 1.81} {'loss': 0.4021, 'learning_rate': 4.8141052016064e-07, 'epoch': 1.81} {'loss': 0.3673, 'learning_rate': 4.813075361641106e-07, 'epoch': 1.81} {'loss': 0.2615, 'learning_rate': 4.812045629123729e-07, 'epoch': 1.81} {'loss': 0.2684, 'learning_rate': 4.811016004055469e-07, 'epoch': 1.81} {'loss': 0.3475, 'learning_rate': 4.809986486437479e-07, 'epoch': 1.81} {'loss': 0.3857, 'learning_rate': 4.808957076270882e-07, 'epoch': 1.81} {'loss': 0.3049, 'learning_rate': 4.807927773556897e-07, 'epoch': 1.81} {'loss': 0.218, 'learning_rate': 4.806898578296648e-07, 'epoch': 1.81} {'loss': 0.3696, 'learning_rate': 4.805869490491311e-07, 'epoch': 1.81} {'loss': 0.2143, 'learning_rate': 4.80484051014204e-07, 'epoch': 1.81} {'loss': 0.3213, 'learning_rate': 4.803811637250011e-07, 'epoch': 1.81} {'loss': 0.3427, 'learning_rate': 4.802782871816369e-07, 'epoch': 1.81} {'loss': 0.2605, 'learning_rate': 4.801754213842291e-07, 'epoch': 1.81} {'loss': 0.2147, 'learning_rate': 4.800725663328909e-07, 'epoch': 1.81} {'loss': 0.368, 'learning_rate': 4.799697220277433e-07, 'epoch': 1.81} {'loss': 0.1237, 'learning_rate': 4.798668884688973e-07, 'epoch': 1.81} {'loss': 0.4626, 'learning_rate': 4.797640656564728e-07, 'epoch': 1.81} {'loss': 0.2653, 'learning_rate': 4.796612535905843e-07, 'epoch': 1.81} {'loss': 0.3945, 'learning_rate': 4.79558452271347e-07, 'epoch': 1.81} {'loss': 0.1845, 'learning_rate': 4.794556616988789e-07, 'epoch': 1.81} {'loss': 0.2105, 'learning_rate': 4.793528818732929e-07, 'epoch': 1.81} {'loss': 0.2584, 'learning_rate': 4.792501127947092e-07, 'epoch': 1.81} {'loss': 0.3877, 'learning_rate': 4.791473544632397e-07, 'epoch': 1.81} {'loss': 0.1892, 'learning_rate': 4.790446068790044e-07, 'epoch': 1.81} {'loss': 0.256, 'learning_rate': 4.789418700421156e-07, 'epoch': 1.81} {'loss': 0.2903, 'learning_rate': 4.788391439526918e-07, 'epoch': 1.81} {'loss': 0.2862, 'learning_rate': 4.787364286108475e-07, 'epoch': 1.81} {'loss': 0.4131, 'learning_rate': 4.786337240167005e-07, 'epoch': 1.81} {'loss': 0.3423, 'learning_rate': 4.785310301703638e-07, 'epoch': 1.81} {'loss': 0.4138, 'learning_rate': 4.784283470719564e-07, 'epoch': 1.81} {'loss': 0.2253, 'learning_rate': 4.783256747215926e-07, 'epoch': 1.81} {'loss': 0.2424, 'learning_rate': 4.782230131193877e-07, 'epoch': 1.81} {'loss': 0.2615, 'learning_rate': 4.781203622654596e-07, 'epoch': 1.81} {'loss': 0.3582, 'learning_rate': 4.780177221599203e-07, 'epoch': 1.81} {'loss': 0.2468, 'learning_rate': 4.779150928028908e-07, 'epoch': 1.81} {'loss': 0.2278, 'learning_rate': 4.778124741944834e-07, 'epoch': 1.81} {'loss': 0.3421, 'learning_rate': 4.777098663348156e-07, 'epoch': 1.81} {'loss': 0.2932, 'learning_rate': 4.776072692240019e-07, 'epoch': 1.81} {'loss': 0.4041, 'learning_rate': 4.775046828621599e-07, 'epoch': 1.81} {'loss': 0.4323, 'learning_rate': 4.774021072494028e-07, 'epoch': 1.81} {'loss': 0.2927, 'learning_rate': 4.772995423858496e-07, 'epoch': 1.81} {'loss': 0.2928, 'learning_rate': 4.771969882716121e-07, 'epoch': 1.81} {'loss': 0.3075, 'learning_rate': 4.770944449068104e-07, 'epoch': 1.81} {'loss': 0.3617, 'learning_rate': 4.769919122915589e-07, 'epoch': 1.81} {'loss': 0.3455, 'learning_rate': 4.768893904259708e-07, 'epoch': 1.81} {'loss': 0.4165, 'learning_rate': 4.7678687931016486e-07, 'epoch': 1.81} {'loss': 0.2905, 'learning_rate': 4.7668437894425433e-07, 'epoch': 1.81} {'loss': 0.3613, 'learning_rate': 4.765818893283569e-07, 'epoch': 1.81} {'loss': 0.4471, 'learning_rate': 4.7647941046258695e-07, 'epoch': 1.81} {'loss': 0.3191, 'learning_rate': 4.763769423470621e-07, 'epoch': 1.81} {'loss': 0.2664, 'learning_rate': 4.7627448498189566e-07, 'epoch': 1.81} {'loss': 0.3585, 'learning_rate': 4.761720383672042e-07, 'epoch': 1.81} {'loss': 0.307, 'learning_rate': 4.760696025031031e-07, 'epoch': 1.81} {'loss': 0.4097, 'learning_rate': 4.759671773897101e-07, 'epoch': 1.81} {'loss': 0.25, 'learning_rate': 4.7586476302713734e-07, 'epoch': 1.81} {'loss': 0.3804, 'learning_rate': 4.7576235941550365e-07, 'epoch': 1.81} {'loss': 0.1373, 'learning_rate': 4.756599665549233e-07, 'epoch': 1.81} {'loss': 0.3031, 'learning_rate': 4.755575844455096e-07, 'epoch': 1.81} {'loss': 0.2718, 'learning_rate': 4.754552130873824e-07, 'epoch': 1.81} {'loss': 0.3712, 'learning_rate': 4.7535285248065276e-07, 'epoch': 1.81} {'loss': 0.2852, 'learning_rate': 4.752505026254406e-07, 'epoch': 1.81} {'loss': 0.2785, 'learning_rate': 4.75148163521858e-07, 'epoch': 1.81} {'loss': 0.3291, 'learning_rate': 4.750458351700238e-07, 'epoch': 1.81} {'loss': 0.2359, 'learning_rate': 4.74943517570049e-07, 'epoch': 1.81} {'loss': 0.2322, 'learning_rate': 4.748412107220546e-07, 'epoch': 1.81} {'loss': 0.3284, 'learning_rate': 4.7473891462615053e-07, 'epoch': 1.81} {'loss': 0.3352, 'learning_rate': 4.746366292824567e-07, 'epoch': 1.81} {'loss': 0.225, 'learning_rate': 4.745343546910852e-07, 'epoch': 1.81} {'loss': 0.23, 'learning_rate': 4.744320908521549e-07, 'epoch': 1.81} {'loss': 0.2067, 'learning_rate': 4.74329837765779e-07, 'epoch': 1.81} {'loss': 0.2371, 'learning_rate': 4.7422759543207187e-07, 'epoch': 1.81} {'loss': 0.2887, 'learning_rate': 4.7412536385115227e-07, 'epoch': 1.81} {'loss': 0.2166, 'learning_rate': 4.7402314302313234e-07, 'epoch': 1.81} {'loss': 0.1406, 'learning_rate': 4.739209329481298e-07, 'epoch': 1.81} {'loss': 0.3179, 'learning_rate': 4.7381873362625783e-07, 'epoch': 1.81} {'loss': 0.2923, 'learning_rate': 4.737165450576342e-07, 'epoch': 1.81} {'loss': 0.2134, 'learning_rate': 4.736143672423721e-07, 'epoch': 1.81} {'loss': 0.198, 'learning_rate': 4.7351220018058917e-07, 'epoch': 1.81} {'loss': 0.4183, 'learning_rate': 4.7341004387239767e-07, 'epoch': 1.81} {'loss': 0.3309, 'learning_rate': 4.7330789831791623e-07, 'epoch': 1.81} {'loss': 0.3465, 'learning_rate': 4.732057635172571e-07, 'epoch': 1.81} {'loss': 0.3268, 'learning_rate': 4.7310363947053907e-07, 'epoch': 1.81} {'loss': 0.3128, 'learning_rate': 4.730015261778742e-07, 'epoch': 1.81} {'loss': 0.318, 'learning_rate': 4.7289942363937803e-07, 'epoch': 1.81} {'loss': 0.2094, 'learning_rate': 4.727973318551693e-07, 'epoch': 1.81} {'loss': 0.1993, 'learning_rate': 4.726952508253579e-07, 'epoch': 1.81} {'loss': 0.3621, 'learning_rate': 4.7259318055006385e-07, 'epoch': 1.81} {'loss': 0.2017, 'learning_rate': 4.724911210293992e-07, 'epoch': 1.81} {'loss': 0.1712, 'learning_rate': 4.7238907226348165e-07, 'epoch': 1.81} {'loss': 0.3467, 'learning_rate': 4.7228703425242327e-07, 'epoch': 1.81} {'loss': 0.176, 'learning_rate': 4.7218500699634186e-07, 'epoch': 1.81} {'loss': 0.3423, 'learning_rate': 4.7208299049535167e-07, 'epoch': 1.81} {'loss': 0.3417, 'learning_rate': 4.719809847495671e-07, 'epoch': 1.81} {'loss': 0.2862, 'learning_rate': 4.7187898975910584e-07, 'epoch': 1.81} {'loss': 0.2827, 'learning_rate': 4.7177700552408003e-07, 'epoch': 1.81} {'loss': 0.3284, 'learning_rate': 4.716750320446084e-07, 'epoch': 1.81} {'loss': 0.2246, 'learning_rate': 4.715730693208009e-07, 'epoch': 1.81} {'loss': 0.2621, 'learning_rate': 4.714711173527775e-07, 'epoch': 1.81} {'loss': 0.2963, 'learning_rate': 4.7136917614065024e-07, 'epoch': 1.81} {'loss': 0.2594, 'learning_rate': 4.7126724568453573e-07, 'epoch': 1.81} {'loss': 0.3153, 'learning_rate': 4.7116532598454836e-07, 'epoch': 1.81} {'loss': 0.2675, 'learning_rate': 4.710634170408035e-07, 'epoch': 1.81} {'loss': 0.2759, 'learning_rate': 4.709615188534167e-07, 'epoch': 1.81} {'loss': 0.1759, 'learning_rate': 4.7085963142250115e-07, 'epoch': 1.81} {'loss': 0.3839, 'learning_rate': 4.707577547481734e-07, 'epoch': 1.81} {'loss': 0.2734, 'learning_rate': 4.706558888305479e-07, 'epoch': 1.81} {'loss': 0.336, 'learning_rate': 4.7055403366974006e-07, 'epoch': 1.81} {'loss': 0.2297, 'learning_rate': 4.7045218926586425e-07, 'epoch': 1.81} {'loss': 0.2378, 'learning_rate': 4.7035035561903586e-07, 'epoch': 1.81} {'loss': 0.329, 'learning_rate': 4.702485327293693e-07, 'epoch': 1.81} {'loss': 0.2321, 'learning_rate': 4.7014672059698117e-07, 'epoch': 1.81} {'loss': 0.1758, 'learning_rate': 4.7004491922198467e-07, 'epoch': 1.81} {'loss': 0.2412, 'learning_rate': 4.6994312860449534e-07, 'epoch': 1.81} {'loss': 0.2879, 'learning_rate': 4.698413487446274e-07, 'epoch': 1.81} {'loss': 0.255, 'learning_rate': 4.697395796424975e-07, 'epoch': 1.81} {'loss': 0.2013, 'learning_rate': 4.6963782129822e-07, 'epoch': 1.81} {'loss': 0.4783, 'learning_rate': 4.69536073711907e-07, 'epoch': 1.81} {'loss': 0.3373, 'learning_rate': 4.694343368836762e-07, 'epoch': 1.81} {'loss': 0.3833, 'learning_rate': 4.693326108136409e-07, 'epoch': 1.81} {'loss': 0.3132, 'learning_rate': 4.692308955019187e-07, 'epoch': 1.81} {'loss': 0.2695, 'learning_rate': 4.691291909486206e-07, 'epoch': 1.81} {'loss': 0.4104, 'learning_rate': 4.690274971538644e-07, 'epoch': 1.81} {'loss': 0.2834, 'learning_rate': 4.6892581411776327e-07, 'epoch': 1.81} {'loss': 0.3839, 'learning_rate': 4.688241418404338e-07, 'epoch': 1.81} {'loss': 0.3081, 'learning_rate': 4.6872248032198695e-07, 'epoch': 1.81} {'loss': 0.193, 'learning_rate': 4.6862082956254165e-07, 'epoch': 1.81} {'loss': 0.3239, 'learning_rate': 4.685191895622099e-07, 'epoch': 1.81} {'loss': 0.4103, 'learning_rate': 4.684175603211094e-07, 'epoch': 1.81} {'loss': 0.4344, 'learning_rate': 4.6831594183935236e-07, 'epoch': 1.81} {'loss': 0.1908, 'learning_rate': 4.682143341170531e-07, 'epoch': 1.81} {'loss': 0.3426, 'learning_rate': 4.6811273715432814e-07, 'epoch': 1.81} {'loss': 0.3282, 'learning_rate': 4.680111509512897e-07, 'epoch': 1.81} {'loss': 0.2497, 'learning_rate': 4.679095755080565e-07, 'epoch': 1.81} {'loss': 0.3238, 'learning_rate': 4.678080108247385e-07, 'epoch': 1.81} {'loss': 0.2935, 'learning_rate': 4.6770645690145445e-07, 'epoch': 1.81} {'loss': 0.2597, 'learning_rate': 4.676049137383154e-07, 'epoch': 1.81} {'loss': 0.4284, 'learning_rate': 4.6750338133543903e-07, 'epoch': 1.81} {'loss': 0.2182, 'learning_rate': 4.674018596929375e-07, 'epoch': 1.81} {'loss': 0.1939, 'learning_rate': 4.6730034881092843e-07, 'epoch': 1.81} {'loss': 0.2773, 'learning_rate': 4.6719884868952294e-07, 'epoch': 1.81} {'loss': 0.3079, 'learning_rate': 4.670973593288386e-07, 'epoch': 1.81} {'loss': 0.2676, 'learning_rate': 4.669958807289865e-07, 'epoch': 1.81} {'loss': 0.2663, 'learning_rate': 4.668944128900854e-07, 'epoch': 1.81} {'loss': 0.3653, 'learning_rate': 4.6679295581224746e-07, 'epoch': 1.81} {'loss': 0.2891, 'learning_rate': 4.6669150949558593e-07, 'epoch': 1.81} {'loss': 0.2309, 'learning_rate': 4.665900739402185e-07, 'epoch': 1.81} {'loss': 0.3714, 'learning_rate': 4.6648864914625613e-07, 'epoch': 1.81} {'loss': 0.4567, 'learning_rate': 4.663872351138177e-07, 'epoch': 1.81} {'loss': 0.2345, 'learning_rate': 4.6628583184301303e-07, 'epoch': 1.81} {'loss': 0.2476, 'learning_rate': 4.6618443933395986e-07, 'epoch': 1.81} {'loss': 0.2849, 'learning_rate': 4.660830575867703e-07, 'epoch': 1.81} {'loss': 0.4208, 'learning_rate': 4.659816866015621e-07, 'epoch': 1.81} {'loss': 0.2498, 'learning_rate': 4.6588032637844506e-07, 'epoch': 1.81} {'loss': 0.2561, 'learning_rate': 4.6577897691753803e-07, 'epoch': 1.81} {'loss': 0.2678, 'learning_rate': 4.6567763821895207e-07, 'epoch': 1.81} {'loss': 0.3051, 'learning_rate': 4.655763102828048e-07, 'epoch': 1.81} {'loss': 0.1729, 'learning_rate': 4.654749931092084e-07, 'epoch': 1.81} {'loss': 0.3405, 'learning_rate': 4.653736866982761e-07, 'epoch': 1.81} {'loss': 0.383, 'learning_rate': 4.652723910501256e-07, 'epoch': 1.81} {'loss': 0.2452, 'learning_rate': 4.6517110616486895e-07, 'epoch': 1.81} {'loss': 0.2263, 'learning_rate': 4.650698320426206e-07, 'epoch': 1.81} {'loss': 0.3475, 'learning_rate': 4.649685686834948e-07, 'epoch': 1.81} {'loss': 0.2699, 'learning_rate': 4.6486731608760826e-07, 'epoch': 1.81} {'loss': 0.2869, 'learning_rate': 4.647660742550708e-07, 'epoch': 1.81} {'loss': 0.1803, 'learning_rate': 4.6466484318600126e-07, 'epoch': 1.81} {'loss': 0.3599, 'learning_rate': 4.645636228805106e-07, 'epoch': 1.81} {'loss': 0.3896, 'learning_rate': 4.6446241333871544e-07, 'epoch': 1.81} {'loss': 0.3603, 'learning_rate': 4.643612145607268e-07, 'epoch': 1.81} {'loss': 0.3073, 'learning_rate': 4.6426002654666346e-07, 'epoch': 1.81} {'loss': 0.3379, 'learning_rate': 4.6415884929663756e-07, 'epoch': 1.81} {'loss': 0.24, 'learning_rate': 4.6405768281076125e-07, 'epoch': 1.81} {'loss': 0.3153, 'learning_rate': 4.6395652708915105e-07, 'epoch': 1.81} {'loss': 0.3476, 'learning_rate': 4.6385538213192025e-07, 'epoch': 1.81} {'loss': 0.2782, 'learning_rate': 4.637542479391843e-07, 'epoch': 1.81} {'loss': 0.2003, 'learning_rate': 4.6365312451105537e-07, 'epoch': 1.81} {'loss': 0.2436, 'learning_rate': 4.635520118476489e-07, 'epoch': 1.81} {'loss': 0.3188, 'learning_rate': 4.6345090994907914e-07, 'epoch': 1.81} {'loss': 0.3779, 'learning_rate': 4.633498188154595e-07, 'epoch': 1.81} {'loss': 0.3653, 'learning_rate': 4.632487384469042e-07, 'epoch': 1.81} {'loss': 0.3182, 'learning_rate': 4.631476688435288e-07, 'epoch': 1.81} {'loss': 0.2954, 'learning_rate': 4.6304661000544424e-07, 'epoch': 1.81} {'loss': 0.3286, 'learning_rate': 4.629455619327683e-07, 'epoch': 1.81} {'loss': 0.3953, 'learning_rate': 4.62844524625613e-07, 'epoch': 1.81} {'loss': 0.2909, 'learning_rate': 4.627434980840917e-07, 'epoch': 1.81} {'loss': 0.3756, 'learning_rate': 4.6264248230832086e-07, 'epoch': 1.81} {'loss': 0.2937, 'learning_rate': 4.625414772984116e-07, 'epoch': 1.81} {'loss': 0.2978, 'learning_rate': 4.6244048305448043e-07, 'epoch': 1.81} {'loss': 0.2864, 'learning_rate': 4.6233949957663836e-07, 'epoch': 1.81} {'loss': 0.4146, 'learning_rate': 4.6223852686500316e-07, 'epoch': 1.81} {'loss': 0.3036, 'learning_rate': 4.6213756491968575e-07, 'epoch': 1.81} {'loss': 0.1476, 'learning_rate': 4.6203661374080276e-07, 'epoch': 1.81} {'loss': 0.2987, 'learning_rate': 4.6193567332846635e-07, 'epoch': 1.81} {'loss': 0.3565, 'learning_rate': 4.618347436827897e-07, 'epoch': 1.81} {'loss': 0.3651, 'learning_rate': 4.6173382480388937e-07, 'epoch': 1.81} {'loss': 0.3558, 'learning_rate': 4.616329166918765e-07, 'epoch': 1.81} {'loss': 0.2088, 'learning_rate': 4.6153201934686645e-07, 'epoch': 1.81} {'loss': 0.314, 'learning_rate': 4.6143113276897357e-07, 'epoch': 1.81} {'loss': 0.3648, 'learning_rate': 4.6133025695831115e-07, 'epoch': 1.81} {'loss': 0.368, 'learning_rate': 4.612293919149924e-07, 'epoch': 1.81} {'loss': 0.3341, 'learning_rate': 4.6112853763913166e-07, 'epoch': 1.81} {'loss': 0.4853, 'learning_rate': 4.6102769413084334e-07, 'epoch': 1.81} {'loss': 0.3686, 'learning_rate': 4.6092686139024177e-07, 'epoch': 1.81} {'loss': 0.2841, 'learning_rate': 4.608260394174391e-07, 'epoch': 1.81} {'loss': 0.2636, 'learning_rate': 4.607252282125485e-07, 'epoch': 1.81} {'loss': 0.4334, 'learning_rate': 4.606244277756877e-07, 'epoch': 1.81} {'loss': 0.3088, 'learning_rate': 4.6052363810696556e-07, 'epoch': 1.81} {'loss': 0.4696, 'learning_rate': 4.6042285920649963e-07, 'epoch': 1.81} {'loss': 0.3461, 'learning_rate': 4.6032209107440104e-07, 'epoch': 1.81} {'loss': 0.3998, 'learning_rate': 4.6022133371078637e-07, 'epoch': 1.81} {'loss': 0.4452, 'learning_rate': 4.6012058711576657e-07, 'epoch': 1.81} {'loss': 0.3051, 'learning_rate': 4.6001985128945715e-07, 'epoch': 1.81} {'loss': 0.2526, 'learning_rate': 4.599191262319702e-07, 'epoch': 1.81} {'loss': 0.2445, 'learning_rate': 4.598184119434212e-07, 'epoch': 1.81} {'loss': 0.2914, 'learning_rate': 4.597177084239224e-07, 'epoch': 1.81} {'loss': 0.166, 'learning_rate': 4.596170156735902e-07, 'epoch': 1.81} {'loss': 0.211, 'learning_rate': 4.595163336925346e-07, 'epoch': 1.81} {'loss': 0.3309, 'learning_rate': 4.59415662480871e-07, 'epoch': 1.81} {'loss': 0.3055, 'learning_rate': 4.5931500203871384e-07, 'epoch': 1.81} {'loss': 0.2731, 'learning_rate': 4.5921435236617404e-07, 'epoch': 1.81} {'loss': 0.2873, 'learning_rate': 4.591137134633683e-07, 'epoch': 1.81} {'loss': 0.316, 'learning_rate': 4.5901308533040754e-07, 'epoch': 1.81} {'loss': 0.3173, 'learning_rate': 4.589124679674084e-07, 'epoch': 1.81} {'loss': 0.3274, 'learning_rate': 4.588118613744808e-07, 'epoch': 1.81} {'loss': 0.2506, 'learning_rate': 4.5871126555174227e-07, 'epoch': 1.81} {'loss': 0.3143, 'learning_rate': 4.5861068049930293e-07, 'epoch': 1.81} {'loss': 0.2641, 'learning_rate': 4.585101062172781e-07, 'epoch': 1.81} {'loss': 0.3369, 'learning_rate': 4.5840954270578106e-07, 'epoch': 1.81} {'loss': 0.4067, 'learning_rate': 4.5830898996492624e-07, 'epoch': 1.81} {'loss': 0.2995, 'learning_rate': 4.5820844799482564e-07, 'epoch': 1.81} {'loss': 0.1531, 'learning_rate': 4.581079167955915e-07, 'epoch': 1.81} {'loss': 0.1634, 'learning_rate': 4.580073963673415e-07, 'epoch': 1.81} {'loss': 0.301, 'learning_rate': 4.5790688671018433e-07, 'epoch': 1.81} {'loss': 0.2718, 'learning_rate': 4.578063878242378e-07, 'epoch': 1.81} {'loss': 0.3527, 'learning_rate': 4.577058997096118e-07, 'epoch': 1.81} {'loss': 0.2237, 'learning_rate': 4.576054223664228e-07, 'epoch': 1.81} {'loss': 0.4413, 'learning_rate': 4.5750495579478196e-07, 'epoch': 1.81} {'loss': 0.2921, 'learning_rate': 4.5740449999480353e-07, 'epoch': 1.81} {'loss': 0.2633, 'learning_rate': 4.573040549665997e-07, 'epoch': 1.81} {'loss': 0.3684, 'learning_rate': 4.57203620710287e-07, 'epoch': 1.81} {'loss': 0.274, 'learning_rate': 4.571031972259743e-07, 'epoch': 1.81} {'loss': 0.2635, 'learning_rate': 4.5700278451378034e-07, 'epoch': 1.81} {'loss': 0.2825, 'learning_rate': 4.5690238257381393e-07, 'epoch': 1.81} {'loss': 0.3363, 'learning_rate': 4.568019914061894e-07, 'epoch': 1.81} {'loss': 0.2507, 'learning_rate': 4.567016110110223e-07, 'epoch': 1.81} {'loss': 0.3371, 'learning_rate': 4.566012413884224e-07, 'epoch': 1.81} {'loss': 0.2535, 'learning_rate': 4.5650088253850756e-07, 'epoch': 1.81} {'loss': 0.3362, 'learning_rate': 4.564005344613853e-07, 'epoch': 1.81} {'loss': 0.2079, 'learning_rate': 4.5630019715717454e-07, 'epoch': 1.81} {'loss': 0.3867, 'learning_rate': 4.5619987062598517e-07, 'epoch': 1.81} {'loss': 0.2582, 'learning_rate': 4.5609955486793146e-07, 'epoch': 1.81} {'loss': 0.3582, 'learning_rate': 4.559992498831256e-07, 'epoch': 1.81} {'loss': 0.3274, 'learning_rate': 4.5589895567168307e-07, 'epoch': 1.81} {'loss': 0.3733, 'learning_rate': 4.5579867223371375e-07, 'epoch': 1.81} {'loss': 0.2168, 'learning_rate': 4.5569839956933537e-07, 'epoch': 1.81} {'loss': 0.2129, 'learning_rate': 4.555981376786578e-07, 'epoch': 1.81} {'loss': 0.2631, 'learning_rate': 4.5549788656179426e-07, 'epoch': 1.81} {'loss': 0.2921, 'learning_rate': 4.553976462188592e-07, 'epoch': 1.81} {'loss': 0.3932, 'learning_rate': 4.5529741664996465e-07, 'epoch': 1.81} {'loss': 0.3577, 'learning_rate': 4.5519719785522497e-07, 'epoch': 1.81} {'loss': 0.3737, 'learning_rate': 4.5509698983475126e-07, 'epoch': 1.81} {'loss': 0.3949, 'learning_rate': 4.5499679258866005e-07, 'epoch': 1.81} {'loss': 0.3203, 'learning_rate': 4.548966061170601e-07, 'epoch': 1.81} {'loss': 0.3118, 'learning_rate': 4.5479643042006803e-07, 'epoch': 1.81} {'loss': 0.3411, 'learning_rate': 4.54696265497796e-07, 'epoch': 1.81} {'loss': 0.2547, 'learning_rate': 4.545961113503561e-07, 'epoch': 1.81} {'loss': 0.316, 'learning_rate': 4.5449596797786267e-07, 'epoch': 1.81} {'loss': 0.2343, 'learning_rate': 4.543958353804279e-07, 'epoch': 1.81} {'loss': 0.3069, 'learning_rate': 4.54295713558166e-07, 'epoch': 1.81} {'loss': 0.3784, 'learning_rate': 4.541956025111871e-07, 'epoch': 1.81} {'loss': 0.3635, 'learning_rate': 4.5409550223960763e-07, 'epoch': 1.81} {'loss': 0.3395, 'learning_rate': 4.5399541274353753e-07, 'epoch': 1.81} {'loss': 0.1611, 'learning_rate': 4.5389533402309337e-07, 'epoch': 1.81} {'loss': 0.3907, 'learning_rate': 4.53795266078384e-07, 'epoch': 1.81} {'loss': 0.4268, 'learning_rate': 4.536952089095259e-07, 'epoch': 1.81} {'loss': 0.3105, 'learning_rate': 4.535951625166302e-07, 'epoch': 1.81} {'loss': 0.2683, 'learning_rate': 4.534951268998111e-07, 'epoch': 1.81} {'loss': 0.3388, 'learning_rate': 4.533951020591787e-07, 'epoch': 1.81} {'loss': 0.253, 'learning_rate': 4.5329508799484944e-07, 'epoch': 1.81} {'loss': 0.309, 'learning_rate': 4.531950847069344e-07, 'epoch': 1.81} {'loss': 0.4437, 'learning_rate': 4.530950921955468e-07, 'epoch': 1.81} {'loss': 0.2325, 'learning_rate': 4.529951104607999e-07, 'epoch': 1.81} {'loss': 0.1851, 'learning_rate': 4.528951395028047e-07, 'epoch': 1.81} {'loss': 0.4166, 'learning_rate': 4.527951793216767e-07, 'epoch': 1.81} {'loss': 0.3696, 'learning_rate': 4.526952299175258e-07, 'epoch': 1.81} {'loss': 0.2957, 'learning_rate': 4.5259529129046743e-07, 'epoch': 1.81} {'loss': 0.419, 'learning_rate': 4.5249536344061375e-07, 'epoch': 1.81} {'loss': 0.3081, 'learning_rate': 4.5239544636807684e-07, 'epoch': 1.81} {'loss': 0.3181, 'learning_rate': 4.5229554007297005e-07, 'epoch': 1.81} {'loss': 0.3399, 'learning_rate': 4.5219564455540656e-07, 'epoch': 1.81} {'loss': 0.3568, 'learning_rate': 4.520957598154974e-07, 'epoch': 1.81} {'loss': 0.3467, 'learning_rate': 4.5199588585335576e-07, 'epoch': 1.81} {'loss': 0.3917, 'learning_rate': 4.5189602266909715e-07, 'epoch': 1.81} {'loss': 0.364, 'learning_rate': 4.517961702628315e-07, 'epoch': 1.81} {'loss': 0.334, 'learning_rate': 4.516963286346732e-07, 'epoch': 1.81} {'loss': 0.337, 'learning_rate': 4.51596497784732e-07, 'epoch': 1.81} {'loss': 0.2579, 'learning_rate': 4.5149667771312466e-07, 'epoch': 1.81} {'loss': 0.2721, 'learning_rate': 4.51396868419961e-07, 'epoch': 1.81} {'loss': 0.2303, 'learning_rate': 4.512970699053554e-07, 'epoch': 1.81} {'loss': 0.3629, 'learning_rate': 4.511972821694177e-07, 'epoch': 1.81} {'loss': 0.3598, 'learning_rate': 4.5109750521226456e-07, 'epoch': 1.81} {'loss': 0.3673, 'learning_rate': 4.509977390340048e-07, 'epoch': 1.81} {'loss': 0.314, 'learning_rate': 4.5089798363475377e-07, 'epoch': 1.81} {'loss': 0.2096, 'learning_rate': 4.507982390146237e-07, 'epoch': 1.81} {'loss': 0.3044, 'learning_rate': 4.506985051737256e-07, 'epoch': 1.81} {'loss': 0.3581, 'learning_rate': 4.505987821121738e-07, 'epoch': 1.81} {'loss': 0.4059, 'learning_rate': 4.504990698300782e-07, 'epoch': 1.81} {'loss': 0.3223, 'learning_rate': 4.5039936832755536e-07, 'epoch': 1.81} {'loss': 0.3205, 'learning_rate': 4.502996776047142e-07, 'epoch': 1.81} {'loss': 0.3797, 'learning_rate': 4.5019999766167e-07, 'epoch': 1.81} {'loss': 0.2157, 'learning_rate': 4.501003284985328e-07, 'epoch': 1.81} {'loss': 0.3061, 'learning_rate': 4.5000067011541695e-07, 'epoch': 1.81} {'loss': 0.3231, 'learning_rate': 4.499010225124345e-07, 'epoch': 1.81} {'loss': 0.2536, 'learning_rate': 4.4980138568969765e-07, 'epoch': 1.81} {'loss': 0.238, 'learning_rate': 4.4970175964731855e-07, 'epoch': 1.81} {'loss': 0.2068, 'learning_rate': 4.4960214438541036e-07, 'epoch': 1.81} {'loss': 0.3749, 'learning_rate': 4.4950253990408643e-07, 'epoch': 1.81} {'loss': 0.4086, 'learning_rate': 4.494029462034566e-07, 'epoch': 1.81} {'loss': 0.5222, 'learning_rate': 4.4930336328363523e-07, 'epoch': 1.81} {'loss': 0.3195, 'learning_rate': 4.4920379114473333e-07, 'epoch': 1.81} {'loss': 0.2108, 'learning_rate': 4.491042297868653e-07, 'epoch': 1.81} {'loss': 0.2336, 'learning_rate': 4.4900467921014103e-07, 'epoch': 1.81} {'loss': 0.2818, 'learning_rate': 4.4890513941467595e-07, 'epoch': 1.81} {'loss': 0.3176, 'learning_rate': 4.4880561040058e-07, 'epoch': 1.81} {'loss': 0.1661, 'learning_rate': 4.4870609216796643e-07, 'epoch': 1.81} {'loss': 0.275, 'learning_rate': 4.486065847169463e-07, 'epoch': 1.81} {'loss': 0.2419, 'learning_rate': 4.4850708804763497e-07, 'epoch': 1.81} {'loss': 0.3026, 'learning_rate': 4.4840760216014133e-07, 'epoch': 1.81} {'loss': 0.4386, 'learning_rate': 4.483081270545808e-07, 'epoch': 1.81} {'loss': 0.1769, 'learning_rate': 4.482086627310633e-07, 'epoch': 1.81} {'loss': 0.2027, 'learning_rate': 4.48109209189701e-07, 'epoch': 1.81} {'loss': 0.2488, 'learning_rate': 4.4800976643060825e-07, 'epoch': 1.81} {'loss': 0.1768, 'learning_rate': 4.4791033445389487e-07, 'epoch': 1.81} {'loss': 0.1881, 'learning_rate': 4.478109132596753e-07, 'epoch': 1.81} {'loss': 0.3444, 'learning_rate': 4.477115028480594e-07, 'epoch': 1.81} {'loss': 0.3562, 'learning_rate': 4.476121032191627e-07, 'epoch': 1.81} {'loss': 0.3357, 'learning_rate': 4.4751271437309394e-07, 'epoch': 1.81} {'loss': 0.3291, 'learning_rate': 4.474133363099675e-07, 'epoch': 1.81} {'loss': 0.3489, 'learning_rate': 4.4731396902989444e-07, 'epoch': 1.81} {'loss': 0.2118, 'learning_rate': 4.472146125329879e-07, 'epoch': 1.81} {'loss': 0.393, 'learning_rate': 4.4711526681935903e-07, 'epoch': 1.81} {'loss': 0.2574, 'learning_rate': 4.4701593188912095e-07, 'epoch': 1.81} {'loss': 0.2709, 'learning_rate': 4.469166077423859e-07, 'epoch': 1.81} {'loss': 0.2278, 'learning_rate': 4.4681729437926367e-07, 'epoch': 1.81} {'loss': 0.2925, 'learning_rate': 4.4671799179986987e-07, 'epoch': 1.81} {'loss': 0.3385, 'learning_rate': 4.4661870000431315e-07, 'epoch': 1.81} {'loss': 0.3218, 'learning_rate': 4.465194189927091e-07, 'epoch': 1.81} {'loss': 0.3334, 'learning_rate': 4.4642014876516536e-07, 'epoch': 1.81} {'loss': 0.2874, 'learning_rate': 4.463208893217996e-07, 'epoch': 1.82} {'loss': 0.2936, 'learning_rate': 4.4622164066271847e-07, 'epoch': 1.82} {'loss': 0.247, 'learning_rate': 4.461224027880373e-07, 'epoch': 1.82} {'loss': 0.2978, 'learning_rate': 4.4602317569786726e-07, 'epoch': 1.82} {'loss': 0.5169, 'learning_rate': 4.459239593923204e-07, 'epoch': 1.82} {'loss': 0.2334, 'learning_rate': 4.458247538715077e-07, 'epoch': 1.82} {'loss': 0.4578, 'learning_rate': 4.457255591355436e-07, 'epoch': 1.82} {'loss': 0.2178, 'learning_rate': 4.45626375184538e-07, 'epoch': 1.82} {'loss': 0.2369, 'learning_rate': 4.45527202018603e-07, 'epoch': 1.82} {'loss': 0.3416, 'learning_rate': 4.4542803963785077e-07, 'epoch': 1.82} {'loss': 0.2601, 'learning_rate': 4.453288880423934e-07, 'epoch': 1.82} {'loss': 0.3727, 'learning_rate': 4.4522974723234305e-07, 'epoch': 1.82} {'loss': 0.2485, 'learning_rate': 4.451306172078107e-07, 'epoch': 1.82} {'loss': 0.2594, 'learning_rate': 4.4503149796891076e-07, 'epoch': 1.82} {'loss': 0.4087, 'learning_rate': 4.449323895157509e-07, 'epoch': 1.82} {'loss': 0.38, 'learning_rate': 4.448332918484477e-07, 'epoch': 1.82} {'loss': 0.2985, 'learning_rate': 4.4473420496710886e-07, 'epoch': 1.82} {'loss': 0.2622, 'learning_rate': 4.446351288718498e-07, 'epoch': 1.82} {'loss': 0.1836, 'learning_rate': 4.445360635627782e-07, 'epoch': 1.82} {'loss': 0.2596, 'learning_rate': 4.4443700904001074e-07, 'epoch': 1.82} {'loss': 0.2568, 'learning_rate': 4.443379653036561e-07, 'epoch': 1.82} {'loss': 0.4143, 'learning_rate': 4.442389323538265e-07, 'epoch': 1.82} {'loss': 0.2289, 'learning_rate': 4.441399101906352e-07, 'epoch': 1.82} {'loss': 0.258, 'learning_rate': 4.4404089881419086e-07, 'epoch': 1.82} {'loss': 0.2718, 'learning_rate': 4.43941898224608e-07, 'epoch': 1.82} {'loss': 0.3284, 'learning_rate': 4.4384290842199753e-07, 'epoch': 1.82} {'loss': 0.4076, 'learning_rate': 4.437439294064716e-07, 'epoch': 1.82} {'loss': 0.2779, 'learning_rate': 4.4364496117814126e-07, 'epoch': 1.82} {'loss': 0.185, 'learning_rate': 4.4354600373711865e-07, 'epoch': 1.82} {'loss': 0.2896, 'learning_rate': 4.434470570835148e-07, 'epoch': 1.82} {'loss': 0.2899, 'learning_rate': 4.4334812121744286e-07, 'epoch': 1.82} {'loss': 0.3652, 'learning_rate': 4.432491961390129e-07, 'epoch': 1.82} {'loss': 0.3546, 'learning_rate': 4.4315028184833797e-07, 'epoch': 1.82} {'loss': 0.3329, 'learning_rate': 4.4305137834552926e-07, 'epoch': 1.82} {'loss': 0.4042, 'learning_rate': 4.429524856306977e-07, 'epoch': 1.82} {'loss': 0.3411, 'learning_rate': 4.428536037039555e-07, 'epoch': 1.82} {'loss': 0.2054, 'learning_rate': 4.427547325654136e-07, 'epoch': 1.82} {'loss': 0.4162, 'learning_rate': 4.4265587221518525e-07, 'epoch': 1.82} {'loss': 0.2053, 'learning_rate': 4.425570226533793e-07, 'epoch': 1.82} {'loss': 0.3003, 'learning_rate': 4.424581838801112e-07, 'epoch': 1.82} {'loss': 0.2508, 'learning_rate': 4.423593558954886e-07, 'epoch': 1.82} {'loss': 0.3016, 'learning_rate': 4.422605386996259e-07, 'epoch': 1.82} {'loss': 0.257, 'learning_rate': 4.42161732292633e-07, 'epoch': 1.82} {'loss': 0.2988, 'learning_rate': 4.4206293667462096e-07, 'epoch': 1.82} {'loss': 0.1757, 'learning_rate': 4.4196415184570516e-07, 'epoch': 1.82} {'loss': 0.3741, 'learning_rate': 4.4186537780599117e-07, 'epoch': 1.82} {'loss': 0.2777, 'learning_rate': 4.4176661455559656e-07, 'epoch': 1.82} {'loss': 0.377, 'learning_rate': 4.4166786209462685e-07, 'epoch': 1.82} {'loss': 0.2544, 'learning_rate': 4.415691204231998e-07, 'epoch': 1.82} {'loss': 0.3592, 'learning_rate': 4.4147038954142074e-07, 'epoch': 1.82} {'loss': 0.4044, 'learning_rate': 4.4137166944940636e-07, 'epoch': 1.82} {'loss': 0.2851, 'learning_rate': 4.4127296014726316e-07, 'epoch': 1.82} {'loss': 0.3526, 'learning_rate': 4.411742616351078e-07, 'epoch': 1.82} {'loss': 0.318, 'learning_rate': 4.410755739130479e-07, 'epoch': 1.82} {'loss': 0.2641, 'learning_rate': 4.409768969811945e-07, 'epoch': 1.82} {'loss': 0.25, 'learning_rate': 4.4087823083966307e-07, 'epoch': 1.82} {'loss': 0.4742, 'learning_rate': 4.407795754885602e-07, 'epoch': 1.82} {'loss': 0.2782, 'learning_rate': 4.4068093092800023e-07, 'epoch': 1.82} {'loss': 0.2913, 'learning_rate': 4.405822971580931e-07, 'epoch': 1.82} {'loss': 0.2662, 'learning_rate': 4.40483674178952e-07, 'epoch': 1.82} {'loss': 0.3655, 'learning_rate': 4.403850619906858e-07, 'epoch': 1.82} {'loss': 0.2716, 'learning_rate': 4.4028646059340873e-07, 'epoch': 1.82} {'loss': 0.2594, 'learning_rate': 4.401878699872286e-07, 'epoch': 1.82} {'loss': 0.2171, 'learning_rate': 4.4008929017225975e-07, 'epoch': 1.82} {'loss': 0.2795, 'learning_rate': 4.3999072114860985e-07, 'epoch': 1.82} {'loss': 0.3074, 'learning_rate': 4.398921629163955e-07, 'epoch': 1.82} {'loss': 0.3532, 'learning_rate': 4.3979361547572317e-07, 'epoch': 1.82} {'loss': 0.2551, 'learning_rate': 4.3969507882670626e-07, 'epoch': 1.82} {'loss': 0.3672, 'learning_rate': 4.395965529694568e-07, 'epoch': 1.82} {'loss': 0.3517, 'learning_rate': 4.3949803790408253e-07, 'epoch': 1.82} {'loss': 0.4305, 'learning_rate': 4.3939953363069886e-07, 'epoch': 1.82} {'loss': 0.2732, 'learning_rate': 4.3930104014941464e-07, 'epoch': 1.82} {'loss': 0.2957, 'learning_rate': 4.39202557460342e-07, 'epoch': 1.82} {'loss': 0.3482, 'learning_rate': 4.3910408556358973e-07, 'epoch': 1.82} {'loss': 0.3899, 'learning_rate': 4.390056244592722e-07, 'epoch': 1.82} {'loss': 0.355, 'learning_rate': 4.3890717414749927e-07, 'epoch': 1.82} {'loss': 0.2662, 'learning_rate': 4.3880873462838204e-07, 'epoch': 1.82} {'loss': 0.3601, 'learning_rate': 4.3871030590203036e-07, 'epoch': 1.82} {'loss': 0.2432, 'learning_rate': 4.3861188796855856e-07, 'epoch': 1.82} {'loss': 0.3107, 'learning_rate': 4.3851348082807444e-07, 'epoch': 1.82} {'loss': 0.2457, 'learning_rate': 4.3841508448069113e-07, 'epoch': 1.82} {'loss': 0.2255, 'learning_rate': 4.3831669892651863e-07, 'epoch': 1.82} {'loss': 0.3471, 'learning_rate': 4.382183241656679e-07, 'epoch': 1.82} {'loss': 0.2377, 'learning_rate': 4.381199601982511e-07, 'epoch': 1.82} {'loss': 0.3534, 'learning_rate': 4.3802160702437814e-07, 'epoch': 1.82} {'loss': 0.4103, 'learning_rate': 4.379232646441611e-07, 'epoch': 1.82} {'loss': 0.3309, 'learning_rate': 4.378249330577089e-07, 'epoch': 1.82} {'loss': 0.1575, 'learning_rate': 4.377266122651358e-07, 'epoch': 1.82} {'loss': 0.4676, 'learning_rate': 4.3762830226654953e-07, 'epoch': 1.82} {'loss': 0.2797, 'learning_rate': 4.3753000306206437e-07, 'epoch': 1.82} {'loss': 0.4599, 'learning_rate': 4.37431714651787e-07, 'epoch': 1.82} {'loss': 0.197, 'learning_rate': 4.3733343703583287e-07, 'epoch': 1.82} {'loss': 0.2468, 'learning_rate': 4.372351702143096e-07, 'epoch': 1.82} {'loss': 0.3234, 'learning_rate': 4.3713691418733053e-07, 'epoch': 1.82} {'loss': 0.2646, 'learning_rate': 4.3703866895500544e-07, 'epoch': 1.82} {'loss': 0.3642, 'learning_rate': 4.369404345174444e-07, 'epoch': 1.82} {'loss': 0.3727, 'learning_rate': 4.368422108747594e-07, 'epoch': 1.82} {'loss': 0.279, 'learning_rate': 4.3674399802706046e-07, 'epoch': 1.82} {'loss': 0.4676, 'learning_rate': 4.3664579597446077e-07, 'epoch': 1.82} {'loss': 0.2379, 'learning_rate': 4.3654760471706693e-07, 'epoch': 1.82} {'loss': 0.2909, 'learning_rate': 4.364494242549944e-07, 'epoch': 1.82} {'loss': 0.353, 'learning_rate': 4.3635125458834973e-07, 'epoch': 1.82} {'loss': 0.446, 'learning_rate': 4.362530957172484e-07, 'epoch': 1.82} {'loss': 0.3332, 'learning_rate': 4.361549476417959e-07, 'epoch': 1.82} {'loss': 0.2644, 'learning_rate': 4.360568103621088e-07, 'epoch': 1.82} {'loss': 0.285, 'learning_rate': 4.359586838782925e-07, 'epoch': 1.82} {'loss': 0.2576, 'learning_rate': 4.3586056819046153e-07, 'epoch': 1.82} {'loss': 0.3734, 'learning_rate': 4.357624632987256e-07, 'epoch': 1.82} {'loss': 0.4447, 'learning_rate': 4.3566436920319367e-07, 'epoch': 1.82} {'loss': 0.1778, 'learning_rate': 4.3556628590397887e-07, 'epoch': 1.82} {'loss': 0.1816, 'learning_rate': 4.3546821340119006e-07, 'epoch': 1.82} {'loss': 0.281, 'learning_rate': 4.3537015169494043e-07, 'epoch': 1.82} {'loss': 0.2815, 'learning_rate': 4.3527210078533777e-07, 'epoch': 1.82} {'loss': 0.314, 'learning_rate': 4.3517406067249414e-07, 'epoch': 1.82} {'loss': 0.2531, 'learning_rate': 4.3507603135652057e-07, 'epoch': 1.82} {'loss': 0.3568, 'learning_rate': 4.3497801283752806e-07, 'epoch': 1.82} {'loss': 0.3585, 'learning_rate': 4.3488000511562434e-07, 'epoch': 1.82} {'loss': 0.2085, 'learning_rate': 4.347820081909249e-07, 'epoch': 1.82} {'loss': 0.3363, 'learning_rate': 4.346840220635351e-07, 'epoch': 1.82} {'loss': 0.2542, 'learning_rate': 4.3458604673357053e-07, 'epoch': 1.82} {'loss': 0.3347, 'learning_rate': 4.344880822011388e-07, 'epoch': 1.82} {'loss': 0.3913, 'learning_rate': 4.3439012846634876e-07, 'epoch': 1.82} {'loss': 0.4006, 'learning_rate': 4.3429218552931586e-07, 'epoch': 1.82} {'loss': 0.2647, 'learning_rate': 4.341942533901466e-07, 'epoch': 1.82} {'loss': 0.3799, 'learning_rate': 4.340963320489544e-07, 'epoch': 1.82} {'loss': 0.3302, 'learning_rate': 4.339984215058468e-07, 'epoch': 1.82} {'loss': 0.2831, 'learning_rate': 4.339005217609371e-07, 'epoch': 1.82} {'loss': 0.456, 'learning_rate': 4.338026328143341e-07, 'epoch': 1.82} {'loss': 0.2636, 'learning_rate': 4.337047546661488e-07, 'epoch': 1.82} {'loss': 0.259, 'learning_rate': 4.336068873164911e-07, 'epoch': 1.82} {'loss': 0.2532, 'learning_rate': 4.3350903076547437e-07, 'epoch': 1.82} {'loss': 0.2629, 'learning_rate': 4.334111850132039e-07, 'epoch': 1.82} {'loss': 0.452, 'learning_rate': 4.3331335005979527e-07, 'epoch': 1.82} {'loss': 0.4075, 'learning_rate': 4.332155259053561e-07, 'epoch': 1.82} {'loss': 0.2666, 'learning_rate': 4.3311771254999746e-07, 'epoch': 1.82} {'loss': 0.2522, 'learning_rate': 4.3301990999382925e-07, 'epoch': 1.82} {'loss': 0.4786, 'learning_rate': 4.329221182369625e-07, 'epoch': 1.82} {'loss': 0.2944, 'learning_rate': 4.328243372795071e-07, 'epoch': 1.82} {'loss': 0.2215, 'learning_rate': 4.3272656712157413e-07, 'epoch': 1.82} {'loss': 0.259, 'learning_rate': 4.3262880776327345e-07, 'epoch': 1.82} {'loss': 0.2715, 'learning_rate': 4.3253105920471495e-07, 'epoch': 1.82} {'loss': 0.3923, 'learning_rate': 4.324333214460108e-07, 'epoch': 1.82} {'loss': 0.35, 'learning_rate': 4.323355944872687e-07, 'epoch': 1.82} {'loss': 0.2781, 'learning_rate': 4.3223787832859965e-07, 'epoch': 1.82} {'loss': 0.2971, 'learning_rate': 4.321401729701169e-07, 'epoch': 1.82} {'loss': 0.2296, 'learning_rate': 4.3204247841192704e-07, 'epoch': 1.82} {'loss': 0.3546, 'learning_rate': 4.319447946541433e-07, 'epoch': 1.82} {'loss': 0.2757, 'learning_rate': 4.3184712169687225e-07, 'epoch': 1.82} {'loss': 0.2617, 'learning_rate': 4.317494595402283e-07, 'epoch': 1.82} {'loss': 0.3202, 'learning_rate': 4.3165180818431794e-07, 'epoch': 1.82} {'loss': 0.3037, 'learning_rate': 4.3155416762925564e-07, 'epoch': 1.82} {'loss': 0.3535, 'learning_rate': 4.314565378751467e-07, 'epoch': 1.82} {'loss': 0.3982, 'learning_rate': 4.313589189221057e-07, 'epoch': 1.82} {'loss': 0.2475, 'learning_rate': 4.3126131077024015e-07, 'epoch': 1.82} {'loss': 0.2961, 'learning_rate': 4.311637134196611e-07, 'epoch': 1.82} {'loss': 0.2361, 'learning_rate': 4.3106612687047854e-07, 'epoch': 1.82} {'loss': 0.3416, 'learning_rate': 4.3096855112280235e-07, 'epoch': 1.82} {'loss': 0.473, 'learning_rate': 4.308709861767435e-07, 'epoch': 1.82} {'loss': 0.1798, 'learning_rate': 4.3077343203241086e-07, 'epoch': 1.82} {'loss': 0.3803, 'learning_rate': 4.306758886899165e-07, 'epoch': 1.82} {'loss': 0.1947, 'learning_rate': 4.3057835614936817e-07, 'epoch': 1.82} {'loss': 0.4725, 'learning_rate': 4.30480834410878e-07, 'epoch': 1.82} {'loss': 0.2763, 'learning_rate': 4.303833234745547e-07, 'epoch': 1.82} {'loss': 0.2207, 'learning_rate': 4.302858233405094e-07, 'epoch': 1.82} {'loss': 0.2232, 'learning_rate': 4.3018833400885087e-07, 'epoch': 1.82} {'loss': 0.2486, 'learning_rate': 4.300908554796912e-07, 'epoch': 1.82} {'loss': 0.4352, 'learning_rate': 4.2999338775313924e-07, 'epoch': 1.82} {'loss': 0.2513, 'learning_rate': 4.298959308293038e-07, 'epoch': 1.82} {'loss': 0.3041, 'learning_rate': 4.29798484708297e-07, 'epoch': 1.82} {'loss': 0.2039, 'learning_rate': 4.297010493902265e-07, 'epoch': 1.82} {'loss': 0.3472, 'learning_rate': 4.2960362487520447e-07, 'epoch': 1.82} {'loss': 0.3925, 'learning_rate': 4.2950621116333967e-07, 'epoch': 1.82} {'loss': 0.343, 'learning_rate': 4.294088082547432e-07, 'epoch': 1.82} {'loss': 0.398, 'learning_rate': 4.293114161495227e-07, 'epoch': 1.82} {'loss': 0.3332, 'learning_rate': 4.2921403484779134e-07, 'epoch': 1.82} {'loss': 0.3381, 'learning_rate': 4.291166643496558e-07, 'epoch': 1.82} {'loss': 0.2595, 'learning_rate': 4.2901930465522935e-07, 'epoch': 1.82} {'loss': 0.2356, 'learning_rate': 4.289219557646185e-07, 'epoch': 1.82} {'loss': 0.3867, 'learning_rate': 4.288246176779365e-07, 'epoch': 1.82} {'loss': 0.3364, 'learning_rate': 4.28727290395291e-07, 'epoch': 1.82} {'loss': 0.2827, 'learning_rate': 4.2862997391679093e-07, 'epoch': 1.82} {'loss': 0.3981, 'learning_rate': 4.2853266824254945e-07, 'epoch': 1.82} {'loss': 0.4615, 'learning_rate': 4.2843537337267204e-07, 'epoch': 1.82} {'loss': 0.336, 'learning_rate': 4.2833808930727305e-07, 'epoch': 1.82} {'loss': 0.2371, 'learning_rate': 4.2824081604645904e-07, 'epoch': 1.82} {'loss': 0.4861, 'learning_rate': 4.281435535903422e-07, 'epoch': 1.82} {'loss': 0.3768, 'learning_rate': 4.280463019390291e-07, 'epoch': 1.82} {'loss': 0.3766, 'learning_rate': 4.27949061092634e-07, 'epoch': 1.82} {'loss': 0.2648, 'learning_rate': 4.2785183105126247e-07, 'epoch': 1.82} {'loss': 0.2355, 'learning_rate': 4.2775461181502664e-07, 'epoch': 1.82} {'loss': 0.4246, 'learning_rate': 4.2765740338403527e-07, 'epoch': 1.82} {'loss': 0.3483, 'learning_rate': 4.275602057583994e-07, 'epoch': 1.82} {'loss': 0.2582, 'learning_rate': 4.2746301893822783e-07, 'epoch': 1.82} {'loss': 0.3042, 'learning_rate': 4.273658429236283e-07, 'epoch': 1.82} {'loss': 0.2723, 'learning_rate': 4.272686777147139e-07, 'epoch': 1.82} {'loss': 0.4322, 'learning_rate': 4.271715233115925e-07, 'epoch': 1.82} {'loss': 0.2095, 'learning_rate': 4.27074379714375e-07, 'epoch': 1.82} {'loss': 0.2976, 'learning_rate': 4.269772469231681e-07, 'epoch': 1.82} {'loss': 0.3538, 'learning_rate': 4.2688012493808496e-07, 'epoch': 1.82} {'loss': 0.3371, 'learning_rate': 4.2678301375923326e-07, 'epoch': 1.82} {'loss': 0.2339, 'learning_rate': 4.26685913386724e-07, 'epoch': 1.82} {'loss': 0.3416, 'learning_rate': 4.265888238206639e-07, 'epoch': 1.82} {'loss': 0.1628, 'learning_rate': 4.264917450611661e-07, 'epoch': 1.82} {'loss': 0.4645, 'learning_rate': 4.263946771083383e-07, 'epoch': 1.82} {'loss': 0.3671, 'learning_rate': 4.2629761996229035e-07, 'epoch': 1.82} {'loss': 0.3596, 'learning_rate': 4.262005736231334e-07, 'epoch': 1.82} {'loss': 0.3716, 'learning_rate': 4.2610353809097283e-07, 'epoch': 1.82} {'loss': 0.3337, 'learning_rate': 4.2600651336592304e-07, 'epoch': 1.82} {'loss': 0.2172, 'learning_rate': 4.2590949944808944e-07, 'epoch': 1.82} {'loss': 0.3496, 'learning_rate': 4.2581249633758427e-07, 'epoch': 1.82} {'loss': 0.2236, 'learning_rate': 4.2571550403451625e-07, 'epoch': 1.82} {'loss': 0.3141, 'learning_rate': 4.256185225389953e-07, 'epoch': 1.82} {'loss': 0.2407, 'learning_rate': 4.2552155185112907e-07, 'epoch': 1.82} {'loss': 0.3385, 'learning_rate': 4.254245919710298e-07, 'epoch': 1.82} {'loss': 0.3489, 'learning_rate': 4.25327642898804e-07, 'epoch': 1.82} {'loss': 0.3358, 'learning_rate': 4.2523070463456385e-07, 'epoch': 1.82} {'loss': 0.3254, 'learning_rate': 4.251337771784159e-07, 'epoch': 1.82} {'loss': 0.2986, 'learning_rate': 4.2503686053047333e-07, 'epoch': 1.82} {'loss': 0.2758, 'learning_rate': 4.249399546908428e-07, 'epoch': 1.82} {'loss': 0.2539, 'learning_rate': 4.248430596596331e-07, 'epoch': 1.82} {'loss': 0.2342, 'learning_rate': 4.2474617543695527e-07, 'epoch': 1.82} {'loss': 0.3026, 'learning_rate': 4.246493020229181e-07, 'epoch': 1.82} {'loss': 0.3072, 'learning_rate': 4.245524394176326e-07, 'epoch': 1.82} {'loss': 0.467, 'learning_rate': 4.244555876212042e-07, 'epoch': 1.82} {'loss': 0.2745, 'learning_rate': 4.243587466337462e-07, 'epoch': 1.82} {'loss': 0.2356, 'learning_rate': 4.242619164553652e-07, 'epoch': 1.82} {'loss': 0.4113, 'learning_rate': 4.241650970861722e-07, 'epoch': 1.82} {'loss': 0.2497, 'learning_rate': 4.240682885262748e-07, 'epoch': 1.82} {'loss': 0.2388, 'learning_rate': 4.2397149077578526e-07, 'epoch': 1.82} {'loss': 0.305, 'learning_rate': 4.23874703834809e-07, 'epoch': 1.82} {'loss': 0.2873, 'learning_rate': 4.2377792770345927e-07, 'epoch': 1.82} {'loss': 0.417, 'learning_rate': 4.236811623818415e-07, 'epoch': 1.82} {'loss': 0.2654, 'learning_rate': 4.2358440787006794e-07, 'epoch': 1.82} {'loss': 0.222, 'learning_rate': 4.2348766416824725e-07, 'epoch': 1.82} {'loss': 0.3633, 'learning_rate': 4.23390931276485e-07, 'epoch': 1.82} {'loss': 0.2746, 'learning_rate': 4.232942091948966e-07, 'epoch': 1.82} {'loss': 0.279, 'learning_rate': 4.2319749792358535e-07, 'epoch': 1.82} {'loss': 0.3607, 'learning_rate': 4.2310079746266443e-07, 'epoch': 1.82} {'loss': 0.4021, 'learning_rate': 4.230041078122404e-07, 'epoch': 1.82} {'loss': 0.3487, 'learning_rate': 4.2290742897242443e-07, 'epoch': 1.82} {'loss': 0.3627, 'learning_rate': 4.228107609433241e-07, 'epoch': 1.82} {'loss': 0.2168, 'learning_rate': 4.227141037250493e-07, 'epoch': 1.82} {'loss': 0.3513, 'learning_rate': 4.2261745731771e-07, 'epoch': 1.82} {'loss': 0.3881, 'learning_rate': 4.2252082172141385e-07, 'epoch': 1.82} {'loss': 0.4635, 'learning_rate': 4.224241969362708e-07, 'epoch': 1.82} {'loss': 0.3141, 'learning_rate': 4.223275829623885e-07, 'epoch': 1.82} {'loss': 0.2614, 'learning_rate': 4.2223097979987915e-07, 'epoch': 1.82} {'loss': 0.3849, 'learning_rate': 4.2213438744884817e-07, 'epoch': 1.82} {'loss': 0.2614, 'learning_rate': 4.2203780590940657e-07, 'epoch': 1.82} {'loss': 0.2704, 'learning_rate': 4.2194123518166206e-07, 'epoch': 1.82} {'loss': 0.2798, 'learning_rate': 4.218446752657257e-07, 'epoch': 1.82} {'loss': 0.2271, 'learning_rate': 4.217481261617051e-07, 'epoch': 1.82} {'loss': 0.2721, 'learning_rate': 4.216515878697092e-07, 'epoch': 1.82} {'loss': 0.4211, 'learning_rate': 4.215550603898488e-07, 'epoch': 1.82} {'loss': 0.3168, 'learning_rate': 4.214585437222285e-07, 'epoch': 1.82} {'loss': 0.2206, 'learning_rate': 4.213620378669625e-07, 'epoch': 1.82} {'loss': 0.3253, 'learning_rate': 4.212655428241552e-07, 'epoch': 1.82} {'loss': 0.3102, 'learning_rate': 4.211690585939199e-07, 'epoch': 1.82} {'loss': 0.3141, 'learning_rate': 4.2107258517636084e-07, 'epoch': 1.82} {'loss': 0.3541, 'learning_rate': 4.2097612257159135e-07, 'epoch': 1.82} {'loss': 0.3621, 'learning_rate': 4.208796707797169e-07, 'epoch': 1.82} {'loss': 0.249, 'learning_rate': 4.2078322980084853e-07, 'epoch': 1.82} {'loss': 0.2641, 'learning_rate': 4.2068679963509384e-07, 'epoch': 1.82} {'loss': 0.2997, 'learning_rate': 4.205903802825628e-07, 'epoch': 1.82} {'loss': 0.274, 'learning_rate': 4.20493971743362e-07, 'epoch': 1.82} {'loss': 0.2273, 'learning_rate': 4.203975740176047e-07, 'epoch': 1.82} {'loss': 0.2537, 'learning_rate': 4.2030118710539524e-07, 'epoch': 1.82} {'loss': 0.2256, 'learning_rate': 4.202048110068435e-07, 'epoch': 1.82} {'loss': 0.3026, 'learning_rate': 4.2010844572206053e-07, 'epoch': 1.82} {'loss': 0.3014, 'learning_rate': 4.200120912511518e-07, 'epoch': 1.82} {'loss': 0.2855, 'learning_rate': 4.199157475942284e-07, 'epoch': 1.82} {'loss': 0.261, 'learning_rate': 4.1981941475139785e-07, 'epoch': 1.82} {'loss': 0.2757, 'learning_rate': 4.1972309272277024e-07, 'epoch': 1.82} {'loss': 0.2959, 'learning_rate': 4.1962678150845204e-07, 'epoch': 1.82} {'loss': 0.3771, 'learning_rate': 4.195304811085554e-07, 'epoch': 1.82} {'loss': 0.3165, 'learning_rate': 4.194341915231859e-07, 'epoch': 1.82} {'loss': 0.3355, 'learning_rate': 4.193379127524533e-07, 'epoch': 1.82} {'loss': 0.3402, 'learning_rate': 4.192416447964664e-07, 'epoch': 1.82} {'loss': 0.3515, 'learning_rate': 4.191453876553342e-07, 'epoch': 1.82} {'loss': 0.2589, 'learning_rate': 4.190491413291653e-07, 'epoch': 1.82} {'loss': 0.3941, 'learning_rate': 4.1895290581806747e-07, 'epoch': 1.82} {'loss': 0.4558, 'learning_rate': 4.1885668112215063e-07, 'epoch': 1.82} {'loss': 0.2644, 'learning_rate': 4.187604672415213e-07, 'epoch': 1.82} {'loss': 0.255, 'learning_rate': 4.1866426417629056e-07, 'epoch': 1.82} {'loss': 0.2563, 'learning_rate': 4.18568071926565e-07, 'epoch': 1.82} {'loss': 0.2223, 'learning_rate': 4.184718904924545e-07, 'epoch': 1.82} {'loss': 0.5419, 'learning_rate': 4.183757198740668e-07, 'epoch': 1.82} {'loss': 0.2486, 'learning_rate': 4.182795600715117e-07, 'epoch': 1.82} {'loss': 0.2812, 'learning_rate': 4.1818341108489593e-07, 'epoch': 1.82} {'loss': 0.2982, 'learning_rate': 4.1808727291433036e-07, 'epoch': 1.82} {'loss': 0.1807, 'learning_rate': 4.179911455599206e-07, 'epoch': 1.82} {'loss': 0.2163, 'learning_rate': 4.178950290217787e-07, 'epoch': 1.82} {'loss': 0.3675, 'learning_rate': 4.1779892330001124e-07, 'epoch': 1.82} {'loss': 0.1796, 'learning_rate': 4.1770282839472485e-07, 'epoch': 1.82} {'loss': 0.305, 'learning_rate': 4.1760674430603056e-07, 'epoch': 1.82} {'loss': 0.4254, 'learning_rate': 4.175106710340349e-07, 'epoch': 1.82} {'loss': 0.3338, 'learning_rate': 4.1741460857884994e-07, 'epoch': 1.82} {'loss': 0.2914, 'learning_rate': 4.173185569405791e-07, 'epoch': 1.82} {'loss': 0.2789, 'learning_rate': 4.172225161193355e-07, 'epoch': 1.82} {'loss': 0.2284, 'learning_rate': 4.171264861152236e-07, 'epoch': 1.82} {'loss': 0.2735, 'learning_rate': 4.170304669283554e-07, 'epoch': 1.82} {'loss': 0.3073, 'learning_rate': 4.1693445855883643e-07, 'epoch': 1.82} {'loss': 0.3192, 'learning_rate': 4.1683846100677663e-07, 'epoch': 1.82} {'loss': 0.3093, 'learning_rate': 4.1674247427228254e-07, 'epoch': 1.82} {'loss': 0.4102, 'learning_rate': 4.1664649835546634e-07, 'epoch': 1.82} {'loss': 0.2866, 'learning_rate': 4.165505332564324e-07, 'epoch': 1.82} {'loss': 0.1926, 'learning_rate': 4.164545789752905e-07, 'epoch': 1.82} {'loss': 0.2797, 'learning_rate': 4.163586355121496e-07, 'epoch': 1.82} {'loss': 0.3977, 'learning_rate': 4.162627028671162e-07, 'epoch': 1.82} {'loss': 0.2291, 'learning_rate': 4.161667810403014e-07, 'epoch': 1.82} {'loss': 0.2839, 'learning_rate': 4.1607087003181056e-07, 'epoch': 1.82} {'loss': 0.5008, 'learning_rate': 4.1597496984175367e-07, 'epoch': 1.82} {'loss': 0.1894, 'learning_rate': 4.158790804702384e-07, 'epoch': 1.82} {'loss': 0.4541, 'learning_rate': 4.1578320191737353e-07, 'epoch': 1.82} {'loss': 0.4204, 'learning_rate': 4.156873341832657e-07, 'epoch': 1.82} {'loss': 0.237, 'learning_rate': 4.1559147726802583e-07, 'epoch': 1.82} {'loss': 0.4232, 'learning_rate': 4.154956311717595e-07, 'epoch': 1.82} {'loss': 0.3632, 'learning_rate': 4.1539979589457767e-07, 'epoch': 1.82} {'loss': 0.2037, 'learning_rate': 4.1530397143658585e-07, 'epoch': 1.82} {'loss': 0.3815, 'learning_rate': 4.152081577978928e-07, 'epoch': 1.82} {'loss': 0.4841, 'learning_rate': 4.151123549786085e-07, 'epoch': 1.82} {'loss': 0.2359, 'learning_rate': 4.150165629788372e-07, 'epoch': 1.82} {'loss': 0.3261, 'learning_rate': 4.1492078179869223e-07, 'epoch': 1.82} {'loss': 0.3566, 'learning_rate': 4.148250114382768e-07, 'epoch': 1.82} {'loss': 0.2643, 'learning_rate': 4.147292518977031e-07, 'epoch': 1.82} {'loss': 0.3292, 'learning_rate': 4.146335031770754e-07, 'epoch': 1.82} {'loss': 0.2393, 'learning_rate': 4.145377652765059e-07, 'epoch': 1.82} {'loss': 0.3376, 'learning_rate': 4.1444203819609896e-07, 'epoch': 1.82} {'loss': 0.2723, 'learning_rate': 4.1434632193596447e-07, 'epoch': 1.82} {'loss': 0.3835, 'learning_rate': 4.142506164962101e-07, 'epoch': 1.82} {'loss': 0.1602, 'learning_rate': 4.1415492187694475e-07, 'epoch': 1.82} {'loss': 0.2862, 'learning_rate': 4.14059238078276e-07, 'epoch': 1.82} {'loss': 0.2303, 'learning_rate': 4.1396356510030934e-07, 'epoch': 1.82} {'loss': 0.383, 'learning_rate': 4.1386790294315695e-07, 'epoch': 1.82} {'loss': 0.3576, 'learning_rate': 4.1377225160692424e-07, 'epoch': 1.82} {'loss': 0.3556, 'learning_rate': 4.136766110917201e-07, 'epoch': 1.82} {'loss': 0.4244, 'learning_rate': 4.1358098139765104e-07, 'epoch': 1.82} {'loss': 0.4217, 'learning_rate': 4.1348536252482695e-07, 'epoch': 1.82} {'loss': 0.2633, 'learning_rate': 4.133897544733545e-07, 'epoch': 1.82} {'loss': 0.3293, 'learning_rate': 4.132941572433424e-07, 'epoch': 1.82} {'loss': 0.4124, 'learning_rate': 4.131985708348973e-07, 'epoch': 1.82} {'loss': 0.498, 'learning_rate': 4.13102995248128e-07, 'epoch': 1.82} {'loss': 0.3104, 'learning_rate': 4.130074304831444e-07, 'epoch': 1.82} {'loss': 0.3396, 'learning_rate': 4.129118765400497e-07, 'epoch': 1.82} {'loss': 0.4478, 'learning_rate': 4.128163334189572e-07, 'epoch': 1.82} {'loss': 0.423, 'learning_rate': 4.1272080111997015e-07, 'epoch': 1.82} {'loss': 0.2055, 'learning_rate': 4.126252796431984e-07, 'epoch': 1.82} {'loss': 0.4259, 'learning_rate': 4.125297689887497e-07, 'epoch': 1.82} {'loss': 0.3454, 'learning_rate': 4.124342691567329e-07, 'epoch': 1.82} {'loss': 0.2273, 'learning_rate': 4.1233878014725225e-07, 'epoch': 1.82} {'loss': 0.3566, 'learning_rate': 4.1224330196041995e-07, 'epoch': 1.82} {'loss': 0.352, 'learning_rate': 4.1214783459634034e-07, 'epoch': 1.82} {'loss': 0.3013, 'learning_rate': 4.120523780551244e-07, 'epoch': 1.82} {'loss': 0.2772, 'learning_rate': 4.1195693233687774e-07, 'epoch': 1.82} {'loss': 0.3042, 'learning_rate': 4.118614974417068e-07, 'epoch': 1.82} {'loss': 0.5057, 'learning_rate': 4.117660733697226e-07, 'epoch': 1.82} {'loss': 0.2503, 'learning_rate': 4.1167066012103073e-07, 'epoch': 1.82} {'loss': 0.2073, 'learning_rate': 4.1157525769573993e-07, 'epoch': 1.82} {'loss': 0.4359, 'learning_rate': 4.114798660939556e-07, 'epoch': 1.82} {'loss': 0.2989, 'learning_rate': 4.113844853157889e-07, 'epoch': 1.82} {'loss': 0.1558, 'learning_rate': 4.112891153613441e-07, 'epoch': 1.82} {'loss': 0.4413, 'learning_rate': 4.1119375623073224e-07, 'epoch': 1.82} {'loss': 0.431, 'learning_rate': 4.1109840792405764e-07, 'epoch': 1.82} {'loss': 0.4119, 'learning_rate': 4.110030704414314e-07, 'epoch': 1.82} {'loss': 0.265, 'learning_rate': 4.1090774378295785e-07, 'epoch': 1.82} {'loss': 0.2784, 'learning_rate': 4.1081242794874686e-07, 'epoch': 1.82} {'loss': 0.4478, 'learning_rate': 4.107171229389051e-07, 'epoch': 1.82} {'loss': 0.1957, 'learning_rate': 4.1062182875353906e-07, 'epoch': 1.82} {'loss': 0.2655, 'learning_rate': 4.105265453927587e-07, 'epoch': 1.82} {'loss': 0.445, 'learning_rate': 4.104312728566695e-07, 'epoch': 1.82} {'loss': 0.196, 'learning_rate': 4.1033601114538134e-07, 'epoch': 1.82} {'loss': 0.3621, 'learning_rate': 4.102407602589986e-07, 'epoch': 1.82} {'loss': 0.2498, 'learning_rate': 4.101455201976312e-07, 'epoch': 1.82} {'loss': 0.1925, 'learning_rate': 4.100502909613846e-07, 'epoch': 1.82} {'loss': 0.4041, 'learning_rate': 4.0995507255036984e-07, 'epoch': 1.82} {'loss': 0.2117, 'learning_rate': 4.098598649646901e-07, 'epoch': 1.82} {'loss': 0.3095, 'learning_rate': 4.0976466820445647e-07, 'epoch': 1.82} {'loss': 0.4318, 'learning_rate': 4.0966948226977445e-07, 'epoch': 1.82} {'loss': 0.3328, 'learning_rate': 4.0957430716075165e-07, 'epoch': 1.82} {'loss': 0.306, 'learning_rate': 4.094791428774969e-07, 'epoch': 1.82} {'loss': 0.3708, 'learning_rate': 4.0938398942011457e-07, 'epoch': 1.82} {'loss': 0.3041, 'learning_rate': 4.092888467887157e-07, 'epoch': 1.82} {'loss': 0.3192, 'learning_rate': 4.0919371498340467e-07, 'epoch': 1.82} {'loss': 0.2636, 'learning_rate': 4.090985940042913e-07, 'epoch': 1.82} {'loss': 0.3547, 'learning_rate': 4.0900348385148003e-07, 'epoch': 1.82} {'loss': 0.232, 'learning_rate': 4.0890838452508185e-07, 'epoch': 1.82} {'loss': 0.4588, 'learning_rate': 4.0881329602520115e-07, 'epoch': 1.82} {'loss': 0.3125, 'learning_rate': 4.087182183519467e-07, 'epoch': 1.82} {'loss': 0.2835, 'learning_rate': 4.086231515054251e-07, 'epoch': 1.82} {'loss': 0.2228, 'learning_rate': 4.085280954857451e-07, 'epoch': 1.82} {'loss': 0.3595, 'learning_rate': 4.0843305029301227e-07, 'epoch': 1.82} {'loss': 0.3251, 'learning_rate': 4.0833801592733534e-07, 'epoch': 1.82} {'loss': 0.1967, 'learning_rate': 4.082429923888209e-07, 'epoch': 1.82} {'loss': 0.3845, 'learning_rate': 4.0814797967757446e-07, 'epoch': 1.82} {'loss': 0.3965, 'learning_rate': 4.08052977793707e-07, 'epoch': 1.82} {'loss': 0.2288, 'learning_rate': 4.079579867373218e-07, 'epoch': 1.82} {'loss': 0.3054, 'learning_rate': 4.0786300650852983e-07, 'epoch': 1.82} {'loss': 0.3207, 'learning_rate': 4.077680371074355e-07, 'epoch': 1.82} {'loss': 0.2911, 'learning_rate': 4.076730785341476e-07, 'epoch': 1.82} {'loss': 0.3262, 'learning_rate': 4.0757813078877163e-07, 'epoch': 1.82} {'loss': 0.3825, 'learning_rate': 4.074831938714174e-07, 'epoch': 1.82} {'loss': 0.2785, 'learning_rate': 4.073882677821883e-07, 'epoch': 1.82} {'loss': 0.1951, 'learning_rate': 4.072933525211964e-07, 'epoch': 1.82} {'loss': 0.4497, 'learning_rate': 4.071984480885438e-07, 'epoch': 1.82} {'loss': 0.4693, 'learning_rate': 4.0710355448434155e-07, 'epoch': 1.82} {'loss': 0.2138, 'learning_rate': 4.070086717086963e-07, 'epoch': 1.82} {'loss': 0.2578, 'learning_rate': 4.069137997617112e-07, 'epoch': 1.82} {'loss': 0.4266, 'learning_rate': 4.068189386434984e-07, 'epoch': 1.82} {'loss': 0.204, 'learning_rate': 4.0672408835416124e-07, 'epoch': 1.82} {'loss': 0.3905, 'learning_rate': 4.066292488938095e-07, 'epoch': 1.82} {'loss': 0.5264, 'learning_rate': 4.065344202625476e-07, 'epoch': 1.82} {'loss': 0.4173, 'learning_rate': 4.064396024604866e-07, 'epoch': 1.82} {'loss': 0.3703, 'learning_rate': 4.0634479548772867e-07, 'epoch': 1.82} {'loss': 0.3516, 'learning_rate': 4.0624999934438467e-07, 'epoch': 1.82} {'loss': 0.3393, 'learning_rate': 4.06155214030558e-07, 'epoch': 1.82} {'loss': 0.3613, 'learning_rate': 4.060604395463597e-07, 'epoch': 1.82} {'loss': 0.342, 'learning_rate': 4.0596567589189394e-07, 'epoch': 1.82} {'loss': 0.29, 'learning_rate': 4.058709230672697e-07, 'epoch': 1.82} {'loss': 0.3382, 'learning_rate': 4.057761810725924e-07, 'epoch': 1.82} {'loss': 0.2658, 'learning_rate': 4.056814499079675e-07, 'epoch': 1.82} {'loss': 0.4044, 'learning_rate': 4.0558672957350606e-07, 'epoch': 1.82} {'loss': 0.424, 'learning_rate': 4.054920200693113e-07, 'epoch': 1.82} {'loss': 0.2387, 'learning_rate': 4.0539732139549317e-07, 'epoch': 1.82} {'loss': 0.3532, 'learning_rate': 4.053026335521548e-07, 'epoch': 1.82} {'loss': 0.2733, 'learning_rate': 4.0520795653940737e-07, 'epoch': 1.82} {'loss': 0.2246, 'learning_rate': 4.05113290357354e-07, 'epoch': 1.82} {'loss': 0.3548, 'learning_rate': 4.050186350061036e-07, 'epoch': 1.82} {'loss': 0.3581, 'learning_rate': 4.0492399048576267e-07, 'epoch': 1.82} {'loss': 0.3528, 'learning_rate': 4.0482935679643787e-07, 'epoch': 1.82} {'loss': 0.2352, 'learning_rate': 4.047347339382357e-07, 'epoch': 1.82} {'loss': 0.247, 'learning_rate': 4.04640121911265e-07, 'epoch': 1.82} {'loss': 0.4323, 'learning_rate': 4.0454552071563014e-07, 'epoch': 1.82} {'loss': 0.3713, 'learning_rate': 4.0445093035143877e-07, 'epoch': 1.82} {'loss': 0.2633, 'learning_rate': 4.043563508187975e-07, 'epoch': 1.82} {'loss': 0.3529, 'learning_rate': 4.0426178211781297e-07, 'epoch': 1.82} {'loss': 0.4076, 'learning_rate': 4.041672242485928e-07, 'epoch': 1.82} {'loss': 0.2797, 'learning_rate': 4.0407267721124135e-07, 'epoch': 1.82} {'loss': 0.3894, 'learning_rate': 4.0397814100586965e-07, 'epoch': 1.82} {'loss': 0.257, 'learning_rate': 4.0388361563257985e-07, 'epoch': 1.82} {'loss': 0.2027, 'learning_rate': 4.0378910109148074e-07, 'epoch': 1.82} {'loss': 0.2701, 'learning_rate': 4.0369459738268005e-07, 'epoch': 1.82} {'loss': 0.4341, 'learning_rate': 4.0360010450628207e-07, 'epoch': 1.82} {'loss': 0.2637, 'learning_rate': 4.0350562246239565e-07, 'epoch': 1.82} {'loss': 0.209, 'learning_rate': 4.034111512511263e-07, 'epoch': 1.82} {'loss': 0.3014, 'learning_rate': 4.0331669087258163e-07, 'epoch': 1.82} {'loss': 0.2618, 'learning_rate': 4.0322224132686605e-07, 'epoch': 1.82} {'loss': 0.3324, 'learning_rate': 4.0312780261408947e-07, 'epoch': 1.82} {'loss': 0.3488, 'learning_rate': 4.030333747343551e-07, 'epoch': 1.82} {'loss': 0.3955, 'learning_rate': 4.029389576877718e-07, 'epoch': 1.82} {'loss': 0.2508, 'learning_rate': 4.0284455147444504e-07, 'epoch': 1.82} {'loss': 0.3075, 'learning_rate': 4.027501560944824e-07, 'epoch': 1.82} {'loss': 0.2754, 'learning_rate': 4.026557715479906e-07, 'epoch': 1.82} {'loss': 0.2043, 'learning_rate': 4.0256139783507285e-07, 'epoch': 1.82} {'loss': 0.3503, 'learning_rate': 4.024670349558413e-07, 'epoch': 1.82} {'loss': 0.2882, 'learning_rate': 4.023726829103969e-07, 'epoch': 1.82} {'loss': 0.2977, 'learning_rate': 4.022783416988496e-07, 'epoch': 1.82} {'loss': 0.3288, 'learning_rate': 4.021840113213049e-07, 'epoch': 1.82} {'loss': 0.4044, 'learning_rate': 4.020896917778694e-07, 'epoch': 1.82} {'loss': 0.3331, 'learning_rate': 4.019953830686496e-07, 'epoch': 1.82} {'loss': 0.3827, 'learning_rate': 4.0190108519375215e-07, 'epoch': 1.82} {'loss': 0.2111, 'learning_rate': 4.0180679815328247e-07, 'epoch': 1.82} {'loss': 0.3156, 'learning_rate': 4.0171252194734833e-07, 'epoch': 1.82} {'loss': 0.3073, 'learning_rate': 4.0161825657605514e-07, 'epoch': 1.82} {'loss': 0.2917, 'learning_rate': 4.0152400203951056e-07, 'epoch': 1.82} {'loss': 0.2947, 'learning_rate': 4.014297583378202e-07, 'epoch': 1.82} {'loss': 0.224, 'learning_rate': 4.013355254710882e-07, 'epoch': 1.82} {'loss': 0.2378, 'learning_rate': 4.012413034394258e-07, 'epoch': 1.82} {'loss': 0.1725, 'learning_rate': 4.0114709224293503e-07, 'epoch': 1.82} {'loss': 0.2561, 'learning_rate': 4.010528918817247e-07, 'epoch': 1.82} {'loss': 0.1773, 'learning_rate': 4.0095870235589917e-07, 'epoch': 1.82} {'loss': 0.3443, 'learning_rate': 4.0086452366556726e-07, 'epoch': 1.82} {'loss': 0.3406, 'learning_rate': 4.007703558108333e-07, 'epoch': 1.82} {'loss': 0.3407, 'learning_rate': 4.0067619879180506e-07, 'epoch': 1.82} {'loss': 0.3597, 'learning_rate': 4.0058205260858686e-07, 'epoch': 1.82} {'loss': 0.3538, 'learning_rate': 4.0048791726128634e-07, 'epoch': 1.82} {'loss': 0.4636, 'learning_rate': 4.0039379275001013e-07, 'epoch': 1.82} {'loss': 0.1577, 'learning_rate': 4.002996790748637e-07, 'epoch': 1.82} {'loss': 0.3697, 'learning_rate': 4.002055762359536e-07, 'epoch': 1.82} {'loss': 0.3876, 'learning_rate': 4.001114842333853e-07, 'epoch': 1.82} {'loss': 0.3786, 'learning_rate': 4.0001740306726655e-07, 'epoch': 1.82} {'loss': 0.3804, 'learning_rate': 3.9992333273770165e-07, 'epoch': 1.82} {'loss': 0.2999, 'learning_rate': 3.9982927324479836e-07, 'epoch': 1.82} {'loss': 0.2754, 'learning_rate': 3.99735224588661e-07, 'epoch': 1.83} {'loss': 0.4476, 'learning_rate': 3.996411867693983e-07, 'epoch': 1.83} {'loss': 0.3363, 'learning_rate': 3.9954715978711476e-07, 'epoch': 1.83} {'loss': 0.3307, 'learning_rate': 3.99453143641918e-07, 'epoch': 1.83} {'loss': 0.242, 'learning_rate': 3.993591383339113e-07, 'epoch': 1.83} {'loss': 0.4364, 'learning_rate': 3.9926514386320335e-07, 'epoch': 1.83} {'loss': 0.2079, 'learning_rate': 3.9917116022989863e-07, 'epoch': 1.83} {'loss': 0.3427, 'learning_rate': 3.990771874341048e-07, 'epoch': 1.83} {'loss': 0.3568, 'learning_rate': 3.9898322547592737e-07, 'epoch': 1.83} {'loss': 0.2382, 'learning_rate': 3.9888927435547173e-07, 'epoch': 1.83} {'loss': 0.2705, 'learning_rate': 3.9879533407284453e-07, 'epoch': 1.83} {'loss': 0.12, 'learning_rate': 3.987014046281501e-07, 'epoch': 1.83} {'loss': 0.2223, 'learning_rate': 3.9860748602149836e-07, 'epoch': 1.83} {'loss': 0.2153, 'learning_rate': 3.985135782529914e-07, 'epoch': 1.83} {'loss': 0.2468, 'learning_rate': 3.9841968132273813e-07, 'epoch': 1.83} {'loss': 0.3842, 'learning_rate': 3.983257952308417e-07, 'epoch': 1.83} {'loss': 0.3654, 'learning_rate': 3.9823191997741097e-07, 'epoch': 1.83} {'loss': 0.2911, 'learning_rate': 3.981380555625491e-07, 'epoch': 1.83} {'loss': 0.3092, 'learning_rate': 3.980442019863651e-07, 'epoch': 1.83} {'loss': 0.3462, 'learning_rate': 3.9795035924896195e-07, 'epoch': 1.83} {'loss': 0.2394, 'learning_rate': 3.9785652735044754e-07, 'epoch': 1.83} {'loss': 0.2361, 'learning_rate': 3.977627062909262e-07, 'epoch': 1.83} {'loss': 0.3553, 'learning_rate': 3.976688960705066e-07, 'epoch': 1.83} {'loss': 0.2152, 'learning_rate': 3.9757509668929327e-07, 'epoch': 1.83} {'loss': 0.3295, 'learning_rate': 3.974813081473894e-07, 'epoch': 1.83} {'loss': 0.1972, 'learning_rate': 3.973875304449049e-07, 'epoch': 1.83} {'loss': 0.1381, 'learning_rate': 3.9729376358194183e-07, 'epoch': 1.83} {'loss': 0.2935, 'learning_rate': 3.972000075586102e-07, 'epoch': 1.83} {'loss': 0.2672, 'learning_rate': 3.9710626237501217e-07, 'epoch': 1.83} {'loss': 0.3418, 'learning_rate': 3.9701252803125646e-07, 'epoch': 1.83} {'loss': 0.2521, 'learning_rate': 3.9691880452744634e-07, 'epoch': 1.83} {'loss': 0.3124, 'learning_rate': 3.9682509186368955e-07, 'epoch': 1.83} {'loss': 0.1065, 'learning_rate': 3.9673139004009043e-07, 'epoch': 1.83} {'loss': 0.1835, 'learning_rate': 3.9663769905675555e-07, 'epoch': 1.83} {'loss': 0.3954, 'learning_rate': 3.9654401891379036e-07, 'epoch': 1.83} {'loss': 0.3019, 'learning_rate': 3.964503496113015e-07, 'epoch': 1.83} {'loss': 0.2892, 'learning_rate': 3.963566911493943e-07, 'epoch': 1.83} {'loss': 0.2899, 'learning_rate': 3.9626304352817333e-07, 'epoch': 1.83} {'loss': 0.3207, 'learning_rate': 3.961694067477462e-07, 'epoch': 1.83} {'loss': 0.2471, 'learning_rate': 3.9607578080821605e-07, 'epoch': 1.83} {'loss': 0.4578, 'learning_rate': 3.9598216570969073e-07, 'epoch': 1.83} {'loss': 0.3603, 'learning_rate': 3.958885614522756e-07, 'epoch': 1.83} {'loss': 0.4254, 'learning_rate': 3.957949680360762e-07, 'epoch': 1.83} {'loss': 0.3413, 'learning_rate': 3.9570138546119686e-07, 'epoch': 1.83} {'loss': 0.2354, 'learning_rate': 3.956078137277453e-07, 'epoch': 1.83} {'loss': 0.3406, 'learning_rate': 3.955142528358247e-07, 'epoch': 1.83} {'loss': 0.4089, 'learning_rate': 3.954207027855439e-07, 'epoch': 1.83} {'loss': 0.2629, 'learning_rate': 3.9532716357700505e-07, 'epoch': 1.83} {'loss': 0.3677, 'learning_rate': 3.95233635210317e-07, 'epoch': 1.83} {'loss': 0.4197, 'learning_rate': 3.95140117685584e-07, 'epoch': 1.83} {'loss': 0.2564, 'learning_rate': 3.950466110029094e-07, 'epoch': 1.83} {'loss': 0.2347, 'learning_rate': 3.949531151624031e-07, 'epoch': 1.83} {'loss': 0.2808, 'learning_rate': 3.9485963016416606e-07, 'epoch': 1.83} {'loss': 0.2641, 'learning_rate': 3.9476615600830713e-07, 'epoch': 1.83} {'loss': 0.3262, 'learning_rate': 3.946726926949307e-07, 'epoch': 1.83} {'loss': 0.2542, 'learning_rate': 3.945792402241422e-07, 'epoch': 1.83} {'loss': 0.3517, 'learning_rate': 3.9448579859604595e-07, 'epoch': 1.83} {'loss': 0.4381, 'learning_rate': 3.9439236781074974e-07, 'epoch': 1.83} {'loss': 0.3066, 'learning_rate': 3.9429894786835787e-07, 'epoch': 1.83} {'loss': 0.2419, 'learning_rate': 3.9420553876897584e-07, 'epoch': 1.83} {'loss': 0.3644, 'learning_rate': 3.9411214051271016e-07, 'epoch': 1.83} {'loss': 0.288, 'learning_rate': 3.9401875309966307e-07, 'epoch': 1.83} {'loss': 0.2465, 'learning_rate': 3.9392537652994446e-07, 'epoch': 1.83} {'loss': 0.3516, 'learning_rate': 3.938320108036553e-07, 'epoch': 1.83} {'loss': 0.251, 'learning_rate': 3.9373865592090446e-07, 'epoch': 1.83} {'loss': 0.2994, 'learning_rate': 3.936453118817951e-07, 'epoch': 1.83} {'loss': 0.2923, 'learning_rate': 3.93551978686435e-07, 'epoch': 1.83} {'loss': 0.2948, 'learning_rate': 3.9345865633492633e-07, 'epoch': 1.83} {'loss': 0.4245, 'learning_rate': 3.9336534482737663e-07, 'epoch': 1.83} {'loss': 0.2771, 'learning_rate': 3.9327204416389153e-07, 'epoch': 1.83} {'loss': 0.2882, 'learning_rate': 3.931787543445742e-07, 'epoch': 1.83} {'loss': 0.2763, 'learning_rate': 3.9308547536953234e-07, 'epoch': 1.83} {'loss': 0.2083, 'learning_rate': 3.929922072388692e-07, 'epoch': 1.83} {'loss': 0.2095, 'learning_rate': 3.928989499526914e-07, 'epoch': 1.83} {'loss': 0.1516, 'learning_rate': 3.9280570351110324e-07, 'epoch': 1.83} {'loss': 0.3211, 'learning_rate': 3.9271246791421137e-07, 'epoch': 1.83} {'loss': 0.4069, 'learning_rate': 3.926192431621201e-07, 'epoch': 1.83} {'loss': 0.2348, 'learning_rate': 3.9252602925493487e-07, 'epoch': 1.83} {'loss': 0.2995, 'learning_rate': 3.9243282619276014e-07, 'epoch': 1.83} {'loss': 0.3589, 'learning_rate': 3.923396339757024e-07, 'epoch': 1.83} {'loss': 0.2887, 'learning_rate': 3.9224645260386496e-07, 'epoch': 1.83} {'loss': 0.2482, 'learning_rate': 3.921532820773566e-07, 'epoch': 1.83} {'loss': 0.3761, 'learning_rate': 3.9206012239627944e-07, 'epoch': 1.83} {'loss': 0.2564, 'learning_rate': 3.919669735607379e-07, 'epoch': 1.83} {'loss': 0.1287, 'learning_rate': 3.9187383557083955e-07, 'epoch': 1.83} {'loss': 0.2717, 'learning_rate': 3.917807084266878e-07, 'epoch': 1.83} {'loss': 0.3223, 'learning_rate': 3.9168759212839027e-07, 'epoch': 1.83} {'loss': 0.2331, 'learning_rate': 3.9159448667604907e-07, 'epoch': 1.83} {'loss': 0.2594, 'learning_rate': 3.915013920697708e-07, 'epoch': 1.83} {'loss': 0.2451, 'learning_rate': 3.914083083096598e-07, 'epoch': 1.83} {'loss': 0.3384, 'learning_rate': 3.9131523539582274e-07, 'epoch': 1.83} {'loss': 0.3243, 'learning_rate': 3.912221733283628e-07, 'epoch': 1.83} {'loss': 0.2116, 'learning_rate': 3.911291221073865e-07, 'epoch': 1.83} {'loss': 0.3048, 'learning_rate': 3.9103608173299723e-07, 'epoch': 1.83} {'loss': 0.3023, 'learning_rate': 3.909430522053026e-07, 'epoch': 1.83} {'loss': 0.2749, 'learning_rate': 3.9085003352440476e-07, 'epoch': 1.83} {'loss': 0.2804, 'learning_rate': 3.907570256904103e-07, 'epoch': 1.83} {'loss': 0.2223, 'learning_rate': 3.906640287034247e-07, 'epoch': 1.83} {'loss': 0.2358, 'learning_rate': 3.9057104256355003e-07, 'epoch': 1.83} {'loss': 0.2225, 'learning_rate': 3.9047806727089523e-07, 'epoch': 1.83} {'loss': 0.1877, 'learning_rate': 3.903851028255623e-07, 'epoch': 1.83} {'loss': 0.2696, 'learning_rate': 3.902921492276579e-07, 'epoch': 1.83} {'loss': 0.3399, 'learning_rate': 3.9019920647728524e-07, 'epoch': 1.83} {'loss': 0.2703, 'learning_rate': 3.9010627457455206e-07, 'epoch': 1.83} {'loss': 0.3119, 'learning_rate': 3.900133535195594e-07, 'epoch': 1.83} {'loss': 0.2794, 'learning_rate': 3.89920443312416e-07, 'epoch': 1.83} {'loss': 0.4169, 'learning_rate': 3.8982754395322396e-07, 'epoch': 1.83} {'loss': 0.4158, 'learning_rate': 3.8973465544209e-07, 'epoch': 1.83} {'loss': 0.3238, 'learning_rate': 3.896417777791173e-07, 'epoch': 1.83} {'loss': 0.2422, 'learning_rate': 3.895489109644113e-07, 'epoch': 1.83} {'loss': 0.1914, 'learning_rate': 3.894560549980786e-07, 'epoch': 1.83} {'loss': 0.2379, 'learning_rate': 3.8936320988022137e-07, 'epoch': 1.83} {'loss': 0.3787, 'learning_rate': 3.8927037561094615e-07, 'epoch': 1.83} {'loss': 0.3346, 'learning_rate': 3.8917755219035515e-07, 'epoch': 1.83} {'loss': 0.2517, 'learning_rate': 3.8908473961855706e-07, 'epoch': 1.83} {'loss': 0.2492, 'learning_rate': 3.8899193789565415e-07, 'epoch': 1.83} {'loss': 0.4023, 'learning_rate': 3.888991470217529e-07, 'epoch': 1.83} {'loss': 0.2908, 'learning_rate': 3.888063669969544e-07, 'epoch': 1.83} {'loss': 0.2317, 'learning_rate': 3.887135978213685e-07, 'epoch': 1.83} {'loss': 0.3564, 'learning_rate': 3.886208394950952e-07, 'epoch': 1.83} {'loss': 0.3545, 'learning_rate': 3.8852809201824214e-07, 'epoch': 1.83} {'loss': 0.3064, 'learning_rate': 3.884353553909137e-07, 'epoch': 1.83} {'loss': 0.335, 'learning_rate': 3.883426296132131e-07, 'epoch': 1.83} {'loss': 0.3189, 'learning_rate': 3.8824991468524696e-07, 'epoch': 1.83} {'loss': 0.2934, 'learning_rate': 3.881572106071174e-07, 'epoch': 1.83} {'loss': 0.2587, 'learning_rate': 3.880645173789321e-07, 'epoch': 1.83} {'loss': 0.1266, 'learning_rate': 3.879718350007933e-07, 'epoch': 1.83} {'loss': 0.3426, 'learning_rate': 3.878791634728063e-07, 'epoch': 1.83} {'loss': 0.35, 'learning_rate': 3.8778650279507555e-07, 'epoch': 1.83} {'loss': 0.2373, 'learning_rate': 3.8769385296770766e-07, 'epoch': 1.83} {'loss': 0.2998, 'learning_rate': 3.876012139908036e-07, 'epoch': 1.83} {'loss': 0.197, 'learning_rate': 3.8750858586447225e-07, 'epoch': 1.83} {'loss': 0.3117, 'learning_rate': 3.8741596858881347e-07, 'epoch': 1.83} {'loss': 0.4068, 'learning_rate': 3.8732336216393605e-07, 'epoch': 1.83} {'loss': 0.3109, 'learning_rate': 3.872307665899422e-07, 'epoch': 1.83} {'loss': 0.2644, 'learning_rate': 3.871381818669351e-07, 'epoch': 1.83} {'loss': 0.2585, 'learning_rate': 3.8704560799502354e-07, 'epoch': 1.83} {'loss': 0.388, 'learning_rate': 3.869530449743075e-07, 'epoch': 1.83} {'loss': 0.2095, 'learning_rate': 3.868604928048947e-07, 'epoch': 1.83} {'loss': 0.3531, 'learning_rate': 3.867679514868872e-07, 'epoch': 1.83} {'loss': 0.3837, 'learning_rate': 3.8667542102039156e-07, 'epoch': 1.83} {'loss': 0.3167, 'learning_rate': 3.8658290140551004e-07, 'epoch': 1.83} {'loss': 0.4266, 'learning_rate': 3.864903926423502e-07, 'epoch': 1.83} {'loss': 0.2932, 'learning_rate': 3.863978947310132e-07, 'epoch': 1.83} {'loss': 0.3051, 'learning_rate': 3.8630540767160664e-07, 'epoch': 1.83} {'loss': 0.3694, 'learning_rate': 3.8621293146423044e-07, 'epoch': 1.83} {'loss': 0.2692, 'learning_rate': 3.861204661089946e-07, 'epoch': 1.83} {'loss': 0.3365, 'learning_rate': 3.86028011606e-07, 'epoch': 1.83} {'loss': 0.3365, 'learning_rate': 3.8593556795535e-07, 'epoch': 1.83} {'loss': 0.4244, 'learning_rate': 3.858431351571512e-07, 'epoch': 1.83} {'loss': 0.2018, 'learning_rate': 3.857507132115068e-07, 'epoch': 1.83} {'loss': 0.3449, 'learning_rate': 3.856583021185234e-07, 'epoch': 1.83} {'loss': 0.1776, 'learning_rate': 3.85565901878302e-07, 'epoch': 1.83} {'loss': 0.2994, 'learning_rate': 3.854735124909492e-07, 'epoch': 1.83} {'loss': 0.3109, 'learning_rate': 3.853811339565672e-07, 'epoch': 1.83} {'loss': 0.2224, 'learning_rate': 3.852887662752636e-07, 'epoch': 1.83} {'loss': 0.2621, 'learning_rate': 3.851964094471383e-07, 'epoch': 1.83} {'loss': 0.2664, 'learning_rate': 3.851040634722991e-07, 'epoch': 1.83} {'loss': 0.2665, 'learning_rate': 3.850117283508492e-07, 'epoch': 1.83} {'loss': 0.3212, 'learning_rate': 3.8491940408289185e-07, 'epoch': 1.83} {'loss': 0.3542, 'learning_rate': 3.8482709066853364e-07, 'epoch': 1.83} {'loss': 0.2049, 'learning_rate': 3.8473478810787556e-07, 'epoch': 1.83} {'loss': 0.3522, 'learning_rate': 3.8464249640102535e-07, 'epoch': 1.83} {'loss': 0.2388, 'learning_rate': 3.84550215548084e-07, 'epoch': 1.83} {'loss': 0.317, 'learning_rate': 3.8445794554915703e-07, 'epoch': 1.83} {'loss': 0.2808, 'learning_rate': 3.8436568640434877e-07, 'epoch': 1.83} {'loss': 0.2785, 'learning_rate': 3.842734381137636e-07, 'epoch': 1.83} {'loss': 0.4828, 'learning_rate': 3.8418120067750476e-07, 'epoch': 1.83} {'loss': 0.3183, 'learning_rate': 3.840889740956777e-07, 'epoch': 1.83} {'loss': 0.339, 'learning_rate': 3.8399675836838457e-07, 'epoch': 1.83} {'loss': 0.2083, 'learning_rate': 3.8390455349573084e-07, 'epoch': 1.83} {'loss': 0.2843, 'learning_rate': 3.838123594778209e-07, 'epoch': 1.83} {'loss': 0.2485, 'learning_rate': 3.8372017631475686e-07, 'epoch': 1.83} {'loss': 0.2216, 'learning_rate': 3.8362800400664536e-07, 'epoch': 1.83} {'loss': 0.4241, 'learning_rate': 3.8353584255358734e-07, 'epoch': 1.83} {'loss': 0.3629, 'learning_rate': 3.8344369195569165e-07, 'epoch': 1.83} {'loss': 0.2601, 'learning_rate': 3.833515522130571e-07, 'epoch': 1.83} {'loss': 0.3323, 'learning_rate': 3.8325942332579024e-07, 'epoch': 1.83} {'loss': 0.3956, 'learning_rate': 3.831673052939955e-07, 'epoch': 1.83} {'loss': 0.4502, 'learning_rate': 3.83075198117776e-07, 'epoch': 1.83} {'loss': 0.3692, 'learning_rate': 3.8298310179723517e-07, 'epoch': 1.83} {'loss': 0.2363, 'learning_rate': 3.8289101633247837e-07, 'epoch': 1.83} {'loss': 0.2642, 'learning_rate': 3.8279894172360885e-07, 'epoch': 1.83} {'loss': 0.1385, 'learning_rate': 3.827068779707299e-07, 'epoch': 1.83} {'loss': 0.3709, 'learning_rate': 3.8261482507394697e-07, 'epoch': 1.83} {'loss': 0.4389, 'learning_rate': 3.825227830333622e-07, 'epoch': 1.83} {'loss': 0.1588, 'learning_rate': 3.8243075184908106e-07, 'epoch': 1.83} {'loss': 0.3341, 'learning_rate': 3.823387315212057e-07, 'epoch': 1.83} {'loss': 0.3193, 'learning_rate': 3.822467220498427e-07, 'epoch': 1.83} {'loss': 0.3472, 'learning_rate': 3.821547234350931e-07, 'epoch': 1.83} {'loss': 0.203, 'learning_rate': 3.8206273567706233e-07, 'epoch': 1.83} {'loss': 0.283, 'learning_rate': 3.8197075877585256e-07, 'epoch': 1.83} {'loss': 0.3197, 'learning_rate': 3.818787927315704e-07, 'epoch': 1.83} {'loss': 0.4264, 'learning_rate': 3.8178683754431676e-07, 'epoch': 1.83} {'loss': 0.2948, 'learning_rate': 3.8169489321419837e-07, 'epoch': 1.83} {'loss': 0.2636, 'learning_rate': 3.816029597413173e-07, 'epoch': 1.83} {'loss': 0.2003, 'learning_rate': 3.8151103712577575e-07, 'epoch': 1.83} {'loss': 0.479, 'learning_rate': 3.814191253676813e-07, 'epoch': 1.83} {'loss': 0.3441, 'learning_rate': 3.81327224467134e-07, 'epoch': 1.83} {'loss': 0.3878, 'learning_rate': 3.812353344242403e-07, 'epoch': 1.83} {'loss': 0.2855, 'learning_rate': 3.8114345523910133e-07, 'epoch': 1.83} {'loss': 0.2366, 'learning_rate': 3.8105158691182363e-07, 'epoch': 1.83} {'loss': 0.2704, 'learning_rate': 3.8095972944250935e-07, 'epoch': 1.83} {'loss': 0.3185, 'learning_rate': 3.808678828312629e-07, 'epoch': 1.83} {'loss': 0.3511, 'learning_rate': 3.807760470781863e-07, 'epoch': 1.83} {'loss': 0.4475, 'learning_rate': 3.806842221833851e-07, 'epoch': 1.83} {'loss': 0.2676, 'learning_rate': 3.8059240814696143e-07, 'epoch': 1.83} {'loss': 0.298, 'learning_rate': 3.8050060496902075e-07, 'epoch': 1.83} {'loss': 0.2448, 'learning_rate': 3.8040881264966525e-07, 'epoch': 1.83} {'loss': 0.3708, 'learning_rate': 3.803170311889981e-07, 'epoch': 1.83} {'loss': 0.2617, 'learning_rate': 3.8022526058712483e-07, 'epoch': 1.83} {'loss': 0.3707, 'learning_rate': 3.801335008441476e-07, 'epoch': 1.83} {'loss': 0.3569, 'learning_rate': 3.8004175196017067e-07, 'epoch': 1.83} {'loss': 0.2609, 'learning_rate': 3.799500139352963e-07, 'epoch': 1.83} {'loss': 0.1852, 'learning_rate': 3.79858286769631e-07, 'epoch': 1.83} {'loss': 0.2607, 'learning_rate': 3.7976657046327357e-07, 'epoch': 1.83} {'loss': 0.2882, 'learning_rate': 3.796748650163329e-07, 'epoch': 1.83} {'loss': 0.2608, 'learning_rate': 3.795831704289077e-07, 'epoch': 1.83} {'loss': 0.2861, 'learning_rate': 3.794914867011057e-07, 'epoch': 1.83} {'loss': 0.3968, 'learning_rate': 3.793998138330268e-07, 'epoch': 1.83} {'loss': 0.2714, 'learning_rate': 3.793081518247776e-07, 'epoch': 1.83} {'loss': 0.3667, 'learning_rate': 3.792165006764592e-07, 'epoch': 1.83} {'loss': 0.296, 'learning_rate': 3.7912486038817585e-07, 'epoch': 1.83} {'loss': 0.3008, 'learning_rate': 3.7903323096003084e-07, 'epoch': 1.83} {'loss': 0.3582, 'learning_rate': 3.7894161239212745e-07, 'epoch': 1.83} {'loss': 0.1648, 'learning_rate': 3.788500046845711e-07, 'epoch': 1.83} {'loss': 0.2514, 'learning_rate': 3.7875840783746177e-07, 'epoch': 1.83} {'loss': 0.3882, 'learning_rate': 3.7866682185090595e-07, 'epoch': 1.83} {'loss': 0.2615, 'learning_rate': 3.785752467250048e-07, 'epoch': 1.83} {'loss': 0.3143, 'learning_rate': 3.7848368245986366e-07, 'epoch': 1.83} {'loss': 0.3659, 'learning_rate': 3.7839212905558255e-07, 'epoch': 1.83} {'loss': 0.3306, 'learning_rate': 3.7830058651226906e-07, 'epoch': 1.83} {'loss': 0.2513, 'learning_rate': 3.7820905483002437e-07, 'epoch': 1.83} {'loss': 0.2925, 'learning_rate': 3.7811753400895155e-07, 'epoch': 1.83} {'loss': 0.3174, 'learning_rate': 3.780260240491551e-07, 'epoch': 1.83} {'loss': 0.474, 'learning_rate': 3.7793452495073715e-07, 'epoch': 1.83} {'loss': 0.2495, 'learning_rate': 3.7784303671380197e-07, 'epoch': 1.83} {'loss': 0.2989, 'learning_rate': 3.7775155933845064e-07, 'epoch': 1.83} {'loss': 0.3492, 'learning_rate': 3.776600928247898e-07, 'epoch': 1.83} {'loss': 0.3536, 'learning_rate': 3.775686371729192e-07, 'epoch': 1.83} {'loss': 0.3166, 'learning_rate': 3.7747719238294565e-07, 'epoch': 1.83} {'loss': 0.3096, 'learning_rate': 3.7738575845496896e-07, 'epoch': 1.83} {'loss': 0.2859, 'learning_rate': 3.7729433538909455e-07, 'epoch': 1.83} {'loss': 0.3321, 'learning_rate': 3.772029231854246e-07, 'epoch': 1.83} {'loss': 0.2809, 'learning_rate': 3.7711152184406355e-07, 'epoch': 1.83} {'loss': 0.3316, 'learning_rate': 3.770201313651123e-07, 'epoch': 1.83} {'loss': 0.2419, 'learning_rate': 3.769287517486775e-07, 'epoch': 1.83} {'loss': 0.2569, 'learning_rate': 3.7683738299485905e-07, 'epoch': 1.83} {'loss': 0.2794, 'learning_rate': 3.7674602510376134e-07, 'epoch': 1.83} {'loss': 0.2094, 'learning_rate': 3.7665467807548763e-07, 'epoch': 1.83} {'loss': 0.3224, 'learning_rate': 3.7656334191014e-07, 'epoch': 1.83} {'loss': 0.2648, 'learning_rate': 3.7647201660782395e-07, 'epoch': 1.83} {'loss': 0.4433, 'learning_rate': 3.7638070216863943e-07, 'epoch': 1.83} {'loss': 0.3243, 'learning_rate': 3.7628939859269185e-07, 'epoch': 1.83} {'loss': 0.2144, 'learning_rate': 3.7619810588008343e-07, 'epoch': 1.83} {'loss': 0.2466, 'learning_rate': 3.7610682403091624e-07, 'epoch': 1.83} {'loss': 0.3729, 'learning_rate': 3.760155530452958e-07, 'epoch': 1.83} {'loss': 0.4141, 'learning_rate': 3.759242929233231e-07, 'epoch': 1.83} {'loss': 0.3996, 'learning_rate': 3.758330436651025e-07, 'epoch': 1.83} {'loss': 0.3961, 'learning_rate': 3.757418052707351e-07, 'epoch': 1.83} {'loss': 0.2823, 'learning_rate': 3.756505777403263e-07, 'epoch': 1.83} {'loss': 0.4444, 'learning_rate': 3.7555936107397607e-07, 'epoch': 1.83} {'loss': 0.1883, 'learning_rate': 3.7546815527179095e-07, 'epoch': 1.83} {'loss': 0.2575, 'learning_rate': 3.7537696033387085e-07, 'epoch': 1.83} {'loss': 0.3385, 'learning_rate': 3.752857762603213e-07, 'epoch': 1.83} {'loss': 0.2743, 'learning_rate': 3.751946030512421e-07, 'epoch': 1.83} {'loss': 0.2414, 'learning_rate': 3.7510344070674e-07, 'epoch': 1.83} {'loss': 0.3383, 'learning_rate': 3.750122892269148e-07, 'epoch': 1.83} {'loss': 0.3606, 'learning_rate': 3.749211486118709e-07, 'epoch': 1.83} {'loss': 0.3012, 'learning_rate': 3.7483001886171043e-07, 'epoch': 1.83} {'loss': 0.2299, 'learning_rate': 3.7473889997653556e-07, 'epoch': 1.83} {'loss': 0.4565, 'learning_rate': 3.7464779195645173e-07, 'epoch': 1.83} {'loss': 0.2293, 'learning_rate': 3.745566948015589e-07, 'epoch': 1.83} {'loss': 0.253, 'learning_rate': 3.7446560851196243e-07, 'epoch': 1.83} {'loss': 0.4529, 'learning_rate': 3.7437453308776237e-07, 'epoch': 1.83} {'loss': 0.2789, 'learning_rate': 3.7428346852906527e-07, 'epoch': 1.83} {'loss': 0.3889, 'learning_rate': 3.741924148359699e-07, 'epoch': 1.83} {'loss': 0.3185, 'learning_rate': 3.7410137200858176e-07, 'epoch': 1.83} {'loss': 0.2987, 'learning_rate': 3.7401034004700187e-07, 'epoch': 1.83} {'loss': 0.3797, 'learning_rate': 3.739193189513346e-07, 'epoch': 1.83} {'loss': 0.4002, 'learning_rate': 3.738283087216821e-07, 'epoch': 1.83} {'loss': 0.3045, 'learning_rate': 3.7373730935814643e-07, 'epoch': 1.83} {'loss': 0.3219, 'learning_rate': 3.7364632086083096e-07, 'epoch': 1.83} {'loss': 0.3127, 'learning_rate': 3.735553432298378e-07, 'epoch': 1.83} {'loss': 0.416, 'learning_rate': 3.7346437646527123e-07, 'epoch': 1.83} {'loss': 0.211, 'learning_rate': 3.7337342056723126e-07, 'epoch': 1.83} {'loss': 0.4826, 'learning_rate': 3.732824755358233e-07, 'epoch': 1.83} {'loss': 0.3307, 'learning_rate': 3.7319154137114845e-07, 'epoch': 1.83} {'loss': 0.3369, 'learning_rate': 3.731006180733099e-07, 'epoch': 1.83} {'loss': 0.2447, 'learning_rate': 3.730097056424098e-07, 'epoch': 1.83} {'loss': 0.3455, 'learning_rate': 3.7291880407855144e-07, 'epoch': 1.83} {'loss': 0.2684, 'learning_rate': 3.7282791338183577e-07, 'epoch': 1.83} {'loss': 0.2481, 'learning_rate': 3.7273703355236837e-07, 'epoch': 1.83} {'loss': 0.3509, 'learning_rate': 3.7264616459025014e-07, 'epoch': 1.83} {'loss': 0.2226, 'learning_rate': 3.725553064955834e-07, 'epoch': 1.83} {'loss': 0.2763, 'learning_rate': 3.724644592684712e-07, 'epoch': 1.83} {'loss': 0.1967, 'learning_rate': 3.723736229090147e-07, 'epoch': 1.83} {'loss': 0.4467, 'learning_rate': 3.7228279741731823e-07, 'epoch': 1.83} {'loss': 0.3225, 'learning_rate': 3.7219198279348277e-07, 'epoch': 1.83} {'loss': 0.2885, 'learning_rate': 3.7210117903761387e-07, 'epoch': 1.83} {'loss': 0.3232, 'learning_rate': 3.7201038614981035e-07, 'epoch': 1.83} {'loss': 0.3059, 'learning_rate': 3.719196041301765e-07, 'epoch': 1.83} {'loss': 0.2946, 'learning_rate': 3.7182883297881445e-07, 'epoch': 1.83} {'loss': 0.3699, 'learning_rate': 3.717380726958275e-07, 'epoch': 1.83} {'loss': 0.2401, 'learning_rate': 3.716473232813167e-07, 'epoch': 1.83} {'loss': 0.3282, 'learning_rate': 3.7155658473538524e-07, 'epoch': 1.83} {'loss': 0.2017, 'learning_rate': 3.714658570581353e-07, 'epoch': 1.83} {'loss': 0.2446, 'learning_rate': 3.7137514024967014e-07, 'epoch': 1.83} {'loss': 0.2273, 'learning_rate': 3.7128443431009184e-07, 'epoch': 1.83} {'loss': 0.2525, 'learning_rate': 3.711937392395004e-07, 'epoch': 1.83} {'loss': 0.3345, 'learning_rate': 3.7110305503800234e-07, 'epoch': 1.83} {'loss': 0.2781, 'learning_rate': 3.7101238170569655e-07, 'epoch': 1.83} {'loss': 0.3577, 'learning_rate': 3.7092171924268725e-07, 'epoch': 1.83} {'loss': 0.2131, 'learning_rate': 3.7083106764907563e-07, 'epoch': 1.83} {'loss': 0.2231, 'learning_rate': 3.707404269249659e-07, 'epoch': 1.83} {'loss': 0.3528, 'learning_rate': 3.706497970704581e-07, 'epoch': 1.83} {'loss': 0.2959, 'learning_rate': 3.7055917808565656e-07, 'epoch': 1.83} {'loss': 0.3249, 'learning_rate': 3.7046856997066117e-07, 'epoch': 1.83} {'loss': 0.3235, 'learning_rate': 3.703779727255774e-07, 'epoch': 1.83} {'loss': 0.1741, 'learning_rate': 3.702873863505041e-07, 'epoch': 1.83} {'loss': 0.3486, 'learning_rate': 3.701968108455467e-07, 'epoch': 1.83} {'loss': 0.2688, 'learning_rate': 3.701062462108052e-07, 'epoch': 1.83} {'loss': 0.3804, 'learning_rate': 3.700156924463827e-07, 'epoch': 1.83} {'loss': 0.2011, 'learning_rate': 3.699251495523815e-07, 'epoch': 1.83} {'loss': 0.3429, 'learning_rate': 3.698346175289025e-07, 'epoch': 1.83} {'loss': 0.3473, 'learning_rate': 3.6974409637605013e-07, 'epoch': 1.83} {'loss': 0.2866, 'learning_rate': 3.696535860939232e-07, 'epoch': 1.83} {'loss': 0.2411, 'learning_rate': 3.695630866826283e-07, 'epoch': 1.83} {'loss': 0.4082, 'learning_rate': 3.694725981422642e-07, 'epoch': 1.83} {'loss': 0.3447, 'learning_rate': 3.693821204729353e-07, 'epoch': 1.83} {'loss': 0.1976, 'learning_rate': 3.6929165367474153e-07, 'epoch': 1.83} {'loss': 0.3897, 'learning_rate': 3.6920119774778715e-07, 'epoch': 1.83} {'loss': 0.3054, 'learning_rate': 3.691107526921722e-07, 'epoch': 1.83} {'loss': 0.2489, 'learning_rate': 3.69020318508001e-07, 'epoch': 1.83} {'loss': 0.2604, 'learning_rate': 3.689298951953746e-07, 'epoch': 1.83} {'loss': 0.5081, 'learning_rate': 3.6883948275439395e-07, 'epoch': 1.83} {'loss': 0.2219, 'learning_rate': 3.6874908118516237e-07, 'epoch': 1.83} {'loss': 0.2969, 'learning_rate': 3.686586904877809e-07, 'epoch': 1.83} {'loss': 0.2882, 'learning_rate': 3.6856831066235386e-07, 'epoch': 1.83} {'loss': 0.2137, 'learning_rate': 3.684779417089801e-07, 'epoch': 1.83} {'loss': 0.2682, 'learning_rate': 3.6838758362776396e-07, 'epoch': 1.83} {'loss': 0.2657, 'learning_rate': 3.6829723641880646e-07, 'epoch': 1.83} {'loss': 0.3516, 'learning_rate': 3.682069000822097e-07, 'epoch': 1.83} {'loss': 0.3024, 'learning_rate': 3.681165746180759e-07, 'epoch': 1.83} {'loss': 0.3253, 'learning_rate': 3.680262600265072e-07, 'epoch': 1.83} {'loss': 0.4844, 'learning_rate': 3.679359563076046e-07, 'epoch': 1.83} {'loss': 0.2471, 'learning_rate': 3.678456634614713e-07, 'epoch': 1.83} {'loss': 0.293, 'learning_rate': 3.6775538148820955e-07, 'epoch': 1.83} {'loss': 0.3193, 'learning_rate': 3.676651103879192e-07, 'epoch': 1.83} {'loss': 0.2324, 'learning_rate': 3.675748501607035e-07, 'epoch': 1.83} {'loss': 0.2846, 'learning_rate': 3.674846008066635e-07, 'epoch': 1.83} {'loss': 0.3182, 'learning_rate': 3.6739436232590244e-07, 'epoch': 1.83} {'loss': 0.3169, 'learning_rate': 3.6730413471852024e-07, 'epoch': 1.83} {'loss': 0.3044, 'learning_rate': 3.6721391798462126e-07, 'epoch': 1.83} {'loss': 0.1877, 'learning_rate': 3.671237121243054e-07, 'epoch': 1.83} {'loss': 0.3957, 'learning_rate': 3.6703351713767374e-07, 'epoch': 1.83} {'loss': 0.3543, 'learning_rate': 3.6694333302483177e-07, 'epoch': 1.83} {'loss': 0.4579, 'learning_rate': 3.6685315978587823e-07, 'epoch': 1.83} {'loss': 0.2948, 'learning_rate': 3.6676299742091524e-07, 'epoch': 1.83} {'loss': 0.3783, 'learning_rate': 3.66672845930045e-07, 'epoch': 1.83} {'loss': 0.3905, 'learning_rate': 3.665827053133697e-07, 'epoch': 1.83} {'loss': 0.3034, 'learning_rate': 3.664925755709903e-07, 'epoch': 1.83} {'loss': 0.169, 'learning_rate': 3.6640245670301e-07, 'epoch': 1.83} {'loss': 0.3252, 'learning_rate': 3.663123487095277e-07, 'epoch': 1.83} {'loss': 0.1754, 'learning_rate': 3.6622225159064774e-07, 'epoch': 1.83} {'loss': 0.4264, 'learning_rate': 3.6613216534647e-07, 'epoch': 1.83} {'loss': 0.1946, 'learning_rate': 3.660420899770989e-07, 'epoch': 1.83} {'loss': 0.351, 'learning_rate': 3.659520254826332e-07, 'epoch': 1.83} {'loss': 0.3747, 'learning_rate': 3.658619718631751e-07, 'epoch': 1.83} {'loss': 0.2941, 'learning_rate': 3.6577192911882886e-07, 'epoch': 1.83} {'loss': 0.3524, 'learning_rate': 3.6568189724969115e-07, 'epoch': 1.83} {'loss': 0.3189, 'learning_rate': 3.6559187625586855e-07, 'epoch': 1.83} {'loss': 0.3689, 'learning_rate': 3.6550186613745987e-07, 'epoch': 1.83} {'loss': 0.1458, 'learning_rate': 3.654118668945683e-07, 'epoch': 1.83} {'loss': 0.3967, 'learning_rate': 3.653218785272938e-07, 'epoch': 1.83} {'loss': 0.3605, 'learning_rate': 3.6523190103573966e-07, 'epoch': 1.83} {'loss': 0.2848, 'learning_rate': 3.6514193442000576e-07, 'epoch': 1.83} {'loss': 0.2612, 'learning_rate': 3.650519786801943e-07, 'epoch': 1.83} {'loss': 0.3429, 'learning_rate': 3.649620338164073e-07, 'epoch': 1.83} {'loss': 0.3862, 'learning_rate': 3.6487209982874694e-07, 'epoch': 1.83} {'loss': 0.1062, 'learning_rate': 3.647821767173132e-07, 'epoch': 1.83} {'loss': 0.2305, 'learning_rate': 3.646922644822071e-07, 'epoch': 1.83} {'loss': 0.3527, 'learning_rate': 3.6460236312353294e-07, 'epoch': 1.83} {'loss': 0.2189, 'learning_rate': 3.6451247264138843e-07, 'epoch': 1.83} {'loss': 0.2574, 'learning_rate': 3.644225930358791e-07, 'epoch': 1.83} {'loss': 0.1546, 'learning_rate': 3.6433272430710266e-07, 'epoch': 1.83} {'loss': 0.3684, 'learning_rate': 3.642428664551634e-07, 'epoch': 1.83} {'loss': 0.3716, 'learning_rate': 3.6415301948016014e-07, 'epoch': 1.83} {'loss': 0.2194, 'learning_rate': 3.6406318338219725e-07, 'epoch': 1.83} {'loss': 0.1877, 'learning_rate': 3.639733581613736e-07, 'epoch': 1.83} {'loss': 0.2712, 'learning_rate': 3.6388354381779346e-07, 'epoch': 1.83} {'loss': 0.3663, 'learning_rate': 3.637937403515546e-07, 'epoch': 1.83} {'loss': 0.3885, 'learning_rate': 3.637039477627613e-07, 'epoch': 1.83} {'loss': 0.218, 'learning_rate': 3.6361416605151356e-07, 'epoch': 1.83} {'loss': 0.3508, 'learning_rate': 3.635243952179124e-07, 'epoch': 1.83} {'loss': 0.2524, 'learning_rate': 3.6343463526206103e-07, 'epoch': 1.83} {'loss': 0.2877, 'learning_rate': 3.6334488618405826e-07, 'epoch': 1.83} {'loss': 0.2394, 'learning_rate': 3.632551479840074e-07, 'epoch': 1.83} {'loss': 0.1832, 'learning_rate': 3.6316542066200723e-07, 'epoch': 1.83} {'loss': 0.442, 'learning_rate': 3.630757042181632e-07, 'epoch': 1.83} {'loss': 0.3356, 'learning_rate': 3.629859986525719e-07, 'epoch': 1.83} {'loss': 0.2454, 'learning_rate': 3.628963039653388e-07, 'epoch': 1.83} {'loss': 0.3043, 'learning_rate': 3.628066201565616e-07, 'epoch': 1.83} {'loss': 0.3608, 'learning_rate': 3.627169472263448e-07, 'epoch': 1.83} {'loss': 0.2651, 'learning_rate': 3.6262728517478584e-07, 'epoch': 1.83} {'loss': 0.2551, 'learning_rate': 3.625376340019904e-07, 'epoch': 1.83} {'loss': 0.359, 'learning_rate': 3.6244799370805606e-07, 'epoch': 1.83} {'loss': 0.3155, 'learning_rate': 3.62358364293085e-07, 'epoch': 1.83} {'loss': 0.3139, 'learning_rate': 3.622687457571794e-07, 'epoch': 1.83} {'loss': 0.3158, 'learning_rate': 3.6217913810043913e-07, 'epoch': 1.83} {'loss': 0.3427, 'learning_rate': 3.6208954132296637e-07, 'epoch': 1.83} {'loss': 0.3834, 'learning_rate': 3.61999955424861e-07, 'epoch': 1.83} {'loss': 0.255, 'learning_rate': 3.619103804062263e-07, 'epoch': 1.83} {'loss': 0.3009, 'learning_rate': 3.61820816267161e-07, 'epoch': 1.83} {'loss': 0.4518, 'learning_rate': 3.6173126300776737e-07, 'epoch': 1.83} {'loss': 0.2259, 'learning_rate': 3.616417206281453e-07, 'epoch': 1.83} {'loss': 0.3619, 'learning_rate': 3.615521891283991e-07, 'epoch': 1.83} {'loss': 0.3936, 'learning_rate': 3.6146266850862534e-07, 'epoch': 1.83} {'loss': 0.3207, 'learning_rate': 3.6137315876892955e-07, 'epoch': 1.83} {'loss': 0.2244, 'learning_rate': 3.612836599094105e-07, 'epoch': 1.83} {'loss': 0.2302, 'learning_rate': 3.61194171930167e-07, 'epoch': 1.83} {'loss': 0.4508, 'learning_rate': 3.611046948313046e-07, 'epoch': 1.83} {'loss': 0.3245, 'learning_rate': 3.610152286129209e-07, 'epoch': 1.83} {'loss': 0.3221, 'learning_rate': 3.609257732751192e-07, 'epoch': 1.83} {'loss': 0.2298, 'learning_rate': 3.6083632881799725e-07, 'epoch': 1.83} {'loss': 0.1908, 'learning_rate': 3.607468952416604e-07, 'epoch': 1.83} {'loss': 0.3452, 'learning_rate': 3.606574725462053e-07, 'epoch': 1.83} {'loss': 0.3181, 'learning_rate': 3.605680607317363e-07, 'epoch': 1.83} {'loss': 0.2503, 'learning_rate': 3.604786597983523e-07, 'epoch': 1.83} {'loss': 0.2463, 'learning_rate': 3.603892697461564e-07, 'epoch': 1.83} {'loss': 0.2069, 'learning_rate': 3.6029989057524526e-07, 'epoch': 1.83} {'loss': 0.1382, 'learning_rate': 3.602105222857244e-07, 'epoch': 1.83} {'loss': 0.2427, 'learning_rate': 3.6012116487769365e-07, 'epoch': 1.83} {'loss': 0.2622, 'learning_rate': 3.600318183512508e-07, 'epoch': 1.83} {'loss': 0.2201, 'learning_rate': 3.599424827065001e-07, 'epoch': 1.83} {'loss': 0.3653, 'learning_rate': 3.598531579435405e-07, 'epoch': 1.83} {'loss': 0.2608, 'learning_rate': 3.59763844062474e-07, 'epoch': 1.83} {'loss': 0.4261, 'learning_rate': 3.5967454106340063e-07, 'epoch': 1.83} {'loss': 0.4177, 'learning_rate': 3.5958524894642244e-07, 'epoch': 1.83} {'loss': 0.267, 'learning_rate': 3.594959677116372e-07, 'epoch': 1.83} {'loss': 0.2814, 'learning_rate': 3.5940669735915033e-07, 'epoch': 1.83} {'loss': 0.3015, 'learning_rate': 3.5931743788905736e-07, 'epoch': 1.83} {'loss': 0.2275, 'learning_rate': 3.5922818930146375e-07, 'epoch': 1.83} {'loss': 0.1293, 'learning_rate': 3.591389515964672e-07, 'epoch': 1.83} {'loss': 0.2999, 'learning_rate': 3.590497247741709e-07, 'epoch': 1.83} {'loss': 0.3543, 'learning_rate': 3.589605088346737e-07, 'epoch': 1.83} {'loss': 0.4397, 'learning_rate': 3.5887130377807557e-07, 'epoch': 1.83} {'loss': 0.2936, 'learning_rate': 3.587821096044797e-07, 'epoch': 1.83} {'loss': 0.2238, 'learning_rate': 3.586929263139849e-07, 'epoch': 1.83} {'loss': 0.3539, 'learning_rate': 3.5860375390669223e-07, 'epoch': 1.83} {'loss': 0.2738, 'learning_rate': 3.585145923827027e-07, 'epoch': 1.83} {'loss': 0.4085, 'learning_rate': 3.584254417421174e-07, 'epoch': 1.83} {'loss': 0.4406, 'learning_rate': 3.58336301985035e-07, 'epoch': 1.83} {'loss': 0.2907, 'learning_rate': 3.582471731115589e-07, 'epoch': 1.83} {'loss': 0.4665, 'learning_rate': 3.5815805512178667e-07, 'epoch': 1.83} {'loss': 0.3676, 'learning_rate': 3.580689480158206e-07, 'epoch': 1.83} {'loss': 0.3538, 'learning_rate': 3.579798517937627e-07, 'epoch': 1.83} {'loss': 0.2634, 'learning_rate': 3.578907664557107e-07, 'epoch': 1.83} {'loss': 0.3391, 'learning_rate': 3.5780169200176795e-07, 'epoch': 1.83} {'loss': 0.3583, 'learning_rate': 3.57712628432032e-07, 'epoch': 1.83} {'loss': 0.3417, 'learning_rate': 3.576235757466062e-07, 'epoch': 1.83} {'loss': 0.2951, 'learning_rate': 3.5753453394558823e-07, 'epoch': 1.83} {'loss': 0.4081, 'learning_rate': 3.574455030290824e-07, 'epoch': 1.83} {'loss': 0.3864, 'learning_rate': 3.573564829971854e-07, 'epoch': 1.83} {'loss': 0.3259, 'learning_rate': 3.5726747384999927e-07, 'epoch': 1.83} {'loss': 0.2272, 'learning_rate': 3.571784755876251e-07, 'epoch': 1.83} {'loss': 0.411, 'learning_rate': 3.5708948821016277e-07, 'epoch': 1.83} {'loss': 0.2218, 'learning_rate': 3.5700051171771334e-07, 'epoch': 1.83} {'loss': 0.2181, 'learning_rate': 3.569115461103756e-07, 'epoch': 1.83} {'loss': 0.1691, 'learning_rate': 3.568225913882517e-07, 'epoch': 1.83} {'loss': 0.411, 'learning_rate': 3.5673364755143935e-07, 'epoch': 1.83} {'loss': 0.3419, 'learning_rate': 3.56644714600044e-07, 'epoch': 1.83} {'loss': 0.2983, 'learning_rate': 3.5655579253416004e-07, 'epoch': 1.83} {'loss': 0.3037, 'learning_rate': 3.5646688135389294e-07, 'epoch': 1.83} {'loss': 0.3741, 'learning_rate': 3.5637798105934043e-07, 'epoch': 1.83} {'loss': 0.3084, 'learning_rate': 3.562890916506034e-07, 'epoch': 1.83} {'loss': 0.1622, 'learning_rate': 3.5620021312778085e-07, 'epoch': 1.83} {'loss': 0.2565, 'learning_rate': 3.561113454909759e-07, 'epoch': 1.83} {'loss': 0.3166, 'learning_rate': 3.5602248874028743e-07, 'epoch': 1.83} {'loss': 0.4657, 'learning_rate': 3.5593364287581535e-07, 'epoch': 1.83} {'loss': 0.2601, 'learning_rate': 3.5584480789766064e-07, 'epoch': 1.83} {'loss': 0.2328, 'learning_rate': 3.5575598380592214e-07, 'epoch': 1.83} {'loss': 0.4544, 'learning_rate': 3.55667170600702e-07, 'epoch': 1.83} {'loss': 0.2909, 'learning_rate': 3.55578368282099e-07, 'epoch': 1.84} {'loss': 0.3394, 'learning_rate': 3.5548957685021537e-07, 'epoch': 1.84} {'loss': 0.3888, 'learning_rate': 3.554007963051487e-07, 'epoch': 1.84} {'loss': 0.2853, 'learning_rate': 3.5531202664700115e-07, 'epoch': 1.84} {'loss': 0.2962, 'learning_rate': 3.552232678758716e-07, 'epoch': 1.84} {'loss': 0.5045, 'learning_rate': 3.551345199918621e-07, 'epoch': 1.84} {'loss': 0.4048, 'learning_rate': 3.550457829950704e-07, 'epoch': 1.84} {'loss': 0.2308, 'learning_rate': 3.549570568855998e-07, 'epoch': 1.84} {'loss': 0.3812, 'learning_rate': 3.548683416635468e-07, 'epoch': 1.84} {'loss': 0.2851, 'learning_rate': 3.5477963732901355e-07, 'epoch': 1.84} {'loss': 0.2696, 'learning_rate': 3.546909438821011e-07, 'epoch': 1.84} {'loss': 0.1982, 'learning_rate': 3.546022613229072e-07, 'epoch': 1.84} {'loss': 0.2493, 'learning_rate': 3.5451358965153394e-07, 'epoch': 1.84} {'loss': 0.351, 'learning_rate': 3.5442492886808013e-07, 'epoch': 1.84} {'loss': 0.1871, 'learning_rate': 3.5433627897264675e-07, 'epoch': 1.84} {'loss': 0.2262, 'learning_rate': 3.5424763996533274e-07, 'epoch': 1.84} {'loss': 0.1802, 'learning_rate': 3.541590118462401e-07, 'epoch': 1.84} {'loss': 0.2528, 'learning_rate': 3.540703946154667e-07, 'epoch': 1.84} {'loss': 0.233, 'learning_rate': 3.539817882731156e-07, 'epoch': 1.84} {'loss': 0.1495, 'learning_rate': 3.5389319281928233e-07, 'epoch': 1.84} {'loss': 0.3432, 'learning_rate': 3.538046082540703e-07, 'epoch': 1.84} {'loss': 0.3751, 'learning_rate': 3.537160345775781e-07, 'epoch': 1.84} {'loss': 0.3646, 'learning_rate': 3.536274717899069e-07, 'epoch': 1.84} {'loss': 0.2767, 'learning_rate': 3.535389198911565e-07, 'epoch': 1.84} {'loss': 0.2417, 'learning_rate': 3.5345037888142473e-07, 'epoch': 1.84} {'loss': 0.2728, 'learning_rate': 3.533618487608148e-07, 'epoch': 1.84} {'loss': 0.3479, 'learning_rate': 3.5327332952942327e-07, 'epoch': 1.84} {'loss': 0.3349, 'learning_rate': 3.531848211873523e-07, 'epoch': 1.84} {'loss': 0.2151, 'learning_rate': 3.530963237347007e-07, 'epoch': 1.84} {'loss': 0.2511, 'learning_rate': 3.530078371715706e-07, 'epoch': 1.84} {'loss': 0.2238, 'learning_rate': 3.5291936149805863e-07, 'epoch': 1.84} {'loss': 0.3416, 'learning_rate': 3.5283089671426687e-07, 'epoch': 1.84} {'loss': 0.2646, 'learning_rate': 3.527424428202941e-07, 'epoch': 1.84} {'loss': 0.265, 'learning_rate': 3.5265399981624147e-07, 'epoch': 1.84} {'loss': 0.1774, 'learning_rate': 3.525655677022066e-07, 'epoch': 1.84} {'loss': 0.3597, 'learning_rate': 3.524771464782928e-07, 'epoch': 1.84} {'loss': 0.3236, 'learning_rate': 3.523887361445966e-07, 'epoch': 1.84} {'loss': 0.2854, 'learning_rate': 3.5230033670121787e-07, 'epoch': 1.84} {'loss': 0.3528, 'learning_rate': 3.5221194814825885e-07, 'epoch': 1.84} {'loss': 0.1527, 'learning_rate': 3.5212357048581727e-07, 'epoch': 1.84} {'loss': 0.4657, 'learning_rate': 3.52035203713994e-07, 'epoch': 1.84} {'loss': 0.2602, 'learning_rate': 3.519468478328869e-07, 'epoch': 1.84} {'loss': 0.2498, 'learning_rate': 3.5185850284259915e-07, 'epoch': 1.84} {'loss': 0.2645, 'learning_rate': 3.517701687432273e-07, 'epoch': 1.84} {'loss': 0.2564, 'learning_rate': 3.516818455348725e-07, 'epoch': 1.84} {'loss': 0.3506, 'learning_rate': 3.5159353321763457e-07, 'epoch': 1.84} {'loss': 0.3739, 'learning_rate': 3.5150523179161234e-07, 'epoch': 1.84} {'loss': 0.2895, 'learning_rate': 3.5141694125690576e-07, 'epoch': 1.84} {'loss': 0.3384, 'learning_rate': 3.513286616136158e-07, 'epoch': 1.84} {'loss': 0.1786, 'learning_rate': 3.512403928618402e-07, 'epoch': 1.84} {'loss': 0.233, 'learning_rate': 3.511521350016789e-07, 'epoch': 1.84} {'loss': 0.368, 'learning_rate': 3.510638880332329e-07, 'epoch': 1.84} {'loss': 0.2353, 'learning_rate': 3.50975651956601e-07, 'epoch': 1.84} {'loss': 0.2777, 'learning_rate': 3.5088742677188203e-07, 'epoch': 1.84} {'loss': 0.2946, 'learning_rate': 3.507992124791759e-07, 'epoch': 1.84} {'loss': 0.3081, 'learning_rate': 3.507110090785848e-07, 'epoch': 1.84} {'loss': 0.243, 'learning_rate': 3.5062281657020304e-07, 'epoch': 1.84} {'loss': 0.159, 'learning_rate': 3.505346349541361e-07, 'epoch': 1.84} {'loss': 0.4139, 'learning_rate': 3.5044646423047836e-07, 'epoch': 1.84} {'loss': 0.2923, 'learning_rate': 3.5035830439933306e-07, 'epoch': 1.84} {'loss': 0.2712, 'learning_rate': 3.502701554607968e-07, 'epoch': 1.84} {'loss': 0.3839, 'learning_rate': 3.501820174149717e-07, 'epoch': 1.84} {'loss': 0.1447, 'learning_rate': 3.500938902619566e-07, 'epoch': 1.84} {'loss': 0.3688, 'learning_rate': 3.500057740018492e-07, 'epoch': 1.84} {'loss': 0.3994, 'learning_rate': 3.499176686347516e-07, 'epoch': 1.84} {'loss': 0.3443, 'learning_rate': 3.4982957416076044e-07, 'epoch': 1.84} {'loss': 0.2142, 'learning_rate': 3.4974149057997787e-07, 'epoch': 1.84} {'loss': 0.392, 'learning_rate': 3.496534178925004e-07, 'epoch': 1.84} {'loss': 0.3429, 'learning_rate': 3.4956535609843133e-07, 'epoch': 1.84} {'loss': 0.2414, 'learning_rate': 3.4947730519786615e-07, 'epoch': 1.84} {'loss': 0.2939, 'learning_rate': 3.493892651909059e-07, 'epoch': 1.84} {'loss': 0.2736, 'learning_rate': 3.4930123607765155e-07, 'epoch': 1.84} {'loss': 0.1192, 'learning_rate': 3.492132178581997e-07, 'epoch': 1.84} {'loss': 0.2552, 'learning_rate': 3.4912521053265147e-07, 'epoch': 1.84} {'loss': 0.2451, 'learning_rate': 3.4903721410110446e-07, 'epoch': 1.84} {'loss': 0.3045, 'learning_rate': 3.4894922856366084e-07, 'epoch': 1.84} {'loss': 0.277, 'learning_rate': 3.4886125392041724e-07, 'epoch': 1.84} {'loss': 0.3779, 'learning_rate': 3.487732901714758e-07, 'epoch': 1.84} {'loss': 0.2983, 'learning_rate': 3.486853373169319e-07, 'epoch': 1.84} {'loss': 0.2221, 'learning_rate': 3.4859739535688887e-07, 'epoch': 1.84} {'loss': 0.2673, 'learning_rate': 3.485094642914422e-07, 'epoch': 1.84} {'loss': 0.1677, 'learning_rate': 3.4842154412069397e-07, 'epoch': 1.84} {'loss': 0.2259, 'learning_rate': 3.4833363484474304e-07, 'epoch': 1.84} {'loss': 0.3816, 'learning_rate': 3.4824573646368707e-07, 'epoch': 1.84} {'loss': 0.3236, 'learning_rate': 3.4815784897762715e-07, 'epoch': 1.84} {'loss': 0.3158, 'learning_rate': 3.48069972386661e-07, 'epoch': 1.84} {'loss': 0.2326, 'learning_rate': 3.479821066908895e-07, 'epoch': 1.84} {'loss': 0.1836, 'learning_rate': 3.478942518904083e-07, 'epoch': 1.84} {'loss': 0.185, 'learning_rate': 3.478064079853216e-07, 'epoch': 1.84} {'loss': 0.4524, 'learning_rate': 3.4771857497572505e-07, 'epoch': 1.84} {'loss': 0.3229, 'learning_rate': 3.4763075286171957e-07, 'epoch': 1.84} {'loss': 0.1508, 'learning_rate': 3.4754294164340175e-07, 'epoch': 1.84} {'loss': 0.347, 'learning_rate': 3.474551413208738e-07, 'epoch': 1.84} {'loss': 0.2425, 'learning_rate': 3.473673518942322e-07, 'epoch': 1.84} {'loss': 0.4324, 'learning_rate': 3.472795733635792e-07, 'epoch': 1.84} {'loss': 0.3442, 'learning_rate': 3.4719180572901025e-07, 'epoch': 1.84} {'loss': 0.3483, 'learning_rate': 3.471040489906274e-07, 'epoch': 1.84} {'loss': 0.2365, 'learning_rate': 3.4701630314852853e-07, 'epoch': 1.84} {'loss': 0.2196, 'learning_rate': 3.469285682028123e-07, 'epoch': 1.84} {'loss': 0.3958, 'learning_rate': 3.4684084415357866e-07, 'epoch': 1.84} {'loss': 0.3078, 'learning_rate': 3.4675313100092425e-07, 'epoch': 1.84} {'loss': 0.2137, 'learning_rate': 3.4666542874495225e-07, 'epoch': 1.84} {'loss': 0.3347, 'learning_rate': 3.465777373857571e-07, 'epoch': 1.84} {'loss': 0.204, 'learning_rate': 3.4649005692344196e-07, 'epoch': 1.84} {'loss': 0.2576, 'learning_rate': 3.464023873581024e-07, 'epoch': 1.84} {'loss': 0.1816, 'learning_rate': 3.463147286898394e-07, 'epoch': 1.84} {'loss': 0.3307, 'learning_rate': 3.462270809187507e-07, 'epoch': 1.84} {'loss': 0.3107, 'learning_rate': 3.4613944404493726e-07, 'epoch': 1.84} {'loss': 0.2736, 'learning_rate': 3.460518180684957e-07, 'epoch': 1.84} {'loss': 0.344, 'learning_rate': 3.45964202989526e-07, 'epoch': 1.84} {'loss': 0.242, 'learning_rate': 3.4587659880812805e-07, 'epoch': 1.84} {'loss': 0.2778, 'learning_rate': 3.457890055243973e-07, 'epoch': 1.84} {'loss': 0.4755, 'learning_rate': 3.45701423138437e-07, 'epoch': 1.84} {'loss': 0.1811, 'learning_rate': 3.4561385165034266e-07, 'epoch': 1.84} {'loss': 0.2599, 'learning_rate': 3.455262910602153e-07, 'epoch': 1.84} {'loss': 0.1852, 'learning_rate': 3.454387413681515e-07, 'epoch': 1.84} {'loss': 0.2609, 'learning_rate': 3.4535120257425337e-07, 'epoch': 1.84} {'loss': 0.2512, 'learning_rate': 3.452636746786153e-07, 'epoch': 1.84} {'loss': 0.2847, 'learning_rate': 3.451761576813406e-07, 'epoch': 1.84} {'loss': 0.321, 'learning_rate': 3.450886515825258e-07, 'epoch': 1.84} {'loss': 0.2986, 'learning_rate': 3.450011563822697e-07, 'epoch': 1.84} {'loss': 0.2281, 'learning_rate': 3.4491367208067117e-07, 'epoch': 1.84} {'loss': 0.2239, 'learning_rate': 3.44826198677829e-07, 'epoch': 1.84} {'loss': 0.3619, 'learning_rate': 3.44738736173843e-07, 'epoch': 1.84} {'loss': 0.2517, 'learning_rate': 3.446512845688099e-07, 'epoch': 1.84} {'loss': 0.2137, 'learning_rate': 3.445638438628307e-07, 'epoch': 1.84} {'loss': 0.1973, 'learning_rate': 3.4447641405600083e-07, 'epoch': 1.84} {'loss': 0.3577, 'learning_rate': 3.443889951484225e-07, 'epoch': 1.84} {'loss': 0.1695, 'learning_rate': 3.4430158714019223e-07, 'epoch': 1.84} {'loss': 0.3792, 'learning_rate': 3.4421419003141e-07, 'epoch': 1.84} {'loss': 0.2516, 'learning_rate': 3.441268038221734e-07, 'epoch': 1.84} {'loss': 0.3525, 'learning_rate': 3.4403942851258145e-07, 'epoch': 1.84} {'loss': 0.3421, 'learning_rate': 3.4395206410273274e-07, 'epoch': 1.84} {'loss': 0.3427, 'learning_rate': 3.438647105927262e-07, 'epoch': 1.84} {'loss': 0.2707, 'learning_rate': 3.437773679826595e-07, 'epoch': 1.84} {'loss': 0.5034, 'learning_rate': 3.4369003627263365e-07, 'epoch': 1.84} {'loss': 0.2324, 'learning_rate': 3.4360271546274525e-07, 'epoch': 1.84} {'loss': 0.2415, 'learning_rate': 3.435154055530909e-07, 'epoch': 1.84} {'loss': 0.2865, 'learning_rate': 3.434281065437739e-07, 'epoch': 1.84} {'loss': 0.2548, 'learning_rate': 3.4334081843488853e-07, 'epoch': 1.84} {'loss': 0.3217, 'learning_rate': 3.432535412265359e-07, 'epoch': 1.84} {'loss': 0.242, 'learning_rate': 3.431662749188136e-07, 'epoch': 1.84} {'loss': 0.334, 'learning_rate': 3.430790195118205e-07, 'epoch': 1.84} {'loss': 0.3261, 'learning_rate': 3.429917750056544e-07, 'epoch': 1.84} {'loss': 0.2603, 'learning_rate': 3.4290454140041507e-07, 'epoch': 1.84} {'loss': 0.3602, 'learning_rate': 3.4281731869619804e-07, 'epoch': 1.84} {'loss': 0.3465, 'learning_rate': 3.427301068931066e-07, 'epoch': 1.84} {'loss': 0.2199, 'learning_rate': 3.4264290599123396e-07, 'epoch': 1.84} {'loss': 0.3965, 'learning_rate': 3.4255571599068226e-07, 'epoch': 1.84} {'loss': 0.2371, 'learning_rate': 3.4246853689154925e-07, 'epoch': 1.84} {'loss': 0.407, 'learning_rate': 3.4238136869393255e-07, 'epoch': 1.84} {'loss': 0.279, 'learning_rate': 3.4229421139793105e-07, 'epoch': 1.84} {'loss': 0.3091, 'learning_rate': 3.4220706500364133e-07, 'epoch': 1.84} {'loss': 0.2649, 'learning_rate': 3.421199295111644e-07, 'epoch': 1.84} {'loss': 0.3456, 'learning_rate': 3.4203280492059676e-07, 'epoch': 1.84} {'loss': 0.2957, 'learning_rate': 3.419456912320396e-07, 'epoch': 1.84} {'loss': 0.2184, 'learning_rate': 3.4185858844558717e-07, 'epoch': 1.84} {'loss': 0.3049, 'learning_rate': 3.417714965613406e-07, 'epoch': 1.84} {'loss': 0.183, 'learning_rate': 3.4168441557939637e-07, 'epoch': 1.84} {'loss': 0.3255, 'learning_rate': 3.415973454998556e-07, 'epoch': 1.84} {'loss': 0.4017, 'learning_rate': 3.415102863228126e-07, 'epoch': 1.84} {'loss': 0.3027, 'learning_rate': 3.4142323804837065e-07, 'epoch': 1.84} {'loss': 0.3183, 'learning_rate': 3.413362006766241e-07, 'epoch': 1.84} {'loss': 0.2631, 'learning_rate': 3.4124917420767065e-07, 'epoch': 1.84} {'loss': 0.2014, 'learning_rate': 3.411621586416125e-07, 'epoch': 1.84} {'loss': 0.3052, 'learning_rate': 3.4107515397854395e-07, 'epoch': 1.84} {'loss': 0.3582, 'learning_rate': 3.409881602185661e-07, 'epoch': 1.84} {'loss': 0.3734, 'learning_rate': 3.409011773617743e-07, 'epoch': 1.84} {'loss': 0.3278, 'learning_rate': 3.408142054082697e-07, 'epoch': 1.84} {'loss': 0.3876, 'learning_rate': 3.4072724435814773e-07, 'epoch': 1.84} {'loss': 0.3068, 'learning_rate': 3.4064029421150833e-07, 'epoch': 1.84} {'loss': 0.2084, 'learning_rate': 3.405533549684503e-07, 'epoch': 1.84} {'loss': 0.1253, 'learning_rate': 3.4046642662906917e-07, 'epoch': 1.84} {'loss': 0.3605, 'learning_rate': 3.4037950919346587e-07, 'epoch': 1.84} {'loss': 0.3227, 'learning_rate': 3.402926026617359e-07, 'epoch': 1.84} {'loss': 0.2281, 'learning_rate': 3.4020570703398036e-07, 'epoch': 1.84} {'loss': 0.3444, 'learning_rate': 3.401188223102947e-07, 'epoch': 1.84} {'loss': 0.1456, 'learning_rate': 3.400319484907788e-07, 'epoch': 1.84} {'loss': 0.2768, 'learning_rate': 3.3994508557552816e-07, 'epoch': 1.84} {'loss': 0.2756, 'learning_rate': 3.398582335646439e-07, 'epoch': 1.84} {'loss': 0.2875, 'learning_rate': 3.3977139245822243e-07, 'epoch': 1.84} {'loss': 0.509, 'learning_rate': 3.396845622563627e-07, 'epoch': 1.84} {'loss': 0.2749, 'learning_rate': 3.395977429591624e-07, 'epoch': 1.84} {'loss': 0.1406, 'learning_rate': 3.3951093456671803e-07, 'epoch': 1.84} {'loss': 0.3285, 'learning_rate': 3.394241370791296e-07, 'epoch': 1.84} {'loss': 0.2317, 'learning_rate': 3.3933735049649253e-07, 'epoch': 1.84} {'loss': 0.2788, 'learning_rate': 3.39250574818909e-07, 'epoch': 1.84} {'loss': 0.4175, 'learning_rate': 3.3916381004647223e-07, 'epoch': 1.84} {'loss': 0.1989, 'learning_rate': 3.3907705617928443e-07, 'epoch': 1.84} {'loss': 0.158, 'learning_rate': 3.3899031321743994e-07, 'epoch': 1.84} {'loss': 0.3206, 'learning_rate': 3.389035811610397e-07, 'epoch': 1.84} {'loss': 0.1871, 'learning_rate': 3.3881686001017933e-07, 'epoch': 1.84} {'loss': 0.2495, 'learning_rate': 3.3873014976495755e-07, 'epoch': 1.84} {'loss': 0.3447, 'learning_rate': 3.386434504254721e-07, 'epoch': 1.84} {'loss': 0.299, 'learning_rate': 3.3855676199182173e-07, 'epoch': 1.84} {'loss': 0.1765, 'learning_rate': 3.3847008446410425e-07, 'epoch': 1.84} {'loss': 0.314, 'learning_rate': 3.3838341784241503e-07, 'epoch': 1.84} {'loss': 0.2514, 'learning_rate': 3.3829676212685516e-07, 'epoch': 1.84} {'loss': 0.326, 'learning_rate': 3.3821011731751894e-07, 'epoch': 1.84} {'loss': 0.3352, 'learning_rate': 3.3812348341450864e-07, 'epoch': 1.84} {'loss': 0.2485, 'learning_rate': 3.380368604179174e-07, 'epoch': 1.84} {'loss': 0.3438, 'learning_rate': 3.379502483278474e-07, 'epoch': 1.84} {'loss': 0.3262, 'learning_rate': 3.378636471443919e-07, 'epoch': 1.84} {'loss': 0.3554, 'learning_rate': 3.377770568676531e-07, 'epoch': 1.84} {'loss': 0.2231, 'learning_rate': 3.3769047749772523e-07, 'epoch': 1.84} {'loss': 0.3207, 'learning_rate': 3.376039090347083e-07, 'epoch': 1.84} {'loss': 0.2989, 'learning_rate': 3.375173514786989e-07, 'epoch': 1.84} {'loss': 0.316, 'learning_rate': 3.3743080482979474e-07, 'epoch': 1.84} {'loss': 0.3469, 'learning_rate': 3.373442690880946e-07, 'epoch': 1.84} {'loss': 0.3136, 'learning_rate': 3.3725774425369506e-07, 'epoch': 1.84} {'loss': 0.2828, 'learning_rate': 3.3717123032669384e-07, 'epoch': 1.84} {'loss': 0.286, 'learning_rate': 3.3708472730718867e-07, 'epoch': 1.84} {'loss': 0.2625, 'learning_rate': 3.369982351952772e-07, 'epoch': 1.84} {'loss': 0.303, 'learning_rate': 3.3691175399105716e-07, 'epoch': 1.84} {'loss': 0.3243, 'learning_rate': 3.368252836946273e-07, 'epoch': 1.84} {'loss': 0.325, 'learning_rate': 3.367388243060832e-07, 'epoch': 1.84} {'loss': 0.3292, 'learning_rate': 3.366523758255236e-07, 'epoch': 1.84} {'loss': 0.2589, 'learning_rate': 3.3656593825304615e-07, 'epoch': 1.84} {'loss': 0.4042, 'learning_rate': 3.364795115887476e-07, 'epoch': 1.84} {'loss': 0.2901, 'learning_rate': 3.3639309583272663e-07, 'epoch': 1.84} {'loss': 0.1949, 'learning_rate': 3.363066909850798e-07, 'epoch': 1.84} {'loss': 0.3267, 'learning_rate': 3.362202970459061e-07, 'epoch': 1.84} {'loss': 0.2143, 'learning_rate': 3.3613391401530085e-07, 'epoch': 1.84} {'loss': 0.2988, 'learning_rate': 3.36047541893364e-07, 'epoch': 1.84} {'loss': 0.3268, 'learning_rate': 3.359611806801899e-07, 'epoch': 1.84} {'loss': 0.4065, 'learning_rate': 3.3587483037587966e-07, 'epoch': 1.84} {'loss': 0.2011, 'learning_rate': 3.3578849098052756e-07, 'epoch': 1.84} {'loss': 0.3397, 'learning_rate': 3.357021624942336e-07, 'epoch': 1.84} {'loss': 0.3358, 'learning_rate': 3.356158449170932e-07, 'epoch': 1.84} {'loss': 0.4414, 'learning_rate': 3.355295382492063e-07, 'epoch': 1.84} {'loss': 0.198, 'learning_rate': 3.354432424906673e-07, 'epoch': 1.84} {'loss': 0.3057, 'learning_rate': 3.3535695764157603e-07, 'epoch': 1.84} {'loss': 0.3469, 'learning_rate': 3.352706837020281e-07, 'epoch': 1.84} {'loss': 0.3089, 'learning_rate': 3.351844206721222e-07, 'epoch': 1.84} {'loss': 0.3663, 'learning_rate': 3.350981685519561e-07, 'epoch': 1.84} {'loss': 0.2194, 'learning_rate': 3.3501192734162526e-07, 'epoch': 1.84} {'loss': 0.3572, 'learning_rate': 3.349256970412285e-07, 'epoch': 1.84} {'loss': 0.4433, 'learning_rate': 3.3483947765086124e-07, 'epoch': 1.84} {'loss': 0.3323, 'learning_rate': 3.3475326917062457e-07, 'epoch': 1.84} {'loss': 0.2959, 'learning_rate': 3.346670716006117e-07, 'epoch': 1.84} {'loss': 0.2772, 'learning_rate': 3.345808849409227e-07, 'epoch': 1.84} {'loss': 0.2524, 'learning_rate': 3.344947091916539e-07, 'epoch': 1.84} {'loss': 0.2779, 'learning_rate': 3.3440854435290214e-07, 'epoch': 1.84} {'loss': 0.1727, 'learning_rate': 3.34322390424765e-07, 'epoch': 1.84} {'loss': 0.3904, 'learning_rate': 3.3423624740734127e-07, 'epoch': 1.84} {'loss': 0.3374, 'learning_rate': 3.341501153007254e-07, 'epoch': 1.84} {'loss': 0.2072, 'learning_rate': 3.340639941050172e-07, 'epoch': 1.84} {'loss': 0.2992, 'learning_rate': 3.3397788382031226e-07, 'epoch': 1.84} {'loss': 0.1765, 'learning_rate': 3.338917844467071e-07, 'epoch': 1.84} {'loss': 0.3283, 'learning_rate': 3.338056959843017e-07, 'epoch': 1.84} {'loss': 0.26, 'learning_rate': 3.337196184331892e-07, 'epoch': 1.84} {'loss': 0.2082, 'learning_rate': 3.336335517934719e-07, 'epoch': 1.84} {'loss': 0.3507, 'learning_rate': 3.3354749606524185e-07, 'epoch': 1.84} {'loss': 0.3301, 'learning_rate': 3.334614512486001e-07, 'epoch': 1.84} {'loss': 0.3172, 'learning_rate': 3.33375417343641e-07, 'epoch': 1.84} {'loss': 0.3717, 'learning_rate': 3.332893943504634e-07, 'epoch': 1.84} {'loss': 0.2422, 'learning_rate': 3.332033822691638e-07, 'epoch': 1.84} {'loss': 0.3257, 'learning_rate': 3.3311738109984e-07, 'epoch': 1.84} {'loss': 0.3302, 'learning_rate': 3.3303139084258753e-07, 'epoch': 1.84} {'loss': 0.3561, 'learning_rate': 3.32945411497505e-07, 'epoch': 1.84} {'loss': 0.3836, 'learning_rate': 3.328594430646881e-07, 'epoch': 1.84} {'loss': 0.3448, 'learning_rate': 3.327734855442355e-07, 'epoch': 1.84} {'loss': 0.3144, 'learning_rate': 3.3268753893624385e-07, 'epoch': 1.84} {'loss': 0.3673, 'learning_rate': 3.326016032408075e-07, 'epoch': 1.84} {'loss': 0.3199, 'learning_rate': 3.3251567845802746e-07, 'epoch': 1.84} {'loss': 0.2477, 'learning_rate': 3.3242976458799816e-07, 'epoch': 1.84} {'loss': 0.1522, 'learning_rate': 3.323438616308172e-07, 'epoch': 1.84} {'loss': 0.2869, 'learning_rate': 3.322579695865813e-07, 'epoch': 1.84} {'loss': 0.3049, 'learning_rate': 3.3217208845538915e-07, 'epoch': 1.84} {'loss': 0.3288, 'learning_rate': 3.3208621823733413e-07, 'epoch': 1.84} {'loss': 0.2824, 'learning_rate': 3.32000358932516e-07, 'epoch': 1.84} {'loss': 0.3498, 'learning_rate': 3.319145105410326e-07, 'epoch': 1.84} {'loss': 0.1968, 'learning_rate': 3.318286730629772e-07, 'epoch': 1.84} {'loss': 0.3375, 'learning_rate': 3.3174284649845065e-07, 'epoch': 1.84} {'loss': 0.2782, 'learning_rate': 3.3165703084754643e-07, 'epoch': 1.84} {'loss': 0.3002, 'learning_rate': 3.315712261103632e-07, 'epoch': 1.84} {'loss': 0.2761, 'learning_rate': 3.314854322869976e-07, 'epoch': 1.84} {'loss': 0.2258, 'learning_rate': 3.313996493775473e-07, 'epoch': 1.84} {'loss': 0.2911, 'learning_rate': 3.3131387738210673e-07, 'epoch': 1.84} {'loss': 0.2653, 'learning_rate': 3.3122811630077577e-07, 'epoch': 1.84} {'loss': 0.1871, 'learning_rate': 3.311423661336477e-07, 'epoch': 1.84} {'loss': 0.2104, 'learning_rate': 3.310566268808235e-07, 'epoch': 1.84} {'loss': 0.2407, 'learning_rate': 3.3097089854239763e-07, 'epoch': 1.84} {'loss': 0.3144, 'learning_rate': 3.3088518111846545e-07, 'epoch': 1.84} {'loss': 0.3364, 'learning_rate': 3.3079947460912587e-07, 'epoch': 1.84} {'loss': 0.3073, 'learning_rate': 3.3071377901447434e-07, 'epoch': 1.84} {'loss': 0.3071, 'learning_rate': 3.3062809433460963e-07, 'epoch': 1.84} {'loss': 0.278, 'learning_rate': 3.3054242056962504e-07, 'epoch': 1.84} {'loss': 0.2563, 'learning_rate': 3.304567577196216e-07, 'epoch': 1.84} {'loss': 0.3767, 'learning_rate': 3.3037110578469254e-07, 'epoch': 1.84} {'loss': 0.345, 'learning_rate': 3.302854647649367e-07, 'epoch': 1.84} {'loss': 0.4402, 'learning_rate': 3.301998346604485e-07, 'epoch': 1.84} {'loss': 0.4134, 'learning_rate': 3.301142154713266e-07, 'epoch': 1.84} {'loss': 0.5352, 'learning_rate': 3.300286071976655e-07, 'epoch': 1.84} {'loss': 0.3096, 'learning_rate': 3.2994300983956504e-07, 'epoch': 1.84} {'loss': 0.1681, 'learning_rate': 3.298574233971208e-07, 'epoch': 1.84} {'loss': 0.394, 'learning_rate': 3.2977184787042704e-07, 'epoch': 1.84} {'loss': 0.3147, 'learning_rate': 3.296862832595826e-07, 'epoch': 1.84} {'loss': 0.3266, 'learning_rate': 3.29600729564683e-07, 'epoch': 1.84} {'loss': 0.2427, 'learning_rate': 3.2951518678582593e-07, 'epoch': 1.84} {'loss': 0.4206, 'learning_rate': 3.2942965492310574e-07, 'epoch': 1.84} {'loss': 0.4, 'learning_rate': 3.2934413397662234e-07, 'epoch': 1.84} {'loss': 0.2706, 'learning_rate': 3.29258623946469e-07, 'epoch': 1.84} {'loss': 0.288, 'learning_rate': 3.2917312483274565e-07, 'epoch': 1.84} {'loss': 0.1755, 'learning_rate': 3.2908763663554443e-07, 'epoch': 1.84} {'loss': 0.2823, 'learning_rate': 3.2900215935496635e-07, 'epoch': 1.84} {'loss': 0.1654, 'learning_rate': 3.2891669299110364e-07, 'epoch': 1.84} {'loss': 0.3069, 'learning_rate': 3.288312375440572e-07, 'epoch': 1.84} {'loss': 0.4462, 'learning_rate': 3.287457930139204e-07, 'epoch': 1.84} {'loss': 0.2587, 'learning_rate': 3.286603594007898e-07, 'epoch': 1.84} {'loss': 0.4422, 'learning_rate': 3.285749367047641e-07, 'epoch': 1.84} {'loss': 0.2173, 'learning_rate': 3.284895249259368e-07, 'epoch': 1.84} {'loss': 0.3252, 'learning_rate': 3.2840412406440646e-07, 'epoch': 1.84} {'loss': 0.2638, 'learning_rate': 3.283187341202676e-07, 'epoch': 1.84} {'loss': 0.3137, 'learning_rate': 3.282333550936201e-07, 'epoch': 1.84} {'loss': 0.1908, 'learning_rate': 3.28147986984555e-07, 'epoch': 1.84} {'loss': 0.2298, 'learning_rate': 3.280626297931744e-07, 'epoch': 1.84} {'loss': 0.4095, 'learning_rate': 3.2797728351956937e-07, 'epoch': 1.84} {'loss': 0.2209, 'learning_rate': 3.27891948163841e-07, 'epoch': 1.84} {'loss': 0.2636, 'learning_rate': 3.278066237260813e-07, 'epoch': 1.84} {'loss': 0.2711, 'learning_rate': 3.277213102063903e-07, 'epoch': 1.84} {'loss': 0.3075, 'learning_rate': 3.2763600760486237e-07, 'epoch': 1.84} {'loss': 0.3431, 'learning_rate': 3.275507159215929e-07, 'epoch': 1.84} {'loss': 0.3649, 'learning_rate': 3.2746543515668195e-07, 'epoch': 1.84} {'loss': 0.3301, 'learning_rate': 3.2738016531022044e-07, 'epoch': 1.84} {'loss': 0.2643, 'learning_rate': 3.2729490638230946e-07, 'epoch': 1.84} {'loss': 0.3256, 'learning_rate': 3.272096583730411e-07, 'epoch': 1.84} {'loss': 0.2083, 'learning_rate': 3.271244212825153e-07, 'epoch': 1.84} {'loss': 0.2916, 'learning_rate': 3.2703919511082535e-07, 'epoch': 1.84} {'loss': 0.3068, 'learning_rate': 3.269539798580701e-07, 'epoch': 1.84} {'loss': 0.1791, 'learning_rate': 3.268687755243438e-07, 'epoch': 1.84} {'loss': 0.4286, 'learning_rate': 3.2678358210974317e-07, 'epoch': 1.84} {'loss': 0.3782, 'learning_rate': 3.266983996143647e-07, 'epoch': 1.84} {'loss': 0.3076, 'learning_rate': 3.266132280383039e-07, 'epoch': 1.84} {'loss': 0.2456, 'learning_rate': 3.265280673816584e-07, 'epoch': 1.84} {'loss': 0.3479, 'learning_rate': 3.264429176445216e-07, 'epoch': 1.84} {'loss': 0.2229, 'learning_rate': 3.2635777882699226e-07, 'epoch': 1.84} {'loss': 0.3727, 'learning_rate': 3.262726509291647e-07, 'epoch': 1.84} {'loss': 0.3729, 'learning_rate': 3.2618753395113667e-07, 'epoch': 1.84} {'loss': 0.1591, 'learning_rate': 3.261024278930025e-07, 'epoch': 1.84} {'loss': 0.3047, 'learning_rate': 3.260173327548599e-07, 'epoch': 1.84} {'loss': 0.3789, 'learning_rate': 3.259322485368033e-07, 'epoch': 1.84} {'loss': 0.197, 'learning_rate': 3.258471752389303e-07, 'epoch': 1.84} {'loss': 0.2941, 'learning_rate': 3.257621128613353e-07, 'epoch': 1.84} {'loss': 0.3209, 'learning_rate': 3.2567706140411605e-07, 'epoch': 1.84} {'loss': 0.383, 'learning_rate': 3.2559202086736683e-07, 'epoch': 1.84} {'loss': 0.3951, 'learning_rate': 3.2550699125118656e-07, 'epoch': 1.84} {'loss': 0.3445, 'learning_rate': 3.2542197255566845e-07, 'epoch': 1.84} {'loss': 0.2534, 'learning_rate': 3.253369647809079e-07, 'epoch': 1.84} {'loss': 0.2651, 'learning_rate': 3.252519679270039e-07, 'epoch': 1.84} {'loss': 0.2534, 'learning_rate': 3.251669819940484e-07, 'epoch': 1.84} {'loss': 0.2812, 'learning_rate': 3.2508200698214145e-07, 'epoch': 1.84} {'loss': 0.4129, 'learning_rate': 3.249970428913762e-07, 'epoch': 1.84} {'loss': 0.4048, 'learning_rate': 3.249120897218505e-07, 'epoch': 1.84} {'loss': 0.2699, 'learning_rate': 3.248271474736586e-07, 'epoch': 1.84} {'loss': 0.2566, 'learning_rate': 3.2474221614689714e-07, 'epoch': 1.84} {'loss': 0.2962, 'learning_rate': 3.246572957416616e-07, 'epoch': 1.84} {'loss': 0.3857, 'learning_rate': 3.2457238625804967e-07, 'epoch': 1.84} {'loss': 0.4571, 'learning_rate': 3.2448748769615346e-07, 'epoch': 1.84} {'loss': 0.2402, 'learning_rate': 3.244026000560729e-07, 'epoch': 1.84} {'loss': 0.3928, 'learning_rate': 3.2431772333790133e-07, 'epoch': 1.84} {'loss': 0.319, 'learning_rate': 3.242328575417342e-07, 'epoch': 1.84} {'loss': 0.3184, 'learning_rate': 3.241480026676691e-07, 'epoch': 1.84} {'loss': 0.2427, 'learning_rate': 3.240631587158005e-07, 'epoch': 1.84} {'loss': 0.2594, 'learning_rate': 3.23978325686225e-07, 'epoch': 1.84} {'loss': 0.2055, 'learning_rate': 3.2389350357903694e-07, 'epoch': 1.84} {'loss': 0.2196, 'learning_rate': 3.238086923943351e-07, 'epoch': 1.84} {'loss': 0.4073, 'learning_rate': 3.2372389213221054e-07, 'epoch': 1.84} {'loss': 0.4045, 'learning_rate': 3.236391027927632e-07, 'epoch': 1.84} {'loss': 0.4604, 'learning_rate': 3.2355432437608747e-07, 'epoch': 1.84} {'loss': 0.2923, 'learning_rate': 3.234695568822788e-07, 'epoch': 1.84} {'loss': 0.1822, 'learning_rate': 3.233848003114326e-07, 'epoch': 1.84} {'loss': 0.327, 'learning_rate': 3.2330005466364446e-07, 'epoch': 1.84} {'loss': 0.2915, 'learning_rate': 3.23215319939012e-07, 'epoch': 1.84} {'loss': 0.2919, 'learning_rate': 3.2313059613762745e-07, 'epoch': 1.84} {'loss': 0.3331, 'learning_rate': 3.230458832595895e-07, 'epoch': 1.84} {'loss': 0.4095, 'learning_rate': 3.2296118130499266e-07, 'epoch': 1.84} {'loss': 0.3082, 'learning_rate': 3.228764902739323e-07, 'epoch': 1.84} {'loss': 0.3404, 'learning_rate': 3.2279181016650396e-07, 'epoch': 1.84} {'loss': 0.3813, 'learning_rate': 3.227071409828031e-07, 'epoch': 1.84} {'loss': 0.4179, 'learning_rate': 3.226224827229263e-07, 'epoch': 1.84} {'loss': 0.2844, 'learning_rate': 3.22537835386969e-07, 'epoch': 1.84} {'loss': 0.2648, 'learning_rate': 3.224531989750257e-07, 'epoch': 1.84} {'loss': 0.4444, 'learning_rate': 3.2236857348719176e-07, 'epoch': 1.84} {'loss': 0.2821, 'learning_rate': 3.222839589235638e-07, 'epoch': 1.84} {'loss': 0.3262, 'learning_rate': 3.221993552842373e-07, 'epoch': 1.84} {'loss': 0.2777, 'learning_rate': 3.221147625693077e-07, 'epoch': 1.84} {'loss': 0.2644, 'learning_rate': 3.220301807788684e-07, 'epoch': 1.84} {'loss': 0.3743, 'learning_rate': 3.2194560991301914e-07, 'epoch': 1.84} {'loss': 0.2763, 'learning_rate': 3.218610499718511e-07, 'epoch': 1.84} {'loss': 0.4032, 'learning_rate': 3.21776500955463e-07, 'epoch': 1.84} {'loss': 0.4437, 'learning_rate': 3.21691962863947e-07, 'epoch': 1.84} {'loss': 0.2583, 'learning_rate': 3.216074356974019e-07, 'epoch': 1.84} {'loss': 0.2785, 'learning_rate': 3.2152291945591997e-07, 'epoch': 1.84} {'loss': 0.2936, 'learning_rate': 3.214384141395999e-07, 'epoch': 1.84} {'loss': 0.3314, 'learning_rate': 3.21353919748536e-07, 'epoch': 1.84} {'loss': 0.2367, 'learning_rate': 3.212694362828206e-07, 'epoch': 1.84} {'loss': 0.327, 'learning_rate': 3.2118496374255347e-07, 'epoch': 1.84} {'loss': 0.2555, 'learning_rate': 3.2110050212782686e-07, 'epoch': 1.84} {'loss': 0.295, 'learning_rate': 3.2101605143873836e-07, 'epoch': 1.84} {'loss': 0.2929, 'learning_rate': 3.209316116753813e-07, 'epoch': 1.84} {'loss': 0.2151, 'learning_rate': 3.2084718283785234e-07, 'epoch': 1.84} {'loss': 0.2635, 'learning_rate': 3.207627649262457e-07, 'epoch': 1.84} {'loss': 0.3186, 'learning_rate': 3.2067835794065805e-07, 'epoch': 1.84} {'loss': 0.3139, 'learning_rate': 3.205939618811826e-07, 'epoch': 1.84} {'loss': 0.3842, 'learning_rate': 3.205095767479183e-07, 'epoch': 1.84} {'loss': 0.2929, 'learning_rate': 3.20425202540956e-07, 'epoch': 1.84} {'loss': 0.3333, 'learning_rate': 3.203408392603935e-07, 'epoch': 1.84} {'loss': 0.2959, 'learning_rate': 3.2025648690632625e-07, 'epoch': 1.84} {'loss': 0.2643, 'learning_rate': 3.2017214547884756e-07, 'epoch': 1.84} {'loss': 0.4612, 'learning_rate': 3.200878149780551e-07, 'epoch': 1.84} {'loss': 0.2966, 'learning_rate': 3.2000349540404205e-07, 'epoch': 1.84} {'loss': 0.3611, 'learning_rate': 3.1991918675690513e-07, 'epoch': 1.84} {'loss': 0.1546, 'learning_rate': 3.1983488903673643e-07, 'epoch': 1.84} {'loss': 0.1681, 'learning_rate': 3.1975060224363585e-07, 'epoch': 1.84} {'loss': 0.2929, 'learning_rate': 3.1966632637769444e-07, 'epoch': 1.84} {'loss': 0.3562, 'learning_rate': 3.1958206143900994e-07, 'epoch': 1.84} {'loss': 0.3474, 'learning_rate': 3.1949780742767557e-07, 'epoch': 1.84} {'loss': 0.1323, 'learning_rate': 3.19413564343789e-07, 'epoch': 1.84} {'loss': 0.4633, 'learning_rate': 3.1932933218744135e-07, 'epoch': 1.84} {'loss': 0.2196, 'learning_rate': 3.1924511095873245e-07, 'epoch': 1.84} {'loss': 0.3539, 'learning_rate': 3.1916090065775453e-07, 'epoch': 1.84} {'loss': 0.2769, 'learning_rate': 3.1907670128460076e-07, 'epoch': 1.84} {'loss': 0.2794, 'learning_rate': 3.1899251283937114e-07, 'epoch': 1.84} {'loss': 0.324, 'learning_rate': 3.189083353221567e-07, 'epoch': 1.84} {'loss': 0.4937, 'learning_rate': 3.18824168733054e-07, 'epoch': 1.84} {'loss': 0.2949, 'learning_rate': 3.187400130721574e-07, 'epoch': 1.84} {'loss': 0.3787, 'learning_rate': 3.186558683395635e-07, 'epoch': 1.84} {'loss': 0.2, 'learning_rate': 3.185717345353645e-07, 'epoch': 1.84} {'loss': 0.2564, 'learning_rate': 3.1848761165965804e-07, 'epoch': 1.84} {'loss': 0.1988, 'learning_rate': 3.184034997125374e-07, 'epoch': 1.84} {'loss': 0.3244, 'learning_rate': 3.1831939869410024e-07, 'epoch': 1.84} {'loss': 0.4395, 'learning_rate': 3.182353086044365e-07, 'epoch': 1.84} {'loss': 0.3465, 'learning_rate': 3.181512294436462e-07, 'epoch': 1.84} {'loss': 0.2504, 'learning_rate': 3.1806716121182135e-07, 'epoch': 1.84} {'loss': 0.2845, 'learning_rate': 3.179831039090575e-07, 'epoch': 1.84} {'loss': 0.1656, 'learning_rate': 3.1789905753545016e-07, 'epoch': 1.84} {'loss': 0.3467, 'learning_rate': 3.178150220910925e-07, 'epoch': 1.84} {'loss': 0.3924, 'learning_rate': 3.177309975760812e-07, 'epoch': 1.84} {'loss': 0.3314, 'learning_rate': 3.1764698399051054e-07, 'epoch': 1.84} {'loss': 0.3082, 'learning_rate': 3.1756298133447495e-07, 'epoch': 1.84} {'loss': 0.3291, 'learning_rate': 3.174789896080699e-07, 'epoch': 1.84} {'loss': 0.3424, 'learning_rate': 3.173950088113897e-07, 'epoch': 1.84} {'loss': 0.3876, 'learning_rate': 3.1731103894452886e-07, 'epoch': 1.84} {'loss': 0.32, 'learning_rate': 3.1722708000758384e-07, 'epoch': 1.84} {'loss': 0.3735, 'learning_rate': 3.1714313200064684e-07, 'epoch': 1.84} {'loss': 0.3726, 'learning_rate': 3.170591949238144e-07, 'epoch': 1.84} {'loss': 0.3973, 'learning_rate': 3.16975268777181e-07, 'epoch': 1.84} {'loss': 0.3398, 'learning_rate': 3.168913535608409e-07, 'epoch': 1.84} {'loss': 0.3378, 'learning_rate': 3.168074492748896e-07, 'epoch': 1.84} {'loss': 0.281, 'learning_rate': 3.167235559194215e-07, 'epoch': 1.84} {'loss': 0.2983, 'learning_rate': 3.1663967349453096e-07, 'epoch': 1.84} {'loss': 0.3925, 'learning_rate': 3.1655580200031233e-07, 'epoch': 1.84} {'loss': 0.3357, 'learning_rate': 3.164719414368611e-07, 'epoch': 1.84} {'loss': 0.2029, 'learning_rate': 3.1638809180427054e-07, 'epoch': 1.84} {'loss': 0.4094, 'learning_rate': 3.1630425310263833e-07, 'epoch': 1.84} {'loss': 0.2723, 'learning_rate': 3.1622042533205557e-07, 'epoch': 1.84} {'loss': 0.5097, 'learning_rate': 3.1613660849261986e-07, 'epoch': 1.84} {'loss': 0.5649, 'learning_rate': 3.160528025844234e-07, 'epoch': 1.84} {'loss': 0.2275, 'learning_rate': 3.159690076075628e-07, 'epoch': 1.84} {'loss': 0.3942, 'learning_rate': 3.1588522356213234e-07, 'epoch': 1.84} {'loss': 0.2709, 'learning_rate': 3.158014504482243e-07, 'epoch': 1.84} {'loss': 0.3362, 'learning_rate': 3.157176882659352e-07, 'epoch': 1.84} {'loss': 0.3396, 'learning_rate': 3.1563393701535937e-07, 'epoch': 1.84} {'loss': 0.298, 'learning_rate': 3.155501966965913e-07, 'epoch': 1.84} {'loss': 0.1997, 'learning_rate': 3.1546646730972517e-07, 'epoch': 1.84} {'loss': 0.317, 'learning_rate': 3.1538274885485664e-07, 'epoch': 1.84} {'loss': 0.2183, 'learning_rate': 3.152990413320789e-07, 'epoch': 1.84} {'loss': 0.192, 'learning_rate': 3.152153447414863e-07, 'epoch': 1.84} {'loss': 0.2023, 'learning_rate': 3.151316590831743e-07, 'epoch': 1.84} {'loss': 0.2387, 'learning_rate': 3.1504798435723736e-07, 'epoch': 1.84} {'loss': 0.3499, 'learning_rate': 3.149643205637698e-07, 'epoch': 1.84} {'loss': 0.3681, 'learning_rate': 3.148806677028648e-07, 'epoch': 1.84} {'loss': 0.2729, 'learning_rate': 3.1479702577461914e-07, 'epoch': 1.84} {'loss': 0.2333, 'learning_rate': 3.1471339477912475e-07, 'epoch': 1.84} {'loss': 0.2725, 'learning_rate': 3.1462977471647836e-07, 'epoch': 1.84} {'loss': 0.2272, 'learning_rate': 3.145461655867721e-07, 'epoch': 1.84} {'loss': 0.3287, 'learning_rate': 3.144625673901025e-07, 'epoch': 1.84} {'loss': 0.417, 'learning_rate': 3.1437898012656064e-07, 'epoch': 1.84} {'loss': 0.3429, 'learning_rate': 3.1429540379624533e-07, 'epoch': 1.84} {'loss': 0.3448, 'learning_rate': 3.142118383992487e-07, 'epoch': 1.84} {'loss': 0.38, 'learning_rate': 3.141282839356641e-07, 'epoch': 1.84} {'loss': 0.3372, 'learning_rate': 3.14044740405588e-07, 'epoch': 1.85} {'loss': 0.3438, 'learning_rate': 3.139612078091114e-07, 'epoch': 1.85} {'loss': 0.3016, 'learning_rate': 3.138776861463333e-07, 'epoch': 1.85} {'loss': 0.303, 'learning_rate': 3.1379417541734347e-07, 'epoch': 1.85} {'loss': 0.2587, 'learning_rate': 3.1371067562223854e-07, 'epoch': 1.85} {'loss': 0.3249, 'learning_rate': 3.136271867611118e-07, 'epoch': 1.85} {'loss': 0.3938, 'learning_rate': 3.1354370883405983e-07, 'epoch': 1.85} {'loss': 0.3916, 'learning_rate': 3.134602418411736e-07, 'epoch': 1.85} {'loss': 0.2121, 'learning_rate': 3.133767857825498e-07, 'epoch': 1.85} {'loss': 0.2291, 'learning_rate': 3.1329334065827945e-07, 'epoch': 1.85} {'loss': 0.0924, 'learning_rate': 3.1320990646846127e-07, 'epoch': 1.85} {'loss': 0.2741, 'learning_rate': 3.131264832131864e-07, 'epoch': 1.85} {'loss': 0.3175, 'learning_rate': 3.1304307089254913e-07, 'epoch': 1.85} {'loss': 0.3228, 'learning_rate': 3.12959669506645e-07, 'epoch': 1.85} {'loss': 0.2236, 'learning_rate': 3.128762790555662e-07, 'epoch': 1.85} {'loss': 0.2976, 'learning_rate': 3.127928995394092e-07, 'epoch': 1.85} {'loss': 0.177, 'learning_rate': 3.1270953095826615e-07, 'epoch': 1.85} {'loss': 0.2618, 'learning_rate': 3.1262617331223265e-07, 'epoch': 1.85} {'loss': 0.4127, 'learning_rate': 3.125428266014008e-07, 'epoch': 1.85} {'loss': 0.3323, 'learning_rate': 3.124594908258671e-07, 'epoch': 1.85} {'loss': 0.2564, 'learning_rate': 3.1237616598572385e-07, 'epoch': 1.85} {'loss': 0.3324, 'learning_rate': 3.122928520810664e-07, 'epoch': 1.85} {'loss': 0.2896, 'learning_rate': 3.12209549111987e-07, 'epoch': 1.85} {'loss': 0.2592, 'learning_rate': 3.121262570785821e-07, 'epoch': 1.85} {'loss': 0.2067, 'learning_rate': 3.12042975980944e-07, 'epoch': 1.85} {'loss': 0.4315, 'learning_rate': 3.119597058191659e-07, 'epoch': 1.85} {'loss': 0.4035, 'learning_rate': 3.118764465933444e-07, 'epoch': 1.85} {'loss': 0.197, 'learning_rate': 3.117931983035716e-07, 'epoch': 1.85} {'loss': 0.314, 'learning_rate': 3.11709960949943e-07, 'epoch': 1.85} {'loss': 0.3301, 'learning_rate': 3.116267345325497e-07, 'epoch': 1.85} {'loss': 0.2089, 'learning_rate': 3.115435190514893e-07, 'epoch': 1.85} {'loss': 0.3026, 'learning_rate': 3.1146031450685174e-07, 'epoch': 1.85} {'loss': 0.2402, 'learning_rate': 3.1137712089873484e-07, 'epoch': 1.85} {'loss': 0.2965, 'learning_rate': 3.1129393822723064e-07, 'epoch': 1.85} {'loss': 0.2009, 'learning_rate': 3.1121076649243353e-07, 'epoch': 1.85} {'loss': 0.1846, 'learning_rate': 3.111276056944357e-07, 'epoch': 1.85} {'loss': 0.1388, 'learning_rate': 3.1104445583333364e-07, 'epoch': 1.85} {'loss': 0.2727, 'learning_rate': 3.109613169092196e-07, 'epoch': 1.85} {'loss': 0.2087, 'learning_rate': 3.1087818892218677e-07, 'epoch': 1.85} {'loss': 0.2204, 'learning_rate': 3.1079507187233183e-07, 'epoch': 1.85} {'loss': 0.3214, 'learning_rate': 3.107119657597457e-07, 'epoch': 1.85} {'loss': 0.2423, 'learning_rate': 3.106288705845228e-07, 'epoch': 1.85} {'loss': 0.2465, 'learning_rate': 3.105457863467576e-07, 'epoch': 1.85} {'loss': 0.4052, 'learning_rate': 3.104627130465443e-07, 'epoch': 1.85} {'loss': 0.2879, 'learning_rate': 3.1037965068397625e-07, 'epoch': 1.85} {'loss': 0.3454, 'learning_rate': 3.102965992591467e-07, 'epoch': 1.85} {'loss': 0.2039, 'learning_rate': 3.102135587721489e-07, 'epoch': 1.85} {'loss': 0.2783, 'learning_rate': 3.101305292230783e-07, 'epoch': 1.85} {'loss': 0.3754, 'learning_rate': 3.100475106120271e-07, 'epoch': 1.85} {'loss': 0.2397, 'learning_rate': 3.0996450293909074e-07, 'epoch': 1.85} {'loss': 0.3755, 'learning_rate': 3.098815062043603e-07, 'epoch': 1.85} {'loss': 0.2514, 'learning_rate': 3.0979852040793235e-07, 'epoch': 1.85} {'loss': 0.3088, 'learning_rate': 3.09715545549899e-07, 'epoch': 1.85} {'loss': 0.3125, 'learning_rate': 3.096325816303525e-07, 'epoch': 1.85} {'loss': 0.2302, 'learning_rate': 3.095496286493904e-07, 'epoch': 1.85} {'loss': 0.3019, 'learning_rate': 3.094666866071017e-07, 'epoch': 1.85} {'loss': 0.3025, 'learning_rate': 3.09383755503585e-07, 'epoch': 1.85} {'loss': 0.3102, 'learning_rate': 3.093008353389293e-07, 'epoch': 1.85} {'loss': 0.2425, 'learning_rate': 3.092179261132311e-07, 'epoch': 1.85} {'loss': 0.216, 'learning_rate': 3.0913502782658143e-07, 'epoch': 1.85} {'loss': 0.2277, 'learning_rate': 3.0905214047907804e-07, 'epoch': 1.85} {'loss': 0.2558, 'learning_rate': 3.0896926407080975e-07, 'epoch': 1.85} {'loss': 0.3104, 'learning_rate': 3.088863986018742e-07, 'epoch': 1.85} {'loss': 0.4483, 'learning_rate': 3.0880354407236134e-07, 'epoch': 1.85} {'loss': 0.3255, 'learning_rate': 3.087207004823678e-07, 'epoch': 1.85} {'loss': 0.3078, 'learning_rate': 3.086378678319857e-07, 'epoch': 1.85} {'loss': 0.3061, 'learning_rate': 3.0855504612130717e-07, 'epoch': 1.85} {'loss': 0.4088, 'learning_rate': 3.084722353504288e-07, 'epoch': 1.85} {'loss': 0.3315, 'learning_rate': 3.0838943551944056e-07, 'epoch': 1.85} {'loss': 0.2737, 'learning_rate': 3.08306646628439e-07, 'epoch': 1.85} {'loss': 0.3176, 'learning_rate': 3.082238686775152e-07, 'epoch': 1.85} {'loss': 0.2047, 'learning_rate': 3.081411016667657e-07, 'epoch': 1.85} {'loss': 0.3578, 'learning_rate': 3.080583455962793e-07, 'epoch': 1.85} {'loss': 0.3592, 'learning_rate': 3.0797560046615385e-07, 'epoch': 1.85} {'loss': 0.2991, 'learning_rate': 3.078928662764802e-07, 'epoch': 1.85} {'loss': 0.3308, 'learning_rate': 3.078101430273528e-07, 'epoch': 1.85} {'loss': 0.293, 'learning_rate': 3.077274307188638e-07, 'epoch': 1.85} {'loss': 0.4016, 'learning_rate': 3.076447293511087e-07, 'epoch': 1.85} {'loss': 0.3971, 'learning_rate': 3.0756203892417956e-07, 'epoch': 1.85} {'loss': 0.3097, 'learning_rate': 3.074793594381698e-07, 'epoch': 1.85} {'loss': 0.4019, 'learning_rate': 3.073966908931725e-07, 'epoch': 1.85} {'loss': 0.2453, 'learning_rate': 3.073140332892799e-07, 'epoch': 1.85} {'loss': 0.4253, 'learning_rate': 3.072313866265886e-07, 'epoch': 1.85} {'loss': 0.2275, 'learning_rate': 3.071487509051885e-07, 'epoch': 1.85} {'loss': 0.2156, 'learning_rate': 3.0706612612517393e-07, 'epoch': 1.85} {'loss': 0.3718, 'learning_rate': 3.069835122866394e-07, 'epoch': 1.85} {'loss': 0.2978, 'learning_rate': 3.0690090938967686e-07, 'epoch': 1.85} {'loss': 0.4345, 'learning_rate': 3.0681831743438086e-07, 'epoch': 1.85} {'loss': 0.3242, 'learning_rate': 3.0673573642084233e-07, 'epoch': 1.85} {'loss': 0.5062, 'learning_rate': 3.066531663491579e-07, 'epoch': 1.85} {'loss': 0.3912, 'learning_rate': 3.065706072194163e-07, 'epoch': 1.85} {'loss': 0.3237, 'learning_rate': 3.064880590317154e-07, 'epoch': 1.85} {'loss': 0.3979, 'learning_rate': 3.06405521786145e-07, 'epoch': 1.85} {'loss': 0.3148, 'learning_rate': 3.0632299548279953e-07, 'epoch': 1.85} {'loss': 0.4139, 'learning_rate': 3.062404801217722e-07, 'epoch': 1.85} {'loss': 0.2587, 'learning_rate': 3.061579757031563e-07, 'epoch': 1.85} {'loss': 0.223, 'learning_rate': 3.0607548222704397e-07, 'epoch': 1.85} {'loss': 0.3896, 'learning_rate': 3.059929996935296e-07, 'epoch': 1.85} {'loss': 0.2717, 'learning_rate': 3.0591052810270637e-07, 'epoch': 1.85} {'loss': 0.229, 'learning_rate': 3.0582806745466543e-07, 'epoch': 1.85} {'loss': 0.2956, 'learning_rate': 3.0574561774950216e-07, 'epoch': 1.85} {'loss': 0.5247, 'learning_rate': 3.056631789873077e-07, 'epoch': 1.85} {'loss': 0.2016, 'learning_rate': 3.055807511681774e-07, 'epoch': 1.85} {'loss': 0.2857, 'learning_rate': 3.0549833429220135e-07, 'epoch': 1.85} {'loss': 0.1429, 'learning_rate': 3.0541592835947596e-07, 'epoch': 1.85} {'loss': 0.3963, 'learning_rate': 3.053335333700902e-07, 'epoch': 1.85} {'loss': 0.257, 'learning_rate': 3.0525114932414166e-07, 'epoch': 1.85} {'loss': 0.3536, 'learning_rate': 3.0516877622171927e-07, 'epoch': 1.85} {'loss': 0.2929, 'learning_rate': 3.050864140629195e-07, 'epoch': 1.85} {'loss': 0.3541, 'learning_rate': 3.0500406284783123e-07, 'epoch': 1.85} {'loss': 0.1899, 'learning_rate': 3.0492172257655215e-07, 'epoch': 1.85} {'loss': 0.3322, 'learning_rate': 3.048393932491722e-07, 'epoch': 1.85} {'loss': 0.2336, 'learning_rate': 3.047570748657846e-07, 'epoch': 1.85} {'loss': 0.2875, 'learning_rate': 3.046747674264827e-07, 'epoch': 1.85} {'loss': 0.2415, 'learning_rate': 3.045924709313586e-07, 'epoch': 1.85} {'loss': 0.41, 'learning_rate': 3.045101853805077e-07, 'epoch': 1.85} {'loss': 0.3095, 'learning_rate': 3.044279107740189e-07, 'epoch': 1.85} {'loss': 0.1452, 'learning_rate': 3.0434564711198875e-07, 'epoch': 1.85} {'loss': 0.2402, 'learning_rate': 3.042633943945084e-07, 'epoch': 1.85} {'loss': 0.2944, 'learning_rate': 3.041811526216709e-07, 'epoch': 1.85} {'loss': 0.3198, 'learning_rate': 3.040989217935686e-07, 'epoch': 1.85} {'loss': 0.3883, 'learning_rate': 3.0401670191029576e-07, 'epoch': 1.85} {'loss': 0.3649, 'learning_rate': 3.0393449297194345e-07, 'epoch': 1.85} {'loss': 0.2553, 'learning_rate': 3.0385229497860604e-07, 'epoch': 1.85} {'loss': 0.4282, 'learning_rate': 3.0377010793037563e-07, 'epoch': 1.85} {'loss': 0.3323, 'learning_rate': 3.0368793182734446e-07, 'epoch': 1.85} {'loss': 0.1783, 'learning_rate': 3.0360576666960686e-07, 'epoch': 1.85} {'loss': 0.3217, 'learning_rate': 3.035236124572527e-07, 'epoch': 1.85} {'loss': 0.2906, 'learning_rate': 3.0344146919037754e-07, 'epoch': 1.85} {'loss': 0.2807, 'learning_rate': 3.033593368690724e-07, 'epoch': 1.85} {'loss': 0.282, 'learning_rate': 3.032772154934316e-07, 'epoch': 1.85} {'loss': 0.3346, 'learning_rate': 3.031951050635462e-07, 'epoch': 1.85} {'loss': 0.4202, 'learning_rate': 3.0311300557951063e-07, 'epoch': 1.85} {'loss': 0.2118, 'learning_rate': 3.0303091704141475e-07, 'epoch': 1.85} {'loss': 0.2587, 'learning_rate': 3.029488394493552e-07, 'epoch': 1.85} {'loss': 0.3118, 'learning_rate': 3.028667728034196e-07, 'epoch': 1.85} {'loss': 0.3198, 'learning_rate': 3.027847171037057e-07, 'epoch': 1.85} {'loss': 0.325, 'learning_rate': 3.027026723503046e-07, 'epoch': 1.85} {'loss': 0.224, 'learning_rate': 3.0262063854330613e-07, 'epoch': 1.85} {'loss': 0.2108, 'learning_rate': 3.0253861568280587e-07, 'epoch': 1.85} {'loss': 0.3552, 'learning_rate': 3.024566037688947e-07, 'epoch': 1.85} {'loss': 0.3506, 'learning_rate': 3.0237460280166607e-07, 'epoch': 1.85} {'loss': 0.2561, 'learning_rate': 3.0229261278121313e-07, 'epoch': 1.85} {'loss': 0.2354, 'learning_rate': 3.022106337076269e-07, 'epoch': 1.85} {'loss': 0.2825, 'learning_rate': 3.0212866558100075e-07, 'epoch': 1.85} {'loss': 0.4041, 'learning_rate': 3.0204670840142893e-07, 'epoch': 1.85} {'loss': 0.2549, 'learning_rate': 3.019647621690003e-07, 'epoch': 1.85} {'loss': 0.2434, 'learning_rate': 3.018828268838103e-07, 'epoch': 1.85} {'loss': 0.4233, 'learning_rate': 3.0180090254594895e-07, 'epoch': 1.85} {'loss': 0.2613, 'learning_rate': 3.0171898915551167e-07, 'epoch': 1.85} {'loss': 0.3909, 'learning_rate': 3.016370867125895e-07, 'epoch': 1.85} {'loss': 0.1973, 'learning_rate': 3.015551952172746e-07, 'epoch': 1.85} {'loss': 0.2864, 'learning_rate': 3.0147331466966024e-07, 'epoch': 1.85} {'loss': 0.3279, 'learning_rate': 3.013914450698363e-07, 'epoch': 1.85} {'loss': 0.2692, 'learning_rate': 3.0130958641789834e-07, 'epoch': 1.85} {'loss': 0.2431, 'learning_rate': 3.012277387139373e-07, 'epoch': 1.85} {'loss': 0.3153, 'learning_rate': 3.011459019580465e-07, 'epoch': 1.85} {'loss': 0.244, 'learning_rate': 3.0106407615031694e-07, 'epoch': 1.85} {'loss': 0.3202, 'learning_rate': 3.00982261290842e-07, 'epoch': 1.85} {'loss': 0.4858, 'learning_rate': 3.009004573797136e-07, 'epoch': 1.85} {'loss': 0.3239, 'learning_rate': 3.008186644170241e-07, 'epoch': 1.85} {'loss': 0.149, 'learning_rate': 3.007368824028656e-07, 'epoch': 1.85} {'loss': 0.2579, 'learning_rate': 3.006551113373324e-07, 'epoch': 1.85} {'loss': 0.3337, 'learning_rate': 3.0057335122051447e-07, 'epoch': 1.85} {'loss': 0.2898, 'learning_rate': 3.004916020525039e-07, 'epoch': 1.85} {'loss': 0.1878, 'learning_rate': 3.004098638333952e-07, 'epoch': 1.85} {'loss': 0.2534, 'learning_rate': 3.0032813656327707e-07, 'epoch': 1.85} {'loss': 0.2368, 'learning_rate': 3.0024642024224617e-07, 'epoch': 1.85} {'loss': 0.4584, 'learning_rate': 3.001647148703912e-07, 'epoch': 1.85} {'loss': 0.2092, 'learning_rate': 3.000830204478067e-07, 'epoch': 1.85} {'loss': 0.2394, 'learning_rate': 3.000013369745836e-07, 'epoch': 1.85} {'loss': 0.3213, 'learning_rate': 2.9991966445081513e-07, 'epoch': 1.85} {'loss': 0.2333, 'learning_rate': 2.9983800287659124e-07, 'epoch': 1.85} {'loss': 0.3848, 'learning_rate': 2.9975635225200636e-07, 'epoch': 1.85} {'loss': 0.0774, 'learning_rate': 2.9967471257715155e-07, 'epoch': 1.85} {'loss': 0.3576, 'learning_rate': 2.9959308385212103e-07, 'epoch': 1.85} {'loss': 0.4317, 'learning_rate': 2.9951146607700486e-07, 'epoch': 1.85} {'loss': 0.3119, 'learning_rate': 2.9942985925189404e-07, 'epoch': 1.85} {'loss': 0.2473, 'learning_rate': 2.9934826337688407e-07, 'epoch': 1.85} {'loss': 0.1165, 'learning_rate': 2.992666784520637e-07, 'epoch': 1.85} {'loss': 0.1989, 'learning_rate': 2.9918510447752737e-07, 'epoch': 1.85} {'loss': 0.2628, 'learning_rate': 2.991035414533661e-07, 'epoch': 1.85} {'loss': 0.2669, 'learning_rate': 2.990219893796731e-07, 'epoch': 1.85} {'loss': 0.332, 'learning_rate': 2.9894044825653837e-07, 'epoch': 1.85} {'loss': 0.3647, 'learning_rate': 2.988589180840551e-07, 'epoch': 1.85} {'loss': 0.3203, 'learning_rate': 2.987773988623166e-07, 'epoch': 1.85} {'loss': 0.2058, 'learning_rate': 2.986958905914117e-07, 'epoch': 1.85} {'loss': 0.4129, 'learning_rate': 2.9861439327143584e-07, 'epoch': 1.85} {'loss': 0.2736, 'learning_rate': 2.9853290690247895e-07, 'epoch': 1.85} {'loss': 0.2803, 'learning_rate': 2.9845143148463427e-07, 'epoch': 1.85} {'loss': 0.3008, 'learning_rate': 2.983699670179929e-07, 'epoch': 1.85} {'loss': 0.2643, 'learning_rate': 2.98288513502647e-07, 'epoch': 1.85} {'loss': 0.2818, 'learning_rate': 2.982070709386875e-07, 'epoch': 1.85} {'loss': 0.1547, 'learning_rate': 2.9812563932620885e-07, 'epoch': 1.85} {'loss': 0.3265, 'learning_rate': 2.9804421866529985e-07, 'epoch': 1.85} {'loss': 0.2907, 'learning_rate': 2.97962808956056e-07, 'epoch': 1.85} {'loss': 0.3449, 'learning_rate': 2.9788141019856495e-07, 'epoch': 1.85} {'loss': 0.3672, 'learning_rate': 2.978000223929223e-07, 'epoch': 1.85} {'loss': 0.1909, 'learning_rate': 2.977186455392189e-07, 'epoch': 1.85} {'loss': 0.3841, 'learning_rate': 2.9763727963754485e-07, 'epoch': 1.85} {'loss': 0.3347, 'learning_rate': 2.975559246879944e-07, 'epoch': 1.85} {'loss': 0.304, 'learning_rate': 2.974745806906576e-07, 'epoch': 1.85} {'loss': 0.3399, 'learning_rate': 2.973932476456276e-07, 'epoch': 1.85} {'loss': 0.4109, 'learning_rate': 2.9731192555299436e-07, 'epoch': 1.85} {'loss': 0.3688, 'learning_rate': 2.972306144128523e-07, 'epoch': 1.85} {'loss': 0.3582, 'learning_rate': 2.9714931422529127e-07, 'epoch': 1.85} {'loss': 0.2621, 'learning_rate': 2.970680249904034e-07, 'epoch': 1.85} {'loss': 0.2582, 'learning_rate': 2.9698674670828097e-07, 'epoch': 1.85} {'loss': 0.2624, 'learning_rate': 2.9690547937901494e-07, 'epoch': 1.85} {'loss': 0.3703, 'learning_rate': 2.9682422300269743e-07, 'epoch': 1.85} {'loss': 0.3183, 'learning_rate': 2.967429775794217e-07, 'epoch': 1.85} {'loss': 0.3944, 'learning_rate': 2.9666174310927665e-07, 'epoch': 1.85} {'loss': 0.401, 'learning_rate': 2.9658051959235545e-07, 'epoch': 1.85} {'loss': 0.2547, 'learning_rate': 2.9649930702875027e-07, 'epoch': 1.85} {'loss': 0.3594, 'learning_rate': 2.9641810541855107e-07, 'epoch': 1.85} {'loss': 0.3662, 'learning_rate': 2.963369147618511e-07, 'epoch': 1.85} {'loss': 0.2327, 'learning_rate': 2.962557350587414e-07, 'epoch': 1.85} {'loss': 0.2996, 'learning_rate': 2.9617456630931407e-07, 'epoch': 1.85} {'loss': 0.2578, 'learning_rate': 2.960934085136602e-07, 'epoch': 1.85} {'loss': 0.4707, 'learning_rate': 2.960122616718719e-07, 'epoch': 1.85} {'loss': 0.246, 'learning_rate': 2.9593112578404025e-07, 'epoch': 1.85} {'loss': 0.2571, 'learning_rate': 2.958500008502574e-07, 'epoch': 1.85} {'loss': 0.322, 'learning_rate': 2.957688868706132e-07, 'epoch': 1.85} {'loss': 0.3904, 'learning_rate': 2.956877838452021e-07, 'epoch': 1.85} {'loss': 0.3363, 'learning_rate': 2.9560669177411405e-07, 'epoch': 1.85} {'loss': 0.3943, 'learning_rate': 2.9552561065744e-07, 'epoch': 1.85} {'loss': 0.3546, 'learning_rate': 2.9544454049527214e-07, 'epoch': 1.85} {'loss': 0.2989, 'learning_rate': 2.953634812877015e-07, 'epoch': 1.85} {'loss': 0.3611, 'learning_rate': 2.952824330348214e-07, 'epoch': 1.85} {'loss': 0.2578, 'learning_rate': 2.952013957367206e-07, 'epoch': 1.85} {'loss': 0.4652, 'learning_rate': 2.951203693934934e-07, 'epoch': 1.85} {'loss': 0.3876, 'learning_rate': 2.9503935400522875e-07, 'epoch': 1.85} {'loss': 0.1723, 'learning_rate': 2.9495834957201986e-07, 'epoch': 1.85} {'loss': 0.2459, 'learning_rate': 2.9487735609395665e-07, 'epoch': 1.85} {'loss': 0.3124, 'learning_rate': 2.9479637357113234e-07, 'epoch': 1.85} {'loss': 0.1885, 'learning_rate': 2.947154020036369e-07, 'epoch': 1.85} {'loss': 0.2695, 'learning_rate': 2.946344413915625e-07, 'epoch': 1.85} {'loss': 0.3222, 'learning_rate': 2.9455349173500126e-07, 'epoch': 1.85} {'loss': 0.1317, 'learning_rate': 2.94472553034042e-07, 'epoch': 1.85} {'loss': 0.2773, 'learning_rate': 2.94391625288778e-07, 'epoch': 1.85} {'loss': 0.259, 'learning_rate': 2.943107084993002e-07, 'epoch': 1.85} {'loss': 0.3604, 'learning_rate': 2.942298026656998e-07, 'epoch': 1.85} {'loss': 0.2622, 'learning_rate': 2.9414890778806884e-07, 'epoch': 1.85} {'loss': 0.3362, 'learning_rate': 2.9406802386649836e-07, 'epoch': 1.85} {'loss': 0.3052, 'learning_rate': 2.9398715090107835e-07, 'epoch': 1.85} {'loss': 0.317, 'learning_rate': 2.93906288891902e-07, 'epoch': 1.85} {'loss': 0.3802, 'learning_rate': 2.9382543783905813e-07, 'epoch': 1.85} {'loss': 0.2102, 'learning_rate': 2.937445977426423e-07, 'epoch': 1.85} {'loss': 0.3771, 'learning_rate': 2.9366376860274103e-07, 'epoch': 1.85} {'loss': 0.3603, 'learning_rate': 2.935829504194487e-07, 'epoch': 1.85} {'loss': 0.2053, 'learning_rate': 2.935021431928553e-07, 'epoch': 1.85} {'loss': 0.4574, 'learning_rate': 2.934213469230518e-07, 'epoch': 1.85} {'loss': 0.2553, 'learning_rate': 2.9334056161013035e-07, 'epoch': 1.85} {'loss': 0.3038, 'learning_rate': 2.932597872541809e-07, 'epoch': 1.85} {'loss': 0.3092, 'learning_rate': 2.9317902385529563e-07, 'epoch': 1.85} {'loss': 0.1854, 'learning_rate': 2.930982714135655e-07, 'epoch': 1.85} {'loss': 0.2243, 'learning_rate': 2.9301752992908164e-07, 'epoch': 1.85} {'loss': 0.1628, 'learning_rate': 2.92936799401935e-07, 'epoch': 1.85} {'loss': 0.563, 'learning_rate': 2.9285607983221665e-07, 'epoch': 1.85} {'loss': 0.1929, 'learning_rate': 2.9277537122001765e-07, 'epoch': 1.85} {'loss': 0.2652, 'learning_rate': 2.9269467356543014e-07, 'epoch': 1.85} {'loss': 0.2635, 'learning_rate': 2.92613986868544e-07, 'epoch': 1.85} {'loss': 0.4733, 'learning_rate': 2.925333111294515e-07, 'epoch': 1.85} {'loss': 0.2094, 'learning_rate': 2.924526463482424e-07, 'epoch': 1.85} {'loss': 0.3247, 'learning_rate': 2.923719925250079e-07, 'epoch': 1.85} {'loss': 0.3424, 'learning_rate': 2.922913496598401e-07, 'epoch': 1.85} {'loss': 0.246, 'learning_rate': 2.9221071775282774e-07, 'epoch': 1.85} {'loss': 0.2007, 'learning_rate': 2.9213009680406523e-07, 'epoch': 1.85} {'loss': 0.2741, 'learning_rate': 2.9204948681364144e-07, 'epoch': 1.85} {'loss': 0.2352, 'learning_rate': 2.919688877816473e-07, 'epoch': 1.85} {'loss': 0.3282, 'learning_rate': 2.91888299708174e-07, 'epoch': 1.85} {'loss': 0.3092, 'learning_rate': 2.9180772259331356e-07, 'epoch': 1.85} {'loss': 0.2958, 'learning_rate': 2.9172715643715485e-07, 'epoch': 1.85} {'loss': 0.1581, 'learning_rate': 2.9164660123979116e-07, 'epoch': 1.85} {'loss': 0.3469, 'learning_rate': 2.9156605700131237e-07, 'epoch': 1.85} {'loss': 0.2034, 'learning_rate': 2.914855237218095e-07, 'epoch': 1.85} {'loss': 0.4566, 'learning_rate': 2.914050014013725e-07, 'epoch': 1.85} {'loss': 0.3718, 'learning_rate': 2.9132449004009354e-07, 'epoch': 1.85} {'loss': 0.3444, 'learning_rate': 2.9124398963806364e-07, 'epoch': 1.85} {'loss': 0.2611, 'learning_rate': 2.9116350019537166e-07, 'epoch': 1.85} {'loss': 0.2379, 'learning_rate': 2.910830217121108e-07, 'epoch': 1.85} {'loss': 0.2502, 'learning_rate': 2.9100255418836986e-07, 'epoch': 1.85} {'loss': 0.2613, 'learning_rate': 2.9092209762424216e-07, 'epoch': 1.85} {'loss': 0.344, 'learning_rate': 2.9084165201981653e-07, 'epoch': 1.85} {'loss': 0.333, 'learning_rate': 2.9076121737518394e-07, 'epoch': 1.85} {'loss': 0.2234, 'learning_rate': 2.9068079369043654e-07, 'epoch': 1.85} {'loss': 0.2531, 'learning_rate': 2.906003809656632e-07, 'epoch': 1.85} {'loss': 0.2414, 'learning_rate': 2.905199792009572e-07, 'epoch': 1.85} {'loss': 0.1949, 'learning_rate': 2.9043958839640616e-07, 'epoch': 1.85} {'loss': 0.2179, 'learning_rate': 2.9035920855210455e-07, 'epoch': 1.85} {'loss': 0.1668, 'learning_rate': 2.9027883966813885e-07, 'epoch': 1.85} {'loss': 0.3667, 'learning_rate': 2.901984817446035e-07, 'epoch': 1.85} {'loss': 0.2991, 'learning_rate': 2.901181347815862e-07, 'epoch': 1.85} {'loss': 0.2814, 'learning_rate': 2.9003779877918024e-07, 'epoch': 1.85} {'loss': 0.3462, 'learning_rate': 2.899574737374744e-07, 'epoch': 1.85} {'loss': 0.2351, 'learning_rate': 2.8987715965656194e-07, 'epoch': 1.85} {'loss': 0.3186, 'learning_rate': 2.8979685653653057e-07, 'epoch': 1.85} {'loss': 0.3276, 'learning_rate': 2.897165643774713e-07, 'epoch': 1.85} {'loss': 0.3126, 'learning_rate': 2.8963628317947634e-07, 'epoch': 1.85} {'loss': 0.2937, 'learning_rate': 2.895560129426345e-07, 'epoch': 1.85} {'loss': 0.4536, 'learning_rate': 2.8947575366703894e-07, 'epoch': 1.85} {'loss': 0.3197, 'learning_rate': 2.893955053527775e-07, 'epoch': 1.85} {'loss': 0.3028, 'learning_rate': 2.8931526799994223e-07, 'epoch': 1.85} {'loss': 0.2258, 'learning_rate': 2.8923504160862316e-07, 'epoch': 1.85} {'loss': 0.2424, 'learning_rate': 2.891548261789123e-07, 'epoch': 1.85} {'loss': 0.3298, 'learning_rate': 2.890746217108975e-07, 'epoch': 1.85} {'loss': 0.256, 'learning_rate': 2.8899442820467304e-07, 'epoch': 1.85} {'loss': 0.3061, 'learning_rate': 2.8891424566032444e-07, 'epoch': 1.85} {'loss': 0.2982, 'learning_rate': 2.888340740779472e-07, 'epoch': 1.85} {'loss': 0.2393, 'learning_rate': 2.8875391345763003e-07, 'epoch': 1.85} {'loss': 0.3377, 'learning_rate': 2.8867376379946077e-07, 'epoch': 1.85} {'loss': 0.2012, 'learning_rate': 2.885936251035337e-07, 'epoch': 1.85} {'loss': 0.316, 'learning_rate': 2.885134973699366e-07, 'epoch': 1.85} {'loss': 0.2038, 'learning_rate': 2.884333805987627e-07, 'epoch': 1.85} {'loss': 0.3091, 'learning_rate': 2.8835327479009855e-07, 'epoch': 1.85} {'loss': 0.2402, 'learning_rate': 2.8827317994403857e-07, 'epoch': 1.85} {'loss': 0.2638, 'learning_rate': 2.881930960606705e-07, 'epoch': 1.85} {'loss': 0.3635, 'learning_rate': 2.881130231400864e-07, 'epoch': 1.85} {'loss': 0.1406, 'learning_rate': 2.880329611823751e-07, 'epoch': 1.85} {'loss': 0.4022, 'learning_rate': 2.879529101876288e-07, 'epoch': 1.85} {'loss': 0.2795, 'learning_rate': 2.8787287015593525e-07, 'epoch': 1.85} {'loss': 0.2463, 'learning_rate': 2.877928410873876e-07, 'epoch': 1.85} {'loss': 0.3152, 'learning_rate': 2.877128229820747e-07, 'epoch': 1.85} {'loss': 0.356, 'learning_rate': 2.8763281584008763e-07, 'epoch': 1.85} {'loss': 0.3035, 'learning_rate': 2.875528196615163e-07, 'epoch': 1.85} {'loss': 0.2564, 'learning_rate': 2.8747283444644944e-07, 'epoch': 1.85} {'loss': 0.3719, 'learning_rate': 2.8739286019498045e-07, 'epoch': 1.85} {'loss': 0.2423, 'learning_rate': 2.87312896907197e-07, 'epoch': 1.85} {'loss': 0.1621, 'learning_rate': 2.872329445831912e-07, 'epoch': 1.85} {'loss': 0.1963, 'learning_rate': 2.8715300322305074e-07, 'epoch': 1.85} {'loss': 0.2839, 'learning_rate': 2.870730728268689e-07, 'epoch': 1.85} {'loss': 0.3006, 'learning_rate': 2.8699315339473457e-07, 'epoch': 1.85} {'loss': 0.1914, 'learning_rate': 2.8691324492673756e-07, 'epoch': 1.85} {'loss': 0.2223, 'learning_rate': 2.8683334742296897e-07, 'epoch': 1.85} {'loss': 0.2526, 'learning_rate': 2.867534608835176e-07, 'epoch': 1.85} {'loss': 0.3398, 'learning_rate': 2.8667358530847457e-07, 'epoch': 1.85} {'loss': 0.2795, 'learning_rate': 2.865937206979319e-07, 'epoch': 1.85} {'loss': 0.2146, 'learning_rate': 2.8651386705197626e-07, 'epoch': 1.85} {'loss': 0.2386, 'learning_rate': 2.8643402437069867e-07, 'epoch': 1.85} {'loss': 0.2497, 'learning_rate': 2.8635419265419127e-07, 'epoch': 1.85} {'loss': 0.2849, 'learning_rate': 2.8627437190254183e-07, 'epoch': 1.85} {'loss': 0.2915, 'learning_rate': 2.861945621158424e-07, 'epoch': 1.85} {'loss': 0.3089, 'learning_rate': 2.861147632941819e-07, 'epoch': 1.85} {'loss': 0.3851, 'learning_rate': 2.8603497543765125e-07, 'epoch': 1.85} {'loss': 0.3542, 'learning_rate': 2.8595519854633826e-07, 'epoch': 1.85} {'loss': 0.243, 'learning_rate': 2.8587543262033614e-07, 'epoch': 1.85} {'loss': 0.3974, 'learning_rate': 2.857956776597326e-07, 'epoch': 1.85} {'loss': 0.4964, 'learning_rate': 2.857159336646187e-07, 'epoch': 1.85} {'loss': 0.1827, 'learning_rate': 2.8563620063508433e-07, 'epoch': 1.85} {'loss': 0.3455, 'learning_rate': 2.855564785712195e-07, 'epoch': 1.85} {'loss': 0.4049, 'learning_rate': 2.85476767473114e-07, 'epoch': 1.85} {'loss': 0.416, 'learning_rate': 2.853970673408579e-07, 'epoch': 1.85} {'loss': 0.2516, 'learning_rate': 2.8531737817454107e-07, 'epoch': 1.85} {'loss': 0.3158, 'learning_rate': 2.8523769997425343e-07, 'epoch': 1.85} {'loss': 0.2489, 'learning_rate': 2.8515803274008604e-07, 'epoch': 1.85} {'loss': 0.3175, 'learning_rate': 2.850783764721265e-07, 'epoch': 1.85} {'loss': 0.2767, 'learning_rate': 2.8499873117046715e-07, 'epoch': 1.85} {'loss': 0.3843, 'learning_rate': 2.849190968351967e-07, 'epoch': 1.85} {'loss': 0.3161, 'learning_rate': 2.848394734664051e-07, 'epoch': 1.85} {'loss': 0.438, 'learning_rate': 2.8475986106418216e-07, 'epoch': 1.85} {'loss': 0.3797, 'learning_rate': 2.84680259628618e-07, 'epoch': 1.85} {'loss': 0.2966, 'learning_rate': 2.8460066915980133e-07, 'epoch': 1.85} {'loss': 0.4242, 'learning_rate': 2.845210896578254e-07, 'epoch': 1.85} {'loss': 0.3003, 'learning_rate': 2.844415211227769e-07, 'epoch': 1.85} {'loss': 0.4439, 'learning_rate': 2.8436196355474455e-07, 'epoch': 1.85} {'loss': 0.2112, 'learning_rate': 2.8428241695382165e-07, 'epoch': 1.85} {'loss': 0.2703, 'learning_rate': 2.8420288132009585e-07, 'epoch': 1.85} {'loss': 0.3248, 'learning_rate': 2.841233566536583e-07, 'epoch': 1.85} {'loss': 0.3442, 'learning_rate': 2.8404384295459666e-07, 'epoch': 1.85} {'loss': 0.2393, 'learning_rate': 2.83964340223003e-07, 'epoch': 1.85} {'loss': 0.3569, 'learning_rate': 2.8388484845896515e-07, 'epoch': 1.85} {'loss': 0.2101, 'learning_rate': 2.8380536766257403e-07, 'epoch': 1.85} {'loss': 0.3103, 'learning_rate': 2.8372589783391855e-07, 'epoch': 1.85} {'loss': 0.2542, 'learning_rate': 2.8364643897309085e-07, 'epoch': 1.85} {'loss': 0.2955, 'learning_rate': 2.8356699108017636e-07, 'epoch': 1.85} {'loss': 0.3017, 'learning_rate': 2.834875541552684e-07, 'epoch': 1.85} {'loss': 0.5255, 'learning_rate': 2.8340812819845575e-07, 'epoch': 1.85} {'loss': 0.2089, 'learning_rate': 2.8332871320982613e-07, 'epoch': 1.85} {'loss': 0.2718, 'learning_rate': 2.8324930918947167e-07, 'epoch': 1.85} {'loss': 0.333, 'learning_rate': 2.8316991613748014e-07, 'epoch': 1.85} {'loss': 0.3778, 'learning_rate': 2.830905340539425e-07, 'epoch': 1.85} {'loss': 0.3041, 'learning_rate': 2.830111629389476e-07, 'epoch': 1.85} {'loss': 0.2772, 'learning_rate': 2.829318027925854e-07, 'epoch': 1.85} {'loss': 0.1834, 'learning_rate': 2.8285245361494573e-07, 'epoch': 1.85} {'loss': 0.4047, 'learning_rate': 2.827731154061175e-07, 'epoch': 1.85} {'loss': 0.3073, 'learning_rate': 2.8269378816619176e-07, 'epoch': 1.85} {'loss': 0.2451, 'learning_rate': 2.8261447189525504e-07, 'epoch': 1.85} {'loss': 0.3746, 'learning_rate': 2.8253516659340066e-07, 'epoch': 1.85} {'loss': 0.5278, 'learning_rate': 2.824558722607151e-07, 'epoch': 1.85} {'loss': 0.3021, 'learning_rate': 2.8237658889728956e-07, 'epoch': 1.85} {'loss': 0.1472, 'learning_rate': 2.8229731650321167e-07, 'epoch': 1.85} {'loss': 0.2588, 'learning_rate': 2.8221805507857356e-07, 'epoch': 1.85} {'loss': 0.2713, 'learning_rate': 2.82138804623463e-07, 'epoch': 1.85} {'loss': 0.3526, 'learning_rate': 2.8205956513796984e-07, 'epoch': 1.85} {'loss': 0.3755, 'learning_rate': 2.8198033662218296e-07, 'epoch': 1.85} {'loss': 0.3803, 'learning_rate': 2.8190111907619335e-07, 'epoch': 1.85} {'loss': 0.2727, 'learning_rate': 2.8182191250008875e-07, 'epoch': 1.85} {'loss': 0.3079, 'learning_rate': 2.8174271689395903e-07, 'epoch': 1.85} {'loss': 0.2641, 'learning_rate': 2.816635322578942e-07, 'epoch': 1.85} {'loss': 0.2036, 'learning_rate': 2.8158435859198195e-07, 'epoch': 1.85} {'loss': 0.4466, 'learning_rate': 2.815051958963144e-07, 'epoch': 1.85} {'loss': 0.2512, 'learning_rate': 2.814260441709793e-07, 'epoch': 1.85} {'loss': 0.2716, 'learning_rate': 2.813469034160654e-07, 'epoch': 1.85} {'loss': 0.2913, 'learning_rate': 2.812677736316627e-07, 'epoch': 1.85} {'loss': 0.2178, 'learning_rate': 2.8118865481786217e-07, 'epoch': 1.85} {'loss': 0.4084, 'learning_rate': 2.8110954697474937e-07, 'epoch': 1.85} {'loss': 0.1944, 'learning_rate': 2.8103045010241747e-07, 'epoch': 1.85} {'loss': 0.2327, 'learning_rate': 2.809513642009531e-07, 'epoch': 1.85} {'loss': 0.3602, 'learning_rate': 2.808722892704474e-07, 'epoch': 1.85} {'loss': 0.4123, 'learning_rate': 2.8079322531098795e-07, 'epoch': 1.85} {'loss': 0.2422, 'learning_rate': 2.8071417232266473e-07, 'epoch': 1.85} {'loss': 0.3505, 'learning_rate': 2.806351303055677e-07, 'epoch': 1.85} {'loss': 0.3882, 'learning_rate': 2.805560992597833e-07, 'epoch': 1.85} {'loss': 0.3268, 'learning_rate': 2.80477079185405e-07, 'epoch': 1.85} {'loss': 0.1717, 'learning_rate': 2.803980700825193e-07, 'epoch': 1.85} {'loss': 0.1888, 'learning_rate': 2.803190719512161e-07, 'epoch': 1.85} {'loss': 0.2723, 'learning_rate': 2.8024008479158317e-07, 'epoch': 1.85} {'loss': 0.4678, 'learning_rate': 2.801611086037126e-07, 'epoch': 1.85} {'loss': 0.498, 'learning_rate': 2.800821433876899e-07, 'epoch': 1.85} {'loss': 0.2873, 'learning_rate': 2.8000318914360834e-07, 'epoch': 1.85} {'loss': 0.2513, 'learning_rate': 2.799242458715534e-07, 'epoch': 1.85} {'loss': 0.2835, 'learning_rate': 2.7984531357161616e-07, 'epoch': 1.85} {'loss': 0.4288, 'learning_rate': 2.7976639224388536e-07, 'epoch': 1.85} {'loss': 0.3793, 'learning_rate': 2.7968748188844874e-07, 'epoch': 1.85} {'loss': 0.3265, 'learning_rate': 2.7960858250539845e-07, 'epoch': 1.85} {'loss': 0.3567, 'learning_rate': 2.7952969409482e-07, 'epoch': 1.85} {'loss': 0.3715, 'learning_rate': 2.794508166568044e-07, 'epoch': 1.85} {'loss': 0.2131, 'learning_rate': 2.793719501914405e-07, 'epoch': 1.85} {'loss': 0.2822, 'learning_rate': 2.792930946988182e-07, 'epoch': 1.85} {'loss': 0.3201, 'learning_rate': 2.7921425017902405e-07, 'epoch': 1.85} {'loss': 0.1911, 'learning_rate': 2.7913541663214915e-07, 'epoch': 1.85} {'loss': 0.3708, 'learning_rate': 2.790565940582812e-07, 'epoch': 1.85} {'loss': 0.4412, 'learning_rate': 2.7897778245751127e-07, 'epoch': 1.85} {'loss': 0.4214, 'learning_rate': 2.788989818299248e-07, 'epoch': 1.85} {'loss': 0.3256, 'learning_rate': 2.788201921756151e-07, 'epoch': 1.85} {'loss': 0.1343, 'learning_rate': 2.787414134946687e-07, 'epoch': 1.85} {'loss': 0.344, 'learning_rate': 2.786626457871733e-07, 'epoch': 1.85} {'loss': 0.2738, 'learning_rate': 2.7858388905322e-07, 'epoch': 1.85} {'loss': 0.3853, 'learning_rate': 2.7850514329289534e-07, 'epoch': 1.85} {'loss': 0.3644, 'learning_rate': 2.7842640850629153e-07, 'epoch': 1.85} {'loss': 0.2636, 'learning_rate': 2.7834768469349517e-07, 'epoch': 1.85} {'loss': 0.3134, 'learning_rate': 2.782689718545961e-07, 'epoch': 1.85} {'loss': 0.3008, 'learning_rate': 2.78190269989681e-07, 'epoch': 1.85} {'loss': 0.4055, 'learning_rate': 2.78111579098842e-07, 'epoch': 1.85} {'loss': 0.2453, 'learning_rate': 2.780328991821657e-07, 'epoch': 1.85} {'loss': 0.326, 'learning_rate': 2.77954230239742e-07, 'epoch': 1.85} {'loss': 0.2918, 'learning_rate': 2.7787557227165864e-07, 'epoch': 1.85} {'loss': 0.4682, 'learning_rate': 2.777969252780055e-07, 'epoch': 1.85} {'loss': 0.1991, 'learning_rate': 2.7771828925887144e-07, 'epoch': 1.85} {'loss': 0.394, 'learning_rate': 2.7763966421434305e-07, 'epoch': 1.85} {'loss': 0.4433, 'learning_rate': 2.775610501445125e-07, 'epoch': 1.85} {'loss': 0.2999, 'learning_rate': 2.7748244704946524e-07, 'epoch': 1.85} {'loss': 0.2471, 'learning_rate': 2.7740385492929233e-07, 'epoch': 1.85} {'loss': 0.3329, 'learning_rate': 2.7732527378408036e-07, 'epoch': 1.85} {'loss': 0.3602, 'learning_rate': 2.7724670361392146e-07, 'epoch': 1.85} {'loss': 0.3663, 'learning_rate': 2.7716814441890007e-07, 'epoch': 1.85} {'loss': 0.3038, 'learning_rate': 2.7708959619910824e-07, 'epoch': 1.85} {'loss': 0.2566, 'learning_rate': 2.7701105895463264e-07, 'epoch': 1.85} {'loss': 0.28, 'learning_rate': 2.7693253268556317e-07, 'epoch': 1.85} {'loss': 0.3831, 'learning_rate': 2.768540173919876e-07, 'epoch': 1.85} {'loss': 0.3896, 'learning_rate': 2.767755130739946e-07, 'epoch': 1.85} {'loss': 0.2076, 'learning_rate': 2.766970197316743e-07, 'epoch': 1.85} {'loss': 0.1751, 'learning_rate': 2.766185373651131e-07, 'epoch': 1.85} {'loss': 0.2852, 'learning_rate': 2.7654006597440106e-07, 'epoch': 1.85} {'loss': 0.4123, 'learning_rate': 2.7646160555962585e-07, 'epoch': 1.85} {'loss': 0.3044, 'learning_rate': 2.7638315612087743e-07, 'epoch': 1.85} {'loss': 0.3096, 'learning_rate': 2.763047176582412e-07, 'epoch': 1.85} {'loss': 0.3979, 'learning_rate': 2.7622629017181044e-07, 'epoch': 1.85} {'loss': 0.3475, 'learning_rate': 2.7614787366166964e-07, 'epoch': 1.85} {'loss': 0.2685, 'learning_rate': 2.760694681279097e-07, 'epoch': 1.85} {'loss': 0.3241, 'learning_rate': 2.759910735706162e-07, 'epoch': 1.85} {'loss': 0.3297, 'learning_rate': 2.759126899898823e-07, 'epoch': 1.85} {'loss': 0.2896, 'learning_rate': 2.758343173857925e-07, 'epoch': 1.85} {'loss': 0.3, 'learning_rate': 2.757559557584366e-07, 'epoch': 1.85} {'loss': 0.2456, 'learning_rate': 2.756776051079046e-07, 'epoch': 1.85} {'loss': 0.2898, 'learning_rate': 2.755992654342809e-07, 'epoch': 1.85} {'loss': 0.1257, 'learning_rate': 2.755209367376588e-07, 'epoch': 1.85} {'loss': 0.2316, 'learning_rate': 2.7544261901812254e-07, 'epoch': 1.85} {'loss': 0.389, 'learning_rate': 2.753643122757632e-07, 'epoch': 1.85} {'loss': 0.343, 'learning_rate': 2.7528601651066745e-07, 'epoch': 1.85} {'loss': 0.2946, 'learning_rate': 2.752077317229263e-07, 'epoch': 1.85} {'loss': 0.2752, 'learning_rate': 2.7512945791262405e-07, 'epoch': 1.85} {'loss': 0.2519, 'learning_rate': 2.750511950798529e-07, 'epoch': 1.85} {'loss': 0.3393, 'learning_rate': 2.749729432247006e-07, 'epoch': 1.86} {'loss': 0.2869, 'learning_rate': 2.748947023472526e-07, 'epoch': 1.86} {'loss': 0.4018, 'learning_rate': 2.748164724475999e-07, 'epoch': 1.86} {'loss': 0.3987, 'learning_rate': 2.7473825352583027e-07, 'epoch': 1.86} {'loss': 0.4149, 'learning_rate': 2.746600455820314e-07, 'epoch': 1.86} {'loss': 0.3045, 'learning_rate': 2.745818486162921e-07, 'epoch': 1.86} {'loss': 0.48, 'learning_rate': 2.7450366262870123e-07, 'epoch': 1.86} {'loss': 0.2737, 'learning_rate': 2.744254876193453e-07, 'epoch': 1.86} {'loss': 0.2837, 'learning_rate': 2.743473235883143e-07, 'epoch': 1.86} {'loss': 0.3979, 'learning_rate': 2.742691705356959e-07, 'epoch': 1.86} {'loss': 0.1526, 'learning_rate': 2.7419102846157786e-07, 'epoch': 1.86} {'loss': 0.1589, 'learning_rate': 2.7411289736604787e-07, 'epoch': 1.86} {'loss': 0.2852, 'learning_rate': 2.740347772491969e-07, 'epoch': 1.86} {'loss': 0.2683, 'learning_rate': 2.7395666811111054e-07, 'epoch': 1.86} {'loss': 0.3942, 'learning_rate': 2.738785699518765e-07, 'epoch': 1.86} {'loss': 0.3486, 'learning_rate': 2.738004827715846e-07, 'epoch': 1.86} {'loss': 0.3841, 'learning_rate': 2.7372240657032257e-07, 'epoch': 1.86} {'loss': 0.2774, 'learning_rate': 2.7364434134817817e-07, 'epoch': 1.86} {'loss': 0.3417, 'learning_rate': 2.7356628710523914e-07, 'epoch': 1.86} {'loss': 0.2436, 'learning_rate': 2.7348824384159645e-07, 'epoch': 1.86} {'loss': 0.2962, 'learning_rate': 2.7341021155733337e-07, 'epoch': 1.86} {'loss': 0.3335, 'learning_rate': 2.733321902525421e-07, 'epoch': 1.86} {'loss': 0.2271, 'learning_rate': 2.7325417992730807e-07, 'epoch': 1.86} {'loss': 0.2182, 'learning_rate': 2.7317618058172235e-07, 'epoch': 1.86} {'loss': 0.2274, 'learning_rate': 2.730981922158693e-07, 'epoch': 1.86} {'loss': 0.3476, 'learning_rate': 2.7302021482984e-07, 'epoch': 1.86} {'loss': 0.3273, 'learning_rate': 2.72942248423721e-07, 'epoch': 1.86} {'loss': 0.479, 'learning_rate': 2.7286429299759885e-07, 'epoch': 1.86} {'loss': 0.3199, 'learning_rate': 2.727863485515647e-07, 'epoch': 1.86} {'loss': 0.4273, 'learning_rate': 2.72708415085704e-07, 'epoch': 1.86} {'loss': 0.2866, 'learning_rate': 2.7263049260010777e-07, 'epoch': 1.86} {'loss': 0.2838, 'learning_rate': 2.7255258109486037e-07, 'epoch': 1.86} {'loss': 0.3267, 'learning_rate': 2.724746805700518e-07, 'epoch': 1.86} {'loss': 0.2986, 'learning_rate': 2.723967910257685e-07, 'epoch': 1.86} {'loss': 0.2467, 'learning_rate': 2.7231891246210064e-07, 'epoch': 1.86} {'loss': 0.3167, 'learning_rate': 2.7224104487913463e-07, 'epoch': 1.86} {'loss': 0.2866, 'learning_rate': 2.7216318827695933e-07, 'epoch': 1.86} {'loss': 0.3748, 'learning_rate': 2.7208534265566024e-07, 'epoch': 1.86} {'loss': 0.2415, 'learning_rate': 2.7200750801532836e-07, 'epoch': 1.86} {'loss': 0.4606, 'learning_rate': 2.719296843560504e-07, 'epoch': 1.86} {'loss': 0.3742, 'learning_rate': 2.718518716779128e-07, 'epoch': 1.86} {'loss': 0.3352, 'learning_rate': 2.7177406998100565e-07, 'epoch': 1.86} {'loss': 0.3215, 'learning_rate': 2.716962792654154e-07, 'epoch': 1.86} {'loss': 0.2557, 'learning_rate': 2.716184995312299e-07, 'epoch': 1.86} {'loss': 0.2221, 'learning_rate': 2.715407307785367e-07, 'epoch': 1.86} {'loss': 0.2959, 'learning_rate': 2.7146297300742473e-07, 'epoch': 1.86} {'loss': 0.2583, 'learning_rate': 2.713852262179806e-07, 'epoch': 1.86} {'loss': 0.3387, 'learning_rate': 2.7130749041029303e-07, 'epoch': 1.86} {'loss': 0.2963, 'learning_rate': 2.712297655844487e-07, 'epoch': 1.86} {'loss': 0.3493, 'learning_rate': 2.7115205174053636e-07, 'epoch': 1.86} {'loss': 0.2533, 'learning_rate': 2.710743488786427e-07, 'epoch': 1.86} {'loss': 0.3369, 'learning_rate': 2.709966569988576e-07, 'epoch': 1.86} {'loss': 0.3222, 'learning_rate': 2.709189761012665e-07, 'epoch': 1.86} {'loss': 0.3283, 'learning_rate': 2.7084130618595717e-07, 'epoch': 1.86} {'loss': 0.2548, 'learning_rate': 2.707636472530195e-07, 'epoch': 1.86} {'loss': 0.2181, 'learning_rate': 2.706859993025379e-07, 'epoch': 1.86} {'loss': 0.192, 'learning_rate': 2.706083623346023e-07, 'epoch': 1.86} {'loss': 0.3492, 'learning_rate': 2.705307363492993e-07, 'epoch': 1.86} {'loss': 0.2469, 'learning_rate': 2.704531213467176e-07, 'epoch': 1.86} {'loss': 0.2671, 'learning_rate': 2.703755173269429e-07, 'epoch': 1.86} {'loss': 0.3307, 'learning_rate': 2.702979242900661e-07, 'epoch': 1.86} {'loss': 0.2347, 'learning_rate': 2.7022034223617043e-07, 'epoch': 1.86} {'loss': 0.3367, 'learning_rate': 2.7014277116534814e-07, 'epoch': 1.86} {'loss': 0.2859, 'learning_rate': 2.700652110776825e-07, 'epoch': 1.86} {'loss': 0.2362, 'learning_rate': 2.6998766197326445e-07, 'epoch': 1.86} {'loss': 0.2485, 'learning_rate': 2.699101238521806e-07, 'epoch': 1.86} {'loss': 0.2831, 'learning_rate': 2.6983259671451546e-07, 'epoch': 1.86} {'loss': 0.3002, 'learning_rate': 2.6975508056036105e-07, 'epoch': 1.86} {'loss': 0.2507, 'learning_rate': 2.6967757538980176e-07, 'epoch': 1.86} {'loss': 0.425, 'learning_rate': 2.6960008120292756e-07, 'epoch': 1.86} {'loss': 0.3393, 'learning_rate': 2.695225979998228e-07, 'epoch': 1.86} {'loss': 0.2955, 'learning_rate': 2.6944512578057857e-07, 'epoch': 1.86} {'loss': 0.2815, 'learning_rate': 2.693676645452781e-07, 'epoch': 1.86} {'loss': 0.3186, 'learning_rate': 2.692902142940135e-07, 'epoch': 1.86} {'loss': 0.278, 'learning_rate': 2.6921277502686806e-07, 'epoch': 1.86} {'loss': 0.3177, 'learning_rate': 2.6913534674393283e-07, 'epoch': 1.86} {'loss': 0.3164, 'learning_rate': 2.690579294452911e-07, 'epoch': 1.86} {'loss': 0.4058, 'learning_rate': 2.6898052313103495e-07, 'epoch': 1.86} {'loss': 0.3041, 'learning_rate': 2.6890312780124885e-07, 'epoch': 1.86} {'loss': 0.2545, 'learning_rate': 2.688257434560193e-07, 'epoch': 1.86} {'loss': 0.3891, 'learning_rate': 2.687483700954363e-07, 'epoch': 1.86} {'loss': 0.2763, 'learning_rate': 2.686710077195842e-07, 'epoch': 1.86} {'loss': 0.2288, 'learning_rate': 2.6859365632855405e-07, 'epoch': 1.86} {'loss': 0.2509, 'learning_rate': 2.685163159224302e-07, 'epoch': 1.86} {'loss': 0.2042, 'learning_rate': 2.684389865013004e-07, 'epoch': 1.86} {'loss': 0.254, 'learning_rate': 2.683616680652534e-07, 'epoch': 1.86} {'loss': 0.3263, 'learning_rate': 2.682843606143748e-07, 'epoch': 1.86} {'loss': 0.3633, 'learning_rate': 2.682070641487533e-07, 'epoch': 1.86} {'loss': 0.2427, 'learning_rate': 2.6812977866847554e-07, 'epoch': 1.86} {'loss': 0.3118, 'learning_rate': 2.6805250417362704e-07, 'epoch': 1.86} {'loss': 0.2265, 'learning_rate': 2.679752406642988e-07, 'epoch': 1.86} {'loss': 0.2826, 'learning_rate': 2.678979881405752e-07, 'epoch': 1.86} {'loss': 0.3126, 'learning_rate': 2.6782074660254285e-07, 'epoch': 1.86} {'loss': 0.3987, 'learning_rate': 2.677435160502917e-07, 'epoch': 1.86} {'loss': 0.2902, 'learning_rate': 2.676662964839072e-07, 'epoch': 1.86} {'loss': 0.1849, 'learning_rate': 2.6758908790347705e-07, 'epoch': 1.86} {'loss': 0.1609, 'learning_rate': 2.6751189030908673e-07, 'epoch': 1.86} {'loss': 0.3215, 'learning_rate': 2.6743470370082624e-07, 'epoch': 1.86} {'loss': 0.3277, 'learning_rate': 2.673575280787799e-07, 'epoch': 1.86} {'loss': 0.3778, 'learning_rate': 2.6728036344303655e-07, 'epoch': 1.86} {'loss': 0.2854, 'learning_rate': 2.6720320979368274e-07, 'epoch': 1.86} {'loss': 0.3306, 'learning_rate': 2.6712606713080625e-07, 'epoch': 1.86} {'loss': 0.2747, 'learning_rate': 2.6704893545449363e-07, 'epoch': 1.86} {'loss': 0.3957, 'learning_rate': 2.6697181476483145e-07, 'epoch': 1.86} {'loss': 0.3089, 'learning_rate': 2.6689470506190863e-07, 'epoch': 1.86} {'loss': 0.3717, 'learning_rate': 2.6681760634580946e-07, 'epoch': 1.86} {'loss': 0.2228, 'learning_rate': 2.6674051861662277e-07, 'epoch': 1.86} {'loss': 0.2915, 'learning_rate': 2.6666344187443517e-07, 'epoch': 1.86} {'loss': 0.2742, 'learning_rate': 2.6658637611933433e-07, 'epoch': 1.86} {'loss': 0.3473, 'learning_rate': 2.6650932135140585e-07, 'epoch': 1.86} {'loss': 0.3848, 'learning_rate': 2.664322775707373e-07, 'epoch': 1.86} {'loss': 0.3952, 'learning_rate': 2.663552447774165e-07, 'epoch': 1.86} {'loss': 0.3555, 'learning_rate': 2.662782229715288e-07, 'epoch': 1.86} {'loss': 0.3151, 'learning_rate': 2.662012121531632e-07, 'epoch': 1.86} {'loss': 0.2671, 'learning_rate': 2.661242123224039e-07, 'epoch': 1.86} {'loss': 0.2558, 'learning_rate': 2.66047223479341e-07, 'epoch': 1.86} {'loss': 0.278, 'learning_rate': 2.659702456240587e-07, 'epoch': 1.86} {'loss': 0.3379, 'learning_rate': 2.6589327875664594e-07, 'epoch': 1.86} {'loss': 0.1667, 'learning_rate': 2.6581632287718704e-07, 'epoch': 1.86} {'loss': 0.3777, 'learning_rate': 2.65739377985772e-07, 'epoch': 1.86} {'loss': 0.2001, 'learning_rate': 2.656624440824851e-07, 'epoch': 1.86} {'loss': 0.3525, 'learning_rate': 2.655855211674152e-07, 'epoch': 1.86} {'loss': 0.3111, 'learning_rate': 2.655086092406478e-07, 'epoch': 1.86} {'loss': 0.3148, 'learning_rate': 2.654317083022706e-07, 'epoch': 1.86} {'loss': 0.4288, 'learning_rate': 2.6535481835236797e-07, 'epoch': 1.86} {'loss': 0.2522, 'learning_rate': 2.6527793939103095e-07, 'epoch': 1.86} {'loss': 0.3816, 'learning_rate': 2.6520107141834395e-07, 'epoch': 1.86} {'loss': 0.3962, 'learning_rate': 2.651242144343913e-07, 'epoch': 1.86} {'loss': 0.3305, 'learning_rate': 2.6504736843926513e-07, 'epoch': 1.86} {'loss': 0.2581, 'learning_rate': 2.649705334330466e-07, 'epoch': 1.86} {'loss': 0.4024, 'learning_rate': 2.648937094158277e-07, 'epoch': 1.86} {'loss': 0.1936, 'learning_rate': 2.648168963876907e-07, 'epoch': 1.86} {'loss': 0.5015, 'learning_rate': 2.6474009434872547e-07, 'epoch': 1.86} {'loss': 0.2673, 'learning_rate': 2.6466330329901534e-07, 'epoch': 1.86} {'loss': 0.2636, 'learning_rate': 2.645865232386513e-07, 'epoch': 1.86} {'loss': 0.2472, 'learning_rate': 2.6450975416771664e-07, 'epoch': 1.86} {'loss': 0.2095, 'learning_rate': 2.644329960863001e-07, 'epoch': 1.86} {'loss': 0.2558, 'learning_rate': 2.643562489944862e-07, 'epoch': 1.86} {'loss': 0.3393, 'learning_rate': 2.642795128923636e-07, 'epoch': 1.86} {'loss': 0.1936, 'learning_rate': 2.642027877800191e-07, 'epoch': 1.86} {'loss': 0.2883, 'learning_rate': 2.641260736575368e-07, 'epoch': 1.86} {'loss': 0.2068, 'learning_rate': 2.6404937052500577e-07, 'epoch': 1.86} {'loss': 0.3391, 'learning_rate': 2.6397267838251026e-07, 'epoch': 1.86} {'loss': 0.3842, 'learning_rate': 2.6389599723013913e-07, 'epoch': 1.86} {'loss': 0.3583, 'learning_rate': 2.6381932706797787e-07, 'epoch': 1.86} {'loss': 0.1868, 'learning_rate': 2.6374266789611304e-07, 'epoch': 1.86} {'loss': 0.3149, 'learning_rate': 2.6366601971463126e-07, 'epoch': 1.86} {'loss': 0.3391, 'learning_rate': 2.635893825236191e-07, 'epoch': 1.86} {'loss': 0.4028, 'learning_rate': 2.635127563231632e-07, 'epoch': 1.86} {'loss': 0.2765, 'learning_rate': 2.634361411133501e-07, 'epoch': 1.86} {'loss': 0.2573, 'learning_rate': 2.633595368942654e-07, 'epoch': 1.86} {'loss': 0.1825, 'learning_rate': 2.632829436659978e-07, 'epoch': 1.86} {'loss': 0.4989, 'learning_rate': 2.632063614286318e-07, 'epoch': 1.86} {'loss': 0.4755, 'learning_rate': 2.631297901822527e-07, 'epoch': 1.86} {'loss': 0.2993, 'learning_rate': 2.630532299269495e-07, 'epoch': 1.86} {'loss': 0.4085, 'learning_rate': 2.629766806628076e-07, 'epoch': 1.86} {'loss': 0.2831, 'learning_rate': 2.6290014238991356e-07, 'epoch': 1.86} {'loss': 0.2154, 'learning_rate': 2.628236151083541e-07, 'epoch': 1.86} {'loss': 0.2238, 'learning_rate': 2.627470988182146e-07, 'epoch': 1.86} {'loss': 0.2727, 'learning_rate': 2.626705935195817e-07, 'epoch': 1.86} {'loss': 0.2883, 'learning_rate': 2.625940992125431e-07, 'epoch': 1.86} {'loss': 0.212, 'learning_rate': 2.6251761589718315e-07, 'epoch': 1.86} {'loss': 0.2363, 'learning_rate': 2.624411435735896e-07, 'epoch': 1.86} {'loss': 0.2307, 'learning_rate': 2.62364682241848e-07, 'epoch': 1.86} {'loss': 0.3543, 'learning_rate': 2.6228823190204476e-07, 'epoch': 1.86} {'loss': 0.2398, 'learning_rate': 2.6221179255426777e-07, 'epoch': 1.86} {'loss': 0.299, 'learning_rate': 2.6213536419860017e-07, 'epoch': 1.86} {'loss': 0.3681, 'learning_rate': 2.62058946835132e-07, 'epoch': 1.86} {'loss': 0.1152, 'learning_rate': 2.619825404639453e-07, 'epoch': 1.86} {'loss': 0.4477, 'learning_rate': 2.6190614508513013e-07, 'epoch': 1.86} {'loss': 0.3577, 'learning_rate': 2.6182976069876966e-07, 'epoch': 1.86} {'loss': 0.3666, 'learning_rate': 2.617533873049538e-07, 'epoch': 1.86} {'loss': 0.4277, 'learning_rate': 2.616770249037648e-07, 'epoch': 1.86} {'loss': 0.3616, 'learning_rate': 2.6160067349529136e-07, 'epoch': 1.86} {'loss': 0.2496, 'learning_rate': 2.61524333079618e-07, 'epoch': 1.86} {'loss': 0.1498, 'learning_rate': 2.614480036568323e-07, 'epoch': 1.86} {'loss': 0.302, 'learning_rate': 2.6137168522701985e-07, 'epoch': 1.86} {'loss': 0.3134, 'learning_rate': 2.6129537779026713e-07, 'epoch': 1.86} {'loss': 0.3832, 'learning_rate': 2.6121908134666084e-07, 'epoch': 1.86} {'loss': 0.2028, 'learning_rate': 2.611427958962853e-07, 'epoch': 1.86} {'loss': 0.2978, 'learning_rate': 2.610665214392283e-07, 'epoch': 1.86} {'loss': 0.3129, 'learning_rate': 2.609902579755741e-07, 'epoch': 1.86} {'loss': 0.2393, 'learning_rate': 2.6091400550541047e-07, 'epoch': 1.86} {'loss': 0.2253, 'learning_rate': 2.608377640288229e-07, 'epoch': 1.86} {'loss': 0.3381, 'learning_rate': 2.6076153354589793e-07, 'epoch': 1.86} {'loss': 0.2782, 'learning_rate': 2.6068531405672117e-07, 'epoch': 1.86} {'loss': 0.3861, 'learning_rate': 2.6060910556137795e-07, 'epoch': 1.86} {'loss': 0.3456, 'learning_rate': 2.6053290805995503e-07, 'epoch': 1.86} {'loss': 0.3006, 'learning_rate': 2.6045672155254e-07, 'epoch': 1.86} {'loss': 0.2613, 'learning_rate': 2.60380546039215e-07, 'epoch': 1.86} {'loss': 0.2296, 'learning_rate': 2.603043815200701e-07, 'epoch': 1.86} {'loss': 0.313, 'learning_rate': 2.6022822799518957e-07, 'epoch': 1.86} {'loss': 0.5, 'learning_rate': 2.6015208546465777e-07, 'epoch': 1.86} {'loss': 0.2745, 'learning_rate': 2.6007595392856354e-07, 'epoch': 1.86} {'loss': 0.1441, 'learning_rate': 2.599998333869902e-07, 'epoch': 1.86} {'loss': 0.2687, 'learning_rate': 2.599237238400265e-07, 'epoch': 1.86} {'loss': 0.2908, 'learning_rate': 2.5984762528775467e-07, 'epoch': 1.86} {'loss': 0.341, 'learning_rate': 2.5977153773026344e-07, 'epoch': 1.86} {'loss': 0.4481, 'learning_rate': 2.5969546116763833e-07, 'epoch': 1.86} {'loss': 0.4185, 'learning_rate': 2.5961939559996484e-07, 'epoch': 1.86} {'loss': 0.3435, 'learning_rate': 2.5954334102732846e-07, 'epoch': 1.86} {'loss': 0.4451, 'learning_rate': 2.594672974498158e-07, 'epoch': 1.86} {'loss': 0.2555, 'learning_rate': 2.593912648675123e-07, 'epoch': 1.86} {'loss': 0.2997, 'learning_rate': 2.593152432805035e-07, 'epoch': 1.86} {'loss': 0.2999, 'learning_rate': 2.5923923268887597e-07, 'epoch': 1.86} {'loss': 0.3573, 'learning_rate': 2.591632330927141e-07, 'epoch': 1.86} {'loss': 0.4288, 'learning_rate': 2.5908724449210664e-07, 'epoch': 1.86} {'loss': 0.2146, 'learning_rate': 2.5901126688713474e-07, 'epoch': 1.86} {'loss': 0.2803, 'learning_rate': 2.589353002778894e-07, 'epoch': 1.86} {'loss': 0.2477, 'learning_rate': 2.5885934466445164e-07, 'epoch': 1.86} {'loss': 0.3671, 'learning_rate': 2.5878340004691026e-07, 'epoch': 1.86} {'loss': 0.2222, 'learning_rate': 2.587074664253508e-07, 'epoch': 1.86} {'loss': 0.3505, 'learning_rate': 2.5863154379985657e-07, 'epoch': 1.86} {'loss': 0.4467, 'learning_rate': 2.5855563217051625e-07, 'epoch': 1.86} {'loss': 0.1703, 'learning_rate': 2.5847973153741323e-07, 'epoch': 1.86} {'loss': 0.4018, 'learning_rate': 2.5840384190063515e-07, 'epoch': 1.86} {'loss': 0.3093, 'learning_rate': 2.583279632602653e-07, 'epoch': 1.86} {'loss': 0.3088, 'learning_rate': 2.5825209561639255e-07, 'epoch': 1.86} {'loss': 0.3335, 'learning_rate': 2.5817623896909893e-07, 'epoch': 1.86} {'loss': 0.1923, 'learning_rate': 2.581003933184734e-07, 'epoch': 1.86} {'loss': 0.3766, 'learning_rate': 2.580245586645991e-07, 'epoch': 1.86} {'loss': 0.2678, 'learning_rate': 2.579487350075627e-07, 'epoch': 1.86} {'loss': 0.1755, 'learning_rate': 2.5787292234744966e-07, 'epoch': 1.86} {'loss': 0.2733, 'learning_rate': 2.577971206843455e-07, 'epoch': 1.86} {'loss': 0.2337, 'learning_rate': 2.5772133001833674e-07, 'epoch': 1.86} {'loss': 0.2811, 'learning_rate': 2.576455503495057e-07, 'epoch': 1.86} {'loss': 0.2494, 'learning_rate': 2.575697816779421e-07, 'epoch': 1.86} {'loss': 0.3324, 'learning_rate': 2.574940240037294e-07, 'epoch': 1.86} {'loss': 0.3289, 'learning_rate': 2.574182773269529e-07, 'epoch': 1.86} {'loss': 0.3292, 'learning_rate': 2.5734254164769825e-07, 'epoch': 1.86} {'loss': 0.2626, 'learning_rate': 2.5726681696605306e-07, 'epoch': 1.86} {'loss': 0.2032, 'learning_rate': 2.571911032820984e-07, 'epoch': 1.86} {'loss': 0.3734, 'learning_rate': 2.571154005959242e-07, 'epoch': 1.86} {'loss': 0.2696, 'learning_rate': 2.5703970890761267e-07, 'epoch': 1.86} {'loss': 0.4002, 'learning_rate': 2.569640282172514e-07, 'epoch': 1.86} {'loss': 0.2284, 'learning_rate': 2.568883585249249e-07, 'epoch': 1.86} {'loss': 0.356, 'learning_rate': 2.5681269983071854e-07, 'epoch': 1.86} {'loss': 0.3014, 'learning_rate': 2.56737052134719e-07, 'epoch': 1.86} {'loss': 0.3672, 'learning_rate': 2.566614154370095e-07, 'epoch': 1.86} {'loss': 0.4453, 'learning_rate': 2.565857897376767e-07, 'epoch': 1.86} {'loss': 0.3346, 'learning_rate': 2.5651017503680486e-07, 'epoch': 1.86} {'loss': 0.3794, 'learning_rate': 2.564345713344818e-07, 'epoch': 1.86} {'loss': 0.4514, 'learning_rate': 2.563589786307896e-07, 'epoch': 1.86} {'loss': 0.2568, 'learning_rate': 2.562833969258172e-07, 'epoch': 1.86} {'loss': 0.3423, 'learning_rate': 2.562078262196455e-07, 'epoch': 1.86} {'loss': 0.2373, 'learning_rate': 2.561322665123644e-07, 'epoch': 1.86} {'loss': 0.3758, 'learning_rate': 2.560567178040563e-07, 'epoch': 1.86} {'loss': 0.3438, 'learning_rate': 2.5598118009480754e-07, 'epoch': 1.86} {'loss': 0.2793, 'learning_rate': 2.5590565338470265e-07, 'epoch': 1.86} {'loss': 0.3198, 'learning_rate': 2.5583013767382816e-07, 'epoch': 1.86} {'loss': 0.3177, 'learning_rate': 2.557546329622684e-07, 'epoch': 1.86} {'loss': 0.279, 'learning_rate': 2.556791392501079e-07, 'epoch': 1.86} {'loss': 0.4205, 'learning_rate': 2.5560365653743315e-07, 'epoch': 1.86} {'loss': 0.3606, 'learning_rate': 2.555281848243285e-07, 'epoch': 1.86} {'loss': 0.2892, 'learning_rate': 2.5545272411088065e-07, 'epoch': 1.86} {'loss': 0.3521, 'learning_rate': 2.5537727439717276e-07, 'epoch': 1.86} {'loss': 0.3584, 'learning_rate': 2.553018356832915e-07, 'epoch': 1.86} {'loss': 0.1981, 'learning_rate': 2.552264079693201e-07, 'epoch': 1.86} {'loss': 0.2277, 'learning_rate': 2.5515099125534623e-07, 'epoch': 1.86} {'loss': 0.2982, 'learning_rate': 2.5507558554145327e-07, 'epoch': 1.86} {'loss': 0.2192, 'learning_rate': 2.5500019082772774e-07, 'epoch': 1.86} {'loss': 0.3991, 'learning_rate': 2.549248071142518e-07, 'epoch': 1.86} {'loss': 0.3379, 'learning_rate': 2.548494344011154e-07, 'epoch': 1.86} {'loss': 0.2044, 'learning_rate': 2.547740726883996e-07, 'epoch': 1.86} {'loss': 0.4663, 'learning_rate': 2.5469872197618984e-07, 'epoch': 1.86} {'loss': 0.2426, 'learning_rate': 2.5462338226457384e-07, 'epoch': 1.86} {'loss': 0.3422, 'learning_rate': 2.5454805355363375e-07, 'epoch': 1.86} {'loss': 0.456, 'learning_rate': 2.5447273584345624e-07, 'epoch': 1.86} {'loss': 0.3008, 'learning_rate': 2.543974291341245e-07, 'epoch': 1.86} {'loss': 0.2399, 'learning_rate': 2.543221334257262e-07, 'epoch': 1.86} {'loss': 0.4033, 'learning_rate': 2.542468487183447e-07, 'epoch': 1.86} {'loss': 0.2597, 'learning_rate': 2.5417157501206546e-07, 'epoch': 1.86} {'loss': 0.4266, 'learning_rate': 2.5409631230697283e-07, 'epoch': 1.86} {'loss': 0.2531, 'learning_rate': 2.5402106060315234e-07, 'epoch': 1.86} {'loss': 0.2375, 'learning_rate': 2.5394581990068835e-07, 'epoch': 1.86} {'loss': 0.281, 'learning_rate': 2.5387059019966743e-07, 'epoch': 1.86} {'loss': 0.2933, 'learning_rate': 2.5379537150017174e-07, 'epoch': 1.86} {'loss': 0.2741, 'learning_rate': 2.5372016380228905e-07, 'epoch': 1.86} {'loss': 0.2871, 'learning_rate': 2.5364496710610364e-07, 'epoch': 1.86} {'loss': 0.327, 'learning_rate': 2.5356978141169773e-07, 'epoch': 1.86} {'loss': 0.3735, 'learning_rate': 2.5349460671915904e-07, 'epoch': 1.86} {'loss': 0.3319, 'learning_rate': 2.534194430285719e-07, 'epoch': 1.86} {'loss': 0.4167, 'learning_rate': 2.5334429034002075e-07, 'epoch': 1.86} {'loss': 0.3084, 'learning_rate': 2.5326914865358986e-07, 'epoch': 1.86} {'loss': 0.3681, 'learning_rate': 2.531940179693648e-07, 'epoch': 1.86} {'loss': 0.2763, 'learning_rate': 2.5311889828743e-07, 'epoch': 1.86} {'loss': 0.2598, 'learning_rate': 2.530437896078719e-07, 'epoch': 1.86} {'loss': 0.2184, 'learning_rate': 2.5296869193077167e-07, 'epoch': 1.86} {'loss': 0.3478, 'learning_rate': 2.528936052562181e-07, 'epoch': 1.86} {'loss': 0.5334, 'learning_rate': 2.528185295842933e-07, 'epoch': 1.86} {'loss': 0.3129, 'learning_rate': 2.5274346491508394e-07, 'epoch': 1.86} {'loss': 0.2809, 'learning_rate': 2.5266841124867326e-07, 'epoch': 1.86} {'loss': 0.2419, 'learning_rate': 2.525933685851456e-07, 'epoch': 1.86} {'loss': 0.3297, 'learning_rate': 2.525183369245876e-07, 'epoch': 1.86} {'loss': 0.2677, 'learning_rate': 2.524433162670814e-07, 'epoch': 1.86} {'loss': 0.309, 'learning_rate': 2.523683066127147e-07, 'epoch': 1.86} {'loss': 0.2438, 'learning_rate': 2.522933079615675e-07, 'epoch': 1.86} {'loss': 0.4678, 'learning_rate': 2.5221832031373075e-07, 'epoch': 1.86} {'loss': 0.2768, 'learning_rate': 2.521433436692855e-07, 'epoch': 1.86} {'loss': 0.2291, 'learning_rate': 2.520683780283162e-07, 'epoch': 1.86} {'loss': 0.2417, 'learning_rate': 2.5199342339090824e-07, 'epoch': 1.86} {'loss': 0.2639, 'learning_rate': 2.51918479757145e-07, 'epoch': 1.86} {'loss': 0.3475, 'learning_rate': 2.5184354712711414e-07, 'epoch': 1.86} {'loss': 0.4391, 'learning_rate': 2.5176862550089666e-07, 'epoch': 1.86} {'loss': 0.272, 'learning_rate': 2.516937148785792e-07, 'epoch': 1.86} {'loss': 0.2371, 'learning_rate': 2.51618815260245e-07, 'epoch': 1.86} {'loss': 0.3868, 'learning_rate': 2.515439266459807e-07, 'epoch': 1.86} {'loss': 0.2793, 'learning_rate': 2.5146904903586846e-07, 'epoch': 1.86} {'loss': 0.3047, 'learning_rate': 2.513941824299948e-07, 'epoch': 1.86} {'loss': 0.2323, 'learning_rate': 2.5131932682844194e-07, 'epoch': 1.86} {'loss': 0.2386, 'learning_rate': 2.512444822312976e-07, 'epoch': 1.86} {'loss': 0.2694, 'learning_rate': 2.5116964863864393e-07, 'epoch': 1.86} {'loss': 0.2039, 'learning_rate': 2.510948260505652e-07, 'epoch': 1.86} {'loss': 0.3215, 'learning_rate': 2.5102001446714707e-07, 'epoch': 1.86} {'loss': 0.1651, 'learning_rate': 2.5094521388847383e-07, 'epoch': 1.86} {'loss': 0.3847, 'learning_rate': 2.508704243146287e-07, 'epoch': 1.86} {'loss': 0.1404, 'learning_rate': 2.5079564574569723e-07, 'epoch': 1.86} {'loss': 0.256, 'learning_rate': 2.507208781817638e-07, 'epoch': 1.86} {'loss': 0.3272, 'learning_rate': 2.506461216229128e-07, 'epoch': 1.86} {'loss': 0.363, 'learning_rate': 2.5057137606922855e-07, 'epoch': 1.86} {'loss': 0.2233, 'learning_rate': 2.5049664152079436e-07, 'epoch': 1.86} {'loss': 0.2473, 'learning_rate': 2.504219179776957e-07, 'epoch': 1.86} {'loss': 0.1899, 'learning_rate': 2.503472054400169e-07, 'epoch': 1.86} {'loss': 0.381, 'learning_rate': 2.502725039078424e-07, 'epoch': 1.86} {'loss': 0.3111, 'learning_rate': 2.501978133812566e-07, 'epoch': 1.86} {'loss': 0.17, 'learning_rate': 2.501231338603427e-07, 'epoch': 1.86} {'loss': 0.3069, 'learning_rate': 2.5004846534518624e-07, 'epoch': 1.86} {'loss': 0.2316, 'learning_rate': 2.4997380783587043e-07, 'epoch': 1.86} {'loss': 0.2743, 'learning_rate': 2.498991613324808e-07, 'epoch': 1.86} {'loss': 0.3034, 'learning_rate': 2.4982452583510063e-07, 'epoch': 1.86} {'loss': 0.408, 'learning_rate': 2.4974990134381537e-07, 'epoch': 1.86} {'loss': 0.2401, 'learning_rate': 2.496752878587061e-07, 'epoch': 1.86} {'loss': 0.2485, 'learning_rate': 2.496006853798616e-07, 'epoch': 1.86} {'loss': 0.3837, 'learning_rate': 2.495260939073629e-07, 'epoch': 1.86} {'loss': 0.3462, 'learning_rate': 2.4945151344129557e-07, 'epoch': 1.86} {'loss': 0.3873, 'learning_rate': 2.4937694398174173e-07, 'epoch': 1.86} {'loss': 0.34, 'learning_rate': 2.49302385528789e-07, 'epoch': 1.86} {'loss': 0.29, 'learning_rate': 2.492278380825197e-07, 'epoch': 1.86} {'loss': 0.3424, 'learning_rate': 2.49153301643017e-07, 'epoch': 1.86} {'loss': 0.2228, 'learning_rate': 2.4907877621036636e-07, 'epoch': 1.86} {'loss': 0.3274, 'learning_rate': 2.490042617846511e-07, 'epoch': 1.86} {'loss': 0.2606, 'learning_rate': 2.489297583659567e-07, 'epoch': 1.86} {'loss': 0.3158, 'learning_rate': 2.4885526595436525e-07, 'epoch': 1.86} {'loss': 0.2155, 'learning_rate': 2.487807845499635e-07, 'epoch': 1.86} {'loss': 0.3581, 'learning_rate': 2.487063141528323e-07, 'epoch': 1.86} {'loss': 0.3386, 'learning_rate': 2.486318547630584e-07, 'epoch': 1.86} {'loss': 0.2209, 'learning_rate': 2.485574063807239e-07, 'epoch': 1.86} {'loss': 0.4392, 'learning_rate': 2.484829690059154e-07, 'epoch': 1.86} {'loss': 0.2737, 'learning_rate': 2.4840854263871286e-07, 'epoch': 1.86} {'loss': 0.267, 'learning_rate': 2.48334127279205e-07, 'epoch': 1.86} {'loss': 0.2593, 'learning_rate': 2.4825972292747304e-07, 'epoch': 1.86} {'loss': 0.3385, 'learning_rate': 2.481853295836012e-07, 'epoch': 1.86} {'loss': 0.4035, 'learning_rate': 2.481109472476739e-07, 'epoch': 1.86} {'loss': 0.405, 'learning_rate': 2.480365759197745e-07, 'epoch': 1.86} {'loss': 0.2938, 'learning_rate': 2.4796221559998726e-07, 'epoch': 1.86} {'loss': 0.4115, 'learning_rate': 2.478878662883966e-07, 'epoch': 1.86} {'loss': 0.2391, 'learning_rate': 2.4781352798508574e-07, 'epoch': 1.86} {'loss': 0.3043, 'learning_rate': 2.4773920069013913e-07, 'epoch': 1.86} {'loss': 0.3315, 'learning_rate': 2.4766488440364113e-07, 'epoch': 1.86} {'loss': 0.3161, 'learning_rate': 2.4759057912567385e-07, 'epoch': 1.86} {'loss': 0.3025, 'learning_rate': 2.4751628485632395e-07, 'epoch': 1.86} {'loss': 0.3856, 'learning_rate': 2.474420015956713e-07, 'epoch': 1.86} {'loss': 0.2535, 'learning_rate': 2.4736772934380484e-07, 'epoch': 1.86} {'loss': 0.1376, 'learning_rate': 2.4729346810080435e-07, 'epoch': 1.86} {'loss': 0.3343, 'learning_rate': 2.472192178667543e-07, 'epoch': 1.86} {'loss': 0.2215, 'learning_rate': 2.4714497864174015e-07, 'epoch': 1.86} {'loss': 0.3286, 'learning_rate': 2.4707075042584404e-07, 'epoch': 1.86} {'loss': 0.3866, 'learning_rate': 2.469965332191504e-07, 'epoch': 1.86} {'loss': 0.4196, 'learning_rate': 2.4692232702174356e-07, 'epoch': 1.86} {'loss': 0.2453, 'learning_rate': 2.468481318337068e-07, 'epoch': 1.86} {'loss': 0.3514, 'learning_rate': 2.467739476551234e-07, 'epoch': 1.86} {'loss': 0.2409, 'learning_rate': 2.466997744860777e-07, 'epoch': 1.86} {'loss': 0.2369, 'learning_rate': 2.4662561232665306e-07, 'epoch': 1.86} {'loss': 0.3081, 'learning_rate': 2.4655146117693375e-07, 'epoch': 1.86} {'loss': 0.2066, 'learning_rate': 2.4647732103700305e-07, 'epoch': 1.86} {'loss': 0.203, 'learning_rate': 2.464031919069454e-07, 'epoch': 1.86} {'loss': 0.2702, 'learning_rate': 2.46329073786844e-07, 'epoch': 1.86} {'loss': 0.2315, 'learning_rate': 2.4625496667678106e-07, 'epoch': 1.86} {'loss': 0.2893, 'learning_rate': 2.46180870576842e-07, 'epoch': 1.86} {'loss': 0.2358, 'learning_rate': 2.4610678548710907e-07, 'epoch': 1.86} {'loss': 0.4351, 'learning_rate': 2.4603271140766883e-07, 'epoch': 1.86} {'loss': 0.2826, 'learning_rate': 2.459586483386012e-07, 'epoch': 1.86} {'loss': 0.3717, 'learning_rate': 2.4588459627999164e-07, 'epoch': 1.86} {'loss': 0.437, 'learning_rate': 2.4581055523192345e-07, 'epoch': 1.86} {'loss': 0.2288, 'learning_rate': 2.45736525194481e-07, 'epoch': 1.86} {'loss': 0.2853, 'learning_rate': 2.4566250616774643e-07, 'epoch': 1.86} {'loss': 0.3661, 'learning_rate': 2.455884981518053e-07, 'epoch': 1.86} {'loss': 0.3054, 'learning_rate': 2.4551450114673856e-07, 'epoch': 1.86} {'loss': 0.3073, 'learning_rate': 2.454405151526318e-07, 'epoch': 1.86} {'loss': 0.3034, 'learning_rate': 2.453665401695682e-07, 'epoch': 1.86} {'loss': 0.2824, 'learning_rate': 2.452925761976299e-07, 'epoch': 1.86} {'loss': 0.2582, 'learning_rate': 2.4521862323690135e-07, 'epoch': 1.86} {'loss': 0.2624, 'learning_rate': 2.451446812874658e-07, 'epoch': 1.86} {'loss': 0.3224, 'learning_rate': 2.4507075034940763e-07, 'epoch': 1.86} {'loss': 0.4353, 'learning_rate': 2.4499683042280896e-07, 'epoch': 1.86} {'loss': 0.3464, 'learning_rate': 2.449229215077542e-07, 'epoch': 1.86} {'loss': 0.3653, 'learning_rate': 2.448490236043255e-07, 'epoch': 1.86} {'loss': 0.3494, 'learning_rate': 2.4477513671260944e-07, 'epoch': 1.86} {'loss': 0.3054, 'learning_rate': 2.44701260832686e-07, 'epoch': 1.86} {'loss': 0.4432, 'learning_rate': 2.4462739596463946e-07, 'epoch': 1.86} {'loss': 0.2072, 'learning_rate': 2.445535421085543e-07, 'epoch': 1.86} {'loss': 0.3526, 'learning_rate': 2.4447969926451155e-07, 'epoch': 1.86} {'loss': 0.2572, 'learning_rate': 2.4440586743259777e-07, 'epoch': 1.86} {'loss': 0.174, 'learning_rate': 2.44332046612894e-07, 'epoch': 1.86} {'loss': 0.2411, 'learning_rate': 2.4425823680548466e-07, 'epoch': 1.86} {'loss': 0.2673, 'learning_rate': 2.4418443801045187e-07, 'epoch': 1.86} {'loss': 0.3241, 'learning_rate': 2.4411065022788004e-07, 'epoch': 1.86} {'loss': 0.2756, 'learning_rate': 2.4403687345785243e-07, 'epoch': 1.86} {'loss': 0.3354, 'learning_rate': 2.4396310770045227e-07, 'epoch': 1.86} {'loss': 0.2136, 'learning_rate': 2.4388935295576066e-07, 'epoch': 1.86} {'loss': 0.2365, 'learning_rate': 2.438156092238653e-07, 'epoch': 1.86} {'loss': 0.2955, 'learning_rate': 2.4374187650484605e-07, 'epoch': 1.86} {'loss': 0.4129, 'learning_rate': 2.4366815479878625e-07, 'epoch': 1.86} {'loss': 0.2631, 'learning_rate': 2.435944441057703e-07, 'epoch': 1.86} {'loss': 0.2784, 'learning_rate': 2.435207444258803e-07, 'epoch': 1.86} {'loss': 0.3348, 'learning_rate': 2.434470557592017e-07, 'epoch': 1.86} {'loss': 0.3439, 'learning_rate': 2.433733781058145e-07, 'epoch': 1.86} {'loss': 0.2975, 'learning_rate': 2.4329971146580425e-07, 'epoch': 1.86} {'loss': 0.3004, 'learning_rate': 2.43226055839253e-07, 'epoch': 1.86} {'loss': 0.3162, 'learning_rate': 2.431524112262451e-07, 'epoch': 1.86} {'loss': 0.3116, 'learning_rate': 2.430787776268617e-07, 'epoch': 1.86} {'loss': 0.2028, 'learning_rate': 2.4300515504118714e-07, 'epoch': 1.86} {'loss': 0.3821, 'learning_rate': 2.429315434693047e-07, 'epoch': 1.86} {'loss': 0.2292, 'learning_rate': 2.428579429112965e-07, 'epoch': 1.86} {'loss': 0.4712, 'learning_rate': 2.4278435336724804e-07, 'epoch': 1.86} {'loss': 0.108, 'learning_rate': 2.4271077483723816e-07, 'epoch': 1.86} {'loss': 0.4241, 'learning_rate': 2.4263720732135455e-07, 'epoch': 1.86} {'loss': 0.2693, 'learning_rate': 2.4256365081967603e-07, 'epoch': 1.86} {'loss': 0.3239, 'learning_rate': 2.4249010533228923e-07, 'epoch': 1.86} {'loss': 0.4197, 'learning_rate': 2.424165708592752e-07, 'epoch': 1.86} {'loss': 0.3424, 'learning_rate': 2.4234304740071824e-07, 'epoch': 1.86} {'loss': 0.3803, 'learning_rate': 2.4226953495669837e-07, 'epoch': 1.86} {'loss': 0.2404, 'learning_rate': 2.4219603352730214e-07, 'epoch': 1.86} {'loss': 0.4359, 'learning_rate': 2.421225431126106e-07, 'epoch': 1.86} {'loss': 0.4474, 'learning_rate': 2.420490637127082e-07, 'epoch': 1.86} {'loss': 0.2665, 'learning_rate': 2.4197559532767476e-07, 'epoch': 1.86} {'loss': 0.3899, 'learning_rate': 2.41902137957597e-07, 'epoch': 1.86} {'loss': 0.4281, 'learning_rate': 2.4182869160255696e-07, 'epoch': 1.86} {'loss': 0.3525, 'learning_rate': 2.4175525626263465e-07, 'epoch': 1.86} {'loss': 0.3225, 'learning_rate': 2.416818319379166e-07, 'epoch': 1.86} {'loss': 0.1841, 'learning_rate': 2.416084186284828e-07, 'epoch': 1.86} {'loss': 0.2623, 'learning_rate': 2.415350163344188e-07, 'epoch': 1.86} {'loss': 0.1588, 'learning_rate': 2.414616250558044e-07, 'epoch': 1.86} {'loss': 0.3122, 'learning_rate': 2.4138824479272517e-07, 'epoch': 1.86} {'loss': 0.3773, 'learning_rate': 2.413148755452621e-07, 'epoch': 1.86} {'loss': 0.3242, 'learning_rate': 2.4124151731350077e-07, 'epoch': 1.86} {'loss': 0.1854, 'learning_rate': 2.411681700975199e-07, 'epoch': 1.86} {'loss': 0.2812, 'learning_rate': 2.4109483389740616e-07, 'epoch': 1.86} {'loss': 0.2063, 'learning_rate': 2.410215087132395e-07, 'epoch': 1.86} {'loss': 0.3217, 'learning_rate': 2.409481945451042e-07, 'epoch': 1.86} {'loss': 0.2248, 'learning_rate': 2.408748913930836e-07, 'epoch': 1.86} {'loss': 0.2208, 'learning_rate': 2.4080159925725763e-07, 'epoch': 1.86} {'loss': 0.2131, 'learning_rate': 2.407283181377118e-07, 'epoch': 1.86} {'loss': 0.2546, 'learning_rate': 2.406550480345282e-07, 'epoch': 1.86} {'loss': 0.4599, 'learning_rate': 2.4058178894778903e-07, 'epoch': 1.86} {'loss': 0.2165, 'learning_rate': 2.4050854087757645e-07, 'epoch': 1.86} {'loss': 0.3024, 'learning_rate': 2.4043530382397487e-07, 'epoch': 1.86} {'loss': 0.4233, 'learning_rate': 2.403620777870641e-07, 'epoch': 1.86} {'loss': 0.2593, 'learning_rate': 2.402888627669309e-07, 'epoch': 1.86} {'loss': 0.2569, 'learning_rate': 2.402156587636539e-07, 'epoch': 1.86} {'loss': 0.3214, 'learning_rate': 2.4014246577731994e-07, 'epoch': 1.86} {'loss': 0.2388, 'learning_rate': 2.4006928380800654e-07, 'epoch': 1.86} {'loss': 0.2846, 'learning_rate': 2.399961128558004e-07, 'epoch': 1.86} {'loss': 0.3197, 'learning_rate': 2.399229529207836e-07, 'epoch': 1.86} {'loss': 0.2838, 'learning_rate': 2.3984980400303613e-07, 'epoch': 1.86} {'loss': 0.2969, 'learning_rate': 2.3977666610264236e-07, 'epoch': 1.86} {'loss': 0.1496, 'learning_rate': 2.397035392196856e-07, 'epoch': 1.86} {'loss': 0.2671, 'learning_rate': 2.396304233542468e-07, 'epoch': 1.86} {'loss': 0.3645, 'learning_rate': 2.395573185064093e-07, 'epoch': 1.86} {'loss': 0.3254, 'learning_rate': 2.3948422467625633e-07, 'epoch': 1.86} {'loss': 0.2663, 'learning_rate': 2.3941114186386895e-07, 'epoch': 1.86} {'loss': 0.3185, 'learning_rate': 2.393380700693304e-07, 'epoch': 1.86} {'loss': 0.2212, 'learning_rate': 2.392650092927229e-07, 'epoch': 1.86} {'loss': 0.4507, 'learning_rate': 2.391919595341297e-07, 'epoch': 1.86} {'loss': 0.3157, 'learning_rate': 2.3911892079363174e-07, 'epoch': 1.86} {'loss': 0.3288, 'learning_rate': 2.3904589307131355e-07, 'epoch': 1.86} {'loss': 0.303, 'learning_rate': 2.389728763672561e-07, 'epoch': 1.86} {'loss': 0.3287, 'learning_rate': 2.388998706815415e-07, 'epoch': 1.86} {'loss': 0.2189, 'learning_rate': 2.3882687601425427e-07, 'epoch': 1.86} {'loss': 0.2284, 'learning_rate': 2.387538923654731e-07, 'epoch': 1.86} {'loss': 0.2156, 'learning_rate': 2.3868091973528465e-07, 'epoch': 1.86} {'loss': 0.2658, 'learning_rate': 2.386079581237677e-07, 'epoch': 1.86} {'loss': 0.3011, 'learning_rate': 2.3853500753100666e-07, 'epoch': 1.87} {'loss': 0.5007, 'learning_rate': 2.384620679570837e-07, 'epoch': 1.87} {'loss': 0.2478, 'learning_rate': 2.3838913940208096e-07, 'epoch': 1.87} {'loss': 0.2806, 'learning_rate': 2.383162218660795e-07, 'epoch': 1.87} {'loss': 0.3382, 'learning_rate': 2.3824331534916369e-07, 'epoch': 1.87} {'loss': 0.2542, 'learning_rate': 2.3817041985141455e-07, 'epoch': 1.87} {'loss': 0.2349, 'learning_rate': 2.3809753537291536e-07, 'epoch': 1.87} {'loss': 0.3422, 'learning_rate': 2.3802466191374828e-07, 'epoch': 1.87} {'loss': 0.3004, 'learning_rate': 2.3795179947399328e-07, 'epoch': 1.87} {'loss': 0.199, 'learning_rate': 2.378789480537358e-07, 'epoch': 1.87} {'loss': 0.2893, 'learning_rate': 2.3780610765305467e-07, 'epoch': 1.87} {'loss': 0.2789, 'learning_rate': 2.3773327827203652e-07, 'epoch': 1.87} {'loss': 0.5605, 'learning_rate': 2.3766045991075904e-07, 'epoch': 1.87} {'loss': 0.2937, 'learning_rate': 2.375876525693077e-07, 'epoch': 1.87} {'loss': 0.2309, 'learning_rate': 2.375148562477636e-07, 'epoch': 1.87} {'loss': 0.1871, 'learning_rate': 2.3744207094620775e-07, 'epoch': 1.87} {'loss': 0.3068, 'learning_rate': 2.373692966647245e-07, 'epoch': 1.87} {'loss': 0.3547, 'learning_rate': 2.3729653340339387e-07, 'epoch': 1.87} {'loss': 0.3669, 'learning_rate': 2.3722378116230015e-07, 'epoch': 1.87} {'loss': 0.2899, 'learning_rate': 2.3715103994152332e-07, 'epoch': 1.87} {'loss': 0.2816, 'learning_rate': 2.3707830974114664e-07, 'epoch': 1.87} {'loss': 0.3992, 'learning_rate': 2.3700559056125228e-07, 'epoch': 1.87} {'loss': 0.3228, 'learning_rate': 2.3693288240192236e-07, 'epoch': 1.87} {'loss': 0.3791, 'learning_rate': 2.3686018526323796e-07, 'epoch': 1.87} {'loss': 0.2665, 'learning_rate': 2.3678749914528232e-07, 'epoch': 1.87} {'loss': 0.2843, 'learning_rate': 2.367148240481365e-07, 'epoch': 1.87} {'loss': 0.2273, 'learning_rate': 2.3664215997188378e-07, 'epoch': 1.87} {'loss': 0.3059, 'learning_rate': 2.365695069166063e-07, 'epoch': 1.87} {'loss': 0.2978, 'learning_rate': 2.3649686488238287e-07, 'epoch': 1.87} {'loss': 0.1818, 'learning_rate': 2.3642423386930014e-07, 'epoch': 1.87} {'loss': 0.3517, 'learning_rate': 2.3635161387743687e-07, 'epoch': 1.87} {'loss': 0.2736, 'learning_rate': 2.362790049068764e-07, 'epoch': 1.87} {'loss': 0.2646, 'learning_rate': 2.3620640695769858e-07, 'epoch': 1.87} {'loss': 0.299, 'learning_rate': 2.3613382002998896e-07, 'epoch': 1.87} {'loss': 0.3388, 'learning_rate': 2.3606124412382637e-07, 'epoch': 1.87} {'loss': 0.3444, 'learning_rate': 2.3598867923929513e-07, 'epoch': 1.87} {'loss': 0.3684, 'learning_rate': 2.3591612537647524e-07, 'epoch': 1.87} {'loss': 0.2117, 'learning_rate': 2.3584358253544992e-07, 'epoch': 1.87} {'loss': 0.2216, 'learning_rate': 2.3577105071629913e-07, 'epoch': 1.87} {'loss': 0.2781, 'learning_rate': 2.3569852991910726e-07, 'epoch': 1.87} {'loss': 0.352, 'learning_rate': 2.356260201439553e-07, 'epoch': 1.87} {'loss': 0.2627, 'learning_rate': 2.3555352139092326e-07, 'epoch': 1.87} {'loss': 0.2938, 'learning_rate': 2.3548103366009656e-07, 'epoch': 1.87} {'loss': 0.3612, 'learning_rate': 2.3540855695155297e-07, 'epoch': 1.87} {'loss': 0.1765, 'learning_rate': 2.3533609126537793e-07, 'epoch': 1.87} {'loss': 0.2217, 'learning_rate': 2.3526363660164918e-07, 'epoch': 1.87} {'loss': 0.3585, 'learning_rate': 2.3519119296045335e-07, 'epoch': 1.87} {'loss': 0.3596, 'learning_rate': 2.351187603418681e-07, 'epoch': 1.87} {'loss': 0.3447, 'learning_rate': 2.3504633874597893e-07, 'epoch': 1.87} {'loss': 0.1303, 'learning_rate': 2.3497392817286357e-07, 'epoch': 1.87} {'loss': 0.4064, 'learning_rate': 2.3490152862260752e-07, 'epoch': 1.87} {'loss': 0.2118, 'learning_rate': 2.3482914009528845e-07, 'epoch': 1.87} {'loss': 0.3685, 'learning_rate': 2.34756762590993e-07, 'epoch': 1.87} {'loss': 0.3767, 'learning_rate': 2.3468439610979886e-07, 'epoch': 1.87} {'loss': 0.1402, 'learning_rate': 2.3461204065178822e-07, 'epoch': 1.87} {'loss': 0.2056, 'learning_rate': 2.3453969621704543e-07, 'epoch': 1.87} {'loss': 0.3428, 'learning_rate': 2.344673628056493e-07, 'epoch': 1.87} {'loss': 0.3489, 'learning_rate': 2.3439504041768202e-07, 'epoch': 1.87} {'loss': 0.4159, 'learning_rate': 2.3432272905322683e-07, 'epoch': 1.87} {'loss': 0.253, 'learning_rate': 2.342504287123637e-07, 'epoch': 1.87} {'loss': 0.324, 'learning_rate': 2.3417813939517475e-07, 'epoch': 1.87} {'loss': 0.2637, 'learning_rate': 2.3410586110174215e-07, 'epoch': 1.87} {'loss': 0.2754, 'learning_rate': 2.3403359383214586e-07, 'epoch': 1.87} {'loss': 0.3734, 'learning_rate': 2.3396133758646911e-07, 'epoch': 1.87} {'loss': 0.3355, 'learning_rate': 2.3388909236479295e-07, 'epoch': 1.87} {'loss': 0.3706, 'learning_rate': 2.3381685816719956e-07, 'epoch': 1.87} {'loss': 0.4224, 'learning_rate': 2.3374463499376886e-07, 'epoch': 1.87} {'loss': 0.2709, 'learning_rate': 2.3367242284458415e-07, 'epoch': 1.87} {'loss': 0.2022, 'learning_rate': 2.336002217197253e-07, 'epoch': 1.87} {'loss': 0.3822, 'learning_rate': 2.335280316192745e-07, 'epoch': 1.87} {'loss': 0.2009, 'learning_rate': 2.3345585254331503e-07, 'epoch': 1.87} {'loss': 0.2791, 'learning_rate': 2.3338368449192461e-07, 'epoch': 1.87} {'loss': 0.3667, 'learning_rate': 2.333115274651876e-07, 'epoch': 1.87} {'loss': 0.2968, 'learning_rate': 2.3323938146318503e-07, 'epoch': 1.87} {'loss': 0.3108, 'learning_rate': 2.3316724648599797e-07, 'epoch': 1.87} {'loss': 0.2114, 'learning_rate': 2.3309512253370747e-07, 'epoch': 1.87} {'loss': 0.4121, 'learning_rate': 2.3302300960639567e-07, 'epoch': 1.87} {'loss': 0.1859, 'learning_rate': 2.3295090770414253e-07, 'epoch': 1.87} {'loss': 0.3192, 'learning_rate': 2.328788168270324e-07, 'epoch': 1.87} {'loss': 0.2729, 'learning_rate': 2.32806736975143e-07, 'epoch': 1.87} {'loss': 0.3287, 'learning_rate': 2.327346681485587e-07, 'epoch': 1.87} {'loss': 0.2386, 'learning_rate': 2.326626103473595e-07, 'epoch': 1.87} {'loss': 0.4388, 'learning_rate': 2.3259056357162635e-07, 'epoch': 1.87} {'loss': 0.2388, 'learning_rate': 2.3251852782144146e-07, 'epoch': 1.87} {'loss': 0.2633, 'learning_rate': 2.3244650309688478e-07, 'epoch': 1.87} {'loss': 0.3832, 'learning_rate': 2.3237448939803954e-07, 'epoch': 1.87} {'loss': 0.2643, 'learning_rate': 2.3230248672498566e-07, 'epoch': 1.87} {'loss': 0.3873, 'learning_rate': 2.322304950778065e-07, 'epoch': 1.87} {'loss': 0.3457, 'learning_rate': 2.3215851445657966e-07, 'epoch': 1.87} {'loss': 0.2701, 'learning_rate': 2.320865448613896e-07, 'epoch': 1.87} {'loss': 0.3154, 'learning_rate': 2.320145862923151e-07, 'epoch': 1.87} {'loss': 0.3496, 'learning_rate': 2.3194263874943946e-07, 'epoch': 1.87} {'loss': 0.3494, 'learning_rate': 2.3187070223284258e-07, 'epoch': 1.87} {'loss': 0.315, 'learning_rate': 2.3179877674260777e-07, 'epoch': 1.87} {'loss': 0.1699, 'learning_rate': 2.317268622788138e-07, 'epoch': 1.87} {'loss': 0.3755, 'learning_rate': 2.3165495884154176e-07, 'epoch': 1.87} {'loss': 0.3863, 'learning_rate': 2.315830664308749e-07, 'epoch': 1.87} {'loss': 0.268, 'learning_rate': 2.3151118504689209e-07, 'epoch': 1.87} {'loss': 0.3093, 'learning_rate': 2.314393146896776e-07, 'epoch': 1.87} {'loss': 0.2928, 'learning_rate': 2.3136745535930817e-07, 'epoch': 1.87} {'loss': 0.3388, 'learning_rate': 2.3129560705586917e-07, 'epoch': 1.87} {'loss': 0.2583, 'learning_rate': 2.3122376977943838e-07, 'epoch': 1.87} {'loss': 0.3116, 'learning_rate': 2.3115194353009906e-07, 'epoch': 1.87} {'loss': 0.2027, 'learning_rate': 2.3108012830793114e-07, 'epoch': 1.87} {'loss': 0.3131, 'learning_rate': 2.3100832411301676e-07, 'epoch': 1.87} {'loss': 0.2265, 'learning_rate': 2.309365309454348e-07, 'epoch': 1.87} {'loss': 0.3371, 'learning_rate': 2.3086474880526955e-07, 'epoch': 1.87} {'loss': 0.3144, 'learning_rate': 2.3079297769260102e-07, 'epoch': 1.87} {'loss': 0.1473, 'learning_rate': 2.3072121760750686e-07, 'epoch': 1.87} {'loss': 0.2, 'learning_rate': 2.3064946855007264e-07, 'epoch': 1.87} {'loss': 0.2278, 'learning_rate': 2.3057773052037714e-07, 'epoch': 1.87} {'loss': 0.5025, 'learning_rate': 2.305060035185014e-07, 'epoch': 1.87} {'loss': 0.2904, 'learning_rate': 2.3043428754452534e-07, 'epoch': 1.87} {'loss': 0.3859, 'learning_rate': 2.303625825985334e-07, 'epoch': 1.87} {'loss': 0.3696, 'learning_rate': 2.3029088868060323e-07, 'epoch': 1.87} {'loss': 0.2893, 'learning_rate': 2.3021920579081702e-07, 'epoch': 1.87} {'loss': 0.2842, 'learning_rate': 2.3014753392925582e-07, 'epoch': 1.87} {'loss': 0.2457, 'learning_rate': 2.3007587309599956e-07, 'epoch': 1.87} {'loss': 0.3817, 'learning_rate': 2.3000422329113037e-07, 'epoch': 1.87} {'loss': 0.4182, 'learning_rate': 2.299325845147282e-07, 'epoch': 1.87} {'loss': 0.2719, 'learning_rate': 2.2986095676687414e-07, 'epoch': 1.87} {'loss': 0.2587, 'learning_rate': 2.2978934004764919e-07, 'epoch': 1.87} {'loss': 0.2413, 'learning_rate': 2.2971773435713551e-07, 'epoch': 1.87} {'loss': 0.2345, 'learning_rate': 2.2964613969541084e-07, 'epoch': 1.87} {'loss': 0.2664, 'learning_rate': 2.2957455606255952e-07, 'epoch': 1.87} {'loss': 0.244, 'learning_rate': 2.2950298345865818e-07, 'epoch': 1.87} {'loss': 0.2742, 'learning_rate': 2.294314218837923e-07, 'epoch': 1.87} {'loss': 0.2533, 'learning_rate': 2.2935987133803962e-07, 'epoch': 1.87} {'loss': 0.3062, 'learning_rate': 2.2928833182148113e-07, 'epoch': 1.87} {'loss': 0.3221, 'learning_rate': 2.2921680333419905e-07, 'epoch': 1.87} {'loss': 0.1965, 'learning_rate': 2.2914528587627216e-07, 'epoch': 1.87} {'loss': 0.3519, 'learning_rate': 2.2907377944778375e-07, 'epoch': 1.87} {'loss': 0.2556, 'learning_rate': 2.2900228404881152e-07, 'epoch': 1.87} {'loss': 0.2963, 'learning_rate': 2.2893079967943876e-07, 'epoch': 1.87} {'loss': 0.2684, 'learning_rate': 2.2885932633974427e-07, 'epoch': 1.87} {'loss': 0.3565, 'learning_rate': 2.2878786402981025e-07, 'epoch': 1.87} {'loss': 0.3012, 'learning_rate': 2.2871641274971546e-07, 'epoch': 1.87} {'loss': 0.3417, 'learning_rate': 2.286449724995421e-07, 'epoch': 1.87} {'loss': 0.413, 'learning_rate': 2.2857354327937121e-07, 'epoch': 1.87} {'loss': 0.2691, 'learning_rate': 2.2850212508928272e-07, 'epoch': 1.87} {'loss': 0.3521, 'learning_rate': 2.2843071792935655e-07, 'epoch': 1.87} {'loss': 0.4501, 'learning_rate': 2.2835932179967379e-07, 'epoch': 1.87} {'loss': 0.2206, 'learning_rate': 2.2828793670031656e-07, 'epoch': 1.87} {'loss': 0.2033, 'learning_rate': 2.282165626313626e-07, 'epoch': 1.87} {'loss': 0.3512, 'learning_rate': 2.2814519959289404e-07, 'epoch': 1.87} {'loss': 0.3396, 'learning_rate': 2.2807384758499196e-07, 'epoch': 1.87} {'loss': 0.282, 'learning_rate': 2.2800250660773625e-07, 'epoch': 1.87} {'loss': 0.4082, 'learning_rate': 2.279311766612069e-07, 'epoch': 1.87} {'loss': 0.2673, 'learning_rate': 2.2785985774548602e-07, 'epoch': 1.87} {'loss': 0.2117, 'learning_rate': 2.2778854986065137e-07, 'epoch': 1.87} {'loss': 0.2274, 'learning_rate': 2.2771725300678727e-07, 'epoch': 1.87} {'loss': 0.3162, 'learning_rate': 2.2764596718397035e-07, 'epoch': 1.87} {'loss': 0.3557, 'learning_rate': 2.2757469239228393e-07, 'epoch': 1.87} {'loss': 0.2717, 'learning_rate': 2.2750342863180784e-07, 'epoch': 1.87} {'loss': 0.3326, 'learning_rate': 2.2743217590262101e-07, 'epoch': 1.87} {'loss': 0.205, 'learning_rate': 2.2736093420480554e-07, 'epoch': 1.87} {'loss': 0.2756, 'learning_rate': 2.2728970353844026e-07, 'epoch': 1.87} {'loss': 0.2056, 'learning_rate': 2.2721848390360736e-07, 'epoch': 1.87} {'loss': 0.2595, 'learning_rate': 2.271472753003856e-07, 'epoch': 1.87} {'loss': 0.2927, 'learning_rate': 2.270760777288572e-07, 'epoch': 1.87} {'loss': 0.3848, 'learning_rate': 2.2700489118910097e-07, 'epoch': 1.87} {'loss': 0.3302, 'learning_rate': 2.2693371568119794e-07, 'epoch': 1.87} {'loss': 0.2638, 'learning_rate': 2.2686255120522803e-07, 'epoch': 1.87} {'loss': 0.2853, 'learning_rate': 2.2679139776127234e-07, 'epoch': 1.87} {'loss': 0.2018, 'learning_rate': 2.2672025534940967e-07, 'epoch': 1.87} {'loss': 0.4207, 'learning_rate': 2.2664912396972326e-07, 'epoch': 1.87} {'loss': 0.3705, 'learning_rate': 2.2657800362229088e-07, 'epoch': 1.87} {'loss': 0.3324, 'learning_rate': 2.2650689430719242e-07, 'epoch': 1.87} {'loss': 0.3078, 'learning_rate': 2.2643579602451004e-07, 'epoch': 1.87} {'loss': 0.1327, 'learning_rate': 2.263647087743215e-07, 'epoch': 1.87} {'loss': 0.2516, 'learning_rate': 2.262936325567111e-07, 'epoch': 1.87} {'loss': 0.3216, 'learning_rate': 2.2622256737175441e-07, 'epoch': 1.87} {'loss': 0.359, 'learning_rate': 2.2615151321953578e-07, 'epoch': 1.87} {'loss': 0.273, 'learning_rate': 2.260804701001318e-07, 'epoch': 1.87} {'loss': 0.4538, 'learning_rate': 2.2600943801362574e-07, 'epoch': 1.87} {'loss': 0.3724, 'learning_rate': 2.2593841696009532e-07, 'epoch': 1.87} {'loss': 0.2768, 'learning_rate': 2.258674069396227e-07, 'epoch': 1.87} {'loss': 0.2306, 'learning_rate': 2.2579640795228676e-07, 'epoch': 1.87} {'loss': 0.4128, 'learning_rate': 2.2572541999816843e-07, 'epoch': 1.87} {'loss': 0.3665, 'learning_rate': 2.2565444307734775e-07, 'epoch': 1.87} {'loss': 0.3163, 'learning_rate': 2.255834771899035e-07, 'epoch': 1.87} {'loss': 0.2541, 'learning_rate': 2.255125223359167e-07, 'epoch': 1.87} {'loss': 0.3662, 'learning_rate': 2.2544157851546843e-07, 'epoch': 1.87} {'loss': 0.1781, 'learning_rate': 2.2537064572863754e-07, 'epoch': 1.87} {'loss': 0.23, 'learning_rate': 2.2529972397550393e-07, 'epoch': 1.87} {'loss': 0.2727, 'learning_rate': 2.2522881325614866e-07, 'epoch': 1.87} {'loss': 0.2271, 'learning_rate': 2.2515791357065164e-07, 'epoch': 1.87} {'loss': 0.2522, 'learning_rate': 2.2508702491909172e-07, 'epoch': 1.87} {'loss': 0.2068, 'learning_rate': 2.2501614730154996e-07, 'epoch': 1.87} {'loss': 0.3547, 'learning_rate': 2.249452807181074e-07, 'epoch': 1.87} {'loss': 0.3611, 'learning_rate': 2.2487442516884174e-07, 'epoch': 1.87} {'loss': 0.3571, 'learning_rate': 2.2480358065383401e-07, 'epoch': 1.87} {'loss': 0.262, 'learning_rate': 2.2473274717316529e-07, 'epoch': 1.87} {'loss': 0.2753, 'learning_rate': 2.2466192472691218e-07, 'epoch': 1.87} {'loss': 0.2539, 'learning_rate': 2.2459111331515903e-07, 'epoch': 1.87} {'loss': 0.2937, 'learning_rate': 2.245203129379825e-07, 'epoch': 1.87} {'loss': 0.2176, 'learning_rate': 2.2444952359546468e-07, 'epoch': 1.87} {'loss': 0.3181, 'learning_rate': 2.2437874528768333e-07, 'epoch': 1.87} {'loss': 0.3418, 'learning_rate': 2.2430797801471947e-07, 'epoch': 1.87} {'loss': 0.3925, 'learning_rate': 2.242372217766531e-07, 'epoch': 1.87} {'loss': 0.3066, 'learning_rate': 2.2416647657356516e-07, 'epoch': 1.87} {'loss': 0.2528, 'learning_rate': 2.2409574240553234e-07, 'epoch': 1.87} {'loss': 0.2706, 'learning_rate': 2.2402501927263787e-07, 'epoch': 1.87} {'loss': 0.2478, 'learning_rate': 2.2395430717495947e-07, 'epoch': 1.87} {'loss': 0.2703, 'learning_rate': 2.238836061125782e-07, 'epoch': 1.87} {'loss': 0.4822, 'learning_rate': 2.2381291608557397e-07, 'epoch': 1.87} {'loss': 0.2652, 'learning_rate': 2.2374223709402453e-07, 'epoch': 1.87} {'loss': 0.2993, 'learning_rate': 2.2367156913801202e-07, 'epoch': 1.87} {'loss': 0.3226, 'learning_rate': 2.2360091221761416e-07, 'epoch': 1.87} {'loss': 0.2922, 'learning_rate': 2.235302663329131e-07, 'epoch': 1.87} {'loss': 0.338, 'learning_rate': 2.2345963148398653e-07, 'epoch': 1.87} {'loss': 0.3165, 'learning_rate': 2.2338900767091443e-07, 'epoch': 1.87} {'loss': 0.2139, 'learning_rate': 2.2331839489377671e-07, 'epoch': 1.87} {'loss': 0.2366, 'learning_rate': 2.2324779315265554e-07, 'epoch': 1.87} {'loss': 0.3228, 'learning_rate': 2.2317720244762754e-07, 'epoch': 1.87} {'loss': 0.315, 'learning_rate': 2.231066227787726e-07, 'epoch': 1.87} {'loss': 0.4699, 'learning_rate': 2.230360541461718e-07, 'epoch': 1.87} {'loss': 0.3665, 'learning_rate': 2.2296549654990396e-07, 'epoch': 1.87} {'loss': 0.2713, 'learning_rate': 2.2289494999004902e-07, 'epoch': 1.87} {'loss': 0.2522, 'learning_rate': 2.228244144666858e-07, 'epoch': 1.87} {'loss': 0.2677, 'learning_rate': 2.2275388997989534e-07, 'epoch': 1.87} {'loss': 0.3233, 'learning_rate': 2.2268337652975648e-07, 'epoch': 1.87} {'loss': 0.3775, 'learning_rate': 2.2261287411634914e-07, 'epoch': 1.87} {'loss': 0.3216, 'learning_rate': 2.2254238273975103e-07, 'epoch': 1.87} {'loss': 0.3723, 'learning_rate': 2.2247190240004545e-07, 'epoch': 1.87} {'loss': 0.3993, 'learning_rate': 2.2240143309730788e-07, 'epoch': 1.87} {'loss': 0.3911, 'learning_rate': 2.2233097483162046e-07, 'epoch': 1.87} {'loss': 0.3435, 'learning_rate': 2.2226052760306317e-07, 'epoch': 1.87} {'loss': 0.379, 'learning_rate': 2.2219009141171367e-07, 'epoch': 1.87} {'loss': 0.2216, 'learning_rate': 2.2211966625765192e-07, 'epoch': 1.87} {'loss': 0.2757, 'learning_rate': 2.2204925214095784e-07, 'epoch': 1.87} {'loss': 0.4398, 'learning_rate': 2.2197884906171142e-07, 'epoch': 1.87} {'loss': 0.324, 'learning_rate': 2.2190845701999032e-07, 'epoch': 1.87} {'loss': 0.4464, 'learning_rate': 2.2183807601587558e-07, 'epoch': 1.87} {'loss': 0.2985, 'learning_rate': 2.2176770604944607e-07, 'epoch': 1.87} {'loss': 0.3282, 'learning_rate': 2.2169734712078284e-07, 'epoch': 1.87} {'loss': 0.2931, 'learning_rate': 2.2162699922996135e-07, 'epoch': 1.87} {'loss': 0.3515, 'learning_rate': 2.2155666237706598e-07, 'epoch': 1.87} {'loss': 0.1848, 'learning_rate': 2.2148633656217222e-07, 'epoch': 1.87} {'loss': 0.2957, 'learning_rate': 2.2141602178536225e-07, 'epoch': 1.87} {'loss': 0.3831, 'learning_rate': 2.213457180467127e-07, 'epoch': 1.87} {'loss': 0.2798, 'learning_rate': 2.2127542534630453e-07, 'epoch': 1.87} {'loss': 0.4883, 'learning_rate': 2.2120514368421775e-07, 'epoch': 1.87} {'loss': 0.2484, 'learning_rate': 2.2113487306053005e-07, 'epoch': 1.87} {'loss': 0.2303, 'learning_rate': 2.210646134753225e-07, 'epoch': 1.87} {'loss': 0.3983, 'learning_rate': 2.2099436492867276e-07, 'epoch': 1.87} {'loss': 0.3568, 'learning_rate': 2.2092412742066082e-07, 'epoch': 1.87} {'loss': 0.3421, 'learning_rate': 2.208539009513655e-07, 'epoch': 1.87} {'loss': 0.4381, 'learning_rate': 2.2078368552086782e-07, 'epoch': 1.87} {'loss': 0.364, 'learning_rate': 2.2071348112924441e-07, 'epoch': 1.87} {'loss': 0.1578, 'learning_rate': 2.2064328777657628e-07, 'epoch': 1.87} {'loss': 0.3277, 'learning_rate': 2.205731054629423e-07, 'epoch': 1.87} {'loss': 0.3662, 'learning_rate': 2.205029341884224e-07, 'epoch': 1.87} {'loss': 0.3113, 'learning_rate': 2.2043277395309425e-07, 'epoch': 1.87} {'loss': 0.2271, 'learning_rate': 2.2036262475703785e-07, 'epoch': 1.87} {'loss': 0.2118, 'learning_rate': 2.2029248660033308e-07, 'epoch': 1.87} {'loss': 0.2452, 'learning_rate': 2.202223594830566e-07, 'epoch': 1.87} {'loss': 0.3384, 'learning_rate': 2.201522434052916e-07, 'epoch': 1.87} {'loss': 0.2614, 'learning_rate': 2.2008213836711257e-07, 'epoch': 1.87} {'loss': 0.4378, 'learning_rate': 2.200120443686038e-07, 'epoch': 1.87} {'loss': 0.1857, 'learning_rate': 2.1994196140983969e-07, 'epoch': 1.87} {'loss': 0.1898, 'learning_rate': 2.1987188949090244e-07, 'epoch': 1.87} {'loss': 0.307, 'learning_rate': 2.198018286118686e-07, 'epoch': 1.87} {'loss': 0.2703, 'learning_rate': 2.1973177877282038e-07, 'epoch': 1.87} {'loss': 0.3248, 'learning_rate': 2.1966173997383434e-07, 'epoch': 1.87} {'loss': 0.2415, 'learning_rate': 2.1959171221499042e-07, 'epoch': 1.87} {'loss': 0.4011, 'learning_rate': 2.195216954963686e-07, 'epoch': 1.87} {'loss': 0.296, 'learning_rate': 2.1945168981804542e-07, 'epoch': 1.87} {'loss': 0.378, 'learning_rate': 2.19381695180102e-07, 'epoch': 1.87} {'loss': 0.3556, 'learning_rate': 2.1931171158261712e-07, 'epoch': 1.87} {'loss': 0.4894, 'learning_rate': 2.1924173902566958e-07, 'epoch': 1.87} {'loss': 0.1635, 'learning_rate': 2.1917177750933715e-07, 'epoch': 1.87} {'loss': 0.2462, 'learning_rate': 2.1910182703370085e-07, 'epoch': 1.87} {'loss': 0.1924, 'learning_rate': 2.1903188759883732e-07, 'epoch': 1.87} {'loss': 0.2977, 'learning_rate': 2.1896195920482864e-07, 'epoch': 1.87} {'loss': 0.4459, 'learning_rate': 2.1889204185175038e-07, 'epoch': 1.87} {'loss': 0.226, 'learning_rate': 2.1882213553968467e-07, 'epoch': 1.87} {'loss': 0.2409, 'learning_rate': 2.18752240268707e-07, 'epoch': 1.87} {'loss': 0.1355, 'learning_rate': 2.1868235603889953e-07, 'epoch': 1.87} {'loss': 0.2233, 'learning_rate': 2.1861248285033998e-07, 'epoch': 1.87} {'loss': 0.2803, 'learning_rate': 2.1854262070310606e-07, 'epoch': 1.87} {'loss': 0.3107, 'learning_rate': 2.184727695972777e-07, 'epoch': 1.87} {'loss': 0.3722, 'learning_rate': 2.1840292953293262e-07, 'epoch': 1.87} {'loss': 0.2551, 'learning_rate': 2.183331005101519e-07, 'epoch': 1.87} {'loss': 0.3208, 'learning_rate': 2.182632825290121e-07, 'epoch': 1.87} {'loss': 0.2341, 'learning_rate': 2.1819347558959314e-07, 'epoch': 1.87} {'loss': 0.3165, 'learning_rate': 2.181236796919739e-07, 'epoch': 1.87} {'loss': 0.1654, 'learning_rate': 2.1805389483623319e-07, 'epoch': 1.87} {'loss': 0.2513, 'learning_rate': 2.179841210224487e-07, 'epoch': 1.87} {'loss': 0.3497, 'learning_rate': 2.179143582507015e-07, 'epoch': 1.87} {'loss': 0.1718, 'learning_rate': 2.178446065210671e-07, 'epoch': 1.87} {'loss': 0.224, 'learning_rate': 2.177748658336265e-07, 'epoch': 1.87} {'loss': 0.3212, 'learning_rate': 2.1770513618845858e-07, 'epoch': 1.87} {'loss': 0.3422, 'learning_rate': 2.17635417585641e-07, 'epoch': 1.87} {'loss': 0.3652, 'learning_rate': 2.1756571002525263e-07, 'epoch': 1.87} {'loss': 0.2742, 'learning_rate': 2.1749601350737226e-07, 'epoch': 1.87} {'loss': 0.265, 'learning_rate': 2.1742632803207987e-07, 'epoch': 1.87} {'loss': 0.3025, 'learning_rate': 2.173566535994509e-07, 'epoch': 1.87} {'loss': 0.319, 'learning_rate': 2.1728699020956757e-07, 'epoch': 1.87} {'loss': 0.3905, 'learning_rate': 2.1721733786250642e-07, 'epoch': 1.87} {'loss': 0.1806, 'learning_rate': 2.1714769655834632e-07, 'epoch': 1.87} {'loss': 0.3524, 'learning_rate': 2.170780662971661e-07, 'epoch': 1.87} {'loss': 0.3618, 'learning_rate': 2.1700844707904566e-07, 'epoch': 1.87} {'loss': 0.2765, 'learning_rate': 2.1693883890406053e-07, 'epoch': 1.87} {'loss': 0.211, 'learning_rate': 2.1686924177229286e-07, 'epoch': 1.87} {'loss': 0.2698, 'learning_rate': 2.1679965568381923e-07, 'epoch': 1.87} {'loss': 0.4054, 'learning_rate': 2.1673008063871738e-07, 'epoch': 1.87} {'loss': 0.372, 'learning_rate': 2.1666051663706833e-07, 'epoch': 1.87} {'loss': 0.1951, 'learning_rate': 2.165909636789476e-07, 'epoch': 1.87} {'loss': 0.2554, 'learning_rate': 2.1652142176443625e-07, 'epoch': 1.87} {'loss': 0.2304, 'learning_rate': 2.1645189089361085e-07, 'epoch': 1.87} {'loss': 0.3994, 'learning_rate': 2.1638237106655136e-07, 'epoch': 1.87} {'loss': 0.3003, 'learning_rate': 2.1631286228333547e-07, 'epoch': 1.87} {'loss': 0.4178, 'learning_rate': 2.1624336454404205e-07, 'epoch': 1.87} {'loss': 0.3361, 'learning_rate': 2.1617387784874987e-07, 'epoch': 1.87} {'loss': 0.2906, 'learning_rate': 2.161044021975367e-07, 'epoch': 1.87} {'loss': 0.3384, 'learning_rate': 2.1603493759048133e-07, 'epoch': 1.87} {'loss': 0.2772, 'learning_rate': 2.159654840276615e-07, 'epoch': 1.87} {'loss': 0.4866, 'learning_rate': 2.158960415091571e-07, 'epoch': 1.87} {'loss': 0.2307, 'learning_rate': 2.158266100350437e-07, 'epoch': 1.87} {'loss': 0.313, 'learning_rate': 2.1575718960540337e-07, 'epoch': 1.87} {'loss': 0.3146, 'learning_rate': 2.1568778022031167e-07, 'epoch': 1.87} {'loss': 0.3494, 'learning_rate': 2.156183818798485e-07, 'epoch': 1.87} {'loss': 0.2059, 'learning_rate': 2.1554899458409052e-07, 'epoch': 1.87} {'loss': 0.29, 'learning_rate': 2.154796183331187e-07, 'epoch': 1.87} {'loss': 0.2041, 'learning_rate': 2.1541025312700858e-07, 'epoch': 1.87} {'loss': 0.3666, 'learning_rate': 2.153408989658401e-07, 'epoch': 1.87} {'loss': 0.1467, 'learning_rate': 2.1527155584969096e-07, 'epoch': 1.87} {'loss': 0.2967, 'learning_rate': 2.1520222377863997e-07, 'epoch': 1.87} {'loss': 0.3355, 'learning_rate': 2.151329027527649e-07, 'epoch': 1.87} {'loss': 0.1543, 'learning_rate': 2.150635927721434e-07, 'epoch': 1.87} {'loss': 0.2211, 'learning_rate': 2.1499429383685543e-07, 'epoch': 1.87} {'loss': 0.3233, 'learning_rate': 2.1492500594697653e-07, 'epoch': 1.87} {'loss': 0.2887, 'learning_rate': 2.148557291025888e-07, 'epoch': 1.87} {'loss': 0.4435, 'learning_rate': 2.1478646330376662e-07, 'epoch': 1.87} {'loss': 0.256, 'learning_rate': 2.1471720855058996e-07, 'epoch': 1.87} {'loss': 0.3816, 'learning_rate': 2.1464796484313766e-07, 'epoch': 1.87} {'loss': 0.2932, 'learning_rate': 2.1457873218148627e-07, 'epoch': 1.87} {'loss': 0.3173, 'learning_rate': 2.1450951056571578e-07, 'epoch': 1.87} {'loss': 0.3243, 'learning_rate': 2.1444029999590167e-07, 'epoch': 1.87} {'loss': 0.3114, 'learning_rate': 2.1437110047212494e-07, 'epoch': 1.87} {'loss': 0.2438, 'learning_rate': 2.1430191199446115e-07, 'epoch': 1.87} {'loss': 0.3168, 'learning_rate': 2.1423273456299133e-07, 'epoch': 1.87} {'loss': 0.3045, 'learning_rate': 2.1416356817778984e-07, 'epoch': 1.87} {'loss': 0.3377, 'learning_rate': 2.1409441283893883e-07, 'epoch': 1.87} {'loss': 0.2305, 'learning_rate': 2.1402526854651273e-07, 'epoch': 1.87} {'loss': 0.3435, 'learning_rate': 2.1395613530059256e-07, 'epoch': 1.87} {'loss': 0.2521, 'learning_rate': 2.1388701310125382e-07, 'epoch': 1.87} {'loss': 0.3344, 'learning_rate': 2.1381790194857642e-07, 'epoch': 1.87} {'loss': 0.3229, 'learning_rate': 2.1374880184263701e-07, 'epoch': 1.87} {'loss': 0.404, 'learning_rate': 2.1367971278351551e-07, 'epoch': 1.87} {'loss': 0.306, 'learning_rate': 2.136106347712874e-07, 'epoch': 1.87} {'loss': 0.2546, 'learning_rate': 2.1354156780603373e-07, 'epoch': 1.87} {'loss': 0.4247, 'learning_rate': 2.134725118878289e-07, 'epoch': 1.87} {'loss': 0.2953, 'learning_rate': 2.1340346701675285e-07, 'epoch': 1.87} {'loss': 0.2367, 'learning_rate': 2.133344331928844e-07, 'epoch': 1.87} {'loss': 0.2823, 'learning_rate': 2.1326541041629901e-07, 'epoch': 1.87} {'loss': 0.3353, 'learning_rate': 2.1319639868707664e-07, 'epoch': 1.87} {'loss': 0.2862, 'learning_rate': 2.1312739800529392e-07, 'epoch': 1.87} {'loss': 0.3512, 'learning_rate': 2.1305840837102965e-07, 'epoch': 1.87} {'loss': 0.3393, 'learning_rate': 2.1298942978436156e-07, 'epoch': 1.87} {'loss': 0.4067, 'learning_rate': 2.1292046224536732e-07, 'epoch': 1.87} {'loss': 0.3146, 'learning_rate': 2.1285150575412472e-07, 'epoch': 1.87} {'loss': 0.369, 'learning_rate': 2.1278256031071143e-07, 'epoch': 1.87} {'loss': 0.2779, 'learning_rate': 2.1271362591520517e-07, 'epoch': 1.87} {'loss': 0.3174, 'learning_rate': 2.1264470256768478e-07, 'epoch': 1.87} {'loss': 0.3075, 'learning_rate': 2.1257579026822795e-07, 'epoch': 1.87} {'loss': 0.3499, 'learning_rate': 2.125068890169102e-07, 'epoch': 1.87} {'loss': 0.2762, 'learning_rate': 2.1243799881381256e-07, 'epoch': 1.87} {'loss': 0.3555, 'learning_rate': 2.1236911965901053e-07, 'epoch': 1.87} {'loss': 0.3167, 'learning_rate': 2.1230025155258293e-07, 'epoch': 1.87} {'loss': 0.3111, 'learning_rate': 2.122313944946064e-07, 'epoch': 1.87} {'loss': 0.3105, 'learning_rate': 2.1216254848515971e-07, 'epoch': 1.87} {'loss': 0.4419, 'learning_rate': 2.1209371352431952e-07, 'epoch': 1.87} {'loss': 0.2736, 'learning_rate': 2.120248896121657e-07, 'epoch': 1.87} {'loss': 0.2085, 'learning_rate': 2.1195607674877382e-07, 'epoch': 1.87} {'loss': 0.2008, 'learning_rate': 2.1188727493422267e-07, 'epoch': 1.87} {'loss': 0.3122, 'learning_rate': 2.1181848416858887e-07, 'epoch': 1.87} {'loss': 0.4044, 'learning_rate': 2.117497044519512e-07, 'epoch': 1.87} {'loss': 0.3305, 'learning_rate': 2.1168093578438631e-07, 'epoch': 1.87} {'loss': 0.3603, 'learning_rate': 2.116121781659719e-07, 'epoch': 1.87} {'loss': 0.3016, 'learning_rate': 2.1154343159678792e-07, 'epoch': 1.87} {'loss': 0.4294, 'learning_rate': 2.1147469607690762e-07, 'epoch': 1.87} {'loss': 0.2984, 'learning_rate': 2.1140597160641318e-07, 'epoch': 1.87} {'loss': 0.4804, 'learning_rate': 2.1133725818537786e-07, 'epoch': 1.87} {'loss': 0.2432, 'learning_rate': 2.1126855581388274e-07, 'epoch': 1.87} {'loss': 0.4343, 'learning_rate': 2.1119986449200435e-07, 'epoch': 1.87} {'loss': 0.3189, 'learning_rate': 2.1113118421981936e-07, 'epoch': 1.87} {'loss': 0.386, 'learning_rate': 2.110625149974055e-07, 'epoch': 1.87} {'loss': 0.3415, 'learning_rate': 2.1099385682484042e-07, 'epoch': 1.87} {'loss': 0.308, 'learning_rate': 2.1092520970220186e-07, 'epoch': 1.87} {'loss': 0.2261, 'learning_rate': 2.1085657362956868e-07, 'epoch': 1.87} {'loss': 0.2271, 'learning_rate': 2.1078794860701636e-07, 'epoch': 1.87} {'loss': 0.3431, 'learning_rate': 2.1071933463462145e-07, 'epoch': 1.87} {'loss': 0.345, 'learning_rate': 2.106507317124651e-07, 'epoch': 1.87} {'loss': 0.2824, 'learning_rate': 2.1058213984062048e-07, 'epoch': 1.87} {'loss': 0.3396, 'learning_rate': 2.105135590191687e-07, 'epoch': 1.87} {'loss': 0.2497, 'learning_rate': 2.1044498924818414e-07, 'epoch': 1.87} {'loss': 0.2177, 'learning_rate': 2.103764305277467e-07, 'epoch': 1.87} {'loss': 0.2957, 'learning_rate': 2.103078828579319e-07, 'epoch': 1.87} {'loss': 0.299, 'learning_rate': 2.1023934623881858e-07, 'epoch': 1.87} {'loss': 0.3125, 'learning_rate': 2.1017082067048332e-07, 'epoch': 1.87} {'loss': 0.4057, 'learning_rate': 2.1010230615300386e-07, 'epoch': 1.87} {'loss': 0.2277, 'learning_rate': 2.1003380268645568e-07, 'epoch': 1.87} {'loss': 0.3849, 'learning_rate': 2.099653102709198e-07, 'epoch': 1.87} {'loss': 0.3836, 'learning_rate': 2.0989682890647068e-07, 'epoch': 1.87} {'loss': 0.3287, 'learning_rate': 2.0982835859318595e-07, 'epoch': 1.87} {'loss': 0.3983, 'learning_rate': 2.0975989933114337e-07, 'epoch': 1.87} {'loss': 0.3706, 'learning_rate': 2.0969145112042065e-07, 'epoch': 1.87} {'loss': 0.2713, 'learning_rate': 2.0962301396109442e-07, 'epoch': 1.87} {'loss': 0.2585, 'learning_rate': 2.0955458785324012e-07, 'epoch': 1.87} {'loss': 0.3225, 'learning_rate': 2.0948617279693883e-07, 'epoch': 1.87} {'loss': 0.4359, 'learning_rate': 2.0941776879226717e-07, 'epoch': 1.87} {'loss': 0.2533, 'learning_rate': 2.0934937583929839e-07, 'epoch': 1.87} {'loss': 0.3353, 'learning_rate': 2.0928099393811462e-07, 'epoch': 1.87} {'loss': 0.1891, 'learning_rate': 2.0921262308878921e-07, 'epoch': 1.87} {'loss': 0.2874, 'learning_rate': 2.0914426329140203e-07, 'epoch': 1.87} {'loss': 0.3346, 'learning_rate': 2.090759145460286e-07, 'epoch': 1.87} {'loss': 0.2533, 'learning_rate': 2.0900757685274665e-07, 'epoch': 1.87} {'loss': 0.3352, 'learning_rate': 2.0893925021163385e-07, 'epoch': 1.87} {'loss': 0.251, 'learning_rate': 2.0887093462276686e-07, 'epoch': 1.87} {'loss': 0.3158, 'learning_rate': 2.0880263008622115e-07, 'epoch': 1.87} {'loss': 0.2731, 'learning_rate': 2.0873433660207665e-07, 'epoch': 1.87} {'loss': 0.2093, 'learning_rate': 2.0866605417040885e-07, 'epoch': 1.87} {'loss': 0.2664, 'learning_rate': 2.085977827912955e-07, 'epoch': 1.87} {'loss': 0.2215, 'learning_rate': 2.085295224648143e-07, 'epoch': 1.87} {'loss': 0.4311, 'learning_rate': 2.0846127319103959e-07, 'epoch': 1.87} {'loss': 0.2228, 'learning_rate': 2.0839303497005138e-07, 'epoch': 1.87} {'loss': 0.3148, 'learning_rate': 2.08324807801924e-07, 'epoch': 1.87} {'loss': 0.3377, 'learning_rate': 2.082565916867374e-07, 'epoch': 1.87} {'loss': 0.2757, 'learning_rate': 2.0818838662456597e-07, 'epoch': 1.87} {'loss': 0.3698, 'learning_rate': 2.0812019261548855e-07, 'epoch': 1.87} {'loss': 0.3717, 'learning_rate': 2.080520096595806e-07, 'epoch': 1.87} {'loss': 0.1745, 'learning_rate': 2.0798383775692099e-07, 'epoch': 1.87} {'loss': 0.2807, 'learning_rate': 2.0791567690758517e-07, 'epoch': 1.87} {'loss': 0.2452, 'learning_rate': 2.078475271116509e-07, 'epoch': 1.87} {'loss': 0.2288, 'learning_rate': 2.0777938836919366e-07, 'epoch': 1.87} {'loss': 0.2423, 'learning_rate': 2.0771126068029334e-07, 'epoch': 1.87} {'loss': 0.3338, 'learning_rate': 2.076431440450233e-07, 'epoch': 1.87} {'loss': 0.3603, 'learning_rate': 2.0757503846346227e-07, 'epoch': 1.87} {'loss': 0.2976, 'learning_rate': 2.0750694393568692e-07, 'epoch': 1.87} {'loss': 0.3452, 'learning_rate': 2.0743886046177386e-07, 'epoch': 1.87} {'loss': 0.2812, 'learning_rate': 2.0737078804180188e-07, 'epoch': 1.87} {'loss': 0.14, 'learning_rate': 2.0730272667584428e-07, 'epoch': 1.87} {'loss': 0.3142, 'learning_rate': 2.0723467636397988e-07, 'epoch': 1.87} {'loss': 0.3106, 'learning_rate': 2.0716663710628527e-07, 'epoch': 1.87} {'loss': 0.3159, 'learning_rate': 2.0709860890283818e-07, 'epoch': 1.87} {'loss': 0.2761, 'learning_rate': 2.070305917537141e-07, 'epoch': 1.87} {'loss': 0.3668, 'learning_rate': 2.0696258565899073e-07, 'epoch': 1.87} {'loss': 0.4152, 'learning_rate': 2.0689459061874361e-07, 'epoch': 1.87} {'loss': 0.1991, 'learning_rate': 2.0682660663305043e-07, 'epoch': 1.87} {'loss': 0.3408, 'learning_rate': 2.067586337019889e-07, 'epoch': 1.87} {'loss': 0.3298, 'learning_rate': 2.066906718256334e-07, 'epoch': 1.87} {'loss': 0.3179, 'learning_rate': 2.0662272100406166e-07, 'epoch': 1.87} {'loss': 0.3064, 'learning_rate': 2.065547812373514e-07, 'epoch': 1.87} {'loss': 0.3544, 'learning_rate': 2.064868525255781e-07, 'epoch': 1.87} {'loss': 0.3075, 'learning_rate': 2.0641893486881836e-07, 'epoch': 1.87} {'loss': 0.2863, 'learning_rate': 2.0635102826714992e-07, 'epoch': 1.87} {'loss': 0.2136, 'learning_rate': 2.0628313272064827e-07, 'epoch': 1.87} {'loss': 0.4428, 'learning_rate': 2.062152482293911e-07, 'epoch': 1.87} {'loss': 0.2667, 'learning_rate': 2.0614737479345394e-07, 'epoch': 1.87} {'loss': 0.3453, 'learning_rate': 2.0607951241291557e-07, 'epoch': 1.87} {'loss': 0.3519, 'learning_rate': 2.060116610878493e-07, 'epoch': 1.87} {'loss': 0.4514, 'learning_rate': 2.059438208183351e-07, 'epoch': 1.87} {'loss': 0.3251, 'learning_rate': 2.0587599160444727e-07, 'epoch': 1.87} {'loss': 0.4014, 'learning_rate': 2.0580817344626135e-07, 'epoch': 1.87} {'loss': 0.4055, 'learning_rate': 2.057403663438573e-07, 'epoch': 1.87} {'loss': 0.2478, 'learning_rate': 2.0567257029730946e-07, 'epoch': 1.87} {'loss': 0.1806, 'learning_rate': 2.0560478530669558e-07, 'epoch': 1.87} {'loss': 0.4023, 'learning_rate': 2.0553701137209004e-07, 'epoch': 1.87} {'loss': 0.2682, 'learning_rate': 2.0546924849357163e-07, 'epoch': 1.87} {'loss': 0.4044, 'learning_rate': 2.054014966712148e-07, 'epoch': 1.87} {'loss': 0.3285, 'learning_rate': 2.053337559050983e-07, 'epoch': 1.87} {'loss': 0.2643, 'learning_rate': 2.0526602619529657e-07, 'epoch': 1.87} {'loss': 0.3999, 'learning_rate': 2.051983075418884e-07, 'epoch': 1.87} {'loss': 0.4474, 'learning_rate': 2.051305999449471e-07, 'epoch': 1.87} {'loss': 0.3788, 'learning_rate': 2.050629034045515e-07, 'epoch': 1.87} {'loss': 0.2564, 'learning_rate': 2.0499521792077813e-07, 'epoch': 1.87} {'loss': 0.4731, 'learning_rate': 2.0492754349370147e-07, 'epoch': 1.87} {'loss': 0.2909, 'learning_rate': 2.0485988012339919e-07, 'epoch': 1.87} {'loss': 0.3776, 'learning_rate': 2.047922278099479e-07, 'epoch': 1.87} {'loss': 0.2006, 'learning_rate': 2.047245865534231e-07, 'epoch': 1.87} {'loss': 0.1795, 'learning_rate': 2.0465695635390138e-07, 'epoch': 1.87} {'loss': 0.5588, 'learning_rate': 2.0458933721145935e-07, 'epoch': 1.88} {'loss': 0.2809, 'learning_rate': 2.0452172912617364e-07, 'epoch': 1.88} {'loss': 0.2499, 'learning_rate': 2.0445413209812081e-07, 'epoch': 1.88} {'loss': 0.2952, 'learning_rate': 2.043865461273753e-07, 'epoch': 1.88} {'loss': 0.2438, 'learning_rate': 2.0431897121401478e-07, 'epoch': 1.88} {'loss': 0.2997, 'learning_rate': 2.0425140735811588e-07, 'epoch': 1.88} {'loss': 0.4735, 'learning_rate': 2.041838545597541e-07, 'epoch': 1.88} {'loss': 0.2792, 'learning_rate': 2.0411631281900713e-07, 'epoch': 1.88} {'loss': 0.1845, 'learning_rate': 2.0404878213594826e-07, 'epoch': 1.88} {'loss': 0.3641, 'learning_rate': 2.0398126251065743e-07, 'epoch': 1.88} {'loss': 0.3302, 'learning_rate': 2.0391375394320677e-07, 'epoch': 1.88} {'loss': 0.4231, 'learning_rate': 2.0384625643367628e-07, 'epoch': 1.88} {'loss': 0.3271, 'learning_rate': 2.037787699821403e-07, 'epoch': 1.88} {'loss': 0.4336, 'learning_rate': 2.0371129458867546e-07, 'epoch': 1.88} {'loss': 0.287, 'learning_rate': 2.036438302533561e-07, 'epoch': 1.88} {'loss': 0.1837, 'learning_rate': 2.035763769762622e-07, 'epoch': 1.88} {'loss': 0.3318, 'learning_rate': 2.035089347574659e-07, 'epoch': 1.88} {'loss': 0.2016, 'learning_rate': 2.0344150359704608e-07, 'epoch': 1.88} {'loss': 0.3234, 'learning_rate': 2.0337408349507815e-07, 'epoch': 1.88} {'loss': 0.2809, 'learning_rate': 2.0330667445163764e-07, 'epoch': 1.88} {'loss': 0.3703, 'learning_rate': 2.032392764668012e-07, 'epoch': 1.88} {'loss': 0.215, 'learning_rate': 2.0317188954064425e-07, 'epoch': 1.88} {'loss': 0.2615, 'learning_rate': 2.0310451367324346e-07, 'epoch': 1.88} {'loss': 0.1936, 'learning_rate': 2.030371488646743e-07, 'epoch': 1.88} {'loss': 0.2703, 'learning_rate': 2.0296979511501336e-07, 'epoch': 1.88} {'loss': 0.3247, 'learning_rate': 2.0290245242433616e-07, 'epoch': 1.88} {'loss': 0.2476, 'learning_rate': 2.0283512079271928e-07, 'epoch': 1.88} {'loss': 0.2802, 'learning_rate': 2.0276780022023933e-07, 'epoch': 1.88} {'loss': 0.2793, 'learning_rate': 2.0270049070697074e-07, 'epoch': 1.88} {'loss': 0.2302, 'learning_rate': 2.0263319225299116e-07, 'epoch': 1.88} {'loss': 0.2589, 'learning_rate': 2.0256590485837502e-07, 'epoch': 1.88} {'loss': 0.1918, 'learning_rate': 2.024986285231989e-07, 'epoch': 1.88} {'loss': 0.2975, 'learning_rate': 2.0243136324753833e-07, 'epoch': 1.88} {'loss': 0.2354, 'learning_rate': 2.0236410903147098e-07, 'epoch': 1.88} {'loss': 0.3911, 'learning_rate': 2.0229686587507015e-07, 'epoch': 1.88} {'loss': 0.2595, 'learning_rate': 2.0222963377841353e-07, 'epoch': 1.88} {'loss': 0.302, 'learning_rate': 2.0216241274157668e-07, 'epoch': 1.88} {'loss': 0.2255, 'learning_rate': 2.0209520276463501e-07, 'epoch': 1.88} {'loss': 0.231, 'learning_rate': 2.020280038476641e-07, 'epoch': 1.88} {'loss': 0.2936, 'learning_rate': 2.0196081599074157e-07, 'epoch': 1.88} {'loss': 0.2132, 'learning_rate': 2.0189363919394189e-07, 'epoch': 1.88} {'loss': 0.3043, 'learning_rate': 2.0182647345734053e-07, 'epoch': 1.88} {'loss': 0.3423, 'learning_rate': 2.017593187810152e-07, 'epoch': 1.88} {'loss': 0.302, 'learning_rate': 2.0169217516503913e-07, 'epoch': 1.88} {'loss': 0.2417, 'learning_rate': 2.0162504260949013e-07, 'epoch': 1.88} {'loss': 0.1536, 'learning_rate': 2.015579211144414e-07, 'epoch': 1.88} {'loss': 0.2451, 'learning_rate': 2.014908106799729e-07, 'epoch': 1.88} {'loss': 0.3519, 'learning_rate': 2.0142371130615678e-07, 'epoch': 1.88} {'loss': 0.365, 'learning_rate': 2.0135662299306969e-07, 'epoch': 1.88} {'loss': 0.4257, 'learning_rate': 2.012895457407882e-07, 'epoch': 1.88} {'loss': 0.3544, 'learning_rate': 2.0122247954938778e-07, 'epoch': 1.88} {'loss': 0.4291, 'learning_rate': 2.0115542441894287e-07, 'epoch': 1.88} {'loss': 0.3459, 'learning_rate': 2.0108838034953115e-07, 'epoch': 1.88} {'loss': 0.3364, 'learning_rate': 2.0102134734122704e-07, 'epoch': 1.88} {'loss': 0.3092, 'learning_rate': 2.0095432539410598e-07, 'epoch': 1.88} {'loss': 0.2044, 'learning_rate': 2.0088731450824573e-07, 'epoch': 1.88} {'loss': 0.2607, 'learning_rate': 2.0082031468371843e-07, 'epoch': 1.88} {'loss': 0.3855, 'learning_rate': 2.0075332592060293e-07, 'epoch': 1.88} {'loss': 0.2978, 'learning_rate': 2.0068634821897138e-07, 'epoch': 1.88} {'loss': 0.3729, 'learning_rate': 2.006193815789037e-07, 'epoch': 1.88} {'loss': 0.3875, 'learning_rate': 2.0055242600047208e-07, 'epoch': 1.88} {'loss': 0.2446, 'learning_rate': 2.0048548148375424e-07, 'epoch': 1.88} {'loss': 0.3851, 'learning_rate': 2.0041854802882455e-07, 'epoch': 1.88} {'loss': 0.4743, 'learning_rate': 2.003516256357585e-07, 'epoch': 1.88} {'loss': 0.3197, 'learning_rate': 2.0028471430463158e-07, 'epoch': 1.88} {'loss': 0.1346, 'learning_rate': 2.0021781403552153e-07, 'epoch': 1.88} {'loss': 0.3301, 'learning_rate': 2.001509248284994e-07, 'epoch': 1.88} {'loss': 0.3651, 'learning_rate': 2.0008404668364624e-07, 'epoch': 1.88} {'loss': 0.3582, 'learning_rate': 2.0001717960103306e-07, 'epoch': 1.88} {'loss': 0.2468, 'learning_rate': 1.999503235807365e-07, 'epoch': 1.88} {'loss': 0.2548, 'learning_rate': 1.998834786228332e-07, 'epoch': 1.88} {'loss': 0.3047, 'learning_rate': 1.9981664472739749e-07, 'epoch': 1.88} {'loss': 0.1726, 'learning_rate': 1.9974982189450598e-07, 'epoch': 1.88} {'loss': 0.3833, 'learning_rate': 1.9968301012423198e-07, 'epoch': 1.88} {'loss': 0.3556, 'learning_rate': 1.9961620941665317e-07, 'epoch': 1.88} {'loss': 0.3617, 'learning_rate': 1.9954941977184394e-07, 'epoch': 1.88} {'loss': 0.274, 'learning_rate': 1.994826411898798e-07, 'epoch': 1.88} {'loss': 0.3109, 'learning_rate': 1.9941587367083626e-07, 'epoch': 1.88} {'loss': 0.2874, 'learning_rate': 1.9934911721478878e-07, 'epoch': 1.88} {'loss': 0.3358, 'learning_rate': 1.9928237182181066e-07, 'epoch': 1.88} {'loss': 0.3047, 'learning_rate': 1.992156374919807e-07, 'epoch': 1.88} {'loss': 0.2252, 'learning_rate': 1.991489142253733e-07, 'epoch': 1.88} {'loss': 0.283, 'learning_rate': 1.9908220202206174e-07, 'epoch': 1.88} {'loss': 0.2162, 'learning_rate': 1.9901550088212264e-07, 'epoch': 1.88} {'loss': 0.1354, 'learning_rate': 1.9894881080563145e-07, 'epoch': 1.88} {'loss': 0.2296, 'learning_rate': 1.988821317926637e-07, 'epoch': 1.88} {'loss': 0.4413, 'learning_rate': 1.9881546384329376e-07, 'epoch': 1.88} {'loss': 0.4373, 'learning_rate': 1.9874880695759824e-07, 'epoch': 1.88} {'loss': 0.3804, 'learning_rate': 1.9868216113564932e-07, 'epoch': 1.88} {'loss': 0.2814, 'learning_rate': 1.986155263775269e-07, 'epoch': 1.88} {'loss': 0.2184, 'learning_rate': 1.9854890268330206e-07, 'epoch': 1.88} {'loss': 0.2607, 'learning_rate': 1.9848229005305363e-07, 'epoch': 1.88} {'loss': 0.3661, 'learning_rate': 1.9841568848685268e-07, 'epoch': 1.88} {'loss': 0.2835, 'learning_rate': 1.9834909798477798e-07, 'epoch': 1.88} {'loss': 0.2683, 'learning_rate': 1.9828251854690284e-07, 'epoch': 1.88} {'loss': 0.2505, 'learning_rate': 1.9821595017330274e-07, 'epoch': 1.88} {'loss': 0.2338, 'learning_rate': 1.981493928640532e-07, 'epoch': 1.88} {'loss': 0.2405, 'learning_rate': 1.980828466192286e-07, 'epoch': 1.88} {'loss': 0.3134, 'learning_rate': 1.9801631143890553e-07, 'epoch': 1.88} {'loss': 0.3376, 'learning_rate': 1.9794978732315727e-07, 'epoch': 1.88} {'loss': 0.2908, 'learning_rate': 1.9788327427206043e-07, 'epoch': 1.88} {'loss': 0.2371, 'learning_rate': 1.978167722856883e-07, 'epoch': 1.88} {'loss': 0.2771, 'learning_rate': 1.9775028136411744e-07, 'epoch': 1.88} {'loss': 0.2523, 'learning_rate': 1.976838015074223e-07, 'epoch': 1.88} {'loss': 0.2875, 'learning_rate': 1.976173327156794e-07, 'epoch': 1.88} {'loss': 0.3515, 'learning_rate': 1.9755087498896098e-07, 'epoch': 1.88} {'loss': 0.2889, 'learning_rate': 1.974844283273447e-07, 'epoch': 1.88} {'loss': 0.2909, 'learning_rate': 1.97417992730905e-07, 'epoch': 1.88} {'loss': 0.3071, 'learning_rate': 1.9735156819971512e-07, 'epoch': 1.88} {'loss': 0.252, 'learning_rate': 1.9728515473385168e-07, 'epoch': 1.88} {'loss': 0.2957, 'learning_rate': 1.9721875233338906e-07, 'epoch': 1.88} {'loss': 0.2525, 'learning_rate': 1.9715236099840274e-07, 'epoch': 1.88} {'loss': 0.2612, 'learning_rate': 1.9708598072896712e-07, 'epoch': 1.88} {'loss': 0.2447, 'learning_rate': 1.970196115251577e-07, 'epoch': 1.88} {'loss': 0.3368, 'learning_rate': 1.9695325338704773e-07, 'epoch': 1.88} {'loss': 0.4527, 'learning_rate': 1.9688690631471497e-07, 'epoch': 1.88} {'loss': 0.2641, 'learning_rate': 1.9682057030823155e-07, 'epoch': 1.88} {'loss': 0.3627, 'learning_rate': 1.9675424536767406e-07, 'epoch': 1.88} {'loss': 0.2655, 'learning_rate': 1.9668793149311583e-07, 'epoch': 1.88} {'loss': 0.3427, 'learning_rate': 1.9662162868463452e-07, 'epoch': 1.88} {'loss': 0.2252, 'learning_rate': 1.9655533694230343e-07, 'epoch': 1.88} {'loss': 0.3113, 'learning_rate': 1.9648905626619474e-07, 'epoch': 1.88} {'loss': 0.3201, 'learning_rate': 1.9642278665638836e-07, 'epoch': 1.88} {'loss': 0.333, 'learning_rate': 1.9635652811295425e-07, 'epoch': 1.88} {'loss': 0.4503, 'learning_rate': 1.962902806359701e-07, 'epoch': 1.88} {'loss': 0.3273, 'learning_rate': 1.9622404422550923e-07, 'epoch': 1.88} {'loss': 0.4185, 'learning_rate': 1.961578188816482e-07, 'epoch': 1.88} {'loss': 0.2787, 'learning_rate': 1.9609160460446142e-07, 'epoch': 1.88} {'loss': 0.3161, 'learning_rate': 1.9602540139402105e-07, 'epoch': 1.88} {'loss': 0.38, 'learning_rate': 1.959592092504059e-07, 'epoch': 1.88} {'loss': 0.3611, 'learning_rate': 1.9589302817368595e-07, 'epoch': 1.88} {'loss': 0.1563, 'learning_rate': 1.9582685816393998e-07, 'epoch': 1.88} {'loss': 0.3944, 'learning_rate': 1.957606992212413e-07, 'epoch': 1.88} {'loss': 0.3532, 'learning_rate': 1.956945513456643e-07, 'epoch': 1.88} {'loss': 0.2949, 'learning_rate': 1.956284145372822e-07, 'epoch': 1.88} {'loss': 0.3456, 'learning_rate': 1.9556228879617389e-07, 'epoch': 1.88} {'loss': 0.3683, 'learning_rate': 1.954961741224093e-07, 'epoch': 1.88} {'loss': 0.1897, 'learning_rate': 1.954300705160661e-07, 'epoch': 1.88} {'loss': 0.2064, 'learning_rate': 1.9536397797721762e-07, 'epoch': 1.88} {'loss': 0.3874, 'learning_rate': 1.9529789650593823e-07, 'epoch': 1.88} {'loss': 0.3785, 'learning_rate': 1.9523182610230452e-07, 'epoch': 1.88} {'loss': 0.3576, 'learning_rate': 1.9516576676638865e-07, 'epoch': 1.88} {'loss': 0.2716, 'learning_rate': 1.9509971849826615e-07, 'epoch': 1.88} {'loss': 0.2638, 'learning_rate': 1.9503368129801137e-07, 'epoch': 1.88} {'loss': 0.2092, 'learning_rate': 1.949676551656998e-07, 'epoch': 1.88} {'loss': 0.3103, 'learning_rate': 1.9490164010140366e-07, 'epoch': 1.88} {'loss': 0.2972, 'learning_rate': 1.9483563610520063e-07, 'epoch': 1.88} {'loss': 0.2949, 'learning_rate': 1.9476964317716284e-07, 'epoch': 1.88} {'loss': 0.3007, 'learning_rate': 1.9470366131736695e-07, 'epoch': 1.88} {'loss': 0.3993, 'learning_rate': 1.94637690525884e-07, 'epoch': 1.88} {'loss': 0.446, 'learning_rate': 1.9457173080279168e-07, 'epoch': 1.88} {'loss': 0.384, 'learning_rate': 1.9450578214816328e-07, 'epoch': 1.88} {'loss': 0.1512, 'learning_rate': 1.944398445620732e-07, 'epoch': 1.88} {'loss': 0.275, 'learning_rate': 1.9437391804459582e-07, 'epoch': 1.88} {'loss': 0.3583, 'learning_rate': 1.9430800259580552e-07, 'epoch': 1.88} {'loss': 0.1753, 'learning_rate': 1.9424209821577776e-07, 'epoch': 1.88} {'loss': 0.1857, 'learning_rate': 1.9417620490458476e-07, 'epoch': 1.88} {'loss': 0.3357, 'learning_rate': 1.9411032266230312e-07, 'epoch': 1.88} {'loss': 0.1804, 'learning_rate': 1.9404445148900497e-07, 'epoch': 1.88} {'loss': 0.2858, 'learning_rate': 1.9397859138476804e-07, 'epoch': 1.88} {'loss': 0.2857, 'learning_rate': 1.9391274234966228e-07, 'epoch': 1.88} {'loss': 0.397, 'learning_rate': 1.938469043837654e-07, 'epoch': 1.88} {'loss': 0.2552, 'learning_rate': 1.937810774871507e-07, 'epoch': 1.88} {'loss': 0.26, 'learning_rate': 1.937152616598925e-07, 'epoch': 1.88} {'loss': 0.3902, 'learning_rate': 1.9364945690206415e-07, 'epoch': 1.88} {'loss': 0.248, 'learning_rate': 1.9358366321374222e-07, 'epoch': 1.88} {'loss': 0.2905, 'learning_rate': 1.9351788059499886e-07, 'epoch': 1.88} {'loss': 0.2568, 'learning_rate': 1.934521090459085e-07, 'epoch': 1.88} {'loss': 0.3981, 'learning_rate': 1.933863485665477e-07, 'epoch': 1.88} {'loss': 0.2648, 'learning_rate': 1.9332059915698643e-07, 'epoch': 1.88} {'loss': 0.3774, 'learning_rate': 1.9325486081730348e-07, 'epoch': 1.88} {'loss': 0.354, 'learning_rate': 1.9318913354756885e-07, 'epoch': 1.88} {'loss': 0.2885, 'learning_rate': 1.9312341734786132e-07, 'epoch': 1.88} {'loss': 0.4471, 'learning_rate': 1.9305771221824976e-07, 'epoch': 1.88} {'loss': 0.2683, 'learning_rate': 1.9299201815881407e-07, 'epoch': 1.88} {'loss': 0.2099, 'learning_rate': 1.9292633516962313e-07, 'epoch': 1.88} {'loss': 0.3116, 'learning_rate': 1.928606632507546e-07, 'epoch': 1.88} {'loss': 0.404, 'learning_rate': 1.9279500240228065e-07, 'epoch': 1.88} {'loss': 0.3322, 'learning_rate': 1.9272935262427793e-07, 'epoch': 1.88} {'loss': 0.414, 'learning_rate': 1.9266371391681748e-07, 'epoch': 1.88} {'loss': 0.3118, 'learning_rate': 1.9259808627997479e-07, 'epoch': 1.88} {'loss': 0.2889, 'learning_rate': 1.9253246971382534e-07, 'epoch': 1.88} {'loss': 0.2783, 'learning_rate': 1.924668642184402e-07, 'epoch': 1.88} {'loss': 0.4363, 'learning_rate': 1.9240126979389484e-07, 'epoch': 1.88} {'loss': 0.4472, 'learning_rate': 1.9233568644026367e-07, 'epoch': 1.88} {'loss': 0.2765, 'learning_rate': 1.9227011415762108e-07, 'epoch': 1.88} {'loss': 0.2261, 'learning_rate': 1.9220455294604033e-07, 'epoch': 1.88} {'loss': 0.2624, 'learning_rate': 1.9213900280559584e-07, 'epoch': 1.88} {'loss': 0.3209, 'learning_rate': 1.9207346373636083e-07, 'epoch': 1.88} {'loss': 0.2628, 'learning_rate': 1.920079357384097e-07, 'epoch': 1.88} {'loss': 0.2616, 'learning_rate': 1.9194241881181686e-07, 'epoch': 1.88} {'loss': 0.3625, 'learning_rate': 1.9187691295665557e-07, 'epoch': 1.88} {'loss': 0.2198, 'learning_rate': 1.918114181730002e-07, 'epoch': 1.88} {'loss': 0.3026, 'learning_rate': 1.9174593446092516e-07, 'epoch': 1.88} {'loss': 0.4041, 'learning_rate': 1.916804618205048e-07, 'epoch': 1.88} {'loss': 0.1502, 'learning_rate': 1.9161500025181023e-07, 'epoch': 1.88} {'loss': 0.4822, 'learning_rate': 1.9154954975491803e-07, 'epoch': 1.88} {'loss': 0.2152, 'learning_rate': 1.9148411032990033e-07, 'epoch': 1.88} {'loss': 0.2343, 'learning_rate': 1.9141868197683377e-07, 'epoch': 1.88} {'loss': 0.1994, 'learning_rate': 1.913532646957883e-07, 'epoch': 1.88} {'loss': 0.2696, 'learning_rate': 1.912878584868405e-07, 'epoch': 1.88} {'loss': 0.3179, 'learning_rate': 1.9122246335006366e-07, 'epoch': 1.88} {'loss': 0.2728, 'learning_rate': 1.9115707928553107e-07, 'epoch': 1.88} {'loss': 0.3618, 'learning_rate': 1.9109170629331707e-07, 'epoch': 1.88} {'loss': 0.3518, 'learning_rate': 1.910263443734961e-07, 'epoch': 1.88} {'loss': 0.3235, 'learning_rate': 1.9096099352614027e-07, 'epoch': 1.88} {'loss': 0.3753, 'learning_rate': 1.9089565375132402e-07, 'epoch': 1.88} {'loss': 0.2961, 'learning_rate': 1.908303250491228e-07, 'epoch': 1.88} {'loss': 0.1744, 'learning_rate': 1.9076500741960657e-07, 'epoch': 1.88} {'loss': 0.3011, 'learning_rate': 1.9069970086285306e-07, 'epoch': 1.88} {'loss': 0.2513, 'learning_rate': 1.906344053789333e-07, 'epoch': 1.88} {'loss': 0.2937, 'learning_rate': 1.905691209679228e-07, 'epoch': 1.88} {'loss': 0.4278, 'learning_rate': 1.9050384762989372e-07, 'epoch': 1.88} {'loss': 0.4441, 'learning_rate': 1.9043858536492043e-07, 'epoch': 1.88} {'loss': 0.2006, 'learning_rate': 1.9037333417307623e-07, 'epoch': 1.88} {'loss': 0.3152, 'learning_rate': 1.9030809405443662e-07, 'epoch': 1.88} {'loss': 0.2289, 'learning_rate': 1.9024286500907263e-07, 'epoch': 1.88} {'loss': 0.2918, 'learning_rate': 1.9017764703705977e-07, 'epoch': 1.88} {'loss': 0.331, 'learning_rate': 1.9011244013847018e-07, 'epoch': 1.88} {'loss': 0.259, 'learning_rate': 1.9004724431337828e-07, 'epoch': 1.88} {'loss': 0.2637, 'learning_rate': 1.8998205956185844e-07, 'epoch': 1.88} {'loss': 0.4253, 'learning_rate': 1.8991688588398283e-07, 'epoch': 1.88} {'loss': 0.2423, 'learning_rate': 1.898517232798258e-07, 'epoch': 1.88} {'loss': 0.348, 'learning_rate': 1.8978657174945958e-07, 'epoch': 1.88} {'loss': 0.2884, 'learning_rate': 1.8972143129295962e-07, 'epoch': 1.88} {'loss': 0.3747, 'learning_rate': 1.8965630191039807e-07, 'epoch': 1.88} {'loss': 0.3522, 'learning_rate': 1.8959118360184936e-07, 'epoch': 1.88} {'loss': 0.2397, 'learning_rate': 1.8952607636738785e-07, 'epoch': 1.88} {'loss': 0.3137, 'learning_rate': 1.8946098020708459e-07, 'epoch': 1.88} {'loss': 0.3643, 'learning_rate': 1.893958951210151e-07, 'epoch': 1.88} {'loss': 0.2762, 'learning_rate': 1.893308211092515e-07, 'epoch': 1.88} {'loss': 0.2291, 'learning_rate': 1.8926575817186822e-07, 'epoch': 1.88} {'loss': 0.4394, 'learning_rate': 1.892007063089374e-07, 'epoch': 1.88} {'loss': 0.2465, 'learning_rate': 1.8913566552053453e-07, 'epoch': 1.88} {'loss': 0.4987, 'learning_rate': 1.8907063580673068e-07, 'epoch': 1.88} {'loss': 0.3343, 'learning_rate': 1.8900561716760136e-07, 'epoch': 1.88} {'loss': 0.3307, 'learning_rate': 1.889406096032187e-07, 'epoch': 1.88} {'loss': 0.1279, 'learning_rate': 1.888756131136571e-07, 'epoch': 1.88} {'loss': 0.2179, 'learning_rate': 1.888106276989876e-07, 'epoch': 1.88} {'loss': 0.2092, 'learning_rate': 1.8874565335928684e-07, 'epoch': 1.88} {'loss': 0.287, 'learning_rate': 1.8868069009462698e-07, 'epoch': 1.88} {'loss': 0.3542, 'learning_rate': 1.8861573790507903e-07, 'epoch': 1.88} {'loss': 0.4132, 'learning_rate': 1.8855079679071964e-07, 'epoch': 1.88} {'loss': 0.3404, 'learning_rate': 1.8848586675161985e-07, 'epoch': 1.88} {'loss': 0.3267, 'learning_rate': 1.8842094778785402e-07, 'epoch': 1.88} {'loss': 0.3979, 'learning_rate': 1.8835603989949547e-07, 'epoch': 1.88} {'loss': 0.278, 'learning_rate': 1.8829114308661745e-07, 'epoch': 1.88} {'loss': 0.3655, 'learning_rate': 1.8822625734929213e-07, 'epoch': 1.88} {'loss': 0.2759, 'learning_rate': 1.8816138268759387e-07, 'epoch': 1.88} {'loss': 0.2601, 'learning_rate': 1.8809651910159487e-07, 'epoch': 1.88} {'loss': 0.3404, 'learning_rate': 1.8803166659137062e-07, 'epoch': 1.88} {'loss': 0.2751, 'learning_rate': 1.8796682515699105e-07, 'epoch': 1.88} {'loss': 0.2495, 'learning_rate': 1.8790199479853278e-07, 'epoch': 1.88} {'loss': 0.278, 'learning_rate': 1.8783717551606683e-07, 'epoch': 1.88} {'loss': 0.3086, 'learning_rate': 1.8777236730966651e-07, 'epoch': 1.88} {'loss': 0.2277, 'learning_rate': 1.8770757017940621e-07, 'epoch': 1.88} {'loss': 0.1328, 'learning_rate': 1.8764278412535587e-07, 'epoch': 1.88} {'loss': 0.4873, 'learning_rate': 1.8757800914759316e-07, 'epoch': 1.88} {'loss': 0.4307, 'learning_rate': 1.8751324524618807e-07, 'epoch': 1.88} {'loss': 0.419, 'learning_rate': 1.87448492421215e-07, 'epoch': 1.88} {'loss': 0.2776, 'learning_rate': 1.8738375067274604e-07, 'epoch': 1.88} {'loss': 0.4469, 'learning_rate': 1.8731902000085567e-07, 'epoch': 1.88} {'loss': 0.2064, 'learning_rate': 1.8725430040561488e-07, 'epoch': 1.88} {'loss': 0.4261, 'learning_rate': 1.8718959188709916e-07, 'epoch': 1.88} {'loss': 0.2612, 'learning_rate': 1.8712489444537963e-07, 'epoch': 1.88} {'loss': 0.273, 'learning_rate': 1.870602080805306e-07, 'epoch': 1.88} {'loss': 0.247, 'learning_rate': 1.8699553279262539e-07, 'epoch': 1.88} {'loss': 0.418, 'learning_rate': 1.8693086858173505e-07, 'epoch': 1.88} {'loss': 0.378, 'learning_rate': 1.8686621544793393e-07, 'epoch': 1.88} {'loss': 0.361, 'learning_rate': 1.8680157339129422e-07, 'epoch': 1.88} {'loss': 0.2246, 'learning_rate': 1.8673694241189033e-07, 'epoch': 1.88} {'loss': 0.3597, 'learning_rate': 1.866723225097944e-07, 'epoch': 1.88} {'loss': 0.31, 'learning_rate': 1.8660771368507857e-07, 'epoch': 1.88} {'loss': 0.2506, 'learning_rate': 1.8654311593781728e-07, 'epoch': 1.88} {'loss': 0.3197, 'learning_rate': 1.8647852926808264e-07, 'epoch': 1.88} {'loss': 0.269, 'learning_rate': 1.8641395367594683e-07, 'epoch': 1.88} {'loss': 0.2049, 'learning_rate': 1.8634938916148427e-07, 'epoch': 1.88} {'loss': 0.4669, 'learning_rate': 1.8628483572476706e-07, 'epoch': 1.88} {'loss': 0.2842, 'learning_rate': 1.8622029336586745e-07, 'epoch': 1.88} {'loss': 0.3093, 'learning_rate': 1.8615576208486087e-07, 'epoch': 1.88} {'loss': 0.4551, 'learning_rate': 1.8609124188181617e-07, 'epoch': 1.88} {'loss': 0.3394, 'learning_rate': 1.8602673275680883e-07, 'epoch': 1.88} {'loss': 0.1975, 'learning_rate': 1.8596223470991103e-07, 'epoch': 1.88} {'loss': 0.2087, 'learning_rate': 1.8589774774119607e-07, 'epoch': 1.88} {'loss': 0.3727, 'learning_rate': 1.8583327185073607e-07, 'epoch': 1.88} {'loss': 0.332, 'learning_rate': 1.8576880703860434e-07, 'epoch': 1.88} {'loss': 0.2678, 'learning_rate': 1.857043533048719e-07, 'epoch': 1.88} {'loss': 0.2822, 'learning_rate': 1.856399106496154e-07, 'epoch': 1.88} {'loss': 0.3277, 'learning_rate': 1.8557547907290252e-07, 'epoch': 1.88} {'loss': 0.3427, 'learning_rate': 1.85511058574811e-07, 'epoch': 1.88} {'loss': 0.2863, 'learning_rate': 1.8544664915540966e-07, 'epoch': 1.88} {'loss': 0.2663, 'learning_rate': 1.85382250814774e-07, 'epoch': 1.88} {'loss': 0.1747, 'learning_rate': 1.853178635529751e-07, 'epoch': 1.88} {'loss': 0.3211, 'learning_rate': 1.8525348737008507e-07, 'epoch': 1.88} {'loss': 0.3345, 'learning_rate': 1.8518912226617835e-07, 'epoch': 1.88} {'loss': 0.2782, 'learning_rate': 1.8512476824132598e-07, 'epoch': 1.88} {'loss': 0.2563, 'learning_rate': 1.850604252956012e-07, 'epoch': 1.88} {'loss': 0.2866, 'learning_rate': 1.8499609342907732e-07, 'epoch': 1.88} {'loss': 0.3215, 'learning_rate': 1.8493177264182648e-07, 'epoch': 1.88} {'loss': 0.3268, 'learning_rate': 1.848674629339209e-07, 'epoch': 1.88} {'loss': 0.3241, 'learning_rate': 1.8480316430543487e-07, 'epoch': 1.88} {'loss': 0.2918, 'learning_rate': 1.8473887675643843e-07, 'epoch': 1.88} {'loss': 0.2935, 'learning_rate': 1.846746002870059e-07, 'epoch': 1.88} {'loss': 0.3011, 'learning_rate': 1.8461033489720838e-07, 'epoch': 1.88} {'loss': 0.3912, 'learning_rate': 1.8454608058712022e-07, 'epoch': 1.88} {'loss': 0.4337, 'learning_rate': 1.8448183735681135e-07, 'epoch': 1.88} {'loss': 0.3111, 'learning_rate': 1.8441760520635843e-07, 'epoch': 1.88} {'loss': 0.2798, 'learning_rate': 1.8435338413583026e-07, 'epoch': 1.88} {'loss': 0.3195, 'learning_rate': 1.8428917414530012e-07, 'epoch': 1.88} {'loss': 0.4545, 'learning_rate': 1.8422497523484238e-07, 'epoch': 1.88} {'loss': 0.3251, 'learning_rate': 1.8416078740452703e-07, 'epoch': 1.88} {'loss': 0.3063, 'learning_rate': 1.840966106544284e-07, 'epoch': 1.88} {'loss': 0.2297, 'learning_rate': 1.8403244498461647e-07, 'epoch': 1.88} {'loss': 0.3331, 'learning_rate': 1.8396829039516672e-07, 'epoch': 1.88} {'loss': 0.2925, 'learning_rate': 1.839041468861502e-07, 'epoch': 1.88} {'loss': 0.2209, 'learning_rate': 1.838400144576391e-07, 'epoch': 1.88} {'loss': 0.322, 'learning_rate': 1.8377589310970556e-07, 'epoch': 1.88} {'loss': 0.3423, 'learning_rate': 1.8371178284242287e-07, 'epoch': 1.88} {'loss': 0.2727, 'learning_rate': 1.8364768365586205e-07, 'epoch': 1.88} {'loss': 0.2199, 'learning_rate': 1.8358359555009753e-07, 'epoch': 1.88} {'loss': 0.2008, 'learning_rate': 1.8351951852520033e-07, 'epoch': 1.88} {'loss': 0.4332, 'learning_rate': 1.8345545258124152e-07, 'epoch': 1.88} {'loss': 0.345, 'learning_rate': 1.833913977182966e-07, 'epoch': 1.88} {'loss': 0.409, 'learning_rate': 1.833273539364344e-07, 'epoch': 1.88} {'loss': 0.3879, 'learning_rate': 1.8326332123572931e-07, 'epoch': 1.88} {'loss': 0.4288, 'learning_rate': 1.831992996162535e-07, 'epoch': 1.88} {'loss': 0.4076, 'learning_rate': 1.831352890780791e-07, 'epoch': 1.88} {'loss': 0.2669, 'learning_rate': 1.8307128962127829e-07, 'epoch': 1.88} {'loss': 0.3395, 'learning_rate': 1.8300730124592326e-07, 'epoch': 1.88} {'loss': 0.2129, 'learning_rate': 1.8294332395208614e-07, 'epoch': 1.88} {'loss': 0.2885, 'learning_rate': 1.82879357739838e-07, 'epoch': 1.88} {'loss': 0.2354, 'learning_rate': 1.8281540260925435e-07, 'epoch': 1.88} {'loss': 0.3202, 'learning_rate': 1.82751458560404e-07, 'epoch': 1.88} {'loss': 0.3191, 'learning_rate': 1.8268752559336024e-07, 'epoch': 1.88} {'loss': 0.462, 'learning_rate': 1.8262360370819633e-07, 'epoch': 1.88} {'loss': 0.2837, 'learning_rate': 1.8255969290498332e-07, 'epoch': 1.88} {'loss': 0.2975, 'learning_rate': 1.824957931837923e-07, 'epoch': 1.88} {'loss': 0.3205, 'learning_rate': 1.824319045446976e-07, 'epoch': 1.88} {'loss': 0.3731, 'learning_rate': 1.8236802698777035e-07, 'epoch': 1.88} {'loss': 0.2744, 'learning_rate': 1.8230416051308376e-07, 'epoch': 1.88} {'loss': 0.3617, 'learning_rate': 1.8224030512070777e-07, 'epoch': 1.88} {'loss': 0.2942, 'learning_rate': 1.8217646081071461e-07, 'epoch': 1.88} {'loss': 0.3394, 'learning_rate': 1.821126275831786e-07, 'epoch': 1.88} {'loss': 0.299, 'learning_rate': 1.8204880543816972e-07, 'epoch': 1.88} {'loss': 0.2192, 'learning_rate': 1.8198499437576235e-07, 'epoch': 1.88} {'loss': 0.2636, 'learning_rate': 1.819211943960253e-07, 'epoch': 1.88} {'loss': 0.4017, 'learning_rate': 1.8185740549903298e-07, 'epoch': 1.88} {'loss': 0.2469, 'learning_rate': 1.8179362768485532e-07, 'epoch': 1.88} {'loss': 0.2368, 'learning_rate': 1.8172986095356782e-07, 'epoch': 1.88} {'loss': 0.2867, 'learning_rate': 1.816661053052382e-07, 'epoch': 1.88} {'loss': 0.2353, 'learning_rate': 1.8160236073994199e-07, 'epoch': 1.88} {'loss': 0.2776, 'learning_rate': 1.8153862725774907e-07, 'epoch': 1.88} {'loss': 0.4404, 'learning_rate': 1.8147490485873166e-07, 'epoch': 1.88} {'loss': 0.2445, 'learning_rate': 1.81411193542963e-07, 'epoch': 1.88} {'loss': 0.3431, 'learning_rate': 1.8134749331051304e-07, 'epoch': 1.88} {'loss': 0.4893, 'learning_rate': 1.8128380416145507e-07, 'epoch': 1.88} {'loss': 0.3614, 'learning_rate': 1.8122012609586016e-07, 'epoch': 1.88} {'loss': 0.1952, 'learning_rate': 1.8115645911380153e-07, 'epoch': 1.88} {'loss': 0.2112, 'learning_rate': 1.8109280321534917e-07, 'epoch': 1.88} {'loss': 0.4121, 'learning_rate': 1.8102915840057632e-07, 'epoch': 1.88} {'loss': 0.3237, 'learning_rate': 1.8096552466955408e-07, 'epoch': 1.88} {'loss': 0.2788, 'learning_rate': 1.809019020223557e-07, 'epoch': 1.88} {'loss': 0.2948, 'learning_rate': 1.8083829045905e-07, 'epoch': 1.88} {'loss': 0.4217, 'learning_rate': 1.807746899797125e-07, 'epoch': 1.88} {'loss': 0.2909, 'learning_rate': 1.80711100584412e-07, 'epoch': 1.88} {'loss': 0.3734, 'learning_rate': 1.806475222732218e-07, 'epoch': 1.88} {'loss': 0.2184, 'learning_rate': 1.8058395504621406e-07, 'epoch': 1.88} {'loss': 0.2461, 'learning_rate': 1.8052039890345873e-07, 'epoch': 1.88} {'loss': 0.3351, 'learning_rate': 1.804568538450291e-07, 'epoch': 1.88} {'loss': 0.3972, 'learning_rate': 1.8039331987099507e-07, 'epoch': 1.88} {'loss': 0.2252, 'learning_rate': 1.8032979698143106e-07, 'epoch': 1.88} {'loss': 0.2861, 'learning_rate': 1.8026628517640698e-07, 'epoch': 1.88} {'loss': 0.3198, 'learning_rate': 1.8020278445599614e-07, 'epoch': 1.88} {'loss': 0.3912, 'learning_rate': 1.8013929482026737e-07, 'epoch': 1.88} {'loss': 0.2436, 'learning_rate': 1.8007581626929504e-07, 'epoch': 1.88} {'loss': 0.2194, 'learning_rate': 1.800123488031491e-07, 'epoch': 1.88} {'loss': 0.2991, 'learning_rate': 1.7994889242190282e-07, 'epoch': 1.88} {'loss': 0.3355, 'learning_rate': 1.7988544712562505e-07, 'epoch': 1.88} {'loss': 0.2019, 'learning_rate': 1.7982201291439128e-07, 'epoch': 1.88} {'loss': 0.3324, 'learning_rate': 1.7975858978827033e-07, 'epoch': 1.88} {'loss': 0.2141, 'learning_rate': 1.7969517774733437e-07, 'epoch': 1.88} {'loss': 0.2276, 'learning_rate': 1.7963177679165556e-07, 'epoch': 1.88} {'loss': 0.211, 'learning_rate': 1.7956838692130385e-07, 'epoch': 1.88} {'loss': 0.2368, 'learning_rate': 1.7950500813635364e-07, 'epoch': 1.88} {'loss': 0.258, 'learning_rate': 1.7944164043687372e-07, 'epoch': 1.88} {'loss': 0.3582, 'learning_rate': 1.7937828382293743e-07, 'epoch': 1.88} {'loss': 0.4516, 'learning_rate': 1.7931493829461466e-07, 'epoch': 1.88} {'loss': 0.2875, 'learning_rate': 1.792516038519787e-07, 'epoch': 1.88} {'loss': 0.3507, 'learning_rate': 1.791882804950984e-07, 'epoch': 1.88} {'loss': 0.3509, 'learning_rate': 1.7912496822404924e-07, 'epoch': 1.88} {'loss': 0.2099, 'learning_rate': 1.7906166703889893e-07, 'epoch': 1.88} {'loss': 0.2576, 'learning_rate': 1.789983769397219e-07, 'epoch': 1.88} {'loss': 0.1304, 'learning_rate': 1.7893509792658804e-07, 'epoch': 1.88} {'loss': 0.3028, 'learning_rate': 1.788718299995673e-07, 'epoch': 1.88} {'loss': 0.2437, 'learning_rate': 1.7880857315873412e-07, 'epoch': 1.88} {'loss': 0.2541, 'learning_rate': 1.787453274041573e-07, 'epoch': 1.88} {'loss': 0.3789, 'learning_rate': 1.786820927359112e-07, 'epoch': 1.88} {'loss': 0.303, 'learning_rate': 1.7861886915406356e-07, 'epoch': 1.88} {'loss': 0.4388, 'learning_rate': 1.785556566586888e-07, 'epoch': 1.88} {'loss': 0.3091, 'learning_rate': 1.784924552498557e-07, 'epoch': 1.88} {'loss': 0.3029, 'learning_rate': 1.784292649276387e-07, 'epoch': 1.88} {'loss': 0.2554, 'learning_rate': 1.7836608569210656e-07, 'epoch': 1.88} {'loss': 0.3644, 'learning_rate': 1.783029175433315e-07, 'epoch': 1.88} {'loss': 0.3587, 'learning_rate': 1.782397604813846e-07, 'epoch': 1.88} {'loss': 0.3273, 'learning_rate': 1.7817661450633795e-07, 'epoch': 1.88} {'loss': 0.2744, 'learning_rate': 1.7811347961826154e-07, 'epoch': 1.88} {'loss': 0.248, 'learning_rate': 1.7805035581722753e-07, 'epoch': 1.88} {'loss': 0.379, 'learning_rate': 1.7798724310330694e-07, 'epoch': 1.88} {'loss': 0.2574, 'learning_rate': 1.779241414765709e-07, 'epoch': 1.88} {'loss': 0.1594, 'learning_rate': 1.778610509370904e-07, 'epoch': 1.88} {'loss': 0.4382, 'learning_rate': 1.777979714849376e-07, 'epoch': 1.88} {'loss': 0.1953, 'learning_rate': 1.777349031201836e-07, 'epoch': 1.88} {'loss': 0.3518, 'learning_rate': 1.776718458428972e-07, 'epoch': 1.88} {'loss': 0.3606, 'learning_rate': 1.776087996531539e-07, 'epoch': 1.88} {'loss': 0.3357, 'learning_rate': 1.7754576455102035e-07, 'epoch': 1.88} {'loss': 0.2163, 'learning_rate': 1.7748274053657087e-07, 'epoch': 1.88} {'loss': 0.2414, 'learning_rate': 1.7741972760987547e-07, 'epoch': 1.88} {'loss': 0.3028, 'learning_rate': 1.7735672577100515e-07, 'epoch': 1.88} {'loss': 0.3117, 'learning_rate': 1.772937350200321e-07, 'epoch': 1.88} {'loss': 0.4371, 'learning_rate': 1.7723075535702517e-07, 'epoch': 1.88} {'loss': 0.3822, 'learning_rate': 1.7716778678205759e-07, 'epoch': 1.88} {'loss': 0.3582, 'learning_rate': 1.7710482929519933e-07, 'epoch': 1.88} {'loss': 0.1814, 'learning_rate': 1.7704188289652257e-07, 'epoch': 1.88} {'loss': 0.3587, 'learning_rate': 1.7697894758609612e-07, 'epoch': 1.88} {'loss': 0.3547, 'learning_rate': 1.7691602336399327e-07, 'epoch': 1.88} {'loss': 0.4493, 'learning_rate': 1.7685311023028396e-07, 'epoch': 1.88} {'loss': 0.378, 'learning_rate': 1.7679020818504033e-07, 'epoch': 1.88} {'loss': 0.2702, 'learning_rate': 1.7672731722833348e-07, 'epoch': 1.88} {'loss': 0.2659, 'learning_rate': 1.766644373602311e-07, 'epoch': 1.88} {'loss': 0.3943, 'learning_rate': 1.7660156858080867e-07, 'epoch': 1.88} {'loss': 0.2552, 'learning_rate': 1.7653871089013398e-07, 'epoch': 1.88} {'loss': 0.3613, 'learning_rate': 1.7647586428827912e-07, 'epoch': 1.88} {'loss': 0.2916, 'learning_rate': 1.764130287753152e-07, 'epoch': 1.88} {'loss': 0.4816, 'learning_rate': 1.7635020435131323e-07, 'epoch': 1.88} {'loss': 0.3155, 'learning_rate': 1.7628739101634317e-07, 'epoch': 1.88} {'loss': 0.3059, 'learning_rate': 1.762245887704772e-07, 'epoch': 1.88} {'loss': 0.3288, 'learning_rate': 1.7616179761378415e-07, 'epoch': 1.88} {'loss': 0.2144, 'learning_rate': 1.760990175463384e-07, 'epoch': 1.88} {'loss': 0.3342, 'learning_rate': 1.7603624856820656e-07, 'epoch': 1.88} {'loss': 0.2855, 'learning_rate': 1.7597349067946412e-07, 'epoch': 1.88} {'loss': 0.3457, 'learning_rate': 1.7591074388017882e-07, 'epoch': 1.88} {'loss': 0.2967, 'learning_rate': 1.7584800817042057e-07, 'epoch': 1.88} {'loss': 0.2341, 'learning_rate': 1.7578528355026381e-07, 'epoch': 1.88} {'loss': 0.409, 'learning_rate': 1.7572257001977512e-07, 'epoch': 1.88} {'loss': 0.3812, 'learning_rate': 1.7565986757902997e-07, 'epoch': 1.88} {'loss': 0.3267, 'learning_rate': 1.755971762280939e-07, 'epoch': 1.88} {'loss': 0.3924, 'learning_rate': 1.755344959670424e-07, 'epoch': 1.88} {'loss': 0.2725, 'learning_rate': 1.754718267959432e-07, 'epoch': 1.88} {'loss': 0.3011, 'learning_rate': 1.7540916871486958e-07, 'epoch': 1.88} {'loss': 0.2424, 'learning_rate': 1.7534652172388923e-07, 'epoch': 1.88} {'loss': 0.1937, 'learning_rate': 1.7528388582307542e-07, 'epoch': 1.88} {'loss': 0.4055, 'learning_rate': 1.7522126101249704e-07, 'epoch': 1.88} {'loss': 0.2506, 'learning_rate': 1.751586472922262e-07, 'epoch': 1.88} {'loss': 0.2266, 'learning_rate': 1.7509604466233288e-07, 'epoch': 1.88} {'loss': 0.1935, 'learning_rate': 1.750334531228881e-07, 'epoch': 1.88} {'loss': 0.2977, 'learning_rate': 1.7497087267396185e-07, 'epoch': 1.88} {'loss': 0.3423, 'learning_rate': 1.7490830331562513e-07, 'epoch': 1.88} {'loss': 0.4314, 'learning_rate': 1.7484574504794906e-07, 'epoch': 1.88} {'loss': 0.3262, 'learning_rate': 1.747831978710024e-07, 'epoch': 1.88} {'loss': 0.353, 'learning_rate': 1.7472066178485846e-07, 'epoch': 1.88} {'loss': 0.4172, 'learning_rate': 1.746581367895861e-07, 'epoch': 1.88} {'loss': 0.3507, 'learning_rate': 1.7459562288525633e-07, 'epoch': 1.88} {'loss': 0.3785, 'learning_rate': 1.7453312007194023e-07, 'epoch': 1.88} {'loss': 0.2677, 'learning_rate': 1.7447062834970774e-07, 'epoch': 1.88} {'loss': 0.1335, 'learning_rate': 1.744081477186288e-07, 'epoch': 1.88} {'loss': 0.4772, 'learning_rate': 1.7434567817877447e-07, 'epoch': 1.88} {'loss': 0.4064, 'learning_rate': 1.7428321973021689e-07, 'epoch': 1.88} {'loss': 0.4013, 'learning_rate': 1.742207723730238e-07, 'epoch': 1.88} {'loss': 0.3218, 'learning_rate': 1.741583361072674e-07, 'epoch': 1.88} {'loss': 0.3161, 'learning_rate': 1.7409591093301758e-07, 'epoch': 1.88} {'loss': 0.2782, 'learning_rate': 1.7403349685034544e-07, 'epoch': 1.88} {'loss': 0.2002, 'learning_rate': 1.7397109385932086e-07, 'epoch': 1.88} {'loss': 0.2975, 'learning_rate': 1.7390870196001497e-07, 'epoch': 1.88} {'loss': 0.3007, 'learning_rate': 1.7384632115249656e-07, 'epoch': 1.88} {'loss': 0.3718, 'learning_rate': 1.7378395143683778e-07, 'epoch': 1.88} {'loss': 0.3094, 'learning_rate': 1.7372159281310753e-07, 'epoch': 1.88} {'loss': 0.3471, 'learning_rate': 1.736592452813779e-07, 'epoch': 1.88} {'loss': 0.159, 'learning_rate': 1.7359690884171776e-07, 'epoch': 1.88} {'loss': 0.3033, 'learning_rate': 1.7353458349419928e-07, 'epoch': 1.88} {'loss': 0.4192, 'learning_rate': 1.7347226923889127e-07, 'epoch': 1.88} {'loss': 0.3537, 'learning_rate': 1.7340996607586368e-07, 'epoch': 1.88} {'loss': 0.2487, 'learning_rate': 1.733476740051887e-07, 'epoch': 1.88} {'loss': 0.4296, 'learning_rate': 1.7328539302693404e-07, 'epoch': 1.89} {'loss': 0.3222, 'learning_rate': 1.7322312314117295e-07, 'epoch': 1.89} {'loss': 0.4392, 'learning_rate': 1.7316086434797319e-07, 'epoch': 1.89} {'loss': 0.3818, 'learning_rate': 1.730986166474069e-07, 'epoch': 1.89} {'loss': 0.3386, 'learning_rate': 1.7303638003954293e-07, 'epoch': 1.89} {'loss': 0.2275, 'learning_rate': 1.7297415452445342e-07, 'epoch': 1.89} {'loss': 0.3765, 'learning_rate': 1.7291194010220612e-07, 'epoch': 1.89} {'loss': 0.4757, 'learning_rate': 1.728497367728743e-07, 'epoch': 1.89} {'loss': 0.3139, 'learning_rate': 1.7278754453652458e-07, 'epoch': 1.89} {'loss': 0.3362, 'learning_rate': 1.727253633932302e-07, 'epoch': 1.89} {'loss': 0.4414, 'learning_rate': 1.7266319334306004e-07, 'epoch': 1.89} {'loss': 0.3224, 'learning_rate': 1.726010343860829e-07, 'epoch': 1.89} {'loss': 0.2671, 'learning_rate': 1.7253888652237204e-07, 'epoch': 1.89} {'loss': 0.4123, 'learning_rate': 1.7247674975199525e-07, 'epoch': 1.89} {'loss': 0.2844, 'learning_rate': 1.7241462407502352e-07, 'epoch': 1.89} {'loss': 0.2941, 'learning_rate': 1.7235250949152681e-07, 'epoch': 1.89} {'loss': 0.2843, 'learning_rate': 1.722904060015751e-07, 'epoch': 1.89} {'loss': 0.3144, 'learning_rate': 1.722283136052394e-07, 'epoch': 1.89} {'loss': 0.2696, 'learning_rate': 1.7216623230258855e-07, 'epoch': 1.89} {'loss': 0.2026, 'learning_rate': 1.7210416209369362e-07, 'epoch': 1.89} {'loss': 0.2825, 'learning_rate': 1.7204210297862457e-07, 'epoch': 1.89} {'loss': 0.2207, 'learning_rate': 1.7198005495744908e-07, 'epoch': 1.89} {'loss': 0.3744, 'learning_rate': 1.7191801803024154e-07, 'epoch': 1.89} {'loss': 0.4343, 'learning_rate': 1.7185599219706862e-07, 'epoch': 1.89} {'loss': 0.3817, 'learning_rate': 1.717939774580013e-07, 'epoch': 1.89} {'loss': 0.4863, 'learning_rate': 1.7173197381311068e-07, 'epoch': 1.89} {'loss': 0.3112, 'learning_rate': 1.7166998126246447e-07, 'epoch': 1.89} {'loss': 0.2554, 'learning_rate': 1.7160799980613484e-07, 'epoch': 1.89} {'loss': 0.2857, 'learning_rate': 1.7154602944418952e-07, 'epoch': 1.89} {'loss': 0.2845, 'learning_rate': 1.7148407017670176e-07, 'epoch': 1.89} {'loss': 0.385, 'learning_rate': 1.7142212200373709e-07, 'epoch': 1.89} {'loss': 0.2348, 'learning_rate': 1.713601849253699e-07, 'epoch': 1.89} {'loss': 0.2659, 'learning_rate': 1.7129825894166674e-07, 'epoch': 1.89} {'loss': 0.3154, 'learning_rate': 1.7123634405269984e-07, 'epoch': 1.89} {'loss': 0.2795, 'learning_rate': 1.711744402585369e-07, 'epoch': 1.89} {'loss': 0.3939, 'learning_rate': 1.7111254755925012e-07, 'epoch': 1.89} {'loss': 0.3263, 'learning_rate': 1.7105066595490827e-07, 'epoch': 1.89} {'loss': 0.2432, 'learning_rate': 1.7098879544558022e-07, 'epoch': 1.89} {'loss': 0.2467, 'learning_rate': 1.7092693603133814e-07, 'epoch': 1.89} {'loss': 0.263, 'learning_rate': 1.7086508771224863e-07, 'epoch': 1.89} {'loss': 0.2934, 'learning_rate': 1.7080325048838388e-07, 'epoch': 1.89} {'loss': 0.3811, 'learning_rate': 1.7074142435981378e-07, 'epoch': 1.89} {'loss': 0.2845, 'learning_rate': 1.706796093266072e-07, 'epoch': 1.89} {'loss': 0.3282, 'learning_rate': 1.7061780538883522e-07, 'epoch': 1.89} {'loss': 0.2844, 'learning_rate': 1.705560125465644e-07, 'epoch': 1.89} {'loss': 0.266, 'learning_rate': 1.7049423079986915e-07, 'epoch': 1.89} {'loss': 0.262, 'learning_rate': 1.7043246014881498e-07, 'epoch': 1.89} {'loss': 0.2129, 'learning_rate': 1.7037070059347404e-07, 'epoch': 1.89} {'loss': 0.3169, 'learning_rate': 1.7030895213391517e-07, 'epoch': 1.89} {'loss': 0.2226, 'learning_rate': 1.7024721477020834e-07, 'epoch': 1.89} {'loss': 0.3483, 'learning_rate': 1.7018548850242234e-07, 'epoch': 1.89} {'loss': 0.3593, 'learning_rate': 1.7012377333062935e-07, 'epoch': 1.89} {'loss': 0.2937, 'learning_rate': 1.70062069254896e-07, 'epoch': 1.89} {'loss': 0.2591, 'learning_rate': 1.7000037627529442e-07, 'epoch': 1.89} {'loss': 0.2503, 'learning_rate': 1.6993869439189237e-07, 'epoch': 1.89} {'loss': 0.3373, 'learning_rate': 1.698770236047609e-07, 'epoch': 1.89} {'loss': 0.3383, 'learning_rate': 1.698153639139688e-07, 'epoch': 1.89} {'loss': 0.3312, 'learning_rate': 1.6975371531958606e-07, 'epoch': 1.89} {'loss': 0.1343, 'learning_rate': 1.696920778216815e-07, 'epoch': 1.89} {'loss': 0.2237, 'learning_rate': 1.6963045142032508e-07, 'epoch': 1.89} {'loss': 0.3216, 'learning_rate': 1.6956883611558783e-07, 'epoch': 1.89} {'loss': 0.2874, 'learning_rate': 1.6950723190753638e-07, 'epoch': 1.89} {'loss': 0.1953, 'learning_rate': 1.6944563879624287e-07, 'epoch': 1.89} {'loss': 0.3292, 'learning_rate': 1.6938405678177617e-07, 'epoch': 1.89} {'loss': 0.3459, 'learning_rate': 1.6932248586420508e-07, 'epoch': 1.89} {'loss': 0.3748, 'learning_rate': 1.6926092604359845e-07, 'epoch': 1.89} {'loss': 0.233, 'learning_rate': 1.6919937732002845e-07, 'epoch': 1.89} {'loss': 0.3101, 'learning_rate': 1.6913783969356168e-07, 'epoch': 1.89} {'loss': 0.3241, 'learning_rate': 1.690763131642703e-07, 'epoch': 1.89} {'loss': 0.1504, 'learning_rate': 1.6901479773222206e-07, 'epoch': 1.89} {'loss': 0.351, 'learning_rate': 1.689532933974858e-07, 'epoch': 1.89} {'loss': 0.2807, 'learning_rate': 1.6889180016013252e-07, 'epoch': 1.89} {'loss': 0.2178, 'learning_rate': 1.6883031802022998e-07, 'epoch': 1.89} {'loss': 0.2532, 'learning_rate': 1.6876884697784924e-07, 'epoch': 1.89} {'loss': 0.2767, 'learning_rate': 1.6870738703305912e-07, 'epoch': 1.89} {'loss': 0.2351, 'learning_rate': 1.6864593818592844e-07, 'epoch': 1.89} {'loss': 0.3775, 'learning_rate': 1.685845004365272e-07, 'epoch': 1.89} {'loss': 0.2808, 'learning_rate': 1.6852307378492416e-07, 'epoch': 1.89} {'loss': 0.5005, 'learning_rate': 1.6846165823118932e-07, 'epoch': 1.89} {'loss': 0.2799, 'learning_rate': 1.684002537753915e-07, 'epoch': 1.89} {'loss': 0.2613, 'learning_rate': 1.6833886041760061e-07, 'epoch': 1.89} {'loss': 0.364, 'learning_rate': 1.6827747815788554e-07, 'epoch': 1.89} {'loss': 0.2028, 'learning_rate': 1.682161069963162e-07, 'epoch': 1.89} {'loss': 0.2045, 'learning_rate': 1.681547469329603e-07, 'epoch': 1.89} {'loss': 0.3194, 'learning_rate': 1.6809339796788783e-07, 'epoch': 1.89} {'loss': 0.2616, 'learning_rate': 1.6803206010116867e-07, 'epoch': 1.89} {'loss': 0.1771, 'learning_rate': 1.6797073333287283e-07, 'epoch': 1.89} {'loss': 0.3029, 'learning_rate': 1.679094176630669e-07, 'epoch': 1.89} {'loss': 0.2163, 'learning_rate': 1.6784811309182191e-07, 'epoch': 1.89} {'loss': 0.2472, 'learning_rate': 1.6778681961920673e-07, 'epoch': 1.89} {'loss': 0.29, 'learning_rate': 1.6772553724529128e-07, 'epoch': 1.89} {'loss': 0.2523, 'learning_rate': 1.676642659701422e-07, 'epoch': 1.89} {'loss': 0.2401, 'learning_rate': 1.676030057938327e-07, 'epoch': 1.89} {'loss': 0.298, 'learning_rate': 1.6754175671642835e-07, 'epoch': 1.89} {'loss': 0.3784, 'learning_rate': 1.674805187380002e-07, 'epoch': 1.89} {'loss': 0.324, 'learning_rate': 1.6741929185861704e-07, 'epoch': 1.89} {'loss': 0.3372, 'learning_rate': 1.6735807607834665e-07, 'epoch': 1.89} {'loss': 0.1781, 'learning_rate': 1.6729687139726004e-07, 'epoch': 1.89} {'loss': 0.3697, 'learning_rate': 1.6723567781542493e-07, 'epoch': 1.89} {'loss': 0.2783, 'learning_rate': 1.671744953329113e-07, 'epoch': 1.89} {'loss': 0.3074, 'learning_rate': 1.6711332394978797e-07, 'epoch': 1.89} {'loss': 0.3766, 'learning_rate': 1.6705216366612374e-07, 'epoch': 1.89} {'loss': 0.2732, 'learning_rate': 1.6699101448198752e-07, 'epoch': 1.89} {'loss': 0.3789, 'learning_rate': 1.6692987639744917e-07, 'epoch': 1.89} {'loss': 0.3268, 'learning_rate': 1.6686874941257646e-07, 'epoch': 1.89} {'loss': 0.3075, 'learning_rate': 1.6680763352744044e-07, 'epoch': 1.89} {'loss': 0.4763, 'learning_rate': 1.6674652874210662e-07, 'epoch': 1.89} {'loss': 0.3953, 'learning_rate': 1.6668543505664824e-07, 'epoch': 1.89} {'loss': 0.3387, 'learning_rate': 1.6662435247113085e-07, 'epoch': 1.89} {'loss': 0.335, 'learning_rate': 1.6656328098562547e-07, 'epoch': 1.89} {'loss': 0.2728, 'learning_rate': 1.6650222060019984e-07, 'epoch': 1.89} {'loss': 0.1342, 'learning_rate': 1.6644117131492276e-07, 'epoch': 1.89} {'loss': 0.4719, 'learning_rate': 1.6638013312986422e-07, 'epoch': 1.89} {'loss': 0.1955, 'learning_rate': 1.6631910604509194e-07, 'epoch': 1.89} {'loss': 0.2927, 'learning_rate': 1.6625809006067695e-07, 'epoch': 1.89} {'loss': 0.3304, 'learning_rate': 1.6619708517668475e-07, 'epoch': 1.89} {'loss': 0.2494, 'learning_rate': 1.6613609139318754e-07, 'epoch': 1.89} {'loss': 0.3584, 'learning_rate': 1.660751087102508e-07, 'epoch': 1.89} {'loss': 0.2767, 'learning_rate': 1.6601413712794667e-07, 'epoch': 1.89} {'loss': 0.4536, 'learning_rate': 1.6595317664634292e-07, 'epoch': 1.89} {'loss': 0.3827, 'learning_rate': 1.6589222726550723e-07, 'epoch': 1.89} {'loss': 0.3361, 'learning_rate': 1.658312889855096e-07, 'epoch': 1.89} {'loss': 0.3154, 'learning_rate': 1.657703618064177e-07, 'epoch': 1.89} {'loss': 0.3786, 'learning_rate': 1.657094457283026e-07, 'epoch': 1.89} {'loss': 0.2903, 'learning_rate': 1.6564854075122982e-07, 'epoch': 1.89} {'loss': 0.2924, 'learning_rate': 1.655876468752704e-07, 'epoch': 1.89} {'loss': 0.3165, 'learning_rate': 1.6552676410049206e-07, 'epoch': 1.89} {'loss': 0.2715, 'learning_rate': 1.6546589242696476e-07, 'epoch': 1.89} {'loss': 0.3558, 'learning_rate': 1.654050318547551e-07, 'epoch': 1.89} {'loss': 0.2971, 'learning_rate': 1.6534418238393412e-07, 'epoch': 1.89} {'loss': 0.3415, 'learning_rate': 1.6528334401456848e-07, 'epoch': 1.89} {'loss': 0.1823, 'learning_rate': 1.6522251674672806e-07, 'epoch': 1.89} {'loss': 0.1947, 'learning_rate': 1.6516170058048066e-07, 'epoch': 1.89} {'loss': 0.2671, 'learning_rate': 1.6510089551589726e-07, 'epoch': 1.89} {'loss': 0.2953, 'learning_rate': 1.650401015530434e-07, 'epoch': 1.89} {'loss': 0.2391, 'learning_rate': 1.6497931869199013e-07, 'epoch': 1.89} {'loss': 0.3329, 'learning_rate': 1.6491854693280408e-07, 'epoch': 1.89} {'loss': 0.3205, 'learning_rate': 1.6485778627555514e-07, 'epoch': 1.89} {'loss': 0.2765, 'learning_rate': 1.6479703672031112e-07, 'epoch': 1.89} {'loss': 0.2298, 'learning_rate': 1.6473629826714077e-07, 'epoch': 1.89} {'loss': 0.3458, 'learning_rate': 1.6467557091611297e-07, 'epoch': 1.89} {'loss': 0.295, 'learning_rate': 1.6461485466729655e-07, 'epoch': 1.89} {'loss': 0.3177, 'learning_rate': 1.6455414952076032e-07, 'epoch': 1.89} {'loss': 0.2906, 'learning_rate': 1.6449345547657202e-07, 'epoch': 1.89} {'loss': 0.2715, 'learning_rate': 1.644327725347994e-07, 'epoch': 1.89} {'loss': 0.35, 'learning_rate': 1.6437210069551236e-07, 'epoch': 1.89} {'loss': 0.4041, 'learning_rate': 1.6431143995877864e-07, 'epoch': 1.89} {'loss': 0.415, 'learning_rate': 1.6425079032466705e-07, 'epoch': 1.89} {'loss': 0.377, 'learning_rate': 1.6419015179324538e-07, 'epoch': 1.89} {'loss': 0.2517, 'learning_rate': 1.6412952436458352e-07, 'epoch': 1.89} {'loss': 0.335, 'learning_rate': 1.6406890803874919e-07, 'epoch': 1.89} {'loss': 0.3905, 'learning_rate': 1.6400830281581015e-07, 'epoch': 1.89} {'loss': 0.2641, 'learning_rate': 1.6394770869583522e-07, 'epoch': 1.89} {'loss': 0.4175, 'learning_rate': 1.638871256788932e-07, 'epoch': 1.89} {'loss': 0.2666, 'learning_rate': 1.6382655376505185e-07, 'epoch': 1.89} {'loss': 0.404, 'learning_rate': 1.6376599295438112e-07, 'epoch': 1.89} {'loss': 0.3112, 'learning_rate': 1.637054432469476e-07, 'epoch': 1.89} {'loss': 0.2161, 'learning_rate': 1.6364490464281902e-07, 'epoch': 1.89} {'loss': 0.3151, 'learning_rate': 1.6358437714206644e-07, 'epoch': 1.89} {'loss': 0.271, 'learning_rate': 1.6352386074475536e-07, 'epoch': 1.89} {'loss': 0.414, 'learning_rate': 1.6346335545095682e-07, 'epoch': 1.89} {'loss': 0.2347, 'learning_rate': 1.6340286126073524e-07, 'epoch': 1.89} {'loss': 0.2839, 'learning_rate': 1.6334237817416387e-07, 'epoch': 1.89} {'loss': 0.1462, 'learning_rate': 1.6328190619130712e-07, 'epoch': 1.89} {'loss': 0.3376, 'learning_rate': 1.6322144531223493e-07, 'epoch': 1.89} {'loss': 0.27, 'learning_rate': 1.6316099553701393e-07, 'epoch': 1.89} {'loss': 0.2812, 'learning_rate': 1.6310055686571514e-07, 'epoch': 1.89} {'loss': 0.24, 'learning_rate': 1.6304012929840518e-07, 'epoch': 1.89} {'loss': 0.3032, 'learning_rate': 1.6297971283515178e-07, 'epoch': 1.89} {'loss': 0.2889, 'learning_rate': 1.629193074760249e-07, 'epoch': 1.89} {'loss': 0.3832, 'learning_rate': 1.6285891322109004e-07, 'epoch': 1.89} {'loss': 0.3721, 'learning_rate': 1.6279853007041712e-07, 'epoch': 1.89} {'loss': 0.3093, 'learning_rate': 1.627381580240739e-07, 'epoch': 1.89} {'loss': 0.2004, 'learning_rate': 1.6267779708212916e-07, 'epoch': 1.89} {'loss': 0.3063, 'learning_rate': 1.6261744724464957e-07, 'epoch': 1.89} {'loss': 0.3154, 'learning_rate': 1.6255710851170614e-07, 'epoch': 1.89} {'loss': 0.2885, 'learning_rate': 1.624967808833633e-07, 'epoch': 1.89} {'loss': 0.3041, 'learning_rate': 1.6243646435969207e-07, 'epoch': 1.89} {'loss': 0.3269, 'learning_rate': 1.6237615894075798e-07, 'epoch': 1.89} {'loss': 0.3037, 'learning_rate': 1.6231586462663208e-07, 'epoch': 1.89} {'loss': 0.2903, 'learning_rate': 1.6225558141737875e-07, 'epoch': 1.89} {'loss': 0.3411, 'learning_rate': 1.6219530931307014e-07, 'epoch': 1.89} {'loss': 0.2723, 'learning_rate': 1.621350483137718e-07, 'epoch': 1.89} {'loss': 0.1679, 'learning_rate': 1.6207479841955253e-07, 'epoch': 1.89} {'loss': 0.2614, 'learning_rate': 1.6201455963047897e-07, 'epoch': 1.89} {'loss': 0.4353, 'learning_rate': 1.6195433194662102e-07, 'epoch': 1.89} {'loss': 0.238, 'learning_rate': 1.6189411536804535e-07, 'epoch': 1.89} {'loss': 0.3242, 'learning_rate': 1.6183390989482073e-07, 'epoch': 1.89} {'loss': 0.2657, 'learning_rate': 1.6177371552701493e-07, 'epoch': 1.89} {'loss': 0.2607, 'learning_rate': 1.6171353226469566e-07, 'epoch': 1.89} {'loss': 0.3748, 'learning_rate': 1.6165336010793064e-07, 'epoch': 1.89} {'loss': 0.316, 'learning_rate': 1.615931990567887e-07, 'epoch': 1.89} {'loss': 0.4026, 'learning_rate': 1.6153304911133649e-07, 'epoch': 1.89} {'loss': 0.2244, 'learning_rate': 1.614729102716428e-07, 'epoch': 1.89} {'loss': 0.3315, 'learning_rate': 1.6141278253777647e-07, 'epoch': 1.89} {'loss': 0.2843, 'learning_rate': 1.6135266590980304e-07, 'epoch': 1.89} {'loss': 0.3219, 'learning_rate': 1.6129256038779128e-07, 'epoch': 1.89} {'loss': 0.2417, 'learning_rate': 1.6123246597181008e-07, 'epoch': 1.89} {'loss': 0.3023, 'learning_rate': 1.6117238266192604e-07, 'epoch': 1.89} {'loss': 0.3237, 'learning_rate': 1.6111231045820796e-07, 'epoch': 1.89} {'loss': 0.3438, 'learning_rate': 1.610522493607225e-07, 'epoch': 1.89} {'loss': 0.3628, 'learning_rate': 1.6099219936953848e-07, 'epoch': 1.89} {'loss': 0.3133, 'learning_rate': 1.609321604847236e-07, 'epoch': 1.89} {'loss': 0.3807, 'learning_rate': 1.608721327063445e-07, 'epoch': 1.89} {'loss': 0.3238, 'learning_rate': 1.6081211603447e-07, 'epoch': 1.89} {'loss': 0.2803, 'learning_rate': 1.6075211046916783e-07, 'epoch': 1.89} {'loss': 0.4006, 'learning_rate': 1.6069211601050571e-07, 'epoch': 1.89} {'loss': 0.2539, 'learning_rate': 1.6063213265855137e-07, 'epoch': 1.89} {'loss': 0.2346, 'learning_rate': 1.6057216041337142e-07, 'epoch': 1.89} {'loss': 0.3891, 'learning_rate': 1.605121992750347e-07, 'epoch': 1.89} {'loss': 0.2833, 'learning_rate': 1.6045224924360892e-07, 'epoch': 1.89} {'loss': 0.2523, 'learning_rate': 1.6039231031916181e-07, 'epoch': 1.89} {'loss': 0.2897, 'learning_rate': 1.6033238250175997e-07, 'epoch': 1.89} {'loss': 0.3755, 'learning_rate': 1.6027246579147226e-07, 'epoch': 1.89} {'loss': 0.3891, 'learning_rate': 1.6021256018836528e-07, 'epoch': 1.89} {'loss': 0.3409, 'learning_rate': 1.6015266569250787e-07, 'epoch': 1.89} {'loss': 0.3025, 'learning_rate': 1.6009278230396662e-07, 'epoch': 1.89} {'loss': 0.3751, 'learning_rate': 1.600329100228093e-07, 'epoch': 1.89} {'loss': 0.2193, 'learning_rate': 1.5997304884910359e-07, 'epoch': 1.89} {'loss': 0.3062, 'learning_rate': 1.5991319878291723e-07, 'epoch': 1.89} {'loss': 0.3447, 'learning_rate': 1.5985335982431904e-07, 'epoch': 1.89} {'loss': 0.3708, 'learning_rate': 1.5979353197337344e-07, 'epoch': 1.89} {'loss': 0.4406, 'learning_rate': 1.5973371523015036e-07, 'epoch': 1.89} {'loss': 0.3682, 'learning_rate': 1.5967390959471752e-07, 'epoch': 1.89} {'loss': 0.3157, 'learning_rate': 1.5961411506714042e-07, 'epoch': 1.89} {'loss': 0.1792, 'learning_rate': 1.595543316474879e-07, 'epoch': 1.89} {'loss': 0.2936, 'learning_rate': 1.5949455933582768e-07, 'epoch': 1.89} {'loss': 0.3428, 'learning_rate': 1.594347981322264e-07, 'epoch': 1.89} {'loss': 0.3355, 'learning_rate': 1.5937504803675175e-07, 'epoch': 1.89} {'loss': 0.3557, 'learning_rate': 1.5931530904947258e-07, 'epoch': 1.89} {'loss': 0.4004, 'learning_rate': 1.5925558117045436e-07, 'epoch': 1.89} {'loss': 0.298, 'learning_rate': 1.59195864399766e-07, 'epoch': 1.89} {'loss': 0.3245, 'learning_rate': 1.591361587374729e-07, 'epoch': 1.89} {'loss': 0.2348, 'learning_rate': 1.5907646418364397e-07, 'epoch': 1.89} {'loss': 0.3674, 'learning_rate': 1.5901678073834803e-07, 'epoch': 1.89} {'loss': 0.4777, 'learning_rate': 1.5895710840164834e-07, 'epoch': 1.89} {'loss': 0.2629, 'learning_rate': 1.5889744717361711e-07, 'epoch': 1.89} {'loss': 0.2176, 'learning_rate': 1.5883779705431756e-07, 'epoch': 1.89} {'loss': 0.298, 'learning_rate': 1.5877815804381967e-07, 'epoch': 1.89} {'loss': 0.3521, 'learning_rate': 1.5871853014218784e-07, 'epoch': 1.89} {'loss': 0.2394, 'learning_rate': 1.5865891334949423e-07, 'epoch': 1.89} {'loss': 0.2582, 'learning_rate': 1.5859930766580102e-07, 'epoch': 1.89} {'loss': 0.3978, 'learning_rate': 1.585397130911792e-07, 'epoch': 1.89} {'loss': 0.4811, 'learning_rate': 1.5848012962569547e-07, 'epoch': 1.89} {'loss': 0.5153, 'learning_rate': 1.5842055726941418e-07, 'epoch': 1.89} {'loss': 0.2661, 'learning_rate': 1.583609960224053e-07, 'epoch': 1.89} {'loss': 0.2032, 'learning_rate': 1.583014458847354e-07, 'epoch': 1.89} {'loss': 0.1923, 'learning_rate': 1.5824190685647223e-07, 'epoch': 1.89} {'loss': 0.3429, 'learning_rate': 1.581823789376813e-07, 'epoch': 1.89} {'loss': 0.4364, 'learning_rate': 1.5812286212843253e-07, 'epoch': 1.89} {'loss': 0.3612, 'learning_rate': 1.5806335642879034e-07, 'epoch': 1.89} {'loss': 0.3202, 'learning_rate': 1.5800386183882355e-07, 'epoch': 1.89} {'loss': 0.3564, 'learning_rate': 1.5794437835859878e-07, 'epoch': 1.89} {'loss': 0.2749, 'learning_rate': 1.5788490598818372e-07, 'epoch': 1.89} {'loss': 0.4216, 'learning_rate': 1.5782544472764394e-07, 'epoch': 1.89} {'loss': 0.3326, 'learning_rate': 1.5776599457704823e-07, 'epoch': 1.89} {'loss': 0.4045, 'learning_rate': 1.5770655553646318e-07, 'epoch': 1.89} {'loss': 0.207, 'learning_rate': 1.5764712760595545e-07, 'epoch': 1.89} {'loss': 0.4878, 'learning_rate': 1.5758771078559386e-07, 'epoch': 1.89} {'loss': 0.3952, 'learning_rate': 1.5752830507544282e-07, 'epoch': 1.89} {'loss': 0.2848, 'learning_rate': 1.574689104755711e-07, 'epoch': 1.89} {'loss': 0.2283, 'learning_rate': 1.5740952698604427e-07, 'epoch': 1.89} {'loss': 0.3644, 'learning_rate': 1.5735015460693227e-07, 'epoch': 1.89} {'loss': 0.4031, 'learning_rate': 1.5729079333829945e-07, 'epoch': 1.89} {'loss': 0.166, 'learning_rate': 1.5723144318021354e-07, 'epoch': 1.89} {'loss': 0.3982, 'learning_rate': 1.5717210413274119e-07, 'epoch': 1.89} {'loss': 0.3303, 'learning_rate': 1.5711277619595122e-07, 'epoch': 1.89} {'loss': 0.2114, 'learning_rate': 1.5705345936990802e-07, 'epoch': 1.89} {'loss': 0.2832, 'learning_rate': 1.569941536546804e-07, 'epoch': 1.89} {'loss': 0.4668, 'learning_rate': 1.569348590503339e-07, 'epoch': 1.89} {'loss': 0.2956, 'learning_rate': 1.5687557555693623e-07, 'epoch': 1.89} {'loss': 0.2829, 'learning_rate': 1.568163031745551e-07, 'epoch': 1.89} {'loss': 0.241, 'learning_rate': 1.5675704190325602e-07, 'epoch': 1.89} {'loss': 0.3336, 'learning_rate': 1.5669779174310674e-07, 'epoch': 1.89} {'loss': 0.3289, 'learning_rate': 1.5663855269417383e-07, 'epoch': 1.89} {'loss': 0.2131, 'learning_rate': 1.5657932475652393e-07, 'epoch': 1.89} {'loss': 0.4703, 'learning_rate': 1.5652010793022365e-07, 'epoch': 1.89} {'loss': 0.2536, 'learning_rate': 1.5646090221534182e-07, 'epoch': 1.89} {'loss': 0.3963, 'learning_rate': 1.5640170761194284e-07, 'epoch': 1.89} {'loss': 0.287, 'learning_rate': 1.5634252412009443e-07, 'epoch': 1.89} {'loss': 0.39, 'learning_rate': 1.562833517398632e-07, 'epoch': 1.89} {'loss': 0.2119, 'learning_rate': 1.5622419047131688e-07, 'epoch': 1.89} {'loss': 0.3693, 'learning_rate': 1.5616504031452206e-07, 'epoch': 1.89} {'loss': 0.2862, 'learning_rate': 1.5610590126954427e-07, 'epoch': 1.89} {'loss': 0.329, 'learning_rate': 1.5604677333645125e-07, 'epoch': 1.89} {'loss': 0.2435, 'learning_rate': 1.5598765651530846e-07, 'epoch': 1.89} {'loss': 0.2403, 'learning_rate': 1.5592855080618473e-07, 'epoch': 1.89} {'loss': 0.2336, 'learning_rate': 1.558694562091456e-07, 'epoch': 1.89} {'loss': 0.3554, 'learning_rate': 1.558103727242577e-07, 'epoch': 1.89} {'loss': 0.2808, 'learning_rate': 1.557513003515887e-07, 'epoch': 1.89} {'loss': 0.2939, 'learning_rate': 1.5569223909120412e-07, 'epoch': 1.89} {'loss': 0.3178, 'learning_rate': 1.556331889431695e-07, 'epoch': 1.89} {'loss': 0.3558, 'learning_rate': 1.555741499075547e-07, 'epoch': 1.89} {'loss': 0.3772, 'learning_rate': 1.555151219844242e-07, 'epoch': 1.89} {'loss': 0.3033, 'learning_rate': 1.5545610517384567e-07, 'epoch': 1.89} {'loss': 0.2855, 'learning_rate': 1.5539709947588467e-07, 'epoch': 1.89} {'loss': 0.3514, 'learning_rate': 1.5533810489060775e-07, 'epoch': 1.89} {'loss': 0.2305, 'learning_rate': 1.5527912141808378e-07, 'epoch': 1.89} {'loss': 0.4393, 'learning_rate': 1.5522014905837602e-07, 'epoch': 1.89} {'loss': 0.1917, 'learning_rate': 1.5516118781155332e-07, 'epoch': 1.89} {'loss': 0.3355, 'learning_rate': 1.5510223767768117e-07, 'epoch': 1.89} {'loss': 0.3953, 'learning_rate': 1.550432986568262e-07, 'epoch': 1.89} {'loss': 0.4048, 'learning_rate': 1.5498437074905614e-07, 'epoch': 1.89} {'loss': 0.34, 'learning_rate': 1.5492545395443648e-07, 'epoch': 1.89} {'loss': 0.2187, 'learning_rate': 1.5486654827303271e-07, 'epoch': 1.89} {'loss': 0.3248, 'learning_rate': 1.548076537049137e-07, 'epoch': 1.89} {'loss': 0.1737, 'learning_rate': 1.5474877025014378e-07, 'epoch': 1.89} {'loss': 0.2523, 'learning_rate': 1.5468989790879185e-07, 'epoch': 1.89} {'loss': 0.2494, 'learning_rate': 1.5463103668092227e-07, 'epoch': 1.89} {'loss': 0.2869, 'learning_rate': 1.5457218656660056e-07, 'epoch': 1.89} {'loss': 0.3478, 'learning_rate': 1.5451334756589664e-07, 'epoch': 1.89} {'loss': 0.3136, 'learning_rate': 1.5445451967887382e-07, 'epoch': 1.89} {'loss': 0.4192, 'learning_rate': 1.543957029055998e-07, 'epoch': 1.89} {'loss': 0.357, 'learning_rate': 1.5433689724614008e-07, 'epoch': 1.89} {'loss': 0.2821, 'learning_rate': 1.5427810270056353e-07, 'epoch': 1.89} {'loss': 0.3593, 'learning_rate': 1.5421931926893342e-07, 'epoch': 1.89} {'loss': 0.2216, 'learning_rate': 1.5416054695131855e-07, 'epoch': 1.89} {'loss': 0.1573, 'learning_rate': 1.5410178574778223e-07, 'epoch': 1.89} {'loss': 0.371, 'learning_rate': 1.5404303565839441e-07, 'epoch': 1.89} {'loss': 0.4068, 'learning_rate': 1.5398429668321945e-07, 'epoch': 1.89} {'loss': 0.2551, 'learning_rate': 1.53925568822324e-07, 'epoch': 1.89} {'loss': 0.2866, 'learning_rate': 1.5386685207577356e-07, 'epoch': 1.89} {'loss': 0.2733, 'learning_rate': 1.5380814644363472e-07, 'epoch': 1.89} {'loss': 0.333, 'learning_rate': 1.5374945192597634e-07, 'epoch': 1.89} {'loss': 0.3931, 'learning_rate': 1.5369076852286058e-07, 'epoch': 1.89} {'loss': 0.3308, 'learning_rate': 1.5363209623435627e-07, 'epoch': 1.89} {'loss': 0.3897, 'learning_rate': 1.535734350605278e-07, 'epoch': 1.89} {'loss': 0.4631, 'learning_rate': 1.53514785001444e-07, 'epoch': 1.89} {'loss': 0.2852, 'learning_rate': 1.5345614605716818e-07, 'epoch': 1.89} {'loss': 0.374, 'learning_rate': 1.5339751822776915e-07, 'epoch': 1.89} {'loss': 0.346, 'learning_rate': 1.5333890151331132e-07, 'epoch': 1.89} {'loss': 0.187, 'learning_rate': 1.532802959138624e-07, 'epoch': 1.89} {'loss': 0.1831, 'learning_rate': 1.5322170142948678e-07, 'epoch': 1.89} {'loss': 0.3528, 'learning_rate': 1.531631180602522e-07, 'epoch': 1.89} {'loss': 0.2943, 'learning_rate': 1.5310454580622302e-07, 'epoch': 1.89} {'loss': 0.3687, 'learning_rate': 1.5304598466746702e-07, 'epoch': 1.89} {'loss': 0.2082, 'learning_rate': 1.5298743464404963e-07, 'epoch': 1.89} {'loss': 0.2775, 'learning_rate': 1.529288957360353e-07, 'epoch': 1.89} {'loss': 0.2881, 'learning_rate': 1.5287036794349285e-07, 'epoch': 1.89} {'loss': 0.2291, 'learning_rate': 1.5281185126648667e-07, 'epoch': 1.89} {'loss': 0.1312, 'learning_rate': 1.527533457050845e-07, 'epoch': 1.89} {'loss': 0.3036, 'learning_rate': 1.526948512593518e-07, 'epoch': 1.89} {'loss': 0.2561, 'learning_rate': 1.5263636792935298e-07, 'epoch': 1.89} {'loss': 0.3801, 'learning_rate': 1.5257789571515468e-07, 'epoch': 1.89} {'loss': 0.3374, 'learning_rate': 1.525194346168235e-07, 'epoch': 1.89} {'loss': 0.3107, 'learning_rate': 1.5246098463442715e-07, 'epoch': 1.89} {'loss': 0.3859, 'learning_rate': 1.524025457680278e-07, 'epoch': 1.89} {'loss': 0.1979, 'learning_rate': 1.5234411801769434e-07, 'epoch': 1.89} {'loss': 0.3097, 'learning_rate': 1.5228570138348998e-07, 'epoch': 1.89} {'loss': 0.3709, 'learning_rate': 1.5222729586548468e-07, 'epoch': 1.89} {'loss': 0.3742, 'learning_rate': 1.5216890146374064e-07, 'epoch': 1.89} {'loss': 0.3239, 'learning_rate': 1.5211051817832667e-07, 'epoch': 1.89} {'loss': 0.2931, 'learning_rate': 1.5205214600930608e-07, 'epoch': 1.89} {'loss': 0.3045, 'learning_rate': 1.5199378495674655e-07, 'epoch': 1.89} {'loss': 0.2677, 'learning_rate': 1.5193543502071361e-07, 'epoch': 1.89} {'loss': 0.3221, 'learning_rate': 1.5187709620127166e-07, 'epoch': 1.89} {'loss': 0.3848, 'learning_rate': 1.5181876849848842e-07, 'epoch': 1.89} {'loss': 0.2382, 'learning_rate': 1.517604519124294e-07, 'epoch': 1.89} {'loss': 0.3056, 'learning_rate': 1.5170214644316006e-07, 'epoch': 1.89} {'loss': 0.2957, 'learning_rate': 1.5164385209074595e-07, 'epoch': 1.89} {'loss': 0.4215, 'learning_rate': 1.5158556885525365e-07, 'epoch': 1.89} {'loss': 0.2972, 'learning_rate': 1.515272967367476e-07, 'epoch': 1.89} {'loss': 0.3389, 'learning_rate': 1.5146903573529547e-07, 'epoch': 1.89} {'loss': 0.3328, 'learning_rate': 1.5141078585096058e-07, 'epoch': 1.89} {'loss': 0.4147, 'learning_rate': 1.5135254708381176e-07, 'epoch': 1.89} {'loss': 0.3722, 'learning_rate': 1.5129431943391115e-07, 'epoch': 1.89} {'loss': 0.3067, 'learning_rate': 1.5123610290132873e-07, 'epoch': 1.89} {'loss': 0.3408, 'learning_rate': 1.5117789748612666e-07, 'epoch': 1.89} {'loss': 0.4303, 'learning_rate': 1.5111970318837155e-07, 'epoch': 1.89} {'loss': 0.1843, 'learning_rate': 1.5106152000813113e-07, 'epoch': 1.89} {'loss': 0.2477, 'learning_rate': 1.5100334794546755e-07, 'epoch': 1.89} {'loss': 0.3656, 'learning_rate': 1.509451870004497e-07, 'epoch': 1.89} {'loss': 0.2969, 'learning_rate': 1.5088703717314078e-07, 'epoch': 1.89} {'loss': 0.2638, 'learning_rate': 1.5082889846360748e-07, 'epoch': 1.89} {'loss': 0.3317, 'learning_rate': 1.5077077087191637e-07, 'epoch': 1.89} {'loss': 0.2306, 'learning_rate': 1.5071265439813187e-07, 'epoch': 1.89} {'loss': 0.3562, 'learning_rate': 1.5065454904231835e-07, 'epoch': 1.89} {'loss': 0.3347, 'learning_rate': 1.5059645480454465e-07, 'epoch': 1.89} {'loss': 0.3547, 'learning_rate': 1.5053837168487406e-07, 'epoch': 1.89} {'loss': 0.4456, 'learning_rate': 1.504802996833732e-07, 'epoch': 1.89} {'loss': 0.1649, 'learning_rate': 1.5042223880010643e-07, 'epoch': 1.89} {'loss': 0.2588, 'learning_rate': 1.5036418903514039e-07, 'epoch': 1.89} {'loss': 0.4292, 'learning_rate': 1.5030615038854056e-07, 'epoch': 1.89} {'loss': 0.3347, 'learning_rate': 1.502481228603714e-07, 'epoch': 1.89} {'loss': 0.3853, 'learning_rate': 1.501901064506994e-07, 'epoch': 1.89} {'loss': 0.4244, 'learning_rate': 1.501321011595891e-07, 'epoch': 1.89} {'loss': 0.3302, 'learning_rate': 1.50074106987107e-07, 'epoch': 1.89} {'loss': 0.299, 'learning_rate': 1.5001612393331755e-07, 'epoch': 1.89} {'loss': 0.1265, 'learning_rate': 1.4995815199828846e-07, 'epoch': 1.89} {'loss': 0.391, 'learning_rate': 1.4990019118208187e-07, 'epoch': 1.89} {'loss': 0.2252, 'learning_rate': 1.4984224148476667e-07, 'epoch': 1.89} {'loss': 0.3256, 'learning_rate': 1.49784302906405e-07, 'epoch': 1.89} {'loss': 0.2685, 'learning_rate': 1.4972637544706458e-07, 'epoch': 1.89} {'loss': 0.2409, 'learning_rate': 1.4966845910680872e-07, 'epoch': 1.89} {'loss': 0.2988, 'learning_rate': 1.496105538857051e-07, 'epoch': 1.89} {'loss': 0.4804, 'learning_rate': 1.4955265978381816e-07, 'epoch': 1.89} {'loss': 0.3557, 'learning_rate': 1.4949477680121226e-07, 'epoch': 1.89} {'loss': 0.3814, 'learning_rate': 1.4943690493795514e-07, 'epoch': 1.89} {'loss': 0.4429, 'learning_rate': 1.4937904419410899e-07, 'epoch': 1.89} {'loss': 0.3121, 'learning_rate': 1.4932119456974147e-07, 'epoch': 1.89} {'loss': 0.3312, 'learning_rate': 1.4926335606491705e-07, 'epoch': 1.89} {'loss': 0.1645, 'learning_rate': 1.4920552867970117e-07, 'epoch': 1.89} {'loss': 0.387, 'learning_rate': 1.4914771241415826e-07, 'epoch': 1.89} {'loss': 0.3329, 'learning_rate': 1.4908990726835603e-07, 'epoch': 1.89} {'loss': 0.4484, 'learning_rate': 1.4903211324235555e-07, 'epoch': 1.89} {'loss': 0.4307, 'learning_rate': 1.4897433033622676e-07, 'epoch': 1.89} {'loss': 0.1925, 'learning_rate': 1.4891655855003185e-07, 'epoch': 1.89} {'loss': 0.3475, 'learning_rate': 1.488587978838374e-07, 'epoch': 1.89} {'loss': 0.204, 'learning_rate': 1.488010483377078e-07, 'epoch': 1.89} {'loss': 0.5545, 'learning_rate': 1.487433099117075e-07, 'epoch': 1.89} {'loss': 0.2427, 'learning_rate': 1.4868558260590417e-07, 'epoch': 1.89} {'loss': 0.3419, 'learning_rate': 1.4862786642036108e-07, 'epoch': 1.89} {'loss': 0.2684, 'learning_rate': 1.485701613551438e-07, 'epoch': 1.89} {'loss': 0.4129, 'learning_rate': 1.4851246741031666e-07, 'epoch': 1.89} {'loss': 0.3274, 'learning_rate': 1.4845478458594632e-07, 'epoch': 1.89} {'loss': 0.2689, 'learning_rate': 1.4839711288209713e-07, 'epoch': 1.89} {'loss': 0.3015, 'learning_rate': 1.4833945229883461e-07, 'epoch': 1.89} {'loss': 0.1859, 'learning_rate': 1.4828180283622317e-07, 'epoch': 1.89} {'loss': 0.2436, 'learning_rate': 1.482241644943283e-07, 'epoch': 1.89} {'loss': 0.3744, 'learning_rate': 1.481665372732144e-07, 'epoch': 1.89} {'loss': 0.4158, 'learning_rate': 1.4810892117294695e-07, 'epoch': 1.89} {'loss': 0.3476, 'learning_rate': 1.480513161935926e-07, 'epoch': 1.89} {'loss': 0.2497, 'learning_rate': 1.4799372233521347e-07, 'epoch': 1.89} {'loss': 0.4121, 'learning_rate': 1.4793613959787623e-07, 'epoch': 1.89} {'loss': 0.3269, 'learning_rate': 1.4787856798164524e-07, 'epoch': 1.89} {'loss': 0.2688, 'learning_rate': 1.478210074865871e-07, 'epoch': 1.89} {'loss': 0.3926, 'learning_rate': 1.4776345811276406e-07, 'epoch': 1.89} {'loss': 0.2248, 'learning_rate': 1.4770591986024373e-07, 'epoch': 1.89} {'loss': 0.3041, 'learning_rate': 1.4764839272908948e-07, 'epoch': 1.89} {'loss': 0.2761, 'learning_rate': 1.4759087671936678e-07, 'epoch': 1.89} {'loss': 0.1928, 'learning_rate': 1.4753337183114004e-07, 'epoch': 1.89} {'loss': 0.4013, 'learning_rate': 1.4747587806447583e-07, 'epoch': 1.89} {'loss': 0.2249, 'learning_rate': 1.4741839541943638e-07, 'epoch': 1.89} {'loss': 0.2985, 'learning_rate': 1.4736092389608937e-07, 'epoch': 1.89} {'loss': 0.2047, 'learning_rate': 1.473034634944981e-07, 'epoch': 1.89} {'loss': 0.5081, 'learning_rate': 1.4724601421472583e-07, 'epoch': 1.89} {'loss': 0.393, 'learning_rate': 1.4718857605684145e-07, 'epoch': 1.89} {'loss': 0.3513, 'learning_rate': 1.4713114902090486e-07, 'epoch': 1.89} {'loss': 0.3154, 'learning_rate': 1.4707373310698603e-07, 'epoch': 1.89} {'loss': 0.3914, 'learning_rate': 1.4701632831514602e-07, 'epoch': 1.89} {'loss': 0.2623, 'learning_rate': 1.469589346454525e-07, 'epoch': 1.89} {'loss': 0.2994, 'learning_rate': 1.4690155209796774e-07, 'epoch': 1.89} {'loss': 0.2592, 'learning_rate': 1.468441806727572e-07, 'epoch': 1.89} {'loss': 0.2967, 'learning_rate': 1.4678682036988633e-07, 'epoch': 1.89} {'loss': 0.2776, 'learning_rate': 1.467294711894196e-07, 'epoch': 1.89} {'loss': 0.2064, 'learning_rate': 1.4667213313142138e-07, 'epoch': 1.89} {'loss': 0.2987, 'learning_rate': 1.4661480619595602e-07, 'epoch': 1.89} {'loss': 0.2564, 'learning_rate': 1.465574903830902e-07, 'epoch': 1.89} {'loss': 0.2447, 'learning_rate': 1.4650018569288603e-07, 'epoch': 1.89} {'loss': 0.1631, 'learning_rate': 1.4644289212541018e-07, 'epoch': 1.89} {'loss': 0.2579, 'learning_rate': 1.463856096807259e-07, 'epoch': 1.89} {'loss': 0.29, 'learning_rate': 1.463283383588987e-07, 'epoch': 1.89} {'loss': 0.3205, 'learning_rate': 1.4627107815999297e-07, 'epoch': 1.89} {'loss': 0.1621, 'learning_rate': 1.4621382908407422e-07, 'epoch': 1.89} {'loss': 0.3961, 'learning_rate': 1.4615659113120572e-07, 'epoch': 1.89} {'loss': 0.2964, 'learning_rate': 1.46099364301453e-07, 'epoch': 1.89} {'loss': 0.3143, 'learning_rate': 1.460421485948804e-07, 'epoch': 1.89} {'loss': 0.2246, 'learning_rate': 1.4598494401155128e-07, 'epoch': 1.89} {'loss': 0.3363, 'learning_rate': 1.459277505515322e-07, 'epoch': 1.89} {'loss': 0.3218, 'learning_rate': 1.4587056821488643e-07, 'epoch': 1.89} {'loss': 0.4464, 'learning_rate': 1.458133970016795e-07, 'epoch': 1.89} {'loss': 0.3519, 'learning_rate': 1.457562369119747e-07, 'epoch': 1.89} {'loss': 0.2171, 'learning_rate': 1.4569908794583753e-07, 'epoch': 1.89} {'loss': 0.2421, 'learning_rate': 1.456419501033324e-07, 'epoch': 1.89} {'loss': 0.1344, 'learning_rate': 1.455848233845236e-07, 'epoch': 1.89} {'loss': 0.2867, 'learning_rate': 1.4552770778947457e-07, 'epoch': 1.89} {'loss': 0.2317, 'learning_rate': 1.4547060331825292e-07, 'epoch': 1.89} {'loss': 0.4031, 'learning_rate': 1.4541350997091975e-07, 'epoch': 1.89} {'loss': 0.3192, 'learning_rate': 1.4535642774754055e-07, 'epoch': 1.89} {'loss': 0.2906, 'learning_rate': 1.4529935664818085e-07, 'epoch': 1.89} {'loss': 0.4061, 'learning_rate': 1.4524229667290279e-07, 'epoch': 1.89} {'loss': 0.3134, 'learning_rate': 1.4518524782177412e-07, 'epoch': 1.89} {'loss': 0.2047, 'learning_rate': 1.4512821009485588e-07, 'epoch': 1.89} {'loss': 0.3262, 'learning_rate': 1.4507118349221473e-07, 'epoch': 1.89} {'loss': 0.2533, 'learning_rate': 1.4501416801391387e-07, 'epoch': 1.89} {'loss': 0.3558, 'learning_rate': 1.4495716366001776e-07, 'epoch': 1.89} {'loss': 0.2404, 'learning_rate': 1.449001704305908e-07, 'epoch': 1.89} {'loss': 0.212, 'learning_rate': 1.4484318832569842e-07, 'epoch': 1.89} {'loss': 0.2109, 'learning_rate': 1.4478621734540289e-07, 'epoch': 1.89} {'loss': 0.3717, 'learning_rate': 1.4472925748977073e-07, 'epoch': 1.89} {'loss': 0.2095, 'learning_rate': 1.4467230875886528e-07, 'epoch': 1.89} {'loss': 0.2622, 'learning_rate': 1.4461537115274982e-07, 'epoch': 1.89} {'loss': 0.3823, 'learning_rate': 1.4455844467149094e-07, 'epoch': 1.89} {'loss': 0.2194, 'learning_rate': 1.4450152931514972e-07, 'epoch': 1.9} {'loss': 0.1902, 'learning_rate': 1.4444462508379274e-07, 'epoch': 1.9} {'loss': 0.3038, 'learning_rate': 1.4438773197748334e-07, 'epoch': 1.9} {'loss': 0.3436, 'learning_rate': 1.44330849996287e-07, 'epoch': 1.9} {'loss': 0.3055, 'learning_rate': 1.4427397914026698e-07, 'epoch': 1.9} {'loss': 0.2928, 'learning_rate': 1.4421711940948657e-07, 'epoch': 1.9} {'loss': 0.3132, 'learning_rate': 1.4416027080401129e-07, 'epoch': 1.9} {'loss': 0.3871, 'learning_rate': 1.4410343332390552e-07, 'epoch': 1.9} {'loss': 0.2236, 'learning_rate': 1.4404660696923145e-07, 'epoch': 1.9} {'loss': 0.3289, 'learning_rate': 1.4398979174005567e-07, 'epoch': 1.9} {'loss': 0.2205, 'learning_rate': 1.4393298763644147e-07, 'epoch': 1.9} {'loss': 0.2933, 'learning_rate': 1.4387619465845104e-07, 'epoch': 1.9} {'loss': 0.3584, 'learning_rate': 1.4381941280615208e-07, 'epoch': 1.9} {'loss': 0.2306, 'learning_rate': 1.4376264207960565e-07, 'epoch': 1.9} {'loss': 0.1821, 'learning_rate': 1.437058824788773e-07, 'epoch': 1.9} {'loss': 0.2591, 'learning_rate': 1.4364913400403024e-07, 'epoch': 1.9} {'loss': 0.2935, 'learning_rate': 1.4359239665513002e-07, 'epoch': 1.9} {'loss': 0.3051, 'learning_rate': 1.435356704322388e-07, 'epoch': 1.9} {'loss': 0.244, 'learning_rate': 1.4347895533542212e-07, 'epoch': 1.9} {'loss': 0.2499, 'learning_rate': 1.4342225136474208e-07, 'epoch': 1.9} {'loss': 0.3827, 'learning_rate': 1.4336555852026646e-07, 'epoch': 1.9} {'loss': 0.2127, 'learning_rate': 1.4330887680205407e-07, 'epoch': 1.9} {'loss': 0.3483, 'learning_rate': 1.4325220621017378e-07, 'epoch': 1.9} {'loss': 0.4605, 'learning_rate': 1.4319554674468662e-07, 'epoch': 1.9} {'loss': 0.2613, 'learning_rate': 1.43138898405657e-07, 'epoch': 1.9} {'loss': 0.3459, 'learning_rate': 1.4308226119315038e-07, 'epoch': 1.9} {'loss': 0.3233, 'learning_rate': 1.4302563510722789e-07, 'epoch': 1.9} {'loss': 0.4909, 'learning_rate': 1.429690201479561e-07, 'epoch': 1.9} {'loss': 0.3319, 'learning_rate': 1.429124163153972e-07, 'epoch': 1.9} {'loss': 0.3112, 'learning_rate': 1.428558236096167e-07, 'epoch': 1.9} {'loss': 0.3496, 'learning_rate': 1.4279924203067563e-07, 'epoch': 1.9} {'loss': 0.192, 'learning_rate': 1.4274267157864174e-07, 'epoch': 1.9} {'loss': 0.338, 'learning_rate': 1.426861122535761e-07, 'epoch': 1.9} {'loss': 0.1934, 'learning_rate': 1.4262956405554417e-07, 'epoch': 1.9} {'loss': 0.2714, 'learning_rate': 1.4257302698460817e-07, 'epoch': 1.9} {'loss': 0.341, 'learning_rate': 1.425165010408336e-07, 'epoch': 1.9} {'loss': 0.3651, 'learning_rate': 1.424599862242826e-07, 'epoch': 1.9} {'loss': 0.2344, 'learning_rate': 1.4240348253501956e-07, 'epoch': 1.9} {'loss': 0.2368, 'learning_rate': 1.4234698997310891e-07, 'epoch': 1.9} {'loss': 0.2673, 'learning_rate': 1.4229050853861393e-07, 'epoch': 1.9} {'loss': 0.3991, 'learning_rate': 1.4223403823159898e-07, 'epoch': 1.9} {'loss': 0.3349, 'learning_rate': 1.4217757905212625e-07, 'epoch': 1.9} {'loss': 0.2843, 'learning_rate': 1.4212113100026126e-07, 'epoch': 1.9} {'loss': 0.4186, 'learning_rate': 1.4206469407606615e-07, 'epoch': 1.9} {'loss': 0.3575, 'learning_rate': 1.4200826827960645e-07, 'epoch': 1.9} {'loss': 0.1939, 'learning_rate': 1.4195185361094432e-07, 'epoch': 1.9} {'loss': 0.3337, 'learning_rate': 1.4189545007014415e-07, 'epoch': 1.9} {'loss': 0.3083, 'learning_rate': 1.4183905765726924e-07, 'epoch': 1.9} {'loss': 0.3059, 'learning_rate': 1.4178267637238396e-07, 'epoch': 1.9} {'loss': 0.3244, 'learning_rate': 1.417263062155505e-07, 'epoch': 1.9} {'loss': 0.1332, 'learning_rate': 1.4166994718683325e-07, 'epoch': 1.9} {'loss': 0.1658, 'learning_rate': 1.416135992862977e-07, 'epoch': 1.9} {'loss': 0.2297, 'learning_rate': 1.415572625140038e-07, 'epoch': 1.9} {'loss': 0.202, 'learning_rate': 1.415009368700182e-07, 'epoch': 1.9} {'loss': 0.2946, 'learning_rate': 1.4144462235440193e-07, 'epoch': 1.9} {'loss': 0.3221, 'learning_rate': 1.413883189672216e-07, 'epoch': 1.9} {'loss': 0.212, 'learning_rate': 1.413320267085383e-07, 'epoch': 1.9} {'loss': 0.27, 'learning_rate': 1.4127574557841638e-07, 'epoch': 1.9} {'loss': 0.3334, 'learning_rate': 1.4121947557692027e-07, 'epoch': 1.9} {'loss': 0.255, 'learning_rate': 1.4116321670411215e-07, 'epoch': 1.9} {'loss': 0.3898, 'learning_rate': 1.4110696896005638e-07, 'epoch': 1.9} {'loss': 0.2637, 'learning_rate': 1.4105073234481514e-07, 'epoch': 1.9} {'loss': 0.3154, 'learning_rate': 1.4099450685845395e-07, 'epoch': 1.9} {'loss': 0.1719, 'learning_rate': 1.4093829250103496e-07, 'epoch': 1.9} {'loss': 0.3032, 'learning_rate': 1.4088208927262148e-07, 'epoch': 1.9} {'loss': 0.2622, 'learning_rate': 1.4082589717327678e-07, 'epoch': 1.9} {'loss': 0.2217, 'learning_rate': 1.4076971620306634e-07, 'epoch': 1.9} {'loss': 0.292, 'learning_rate': 1.4071354636205014e-07, 'epoch': 1.9} {'loss': 0.3357, 'learning_rate': 1.406573876502948e-07, 'epoch': 1.9} {'loss': 0.2194, 'learning_rate': 1.4060124006786245e-07, 'epoch': 1.9} {'loss': 0.2888, 'learning_rate': 1.4054510361481642e-07, 'epoch': 1.9} {'loss': 0.4062, 'learning_rate': 1.4048897829122e-07, 'epoch': 1.9} {'loss': 0.4033, 'learning_rate': 1.4043286409713642e-07, 'epoch': 1.9} {'loss': 0.1719, 'learning_rate': 1.4037676103263008e-07, 'epoch': 1.9} {'loss': 0.2426, 'learning_rate': 1.403206690977621e-07, 'epoch': 1.9} {'loss': 0.4606, 'learning_rate': 1.4026458829259793e-07, 'epoch': 1.9} {'loss': 0.3755, 'learning_rate': 1.4020851861719975e-07, 'epoch': 1.9} {'loss': 0.3294, 'learning_rate': 1.4015246007163196e-07, 'epoch': 1.9} {'loss': 0.4369, 'learning_rate': 1.4009641265595674e-07, 'epoch': 1.9} {'loss': 0.3154, 'learning_rate': 1.4004037637023738e-07, 'epoch': 1.9} {'loss': 0.233, 'learning_rate': 1.3998435121453825e-07, 'epoch': 1.9} {'loss': 0.3006, 'learning_rate': 1.3992833718892153e-07, 'epoch': 1.9} {'loss': 0.2559, 'learning_rate': 1.3987233429344937e-07, 'epoch': 1.9} {'loss': 0.3351, 'learning_rate': 1.3981634252818842e-07, 'epoch': 1.9} {'loss': 0.3357, 'learning_rate': 1.3976036189319975e-07, 'epoch': 1.9} {'loss': 0.1799, 'learning_rate': 1.3970439238854548e-07, 'epoch': 1.9} {'loss': 0.1512, 'learning_rate': 1.3964843401429007e-07, 'epoch': 1.9} {'loss': 0.2743, 'learning_rate': 1.3959248677049676e-07, 'epoch': 1.9} {'loss': 0.3144, 'learning_rate': 1.3953655065722882e-07, 'epoch': 1.9} {'loss': 0.2569, 'learning_rate': 1.3948062567454844e-07, 'epoch': 1.9} {'loss': 0.3276, 'learning_rate': 1.3942471182252006e-07, 'epoch': 1.9} {'loss': 0.3178, 'learning_rate': 1.3936880910120464e-07, 'epoch': 1.9} {'loss': 0.3031, 'learning_rate': 1.393129175106678e-07, 'epoch': 1.9} {'loss': 0.2975, 'learning_rate': 1.392570370509716e-07, 'epoch': 1.9} {'loss': 0.4259, 'learning_rate': 1.392011677221794e-07, 'epoch': 1.9} {'loss': 0.3999, 'learning_rate': 1.3914530952435334e-07, 'epoch': 1.9} {'loss': 0.3751, 'learning_rate': 1.3908946245755784e-07, 'epoch': 1.9} {'loss': 0.3652, 'learning_rate': 1.3903362652185503e-07, 'epoch': 1.9} {'loss': 0.2957, 'learning_rate': 1.3897780171730713e-07, 'epoch': 1.9} {'loss': 0.1672, 'learning_rate': 1.389219880439796e-07, 'epoch': 1.9} {'loss': 0.3171, 'learning_rate': 1.3886618550193243e-07, 'epoch': 1.9} {'loss': 0.2092, 'learning_rate': 1.388103940912311e-07, 'epoch': 1.9} {'loss': 0.2787, 'learning_rate': 1.3875461381193778e-07, 'epoch': 1.9} {'loss': 0.2684, 'learning_rate': 1.3869884466411465e-07, 'epoch': 1.9} {'loss': 0.2743, 'learning_rate': 1.386430866478261e-07, 'epoch': 1.9} {'loss': 0.3604, 'learning_rate': 1.3858733976313431e-07, 'epoch': 1.9} {'loss': 0.2611, 'learning_rate': 1.3853160401010034e-07, 'epoch': 1.9} {'loss': 0.3408, 'learning_rate': 1.384758793887908e-07, 'epoch': 1.9} {'loss': 0.3026, 'learning_rate': 1.3842016589926567e-07, 'epoch': 1.9} {'loss': 0.3735, 'learning_rate': 1.383644635415904e-07, 'epoch': 1.9} {'loss': 0.3901, 'learning_rate': 1.3830877231582607e-07, 'epoch': 1.9} {'loss': 0.252, 'learning_rate': 1.3825309222203487e-07, 'epoch': 1.9} {'loss': 0.3057, 'learning_rate': 1.3819742326028118e-07, 'epoch': 1.9} {'loss': 0.3043, 'learning_rate': 1.3814176543062609e-07, 'epoch': 1.9} {'loss': 0.513, 'learning_rate': 1.3808611873313504e-07, 'epoch': 1.9} {'loss': 0.2544, 'learning_rate': 1.3803048316786915e-07, 'epoch': 1.9} {'loss': 0.3044, 'learning_rate': 1.379748587348917e-07, 'epoch': 1.9} {'loss': 0.3152, 'learning_rate': 1.379192454342648e-07, 'epoch': 1.9} {'loss': 0.2561, 'learning_rate': 1.3786364326605183e-07, 'epoch': 1.9} {'loss': 0.3656, 'learning_rate': 1.378080522303149e-07, 'epoch': 1.9} {'loss': 0.389, 'learning_rate': 1.3775247232711843e-07, 'epoch': 1.9} {'loss': 0.1852, 'learning_rate': 1.3769690355652342e-07, 'epoch': 1.9} {'loss': 0.3004, 'learning_rate': 1.3764134591859324e-07, 'epoch': 1.9} {'loss': 0.3083, 'learning_rate': 1.3758579941339113e-07, 'epoch': 1.9} {'loss': 0.2916, 'learning_rate': 1.3753026404097812e-07, 'epoch': 1.9} {'loss': 0.3458, 'learning_rate': 1.3747473980141978e-07, 'epoch': 1.9} {'loss': 0.2028, 'learning_rate': 1.3741922669477493e-07, 'epoch': 1.9} {'loss': 0.2022, 'learning_rate': 1.3736372472111016e-07, 'epoch': 1.9} {'loss': 0.3188, 'learning_rate': 1.3730823388048432e-07, 'epoch': 1.9} {'loss': 0.1929, 'learning_rate': 1.3725275417296402e-07, 'epoch': 1.9} {'loss': 0.3469, 'learning_rate': 1.3719728559860812e-07, 'epoch': 1.9} {'loss': 0.3882, 'learning_rate': 1.3714182815748212e-07, 'epoch': 1.9} {'loss': 0.3024, 'learning_rate': 1.3708638184964707e-07, 'epoch': 1.9} {'loss': 0.1912, 'learning_rate': 1.3703094667516625e-07, 'epoch': 1.9} {'loss': 0.2814, 'learning_rate': 1.3697552263410073e-07, 'epoch': 1.9} {'loss': 0.4147, 'learning_rate': 1.3692010972651605e-07, 'epoch': 1.9} {'loss': 0.3102, 'learning_rate': 1.3686470795247208e-07, 'epoch': 1.9} {'loss': 0.3926, 'learning_rate': 1.3680931731203217e-07, 'epoch': 1.9} {'loss': 0.3401, 'learning_rate': 1.3675393780525958e-07, 'epoch': 1.9} {'loss': 0.3453, 'learning_rate': 1.3669856943221537e-07, 'epoch': 1.9} {'loss': 0.431, 'learning_rate': 1.3664321219296394e-07, 'epoch': 1.9} {'loss': 0.2541, 'learning_rate': 1.3658786608756637e-07, 'epoch': 1.9} {'loss': 0.4035, 'learning_rate': 1.3653253111608588e-07, 'epoch': 1.9} {'loss': 0.3512, 'learning_rate': 1.364772072785836e-07, 'epoch': 1.9} {'loss': 0.179, 'learning_rate': 1.3642189457512279e-07, 'epoch': 1.9} {'loss': 0.3806, 'learning_rate': 1.363665930057667e-07, 'epoch': 1.9} {'loss': 0.4382, 'learning_rate': 1.3631130257057756e-07, 'epoch': 1.9} {'loss': 0.2895, 'learning_rate': 1.362560232696153e-07, 'epoch': 1.9} {'loss': 0.2194, 'learning_rate': 1.362007551029465e-07, 'epoch': 1.9} {'loss': 0.4244, 'learning_rate': 1.3614549807063115e-07, 'epoch': 1.9} {'loss': 0.3758, 'learning_rate': 1.360902521727303e-07, 'epoch': 1.9} {'loss': 0.3384, 'learning_rate': 1.3603501740930948e-07, 'epoch': 1.9} {'loss': 0.3747, 'learning_rate': 1.3597979378042746e-07, 'epoch': 1.9} {'loss': 0.2954, 'learning_rate': 1.3592458128614982e-07, 'epoch': 1.9} {'loss': 0.34, 'learning_rate': 1.3586937992653759e-07, 'epoch': 1.9} {'loss': 0.4111, 'learning_rate': 1.3581418970165295e-07, 'epoch': 1.9} {'loss': 0.2252, 'learning_rate': 1.3575901061155805e-07, 'epoch': 1.9} {'loss': 0.2353, 'learning_rate': 1.357038426563162e-07, 'epoch': 1.9} {'loss': 0.3798, 'learning_rate': 1.3564868583598845e-07, 'epoch': 1.9} {'loss': 0.2445, 'learning_rate': 1.3559354015063696e-07, 'epoch': 1.9} {'loss': 0.2641, 'learning_rate': 1.3553840560032615e-07, 'epoch': 1.9} {'loss': 0.5305, 'learning_rate': 1.3548328218511486e-07, 'epoch': 1.9} {'loss': 0.3401, 'learning_rate': 1.3542816990506857e-07, 'epoch': 1.9} {'loss': 0.2176, 'learning_rate': 1.3537306876024726e-07, 'epoch': 1.9} {'loss': 0.2631, 'learning_rate': 1.3531797875071418e-07, 'epoch': 1.9} {'loss': 0.3687, 'learning_rate': 1.352628998765304e-07, 'epoch': 1.9} {'loss': 0.2969, 'learning_rate': 1.3520783213776035e-07, 'epoch': 1.9} {'loss': 0.3585, 'learning_rate': 1.3515277553446394e-07, 'epoch': 1.9} {'loss': 0.269, 'learning_rate': 1.3509773006670446e-07, 'epoch': 1.9} {'loss': 0.2819, 'learning_rate': 1.3504269573454298e-07, 'epoch': 1.9} {'loss': 0.205, 'learning_rate': 1.349876725380439e-07, 'epoch': 1.9} {'loss': 0.2025, 'learning_rate': 1.3493266047726716e-07, 'epoch': 1.9} {'loss': 0.2718, 'learning_rate': 1.3487765955227494e-07, 'epoch': 1.9} {'loss': 0.4463, 'learning_rate': 1.3482266976313053e-07, 'epoch': 1.9} {'loss': 0.3722, 'learning_rate': 1.3476769110989495e-07, 'epoch': 1.9} {'loss': 0.3569, 'learning_rate': 1.3471272359263044e-07, 'epoch': 1.9} {'loss': 0.2509, 'learning_rate': 1.3465776721140022e-07, 'epoch': 1.9} {'loss': 0.361, 'learning_rate': 1.3460282196626429e-07, 'epoch': 1.9} {'loss': 0.408, 'learning_rate': 1.34547887857287e-07, 'epoch': 1.9} {'loss': 0.3496, 'learning_rate': 1.3449296488452833e-07, 'epoch': 1.9} {'loss': 0.209, 'learning_rate': 1.3443805304805047e-07, 'epoch': 1.9} {'loss': 0.3565, 'learning_rate': 1.3438315234791777e-07, 'epoch': 1.9} {'loss': 0.3333, 'learning_rate': 1.343282627841891e-07, 'epoch': 1.9} {'loss': 0.4155, 'learning_rate': 1.3427338435692882e-07, 'epoch': 1.9} {'loss': 0.1449, 'learning_rate': 1.3421851706619694e-07, 'epoch': 1.9} {'loss': 0.3699, 'learning_rate': 1.3416366091205667e-07, 'epoch': 1.9} {'loss': 0.2998, 'learning_rate': 1.3410881589456914e-07, 'epoch': 1.9} {'loss': 0.1875, 'learning_rate': 1.340539820137976e-07, 'epoch': 1.9} {'loss': 0.3375, 'learning_rate': 1.33999159269802e-07, 'epoch': 1.9} {'loss': 0.2919, 'learning_rate': 1.3394434766264564e-07, 'epoch': 1.9} {'loss': 0.2488, 'learning_rate': 1.3388954719239066e-07, 'epoch': 1.9} {'loss': 0.2483, 'learning_rate': 1.3383475785909705e-07, 'epoch': 1.9} {'loss': 0.2777, 'learning_rate': 1.3377997966282808e-07, 'epoch': 1.9} {'loss': 0.3132, 'learning_rate': 1.337252126036459e-07, 'epoch': 1.9} {'loss': 0.4093, 'learning_rate': 1.336704566816116e-07, 'epoch': 1.9} {'loss': 0.1088, 'learning_rate': 1.3361571189678735e-07, 'epoch': 1.9} {'loss': 0.2271, 'learning_rate': 1.335609782492342e-07, 'epoch': 1.9} {'loss': 0.3358, 'learning_rate': 1.3350625573901544e-07, 'epoch': 1.9} {'loss': 0.3973, 'learning_rate': 1.3345154436619101e-07, 'epoch': 1.9} {'loss': 0.3206, 'learning_rate': 1.3339684413082422e-07, 'epoch': 1.9} {'loss': 0.2902, 'learning_rate': 1.333421550329761e-07, 'epoch': 1.9} {'loss': 0.2609, 'learning_rate': 1.3328747707270884e-07, 'epoch': 1.9} {'loss': 0.2993, 'learning_rate': 1.3323281025008239e-07, 'epoch': 1.9} {'loss': 0.2889, 'learning_rate': 1.3317815456516114e-07, 'epoch': 1.9} {'loss': 0.1786, 'learning_rate': 1.3312351001800394e-07, 'epoch': 1.9} {'loss': 0.2441, 'learning_rate': 1.330688766086763e-07, 'epoch': 1.9} {'loss': 0.2628, 'learning_rate': 1.3301425433723592e-07, 'epoch': 1.9} {'loss': 0.4219, 'learning_rate': 1.329596432037472e-07, 'epoch': 1.9} {'loss': 0.2874, 'learning_rate': 1.3290504320826903e-07, 'epoch': 1.9} {'loss': 0.3224, 'learning_rate': 1.3285045435086686e-07, 'epoch': 1.9} {'loss': 0.1457, 'learning_rate': 1.3279587663159953e-07, 'epoch': 1.9} {'loss': 0.352, 'learning_rate': 1.3274131005052816e-07, 'epoch': 1.9} {'loss': 0.4608, 'learning_rate': 1.3268675460771706e-07, 'epoch': 1.9} {'loss': 0.2656, 'learning_rate': 1.3263221030322516e-07, 'epoch': 1.9} {'loss': 0.3686, 'learning_rate': 1.3257767713711566e-07, 'epoch': 1.9} {'loss': 0.2614, 'learning_rate': 1.325231551094497e-07, 'epoch': 1.9} {'loss': 0.3078, 'learning_rate': 1.3246864422028825e-07, 'epoch': 1.9} {'loss': 0.2261, 'learning_rate': 1.324141444696936e-07, 'epoch': 1.9} {'loss': 0.462, 'learning_rate': 1.323596558577267e-07, 'epoch': 1.9} {'loss': 0.274, 'learning_rate': 1.3230517838444978e-07, 'epoch': 1.9} {'loss': 0.3282, 'learning_rate': 1.322507120499239e-07, 'epoch': 1.9} {'loss': 0.2436, 'learning_rate': 1.3219625685421013e-07, 'epoch': 1.9} {'loss': 0.1097, 'learning_rate': 1.3214181279737058e-07, 'epoch': 1.9} {'loss': 0.3402, 'learning_rate': 1.320873798794664e-07, 'epoch': 1.9} {'loss': 0.2984, 'learning_rate': 1.320329581005586e-07, 'epoch': 1.9} {'loss': 0.3336, 'learning_rate': 1.3197854746071048e-07, 'epoch': 1.9} {'loss': 0.3734, 'learning_rate': 1.319241479599809e-07, 'epoch': 1.9} {'loss': 0.2436, 'learning_rate': 1.3186975959843307e-07, 'epoch': 1.9} {'loss': 0.2273, 'learning_rate': 1.3181538237612702e-07, 'epoch': 1.9} {'loss': 0.3738, 'learning_rate': 1.3176101629312487e-07, 'epoch': 1.9} {'loss': 0.2804, 'learning_rate': 1.3170666134948883e-07, 'epoch': 1.9} {'loss': 0.268, 'learning_rate': 1.3165231754527884e-07, 'epoch': 1.9} {'loss': 0.405, 'learning_rate': 1.315979848805571e-07, 'epoch': 1.9} {'loss': 0.3926, 'learning_rate': 1.315436633553846e-07, 'epoch': 1.9} {'loss': 0.4268, 'learning_rate': 1.3148935296982247e-07, 'epoch': 1.9} {'loss': 0.2621, 'learning_rate': 1.3143505372393285e-07, 'epoch': 1.9} {'loss': 0.2704, 'learning_rate': 1.313807656177768e-07, 'epoch': 1.9} {'loss': 0.3484, 'learning_rate': 1.3132648865141428e-07, 'epoch': 1.9} {'loss': 0.2837, 'learning_rate': 1.312722228249075e-07, 'epoch': 1.9} {'loss': 0.2539, 'learning_rate': 1.3121796813831854e-07, 'epoch': 1.9} {'loss': 0.2878, 'learning_rate': 1.3116372459170747e-07, 'epoch': 1.9} {'loss': 0.2415, 'learning_rate': 1.3110949218513525e-07, 'epoch': 1.9} {'loss': 0.232, 'learning_rate': 1.310552709186652e-07, 'epoch': 1.9} {'loss': 0.3074, 'learning_rate': 1.310010607923562e-07, 'epoch': 1.9} {'loss': 0.2531, 'learning_rate': 1.3094686180627037e-07, 'epoch': 1.9} {'loss': 0.3192, 'learning_rate': 1.3089267396046878e-07, 'epoch': 1.9} {'loss': 0.2059, 'learning_rate': 1.3083849725501253e-07, 'epoch': 1.9} {'loss': 0.3317, 'learning_rate': 1.3078433168996262e-07, 'epoch': 1.9} {'loss': 0.3285, 'learning_rate': 1.3073017726538129e-07, 'epoch': 1.9} {'loss': 0.4097, 'learning_rate': 1.3067603398132956e-07, 'epoch': 1.9} {'loss': 0.3201, 'learning_rate': 1.3062190183786628e-07, 'epoch': 1.9} {'loss': 0.3797, 'learning_rate': 1.3056778083505471e-07, 'epoch': 1.9} {'loss': 0.3245, 'learning_rate': 1.3051367097295487e-07, 'epoch': 1.9} {'loss': 0.4519, 'learning_rate': 1.3045957225162887e-07, 'epoch': 1.9} {'loss': 0.2466, 'learning_rate': 1.3040548467113667e-07, 'epoch': 1.9} {'loss': 0.2076, 'learning_rate': 1.3035140823154048e-07, 'epoch': 1.9} {'loss': 0.2853, 'learning_rate': 1.302973429329013e-07, 'epoch': 1.9} {'loss': 0.2716, 'learning_rate': 1.3024328877527914e-07, 'epoch': 1.9} {'loss': 0.4354, 'learning_rate': 1.3018924575873505e-07, 'epoch': 1.9} {'loss': 0.3563, 'learning_rate': 1.3013521388333005e-07, 'epoch': 1.9} {'loss': 0.2605, 'learning_rate': 1.3008119314912748e-07, 'epoch': 1.9} {'loss': 0.333, 'learning_rate': 1.3002718355618394e-07, 'epoch': 1.9} {'loss': 0.3068, 'learning_rate': 1.2997318510456492e-07, 'epoch': 1.9} {'loss': 0.2652, 'learning_rate': 1.2991919779432816e-07, 'epoch': 1.9} {'loss': 0.372, 'learning_rate': 1.2986522162553583e-07, 'epoch': 1.9} {'loss': 0.2715, 'learning_rate': 1.29811256598249e-07, 'epoch': 1.9} {'loss': 0.3107, 'learning_rate': 1.2975730271252872e-07, 'epoch': 1.9} {'loss': 0.3497, 'learning_rate': 1.2970335996843496e-07, 'epoch': 1.9} {'loss': 0.2569, 'learning_rate': 1.296494283660299e-07, 'epoch': 1.9} {'loss': 0.3411, 'learning_rate': 1.2959550790537346e-07, 'epoch': 1.9} {'loss': 0.261, 'learning_rate': 1.295415985865256e-07, 'epoch': 1.9} {'loss': 0.373, 'learning_rate': 1.294877004095496e-07, 'epoch': 1.9} {'loss': 0.2948, 'learning_rate': 1.2943381337450434e-07, 'epoch': 1.9} {'loss': 0.3833, 'learning_rate': 1.2937993748145193e-07, 'epoch': 1.9} {'loss': 0.2871, 'learning_rate': 1.2932607273045128e-07, 'epoch': 1.9} {'loss': 0.2768, 'learning_rate': 1.2927221912156675e-07, 'epoch': 1.9} {'loss': 0.2362, 'learning_rate': 1.2921837665485494e-07, 'epoch': 1.9} {'loss': 0.2595, 'learning_rate': 1.2916454533037914e-07, 'epoch': 1.9} {'loss': 0.3013, 'learning_rate': 1.2911072514819933e-07, 'epoch': 1.9} {'loss': 0.1553, 'learning_rate': 1.2905691610837768e-07, 'epoch': 1.9} {'loss': 0.3508, 'learning_rate': 1.2900311821097188e-07, 'epoch': 1.9} {'loss': 0.3274, 'learning_rate': 1.2894933145604639e-07, 'epoch': 1.9} {'loss': 0.3184, 'learning_rate': 1.2889555584365886e-07, 'epoch': 1.9} {'loss': 0.353, 'learning_rate': 1.2884179137387155e-07, 'epoch': 1.9} {'loss': 0.4268, 'learning_rate': 1.2878803804674434e-07, 'epoch': 1.9} {'loss': 0.2711, 'learning_rate': 1.287342958623383e-07, 'epoch': 1.9} {'loss': 0.3594, 'learning_rate': 1.2868056482071457e-07, 'epoch': 1.9} {'loss': 0.2964, 'learning_rate': 1.28626844921933e-07, 'epoch': 1.9} {'loss': 0.1479, 'learning_rate': 1.2857313616605582e-07, 'epoch': 1.9} {'loss': 0.3367, 'learning_rate': 1.2851943855314075e-07, 'epoch': 1.9} {'loss': 0.285, 'learning_rate': 1.2846575208325106e-07, 'epoch': 1.9} {'loss': 0.3437, 'learning_rate': 1.2841207675644562e-07, 'epoch': 1.9} {'loss': 0.2575, 'learning_rate': 1.2835841257278658e-07, 'epoch': 1.9} {'loss': 0.4286, 'learning_rate': 1.283047595323328e-07, 'epoch': 1.9} {'loss': 0.228, 'learning_rate': 1.2825111763514753e-07, 'epoch': 1.9} {'loss': 0.4707, 'learning_rate': 1.2819748688128853e-07, 'epoch': 1.9} {'loss': 0.2789, 'learning_rate': 1.2814386727081685e-07, 'epoch': 1.9} {'loss': 0.304, 'learning_rate': 1.2809025880379354e-07, 'epoch': 1.9} {'loss': 0.3852, 'learning_rate': 1.280366614802797e-07, 'epoch': 1.9} {'loss': 0.3173, 'learning_rate': 1.2798307530033527e-07, 'epoch': 1.9} {'loss': 0.3234, 'learning_rate': 1.279295002640202e-07, 'epoch': 1.9} {'loss': 0.3214, 'learning_rate': 1.278759363713955e-07, 'epoch': 1.9} {'loss': 0.3244, 'learning_rate': 1.278223836225212e-07, 'epoch': 1.9} {'loss': 0.2604, 'learning_rate': 1.2776884201745943e-07, 'epoch': 1.9} {'loss': 0.2689, 'learning_rate': 1.2771531155626792e-07, 'epoch': 1.9} {'loss': 0.4006, 'learning_rate': 1.2766179223901e-07, 'epoch': 1.9} {'loss': 0.357, 'learning_rate': 1.2760828406574332e-07, 'epoch': 1.9} {'loss': 0.1992, 'learning_rate': 1.2755478703653012e-07, 'epoch': 1.9} {'loss': 0.3105, 'learning_rate': 1.2750130115143033e-07, 'epoch': 1.9} {'loss': 0.2425, 'learning_rate': 1.274478264105039e-07, 'epoch': 1.9} {'loss': 0.3246, 'learning_rate': 1.273943628138119e-07, 'epoch': 1.9} {'loss': 0.4271, 'learning_rate': 1.2734091036141426e-07, 'epoch': 1.9} {'loss': 0.2505, 'learning_rate': 1.2728746905337096e-07, 'epoch': 1.9} {'loss': 0.2597, 'learning_rate': 1.2723403888974307e-07, 'epoch': 1.9} {'loss': 0.3962, 'learning_rate': 1.271806198705905e-07, 'epoch': 1.9} {'loss': 0.3188, 'learning_rate': 1.2712721199597323e-07, 'epoch': 1.9} {'loss': 0.3052, 'learning_rate': 1.270738152659523e-07, 'epoch': 1.9} {'loss': 0.299, 'learning_rate': 1.270204296805877e-07, 'epoch': 1.9} {'loss': 0.1988, 'learning_rate': 1.2696705523993936e-07, 'epoch': 1.9} {'loss': 0.3738, 'learning_rate': 1.2691369194406834e-07, 'epoch': 1.9} {'loss': 0.1797, 'learning_rate': 1.2686033979303348e-07, 'epoch': 1.9} {'loss': 0.4435, 'learning_rate': 1.2680699878689694e-07, 'epoch': 1.9} {'loss': 0.2894, 'learning_rate': 1.267536689257165e-07, 'epoch': 1.9} {'loss': 0.259, 'learning_rate': 1.267003502095543e-07, 'epoch': 1.9} {'loss': 0.1351, 'learning_rate': 1.2664704263847028e-07, 'epoch': 1.9} {'loss': 0.2579, 'learning_rate': 1.265937462125244e-07, 'epoch': 1.9} {'loss': 0.2944, 'learning_rate': 1.2654046093177552e-07, 'epoch': 1.9} {'loss': 0.2911, 'learning_rate': 1.264871867962858e-07, 'epoch': 1.9} {'loss': 0.4009, 'learning_rate': 1.2643392380611407e-07, 'epoch': 1.9} {'loss': 0.3397, 'learning_rate': 1.2638067196132143e-07, 'epoch': 1.9} {'loss': 0.2788, 'learning_rate': 1.2632743126196666e-07, 'epoch': 1.9} {'loss': 0.4387, 'learning_rate': 1.2627420170811089e-07, 'epoch': 1.9} {'loss': 0.3207, 'learning_rate': 1.2622098329981403e-07, 'epoch': 1.9} {'loss': 0.239, 'learning_rate': 1.2616777603713605e-07, 'epoch': 1.9} {'loss': 0.4097, 'learning_rate': 1.2611457992013686e-07, 'epoch': 1.9} {'loss': 0.3065, 'learning_rate': 1.260613949488776e-07, 'epoch': 1.9} {'loss': 0.2695, 'learning_rate': 1.2600822112341705e-07, 'epoch': 1.9} {'loss': 0.3568, 'learning_rate': 1.2595505844381516e-07, 'epoch': 1.9} {'loss': 0.3293, 'learning_rate': 1.2590190691013305e-07, 'epoch': 1.9} {'loss': 0.3913, 'learning_rate': 1.258487665224295e-07, 'epoch': 1.9} {'loss': 0.2716, 'learning_rate': 1.257956372807656e-07, 'epoch': 1.9} {'loss': 0.25, 'learning_rate': 1.257425191852002e-07, 'epoch': 1.9} {'loss': 0.3453, 'learning_rate': 1.2568941223579435e-07, 'epoch': 1.9} {'loss': 0.328, 'learning_rate': 1.2563631643260687e-07, 'epoch': 1.9} {'loss': 0.2353, 'learning_rate': 1.2558323177569886e-07, 'epoch': 1.9} {'loss': 0.3157, 'learning_rate': 1.2553015826512804e-07, 'epoch': 1.9} {'loss': 0.221, 'learning_rate': 1.254770959009577e-07, 'epoch': 1.9} {'loss': 0.2149, 'learning_rate': 1.2542404468324555e-07, 'epoch': 1.9} {'loss': 0.3523, 'learning_rate': 1.2537100461205265e-07, 'epoch': 1.9} {'loss': 0.242, 'learning_rate': 1.2531797568743675e-07, 'epoch': 1.9} {'loss': 0.2176, 'learning_rate': 1.2526495790946002e-07, 'epoch': 1.9} {'loss': 0.2162, 'learning_rate': 1.252119512781802e-07, 'epoch': 1.9} {'loss': 0.2706, 'learning_rate': 1.2515895579365945e-07, 'epoch': 1.9} {'loss': 0.2555, 'learning_rate': 1.251059714559566e-07, 'epoch': 1.9} {'loss': 0.306, 'learning_rate': 1.2505299826513052e-07, 'epoch': 1.9} {'loss': 0.3314, 'learning_rate': 1.2500003622124225e-07, 'epoch': 1.9} {'loss': 0.2233, 'learning_rate': 1.2494708532435174e-07, 'epoch': 1.9} {'loss': 0.2187, 'learning_rate': 1.2489414557451672e-07, 'epoch': 1.9} {'loss': 0.2926, 'learning_rate': 1.248412169717994e-07, 'epoch': 1.9} {'loss': 0.2776, 'learning_rate': 1.247882995162575e-07, 'epoch': 1.9} {'loss': 0.1464, 'learning_rate': 1.2473539320795313e-07, 'epoch': 1.9} {'loss': 0.2236, 'learning_rate': 1.246824980469441e-07, 'epoch': 1.9} {'loss': 0.1093, 'learning_rate': 1.2462961403329033e-07, 'epoch': 1.9} {'loss': 0.2946, 'learning_rate': 1.2457674116705176e-07, 'epoch': 1.9} {'loss': 0.2289, 'learning_rate': 1.2452387944828837e-07, 'epoch': 1.9} {'loss': 0.3474, 'learning_rate': 1.2447102887706008e-07, 'epoch': 1.9} {'loss': 0.2254, 'learning_rate': 1.2441818945342576e-07, 'epoch': 1.9} {'loss': 0.3413, 'learning_rate': 1.2436536117744425e-07, 'epoch': 1.9} {'loss': 0.2106, 'learning_rate': 1.243125440491777e-07, 'epoch': 1.9} {'loss': 0.3911, 'learning_rate': 1.2425973806868495e-07, 'epoch': 1.9} {'loss': 0.2425, 'learning_rate': 1.2420694323602377e-07, 'epoch': 1.9} {'loss': 0.4549, 'learning_rate': 1.241541595512552e-07, 'epoch': 1.9} {'loss': 0.3572, 'learning_rate': 1.2410138701443808e-07, 'epoch': 1.9} {'loss': 0.2554, 'learning_rate': 1.2404862562563345e-07, 'epoch': 1.9} {'loss': 0.3025, 'learning_rate': 1.239958753848991e-07, 'epoch': 1.9} {'loss': 0.3525, 'learning_rate': 1.2394313629229604e-07, 'epoch': 1.9} {'loss': 0.2114, 'learning_rate': 1.2389040834788313e-07, 'epoch': 1.9} {'loss': 0.2936, 'learning_rate': 1.2383769155172033e-07, 'epoch': 1.9} {'loss': 0.3175, 'learning_rate': 1.2378498590386533e-07, 'epoch': 1.9} {'loss': 0.1581, 'learning_rate': 1.2373229140438037e-07, 'epoch': 1.9} {'loss': 0.3035, 'learning_rate': 1.2367960805332312e-07, 'epoch': 1.9} {'loss': 0.2742, 'learning_rate': 1.236269358507536e-07, 'epoch': 1.9} {'loss': 0.301, 'learning_rate': 1.2357427479673166e-07, 'epoch': 1.9} {'loss': 0.3159, 'learning_rate': 1.2352162489131514e-07, 'epoch': 1.9} {'loss': 0.3395, 'learning_rate': 1.2346898613456503e-07, 'epoch': 1.9} {'loss': 0.3049, 'learning_rate': 1.2341635852654022e-07, 'epoch': 1.9} {'loss': 0.4164, 'learning_rate': 1.2336374206730061e-07, 'epoch': 1.9} {'loss': 0.373, 'learning_rate': 1.233111367569051e-07, 'epoch': 1.9} {'loss': 0.2496, 'learning_rate': 1.232585425954136e-07, 'epoch': 1.9} {'loss': 0.3047, 'learning_rate': 1.2320595958288383e-07, 'epoch': 1.9} {'loss': 0.1945, 'learning_rate': 1.23153387719378e-07, 'epoch': 1.9} {'loss': 0.3723, 'learning_rate': 1.2310082700495273e-07, 'epoch': 1.9} {'loss': 0.2738, 'learning_rate': 1.2304827743966797e-07, 'epoch': 1.9} {'loss': 0.3145, 'learning_rate': 1.2299573902358474e-07, 'epoch': 1.9} {'loss': 0.172, 'learning_rate': 1.2294321175676082e-07, 'epoch': 1.9} {'loss': 0.4303, 'learning_rate': 1.2289069563925615e-07, 'epoch': 1.9} {'loss': 0.413, 'learning_rate': 1.2283819067112846e-07, 'epoch': 1.9} {'loss': 0.422, 'learning_rate': 1.227856968524388e-07, 'epoch': 1.9} {'loss': 0.326, 'learning_rate': 1.2273321418324602e-07, 'epoch': 1.9} {'loss': 0.2805, 'learning_rate': 1.2268074266360897e-07, 'epoch': 1.9} {'loss': 0.2912, 'learning_rate': 1.226282822935876e-07, 'epoch': 1.9} {'loss': 0.3289, 'learning_rate': 1.225758330732396e-07, 'epoch': 1.9} {'loss': 0.2316, 'learning_rate': 1.2252339500262611e-07, 'epoch': 1.9} {'loss': 0.2009, 'learning_rate': 1.2247096808180591e-07, 'epoch': 1.9} {'loss': 0.287, 'learning_rate': 1.2241855231083565e-07, 'epoch': 1.9} {'loss': 0.2602, 'learning_rate': 1.223661476897786e-07, 'epoch': 1.9} {'loss': 0.2651, 'learning_rate': 1.223137542186903e-07, 'epoch': 1.9} {'loss': 0.3732, 'learning_rate': 1.2226137189763288e-07, 'epoch': 1.9} {'loss': 0.2335, 'learning_rate': 1.222090007266641e-07, 'epoch': 1.9} {'loss': 0.2232, 'learning_rate': 1.2215664070584165e-07, 'epoch': 1.9} {'loss': 0.2364, 'learning_rate': 1.2210429183522665e-07, 'epoch': 1.9} {'loss': 0.3272, 'learning_rate': 1.2205195411487792e-07, 'epoch': 1.9} {'loss': 0.2497, 'learning_rate': 1.2199962754485318e-07, 'epoch': 1.9} {'loss': 0.3344, 'learning_rate': 1.2194731212521349e-07, 'epoch': 1.9} {'loss': 0.4643, 'learning_rate': 1.218950078560166e-07, 'epoch': 1.9} {'loss': 0.3066, 'learning_rate': 1.2184271473732133e-07, 'epoch': 1.9} {'loss': 0.1977, 'learning_rate': 1.2179043276918767e-07, 'epoch': 1.9} {'loss': 0.206, 'learning_rate': 1.2173816195167442e-07, 'epoch': 1.9} {'loss': 0.1985, 'learning_rate': 1.2168590228483935e-07, 'epoch': 1.9} {'loss': 0.2615, 'learning_rate': 1.2163365376874347e-07, 'epoch': 1.9} {'loss': 0.2925, 'learning_rate': 1.2158141640344455e-07, 'epoch': 1.9} {'loss': 0.4136, 'learning_rate': 1.2152919018900146e-07, 'epoch': 1.9} {'loss': 0.3422, 'learning_rate': 1.2147697512547407e-07, 'epoch': 1.9} {'loss': 0.2611, 'learning_rate': 1.214247712129202e-07, 'epoch': 1.9} {'loss': 0.3737, 'learning_rate': 1.2137257845139862e-07, 'epoch': 1.9} {'loss': 0.3317, 'learning_rate': 1.213203968409704e-07, 'epoch': 1.9} {'loss': 0.3155, 'learning_rate': 1.2126822638169112e-07, 'epoch': 1.9} {'loss': 0.3477, 'learning_rate': 1.2121606707362288e-07, 'epoch': 1.9} {'loss': 0.337, 'learning_rate': 1.2116391891682233e-07, 'epoch': 1.9} {'loss': 0.2659, 'learning_rate': 1.2111178191134944e-07, 'epoch': 1.9} {'loss': 0.4208, 'learning_rate': 1.21059656057263e-07, 'epoch': 1.9} {'loss': 0.1368, 'learning_rate': 1.2100754135462188e-07, 'epoch': 1.9} {'loss': 0.1765, 'learning_rate': 1.2095543780348384e-07, 'epoch': 1.9} {'loss': 0.3385, 'learning_rate': 1.209033454039088e-07, 'epoch': 1.9} {'loss': 0.3457, 'learning_rate': 1.2085126415595672e-07, 'epoch': 1.9} {'loss': 0.2552, 'learning_rate': 1.207991940596831e-07, 'epoch': 1.9} {'loss': 0.2562, 'learning_rate': 1.2074713511514902e-07, 'epoch': 1.9} {'loss': 0.2542, 'learning_rate': 1.206950873224133e-07, 'epoch': 1.9} {'loss': 0.2219, 'learning_rate': 1.206430506815337e-07, 'epoch': 1.9} {'loss': 0.2202, 'learning_rate': 1.2059102519256903e-07, 'epoch': 1.9} {'loss': 0.2247, 'learning_rate': 1.2053901085557927e-07, 'epoch': 1.9} {'loss': 0.2413, 'learning_rate': 1.2048700767062215e-07, 'epoch': 1.9} {'loss': 0.264, 'learning_rate': 1.204350156377565e-07, 'epoch': 1.9} {'loss': 0.289, 'learning_rate': 1.2038303475704117e-07, 'epoch': 1.9} {'loss': 0.3215, 'learning_rate': 1.2033106502853497e-07, 'epoch': 1.9} {'loss': 0.2608, 'learning_rate': 1.2027910645229458e-07, 'epoch': 1.9} {'loss': 0.3098, 'learning_rate': 1.2022715902838212e-07, 'epoch': 1.9} {'loss': 0.2007, 'learning_rate': 1.2017522275685423e-07, 'epoch': 1.9} {'loss': 0.3256, 'learning_rate': 1.2012329763776974e-07, 'epoch': 1.9} {'loss': 0.1909, 'learning_rate': 1.2007138367118753e-07, 'epoch': 1.9} {'loss': 0.2948, 'learning_rate': 1.200194808571642e-07, 'epoch': 1.9} {'loss': 0.2154, 'learning_rate': 1.199675891957619e-07, 'epoch': 1.9} {'loss': 0.3433, 'learning_rate': 1.1991570868703618e-07, 'epoch': 1.9} {'loss': 0.4993, 'learning_rate': 1.1986383933104805e-07, 'epoch': 1.9} {'loss': 0.217, 'learning_rate': 1.198119811278542e-07, 'epoch': 1.9} {'loss': 0.5132, 'learning_rate': 1.1976013407751452e-07, 'epoch': 1.9} {'loss': 0.2799, 'learning_rate': 1.1970829818008677e-07, 'epoch': 1.9} {'loss': 0.2538, 'learning_rate': 1.196564734356287e-07, 'epoch': 1.9} {'loss': 0.289, 'learning_rate': 1.1960465984420023e-07, 'epoch': 1.9} {'loss': 0.4266, 'learning_rate': 1.1955285740585798e-07, 'epoch': 1.9} {'loss': 0.2268, 'learning_rate': 1.1950106612066303e-07, 'epoch': 1.9} {'loss': 0.319, 'learning_rate': 1.19449285988672e-07, 'epoch': 1.9} {'loss': 0.2028, 'learning_rate': 1.1939751700994484e-07, 'epoch': 1.9} {'loss': 0.4351, 'learning_rate': 1.1934575918453816e-07, 'epoch': 1.9} {'loss': 0.2045, 'learning_rate': 1.1929401251251084e-07, 'epoch': 1.9} {'loss': 0.3114, 'learning_rate': 1.1924227699392278e-07, 'epoch': 1.9} {'loss': 0.3733, 'learning_rate': 1.1919055262883062e-07, 'epoch': 1.9} {'loss': 0.3424, 'learning_rate': 1.1913883941729321e-07, 'epoch': 1.9} {'loss': 0.2477, 'learning_rate': 1.1908713735936939e-07, 'epoch': 1.9} {'loss': 0.2754, 'learning_rate': 1.19035446455118e-07, 'epoch': 1.9} {'loss': 0.2917, 'learning_rate': 1.1898376670459455e-07, 'epoch': 1.9} {'loss': 0.2879, 'learning_rate': 1.1893209810786121e-07, 'epoch': 1.9} {'loss': 0.4245, 'learning_rate': 1.1888044066497462e-07, 'epoch': 1.9} {'loss': 0.3423, 'learning_rate': 1.1882879437599249e-07, 'epoch': 1.9} {'loss': 0.2655, 'learning_rate': 1.1877715924097366e-07, 'epoch': 1.9} {'loss': 0.2379, 'learning_rate': 1.1872553525997587e-07, 'epoch': 1.9} {'loss': 0.3606, 'learning_rate': 1.1867392243305908e-07, 'epoch': 1.9} {'loss': 0.3127, 'learning_rate': 1.1862232076027991e-07, 'epoch': 1.9} {'loss': 0.3305, 'learning_rate': 1.1857073024169607e-07, 'epoch': 1.9} {'loss': 0.205, 'learning_rate': 1.1851915087736864e-07, 'epoch': 1.9} {'loss': 0.2384, 'learning_rate': 1.1846758266735314e-07, 'epoch': 1.9} {'loss': 0.3515, 'learning_rate': 1.1841602561170839e-07, 'epoch': 1.9} {'loss': 0.4821, 'learning_rate': 1.1836447971049436e-07, 'epoch': 1.91} {'loss': 0.1758, 'learning_rate': 1.1831294496376655e-07, 'epoch': 1.91} {'loss': 0.2946, 'learning_rate': 1.182614213715838e-07, 'epoch': 1.91} {'loss': 0.2597, 'learning_rate': 1.1820990893400497e-07, 'epoch': 1.91} {'loss': 0.2463, 'learning_rate': 1.1815840765108888e-07, 'epoch': 1.91} {'loss': 0.2718, 'learning_rate': 1.1810691752289216e-07, 'epoch': 1.91} {'loss': 0.397, 'learning_rate': 1.1805543854947477e-07, 'epoch': 1.91} {'loss': 0.3243, 'learning_rate': 1.1800397073089221e-07, 'epoch': 1.91} {'loss': 0.3625, 'learning_rate': 1.1795251406720553e-07, 'epoch': 1.91} {'loss': 0.3289, 'learning_rate': 1.1790106855846916e-07, 'epoch': 1.91} {'loss': 0.353, 'learning_rate': 1.1784963420474526e-07, 'epoch': 1.91} {'loss': 0.334, 'learning_rate': 1.1779821100608935e-07, 'epoch': 1.91} {'loss': 0.2986, 'learning_rate': 1.1774679896256024e-07, 'epoch': 1.91} {'loss': 0.402, 'learning_rate': 1.176953980742157e-07, 'epoch': 1.91} {'loss': 0.306, 'learning_rate': 1.1764400834111234e-07, 'epoch': 1.91} {'loss': 0.3089, 'learning_rate': 1.1759262976331232e-07, 'epoch': 1.91} {'loss': 0.3027, 'learning_rate': 1.1754126234086893e-07, 'epoch': 1.91} {'loss': 0.3111, 'learning_rate': 1.1748990607384325e-07, 'epoch': 1.91} {'loss': 0.3416, 'learning_rate': 1.1743856096229189e-07, 'epoch': 1.91} {'loss': 0.3923, 'learning_rate': 1.1738722700627259e-07, 'epoch': 1.91} {'loss': 0.3147, 'learning_rate': 1.1733590420584418e-07, 'epoch': 1.91} {'loss': 0.3215, 'learning_rate': 1.172845925610655e-07, 'epoch': 1.91} {'loss': 0.3756, 'learning_rate': 1.1723329207199207e-07, 'epoch': 1.91} {'loss': 0.317, 'learning_rate': 1.1718200273868275e-07, 'epoch': 1.91} {'loss': 0.4602, 'learning_rate': 1.1713072456119634e-07, 'epoch': 1.91} {'loss': 0.2913, 'learning_rate': 1.1707945753958949e-07, 'epoch': 1.91} {'loss': 0.3609, 'learning_rate': 1.1702820167392103e-07, 'epoch': 1.91} {'loss': 0.3728, 'learning_rate': 1.169769569642476e-07, 'epoch': 1.91} {'loss': 0.4693, 'learning_rate': 1.1692572341062913e-07, 'epoch': 1.91} {'loss': 0.1366, 'learning_rate': 1.1687450101312114e-07, 'epoch': 1.91} {'loss': 0.1697, 'learning_rate': 1.1682328977178359e-07, 'epoch': 1.91} {'loss': 0.3604, 'learning_rate': 1.1677208968667197e-07, 'epoch': 1.91} {'loss': 0.3184, 'learning_rate': 1.1672090075784514e-07, 'epoch': 1.91} {'loss': 0.2927, 'learning_rate': 1.1666972298536195e-07, 'epoch': 1.91} {'loss': 0.268, 'learning_rate': 1.1661855636927899e-07, 'epoch': 1.91} {'loss': 0.3824, 'learning_rate': 1.1656740090965401e-07, 'epoch': 1.91} {'loss': 0.2732, 'learning_rate': 1.1651625660654475e-07, 'epoch': 1.91} {'loss': 0.3329, 'learning_rate': 1.1646512346001004e-07, 'epoch': 1.91} {'loss': 0.1565, 'learning_rate': 1.164140014701065e-07, 'epoch': 1.91} {'loss': 0.3482, 'learning_rate': 1.1636289063689187e-07, 'epoch': 1.91} {'loss': 0.3465, 'learning_rate': 1.163117909604239e-07, 'epoch': 1.91} {'loss': 0.2769, 'learning_rate': 1.1626070244076138e-07, 'epoch': 1.91} {'loss': 0.3163, 'learning_rate': 1.1620962507795985e-07, 'epoch': 1.91} {'loss': 0.3071, 'learning_rate': 1.1615855887207927e-07, 'epoch': 1.91} {'loss': 0.3706, 'learning_rate': 1.1610750382317515e-07, 'epoch': 1.91} {'loss': 0.2108, 'learning_rate': 1.1605645993130632e-07, 'epoch': 1.91} {'loss': 0.4728, 'learning_rate': 1.1600542719653052e-07, 'epoch': 1.91} {'loss': 0.4111, 'learning_rate': 1.1595440561890548e-07, 'epoch': 1.91} {'loss': 0.3067, 'learning_rate': 1.159033951984867e-07, 'epoch': 1.91} {'loss': 0.2915, 'learning_rate': 1.1585239593533526e-07, 'epoch': 1.91} {'loss': 0.4159, 'learning_rate': 1.1580140782950666e-07, 'epoch': 1.91} {'loss': 0.3068, 'learning_rate': 1.1575043088105864e-07, 'epoch': 1.91} {'loss': 0.319, 'learning_rate': 1.1569946509004892e-07, 'epoch': 1.91} {'loss': 0.365, 'learning_rate': 1.1564851045653414e-07, 'epoch': 1.91} {'loss': 0.2815, 'learning_rate': 1.1559756698057312e-07, 'epoch': 1.91} {'loss': 0.3085, 'learning_rate': 1.1554663466222249e-07, 'epoch': 1.91} {'loss': 0.1934, 'learning_rate': 1.1549571350153998e-07, 'epoch': 1.91} {'loss': 0.3145, 'learning_rate': 1.1544480349858334e-07, 'epoch': 1.91} {'loss': 0.3274, 'learning_rate': 1.1539390465341027e-07, 'epoch': 1.91} {'loss': 0.2793, 'learning_rate': 1.1534301696607741e-07, 'epoch': 1.91} {'loss': 0.2348, 'learning_rate': 1.1529214043664361e-07, 'epoch': 1.91} {'loss': 0.5089, 'learning_rate': 1.1524127506516325e-07, 'epoch': 1.91} {'loss': 0.2504, 'learning_rate': 1.1519042085169851e-07, 'epoch': 1.91} {'loss': 0.2704, 'learning_rate': 1.1513957779630159e-07, 'epoch': 1.91} {'loss': 0.3016, 'learning_rate': 1.1508874589903462e-07, 'epoch': 1.91} {'loss': 0.2748, 'learning_rate': 1.1503792515995094e-07, 'epoch': 1.91} {'loss': 0.156, 'learning_rate': 1.1498711557911046e-07, 'epoch': 1.91} {'loss': 0.3471, 'learning_rate': 1.1493631715656983e-07, 'epoch': 1.91} {'loss': 0.333, 'learning_rate': 1.1488552989238566e-07, 'epoch': 1.91} {'loss': 0.2759, 'learning_rate': 1.1483475378661679e-07, 'epoch': 1.91} {'loss': 0.1558, 'learning_rate': 1.1478398883931985e-07, 'epoch': 1.91} {'loss': 0.2807, 'learning_rate': 1.1473323505055145e-07, 'epoch': 1.91} {'loss': 0.1698, 'learning_rate': 1.1468249242037044e-07, 'epoch': 1.91} {'loss': 0.1563, 'learning_rate': 1.1463176094883232e-07, 'epoch': 1.91} {'loss': 0.4157, 'learning_rate': 1.1458104063599485e-07, 'epoch': 1.91} {'loss': 0.3162, 'learning_rate': 1.1453033148191572e-07, 'epoch': 1.91} {'loss': 0.1038, 'learning_rate': 1.1447963348665269e-07, 'epoch': 1.91} {'loss': 0.3668, 'learning_rate': 1.1442894665026239e-07, 'epoch': 1.91} {'loss': 0.3531, 'learning_rate': 1.1437827097280141e-07, 'epoch': 1.91} {'loss': 0.2215, 'learning_rate': 1.143276064543275e-07, 'epoch': 1.91} {'loss': 0.3966, 'learning_rate': 1.142769530948984e-07, 'epoch': 1.91} {'loss': 0.2726, 'learning_rate': 1.142263108945696e-07, 'epoch': 1.91} {'loss': 0.3102, 'learning_rate': 1.1417567985340105e-07, 'epoch': 1.91} {'loss': 0.2865, 'learning_rate': 1.1412505997144718e-07, 'epoch': 1.91} {'loss': 0.2225, 'learning_rate': 1.1407445124876681e-07, 'epoch': 1.91} {'loss': 0.1703, 'learning_rate': 1.1402385368541657e-07, 'epoch': 1.91} {'loss': 0.2758, 'learning_rate': 1.1397326728145309e-07, 'epoch': 1.91} {'loss': 0.2971, 'learning_rate': 1.1392269203693407e-07, 'epoch': 1.91} {'loss': 0.3816, 'learning_rate': 1.1387212795191615e-07, 'epoch': 1.91} {'loss': 0.1621, 'learning_rate': 1.1382157502645708e-07, 'epoch': 1.91} {'loss': 0.2538, 'learning_rate': 1.1377103326061234e-07, 'epoch': 1.91} {'loss': 0.3233, 'learning_rate': 1.137205026544419e-07, 'epoch': 1.91} {'loss': 0.3043, 'learning_rate': 1.1366998320799904e-07, 'epoch': 1.91} {'loss': 0.2378, 'learning_rate': 1.1361947492134485e-07, 'epoch': 1.91} {'loss': 0.4396, 'learning_rate': 1.1356897779453257e-07, 'epoch': 1.91} {'loss': 0.3836, 'learning_rate': 1.135184918276222e-07, 'epoch': 1.91} {'loss': 0.3622, 'learning_rate': 1.1346801702066812e-07, 'epoch': 1.91} {'loss': 0.2364, 'learning_rate': 1.1341755337373028e-07, 'epoch': 1.91} {'loss': 0.1688, 'learning_rate': 1.1336710088686309e-07, 'epoch': 1.91} {'loss': 0.3847, 'learning_rate': 1.1331665956012428e-07, 'epoch': 1.91} {'loss': 0.3814, 'learning_rate': 1.1326622939357157e-07, 'epoch': 1.91} {'loss': 0.3856, 'learning_rate': 1.1321581038726048e-07, 'epoch': 1.91} {'loss': 0.2862, 'learning_rate': 1.1316540254124985e-07, 'epoch': 1.91} {'loss': 0.3033, 'learning_rate': 1.1311500585559409e-07, 'epoch': 1.91} {'loss': 0.2424, 'learning_rate': 1.1306462033035203e-07, 'epoch': 1.91} {'loss': 0.1928, 'learning_rate': 1.130142459655803e-07, 'epoch': 1.91} {'loss': 0.4111, 'learning_rate': 1.1296388276133442e-07, 'epoch': 1.91} {'loss': 0.3147, 'learning_rate': 1.1291353071767319e-07, 'epoch': 1.91} {'loss': 0.1972, 'learning_rate': 1.1286318983465216e-07, 'epoch': 1.91} {'loss': 0.2481, 'learning_rate': 1.1281286011232795e-07, 'epoch': 1.91} {'loss': 0.3025, 'learning_rate': 1.1276254155075827e-07, 'epoch': 1.91} {'loss': 0.3898, 'learning_rate': 1.1271223414999977e-07, 'epoch': 1.91} {'loss': 0.2804, 'learning_rate': 1.1266193791010793e-07, 'epoch': 1.91} {'loss': 0.2436, 'learning_rate': 1.1261165283114161e-07, 'epoch': 1.91} {'loss': 0.2855, 'learning_rate': 1.1256137891315633e-07, 'epoch': 1.91} {'loss': 0.2209, 'learning_rate': 1.125111161562098e-07, 'epoch': 1.91} {'loss': 0.398, 'learning_rate': 1.1246086456035643e-07, 'epoch': 1.91} {'loss': 0.4636, 'learning_rate': 1.1241062412565617e-07, 'epoch': 1.91} {'loss': 0.3429, 'learning_rate': 1.1236039485216343e-07, 'epoch': 1.91} {'loss': 0.4507, 'learning_rate': 1.1231017673993482e-07, 'epoch': 1.91} {'loss': 0.3213, 'learning_rate': 1.1225996978902809e-07, 'epoch': 1.91} {'loss': 0.3262, 'learning_rate': 1.1220977399950095e-07, 'epoch': 1.91} {'loss': 0.3822, 'learning_rate': 1.1215958937140781e-07, 'epoch': 1.91} {'loss': 0.3758, 'learning_rate': 1.1210941590480639e-07, 'epoch': 1.91} {'loss': 0.4569, 'learning_rate': 1.1205925359975223e-07, 'epoch': 1.91} {'loss': 0.4977, 'learning_rate': 1.1200910245630415e-07, 'epoch': 1.91} {'loss': 0.2824, 'learning_rate': 1.1195896247451765e-07, 'epoch': 1.91} {'loss': 0.2997, 'learning_rate': 1.1190883365444827e-07, 'epoch': 1.91} {'loss': 0.3698, 'learning_rate': 1.1185871599615373e-07, 'epoch': 1.91} {'loss': 0.3509, 'learning_rate': 1.1180860949968953e-07, 'epoch': 1.91} {'loss': 0.2435, 'learning_rate': 1.1175851416511451e-07, 'epoch': 1.91} {'loss': 0.333, 'learning_rate': 1.1170842999248311e-07, 'epoch': 1.91} {'loss': 0.3072, 'learning_rate': 1.1165835698185301e-07, 'epoch': 1.91} {'loss': 0.291, 'learning_rate': 1.1160829513327975e-07, 'epoch': 1.91} {'loss': 0.4272, 'learning_rate': 1.1155824444682106e-07, 'epoch': 1.91} {'loss': 0.3956, 'learning_rate': 1.1150820492253134e-07, 'epoch': 1.91} {'loss': 0.2302, 'learning_rate': 1.1145817656047054e-07, 'epoch': 1.91} {'loss': 0.3803, 'learning_rate': 1.1140815936069083e-07, 'epoch': 1.91} {'loss': 0.4135, 'learning_rate': 1.1135815332325217e-07, 'epoch': 1.91} {'loss': 0.3297, 'learning_rate': 1.1130815844821008e-07, 'epoch': 1.91} {'loss': 0.2993, 'learning_rate': 1.1125817473562006e-07, 'epoch': 1.91} {'loss': 0.2569, 'learning_rate': 1.1120820218553984e-07, 'epoch': 1.91} {'loss': 0.3296, 'learning_rate': 1.1115824079802384e-07, 'epoch': 1.91} {'loss': 0.2127, 'learning_rate': 1.1110829057313088e-07, 'epoch': 1.91} {'loss': 0.2728, 'learning_rate': 1.1105835151091537e-07, 'epoch': 1.91} {'loss': 0.3018, 'learning_rate': 1.1100842361143504e-07, 'epoch': 1.91} {'loss': 0.2939, 'learning_rate': 1.109585068747454e-07, 'epoch': 1.91} {'loss': 0.4177, 'learning_rate': 1.1090860130090308e-07, 'epoch': 1.91} {'loss': 0.2352, 'learning_rate': 1.108587068899647e-07, 'epoch': 1.91} {'loss': 0.1808, 'learning_rate': 1.1080882364198687e-07, 'epoch': 1.91} {'loss': 0.3031, 'learning_rate': 1.1075895155702398e-07, 'epoch': 1.91} {'loss': 0.3409, 'learning_rate': 1.1070909063513491e-07, 'epoch': 1.91} {'loss': 0.2029, 'learning_rate': 1.1065924087637403e-07, 'epoch': 1.91} {'loss': 0.2084, 'learning_rate': 1.1060940228079908e-07, 'epoch': 1.91} {'loss': 0.4339, 'learning_rate': 1.1055957484846558e-07, 'epoch': 1.91} {'loss': 0.3416, 'learning_rate': 1.1050975857942792e-07, 'epoch': 1.91} {'loss': 0.2593, 'learning_rate': 1.1045995347374606e-07, 'epoch': 1.91} {'loss': 0.2419, 'learning_rate': 1.1041015953147327e-07, 'epoch': 1.91} {'loss': 0.3095, 'learning_rate': 1.1036037675266843e-07, 'epoch': 1.91} {'loss': 0.3302, 'learning_rate': 1.1031060513738478e-07, 'epoch': 1.91} {'loss': 0.2878, 'learning_rate': 1.102608446856801e-07, 'epoch': 1.91} {'loss': 0.2288, 'learning_rate': 1.1021109539760989e-07, 'epoch': 1.91} {'loss': 0.4083, 'learning_rate': 1.1016135727323185e-07, 'epoch': 1.91} {'loss': 0.4923, 'learning_rate': 1.101116303125993e-07, 'epoch': 1.91} {'loss': 0.3446, 'learning_rate': 1.1006191451577108e-07, 'epoch': 1.91} {'loss': 0.2816, 'learning_rate': 1.100122098828027e-07, 'epoch': 1.91} {'loss': 0.2371, 'learning_rate': 1.0996251641374966e-07, 'epoch': 1.91} {'loss': 0.2841, 'learning_rate': 1.0991283410866749e-07, 'epoch': 1.91} {'loss': 0.1704, 'learning_rate': 1.0986316296761279e-07, 'epoch': 1.91} {'loss': 0.2446, 'learning_rate': 1.0981350299064331e-07, 'epoch': 1.91} {'loss': 0.4854, 'learning_rate': 1.0976385417781343e-07, 'epoch': 1.91} {'loss': 0.3571, 'learning_rate': 1.0971421652917869e-07, 'epoch': 1.91} {'loss': 0.292, 'learning_rate': 1.096645900447968e-07, 'epoch': 1.91} {'loss': 0.4208, 'learning_rate': 1.0961497472472216e-07, 'epoch': 1.91} {'loss': 0.3226, 'learning_rate': 1.095653705690114e-07, 'epoch': 1.91} {'loss': 0.2759, 'learning_rate': 1.0951577757772114e-07, 'epoch': 1.91} {'loss': 0.2207, 'learning_rate': 1.0946619575090689e-07, 'epoch': 1.91} {'loss': 0.4362, 'learning_rate': 1.0941662508862305e-07, 'epoch': 1.91} {'loss': 0.2144, 'learning_rate': 1.0936706559092847e-07, 'epoch': 1.91} {'loss': 0.2044, 'learning_rate': 1.0931751725787753e-07, 'epoch': 1.91} {'loss': 0.2457, 'learning_rate': 1.0926798008952577e-07, 'epoch': 1.91} {'loss': 0.3101, 'learning_rate': 1.092184540859298e-07, 'epoch': 1.91} {'loss': 0.4386, 'learning_rate': 1.0916893924714622e-07, 'epoch': 1.91} {'loss': 0.2534, 'learning_rate': 1.0911943557322946e-07, 'epoch': 1.91} {'loss': 0.2004, 'learning_rate': 1.0906994306423612e-07, 'epoch': 1.91} {'loss': 0.3252, 'learning_rate': 1.0902046172022174e-07, 'epoch': 1.91} {'loss': 0.1572, 'learning_rate': 1.089709915412418e-07, 'epoch': 1.91} {'loss': 0.3712, 'learning_rate': 1.0892153252735404e-07, 'epoch': 1.91} {'loss': 0.189, 'learning_rate': 1.0887208467861287e-07, 'epoch': 1.91} {'loss': 0.403, 'learning_rate': 1.088226479950738e-07, 'epoch': 1.91} {'loss': 0.2691, 'learning_rate': 1.0877322247679233e-07, 'epoch': 1.91} {'loss': 0.3042, 'learning_rate': 1.0872380812382622e-07, 'epoch': 1.91} {'loss': 0.3195, 'learning_rate': 1.0867440493622871e-07, 'epoch': 1.91} {'loss': 0.1537, 'learning_rate': 1.0862501291405869e-07, 'epoch': 1.91} {'loss': 0.351, 'learning_rate': 1.0857563205736832e-07, 'epoch': 1.91} {'loss': 0.3009, 'learning_rate': 1.0852626236621644e-07, 'epoch': 1.91} {'loss': 0.3309, 'learning_rate': 1.0847690384065634e-07, 'epoch': 1.91} {'loss': 0.3299, 'learning_rate': 1.0842755648074577e-07, 'epoch': 1.91} {'loss': 0.2886, 'learning_rate': 1.083782202865391e-07, 'epoch': 1.91} {'loss': 0.5964, 'learning_rate': 1.0832889525809298e-07, 'epoch': 1.91} {'loss': 0.3232, 'learning_rate': 1.0827958139546179e-07, 'epoch': 1.91} {'loss': 0.2854, 'learning_rate': 1.0823027869870218e-07, 'epoch': 1.91} {'loss': 0.3509, 'learning_rate': 1.0818098716786962e-07, 'epoch': 1.91} {'loss': 0.3604, 'learning_rate': 1.0813170680301966e-07, 'epoch': 1.91} {'loss': 0.248, 'learning_rate': 1.0808243760420778e-07, 'epoch': 1.91} {'loss': 0.3644, 'learning_rate': 1.0803317957149061e-07, 'epoch': 1.91} {'loss': 0.2969, 'learning_rate': 1.0798393270492258e-07, 'epoch': 1.91} {'loss': 0.2798, 'learning_rate': 1.0793469700455916e-07, 'epoch': 1.91} {'loss': 0.4115, 'learning_rate': 1.07885472470457e-07, 'epoch': 1.91} {'loss': 0.3067, 'learning_rate': 1.0783625910267048e-07, 'epoch': 1.91} {'loss': 0.4322, 'learning_rate': 1.0778705690125624e-07, 'epoch': 1.91} {'loss': 0.2422, 'learning_rate': 1.0773786586626866e-07, 'epoch': 1.91} {'loss': 0.2358, 'learning_rate': 1.0768868599776438e-07, 'epoch': 1.91} {'loss': 0.327, 'learning_rate': 1.0763951729579891e-07, 'epoch': 1.91} {'loss': 0.3039, 'learning_rate': 1.0759035976042664e-07, 'epoch': 1.91} {'loss': 0.1342, 'learning_rate': 1.0754121339170421e-07, 'epoch': 1.91} {'loss': 0.1743, 'learning_rate': 1.0749207818968599e-07, 'epoch': 1.91} {'loss': 0.2774, 'learning_rate': 1.0744295415442862e-07, 'epoch': 1.91} {'loss': 0.2208, 'learning_rate': 1.0739384128598651e-07, 'epoch': 1.91} {'loss': 0.1715, 'learning_rate': 1.0734473958441626e-07, 'epoch': 1.91} {'loss': 0.3198, 'learning_rate': 1.0729564904977119e-07, 'epoch': 1.91} {'loss': 0.2133, 'learning_rate': 1.0724656968211012e-07, 'epoch': 1.91} {'loss': 0.3868, 'learning_rate': 1.0719750148148522e-07, 'epoch': 1.91} {'loss': 0.3936, 'learning_rate': 1.0714844444795313e-07, 'epoch': 1.91} {'loss': 0.2851, 'learning_rate': 1.0709939858157048e-07, 'epoch': 1.91} {'loss': 0.2798, 'learning_rate': 1.0705036388239054e-07, 'epoch': 1.91} {'loss': 0.3035, 'learning_rate': 1.0700134035046882e-07, 'epoch': 1.91} {'loss': 0.2665, 'learning_rate': 1.0695232798586196e-07, 'epoch': 1.91} {'loss': 0.3144, 'learning_rate': 1.0690332678862548e-07, 'epoch': 1.91} {'loss': 0.2531, 'learning_rate': 1.0685433675881263e-07, 'epoch': 1.91} {'loss': 0.199, 'learning_rate': 1.0680535789648005e-07, 'epoch': 1.91} {'loss': 0.4198, 'learning_rate': 1.0675639020168327e-07, 'epoch': 1.91} {'loss': 0.3022, 'learning_rate': 1.0670743367447778e-07, 'epoch': 1.91} {'loss': 0.2534, 'learning_rate': 1.0665848831491798e-07, 'epoch': 1.91} {'loss': 0.4535, 'learning_rate': 1.066095541230594e-07, 'epoch': 1.91} {'loss': 0.334, 'learning_rate': 1.0656063109895642e-07, 'epoch': 1.91} {'loss': 0.3856, 'learning_rate': 1.065117192426668e-07, 'epoch': 1.91} {'loss': 0.3751, 'learning_rate': 1.0646281855424267e-07, 'epoch': 1.91} {'loss': 0.3376, 'learning_rate': 1.0641392903374182e-07, 'epoch': 1.91} {'loss': 0.2907, 'learning_rate': 1.063650506812175e-07, 'epoch': 1.91} {'loss': 0.3136, 'learning_rate': 1.0631618349672524e-07, 'epoch': 1.91} {'loss': 0.3989, 'learning_rate': 1.0626732748032164e-07, 'epoch': 1.91} {'loss': 0.3805, 'learning_rate': 1.0621848263206003e-07, 'epoch': 1.91} {'loss': 0.3256, 'learning_rate': 1.061696489519981e-07, 'epoch': 1.91} {'loss': 0.1776, 'learning_rate': 1.0612082644018695e-07, 'epoch': 1.91} {'loss': 0.3904, 'learning_rate': 1.0607201509668541e-07, 'epoch': 1.91} {'loss': 0.2541, 'learning_rate': 1.0602321492154677e-07, 'epoch': 1.91} {'loss': 0.3987, 'learning_rate': 1.0597442591482654e-07, 'epoch': 1.91} {'loss': 0.3225, 'learning_rate': 1.0592564807657912e-07, 'epoch': 1.91} {'loss': 0.224, 'learning_rate': 1.0587688140686114e-07, 'epoch': 1.91} {'loss': 0.4913, 'learning_rate': 1.05828125905727e-07, 'epoch': 1.91} {'loss': 0.3215, 'learning_rate': 1.0577938157322997e-07, 'epoch': 1.91} {'loss': 0.2879, 'learning_rate': 1.0573064840942782e-07, 'epoch': 1.91} {'loss': 0.2975, 'learning_rate': 1.056819264143738e-07, 'epoch': 1.91} {'loss': 0.189, 'learning_rate': 1.0563321558812345e-07, 'epoch': 1.91} {'loss': 0.374, 'learning_rate': 1.0558451593073116e-07, 'epoch': 1.91} {'loss': 0.2366, 'learning_rate': 1.0553582744225355e-07, 'epoch': 1.91} {'loss': 0.2687, 'learning_rate': 1.0548715012274391e-07, 'epoch': 1.91} {'loss': 0.3003, 'learning_rate': 1.0543848397225775e-07, 'epoch': 1.91} {'loss': 0.3903, 'learning_rate': 1.0538982899084948e-07, 'epoch': 1.91} {'loss': 0.3044, 'learning_rate': 1.0534118517857572e-07, 'epoch': 1.91} {'loss': 0.3316, 'learning_rate': 1.0529255253548865e-07, 'epoch': 1.91} {'loss': 0.3522, 'learning_rate': 1.0524393106164599e-07, 'epoch': 1.91} {'loss': 0.4402, 'learning_rate': 1.0519532075710104e-07, 'epoch': 1.91} {'loss': 0.277, 'learning_rate': 1.0514672162190931e-07, 'epoch': 1.91} {'loss': 0.2856, 'learning_rate': 1.050981336561252e-07, 'epoch': 1.91} {'loss': 0.1747, 'learning_rate': 1.0504955685980312e-07, 'epoch': 1.91} {'loss': 0.3604, 'learning_rate': 1.0500099123299856e-07, 'epoch': 1.91} {'loss': 0.2447, 'learning_rate': 1.0495243677576594e-07, 'epoch': 1.91} {'loss': 0.2123, 'learning_rate': 1.0490389348816076e-07, 'epoch': 1.91} {'loss': 0.232, 'learning_rate': 1.0485536137023745e-07, 'epoch': 1.91} {'loss': 0.2158, 'learning_rate': 1.0480684042205147e-07, 'epoch': 1.91} {'loss': 0.3411, 'learning_rate': 1.0475833064365615e-07, 'epoch': 1.91} {'loss': 0.3532, 'learning_rate': 1.0470983203510699e-07, 'epoch': 1.91} {'loss': 0.3721, 'learning_rate': 1.046613445964595e-07, 'epoch': 1.91} {'loss': 0.2213, 'learning_rate': 1.0461286832776697e-07, 'epoch': 1.91} {'loss': 0.3079, 'learning_rate': 1.0456440322908489e-07, 'epoch': 1.91} {'loss': 0.29, 'learning_rate': 1.0451594930046771e-07, 'epoch': 1.91} {'loss': 0.3143, 'learning_rate': 1.0446750654197091e-07, 'epoch': 1.91} {'loss': 0.2317, 'learning_rate': 1.0441907495364889e-07, 'epoch': 1.91} {'loss': 0.3573, 'learning_rate': 1.0437065453555496e-07, 'epoch': 1.91} {'loss': 0.3394, 'learning_rate': 1.0432224528774571e-07, 'epoch': 1.91} {'loss': 0.2421, 'learning_rate': 1.0427384721027445e-07, 'epoch': 1.91} {'loss': 0.3265, 'learning_rate': 1.0422546030319559e-07, 'epoch': 1.91} {'loss': 0.3286, 'learning_rate': 1.0417708456656572e-07, 'epoch': 1.91} {'loss': 0.2615, 'learning_rate': 1.0412872000043816e-07, 'epoch': 1.91} {'loss': 0.3219, 'learning_rate': 1.040803666048662e-07, 'epoch': 1.91} {'loss': 0.2685, 'learning_rate': 1.0403202437990645e-07, 'epoch': 1.91} {'loss': 0.3688, 'learning_rate': 1.039836933256122e-07, 'epoch': 1.91} {'loss': 0.2316, 'learning_rate': 1.0393537344204008e-07, 'epoch': 1.91} {'loss': 0.3533, 'learning_rate': 1.0388706472924115e-07, 'epoch': 1.91} {'loss': 0.1959, 'learning_rate': 1.0383876718727314e-07, 'epoch': 1.91} {'loss': 0.3488, 'learning_rate': 1.0379048081618825e-07, 'epoch': 1.91} {'loss': 0.3837, 'learning_rate': 1.0374220561604308e-07, 'epoch': 1.91} {'loss': 0.243, 'learning_rate': 1.0369394158689094e-07, 'epoch': 1.91} {'loss': 0.3189, 'learning_rate': 1.0364568872878622e-07, 'epoch': 1.91} {'loss': 0.3774, 'learning_rate': 1.0359744704178332e-07, 'epoch': 1.91} {'loss': 0.3022, 'learning_rate': 1.0354921652593775e-07, 'epoch': 1.91} {'loss': 0.2789, 'learning_rate': 1.035009971813039e-07, 'epoch': 1.91} {'loss': 0.4342, 'learning_rate': 1.0345278900793398e-07, 'epoch': 1.91} {'loss': 0.3793, 'learning_rate': 1.034045920058846e-07, 'epoch': 1.91} {'loss': 0.4542, 'learning_rate': 1.0335640617520904e-07, 'epoch': 1.91} {'loss': 0.3626, 'learning_rate': 1.033082315159628e-07, 'epoch': 1.91} {'loss': 0.385, 'learning_rate': 1.0326006802819922e-07, 'epoch': 1.91} {'loss': 0.1885, 'learning_rate': 1.0321191571197264e-07, 'epoch': 1.91} {'loss': 0.3523, 'learning_rate': 1.0316377456733862e-07, 'epoch': 1.91} {'loss': 0.4354, 'learning_rate': 1.0311564459435042e-07, 'epoch': 1.91} {'loss': 0.3714, 'learning_rate': 1.0306752579306245e-07, 'epoch': 1.91} {'loss': 0.2668, 'learning_rate': 1.0301941816353023e-07, 'epoch': 1.91} {'loss': 0.4306, 'learning_rate': 1.0297132170580593e-07, 'epoch': 1.91} {'loss': 0.4291, 'learning_rate': 1.0292323641994617e-07, 'epoch': 1.91} {'loss': 0.1981, 'learning_rate': 1.0287516230600314e-07, 'epoch': 1.91} {'loss': 0.3897, 'learning_rate': 1.0282709936403234e-07, 'epoch': 1.91} {'loss': 0.2014, 'learning_rate': 1.0277904759408819e-07, 'epoch': 1.91} {'loss': 0.4746, 'learning_rate': 1.0273100699622285e-07, 'epoch': 1.91} {'loss': 0.3893, 'learning_rate': 1.0268297757049406e-07, 'epoch': 1.91} {'loss': 0.366, 'learning_rate': 1.0263495931695289e-07, 'epoch': 1.91} {'loss': 0.2421, 'learning_rate': 1.0258695223565485e-07, 'epoch': 1.91} {'loss': 0.2982, 'learning_rate': 1.0253895632665434e-07, 'epoch': 1.91} {'loss': 0.1582, 'learning_rate': 1.0249097159000576e-07, 'epoch': 1.91} {'loss': 0.2353, 'learning_rate': 1.0244299802576241e-07, 'epoch': 1.91} {'loss': 0.2308, 'learning_rate': 1.0239503563397868e-07, 'epoch': 1.91} {'loss': 0.2522, 'learning_rate': 1.0234708441470787e-07, 'epoch': 1.91} {'loss': 0.4443, 'learning_rate': 1.0229914436800658e-07, 'epoch': 1.91} {'loss': 0.3493, 'learning_rate': 1.0225121549392702e-07, 'epoch': 1.91} {'loss': 0.2874, 'learning_rate': 1.0220329779252358e-07, 'epoch': 1.91} {'loss': 0.2353, 'learning_rate': 1.0215539126385065e-07, 'epoch': 1.91} {'loss': 0.3238, 'learning_rate': 1.0210749590796153e-07, 'epoch': 1.91} {'loss': 0.2632, 'learning_rate': 1.0205961172491174e-07, 'epoch': 1.91} {'loss': 0.2987, 'learning_rate': 1.0201173871475346e-07, 'epoch': 1.91} {'loss': 0.2395, 'learning_rate': 1.0196387687754327e-07, 'epoch': 1.91} {'loss': 0.2672, 'learning_rate': 1.019160262133323e-07, 'epoch': 1.91} {'loss': 0.2955, 'learning_rate': 1.0186818672217602e-07, 'epoch': 1.91} {'loss': 0.1914, 'learning_rate': 1.0182035840412885e-07, 'epoch': 1.91} {'loss': 0.3928, 'learning_rate': 1.0177254125924408e-07, 'epoch': 1.91} {'loss': 0.2575, 'learning_rate': 1.0172473528757609e-07, 'epoch': 1.91} {'loss': 0.2683, 'learning_rate': 1.016769404891782e-07, 'epoch': 1.91} {'loss': 0.2985, 'learning_rate': 1.016291568641059e-07, 'epoch': 1.91} {'loss': 0.3493, 'learning_rate': 1.0158138441241028e-07, 'epoch': 1.91} {'loss': 0.2944, 'learning_rate': 1.0153362313414794e-07, 'epoch': 1.91} {'loss': 0.3292, 'learning_rate': 1.0148587302937218e-07, 'epoch': 1.91} {'loss': 0.241, 'learning_rate': 1.0143813409813629e-07, 'epoch': 1.91} {'loss': 0.3084, 'learning_rate': 1.0139040634049357e-07, 'epoch': 1.91} {'loss': 0.1508, 'learning_rate': 1.0134268975649952e-07, 'epoch': 1.91} {'loss': 0.3658, 'learning_rate': 1.0129498434620744e-07, 'epoch': 1.91} {'loss': 0.1794, 'learning_rate': 1.0124729010967061e-07, 'epoch': 1.91} {'loss': 0.2395, 'learning_rate': 1.0119960704694342e-07, 'epoch': 1.91} {'loss': 0.399, 'learning_rate': 1.0115193515808031e-07, 'epoch': 1.91} {'loss': 0.3161, 'learning_rate': 1.0110427444313342e-07, 'epoch': 1.91} {'loss': 0.4561, 'learning_rate': 1.0105662490215718e-07, 'epoch': 1.91} {'loss': 0.3914, 'learning_rate': 1.0100898653520708e-07, 'epoch': 1.91} {'loss': 0.303, 'learning_rate': 1.0096135934233308e-07, 'epoch': 1.91} {'loss': 0.2602, 'learning_rate': 1.0091374332359294e-07, 'epoch': 1.91} {'loss': 0.2205, 'learning_rate': 1.0086613847903882e-07, 'epoch': 1.91} {'loss': 0.1923, 'learning_rate': 1.00818544808724e-07, 'epoch': 1.91} {'loss': 0.4049, 'learning_rate': 1.0077096231270289e-07, 'epoch': 1.91} {'loss': 0.2924, 'learning_rate': 1.0072339099102879e-07, 'epoch': 1.91} {'loss': 0.4527, 'learning_rate': 1.0067583084375498e-07, 'epoch': 1.91} {'loss': 0.2233, 'learning_rate': 1.0062828187093698e-07, 'epoch': 1.91} {'loss': 0.3223, 'learning_rate': 1.0058074407262585e-07, 'epoch': 1.91} {'loss': 0.3447, 'learning_rate': 1.0053321744887823e-07, 'epoch': 1.91} {'loss': 0.379, 'learning_rate': 1.0048570199974406e-07, 'epoch': 1.91} {'loss': 0.1592, 'learning_rate': 1.0043819772528107e-07, 'epoch': 1.91} {'loss': 0.198, 'learning_rate': 1.0039070462554034e-07, 'epoch': 1.91} {'loss': 0.2522, 'learning_rate': 1.0034322270057517e-07, 'epoch': 1.91} {'loss': 0.2919, 'learning_rate': 1.0029575195044106e-07, 'epoch': 1.91} {'loss': 0.3646, 'learning_rate': 1.0024829237518796e-07, 'epoch': 1.91} {'loss': 0.2989, 'learning_rate': 1.0020084397487473e-07, 'epoch': 1.91} {'loss': 0.2023, 'learning_rate': 1.0015340674955131e-07, 'epoch': 1.91} {'loss': 0.2975, 'learning_rate': 1.0010598069927213e-07, 'epoch': 1.91} {'loss': 0.2447, 'learning_rate': 1.0005856582409157e-07, 'epoch': 1.91} {'loss': 0.3122, 'learning_rate': 1.000111621240618e-07, 'epoch': 1.91} {'loss': 0.3427, 'learning_rate': 9.996376959923615e-08, 'epoch': 1.91} {'loss': 0.4013, 'learning_rate': 9.991638824966898e-08, 'epoch': 1.91} {'loss': 0.245, 'learning_rate': 9.986901807541471e-08, 'epoch': 1.91} {'loss': 0.2949, 'learning_rate': 9.982165907652441e-08, 'epoch': 1.91} {'loss': 0.3684, 'learning_rate': 9.97743112530547e-08, 'epoch': 1.91} {'loss': 0.3202, 'learning_rate': 9.972697460505554e-08, 'epoch': 1.91} {'loss': 0.3695, 'learning_rate': 9.967964913258243e-08, 'epoch': 1.91} {'loss': 0.2235, 'learning_rate': 9.963233483568757e-08, 'epoch': 1.91} {'loss': 0.2754, 'learning_rate': 9.958503171442647e-08, 'epoch': 1.91} {'loss': 0.268, 'learning_rate': 9.953773976885017e-08, 'epoch': 1.91} {'loss': 0.3222, 'learning_rate': 9.949045899901422e-08, 'epoch': 1.91} {'loss': 0.2421, 'learning_rate': 9.944318940497078e-08, 'epoch': 1.91} {'loss': 0.3052, 'learning_rate': 9.939593098677203e-08, 'epoch': 1.91} {'loss': 0.1932, 'learning_rate': 9.93486837444746e-08, 'epoch': 1.91} {'loss': 0.1699, 'learning_rate': 9.930144767812733e-08, 'epoch': 1.91} {'loss': 0.2082, 'learning_rate': 9.925422278778796e-08, 'epoch': 1.91} {'loss': 0.3418, 'learning_rate': 9.920700907350645e-08, 'epoch': 1.91} {'loss': 0.3367, 'learning_rate': 9.915980653533941e-08, 'epoch': 1.91} {'loss': 0.2077, 'learning_rate': 9.91126151733357e-08, 'epoch': 1.91} {'loss': 0.1756, 'learning_rate': 9.906543498755306e-08, 'epoch': 1.91} {'loss': 0.2928, 'learning_rate': 9.901826597804254e-08, 'epoch': 1.91} {'loss': 0.3641, 'learning_rate': 9.897110814485745e-08, 'epoch': 1.91} {'loss': 0.317, 'learning_rate': 9.892396148804995e-08, 'epoch': 1.91} {'loss': 0.2253, 'learning_rate': 9.887682600767667e-08, 'epoch': 1.91} {'loss': 0.3409, 'learning_rate': 9.882970170378759e-08, 'epoch': 1.91} {'loss': 0.2173, 'learning_rate': 9.878258857643708e-08, 'epoch': 1.91} {'loss': 0.2472, 'learning_rate': 9.873548662567844e-08, 'epoch': 1.91} {'loss': 0.1761, 'learning_rate': 9.868839585156387e-08, 'epoch': 1.91} {'loss': 0.2106, 'learning_rate': 9.864131625414775e-08, 'epoch': 1.91} {'loss': 0.3315, 'learning_rate': 9.859424783348226e-08, 'epoch': 1.91} {'loss': 0.2679, 'learning_rate': 9.854719058962181e-08, 'epoch': 1.91} {'loss': 0.1981, 'learning_rate': 9.850014452261858e-08, 'epoch': 1.91} {'loss': 0.4182, 'learning_rate': 9.845310963252585e-08, 'epoch': 1.91} {'loss': 0.2051, 'learning_rate': 9.840608591939582e-08, 'epoch': 1.91} {'loss': 0.4797, 'learning_rate': 9.835907338328398e-08, 'epoch': 1.91} {'loss': 0.25, 'learning_rate': 9.83120720242403e-08, 'epoch': 1.91} {'loss': 0.312, 'learning_rate': 9.826508184232031e-08, 'epoch': 1.91} {'loss': 0.2153, 'learning_rate': 9.821810283757615e-08, 'epoch': 1.91} {'loss': 0.3057, 'learning_rate': 9.817113501006115e-08, 'epoch': 1.91} {'loss': 0.3197, 'learning_rate': 9.812417835982745e-08, 'epoch': 1.91} {'loss': 0.2813, 'learning_rate': 9.807723288692839e-08, 'epoch': 1.91} {'loss': 0.2715, 'learning_rate': 9.803029859141833e-08, 'epoch': 1.91} {'loss': 0.2942, 'learning_rate': 9.798337547334724e-08, 'epoch': 1.91} {'loss': 0.3435, 'learning_rate': 9.793646353277176e-08, 'epoch': 1.91} {'loss': 0.2776, 'learning_rate': 9.788956276974182e-08, 'epoch': 1.91} {'loss': 0.4471, 'learning_rate': 9.784267318431184e-08, 'epoch': 1.91} {'loss': 0.205, 'learning_rate': 9.779579477653511e-08, 'epoch': 1.91} {'loss': 0.3317, 'learning_rate': 9.77489275464638e-08, 'epoch': 1.91} {'loss': 0.2798, 'learning_rate': 9.770207149415012e-08, 'epoch': 1.91} {'loss': 0.378, 'learning_rate': 9.765522661964843e-08, 'epoch': 1.91} {'loss': 0.437, 'learning_rate': 9.760839292301094e-08, 'epoch': 1.91} {'loss': 0.2573, 'learning_rate': 9.756157040429093e-08, 'epoch': 1.91} {'loss': 0.2843, 'learning_rate': 9.751475906354057e-08, 'epoch': 1.91} {'loss': 0.4443, 'learning_rate': 9.746795890081318e-08, 'epoch': 1.91} {'loss': 0.3524, 'learning_rate': 9.742116991616091e-08, 'epoch': 1.91} {'loss': 0.3088, 'learning_rate': 9.737439210963706e-08, 'epoch': 1.91} {'loss': 0.1737, 'learning_rate': 9.732762548129493e-08, 'epoch': 1.91} {'loss': 0.3046, 'learning_rate': 9.72808700311867e-08, 'epoch': 1.91} {'loss': 0.1592, 'learning_rate': 9.723412575936563e-08, 'epoch': 1.91} {'loss': 0.2666, 'learning_rate': 9.718739266588284e-08, 'epoch': 1.91} {'loss': 0.1461, 'learning_rate': 9.714067075079381e-08, 'epoch': 1.91} {'loss': 0.3855, 'learning_rate': 9.70939600141485e-08, 'epoch': 1.91} {'loss': 0.2373, 'learning_rate': 9.704726045600244e-08, 'epoch': 1.91} {'loss': 0.2674, 'learning_rate': 9.700057207640557e-08, 'epoch': 1.91} {'loss': 0.2488, 'learning_rate': 9.69538948754134e-08, 'epoch': 1.91} {'loss': 0.3732, 'learning_rate': 9.690722885307591e-08, 'epoch': 1.91} {'loss': 0.2501, 'learning_rate': 9.686057400944749e-08, 'epoch': 1.91} {'loss': 0.45, 'learning_rate': 9.681393034458032e-08, 'epoch': 1.91} {'loss': 0.3114, 'learning_rate': 9.676729785852656e-08, 'epoch': 1.91} {'loss': 0.216, 'learning_rate': 9.672067655134065e-08, 'epoch': 1.91} {'loss': 0.179, 'learning_rate': 9.667406642307253e-08, 'epoch': 1.91} {'loss': 0.4042, 'learning_rate': 9.66274674737766e-08, 'epoch': 1.91} {'loss': 0.2475, 'learning_rate': 9.658087970350505e-08, 'epoch': 1.91} {'loss': 0.3182, 'learning_rate': 9.653430311231004e-08, 'epoch': 1.91} {'loss': 0.292, 'learning_rate': 9.648773770024489e-08, 'epoch': 1.91} {'loss': 0.2675, 'learning_rate': 9.644118346736176e-08, 'epoch': 1.91} {'loss': 0.2604, 'learning_rate': 9.639464041371394e-08, 'epoch': 1.91} {'loss': 0.4028, 'learning_rate': 9.634810853935251e-08, 'epoch': 1.91} {'loss': 0.2342, 'learning_rate': 9.630158784433186e-08, 'epoch': 1.91} {'loss': 0.3317, 'learning_rate': 9.625507832870195e-08, 'epoch': 1.91} {'loss': 0.3131, 'learning_rate': 9.620857999251831e-08, 'epoch': 1.91} {'loss': 0.3797, 'learning_rate': 9.616209283583088e-08, 'epoch': 1.91} {'loss': 0.4304, 'learning_rate': 9.611561685869408e-08, 'epoch': 1.91} {'loss': 0.333, 'learning_rate': 9.606915206115785e-08, 'epoch': 1.91} {'loss': 0.2598, 'learning_rate': 9.602269844327771e-08, 'epoch': 1.91} {'loss': 0.2748, 'learning_rate': 9.597625600510363e-08, 'epoch': 1.91} {'loss': 0.3913, 'learning_rate': 9.592982474668999e-08, 'epoch': 1.91} {'loss': 0.2412, 'learning_rate': 9.588340466808676e-08, 'epoch': 1.91} {'loss': 0.3141, 'learning_rate': 9.583699576934946e-08, 'epoch': 1.91} {'loss': 0.307, 'learning_rate': 9.579059805052693e-08, 'epoch': 1.91} {'loss': 0.1321, 'learning_rate': 9.574421151167579e-08, 'epoch': 1.91} {'loss': 0.4494, 'learning_rate': 9.569783615284489e-08, 'epoch': 1.91} {'loss': 0.3237, 'learning_rate': 9.565147197408753e-08, 'epoch': 1.91} {'loss': 0.179, 'learning_rate': 9.560511897545588e-08, 'epoch': 1.91} {'loss': 0.1705, 'learning_rate': 9.555877715700324e-08, 'epoch': 1.91} {'loss': 0.4683, 'learning_rate': 9.551244651878177e-08, 'epoch': 1.91} {'loss': 0.2705, 'learning_rate': 9.546612706084258e-08, 'epoch': 1.91} {'loss': 0.3248, 'learning_rate': 9.541981878323892e-08, 'epoch': 1.91} {'loss': 0.3482, 'learning_rate': 9.537352168602298e-08, 'epoch': 1.91} {'loss': 0.2454, 'learning_rate': 9.532723576924696e-08, 'epoch': 1.91} {'loss': 0.3983, 'learning_rate': 9.528096103296302e-08, 'epoch': 1.91} {'loss': 0.3052, 'learning_rate': 9.523469747722225e-08, 'epoch': 1.91} {'loss': 0.3518, 'learning_rate': 9.518844510208014e-08, 'epoch': 1.91} {'loss': 0.3192, 'learning_rate': 9.514220390758444e-08, 'epoch': 1.91} {'loss': 0.3011, 'learning_rate': 9.509597389379177e-08, 'epoch': 1.91} {'loss': 0.2655, 'learning_rate': 9.504975506075098e-08, 'epoch': 1.91} {'loss': 0.1739, 'learning_rate': 9.500354740851647e-08, 'epoch': 1.91} {'loss': 0.3139, 'learning_rate': 9.49573509371382e-08, 'epoch': 1.91} {'loss': 0.423, 'learning_rate': 9.491116564667058e-08, 'epoch': 1.91} {'loss': 0.3244, 'learning_rate': 9.486499153716466e-08, 'epoch': 1.91} {'loss': 0.2319, 'learning_rate': 9.481882860867264e-08, 'epoch': 1.91} {'loss': 0.2893, 'learning_rate': 9.477267686124558e-08, 'epoch': 1.92} {'loss': 0.327, 'learning_rate': 9.472653629493789e-08, 'epoch': 1.92} {'loss': 0.2245, 'learning_rate': 9.468040690979952e-08, 'epoch': 1.92} {'loss': 0.2805, 'learning_rate': 9.463428870588376e-08, 'epoch': 1.92} {'loss': 0.3569, 'learning_rate': 9.45881816832428e-08, 'epoch': 1.92} {'loss': 0.2772, 'learning_rate': 9.454208584192659e-08, 'epoch': 1.92} {'loss': 0.4125, 'learning_rate': 9.449600118199065e-08, 'epoch': 1.92} {'loss': 0.3451, 'learning_rate': 9.444992770348383e-08, 'epoch': 1.92} {'loss': 0.3279, 'learning_rate': 9.44038654064594e-08, 'epoch': 1.92} {'loss': 0.2578, 'learning_rate': 9.435781429096957e-08, 'epoch': 1.92} {'loss': 0.1746, 'learning_rate': 9.43117743570665e-08, 'epoch': 1.92} {'loss': 0.3224, 'learning_rate': 9.426574560480129e-08, 'epoch': 1.92} {'loss': 0.2095, 'learning_rate': 9.421972803422718e-08, 'epoch': 1.92} {'loss': 0.3554, 'learning_rate': 9.417372164539529e-08, 'epoch': 1.92} {'loss': 0.3697, 'learning_rate': 9.412772643835666e-08, 'epoch': 1.92} {'loss': 0.2924, 'learning_rate': 9.408174241316459e-08, 'epoch': 1.92} {'loss': 0.2818, 'learning_rate': 9.403576956987015e-08, 'epoch': 1.92} {'loss': 0.2854, 'learning_rate': 9.398980790852664e-08, 'epoch': 1.92} {'loss': 0.2609, 'learning_rate': 9.394385742918399e-08, 'epoch': 1.92} {'loss': 0.3585, 'learning_rate': 9.389791813189553e-08, 'epoch': 1.92} {'loss': 0.298, 'learning_rate': 9.38519900167123e-08, 'epoch': 1.92} {'loss': 0.3575, 'learning_rate': 9.38060730836865e-08, 'epoch': 1.92} {'loss': 0.3034, 'learning_rate': 9.37601673328703e-08, 'epoch': 1.92} {'loss': 0.2891, 'learning_rate': 9.371427276431478e-08, 'epoch': 1.92} {'loss': 0.285, 'learning_rate': 9.36683893780721e-08, 'epoch': 1.92} {'loss': 0.1956, 'learning_rate': 9.362251717419336e-08, 'epoch': 1.92} {'loss': 0.3477, 'learning_rate': 9.357665615273292e-08, 'epoch': 1.92} {'loss': 0.3596, 'learning_rate': 9.353080631373856e-08, 'epoch': 1.92} {'loss': 0.3682, 'learning_rate': 9.348496765726467e-08, 'epoch': 1.92} {'loss': 0.4678, 'learning_rate': 9.34391401833623e-08, 'epoch': 1.92} {'loss': 0.3438, 'learning_rate': 9.339332389208478e-08, 'epoch': 1.92} {'loss': 0.2353, 'learning_rate': 9.334751878348092e-08, 'epoch': 1.92} {'loss': 0.2377, 'learning_rate': 9.330172485760403e-08, 'epoch': 1.92} {'loss': 0.3098, 'learning_rate': 9.325594211450628e-08, 'epoch': 1.92} {'loss': 0.3005, 'learning_rate': 9.321017055423765e-08, 'epoch': 1.92} {'loss': 0.2544, 'learning_rate': 9.31644101768514e-08, 'epoch': 1.92} {'loss': 0.297, 'learning_rate': 9.311866098239974e-08, 'epoch': 1.92} {'loss': 0.2204, 'learning_rate': 9.307292297093151e-08, 'epoch': 1.92} {'loss': 0.2112, 'learning_rate': 9.30271961425011e-08, 'epoch': 1.92} {'loss': 0.3152, 'learning_rate': 9.298148049715961e-08, 'epoch': 1.92} {'loss': 0.4053, 'learning_rate': 9.293577603495696e-08, 'epoch': 1.92} {'loss': 0.4032, 'learning_rate': 9.289008275594646e-08, 'epoch': 1.92} {'loss': 0.2598, 'learning_rate': 9.284440066017808e-08, 'epoch': 1.92} {'loss': 0.4323, 'learning_rate': 9.27987297477062e-08, 'epoch': 1.92} {'loss': 0.4195, 'learning_rate': 9.275307001857858e-08, 'epoch': 1.92} {'loss': 0.2744, 'learning_rate': 9.270742147285072e-08, 'epoch': 1.92} {'loss': 0.3361, 'learning_rate': 9.266178411057148e-08, 'epoch': 1.92} {'loss': 0.364, 'learning_rate': 9.261615793179302e-08, 'epoch': 1.92} {'loss': 0.277, 'learning_rate': 9.257054293656642e-08, 'epoch': 1.92} {'loss': 0.3058, 'learning_rate': 9.252493912494498e-08, 'epoch': 1.92} {'loss': 0.2417, 'learning_rate': 9.247934649697754e-08, 'epoch': 1.92} {'loss': 0.3137, 'learning_rate': 9.243376505271851e-08, 'epoch': 1.92} {'loss': 0.29, 'learning_rate': 9.238819479221673e-08, 'epoch': 1.92} {'loss': 0.1673, 'learning_rate': 9.234263571552438e-08, 'epoch': 1.92} {'loss': 0.3554, 'learning_rate': 9.229708782269365e-08, 'epoch': 1.92} {'loss': 0.345, 'learning_rate': 9.225155111377448e-08, 'epoch': 1.92} {'loss': 0.1729, 'learning_rate': 9.22060255888213e-08, 'epoch': 1.92} {'loss': 0.2653, 'learning_rate': 9.216051124788184e-08, 'epoch': 1.92} {'loss': 0.304, 'learning_rate': 9.211500809100937e-08, 'epoch': 1.92} {'loss': 0.2647, 'learning_rate': 9.206951611825499e-08, 'epoch': 1.92} {'loss': 0.325, 'learning_rate': 9.202403532967086e-08, 'epoch': 1.92} {'loss': 0.3781, 'learning_rate': 9.197856572530583e-08, 'epoch': 1.92} {'loss': 0.2973, 'learning_rate': 9.193310730521432e-08, 'epoch': 1.92} {'loss': 0.4403, 'learning_rate': 9.188766006944627e-08, 'epoch': 1.92} {'loss': 0.2211, 'learning_rate': 9.184222401805276e-08, 'epoch': 1.92} {'loss': 0.2942, 'learning_rate': 9.179679915108485e-08, 'epoch': 1.92} {'loss': 0.2952, 'learning_rate': 9.175138546859364e-08, 'epoch': 1.92} {'loss': 0.3222, 'learning_rate': 9.170598297063238e-08, 'epoch': 1.92} {'loss': 0.2104, 'learning_rate': 9.166059165724994e-08, 'epoch': 1.92} {'loss': 0.1667, 'learning_rate': 9.161521152849962e-08, 'epoch': 1.92} {'loss': 0.2513, 'learning_rate': 9.156984258443025e-08, 'epoch': 1.92} {'loss': 0.2979, 'learning_rate': 9.152448482509513e-08, 'epoch': 1.92} {'loss': 0.3625, 'learning_rate': 9.147913825054423e-08, 'epoch': 1.92} {'loss': 0.2094, 'learning_rate': 9.14338028608297e-08, 'epoch': 1.92} {'loss': 0.3041, 'learning_rate': 9.138847865600154e-08, 'epoch': 1.92} {'loss': 0.3056, 'learning_rate': 9.13431656361119e-08, 'epoch': 1.92} {'loss': 0.3302, 'learning_rate': 9.129786380121186e-08, 'epoch': 1.92} {'loss': 0.2146, 'learning_rate': 9.12525731513525e-08, 'epoch': 1.92} {'loss': 0.2254, 'learning_rate': 9.120729368658377e-08, 'epoch': 1.92} {'loss': 0.1686, 'learning_rate': 9.116202540695784e-08, 'epoch': 1.92} {'loss': 0.2207, 'learning_rate': 9.111676831252691e-08, 'epoch': 1.92} {'loss': 0.3313, 'learning_rate': 9.107152240333983e-08, 'epoch': 1.92} {'loss': 0.3814, 'learning_rate': 9.102628767944877e-08, 'epoch': 1.92} {'loss': 0.2287, 'learning_rate': 9.09810641409048e-08, 'epoch': 1.92} {'loss': 0.2879, 'learning_rate': 9.09358517877601e-08, 'epoch': 1.92} {'loss': 0.3801, 'learning_rate': 9.089065062006352e-08, 'epoch': 1.92} {'loss': 0.393, 'learning_rate': 9.084546063786726e-08, 'epoch': 1.92} {'loss': 0.3736, 'learning_rate': 9.080028184122236e-08, 'epoch': 1.92} {'loss': 0.3804, 'learning_rate': 9.075511423017879e-08, 'epoch': 1.92} {'loss': 0.3312, 'learning_rate': 9.070995780478875e-08, 'epoch': 1.92} {'loss': 0.3977, 'learning_rate': 9.066481256510329e-08, 'epoch': 1.92} {'loss': 0.2532, 'learning_rate': 9.061967851117238e-08, 'epoch': 1.92} {'loss': 0.2583, 'learning_rate': 9.057455564304817e-08, 'epoch': 1.92} {'loss': 0.3508, 'learning_rate': 9.052944396078067e-08, 'epoch': 1.92} {'loss': 0.2952, 'learning_rate': 9.048434346442092e-08, 'epoch': 1.92} {'loss': 0.4356, 'learning_rate': 9.043925415402e-08, 'epoch': 1.92} {'loss': 0.3534, 'learning_rate': 9.039417602962786e-08, 'epoch': 1.92} {'loss': 0.3354, 'learning_rate': 9.03491090912978e-08, 'epoch': 1.92} {'loss': 0.2906, 'learning_rate': 9.030405333907865e-08, 'epoch': 1.92} {'loss': 0.2474, 'learning_rate': 9.025900877302151e-08, 'epoch': 1.92} {'loss': 0.242, 'learning_rate': 9.021397539317855e-08, 'epoch': 1.92} {'loss': 0.2802, 'learning_rate': 9.016895319959862e-08, 'epoch': 1.92} {'loss': 0.3026, 'learning_rate': 9.012394219233389e-08, 'epoch': 1.92} {'loss': 0.2445, 'learning_rate': 9.007894237143322e-08, 'epoch': 1.92} {'loss': 0.3474, 'learning_rate': 9.003395373695101e-08, 'epoch': 1.92} {'loss': 0.3524, 'learning_rate': 8.998897628893499e-08, 'epoch': 1.92} {'loss': 0.4344, 'learning_rate': 8.994401002743735e-08, 'epoch': 1.92} {'loss': 0.2374, 'learning_rate': 8.989905495250806e-08, 'epoch': 1.92} {'loss': 0.3868, 'learning_rate': 8.985411106419928e-08, 'epoch': 1.92} {'loss': 0.2331, 'learning_rate': 8.980917836255876e-08, 'epoch': 1.92} {'loss': 0.2927, 'learning_rate': 8.976425684764089e-08, 'epoch': 1.92} {'loss': 0.2163, 'learning_rate': 8.971934651949454e-08, 'epoch': 1.92} {'loss': 0.3481, 'learning_rate': 8.967444737816966e-08, 'epoch': 1.92} {'loss': 0.3193, 'learning_rate': 8.962955942371843e-08, 'epoch': 1.92} {'loss': 0.2332, 'learning_rate': 8.95846826561908e-08, 'epoch': 1.92} {'loss': 0.2422, 'learning_rate': 8.953981707563786e-08, 'epoch': 1.92} {'loss': 0.2854, 'learning_rate': 8.949496268210845e-08, 'epoch': 1.92} {'loss': 0.3968, 'learning_rate': 8.945011947565586e-08, 'epoch': 1.92} {'loss': 0.2523, 'learning_rate': 8.940528745632892e-08, 'epoch': 1.92} {'loss': 0.3851, 'learning_rate': 8.936046662417986e-08, 'epoch': 1.92} {'loss': 0.3289, 'learning_rate': 8.931565697925748e-08, 'epoch': 1.92} {'loss': 0.2805, 'learning_rate': 8.927085852161287e-08, 'epoch': 1.92} {'loss': 0.1976, 'learning_rate': 8.922607125129711e-08, 'epoch': 1.92} {'loss': 0.233, 'learning_rate': 8.918129516836127e-08, 'epoch': 1.92} {'loss': 0.1407, 'learning_rate': 8.913653027285418e-08, 'epoch': 1.92} {'loss': 0.2546, 'learning_rate': 8.909177656482692e-08, 'epoch': 1.92} {'loss': 0.3124, 'learning_rate': 8.904703404433169e-08, 'epoch': 1.92} {'loss': 0.2043, 'learning_rate': 8.90023027114173e-08, 'epoch': 1.92} {'loss': 0.3143, 'learning_rate': 8.895758256613374e-08, 'epoch': 1.92} {'loss': 0.2781, 'learning_rate': 8.891287360853318e-08, 'epoch': 1.92} {'loss': 0.2357, 'learning_rate': 8.886817583866558e-08, 'epoch': 1.92} {'loss': 0.2909, 'learning_rate': 8.88234892565798e-08, 'epoch': 1.92} {'loss': 0.2848, 'learning_rate': 8.877881386232912e-08, 'epoch': 1.92} {'loss': 0.3312, 'learning_rate': 8.873414965596128e-08, 'epoch': 1.92} {'loss': 0.2706, 'learning_rate': 8.868949663752957e-08, 'epoch': 1.92} {'loss': 0.3981, 'learning_rate': 8.864485480708062e-08, 'epoch': 1.92} {'loss': 0.3864, 'learning_rate': 8.860022416466885e-08, 'epoch': 1.92} {'loss': 0.3525, 'learning_rate': 8.855560471034086e-08, 'epoch': 1.92} {'loss': 0.3707, 'learning_rate': 8.851099644414996e-08, 'epoch': 1.92} {'loss': 0.3932, 'learning_rate': 8.846639936614498e-08, 'epoch': 1.92} {'loss': 0.4189, 'learning_rate': 8.842181347637701e-08, 'epoch': 1.92} {'loss': 0.2861, 'learning_rate': 8.837723877489601e-08, 'epoch': 1.92} {'loss': 0.4124, 'learning_rate': 8.833267526175193e-08, 'epoch': 1.92} {'loss': 0.2434, 'learning_rate': 8.828812293699585e-08, 'epoch': 1.92} {'loss': 0.2128, 'learning_rate': 8.824358180067771e-08, 'epoch': 1.92} {'loss': 0.2041, 'learning_rate': 8.819905185284749e-08, 'epoch': 1.92} {'loss': 0.4207, 'learning_rate': 8.815453309355514e-08, 'epoch': 1.92} {'loss': 0.3323, 'learning_rate': 8.811002552285286e-08, 'epoch': 1.92} {'loss': 0.262, 'learning_rate': 8.806552914078837e-08, 'epoch': 1.92} {'loss': 0.2971, 'learning_rate': 8.802104394741384e-08, 'epoch': 1.92} {'loss': 0.3289, 'learning_rate': 8.797656994277814e-08, 'epoch': 1.92} {'loss': 0.3445, 'learning_rate': 8.793210712693235e-08, 'epoch': 1.92} {'loss': 0.3531, 'learning_rate': 8.78876554999264e-08, 'epoch': 1.92} {'loss': 0.2573, 'learning_rate': 8.784321506181026e-08, 'epoch': 1.92} {'loss': 0.2667, 'learning_rate': 8.77987858126339e-08, 'epoch': 1.92} {'loss': 0.2266, 'learning_rate': 8.775436775244839e-08, 'epoch': 1.92} {'loss': 0.3742, 'learning_rate': 8.770996088130368e-08, 'epoch': 1.92} {'loss': 0.2809, 'learning_rate': 8.766556519924863e-08, 'epoch': 1.92} {'loss': 0.3836, 'learning_rate': 8.76211807063343e-08, 'epoch': 1.92} {'loss': 0.2407, 'learning_rate': 8.757680740261065e-08, 'epoch': 1.92} {'loss': 0.31, 'learning_rate': 8.753244528812877e-08, 'epoch': 1.92} {'loss': 0.2828, 'learning_rate': 8.748809436293637e-08, 'epoch': 1.92} {'loss': 0.3486, 'learning_rate': 8.744375462708677e-08, 'epoch': 1.92} {'loss': 0.4553, 'learning_rate': 8.739942608062658e-08, 'epoch': 1.92} {'loss': 0.2624, 'learning_rate': 8.735510872360798e-08, 'epoch': 1.92} {'loss': 0.3075, 'learning_rate': 8.731080255608093e-08, 'epoch': 1.92} {'loss': 0.2614, 'learning_rate': 8.726650757809429e-08, 'epoch': 1.92} {'loss': 0.2541, 'learning_rate': 8.722222378970024e-08, 'epoch': 1.92} {'loss': 0.2943, 'learning_rate': 8.717795119094542e-08, 'epoch': 1.92} {'loss': 0.2721, 'learning_rate': 8.713368978188308e-08, 'epoch': 1.92} {'loss': 0.3457, 'learning_rate': 8.708943956256099e-08, 'epoch': 1.92} {'loss': 0.4375, 'learning_rate': 8.704520053303023e-08, 'epoch': 1.92} {'loss': 0.3089, 'learning_rate': 8.700097269333963e-08, 'epoch': 1.92} {'loss': 0.1901, 'learning_rate': 8.695675604354136e-08, 'epoch': 1.92} {'loss': 0.1947, 'learning_rate': 8.691255058368209e-08, 'epoch': 1.92} {'loss': 0.3358, 'learning_rate': 8.686835631381507e-08, 'epoch': 1.92} {'loss': 0.2946, 'learning_rate': 8.682417323398806e-08, 'epoch': 1.92} {'loss': 0.2602, 'learning_rate': 8.678000134425102e-08, 'epoch': 1.92} {'loss': 0.1533, 'learning_rate': 8.673584064465501e-08, 'epoch': 1.92} {'loss': 0.3469, 'learning_rate': 8.669169113524888e-08, 'epoch': 1.92} {'loss': 0.3603, 'learning_rate': 8.664755281608261e-08, 'epoch': 1.92} {'loss': 0.1962, 'learning_rate': 8.660342568720503e-08, 'epoch': 1.92} {'loss': 0.4141, 'learning_rate': 8.655930974866944e-08, 'epoch': 1.92} {'loss': 0.202, 'learning_rate': 8.651520500052136e-08, 'epoch': 1.92} {'loss': 0.2841, 'learning_rate': 8.647111144281296e-08, 'epoch': 1.92} {'loss': 0.3456, 'learning_rate': 8.642702907559419e-08, 'epoch': 1.92} {'loss': 0.2502, 'learning_rate': 8.638295789891393e-08, 'epoch': 1.92} {'loss': 0.3704, 'learning_rate': 8.633889791282213e-08, 'epoch': 1.92} {'loss': 0.2563, 'learning_rate': 8.629484911736763e-08, 'epoch': 1.92} {'loss': 0.4645, 'learning_rate': 8.625081151260151e-08, 'epoch': 1.92} {'loss': 0.1919, 'learning_rate': 8.620678509857372e-08, 'epoch': 1.92} {'loss': 0.1535, 'learning_rate': 8.616276987533312e-08, 'epoch': 1.92} {'loss': 0.194, 'learning_rate': 8.611876584292856e-08, 'epoch': 1.92} {'loss': 0.209, 'learning_rate': 8.607477300141221e-08, 'epoch': 1.92} {'loss': 0.2961, 'learning_rate': 8.60307913508307e-08, 'epoch': 1.92} {'loss': 0.1625, 'learning_rate': 8.598682089123622e-08, 'epoch': 1.92} {'loss': 0.3798, 'learning_rate': 8.594286162267651e-08, 'epoch': 1.92} {'loss': 0.3258, 'learning_rate': 8.589891354520374e-08, 'epoch': 1.92} {'loss': 0.2684, 'learning_rate': 8.585497665886344e-08, 'epoch': 1.92} {'loss': 0.2323, 'learning_rate': 8.581105096371001e-08, 'epoch': 1.92} {'loss': 0.2661, 'learning_rate': 8.576713645979007e-08, 'epoch': 1.92} {'loss': 0.3578, 'learning_rate': 8.572323314715247e-08, 'epoch': 1.92} {'loss': 0.2777, 'learning_rate': 8.567934102584941e-08, 'epoch': 1.92} {'loss': 0.2726, 'learning_rate': 8.563546009592749e-08, 'epoch': 1.92} {'loss': 0.272, 'learning_rate': 8.559159035743892e-08, 'epoch': 1.92} {'loss': 0.3583, 'learning_rate': 8.554773181043252e-08, 'epoch': 1.92} {'loss': 0.1899, 'learning_rate': 8.550388445495717e-08, 'epoch': 1.92} {'loss': 0.2722, 'learning_rate': 8.54600482910617e-08, 'epoch': 1.92} {'loss': 0.2553, 'learning_rate': 8.541622331879717e-08, 'epoch': 1.92} {'loss': 0.2643, 'learning_rate': 8.537240953821247e-08, 'epoch': 1.92} {'loss': 0.2222, 'learning_rate': 8.532860694935751e-08, 'epoch': 1.92} {'loss': 0.1497, 'learning_rate': 8.528481555228007e-08, 'epoch': 1.92} {'loss': 0.2247, 'learning_rate': 8.524103534703121e-08, 'epoch': 1.92} {'loss': 0.4039, 'learning_rate': 8.519726633365977e-08, 'epoch': 1.92} {'loss': 0.2716, 'learning_rate': 8.515350851221571e-08, 'epoch': 1.92} {'loss': 0.3432, 'learning_rate': 8.510976188274677e-08, 'epoch': 1.92} {'loss': 0.3598, 'learning_rate': 8.506602644530404e-08, 'epoch': 1.92} {'loss': 0.3021, 'learning_rate': 8.502230219993746e-08, 'epoch': 1.92} {'loss': 0.4697, 'learning_rate': 8.497858914669365e-08, 'epoch': 1.92} {'loss': 0.3959, 'learning_rate': 8.493488728562482e-08, 'epoch': 1.92} {'loss': 0.2591, 'learning_rate': 8.48911966167787e-08, 'epoch': 1.92} {'loss': 0.1649, 'learning_rate': 8.484751714020522e-08, 'epoch': 1.92} {'loss': 0.3373, 'learning_rate': 8.480384885595217e-08, 'epoch': 1.92} {'loss': 0.3811, 'learning_rate': 8.476019176407169e-08, 'epoch': 1.92} {'loss': 0.2584, 'learning_rate': 8.471654586461042e-08, 'epoch': 1.92} {'loss': 0.3411, 'learning_rate': 8.467291115761944e-08, 'epoch': 1.92} {'loss': 0.2983, 'learning_rate': 8.462928764314648e-08, 'epoch': 1.92} {'loss': 0.2356, 'learning_rate': 8.45856753212415e-08, 'epoch': 1.92} {'loss': 0.2606, 'learning_rate': 8.454207419195448e-08, 'epoch': 1.92} {'loss': 0.2871, 'learning_rate': 8.449848425533425e-08, 'epoch': 1.92} {'loss': 0.26, 'learning_rate': 8.445490551142965e-08, 'epoch': 1.92} {'loss': 0.2746, 'learning_rate': 8.441133796028844e-08, 'epoch': 1.92} {'loss': 0.2444, 'learning_rate': 8.436778160196279e-08, 'epoch': 1.92} {'loss': 0.4436, 'learning_rate': 8.432423643649934e-08, 'epoch': 1.92} {'loss': 0.3333, 'learning_rate': 8.428070246394914e-08, 'epoch': 1.92} {'loss': 0.1516, 'learning_rate': 8.423717968435995e-08, 'epoch': 1.92} {'loss': 0.409, 'learning_rate': 8.419366809778173e-08, 'epoch': 1.92} {'loss': 0.3263, 'learning_rate': 8.415016770426331e-08, 'epoch': 1.92} {'loss': 0.3143, 'learning_rate': 8.410667850385356e-08, 'epoch': 1.92} {'loss': 0.3632, 'learning_rate': 8.406320049660243e-08, 'epoch': 1.92} {'loss': 0.3808, 'learning_rate': 8.401973368255767e-08, 'epoch': 1.92} {'loss': 0.2384, 'learning_rate': 8.397627806176923e-08, 'epoch': 1.92} {'loss': 0.2202, 'learning_rate': 8.393283363428595e-08, 'epoch': 1.92} {'loss': 0.1714, 'learning_rate': 8.38894004001567e-08, 'epoch': 1.92} {'loss': 0.3521, 'learning_rate': 8.384597835943031e-08, 'epoch': 1.92} {'loss': 0.3648, 'learning_rate': 8.380256751215677e-08, 'epoch': 1.92} {'loss': 0.3279, 'learning_rate': 8.375916785838378e-08, 'epoch': 1.92} {'loss': 0.3424, 'learning_rate': 8.371577939816245e-08, 'epoch': 1.92} {'loss': 0.3409, 'learning_rate': 8.367240213153937e-08, 'epoch': 1.92} {'loss': 0.2674, 'learning_rate': 8.362903605856455e-08, 'epoch': 1.92} {'loss': 0.2673, 'learning_rate': 8.358568117928678e-08, 'epoch': 1.92} {'loss': 0.4636, 'learning_rate': 8.354233749375496e-08, 'epoch': 1.92} {'loss': 0.3035, 'learning_rate': 8.349900500201901e-08, 'epoch': 1.92} {'loss': 0.3887, 'learning_rate': 8.34556837041256e-08, 'epoch': 1.92} {'loss': 0.2711, 'learning_rate': 8.341237360012578e-08, 'epoch': 1.92} {'loss': 0.2614, 'learning_rate': 8.336907469006727e-08, 'epoch': 1.92} {'loss': 0.4116, 'learning_rate': 8.332578697400007e-08, 'epoch': 1.92} {'loss': 0.1867, 'learning_rate': 8.328251045197189e-08, 'epoch': 1.92} {'loss': 0.294, 'learning_rate': 8.32392451240327e-08, 'epoch': 1.92} {'loss': 0.205, 'learning_rate': 8.319599099022912e-08, 'epoch': 1.92} {'loss': 0.3532, 'learning_rate': 8.315274805061225e-08, 'epoch': 1.92} {'loss': 0.2523, 'learning_rate': 8.31095163052309e-08, 'epoch': 1.92} {'loss': 0.552, 'learning_rate': 8.306629575413172e-08, 'epoch': 1.92} {'loss': 0.2347, 'learning_rate': 8.302308639736578e-08, 'epoch': 1.92} {'loss': 0.3658, 'learning_rate': 8.297988823498082e-08, 'epoch': 1.92} {'loss': 0.3062, 'learning_rate': 8.29367012670268e-08, 'epoch': 1.92} {'loss': 0.315, 'learning_rate': 8.289352549355035e-08, 'epoch': 1.92} {'loss': 0.2888, 'learning_rate': 8.285036091460141e-08, 'epoch': 1.92} {'loss': 0.2637, 'learning_rate': 8.280720753022775e-08, 'epoch': 1.92} {'loss': 0.1551, 'learning_rate': 8.276406534048043e-08, 'epoch': 1.92} {'loss': 0.2824, 'learning_rate': 8.272093434540496e-08, 'epoch': 1.92} {'loss': 0.2426, 'learning_rate': 8.267781454505352e-08, 'epoch': 1.92} {'loss': 0.2443, 'learning_rate': 8.263470593947165e-08, 'epoch': 1.92} {'loss': 0.2798, 'learning_rate': 8.259160852871039e-08, 'epoch': 1.92} {'loss': 0.2512, 'learning_rate': 8.254852231281641e-08, 'epoch': 1.92} {'loss': 0.4638, 'learning_rate': 8.250544729183962e-08, 'epoch': 1.92} {'loss': 0.2936, 'learning_rate': 8.24623834658278e-08, 'epoch': 1.92} {'loss': 0.3062, 'learning_rate': 8.241933083483089e-08, 'epoch': 1.92} {'loss': 0.2829, 'learning_rate': 8.237628939889553e-08, 'epoch': 1.92} {'loss': 0.3294, 'learning_rate': 8.233325915807277e-08, 'epoch': 1.92} {'loss': 0.3191, 'learning_rate': 8.229024011240816e-08, 'epoch': 1.92} {'loss': 0.2279, 'learning_rate': 8.224723226195275e-08, 'epoch': 1.92} {'loss': 0.2898, 'learning_rate': 8.220423560675428e-08, 'epoch': 1.92} {'loss': 0.3593, 'learning_rate': 8.21612501468616e-08, 'epoch': 1.92} {'loss': 0.2951, 'learning_rate': 8.211827588232246e-08, 'epoch': 1.92} {'loss': 0.2475, 'learning_rate': 8.207531281318681e-08, 'epoch': 1.92} {'loss': 0.2321, 'learning_rate': 8.203236093950128e-08, 'epoch': 1.92} {'loss': 0.2343, 'learning_rate': 8.198942026131584e-08, 'epoch': 1.92} {'loss': 0.215, 'learning_rate': 8.194649077867711e-08, 'epoch': 1.92} {'loss': 0.2144, 'learning_rate': 8.190357249163616e-08, 'epoch': 1.92} {'loss': 0.4022, 'learning_rate': 8.186066540023851e-08, 'epoch': 1.92} {'loss': 0.384, 'learning_rate': 8.181776950453524e-08, 'epoch': 1.92} {'loss': 0.4035, 'learning_rate': 8.177488480457408e-08, 'epoch': 1.92} {'loss': 0.208, 'learning_rate': 8.173201130040276e-08, 'epoch': 1.92} {'loss': 0.5073, 'learning_rate': 8.168914899206903e-08, 'epoch': 1.92} {'loss': 0.2063, 'learning_rate': 8.164629787962286e-08, 'epoch': 1.92} {'loss': 0.3686, 'learning_rate': 8.160345796311198e-08, 'epoch': 1.92} {'loss': 0.3675, 'learning_rate': 8.156062924258524e-08, 'epoch': 1.92} {'loss': 0.3119, 'learning_rate': 8.151781171808926e-08, 'epoch': 1.92} {'loss': 0.3078, 'learning_rate': 8.147500538967401e-08, 'epoch': 1.92} {'loss': 0.3263, 'learning_rate': 8.143221025738834e-08, 'epoch': 1.92} {'loss': 0.2525, 'learning_rate': 8.138942632127888e-08, 'epoch': 1.92} {'loss': 0.3, 'learning_rate': 8.134665358139449e-08, 'epoch': 1.92} {'loss': 0.1944, 'learning_rate': 8.1303892037784e-08, 'epoch': 1.92} {'loss': 0.4654, 'learning_rate': 8.126114169049515e-08, 'epoch': 1.92} {'loss': 0.1972, 'learning_rate': 8.121840253957569e-08, 'epoch': 1.92} {'loss': 0.3049, 'learning_rate': 8.117567458507559e-08, 'epoch': 1.92} {'loss': 0.3774, 'learning_rate': 8.113295782704145e-08, 'epoch': 1.92} {'loss': 0.3002, 'learning_rate': 8.109025226552214e-08, 'epoch': 1.92} {'loss': 0.2206, 'learning_rate': 8.10475579005654e-08, 'epoch': 1.92} {'loss': 0.4635, 'learning_rate': 8.100487473222008e-08, 'epoch': 1.92} {'loss': 0.366, 'learning_rate': 8.09622027605339e-08, 'epoch': 1.92} {'loss': 0.1706, 'learning_rate': 8.091954198555574e-08, 'epoch': 1.92} {'loss': 0.42, 'learning_rate': 8.087689240733332e-08, 'epoch': 1.92} {'loss': 0.305, 'learning_rate': 8.083425402591327e-08, 'epoch': 1.92} {'loss': 0.368, 'learning_rate': 8.079162684134668e-08, 'epoch': 1.92} {'loss': 0.17, 'learning_rate': 8.074901085367903e-08, 'epoch': 1.92} {'loss': 0.3411, 'learning_rate': 8.070640606296031e-08, 'epoch': 1.92} {'loss': 0.2385, 'learning_rate': 8.066381246923716e-08, 'epoch': 1.92} {'loss': 0.2149, 'learning_rate': 8.062123007255951e-08, 'epoch': 1.92} {'loss': 0.3395, 'learning_rate': 8.05786588729729e-08, 'epoch': 1.92} {'loss': 0.3781, 'learning_rate': 8.053609887052727e-08, 'epoch': 1.92} {'loss': 0.327, 'learning_rate': 8.049355006526926e-08, 'epoch': 1.92} {'loss': 0.2105, 'learning_rate': 8.045101245724885e-08, 'epoch': 1.92} {'loss': 0.1984, 'learning_rate': 8.040848604651375e-08, 'epoch': 1.92} {'loss': 0.2739, 'learning_rate': 8.036597083310949e-08, 'epoch': 1.92} {'loss': 0.2016, 'learning_rate': 8.032346681708714e-08, 'epoch': 1.92} {'loss': 0.4032, 'learning_rate': 8.02809739984911e-08, 'epoch': 1.92} {'loss': 0.3279, 'learning_rate': 8.023849237737358e-08, 'epoch': 1.92} {'loss': 0.2961, 'learning_rate': 8.019602195378007e-08, 'epoch': 1.92} {'loss': 0.2644, 'learning_rate': 8.015356272775831e-08, 'epoch': 1.92} {'loss': 0.433, 'learning_rate': 8.011111469935717e-08, 'epoch': 1.92} {'loss': 0.2769, 'learning_rate': 8.006867786862438e-08, 'epoch': 1.92} {'loss': 0.3035, 'learning_rate': 8.002625223560767e-08, 'epoch': 1.92} {'loss': 0.155, 'learning_rate': 7.998383780035479e-08, 'epoch': 1.92} {'loss': 0.2873, 'learning_rate': 7.994143456291348e-08, 'epoch': 1.92} {'loss': 0.3702, 'learning_rate': 7.989904252333258e-08, 'epoch': 1.92} {'loss': 0.21, 'learning_rate': 7.985666168165874e-08, 'epoch': 1.92} {'loss': 0.1556, 'learning_rate': 7.981429203794078e-08, 'epoch': 1.92} {'loss': 0.3137, 'learning_rate': 7.977193359222535e-08, 'epoch': 1.92} {'loss': 0.2529, 'learning_rate': 7.97295863445613e-08, 'epoch': 1.92} {'loss': 0.3924, 'learning_rate': 7.968725029499636e-08, 'epoch': 1.92} {'loss': 0.3267, 'learning_rate': 7.964492544357827e-08, 'epoch': 1.92} {'loss': 0.2631, 'learning_rate': 7.960261179035478e-08, 'epoch': 1.92} {'loss': 0.3719, 'learning_rate': 7.95603093353725e-08, 'epoch': 1.92} {'loss': 0.2513, 'learning_rate': 7.951801807868032e-08, 'epoch': 1.92} {'loss': 0.3869, 'learning_rate': 7.947573802032594e-08, 'epoch': 1.92} {'loss': 0.2472, 'learning_rate': 7.943346916035821e-08, 'epoch': 1.92} {'loss': 0.2237, 'learning_rate': 7.939121149882156e-08, 'epoch': 1.92} {'loss': 0.3227, 'learning_rate': 7.934896503576706e-08, 'epoch': 1.92} {'loss': 0.2634, 'learning_rate': 7.930672977124132e-08, 'epoch': 1.92} {'loss': 0.1851, 'learning_rate': 7.926450570529099e-08, 'epoch': 1.92} {'loss': 0.3928, 'learning_rate': 7.92222928379649e-08, 'epoch': 1.92} {'loss': 0.4125, 'learning_rate': 7.91800911693108e-08, 'epoch': 1.92} {'loss': 0.3532, 'learning_rate': 7.913790069937533e-08, 'epoch': 1.92} {'loss': 0.4201, 'learning_rate': 7.90957214282062e-08, 'epoch': 1.92} {'loss': 0.2211, 'learning_rate': 7.90535533558523e-08, 'epoch': 1.92} {'loss': 0.4454, 'learning_rate': 7.901139648235911e-08, 'epoch': 1.92} {'loss': 0.2664, 'learning_rate': 7.896925080777663e-08, 'epoch': 1.92} {'loss': 0.3243, 'learning_rate': 7.892711633215145e-08, 'epoch': 1.92} {'loss': 0.2563, 'learning_rate': 7.888499305553022e-08, 'epoch': 1.92} {'loss': 0.3197, 'learning_rate': 7.884288097796178e-08, 'epoch': 1.92} {'loss': 0.3222, 'learning_rate': 7.880078009949277e-08, 'epoch': 1.92} {'loss': 0.2204, 'learning_rate': 7.875869042017093e-08, 'epoch': 1.92} {'loss': 0.2187, 'learning_rate': 7.871661194004399e-08, 'epoch': 1.92} {'loss': 0.1624, 'learning_rate': 7.86745446591608e-08, 'epoch': 1.92} {'loss': 0.2333, 'learning_rate': 7.863248857756578e-08, 'epoch': 1.92} {'loss': 0.4322, 'learning_rate': 7.859044369530777e-08, 'epoch': 1.92} {'loss': 0.3064, 'learning_rate': 7.854841001243562e-08, 'epoch': 1.92} {'loss': 0.3439, 'learning_rate': 7.850638752899487e-08, 'epoch': 1.92} {'loss': 0.2468, 'learning_rate': 7.846437624503433e-08, 'epoch': 1.92} {'loss': 0.2306, 'learning_rate': 7.842237616060066e-08, 'epoch': 1.92} {'loss': 0.2992, 'learning_rate': 7.83803872757416e-08, 'epoch': 1.92} {'loss': 0.3516, 'learning_rate': 7.833840959050376e-08, 'epoch': 1.92} {'loss': 0.3456, 'learning_rate': 7.829644310493601e-08, 'epoch': 1.92} {'loss': 0.2541, 'learning_rate': 7.825448781908496e-08, 'epoch': 1.92} {'loss': 0.3691, 'learning_rate': 7.821254373299724e-08, 'epoch': 1.92} {'loss': 0.2659, 'learning_rate': 7.817061084672062e-08, 'epoch': 1.92} {'loss': 0.281, 'learning_rate': 7.812868916030392e-08, 'epoch': 1.92} {'loss': 0.3784, 'learning_rate': 7.808677867379155e-08, 'epoch': 1.92} {'loss': 0.1976, 'learning_rate': 7.804487938723348e-08, 'epoch': 1.92} {'loss': 0.3008, 'learning_rate': 7.800299130067524e-08, 'epoch': 1.92} {'loss': 0.2185, 'learning_rate': 7.796111441416565e-08, 'epoch': 1.92} {'loss': 0.414, 'learning_rate': 7.791924872775026e-08, 'epoch': 1.92} {'loss': 0.3646, 'learning_rate': 7.7877394241479e-08, 'epoch': 1.92} {'loss': 0.4628, 'learning_rate': 7.78355509553963e-08, 'epoch': 1.92} {'loss': 0.3382, 'learning_rate': 7.77937188695499e-08, 'epoch': 1.92} {'loss': 0.3667, 'learning_rate': 7.775189798398864e-08, 'epoch': 1.92} {'loss': 0.4355, 'learning_rate': 7.771008829875804e-08, 'epoch': 1.92} {'loss': 0.3399, 'learning_rate': 7.766828981390695e-08, 'epoch': 1.92} {'loss': 0.3545, 'learning_rate': 7.762650252947978e-08, 'epoch': 1.92} {'loss': 0.256, 'learning_rate': 7.758472644552651e-08, 'epoch': 1.92} {'loss': 0.3213, 'learning_rate': 7.754296156209374e-08, 'epoch': 1.92} {'loss': 0.357, 'learning_rate': 7.750120787922699e-08, 'epoch': 1.92} {'loss': 0.3328, 'learning_rate': 7.745946539697513e-08, 'epoch': 1.92} {'loss': 0.4516, 'learning_rate': 7.741773411538477e-08, 'epoch': 1.92} {'loss': 0.3763, 'learning_rate': 7.737601403450257e-08, 'epoch': 1.92} {'loss': 0.2427, 'learning_rate': 7.733430515437623e-08, 'epoch': 1.92} {'loss': 0.257, 'learning_rate': 7.729260747505351e-08, 'epoch': 1.92} {'loss': 0.3532, 'learning_rate': 7.725092099657882e-08, 'epoch': 1.92} {'loss': 0.369, 'learning_rate': 7.720924571900212e-08, 'epoch': 1.92} {'loss': 0.278, 'learning_rate': 7.716758164236892e-08, 'epoch': 1.92} {'loss': 0.2758, 'learning_rate': 7.712592876672697e-08, 'epoch': 1.92} {'loss': 0.289, 'learning_rate': 7.70842870921218e-08, 'epoch': 1.92} {'loss': 0.3087, 'learning_rate': 7.704265661860222e-08, 'epoch': 1.92} {'loss': 0.2389, 'learning_rate': 7.700103734621489e-08, 'epoch': 1.92} {'loss': 0.4063, 'learning_rate': 7.695942927500644e-08, 'epoch': 1.92} {'loss': 0.3128, 'learning_rate': 7.691783240502348e-08, 'epoch': 1.92} {'loss': 0.3091, 'learning_rate': 7.687624673631266e-08, 'epoch': 1.92} {'loss': 0.3966, 'learning_rate': 7.683467226892282e-08, 'epoch': 1.92} {'loss': 0.2408, 'learning_rate': 7.679310900289949e-08, 'epoch': 1.92} {'loss': 0.1982, 'learning_rate': 7.675155693828929e-08, 'epoch': 1.92} {'loss': 0.245, 'learning_rate': 7.671001607513994e-08, 'epoch': 1.92} {'loss': 0.2588, 'learning_rate': 7.666848641349811e-08, 'epoch': 1.92} {'loss': 0.325, 'learning_rate': 7.662696795340929e-08, 'epoch': 1.92} {'loss': 0.3971, 'learning_rate': 7.658546069492234e-08, 'epoch': 1.92} {'loss': 0.2751, 'learning_rate': 7.654396463808388e-08, 'epoch': 1.92} {'loss': 0.2158, 'learning_rate': 7.650247978294057e-08, 'epoch': 1.92} {'loss': 0.2111, 'learning_rate': 7.646100612953788e-08, 'epoch': 1.92} {'loss': 0.3649, 'learning_rate': 7.641954367792359e-08, 'epoch': 1.92} {'loss': 0.283, 'learning_rate': 7.637809242814542e-08, 'epoch': 1.92} {'loss': 0.249, 'learning_rate': 7.63366523802489e-08, 'epoch': 1.92} {'loss': 0.3033, 'learning_rate': 7.629522353428065e-08, 'epoch': 1.92} {'loss': 0.3224, 'learning_rate': 7.625380589028953e-08, 'epoch': 1.92} {'loss': 0.3037, 'learning_rate': 7.621239944831993e-08, 'epoch': 1.92} {'loss': 0.4463, 'learning_rate': 7.61710042084196e-08, 'epoch': 1.92} {'loss': 0.3029, 'learning_rate': 7.612962017063519e-08, 'epoch': 1.92} {'loss': 0.2703, 'learning_rate': 7.60882473350122e-08, 'epoch': 1.92} {'loss': 0.2849, 'learning_rate': 7.604688570159945e-08, 'epoch': 1.92} {'loss': 0.3603, 'learning_rate': 7.600553527044253e-08, 'epoch': 1.92} {'loss': 0.2977, 'learning_rate': 7.5964196041588e-08, 'epoch': 1.92} {'loss': 0.3709, 'learning_rate': 7.592286801508253e-08, 'epoch': 1.92} {'loss': 0.3086, 'learning_rate': 7.588155119097385e-08, 'epoch': 1.92} {'loss': 0.3393, 'learning_rate': 7.584024556930747e-08, 'epoch': 1.92} {'loss': 0.3421, 'learning_rate': 7.579895115013004e-08, 'epoch': 1.92} {'loss': 0.3037, 'learning_rate': 7.575766793348815e-08, 'epoch': 1.92} {'loss': 0.3035, 'learning_rate': 7.571639591942959e-08, 'epoch': 1.92} {'loss': 0.3885, 'learning_rate': 7.567513510799985e-08, 'epoch': 1.92} {'loss': 0.354, 'learning_rate': 7.563388549924444e-08, 'epoch': 1.92} {'loss': 0.2331, 'learning_rate': 7.559264709321224e-08, 'epoch': 1.92} {'loss': 0.3654, 'learning_rate': 7.555141988994874e-08, 'epoch': 1.92} {'loss': 0.2104, 'learning_rate': 7.551020388950059e-08, 'epoch': 1.92} {'loss': 0.3112, 'learning_rate': 7.54689990919133e-08, 'epoch': 1.92} {'loss': 0.3099, 'learning_rate': 7.542780549723461e-08, 'epoch': 1.92} {'loss': 0.3242, 'learning_rate': 7.538662310551114e-08, 'epoch': 1.92} {'loss': 0.3949, 'learning_rate': 7.534545191678844e-08, 'epoch': 1.92} {'loss': 0.1374, 'learning_rate': 7.530429193111421e-08, 'epoch': 1.92} {'loss': 0.2176, 'learning_rate': 7.5263143148534e-08, 'epoch': 1.92} {'loss': 0.3102, 'learning_rate': 7.522200556909331e-08, 'epoch': 1.92} {'loss': 0.3514, 'learning_rate': 7.5180879192841e-08, 'epoch': 1.92} {'loss': 0.287, 'learning_rate': 7.513976401982148e-08, 'epoch': 1.92} {'loss': 0.2805, 'learning_rate': 7.509866005008138e-08, 'epoch': 1.92} {'loss': 0.4108, 'learning_rate': 7.505756728366953e-08, 'epoch': 1.92} {'loss': 0.3337, 'learning_rate': 7.501648572062814e-08, 'epoch': 1.92} {'loss': 0.2198, 'learning_rate': 7.497541536100717e-08, 'epoch': 1.92} {'loss': 0.2571, 'learning_rate': 7.493435620485101e-08, 'epoch': 1.92} {'loss': 0.2205, 'learning_rate': 7.489330825220742e-08, 'epoch': 1.92} {'loss': 0.2683, 'learning_rate': 7.485227150312079e-08, 'epoch': 1.92} {'loss': 0.1622, 'learning_rate': 7.481124595763889e-08, 'epoch': 1.92} {'loss': 0.5042, 'learning_rate': 7.477023161580832e-08, 'epoch': 1.92} {'loss': 0.4477, 'learning_rate': 7.472922847767461e-08, 'epoch': 1.92} {'loss': 0.2817, 'learning_rate': 7.468823654328328e-08, 'epoch': 1.92} {'loss': 0.3468, 'learning_rate': 7.464725581268317e-08, 'epoch': 1.92} {'loss': 0.4015, 'learning_rate': 7.460628628591759e-08, 'epoch': 1.92} {'loss': 0.2703, 'learning_rate': 7.45653279630354e-08, 'epoch': 1.92} {'loss': 0.172, 'learning_rate': 7.452438084408097e-08, 'epoch': 1.92} {'loss': 0.2611, 'learning_rate': 7.448344492909987e-08, 'epoch': 1.92} {'loss': 0.3681, 'learning_rate': 7.444252021814091e-08, 'epoch': 1.92} {'loss': 0.3342, 'learning_rate': 7.440160671124852e-08, 'epoch': 1.92} {'loss': 0.3472, 'learning_rate': 7.436070440846932e-08, 'epoch': 1.92} {'loss': 0.296, 'learning_rate': 7.431981330984884e-08, 'epoch': 1.92} {'loss': 0.2313, 'learning_rate': 7.42789334154348e-08, 'epoch': 1.92} {'loss': 0.3489, 'learning_rate': 7.423806472527162e-08, 'epoch': 1.92} {'loss': 0.2838, 'learning_rate': 7.419720723940704e-08, 'epoch': 1.92} {'loss': 0.3138, 'learning_rate': 7.415636095788547e-08, 'epoch': 1.92} {'loss': 0.438, 'learning_rate': 7.411552588075466e-08, 'epoch': 1.92} {'loss': 0.3217, 'learning_rate': 7.407470200806011e-08, 'epoch': 1.92} {'loss': 0.3383, 'learning_rate': 7.403388933984624e-08, 'epoch': 1.92} {'loss': 0.3545, 'learning_rate': 7.399308787616189e-08, 'epoch': 1.92} {'loss': 0.2903, 'learning_rate': 7.395229761705148e-08, 'epoch': 1.92} {'loss': 0.3699, 'learning_rate': 7.391151856256162e-08, 'epoch': 1.92} {'loss': 0.2948, 'learning_rate': 7.387075071273675e-08, 'epoch': 1.92} {'loss': 0.4048, 'learning_rate': 7.382999406762569e-08, 'epoch': 1.92} {'loss': 0.3379, 'learning_rate': 7.378924862727288e-08, 'epoch': 1.93} {'loss': 0.2055, 'learning_rate': 7.374851439172492e-08, 'epoch': 1.93} {'loss': 0.2831, 'learning_rate': 7.370779136102623e-08, 'epoch': 1.93} {'loss': 0.3365, 'learning_rate': 7.366707953522456e-08, 'epoch': 1.93} {'loss': 0.4647, 'learning_rate': 7.362637891436542e-08, 'epoch': 1.93} {'loss': 0.2153, 'learning_rate': 7.35856894984932e-08, 'epoch': 1.93} {'loss': 0.2642, 'learning_rate': 7.354501128765678e-08, 'epoch': 1.93} {'loss': 0.3694, 'learning_rate': 7.350434428189946e-08, 'epoch': 1.93} {'loss': 0.4396, 'learning_rate': 7.346368848126784e-08, 'epoch': 1.93} {'loss': 0.3798, 'learning_rate': 7.342304388580856e-08, 'epoch': 1.93} {'loss': 0.186, 'learning_rate': 7.338241049556715e-08, 'epoch': 1.93} {'loss': 0.3452, 'learning_rate': 7.334178831058914e-08, 'epoch': 1.93} {'loss': 0.2873, 'learning_rate': 7.330117733092113e-08, 'epoch': 1.93} {'loss': 0.2497, 'learning_rate': 7.326057755660754e-08, 'epoch': 1.93} {'loss': 0.3943, 'learning_rate': 7.321998898769611e-08, 'epoch': 1.93} {'loss': 0.3265, 'learning_rate': 7.317941162423126e-08, 'epoch': 1.93} {'loss': 0.3121, 'learning_rate': 7.31388454662585e-08, 'epoch': 1.93} {'loss': 0.136, 'learning_rate': 7.309829051382556e-08, 'epoch': 1.93} {'loss': 0.2902, 'learning_rate': 7.305774676697574e-08, 'epoch': 1.93} {'loss': 0.262, 'learning_rate': 7.30172142257568e-08, 'epoch': 1.93} {'loss': 0.3796, 'learning_rate': 7.297669289021314e-08, 'epoch': 1.93} {'loss': 0.3111, 'learning_rate': 7.29361827603925e-08, 'epoch': 1.93} {'loss': 0.3023, 'learning_rate': 7.289568383633705e-08, 'epoch': 1.93} {'loss': 0.192, 'learning_rate': 7.285519611809677e-08, 'epoch': 1.93} {'loss': 0.1545, 'learning_rate': 7.281471960571385e-08, 'epoch': 1.93} {'loss': 0.2506, 'learning_rate': 7.277425429923601e-08, 'epoch': 1.93} {'loss': 0.3597, 'learning_rate': 7.273380019870768e-08, 'epoch': 1.93} {'loss': 0.3372, 'learning_rate': 7.269335730417549e-08, 'epoch': 1.93} {'loss': 0.3026, 'learning_rate': 7.265292561568493e-08, 'epoch': 1.93} {'loss': 0.2274, 'learning_rate': 7.261250513328044e-08, 'epoch': 1.93} {'loss': 0.322, 'learning_rate': 7.257209585700975e-08, 'epoch': 1.93} {'loss': 0.3289, 'learning_rate': 7.253169778691726e-08, 'epoch': 1.93} {'loss': 0.3514, 'learning_rate': 7.249131092304851e-08, 'epoch': 1.93} {'loss': 0.3315, 'learning_rate': 7.2450935265449e-08, 'epoch': 1.93} {'loss': 0.3, 'learning_rate': 7.241057081416536e-08, 'epoch': 1.93} {'loss': 0.4078, 'learning_rate': 7.23702175692409e-08, 'epoch': 1.93} {'loss': 0.3285, 'learning_rate': 7.232987553072446e-08, 'epoch': 1.93} {'loss': 0.3274, 'learning_rate': 7.228954469865823e-08, 'epoch': 1.93} {'loss': 0.3586, 'learning_rate': 7.224922507308995e-08, 'epoch': 1.93} {'loss': 0.2877, 'learning_rate': 7.220891665406404e-08, 'epoch': 1.93} {'loss': 0.2932, 'learning_rate': 7.216861944162712e-08, 'epoch': 1.93} {'loss': 0.2765, 'learning_rate': 7.212833343582471e-08, 'epoch': 1.93} {'loss': 0.3567, 'learning_rate': 7.20880586367001e-08, 'epoch': 1.93} {'loss': 0.2289, 'learning_rate': 7.204779504429992e-08, 'epoch': 1.93} {'loss': 0.4163, 'learning_rate': 7.200754265867083e-08, 'epoch': 1.93} {'loss': 0.2005, 'learning_rate': 7.196730147985719e-08, 'epoch': 1.93} {'loss': 0.2323, 'learning_rate': 7.192707150790345e-08, 'epoch': 1.93} {'loss': 0.3497, 'learning_rate': 7.188685274285734e-08, 'epoch': 1.93} {'loss': 0.2339, 'learning_rate': 7.184664518476325e-08, 'epoch': 1.93} {'loss': 0.183, 'learning_rate': 7.180644883366561e-08, 'epoch': 1.93} {'loss': 0.3014, 'learning_rate': 7.176626368961104e-08, 'epoch': 1.93} {'loss': 0.3118, 'learning_rate': 7.172608975264395e-08, 'epoch': 1.93} {'loss': 0.2745, 'learning_rate': 7.168592702281097e-08, 'epoch': 1.93} {'loss': 0.3675, 'learning_rate': 7.164577550015539e-08, 'epoch': 1.93} {'loss': 0.4033, 'learning_rate': 7.160563518472497e-08, 'epoch': 1.93} {'loss': 0.4585, 'learning_rate': 7.156550607656298e-08, 'epoch': 1.93} {'loss': 0.3695, 'learning_rate': 7.152538817571608e-08, 'epoch': 1.93} {'loss': 0.2063, 'learning_rate': 7.148528148222866e-08, 'epoch': 1.93} {'loss': 0.4532, 'learning_rate': 7.144518599614737e-08, 'epoch': 1.93} {'loss': 0.2949, 'learning_rate': 7.140510171751547e-08, 'epoch': 1.93} {'loss': 0.22, 'learning_rate': 7.136502864637962e-08, 'epoch': 1.93} {'loss': 0.2954, 'learning_rate': 7.132496678278311e-08, 'epoch': 1.93} {'loss': 0.2853, 'learning_rate': 7.128491612677479e-08, 'epoch': 1.93} {'loss': 0.3089, 'learning_rate': 7.124487667839685e-08, 'epoch': 1.93} {'loss': 0.3237, 'learning_rate': 7.120484843769592e-08, 'epoch': 1.93} {'loss': 0.3676, 'learning_rate': 7.11648314047153e-08, 'epoch': 1.93} {'loss': 0.2185, 'learning_rate': 7.112482557950274e-08, 'epoch': 1.93} {'loss': 0.4648, 'learning_rate': 7.108483096210261e-08, 'epoch': 1.93} {'loss': 0.3798, 'learning_rate': 7.104484755255825e-08, 'epoch': 1.93} {'loss': 0.4028, 'learning_rate': 7.100487535091738e-08, 'epoch': 1.93} {'loss': 0.2435, 'learning_rate': 7.09649143572233e-08, 'epoch': 1.93} {'loss': 0.2797, 'learning_rate': 7.092496457152154e-08, 'epoch': 1.93} {'loss': 0.3003, 'learning_rate': 7.08850259938576e-08, 'epoch': 1.93} {'loss': 0.1639, 'learning_rate': 7.084509862427701e-08, 'epoch': 1.93} {'loss': 0.381, 'learning_rate': 7.080518246282308e-08, 'epoch': 1.93} {'loss': 0.2673, 'learning_rate': 7.076527750954243e-08, 'epoch': 1.93} {'loss': 0.2561, 'learning_rate': 7.072538376447945e-08, 'epoch': 1.93} {'loss': 0.3707, 'learning_rate': 7.068550122768081e-08, 'epoch': 1.93} {'loss': 0.3284, 'learning_rate': 7.064562989918866e-08, 'epoch': 1.93} {'loss': 0.4809, 'learning_rate': 7.060576977904965e-08, 'epoch': 1.93} {'loss': 0.2979, 'learning_rate': 7.056592086730929e-08, 'epoch': 1.93} {'loss': 0.1971, 'learning_rate': 7.052608316401089e-08, 'epoch': 1.93} {'loss': 0.3682, 'learning_rate': 7.048625666920106e-08, 'epoch': 1.93} {'loss': 0.3101, 'learning_rate': 7.044644138292311e-08, 'epoch': 1.93} {'loss': 0.3903, 'learning_rate': 7.040663730522367e-08, 'epoch': 1.93} {'loss': 0.4057, 'learning_rate': 7.036684443614605e-08, 'epoch': 1.93} {'loss': 0.3539, 'learning_rate': 7.032706277573798e-08, 'epoch': 1.93} {'loss': 0.1821, 'learning_rate': 7.028729232404053e-08, 'epoch': 1.93} {'loss': 0.2776, 'learning_rate': 7.024753308110144e-08, 'epoch': 1.93} {'loss': 0.1342, 'learning_rate': 7.020778504696402e-08, 'epoch': 1.93} {'loss': 0.3437, 'learning_rate': 7.016804822167489e-08, 'epoch': 1.93} {'loss': 0.2828, 'learning_rate': 7.012832260527624e-08, 'epoch': 1.93} {'loss': 0.383, 'learning_rate': 7.008860819781582e-08, 'epoch': 1.93} {'loss': 0.1967, 'learning_rate': 7.004890499933693e-08, 'epoch': 1.93} {'loss': 0.2982, 'learning_rate': 7.000921300988394e-08, 'epoch': 1.93} {'loss': 0.2877, 'learning_rate': 6.996953222950242e-08, 'epoch': 1.93} {'loss': 0.4026, 'learning_rate': 6.992986265823676e-08, 'epoch': 1.93} {'loss': 0.3784, 'learning_rate': 6.989020429613247e-08, 'epoch': 1.93} {'loss': 0.1829, 'learning_rate': 6.985055714323396e-08, 'epoch': 1.93} {'loss': 0.3078, 'learning_rate': 6.981092119958565e-08, 'epoch': 1.93} {'loss': 0.3411, 'learning_rate': 6.977129646523306e-08, 'epoch': 1.93} {'loss': 0.2345, 'learning_rate': 6.973168294021948e-08, 'epoch': 1.93} {'loss': 0.3194, 'learning_rate': 6.969208062459043e-08, 'epoch': 1.93} {'loss': 0.3079, 'learning_rate': 6.965248951839144e-08, 'epoch': 1.93} {'loss': 0.333, 'learning_rate': 6.961290962166578e-08, 'epoch': 1.93} {'loss': 0.3267, 'learning_rate': 6.9573340934459e-08, 'epoch': 1.93} {'loss': 0.2854, 'learning_rate': 6.95337834568155e-08, 'epoch': 1.93} {'loss': 0.4715, 'learning_rate': 6.949423718878079e-08, 'epoch': 1.93} {'loss': 0.2852, 'learning_rate': 6.945470213039818e-08, 'epoch': 1.93} {'loss': 0.2127, 'learning_rate': 6.941517828171207e-08, 'epoch': 1.93} {'loss': 0.3744, 'learning_rate': 6.93756656427691e-08, 'epoch': 1.93} {'loss': 0.3292, 'learning_rate': 6.933616421361144e-08, 'epoch': 1.93} {'loss': 0.2036, 'learning_rate': 6.929667399428574e-08, 'epoch': 1.93} {'loss': 0.1787, 'learning_rate': 6.925719498483529e-08, 'epoch': 1.93} {'loss': 0.2262, 'learning_rate': 6.921772718530562e-08, 'epoch': 1.93} {'loss': 0.3261, 'learning_rate': 6.917827059574e-08, 'epoch': 1.93} {'loss': 0.3915, 'learning_rate': 6.913882521618398e-08, 'epoch': 1.93} {'loss': 0.3345, 'learning_rate': 6.909939104668195e-08, 'epoch': 1.93} {'loss': 0.3768, 'learning_rate': 6.905996808727722e-08, 'epoch': 1.93} {'loss': 0.2808, 'learning_rate': 6.902055633801641e-08, 'epoch': 1.93} {'loss': 0.192, 'learning_rate': 6.898115579894282e-08, 'epoch': 1.93} {'loss': 0.4095, 'learning_rate': 6.894176647010087e-08, 'epoch': 1.93} {'loss': 0.2257, 'learning_rate': 6.890238835153496e-08, 'epoch': 1.93} {'loss': 0.2836, 'learning_rate': 6.88630214432906e-08, 'epoch': 1.93} {'loss': 0.298, 'learning_rate': 6.882366574541e-08, 'epoch': 1.93} {'loss': 0.3229, 'learning_rate': 6.878432125793977e-08, 'epoch': 1.93} {'loss': 0.2283, 'learning_rate': 6.874498798092432e-08, 'epoch': 1.93} {'loss': 0.2901, 'learning_rate': 6.870566591440586e-08, 'epoch': 1.93} {'loss': 0.3009, 'learning_rate': 6.8666355058431e-08, 'epoch': 1.93} {'loss': 0.1999, 'learning_rate': 6.862705541304304e-08, 'epoch': 1.93} {'loss': 0.3107, 'learning_rate': 6.858776697828751e-08, 'epoch': 1.93} {'loss': 0.2231, 'learning_rate': 6.854848975420658e-08, 'epoch': 1.93} {'loss': 0.3295, 'learning_rate': 6.850922374084578e-08, 'epoch': 1.93} {'loss': 0.2417, 'learning_rate': 6.846996893825065e-08, 'epoch': 1.93} {'loss': 0.3076, 'learning_rate': 6.843072534646334e-08, 'epoch': 1.93} {'loss': 0.3069, 'learning_rate': 6.839149296552938e-08, 'epoch': 1.93} {'loss': 0.3442, 'learning_rate': 6.83522717954932e-08, 'epoch': 1.93} {'loss': 0.348, 'learning_rate': 6.831306183639807e-08, 'epoch': 1.93} {'loss': 0.2186, 'learning_rate': 6.827386308828954e-08, 'epoch': 1.93} {'loss': 0.3388, 'learning_rate': 6.8234675551212e-08, 'epoch': 1.93} {'loss': 0.3314, 'learning_rate': 6.819549922520763e-08, 'epoch': 1.93} {'loss': 0.3623, 'learning_rate': 6.815633411032196e-08, 'epoch': 1.93} {'loss': 0.4391, 'learning_rate': 6.811718020659941e-08, 'epoch': 1.93} {'loss': 0.4054, 'learning_rate': 6.807803751408437e-08, 'epoch': 1.93} {'loss': 0.3075, 'learning_rate': 6.803890603281904e-08, 'epoch': 1.93} {'loss': 0.1729, 'learning_rate': 6.799978576285116e-08, 'epoch': 1.93} {'loss': 0.2789, 'learning_rate': 6.79606767042218e-08, 'epoch': 1.93} {'loss': 0.2953, 'learning_rate': 6.792157885697647e-08, 'epoch': 1.93} {'loss': 0.2368, 'learning_rate': 6.78824922211585e-08, 'epoch': 1.93} {'loss': 0.1865, 'learning_rate': 6.784341679681228e-08, 'epoch': 1.93} {'loss': 0.5616, 'learning_rate': 6.780435258398333e-08, 'epoch': 1.93} {'loss': 0.1897, 'learning_rate': 6.776529958271383e-08, 'epoch': 1.93} {'loss': 0.4094, 'learning_rate': 6.77262577930482e-08, 'epoch': 1.93} {'loss': 0.2824, 'learning_rate': 6.768722721503196e-08, 'epoch': 1.93} {'loss': 0.3309, 'learning_rate': 6.76482078487084e-08, 'epoch': 1.93} {'loss': 0.1591, 'learning_rate': 6.760919969411972e-08, 'epoch': 1.93} {'loss': 0.4126, 'learning_rate': 6.757020275131254e-08, 'epoch': 1.93} {'loss': 0.2245, 'learning_rate': 6.753121702032906e-08, 'epoch': 1.93} {'loss': 0.2918, 'learning_rate': 6.749224250121589e-08, 'epoch': 1.93} {'loss': 0.2895, 'learning_rate': 6.745327919401301e-08, 'epoch': 1.93} {'loss': 0.3396, 'learning_rate': 6.741432709876816e-08, 'epoch': 1.93} {'loss': 0.233, 'learning_rate': 6.737538621552241e-08, 'epoch': 1.93} {'loss': 0.3149, 'learning_rate': 6.733645654432242e-08, 'epoch': 1.93} {'loss': 0.237, 'learning_rate': 6.729753808521034e-08, 'epoch': 1.93} {'loss': 0.2736, 'learning_rate': 6.725863083823058e-08, 'epoch': 1.93} {'loss': 0.4971, 'learning_rate': 6.721973480342648e-08, 'epoch': 1.93} {'loss': 0.22, 'learning_rate': 6.718084998084351e-08, 'epoch': 1.93} {'loss': 0.2705, 'learning_rate': 6.714197637052388e-08, 'epoch': 1.93} {'loss': 0.3095, 'learning_rate': 6.710311397251201e-08, 'epoch': 1.93} {'loss': 0.2649, 'learning_rate': 6.70642627868523e-08, 'epoch': 1.93} {'loss': 0.1563, 'learning_rate': 6.702542281358804e-08, 'epoch': 1.93} {'loss': 0.4075, 'learning_rate': 6.698659405276364e-08, 'epoch': 1.93} {'loss': 0.2612, 'learning_rate': 6.694777650442131e-08, 'epoch': 1.93} {'loss': 0.309, 'learning_rate': 6.690897016860764e-08, 'epoch': 1.93} {'loss': 0.354, 'learning_rate': 6.687017504536375e-08, 'epoch': 1.93} {'loss': 0.4419, 'learning_rate': 6.683139113473514e-08, 'epoch': 1.93} {'loss': 0.2904, 'learning_rate': 6.679261843676399e-08, 'epoch': 1.93} {'loss': 0.2684, 'learning_rate': 6.675385695149695e-08, 'epoch': 1.93} {'loss': 0.3528, 'learning_rate': 6.671510667897396e-08, 'epoch': 1.93} {'loss': 0.33, 'learning_rate': 6.667636761924168e-08, 'epoch': 1.93} {'loss': 0.2471, 'learning_rate': 6.663763977234339e-08, 'epoch': 1.93} {'loss': 0.2305, 'learning_rate': 6.659892313832129e-08, 'epoch': 1.93} {'loss': 0.3468, 'learning_rate': 6.656021771722087e-08, 'epoch': 1.93} {'loss': 0.2256, 'learning_rate': 6.652152350908436e-08, 'epoch': 1.93} {'loss': 0.2219, 'learning_rate': 6.648284051395614e-08, 'epoch': 1.93} {'loss': 0.2554, 'learning_rate': 6.644416873188064e-08, 'epoch': 1.93} {'loss': 0.2709, 'learning_rate': 6.640550816290003e-08, 'epoch': 1.93} {'loss': 0.2038, 'learning_rate': 6.636685880705873e-08, 'epoch': 1.93} {'loss': 0.1782, 'learning_rate': 6.632822066440114e-08, 'epoch': 1.93} {'loss': 0.1931, 'learning_rate': 6.628959373496834e-08, 'epoch': 1.93} {'loss': 0.3827, 'learning_rate': 6.625097801880698e-08, 'epoch': 1.93} {'loss': 0.3174, 'learning_rate': 6.62123735159581e-08, 'epoch': 1.93} {'loss': 0.3036, 'learning_rate': 6.617378022646726e-08, 'epoch': 1.93} {'loss': 0.343, 'learning_rate': 6.613519815037772e-08, 'epoch': 1.93} {'loss': 0.2442, 'learning_rate': 6.60966272877317e-08, 'epoch': 1.93} {'loss': 0.2913, 'learning_rate': 6.605806763857359e-08, 'epoch': 1.93} {'loss': 0.2912, 'learning_rate': 6.601951920294669e-08, 'epoch': 1.93} {'loss': 0.1789, 'learning_rate': 6.598098198089542e-08, 'epoch': 1.93} {'loss': 0.3395, 'learning_rate': 6.594245597246196e-08, 'epoch': 1.93} {'loss': 0.2974, 'learning_rate': 6.590394117769072e-08, 'epoch': 1.93} {'loss': 0.3725, 'learning_rate': 6.5865437596625e-08, 'epoch': 1.93} {'loss': 0.2006, 'learning_rate': 6.582694522930811e-08, 'epoch': 1.93} {'loss': 0.3941, 'learning_rate': 6.578846407578443e-08, 'epoch': 1.93} {'loss': 0.296, 'learning_rate': 6.574999413609507e-08, 'epoch': 1.93} {'loss': 0.4158, 'learning_rate': 6.571153541028552e-08, 'epoch': 1.93} {'loss': 0.2487, 'learning_rate': 6.5673087898398e-08, 'epoch': 1.93} {'loss': 0.3175, 'learning_rate': 6.563465160047689e-08, 'epoch': 1.93} {'loss': 0.2963, 'learning_rate': 6.559622651656439e-08, 'epoch': 1.93} {'loss': 0.3332, 'learning_rate': 6.555781264670602e-08, 'epoch': 1.93} {'loss': 0.2099, 'learning_rate': 6.551940999094286e-08, 'epoch': 1.93} {'loss': 0.2507, 'learning_rate': 6.548101854931932e-08, 'epoch': 1.93} {'loss': 0.3014, 'learning_rate': 6.54426383218787e-08, 'epoch': 1.93} {'loss': 0.4306, 'learning_rate': 6.540426930866428e-08, 'epoch': 1.93} {'loss': 0.367, 'learning_rate': 6.536591150971939e-08, 'epoch': 1.93} {'loss': 0.4017, 'learning_rate': 6.532756492508729e-08, 'epoch': 1.93} {'loss': 0.3712, 'learning_rate': 6.528922955481021e-08, 'epoch': 1.93} {'loss': 0.3672, 'learning_rate': 6.525090539893364e-08, 'epoch': 1.93} {'loss': 0.2177, 'learning_rate': 6.521259245749867e-08, 'epoch': 1.93} {'loss': 0.2581, 'learning_rate': 6.517429073054971e-08, 'epoch': 1.93} {'loss': 0.2543, 'learning_rate': 6.513600021813005e-08, 'epoch': 1.93} {'loss': 0.2235, 'learning_rate': 6.509772092028299e-08, 'epoch': 1.93} {'loss': 0.3545, 'learning_rate': 6.505945283705073e-08, 'epoch': 1.93} {'loss': 0.2875, 'learning_rate': 6.502119596847766e-08, 'epoch': 1.93} {'loss': 0.3219, 'learning_rate': 6.4982950314606e-08, 'epoch': 1.93} {'loss': 0.403, 'learning_rate': 6.494471587547902e-08, 'epoch': 1.93} {'loss': 0.4468, 'learning_rate': 6.490649265114113e-08, 'epoch': 1.93} {'loss': 0.3203, 'learning_rate': 6.486828064163453e-08, 'epoch': 1.93} {'loss': 0.4152, 'learning_rate': 6.483007984700141e-08, 'epoch': 1.93} {'loss': 0.2605, 'learning_rate': 6.479189026728727e-08, 'epoch': 1.93} {'loss': 0.4214, 'learning_rate': 6.475371190253322e-08, 'epoch': 1.93} {'loss': 0.3721, 'learning_rate': 6.471554475278253e-08, 'epoch': 1.93} {'loss': 0.2391, 'learning_rate': 6.46773888180785e-08, 'epoch': 1.93} {'loss': 0.2803, 'learning_rate': 6.463924409846555e-08, 'epoch': 1.93} {'loss': 0.2308, 'learning_rate': 6.460111059398478e-08, 'epoch': 1.93} {'loss': 0.2575, 'learning_rate': 6.456298830467944e-08, 'epoch': 1.93} {'loss': 0.3564, 'learning_rate': 6.452487723059398e-08, 'epoch': 1.93} {'loss': 0.2168, 'learning_rate': 6.448677737177055e-08, 'epoch': 1.93} {'loss': 0.2688, 'learning_rate': 6.44486887282525e-08, 'epoch': 1.93} {'loss': 0.3469, 'learning_rate': 6.441061130008197e-08, 'epoch': 1.93} {'loss': 0.3001, 'learning_rate': 6.437254508730339e-08, 'epoch': 1.93} {'loss': 0.3359, 'learning_rate': 6.433449008995784e-08, 'epoch': 1.93} {'loss': 0.3657, 'learning_rate': 6.429644630808973e-08, 'epoch': 1.93} {'loss': 0.4476, 'learning_rate': 6.425841374174124e-08, 'epoch': 1.93} {'loss': 0.2806, 'learning_rate': 6.422039239095679e-08, 'epoch': 1.93} {'loss': 0.2874, 'learning_rate': 6.418238225577745e-08, 'epoch': 1.93} {'loss': 0.1886, 'learning_rate': 6.41443833362465e-08, 'epoch': 1.93} {'loss': 0.2574, 'learning_rate': 6.410639563240729e-08, 'epoch': 1.93} {'loss': 0.3553, 'learning_rate': 6.406841914430306e-08, 'epoch': 1.93} {'loss': 0.3657, 'learning_rate': 6.403045387197493e-08, 'epoch': 1.93} {'loss': 0.527, 'learning_rate': 6.39924998154684e-08, 'epoch': 1.93} {'loss': 0.2755, 'learning_rate': 6.395455697482344e-08, 'epoch': 1.93} {'loss': 0.2015, 'learning_rate': 6.391662535008558e-08, 'epoch': 1.93} {'loss': 0.336, 'learning_rate': 6.3878704941297e-08, 'epoch': 1.93} {'loss': 0.3722, 'learning_rate': 6.384079574849878e-08, 'epoch': 1.93} {'loss': 0.2805, 'learning_rate': 6.380289777173532e-08, 'epoch': 1.93} {'loss': 0.3287, 'learning_rate': 6.376501101104771e-08, 'epoch': 1.93} {'loss': 0.2703, 'learning_rate': 6.372713546648146e-08, 'epoch': 1.93} {'loss': 0.2374, 'learning_rate': 6.368927113807766e-08, 'epoch': 1.93} {'loss': 0.3755, 'learning_rate': 6.365141802587848e-08, 'epoch': 1.93} {'loss': 0.2943, 'learning_rate': 6.361357612992724e-08, 'epoch': 1.93} {'loss': 0.2076, 'learning_rate': 6.357574545026834e-08, 'epoch': 1.93} {'loss': 0.2607, 'learning_rate': 6.353792598694064e-08, 'epoch': 1.93} {'loss': 0.4967, 'learning_rate': 6.350011773999077e-08, 'epoch': 1.93} {'loss': 0.3322, 'learning_rate': 6.346232070945868e-08, 'epoch': 1.93} {'loss': 0.3402, 'learning_rate': 6.342453489538992e-08, 'epoch': 1.93} {'loss': 0.2509, 'learning_rate': 6.338676029782442e-08, 'epoch': 1.93} {'loss': 0.3234, 'learning_rate': 6.334899691680441e-08, 'epoch': 1.93} {'loss': 0.2858, 'learning_rate': 6.331124475237538e-08, 'epoch': 1.93} {'loss': 0.2993, 'learning_rate': 6.327350380457731e-08, 'epoch': 1.93} {'loss': 0.2785, 'learning_rate': 6.32357740734546e-08, 'epoch': 1.93} {'loss': 0.1965, 'learning_rate': 6.319805555904946e-08, 'epoch': 1.93} {'loss': 0.1464, 'learning_rate': 6.316034826140405e-08, 'epoch': 1.93} {'loss': 0.2473, 'learning_rate': 6.312265218056057e-08, 'epoch': 1.93} {'loss': 0.2159, 'learning_rate': 6.308496731656232e-08, 'epoch': 1.93} {'loss': 0.238, 'learning_rate': 6.30472936694504e-08, 'epoch': 1.93} {'loss': 0.294, 'learning_rate': 6.300963123927028e-08, 'epoch': 1.93} {'loss': 0.243, 'learning_rate': 6.297198002606197e-08, 'epoch': 1.93} {'loss': 0.3453, 'learning_rate': 6.293434002986875e-08, 'epoch': 1.93} {'loss': 0.2379, 'learning_rate': 6.289671125073282e-08, 'epoch': 1.93} {'loss': 0.3501, 'learning_rate': 6.285909368869636e-08, 'epoch': 1.93} {'loss': 0.2447, 'learning_rate': 6.282148734380377e-08, 'epoch': 1.93} {'loss': 0.1786, 'learning_rate': 6.278389221609504e-08, 'epoch': 1.93} {'loss': 0.3029, 'learning_rate': 6.274630830561346e-08, 'epoch': 1.93} {'loss': 0.2095, 'learning_rate': 6.270873561240232e-08, 'epoch': 1.93} {'loss': 0.2721, 'learning_rate': 6.26711741365027e-08, 'epoch': 1.93} {'loss': 0.2993, 'learning_rate': 6.263362387795791e-08, 'epoch': 1.93} {'loss': 0.3972, 'learning_rate': 6.259608483681012e-08, 'epoch': 1.93} {'loss': 0.2682, 'learning_rate': 6.255855701310154e-08, 'epoch': 1.93} {'loss': 0.1498, 'learning_rate': 6.252104040687546e-08, 'epoch': 1.93} {'loss': 0.3787, 'learning_rate': 6.248353501817295e-08, 'epoch': 1.93} {'loss': 0.3779, 'learning_rate': 6.24460408470362e-08, 'epoch': 1.93} {'loss': 0.2797, 'learning_rate': 6.240855789350964e-08, 'epoch': 1.93} {'loss': 0.2898, 'learning_rate': 6.23710861576321e-08, 'epoch': 1.93} {'loss': 0.2945, 'learning_rate': 6.233362563944911e-08, 'epoch': 1.93} {'loss': 0.226, 'learning_rate': 6.229617633900065e-08, 'epoch': 1.93} {'loss': 0.2598, 'learning_rate': 6.225873825633111e-08, 'epoch': 1.93} {'loss': 0.2209, 'learning_rate': 6.222131139148157e-08, 'epoch': 1.93} {'loss': 0.3004, 'learning_rate': 6.218389574449535e-08, 'epoch': 1.93} {'loss': 0.2781, 'learning_rate': 6.21464913154124e-08, 'epoch': 1.93} {'loss': 0.2743, 'learning_rate': 6.2109098104276e-08, 'epoch': 1.93} {'loss': 0.2188, 'learning_rate': 6.20717161111295e-08, 'epoch': 1.93} {'loss': 0.3247, 'learning_rate': 6.203434533601394e-08, 'epoch': 1.93} {'loss': 0.388, 'learning_rate': 6.199698577897261e-08, 'epoch': 1.93} {'loss': 0.2189, 'learning_rate': 6.195963744004551e-08, 'epoch': 1.93} {'loss': 0.4093, 'learning_rate': 6.192230031927705e-08, 'epoch': 1.93} {'loss': 0.3326, 'learning_rate': 6.188497441670826e-08, 'epoch': 1.93} {'loss': 0.3179, 'learning_rate': 6.184765973238249e-08, 'epoch': 1.93} {'loss': 0.2551, 'learning_rate': 6.181035626633969e-08, 'epoch': 1.93} {'loss': 0.4929, 'learning_rate': 6.177306401862316e-08, 'epoch': 1.93} {'loss': 0.3303, 'learning_rate': 6.173578298927508e-08, 'epoch': 1.93} {'loss': 0.2842, 'learning_rate': 6.169851317833763e-08, 'epoch': 1.93} {'loss': 0.4475, 'learning_rate': 6.166125458585303e-08, 'epoch': 1.93} {'loss': 0.2974, 'learning_rate': 6.162400721186235e-08, 'epoch': 1.93} {'loss': 0.3594, 'learning_rate': 6.158677105640887e-08, 'epoch': 1.93} {'loss': 0.2564, 'learning_rate': 6.154954611953367e-08, 'epoch': 1.93} {'loss': 0.2547, 'learning_rate': 6.151233240128007e-08, 'epoch': 1.93} {'loss': 0.2378, 'learning_rate': 6.147512990168803e-08, 'epoch': 1.93} {'loss': 0.3726, 'learning_rate': 6.143793862080083e-08, 'epoch': 1.93} {'loss': 0.19, 'learning_rate': 6.140075855866068e-08, 'epoch': 1.93} {'loss': 0.2337, 'learning_rate': 6.136358971530864e-08, 'epoch': 1.93} {'loss': 0.3289, 'learning_rate': 6.132643209078803e-08, 'epoch': 1.93} {'loss': 0.27, 'learning_rate': 6.128928568513881e-08, 'epoch': 1.93} {'loss': 0.2377, 'learning_rate': 6.125215049840538e-08, 'epoch': 1.93} {'loss': 0.4544, 'learning_rate': 6.121502653062772e-08, 'epoch': 1.93} {'loss': 0.2482, 'learning_rate': 6.117791378184801e-08, 'epoch': 1.93} {'loss': 0.2999, 'learning_rate': 6.114081225210844e-08, 'epoch': 1.93} {'loss': 0.3616, 'learning_rate': 6.11037219414512e-08, 'epoch': 1.93} {'loss': 0.4329, 'learning_rate': 6.106664284991848e-08, 'epoch': 1.93} {'loss': 0.3475, 'learning_rate': 6.102957497755136e-08, 'epoch': 1.93} {'loss': 0.4564, 'learning_rate': 6.09925183243909e-08, 'epoch': 1.93} {'loss': 0.4188, 'learning_rate': 6.095547289048043e-08, 'epoch': 1.93} {'loss': 0.1582, 'learning_rate': 6.0918438675861e-08, 'epoch': 1.93} {'loss': 0.2428, 'learning_rate': 6.088141568057592e-08, 'epoch': 1.93} {'loss': 0.3257, 'learning_rate': 6.084440390466407e-08, 'epoch': 1.93} {'loss': 0.2407, 'learning_rate': 6.080740334816981e-08, 'epoch': 1.93} {'loss': 0.3461, 'learning_rate': 6.077041401113315e-08, 'epoch': 1.93} {'loss': 0.3194, 'learning_rate': 6.073343589359737e-08, 'epoch': 1.93} {'loss': 0.311, 'learning_rate': 6.069646899560355e-08, 'epoch': 1.93} {'loss': 0.3151, 'learning_rate': 6.065951331719389e-08, 'epoch': 1.93} {'loss': 0.2168, 'learning_rate': 6.062256885840834e-08, 'epoch': 1.93} {'loss': 0.3154, 'learning_rate': 6.05856356192902e-08, 'epoch': 1.93} {'loss': 0.3196, 'learning_rate': 6.054871359988168e-08, 'epoch': 1.93} {'loss': 0.124, 'learning_rate': 6.051180280022273e-08, 'epoch': 1.93} {'loss': 0.4198, 'learning_rate': 6.047490322035554e-08, 'epoch': 1.93} {'loss': 0.3152, 'learning_rate': 6.04380148603223e-08, 'epoch': 1.93} {'loss': 0.4086, 'learning_rate': 6.04011377201652e-08, 'epoch': 1.93} {'loss': 0.17, 'learning_rate': 6.036427179992422e-08, 'epoch': 1.93} {'loss': 0.2884, 'learning_rate': 6.032741709964263e-08, 'epoch': 1.93} {'loss': 0.3072, 'learning_rate': 6.029057361936152e-08, 'epoch': 1.93} {'loss': 0.4231, 'learning_rate': 6.025374135912088e-08, 'epoch': 1.93} {'loss': 0.224, 'learning_rate': 6.021692031896508e-08, 'epoch': 1.93} {'loss': 0.2543, 'learning_rate': 6.018011049893302e-08, 'epoch': 1.93} {'loss': 0.3645, 'learning_rate': 6.014331189906908e-08, 'epoch': 1.93} {'loss': 0.3687, 'learning_rate': 6.010652451941101e-08, 'epoch': 1.93} {'loss': 0.4023, 'learning_rate': 6.006974836000435e-08, 'epoch': 1.93} {'loss': 0.1367, 'learning_rate': 6.003298342088793e-08, 'epoch': 1.93} {'loss': 0.2025, 'learning_rate': 5.999622970210394e-08, 'epoch': 1.93} {'loss': 0.3329, 'learning_rate': 5.99594872036946e-08, 'epoch': 1.93} {'loss': 0.346, 'learning_rate': 5.992275592570096e-08, 'epoch': 1.93} {'loss': 0.2717, 'learning_rate': 5.9886035868163e-08, 'epoch': 1.93} {'loss': 0.3782, 'learning_rate': 5.984932703112512e-08, 'epoch': 1.93} {'loss': 0.2753, 'learning_rate': 5.981262941462617e-08, 'epoch': 1.93} {'loss': 0.2319, 'learning_rate': 5.977594301870949e-08, 'epoch': 1.93} {'loss': 0.3119, 'learning_rate': 5.973926784341389e-08, 'epoch': 1.93} {'loss': 0.257, 'learning_rate': 5.970260388878379e-08, 'epoch': 1.93} {'loss': 0.279, 'learning_rate': 5.966595115485918e-08, 'epoch': 1.93} {'loss': 0.281, 'learning_rate': 5.962930964168112e-08, 'epoch': 1.93} {'loss': 0.3006, 'learning_rate': 5.959267934929181e-08, 'epoch': 1.93} {'loss': 0.1674, 'learning_rate': 5.95560602777312e-08, 'epoch': 1.93} {'loss': 0.3681, 'learning_rate': 5.95194524270426e-08, 'epoch': 1.93} {'loss': 0.3204, 'learning_rate': 5.948285579726487e-08, 'epoch': 1.93} {'loss': 0.2669, 'learning_rate': 5.9446270388441304e-08, 'epoch': 1.93} {'loss': 0.1735, 'learning_rate': 5.940969620061299e-08, 'epoch': 1.93} {'loss': 0.2569, 'learning_rate': 5.937313323382099e-08, 'epoch': 1.93} {'loss': 0.3438, 'learning_rate': 5.933658148810528e-08, 'epoch': 1.93} {'loss': 0.334, 'learning_rate': 5.9300040963510275e-08, 'epoch': 1.93} {'loss': 0.3222, 'learning_rate': 5.926351166007371e-08, 'epoch': 1.93} {'loss': 0.2769, 'learning_rate': 5.92269935778389e-08, 'epoch': 1.93} {'loss': 0.284, 'learning_rate': 5.9190486716845795e-08, 'epoch': 1.93} {'loss': 0.4177, 'learning_rate': 5.91539910771366e-08, 'epoch': 1.93} {'loss': 0.1506, 'learning_rate': 5.9117506658752374e-08, 'epoch': 1.93} {'loss': 0.3252, 'learning_rate': 5.9081033461734215e-08, 'epoch': 1.93} {'loss': 0.2724, 'learning_rate': 5.904457148612319e-08, 'epoch': 1.93} {'loss': 0.3248, 'learning_rate': 5.9008120731960385e-08, 'epoch': 1.93} {'loss': 0.3241, 'learning_rate': 5.897168119928687e-08, 'epoch': 1.93} {'loss': 0.2362, 'learning_rate': 5.8935252888143723e-08, 'epoch': 1.93} {'loss': 0.2794, 'learning_rate': 5.889883579857314e-08, 'epoch': 1.93} {'loss': 0.3369, 'learning_rate': 5.8862429930615084e-08, 'epoch': 1.93} {'loss': 0.3668, 'learning_rate': 5.8826035284310634e-08, 'epoch': 1.93} {'loss': 0.4409, 'learning_rate': 5.8789651859701976e-08, 'epoch': 1.93} {'loss': 0.2238, 'learning_rate': 5.875327965682909e-08, 'epoch': 1.93} {'loss': 0.3516, 'learning_rate': 5.8716918675733037e-08, 'epoch': 1.93} {'loss': 0.1915, 'learning_rate': 5.86805689164538e-08, 'epoch': 1.93} {'loss': 0.2237, 'learning_rate': 5.864423037903577e-08, 'epoch': 1.93} {'loss': 0.3483, 'learning_rate': 5.8607903063516714e-08, 'epoch': 1.93} {'loss': 0.1755, 'learning_rate': 5.857158696993992e-08, 'epoch': 1.93} {'loss': 0.2491, 'learning_rate': 5.853528209834536e-08, 'epoch': 1.93} {'loss': 0.1886, 'learning_rate': 5.8498988448773e-08, 'epoch': 1.93} {'loss': 0.2591, 'learning_rate': 5.8462706021266136e-08, 'epoch': 1.93} {'loss': 0.3803, 'learning_rate': 5.842643481586363e-08, 'epoch': 1.93} {'loss': 0.2932, 'learning_rate': 5.839017483260767e-08, 'epoch': 1.93} {'loss': 0.3597, 'learning_rate': 5.835392607153712e-08, 'epoch': 1.93} {'loss': 0.3274, 'learning_rate': 5.831768853269637e-08, 'epoch': 1.93} {'loss': 0.3837, 'learning_rate': 5.828146221612319e-08, 'epoch': 1.93} {'loss': 0.1673, 'learning_rate': 5.824524712186086e-08, 'epoch': 1.93} {'loss': 0.273, 'learning_rate': 5.820904324994825e-08, 'epoch': 1.93} {'loss': 0.2123, 'learning_rate': 5.817285060042754e-08, 'epoch': 1.93} {'loss': 0.1974, 'learning_rate': 5.813666917333871e-08, 'epoch': 1.93} {'loss': 0.3694, 'learning_rate': 5.810049896872394e-08, 'epoch': 1.93} {'loss': 0.3287, 'learning_rate': 5.8064339986622086e-08, 'epoch': 1.93} {'loss': 0.3276, 'learning_rate': 5.8028192227076454e-08, 'epoch': 1.93} {'loss': 0.2863, 'learning_rate': 5.799205569012589e-08, 'epoch': 1.93} {'loss': 0.2382, 'learning_rate': 5.795593037581038e-08, 'epoch': 1.93} {'loss': 0.2585, 'learning_rate': 5.791981628417431e-08, 'epoch': 1.93} {'loss': 0.3072, 'learning_rate': 5.788371341525434e-08, 'epoch': 1.93} {'loss': 0.4151, 'learning_rate': 5.784762176909375e-08, 'epoch': 1.93} {'loss': 0.3786, 'learning_rate': 5.781154134573252e-08, 'epoch': 1.93} {'loss': 0.4082, 'learning_rate': 5.777547214521173e-08, 'epoch': 1.93} {'loss': 0.4088, 'learning_rate': 5.773941416757134e-08, 'epoch': 1.93} {'loss': 0.3382, 'learning_rate': 5.770336741285354e-08, 'epoch': 1.93} {'loss': 0.351, 'learning_rate': 5.766733188109719e-08, 'epoch': 1.93} {'loss': 0.1677, 'learning_rate': 5.763130757234336e-08, 'epoch': 1.93} {'loss': 0.3627, 'learning_rate': 5.7595294486634254e-08, 'epoch': 1.93} {'loss': 0.2861, 'learning_rate': 5.755929262400872e-08, 'epoch': 1.93} {'loss': 0.426, 'learning_rate': 5.752330198450895e-08, 'epoch': 1.93} {'loss': 0.343, 'learning_rate': 5.74873225681738e-08, 'epoch': 1.93} {'loss': 0.3514, 'learning_rate': 5.745135437504434e-08, 'epoch': 1.93} {'loss': 0.2376, 'learning_rate': 5.741539740516278e-08, 'epoch': 1.93} {'loss': 0.3084, 'learning_rate': 5.737945165856795e-08, 'epoch': 1.93} {'loss': 0.2859, 'learning_rate': 5.7343517135300955e-08, 'epoch': 1.93} {'loss': 0.2863, 'learning_rate': 5.730759383540285e-08, 'epoch': 1.93} {'loss': 0.2451, 'learning_rate': 5.727168175891362e-08, 'epoch': 1.93} {'loss': 0.2635, 'learning_rate': 5.723578090587434e-08, 'epoch': 1.93} {'loss': 0.2668, 'learning_rate': 5.719989127632497e-08, 'epoch': 1.93} {'loss': 0.3378, 'learning_rate': 5.716401287030549e-08, 'epoch': 1.93} {'loss': 0.2697, 'learning_rate': 5.712814568785807e-08, 'epoch': 1.93} {'loss': 0.341, 'learning_rate': 5.7092289729021586e-08, 'epoch': 1.93} {'loss': 0.3571, 'learning_rate': 5.705644499383711e-08, 'epoch': 1.93} {'loss': 0.2077, 'learning_rate': 5.702061148234683e-08, 'epoch': 1.93} {'loss': 0.4864, 'learning_rate': 5.698478919458739e-08, 'epoch': 1.93} {'loss': 0.32, 'learning_rate': 5.6948978130602073e-08, 'epoch': 1.93} {'loss': 0.2138, 'learning_rate': 5.691317829043086e-08, 'epoch': 1.93} {'loss': 0.2132, 'learning_rate': 5.6877389674113714e-08, 'epoch': 1.93} {'loss': 0.3724, 'learning_rate': 5.6841612281691715e-08, 'epoch': 1.93} {'loss': 0.2854, 'learning_rate': 5.680584611320483e-08, 'epoch': 1.93} {'loss': 0.3738, 'learning_rate': 5.6770091168693034e-08, 'epoch': 1.93} {'loss': 0.3261, 'learning_rate': 5.673434744819628e-08, 'epoch': 1.93} {'loss': 0.3683, 'learning_rate': 5.669861495175677e-08, 'epoch': 1.93} {'loss': 0.2675, 'learning_rate': 5.6662893679412246e-08, 'epoch': 1.93} {'loss': 0.3918, 'learning_rate': 5.6627183631206004e-08, 'epoch': 1.93} {'loss': 0.201, 'learning_rate': 5.65914848071758e-08, 'epoch': 1.93} {'loss': 0.2441, 'learning_rate': 5.6555797207363815e-08, 'epoch': 1.93} {'loss': 0.3577, 'learning_rate': 5.652012083180891e-08, 'epoch': 1.93} {'loss': 0.2907, 'learning_rate': 5.648445568055216e-08, 'epoch': 1.93} {'loss': 0.2858, 'learning_rate': 5.644880175363465e-08, 'epoch': 1.93} {'loss': 0.2722, 'learning_rate': 5.6413159051094124e-08, 'epoch': 1.93} {'loss': 0.3904, 'learning_rate': 5.6377527572972765e-08, 'epoch': 1.93} {'loss': 0.2595, 'learning_rate': 5.634190731930944e-08, 'epoch': 1.93} {'loss': 0.354, 'learning_rate': 5.6306298290146336e-08, 'epoch': 1.93} {'loss': 0.4118, 'learning_rate': 5.62707004855223e-08, 'epoch': 1.93} {'loss': 0.329, 'learning_rate': 5.623511390547842e-08, 'epoch': 1.93} {'loss': 0.5456, 'learning_rate': 5.619953855005355e-08, 'epoch': 1.93} {'loss': 0.2604, 'learning_rate': 5.616397441928767e-08, 'epoch': 1.93} {'loss': 0.3438, 'learning_rate': 5.612842151322295e-08, 'epoch': 1.93} {'loss': 0.3799, 'learning_rate': 5.6092879831898264e-08, 'epoch': 1.93} {'loss': 0.3779, 'learning_rate': 5.6057349375353564e-08, 'epoch': 1.93} {'loss': 0.2391, 'learning_rate': 5.602183014362883e-08, 'epoch': 1.93} {'loss': 0.304, 'learning_rate': 5.5986322136765135e-08, 'epoch': 1.93} {'loss': 0.2281, 'learning_rate': 5.595082535480134e-08, 'epoch': 1.93} {'loss': 0.2662, 'learning_rate': 5.5915339797778524e-08, 'epoch': 1.93} {'loss': 0.3336, 'learning_rate': 5.587986546573554e-08, 'epoch': 1.93} {'loss': 0.2389, 'learning_rate': 5.584440235871458e-08, 'epoch': 1.93} {'loss': 0.2617, 'learning_rate': 5.5808950476753385e-08, 'epoch': 1.93} {'loss': 0.4369, 'learning_rate': 5.5773509819893045e-08, 'epoch': 1.93} {'loss': 0.2456, 'learning_rate': 5.573808038817352e-08, 'epoch': 1.93} {'loss': 0.3135, 'learning_rate': 5.570266218163478e-08, 'epoch': 1.93} {'loss': 0.4174, 'learning_rate': 5.56672552003168e-08, 'epoch': 1.93} {'loss': 0.2185, 'learning_rate': 5.5631859444259526e-08, 'epoch': 1.93} {'loss': 0.2948, 'learning_rate': 5.5596474913502954e-08, 'epoch': 1.93} {'loss': 0.3222, 'learning_rate': 5.556110160808592e-08, 'epoch': 1.93} {'loss': 0.2703, 'learning_rate': 5.5525739528050626e-08, 'epoch': 1.93} {'loss': 0.148, 'learning_rate': 5.5490388673434816e-08, 'epoch': 1.93} {'loss': 0.4024, 'learning_rate': 5.545504904427956e-08, 'epoch': 1.94} {'loss': 0.3134, 'learning_rate': 5.541972064062484e-08, 'epoch': 1.94} {'loss': 0.3934, 'learning_rate': 5.5384403462510616e-08, 'epoch': 1.94} {'loss': 0.3599, 'learning_rate': 5.534909750997575e-08, 'epoch': 1.94} {'loss': 0.2852, 'learning_rate': 5.53138027830602e-08, 'epoch': 1.94} {'loss': 0.2564, 'learning_rate': 5.527851928180505e-08, 'epoch': 1.94} {'loss': 0.1261, 'learning_rate': 5.524324700624917e-08, 'epoch': 1.94} {'loss': 0.3244, 'learning_rate': 5.5207985956432506e-08, 'epoch': 1.94} {'loss': 0.4032, 'learning_rate': 5.5172736132395044e-08, 'epoch': 1.94} {'loss': 0.3241, 'learning_rate': 5.5137497534176745e-08, 'epoch': 1.94} {'loss': 0.2318, 'learning_rate': 5.5102270161816466e-08, 'epoch': 1.94} {'loss': 0.3451, 'learning_rate': 5.506705401535528e-08, 'epoch': 1.94} {'loss': 0.4491, 'learning_rate': 5.5031849094830944e-08, 'epoch': 1.94} {'loss': 0.3883, 'learning_rate': 5.499665540028676e-08, 'epoch': 1.94} {'loss': 0.3249, 'learning_rate': 5.496147293175824e-08, 'epoch': 1.94} {'loss': 0.3986, 'learning_rate': 5.4926301689287584e-08, 'epoch': 1.94} {'loss': 0.352, 'learning_rate': 5.4891141672914764e-08, 'epoch': 1.94} {'loss': 0.3648, 'learning_rate': 5.4855992882678624e-08, 'epoch': 1.94} {'loss': 0.2609, 'learning_rate': 5.482085531861803e-08, 'epoch': 1.94} {'loss': 0.2863, 'learning_rate': 5.4785728980774054e-08, 'epoch': 1.94} {'loss': 0.3842, 'learning_rate': 5.475061386918556e-08, 'epoch': 1.94} {'loss': 0.4519, 'learning_rate': 5.4715509983892525e-08, 'epoch': 1.94} {'loss': 0.4601, 'learning_rate': 5.4680417324934896e-08, 'epoch': 1.94} {'loss': 0.3726, 'learning_rate': 5.464533589235155e-08, 'epoch': 1.94} {'loss': 0.3629, 'learning_rate': 5.461026568618244e-08, 'epoch': 1.94} {'loss': 0.3461, 'learning_rate': 5.457520670646754e-08, 'epoch': 1.94} {'loss': 0.4008, 'learning_rate': 5.454015895324571e-08, 'epoch': 1.94} {'loss': 0.2853, 'learning_rate': 5.450512242655581e-08, 'epoch': 1.94} {'loss': 0.1847, 'learning_rate': 5.447009712644003e-08, 'epoch': 1.94} {'loss': 0.229, 'learning_rate': 5.44350830529361e-08, 'epoch': 1.94} {'loss': 0.3087, 'learning_rate': 5.4400080206082894e-08, 'epoch': 1.94} {'loss': 0.2556, 'learning_rate': 5.436508858592149e-08, 'epoch': 1.94} {'loss': 0.2713, 'learning_rate': 5.4330108192489626e-08, 'epoch': 1.94} {'loss': 0.417, 'learning_rate': 5.429513902582839e-08, 'epoch': 1.94} {'loss': 0.2905, 'learning_rate': 5.4260181085976636e-08, 'epoch': 1.94} {'loss': 0.2517, 'learning_rate': 5.4225234372974335e-08, 'epoch': 1.94} {'loss': 0.3647, 'learning_rate': 5.4190298886859225e-08, 'epoch': 1.94} {'loss': 0.2441, 'learning_rate': 5.415537462767351e-08, 'epoch': 1.94} {'loss': 0.2495, 'learning_rate': 5.412046159545381e-08, 'epoch': 1.94} {'loss': 0.2607, 'learning_rate': 5.408555979024233e-08, 'epoch': 1.94} {'loss': 0.3361, 'learning_rate': 5.405066921207569e-08, 'epoch': 1.94} {'loss': 0.3774, 'learning_rate': 5.401578986099498e-08, 'epoch': 1.94} {'loss': 0.3749, 'learning_rate': 5.398092173703906e-08, 'epoch': 1.94} {'loss': 0.2234, 'learning_rate': 5.394606484024789e-08, 'epoch': 1.94} {'loss': 0.3808, 'learning_rate': 5.3911219170659225e-08, 'epoch': 1.94} {'loss': 0.3382, 'learning_rate': 5.3876384728314135e-08, 'epoch': 1.94} {'loss': 0.3981, 'learning_rate': 5.3841561513251484e-08, 'epoch': 1.94} {'loss': 0.1939, 'learning_rate': 5.380674952550902e-08, 'epoch': 1.94} {'loss': 0.2887, 'learning_rate': 5.377194876512892e-08, 'epoch': 1.94} {'loss': 0.2552, 'learning_rate': 5.373715923214784e-08, 'epoch': 1.94} {'loss': 0.3009, 'learning_rate': 5.3702380926606844e-08, 'epoch': 1.94} {'loss': 0.191, 'learning_rate': 5.3667613848544795e-08, 'epoch': 1.94} {'loss': 0.2335, 'learning_rate': 5.363285799799944e-08, 'epoch': 1.94} {'loss': 0.2673, 'learning_rate': 5.359811337501186e-08, 'epoch': 1.94} {'loss': 0.2301, 'learning_rate': 5.3563379979620913e-08, 'epoch': 1.94} {'loss': 0.2014, 'learning_rate': 5.3528657811865445e-08, 'epoch': 1.94} {'loss': 0.3686, 'learning_rate': 5.349394687178433e-08, 'epoch': 1.94} {'loss': 0.3037, 'learning_rate': 5.345924715941753e-08, 'epoch': 1.94} {'loss': 0.2817, 'learning_rate': 5.3424558674803893e-08, 'epoch': 1.94} {'loss': 0.4324, 'learning_rate': 5.338988141798229e-08, 'epoch': 1.94} {'loss': 0.2813, 'learning_rate': 5.335521538899158e-08, 'epoch': 1.94} {'loss': 0.1536, 'learning_rate': 5.332056058787172e-08, 'epoch': 1.94} {'loss': 0.2913, 'learning_rate': 5.328591701466157e-08, 'epoch': 1.94} {'loss': 0.3204, 'learning_rate': 5.3251284669399996e-08, 'epoch': 1.94} {'loss': 0.3042, 'learning_rate': 5.321666355212696e-08, 'epoch': 1.94} {'loss': 0.2585, 'learning_rate': 5.318205366288021e-08, 'epoch': 1.94} {'loss': 0.2981, 'learning_rate': 5.314745500169971e-08, 'epoch': 1.94} {'loss': 0.3565, 'learning_rate': 5.311286756862322e-08, 'epoch': 1.94} {'loss': 0.1887, 'learning_rate': 5.3078291363692916e-08, 'epoch': 1.94} {'loss': 0.2111, 'learning_rate': 5.3043726386944324e-08, 'epoch': 1.94} {'loss': 0.3362, 'learning_rate': 5.3009172638417425e-08, 'epoch': 1.94} {'loss': 0.3519, 'learning_rate': 5.297463011815218e-08, 'epoch': 1.94} {'loss': 0.3274, 'learning_rate': 5.294009882618745e-08, 'epoch': 1.94} {'loss': 0.2337, 'learning_rate': 5.2905578762560974e-08, 'epoch': 1.94} {'loss': 0.2695, 'learning_rate': 5.287106992731383e-08, 'epoch': 1.94} {'loss': 0.2456, 'learning_rate': 5.283657232048267e-08, 'epoch': 1.94} {'loss': 0.2459, 'learning_rate': 5.280208594210856e-08, 'epoch': 1.94} {'loss': 0.3395, 'learning_rate': 5.276761079222814e-08, 'epoch': 1.94} {'loss': 0.3173, 'learning_rate': 5.273314687088249e-08, 'epoch': 1.94} {'loss': 0.3922, 'learning_rate': 5.269869417810825e-08, 'epoch': 1.94} {'loss': 0.3861, 'learning_rate': 5.2664252713946484e-08, 'epoch': 1.94} {'loss': 0.2845, 'learning_rate': 5.262982247843606e-08, 'epoch': 1.94} {'loss': 0.3129, 'learning_rate': 5.2595403471613626e-08, 'epoch': 1.94} {'loss': 0.2447, 'learning_rate': 5.256099569352025e-08, 'epoch': 1.94} {'loss': 0.2807, 'learning_rate': 5.2526599144192555e-08, 'epoch': 1.94} {'loss': 0.378, 'learning_rate': 5.2492213823672754e-08, 'epoch': 1.94} {'loss': 0.3395, 'learning_rate': 5.245783973199636e-08, 'epoch': 1.94} {'loss': 0.3702, 'learning_rate': 5.242347686920335e-08, 'epoch': 1.94} {'loss': 0.3175, 'learning_rate': 5.238912523533257e-08, 'epoch': 1.94} {'loss': 0.3782, 'learning_rate': 5.2354784830424e-08, 'epoch': 1.94} {'loss': 0.2162, 'learning_rate': 5.232045565451427e-08, 'epoch': 1.94} {'loss': 0.2018, 'learning_rate': 5.228613770764335e-08, 'epoch': 1.94} {'loss': 0.2864, 'learning_rate': 5.2251830989848984e-08, 'epoch': 1.94} {'loss': 0.3977, 'learning_rate': 5.2217535501172255e-08, 'epoch': 1.94} {'loss': 0.3178, 'learning_rate': 5.21832512416498e-08, 'epoch': 1.94} {'loss': 0.309, 'learning_rate': 5.214897821131937e-08, 'epoch': 1.94} {'loss': 0.2556, 'learning_rate': 5.211471641022314e-08, 'epoch': 1.94} {'loss': 0.2359, 'learning_rate': 5.208046583839555e-08, 'epoch': 1.94} {'loss': 0.4886, 'learning_rate': 5.204622649587876e-08, 'epoch': 1.94} {'loss': 0.3859, 'learning_rate': 5.201199838271054e-08, 'epoch': 1.94} {'loss': 0.3724, 'learning_rate': 5.197778149892863e-08, 'epoch': 1.94} {'loss': 0.3345, 'learning_rate': 5.1943575844570773e-08, 'epoch': 1.94} {'loss': 0.355, 'learning_rate': 5.190938141967805e-08, 'epoch': 1.94} {'loss': 0.1955, 'learning_rate': 5.187519822428821e-08, 'epoch': 1.94} {'loss': 0.2997, 'learning_rate': 5.1841026258439006e-08, 'epoch': 1.94} {'loss': 0.3721, 'learning_rate': 5.18068655221704e-08, 'epoch': 1.94} {'loss': 0.3331, 'learning_rate': 5.177271601551903e-08, 'epoch': 1.94} {'loss': 0.257, 'learning_rate': 5.173857773852486e-08, 'epoch': 1.94} {'loss': 0.3133, 'learning_rate': 5.170445069122676e-08, 'epoch': 1.94} {'loss': 0.3102, 'learning_rate': 5.167033487366135e-08, 'epoch': 1.94} {'loss': 0.3133, 'learning_rate': 5.163623028586862e-08, 'epoch': 1.94} {'loss': 0.413, 'learning_rate': 5.16021369278874e-08, 'epoch': 1.94} {'loss': 0.2898, 'learning_rate': 5.1568054799755465e-08, 'epoch': 1.94} {'loss': 0.3335, 'learning_rate': 5.153398390151165e-08, 'epoch': 1.94} {'loss': 0.3418, 'learning_rate': 5.149992423319372e-08, 'epoch': 1.94} {'loss': 0.2046, 'learning_rate': 5.1465875794840526e-08, 'epoch': 1.94} {'loss': 0.1309, 'learning_rate': 5.143183858649092e-08, 'epoch': 1.94} {'loss': 0.2126, 'learning_rate': 5.139781260818266e-08, 'epoch': 1.94} {'loss': 0.2145, 'learning_rate': 5.136379785995571e-08, 'epoch': 1.94} {'loss': 0.3107, 'learning_rate': 5.1329794341845594e-08, 'epoch': 1.94} {'loss': 0.2765, 'learning_rate': 5.129580205389339e-08, 'epoch': 1.94} {'loss': 0.1779, 'learning_rate': 5.1261820996134637e-08, 'epoch': 1.94} {'loss': 0.3537, 'learning_rate': 5.1227851168611506e-08, 'epoch': 1.94} {'loss': 0.3457, 'learning_rate': 5.119389257135954e-08, 'epoch': 1.94} {'loss': 0.2464, 'learning_rate': 5.115994520441758e-08, 'epoch': 1.94} {'loss': 0.3114, 'learning_rate': 5.11260090678245e-08, 'epoch': 1.94} {'loss': 0.2888, 'learning_rate': 5.109208416161804e-08, 'epoch': 1.94} {'loss': 0.3081, 'learning_rate': 5.1058170485835944e-08, 'epoch': 1.94} {'loss': 0.2345, 'learning_rate': 5.10242680405193e-08, 'epoch': 1.94} {'loss': 0.2791, 'learning_rate': 5.0990376825702516e-08, 'epoch': 1.94} {'loss': 0.2658, 'learning_rate': 5.095649684142667e-08, 'epoch': 1.94} {'loss': 0.2614, 'learning_rate': 5.092262808772952e-08, 'epoch': 1.94} {'loss': 0.3373, 'learning_rate': 5.088877056464769e-08, 'epoch': 1.94} {'loss': 0.2198, 'learning_rate': 5.085492427222116e-08, 'epoch': 1.94} {'loss': 0.2726, 'learning_rate': 5.082108921048656e-08, 'epoch': 1.94} {'loss': 0.1168, 'learning_rate': 5.078726537948386e-08, 'epoch': 1.94} {'loss': 0.2933, 'learning_rate': 5.075345277925081e-08, 'epoch': 1.94} {'loss': 0.2949, 'learning_rate': 5.0719651409824045e-08, 'epoch': 1.94} {'loss': 0.1708, 'learning_rate': 5.068586127124353e-08, 'epoch': 1.94} {'loss': 0.3897, 'learning_rate': 5.065208236354702e-08, 'epoch': 1.94} {'loss': 0.45, 'learning_rate': 5.0618314686772253e-08, 'epoch': 1.94} {'loss': 0.193, 'learning_rate': 5.058455824095698e-08, 'epoch': 1.94} {'loss': 0.3797, 'learning_rate': 5.055081302614007e-08, 'epoch': 1.94} {'loss': 0.1831, 'learning_rate': 5.0517079042359254e-08, 'epoch': 1.94} {'loss': 0.3338, 'learning_rate': 5.0483356289652284e-08, 'epoch': 1.94} {'loss': 0.2856, 'learning_rate': 5.044964476805803e-08, 'epoch': 1.94} {'loss': 0.3737, 'learning_rate': 5.041594447761422e-08, 'epoch': 1.94} {'loss': 0.1954, 'learning_rate': 5.038225541835862e-08, 'epoch': 1.94} {'loss': 0.3936, 'learning_rate': 5.0348577590330074e-08, 'epoch': 1.94} {'loss': 0.4214, 'learning_rate': 5.031491099356522e-08, 'epoch': 1.94} {'loss': 0.2169, 'learning_rate': 5.028125562810293e-08, 'epoch': 1.94} {'loss': 0.3054, 'learning_rate': 5.024761149398094e-08, 'epoch': 1.94} {'loss': 0.3121, 'learning_rate': 5.021397859123811e-08, 'epoch': 1.94} {'loss': 0.3623, 'learning_rate': 5.018035691991108e-08, 'epoch': 1.94} {'loss': 0.3266, 'learning_rate': 5.014674648003759e-08, 'epoch': 1.94} {'loss': 0.2608, 'learning_rate': 5.011314727165761e-08, 'epoch': 1.94} {'loss': 0.3523, 'learning_rate': 5.007955929480779e-08, 'epoch': 1.94} {'loss': 0.3366, 'learning_rate': 5.0045982549525864e-08, 'epoch': 1.94} {'loss': 0.3566, 'learning_rate': 5.001241703584958e-08, 'epoch': 1.94} {'loss': 0.2515, 'learning_rate': 4.99788627538178e-08, 'epoch': 1.94} {'loss': 0.3384, 'learning_rate': 4.994531970346716e-08, 'epoch': 1.94} {'loss': 0.3677, 'learning_rate': 4.991178788483653e-08, 'epoch': 1.94} {'loss': 0.3085, 'learning_rate': 4.987826729796252e-08, 'epoch': 1.94} {'loss': 0.3748, 'learning_rate': 4.984475794288513e-08, 'epoch': 1.94} {'loss': 0.2163, 'learning_rate': 4.981125981963986e-08, 'epoch': 1.94} {'loss': 0.1784, 'learning_rate': 4.977777292826669e-08, 'epoch': 1.94} {'loss': 0.2119, 'learning_rate': 4.9744297268801145e-08, 'epoch': 1.94} {'loss': 0.2421, 'learning_rate': 4.9710832841283195e-08, 'epoch': 1.94} {'loss': 0.2941, 'learning_rate': 4.967737964574948e-08, 'epoch': 1.94} {'loss': 0.2339, 'learning_rate': 4.964393768223663e-08, 'epoch': 1.94} {'loss': 0.2534, 'learning_rate': 4.961050695078573e-08, 'epoch': 1.94} {'loss': 0.3849, 'learning_rate': 4.9577087451430086e-08, 'epoch': 1.94} {'loss': 0.2009, 'learning_rate': 4.954367918421188e-08, 'epoch': 1.94} {'loss': 0.2656, 'learning_rate': 4.951028214916442e-08, 'epoch': 1.94} {'loss': 0.2271, 'learning_rate': 4.947689634632991e-08, 'epoch': 1.94} {'loss': 0.2713, 'learning_rate': 4.944352177574274e-08, 'epoch': 1.94} {'loss': 0.2821, 'learning_rate': 4.941015843744179e-08, 'epoch': 1.94} {'loss': 0.3562, 'learning_rate': 4.937680633146369e-08, 'epoch': 1.94} {'loss': 0.2524, 'learning_rate': 4.9343465457848406e-08, 'epoch': 1.94} {'loss': 0.4778, 'learning_rate': 4.931013581663147e-08, 'epoch': 1.94} {'loss': 0.2083, 'learning_rate': 4.927681740785062e-08, 'epoch': 1.94} {'loss': 0.212, 'learning_rate': 4.924351023154583e-08, 'epoch': 1.94} {'loss': 0.3296, 'learning_rate': 4.921021428775041e-08, 'epoch': 1.94} {'loss': 0.3715, 'learning_rate': 4.917692957650655e-08, 'epoch': 1.94} {'loss': 0.2582, 'learning_rate': 4.914365609784866e-08, 'epoch': 1.94} {'loss': 0.3811, 'learning_rate': 4.91103938518156e-08, 'epoch': 1.94} {'loss': 0.2257, 'learning_rate': 4.9077142838444e-08, 'epoch': 1.94} {'loss': 0.3331, 'learning_rate': 4.9043903057773845e-08, 'epoch': 1.94} {'loss': 0.2611, 'learning_rate': 4.901067450983843e-08, 'epoch': 1.94} {'loss': 0.2106, 'learning_rate': 4.897745719467995e-08, 'epoch': 1.94} {'loss': 0.1648, 'learning_rate': 4.89442511123317e-08, 'epoch': 1.94} {'loss': 0.5069, 'learning_rate': 4.8911056262834765e-08, 'epoch': 1.94} {'loss': 0.3275, 'learning_rate': 4.8877872646223566e-08, 'epoch': 1.94} {'loss': 0.1805, 'learning_rate': 4.884470026253807e-08, 'epoch': 1.94} {'loss': 0.3469, 'learning_rate': 4.881153911181491e-08, 'epoch': 1.94} {'loss': 0.3172, 'learning_rate': 4.8778389194089616e-08, 'epoch': 1.94} {'loss': 0.1943, 'learning_rate': 4.874525050940215e-08, 'epoch': 1.94} {'loss': 0.2512, 'learning_rate': 4.871212305778916e-08, 'epoch': 1.94} {'loss': 0.3643, 'learning_rate': 4.867900683928728e-08, 'epoch': 1.94} {'loss': 0.3709, 'learning_rate': 4.864590185393536e-08, 'epoch': 1.94} {'loss': 0.3437, 'learning_rate': 4.8612808101768936e-08, 'epoch': 1.94} {'loss': 0.2489, 'learning_rate': 4.8579725582826864e-08, 'epoch': 1.94} {'loss': 0.3271, 'learning_rate': 4.854665429714578e-08, 'epoch': 1.94} {'loss': 0.1823, 'learning_rate': 4.851359424476343e-08, 'epoch': 1.94} {'loss': 0.3622, 'learning_rate': 4.848054542571645e-08, 'epoch': 1.94} {'loss': 0.3719, 'learning_rate': 4.844750784004259e-08, 'epoch': 1.94} {'loss': 0.3845, 'learning_rate': 4.841448148777961e-08, 'epoch': 1.94} {'loss': 0.3291, 'learning_rate': 4.838146636896412e-08, 'epoch': 1.94} {'loss': 0.2064, 'learning_rate': 4.834846248363168e-08, 'epoch': 1.94} {'loss': 0.3237, 'learning_rate': 4.831546983182334e-08, 'epoch': 1.94} {'loss': 0.3046, 'learning_rate': 4.8282488413574635e-08, 'epoch': 1.94} {'loss': 0.3634, 'learning_rate': 4.824951822892221e-08, 'epoch': 1.94} {'loss': 0.4203, 'learning_rate': 4.821655927790381e-08, 'epoch': 1.94} {'loss': 0.3323, 'learning_rate': 4.818361156055606e-08, 'epoch': 1.94} {'loss': 0.2542, 'learning_rate': 4.815067507691673e-08, 'epoch': 1.94} {'loss': 0.4159, 'learning_rate': 4.811774982702355e-08, 'epoch': 1.94} {'loss': 0.1931, 'learning_rate': 4.8084835810912055e-08, 'epoch': 1.94} {'loss': 0.3725, 'learning_rate': 4.80519330286211e-08, 'epoch': 1.94} {'loss': 0.2866, 'learning_rate': 4.801904148018621e-08, 'epoch': 1.94} {'loss': 0.3741, 'learning_rate': 4.798616116564625e-08, 'epoch': 1.94} {'loss': 0.3545, 'learning_rate': 4.795329208503674e-08, 'epoch': 1.94} {'loss': 0.4264, 'learning_rate': 4.792043423839543e-08, 'epoch': 1.94} {'loss': 0.3615, 'learning_rate': 4.788758762576007e-08, 'epoch': 1.94} {'loss': 0.1469, 'learning_rate': 4.785475224716618e-08, 'epoch': 1.94} {'loss': 0.3969, 'learning_rate': 4.7821928102653736e-08, 'epoch': 1.94} {'loss': 0.4293, 'learning_rate': 4.778911519225604e-08, 'epoch': 1.94} {'loss': 0.4645, 'learning_rate': 4.7756313516013065e-08, 'epoch': 1.94} {'loss': 0.2073, 'learning_rate': 4.772352307395922e-08, 'epoch': 1.94} {'loss': 0.2267, 'learning_rate': 4.769074386613448e-08, 'epoch': 1.94} {'loss': 0.3825, 'learning_rate': 4.765797589257437e-08, 'epoch': 1.94} {'loss': 0.2356, 'learning_rate': 4.762521915331442e-08, 'epoch': 1.94} {'loss': 0.2859, 'learning_rate': 4.759247364839459e-08, 'epoch': 1.94} {'loss': 0.2204, 'learning_rate': 4.7559739377849304e-08, 'epoch': 1.94} {'loss': 0.4281, 'learning_rate': 4.7527016341717414e-08, 'epoch': 1.94} {'loss': 0.1957, 'learning_rate': 4.7494304540033346e-08, 'epoch': 1.94} {'loss': 0.2896, 'learning_rate': 4.7461603972837054e-08, 'epoch': 1.94} {'loss': 0.1575, 'learning_rate': 4.742891464016408e-08, 'epoch': 1.94} {'loss': 0.2135, 'learning_rate': 4.739623654205106e-08, 'epoch': 1.94} {'loss': 0.2942, 'learning_rate': 4.7363569678534613e-08, 'epoch': 1.94} {'loss': 0.1798, 'learning_rate': 4.733091404965251e-08, 'epoch': 1.94} {'loss': 0.2309, 'learning_rate': 4.7298269655441375e-08, 'epoch': 1.94} {'loss': 0.2823, 'learning_rate': 4.726563649593785e-08, 'epoch': 1.94} {'loss': 0.2085, 'learning_rate': 4.723301457117968e-08, 'epoch': 1.94} {'loss': 0.4757, 'learning_rate': 4.720040388120128e-08, 'epoch': 1.94} {'loss': 0.2767, 'learning_rate': 4.716780442604152e-08, 'epoch': 1.94} {'loss': 0.1882, 'learning_rate': 4.7135216205737025e-08, 'epoch': 1.94} {'loss': 0.2226, 'learning_rate': 4.710263922032443e-08, 'epoch': 1.94} {'loss': 0.2883, 'learning_rate': 4.7070073469839274e-08, 'epoch': 1.94} {'loss': 0.2674, 'learning_rate': 4.70375189543204e-08, 'epoch': 1.94} {'loss': 0.2239, 'learning_rate': 4.700497567380335e-08, 'epoch': 1.94} {'loss': 0.3904, 'learning_rate': 4.697244362832476e-08, 'epoch': 1.94} {'loss': 0.3024, 'learning_rate': 4.6939922817921256e-08, 'epoch': 1.94} {'loss': 0.275, 'learning_rate': 4.6907413242630596e-08, 'epoch': 1.94} {'loss': 0.2922, 'learning_rate': 4.68749149024883e-08, 'epoch': 1.94} {'loss': 0.2093, 'learning_rate': 4.684242779753212e-08, 'epoch': 1.94} {'loss': 0.2737, 'learning_rate': 4.680995192779758e-08, 'epoch': 1.94} {'loss': 0.1714, 'learning_rate': 4.677748729332243e-08, 'epoch': 1.94} {'loss': 0.3967, 'learning_rate': 4.674503389414331e-08, 'epoch': 1.94} {'loss': 0.3701, 'learning_rate': 4.671259173029463e-08, 'epoch': 1.94} {'loss': 0.2011, 'learning_rate': 4.6680160801816366e-08, 'epoch': 1.94} {'loss': 0.1785, 'learning_rate': 4.664774110874182e-08, 'epoch': 1.94} {'loss': 0.3104, 'learning_rate': 4.6615332651110955e-08, 'epoch': 1.94} {'loss': 0.2567, 'learning_rate': 4.65829354289582e-08, 'epoch': 1.94} {'loss': 0.3189, 'learning_rate': 4.655054944232018e-08, 'epoch': 1.94} {'loss': 0.2062, 'learning_rate': 4.651817469123354e-08, 'epoch': 1.94} {'loss': 0.4268, 'learning_rate': 4.648581117573603e-08, 'epoch': 1.94} {'loss': 0.4338, 'learning_rate': 4.6453458895863165e-08, 'epoch': 1.94} {'loss': 0.3204, 'learning_rate': 4.6421117851651596e-08, 'epoch': 1.94} {'loss': 0.2645, 'learning_rate': 4.6388788043136845e-08, 'epoch': 1.94} {'loss': 0.2997, 'learning_rate': 4.635646947035777e-08, 'epoch': 1.94} {'loss': 0.1206, 'learning_rate': 4.6324162133348784e-08, 'epoch': 1.94} {'loss': 0.3641, 'learning_rate': 4.629186603214653e-08, 'epoch': 1.94} {'loss': 0.1611, 'learning_rate': 4.625958116678875e-08, 'epoch': 1.94} {'loss': 0.1743, 'learning_rate': 4.622730753731097e-08, 'epoch': 1.94} {'loss': 0.2565, 'learning_rate': 4.619504514374984e-08, 'epoch': 1.94} {'loss': 0.3325, 'learning_rate': 4.6162793986140875e-08, 'epoch': 1.94} {'loss': 0.2775, 'learning_rate': 4.613055406452183e-08, 'epoch': 1.94} {'loss': 0.3649, 'learning_rate': 4.6098325378928224e-08, 'epoch': 1.94} {'loss': 0.3966, 'learning_rate': 4.606610792939781e-08, 'epoch': 1.94} {'loss': 0.1919, 'learning_rate': 4.6033901715965e-08, 'epoch': 1.94} {'loss': 0.2882, 'learning_rate': 4.600170673866755e-08, 'epoch': 1.94} {'loss': 0.3561, 'learning_rate': 4.596952299754209e-08, 'epoch': 1.94} {'loss': 0.1951, 'learning_rate': 4.593735049262305e-08, 'epoch': 1.94} {'loss': 0.3098, 'learning_rate': 4.5905189223948156e-08, 'epoch': 1.94} {'loss': 0.2697, 'learning_rate': 4.5873039191552947e-08, 'epoch': 1.94} {'loss': 0.3284, 'learning_rate': 4.584090039547517e-08, 'epoch': 1.94} {'loss': 0.282, 'learning_rate': 4.580877283574925e-08, 'epoch': 1.94} {'loss': 0.1454, 'learning_rate': 4.577665651241292e-08, 'epoch': 1.94} {'loss': 0.418, 'learning_rate': 4.5744551425501717e-08, 'epoch': 1.94} {'loss': 0.4744, 'learning_rate': 4.571245757505227e-08, 'epoch': 1.94} {'loss': 0.2892, 'learning_rate': 4.568037496110012e-08, 'epoch': 1.94} {'loss': 0.2905, 'learning_rate': 4.564830358368189e-08, 'epoch': 1.94} {'loss': 0.3519, 'learning_rate': 4.5616243442834216e-08, 'epoch': 1.94} {'loss': 0.2462, 'learning_rate': 4.558419453859264e-08, 'epoch': 1.94} {'loss': 0.2525, 'learning_rate': 4.55521568709949e-08, 'epoch': 1.94} {'loss': 0.1975, 'learning_rate': 4.552013044007431e-08, 'epoch': 1.94} {'loss': 0.1773, 'learning_rate': 4.54881152458686e-08, 'epoch': 1.94} {'loss': 0.378, 'learning_rate': 4.5456111288414427e-08, 'epoch': 1.94} {'loss': 0.3656, 'learning_rate': 4.542411856774731e-08, 'epoch': 1.94} {'loss': 0.4193, 'learning_rate': 4.539213708390278e-08, 'epoch': 1.94} {'loss': 0.3039, 'learning_rate': 4.536016683691857e-08, 'epoch': 1.94} {'loss': 0.3916, 'learning_rate': 4.5328207826828006e-08, 'epoch': 1.94} {'loss': 0.3344, 'learning_rate': 4.5296260053671046e-08, 'epoch': 1.94} {'loss': 0.3693, 'learning_rate': 4.526432351747989e-08, 'epoch': 1.94} {'loss': 0.2449, 'learning_rate': 4.523239821829339e-08, 'epoch': 1.94} {'loss': 0.3284, 'learning_rate': 4.5200484156145974e-08, 'epoch': 1.94} {'loss': 0.419, 'learning_rate': 4.5168581331075375e-08, 'epoch': 1.94} {'loss': 0.2663, 'learning_rate': 4.5136689743114915e-08, 'epoch': 1.94} {'loss': 0.304, 'learning_rate': 4.5104809392303436e-08, 'epoch': 1.94} {'loss': 0.3653, 'learning_rate': 4.507294027867426e-08, 'epoch': 1.94} {'loss': 0.2398, 'learning_rate': 4.5041082402265124e-08, 'epoch': 1.94} {'loss': 0.1957, 'learning_rate': 4.500923576311267e-08, 'epoch': 1.94} {'loss': 0.3638, 'learning_rate': 4.497740036125131e-08, 'epoch': 1.94} {'loss': 0.3238, 'learning_rate': 4.494557619671658e-08, 'epoch': 1.94} {'loss': 0.3523, 'learning_rate': 4.491376326954622e-08, 'epoch': 1.94} {'loss': 0.2291, 'learning_rate': 4.4881961579774645e-08, 'epoch': 1.94} {'loss': 0.2417, 'learning_rate': 4.48501711274385e-08, 'epoch': 1.94} {'loss': 0.3741, 'learning_rate': 4.481839191257331e-08, 'epoch': 1.94} {'loss': 0.2385, 'learning_rate': 4.478662393521571e-08, 'epoch': 1.94} {'loss': 0.3648, 'learning_rate': 4.475486719540012e-08, 'epoch': 1.94} {'loss': 0.2513, 'learning_rate': 4.472312169316318e-08, 'epoch': 1.94} {'loss': 0.3077, 'learning_rate': 4.46913874285404e-08, 'epoch': 1.94} {'loss': 0.171, 'learning_rate': 4.465966440156955e-08, 'epoch': 1.94} {'loss': 0.361, 'learning_rate': 4.462795261228281e-08, 'epoch': 1.94} {'loss': 0.4487, 'learning_rate': 4.459625206072016e-08, 'epoch': 1.94} {'loss': 0.3001, 'learning_rate': 4.456456274691379e-08, 'epoch': 1.94} {'loss': 0.2968, 'learning_rate': 4.453288467090144e-08, 'epoch': 1.94} {'loss': 0.3425, 'learning_rate': 4.4501217832718655e-08, 'epoch': 1.94} {'loss': 0.341, 'learning_rate': 4.446956223239984e-08, 'epoch': 1.94} {'loss': 0.326, 'learning_rate': 4.443791786998275e-08, 'epoch': 1.94} {'loss': 0.3889, 'learning_rate': 4.440628474550068e-08, 'epoch': 1.94} {'loss': 0.3686, 'learning_rate': 4.43746628589925e-08, 'epoch': 1.94} {'loss': 0.3229, 'learning_rate': 4.434305221049151e-08, 'epoch': 1.94} {'loss': 0.2859, 'learning_rate': 4.431145280003435e-08, 'epoch': 1.94} {'loss': 0.361, 'learning_rate': 4.427986462765543e-08, 'epoch': 1.94} {'loss': 0.2275, 'learning_rate': 4.424828769339251e-08, 'epoch': 1.94} {'loss': 0.2779, 'learning_rate': 4.421672199727889e-08, 'epoch': 1.94} {'loss': 0.2195, 'learning_rate': 4.418516753935231e-08, 'epoch': 1.94} {'loss': 0.275, 'learning_rate': 4.4153624319647204e-08, 'epoch': 1.94} {'loss': 0.2384, 'learning_rate': 4.4122092338199086e-08, 'epoch': 1.94} {'loss': 0.3026, 'learning_rate': 4.4090571595044596e-08, 'epoch': 1.94} {'loss': 0.3402, 'learning_rate': 4.4059062090219264e-08, 'epoch': 1.94} {'loss': 0.1986, 'learning_rate': 4.4027563823756394e-08, 'epoch': 1.94} {'loss': 0.2461, 'learning_rate': 4.399607679569484e-08, 'epoch': 1.94} {'loss': 0.2717, 'learning_rate': 4.3964601006066806e-08, 'epoch': 1.94} {'loss': 0.2785, 'learning_rate': 4.393313645491115e-08, 'epoch': 1.94} {'loss': 0.2893, 'learning_rate': 4.3901683142261175e-08, 'epoch': 1.94} {'loss': 0.3561, 'learning_rate': 4.3870241068152406e-08, 'epoch': 1.94} {'loss': 0.2804, 'learning_rate': 4.3838810232621484e-08, 'epoch': 1.94} {'loss': 0.5541, 'learning_rate': 4.380739063570283e-08, 'epoch': 1.94} {'loss': 0.2984, 'learning_rate': 4.377598227743196e-08, 'epoch': 1.94} {'loss': 0.1907, 'learning_rate': 4.374458515784552e-08, 'epoch': 1.94} {'loss': 0.3583, 'learning_rate': 4.3713199276977924e-08, 'epoch': 1.94} {'loss': 0.3279, 'learning_rate': 4.368182463486581e-08, 'epoch': 1.94} {'loss': 0.3336, 'learning_rate': 4.3650461231542486e-08, 'epoch': 1.94} {'loss': 0.235, 'learning_rate': 4.3619109067044583e-08, 'epoch': 1.94} {'loss': 0.3674, 'learning_rate': 4.3587768141407636e-08, 'epoch': 1.94} {'loss': 0.3342, 'learning_rate': 4.355643845466717e-08, 'epoch': 1.94} {'loss': 0.3609, 'learning_rate': 4.3525120006857605e-08, 'epoch': 1.94} {'loss': 0.2898, 'learning_rate': 4.3493812798015566e-08, 'epoch': 1.94} {'loss': 0.1601, 'learning_rate': 4.3462516828174375e-08, 'epoch': 1.94} {'loss': 0.2012, 'learning_rate': 4.3431232097371766e-08, 'epoch': 1.94} {'loss': 0.2525, 'learning_rate': 4.339995860564217e-08, 'epoch': 1.94} {'loss': 0.3355, 'learning_rate': 4.336869635301999e-08, 'epoch': 1.94} {'loss': 0.3591, 'learning_rate': 4.333744533954076e-08, 'epoch': 1.94} {'loss': 0.2703, 'learning_rate': 4.330620556524112e-08, 'epoch': 1.94} {'loss': 0.2395, 'learning_rate': 4.327497703015548e-08, 'epoch': 1.94} {'loss': 0.1733, 'learning_rate': 4.324375973431827e-08, 'epoch': 1.94} {'loss': 0.3466, 'learning_rate': 4.321255367776722e-08, 'epoch': 1.94} {'loss': 0.3284, 'learning_rate': 4.318135886053343e-08, 'epoch': 1.94} {'loss': 0.2296, 'learning_rate': 4.315017528265575e-08, 'epoch': 1.94} {'loss': 0.3553, 'learning_rate': 4.31190029441686e-08, 'epoch': 1.94} {'loss': 0.166, 'learning_rate': 4.308784184510639e-08, 'epoch': 1.94} {'loss': 0.277, 'learning_rate': 4.3056691985503555e-08, 'epoch': 1.94} {'loss': 0.2805, 'learning_rate': 4.302555336539782e-08, 'epoch': 1.94} {'loss': 0.3334, 'learning_rate': 4.29944259848214e-08, 'epoch': 1.94} {'loss': 0.2097, 'learning_rate': 4.2963309843812027e-08, 'epoch': 1.94} {'loss': 0.3528, 'learning_rate': 4.293220494240302e-08, 'epoch': 1.94} {'loss': 0.3252, 'learning_rate': 4.2901111280631016e-08, 'epoch': 1.94} {'loss': 0.2408, 'learning_rate': 4.287002885852931e-08, 'epoch': 1.94} {'loss': 0.1933, 'learning_rate': 4.2838957676134554e-08, 'epoch': 1.94} {'loss': 0.241, 'learning_rate': 4.280789773348004e-08, 'epoch': 1.94} {'loss': 0.3053, 'learning_rate': 4.277684903060242e-08, 'epoch': 1.94} {'loss': 0.4184, 'learning_rate': 4.274581156753721e-08, 'epoch': 1.94} {'loss': 0.337, 'learning_rate': 4.2714785344317725e-08, 'epoch': 1.94} {'loss': 0.4076, 'learning_rate': 4.2683770360980593e-08, 'epoch': 1.94} {'loss': 0.3143, 'learning_rate': 4.2652766617559125e-08, 'epoch': 1.94} {'loss': 0.2537, 'learning_rate': 4.2621774114088856e-08, 'epoch': 1.94} {'loss': 0.3077, 'learning_rate': 4.259079285060641e-08, 'epoch': 1.94} {'loss': 0.2126, 'learning_rate': 4.255982282714399e-08, 'epoch': 1.94} {'loss': 0.2843, 'learning_rate': 4.252886404373935e-08, 'epoch': 1.94} {'loss': 0.2826, 'learning_rate': 4.249791650042578e-08, 'epoch': 1.94} {'loss': 0.3284, 'learning_rate': 4.2466980197237716e-08, 'epoch': 1.94} {'loss': 0.2884, 'learning_rate': 4.2436055134211786e-08, 'epoch': 1.94} {'loss': 0.269, 'learning_rate': 4.2405141311382404e-08, 'epoch': 1.94} {'loss': 0.3058, 'learning_rate': 4.237423872878288e-08, 'epoch': 1.94} {'loss': 0.2757, 'learning_rate': 4.2343347386449854e-08, 'epoch': 1.94} {'loss': 0.3333, 'learning_rate': 4.231246728441774e-08, 'epoch': 1.94} {'loss': 0.3503, 'learning_rate': 4.228159842272206e-08, 'epoch': 1.94} {'loss': 0.4311, 'learning_rate': 4.225074080139502e-08, 'epoch': 1.94} {'loss': 0.3495, 'learning_rate': 4.221989442047547e-08, 'epoch': 1.94} {'loss': 0.4617, 'learning_rate': 4.2189059279994507e-08, 'epoch': 1.94} {'loss': 0.3495, 'learning_rate': 4.2158235379989864e-08, 'epoch': 1.94} {'loss': 0.2849, 'learning_rate': 4.212742272049375e-08, 'epoch': 1.94} {'loss': 0.3247, 'learning_rate': 4.2096621301542794e-08, 'epoch': 1.94} {'loss': 0.3365, 'learning_rate': 4.206583112317031e-08, 'epoch': 1.94} {'loss': 0.43, 'learning_rate': 4.203505218541293e-08, 'epoch': 1.94} {'loss': 0.2604, 'learning_rate': 4.200428448830396e-08, 'epoch': 1.94} {'loss': 0.1608, 'learning_rate': 4.197352803187893e-08, 'epoch': 1.94} {'loss': 0.2693, 'learning_rate': 4.194278281617226e-08, 'epoch': 1.94} {'loss': 0.2382, 'learning_rate': 4.191204884121836e-08, 'epoch': 1.94} {'loss': 0.39, 'learning_rate': 4.1881326107051645e-08, 'epoch': 1.94} {'loss': 0.2987, 'learning_rate': 4.1850614613707655e-08, 'epoch': 1.94} {'loss': 0.2105, 'learning_rate': 4.181991436122079e-08, 'epoch': 1.94} {'loss': 0.329, 'learning_rate': 4.1789225349626594e-08, 'epoch': 1.94} {'loss': 0.3741, 'learning_rate': 4.175854757895725e-08, 'epoch': 1.94} {'loss': 0.2913, 'learning_rate': 4.172788104924941e-08, 'epoch': 1.94} {'loss': 0.2379, 'learning_rate': 4.1697225760536366e-08, 'epoch': 1.94} {'loss': 0.1906, 'learning_rate': 4.1666581712854756e-08, 'epoch': 1.94} {'loss': 0.2879, 'learning_rate': 4.163594890623679e-08, 'epoch': 1.94} {'loss': 0.2504, 'learning_rate': 4.160532734071909e-08, 'epoch': 1.94} {'loss': 0.1926, 'learning_rate': 4.1574717016334977e-08, 'epoch': 1.94} {'loss': 0.2024, 'learning_rate': 4.154411793311886e-08, 'epoch': 1.94} {'loss': 0.3574, 'learning_rate': 4.151353009110626e-08, 'epoch': 1.94} {'loss': 0.4083, 'learning_rate': 4.14829534903316e-08, 'epoch': 1.94} {'loss': 0.4219, 'learning_rate': 4.1452388130828193e-08, 'epoch': 1.94} {'loss': 0.363, 'learning_rate': 4.1421834012631556e-08, 'epoch': 1.94} {'loss': 0.221, 'learning_rate': 4.139129113577611e-08, 'epoch': 1.94} {'loss': 0.3493, 'learning_rate': 4.136075950029628e-08, 'epoch': 1.94} {'loss': 0.3771, 'learning_rate': 4.133023910622647e-08, 'epoch': 1.94} {'loss': 0.3698, 'learning_rate': 4.1299729953601096e-08, 'epoch': 1.94} {'loss': 0.2682, 'learning_rate': 4.1269232042453475e-08, 'epoch': 1.94} {'loss': 0.3215, 'learning_rate': 4.1238745372820246e-08, 'epoch': 1.94} {'loss': 0.3078, 'learning_rate': 4.12082699447347e-08, 'epoch': 1.94} {'loss': 0.2878, 'learning_rate': 4.117780575823127e-08, 'epoch': 1.94} {'loss': 0.3376, 'learning_rate': 4.1147352813344367e-08, 'epoch': 1.94} {'loss': 0.3579, 'learning_rate': 4.1116911110107293e-08, 'epoch': 1.94} {'loss': 0.2374, 'learning_rate': 4.108648064855669e-08, 'epoch': 1.94} {'loss': 0.2146, 'learning_rate': 4.105606142872476e-08, 'epoch': 1.94} {'loss': 0.2114, 'learning_rate': 4.102565345064813e-08, 'epoch': 1.94} {'loss': 0.4255, 'learning_rate': 4.0995256714359e-08, 'epoch': 1.94} {'loss': 0.3739, 'learning_rate': 4.096487121989179e-08, 'epoch': 1.94} {'loss': 0.4379, 'learning_rate': 4.093449696728202e-08, 'epoch': 1.94} {'loss': 0.4743, 'learning_rate': 4.090413395656301e-08, 'epoch': 1.94} {'loss': 0.358, 'learning_rate': 4.087378218777027e-08, 'epoch': 1.94} {'loss': 0.2592, 'learning_rate': 4.0843441660937124e-08, 'epoch': 1.94} {'loss': 0.3533, 'learning_rate': 4.081311237609686e-08, 'epoch': 1.94} {'loss': 0.2389, 'learning_rate': 4.078279433328613e-08, 'epoch': 1.94} {'loss': 0.2113, 'learning_rate': 4.075248753253713e-08, 'epoch': 1.94} {'loss': 0.4233, 'learning_rate': 4.0722191973884274e-08, 'epoch': 1.94} {'loss': 0.2183, 'learning_rate': 4.0691907657363085e-08, 'epoch': 1.94} {'loss': 0.455, 'learning_rate': 4.066163458300576e-08, 'epoch': 1.94} {'loss': 0.223, 'learning_rate': 4.063137275084894e-08, 'epoch': 1.94} {'loss': 0.339, 'learning_rate': 4.0601122160924825e-08, 'epoch': 1.94} {'loss': 0.4661, 'learning_rate': 4.057088281326782e-08, 'epoch': 1.94} {'loss': 0.3718, 'learning_rate': 4.054065470791235e-08, 'epoch': 1.94} {'loss': 0.2321, 'learning_rate': 4.051043784489283e-08, 'epoch': 1.94} {'loss': 0.2875, 'learning_rate': 4.0480232224243685e-08, 'epoch': 1.94} {'loss': 0.3627, 'learning_rate': 4.0450037845998214e-08, 'epoch': 1.94} {'loss': 0.4408, 'learning_rate': 4.041985471019083e-08, 'epoch': 1.94} {'loss': 0.332, 'learning_rate': 4.038968281685485e-08, 'epoch': 1.94} {'loss': 0.4395, 'learning_rate': 4.035952216602579e-08, 'epoch': 1.94} {'loss': 0.31, 'learning_rate': 4.032937275773585e-08, 'epoch': 1.94} {'loss': 0.3963, 'learning_rate': 4.029923459202167e-08, 'epoch': 1.94} {'loss': 0.2719, 'learning_rate': 4.0269107668914345e-08, 'epoch': 1.94} {'loss': 0.326, 'learning_rate': 4.023899198845049e-08, 'epoch': 1.94} {'loss': 0.1946, 'learning_rate': 4.0208887550662326e-08, 'epoch': 1.94} {'loss': 0.4055, 'learning_rate': 4.017879435558425e-08, 'epoch': 1.94} {'loss': 0.2694, 'learning_rate': 4.0148712403250686e-08, 'epoch': 1.94} {'loss': 0.4038, 'learning_rate': 4.0118641693693836e-08, 'epoch': 1.94} {'loss': 0.4301, 'learning_rate': 4.008858222695144e-08, 'epoch': 1.94} {'loss': 0.2804, 'learning_rate': 4.0058534003053486e-08, 'epoch': 1.94} {'loss': 0.2247, 'learning_rate': 4.0028497022035485e-08, 'epoch': 1.94} {'loss': 0.43, 'learning_rate': 3.999847128393186e-08, 'epoch': 1.94} {'loss': 0.4818, 'learning_rate': 3.9968456788775924e-08, 'epoch': 1.94} {'loss': 0.2478, 'learning_rate': 3.9938453536600976e-08, 'epoch': 1.94} {'loss': 0.2741, 'learning_rate': 3.9908461527442546e-08, 'epoch': 1.94} {'loss': 0.3366, 'learning_rate': 3.987848076133283e-08, 'epoch': 1.94} {'loss': 0.264, 'learning_rate': 3.984851123830624e-08, 'epoch': 1.94} {'loss': 0.1916, 'learning_rate': 3.98185529583972e-08, 'epoch': 1.94} {'loss': 0.2549, 'learning_rate': 3.978860592163902e-08, 'epoch': 1.94} {'loss': 0.2956, 'learning_rate': 3.9758670128065e-08, 'epoch': 1.94} {'loss': 0.3542, 'learning_rate': 3.9728745577709557e-08, 'epoch': 1.94} {'loss': 0.3277, 'learning_rate': 3.9698832270606e-08, 'epoch': 1.95} {'loss': 0.3175, 'learning_rate': 3.966893020678875e-08, 'epoch': 1.95} {'loss': 0.3403, 'learning_rate': 3.963903938629221e-08, 'epoch': 1.95} {'loss': 0.3283, 'learning_rate': 3.960915980914748e-08, 'epoch': 1.95} {'loss': 0.3257, 'learning_rate': 3.957929147539119e-08, 'epoch': 1.95} {'loss': 0.4509, 'learning_rate': 3.954943438505443e-08, 'epoch': 1.95} {'loss': 0.3598, 'learning_rate': 3.951958853817384e-08, 'epoch': 1.95} {'loss': 0.3393, 'learning_rate': 3.9489753934780494e-08, 'epoch': 1.95} {'loss': 0.4302, 'learning_rate': 3.945993057490993e-08, 'epoch': 1.95} {'loss': 0.2414, 'learning_rate': 3.9430118458594346e-08, 'epoch': 1.95} {'loss': 0.3058, 'learning_rate': 3.940031758586815e-08, 'epoch': 1.95} {'loss': 0.3205, 'learning_rate': 3.937052795676577e-08, 'epoch': 1.95} {'loss': 0.1384, 'learning_rate': 3.934074957131828e-08, 'epoch': 1.95} {'loss': 0.4709, 'learning_rate': 3.9310982429562325e-08, 'epoch': 1.95} {'loss': 0.2862, 'learning_rate': 3.92812265315301e-08, 'epoch': 1.95} {'loss': 0.4786, 'learning_rate': 3.9251481877254914e-08, 'epoch': 1.95} {'loss': 0.2744, 'learning_rate': 3.922174846677007e-08, 'epoch': 1.95} {'loss': 0.3927, 'learning_rate': 3.91920263001111e-08, 'epoch': 1.95} {'loss': 0.4516, 'learning_rate': 3.916231537730908e-08, 'epoch': 1.95} {'loss': 0.3388, 'learning_rate': 3.9132615698399546e-08, 'epoch': 1.95} {'loss': 0.3048, 'learning_rate': 3.910292726341469e-08, 'epoch': 1.95} {'loss': 0.2855, 'learning_rate': 3.9073250072388933e-08, 'epoch': 1.95} {'loss': 0.3073, 'learning_rate': 3.904358412535447e-08, 'epoch': 1.95} {'loss': 0.3154, 'learning_rate': 3.901392942234572e-08, 'epoch': 1.95} {'loss': 0.2202, 'learning_rate': 3.8984285963395986e-08, 'epoch': 1.95} {'loss': 0.1628, 'learning_rate': 3.8954653748539684e-08, 'epoch': 1.95} {'loss': 0.2406, 'learning_rate': 3.892503277780901e-08, 'epoch': 1.95} {'loss': 0.3497, 'learning_rate': 3.889542305123728e-08, 'epoch': 1.95} {'loss': 0.2123, 'learning_rate': 3.88658245688589e-08, 'epoch': 1.95} {'loss': 0.2551, 'learning_rate': 3.8836237330707183e-08, 'epoch': 1.95} {'loss': 0.2943, 'learning_rate': 3.880666133681432e-08, 'epoch': 1.95} {'loss': 0.294, 'learning_rate': 3.877709658721474e-08, 'epoch': 1.95} {'loss': 0.2429, 'learning_rate': 3.874754308194173e-08, 'epoch': 1.95} {'loss': 0.3019, 'learning_rate': 3.871800082102861e-08, 'epoch': 1.95} {'loss': 0.3155, 'learning_rate': 3.8688469804508687e-08, 'epoch': 1.95} {'loss': 0.3245, 'learning_rate': 3.865895003241527e-08, 'epoch': 1.95} {'loss': 0.323, 'learning_rate': 3.862944150478165e-08, 'epoch': 1.95} {'loss': 0.3781, 'learning_rate': 3.859994422164115e-08, 'epoch': 1.95} {'loss': 0.2943, 'learning_rate': 3.857045818302707e-08, 'epoch': 1.95} {'loss': 0.2136, 'learning_rate': 3.854098338897272e-08, 'epoch': 1.95} {'loss': 0.2291, 'learning_rate': 3.8511519839511404e-08, 'epoch': 1.95} {'loss': 0.3583, 'learning_rate': 3.8482067534676424e-08, 'epoch': 1.95} {'loss': 0.226, 'learning_rate': 3.845262647449999e-08, 'epoch': 1.95} {'loss': 0.3864, 'learning_rate': 3.8423196659017615e-08, 'epoch': 1.95} {'loss': 0.343, 'learning_rate': 3.839377808826039e-08, 'epoch': 1.95} {'loss': 0.2544, 'learning_rate': 3.836437076226163e-08, 'epoch': 1.95} {'loss': 0.4131, 'learning_rate': 3.8334974681056845e-08, 'epoch': 1.95} {'loss': 0.3386, 'learning_rate': 3.830558984467603e-08, 'epoch': 1.95} {'loss': 0.2152, 'learning_rate': 3.8276216253154696e-08, 'epoch': 1.95} {'loss': 0.2503, 'learning_rate': 3.824685390652505e-08, 'epoch': 1.95} {'loss': 0.2185, 'learning_rate': 3.82175028048204e-08, 'epoch': 1.95} {'loss': 0.3021, 'learning_rate': 3.8188162948074035e-08, 'epoch': 1.95} {'loss': 0.417, 'learning_rate': 3.815883433631929e-08, 'epoch': 1.95} {'loss': 0.2692, 'learning_rate': 3.812951696958722e-08, 'epoch': 1.95} {'loss': 0.2776, 'learning_rate': 3.810021084791449e-08, 'epoch': 1.95} {'loss': 0.3575, 'learning_rate': 3.8070915971331055e-08, 'epoch': 1.95} {'loss': 0.3095, 'learning_rate': 3.804163233987246e-08, 'epoch': 1.95} {'loss': 0.3468, 'learning_rate': 3.8012359953569775e-08, 'epoch': 1.95} {'loss': 0.2865, 'learning_rate': 3.798309881245632e-08, 'epoch': 1.95} {'loss': 0.1653, 'learning_rate': 3.7953848916566505e-08, 'epoch': 1.95} {'loss': 0.3442, 'learning_rate': 3.792461026593142e-08, 'epoch': 1.95} {'loss': 0.242, 'learning_rate': 3.789538286058547e-08, 'epoch': 1.95} {'loss': 0.3515, 'learning_rate': 3.786616670056087e-08, 'epoch': 1.95} {'loss': 0.2521, 'learning_rate': 3.7836961785892025e-08, 'epoch': 1.95} {'loss': 0.221, 'learning_rate': 3.780776811661002e-08, 'epoch': 1.95} {'loss': 0.3583, 'learning_rate': 3.777858569274928e-08, 'epoch': 1.95} {'loss': 0.345, 'learning_rate': 3.7749414514342e-08, 'epoch': 1.95} {'loss': 0.4105, 'learning_rate': 3.772025458142037e-08, 'epoch': 1.95} {'loss': 0.3098, 'learning_rate': 3.769110589401881e-08, 'epoch': 1.95} {'loss': 0.2476, 'learning_rate': 3.766196845216952e-08, 'epoch': 1.95} {'loss': 0.247, 'learning_rate': 3.76328422559058e-08, 'epoch': 1.95} {'loss': 0.3608, 'learning_rate': 3.7603727305259854e-08, 'epoch': 1.95} {'loss': 0.2536, 'learning_rate': 3.757462360026498e-08, 'epoch': 1.95} {'loss': 0.1579, 'learning_rate': 3.7545531140953386e-08, 'epoch': 1.95} {'loss': 0.3358, 'learning_rate': 3.7516449927359475e-08, 'epoch': 1.95} {'loss': 0.289, 'learning_rate': 3.748737995951324e-08, 'epoch': 1.95} {'loss': 0.2748, 'learning_rate': 3.7458321237451304e-08, 'epoch': 1.95} {'loss': 0.4544, 'learning_rate': 3.742927376120364e-08, 'epoch': 1.95} {'loss': 0.253, 'learning_rate': 3.7400237530803576e-08, 'epoch': 1.95} {'loss': 0.337, 'learning_rate': 3.7371212546284396e-08, 'epoch': 1.95} {'loss': 0.2283, 'learning_rate': 3.734219880767831e-08, 'epoch': 1.95} {'loss': 0.3287, 'learning_rate': 3.731319631501862e-08, 'epoch': 1.95} {'loss': 0.3117, 'learning_rate': 3.728420506833863e-08, 'epoch': 1.95} {'loss': 0.1393, 'learning_rate': 3.725522506766943e-08, 'epoch': 1.95} {'loss': 0.4286, 'learning_rate': 3.7226256313044327e-08, 'epoch': 1.95} {'loss': 0.2664, 'learning_rate': 3.719729880449663e-08, 'epoch': 1.95} {'loss': 0.2987, 'learning_rate': 3.716835254205853e-08, 'epoch': 1.95} {'loss': 0.1798, 'learning_rate': 3.713941752576333e-08, 'epoch': 1.95} {'loss': 0.4308, 'learning_rate': 3.711049375564324e-08, 'epoch': 1.95} {'loss': 0.356, 'learning_rate': 3.708158123173044e-08, 'epoch': 1.95} {'loss': 0.2356, 'learning_rate': 3.7052679954058255e-08, 'epoch': 1.95} {'loss': 0.4504, 'learning_rate': 3.702378992265887e-08, 'epoch': 1.95} {'loss': 0.2516, 'learning_rate': 3.699491113756448e-08, 'epoch': 1.95} {'loss': 0.3816, 'learning_rate': 3.696604359880951e-08, 'epoch': 1.95} {'loss': 0.2882, 'learning_rate': 3.693718730642393e-08, 'epoch': 1.95} {'loss': 0.1299, 'learning_rate': 3.690834226044327e-08, 'epoch': 1.95} {'loss': 0.4643, 'learning_rate': 3.687950846089749e-08, 'epoch': 1.95} {'loss': 0.1922, 'learning_rate': 3.685068590781993e-08, 'epoch': 1.95} {'loss': 0.246, 'learning_rate': 3.682187460124498e-08, 'epoch': 1.95} {'loss': 0.346, 'learning_rate': 3.679307454120151e-08, 'epoch': 1.95} {'loss': 0.3536, 'learning_rate': 3.676428572772506e-08, 'epoch': 1.95} {'loss': 0.2581, 'learning_rate': 3.67355081608467e-08, 'epoch': 1.95} {'loss': 0.3575, 'learning_rate': 3.6706741840600856e-08, 'epoch': 1.95} {'loss': 0.1445, 'learning_rate': 3.667798676701639e-08, 'epoch': 1.95} {'loss': 0.2652, 'learning_rate': 3.664924294012884e-08, 'epoch': 1.95} {'loss': 0.2154, 'learning_rate': 3.6620510359970385e-08, 'epoch': 1.95} {'loss': 0.2389, 'learning_rate': 3.659178902657212e-08, 'epoch': 1.95} {'loss': 0.3599, 'learning_rate': 3.6563078939966245e-08, 'epoch': 1.95} {'loss': 0.2321, 'learning_rate': 3.653438010018717e-08, 'epoch': 1.95} {'loss': 0.2519, 'learning_rate': 3.6505692507265987e-08, 'epoch': 1.95} {'loss': 0.2702, 'learning_rate': 3.6477016161234893e-08, 'epoch': 1.95} {'loss': 0.3036, 'learning_rate': 3.6448351062126074e-08, 'epoch': 1.95} {'loss': 0.4397, 'learning_rate': 3.641969720997285e-08, 'epoch': 1.95} {'loss': 0.3143, 'learning_rate': 3.639105460480741e-08, 'epoch': 1.95} {'loss': 0.3669, 'learning_rate': 3.636242324666195e-08, 'epoch': 1.95} {'loss': 0.2588, 'learning_rate': 3.633380313556867e-08, 'epoch': 1.95} {'loss': 0.1921, 'learning_rate': 3.6305194271559764e-08, 'epoch': 1.95} {'loss': 0.3281, 'learning_rate': 3.627659665466743e-08, 'epoch': 1.95} {'loss': 0.2524, 'learning_rate': 3.624801028492386e-08, 'epoch': 1.95} {'loss': 0.4286, 'learning_rate': 3.621943516236126e-08, 'epoch': 1.95} {'loss': 0.349, 'learning_rate': 3.619087128701293e-08, 'epoch': 1.95} {'loss': 0.1931, 'learning_rate': 3.6162318658911064e-08, 'epoch': 1.95} {'loss': 0.1893, 'learning_rate': 3.6133777278085644e-08, 'epoch': 1.95} {'loss': 0.1574, 'learning_rate': 3.610524714457109e-08, 'epoch': 1.95} {'loss': 0.2766, 'learning_rate': 3.607672825839958e-08, 'epoch': 1.95} {'loss': 0.2865, 'learning_rate': 3.604822061960223e-08, 'epoch': 1.95} {'loss': 0.2827, 'learning_rate': 3.601972422821121e-08, 'epoch': 1.95} {'loss': 0.3049, 'learning_rate': 3.5991239084259834e-08, 'epoch': 1.95} {'loss': 0.2999, 'learning_rate': 3.59627651877803e-08, 'epoch': 1.95} {'loss': 0.2393, 'learning_rate': 3.593430253880259e-08, 'epoch': 1.95} {'loss': 0.2967, 'learning_rate': 3.5905851137361116e-08, 'epoch': 1.95} {'loss': 0.225, 'learning_rate': 3.587741098348696e-08, 'epoch': 1.95} {'loss': 0.3904, 'learning_rate': 3.584898207721233e-08, 'epoch': 1.95} {'loss': 0.2994, 'learning_rate': 3.5820564418570516e-08, 'epoch': 1.95} {'loss': 0.1957, 'learning_rate': 3.5792158007591504e-08, 'epoch': 1.95} {'loss': 0.327, 'learning_rate': 3.5763762844308603e-08, 'epoch': 1.95} {'loss': 0.2742, 'learning_rate': 3.5735378928752896e-08, 'epoch': 1.95} {'loss': 0.3526, 'learning_rate': 3.570700626095769e-08, 'epoch': 1.95} {'loss': 0.3622, 'learning_rate': 3.567864484095518e-08, 'epoch': 1.95} {'loss': 0.3755, 'learning_rate': 3.565029466877534e-08, 'epoch': 1.95} {'loss': 0.3365, 'learning_rate': 3.5621955744452594e-08, 'epoch': 1.95} {'loss': 0.2655, 'learning_rate': 3.559362806801692e-08, 'epoch': 1.95} {'loss': 0.3818, 'learning_rate': 3.556531163950272e-08, 'epoch': 1.95} {'loss': 0.4002, 'learning_rate': 3.553700645893887e-08, 'epoch': 1.95} {'loss': 0.209, 'learning_rate': 3.550871252635979e-08, 'epoch': 1.95} {'loss': 0.3244, 'learning_rate': 3.548042984179656e-08, 'epoch': 1.95} {'loss': 0.2733, 'learning_rate': 3.545215840528027e-08, 'epoch': 1.95} {'loss': 0.441, 'learning_rate': 3.542389821684422e-08, 'epoch': 1.95} {'loss': 0.2343, 'learning_rate': 3.5395649276520614e-08, 'epoch': 1.95} {'loss': 0.3815, 'learning_rate': 3.5367411584338315e-08, 'epoch': 1.95} {'loss': 0.3158, 'learning_rate': 3.533918514033286e-08, 'epoch': 1.95} {'loss': 0.182, 'learning_rate': 3.53109699445342e-08, 'epoch': 1.95} {'loss': 0.3139, 'learning_rate': 3.5282765996975666e-08, 'epoch': 1.95} {'loss': 0.2953, 'learning_rate': 3.525457329768611e-08, 'epoch': 1.95} {'loss': 0.261, 'learning_rate': 3.522639184670107e-08, 'epoch': 1.95} {'loss': 0.3063, 'learning_rate': 3.51982216440494e-08, 'epoch': 1.95} {'loss': 0.1644, 'learning_rate': 3.5170062689764416e-08, 'epoch': 1.95} {'loss': 0.3876, 'learning_rate': 3.51419149838772e-08, 'epoch': 1.95} {'loss': 0.3169, 'learning_rate': 3.5113778526419953e-08, 'epoch': 1.95} {'loss': 0.1458, 'learning_rate': 3.508565331742486e-08, 'epoch': 1.95} {'loss': 0.2667, 'learning_rate': 3.505753935692302e-08, 'epoch': 1.95} {'loss': 0.3674, 'learning_rate': 3.502943664494551e-08, 'epoch': 1.95} {'loss': 0.2987, 'learning_rate': 3.500134518152565e-08, 'epoch': 1.95} {'loss': 0.3185, 'learning_rate': 3.4973264966694506e-08, 'epoch': 1.95} {'loss': 0.2541, 'learning_rate': 3.494519600048207e-08, 'epoch': 1.95} {'loss': 0.3167, 'learning_rate': 3.4917138282923866e-08, 'epoch': 1.95} {'loss': 0.4428, 'learning_rate': 3.4889091814047646e-08, 'epoch': 1.95} {'loss': 0.2455, 'learning_rate': 3.4861056593886723e-08, 'epoch': 1.95} {'loss': 0.2897, 'learning_rate': 3.4833032622473285e-08, 'epoch': 1.95} {'loss': 0.289, 'learning_rate': 3.480501989983842e-08, 'epoch': 1.95} {'loss': 0.4086, 'learning_rate': 3.477701842601322e-08, 'epoch': 1.95} {'loss': 0.2405, 'learning_rate': 3.4749028201029874e-08, 'epoch': 1.95} {'loss': 0.2413, 'learning_rate': 3.472104922492059e-08, 'epoch': 1.95} {'loss': 0.2938, 'learning_rate': 3.469308149771533e-08, 'epoch': 1.95} {'loss': 0.3176, 'learning_rate': 3.466512501944741e-08, 'epoch': 1.95} {'loss': 0.2257, 'learning_rate': 3.4637179790146805e-08, 'epoch': 1.95} {'loss': 0.3809, 'learning_rate': 3.4609245809846816e-08, 'epoch': 1.95} {'loss': 0.2009, 'learning_rate': 3.4581323078577424e-08, 'epoch': 1.95} {'loss': 0.3778, 'learning_rate': 3.4553411596370825e-08, 'epoch': 1.95} {'loss': 0.278, 'learning_rate': 3.45255113632581e-08, 'epoch': 1.95} {'loss': 0.1387, 'learning_rate': 3.4497622379270345e-08, 'epoch': 1.95} {'loss': 0.2094, 'learning_rate': 3.446974464444086e-08, 'epoch': 1.95} {'loss': 0.2544, 'learning_rate': 3.4441878158799625e-08, 'epoch': 1.95} {'loss': 0.1686, 'learning_rate': 3.441402292237883e-08, 'epoch': 1.95} {'loss': 0.2826, 'learning_rate': 3.438617893520957e-08, 'epoch': 1.95} {'loss': 0.2364, 'learning_rate': 3.435834619732292e-08, 'epoch': 1.95} {'loss': 0.2547, 'learning_rate': 3.433052470875109e-08, 'epoch': 1.95} {'loss': 0.3266, 'learning_rate': 3.430271446952405e-08, 'epoch': 1.95} {'loss': 0.4124, 'learning_rate': 3.42749154796751e-08, 'epoch': 1.95} {'loss': 0.4191, 'learning_rate': 3.424712773923422e-08, 'epoch': 1.95} {'loss': 0.2824, 'learning_rate': 3.421935124823361e-08, 'epoch': 1.95} {'loss': 0.1393, 'learning_rate': 3.419158600670436e-08, 'epoch': 1.95} {'loss': 0.4046, 'learning_rate': 3.4163832014677546e-08, 'epoch': 1.95} {'loss': 0.3403, 'learning_rate': 3.413608927218426e-08, 'epoch': 1.95} {'loss': 0.1206, 'learning_rate': 3.4108357779256694e-08, 'epoch': 1.95} {'loss': 0.3288, 'learning_rate': 3.4080637535925944e-08, 'epoch': 1.95} {'loss': 0.2206, 'learning_rate': 3.405292854222198e-08, 'epoch': 1.95} {'loss': 0.4255, 'learning_rate': 3.40252307981781e-08, 'epoch': 1.95} {'loss': 0.241, 'learning_rate': 3.399754430382429e-08, 'epoch': 1.95} {'loss': 0.3285, 'learning_rate': 3.396986905919164e-08, 'epoch': 1.95} {'loss': 0.535, 'learning_rate': 3.394220506431345e-08, 'epoch': 1.95} {'loss': 0.3502, 'learning_rate': 3.3914552319217474e-08, 'epoch': 1.95} {'loss': 0.1465, 'learning_rate': 3.388691082393813e-08, 'epoch': 1.95} {'loss': 0.3565, 'learning_rate': 3.3859280578504295e-08, 'epoch': 1.95} {'loss': 0.3397, 'learning_rate': 3.383166158294926e-08, 'epoch': 1.95} {'loss': 0.3282, 'learning_rate': 3.380405383730301e-08, 'epoch': 1.95} {'loss': 0.3088, 'learning_rate': 3.377645734159662e-08, 'epoch': 1.95} {'loss': 0.2495, 'learning_rate': 3.37488720958612e-08, 'epoch': 1.95} {'loss': 0.2713, 'learning_rate': 3.372129810012781e-08, 'epoch': 1.95} {'loss': 0.3732, 'learning_rate': 3.369373535442866e-08, 'epoch': 1.95} {'loss': 0.43, 'learning_rate': 3.366618385879372e-08, 'epoch': 1.95} {'loss': 0.3905, 'learning_rate': 3.363864361325519e-08, 'epoch': 1.95} {'loss': 0.2369, 'learning_rate': 3.3611114617841944e-08, 'epoch': 1.95} {'loss': 0.3518, 'learning_rate': 3.358359687258728e-08, 'epoch': 1.95} {'loss': 0.1612, 'learning_rate': 3.3556090377522275e-08, 'epoch': 1.95} {'loss': 0.2529, 'learning_rate': 3.3528595132675815e-08, 'epoch': 1.95} {'loss': 0.2306, 'learning_rate': 3.350111113808119e-08, 'epoch': 1.95} {'loss': 0.3302, 'learning_rate': 3.3473638393769493e-08, 'epoch': 1.95} {'loss': 0.2537, 'learning_rate': 3.3446176899769586e-08, 'epoch': 1.95} {'loss': 0.3037, 'learning_rate': 3.3418726656113675e-08, 'epoch': 1.95} {'loss': 0.3403, 'learning_rate': 3.339128766283284e-08, 'epoch': 1.95} {'loss': 0.2276, 'learning_rate': 3.336385991995927e-08, 'epoch': 1.95} {'loss': 0.3128, 'learning_rate': 3.3336443427520736e-08, 'epoch': 1.95} {'loss': 0.293, 'learning_rate': 3.330903818555164e-08, 'epoch': 1.95} {'loss': 0.1141, 'learning_rate': 3.328164419408086e-08, 'epoch': 1.95} {'loss': 0.3433, 'learning_rate': 3.325426145313948e-08, 'epoch': 1.95} {'loss': 0.3503, 'learning_rate': 3.322688996275858e-08, 'epoch': 1.95} {'loss': 0.1595, 'learning_rate': 3.319952972297036e-08, 'epoch': 1.95} {'loss': 0.4392, 'learning_rate': 3.3172180733803686e-08, 'epoch': 1.95} {'loss': 0.4005, 'learning_rate': 3.314484299529075e-08, 'epoch': 1.95} {'loss': 0.3258, 'learning_rate': 3.311751650746153e-08, 'epoch': 1.95} {'loss': 0.2918, 'learning_rate': 3.3090201270348235e-08, 'epoch': 1.95} {'loss': 0.3224, 'learning_rate': 3.3062897283979714e-08, 'epoch': 1.95} {'loss': 0.2955, 'learning_rate': 3.303560454838928e-08, 'epoch': 1.95} {'loss': 0.3391, 'learning_rate': 3.3008323063604684e-08, 'epoch': 1.95} {'loss': 0.3162, 'learning_rate': 3.2981052829660354e-08, 'epoch': 1.95} {'loss': 0.2261, 'learning_rate': 3.295379384658292e-08, 'epoch': 1.95} {'loss': 0.3747, 'learning_rate': 3.292654611440682e-08, 'epoch': 1.95} {'loss': 0.2152, 'learning_rate': 3.2899309633160905e-08, 'epoch': 1.95} {'loss': 0.3462, 'learning_rate': 3.287208440287626e-08, 'epoch': 1.95} {'loss': 0.4095, 'learning_rate': 3.284487042358398e-08, 'epoch': 1.95} {'loss': 0.4588, 'learning_rate': 3.2817667695314027e-08, 'epoch': 1.95} {'loss': 0.3244, 'learning_rate': 3.279047621809861e-08, 'epoch': 1.95} {'loss': 0.2684, 'learning_rate': 3.2763295991965484e-08, 'epoch': 1.95} {'loss': 0.2333, 'learning_rate': 3.273612701694906e-08, 'epoch': 1.95} {'loss': 0.4047, 'learning_rate': 3.27089692930771e-08, 'epoch': 1.95} {'loss': 0.2771, 'learning_rate': 3.2681822820381794e-08, 'epoch': 1.95} {'loss': 0.2878, 'learning_rate': 3.265468759889312e-08, 'epoch': 1.95} {'loss': 0.3364, 'learning_rate': 3.262756362864217e-08, 'epoch': 1.95} {'loss': 0.2931, 'learning_rate': 3.260045090965891e-08, 'epoch': 1.95} {'loss': 0.2993, 'learning_rate': 3.2573349441975544e-08, 'epoch': 1.95} {'loss': 0.3944, 'learning_rate': 3.2546259225619824e-08, 'epoch': 1.95} {'loss': 0.2823, 'learning_rate': 3.251918026062506e-08, 'epoch': 1.95} {'loss': 0.3173, 'learning_rate': 3.249211254702012e-08, 'epoch': 1.95} {'loss': 0.3278, 'learning_rate': 3.246505608483719e-08, 'epoch': 1.95} {'loss': 0.2595, 'learning_rate': 3.243801087410514e-08, 'epoch': 1.95} {'loss': 0.3886, 'learning_rate': 3.2410976914855064e-08, 'epoch': 1.95} {'loss': 0.3265, 'learning_rate': 3.238395420711804e-08, 'epoch': 1.95} {'loss': 0.3108, 'learning_rate': 3.2356942750922936e-08, 'epoch': 1.95} {'loss': 0.3812, 'learning_rate': 3.232994254630195e-08, 'epoch': 1.95} {'loss': 0.3096, 'learning_rate': 3.230295359328506e-08, 'epoch': 1.95} {'loss': 0.2072, 'learning_rate': 3.2275975891903346e-08, 'epoch': 1.95} {'loss': 0.3824, 'learning_rate': 3.2249009442185675e-08, 'epoch': 1.95} {'loss': 0.3377, 'learning_rate': 3.222205424416425e-08, 'epoch': 1.95} {'loss': 0.4396, 'learning_rate': 3.2195110297867924e-08, 'epoch': 1.95} {'loss': 0.3988, 'learning_rate': 3.216817760332891e-08, 'epoch': 1.95} {'loss': 0.3211, 'learning_rate': 3.2141256160576064e-08, 'epoch': 1.95} {'loss': 0.3504, 'learning_rate': 3.211434596963936e-08, 'epoch': 1.95} {'loss': 0.2053, 'learning_rate': 3.2087447030551e-08, 'epoch': 1.95} {'loss': 0.3962, 'learning_rate': 3.206055934333985e-08, 'epoch': 1.95} {'loss': 0.2338, 'learning_rate': 3.20336829080381e-08, 'epoch': 1.95} {'loss': 0.3257, 'learning_rate': 3.2006817724673514e-08, 'epoch': 1.95} {'loss': 0.3513, 'learning_rate': 3.197996379327828e-08, 'epoch': 1.95} {'loss': 0.3017, 'learning_rate': 3.195312111388127e-08, 'epoch': 1.95} {'loss': 0.4808, 'learning_rate': 3.192628968651468e-08, 'epoch': 1.95} {'loss': 0.3879, 'learning_rate': 3.189946951120737e-08, 'epoch': 1.95} {'loss': 0.3266, 'learning_rate': 3.1872660587990434e-08, 'epoch': 1.95} {'loss': 0.4139, 'learning_rate': 3.1845862916893844e-08, 'epoch': 1.95} {'loss': 0.2724, 'learning_rate': 3.1819076497947574e-08, 'epoch': 1.95} {'loss': 0.3875, 'learning_rate': 3.179230133118161e-08, 'epoch': 1.95} {'loss': 0.2429, 'learning_rate': 3.176553741662702e-08, 'epoch': 1.95} {'loss': 0.2298, 'learning_rate': 3.1738784754313804e-08, 'epoch': 1.95} {'loss': 0.372, 'learning_rate': 3.17120433442708e-08, 'epoch': 1.95} {'loss': 0.3751, 'learning_rate': 3.1685313186530233e-08, 'epoch': 1.95} {'loss': 0.329, 'learning_rate': 3.1658594281120946e-08, 'epoch': 1.95} {'loss': 0.4886, 'learning_rate': 3.1631886628074035e-08, 'epoch': 1.95} {'loss': 0.3018, 'learning_rate': 3.160519022741948e-08, 'epoch': 1.95} {'loss': 0.2681, 'learning_rate': 3.157850507918614e-08, 'epoch': 1.95} {'loss': 0.3385, 'learning_rate': 3.15518311834051e-08, 'epoch': 1.95} {'loss': 0.2523, 'learning_rate': 3.1525168540107455e-08, 'epoch': 1.95} {'loss': 0.3178, 'learning_rate': 3.149851714932206e-08, 'epoch': 1.95} {'loss': 0.3655, 'learning_rate': 3.14718770110789e-08, 'epoch': 1.95} {'loss': 0.2808, 'learning_rate': 3.144524812540795e-08, 'epoch': 1.95} {'loss': 0.3854, 'learning_rate': 3.141863049234028e-08, 'epoch': 1.95} {'loss': 0.3773, 'learning_rate': 3.139202411190589e-08, 'epoch': 1.95} {'loss': 0.4309, 'learning_rate': 3.136542898413253e-08, 'epoch': 1.95} {'loss': 0.4142, 'learning_rate': 3.1338845109053494e-08, 'epoch': 1.95} {'loss': 0.359, 'learning_rate': 3.131227248669655e-08, 'epoch': 1.95} {'loss': 0.2829, 'learning_rate': 3.128571111709278e-08, 'epoch': 1.95} {'loss': 0.1649, 'learning_rate': 3.125916100027215e-08, 'epoch': 1.95} {'loss': 0.2706, 'learning_rate': 3.1232622136263545e-08, 'epoch': 1.95} {'loss': 0.2063, 'learning_rate': 3.120609452509804e-08, 'epoch': 1.95} {'loss': 0.2756, 'learning_rate': 3.117957816680561e-08, 'epoch': 1.95} {'loss': 0.3844, 'learning_rate': 3.115307306141513e-08, 'epoch': 1.95} {'loss': 0.2782, 'learning_rate': 3.1126579208957674e-08, 'epoch': 1.95} {'loss': 0.3683, 'learning_rate': 3.1100096609462114e-08, 'epoch': 1.95} {'loss': 0.3027, 'learning_rate': 3.107362526295843e-08, 'epoch': 1.95} {'loss': 0.24, 'learning_rate': 3.104716516947881e-08, 'epoch': 1.95} {'loss': 0.3586, 'learning_rate': 3.1020716329049906e-08, 'epoch': 1.95} {'loss': 0.2924, 'learning_rate': 3.09942787417028e-08, 'epoch': 1.95} {'loss': 0.2552, 'learning_rate': 3.096785240746747e-08, 'epoch': 1.95} {'loss': 0.3657, 'learning_rate': 3.0941437326373894e-08, 'epoch': 1.95} {'loss': 0.3714, 'learning_rate': 3.091503349845204e-08, 'epoch': 1.95} {'loss': 0.2348, 'learning_rate': 3.0888640923730785e-08, 'epoch': 1.95} {'loss': 0.3973, 'learning_rate': 3.086225960224121e-08, 'epoch': 1.95} {'loss': 0.413, 'learning_rate': 3.083588953401217e-08, 'epoch': 1.95} {'loss': 0.2051, 'learning_rate': 3.0809530719073663e-08, 'epoch': 1.95} {'loss': 0.3246, 'learning_rate': 3.0783183157455657e-08, 'epoch': 1.95} {'loss': 0.2566, 'learning_rate': 3.0756846849187004e-08, 'epoch': 1.95} {'loss': 0.3466, 'learning_rate': 3.073052179429881e-08, 'epoch': 1.95} {'loss': 0.3284, 'learning_rate': 3.0704207992821033e-08, 'epoch': 1.95} {'loss': 0.2067, 'learning_rate': 3.0677905444780334e-08, 'epoch': 1.95} {'loss': 0.502, 'learning_rate': 3.065161415021001e-08, 'epoch': 1.95} {'loss': 0.3223, 'learning_rate': 3.062533410913782e-08, 'epoch': 1.95} {'loss': 0.3084, 'learning_rate': 3.059906532159373e-08, 'epoch': 1.95} {'loss': 0.2596, 'learning_rate': 3.0572807787607736e-08, 'epoch': 1.95} {'loss': 0.1991, 'learning_rate': 3.0546561507208693e-08, 'epoch': 1.95} {'loss': 0.2586, 'learning_rate': 3.052032648042769e-08, 'epoch': 1.95} {'loss': 0.2827, 'learning_rate': 3.049410270729247e-08, 'epoch': 1.95} {'loss': 0.2306, 'learning_rate': 3.046789018783525e-08, 'epoch': 1.95} {'loss': 0.262, 'learning_rate': 3.0441688922082656e-08, 'epoch': 1.95} {'loss': 0.2065, 'learning_rate': 3.041549891006579e-08, 'epoch': 1.95} {'loss': 0.3261, 'learning_rate': 3.038932015181351e-08, 'epoch': 1.95} {'loss': 0.3114, 'learning_rate': 3.0363152647356895e-08, 'epoch': 1.95} {'loss': 0.3516, 'learning_rate': 3.033699639672372e-08, 'epoch': 1.95} {'loss': 0.2323, 'learning_rate': 3.031085139994505e-08, 'epoch': 1.95} {'loss': 0.3786, 'learning_rate': 3.0284717657048654e-08, 'epoch': 1.95} {'loss': 0.3436, 'learning_rate': 3.025859516806673e-08, 'epoch': 1.95} {'loss': 0.3174, 'learning_rate': 3.0232483933024805e-08, 'epoch': 1.95} {'loss': 0.3231, 'learning_rate': 3.020638395195619e-08, 'epoch': 1.95} {'loss': 0.3901, 'learning_rate': 3.0180295224887526e-08, 'epoch': 1.95} {'loss': 0.3194, 'learning_rate': 3.01542177518499e-08, 'epoch': 1.95} {'loss': 0.3488, 'learning_rate': 3.012815153287329e-08, 'epoch': 1.95} {'loss': 0.3485, 'learning_rate': 3.010209656798435e-08, 'epoch': 1.95} {'loss': 0.2852, 'learning_rate': 3.0076052857216375e-08, 'epoch': 1.95} {'loss': 0.3202, 'learning_rate': 3.00500204005949e-08, 'epoch': 1.95} {'loss': 0.2496, 'learning_rate': 3.002399919815213e-08, 'epoch': 1.95} {'loss': 0.2373, 'learning_rate': 2.9997989249915815e-08, 'epoch': 1.95} {'loss': 0.2885, 'learning_rate': 2.997199055591593e-08, 'epoch': 1.95} {'loss': 0.3722, 'learning_rate': 2.994600311618134e-08, 'epoch': 1.95} {'loss': 0.285, 'learning_rate': 2.992002693074314e-08, 'epoch': 1.95} {'loss': 0.3644, 'learning_rate': 2.9894061999627963e-08, 'epoch': 1.95} {'loss': 0.1692, 'learning_rate': 2.9868108322866905e-08, 'epoch': 1.95} {'loss': 0.3214, 'learning_rate': 2.9842165900488826e-08, 'epoch': 1.95} {'loss': 0.273, 'learning_rate': 2.981623473252371e-08, 'epoch': 1.95} {'loss': 0.1824, 'learning_rate': 2.9790314818999298e-08, 'epoch': 1.95} {'loss': 0.2129, 'learning_rate': 2.9764406159946692e-08, 'epoch': 1.95} {'loss': 0.2598, 'learning_rate': 2.9738508755393635e-08, 'epoch': 1.95} {'loss': 0.2943, 'learning_rate': 2.9712622605369003e-08, 'epoch': 1.95} {'loss': 0.2602, 'learning_rate': 2.9686747709903874e-08, 'epoch': 1.95} {'loss': 0.158, 'learning_rate': 2.9660884069026008e-08, 'epoch': 1.95} {'loss': 0.2067, 'learning_rate': 2.963503168276538e-08, 'epoch': 1.95} {'loss': 0.2979, 'learning_rate': 2.9609190551150857e-08, 'epoch': 1.95} {'loss': 0.3704, 'learning_rate': 2.9583360674211303e-08, 'epoch': 1.95} {'loss': 0.2425, 'learning_rate': 2.9557542051976696e-08, 'epoch': 1.95} {'loss': 0.3592, 'learning_rate': 2.953173468447479e-08, 'epoch': 1.95} {'loss': 0.2926, 'learning_rate': 2.950593857173667e-08, 'epoch': 1.95} {'loss': 0.2414, 'learning_rate': 2.9480153713788983e-08, 'epoch': 1.95} {'loss': 0.3073, 'learning_rate': 2.9454380110663927e-08, 'epoch': 1.95} {'loss': 0.3864, 'learning_rate': 2.9428617762387034e-08, 'epoch': 1.95} {'loss': 0.314, 'learning_rate': 2.9402866668990505e-08, 'epoch': 1.95} {'loss': 0.281, 'learning_rate': 2.937712683050209e-08, 'epoch': 1.95} {'loss': 0.3385, 'learning_rate': 2.9351398246950656e-08, 'epoch': 1.95} {'loss': 0.1688, 'learning_rate': 2.9325680918365074e-08, 'epoch': 1.95} {'loss': 0.1285, 'learning_rate': 2.9299974844775313e-08, 'epoch': 1.95} {'loss': 0.2483, 'learning_rate': 2.9274280026210245e-08, 'epoch': 1.95} {'loss': 0.437, 'learning_rate': 2.924859646269762e-08, 'epoch': 1.95} {'loss': 0.3332, 'learning_rate': 2.922292415426742e-08, 'epoch': 1.95} {'loss': 0.2968, 'learning_rate': 2.9197263100949613e-08, 'epoch': 1.95} {'loss': 0.4348, 'learning_rate': 2.9171613302770852e-08, 'epoch': 1.95} {'loss': 0.2163, 'learning_rate': 2.9145974759761108e-08, 'epoch': 1.95} {'loss': 0.381, 'learning_rate': 2.912034747195036e-08, 'epoch': 1.95} {'loss': 0.3581, 'learning_rate': 2.9094731439366363e-08, 'epoch': 1.95} {'loss': 0.3055, 'learning_rate': 2.9069126662039093e-08, 'epoch': 1.95} {'loss': 0.3274, 'learning_rate': 2.9043533139995195e-08, 'epoch': 1.95} {'loss': 0.1838, 'learning_rate': 2.9017950873265756e-08, 'epoch': 1.95} {'loss': 0.3573, 'learning_rate': 2.899237986187964e-08, 'epoch': 1.95} {'loss': 0.2368, 'learning_rate': 2.8966820105864602e-08, 'epoch': 1.95} {'loss': 0.3542, 'learning_rate': 2.894127160524951e-08, 'epoch': 1.95} {'loss': 0.4515, 'learning_rate': 2.891573436006434e-08, 'epoch': 1.95} {'loss': 0.2372, 'learning_rate': 2.8890208370336846e-08, 'epoch': 1.95} {'loss': 0.2751, 'learning_rate': 2.8864693636095898e-08, 'epoch': 1.95} {'loss': 0.3342, 'learning_rate': 2.8839190157371468e-08, 'epoch': 1.95} {'loss': 0.2847, 'learning_rate': 2.8813697934190198e-08, 'epoch': 1.95} {'loss': 0.3117, 'learning_rate': 2.8788216966583183e-08, 'epoch': 1.95} {'loss': 0.1919, 'learning_rate': 2.876274725457817e-08, 'epoch': 1.95} {'loss': 0.3004, 'learning_rate': 2.8737288798204033e-08, 'epoch': 1.95} {'loss': 0.375, 'learning_rate': 2.8711841597488523e-08, 'epoch': 1.95} {'loss': 0.4681, 'learning_rate': 2.8686405652461614e-08, 'epoch': 1.95} {'loss': 0.1816, 'learning_rate': 2.8660980963152172e-08, 'epoch': 1.95} {'loss': 0.3482, 'learning_rate': 2.863556752958796e-08, 'epoch': 1.95} {'loss': 0.2286, 'learning_rate': 2.8610165351797836e-08, 'epoch': 1.95} {'loss': 0.336, 'learning_rate': 2.8584774429810668e-08, 'epoch': 1.95} {'loss': 0.1894, 'learning_rate': 2.8559394763655323e-08, 'epoch': 1.95} {'loss': 0.32, 'learning_rate': 2.8534026353359558e-08, 'epoch': 1.95} {'loss': 0.4515, 'learning_rate': 2.8508669198953343e-08, 'epoch': 1.95} {'loss': 0.2577, 'learning_rate': 2.8483323300465547e-08, 'epoch': 1.95} {'loss': 0.2125, 'learning_rate': 2.8457988657922818e-08, 'epoch': 1.95} {'loss': 0.2158, 'learning_rate': 2.843266527135513e-08, 'epoch': 1.95} {'loss': 0.3019, 'learning_rate': 2.840735314079135e-08, 'epoch': 1.95} {'loss': 0.358, 'learning_rate': 2.838205226625812e-08, 'epoch': 1.95} {'loss': 0.1966, 'learning_rate': 2.835676264778653e-08, 'epoch': 1.95} {'loss': 0.3423, 'learning_rate': 2.833148428540322e-08, 'epoch': 1.95} {'loss': 0.2212, 'learning_rate': 2.8306217179138173e-08, 'epoch': 1.95} {'loss': 0.2856, 'learning_rate': 2.828096132901803e-08, 'epoch': 1.95} {'loss': 0.2562, 'learning_rate': 2.825571673507388e-08, 'epoch': 1.95} {'loss': 0.128, 'learning_rate': 2.8230483397332363e-08, 'epoch': 1.95} {'loss': 0.3179, 'learning_rate': 2.8205261315822353e-08, 'epoch': 1.95} {'loss': 0.2341, 'learning_rate': 2.8180050490571596e-08, 'epoch': 1.95} {'loss': 0.2282, 'learning_rate': 2.8154850921610077e-08, 'epoch': 1.95} {'loss': 0.2627, 'learning_rate': 2.8129662608965545e-08, 'epoch': 1.95} {'loss': 0.2962, 'learning_rate': 2.810448555266576e-08, 'epoch': 1.95} {'loss': 0.3132, 'learning_rate': 2.8079319752740696e-08, 'epoch': 1.95} {'loss': 0.3466, 'learning_rate': 2.8054165209217e-08, 'epoch': 1.95} {'loss': 0.205, 'learning_rate': 2.8029021922124644e-08, 'epoch': 1.95} {'loss': 0.2785, 'learning_rate': 2.8003889891491385e-08, 'epoch': 1.95} {'loss': 0.161, 'learning_rate': 2.7978769117344984e-08, 'epoch': 1.95} {'loss': 0.249, 'learning_rate': 2.79536595997143e-08, 'epoch': 1.95} {'loss': 0.3494, 'learning_rate': 2.792856133862709e-08, 'epoch': 1.95} {'loss': 0.2039, 'learning_rate': 2.7903474334113335e-08, 'epoch': 1.95} {'loss': 0.2687, 'learning_rate': 2.7878398586199674e-08, 'epoch': 1.95} {'loss': 0.2452, 'learning_rate': 2.7853334094914974e-08, 'epoch': 1.95} {'loss': 0.263, 'learning_rate': 2.7828280860288102e-08, 'epoch': 1.95} {'loss': 0.3052, 'learning_rate': 2.7803238882346817e-08, 'epoch': 1.95} {'loss': 0.1861, 'learning_rate': 2.777820816111776e-08, 'epoch': 1.95} {'loss': 0.1456, 'learning_rate': 2.7753188696633126e-08, 'epoch': 1.95} {'loss': 0.3536, 'learning_rate': 2.7728180488917343e-08, 'epoch': 1.95} {'loss': 0.2049, 'learning_rate': 2.770318353800039e-08, 'epoch': 1.95} {'loss': 0.2394, 'learning_rate': 2.7678197843910014e-08, 'epoch': 1.95} {'loss': 0.3174, 'learning_rate': 2.765322340667509e-08, 'epoch': 1.95} {'loss': 0.2156, 'learning_rate': 2.7628260226323367e-08, 'epoch': 1.95} {'loss': 0.3507, 'learning_rate': 2.7603308302882602e-08, 'epoch': 1.95} {'loss': 0.3043, 'learning_rate': 2.7578367636382774e-08, 'epoch': 1.95} {'loss': 0.4377, 'learning_rate': 2.7553438226848307e-08, 'epoch': 1.95} {'loss': 0.3317, 'learning_rate': 2.7528520074311392e-08, 'epoch': 1.95} {'loss': 0.3693, 'learning_rate': 2.7503613178797573e-08, 'epoch': 1.95} {'loss': 0.3398, 'learning_rate': 2.747871754033682e-08, 'epoch': 1.95} {'loss': 0.3493, 'learning_rate': 2.7453833158954668e-08, 'epoch': 1.95} {'loss': 0.3196, 'learning_rate': 2.7428960034682205e-08, 'epoch': 1.95} {'loss': 0.2569, 'learning_rate': 2.7404098167544966e-08, 'epoch': 1.95} {'loss': 0.303, 'learning_rate': 2.737924755757293e-08, 'epoch': 1.95} {'loss': 0.3576, 'learning_rate': 2.7354408204792736e-08, 'epoch': 1.95} {'loss': 0.27, 'learning_rate': 2.7329580109234367e-08, 'epoch': 1.95} {'loss': 0.3355, 'learning_rate': 2.7304763270923352e-08, 'epoch': 1.95} {'loss': 0.3083, 'learning_rate': 2.727995768988856e-08, 'epoch': 1.95} {'loss': 0.0944, 'learning_rate': 2.7255163366158854e-08, 'epoch': 1.95} {'loss': 0.3045, 'learning_rate': 2.7230380299761994e-08, 'epoch': 1.95} {'loss': 0.3023, 'learning_rate': 2.7205608490724623e-08, 'epoch': 1.95} {'loss': 0.2304, 'learning_rate': 2.7180847939076717e-08, 'epoch': 1.95} {'loss': 0.2564, 'learning_rate': 2.715609864484492e-08, 'epoch': 1.95} {'loss': 0.2536, 'learning_rate': 2.713136060805699e-08, 'epoch': 1.95} {'loss': 0.2665, 'learning_rate': 2.710663382874179e-08, 'epoch': 1.95} {'loss': 0.3736, 'learning_rate': 2.708191830692597e-08, 'epoch': 1.95} {'loss': 0.2506, 'learning_rate': 2.70572140426395e-08, 'epoch': 1.95} {'loss': 0.218, 'learning_rate': 2.703252103590792e-08, 'epoch': 1.95} {'loss': 0.3634, 'learning_rate': 2.7007839286761205e-08, 'epoch': 1.95} {'loss': 0.3075, 'learning_rate': 2.698316879522489e-08, 'epoch': 1.95} {'loss': 0.2039, 'learning_rate': 2.695850956133006e-08, 'epoch': 1.95} {'loss': 0.3071, 'learning_rate': 2.693386158510114e-08, 'epoch': 1.95} {'loss': 0.2665, 'learning_rate': 2.6909224866566998e-08, 'epoch': 1.95} {'loss': 0.3774, 'learning_rate': 2.6884599405757604e-08, 'epoch': 1.95} {'loss': 0.3752, 'learning_rate': 2.6859985202697392e-08, 'epoch': 1.95} {'loss': 0.2534, 'learning_rate': 2.683538225741633e-08, 'epoch': 1.95} {'loss': 0.1574, 'learning_rate': 2.681079056994218e-08, 'epoch': 1.95} {'loss': 0.2579, 'learning_rate': 2.6786210140301584e-08, 'epoch': 1.95} {'loss': 0.2837, 'learning_rate': 2.6761640968522297e-08, 'epoch': 1.95} {'loss': 0.2621, 'learning_rate': 2.6737083054633185e-08, 'epoch': 1.95} {'loss': 0.22, 'learning_rate': 2.6712536398662002e-08, 'epoch': 1.95} {'loss': 0.3315, 'learning_rate': 2.6688001000635398e-08, 'epoch': 1.95} {'loss': 0.2776, 'learning_rate': 2.6663476860581128e-08, 'epoch': 1.95} {'loss': 0.3021, 'learning_rate': 2.6638963978528055e-08, 'epoch': 1.95} {'loss': 0.3146, 'learning_rate': 2.6614462354502824e-08, 'epoch': 1.95} {'loss': 0.4088, 'learning_rate': 2.6589971988533192e-08, 'epoch': 1.96} {'loss': 0.233, 'learning_rate': 2.6565492880646915e-08, 'epoch': 1.96} {'loss': 0.2881, 'learning_rate': 2.6541025030870636e-08, 'epoch': 1.96} {'loss': 0.3148, 'learning_rate': 2.6516568439234334e-08, 'epoch': 1.96} {'loss': 0.2319, 'learning_rate': 2.6492123105764656e-08, 'epoch': 1.96} {'loss': 0.423, 'learning_rate': 2.6467689030488242e-08, 'epoch': 1.96} {'loss': 0.2658, 'learning_rate': 2.644326621343285e-08, 'epoch': 1.96} {'loss': 0.2649, 'learning_rate': 2.6418854654626237e-08, 'epoch': 1.96} {'loss': 0.2629, 'learning_rate': 2.6394454354097267e-08, 'epoch': 1.96} {'loss': 0.3485, 'learning_rate': 2.6370065311871474e-08, 'epoch': 1.96} {'loss': 0.2957, 'learning_rate': 2.6345687527977724e-08, 'epoch': 1.96} {'loss': 0.2404, 'learning_rate': 2.632132100244267e-08, 'epoch': 1.96} {'loss': 0.3396, 'learning_rate': 2.6296965735295166e-08, 'epoch': 1.96} {'loss': 0.1604, 'learning_rate': 2.6272621726560753e-08, 'epoch': 1.96} {'loss': 0.3607, 'learning_rate': 2.6248288976268298e-08, 'epoch': 1.96} {'loss': 0.239, 'learning_rate': 2.6223967484445555e-08, 'epoch': 1.96} {'loss': 0.2547, 'learning_rate': 2.619965725111917e-08, 'epoch': 1.96} {'loss': 0.3113, 'learning_rate': 2.617535827631579e-08, 'epoch': 1.96} {'loss': 0.416, 'learning_rate': 2.6151070560065384e-08, 'epoch': 1.96} {'loss': 0.2309, 'learning_rate': 2.6126794102392384e-08, 'epoch': 1.96} {'loss': 0.3059, 'learning_rate': 2.6102528903326764e-08, 'epoch': 1.96} {'loss': 0.2974, 'learning_rate': 2.6078274962892948e-08, 'epoch': 1.96} {'loss': 0.3362, 'learning_rate': 2.6054032281122023e-08, 'epoch': 1.96} {'loss': 0.2887, 'learning_rate': 2.602980085803841e-08, 'epoch': 1.96} {'loss': 0.4368, 'learning_rate': 2.6005580693670985e-08, 'epoch': 1.96} {'loss': 0.4169, 'learning_rate': 2.5981371788047494e-08, 'epoch': 1.96} {'loss': 0.3405, 'learning_rate': 2.5957174141192367e-08, 'epoch': 1.96} {'loss': 0.3158, 'learning_rate': 2.5932987753136685e-08, 'epoch': 1.96} {'loss': 0.3505, 'learning_rate': 2.5908812623904878e-08, 'epoch': 1.96} {'loss': 0.3302, 'learning_rate': 2.588464875352581e-08, 'epoch': 1.96} {'loss': 0.1893, 'learning_rate': 2.5860496142026124e-08, 'epoch': 1.96} {'loss': 0.2547, 'learning_rate': 2.5836354789433583e-08, 'epoch': 1.96} {'loss': 0.2298, 'learning_rate': 2.5812224695774825e-08, 'epoch': 1.96} {'loss': 0.3767, 'learning_rate': 2.5788105861077607e-08, 'epoch': 1.96} {'loss': 0.3871, 'learning_rate': 2.5763998285368574e-08, 'epoch': 1.96} {'loss': 0.391, 'learning_rate': 2.5739901968676595e-08, 'epoch': 1.96} {'loss': 0.3383, 'learning_rate': 2.5715816911026092e-08, 'epoch': 1.96} {'loss': 0.2371, 'learning_rate': 2.5691743112445933e-08, 'epoch': 1.96} {'loss': 0.1942, 'learning_rate': 2.5667680572963872e-08, 'epoch': 1.96} {'loss': 0.3956, 'learning_rate': 2.5643629292605443e-08, 'epoch': 1.96} {'loss': 0.1407, 'learning_rate': 2.5619589271398404e-08, 'epoch': 1.96} {'loss': 0.1904, 'learning_rate': 2.559556050937051e-08, 'epoch': 1.96} {'loss': 0.3658, 'learning_rate': 2.5571543006549516e-08, 'epoch': 1.96} {'loss': 0.2877, 'learning_rate': 2.5547536762960956e-08, 'epoch': 1.96} {'loss': 0.3393, 'learning_rate': 2.5523541778631477e-08, 'epoch': 1.96} {'loss': 0.2849, 'learning_rate': 2.5499558053591055e-08, 'epoch': 1.96} {'loss': 0.1934, 'learning_rate': 2.5475585587863007e-08, 'epoch': 1.96} {'loss': 0.4748, 'learning_rate': 2.5451624381477303e-08, 'epoch': 1.96} {'loss': 0.1669, 'learning_rate': 2.542767443445948e-08, 'epoch': 1.96} {'loss': 0.3042, 'learning_rate': 2.54037357468373e-08, 'epoch': 1.96} {'loss': 0.3405, 'learning_rate': 2.53798083186374e-08, 'epoch': 1.96} {'loss': 0.3063, 'learning_rate': 2.535589214988754e-08, 'epoch': 1.96} {'loss': 0.1948, 'learning_rate': 2.5331987240613255e-08, 'epoch': 1.96} {'loss': 0.3046, 'learning_rate': 2.530809359084341e-08, 'epoch': 1.96} {'loss': 0.2378, 'learning_rate': 2.5284211200603535e-08, 'epoch': 1.96} {'loss': 0.2517, 'learning_rate': 2.5260340069920285e-08, 'epoch': 1.96} {'loss': 0.3689, 'learning_rate': 2.523648019882252e-08, 'epoch': 1.96} {'loss': 0.2954, 'learning_rate': 2.5212631587334668e-08, 'epoch': 1.96} {'loss': 0.2421, 'learning_rate': 2.5188794235486702e-08, 'epoch': 1.96} {'loss': 0.3116, 'learning_rate': 2.5164968143301938e-08, 'epoch': 1.96} {'loss': 0.2888, 'learning_rate': 2.514115331081035e-08, 'epoch': 1.96} {'loss': 0.4275, 'learning_rate': 2.511734973803637e-08, 'epoch': 1.96} {'loss': 0.4414, 'learning_rate': 2.5093557425009962e-08, 'epoch': 1.96} {'loss': 0.3079, 'learning_rate': 2.506977637175445e-08, 'epoch': 1.96} {'loss': 0.2018, 'learning_rate': 2.50460065782987e-08, 'epoch': 1.96} {'loss': 0.2759, 'learning_rate': 2.502224804466935e-08, 'epoch': 1.96} {'loss': 0.4399, 'learning_rate': 2.4998500770893054e-08, 'epoch': 1.96} {'loss': 0.2402, 'learning_rate': 2.497476475699645e-08, 'epoch': 1.96} {'loss': 0.3425, 'learning_rate': 2.49510400030073e-08, 'epoch': 1.96} {'loss': 0.3207, 'learning_rate': 2.4927326508951132e-08, 'epoch': 1.96} {'loss': 0.2974, 'learning_rate': 2.49036242748546e-08, 'epoch': 1.96} {'loss': 0.3041, 'learning_rate': 2.487993330074545e-08, 'epoch': 1.96} {'loss': 0.2065, 'learning_rate': 2.4856253586650336e-08, 'epoch': 1.96} {'loss': 0.3761, 'learning_rate': 2.4832585132594787e-08, 'epoch': 1.96} {'loss': 0.4063, 'learning_rate': 2.4808927938607675e-08, 'epoch': 1.96} {'loss': 0.1997, 'learning_rate': 2.4785282004713418e-08, 'epoch': 1.96} {'loss': 0.2836, 'learning_rate': 2.4761647330939776e-08, 'epoch': 1.96} {'loss': 0.167, 'learning_rate': 2.4738023917313392e-08, 'epoch': 1.96} {'loss': 0.3388, 'learning_rate': 2.4714411763860914e-08, 'epoch': 1.96} {'loss': 0.5302, 'learning_rate': 2.4690810870608983e-08, 'epoch': 1.96} {'loss': 0.2383, 'learning_rate': 2.4667221237584248e-08, 'epoch': 1.96} {'loss': 0.424, 'learning_rate': 2.4643642864813354e-08, 'epoch': 1.96} {'loss': 0.2274, 'learning_rate': 2.4620075752322946e-08, 'epoch': 1.96} {'loss': 0.3516, 'learning_rate': 2.459651990013967e-08, 'epoch': 1.96} {'loss': 0.3951, 'learning_rate': 2.457297530829017e-08, 'epoch': 1.96} {'loss': 0.4533, 'learning_rate': 2.454944197680109e-08, 'epoch': 1.96} {'loss': 0.2711, 'learning_rate': 2.452591990569797e-08, 'epoch': 1.96} {'loss': 0.2187, 'learning_rate': 2.450240909500856e-08, 'epoch': 1.96} {'loss': 0.2551, 'learning_rate': 2.4478909544758402e-08, 'epoch': 1.96} {'loss': 0.2293, 'learning_rate': 2.4455421254975242e-08, 'epoch': 1.96} {'loss': 0.2118, 'learning_rate': 2.4431944225685734e-08, 'epoch': 1.96} {'loss': 0.3149, 'learning_rate': 2.4408478456914297e-08, 'epoch': 1.96} {'loss': 0.3469, 'learning_rate': 2.438502394868869e-08, 'epoch': 1.96} {'loss': 0.2778, 'learning_rate': 2.436158070103667e-08, 'epoch': 1.96} {'loss': 0.3249, 'learning_rate': 2.4338148713982656e-08, 'epoch': 1.96} {'loss': 0.3196, 'learning_rate': 2.43147279875533e-08, 'epoch': 1.96} {'loss': 0.2156, 'learning_rate': 2.429131852177746e-08, 'epoch': 1.96} {'loss': 0.1767, 'learning_rate': 2.426792031667846e-08, 'epoch': 1.96} {'loss': 0.3131, 'learning_rate': 2.4244533372284053e-08, 'epoch': 1.96} {'loss': 0.2814, 'learning_rate': 2.4221157688620878e-08, 'epoch': 1.96} {'loss': 0.3671, 'learning_rate': 2.4197793265714477e-08, 'epoch': 1.96} {'loss': 0.2805, 'learning_rate': 2.41744401035926e-08, 'epoch': 1.96} {'loss': 0.3745, 'learning_rate': 2.4151098202279677e-08, 'epoch': 1.96} {'loss': 0.3096, 'learning_rate': 2.4127767561804573e-08, 'epoch': 1.96} {'loss': 0.2598, 'learning_rate': 2.4104448182191707e-08, 'epoch': 1.96} {'loss': 0.2175, 'learning_rate': 2.4081140063467733e-08, 'epoch': 1.96} {'loss': 0.4012, 'learning_rate': 2.4057843205658182e-08, 'epoch': 1.96} {'loss': 0.2566, 'learning_rate': 2.403455760879192e-08, 'epoch': 1.96} {'loss': 0.3884, 'learning_rate': 2.4011283272893372e-08, 'epoch': 1.96} {'loss': 0.2251, 'learning_rate': 2.398802019798807e-08, 'epoch': 1.96} {'loss': 0.3305, 'learning_rate': 2.3964768384103775e-08, 'epoch': 1.96} {'loss': 0.2617, 'learning_rate': 2.394152783126713e-08, 'epoch': 1.96} {'loss': 0.4187, 'learning_rate': 2.391829853950256e-08, 'epoch': 1.96} {'loss': 0.2519, 'learning_rate': 2.389508050883671e-08, 'epoch': 1.96} {'loss': 0.3594, 'learning_rate': 2.3871873739297334e-08, 'epoch': 1.96} {'loss': 0.26, 'learning_rate': 2.384867823090886e-08, 'epoch': 1.96} {'loss': 0.1595, 'learning_rate': 2.3825493983697933e-08, 'epoch': 1.96} {'loss': 0.2889, 'learning_rate': 2.380232099769231e-08, 'epoch': 1.96} {'loss': 0.2176, 'learning_rate': 2.3779159272915298e-08, 'epoch': 1.96} {'loss': 0.3843, 'learning_rate': 2.375600880939577e-08, 'epoch': 1.96} {'loss': 0.3217, 'learning_rate': 2.373286960715815e-08, 'epoch': 1.96} {'loss': 0.356, 'learning_rate': 2.370974166622797e-08, 'epoch': 1.96} {'loss': 0.2414, 'learning_rate': 2.36866249866341e-08, 'epoch': 1.96} {'loss': 0.4185, 'learning_rate': 2.366351956839985e-08, 'epoch': 1.96} {'loss': 0.1589, 'learning_rate': 2.3640425411552982e-08, 'epoch': 1.96} {'loss': 0.4237, 'learning_rate': 2.3617342516119024e-08, 'epoch': 1.96} {'loss': 0.3408, 'learning_rate': 2.3594270882123517e-08, 'epoch': 1.96} {'loss': 0.2393, 'learning_rate': 2.35712105095931e-08, 'epoch': 1.96} {'loss': 0.1772, 'learning_rate': 2.3548161398554424e-08, 'epoch': 1.96} {'loss': 0.3138, 'learning_rate': 2.3525123549031914e-08, 'epoch': 1.96} {'loss': 0.4524, 'learning_rate': 2.3502096961052213e-08, 'epoch': 1.96} {'loss': 0.28, 'learning_rate': 2.3479081634641964e-08, 'epoch': 1.96} {'loss': 0.4876, 'learning_rate': 2.3456077569826708e-08, 'epoch': 1.96} {'loss': 0.2091, 'learning_rate': 2.3433084766633085e-08, 'epoch': 1.96} {'loss': 0.3242, 'learning_rate': 2.341010322508552e-08, 'epoch': 1.96} {'loss': 0.3637, 'learning_rate': 2.3387132945210665e-08, 'epoch': 1.96} {'loss': 0.1512, 'learning_rate': 2.3364173927035162e-08, 'epoch': 1.96} {'loss': 0.3308, 'learning_rate': 2.3341226170583432e-08, 'epoch': 1.96} {'loss': 0.4483, 'learning_rate': 2.3318289675883234e-08, 'epoch': 1.96} {'loss': 0.307, 'learning_rate': 2.329536444295899e-08, 'epoch': 1.96} {'loss': 0.3246, 'learning_rate': 2.327245047183735e-08, 'epoch': 1.96} {'loss': 0.4365, 'learning_rate': 2.3249547762544955e-08, 'epoch': 1.96} {'loss': 0.2282, 'learning_rate': 2.3226656315105123e-08, 'epoch': 1.96} {'loss': 0.2985, 'learning_rate': 2.3203776129545608e-08, 'epoch': 1.96} {'loss': 0.2268, 'learning_rate': 2.3180907205893054e-08, 'epoch': 1.96} {'loss': 0.4615, 'learning_rate': 2.315804954417078e-08, 'epoch': 1.96} {'loss': 0.4389, 'learning_rate': 2.3135203144406538e-08, 'epoch': 1.96} {'loss': 0.4421, 'learning_rate': 2.311236800662475e-08, 'epoch': 1.96} {'loss': 0.4203, 'learning_rate': 2.3089544130852072e-08, 'epoch': 1.96} {'loss': 0.3311, 'learning_rate': 2.3066731517114026e-08, 'epoch': 1.96} {'loss': 0.2837, 'learning_rate': 2.3043930165437266e-08, 'epoch': 1.96} {'loss': 0.2967, 'learning_rate': 2.3021140075846215e-08, 'epoch': 1.96} {'loss': 0.3498, 'learning_rate': 2.2998361248366406e-08, 'epoch': 1.96} {'loss': 0.3655, 'learning_rate': 2.29755936830256e-08, 'epoch': 1.96} {'loss': 0.2585, 'learning_rate': 2.2952837379847103e-08, 'epoch': 1.96} {'loss': 0.3276, 'learning_rate': 2.2930092338858678e-08, 'epoch': 1.96} {'loss': 0.3683, 'learning_rate': 2.2907358560083638e-08, 'epoch': 1.96} {'loss': 0.4641, 'learning_rate': 2.2884636043549735e-08, 'epoch': 1.96} {'loss': 0.1941, 'learning_rate': 2.28619247892814e-08, 'epoch': 1.96} {'loss': 0.4143, 'learning_rate': 2.283922479730527e-08, 'epoch': 1.96} {'loss': 0.2873, 'learning_rate': 2.2816536067645778e-08, 'epoch': 1.96} {'loss': 0.2892, 'learning_rate': 2.2793858600329565e-08, 'epoch': 1.96} {'loss': 0.3691, 'learning_rate': 2.277119239538217e-08, 'epoch': 1.96} {'loss': 0.2248, 'learning_rate': 2.274853745282801e-08, 'epoch': 1.96} {'loss': 0.3676, 'learning_rate': 2.2725893772693743e-08, 'epoch': 1.96} {'loss': 0.3117, 'learning_rate': 2.270326135500489e-08, 'epoch': 1.96} {'loss': 0.2885, 'learning_rate': 2.2680640199786995e-08, 'epoch': 1.96} {'loss': 0.1582, 'learning_rate': 2.265803030706448e-08, 'epoch': 1.96} {'loss': 0.3556, 'learning_rate': 2.2635431676865106e-08, 'epoch': 1.96} {'loss': 0.2631, 'learning_rate': 2.261284430921218e-08, 'epoch': 1.96} {'loss': 0.4141, 'learning_rate': 2.2590268204132348e-08, 'epoch': 1.96} {'loss': 0.3772, 'learning_rate': 2.256770336165115e-08, 'epoch': 1.96} {'loss': 0.263, 'learning_rate': 2.2545149781793006e-08, 'epoch': 1.96} {'loss': 0.2572, 'learning_rate': 2.2522607464584568e-08, 'epoch': 1.96} {'loss': 0.313, 'learning_rate': 2.2500076410050252e-08, 'epoch': 1.96} {'loss': 0.2402, 'learning_rate': 2.2477556618216713e-08, 'epoch': 1.96} {'loss': 0.2472, 'learning_rate': 2.2455048089107258e-08, 'epoch': 1.96} {'loss': 0.3464, 'learning_rate': 2.2432550822750755e-08, 'epoch': 1.96} {'loss': 0.4237, 'learning_rate': 2.241006481916941e-08, 'epoch': 1.96} {'loss': 0.3629, 'learning_rate': 2.2387590078389865e-08, 'epoch': 1.96} {'loss': 0.2865, 'learning_rate': 2.2365126600437657e-08, 'epoch': 1.96} {'loss': 0.2708, 'learning_rate': 2.2342674385338325e-08, 'epoch': 1.96} {'loss': 0.3483, 'learning_rate': 2.232023343311518e-08, 'epoch': 1.96} {'loss': 0.3486, 'learning_rate': 2.2297803743797087e-08, 'epoch': 1.96} {'loss': 0.2925, 'learning_rate': 2.227538531740625e-08, 'epoch': 1.96} {'loss': 0.3117, 'learning_rate': 2.225297815396932e-08, 'epoch': 1.96} {'loss': 0.3409, 'learning_rate': 2.2230582253511824e-08, 'epoch': 1.96} {'loss': 0.1687, 'learning_rate': 2.2208197616058192e-08, 'epoch': 1.96} {'loss': 0.317, 'learning_rate': 2.2185824241633957e-08, 'epoch': 1.96} {'loss': 0.2981, 'learning_rate': 2.2163462130265766e-08, 'epoch': 1.96} {'loss': 0.4101, 'learning_rate': 2.2141111281976936e-08, 'epoch': 1.96} {'loss': 0.4205, 'learning_rate': 2.2118771696792997e-08, 'epoch': 1.96} {'loss': 0.2762, 'learning_rate': 2.2096443374739486e-08, 'epoch': 1.96} {'loss': 0.267, 'learning_rate': 2.2074126315841937e-08, 'epoch': 1.96} {'loss': 0.2549, 'learning_rate': 2.205182052012589e-08, 'epoch': 1.96} {'loss': 0.42, 'learning_rate': 2.2029525987615763e-08, 'epoch': 1.96} {'loss': 0.3296, 'learning_rate': 2.2007242718335986e-08, 'epoch': 1.96} {'loss': 0.1999, 'learning_rate': 2.1984970712313202e-08, 'epoch': 1.96} {'loss': 0.2638, 'learning_rate': 2.196270996957295e-08, 'epoch': 1.96} {'loss': 0.3974, 'learning_rate': 2.1940460490138538e-08, 'epoch': 1.96} {'loss': 0.26, 'learning_rate': 2.1918222274035507e-08, 'epoch': 1.96} {'loss': 0.3075, 'learning_rate': 2.189599532128939e-08, 'epoch': 1.96} {'loss': 0.2535, 'learning_rate': 2.1873779631925718e-08, 'epoch': 1.96} {'loss': 0.3274, 'learning_rate': 2.1851575205968922e-08, 'epoch': 1.96} {'loss': 0.2915, 'learning_rate': 2.1829382043444537e-08, 'epoch': 1.96} {'loss': 0.2327, 'learning_rate': 2.1807200144378095e-08, 'epoch': 1.96} {'loss': 0.4104, 'learning_rate': 2.178502950879291e-08, 'epoch': 1.96} {'loss': 0.3178, 'learning_rate': 2.1762870136714522e-08, 'epoch': 1.96} {'loss': 0.3458, 'learning_rate': 2.1740722028168458e-08, 'epoch': 1.96} {'loss': 0.2623, 'learning_rate': 2.1718585183181374e-08, 'epoch': 1.96} {'loss': 0.2426, 'learning_rate': 2.1696459601775466e-08, 'epoch': 1.96} {'loss': 0.3467, 'learning_rate': 2.1674345283976273e-08, 'epoch': 1.96} {'loss': 0.2883, 'learning_rate': 2.1652242229809328e-08, 'epoch': 1.96} {'loss': 0.2965, 'learning_rate': 2.163015043930017e-08, 'epoch': 1.96} {'loss': 0.446, 'learning_rate': 2.1608069912473217e-08, 'epoch': 1.96} {'loss': 0.2582, 'learning_rate': 2.158600064935179e-08, 'epoch': 1.96} {'loss': 0.2278, 'learning_rate': 2.1563942649963643e-08, 'epoch': 1.96} {'loss': 0.3049, 'learning_rate': 2.154189591433209e-08, 'epoch': 1.96} {'loss': 0.337, 'learning_rate': 2.1519860442482665e-08, 'epoch': 1.96} {'loss': 0.3266, 'learning_rate': 2.1497836234438684e-08, 'epoch': 1.96} {'loss': 0.3526, 'learning_rate': 2.1475823290226793e-08, 'epoch': 1.96} {'loss': 0.1694, 'learning_rate': 2.1453821609871415e-08, 'epoch': 1.96} {'loss': 0.3664, 'learning_rate': 2.143183119339698e-08, 'epoch': 1.96} {'loss': 0.2368, 'learning_rate': 2.1409852040829017e-08, 'epoch': 1.96} {'loss': 0.2857, 'learning_rate': 2.1387884152190842e-08, 'epoch': 1.96} {'loss': 0.3589, 'learning_rate': 2.13659275275091e-08, 'epoch': 1.96} {'loss': 0.4097, 'learning_rate': 2.1343982166807108e-08, 'epoch': 1.96} {'loss': 0.3401, 'learning_rate': 2.1322048070110402e-08, 'epoch': 1.96} {'loss': 0.2518, 'learning_rate': 2.13001252374434e-08, 'epoch': 1.96} {'loss': 0.2262, 'learning_rate': 2.127821366883165e-08, 'epoch': 1.96} {'loss': 0.3632, 'learning_rate': 2.1256313364298454e-08, 'epoch': 1.96} {'loss': 0.3936, 'learning_rate': 2.123442432386935e-08, 'epoch': 1.96} {'loss': 0.2458, 'learning_rate': 2.121254654756988e-08, 'epoch': 1.96} {'loss': 0.279, 'learning_rate': 2.119068003542335e-08, 'epoch': 1.96} {'loss': 0.2785, 'learning_rate': 2.116882478745419e-08, 'epoch': 1.96} {'loss': 0.4427, 'learning_rate': 2.1146980803689045e-08, 'epoch': 1.96} {'loss': 0.1186, 'learning_rate': 2.1125148084151224e-08, 'epoch': 1.96} {'loss': 0.2837, 'learning_rate': 2.110332662886516e-08, 'epoch': 1.96} {'loss': 0.1856, 'learning_rate': 2.1081516437856385e-08, 'epoch': 1.96} {'loss': 0.214, 'learning_rate': 2.1059717511148213e-08, 'epoch': 1.96} {'loss': 0.3587, 'learning_rate': 2.1037929848766182e-08, 'epoch': 1.96} {'loss': 0.349, 'learning_rate': 2.101615345073582e-08, 'epoch': 1.96} {'loss': 0.3146, 'learning_rate': 2.099438831707934e-08, 'epoch': 1.96} {'loss': 0.5195, 'learning_rate': 2.0972634447823382e-08, 'epoch': 1.96} {'loss': 0.2844, 'learning_rate': 2.0950891842991262e-08, 'epoch': 1.96} {'loss': 0.1637, 'learning_rate': 2.0929160502608516e-08, 'epoch': 1.96} {'loss': 0.2699, 'learning_rate': 2.0907440426698457e-08, 'epoch': 1.96} {'loss': 0.3973, 'learning_rate': 2.088573161528662e-08, 'epoch': 1.96} {'loss': 0.2207, 'learning_rate': 2.0864034068397432e-08, 'epoch': 1.96} {'loss': 0.2815, 'learning_rate': 2.0842347786054205e-08, 'epoch': 1.96} {'loss': 0.3276, 'learning_rate': 2.082067276828359e-08, 'epoch': 1.96} {'loss': 0.3927, 'learning_rate': 2.0799009015107785e-08, 'epoch': 1.96} {'loss': 0.2114, 'learning_rate': 2.0777356526553438e-08, 'epoch': 1.96} {'loss': 0.2771, 'learning_rate': 2.0755715302642754e-08, 'epoch': 1.96} {'loss': 0.4601, 'learning_rate': 2.0734085343401268e-08, 'epoch': 1.96} {'loss': 0.1473, 'learning_rate': 2.0712466648853403e-08, 'epoch': 1.96} {'loss': 0.3697, 'learning_rate': 2.0690859219024695e-08, 'epoch': 1.96} {'loss': 0.305, 'learning_rate': 2.066926305393735e-08, 'epoch': 1.96} {'loss': 0.3556, 'learning_rate': 2.06476781536169e-08, 'epoch': 1.96} {'loss': 0.3009, 'learning_rate': 2.0626104518086666e-08, 'epoch': 1.96} {'loss': 0.2836, 'learning_rate': 2.0604542147373285e-08, 'epoch': 1.96} {'loss': 0.2937, 'learning_rate': 2.0582991041498967e-08, 'epoch': 1.96} {'loss': 0.3126, 'learning_rate': 2.0561451200489247e-08, 'epoch': 1.96} {'loss': 0.3692, 'learning_rate': 2.0539922624367436e-08, 'epoch': 1.96} {'loss': 0.2777, 'learning_rate': 2.0518405313159074e-08, 'epoch': 1.96} {'loss': 0.339, 'learning_rate': 2.049689926688636e-08, 'epoch': 1.96} {'loss': 0.2132, 'learning_rate': 2.0475404485575943e-08, 'epoch': 1.96} {'loss': 0.2181, 'learning_rate': 2.045392096925114e-08, 'epoch': 1.96} {'loss': 0.3078, 'learning_rate': 2.043244871793637e-08, 'epoch': 1.96} {'loss': 0.1851, 'learning_rate': 2.0410987731654952e-08, 'epoch': 1.96} {'loss': 0.2758, 'learning_rate': 2.038953801043242e-08, 'epoch': 1.96} {'loss': 0.1755, 'learning_rate': 2.0368099554292087e-08, 'epoch': 1.96} {'loss': 0.3572, 'learning_rate': 2.034667236325838e-08, 'epoch': 1.96} {'loss': 0.3553, 'learning_rate': 2.0325256437356834e-08, 'epoch': 1.96} {'loss': 0.2245, 'learning_rate': 2.030385177660854e-08, 'epoch': 1.96} {'loss': 0.3114, 'learning_rate': 2.028245838104015e-08, 'epoch': 1.96} {'loss': 0.2325, 'learning_rate': 2.026107625067497e-08, 'epoch': 1.96} {'loss': 0.3041, 'learning_rate': 2.0239705385537435e-08, 'epoch': 1.96} {'loss': 0.4095, 'learning_rate': 2.021834578565196e-08, 'epoch': 1.96} {'loss': 0.2154, 'learning_rate': 2.0196997451041866e-08, 'epoch': 1.96} {'loss': 0.2922, 'learning_rate': 2.0175660381731576e-08, 'epoch': 1.96} {'loss': 0.3594, 'learning_rate': 2.0154334577745517e-08, 'epoch': 1.96} {'loss': 0.1696, 'learning_rate': 2.0133020039106997e-08, 'epoch': 1.96} {'loss': 0.3514, 'learning_rate': 2.011171676584045e-08, 'epoch': 1.96} {'loss': 0.3944, 'learning_rate': 2.0090424757971406e-08, 'epoch': 1.96} {'loss': 0.2974, 'learning_rate': 2.0069144015520958e-08, 'epoch': 1.96} {'loss': 0.1586, 'learning_rate': 2.0047874538514644e-08, 'epoch': 1.96} {'loss': 0.3133, 'learning_rate': 2.0026616326976887e-08, 'epoch': 1.96} {'loss': 0.3445, 'learning_rate': 2.0005369380932115e-08, 'epoch': 1.96} {'loss': 0.3109, 'learning_rate': 1.998413370040253e-08, 'epoch': 1.96} {'loss': 0.2983, 'learning_rate': 1.9962909285413667e-08, 'epoch': 1.96} {'loss': 0.3607, 'learning_rate': 1.994169613598773e-08, 'epoch': 1.96} {'loss': 0.2662, 'learning_rate': 1.9920494252151366e-08, 'epoch': 1.96} {'loss': 0.1928, 'learning_rate': 1.989930363392567e-08, 'epoch': 1.96} {'loss': 0.417, 'learning_rate': 1.9878124281336174e-08, 'epoch': 1.96} {'loss': 0.2836, 'learning_rate': 1.9856956194407306e-08, 'epoch': 1.96} {'loss': 0.3838, 'learning_rate': 1.983579937316127e-08, 'epoch': 1.96} {'loss': 0.2821, 'learning_rate': 1.9814653817623597e-08, 'epoch': 1.96} {'loss': 0.3835, 'learning_rate': 1.9793519527816495e-08, 'epoch': 1.96} {'loss': 0.2966, 'learning_rate': 1.97723965037655e-08, 'epoch': 1.96} {'loss': 0.4532, 'learning_rate': 1.9751284745492815e-08, 'epoch': 1.96} {'loss': 0.3221, 'learning_rate': 1.9730184253023976e-08, 'epoch': 1.96} {'loss': 0.1792, 'learning_rate': 1.9709095026381187e-08, 'epoch': 1.96} {'loss': 0.3775, 'learning_rate': 1.968801706558887e-08, 'epoch': 1.96} {'loss': 0.3534, 'learning_rate': 1.9666950370671455e-08, 'epoch': 1.96} {'loss': 0.2469, 'learning_rate': 1.9645894941652254e-08, 'epoch': 1.96} {'loss': 0.2566, 'learning_rate': 1.9624850778554582e-08, 'epoch': 1.96} {'loss': 0.3536, 'learning_rate': 1.9603817881402863e-08, 'epoch': 1.96} {'loss': 0.3186, 'learning_rate': 1.9582796250220413e-08, 'epoch': 1.96} {'loss': 0.2335, 'learning_rate': 1.956178588503055e-08, 'epoch': 1.96} {'loss': 0.2339, 'learning_rate': 1.95407867858588e-08, 'epoch': 1.96} {'loss': 0.2011, 'learning_rate': 1.9519798952726265e-08, 'epoch': 1.96} {'loss': 0.2928, 'learning_rate': 1.9498822385659588e-08, 'epoch': 1.96} {'loss': 0.2923, 'learning_rate': 1.9477857084679864e-08, 'epoch': 1.96} {'loss': 0.4767, 'learning_rate': 1.9456903049811515e-08, 'epoch': 1.96} {'loss': 0.2341, 'learning_rate': 1.943596028107897e-08, 'epoch': 1.96} {'loss': 0.33, 'learning_rate': 1.941502877850554e-08, 'epoch': 1.96} {'loss': 0.2422, 'learning_rate': 1.9394108542114542e-08, 'epoch': 1.96} {'loss': 0.3085, 'learning_rate': 1.937319957192929e-08, 'epoch': 1.96} {'loss': 0.3805, 'learning_rate': 1.935230186797421e-08, 'epoch': 1.96} {'loss': 0.3779, 'learning_rate': 1.9331415430271505e-08, 'epoch': 1.96} {'loss': 0.282, 'learning_rate': 1.931054025884671e-08, 'epoch': 1.96} {'loss': 0.2626, 'learning_rate': 1.928967635372203e-08, 'epoch': 1.96} {'loss': 0.3567, 'learning_rate': 1.9268823714921892e-08, 'epoch': 1.96} {'loss': 0.3435, 'learning_rate': 1.9247982342468496e-08, 'epoch': 1.96} {'loss': 0.1963, 'learning_rate': 1.922715223638738e-08, 'epoch': 1.96} {'loss': 0.3537, 'learning_rate': 1.920633339669964e-08, 'epoch': 1.96} {'loss': 0.2692, 'learning_rate': 1.9185525823430806e-08, 'epoch': 1.96} {'loss': 0.2205, 'learning_rate': 1.9164729516603088e-08, 'epoch': 1.96} {'loss': 0.2917, 'learning_rate': 1.9143944476240904e-08, 'epoch': 1.96} {'loss': 0.3489, 'learning_rate': 1.9123170702366466e-08, 'epoch': 1.96} {'loss': 0.3262, 'learning_rate': 1.9102408195005307e-08, 'epoch': 1.96} {'loss': 0.3346, 'learning_rate': 1.9081656954178517e-08, 'epoch': 1.96} {'loss': 0.3937, 'learning_rate': 1.9060916979910527e-08, 'epoch': 1.96} {'loss': 0.3137, 'learning_rate': 1.9040188272224647e-08, 'epoch': 1.96} {'loss': 0.3269, 'learning_rate': 1.9019470831145303e-08, 'epoch': 1.96} {'loss': 0.3188, 'learning_rate': 1.8998764656694702e-08, 'epoch': 1.96} {'loss': 0.2447, 'learning_rate': 1.8978069748896155e-08, 'epoch': 1.96} {'loss': 0.2915, 'learning_rate': 1.895738610777409e-08, 'epoch': 1.96} {'loss': 0.1817, 'learning_rate': 1.893671373335071e-08, 'epoch': 1.96} {'loss': 0.205, 'learning_rate': 1.8916052625649328e-08, 'epoch': 1.96} {'loss': 0.2254, 'learning_rate': 1.8895402784694374e-08, 'epoch': 1.96} {'loss': 0.3915, 'learning_rate': 1.8874764210509157e-08, 'epoch': 1.96} {'loss': 0.1995, 'learning_rate': 1.8854136903115884e-08, 'epoch': 1.96} {'loss': 0.3946, 'learning_rate': 1.8833520862536758e-08, 'epoch': 1.96} {'loss': 0.3274, 'learning_rate': 1.881291608879843e-08, 'epoch': 1.96} {'loss': 0.2543, 'learning_rate': 1.8792322581921985e-08, 'epoch': 1.96} {'loss': 0.2422, 'learning_rate': 1.8771740341930744e-08, 'epoch': 1.96} {'loss': 0.2159, 'learning_rate': 1.8751169368848022e-08, 'epoch': 1.96} {'loss': 0.2701, 'learning_rate': 1.873060966269713e-08, 'epoch': 1.96} {'loss': 0.2865, 'learning_rate': 1.8710061223501385e-08, 'epoch': 1.96} {'loss': 0.3022, 'learning_rate': 1.8689524051284104e-08, 'epoch': 1.96} {'loss': 0.2952, 'learning_rate': 1.8668998146068594e-08, 'epoch': 1.96} {'loss': 0.3407, 'learning_rate': 1.864848350787707e-08, 'epoch': 1.96} {'loss': 0.384, 'learning_rate': 1.8627980136733948e-08, 'epoch': 1.96} {'loss': 0.333, 'learning_rate': 1.8607488032661437e-08, 'epoch': 1.96} {'loss': 0.3587, 'learning_rate': 1.858700719568396e-08, 'epoch': 1.96} {'loss': 0.4879, 'learning_rate': 1.856653762582261e-08, 'epoch': 1.96} {'loss': 0.424, 'learning_rate': 1.8546079323101818e-08, 'epoch': 1.96} {'loss': 0.2026, 'learning_rate': 1.8525632287543782e-08, 'epoch': 1.96} {'loss': 0.2509, 'learning_rate': 1.850519651917404e-08, 'epoch': 1.96} {'loss': 0.1854, 'learning_rate': 1.8484772018012576e-08, 'epoch': 1.96} {'loss': 0.203, 'learning_rate': 1.8464358784083812e-08, 'epoch': 1.96} {'loss': 0.239, 'learning_rate': 1.844395681741107e-08, 'epoch': 1.96} {'loss': 0.207, 'learning_rate': 1.8423566118016545e-08, 'epoch': 1.96} {'loss': 0.3902, 'learning_rate': 1.8403186685923558e-08, 'epoch': 1.96} {'loss': 0.2415, 'learning_rate': 1.838281852115653e-08, 'epoch': 1.96} {'loss': 0.3108, 'learning_rate': 1.836246162373545e-08, 'epoch': 1.96} {'loss': 0.2584, 'learning_rate': 1.834211599368696e-08, 'epoch': 1.96} {'loss': 0.244, 'learning_rate': 1.8321781631031042e-08, 'epoch': 1.96} {'loss': 0.4433, 'learning_rate': 1.8301458535792127e-08, 'epoch': 1.96} {'loss': 0.2298, 'learning_rate': 1.8281146707992413e-08, 'epoch': 1.96} {'loss': 0.3401, 'learning_rate': 1.826084614765522e-08, 'epoch': 1.96} {'loss': 0.3556, 'learning_rate': 1.824055685480275e-08, 'epoch': 1.96} {'loss': 0.3201, 'learning_rate': 1.8220278829459425e-08, 'epoch': 1.96} {'loss': 0.1756, 'learning_rate': 1.8200012071647454e-08, 'epoch': 1.96} {'loss': 0.1868, 'learning_rate': 1.817975658138904e-08, 'epoch': 1.96} {'loss': 0.3278, 'learning_rate': 1.81595123587075e-08, 'epoch': 1.96} {'loss': 0.2023, 'learning_rate': 1.8139279403626142e-08, 'epoch': 1.96} {'loss': 0.3323, 'learning_rate': 1.8119057716167177e-08, 'epoch': 1.96} {'loss': 0.3222, 'learning_rate': 1.8098847296353915e-08, 'epoch': 1.96} {'loss': 0.3359, 'learning_rate': 1.8078648144208567e-08, 'epoch': 1.96} {'loss': 0.2742, 'learning_rate': 1.805846025975444e-08, 'epoch': 1.96} {'loss': 0.3346, 'learning_rate': 1.8038283643013743e-08, 'epoch': 1.96} {'loss': 0.2632, 'learning_rate': 1.80181182940109e-08, 'epoch': 1.96} {'loss': 0.3317, 'learning_rate': 1.7997964212765894e-08, 'epoch': 1.96} {'loss': 0.2068, 'learning_rate': 1.797782139930426e-08, 'epoch': 1.96} {'loss': 0.3828, 'learning_rate': 1.7957689853647098e-08, 'epoch': 1.96} {'loss': 0.3583, 'learning_rate': 1.7937569575816604e-08, 'epoch': 1.96} {'loss': 0.3286, 'learning_rate': 1.7917460565837208e-08, 'epoch': 1.96} {'loss': 0.3049, 'learning_rate': 1.789736282373111e-08, 'epoch': 1.96} {'loss': 0.1994, 'learning_rate': 1.7877276349520523e-08, 'epoch': 1.96} {'loss': 0.2853, 'learning_rate': 1.7857201143228752e-08, 'epoch': 1.96} {'loss': 0.3609, 'learning_rate': 1.7837137204876898e-08, 'epoch': 1.96} {'loss': 0.3905, 'learning_rate': 1.781708453448938e-08, 'epoch': 1.96} {'loss': 0.2881, 'learning_rate': 1.779704313208841e-08, 'epoch': 1.96} {'loss': 0.3405, 'learning_rate': 1.7777012997696185e-08, 'epoch': 1.96} {'loss': 0.2348, 'learning_rate': 1.7756994131334916e-08, 'epoch': 1.96} {'loss': 0.253, 'learning_rate': 1.773698653302791e-08, 'epoch': 1.96} {'loss': 0.2909, 'learning_rate': 1.771699020279849e-08, 'epoch': 1.96} {'loss': 0.1803, 'learning_rate': 1.7697005140667745e-08, 'epoch': 1.96} {'loss': 0.4038, 'learning_rate': 1.767703134665899e-08, 'epoch': 1.96} {'loss': 0.297, 'learning_rate': 1.7657068820794433e-08, 'epoch': 1.96} {'loss': 0.4082, 'learning_rate': 1.7637117563097384e-08, 'epoch': 1.96} {'loss': 0.3288, 'learning_rate': 1.761717757358894e-08, 'epoch': 1.96} {'loss': 0.2933, 'learning_rate': 1.7597248852292415e-08, 'epoch': 1.96} {'loss': 0.3411, 'learning_rate': 1.7577331399231125e-08, 'epoch': 1.96} {'loss': 0.3774, 'learning_rate': 1.7557425214426162e-08, 'epoch': 1.96} {'loss': 0.2471, 'learning_rate': 1.753753029790084e-08, 'epoch': 1.96} {'loss': 0.3759, 'learning_rate': 1.7517646649678477e-08, 'epoch': 1.96} {'loss': 0.2843, 'learning_rate': 1.7497774269779057e-08, 'epoch': 1.96} {'loss': 0.3659, 'learning_rate': 1.7477913158227e-08, 'epoch': 1.96} {'loss': 0.2459, 'learning_rate': 1.7458063315043406e-08, 'epoch': 1.96} {'loss': 0.3404, 'learning_rate': 1.7438224740252697e-08, 'epoch': 1.96} {'loss': 0.2036, 'learning_rate': 1.7418397433874858e-08, 'epoch': 1.96} {'loss': 0.337, 'learning_rate': 1.73985813959332e-08, 'epoch': 1.96} {'loss': 0.2951, 'learning_rate': 1.7378776626451044e-08, 'epoch': 1.96} {'loss': 0.284, 'learning_rate': 1.735898312544948e-08, 'epoch': 1.96} {'loss': 0.3301, 'learning_rate': 1.7339200892951822e-08, 'epoch': 1.96} {'loss': 0.4754, 'learning_rate': 1.731942992897917e-08, 'epoch': 1.96} {'loss': 0.2948, 'learning_rate': 1.729967023355594e-08, 'epoch': 1.96} {'loss': 0.424, 'learning_rate': 1.7279921806702126e-08, 'epoch': 1.96} {'loss': 0.4792, 'learning_rate': 1.7260184648441036e-08, 'epoch': 1.96} {'loss': 0.3456, 'learning_rate': 1.7240458758794876e-08, 'epoch': 1.96} {'loss': 0.2742, 'learning_rate': 1.722074413778585e-08, 'epoch': 1.96} {'loss': 0.2604, 'learning_rate': 1.720104078543616e-08, 'epoch': 1.96} {'loss': 0.3542, 'learning_rate': 1.718134870176802e-08, 'epoch': 1.96} {'loss': 0.2782, 'learning_rate': 1.7161667886804732e-08, 'epoch': 1.96} {'loss': 0.2052, 'learning_rate': 1.7141998340567402e-08, 'epoch': 1.96} {'loss': 0.2003, 'learning_rate': 1.7122340063078225e-08, 'epoch': 1.96} {'loss': 0.3603, 'learning_rate': 1.710269305435941e-08, 'epoch': 1.96} {'loss': 0.2118, 'learning_rate': 1.7083057314433162e-08, 'epoch': 1.96} {'loss': 0.3198, 'learning_rate': 1.706343284332168e-08, 'epoch': 1.96} {'loss': 0.2313, 'learning_rate': 1.7043819641048288e-08, 'epoch': 1.96} {'loss': 0.4681, 'learning_rate': 1.702421770763296e-08, 'epoch': 1.96} {'loss': 0.3505, 'learning_rate': 1.700462704309902e-08, 'epoch': 1.96} {'loss': 0.214, 'learning_rate': 1.6985047647468668e-08, 'epoch': 1.96} {'loss': 0.3296, 'learning_rate': 1.6965479520764105e-08, 'epoch': 1.96} {'loss': 0.317, 'learning_rate': 1.6945922663007542e-08, 'epoch': 1.96} {'loss': 0.3125, 'learning_rate': 1.6926377074220067e-08, 'epoch': 1.96} {'loss': 0.1944, 'learning_rate': 1.690684275442389e-08, 'epoch': 1.96} {'loss': 0.2688, 'learning_rate': 1.6887319703642323e-08, 'epoch': 1.96} {'loss': 0.3376, 'learning_rate': 1.6867807921896463e-08, 'epoch': 1.96} {'loss': 0.3645, 'learning_rate': 1.6848307409208507e-08, 'epoch': 1.96} {'loss': 0.2576, 'learning_rate': 1.682881816559956e-08, 'epoch': 1.96} {'loss': 0.4104, 'learning_rate': 1.6809340191094035e-08, 'epoch': 1.96} {'loss': 0.3193, 'learning_rate': 1.6789873485710817e-08, 'epoch': 1.96} {'loss': 0.2151, 'learning_rate': 1.6770418049474322e-08, 'epoch': 1.96} {'loss': 0.2332, 'learning_rate': 1.6750973882405652e-08, 'epoch': 1.96} {'loss': 0.2931, 'learning_rate': 1.6731540984527007e-08, 'epoch': 1.96} {'loss': 0.3706, 'learning_rate': 1.671211935585948e-08, 'epoch': 1.96} {'loss': 0.1856, 'learning_rate': 1.669270899642528e-08, 'epoch': 1.96} {'loss': 0.2041, 'learning_rate': 1.6673309906246604e-08, 'epoch': 1.96} {'loss': 0.2524, 'learning_rate': 1.6653922085346775e-08, 'epoch': 1.96} {'loss': 0.2607, 'learning_rate': 1.6634545533744663e-08, 'epoch': 1.96} {'loss': 0.2159, 'learning_rate': 1.661518025146469e-08, 'epoch': 1.96} {'loss': 0.3232, 'learning_rate': 1.6595826238526846e-08, 'epoch': 1.96} {'loss': 0.1837, 'learning_rate': 1.6576483494954442e-08, 'epoch': 1.96} {'loss': 0.2039, 'learning_rate': 1.6557152020768576e-08, 'epoch': 1.96} {'loss': 0.3866, 'learning_rate': 1.6537831815991444e-08, 'epoch': 1.96} {'loss': 0.5176, 'learning_rate': 1.651852288064526e-08, 'epoch': 1.96} {'loss': 0.286, 'learning_rate': 1.6499225214750003e-08, 'epoch': 1.96} {'loss': 0.4344, 'learning_rate': 1.647993881832899e-08, 'epoch': 1.96} {'loss': 0.378, 'learning_rate': 1.646066369140442e-08, 'epoch': 1.96} {'loss': 0.2453, 'learning_rate': 1.6441399833996286e-08, 'epoch': 1.96} {'loss': 0.3868, 'learning_rate': 1.6422147246127896e-08, 'epoch': 1.96} {'loss': 0.4917, 'learning_rate': 1.6402905927820347e-08, 'epoch': 1.96} {'loss': 0.3462, 'learning_rate': 1.638367587909584e-08, 'epoch': 1.96} {'loss': 0.4215, 'learning_rate': 1.636445709997547e-08, 'epoch': 1.96} {'loss': 0.3706, 'learning_rate': 1.6345249590480338e-08, 'epoch': 1.96} {'loss': 0.3341, 'learning_rate': 1.6326053350633752e-08, 'epoch': 1.96} {'loss': 0.2705, 'learning_rate': 1.630686838045681e-08, 'epoch': 1.96} {'loss': 0.3117, 'learning_rate': 1.62876946799706e-08, 'epoch': 1.96} {'loss': 0.4045, 'learning_rate': 1.6268532249196224e-08, 'epoch': 1.96} {'loss': 0.3922, 'learning_rate': 1.624938108815699e-08, 'epoch': 1.96} {'loss': 0.3173, 'learning_rate': 1.6230241196873996e-08, 'epoch': 1.96} {'loss': 0.2219, 'learning_rate': 1.6211112575368336e-08, 'epoch': 1.96} {'loss': 0.3097, 'learning_rate': 1.6191995223662215e-08, 'epoch': 1.96} {'loss': 0.3283, 'learning_rate': 1.6172889141775617e-08, 'epoch': 1.96} {'loss': 0.3724, 'learning_rate': 1.6153794329731855e-08, 'epoch': 1.96} {'loss': 0.2395, 'learning_rate': 1.6134710787552023e-08, 'epoch': 1.96} {'loss': 0.3137, 'learning_rate': 1.6115638515258325e-08, 'epoch': 1.96} {'loss': 0.2999, 'learning_rate': 1.609657751287075e-08, 'epoch': 1.96} {'loss': 0.3603, 'learning_rate': 1.6077527780411495e-08, 'epoch': 1.97} {'loss': 0.3519, 'learning_rate': 1.605848931790277e-08, 'epoch': 1.97} {'loss': 0.385, 'learning_rate': 1.6039462125365668e-08, 'epoch': 1.97} {'loss': 0.2527, 'learning_rate': 1.6020446202821282e-08, 'epoch': 1.97} {'loss': 0.201, 'learning_rate': 1.6001441550290707e-08, 'epoch': 1.97} {'loss': 0.2959, 'learning_rate': 1.598244816779615e-08, 'epoch': 1.97} {'loss': 0.249, 'learning_rate': 1.59634660553587e-08, 'epoch': 1.97} {'loss': 0.2727, 'learning_rate': 1.5944495213000565e-08, 'epoch': 1.97} {'loss': 0.4051, 'learning_rate': 1.592553564074173e-08, 'epoch': 1.97} {'loss': 0.3294, 'learning_rate': 1.5906587338605506e-08, 'epoch': 1.97} {'loss': 0.2803, 'learning_rate': 1.588765030661077e-08, 'epoch': 1.97} {'loss': 0.207, 'learning_rate': 1.5868724544780833e-08, 'epoch': 1.97} {'loss': 0.3596, 'learning_rate': 1.5849810053137903e-08, 'epoch': 1.97} {'loss': 0.3052, 'learning_rate': 1.5830906831699743e-08, 'epoch': 1.97} {'loss': 0.3218, 'learning_rate': 1.5812014880491888e-08, 'epoch': 1.97} {'loss': 0.2233, 'learning_rate': 1.57931341995321e-08, 'epoch': 1.97} {'loss': 0.256, 'learning_rate': 1.5774264788844806e-08, 'epoch': 1.97} {'loss': 0.3673, 'learning_rate': 1.5755406648447768e-08, 'epoch': 1.97} {'loss': 0.2489, 'learning_rate': 1.5736559778366523e-08, 'epoch': 1.97} {'loss': 0.3148, 'learning_rate': 1.571772417861883e-08, 'epoch': 1.97} {'loss': 0.2393, 'learning_rate': 1.56988998492269e-08, 'epoch': 1.97} {'loss': 0.3103, 'learning_rate': 1.5680086790212935e-08, 'epoch': 1.97} {'loss': 0.2998, 'learning_rate': 1.5661285001598026e-08, 'epoch': 1.97} {'loss': 0.3784, 'learning_rate': 1.564249448340216e-08, 'epoch': 1.97} {'loss': 0.3247, 'learning_rate': 1.562371523564754e-08, 'epoch': 1.97} {'loss': 0.337, 'learning_rate': 1.5604947258355262e-08, 'epoch': 1.97} {'loss': 0.304, 'learning_rate': 1.558619055154642e-08, 'epoch': 1.97} {'loss': 0.3536, 'learning_rate': 1.5567445115241e-08, 'epoch': 1.97} {'loss': 0.3648, 'learning_rate': 1.5548710949462308e-08, 'epoch': 1.97} {'loss': 0.2929, 'learning_rate': 1.552998805423034e-08, 'epoch': 1.97} {'loss': 0.1737, 'learning_rate': 1.551127642956729e-08, 'epoch': 1.97} {'loss': 0.3241, 'learning_rate': 1.549257607549204e-08, 'epoch': 1.97} {'loss': 0.3877, 'learning_rate': 1.54738869920279e-08, 'epoch': 1.97} {'loss': 0.2185, 'learning_rate': 1.545520917919485e-08, 'epoch': 1.97} {'loss': 0.4128, 'learning_rate': 1.5436542637013997e-08, 'epoch': 1.97} {'loss': 0.2791, 'learning_rate': 1.5417887365506423e-08, 'epoch': 1.97} {'loss': 0.2485, 'learning_rate': 1.5399243364693228e-08, 'epoch': 1.97} {'loss': 0.2795, 'learning_rate': 1.5380610634596616e-08, 'epoch': 1.97} {'loss': 0.1654, 'learning_rate': 1.536198917523657e-08, 'epoch': 1.97} {'loss': 0.4669, 'learning_rate': 1.5343378986633074e-08, 'epoch': 1.97} {'loss': 0.3891, 'learning_rate': 1.5324780068809442e-08, 'epoch': 1.97} {'loss': 0.2092, 'learning_rate': 1.530619242178455e-08, 'epoch': 1.97} {'loss': 0.4355, 'learning_rate': 1.52876160455806e-08, 'epoch': 1.97} {'loss': 0.2935, 'learning_rate': 1.5269050940218687e-08, 'epoch': 1.97} {'loss': 0.3112, 'learning_rate': 1.5250497105718798e-08, 'epoch': 1.97} {'loss': 0.3419, 'learning_rate': 1.5231954542102025e-08, 'epoch': 1.97} {'loss': 0.31, 'learning_rate': 1.521342324939057e-08, 'epoch': 1.97} {'loss': 0.3392, 'learning_rate': 1.5194903227604417e-08, 'epoch': 1.97} {'loss': 0.2192, 'learning_rate': 1.5176394476764667e-08, 'epoch': 1.97} {'loss': 0.2547, 'learning_rate': 1.5157896996891296e-08, 'epoch': 1.97} {'loss': 0.3376, 'learning_rate': 1.5139410788006516e-08, 'epoch': 1.97} {'loss': 0.3171, 'learning_rate': 1.51209358501303e-08, 'epoch': 1.97} {'loss': 0.2097, 'learning_rate': 1.5102472183283755e-08, 'epoch': 1.97} {'loss': 0.3494, 'learning_rate': 1.5084019787487968e-08, 'epoch': 1.97} {'loss': 0.261, 'learning_rate': 1.5065578662762927e-08, 'epoch': 1.97} {'loss': 0.2955, 'learning_rate': 1.504714880913083e-08, 'epoch': 1.97} {'loss': 0.2451, 'learning_rate': 1.5028730226611666e-08, 'epoch': 1.97} {'loss': 0.2409, 'learning_rate': 1.5010322915226528e-08, 'epoch': 1.97} {'loss': 0.2547, 'learning_rate': 1.4991926874996508e-08, 'epoch': 1.97} {'loss': 0.3986, 'learning_rate': 1.4973542105941596e-08, 'epoch': 1.97} {'loss': 0.1934, 'learning_rate': 1.495516860808177e-08, 'epoch': 1.97} {'loss': 0.2763, 'learning_rate': 1.493680638143924e-08, 'epoch': 1.97} {'loss': 0.201, 'learning_rate': 1.4918455426035094e-08, 'epoch': 1.97} {'loss': 0.2379, 'learning_rate': 1.4900115741889321e-08, 'epoch': 1.97} {'loss': 0.1582, 'learning_rate': 1.4881787329021902e-08, 'epoch': 1.97} {'loss': 0.3788, 'learning_rate': 1.4863470187453931e-08, 'epoch': 1.97} {'loss': 0.2846, 'learning_rate': 1.4845164317206506e-08, 'epoch': 1.97} {'loss': 0.4004, 'learning_rate': 1.4826869718300718e-08, 'epoch': 1.97} {'loss': 0.3062, 'learning_rate': 1.4808586390756552e-08, 'epoch': 1.97} {'loss': 0.3519, 'learning_rate': 1.4790314334593992e-08, 'epoch': 1.97} {'loss': 0.5187, 'learning_rate': 1.4772053549835242e-08, 'epoch': 1.97} {'loss': 0.3378, 'learning_rate': 1.4753804036499175e-08, 'epoch': 1.97} {'loss': 0.4185, 'learning_rate': 1.4735565794607998e-08, 'epoch': 1.97} {'loss': 0.237, 'learning_rate': 1.4717338824180583e-08, 'epoch': 1.97} {'loss': 0.1787, 'learning_rate': 1.4699123125239134e-08, 'epoch': 1.97} {'loss': 0.3155, 'learning_rate': 1.4680918697804747e-08, 'epoch': 1.97} {'loss': 0.3887, 'learning_rate': 1.4662725541895185e-08, 'epoch': 1.97} {'loss': 0.2884, 'learning_rate': 1.464454365753376e-08, 'epoch': 1.97} {'loss': 0.3889, 'learning_rate': 1.462637304473824e-08, 'epoch': 1.97} {'loss': 0.2241, 'learning_rate': 1.4608213703531937e-08, 'epoch': 1.97} {'loss': 0.1546, 'learning_rate': 1.4590065633933726e-08, 'epoch': 1.97} {'loss': 0.3252, 'learning_rate': 1.457192883596581e-08, 'epoch': 1.97} {'loss': 0.2686, 'learning_rate': 1.4553803309645953e-08, 'epoch': 1.97} {'loss': 0.184, 'learning_rate': 1.453568905499636e-08, 'epoch': 1.97} {'loss': 0.3145, 'learning_rate': 1.4517586072037016e-08, 'epoch': 1.97} {'loss': 0.3144, 'learning_rate': 1.4499494360789012e-08, 'epoch': 1.97} {'loss': 0.1707, 'learning_rate': 1.4481413921271226e-08, 'epoch': 1.97} {'loss': 0.2049, 'learning_rate': 1.446334475350586e-08, 'epoch': 1.97} {'loss': 0.2896, 'learning_rate': 1.4445286857512897e-08, 'epoch': 1.97} {'loss': 0.4196, 'learning_rate': 1.4427240233311213e-08, 'epoch': 1.97} {'loss': 0.3457, 'learning_rate': 1.4409204880924121e-08, 'epoch': 1.97} {'loss': 0.2333, 'learning_rate': 1.4391180800368277e-08, 'epoch': 1.97} {'loss': 0.2072, 'learning_rate': 1.4373167991666992e-08, 'epoch': 1.97} {'loss': 0.3159, 'learning_rate': 1.4355166454839142e-08, 'epoch': 1.97} {'loss': 0.3846, 'learning_rate': 1.4337176189905822e-08, 'epoch': 1.97} {'loss': 0.2816, 'learning_rate': 1.4319197196887014e-08, 'epoch': 1.97} {'loss': 0.4003, 'learning_rate': 1.4301229475802703e-08, 'epoch': 1.97} {'loss': 0.3347, 'learning_rate': 1.4283273026672873e-08, 'epoch': 1.97} {'loss': 0.352, 'learning_rate': 1.4265327849519727e-08, 'epoch': 1.97} {'loss': 0.321, 'learning_rate': 1.4247393944361033e-08, 'epoch': 1.97} {'loss': 0.3649, 'learning_rate': 1.422947131121788e-08, 'epoch': 1.97} {'loss': 0.338, 'learning_rate': 1.4211559950112475e-08, 'epoch': 1.97} {'loss': 0.2943, 'learning_rate': 1.419365986106147e-08, 'epoch': 1.97} {'loss': 0.4198, 'learning_rate': 1.4175771044088183e-08, 'epoch': 1.97} {'loss': 0.2975, 'learning_rate': 1.4157893499210373e-08, 'epoch': 1.97} {'loss': 0.2638, 'learning_rate': 1.4140027226450248e-08, 'epoch': 1.97} {'loss': 0.274, 'learning_rate': 1.412217222582779e-08, 'epoch': 1.97} {'loss': 0.3429, 'learning_rate': 1.4104328497360763e-08, 'epoch': 1.97} {'loss': 0.342, 'learning_rate': 1.4086496041072484e-08, 'epoch': 1.97} {'loss': 0.2176, 'learning_rate': 1.4068674856980713e-08, 'epoch': 1.97} {'loss': 0.2388, 'learning_rate': 1.4050864945107656e-08, 'epoch': 1.97} {'loss': 0.426, 'learning_rate': 1.4033066305471077e-08, 'epoch': 1.97} {'loss': 0.4553, 'learning_rate': 1.4015278938093179e-08, 'epoch': 1.97} {'loss': 0.3619, 'learning_rate': 1.3997502842992839e-08, 'epoch': 1.97} {'loss': 0.3335, 'learning_rate': 1.3979738020190037e-08, 'epoch': 1.97} {'loss': 0.2483, 'learning_rate': 1.396198446970476e-08, 'epoch': 1.97} {'loss': 0.2354, 'learning_rate': 1.39442421915581e-08, 'epoch': 1.97} {'loss': 0.3832, 'learning_rate': 1.3926511185768931e-08, 'epoch': 1.97} {'loss': 0.4105, 'learning_rate': 1.390879145235946e-08, 'epoch': 1.97} {'loss': 0.2959, 'learning_rate': 1.389108299134634e-08, 'epoch': 1.97} {'loss': 0.3857, 'learning_rate': 1.387338580275177e-08, 'epoch': 1.97} {'loss': 0.2722, 'learning_rate': 1.3855699886594632e-08, 'epoch': 1.97} {'loss': 0.1298, 'learning_rate': 1.3838025242896014e-08, 'epoch': 1.97} {'loss': 0.2633, 'learning_rate': 1.3820361871675902e-08, 'epoch': 1.97} {'loss': 0.385, 'learning_rate': 1.380270977295317e-08, 'epoch': 1.97} {'loss': 0.1993, 'learning_rate': 1.3785068946747804e-08, 'epoch': 1.97} {'loss': 0.3001, 'learning_rate': 1.3767439393079785e-08, 'epoch': 1.97} {'loss': 0.2674, 'learning_rate': 1.3749821111970207e-08, 'epoch': 1.97} {'loss': 0.3237, 'learning_rate': 1.3732214103437947e-08, 'epoch': 1.97} {'loss': 0.247, 'learning_rate': 1.3714618367502985e-08, 'epoch': 1.97} {'loss': 0.3076, 'learning_rate': 1.3697033904185308e-08, 'epoch': 1.97} {'loss': 0.2387, 'learning_rate': 1.3679460713504899e-08, 'epoch': 1.97} {'loss': 0.3063, 'learning_rate': 1.3661898795480632e-08, 'epoch': 1.97} {'loss': 0.2846, 'learning_rate': 1.3644348150133602e-08, 'epoch': 1.97} {'loss': 0.2445, 'learning_rate': 1.362680877748268e-08, 'epoch': 1.97} {'loss': 0.3307, 'learning_rate': 1.3609280677548965e-08, 'epoch': 1.97} {'loss': 0.3964, 'learning_rate': 1.3591763850350215e-08, 'epoch': 1.97} {'loss': 0.2465, 'learning_rate': 1.3574258295908638e-08, 'epoch': 1.97} {'loss': 0.1799, 'learning_rate': 1.3556764014241997e-08, 'epoch': 1.97} {'loss': 0.1915, 'learning_rate': 1.3539281005371385e-08, 'epoch': 1.97} {'loss': 0.3457, 'learning_rate': 1.3521809269314568e-08, 'epoch': 1.97} {'loss': 0.2468, 'learning_rate': 1.3504348806093747e-08, 'epoch': 1.97} {'loss': 0.2046, 'learning_rate': 1.348689961572669e-08, 'epoch': 1.97} {'loss': 0.3076, 'learning_rate': 1.3469461698234487e-08, 'epoch': 1.97} {'loss': 0.3198, 'learning_rate': 1.3452035053637125e-08, 'epoch': 1.97} {'loss': 0.2579, 'learning_rate': 1.3434619681951255e-08, 'epoch': 1.97} {'loss': 0.2872, 'learning_rate': 1.3417215583200195e-08, 'epoch': 1.97} {'loss': 0.3004, 'learning_rate': 1.3399822757401703e-08, 'epoch': 1.97} {'loss': 0.3, 'learning_rate': 1.3382441204575768e-08, 'epoch': 1.97} {'loss': 0.1405, 'learning_rate': 1.3365070924742374e-08, 'epoch': 1.97} {'loss': 0.278, 'learning_rate': 1.3347711917920392e-08, 'epoch': 1.97} {'loss': 0.4004, 'learning_rate': 1.3330364184129807e-08, 'epoch': 1.97} {'loss': 0.2466, 'learning_rate': 1.3313027723389493e-08, 'epoch': 1.97} {'loss': 0.3325, 'learning_rate': 1.3295702535720546e-08, 'epoch': 1.97} {'loss': 0.3073, 'learning_rate': 1.3278388621141836e-08, 'epoch': 1.97} {'loss': 0.2758, 'learning_rate': 1.326108597967224e-08, 'epoch': 1.97} {'loss': 0.3441, 'learning_rate': 1.3243794611331739e-08, 'epoch': 1.97} {'loss': 0.4528, 'learning_rate': 1.3226514516140321e-08, 'epoch': 1.97} {'loss': 0.4288, 'learning_rate': 1.3209245694117967e-08, 'epoch': 1.97} {'loss': 0.3097, 'learning_rate': 1.3191988145281332e-08, 'epoch': 1.97} {'loss': 0.3291, 'learning_rate': 1.3174741869653729e-08, 'epoch': 1.97} {'loss': 0.2161, 'learning_rate': 1.3157506867251813e-08, 'epoch': 1.97} {'loss': 0.3465, 'learning_rate': 1.3140283138095566e-08, 'epoch': 1.97} {'loss': 0.2822, 'learning_rate': 1.3123070682204975e-08, 'epoch': 1.97} {'loss': 0.4928, 'learning_rate': 1.3105869499600022e-08, 'epoch': 1.97} {'loss': 0.3455, 'learning_rate': 1.308867959029958e-08, 'epoch': 1.97} {'loss': 0.1902, 'learning_rate': 1.3071500954322525e-08, 'epoch': 1.97} {'loss': 0.2926, 'learning_rate': 1.305433359168884e-08, 'epoch': 1.97} {'loss': 0.3542, 'learning_rate': 1.3037177502417397e-08, 'epoch': 1.97} {'loss': 0.4048, 'learning_rate': 1.3020032686527073e-08, 'epoch': 1.97} {'loss': 0.316, 'learning_rate': 1.300289914403896e-08, 'epoch': 1.97} {'loss': 0.2626, 'learning_rate': 1.2985776874971933e-08, 'epoch': 1.97} {'loss': 0.2004, 'learning_rate': 1.2968665879343756e-08, 'epoch': 1.97} {'loss': 0.2445, 'learning_rate': 1.2951566157175521e-08, 'epoch': 1.97} {'loss': 0.254, 'learning_rate': 1.2934477708486104e-08, 'epoch': 1.97} {'loss': 0.3861, 'learning_rate': 1.2917400533294378e-08, 'epoch': 1.97} {'loss': 0.3254, 'learning_rate': 1.2900334631619216e-08, 'epoch': 1.97} {'loss': 0.211, 'learning_rate': 1.2883280003480603e-08, 'epoch': 1.97} {'loss': 0.3159, 'learning_rate': 1.2866236648898522e-08, 'epoch': 1.97} {'loss': 0.4007, 'learning_rate': 1.2849204567890738e-08, 'epoch': 1.97} {'loss': 0.3572, 'learning_rate': 1.2832183760476125e-08, 'epoch': 1.97} {'loss': 0.2894, 'learning_rate': 1.2815174226675774e-08, 'epoch': 1.97} {'loss': 0.435, 'learning_rate': 1.2798175966507453e-08, 'epoch': 1.97} {'loss': 0.582, 'learning_rate': 1.2781188979991144e-08, 'epoch': 1.97} {'loss': 0.4174, 'learning_rate': 1.276421326714683e-08, 'epoch': 1.97} {'loss': 0.3267, 'learning_rate': 1.2747248827991165e-08, 'epoch': 1.97} {'loss': 0.2525, 'learning_rate': 1.2730295662545244e-08, 'epoch': 1.97} {'loss': 0.3282, 'learning_rate': 1.271335377082683e-08, 'epoch': 1.97} {'loss': 0.2926, 'learning_rate': 1.2696423152857017e-08, 'epoch': 1.97} {'loss': 0.2498, 'learning_rate': 1.267950380865246e-08, 'epoch': 1.97} {'loss': 0.2908, 'learning_rate': 1.266259573823425e-08, 'epoch': 1.97} {'loss': 0.4203, 'learning_rate': 1.2645698941621265e-08, 'epoch': 1.97} {'loss': 0.3553, 'learning_rate': 1.2628813418831265e-08, 'epoch': 1.97} {'loss': 0.3037, 'learning_rate': 1.2611939169885346e-08, 'epoch': 1.97} {'loss': 0.3058, 'learning_rate': 1.259507619480016e-08, 'epoch': 1.97} {'loss': 0.2053, 'learning_rate': 1.2578224493595692e-08, 'epoch': 1.97} {'loss': 0.3083, 'learning_rate': 1.2561384066293036e-08, 'epoch': 1.97} {'loss': 0.3514, 'learning_rate': 1.2544554912907736e-08, 'epoch': 1.97} {'loss': 0.3808, 'learning_rate': 1.2527737033460885e-08, 'epoch': 1.97} {'loss': 0.2454, 'learning_rate': 1.2510930427971357e-08, 'epoch': 1.97} {'loss': 0.3965, 'learning_rate': 1.2494135096456917e-08, 'epoch': 1.97} {'loss': 0.4171, 'learning_rate': 1.2477351038938656e-08, 'epoch': 1.97} {'loss': 0.2831, 'learning_rate': 1.2460578255433232e-08, 'epoch': 1.97} {'loss': 0.3131, 'learning_rate': 1.2443816745960625e-08, 'epoch': 1.97} {'loss': 0.4065, 'learning_rate': 1.242706651053971e-08, 'epoch': 1.97} {'loss': 0.4894, 'learning_rate': 1.241032754919047e-08, 'epoch': 1.97} {'loss': 0.2957, 'learning_rate': 1.2393599861929561e-08, 'epoch': 1.97} {'loss': 0.3217, 'learning_rate': 1.2376883448778076e-08, 'epoch': 1.97} {'loss': 0.3256, 'learning_rate': 1.2360178309752668e-08, 'epoch': 1.97} {'loss': 0.1047, 'learning_rate': 1.2343484444874431e-08, 'epoch': 1.97} {'loss': 0.2964, 'learning_rate': 1.232680185416002e-08, 'epoch': 1.97} {'loss': 0.1567, 'learning_rate': 1.2310130537630527e-08, 'epoch': 1.97} {'loss': 0.3031, 'learning_rate': 1.2293470495303716e-08, 'epoch': 1.97} {'loss': 0.2703, 'learning_rate': 1.2276821727197352e-08, 'epoch': 1.97} {'loss': 0.3276, 'learning_rate': 1.2260184233331418e-08, 'epoch': 1.97} {'loss': 0.3188, 'learning_rate': 1.2243558013724788e-08, 'epoch': 1.97} {'loss': 0.2512, 'learning_rate': 1.2226943068396335e-08, 'epoch': 1.97} {'loss': 0.3022, 'learning_rate': 1.2210339397363824e-08, 'epoch': 1.97} {'loss': 0.4814, 'learning_rate': 1.2193747000646128e-08, 'epoch': 1.97} {'loss': 0.1673, 'learning_rate': 1.217716587826323e-08, 'epoch': 1.97} {'loss': 0.3366, 'learning_rate': 1.2160596030232896e-08, 'epoch': 1.97} {'loss': 0.1339, 'learning_rate': 1.2144037456573999e-08, 'epoch': 1.97} {'loss': 0.183, 'learning_rate': 1.2127490157305411e-08, 'epoch': 1.97} {'loss': 0.3294, 'learning_rate': 1.2110954132444896e-08, 'epoch': 1.97} {'loss': 0.1973, 'learning_rate': 1.209442938201244e-08, 'epoch': 1.97} {'loss': 0.3919, 'learning_rate': 1.2077915906025806e-08, 'epoch': 1.97} {'loss': 0.2276, 'learning_rate': 1.2061413704503865e-08, 'epoch': 1.97} {'loss': 0.3221, 'learning_rate': 1.2044922777465496e-08, 'epoch': 1.97} {'loss': 0.3394, 'learning_rate': 1.2028443124928457e-08, 'epoch': 1.97} {'loss': 0.2326, 'learning_rate': 1.2011974746912735e-08, 'epoch': 1.97} {'loss': 0.3101, 'learning_rate': 1.1995517643436095e-08, 'epoch': 1.97} {'loss': 0.3252, 'learning_rate': 1.1979071814517408e-08, 'epoch': 1.97} {'loss': 0.323, 'learning_rate': 1.1962637260174436e-08, 'epoch': 1.97} {'loss': 0.3041, 'learning_rate': 1.1946213980426058e-08, 'epoch': 1.97} {'loss': 0.4082, 'learning_rate': 1.1929801975292254e-08, 'epoch': 1.97} {'loss': 0.274, 'learning_rate': 1.1913401244789679e-08, 'epoch': 1.97} {'loss': 0.2626, 'learning_rate': 1.1897011788937206e-08, 'epoch': 1.97} {'loss': 0.3863, 'learning_rate': 1.1880633607754821e-08, 'epoch': 1.97} {'loss': 0.4878, 'learning_rate': 1.1864266701259174e-08, 'epoch': 1.97} {'loss': 0.2511, 'learning_rate': 1.1847911069469142e-08, 'epoch': 1.97} {'loss': 0.2532, 'learning_rate': 1.1831566712403597e-08, 'epoch': 1.97} {'loss': 0.3539, 'learning_rate': 1.1815233630081413e-08, 'epoch': 1.97} {'loss': 0.1674, 'learning_rate': 1.1798911822520353e-08, 'epoch': 1.97} {'loss': 0.2742, 'learning_rate': 1.1782601289738183e-08, 'epoch': 1.97} {'loss': 0.1971, 'learning_rate': 1.1766302031754884e-08, 'epoch': 1.97} {'loss': 0.3349, 'learning_rate': 1.175001404858822e-08, 'epoch': 1.97} {'loss': 0.3087, 'learning_rate': 1.1733737340255957e-08, 'epoch': 1.97} {'loss': 0.4028, 'learning_rate': 1.1717471906776967e-08, 'epoch': 1.97} {'loss': 0.354, 'learning_rate': 1.1701217748170123e-08, 'epoch': 1.97} {'loss': 0.2826, 'learning_rate': 1.168497486445319e-08, 'epoch': 1.97} {'loss': 0.2354, 'learning_rate': 1.1668743255643933e-08, 'epoch': 1.97} {'loss': 0.2924, 'learning_rate': 1.1652522921761223e-08, 'epoch': 1.97} {'loss': 0.2196, 'learning_rate': 1.1636313862823934e-08, 'epoch': 1.97} {'loss': 0.1877, 'learning_rate': 1.162011607884983e-08, 'epoch': 1.97} {'loss': 0.3011, 'learning_rate': 1.1603929569856675e-08, 'epoch': 1.97} {'loss': 0.3613, 'learning_rate': 1.1587754335864454e-08, 'epoch': 1.97} {'loss': 0.2651, 'learning_rate': 1.1571590376889819e-08, 'epoch': 1.97} {'loss': 0.172, 'learning_rate': 1.1555437692950532e-08, 'epoch': 1.97} {'loss': 0.5202, 'learning_rate': 1.153929628406658e-08, 'epoch': 1.97} {'loss': 0.1806, 'learning_rate': 1.1523166150255727e-08, 'epoch': 1.97} {'loss': 0.1361, 'learning_rate': 1.1507047291535734e-08, 'epoch': 1.97} {'loss': 0.2224, 'learning_rate': 1.1490939707924365e-08, 'epoch': 1.97} {'loss': 0.3424, 'learning_rate': 1.1474843399440493e-08, 'epoch': 1.97} {'loss': 0.2675, 'learning_rate': 1.1458758366101885e-08, 'epoch': 1.97} {'loss': 0.2615, 'learning_rate': 1.1442684607927412e-08, 'epoch': 1.97} {'loss': 0.3295, 'learning_rate': 1.1426622124933729e-08, 'epoch': 1.97} {'loss': 0.2619, 'learning_rate': 1.1410570917141928e-08, 'epoch': 1.97} {'loss': 0.2112, 'learning_rate': 1.1394530984566442e-08, 'epoch': 1.97} {'loss': 0.3088, 'learning_rate': 1.137850232722726e-08, 'epoch': 1.97} {'loss': 0.3421, 'learning_rate': 1.1362484945143248e-08, 'epoch': 1.97} {'loss': 0.2785, 'learning_rate': 1.1346478838331065e-08, 'epoch': 1.97} {'loss': 0.2835, 'learning_rate': 1.1330484006809584e-08, 'epoch': 1.97} {'loss': 0.4176, 'learning_rate': 1.1314500450595455e-08, 'epoch': 1.97} {'loss': 0.2655, 'learning_rate': 1.1298528169708667e-08, 'epoch': 1.97} {'loss': 0.2203, 'learning_rate': 1.128256716416698e-08, 'epoch': 1.97} {'loss': 0.2458, 'learning_rate': 1.1266617433987048e-08, 'epoch': 1.97} {'loss': 0.3265, 'learning_rate': 1.1250678979187747e-08, 'epoch': 1.97} {'loss': 0.3278, 'learning_rate': 1.1234751799786837e-08, 'epoch': 1.97} {'loss': 0.2745, 'learning_rate': 1.1218835895802083e-08, 'epoch': 1.97} {'loss': 0.3296, 'learning_rate': 1.1202931267252359e-08, 'epoch': 1.97} {'loss': 0.3185, 'learning_rate': 1.118703791415543e-08, 'epoch': 1.97} {'loss': 0.193, 'learning_rate': 1.1171155836529058e-08, 'epoch': 1.97} {'loss': 0.4444, 'learning_rate': 1.1155285034389896e-08, 'epoch': 1.97} {'loss': 0.2091, 'learning_rate': 1.1139425507757928e-08, 'epoch': 1.97} {'loss': 0.1826, 'learning_rate': 1.1123577256649808e-08, 'epoch': 1.97} {'loss': 0.4585, 'learning_rate': 1.1107740281083302e-08, 'epoch': 1.97} {'loss': 0.3175, 'learning_rate': 1.1091914581076169e-08, 'epoch': 1.97} {'loss': 0.1721, 'learning_rate': 1.1076100156648395e-08, 'epoch': 1.97} {'loss': 0.329, 'learning_rate': 1.1060297007814413e-08, 'epoch': 1.97} {'loss': 0.2993, 'learning_rate': 1.1044505134595319e-08, 'epoch': 1.97} {'loss': 0.4854, 'learning_rate': 1.1028724537006652e-08, 'epoch': 1.97} {'loss': 0.3585, 'learning_rate': 1.101295521506729e-08, 'epoch': 1.97} {'loss': 0.4551, 'learning_rate': 1.0997197168794993e-08, 'epoch': 1.97} {'loss': 0.3378, 'learning_rate': 1.0981450398207527e-08, 'epoch': 1.97} {'loss': 0.2749, 'learning_rate': 1.0965714903322654e-08, 'epoch': 1.97} {'loss': 0.4093, 'learning_rate': 1.094999068415703e-08, 'epoch': 1.97} {'loss': 0.3031, 'learning_rate': 1.0934277740730636e-08, 'epoch': 1.97} {'loss': 0.2772, 'learning_rate': 1.0918576073059018e-08, 'epoch': 1.97} {'loss': 0.2479, 'learning_rate': 1.0902885681161046e-08, 'epoch': 1.97} {'loss': 0.3097, 'learning_rate': 1.0887206565054486e-08, 'epoch': 1.97} {'loss': 0.1993, 'learning_rate': 1.0871538724755992e-08, 'epoch': 1.97} {'loss': 0.2224, 'learning_rate': 1.0855882160284437e-08, 'epoch': 1.97} {'loss': 0.2708, 'learning_rate': 1.0840236871656474e-08, 'epoch': 1.97} {'loss': 0.2742, 'learning_rate': 1.0824602858892087e-08, 'epoch': 1.97} {'loss': 0.3581, 'learning_rate': 1.0808980122005707e-08, 'epoch': 1.97} {'loss': 0.2913, 'learning_rate': 1.0793368661016213e-08, 'epoch': 1.97} {'loss': 0.3834, 'learning_rate': 1.0777768475942474e-08, 'epoch': 1.97} {'loss': 0.1908, 'learning_rate': 1.0762179566801146e-08, 'epoch': 1.97} {'loss': 0.4591, 'learning_rate': 1.074660193360888e-08, 'epoch': 1.97} {'loss': 0.3386, 'learning_rate': 1.0731035576384553e-08, 'epoch': 1.97} {'loss': 0.1625, 'learning_rate': 1.0715480495145925e-08, 'epoch': 1.97} {'loss': 0.2739, 'learning_rate': 1.0699936689909652e-08, 'epoch': 1.97} {'loss': 0.3093, 'learning_rate': 1.0684404160693495e-08, 'epoch': 1.97} {'loss': 0.3039, 'learning_rate': 1.066888290751411e-08, 'epoch': 1.97} {'loss': 0.2898, 'learning_rate': 1.0653372930391482e-08, 'epoch': 1.97} {'loss': 0.278, 'learning_rate': 1.063787422934115e-08, 'epoch': 1.97} {'loss': 0.3388, 'learning_rate': 1.062238680438088e-08, 'epoch': 1.97} {'loss': 0.3063, 'learning_rate': 1.0606910655528436e-08, 'epoch': 1.97} {'loss': 0.3256, 'learning_rate': 1.0591445782801579e-08, 'epoch': 1.97} {'loss': 0.2987, 'learning_rate': 1.0575992186216966e-08, 'epoch': 1.97} {'loss': 0.2566, 'learning_rate': 1.0560549865792358e-08, 'epoch': 1.97} {'loss': 0.4221, 'learning_rate': 1.054511882154552e-08, 'epoch': 1.97} {'loss': 0.4622, 'learning_rate': 1.0529699053493103e-08, 'epoch': 1.97} {'loss': 0.4567, 'learning_rate': 1.0514290561653984e-08, 'epoch': 1.97} {'loss': 0.2165, 'learning_rate': 1.0498893346044815e-08, 'epoch': 1.97} {'loss': 0.2331, 'learning_rate': 1.0483507406682248e-08, 'epoch': 1.97} {'loss': 0.1315, 'learning_rate': 1.0468132743584048e-08, 'epoch': 1.97} {'loss': 0.3252, 'learning_rate': 1.0452769356767978e-08, 'epoch': 1.97} {'loss': 0.1862, 'learning_rate': 1.0437417246250692e-08, 'epoch': 1.97} {'loss': 0.3722, 'learning_rate': 1.0422076412051064e-08, 'epoch': 1.97} {'loss': 0.366, 'learning_rate': 1.0406746854184635e-08, 'epoch': 1.97} {'loss': 0.2528, 'learning_rate': 1.0391428572669171e-08, 'epoch': 1.97} {'loss': 0.1588, 'learning_rate': 1.0376121567522435e-08, 'epoch': 1.97} {'loss': 0.2821, 'learning_rate': 1.036082583876108e-08, 'epoch': 1.97} {'loss': 0.3594, 'learning_rate': 1.034554138640287e-08, 'epoch': 1.97} {'loss': 0.1745, 'learning_rate': 1.0330268210465567e-08, 'epoch': 1.97} {'loss': 0.284, 'learning_rate': 1.0315006310964715e-08, 'epoch': 1.97} {'loss': 0.3264, 'learning_rate': 1.0299755687919189e-08, 'epoch': 1.97} {'loss': 0.3064, 'learning_rate': 1.028451634134564e-08, 'epoch': 1.97} {'loss': 0.3558, 'learning_rate': 1.0269288271261835e-08, 'epoch': 1.97} {'loss': 0.2445, 'learning_rate': 1.0254071477683314e-08, 'epoch': 1.97} {'loss': 0.171, 'learning_rate': 1.0238865960628953e-08, 'epoch': 1.97} {'loss': 0.2262, 'learning_rate': 1.0223671720114292e-08, 'epoch': 1.97} {'loss': 0.3138, 'learning_rate': 1.0208488756158208e-08, 'epoch': 1.97} {'loss': 0.2289, 'learning_rate': 1.0193317068777352e-08, 'epoch': 1.97} {'loss': 0.2089, 'learning_rate': 1.017815665798838e-08, 'epoch': 1.97} {'loss': 0.1297, 'learning_rate': 1.0163007523809054e-08, 'epoch': 1.97} {'loss': 0.3191, 'learning_rate': 1.0147869666254916e-08, 'epoch': 1.97} {'loss': 0.267, 'learning_rate': 1.0132743085344842e-08, 'epoch': 1.97} {'loss': 0.2927, 'learning_rate': 1.0117627781095484e-08, 'epoch': 1.97} {'loss': 0.2631, 'learning_rate': 1.0102523753523497e-08, 'epoch': 1.97} {'loss': 0.2785, 'learning_rate': 1.0087431002645532e-08, 'epoch': 1.97} {'loss': 0.3514, 'learning_rate': 1.0072349528479353e-08, 'epoch': 1.97} {'loss': 0.4077, 'learning_rate': 1.0057279331042724e-08, 'epoch': 1.97} {'loss': 0.2501, 'learning_rate': 1.0042220410351188e-08, 'epoch': 1.97} {'loss': 0.476, 'learning_rate': 1.002717276642251e-08, 'epoch': 1.97} {'loss': 0.2265, 'learning_rate': 1.0012136399272233e-08, 'epoch': 1.97} {'loss': 0.3538, 'learning_rate': 9.997111308920338e-09, 'epoch': 1.97} {'loss': 0.324, 'learning_rate': 9.98209749538126e-09, 'epoch': 1.97} {'loss': 0.2847, 'learning_rate': 9.967094958672763e-09, 'epoch': 1.97} {'loss': 0.2937, 'learning_rate': 9.952103698811499e-09, 'epoch': 1.97} {'loss': 0.2871, 'learning_rate': 9.937123715814123e-09, 'epoch': 1.97} {'loss': 0.3942, 'learning_rate': 9.922155009699508e-09, 'epoch': 1.97} {'loss': 0.3096, 'learning_rate': 9.907197580482087e-09, 'epoch': 1.97} {'loss': 0.1567, 'learning_rate': 9.892251428179622e-09, 'epoch': 1.97} {'loss': 0.331, 'learning_rate': 9.877316552808768e-09, 'epoch': 1.97} {'loss': 0.2535, 'learning_rate': 9.8623929543884e-09, 'epoch': 1.97} {'loss': 0.2706, 'learning_rate': 9.847480632931838e-09, 'epoch': 1.97} {'loss': 0.4312, 'learning_rate': 9.832579588459068e-09, 'epoch': 1.97} {'loss': 0.2855, 'learning_rate': 9.817689820984521e-09, 'epoch': 1.97} {'loss': 0.1504, 'learning_rate': 9.802811330527074e-09, 'epoch': 1.97} {'loss': 0.2249, 'learning_rate': 9.787944117102265e-09, 'epoch': 1.97} {'loss': 0.2743, 'learning_rate': 9.773088180726754e-09, 'epoch': 1.97} {'loss': 0.3309, 'learning_rate': 9.758243521417187e-09, 'epoch': 1.97} {'loss': 0.3309, 'learning_rate': 9.743410139192444e-09, 'epoch': 1.97} {'loss': 0.3988, 'learning_rate': 9.728588034065845e-09, 'epoch': 1.97} {'loss': 0.3045, 'learning_rate': 9.713777206057373e-09, 'epoch': 1.97} {'loss': 0.3727, 'learning_rate': 9.698977655181463e-09, 'epoch': 1.97} {'loss': 0.219, 'learning_rate': 9.684189381455878e-09, 'epoch': 1.97} {'loss': 0.1258, 'learning_rate': 9.66941238489727e-09, 'epoch': 1.97} {'loss': 0.2472, 'learning_rate': 9.654646665522294e-09, 'epoch': 1.97} {'loss': 0.1853, 'learning_rate': 9.639892223347602e-09, 'epoch': 1.97} {'loss': 0.3034, 'learning_rate': 9.625149058388739e-09, 'epoch': 1.97} {'loss': 0.4137, 'learning_rate': 9.610417170664576e-09, 'epoch': 1.97} {'loss': 0.3439, 'learning_rate': 9.595696560189549e-09, 'epoch': 1.97} {'loss': 0.2292, 'learning_rate': 9.58098722698142e-09, 'epoch': 1.97} {'loss': 0.3522, 'learning_rate': 9.566289171056842e-09, 'epoch': 1.97} {'loss': 0.3965, 'learning_rate': 9.551602392431358e-09, 'epoch': 1.97} {'loss': 0.3402, 'learning_rate': 9.536926891123844e-09, 'epoch': 1.97} {'loss': 0.2694, 'learning_rate': 9.522262667147619e-09, 'epoch': 1.97} {'loss': 0.2243, 'learning_rate': 9.50760972052267e-09, 'epoch': 1.97} {'loss': 0.3049, 'learning_rate': 9.492968051262319e-09, 'epoch': 1.97} {'loss': 0.4325, 'learning_rate': 9.47833765938544e-09, 'epoch': 1.97} {'loss': 0.098, 'learning_rate': 9.463718544907573e-09, 'epoch': 1.97} {'loss': 0.378, 'learning_rate': 9.449110707845378e-09, 'epoch': 1.97} {'loss': 0.3302, 'learning_rate': 9.434514148215501e-09, 'epoch': 1.97} {'loss': 0.1897, 'learning_rate': 9.4199288660346e-09, 'epoch': 1.97} {'loss': 0.2357, 'learning_rate': 9.405354861318217e-09, 'epoch': 1.97} {'loss': 0.2706, 'learning_rate': 9.390792134084114e-09, 'epoch': 1.97} {'loss': 0.3973, 'learning_rate': 9.376240684346727e-09, 'epoch': 1.97} {'loss': 0.3589, 'learning_rate': 9.361700512124928e-09, 'epoch': 1.97} {'loss': 0.1091, 'learning_rate': 9.347171617433148e-09, 'epoch': 1.97} {'loss': 0.3392, 'learning_rate': 9.332654000289155e-09, 'epoch': 1.97} {'loss': 0.2127, 'learning_rate': 9.318147660708488e-09, 'epoch': 1.97} {'loss': 0.278, 'learning_rate': 9.303652598707802e-09, 'epoch': 1.97} {'loss': 0.3161, 'learning_rate': 9.28916881430375e-09, 'epoch': 1.97} {'loss': 0.2013, 'learning_rate': 9.274696307511876e-09, 'epoch': 1.97} {'loss': 0.201, 'learning_rate': 9.260235078349944e-09, 'epoch': 1.97} {'loss': 0.1771, 'learning_rate': 9.245785126832386e-09, 'epoch': 1.97} {'loss': 0.3257, 'learning_rate': 9.231346452978074e-09, 'epoch': 1.97} {'loss': 0.2982, 'learning_rate': 9.216919056800333e-09, 'epoch': 1.97} {'loss': 0.363, 'learning_rate': 9.202502938316927e-09, 'epoch': 1.97} {'loss': 0.4735, 'learning_rate': 9.188098097544507e-09, 'epoch': 1.97} {'loss': 0.2149, 'learning_rate': 9.173704534498618e-09, 'epoch': 1.97} {'loss': 0.2959, 'learning_rate': 9.159322249195911e-09, 'epoch': 1.97} {'loss': 0.2245, 'learning_rate': 9.144951241651933e-09, 'epoch': 1.97} {'loss': 0.4302, 'learning_rate': 9.130591511884446e-09, 'epoch': 1.97} {'loss': 0.2852, 'learning_rate': 9.116243059907881e-09, 'epoch': 1.97} {'loss': 0.305, 'learning_rate': 9.101905885740003e-09, 'epoch': 1.97} {'loss': 0.2339, 'learning_rate': 9.087579989395245e-09, 'epoch': 1.97} {'loss': 0.3541, 'learning_rate': 9.07326537089137e-09, 'epoch': 1.97} {'loss': 0.3444, 'learning_rate': 9.058962030243923e-09, 'epoch': 1.97} {'loss': 0.2584, 'learning_rate': 9.044669967468444e-09, 'epoch': 1.97} {'loss': 0.3801, 'learning_rate': 9.0303891825827e-09, 'epoch': 1.97} {'loss': 0.3022, 'learning_rate': 9.016119675601121e-09, 'epoch': 1.97} {'loss': 0.2881, 'learning_rate': 9.001861446540362e-09, 'epoch': 1.97} {'loss': 0.36, 'learning_rate': 8.987614495417074e-09, 'epoch': 1.97} {'loss': 0.2214, 'learning_rate': 8.973378822246803e-09, 'epoch': 1.97} {'loss': 0.3286, 'learning_rate': 8.959154427045091e-09, 'epoch': 1.97} {'loss': 0.2674, 'learning_rate': 8.944941309828593e-09, 'epoch': 1.97} {'loss': 0.4732, 'learning_rate': 8.930739470613957e-09, 'epoch': 1.97} {'loss': 0.2831, 'learning_rate': 8.916548909416733e-09, 'epoch': 1.97} {'loss': 0.3704, 'learning_rate': 8.90236962625246e-09, 'epoch': 1.97} {'loss': 0.3256, 'learning_rate': 8.888201621137793e-09, 'epoch': 1.97} {'loss': 0.1451, 'learning_rate': 8.874044894088274e-09, 'epoch': 1.97} {'loss': 0.2164, 'learning_rate': 8.859899445120557e-09, 'epoch': 1.97} {'loss': 0.2366, 'learning_rate': 8.845765274249073e-09, 'epoch': 1.97} {'loss': 0.1778, 'learning_rate': 8.83164238149159e-09, 'epoch': 1.97} {'loss': 0.4327, 'learning_rate': 8.817530766862537e-09, 'epoch': 1.97} {'loss': 0.2449, 'learning_rate': 8.803430430379678e-09, 'epoch': 1.97} {'loss': 0.2801, 'learning_rate': 8.789341372057447e-09, 'epoch': 1.97} {'loss': 0.3788, 'learning_rate': 8.775263591911387e-09, 'epoch': 1.97} {'loss': 0.1719, 'learning_rate': 8.761197089959261e-09, 'epoch': 1.97} {'loss': 0.4069, 'learning_rate': 8.747141866214393e-09, 'epoch': 1.97} {'loss': 0.4122, 'learning_rate': 8.733097920695655e-09, 'epoch': 1.97} {'loss': 0.3026, 'learning_rate': 8.71906525341637e-09, 'epoch': 1.97} {'loss': 0.2172, 'learning_rate': 8.705043864393192e-09, 'epoch': 1.97} {'loss': 0.2972, 'learning_rate': 8.691033753642774e-09, 'epoch': 1.97} {'loss': 0.4305, 'learning_rate': 8.67703492117955e-09, 'epoch': 1.97} {'loss': 0.2654, 'learning_rate': 8.663047367021282e-09, 'epoch': 1.97} {'loss': 0.3463, 'learning_rate': 8.649071091181293e-09, 'epoch': 1.97} {'loss': 0.2646, 'learning_rate': 8.635106093677347e-09, 'epoch': 1.97} {'loss': 0.211, 'learning_rate': 8.621152374523878e-09, 'epoch': 1.97} {'loss': 0.1569, 'learning_rate': 8.607209933736427e-09, 'epoch': 1.97} {'loss': 0.177, 'learning_rate': 8.593278771332758e-09, 'epoch': 1.97} {'loss': 0.2732, 'learning_rate': 8.579358887327304e-09, 'epoch': 1.97} {'loss': 0.2804, 'learning_rate': 8.56545028173561e-09, 'epoch': 1.97} {'loss': 0.1436, 'learning_rate': 8.551552954573217e-09, 'epoch': 1.97} {'loss': 0.3796, 'learning_rate': 8.537666905855668e-09, 'epoch': 1.97} {'loss': 0.2328, 'learning_rate': 8.523792135599618e-09, 'epoch': 1.97} {'loss': 0.4407, 'learning_rate': 8.509928643820608e-09, 'epoch': 1.97} {'loss': 0.2381, 'learning_rate': 8.496076430534183e-09, 'epoch': 1.97} {'loss': 0.3381, 'learning_rate': 8.482235495754775e-09, 'epoch': 1.97} {'loss': 0.3542, 'learning_rate': 8.46840583949904e-09, 'epoch': 1.97} {'loss': 0.3329, 'learning_rate': 8.454587461783625e-09, 'epoch': 1.97} {'loss': 0.3601, 'learning_rate': 8.44078036262186e-09, 'epoch': 1.97} {'loss': 0.1629, 'learning_rate': 8.426984542030392e-09, 'epoch': 1.97} {'loss': 0.353, 'learning_rate': 8.413200000025879e-09, 'epoch': 1.97} {'loss': 0.3291, 'learning_rate': 8.399426736621642e-09, 'epoch': 1.97} {'loss': 0.395, 'learning_rate': 8.385664751835442e-09, 'epoch': 1.97} {'loss': 0.3288, 'learning_rate': 8.371914045681717e-09, 'epoch': 1.97} {'loss': 0.298, 'learning_rate': 8.358174618176007e-09, 'epoch': 1.97} {'loss': 0.3313, 'learning_rate': 8.344446469333856e-09, 'epoch': 1.97} {'loss': 0.4913, 'learning_rate': 8.330729599170806e-09, 'epoch': 1.97} {'loss': 0.3186, 'learning_rate': 8.317024007702402e-09, 'epoch': 1.97} {'loss': 0.3085, 'learning_rate': 8.303329694944184e-09, 'epoch': 1.97} {'loss': 0.3811, 'learning_rate': 8.28964666091059e-09, 'epoch': 1.97} {'loss': 0.3838, 'learning_rate': 8.275974905619376e-09, 'epoch': 1.97} {'loss': 0.363, 'learning_rate': 8.262314429083873e-09, 'epoch': 1.97} {'loss': 0.2454, 'learning_rate': 8.24866523131962e-09, 'epoch': 1.97} {'loss': 0.1948, 'learning_rate': 8.23502731234327e-09, 'epoch': 1.97} {'loss': 0.3094, 'learning_rate': 8.221400672169255e-09, 'epoch': 1.97} {'loss': 0.3102, 'learning_rate': 8.207785310814231e-09, 'epoch': 1.98} {'loss': 0.3516, 'learning_rate': 8.19418122829152e-09, 'epoch': 1.98} {'loss': 0.2815, 'learning_rate': 8.180588424617775e-09, 'epoch': 1.98} {'loss': 0.234, 'learning_rate': 8.167006899808538e-09, 'epoch': 1.98} {'loss': 0.2842, 'learning_rate': 8.153436653878244e-09, 'epoch': 1.98} {'loss': 0.33, 'learning_rate': 8.139877686842435e-09, 'epoch': 1.98} {'loss': 0.2525, 'learning_rate': 8.126329998717763e-09, 'epoch': 1.98} {'loss': 0.3688, 'learning_rate': 8.112793589517554e-09, 'epoch': 1.98} {'loss': 0.2366, 'learning_rate': 8.099268459258458e-09, 'epoch': 1.98} {'loss': 0.2644, 'learning_rate': 8.08575460795491e-09, 'epoch': 1.98} {'loss': 0.2942, 'learning_rate': 8.072252035622452e-09, 'epoch': 1.98} {'loss': 0.2659, 'learning_rate': 8.058760742276628e-09, 'epoch': 1.98} {'loss': 0.2799, 'learning_rate': 8.04528072793187e-09, 'epoch': 1.98} {'loss': 0.3275, 'learning_rate': 8.031811992603722e-09, 'epoch': 1.98} {'loss': 0.2801, 'learning_rate': 8.018354536308836e-09, 'epoch': 1.98} {'loss': 0.4171, 'learning_rate': 8.004908359060537e-09, 'epoch': 1.98} {'loss': 0.4597, 'learning_rate': 7.991473460874366e-09, 'epoch': 1.98} {'loss': 0.1883, 'learning_rate': 7.978049841765868e-09, 'epoch': 1.98} {'loss': 0.2944, 'learning_rate': 7.964637501750583e-09, 'epoch': 1.98} {'loss': 0.1929, 'learning_rate': 7.951236440841836e-09, 'epoch': 1.98} {'loss': 0.2526, 'learning_rate': 7.93784665905739e-09, 'epoch': 1.98} {'loss': 0.2893, 'learning_rate': 7.92446815641057e-09, 'epoch': 1.98} {'loss': 0.5122, 'learning_rate': 7.911100932916916e-09, 'epoch': 1.98} {'loss': 0.4087, 'learning_rate': 7.89774498859197e-09, 'epoch': 1.98} {'loss': 0.3257, 'learning_rate': 7.88440032345017e-09, 'epoch': 1.98} {'loss': 0.3117, 'learning_rate': 7.871066937505945e-09, 'epoch': 1.98} {'loss': 0.3, 'learning_rate': 7.85774483077595e-09, 'epoch': 1.98} {'loss': 0.3888, 'learning_rate': 7.844434003274614e-09, 'epoch': 1.98} {'loss': 0.3505, 'learning_rate': 7.831134455017485e-09, 'epoch': 1.98} {'loss': 0.231, 'learning_rate': 7.817846186017886e-09, 'epoch': 1.98} {'loss': 0.2905, 'learning_rate': 7.804569196291357e-09, 'epoch': 1.98} {'loss': 0.2582, 'learning_rate': 7.79130348585455e-09, 'epoch': 1.98} {'loss': 0.3411, 'learning_rate': 7.778049054720793e-09, 'epoch': 1.98} {'loss': 0.226, 'learning_rate': 7.764805902904515e-09, 'epoch': 1.98} {'loss': 0.337, 'learning_rate': 7.751574030423482e-09, 'epoch': 1.98} {'loss': 0.1764, 'learning_rate': 7.738353437289902e-09, 'epoch': 1.98} {'loss': 0.375, 'learning_rate': 7.725144123519323e-09, 'epoch': 1.98} {'loss': 0.4091, 'learning_rate': 7.711946089127287e-09, 'epoch': 1.98} {'loss': 0.2054, 'learning_rate': 7.698759334128226e-09, 'epoch': 1.98} {'loss': 0.2011, 'learning_rate': 7.685583858536572e-09, 'epoch': 1.98} {'loss': 0.3459, 'learning_rate': 7.672419662368979e-09, 'epoch': 1.98} {'loss': 0.3368, 'learning_rate': 7.659266745638772e-09, 'epoch': 1.98} {'loss': 0.234, 'learning_rate': 7.64612510836038e-09, 'epoch': 1.98} {'loss': 0.3677, 'learning_rate': 7.63299475055046e-09, 'epoch': 1.98} {'loss': 0.2503, 'learning_rate': 7.619875672221222e-09, 'epoch': 1.98} {'loss': 0.4152, 'learning_rate': 7.60676787339043e-09, 'epoch': 1.98} {'loss': 0.5012, 'learning_rate': 7.593671354071408e-09, 'epoch': 1.98} {'loss': 0.3535, 'learning_rate': 7.580586114278587e-09, 'epoch': 1.98} {'loss': 0.3078, 'learning_rate': 7.567512154026402e-09, 'epoch': 1.98} {'loss': 0.2892, 'learning_rate': 7.554449473331504e-09, 'epoch': 1.98} {'loss': 0.5412, 'learning_rate': 7.541398072207218e-09, 'epoch': 1.98} {'loss': 0.1361, 'learning_rate': 7.528357950667975e-09, 'epoch': 1.98} {'loss': 0.2907, 'learning_rate': 7.515329108729319e-09, 'epoch': 1.98} {'loss': 0.3225, 'learning_rate': 7.502311546405683e-09, 'epoch': 1.98} {'loss': 0.2688, 'learning_rate': 7.48930526371261e-09, 'epoch': 1.98} {'loss': 0.2214, 'learning_rate': 7.476310260662312e-09, 'epoch': 1.98} {'loss': 0.1886, 'learning_rate': 7.463326537272554e-09, 'epoch': 1.98} {'loss': 0.4857, 'learning_rate': 7.450354093555545e-09, 'epoch': 1.98} {'loss': 0.3644, 'learning_rate': 7.437392929527943e-09, 'epoch': 1.98} {'loss': 0.2626, 'learning_rate': 7.424443045203067e-09, 'epoch': 1.98} {'loss': 0.2804, 'learning_rate': 7.4115044405953515e-09, 'epoch': 1.98} {'loss': 0.1585, 'learning_rate': 7.39857711571923e-09, 'epoch': 1.98} {'loss': 0.3731, 'learning_rate': 7.385661070591355e-09, 'epoch': 1.98} {'loss': 0.2757, 'learning_rate': 7.3727563052239385e-09, 'epoch': 1.98} {'loss': 0.2331, 'learning_rate': 7.359862819633634e-09, 'epoch': 1.98} {'loss': 0.2852, 'learning_rate': 7.346980613832655e-09, 'epoch': 1.98} {'loss': 0.2949, 'learning_rate': 7.334109687836544e-09, 'epoch': 1.98} {'loss': 0.1982, 'learning_rate': 7.321250041660843e-09, 'epoch': 1.98} {'loss': 0.3045, 'learning_rate': 7.308401675318877e-09, 'epoch': 1.98} {'loss': 0.2761, 'learning_rate': 7.295564588826187e-09, 'epoch': 1.98} {'loss': 0.2562, 'learning_rate': 7.282738782196097e-09, 'epoch': 1.98} {'loss': 0.2678, 'learning_rate': 7.269924255443039e-09, 'epoch': 1.98} {'loss': 0.2566, 'learning_rate': 7.257121008582557e-09, 'epoch': 1.98} {'loss': 0.3388, 'learning_rate': 7.244329041629084e-09, 'epoch': 1.98} {'loss': 0.2297, 'learning_rate': 7.231548354595941e-09, 'epoch': 1.98} {'loss': 0.3989, 'learning_rate': 7.218778947498673e-09, 'epoch': 1.98} {'loss': 0.2341, 'learning_rate': 7.206020820350601e-09, 'epoch': 1.98} {'loss': 0.277, 'learning_rate': 7.193273973167269e-09, 'epoch': 1.98} {'loss': 0.4126, 'learning_rate': 7.180538405962001e-09, 'epoch': 1.98} {'loss': 0.2571, 'learning_rate': 7.167814118750338e-09, 'epoch': 1.98} {'loss': 0.3512, 'learning_rate': 7.1551011115456035e-09, 'epoch': 1.98} {'loss': 0.2829, 'learning_rate': 7.142399384362231e-09, 'epoch': 1.98} {'loss': 0.3298, 'learning_rate': 7.129708937214652e-09, 'epoch': 1.98} {'loss': 0.3127, 'learning_rate': 7.117029770118411e-09, 'epoch': 1.98} {'loss': 0.2956, 'learning_rate': 7.10436188308572e-09, 'epoch': 1.98} {'loss': 0.3106, 'learning_rate': 7.0917052761321214e-09, 'epoch': 1.98} {'loss': 0.2817, 'learning_rate': 7.079059949273159e-09, 'epoch': 1.98} {'loss': 0.4059, 'learning_rate': 7.066425902519936e-09, 'epoch': 1.98} {'loss': 0.311, 'learning_rate': 7.0538031358891035e-09, 'epoch': 1.98} {'loss': 0.1795, 'learning_rate': 7.041191649395096e-09, 'epoch': 1.98} {'loss': 0.3277, 'learning_rate': 7.028591443050125e-09, 'epoch': 1.98} {'loss': 0.3337, 'learning_rate': 7.016002516869735e-09, 'epoch': 1.98} {'loss': 0.4943, 'learning_rate': 7.003424870868359e-09, 'epoch': 1.98} {'loss': 0.423, 'learning_rate': 6.990858505060427e-09, 'epoch': 1.98} {'loss': 0.4201, 'learning_rate': 6.978303419459265e-09, 'epoch': 1.98} {'loss': 0.4483, 'learning_rate': 6.9657596140793035e-09, 'epoch': 1.98} {'loss': 0.3149, 'learning_rate': 6.953227088933867e-09, 'epoch': 1.98} {'loss': 0.2315, 'learning_rate': 6.940705844038498e-09, 'epoch': 1.98} {'loss': 0.177, 'learning_rate': 6.928195879407629e-09, 'epoch': 1.98} {'loss': 0.1515, 'learning_rate': 6.915697195053472e-09, 'epoch': 1.98} {'loss': 0.3269, 'learning_rate': 6.903209790991572e-09, 'epoch': 1.98} {'loss': 0.2583, 'learning_rate': 6.89073366723636e-09, 'epoch': 1.98} {'loss': 0.3072, 'learning_rate': 6.878268823800049e-09, 'epoch': 1.98} {'loss': 0.2746, 'learning_rate': 6.865815260698183e-09, 'epoch': 1.98} {'loss': 0.2901, 'learning_rate': 6.853372977945194e-09, 'epoch': 1.98} {'loss': 0.3188, 'learning_rate': 6.8409419755544045e-09, 'epoch': 1.98} {'loss': 0.2781, 'learning_rate': 6.828522253539138e-09, 'epoch': 1.98} {'loss': 0.2348, 'learning_rate': 6.816113811914937e-09, 'epoch': 1.98} {'loss': 0.4192, 'learning_rate': 6.803716650694014e-09, 'epoch': 1.98} {'loss': 0.2978, 'learning_rate': 6.791330769891913e-09, 'epoch': 1.98} {'loss': 0.1758, 'learning_rate': 6.7789561695230655e-09, 'epoch': 1.98} {'loss': 0.39, 'learning_rate': 6.766592849599685e-09, 'epoch': 1.98} {'loss': 0.2398, 'learning_rate': 6.754240810136204e-09, 'epoch': 1.98} {'loss': 0.2918, 'learning_rate': 6.741900051147054e-09, 'epoch': 1.98} {'loss': 0.1581, 'learning_rate': 6.729570572646671e-09, 'epoch': 1.98} {'loss': 0.1745, 'learning_rate': 6.717252374647265e-09, 'epoch': 1.98} {'loss': 0.2541, 'learning_rate': 6.70494545716438e-09, 'epoch': 1.98} {'loss': 0.3683, 'learning_rate': 6.6926498202113385e-09, 'epoch': 1.98} {'loss': 0.1616, 'learning_rate': 6.680365463801464e-09, 'epoch': 1.98} {'loss': 0.1563, 'learning_rate': 6.668092387950298e-09, 'epoch': 1.98} {'loss': 0.2326, 'learning_rate': 6.655830592670054e-09, 'epoch': 1.98} {'loss': 0.2501, 'learning_rate': 6.643580077974055e-09, 'epoch': 1.98} {'loss': 0.3514, 'learning_rate': 6.631340843877843e-09, 'epoch': 1.98} {'loss': 0.3339, 'learning_rate': 6.619112890394741e-09, 'epoch': 1.98} {'loss': 0.2853, 'learning_rate': 6.606896217538073e-09, 'epoch': 1.98} {'loss': 0.3713, 'learning_rate': 6.5946908253222695e-09, 'epoch': 1.98} {'loss': 0.3138, 'learning_rate': 6.582496713760656e-09, 'epoch': 1.98} {'loss': 0.3527, 'learning_rate': 6.570313882866553e-09, 'epoch': 1.98} {'loss': 0.379, 'learning_rate': 6.558142332654394e-09, 'epoch': 1.98} {'loss': 0.3009, 'learning_rate': 6.545982063137501e-09, 'epoch': 1.98} {'loss': 0.3051, 'learning_rate': 6.533833074330309e-09, 'epoch': 1.98} {'loss': 0.1528, 'learning_rate': 6.521695366246139e-09, 'epoch': 1.98} {'loss': 0.2467, 'learning_rate': 6.509568938898314e-09, 'epoch': 1.98} {'loss': 0.2791, 'learning_rate': 6.497453792301267e-09, 'epoch': 1.98} {'loss': 0.3873, 'learning_rate': 6.48534992646721e-09, 'epoch': 1.98} {'loss': 0.329, 'learning_rate': 6.473257341411687e-09, 'epoch': 1.98} {'loss': 0.321, 'learning_rate': 6.46117603714802e-09, 'epoch': 1.98} {'loss': 0.3138, 'learning_rate': 6.4491060136884224e-09, 'epoch': 1.98} {'loss': 0.2714, 'learning_rate': 6.4370472710473255e-09, 'epoch': 1.98} {'loss': 0.3036, 'learning_rate': 6.424999809239163e-09, 'epoch': 1.98} {'loss': 0.2058, 'learning_rate': 6.412963628276148e-09, 'epoch': 1.98} {'loss': 0.2083, 'learning_rate': 6.400938728172712e-09, 'epoch': 1.98} {'loss': 0.2569, 'learning_rate': 6.388925108942179e-09, 'epoch': 1.98} {'loss': 0.4247, 'learning_rate': 6.376922770598981e-09, 'epoch': 1.98} {'loss': 0.3471, 'learning_rate': 6.3649317131553316e-09, 'epoch': 1.98} {'loss': 0.297, 'learning_rate': 6.352951936624552e-09, 'epoch': 1.98} {'loss': 0.3883, 'learning_rate': 6.340983441022186e-09, 'epoch': 1.98} {'loss': 0.2303, 'learning_rate': 6.329026226359336e-09, 'epoch': 1.98} {'loss': 0.193, 'learning_rate': 6.317080292651545e-09, 'epoch': 1.98} {'loss': 0.2878, 'learning_rate': 6.3051456399110255e-09, 'epoch': 1.98} {'loss': 0.2659, 'learning_rate': 6.2932222681511e-09, 'epoch': 1.98} {'loss': 0.3163, 'learning_rate': 6.281310177386202e-09, 'epoch': 1.98} {'loss': 0.2734, 'learning_rate': 6.269409367629653e-09, 'epoch': 1.98} {'loss': 0.3188, 'learning_rate': 6.2575198388936664e-09, 'epoch': 1.98} {'loss': 0.2624, 'learning_rate': 6.245641591193785e-09, 'epoch': 1.98} {'loss': 0.3789, 'learning_rate': 6.233774624541111e-09, 'epoch': 1.98} {'loss': 0.2672, 'learning_rate': 6.221918938951188e-09, 'epoch': 1.98} {'loss': 0.2852, 'learning_rate': 6.210074534435117e-09, 'epoch': 1.98} {'loss': 0.2852, 'learning_rate': 6.198241411008443e-09, 'epoch': 1.98} {'loss': 0.4294, 'learning_rate': 6.186419568682267e-09, 'epoch': 1.98} {'loss': 0.1936, 'learning_rate': 6.174609007472132e-09, 'epoch': 1.98} {'loss': 0.2632, 'learning_rate': 6.162809727390251e-09, 'epoch': 1.98} {'loss': 0.3291, 'learning_rate': 6.151021728449946e-09, 'epoch': 1.98} {'loss': 0.2362, 'learning_rate': 6.139245010665651e-09, 'epoch': 1.98} {'loss': 0.5839, 'learning_rate': 6.127479574048467e-09, 'epoch': 1.98} {'loss': 0.3491, 'learning_rate': 6.115725418613938e-09, 'epoch': 1.98} {'loss': 0.3854, 'learning_rate': 6.103982544373166e-09, 'epoch': 1.98} {'loss': 0.3026, 'learning_rate': 6.092250951341694e-09, 'epoch': 1.98} {'loss': 0.4721, 'learning_rate': 6.080530639531734e-09, 'epoch': 1.98} {'loss': 0.3397, 'learning_rate': 6.0688216089555e-09, 'epoch': 1.98} {'loss': 0.3356, 'learning_rate': 6.057123859627423e-09, 'epoch': 1.98} {'loss': 0.3211, 'learning_rate': 6.0454373915608265e-09, 'epoch': 1.98} {'loss': 0.3004, 'learning_rate': 6.0337622047679236e-09, 'epoch': 1.98} {'loss': 0.3433, 'learning_rate': 6.022098299263146e-09, 'epoch': 1.98} {'loss': 0.2027, 'learning_rate': 6.0104456750587074e-09, 'epoch': 1.98} {'loss': 0.3532, 'learning_rate': 5.998804332167929e-09, 'epoch': 1.98} {'loss': 0.2963, 'learning_rate': 5.9871742706041346e-09, 'epoch': 1.98} {'loss': 0.2163, 'learning_rate': 5.975555490380647e-09, 'epoch': 1.98} {'loss': 0.2418, 'learning_rate': 5.963947991509678e-09, 'epoch': 1.98} {'loss': 0.2937, 'learning_rate': 5.95235177400455e-09, 'epoch': 1.98} {'loss': 0.3676, 'learning_rate': 5.9407668378796966e-09, 'epoch': 1.98} {'loss': 0.4297, 'learning_rate': 5.929193183147331e-09, 'epoch': 1.98} {'loss': 0.357, 'learning_rate': 5.917630809819663e-09, 'epoch': 1.98} {'loss': 0.2739, 'learning_rate': 5.906079717911129e-09, 'epoch': 1.98} {'loss': 0.3402, 'learning_rate': 5.894539907433938e-09, 'epoch': 1.98} {'loss': 0.3701, 'learning_rate': 5.883011378401415e-09, 'epoch': 1.98} {'loss': 0.2191, 'learning_rate': 5.871494130826883e-09, 'epoch': 1.98} {'loss': 0.2838, 'learning_rate': 5.859988164722552e-09, 'epoch': 1.98} {'loss': 0.3435, 'learning_rate': 5.848493480101747e-09, 'epoch': 1.98} {'loss': 0.2804, 'learning_rate': 5.8370100769777896e-09, 'epoch': 1.98} {'loss': 0.2958, 'learning_rate': 5.825537955362892e-09, 'epoch': 1.98} {'loss': 0.1675, 'learning_rate': 5.8140771152714884e-09, 'epoch': 1.98} {'loss': 0.3496, 'learning_rate': 5.8026275567146795e-09, 'epoch': 1.98} {'loss': 0.1974, 'learning_rate': 5.791189279706899e-09, 'epoch': 1.98} {'loss': 0.2355, 'learning_rate': 5.779762284259249e-09, 'epoch': 1.98} {'loss': 0.3389, 'learning_rate': 5.768346570386163e-09, 'epoch': 1.98} {'loss': 0.2716, 'learning_rate': 5.756942138100963e-09, 'epoch': 1.98} {'loss': 0.2652, 'learning_rate': 5.7455489874147505e-09, 'epoch': 1.98} {'loss': 0.3311, 'learning_rate': 5.73416711834196e-09, 'epoch': 1.98} {'loss': 0.26, 'learning_rate': 5.722796530893693e-09, 'epoch': 1.98} {'loss': 0.314, 'learning_rate': 5.711437225085492e-09, 'epoch': 1.98} {'loss': 0.3666, 'learning_rate': 5.70008920092735e-09, 'epoch': 1.98} {'loss': 0.2422, 'learning_rate': 5.6887524584337e-09, 'epoch': 1.98} {'loss': 0.2356, 'learning_rate': 5.677426997616753e-09, 'epoch': 1.98} {'loss': 0.3705, 'learning_rate': 5.666112818489833e-09, 'epoch': 1.98} {'loss': 0.2702, 'learning_rate': 5.654809921065152e-09, 'epoch': 1.98} {'loss': 0.2227, 'learning_rate': 5.643518305356033e-09, 'epoch': 1.98} {'loss': 0.448, 'learning_rate': 5.632237971374688e-09, 'epoch': 1.98} {'loss': 0.3865, 'learning_rate': 5.62096891913333e-09, 'epoch': 1.98} {'loss': 0.1809, 'learning_rate': 5.609711148646391e-09, 'epoch': 1.98} {'loss': 0.2505, 'learning_rate': 5.598464659924974e-09, 'epoch': 1.98} {'loss': 0.1934, 'learning_rate': 5.5872294529824015e-09, 'epoch': 1.98} {'loss': 0.4244, 'learning_rate': 5.576005527831995e-09, 'epoch': 1.98} {'loss': 0.3593, 'learning_rate': 5.56479288448486e-09, 'epoch': 1.98} {'loss': 0.2274, 'learning_rate': 5.553591522954316e-09, 'epoch': 1.98} {'loss': 0.2744, 'learning_rate': 5.542401443254797e-09, 'epoch': 1.98} {'loss': 0.2694, 'learning_rate': 5.531222645396295e-09, 'epoch': 1.98} {'loss': 0.3511, 'learning_rate': 5.520055129392132e-09, 'epoch': 1.98} {'loss': 0.358, 'learning_rate': 5.508898895255632e-09, 'epoch': 1.98} {'loss': 0.3895, 'learning_rate': 5.497753942999007e-09, 'epoch': 1.98} {'loss': 0.2659, 'learning_rate': 5.4866202726355786e-09, 'epoch': 1.98} {'loss': 0.3063, 'learning_rate': 5.47549788417645e-09, 'epoch': 1.98} {'loss': 0.4123, 'learning_rate': 5.464386777634945e-09, 'epoch': 1.98} {'loss': 0.2718, 'learning_rate': 5.453286953024384e-09, 'epoch': 1.98} {'loss': 0.3092, 'learning_rate': 5.44219841035587e-09, 'epoch': 1.98} {'loss': 0.2423, 'learning_rate': 5.431121149642726e-09, 'epoch': 1.98} {'loss': 0.4424, 'learning_rate': 5.420055170897165e-09, 'epoch': 1.98} {'loss': 0.3622, 'learning_rate': 5.409000474131399e-09, 'epoch': 1.98} {'loss': 0.4113, 'learning_rate': 5.39795705935875e-09, 'epoch': 1.98} {'loss': 0.299, 'learning_rate': 5.38692492659143e-09, 'epoch': 1.98} {'loss': 0.3741, 'learning_rate': 5.375904075841654e-09, 'epoch': 1.98} {'loss': 0.2691, 'learning_rate': 5.364894507121632e-09, 'epoch': 1.98} {'loss': 0.3729, 'learning_rate': 5.353896220444687e-09, 'epoch': 1.98} {'loss': 0.2989, 'learning_rate': 5.342909215821923e-09, 'epoch': 1.98} {'loss': 0.1148, 'learning_rate': 5.331933493266661e-09, 'epoch': 1.98} {'loss': 0.209, 'learning_rate': 5.320969052791114e-09, 'epoch': 1.98} {'loss': 0.1309, 'learning_rate': 5.310015894407494e-09, 'epoch': 1.98} {'loss': 0.2069, 'learning_rate': 5.299074018128014e-09, 'epoch': 1.98} {'loss': 0.3484, 'learning_rate': 5.288143423965997e-09, 'epoch': 1.98} {'loss': 0.2222, 'learning_rate': 5.277224111932544e-09, 'epoch': 1.98} {'loss': 0.1861, 'learning_rate': 5.266316082040979e-09, 'epoch': 1.98} {'loss': 0.4365, 'learning_rate': 5.255419334302403e-09, 'epoch': 1.98} {'loss': 0.2995, 'learning_rate': 5.24453386873125e-09, 'epoch': 1.98} {'loss': 0.302, 'learning_rate': 5.233659685337511e-09, 'epoch': 1.98} {'loss': 0.2943, 'learning_rate': 5.222796784134509e-09, 'epoch': 1.98} {'loss': 0.447, 'learning_rate': 5.211945165134458e-09, 'epoch': 1.98} {'loss': 0.3425, 'learning_rate': 5.201104828348457e-09, 'epoch': 1.98} {'loss': 0.1706, 'learning_rate': 5.190275773790943e-09, 'epoch': 1.98} {'loss': 0.3123, 'learning_rate': 5.179458001473014e-09, 'epoch': 1.98} {'loss': 0.2664, 'learning_rate': 5.1686515114068856e-09, 'epoch': 1.98} {'loss': 0.2704, 'learning_rate': 5.157856303604769e-09, 'epoch': 1.98} {'loss': 0.2689, 'learning_rate': 5.147072378077766e-09, 'epoch': 1.98} {'loss': 0.2646, 'learning_rate': 5.136299734840311e-09, 'epoch': 1.98} {'loss': 0.28, 'learning_rate': 5.1255383739023946e-09, 'epoch': 1.98} {'loss': 0.3267, 'learning_rate': 5.11478829527845e-09, 'epoch': 1.98} {'loss': 0.2796, 'learning_rate': 5.10404949897847e-09, 'epoch': 1.98} {'loss': 0.3647, 'learning_rate': 5.093321985015775e-09, 'epoch': 1.98} {'loss': 0.3757, 'learning_rate': 5.082605753401471e-09, 'epoch': 1.98} {'loss': 0.3098, 'learning_rate': 5.071900804148877e-09, 'epoch': 1.98} {'loss': 0.271, 'learning_rate': 5.061207137269098e-09, 'epoch': 1.98} {'loss': 0.304, 'learning_rate': 5.050524752774344e-09, 'epoch': 1.98} {'loss': 0.4374, 'learning_rate': 5.0398536506779395e-09, 'epoch': 1.98} {'loss': 0.2389, 'learning_rate': 5.0291938309898754e-09, 'epoch': 1.98} {'loss': 0.2946, 'learning_rate': 5.018545293723476e-09, 'epoch': 1.98} {'loss': 0.3412, 'learning_rate': 5.007908038890952e-09, 'epoch': 1.98} {'loss': 0.2845, 'learning_rate': 4.997282066503406e-09, 'epoch': 1.98} {'loss': 0.2343, 'learning_rate': 4.986667376573051e-09, 'epoch': 1.98} {'loss': 0.2797, 'learning_rate': 4.97606396911321e-09, 'epoch': 1.98} {'loss': 0.3655, 'learning_rate': 4.965471844133873e-09, 'epoch': 1.98} {'loss': 0.2611, 'learning_rate': 4.954891001647255e-09, 'epoch': 1.98} {'loss': 0.2785, 'learning_rate': 4.9443214416666775e-09, 'epoch': 1.98} {'loss': 0.1824, 'learning_rate': 4.933763164204352e-09, 'epoch': 1.98} {'loss': 0.4927, 'learning_rate': 4.923216169269162e-09, 'epoch': 1.98} {'loss': 0.3358, 'learning_rate': 4.912680456876651e-09, 'epoch': 1.98} {'loss': 0.3308, 'learning_rate': 4.9021560270368085e-09, 'epoch': 1.98} {'loss': 0.201, 'learning_rate': 4.891642879760739e-09, 'epoch': 1.98} {'loss': 0.2618, 'learning_rate': 4.881141015061763e-09, 'epoch': 1.98} {'loss': 0.2553, 'learning_rate': 4.870650432952095e-09, 'epoch': 1.98} {'loss': 0.2853, 'learning_rate': 4.860171133441727e-09, 'epoch': 1.98} {'loss': 0.163, 'learning_rate': 4.8497031165439804e-09, 'epoch': 1.98} {'loss': 0.3168, 'learning_rate': 4.839246382271068e-09, 'epoch': 1.98} {'loss': 0.3068, 'learning_rate': 4.828800930632982e-09, 'epoch': 1.98} {'loss': 0.2889, 'learning_rate': 4.818366761643045e-09, 'epoch': 1.98} {'loss': 0.2672, 'learning_rate': 4.80794387531236e-09, 'epoch': 1.98} {'loss': 0.3129, 'learning_rate': 4.797532271652028e-09, 'epoch': 1.98} {'loss': 0.3062, 'learning_rate': 4.787131950675372e-09, 'epoch': 1.98} {'loss': 0.2841, 'learning_rate': 4.776742912393495e-09, 'epoch': 1.98} {'loss': 0.3155, 'learning_rate': 4.766365156818609e-09, 'epoch': 1.98} {'loss': 0.2168, 'learning_rate': 4.755998683960705e-09, 'epoch': 1.98} {'loss': 0.2719, 'learning_rate': 4.745643493833108e-09, 'epoch': 1.98} {'loss': 0.3871, 'learning_rate': 4.735299586445807e-09, 'epoch': 1.98} {'loss': 0.2924, 'learning_rate': 4.724966961813238e-09, 'epoch': 1.98} {'loss': 0.2271, 'learning_rate': 4.714645619945391e-09, 'epoch': 1.98} {'loss': 0.4125, 'learning_rate': 4.704335560853368e-09, 'epoch': 1.98} {'loss': 0.1405, 'learning_rate': 4.694036784549383e-09, 'epoch': 1.98} {'loss': 0.3586, 'learning_rate': 4.683749291045647e-09, 'epoch': 1.98} {'loss': 0.344, 'learning_rate': 4.673473080352154e-09, 'epoch': 1.98} {'loss': 0.412, 'learning_rate': 4.663208152483334e-09, 'epoch': 1.98} {'loss': 0.2435, 'learning_rate': 4.652954507448071e-09, 'epoch': 1.98} {'loss': 0.4302, 'learning_rate': 4.6427121452585766e-09, 'epoch': 1.98} {'loss': 0.3372, 'learning_rate': 4.632481065927063e-09, 'epoch': 1.98} {'loss': 0.1567, 'learning_rate': 4.622261269465744e-09, 'epoch': 1.98} {'loss': 0.2744, 'learning_rate': 4.6120527558835004e-09, 'epoch': 1.98} {'loss': 0.3561, 'learning_rate': 4.601855525194765e-09, 'epoch': 1.98} {'loss': 0.516, 'learning_rate': 4.59166957740953e-09, 'epoch': 1.98} {'loss': 0.3032, 'learning_rate': 4.581494912538897e-09, 'epoch': 1.98} {'loss': 0.2597, 'learning_rate': 4.571331530596191e-09, 'epoch': 1.98} {'loss': 0.2578, 'learning_rate': 4.5611794315914e-09, 'epoch': 1.98} {'loss': 0.1965, 'learning_rate': 4.55103861553563e-09, 'epoch': 1.98} {'loss': 0.4398, 'learning_rate': 4.540909082442202e-09, 'epoch': 1.98} {'loss': 0.1911, 'learning_rate': 4.530790832319998e-09, 'epoch': 1.98} {'loss': 0.4636, 'learning_rate': 4.520683865182341e-09, 'epoch': 1.98} {'loss': 0.278, 'learning_rate': 4.510588181040331e-09, 'epoch': 1.98} {'loss': 0.4314, 'learning_rate': 4.500503779905075e-09, 'epoch': 1.98} {'loss': 0.2877, 'learning_rate': 4.49043066178767e-09, 'epoch': 1.98} {'loss': 0.2775, 'learning_rate': 4.480368826700332e-09, 'epoch': 1.98} {'loss': 0.275, 'learning_rate': 4.470318274654162e-09, 'epoch': 1.98} {'loss': 0.3689, 'learning_rate': 4.460279005660262e-09, 'epoch': 1.98} {'loss': 0.0911, 'learning_rate': 4.450251019728624e-09, 'epoch': 1.98} {'loss': 0.2888, 'learning_rate': 4.440234316873682e-09, 'epoch': 1.98} {'loss': 0.2298, 'learning_rate': 4.430228897103206e-09, 'epoch': 1.98} {'loss': 0.1939, 'learning_rate': 4.42023476043163e-09, 'epoch': 1.98} {'loss': 0.4068, 'learning_rate': 4.410251906867835e-09, 'epoch': 1.98} {'loss': 0.3031, 'learning_rate': 4.4002803364251445e-09, 'epoch': 1.98} {'loss': 0.3539, 'learning_rate': 4.39032004911355e-09, 'epoch': 1.98} {'loss': 0.3605, 'learning_rate': 4.380371044944154e-09, 'epoch': 1.98} {'loss': 0.4582, 'learning_rate': 4.370433323929168e-09, 'epoch': 1.98} {'loss': 0.3131, 'learning_rate': 4.360506886078586e-09, 'epoch': 1.98} {'loss': 0.4064, 'learning_rate': 4.3505917314046185e-09, 'epoch': 1.98} {'loss': 0.4323, 'learning_rate': 4.340687859917259e-09, 'epoch': 1.98} {'loss': 0.3575, 'learning_rate': 4.3307952716287184e-09, 'epoch': 1.98} {'loss': 0.3183, 'learning_rate': 4.32091396655121e-09, 'epoch': 1.98} {'loss': 0.3031, 'learning_rate': 4.311043944693616e-09, 'epoch': 1.98} {'loss': 0.1974, 'learning_rate': 4.301185206068148e-09, 'epoch': 1.98} {'loss': 0.2082, 'learning_rate': 4.291337750685909e-09, 'epoch': 1.98} {'loss': 0.2546, 'learning_rate': 4.281501578558e-09, 'epoch': 1.98} {'loss': 0.2422, 'learning_rate': 4.271676689695525e-09, 'epoch': 1.98} {'loss': 0.281, 'learning_rate': 4.2618630841095856e-09, 'epoch': 1.98} {'loss': 0.3592, 'learning_rate': 4.252060761811283e-09, 'epoch': 1.98} {'loss': 0.4871, 'learning_rate': 4.2422697228117206e-09, 'epoch': 1.98} {'loss': 0.2887, 'learning_rate': 4.232489967120889e-09, 'epoch': 1.98} {'loss': 0.3495, 'learning_rate': 4.222721494752114e-09, 'epoch': 1.98} {'loss': 0.3055, 'learning_rate': 4.212964305714273e-09, 'epoch': 1.98} {'loss': 0.1891, 'learning_rate': 4.203218400019582e-09, 'epoch': 1.98} {'loss': 0.3508, 'learning_rate': 4.193483777678031e-09, 'epoch': 1.98} {'loss': 0.1312, 'learning_rate': 4.183760438701834e-09, 'epoch': 1.98} {'loss': 0.3005, 'learning_rate': 4.174048383102092e-09, 'epoch': 1.98} {'loss': 0.2727, 'learning_rate': 4.164347610887687e-09, 'epoch': 1.98} {'loss': 0.2257, 'learning_rate': 4.1546581220719415e-09, 'epoch': 1.98} {'loss': 0.4154, 'learning_rate': 4.144979916663738e-09, 'epoch': 1.98} {'loss': 0.4078, 'learning_rate': 4.1353129946763996e-09, 'epoch': 1.98} {'loss': 0.1539, 'learning_rate': 4.125657356118806e-09, 'epoch': 1.98} {'loss': 0.327, 'learning_rate': 4.116013001002062e-09, 'epoch': 1.98} {'loss': 0.2371, 'learning_rate': 4.1063799293383775e-09, 'epoch': 1.98} {'loss': 0.3467, 'learning_rate': 4.096758141137747e-09, 'epoch': 1.98} {'loss': 0.3463, 'learning_rate': 4.08714763641016e-09, 'epoch': 1.98} {'loss': 0.3556, 'learning_rate': 4.0775484151678316e-09, 'epoch': 1.98} {'loss': 0.4711, 'learning_rate': 4.067960477421861e-09, 'epoch': 1.98} {'loss': 0.3648, 'learning_rate': 4.0583838231811334e-09, 'epoch': 1.98} {'loss': 0.3036, 'learning_rate': 4.048818452458969e-09, 'epoch': 1.98} {'loss': 0.2272, 'learning_rate': 4.0392643652642506e-09, 'epoch': 1.98} {'loss': 0.3285, 'learning_rate': 4.0297215616080796e-09, 'epoch': 1.98} {'loss': 0.4254, 'learning_rate': 4.0201900415015596e-09, 'epoch': 1.98} {'loss': 0.3581, 'learning_rate': 4.010669804955791e-09, 'epoch': 1.98} {'loss': 0.3636, 'learning_rate': 4.001160851980767e-09, 'epoch': 1.98} {'loss': 0.2693, 'learning_rate': 3.9916631825875905e-09, 'epoch': 1.98} {'loss': 0.3217, 'learning_rate': 3.982176796787363e-09, 'epoch': 1.98} {'loss': 0.2193, 'learning_rate': 3.972701694590075e-09, 'epoch': 1.98} {'loss': 0.3184, 'learning_rate': 3.963237876006832e-09, 'epoch': 1.98} {'loss': 0.378, 'learning_rate': 3.9537853410487324e-09, 'epoch': 1.98} {'loss': 0.3545, 'learning_rate': 3.944344089725771e-09, 'epoch': 1.98} {'loss': 0.3203, 'learning_rate': 3.934914122049049e-09, 'epoch': 1.98} {'loss': 0.3461, 'learning_rate': 3.9254954380285595e-09, 'epoch': 1.98} {'loss': 0.3291, 'learning_rate': 3.916088037675403e-09, 'epoch': 1.98} {'loss': 0.4556, 'learning_rate': 3.906691921000682e-09, 'epoch': 1.98} {'loss': 0.256, 'learning_rate': 3.89730708801328e-09, 'epoch': 1.98} {'loss': 0.3472, 'learning_rate': 3.887933538725408e-09, 'epoch': 1.98} {'loss': 0.3891, 'learning_rate': 3.878571273148168e-09, 'epoch': 1.98} {'loss': 0.2283, 'learning_rate': 3.869220291290443e-09, 'epoch': 1.98} {'loss': 0.4686, 'learning_rate': 3.859880593163334e-09, 'epoch': 1.98} {'loss': 0.2271, 'learning_rate': 3.850552178777944e-09, 'epoch': 1.98} {'loss': 0.4453, 'learning_rate': 3.841235048144265e-09, 'epoch': 1.98} {'loss': 0.1901, 'learning_rate': 3.831929201272289e-09, 'epoch': 1.98} {'loss': 0.4298, 'learning_rate': 3.822634638174227e-09, 'epoch': 1.98} {'loss': 0.2384, 'learning_rate': 3.813351358858963e-09, 'epoch': 1.98} {'loss': 0.4327, 'learning_rate': 3.8040793633375985e-09, 'epoch': 1.98} {'loss': 0.3438, 'learning_rate': 3.794818651621235e-09, 'epoch': 1.98} {'loss': 0.3609, 'learning_rate': 3.785569223718755e-09, 'epoch': 1.98} {'loss': 0.3843, 'learning_rate': 3.77633107964237e-09, 'epoch': 1.98} {'loss': 0.1965, 'learning_rate': 3.767104219400963e-09, 'epoch': 1.98} {'loss': 0.2001, 'learning_rate': 3.757888643005636e-09, 'epoch': 1.98} {'loss': 0.2228, 'learning_rate': 3.748684350467491e-09, 'epoch': 1.98} {'loss': 0.3592, 'learning_rate': 3.73949134179541e-09, 'epoch': 1.98} {'loss': 0.37, 'learning_rate': 3.7303096170004935e-09, 'epoch': 1.98} {'loss': 0.323, 'learning_rate': 3.7211391760938463e-09, 'epoch': 1.98} {'loss': 0.2902, 'learning_rate': 3.711980019084349e-09, 'epoch': 1.98} {'loss': 0.3191, 'learning_rate': 3.7028321459842143e-09, 'epoch': 1.98} {'loss': 0.2083, 'learning_rate': 3.6936955568023235e-09, 'epoch': 1.98} {'loss': 0.4709, 'learning_rate': 3.6845702515486694e-09, 'epoch': 1.98} {'loss': 0.406, 'learning_rate': 3.6754562302354636e-09, 'epoch': 1.98} {'loss': 0.3524, 'learning_rate': 3.666353492870478e-09, 'epoch': 1.98} {'loss': 0.3332, 'learning_rate': 3.6572620394659253e-09, 'epoch': 1.98} {'loss': 0.3326, 'learning_rate': 3.648181870031797e-09, 'epoch': 1.98} {'loss': 0.2801, 'learning_rate': 3.6391129845769755e-09, 'epoch': 1.98} {'loss': 0.3143, 'learning_rate': 3.630055383113673e-09, 'epoch': 1.98} {'loss': 0.3407, 'learning_rate': 3.621009065650771e-09, 'epoch': 1.98} {'loss': 0.326, 'learning_rate': 3.611974032198262e-09, 'epoch': 1.98} {'loss': 0.2573, 'learning_rate': 3.6029502827683583e-09, 'epoch': 1.98} {'loss': 0.3201, 'learning_rate': 3.593937817368831e-09, 'epoch': 1.98} {'loss': 0.2431, 'learning_rate': 3.584936636010783e-09, 'epoch': 1.98} {'loss': 0.3247, 'learning_rate': 3.5759467387042056e-09, 'epoch': 1.98} {'loss': 0.1554, 'learning_rate': 3.566968125460202e-09, 'epoch': 1.98} {'loss': 0.3602, 'learning_rate': 3.558000796287653e-09, 'epoch': 1.98} {'loss': 0.4078, 'learning_rate': 3.549044751197661e-09, 'epoch': 1.98} {'loss': 0.3099, 'learning_rate': 3.5400999902002186e-09, 'epoch': 1.98} {'loss': 0.4175, 'learning_rate': 3.531166513304207e-09, 'epoch': 1.98} {'loss': 0.2338, 'learning_rate': 3.522244320520729e-09, 'epoch': 1.98} {'loss': 0.3925, 'learning_rate': 3.5133334118597762e-09, 'epoch': 1.98} {'loss': 0.1127, 'learning_rate': 3.5044337873313406e-09, 'epoch': 1.98} {'loss': 0.3693, 'learning_rate': 3.4955454469465246e-09, 'epoch': 1.98} {'loss': 0.3524, 'learning_rate': 3.4866683907130996e-09, 'epoch': 1.98} {'loss': 0.2834, 'learning_rate': 3.4778026186421675e-09, 'epoch': 1.98} {'loss': 0.3739, 'learning_rate': 3.4689481307448313e-09, 'epoch': 1.98} {'loss': 0.2646, 'learning_rate': 3.4601049270288623e-09, 'epoch': 1.98} {'loss': 0.3235, 'learning_rate': 3.4512730075064725e-09, 'epoch': 1.98} {'loss': 0.3392, 'learning_rate': 3.4424523721865443e-09, 'epoch': 1.98} {'loss': 0.2006, 'learning_rate': 3.4336430210790695e-09, 'epoch': 1.98} {'loss': 0.3322, 'learning_rate': 3.4248449541940397e-09, 'epoch': 1.98} {'loss': 0.3112, 'learning_rate': 3.4160581715414476e-09, 'epoch': 1.98} {'loss': 0.3024, 'learning_rate': 3.4072826731312847e-09, 'epoch': 1.98} {'loss': 0.2667, 'learning_rate': 3.398518458973543e-09, 'epoch': 1.98} {'loss': 0.3489, 'learning_rate': 3.3897655290771048e-09, 'epoch': 1.98} {'loss': 0.2618, 'learning_rate': 3.381023883454182e-09, 'epoch': 1.98} {'loss': 0.3504, 'learning_rate': 3.372293522111436e-09, 'epoch': 1.98} {'loss': 0.3196, 'learning_rate': 3.3635744450610795e-09, 'epoch': 1.98} {'loss': 0.2877, 'learning_rate': 3.3548666523131045e-09, 'epoch': 1.98} {'loss': 0.3001, 'learning_rate': 3.3461701438752825e-09, 'epoch': 1.98} {'loss': 0.1959, 'learning_rate': 3.337484919759826e-09, 'epoch': 1.98} {'loss': 0.285, 'learning_rate': 3.328810979974506e-09, 'epoch': 1.98} {'loss': 0.2205, 'learning_rate': 3.3201483245304255e-09, 'epoch': 1.98} {'loss': 0.282, 'learning_rate': 3.311496953436466e-09, 'epoch': 1.98} {'loss': 0.4137, 'learning_rate': 3.3028568667037297e-09, 'epoch': 1.98} {'loss': 0.2469, 'learning_rate': 3.294228064339988e-09, 'epoch': 1.98} {'loss': 0.2853, 'learning_rate': 3.285610546357454e-09, 'epoch': 1.98} {'loss': 0.2489, 'learning_rate': 3.2770043127638984e-09, 'epoch': 1.98} {'loss': 0.1495, 'learning_rate': 3.2684093635693136e-09, 'epoch': 1.98} {'loss': 0.3003, 'learning_rate': 3.259825698783692e-09, 'epoch': 1.98} {'loss': 0.2656, 'learning_rate': 3.2512533184170247e-09, 'epoch': 1.98} {'loss': 0.3053, 'learning_rate': 3.2426922224781943e-09, 'epoch': 1.98} {'loss': 0.2109, 'learning_rate': 3.2341424109783027e-09, 'epoch': 1.98} {'loss': 0.3326, 'learning_rate': 3.2256038839251213e-09, 'epoch': 1.98} {'loss': 0.2356, 'learning_rate': 3.217076641330863e-09, 'epoch': 1.98} {'loss': 0.4158, 'learning_rate': 3.2085606832021887e-09, 'epoch': 1.98} {'loss': 0.2606, 'learning_rate': 3.2000560095502007e-09, 'epoch': 1.98} {'loss': 0.4159, 'learning_rate': 3.1915626203848915e-09, 'epoch': 1.98} {'loss': 0.3366, 'learning_rate': 3.1830805157151424e-09, 'epoch': 1.98} {'loss': 0.2668, 'learning_rate': 3.1746096955498353e-09, 'epoch': 1.98} {'loss': 0.3126, 'learning_rate': 3.166150159900072e-09, 'epoch': 1.98} {'loss': 0.3174, 'learning_rate': 3.157701908774735e-09, 'epoch': 1.98} {'loss': 0.2851, 'learning_rate': 3.149264942183816e-09, 'epoch': 1.98} {'loss': 0.3253, 'learning_rate': 3.140839260136197e-09, 'epoch': 1.98} {'loss': 0.3666, 'learning_rate': 3.1324248626407596e-09, 'epoch': 1.98} {'loss': 0.2929, 'learning_rate': 3.1240217497086056e-09, 'epoch': 1.98} {'loss': 0.1899, 'learning_rate': 3.1156299213486175e-09, 'epoch': 1.98} {'loss': 0.2786, 'learning_rate': 3.1072493775696765e-09, 'epoch': 1.98} {'loss': 0.3208, 'learning_rate': 3.098880118381775e-09, 'epoch': 1.98} {'loss': 0.1875, 'learning_rate': 3.090522143793795e-09, 'epoch': 1.98} {'loss': 0.237, 'learning_rate': 3.082175453816838e-09, 'epoch': 1.98} {'loss': 0.2542, 'learning_rate': 3.073840048457566e-09, 'epoch': 1.98} {'loss': 0.4245, 'learning_rate': 3.065515927728191e-09, 'epoch': 1.98} {'loss': 0.4192, 'learning_rate': 3.0572030916364847e-09, 'epoch': 1.98} {'loss': 0.3307, 'learning_rate': 3.0489015401913293e-09, 'epoch': 1.98} {'loss': 0.3504, 'learning_rate': 3.0406112734038263e-09, 'epoch': 1.98} {'loss': 0.2333, 'learning_rate': 3.032332291282858e-09, 'epoch': 1.98} {'loss': 0.198, 'learning_rate': 3.0240645938361956e-09, 'epoch': 1.98} {'loss': 0.24, 'learning_rate': 3.0158081810749418e-09, 'epoch': 1.98} {'loss': 0.1748, 'learning_rate': 3.007563053007978e-09, 'epoch': 1.98} {'loss': 0.4994, 'learning_rate': 2.999329209644186e-09, 'epoch': 1.98} {'loss': 0.2628, 'learning_rate': 2.9911066509935583e-09, 'epoch': 1.98} {'loss': 0.2543, 'learning_rate': 2.982895377064976e-09, 'epoch': 1.98} {'loss': 0.3973, 'learning_rate': 2.974695387867321e-09, 'epoch': 1.98} {'loss': 0.2388, 'learning_rate': 2.966506683409476e-09, 'epoch': 1.98} {'loss': 0.4426, 'learning_rate': 2.958329263702542e-09, 'epoch': 1.98} {'loss': 0.3006, 'learning_rate': 2.950163128754291e-09, 'epoch': 1.99} {'loss': 0.4722, 'learning_rate': 2.942008278574715e-09, 'epoch': 1.99} {'loss': 0.2574, 'learning_rate': 2.933864713171586e-09, 'epoch': 1.99} {'loss': 0.4687, 'learning_rate': 2.9257324325560053e-09, 'epoch': 1.99} {'loss': 0.3484, 'learning_rate': 2.9176114367357456e-09, 'epoch': 1.99} {'loss': 0.2487, 'learning_rate': 2.9095017257207982e-09, 'epoch': 1.99} {'loss': 0.3375, 'learning_rate': 2.9014032995200447e-09, 'epoch': 1.99} {'loss': 0.3295, 'learning_rate': 2.8933161581423674e-09, 'epoch': 1.99} {'loss': 0.4025, 'learning_rate': 2.885240301596648e-09, 'epoch': 1.99} {'loss': 0.4349, 'learning_rate': 2.877175729892878e-09, 'epoch': 1.99} {'loss': 0.1948, 'learning_rate': 2.86912244303994e-09, 'epoch': 1.99} {'loss': 0.371, 'learning_rate': 2.8610804410467153e-09, 'epoch': 1.99} {'loss': 0.338, 'learning_rate': 2.8530497239220857e-09, 'epoch': 1.99} {'loss': 0.3325, 'learning_rate': 2.8450302916749327e-09, 'epoch': 1.99} {'loss': 0.3765, 'learning_rate': 2.837022144315249e-09, 'epoch': 1.99} {'loss': 0.3334, 'learning_rate': 2.8290252818508056e-09, 'epoch': 1.99} {'loss': 0.3478, 'learning_rate': 2.821039704292705e-09, 'epoch': 1.99} {'loss': 0.3787, 'learning_rate': 2.8130654116476087e-09, 'epoch': 1.99} {'loss': 0.3185, 'learning_rate': 2.805102403925508e-09, 'epoch': 1.99} {'loss': 0.3437, 'learning_rate': 2.7971506811352857e-09, 'epoch': 1.99} {'loss': 0.2669, 'learning_rate': 2.789210243286933e-09, 'epoch': 1.99} {'loss': 0.3338, 'learning_rate': 2.7812810903871113e-09, 'epoch': 1.99} {'loss': 0.3118, 'learning_rate': 2.773363222446923e-09, 'epoch': 1.99} {'loss': 0.2957, 'learning_rate': 2.7654566394752503e-09, 'epoch': 1.99} {'loss': 0.3514, 'learning_rate': 2.757561341478754e-09, 'epoch': 1.99} {'loss': 0.2571, 'learning_rate': 2.7496773284696466e-09, 'epoch': 1.99} {'loss': 0.3797, 'learning_rate': 2.7418046004534794e-09, 'epoch': 1.99} {'loss': 0.2579, 'learning_rate': 2.7339431574424644e-09, 'epoch': 1.99} {'loss': 0.2879, 'learning_rate': 2.7260929994421537e-09, 'epoch': 1.99} {'loss': 0.4754, 'learning_rate': 2.718254126463649e-09, 'epoch': 1.99} {'loss': 0.1261, 'learning_rate': 2.710426538515831e-09, 'epoch': 1.99} {'loss': 0.2569, 'learning_rate': 2.702610235605363e-09, 'epoch': 1.99} {'loss': 0.3354, 'learning_rate': 2.6948052177433458e-09, 'epoch': 1.99} {'loss': 0.3095, 'learning_rate': 2.6870114849386618e-09, 'epoch': 1.99} {'loss': 0.3771, 'learning_rate': 2.6792290371979723e-09, 'epoch': 1.99} {'loss': 0.2146, 'learning_rate': 2.6714578745323794e-09, 'epoch': 1.99} {'loss': 0.3162, 'learning_rate': 2.6636979969485444e-09, 'epoch': 1.99} {'loss': 0.3072, 'learning_rate': 2.6559494044575695e-09, 'epoch': 1.99} {'loss': 0.2671, 'learning_rate': 2.6482120970661162e-09, 'epoch': 1.99} {'loss': 0.2144, 'learning_rate': 2.6404860747830663e-09, 'epoch': 1.99} {'loss': 0.3252, 'learning_rate': 2.632771337619522e-09, 'epoch': 1.99} {'loss': 0.1962, 'learning_rate': 2.625067885581034e-09, 'epoch': 1.99} {'loss': 0.3226, 'learning_rate': 2.6173757186787054e-09, 'epoch': 1.99} {'loss': 0.3575, 'learning_rate': 2.609694836920307e-09, 'epoch': 1.99} {'loss': 0.4645, 'learning_rate': 2.6020252403136105e-09, 'epoch': 1.99} {'loss': 0.3456, 'learning_rate': 2.5943669288686078e-09, 'epoch': 1.99} {'loss': 0.3262, 'learning_rate': 2.5867199025930713e-09, 'epoch': 1.99} {'loss': 0.4363, 'learning_rate': 2.579084161496992e-09, 'epoch': 1.99} {'loss': 0.3138, 'learning_rate': 2.5714597055870314e-09, 'epoch': 1.99} {'loss': 0.2578, 'learning_rate': 2.5638465348731824e-09, 'epoch': 1.99} {'loss': 0.3027, 'learning_rate': 2.5562446493643254e-09, 'epoch': 1.99} {'loss': 0.3967, 'learning_rate': 2.548654049067123e-09, 'epoch': 1.99} {'loss': 0.4073, 'learning_rate': 2.5410747339926767e-09, 'epoch': 1.99} {'loss': 0.3915, 'learning_rate': 2.533506704147648e-09, 'epoch': 1.99} {'loss': 0.2014, 'learning_rate': 2.5259499595409187e-09, 'epoch': 1.99} {'loss': 0.3984, 'learning_rate': 2.5184045001813706e-09, 'epoch': 1.99} {'loss': 0.3055, 'learning_rate': 2.5108703260778855e-09, 'epoch': 1.99} {'loss': 0.417, 'learning_rate': 2.503347437238235e-09, 'epoch': 1.99} {'loss': 0.2322, 'learning_rate': 2.4958358336713007e-09, 'epoch': 1.99} {'loss': 0.2845, 'learning_rate': 2.488335515384854e-09, 'epoch': 1.99} {'loss': 0.394, 'learning_rate': 2.4808464823877774e-09, 'epoch': 1.99} {'loss': 0.2677, 'learning_rate': 2.4733687346900624e-09, 'epoch': 1.99} {'loss': 0.3323, 'learning_rate': 2.4659022722983705e-09, 'epoch': 1.99} {'loss': 0.2993, 'learning_rate': 2.458447095220473e-09, 'epoch': 1.99} {'loss': 0.3424, 'learning_rate': 2.4510032034674726e-09, 'epoch': 1.99} {'loss': 0.2178, 'learning_rate': 2.44357059704492e-09, 'epoch': 1.99} {'loss': 0.2853, 'learning_rate': 2.436149275962807e-09, 'epoch': 1.99} {'loss': 0.3413, 'learning_rate': 2.4287392402289056e-09, 'epoch': 1.99} {'loss': 0.3323, 'learning_rate': 2.4213404898520978e-09, 'epoch': 1.99} {'loss': 0.2706, 'learning_rate': 2.4139530248412645e-09, 'epoch': 1.99} {'loss': 0.1824, 'learning_rate': 2.406576845203068e-09, 'epoch': 1.99} {'loss': 0.3254, 'learning_rate': 2.3992119509463896e-09, 'epoch': 1.99} {'loss': 0.3279, 'learning_rate': 2.391858342080111e-09, 'epoch': 1.99} {'loss': 0.1652, 'learning_rate': 2.3845160186131142e-09, 'epoch': 1.99} {'loss': 0.3648, 'learning_rate': 2.377184980552061e-09, 'epoch': 1.99} {'loss': 0.2984, 'learning_rate': 2.369865227906942e-09, 'epoch': 1.99} {'loss': 0.4581, 'learning_rate': 2.36255676068331e-09, 'epoch': 1.99} {'loss': 0.3012, 'learning_rate': 2.3552595788933765e-09, 'epoch': 1.99} {'loss': 0.2421, 'learning_rate': 2.3479736825415823e-09, 'epoch': 1.99} {'loss': 0.2848, 'learning_rate': 2.3406990716379195e-09, 'epoch': 1.99} {'loss': 0.2629, 'learning_rate': 2.3334357461912705e-09, 'epoch': 1.99} {'loss': 0.1936, 'learning_rate': 2.326183706208296e-09, 'epoch': 1.99} {'loss': 0.2624, 'learning_rate': 2.318942951698988e-09, 'epoch': 1.99} {'loss': 0.3773, 'learning_rate': 2.311713482670008e-09, 'epoch': 1.99} {'loss': 0.3526, 'learning_rate': 2.304495299129128e-09, 'epoch': 1.99} {'loss': 0.4086, 'learning_rate': 2.2972884010863395e-09, 'epoch': 1.99} {'loss': 0.1572, 'learning_rate': 2.290092788548304e-09, 'epoch': 1.99} {'loss': 0.3768, 'learning_rate': 2.2829084615227925e-09, 'epoch': 1.99} {'loss': 0.3561, 'learning_rate': 2.275735420019798e-09, 'epoch': 1.99} {'loss': 0.2845, 'learning_rate': 2.268573664045981e-09, 'epoch': 1.99} {'loss': 0.1669, 'learning_rate': 2.2614231936102238e-09, 'epoch': 1.99} {'loss': 0.332, 'learning_rate': 2.254284008720298e-09, 'epoch': 1.99} {'loss': 0.2422, 'learning_rate': 2.2471561093828643e-09, 'epoch': 1.99} {'loss': 0.3288, 'learning_rate': 2.2400394956079153e-09, 'epoch': 1.99} {'loss': 0.3265, 'learning_rate': 2.2329341674032222e-09, 'epoch': 1.99} {'loss': 0.3244, 'learning_rate': 2.225840124776557e-09, 'epoch': 1.99} {'loss': 0.3377, 'learning_rate': 2.218757367734581e-09, 'epoch': 1.99} {'loss': 0.2136, 'learning_rate': 2.2116858962872856e-09, 'epoch': 1.99} {'loss': 0.2638, 'learning_rate': 2.2046257104413325e-09, 'epoch': 1.99} {'loss': 0.275, 'learning_rate': 2.197576810205604e-09, 'epoch': 1.99} {'loss': 0.1144, 'learning_rate': 2.1905391955878706e-09, 'epoch': 1.99} {'loss': 0.4756, 'learning_rate': 2.183512866595905e-09, 'epoch': 1.99} {'loss': 0.3064, 'learning_rate': 2.1764978232374777e-09, 'epoch': 1.99} {'loss': 0.3233, 'learning_rate': 2.169494065520361e-09, 'epoch': 1.99} {'loss': 0.2938, 'learning_rate': 2.162501593452326e-09, 'epoch': 1.99} {'loss': 0.3482, 'learning_rate': 2.1555204070422552e-09, 'epoch': 1.99} {'loss': 0.2313, 'learning_rate': 2.148550506296809e-09, 'epoch': 1.99} {'loss': 0.4514, 'learning_rate': 2.1415918912248702e-09, 'epoch': 1.99} {'loss': 0.341, 'learning_rate': 2.1346445618342093e-09, 'epoch': 1.99} {'loss': 0.2584, 'learning_rate': 2.1277085181314882e-09, 'epoch': 1.99} {'loss': 0.4432, 'learning_rate': 2.120783760126699e-09, 'epoch': 1.99} {'loss': 0.3156, 'learning_rate': 2.1138702878253923e-09, 'epoch': 1.99} {'loss': 0.2879, 'learning_rate': 2.1069681012364506e-09, 'epoch': 1.99} {'loss': 0.1487, 'learning_rate': 2.100077200367645e-09, 'epoch': 1.99} {'loss': 0.2948, 'learning_rate': 2.0931975852267472e-09, 'epoch': 1.99} {'loss': 0.2426, 'learning_rate': 2.0863292558215288e-09, 'epoch': 1.99} {'loss': 0.2641, 'learning_rate': 2.079472212159761e-09, 'epoch': 1.99} {'loss': 0.2063, 'learning_rate': 2.072626454249216e-09, 'epoch': 1.99} {'loss': 0.461, 'learning_rate': 2.0657919820965545e-09, 'epoch': 1.99} {'loss': 0.3351, 'learning_rate': 2.0589687957106587e-09, 'epoch': 1.99} {'loss': 0.2968, 'learning_rate': 2.0521568950992997e-09, 'epoch': 1.99} {'loss': 0.3264, 'learning_rate': 2.04535628027025e-09, 'epoch': 1.99} {'loss': 0.2902, 'learning_rate': 2.03856695123017e-09, 'epoch': 1.99} {'loss': 0.3162, 'learning_rate': 2.0317889079879415e-09, 'epoch': 1.99} {'loss': 0.2845, 'learning_rate': 2.0250221505502264e-09, 'epoch': 1.99} {'loss': 0.345, 'learning_rate': 2.0182666789247963e-09, 'epoch': 1.99} {'loss': 0.2667, 'learning_rate': 2.011522493119422e-09, 'epoch': 1.99} {'loss': 0.2162, 'learning_rate': 2.004789593142986e-09, 'epoch': 1.99} {'loss': 0.2681, 'learning_rate': 1.9980679790010392e-09, 'epoch': 1.99} {'loss': 0.2779, 'learning_rate': 1.9913576507024634e-09, 'epoch': 1.99} {'loss': 0.1646, 'learning_rate': 1.98465860825392e-09, 'epoch': 1.99} {'loss': 0.3985, 'learning_rate': 1.9779708516642905e-09, 'epoch': 1.99} {'loss': 0.321, 'learning_rate': 1.971294380939126e-09, 'epoch': 1.99} {'loss': 0.2633, 'learning_rate': 1.964629196088419e-09, 'epoch': 1.99} {'loss': 0.4475, 'learning_rate': 1.9579752971177202e-09, 'epoch': 1.99} {'loss': 0.2428, 'learning_rate': 1.9513326840348014e-09, 'epoch': 1.99} {'loss': 0.5557, 'learning_rate': 1.944701356848544e-09, 'epoch': 1.99} {'loss': 0.3613, 'learning_rate': 1.9380813155644996e-09, 'epoch': 1.99} {'loss': 0.2205, 'learning_rate': 1.93147256019266e-09, 'epoch': 1.99} {'loss': 0.2844, 'learning_rate': 1.9248750907374658e-09, 'epoch': 1.99} {'loss': 0.3164, 'learning_rate': 1.9182889072089093e-09, 'epoch': 1.99} {'loss': 0.3352, 'learning_rate': 1.911714009612542e-09, 'epoch': 1.99} {'loss': 0.2786, 'learning_rate': 1.905150397957245e-09, 'epoch': 1.99} {'loss': 0.5217, 'learning_rate': 1.89859807224968e-09, 'epoch': 1.99} {'loss': 0.233, 'learning_rate': 1.8920570324976185e-09, 'epoch': 1.99} {'loss': 0.2848, 'learning_rate': 1.885527278707722e-09, 'epoch': 1.99} {'loss': 0.189, 'learning_rate': 1.8790088108877612e-09, 'epoch': 1.99} {'loss': 0.3897, 'learning_rate': 1.8725016290455088e-09, 'epoch': 1.99} {'loss': 0.2538, 'learning_rate': 1.8660057331876257e-09, 'epoch': 1.99} {'loss': 0.2096, 'learning_rate': 1.8595211233218835e-09, 'epoch': 1.99} {'loss': 0.4245, 'learning_rate': 1.8530477994560535e-09, 'epoch': 1.99} {'loss': 0.3039, 'learning_rate': 1.8465857615967974e-09, 'epoch': 1.99} {'loss': 0.3138, 'learning_rate': 1.8401350097507764e-09, 'epoch': 1.99} {'loss': 0.4181, 'learning_rate': 1.8336955439268722e-09, 'epoch': 1.99} {'loss': 0.2302, 'learning_rate': 1.827267364130636e-09, 'epoch': 1.99} {'loss': 0.3274, 'learning_rate': 1.8208504703709496e-09, 'epoch': 1.99} {'loss': 0.2098, 'learning_rate': 1.814444862653364e-09, 'epoch': 1.99} {'loss': 0.4788, 'learning_rate': 1.808050540986761e-09, 'epoch': 1.99} {'loss': 0.308, 'learning_rate': 1.8016675053778021e-09, 'epoch': 1.99} {'loss': 0.3042, 'learning_rate': 1.7952957558331485e-09, 'epoch': 1.99} {'loss': 0.2491, 'learning_rate': 1.7889352923605718e-09, 'epoch': 1.99} {'loss': 0.3303, 'learning_rate': 1.7825861149667334e-09, 'epoch': 1.99} {'loss': 0.2553, 'learning_rate': 1.7762482236594047e-09, 'epoch': 1.99} {'loss': 0.3121, 'learning_rate': 1.7699216184452472e-09, 'epoch': 1.99} {'loss': 0.2892, 'learning_rate': 1.7636062993309223e-09, 'epoch': 1.99} {'loss': 0.3163, 'learning_rate': 1.7573022663253114e-09, 'epoch': 1.99} {'loss': 0.2497, 'learning_rate': 1.751009519433966e-09, 'epoch': 1.99} {'loss': 0.2531, 'learning_rate': 1.7447280586646576e-09, 'epoch': 1.99} {'loss': 0.2706, 'learning_rate': 1.7384578840240474e-09, 'epoch': 1.99} {'loss': 0.1606, 'learning_rate': 1.732198995519907e-09, 'epoch': 1.99} {'loss': 0.2788, 'learning_rate': 1.7259513931588977e-09, 'epoch': 1.99} {'loss': 0.3267, 'learning_rate': 1.7197150769476811e-09, 'epoch': 1.99} {'loss': 0.268, 'learning_rate': 1.7134900468929184e-09, 'epoch': 1.99} {'loss': 0.1635, 'learning_rate': 1.7072763030034911e-09, 'epoch': 1.99} {'loss': 0.3675, 'learning_rate': 1.7010738452849508e-09, 'epoch': 1.99} {'loss': 0.2399, 'learning_rate': 1.6948826737450684e-09, 'epoch': 1.99} {'loss': 0.158, 'learning_rate': 1.6887027883893958e-09, 'epoch': 1.99} {'loss': 0.1888, 'learning_rate': 1.6825341892268143e-09, 'epoch': 1.99} {'loss': 0.3082, 'learning_rate': 1.6763768762628752e-09, 'epoch': 1.99} {'loss': 0.3809, 'learning_rate': 1.67023084950535e-09, 'epoch': 1.99} {'loss': 0.4291, 'learning_rate': 1.6640961089608998e-09, 'epoch': 1.99} {'loss': 0.2829, 'learning_rate': 1.6579726546361863e-09, 'epoch': 1.99} {'loss': 0.1561, 'learning_rate': 1.6518604865378707e-09, 'epoch': 1.99} {'loss': 0.3651, 'learning_rate': 1.6457596046737245e-09, 'epoch': 1.99} {'loss': 0.17, 'learning_rate': 1.639670009050409e-09, 'epoch': 1.99} {'loss': 0.3532, 'learning_rate': 1.633591699674586e-09, 'epoch': 1.99} {'loss': 0.3685, 'learning_rate': 1.6275246765529162e-09, 'epoch': 1.99} {'loss': 0.3624, 'learning_rate': 1.6214689396931716e-09, 'epoch': 1.99} {'loss': 0.1614, 'learning_rate': 1.615424489100903e-09, 'epoch': 1.99} {'loss': 0.3644, 'learning_rate': 1.609391324783882e-09, 'epoch': 1.99} {'loss': 0.2812, 'learning_rate': 1.60336944674766e-09, 'epoch': 1.99} {'loss': 0.3079, 'learning_rate': 1.5973588550011187e-09, 'epoch': 1.99} {'loss': 0.2934, 'learning_rate': 1.591359549549809e-09, 'epoch': 1.99} {'loss': 0.1965, 'learning_rate': 1.5853715304003925e-09, 'epoch': 1.99} {'loss': 0.2666, 'learning_rate': 1.5793947975595303e-09, 'epoch': 1.99} {'loss': 0.2239, 'learning_rate': 1.5734293510338838e-09, 'epoch': 1.99} {'loss': 0.261, 'learning_rate': 1.5674751908312246e-09, 'epoch': 1.99} {'loss': 0.2765, 'learning_rate': 1.561532316957104e-09, 'epoch': 1.99} {'loss': 0.3021, 'learning_rate': 1.5556007294192932e-09, 'epoch': 1.99} {'loss': 0.2267, 'learning_rate': 1.5496804282233435e-09, 'epoch': 1.99} {'loss': 0.2842, 'learning_rate': 1.5437714133770265e-09, 'epoch': 1.99} {'loss': 0.2223, 'learning_rate': 1.5378736848858933e-09, 'epoch': 1.99} {'loss': 0.3734, 'learning_rate': 1.5319872427577154e-09, 'epoch': 1.99} {'loss': 0.2389, 'learning_rate': 1.526112086998044e-09, 'epoch': 1.99} {'loss': 0.3165, 'learning_rate': 1.5202482176146505e-09, 'epoch': 1.99} {'loss': 0.2338, 'learning_rate': 1.5143956346141963e-09, 'epoch': 1.99} {'loss': 0.2466, 'learning_rate': 1.5085543380011224e-09, 'epoch': 1.99} {'loss': 0.2093, 'learning_rate': 1.5027243277854208e-09, 'epoch': 1.99} {'loss': 0.2533, 'learning_rate': 1.4969056039704223e-09, 'epoch': 1.99} {'loss': 0.4196, 'learning_rate': 1.491098166565008e-09, 'epoch': 1.99} {'loss': 0.4282, 'learning_rate': 1.4853020155736198e-09, 'epoch': 1.99} {'loss': 0.1612, 'learning_rate': 1.4795171510051388e-09, 'epoch': 1.99} {'loss': 0.3603, 'learning_rate': 1.4737435728640059e-09, 'epoch': 1.99} {'loss': 0.262, 'learning_rate': 1.4679812811591032e-09, 'epoch': 1.99} {'loss': 0.3534, 'learning_rate': 1.4622302758948714e-09, 'epoch': 1.99} {'loss': 0.3368, 'learning_rate': 1.4564905570779719e-09, 'epoch': 1.99} {'loss': 0.2915, 'learning_rate': 1.4507621247161763e-09, 'epoch': 1.99} {'loss': 0.2968, 'learning_rate': 1.4450449788139254e-09, 'epoch': 1.99} {'loss': 0.3122, 'learning_rate': 1.439339119380101e-09, 'epoch': 1.99} {'loss': 0.2321, 'learning_rate': 1.4336445464202541e-09, 'epoch': 1.99} {'loss': 0.3649, 'learning_rate': 1.427961259938826e-09, 'epoch': 1.99} {'loss': 0.3488, 'learning_rate': 1.4222892599458082e-09, 'epoch': 1.99} {'loss': 0.3405, 'learning_rate': 1.4166285464445317e-09, 'epoch': 1.99} {'loss': 0.2421, 'learning_rate': 1.410979119442768e-09, 'epoch': 1.99} {'loss': 0.5485, 'learning_rate': 1.4053409789471784e-09, 'epoch': 1.99} {'loss': 0.33, 'learning_rate': 1.399714124963314e-09, 'epoch': 1.99} {'loss': 0.2913, 'learning_rate': 1.3940985574978361e-09, 'epoch': 1.99} {'loss': 0.3181, 'learning_rate': 1.3884942765562958e-09, 'epoch': 1.99} {'loss': 0.4102, 'learning_rate': 1.382901282146465e-09, 'epoch': 1.99} {'loss': 0.3238, 'learning_rate': 1.3773195742738943e-09, 'epoch': 1.99} {'loss': 0.2838, 'learning_rate': 1.3717491529463556e-09, 'epoch': 1.99} {'loss': 0.2615, 'learning_rate': 1.3661900181671794e-09, 'epoch': 1.99} {'loss': 0.3459, 'learning_rate': 1.3606421699441375e-09, 'epoch': 1.99} {'loss': 0.3489, 'learning_rate': 1.3551056082850012e-09, 'epoch': 1.99} {'loss': 0.2902, 'learning_rate': 1.3495803331931012e-09, 'epoch': 1.99} {'loss': 0.3576, 'learning_rate': 1.3440663446773194e-09, 'epoch': 1.99} {'loss': 0.2898, 'learning_rate': 1.3385636427420968e-09, 'epoch': 1.99} {'loss': 0.3221, 'learning_rate': 1.3330722273952046e-09, 'epoch': 1.99} {'loss': 0.3248, 'learning_rate': 1.327592098641084e-09, 'epoch': 1.99} {'loss': 0.3099, 'learning_rate': 1.3221232564863961e-09, 'epoch': 1.99} {'loss': 0.3723, 'learning_rate': 1.3166657009389127e-09, 'epoch': 1.99} {'loss': 0.2228, 'learning_rate': 1.3112194320030746e-09, 'epoch': 1.99} {'loss': 0.3392, 'learning_rate': 1.3057844496855431e-09, 'epoch': 1.99} {'loss': 0.227, 'learning_rate': 1.3003607539918695e-09, 'epoch': 1.99} {'loss': 0.3071, 'learning_rate': 1.2949483449287147e-09, 'epoch': 1.99} {'loss': 0.3199, 'learning_rate': 1.2895472225027406e-09, 'epoch': 1.99} {'loss': 0.2613, 'learning_rate': 1.2841573867194978e-09, 'epoch': 1.99} {'loss': 0.3111, 'learning_rate': 1.278778837585648e-09, 'epoch': 1.99} {'loss': 0.3768, 'learning_rate': 1.273411575105632e-09, 'epoch': 1.99} {'loss': 0.4479, 'learning_rate': 1.2680555992872213e-09, 'epoch': 1.99} {'loss': 0.2624, 'learning_rate': 1.262710910135967e-09, 'epoch': 1.99} {'loss': 0.2116, 'learning_rate': 1.25737750765742e-09, 'epoch': 1.99} {'loss': 0.2625, 'learning_rate': 1.2520553918582423e-09, 'epoch': 1.99} {'loss': 0.3343, 'learning_rate': 1.2467445627439846e-09, 'epoch': 1.99} {'loss': 0.2965, 'learning_rate': 1.2414450203201977e-09, 'epoch': 1.99} {'loss': 0.4175, 'learning_rate': 1.2361567645946538e-09, 'epoch': 1.99} {'loss': 0.402, 'learning_rate': 1.230879795570683e-09, 'epoch': 1.99} {'loss': 0.3746, 'learning_rate': 1.2256141132571676e-09, 'epoch': 1.99} {'loss': 0.4204, 'learning_rate': 1.2203597176574378e-09, 'epoch': 1.99} {'loss': 0.4032, 'learning_rate': 1.2151166087792655e-09, 'epoch': 1.99} {'loss': 0.3455, 'learning_rate': 1.2098847866270912e-09, 'epoch': 1.99} {'loss': 0.2846, 'learning_rate': 1.204664251208687e-09, 'epoch': 1.99} {'loss': 0.3267, 'learning_rate': 1.1994550025284934e-09, 'epoch': 1.99} {'loss': 0.3341, 'learning_rate': 1.1942570405920618e-09, 'epoch': 1.99} {'loss': 0.2652, 'learning_rate': 1.1890703654071633e-09, 'epoch': 1.99} {'loss': 0.2728, 'learning_rate': 1.183894976977129e-09, 'epoch': 1.99} {'loss': 0.3158, 'learning_rate': 1.1787308753097303e-09, 'epoch': 1.99} {'loss': 0.2972, 'learning_rate': 1.1735780604105184e-09, 'epoch': 1.99} {'loss': 0.2967, 'learning_rate': 1.1684365322850445e-09, 'epoch': 1.99} {'loss': 0.2625, 'learning_rate': 1.1633062909388593e-09, 'epoch': 1.99} {'loss': 0.2571, 'learning_rate': 1.1581873363775141e-09, 'epoch': 1.99} {'loss': 0.2002, 'learning_rate': 1.1530796686076707e-09, 'epoch': 1.99} {'loss': 0.2214, 'learning_rate': 1.1479832876337694e-09, 'epoch': 1.99} {'loss': 0.1395, 'learning_rate': 1.1428981934635819e-09, 'epoch': 1.99} {'loss': 0.2555, 'learning_rate': 1.137824386100439e-09, 'epoch': 1.99} {'loss': 0.5232, 'learning_rate': 1.1327618655521123e-09, 'epoch': 1.99} {'loss': 0.4705, 'learning_rate': 1.1277106318230423e-09, 'epoch': 1.99} {'loss': 0.2995, 'learning_rate': 1.122670684919891e-09, 'epoch': 1.99} {'loss': 0.2816, 'learning_rate': 1.117642024848209e-09, 'epoch': 1.99} {'loss': 0.2848, 'learning_rate': 1.1126246516124373e-09, 'epoch': 1.99} {'loss': 0.4006, 'learning_rate': 1.1076185652203475e-09, 'epoch': 1.99} {'loss': 0.2066, 'learning_rate': 1.1026237656752703e-09, 'epoch': 1.99} {'loss': 0.2096, 'learning_rate': 1.0976402529849772e-09, 'epoch': 1.99} {'loss': 0.191, 'learning_rate': 1.0926680271527989e-09, 'epoch': 1.99} {'loss': 0.3773, 'learning_rate': 1.087707088186507e-09, 'epoch': 1.99} {'loss': 0.2645, 'learning_rate': 1.0827574360905425e-09, 'epoch': 1.99} {'loss': 0.3143, 'learning_rate': 1.0778190708704561e-09, 'epoch': 1.99} {'loss': 0.3749, 'learning_rate': 1.0728919925329095e-09, 'epoch': 1.99} {'loss': 0.3109, 'learning_rate': 1.0679762010823436e-09, 'epoch': 1.99} {'loss': 0.1874, 'learning_rate': 1.0630716965243093e-09, 'epoch': 1.99} {'loss': 0.3187, 'learning_rate': 1.058178478864358e-09, 'epoch': 1.99} {'loss': 0.3011, 'learning_rate': 1.0532965481091505e-09, 'epoch': 1.99} {'loss': 0.2869, 'learning_rate': 1.0484259042631284e-09, 'epoch': 1.99} {'loss': 0.3863, 'learning_rate': 1.0435665473318424e-09, 'epoch': 1.99} {'loss': 0.271, 'learning_rate': 1.038718477321954e-09, 'epoch': 1.99} {'loss': 0.3173, 'learning_rate': 1.0338816942367935e-09, 'epoch': 1.99} {'loss': 0.34, 'learning_rate': 1.0290561980830228e-09, 'epoch': 1.99} {'loss': 0.4052, 'learning_rate': 1.0242419888673027e-09, 'epoch': 1.99} {'loss': 0.209, 'learning_rate': 1.0194390665929644e-09, 'epoch': 1.99} {'loss': 0.2894, 'learning_rate': 1.0146474312655586e-09, 'epoch': 1.99} {'loss': 0.3511, 'learning_rate': 1.0098670828917467e-09, 'epoch': 1.99} {'loss': 0.4259, 'learning_rate': 1.00509802147708e-09, 'epoch': 1.99} {'loss': 0.2659, 'learning_rate': 1.0003402470259992e-09, 'epoch': 1.99} {'loss': 0.2176, 'learning_rate': 9.955937595440556e-10, 'epoch': 1.99} {'loss': 0.3049, 'learning_rate': 9.9085855903569e-10, 'epoch': 1.99} {'loss': 0.3222, 'learning_rate': 9.86134645508674e-10, 'epoch': 1.99} {'loss': 0.3724, 'learning_rate': 9.814220189663382e-10, 'epoch': 1.99} {'loss': 0.3255, 'learning_rate': 9.767206794142337e-10, 'epoch': 1.99} {'loss': 0.1764, 'learning_rate': 9.720306268579116e-10, 'epoch': 1.99} {'loss': 0.3788, 'learning_rate': 9.673518613040333e-10, 'epoch': 1.99} {'loss': 0.2444, 'learning_rate': 9.626843827559295e-10, 'epoch': 1.99} {'loss': 0.3286, 'learning_rate': 9.580281912191514e-10, 'epoch': 1.99} {'loss': 0.2613, 'learning_rate': 9.533832866992498e-10, 'epoch': 1.99} {'loss': 0.3849, 'learning_rate': 9.487496692017761e-10, 'epoch': 1.99} {'loss': 0.2278, 'learning_rate': 9.441273387322813e-10, 'epoch': 1.99} {'loss': 0.3265, 'learning_rate': 9.395162952952063e-10, 'epoch': 1.99} {'loss': 0.3641, 'learning_rate': 9.349165388961023e-10, 'epoch': 1.99} {'loss': 0.3418, 'learning_rate': 9.303280695394101e-10, 'epoch': 1.99} {'loss': 0.2766, 'learning_rate': 9.25750887231791e-10, 'epoch': 1.99} {'loss': 0.3325, 'learning_rate': 9.211849919765758e-10, 'epoch': 1.99} {'loss': 0.2698, 'learning_rate': 9.166303837804258e-10, 'epoch': 1.99} {'loss': 0.2333, 'learning_rate': 9.12087062648892e-10, 'epoch': 1.99} {'loss': 0.2428, 'learning_rate': 9.075550285853052e-10, 'epoch': 1.99} {'loss': 0.3161, 'learning_rate': 9.030342815952164e-10, 'epoch': 1.99} {'loss': 0.2064, 'learning_rate': 8.985248216852871e-10, 'epoch': 1.99} {'loss': 0.2662, 'learning_rate': 8.940266488588478e-10, 'epoch': 1.99} {'loss': 0.2865, 'learning_rate': 8.895397631214498e-10, 'epoch': 1.99} {'loss': 0.4086, 'learning_rate': 8.85064164478644e-10, 'epoch': 1.99} {'loss': 0.2058, 'learning_rate': 8.805998529348713e-10, 'epoch': 1.99} {'loss': 0.3692, 'learning_rate': 8.761468284956831e-10, 'epoch': 1.99} {'loss': 0.4032, 'learning_rate': 8.717050911666302e-10, 'epoch': 1.99} {'loss': 0.3471, 'learning_rate': 8.672746409510435e-10, 'epoch': 1.99} {'loss': 0.3072, 'learning_rate': 8.628554778555842e-10, 'epoch': 1.99} {'loss': 0.2154, 'learning_rate': 8.58447601883583e-10, 'epoch': 1.99} {'loss': 0.3739, 'learning_rate': 8.540510130417012e-10, 'epoch': 1.99} {'loss': 0.2528, 'learning_rate': 8.496657113343798e-10, 'epoch': 1.99} {'loss': 0.3094, 'learning_rate': 8.452916967660596e-10, 'epoch': 1.99} {'loss': 0.2791, 'learning_rate': 8.409289693422917e-10, 'epoch': 1.99} {'loss': 0.4055, 'learning_rate': 8.365775290675171e-10, 'epoch': 1.99} {'loss': 0.2662, 'learning_rate': 8.322373759461765e-10, 'epoch': 1.99} {'loss': 0.3329, 'learning_rate': 8.279085099838213e-10, 'epoch': 1.99} {'loss': 0.4049, 'learning_rate': 8.235909311860024e-10, 'epoch': 1.99} {'loss': 0.2152, 'learning_rate': 8.192846395571608e-10, 'epoch': 1.99} {'loss': 0.3364, 'learning_rate': 8.149896351017372e-10, 'epoch': 1.99} {'loss': 0.2832, 'learning_rate': 8.107059178241728e-10, 'epoch': 1.99} {'loss': 0.3698, 'learning_rate': 8.064334877300184e-10, 'epoch': 1.99} {'loss': 0.3884, 'learning_rate': 8.021723448237151e-10, 'epoch': 1.99} {'loss': 0.2618, 'learning_rate': 7.979224891108139e-10, 'epoch': 1.99} {'loss': 0.2908, 'learning_rate': 7.936839205957558e-10, 'epoch': 1.99} {'loss': 0.2906, 'learning_rate': 7.894566392829817e-10, 'epoch': 1.99} {'loss': 0.2963, 'learning_rate': 7.852406451780425e-10, 'epoch': 1.99} {'loss': 0.2519, 'learning_rate': 7.810359382842691e-10, 'epoch': 1.99} {'loss': 0.288, 'learning_rate': 7.768425186072126e-10, 'epoch': 1.99} {'loss': 0.2235, 'learning_rate': 7.72660386152424e-10, 'epoch': 1.99} {'loss': 0.3266, 'learning_rate': 7.68489540923234e-10, 'epoch': 1.99} {'loss': 0.4135, 'learning_rate': 7.643299829251937e-10, 'epoch': 1.99} {'loss': 0.3755, 'learning_rate': 7.601817121627442e-10, 'epoch': 1.99} {'loss': 0.1962, 'learning_rate': 7.560447286403261e-10, 'epoch': 1.99} {'loss': 0.2908, 'learning_rate': 7.519190323634906e-10, 'epoch': 1.99} {'loss': 0.0926, 'learning_rate': 7.478046233355684e-10, 'epoch': 1.99} {'loss': 0.2117, 'learning_rate': 7.43701501563221e-10, 'epoch': 1.99} {'loss': 0.2508, 'learning_rate': 7.396096670486686e-10, 'epoch': 1.99} {'loss': 0.3743, 'learning_rate': 7.355291197974623e-10, 'epoch': 1.99} {'loss': 0.3808, 'learning_rate': 7.314598598151534e-10, 'epoch': 1.99} {'loss': 0.3477, 'learning_rate': 7.274018871050725e-10, 'epoch': 1.99} {'loss': 0.2928, 'learning_rate': 7.233552016727707e-10, 'epoch': 1.99} {'loss': 0.2967, 'learning_rate': 7.193198035226889e-10, 'epoch': 1.99} {'loss': 0.2072, 'learning_rate': 7.152956926581578e-10, 'epoch': 1.99} {'loss': 0.2618, 'learning_rate': 7.112828690847284e-10, 'epoch': 1.99} {'loss': 0.26, 'learning_rate': 7.072813328068418e-10, 'epoch': 1.99} {'loss': 0.388, 'learning_rate': 7.032910838289386e-10, 'epoch': 1.99} {'loss': 0.3145, 'learning_rate': 6.993121221565702e-10, 'epoch': 1.99} {'loss': 0.2732, 'learning_rate': 6.953444477919568e-10, 'epoch': 1.99} {'loss': 0.2737, 'learning_rate': 6.9138806074176e-10, 'epoch': 1.99} {'loss': 0.3064, 'learning_rate': 6.874429610082001e-10, 'epoch': 1.99} {'loss': 0.3921, 'learning_rate': 6.835091485979384e-10, 'epoch': 1.99} {'loss': 0.3559, 'learning_rate': 6.795866235154158e-10, 'epoch': 1.99} {'loss': 0.3964, 'learning_rate': 6.756753857628528e-10, 'epoch': 1.99} {'loss': 0.3499, 'learning_rate': 6.717754353458005e-10, 'epoch': 1.99} {'loss': 0.2984, 'learning_rate': 6.678867722698101e-10, 'epoch': 1.99} {'loss': 0.3684, 'learning_rate': 6.640093965382122e-10, 'epoch': 1.99} {'loss': 0.3305, 'learning_rate': 6.601433081554475e-10, 'epoch': 1.99} {'loss': 0.3887, 'learning_rate': 6.562885071259572e-10, 'epoch': 1.99} {'loss': 0.2693, 'learning_rate': 6.524449934530718e-10, 'epoch': 1.99} {'loss': 0.3815, 'learning_rate': 6.486127671434528e-10, 'epoch': 1.99} {'loss': 0.2523, 'learning_rate': 6.447918281993204e-10, 'epoch': 1.99} {'loss': 0.2521, 'learning_rate': 6.409821766262259e-10, 'epoch': 1.99} {'loss': 0.3725, 'learning_rate': 6.371838124274998e-10, 'epoch': 1.99} {'loss': 0.3001, 'learning_rate': 6.333967356075832e-10, 'epoch': 1.99} {'loss': 0.2644, 'learning_rate': 6.296209461720271e-10, 'epoch': 1.99} {'loss': 0.2684, 'learning_rate': 6.258564441241622e-10, 'epoch': 1.99} {'loss': 0.4106, 'learning_rate': 6.22103229467319e-10, 'epoch': 1.99} {'loss': 0.3477, 'learning_rate': 6.183613022070489e-10, 'epoch': 1.99} {'loss': 0.4605, 'learning_rate': 6.146306623477926e-10, 'epoch': 1.99} {'loss': 0.2287, 'learning_rate': 6.109113098928809e-10, 'epoch': 1.99} {'loss': 0.1839, 'learning_rate': 6.072032448467547e-10, 'epoch': 1.99} {'loss': 0.2301, 'learning_rate': 6.035064672127444e-10, 'epoch': 1.99} {'loss': 0.3283, 'learning_rate': 5.998209769964014e-10, 'epoch': 1.99} {'loss': 0.2456, 'learning_rate': 5.961467742021665e-10, 'epoch': 1.99} {'loss': 0.402, 'learning_rate': 5.924838588322601e-10, 'epoch': 1.99} {'loss': 0.281, 'learning_rate': 5.888322308933436e-10, 'epoch': 1.99} {'loss': 0.3264, 'learning_rate': 5.851918903865272e-10, 'epoch': 1.99} {'loss': 0.2558, 'learning_rate': 5.815628373184723e-10, 'epoch': 1.99} {'loss': 0.3874, 'learning_rate': 5.779450716925095e-10, 'epoch': 1.99} {'loss': 0.3339, 'learning_rate': 5.743385935119694e-10, 'epoch': 1.99} {'loss': 0.2618, 'learning_rate': 5.707434027824032e-10, 'epoch': 1.99} {'loss': 0.459, 'learning_rate': 5.671594995060314e-10, 'epoch': 1.99} {'loss': 0.23, 'learning_rate': 5.63586883688405e-10, 'epoch': 1.99} {'loss': 0.2665, 'learning_rate': 5.600255553328548e-10, 'epoch': 1.99} {'loss': 0.2472, 'learning_rate': 5.564755144438216e-10, 'epoch': 1.99} {'loss': 0.2558, 'learning_rate': 5.529367610246361e-10, 'epoch': 1.99} {'loss': 0.0975, 'learning_rate': 5.494092950797392e-10, 'epoch': 1.99} {'loss': 0.4263, 'learning_rate': 5.458931166135717e-10, 'epoch': 1.99} {'loss': 0.2495, 'learning_rate': 5.423882256294644e-10, 'epoch': 1.99} {'loss': 0.1585, 'learning_rate': 5.388946221307479e-10, 'epoch': 1.99} {'loss': 0.1958, 'learning_rate': 5.354123061229732e-10, 'epoch': 1.99} {'loss': 0.3909, 'learning_rate': 5.319412776094712e-10, 'epoch': 1.99} {'loss': 0.3392, 'learning_rate': 5.284815365935725e-10, 'epoch': 1.99} {'loss': 0.3762, 'learning_rate': 5.250330830786077e-10, 'epoch': 1.99} {'loss': 0.3832, 'learning_rate': 5.215959170701279e-10, 'epoch': 1.99} {'loss': 0.3682, 'learning_rate': 5.181700385714639e-10, 'epoch': 1.99} {'loss': 0.304, 'learning_rate': 5.147554475859462e-10, 'epoch': 1.99} {'loss': 0.0918, 'learning_rate': 5.113521441180158e-10, 'epoch': 1.99} {'loss': 0.3468, 'learning_rate': 5.079601281710034e-10, 'epoch': 1.99} {'loss': 0.3683, 'learning_rate': 5.045793997493497e-10, 'epoch': 1.99} {'loss': 0.3812, 'learning_rate': 5.012099588563857e-10, 'epoch': 1.99} {'loss': 0.3878, 'learning_rate': 4.978518054965519e-10, 'epoch': 1.99} {'loss': 0.3791, 'learning_rate': 4.945049396731794e-10, 'epoch': 1.99} {'loss': 0.3696, 'learning_rate': 4.911693613895985e-10, 'epoch': 1.99} {'loss': 0.3412, 'learning_rate': 4.8784507064914e-10, 'epoch': 1.99} {'loss': 0.3297, 'learning_rate': 4.845320674573551e-10, 'epoch': 1.99} {'loss': 0.222, 'learning_rate': 4.812303518175743e-10, 'epoch': 1.99} {'loss': 0.4751, 'learning_rate': 4.779399237320181e-10, 'epoch': 1.99} {'loss': 0.3547, 'learning_rate': 4.746607832051275e-10, 'epoch': 1.99} {'loss': 0.2032, 'learning_rate': 4.713929302413434e-10, 'epoch': 1.99} {'loss': 0.2997, 'learning_rate': 4.681363648439963e-10, 'epoch': 1.99} {'loss': 0.3125, 'learning_rate': 4.6489108701641695e-10, 'epoch': 1.99} {'loss': 0.3567, 'learning_rate': 4.6165709676304626e-10, 'epoch': 1.99} {'loss': 0.2332, 'learning_rate': 4.5843439408610467e-10, 'epoch': 1.99} {'loss': 0.2553, 'learning_rate': 4.552229789911433e-10, 'epoch': 1.99} {'loss': 0.3527, 'learning_rate': 4.520228514792724e-10, 'epoch': 1.99} {'loss': 0.3189, 'learning_rate': 4.4883401155715325e-10, 'epoch': 1.99} {'loss': 0.223, 'learning_rate': 4.4565645922589604e-10, 'epoch': 1.99} {'loss': 0.2487, 'learning_rate': 4.424901944899418e-10, 'epoch': 1.99} {'loss': 0.278, 'learning_rate': 4.393352173526211e-10, 'epoch': 1.99} {'loss': 0.2384, 'learning_rate': 4.3619152781837484e-10, 'epoch': 1.99} {'loss': 0.2491, 'learning_rate': 4.330591258905337e-10, 'epoch': 1.99} {'loss': 0.4372, 'learning_rate': 4.299380115713181e-10, 'epoch': 1.99} {'loss': 0.2468, 'learning_rate': 4.268281848662792e-10, 'epoch': 1.99} {'loss': 0.1949, 'learning_rate': 4.237296457765272e-10, 'epoch': 1.99} {'loss': 0.3177, 'learning_rate': 4.206423943076132e-10, 'epoch': 1.99} {'loss': 0.3926, 'learning_rate': 4.1756643046286794e-10, 'epoch': 1.99} {'loss': 0.2452, 'learning_rate': 4.145017542445118e-10, 'epoch': 1.99} {'loss': 0.3154, 'learning_rate': 4.114483656558754e-10, 'epoch': 1.99} {'loss': 0.349, 'learning_rate': 4.0840626470250997e-10, 'epoch': 1.99} {'loss': 0.4496, 'learning_rate': 4.0537545138663595e-10, 'epoch': 1.99} {'loss': 0.2387, 'learning_rate': 4.0235592571047364e-10, 'epoch': 1.99} {'loss': 0.3505, 'learning_rate': 3.993476876795743e-10, 'epoch': 1.99} {'loss': 0.3685, 'learning_rate': 3.963507372950481e-10, 'epoch': 1.99} {'loss': 0.4463, 'learning_rate': 3.933650745624462e-10, 'epoch': 1.99} {'loss': 0.1935, 'learning_rate': 3.90390699483989e-10, 'epoch': 1.99} {'loss': 0.3141, 'learning_rate': 3.8742761206411737e-10, 'epoch': 1.99} {'loss': 0.3013, 'learning_rate': 3.844758123039416e-10, 'epoch': 1.99} {'loss': 0.3459, 'learning_rate': 3.8153530020901273e-10, 'epoch': 1.99} {'loss': 0.2795, 'learning_rate': 3.786060757815513e-10, 'epoch': 1.99} {'loss': 0.2494, 'learning_rate': 3.7568813902488786e-10, 'epoch': 1.99} {'loss': 0.2041, 'learning_rate': 3.727814899434634e-10, 'epoch': 1.99} {'loss': 0.3884, 'learning_rate': 3.698861285383881e-10, 'epoch': 1.99} {'loss': 0.3759, 'learning_rate': 3.670020548152131e-10, 'epoch': 1.99} {'loss': 0.3504, 'learning_rate': 3.6412926877615885e-10, 'epoch': 1.99} {'loss': 0.2912, 'learning_rate': 3.612677704234457e-10, 'epoch': 1.99} {'loss': 0.32, 'learning_rate': 3.5841755976262494e-10, 'epoch': 1.99} {'loss': 0.3501, 'learning_rate': 3.5557863679480667e-10, 'epoch': 1.99} {'loss': 0.3446, 'learning_rate': 3.5275100152443173e-10, 'epoch': 1.99} {'loss': 0.4647, 'learning_rate': 3.499346539537207e-10, 'epoch': 1.99} {'loss': 0.2859, 'learning_rate': 3.4712959408711445e-10, 'epoch': 1.99} {'loss': 0.3615, 'learning_rate': 3.4433582192683334e-10, 'epoch': 1.99} {'loss': 0.192, 'learning_rate': 3.415533374762081e-10, 'epoch': 1.99} {'loss': 0.4333, 'learning_rate': 3.387821407385694e-10, 'epoch': 1.99} {'loss': 0.3494, 'learning_rate': 3.3602223171613766e-10, 'epoch': 1.99} {'loss': 0.2073, 'learning_rate': 3.332736104133538e-10, 'epoch': 1.99} {'loss': 0.2919, 'learning_rate': 3.305362768335485e-10, 'epoch': 1.99} {'loss': 0.3943, 'learning_rate': 3.2781023097783194e-10, 'epoch': 2.0} {'loss': 0.3584, 'learning_rate': 3.2509547285175523e-10, 'epoch': 2.0} {'loss': 0.2417, 'learning_rate': 3.2239200245642866e-10, 'epoch': 2.0} {'loss': 0.3081, 'learning_rate': 3.196998197951828e-10, 'epoch': 2.0} {'loss': 0.3113, 'learning_rate': 3.170189248713484e-10, 'epoch': 2.0} {'loss': 0.1909, 'learning_rate': 3.1434931768936637e-10, 'epoch': 2.0} {'loss': 0.3723, 'learning_rate': 3.116909982503469e-10, 'epoch': 2.0} {'loss': 0.2587, 'learning_rate': 3.0904396655762057e-10, 'epoch': 2.0} {'loss': 0.31, 'learning_rate': 3.064082226145182e-10, 'epoch': 2.0} {'loss': 0.3531, 'learning_rate': 3.037837664232601e-10, 'epoch': 2.0} {'loss': 0.3173, 'learning_rate': 3.011705979882873e-10, 'epoch': 2.0} {'loss': 0.3827, 'learning_rate': 2.9856871731182014e-10, 'epoch': 2.0} {'loss': 0.2322, 'learning_rate': 2.959781243971893e-10, 'epoch': 2.0} {'loss': 0.3816, 'learning_rate': 2.9339881924550505e-10, 'epoch': 2.0} {'loss': 0.2918, 'learning_rate': 2.908308018623185e-10, 'epoch': 2.0} {'loss': 0.2539, 'learning_rate': 2.8827407224873983e-10, 'epoch': 2.0} {'loss': 0.226, 'learning_rate': 2.8572863040809974e-10, 'epoch': 2.0} {'loss': 0.35, 'learning_rate': 2.8319447634372886e-10, 'epoch': 2.0} {'loss': 0.2892, 'learning_rate': 2.806716100578477e-10, 'epoch': 2.0} {'loss': 0.3866, 'learning_rate': 2.781600315537869e-10, 'epoch': 2.0} {'loss': 0.2673, 'learning_rate': 2.756597408337669e-10, 'epoch': 2.0} {'loss': 0.218, 'learning_rate': 2.7317073790111836e-10, 'epoch': 2.0} {'loss': 0.4396, 'learning_rate': 2.7069302275806173e-10, 'epoch': 2.0} {'loss': 0.1551, 'learning_rate': 2.6822659540903796e-10, 'epoch': 2.0} {'loss': 0.2339, 'learning_rate': 2.6577145585404694e-10, 'epoch': 2.0} {'loss': 0.4472, 'learning_rate': 2.633276040986399e-10, 'epoch': 2.0} {'loss': 0.3136, 'learning_rate': 2.60895040143927e-10, 'epoch': 2.0} {'loss': 0.3386, 'learning_rate': 2.5847376399323885e-10, 'epoch': 2.0} {'loss': 0.2905, 'learning_rate': 2.5606377564990625e-10, 'epoch': 2.0} {'loss': 0.2758, 'learning_rate': 2.5366507511503936e-10, 'epoch': 2.0} {'loss': 0.1636, 'learning_rate': 2.5127766239196883e-10, 'epoch': 2.0} {'loss': 0.2755, 'learning_rate': 2.489015374851356e-10, 'epoch': 2.0} {'loss': 0.3768, 'learning_rate': 2.465367003945396e-10, 'epoch': 2.0} {'loss': 0.3026, 'learning_rate': 2.441831511246218e-10, 'epoch': 2.0} {'loss': 0.3716, 'learning_rate': 2.4184088967649235e-10, 'epoch': 2.0} {'loss': 0.3691, 'learning_rate': 2.395099160545922e-10, 'epoch': 2.0} {'loss': 0.1907, 'learning_rate': 2.371902302611417e-10, 'epoch': 2.0} {'loss': 0.2931, 'learning_rate': 2.348818322972513e-10, 'epoch': 2.0} {'loss': 0.3024, 'learning_rate': 2.325847221673616e-10, 'epoch': 2.0} {'loss': 0.3259, 'learning_rate': 2.3029889987369325e-10, 'epoch': 2.0} {'loss': 0.2532, 'learning_rate': 2.280243654173564e-10, 'epoch': 2.0} {'loss': 0.2989, 'learning_rate': 2.2576111880279196e-10, 'epoch': 2.0} {'loss': 0.1889, 'learning_rate': 2.2350916003222033e-10, 'epoch': 2.0} {'loss': 0.2765, 'learning_rate': 2.212684891067518e-10, 'epoch': 2.0} {'loss': 0.3542, 'learning_rate': 2.1903910603082723e-10, 'epoch': 2.0} {'loss': 0.2576, 'learning_rate': 2.1682101080555685e-10, 'epoch': 2.0} {'loss': 0.3079, 'learning_rate': 2.146142034342713e-10, 'epoch': 2.0} {'loss': 0.347, 'learning_rate': 2.1241868391808086e-10, 'epoch': 2.0} {'loss': 0.3528, 'learning_rate': 2.1023445226142637e-10, 'epoch': 2.0} {'loss': 0.3191, 'learning_rate': 2.0806150846652828e-10, 'epoch': 2.0} {'loss': 0.3327, 'learning_rate': 2.0589985253449684e-10, 'epoch': 2.0} {'loss': 0.3505, 'learning_rate': 2.037494844675525e-10, 'epoch': 2.0} {'loss': 0.2814, 'learning_rate': 2.016104042701361e-10, 'epoch': 2.0} {'loss': 0.2728, 'learning_rate': 1.9948261194335793e-10, 'epoch': 2.0} {'loss': 0.3503, 'learning_rate': 1.9736610748943842e-10, 'epoch': 2.0} {'loss': 0.3712, 'learning_rate': 1.952608909117082e-10, 'epoch': 2.0} {'loss': 0.3775, 'learning_rate': 1.931669622112775e-10, 'epoch': 2.0} {'loss': 0.2544, 'learning_rate': 1.9108432139258727e-10, 'epoch': 2.0} {'loss': 0.2571, 'learning_rate': 1.8901296845563743e-10, 'epoch': 2.0} {'loss': 0.4318, 'learning_rate': 1.869529034037587e-10, 'epoch': 2.0} {'loss': 0.3584, 'learning_rate': 1.8490412623917154e-10, 'epoch': 2.0} {'loss': 0.2623, 'learning_rate': 1.8286663696409636e-10, 'epoch': 2.0} {'loss': 0.1889, 'learning_rate': 1.808404355818638e-10, 'epoch': 2.0} {'loss': 0.2341, 'learning_rate': 1.7882552209247394e-10, 'epoch': 2.0} {'loss': 0.393, 'learning_rate': 1.7682189650036763e-10, 'epoch': 2.0} {'loss': 0.2424, 'learning_rate': 1.748295588077653e-10, 'epoch': 2.0} {'loss': 0.37, 'learning_rate': 1.7284850901577722e-10, 'epoch': 2.0} {'loss': 0.4154, 'learning_rate': 1.708787471266238e-10, 'epoch': 2.0} {'loss': 0.3636, 'learning_rate': 1.689202731436357e-10, 'epoch': 2.0} {'loss': 0.3074, 'learning_rate': 1.6697308706792313e-10, 'epoch': 2.0} {'loss': 0.1629, 'learning_rate': 1.6503718890281683e-10, 'epoch': 2.0} {'loss': 0.2872, 'learning_rate': 1.63112578649427e-10, 'epoch': 2.0} {'loss': 0.2938, 'learning_rate': 1.6119925630997402e-10, 'epoch': 2.0} {'loss': 0.5316, 'learning_rate': 1.592972218866784e-10, 'epoch': 2.0} {'loss': 0.2684, 'learning_rate': 1.574064753828708e-10, 'epoch': 2.0} {'loss': 0.3926, 'learning_rate': 1.5552701679966141e-10, 'epoch': 2.0} {'loss': 0.4351, 'learning_rate': 1.5365884613927073e-10, 'epoch': 2.0} {'loss': 0.4427, 'learning_rate': 1.5180196340391918e-10, 'epoch': 2.0} {'loss': 0.4511, 'learning_rate': 1.4995636859471695e-10, 'epoch': 2.0} {'loss': 0.3535, 'learning_rate': 1.4812206171499478e-10, 'epoch': 2.0} {'loss': 0.3434, 'learning_rate': 1.4629904276697304e-10, 'epoch': 2.0} {'loss': 0.4322, 'learning_rate': 1.4448731175287223e-10, 'epoch': 2.0} {'loss': 0.3054, 'learning_rate': 1.4268686867269233e-10, 'epoch': 2.0} {'loss': 0.2978, 'learning_rate': 1.4089771353087422e-10, 'epoch': 2.0} {'loss': 0.2944, 'learning_rate': 1.3911984632741792e-10, 'epoch': 2.0} {'loss': 0.2972, 'learning_rate': 1.373532670656541e-10, 'epoch': 2.0} {'loss': 0.2378, 'learning_rate': 1.355979757478032e-10, 'epoch': 2.0} {'loss': 0.2714, 'learning_rate': 1.3385397237497545e-10, 'epoch': 2.0} {'loss': 0.2898, 'learning_rate': 1.3212125694939126e-10, 'epoch': 2.0} {'loss': 0.2241, 'learning_rate': 1.303998294732711e-10, 'epoch': 2.0} {'loss': 0.2136, 'learning_rate': 1.2868968994883545e-10, 'epoch': 2.0} {'loss': 0.2359, 'learning_rate': 1.2699083837608428e-10, 'epoch': 2.0} {'loss': 0.2777, 'learning_rate': 1.2530327475945847e-10, 'epoch': 2.0} {'loss': 0.2969, 'learning_rate': 1.2362699910006825e-10, 'epoch': 2.0} {'loss': 0.1406, 'learning_rate': 1.2196201139902385e-10, 'epoch': 2.0} {'loss': 0.2456, 'learning_rate': 1.2030831165854574e-10, 'epoch': 2.0} {'loss': 0.3538, 'learning_rate': 1.186658998808543e-10, 'epoch': 2.0} {'loss': 0.271, 'learning_rate': 1.1703477606817005e-10, 'epoch': 2.0} {'loss': 0.2878, 'learning_rate': 1.1541494022160316e-10, 'epoch': 2.0} {'loss': 0.392, 'learning_rate': 1.1380639234226387e-10, 'epoch': 2.0} {'loss': 0.2641, 'learning_rate': 1.1220913243348286e-10, 'epoch': 2.0} {'loss': 0.304, 'learning_rate': 1.1062316049637034e-10, 'epoch': 2.0} {'loss': 0.2744, 'learning_rate': 1.0904847653314677e-10, 'epoch': 2.0} {'loss': 0.3329, 'learning_rate': 1.0748508054492235e-10, 'epoch': 2.0} {'loss': 0.2525, 'learning_rate': 1.0593297253391754e-10, 'epoch': 2.0} {'loss': 0.4117, 'learning_rate': 1.0439215250124257e-10, 'epoch': 2.0} {'loss': 0.3204, 'learning_rate': 1.0286262045022811e-10, 'epoch': 2.0} {'loss': 0.2873, 'learning_rate': 1.0134437638087413e-10, 'epoch': 2.0} {'loss': 0.1906, 'learning_rate': 9.983742029540111e-11, 'epoch': 2.0} {'loss': 0.2519, 'learning_rate': 9.834175219602948e-11, 'epoch': 2.0} {'loss': 0.2967, 'learning_rate': 9.685737208386947e-11, 'epoch': 2.0} {'loss': 0.3045, 'learning_rate': 9.53842799600313e-11, 'epoch': 2.0} {'loss': 0.4213, 'learning_rate': 9.392247582784564e-11, 'epoch': 2.0} {'loss': 0.2829, 'learning_rate': 9.247195968731248e-11, 'epoch': 2.0} {'loss': 0.3115, 'learning_rate': 9.103273154176251e-11, 'epoch': 2.0} {'loss': 0.3019, 'learning_rate': 8.960479139119571e-11, 'epoch': 2.0} {'loss': 0.2142, 'learning_rate': 8.818813923894276e-11, 'epoch': 2.0} {'loss': 0.3976, 'learning_rate': 8.678277508389344e-11, 'epoch': 2.0} {'loss': 0.3207, 'learning_rate': 8.538869893048862e-11, 'epoch': 2.0} {'loss': 0.3149, 'learning_rate': 8.400591077872833e-11, 'epoch': 2.0} {'loss': 0.2669, 'learning_rate': 8.2634410630833e-11, 'epoch': 2.0} {'loss': 0.219, 'learning_rate': 8.127419848791285e-11, 'epoch': 2.0} {'loss': 0.3395, 'learning_rate': 7.992527435107811e-11, 'epoch': 2.0} {'loss': 0.2388, 'learning_rate': 7.858763822254922e-11, 'epoch': 2.0} {'loss': 0.1654, 'learning_rate': 7.726129010454664e-11, 'epoch': 2.0} {'loss': 0.2201, 'learning_rate': 7.594622999707035e-11, 'epoch': 2.0} {'loss': 0.2054, 'learning_rate': 7.464245790234082e-11, 'epoch': 2.0} {'loss': 0.2733, 'learning_rate': 7.334997382257847e-11, 'epoch': 2.0} {'loss': 0.2133, 'learning_rate': 7.206877775778331e-11, 'epoch': 2.0} {'loss': 0.3198, 'learning_rate': 7.07988697101758e-11, 'epoch': 2.0} {'loss': 0.2143, 'learning_rate': 6.954024968086615e-11, 'epoch': 2.0} {'loss': 0.3197, 'learning_rate': 6.829291767096457e-11, 'epoch': 2.0} {'loss': 0.2172, 'learning_rate': 6.705687368380176e-11, 'epoch': 2.0} {'loss': 0.3507, 'learning_rate': 6.583211771826747e-11, 'epoch': 2.0} {'loss': 0.2814, 'learning_rate': 6.461864977658216e-11, 'epoch': 2.0} {'loss': 0.3193, 'learning_rate': 6.341646986096628e-11, 'epoch': 2.0} {'loss': 0.4399, 'learning_rate': 6.222557797253004e-11, 'epoch': 2.0} {'loss': 0.2958, 'learning_rate': 6.104597411127345e-11, 'epoch': 2.0} {'loss': 0.2606, 'learning_rate': 5.987765828052716e-11, 'epoch': 2.0} {'loss': 0.4618, 'learning_rate': 5.87206304802912e-11, 'epoch': 2.0} {'loss': 0.3031, 'learning_rate': 5.757489071167577e-11, 'epoch': 2.0} {'loss': 0.3939, 'learning_rate': 5.6440438976901326e-11, 'epoch': 2.0} {'loss': 0.3673, 'learning_rate': 5.5317275277078085e-11, 'epoch': 2.0} {'loss': 0.1931, 'learning_rate': 5.420539961220606e-11, 'epoch': 2.0} {'loss': 0.3414, 'learning_rate': 5.31048119856159e-11, 'epoch': 2.0} {'loss': 0.2992, 'learning_rate': 5.2015512397307623e-11, 'epoch': 2.0} {'loss': 0.2861, 'learning_rate': 5.093750084839144e-11, 'epoch': 2.0} {'loss': 0.4006, 'learning_rate': 4.9870777341087804e-11, 'epoch': 2.0} {'loss': 0.242, 'learning_rate': 4.881534187428649e-11, 'epoch': 2.0} {'loss': 0.3732, 'learning_rate': 4.777119445242839e-11, 'epoch': 2.0} {'loss': 0.255, 'learning_rate': 4.673833507440329e-11, 'epoch': 2.0} {'loss': 0.3496, 'learning_rate': 4.5716763742431613e-11, 'epoch': 2.0} {'loss': 0.3674, 'learning_rate': 4.470648045651338e-11, 'epoch': 2.0} {'loss': 0.3251, 'learning_rate': 4.370748521886903e-11, 'epoch': 2.0} {'loss': 0.2852, 'learning_rate': 4.271977803060878e-11, 'epoch': 2.0} {'loss': 0.2855, 'learning_rate': 4.1743358892842865e-11, 'epoch': 2.0} {'loss': 0.3598, 'learning_rate': 4.077822780557128e-11, 'epoch': 2.0} {'loss': 0.2482, 'learning_rate': 3.982438477101447e-11, 'epoch': 2.0} {'loss': 0.3519, 'learning_rate': 3.8881829789172434e-11, 'epoch': 2.0} {'loss': 0.3109, 'learning_rate': 3.795056286337584e-11, 'epoch': 2.0} {'loss': 0.2536, 'learning_rate': 3.703058399251447e-11, 'epoch': 2.0} {'loss': 0.3657, 'learning_rate': 3.612189317769854e-11, 'epoch': 2.0} {'loss': 0.2332, 'learning_rate': 3.5224490421148504e-11, 'epoch': 2.0} {'loss': 0.2563, 'learning_rate': 3.433837572286436e-11, 'epoch': 2.0} {'loss': 0.3125, 'learning_rate': 3.3463549083956325e-11, 'epoch': 2.0} {'loss': 0.1948, 'learning_rate': 3.260001050664485e-11, 'epoch': 2.0} {'loss': 0.2275, 'learning_rate': 3.1747759989819713e-11, 'epoch': 2.0} {'loss': 0.2865, 'learning_rate': 3.090679753681158e-11, 'epoch': 2.0} {'loss': 0.3147, 'learning_rate': 3.007712314651023e-11, 'epoch': 2.0} {'loss': 0.3159, 'learning_rate': 2.925873682113611e-11, 'epoch': 2.0} {'loss': 0.3474, 'learning_rate': 2.8451638560689222e-11, 'epoch': 2.0} {'loss': 0.3789, 'learning_rate': 2.765582836627978e-11, 'epoch': 2.0} {'loss': 0.3308, 'learning_rate': 2.6871306240128236e-11, 'epoch': 2.0} {'loss': 0.1305, 'learning_rate': 2.6098072181124366e-11, 'epoch': 2.0} {'loss': 0.3489, 'learning_rate': 2.5336126191488618e-11, 'epoch': 2.0} {'loss': 0.3812, 'learning_rate': 2.458546827122099e-11, 'epoch': 2.0} {'loss': 0.3009, 'learning_rate': 2.3846098421431707e-11, 'epoch': 2.0} {'loss': 0.325, 'learning_rate': 2.3118016644341213e-11, 'epoch': 2.0} {'loss': 0.1984, 'learning_rate': 2.2401222938839283e-11, 'epoch': 2.0} {'loss': 0.322, 'learning_rate': 2.1695717306036147e-11, 'epoch': 2.0} {'loss': 0.3486, 'learning_rate': 2.1001499748152243e-11, 'epoch': 2.0} {'loss': 0.2698, 'learning_rate': 2.031857026407735e-11, 'epoch': 2.0} {'loss': 0.3065, 'learning_rate': 1.964692885603192e-11, 'epoch': 2.0} {'loss': 0.3285, 'learning_rate': 1.898657552401595e-11, 'epoch': 2.0} {'loss': 0.3483, 'learning_rate': 1.8337510269139658e-11, 'epoch': 2.0} {'loss': 0.266, 'learning_rate': 1.769973309140305e-11, 'epoch': 2.0} {'loss': 0.2632, 'learning_rate': 1.7073243993026568e-11, 'epoch': 2.0} {'loss': 0.2973, 'learning_rate': 1.645804297289999e-11, 'epoch': 2.0} {'loss': 0.329, 'learning_rate': 1.5854130033243764e-11, 'epoch': 2.0} {'loss': 0.3989, 'learning_rate': 1.5261505174057888e-11, 'epoch': 2.0} {'loss': 0.4016, 'learning_rate': 1.4680168395342364e-11, 'epoch': 2.0} {'loss': 0.3285, 'learning_rate': 1.4110119699317637e-11, 'epoch': 2.0} {'loss': 0.3061, 'learning_rate': 1.3551359084873483e-11, 'epoch': 2.0} {'loss': 0.3104, 'learning_rate': 1.300388655423035e-11, 'epoch': 2.0} {'loss': 0.283, 'learning_rate': 1.2467702107388235e-11, 'epoch': 2.0} {'loss': 0.4376, 'learning_rate': 1.1942805744347142e-11, 'epoch': 2.0} {'loss': 0.314, 'learning_rate': 1.1429197467327513e-11, 'epoch': 2.0} {'loss': 0.442, 'learning_rate': 1.0926877274108904e-11, 'epoch': 2.0} {'loss': 0.4337, 'learning_rate': 1.0435845168021985e-11, 'epoch': 2.0} {'loss': 0.2913, 'learning_rate': 9.956101149066755e-12, 'epoch': 2.0} {'loss': 0.4111, 'learning_rate': 9.48764521613299e-12, 'epoch': 2.0} {'loss': 0.36, 'learning_rate': 9.030477371441138e-12, 'epoch': 2.0} {'loss': 0.3467, 'learning_rate': 8.584597614991197e-12, 'epoch': 2.0} {'loss': 0.3446, 'learning_rate': 8.150005947893392e-12, 'epoch': 2.0} {'loss': 0.3381, 'learning_rate': 7.726702369037497e-12, 'epoch': 2.0} {'loss': 0.2872, 'learning_rate': 7.314686880643962e-12, 'epoch': 2.0} {'loss': 0.2921, 'learning_rate': 6.913959481602561e-12, 'epoch': 2.0} {'loss': 0.2647, 'learning_rate': 6.5245201741337414e-12, 'epoch': 2.0} {'loss': 0.1564, 'learning_rate': 6.14636895712728e-12, 'epoch': 2.0} {'loss': 0.2378, 'learning_rate': 5.779505831693399e-12, 'epoch': 2.0} {'loss': 0.404, 'learning_rate': 5.4239307978321e-12, 'epoch': 2.0} {'loss': 0.336, 'learning_rate': 5.079643856653605e-12, 'epoch': 2.0} {'loss': 0.3273, 'learning_rate': 4.74664500704769e-12, 'epoch': 2.0} {'loss': 0.264, 'learning_rate': 4.424934252345026e-12, 'epoch': 2.0} {'loss': 0.3884, 'learning_rate': 4.114511589214942e-12, 'epoch': 2.0} {'loss': 0.3324, 'learning_rate': 3.815377020988109e-12, 'epoch': 2.0} {'loss': 0.1356, 'learning_rate': 3.527530546554303e-12, 'epoch': 2.0} {'loss': 0.3222, 'learning_rate': 3.2509721670237472e-12, 'epoch': 2.0} {'loss': 0.2522, 'learning_rate': 2.9857018823964414e-12, 'epoch': 2.0} {'loss': 0.3868, 'learning_rate': 2.7317196915621626e-12, 'epoch': 2.0} {'loss': 0.4195, 'learning_rate': 2.489025596741357e-12, 'epoch': 2.0} {'loss': 0.4149, 'learning_rate': 2.2576195979340243e-12, 'epoch': 2.0} {'loss': 0.2733, 'learning_rate': 2.0375016940299418e-12, 'epoch': 2.0} {'loss': 0.4191, 'learning_rate': 1.8286718872495557e-12, 'epoch': 2.0} {'loss': 0.3411, 'learning_rate': 1.6311301764826425e-12, 'epoch': 2.0} {'loss': 0.234, 'learning_rate': 1.4448765617292026e-12, 'epoch': 2.0} {'loss': 0.3135, 'learning_rate': 1.269911045209682e-12, 'epoch': 2.0} {'loss': 0.4166, 'learning_rate': 1.1062336247036342e-12, 'epoch': 2.0} {'loss': 0.1873, 'learning_rate': 9.538443013212829e-13, 'epoch': 2.0} {'loss': 0.2138, 'learning_rate': 8.127430750626275e-13, 'epoch': 2.0} {'loss': 0.2634, 'learning_rate': 6.829299459276683e-13, 'epoch': 2.0} {'loss': 0.2412, 'learning_rate': 5.644049150266284e-13, 'epoch': 2.0} {'loss': 0.3037, 'learning_rate': 4.571679823595077e-13, 'epoch': 2.0} {'loss': 0.1874, 'learning_rate': 3.6121914681608303e-13, 'epoch': 2.0} {'loss': 0.2803, 'learning_rate': 2.7655840950657763e-13, 'epoch': 2.0} {'loss': 0.3892, 'learning_rate': 2.0318577043099142e-13, 'epoch': 2.0} {'loss': 0.1936, 'learning_rate': 1.4110122958932438e-13, 'epoch': 2.0} {'loss': 0.3091, 'learning_rate': 9.030478698157652e-14, 'epoch': 2.0} {'loss': 0.2654, 'learning_rate': 5.0796442607747856e-14, 'epoch': 2.0} {'loss': 0.3721, 'learning_rate': 2.2576196467838375e-14, 'epoch': 2.0} {'loss': 0.295, 'learning_rate': 5.644049672071106e-15, 'epoch': 2.0} {'loss': 0.2949, 'learning_rate': 0.0, 'epoch': 2.0} {'train_runtime': 152453.5324, 'train_samples_per_second': 10.128, 'train_steps_per_second': 0.633, 'train_loss': 0.4409202744456005, 'epoch': 2.0}