The following values were not passed to `accelerate launch` and had defaults used instead:
	`--num_processes` was set to a value of `4`
		More than one GPU was found, enabling multi-GPU training.
		If this was unintended please pass in `--num_processes=1`.
	`--num_machines` was set to a value of `1`
	`--mixed_precision` was set to a value of `'no'`
	`--dynamo_backend` was set to a value of `'no'`
To avoid this warning pass in values for each of the problematic parameters or run `accelerate config`.
Params using prompt template alpaca:
base_model: baichuan-inc/Baichuan2-7B-Base
data_path: ../../data/belle_dolphine/p13.jsonl
output_dir: ../out/lora/p13
batch_size: 32
micro_batch_size: 2
num_epochs: 1
learning_rate: 0.0004
cutoff_len: 4096
val_set_size: 0
lr_scheduler: cosine
warmup_steps: 100
lora_r: 16
lora_alpha: 16
lora_dropout: 0.05
lora_target_modules: ['gate_proj', 'down_proj', 'up_proj']
train_on_inputs: False
add_eos_token: False
group_by_length: False
wandb_project: lora-moe
wandb_run_name: belle_dolphine-p13
wandb_watch: 
wandb_log_model: 
resume_from_checkpoint: False

gradient_accumulation_steps:  4
gradient_accumulation_steps:  4
gradient_accumulation_steps:  4
gradient_accumulation_steps:  4
Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:  50%|█████     | 1/2 [00:11<00:11, 11.45s/it]Loading checkpoint shards:  50%|█████     | 1/2 [00:11<00:11, 11.49s/it]Loading checkpoint shards:  50%|█████     | 1/2 [00:12<00:12, 12.23s/it]Loading checkpoint shards:  50%|█████     | 1/2 [00:12<00:12, 12.25s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:16<00:00,  7.93s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:16<00:00,  8.46s/it]
Loading checkpoint shards: 100%|██████████| 2/2 [00:17<00:00,  8.02s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:17<00:00,  8.54s/it]
Loading checkpoint shards: 100%|██████████| 2/2 [00:17<00:00,  8.23s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:17<00:00,  8.83s/it]
pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
Loading checkpoint shards: 100%|██████████| 2/2 [00:18<00:00,  8.45s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:18<00:00,  9.02s/it]
pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183

Map:   0%|          | 0/110379 [00:00<?, ? examples/s]Map:   0%|          | 0/110379 [00:00<?, ? examples/s]Map:   0%|          | 55/110379 [00:00<03:24, 538.87 examples/s]Map:   0%|          | 46/110379 [00:00<04:07, 445.62 examples/s]Map:   0%|          | 125/110379 [00:00<02:56, 625.02 examples/s]Map:   0%|          | 98/110379 [00:00<03:51, 476.62 examples/s]Map:   0%|          | 189/110379 [00:00<02:55, 627.85 examples/s]Map:   0%|          | 154/110379 [00:00<03:40, 500.36 examples/s]Map:   0%|          | 256/110379 [00:00<02:53, 636.27 examples/s]Map:   0%|          | 207/110379 [00:00<03:35, 510.87 examples/s]Map:   0%|          | 325/110379 [00:00<02:49, 649.65 examples/s]Map:   0%|          | 281/110379 [00:00<03:06, 588.94 examples/s]Map:   0%|          | 357/110379 [00:00<02:51, 643.17 examples/s]trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183
Map:   0%|          | 416/110379 [00:00<02:55, 627.00 examples/s]Map:   0%|          | 437/110379 [00:00<02:39, 689.88 examples/s]Map:   0%|          | 0/110379 [00:00<?, ? examples/s]Map:   0%|          | 491/110379 [00:00<02:46, 661.26 examples/s]trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183
Map:   0%|          | 507/110379 [00:00<02:39, 688.78 examples/s]Map:   0%|          | 50/110379 [00:00<03:46, 487.36 examples/s]Map:   0%|          | 0/110379 [00:00<?, ? examples/s]Map:   1%|          | 586/110379 [00:00<02:50, 645.45 examples/s]Map:   1%|          | 577/110379 [00:00<02:39, 689.44 examples/s]Map:   0%|          | 99/110379 [00:00<03:50, 478.24 examples/s]Map:   0%|          | 70/110379 [00:00<02:41, 684.16 examples/s]Map:   1%|          | 656/110379 [00:01<02:33, 716.14 examples/s]Map:   0%|          | 172/110379 [00:00<03:08, 583.30 examples/s]Map:   0%|          | 147/110379 [00:00<02:30, 731.73 examples/s]Map:   1%|          | 689/110379 [00:01<02:48, 652.77 examples/s]Map:   0%|          | 244/110379 [00:00<02:53, 635.72 examples/s]Map:   1%|          | 764/110379 [00:01<02:42, 675.77 examples/s]Map:   1%|          | 761/110379 [00:01<02:35, 703.70 examples/s]Map:   0%|          | 250/110379 [00:00<02:36, 701.79 examples/s]Map:   0%|          | 313/110379 [00:00<02:49, 649.27 examples/s]Map:   1%|          | 839/110379 [00:01<02:37, 693.86 examples/s]Map:   0%|          | 334/110379 [00:00<02:27, 746.59 examples/s]Map:   1%|          | 860/110379 [00:01<02:40, 683.28 examples/s]Map:   0%|          | 385/110379 [00:00<02:44, 668.61 examples/s]Map:   1%|          | 912/110379 [00:01<02:35, 701.76 examples/s]Map:   0%|          | 413/110379 [00:00<02:25, 756.85 examples/s]Map:   1%|          | 934/110379 [00:01<02:37, 696.60 examples/s]Map:   0%|          | 476/110379 [00:00<02:51, 639.14 examples/s]Map:   0%|          | 493/110379 [00:00<02:22, 768.62 examples/s]Map:   1%|          | 577/110379 [00:00<02:19, 786.65 examples/s]Map:   1%|          | 1000/110379 [00:01<03:25, 531.20 examples/s]Map:   1%|          | 565/110379 [00:00<02:57, 617.84 examples/s]Map:   1%|          | 1036/110379 [00:01<03:17, 554.03 examples/s]Map:   1%|          | 1074/110379 [00:01<03:10, 574.58 examples/s]Map:   1%|          | 695/110379 [00:00<02:20, 781.79 examples/s]Map:   1%|          | 638/110379 [00:01<02:50, 642.81 examples/s]Map:   1%|          | 1110/110379 [00:01<03:05, 589.92 examples/s]Map:   1%|          | 1149/110379 [00:01<02:57, 613.98 examples/s]Map:   1%|          | 779/110379 [00:01<02:17, 794.29 examples/s]Map:   1%|          | 713/110379 [00:01<02:44, 667.58 examples/s]Map:   1%|          | 1182/110379 [00:01<02:56, 619.17 examples/s]Map:   1%|          | 1224/110379 [00:01<02:49, 645.77 examples/s]Map:   1%|          | 785/110379 [00:01<02:41, 680.49 examples/s]Map:   1%|          | 1258/110379 [00:01<02:47, 651.61 examples/s]Map:   1%|          | 897/110379 [00:01<02:19, 782.17 examples/s]Map:   1%|          | 1296/110379 [00:02<02:44, 663.83 examples/s]Map:   1%|          | 858/110379 [00:01<02:38, 690.54 examples/s]Map:   1%|          | 1342/110379 [00:02<02:36, 696.59 examples/s]Map:   1%|          | 977/110379 [00:01<02:19, 783.52 examples/s]Map:   1%|          | 1372/110379 [00:02<02:38, 688.95 examples/s]Map:   1%|          | 933/110379 [00:01<02:35, 704.69 examples/s]Map:   1%|▏         | 1421/110379 [00:02<02:31, 719.30 examples/s]Map:   1%|▏         | 1447/110379 [00:02<02:35, 701.93 examples/s]Map:   1%|▏         | 1498/110379 [00:02<02:29, 729.33 examples/s]Map:   1%|▏         | 1528/110379 [00:02<02:29, 729.73 examples/s]Map:   1%|          | 1079/110379 [00:01<02:58, 613.32 examples/s]Map:   1%|          | 1036/110379 [00:01<03:17, 554.75 examples/s]Map:   1%|▏         | 1609/110379 [00:02<02:25, 747.22 examples/s]Map:   1%|          | 1159/110379 [00:01<02:47, 650.35 examples/s]Map:   1%|▏         | 1607/110379 [00:02<02:30, 721.82 examples/s]Map:   1%|          | 1117/110379 [00:01<02:59, 610.10 examples/s]Map:   2%|▏         | 1690/110379 [00:02<02:22, 762.19 examples/s]Map:   1%|          | 1236/110379 [00:01<02:40, 678.00 examples/s]Map:   2%|▏         | 1683/110379 [00:02<02:28, 730.37 examples/s]Map:   1%|          | 1197/110379 [00:01<02:47, 653.39 examples/s]Map:   1%|          | 1320/110379 [00:01<02:32, 716.74 examples/s]Map:   2%|▏         | 1804/110379 [00:02<02:23, 756.71 examples/s]Map:   2%|▏         | 1789/110379 [00:02<02:31, 717.29 examples/s]Map:   1%|          | 1274/110379 [00:01<02:40, 680.21 examples/s]Map:   1%|▏         | 1403/110379 [00:01<02:26, 743.52 examples/s]Map:   2%|▏         | 1884/110379 [00:02<02:21, 764.14 examples/s]Map:   2%|▏         | 1863/110379 [00:02<02:30, 721.06 examples/s]Map:   1%|          | 1353/110379 [00:02<02:34, 706.59 examples/s]Map:   1%|▏         | 1484/110379 [00:02<02:23, 758.29 examples/s]Map:   2%|▏         | 1968/110379 [00:02<02:18, 782.11 examples/s]Map:   2%|▏         | 1945/110379 [00:02<02:25, 744.14 examples/s]Map:   1%|▏         | 1430/110379 [00:02<02:31, 720.67 examples/s]Map:   1%|▏         | 1583/110379 [00:02<02:31, 719.00 examples/s]Map:   1%|▏         | 1510/110379 [00:02<02:27, 739.91 examples/s]Map:   1%|▏         | 1586/110379 [00:02<02:26, 745.16 examples/s]Map:   2%|▏         | 2079/110379 [00:03<02:56, 612.25 examples/s]Map:   2%|▏         | 2040/110379 [00:03<03:09, 571.71 examples/s]Map:   2%|▏         | 1693/110379 [00:02<02:30, 722.24 examples/s]Map:   2%|▏         | 1662/110379 [00:02<02:25, 747.38 examples/s]Map:   2%|▏         | 2156/110379 [00:03<02:47, 644.42 examples/s]Map:   2%|▏         | 2117/110379 [00:03<02:56, 613.14 examples/s]Map:   2%|▏         | 1800/110379 [00:02<02:31, 715.86 examples/s]Map:   2%|▏         | 2196/110379 [00:03<02:45, 652.02 examples/s]Map:   2%|▏         | 1772/110379 [00:02<02:27, 734.81 examples/s]Map:   2%|▏         | 2258/110379 [00:03<02:45, 651.36 examples/s]Map:   2%|▏         | 1907/110379 [00:02<02:32, 713.13 examples/s]Map:   2%|▏         | 2340/110379 [00:03<02:36, 689.24 examples/s]Map:   2%|▏         | 2296/110379 [00:03<02:46, 648.39 examples/s]Map:   2%|▏         | 1878/110379 [00:02<02:30, 719.33 examples/s]Map:   2%|▏         | 1985/110379 [00:02<02:29, 727.40 examples/s]Map:   2%|▏         | 2366/110379 [00:03<02:44, 656.53 examples/s]Map:   2%|▏         | 1957/110379 [00:02<02:27, 734.71 examples/s]Map:   2%|▏         | 2454/110379 [00:03<02:32, 707.22 examples/s]Map:   2%|▏         | 2435/110379 [00:03<02:43, 661.91 examples/s]Map:   2%|▏         | 2531/110379 [00:03<02:29, 720.90 examples/s]Map:   2%|▏         | 2077/110379 [00:02<03:10, 568.63 examples/s]Map:   2%|▏         | 2510/110379 [00:03<02:37, 684.46 examples/s]Map:   2%|▏         | 2615/110379 [00:03<02:23, 748.48 examples/s]Map:   2%|▏         | 2039/110379 [00:03<03:12, 562.50 examples/s]Map:   2%|▏         | 2150/110379 [00:03<03:00, 599.08 examples/s]Map:   2%|▏         | 2583/110379 [00:03<02:35, 692.67 examples/s]Map:   2%|▏         | 2697/110379 [00:03<02:20, 765.63 examples/s]Map:   2%|▏         | 2118/110379 [00:03<02:57, 610.11 examples/s]Map:   2%|▏         | 2226/110379 [00:03<02:51, 632.28 examples/s]Map:   2%|▏         | 2657/110379 [00:04<02:32, 704.83 examples/s]Map:   2%|▏         | 2194/110379 [00:03<02:47, 644.74 examples/s]Map:   3%|▎         | 2814/110379 [00:04<02:20, 767.41 examples/s]Map:   2%|▏         | 2734/110379 [00:04<02:29, 718.19 examples/s]Map:   2%|▏         | 2280/110379 [00:03<02:35, 695.08 examples/s]Map:   2%|▏         | 2327/110379 [00:03<02:48, 642.32 examples/s]Map:   3%|▎         | 2893/110379 [00:04<02:19, 769.50 examples/s]Map:   2%|▏         | 2371/110379 [00:03<02:24, 745.11 examples/s]Map:   2%|▏         | 2397/110379 [00:03<02:45, 652.59 examples/s]Map:   3%|▎         | 2842/110379 [00:04<02:30, 714.67 examples/s]Map:   2%|▏         | 2455/110379 [00:03<02:20, 767.84 examples/s]Map:   2%|▏         | 2475/110379 [00:03<02:37, 683.14 examples/s]Map:   3%|▎         | 2954/110379 [00:04<02:29, 718.99 examples/s]Map:   3%|▎         | 3000/110379 [00:04<02:59, 598.27 examples/s]Map:   2%|▏         | 2554/110379 [00:03<02:32, 707.32 examples/s]Map:   2%|▏         | 2568/110379 [00:03<02:22, 758.48 examples/s]Map:   3%|▎         | 3080/110379 [00:04<02:47, 639.18 examples/s]Map:   2%|▏         | 2638/110379 [00:03<02:25, 742.74 examples/s]Map:   3%|▎         | 3160/110379 [00:04<02:39, 672.78 examples/s]Map:   3%|▎         | 3031/110379 [00:04<03:17, 543.18 examples/s]Map:   2%|▏         | 2676/110379 [00:03<02:24, 744.28 examples/s]Map:   2%|▏         | 2715/110379 [00:03<02:24, 746.99 examples/s]Map:   3%|▎         | 3100/110379 [00:04<03:07, 572.18 examples/s]Map:   3%|▎         | 3261/110379 [00:04<02:39, 669.93 examples/s]Map:   3%|▎         | 2818/110379 [00:03<02:28, 723.21 examples/s]Map:   3%|▎         | 2791/110379 [00:04<02:24, 745.27 examples/s]Map:   3%|▎         | 3173/110379 [00:04<02:56, 607.57 examples/s]Map:   3%|▎         | 2893/110379 [00:04<02:27, 728.38 examples/s]Map:   3%|▎         | 2872/110379 [00:04<02:21, 758.29 examples/s]Map:   3%|▎         | 3368/110379 [00:04<02:36, 682.28 examples/s]Map:   3%|▎         | 3241/110379 [00:04<02:51, 623.77 examples/s]Map:   3%|▎         | 3446/110379 [00:05<02:32, 701.79 examples/s]Map:   3%|▎         | 3313/110379 [00:05<02:45, 647.22 examples/s]Map:   3%|▎         | 2988/110379 [00:04<02:21, 758.42 examples/s]Map:   3%|▎         | 3524/110379 [00:05<02:28, 719.76 examples/s]Map:   3%|▎         | 3388/110379 [00:05<02:39, 672.83 examples/s]Map:   3%|▎         | 3000/110379 [00:04<03:12, 556.45 examples/s]Map:   3%|▎         | 3603/110379 [00:05<02:25, 735.86 examples/s]Map:   3%|▎         | 3462/110379 [00:05<02:35, 687.17 examples/s]Map:   3%|▎         | 3069/110379 [00:04<03:03, 583.37 examples/s]Map:   3%|▎         | 3077/110379 [00:04<02:59, 597.33 examples/s]Map:   3%|▎         | 3686/110379 [00:05<02:20, 759.08 examples/s]Map:   3%|▎         | 3534/110379 [00:05<02:34, 691.52 examples/s]Map:   3%|▎         | 3142/110379 [00:04<02:54, 614.39 examples/s]Map:   3%|▎         | 3162/110379 [00:04<02:45, 647.43 examples/s]Map:   3%|▎         | 3770/110379 [00:05<02:16, 778.56 examples/s]Map:   3%|▎         | 3607/110379 [00:05<02:32, 701.18 examples/s]Map:   3%|▎         | 3213/110379 [00:04<02:48, 635.43 examples/s]Map:   3%|▎         | 3238/110379 [00:04<02:39, 671.24 examples/s]Map:   3%|▎         | 3851/110379 [00:05<02:15, 785.53 examples/s]Map:   3%|▎         | 3681/110379 [00:05<02:30, 708.56 examples/s]Map:   3%|▎         | 3319/110379 [00:04<02:32, 703.81 examples/s]Map:   3%|▎         | 3315/110379 [00:04<02:45, 648.48 examples/s]Map:   3%|▎         | 3397/110379 [00:04<02:28, 721.87 examples/s]Map:   4%|▎         | 3964/110379 [00:05<02:18, 769.30 examples/s]Map:   3%|▎         | 3784/110379 [00:05<02:33, 695.61 examples/s]Map:   3%|▎         | 3385/110379 [00:04<02:42, 656.49 examples/s]Map:   3%|▎         | 3482/110379 [00:05<02:21, 755.04 examples/s]Map:   3%|▎         | 3861/110379 [00:05<02:30, 707.03 examples/s]Map:   3%|▎         | 3458/110379 [00:05<02:38, 672.86 examples/s]Map:   3%|▎         | 3587/110379 [00:05<02:26, 728.15 examples/s]Map:   4%|▎         | 3968/110379 [00:05<02:30, 706.00 examples/s]Map:   4%|▎         | 4070/110379 [00:06<03:02, 581.15 examples/s]Map:   3%|▎         | 3557/110379 [00:05<02:40, 665.19 examples/s]Map:   4%|▍         | 4152/110379 [00:06<02:48, 629.30 examples/s]Map:   3%|▎         | 3633/110379 [00:05<02:34, 689.08 examples/s]Map:   3%|▎         | 3700/110379 [00:05<02:25, 734.15 examples/s]Map:   4%|▍         | 4227/110379 [00:06<02:41, 655.85 examples/s]Map:   3%|▎         | 3714/110379 [00:05<02:29, 713.52 examples/s]Map:   3%|▎         | 3782/110379 [00:05<02:21, 753.46 examples/s]Map:   4%|▎         | 4069/110379 [00:06<03:11, 555.21 examples/s]Map:   4%|▍         | 4303/110379 [00:06<02:35, 680.17 examples/s]Map:   3%|▎         | 3793/110379 [00:05<02:27, 722.26 examples/s]Map:   3%|▎         | 3862/110379 [00:05<02:19, 764.23 examples/s]Map:   4%|▍         | 4151/110379 [00:06<02:54, 608.28 examples/s]Map:   4%|▍         | 4382/110379 [00:06<02:30, 705.98 examples/s]Map:   4%|▎         | 3870/110379 [00:05<02:25, 734.52 examples/s]Map:   4%|▎         | 3941/110379 [00:05<02:18, 767.54 examples/s]Map:   4%|▍         | 4230/110379 [00:06<02:43, 647.46 examples/s]Map:   4%|▍         | 4458/110379 [00:06<02:27, 717.28 examples/s]Map:   4%|▎         | 3947/110379 [00:05<02:23, 742.65 examples/s]Map:   4%|▍         | 4306/110379 [00:06<02:37, 672.46 examples/s]Map:   4%|▍         | 4533/110379 [00:06<02:26, 721.69 examples/s]Map:   4%|▍         | 4387/110379 [00:06<02:29, 707.18 examples/s]Map:   4%|▎         | 4035/110379 [00:05<03:02, 581.83 examples/s]Map:   4%|▍         | 4611/110379 [00:06<02:23, 734.99 examples/s]Map:   4%|▍         | 4469/110379 [00:06<02:24, 733.25 examples/s]Map:   4%|▎         | 4034/110379 [00:05<03:11, 556.38 examples/s]Map:   4%|▎         | 4116/110379 [00:06<02:48, 630.00 examples/s]Map:   4%|▍         | 4686/110379 [00:06<02:23, 734.62 examples/s]Map:   4%|▍         | 4547/110379 [00:06<02:22, 744.51 examples/s]Map:   4%|▎         | 4111/110379 [00:06<02:57, 599.59 examples/s]Map:   4%|▍         | 4193/110379 [00:06<02:40, 661.03 examples/s]Map:   4%|▍         | 4626/110379 [00:06<02:20, 754.75 examples/s]Map:   4%|▍         | 4794/110379 [00:06<02:25, 724.57 examples/s]Map:   4%|▍         | 4189/110379 [00:06<02:45, 640.77 examples/s]Map:   4%|▍         | 4276/110379 [00:06<02:31, 701.94 examples/s]Map:   4%|▍         | 4706/110379 [00:07<02:18, 765.03 examples/s]Map:   4%|▍         | 4872/110379 [00:07<02:23, 736.13 examples/s]Map:   4%|▍         | 4262/110379 [00:06<02:40, 662.45 examples/s]Map:   4%|▍         | 4356/110379 [00:06<02:26, 724.73 examples/s]Map:   4%|▍         | 4949/110379 [00:07<02:21, 742.78 examples/s]Map:   4%|▍         | 4333/110379 [00:06<02:37, 672.99 examples/s]Map:   4%|▍         | 4812/110379 [00:07<02:23, 738.09 examples/s]Map:   4%|▍         | 4465/110379 [00:06<02:27, 718.82 examples/s]Map:   4%|▍         | 4435/110379 [00:06<02:37, 671.84 examples/s]Map:   4%|▍         | 4924/110379 [00:07<02:22, 737.66 examples/s]Map:   4%|▍         | 4574/110379 [00:06<02:26, 719.96 examples/s]Map:   5%|▍         | 5040/110379 [00:07<03:09, 555.61 examples/s]Map:   4%|▍         | 4513/110379 [00:06<02:32, 692.66 examples/s]Map:   4%|▍         | 4652/110379 [00:06<02:24, 731.91 examples/s]Map:   5%|▍         | 5111/110379 [00:07<02:59, 587.02 examples/s]Map:   4%|▍         | 4622/110379 [00:06<02:30, 702.06 examples/s]Map:   5%|▍         | 5000/110379 [00:07<03:02, 578.28 examples/s]Map:   4%|▍         | 4729/110379 [00:06<02:22, 738.85 examples/s]Map:   5%|▍         | 5187/110379 [00:07<02:48, 626.11 examples/s]Map:   4%|▍         | 4694/110379 [00:06<02:29, 704.84 examples/s]Map:   5%|▍         | 5079/110379 [00:07<02:49, 622.05 examples/s]Map:   4%|▍         | 4807/110379 [00:06<02:20, 748.90 examples/s]Map:   5%|▍         | 5266/110379 [00:07<02:38, 665.08 examples/s]Map:   4%|▍         | 4774/110379 [00:06<02:25, 726.63 examples/s]Map:   5%|▍         | 5166/110379 [00:07<02:36, 672.49 examples/s]Map:   4%|▍         | 4884/110379 [00:07<02:22, 742.76 examples/s]Map:   5%|▍         | 5347/110379 [00:07<02:30, 700.05 examples/s]Map:   4%|▍         | 4853/110379 [00:07<02:22, 739.84 examples/s]Map:   5%|▍         | 5239/110379 [00:07<02:33, 685.21 examples/s]Map:   4%|▍         | 4961/110379 [00:07<02:21, 745.65 examples/s]Map:   5%|▍         | 5428/110379 [00:07<02:24, 727.08 examples/s]Map:   5%|▍         | 5312/110379 [00:07<02:31, 693.16 examples/s]Map:   5%|▍         | 5506/110379 [00:08<02:22, 737.02 examples/s]Map:   4%|▍         | 4959/110379 [00:07<02:26, 720.80 examples/s]Map:   5%|▍         | 5388/110379 [00:08<02:27, 709.79 examples/s]Map:   5%|▌         | 5586/110379 [00:08<02:19, 750.47 examples/s]Map:   5%|▍         | 5075/110379 [00:07<03:02, 578.30 examples/s]Map:   5%|▍         | 5465/110379 [00:08<02:24, 724.82 examples/s]Map:   5%|▌         | 5663/110379 [00:08<02:18, 754.95 examples/s]Map:   5%|▍         | 5160/110379 [00:07<02:45, 634.83 examples/s]Map:   5%|▍         | 5038/110379 [00:07<03:11, 550.82 examples/s]Map:   5%|▌         | 5544/110379 [00:08<02:21, 740.96 examples/s]Map:   5%|▍         | 5238/110379 [00:07<02:37, 665.77 examples/s]Map:   5%|▍         | 5118/110379 [00:07<02:54, 601.74 examples/s]Map:   5%|▌         | 5779/110379 [00:08<02:18, 757.32 examples/s]Map:   5%|▌         | 5621/110379 [00:08<02:20, 748.11 examples/s]Map:   5%|▍         | 5318/110379 [00:07<02:30, 697.24 examples/s]Map:   5%|▍         | 5195/110379 [00:07<02:45, 637.15 examples/s]Map:   5%|▌         | 5861/110379 [00:08<02:15, 770.55 examples/s]Map:   5%|▌         | 5730/110379 [00:08<02:22, 736.89 examples/s]Map:   5%|▍         | 5426/110379 [00:07<02:29, 702.14 examples/s]Map:   5%|▍         | 5297/110379 [00:07<02:41, 648.67 examples/s]Map:   5%|▌         | 5971/110379 [00:08<02:18, 753.82 examples/s]Map:   5%|▌         | 5844/110379 [00:08<02:21, 739.23 examples/s]Map:   5%|▍         | 5501/110379 [00:07<02:27, 710.96 examples/s]Map:   5%|▍         | 5376/110379 [00:07<02:34, 678.99 examples/s]Map:   5%|▌         | 5923/110379 [00:08<02:19, 749.52 examples/s]Map:   5%|▌         | 5578/110379 [00:08<02:24, 722.92 examples/s]Map:   5%|▍         | 5452/110379 [00:07<02:30, 695.54 examples/s]Map:   6%|▌         | 6085/110379 [00:08<02:52, 604.97 examples/s]Map:   5%|▌         | 5658/110379 [00:08<02:21, 742.21 examples/s]Map:   5%|▌         | 5532/110379 [00:08<02:25, 721.14 examples/s]Map:   6%|▌         | 6171/110379 [00:09<02:39, 653.92 examples/s]Map:   5%|▌         | 5734/110379 [00:08<02:20, 745.67 examples/s]Map:   5%|▌         | 5607/110379 [00:08<02:24, 726.69 examples/s]Map:   5%|▌         | 6000/110379 [00:09<03:09, 552.03 examples/s]Map:   6%|▌         | 6243/110379 [00:09<02:35, 668.53 examples/s]Map:   5%|▌         | 5814/110379 [00:08<02:17, 760.56 examples/s]Map:   5%|▌         | 5684/110379 [00:08<02:21, 737.48 examples/s]Map:   6%|▌         | 6077/110379 [00:09<02:55, 593.19 examples/s]Map:   6%|▌         | 6321/110379 [00:09<02:30, 692.83 examples/s]Map:   5%|▌         | 5900/110379 [00:08<02:12, 785.82 examples/s]Map:   5%|▌         | 5760/110379 [00:08<02:21, 740.01 examples/s]Map:   6%|▌         | 6153/110379 [00:09<02:45, 631.21 examples/s]Map:   6%|▌         | 6397/110379 [00:09<02:26, 708.49 examples/s]Map:   5%|▌         | 5839/110379 [00:08<02:19, 750.70 examples/s]Map:   6%|▌         | 6228/110379 [00:09<02:38, 658.20 examples/s]Map:   6%|▌         | 6481/110379 [00:09<02:20, 740.43 examples/s]Map:   5%|▌         | 5918/110379 [00:08<02:17, 758.46 examples/s]Map:   6%|▌         | 6310/110379 [00:09<02:29, 698.33 examples/s]Map:   5%|▌         | 6000/110379 [00:08<02:59, 582.88 examples/s]Map:   6%|▌         | 6559/110379 [00:09<02:18, 750.37 examples/s]Map:   6%|▌         | 6386/110379 [00:09<02:25, 712.61 examples/s]Map:   6%|▌         | 6085/110379 [00:08<02:42, 641.84 examples/s]Map:   6%|▌         | 6637/110379 [00:09<02:16, 758.22 examples/s]Map:   6%|▌         | 6463/110379 [00:09<02:23, 725.89 examples/s]Map:   5%|▌         | 6000/110379 [00:08<03:07, 556.90 examples/s]Map:   6%|▌         | 6159/110379 [00:08<02:37, 662.34 examples/s]Map:   6%|▌         | 6718/110379 [00:09<02:14, 769.59 examples/s]Map:   6%|▌         | 6073/110379 [00:08<02:57, 589.04 examples/s]Map:   6%|▌         | 6237/110379 [00:09<02:30, 690.89 examples/s]Map:   6%|▌         | 6567/110379 [00:09<02:26, 708.79 examples/s]Map:   6%|▌         | 6829/110379 [00:09<02:16, 756.45 examples/s]Map:   6%|▌         | 6147/110379 [00:09<02:47, 622.49 examples/s]Map:   6%|▌         | 6344/110379 [00:09<02:29, 696.04 examples/s]Map:   6%|▌         | 6663/110379 [00:09<02:32, 681.26 examples/s]Map:   6%|▌         | 6220/110379 [00:09<02:41, 645.76 examples/s]Map:   6%|▋         | 6933/110379 [00:10<02:22, 726.82 examples/s]Map:   6%|▌         | 6424/110379 [00:09<02:24, 719.27 examples/s]Map:   6%|▌         | 6738/110379 [00:10<02:29, 694.34 examples/s]Map:   6%|▌         | 6298/110379 [00:09<02:33, 679.28 examples/s]Map:   6%|▌         | 6501/110379 [00:09<02:21, 731.65 examples/s]Map:   6%|▌         | 6814/110379 [00:10<02:26, 707.18 examples/s]Map:   6%|▌         | 6373/110379 [00:09<02:28, 698.12 examples/s]Map:   6%|▋         | 7040/110379 [00:10<02:54, 591.18 examples/s]Map:   6%|▌         | 6446/110379 [00:09<02:27, 704.08 examples/s]Map:   6%|▌         | 6618/110379 [00:09<02:20, 740.33 examples/s]Map:   6%|▋         | 6914/110379 [00:10<02:30, 687.83 examples/s]Map:   6%|▋         | 7119/110379 [00:10<02:43, 630.99 examples/s]Map:   6%|▌         | 6525/110379 [00:09<02:23, 722.88 examples/s]Map:   6%|▌         | 6699/110379 [00:09<02:17, 755.95 examples/s]Map:   6%|▋         | 6984/110379 [00:10<02:29, 689.59 examples/s]Map:   7%|▋         | 7200/110379 [00:10<02:34, 668.24 examples/s]Map:   6%|▌         | 6600/110379 [00:09<02:22, 726.91 examples/s]Map:   6%|▌         | 6776/110379 [00:09<02:16, 758.03 examples/s]Map:   7%|▋         | 7280/110379 [00:10<02:27, 699.66 examples/s]Map:   6%|▌         | 6677/110379 [00:09<02:20, 737.31 examples/s]Map:   6%|▌         | 6855/110379 [00:09<02:15, 765.90 examples/s]Map:   7%|▋         | 7360/110379 [00:10<02:22, 723.99 examples/s]Map:   6%|▋         | 7075/110379 [00:10<03:14, 530.90 examples/s]Map:   6%|▌         | 6754/110379 [00:09<02:20, 736.18 examples/s]Map:   6%|▋         | 6933/110379 [00:09<02:15, 765.08 examples/s]Map:   7%|▋         | 7440/110379 [00:10<02:19, 740.09 examples/s]Map:   6%|▋         | 7153/110379 [00:10<02:57, 582.50 examples/s]Map:   6%|▌         | 6838/110379 [00:09<02:15, 762.27 examples/s]Map:   7%|▋         | 7518/110379 [00:10<02:17, 748.30 examples/s]Map:   7%|▋         | 7226/110379 [00:10<02:48, 613.17 examples/s]Map:   6%|▋         | 6918/110379 [00:10<02:14, 766.73 examples/s]Map:   6%|▋         | 7037/110379 [00:10<02:57, 582.94 examples/s]Map:   7%|▋         | 7599/110379 [00:10<02:14, 763.33 examples/s]Map:   7%|▋         | 7307/110379 [00:10<02:36, 658.71 examples/s]Map:   6%|▋         | 6997/110379 [00:10<02:14, 769.14 examples/s]Map:   6%|▋         | 7122/110379 [00:10<02:41, 638.64 examples/s]Map:   7%|▋         | 7677/110379 [00:11<02:14, 765.02 examples/s]Map:   7%|▋         | 7381/110379 [00:11<02:32, 676.60 examples/s]Map:   7%|▋         | 7758/110379 [00:11<02:12, 775.97 examples/s]Map:   7%|▋         | 7231/110379 [00:10<02:35, 665.43 examples/s]Map:   7%|▋         | 7474/110379 [00:11<02:38, 648.07 examples/s]Map:   6%|▋         | 7110/110379 [00:10<02:58, 578.00 examples/s]Map:   7%|▋         | 7315/110379 [00:10<02:26, 704.30 examples/s]Map:   7%|▋         | 7874/110379 [00:11<02:13, 768.81 examples/s]Map:   7%|▋         | 7549/110379 [00:11<02:33, 668.02 examples/s]Map:   7%|▋         | 7188/110379 [00:10<02:46, 618.59 examples/s]Map:   7%|▋         | 7399/110379 [00:10<02:19, 735.85 examples/s]Map:   7%|▋         | 7956/110379 [00:11<02:11, 778.80 examples/s]Map:   7%|▋         | 7624/110379 [00:11<02:29, 688.33 examples/s]Map:   7%|▋         | 7266/110379 [00:10<02:37, 654.37 examples/s]Map:   7%|▋         | 7482/110379 [00:10<02:15, 757.16 examples/s]Map:   7%|▋         | 7701/110379 [00:11<02:25, 705.57 examples/s]Map:   7%|▋         | 7345/110379 [00:10<02:30, 685.67 examples/s]Map:   7%|▋         | 7561/110379 [00:10<02:14, 761.65 examples/s]Map:   7%|▋         | 7775/110379 [00:11<02:24, 711.08 examples/s]Map:   7%|▋         | 8039/110379 [00:11<02:53, 588.70 examples/s]Map:   7%|▋         | 7421/110379 [00:10<02:26, 703.40 examples/s]Map:   7%|▋         | 7851/110379 [00:11<02:21, 724.34 examples/s]Map:   7%|▋         | 8124/110379 [00:11<02:38, 644.24 examples/s]Map:   7%|▋         | 7679/110379 [00:11<02:14, 765.22 examples/s]Map:   7%|▋         | 7531/110379 [00:11<02:24, 710.28 examples/s]Map:   7%|▋         | 7930/110379 [00:11<02:18, 741.52 examples/s]Map:   7%|▋         | 8205/110379 [00:11<02:29, 683.91 examples/s]Map:   7%|▋         | 7797/110379 [00:11<02:13, 771.23 examples/s]Map:   7%|▋         | 7606/110379 [00:11<02:23, 716.42 examples/s]Map:   8%|▊         | 8288/110379 [00:11<02:22, 718.91 examples/s]Map:   7%|▋         | 7879/110379 [00:11<02:11, 780.46 examples/s]Map:   7%|▋         | 7684/110379 [00:11<02:20, 728.79 examples/s]Map:   8%|▊         | 8371/110379 [00:12<02:16, 748.00 examples/s]Map:   7%|▋         | 8035/110379 [00:12<03:01, 563.22 examples/s]Map:   8%|▊         | 8454/110379 [00:12<02:12, 767.28 examples/s]Map:   7%|▋         | 7995/110379 [00:11<02:12, 772.14 examples/s]Map:   7%|▋         | 7793/110379 [00:11<02:21, 725.63 examples/s]Map:   7%|▋         | 8107/110379 [00:12<02:51, 595.01 examples/s]Map:   7%|▋         | 7871/110379 [00:11<02:19, 737.30 examples/s]Map:   7%|▋         | 8184/110379 [00:12<02:41, 634.22 examples/s]Map:   8%|▊         | 8571/110379 [00:12<02:12, 769.80 examples/s]Map:   7%|▋         | 8074/110379 [00:11<02:53, 587.98 examples/s]Map:   7%|▋         | 8263/110379 [00:12<02:31, 671.97 examples/s]Map:   8%|▊         | 8654/110379 [00:12<02:10, 779.34 examples/s]Map:   7%|▋         | 7987/110379 [00:11<02:17, 747.19 examples/s]Map:   7%|▋         | 8156/110379 [00:11<02:40, 635.08 examples/s]Map:   8%|▊         | 8343/110379 [00:12<02:24, 703.87 examples/s]Map:   8%|▊         | 8772/110379 [00:12<02:10, 777.46 examples/s]Map:   7%|▋         | 8237/110379 [00:11<02:31, 672.33 examples/s]Map:   8%|▊         | 8423/110379 [00:12<02:20, 725.91 examples/s]Map:   8%|▊         | 8855/110379 [00:12<02:08, 787.89 examples/s]Map:   7%|▋         | 8078/110379 [00:11<02:55, 584.40 examples/s]Map:   8%|▊         | 8320/110379 [00:11<02:23, 709.44 examples/s]Map:   8%|▊         | 8504/110379 [00:12<02:16, 744.34 examples/s]Map:   7%|▋         | 8158/110379 [00:11<02:42, 628.95 examples/s]Map:   8%|▊         | 8401/110379 [00:12<02:19, 731.63 examples/s]Map:   8%|▊         | 8581/110379 [00:12<02:16, 747.63 examples/s]Map:   8%|▊         | 8976/110379 [00:12<02:08, 790.97 examples/s]Map:   7%|▋         | 8233/110379 [00:12<02:36, 654.47 examples/s]Map:   8%|▊         | 8484/110379 [00:12<02:14, 755.15 examples/s]Map:   8%|▊         | 8691/110379 [00:12<02:18, 736.03 examples/s]Map:   8%|▊         | 8311/110379 [00:12<02:29, 680.98 examples/s]Map:   8%|▊         | 8565/110379 [00:12<02:13, 765.30 examples/s]Map:   8%|▊         | 9077/110379 [00:13<02:42, 621.63 examples/s]Map:   8%|▊         | 8768/110379 [00:13<02:17, 741.58 examples/s]Map:   8%|▊         | 8392/110379 [00:12<02:23, 710.57 examples/s]Map:   8%|▊         | 8650/110379 [00:12<02:09, 786.46 examples/s]Map:   8%|▊         | 9155/110379 [00:13<02:34, 653.14 examples/s]Map:   8%|▊         | 8848/110379 [00:13<02:14, 754.98 examples/s]Map:   8%|▊         | 8473/110379 [00:12<02:19, 732.99 examples/s]Map:   8%|▊         | 9237/110379 [00:13<02:26, 688.76 examples/s]Map:   8%|▊         | 8773/110379 [00:12<02:07, 796.12 examples/s]Map:   8%|▊         | 8550/110379 [00:12<02:17, 742.41 examples/s]Map:   8%|▊         | 8958/110379 [00:13<02:18, 733.42 examples/s]Map:   8%|▊         | 9313/110379 [00:13<02:23, 703.72 examples/s]Map:   8%|▊         | 8882/110379 [00:12<02:12, 767.45 examples/s]Map:   8%|▊         | 8663/110379 [00:12<02:16, 744.65 examples/s]Map:   9%|▊         | 9423/110379 [00:13<02:22, 709.99 examples/s]Map:   8%|▊         | 9033/110379 [00:13<03:04, 548.44 examples/s]Map:   8%|▊         | 8775/110379 [00:12<02:17, 739.31 examples/s]Map:   9%|▊         | 9504/110379 [00:13<02:17, 732.03 examples/s]Map:   8%|▊         | 9107/110379 [00:13<02:52, 586.54 examples/s]Map:   8%|▊         | 9000/110379 [00:12<02:45, 611.55 examples/s]Map:   8%|▊         | 8855/110379 [00:12<02:15, 750.41 examples/s]Map:   9%|▊         | 9583/110379 [00:13<02:15, 743.72 examples/s]Map:   8%|▊         | 9186/110379 [00:13<02:40, 631.85 examples/s]Map:   8%|▊         | 9074/110379 [00:13<02:39, 634.82 examples/s]Map:   9%|▉         | 9661/110379 [00:13<02:14, 747.97 examples/s]Map:   8%|▊         | 8969/110379 [00:13<02:15, 749.24 examples/s]Map:   8%|▊         | 9263/110379 [00:13<02:32, 663.74 examples/s]Map:   8%|▊         | 9154/110379 [00:13<02:31, 669.36 examples/s]Map:   9%|▉         | 9738/110379 [00:13<02:13, 751.59 examples/s]Map:   8%|▊         | 9335/110379 [00:13<02:29, 677.70 examples/s]Map:   8%|▊         | 9229/110379 [00:13<02:27, 686.64 examples/s]Map:   9%|▉         | 9817/110379 [00:14<02:12, 760.90 examples/s]Map:   9%|▊         | 9409/110379 [00:14<02:26, 691.33 examples/s]Map:   8%|▊         | 9313/110379 [00:13<02:19, 724.89 examples/s]Map:   8%|▊         | 9066/110379 [00:13<02:56, 574.92 examples/s]Map:   9%|▉         | 9898/110379 [00:14<02:10, 772.35 examples/s]Map:   9%|▊         | 9394/110379 [00:13<02:15, 744.50 examples/s]Map:   8%|▊         | 9148/110379 [00:13<02:42, 622.14 examples/s]Map:   9%|▊         | 9514/110379 [00:14<02:26, 686.54 examples/s]Map:   9%|▉         | 9982/110379 [00:14<02:07, 788.99 examples/s]Map:   9%|▊         | 9474/110379 [00:13<02:13, 758.06 examples/s]Map:   8%|▊         | 9230/110379 [00:13<02:32, 664.72 examples/s]Map:   9%|▊         | 9587/110379 [00:14<02:24, 696.96 examples/s]Map:   9%|▊         | 9559/110379 [00:13<02:09, 781.49 examples/s]Map:   8%|▊         | 9308/110379 [00:13<02:26, 690.28 examples/s]Map:   9%|▉         | 10078/110379 [00:14<02:49, 591.18 examples/s]Map:   9%|▉         | 9694/110379 [00:14<02:23, 699.42 examples/s]Map:   9%|▊         | 9386/110379 [00:13<02:22, 708.67 examples/s]Map:   9%|▉         | 9674/110379 [00:13<02:10, 772.79 examples/s]Map:   9%|▉         | 10158/110379 [00:14<02:37, 637.44 examples/s]Map:   9%|▉         | 9765/110379 [00:14<02:23, 698.92 examples/s]Map:   9%|▉         | 9753/110379 [00:13<02:09, 774.53 examples/s]Map:   9%|▉         | 10240/110379 [00:14<02:27, 680.67 examples/s]Map:   9%|▊         | 9493/110379 [00:13<02:23, 702.72 examples/s]Map:   9%|▉         | 9843/110379 [00:14<02:19, 718.37 examples/s]Map:   9%|▉         | 9836/110379 [00:14<02:07, 788.50 examples/s]Map:   9%|▉         | 10321/110379 [00:14<02:20, 711.96 examples/s]Map:   9%|▊         | 9568/110379 [00:13<02:21, 711.39 examples/s]Map:   9%|▉         | 9918/110379 [00:14<02:18, 724.66 examples/s]Map:   9%|▉         | 10400/110379 [00:14<02:16, 730.63 examples/s]Map:   9%|▊         | 9646/110379 [00:14<02:18, 726.40 examples/s]Map:   9%|▉         | 9957/110379 [00:14<02:06, 792.20 examples/s]Map:   9%|▉         | 10480/110379 [00:14<02:13, 746.59 examples/s]Map:   9%|▉         | 9725/110379 [00:14<02:16, 739.31 examples/s]Map:   9%|▉         | 10000/110379 [00:15<03:05, 541.15 examples/s]Map:   9%|▉         | 9806/110379 [00:14<02:12, 756.93 examples/s]Map:   9%|▉         | 10076/110379 [00:15<02:50, 587.96 examples/s]Map:   9%|▉         | 10039/110379 [00:14<02:45, 606.08 examples/s]Map:  10%|▉         | 10593/110379 [00:15<02:13, 747.37 examples/s]Map:   9%|▉         | 9883/110379 [00:14<02:12, 757.91 examples/s]Map:   9%|▉         | 10154/110379 [00:15<02:38, 631.17 examples/s]Map:   9%|▉         | 10121/110379 [00:14<02:34, 650.18 examples/s]Map:  10%|▉         | 10673/110379 [00:15<02:11, 759.95 examples/s]Map:   9%|▉         | 10231/110379 [00:15<02:30, 663.83 examples/s]Map:   9%|▉         | 10204/110379 [00:14<02:25, 690.04 examples/s]Map:  10%|▉         | 10757/110379 [00:15<02:08, 777.83 examples/s]Map:   9%|▉         | 9998/110379 [00:14<02:12, 757.90 examples/s]Map:   9%|▉         | 10302/110379 [00:15<02:28, 672.87 examples/s]Map:   9%|▉         | 10285/110379 [00:14<02:19, 717.29 examples/s]Map:  10%|▉         | 10874/110379 [00:15<02:08, 776.05 examples/s]Map:   9%|▉         | 10379/110379 [00:15<02:23, 697.79 examples/s]Map:   9%|▉         | 10370/110379 [00:14<02:13, 749.53 examples/s]Map:   9%|▉         | 10076/110379 [00:14<02:54, 573.62 examples/s]Map:  10%|▉         | 10954/110379 [00:15<02:07, 779.84 examples/s]Map:   9%|▉         | 10153/110379 [00:14<02:43, 614.64 examples/s]Map:   9%|▉         | 10485/110379 [00:15<02:23, 697.09 examples/s]Map:  10%|▉         | 10490/110379 [00:14<02:10, 763.79 examples/s]Map:   9%|▉         | 10225/110379 [00:14<02:37, 637.64 examples/s]Map:  10%|▉         | 11033/110379 [00:15<02:52, 577.22 examples/s]Map:  10%|▉         | 10591/110379 [00:15<02:23, 695.55 examples/s]Map:  10%|▉         | 10592/110379 [00:15<02:16, 731.29 examples/s]Map:   9%|▉         | 10295/110379 [00:15<02:33, 652.98 examples/s]Map:  10%|█         | 11115/110379 [00:15<02:38, 626.82 examples/s]Map:  10%|▉         | 10678/110379 [00:15<02:10, 761.61 examples/s]Map:  10%|▉         | 10665/110379 [00:15<02:21, 704.94 examples/s]Map:   9%|▉         | 10371/110379 [00:15<02:27, 679.63 examples/s]Map:  10%|█         | 11196/110379 [00:16<02:28, 667.49 examples/s]Map:  10%|▉         | 10758/110379 [00:15<02:09, 769.83 examples/s]Map:  10%|▉         | 10738/110379 [00:16<02:20, 708.83 examples/s]Map:   9%|▉         | 10444/110379 [00:15<02:24, 689.42 examples/s]Map:  10%|█         | 11275/110379 [00:16<02:22, 696.04 examples/s]Map:  10%|▉         | 10839/110379 [00:15<02:07, 778.43 examples/s]Map:  10%|▉         | 10811/110379 [00:16<02:19, 713.25 examples/s]Map:  10%|▉         | 10521/110379 [00:15<02:20, 709.61 examples/s]Map:  10%|█         | 11352/110379 [00:16<02:18, 714.06 examples/s]Map:  10%|▉         | 10918/110379 [00:15<02:07, 779.04 examples/s]Map:  10%|▉         | 10598/110379 [00:15<02:17, 723.89 examples/s]Map:  10%|▉         | 10918/110379 [00:16<02:19, 712.19 examples/s]Map:  10%|█         | 11432/110379 [00:16<02:14, 736.65 examples/s]Map:  10%|▉         | 10674/110379 [00:15<02:16, 730.24 examples/s]Map:  10%|▉         | 10992/110379 [00:16<02:18, 715.88 examples/s]Map:  10%|█         | 11514/110379 [00:16<02:10, 757.95 examples/s]Map:  10%|▉         | 11000/110379 [00:15<02:46, 596.78 examples/s]Map:  10%|▉         | 10768/110379 [00:15<02:25, 686.52 examples/s]Map:  11%|█         | 11598/110379 [00:16<02:07, 776.93 examples/s]Map:  10%|█         | 11079/110379 [00:15<02:35, 639.68 examples/s]Map:  10%|█         | 11075/110379 [00:16<03:01, 546.65 examples/s]Map:  11%|█         | 11681/110379 [00:16<02:05, 788.67 examples/s]Map:  10%|█         | 11155/110379 [00:15<02:28, 668.59 examples/s]Map:  10%|▉         | 10847/110379 [00:15<02:39, 625.41 examples/s]Map:  10%|█         | 11146/110379 [00:16<02:50, 581.73 examples/s]Map:  10%|█         | 11232/110379 [00:16<02:23, 692.20 examples/s]Map:  10%|▉         | 10918/110379 [00:15<02:34, 643.97 examples/s]Map:  11%|█         | 11791/110379 [00:16<02:09, 763.52 examples/s]Map:  10%|█         | 11214/110379 [00:16<02:44, 602.91 examples/s]Map:  10%|█         | 11315/110379 [00:16<02:16, 724.60 examples/s]Map:  10%|▉         | 10988/110379 [00:16<02:31, 655.00 examples/s]Map:  11%|█         | 11875/110379 [00:16<02:05, 782.05 examples/s]Map:  10%|█         | 11282/110379 [00:16<02:39, 619.66 examples/s]Map:  10%|█         | 11419/110379 [00:16<02:19, 709.83 examples/s]Map:  10%|█         | 11353/110379 [00:17<02:34, 641.50 examples/s]Map:  11%|█         | 11985/110379 [00:17<02:09, 759.73 examples/s]Map:  10%|█         | 11498/110379 [00:16<02:15, 728.53 examples/s]Map:  10%|█         | 11426/110379 [00:17<02:29, 663.43 examples/s]Map:  10%|█         | 11072/110379 [00:16<03:23, 487.35 examples/s]Map:  10%|█         | 11500/110379 [00:17<02:25, 680.15 examples/s]Map:  10%|█         | 11142/110379 [00:16<03:06, 531.13 examples/s]Map:  11%|█         | 11612/110379 [00:16<02:14, 735.62 examples/s]Map:  11%|█         | 12075/110379 [00:17<02:47, 587.22 examples/s]Map:  10%|█         | 11574/110379 [00:17<02:22, 695.77 examples/s]Map:  10%|█         | 11216/110379 [00:16<02:51, 578.19 examples/s]Map:  11%|█         | 11695/110379 [00:16<02:10, 758.02 examples/s]Map:  11%|█         | 12152/110379 [00:17<02:37, 624.28 examples/s]Map:  10%|█         | 11293/110379 [00:16<02:39, 619.99 examples/s]Map:  11%|█         | 11775/110379 [00:16<02:08, 765.25 examples/s]Map:  11%|█         | 12227/110379 [00:17<02:30, 650.25 examples/s]Map:  11%|█         | 11682/110379 [00:17<02:20, 701.66 examples/s]Map:  10%|█         | 11365/110379 [00:16<02:33, 644.55 examples/s]Map:  11%|█         | 11859/110379 [00:16<02:05, 782.22 examples/s]Map:  11%|█         | 12306/110379 [00:17<02:23, 683.70 examples/s]Map:  11%|█         | 11755/110379 [00:17<02:19, 706.36 examples/s]Map:  10%|█         | 11436/110379 [00:16<02:30, 658.56 examples/s]Map:  11%|█         | 12389/110379 [00:17<02:16, 717.09 examples/s]Map:  11%|█         | 11827/110379 [00:17<02:19, 707.26 examples/s]Map:  11%|█         | 11973/110379 [00:16<02:08, 766.79 examples/s]Map:  10%|█         | 11507/110379 [00:16<02:27, 671.48 examples/s]Map:  11%|█▏        | 12465/110379 [00:17<02:15, 723.33 examples/s]Map:  11%|█         | 11901/110379 [00:17<02:18, 712.87 examples/s]Map:  10%|█         | 11582/110379 [00:17<02:22, 690.92 examples/s]Map:  11%|█▏        | 12541/110379 [00:17<02:13, 730.91 examples/s]Map:  11%|█         | 11976/110379 [00:17<02:16, 720.35 examples/s]Map:  11%|█         | 11659/110379 [00:17<02:19, 709.82 examples/s]Map:  11%|█         | 12076/110379 [00:17<02:45, 593.78 examples/s]Map:  11%|█▏        | 12620/110379 [00:17<02:11, 744.84 examples/s]Map:  11%|█         | 12150/110379 [00:17<02:37, 622.64 examples/s]Map:  11%|█         | 11767/110379 [00:17<02:18, 709.48 examples/s]Map:  12%|█▏        | 12735/110379 [00:18<02:10, 748.92 examples/s]Map:  11%|█         | 12074/110379 [00:18<03:00, 545.50 examples/s]Map:  11%|█         | 12232/110379 [00:17<02:27, 667.22 examples/s]Map:  11%|█         | 12148/110379 [00:18<02:47, 586.22 examples/s]Map:  11%|█         | 11874/110379 [00:17<02:18, 708.81 examples/s]Map:  11%|█         | 12310/110379 [00:17<02:21, 691.95 examples/s]Map:  12%|█▏        | 12845/110379 [00:18<02:12, 738.06 examples/s]Map:  11%|█         | 12252/110379 [00:18<02:38, 617.45 examples/s]Map:  11%|█         | 11975/110379 [00:17<02:22, 691.86 examples/s]Map:  11%|█▏        | 12418/110379 [00:17<02:20, 697.56 examples/s]Map:  12%|█▏        | 12954/110379 [00:18<02:13, 728.25 examples/s]Map:  11%|█         | 12329/110379 [00:18<02:31, 648.77 examples/s]Map:  11%|█▏        | 12492/110379 [00:17<02:19, 700.47 examples/s]Map:  11%|█         | 12408/110379 [00:18<02:23, 681.23 examples/s]Map:  11%|█▏        | 12568/110379 [00:17<02:17, 713.89 examples/s]Map:  11%|█         | 12078/110379 [00:17<02:56, 556.46 examples/s]Map:  12%|█▏        | 13041/110379 [00:18<02:48, 577.37 examples/s]Map:  11%|█▏        | 12483/110379 [00:18<02:21, 692.87 examples/s]Map:  11%|█▏        | 12649/110379 [00:18<02:12, 736.76 examples/s]Map:  12%|█▏        | 13118/110379 [00:18<02:37, 615.91 examples/s]Map:  11%|█         | 12155/110379 [00:17<02:44, 596.86 examples/s]Map:  11%|█▏        | 12560/110379 [00:18<02:17, 712.89 examples/s]Map:  12%|█▏        | 12728/110379 [00:18<02:10, 750.09 examples/s]Map:  11%|█         | 12225/110379 [00:18<02:38, 617.93 examples/s]Map:  12%|█▏        | 13196/110379 [00:18<02:29, 648.00 examples/s]Map:  11%|█▏        | 12634/110379 [00:18<02:16, 713.87 examples/s]Map:  12%|█▏        | 12805/110379 [00:18<02:09, 753.07 examples/s]Map:  11%|█         | 12297/110379 [00:18<02:33, 638.67 examples/s]Map:  12%|█▏        | 13280/110379 [00:18<02:20, 690.71 examples/s]Map:  12%|█▏        | 12708/110379 [00:19<02:16, 717.93 examples/s]Map:  12%|█▏        | 12884/110379 [00:18<02:08, 758.14 examples/s]Map:  11%|█         | 12374/110379 [00:18<02:26, 670.86 examples/s]Map:  12%|█▏        | 13357/110379 [00:19<02:17, 707.60 examples/s]Map:  12%|█▏        | 12965/110379 [00:18<02:06, 768.63 examples/s]Map:  12%|█▏        | 12815/110379 [00:19<02:17, 711.11 examples/s]Map:  12%|█▏        | 13432/110379 [00:19<02:15, 716.48 examples/s]Map:  11%|█▏        | 12477/110379 [00:18<02:25, 674.82 examples/s]Map:  12%|█▏        | 12887/110379 [00:19<02:17, 711.13 examples/s]Map:  12%|█▏        | 13512/110379 [00:19<02:11, 738.33 examples/s]Map:  11%|█▏        | 12552/110379 [00:18<02:21, 690.34 examples/s]Map:  12%|█▏        | 12960/110379 [00:19<02:17, 708.88 examples/s]Map:  12%|█▏        | 13591/110379 [00:19<02:08, 752.03 examples/s]Map:  12%|█▏        | 13073/110379 [00:18<02:50, 570.72 examples/s]Map:  11%|█▏        | 12658/110379 [00:18<02:21, 690.38 examples/s]Map:  12%|█▏        | 13673/110379 [00:19<02:06, 767.30 examples/s]Map:  12%|█▏        | 13148/110379 [00:18<02:40, 606.79 examples/s]Map:  12%|█▏        | 12755/110379 [00:18<02:25, 672.78 examples/s]Map:  12%|█▏        | 13779/110379 [00:19<02:10, 740.85 examples/s]Map:  12%|█▏        | 13063/110379 [00:19<03:07, 518.53 examples/s]Map:  12%|█▏        | 13258/110379 [00:18<02:30, 643.34 examples/s]Map:  13%|█▎        | 13861/110379 [00:19<02:06, 760.23 examples/s]Map:  12%|█▏        | 12831/110379 [00:18<02:21, 689.58 examples/s]Map:  12%|█▏        | 13136/110379 [00:19<02:53, 560.59 examples/s]Map:  12%|█▏        | 13336/110379 [00:19<02:24, 671.41 examples/s]Map:  13%|█▎        | 13943/110379 [00:19<02:04, 774.36 examples/s]Map:  12%|█▏        | 12909/110379 [00:19<02:17, 710.38 examples/s]Map:  12%|█▏        | 13207/110379 [00:19<02:43, 593.19 examples/s]Map:  12%|█▏        | 13412/110379 [00:19<02:20, 691.87 examples/s]Map:  12%|█▏        | 12984/110379 [00:19<02:15, 719.18 examples/s]Map:  12%|█▏        | 13279/110379 [00:19<02:35, 622.98 examples/s]Map:  12%|█▏        | 13495/110379 [00:19<02:13, 726.41 examples/s]Map:  12%|█▏        | 13353/110379 [00:20<02:29, 647.83 examples/s]Map:  12%|█▏        | 13574/110379 [00:19<02:10, 741.21 examples/s]Map:  13%|█▎        | 14039/110379 [00:20<02:42, 593.35 examples/s]Map:  12%|█▏        | 13428/110379 [00:20<02:24, 673.04 examples/s]Map:  12%|█▏        | 13651/110379 [00:19<02:09, 746.28 examples/s]Map:  13%|█▎        | 14115/110379 [00:20<02:33, 628.10 examples/s]Map:  12%|█▏        | 13068/110379 [00:19<03:01, 537.36 examples/s]Map:  12%|█▏        | 13504/110379 [00:20<02:19, 692.84 examples/s]Map:  13%|█▎        | 14190/110379 [00:20<02:26, 656.11 examples/s]Map:  12%|█▏        | 13138/110379 [00:19<02:54, 558.15 examples/s]Map:  12%|█▏        | 13766/110379 [00:19<02:08, 751.16 examples/s]Map:  12%|█▏        | 13578/110379 [00:20<02:18, 700.68 examples/s]Map:  13%|█▎        | 14269/110379 [00:20<02:19, 688.86 examples/s]Map:  12%|█▏        | 13209/110379 [00:19<02:44, 592.21 examples/s]Map:  13%|█▎        | 13875/110379 [00:19<02:10, 741.24 examples/s]Map:  13%|█▎        | 14349/110379 [00:20<02:13, 717.30 examples/s]Map:  12%|█▏        | 13278/110379 [00:19<02:37, 614.73 examples/s]Map:  12%|█▏        | 13676/110379 [00:20<02:22, 679.53 examples/s]Map:  13%|█▎        | 13954/110379 [00:19<02:08, 752.66 examples/s]Map:  13%|█▎        | 14428/110379 [00:20<02:10, 733.50 examples/s]Map:  12%|█▏        | 13353/110379 [00:19<02:29, 647.10 examples/s]Map:  12%|█▏        | 13773/110379 [00:20<02:25, 664.45 examples/s]Map:  13%|█▎        | 14511/110379 [00:20<02:06, 757.36 examples/s]Map:  12%|█▏        | 13424/110379 [00:19<02:26, 662.00 examples/s]Map:  13%|█▎        | 13847/110379 [00:20<02:22, 678.67 examples/s]Map:  13%|█▎        | 14593/110379 [00:20<02:03, 773.22 examples/s]Map:  12%|█▏        | 13497/110379 [00:19<02:22, 679.55 examples/s]Map:  13%|█▎        | 14035/110379 [00:20<02:49, 568.27 examples/s]Map:  13%|█▎        | 13919/110379 [00:20<02:21, 682.53 examples/s]Map:  12%|█▏        | 13567/110379 [00:20<02:21, 682.10 examples/s]Map:  13%|█▎        | 14113/110379 [00:20<02:37, 611.65 examples/s]Map:  13%|█▎        | 14696/110379 [00:20<02:09, 739.53 examples/s]Map:  13%|█▎        | 13992/110379 [00:20<02:19, 691.88 examples/s]Map:  12%|█▏        | 13643/110379 [00:20<02:18, 700.07 examples/s]Map:  13%|█▎        | 14190/110379 [00:20<02:28, 646.06 examples/s]Map:  13%|█▎        | 14775/110379 [00:21<02:07, 750.46 examples/s]Map:  12%|█▏        | 13714/110379 [00:20<02:18, 697.51 examples/s]Map:  13%|█▎        | 14268/110379 [00:20<02:21, 678.27 examples/s]Map:  13%|█▎        | 14854/110379 [00:21<02:06, 757.16 examples/s]Map:  13%|█▎        | 14343/110379 [00:20<02:18, 695.10 examples/s]Map:  13%|█▎        | 14077/110379 [00:21<03:02, 527.72 examples/s]Map:  14%|█▎        | 14934/110379 [00:21<02:04, 767.63 examples/s]Map:  13%|█▎        | 13820/110379 [00:20<02:18, 698.60 examples/s]Map:  13%|█▎        | 14424/110379 [00:20<02:13, 720.52 examples/s]Map:  13%|█▎        | 14148/110379 [00:21<02:50, 564.68 examples/s]Map:  13%|█▎        | 13898/110379 [00:20<02:14, 718.91 examples/s]Map:  13%|█▎        | 14504/110379 [00:20<02:10, 735.86 examples/s]Map:  13%|█▎        | 14216/110379 [00:21<02:42, 591.13 examples/s]Map:  13%|█▎        | 13977/110379 [00:20<02:11, 735.25 examples/s]Map:  14%|█▎        | 15038/110379 [00:21<02:40, 595.24 examples/s]Map:  13%|█▎        | 14585/110379 [00:20<02:07, 752.27 examples/s]Map:  13%|█▎        | 14282/110379 [00:21<02:38, 606.90 examples/s]Map:  14%|█▎        | 15118/110379 [00:21<02:28, 639.75 examples/s]Map:  13%|█▎        | 14665/110379 [00:20<02:05, 764.42 examples/s]Map:  13%|█▎        | 14357/110379 [00:21<02:29, 642.56 examples/s]Map:  14%|█▍        | 15196/110379 [00:21<02:21, 670.51 examples/s]Map:  13%|█▎        | 14073/110379 [00:20<02:54, 552.21 examples/s]Map:  13%|█▎        | 14745/110379 [00:21<02:03, 772.25 examples/s]Map:  13%|█▎        | 14459/110379 [00:21<02:27, 651.15 examples/s]Map:  14%|█▍        | 15277/110379 [00:21<02:15, 701.21 examples/s]Map:  13%|█▎        | 14143/110379 [00:20<02:45, 582.43 examples/s]Map:  13%|█▎        | 14860/110379 [00:21<02:05, 761.29 examples/s]Map:  14%|█▍        | 15355/110379 [00:21<02:11, 719.98 examples/s]Map:  13%|█▎        | 14219/110379 [00:21<02:34, 621.51 examples/s]Map:  13%|█▎        | 14558/110379 [00:21<02:27, 651.59 examples/s]Map:  14%|█▍        | 15435/110379 [00:22<02:08, 740.56 examples/s]Map:  13%|█▎        | 14291/110379 [00:21<02:29, 644.07 examples/s]Map:  14%|█▎        | 14964/110379 [00:21<02:09, 734.22 examples/s]Map:  13%|█▎        | 14628/110379 [00:22<02:24, 661.97 examples/s]Map:  13%|█▎        | 14697/110379 [00:22<02:23, 666.71 examples/s]Map:  14%|█▍        | 15540/110379 [00:22<02:11, 721.50 examples/s]Map:  13%|█▎        | 14395/110379 [00:21<02:26, 655.52 examples/s]Map:  13%|█▎        | 14769/110379 [00:22<02:20, 678.83 examples/s]Map:  14%|█▍        | 15616/110379 [00:22<02:10, 728.16 examples/s]Map:  13%|█▎        | 14469/110379 [00:21<02:22, 674.52 examples/s]Map:  14%|█▎        | 15072/110379 [00:21<02:50, 560.30 examples/s]Map:  13%|█▎        | 14839/110379 [00:22<02:20, 679.90 examples/s]Map:  14%|█▍        | 15696/110379 [00:22<02:07, 744.70 examples/s]Map:  13%|█▎        | 14546/110379 [00:21<02:17, 697.37 examples/s]Map:  14%|█▎        | 15156/110379 [00:21<02:35, 613.66 examples/s]Map:  14%|█▎        | 14912/110379 [00:22<02:17, 691.88 examples/s]Map:  14%|█▍        | 15775/110379 [00:22<02:06, 750.71 examples/s]Map:  13%|█▎        | 14620/110379 [00:21<02:15, 707.72 examples/s]Map:  14%|█▍        | 15240/110379 [00:21<02:23, 661.38 examples/s]Map:  14%|█▍        | 15857/110379 [00:22<02:02, 768.80 examples/s]Map:  13%|█▎        | 14701/110379 [00:21<02:10, 732.07 examples/s]Map:  14%|█▍        | 15316/110379 [00:21<02:19, 681.47 examples/s]Map:  14%|█▍        | 15938/110379 [00:22<02:01, 777.53 examples/s]Map:  13%|█▎        | 14776/110379 [00:21<02:10, 730.82 examples/s]Map:  14%|█▎        | 15000/110379 [00:22<03:08, 506.06 examples/s]Map:  14%|█▍        | 15394/110379 [00:22<02:15, 702.80 examples/s]Map:  13%|█▎        | 14853/110379 [00:21<02:08, 740.59 examples/s]Map:  14%|█▎        | 15072/110379 [00:22<02:52, 550.91 examples/s]Map:  14%|█▍        | 15477/110379 [00:22<02:09, 732.36 examples/s]Map:  14%|█▎        | 14930/110379 [00:22<02:08, 744.63 examples/s]Map:  15%|█▍        | 16038/110379 [00:22<02:38, 593.69 examples/s]Map:  14%|█▎        | 15143/110379 [00:22<02:42, 586.48 examples/s]Map:  14%|█▍        | 15559/110379 [00:22<02:06, 749.82 examples/s]Map:  15%|█▍        | 16117/110379 [00:23<02:27, 637.71 examples/s]Map:  14%|█▍        | 15214/110379 [00:23<02:35, 613.56 examples/s]Map:  14%|█▍        | 15639/110379 [00:22<02:04, 761.77 examples/s]Map:  15%|█▍        | 16197/110379 [00:23<02:19, 674.85 examples/s]Map:  14%|█▍        | 15284/110379 [00:23<02:29, 635.42 examples/s]Map:  14%|█▍        | 15719/110379 [00:22<02:03, 768.52 examples/s]Map:  14%|█▎        | 15034/110379 [00:22<02:50, 559.61 examples/s]Map:  15%|█▍        | 16278/110379 [00:23<02:13, 706.41 examples/s]Map:  14%|█▍        | 15361/110379 [00:23<02:22, 665.86 examples/s]Map:  14%|█▍        | 15802/110379 [00:22<02:00, 785.29 examples/s]Map:  14%|█▎        | 15112/110379 [00:22<02:36, 606.83 examples/s]Map:  15%|█▍        | 16359/110379 [00:23<02:08, 731.30 examples/s]Map:  14%|█▍        | 15431/110379 [00:23<02:21, 671.41 examples/s]Map:  14%|█▍        | 15883/110379 [00:22<01:59, 788.89 examples/s]Map:  14%|█▍        | 15184/110379 [00:22<02:30, 632.21 examples/s]Map:  15%|█▍        | 16471/110379 [00:23<02:08, 731.74 examples/s]Map:  14%|█▍        | 15254/110379 [00:22<02:27, 647.11 examples/s]Map:  14%|█▍        | 15533/110379 [00:23<02:21, 671.10 examples/s]Map:  14%|█▍        | 15998/110379 [00:22<02:01, 777.45 examples/s]Map:  15%|█▍        | 16553/110379 [00:23<02:04, 752.37 examples/s]Map:  14%|█▍        | 15338/110379 [00:22<02:16, 695.08 examples/s]Map:  14%|█▍        | 15612/110379 [00:23<02:15, 698.34 examples/s]Map:  15%|█▌        | 16631/110379 [00:23<02:03, 757.73 examples/s]Map:  14%|█▍        | 15415/110379 [00:22<02:13, 712.95 examples/s]Map:  14%|█▍        | 15685/110379 [00:23<02:14, 704.76 examples/s]Map:  15%|█▍        | 16079/110379 [00:22<02:39, 591.87 examples/s]Map:  14%|█▍        | 15757/110379 [00:23<02:14, 704.76 examples/s]Map:  15%|█▌        | 16746/110379 [00:23<02:03, 757.73 examples/s]Map:  15%|█▍        | 16160/110379 [00:23<02:27, 638.37 examples/s]Map:  14%|█▍        | 15525/110379 [00:22<02:12, 716.63 examples/s]Map:  14%|█▍        | 15830/110379 [00:23<02:13, 708.45 examples/s]Map:  15%|█▌        | 16828/110379 [00:23<02:01, 767.77 examples/s]Map:  15%|█▍        | 16238/110379 [00:23<02:20, 669.91 examples/s]Map:  14%|█▍        | 15631/110379 [00:23<02:13, 710.23 examples/s]Map:  14%|█▍        | 15908/110379 [00:23<02:10, 726.62 examples/s]Map:  15%|█▌        | 16910/110379 [00:24<02:00, 776.49 examples/s]Map:  15%|█▍        | 16314/110379 [00:23<02:16, 690.06 examples/s]Map:  14%|█▍        | 15709/110379 [00:23<02:10, 725.31 examples/s]Map:  14%|█▍        | 15986/110379 [00:24<02:07, 738.55 examples/s]Map:  15%|█▍        | 16394/110379 [00:23<02:11, 715.76 examples/s]Map:  14%|█▍        | 15785/110379 [00:23<02:09, 733.09 examples/s]Map:  15%|█▍        | 16472/110379 [00:23<02:08, 731.86 examples/s]Map:  15%|█▌        | 17000/110379 [00:24<02:39, 584.85 examples/s]Map:  14%|█▍        | 15864/110379 [00:23<02:06, 745.84 examples/s]Map:  15%|█▍        | 16076/110379 [00:24<02:49, 555.69 examples/s]Map:  15%|█▌        | 17085/110379 [00:24<02:25, 640.49 examples/s]Map:  15%|█▌        | 16588/110379 [00:23<02:06, 744.21 examples/s]Map:  14%|█▍        | 15979/110379 [00:23<02:05, 751.14 examples/s]Map:  15%|█▍        | 16152/110379 [00:24<02:38, 594.77 examples/s]Map:  16%|█▌        | 17161/110379 [00:24<02:19, 667.92 examples/s]Map:  15%|█▌        | 16675/110379 [00:23<02:01, 772.73 examples/s]Map:  15%|█▍        | 16235/110379 [00:24<02:24, 650.18 examples/s]Map:  16%|█▌        | 17240/110379 [00:24<02:13, 697.62 examples/s]Map:  15%|█▌        | 16755/110379 [00:23<02:00, 776.80 examples/s]Map:  15%|█▍        | 16313/110379 [00:24<02:17, 681.82 examples/s]Map:  16%|█▌        | 17318/110379 [00:24<02:09, 716.55 examples/s]Map:  15%|█▍        | 16074/110379 [00:23<02:43, 576.81 examples/s]Map:  15%|█▌        | 16838/110379 [00:23<01:58, 789.94 examples/s]Map:  15%|█▍        | 16391/110379 [00:24<02:13, 701.51 examples/s]Map:  16%|█▌        | 17398/110379 [00:24<02:06, 736.54 examples/s]Map:  15%|█▍        | 16150/110379 [00:23<02:33, 614.08 examples/s]Map:  15%|█▌        | 16918/110379 [00:24<01:58, 789.47 examples/s]Map:  15%|█▍        | 16468/110379 [00:24<02:10, 719.68 examples/s]Map:  16%|█▌        | 17477/110379 [00:24<02:03, 750.96 examples/s]Map:  15%|█▍        | 16229/110379 [00:24<02:24, 652.05 examples/s]Map:  15%|█▌        | 16998/110379 [00:24<01:58, 790.67 examples/s]Map:  15%|█▍        | 16546/110379 [00:24<02:07, 734.37 examples/s]Map:  16%|█▌        | 17561/110379 [00:24<02:00, 772.83 examples/s]Map:  15%|█▍        | 16312/110379 [00:24<02:15, 692.80 examples/s]Map:  15%|█▌        | 16622/110379 [00:25<02:06, 739.20 examples/s]Map:  16%|█▌        | 17643/110379 [00:25<01:58, 785.11 examples/s]Map:  15%|█▍        | 16391/110379 [00:24<02:11, 716.41 examples/s]Map:  15%|█▌        | 16700/110379 [00:25<02:05, 747.23 examples/s]Map:  16%|█▌        | 17109/110379 [00:24<02:38, 590.15 examples/s]Map:  16%|█▌        | 17760/110379 [00:25<01:58, 780.67 examples/s]Map:  15%|█▍        | 16473/110379 [00:24<02:24, 651.68 examples/s]Map:  16%|█▌        | 17193/110379 [00:24<02:24, 642.92 examples/s]Map:  15%|█▌        | 16805/110379 [00:25<02:09, 721.66 examples/s]Map:  16%|█▌        | 17840/110379 [00:25<01:58, 782.37 examples/s]Map:  16%|█▌        | 17272/110379 [00:24<02:19, 669.09 examples/s]Map:  15%|█▌        | 16568/110379 [00:24<02:26, 642.49 examples/s]Map:  15%|█▌        | 16909/110379 [00:25<02:11, 708.73 examples/s]Map:  16%|█▌        | 17359/110379 [00:24<02:09, 716.90 examples/s]Map:  16%|█▋        | 17951/110379 [00:25<02:00, 764.08 examples/s]Map:  15%|█▌        | 16639/110379 [00:24<02:23, 655.39 examples/s]Map:  16%|█▌        | 17440/110379 [00:24<02:05, 739.07 examples/s]Map:  15%|█▌        | 16714/110379 [00:24<02:18, 677.85 examples/s]Map:  15%|█▌        | 16789/110379 [00:24<02:14, 695.96 examples/s]Map:  16%|█▋        | 18039/110379 [00:25<02:38, 583.68 examples/s]Map:  16%|█▌        | 17552/110379 [00:24<02:05, 737.81 examples/s]Map:  15%|█▌        | 17000/110379 [00:25<02:54, 536.40 examples/s]Map:  16%|█▌        | 17631/110379 [00:25<02:03, 748.92 examples/s]Map:  16%|█▋        | 18118/110379 [00:25<02:27, 624.94 examples/s]Map:  15%|█▌        | 17065/110379 [00:25<02:47, 557.83 examples/s]Map:  15%|█▌        | 16890/110379 [00:25<02:16, 683.56 examples/s]Map:  16%|█▋        | 18188/110379 [00:25<02:23, 641.04 examples/s]Map:  16%|█▌        | 17710/110379 [00:25<02:02, 757.36 examples/s]Map:  16%|█▌        | 17160/110379 [00:25<02:40, 579.23 examples/s]Map:  15%|█▌        | 16993/110379 [00:25<02:16, 682.43 examples/s]Map:  16%|█▌        | 17790/110379 [00:25<02:00, 766.98 examples/s]Map:  17%|█▋        | 18263/110379 [00:26<02:18, 664.87 examples/s]Map:  16%|█▌        | 17235/110379 [00:26<02:31, 616.69 examples/s]Map:  16%|█▌        | 17872/110379 [00:25<01:58, 778.61 examples/s]Map:  17%|█▋        | 18347/110379 [00:26<02:10, 707.77 examples/s]Map:  16%|█▌        | 17307/110379 [00:26<02:25, 637.74 examples/s]Map:  17%|█▋        | 18429/110379 [00:26<02:05, 733.80 examples/s]Map:  15%|█▌        | 17072/110379 [00:25<02:55, 530.30 examples/s]Map:  16%|█▋        | 17989/110379 [00:25<01:59, 776.39 examples/s]Map:  16%|█▌        | 17378/110379 [00:26<02:22, 653.46 examples/s]Map:  17%|█▋        | 18509/110379 [00:26<02:02, 749.80 examples/s]Map:  16%|█▌        | 17149/110379 [00:25<02:41, 578.60 examples/s]Map:  16%|█▌        | 17453/110379 [00:26<02:17, 677.33 examples/s]Map:  17%|█▋        | 18587/110379 [00:26<02:01, 757.08 examples/s]Map:  16%|█▌        | 17224/110379 [00:25<02:31, 613.72 examples/s]Map:  16%|█▌        | 17524/110379 [00:26<02:16, 682.03 examples/s]Map:  16%|█▋        | 18080/110379 [00:25<02:34, 596.61 examples/s]Map:  17%|█▋        | 18668/110379 [00:26<01:58, 771.30 examples/s]Map:  16%|█▌        | 17293/110379 [00:25<02:27, 630.96 examples/s]Map:  16%|█▌        | 17597/110379 [00:26<02:14, 692.20 examples/s]Map:  16%|█▋        | 18153/110379 [00:25<02:28, 621.21 examples/s]Map:  16%|█▌        | 17364/110379 [00:25<02:23, 648.29 examples/s]Map:  17%|█▋        | 18780/110379 [00:26<02:01, 756.85 examples/s]Map:  16%|█▌        | 17670/110379 [00:26<02:12, 700.32 examples/s]Map:  17%|█▋        | 18233/110379 [00:25<02:20, 656.40 examples/s]Map:  16%|█▌        | 17741/110379 [00:26<02:12, 700.27 examples/s]Map:  16%|█▌        | 17463/110379 [00:25<02:23, 645.39 examples/s]Map:  17%|█▋        | 18311/110379 [00:26<02:14, 686.09 examples/s]Map:  17%|█▋        | 18895/110379 [00:26<02:01, 754.97 examples/s]Map:  16%|█▌        | 17533/110379 [00:26<02:21, 657.47 examples/s]Map:  17%|█▋        | 18387/110379 [00:26<02:11, 700.88 examples/s]Map:  17%|█▋        | 18976/110379 [00:26<01:59, 766.93 examples/s]Map:  16%|█▌        | 17847/110379 [00:26<02:12, 699.73 examples/s]Map:  16%|█▌        | 17604/110379 [00:26<02:19, 665.61 examples/s]Map:  17%|█▋        | 18467/110379 [00:26<02:06, 726.72 examples/s]Map:  16%|█▌        | 17919/110379 [00:27<02:11, 702.78 examples/s]Map:  17%|█▋        | 18548/110379 [00:26<02:02, 748.14 examples/s]Map:  16%|█▌        | 17702/110379 [00:26<02:21, 653.28 examples/s]Map:  17%|█▋        | 19073/110379 [00:27<02:37, 578.59 examples/s]Map:  17%|█▋        | 18625/110379 [00:26<02:02, 750.06 examples/s]Map:  16%|█▌        | 17770/110379 [00:26<02:21, 656.18 examples/s]Map:  17%|█▋        | 19154/110379 [00:27<02:25, 624.90 examples/s]Map:  16%|█▋        | 18000/110379 [00:27<03:00, 511.55 examples/s]Map:  17%|█▋        | 18735/110379 [00:26<02:04, 738.15 examples/s]Map:  17%|█▋        | 19236/110379 [00:27<02:16, 668.40 examples/s]Map:  16%|█▋        | 18074/110379 [00:27<02:44, 560.20 examples/s]Map:  16%|█▌        | 17870/110379 [00:26<02:21, 653.20 examples/s]Map:  17%|█▋        | 18813/110379 [00:26<02:02, 748.65 examples/s]Map:  18%|█▊        | 19320/110379 [00:27<02:08, 706.79 examples/s]Map:  16%|█▋        | 18146/110379 [00:27<02:34, 596.35 examples/s]Map:  16%|█▋        | 17939/110379 [00:26<02:20, 659.74 examples/s]Map:  17%|█▋        | 18894/110379 [00:26<02:00, 761.25 examples/s]Map:  18%|█▊        | 19404/110379 [00:27<02:03, 739.11 examples/s]Map:  17%|█▋        | 18222/110379 [00:27<02:24, 636.04 examples/s]Map:  17%|█▋        | 18975/110379 [00:26<01:58, 772.64 examples/s]Map:  17%|█▋        | 18294/110379 [00:27<02:20, 655.21 examples/s]Map:  18%|█▊        | 19522/110379 [00:27<02:00, 752.51 examples/s]Map:  16%|█▋        | 18037/110379 [00:26<03:02, 505.91 examples/s]Map:  17%|█▋        | 18364/110379 [00:27<02:18, 666.71 examples/s]Map:  16%|█▋        | 18102/110379 [00:27<02:53, 532.18 examples/s]Map:  18%|█▊        | 19637/110379 [00:27<02:00, 753.05 examples/s]Map:  17%|█▋        | 19075/110379 [00:27<02:38, 577.08 examples/s]Map:  17%|█▋        | 18461/110379 [00:27<02:20, 652.02 examples/s]Map:  16%|█▋        | 18171/110379 [00:27<02:42, 566.47 examples/s]Map:  18%|█▊        | 19716/110379 [00:28<01:59, 760.52 examples/s]Map:  17%|█▋        | 19156/110379 [00:27<02:25, 626.78 examples/s]Map:  17%|█▋        | 18534/110379 [00:28<02:16, 670.72 examples/s]Map:  17%|█▋        | 18247/110379 [00:27<02:31, 609.26 examples/s]Map:  18%|█▊        | 19798/110379 [00:28<01:57, 772.45 examples/s]Map:  17%|█▋        | 19235/110379 [00:27<02:17, 663.80 examples/s]Map:  17%|█▋        | 18322/110379 [00:27<02:23, 642.46 examples/s]Map:  17%|█▋        | 18640/110379 [00:28<02:15, 677.97 examples/s]Map:  18%|█▊        | 19320/110379 [00:27<02:08, 708.92 examples/s]Map:  18%|█▊        | 19914/110379 [00:28<01:57, 769.02 examples/s]Map:  17%|█▋        | 18394/110379 [00:27<02:19, 660.77 examples/s]Map:  17%|█▋        | 18714/110379 [00:28<02:13, 688.92 examples/s]Map:  18%|█▊        | 19996/110379 [00:28<01:56, 776.32 examples/s]Map:  18%|█▊        | 19425/110379 [00:27<02:09, 701.57 examples/s]Map:  17%|█▋        | 18469/110379 [00:27<02:14, 684.30 examples/s]Map:  17%|█▋        | 18809/110379 [00:28<02:17, 666.58 examples/s]Map:  17%|█▋        | 18544/110379 [00:27<02:11, 700.13 examples/s]Map:  18%|█▊        | 19529/110379 [00:27<02:10, 697.49 examples/s]Map:  17%|█▋        | 18880/110379 [00:28<02:15, 674.13 examples/s]Map:  18%|█▊        | 20080/110379 [00:28<02:35, 582.16 examples/s]Map:  17%|█▋        | 18618/110379 [00:27<02:09, 709.24 examples/s]Map:  18%|█▊        | 19604/110379 [00:27<02:08, 708.76 examples/s]Map:  17%|█▋        | 18951/110379 [00:28<02:14, 680.82 examples/s]Map:  18%|█▊        | 20162/110379 [00:28<02:22, 632.79 examples/s]Map:  18%|█▊        | 19682/110379 [00:28<02:04, 725.83 examples/s]Map:  17%|█▋        | 18728/110379 [00:27<02:07, 716.20 examples/s]Map:  18%|█▊        | 20236/110379 [00:28<02:17, 656.39 examples/s]Map:  18%|█▊        | 19758/110379 [00:28<02:03, 732.65 examples/s]Map:  18%|█▊        | 20314/110379 [00:28<02:11, 686.35 examples/s]Map:  17%|█▋        | 18837/110379 [00:28<02:08, 714.47 examples/s]Map:  17%|█▋        | 19035/110379 [00:28<02:57, 514.41 examples/s]Map:  18%|█▊        | 19839/110379 [00:28<02:00, 753.34 examples/s]Map:  18%|█▊        | 20389/110379 [00:29<02:08, 701.52 examples/s]Map:  17%|█▋        | 18913/110379 [00:28<02:06, 724.97 examples/s]Map:  17%|█▋        | 19111/110379 [00:29<02:41, 566.32 examples/s]Map:  18%|█▊        | 19917/110379 [00:28<01:59, 759.98 examples/s]Map:  19%|█▊        | 20471/110379 [00:29<02:02, 732.56 examples/s]Map:  17%|█▋        | 19188/110379 [00:29<02:29, 611.54 examples/s]Map:  19%|█▊        | 20551/110379 [00:29<01:59, 749.36 examples/s]Map:  17%|█▋        | 19256/110379 [00:29<02:25, 627.47 examples/s]Map:  17%|█▋        | 19000/110379 [00:28<02:46, 549.63 examples/s]Map:  18%|█▊        | 20000/110379 [00:28<02:40, 564.71 examples/s]Map:  18%|█▊        | 19325/110379 [00:29<02:21, 641.37 examples/s]Map:  19%|█▊        | 20663/110379 [00:29<02:00, 746.21 examples/s]Map:  17%|█▋        | 19069/110379 [00:28<02:38, 577.00 examples/s]Map:  18%|█▊        | 20075/110379 [00:28<02:28, 606.23 examples/s]Map:  18%|█▊        | 19396/110379 [00:29<02:18, 657.14 examples/s]Map:  17%|█▋        | 19140/110379 [00:28<02:30, 606.73 examples/s]Map:  18%|█▊        | 20154/110379 [00:28<02:19, 649.07 examples/s]Map:  19%|█▉        | 20778/110379 [00:29<01:59, 750.52 examples/s]Map:  18%|█▊        | 19466/110379 [00:29<02:16, 666.89 examples/s]Map:  18%|█▊        | 20230/110379 [00:28<02:13, 674.04 examples/s]Map:  19%|█▉        | 20859/110379 [00:29<01:58, 758.36 examples/s]Map:  17%|█▋        | 19242/110379 [00:28<02:25, 628.23 examples/s]Map:  18%|█▊        | 19539/110379 [00:29<02:13, 681.20 examples/s]Map:  18%|█▊        | 20332/110379 [00:29<02:16, 658.47 examples/s]Map:  19%|█▉        | 20961/110379 [00:29<02:02, 727.57 examples/s]Map:  18%|█▊        | 19334/110379 [00:28<02:27, 617.06 examples/s]Map:  18%|█▊        | 19635/110379 [00:29<02:17, 659.19 examples/s]Map:  18%|█▊        | 20408/110379 [00:29<02:11, 683.05 examples/s]Map:  18%|█▊        | 19405/110379 [00:29<02:22, 637.27 examples/s]Map:  18%|█▊        | 19705/110379 [00:29<02:15, 667.92 examples/s]Map:  19%|█▊        | 20490/110379 [00:29<02:05, 716.20 examples/s]Map:  18%|█▊        | 19476/110379 [00:29<02:18, 654.57 examples/s]Map:  19%|█▉        | 21039/110379 [00:30<02:37, 565.54 examples/s]Map:  18%|█▊        | 19810/110379 [00:30<02:14, 675.01 examples/s]Map:  19%|█▊        | 20569/110379 [00:29<02:03, 729.35 examples/s]Map:  18%|█▊        | 19550/110379 [00:29<02:14, 673.45 examples/s]Map:  19%|█▉        | 21118/110379 [00:30<02:25, 611.82 examples/s]Map:  18%|█▊        | 19883/110379 [00:30<02:11, 688.04 examples/s]Map:  19%|█▊        | 20651/110379 [00:29<01:59, 752.61 examples/s]Map:  19%|█▉        | 21194/110379 [00:30<02:18, 643.67 examples/s]Map:  18%|█▊        | 19652/110379 [00:29<02:14, 673.33 examples/s]Map:  18%|█▊        | 19957/110379 [00:30<02:09, 700.14 examples/s]Map:  19%|█▉        | 20734/110379 [00:29<01:56, 771.28 examples/s]Map:  19%|█▉        | 21266/110379 [00:30<02:14, 660.79 examples/s]Map:  19%|█▉        | 20818/110379 [00:29<01:53, 787.84 examples/s]Map:  18%|█▊        | 19758/110379 [00:29<02:13, 681.29 examples/s]Map:  19%|█▉        | 21348/110379 [00:30<02:07, 700.12 examples/s]Map:  18%|█▊        | 20034/110379 [00:30<02:52, 522.80 examples/s]Map:  19%|█▉        | 21422/110379 [00:30<02:05, 708.35 examples/s]Map:  19%|█▉        | 20922/110379 [00:29<02:00, 741.33 examples/s]Map:  18%|█▊        | 19853/110379 [00:29<02:17, 659.91 examples/s]Map:  18%|█▊        | 20102/110379 [00:30<02:42, 556.75 examples/s]Map:  18%|█▊        | 19923/110379 [00:29<02:15, 665.75 examples/s]Map:  20%|█▉        | 21533/110379 [00:30<02:04, 713.98 examples/s]Map:  18%|█▊        | 20172/110379 [00:30<02:33, 589.18 examples/s]Map:  18%|█▊        | 19994/110379 [00:29<02:14, 670.62 examples/s]Map:  20%|█▉        | 21609/110379 [00:30<02:02, 722.38 examples/s]Map:  19%|█▉        | 21000/110379 [00:30<02:42, 550.83 examples/s]Map:  18%|█▊        | 20243/110379 [00:30<02:25, 619.08 examples/s]Map:  20%|█▉        | 21684/110379 [00:30<02:01, 728.75 examples/s]Map:  19%|█▉        | 21070/110379 [00:30<02:33, 582.11 examples/s]Map:  18%|█▊        | 20316/110379 [00:30<02:19, 646.28 examples/s]Map:  20%|█▉        | 21763/110379 [00:30<01:59, 740.64 examples/s]Map:  19%|█▉        | 21142/110379 [00:30<02:25, 611.71 examples/s]Map:  18%|█▊        | 20071/110379 [00:30<02:58, 507.29 examples/s]Map:  18%|█▊        | 20387/110379 [00:30<02:15, 662.47 examples/s]Map:  18%|█▊        | 20144/110379 [00:30<02:43, 553.01 examples/s]Map:  20%|█▉        | 21868/110379 [00:31<02:02, 722.24 examples/s]Map:  19%|█▉        | 21239/110379 [00:30<02:24, 618.38 examples/s]Map:  19%|█▊        | 20484/110379 [00:31<02:17, 655.46 examples/s]Map:  18%|█▊        | 20207/110379 [00:30<02:38, 567.97 examples/s]Map:  20%|█▉        | 21944/110379 [00:31<02:01, 726.59 examples/s]Map:  19%|█▉        | 21313/110379 [00:30<02:17, 646.10 examples/s]Map:  19%|█▊        | 20552/110379 [00:31<02:16, 658.21 examples/s]Map:  18%|█▊        | 20277/110379 [00:30<02:30, 597.23 examples/s]Map:  19%|█▉        | 21385/110379 [00:30<02:14, 660.82 examples/s]Map:  18%|█▊        | 20348/110379 [00:30<02:24, 623.36 examples/s]Map:  19%|█▊        | 20641/110379 [00:31<02:22, 630.96 examples/s]Map:  19%|█▉        | 21457/110379 [00:30<02:12, 673.18 examples/s]Map:  20%|█▉        | 22036/110379 [00:31<02:39, 554.38 examples/s]Map:  19%|█▉        | 20709/110379 [00:31<02:19, 641.38 examples/s]Map:  18%|█▊        | 20420/110379 [00:30<02:19, 643.33 examples/s]Map:  20%|█▉        | 21527/110379 [00:30<02:10, 678.35 examples/s]Map:  20%|██        | 22113/110379 [00:31<02:27, 598.77 examples/s]Map:  19%|█▉        | 20784/110379 [00:31<02:13, 669.03 examples/s]Map:  19%|█▊        | 20489/110379 [00:30<02:17, 654.01 examples/s]Map:  20%|█▉        | 21603/110379 [00:30<02:07, 698.70 examples/s]Map:  20%|██        | 22193/110379 [00:31<02:17, 642.26 examples/s]Map:  19%|█▉        | 20855/110379 [00:31<02:12, 675.40 examples/s]Map:  19%|█▊        | 20559/110379 [00:30<02:15, 663.85 examples/s]Map:  20%|█▉        | 21679/110379 [00:30<02:04, 714.31 examples/s]Map:  19%|█▊        | 20635/110379 [00:30<02:10, 689.49 examples/s]Map:  20%|██        | 22299/110379 [00:31<02:13, 658.47 examples/s]Map:  20%|█▉        | 21752/110379 [00:31<02:04, 714.71 examples/s]Map:  19%|█▉        | 20958/110379 [00:31<02:12, 675.10 examples/s]Map:  19%|█▉        | 20705/110379 [00:31<02:09, 689.84 examples/s]Map:  20%|██        | 22373/110379 [00:31<02:10, 676.78 examples/s]Map:  20%|█▉        | 21828/110379 [00:31<02:02, 725.81 examples/s]Map:  19%|█▉        | 20777/110379 [00:31<02:08, 695.98 examples/s]Map:  20%|██        | 22456/110379 [00:32<02:03, 712.32 examples/s]Map:  20%|█▉        | 21902/110379 [00:31<02:01, 725.63 examples/s]Map:  19%|█▉        | 21036/110379 [00:32<02:53, 513.92 examples/s]Map:  20%|██        | 22533/110379 [00:32<02:00, 727.41 examples/s]Map:  20%|█▉        | 21977/110379 [00:31<02:00, 731.14 examples/s]Map:  19%|█▉        | 20882/110379 [00:31<02:09, 692.06 examples/s]Map:  19%|█▉        | 21102/110379 [00:32<02:44, 543.23 examples/s]Map:  20%|██        | 22610/110379 [00:32<01:59, 735.44 examples/s]Map:  19%|█▉        | 21175/110379 [00:32<02:32, 585.04 examples/s]Map:  19%|█▉        | 20984/110379 [00:31<02:11, 681.69 examples/s]Map:  21%|██        | 22718/110379 [00:32<02:00, 726.59 examples/s]Map:  20%|█▉        | 22068/110379 [00:31<02:45, 532.65 examples/s]Map:  19%|█▉        | 21267/110379 [00:32<02:31, 588.28 examples/s]Map:  20%|██        | 22137/110379 [00:31<02:36, 564.98 examples/s]Map:  21%|██        | 22817/110379 [00:32<02:05, 699.61 examples/s]Map:  19%|█▉        | 21331/110379 [00:32<02:28, 597.68 examples/s]Map:  19%|█▉        | 21064/110379 [00:31<03:00, 493.63 examples/s]Map:  20%|██        | 22213/110379 [00:31<02:24, 608.46 examples/s]Map:  21%|██        | 22889/110379 [00:32<02:04, 702.81 examples/s]Map:  19%|█▉        | 21404/110379 [00:32<02:21, 629.39 examples/s]Map:  19%|█▉        | 21134/110379 [00:31<02:47, 533.79 examples/s]Map:  20%|██        | 22290/110379 [00:31<02:16, 646.28 examples/s]Map:  21%|██        | 22969/110379 [00:32<02:00, 725.40 examples/s]Map:  19%|█▉        | 21472/110379 [00:32<02:19, 639.10 examples/s]Map:  19%|█▉        | 21205/110379 [00:31<02:36, 568.97 examples/s]Map:  20%|██        | 22365/110379 [00:32<02:11, 670.88 examples/s]Map:  20%|█▉        | 21546/110379 [00:32<02:13, 663.04 examples/s]Map:  19%|█▉        | 21280/110379 [00:32<02:26, 610.00 examples/s]Map:  20%|██        | 22444/110379 [00:32<02:05, 701.36 examples/s]Map:  20%|█▉        | 21623/110379 [00:32<02:08, 689.34 examples/s]Map:  19%|█▉        | 21353/110379 [00:32<02:20, 635.67 examples/s]Map:  21%|██        | 23080/110379 [00:33<02:31, 575.75 examples/s]Map:  20%|██        | 22525/110379 [00:32<02:00, 727.89 examples/s]Map:  20%|█▉        | 21695/110379 [00:33<02:07, 696.27 examples/s]Map:  19%|█▉        | 21422/110379 [00:32<02:17, 648.26 examples/s]Map:  21%|██        | 23155/110379 [00:33<02:23, 609.75 examples/s]Map:  20%|██        | 22601/110379 [00:32<01:59, 733.43 examples/s]Map:  20%|█▉        | 21770/110379 [00:33<02:05, 707.11 examples/s]Map:  19%|█▉        | 21498/110379 [00:32<02:11, 677.98 examples/s]Map:  21%|██        | 23239/110379 [00:33<02:12, 659.51 examples/s]Map:  21%|██        | 22676/110379 [00:32<01:59, 731.19 examples/s]Map:  21%|██        | 23320/110379 [00:33<02:05, 694.51 examples/s]Map:  20%|█▉        | 21864/110379 [00:33<02:11, 672.74 examples/s]Map:  20%|█▉        | 21597/110379 [00:32<02:12, 668.67 examples/s]Map:  21%|██        | 22783/110379 [00:32<02:01, 720.86 examples/s]Map:  21%|██        | 23398/110379 [00:33<02:01, 715.27 examples/s]Map:  20%|█▉        | 21939/110379 [00:33<02:07, 692.34 examples/s]Map:  20%|█▉        | 21669/110379 [00:32<02:10, 677.57 examples/s]Map:  21%|██        | 22890/110379 [00:32<02:03, 710.74 examples/s]Map:  20%|█▉        | 21745/110379 [00:32<02:06, 698.86 examples/s]Map:  21%|██▏       | 23505/110379 [00:33<02:02, 710.96 examples/s]Map:  21%|██        | 22999/110379 [00:32<02:02, 713.00 examples/s]Map:  20%|█▉        | 22032/110379 [00:33<02:51, 515.02 examples/s]Map:  20%|█▉        | 21854/110379 [00:32<02:05, 704.84 examples/s]Map:  21%|██▏       | 23609/110379 [00:33<02:03, 702.58 examples/s]Map:  20%|██        | 22124/110379 [00:33<02:42, 541.66 examples/s]Map:  20%|█▉        | 21956/110379 [00:33<02:07, 692.99 examples/s]Map:  21%|██▏       | 23706/110379 [00:33<02:07, 680.90 examples/s]Map:  21%|██        | 23073/110379 [00:33<02:40, 543.19 examples/s]Map:  20%|██        | 22200/110379 [00:33<02:30, 586.94 examples/s]Map:  22%|██▏       | 23778/110379 [00:33<02:06, 685.48 examples/s]Map:  21%|██        | 23150/110379 [00:33<02:28, 587.41 examples/s]Map:  20%|██        | 22277/110379 [00:34<02:20, 627.09 examples/s]Map:  22%|██▏       | 23853/110379 [00:34<02:04, 697.53 examples/s]Map:  21%|██        | 23218/110379 [00:33<02:23, 605.84 examples/s]Map:  20%|█▉        | 22036/110379 [00:33<02:49, 520.89 examples/s]Map:  20%|██        | 22353/110379 [00:34<02:14, 654.63 examples/s]Map:  21%|██        | 23292/110379 [00:33<02:17, 632.47 examples/s]Map:  20%|██        | 22109/110379 [00:33<02:37, 560.69 examples/s]Map:  22%|██▏       | 23961/110379 [00:34<02:03, 702.45 examples/s]Map:  20%|██        | 22426/110379 [00:34<02:11, 670.39 examples/s]Map:  21%|██        | 23367/110379 [00:33<02:11, 661.48 examples/s]Map:  20%|██        | 22181/110379 [00:33<02:28, 594.52 examples/s]Map:  20%|██        | 22497/110379 [00:34<02:09, 678.70 examples/s]Map:  20%|██        | 22253/110379 [00:33<02:21, 621.78 examples/s]Map:  22%|██▏       | 24036/110379 [00:34<02:40, 537.16 examples/s]Map:  20%|██        | 22573/110379 [00:34<02:05, 698.70 examples/s]Map:  21%|██▏       | 23475/110379 [00:33<02:07, 680.74 examples/s]Map:  20%|██        | 22324/110379 [00:33<02:16, 642.82 examples/s]Map:  22%|██▏       | 24105/110379 [00:34<02:31, 567.69 examples/s]Map:  21%|██        | 22646/110379 [00:34<02:04, 704.98 examples/s]Map:  21%|██▏       | 23547/110379 [00:33<02:05, 689.47 examples/s]Map:  20%|██        | 22400/110379 [00:33<02:11, 669.96 examples/s]Map:  22%|██▏       | 24181/110379 [00:34<02:21, 610.00 examples/s]Map:  21%|██        | 22724/110379 [00:34<02:00, 724.59 examples/s]Map:  21%|██▏       | 23656/110379 [00:33<02:03, 699.76 examples/s]Map:  22%|██▏       | 24256/110379 [00:34<02:14, 641.44 examples/s]Map:  20%|██        | 22504/110379 [00:33<02:09, 676.06 examples/s]Map:  21%|██        | 22839/110379 [00:34<01:58, 735.68 examples/s]Map:  22%|██▏       | 24335/110379 [00:34<02:07, 674.12 examples/s]Map:  22%|██▏       | 23762/110379 [00:34<02:04, 698.34 examples/s]Map:  20%|██        | 22579/110379 [00:34<02:07, 690.65 examples/s]Map:  21%|██        | 22949/110379 [00:34<01:59, 732.06 examples/s]Map:  22%|██▏       | 24411/110379 [00:34<02:04, 689.13 examples/s]Map:  22%|██▏       | 23840/110379 [00:34<02:00, 716.47 examples/s]Map:  21%|██        | 22683/110379 [00:34<02:07, 689.92 examples/s]Map:  22%|██▏       | 24484/110379 [00:35<02:03, 696.56 examples/s]Map:  22%|██▏       | 23942/110379 [00:34<02:03, 701.83 examples/s]Map:  21%|██        | 22787/110379 [00:34<02:07, 687.39 examples/s]Map:  21%|██        | 23036/110379 [00:35<02:36, 558.32 examples/s]Map:  22%|██▏       | 24591/110379 [00:35<02:03, 697.43 examples/s]Map:  21%|██        | 22859/110379 [00:34<02:06, 691.15 examples/s]Map:  21%|██        | 23114/110379 [00:35<02:25, 601.31 examples/s]Map:  22%|██▏       | 24668/110379 [00:35<01:59, 714.69 examples/s]Map:  22%|██▏       | 24038/110379 [00:34<02:35, 555.61 examples/s]Map:  21%|██        | 23189/110379 [00:35<02:18, 631.48 examples/s]Map:  21%|██        | 22958/110379 [00:34<02:09, 675.94 examples/s]Map:  22%|██▏       | 24771/110379 [00:35<02:02, 699.50 examples/s]Map:  22%|██▏       | 24111/110379 [00:34<02:26, 588.41 examples/s]Map:  21%|██        | 23261/110379 [00:35<02:13, 651.81 examples/s]Map:  21%|██        | 23337/110379 [00:35<02:08, 675.11 examples/s]Map:  23%|██▎       | 24864/110379 [00:35<02:08, 667.15 examples/s]Map:  22%|██▏       | 24204/110379 [00:34<02:25, 593.17 examples/s]Map:  21%|██        | 23029/110379 [00:34<02:59, 485.53 examples/s]Map:  21%|██        | 23408/110379 [00:35<02:07, 681.92 examples/s]Map:  22%|██▏       | 24269/110379 [00:34<02:22, 604.91 examples/s]Map:  23%|██▎       | 24955/110379 [00:35<02:12, 643.64 examples/s]Map:  21%|██        | 23097/110379 [00:34<02:47, 522.25 examples/s]Map:  21%|██▏       | 23488/110379 [00:35<02:01, 712.65 examples/s]Map:  22%|██▏       | 24338/110379 [00:35<02:17, 624.17 examples/s]Map:  21%|██        | 23173/110379 [00:35<02:32, 571.70 examples/s]Map:  21%|██▏       | 23562/110379 [00:35<02:01, 715.04 examples/s]Map:  22%|██▏       | 24428/110379 [00:35<02:20, 611.81 examples/s]Map:  21%|██        | 23239/110379 [00:35<02:27, 591.21 examples/s]Map:  23%|██▎       | 25029/110379 [00:36<02:52, 496.13 examples/s]Map:  21%|██▏       | 23662/110379 [00:36<02:05, 690.40 examples/s]Map:  22%|██▏       | 24497/110379 [00:35<02:16, 628.78 examples/s]Map:  21%|██        | 23306/110379 [00:35<02:22, 609.92 examples/s]Map:  23%|██▎       | 25097/110379 [00:36<02:40, 530.94 examples/s]Map:  22%|██▏       | 23737/110379 [00:36<02:03, 702.69 examples/s]Map:  22%|██▏       | 24570/110379 [00:35<02:11, 652.98 examples/s]Map:  21%|██        | 23377/110379 [00:35<02:16, 635.19 examples/s]Map:  23%|██▎       | 25169/110379 [00:36<02:30, 567.68 examples/s]Map:  22%|██▏       | 23815/110379 [00:36<02:00, 721.01 examples/s]Map:  22%|██▏       | 24645/110379 [00:35<02:06, 677.30 examples/s]Map:  21%|██        | 23453/110379 [00:35<02:10, 667.07 examples/s]Map:  23%|██▎       | 25245/110379 [00:36<02:19, 611.74 examples/s]Map:  22%|██▏       | 24725/110379 [00:35<02:01, 707.88 examples/s]Map:  21%|██▏       | 23528/110379 [00:35<02:06, 687.88 examples/s]Map:  22%|██▏       | 23924/110379 [00:36<02:00, 718.25 examples/s]Map:  23%|██▎       | 25317/110379 [00:36<02:13, 636.42 examples/s]Map:  22%|██▏       | 24805/110379 [00:35<01:57, 729.31 examples/s]Map:  21%|██▏       | 23604/110379 [00:35<02:03, 705.29 examples/s]Map:  22%|██▏       | 23997/110379 [00:36<01:59, 720.84 examples/s]Map:  23%|██▎       | 25392/110379 [00:36<02:08, 662.06 examples/s]Map:  23%|██▎       | 24879/110379 [00:35<01:57, 729.11 examples/s]Map:  21%|██▏       | 23685/110379 [00:35<01:57, 735.11 examples/s]Map:  23%|██▎       | 25461/110379 [00:36<02:07, 667.91 examples/s]Map:  23%|██▎       | 24958/110379 [00:35<01:54, 744.54 examples/s]Map:  22%|██▏       | 23766/110379 [00:35<01:55, 753.04 examples/s]Map:  22%|██▏       | 24075/110379 [00:36<02:38, 545.14 examples/s]Map:  23%|██▎       | 25560/110379 [00:36<02:08, 661.66 examples/s]Map:  22%|██▏       | 24159/110379 [00:36<02:21, 608.45 examples/s]Map:  22%|██▏       | 23860/110379 [00:36<02:03, 699.72 examples/s]Map:  23%|██▎       | 25634/110379 [00:36<02:04, 680.21 examples/s]Map:  23%|██▎       | 25033/110379 [00:36<02:50, 499.86 examples/s]Map:  22%|██▏       | 24232/110379 [00:36<02:16, 632.12 examples/s]Map:  23%|██▎       | 25707/110379 [00:36<02:02, 688.96 examples/s]Map:  22%|██▏       | 23948/110379 [00:36<02:12, 652.46 examples/s]Map:  22%|██▏       | 24304/110379 [00:37<02:12, 652.03 examples/s]Map:  23%|██▎       | 25116/110379 [00:36<02:45, 513.81 examples/s]Map:  23%|██▎       | 25809/110379 [00:37<02:03, 685.35 examples/s]Map:  22%|██▏       | 24375/110379 [00:37<02:09, 666.02 examples/s]Map:  23%|██▎       | 25884/110379 [00:37<02:01, 696.89 examples/s]Map:  23%|██▎       | 25200/110379 [00:36<02:42, 524.45 examples/s]Map:  22%|██▏       | 24446/110379 [00:37<02:07, 676.04 examples/s]Map:  22%|██▏       | 24031/110379 [00:36<03:07, 460.40 examples/s]Map:  24%|██▎       | 25957/110379 [00:37<02:00, 700.87 examples/s]Map:  23%|██▎       | 25286/110379 [00:36<02:39, 534.86 examples/s]Map:  22%|██▏       | 24538/110379 [00:37<02:11, 650.40 examples/s]Map:  22%|██▏       | 24091/110379 [00:36<02:57, 485.90 examples/s]Map:  22%|██▏       | 24155/110379 [00:36<02:46, 517.68 examples/s]Map:  22%|██▏       | 24640/110379 [00:37<02:10, 657.84 examples/s]Map:  23%|██▎       | 25374/110379 [00:36<02:35, 546.87 examples/s]Map:  24%|██▎       | 26035/110379 [00:37<02:46, 505.99 examples/s]Map:  22%|██▏       | 24217/110379 [00:36<02:40, 537.87 examples/s]Map:  23%|██▎       | 25457/110379 [00:36<02:19, 607.08 examples/s]Map:  22%|██▏       | 24715/110379 [00:37<02:06, 676.62 examples/s]Map:  24%|██▎       | 26110/110379 [00:37<02:31, 555.89 examples/s]Map:  22%|██▏       | 24283/110379 [00:36<02:32, 565.83 examples/s]Map:  23%|██▎       | 25532/110379 [00:37<02:12, 638.45 examples/s]Map:  22%|██▏       | 24788/110379 [00:37<02:04, 688.68 examples/s]Map:  24%|██▎       | 26184/110379 [00:37<02:20, 597.17 examples/s]Map:  22%|██▏       | 24344/110379 [00:36<02:29, 575.45 examples/s]Map:  23%|██▎       | 25609/110379 [00:37<02:06, 669.81 examples/s]Map:  23%|██▎       | 24859/110379 [00:37<02:04, 689.50 examples/s]Map:  24%|██▍       | 26255/110379 [00:37<02:15, 622.52 examples/s]Map:  22%|██▏       | 24411/110379 [00:37<02:23, 599.12 examples/s]Map:  23%|██▎       | 25686/110379 [00:37<02:02, 691.63 examples/s]Map:  23%|██▎       | 24929/110379 [00:37<02:04, 685.97 examples/s]Map:  24%|██▍       | 26324/110379 [00:38<02:11, 638.79 examples/s]Map:  22%|██▏       | 24487/110379 [00:37<02:13, 641.70 examples/s]Map:  23%|██▎       | 25763/110379 [00:37<01:58, 712.50 examples/s]Map:  24%|██▍       | 26403/110379 [00:38<02:04, 676.82 examples/s]Map:  22%|██▏       | 24563/110379 [00:37<02:07, 674.91 examples/s]Map:  23%|██▎       | 25842/110379 [00:37<01:55, 731.23 examples/s]Map:  23%|██▎       | 25000/110379 [00:38<02:45, 514.46 examples/s]Map:  24%|██▍       | 26475/110379 [00:38<02:03, 681.95 examples/s]Map:  22%|██▏       | 24642/110379 [00:37<02:03, 695.07 examples/s]Map:  23%|██▎       | 25078/110379 [00:38<02:29, 572.39 examples/s]Map:  24%|██▎       | 25955/110379 [00:37<01:54, 734.67 examples/s]Map:  22%|██▏       | 24717/110379 [00:37<02:01, 704.44 examples/s]Map:  24%|██▍       | 26580/110379 [00:38<02:03, 680.57 examples/s]Map:  23%|██▎       | 25153/110379 [00:38<02:18, 613.74 examples/s]Map:  22%|██▏       | 24790/110379 [00:37<02:00, 710.38 examples/s]Map:  24%|██▍       | 26650/110379 [00:38<02:02, 684.73 examples/s]Map:  23%|██▎       | 25223/110379 [00:38<02:14, 632.96 examples/s]Map:  23%|██▎       | 24870/110379 [00:37<01:56, 734.07 examples/s]Map:  24%|██▎       | 26036/110379 [00:37<02:30, 558.86 examples/s]Map:  24%|██▍       | 26720/110379 [00:38<02:01, 687.61 examples/s]Map:  23%|██▎       | 25296/110379 [00:38<02:09, 655.90 examples/s]Map:  23%|██▎       | 24948/110379 [00:37<01:55, 741.47 examples/s]Map:  24%|██▎       | 26107/110379 [00:37<02:23, 588.47 examples/s]Map:  24%|██▍       | 26819/110379 [00:38<02:03, 674.61 examples/s]Map:  23%|██▎       | 25393/110379 [00:38<02:10, 649.22 examples/s]Map:  24%|██▎       | 26172/110379 [00:38<02:20, 600.24 examples/s]Map:  24%|██▍       | 26911/110379 [00:38<02:08, 649.85 examples/s]Map:  24%|██▍       | 26241/110379 [00:38<02:16, 614.84 examples/s]Map:  23%|██▎       | 25474/110379 [00:38<02:19, 610.56 examples/s]Map:  23%|██▎       | 25024/110379 [00:38<02:58, 477.17 examples/s]Map:  24%|██▍       | 26331/110379 [00:38<02:18, 608.51 examples/s]Map:  24%|██▍       | 26993/110379 [00:39<02:15, 613.86 examples/s]Map:  23%|██▎       | 25550/110379 [00:39<02:27, 574.52 examples/s]Map:  23%|██▎       | 25099/110379 [00:38<02:57, 480.85 examples/s]Map:  24%|██▍       | 26398/110379 [00:38<02:15, 619.42 examples/s]Map:  23%|██▎       | 25635/110379 [00:39<02:28, 571.38 examples/s]Map:  24%|██▍       | 26463/110379 [00:38<02:13, 626.64 examples/s]Map:  23%|██▎       | 25170/110379 [00:38<02:59, 475.24 examples/s]Map:  25%|██▍       | 27069/110379 [00:39<02:53, 481.10 examples/s]Map:  23%|██▎       | 25697/110379 [00:39<02:26, 578.37 examples/s]Map:  25%|██▍       | 27142/110379 [00:39<02:36, 530.39 examples/s]Map:  24%|██▍       | 26552/110379 [00:38<02:17, 611.78 examples/s]Map:  23%|██▎       | 25244/110379 [00:38<02:57, 479.41 examples/s]Map:  25%|██▍       | 27212/110379 [00:39<02:26, 567.77 examples/s]Map:  23%|██▎       | 25775/110379 [00:39<02:33, 551.04 examples/s]Map:  23%|██▎       | 25316/110379 [00:38<02:40, 530.29 examples/s]Map:  24%|██▍       | 26644/110379 [00:38<02:17, 607.72 examples/s]Map:  25%|██▍       | 27283/110379 [00:39<02:18, 598.24 examples/s]Map:  23%|██▎       | 25832/110379 [00:39<02:32, 553.26 examples/s]Map:  23%|██▎       | 25391/110379 [00:38<02:26, 580.91 examples/s]Map:  25%|██▍       | 27349/110379 [00:39<02:15, 610.87 examples/s]Map:  24%|██▍       | 26736/110379 [00:38<02:17, 606.80 examples/s]Map:  23%|██▎       | 25464/110379 [00:38<02:18, 615.25 examples/s]Map:  23%|██▎       | 25918/110379 [00:39<02:31, 557.60 examples/s]Map:  25%|██▍       | 27423/110379 [00:39<02:08, 643.34 examples/s]Map:  23%|██▎       | 25538/110379 [00:38<02:11, 646.54 examples/s]Map:  24%|██▎       | 25986/110379 [00:39<02:24, 585.60 examples/s]Map:  24%|██▍       | 26830/110379 [00:39<02:17, 608.45 examples/s]Map:  25%|██▍       | 27491/110379 [00:39<02:06, 652.92 examples/s]Map:  24%|██▍       | 26896/110379 [00:39<02:14, 619.29 examples/s]Map:  23%|██▎       | 25641/110379 [00:39<02:08, 658.01 examples/s]Map:  25%|██▍       | 27559/110379 [00:39<02:06, 657.07 examples/s]Map:  23%|██▎       | 25715/110379 [00:39<02:06, 670.55 examples/s]Map:  25%|██▌       | 27636/110379 [00:40<02:00, 687.97 examples/s]Map:  24%|██▎       | 26071/110379 [00:40<02:59, 469.12 examples/s]Map:  24%|██▍       | 26983/110379 [00:39<02:17, 606.09 examples/s]Map:  24%|██▎       | 26142/110379 [00:40<02:42, 518.77 examples/s]Map:  25%|██▌       | 27712/110379 [00:40<01:57, 704.60 examples/s]Map:  23%|██▎       | 25819/110379 [00:39<02:04, 677.20 examples/s]Map:  25%|██▌       | 27787/110379 [00:40<01:55, 715.50 examples/s]Map:  24%|██▎       | 26205/110379 [00:40<02:35, 542.09 examples/s]Map:  23%|██▎       | 25893/110379 [00:39<02:02, 689.55 examples/s]Map:  25%|██▍       | 27058/110379 [00:39<03:07, 443.25 examples/s]Map:  25%|██▌       | 27886/110379 [00:40<01:59, 690.12 examples/s]Map:  24%|██▍       | 26294/110379 [00:40<02:31, 555.68 examples/s]Map:  24%|██▎       | 25989/110379 [00:39<02:06, 668.80 examples/s]Map:  25%|██▍       | 27124/110379 [00:39<02:52, 482.56 examples/s]Map:  25%|██▌       | 27962/110379 [00:40<01:57, 704.09 examples/s]Map:  24%|██▍       | 26355/110379 [00:40<02:28, 565.63 examples/s]Map:  25%|██▍       | 27199/110379 [00:39<02:34, 537.85 examples/s]Map:  24%|██▍       | 26416/110379 [00:40<02:26, 574.61 examples/s]Map:  25%|██▍       | 27280/110379 [00:39<02:18, 598.11 examples/s]Map:  24%|██▍       | 26483/110379 [00:40<02:19, 599.36 examples/s]Map:  24%|██▎       | 26062/110379 [00:39<02:58, 472.94 examples/s]Map:  25%|██▌       | 28034/110379 [00:40<02:36, 524.86 examples/s]Map:  25%|██▍       | 27358/110379 [00:40<02:09, 640.43 examples/s]Map:  24%|██▍       | 26553/110379 [00:40<02:14, 624.46 examples/s]Map:  24%|██▎       | 26123/110379 [00:40<02:49, 496.07 examples/s]Map:  25%|██▌       | 28113/110379 [00:40<02:21, 583.01 examples/s]Map:  25%|██▍       | 27432/110379 [00:40<02:04, 665.11 examples/s]Map:  24%|██▍       | 26620/110379 [00:40<02:12, 631.19 examples/s]Map:  24%|██▎       | 26191/110379 [00:40<02:38, 532.26 examples/s]Map:  25%|██▍       | 27508/110379 [00:40<02:00, 688.43 examples/s]Map:  26%|██▌       | 28214/110379 [00:41<02:14, 609.95 examples/s]Map:  24%|██▍       | 26263/110379 [00:40<02:26, 575.02 examples/s]Map:  25%|██▍       | 27586/110379 [00:40<01:56, 711.96 examples/s]Map:  24%|██▍       | 26706/110379 [00:41<02:18, 603.26 examples/s]Map:  26%|██▌       | 28287/110379 [00:41<02:09, 635.06 examples/s]Map:  24%|██▍       | 26331/110379 [00:40<02:19, 600.82 examples/s]Map:  24%|██▍       | 26768/110379 [00:41<02:18, 602.18 examples/s]Map:  25%|██▌       | 27700/110379 [00:40<01:53, 726.32 examples/s]Map:  24%|██▍       | 26403/110379 [00:40<02:13, 629.84 examples/s]Map:  26%|██▌       | 28372/110379 [00:41<02:14, 608.76 examples/s]Map:  24%|██▍       | 26832/110379 [00:41<02:17, 607.75 examples/s]Map:  24%|██▍       | 26473/110379 [00:40<02:10, 644.28 examples/s]Map:  24%|██▍       | 26894/110379 [00:41<02:17, 607.90 examples/s]Map:  26%|██▌       | 28455/110379 [00:41<02:20, 585.04 examples/s]Map:  25%|██▌       | 27803/110379 [00:40<02:10, 631.91 examples/s]Map:  24%|██▍       | 26545/110379 [00:40<02:06, 661.35 examples/s]Map:  24%|██▍       | 26987/110379 [00:41<02:17, 607.73 examples/s]Map:  24%|██▍       | 26616/110379 [00:40<02:04, 672.45 examples/s]Map:  26%|██▌       | 28533/110379 [00:41<02:26, 560.49 examples/s]Map:  25%|██▌       | 27891/110379 [00:40<02:14, 613.65 examples/s]Map:  24%|██▍       | 26694/110379 [00:40<01:59, 698.78 examples/s]Map:  26%|██▌       | 28593/110379 [00:41<02:23, 568.61 examples/s]Map:  25%|██▌       | 27956/110379 [00:40<02:13, 619.56 examples/s]Map:  24%|██▍       | 26767/110379 [00:40<01:58, 705.53 examples/s]Map:  26%|██▌       | 28661/110379 [00:41<02:18, 591.67 examples/s]Map:  25%|██▍       | 27062/110379 [00:41<03:02, 455.87 examples/s]Map:  26%|██▌       | 28722/110379 [00:41<02:16, 596.17 examples/s]Map:  24%|██▍       | 26864/110379 [00:41<02:02, 682.07 examples/s]Map:  25%|██▍       | 27128/110379 [00:41<02:48, 493.98 examples/s]Map:  25%|██▌       | 28037/110379 [00:41<02:56, 466.27 examples/s]Map:  26%|██▌       | 28791/110379 [00:41<02:12, 617.41 examples/s]Map:  25%|██▍       | 27198/110379 [00:42<02:34, 538.91 examples/s]Map:  24%|██▍       | 26954/110379 [00:41<02:08, 648.22 examples/s]Map:  25%|██▌       | 28100/110379 [00:41<02:45, 496.48 examples/s]Map:  26%|██▌       | 28869/110379 [00:42<02:03, 659.64 examples/s]Map:  25%|██▍       | 27261/110379 [00:42<02:28, 557.86 examples/s]Map:  26%|██▌       | 28166/110379 [00:41<02:35, 530.16 examples/s]Map:  26%|██▌       | 28943/110379 [00:42<01:59, 681.24 examples/s]Map:  25%|██▍       | 27323/110379 [00:42<02:25, 570.74 examples/s]Map:  26%|██▌       | 28230/110379 [00:41<02:28, 554.97 examples/s]Map:  25%|██▍       | 27386/110379 [00:42<02:22, 583.20 examples/s]Map:  24%|██▍       | 27027/110379 [00:41<03:05, 449.11 examples/s]Map:  26%|██▌       | 28318/110379 [00:41<02:25, 564.24 examples/s]Map:  25%|██▍       | 27449/110379 [00:42<02:19, 595.58 examples/s]Map:  26%|██▋       | 29032/110379 [00:42<02:41, 503.66 examples/s]Map:  25%|██▍       | 27096/110379 [00:41<02:48, 494.78 examples/s]Map:  26%|██▌       | 28395/110379 [00:41<02:13, 612.89 examples/s]Map:  26%|██▋       | 29109/110379 [00:42<02:25, 559.58 examples/s]Map:  25%|██▍       | 27164/110379 [00:41<02:36, 533.30 examples/s]Map:  25%|██▍       | 27542/110379 [00:42<02:17, 603.11 examples/s]Map:  26%|██▌       | 28470/110379 [00:41<02:07, 642.92 examples/s]Map:  26%|██▋       | 29179/110379 [00:42<02:17, 590.74 examples/s]Map:  25%|██▍       | 27238/110379 [00:41<02:25, 569.79 examples/s]Map:  26%|██▌       | 28547/110379 [00:42<02:01, 675.22 examples/s]Map:  25%|██▌       | 27635/110379 [00:42<02:16, 604.12 examples/s]Map:  25%|██▍       | 27318/110379 [00:41<02:12, 624.52 examples/s]Map:  27%|██▋       | 29284/110379 [00:42<02:09, 625.72 examples/s]Map:  26%|██▌       | 28625/110379 [00:42<01:56, 702.53 examples/s]Map:  25%|██▌       | 27704/110379 [00:42<02:12, 623.80 examples/s]Map:  25%|██▍       | 27397/110379 [00:42<02:04, 666.44 examples/s]Map:  27%|██▋       | 29357/110379 [00:42<02:04, 648.98 examples/s]Map:  26%|██▌       | 28699/110379 [00:42<01:55, 709.94 examples/s]Map:  25%|██▌       | 27779/110379 [00:42<02:05, 655.87 examples/s]Map:  25%|██▍       | 27468/110379 [00:42<02:02, 677.15 examples/s]Map:  27%|██▋       | 29432/110379 [00:43<02:00, 669.69 examples/s]Map:  26%|██▌       | 28773/110379 [00:42<01:54, 715.41 examples/s]Map:  25%|██▌       | 27860/110379 [00:43<01:58, 697.19 examples/s]Map:  25%|██▍       | 27540/110379 [00:42<02:00, 685.09 examples/s]Map:  25%|██▌       | 27931/110379 [00:43<01:58, 698.20 examples/s]Map:  27%|██▋       | 29534/110379 [00:43<02:00, 672.49 examples/s]Map:  26%|██▌       | 28869/110379 [00:42<01:59, 682.42 examples/s]Map:  25%|██▌       | 27645/110379 [00:42<02:00, 684.05 examples/s]Map:  27%|██▋       | 29604/110379 [00:43<01:59, 677.59 examples/s]Map:  26%|██▌       | 28940/110379 [00:42<01:58, 685.60 examples/s]Map:  25%|██▌       | 27725/110379 [00:42<01:56, 710.31 examples/s]Map:  27%|██▋       | 29681/110379 [00:43<01:55, 698.87 examples/s]Map:  25%|██▌       | 28038/110379 [00:43<02:32, 539.51 examples/s]Map:  25%|██▌       | 27798/110379 [00:42<01:55, 712.93 examples/s]Map:  25%|██▌       | 28106/110379 [00:43<02:24, 567.85 examples/s]Map:  27%|██▋       | 29789/110379 [00:43<01:54, 704.59 examples/s]Map:  25%|██▌       | 27873/110379 [00:42<01:54, 719.96 examples/s]Map:  26%|██▋       | 29038/110379 [00:42<02:33, 531.58 examples/s]Map:  26%|██▌       | 28171/110379 [00:43<02:21, 582.94 examples/s]Map:  26%|██▋       | 29111/110379 [00:42<02:22, 571.62 examples/s]Map:  27%|██▋       | 29893/110379 [00:43<01:55, 696.62 examples/s]Map:  25%|██▌       | 27964/110379 [00:42<02:02, 671.54 examples/s]Map:  26%|██▌       | 28237/110379 [00:43<02:17, 599.57 examples/s]Map:  26%|██▋       | 29191/110379 [00:43<02:10, 622.60 examples/s]Map:  27%|██▋       | 29966/110379 [00:43<01:54, 702.29 examples/s]Map:  27%|██▋       | 29267/110379 [00:43<02:03, 656.30 examples/s]Map:  26%|██▌       | 28331/110379 [00:43<02:16, 601.96 examples/s]Map:  25%|██▌       | 28037/110379 [00:43<02:39, 517.46 examples/s]Map:  27%|██▋       | 29338/110379 [00:43<02:01, 665.39 examples/s]Map:  26%|██▌       | 28394/110379 [00:43<02:15, 603.79 examples/s]Map:  27%|██▋       | 30037/110379 [00:44<02:33, 522.52 examples/s]Map:  25%|██▌       | 28118/110379 [00:43<02:21, 579.36 examples/s]Map:  27%|██▋       | 29409/110379 [00:43<02:00, 672.94 examples/s]Map:  26%|██▌       | 28468/110379 [00:44<02:08, 636.92 examples/s]Map:  27%|██▋       | 30119/110379 [00:44<02:17, 584.57 examples/s]Map:  26%|██▌       | 28197/110379 [00:43<02:11, 626.61 examples/s]Map:  27%|██▋       | 29482/110379 [00:43<01:58, 683.51 examples/s]Map:  26%|██▌       | 28546/110379 [00:44<02:01, 674.62 examples/s]Map:  27%|██▋       | 30195/110379 [00:44<02:09, 620.91 examples/s]Map:  26%|██▌       | 28274/110379 [00:43<02:04, 661.26 examples/s]Map:  27%|██▋       | 29553/110379 [00:43<01:57, 687.33 examples/s]Map:  26%|██▌       | 28618/110379 [00:44<01:59, 686.63 examples/s]Map:  27%|██▋       | 30269/110379 [00:44<02:04, 645.57 examples/s]Map:  27%|██▋       | 29630/110379 [00:43<01:54, 707.19 examples/s]Map:  26%|██▌       | 28374/110379 [00:43<02:04, 658.18 examples/s]Map:  26%|██▌       | 28692/110379 [00:44<01:57, 698.14 examples/s]Map:  27%|██▋       | 30343/110379 [00:44<01:59, 668.84 examples/s]Map:  27%|██▋       | 29732/110379 [00:43<01:56, 693.47 examples/s]Map:  26%|██▌       | 28471/110379 [00:43<02:06, 647.73 examples/s]Map:  26%|██▌       | 28787/110379 [00:44<02:01, 669.02 examples/s]Map:  28%|██▊       | 30435/110379 [00:44<02:04, 642.51 examples/s]Map:  27%|██▋       | 29815/110379 [00:43<01:50, 727.57 examples/s]Map:  26%|██▌       | 28546/110379 [00:43<02:01, 672.03 examples/s]Map:  26%|██▌       | 28858/110379 [00:44<02:00, 677.27 examples/s]Map:  28%|██▊       | 30504/110379 [00:44<02:03, 648.51 examples/s]Map:  27%|██▋       | 29891/110379 [00:43<01:49, 731.77 examples/s]Map:  26%|██▌       | 28937/110379 [00:44<01:55, 706.91 examples/s]Map:  26%|██▌       | 28624/110379 [00:43<01:57, 695.00 examples/s]Map:  28%|██▊       | 30599/110379 [00:44<02:04, 639.25 examples/s]Map:  27%|██▋       | 29976/110379 [00:44<01:45, 760.99 examples/s]Map:  26%|██▌       | 28699/110379 [00:44<01:56, 701.26 examples/s]Map:  28%|██▊       | 30682/110379 [00:44<01:56, 682.85 examples/s]Map:  26%|██▌       | 28771/110379 [00:44<01:56, 703.49 examples/s]Map:  26%|██▋       | 29034/110379 [00:44<02:28, 548.79 examples/s]Map:  28%|██▊       | 30754/110379 [00:45<01:55, 690.64 examples/s]Map:  26%|██▌       | 28851/110379 [00:44<01:52, 724.94 examples/s]Map:  27%|██▋       | 30072/110379 [00:44<02:21, 568.88 examples/s]Map:  26%|██▋       | 29118/110379 [00:45<02:13, 610.35 examples/s]Map:  28%|██▊       | 30830/110379 [00:45<01:53, 699.57 examples/s]Map:  26%|██▌       | 28929/110379 [00:44<01:50, 738.37 examples/s]Map:  27%|██▋       | 30148/110379 [00:44<02:11, 609.60 examples/s]Map:  26%|██▋       | 29199/110379 [00:45<02:04, 654.46 examples/s]Map:  28%|██▊       | 30916/110379 [00:45<01:47, 741.71 examples/s]Map:  27%|██▋       | 30229/110379 [00:44<02:02, 655.04 examples/s]Map:  27%|██▋       | 29273/110379 [00:45<02:00, 670.61 examples/s]Map:  28%|██▊       | 30998/110379 [00:45<01:44, 760.09 examples/s]Map:  27%|██▋       | 30306/110379 [00:44<01:57, 682.88 examples/s]Map:  27%|██▋       | 29350/110379 [00:45<01:56, 695.19 examples/s]Map:  26%|██▋       | 29033/110379 [00:44<02:27, 553.00 examples/s]Map:  28%|██▊       | 30386/110379 [00:44<01:52, 712.53 examples/s]Map:  27%|██▋       | 29427/110379 [00:45<01:53, 712.65 examples/s]Map:  26%|██▋       | 29107/110379 [00:44<02:17, 593.01 examples/s]Map:  28%|██▊       | 31077/110379 [00:45<02:22, 557.01 examples/s]Map:  28%|██▊       | 30464/110379 [00:44<01:49, 729.54 examples/s]Map:  26%|██▋       | 29187/110379 [00:44<02:06, 639.78 examples/s]Map:  27%|██▋       | 29538/110379 [00:45<01:52, 716.97 examples/s]Map:  28%|██▊       | 31156/110379 [00:45<02:10, 607.94 examples/s]Map:  28%|██▊       | 30546/110379 [00:44<01:46, 750.38 examples/s]Map:  27%|██▋       | 29262/110379 [00:44<02:02, 664.42 examples/s]Map:  27%|██▋       | 29615/110379 [00:45<01:51, 725.01 examples/s]Map:  28%|██▊       | 31234/110379 [00:45<02:02, 647.40 examples/s]Map:  27%|██▋       | 29338/110379 [00:44<01:57, 688.48 examples/s]Map:  28%|██▊       | 30663/110379 [00:45<01:45, 756.11 examples/s]Map:  28%|██▊       | 31306/110379 [00:45<01:59, 663.36 examples/s]Map:  27%|██▋       | 29715/110379 [00:45<01:55, 699.81 examples/s]Map:  27%|██▋       | 29437/110379 [00:45<01:59, 674.77 examples/s]Map:  28%|██▊       | 31378/110379 [00:45<01:56, 675.96 examples/s]Map:  28%|██▊       | 30773/110379 [00:45<01:46, 745.38 examples/s]Map:  27%|██▋       | 29793/110379 [00:46<01:52, 717.18 examples/s]Map:  27%|██▋       | 29510/110379 [00:45<01:57, 685.84 examples/s]Map:  28%|██▊       | 31455/110379 [00:46<01:52, 698.77 examples/s]Map:  28%|██▊       | 30852/110379 [00:45<01:45, 751.30 examples/s]Map:  27%|██▋       | 29868/110379 [00:46<01:51, 724.33 examples/s]Map:  27%|██▋       | 29585/110379 [00:45<01:55, 700.62 examples/s]Map:  29%|██▊       | 31538/110379 [00:46<01:47, 732.24 examples/s]Map:  28%|██▊       | 30929/110379 [00:45<01:45, 754.38 examples/s]Map:  27%|██▋       | 29947/110379 [00:46<01:49, 735.96 examples/s]Map:  27%|██▋       | 29664/110379 [00:45<01:51, 721.09 examples/s]Map:  29%|██▊       | 31617/110379 [00:46<01:45, 744.80 examples/s]Map:  27%|██▋       | 29773/110379 [00:45<01:51, 721.33 examples/s]Map:  29%|██▊       | 31727/110379 [00:46<01:46, 736.64 examples/s]Map:  27%|██▋       | 30039/110379 [00:46<02:23, 560.98 examples/s]Map:  28%|██▊       | 31038/110379 [00:45<02:17, 577.45 examples/s]Map:  27%|██▋       | 29847/110379 [00:45<01:51, 724.31 examples/s]Map:  27%|██▋       | 30118/110379 [00:46<02:11, 609.85 examples/s]Map:  28%|██▊       | 31116/110379 [00:45<02:08, 618.87 examples/s]Map:  29%|██▉       | 31831/110379 [00:46<01:49, 715.79 examples/s]Map:  27%|██▋       | 29929/110379 [00:45<01:47, 745.25 examples/s]Map:  27%|██▋       | 30194/110379 [00:46<02:04, 642.42 examples/s]Map:  28%|██▊       | 31189/110379 [00:45<02:03, 641.94 examples/s]Map:  29%|██▉       | 31936/110379 [00:46<01:50, 708.02 examples/s]Map:  28%|██▊       | 31264/110379 [00:46<01:59, 664.47 examples/s]Map:  27%|██▋       | 30287/110379 [00:46<02:06, 632.59 examples/s]Map:  28%|██▊       | 31346/110379 [00:46<01:52, 701.89 examples/s]Map:  27%|██▋       | 30037/110379 [00:46<02:24, 557.68 examples/s]Map:  28%|██▊       | 30380/110379 [00:46<02:07, 625.67 examples/s]Map:  28%|██▊       | 31422/110379 [00:46<01:50, 714.33 examples/s]Map:  29%|██▉       | 32037/110379 [00:47<02:20, 559.28 examples/s]Map:  27%|██▋       | 30110/110379 [00:46<02:15, 592.52 examples/s]Map:  28%|██▊       | 30457/110379 [00:47<02:01, 656.79 examples/s]Map:  29%|██▊       | 31503/110379 [00:46<01:46, 740.48 examples/s]Map:  29%|██▉       | 32114/110379 [00:47<02:10, 599.02 examples/s]Map:  27%|██▋       | 30189/110379 [00:46<02:06, 635.37 examples/s]Map:  28%|██▊       | 30536/110379 [00:47<01:56, 687.98 examples/s]Map:  29%|██▊       | 31583/110379 [00:46<01:44, 753.07 examples/s]Map:  29%|██▉       | 32191/110379 [00:47<02:03, 634.01 examples/s]Map:  27%|██▋       | 30265/110379 [00:46<02:01, 662.03 examples/s]Map:  29%|██▉       | 32261/110379 [00:47<02:00, 647.83 examples/s]Map:  28%|██▊       | 30615/110379 [00:47<02:06, 628.66 examples/s]Map:  29%|██▊       | 31689/110379 [00:46<01:47, 730.28 examples/s]Map:  28%|██▊       | 30358/110379 [00:46<02:04, 644.41 examples/s]Map:  29%|██▉       | 32357/110379 [00:47<02:01, 643.73 examples/s]Map:  28%|██▊       | 30696/110379 [00:47<02:13, 597.51 examples/s]Map:  29%|██▉       | 31801/110379 [00:46<01:47, 731.37 examples/s]Map:  28%|██▊       | 30446/110379 [00:46<02:08, 621.92 examples/s]Map:  29%|██▉       | 31884/110379 [00:46<01:44, 751.25 examples/s]Map:  29%|██▉       | 32452/110379 [00:47<02:02, 633.90 examples/s]Map:  28%|██▊       | 30782/110379 [00:47<02:15, 585.31 examples/s]Map:  28%|██▊       | 30513/110379 [00:46<02:06, 630.53 examples/s]Map:  28%|██▊       | 30586/110379 [00:46<02:02, 653.70 examples/s]Map:  29%|██▉       | 32537/110379 [00:47<02:07, 609.63 examples/s]Map:  28%|██▊       | 30862/110379 [00:47<02:20, 565.23 examples/s]Map:  29%|██▉       | 32000/110379 [00:47<02:12, 591.49 examples/s]Map:  30%|██▉       | 32610/110379 [00:47<02:02, 634.42 examples/s]Map:  28%|██▊       | 30684/110379 [00:47<02:03, 643.20 examples/s]Map:  28%|██▊       | 30938/110379 [00:47<02:26, 542.76 examples/s]Map:  29%|██▉       | 32074/110379 [00:47<02:06, 620.42 examples/s]Map:  30%|██▉       | 32681/110379 [00:47<01:59, 651.83 examples/s]Map:  28%|██▊       | 30998/110379 [00:48<02:23, 555.10 examples/s]Map:  28%|██▊       | 30773/110379 [00:47<02:07, 625.22 examples/s]Map:  29%|██▉       | 32154/110379 [00:47<01:58, 657.43 examples/s]Map:  30%|██▉       | 32753/110379 [00:48<01:56, 668.64 examples/s]Map:  29%|██▉       | 32235/110379 [00:47<01:52, 692.85 examples/s]Map:  30%|██▉       | 32826/110379 [00:48<01:54, 678.89 examples/s]Map:  28%|██▊       | 30860/110379 [00:47<02:11, 605.32 examples/s]Map:  29%|██▉       | 32313/110379 [00:47<01:49, 712.69 examples/s]Map:  28%|██▊       | 31060/110379 [00:48<03:12, 411.81 examples/s]Map:  30%|██▉       | 32913/110379 [00:48<02:02, 632.01 examples/s]Map:  28%|██▊       | 30956/110379 [00:47<02:09, 613.45 examples/s]Map:  29%|██▉       | 32393/110379 [00:47<01:46, 734.00 examples/s]Map:  28%|██▊       | 31125/110379 [00:48<02:52, 458.73 examples/s]Map:  30%|██▉       | 32978/110379 [00:48<02:02, 633.90 examples/s]Map:  28%|██▊       | 31194/110379 [00:48<02:36, 506.49 examples/s]Map:  29%|██▉       | 32510/110379 [00:47<01:44, 746.06 examples/s]Map:  28%|██▊       | 31268/110379 [00:48<02:21, 558.99 examples/s]Map:  28%|██▊       | 31035/110379 [00:47<02:45, 479.17 examples/s]Map:  30%|██▉       | 32616/110379 [00:47<01:46, 730.92 examples/s]Map:  28%|██▊       | 31339/110379 [00:48<02:12, 595.82 examples/s]Map:  28%|██▊       | 31094/110379 [00:47<02:38, 499.86 examples/s]Map:  30%|██▉       | 33059/110379 [00:48<02:56, 439.05 examples/s]Map:  28%|██▊       | 31406/110379 [00:48<02:09, 612.07 examples/s]Map:  28%|██▊       | 31156/110379 [00:47<02:31, 523.01 examples/s]Map:  30%|██▉       | 32718/110379 [00:48<01:49, 708.13 examples/s]Map:  30%|███       | 33127/110379 [00:48<02:39, 485.13 examples/s]Map:  29%|██▊       | 31482/110379 [00:48<02:01, 651.15 examples/s]Map:  28%|██▊       | 31215/110379 [00:48<02:27, 537.58 examples/s]Map:  30%|██▉       | 32806/110379 [00:48<01:56, 668.18 examples/s]Map:  30%|███       | 33211/110379 [00:49<02:33, 503.64 examples/s]Map:  29%|██▊       | 31561/110379 [00:49<01:54, 686.05 examples/s]Map:  28%|██▊       | 31274/110379 [00:48<02:24, 547.46 examples/s]Map:  30%|███       | 33276/110379 [00:49<02:24, 533.46 examples/s]Map:  29%|██▊       | 31640/110379 [00:49<01:50, 712.95 examples/s]Map:  28%|██▊       | 31334/110379 [00:48<02:21, 557.64 examples/s]Map:  30%|██▉       | 32898/110379 [00:48<01:59, 646.79 examples/s]Map:  30%|███       | 33337/110379 [00:49<02:19, 550.96 examples/s]Map:  29%|██▊       | 31713/110379 [00:49<01:49, 717.46 examples/s]Map:  28%|██▊       | 31421/110379 [00:48<02:20, 562.43 examples/s]Map:  30%|██▉       | 32985/110379 [00:48<02:05, 619.08 examples/s]Map:  30%|███       | 33424/110379 [00:49<02:17, 557.72 examples/s]Map:  29%|██▉       | 31819/110379 [00:49<01:50, 711.17 examples/s]Map:  29%|██▊       | 31483/110379 [00:48<02:16, 576.09 examples/s]Map:  30%|███       | 33501/110379 [00:49<02:06, 608.31 examples/s]Map:  29%|██▉       | 31898/110379 [00:49<01:47, 728.69 examples/s]Map:  29%|██▊       | 31552/110379 [00:48<02:10, 603.52 examples/s]Map:  30%|███       | 33574/110379 [00:49<02:00, 638.59 examples/s]Map:  29%|██▊       | 31616/110379 [00:48<02:08, 611.22 examples/s]Map:  30%|██▉       | 33058/110379 [00:48<02:50, 452.88 examples/s]Map:  30%|███       | 33651/110379 [00:49<01:54, 673.00 examples/s]Map:  29%|██▊       | 31679/110379 [00:48<02:08, 612.05 examples/s]Map:  30%|███       | 33123/110379 [00:48<02:38, 487.22 examples/s]Map:  29%|██▉       | 32000/110379 [00:49<02:22, 551.82 examples/s]Map:  31%|███       | 33733/110379 [00:49<01:47, 711.00 examples/s]Map:  29%|██▉       | 31748/110379 [00:48<02:05, 628.68 examples/s]Map:  30%|███       | 33188/110379 [00:49<02:28, 518.96 examples/s]Map:  29%|██▉       | 32071/110379 [00:49<02:14, 583.07 examples/s]Map:  31%|███       | 33814/110379 [00:49<01:44, 734.44 examples/s]Map:  29%|██▉       | 31822/110379 [00:49<01:59, 659.16 examples/s]Map:  30%|███       | 33264/110379 [00:49<02:14, 573.27 examples/s]Map:  29%|██▉       | 32137/110379 [00:49<02:10, 599.82 examples/s]Map:  29%|██▉       | 31900/110379 [00:49<01:53, 692.15 examples/s]Map:  30%|███       | 33345/110379 [00:49<02:02, 627.33 examples/s]Map:  31%|███       | 33922/110379 [00:50<01:45, 723.26 examples/s]Map:  29%|██▉       | 32209/110379 [00:50<02:20, 555.21 examples/s]Map:  30%|███       | 33438/110379 [00:49<02:03, 621.82 examples/s]Map:  30%|███       | 33513/110379 [00:49<01:57, 651.91 examples/s]Map:  29%|██▉       | 32287/110379 [00:50<02:24, 538.57 examples/s]Map:  29%|██▉       | 32000/110379 [00:49<02:34, 507.85 examples/s]Map:  31%|███       | 34000/110379 [00:50<02:26, 522.69 examples/s]Map:  30%|███       | 33592/110379 [00:49<01:51, 686.20 examples/s]Map:  29%|██▉       | 32078/110379 [00:49<02:18, 563.85 examples/s]Map:  31%|███       | 34077/110379 [00:50<02:13, 572.02 examples/s]Map:  29%|██▉       | 32372/110379 [00:50<02:23, 542.84 examples/s]Map:  31%|███       | 33671/110379 [00:49<01:48, 707.64 examples/s]Map:  29%|██▉       | 32158/110379 [00:49<02:06, 616.44 examples/s]Map:  31%|███       | 34145/110379 [00:50<02:08, 594.94 examples/s]Map:  29%|██▉       | 32430/110379 [00:50<02:22, 547.23 examples/s]Map:  31%|███       | 33744/110379 [00:49<01:47, 710.59 examples/s]Map:  29%|██▉       | 32229/110379 [00:49<02:02, 637.57 examples/s]Map:  31%|███       | 34228/110379 [00:50<02:11, 580.28 examples/s]Map:  31%|███       | 33819/110379 [00:49<01:46, 720.36 examples/s]Map:  29%|██▉       | 32510/110379 [00:50<02:23, 541.06 examples/s]Map:  29%|██▉       | 32304/110379 [00:49<01:57, 664.85 examples/s]Map:  29%|██▉       | 32381/110379 [00:49<01:52, 691.50 examples/s]Map:  31%|███       | 34309/110379 [00:50<02:14, 565.61 examples/s]Map:  31%|███       | 33931/110379 [00:50<01:45, 724.98 examples/s]Map:  30%|██▉       | 32589/110379 [00:50<02:25, 533.98 examples/s]Map:  29%|██▉       | 32458/110379 [00:50<01:49, 711.75 examples/s]Map:  30%|██▉       | 32663/110379 [00:50<02:14, 579.74 examples/s]Map:  31%|███       | 34385/110379 [00:50<02:20, 542.21 examples/s]Map:  29%|██▉       | 32534/110379 [00:50<01:47, 724.04 examples/s]Map:  30%|██▉       | 32738/110379 [00:51<02:05, 619.08 examples/s]Map:  31%|███       | 34034/110379 [00:50<02:14, 567.53 examples/s]Map:  30%|██▉       | 32616/110379 [00:50<01:43, 748.81 examples/s]Map:  31%|███       | 34467/110379 [00:51<02:20, 540.58 examples/s]Map:  30%|██▉       | 32810/110379 [00:51<02:00, 642.98 examples/s]Map:  31%|███       | 34115/110379 [00:50<02:04, 614.51 examples/s]Map:  30%|██▉       | 32695/110379 [00:50<01:42, 759.59 examples/s]Map:  31%|███▏      | 34525/110379 [00:51<02:18, 546.45 examples/s]Map:  30%|██▉       | 32880/110379 [00:51<01:58, 656.52 examples/s]Map:  30%|██▉       | 32772/110379 [00:50<01:42, 759.49 examples/s]Map:  31%|███▏      | 34585/110379 [00:51<02:16, 556.81 examples/s]Map:  31%|███       | 34223/110379 [00:50<01:58, 643.77 examples/s]Map:  30%|██▉       | 32982/110379 [00:51<01:56, 662.18 examples/s]Map:  30%|██▉       | 32849/110379 [00:50<01:42, 759.69 examples/s]Map:  31%|███▏      | 34647/110379 [00:51<02:13, 567.08 examples/s]Map:  31%|███       | 34321/110379 [00:50<01:58, 643.82 examples/s]Map:  31%|███▏      | 34709/110379 [00:51<02:11, 574.32 examples/s]Map:  30%|██▉       | 32949/110379 [00:50<01:49, 706.21 examples/s]Map:  31%|███       | 34414/110379 [00:50<01:59, 634.19 examples/s]Map:  30%|██▉       | 33069/110379 [00:51<02:33, 505.06 examples/s]Map:  32%|███▏      | 34801/110379 [00:51<02:09, 583.70 examples/s]Map:  30%|███       | 33132/110379 [00:51<02:26, 528.41 examples/s]Map:  32%|███▏      | 34876/110379 [00:51<02:01, 622.15 examples/s]Map:  31%|███▏      | 34508/110379 [00:51<02:00, 628.76 examples/s]Map:  30%|██▉       | 33034/110379 [00:50<02:27, 523.99 examples/s]Map:  30%|███       | 33196/110379 [00:51<02:19, 552.43 examples/s]Map:  32%|███▏      | 34946/110379 [00:51<01:57, 639.85 examples/s]Map:  30%|██▉       | 33111/110379 [00:51<02:14, 572.57 examples/s]Map:  31%|███▏      | 34600/110379 [00:51<02:02, 620.98 examples/s]Map:  30%|███       | 33285/110379 [00:51<02:16, 563.53 examples/s]Map:  30%|███       | 33195/110379 [00:51<02:02, 632.34 examples/s]Map:  31%|███▏      | 34695/110379 [00:51<02:01, 621.82 examples/s]Map:  30%|███       | 33347/110379 [00:52<02:14, 572.76 examples/s]Map:  30%|███       | 33271/110379 [00:51<01:56, 662.81 examples/s]Map:  32%|███▏      | 35035/110379 [00:52<02:32, 494.44 examples/s]Map:  30%|███       | 33347/110379 [00:51<01:52, 683.98 examples/s]Map:  32%|███▏      | 35106/110379 [00:52<02:19, 538.65 examples/s]Map:  32%|███▏      | 34785/110379 [00:51<02:03, 611.80 examples/s]Map:  30%|███       | 33434/110379 [00:52<02:14, 572.95 examples/s]Map:  30%|███       | 33426/110379 [00:51<01:48, 709.63 examples/s]Map:  32%|███▏      | 35177/110379 [00:52<02:10, 578.12 examples/s]Map:  32%|███▏      | 34848/110379 [00:51<02:03, 613.79 examples/s]Map:  30%|███       | 33494/110379 [00:52<02:13, 576.90 examples/s]Map:  30%|███       | 33507/110379 [00:51<01:44, 733.12 examples/s]Map:  32%|███▏      | 35248/110379 [00:52<02:03, 608.77 examples/s]Map:  32%|███▏      | 34913/110379 [00:51<02:01, 622.13 examples/s]Map:  30%|███       | 33555/110379 [00:52<02:12, 581.38 examples/s]Map:  30%|███       | 33588/110379 [00:51<01:42, 751.78 examples/s]Map:  32%|███▏      | 35324/110379 [00:52<01:56, 645.48 examples/s]Map:  32%|███▏      | 34994/110379 [00:51<01:52, 669.13 examples/s]Map:  30%|███       | 33617/110379 [00:52<02:10, 588.45 examples/s]Map:  31%|███       | 33670/110379 [00:51<01:39, 769.79 examples/s]Map:  31%|███       | 33680/110379 [00:52<02:08, 598.26 examples/s]Map:  32%|███▏      | 35412/110379 [00:52<02:00, 619.95 examples/s]Map:  31%|███       | 33743/110379 [00:52<02:06, 604.64 examples/s]Map:  31%|███       | 33765/110379 [00:51<01:47, 712.66 examples/s]Map:  32%|███▏      | 35063/110379 [00:52<02:32, 493.49 examples/s]Map:  32%|███▏      | 35484/110379 [00:52<01:56, 644.05 examples/s]Map:  32%|███▏      | 35124/110379 [00:52<02:25, 515.82 examples/s]Map:  32%|███▏      | 35552/110379 [00:52<01:55, 649.55 examples/s]Map:  31%|███       | 33833/110379 [00:52<02:07, 600.66 examples/s]Map:  31%|███       | 33858/110379 [00:52<01:53, 677.15 examples/s]Map:  32%|███▏      | 35197/110379 [00:52<02:13, 563.37 examples/s]Map:  32%|███▏      | 35628/110379 [00:52<01:50, 678.52 examples/s]Map:  31%|███       | 33902/110379 [00:52<02:02, 622.90 examples/s]Map:  31%|███       | 33933/110379 [00:52<01:50, 690.75 examples/s]Map:  32%|███▏      | 35265/110379 [00:52<02:06, 592.53 examples/s]Map:  32%|███▏      | 35703/110379 [00:53<01:47, 694.42 examples/s]Map:  31%|███       | 33992/110379 [00:53<02:04, 612.13 examples/s]Map:  32%|███▏      | 35345/110379 [00:52<01:56, 646.08 examples/s]Map:  32%|███▏      | 35784/110379 [00:53<01:42, 726.31 examples/s]Map:  32%|███▏      | 35421/110379 [00:52<01:51, 674.84 examples/s]Map:  31%|███       | 34041/110379 [00:52<02:16, 560.56 examples/s]Map:  32%|███▏      | 35864/110379 [00:53<01:39, 746.12 examples/s]Map:  32%|███▏      | 35501/110379 [00:52<01:45, 708.31 examples/s]Map:  31%|███       | 34120/110379 [00:52<02:05, 607.14 examples/s]Map:  31%|███       | 34060/110379 [00:53<02:52, 442.20 examples/s]Map:  33%|███▎      | 35974/110379 [00:53<01:40, 736.99 examples/s]Map:  31%|███       | 34194/110379 [00:52<01:59, 635.08 examples/s]Map:  31%|███       | 34123/110379 [00:53<02:39, 477.81 examples/s]Map:  32%|███▏      | 35615/110379 [00:52<01:43, 722.48 examples/s]Map:  31%|███       | 34268/110379 [00:52<01:55, 656.74 examples/s]Map:  31%|███       | 34188/110379 [00:53<02:28, 513.39 examples/s]Map:  32%|███▏      | 35724/110379 [00:52<01:43, 720.02 examples/s]Map:  33%|███▎      | 36078/110379 [00:53<02:11, 565.40 examples/s]Map:  31%|███       | 34362/110379 [00:52<01:58, 641.22 examples/s]Map:  31%|███       | 34276/110379 [00:53<02:22, 533.30 examples/s]Map:  32%|███▏      | 35800/110379 [00:53<01:42, 728.22 examples/s]Map:  33%|███▎      | 36150/110379 [00:53<02:04, 596.61 examples/s]Map:  31%|███       | 34343/110379 [00:53<02:15, 562.34 examples/s]Map:  33%|███▎      | 35878/110379 [00:53<01:40, 740.19 examples/s]Map:  31%|███       | 34458/110379 [00:53<02:00, 628.53 examples/s]Map:  33%|███▎      | 36225/110379 [00:53<01:57, 630.32 examples/s]Map:  31%|███       | 34422/110379 [00:53<02:03, 617.12 examples/s]Map:  33%|███▎      | 36302/110379 [00:54<01:51, 663.48 examples/s]Map:  33%|███▎      | 35988/110379 [00:53<01:41, 734.98 examples/s]Map:  31%|███▏      | 34555/110379 [00:53<02:00, 631.63 examples/s]Map:  31%|███▏      | 34501/110379 [00:54<01:55, 659.64 examples/s]Map:  33%|███▎      | 36374/110379 [00:54<01:49, 675.94 examples/s]Map:  31%|███▏      | 34622/110379 [00:53<01:58, 637.78 examples/s]Map:  31%|███▏      | 34573/110379 [00:54<01:52, 674.88 examples/s]Map:  33%|███▎      | 36452/110379 [00:54<01:45, 702.90 examples/s]Map:  33%|███▎      | 36063/110379 [00:53<02:16, 542.86 examples/s]Map:  31%|███▏      | 34719/110379 [00:53<01:58, 636.43 examples/s]Map:  31%|███▏      | 34673/110379 [00:54<01:53, 667.65 examples/s]Map:  33%|███▎      | 36547/110379 [00:54<01:49, 676.11 examples/s]Map:  33%|███▎      | 36153/110379 [00:53<02:13, 556.02 examples/s]Map:  32%|███▏      | 34807/110379 [00:53<02:02, 617.54 examples/s]Map:  31%|███▏      | 34769/110379 [00:54<01:55, 653.07 examples/s]Map:  33%|███▎      | 36650/110379 [00:54<01:50, 667.53 examples/s]Map:  33%|███▎      | 36219/110379 [00:53<02:08, 576.99 examples/s]Map:  32%|███▏      | 34888/110379 [00:53<01:54, 661.63 examples/s]Map:  32%|███▏      | 34839/110379 [00:54<01:53, 663.85 examples/s]Map:  33%|███▎      | 36720/110379 [00:54<01:49, 672.85 examples/s]Map:  33%|███▎      | 36294/110379 [00:53<02:00, 615.50 examples/s]Map:  32%|███▏      | 34966/110379 [00:53<01:49, 688.90 examples/s]Map:  32%|███▏      | 34917/110379 [00:54<01:49, 689.81 examples/s]Map:  33%|███▎      | 36797/110379 [00:54<01:45, 695.96 examples/s]Map:  33%|███▎      | 36364/110379 [00:53<01:56, 633.98 examples/s]Map:  32%|███▏      | 34988/110379 [00:54<01:49, 690.79 examples/s]Map:  33%|███▎      | 36881/110379 [00:54<01:40, 730.50 examples/s]Map:  33%|███▎      | 36439/110379 [00:54<01:52, 658.81 examples/s]Map:  32%|███▏      | 35039/110379 [00:54<02:19, 539.79 examples/s]Map:  33%|███▎      | 36964/110379 [00:54<01:37, 752.24 examples/s]Map:  33%|███▎      | 36516/110379 [00:54<01:47, 684.43 examples/s]Map:  32%|███▏      | 35114/110379 [00:54<02:08, 583.62 examples/s]Map:  32%|███▏      | 35068/110379 [00:55<02:27, 510.96 examples/s]Map:  33%|███▎      | 36590/110379 [00:54<01:45, 698.49 examples/s]Map:  32%|███▏      | 35191/110379 [00:54<01:59, 626.75 examples/s]Map:  32%|███▏      | 35129/110379 [00:55<02:22, 528.89 examples/s]Map:  32%|███▏      | 35267/110379 [00:54<01:54, 658.29 examples/s]Map:  34%|███▎      | 37073/110379 [00:55<02:08, 569.97 examples/s]Map:  33%|███▎      | 36697/110379 [00:54<01:45, 697.52 examples/s]Map:  32%|███▏      | 35349/110379 [00:54<01:47, 699.27 examples/s]Map:  34%|███▎      | 37152/110379 [00:55<01:59, 614.07 examples/s]Map:  32%|███▏      | 35213/110379 [00:55<02:20, 536.55 examples/s]Map:  33%|███▎      | 36769/110379 [00:54<01:44, 701.49 examples/s]Map:  34%|███▎      | 37230/110379 [00:55<01:52, 651.42 examples/s]Map:  33%|███▎      | 36841/110379 [00:54<01:44, 703.42 examples/s]Map:  32%|███▏      | 35276/110379 [00:55<02:15, 552.78 examples/s]Map:  32%|███▏      | 35461/110379 [00:54<01:45, 711.73 examples/s]Map:  32%|███▏      | 35336/110379 [00:55<02:13, 561.68 examples/s]Map:  32%|███▏      | 35542/110379 [00:54<01:41, 734.62 examples/s]Map:  34%|███▍      | 37339/110379 [00:55<01:48, 673.32 examples/s]Map:  33%|███▎      | 36947/110379 [00:54<01:44, 701.84 examples/s]Map:  32%|███▏      | 35405/110379 [00:55<02:06, 592.67 examples/s]Map:  34%|███▍      | 37414/110379 [00:55<01:46, 688.13 examples/s]Map:  32%|███▏      | 35651/110379 [00:54<01:42, 726.34 examples/s]Map:  32%|███▏      | 35467/110379 [00:55<02:05, 596.97 examples/s]Map:  34%|███▍      | 37509/110379 [00:55<01:49, 664.60 examples/s]Map:  32%|███▏      | 35533/110379 [00:55<02:02, 612.88 examples/s]Map:  34%|███▎      | 37030/110379 [00:55<02:19, 523.98 examples/s]Map:  32%|███▏      | 35750/110379 [00:54<01:46, 700.39 examples/s]Map:  32%|███▏      | 35596/110379 [00:55<02:01, 615.93 examples/s]Map:  34%|███▎      | 37090/110379 [00:55<02:16, 538.28 examples/s]Map:  34%|███▍      | 37600/110379 [00:55<01:53, 642.24 examples/s]Map:  32%|███▏      | 35847/110379 [00:55<01:49, 681.55 examples/s]Map:  34%|███▎      | 37154/110379 [00:55<02:10, 561.17 examples/s]Map:  32%|███▏      | 35667/110379 [00:55<01:56, 639.41 examples/s]Map:  33%|███▎      | 35922/110379 [00:55<01:47, 694.18 examples/s]Map:  34%|███▍      | 37695/110379 [00:56<01:53, 638.43 examples/s]Map:  34%|███▎      | 37230/110379 [00:55<02:00, 608.15 examples/s]Map:  32%|███▏      | 35739/110379 [00:56<01:53, 658.36 examples/s]Map:  33%|███▎      | 35993/110379 [00:55<01:46, 696.98 examples/s]Map:  34%|███▍      | 37309/110379 [00:55<01:51, 653.49 examples/s]Map:  32%|███▏      | 35814/110379 [00:56<01:49, 681.31 examples/s]Map:  34%|███▍      | 37782/110379 [00:56<01:58, 614.54 examples/s]Map:  34%|███▍      | 37390/110379 [00:55<01:45, 694.49 examples/s]Map:  33%|███▎      | 35883/110379 [00:56<01:49, 680.69 examples/s]Map:  34%|███▍      | 37845/110379 [00:56<01:57, 616.59 examples/s]Map:  34%|███▍      | 37468/110379 [00:55<01:42, 712.61 examples/s]Map:  33%|███▎      | 35958/110379 [00:56<01:46, 698.25 examples/s]Map:  33%|███▎      | 36070/110379 [00:55<02:21, 525.29 examples/s]Map:  34%|███▍      | 37930/110379 [00:56<02:00, 598.77 examples/s]Map:  34%|███▍      | 37549/110379 [00:55<01:38, 738.81 examples/s]Map:  33%|███▎      | 36144/110379 [00:55<02:10, 567.83 examples/s]Map:  34%|███▍      | 37626/110379 [00:55<01:38, 741.82 examples/s]Map:  33%|███▎      | 36220/110379 [00:55<02:01, 609.63 examples/s]Map:  33%|███▎      | 36038/110379 [00:56<02:27, 503.55 examples/s]Map:  34%|███▍      | 37704/110379 [00:55<01:36, 750.57 examples/s]Map:  33%|███▎      | 36295/110379 [00:55<01:55, 641.85 examples/s]Map:  33%|███▎      | 36117/110379 [00:56<02:10, 567.57 examples/s]Map:  34%|███▍      | 38000/110379 [00:56<02:46, 434.55 examples/s]Map:  34%|███▍      | 37780/110379 [00:56<01:36, 749.65 examples/s]Map:  33%|███▎      | 36366/110379 [00:55<01:53, 654.57 examples/s]Map:  33%|███▎      | 36196/110379 [00:56<01:59, 619.88 examples/s]Map:  34%|███▍      | 38060/110379 [00:56<02:35, 464.25 examples/s]Map:  34%|███▍      | 37858/110379 [00:56<01:35, 756.34 examples/s]Map:  33%|███▎      | 36443/110379 [00:56<01:48, 684.50 examples/s]Map:  33%|███▎      | 36270/110379 [00:56<01:54, 648.47 examples/s]Map:  35%|███▍      | 38123/110379 [00:56<02:24, 499.20 examples/s]Map:  33%|███▎      | 36518/110379 [00:56<01:45, 698.66 examples/s]Map:  33%|███▎      | 36346/110379 [00:57<01:49, 675.65 examples/s]Map:  34%|███▍      | 37976/110379 [00:56<01:34, 764.32 examples/s]Map:  35%|███▍      | 38207/110379 [00:57<02:19, 516.39 examples/s]Map:  33%|███▎      | 36622/110379 [00:56<01:46, 692.90 examples/s]Map:  33%|███▎      | 36451/110379 [00:57<01:48, 678.94 examples/s]Map:  35%|███▍      | 38273/110379 [00:57<02:11, 547.19 examples/s]Map:  33%|███▎      | 36695/110379 [00:56<01:45, 700.96 examples/s]Map:  34%|███▍      | 38070/110379 [00:56<02:05, 574.76 examples/s]Map:  35%|███▍      | 38336/110379 [00:57<02:07, 566.40 examples/s]Map:  33%|███▎      | 36551/110379 [00:57<01:50, 670.11 examples/s]Map:  35%|███▍      | 38137/110379 [00:56<02:01, 593.96 examples/s]Map:  33%|███▎      | 36793/110379 [00:56<01:48, 678.39 examples/s]Map:  35%|███▍      | 38397/110379 [00:57<02:05, 573.40 examples/s]Map:  35%|███▍      | 38211/110379 [00:56<01:55, 625.96 examples/s]Map:  33%|███▎      | 36647/110379 [00:57<01:52, 657.82 examples/s]Map:  35%|███▍      | 38466/110379 [00:57<01:58, 604.47 examples/s]Map:  33%|███▎      | 36902/110379 [00:56<01:46, 693.17 examples/s]Map:  35%|███▍      | 38284/110379 [00:56<01:50, 650.07 examples/s]Map:  33%|███▎      | 36724/110379 [00:57<01:47, 682.79 examples/s]Map:  35%|███▍      | 38540/110379 [00:57<01:52, 639.72 examples/s]Map:  34%|███▎      | 36982/110379 [00:56<01:42, 715.68 examples/s]Map:  33%|███▎      | 36802/110379 [00:57<01:44, 704.48 examples/s]Map:  35%|███▍      | 38363/110379 [00:56<01:45, 680.46 examples/s]Map:  35%|███▍      | 38621/110379 [00:57<01:44, 683.98 examples/s]Map:  35%|███▍      | 38442/110379 [00:57<01:41, 708.95 examples/s]Map:  33%|███▎      | 36878/110379 [00:57<01:42, 715.97 examples/s]Map:  35%|███▌      | 38695/110379 [00:57<01:42, 698.51 examples/s]Map:  35%|███▍      | 38521/110379 [00:57<01:38, 728.38 examples/s]Map:  33%|███▎      | 36951/110379 [00:57<01:42, 716.75 examples/s]Map:  34%|███▎      | 37069/110379 [00:57<02:12, 551.96 examples/s]Map:  35%|███▌      | 38773/110379 [00:57<01:39, 719.12 examples/s]Map:  35%|███▍      | 38599/110379 [00:57<01:36, 740.45 examples/s]Map:  34%|███▎      | 37144/110379 [00:57<02:04, 588.81 examples/s]Map:  35%|███▌      | 38852/110379 [00:58<01:37, 736.85 examples/s]Map:  35%|███▌      | 38677/110379 [00:57<01:35, 751.15 examples/s]Map:  34%|███▎      | 37221/110379 [00:57<01:56, 628.25 examples/s]Map:  35%|███▌      | 38928/110379 [00:58<01:36, 739.67 examples/s]Map:  34%|███▎      | 37035/110379 [00:58<02:16, 535.93 examples/s]Map:  35%|███▌      | 38758/110379 [00:57<01:33, 766.51 examples/s]Map:  34%|███▍      | 37295/110379 [00:57<01:51, 655.59 examples/s]Map:  34%|███▎      | 37105/110379 [00:58<02:08, 571.43 examples/s]Map:  34%|███▍      | 37376/110379 [00:57<01:44, 695.57 examples/s]Map:  34%|███▎      | 37182/110379 [00:58<01:58, 615.31 examples/s]Map:  35%|███▌      | 38867/110379 [00:57<01:35, 746.52 examples/s]Map:  35%|███▌      | 39037/110379 [00:58<02:08, 556.84 examples/s]Map:  34%|███▍      | 37453/110379 [00:57<01:42, 712.67 examples/s]Map:  34%|███▎      | 37252/110379 [00:58<01:54, 636.00 examples/s]Map:  35%|███▌      | 38945/110379 [00:57<01:34, 753.47 examples/s]Map:  35%|███▌      | 39111/110379 [00:58<01:59, 596.00 examples/s]Map:  34%|███▍      | 37529/110379 [00:57<01:40, 724.34 examples/s]Map:  34%|███▍      | 37328/110379 [00:58<01:49, 666.85 examples/s]Map:  34%|███▍      | 37604/110379 [00:57<01:39, 729.96 examples/s]Map:  34%|███▍      | 37404/110379 [00:58<01:45, 689.37 examples/s]Map:  36%|███▌      | 39207/110379 [00:58<01:57, 603.41 examples/s]Map:  35%|███▌      | 39027/110379 [00:58<02:13, 534.01 examples/s]Map:  34%|███▍      | 37706/110379 [00:57<01:42, 705.95 examples/s]Map:  34%|███▍      | 37508/110379 [00:58<01:46, 686.57 examples/s]Map:  36%|███▌      | 39302/110379 [00:58<01:56, 608.88 examples/s]Map:  35%|███▌      | 39102/110379 [00:58<02:03, 577.20 examples/s]Map:  34%|███▍      | 37589/110379 [00:58<01:41, 715.90 examples/s]Map:  36%|███▌      | 39374/110379 [00:58<01:52, 630.27 examples/s]Map:  34%|███▍      | 37815/110379 [00:58<01:42, 711.09 examples/s]Map:  35%|███▌      | 39173/110379 [00:58<01:58, 602.78 examples/s]Map:  34%|███▍      | 37665/110379 [00:59<01:40, 725.79 examples/s]Map:  36%|███▌      | 39452/110379 [00:59<01:46, 664.95 examples/s]Map:  34%|███▍      | 37888/110379 [00:58<01:41, 713.57 examples/s]Map:  36%|███▌      | 39248/110379 [00:58<01:51, 637.04 examples/s]Map:  34%|███▍      | 37763/110379 [00:59<01:44, 696.86 examples/s]Map:  36%|███▌      | 39541/110379 [00:59<01:51, 636.49 examples/s]Map:  34%|███▍      | 37998/110379 [00:58<01:41, 714.24 examples/s]Map:  36%|███▌      | 39352/110379 [00:58<01:48, 652.91 examples/s]Map:  34%|███▍      | 37842/110379 [00:59<01:41, 716.33 examples/s]Map:  36%|███▌      | 39435/110379 [00:58<01:42, 691.39 examples/s]Map:  36%|███▌      | 39641/110379 [00:59<01:50, 641.68 examples/s]Map:  36%|███▌      | 39510/110379 [00:58<01:40, 704.74 examples/s]Map:  34%|███▍      | 38072/110379 [00:58<02:11, 551.62 examples/s]Map:  34%|███▍      | 37955/110379 [00:59<01:39, 726.09 examples/s]Map:  36%|███▌      | 39716/110379 [00:59<01:46, 663.50 examples/s]Map:  36%|███▌      | 39588/110379 [00:58<01:38, 722.30 examples/s]Map:  35%|███▍      | 38155/110379 [00:58<01:58, 609.75 examples/s]Map:  36%|███▌      | 39789/110379 [00:59<01:44, 677.54 examples/s]Map:  36%|███▌      | 39664/110379 [00:58<01:36, 731.41 examples/s]Map:  35%|███▍      | 38233/110379 [00:58<01:51, 647.77 examples/s]Map:  34%|███▍      | 38038/110379 [00:59<02:08, 562.43 examples/s]Map:  36%|███▌      | 39894/110379 [00:59<01:43, 680.91 examples/s]Map:  35%|███▍      | 38319/110379 [00:58<01:43, 698.12 examples/s]Map:  36%|███▌      | 39774/110379 [00:59<01:36, 728.90 examples/s]Map:  35%|███▍      | 38122/110379 [00:59<01:56, 619.65 examples/s]Map:  36%|███▌      | 39971/110379 [00:59<01:40, 699.40 examples/s]Map:  35%|███▍      | 38402/110379 [00:58<01:38, 730.87 examples/s]Map:  36%|███▌      | 39853/110379 [00:59<01:35, 741.48 examples/s]Map:  35%|███▍      | 38204/110379 [00:59<01:48, 666.02 examples/s]Map:  35%|███▍      | 38281/110379 [00:59<01:44, 689.87 examples/s]Map:  35%|███▍      | 38517/110379 [00:59<01:37, 738.75 examples/s]Map:  36%|███▌      | 39957/110379 [00:59<01:37, 723.50 examples/s]Map:  36%|███▋      | 40071/110379 [01:00<02:10, 538.22 examples/s]Map:  35%|███▍      | 38382/110379 [01:00<01:46, 678.33 examples/s]Map:  35%|███▍      | 38615/110379 [00:59<01:41, 705.54 examples/s]Map:  36%|███▋      | 40142/110379 [01:00<02:03, 570.93 examples/s]Map:  35%|███▍      | 38463/110379 [01:00<01:41, 707.03 examples/s]Map:  35%|███▌      | 38688/110379 [00:59<01:41, 709.53 examples/s]Map:  36%|███▋      | 40032/110379 [00:59<02:13, 525.51 examples/s]Map:  36%|███▋      | 40219/110379 [01:00<01:54, 613.63 examples/s]Map:  35%|███▌      | 38762/110379 [00:59<01:40, 716.03 examples/s]Map:  36%|███▋      | 40112/110379 [00:59<02:00, 581.21 examples/s]Map:  35%|███▍      | 38570/110379 [01:00<01:41, 707.96 examples/s]Map:  37%|███▋      | 40301/110379 [01:00<01:45, 661.50 examples/s]Map:  35%|███▌      | 38839/110379 [00:59<01:38, 729.04 examples/s]Map:  36%|███▋      | 40187/110379 [00:59<01:53, 618.37 examples/s]Map:  35%|███▌      | 38648/110379 [01:00<01:39, 723.19 examples/s]Map:  37%|███▋      | 40380/110379 [01:00<01:41, 691.17 examples/s]Map:  35%|███▌      | 38918/110379 [00:59<01:36, 744.17 examples/s]Map:  36%|███▋      | 40263/110379 [00:59<01:47, 652.27 examples/s]Map:  35%|███▌      | 38726/110379 [01:00<01:37, 731.99 examples/s]Map:  37%|███▋      | 40457/110379 [01:00<01:38, 710.24 examples/s]Map:  35%|███▌      | 38994/110379 [00:59<01:35, 744.81 examples/s]Map:  37%|███▋      | 40346/110379 [00:59<01:40, 695.97 examples/s]Map:  35%|███▌      | 38805/110379 [01:00<01:35, 747.31 examples/s]Map:  37%|███▋      | 40564/110379 [01:00<01:38, 708.54 examples/s]Map:  37%|███▋      | 40423/110379 [01:00<01:38, 711.84 examples/s]Map:  35%|███▌      | 38881/110379 [01:00<01:35, 748.86 examples/s]Map:  37%|███▋      | 40640/110379 [01:00<01:37, 717.93 examples/s]Map:  35%|███▌      | 39072/110379 [01:00<02:09, 550.05 examples/s]Map:  37%|███▋      | 40501/110379 [01:00<01:35, 729.46 examples/s]Map:  35%|███▌      | 38967/110379 [01:00<01:31, 777.50 examples/s]Map:  37%|███▋      | 40716/110379 [01:00<01:35, 725.70 examples/s]Map:  35%|███▌      | 39151/110379 [01:00<01:58, 601.84 examples/s]Map:  37%|███▋      | 40579/110379 [01:00<01:35, 733.67 examples/s]Map:  37%|███▋      | 40801/110379 [01:01<01:31, 758.78 examples/s]Map:  36%|███▌      | 39229/110379 [01:00<01:50, 644.33 examples/s]Map:  37%|███▋      | 40658/110379 [01:00<01:33, 745.35 examples/s]Map:  35%|███▌      | 39074/110379 [01:01<02:00, 590.66 examples/s]Map:  36%|███▌      | 39308/110379 [01:00<01:44, 677.19 examples/s]Map:  37%|███▋      | 40737/110379 [01:00<01:32, 754.92 examples/s]Map:  37%|███▋      | 40914/110379 [01:01<01:32, 748.77 examples/s]Map:  35%|███▌      | 39156/110379 [01:01<01:51, 640.44 examples/s]Map:  36%|███▌      | 39382/110379 [01:00<01:42, 690.95 examples/s]Map:  37%|███▋      | 40995/110379 [01:01<01:31, 761.64 examples/s]Map:  37%|███▋      | 40848/110379 [01:00<01:33, 743.61 examples/s]Map:  36%|███▌      | 39233/110379 [01:01<01:46, 668.04 examples/s]Map:  36%|███▌      | 39493/110379 [01:00<01:40, 705.64 examples/s]Map:  36%|███▌      | 39306/110379 [01:01<01:44, 681.80 examples/s]Map:  37%|███▋      | 40929/110379 [01:00<01:44, 665.56 examples/s]Map:  36%|███▌      | 39572/110379 [01:00<01:37, 725.00 examples/s]Map:  37%|███▋      | 41073/110379 [01:01<02:03, 562.10 examples/s]Map:  36%|███▌      | 39397/110379 [01:01<01:48, 653.36 examples/s]Map:  36%|███▌      | 39652/110379 [01:00<01:35, 743.16 examples/s]Map:  37%|███▋      | 41158/110379 [01:01<01:51, 623.32 examples/s]Map:  36%|███▌      | 39729/110379 [01:00<01:34, 746.17 examples/s]Map:  37%|███▋      | 41233/110379 [01:01<01:46, 650.71 examples/s]Map:  36%|███▌      | 39467/110379 [01:01<02:00, 589.48 examples/s]Map:  37%|███▋      | 41000/110379 [01:01<02:33, 452.83 examples/s]Map:  36%|███▌      | 39805/110379 [01:01<01:34, 747.02 examples/s]Map:  37%|███▋      | 41310/110379 [01:01<01:41, 679.56 examples/s]Map:  37%|███▋      | 41076/110379 [01:01<02:15, 509.81 examples/s]Map:  36%|███▌      | 39549/110379 [01:01<02:04, 570.67 examples/s]Map:  36%|███▌      | 39884/110379 [01:01<01:33, 754.74 examples/s]Map:  37%|███▋      | 41147/110379 [01:01<02:05, 550.82 examples/s]Map:  38%|███▊      | 41412/110379 [01:02<01:42, 671.50 examples/s]Map:  36%|███▌      | 39964/110379 [01:01<01:31, 765.52 examples/s]Map:  36%|███▌      | 39631/110379 [01:02<02:06, 559.99 examples/s]Map:  37%|███▋      | 41231/110379 [01:01<02:05, 549.45 examples/s]Map:  38%|███▊      | 41488/110379 [01:02<01:52, 611.12 examples/s]Map:  36%|███▌      | 39714/110379 [01:02<02:07, 553.86 examples/s]Map:  37%|███▋      | 41296/110379 [01:01<02:01, 569.24 examples/s]Map:  38%|███▊      | 41566/110379 [01:02<01:58, 578.29 examples/s]Map:  36%|███▋      | 40073/110379 [01:01<02:01, 580.88 examples/s]Map:  37%|███▋      | 41367/110379 [01:01<01:54, 600.65 examples/s]Map:  36%|███▌      | 39790/110379 [01:02<02:11, 535.22 examples/s]Map:  38%|███▊      | 41636/110379 [01:02<01:54, 602.39 examples/s]Map:  38%|███▊      | 41437/110379 [01:01<01:50, 623.28 examples/s]Map:  36%|███▋      | 40162/110379 [01:01<02:01, 579.54 examples/s]Map:  38%|███▊      | 41710/110379 [01:02<01:48, 634.31 examples/s]Map:  36%|███▌      | 39869/110379 [01:02<02:13, 529.15 examples/s]Map:  38%|███▊      | 41530/110379 [01:01<01:51, 619.41 examples/s]Map:  38%|███▊      | 41786/110379 [01:02<01:43, 665.43 examples/s]Map:  36%|███▋      | 40247/110379 [01:01<02:02, 571.36 examples/s]Map:  36%|███▌      | 39941/110379 [01:02<02:17, 511.41 examples/s]Map:  38%|███▊      | 41858/110379 [01:02<01:40, 679.25 examples/s]Map:  37%|███▋      | 40324/110379 [01:01<01:54, 614.03 examples/s]Map:  38%|███▊      | 41623/110379 [01:02<01:51, 617.51 examples/s]Map:  38%|███▊      | 41937/110379 [01:02<01:36, 706.45 examples/s]Map:  37%|███▋      | 40400/110379 [01:01<01:48, 645.16 examples/s]Map:  38%|███▊      | 41713/110379 [01:02<01:53, 607.06 examples/s]Map:  37%|███▋      | 40480/110379 [01:02<01:42, 682.89 examples/s]Map:  36%|███▌      | 40000/110379 [01:02<03:08, 374.13 examples/s]Map:  38%|███▊      | 41776/110379 [01:02<01:52, 609.13 examples/s]Map:  36%|███▋      | 40062/110379 [01:03<02:48, 418.49 examples/s]Map:  37%|███▋      | 40584/110379 [01:02<01:42, 681.66 examples/s]Map:  38%|███▊      | 41839/110379 [01:02<01:51, 612.34 examples/s]Map:  38%|███▊      | 42028/110379 [01:03<02:23, 477.09 examples/s]Map:  36%|███▋      | 40117/110379 [01:03<02:37, 444.78 examples/s]Map:  37%|███▋      | 40657/110379 [01:02<01:40, 692.93 examples/s]Map:  38%|███▊      | 41903/110379 [01:02<01:50, 617.34 examples/s]Map:  36%|███▋      | 40176/110379 [01:03<02:27, 475.47 examples/s]Map:  38%|███▊      | 42113/110379 [01:03<02:17, 497.37 examples/s]Map:  37%|███▋      | 40758/110379 [01:02<01:41, 683.81 examples/s]Map:  38%|███▊      | 41998/110379 [01:02<01:50, 621.07 examples/s]Map:  36%|███▋      | 40239/110379 [01:03<02:17, 510.51 examples/s]Map:  38%|███▊      | 42201/110379 [01:03<02:11, 519.11 examples/s]Map:  37%|███▋      | 40297/110379 [01:03<02:13, 526.18 examples/s]Map:  37%|███▋      | 40854/110379 [01:02<01:44, 663.57 examples/s]Map:  38%|███▊      | 42261/110379 [01:03<02:07, 533.03 examples/s]Map:  37%|███▋      | 40364/110379 [01:03<02:04, 561.45 examples/s]Map:  37%|███▋      | 40922/110379 [01:02<01:44, 666.15 examples/s]Map:  38%|███▊      | 42079/110379 [01:02<02:17, 497.60 examples/s]Map:  38%|███▊      | 42319/110379 [01:03<02:05, 541.02 examples/s]Map:  37%|███▋      | 40999/110379 [01:02<01:40, 689.72 examples/s]Map:  38%|███▊      | 42160/110379 [01:02<02:01, 561.85 examples/s]Map:  37%|███▋      | 40452/110379 [01:03<02:03, 565.96 examples/s]Map:  38%|███▊      | 42377/110379 [01:03<02:03, 548.86 examples/s]Map:  38%|███▊      | 42239/110379 [01:03<01:50, 614.67 examples/s]Map:  37%|███▋      | 40515/110379 [01:03<02:00, 580.39 examples/s]Map:  38%|███▊      | 42463/110379 [01:03<02:02, 554.93 examples/s]Map:  37%|███▋      | 41074/110379 [01:03<02:10, 530.35 examples/s]Map:  38%|███▊      | 42324/110379 [01:03<01:41, 670.66 examples/s]Map:  37%|███▋      | 40578/110379 [01:03<01:58, 591.47 examples/s]Map:  37%|███▋      | 41147/110379 [01:03<02:00, 573.45 examples/s]Map:  38%|███▊      | 42401/110379 [01:03<01:38, 693.34 examples/s]Map:  37%|███▋      | 40642/110379 [01:04<01:55, 602.85 examples/s]Map:  39%|███▊      | 42549/110379 [01:04<02:01, 557.92 examples/s]Map:  38%|███▊      | 42476/110379 [01:03<01:36, 706.87 examples/s]Map:  37%|███▋      | 40707/110379 [01:04<01:53, 612.25 examples/s]Map:  39%|███▊      | 42612/110379 [01:04<01:58, 572.32 examples/s]Map:  37%|███▋      | 41234/110379 [01:03<02:00, 574.62 examples/s]Map:  39%|███▊      | 42554/110379 [01:03<01:34, 716.50 examples/s]Map:  37%|███▋      | 40771/110379 [01:04<01:53, 615.14 examples/s]Map:  39%|███▊      | 42675/110379 [01:04<01:55, 584.82 examples/s]Map:  37%|███▋      | 41301/110379 [01:03<01:56, 593.98 examples/s]Map:  37%|███▋      | 40838/110379 [01:04<01:50, 627.13 examples/s]Map:  39%|███▊      | 42655/110379 [01:03<01:37, 697.15 examples/s]Map:  39%|███▊      | 42767/110379 [01:04<01:54, 591.13 examples/s]Map:  37%|███▋      | 41392/110379 [01:03<01:55, 594.77 examples/s]Map:  37%|███▋      | 40911/110379 [01:04<01:46, 653.76 examples/s]Map:  39%|███▊      | 42729/110379 [01:03<01:35, 705.71 examples/s]Map:  39%|███▉      | 42837/110379 [01:04<01:49, 615.38 examples/s]Map:  38%|███▊      | 41454/110379 [01:03<01:54, 599.37 examples/s]Map:  37%|███▋      | 40989/110379 [01:04<01:41, 685.37 examples/s]Map:  39%|███▉      | 42811/110379 [01:03<01:32, 733.12 examples/s]Map:  38%|███▊      | 41518/110379 [01:03<01:53, 608.21 examples/s]Map:  39%|███▉      | 42926/110379 [01:04<01:51, 605.51 examples/s]Map:  39%|███▉      | 42891/110379 [01:03<01:30, 744.43 examples/s]Map:  39%|███▉      | 42988/110379 [01:04<01:51, 604.54 examples/s]Map:  38%|███▊      | 41608/110379 [01:03<01:54, 602.77 examples/s]Map:  39%|███▉      | 42968/110379 [01:04<01:29, 749.51 examples/s]Map:  37%|███▋      | 41077/110379 [01:04<02:10, 530.60 examples/s]Map:  38%|███▊      | 41675/110379 [01:04<01:51, 617.49 examples/s]Map:  37%|███▋      | 41158/110379 [01:04<01:57, 590.41 examples/s]Map:  38%|███▊      | 41740/110379 [01:04<01:50, 622.54 examples/s]Map:  37%|███▋      | 41237/110379 [01:04<01:48, 638.79 examples/s]Map:  39%|███▉      | 43057/110379 [01:05<02:36, 431.54 examples/s]Map:  39%|███▉      | 43074/110379 [01:04<01:57, 573.66 examples/s]Map:  38%|███▊      | 41831/110379 [01:04<01:51, 612.65 examples/s]Map:  39%|███▉      | 43120/110379 [01:05<02:22, 471.39 examples/s]Map:  37%|███▋      | 41334/110379 [01:05<01:48, 639.14 examples/s]Map:  39%|███▉      | 43152/110379 [01:04<01:48, 617.62 examples/s]Map:  38%|███▊      | 41894/110379 [01:04<01:51, 614.70 examples/s]Map:  39%|███▉      | 43189/110379 [01:05<02:09, 518.96 examples/s]Map:  38%|███▊      | 41404/110379 [01:05<01:45, 652.29 examples/s]Map:  39%|███▉      | 43222/110379 [01:04<01:45, 633.69 examples/s]Map:  38%|███▊      | 41956/110379 [01:04<01:51, 612.75 examples/s]Map:  39%|███▉      | 43272/110379 [01:05<01:53, 592.80 examples/s]Map:  38%|███▊      | 41481/110379 [01:05<01:41, 681.82 examples/s]Map:  39%|███▉      | 43295/110379 [01:04<01:42, 656.48 examples/s]Map:  39%|███▉      | 43352/110379 [01:05<01:44, 643.61 examples/s]Map:  38%|███▊      | 41558/110379 [01:05<01:37, 702.47 examples/s]Map:  39%|███▉      | 43388/110379 [01:04<01:45, 633.58 examples/s]Map:  39%|███▉      | 43430/110379 [01:05<01:39, 675.97 examples/s]Map:  38%|███▊      | 41637/110379 [01:05<01:34, 723.96 examples/s]Map:  39%|███▉      | 43456/110379 [01:04<01:44, 641.48 examples/s]Map:  38%|███▊      | 42032/110379 [01:04<02:35, 440.20 examples/s]Map:  39%|███▉      | 43513/110379 [01:05<01:33, 715.70 examples/s]Map:  38%|███▊      | 41745/110379 [01:05<01:35, 718.11 examples/s]Map:  39%|███▉      | 43528/110379 [01:04<01:41, 660.93 examples/s]Map:  38%|███▊      | 42096/110379 [01:04<02:22, 480.20 examples/s]Map:  40%|███▉      | 43611/110379 [01:05<01:37, 687.35 examples/s]Map:  38%|███▊      | 41825/110379 [01:05<01:33, 735.50 examples/s]Map:  40%|███▉      | 43606/110379 [01:05<01:36, 692.10 examples/s]Map:  38%|███▊      | 42162/110379 [01:04<02:11, 520.37 examples/s]Map:  38%|███▊      | 41908/110379 [01:05<01:30, 759.76 examples/s]Map:  40%|███▉      | 43684/110379 [01:05<01:33, 713.48 examples/s]Map:  38%|███▊      | 42230/110379 [01:05<02:02, 556.65 examples/s]Map:  40%|███▉      | 43702/110379 [01:05<01:41, 654.35 examples/s]Map:  38%|███▊      | 41989/110379 [01:05<01:28, 770.90 examples/s]Map:  40%|███▉      | 43763/110379 [01:05<01:31, 731.65 examples/s]Map:  38%|███▊      | 42292/110379 [01:05<01:59, 571.78 examples/s]Map:  40%|███▉      | 43801/110379 [01:06<01:41, 652.96 examples/s]Map:  38%|███▊      | 42374/110379 [01:05<01:46, 635.58 examples/s]Map:  40%|███▉      | 43853/110379 [01:05<01:37, 679.45 examples/s]Map:  38%|███▊      | 42442/110379 [01:05<01:45, 646.56 examples/s]Map:  38%|███▊      | 42075/110379 [01:06<01:59, 571.45 examples/s]Map:  40%|███▉      | 43895/110379 [01:06<01:43, 641.90 examples/s]Map:  40%|███▉      | 43948/110379 [01:05<01:40, 658.34 examples/s]Map:  38%|███▊      | 42155/110379 [01:06<01:49, 621.82 examples/s]Map:  39%|███▊      | 42539/110379 [01:05<01:46, 638.27 examples/s]Map:  40%|███▉      | 43993/110379 [01:06<01:43, 640.53 examples/s]Map:  38%|███▊      | 42228/110379 [01:06<01:45, 645.73 examples/s]Map:  39%|███▊      | 42611/110379 [01:05<01:43, 656.40 examples/s]Map:  39%|███▊      | 42679/110379 [01:05<01:42, 660.49 examples/s]Map:  40%|███▉      | 44031/110379 [01:05<02:13, 498.36 examples/s]Map:  38%|███▊      | 42330/110379 [01:06<01:43, 655.20 examples/s]Map:  40%|███▉      | 44074/110379 [01:06<02:12, 499.26 examples/s]Map:  39%|███▊      | 42753/110379 [01:05<01:39, 679.36 examples/s]Map:  40%|███▉      | 44114/110379 [01:05<01:57, 562.88 examples/s]Map:  38%|███▊      | 42409/110379 [01:06<01:38, 687.04 examples/s]Map:  40%|███▉      | 44144/110379 [01:06<02:03, 536.85 examples/s]Map:  39%|███▉      | 42822/110379 [01:05<01:39, 678.71 examples/s]Map:  40%|████      | 44193/110379 [01:06<01:48, 611.58 examples/s]Map:  38%|███▊      | 42490/110379 [01:06<01:34, 715.98 examples/s]Map:  40%|████      | 44221/110379 [01:06<01:52, 585.61 examples/s]Map:  39%|███▉      | 42898/110379 [01:06<01:36, 701.50 examples/s]Map:  40%|████      | 44270/110379 [01:06<01:41, 648.73 examples/s]Map:  39%|███▊      | 42600/110379 [01:06<01:34, 718.78 examples/s]Map:  40%|████      | 44301/110379 [01:06<01:44, 634.19 examples/s]Map:  39%|███▉      | 42981/110379 [01:06<01:31, 734.05 examples/s]Map:  40%|████      | 44355/110379 [01:06<01:34, 695.89 examples/s]Map:  39%|███▊      | 42675/110379 [01:07<01:33, 721.47 examples/s]Map:  40%|████      | 44381/110379 [01:07<01:37, 673.64 examples/s]Map:  40%|████      | 44435/110379 [01:06<01:31, 721.00 examples/s]Map:  39%|███▊      | 42753/110379 [01:07<01:32, 732.18 examples/s]Map:  40%|████      | 44463/110379 [01:07<01:32, 711.38 examples/s]Map:  40%|████      | 44517/110379 [01:06<01:28, 743.77 examples/s]Map:  39%|███▉      | 43075/110379 [01:06<02:01, 553.75 examples/s]Map:  39%|███▉      | 42832/110379 [01:07<01:30, 742.57 examples/s]Map:  40%|████      | 44541/110379 [01:07<01:30, 727.80 examples/s]Map:  40%|████      | 44599/110379 [01:06<01:26, 760.99 examples/s]Map:  39%|███▉      | 43151/110379 [01:06<01:52, 599.37 examples/s]Map:  39%|███▉      | 42917/110379 [01:07<01:27, 768.79 examples/s]Map:  40%|████      | 44679/110379 [01:06<01:25, 768.50 examples/s]Map:  40%|████      | 44655/110379 [01:07<01:29, 736.23 examples/s]Map:  39%|███▉      | 43227/110379 [01:06<01:45, 636.38 examples/s]Map:  39%|███▉      | 42998/110379 [01:07<01:26, 776.11 examples/s]Map:  41%|████      | 44763/110379 [01:06<01:23, 784.84 examples/s]Map:  39%|███▉      | 43307/110379 [01:06<01:39, 674.23 examples/s]Map:  41%|████      | 44759/110379 [01:07<01:31, 717.31 examples/s]Map:  39%|███▉      | 43381/110379 [01:06<01:37, 689.02 examples/s]Map:  41%|████      | 44881/110379 [01:06<01:23, 780.51 examples/s]Map:  41%|████      | 44836/110379 [01:07<01:29, 728.49 examples/s]Map:  39%|███▉      | 43455/110379 [01:06<01:35, 699.58 examples/s]Map:  39%|███▉      | 43110/110379 [01:07<01:56, 579.31 examples/s]Map:  41%|████      | 44988/110379 [01:07<01:26, 752.99 examples/s]Map:  41%|████      | 44943/110379 [01:07<01:30, 719.14 examples/s]Map:  39%|███▉      | 43533/110379 [01:06<01:33, 718.05 examples/s]Map:  39%|███▉      | 43191/110379 [01:07<01:47, 625.79 examples/s]Map:  40%|███▉      | 43630/110379 [01:07<01:37, 685.68 examples/s]Map:  39%|███▉      | 43298/110379 [01:07<01:43, 648.36 examples/s]Map:  41%|████      | 45076/110379 [01:07<01:55, 565.82 examples/s]Map:  40%|███▉      | 43703/110379 [01:07<01:36, 694.07 examples/s]Map:  41%|████      | 45039/110379 [01:08<01:58, 551.62 examples/s]Map:  39%|███▉      | 43381/110379 [01:08<01:38, 681.50 examples/s]Map:  41%|████      | 45156/110379 [01:07<01:46, 612.45 examples/s]Map:  40%|███▉      | 43779/110379 [01:07<01:33, 708.71 examples/s]Map:  39%|███▉      | 43457/110379 [01:08<01:35, 697.82 examples/s]Map:  41%|████      | 45121/110379 [01:08<01:59, 545.55 examples/s]Map:  41%|████      | 45231/110379 [01:07<01:41, 641.68 examples/s]Map:  40%|███▉      | 43855/110379 [01:07<01:32, 716.21 examples/s]Map:  39%|███▉      | 43537/110379 [01:08<01:32, 723.74 examples/s]Map:  41%|████      | 45188/110379 [01:08<01:54, 568.53 examples/s]Map:  41%|████      | 45313/110379 [01:07<01:35, 684.29 examples/s]Map:  40%|███▉      | 43617/110379 [01:08<01:29, 742.37 examples/s]Map:  40%|███▉      | 43937/110379 [01:07<01:42, 650.40 examples/s]Map:  41%|████      | 45254/110379 [01:08<01:50, 587.49 examples/s]Map:  41%|████      | 45394/110379 [01:07<01:30, 714.30 examples/s]Map:  40%|███▉      | 43728/110379 [01:08<01:30, 737.25 examples/s]Map:  41%|████      | 45480/110379 [01:07<01:38, 661.20 examples/s]Map:  41%|████      | 45346/110379 [01:08<01:50, 589.51 examples/s]Map:  40%|███▉      | 43804/110379 [01:08<01:29, 741.21 examples/s]Map:  41%|████      | 45411/110379 [01:08<01:48, 600.82 examples/s]Map:  40%|███▉      | 44035/110379 [01:07<02:10, 509.40 examples/s]Map:  40%|███▉      | 43881/110379 [01:08<01:29, 746.54 examples/s]Map:  41%|████▏     | 45571/110379 [01:08<01:41, 636.00 examples/s]Map:  40%|███▉      | 44101/110379 [01:07<02:02, 539.26 examples/s]Map:  40%|███▉      | 43960/110379 [01:08<01:27, 755.11 examples/s]Map:  41%|████      | 45498/110379 [01:08<01:50, 587.64 examples/s]Map:  41%|████▏     | 45660/110379 [01:08<01:45, 616.12 examples/s]Map:  40%|████      | 44174/110379 [01:08<01:54, 579.78 examples/s]Map:  41%|████▏     | 45561/110379 [01:08<01:49, 593.09 examples/s]Map:  41%|████▏     | 45731/110379 [01:08<01:41, 635.45 examples/s]Map:  40%|████      | 44251/110379 [01:08<01:45, 625.03 examples/s]Map:  41%|████▏     | 45625/110379 [01:09<01:47, 602.20 examples/s]Map:  40%|███▉      | 44037/110379 [01:09<02:01, 545.00 examples/s]Map:  42%|████▏     | 45811/110379 [01:08<01:35, 675.90 examples/s]Map:  40%|████      | 44325/110379 [01:08<01:41, 651.89 examples/s]Map:  41%|████▏     | 45690/110379 [01:09<01:45, 611.02 examples/s]Map:  40%|███▉      | 44122/110379 [01:09<01:48, 611.54 examples/s]Map:  42%|████▏     | 45884/110379 [01:08<01:33, 686.83 examples/s]Map:  40%|████      | 44397/110379 [01:08<01:38, 667.17 examples/s]Map:  41%|████▏     | 45784/110379 [01:09<01:45, 613.04 examples/s]Map:  40%|████      | 44218/110379 [01:09<01:47, 617.21 examples/s]Map:  42%|████▏     | 45978/110379 [01:08<01:37, 663.90 examples/s]Map:  40%|████      | 44499/110379 [01:08<01:38, 666.79 examples/s]Map:  42%|████▏     | 45847/110379 [01:09<01:45, 610.71 examples/s]Map:  40%|████      | 44287/110379 [01:09<01:44, 633.11 examples/s]Map:  40%|████      | 44570/110379 [01:08<01:37, 675.70 examples/s]Map:  42%|████▏     | 45919/110379 [01:09<01:41, 636.83 examples/s]Map:  40%|████      | 44367/110379 [01:09<01:37, 673.93 examples/s]Map:  40%|████      | 44649/110379 [01:08<01:33, 705.48 examples/s]Map:  42%|████▏     | 46062/110379 [01:08<02:09, 497.33 examples/s]Map:  40%|████      | 44445/110379 [01:09<01:34, 698.38 examples/s]Map:  41%|████      | 44727/110379 [01:08<01:30, 723.42 examples/s]Map:  42%|████▏     | 46125/110379 [01:09<02:03, 521.80 examples/s]Map:  40%|████      | 44521/110379 [01:09<01:32, 711.62 examples/s]Map:  42%|████▏     | 46000/110379 [01:09<02:23, 447.24 examples/s]Map:  41%|████      | 44841/110379 [01:08<01:29, 734.42 examples/s]Map:  42%|████▏     | 46199/110379 [01:09<01:52, 569.31 examples/s]Map:  40%|████      | 44633/110379 [01:09<01:31, 718.59 examples/s]Map:  42%|████▏     | 46055/110379 [01:09<02:18, 462.93 examples/s]Map:  42%|████▏     | 46277/110379 [01:09<01:43, 618.33 examples/s]Map:  41%|████      | 44952/110379 [01:09<01:29, 731.12 examples/s]Map:  41%|████      | 44708/110379 [01:10<01:30, 723.40 examples/s]Map:  42%|████▏     | 46129/110379 [01:10<02:03, 522.12 examples/s]Map:  42%|████▏     | 46345/110379 [01:09<01:41, 632.56 examples/s]Map:  41%|████      | 44788/110379 [01:10<01:28, 739.07 examples/s]Map:  42%|████▏     | 46204/110379 [01:10<01:51, 573.21 examples/s]Map:  42%|████▏     | 46441/110379 [01:09<01:41, 632.44 examples/s]Map:  41%|████      | 44864/110379 [01:10<01:28, 743.83 examples/s]Map:  41%|████      | 45036/110379 [01:09<01:54, 568.21 examples/s]Map:  42%|████▏     | 46289/110379 [01:10<01:53, 566.88 examples/s]Map:  41%|████      | 45112/110379 [01:09<01:47, 604.61 examples/s]Map:  42%|████▏     | 46537/110379 [01:09<01:40, 632.78 examples/s]Map:  41%|████      | 44971/110379 [01:10<01:29, 729.01 examples/s]Map:  41%|████      | 45190/110379 [01:09<01:41, 640.78 examples/s]Map:  42%|████▏     | 46370/110379 [01:10<01:55, 553.79 examples/s]Map:  42%|████▏     | 46609/110379 [01:09<01:37, 652.38 examples/s]Map:  41%|████      | 45263/110379 [01:09<01:38, 660.14 examples/s]Map:  42%|████▏     | 46688/110379 [01:09<01:33, 680.92 examples/s]Map:  42%|████▏     | 46453/110379 [01:10<01:55, 552.47 examples/s]Map:  41%|████      | 45340/110379 [01:09<01:34, 685.99 examples/s]Map:  41%|████      | 45061/110379 [01:10<02:04, 524.49 examples/s]Map:  42%|████▏     | 46764/110379 [01:09<01:30, 699.54 examples/s]Map:  42%|████▏     | 46518/110379 [01:10<01:51, 570.39 examples/s]Map:  41%|████      | 45418/110379 [01:09<01:31, 709.27 examples/s]Map:  41%|████      | 45125/110379 [01:10<01:59, 546.85 examples/s]Map:  42%|████▏     | 46844/110379 [01:10<01:27, 724.66 examples/s]Map:  41%|████      | 45192/110379 [01:10<01:53, 572.91 examples/s]Map:  42%|████▏     | 46602/110379 [01:10<01:53, 561.55 examples/s]Map:  41%|████      | 45515/110379 [01:10<01:34, 683.79 examples/s]Map:  43%|████▎     | 46943/110379 [01:10<01:31, 695.91 examples/s]Map:  41%|████      | 45266/110379 [01:10<01:46, 609.22 examples/s]Map:  42%|████▏     | 46676/110379 [01:10<01:46, 599.79 examples/s]Map:  41%|████▏     | 45616/110379 [01:10<01:35, 678.19 examples/s]Map:  41%|████      | 45344/110379 [01:11<01:40, 649.81 examples/s]Map:  42%|████▏     | 46752/110379 [01:11<01:39, 637.23 examples/s]Map:  41%|████▏     | 45697/110379 [01:10<01:31, 706.40 examples/s]Map:  41%|████      | 45424/110379 [01:11<01:34, 688.01 examples/s]Map:  42%|████▏     | 46829/110379 [01:11<01:34, 669.31 examples/s]Map:  43%|████▎     | 47029/110379 [01:10<02:08, 493.92 examples/s]Map:  41%|████▏     | 45777/110379 [01:10<01:28, 728.61 examples/s]Map:  41%|████      | 45502/110379 [01:11<01:31, 712.30 examples/s]Map:  42%|████▏     | 46902/110379 [01:11<01:33, 681.54 examples/s]Map:  43%|████▎     | 47093/110379 [01:10<02:01, 521.47 examples/s]Map:  41%|████▏     | 45586/110379 [01:11<01:26, 745.85 examples/s]Map:  43%|████▎     | 46989/110379 [01:11<01:26, 730.60 examples/s]Map:  42%|████▏     | 45889/110379 [01:10<01:28, 732.55 examples/s]Map:  43%|████▎     | 47168/110379 [01:10<01:50, 570.60 examples/s]Map:  42%|████▏     | 45965/110379 [01:10<01:27, 738.63 examples/s]Map:  43%|████▎     | 47237/110379 [01:10<01:45, 598.01 examples/s]Map:  41%|████▏     | 45697/110379 [01:11<01:27, 736.06 examples/s]Map:  43%|████▎     | 47306/110379 [01:10<01:41, 619.63 examples/s]Map:  43%|████▎     | 47084/110379 [01:11<01:52, 563.47 examples/s]Map:  41%|████▏     | 45777/110379 [01:11<01:26, 750.81 examples/s]Map:  43%|████▎     | 47373/110379 [01:10<01:39, 630.53 examples/s]Map:  43%|████▎     | 47163/110379 [01:11<01:43, 612.98 examples/s]Map:  42%|████▏     | 45854/110379 [01:11<01:25, 753.49 examples/s]Map:  42%|████▏     | 46079/110379 [01:10<01:50, 579.86 examples/s]Map:  43%|████▎     | 47246/110379 [01:11<01:34, 665.41 examples/s]Map:  43%|████▎     | 47449/110379 [01:11<01:34, 663.80 examples/s]Map:  42%|████▏     | 45966/110379 [01:11<01:25, 750.25 examples/s]Map:  42%|████▏     | 46157/110379 [01:11<01:43, 620.01 examples/s]Map:  43%|████▎     | 47320/110379 [01:11<01:32, 683.92 examples/s]Map:  43%|████▎     | 47529/110379 [01:11<01:30, 696.62 examples/s]Map:  42%|████▏     | 46236/110379 [01:11<01:37, 655.97 examples/s]Map:  43%|████▎     | 47394/110379 [01:12<01:30, 698.09 examples/s]Map:  43%|████▎     | 47602/110379 [01:11<01:29, 703.76 examples/s]Map:  42%|████▏     | 46316/110379 [01:11<01:33, 688.11 examples/s]Map:  43%|████▎     | 47477/110379 [01:12<01:25, 732.54 examples/s]Map:  42%|████▏     | 46077/110379 [01:12<01:51, 577.46 examples/s]Map:  43%|████▎     | 47705/110379 [01:11<01:30, 695.07 examples/s]Map:  42%|████▏     | 46393/110379 [01:11<01:30, 706.36 examples/s]Map:  43%|████▎     | 47555/110379 [01:12<01:24, 741.91 examples/s]Map:  42%|████▏     | 46152/110379 [01:12<01:45, 610.62 examples/s]Map:  43%|████▎     | 47786/110379 [01:11<01:26, 724.69 examples/s]Map:  42%|████▏     | 46473/110379 [01:11<01:27, 731.10 examples/s]Map:  43%|████▎     | 47632/110379 [01:12<01:24, 742.85 examples/s]Map:  42%|████▏     | 46225/110379 [01:12<01:41, 632.87 examples/s]Map:  43%|████▎     | 47890/110379 [01:11<01:27, 711.12 examples/s]Map:  42%|████▏     | 46575/110379 [01:11<01:30, 708.83 examples/s]Map:  42%|████▏     | 46297/110379 [01:12<01:38, 652.73 examples/s]Map:  43%|████▎     | 47740/110379 [01:12<01:25, 730.31 examples/s]Map:  43%|████▎     | 47971/110379 [01:11<01:25, 733.99 examples/s]Map:  42%|████▏     | 46375/110379 [01:12<01:33, 681.12 examples/s]Map:  43%|████▎     | 47818/110379 [01:12<01:24, 740.81 examples/s]Map:  42%|████▏     | 46684/110379 [01:11<01:29, 709.68 examples/s]Map:  42%|████▏     | 46450/110379 [01:12<01:31, 698.03 examples/s]Map:  42%|████▏     | 46764/110379 [01:11<01:27, 729.49 examples/s]Map:  43%|████▎     | 47933/110379 [01:12<01:23, 744.20 examples/s]Map:  42%|████▏     | 46526/110379 [01:12<01:29, 712.57 examples/s]Map:  44%|████▎     | 48079/110379 [01:12<01:47, 578.58 examples/s]Map:  42%|████▏     | 46841/110379 [01:11<01:26, 738.45 examples/s]Map:  42%|████▏     | 46602/110379 [01:12<01:28, 719.40 examples/s]Map:  44%|████▎     | 48157/110379 [01:12<01:40, 619.31 examples/s]Map:  43%|████▎     | 46932/110379 [01:12<01:32, 686.76 examples/s]Map:  42%|████▏     | 46680/110379 [01:12<01:26, 732.79 examples/s]Map:  44%|████▎     | 48231/110379 [01:12<01:36, 644.49 examples/s]Map:  44%|████▎     | 48040/110379 [01:12<01:45, 588.18 examples/s]Map:  42%|████▏     | 46761/110379 [01:13<01:24, 750.85 examples/s]Map:  44%|████▍     | 48307/110379 [01:12<01:32, 672.25 examples/s]Map:  44%|████▎     | 48120/110379 [01:13<01:39, 628.41 examples/s]Map:  42%|████▏     | 46842/110379 [01:13<01:23, 765.10 examples/s]Map:  44%|████▍     | 48385/110379 [01:12<01:29, 696.04 examples/s]Map:  44%|████▎     | 48201/110379 [01:13<01:32, 668.87 examples/s]Map:  43%|████▎     | 47033/110379 [01:12<01:57, 536.84 examples/s]Map:  44%|████▍     | 48460/110379 [01:12<01:27, 706.07 examples/s]Map:  44%|████▎     | 48281/110379 [01:13<01:28, 697.96 examples/s]Map:  43%|████▎     | 47108/110379 [01:12<01:49, 579.09 examples/s]Map:  43%|████▎     | 46954/110379 [01:13<01:24, 751.43 examples/s]Map:  44%|████▍     | 48533/110379 [01:12<01:27, 709.78 examples/s]Map:  44%|████▍     | 48358/110379 [01:13<01:27, 710.74 examples/s]Map:  43%|████▎     | 47181/110379 [01:12<01:43, 610.80 examples/s]Map:  44%|████▍     | 48434/110379 [01:13<01:26, 719.23 examples/s]Map:  43%|████▎     | 47256/110379 [01:12<01:38, 639.03 examples/s]Map:  44%|████▍     | 48641/110379 [01:12<01:27, 708.14 examples/s]Map:  43%|████▎     | 47033/110379 [01:13<01:57, 537.63 examples/s]Map:  44%|████▍     | 48514/110379 [01:13<01:23, 739.50 examples/s]Map:  43%|████▎     | 47333/110379 [01:12<01:33, 670.95 examples/s]Map:  44%|████▍     | 48718/110379 [01:12<01:25, 723.11 examples/s]Map:  43%|████▎     | 47108/110379 [01:13<01:48, 581.31 examples/s]Map:  44%|████▍     | 48792/110379 [01:13<01:24, 724.84 examples/s]Map:  44%|████▍     | 48623/110379 [01:13<01:24, 730.68 examples/s]Map:  43%|████▎     | 47435/110379 [01:12<01:34, 668.76 examples/s]Map:  43%|████▎     | 47179/110379 [01:13<01:43, 610.28 examples/s]Map:  44%|████▍     | 48702/110379 [01:13<01:22, 743.79 examples/s]Map:  43%|████▎     | 47512/110379 [01:13<01:31, 689.55 examples/s]Map:  43%|████▎     | 47251/110379 [01:13<01:39, 636.93 examples/s]Map:  44%|████▍     | 48904/110379 [01:13<01:24, 729.74 examples/s]Map:  43%|████▎     | 47590/110379 [01:13<01:28, 712.71 examples/s]Map:  44%|████▍     | 48983/110379 [01:13<01:23, 738.94 examples/s]Map:  44%|████▍     | 48809/110379 [01:13<01:24, 728.38 examples/s]Map:  43%|████▎     | 47343/110379 [01:14<01:40, 625.77 examples/s]Map:  43%|████▎     | 47668/110379 [01:13<01:26, 728.15 examples/s]Map:  44%|████▍     | 48890/110379 [01:14<01:22, 745.25 examples/s]Map:  43%|████▎     | 47747/110379 [01:13<01:24, 743.06 examples/s]Map:  43%|████▎     | 47422/110379 [01:14<01:46, 589.90 examples/s]Map:  44%|████▍     | 49071/110379 [01:13<01:50, 553.41 examples/s]Map:  44%|████▍     | 48994/110379 [01:14<01:24, 722.46 examples/s]Map:  43%|████▎     | 47829/110379 [01:13<01:22, 759.96 examples/s]Map:  43%|████▎     | 47495/110379 [01:14<01:41, 620.85 examples/s]Map:  45%|████▍     | 49152/110379 [01:13<01:40, 607.06 examples/s]Map:  43%|████▎     | 47568/110379 [01:14<01:37, 645.12 examples/s]Map:  43%|████▎     | 47933/110379 [01:13<01:25, 733.33 examples/s]Map:  45%|████▍     | 49230/110379 [01:13<01:34, 644.63 examples/s]Map:  43%|████▎     | 47639/110379 [01:14<01:35, 658.43 examples/s]Map:  45%|████▍     | 49304/110379 [01:13<01:31, 667.68 examples/s]Map:  44%|████▍     | 49089/110379 [01:14<02:02, 501.02 examples/s]Map:  43%|████▎     | 47715/110379 [01:14<01:31, 684.91 examples/s]Map:  45%|████▍     | 49381/110379 [01:13<01:28, 690.59 examples/s]Map:  45%|████▍     | 49155/110379 [01:14<01:55, 529.06 examples/s]Map:  43%|████▎     | 47796/110379 [01:14<01:27, 717.81 examples/s]Map:  44%|████▎     | 48031/110379 [01:13<02:02, 510.90 examples/s]Map:  45%|████▍     | 49460/110379 [01:14<01:25, 715.56 examples/s]Map:  45%|████▍     | 49219/110379 [01:14<01:51, 550.68 examples/s]Map:  44%|████▎     | 48108/110379 [01:13<01:51, 559.60 examples/s]Map:  43%|████▎     | 47900/110379 [01:14<01:29, 697.35 examples/s]Map:  45%|████▍     | 49539/110379 [01:14<01:22, 733.24 examples/s]Map:  45%|████▍     | 49287/110379 [01:14<01:46, 575.05 examples/s]Map:  44%|████▎     | 48191/110379 [01:14<01:41, 615.70 examples/s]Map:  45%|████▍     | 49355/110379 [01:14<01:41, 598.43 examples/s]Map:  43%|████▎     | 47995/110379 [01:14<01:32, 671.97 examples/s]Map:  45%|████▍     | 49643/110379 [01:14<01:25, 711.98 examples/s]Map:  45%|████▍     | 49429/110379 [01:15<01:36, 633.45 examples/s]Map:  44%|████▎     | 48290/110379 [01:14<01:38, 628.30 examples/s]Map:  45%|████▌     | 49754/110379 [01:14<01:24, 718.89 examples/s]Map:  45%|████▍     | 49499/110379 [01:15<01:34, 646.97 examples/s]Map:  44%|████▍     | 48366/110379 [01:14<01:34, 657.16 examples/s]Map:  45%|████▌     | 49831/110379 [01:14<01:22, 729.99 examples/s]Map:  45%|████▍     | 49570/110379 [01:15<01:32, 660.48 examples/s]Map:  44%|████▎     | 48096/110379 [01:15<02:09, 482.05 examples/s]Map:  44%|████▍     | 48457/110379 [01:14<01:36, 639.30 examples/s]Map:  45%|████▍     | 49645/110379 [01:15<01:28, 684.00 examples/s]Map:  44%|████▎     | 48177/110379 [01:15<01:54, 541.03 examples/s]Map:  45%|████▌     | 49717/110379 [01:15<01:28, 688.96 examples/s]Map:  44%|████▍     | 48549/110379 [01:14<01:38, 625.85 examples/s]Map:  45%|████▌     | 49910/110379 [01:14<01:54, 529.65 examples/s]Map:  44%|████▎     | 48249/110379 [01:15<01:47, 577.94 examples/s]Map:  45%|████▌     | 49793/110379 [01:15<01:25, 707.28 examples/s]Map:  45%|████▌     | 49978/110379 [01:14<01:47, 560.42 examples/s]Map:  44%|████▍     | 48644/110379 [01:14<01:38, 623.96 examples/s]Map:  44%|████▍     | 48345/110379 [01:15<01:44, 595.97 examples/s]Map:  45%|████▌     | 49867/110379 [01:15<01:24, 712.73 examples/s]Map:  44%|████▍     | 48735/110379 [01:14<01:40, 614.99 examples/s]Map:  44%|████▍     | 48438/110379 [01:15<01:43, 599.71 examples/s]Map:  45%|████▌     | 50079/110379 [01:15<02:05, 480.11 examples/s]Map:  44%|████▍     | 48800/110379 [01:15<01:39, 619.40 examples/s]Map:  44%|████▍     | 48531/110379 [01:15<01:42, 603.56 examples/s]Map:  45%|████▌     | 50154/110379 [01:15<01:53, 531.08 examples/s]Map:  45%|████▌     | 49947/110379 [01:16<02:22, 424.88 examples/s]Map:  44%|████▍     | 48886/110379 [01:15<01:42, 598.84 examples/s]Map:  46%|████▌     | 50225/110379 [01:15<01:46, 567.33 examples/s]Map:  44%|████▍     | 48619/110379 [01:16<01:44, 593.73 examples/s]Map:  44%|████▍     | 48960/110379 [01:15<01:37, 629.08 examples/s]Map:  46%|████▌     | 50307/110379 [01:15<01:36, 624.87 examples/s]Map:  44%|████▍     | 48684/110379 [01:16<01:42, 603.49 examples/s]Map:  46%|████▌     | 50386/110379 [01:15<01:30, 664.82 examples/s]Map:  45%|████▌     | 50027/110379 [01:16<02:49, 356.56 examples/s]Map:  44%|████▍     | 48765/110379 [01:16<01:46, 579.94 examples/s]Map:  46%|████▌     | 50458/110379 [01:15<01:28, 678.84 examples/s]Map:  44%|████▍     | 49025/110379 [01:15<02:17, 445.80 examples/s]Map:  45%|████▌     | 50084/110379 [01:16<02:34, 391.27 examples/s]Map:  44%|████▍     | 48830/110379 [01:16<01:43, 593.83 examples/s]Map:  44%|████▍     | 49096/110379 [01:15<02:02, 498.37 examples/s]Map:  46%|████▌     | 50557/110379 [01:15<01:29, 666.29 examples/s]Map:  45%|████▌     | 50142/110379 [01:16<02:21, 426.45 examples/s]Map:  45%|████▍     | 49161/110379 [01:15<01:55, 531.05 examples/s]Map:  44%|████▍     | 48918/110379 [01:16<01:45, 584.01 examples/s]Map:  45%|████▌     | 50205/110379 [01:16<02:08, 468.60 examples/s]Map:  46%|████▌     | 50654/110379 [01:15<01:31, 653.12 examples/s]Map:  45%|████▍     | 49229/110379 [01:15<01:48, 563.51 examples/s]Map:  44%|████▍     | 48982/110379 [01:16<01:43, 593.16 examples/s]Map:  46%|████▌     | 50281/110379 [01:16<01:52, 533.35 examples/s]Map:  45%|████▍     | 49292/110379 [01:15<01:45, 578.58 examples/s]Map:  46%|████▌     | 50748/110379 [01:16<01:32, 642.20 examples/s]Map:  46%|████▌     | 50354/110379 [01:16<01:43, 579.01 examples/s]Map:  46%|████▌     | 50817/110379 [01:16<01:31, 652.39 examples/s]Map:  46%|████▌     | 50425/110379 [01:16<01:38, 610.76 examples/s]Map:  45%|████▍     | 49380/110379 [01:16<01:45, 579.37 examples/s]Map:  44%|████▍     | 49058/110379 [01:17<02:24, 423.64 examples/s]Map:  46%|████▌     | 50496/110379 [01:17<01:34, 636.23 examples/s]Map:  46%|████▌     | 50907/110379 [01:16<01:34, 631.71 examples/s]Map:  45%|████▍     | 49467/110379 [01:16<01:45, 575.76 examples/s]Map:  44%|████▍     | 49114/110379 [01:17<02:16, 447.30 examples/s]Map:  46%|████▌     | 50572/110379 [01:17<01:29, 667.99 examples/s]Map:  45%|████▍     | 49534/110379 [01:16<01:42, 596.26 examples/s]Map:  45%|████▍     | 49190/110379 [01:17<01:59, 512.80 examples/s]Map:  46%|████▌     | 50649/110379 [01:17<01:26, 693.13 examples/s]Map:  45%|████▍     | 49598/110379 [01:16<01:40, 606.47 examples/s]Map:  45%|████▍     | 49272/110379 [01:17<01:45, 581.84 examples/s]Map:  46%|████▌     | 51000/110379 [01:16<02:06, 469.06 examples/s]Map:  46%|████▌     | 50755/110379 [01:17<01:26, 691.39 examples/s]Map:  45%|████▍     | 49665/110379 [01:16<01:37, 620.78 examples/s]Map:  45%|████▍     | 49341/110379 [01:17<01:40, 606.32 examples/s]Map:  46%|████▋     | 51059/110379 [01:16<02:01, 489.97 examples/s]Map:  46%|████▌     | 50831/110379 [01:17<01:24, 704.94 examples/s]Map:  45%|████▍     | 49417/110379 [01:17<01:34, 645.06 examples/s]Map:  45%|████▌     | 49755/110379 [01:16<01:39, 608.22 examples/s]Map:  46%|████▋     | 51123/110379 [01:16<01:53, 520.32 examples/s]Map:  46%|████▌     | 50904/110379 [01:17<01:23, 708.05 examples/s]Map:  45%|████▍     | 49493/110379 [01:17<01:31, 667.73 examples/s]Map:  45%|████▌     | 49817/110379 [01:16<01:39, 609.82 examples/s]Map:  46%|████▋     | 51192/110379 [01:16<01:46, 557.41 examples/s]Map:  46%|████▌     | 50977/110379 [01:17<01:23, 710.43 examples/s]Map:  45%|████▍     | 49575/110379 [01:17<01:38, 617.74 examples/s]Map:  46%|████▋     | 51284/110379 [01:17<01:43, 572.93 examples/s]Map:  45%|████▌     | 49884/110379 [01:17<02:20, 429.38 examples/s]Map:  47%|████▋     | 51359/110379 [01:17<01:36, 613.57 examples/s]Map:  45%|████▍     | 49648/110379 [01:17<01:46, 568.87 examples/s]Map:  46%|████▋     | 51075/110379 [01:17<01:50, 538.92 examples/s]Map:  47%|████▋     | 51436/110379 [01:17<01:30, 651.98 examples/s]Map:  45%|████▌     | 49717/110379 [01:18<01:41, 595.68 examples/s]Map:  45%|████▌     | 49947/110379 [01:17<02:09, 467.10 examples/s]Map:  46%|████▋     | 51146/110379 [01:18<01:43, 573.63 examples/s]Map:  45%|████▌     | 49788/110379 [01:18<01:37, 623.93 examples/s]Map:  47%|████▋     | 51527/110379 [01:17<01:33, 631.44 examples/s]Map:  46%|████▋     | 51228/110379 [01:18<01:47, 552.71 examples/s]Map:  45%|████▌     | 49854/110379 [01:18<01:35, 632.11 examples/s]Map:  45%|████▌     | 50038/110379 [01:17<02:29, 402.89 examples/s]Map:  46%|████▋     | 51291/110379 [01:18<01:44, 567.94 examples/s]Map:  47%|████▋     | 51614/110379 [01:17<01:36, 608.52 examples/s]Map:  45%|████▌     | 50117/110379 [01:17<02:07, 474.43 examples/s]Map:  47%|████▋     | 51359/110379 [01:18<01:39, 593.94 examples/s]Map:  47%|████▋     | 51709/110379 [01:17<01:35, 611.74 examples/s]Map:  45%|████▌     | 49919/110379 [01:18<02:19, 433.68 examples/s]Map:  45%|████▌     | 50193/110379 [01:17<01:53, 531.73 examples/s]Map:  47%|████▋     | 51437/110379 [01:18<01:32, 640.41 examples/s]Map:  45%|████▌     | 49997/110379 [01:18<01:59, 506.51 examples/s]Map:  46%|████▌     | 50277/110379 [01:17<01:39, 602.29 examples/s]Map:  47%|████▋     | 51511/110379 [01:18<01:28, 663.40 examples/s]Map:  47%|████▋     | 51800/110379 [01:17<01:36, 608.95 examples/s]Map:  46%|████▌     | 50358/110379 [01:17<01:32, 650.30 examples/s]Map:  47%|████▋     | 51581/110379 [01:18<01:27, 670.86 examples/s]Map:  47%|████▋     | 51892/110379 [01:18<01:36, 605.84 examples/s]Map:  46%|████▌     | 50436/110379 [01:18<01:27, 682.69 examples/s]Map:  47%|████▋     | 51656/110379 [01:18<01:25, 689.85 examples/s]Map:  45%|████▌     | 50073/110379 [01:18<02:22, 423.03 examples/s]Map:  47%|████▋     | 51964/110379 [01:18<01:32, 630.74 examples/s]Map:  46%|████▌     | 50514/110379 [01:18<01:24, 706.60 examples/s]Map:  47%|████▋     | 51731/110379 [01:18<01:23, 704.71 examples/s]Map:  45%|████▌     | 50153/110379 [01:18<02:01, 496.31 examples/s]Map:  46%|████▌     | 50592/110379 [01:18<01:22, 723.06 examples/s]Map:  47%|████▋     | 51809/110379 [01:19<01:21, 722.80 examples/s]Map:  46%|████▌     | 50234/110379 [01:19<01:46, 563.75 examples/s]Map:  47%|████▋     | 52036/110379 [01:18<01:54, 507.82 examples/s]Map:  46%|████▌     | 50668/110379 [01:18<01:22, 727.56 examples/s]Map:  47%|████▋     | 51884/110379 [01:19<01:20, 724.75 examples/s]Map:  46%|████▌     | 50316/110379 [01:19<01:36, 622.87 examples/s]Map:  47%|████▋     | 52107/110379 [01:18<01:45, 550.01 examples/s]Map:  46%|████▌     | 50745/110379 [01:18<01:21, 736.03 examples/s]Map:  46%|████▌     | 50402/110379 [01:19<01:28, 679.29 examples/s]Map:  47%|████▋     | 51996/110379 [01:19<01:20, 727.02 examples/s]Map:  47%|████▋     | 52183/110379 [01:18<01:37, 598.10 examples/s]Map:  46%|████▌     | 50857/110379 [01:18<01:20, 738.11 examples/s]Map:  46%|████▌     | 50512/110379 [01:19<01:26, 693.94 examples/s]Map:  47%|████▋     | 52248/110379 [01:18<01:35, 608.50 examples/s]Map:  47%|████▋     | 52313/110379 [01:18<01:33, 618.38 examples/s]Map:  46%|████▌     | 50960/110379 [01:18<01:23, 714.38 examples/s]Map:  46%|████▌     | 50612/110379 [01:19<01:27, 681.99 examples/s]Map:  47%|████▋     | 52099/110379 [01:19<01:47, 540.25 examples/s]Map:  47%|████▋     | 52384/110379 [01:18<01:30, 641.87 examples/s]Map:  47%|████▋     | 52171/110379 [01:19<01:40, 576.36 examples/s]Map:  46%|████▌     | 50705/110379 [01:19<01:30, 659.89 examples/s]Map:  48%|████▊     | 52463/110379 [01:19<01:25, 680.10 examples/s]Map:  47%|████▋     | 52249/110379 [01:19<01:33, 621.37 examples/s]Map:  48%|████▊     | 52539/110379 [01:19<01:22, 699.10 examples/s]Map:  46%|████▋     | 51061/110379 [01:19<01:52, 528.02 examples/s]Map:  46%|████▌     | 50800/110379 [01:19<01:32, 644.18 examples/s]Map:  47%|████▋     | 52329/110379 [01:19<01:27, 661.23 examples/s]Map:  46%|████▋     | 51128/110379 [01:19<01:47, 553.74 examples/s]Map:  46%|████▌     | 50877/110379 [01:20<01:28, 669.57 examples/s]Map:  48%|████▊     | 52637/110379 [01:19<01:24, 679.85 examples/s]Map:  47%|████▋     | 52420/110379 [01:20<01:30, 639.67 examples/s]Map:  46%|████▋     | 51205/110379 [01:19<01:38, 598.74 examples/s]Map:  46%|████▌     | 50959/110379 [01:20<01:24, 704.43 examples/s]Map:  48%|████▊     | 52735/110379 [01:19<01:26, 668.92 examples/s]Map:  48%|████▊     | 52492/110379 [01:20<01:28, 654.84 examples/s]Map:  46%|████▋     | 51280/110379 [01:19<01:33, 632.63 examples/s]Map:  47%|████▋     | 51352/110379 [01:19<01:30, 652.54 examples/s]Map:  48%|████▊     | 52833/110379 [01:19<01:27, 658.76 examples/s]Map:  48%|████▊     | 52581/110379 [01:20<01:31, 629.23 examples/s]Map:  46%|████▌     | 51038/110379 [01:20<01:48, 547.93 examples/s]Map:  47%|████▋     | 51458/110379 [01:19<01:28, 666.30 examples/s]Map:  46%|████▋     | 51117/110379 [01:20<01:39, 598.56 examples/s]Map:  48%|████▊     | 52922/110379 [01:19<01:30, 634.54 examples/s]Map:  48%|████▊     | 52675/110379 [01:20<01:32, 624.30 examples/s]Map:  47%|████▋     | 51530/110379 [01:19<01:27, 671.45 examples/s]Map:  46%|████▋     | 51211/110379 [01:20<01:38, 603.28 examples/s]Map:  48%|████▊     | 52760/110379 [01:20<01:35, 604.49 examples/s]Map:  47%|████▋     | 51605/110379 [01:19<01:25, 688.01 examples/s]Map:  48%|████▊     | 52830/110379 [01:20<01:32, 622.61 examples/s]Map:  46%|████▋     | 51308/110379 [01:20<01:36, 613.69 examples/s]Map:  48%|████▊     | 53000/110379 [01:20<02:02, 469.35 examples/s]Map:  47%|████▋     | 51698/110379 [01:19<01:30, 645.96 examples/s]Map:  47%|████▋     | 51373/110379 [01:20<01:35, 618.63 examples/s]Map:  48%|████▊     | 53066/110379 [01:20<01:54, 502.68 examples/s]Map:  48%|████▊     | 52924/110379 [01:20<01:32, 619.38 examples/s]Map:  47%|████▋     | 51440/110379 [01:20<01:33, 629.46 examples/s]Map:  47%|████▋     | 51790/110379 [01:20<01:32, 631.44 examples/s]Map:  48%|████▊     | 53131/110379 [01:20<01:47, 533.07 examples/s]Map:  48%|████▊     | 53205/110379 [01:20<01:38, 578.60 examples/s]Map:  47%|████▋     | 51534/110379 [01:21<01:34, 623.00 examples/s]Map:  47%|████▋     | 51884/110379 [01:20<01:33, 627.44 examples/s]Map:  48%|████▊     | 53000/110379 [01:21<02:04, 461.90 examples/s]Map:  48%|████▊     | 53273/110379 [01:20<01:34, 602.12 examples/s]Map:  47%|████▋     | 51973/110379 [01:20<01:34, 615.21 examples/s]Map:  48%|████▊     | 53060/110379 [01:21<01:57, 487.42 examples/s]Map:  47%|████▋     | 51628/110379 [01:21<01:34, 620.25 examples/s]Map:  48%|████▊     | 53353/110379 [01:20<01:27, 652.05 examples/s]Map:  48%|████▊     | 53122/110379 [01:21<01:51, 514.30 examples/s]Map:  48%|████▊     | 53435/110379 [01:20<01:21, 695.33 examples/s]Map:  47%|████▋     | 51721/110379 [01:21<01:35, 615.87 examples/s]Map:  48%|████▊     | 53185/110379 [01:21<01:45, 539.72 examples/s]Map:  48%|████▊     | 53514/110379 [01:20<01:19, 717.55 examples/s]Map:  47%|████▋     | 52036/110379 [01:20<02:00, 485.38 examples/s]Map:  48%|████▊     | 53246/110379 [01:21<01:42, 556.39 examples/s]Map:  47%|████▋     | 51810/110379 [01:21<01:37, 603.77 examples/s]Map:  49%|████▊     | 53593/110379 [01:20<01:17, 735.66 examples/s]Map:  47%|████▋     | 52112/110379 [01:20<01:48, 538.60 examples/s]Map:  48%|████▊     | 53312/110379 [01:21<01:38, 580.32 examples/s]Map:  47%|████▋     | 51876/110379 [01:21<01:35, 615.56 examples/s]Map:  47%|████▋     | 52190/110379 [01:20<01:38, 591.59 examples/s]Map:  49%|████▊     | 53708/110379 [01:20<01:16, 744.09 examples/s]Map:  48%|████▊     | 53376/110379 [01:21<01:36, 591.79 examples/s]Map:  47%|████▋     | 51943/110379 [01:21<01:33, 622.86 examples/s]Map:  47%|████▋     | 52290/110379 [01:20<01:34, 611.89 examples/s]Map:  48%|████▊     | 53453/110379 [01:21<01:29, 638.01 examples/s]Map:  49%|████▉     | 53811/110379 [01:21<01:18, 718.35 examples/s]Map:  47%|████▋     | 52364/110379 [01:21<01:30, 638.25 examples/s]Map:  48%|████▊     | 53530/110379 [01:21<01:24, 670.70 examples/s]Map:  49%|████▉     | 53908/110379 [01:21<01:21, 694.23 examples/s]Map:  48%|████▊     | 52441/110379 [01:21<01:26, 669.69 examples/s]Map:  47%|████▋     | 52029/110379 [01:22<02:07, 459.08 examples/s]Map:  49%|████▊     | 53600/110379 [01:22<01:23, 678.02 examples/s]Map:  49%|████▉     | 53985/110379 [01:21<01:19, 709.10 examples/s]Map:  48%|████▊     | 52517/110379 [01:21<01:23, 690.15 examples/s]Map:  47%|████▋     | 52090/110379 [01:22<01:59, 486.02 examples/s]Map:  49%|████▊     | 53699/110379 [01:22<01:25, 664.83 examples/s]Map:  48%|████▊     | 52593/110379 [01:21<01:22, 704.38 examples/s]Map:  47%|████▋     | 52165/110379 [01:22<01:47, 543.39 examples/s]Map:  48%|████▊     | 52669/110379 [01:21<01:20, 713.61 examples/s]Map:  47%|████▋     | 52245/110379 [01:22<01:36, 602.77 examples/s]Map:  49%|████▉     | 54081/110379 [01:21<01:40, 560.83 examples/s]Map:  49%|████▊     | 53792/110379 [01:22<01:27, 646.54 examples/s]Map:  48%|████▊     | 52743/110379 [01:21<01:20, 716.20 examples/s]Map:  47%|████▋     | 52321/110379 [01:22<01:30, 639.00 examples/s]Map:  49%|████▉     | 54160/110379 [01:21<01:32, 607.68 examples/s]Map:  49%|████▉     | 53884/110379 [01:22<01:29, 631.83 examples/s]Map:  49%|████▉     | 54232/110379 [01:21<01:28, 630.97 examples/s]Map:  48%|████▊     | 52847/110379 [01:21<01:21, 704.88 examples/s]Map:  47%|████▋     | 52424/110379 [01:22<01:29, 649.00 examples/s]Map:  49%|████▉     | 53980/110379 [01:22<01:29, 632.30 examples/s]Map:  49%|████▉     | 54335/110379 [01:21<01:26, 648.13 examples/s]Map:  48%|████▊     | 52935/110379 [01:21<01:27, 658.18 examples/s]Map:  48%|████▊     | 52523/110379 [01:22<01:29, 649.39 examples/s]Map:  49%|████▉     | 54431/110379 [01:22<01:27, 641.40 examples/s]Map:  48%|████▊     | 52612/110379 [01:22<01:32, 627.82 examples/s]Map:  49%|████▉     | 54060/110379 [01:22<01:59, 469.80 examples/s]Map:  49%|████▉     | 54502/110379 [01:22<01:25, 655.24 examples/s]Map:  49%|████▉     | 54121/110379 [01:23<01:53, 495.07 examples/s]Map:  48%|████▊     | 53030/110379 [01:22<02:02, 468.70 examples/s]Map:  48%|████▊     | 52705/110379 [01:23<01:32, 623.18 examples/s]Map:  49%|████▉     | 54577/110379 [01:22<01:22, 678.04 examples/s]Map:  49%|████▉     | 54187/110379 [01:23<01:46, 527.01 examples/s]Map:  48%|████▊     | 53098/110379 [01:22<01:53, 505.18 examples/s]Map:  48%|████▊     | 52769/110379 [01:23<01:32, 623.72 examples/s]Map:  50%|████▉     | 54656/110379 [01:22<01:19, 703.34 examples/s]Map:  49%|████▉     | 54247/110379 [01:23<01:43, 541.96 examples/s]Map:  48%|████▊     | 53164/110379 [01:22<01:46, 535.45 examples/s]Map:  48%|████▊     | 52857/110379 [01:23<01:34, 608.44 examples/s]Map:  50%|████▉     | 54758/110379 [01:22<01:20, 691.76 examples/s]Map:  49%|████▉     | 54326/110379 [01:23<01:32, 603.22 examples/s]Map:  48%|████▊     | 53237/110379 [01:22<01:38, 578.82 examples/s]Map:  48%|████▊     | 52922/110379 [01:23<01:33, 617.05 examples/s]Map:  50%|████▉     | 54838/110379 [01:22<01:17, 714.44 examples/s]Map:  49%|████▉     | 54400/110379 [01:23<01:27, 636.16 examples/s]Map:  48%|████▊     | 53309/110379 [01:22<01:33, 610.26 examples/s]Map:  48%|████▊     | 52985/110379 [01:23<01:32, 619.15 examples/s]Map:  49%|████▉     | 54480/110379 [01:23<01:22, 677.84 examples/s]Map:  48%|████▊     | 53379/110379 [01:22<01:30, 631.70 examples/s]Map:  50%|████▉     | 54934/110379 [01:22<01:21, 684.35 examples/s]Map:  49%|████▉     | 54554/110379 [01:23<01:20, 690.05 examples/s]Map:  48%|████▊     | 53450/110379 [01:22<01:27, 650.48 examples/s]Map:  49%|████▉     | 54632/110379 [01:23<01:18, 711.06 examples/s]Map:  48%|████▊     | 53523/110379 [01:22<01:24, 670.76 examples/s]Map:  48%|████▊     | 53054/110379 [01:23<02:13, 428.50 examples/s]Map:  50%|████▉     | 54711/110379 [01:23<01:16, 730.36 examples/s]Map:  49%|████▊     | 53596/110379 [01:23<01:22, 686.32 examples/s]Map:  50%|████▉     | 55035/110379 [01:23<01:51, 494.44 examples/s]Map:  48%|████▊     | 53114/110379 [01:23<02:04, 461.57 examples/s]Map:  50%|████▉     | 55099/110379 [01:23<01:46, 520.70 examples/s]Map:  48%|████▊     | 53181/110379 [01:24<01:52, 506.61 examples/s]Map:  50%|████▉     | 54813/110379 [01:24<01:18, 706.92 examples/s]Map:  49%|████▊     | 53691/110379 [01:23<01:25, 662.33 examples/s]Map:  50%|████▉     | 55165/110379 [01:23<01:41, 546.18 examples/s]Map:  48%|████▊     | 53245/110379 [01:24<01:46, 536.67 examples/s]Map:  50%|████▉     | 54915/110379 [01:24<01:19, 694.59 examples/s]Map:  49%|████▊     | 53791/110379 [01:23<01:25, 659.78 examples/s]Map:  50%|█████     | 55230/110379 [01:23<01:36, 569.68 examples/s]Map:  48%|████▊     | 53311/110379 [01:24<01:40, 566.21 examples/s]Map:  49%|████▉     | 53860/110379 [01:23<01:25, 661.90 examples/s]Map:  50%|█████     | 55306/110379 [01:23<01:29, 615.39 examples/s]Map:  48%|████▊     | 53399/110379 [01:24<01:39, 570.74 examples/s]Map:  50%|█████     | 55385/110379 [01:23<01:23, 659.16 examples/s]Map:  49%|████▉     | 53940/110379 [01:23<01:32, 612.40 examples/s]Map:  50%|████▉     | 55000/110379 [01:24<01:51, 498.43 examples/s]Map:  48%|████▊     | 53465/110379 [01:24<01:36, 592.21 examples/s]Map:  50%|█████     | 55463/110379 [01:23<01:19, 690.89 examples/s]Map:  48%|████▊     | 53527/110379 [01:24<01:34, 599.10 examples/s]Map:  50%|█████     | 55536/110379 [01:23<01:18, 698.09 examples/s]Map:  50%|████▉     | 55088/110379 [01:24<01:46, 519.79 examples/s]Map:  49%|████▊     | 53590/110379 [01:24<01:33, 606.08 examples/s]Map:  50%|████▉     | 55153/110379 [01:24<01:41, 543.25 examples/s]Map:  49%|████▉     | 54036/110379 [01:23<02:00, 467.90 examples/s]Map:  50%|█████     | 55649/110379 [01:24<01:16, 715.58 examples/s]Map:  49%|████▊     | 53656/110379 [01:24<01:31, 618.56 examples/s]Map:  49%|████▉     | 54109/110379 [01:24<01:49, 516.20 examples/s]Map:  50%|█████     | 55243/110379 [01:24<01:38, 559.19 examples/s]Map:  49%|████▊     | 53721/110379 [01:24<01:30, 624.20 examples/s]Map:  51%|█████     | 55746/110379 [01:24<01:19, 688.80 examples/s]Map:  49%|████▉     | 54180/110379 [01:24<01:40, 556.88 examples/s]Map:  50%|█████     | 55311/110379 [01:24<01:34, 583.74 examples/s]Map:  49%|████▉     | 53815/110379 [01:25<01:30, 622.02 examples/s]Map:  49%|████▉     | 54254/110379 [01:24<01:34, 596.85 examples/s]Map:  51%|█████     | 55839/110379 [01:24<01:22, 663.74 examples/s]Map:  50%|█████     | 55408/110379 [01:25<01:31, 600.72 examples/s]Map:  49%|████▉     | 53879/110379 [01:25<01:31, 619.96 examples/s]Map:  49%|████▉     | 54330/110379 [01:24<01:27, 636.97 examples/s]Map:  51%|█████     | 55943/110379 [01:24<01:21, 672.04 examples/s]Map:  50%|█████     | 55484/110379 [01:25<01:26, 634.76 examples/s]Map:  49%|████▉     | 53954/110379 [01:25<01:26, 651.09 examples/s]Map:  49%|████▉     | 54409/110379 [01:24<01:22, 676.06 examples/s]Map:  50%|█████     | 55558/110379 [01:25<01:23, 657.02 examples/s]Map:  49%|████▉     | 54512/110379 [01:24<01:22, 675.61 examples/s]Map:  49%|████▉     | 54037/110379 [01:25<01:50, 510.43 examples/s]Map:  51%|█████     | 56034/110379 [01:24<01:41, 538.02 examples/s]Map:  50%|█████     | 55657/110379 [01:25<01:23, 655.47 examples/s]Map:  49%|████▉     | 54589/110379 [01:24<01:20, 696.57 examples/s]Map:  49%|████▉     | 54104/110379 [01:25<01:43, 543.90 examples/s]Map:  51%|█████     | 56098/110379 [01:24<01:37, 556.71 examples/s]Map:  51%|█████     | 55743/110379 [01:25<01:28, 620.63 examples/s]Map:  50%|████▉     | 54686/110379 [01:24<01:23, 669.35 examples/s]Map:  51%|█████     | 56160/110379 [01:24<01:35, 567.95 examples/s]Map:  49%|████▉     | 54188/110379 [01:25<01:43, 542.56 examples/s]Map:  51%|█████     | 55812/110379 [01:25<01:25, 635.64 examples/s]Map:  51%|█████     | 56235/110379 [01:25<01:28, 608.52 examples/s]Map:  50%|████▉     | 54774/110379 [01:24<01:26, 639.25 examples/s]Map:  49%|████▉     | 54248/110379 [01:25<01:41, 554.34 examples/s]Map:  51%|█████     | 55891/110379 [01:25<01:21, 672.47 examples/s]Map:  51%|█████     | 56309/110379 [01:25<01:24, 637.76 examples/s]Map:  51%|█████     | 55967/110379 [01:25<01:18, 694.31 examples/s]Map:  50%|████▉     | 54871/110379 [01:25<01:27, 635.88 examples/s]Map:  51%|█████     | 56385/110379 [01:25<01:20, 668.88 examples/s]Map:  49%|████▉     | 54340/110379 [01:25<01:38, 569.15 examples/s]Map:  51%|█████     | 56467/110379 [01:25<01:16, 706.99 examples/s]Map:  49%|████▉     | 54405/110379 [01:26<01:35, 586.08 examples/s]Map:  50%|████▉     | 54964/110379 [01:25<01:28, 628.30 examples/s]Map:  51%|█████     | 56545/110379 [01:25<01:14, 722.81 examples/s]Map:  49%|████▉     | 54479/110379 [01:26<01:29, 622.44 examples/s]Map:  51%|█████     | 56076/110379 [01:26<01:40, 541.67 examples/s]Map:  51%|█████▏    | 56625/110379 [01:25<01:12, 739.40 examples/s]Map:  49%|████▉     | 54550/110379 [01:26<01:26, 642.90 examples/s]Map:  51%|█████     | 56147/110379 [01:26<01:34, 575.11 examples/s]Map:  50%|████▉     | 55037/110379 [01:25<01:48, 508.82 examples/s]Map:  51%|█████▏    | 56704/110379 [01:25<01:11, 751.47 examples/s]Map:  49%|████▉     | 54629/110379 [01:26<01:21, 680.70 examples/s]Map:  51%|█████     | 56220/110379 [01:26<01:28, 609.65 examples/s]Map:  50%|████▉     | 55118/110379 [01:25<01:37, 568.60 examples/s]Map:  51%|█████▏    | 56782/110379 [01:25<01:10, 757.96 examples/s]Map:  50%|████▉     | 54706/110379 [01:26<01:19, 697.96 examples/s]Map:  50%|█████     | 55191/110379 [01:25<01:32, 599.56 examples/s]Map:  51%|█████     | 56307/110379 [01:26<01:30, 596.83 examples/s]Map:  52%|█████▏    | 56859/110379 [01:25<01:10, 757.75 examples/s]Map:  50%|████▉     | 54778/110379 [01:26<01:19, 701.57 examples/s]Map:  50%|████▉     | 54854/110379 [01:26<01:17, 713.51 examples/s]Map:  50%|█████     | 55272/110379 [01:25<01:35, 576.50 examples/s]Map:  51%|█████     | 56385/110379 [01:26<01:34, 570.19 examples/s]Map:  52%|█████▏    | 56968/110379 [01:26<01:12, 738.20 examples/s]Map:  50%|████▉     | 54927/110379 [01:26<01:17, 714.71 examples/s]Map:  50%|█████     | 55368/110379 [01:26<01:32, 592.58 examples/s]Map:  51%|█████     | 56456/110379 [01:26<01:40, 535.31 examples/s]Map:  50%|█████     | 55435/110379 [01:26<01:30, 608.13 examples/s]Map:  51%|█████     | 56517/110379 [01:26<01:37, 550.23 examples/s]Map:  52%|█████▏    | 57068/110379 [01:26<01:36, 554.30 examples/s]Map:  50%|████▉     | 55000/110379 [01:27<01:48, 508.16 examples/s]Map:  50%|█████     | 55502/110379 [01:26<01:28, 621.42 examples/s]Map:  52%|█████▏    | 57147/110379 [01:26<01:28, 601.10 examples/s]Map:  51%|█████▏    | 56593/110379 [01:27<01:41, 530.81 examples/s]Map:  50%|████▉     | 55070/110379 [01:27<01:40, 548.00 examples/s]Map:  50%|█████     | 55566/110379 [01:26<01:27, 623.13 examples/s]Map:  52%|█████▏    | 57229/110379 [01:26<01:21, 649.51 examples/s]Map:  51%|█████▏    | 56668/110379 [01:27<01:32, 578.87 examples/s]Map:  50%|████▉     | 55147/110379 [01:27<01:32, 600.32 examples/s]Map:  50%|█████     | 55630/110379 [01:26<01:27, 625.18 examples/s]Map:  52%|█████▏    | 57309/110379 [01:26<01:17, 685.69 examples/s]Map:  51%|█████▏    | 56742/110379 [01:27<01:26, 618.38 examples/s]Map:  50%|█████     | 55226/110379 [01:27<01:25, 646.94 examples/s]Map:  50%|█████     | 55695/110379 [01:26<01:27, 627.68 examples/s]Map:  52%|█████▏    | 57393/110379 [01:26<01:13, 722.24 examples/s]Map:  50%|█████     | 55304/110379 [01:27<01:21, 676.98 examples/s]Map:  51%|█████     | 55759/110379 [01:26<01:26, 627.94 examples/s]Map:  51%|█████▏    | 56821/110379 [01:27<01:32, 580.63 examples/s]Map:  52%|█████▏    | 57474/110379 [01:26<01:11, 744.09 examples/s]Map:  50%|█████     | 55377/110379 [01:27<01:19, 690.19 examples/s]Map:  51%|█████     | 55836/110379 [01:26<01:21, 666.43 examples/s]Map:  52%|█████▏    | 56901/110379 [01:27<01:35, 561.57 examples/s]Map:  50%|█████     | 55459/110379 [01:27<01:15, 723.97 examples/s]Map:  51%|█████     | 55908/110379 [01:26<01:20, 675.06 examples/s]Map:  52%|█████▏    | 57585/110379 [01:26<01:11, 741.71 examples/s]Map:  50%|█████     | 55537/110379 [01:27<01:14, 735.32 examples/s]Map:  51%|█████     | 55988/110379 [01:26<01:16, 710.25 examples/s]Map:  52%|█████▏    | 57666/110379 [01:27<01:10, 752.09 examples/s]Map:  52%|█████▏    | 56977/110379 [01:27<01:38, 540.66 examples/s]Map:  50%|█████     | 55615/110379 [01:27<01:13, 744.13 examples/s]Map:  52%|█████▏    | 57744/110379 [01:27<01:09, 756.04 examples/s]Map:  50%|█████     | 55691/110379 [01:27<01:13, 748.25 examples/s]Map:  52%|█████▏    | 57822/110379 [01:27<01:09, 759.12 examples/s]Map:  51%|█████     | 56072/110379 [01:27<01:41, 534.47 examples/s]Map:  52%|█████▏    | 57035/110379 [01:28<02:04, 428.10 examples/s]Map:  51%|█████     | 56148/110379 [01:27<01:32, 585.39 examples/s]Map:  51%|█████     | 55808/110379 [01:28<01:11, 758.29 examples/s]Map:  52%|█████▏    | 57113/110379 [01:28<01:46, 498.59 examples/s]Map:  52%|█████▏    | 57935/110379 [01:27<01:09, 750.03 examples/s]Map:  51%|█████     | 56223/110379 [01:27<01:27, 621.76 examples/s]Map:  52%|█████▏    | 57189/110379 [01:28<01:35, 555.91 examples/s]Map:  51%|█████     | 55919/110379 [01:28<01:12, 746.76 examples/s]Map:  51%|█████     | 56293/110379 [01:27<01:24, 638.71 examples/s]Map:  52%|█████▏    | 57253/110379 [01:28<01:32, 575.17 examples/s]Map:  53%|█████▎    | 58036/110379 [01:27<01:32, 567.63 examples/s]Map:  51%|█████     | 56373/110379 [01:27<01:19, 680.98 examples/s]Map:  52%|█████▏    | 57332/110379 [01:28<01:35, 555.01 examples/s]Map:  51%|█████     | 56000/110379 [01:28<01:35, 566.61 examples/s]Map:  53%|█████▎    | 58113/110379 [01:27<01:25, 608.11 examples/s]Map:  51%|█████     | 56448/110379 [01:27<01:17, 698.54 examples/s]Map:  52%|█████▏    | 57404/110379 [01:28<01:29, 594.31 examples/s]Map:  51%|█████     | 56076/110379 [01:28<01:30, 602.57 examples/s]Map:  53%|█████▎    | 58196/110379 [01:27<01:19, 656.04 examples/s]Map:  51%|█████     | 56559/110379 [01:27<01:15, 711.82 examples/s]Map:  52%|█████▏    | 57472/110379 [01:28<01:26, 613.16 examples/s]Map:  51%|█████     | 56153/110379 [01:28<01:24, 640.27 examples/s]Map:  53%|█████▎    | 58280/110379 [01:27<01:14, 698.52 examples/s]Map:  51%|█████▏    | 56636/110379 [01:27<01:14, 725.82 examples/s]Map:  52%|█████▏    | 57548/110379 [01:28<01:21, 650.91 examples/s]Map:  51%|█████     | 56236/110379 [01:28<01:19, 680.76 examples/s]Map:  53%|█████▎    | 58390/110379 [01:28<01:13, 707.95 examples/s]Map:  51%|█████▏    | 56717/110379 [01:28<01:11, 745.54 examples/s]Map:  52%|█████▏    | 57622/110379 [01:28<01:18, 671.90 examples/s]Map:  51%|█████     | 56317/110379 [01:28<01:15, 713.31 examples/s]Map:  53%|█████▎    | 58466/110379 [01:28<01:12, 718.82 examples/s]Map:  51%|█████▏    | 56794/110379 [01:28<01:11, 747.10 examples/s]Map:  52%|█████▏    | 57699/110379 [01:28<01:15, 695.80 examples/s]Map:  51%|█████     | 56393/110379 [01:29<01:14, 723.05 examples/s]Map:  53%|█████▎    | 58545/110379 [01:28<01:10, 736.70 examples/s]Map:  52%|█████▏    | 57772/110379 [01:29<01:15, 701.32 examples/s]Map:  51%|█████     | 56470/110379 [01:29<01:13, 732.25 examples/s]Map:  52%|█████▏    | 56887/110379 [01:28<01:16, 696.14 examples/s]Map:  53%|█████▎    | 58622/110379 [01:28<01:09, 741.34 examples/s]Map:  52%|█████▏    | 57845/110379 [01:29<01:14, 706.17 examples/s]Map:  51%|█████     | 56548/110379 [01:29<01:12, 743.94 examples/s]Map:  53%|█████▎    | 58704/110379 [01:28<01:07, 760.31 examples/s]Map:  52%|█████▏    | 56986/110379 [01:28<01:18, 681.30 examples/s]Map:  53%|█████▎    | 57955/110379 [01:29<01:13, 715.05 examples/s]Map:  51%|█████▏    | 56660/110379 [01:29<01:12, 739.51 examples/s]Map:  53%|█████▎    | 58819/110379 [01:28<01:07, 759.93 examples/s]Map:  51%|█████▏    | 56737/110379 [01:29<01:11, 745.17 examples/s]Map:  52%|█████▏    | 57076/110379 [01:28<01:38, 541.57 examples/s]Map:  51%|█████▏    | 56818/110379 [01:29<01:10, 757.75 examples/s]Map:  53%|█████▎    | 58933/110379 [01:28<01:08, 754.30 examples/s]Map:  53%|█████▎    | 58036/110379 [01:29<01:37, 538.53 examples/s]Map:  52%|█████▏    | 57156/110379 [01:28<01:39, 535.75 examples/s]Map:  53%|█████▎    | 58114/110379 [01:29<01:28, 587.57 examples/s]Map:  52%|█████▏    | 56924/110379 [01:29<01:12, 736.40 examples/s]Map:  53%|█████▎    | 58185/110379 [01:29<01:25, 612.41 examples/s]Map:  52%|█████▏    | 57246/110379 [01:28<01:36, 553.38 examples/s]Map:  53%|█████▎    | 59031/110379 [01:29<01:32, 557.40 examples/s]Map:  53%|█████▎    | 58256/110379 [01:29<01:21, 636.28 examples/s]Map:  52%|█████▏    | 57321/110379 [01:29<01:29, 593.73 examples/s]Map:  52%|█████▏    | 57000/110379 [01:29<01:36, 552.29 examples/s]Map:  54%|█████▎    | 59111/110379 [01:29<01:25, 602.31 examples/s]Map:  53%|█████▎    | 58327/110379 [01:29<01:20, 649.07 examples/s]Map:  52%|█████▏    | 57390/110379 [01:29<01:26, 612.90 examples/s]Map:  52%|█████▏    | 57074/110379 [01:30<01:30, 591.24 examples/s]Map:  54%|█████▎    | 59184/110379 [01:29<01:21, 627.24 examples/s]Map:  53%|█████▎    | 58395/110379 [01:30<01:19, 654.68 examples/s]Map:  52%|█████▏    | 57472/110379 [01:29<01:20, 660.96 examples/s]Map:  52%|█████▏    | 57157/110379 [01:30<01:22, 643.82 examples/s]Map:  54%|█████▎    | 59258/110379 [01:29<01:18, 653.02 examples/s]Map:  52%|█████▏    | 57550/110379 [01:29<01:16, 689.27 examples/s]Map:  53%|█████▎    | 58491/110379 [01:30<01:20, 646.70 examples/s]Map:  54%|█████▍    | 59336/110379 [01:29<01:14, 684.40 examples/s]Map:  52%|█████▏    | 57233/110379 [01:30<01:19, 670.24 examples/s]Map:  52%|█████▏    | 57631/110379 [01:29<01:13, 721.57 examples/s]Map:  53%|█████▎    | 58560/110379 [01:30<01:18, 656.32 examples/s]Map:  52%|█████▏    | 57310/110379 [01:30<01:16, 694.57 examples/s]Map:  54%|█████▍    | 59416/110379 [01:29<01:11, 710.39 examples/s]Map:  52%|█████▏    | 57710/110379 [01:29<01:11, 738.00 examples/s]Map:  52%|█████▏    | 57387/110379 [01:30<01:14, 708.00 examples/s]Map:  53%|█████▎    | 58657/110379 [01:30<01:19, 648.62 examples/s]Map:  54%|█████▍    | 59522/110379 [01:29<01:12, 703.72 examples/s]Map:  52%|█████▏    | 57787/110379 [01:29<01:10, 743.12 examples/s]Map:  52%|█████▏    | 57462/110379 [01:30<01:13, 715.73 examples/s]Map:  53%|█████▎    | 58733/110379 [01:30<01:16, 675.11 examples/s]Map:  54%|█████▍    | 59599/110379 [01:29<01:10, 718.49 examples/s]Map:  52%|█████▏    | 57863/110379 [01:29<01:10, 746.50 examples/s]Map:  52%|█████▏    | 57537/110379 [01:30<01:13, 721.32 examples/s]Map:  53%|█████▎    | 58807/110379 [01:30<01:15, 687.24 examples/s]Map:  54%|█████▍    | 59679/110379 [01:29<01:08, 735.15 examples/s]Map:  53%|█████▎    | 57978/110379 [01:29<01:09, 750.36 examples/s]Map:  54%|█████▍    | 59755/110379 [01:30<01:08, 738.94 examples/s]Map:  52%|█████▏    | 57646/110379 [01:30<01:13, 719.95 examples/s]Map:  53%|█████▎    | 58895/110379 [01:30<01:19, 647.28 examples/s]Map:  54%|█████▍    | 59868/110379 [01:30<01:08, 740.68 examples/s]Map:  52%|█████▏    | 57756/110379 [01:30<01:13, 720.27 examples/s]Map:  53%|█████▎    | 58985/110379 [01:31<01:21, 628.33 examples/s]Map:  53%|█████▎    | 58072/110379 [01:30<01:32, 565.47 examples/s]Map:  54%|█████▍    | 59958/110379 [01:30<01:13, 689.81 examples/s]Map:  52%|█████▏    | 57860/110379 [01:31<01:14, 701.50 examples/s]Map:  53%|█████▎    | 58137/110379 [01:30<01:29, 581.02 examples/s]Map:  53%|█████▎    | 57953/110379 [01:31<01:17, 672.59 examples/s]Map:  53%|█████▎    | 58227/110379 [01:30<01:29, 582.11 examples/s]Map:  54%|█████▎    | 59066/110379 [01:31<01:52, 456.16 examples/s]Map:  54%|█████▍    | 60037/110379 [01:30<01:39, 507.62 examples/s]Map:  53%|█████▎    | 58296/110379 [01:30<01:25, 605.71 examples/s]Map:  54%|█████▎    | 59138/110379 [01:31<01:41, 503.93 examples/s]Map:  54%|█████▍    | 60116/110379 [01:30<01:29, 562.59 examples/s]Map:  53%|█████▎    | 58369/110379 [01:30<01:22, 631.56 examples/s]Map:  54%|█████▎    | 59210/110379 [01:31<01:33, 545.36 examples/s]Map:  53%|█████▎    | 58032/110379 [01:31<01:39, 525.11 examples/s]Map:  55%|█████▍    | 60195/110379 [01:30<01:22, 611.53 examples/s]Map:  53%|█████▎    | 58441/110379 [01:30<01:19, 653.77 examples/s]Map:  54%|█████▎    | 59287/110379 [01:31<01:25, 595.96 examples/s]Map:  53%|█████▎    | 58101/110379 [01:31<01:34, 555.45 examples/s]Map:  53%|█████▎    | 58516/110379 [01:30<01:16, 675.35 examples/s]Map:  54%|█████▍    | 59357/110379 [01:31<01:22, 618.65 examples/s]Map:  53%|█████▎    | 58175/110379 [01:31<01:27, 593.56 examples/s]Map:  55%|█████▍    | 60282/110379 [01:31<01:23, 598.94 examples/s]Map:  53%|█████▎    | 58589/110379 [01:30<01:15, 687.15 examples/s]Map:  54%|█████▍    | 59434/110379 [01:31<01:17, 654.24 examples/s]Map:  53%|█████▎    | 58249/110379 [01:31<01:23, 626.06 examples/s]Map:  55%|█████▍    | 60369/110379 [01:31<01:24, 590.10 examples/s]Map:  53%|█████▎    | 58664/110379 [01:31<01:13, 704.00 examples/s]Map:  53%|█████▎    | 58320/110379 [01:31<01:20, 644.96 examples/s]Map:  54%|█████▍    | 59520/110379 [01:31<01:21, 622.67 examples/s]Map:  53%|█████▎    | 58739/110379 [01:31<01:12, 714.04 examples/s]Map:  53%|█████▎    | 58395/110379 [01:32<01:17, 671.55 examples/s]Map:  55%|█████▍    | 60460/110379 [01:31<01:24, 593.30 examples/s]Map:  53%|█████▎    | 58816/110379 [01:31<01:10, 730.11 examples/s]Map:  54%|█████▍    | 59611/110379 [01:32<01:22, 613.81 examples/s]Map:  53%|█████▎    | 58472/110379 [01:32<01:14, 693.86 examples/s]Map:  55%|█████▍    | 60548/110379 [01:31<01:24, 586.93 examples/s]Map:  53%|█████▎    | 58926/110379 [01:31<01:10, 729.02 examples/s]Map:  54%|█████▍    | 59706/110379 [01:32<01:22, 617.57 examples/s]Map:  53%|█████▎    | 58578/110379 [01:32<01:14, 695.42 examples/s]Map:  55%|█████▍    | 60637/110379 [01:31<01:24, 586.07 examples/s]Map:  54%|█████▍    | 59779/110379 [01:32<01:18, 642.90 examples/s]Map:  53%|█████▎    | 58678/110379 [01:32<01:16, 680.23 examples/s]Map:  55%|█████▍    | 60702/110379 [01:31<01:23, 598.08 examples/s]Map:  53%|█████▎    | 59000/110379 [01:31<01:33, 547.96 examples/s]Map:  54%|█████▍    | 59873/110379 [01:32<01:19, 633.76 examples/s]Map:  53%|█████▎    | 58748/110379 [01:32<01:16, 678.91 examples/s]Map:  55%|█████▌    | 60781/110379 [01:31<01:17, 643.40 examples/s]Map:  54%|█████▎    | 59067/110379 [01:31<01:29, 573.18 examples/s]Map:  54%|█████▍    | 59941/110379 [01:32<01:18, 642.98 examples/s]Map:  55%|█████▌    | 60850/110379 [01:31<01:15, 653.10 examples/s]Map:  54%|█████▎    | 59139/110379 [01:31<01:24, 604.86 examples/s]Map:  53%|█████▎    | 58848/110379 [01:32<01:16, 670.87 examples/s]Map:  55%|█████▌    | 60945/110379 [01:32<01:16, 642.88 examples/s]Map:  54%|█████▎    | 59224/110379 [01:31<01:26, 588.52 examples/s]Map:  53%|█████▎    | 58943/110379 [01:32<01:18, 655.50 examples/s]Map:  54%|█████▍    | 60026/110379 [01:32<01:46, 471.26 examples/s]Map:  54%|█████▎    | 59296/110379 [01:32<01:22, 617.57 examples/s]Map:  54%|█████▍    | 60088/110379 [01:33<01:40, 499.10 examples/s]Map:  54%|█████▍    | 59367/110379 [01:32<01:19, 640.46 examples/s]Map:  55%|█████▌    | 61038/110379 [01:32<01:34, 522.94 examples/s]Map:  53%|█████▎    | 59034/110379 [01:33<01:39, 517.67 examples/s]Map:  54%|█████▍    | 60154/110379 [01:33<01:34, 532.72 examples/s]Map:  54%|█████▍    | 59444/110379 [01:32<01:15, 671.08 examples/s]Map:  55%|█████▌    | 61119/110379 [01:32<01:24, 581.83 examples/s]Map:  54%|█████▎    | 59117/110379 [01:33<01:28, 576.84 examples/s]Map:  55%|█████▍    | 60230/110379 [01:33<01:25, 585.62 examples/s]Map:  54%|█████▍    | 59519/110379 [01:32<01:13, 690.41 examples/s]Map:  55%|█████▌    | 61196/110379 [01:32<01:18, 623.17 examples/s]Map:  54%|█████▎    | 59194/110379 [01:33<01:22, 617.95 examples/s]Map:  55%|█████▍    | 60306/110379 [01:33<01:19, 627.33 examples/s]Map:  54%|█████▍    | 59590/110379 [01:32<01:13, 694.62 examples/s]Map:  56%|█████▌    | 61267/110379 [01:32<01:16, 642.34 examples/s]Map:  54%|█████▎    | 59269/110379 [01:33<01:18, 648.57 examples/s]Map:  55%|█████▍    | 60377/110379 [01:33<01:17, 647.41 examples/s]Map:  54%|█████▍    | 59664/110379 [01:32<01:11, 704.98 examples/s]Map:  56%|█████▌    | 61342/110379 [01:32<01:13, 667.76 examples/s]Map:  55%|█████▍    | 60448/110379 [01:33<01:15, 662.49 examples/s]Map:  54%|█████▍    | 59740/110379 [01:32<01:10, 718.63 examples/s]Map:  56%|█████▌    | 61425/110379 [01:32<01:09, 708.20 examples/s]Map:  54%|█████▍    | 59371/110379 [01:33<01:17, 657.56 examples/s]Map:  55%|█████▍    | 60528/110379 [01:33<01:11, 698.50 examples/s]Map:  54%|█████▍    | 59816/110379 [01:32<01:09, 727.71 examples/s]Map:  56%|█████▌    | 61499/110379 [01:32<01:08, 714.19 examples/s]Map:  54%|█████▍    | 59442/110379 [01:33<01:16, 666.95 examples/s]Map:  55%|█████▍    | 60603/110379 [01:33<01:10, 710.24 examples/s]Map:  54%|█████▍    | 59892/110379 [01:32<01:08, 733.21 examples/s]Map:  56%|█████▌    | 61578/110379 [01:33<01:06, 732.90 examples/s]Map:  54%|█████▍    | 59527/110379 [01:33<01:11, 711.39 examples/s]Map:  55%|█████▍    | 60679/110379 [01:33<01:08, 721.39 examples/s]Map:  54%|█████▍    | 59969/110379 [01:33<01:08, 737.73 examples/s]Map:  56%|█████▌    | 61656/110379 [01:33<01:05, 743.37 examples/s]Map:  54%|█████▍    | 59605/110379 [01:33<01:09, 727.26 examples/s]Map:  56%|█████▌    | 61733/110379 [01:33<01:05, 747.88 examples/s]Map:  54%|█████▍    | 59680/110379 [01:33<01:09, 728.72 examples/s]Map:  55%|█████▌    | 60793/110379 [01:33<01:07, 733.31 examples/s]Map:  55%|█████▌    | 60867/110379 [01:34<01:07, 733.07 examples/s]Map:  56%|█████▌    | 61839/110379 [01:33<01:06, 728.58 examples/s]Map:  54%|█████▍    | 59763/110379 [01:34<01:16, 658.44 examples/s]Map:  54%|█████▍    | 60064/110379 [01:33<01:35, 528.44 examples/s]Map:  55%|█████▌    | 60941/110379 [01:34<01:07, 731.09 examples/s]Map:  56%|█████▌    | 61937/110379 [01:33<01:09, 697.65 examples/s]Map:  54%|█████▍    | 59868/110379 [01:34<01:15, 670.98 examples/s]Map:  54%|█████▍    | 60153/110379 [01:33<01:32, 545.41 examples/s]Map:  54%|█████▍    | 59943/110379 [01:34<01:13, 687.15 examples/s]Map:  55%|█████▍    | 60237/110379 [01:33<01:31, 547.45 examples/s]Map:  55%|█████▌    | 61028/110379 [01:34<01:34, 521.71 examples/s]Map:  56%|█████▌    | 62040/110379 [01:33<01:25, 568.13 examples/s]Map:  55%|█████▍    | 60301/110379 [01:33<01:28, 563.49 examples/s]Map:  55%|█████▌    | 61092/110379 [01:34<01:30, 542.72 examples/s]Map:  56%|█████▋    | 62117/110379 [01:33<01:19, 609.12 examples/s]Map:  54%|█████▍    | 60037/110379 [01:34<01:32, 543.26 examples/s]Map:  55%|█████▍    | 60365/110379 [01:33<01:26, 579.03 examples/s]Map:  55%|█████▌    | 61183/110379 [01:34<01:28, 558.92 examples/s]Map:  56%|█████▋    | 62190/110379 [01:33<01:15, 636.07 examples/s]Map:  55%|█████▍    | 60438/110379 [01:33<01:21, 613.89 examples/s]Map:  54%|█████▍    | 60119/110379 [01:34<01:33, 540.00 examples/s]Map:  55%|█████▌    | 61246/110379 [01:34<01:25, 573.61 examples/s]Map:  56%|█████▋    | 62271/110379 [01:34<01:10, 678.17 examples/s]Map:  55%|█████▍    | 60510/110379 [01:34<01:18, 638.86 examples/s]Map:  55%|█████▍    | 60203/110379 [01:34<01:32, 543.55 examples/s]Map:  55%|█████▍    | 60588/110379 [01:34<01:14, 672.82 examples/s]Map:  56%|█████▌    | 61333/110379 [01:34<01:25, 572.35 examples/s]Map:  57%|█████▋    | 62380/110379 [01:34<01:09, 689.43 examples/s]Map:  55%|█████▍    | 60667/110379 [01:34<01:10, 701.48 examples/s]Map:  55%|█████▍    | 60283/110379 [01:35<01:33, 537.16 examples/s]Map:  56%|█████▌    | 61424/110379 [01:35<01:24, 577.40 examples/s]Map:  57%|█████▋    | 62463/110379 [01:34<01:14, 642.38 examples/s]Map:  55%|█████▌    | 60739/110379 [01:34<01:10, 703.85 examples/s]Map:  55%|█████▍    | 60339/110379 [01:35<01:32, 538.23 examples/s]Map:  56%|█████▌    | 61487/110379 [01:35<01:23, 587.76 examples/s]Map:  57%|█████▋    | 62533/110379 [01:34<01:13, 652.47 examples/s]Map:  55%|█████▌    | 60812/110379 [01:34<01:09, 708.73 examples/s]Map:  57%|█████▋    | 62607/110379 [01:34<01:11, 671.44 examples/s]Map:  55%|█████▍    | 60423/110379 [01:35<01:33, 533.01 examples/s]Map:  56%|█████▌    | 61573/110379 [01:35<01:24, 579.29 examples/s]Map:  55%|█████▌    | 60912/110379 [01:34<01:11, 690.75 examples/s]Map:  56%|█████▌    | 61636/110379 [01:35<01:22, 590.74 examples/s]Map:  57%|█████▋    | 62697/110379 [01:34<01:14, 643.01 examples/s]Map:  55%|█████▍    | 60507/110379 [01:35<01:32, 538.23 examples/s]Map:  55%|█████▍    | 60566/110379 [01:35<01:31, 546.47 examples/s]Map:  56%|█████▌    | 61727/110379 [01:35<01:24, 574.58 examples/s]Map:  57%|█████▋    | 62789/110379 [01:34<01:15, 627.89 examples/s]Map:  55%|█████▌    | 61000/110379 [01:34<01:38, 500.13 examples/s]Map:  55%|█████▍    | 60629/110379 [01:35<01:27, 565.88 examples/s]Map:  56%|█████▌    | 61818/110379 [01:35<01:23, 581.66 examples/s]Map:  57%|█████▋    | 62878/110379 [01:35<01:17, 614.24 examples/s]Map:  55%|█████▍    | 60699/110379 [01:35<01:23, 596.79 examples/s]Map:  55%|█████▌    | 61084/110379 [01:34<01:35, 514.96 examples/s]Map:  57%|█████▋    | 62953/110379 [01:35<01:13, 645.17 examples/s]Map:  55%|█████▌    | 61146/110379 [01:35<01:32, 534.92 examples/s]Map:  56%|█████▌    | 61896/110379 [01:35<01:26, 558.95 examples/s]Map:  55%|█████▌    | 60790/110379 [01:35<01:23, 594.98 examples/s]Map:  55%|█████▌    | 61206/110379 [01:35<01:29, 546.99 examples/s]Map:  56%|█████▌    | 61967/110379 [01:36<01:21, 591.48 examples/s]Map:  55%|█████▌    | 60876/110379 [01:36<01:24, 585.46 examples/s]Map:  57%|█████▋    | 63037/110379 [01:35<01:31, 516.84 examples/s]Map:  56%|█████▌    | 61280/110379 [01:35<01:22, 592.36 examples/s]Map:  55%|█████▌    | 60941/110379 [01:36<01:22, 599.15 examples/s]Map:  57%|█████▋    | 63117/110379 [01:35<01:22, 574.46 examples/s]Map:  56%|█████▌    | 61356/110379 [01:35<01:17, 634.19 examples/s]Map:  57%|█████▋    | 63193/110379 [01:35<01:17, 612.51 examples/s]Map:  56%|█████▌    | 61434/110379 [01:35<01:12, 672.74 examples/s]Map:  56%|█████▌    | 62055/110379 [01:36<01:51, 431.67 examples/s]Map:  56%|█████▌    | 61507/110379 [01:35<01:11, 684.00 examples/s]Map:  56%|█████▋    | 62112/110379 [01:36<01:46, 455.01 examples/s]Map:  55%|█████▌    | 61038/110379 [01:36<01:40, 492.96 examples/s]Map:  57%|█████▋    | 63289/110379 [01:35<01:16, 619.25 examples/s]Map:  56%|█████▌    | 61582/110379 [01:35<01:09, 701.63 examples/s]Map:  56%|█████▋    | 62178/110379 [01:36<01:37, 495.61 examples/s]Map:  55%|█████▌    | 61117/110379 [01:36<01:29, 552.45 examples/s]Map:  57%|█████▋    | 63388/110379 [01:35<01:14, 629.70 examples/s]Map:  56%|█████▋    | 62245/110379 [01:36<01:30, 533.34 examples/s]Map:  55%|█████▌    | 61201/110379 [01:36<01:19, 615.51 examples/s]Map:  56%|█████▌    | 61691/110379 [01:35<01:08, 706.07 examples/s]Map:  57%|█████▋    | 63460/110379 [01:36<01:12, 648.71 examples/s]Map:  56%|█████▋    | 62307/110379 [01:36<01:27, 550.41 examples/s]Map:  56%|█████▌    | 61276/110379 [01:36<01:15, 647.65 examples/s]Map:  56%|█████▌    | 61763/110379 [01:35<01:09, 702.45 examples/s]Map:  58%|█████▊    | 63538/110379 [01:36<01:09, 678.47 examples/s]Map:  56%|█████▌    | 61355/110379 [01:36<01:11, 682.67 examples/s]Map:  57%|█████▋    | 62394/110379 [01:36<01:26, 556.33 examples/s]Map:  58%|█████▊    | 63615/110379 [01:36<01:06, 700.23 examples/s]Map:  56%|█████▌    | 61842/110379 [01:36<01:16, 634.08 examples/s]Map:  56%|█████▌    | 61433/110379 [01:36<01:09, 707.74 examples/s]Map:  57%|█████▋    | 62470/110379 [01:37<01:19, 604.09 examples/s]Map:  58%|█████▊    | 63687/110379 [01:36<01:06, 703.28 examples/s]Map:  56%|█████▌    | 61934/110379 [01:36<01:17, 626.04 examples/s]Map:  57%|█████▋    | 62540/110379 [01:37<01:16, 624.58 examples/s]Map:  56%|█████▌    | 61538/110379 [01:37<01:09, 702.47 examples/s]Map:  58%|█████▊    | 63762/110379 [01:36<01:05, 713.86 examples/s]Map:  56%|█████▌    | 61612/110379 [01:37<01:08, 710.22 examples/s]Map:  58%|█████▊    | 63847/110379 [01:36<01:02, 750.05 examples/s]Map:  57%|█████▋    | 62629/110379 [01:37<01:18, 611.31 examples/s]Map:  56%|█████▌    | 62000/110379 [01:36<01:37, 494.86 examples/s]Map:  56%|█████▌    | 61691/110379 [01:37<01:07, 724.78 examples/s]Map:  58%|█████▊    | 63925/110379 [01:36<01:01, 753.03 examples/s]Map:  57%|█████▋    | 62704/110379 [01:37<01:13, 645.20 examples/s]Map:  56%|█████▌    | 62077/110379 [01:36<01:27, 552.00 examples/s]Map:  56%|█████▌    | 61768/110379 [01:37<01:06, 734.21 examples/s]Map:  57%|█████▋    | 62779/110379 [01:37<01:10, 671.54 examples/s]Map:  56%|█████▋    | 62149/110379 [01:36<01:21, 588.27 examples/s]Map:  56%|█████▌    | 61850/110379 [01:37<01:04, 753.81 examples/s]Map:  57%|█████▋    | 62857/110379 [01:37<01:08, 696.69 examples/s]Map:  58%|█████▊    | 64040/110379 [01:36<01:21, 570.95 examples/s]Map:  56%|█████▋    | 62213/110379 [01:36<01:20, 598.44 examples/s]Map:  56%|█████▌    | 61958/110379 [01:37<01:05, 736.26 examples/s]Map:  58%|█████▊    | 64124/110379 [01:36<01:13, 625.22 examples/s]Map:  56%|█████▋    | 62287/110379 [01:36<01:15, 634.05 examples/s]Map:  57%|█████▋    | 62959/110379 [01:37<01:08, 688.27 examples/s]Map:  58%|█████▊    | 64203/110379 [01:37<01:09, 661.02 examples/s]Map:  57%|█████▋    | 62365/110379 [01:36<01:11, 670.51 examples/s]Map:  56%|█████▌    | 62043/110379 [01:37<01:23, 578.14 examples/s]Map:  58%|█████▊    | 64283/110379 [01:37<01:06, 693.77 examples/s]Map:  57%|█████▋    | 62439/110379 [01:37<01:09, 685.06 examples/s]Map:  57%|█████▋    | 63037/110379 [01:37<01:30, 521.03 examples/s]Map:  56%|█████▋    | 62120/110379 [01:38<01:18, 618.70 examples/s]Map:  58%|█████▊    | 64358/110379 [01:37<01:05, 707.39 examples/s]Map:  57%|█████▋    | 62511/110379 [01:37<01:09, 690.87 examples/s]Map:  57%|█████▋    | 63119/110379 [01:38<01:21, 582.14 examples/s]Map:  56%|█████▋    | 62196/110379 [01:38<01:14, 650.61 examples/s]Map:  57%|█████▋    | 63190/110379 [01:38<01:17, 609.14 examples/s]Map:  58%|█████▊    | 64461/110379 [01:37<01:05, 698.14 examples/s]Map:  57%|█████▋    | 62596/110379 [01:37<01:14, 637.87 examples/s]Map:  56%|█████▋    | 62276/110379 [01:38<01:10, 686.63 examples/s]Map:  57%|█████▋    | 63265/110379 [01:38<01:13, 642.68 examples/s]Map:  58%|█████▊    | 64567/110379 [01:37<01:05, 696.52 examples/s]Map:  57%|█████▋    | 62683/110379 [01:37<01:17, 615.64 examples/s]Map:  57%|█████▋    | 62381/110379 [01:38<01:09, 687.64 examples/s]Map:  57%|█████▋    | 63339/110379 [01:38<01:10, 666.15 examples/s]Map:  59%|█████▊    | 64648/110379 [01:37<01:03, 717.77 examples/s]Map:  57%|█████▋    | 62758/110379 [01:37<01:13, 647.14 examples/s]Map:  57%|█████▋    | 62461/110379 [01:38<01:07, 714.57 examples/s]Map:  57%|█████▋    | 63419/110379 [01:38<01:06, 701.44 examples/s]Map:  59%|█████▊    | 64724/110379 [01:37<01:02, 727.50 examples/s]Map:  57%|█████▋    | 62840/110379 [01:37<01:08, 689.65 examples/s]Map:  57%|█████▋    | 62540/110379 [01:38<01:05, 731.17 examples/s]Map:  58%|█████▊    | 63515/110379 [01:38<01:09, 671.10 examples/s]Map:  59%|█████▊    | 64804/110379 [01:37<01:01, 744.24 examples/s]Map:  57%|█████▋    | 62912/110379 [01:37<01:08, 695.06 examples/s]Map:  57%|█████▋    | 62616/110379 [01:38<01:04, 737.43 examples/s]Map:  59%|█████▉    | 64881/110379 [01:38<01:00, 750.43 examples/s]Map:  57%|█████▋    | 62987/110379 [01:37<01:06, 708.77 examples/s]Map:  58%|█████▊    | 63594/110379 [01:38<01:15, 619.04 examples/s]Map:  57%|█████▋    | 62720/110379 [01:38<01:06, 717.35 examples/s]Map:  58%|█████▊    | 63673/110379 [01:38<01:10, 659.06 examples/s]Map:  59%|█████▉    | 64997/110379 [01:38<00:59, 757.02 examples/s]Map:  57%|█████▋    | 62795/110379 [01:38<01:05, 722.93 examples/s]Map:  57%|█████▋    | 63066/110379 [01:38<01:31, 519.29 examples/s]Map:  58%|█████▊    | 63751/110379 [01:38<01:07, 686.41 examples/s]Map:  57%|█████▋    | 62883/110379 [01:39<01:10, 670.88 examples/s]Map:  57%|█████▋    | 63129/110379 [01:38<01:27, 541.83 examples/s]Map:  58%|█████▊    | 63827/110379 [01:39<01:06, 704.52 examples/s]Map:  59%|█████▉    | 65106/110379 [01:38<01:19, 568.82 examples/s]Map:  57%|█████▋    | 63203/110379 [01:38<01:20, 587.79 examples/s]Map:  57%|█████▋    | 62966/110379 [01:39<01:15, 629.31 examples/s]Map:  58%|█████▊    | 63935/110379 [01:39<01:05, 706.69 examples/s]Map:  59%|█████▉    | 65177/110379 [01:38<01:15, 595.24 examples/s]Map:  57%|█████▋    | 63278/110379 [01:38<01:15, 627.42 examples/s]Map:  59%|█████▉    | 65249/110379 [01:38<01:12, 622.04 examples/s]Map:  57%|█████▋    | 63352/110379 [01:38<01:11, 654.59 examples/s]Map:  59%|█████▉    | 65326/110379 [01:38<01:08, 654.22 examples/s]Map:  57%|█████▋    | 63033/110379 [01:39<01:44, 454.97 examples/s]Map:  58%|█████▊    | 64037/110379 [01:39<01:27, 528.37 examples/s]Map:  57%|█████▋    | 63431/110379 [01:38<01:18, 598.25 examples/s]Map:  59%|█████▉    | 65405/110379 [01:38<01:05, 687.23 examples/s]Map:  58%|█████▊    | 64117/110379 [01:39<01:19, 580.97 examples/s]Map:  57%|█████▋    | 63118/110379 [01:39<01:37, 482.88 examples/s]Map:  58%|█████▊    | 63525/110379 [01:38<01:17, 600.93 examples/s]Map:  59%|█████▉    | 65504/110379 [01:39<01:06, 673.28 examples/s]Map:  57%|█████▋    | 63181/110379 [01:39<01:32, 509.60 examples/s]Map:  58%|█████▊    | 64202/110379 [01:39<01:20, 572.48 examples/s]Map:  58%|█████▊    | 63598/110379 [01:38<01:14, 630.17 examples/s]Map:  57%|█████▋    | 63253/110379 [01:39<01:24, 555.37 examples/s]Map:  59%|█████▉    | 65595/110379 [01:39<01:09, 646.62 examples/s]Map:  58%|█████▊    | 64267/110379 [01:39<01:18, 587.81 examples/s]Map:  58%|█████▊    | 63670/110379 [01:39<01:11, 651.92 examples/s]Map:  58%|█████▊    | 64340/110379 [01:39<01:14, 618.34 examples/s]Map:  57%|█████▋    | 63344/110379 [01:40<01:22, 567.13 examples/s]Map:  60%|█████▉    | 65696/110379 [01:39<01:08, 651.34 examples/s]Map:  58%|█████▊    | 63760/110379 [01:39<01:14, 628.24 examples/s]Map:  58%|█████▊    | 64414/110379 [01:40<01:11, 647.29 examples/s]Map:  57%|█████▋    | 63407/110379 [01:40<01:20, 580.37 examples/s]Map:  60%|█████▉    | 65775/110379 [01:39<01:05, 680.90 examples/s]Map:  58%|█████▊    | 64489/110379 [01:40<01:08, 672.37 examples/s]Map:  58%|█████▊    | 63471/110379 [01:40<01:19, 593.00 examples/s]Map:  58%|█████▊    | 63851/110379 [01:39<01:15, 617.11 examples/s]Map:  60%|█████▉    | 65855/110379 [01:39<01:02, 707.41 examples/s]Map:  58%|█████▊    | 64560/110379 [01:40<01:07, 681.86 examples/s]Map:  60%|█████▉    | 65931/110379 [01:39<01:01, 717.75 examples/s]Map:  58%|█████▊    | 63564/110379 [01:40<01:18, 598.63 examples/s]Map:  58%|█████▊    | 63945/110379 [01:39<01:15, 612.56 examples/s]Map:  59%|█████▊    | 64651/110379 [01:40<01:10, 648.23 examples/s]Map:  58%|█████▊    | 63654/110379 [01:40<01:18, 595.72 examples/s]Map:  59%|█████▊    | 64738/110379 [01:40<01:13, 621.89 examples/s]Map:  60%|█████▉    | 66035/110379 [01:39<01:19, 560.58 examples/s]Map:  58%|█████▊    | 63718/110379 [01:40<01:17, 605.23 examples/s]Map:  58%|█████▊    | 64029/110379 [01:39<01:40, 459.57 examples/s]Map:  59%|█████▊    | 64802/110379 [01:40<01:13, 624.12 examples/s]Map:  60%|█████▉    | 66112/110379 [01:39<01:13, 602.95 examples/s]Map:  58%|█████▊    | 64103/110379 [01:39<01:30, 509.90 examples/s]Map:  58%|█████▊    | 63800/110379 [01:40<01:20, 581.87 examples/s]Map:  59%|█████▉    | 64877/110379 [01:40<01:09, 654.55 examples/s]Map:  60%|█████▉    | 66190/110379 [01:40<01:08, 641.59 examples/s]Map:  58%|█████▊    | 64183/110379 [01:40<01:20, 570.47 examples/s]Map:  60%|██████    | 66264/110379 [01:40<01:06, 663.64 examples/s]Map:  59%|█████▉    | 64948/110379 [01:40<01:09, 658.12 examples/s]Map:  58%|█████▊    | 63886/110379 [01:40<01:20, 576.67 examples/s]Map:  58%|█████▊    | 64255/110379 [01:40<01:16, 603.78 examples/s]Map:  58%|█████▊    | 63945/110379 [01:41<01:20, 574.81 examples/s]Map:  60%|██████    | 66354/110379 [01:40<01:09, 637.89 examples/s]Map:  58%|█████▊    | 64326/110379 [01:40<01:13, 626.49 examples/s]Map:  59%|█████▉    | 65032/110379 [01:41<01:32, 488.30 examples/s]Map:  60%|██████    | 66448/110379 [01:40<01:09, 629.86 examples/s]Map:  58%|█████▊    | 64426/110379 [01:40<01:12, 637.78 examples/s]Map:  59%|█████▉    | 65106/110379 [01:41<01:23, 540.35 examples/s]Map:  58%|█████▊    | 64028/110379 [01:41<01:47, 430.12 examples/s]Map:  58%|█████▊    | 64503/110379 [01:40<01:08, 667.25 examples/s]Map:  60%|██████    | 66537/110379 [01:40<01:11, 616.12 examples/s]Map:  59%|█████▉    | 65179/110379 [01:41<01:17, 581.50 examples/s]Map:  58%|█████▊    | 64094/110379 [01:41<01:37, 474.23 examples/s]Map:  59%|█████▊    | 64576/110379 [01:40<01:07, 681.83 examples/s]Map:  59%|█████▉    | 65252/110379 [01:41<01:13, 615.75 examples/s]Map:  60%|██████    | 66627/110379 [01:40<01:12, 606.64 examples/s]Map:  58%|█████▊    | 64157/110379 [01:41<01:31, 504.19 examples/s]Map:  59%|█████▊    | 64650/110379 [01:40<01:05, 694.23 examples/s]Map:  59%|█████▉    | 65319/110379 [01:41<01:11, 628.28 examples/s]Map:  60%|██████    | 66700/110379 [01:40<01:09, 632.09 examples/s]Map:  58%|█████▊    | 64220/110379 [01:41<01:26, 531.30 examples/s]Map:  59%|█████▊    | 64726/110379 [01:40<01:04, 709.64 examples/s]Map:  59%|█████▉    | 65400/110379 [01:41<01:06, 673.54 examples/s]Map:  60%|██████    | 66776/110379 [01:40<01:06, 658.67 examples/s]Map:  58%|█████▊    | 64286/110379 [01:41<01:22, 561.11 examples/s]Map:  59%|█████▊    | 64800/110379 [01:40<01:03, 714.39 examples/s]Map:  59%|█████▉    | 65473/110379 [01:41<01:05, 683.41 examples/s]Map:  61%|██████    | 66853/110379 [01:41<01:03, 684.46 examples/s]Map:  58%|█████▊    | 64352/110379 [01:41<01:18, 585.82 examples/s]Map:  59%|█████▉    | 64877/110379 [01:40<01:02, 727.42 examples/s]Map:  59%|█████▉    | 65546/110379 [01:41<01:04, 696.42 examples/s]Map:  61%|██████    | 66926/110379 [01:41<01:02, 694.78 examples/s]Map:  59%|█████▉    | 64951/110379 [01:41<01:02, 727.20 examples/s]Map:  58%|█████▊    | 64450/110379 [01:41<01:15, 605.23 examples/s]Map:  59%|█████▉    | 65654/110379 [01:42<01:04, 696.27 examples/s]Map:  58%|█████▊    | 64524/110379 [01:42<01:12, 632.96 examples/s]Map:  60%|█████▉    | 65728/110379 [01:42<01:03, 706.14 examples/s]Map:  61%|██████    | 67000/110379 [01:41<01:22, 527.56 examples/s]Map:  59%|█████▉    | 65035/110379 [01:41<01:22, 547.56 examples/s]Map:  59%|█████▊    | 64604/110379 [01:42<01:07, 675.43 examples/s]Map:  60%|█████▉    | 65803/110379 [01:42<01:02, 713.60 examples/s]Map:  61%|██████    | 67082/110379 [01:41<01:13, 592.80 examples/s]Map:  59%|█████▉    | 65113/110379 [01:41<01:15, 599.58 examples/s]Map:  59%|█████▊    | 64678/110379 [01:42<01:06, 691.71 examples/s]Map:  60%|█████▉    | 65880/110379 [01:42<01:01, 724.25 examples/s]Map:  61%|██████    | 67160/110379 [01:41<01:07, 636.90 examples/s]Map:  59%|█████▉    | 65181/110379 [01:41<01:13, 618.43 examples/s]Map:  59%|█████▊    | 64751/110379 [01:42<01:05, 699.04 examples/s]Map:  59%|█████▉    | 65256/110379 [01:41<01:09, 649.97 examples/s]Map:  59%|█████▊    | 64829/110379 [01:42<01:03, 716.85 examples/s]Map:  60%|█████▉    | 65978/110379 [01:42<01:03, 694.47 examples/s]Map:  61%|██████    | 67269/110379 [01:41<01:04, 664.46 examples/s]Map:  59%|█████▉    | 65336/110379 [01:41<01:05, 686.55 examples/s]Map:  59%|█████▉    | 64907/110379 [01:42<01:02, 731.58 examples/s]Map:  61%|██████    | 67350/110379 [01:41<01:01, 695.13 examples/s]Map:  59%|█████▉    | 65416/110379 [01:41<01:02, 713.82 examples/s]Map:  61%|██████    | 67426/110379 [01:41<01:00, 706.56 examples/s]Map:  60%|█████▉    | 66076/110379 [01:42<01:22, 540.27 examples/s]Map:  59%|█████▉    | 65492/110379 [01:41<01:02, 723.60 examples/s]Map:  61%|██████    | 67500/110379 [01:42<01:00, 713.93 examples/s]Map:  59%|█████▉    | 65000/110379 [01:42<01:22, 548.99 examples/s]Map:  60%|█████▉    | 66154/110379 [01:42<01:15, 588.77 examples/s]Map:  59%|█████▉    | 65568/110379 [01:42<01:01, 732.70 examples/s]Map:  61%|██████    | 67574/110379 [01:42<00:59, 718.57 examples/s]Map:  59%|█████▉    | 65076/110379 [01:42<01:16, 595.62 examples/s]Map:  60%|██████    | 66232/110379 [01:42<01:09, 631.36 examples/s]Map:  59%|█████▉    | 65649/110379 [01:42<00:59, 755.09 examples/s]Map:  59%|█████▉    | 65150/110379 [01:43<01:11, 628.25 examples/s]Map:  60%|██████    | 66302/110379 [01:43<01:08, 646.96 examples/s]Map:  61%|██████▏   | 67683/110379 [01:42<00:59, 719.18 examples/s]Map:  60%|█████▉    | 65761/110379 [01:42<00:59, 746.23 examples/s]Map:  60%|██████    | 66378/110379 [01:43<01:05, 673.09 examples/s]Map:  61%|██████▏   | 67759/110379 [01:42<00:58, 728.48 examples/s]Map:  59%|█████▉    | 65255/110379 [01:43<01:09, 650.87 examples/s]Map:  60%|█████▉    | 65838/110379 [01:42<00:59, 746.69 examples/s]Map:  60%|██████    | 66458/110379 [01:43<01:02, 705.43 examples/s]Map:  59%|█████▉    | 65331/110379 [01:43<01:06, 675.85 examples/s]Map:  61%|██████▏   | 67866/110379 [01:42<00:59, 719.49 examples/s]Map:  60%|██████    | 66533/110379 [01:43<01:01, 709.78 examples/s]Map:  60%|█████▉    | 65951/110379 [01:42<00:59, 744.56 examples/s]Map:  59%|█████▉    | 65407/110379 [01:43<01:04, 696.53 examples/s]Map:  62%|██████▏   | 67975/110379 [01:42<00:59, 718.56 examples/s]Map:  60%|██████    | 66606/110379 [01:43<01:01, 710.03 examples/s]Map:  59%|█████▉    | 65516/110379 [01:43<01:03, 703.78 examples/s]Map:  60%|█████▉    | 66033/110379 [01:42<01:18, 564.10 examples/s]Map:  60%|██████    | 66710/110379 [01:43<01:02, 699.80 examples/s]Map:  59%|█████▉    | 65611/110379 [01:43<01:06, 678.08 examples/s]Map:  60%|█████▉    | 66101/110379 [01:42<01:15, 588.20 examples/s]Map:  62%|██████▏   | 68062/110379 [01:43<01:20, 527.94 examples/s]Map:  61%|██████    | 66800/110379 [01:43<01:06, 658.98 examples/s]Map:  60%|█████▉    | 65683/110379 [01:43<01:05, 687.20 examples/s]Map:  60%|█████▉    | 66185/110379 [01:42<01:08, 644.64 examples/s]Map:  62%|██████▏   | 68126/110379 [01:43<01:17, 545.92 examples/s]Map:  61%|██████    | 66878/110379 [01:43<01:03, 688.43 examples/s]Map:  60%|█████▉    | 65759/110379 [01:43<01:03, 704.39 examples/s]Map:  60%|██████    | 66265/110379 [01:43<01:04, 682.29 examples/s]Map:  62%|██████▏   | 68198/110379 [01:43<01:12, 581.31 examples/s]Map:  61%|██████    | 66949/110379 [01:43<01:02, 691.37 examples/s]Map:  60%|█████▉    | 65835/110379 [01:43<01:02, 716.73 examples/s]Map:  62%|██████▏   | 68272/110379 [01:43<01:08, 616.23 examples/s]Map:  60%|██████    | 66343/110379 [01:43<01:10, 624.34 examples/s]Map:  60%|█████▉    | 65912/110379 [01:44<01:00, 730.29 examples/s]Map:  62%|██████▏   | 68348/110379 [01:43<01:04, 651.95 examples/s]Map:  60%|█████▉    | 65990/110379 [01:44<00:59, 742.21 examples/s]Map:  60%|██████    | 66431/110379 [01:43<01:12, 603.88 examples/s]Map:  62%|██████▏   | 68427/110379 [01:43<01:01, 686.25 examples/s]Map:  61%|██████    | 67026/110379 [01:44<01:37, 444.98 examples/s]Map:  60%|██████    | 66503/110379 [01:43<01:09, 630.96 examples/s]Map:  62%|██████▏   | 68504/110379 [01:43<00:59, 705.56 examples/s]Map:  61%|██████    | 67094/110379 [01:44<01:28, 490.34 examples/s]Map:  60%|██████    | 66570/110379 [01:43<01:08, 639.92 examples/s]Map:  62%|██████▏   | 68578/110379 [01:43<00:58, 712.22 examples/s]Map:  61%|██████    | 67165/110379 [01:44<01:20, 535.72 examples/s]Map:  60%|█████▉    | 66090/110379 [01:44<01:29, 496.80 examples/s]Map:  62%|██████▏   | 68655/110379 [01:43<00:57, 726.81 examples/s]Map:  60%|██████    | 66658/110379 [01:43<01:10, 617.60 examples/s]Map:  61%|██████    | 67231/110379 [01:44<01:16, 560.85 examples/s]Map:  60%|█████▉    | 66156/110379 [01:44<01:23, 528.55 examples/s]Map:  60%|██████    | 66725/110379 [01:43<01:09, 628.72 examples/s]Map:  61%|██████    | 67301/110379 [01:44<01:12, 592.85 examples/s]Map:  62%|██████▏   | 68759/110379 [01:43<00:58, 710.14 examples/s]Map:  60%|██████    | 66246/110379 [01:44<01:21, 544.42 examples/s]Map:  61%|██████    | 66798/110379 [01:43<01:06, 653.60 examples/s]Map:  61%|██████    | 67375/110379 [01:44<01:08, 626.55 examples/s]Map:  62%|██████▏   | 68868/110379 [01:44<00:58, 709.99 examples/s]Map:  61%|██████    | 66867/110379 [01:44<01:05, 661.39 examples/s]Map:  60%|██████    | 66313/110379 [01:44<01:17, 568.06 examples/s]Map:  61%|██████    | 67453/110379 [01:44<01:04, 664.03 examples/s]Map:  60%|██████    | 66380/110379 [01:44<01:14, 589.33 examples/s]Map:  62%|██████▏   | 68965/110379 [01:44<01:00, 679.95 examples/s]Map:  61%|██████    | 66966/110379 [01:44<01:06, 655.21 examples/s]Map:  61%|██████    | 67549/110379 [01:45<01:06, 648.45 examples/s]Map:  60%|██████    | 66473/110379 [01:45<01:13, 597.24 examples/s]Map:  61%|██████▏   | 67641/110379 [01:45<01:07, 629.77 examples/s]Map:  60%|██████    | 66536/110379 [01:45<01:12, 602.47 examples/s]Map:  61%|██████    | 67035/110379 [01:44<01:26, 503.89 examples/s]Map:  63%|██████▎   | 69070/110379 [01:44<01:22, 501.38 examples/s]Map:  60%|██████    | 66610/110379 [01:45<01:09, 633.97 examples/s]Map:  61%|██████    | 67113/110379 [01:44<01:16, 563.24 examples/s]Map:  61%|██████▏   | 67729/110379 [01:45<01:09, 612.93 examples/s]Map:  63%|██████▎   | 69148/110379 [01:44<01:14, 550.33 examples/s]Map:  60%|██████    | 66690/110379 [01:45<01:04, 677.16 examples/s]Map:  61%|██████    | 67184/110379 [01:44<01:12, 594.75 examples/s]Map:  61%|██████▏   | 67817/110379 [01:45<01:11, 598.85 examples/s]Map:  60%|██████    | 66763/110379 [01:45<01:03, 690.97 examples/s]Map:  63%|██████▎   | 69216/110379 [01:44<01:11, 575.46 examples/s]Map:  61%|██████    | 67256/110379 [01:44<01:08, 625.21 examples/s]Map:  61%|██████▏   | 67879/110379 [01:45<01:11, 596.71 examples/s]Map:  61%|██████    | 66841/110379 [01:45<01:01, 712.78 examples/s]Map:  63%|██████▎   | 69295/110379 [01:44<01:06, 619.00 examples/s]Map:  61%|██████    | 67329/110379 [01:44<01:06, 651.58 examples/s]Map:  62%|██████▏   | 67950/110379 [01:45<01:08, 621.85 examples/s]Map:  61%|██████    | 66918/110379 [01:45<00:59, 725.92 examples/s]Map:  63%|██████▎   | 69374/110379 [01:45<01:02, 657.18 examples/s]Map:  61%|██████    | 67398/110379 [01:44<01:05, 658.94 examples/s]Map:  61%|██████    | 66996/110379 [01:45<00:59, 733.73 examples/s]Map:  63%|██████▎   | 69451/110379 [01:45<00:59, 684.23 examples/s]Map:  61%|██████    | 67472/110379 [01:45<01:03, 677.35 examples/s]Map:  63%|██████▎   | 69524/110379 [01:45<00:58, 694.08 examples/s]Map:  61%|██████    | 67544/110379 [01:45<01:02, 686.66 examples/s]Map:  62%|██████▏   | 68036/110379 [01:45<01:25, 496.47 examples/s]Map:  63%|██████▎   | 69600/110379 [01:45<00:57, 707.75 examples/s]Map:  61%|██████▏   | 67615/110379 [01:45<01:01, 690.24 examples/s]Map:  62%|██████▏   | 68114/110379 [01:46<01:16, 555.01 examples/s]Map:  61%|██████    | 67082/110379 [01:46<01:26, 498.56 examples/s]Map:  63%|██████▎   | 69679/110379 [01:45<00:55, 729.61 examples/s]Map:  61%|██████▏   | 67687/110379 [01:45<01:01, 694.59 examples/s]Map:  62%|██████▏   | 68189/110379 [01:46<01:11, 592.55 examples/s]Map:  63%|██████▎   | 69758/110379 [01:45<00:54, 743.22 examples/s]Map:  61%|██████    | 67177/110379 [01:46<01:20, 536.10 examples/s]Map:  62%|██████▏   | 68257/110379 [01:46<01:09, 607.35 examples/s]Map:  61%|██████▏   | 67787/110379 [01:45<01:02, 676.43 examples/s]Map:  61%|██████    | 67241/110379 [01:46<01:17, 556.08 examples/s]Map:  62%|██████▏   | 68323/110379 [01:46<01:07, 619.33 examples/s]Map:  63%|██████▎   | 69857/110379 [01:45<00:57, 707.55 examples/s]Map:  61%|██████▏   | 67857/110379 [01:45<01:02, 680.93 examples/s]Map:  61%|██████    | 67311/110379 [01:46<01:13, 587.79 examples/s]Map:  62%|██████▏   | 68402/110379 [01:46<01:03, 661.09 examples/s]Map:  62%|██████▏   | 67929/110379 [01:45<01:01, 686.84 examples/s]Map:  63%|██████▎   | 69966/110379 [01:45<00:56, 710.51 examples/s]Map:  62%|██████▏   | 68471/110379 [01:46<01:02, 668.84 examples/s]Map:  61%|██████    | 67376/110379 [01:46<01:11, 598.35 examples/s]Map:  62%|██████▏   | 68574/110379 [01:46<01:01, 674.49 examples/s]Map:  61%|██████    | 67463/110379 [01:46<01:13, 587.78 examples/s]Map:  62%|██████▏   | 68000/110379 [01:45<01:22, 515.14 examples/s]Map:  63%|██████▎   | 70075/110379 [01:46<01:11, 561.48 examples/s]Map:  62%|██████▏   | 68655/110379 [01:46<00:58, 707.21 examples/s]Map:  61%|██████    | 67533/110379 [01:46<01:09, 614.26 examples/s]Map:  62%|██████▏   | 68072/110379 [01:46<01:15, 560.49 examples/s]Map:  64%|██████▎   | 70153/110379 [01:46<01:06, 602.88 examples/s]Map:  61%|██████▏   | 67615/110379 [01:46<01:04, 667.30 examples/s]Map:  62%|██████▏   | 68152/110379 [01:46<01:08, 616.72 examples/s]Map:  62%|██████▏   | 68760/110379 [01:47<00:59, 699.76 examples/s]Map:  64%|██████▎   | 70230/110379 [01:46<01:03, 635.00 examples/s]Map:  61%|██████▏   | 67694/110379 [01:47<01:01, 697.38 examples/s]Map:  62%|██████▏   | 68221/110379 [01:46<01:06, 634.31 examples/s]Map:  62%|██████▏   | 68832/110379 [01:47<00:59, 703.42 examples/s]Map:  64%|██████▎   | 70311/110379 [01:46<00:59, 673.50 examples/s]Map:  61%|██████▏   | 67772/110379 [01:47<00:59, 719.04 examples/s]Map:  62%|██████▏   | 68289/110379 [01:46<01:05, 645.66 examples/s]Map:  64%|██████▍   | 70385/110379 [01:46<00:58, 687.32 examples/s]Map:  62%|██████▏   | 68939/110379 [01:47<00:58, 702.95 examples/s]Map:  61%|██████▏   | 67851/110379 [01:47<00:58, 732.46 examples/s]Map:  62%|██████▏   | 68386/110379 [01:46<01:05, 643.89 examples/s]Map:  64%|██████▍   | 70462/110379 [01:46<00:57, 700.19 examples/s]Map:  62%|██████▏   | 67931/110379 [01:47<00:56, 749.39 examples/s]Map:  62%|██████▏   | 68464/110379 [01:46<01:01, 676.73 examples/s]Map:  64%|██████▍   | 70545/110379 [01:46<00:54, 733.90 examples/s]Map:  62%|██████▏   | 68538/110379 [01:46<01:00, 691.71 examples/s]Map:  63%|██████▎   | 69034/110379 [01:47<01:16, 540.48 examples/s]Map:  64%|██████▍   | 70642/110379 [01:46<00:57, 693.09 examples/s]Map:  63%|██████▎   | 69101/110379 [01:47<01:13, 564.56 examples/s]Map:  62%|██████▏   | 68031/110379 [01:47<01:20, 524.97 examples/s]Map:  62%|██████▏   | 68637/110379 [01:46<01:01, 678.83 examples/s]Map:  63%|██████▎   | 69176/110379 [01:47<01:08, 603.86 examples/s]Map:  62%|██████▏   | 68103/110379 [01:47<01:15, 563.42 examples/s]Map:  64%|██████▍   | 70752/110379 [01:47<00:56, 703.68 examples/s]Map:  62%|██████▏   | 68719/110379 [01:46<00:58, 711.97 examples/s]Map:  63%|██████▎   | 69258/110379 [01:47<01:03, 649.65 examples/s]Map:  62%|██████▏   | 68184/110379 [01:47<01:08, 614.47 examples/s]Map:  64%|██████▍   | 70830/110379 [01:47<00:55, 717.65 examples/s]Map:  62%|██████▏   | 68792/110379 [01:47<00:58, 714.10 examples/s]Map:  63%|██████▎   | 69335/110379 [01:47<01:00, 676.29 examples/s]Map:  64%|██████▍   | 70923/110379 [01:47<00:57, 681.86 examples/s]Map:  62%|██████▏   | 68279/110379 [01:48<01:08, 615.89 examples/s]Map:  62%|██████▏   | 68873/110379 [01:47<01:04, 647.19 examples/s]Map:  63%|██████▎   | 69410/110379 [01:48<00:59, 691.46 examples/s]Map:  63%|██████▎   | 69490/110379 [01:48<00:56, 718.39 examples/s]Map:  62%|██████▏   | 68374/110379 [01:48<01:08, 616.99 examples/s]Map:  62%|██████▏   | 68965/110379 [01:47<01:05, 631.26 examples/s]Map:  63%|██████▎   | 69571/110379 [01:48<00:55, 740.24 examples/s]Map:  64%|██████▍   | 71000/110379 [01:47<01:20, 487.94 examples/s]Map:  62%|██████▏   | 68465/110379 [01:48<01:08, 611.56 examples/s]Map:  63%|██████▎   | 69647/110379 [01:48<00:54, 741.13 examples/s]Map:  63%|██████▎   | 69038/110379 [01:47<01:21, 508.28 examples/s]Map:  64%|██████▍   | 71076/110379 [01:47<01:12, 539.63 examples/s]Map:  62%|██████▏   | 68531/110379 [01:48<01:07, 620.82 examples/s]Map:  63%|██████▎   | 69747/110379 [01:48<00:57, 710.69 examples/s]Map:  63%|██████▎   | 69116/110379 [01:47<01:13, 564.07 examples/s]Map:  64%|██████▍   | 71161/110379 [01:47<01:05, 601.02 examples/s]Map:  62%|██████▏   | 68596/110379 [01:48<01:06, 626.09 examples/s]Map:  63%|██████▎   | 69827/110379 [01:48<00:55, 732.50 examples/s]Map:  63%|██████▎   | 69189/110379 [01:47<01:08, 599.62 examples/s]Map:  65%|██████▍   | 71239/110379 [01:47<01:01, 640.35 examples/s]Map:  62%|██████▏   | 68662/110379 [01:48<01:06, 631.66 examples/s]Map:  63%|██████▎   | 69260/110379 [01:47<01:05, 624.07 examples/s]Map:  65%|██████▍   | 71323/110379 [01:47<00:56, 689.13 examples/s]Map:  62%|██████▏   | 68738/110379 [01:48<01:02, 663.18 examples/s]Map:  63%|██████▎   | 69944/110379 [01:48<00:54, 745.70 examples/s]Map:  65%|██████▍   | 71404/110379 [01:48<00:54, 719.41 examples/s]Map:  63%|██████▎   | 69339/110379 [01:47<01:02, 660.17 examples/s]Map:  62%|██████▏   | 68813/110379 [01:48<01:01, 681.23 examples/s]Map:  65%|██████▍   | 71511/110379 [01:48<00:54, 713.18 examples/s]Map:  63%|██████▎   | 69427/110379 [01:48<01:05, 626.64 examples/s]Map:  62%|██████▏   | 68922/110379 [01:48<00:59, 694.61 examples/s]Map:  63%|██████▎   | 70034/110379 [01:49<01:14, 543.03 examples/s]Map:  63%|██████▎   | 68992/110379 [01:49<00:59, 694.11 examples/s]Map:  63%|██████▎   | 69526/110379 [01:48<01:04, 633.68 examples/s]Map:  65%|██████▍   | 71612/110379 [01:48<00:56, 690.44 examples/s]Map:  64%|██████▎   | 70119/110379 [01:49<01:06, 602.10 examples/s]Map:  63%|██████▎   | 69598/110379 [01:48<01:02, 654.23 examples/s]Map:  64%|██████▎   | 70188/110379 [01:49<01:04, 619.07 examples/s]Map:  65%|██████▍   | 71706/110379 [01:48<00:58, 662.76 examples/s]Map:  63%|██████▎   | 69075/110379 [01:49<01:16, 539.61 examples/s]Map:  63%|██████▎   | 69671/110379 [01:48<01:00, 672.34 examples/s]Map:  64%|██████▎   | 70266/110379 [01:49<01:01, 656.79 examples/s]Map:  65%|██████▌   | 71783/110379 [01:48<00:56, 684.79 examples/s]Map:  63%|██████▎   | 69151/110379 [01:49<01:10, 587.26 examples/s]Map:  63%|██████▎   | 69746/110379 [01:48<00:58, 688.81 examples/s]Map:  64%|██████▎   | 70348/110379 [01:49<00:57, 697.73 examples/s]Map:  65%|██████▌   | 71859/110379 [01:48<00:54, 701.36 examples/s]Map:  63%|██████▎   | 69230/110379 [01:49<01:04, 633.41 examples/s]Map:  64%|██████▍   | 70426/110379 [01:49<00:55, 717.82 examples/s]Map:  63%|██████▎   | 69854/110379 [01:48<00:58, 696.58 examples/s]Map:  65%|██████▌   | 71934/110379 [01:48<00:54, 711.30 examples/s]Map:  63%|██████▎   | 69312/110379 [01:49<01:00, 676.03 examples/s]Map:  64%|██████▍   | 70510/110379 [01:49<00:53, 748.87 examples/s]Map:  63%|██████▎   | 69942/110379 [01:48<01:01, 655.27 examples/s]Map:  63%|██████▎   | 69412/110379 [01:49<01:00, 672.27 examples/s]Map:  64%|██████▍   | 70612/110379 [01:49<00:55, 717.58 examples/s]Map:  65%|██████▌   | 72034/110379 [01:49<01:10, 544.29 examples/s]Map:  63%|██████▎   | 69489/110379 [01:49<00:58, 694.89 examples/s]Map:  64%|██████▍   | 70701/110379 [01:49<00:59, 669.43 examples/s]Map:  65%|██████▌   | 72111/110379 [01:49<01:04, 589.34 examples/s]Map:  63%|██████▎   | 69561/110379 [01:49<00:58, 697.41 examples/s]Map:  63%|██████▎   | 70029/110379 [01:49<01:23, 481.90 examples/s]Map:  64%|██████▍   | 70777/110379 [01:50<00:57, 685.33 examples/s]Map:  65%|██████▌   | 72189/110379 [01:49<01:00, 630.46 examples/s]Map:  63%|██████▎   | 69636/110379 [01:50<00:57, 711.33 examples/s]Map:  63%|██████▎   | 70089/110379 [01:49<01:19, 504.06 examples/s]Map:  64%|██████▍   | 70848/110379 [01:50<00:57, 690.85 examples/s]Map:  65%|██████▌   | 72261/110379 [01:49<00:58, 651.01 examples/s]Map:  63%|██████▎   | 69713/110379 [01:50<00:56, 721.35 examples/s]Map:  64%|██████▎   | 70165/110379 [01:49<01:12, 556.96 examples/s]Map:  64%|██████▍   | 70922/110379 [01:50<00:56, 700.90 examples/s]Map:  66%|██████▌   | 72344/110379 [01:49<01:01, 614.65 examples/s]Map:  63%|██████▎   | 69814/110379 [01:50<00:58, 695.67 examples/s]Map:  64%|██████▎   | 70256/110379 [01:49<01:10, 568.41 examples/s]Map:  66%|██████▌   | 72439/110379 [01:49<01:01, 617.29 examples/s]Map:  63%|██████▎   | 69906/110379 [01:50<01:00, 665.49 examples/s]Map:  64%|██████▍   | 71000/110379 [01:50<01:17, 505.66 examples/s]Map:  64%|██████▎   | 70335/110379 [01:49<01:12, 551.99 examples/s]Map:  66%|██████▌   | 72518/110379 [01:49<00:57, 656.09 examples/s]Map:  64%|██████▍   | 71072/110379 [01:50<01:11, 549.77 examples/s]Map:  64%|██████▍   | 70399/110379 [01:49<01:10, 569.83 examples/s]Map:  66%|██████▌   | 72592/110379 [01:49<00:56, 674.69 examples/s]Map:  64%|██████▍   | 71150/110379 [01:50<01:05, 600.99 examples/s]Map:  64%|██████▍   | 70473/110379 [01:49<01:05, 609.47 examples/s]Map:  63%|██████▎   | 70000/110379 [01:50<01:17, 520.03 examples/s]Map:  66%|██████▌   | 72669/110379 [01:50<00:54, 696.60 examples/s]Map:  65%|██████▍   | 71228/110379 [01:50<01:01, 641.80 examples/s]Map:  64%|██████▍   | 70547/110379 [01:49<01:02, 641.00 examples/s]Map:  63%|██████▎   | 70079/110379 [01:50<01:10, 572.33 examples/s]Map:  66%|██████▌   | 72745/110379 [01:50<00:52, 710.31 examples/s]Map:  65%|██████▍   | 71304/110379 [01:50<00:58, 671.73 examples/s]Map:  64%|██████▍   | 70628/110379 [01:50<00:58, 684.17 examples/s]Map:  64%|██████▎   | 70154/110379 [01:50<01:05, 610.29 examples/s]Map:  66%|██████▌   | 72822/110379 [01:50<00:51, 724.13 examples/s]Map:  65%|██████▍   | 71377/110379 [01:51<00:56, 686.80 examples/s]Map:  64%|██████▍   | 70703/110379 [01:50<00:56, 699.87 examples/s]Map:  64%|██████▎   | 70227/110379 [01:51<01:02, 637.49 examples/s]Map:  65%|██████▍   | 71459/110379 [01:51<00:54, 720.15 examples/s]Map:  66%|██████▌   | 72935/110379 [01:50<00:51, 728.25 examples/s]Map:  64%|██████▍   | 70775/110379 [01:50<00:56, 699.97 examples/s]Map:  64%|██████▎   | 70298/110379 [01:51<01:01, 654.89 examples/s]Map:  65%|██████▍   | 71537/110379 [01:51<00:52, 734.41 examples/s]Map:  64%|██████▍   | 70377/110379 [01:51<00:57, 690.20 examples/s]Map:  64%|██████▍   | 70882/110379 [01:50<00:56, 699.46 examples/s]Map:  64%|██████▍   | 70455/110379 [01:51<00:55, 714.04 examples/s]Map:  65%|██████▍   | 71644/110379 [01:51<00:53, 719.17 examples/s]Map:  64%|██████▍   | 70962/110379 [01:50<00:54, 722.48 examples/s]Map:  66%|██████▌   | 73035/110379 [01:50<01:08, 544.50 examples/s]Map:  64%|██████▍   | 70534/110379 [01:51<00:54, 732.68 examples/s]Map:  66%|██████▌   | 73109/110379 [01:50<01:03, 583.57 examples/s]Map:  65%|██████▍   | 71741/110379 [01:51<00:55, 691.88 examples/s]Map:  64%|██████▍   | 70617/110379 [01:51<00:52, 757.37 examples/s]Map:  66%|██████▋   | 73191/110379 [01:50<00:58, 633.99 examples/s]Map:  64%|██████▍   | 70695/110379 [01:51<00:52, 762.03 examples/s]Map:  64%|██████▍   | 71069/110379 [01:50<01:10, 555.24 examples/s]Map:  65%|██████▌   | 71838/110379 [01:51<00:57, 673.35 examples/s]Map:  66%|██████▋   | 73265/110379 [01:50<00:56, 655.90 examples/s]Map:  64%|██████▍   | 70773/110379 [01:51<00:51, 763.48 examples/s]Map:  64%|██████▍   | 71140/110379 [01:50<01:07, 584.43 examples/s]Map:  65%|██████▌   | 71908/110379 [01:51<00:56, 679.28 examples/s]Map:  66%|██████▋   | 73369/110379 [01:51<00:55, 666.25 examples/s]Map:  65%|██████▌   | 71979/110379 [01:51<00:56, 685.04 examples/s]Map:  64%|██████▍   | 70865/110379 [01:51<00:56, 702.53 examples/s]Map:  65%|██████▍   | 71226/110379 [01:51<01:07, 579.00 examples/s]Map:  67%|██████▋   | 73464/110379 [01:51<00:56, 652.39 examples/s]Map:  64%|██████▍   | 70955/110379 [01:52<00:59, 662.27 examples/s]Map:  65%|██████▍   | 71319/110379 [01:51<01:06, 588.87 examples/s]Map:  67%|██████▋   | 73553/110379 [01:51<00:58, 625.85 examples/s]Map:  65%|██████▌   | 72072/110379 [01:52<01:17, 492.05 examples/s]Map:  65%|██████▍   | 71405/110379 [01:51<01:06, 581.89 examples/s]Map:  65%|██████▌   | 72141/110379 [01:52<01:12, 530.28 examples/s]Map:  67%|██████▋   | 73644/110379 [01:51<00:59, 614.86 examples/s]Map:  64%|██████▍   | 71040/110379 [01:52<01:16, 516.65 examples/s]Map:  65%|██████▍   | 71473/110379 [01:51<01:04, 600.87 examples/s]Map:  65%|██████▌   | 72215/110379 [01:52<01:06, 573.99 examples/s]Map:  67%|██████▋   | 73708/110379 [01:51<00:59, 618.36 examples/s]Map:  64%|██████▍   | 71117/110379 [01:52<01:09, 567.63 examples/s]Map:  65%|██████▍   | 71546/110379 [01:51<01:01, 630.29 examples/s]Map:  65%|██████▌   | 72287/110379 [01:52<01:02, 607.08 examples/s]Map:  67%|██████▋   | 73785/110379 [01:51<00:56, 653.26 examples/s]Map:  64%|██████▍   | 71187/110379 [01:52<01:05, 595.49 examples/s]Map:  65%|██████▍   | 71616/110379 [01:51<01:00, 645.73 examples/s]Map:  66%|██████▌   | 72360/110379 [01:52<00:59, 636.99 examples/s]Map:  67%|██████▋   | 73862/110379 [01:51<00:53, 681.04 examples/s]Map:  65%|██████▍   | 71259/110379 [01:52<01:02, 625.08 examples/s]Map:  65%|██████▍   | 71695/110379 [01:51<00:56, 682.41 examples/s]Map:  66%|██████▌   | 72432/110379 [01:52<00:57, 654.80 examples/s]Map:  67%|██████▋   | 73935/110379 [01:51<00:52, 690.48 examples/s]Map:  65%|██████▍   | 71339/110379 [01:52<00:58, 669.17 examples/s]Map:  65%|██████▌   | 71766/110379 [01:51<00:56, 684.19 examples/s]Map:  66%|██████▌   | 72507/110379 [01:52<00:56, 674.94 examples/s]Map:  65%|██████▍   | 71411/110379 [01:52<00:57, 681.53 examples/s]Map:  65%|██████▌   | 71870/110379 [01:52<00:56, 684.58 examples/s]Map:  65%|██████▍   | 71492/110379 [01:52<00:54, 714.38 examples/s]Map:  66%|██████▌   | 72612/110379 [01:52<00:55, 679.36 examples/s]Map:  67%|██████▋   | 74031/110379 [01:52<01:07, 535.73 examples/s]Map:  65%|██████▌   | 71942/110379 [01:52<00:55, 691.58 examples/s]Map:  65%|██████▍   | 71567/110379 [01:53<00:54, 718.42 examples/s]Map:  66%|██████▌   | 72690/110379 [01:53<00:53, 703.81 examples/s]Map:  67%|██████▋   | 74108/110379 [01:52<01:02, 584.37 examples/s]Map:  65%|██████▍   | 71645/110379 [01:53<00:52, 734.41 examples/s]Map:  66%|██████▌   | 72762/110379 [01:53<00:53, 704.34 examples/s]Map:  67%|██████▋   | 74176/110379 [01:52<00:59, 604.04 examples/s]Map:  65%|██████▌   | 72028/110379 [01:52<01:15, 504.91 examples/s]Map:  65%|██████▌   | 71748/110379 [01:53<00:54, 712.26 examples/s]Map:  66%|██████▌   | 72860/110379 [01:53<00:55, 678.45 examples/s]Map:  67%|██████▋   | 74270/110379 [01:52<00:59, 607.45 examples/s]Map:  65%|██████▌   | 72105/110379 [01:52<01:08, 557.55 examples/s]Map:  66%|██████▌   | 72933/110379 [01:53<00:54, 687.72 examples/s]Map:  65%|██████▌   | 71844/110379 [01:53<00:56, 683.82 examples/s]Map:  67%|██████▋   | 74349/110379 [01:52<00:55, 649.41 examples/s]Map:  65%|██████▌   | 72188/110379 [01:52<01:01, 617.04 examples/s]Map:  67%|██████▋   | 74429/110379 [01:52<00:52, 685.30 examples/s]Map:  65%|██████▌   | 72265/110379 [01:52<00:58, 650.44 examples/s]Map:  65%|██████▌   | 71945/110379 [01:53<00:56, 676.46 examples/s]Map:  68%|██████▊   | 74510/110379 [01:52<00:50, 716.91 examples/s]Map:  66%|██████▌   | 72336/110379 [01:52<00:57, 661.96 examples/s]Map:  66%|██████▌   | 73033/110379 [01:53<01:12, 515.74 examples/s]Map:  68%|██████▊   | 74589/110379 [01:52<00:48, 736.02 examples/s]Map:  66%|██████▌   | 72407/110379 [01:52<00:56, 673.75 examples/s]Map:  66%|██████▌   | 73106/110379 [01:53<01:06, 558.09 examples/s]Map:  65%|██████▌   | 72034/110379 [01:53<01:11, 539.18 examples/s]Map:  68%|██████▊   | 74670/110379 [01:53<00:47, 754.70 examples/s]Map:  66%|██████▌   | 72487/110379 [01:53<00:53, 706.97 examples/s]Map:  66%|██████▋   | 73177/110379 [01:53<01:03, 589.74 examples/s]Map:  65%|██████▌   | 72111/110379 [01:53<01:05, 585.66 examples/s]Map:  68%|██████▊   | 74749/110379 [01:53<00:46, 762.84 examples/s]Map:  66%|██████▌   | 72563/110379 [01:53<00:52, 719.48 examples/s]Map:  66%|██████▋   | 73252/110379 [01:53<00:59, 625.26 examples/s]Map:  65%|██████▌   | 72188/110379 [01:54<01:01, 624.76 examples/s]Map:  66%|██████▌   | 72642/110379 [01:53<00:51, 736.45 examples/s]Map:  68%|██████▊   | 74862/110379 [01:53<00:46, 755.92 examples/s]Map:  65%|██████▌   | 72265/110379 [01:54<00:57, 657.90 examples/s]Map:  66%|██████▋   | 73353/110379 [01:54<00:58, 638.25 examples/s]Map:  66%|██████▌   | 72722/110379 [01:53<00:50, 751.30 examples/s]Map:  68%|██████▊   | 74942/110379 [01:53<00:46, 764.46 examples/s]Map:  66%|██████▌   | 72342/110379 [01:54<00:55, 682.52 examples/s]Map:  67%|██████▋   | 73456/110379 [01:54<00:56, 651.06 examples/s]Map:  66%|██████▌   | 72834/110379 [01:53<00:50, 746.03 examples/s]Map:  66%|██████▌   | 72417/110379 [01:54<00:54, 698.66 examples/s]Map:  67%|██████▋   | 73560/110379 [01:54<00:55, 661.70 examples/s]Map:  66%|██████▌   | 72500/110379 [01:54<00:51, 730.75 examples/s]Map:  68%|██████▊   | 75041/110379 [01:53<01:00, 582.99 examples/s]Map:  66%|██████▌   | 72947/110379 [01:53<00:50, 742.39 examples/s]Map:  68%|██████▊   | 75117/110379 [01:53<00:56, 619.13 examples/s]Map:  66%|██████▌   | 72607/110379 [01:54<00:52, 721.28 examples/s]Map:  67%|██████▋   | 73660/110379 [01:54<00:55, 656.58 examples/s]Map:  66%|██████▌   | 72684/110379 [01:54<00:51, 730.71 examples/s]Map:  67%|██████▋   | 73732/110379 [01:54<00:54, 668.50 examples/s]Map:  68%|██████▊   | 75223/110379 [01:53<00:54, 640.42 examples/s]Map:  66%|██████▌   | 73036/110379 [01:53<01:06, 564.65 examples/s]Map:  66%|██████▌   | 72762/110379 [01:54<00:50, 739.24 examples/s]Map:  67%|██████▋   | 73807/110379 [01:54<00:53, 685.80 examples/s]Map:  68%|██████▊   | 75300/110379 [01:54<00:52, 668.77 examples/s]Map:  66%|██████▌   | 73116/110379 [01:53<01:00, 612.00 examples/s]Map:  66%|██████▌   | 72842/110379 [01:54<00:49, 752.87 examples/s]Map:  67%|██████▋   | 73880/110379 [01:54<00:52, 695.77 examples/s]Map:  68%|██████▊   | 75380/110379 [01:54<00:50, 699.79 examples/s]Map:  66%|██████▋   | 73194/110379 [01:54<00:57, 648.48 examples/s]Map:  67%|██████▋   | 73953/110379 [01:54<00:51, 703.66 examples/s]Map:  66%|██████▌   | 72922/110379 [01:54<00:49, 761.68 examples/s]Map:  68%|██████▊   | 75461/110379 [01:54<00:48, 725.64 examples/s]Map:  66%|██████▋   | 73273/110379 [01:54<00:55, 673.21 examples/s]Map:  68%|██████▊   | 75540/110379 [01:54<00:47, 739.82 examples/s]Map:  66%|██████▋   | 73353/110379 [01:54<00:52, 701.52 examples/s]Map:  69%|██████▊   | 75619/110379 [01:54<00:46, 751.49 examples/s]Map:  66%|██████▌   | 73000/110379 [01:55<01:06, 561.56 examples/s]Map:  67%|██████▋   | 73427/110379 [01:54<00:52, 708.73 examples/s]Map:  67%|██████▋   | 74039/110379 [01:55<01:08, 528.44 examples/s]Map:  69%|██████▊   | 75698/110379 [01:54<00:45, 757.59 examples/s]Map:  66%|██████▌   | 73081/110379 [01:55<01:00, 617.29 examples/s]Map:  67%|██████▋   | 73510/110379 [01:54<00:50, 736.98 examples/s]Map:  67%|██████▋   | 74110/110379 [01:55<01:04, 560.57 examples/s]Map:  69%|██████▊   | 75776/110379 [01:54<00:45, 761.95 examples/s]Map:  66%|██████▋   | 73157/110379 [01:55<00:57, 650.41 examples/s]Map:  67%|██████▋   | 73587/110379 [01:54<00:49, 742.93 examples/s]Map:  67%|██████▋   | 74179/110379 [01:55<01:01, 588.89 examples/s]Map:  66%|██████▋   | 73234/110379 [01:55<00:54, 680.69 examples/s]Map:  67%|██████▋   | 73668/110379 [01:54<00:48, 760.48 examples/s]Map:  67%|██████▋   | 74254/110379 [01:55<00:57, 624.26 examples/s]Map:  69%|██████▉   | 75894/110379 [01:54<00:44, 766.82 examples/s]Map:  67%|██████▋   | 74329/110379 [01:55<00:54, 655.98 examples/s]Map:  66%|██████▋   | 73346/110379 [01:55<00:52, 701.54 examples/s]Map:  67%|██████▋   | 73781/110379 [01:54<00:48, 754.65 examples/s]Map:  67%|██████▋   | 73426/110379 [01:55<00:51, 722.40 examples/s]Map:  67%|██████▋   | 74437/110379 [01:55<00:53, 676.27 examples/s]Map:  69%|██████▉   | 76000/110379 [01:55<00:58, 589.03 examples/s]Map:  67%|██████▋   | 73887/110379 [01:55<00:49, 734.59 examples/s]Map:  68%|██████▊   | 74507/110379 [01:55<00:52, 679.95 examples/s]Map:  69%|██████▉   | 76070/110379 [01:55<00:56, 610.44 examples/s]Map:  67%|██████▋   | 73528/110379 [01:55<00:52, 705.09 examples/s]Map:  67%|██████▋   | 73963/110379 [01:55<00:49, 738.36 examples/s]Map:  69%|██████▉   | 76144/110379 [01:55<00:53, 636.49 examples/s]Map:  68%|██████▊   | 74599/110379 [01:56<00:54, 654.69 examples/s]Map:  67%|██████▋   | 73628/110379 [01:56<00:53, 687.88 examples/s]Map:  69%|██████▉   | 76225/110379 [01:55<00:50, 675.50 examples/s]Map:  68%|██████▊   | 74671/110379 [01:56<00:53, 669.43 examples/s]Map:  67%|██████▋   | 73710/110379 [01:56<00:51, 716.69 examples/s]Map:  67%|██████▋   | 74074/110379 [01:55<01:03, 575.44 examples/s]Map:  69%|██████▉   | 76312/110379 [01:55<00:47, 721.63 examples/s]Map:  68%|██████▊   | 74751/110379 [01:56<00:51, 698.31 examples/s]Map:  67%|██████▋   | 73788/110379 [01:56<00:50, 730.17 examples/s]Map:  67%|██████▋   | 74152/110379 [01:55<00:58, 616.02 examples/s]Map:  69%|██████▉   | 76389/110379 [01:55<00:46, 733.45 examples/s]Map:  68%|██████▊   | 74828/110379 [01:56<00:49, 715.89 examples/s]Map:  67%|██████▋   | 74227/110379 [01:55<00:56, 642.80 examples/s]Map:  69%|██████▉   | 76467/110379 [01:55<00:45, 742.18 examples/s]Map:  67%|██████▋   | 73893/110379 [01:56<00:51, 712.90 examples/s]Map:  68%|██████▊   | 74904/110379 [01:56<00:49, 723.83 examples/s]Map:  67%|██████▋   | 74306/110379 [01:55<00:53, 677.19 examples/s]Map:  69%|██████▉   | 76548/110379 [01:55<00:44, 756.62 examples/s]Map:  67%|██████▋   | 73966/110379 [01:56<00:50, 716.02 examples/s]Map:  67%|██████▋   | 74387/110379 [01:55<00:50, 707.51 examples/s]Map:  69%|██████▉   | 76659/110379 [01:55<00:45, 746.62 examples/s]Map:  68%|██████▊   | 75000/110379 [01:56<01:05, 543.82 examples/s]Map:  67%|██████▋   | 74462/110379 [01:55<00:50, 715.61 examples/s]Map:  70%|██████▉   | 76737/110379 [01:56<00:44, 754.03 examples/s]Map:  67%|██████▋   | 74073/110379 [01:56<01:05, 553.79 examples/s]Map:  68%|██████▊   | 75074/110379 [01:56<01:00, 585.42 examples/s]Map:  68%|██████▊   | 74537/110379 [01:55<00:49, 720.05 examples/s]Map:  70%|██████▉   | 76818/110379 [01:56<00:43, 767.76 examples/s]Map:  67%|██████▋   | 74149/110379 [01:56<01:01, 593.77 examples/s]Map:  68%|██████▊   | 75156/110379 [01:56<00:55, 639.17 examples/s]Map:  68%|██████▊   | 74644/110379 [01:56<00:49, 715.10 examples/s]Map:  67%|██████▋   | 74229/110379 [01:57<00:56, 639.49 examples/s]Map:  68%|██████▊   | 75235/110379 [01:57<00:52, 674.91 examples/s]Map:  70%|██████▉   | 76927/110379 [01:56<00:44, 748.48 examples/s]Map:  68%|██████▊   | 74717/110379 [01:56<00:49, 714.73 examples/s]Map:  67%|██████▋   | 74307/110379 [01:57<00:53, 668.89 examples/s]Map:  68%|██████▊   | 75310/110379 [01:57<00:50, 692.49 examples/s]Map:  68%|██████▊   | 74790/110379 [01:56<00:49, 714.88 examples/s]Map:  67%|██████▋   | 74384/110379 [01:57<00:52, 690.89 examples/s]Map:  68%|██████▊   | 75388/110379 [01:57<00:49, 712.59 examples/s]Map:  68%|██████▊   | 74863/110379 [01:56<00:49, 717.28 examples/s]Map:  70%|██████▉   | 77043/110379 [01:56<00:57, 583.17 examples/s]Map:  68%|██████▊   | 75465/110379 [01:57<00:48, 725.52 examples/s]Map:  67%|██████▋   | 74482/110379 [01:57<00:53, 671.12 examples/s]Map:  68%|██████▊   | 74963/110379 [01:56<00:51, 693.36 examples/s]Map:  70%|██████▉   | 77143/110379 [01:56<00:55, 603.08 examples/s]Map:  68%|██████▊   | 75565/110379 [01:57<00:49, 697.93 examples/s]Map:  68%|██████▊   | 74582/110379 [01:57<00:53, 668.07 examples/s]Map:  70%|██████▉   | 77221/110379 [01:56<00:51, 637.66 examples/s]Map:  68%|██████▊   | 74659/110379 [01:57<00:51, 689.55 examples/s]Map:  69%|██████▊   | 75674/110379 [01:57<00:49, 706.59 examples/s]Map:  70%|███████   | 77301/110379 [01:56<00:49, 672.00 examples/s]Map:  68%|██████▊   | 75070/110379 [01:56<01:06, 533.56 examples/s]Map:  68%|██████▊   | 74731/110379 [01:57<00:51, 696.93 examples/s]Map:  69%|██████▊   | 75755/110379 [01:57<00:47, 726.75 examples/s]Map:  70%|███████   | 77382/110379 [01:57<00:46, 703.74 examples/s]Map:  68%|██████▊   | 75144/110379 [01:56<01:01, 573.31 examples/s]Map:  68%|██████▊   | 74813/110379 [01:57<00:48, 726.86 examples/s]Map:  69%|██████▊   | 75838/110379 [01:57<00:45, 752.20 examples/s]Map:  70%|███████   | 77463/110379 [01:57<00:45, 728.71 examples/s]Map:  68%|██████▊   | 75217/110379 [01:57<00:57, 607.12 examples/s]Map:  68%|██████▊   | 74888/110379 [01:57<00:48, 731.92 examples/s]Map:  69%|██████▉   | 75915/110379 [01:57<00:45, 754.75 examples/s]Map:  70%|███████   | 77543/110379 [01:57<00:43, 746.97 examples/s]Map:  68%|██████▊   | 75291/110379 [01:57<00:55, 637.64 examples/s]Map:  70%|███████   | 77623/110379 [01:57<00:43, 756.75 examples/s]Map:  68%|██████▊   | 75370/110379 [01:57<00:51, 675.41 examples/s]Map:  70%|███████   | 77703/110379 [01:57<00:42, 763.17 examples/s]Map:  69%|██████▉   | 76000/110379 [01:58<01:01, 562.03 examples/s]Map:  68%|██████▊   | 75000/110379 [01:58<01:02, 565.21 examples/s]Map:  68%|██████▊   | 75450/110379 [01:57<00:49, 708.22 examples/s]Map:  69%|██████▉   | 76078/110379 [01:58<00:56, 608.96 examples/s]Map:  70%|███████   | 77787/110379 [01:57<00:41, 781.16 examples/s]Map:  68%|██████▊   | 75081/110379 [01:58<00:57, 610.75 examples/s]Map:  68%|██████▊   | 75529/110379 [01:57<00:47, 729.35 examples/s]Map:  71%|███████   | 77870/110379 [01:57<00:40, 794.80 examples/s]Map:  69%|██████▉   | 76158/110379 [01:58<00:52, 653.33 examples/s]Map:  68%|██████▊   | 75158/110379 [01:58<00:54, 645.15 examples/s]Map:  68%|██████▊   | 75608/110379 [01:57<00:46, 743.42 examples/s]Map:  69%|██████▉   | 76233/110379 [01:58<00:50, 675.19 examples/s]Map:  71%|███████   | 77978/110379 [01:57<00:42, 762.81 examples/s]Map:  68%|██████▊   | 75249/110379 [01:58<00:55, 629.77 examples/s]Map:  69%|██████▊   | 75720/110379 [01:57<00:46, 738.28 examples/s]Map:  69%|██████▉   | 76311/110379 [01:58<00:48, 698.64 examples/s]Map:  68%|██████▊   | 75330/110379 [01:58<00:52, 668.63 examples/s]Map:  69%|██████▊   | 75801/110379 [01:57<00:45, 751.95 examples/s]Map:  69%|██████▉   | 76417/110379 [01:58<00:48, 695.72 examples/s]Map:  68%|██████▊   | 75405/110379 [01:58<00:50, 687.67 examples/s]Map:  71%|███████   | 78070/110379 [01:58<00:56, 575.91 examples/s]Map:  69%|██████▉   | 75907/110379 [01:58<00:47, 727.70 examples/s]Map:  68%|██████▊   | 75477/110379 [01:58<00:50, 692.60 examples/s]Map:  71%|███████   | 78149/110379 [01:58<00:52, 617.52 examples/s]Map:  69%|██████▉   | 76525/110379 [01:58<00:48, 698.64 examples/s]Map:  69%|██████▉   | 75981/110379 [01:58<00:47, 728.84 examples/s]Map:  68%|██████▊   | 75553/110379 [01:58<00:49, 710.16 examples/s]Map:  71%|███████   | 78221/110379 [01:58<00:50, 639.36 examples/s]Map:  69%|██████▉   | 76630/110379 [01:59<00:48, 697.30 examples/s]Map:  71%|███████   | 78297/110379 [01:58<00:47, 668.69 examples/s]Map:  69%|██████▊   | 75665/110379 [01:59<00:48, 722.07 examples/s]Map:  69%|██████▉   | 76705/110379 [01:59<00:47, 707.88 examples/s]Map:  69%|██████▉   | 76072/110379 [01:58<01:01, 559.41 examples/s]Map:  71%|███████   | 78373/110379 [01:58<00:46, 689.82 examples/s]Map:  69%|██████▊   | 75741/110379 [01:59<00:47, 727.76 examples/s]Map:  70%|██████▉   | 76784/110379 [01:59<00:46, 726.06 examples/s]Map:  69%|██████▉   | 76135/110379 [01:58<01:00, 566.75 examples/s]Map:  71%|███████   | 78486/110379 [01:58<00:44, 710.14 examples/s]Map:  69%|██████▊   | 75844/110379 [01:59<00:48, 708.37 examples/s]Map:  69%|██████▉   | 76200/110379 [01:58<00:58, 584.20 examples/s]Map:  70%|██████▉   | 76894/110379 [01:59<00:46, 724.14 examples/s]Map:  71%|███████   | 78563/110379 [01:58<00:44, 720.40 examples/s]Map:  69%|██████▉   | 76278/110379 [01:58<00:54, 624.52 examples/s]Map:  69%|██████▉   | 75954/110379 [01:59<00:48, 713.37 examples/s]Map:  71%|███████   | 78644/110379 [01:58<00:42, 740.86 examples/s]Map:  70%|██████▉   | 76984/110379 [01:59<00:49, 678.81 examples/s]Map:  69%|██████▉   | 76356/110379 [01:58<00:51, 663.52 examples/s]Map:  71%|███████▏  | 78755/110379 [01:58<00:42, 735.92 examples/s]Map:  69%|██████▉   | 76428/110379 [01:58<00:50, 677.96 examples/s]Map:  69%|██████▉   | 76036/110379 [01:59<01:02, 553.69 examples/s]Map:  71%|███████▏  | 78836/110379 [01:59<00:42, 750.70 examples/s]Map:  69%|██████▉   | 76506/110379 [01:58<00:48, 702.48 examples/s]Map:  70%|██████▉   | 77063/110379 [01:59<01:09, 478.36 examples/s]Map:  69%|██████▉   | 76112/110379 [01:59<00:57, 594.46 examples/s]Map:  70%|██████▉   | 77137/110379 [01:59<01:03, 525.75 examples/s]Map:  72%|███████▏  | 78950/110379 [01:59<00:41, 748.88 examples/s]Map:  69%|██████▉   | 76598/110379 [01:59<00:50, 665.11 examples/s]Map:  69%|██████▉   | 76183/110379 [01:59<00:55, 619.09 examples/s]Map:  70%|██████▉   | 77204/110379 [02:00<00:59, 554.98 examples/s]Map:  69%|██████▉   | 76674/110379 [01:59<00:48, 688.92 examples/s]Map:  69%|██████▉   | 76256/110379 [02:00<00:59, 572.50 examples/s]Map:  70%|██████▉   | 76749/110379 [01:59<00:47, 701.75 examples/s]Map:  70%|███████   | 77272/110379 [02:00<00:57, 577.34 examples/s]Map:  72%|███████▏  | 79028/110379 [01:59<00:56, 550.16 examples/s]Map:  69%|██████▉   | 76322/110379 [02:00<00:57, 590.77 examples/s]Map:  72%|███████▏  | 79095/110379 [01:59<00:54, 573.11 examples/s]Map:  70%|███████   | 77358/110379 [02:00<00:57, 574.09 examples/s]Map:  70%|██████▉   | 76847/110379 [01:59<00:49, 677.91 examples/s]Map:  69%|██████▉   | 76388/110379 [02:00<00:56, 605.36 examples/s]Map:  72%|███████▏  | 79168/110379 [01:59<00:51, 605.99 examples/s]Map:  69%|██████▉   | 76455/110379 [02:00<00:54, 621.08 examples/s]Map:  70%|██████▉   | 76936/110379 [01:59<00:51, 646.53 examples/s]Map:  70%|███████   | 77446/110379 [02:00<00:57, 573.36 examples/s]Map:  72%|███████▏  | 79267/110379 [01:59<00:50, 620.27 examples/s]Map:  70%|███████   | 77510/110379 [02:00<00:56, 584.89 examples/s]Map:  69%|██████▉   | 76551/110379 [02:00<00:54, 625.15 examples/s]Map:  69%|██████▉   | 76616/110379 [02:00<00:53, 628.77 examples/s]Map:  72%|███████▏  | 79364/110379 [01:59<00:49, 624.96 examples/s]Map:  70%|███████   | 77597/110379 [02:00<00:56, 580.24 examples/s]Map:  70%|██████▉   | 77028/110379 [01:59<01:10, 473.42 examples/s]Map:  69%|██████▉   | 76687/110379 [02:00<00:51, 649.13 examples/s]Map:  72%|███████▏  | 79431/110379 [02:00<00:48, 632.40 examples/s]Map:  70%|███████   | 77690/110379 [02:00<00:55, 590.61 examples/s]Map:  70%|██████▉   | 77086/110379 [02:00<01:07, 491.29 examples/s]Map:  70%|██████▉   | 76765/110379 [02:00<00:49, 681.44 examples/s]Map:  72%|███████▏  | 79520/110379 [02:00<00:50, 616.96 examples/s]Map:  70%|██████▉   | 77145/110379 [02:00<01:05, 510.22 examples/s]Map:  70%|██████▉   | 76844/110379 [02:00<00:47, 709.32 examples/s]Map:  70%|███████   | 77778/110379 [02:01<00:55, 585.81 examples/s]Map:  70%|██████▉   | 77208/110379 [02:00<01:01, 535.67 examples/s]Map:  70%|██████▉   | 76916/110379 [02:01<00:47, 707.69 examples/s]Map:  72%|███████▏  | 79613/110379 [02:00<00:49, 615.79 examples/s]Map:  71%|███████   | 77869/110379 [02:01<00:55, 589.00 examples/s]Map:  70%|███████   | 77276/110379 [02:00<00:58, 567.76 examples/s]Map:  70%|██████▉   | 76990/110379 [02:01<00:46, 713.77 examples/s]Map:  72%|███████▏  | 79676/110379 [02:00<00:49, 617.00 examples/s]Map:  71%|███████   | 77957/110379 [02:01<00:55, 585.15 examples/s]Map:  70%|███████   | 77368/110379 [02:00<00:56, 579.34 examples/s]Map:  72%|███████▏  | 79766/110379 [02:00<00:50, 608.13 examples/s]Map:  70%|███████   | 77442/110379 [02:00<00:53, 617.04 examples/s]Map:  70%|██████▉   | 77084/110379 [02:01<01:07, 494.85 examples/s]Map:  72%|███████▏  | 79859/110379 [02:00<00:50, 606.54 examples/s]Map:  70%|███████   | 77516/110379 [02:00<00:50, 646.59 examples/s]Map:  70%|██████▉   | 77160/110379 [02:01<01:00, 548.58 examples/s]Map:  71%|███████   | 78031/110379 [02:01<01:14, 434.01 examples/s]Map:  72%|███████▏  | 79921/110379 [02:00<00:50, 606.98 examples/s]Map:  70%|███████   | 77592/110379 [02:00<00:48, 675.28 examples/s]Map:  70%|██████▉   | 77236/110379 [02:01<00:55, 596.12 examples/s]Map:  71%|███████   | 78094/110379 [02:01<01:08, 468.67 examples/s]Map:  70%|███████   | 77665/110379 [02:00<00:47, 689.21 examples/s]Map:  70%|███████   | 77313/110379 [02:01<00:51, 638.38 examples/s]Map:  71%|███████   | 78156/110379 [02:01<01:04, 497.01 examples/s]Map:  70%|███████   | 77388/110379 [02:01<00:49, 664.15 examples/s]Map:  70%|███████   | 77773/110379 [02:01<00:46, 696.88 examples/s]Map:  72%|███████▏  | 80000/110379 [02:01<01:08, 446.35 examples/s]Map:  71%|███████   | 78215/110379 [02:01<01:02, 515.48 examples/s]Map:  70%|███████   | 77463/110379 [02:01<00:48, 684.04 examples/s]Map:  73%|███████▎  | 80084/110379 [02:01<00:58, 522.19 examples/s]Map:  71%|███████   | 78280/110379 [02:02<00:58, 545.26 examples/s]Map:  71%|███████   | 77867/110379 [02:01<00:48, 664.63 examples/s]Map:  70%|███████   | 77540/110379 [02:02<00:46, 705.99 examples/s]Map:  73%|███████▎  | 80158/110379 [02:01<00:53, 569.04 examples/s]Map:  71%|███████   | 78340/110379 [02:02<00:57, 557.39 examples/s]Map:  71%|███████   | 77937/110379 [02:01<00:48, 669.78 examples/s]Map:  70%|███████   | 77615/110379 [02:02<00:45, 716.62 examples/s]Map:  73%|███████▎  | 80239/110379 [02:01<00:48, 624.74 examples/s]Map:  71%|███████   | 78400/110379 [02:02<00:56, 563.32 examples/s]Map:  73%|███████▎  | 80312/110379 [02:01<00:46, 650.37 examples/s]Map:  71%|███████   | 78464/110379 [02:02<00:55, 580.02 examples/s]Map:  70%|███████   | 77726/110379 [02:02<00:45, 721.72 examples/s]Map:  71%|███████   | 78033/110379 [02:01<01:01, 529.44 examples/s]Map:  73%|███████▎  | 80383/110379 [02:01<00:45, 664.06 examples/s]Map:  71%|███████   | 78555/110379 [02:02<00:54, 585.40 examples/s]Map:  71%|███████   | 77823/110379 [02:02<00:46, 693.65 examples/s]Map:  71%|███████   | 78100/110379 [02:01<00:57, 558.28 examples/s]Map:  73%|███████▎  | 80491/110379 [02:01<00:44, 678.63 examples/s]Map:  71%|███████   | 78625/110379 [02:02<00:52, 610.62 examples/s]Map:  71%|███████   | 77899/110379 [02:02<00:45, 709.47 examples/s]Map:  71%|███████   | 78181/110379 [02:01<00:52, 614.17 examples/s]Map:  73%|███████▎  | 80567/110379 [02:01<00:42, 697.76 examples/s]Map:  71%|███████▏  | 78700/110379 [02:02<00:49, 646.32 examples/s]Map:  71%|███████   | 77978/110379 [02:02<00:44, 728.33 examples/s]Map:  71%|███████   | 78258/110379 [02:01<00:49, 650.63 examples/s]Map:  73%|███████▎  | 80641/110379 [02:02<00:42, 705.01 examples/s]Map:  71%|███████▏  | 78772/110379 [02:02<00:47, 663.19 examples/s]Map:  71%|███████   | 78334/110379 [02:01<00:47, 676.36 examples/s]Map:  73%|███████▎  | 80719/110379 [02:02<00:40, 724.36 examples/s]Map:  71%|███████▏  | 78841/110379 [02:02<00:47, 666.24 examples/s]Map:  71%|███████   | 78406/110379 [02:02<00:46, 686.17 examples/s]Map:  71%|███████   | 78075/110379 [02:02<00:58, 553.28 examples/s]Map:  73%|███████▎  | 80794/110379 [02:02<00:40, 730.46 examples/s]Map:  71%|███████▏  | 78917/110379 [02:03<00:45, 689.36 examples/s]Map:  71%|███████   | 78155/110379 [02:03<00:53, 604.80 examples/s]Map:  71%|███████   | 78501/110379 [02:02<00:48, 661.61 examples/s]Map:  73%|███████▎  | 80877/110379 [02:02<00:39, 756.28 examples/s]Map:  72%|███████▏  | 78997/110379 [02:03<00:43, 713.50 examples/s]Map:  71%|███████   | 78234/110379 [02:03<00:49, 646.17 examples/s]Map:  73%|███████▎  | 80960/110379 [02:02<00:37, 776.47 examples/s]Map:  71%|███████   | 78587/110379 [02:02<00:50, 627.49 examples/s]Map:  71%|███████   | 78316/110379 [02:03<00:46, 684.31 examples/s]Map:  72%|███████▏  | 79070/110379 [02:03<01:00, 519.89 examples/s]Map:  71%|███████   | 78395/110379 [02:03<00:45, 709.50 examples/s]Map:  71%|███████▏  | 78684/110379 [02:02<00:50, 628.81 examples/s]Map:  73%|███████▎  | 81041/110379 [02:02<00:50, 578.28 examples/s]Map:  72%|███████▏  | 79150/110379 [02:03<00:53, 583.49 examples/s]Map:  71%|███████   | 78476/110379 [02:03<00:43, 734.48 examples/s]Map:  73%|███████▎  | 81119/110379 [02:02<00:46, 623.24 examples/s]Map:  71%|███████▏  | 78773/110379 [02:02<00:51, 611.14 examples/s]Map:  72%|███████▏  | 79227/110379 [02:03<00:49, 628.41 examples/s]Map:  74%|███████▎  | 81202/110379 [02:02<00:43, 670.43 examples/s]Map:  71%|███████   | 78583/110379 [02:03<00:44, 721.39 examples/s]Map:  72%|███████▏  | 79304/110379 [02:03<00:46, 662.82 examples/s]Map:  71%|███████▏  | 78865/110379 [02:02<00:51, 607.96 examples/s]Map:  74%|███████▎  | 81282/110379 [02:02<00:41, 700.28 examples/s]Map:  71%|███████▏  | 78664/110379 [02:03<00:42, 739.50 examples/s]Map:  72%|███████▏  | 79384/110379 [02:03<00:44, 697.60 examples/s]Map:  72%|███████▏  | 78935/110379 [02:02<00:50, 627.84 examples/s]Map:  74%|███████▎  | 81359/110379 [02:03<00:40, 714.37 examples/s]Map:  72%|███████▏  | 79459/110379 [02:03<00:43, 711.86 examples/s]Map:  71%|███████▏  | 78762/110379 [02:03<00:44, 704.43 examples/s]Map:  74%|███████▍  | 81444/110379 [02:03<00:38, 750.80 examples/s]Map:  72%|███████▏  | 79000/110379 [02:03<01:03, 495.51 examples/s]Map:  72%|███████▏  | 79559/110379 [02:03<00:44, 690.88 examples/s]Map:  71%|███████▏  | 78859/110379 [02:04<00:46, 681.26 examples/s]Map:  74%|███████▍  | 81549/110379 [02:03<00:39, 728.24 examples/s]Map:  72%|███████▏  | 79067/110379 [02:03<00:58, 532.06 examples/s]Map:  72%|███████▏  | 79661/110379 [02:04<00:45, 681.58 examples/s]Map:  72%|███████▏  | 79144/110379 [02:03<00:53, 585.21 examples/s]Map:  74%|███████▍  | 81658/110379 [02:03<00:39, 725.72 examples/s]Map:  72%|███████▏  | 78948/110379 [02:04<00:54, 580.50 examples/s]Map:  72%|███████▏  | 79740/110379 [02:04<00:43, 706.95 examples/s]Map:  72%|███████▏  | 79221/110379 [02:03<00:49, 630.10 examples/s]Map:  72%|███████▏  | 79814/110379 [02:04<00:42, 711.99 examples/s]Map:  74%|███████▍  | 81771/110379 [02:03<00:39, 730.39 examples/s]Map:  72%|███████▏  | 79302/110379 [02:03<00:46, 675.27 examples/s]Map:  72%|███████▏  | 79890/110379 [02:04<00:42, 722.17 examples/s]Map:  74%|███████▍  | 81848/110379 [02:03<00:38, 738.82 examples/s]Map:  72%|███████▏  | 79038/110379 [02:04<01:02, 501.15 examples/s]Map:  72%|███████▏  | 79374/110379 [02:03<00:45, 686.29 examples/s]Map:  72%|███████▏  | 79964/110379 [02:04<00:41, 725.40 examples/s]Map:  74%|███████▍  | 81927/110379 [02:03<00:37, 749.21 examples/s]Map:  72%|███████▏  | 79120/110379 [02:04<00:55, 559.98 examples/s]Map:  72%|███████▏  | 79452/110379 [02:03<00:43, 711.51 examples/s]Map:  72%|███████▏  | 79198/110379 [02:04<00:51, 604.13 examples/s]Map:  72%|███████▏  | 79532/110379 [02:03<00:42, 732.98 examples/s]Map:  73%|███████▎  | 80040/110379 [02:04<00:55, 550.05 examples/s]Map:  72%|███████▏  | 79274/110379 [02:04<00:48, 637.19 examples/s]Map:  74%|███████▍  | 82039/110379 [02:04<00:48, 587.10 examples/s]Map:  72%|███████▏  | 79638/110379 [02:04<00:42, 717.93 examples/s]Map:  73%|███████▎  | 80119/110379 [02:04<00:50, 604.56 examples/s]Map:  72%|███████▏  | 79371/110379 [02:04<00:48, 638.10 examples/s]Map:  74%|███████▍  | 82114/110379 [02:04<00:45, 619.73 examples/s]Map:  72%|███████▏  | 79713/110379 [02:04<00:42, 723.26 examples/s]Map:  73%|███████▎  | 80197/110379 [02:04<00:46, 644.96 examples/s]Map:  72%|███████▏  | 79448/110379 [02:05<00:46, 666.80 examples/s]Map:  74%|███████▍  | 82196/110379 [02:04<00:42, 663.76 examples/s]Map:  73%|███████▎  | 80271/110379 [02:05<00:45, 667.74 examples/s]Map:  72%|███████▏  | 79805/110379 [02:04<00:44, 680.11 examples/s]Map:  72%|███████▏  | 79524/110379 [02:05<00:44, 686.12 examples/s]Map:  75%|███████▍  | 82273/110379 [02:04<00:40, 688.88 examples/s]Map:  73%|███████▎  | 80349/110379 [02:05<00:43, 696.46 examples/s]Map:  72%|███████▏  | 79879/110379 [02:04<00:43, 695.17 examples/s]Map:  72%|███████▏  | 79597/110379 [02:05<00:44, 693.68 examples/s]Map:  75%|███████▍  | 82352/110379 [02:04<00:39, 713.65 examples/s]Map:  72%|███████▏  | 79956/110379 [02:04<00:42, 712.84 examples/s]Map:  73%|███████▎  | 80459/110379 [02:05<00:42, 706.74 examples/s]Map:  72%|███████▏  | 79682/110379 [02:05<00:41, 733.21 examples/s]Map:  75%|███████▍  | 82432/110379 [02:04<00:38, 732.41 examples/s]Map:  73%|███████▎  | 80537/110379 [02:05<00:41, 722.10 examples/s]Map:  72%|███████▏  | 79757/110379 [02:05<00:41, 734.10 examples/s]Map:  75%|███████▍  | 82543/110379 [02:04<00:38, 731.16 examples/s]Map:  73%|███████▎  | 80637/110379 [02:05<00:42, 697.92 examples/s]Map:  72%|███████▏  | 79859/110379 [02:05<00:43, 707.05 examples/s]Map:  75%|███████▍  | 82620/110379 [02:04<00:37, 737.72 examples/s]Map:  73%|███████▎  | 80062/110379 [02:04<00:57, 529.16 examples/s]Map:  73%|███████▎  | 80713/110379 [02:05<00:41, 712.74 examples/s]Map:  75%|███████▍  | 82697/110379 [02:04<00:37, 742.99 examples/s]Map:  73%|███████▎  | 80143/110379 [02:04<00:51, 585.37 examples/s]Map:  72%|███████▏  | 79951/110379 [02:05<00:45, 671.36 examples/s]Map:  73%|███████▎  | 80799/110379 [02:05<00:39, 749.78 examples/s]Map:  75%|███████▍  | 82774/110379 [02:05<00:36, 746.80 examples/s]Map:  73%|███████▎  | 80222/110379 [02:04<00:47, 629.27 examples/s]Map:  75%|███████▌  | 82854/110379 [02:05<00:36, 758.35 examples/s]Map:  73%|███████▎  | 80302/110379 [02:05<00:45, 667.19 examples/s]Map:  73%|███████▎  | 80910/110379 [02:05<00:39, 744.21 examples/s]Map:  75%|███████▌  | 82935/110379 [02:05<00:35, 768.76 examples/s]Map:  73%|███████▎  | 80028/110379 [02:06<01:03, 478.53 examples/s]Map:  73%|███████▎  | 80411/110379 [02:05<00:43, 681.44 examples/s]Map:  73%|███████▎  | 80090/110379 [02:06<00:59, 504.85 examples/s]Map:  73%|███████▎  | 80493/110379 [02:05<00:42, 709.44 examples/s]Map:  73%|███████▎  | 81000/110379 [02:06<00:52, 562.64 examples/s]Map:  73%|███████▎  | 80156/110379 [02:06<00:56, 535.75 examples/s]Map:  75%|███████▌  | 83042/110379 [02:05<00:46, 586.16 examples/s]Map:  73%|███████▎  | 80608/110379 [02:05<00:40, 726.21 examples/s]Map:  73%|███████▎  | 80218/110379 [02:06<00:54, 552.63 examples/s]Map:  73%|███████▎  | 81093/110379 [02:06<00:50, 577.01 examples/s]Map:  75%|███████▌  | 83125/110379 [02:05<00:42, 638.30 examples/s]Map:  73%|███████▎  | 80689/110379 [02:05<00:39, 744.91 examples/s]Map:  73%|███████▎  | 80282/110379 [02:06<00:52, 573.30 examples/s]Map:  74%|███████▎  | 81171/110379 [02:06<00:47, 615.93 examples/s]Map:  75%|███████▌  | 83205/110379 [02:05<00:40, 672.04 examples/s]Map:  73%|███████▎  | 80768/110379 [02:05<00:39, 751.67 examples/s]Map:  73%|███████▎  | 80359/110379 [02:06<00:48, 624.18 examples/s]Map:  74%|███████▎  | 81252/110379 [02:06<00:44, 659.09 examples/s]Map:  75%|███████▌  | 83282/110379 [02:05<00:39, 692.14 examples/s]Map:  73%|███████▎  | 80850/110379 [02:05<00:38, 767.50 examples/s]Map:  73%|███████▎  | 80437/110379 [02:06<00:45, 662.62 examples/s]Map:  74%|███████▎  | 81327/110379 [02:06<00:42, 679.83 examples/s]Map:  76%|███████▌  | 83367/110379 [02:05<00:36, 732.12 examples/s]Map:  73%|███████▎  | 80521/110379 [02:06<00:42, 708.38 examples/s]Map:  73%|███████▎  | 80960/110379 [02:05<00:39, 752.74 examples/s]Map:  76%|███████▌  | 83447/110379 [02:06<00:35, 749.89 examples/s]Map:  74%|███████▍  | 81432/110379 [02:06<00:42, 685.70 examples/s]Map:  73%|███████▎  | 80598/110379 [02:06<00:41, 721.68 examples/s]Map:  76%|███████▌  | 83531/110379 [02:06<00:34, 772.53 examples/s]Map:  74%|███████▍  | 81509/110379 [02:06<00:41, 702.60 examples/s]Map:  73%|███████▎  | 80675/110379 [02:06<00:40, 733.40 examples/s]Map:  76%|███████▌  | 83624/110379 [02:06<00:37, 712.58 examples/s]Map:  73%|███████▎  | 80752/110379 [02:07<00:39, 742.96 examples/s]Map:  74%|███████▍  | 81614/110379 [02:07<00:41, 699.18 examples/s]Map:  73%|███████▎  | 81074/110379 [02:06<00:50, 575.32 examples/s]Map:  76%|███████▌  | 83707/110379 [02:06<00:36, 739.21 examples/s]Map:  73%|███████▎  | 80832/110379 [02:07<00:39, 755.07 examples/s]Map:  74%|███████▍  | 81694/110379 [02:07<00:39, 722.39 examples/s]Map:  74%|███████▎  | 81153/110379 [02:06<00:47, 615.13 examples/s]Map:  73%|███████▎  | 80910/110379 [02:07<00:38, 758.94 examples/s]Map:  74%|███████▎  | 81230/110379 [02:06<00:45, 647.11 examples/s]Map:  76%|███████▌  | 83821/110379 [02:06<00:35, 743.50 examples/s]Map:  74%|███████▍  | 81806/110379 [02:07<00:39, 726.87 examples/s]Map:  73%|███████▎  | 80992/110379 [02:07<00:38, 770.87 examples/s]Map:  74%|███████▎  | 81302/110379 [02:06<00:43, 663.06 examples/s]Map:  74%|███████▍  | 81884/110379 [02:07<00:38, 737.55 examples/s]Map:  76%|███████▌  | 83935/110379 [02:06<00:35, 745.69 examples/s]Map:  74%|███████▎  | 81384/110379 [02:06<00:41, 700.02 examples/s]Map:  74%|███████▍  | 81963/110379 [02:07<00:38, 738.66 examples/s]Map:  74%|███████▍  | 81462/110379 [02:06<00:40, 719.03 examples/s]Map:  73%|███████▎  | 81081/110379 [02:07<00:50, 579.39 examples/s]Map:  74%|███████▎  | 81160/110379 [02:07<00:46, 625.98 examples/s]Map:  74%|███████▍  | 81563/110379 [02:06<00:41, 695.70 examples/s]Map:  76%|███████▌  | 84028/110379 [02:06<00:49, 535.49 examples/s]Map:  74%|███████▎  | 81237/110379 [02:07<00:44, 654.47 examples/s]Map:  74%|███████▍  | 82074/110379 [02:07<00:52, 541.62 examples/s]Map:  74%|███████▍  | 81659/110379 [02:07<00:42, 672.29 examples/s]Map:  76%|███████▌  | 84116/110379 [02:07<00:48, 544.53 examples/s]Map:  74%|███████▎  | 81315/110379 [02:07<00:42, 684.42 examples/s]Map:  74%|███████▍  | 82148/110379 [02:07<00:48, 579.97 examples/s]Map:  76%|███████▋  | 84185/110379 [02:07<00:45, 570.14 examples/s]Map:  74%|███████▎  | 81396/110379 [02:07<00:40, 716.76 examples/s]Map:  74%|███████▍  | 82222/110379 [02:08<00:45, 612.83 examples/s]Map:  74%|███████▍  | 81755/110379 [02:07<00:43, 657.72 examples/s]Map:  76%|███████▋  | 84259/110379 [02:07<00:43, 604.33 examples/s]Map:  74%|███████▍  | 81832/110379 [02:07<00:41, 682.23 examples/s]Map:  74%|███████▍  | 81500/110379 [02:08<00:40, 705.69 examples/s]Map:  75%|███████▍  | 82316/110379 [02:08<00:45, 614.33 examples/s]Map:  76%|███████▋  | 84327/110379 [02:07<00:41, 620.38 examples/s]Map:  74%|███████▍  | 81911/110379 [02:07<00:40, 706.34 examples/s]Map:  74%|███████▍  | 81601/110379 [02:08<00:41, 691.83 examples/s]Map:  75%|███████▍  | 82411/110379 [02:08<00:45, 617.33 examples/s]Map:  74%|███████▍  | 81989/110379 [02:07<00:39, 724.74 examples/s]Map:  76%|███████▋  | 84419/110379 [02:07<00:42, 615.33 examples/s]Map:  74%|███████▍  | 81703/110379 [02:08<00:41, 683.20 examples/s]Map:  75%|███████▍  | 82506/110379 [02:08<00:44, 620.41 examples/s]Map:  77%|███████▋  | 84517/110379 [02:07<00:41, 625.35 examples/s]Map:  74%|███████▍  | 81779/110379 [02:08<00:40, 698.52 examples/s]Map:  77%|███████▋  | 84594/110379 [02:07<00:39, 658.33 examples/s]Map:  75%|███████▍  | 82603/110379 [02:08<00:44, 624.38 examples/s]Map:  74%|███████▍  | 82087/110379 [02:07<00:55, 507.14 examples/s]Map:  74%|███████▍  | 81878/110379 [02:08<00:41, 681.30 examples/s]Map:  75%|███████▍  | 82669/110379 [02:08<00:44, 629.23 examples/s]Map:  74%|███████▍  | 82162/110379 [02:07<00:50, 554.11 examples/s]Map:  77%|███████▋  | 84698/110379 [02:08<00:38, 665.89 examples/s]Map:  75%|███████▍  | 82734/110379 [02:08<00:43, 630.68 examples/s]Map:  75%|███████▍  | 82236/110379 [02:08<00:47, 591.12 examples/s]Map:  77%|███████▋  | 84776/110379 [02:08<00:37, 689.52 examples/s]Map:  74%|███████▍  | 81980/110379 [02:08<00:41, 678.31 examples/s]Map:  75%|███████▌  | 82811/110379 [02:08<00:41, 663.48 examples/s]Map:  75%|███████▍  | 82314/110379 [02:08<00:44, 629.32 examples/s]Map:  77%|███████▋  | 84852/110379 [02:08<00:36, 706.32 examples/s]Map:  75%|███████▌  | 82880/110379 [02:09<00:41, 667.23 examples/s]Map:  75%|███████▍  | 82392/110379 [02:08<00:42, 663.62 examples/s]Map:  77%|███████▋  | 84933/110379 [02:08<00:34, 731.59 examples/s]Map:  74%|███████▍  | 82071/110379 [02:09<00:52, 540.06 examples/s]Map:  75%|███████▌  | 82953/110379 [02:09<00:40, 682.56 examples/s]Map:  75%|███████▍  | 82496/110379 [02:08<00:41, 671.09 examples/s]Map:  74%|███████▍  | 82151/110379 [02:09<00:47, 591.01 examples/s]Map:  75%|███████▍  | 82571/110379 [02:08<00:40, 687.83 examples/s]Map:  74%|███████▍  | 82223/110379 [02:09<00:45, 617.65 examples/s]Map:  77%|███████▋  | 85040/110379 [02:08<00:44, 565.18 examples/s]Map:  75%|███████▌  | 83036/110379 [02:09<00:53, 513.31 examples/s]Map:  75%|███████▍  | 82652/110379 [02:08<00:38, 715.66 examples/s]Map:  75%|███████▍  | 82298/110379 [02:09<00:43, 645.12 examples/s]Map:  77%|███████▋  | 85119/110379 [02:08<00:41, 610.48 examples/s]Map:  75%|███████▌  | 83104/110379 [02:09<00:49, 548.84 examples/s]Map:  75%|███████▍  | 82726/110379 [02:08<00:38, 721.98 examples/s]Map:  75%|███████▍  | 82369/110379 [02:09<00:42, 660.97 examples/s]Map:  77%|███████▋  | 85201/110379 [02:08<00:38, 658.10 examples/s]Map:  75%|███████▌  | 83177/110379 [02:09<00:46, 588.83 examples/s]Map:  75%|███████▌  | 82803/110379 [02:08<00:37, 733.77 examples/s]Map:  75%|███████▍  | 82442/110379 [02:09<00:41, 677.21 examples/s]Map:  77%|███████▋  | 85278/110379 [02:08<00:36, 683.52 examples/s]Map:  75%|███████▌  | 83250/110379 [02:09<00:43, 622.42 examples/s]Map:  75%|███████▌  | 82878/110379 [02:08<00:37, 733.89 examples/s]Map:  75%|███████▍  | 82514/110379 [02:09<00:40, 686.90 examples/s]Map:  77%|███████▋  | 85352/110379 [02:08<00:35, 696.84 examples/s]Map:  75%|███████▌  | 83336/110379 [02:09<00:44, 603.23 examples/s]Map:  75%|███████▌  | 82984/110379 [02:09<00:38, 718.06 examples/s]Map:  75%|███████▍  | 82616/110379 [02:09<00:40, 683.08 examples/s]Map:  77%|███████▋  | 85461/110379 [02:09<00:35, 702.41 examples/s]Map:  75%|███████▍  | 82696/110379 [02:09<00:39, 708.80 examples/s]Map:  76%|███████▌  | 83420/110379 [02:09<00:45, 586.94 examples/s]Map:  78%|███████▊  | 85577/110379 [02:09<00:34, 723.27 examples/s]Map:  75%|███████▍  | 82771/110379 [02:10<00:38, 718.16 examples/s]Map:  78%|███████▊  | 85652/110379 [02:09<00:34, 726.52 examples/s]Map:  76%|███████▌  | 83503/110379 [02:10<00:46, 572.59 examples/s]Map:  75%|███████▌  | 83088/110379 [02:09<00:52, 521.03 examples/s]Map:  75%|███████▌  | 82844/110379 [02:10<00:38, 712.56 examples/s]Map:  75%|███████▌  | 83162/110379 [02:09<00:48, 561.74 examples/s]Map:  75%|███████▌  | 82922/110379 [02:10<00:37, 726.86 examples/s]Map:  78%|███████▊  | 85750/110379 [02:09<00:35, 697.50 examples/s]Map:  76%|███████▌  | 83580/110379 [02:10<00:48, 548.50 examples/s]Map:  75%|███████▌  | 83242/110379 [02:09<00:44, 610.08 examples/s]Map:  78%|███████▊  | 85828/110379 [02:09<00:34, 714.98 examples/s]Map:  76%|███████▌  | 83658/110379 [02:10<00:44, 597.94 examples/s]Map:  75%|███████▌  | 83317/110379 [02:09<00:42, 642.65 examples/s]Map:  75%|███████▌  | 83000/110379 [02:10<00:50, 546.20 examples/s]Map:  76%|███████▌  | 83729/110379 [02:10<00:42, 624.17 examples/s]Map:  78%|███████▊  | 85913/110379 [02:09<00:37, 658.48 examples/s]Map:  75%|███████▌  | 83079/110379 [02:10<00:45, 600.13 examples/s]Map:  76%|███████▌  | 83406/110379 [02:09<00:43, 621.96 examples/s]Map:  76%|███████▌  | 83812/110379 [02:10<00:44, 596.50 examples/s]Map:  75%|███████▌  | 83153/110379 [02:10<00:43, 632.46 examples/s]Map:  76%|███████▌  | 83883/110379 [02:10<00:42, 621.91 examples/s]Map:  76%|███████▌  | 83495/110379 [02:09<00:44, 609.23 examples/s]Map:  75%|███████▌  | 83233/110379 [02:10<00:40, 672.78 examples/s]Map:  78%|███████▊  | 86000/110379 [02:10<00:51, 471.81 examples/s]Map:  76%|███████▌  | 83955/110379 [02:10<00:40, 645.19 examples/s]Map:  76%|███████▌  | 83595/110379 [02:10<00:43, 622.30 examples/s]Map:  78%|███████▊  | 86081/110379 [02:10<00:45, 533.33 examples/s]Map:  75%|███████▌  | 83329/110379 [02:10<00:41, 659.49 examples/s]Map:  78%|███████▊  | 86162/110379 [02:10<00:41, 589.35 examples/s]Map:  76%|███████▌  | 83683/110379 [02:10<00:43, 608.18 examples/s]Map:  76%|███████▌  | 83424/110379 [02:11<00:41, 642.84 examples/s]Map:  76%|███████▌  | 84037/110379 [02:11<00:53, 488.54 examples/s]Map:  78%|███████▊  | 86254/110379 [02:10<00:40, 594.56 examples/s]Map:  76%|███████▌  | 84111/110379 [02:11<00:48, 540.79 examples/s]Map:  76%|███████▌  | 83501/110379 [02:11<00:40, 670.06 examples/s]Map:  76%|███████▌  | 83782/110379 [02:10<00:42, 620.70 examples/s]Map:  76%|███████▋  | 84173/110379 [02:11<00:46, 558.15 examples/s]Map:  76%|███████▌  | 83853/110379 [02:10<00:41, 638.81 examples/s]Map:  78%|███████▊  | 86337/110379 [02:10<00:41, 578.27 examples/s]Map:  76%|███████▌  | 83596/110379 [02:11<00:40, 653.85 examples/s]Map:  76%|███████▋  | 84239/110379 [02:11<00:44, 582.67 examples/s]Map:  76%|███████▌  | 83664/110379 [02:11<00:40, 657.76 examples/s]Map:  76%|███████▌  | 83952/110379 [02:10<00:41, 643.93 examples/s]Map:  78%|███████▊  | 86417/110379 [02:10<00:42, 560.46 examples/s]Map:  76%|███████▋  | 84328/110379 [02:11<00:44, 581.41 examples/s]Map:  76%|███████▌  | 83736/110379 [02:11<00:39, 671.71 examples/s]Map:  78%|███████▊  | 86479/110379 [02:10<00:41, 572.39 examples/s]Map:  76%|███████▌  | 83814/110379 [02:11<00:38, 697.24 examples/s]Map:  76%|███████▌  | 84041/110379 [02:10<00:48, 537.89 examples/s]Map:  76%|███████▋  | 84417/110379 [02:11<00:44, 579.43 examples/s]Map:  78%|███████▊  | 86568/110379 [02:11<00:41, 576.76 examples/s]Map:  76%|███████▌  | 83890/110379 [02:11<00:37, 712.52 examples/s]Map:  76%|███████▌  | 84120/110379 [02:10<00:44, 588.71 examples/s]Map:  77%|███████▋  | 84480/110379 [02:11<00:43, 589.70 examples/s]Map:  78%|███████▊  | 86633/110379 [02:11<00:40, 593.38 examples/s]Map:  76%|███████▌  | 83963/110379 [02:11<00:37, 711.09 examples/s]Map:  76%|███████▋  | 84196/110379 [02:11<00:41, 625.30 examples/s]Map:  77%|███████▋  | 84553/110379 [02:11<00:41, 623.16 examples/s]Map:  79%|███████▊  | 86724/110379 [02:11<00:39, 593.29 examples/s]Map:  76%|███████▋  | 84272/110379 [02:11<00:39, 656.23 examples/s]Map:  77%|███████▋  | 84624/110379 [02:12<00:40, 641.09 examples/s]Map:  76%|███████▌  | 84040/110379 [02:12<00:49, 528.44 examples/s]Map:  79%|███████▊  | 86787/110379 [02:11<00:39, 598.62 examples/s]Map:  76%|███████▋  | 84349/110379 [02:11<00:38, 683.13 examples/s]Map:  77%|███████▋  | 84691/110379 [02:12<00:39, 644.34 examples/s]Map:  76%|███████▌  | 84114/110379 [02:12<00:45, 574.88 examples/s]Map:  79%|███████▊  | 86850/110379 [02:11<00:39, 600.85 examples/s]Map:  76%|███████▋  | 84421/110379 [02:11<00:37, 685.08 examples/s]Map:  77%|███████▋  | 84784/110379 [02:12<00:40, 632.51 examples/s]Map:  76%|███████▋  | 84190/110379 [02:12<00:42, 618.12 examples/s]Map:  79%|███████▊  | 86916/110379 [02:11<00:38, 615.34 examples/s]Map:  77%|███████▋  | 84508/110379 [02:11<00:40, 644.54 examples/s]Map:  77%|███████▋  | 84852/110379 [02:12<00:39, 642.56 examples/s]Map:  76%|███████▋  | 84260/110379 [02:12<00:41, 636.11 examples/s]Map:  79%|███████▉  | 86996/110379 [02:11<00:35, 662.13 examples/s]Map:  77%|███████▋  | 84928/110379 [02:12<00:37, 672.31 examples/s]Map:  76%|███████▋  | 84338/110379 [02:12<00:38, 673.67 examples/s]Map:  77%|███████▋  | 84603/110379 [02:11<00:40, 635.57 examples/s]Map:  76%|███████▋  | 84416/110379 [02:12<00:37, 698.36 examples/s]Map:  77%|███████▋  | 84670/110379 [02:11<00:40, 640.00 examples/s]Map:  79%|███████▉  | 87076/110379 [02:11<00:45, 510.18 examples/s]Map:  77%|███████▋  | 85000/110379 [02:12<00:49, 511.17 examples/s]Map:  77%|███████▋  | 84497/110379 [02:12<00:35, 726.59 examples/s]Map:  77%|███████▋  | 84736/110379 [02:11<00:39, 643.51 examples/s]Map:  79%|███████▉  | 87154/110379 [02:12<00:40, 569.62 examples/s]Map:  77%|███████▋  | 85075/110379 [02:12<00:44, 564.70 examples/s]Map:  77%|███████▋  | 84806/110379 [02:11<00:39, 655.66 examples/s]Map:  79%|███████▉  | 87230/110379 [02:12<00:37, 613.31 examples/s]Map:  77%|███████▋  | 84606/110379 [02:12<00:35, 724.02 examples/s]Map:  77%|███████▋  | 85145/110379 [02:12<00:42, 595.40 examples/s]Map:  79%|███████▉  | 87309/110379 [02:12<00:35, 657.32 examples/s]Map:  77%|███████▋  | 84685/110379 [02:12<00:34, 738.84 examples/s]Map:  77%|███████▋  | 84901/110379 [02:12<00:39, 645.18 examples/s]Map:  77%|███████▋  | 85225/110379 [02:13<00:39, 644.77 examples/s]Map:  79%|███████▉  | 87382/110379 [02:12<00:34, 671.50 examples/s]Map:  77%|███████▋  | 85296/110379 [02:13<00:38, 657.09 examples/s]Map:  77%|███████▋  | 84792/110379 [02:13<00:35, 723.14 examples/s]Map:  77%|███████▋  | 84995/110379 [02:12<00:39, 634.93 examples/s]Map:  79%|███████▉  | 87455/110379 [02:12<00:33, 684.42 examples/s]Map:  77%|███████▋  | 85374/110379 [02:13<00:36, 687.95 examples/s]Map:  79%|███████▉  | 87526/110379 [02:12<00:33, 689.50 examples/s]Map:  77%|███████▋  | 84892/110379 [02:13<00:36, 700.07 examples/s]Map:  77%|███████▋  | 85449/110379 [02:13<00:35, 701.17 examples/s]Map:  79%|███████▉  | 87600/110379 [02:12<00:32, 700.16 examples/s]Map:  77%|███████▋  | 85071/110379 [02:12<00:50, 505.47 examples/s]Map:  77%|███████▋  | 84966/110379 [02:13<00:35, 707.89 examples/s]Map:  77%|███████▋  | 85526/110379 [02:13<00:34, 716.46 examples/s]Map:  79%|███████▉  | 87673/110379 [02:12<00:32, 707.86 examples/s]Map:  77%|███████▋  | 85147/110379 [02:12<00:45, 556.07 examples/s]Map:  78%|███████▊  | 85603/110379 [02:13<00:33, 729.41 examples/s]Map:  79%|███████▉  | 87747/110379 [02:12<00:31, 712.25 examples/s]Map:  77%|███████▋  | 85219/110379 [02:12<00:42, 591.58 examples/s]Map:  78%|███████▊  | 85681/110379 [02:13<00:33, 743.42 examples/s]Map:  77%|███████▋  | 85070/110379 [02:13<00:46, 546.94 examples/s]Map:  80%|███████▉  | 87824/110379 [02:12<00:31, 726.22 examples/s]Map:  77%|███████▋  | 85288/110379 [02:12<00:40, 614.43 examples/s]Map:  77%|███████▋  | 85148/110379 [02:13<00:42, 591.60 examples/s]Map:  77%|███████▋  | 85357/110379 [02:12<00:39, 632.61 examples/s]Map:  78%|███████▊  | 85779/110379 [02:13<00:34, 703.64 examples/s]Map:  80%|███████▉  | 87935/110379 [02:13<00:30, 726.45 examples/s]Map:  77%|███████▋  | 85225/110379 [02:13<00:39, 631.00 examples/s]Map:  77%|███████▋  | 85432/110379 [02:13<00:37, 663.15 examples/s]Map:  78%|███████▊  | 85884/110379 [02:13<00:35, 692.43 examples/s]Map:  77%|███████▋  | 85299/110379 [02:13<00:38, 653.26 examples/s]Map:  77%|███████▋  | 85504/110379 [02:13<00:36, 678.01 examples/s]Map:  78%|███████▊  | 85955/110379 [02:14<00:35, 695.08 examples/s]Map:  77%|███████▋  | 85378/110379 [02:14<00:36, 688.05 examples/s]Map:  78%|███████▊  | 85580/110379 [02:13<00:35, 696.42 examples/s]Map:  80%|███████▉  | 88036/110379 [02:13<00:40, 548.49 examples/s]Map:  77%|███████▋  | 85460/110379 [02:14<00:34, 721.44 examples/s]Map:  78%|███████▊  | 85659/110379 [02:13<00:34, 722.73 examples/s]Map:  80%|███████▉  | 88106/110379 [02:13<00:38, 578.38 examples/s]Map:  78%|███████▊  | 86028/110379 [02:14<00:48, 504.76 examples/s]Map:  80%|███████▉  | 88186/110379 [02:13<00:35, 627.42 examples/s]Map:  78%|███████▊  | 85573/110379 [02:14<00:34, 728.10 examples/s]Map:  78%|███████▊  | 85769/110379 [02:13<00:34, 722.16 examples/s]Map:  80%|███████▉  | 88261/110379 [02:13<00:33, 654.31 examples/s]Map:  78%|███████▊  | 85652/110379 [02:14<00:33, 739.21 examples/s]Map:  78%|███████▊  | 85844/110379 [02:13<00:33, 727.61 examples/s]Map:  78%|███████▊  | 86111/110379 [02:14<00:47, 515.15 examples/s]Map:  80%|████████  | 88336/110379 [02:13<00:32, 672.73 examples/s]Map:  78%|███████▊  | 86170/110379 [02:14<00:45, 528.90 examples/s]Map:  78%|███████▊  | 85750/110379 [02:14<00:34, 705.49 examples/s]Map:  78%|███████▊  | 85940/110379 [02:13<00:35, 691.94 examples/s]Map:  78%|███████▊  | 86230/110379 [02:14<00:44, 542.44 examples/s]Map:  80%|████████  | 88431/110379 [02:13<00:33, 656.57 examples/s]Map:  78%|███████▊  | 85854/110379 [02:14<00:35, 700.17 examples/s]Map:  78%|███████▊  | 86313/110379 [02:14<00:44, 544.19 examples/s]Map:  80%|████████  | 88537/110379 [02:14<00:32, 669.44 examples/s]Map:  78%|███████▊  | 86035/110379 [02:14<00:46, 526.89 examples/s]Map:  78%|███████▊  | 85963/110379 [02:14<00:34, 703.81 examples/s]Map:  78%|███████▊  | 86372/110379 [02:14<00:43, 552.34 examples/s]Map:  80%|████████  | 88621/110379 [02:14<00:30, 709.01 examples/s]Map:  78%|███████▊  | 86110/110379 [02:14<00:42, 570.68 examples/s]Map:  78%|███████▊  | 86446/110379 [02:15<00:40, 596.95 examples/s]Map:  80%|████████  | 88703/110379 [02:14<00:29, 735.76 examples/s]Map:  78%|███████▊  | 86190/110379 [02:14<00:39, 612.75 examples/s]Map:  78%|███████▊  | 86516/110379 [02:15<00:38, 622.82 examples/s]Map:  80%|████████  | 88786/110379 [02:14<00:28, 757.25 examples/s]Map:  78%|███████▊  | 86035/110379 [02:15<00:45, 529.34 examples/s]Map:  78%|███████▊  | 86265/110379 [02:14<00:37, 643.80 examples/s]Map:  78%|███████▊  | 86587/110379 [02:15<00:36, 644.97 examples/s]Map:  81%|████████  | 88866/110379 [02:14<00:28, 767.08 examples/s]Map:  78%|███████▊  | 86103/110379 [02:15<00:43, 558.12 examples/s]Map:  78%|███████▊  | 86335/110379 [02:14<00:36, 657.21 examples/s]Map:  79%|███████▊  | 86661/110379 [02:15<00:35, 671.34 examples/s]Map:  81%|████████  | 88946/110379 [02:14<00:27, 771.49 examples/s]Map:  78%|███████▊  | 86178/110379 [02:15<00:40, 599.49 examples/s]Map:  78%|███████▊  | 86409/110379 [02:14<00:35, 677.09 examples/s]Map:  79%|███████▊  | 86737/110379 [02:15<00:34, 693.01 examples/s]Map:  78%|███████▊  | 86257/110379 [02:15<00:37, 643.68 examples/s]Map:  78%|███████▊  | 86488/110379 [02:14<00:33, 704.85 examples/s]Map:  79%|███████▊  | 86816/110379 [02:15<00:32, 718.95 examples/s]Map:  78%|███████▊  | 86331/110379 [02:15<00:36, 663.20 examples/s]Map:  81%|████████  | 89040/110379 [02:14<00:36, 585.67 examples/s]Map:  78%|███████▊  | 86404/110379 [02:15<00:35, 680.35 examples/s]Map:  78%|███████▊  | 86601/110379 [02:14<00:33, 716.12 examples/s]Map:  81%|████████  | 89118/110379 [02:14<00:33, 627.14 examples/s]Map:  79%|███████▊  | 86919/110379 [02:15<00:33, 700.77 examples/s]Map:  78%|███████▊  | 86480/110379 [02:15<00:34, 698.43 examples/s]Map:  81%|████████  | 89196/110379 [02:15<00:32, 659.51 examples/s]Map:  79%|███████▊  | 86712/110379 [02:14<00:32, 717.44 examples/s]Map:  78%|███████▊  | 86556/110379 [02:15<00:33, 713.78 examples/s]Map:  81%|████████  | 89272/110379 [02:15<00:30, 681.59 examples/s]Map:  79%|███████▊  | 86788/110379 [02:15<00:32, 725.43 examples/s]Map:  79%|███████▉  | 87000/110379 [02:15<00:44, 527.58 examples/s]Map:  81%|████████  | 89351/110379 [02:15<00:29, 709.28 examples/s]Map:  78%|███████▊  | 86646/110379 [02:15<00:35, 666.01 examples/s]Map:  79%|███████▊  | 86866/110379 [02:15<00:31, 736.36 examples/s]Map:  79%|███████▉  | 87073/110379 [02:16<00:40, 569.31 examples/s]Map:  79%|███████▉  | 87138/110379 [02:16<00:39, 586.68 examples/s]Map:  81%|████████  | 89450/110379 [02:15<00:30, 687.18 examples/s]Map:  79%|███████▊  | 86738/110379 [02:16<00:36, 644.59 examples/s]Map:  79%|███████▉  | 86971/110379 [02:15<00:32, 713.00 examples/s]Map:  79%|███████▉  | 87207/110379 [02:16<00:37, 610.15 examples/s]Map:  81%|████████  | 89524/110379 [02:15<00:29, 698.56 examples/s]Map:  79%|███████▊  | 86811/110379 [02:16<00:35, 665.18 examples/s]Map:  79%|███████▉  | 87288/110379 [02:16<00:35, 659.06 examples/s]Map:  79%|███████▊  | 86888/110379 [02:16<00:33, 691.32 examples/s]Map:  81%|████████  | 89633/110379 [02:15<00:29, 706.14 examples/s]Map:  79%|███████▉  | 87071/110379 [02:15<00:41, 557.78 examples/s]Map:  79%|███████▉  | 87365/110379 [02:16<00:33, 687.16 examples/s]Map:  79%|███████▉  | 86964/110379 [02:16<00:33, 706.61 examples/s]Map:  81%|████████▏ | 89711/110379 [02:15<00:28, 721.56 examples/s]Map:  79%|███████▉  | 87151/110379 [02:15<00:38, 605.74 examples/s]Map:  79%|███████▉  | 87444/110379 [02:16<00:32, 714.54 examples/s]Map:  81%|████████▏ | 89793/110379 [02:15<00:27, 744.71 examples/s]Map:  79%|███████▉  | 87523/110379 [02:16<00:31, 734.89 examples/s]Map:  79%|███████▉  | 87036/110379 [02:16<00:43, 534.86 examples/s]Map:  79%|███████▉  | 87255/110379 [02:15<00:36, 629.65 examples/s]Map:  81%|████████▏ | 89877/110379 [02:15<00:26, 770.44 examples/s]Map:  79%|███████▉  | 87112/110379 [02:16<00:39, 583.54 examples/s]Map:  79%|███████▉  | 87333/110379 [02:15<00:34, 659.17 examples/s]Map:  79%|███████▉  | 87638/110379 [02:16<00:30, 742.75 examples/s]Map:  82%|████████▏ | 89992/110379 [02:16<00:26, 763.20 examples/s]Map:  79%|███████▉  | 87189/110379 [02:16<00:36, 626.87 examples/s]Map:  79%|███████▉  | 87406/110379 [02:16<00:34, 670.05 examples/s]Map:  79%|███████▉  | 87748/110379 [02:16<00:30, 736.80 examples/s]Map:  79%|███████▉  | 87262/110379 [02:16<00:35, 652.89 examples/s]Map:  79%|███████▉  | 87479/110379 [02:16<00:33, 677.38 examples/s]Map:  80%|███████▉  | 87825/110379 [02:17<00:30, 741.17 examples/s]Map:  79%|███████▉  | 87335/110379 [02:17<00:34, 669.66 examples/s]Map:  82%|████████▏ | 90081/110379 [02:16<00:34, 582.04 examples/s]Map:  79%|███████▉  | 87556/110379 [02:16<00:32, 698.83 examples/s]Map:  79%|███████▉  | 87413/110379 [02:17<00:32, 697.16 examples/s]Map:  82%|████████▏ | 90164/110379 [02:16<00:31, 633.99 examples/s]Map:  79%|███████▉  | 87637/110379 [02:16<00:31, 726.31 examples/s]Map:  80%|███████▉  | 87942/110379 [02:17<00:29, 748.61 examples/s]Map:  82%|████████▏ | 90245/110379 [02:16<00:29, 674.26 examples/s]Map:  79%|███████▉  | 87713/110379 [02:16<00:30, 731.85 examples/s]Map:  79%|███████▉  | 87506/110379 [02:17<00:34, 665.50 examples/s]Map:  82%|████████▏ | 90322/110379 [02:16<00:28, 692.45 examples/s]Map:  79%|███████▉  | 87579/110379 [02:17<00:33, 676.44 examples/s]Map:  80%|███████▉  | 88039/110379 [02:17<00:37, 588.44 examples/s]Map:  80%|███████▉  | 87817/110379 [02:16<00:31, 713.22 examples/s]Map:  79%|███████▉  | 87650/110379 [02:17<00:33, 683.13 examples/s]Map:  80%|███████▉  | 88106/110379 [02:17<00:36, 603.15 examples/s]Map:  82%|████████▏ | 90415/110379 [02:16<00:30, 664.07 examples/s]Map:  80%|███████▉  | 87916/110379 [02:16<00:32, 692.31 examples/s]Map:  79%|███████▉  | 87720/110379 [02:17<00:33, 682.56 examples/s]Map:  80%|███████▉  | 88173/110379 [02:17<00:36, 616.49 examples/s]Map:  82%|████████▏ | 90486/110379 [02:16<00:29, 671.01 examples/s]Map:  80%|███████▉  | 87987/110379 [02:16<00:32, 695.48 examples/s]Map:  80%|███████▉  | 88252/110379 [02:17<00:33, 657.46 examples/s]Map:  82%|████████▏ | 90565/110379 [02:16<00:28, 699.73 examples/s]Map:  80%|███████▉  | 87822/110379 [02:17<00:33, 674.91 examples/s]Map:  80%|████████  | 88329/110379 [02:17<00:32, 685.08 examples/s]Map:  82%|████████▏ | 90640/110379 [02:17<00:27, 708.86 examples/s]Map:  80%|███████▉  | 87899/110379 [02:17<00:32, 694.46 examples/s]Map:  80%|███████▉  | 88069/110379 [02:17<00:42, 523.50 examples/s]Map:  80%|████████  | 88408/110379 [02:17<00:31, 708.36 examples/s]Map:  82%|████████▏ | 90743/110379 [02:17<00:28, 694.42 examples/s]Map:  80%|████████  | 88488/110379 [02:18<00:29, 732.31 examples/s]Map:  80%|███████▉  | 88166/110379 [02:17<00:40, 554.93 examples/s]Map:  80%|████████  | 88565/110379 [02:18<00:29, 733.73 examples/s]Map:  82%|████████▏ | 90852/110379 [02:17<00:27, 700.23 examples/s]Map:  80%|███████▉  | 88000/110379 [02:18<00:42, 531.01 examples/s]Map:  80%|███████▉  | 88246/110379 [02:17<00:36, 604.95 examples/s]Map:  80%|████████  | 88641/110379 [02:18<00:29, 738.71 examples/s]Map:  82%|████████▏ | 90934/110379 [02:17<00:26, 726.18 examples/s]Map:  80%|███████▉  | 88074/110379 [02:18<00:38, 573.83 examples/s]Map:  80%|████████  | 88323/110379 [02:17<00:34, 639.73 examples/s]Map:  80%|████████  | 88717/110379 [02:18<00:29, 743.05 examples/s]Map:  80%|███████▉  | 88147/110379 [02:18<00:36, 608.53 examples/s]Map:  80%|████████  | 88395/110379 [02:17<00:33, 656.80 examples/s]Map:  80%|███████▉  | 88219/110379 [02:18<00:34, 635.36 examples/s]Map:  80%|████████  | 88476/110379 [02:17<00:31, 696.45 examples/s]Map:  80%|████████  | 88826/110379 [02:18<00:29, 732.06 examples/s]Map:  82%|████████▏ | 91040/110379 [02:17<00:33, 572.51 examples/s]Map:  80%|███████▉  | 88291/110379 [02:18<00:33, 655.23 examples/s]Map:  80%|████████  | 88550/110379 [02:17<00:30, 706.45 examples/s]Map:  83%|████████▎ | 91120/110379 [02:17<00:31, 617.53 examples/s]Map:  81%|████████  | 88934/110379 [02:18<00:29, 724.90 examples/s]Map:  80%|████████  | 88362/110379 [02:18<00:33, 667.16 examples/s]Map:  83%|████████▎ | 91199/110379 [02:17<00:29, 656.29 examples/s]Map:  80%|████████  | 88655/110379 [02:17<00:30, 701.93 examples/s]Map:  80%|████████  | 88438/110379 [02:18<00:31, 690.32 examples/s]Map:  83%|████████▎ | 91278/110379 [02:18<00:27, 685.80 examples/s]Map:  80%|████████  | 88732/110379 [02:17<00:30, 715.33 examples/s]Map:  80%|████████  | 88515/110379 [02:18<00:30, 710.65 examples/s]Map:  81%|████████  | 89038/110379 [02:18<00:37, 574.44 examples/s]Map:  83%|████████▎ | 91356/110379 [02:18<00:26, 708.40 examples/s]Map:  80%|████████  | 88810/110379 [02:18<00:29, 730.53 examples/s]Map:  81%|████████  | 89107/110379 [02:19<00:35, 595.78 examples/s]Map:  80%|████████  | 88614/110379 [02:19<00:31, 690.32 examples/s]Map:  83%|████████▎ | 91461/110379 [02:18<00:26, 701.52 examples/s]Map:  81%|████████  | 88916/110379 [02:18<00:29, 718.83 examples/s]Map:  81%|████████  | 89201/110379 [02:19<00:35, 601.73 examples/s]Map:  83%|████████▎ | 91541/110379 [02:18<00:25, 724.70 examples/s]Map:  80%|████████  | 88727/110379 [02:19<00:30, 707.23 examples/s]Map:  80%|████████  | 88802/110379 [02:19<00:30, 713.85 examples/s]Map:  81%|████████  | 89294/110379 [02:19<00:34, 604.34 examples/s]Map:  83%|████████▎ | 91653/110379 [02:18<00:25, 728.05 examples/s]Map:  81%|████████  | 89000/110379 [02:18<00:39, 548.15 examples/s]Map:  81%|████████  | 88884/110379 [02:19<00:29, 740.18 examples/s]Map:  81%|████████  | 89366/110379 [02:19<00:33, 628.29 examples/s]Map:  83%|████████▎ | 91732/110379 [02:18<00:25, 741.54 examples/s]Map:  81%|████████  | 89079/110379 [02:18<00:35, 598.29 examples/s]Map:  81%|████████  | 88960/110379 [02:19<00:28, 742.79 examples/s]Map:  81%|████████  | 89441/110379 [02:19<00:32, 654.19 examples/s]Map:  83%|████████▎ | 91814/110379 [02:18<00:24, 758.68 examples/s]Map:  81%|████████  | 89159/110379 [02:18<00:32, 643.88 examples/s]Map:  81%|████████  | 89517/110379 [02:19<00:30, 678.72 examples/s]Map:  81%|████████  | 89234/110379 [02:18<00:31, 668.64 examples/s]Map:  83%|████████▎ | 91923/110379 [02:18<00:24, 745.89 examples/s]Map:  81%|████████  | 89035/110379 [02:19<00:38, 547.94 examples/s]Map:  81%|████████  | 89597/110379 [02:19<00:29, 708.36 examples/s]Map:  81%|████████  | 89344/110379 [02:18<00:30, 688.17 examples/s]Map:  81%|████████  | 89105/110379 [02:19<00:36, 580.10 examples/s]Map:  81%|████████  | 89680/110379 [02:19<00:28, 738.05 examples/s]Map:  81%|████████  | 89420/110379 [02:19<00:29, 704.22 examples/s]Map:  83%|████████▎ | 92000/110379 [02:19<00:32, 566.26 examples/s]Map:  81%|████████  | 89196/110379 [02:19<00:36, 585.76 examples/s]Map:  81%|████████▏ | 89792/110379 [02:19<00:27, 736.66 examples/s]Map:  83%|████████▎ | 92078/110379 [02:19<00:30, 609.47 examples/s]Map:  81%|████████  | 89515/110379 [02:19<00:30, 678.60 examples/s]Map:  81%|████████▏ | 89868/110379 [02:20<00:27, 741.16 examples/s]Map:  83%|████████▎ | 92153/110379 [02:19<00:28, 637.90 examples/s]Map:  81%|████████  | 89284/110379 [02:20<00:36, 584.24 examples/s]Map:  81%|████████▏ | 89945/110379 [02:20<00:27, 745.20 examples/s]Map:  81%|████████  | 89606/110379 [02:19<00:31, 653.67 examples/s]Map:  84%|████████▎ | 92227/110379 [02:19<00:27, 660.92 examples/s]Map:  81%|████████  | 89349/110379 [02:20<00:35, 596.94 examples/s]Map:  84%|████████▎ | 92308/110379 [02:19<00:26, 689.91 examples/s]Map:  81%|████████▏ | 89689/110379 [02:19<00:33, 618.47 examples/s]Map:  81%|████████  | 89441/110379 [02:20<00:34, 599.48 examples/s]Map:  84%|████████▎ | 92386/110379 [02:19<00:25, 710.85 examples/s]Map:  82%|████████▏ | 90033/110379 [02:20<00:37, 546.96 examples/s]Map:  81%|████████  | 89505/110379 [02:20<00:34, 605.85 examples/s]Map:  81%|████████▏ | 89780/110379 [02:19<00:33, 612.39 examples/s]Map:  82%|████████▏ | 90100/110379 [02:20<00:35, 571.76 examples/s]Map:  81%|████████  | 89568/110379 [02:20<00:34, 608.79 examples/s]Map:  84%|████████▍ | 92489/110379 [02:19<00:25, 698.27 examples/s]Map:  81%|████████▏ | 89867/110379 [02:19<00:34, 598.29 examples/s]Map:  81%|████████  | 89636/110379 [02:20<00:33, 624.69 examples/s]Map:  84%|████████▍ | 92561/110379 [02:19<00:25, 702.60 examples/s]Map:  82%|████████▏ | 90193/110379 [02:20<00:34, 582.48 examples/s]Map:  81%|████████▏ | 89713/110379 [02:20<00:31, 664.01 examples/s]Map:  84%|████████▍ | 92635/110379 [02:20<00:24, 710.53 examples/s]Map:  81%|████████▏ | 89956/110379 [02:19<00:34, 594.76 examples/s]Map:  82%|████████▏ | 90283/110379 [02:20<00:34, 584.26 examples/s]Map:  84%|████████▍ | 92709/110379 [02:20<00:24, 717.45 examples/s]Map:  81%|████████▏ | 89790/110379 [02:20<00:29, 689.74 examples/s]Map:  84%|████████▍ | 92790/110379 [02:20<00:23, 741.66 examples/s]Map:  81%|████████▏ | 89864/110379 [02:20<00:29, 700.61 examples/s]Map:  82%|████████▏ | 90368/110379 [02:20<00:34, 576.39 examples/s]Map:  82%|████████▏ | 90035/110379 [02:20<00:42, 477.15 examples/s]Map:  84%|████████▍ | 92869/110379 [02:20<00:23, 750.36 examples/s]Map:  81%|████████▏ | 89938/110379 [02:21<00:28, 708.57 examples/s]Map:  82%|████████▏ | 90437/110379 [02:21<00:33, 597.81 examples/s]Map:  82%|████████▏ | 90103/110379 [02:20<00:39, 514.81 examples/s]Map:  82%|████████▏ | 90510/110379 [02:21<00:31, 622.73 examples/s]Map:  84%|████████▍ | 92961/110379 [02:20<00:25, 694.57 examples/s]Map:  82%|████████▏ | 90167/110379 [02:20<00:37, 539.47 examples/s]Map:  82%|████████▏ | 90583/110379 [02:21<00:30, 648.44 examples/s]Map:  82%|████████▏ | 90037/110379 [02:21<00:38, 530.35 examples/s]Map:  82%|████████▏ | 90658/110379 [02:21<00:29, 672.11 examples/s]Map:  82%|████████▏ | 90245/110379 [02:20<00:37, 530.18 examples/s]Map:  82%|████████▏ | 90112/110379 [02:21<00:35, 576.47 examples/s]Map:  84%|████████▍ | 93033/110379 [02:20<00:33, 516.20 examples/s]Map:  82%|████████▏ | 90730/110379 [02:21<00:28, 681.64 examples/s]Map:  82%|████████▏ | 90313/110379 [02:20<00:35, 561.35 examples/s]Map:  82%|████████▏ | 90193/110379 [02:21<00:32, 628.83 examples/s]Map:  84%|████████▍ | 93109/110379 [02:20<00:30, 566.70 examples/s]Map:  82%|████████▏ | 90803/110379 [02:21<00:28, 692.00 examples/s]Map:  82%|████████▏ | 90386/110379 [02:20<00:33, 601.11 examples/s]Map:  82%|████████▏ | 90272/110379 [02:21<00:30, 665.95 examples/s]Map:  84%|████████▍ | 93184/110379 [02:20<00:28, 608.78 examples/s]Map:  82%|████████▏ | 90878/110379 [02:21<00:27, 706.20 examples/s]Map:  82%|████████▏ | 90454/110379 [02:20<00:32, 619.94 examples/s]Map:  82%|████████▏ | 90350/110379 [02:21<00:28, 694.89 examples/s]Map:  84%|████████▍ | 93268/110379 [02:21<00:25, 663.82 examples/s]Map:  82%|████████▏ | 90951/110379 [02:21<00:27, 709.66 examples/s]Map:  82%|████████▏ | 90532/110379 [02:20<00:29, 662.17 examples/s]Map:  85%|████████▍ | 93352/110379 [02:21<00:24, 708.07 examples/s]Map:  82%|████████▏ | 90455/110379 [02:21<00:28, 692.08 examples/s]Map:  82%|████████▏ | 90626/110379 [02:21<00:30, 644.56 examples/s]Map:  85%|████████▍ | 93455/110379 [02:21<00:24, 696.20 examples/s]Map:  82%|████████▏ | 90560/110379 [02:22<00:28, 690.74 examples/s]Map:  82%|████████▏ | 91030/110379 [02:22<00:39, 495.50 examples/s]Map:  82%|████████▏ | 90723/110379 [02:21<00:30, 642.15 examples/s]Map:  85%|████████▍ | 93553/110379 [02:21<00:24, 674.97 examples/s]Map:  82%|████████▏ | 90662/110379 [02:22<00:28, 680.99 examples/s]Map:  83%|████████▎ | 91116/110379 [02:22<00:37, 515.74 examples/s]Map:  82%|████████▏ | 90797/110379 [02:21<00:29, 663.92 examples/s]Map:  82%|████████▏ | 90735/110379 [02:22<00:28, 686.00 examples/s]Map:  85%|████████▍ | 93646/110379 [02:21<00:25, 655.28 examples/s]Map:  83%|████████▎ | 91179/110379 [02:22<00:35, 538.65 examples/s]Map:  82%|████████▏ | 90874/110379 [02:21<00:28, 690.21 examples/s]Map:  82%|████████▏ | 90811/110379 [02:22<00:27, 701.06 examples/s]Map:  85%|████████▍ | 93741/110379 [02:21<00:25, 645.01 examples/s]Map:  82%|████████▏ | 90982/110379 [02:21<00:27, 698.82 examples/s]Map:  83%|████████▎ | 91263/110379 [02:22<00:35, 538.64 examples/s]Map:  82%|████████▏ | 90892/110379 [02:22<00:26, 726.03 examples/s]Map:  85%|████████▍ | 93812/110379 [02:21<00:25, 658.23 examples/s]Map:  83%|████████▎ | 91322/110379 [02:22<00:34, 546.97 examples/s]Map:  85%|████████▌ | 93891/110379 [02:21<00:23, 689.48 examples/s]Map:  83%|████████▎ | 91385/110379 [02:22<00:33, 562.40 examples/s]Map:  83%|████████▎ | 91069/110379 [02:21<00:35, 537.66 examples/s]Map:  85%|████████▌ | 93965/110379 [02:22<00:23, 700.66 examples/s]Map:  82%|████████▏ | 91000/110379 [02:22<00:34, 557.37 examples/s]Map:  83%|████████▎ | 91446/110379 [02:22<00:33, 573.00 examples/s]Map:  83%|████████▎ | 91142/110379 [02:21<00:33, 575.62 examples/s]Map:  83%|████████▎ | 91079/110379 [02:22<00:31, 604.88 examples/s]Map:  83%|████████▎ | 91534/110379 [02:22<00:32, 573.14 examples/s]Map:  83%|████████▎ | 91224/110379 [02:22<00:34, 559.30 examples/s]Map:  83%|████████▎ | 91150/110379 [02:22<00:30, 627.02 examples/s]Map:  83%|████████▎ | 91595/110379 [02:23<00:32, 580.95 examples/s]Map:  85%|████████▌ | 94068/110379 [02:22<00:31, 517.10 examples/s]Map:  83%|████████▎ | 91222/110379 [02:23<00:29, 648.39 examples/s]Map:  83%|████████▎ | 91307/110379 [02:22<00:34, 553.13 examples/s]Map:  83%|████████▎ | 91656/110379 [02:23<00:31, 585.14 examples/s]Map:  85%|████████▌ | 94129/110379 [02:22<00:30, 533.12 examples/s]Map:  83%|████████▎ | 91297/110379 [02:23<00:28, 673.20 examples/s]Map:  83%|████████▎ | 91379/110379 [02:22<00:32, 586.69 examples/s]Map:  83%|████████▎ | 91745/110379 [02:23<00:31, 585.02 examples/s]Map:  85%|████████▌ | 94231/110379 [02:22<00:28, 575.25 examples/s]Map:  83%|████████▎ | 91453/110379 [02:22<00:30, 620.55 examples/s]Map:  83%|████████▎ | 91400/110379 [02:23<00:28, 673.57 examples/s]Map:  83%|████████▎ | 91805/110379 [02:23<00:31, 583.24 examples/s]Map:  85%|████████▌ | 94312/110379 [02:22<00:25, 625.88 examples/s]Map:  83%|████████▎ | 91551/110379 [02:22<00:29, 628.57 examples/s]Map:  83%|████████▎ | 91494/110379 [02:23<00:28, 654.10 examples/s]Map:  83%|████████▎ | 91864/110379 [02:23<00:31, 581.26 examples/s]Map:  86%|████████▌ | 94386/110379 [02:22<00:24, 650.75 examples/s]Map:  83%|████████▎ | 91623/110379 [02:22<00:28, 649.94 examples/s]Map:  83%|████████▎ | 91924/110379 [02:23<00:31, 581.76 examples/s]Map:  83%|████████▎ | 91586/110379 [02:23<00:29, 638.94 examples/s]Map:  86%|████████▌ | 94483/110379 [02:22<00:24, 646.59 examples/s]Map:  83%|████████▎ | 91691/110379 [02:22<00:28, 651.97 examples/s]Map:  83%|████████▎ | 91986/110379 [02:23<00:31, 587.07 examples/s]Map:  83%|████████▎ | 91678/110379 [02:23<00:29, 626.73 examples/s]Map:  83%|████████▎ | 91768/110379 [02:22<00:27, 681.13 examples/s]Map:  86%|████████▌ | 94573/110379 [02:23<00:25, 629.50 examples/s]Map:  83%|████████▎ | 91838/110379 [02:23<00:27, 683.03 examples/s]Map:  86%|████████▌ | 94648/110379 [02:23<00:23, 656.30 examples/s]Map:  83%|████████▎ | 91764/110379 [02:23<00:30, 605.60 examples/s]Map:  83%|████████▎ | 92081/110379 [02:23<00:39, 461.72 examples/s]Map:  86%|████████▌ | 94722/110379 [02:23<00:23, 674.79 examples/s]Map:  83%|████████▎ | 91841/110379 [02:24<00:28, 640.40 examples/s]Map:  83%|████████▎ | 91922/110379 [02:23<00:29, 631.75 examples/s]Map:  83%|████████▎ | 92155/110379 [02:24<00:35, 519.52 examples/s]Map:  86%|████████▌ | 94805/110379 [02:23<00:21, 709.86 examples/s]Map:  83%|████████▎ | 91914/110379 [02:24<00:27, 660.63 examples/s]Map:  83%|████████▎ | 91997/110379 [02:23<00:27, 658.38 examples/s]Map:  84%|████████▎ | 92230/110379 [02:24<00:31, 571.64 examples/s]Map:  83%|████████▎ | 91989/110379 [02:24<00:27, 680.94 examples/s]Map:  84%|████████▎ | 92307/110379 [02:24<00:29, 618.36 examples/s]Map:  86%|████████▌ | 94904/110379 [02:23<00:22, 688.73 examples/s]Map:  84%|████████▎ | 92386/110379 [02:24<00:27, 660.66 examples/s]Map:  86%|████████▌ | 94999/110379 [02:23<00:23, 665.93 examples/s]Map:  83%|████████▎ | 92090/110379 [02:23<00:37, 482.06 examples/s]Map:  84%|████████▍ | 92461/110379 [02:24<00:26, 679.50 examples/s]Map:  83%|████████▎ | 92149/110379 [02:23<00:36, 502.20 examples/s]Map:  83%|████████▎ | 92087/110379 [02:24<00:37, 486.59 examples/s]Map:  84%|████████▍ | 92542/110379 [02:24<00:24, 714.13 examples/s]Map:  84%|████████▎ | 92214/110379 [02:23<00:33, 534.57 examples/s]Map:  83%|████████▎ | 92149/110379 [02:24<00:35, 509.63 examples/s]Map:  84%|████████▍ | 92621/110379 [02:24<00:24, 732.47 examples/s]Map:  84%|████████▎ | 92277/110379 [02:23<00:32, 555.40 examples/s]Map:  86%|████████▌ | 95096/110379 [02:24<00:31, 487.66 examples/s]Map:  84%|████████▎ | 92211/110379 [02:24<00:34, 532.51 examples/s]Map:  84%|████████▍ | 92701/110379 [02:24<00:23, 749.73 examples/s]Map:  86%|████████▌ | 95162/110379 [02:24<00:29, 518.45 examples/s]Map:  84%|████████▎ | 92279/110379 [02:24<00:31, 566.37 examples/s]Map:  84%|████████▍ | 92780/110379 [02:24<00:23, 758.32 examples/s]Map:  84%|████████▎ | 92380/110379 [02:24<00:30, 596.79 examples/s]Map:  86%|████████▋ | 95242/110379 [02:24<00:26, 575.49 examples/s]Map:  84%|████████▍ | 92458/110379 [02:24<00:27, 640.91 examples/s]Map:  84%|████████▎ | 92364/110379 [02:25<00:31, 565.05 examples/s]Map:  84%|████████▍ | 92892/110379 [02:25<00:23, 747.25 examples/s]Map:  86%|████████▋ | 95326/110379 [02:24<00:23, 633.46 examples/s]Map:  84%|████████▎ | 92431/110379 [02:25<00:30, 589.50 examples/s]Map:  84%|████████▍ | 92557/110379 [02:24<00:27, 644.55 examples/s]Map:  86%|████████▋ | 95402/110379 [02:24<00:22, 660.97 examples/s]Map:  84%|████████▍ | 92994/110379 [02:25<00:24, 721.00 examples/s]Map:  84%|████████▍ | 92501/110379 [02:25<00:29, 616.24 examples/s]Map:  84%|████████▍ | 92632/110379 [02:24<00:26, 666.69 examples/s]Map:  87%|████████▋ | 95509/110379 [02:24<00:22, 673.37 examples/s]Map:  84%|████████▍ | 92574/110379 [02:25<00:27, 645.57 examples/s]Map:  84%|████████▍ | 92706/110379 [02:24<00:25, 684.74 examples/s]Map:  87%|████████▋ | 95586/110379 [02:24<00:21, 690.21 examples/s]Map:  84%|████████▍ | 92648/110379 [02:25<00:26, 669.82 examples/s]Map:  84%|████████▍ | 93074/110379 [02:25<00:30, 559.11 examples/s]Map:  84%|████████▍ | 92783/110379 [02:24<00:24, 706.16 examples/s]Map:  87%|████████▋ | 95663/110379 [02:24<00:20, 707.49 examples/s]Map:  84%|████████▍ | 92726/110379 [02:25<00:25, 694.43 examples/s]Map:  84%|████████▍ | 93152/110379 [02:25<00:28, 603.17 examples/s]Map:  84%|████████▍ | 92864/110379 [02:24<00:23, 732.98 examples/s]Map:  87%|████████▋ | 95741/110379 [02:24<00:20, 724.69 examples/s]Map:  84%|████████▍ | 93227/110379 [02:25<00:26, 636.19 examples/s]Map:  84%|████████▍ | 92942/110379 [02:24<00:23, 745.40 examples/s]Map:  84%|████████▍ | 92827/110379 [02:25<00:25, 681.92 examples/s]Map:  87%|████████▋ | 95821/110379 [02:24<00:19, 743.68 examples/s]Map:  85%|████████▍ | 93305/110379 [02:25<00:25, 669.31 examples/s]Map:  84%|████████▍ | 92905/110379 [02:25<00:24, 705.78 examples/s]Map:  87%|████████▋ | 95903/110379 [02:25<00:18, 763.35 examples/s]Map:  85%|████████▍ | 93382/110379 [02:25<00:24, 693.78 examples/s]Map:  84%|████████▍ | 92979/110379 [02:25<00:24, 713.35 examples/s]Map:  84%|████████▍ | 93032/110379 [02:25<00:31, 557.63 examples/s]Map:  85%|████████▍ | 93460/110379 [02:25<00:23, 713.61 examples/s]Map:  84%|████████▍ | 93103/110379 [02:25<00:29, 590.34 examples/s]Map:  85%|████████▍ | 93541/110379 [02:26<00:22, 738.27 examples/s]Map:  87%|████████▋ | 96000/110379 [02:25<00:25, 569.34 examples/s]Map:  84%|████████▍ | 93178/110379 [02:25<00:27, 627.91 examples/s]Map:  85%|████████▍ | 93618/110379 [02:26<00:22, 745.16 examples/s]Map:  84%|████████▍ | 93064/110379 [02:26<00:35, 488.96 examples/s]Map:  87%|████████▋ | 96078/110379 [02:25<00:23, 614.43 examples/s]Map:  84%|████████▍ | 93257/110379 [02:25<00:25, 664.14 examples/s]Map:  85%|████████▍ | 93700/110379 [02:26<00:21, 764.46 examples/s]Map:  84%|████████▍ | 93124/110379 [02:26<00:33, 509.46 examples/s]Map:  87%|████████▋ | 96155/110379 [02:25<00:21, 648.38 examples/s]Map:  85%|████████▍ | 93340/110379 [02:25<00:24, 701.21 examples/s]Map:  85%|████████▍ | 93779/110379 [02:26<00:21, 769.34 examples/s]Map:  84%|████████▍ | 93189/110379 [02:26<00:31, 539.72 examples/s]Map:  87%|████████▋ | 96233/110379 [02:25<00:20, 678.29 examples/s]Map:  85%|████████▌ | 93858/110379 [02:26<00:21, 774.27 examples/s]Map:  85%|████████▍ | 93419/110379 [02:25<00:26, 631.87 examples/s]Map:  87%|████████▋ | 96308/110379 [02:25<00:20, 694.82 examples/s]Map:  85%|████████▍ | 93271/110379 [02:26<00:31, 540.38 examples/s]Map:  85%|████████▌ | 93938/110379 [02:26<00:21, 780.84 examples/s]Map:  87%|████████▋ | 96385/110379 [02:25<00:19, 711.37 examples/s]Map:  85%|████████▍ | 93502/110379 [02:25<00:27, 602.83 examples/s]Map:  85%|████████▍ | 93351/110379 [02:26<00:31, 535.36 examples/s]Map:  87%|████████▋ | 96488/110379 [02:26<00:19, 696.14 examples/s]Map:  85%|████████▍ | 93587/110379 [02:25<00:28, 587.81 examples/s]Map:  85%|████████▌ | 94042/110379 [02:26<00:28, 565.65 examples/s]Map:  85%|████████▍ | 93434/110379 [02:26<00:31, 537.53 examples/s]Map:  87%|████████▋ | 96565/110379 [02:26<00:19, 712.48 examples/s]Map:  85%|████████▌ | 94127/110379 [02:26<00:25, 626.73 examples/s]Map:  85%|████████▍ | 93672/110379 [02:26<00:29, 576.01 examples/s]Map:  85%|████████▍ | 93496/110379 [02:26<00:30, 554.57 examples/s]Map:  88%|████████▊ | 96645/110379 [02:26<00:18, 730.69 examples/s]Map:  85%|████████▌ | 94210/110379 [02:27<00:24, 672.81 examples/s]Map:  85%|████████▍ | 93734/110379 [02:26<00:28, 584.58 examples/s]Map:  85%|████████▍ | 93564/110379 [02:27<00:28, 583.46 examples/s]Map:  88%|████████▊ | 96724/110379 [02:26<00:18, 744.79 examples/s]Map:  85%|████████▌ | 94286/110379 [02:27<00:23, 691.83 examples/s]Map:  85%|████████▍ | 93810/110379 [02:26<00:26, 626.39 examples/s]Map:  85%|████████▍ | 93636/110379 [02:27<00:27, 614.63 examples/s]Map:  88%|████████▊ | 96803/110379 [02:26<00:17, 755.21 examples/s]Map:  85%|████████▌ | 93885/110379 [02:26<00:25, 657.04 examples/s]Map:  85%|████████▍ | 93711/110379 [02:27<00:25, 649.44 examples/s]Map:  86%|████████▌ | 94382/110379 [02:27<00:23, 672.39 examples/s]Map:  88%|████████▊ | 96907/110379 [02:26<00:18, 727.16 examples/s]Map:  86%|████████▌ | 94461/110379 [02:27<00:22, 699.75 examples/s]Map:  85%|████████▌ | 93970/110379 [02:26<00:26, 620.06 examples/s]Map:  85%|████████▍ | 93805/110379 [02:27<00:26, 636.25 examples/s]Map:  86%|████████▌ | 94540/110379 [02:27<00:21, 721.27 examples/s]Map:  85%|████████▌ | 93896/110379 [02:27<00:26, 621.45 examples/s]Map:  88%|████████▊ | 97000/110379 [02:26<00:25, 533.92 examples/s]Map:  86%|████████▌ | 94648/110379 [02:27<00:22, 714.89 examples/s]Map:  85%|████████▌ | 94036/110379 [02:26<00:35, 457.63 examples/s]Map:  85%|████████▌ | 93968/110379 [02:27<00:25, 643.25 examples/s]Map:  88%|████████▊ | 97072/110379 [02:26<00:23, 571.44 examples/s]Map:  86%|████████▌ | 94725/110379 [02:27<00:21, 725.48 examples/s]Map:  85%|████████▌ | 94113/110379 [02:26<00:31, 520.19 examples/s]Map:  88%|████████▊ | 97150/110379 [02:27<00:21, 615.31 examples/s]Map:  86%|████████▌ | 94809/110379 [02:27<00:20, 752.69 examples/s]Map:  85%|████████▌ | 94193/110379 [02:26<00:27, 582.06 examples/s]Map:  88%|████████▊ | 97250/110379 [02:27<00:20, 630.22 examples/s]Map:  85%|████████▌ | 94272/110379 [02:27<00:25, 630.88 examples/s]Map:  85%|████████▌ | 94069/110379 [02:27<00:33, 488.45 examples/s]Map:  86%|████████▌ | 94909/110379 [02:27<00:21, 721.05 examples/s]Map:  88%|████████▊ | 97320/110379 [02:27<00:20, 642.72 examples/s]Map:  85%|████████▌ | 94354/110379 [02:27<00:23, 676.38 examples/s]Map:  85%|████████▌ | 94139/110379 [02:28<00:30, 528.00 examples/s]Map:  86%|████████▌ | 94993/110379 [02:28<00:23, 662.42 examples/s]Map:  88%|████████▊ | 97428/110379 [02:27<00:19, 667.31 examples/s]Map:  86%|████████▌ | 94457/110379 [02:27<00:23, 676.90 examples/s]Map:  85%|████████▌ | 94228/110379 [02:28<00:29, 544.24 examples/s]Map:  88%|████████▊ | 97501/110379 [02:27<00:18, 678.22 examples/s]Map:  85%|████████▌ | 94288/110379 [02:28<00:29, 554.81 examples/s]Map:  86%|████████▌ | 94559/110379 [02:27<00:23, 674.23 examples/s]Map:  88%|████████▊ | 97573/110379 [02:27<00:18, 684.84 examples/s]Map:  85%|████████▌ | 94351/110379 [02:28<00:28, 571.84 examples/s]Map:  86%|████████▌ | 95091/110379 [02:28<00:30, 493.64 examples/s]Map:  86%|████████▌ | 94631/110379 [02:27<00:23, 680.12 examples/s]Map:  88%|████████▊ | 97654/110379 [02:27<00:17, 715.13 examples/s]Map:  86%|████████▌ | 95155/110379 [02:28<00:29, 519.36 examples/s]Map:  86%|████████▌ | 94704/110379 [02:27<00:22, 692.34 examples/s]Map:  86%|████████▌ | 94443/110379 [02:28<00:27, 584.19 examples/s]Map:  89%|████████▊ | 97739/110379 [02:27<00:16, 748.61 examples/s]Map:  86%|████████▌ | 94507/110379 [02:28<00:26, 596.72 examples/s]Map:  89%|████████▊ | 97821/110379 [02:27<00:16, 767.47 examples/s]Map:  86%|████████▋ | 95248/110379 [02:28<00:27, 546.36 examples/s]Map:  86%|████████▌ | 94810/110379 [02:27<00:22, 694.09 examples/s]Map:  86%|████████▌ | 94569/110379 [02:28<00:26, 600.56 examples/s]Map:  86%|████████▋ | 95308/110379 [02:28<00:27, 557.76 examples/s]Map:  86%|████████▌ | 94887/110379 [02:27<00:21, 709.50 examples/s]Map:  89%|████████▊ | 97942/110379 [02:28<00:16, 775.53 examples/s]Map:  86%|████████▌ | 94631/110379 [02:28<00:26, 601.91 examples/s]Map:  86%|████████▋ | 95372/110379 [02:28<00:26, 575.56 examples/s]Map:  86%|████████▌ | 94961/110379 [02:28<00:21, 715.29 examples/s]Map:  86%|████████▌ | 94695/110379 [02:28<00:25, 609.57 examples/s]Map:  86%|████████▋ | 95440/110379 [02:28<00:24, 597.62 examples/s]Map:  89%|████████▉ | 98038/110379 [02:28<00:20, 594.95 examples/s]Map:  86%|████████▌ | 94786/110379 [02:29<00:25, 606.06 examples/s]Map:  86%|████████▌ | 95035/110379 [02:28<00:28, 539.88 examples/s]Map:  87%|████████▋ | 95536/110379 [02:29<00:24, 606.56 examples/s]Map:  89%|████████▉ | 98124/110379 [02:28<00:18, 648.71 examples/s]Map:  86%|████████▌ | 94849/110379 [02:29<00:25, 605.61 examples/s]Map:  86%|████████▌ | 95114/110379 [02:28<00:25, 592.30 examples/s]Map:  89%|████████▉ | 98200/110379 [02:28<00:18, 672.68 examples/s]Map:  87%|████████▋ | 95621/110379 [02:29<00:25, 588.45 examples/s]Map:  86%|████████▌ | 94922/110379 [02:29<00:24, 637.12 examples/s]Map:  86%|████████▌ | 95189/110379 [02:28<00:24, 628.97 examples/s]Map:  87%|████████▋ | 95684/110379 [02:29<00:24, 592.98 examples/s]Map:  86%|████████▌ | 94995/110379 [02:29<00:23, 659.97 examples/s]Map:  86%|████████▋ | 95269/110379 [02:28<00:22, 672.15 examples/s]Map:  89%|████████▉ | 98292/110379 [02:28<00:18, 651.24 examples/s]Map:  87%|████████▋ | 95749/110379 [02:29<00:24, 601.69 examples/s]Map:  86%|████████▋ | 95342/110379 [02:28<00:21, 685.13 examples/s]Map:  89%|████████▉ | 98391/110379 [02:28<00:18, 650.24 examples/s]Map:  87%|████████▋ | 95823/110379 [02:29<00:22, 637.05 examples/s]Map:  86%|████████▋ | 95428/110379 [02:28<00:23, 639.84 examples/s]Map:  87%|████████▋ | 95903/110379 [02:29<00:21, 677.12 examples/s]Map:  86%|████████▌ | 95095/110379 [02:29<00:31, 480.39 examples/s]Map:  89%|████████▉ | 98493/110379 [02:29<00:18, 656.37 examples/s]Map:  86%|████████▌ | 95161/110379 [02:29<00:29, 516.50 examples/s]Map:  87%|████████▋ | 95526/110379 [02:28<00:23, 639.70 examples/s]Map:  89%|████████▉ | 98586/110379 [02:29<00:18, 643.99 examples/s]Map:  86%|████████▋ | 95232/110379 [02:29<00:27, 557.40 examples/s]Map:  87%|████████▋ | 95594/110379 [02:29<00:22, 648.13 examples/s]Map:  87%|████████▋ | 96000/110379 [02:30<00:29, 491.54 examples/s]Map:  86%|████████▋ | 95305/110379 [02:30<00:25, 596.23 examples/s]Map:  87%|████████▋ | 95671/110379 [02:29<00:21, 678.38 examples/s]Map:  89%|████████▉ | 98675/110379 [02:29<00:18, 624.44 examples/s]Map:  87%|████████▋ | 96066/110379 [02:30<00:27, 524.14 examples/s]Map:  86%|████████▋ | 95385/110379 [02:30<00:23, 646.39 examples/s]Map:  87%|████████▋ | 95746/110379 [02:29<00:21, 693.30 examples/s]Map:  89%|████████▉ | 98766/110379 [02:29<00:18, 613.83 examples/s]Map:  87%|████████▋ | 96133/110379 [02:30<00:25, 549.39 examples/s]Map:  86%|████████▋ | 95466/110379 [02:30<00:21, 687.55 examples/s]Map:  87%|████████▋ | 95821/110379 [02:29<00:20, 707.08 examples/s]Map:  90%|████████▉ | 98831/110379 [02:29<00:18, 618.88 examples/s]Map:  87%|████████▋ | 96200/110379 [02:30<00:24, 577.83 examples/s]Map:  87%|████████▋ | 95546/110379 [02:30<00:20, 716.85 examples/s]Map:  87%|████████▋ | 95894/110379 [02:29<00:20, 711.12 examples/s]Map:  90%|████████▉ | 98900/110379 [02:29<00:18, 633.52 examples/s]Map:  87%|████████▋ | 95626/110379 [02:30<00:20, 736.84 examples/s]Map:  87%|████████▋ | 95975/110379 [02:29<00:19, 735.24 examples/s]Map:  87%|████████▋ | 96291/110379 [02:30<00:24, 582.29 examples/s]Map:  90%|████████▉ | 98966/110379 [02:29<00:17, 636.75 examples/s]Map:  87%|████████▋ | 96357/110379 [02:30<00:23, 599.18 examples/s]Map:  87%|████████▋ | 95727/110379 [02:30<00:20, 707.42 examples/s]Map:  87%|████████▋ | 96430/110379 [02:30<00:22, 630.96 examples/s]Map:  87%|████████▋ | 95805/110379 [02:30<00:20, 722.90 examples/s]Map:  87%|████████▋ | 96079/110379 [02:29<00:25, 558.88 examples/s]Map:  90%|████████▉ | 99032/110379 [02:30<00:25, 452.60 examples/s]Map:  87%|████████▋ | 96511/110379 [02:30<00:20, 676.66 examples/s]Map:  87%|████████▋ | 95880/110379 [02:30<00:19, 729.76 examples/s]Map:  87%|████████▋ | 96158/110379 [02:29<00:23, 608.11 examples/s]Map:  90%|████████▉ | 99107/110379 [02:30<00:21, 513.87 examples/s]Map:  88%|████████▊ | 96593/110379 [02:30<00:19, 713.45 examples/s]Map:  87%|████████▋ | 96235/110379 [02:30<00:21, 644.53 examples/s]Map:  87%|████████▋ | 95988/110379 [02:30<00:19, 724.12 examples/s]Map:  90%|████████▉ | 99185/110379 [02:30<00:19, 571.40 examples/s]Map:  88%|████████▊ | 96668/110379 [02:30<00:19, 721.01 examples/s]Map:  87%|████████▋ | 96315/110379 [02:30<00:20, 679.97 examples/s]Map:  88%|████████▊ | 96748/110379 [02:31<00:18, 742.29 examples/s]Map:  90%|████████▉ | 99267/110379 [02:30<00:17, 629.11 examples/s]Map:  87%|████████▋ | 96396/110379 [02:30<00:20, 690.48 examples/s]Map:  88%|████████▊ | 96826/110379 [02:31<00:18, 744.53 examples/s]Map:  87%|████████▋ | 96073/110379 [02:31<00:25, 553.14 examples/s]Map:  90%|█████████ | 99348/110379 [02:30<00:16, 669.81 examples/s]Map:  87%|████████▋ | 96473/110379 [02:30<00:19, 708.55 examples/s]Map:  87%|████████▋ | 96146/110379 [02:31<00:24, 589.23 examples/s]Map:  90%|█████████ | 99433/110379 [02:30<00:15, 712.77 examples/s]Map:  88%|████████▊ | 96931/110379 [02:31<00:18, 725.79 examples/s]Map:  87%|████████▋ | 96573/110379 [02:30<00:19, 692.04 examples/s]Map:  87%|████████▋ | 96215/110379 [02:31<00:23, 610.49 examples/s]Map:  90%|█████████ | 99534/110379 [02:30<00:15, 695.43 examples/s]Map:  88%|████████▊ | 96647/110379 [02:30<00:19, 701.66 examples/s]Map:  87%|████████▋ | 96289/110379 [02:31<00:21, 640.89 examples/s]Map:  88%|████████▊ | 96726/110379 [02:30<00:18, 722.02 examples/s]Map:  87%|████████▋ | 96366/110379 [02:31<00:20, 670.51 examples/s]Map:  90%|█████████ | 99625/110379 [02:30<00:16, 655.29 examples/s]Map:  88%|████████▊ | 97037/110379 [02:31<00:24, 549.44 examples/s]Map:  88%|████████▊ | 96800/110379 [02:30<00:18, 723.98 examples/s]Map:  87%|████████▋ | 96447/110379 [02:31<00:19, 702.06 examples/s]Map:  90%|█████████ | 99697/110379 [02:30<00:15, 668.66 examples/s]Map:  88%|████████▊ | 97117/110379 [02:31<00:22, 599.18 examples/s]Map:  87%|████████▋ | 96528/110379 [02:31<00:18, 729.21 examples/s]Map:  90%|█████████ | 99775/110379 [02:31<00:15, 695.05 examples/s]Map:  88%|████████▊ | 97188/110379 [02:31<00:21, 622.86 examples/s]Map:  88%|████████▊ | 96915/110379 [02:30<00:18, 737.97 examples/s]Map:  88%|████████▊ | 96604/110379 [02:31<00:18, 734.34 examples/s]Map:  90%|█████████ | 99861/110379 [02:31<00:14, 737.13 examples/s]Map:  88%|████████▊ | 97261/110379 [02:31<00:20, 647.62 examples/s]Map:  88%|████████▊ | 96682/110379 [02:31<00:18, 744.13 examples/s]Map:  91%|█████████ | 99940/110379 [02:31<00:13, 750.11 examples/s]Map:  88%|████████▊ | 97339/110379 [02:32<00:19, 678.93 examples/s]Map:  88%|████████▊ | 97000/110379 [02:31<00:23, 564.76 examples/s]Map:  88%|████████▊ | 97418/110379 [02:32<00:18, 705.42 examples/s]Map:  88%|████████▊ | 96800/110379 [02:32<00:17, 756.67 examples/s]Map:  88%|████████▊ | 97076/110379 [02:31<00:21, 605.66 examples/s]Map:  88%|████████▊ | 97497/110379 [02:32<00:17, 727.14 examples/s]Map:  91%|█████████ | 100038/110379 [02:31<00:18, 565.17 examples/s]Map:  88%|████████▊ | 97156/110379 [02:31<00:20, 648.29 examples/s]Map:  88%|████████▊ | 96911/110379 [02:32<00:17, 748.98 examples/s]Map:  91%|█████████ | 100120/110379 [02:31<00:16, 618.58 examples/s]Map:  88%|████████▊ | 97609/110379 [02:32<00:17, 728.39 examples/s]Map:  88%|████████▊ | 97232/110379 [02:31<00:19, 674.11 examples/s]Map:  88%|████████▊ | 96990/110379 [02:32<00:17, 755.74 examples/s]Map:  91%|█████████ | 100204/110379 [02:31<00:15, 668.55 examples/s]Map:  89%|████████▊ | 97686/110379 [02:32<00:17, 736.91 examples/s]Map:  88%|████████▊ | 97309/110379 [02:31<00:18, 694.90 examples/s]Map:  91%|█████████ | 100290/110379 [02:31<00:14, 716.12 examples/s]Map:  88%|████████▊ | 97383/110379 [02:31<00:18, 701.87 examples/s]Map:  89%|████████▊ | 97799/110379 [02:32<00:17, 739.02 examples/s]Map:  88%|████████▊ | 97075/110379 [02:32<00:23, 574.46 examples/s]Map:  91%|█████████ | 100374/110379 [02:31<00:13, 743.98 examples/s]Map:  88%|████████▊ | 97463/110379 [02:31<00:17, 726.31 examples/s]Map:  89%|████████▊ | 97878/110379 [02:32<00:16, 743.02 examples/s]Map:  88%|████████▊ | 97148/110379 [02:32<00:21, 606.95 examples/s]Map:  91%|█████████ | 100485/110379 [02:32<00:13, 732.04 examples/s]Map:  88%|████████▊ | 97556/110379 [02:31<00:18, 684.35 examples/s]Map:  88%|████████▊ | 97215/110379 [02:32<00:21, 620.11 examples/s]Map:  89%|████████▉ | 97987/110379 [02:32<00:16, 734.80 examples/s]Map:  91%|█████████ | 100568/110379 [02:32<00:12, 755.87 examples/s]Map:  88%|████████▊ | 97631/110379 [02:32<00:18, 699.72 examples/s]Map:  88%|████████▊ | 97291/110379 [02:32<00:20, 652.70 examples/s]Map:  89%|████████▊ | 97707/110379 [02:32<00:17, 712.77 examples/s]Map:  88%|████████▊ | 97373/110379 [02:33<00:18, 696.10 examples/s]Map:  91%|█████████ | 100682/110379 [02:32<00:12, 754.83 examples/s]Map:  89%|████████▉ | 98074/110379 [02:33<00:21, 573.80 examples/s]Map:  89%|████████▊ | 97781/110379 [02:32<00:17, 715.98 examples/s]Map:  88%|████████▊ | 97448/110379 [02:33<00:18, 708.65 examples/s]Map:  91%|█████████▏| 100765/110379 [02:32<00:12, 773.18 examples/s]Map:  89%|████████▉ | 98147/110379 [02:33<00:20, 605.72 examples/s]Map:  89%|████████▊ | 97861/110379 [02:32<00:16, 737.85 examples/s]Map:  88%|████████▊ | 97549/110379 [02:33<00:18, 691.71 examples/s]Map:  91%|█████████▏| 100853/110379 [02:32<00:13, 703.89 examples/s]Map:  89%|████████▉ | 98217/110379 [02:33<00:19, 624.45 examples/s]Map:  89%|████████▉ | 97966/110379 [02:32<00:17, 721.33 examples/s]Map:  88%|████████▊ | 97622/110379 [02:33<00:18, 699.01 examples/s]Map:  89%|████████▉ | 98293/110379 [02:33<00:18, 655.77 examples/s]Map:  91%|█████████▏| 100936/110379 [02:32<00:14, 649.48 examples/s]Map:  89%|████████▊ | 97702/110379 [02:33<00:17, 720.93 examples/s]Map:  89%|████████▉ | 98365/110379 [02:33<00:17, 671.20 examples/s]Map:  89%|████████▊ | 97783/110379 [02:33<00:16, 742.62 examples/s]Map:  89%|████████▉ | 98446/110379 [02:33<00:16, 705.22 examples/s]Map:  89%|████████▉ | 98075/110379 [02:32<00:22, 558.93 examples/s]Map:  89%|████████▊ | 97859/110379 [02:33<00:16, 745.71 examples/s]Map:  89%|████████▉ | 98524/110379 [02:33<00:16, 723.31 examples/s]Map:  89%|████████▉ | 98157/110379 [02:32<00:20, 609.52 examples/s]Map:  92%|█████████▏| 101028/110379 [02:33<00:19, 479.11 examples/s]Map:  89%|████████▉ | 98600/110379 [02:33<00:16, 731.22 examples/s]Map:  89%|████████▉ | 97967/110379 [02:33<00:16, 733.76 examples/s]Map:  89%|████████▉ | 98234/110379 [02:33<00:18, 643.48 examples/s]Map:  92%|█████████▏| 101086/110379 [02:33<00:18, 497.16 examples/s]Map:  89%|████████▉ | 98675/110379 [02:33<00:15, 733.75 examples/s]Map:  89%|████████▉ | 98309/110379 [02:33<00:18, 666.89 examples/s]Map:  92%|█████████▏| 101163/110379 [02:33<00:16, 552.66 examples/s]Map:  89%|████████▉ | 98385/110379 [02:33<00:17, 688.13 examples/s]Map:  89%|████████▉ | 98784/110379 [02:34<00:15, 725.57 examples/s]Map:  92%|█████████▏| 101239/110379 [02:33<00:15, 598.93 examples/s]Map:  89%|████████▉ | 98062/110379 [02:34<00:22, 549.85 examples/s]Map:  92%|█████████▏| 101310/110379 [02:33<00:14, 621.58 examples/s]Map:  89%|████████▉ | 98490/110379 [02:33<00:17, 688.69 examples/s]Map:  90%|████████▉ | 98894/110379 [02:34<00:15, 724.75 examples/s]Map:  89%|████████▉ | 98160/110379 [02:34<00:21, 576.69 examples/s]Map:  92%|█████████▏| 101389/110379 [02:33<00:13, 662.67 examples/s]Map:  89%|████████▉ | 98566/110379 [02:33<00:16, 705.15 examples/s]Map:  90%|████████▉ | 98969/110379 [02:34<00:15, 728.85 examples/s]Map:  89%|████████▉ | 98227/110379 [02:34<00:20, 594.67 examples/s]Map:  92%|█████████▏| 101469/110379 [02:33<00:12, 695.23 examples/s]Map:  89%|████████▉ | 98671/110379 [02:33<00:16, 701.39 examples/s]Map:  92%|█████████▏| 101545/110379 [02:33<00:12, 708.50 examples/s]Map:  89%|████████▉ | 98316/110379 [02:34<00:20, 592.78 examples/s]Map:  89%|████████▉ | 98746/110379 [02:33<00:16, 710.72 examples/s]Map:  92%|█████████▏| 101625/110379 [02:33<00:11, 733.16 examples/s]Map:  90%|████████▉ | 99074/110379 [02:34<00:19, 569.94 examples/s]Map:  89%|████████▉ | 98379/110379 [02:34<00:20, 598.27 examples/s]Map:  90%|████████▉ | 99145/110379 [02:34<00:18, 598.79 examples/s]Map:  89%|████████▉ | 98443/110379 [02:34<00:19, 606.54 examples/s]Map:  90%|████████▉ | 98853/110379 [02:33<00:16, 709.63 examples/s]Map:  92%|█████████▏| 101737/110379 [02:34<00:11, 733.34 examples/s]Map:  90%|████████▉ | 99219/110379 [02:34<00:17, 629.25 examples/s]Map:  89%|████████▉ | 98506/110379 [02:34<00:19, 610.56 examples/s]Map:  92%|█████████▏| 101813/110379 [02:34<00:11, 737.87 examples/s]Map:  90%|████████▉ | 98958/110379 [02:34<00:16, 702.84 examples/s]Map:  89%|████████▉ | 98570/110379 [02:34<00:19, 610.14 examples/s]Map:  90%|████████▉ | 99301/110379 [02:34<00:18, 595.63 examples/s]Map:  92%|█████████▏| 101915/110379 [02:34<00:11, 713.43 examples/s]Map:  89%|████████▉ | 98638/110379 [02:35<00:18, 626.55 examples/s]Map:  90%|█████████ | 99377/110379 [02:35<00:19, 563.38 examples/s]Map:  90%|████████▉ | 99032/110379 [02:34<00:21, 536.31 examples/s]Map:  89%|████████▉ | 98732/110379 [02:35<00:18, 623.66 examples/s]Map:  90%|█████████ | 99437/110379 [02:35<00:19, 570.74 examples/s]Map:  90%|████████▉ | 99111/110379 [02:34<00:19, 586.70 examples/s]Map:  92%|█████████▏| 102000/110379 [02:34<00:16, 509.59 examples/s]Map:  90%|████████▉ | 99185/110379 [02:34<00:18, 619.89 examples/s]Map:  90%|████████▉ | 98824/110379 [02:35<00:18, 614.94 examples/s]Map:  90%|█████████ | 99520/110379 [02:35<00:19, 560.17 examples/s]Map:  92%|█████████▏| 102086/110379 [02:34<00:14, 576.89 examples/s]Map:  90%|████████▉ | 99260/110379 [02:34<00:17, 651.22 examples/s]Map:  90%|█████████ | 99584/110379 [02:35<00:18, 576.96 examples/s]Map:  90%|████████▉ | 98915/110379 [02:35<00:18, 609.14 examples/s]Map:  90%|████████▉ | 99331/110379 [02:34<00:16, 664.46 examples/s]Map:  93%|█████████▎| 102178/110379 [02:34<00:14, 584.23 examples/s]Map:  90%|█████████ | 99651/110379 [02:35<00:17, 597.80 examples/s]Map:  90%|████████▉ | 98978/110379 [02:35<00:18, 611.61 examples/s]Map:  93%|█████████▎| 102251/110379 [02:34<00:13, 614.31 examples/s]Map:  90%|█████████ | 99728/110379 [02:35<00:16, 638.91 examples/s]Map:  90%|█████████ | 99438/110379 [02:34<00:16, 678.00 examples/s]Map:  93%|█████████▎| 102330/110379 [02:35<00:12, 654.01 examples/s]Map:  90%|█████████ | 99806/110379 [02:35<00:15, 674.64 examples/s]Map:  90%|█████████ | 99513/110379 [02:34<00:15, 694.42 examples/s]Map:  93%|█████████▎| 102410/110379 [02:35<00:11, 688.80 examples/s]Map:  90%|█████████ | 99885/110379 [02:35<00:14, 703.39 examples/s]Map:  90%|█████████ | 99587/110379 [02:35<00:15, 702.71 examples/s]Map:  90%|████████▉ | 99063/110379 [02:35<00:24, 453.05 examples/s]Map:  91%|█████████ | 99963/110379 [02:35<00:14, 720.97 examples/s]Map:  90%|█████████ | 99659/110379 [02:35<00:15, 703.76 examples/s]Map:  90%|████████▉ | 99129/110379 [02:35<00:22, 492.25 examples/s]Map:  93%|█████████▎| 102521/110379 [02:35<00:11, 703.69 examples/s]Map:  90%|█████████ | 99738/110379 [02:35<00:14, 720.34 examples/s]Map:  90%|████████▉ | 99195/110379 [02:36<00:21, 525.80 examples/s]Map:  93%|█████████▎| 102606/110379 [02:35<00:10, 737.29 examples/s]Map:  90%|████████▉ | 99255/110379 [02:36<00:20, 542.14 examples/s]Map:  91%|█████████ | 100042/110379 [02:36<00:18, 546.63 examples/s]Map:  90%|█████████ | 99843/110379 [02:35<00:14, 710.48 examples/s]Map:  93%|█████████▎| 102720/110379 [02:35<00:10, 735.33 examples/s]Map:  90%|████████▉ | 99328/110379 [02:36<00:18, 587.12 examples/s]Map:  91%|█████████ | 100116/110379 [02:36<00:17, 590.49 examples/s]Map:  91%|█████████ | 99923/110379 [02:35<00:14, 728.61 examples/s]Map:  90%|█████████ | 99409/110379 [02:36<00:17, 642.28 examples/s]Map:  91%|█████████ | 100195/110379 [02:36<00:15, 638.83 examples/s]Map:  93%|█████████▎| 102827/110379 [02:35<00:10, 726.25 examples/s]Map:  91%|█████████ | 99997/110379 [02:35<00:14, 729.56 examples/s]Map:  90%|█████████ | 99489/110379 [02:36<00:16, 680.60 examples/s]Map:  91%|█████████ | 100273/110379 [02:36<00:15, 673.19 examples/s]Map:  93%|█████████▎| 102911/110379 [02:35<00:09, 748.36 examples/s]Map:  90%|█████████ | 99569/110379 [02:36<00:15, 712.62 examples/s]Map:  93%|█████████▎| 102998/110379 [02:35<00:09, 777.83 examples/s]Map:  91%|█████████ | 100380/110379 [02:36<00:14, 684.37 examples/s]Map:  91%|█████████ | 100099/110379 [02:35<00:19, 537.53 examples/s]Map:  90%|█████████ | 99679/110379 [02:36<00:14, 718.26 examples/s]Map:  91%|█████████ | 100456/110379 [02:36<00:14, 700.99 examples/s]Map:  91%|█████████ | 100192/110379 [02:36<00:18, 559.99 examples/s]Map:  93%|█████████▎| 103110/110379 [02:36<00:12, 587.67 examples/s]Map:  90%|█████████ | 99785/110379 [02:36<00:14, 709.52 examples/s]Map:  91%|█████████ | 100557/110379 [02:36<00:14, 685.68 examples/s]Map:  91%|█████████ | 100260/110379 [02:36<00:17, 583.01 examples/s]Map:  93%|█████████▎| 103187/110379 [02:36<00:11, 624.36 examples/s]Map:  91%|█████████ | 100630/110379 [02:37<00:14, 694.58 examples/s]Map:  91%|█████████ | 99895/110379 [02:37<00:14, 713.73 examples/s]Map:  91%|█████████ | 100341/110379 [02:36<00:15, 632.69 examples/s]Map:  94%|█████████▎| 103268/110379 [02:36<00:10, 663.50 examples/s]Map:  91%|█████████ | 100702/110379 [02:37<00:13, 698.40 examples/s]Map:  91%|█████████ | 99976/110379 [02:37<00:14, 735.31 examples/s]Map:  91%|█████████ | 100419/110379 [02:36<00:14, 665.05 examples/s]Map:  94%|█████████▎| 103349/110379 [02:36<00:10, 696.03 examples/s]Map:  91%|█████████▏| 100778/110379 [02:37<00:13, 712.59 examples/s]Map:  91%|█████████ | 100502/110379 [02:36<00:14, 703.02 examples/s]Map:  94%|█████████▎| 103427/110379 [02:36<00:09, 715.94 examples/s]Map:  91%|█████████▏| 100860/110379 [02:37<00:12, 738.64 examples/s]Map:  91%|█████████ | 100069/110379 [02:37<00:18, 569.09 examples/s]Map:  91%|█████████ | 100589/110379 [02:36<00:14, 656.07 examples/s]Map:  94%|█████████▍| 103526/110379 [02:36<00:09, 692.92 examples/s]Map:  91%|█████████▏| 100940/110379 [02:37<00:14, 655.67 examples/s]Map:  91%|█████████ | 100138/110379 [02:37<00:17, 589.94 examples/s]Map:  91%|█████████ | 100688/110379 [02:36<00:14, 652.31 examples/s]Map:  94%|█████████▍| 103615/110379 [02:36<00:10, 649.13 examples/s]Map:  91%|█████████ | 100230/110379 [02:37<00:17, 593.60 examples/s]Map:  91%|█████████▏| 100794/110379 [02:36<00:14, 664.46 examples/s]Map:  94%|█████████▍| 103713/110379 [02:37<00:10, 646.72 examples/s]Map:  92%|█████████▏| 101029/110379 [02:37<00:21, 441.21 examples/s]Map:  91%|█████████ | 100325/110379 [02:37<00:16, 602.46 examples/s]Map:  91%|█████████▏| 100862/110379 [02:37<00:14, 666.12 examples/s]Map:  94%|█████████▍| 103802/110379 [02:37<00:10, 626.75 examples/s]Map:  92%|█████████▏| 101086/110379 [02:37<00:20, 462.28 examples/s]Map:  91%|█████████ | 100394/110379 [02:37<00:16, 619.28 examples/s]Map:  91%|█████████▏| 100938/110379 [02:37<00:13, 686.67 examples/s]Map:  94%|█████████▍| 103871/110379 [02:37<00:10, 638.12 examples/s]Map:  92%|█████████▏| 101161/110379 [02:38<00:17, 519.86 examples/s]Map:  91%|█████████ | 100482/110379 [02:38<00:16, 605.51 examples/s]Map:  92%|█████████▏| 101229/110379 [02:38<00:16, 554.77 examples/s]Map:  94%|█████████▍| 103958/110379 [02:37<00:10, 618.43 examples/s]Map:  91%|█████████ | 100552/110379 [02:38<00:15, 624.63 examples/s]Map:  92%|█████████▏| 101031/110379 [02:37<00:18, 518.67 examples/s]Map:  92%|█████████▏| 101320/110379 [02:38<00:15, 569.98 examples/s]Map:  92%|█████████▏| 101091/110379 [02:37<00:17, 532.08 examples/s]Map:  91%|█████████ | 100648/110379 [02:38<00:15, 625.67 examples/s]Map:  92%|█████████▏| 101386/110379 [02:38<00:15, 588.17 examples/s]Map:  92%|█████████▏| 101157/110379 [02:37<00:16, 558.82 examples/s]Map:  91%|█████████ | 100713/110379 [02:38<00:15, 626.81 examples/s]Map:  94%|█████████▍| 104031/110379 [02:37<00:13, 454.91 examples/s]Map:  92%|█████████▏| 101465/110379 [02:38<00:13, 637.66 examples/s]Map:  92%|█████████▏| 101218/110379 [02:37<00:16, 570.47 examples/s]Map:  94%|█████████▍| 104092/110379 [02:37<00:13, 482.17 examples/s]Map:  92%|█████████▏| 101537/110379 [02:38<00:13, 658.21 examples/s]Map:  91%|█████████▏| 100809/110379 [02:38<00:15, 628.81 examples/s]Map:  92%|█████████▏| 101287/110379 [02:37<00:15, 598.02 examples/s]Map:  94%|█████████▍| 104163/110379 [02:37<00:11, 529.46 examples/s]Map:  92%|█████████▏| 101613/110379 [02:38<00:12, 683.21 examples/s]Map:  92%|█████████▏| 101351/110379 [02:37<00:14, 605.24 examples/s]Map:  91%|█████████▏| 100897/110379 [02:38<00:15, 613.23 examples/s]Map:  94%|█████████▍| 104240/110379 [02:38<00:10, 583.08 examples/s]Map:  92%|█████████▏| 101692/110379 [02:38<00:12, 711.54 examples/s]Map:  92%|█████████▏| 101417/110379 [02:37<00:14, 616.63 examples/s]Map:  91%|█████████▏| 100961/110379 [02:38<00:15, 616.89 examples/s]Map:  95%|█████████▍| 104320/110379 [02:38<00:09, 634.01 examples/s]Map:  92%|█████████▏| 101766/110379 [02:38<00:12, 716.52 examples/s]Map:  95%|█████████▍| 104395/110379 [02:38<00:09, 662.67 examples/s]Map:  92%|█████████▏| 101839/110379 [02:38<00:11, 716.63 examples/s]Map:  92%|█████████▏| 101509/110379 [02:38<00:14, 613.55 examples/s]Map:  95%|█████████▍| 104469/110379 [02:38<00:08, 680.88 examples/s]Map:  92%|█████████▏| 101579/110379 [02:38<00:13, 634.06 examples/s]Map:  92%|█████████▏| 101037/110379 [02:39<00:19, 473.06 examples/s]Map:  92%|█████████▏| 101931/110379 [02:39<00:12, 670.63 examples/s]Map:  95%|█████████▍| 104546/110379 [02:38<00:08, 702.43 examples/s]Map:  92%|█████████▏| 101113/110379 [02:39<00:17, 531.93 examples/s]Map:  92%|█████████▏| 101651/110379 [02:38<00:13, 654.34 examples/s]Map:  95%|█████████▍| 104620/110379 [02:38<00:08, 711.79 examples/s]Map:  92%|█████████▏| 101193/110379 [02:39<00:15, 591.01 examples/s]Map:  92%|█████████▏| 101723/110379 [02:38<00:12, 669.57 examples/s]Map:  95%|█████████▍| 104695/110379 [02:38<00:07, 717.07 examples/s]Map:  92%|█████████▏| 102000/110379 [02:39<00:16, 511.73 examples/s]Map:  92%|█████████▏| 101274/110379 [02:39<00:14, 642.34 examples/s]Map:  92%|█████████▏| 101796/110379 [02:38<00:12, 679.83 examples/s]Map:  95%|█████████▍| 104776/110379 [02:38<00:07, 739.84 examples/s]Map:  92%|█████████▏| 102073/110379 [02:39<00:14, 559.34 examples/s]Map:  92%|█████████▏| 101352/110379 [02:39<00:13, 676.20 examples/s]Map:  92%|█████████▏| 101896/110379 [02:38<00:12, 668.68 examples/s]Map:  95%|█████████▍| 104851/110379 [02:38<00:07, 740.53 examples/s]Map:  93%|█████████▎| 102145/110379 [02:39<00:13, 594.53 examples/s]Map:  92%|█████████▏| 101427/110379 [02:39<00:12, 692.12 examples/s]Map:  92%|█████████▏| 101966/110379 [02:38<00:12, 674.15 examples/s]Map:  95%|█████████▌| 104960/110379 [02:38<00:07, 729.02 examples/s]Map:  93%|█████████▎| 102243/110379 [02:39<00:13, 610.87 examples/s]Map:  92%|█████████▏| 101533/110379 [02:39<00:12, 694.42 examples/s]Map:  93%|█████████▎| 102311/110379 [02:39<00:12, 626.37 examples/s]Map:  92%|█████████▏| 101607/110379 [02:39<00:12, 704.30 examples/s]Map:  93%|█████████▎| 102388/110379 [02:39<00:12, 662.17 examples/s]Map:  92%|█████████▏| 102067/110379 [02:39<00:16, 503.62 examples/s]Map:  95%|█████████▌| 105037/110379 [02:39<00:09, 543.41 examples/s]Map:  92%|█████████▏| 101685/110379 [02:39<00:12, 719.42 examples/s]Map:  93%|█████████▎| 102462/110379 [02:40<00:11, 680.49 examples/s]Map:  93%|█████████▎| 102133/110379 [02:39<00:15, 535.27 examples/s]Map:  95%|█████████▌| 105118/110379 [02:39<00:08, 600.15 examples/s]Map:  92%|█████████▏| 101763/110379 [02:40<00:11, 733.25 examples/s]Map:  93%|█████████▎| 102538/110379 [02:40<00:11, 700.71 examples/s]Map:  93%|█████████▎| 102204/110379 [02:39<00:14, 573.67 examples/s]Map:  92%|█████████▏| 101842/110379 [02:40<00:11, 746.95 examples/s]Map:  95%|█████████▌| 105212/110379 [02:39<00:08, 604.60 examples/s]Map:  93%|█████████▎| 102622/110379 [02:40<00:10, 737.61 examples/s]Map:  93%|█████████▎| 102279/110379 [02:39<00:13, 613.07 examples/s]Map:  92%|█████████▏| 101922/110379 [02:40<00:11, 759.14 examples/s]Map:  95%|█████████▌| 105293/110379 [02:39<00:07, 650.98 examples/s]Map:  93%|█████████▎| 102347/110379 [02:39<00:12, 629.34 examples/s]Map:  93%|█████████▎| 102730/110379 [02:40<00:10, 727.70 examples/s]Map:  95%|█████████▌| 105374/110379 [02:39<00:07, 688.31 examples/s]Map:  93%|█████████▎| 102417/110379 [02:39<00:12, 645.58 examples/s]Map:  93%|█████████▎| 102807/110379 [02:40<00:10, 736.01 examples/s]Map:  92%|█████████▏| 102000/110379 [02:40<00:16, 519.15 examples/s]Map:  93%|█████████▎| 102489/110379 [02:39<00:11, 665.42 examples/s]Map:  96%|█████████▌| 105469/110379 [02:39<00:07, 664.01 examples/s]Map:  93%|█████████▎| 102885/110379 [02:40<00:10, 744.28 examples/s]Map:  92%|█████████▏| 102068/110379 [02:40<00:15, 550.19 examples/s]Map:  93%|█████████▎| 102558/110379 [02:39<00:11, 671.36 examples/s]Map:  93%|█████████▎| 102961/110379 [02:40<00:09, 743.25 examples/s]Map:  96%|█████████▌| 105563/110379 [02:39<00:07, 651.39 examples/s]Map:  93%|█████████▎| 102160/110379 [02:40<00:14, 560.63 examples/s]Map:  93%|█████████▎| 102660/110379 [02:39<00:11, 668.64 examples/s]Map:  96%|█████████▌| 105633/110379 [02:40<00:07, 660.75 examples/s]Map:  93%|█████████▎| 102233/110379 [02:40<00:13, 597.90 examples/s]Map:  93%|█████████▎| 103040/110379 [02:40<00:13, 564.46 examples/s]Map:  93%|█████████▎| 102755/110379 [02:40<00:11, 649.21 examples/s]Map:  96%|█████████▌| 105717/110379 [02:40<00:07, 615.34 examples/s]Map:  93%|█████████▎| 102304/110379 [02:40<00:12, 621.91 examples/s]Map:  93%|█████████▎| 103120/110379 [02:40<00:11, 617.08 examples/s]Map:  93%|█████████▎| 103191/110379 [02:41<00:11, 636.77 examples/s]Map:  93%|█████████▎| 102849/110379 [02:40<00:11, 640.64 examples/s]Map:  96%|█████████▌| 105812/110379 [02:40<00:07, 617.72 examples/s]Map:  93%|█████████▎| 102390/110379 [02:41<00:13, 600.00 examples/s]Map:  94%|█████████▎| 103265/110379 [02:41<00:10, 661.06 examples/s]Map:  96%|█████████▌| 105881/110379 [02:40<00:07, 631.11 examples/s]Map:  93%|█████████▎| 102461/110379 [02:41<00:12, 625.65 examples/s]Map:  93%|█████████▎| 102931/110379 [02:40<00:12, 608.62 examples/s]Map:  94%|█████████▎| 103344/110379 [02:41<00:10, 693.71 examples/s]Map:  93%|█████████▎| 102529/110379 [02:41<00:12, 637.73 examples/s]Map:  93%|█████████▎| 102994/110379 [02:40<00:12, 609.61 examples/s]Map:  96%|█████████▌| 105976/110379 [02:40<00:07, 626.18 examples/s]Map:  94%|█████████▎| 103423/110379 [02:41<00:09, 718.62 examples/s]Map:  93%|█████████▎| 102610/110379 [02:41<00:11, 682.19 examples/s]Map:  94%|█████████▍| 103500/110379 [02:41<00:09, 729.70 examples/s]Map:  93%|█████████▎| 102688/110379 [02:41<00:10, 707.58 examples/s]Map:  93%|█████████▎| 103076/110379 [02:40<00:14, 491.77 examples/s]Map:  94%|█████████▍| 103603/110379 [02:41<00:09, 708.85 examples/s]Map:  96%|█████████▌| 106063/110379 [02:40<00:09, 462.33 examples/s]Map:  93%|█████████▎| 102794/110379 [02:41<00:10, 702.83 examples/s]Map:  93%|█████████▎| 103147/110379 [02:40<00:13, 536.26 examples/s]Map:  96%|█████████▌| 106128/110379 [02:41<00:08, 495.82 examples/s]Map:  93%|█████████▎| 102872/110379 [02:41<00:10, 721.56 examples/s]Map:  94%|█████████▎| 103219/110379 [02:40<00:12, 576.21 examples/s]Map:  94%|█████████▍| 103694/110379 [02:41<00:10, 666.37 examples/s]Map:  96%|█████████▌| 106194/110379 [02:41<00:07, 527.15 examples/s]Map:  93%|█████████▎| 102947/110379 [02:41<00:10, 726.40 examples/s]Map:  94%|█████████▎| 103291/110379 [02:41<00:11, 609.33 examples/s]Map:  94%|█████████▍| 103776/110379 [02:41<00:10, 621.29 examples/s]Map:  96%|█████████▋| 106259/110379 [02:41<00:07, 553.56 examples/s]Map:  94%|█████████▎| 103372/110379 [02:41<00:10, 658.42 examples/s]Map:  94%|█████████▍| 103843/110379 [02:42<00:10, 624.01 examples/s]Map:  94%|█████████▎| 103442/110379 [02:41<00:10, 668.80 examples/s]Map:  93%|█████████▎| 103040/110379 [02:42<00:12, 565.24 examples/s]Map:  96%|█████████▋| 106351/110379 [02:41<00:07, 571.51 examples/s]Map:  94%|█████████▍| 103935/110379 [02:42<00:10, 616.87 examples/s]Map:  93%|█████████▎| 103120/110379 [02:42<00:11, 616.13 examples/s]Map:  96%|█████████▋| 106417/110379 [02:41<00:06, 591.07 examples/s]Map:  94%|█████████▍| 103548/110379 [02:41<00:10, 678.52 examples/s]Map:  93%|█████████▎| 103199/110379 [02:42<00:10, 654.37 examples/s]Map:  96%|█████████▋| 106485/110379 [02:41<00:06, 610.99 examples/s]Map:  94%|█████████▍| 103625/110379 [02:41<00:09, 700.18 examples/s]Map:  94%|█████████▎| 103277/110379 [02:42<00:10, 684.64 examples/s]Map:  97%|█████████▋| 106563/110379 [02:41<00:05, 653.38 examples/s]Map:  94%|█████████▍| 103705/110379 [02:41<00:09, 725.45 examples/s]Map:  94%|█████████▍| 104000/110379 [02:42<00:14, 440.46 examples/s]Map:  97%|█████████▋| 106642/110379 [02:41<00:05, 686.10 examples/s]Map:  94%|█████████▎| 103384/110379 [02:42<00:10, 685.68 examples/s]Map:  94%|█████████▍| 104067/110379 [02:42<00:13, 483.18 examples/s]Map:  94%|█████████▍| 103802/110379 [02:41<00:09, 695.16 examples/s]Map:  97%|█████████▋| 106739/110379 [02:41<00:05, 667.08 examples/s]Map:  94%|█████████▍| 104135/110379 [02:42<00:11, 523.28 examples/s]Map:  94%|█████████▎| 103475/110379 [02:42<00:10, 656.43 examples/s]Map:  94%|█████████▍| 103903/110379 [02:41<00:09, 686.73 examples/s]Map:  97%|█████████▋| 106820/110379 [02:42<00:05, 701.45 examples/s]Map:  94%|█████████▍| 104195/110379 [02:42<00:11, 538.44 examples/s]Map:  94%|█████████▍| 103982/110379 [02:42<00:09, 708.65 examples/s]Map:  97%|█████████▋| 106897/110379 [02:42<00:04, 719.12 examples/s]Map:  94%|█████████▍| 103546/110379 [02:42<00:11, 593.87 examples/s]Map:  94%|█████████▍| 104256/110379 [02:42<00:11, 551.54 examples/s]Map:  97%|█████████▋| 106973/110379 [02:42<00:04, 727.32 examples/s]Map:  95%|█████████▍| 104325/110379 [02:43<00:10, 586.05 examples/s]Map:  94%|█████████▍| 103617/110379 [02:43<00:12, 554.41 examples/s]Map:  95%|█████████▍| 104387/110379 [02:43<00:10, 587.58 examples/s]Map:  94%|█████████▍| 104075/110379 [02:42<00:11, 549.93 examples/s]Map:  94%|█████████▍| 103692/110379 [02:43<00:12, 532.63 examples/s]Map:  95%|█████████▍| 104455/110379 [02:43<00:09, 610.98 examples/s]Map:  94%|█████████▍| 104153/110379 [02:42<00:10, 595.66 examples/s]Map:  97%|█████████▋| 107081/110379 [02:42<00:05, 563.01 examples/s]Map:  95%|█████████▍| 104521/110379 [02:43<00:09, 622.65 examples/s]Map:  94%|█████████▍| 104226/110379 [02:42<00:09, 625.16 examples/s]Map:  94%|█████████▍| 103771/110379 [02:43<00:12, 528.00 examples/s]Map:  97%|█████████▋| 107160/110379 [02:42<00:05, 608.64 examples/s]Map:  94%|█████████▍| 104304/110379 [02:42<00:09, 656.67 examples/s]Map:  94%|█████████▍| 103832/110379 [02:43<00:12, 544.95 examples/s]Map:  95%|█████████▍| 104618/110379 [02:43<00:09, 630.12 examples/s]Map:  97%|█████████▋| 107239/110379 [02:42<00:04, 647.90 examples/s]Map:  95%|█████████▍| 104384/110379 [02:42<00:08, 692.10 examples/s]Map:  97%|█████████▋| 107315/110379 [02:42<00:04, 673.41 examples/s]Map:  94%|█████████▍| 103916/110379 [02:43<00:11, 545.05 examples/s]Map:  95%|█████████▍| 104710/110379 [02:43<00:09, 621.62 examples/s]Map:  97%|█████████▋| 107391/110379 [02:42<00:04, 692.98 examples/s]Map:  95%|█████████▍| 104494/110379 [02:42<00:08, 702.98 examples/s]Map:  94%|█████████▍| 103982/110379 [02:43<00:11, 566.93 examples/s]Map:  95%|█████████▍| 104799/110379 [02:43<00:09, 610.22 examples/s]Map:  97%|█████████▋| 107478/110379 [02:43<00:03, 738.67 examples/s]Map:  95%|█████████▍| 104571/110379 [02:42<00:08, 718.58 examples/s]Map:  95%|█████████▌| 104863/110379 [02:43<00:08, 614.80 examples/s]Map:  97%|█████████▋| 107592/110379 [02:43<00:03, 743.97 examples/s]Map:  95%|█████████▍| 104681/110379 [02:43<00:07, 717.34 examples/s]Map:  94%|█████████▍| 104056/110379 [02:43<00:15, 412.47 examples/s]Map:  95%|█████████▌| 104957/110379 [02:44<00:08, 612.65 examples/s]Map:  98%|█████████▊| 107696/110379 [02:43<00:03, 723.26 examples/s]Map:  95%|█████████▍| 104788/110379 [02:43<00:07, 714.63 examples/s]Map:  94%|█████████▍| 104121/110379 [02:44<00:13, 457.85 examples/s]Map:  94%|█████████▍| 104187/110379 [02:44<00:12, 497.76 examples/s]Map:  98%|█████████▊| 107794/110379 [02:43<00:03, 696.64 examples/s]Map:  95%|█████████▌| 104882/110379 [02:43<00:08, 681.09 examples/s]Map:  95%|█████████▌| 105034/110379 [02:44<00:11, 457.41 examples/s]Map:  94%|█████████▍| 104247/110379 [02:44<00:11, 520.06 examples/s]Map:  98%|█████████▊| 107894/110379 [02:43<00:03, 683.36 examples/s]Map:  95%|█████████▌| 104978/110379 [02:43<00:08, 665.93 examples/s]Map:  95%|█████████▌| 105116/110379 [02:44<00:09, 526.98 examples/s]Map:  95%|█████████▍| 104324/110379 [02:44<00:10, 580.78 examples/s]Map:  95%|█████████▌| 105196/110379 [02:44<00:08, 584.38 examples/s]Map:  95%|█████████▍| 104399/110379 [02:44<00:09, 621.31 examples/s]Map:  98%|█████████▊| 107996/110379 [02:43<00:03, 680.15 examples/s]Map:  95%|█████████▌| 105278/110379 [02:44<00:07, 638.85 examples/s]Map:  95%|█████████▍| 104474/110379 [02:44<00:09, 655.18 examples/s]Map:  95%|█████████▌| 105069/110379 [02:43<00:09, 532.55 examples/s]Map:  95%|█████████▌| 105356/110379 [02:44<00:07, 672.61 examples/s]Map:  95%|█████████▌| 105142/110379 [02:43<00:09, 570.41 examples/s]Map:  95%|█████████▍| 104577/110379 [02:44<00:08, 662.83 examples/s]Map:  98%|█████████▊| 108077/110379 [02:44<00:04, 531.03 examples/s]Map:  95%|█████████▌| 105218/110379 [02:43<00:08, 610.30 examples/s]Map:  96%|█████████▌| 105446/110379 [02:44<00:07, 641.68 examples/s]Map:  95%|█████████▍| 104653/110379 [02:44<00:08, 684.89 examples/s]Map:  98%|█████████▊| 108159/110379 [02:44<00:03, 585.82 examples/s]Map:  95%|█████████▌| 105288/110379 [02:44<00:08, 630.47 examples/s]Map:  95%|█████████▍| 104732/110379 [02:44<00:07, 710.42 examples/s]Map:  98%|█████████▊| 108239/110379 [02:44<00:03, 631.08 examples/s]Map:  96%|█████████▌| 105533/110379 [02:45<00:07, 616.07 examples/s]Map:  95%|█████████▌| 105358/110379 [02:44<00:07, 643.38 examples/s]Map:  95%|█████████▍| 104811/110379 [02:45<00:07, 730.40 examples/s]Map:  98%|█████████▊| 108319/110379 [02:44<00:03, 669.17 examples/s]Map:  96%|█████████▌| 105432/110379 [02:44<00:07, 665.74 examples/s]Map:  96%|█████████▌| 105626/110379 [02:45<00:07, 612.09 examples/s]Map:  95%|█████████▌| 104887/110379 [02:45<00:07, 734.42 examples/s]Map:  98%|█████████▊| 108399/110379 [02:44<00:02, 699.98 examples/s]Map:  96%|█████████▌| 105511/110379 [02:44<00:07, 695.22 examples/s]Map:  96%|█████████▌| 105710/110379 [02:45<00:07, 663.77 examples/s]Map:  98%|█████████▊| 108484/110379 [02:44<00:02, 736.73 examples/s]Map:  95%|█████████▌| 104985/110379 [02:45<00:07, 697.69 examples/s]Map:  96%|█████████▌| 105588/110379 [02:44<00:06, 711.78 examples/s]Map:  96%|█████████▌| 105789/110379 [02:45<00:06, 692.35 examples/s]Map:  98%|█████████▊| 108598/110379 [02:44<00:02, 741.15 examples/s]Map:  96%|█████████▌| 105665/110379 [02:44<00:06, 726.04 examples/s]Map:  96%|█████████▌| 105868/110379 [02:45<00:06, 717.22 examples/s]Map:  98%|█████████▊| 108682/110379 [02:44<00:02, 764.40 examples/s]Map:  96%|█████████▌| 105742/110379 [02:44<00:06, 734.67 examples/s]Map:  96%|█████████▌| 105947/110379 [02:45<00:06, 733.59 examples/s]Map:  96%|█████████▌| 105819/110379 [02:44<00:06, 742.82 examples/s]Map:  95%|█████████▌| 105086/110379 [02:45<00:11, 475.21 examples/s]Map:  99%|█████████▊| 108795/110379 [02:44<00:02, 758.48 examples/s]Map:  96%|█████████▌| 105914/110379 [02:44<00:06, 693.63 examples/s]Map:  95%|█████████▌| 105164/110379 [02:45<00:10, 483.14 examples/s]Map:  99%|█████████▊| 108899/110379 [02:45<00:02, 732.25 examples/s]Map:  96%|█████████▌| 106037/110379 [02:45<00:08, 522.06 examples/s]Map:  96%|█████████▌| 105988/110379 [02:45<00:06, 701.61 examples/s]Map:  95%|█████████▌| 105245/110379 [02:45<00:09, 542.19 examples/s]Map:  96%|█████████▌| 106107/110379 [02:45<00:07, 557.19 examples/s]Map:  95%|█████████▌| 105329/110379 [02:46<00:08, 604.73 examples/s]Map:  96%|█████████▌| 106174/110379 [02:46<00:07, 580.85 examples/s]Map:  95%|█████████▌| 105406/110379 [02:46<00:07, 641.39 examples/s]Map:  99%|█████████▉| 109000/110379 [02:45<00:02, 540.07 examples/s]Map:  96%|█████████▋| 106255/110379 [02:46<00:06, 636.99 examples/s]Map:  96%|█████████▌| 105487/110379 [02:46<00:07, 680.94 examples/s]Map:  99%|█████████▉| 109064/110379 [02:45<00:02, 557.31 examples/s]Map:  96%|█████████▋| 106331/110379 [02:46<00:06, 665.77 examples/s]Map:  96%|█████████▌| 106075/110379 [02:45<00:09, 446.64 examples/s]Map:  96%|█████████▌| 105569/110379 [02:46<00:06, 714.19 examples/s]Map:  99%|█████████▉| 109132/110379 [02:45<00:02, 582.55 examples/s]Map:  96%|█████████▋| 106412/110379 [02:46<00:05, 703.74 examples/s]Map:  96%|█████████▌| 106151/110379 [02:45<00:09, 458.42 examples/s]Map:  96%|█████████▌| 105646/110379 [02:46<00:06, 725.39 examples/s]Map:  99%|█████████▉| 109197/110379 [02:45<00:01, 595.71 examples/s]Map:  96%|█████████▋| 106495/110379 [02:46<00:05, 736.84 examples/s]Map:  96%|█████████▌| 106227/110379 [02:45<00:08, 464.68 examples/s]Map:  96%|█████████▌| 105750/110379 [02:46<00:06, 712.50 examples/s]Map:  99%|█████████▉| 109296/110379 [02:45<00:01, 614.49 examples/s]Map:  97%|█████████▋| 106614/110379 [02:46<00:05, 752.21 examples/s]Map:  96%|█████████▋| 106302/110379 [02:45<00:07, 520.10 examples/s]Map:  96%|█████████▌| 105827/110379 [02:46<00:06, 723.48 examples/s]Map:  99%|█████████▉| 109362/110379 [02:45<00:01, 623.27 examples/s]Map:  97%|█████████▋| 106691/110379 [02:46<00:04, 754.28 examples/s]Map:  96%|█████████▋| 106373/110379 [02:45<00:07, 560.57 examples/s]Map:  96%|█████████▌| 105902/110379 [02:46<00:06, 728.73 examples/s]Map:  99%|█████████▉| 109427/110379 [02:46<00:01, 628.32 examples/s]Map:  97%|█████████▋| 106771/110379 [02:46<00:04, 764.66 examples/s]Map:  96%|█████████▋| 106450/110379 [02:46<00:06, 609.55 examples/s]Map:  96%|█████████▌| 105978/110379 [02:46<00:06, 733.01 examples/s]Map:  99%|█████████▉| 109492/110379 [02:46<00:01, 628.00 examples/s]Map:  97%|█████████▋| 106884/110379 [02:46<00:04, 757.61 examples/s]Map:  97%|█████████▋| 106520/110379 [02:46<00:06, 628.57 examples/s]Map:  99%|█████████▉| 109586/110379 [02:46<00:01, 623.12 examples/s]Map:  97%|█████████▋| 106965/110379 [02:47<00:04, 768.02 examples/s]Map:  97%|█████████▋| 106605/110379 [02:46<00:06, 603.20 examples/s]Map:  96%|█████████▌| 106075/110379 [02:47<00:07, 558.42 examples/s]Map:  99%|█████████▉| 109651/110379 [02:46<00:01, 627.11 examples/s]Map:  96%|█████████▌| 106147/110379 [02:47<00:07, 589.39 examples/s]Map:  97%|█████████▋| 106695/110379 [02:46<00:06, 599.04 examples/s]Map:  99%|█████████▉| 109749/110379 [02:46<00:01, 628.55 examples/s]Map:  97%|█████████▋| 107066/110379 [02:47<00:05, 563.17 examples/s]Map:  97%|█████████▋| 106764/110379 [02:46<00:05, 619.36 examples/s]Map:  96%|█████████▋| 106247/110379 [02:47<00:06, 612.20 examples/s]Map:  99%|█████████▉| 109813/110379 [02:46<00:00, 630.45 examples/s]Map:  97%|█████████▋| 107143/110379 [02:47<00:05, 604.37 examples/s]Map:  97%|█████████▋| 106838/110379 [02:46<00:05, 647.83 examples/s]Map:  96%|█████████▋| 106325/110379 [02:47<00:06, 649.57 examples/s]Map: 100%|█████████▉| 109880/110379 [02:46<00:00, 637.91 examples/s]Map:  97%|█████████▋| 107218/110379 [02:47<00:04, 636.46 examples/s]Map:  97%|█████████▋| 106910/110379 [02:46<00:05, 663.80 examples/s]Map:  96%|█████████▋| 106400/110379 [02:47<00:05, 671.44 examples/s]Map:  97%|█████████▋| 107302/110379 [02:47<00:04, 683.85 examples/s]Map: 100%|█████████▉| 109970/110379 [02:46<00:00, 621.01 examples/s]Map:  97%|█████████▋| 106985/110379 [02:46<00:04, 685.34 examples/s]Map:  96%|█████████▋| 106474/110379 [02:47<00:05, 689.00 examples/s]Map:  97%|█████████▋| 107385/110379 [02:47<00:04, 719.79 examples/s]Map:  97%|█████████▋| 106546/110379 [02:47<00:05, 695.98 examples/s]Map:  97%|█████████▋| 107462/110379 [02:47<00:03, 731.24 examples/s]Map:  97%|█████████▋| 106624/110379 [02:47<00:05, 717.52 examples/s]Map:  97%|█████████▋| 107073/110379 [02:47<00:06, 522.49 examples/s]Map:  97%|█████████▋| 107541/110379 [02:47<00:03, 743.49 examples/s]Map: 100%|█████████▉| 110062/110379 [02:47<00:00, 455.33 examples/s]Map:  97%|█████████▋| 107618/110379 [02:48<00:03, 749.16 examples/s]Map:  97%|█████████▋| 106730/110379 [02:48<00:05, 706.28 examples/s]Map: 100%|█████████▉| 110128/110379 [02:47<00:00, 493.17 examples/s]Map:  97%|█████████▋| 107168/110379 [02:47<00:05, 554.61 examples/s]Map:  98%|█████████▊| 107698/110379 [02:48<00:03, 757.38 examples/s]Map:  97%|█████████▋| 106808/110379 [02:48<00:04, 719.46 examples/s]Map: 100%|█████████▉| 110190/110379 [02:47<00:00, 518.18 examples/s]Map:  97%|█████████▋| 107241/110379 [02:47<00:05, 591.03 examples/s]Map:  98%|█████████▊| 107776/110379 [02:48<00:03, 761.89 examples/s]Map:  97%|█████████▋| 106886/110379 [02:48<00:04, 734.33 examples/s]Map: 100%|█████████▉| 110249/110379 [02:47<00:00, 532.49 examples/s]Map:  97%|█████████▋| 107319/110379 [02:47<00:04, 635.75 examples/s]Map:  98%|█████████▊| 107854/110379 [02:48<00:03, 764.59 examples/s]Map: 100%|█████████▉| 110319/110379 [02:47<00:00, 571.93 examples/s]Map:  97%|█████████▋| 107394/110379 [02:47<00:04, 663.85 examples/s]Map:  97%|█████████▋| 106992/110379 [02:48<00:04, 720.34 examples/s]Map:  97%|█████████▋| 107465/110379 [02:47<00:04, 672.51 examples/s]Map:  98%|█████████▊| 107960/110379 [02:48<00:03, 739.72 examples/s]Map:  97%|█████████▋| 107555/110379 [02:47<00:04, 641.55 examples/s]Map: 100%|██████████| 110379/110379 [02:47<00:00, 657.13 examples/s]
Map:  97%|█████████▋| 107095/110379 [02:48<00:06, 510.19 examples/s]Map:  98%|█████████▊| 107643/110379 [02:47<00:04, 618.62 examples/s]Map:  98%|█████████▊| 108060/110379 [02:48<00:04, 511.12 examples/s]Map:  97%|█████████▋| 107186/110379 [02:48<00:05, 532.89 examples/s]Map:  98%|█████████▊| 107734/110379 [02:48<00:04, 610.18 examples/s]Map:  98%|█████████▊| 108154/110379 [02:48<00:04, 540.14 examples/s]Map:  97%|█████████▋| 107255/110379 [02:48<00:05, 561.56 examples/s]Map:  98%|█████████▊| 108228/110379 [02:49<00:03, 578.37 examples/s]Map:  97%|█████████▋| 107319/110379 [02:49<00:05, 575.23 examples/s]Map:  98%|█████████▊| 107827/110379 [02:48<00:04, 610.17 examples/s]Map:  98%|█████████▊| 108308/110379 [02:49<00:03, 624.65 examples/s]Map:  97%|█████████▋| 107413/110379 [02:49<00:05, 589.69 examples/s]Map:  98%|█████████▊| 107923/110379 [02:48<00:03, 618.32 examples/s]Map:  98%|█████████▊| 108381/110379 [02:49<00:03, 649.58 examples/s]Map:  97%|█████████▋| 107479/110379 [02:49<00:04, 602.48 examples/s]Map:  98%|█████████▊| 107997/110379 [02:48<00:03, 643.69 examples/s]Map:  98%|█████████▊| 108457/110379 [02:49<00:02, 676.07 examples/s]Map:  98%|█████████▊| 108538/110379 [02:49<00:02, 708.93 examples/s]Map:  97%|█████████▋| 107566/110379 [02:49<00:04, 592.24 examples/s]Map:  98%|█████████▊| 108073/110379 [02:48<00:04, 509.11 examples/s]Map:  98%|█████████▊| 107628/110379 [02:49<00:04, 595.21 examples/s]Map:  98%|█████████▊| 108649/110379 [02:49<00:02, 715.72 examples/s]Map:  98%|█████████▊| 108148/110379 [02:48<00:04, 557.65 examples/s]Map:  98%|█████████▊| 107698/110379 [02:49<00:04, 619.54 examples/s]Map:  99%|█████████▊| 108727/110379 [02:49<00:02, 728.79 examples/s]Map:  98%|█████████▊| 108231/110379 [02:48<00:03, 619.18 examples/s]Map:  98%|█████████▊| 107775/110379 [02:49<00:03, 656.65 examples/s]Map:  99%|█████████▊| 108808/110379 [02:49<00:02, 748.97 examples/s]Map:  98%|█████████▊| 108303/110379 [02:49<00:03, 641.91 examples/s]Map:  98%|█████████▊| 107850/110379 [02:49<00:03, 678.38 examples/s]Map:  99%|█████████▊| 108886/110379 [02:49<00:01, 753.14 examples/s]Map:  98%|█████████▊| 108378/110379 [02:49<00:02, 668.83 examples/s]Map:  98%|█████████▊| 107921/110379 [02:50<00:03, 684.23 examples/s]Map:  98%|█████████▊| 108451/110379 [02:49<00:02, 680.48 examples/s]Map:  99%|█████████▉| 109000/110379 [02:50<00:02, 567.48 examples/s]Map:  98%|█████████▊| 108548/110379 [02:49<00:02, 664.84 examples/s]Map:  98%|█████████▊| 108000/110379 [02:50<00:04, 476.08 examples/s]Map:  99%|█████████▉| 109092/110379 [02:50<00:02, 579.04 examples/s]Map:  98%|█████████▊| 108062/110379 [02:50<00:04, 504.03 examples/s]Map:  98%|█████████▊| 108640/110379 [02:49<00:02, 642.40 examples/s]Map:  99%|█████████▉| 109166/110379 [02:50<00:01, 611.72 examples/s]Map:  98%|█████████▊| 108129/110379 [02:50<00:04, 541.74 examples/s]Map:  99%|█████████▊| 108724/110379 [02:49<00:02, 610.26 examples/s]Map:  99%|█████████▉| 109234/110379 [02:50<00:01, 624.85 examples/s]Map:  98%|█████████▊| 108201/110379 [02:50<00:03, 583.30 examples/s]Map:  99%|█████████▉| 109317/110379 [02:50<00:01, 672.45 examples/s]Map:  98%|█████████▊| 108278/110379 [02:50<00:03, 629.33 examples/s]Map:  99%|█████████▊| 108815/110379 [02:49<00:02, 602.14 examples/s]Map:  98%|█████████▊| 108348/110379 [02:50<00:03, 644.21 examples/s]Map:  99%|█████████▉| 109417/110379 [02:50<00:01, 667.36 examples/s]Map:  99%|█████████▊| 108908/110379 [02:50<00:02, 603.04 examples/s]Map:  98%|█████████▊| 108448/110379 [02:50<00:02, 644.23 examples/s]Map:  99%|█████████▊| 108971/110379 [02:50<00:02, 606.89 examples/s]Map:  99%|█████████▉| 109510/110379 [02:50<00:01, 650.61 examples/s]Map:  98%|█████████▊| 108519/110379 [02:51<00:02, 659.64 examples/s]Map:  99%|█████████▉| 109578/110379 [02:51<00:01, 655.21 examples/s]Map:  99%|█████████▉| 109035/110379 [02:50<00:02, 486.69 examples/s]Map:  99%|█████████▉| 109654/110379 [02:51<00:01, 679.35 examples/s]Map:  98%|█████████▊| 108614/110379 [02:51<00:02, 648.25 examples/s]Map:  99%|█████████▉| 109114/110379 [02:50<00:02, 549.54 examples/s]Map:  99%|█████████▉| 109727/110379 [02:51<00:00, 691.32 examples/s]Map:  98%|█████████▊| 108704/110379 [02:51<00:02, 627.65 examples/s]Map:  99%|█████████▉| 109187/110379 [02:50<00:02, 589.67 examples/s]Map:  99%|█████████▉| 109805/110379 [02:51<00:00, 713.36 examples/s]Map:  99%|█████████▉| 109263/110379 [02:50<00:01, 630.38 examples/s]Map: 100%|█████████▉| 109882/110379 [02:51<00:00, 724.09 examples/s]Map:  99%|█████████▊| 108792/110379 [02:51<00:02, 612.42 examples/s]Map:  99%|█████████▉| 109339/110379 [02:50<00:01, 663.07 examples/s]Map: 100%|█████████▉| 109958/110379 [02:51<00:00, 732.30 examples/s]Map:  99%|█████████▊| 108855/110379 [02:51<00:02, 613.70 examples/s]Map:  99%|█████████▉| 109417/110379 [02:50<00:01, 694.01 examples/s]Map:  99%|█████████▊| 108918/110379 [02:51<00:02, 615.32 examples/s]Map:  99%|█████████▉| 109496/110379 [02:50<00:01, 718.31 examples/s]Map:  99%|█████████▊| 108982/110379 [02:51<00:02, 616.11 examples/s]Map: 100%|█████████▉| 110038/110379 [02:51<00:00, 536.60 examples/s]Map:  99%|█████████▉| 109571/110379 [02:51<00:01, 724.34 examples/s]Map: 100%|█████████▉| 110118/110379 [02:51<00:00, 594.22 examples/s]Map:  99%|█████████▉| 109649/110379 [02:51<00:00, 736.46 examples/s]Map: 100%|█████████▉| 110200/110379 [02:52<00:00, 648.75 examples/s]Map:  99%|█████████▉| 109064/110379 [02:52<00:02, 446.88 examples/s]Map:  99%|█████████▉| 109754/110379 [02:51<00:00, 719.14 examples/s]Map: 100%|█████████▉| 110277/110379 [02:52<00:00, 679.04 examples/s]Map:  99%|█████████▉| 109121/110379 [02:52<00:02, 470.66 examples/s]Map: 100%|█████████▉| 110373/110379 [02:52<00:00, 664.39 examples/s]Map: 100%|█████████▉| 109858/110379 [02:51<00:00, 706.85 examples/s]Map:  99%|█████████▉| 109191/110379 [02:52<00:02, 519.81 examples/s]Map: 100%|█████████▉| 109930/110379 [02:51<00:00, 708.39 examples/s]Map:  99%|█████████▉| 109263/110379 [02:52<00:01, 566.13 examples/s]Map:  99%|█████████▉| 109334/110379 [02:52<00:01, 600.40 examples/s]Map: 100%|██████████| 110379/110379 [02:52<00:00, 639.83 examples/s]
Map:  99%|█████████▉| 109406/110379 [02:52<00:01, 630.27 examples/s]Map: 100%|█████████▉| 110032/110379 [02:51<00:00, 553.22 examples/s]Map:  99%|█████████▉| 109482/110379 [02:52<00:01, 664.85 examples/s]Detected kernel version 5.4.0, which is below the recommended minimum of 5.5.0; this can cause the process to hang. It is recommended to upgrade the kernel to the minimum version or higher.
Map: 100%|█████████▉| 110110/110379 [02:51<00:00, 598.93 examples/s]Map:  99%|█████████▉| 109560/110379 [02:52<00:01, 694.16 examples/s]Map: 100%|█████████▉| 110184/110379 [02:52<00:00, 628.59 examples/s]Map:  99%|█████████▉| 109634/110379 [02:52<00:01, 703.25 examples/s]Map: 100%|█████████▉| 110258/110379 [02:52<00:00, 652.84 examples/s]Map:  99%|█████████▉| 109710/110379 [02:53<00:00, 716.81 examples/s]Map: 100%|█████████▉| 110334/110379 [02:52<00:00, 677.96 examples/s]Map:  99%|█████████▉| 109784/110379 [02:53<00:00, 719.83 examples/s]Map: 100%|█████████▉| 109859/110379 [02:53<00:00, 726.04 examples/s]Map: 100%|██████████| 110379/110379 [02:52<00:00, 639.95 examples/s]
Map: 100%|█████████▉| 109966/110379 [02:53<00:00, 716.02 examples/s]Map: 100%|█████████▉| 110078/110379 [02:53<00:00, 565.09 examples/s]Map: 100%|█████████▉| 110151/110379 [02:53<00:00, 594.23 examples/s]Map: 100%|█████████▉| 110232/110379 [02:53<00:00, 640.93 examples/s]Map: 100%|█████████▉| 110307/110379 [02:53<00:00, 664.76 examples/s]Map: 100%|██████████| 110379/110379 [02:54<00:00, 597.72 examples/s]Map: 100%|██████████| 110379/110379 [02:54<00:00, 633.33 examples/s]
/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
  warnings.warn(
/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
  warnings.warn(
/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
  warnings.warn(
wandb: Currently logged in as: k-duan (nus_keyu). Use `wandb login --relogin` to force relogin
wandb: Tracking run with wandb version 0.16.1
wandb: Run data is saved locally in /home/aiops/duanky/lora-moe/experiments/launch_scripts/wandb/run-20231229_120011-rpu8pnl2
wandb: Run `wandb offline` to turn off syncing.
wandb: Syncing run belle_dolphine-p13
wandb: ⭐️ View project at https://wandb.ai/nus_keyu/lora-moe
wandb: 🚀 View run at https://wandb.ai/nus_keyu/lora-moe/runs/rpu8pnl2
  0%|          | 0/3449 [00:00<?, ?it/s]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
  warnings.warn(
  0%|          | 1/3449 [00:03<3:00:26,  3.14s/it]                                                  {'loss': 1.5832, 'learning_rate': 4.000000000000001e-06, 'epoch': 0.0}
  0%|          | 1/3449 [00:03<3:00:26,  3.14s/it]  0%|          | 2/3449 [00:06<3:08:33,  3.28s/it]                                                  {'loss': 1.516, 'learning_rate': 8.000000000000001e-06, 'epoch': 0.0}
  0%|          | 2/3449 [00:06<3:08:33,  3.28s/it]  0%|          | 3/3449 [00:09<3:02:07,  3.17s/it]                                                  {'loss': 1.6493, 'learning_rate': 1.2e-05, 'epoch': 0.0}
  0%|          | 3/3449 [00:09<3:02:07,  3.17s/it]  0%|          | 4/3449 [00:12<2:51:10,  2.98s/it]                                                  {'loss': 1.7471, 'learning_rate': 1.6000000000000003e-05, 'epoch': 0.0}
  0%|          | 4/3449 [00:12<2:51:10,  2.98s/it]  0%|          | 5/3449 [00:15<2:47:19,  2.92s/it]                                                  {'loss': 1.7788, 'learning_rate': 2e-05, 'epoch': 0.0}
  0%|          | 5/3449 [00:15<2:47:19,  2.92s/it]  0%|          | 6/3449 [00:17<2:38:35,  2.76s/it]                                                  {'loss': 1.6985, 'learning_rate': 2.4e-05, 'epoch': 0.0}
  0%|          | 6/3449 [00:17<2:38:35,  2.76s/it]  0%|          | 7/3449 [00:20<2:36:31,  2.73s/it]                                                  {'loss': 1.6358, 'learning_rate': 2.8000000000000003e-05, 'epoch': 0.0}
  0%|          | 7/3449 [00:20<2:36:31,  2.73s/it]  0%|          | 8/3449 [00:22<2:34:20,  2.69s/it]                                                  {'loss': 1.7444, 'learning_rate': 3.2000000000000005e-05, 'epoch': 0.0}
  0%|          | 8/3449 [00:22<2:34:20,  2.69s/it]  0%|          | 9/3449 [00:25<2:30:53,  2.63s/it]                                                  {'loss': 1.8029, 'learning_rate': 3.6e-05, 'epoch': 0.0}
  0%|          | 9/3449 [00:25<2:30:53,  2.63s/it]  0%|          | 10/3449 [00:27<2:26:59,  2.56s/it]                                                   {'loss': 1.633, 'learning_rate': 4e-05, 'epoch': 0.0}
  0%|          | 10/3449 [00:27<2:26:59,  2.56s/it]  0%|          | 11/3449 [00:30<2:28:20,  2.59s/it]                                                   {'loss': 1.6036, 'learning_rate': 4.4000000000000006e-05, 'epoch': 0.0}
  0%|          | 11/3449 [00:30<2:28:20,  2.59s/it]  0%|          | 12/3449 [00:33<2:31:08,  2.64s/it]                                                   {'loss': 1.7389, 'learning_rate': 4.8e-05, 'epoch': 0.0}
  0%|          | 12/3449 [00:33<2:31:08,  2.64s/it]  0%|          | 13/3449 [00:35<2:31:30,  2.65s/it]                                                   {'loss': 1.5451, 'learning_rate': 5.2000000000000004e-05, 'epoch': 0.0}
  0%|          | 13/3449 [00:35<2:31:30,  2.65s/it]  0%|          | 14/3449 [00:40<3:01:25,  3.17s/it]                                                   {'loss': 1.5136, 'learning_rate': 5.6000000000000006e-05, 'epoch': 0.0}
  0%|          | 14/3449 [00:40<3:01:25,  3.17s/it]  0%|          | 15/3449 [00:44<3:18:02,  3.46s/it]                                                   {'loss': 1.4915, 'learning_rate': 6e-05, 'epoch': 0.0}
  0%|          | 15/3449 [00:44<3:18:02,  3.46s/it]  0%|          | 16/3449 [00:46<3:04:26,  3.22s/it]                                                   {'loss': 1.5161, 'learning_rate': 6.400000000000001e-05, 'epoch': 0.0}
  0%|          | 16/3449 [00:46<3:04:26,  3.22s/it]  0%|          | 17/3449 [00:49<2:53:55,  3.04s/it]                                                   {'loss': 1.5376, 'learning_rate': 6.800000000000001e-05, 'epoch': 0.0}
  0%|          | 17/3449 [00:49<2:53:55,  3.04s/it]  1%|          | 18/3449 [00:52<2:50:47,  2.99s/it]                                                   {'loss': 1.5323, 'learning_rate': 7.2e-05, 'epoch': 0.01}
  1%|          | 18/3449 [00:52<2:50:47,  2.99s/it]  1%|          | 19/3449 [00:55<2:52:53,  3.02s/it]                                                   {'loss': 1.5795, 'learning_rate': 7.6e-05, 'epoch': 0.01}
  1%|          | 19/3449 [00:55<2:52:53,  3.02s/it]  1%|          | 20/3449 [00:58<2:45:52,  2.90s/it]                                                   {'loss': 1.5304, 'learning_rate': 8e-05, 'epoch': 0.01}
  1%|          | 20/3449 [00:58<2:45:52,  2.90s/it]  1%|          | 21/3449 [01:00<2:39:44,  2.80s/it]                                                   {'loss': 1.736, 'learning_rate': 8.4e-05, 'epoch': 0.01}
  1%|          | 21/3449 [01:00<2:39:44,  2.80s/it]  1%|          | 22/3449 [01:03<2:42:20,  2.84s/it]                                                   {'loss': 1.4172, 'learning_rate': 8.800000000000001e-05, 'epoch': 0.01}
  1%|          | 22/3449 [01:03<2:42:20,  2.84s/it]  1%|          | 23/3449 [01:06<2:42:24,  2.84s/it]                                                   {'loss': 1.4842, 'learning_rate': 9.200000000000001e-05, 'epoch': 0.01}
  1%|          | 23/3449 [01:06<2:42:24,  2.84s/it]  1%|          | 24/3449 [01:09<2:40:59,  2.82s/it]                                                   {'loss': 1.5846, 'learning_rate': 9.6e-05, 'epoch': 0.01}
  1%|          | 24/3449 [01:09<2:40:59,  2.82s/it]  1%|          | 25/3449 [01:11<2:35:50,  2.73s/it]                                                   {'loss': 1.419, 'learning_rate': 0.0001, 'epoch': 0.01}
  1%|          | 25/3449 [01:11<2:35:50,  2.73s/it]  1%|          | 26/3449 [01:14<2:29:28,  2.62s/it]                                                   {'loss': 1.5319, 'learning_rate': 0.00010400000000000001, 'epoch': 0.01}
  1%|          | 26/3449 [01:14<2:29:28,  2.62s/it]  1%|          | 27/3449 [01:17<2:38:44,  2.78s/it]                                                   {'loss': 1.5199, 'learning_rate': 0.00010800000000000001, 'epoch': 0.01}
  1%|          | 27/3449 [01:17<2:38:44,  2.78s/it]  1%|          | 28/3449 [01:20<2:46:10,  2.91s/it]                                                   {'loss': 1.5843, 'learning_rate': 0.00011200000000000001, 'epoch': 0.01}
  1%|          | 28/3449 [01:20<2:46:10,  2.91s/it]  1%|          | 29/3449 [01:23<2:50:18,  2.99s/it]                                                   {'loss': 1.3958, 'learning_rate': 0.000116, 'epoch': 0.01}
  1%|          | 29/3449 [01:23<2:50:18,  2.99s/it]  1%|          | 30/3449 [01:26<2:50:59,  3.00s/it]                                                   {'loss': 1.3748, 'learning_rate': 0.00012, 'epoch': 0.01}
  1%|          | 30/3449 [01:26<2:50:59,  3.00s/it]  1%|          | 31/3449 [01:29<2:52:56,  3.04s/it]                                                   {'loss': 1.5378, 'learning_rate': 0.000124, 'epoch': 0.01}
  1%|          | 31/3449 [01:29<2:52:56,  3.04s/it]  1%|          | 32/3449 [01:36<3:56:07,  4.15s/it]                                                   {'loss': 1.5137, 'learning_rate': 0.00012800000000000002, 'epoch': 0.01}
  1%|          | 32/3449 [01:36<3:56:07,  4.15s/it]  1%|          | 33/3449 [01:39<3:32:07,  3.73s/it]                                                   {'loss': 1.5762, 'learning_rate': 0.000132, 'epoch': 0.01}
  1%|          | 33/3449 [01:39<3:32:07,  3.73s/it]  1%|          | 34/3449 [01:41<3:10:35,  3.35s/it]                                                   {'loss': 1.4164, 'learning_rate': 0.00013600000000000003, 'epoch': 0.01}
  1%|          | 34/3449 [01:41<3:10:35,  3.35s/it]  1%|          | 35/3449 [01:44<2:55:36,  3.09s/it]                                                   {'loss': 1.5456, 'learning_rate': 0.00014, 'epoch': 0.01}
  1%|          | 35/3449 [01:44<2:55:36,  3.09s/it]  1%|          | 36/3449 [01:47<2:51:49,  3.02s/it]                                                   {'loss': 1.4421, 'learning_rate': 0.000144, 'epoch': 0.01}
  1%|          | 36/3449 [01:47<2:51:49,  3.02s/it]  1%|          | 37/3449 [01:49<2:48:05,  2.96s/it]                                                   {'loss': 1.341, 'learning_rate': 0.000148, 'epoch': 0.01}
  1%|          | 37/3449 [01:49<2:48:05,  2.96s/it]  1%|          | 38/3449 [01:52<2:43:45,  2.88s/it]                                                   {'loss': 1.4324, 'learning_rate': 0.000152, 'epoch': 0.01}
  1%|          | 38/3449 [01:52<2:43:45,  2.88s/it]  1%|          | 39/3449 [01:55<2:45:18,  2.91s/it]                                                   {'loss': 1.5214, 'learning_rate': 0.00015600000000000002, 'epoch': 0.01}
  1%|          | 39/3449 [01:55<2:45:18,  2.91s/it]  1%|          | 40/3449 [01:59<2:59:51,  3.17s/it]                                                   {'loss': 1.2637, 'learning_rate': 0.00016, 'epoch': 0.01}
  1%|          | 40/3449 [01:59<2:59:51,  3.17s/it]  1%|          | 41/3449 [02:02<2:57:37,  3.13s/it]                                                   {'loss': 1.5638, 'learning_rate': 0.000164, 'epoch': 0.01}
  1%|          | 41/3449 [02:02<2:57:37,  3.13s/it]  1%|          | 42/3449 [02:04<2:45:08,  2.91s/it]                                                   {'loss': 1.3309, 'learning_rate': 0.000168, 'epoch': 0.01}
  1%|          | 42/3449 [02:04<2:45:08,  2.91s/it]  1%|          | 43/3449 [02:07<2:38:55,  2.80s/it]                                                   {'loss': 1.3436, 'learning_rate': 0.000172, 'epoch': 0.01}
  1%|          | 43/3449 [02:07<2:38:55,  2.80s/it]  1%|▏         | 44/3449 [02:09<2:28:07,  2.61s/it]                                                   {'loss': 1.5341, 'learning_rate': 0.00017600000000000002, 'epoch': 0.01}
  1%|▏         | 44/3449 [02:09<2:28:07,  2.61s/it]  1%|▏         | 45/3449 [02:12<2:30:23,  2.65s/it]                                                   {'loss': 1.3339, 'learning_rate': 0.00018, 'epoch': 0.01}
  1%|▏         | 45/3449 [02:12<2:30:23,  2.65s/it]  1%|▏         | 46/3449 [02:15<2:37:07,  2.77s/it]                                                   {'loss': 1.3667, 'learning_rate': 0.00018400000000000003, 'epoch': 0.01}
  1%|▏         | 46/3449 [02:15<2:37:07,  2.77s/it]  1%|▏         | 47/3449 [02:18<2:36:27,  2.76s/it]                                                   {'loss': 1.3897, 'learning_rate': 0.000188, 'epoch': 0.01}
  1%|▏         | 47/3449 [02:18<2:36:27,  2.76s/it]  1%|▏         | 48/3449 [02:21<2:43:40,  2.89s/it]                                                   {'loss': 1.3349, 'learning_rate': 0.000192, 'epoch': 0.01}
  1%|▏         | 48/3449 [02:21<2:43:40,  2.89s/it]  1%|▏         | 49/3449 [02:23<2:35:08,  2.74s/it]                                                   {'loss': 1.4463, 'learning_rate': 0.000196, 'epoch': 0.01}
  1%|▏         | 49/3449 [02:23<2:35:08,  2.74s/it]  1%|▏         | 50/3449 [02:27<2:50:10,  3.00s/it]                                                   {'loss': 1.3309, 'learning_rate': 0.0002, 'epoch': 0.01}
  1%|▏         | 50/3449 [02:27<2:50:10,  3.00s/it]  1%|▏         | 51/3449 [02:31<3:14:50,  3.44s/it]                                                   {'loss': 1.4589, 'learning_rate': 0.00020400000000000003, 'epoch': 0.01}
  1%|▏         | 51/3449 [02:31<3:14:50,  3.44s/it]  2%|▏         | 52/3449 [02:34<2:55:21,  3.10s/it]                                                   {'loss': 1.421, 'learning_rate': 0.00020800000000000001, 'epoch': 0.02}
  2%|▏         | 52/3449 [02:34<2:55:21,  3.10s/it]  2%|▏         | 53/3449 [02:37<2:57:04,  3.13s/it]                                                   {'loss': 1.399, 'learning_rate': 0.00021200000000000003, 'epoch': 0.02}
  2%|▏         | 53/3449 [02:37<2:57:04,  3.13s/it]  2%|▏         | 54/3449 [02:39<2:50:35,  3.01s/it]                                                   {'loss': 1.3131, 'learning_rate': 0.00021600000000000002, 'epoch': 0.02}
  2%|▏         | 54/3449 [02:39<2:50:35,  3.01s/it]  2%|▏         | 55/3449 [02:42<2:47:49,  2.97s/it]                                                   {'loss': 1.2907, 'learning_rate': 0.00022000000000000003, 'epoch': 0.02}
  2%|▏         | 55/3449 [02:42<2:47:49,  2.97s/it]  2%|▏         | 56/3449 [02:45<2:39:47,  2.83s/it]                                                   {'loss': 1.443, 'learning_rate': 0.00022400000000000002, 'epoch': 0.02}
  2%|▏         | 56/3449 [02:45<2:39:47,  2.83s/it]  2%|▏         | 57/3449 [02:48<2:40:03,  2.83s/it]                                                   {'loss': 1.5236, 'learning_rate': 0.00022799999999999999, 'epoch': 0.02}
  2%|▏         | 57/3449 [02:48<2:40:03,  2.83s/it]  2%|▏         | 58/3449 [02:51<2:42:48,  2.88s/it]                                                   {'loss': 1.3018, 'learning_rate': 0.000232, 'epoch': 0.02}
  2%|▏         | 58/3449 [02:51<2:42:48,  2.88s/it]  2%|▏         | 59/3449 [02:54<2:42:33,  2.88s/it]                                                   {'loss': 1.4164, 'learning_rate': 0.000236, 'epoch': 0.02}
  2%|▏         | 59/3449 [02:54<2:42:33,  2.88s/it]  2%|▏         | 60/3449 [02:56<2:38:49,  2.81s/it]                                                   {'loss': 1.3918, 'learning_rate': 0.00024, 'epoch': 0.02}
  2%|▏         | 60/3449 [02:56<2:38:49,  2.81s/it]  2%|▏         | 61/3449 [02:59<2:34:54,  2.74s/it]                                                   {'loss': 1.5658, 'learning_rate': 0.000244, 'epoch': 0.02}
  2%|▏         | 61/3449 [02:59<2:34:54,  2.74s/it]  2%|▏         | 62/3449 [03:01<2:29:25,  2.65s/it]                                                   {'loss': 1.3968, 'learning_rate': 0.000248, 'epoch': 0.02}
  2%|▏         | 62/3449 [03:01<2:29:25,  2.65s/it]  2%|▏         | 63/3449 [03:04<2:31:50,  2.69s/it]                                                   {'loss': 1.4089, 'learning_rate': 0.000252, 'epoch': 0.02}
  2%|▏         | 63/3449 [03:04<2:31:50,  2.69s/it]  2%|▏         | 64/3449 [03:06<2:25:27,  2.58s/it]                                                   {'loss': 1.3224, 'learning_rate': 0.00025600000000000004, 'epoch': 0.02}
  2%|▏         | 64/3449 [03:06<2:25:27,  2.58s/it]  2%|▏         | 65/3449 [03:10<2:42:36,  2.88s/it]                                                   {'loss': 1.5052, 'learning_rate': 0.00026000000000000003, 'epoch': 0.02}
  2%|▏         | 65/3449 [03:10<2:42:36,  2.88s/it]  2%|▏         | 66/3449 [03:13<2:39:13,  2.82s/it]                                                   {'loss': 1.4618, 'learning_rate': 0.000264, 'epoch': 0.02}
  2%|▏         | 66/3449 [03:13<2:39:13,  2.82s/it]  2%|▏         | 67/3449 [03:15<2:33:02,  2.72s/it]                                                   {'loss': 1.405, 'learning_rate': 0.000268, 'epoch': 0.02}
  2%|▏         | 67/3449 [03:15<2:33:02,  2.72s/it]  2%|▏         | 68/3449 [03:18<2:29:16,  2.65s/it]                                                   {'loss': 1.3175, 'learning_rate': 0.00027200000000000005, 'epoch': 0.02}
  2%|▏         | 68/3449 [03:18<2:29:16,  2.65s/it]  2%|▏         | 69/3449 [03:20<2:28:12,  2.63s/it]                                                   {'loss': 1.2401, 'learning_rate': 0.000276, 'epoch': 0.02}
  2%|▏         | 69/3449 [03:20<2:28:12,  2.63s/it]  2%|▏         | 70/3449 [03:23<2:28:41,  2.64s/it]                                                   {'loss': 1.3094, 'learning_rate': 0.00028, 'epoch': 0.02}
  2%|▏         | 70/3449 [03:23<2:28:41,  2.64s/it]  2%|▏         | 71/3449 [03:26<2:34:54,  2.75s/it]                                                   {'loss': 1.2717, 'learning_rate': 0.000284, 'epoch': 0.02}
  2%|▏         | 71/3449 [03:26<2:34:54,  2.75s/it]  2%|▏         | 72/3449 [03:28<2:32:24,  2.71s/it]                                                   {'loss': 1.2567, 'learning_rate': 0.000288, 'epoch': 0.02}
  2%|▏         | 72/3449 [03:28<2:32:24,  2.71s/it]  2%|▏         | 73/3449 [03:32<2:39:01,  2.83s/it]                                                   {'loss': 1.4094, 'learning_rate': 0.000292, 'epoch': 0.02}
  2%|▏         | 73/3449 [03:32<2:39:01,  2.83s/it]  2%|▏         | 74/3449 [03:35<2:43:27,  2.91s/it]                                                   {'loss': 1.3668, 'learning_rate': 0.000296, 'epoch': 0.02}
  2%|▏         | 74/3449 [03:35<2:43:27,  2.91s/it]  2%|▏         | 75/3449 [03:37<2:40:25,  2.85s/it]                                                   {'loss': 1.2809, 'learning_rate': 0.00030000000000000003, 'epoch': 0.02}
  2%|▏         | 75/3449 [03:37<2:40:25,  2.85s/it]  2%|▏         | 76/3449 [03:40<2:30:11,  2.67s/it]                                                   {'loss': 1.6195, 'learning_rate': 0.000304, 'epoch': 0.02}
  2%|▏         | 76/3449 [03:40<2:30:11,  2.67s/it]  2%|▏         | 77/3449 [03:43<2:35:01,  2.76s/it]                                                   {'loss': 1.5164, 'learning_rate': 0.000308, 'epoch': 0.02}
  2%|▏         | 77/3449 [03:43<2:35:01,  2.76s/it]  2%|▏         | 78/3449 [03:45<2:30:33,  2.68s/it]                                                   {'loss': 1.3275, 'learning_rate': 0.00031200000000000005, 'epoch': 0.02}
  2%|▏         | 78/3449 [03:45<2:30:33,  2.68s/it]  2%|▏         | 79/3449 [03:49<2:43:51,  2.92s/it]                                                   {'loss': 1.3314, 'learning_rate': 0.00031600000000000004, 'epoch': 0.02}
  2%|▏         | 79/3449 [03:49<2:43:51,  2.92s/it]  2%|▏         | 80/3449 [03:51<2:41:01,  2.87s/it]                                                   {'loss': 1.4825, 'learning_rate': 0.00032, 'epoch': 0.02}
  2%|▏         | 80/3449 [03:51<2:41:01,  2.87s/it]  2%|▏         | 81/3449 [03:54<2:36:46,  2.79s/it]                                                   {'loss': 1.4019, 'learning_rate': 0.000324, 'epoch': 0.02}
  2%|▏         | 81/3449 [03:54<2:36:46,  2.79s/it]  2%|▏         | 82/3449 [03:58<2:58:27,  3.18s/it]                                                   {'loss': 1.3452, 'learning_rate': 0.000328, 'epoch': 0.02}
  2%|▏         | 82/3449 [03:58<2:58:27,  3.18s/it]  2%|▏         | 83/3449 [04:01<2:52:39,  3.08s/it]                                                   {'loss': 1.279, 'learning_rate': 0.000332, 'epoch': 0.02}
  2%|▏         | 83/3449 [04:01<2:52:39,  3.08s/it]  2%|▏         | 84/3449 [04:03<2:45:15,  2.95s/it]                                                   {'loss': 1.4439, 'learning_rate': 0.000336, 'epoch': 0.02}
  2%|▏         | 84/3449 [04:03<2:45:15,  2.95s/it]  2%|▏         | 85/3449 [04:06<2:40:48,  2.87s/it]                                                   {'loss': 1.3839, 'learning_rate': 0.00034, 'epoch': 0.02}
  2%|▏         | 85/3449 [04:06<2:40:48,  2.87s/it]  2%|▏         | 86/3449 [04:09<2:43:13,  2.91s/it]                                                   {'loss': 1.2913, 'learning_rate': 0.000344, 'epoch': 0.02}
  2%|▏         | 86/3449 [04:09<2:43:13,  2.91s/it]  3%|▎         | 87/3449 [04:12<2:43:37,  2.92s/it]                                                   {'loss': 1.3672, 'learning_rate': 0.000348, 'epoch': 0.03}
  3%|▎         | 87/3449 [04:12<2:43:37,  2.92s/it]  3%|▎         | 88/3449 [04:15<2:49:01,  3.02s/it]                                                   {'loss': 1.4193, 'learning_rate': 0.00035200000000000005, 'epoch': 0.03}
  3%|▎         | 88/3449 [04:15<2:49:01,  3.02s/it]  3%|▎         | 89/3449 [04:18<2:49:19,  3.02s/it]                                                   {'loss': 1.4455, 'learning_rate': 0.00035600000000000003, 'epoch': 0.03}
  3%|▎         | 89/3449 [04:18<2:49:19,  3.02s/it]  3%|▎         | 90/3449 [04:21<2:49:49,  3.03s/it]                                                   {'loss': 1.2722, 'learning_rate': 0.00036, 'epoch': 0.03}
  3%|▎         | 90/3449 [04:21<2:49:49,  3.03s/it]  3%|▎         | 91/3449 [04:24<2:36:27,  2.80s/it]                                                   {'loss': 1.5172, 'learning_rate': 0.000364, 'epoch': 0.03}
  3%|▎         | 91/3449 [04:24<2:36:27,  2.80s/it]  3%|▎         | 92/3449 [04:26<2:30:21,  2.69s/it]                                                   {'loss': 1.4723, 'learning_rate': 0.00036800000000000005, 'epoch': 0.03}
  3%|▎         | 92/3449 [04:26<2:30:21,  2.69s/it]  3%|▎         | 93/3449 [04:29<2:31:27,  2.71s/it]                                                   {'loss': 1.2708, 'learning_rate': 0.00037200000000000004, 'epoch': 0.03}
  3%|▎         | 93/3449 [04:29<2:31:27,  2.71s/it]  3%|▎         | 94/3449 [04:32<2:31:44,  2.71s/it]                                                   {'loss': 1.4163, 'learning_rate': 0.000376, 'epoch': 0.03}
  3%|▎         | 94/3449 [04:32<2:31:44,  2.71s/it]  3%|▎         | 95/3449 [04:35<2:39:10,  2.85s/it]                                                   {'loss': 1.4054, 'learning_rate': 0.00038, 'epoch': 0.03}
  3%|▎         | 95/3449 [04:35<2:39:10,  2.85s/it]  3%|▎         | 96/3449 [04:38<2:40:19,  2.87s/it]                                                   {'loss': 1.3794, 'learning_rate': 0.000384, 'epoch': 0.03}
  3%|▎         | 96/3449 [04:38<2:40:19,  2.87s/it]  3%|▎         | 97/3449 [04:40<2:35:54,  2.79s/it]                                                   {'loss': 1.3473, 'learning_rate': 0.000388, 'epoch': 0.03}
  3%|▎         | 97/3449 [04:40<2:35:54,  2.79s/it]  3%|▎         | 98/3449 [04:43<2:35:51,  2.79s/it]                                                   {'loss': 1.5271, 'learning_rate': 0.000392, 'epoch': 0.03}
  3%|▎         | 98/3449 [04:43<2:35:51,  2.79s/it]  3%|▎         | 99/3449 [04:45<2:28:31,  2.66s/it]                                                   {'loss': 1.4365, 'learning_rate': 0.00039600000000000003, 'epoch': 0.03}
  3%|▎         | 99/3449 [04:45<2:28:31,  2.66s/it]  3%|▎         | 100/3449 [04:48<2:30:54,  2.70s/it]                                                    {'loss': 1.5053, 'learning_rate': 0.0004, 'epoch': 0.03}
  3%|▎         | 100/3449 [04:48<2:30:54,  2.70s/it]  3%|▎         | 101/3449 [04:51<2:26:58,  2.63s/it]                                                    {'loss': 1.3237, 'learning_rate': 0.0003999999120026855, 'epoch': 0.03}
  3%|▎         | 101/3449 [04:51<2:26:58,  2.63s/it]  3%|▎         | 102/3449 [04:53<2:24:38,  2.59s/it]                                                    {'loss': 1.5015, 'learning_rate': 0.00039999964801081954, 'epoch': 0.03}
  3%|▎         | 102/3449 [04:53<2:24:38,  2.59s/it]  3%|▎         | 103/3449 [04:57<2:39:33,  2.86s/it]                                                    {'loss': 1.2449, 'learning_rate': 0.0003999992080246343, 'epoch': 0.03}
  3%|▎         | 103/3449 [04:57<2:39:33,  2.86s/it]  3%|▎         | 104/3449 [04:59<2:37:33,  2.83s/it]                                                    {'loss': 1.4435, 'learning_rate': 0.0003999985920445171, 'epoch': 0.03}
  3%|▎         | 104/3449 [04:59<2:37:33,  2.83s/it]  3%|▎         | 105/3449 [05:02<2:31:46,  2.72s/it]                                                    {'loss': 1.4326, 'learning_rate': 0.0003999978000710098, 'epoch': 0.03}
  3%|▎         | 105/3449 [05:02<2:31:46,  2.72s/it]  3%|▎         | 106/3449 [05:04<2:29:17,  2.68s/it]                                                    {'loss': 1.4118, 'learning_rate': 0.0003999968321048095, 'epoch': 0.03}
  3%|▎         | 106/3449 [05:04<2:29:17,  2.68s/it]  3%|▎         | 107/3449 [05:07<2:22:46,  2.56s/it]                                                    {'loss': 1.4152, 'learning_rate': 0.0003999956881467678, 'epoch': 0.03}
  3%|▎         | 107/3449 [05:07<2:22:46,  2.56s/it]  3%|▎         | 108/3449 [05:09<2:20:03,  2.52s/it]                                                    {'loss': 1.3995, 'learning_rate': 0.00039999436819789153, 'epoch': 0.03}
  3%|▎         | 108/3449 [05:09<2:20:03,  2.52s/it]  3%|▎         | 109/3449 [05:12<2:24:11,  2.59s/it]                                                    {'loss': 1.3273, 'learning_rate': 0.0003999928722593421, 'epoch': 0.03}
  3%|▎         | 109/3449 [05:12<2:24:11,  2.59s/it]  3%|▎         | 110/3449 [05:15<2:29:16,  2.68s/it]                                                    {'loss': 1.2412, 'learning_rate': 0.000399991200332436, 'epoch': 0.03}
  3%|▎         | 110/3449 [05:15<2:29:16,  2.68s/it]  3%|▎         | 111/3449 [05:17<2:28:40,  2.67s/it]                                                    {'loss': 1.404, 'learning_rate': 0.0003999893524186444, 'epoch': 0.03}
  3%|▎         | 111/3449 [05:17<2:28:40,  2.67s/it]  3%|▎         | 112/3449 [05:21<2:36:17,  2.81s/it]                                                    {'loss': 1.4241, 'learning_rate': 0.0003999873285195934, 'epoch': 0.03}
  3%|▎         | 112/3449 [05:21<2:36:17,  2.81s/it]  3%|▎         | 113/3449 [05:23<2:27:14,  2.65s/it]                                                    {'loss': 1.3263, 'learning_rate': 0.000399985128637064, 'epoch': 0.03}
  3%|▎         | 113/3449 [05:23<2:27:14,  2.65s/it]  3%|▎         | 114/3449 [05:26<2:36:36,  2.82s/it]                                                    {'loss': 1.4066, 'learning_rate': 0.000399982752772992, 'epoch': 0.03}
  3%|▎         | 114/3449 [05:26<2:36:36,  2.82s/it]  3%|▎         | 115/3449 [05:28<2:27:49,  2.66s/it]                                                    {'loss': 1.4737, 'learning_rate': 0.00039998020092946824, 'epoch': 0.03}
  3%|▎         | 115/3449 [05:28<2:27:49,  2.66s/it]  3%|▎         | 116/3449 [05:31<2:24:21,  2.60s/it]                                                    {'loss': 1.3736, 'learning_rate': 0.0003999774731087381, 'epoch': 0.03}
  3%|▎         | 116/3449 [05:31<2:24:21,  2.60s/it]  3%|▎         | 117/3449 [05:34<2:33:07,  2.76s/it]                                                    {'loss': 1.3962, 'learning_rate': 0.0003999745693132021, 'epoch': 0.03}
  3%|▎         | 117/3449 [05:34<2:33:07,  2.76s/it]  3%|▎         | 118/3449 [05:37<2:42:21,  2.92s/it]                                                    {'loss': 1.4497, 'learning_rate': 0.00039997148954541543, 'epoch': 0.03}
  3%|▎         | 118/3449 [05:37<2:42:21,  2.92s/it]  3%|▎         | 119/3449 [05:40<2:38:45,  2.86s/it]                                                    {'loss': 1.3684, 'learning_rate': 0.00039996823380808824, 'epoch': 0.03}
  3%|▎         | 119/3449 [05:40<2:38:45,  2.86s/it]  3%|▎         | 120/3449 [05:43<2:36:03,  2.81s/it]                                                    {'loss': 1.396, 'learning_rate': 0.0003999648021040855, 'epoch': 0.03}
  3%|▎         | 120/3449 [05:43<2:36:03,  2.81s/it]  4%|▎         | 121/3449 [05:45<2:30:04,  2.71s/it]                                                    {'loss': 1.4098, 'learning_rate': 0.000399961194436427, 'epoch': 0.04}
  4%|▎         | 121/3449 [05:45<2:30:04,  2.71s/it]  4%|▎         | 122/3449 [05:48<2:27:00,  2.65s/it]                                                    {'loss': 1.4442, 'learning_rate': 0.00039995741080828734, 'epoch': 0.04}
  4%|▎         | 122/3449 [05:48<2:27:00,  2.65s/it]  4%|▎         | 123/3449 [05:51<2:32:27,  2.75s/it]                                                    {'loss': 1.3268, 'learning_rate': 0.0003999534512229961, 'epoch': 0.04}
  4%|▎         | 123/3449 [05:51<2:32:27,  2.75s/it]  4%|▎         | 124/3449 [05:53<2:24:37,  2.61s/it]                                                    {'loss': 1.4533, 'learning_rate': 0.00039994931568403764, 'epoch': 0.04}
  4%|▎         | 124/3449 [05:53<2:24:37,  2.61s/it]  4%|▎         | 125/3449 [05:56<2:26:05,  2.64s/it]                                                    {'loss': 1.2902, 'learning_rate': 0.000399945004195051, 'epoch': 0.04}
  4%|▎         | 125/3449 [05:56<2:26:05,  2.64s/it]  4%|▎         | 126/3449 [05:59<2:31:11,  2.73s/it]                                                    {'loss': 1.3231, 'learning_rate': 0.0003999405167598303, 'epoch': 0.04}
  4%|▎         | 126/3449 [05:59<2:31:11,  2.73s/it]  4%|▎         | 127/3449 [06:01<2:33:58,  2.78s/it]                                                    {'loss': 1.4404, 'learning_rate': 0.0003999358533823242, 'epoch': 0.04}
  4%|▎         | 127/3449 [06:01<2:33:58,  2.78s/it]  4%|▎         | 128/3449 [06:05<2:51:03,  3.09s/it]                                                    {'loss': 1.5074, 'learning_rate': 0.0003999310140666365, 'epoch': 0.04}
  4%|▎         | 128/3449 [06:05<2:51:03,  3.09s/it]  4%|▎         | 129/3449 [06:08<2:42:31,  2.94s/it]                                                    {'loss': 1.5619, 'learning_rate': 0.00039992599881702554, 'epoch': 0.04}
  4%|▎         | 129/3449 [06:08<2:42:31,  2.94s/it]  4%|▍         | 130/3449 [06:11<2:38:45,  2.87s/it]                                                    {'loss': 1.4426, 'learning_rate': 0.00039992080763790475, 'epoch': 0.04}
  4%|▍         | 130/3449 [06:11<2:38:45,  2.87s/it]  4%|▍         | 131/3449 [06:13<2:38:02,  2.86s/it]                                                    {'loss': 1.2351, 'learning_rate': 0.00039991544053384213, 'epoch': 0.04}
  4%|▍         | 131/3449 [06:13<2:38:02,  2.86s/it]  4%|▍         | 132/3449 [06:16<2:38:31,  2.87s/it]                                                    {'loss': 1.3252, 'learning_rate': 0.00039990989750956064, 'epoch': 0.04}
  4%|▍         | 132/3449 [06:16<2:38:31,  2.87s/it]  4%|▍         | 133/3449 [06:19<2:43:19,  2.96s/it]                                                    {'loss': 1.4116, 'learning_rate': 0.00039990417856993794, 'epoch': 0.04}
  4%|▍         | 133/3449 [06:19<2:43:19,  2.96s/it]  4%|▍         | 134/3449 [06:23<2:52:45,  3.13s/it]                                                    {'loss': 1.3452, 'learning_rate': 0.00039989828372000657, 'epoch': 0.04}
  4%|▍         | 134/3449 [06:23<2:52:45,  3.13s/it]  4%|▍         | 135/3449 [06:26<2:44:04,  2.97s/it]                                                    {'loss': 1.3856, 'learning_rate': 0.0003998922129649538, 'epoch': 0.04}
  4%|▍         | 135/3449 [06:26<2:44:04,  2.97s/it]  4%|▍         | 136/3449 [06:28<2:32:37,  2.76s/it]                                                    {'loss': 1.3277, 'learning_rate': 0.0003998859663101218, 'epoch': 0.04}
  4%|▍         | 136/3449 [06:28<2:32:37,  2.76s/it]  4%|▍         | 137/3449 [06:31<2:31:06,  2.74s/it]                                                    {'loss': 1.4707, 'learning_rate': 0.0003998795437610074, 'epoch': 0.04}
  4%|▍         | 137/3449 [06:31<2:31:06,  2.74s/it]  4%|▍         | 138/3449 [06:34<2:41:08,  2.92s/it]                                                    {'loss': 1.4154, 'learning_rate': 0.00039987294532326233, 'epoch': 0.04}
  4%|▍         | 138/3449 [06:34<2:41:08,  2.92s/it]  4%|▍         | 139/3449 [06:36<2:29:50,  2.72s/it]                                                    {'loss': 1.4648, 'learning_rate': 0.000399866171002693, 'epoch': 0.04}
  4%|▍         | 139/3449 [06:36<2:29:50,  2.72s/it]  4%|▍         | 140/3449 [06:38<2:23:35,  2.60s/it]                                                    {'loss': 1.3241, 'learning_rate': 0.00039985922080526065, 'epoch': 0.04}
  4%|▍         | 140/3449 [06:39<2:23:35,  2.60s/it]  4%|▍         | 141/3449 [06:41<2:25:42,  2.64s/it]                                                    {'loss': 1.3787, 'learning_rate': 0.0003998520947370812, 'epoch': 0.04}
  4%|▍         | 141/3449 [06:41<2:25:42,  2.64s/it]  4%|▍         | 142/3449 [06:44<2:22:12,  2.58s/it]                                                    {'loss': 1.1477, 'learning_rate': 0.0003998447928044255, 'epoch': 0.04}
  4%|▍         | 142/3449 [06:44<2:22:12,  2.58s/it]  4%|▍         | 143/3449 [06:46<2:26:05,  2.65s/it]                                                    {'loss': 1.4423, 'learning_rate': 0.000399837315013719, 'epoch': 0.04}
  4%|▍         | 143/3449 [06:46<2:26:05,  2.65s/it]  4%|▍         | 144/3449 [06:49<2:29:01,  2.71s/it]                                                    {'loss': 1.4003, 'learning_rate': 0.00039982966137154193, 'epoch': 0.04}
  4%|▍         | 144/3449 [06:49<2:29:01,  2.71s/it]  4%|▍         | 145/3449 [06:52<2:23:52,  2.61s/it]                                                    {'loss': 1.3892, 'learning_rate': 0.0003998218318846293, 'epoch': 0.04}
  4%|▍         | 145/3449 [06:52<2:23:52,  2.61s/it]  4%|▍         | 146/3449 [06:55<2:40:01,  2.91s/it]                                                    {'loss': 1.4127, 'learning_rate': 0.00039981382655987095, 'epoch': 0.04}
  4%|▍         | 146/3449 [06:55<2:40:01,  2.91s/it]  4%|▍         | 147/3449 [06:58<2:37:40,  2.86s/it]                                                    {'loss': 1.4172, 'learning_rate': 0.00039980564540431125, 'epoch': 0.04}
  4%|▍         | 147/3449 [06:58<2:37:40,  2.86s/it]  4%|▍         | 148/3449 [07:01<2:40:26,  2.92s/it]                                                    {'loss': 1.3198, 'learning_rate': 0.00039979728842514935, 'epoch': 0.04}
  4%|▍         | 148/3449 [07:01<2:40:26,  2.92s/it]  4%|▍         | 149/3449 [07:04<2:34:55,  2.82s/it]                                                    {'loss': 1.3332, 'learning_rate': 0.00039978875562973927, 'epoch': 0.04}
  4%|▍         | 149/3449 [07:04<2:34:55,  2.82s/it]  4%|▍         | 150/3449 [07:06<2:31:30,  2.76s/it]                                                    {'loss': 1.4563, 'learning_rate': 0.00039978004702558966, 'epoch': 0.04}
  4%|▍         | 150/3449 [07:06<2:31:30,  2.76s/it]  4%|▍         | 151/3449 [07:09<2:31:30,  2.76s/it]                                                    {'loss': 1.4628, 'learning_rate': 0.0003997711626203637, 'epoch': 0.04}
  4%|▍         | 151/3449 [07:09<2:31:30,  2.76s/it]  4%|▍         | 152/3449 [07:12<2:32:16,  2.77s/it]                                                    {'loss': 1.358, 'learning_rate': 0.00039976210242187964, 'epoch': 0.04}
  4%|▍         | 152/3449 [07:12<2:32:16,  2.77s/it]  4%|▍         | 153/3449 [07:15<2:33:10,  2.79s/it]                                                    {'loss': 1.2227, 'learning_rate': 0.00039975286643811, 'epoch': 0.04}
  4%|▍         | 153/3449 [07:15<2:33:10,  2.79s/it]  4%|▍         | 154/3449 [07:17<2:26:37,  2.67s/it]                                                    {'loss': 1.4093, 'learning_rate': 0.0003997434546771824, 'epoch': 0.04}
  4%|▍         | 154/3449 [07:17<2:26:37,  2.67s/it]  4%|▍         | 155/3449 [07:20<2:24:31,  2.63s/it]                                                    {'loss': 1.3938, 'learning_rate': 0.0003997338671473787, 'epoch': 0.04}
  4%|▍         | 155/3449 [07:20<2:24:31,  2.63s/it]  5%|▍         | 156/3449 [07:22<2:23:14,  2.61s/it]                                                    {'loss': 1.2654, 'learning_rate': 0.0003997241038571359, 'epoch': 0.05}
  5%|▍         | 156/3449 [07:22<2:23:14,  2.61s/it]  5%|▍         | 157/3449 [07:25<2:23:58,  2.62s/it]                                                    {'loss': 1.3301, 'learning_rate': 0.00039971416481504536, 'epoch': 0.05}
  5%|▍         | 157/3449 [07:25<2:23:58,  2.62s/it]  5%|▍         | 158/3449 [07:27<2:22:14,  2.59s/it]                                                    {'loss': 1.4287, 'learning_rate': 0.0003997040500298531, 'epoch': 0.05}
  5%|▍         | 158/3449 [07:27<2:22:14,  2.59s/it]  5%|▍         | 159/3449 [07:30<2:24:50,  2.64s/it]                                                    {'loss': 1.5021, 'learning_rate': 0.00039969375951045985, 'epoch': 0.05}
  5%|▍         | 159/3449 [07:30<2:24:50,  2.64s/it]  5%|▍         | 160/3449 [07:33<2:29:56,  2.74s/it]                                                    {'loss': 1.3404, 'learning_rate': 0.00039968329326592117, 'epoch': 0.05}
  5%|▍         | 160/3449 [07:33<2:29:56,  2.74s/it]  5%|▍         | 161/3449 [07:36<2:26:46,  2.68s/it]                                                    {'loss': 1.3392, 'learning_rate': 0.0003996726513054469, 'epoch': 0.05}
  5%|▍         | 161/3449 [07:36<2:26:46,  2.68s/it]  5%|▍         | 162/3449 [07:38<2:25:55,  2.66s/it]                                                    {'loss': 1.4043, 'learning_rate': 0.0003996618336384017, 'epoch': 0.05}
  5%|▍         | 162/3449 [07:38<2:25:55,  2.66s/it]  5%|▍         | 163/3449 [07:41<2:22:16,  2.60s/it]                                                    {'loss': 1.2441, 'learning_rate': 0.00039965084027430487, 'epoch': 0.05}
  5%|▍         | 163/3449 [07:41<2:22:16,  2.60s/it]  5%|▍         | 164/3449 [07:43<2:19:01,  2.54s/it]                                                    {'loss': 1.442, 'learning_rate': 0.00039963967122283033, 'epoch': 0.05}
  5%|▍         | 164/3449 [07:43<2:19:01,  2.54s/it]  5%|▍         | 165/3449 [07:46<2:27:03,  2.69s/it]                                                    {'loss': 1.3297, 'learning_rate': 0.00039962832649380635, 'epoch': 0.05}
  5%|▍         | 165/3449 [07:46<2:27:03,  2.69s/it]  5%|▍         | 166/3449 [07:49<2:25:05,  2.65s/it]                                                    {'loss': 1.3974, 'learning_rate': 0.00039961680609721626, 'epoch': 0.05}
  5%|▍         | 166/3449 [07:49<2:25:05,  2.65s/it]  5%|▍         | 167/3449 [07:51<2:22:18,  2.60s/it]                                                    {'loss': 1.4026, 'learning_rate': 0.00039960511004319746, 'epoch': 0.05}
  5%|▍         | 167/3449 [07:51<2:22:18,  2.60s/it]  5%|▍         | 168/3449 [07:54<2:27:41,  2.70s/it]                                                    {'loss': 1.4038, 'learning_rate': 0.0003995932383420423, 'epoch': 0.05}
  5%|▍         | 168/3449 [07:54<2:27:41,  2.70s/it]  5%|▍         | 169/3449 [07:57<2:31:11,  2.77s/it]                                                    {'loss': 1.2948, 'learning_rate': 0.0003995811910041975, 'epoch': 0.05}
  5%|▍         | 169/3449 [07:57<2:31:11,  2.77s/it]  5%|▍         | 170/3449 [08:00<2:37:19,  2.88s/it]                                                    {'loss': 1.504, 'learning_rate': 0.0003995689680402644, 'epoch': 0.05}
  5%|▍         | 170/3449 [08:00<2:37:19,  2.88s/it]  5%|▍         | 171/3449 [08:03<2:37:41,  2.89s/it]                                                    {'loss': 1.2047, 'learning_rate': 0.00039955656946099894, 'epoch': 0.05}
  5%|▍         | 171/3449 [08:03<2:37:41,  2.89s/it]  5%|▍         | 172/3449 [08:06<2:31:44,  2.78s/it]                                                    {'loss': 1.328, 'learning_rate': 0.0003995439952773114, 'epoch': 0.05}
  5%|▍         | 172/3449 [08:06<2:31:44,  2.78s/it]  5%|▌         | 173/3449 [08:09<2:40:35,  2.94s/it]                                                    {'loss': 1.3518, 'learning_rate': 0.0003995312455002669, 'epoch': 0.05}
  5%|▌         | 173/3449 [08:09<2:40:35,  2.94s/it]  5%|▌         | 174/3449 [08:11<2:31:47,  2.78s/it]                                                    {'loss': 1.4515, 'learning_rate': 0.0003995183201410848, 'epoch': 0.05}
  5%|▌         | 174/3449 [08:11<2:31:47,  2.78s/it]  5%|▌         | 175/3449 [08:14<2:30:49,  2.76s/it]                                                    {'loss': 1.3857, 'learning_rate': 0.000399505219211139, 'epoch': 0.05}
  5%|▌         | 175/3449 [08:14<2:30:49,  2.76s/it]  5%|▌         | 176/3449 [08:17<2:33:26,  2.81s/it]                                                    {'loss': 1.4068, 'learning_rate': 0.0003994919427219581, 'epoch': 0.05}
  5%|▌         | 176/3449 [08:17<2:33:26,  2.81s/it]  5%|▌         | 177/3449 [08:20<2:36:30,  2.87s/it]                                                    {'loss': 1.2225, 'learning_rate': 0.000399478490685225, 'epoch': 0.05}
  5%|▌         | 177/3449 [08:20<2:36:30,  2.87s/it]  5%|▌         | 178/3449 [08:23<2:36:33,  2.87s/it]                                                    {'loss': 1.3794, 'learning_rate': 0.0003994648631127772, 'epoch': 0.05}
  5%|▌         | 178/3449 [08:23<2:36:33,  2.87s/it]  5%|▌         | 179/3449 [08:25<2:30:48,  2.77s/it]                                                    {'loss': 1.4642, 'learning_rate': 0.0003994510600166065, 'epoch': 0.05}
  5%|▌         | 179/3449 [08:25<2:30:48,  2.77s/it]  5%|▌         | 180/3449 [08:28<2:26:31,  2.69s/it]                                                    {'loss': 1.2692, 'learning_rate': 0.00039943708140885925, 'epoch': 0.05}
  5%|▌         | 180/3449 [08:28<2:26:31,  2.69s/it]  5%|▌         | 181/3449 [08:31<2:31:22,  2.78s/it]                                                    {'loss': 1.3233, 'learning_rate': 0.00039942292730183625, 'epoch': 0.05}
  5%|▌         | 181/3449 [08:31<2:31:22,  2.78s/it]  5%|▌         | 182/3449 [08:34<2:29:58,  2.75s/it]                                                    {'loss': 1.2888, 'learning_rate': 0.0003994085977079928, 'epoch': 0.05}
  5%|▌         | 182/3449 [08:34<2:29:58,  2.75s/it]  5%|▌         | 183/3449 [08:38<2:59:28,  3.30s/it]                                                    {'loss': 1.4167, 'learning_rate': 0.00039939409263993854, 'epoch': 0.05}
  5%|▌         | 183/3449 [08:38<2:59:28,  3.30s/it]  5%|▌         | 184/3449 [08:41<2:47:10,  3.07s/it]                                                    {'loss': 1.3193, 'learning_rate': 0.0003993794121104375, 'epoch': 0.05}
  5%|▌         | 184/3449 [08:41<2:47:10,  3.07s/it]  5%|▌         | 185/3449 [08:44<2:45:56,  3.05s/it]                                                    {'loss': 1.4016, 'learning_rate': 0.0003993645561324082, 'epoch': 0.05}
  5%|▌         | 185/3449 [08:44<2:45:56,  3.05s/it]  5%|▌         | 186/3449 [08:46<2:34:38,  2.84s/it]                                                    {'loss': 1.3544, 'learning_rate': 0.0003993495247189235, 'epoch': 0.05}
  5%|▌         | 186/3449 [08:46<2:34:38,  2.84s/it]  5%|▌         | 187/3449 [08:49<2:32:17,  2.80s/it]                                                    {'loss': 1.4277, 'learning_rate': 0.0003993343178832106, 'epoch': 0.05}
  5%|▌         | 187/3449 [08:49<2:32:17,  2.80s/it]  5%|▌         | 188/3449 [08:51<2:31:15,  2.78s/it]                                                    {'loss': 1.4128, 'learning_rate': 0.00039931893563865115, 'epoch': 0.05}
  5%|▌         | 188/3449 [08:51<2:31:15,  2.78s/it]  5%|▌         | 189/3449 [08:54<2:26:05,  2.69s/it]                                                    {'loss': 1.3224, 'learning_rate': 0.00039930337799878103, 'epoch': 0.05}
  5%|▌         | 189/3449 [08:54<2:26:05,  2.69s/it]  6%|▌         | 190/3449 [08:56<2:21:31,  2.61s/it]                                                    {'loss': 1.4007, 'learning_rate': 0.0003992876449772907, 'epoch': 0.06}
  6%|▌         | 190/3449 [08:56<2:21:31,  2.61s/it]  6%|▌         | 191/3449 [09:00<2:32:00,  2.80s/it]                                                    {'loss': 1.2749, 'learning_rate': 0.0003992717365880246, 'epoch': 0.06}
  6%|▌         | 191/3449 [09:00<2:32:00,  2.80s/it]  6%|▌         | 192/3449 [09:03<2:33:20,  2.82s/it]                                                    {'loss': 1.3118, 'learning_rate': 0.00039925565284498185, 'epoch': 0.06}
  6%|▌         | 192/3449 [09:03<2:33:20,  2.82s/it]  6%|▌         | 193/3449 [09:06<2:44:38,  3.03s/it]                                                    {'loss': 1.2867, 'learning_rate': 0.00039923939376231563, 'epoch': 0.06}
  6%|▌         | 193/3449 [09:06<2:44:38,  3.03s/it]  6%|▌         | 194/3449 [09:09<2:36:13,  2.88s/it]                                                    {'loss': 1.3441, 'learning_rate': 0.00039922295935433346, 'epoch': 0.06}
  6%|▌         | 194/3449 [09:09<2:36:13,  2.88s/it]  6%|▌         | 195/3449 [09:11<2:35:14,  2.86s/it]                                                    {'loss': 1.3888, 'learning_rate': 0.0003992063496354973, 'epoch': 0.06}
  6%|▌         | 195/3449 [09:11<2:35:14,  2.86s/it]  6%|▌         | 196/3449 [09:14<2:30:26,  2.77s/it]                                                    {'loss': 1.405, 'learning_rate': 0.0003991895646204232, 'epoch': 0.06}
  6%|▌         | 196/3449 [09:14<2:30:26,  2.77s/it]  6%|▌         | 197/3449 [09:17<2:29:40,  2.76s/it]                                                    {'loss': 1.4234, 'learning_rate': 0.00039917260432388146, 'epoch': 0.06}
  6%|▌         | 197/3449 [09:17<2:29:40,  2.76s/it]  6%|▌         | 198/3449 [09:19<2:22:16,  2.63s/it]                                                    {'loss': 1.4004, 'learning_rate': 0.0003991554687607968, 'epoch': 0.06}
  6%|▌         | 198/3449 [09:19<2:22:16,  2.63s/it]  6%|▌         | 199/3449 [09:21<2:16:16,  2.52s/it]                                                    {'loss': 1.4156, 'learning_rate': 0.000399138157946248, 'epoch': 0.06}
  6%|▌         | 199/3449 [09:21<2:16:16,  2.52s/it]  6%|▌         | 200/3449 [09:24<2:24:52,  2.68s/it]                                                    {'loss': 1.4495, 'learning_rate': 0.000399120671895468, 'epoch': 0.06}
  6%|▌         | 200/3449 [09:24<2:24:52,  2.68s/it]  6%|▌         | 201/3449 [09:27<2:27:17,  2.72s/it]                                                    {'loss': 1.4346, 'learning_rate': 0.0003991030106238442, 'epoch': 0.06}
  6%|▌         | 201/3449 [09:27<2:27:17,  2.72s/it]  6%|▌         | 202/3449 [09:29<2:21:29,  2.61s/it]                                                    {'loss': 1.2202, 'learning_rate': 0.000399085174146918, 'epoch': 0.06}
  6%|▌         | 202/3449 [09:29<2:21:29,  2.61s/it]  6%|▌         | 203/3449 [09:32<2:22:08,  2.63s/it]                                                    {'loss': 1.473, 'learning_rate': 0.00039906716248038507, 'epoch': 0.06}
  6%|▌         | 203/3449 [09:32<2:22:08,  2.63s/it]  6%|▌         | 204/3449 [09:35<2:30:54,  2.79s/it]                                                    {'loss': 1.3089, 'learning_rate': 0.0003990489756400951, 'epoch': 0.06}
  6%|▌         | 204/3449 [09:35<2:30:54,  2.79s/it]  6%|▌         | 205/3449 [09:39<2:42:31,  3.01s/it]                                                    {'loss': 1.3049, 'learning_rate': 0.0003990306136420521, 'epoch': 0.06}
  6%|▌         | 205/3449 [09:39<2:42:31,  3.01s/it]  6%|▌         | 206/3449 [09:42<2:44:51,  3.05s/it]                                                    {'loss': 1.3764, 'learning_rate': 0.0003990120765024141, 'epoch': 0.06}
  6%|▌         | 206/3449 [09:42<2:44:51,  3.05s/it]  6%|▌         | 207/3449 [09:45<2:41:27,  2.99s/it]                                                    {'loss': 1.272, 'learning_rate': 0.0003989933642374933, 'epoch': 0.06}
  6%|▌         | 207/3449 [09:45<2:41:27,  2.99s/it]  6%|▌         | 208/3449 [09:48<2:37:15,  2.91s/it]                                                    {'loss': 1.3248, 'learning_rate': 0.0003989744768637559, 'epoch': 0.06}
  6%|▌         | 208/3449 [09:48<2:37:15,  2.91s/it]  6%|▌         | 209/3449 [09:50<2:33:02,  2.83s/it]                                                    {'loss': 1.3713, 'learning_rate': 0.0003989554143978224, 'epoch': 0.06}
  6%|▌         | 209/3449 [09:50<2:33:02,  2.83s/it]  6%|▌         | 210/3449 [09:53<2:35:25,  2.88s/it]                                                    {'loss': 1.5846, 'learning_rate': 0.0003989361768564673, 'epoch': 0.06}
  6%|▌         | 210/3449 [09:53<2:35:25,  2.88s/it]  6%|▌         | 211/3449 [09:56<2:32:19,  2.82s/it]                                                    {'loss': 1.3624, 'learning_rate': 0.000398916764256619, 'epoch': 0.06}
  6%|▌         | 211/3449 [09:56<2:32:19,  2.82s/it]  6%|▌         | 212/3449 [09:59<2:37:22,  2.92s/it]                                                    {'loss': 1.3555, 'learning_rate': 0.00039889717661536003, 'epoch': 0.06}
  6%|▌         | 212/3449 [09:59<2:37:22,  2.92s/it]  6%|▌         | 213/3449 [10:02<2:35:34,  2.88s/it]                                                    {'loss': 1.2427, 'learning_rate': 0.00039887741394992713, 'epoch': 0.06}
  6%|▌         | 213/3449 [10:02<2:35:34,  2.88s/it]  6%|▌         | 214/3449 [10:04<2:25:30,  2.70s/it]                                                    {'loss': 1.4018, 'learning_rate': 0.0003988574762777108, 'epoch': 0.06}
  6%|▌         | 214/3449 [10:04<2:25:30,  2.70s/it]  6%|▌         | 215/3449 [10:07<2:24:38,  2.68s/it]                                                    {'loss': 1.3019, 'learning_rate': 0.0003988373636162558, 'epoch': 0.06}
  6%|▌         | 215/3449 [10:07<2:24:38,  2.68s/it]  6%|▋         | 216/3449 [10:09<2:20:59,  2.62s/it]                                                    {'loss': 1.3403, 'learning_rate': 0.0003988170759832605, 'epoch': 0.06}
  6%|▋         | 216/3449 [10:09<2:20:59,  2.62s/it]  6%|▋         | 217/3449 [10:12<2:23:41,  2.67s/it]                                                    {'loss': 1.3435, 'learning_rate': 0.00039879661339657776, 'epoch': 0.06}
  6%|▋         | 217/3449 [10:12<2:23:41,  2.67s/it]  6%|▋         | 218/3449 [10:14<2:18:27,  2.57s/it]                                                    {'loss': 1.4053, 'learning_rate': 0.0003987759758742138, 'epoch': 0.06}
  6%|▋         | 218/3449 [10:14<2:18:27,  2.57s/it]  6%|▋         | 219/3449 [10:17<2:13:59,  2.49s/it]                                                    {'loss': 1.4096, 'learning_rate': 0.00039875516343432937, 'epoch': 0.06}
  6%|▋         | 219/3449 [10:17<2:13:59,  2.49s/it]  6%|▋         | 220/3449 [10:19<2:16:30,  2.54s/it]                                                    {'loss': 1.4866, 'learning_rate': 0.00039873417609523863, 'epoch': 0.06}
  6%|▋         | 220/3449 [10:19<2:16:30,  2.54s/it]  6%|▋         | 221/3449 [10:22<2:21:37,  2.63s/it]                                                    {'loss': 1.4622, 'learning_rate': 0.00039871301387541, 'epoch': 0.06}
  6%|▋         | 221/3449 [10:22<2:21:37,  2.63s/it]  6%|▋         | 222/3449 [10:25<2:33:15,  2.85s/it]                                                    {'loss': 1.3574, 'learning_rate': 0.00039869167679346573, 'epoch': 0.06}
  6%|▋         | 222/3449 [10:25<2:33:15,  2.85s/it]  6%|▋         | 223/3449 [10:28<2:33:08,  2.85s/it]                                                    {'loss': 1.4224, 'learning_rate': 0.0003986701648681817, 'epoch': 0.06}
  6%|▋         | 223/3449 [10:28<2:33:08,  2.85s/it]  6%|▋         | 224/3449 [10:31<2:32:03,  2.83s/it]                                                    {'loss': 1.3927, 'learning_rate': 0.000398648478118488, 'epoch': 0.06}
  6%|▋         | 224/3449 [10:31<2:32:03,  2.83s/it]  7%|▋         | 225/3449 [10:33<2:23:35,  2.67s/it]                                                    {'loss': 1.3708, 'learning_rate': 0.00039862661656346816, 'epoch': 0.07}
  7%|▋         | 225/3449 [10:33<2:23:35,  2.67s/it]  7%|▋         | 226/3449 [10:36<2:21:33,  2.64s/it]                                                    {'loss': 1.2435, 'learning_rate': 0.00039860458022236, 'epoch': 0.07}
  7%|▋         | 226/3449 [10:36<2:21:33,  2.64s/it]  7%|▋         | 227/3449 [10:39<2:26:13,  2.72s/it]                                                    {'loss': 1.2099, 'learning_rate': 0.0003985823691145548, 'epoch': 0.07}
  7%|▋         | 227/3449 [10:39<2:26:13,  2.72s/it]  7%|▋         | 228/3449 [10:41<2:21:10,  2.63s/it]                                                    {'loss': 1.3541, 'learning_rate': 0.0003985599832595977, 'epoch': 0.07}
  7%|▋         | 228/3449 [10:41<2:21:10,  2.63s/it]  7%|▋         | 229/3449 [10:44<2:23:30,  2.67s/it]                                                    {'loss': 1.3682, 'learning_rate': 0.00039853742267718776, 'epoch': 0.07}
  7%|▋         | 229/3449 [10:44<2:23:30,  2.67s/it]  7%|▋         | 230/3449 [10:48<2:38:08,  2.95s/it]                                                    {'loss': 1.3608, 'learning_rate': 0.00039851468738717765, 'epoch': 0.07}
  7%|▋         | 230/3449 [10:48<2:38:08,  2.95s/it]  7%|▋         | 231/3449 [10:50<2:28:03,  2.76s/it]                                                    {'loss': 1.4069, 'learning_rate': 0.00039849177740957373, 'epoch': 0.07}
  7%|▋         | 231/3449 [10:50<2:28:03,  2.76s/it]  7%|▋         | 232/3449 [10:53<2:30:51,  2.81s/it]                                                    {'loss': 1.7075, 'learning_rate': 0.00039846869276453624, 'epoch': 0.07}
  7%|▋         | 232/3449 [10:53<2:30:51,  2.81s/it]  7%|▋         | 233/3449 [10:56<2:33:16,  2.86s/it]                                                    {'loss': 1.257, 'learning_rate': 0.000398445433472379, 'epoch': 0.07}
  7%|▋         | 233/3449 [10:56<2:33:16,  2.86s/it]  7%|▋         | 234/3449 [10:58<2:24:55,  2.70s/it]                                                    {'loss': 1.3831, 'learning_rate': 0.0003984219995535697, 'epoch': 0.07}
  7%|▋         | 234/3449 [10:58<2:24:55,  2.70s/it]  7%|▋         | 235/3449 [11:02<2:35:55,  2.91s/it]                                                    {'loss': 1.3522, 'learning_rate': 0.00039839839102872936, 'epoch': 0.07}
  7%|▋         | 235/3449 [11:02<2:35:55,  2.91s/it]  7%|▋         | 236/3449 [11:04<2:28:36,  2.78s/it]                                                    {'loss': 1.4216, 'learning_rate': 0.00039837460791863297, 'epoch': 0.07}
  7%|▋         | 236/3449 [11:04<2:28:36,  2.78s/it]  7%|▋         | 237/3449 [11:07<2:31:59,  2.84s/it]                                                    {'loss': 1.3535, 'learning_rate': 0.000398350650244209, 'epoch': 0.07}
  7%|▋         | 237/3449 [11:07<2:31:59,  2.84s/it]  7%|▋         | 238/3449 [11:09<2:24:22,  2.70s/it]                                                    {'loss': 1.3365, 'learning_rate': 0.0003983265180265396, 'epoch': 0.07}
  7%|▋         | 238/3449 [11:09<2:24:22,  2.70s/it]  7%|▋         | 239/3449 [11:12<2:15:21,  2.53s/it]                                                    {'loss': 1.4763, 'learning_rate': 0.0003983022112868604, 'epoch': 0.07}
  7%|▋         | 239/3449 [11:12<2:15:21,  2.53s/it]  7%|▋         | 240/3449 [11:15<2:22:03,  2.66s/it]                                                    {'loss': 1.3085, 'learning_rate': 0.0003982777300465608, 'epoch': 0.07}
  7%|▋         | 240/3449 [11:15<2:22:03,  2.66s/it]  7%|▋         | 241/3449 [11:17<2:20:56,  2.64s/it]                                                    {'loss': 1.3435, 'learning_rate': 0.0003982530743271834, 'epoch': 0.07}
  7%|▋         | 241/3449 [11:17<2:20:56,  2.64s/it]  7%|▋         | 242/3449 [11:20<2:17:32,  2.57s/it]                                                    {'loss': 1.1607, 'learning_rate': 0.0003982282441504248, 'epoch': 0.07}
  7%|▋         | 242/3449 [11:20<2:17:32,  2.57s/it]  7%|▋         | 243/3449 [11:23<2:29:28,  2.80s/it]                                                    {'loss': 1.3848, 'learning_rate': 0.0003982032395381348, 'epoch': 0.07}
  7%|▋         | 243/3449 [11:23<2:29:28,  2.80s/it]  7%|▋         | 244/3449 [11:25<2:24:36,  2.71s/it]                                                    {'loss': 1.5452, 'learning_rate': 0.00039817806051231685, 'epoch': 0.07}
  7%|▋         | 244/3449 [11:25<2:24:36,  2.71s/it]  7%|▋         | 245/3449 [11:28<2:22:34,  2.67s/it]                                                    {'loss': 1.4223, 'learning_rate': 0.0003981527070951277, 'epoch': 0.07}
  7%|▋         | 245/3449 [11:28<2:22:34,  2.67s/it]  7%|▋         | 246/3449 [11:31<2:23:58,  2.70s/it]                                                    {'loss': 1.5239, 'learning_rate': 0.00039812717930887777, 'epoch': 0.07}
  7%|▋         | 246/3449 [11:31<2:23:58,  2.70s/it]  7%|▋         | 247/3449 [11:34<2:25:41,  2.73s/it]                                                    {'loss': 1.4098, 'learning_rate': 0.0003981014771760307, 'epoch': 0.07}
  7%|▋         | 247/3449 [11:34<2:25:41,  2.73s/it]  7%|▋         | 248/3449 [11:37<2:31:04,  2.83s/it]                                                    {'loss': 1.2477, 'learning_rate': 0.0003980756007192039, 'epoch': 0.07}
  7%|▋         | 248/3449 [11:37<2:31:04,  2.83s/it]  7%|▋         | 249/3449 [11:39<2:31:40,  2.84s/it]                                                    {'loss': 1.2293, 'learning_rate': 0.00039804954996116774, 'epoch': 0.07}
  7%|▋         | 249/3449 [11:39<2:31:40,  2.84s/it]  7%|▋         | 250/3449 [11:42<2:25:35,  2.73s/it]                                                    {'loss': 1.2934, 'learning_rate': 0.0003980233249248463, 'epoch': 0.07}
  7%|▋         | 250/3449 [11:42<2:25:35,  2.73s/it]  7%|▋         | 251/3449 [11:45<2:28:48,  2.79s/it]                                                    {'loss': 1.2993, 'learning_rate': 0.00039799692563331686, 'epoch': 0.07}
  7%|▋         | 251/3449 [11:45<2:28:48,  2.79s/it]  7%|▋         | 252/3449 [11:47<2:22:08,  2.67s/it]                                                    {'loss': 1.4085, 'learning_rate': 0.0003979703521098102, 'epoch': 0.07}
  7%|▋         | 252/3449 [11:47<2:22:08,  2.67s/it]  7%|▋         | 253/3449 [11:50<2:23:19,  2.69s/it]                                                    {'loss': 1.2628, 'learning_rate': 0.00039794360437771015, 'epoch': 0.07}
  7%|▋         | 253/3449 [11:50<2:23:19,  2.69s/it]  7%|▋         | 254/3449 [11:52<2:17:45,  2.59s/it]                                                    {'loss': 1.4072, 'learning_rate': 0.00039791668246055406, 'epoch': 0.07}
  7%|▋         | 254/3449 [11:52<2:17:45,  2.59s/it]  7%|▋         | 255/3449 [11:55<2:14:35,  2.53s/it]                                                    {'loss': 1.3316, 'learning_rate': 0.0003978895863820325, 'epoch': 0.07}
  7%|▋         | 255/3449 [11:55<2:14:35,  2.53s/it]  7%|▋         | 256/3449 [11:58<2:20:37,  2.64s/it]                                                    {'loss': 1.3214, 'learning_rate': 0.00039786231616598935, 'epoch': 0.07}
  7%|▋         | 256/3449 [11:58<2:20:37,  2.64s/it]  7%|▋         | 257/3449 [12:00<2:17:08,  2.58s/it]                                                    {'loss': 1.3406, 'learning_rate': 0.00039783487183642154, 'epoch': 0.07}
  7%|▋         | 257/3449 [12:00<2:17:08,  2.58s/it]  7%|▋         | 258/3449 [12:02<2:14:18,  2.53s/it]                                                    {'loss': 1.5058, 'learning_rate': 0.00039780725341747946, 'epoch': 0.07}
  7%|▋         | 258/3449 [12:02<2:14:18,  2.53s/it]  8%|▊         | 259/3449 [12:06<2:24:07,  2.71s/it]                                                    {'loss': 1.2867, 'learning_rate': 0.0003977794609334665, 'epoch': 0.08}
  8%|▊         | 259/3449 [12:06<2:24:07,  2.71s/it]  8%|▊         | 260/3449 [12:09<2:28:50,  2.80s/it]                                                    {'loss': 1.3296, 'learning_rate': 0.00039775149440883934, 'epoch': 0.08}
  8%|▊         | 260/3449 [12:09<2:28:50,  2.80s/it]  8%|▊         | 261/3449 [12:11<2:22:35,  2.68s/it]                                                    {'loss': 1.3374, 'learning_rate': 0.0003977233538682077, 'epoch': 0.08}
  8%|▊         | 261/3449 [12:11<2:22:35,  2.68s/it]  8%|▊         | 262/3449 [12:15<2:38:27,  2.98s/it]                                                    {'loss': 1.3311, 'learning_rate': 0.0003976950393363346, 'epoch': 0.08}
  8%|▊         | 262/3449 [12:15<2:38:27,  2.98s/it]  8%|▊         | 263/3449 [12:17<2:32:17,  2.87s/it]                                                    {'loss': 1.3599, 'learning_rate': 0.00039766655083813603, 'epoch': 0.08}
  8%|▊         | 263/3449 [12:17<2:32:17,  2.87s/it]  8%|▊         | 264/3449 [12:20<2:28:07,  2.79s/it]                                                    {'loss': 1.2804, 'learning_rate': 0.0003976378883986811, 'epoch': 0.08}
  8%|▊         | 264/3449 [12:20<2:28:07,  2.79s/it]  8%|▊         | 265/3449 [12:23<2:25:42,  2.75s/it]                                                    {'loss': 1.2712, 'learning_rate': 0.000397609052043192, 'epoch': 0.08}
  8%|▊         | 265/3449 [12:23<2:25:42,  2.75s/it]  8%|▊         | 266/3449 [12:25<2:23:39,  2.71s/it]                                                    {'loss': 1.3557, 'learning_rate': 0.00039758004179704393, 'epoch': 0.08}
  8%|▊         | 266/3449 [12:25<2:23:39,  2.71s/it]  8%|▊         | 267/3449 [12:29<2:36:00,  2.94s/it]                                                    {'loss': 1.2742, 'learning_rate': 0.0003975508576857651, 'epoch': 0.08}
  8%|▊         | 267/3449 [12:29<2:36:00,  2.94s/it]  8%|▊         | 268/3449 [12:31<2:29:02,  2.81s/it]                                                    {'loss': 1.5171, 'learning_rate': 0.0003975214997350368, 'epoch': 0.08}
  8%|▊         | 268/3449 [12:31<2:29:02,  2.81s/it]  8%|▊         | 269/3449 [12:34<2:23:55,  2.72s/it]                                                    {'loss': 1.4556, 'learning_rate': 0.00039749196797069316, 'epoch': 0.08}
  8%|▊         | 269/3449 [12:34<2:23:55,  2.72s/it]  8%|▊         | 270/3449 [12:37<2:38:25,  2.99s/it]                                                    {'loss': 1.2967, 'learning_rate': 0.0003974622624187215, 'epoch': 0.08}
  8%|▊         | 270/3449 [12:37<2:38:25,  2.99s/it]  8%|▊         | 271/3449 [12:41<2:42:36,  3.07s/it]                                                    {'loss': 1.3242, 'learning_rate': 0.00039743238310526173, 'epoch': 0.08}
  8%|▊         | 271/3449 [12:41<2:42:36,  3.07s/it]  8%|▊         | 272/3449 [12:43<2:36:10,  2.95s/it]                                                    {'loss': 1.2761, 'learning_rate': 0.0003974023300566069, 'epoch': 0.08}
  8%|▊         | 272/3449 [12:43<2:36:10,  2.95s/it]  8%|▊         | 273/3449 [12:46<2:29:43,  2.83s/it]                                                    {'loss': 1.3672, 'learning_rate': 0.0003973721032992029, 'epoch': 0.08}
  8%|▊         | 273/3449 [12:46<2:29:43,  2.83s/it]  8%|▊         | 274/3449 [12:49<2:32:10,  2.88s/it]                                                    {'loss': 1.3849, 'learning_rate': 0.0003973417028596485, 'epoch': 0.08}
  8%|▊         | 274/3449 [12:49<2:32:10,  2.88s/it]  8%|▊         | 275/3449 [12:52<2:30:14,  2.84s/it]                                                    {'loss': 1.3892, 'learning_rate': 0.00039731112876469527, 'epoch': 0.08}
  8%|▊         | 275/3449 [12:52<2:30:14,  2.84s/it]  8%|▊         | 276/3449 [12:54<2:30:03,  2.84s/it]                                                    {'loss': 1.3909, 'learning_rate': 0.0003972803810412475, 'epoch': 0.08}
  8%|▊         | 276/3449 [12:54<2:30:03,  2.84s/it]  8%|▊         | 277/3449 [12:57<2:31:03,  2.86s/it]                                                    {'loss': 1.407, 'learning_rate': 0.0003972494597163625, 'epoch': 0.08}
  8%|▊         | 277/3449 [12:57<2:31:03,  2.86s/it]  8%|▊         | 278/3449 [13:00<2:35:45,  2.95s/it]                                                    {'loss': 1.3331, 'learning_rate': 0.00039721836481725, 'epoch': 0.08}
  8%|▊         | 278/3449 [13:00<2:35:45,  2.95s/it]  8%|▊         | 279/3449 [13:03<2:28:40,  2.81s/it]                                                    {'loss': 1.4107, 'learning_rate': 0.00039718709637127285, 'epoch': 0.08}
  8%|▊         | 279/3449 [13:03<2:28:40,  2.81s/it]  8%|▊         | 280/3449 [13:06<2:29:27,  2.83s/it]                                                    {'loss': 1.3444, 'learning_rate': 0.00039715565440594637, 'epoch': 0.08}
  8%|▊         | 280/3449 [13:06<2:29:27,  2.83s/it]  8%|▊         | 281/3449 [13:10<2:45:01,  3.13s/it]                                                    {'loss': 1.3164, 'learning_rate': 0.00039712403894893875, 'epoch': 0.08}
  8%|▊         | 281/3449 [13:10<2:45:01,  3.13s/it]  8%|▊         | 282/3449 [13:13<2:47:33,  3.17s/it]                                                    {'loss': 1.4395, 'learning_rate': 0.0003970922500280706, 'epoch': 0.08}
  8%|▊         | 282/3449 [13:13<2:47:33,  3.17s/it]  8%|▊         | 283/3449 [13:16<2:50:09,  3.22s/it]                                                    {'loss': 1.4244, 'learning_rate': 0.00039706028767131545, 'epoch': 0.08}
  8%|▊         | 283/3449 [13:16<2:50:09,  3.22s/it]  8%|▊         | 284/3449 [13:20<3:03:20,  3.48s/it]                                                    {'loss': 1.2813, 'learning_rate': 0.00039702815190679916, 'epoch': 0.08}
  8%|▊         | 284/3449 [13:20<3:03:20,  3.48s/it]  8%|▊         | 285/3449 [13:23<2:52:03,  3.26s/it]                                                    {'loss': 1.427, 'learning_rate': 0.00039699584276280044, 'epoch': 0.08}
  8%|▊         | 285/3449 [13:23<2:52:03,  3.26s/it]  8%|▊         | 286/3449 [13:26<2:44:43,  3.12s/it]                                                    {'loss': 1.1327, 'learning_rate': 0.00039696336026775043, 'epoch': 0.08}
  8%|▊         | 286/3449 [13:26<2:44:43,  3.12s/it]  8%|▊         | 287/3449 [13:29<2:45:33,  3.14s/it]                                                    {'loss': 1.3982, 'learning_rate': 0.000396930704450233, 'epoch': 0.08}
  8%|▊         | 287/3449 [13:29<2:45:33,  3.14s/it]  8%|▊         | 288/3449 [13:32<2:49:03,  3.21s/it]                                                    {'loss': 1.3648, 'learning_rate': 0.00039689787533898414, 'epoch': 0.08}
  8%|▊         | 288/3449 [13:32<2:49:03,  3.21s/it]  8%|▊         | 289/3449 [13:35<2:43:32,  3.11s/it]                                                    {'loss': 1.3662, 'learning_rate': 0.0003968648729628927, 'epoch': 0.08}
  8%|▊         | 289/3449 [13:35<2:43:32,  3.11s/it]  8%|▊         | 290/3449 [13:38<2:33:51,  2.92s/it]                                                    {'loss': 1.3564, 'learning_rate': 0.00039683169735099997, 'epoch': 0.08}
  8%|▊         | 290/3449 [13:38<2:33:51,  2.92s/it]  8%|▊         | 291/3449 [13:40<2:26:39,  2.79s/it]                                                    {'loss': 1.3171, 'learning_rate': 0.00039679834853249954, 'epoch': 0.08}
  8%|▊         | 291/3449 [13:40<2:26:39,  2.79s/it]  8%|▊         | 292/3449 [13:43<2:21:21,  2.69s/it]                                                    {'loss': 1.4295, 'learning_rate': 0.0003967648265367374, 'epoch': 0.08}
  8%|▊         | 292/3449 [13:43<2:21:21,  2.69s/it]  8%|▊         | 293/3449 [13:45<2:22:43,  2.71s/it]                                                    {'loss': 1.2965, 'learning_rate': 0.00039673113139321217, 'epoch': 0.08}
  8%|▊         | 293/3449 [13:45<2:22:43,  2.71s/it]  9%|▊         | 294/3449 [13:48<2:14:35,  2.56s/it]                                                    {'loss': 1.6415, 'learning_rate': 0.00039669726313157447, 'epoch': 0.09}
  9%|▊         | 294/3449 [13:48<2:14:35,  2.56s/it]  9%|▊         | 295/3449 [13:51<2:30:59,  2.87s/it]                                                    {'loss': 1.2551, 'learning_rate': 0.00039666322178162763, 'epoch': 0.09}
  9%|▊         | 295/3449 [13:51<2:30:59,  2.87s/it]  9%|▊         | 296/3449 [13:55<2:47:55,  3.20s/it]                                                    {'loss': 1.3234, 'learning_rate': 0.00039662900737332695, 'epoch': 0.09}
  9%|▊         | 296/3449 [13:55<2:47:55,  3.20s/it]  9%|▊         | 297/3449 [13:58<2:42:30,  3.09s/it]                                                    {'loss': 1.3994, 'learning_rate': 0.0003965946199367804, 'epoch': 0.09}
  9%|▊         | 297/3449 [13:58<2:42:30,  3.09s/it]  9%|▊         | 298/3449 [14:01<2:40:47,  3.06s/it]                                                    {'loss': 1.206, 'learning_rate': 0.0003965600595022478, 'epoch': 0.09}
  9%|▊         | 298/3449 [14:01<2:40:47,  3.06s/it]  9%|▊         | 299/3449 [14:04<2:38:11,  3.01s/it]                                                    {'loss': 1.2827, 'learning_rate': 0.0003965253261001416, 'epoch': 0.09}
  9%|▊         | 299/3449 [14:04<2:38:11,  3.01s/it]  9%|▊         | 300/3449 [14:07<2:33:46,  2.93s/it]                                                    {'loss': 1.3162, 'learning_rate': 0.0003964904197610261, 'epoch': 0.09}
  9%|▊         | 300/3449 [14:07<2:33:46,  2.93s/it]  9%|▊         | 301/3449 [14:09<2:20:30,  2.68s/it]                                                    {'loss': 1.5978, 'learning_rate': 0.000396455340515618, 'epoch': 0.09}
  9%|▊         | 301/3449 [14:09<2:20:30,  2.68s/it]  9%|▉         | 302/3449 [14:12<2:29:55,  2.86s/it]                                                    {'loss': 1.3232, 'learning_rate': 0.00039642008839478615, 'epoch': 0.09}
  9%|▉         | 302/3449 [14:12<2:29:55,  2.86s/it]  9%|▉         | 303/3449 [14:15<2:27:49,  2.82s/it]                                                    {'loss': 1.2778, 'learning_rate': 0.0003963846634295513, 'epoch': 0.09}
  9%|▉         | 303/3449 [14:15<2:27:49,  2.82s/it]  9%|▉         | 304/3449 [14:17<2:21:33,  2.70s/it]                                                    {'loss': 1.3913, 'learning_rate': 0.00039634906565108667, 'epoch': 0.09}
  9%|▉         | 304/3449 [14:17<2:21:33,  2.70s/it]  9%|▉         | 305/3449 [14:21<2:36:22,  2.98s/it]                                                    {'loss': 1.2894, 'learning_rate': 0.00039631329509071724, 'epoch': 0.09}
  9%|▉         | 305/3449 [14:21<2:36:22,  2.98s/it]  9%|▉         | 306/3449 [14:24<2:36:28,  2.99s/it]                                                    {'loss': 1.3261, 'learning_rate': 0.00039627735177992024, 'epoch': 0.09}
  9%|▉         | 306/3449 [14:24<2:36:28,  2.99s/it]  9%|▉         | 307/3449 [14:27<2:33:47,  2.94s/it]                                                    {'loss': 1.3329, 'learning_rate': 0.0003962412357503246, 'epoch': 0.09}
  9%|▉         | 307/3449 [14:27<2:33:47,  2.94s/it]  9%|▉         | 308/3449 [14:29<2:27:04,  2.81s/it]                                                    {'loss': 1.3168, 'learning_rate': 0.00039620494703371175, 'epoch': 0.09}
  9%|▉         | 308/3449 [14:29<2:27:04,  2.81s/it]  9%|▉         | 309/3449 [14:33<2:36:00,  2.98s/it]                                                    {'loss': 1.3801, 'learning_rate': 0.00039616848566201453, 'epoch': 0.09}
  9%|▉         | 309/3449 [14:33<2:36:00,  2.98s/it]  9%|▉         | 310/3449 [14:36<2:39:39,  3.05s/it]                                                    {'loss': 1.3349, 'learning_rate': 0.00039613185166731814, 'epoch': 0.09}
  9%|▉         | 310/3449 [14:36<2:39:39,  3.05s/it]  9%|▉         | 311/3449 [14:39<2:39:53,  3.06s/it]                                                    {'loss': 1.2949, 'learning_rate': 0.00039609504508185937, 'epoch': 0.09}
  9%|▉         | 311/3449 [14:39<2:39:53,  3.06s/it]  9%|▉         | 312/3449 [14:42<2:33:31,  2.94s/it]                                                    {'loss': 1.1931, 'learning_rate': 0.00039605806593802714, 'epoch': 0.09}
  9%|▉         | 312/3449 [14:42<2:33:31,  2.94s/it]  9%|▉         | 313/3449 [14:44<2:27:45,  2.83s/it]                                                    {'loss': 1.5426, 'learning_rate': 0.00039602091426836205, 'epoch': 0.09}
  9%|▉         | 313/3449 [14:44<2:27:45,  2.83s/it]  9%|▉         | 314/3449 [14:47<2:31:07,  2.89s/it]                                                    {'loss': 1.4269, 'learning_rate': 0.0003959835901055566, 'epoch': 0.09}
  9%|▉         | 314/3449 [14:47<2:31:07,  2.89s/it]  9%|▉         | 315/3449 [14:50<2:31:09,  2.89s/it]                                                    {'loss': 1.3779, 'learning_rate': 0.00039594609348245506, 'epoch': 0.09}
  9%|▉         | 315/3449 [14:50<2:31:09,  2.89s/it]  9%|▉         | 316/3449 [14:53<2:26:19,  2.80s/it]                                                    {'loss': 1.3227, 'learning_rate': 0.00039590842443205335, 'epoch': 0.09}
  9%|▉         | 316/3449 [14:53<2:26:19,  2.80s/it]  9%|▉         | 317/3449 [14:56<2:34:46,  2.96s/it]                                                    {'loss': 1.331, 'learning_rate': 0.0003958705829874994, 'epoch': 0.09}
  9%|▉         | 317/3449 [14:56<2:34:46,  2.96s/it]  9%|▉         | 318/3449 [14:59<2:35:01,  2.97s/it]                                                    {'loss': 1.2632, 'learning_rate': 0.0003958325691820925, 'epoch': 0.09}
  9%|▉         | 318/3449 [14:59<2:35:01,  2.97s/it]  9%|▉         | 319/3449 [15:02<2:29:31,  2.87s/it]                                                    {'loss': 1.3223, 'learning_rate': 0.00039579438304928385, 'epoch': 0.09}
  9%|▉         | 319/3449 [15:02<2:29:31,  2.87s/it]  9%|▉         | 320/3449 [15:04<2:22:31,  2.73s/it]                                                    {'loss': 1.396, 'learning_rate': 0.0003957560246226763, 'epoch': 0.09}
  9%|▉         | 320/3449 [15:04<2:22:31,  2.73s/it]  9%|▉         | 321/3449 [15:08<2:41:15,  3.09s/it]                                                    {'loss': 1.3239, 'learning_rate': 0.00039571749393602405, 'epoch': 0.09}
  9%|▉         | 321/3449 [15:08<2:41:15,  3.09s/it]  9%|▉         | 322/3449 [15:11<2:36:56,  3.01s/it]                                                    {'loss': 1.4516, 'learning_rate': 0.0003956787910232332, 'epoch': 0.09}
  9%|▉         | 322/3449 [15:11<2:36:56,  3.01s/it]  9%|▉         | 323/3449 [15:15<2:57:40,  3.41s/it]                                                    {'loss': 1.3951, 'learning_rate': 0.00039563991591836127, 'epoch': 0.09}
  9%|▉         | 323/3449 [15:15<2:57:40,  3.41s/it]  9%|▉         | 324/3449 [15:18<2:47:28,  3.22s/it]                                                    {'loss': 1.3145, 'learning_rate': 0.0003956008686556172, 'epoch': 0.09}
  9%|▉         | 324/3449 [15:18<2:47:28,  3.22s/it]  9%|▉         | 325/3449 [15:21<2:48:56,  3.24s/it]                                                    {'loss': 1.298, 'learning_rate': 0.0003955616492693617, 'epoch': 0.09}
  9%|▉         | 325/3449 [15:21<2:48:56,  3.24s/it]  9%|▉         | 326/3449 [15:23<2:34:39,  2.97s/it]                                                    {'loss': 1.3131, 'learning_rate': 0.0003955222577941067, 'epoch': 0.09}
  9%|▉         | 326/3449 [15:23<2:34:39,  2.97s/it]  9%|▉         | 327/3449 [15:26<2:28:24,  2.85s/it]                                                    {'loss': 1.2039, 'learning_rate': 0.00039548269426451557, 'epoch': 0.09}
  9%|▉         | 327/3449 [15:26<2:28:24,  2.85s/it] 10%|▉         | 328/3449 [15:29<2:33:56,  2.96s/it]                                                    {'loss': 1.3435, 'learning_rate': 0.0003954429587154032, 'epoch': 0.1}
 10%|▉         | 328/3449 [15:29<2:33:56,  2.96s/it] 10%|▉         | 329/3449 [15:32<2:27:10,  2.83s/it]                                                    {'loss': 1.4773, 'learning_rate': 0.0003954030511817359, 'epoch': 0.1}
 10%|▉         | 329/3449 [15:32<2:27:10,  2.83s/it] 10%|▉         | 330/3449 [15:35<2:28:12,  2.85s/it]                                                    {'loss': 1.4621, 'learning_rate': 0.0003953629716986311, 'epoch': 0.1}
 10%|▉         | 330/3449 [15:35<2:28:12,  2.85s/it] 10%|▉         | 331/3449 [15:38<2:32:46,  2.94s/it]                                                    {'loss': 1.4583, 'learning_rate': 0.0003953227203013577, 'epoch': 0.1}
 10%|▉         | 331/3449 [15:38<2:32:46,  2.94s/it] 10%|▉         | 332/3449 [15:40<2:26:52,  2.83s/it]                                                    {'loss': 1.4588, 'learning_rate': 0.0003952822970253359, 'epoch': 0.1}
 10%|▉         | 332/3449 [15:40<2:26:52,  2.83s/it] 10%|▉         | 333/3449 [15:43<2:19:12,  2.68s/it]                                                    {'loss': 1.3788, 'learning_rate': 0.0003952417019061371, 'epoch': 0.1}
 10%|▉         | 333/3449 [15:43<2:19:12,  2.68s/it] 10%|▉         | 334/3449 [15:45<2:18:03,  2.66s/it]                                                    {'loss': 1.3653, 'learning_rate': 0.0003952009349794838, 'epoch': 0.1}
 10%|▉         | 334/3449 [15:45<2:18:03,  2.66s/it] 10%|▉         | 335/3449 [15:48<2:18:23,  2.67s/it]                                                    {'loss': 1.2425, 'learning_rate': 0.0003951599962812499, 'epoch': 0.1}
 10%|▉         | 335/3449 [15:48<2:18:23,  2.67s/it] 10%|▉         | 336/3449 [15:51<2:19:15,  2.68s/it]                                                    {'loss': 1.2731, 'learning_rate': 0.00039511888584746035, 'epoch': 0.1}
 10%|▉         | 336/3449 [15:51<2:19:15,  2.68s/it] 10%|▉         | 337/3449 [15:53<2:13:13,  2.57s/it]                                                    {'loss': 1.3504, 'learning_rate': 0.00039507760371429126, 'epoch': 0.1}
 10%|▉         | 337/3449 [15:53<2:13:13,  2.57s/it] 10%|▉         | 338/3449 [15:56<2:19:24,  2.69s/it]                                                    {'loss': 1.3654, 'learning_rate': 0.0003950361499180697, 'epoch': 0.1}
 10%|▉         | 338/3449 [15:56<2:19:24,  2.69s/it] 10%|▉         | 339/3449 [16:00<2:39:12,  3.07s/it]                                                    {'loss': 1.3129, 'learning_rate': 0.00039499452449527395, 'epoch': 0.1}
 10%|▉         | 339/3449 [16:00<2:39:12,  3.07s/it] 10%|▉         | 340/3449 [16:02<2:27:20,  2.84s/it]                                                    {'loss': 1.4244, 'learning_rate': 0.00039495272748253326, 'epoch': 0.1}
 10%|▉         | 340/3449 [16:02<2:27:20,  2.84s/it] 10%|▉         | 341/3449 [16:05<2:24:22,  2.79s/it]                                                    {'loss': 1.41, 'learning_rate': 0.00039491075891662794, 'epoch': 0.1}
 10%|▉         | 341/3449 [16:05<2:24:22,  2.79s/it] 10%|▉         | 342/3449 [16:08<2:23:07,  2.76s/it]                                                    {'loss': 1.2094, 'learning_rate': 0.00039486861883448907, 'epoch': 0.1}
 10%|▉         | 342/3449 [16:08<2:23:07,  2.76s/it] 10%|▉         | 343/3449 [16:10<2:16:04,  2.63s/it]                                                    {'loss': 1.5471, 'learning_rate': 0.00039482630727319883, 'epoch': 0.1}
 10%|▉         | 343/3449 [16:10<2:16:04,  2.63s/it] 10%|▉         | 344/3449 [16:13<2:17:00,  2.65s/it]                                                    {'loss': 1.2915, 'learning_rate': 0.0003947838242699904, 'epoch': 0.1}
 10%|▉         | 344/3449 [16:13<2:17:00,  2.65s/it] 10%|█         | 345/3449 [16:16<2:20:09,  2.71s/it]                                                    {'loss': 1.3057, 'learning_rate': 0.0003947411698622475, 'epoch': 0.1}
 10%|█         | 345/3449 [16:16<2:20:09,  2.71s/it] 10%|█         | 346/3449 [16:18<2:17:19,  2.66s/it]                                                    {'loss': 1.374, 'learning_rate': 0.000394698344087505, 'epoch': 0.1}
 10%|█         | 346/3449 [16:18<2:17:19,  2.66s/it] 10%|█         | 347/3449 [16:21<2:23:59,  2.79s/it]                                                    {'loss': 1.3786, 'learning_rate': 0.00039465534698344826, 'epoch': 0.1}
 10%|█         | 347/3449 [16:21<2:23:59,  2.79s/it] 10%|█         | 348/3449 [16:24<2:28:11,  2.87s/it]                                                    {'loss': 1.4415, 'learning_rate': 0.0003946121785879138, 'epoch': 0.1}
 10%|█         | 348/3449 [16:24<2:28:11,  2.87s/it] 10%|█         | 349/3449 [16:28<2:36:43,  3.03s/it]                                                    {'loss': 1.2374, 'learning_rate': 0.00039456883893888845, 'epoch': 0.1}
 10%|█         | 349/3449 [16:28<2:36:43,  3.03s/it] 10%|█         | 350/3449 [16:30<2:27:45,  2.86s/it]                                                    {'loss': 1.3662, 'learning_rate': 0.00039452532807451006, 'epoch': 0.1}
 10%|█         | 350/3449 [16:30<2:27:45,  2.86s/it] 10%|█         | 351/3449 [16:33<2:26:05,  2.83s/it]                                                    {'loss': 1.2629, 'learning_rate': 0.0003944816460330669, 'epoch': 0.1}
 10%|█         | 351/3449 [16:33<2:26:05,  2.83s/it] 10%|█         | 352/3449 [16:35<2:22:40,  2.76s/it]                                                    {'loss': 1.2885, 'learning_rate': 0.00039443779285299824, 'epoch': 0.1}
 10%|█         | 352/3449 [16:35<2:22:40,  2.76s/it] 10%|█         | 353/3449 [16:39<2:30:16,  2.91s/it]                                                    {'loss': 1.3265, 'learning_rate': 0.0003943937685728934, 'epoch': 0.1}
 10%|█         | 353/3449 [16:39<2:30:16,  2.91s/it] 10%|█         | 354/3449 [16:42<2:40:18,  3.11s/it]                                                    {'loss': 1.2861, 'learning_rate': 0.00039434957323149277, 'epoch': 0.1}
 10%|█         | 354/3449 [16:42<2:40:18,  3.11s/it] 10%|█         | 355/3449 [16:45<2:30:21,  2.92s/it]                                                    {'loss': 1.27, 'learning_rate': 0.00039430520686768695, 'epoch': 0.1}
 10%|█         | 355/3449 [16:45<2:30:21,  2.92s/it] 10%|█         | 356/3449 [16:48<2:32:10,  2.95s/it]                                                    {'loss': 1.1879, 'learning_rate': 0.0003942606695205172, 'epoch': 0.1}
 10%|█         | 356/3449 [16:48<2:32:10,  2.95s/it] 10%|█         | 357/3449 [16:50<2:26:03,  2.83s/it]                                                    {'loss': 1.4018, 'learning_rate': 0.0003942159612291752, 'epoch': 0.1}
 10%|█         | 357/3449 [16:50<2:26:03,  2.83s/it] 10%|█         | 358/3449 [16:54<2:33:42,  2.98s/it]                                                    {'loss': 1.3663, 'learning_rate': 0.000394171082033003, 'epoch': 0.1}
 10%|█         | 358/3449 [16:54<2:33:42,  2.98s/it] 10%|█         | 359/3449 [16:56<2:29:14,  2.90s/it]                                                    {'loss': 1.2719, 'learning_rate': 0.0003941260319714932, 'epoch': 0.1}
 10%|█         | 359/3449 [16:56<2:29:14,  2.90s/it] 10%|█         | 360/3449 [16:59<2:26:09,  2.84s/it]                                                    {'loss': 1.3557, 'learning_rate': 0.00039408081108428843, 'epoch': 0.1}
 10%|█         | 360/3449 [16:59<2:26:09,  2.84s/it] 10%|█         | 361/3449 [17:02<2:25:03,  2.82s/it]                                                    {'loss': 1.251, 'learning_rate': 0.0003940354194111821, 'epoch': 0.1}
 10%|█         | 361/3449 [17:02<2:25:03,  2.82s/it] 10%|█         | 362/3449 [17:04<2:22:06,  2.76s/it]                                                    {'loss': 1.4242, 'learning_rate': 0.0003939898569921175, 'epoch': 0.1}
 10%|█         | 362/3449 [17:04<2:22:06,  2.76s/it] 11%|█         | 363/3449 [17:07<2:16:48,  2.66s/it]                                                    {'loss': 1.464, 'learning_rate': 0.0003939441238671884, 'epoch': 0.11}
 11%|█         | 363/3449 [17:07<2:16:48,  2.66s/it] 11%|█         | 364/3449 [17:09<2:13:09,  2.59s/it]                                                    {'loss': 1.279, 'learning_rate': 0.00039389822007663866, 'epoch': 0.11}
 11%|█         | 364/3449 [17:09<2:13:09,  2.59s/it] 11%|█         | 365/3449 [17:12<2:13:04,  2.59s/it]                                                    {'loss': 1.4705, 'learning_rate': 0.0003938521456608625, 'epoch': 0.11}
 11%|█         | 365/3449 [17:12<2:13:04,  2.59s/it] 11%|█         | 366/3449 [17:14<2:11:59,  2.57s/it]                                                    {'loss': 1.2939, 'learning_rate': 0.000393805900660404, 'epoch': 0.11}
 11%|█         | 366/3449 [17:14<2:11:59,  2.57s/it] 11%|█         | 367/3449 [17:17<2:13:04,  2.59s/it]                                                    {'loss': 1.3762, 'learning_rate': 0.0003937594851159577, 'epoch': 0.11}
 11%|█         | 367/3449 [17:17<2:13:04,  2.59s/it] 11%|█         | 368/3449 [17:20<2:22:30,  2.78s/it]                                                    {'loss': 1.504, 'learning_rate': 0.00039371289906836793, 'epoch': 0.11}
 11%|█         | 368/3449 [17:20<2:22:30,  2.78s/it] 11%|█         | 369/3449 [17:23<2:27:26,  2.87s/it]                                                    {'loss': 1.1273, 'learning_rate': 0.00039366614255862916, 'epoch': 0.11}
 11%|█         | 369/3449 [17:23<2:27:26,  2.87s/it] 11%|█         | 370/3449 [17:26<2:24:24,  2.81s/it]                                                    {'loss': 1.2929, 'learning_rate': 0.00039361921562788594, 'epoch': 0.11}
 11%|█         | 370/3449 [17:26<2:24:24,  2.81s/it] 11%|█         | 371/3449 [17:29<2:25:02,  2.83s/it]                                                    {'loss': 1.461, 'learning_rate': 0.0003935721183174326, 'epoch': 0.11}
 11%|█         | 371/3449 [17:29<2:25:02,  2.83s/it] 11%|█         | 372/3449 [17:32<2:23:15,  2.79s/it]                                                    {'loss': 1.2933, 'learning_rate': 0.00039352485066871355, 'epoch': 0.11}
 11%|█         | 372/3449 [17:32<2:23:15,  2.79s/it] 11%|█         | 373/3449 [17:35<2:35:07,  3.03s/it]                                                    {'loss': 1.2856, 'learning_rate': 0.0003934774127233231, 'epoch': 0.11}
 11%|█         | 373/3449 [17:35<2:35:07,  3.03s/it] 11%|█         | 374/3449 [17:38<2:32:10,  2.97s/it]                                                    {'loss': 1.3504, 'learning_rate': 0.0003934298045230053, 'epoch': 0.11}
 11%|█         | 374/3449 [17:38<2:32:10,  2.97s/it] 11%|█         | 375/3449 [17:40<2:24:17,  2.82s/it]                                                    {'loss': 1.3782, 'learning_rate': 0.0003933820261096541, 'epoch': 0.11}
 11%|█         | 375/3449 [17:40<2:24:17,  2.82s/it] 11%|█         | 376/3449 [17:43<2:23:32,  2.80s/it]                                                    {'loss': 1.2738, 'learning_rate': 0.00039333407752531333, 'epoch': 0.11}
 11%|█         | 376/3449 [17:43<2:23:32,  2.80s/it] 11%|█         | 377/3449 [17:47<2:33:33,  3.00s/it]                                                    {'loss': 1.4028, 'learning_rate': 0.00039328595881217625, 'epoch': 0.11}
 11%|█         | 377/3449 [17:47<2:33:33,  3.00s/it] 11%|█         | 378/3449 [17:49<2:23:19,  2.80s/it]                                                    {'loss': 1.3697, 'learning_rate': 0.0003932376700125862, 'epoch': 0.11}
 11%|█         | 378/3449 [17:49<2:23:19,  2.80s/it] 11%|█         | 379/3449 [17:52<2:19:35,  2.73s/it]                                                    {'loss': 1.471, 'learning_rate': 0.000393189211169036, 'epoch': 0.11}
 11%|█         | 379/3449 [17:52<2:19:35,  2.73s/it] 11%|█         | 380/3449 [17:54<2:14:01,  2.62s/it]                                                    {'loss': 1.4331, 'learning_rate': 0.0003931405823241681, 'epoch': 0.11}
 11%|█         | 380/3449 [17:54<2:14:01,  2.62s/it] 11%|█         | 381/3449 [17:57<2:15:39,  2.65s/it]                                                    {'loss': 1.3678, 'learning_rate': 0.00039309178352077455, 'epoch': 0.11}
 11%|█         | 381/3449 [17:57<2:15:39,  2.65s/it] 11%|█         | 382/3449 [17:59<2:15:03,  2.64s/it]                                                    {'loss': 1.2892, 'learning_rate': 0.0003930428148017971, 'epoch': 0.11}
 11%|█         | 382/3449 [17:59<2:15:03,  2.64s/it] 11%|█         | 383/3449 [18:02<2:22:54,  2.80s/it]                                                    {'loss': 1.381, 'learning_rate': 0.00039299367621032673, 'epoch': 0.11}
 11%|█         | 383/3449 [18:02<2:22:54,  2.80s/it] 11%|█         | 384/3449 [18:05<2:21:25,  2.77s/it]                                                    {'loss': 1.255, 'learning_rate': 0.0003929443677896042, 'epoch': 0.11}
 11%|█         | 384/3449 [18:05<2:21:25,  2.77s/it] 11%|█         | 385/3449 [18:08<2:17:57,  2.70s/it]                                                    {'loss': 1.5373, 'learning_rate': 0.00039289488958301963, 'epoch': 0.11}
 11%|█         | 385/3449 [18:08<2:17:57,  2.70s/it] 11%|█         | 386/3449 [18:10<2:13:32,  2.62s/it]                                                    {'loss': 1.4048, 'learning_rate': 0.0003928452416341124, 'epoch': 0.11}
 11%|█         | 386/3449 [18:10<2:13:32,  2.62s/it] 11%|█         | 387/3449 [18:13<2:16:08,  2.67s/it]                                                    {'loss': 1.3485, 'learning_rate': 0.0003927954239865715, 'epoch': 0.11}
 11%|█         | 387/3449 [18:13<2:16:08,  2.67s/it] 11%|█         | 388/3449 [18:16<2:15:31,  2.66s/it]                                                    {'loss': 1.3841, 'learning_rate': 0.00039274543668423495, 'epoch': 0.11}
 11%|█         | 388/3449 [18:16<2:15:31,  2.66s/it] 11%|█▏        | 389/3449 [18:18<2:18:09,  2.71s/it]                                                    {'loss': 1.2156, 'learning_rate': 0.00039269527977109044, 'epoch': 0.11}
 11%|█▏        | 389/3449 [18:18<2:18:09,  2.71s/it] 11%|█▏        | 390/3449 [18:21<2:19:25,  2.73s/it]                                                    {'loss': 1.4647, 'learning_rate': 0.0003926449532912746, 'epoch': 0.11}
 11%|█▏        | 390/3449 [18:21<2:19:25,  2.73s/it] 11%|█▏        | 391/3449 [18:24<2:13:44,  2.62s/it]                                                    {'loss': 1.3239, 'learning_rate': 0.00039259445728907327, 'epoch': 0.11}
 11%|█▏        | 391/3449 [18:24<2:13:44,  2.62s/it] 11%|█▏        | 392/3449 [18:27<2:27:44,  2.90s/it]                                                    {'loss': 1.2882, 'learning_rate': 0.0003925437918089218, 'epoch': 0.11}
 11%|█▏        | 392/3449 [18:27<2:27:44,  2.90s/it] 11%|█▏        | 393/3449 [18:30<2:29:15,  2.93s/it]                                                    {'loss': 1.3821, 'learning_rate': 0.00039249295689540426, 'epoch': 0.11}
 11%|█▏        | 393/3449 [18:30<2:29:15,  2.93s/it] 11%|█▏        | 394/3449 [18:33<2:22:42,  2.80s/it]                                                    {'loss': 1.1908, 'learning_rate': 0.00039244195259325416, 'epoch': 0.11}
 11%|█▏        | 394/3449 [18:33<2:22:42,  2.80s/it] 11%|█▏        | 395/3449 [18:36<2:26:20,  2.87s/it]                                                    {'loss': 1.1618, 'learning_rate': 0.00039239077894735383, 'epoch': 0.11}
 11%|█▏        | 395/3449 [18:36<2:26:20,  2.87s/it] 11%|█▏        | 396/3449 [18:38<2:24:17,  2.84s/it]                                                    {'loss': 1.3317, 'learning_rate': 0.0003923394360027347, 'epoch': 0.11}
 11%|█▏        | 396/3449 [18:38<2:24:17,  2.84s/it] 12%|█▏        | 397/3449 [18:41<2:18:43,  2.73s/it]                                                    {'loss': 1.5053, 'learning_rate': 0.0003922879238045773, 'epoch': 0.12}
 12%|█▏        | 397/3449 [18:41<2:18:43,  2.73s/it] 12%|█▏        | 398/3449 [18:43<2:12:02,  2.60s/it]                                                    {'loss': 1.3213, 'learning_rate': 0.00039223624239821073, 'epoch': 0.12}
 12%|█▏        | 398/3449 [18:43<2:12:02,  2.60s/it] 12%|█▏        | 399/3449 [18:46<2:16:36,  2.69s/it]                                                    {'loss': 1.1913, 'learning_rate': 0.0003921843918291135, 'epoch': 0.12}
 12%|█▏        | 399/3449 [18:46<2:16:36,  2.69s/it] 12%|█▏        | 400/3449 [18:49<2:18:04,  2.72s/it]                                                    {'loss': 1.3521, 'learning_rate': 0.0003921323721429126, 'epoch': 0.12}
 12%|█▏        | 400/3449 [18:49<2:18:04,  2.72s/it] 12%|█▏        | 401/3449 [18:52<2:18:47,  2.73s/it]                                                    {'loss': 1.4003, 'learning_rate': 0.00039208018338538386, 'epoch': 0.12}
 12%|█▏        | 401/3449 [18:52<2:18:47,  2.73s/it] 12%|█▏        | 402/3449 [18:54<2:12:38,  2.61s/it]                                                    {'loss': 1.2853, 'learning_rate': 0.0003920278256024522, 'epoch': 0.12}
 12%|█▏        | 402/3449 [18:54<2:12:38,  2.61s/it] 12%|█▏        | 403/3449 [18:56<2:10:55,  2.58s/it]                                                    {'loss': 1.6179, 'learning_rate': 0.00039197529884019096, 'epoch': 0.12}
 12%|█▏        | 403/3449 [18:56<2:10:55,  2.58s/it] 12%|█▏        | 404/3449 [18:59<2:15:40,  2.67s/it]                                                    {'loss': 1.3391, 'learning_rate': 0.00039192260314482223, 'epoch': 0.12}
 12%|█▏        | 404/3449 [18:59<2:15:40,  2.67s/it] 12%|█▏        | 405/3449 [19:02<2:11:40,  2.60s/it]                                                    {'loss': 1.3379, 'learning_rate': 0.00039186973856271683, 'epoch': 0.12}
 12%|█▏        | 405/3449 [19:02<2:11:40,  2.60s/it] 12%|█▏        | 406/3449 [19:04<2:10:39,  2.58s/it]                                                    {'loss': 1.2994, 'learning_rate': 0.0003918167051403943, 'epoch': 0.12}
 12%|█▏        | 406/3449 [19:04<2:10:39,  2.58s/it] 12%|█▏        | 407/3449 [19:07<2:06:26,  2.49s/it]                                                    {'loss': 1.3591, 'learning_rate': 0.00039176350292452244, 'epoch': 0.12}
 12%|█▏        | 407/3449 [19:07<2:06:26,  2.49s/it] 12%|█▏        | 408/3449 [19:09<2:10:01,  2.57s/it]                                                    {'loss': 1.259, 'learning_rate': 0.00039171013196191793, 'epoch': 0.12}
 12%|█▏        | 408/3449 [19:09<2:10:01,  2.57s/it] 12%|█▏        | 409/3449 [19:12<2:10:53,  2.58s/it]                                                    {'loss': 1.402, 'learning_rate': 0.00039165659229954566, 'epoch': 0.12}
 12%|█▏        | 409/3449 [19:12<2:10:53,  2.58s/it] 12%|█▏        | 410/3449 [19:15<2:15:34,  2.68s/it]                                                    {'loss': 1.2868, 'learning_rate': 0.00039160288398451906, 'epoch': 0.12}
 12%|█▏        | 410/3449 [19:15<2:15:34,  2.68s/it] 12%|█▏        | 411/3449 [19:18<2:17:58,  2.72s/it]                                                    {'loss': 1.4592, 'learning_rate': 0.0003915490070641002, 'epoch': 0.12}
 12%|█▏        | 411/3449 [19:18<2:17:58,  2.72s/it] 12%|█▏        | 412/3449 [19:21<2:23:38,  2.84s/it]                                                    {'loss': 1.3848, 'learning_rate': 0.00039149496158569924, 'epoch': 0.12}
 12%|█▏        | 412/3449 [19:21<2:23:38,  2.84s/it] 12%|█▏        | 413/3449 [19:24<2:31:14,  2.99s/it]                                                    {'loss': 1.292, 'learning_rate': 0.0003914407475968746, 'epoch': 0.12}
 12%|█▏        | 413/3449 [19:24<2:31:14,  2.99s/it] 12%|█▏        | 414/3449 [19:28<2:37:54,  3.12s/it]                                                    {'loss': 1.2964, 'learning_rate': 0.0003913863651453333, 'epoch': 0.12}
 12%|█▏        | 414/3449 [19:28<2:37:54,  3.12s/it] 12%|█▏        | 415/3449 [19:30<2:25:28,  2.88s/it]                                                    {'loss': 1.2426, 'learning_rate': 0.00039133181427893044, 'epoch': 0.12}
 12%|█▏        | 415/3449 [19:30<2:25:28,  2.88s/it] 12%|█▏        | 416/3449 [19:33<2:23:47,  2.84s/it]                                                    {'loss': 1.3032, 'learning_rate': 0.0003912770950456693, 'epoch': 0.12}
 12%|█▏        | 416/3449 [19:33<2:23:47,  2.84s/it] 12%|█▏        | 417/3449 [19:35<2:18:19,  2.74s/it]                                                    {'loss': 1.427, 'learning_rate': 0.00039122220749370125, 'epoch': 0.12}
 12%|█▏        | 417/3449 [19:35<2:18:19,  2.74s/it] 12%|█▏        | 418/3449 [19:37<2:10:56,  2.59s/it]                                                    {'loss': 1.1978, 'learning_rate': 0.00039116715167132593, 'epoch': 0.12}
 12%|█▏        | 418/3449 [19:37<2:10:56,  2.59s/it] 12%|█▏        | 419/3449 [19:41<2:34:12,  3.05s/it]                                                    {'loss': 1.3663, 'learning_rate': 0.00039111192762699093, 'epoch': 0.12}
 12%|█▏        | 419/3449 [19:42<2:34:12,  3.05s/it] 12%|█▏        | 420/3449 [19:44<2:25:33,  2.88s/it]                                                    {'loss': 1.2532, 'learning_rate': 0.00039105653540929197, 'epoch': 0.12}
 12%|█▏        | 420/3449 [19:44<2:25:33,  2.88s/it] 12%|█▏        | 421/3449 [19:46<2:16:32,  2.71s/it]                                                    {'loss': 1.2392, 'learning_rate': 0.00039100097506697276, 'epoch': 0.12}
 12%|█▏        | 421/3449 [19:46<2:16:32,  2.71s/it] 12%|█▏        | 422/3449 [19:49<2:21:57,  2.81s/it]                                                    {'loss': 1.2665, 'learning_rate': 0.00039094524664892483, 'epoch': 0.12}
 12%|█▏        | 422/3449 [19:49<2:21:57,  2.81s/it] 12%|█▏        | 423/3449 [19:52<2:18:07,  2.74s/it]                                                    {'loss': 1.2964, 'learning_rate': 0.00039088935020418776, 'epoch': 0.12}
 12%|█▏        | 423/3449 [19:52<2:18:07,  2.74s/it] 12%|█▏        | 424/3449 [19:54<2:14:39,  2.67s/it]                                                    {'loss': 1.3515, 'learning_rate': 0.0003908332857819488, 'epoch': 0.12}
 12%|█▏        | 424/3449 [19:54<2:14:39,  2.67s/it] 12%|█▏        | 425/3449 [19:57<2:11:39,  2.61s/it]                                                    {'loss': 1.4667, 'learning_rate': 0.0003907770534315433, 'epoch': 0.12}
 12%|█▏        | 425/3449 [19:57<2:11:39,  2.61s/it] 12%|█▏        | 426/3449 [20:00<2:11:40,  2.61s/it]                                                    {'loss': 1.2508, 'learning_rate': 0.00039072065320245415, 'epoch': 0.12}
 12%|█▏        | 426/3449 [20:00<2:11:40,  2.61s/it] 12%|█▏        | 427/3449 [20:03<2:22:12,  2.82s/it]                                                    {'loss': 1.1843, 'learning_rate': 0.000390664085144312, 'epoch': 0.12}
 12%|█▏        | 427/3449 [20:03<2:22:12,  2.82s/it] 12%|█▏        | 428/3449 [20:06<2:32:57,  3.04s/it]                                                    {'loss': 1.2708, 'learning_rate': 0.0003906073493068952, 'epoch': 0.12}
 12%|█▏        | 428/3449 [20:06<2:32:57,  3.04s/it] 12%|█▏        | 429/3449 [20:09<2:25:39,  2.89s/it]                                                    {'loss': 1.2819, 'learning_rate': 0.0003905504457401299, 'epoch': 0.12}
 12%|█▏        | 429/3449 [20:09<2:25:39,  2.89s/it] 12%|█▏        | 430/3449 [20:12<2:29:56,  2.98s/it]                                                    {'loss': 1.3026, 'learning_rate': 0.00039049337449408955, 'epoch': 0.12}
 12%|█▏        | 430/3449 [20:12<2:29:56,  2.98s/it] 12%|█▏        | 431/3449 [20:15<2:27:47,  2.94s/it]                                                    {'loss': 1.3789, 'learning_rate': 0.0003904361356189954, 'epoch': 0.12}
 12%|█▏        | 431/3449 [20:15<2:27:47,  2.94s/it] 13%|█▎        | 432/3449 [20:19<2:41:17,  3.21s/it]                                                    {'loss': 1.324, 'learning_rate': 0.00039037872916521614, 'epoch': 0.13}
 13%|█▎        | 432/3449 [20:19<2:41:17,  3.21s/it] 13%|█▎        | 433/3449 [20:21<2:30:32,  2.99s/it]                                                    {'loss': 1.4777, 'learning_rate': 0.0003903211551832678, 'epoch': 0.13}
 13%|█▎        | 433/3449 [20:21<2:30:32,  2.99s/it] 13%|█▎        | 434/3449 [20:24<2:20:49,  2.80s/it]                                                    {'loss': 1.3832, 'learning_rate': 0.0003902634137238141, 'epoch': 0.13}
 13%|█▎        | 434/3449 [20:24<2:20:49,  2.80s/it] 13%|█▎        | 435/3449 [20:27<2:36:23,  3.11s/it]                                                    {'loss': 1.2534, 'learning_rate': 0.00039020550483766583, 'epoch': 0.13}
 13%|█▎        | 435/3449 [20:27<2:36:23,  3.11s/it] 13%|█▎        | 436/3449 [20:31<2:35:41,  3.10s/it]                                                    {'loss': 1.3532, 'learning_rate': 0.0003901474285757813, 'epoch': 0.13}
 13%|█▎        | 436/3449 [20:31<2:35:41,  3.10s/it] 13%|█▎        | 437/3449 [20:33<2:32:27,  3.04s/it]                                                    {'loss': 1.1942, 'learning_rate': 0.0003900891849892661, 'epoch': 0.13}
 13%|█▎        | 437/3449 [20:33<2:32:27,  3.04s/it] 13%|█▎        | 438/3449 [20:36<2:27:45,  2.94s/it]                                                    {'loss': 1.3259, 'learning_rate': 0.000390030774129373, 'epoch': 0.13}
 13%|█▎        | 438/3449 [20:36<2:27:45,  2.94s/it] 13%|█▎        | 439/3449 [20:39<2:21:40,  2.82s/it]                                                    {'loss': 1.3383, 'learning_rate': 0.00038997219604750195, 'epoch': 0.13}
 13%|█▎        | 439/3449 [20:39<2:21:40,  2.82s/it] 13%|█▎        | 440/3449 [20:41<2:19:01,  2.77s/it]                                                    {'loss': 1.3872, 'learning_rate': 0.00038991345079520014, 'epoch': 0.13}
 13%|█▎        | 440/3449 [20:41<2:19:01,  2.77s/it] 13%|█▎        | 441/3449 [20:44<2:15:16,  2.70s/it]                                                    {'loss': 1.2964, 'learning_rate': 0.00038985453842416183, 'epoch': 0.13}
 13%|█▎        | 441/3449 [20:44<2:15:16,  2.70s/it] 13%|█▎        | 442/3449 [20:46<2:11:56,  2.63s/it]                                                    {'loss': 1.4885, 'learning_rate': 0.0003897954589862282, 'epoch': 0.13}
 13%|█▎        | 442/3449 [20:46<2:11:56,  2.63s/it] 13%|█▎        | 443/3449 [20:49<2:10:01,  2.60s/it]                                                    {'loss': 1.1836, 'learning_rate': 0.00038973621253338776, 'epoch': 0.13}
 13%|█▎        | 443/3449 [20:49<2:10:01,  2.60s/it] 13%|█▎        | 444/3449 [20:52<2:15:54,  2.71s/it]                                                    {'loss': 1.3709, 'learning_rate': 0.0003896767991177757, 'epoch': 0.13}
 13%|█▎        | 444/3449 [20:52<2:15:54,  2.71s/it] 13%|█▎        | 445/3449 [20:55<2:29:21,  2.98s/it]                                                    {'loss': 1.3361, 'learning_rate': 0.0003896172187916741, 'epoch': 0.13}
 13%|█▎        | 445/3449 [20:55<2:29:21,  2.98s/it] 13%|█▎        | 446/3449 [20:58<2:25:59,  2.92s/it]                                                    {'loss': 1.4199, 'learning_rate': 0.0003895574716075123, 'epoch': 0.13}
 13%|█▎        | 446/3449 [20:58<2:25:59,  2.92s/it] 13%|█▎        | 447/3449 [21:02<2:38:56,  3.18s/it]                                                    {'loss': 1.3185, 'learning_rate': 0.00038949755761786604, 'epoch': 0.13}
 13%|█▎        | 447/3449 [21:02<2:38:56,  3.18s/it] 13%|█▎        | 448/3449 [21:04<2:28:09,  2.96s/it]                                                    {'loss': 1.4701, 'learning_rate': 0.0003894374768754581, 'epoch': 0.13}
 13%|█▎        | 448/3449 [21:04<2:28:09,  2.96s/it] 13%|█▎        | 449/3449 [21:07<2:24:46,  2.90s/it]                                                    {'loss': 1.2512, 'learning_rate': 0.0003893772294331578, 'epoch': 0.13}
 13%|█▎        | 449/3449 [21:07<2:24:46,  2.90s/it] 13%|█▎        | 450/3449 [21:10<2:24:36,  2.89s/it]                                                    {'loss': 1.4217, 'learning_rate': 0.00038931681534398147, 'epoch': 0.13}
 13%|█▎        | 450/3449 [21:10<2:24:36,  2.89s/it] 13%|█▎        | 451/3449 [21:13<2:17:40,  2.76s/it]                                                    {'loss': 1.393, 'learning_rate': 0.00038925623466109176, 'epoch': 0.13}
 13%|█▎        | 451/3449 [21:13<2:17:40,  2.76s/it] 13%|█▎        | 452/3449 [21:17<2:43:50,  3.28s/it]                                                    {'loss': 1.4419, 'learning_rate': 0.00038919548743779803, 'epoch': 0.13}
 13%|█▎        | 452/3449 [21:17<2:43:50,  3.28s/it] 13%|█▎        | 453/3449 [21:20<2:37:34,  3.16s/it]                                                    {'loss': 1.2372, 'learning_rate': 0.00038913457372755626, 'epoch': 0.13}
 13%|█▎        | 453/3449 [21:20<2:37:34,  3.16s/it] 13%|█▎        | 454/3449 [21:23<2:38:38,  3.18s/it]                                                    {'loss': 1.4241, 'learning_rate': 0.0003890734935839688, 'epoch': 0.13}
 13%|█▎        | 454/3449 [21:23<2:38:38,  3.18s/it] 13%|█▎        | 455/3449 [21:26<2:30:11,  3.01s/it]                                                    {'loss': 1.3903, 'learning_rate': 0.0003890122470607847, 'epoch': 0.13}
 13%|█▎        | 455/3449 [21:26<2:30:11,  3.01s/it] 13%|█▎        | 456/3449 [21:29<2:30:00,  3.01s/it]                                                    {'loss': 1.1638, 'learning_rate': 0.00038895083421189904, 'epoch': 0.13}
 13%|█▎        | 456/3449 [21:29<2:30:00,  3.01s/it] 13%|█▎        | 457/3449 [21:32<2:26:44,  2.94s/it]                                                    {'loss': 1.3148, 'learning_rate': 0.00038888925509135365, 'epoch': 0.13}
 13%|█▎        | 457/3449 [21:32<2:26:44,  2.94s/it] 13%|█▎        | 458/3449 [21:35<2:33:20,  3.08s/it]                                                    {'loss': 1.3197, 'learning_rate': 0.00038882750975333645, 'epoch': 0.13}
 13%|█▎        | 458/3449 [21:35<2:33:20,  3.08s/it] 13%|█▎        | 459/3449 [21:38<2:29:55,  3.01s/it]                                                    {'loss': 1.3027, 'learning_rate': 0.00038876559825218164, 'epoch': 0.13}
 13%|█▎        | 459/3449 [21:38<2:29:55,  3.01s/it] 13%|█▎        | 460/3449 [21:41<2:34:04,  3.09s/it]                                                    {'loss': 1.2378, 'learning_rate': 0.0003887035206423697, 'epoch': 0.13}
 13%|█▎        | 460/3449 [21:41<2:34:04,  3.09s/it] 13%|█▎        | 461/3449 [21:43<2:23:41,  2.89s/it]                                                    {'loss': 1.2874, 'learning_rate': 0.0003886412769785273, 'epoch': 0.13}
 13%|█▎        | 461/3449 [21:43<2:23:41,  2.89s/it] 13%|█▎        | 462/3449 [21:47<2:33:14,  3.08s/it]                                                    {'loss': 1.3247, 'learning_rate': 0.0003885788673154272, 'epoch': 0.13}
 13%|█▎        | 462/3449 [21:47<2:33:14,  3.08s/it] 13%|█▎        | 463/3449 [21:50<2:28:06,  2.98s/it]                                                    {'loss': 1.4948, 'learning_rate': 0.0003885162917079881, 'epoch': 0.13}
 13%|█▎        | 463/3449 [21:50<2:28:06,  2.98s/it] 13%|█▎        | 464/3449 [21:52<2:18:19,  2.78s/it]                                                    {'loss': 1.3641, 'learning_rate': 0.00038845355021127495, 'epoch': 0.13}
 13%|█▎        | 464/3449 [21:52<2:18:19,  2.78s/it] 13%|█▎        | 465/3449 [21:55<2:20:11,  2.82s/it]                                                    {'loss': 1.2692, 'learning_rate': 0.0003883906428804986, 'epoch': 0.13}
 13%|█▎        | 465/3449 [21:55<2:20:11,  2.82s/it] 14%|█▎        | 466/3449 [21:58<2:16:29,  2.75s/it]                                                    {'loss': 1.2695, 'learning_rate': 0.00038832756977101574, 'epoch': 0.14}
 14%|█▎        | 466/3449 [21:58<2:16:29,  2.75s/it] 14%|█▎        | 467/3449 [22:00<2:18:06,  2.78s/it]                                                    {'loss': 1.3523, 'learning_rate': 0.00038826433093832913, 'epoch': 0.14}
 14%|█▎        | 467/3449 [22:00<2:18:06,  2.78s/it] 14%|█▎        | 468/3449 [22:03<2:13:58,  2.70s/it]                                                    {'loss': 1.4101, 'learning_rate': 0.0003882009264380871, 'epoch': 0.14}
 14%|█▎        | 468/3449 [22:03<2:13:58,  2.70s/it] 14%|█▎        | 469/3449 [22:06<2:26:26,  2.95s/it]                                                    {'loss': 1.1302, 'learning_rate': 0.0003881373563260841, 'epoch': 0.14}
 14%|█▎        | 469/3449 [22:06<2:26:26,  2.95s/it] 14%|█▎        | 470/3449 [22:11<2:43:11,  3.29s/it]                                                    {'loss': 1.4, 'learning_rate': 0.0003880736206582599, 'epoch': 0.14}
 14%|█▎        | 470/3449 [22:11<2:43:11,  3.29s/it] 14%|█▎        | 471/3449 [22:13<2:34:54,  3.12s/it]                                                    {'loss': 1.2677, 'learning_rate': 0.0003880097194907003, 'epoch': 0.14}
 14%|█▎        | 471/3449 [22:13<2:34:54,  3.12s/it] 14%|█▎        | 472/3449 [22:16<2:28:44,  3.00s/it]                                                    {'loss': 1.2799, 'learning_rate': 0.00038794565287963653, 'epoch': 0.14}
 14%|█▎        | 472/3449 [22:16<2:28:44,  3.00s/it] 14%|█▎        | 473/3449 [22:19<2:27:29,  2.97s/it]                                                    {'loss': 1.4191, 'learning_rate': 0.00038788142088144566, 'epoch': 0.14}
 14%|█▎        | 473/3449 [22:19<2:27:29,  2.97s/it] 14%|█▎        | 474/3449 [22:23<2:39:48,  3.22s/it]                                                    {'loss': 1.1316, 'learning_rate': 0.00038781702355264995, 'epoch': 0.14}
 14%|█▎        | 474/3449 [22:23<2:39:48,  3.22s/it] 14%|█▍        | 475/3449 [22:25<2:29:33,  3.02s/it]                                                    {'loss': 1.3546, 'learning_rate': 0.00038775246094991734, 'epoch': 0.14}
 14%|█▍        | 475/3449 [22:25<2:29:33,  3.02s/it] 14%|█▍        | 476/3449 [22:28<2:22:21,  2.87s/it]                                                    {'loss': 1.2596, 'learning_rate': 0.0003876877331300613, 'epoch': 0.14}
 14%|█▍        | 476/3449 [22:28<2:22:21,  2.87s/it] 14%|█▍        | 477/3449 [22:30<2:11:32,  2.66s/it]                                                    {'loss': 1.5291, 'learning_rate': 0.0003876228401500404, 'epoch': 0.14}
 14%|█▍        | 477/3449 [22:30<2:11:32,  2.66s/it] 14%|█▍        | 478/3449 [22:33<2:10:56,  2.64s/it]                                                    {'loss': 1.4081, 'learning_rate': 0.0003875577820669589, 'epoch': 0.14}
 14%|█▍        | 478/3449 [22:33<2:10:56,  2.64s/it] 14%|█▍        | 479/3449 [22:36<2:22:12,  2.87s/it]                                                    {'loss': 1.2045, 'learning_rate': 0.0003874925589380661, 'epoch': 0.14}
 14%|█▍        | 479/3449 [22:36<2:22:12,  2.87s/it] 14%|█▍        | 480/3449 [22:39<2:18:20,  2.80s/it]                                                    {'loss': 1.3115, 'learning_rate': 0.0003874271708207565, 'epoch': 0.14}
 14%|█▍        | 480/3449 [22:39<2:18:20,  2.80s/it] 14%|█▍        | 481/3449 [22:41<2:16:23,  2.76s/it]                                                    {'loss': 1.3006, 'learning_rate': 0.00038736161777257004, 'epoch': 0.14}
 14%|█▍        | 481/3449 [22:41<2:16:23,  2.76s/it] 14%|█▍        | 482/3449 [22:44<2:17:19,  2.78s/it]                                                    {'loss': 1.2511, 'learning_rate': 0.00038729589985119156, 'epoch': 0.14}
 14%|█▍        | 482/3449 [22:44<2:17:19,  2.78s/it] 14%|█▍        | 483/3449 [22:47<2:14:23,  2.72s/it]                                                    {'loss': 1.3153, 'learning_rate': 0.0003872300171144511, 'epoch': 0.14}
 14%|█▍        | 483/3449 [22:47<2:14:23,  2.72s/it] 14%|█▍        | 484/3449 [22:49<2:15:09,  2.73s/it]                                                    {'loss': 1.5334, 'learning_rate': 0.00038716396962032364, 'epoch': 0.14}
 14%|█▍        | 484/3449 [22:49<2:15:09,  2.73s/it] 14%|█▍        | 485/3449 [22:52<2:12:40,  2.69s/it]                                                    {'loss': 1.3983, 'learning_rate': 0.00038709775742692927, 'epoch': 0.14}
 14%|█▍        | 485/3449 [22:52<2:12:40,  2.69s/it] 14%|█▍        | 486/3449 [22:55<2:17:10,  2.78s/it]                                                    {'loss': 1.2143, 'learning_rate': 0.0003870313805925329, 'epoch': 0.14}
 14%|█▍        | 486/3449 [22:55<2:17:10,  2.78s/it] 14%|█▍        | 487/3449 [22:58<2:14:18,  2.72s/it]                                                    {'loss': 1.3641, 'learning_rate': 0.0003869648391755444, 'epoch': 0.14}
 14%|█▍        | 487/3449 [22:58<2:14:18,  2.72s/it] 14%|█▍        | 488/3449 [23:00<2:14:32,  2.73s/it]                                                    {'loss': 1.4607, 'learning_rate': 0.00038689813323451836, 'epoch': 0.14}
 14%|█▍        | 488/3449 [23:00<2:14:32,  2.73s/it] 14%|█▍        | 489/3449 [23:03<2:13:42,  2.71s/it]                                                    {'loss': 1.2097, 'learning_rate': 0.0003868312628281543, 'epoch': 0.14}
 14%|█▍        | 489/3449 [23:03<2:13:42,  2.71s/it] 14%|█▍        | 490/3449 [23:06<2:16:29,  2.77s/it]                                                    {'loss': 1.2142, 'learning_rate': 0.0003867642280152963, 'epoch': 0.14}
 14%|█▍        | 490/3449 [23:06<2:16:29,  2.77s/it] 14%|█▍        | 491/3449 [23:10<2:36:37,  3.18s/it]                                                    {'loss': 1.1171, 'learning_rate': 0.0003866970288549333, 'epoch': 0.14}
 14%|█▍        | 491/3449 [23:10<2:36:37,  3.18s/it] 14%|█▍        | 492/3449 [23:12<2:24:59,  2.94s/it]                                                    {'loss': 1.3582, 'learning_rate': 0.0003866296654061986, 'epoch': 0.14}
 14%|█▍        | 492/3449 [23:12<2:24:59,  2.94s/it] 14%|█▍        | 493/3449 [23:16<2:33:25,  3.11s/it]                                                    {'loss': 1.2705, 'learning_rate': 0.00038656213772837045, 'epoch': 0.14}
 14%|█▍        | 493/3449 [23:16<2:33:25,  3.11s/it] 14%|█▍        | 494/3449 [23:19<2:26:42,  2.98s/it]                                                    {'loss': 1.0947, 'learning_rate': 0.00038649444588087115, 'epoch': 0.14}
 14%|█▍        | 494/3449 [23:19<2:26:42,  2.98s/it] 14%|█▍        | 495/3449 [23:22<2:27:44,  3.00s/it]                                                    {'loss': 1.3349, 'learning_rate': 0.00038642658992326794, 'epoch': 0.14}
 14%|█▍        | 495/3449 [23:22<2:27:44,  3.00s/it] 14%|█▍        | 496/3449 [23:24<2:22:21,  2.89s/it]                                                    {'loss': 1.3444, 'learning_rate': 0.00038635856991527204, 'epoch': 0.14}
 14%|█▍        | 496/3449 [23:24<2:22:21,  2.89s/it] 14%|█▍        | 497/3449 [23:27<2:19:11,  2.83s/it]                                                    {'loss': 1.2091, 'learning_rate': 0.0003862903859167393, 'epoch': 0.14}
 14%|█▍        | 497/3449 [23:27<2:19:11,  2.83s/it] 14%|█▍        | 498/3449 [23:30<2:15:29,  2.75s/it]                                                    {'loss': 1.3876, 'learning_rate': 0.00038622203798766984, 'epoch': 0.14}
 14%|█▍        | 498/3449 [23:30<2:15:29,  2.75s/it] 14%|█▍        | 499/3449 [23:33<2:30:27,  3.06s/it]                                                    {'loss': 1.3659, 'learning_rate': 0.000386153526188208, 'epoch': 0.14}
 14%|█▍        | 499/3449 [23:33<2:30:27,  3.06s/it] 14%|█▍        | 500/3449 [23:36<2:28:00,  3.01s/it]                                                    {'loss': 1.3617, 'learning_rate': 0.00038608485057864227, 'epoch': 0.14}
 14%|█▍        | 500/3449 [23:36<2:28:00,  3.01s/it] 15%|█▍        | 501/3449 [23:38<2:17:30,  2.80s/it]                                                    {'loss': 1.3491, 'learning_rate': 0.0003860160112194054, 'epoch': 0.15}
 15%|█▍        | 501/3449 [23:39<2:17:30,  2.80s/it] 15%|█▍        | 502/3449 [23:41<2:20:04,  2.85s/it]                                                    {'loss': 1.2504, 'learning_rate': 0.00038594700817107415, 'epoch': 0.15}
 15%|█▍        | 502/3449 [23:41<2:20:04,  2.85s/it] 15%|█▍        | 503/3449 [23:46<2:41:03,  3.28s/it]                                                    {'loss': 1.297, 'learning_rate': 0.0003858778414943694, 'epoch': 0.15}
 15%|█▍        | 503/3449 [23:46<2:41:03,  3.28s/it] 15%|█▍        | 504/3449 [23:48<2:30:23,  3.06s/it]                                                    {'loss': 1.4889, 'learning_rate': 0.00038580851125015583, 'epoch': 0.15}
 15%|█▍        | 504/3449 [23:48<2:30:23,  3.06s/it] 15%|█▍        | 505/3449 [23:53<2:47:05,  3.41s/it]                                                    {'loss': 1.3215, 'learning_rate': 0.0003857390174994424, 'epoch': 0.15}
 15%|█▍        | 505/3449 [23:53<2:47:05,  3.41s/it] 15%|█▍        | 506/3449 [23:55<2:33:40,  3.13s/it]                                                    {'loss': 1.336, 'learning_rate': 0.00038566936030338153, 'epoch': 0.15}
 15%|█▍        | 506/3449 [23:55<2:33:40,  3.13s/it] 15%|█▍        | 507/3449 [23:57<2:22:41,  2.91s/it]                                                    {'loss': 1.4424, 'learning_rate': 0.00038559953972326985, 'epoch': 0.15}
 15%|█▍        | 507/3449 [23:57<2:22:41,  2.91s/it] 15%|█▍        | 508/3449 [24:00<2:15:14,  2.76s/it]                                                    {'loss': 1.3839, 'learning_rate': 0.0003855295558205475, 'epoch': 0.15}
 15%|█▍        | 508/3449 [24:00<2:15:14,  2.76s/it] 15%|█▍        | 509/3449 [24:03<2:17:01,  2.80s/it]                                                    {'loss': 1.4157, 'learning_rate': 0.00038545940865679845, 'epoch': 0.15}
 15%|█▍        | 509/3449 [24:03<2:17:01,  2.80s/it] 15%|█▍        | 510/3449 [24:05<2:14:47,  2.75s/it]                                                    {'loss': 1.3802, 'learning_rate': 0.00038538909829375034, 'epoch': 0.15}
 15%|█▍        | 510/3449 [24:05<2:14:47,  2.75s/it] 15%|█▍        | 511/3449 [24:08<2:15:13,  2.76s/it]                                                    {'loss': 1.4247, 'learning_rate': 0.0003853186247932744, 'epoch': 0.15}
 15%|█▍        | 511/3449 [24:08<2:15:13,  2.76s/it] 15%|█▍        | 512/3449 [24:11<2:16:51,  2.80s/it]                                                    {'loss': 1.2501, 'learning_rate': 0.0003852479882173854, 'epoch': 0.15}
 15%|█▍        | 512/3449 [24:11<2:16:51,  2.80s/it] 15%|█▍        | 513/3449 [24:13<2:11:02,  2.68s/it]                                                    {'loss': 1.3293, 'learning_rate': 0.00038517718862824166, 'epoch': 0.15}
 15%|█▍        | 513/3449 [24:13<2:11:02,  2.68s/it] 15%|█▍        | 514/3449 [24:16<2:11:57,  2.70s/it]                                                    {'loss': 1.3841, 'learning_rate': 0.00038510622608814486, 'epoch': 0.15}
 15%|█▍        | 514/3449 [24:16<2:11:57,  2.70s/it] 15%|█▍        | 515/3449 [24:19<2:09:59,  2.66s/it]                                                    {'loss': 1.3453, 'learning_rate': 0.00038503510065954026, 'epoch': 0.15}
 15%|█▍        | 515/3449 [24:19<2:09:59,  2.66s/it] 15%|█▍        | 516/3449 [24:21<2:07:35,  2.61s/it]                                                    {'loss': 1.2539, 'learning_rate': 0.00038496381240501614, 'epoch': 0.15}
 15%|█▍        | 516/3449 [24:21<2:07:35,  2.61s/it] 15%|█▍        | 517/3449 [24:24<2:13:42,  2.74s/it]                                                    {'loss': 1.2811, 'learning_rate': 0.0003848923613873044, 'epoch': 0.15}
 15%|█▍        | 517/3449 [24:24<2:13:42,  2.74s/it] 15%|█▌        | 518/3449 [24:26<2:06:20,  2.59s/it]                                                    {'loss': 1.3435, 'learning_rate': 0.00038482074766927997, 'epoch': 0.15}
 15%|█▌        | 518/3449 [24:26<2:06:20,  2.59s/it] 15%|█▌        | 519/3449 [24:29<2:06:29,  2.59s/it]                                                    {'loss': 1.2876, 'learning_rate': 0.0003847489713139609, 'epoch': 0.15}
 15%|█▌        | 519/3449 [24:29<2:06:29,  2.59s/it] 15%|█▌        | 520/3449 [24:32<2:14:19,  2.75s/it]                                                    {'loss': 1.185, 'learning_rate': 0.00038467703238450864, 'epoch': 0.15}
 15%|█▌        | 520/3449 [24:32<2:14:19,  2.75s/it] 15%|█▌        | 521/3449 [24:36<2:22:51,  2.93s/it]                                                    {'loss': 1.196, 'learning_rate': 0.00038460493094422734, 'epoch': 0.15}
 15%|█▌        | 521/3449 [24:36<2:22:51,  2.93s/it] 15%|█▌        | 522/3449 [24:38<2:16:09,  2.79s/it]                                                    {'loss': 1.3964, 'learning_rate': 0.0003845326670565645, 'epoch': 0.15}
 15%|█▌        | 522/3449 [24:38<2:16:09,  2.79s/it] 15%|█▌        | 523/3449 [24:41<2:16:06,  2.79s/it]                                                    {'loss': 1.4147, 'learning_rate': 0.0003844602407851103, 'epoch': 0.15}
 15%|█▌        | 523/3449 [24:41<2:16:06,  2.79s/it] 15%|█▌        | 524/3449 [24:44<2:17:16,  2.82s/it]                                                    {'loss': 1.352, 'learning_rate': 0.0003843876521935979, 'epoch': 0.15}
 15%|█▌        | 524/3449 [24:44<2:17:16,  2.82s/it] 15%|█▌        | 525/3449 [24:47<2:21:15,  2.90s/it]                                                    {'loss': 1.2607, 'learning_rate': 0.00038431490134590337, 'epoch': 0.15}
 15%|█▌        | 525/3449 [24:47<2:21:15,  2.90s/it] 15%|█▌        | 526/3449 [24:50<2:19:59,  2.87s/it]                                                    {'loss': 1.2796, 'learning_rate': 0.0003842419883060454, 'epoch': 0.15}
 15%|█▌        | 526/3449 [24:50<2:19:59,  2.87s/it] 15%|█▌        | 527/3449 [24:52<2:13:48,  2.75s/it]                                                    {'loss': 1.3396, 'learning_rate': 0.0003841689131381856, 'epoch': 0.15}
 15%|█▌        | 527/3449 [24:52<2:13:48,  2.75s/it] 15%|█▌        | 528/3449 [24:55<2:11:36,  2.70s/it]                                                    {'loss': 1.4369, 'learning_rate': 0.0003840956759066282, 'epoch': 0.15}
 15%|█▌        | 528/3449 [24:55<2:11:36,  2.70s/it] 15%|█▌        | 529/3449 [24:57<2:08:35,  2.64s/it]                                                    {'loss': 1.5503, 'learning_rate': 0.0003840222766758198, 'epoch': 0.15}
 15%|█▌        | 529/3449 [24:57<2:08:35,  2.64s/it] 15%|█▌        | 530/3449 [24:59<2:01:53,  2.51s/it]                                                    {'loss': 1.3106, 'learning_rate': 0.00038394871551035003, 'epoch': 0.15}
 15%|█▌        | 530/3449 [24:59<2:01:53,  2.51s/it] 15%|█▌        | 531/3449 [25:02<2:05:54,  2.59s/it]                                                    {'loss': 1.3839, 'learning_rate': 0.0003838749924749505, 'epoch': 0.15}
 15%|█▌        | 531/3449 [25:02<2:05:54,  2.59s/it] 15%|█▌        | 532/3449 [25:05<2:12:35,  2.73s/it]                                                    {'loss': 1.3257, 'learning_rate': 0.00038380110763449563, 'epoch': 0.15}
 15%|█▌        | 532/3449 [25:05<2:12:35,  2.73s/it] 15%|█▌        | 533/3449 [25:07<2:06:11,  2.60s/it]                                                    {'loss': 1.4503, 'learning_rate': 0.00038372706105400207, 'epoch': 0.15}
 15%|█▌        | 533/3449 [25:07<2:06:11,  2.60s/it] 15%|█▌        | 534/3449 [25:10<2:10:43,  2.69s/it]                                                    {'loss': 1.2723, 'learning_rate': 0.00038365285279862876, 'epoch': 0.15}
 15%|█▌        | 534/3449 [25:10<2:10:43,  2.69s/it] 16%|█▌        | 535/3449 [25:13<2:07:06,  2.62s/it]                                                    {'loss': 1.4161, 'learning_rate': 0.000383578482933677, 'epoch': 0.16}
 16%|█▌        | 535/3449 [25:13<2:07:06,  2.62s/it] 16%|█▌        | 536/3449 [25:19<3:06:24,  3.84s/it]                                                    {'loss': 1.1735, 'learning_rate': 0.0003835039515245904, 'epoch': 0.16}
 16%|█▌        | 536/3449 [25:19<3:06:24,  3.84s/it] 16%|█▌        | 537/3449 [25:22<2:48:32,  3.47s/it]                                                    {'loss': 1.2848, 'learning_rate': 0.0003834292586369545, 'epoch': 0.16}
 16%|█▌        | 537/3449 [25:22<2:48:32,  3.47s/it] 16%|█▌        | 538/3449 [25:25<2:38:03,  3.26s/it]                                                    {'loss': 1.3721, 'learning_rate': 0.00038335440433649693, 'epoch': 0.16}
 16%|█▌        | 538/3449 [25:25<2:38:03,  3.26s/it] 16%|█▌        | 539/3449 [25:27<2:25:06,  2.99s/it]                                                    {'loss': 1.3287, 'learning_rate': 0.00038327938868908763, 'epoch': 0.16}
 16%|█▌        | 539/3449 [25:27<2:25:06,  2.99s/it] 16%|█▌        | 540/3449 [25:30<2:18:58,  2.87s/it]                                                    {'loss': 1.5261, 'learning_rate': 0.00038320421176073823, 'epoch': 0.16}
 16%|█▌        | 540/3449 [25:30<2:18:58,  2.87s/it] 16%|█▌        | 541/3449 [25:32<2:12:01,  2.72s/it]                                                    {'loss': 1.3888, 'learning_rate': 0.0003831288736176025, 'epoch': 0.16}
 16%|█▌        | 541/3449 [25:32<2:12:01,  2.72s/it] 16%|█▌        | 542/3449 [25:35<2:07:51,  2.64s/it]                                                    {'loss': 1.3134, 'learning_rate': 0.000383053374325976, 'epoch': 0.16}
 16%|█▌        | 542/3449 [25:35<2:07:51,  2.64s/it] 16%|█▌        | 543/3449 [25:37<2:03:46,  2.56s/it]                                                    {'loss': 1.3813, 'learning_rate': 0.00038297771395229594, 'epoch': 0.16}
 16%|█▌        | 543/3449 [25:37<2:03:46,  2.56s/it] 16%|█▌        | 544/3449 [25:40<2:06:56,  2.62s/it]                                                    {'loss': 1.2592, 'learning_rate': 0.00038290189256314156, 'epoch': 0.16}
 16%|█▌        | 544/3449 [25:40<2:06:56,  2.62s/it] 16%|█▌        | 545/3449 [25:44<2:36:26,  3.23s/it]                                                    {'loss': 1.2625, 'learning_rate': 0.00038282591022523356, 'epoch': 0.16}
 16%|█▌        | 545/3449 [25:44<2:36:26,  3.23s/it] 16%|█▌        | 546/3449 [25:47<2:31:03,  3.12s/it]                                                    {'loss': 1.2192, 'learning_rate': 0.0003827497670054344, 'epoch': 0.16}
 16%|█▌        | 546/3449 [25:47<2:31:03,  3.12s/it] 16%|█▌        | 547/3449 [25:50<2:27:58,  3.06s/it]                                                    {'loss': 1.2154, 'learning_rate': 0.0003826734629707481, 'epoch': 0.16}
 16%|█▌        | 547/3449 [25:50<2:27:58,  3.06s/it] 16%|█▌        | 548/3449 [25:54<2:37:23,  3.26s/it]                                                    {'loss': 1.3196, 'learning_rate': 0.0003825969981883201, 'epoch': 0.16}
 16%|█▌        | 548/3449 [25:54<2:37:23,  3.26s/it] 16%|█▌        | 549/3449 [25:57<2:31:16,  3.13s/it]                                                    {'loss': 1.3649, 'learning_rate': 0.00038252037272543734, 'epoch': 0.16}
 16%|█▌        | 549/3449 [25:57<2:31:16,  3.13s/it] 16%|█▌        | 550/3449 [26:01<2:42:32,  3.36s/it]                                                    {'loss': 1.2522, 'learning_rate': 0.0003824435866495282, 'epoch': 0.16}
 16%|█▌        | 550/3449 [26:01<2:42:32,  3.36s/it] 16%|█▌        | 551/3449 [26:04<2:36:50,  3.25s/it]                                                    {'loss': 1.2861, 'learning_rate': 0.00038236664002816244, 'epoch': 0.16}
 16%|█▌        | 551/3449 [26:04<2:36:50,  3.25s/it] 16%|█▌        | 552/3449 [26:07<2:32:31,  3.16s/it]                                                    {'loss': 1.3513, 'learning_rate': 0.00038228953292905094, 'epoch': 0.16}
 16%|█▌        | 552/3449 [26:07<2:32:31,  3.16s/it] 16%|█▌        | 553/3449 [26:09<2:27:22,  3.05s/it]                                                    {'loss': 1.2638, 'learning_rate': 0.0003822122654200458, 'epoch': 0.16}
 16%|█▌        | 553/3449 [26:09<2:27:22,  3.05s/it] 16%|█▌        | 554/3449 [26:12<2:24:58,  3.00s/it]                                                    {'loss': 1.2824, 'learning_rate': 0.0003821348375691405, 'epoch': 0.16}
 16%|█▌        | 554/3449 [26:12<2:24:58,  3.00s/it] 16%|█▌        | 555/3449 [26:15<2:21:54,  2.94s/it]                                                    {'loss': 1.4368, 'learning_rate': 0.0003820572494444694, 'epoch': 0.16}
 16%|█▌        | 555/3449 [26:15<2:21:54,  2.94s/it] 16%|█▌        | 556/3449 [26:18<2:14:33,  2.79s/it]                                                    {'loss': 1.3823, 'learning_rate': 0.00038197950111430794, 'epoch': 0.16}
 16%|█▌        | 556/3449 [26:18<2:14:33,  2.79s/it] 16%|█▌        | 557/3449 [26:20<2:12:24,  2.75s/it]                                                    {'loss': 1.4946, 'learning_rate': 0.00038190159264707267, 'epoch': 0.16}
 16%|█▌        | 557/3449 [26:20<2:12:24,  2.75s/it] 16%|█▌        | 558/3449 [26:23<2:14:21,  2.79s/it]                                                    {'loss': 1.3771, 'learning_rate': 0.00038182352411132085, 'epoch': 0.16}
 16%|█▌        | 558/3449 [26:23<2:14:21,  2.79s/it] 16%|█▌        | 559/3449 [26:25<2:08:11,  2.66s/it]                                                    {'loss': 1.367, 'learning_rate': 0.0003817452955757507, 'epoch': 0.16}
 16%|█▌        | 559/3449 [26:25<2:08:11,  2.66s/it] 16%|█▌        | 560/3449 [26:29<2:22:12,  2.95s/it]                                                    {'loss': 1.2109, 'learning_rate': 0.00038166690710920124, 'epoch': 0.16}
 16%|█▌        | 560/3449 [26:29<2:22:12,  2.95s/it] 16%|█▋        | 561/3449 [26:35<3:09:55,  3.95s/it]                                                    {'loss': 1.1682, 'learning_rate': 0.00038158835878065225, 'epoch': 0.16}
 16%|█▋        | 561/3449 [26:35<3:09:55,  3.95s/it] 16%|█▋        | 562/3449 [26:38<2:53:40,  3.61s/it]                                                    {'loss': 1.2641, 'learning_rate': 0.0003815096506592241, 'epoch': 0.16}
 16%|█▋        | 562/3449 [26:38<2:53:40,  3.61s/it] 16%|█▋        | 563/3449 [26:41<2:40:51,  3.34s/it]                                                    {'loss': 1.4155, 'learning_rate': 0.0003814307828141779, 'epoch': 0.16}
 16%|█▋        | 563/3449 [26:41<2:40:51,  3.34s/it] 16%|█▋        | 564/3449 [26:44<2:30:42,  3.13s/it]                                                    {'loss': 1.4218, 'learning_rate': 0.00038135175531491515, 'epoch': 0.16}
 16%|█▋        | 564/3449 [26:44<2:30:42,  3.13s/it] 16%|█▋        | 565/3449 [26:46<2:22:04,  2.96s/it]                                                    {'loss': 1.198, 'learning_rate': 0.00038127256823097794, 'epoch': 0.16}
 16%|█▋        | 565/3449 [26:46<2:22:04,  2.96s/it] 16%|█▋        | 566/3449 [26:51<2:49:31,  3.53s/it]                                                    {'loss': 1.3554, 'learning_rate': 0.00038119322163204886, 'epoch': 0.16}
 16%|█▋        | 566/3449 [26:51<2:49:31,  3.53s/it] 16%|█▋        | 567/3449 [26:54<2:41:16,  3.36s/it]                                                    {'loss': 1.1691, 'learning_rate': 0.00038111371558795064, 'epoch': 0.16}
 16%|█▋        | 567/3449 [26:54<2:41:16,  3.36s/it] 16%|█▋        | 568/3449 [26:56<2:23:55,  3.00s/it]                                                    {'loss': 1.326, 'learning_rate': 0.0003810340501686466, 'epoch': 0.16}
 16%|█▋        | 568/3449 [26:56<2:23:55,  3.00s/it] 16%|█▋        | 569/3449 [26:58<2:15:12,  2.82s/it]                                                    {'loss': 1.4071, 'learning_rate': 0.0003809542254442401, 'epoch': 0.16}
 16%|█▋        | 569/3449 [26:58<2:15:12,  2.82s/it] 17%|█▋        | 570/3449 [27:01<2:08:09,  2.67s/it]                                                    {'loss': 1.3133, 'learning_rate': 0.0003808742414849748, 'epoch': 0.17}
 17%|█▋        | 570/3449 [27:01<2:08:09,  2.67s/it] 17%|█▋        | 571/3449 [27:03<2:07:59,  2.67s/it]                                                    {'loss': 1.3361, 'learning_rate': 0.0003807940983612344, 'epoch': 0.17}
 17%|█▋        | 571/3449 [27:03<2:07:59,  2.67s/it] 17%|█▋        | 572/3449 [27:07<2:14:29,  2.80s/it]                                                    {'loss': 1.2362, 'learning_rate': 0.0003807137961435427, 'epoch': 0.17}
 17%|█▋        | 572/3449 [27:07<2:14:29,  2.80s/it] 17%|█▋        | 573/3449 [27:09<2:08:15,  2.68s/it]                                                    {'loss': 1.431, 'learning_rate': 0.00038063333490256354, 'epoch': 0.17}
 17%|█▋        | 573/3449 [27:09<2:08:15,  2.68s/it] 17%|█▋        | 574/3449 [27:12<2:07:56,  2.67s/it]                                                    {'loss': 1.2436, 'learning_rate': 0.00038055271470910053, 'epoch': 0.17}
 17%|█▋        | 574/3449 [27:12<2:07:56,  2.67s/it] 17%|█▋        | 575/3449 [27:14<2:07:12,  2.66s/it]                                                    {'loss': 1.2789, 'learning_rate': 0.00038047193563409744, 'epoch': 0.17}
 17%|█▋        | 575/3449 [27:14<2:07:12,  2.66s/it] 17%|█▋        | 576/3449 [27:17<2:05:03,  2.61s/it]                                                    {'loss': 1.2921, 'learning_rate': 0.00038039099774863754, 'epoch': 0.17}
 17%|█▋        | 576/3449 [27:17<2:05:03,  2.61s/it] 17%|█▋        | 577/3449 [27:19<2:05:36,  2.62s/it]                                                    {'loss': 1.2558, 'learning_rate': 0.00038030990112394413, 'epoch': 0.17}
 17%|█▋        | 577/3449 [27:19<2:05:36,  2.62s/it] 17%|█▋        | 578/3449 [27:22<2:06:41,  2.65s/it]                                                    {'loss': 1.3656, 'learning_rate': 0.0003802286458313799, 'epoch': 0.17}
 17%|█▋        | 578/3449 [27:22<2:06:41,  2.65s/it] 17%|█▋        | 579/3449 [27:25<2:03:56,  2.59s/it]                                                    {'loss': 1.2975, 'learning_rate': 0.00038014723194244746, 'epoch': 0.17}
 17%|█▋        | 579/3449 [27:25<2:03:56,  2.59s/it] 17%|█▋        | 580/3449 [27:28<2:16:00,  2.84s/it]                                                    {'loss': 1.3769, 'learning_rate': 0.0003800656595287888, 'epoch': 0.17}
 17%|█▋        | 580/3449 [27:28<2:16:00,  2.84s/it] 17%|█▋        | 581/3449 [27:30<2:08:35,  2.69s/it]                                                    {'loss': 1.4537, 'learning_rate': 0.0003799839286621855, 'epoch': 0.17}
 17%|█▋        | 581/3449 [27:30<2:08:35,  2.69s/it] 17%|█▋        | 582/3449 [27:34<2:18:46,  2.90s/it]                                                    {'loss': 1.2094, 'learning_rate': 0.0003799020394145584, 'epoch': 0.17}
 17%|█▋        | 582/3449 [27:34<2:18:46,  2.90s/it] 17%|█▋        | 583/3449 [27:37<2:24:11,  3.02s/it]                                                    {'loss': 1.3608, 'learning_rate': 0.0003798199918579679, 'epoch': 0.17}
 17%|█▋        | 583/3449 [27:37<2:24:11,  3.02s/it] 17%|█▋        | 584/3449 [27:40<2:22:47,  2.99s/it]                                                    {'loss': 1.2369, 'learning_rate': 0.0003797377860646138, 'epoch': 0.17}
 17%|█▋        | 584/3449 [27:40<2:22:47,  2.99s/it] 17%|█▋        | 585/3449 [27:43<2:21:47,  2.97s/it]                                                    {'loss': 1.3911, 'learning_rate': 0.00037965542210683474, 'epoch': 0.17}
 17%|█▋        | 585/3449 [27:43<2:21:47,  2.97s/it] 17%|█▋        | 586/3449 [27:45<2:11:29,  2.76s/it]                                                    {'loss': 1.292, 'learning_rate': 0.000379572900057109, 'epoch': 0.17}
 17%|█▋        | 586/3449 [27:45<2:11:29,  2.76s/it] 17%|█▋        | 587/3449 [27:48<2:10:56,  2.75s/it]                                                    {'loss': 1.3406, 'learning_rate': 0.0003794902199880536, 'epoch': 0.17}
 17%|█▋        | 587/3449 [27:48<2:10:56,  2.75s/it] 17%|█▋        | 588/3449 [27:50<2:05:49,  2.64s/it]                                                    {'loss': 1.2936, 'learning_rate': 0.0003794073819724249, 'epoch': 0.17}
 17%|█▋        | 588/3449 [27:50<2:05:49,  2.64s/it] 17%|█▋        | 589/3449 [27:52<2:00:02,  2.52s/it]                                                    {'loss': 1.529, 'learning_rate': 0.0003793243860831181, 'epoch': 0.17}
 17%|█▋        | 589/3449 [27:52<2:00:02,  2.52s/it] 17%|█▋        | 590/3449 [27:56<2:08:25,  2.70s/it]                                                    {'loss': 1.2615, 'learning_rate': 0.0003792412323931673, 'epoch': 0.17}
 17%|█▋        | 590/3449 [27:56<2:08:25,  2.70s/it] 17%|█▋        | 591/3449 [27:59<2:21:54,  2.98s/it]                                                    {'loss': 1.2682, 'learning_rate': 0.00037915792097574557, 'epoch': 0.17}
 17%|█▋        | 591/3449 [27:59<2:21:54,  2.98s/it] 17%|█▋        | 592/3449 [28:02<2:20:26,  2.95s/it]                                                    {'loss': 1.4804, 'learning_rate': 0.0003790744519041647, 'epoch': 0.17}
 17%|█▋        | 592/3449 [28:02<2:20:26,  2.95s/it] 17%|█▋        | 593/3449 [28:06<2:31:27,  3.18s/it]                                                    {'loss': 1.2158, 'learning_rate': 0.00037899082525187525, 'epoch': 0.17}
 17%|█▋        | 593/3449 [28:06<2:31:27,  3.18s/it] 17%|█▋        | 594/3449 [28:09<2:25:11,  3.05s/it]                                                    {'loss': 1.3411, 'learning_rate': 0.0003789070410924664, 'epoch': 0.17}
 17%|█▋        | 594/3449 [28:09<2:25:11,  3.05s/it] 17%|█▋        | 595/3449 [28:11<2:20:23,  2.95s/it]                                                    {'loss': 1.2307, 'learning_rate': 0.00037882309949966597, 'epoch': 0.17}
 17%|█▋        | 595/3449 [28:11<2:20:23,  2.95s/it] 17%|█▋        | 596/3449 [28:14<2:18:08,  2.91s/it]                                                    {'loss': 1.2769, 'learning_rate': 0.00037873900054734034, 'epoch': 0.17}
 17%|█▋        | 596/3449 [28:14<2:18:08,  2.91s/it] 17%|█▋        | 597/3449 [28:17<2:19:11,  2.93s/it]                                                    {'loss': 1.4223, 'learning_rate': 0.00037865474430949427, 'epoch': 0.17}
 17%|█▋        | 597/3449 [28:17<2:19:11,  2.93s/it] 17%|█▋        | 598/3449 [28:20<2:19:04,  2.93s/it]                                                    {'loss': 1.2942, 'learning_rate': 0.00037857033086027104, 'epoch': 0.17}
 17%|█▋        | 598/3449 [28:20<2:19:04,  2.93s/it] 17%|█▋        | 599/3449 [28:23<2:15:40,  2.86s/it]                                                    {'loss': 1.2689, 'learning_rate': 0.0003784857602739522, 'epoch': 0.17}
 17%|█▋        | 599/3449 [28:23<2:15:40,  2.86s/it] 17%|█▋        | 600/3449 [28:26<2:17:39,  2.90s/it]                                                    {'loss': 1.3241, 'learning_rate': 0.0003784010326249576, 'epoch': 0.17}
 17%|█▋        | 600/3449 [28:26<2:17:39,  2.90s/it] 17%|█▋        | 601/3449 [28:28<2:08:36,  2.71s/it]                                                    {'loss': 1.222, 'learning_rate': 0.00037831614798784525, 'epoch': 0.17}
 17%|█▋        | 601/3449 [28:28<2:08:36,  2.71s/it] 17%|█▋        | 602/3449 [28:31<2:16:01,  2.87s/it]                                                    {'loss': 1.3674, 'learning_rate': 0.0003782311064373114, 'epoch': 0.17}
 17%|█▋        | 602/3449 [28:31<2:16:01,  2.87s/it] 17%|█▋        | 603/3449 [28:33<2:08:04,  2.70s/it]                                                    {'loss': 1.4221, 'learning_rate': 0.0003781459080481903, 'epoch': 0.17}
 17%|█▋        | 603/3449 [28:33<2:08:04,  2.70s/it] 18%|█▊        | 604/3449 [28:36<2:02:24,  2.58s/it]                                                    {'loss': 1.4172, 'learning_rate': 0.0003780605528954543, 'epoch': 0.18}
 18%|█▊        | 604/3449 [28:36<2:02:24,  2.58s/it] 18%|█▊        | 605/3449 [28:38<1:58:41,  2.50s/it]                                                    {'loss': 1.3146, 'learning_rate': 0.0003779750410542136, 'epoch': 0.18}
 18%|█▊        | 605/3449 [28:38<1:58:41,  2.50s/it] 18%|█▊        | 606/3449 [28:40<1:55:05,  2.43s/it]                                                    {'loss': 1.2114, 'learning_rate': 0.0003778893725997163, 'epoch': 0.18}
 18%|█▊        | 606/3449 [28:40<1:55:05,  2.43s/it] 18%|█▊        | 607/3449 [28:43<1:59:29,  2.52s/it]                                                    {'loss': 1.2844, 'learning_rate': 0.00037780354760734837, 'epoch': 0.18}
 18%|█▊        | 607/3449 [28:43<1:59:29,  2.52s/it] 18%|█▊        | 608/3449 [28:46<2:00:37,  2.55s/it]                                                    {'loss': 1.3779, 'learning_rate': 0.0003777175661526336, 'epoch': 0.18}
 18%|█▊        | 608/3449 [28:46<2:00:37,  2.55s/it] 18%|█▊        | 609/3449 [28:49<2:06:55,  2.68s/it]                                                    {'loss': 1.0988, 'learning_rate': 0.0003776314283112331, 'epoch': 0.18}
 18%|█▊        | 609/3449 [28:49<2:06:55,  2.68s/it] 18%|█▊        | 610/3449 [28:51<2:08:13,  2.71s/it]                                                    {'loss': 1.3803, 'learning_rate': 0.0003775451341589461, 'epoch': 0.18}
 18%|█▊        | 610/3449 [28:51<2:08:13,  2.71s/it] 18%|█▊        | 611/3449 [28:55<2:15:08,  2.86s/it]                                                    {'loss': 1.1517, 'learning_rate': 0.00037745868377170907, 'epoch': 0.18}
 18%|█▊        | 611/3449 [28:55<2:15:08,  2.86s/it] 18%|█▊        | 612/3449 [28:58<2:21:42,  3.00s/it]                                                    {'loss': 1.2965, 'learning_rate': 0.000377372077225596, 'epoch': 0.18}
 18%|█▊        | 612/3449 [28:58<2:21:42,  3.00s/it] 18%|█▊        | 613/3449 [29:01<2:14:53,  2.85s/it]                                                    {'loss': 1.4926, 'learning_rate': 0.00037728531459681826, 'epoch': 0.18}
 18%|█▊        | 613/3449 [29:01<2:14:53,  2.85s/it] 18%|█▊        | 614/3449 [29:03<2:09:06,  2.73s/it]                                                    {'loss': 1.4066, 'learning_rate': 0.00037719839596172476, 'epoch': 0.18}
 18%|█▊        | 614/3449 [29:03<2:09:06,  2.73s/it] 18%|█▊        | 615/3449 [29:11<3:21:13,  4.26s/it]                                                    {'loss': 1.3498, 'learning_rate': 0.00037711132139680155, 'epoch': 0.18}
 18%|█▊        | 615/3449 [29:11<3:21:13,  4.26s/it] 18%|█▊        | 616/3449 [29:13<2:53:46,  3.68s/it]                                                    {'loss': 1.4738, 'learning_rate': 0.00037702409097867186, 'epoch': 0.18}
 18%|█▊        | 616/3449 [29:13<2:53:46,  3.68s/it] 18%|█▊        | 617/3449 [29:16<2:46:02,  3.52s/it]                                                    {'loss': 1.3854, 'learning_rate': 0.00037693670478409607, 'epoch': 0.18}
 18%|█▊        | 617/3449 [29:16<2:46:02,  3.52s/it] 18%|█▊        | 618/3449 [29:19<2:34:56,  3.28s/it]                                                    {'loss': 1.2015, 'learning_rate': 0.00037684916288997176, 'epoch': 0.18}
 18%|█▊        | 618/3449 [29:19<2:34:56,  3.28s/it] 18%|█▊        | 619/3449 [29:21<2:23:26,  3.04s/it]                                                    {'loss': 1.3336, 'learning_rate': 0.00037676146537333344, 'epoch': 0.18}
 18%|█▊        | 619/3449 [29:21<2:23:26,  3.04s/it] 18%|█▊        | 620/3449 [29:24<2:19:08,  2.95s/it]                                                    {'loss': 1.2285, 'learning_rate': 0.00037667361231135256, 'epoch': 0.18}
 18%|█▊        | 620/3449 [29:24<2:19:08,  2.95s/it] 18%|█▊        | 621/3449 [29:27<2:11:45,  2.80s/it]                                                    {'loss': 1.3738, 'learning_rate': 0.00037658560378133745, 'epoch': 0.18}
 18%|█▊        | 621/3449 [29:27<2:11:45,  2.80s/it] 18%|█▊        | 622/3449 [29:29<2:07:57,  2.72s/it]                                                    {'loss': 1.2951, 'learning_rate': 0.0003764974398607333, 'epoch': 0.18}
 18%|█▊        | 622/3449 [29:29<2:07:57,  2.72s/it] 18%|█▊        | 623/3449 [29:32<2:11:00,  2.78s/it]                                                    {'loss': 1.3998, 'learning_rate': 0.00037640912062712186, 'epoch': 0.18}
 18%|█▊        | 623/3449 [29:32<2:11:00,  2.78s/it] 18%|█▊        | 624/3449 [29:35<2:06:04,  2.68s/it]                                                    {'loss': 1.3421, 'learning_rate': 0.00037632064615822185, 'epoch': 0.18}
 18%|█▊        | 624/3449 [29:35<2:06:04,  2.68s/it] 18%|█▊        | 625/3449 [29:37<2:04:50,  2.65s/it]                                                    {'loss': 1.2505, 'learning_rate': 0.0003762320165318883, 'epoch': 0.18}
 18%|█▊        | 625/3449 [29:37<2:04:50,  2.65s/it] 18%|█▊        | 626/3449 [29:40<2:02:56,  2.61s/it]                                                    {'loss': 1.3863, 'learning_rate': 0.000376143231826113, 'epoch': 0.18}
 18%|█▊        | 626/3449 [29:40<2:02:56,  2.61s/it] 18%|█▊        | 627/3449 [29:42<2:04:45,  2.65s/it]                                                    {'loss': 1.2849, 'learning_rate': 0.00037605429211902397, 'epoch': 0.18}
 18%|█▊        | 627/3449 [29:42<2:04:45,  2.65s/it] 18%|█▊        | 628/3449 [29:45<2:01:35,  2.59s/it]                                                    {'loss': 1.221, 'learning_rate': 0.00037596519748888594, 'epoch': 0.18}
 18%|█▊        | 628/3449 [29:45<2:01:35,  2.59s/it] 18%|█▊        | 629/3449 [29:48<2:09:58,  2.77s/it]                                                    {'loss': 1.195, 'learning_rate': 0.0003758759480140997, 'epoch': 0.18}
 18%|█▊        | 629/3449 [29:48<2:09:58,  2.77s/it] 18%|█▊        | 630/3449 [29:51<2:07:08,  2.71s/it]                                                    {'loss': 1.4152, 'learning_rate': 0.0003757865437732023, 'epoch': 0.18}
 18%|█▊        | 630/3449 [29:51<2:07:08,  2.71s/it] 18%|█▊        | 631/3449 [29:55<2:26:04,  3.11s/it]                                                    {'loss': 1.3788, 'learning_rate': 0.00037569698484486724, 'epoch': 0.18}
 18%|█▊        | 631/3449 [29:55<2:26:04,  3.11s/it] 18%|█▊        | 632/3449 [29:58<2:25:28,  3.10s/it]                                                    {'loss': 1.2949, 'learning_rate': 0.00037560727130790385, 'epoch': 0.18}
 18%|█▊        | 632/3449 [29:58<2:25:28,  3.10s/it] 18%|█▊        | 633/3449 [30:00<2:21:01,  3.00s/it]                                                    {'loss': 1.3709, 'learning_rate': 0.00037551740324125773, 'epoch': 0.18}
 18%|█▊        | 633/3449 [30:01<2:21:01,  3.00s/it] 18%|█▊        | 634/3449 [30:03<2:20:29,  2.99s/it]                                                    {'loss': 1.2895, 'learning_rate': 0.00037542738072401027, 'epoch': 0.18}
 18%|█▊        | 634/3449 [30:03<2:20:29,  2.99s/it] 18%|█▊        | 635/3449 [30:07<2:22:12,  3.03s/it]                                                    {'loss': 1.3311, 'learning_rate': 0.0003753372038353789, 'epoch': 0.18}
 18%|█▊        | 635/3449 [30:07<2:22:12,  3.03s/it] 18%|█▊        | 636/3449 [30:10<2:22:43,  3.04s/it]                                                    {'loss': 1.2309, 'learning_rate': 0.00037524687265471697, 'epoch': 0.18}
 18%|█▊        | 636/3449 [30:10<2:22:43,  3.04s/it] 18%|█▊        | 637/3449 [30:12<2:11:34,  2.81s/it]                                                    {'loss': 1.3925, 'learning_rate': 0.0003751563872615133, 'epoch': 0.18}
 18%|█▊        | 637/3449 [30:12<2:11:34,  2.81s/it] 18%|█▊        | 638/3449 [30:15<2:13:14,  2.84s/it]                                                    {'loss': 1.3566, 'learning_rate': 0.00037506574773539276, 'epoch': 0.18}
 18%|█▊        | 638/3449 [30:15<2:13:14,  2.84s/it] 19%|█▊        | 639/3449 [30:18<2:12:26,  2.83s/it]                                                    {'loss': 1.3243, 'learning_rate': 0.0003749749541561156, 'epoch': 0.19}
 19%|█▊        | 639/3449 [30:18<2:12:26,  2.83s/it] 19%|█▊        | 640/3449 [30:21<2:13:26,  2.85s/it]                                                    {'loss': 1.3834, 'learning_rate': 0.00037488400660357774, 'epoch': 0.19}
 19%|█▊        | 640/3449 [30:21<2:13:26,  2.85s/it] 19%|█▊        | 641/3449 [30:24<2:17:46,  2.94s/it]                                                    {'loss': 1.2708, 'learning_rate': 0.00037479290515781067, 'epoch': 0.19}
 19%|█▊        | 641/3449 [30:24<2:17:46,  2.94s/it] 19%|█▊        | 642/3449 [30:26<2:12:40,  2.84s/it]                                                    {'loss': 1.3351, 'learning_rate': 0.00037470164989898116, 'epoch': 0.19}
 19%|█▊        | 642/3449 [30:26<2:12:40,  2.84s/it] 19%|█▊        | 643/3449 [30:29<2:09:35,  2.77s/it]                                                    {'loss': 1.3267, 'learning_rate': 0.00037461024090739136, 'epoch': 0.19}
 19%|█▊        | 643/3449 [30:29<2:09:35,  2.77s/it] 19%|█▊        | 644/3449 [30:32<2:15:23,  2.90s/it]                                                    {'loss': 1.3807, 'learning_rate': 0.00037451867826347876, 'epoch': 0.19}
 19%|█▊        | 644/3449 [30:32<2:15:23,  2.90s/it] 19%|█▊        | 645/3449 [30:35<2:17:25,  2.94s/it]                                                    {'loss': 1.1451, 'learning_rate': 0.00037442696204781605, 'epoch': 0.19}
 19%|█▊        | 645/3449 [30:35<2:17:25,  2.94s/it] 19%|█▊        | 646/3449 [30:38<2:16:10,  2.91s/it]                                                    {'loss': 1.2059, 'learning_rate': 0.000374335092341111, 'epoch': 0.19}
 19%|█▊        | 646/3449 [30:38<2:16:10,  2.91s/it] 19%|█▉        | 647/3449 [30:40<2:08:50,  2.76s/it]                                                    {'loss': 1.1875, 'learning_rate': 0.0003742430692242065, 'epoch': 0.19}
 19%|█▉        | 647/3449 [30:40<2:08:50,  2.76s/it] 19%|█▉        | 648/3449 [30:43<2:03:48,  2.65s/it]                                                    {'loss': 1.4249, 'learning_rate': 0.0003741508927780804, 'epoch': 0.19}
 19%|█▉        | 648/3449 [30:43<2:03:48,  2.65s/it] 19%|█▉        | 649/3449 [30:46<2:15:16,  2.90s/it]                                                    {'loss': 1.4409, 'learning_rate': 0.0003740585630838455, 'epoch': 0.19}
 19%|█▉        | 649/3449 [30:46<2:15:16,  2.90s/it] 19%|█▉        | 650/3449 [30:49<2:06:38,  2.71s/it]                                                    {'loss': 1.4722, 'learning_rate': 0.0003739660802227495, 'epoch': 0.19}
 19%|█▉        | 650/3449 [30:49<2:06:38,  2.71s/it] 19%|█▉        | 651/3449 [30:51<2:00:19,  2.58s/it]                                                    {'loss': 1.2156, 'learning_rate': 0.00037387344427617476, 'epoch': 0.19}
 19%|█▉        | 651/3449 [30:51<2:00:19,  2.58s/it] 19%|█▉        | 652/3449 [30:53<1:54:33,  2.46s/it]                                                    {'loss': 1.3374, 'learning_rate': 0.00037378065532563847, 'epoch': 0.19}
 19%|█▉        | 652/3449 [30:53<1:54:33,  2.46s/it] 19%|█▉        | 653/3449 [30:56<2:07:56,  2.75s/it]                                                    {'loss': 1.24, 'learning_rate': 0.00037368771345279244, 'epoch': 0.19}
 19%|█▉        | 653/3449 [30:56<2:07:56,  2.75s/it] 19%|█▉        | 654/3449 [30:59<2:06:06,  2.71s/it]                                                    {'loss': 1.3434, 'learning_rate': 0.00037359461873942297, 'epoch': 0.19}
 19%|█▉        | 654/3449 [30:59<2:06:06,  2.71s/it] 19%|█▉        | 655/3449 [31:02<2:08:42,  2.76s/it]                                                    {'loss': 1.3179, 'learning_rate': 0.0003735013712674509, 'epoch': 0.19}
 19%|█▉        | 655/3449 [31:02<2:08:42,  2.76s/it] 19%|█▉        | 656/3449 [31:05<2:06:59,  2.73s/it]                                                    {'loss': 1.3183, 'learning_rate': 0.0003734079711189316, 'epoch': 0.19}
 19%|█▉        | 656/3449 [31:05<2:06:59,  2.73s/it] 19%|█▉        | 657/3449 [31:08<2:18:48,  2.98s/it]                                                    {'loss': 1.2632, 'learning_rate': 0.0003733144183760546, 'epoch': 0.19}
 19%|█▉        | 657/3449 [31:08<2:18:48,  2.98s/it] 19%|█▉        | 658/3449 [31:11<2:14:33,  2.89s/it]                                                    {'loss': 1.4223, 'learning_rate': 0.0003732207131211438, 'epoch': 0.19}
 19%|█▉        | 658/3449 [31:11<2:14:33,  2.89s/it] 19%|█▉        | 659/3449 [31:13<2:08:08,  2.76s/it]                                                    {'loss': 1.3397, 'learning_rate': 0.0003731268554366573, 'epoch': 0.19}
 19%|█▉        | 659/3449 [31:13<2:08:08,  2.76s/it] 19%|█▉        | 660/3449 [31:16<2:05:13,  2.69s/it]                                                    {'loss': 1.2703, 'learning_rate': 0.00037303284540518745, 'epoch': 0.19}
 19%|█▉        | 660/3449 [31:16<2:05:13,  2.69s/it] 19%|█▉        | 661/3449 [31:18<2:02:12,  2.63s/it]                                                    {'loss': 1.5002, 'learning_rate': 0.00037293868310946045, 'epoch': 0.19}
 19%|█▉        | 661/3449 [31:18<2:02:12,  2.63s/it] 19%|█▉        | 662/3449 [31:21<2:09:02,  2.78s/it]                                                    {'loss': 1.3052, 'learning_rate': 0.00037284436863233657, 'epoch': 0.19}
 19%|█▉        | 662/3449 [31:21<2:09:02,  2.78s/it] 19%|█▉        | 663/3449 [31:24<2:05:20,  2.70s/it]                                                    {'loss': 1.3705, 'learning_rate': 0.0003727499020568101, 'epoch': 0.19}
 19%|█▉        | 663/3449 [31:24<2:05:20,  2.70s/it] 19%|█▉        | 664/3449 [31:27<2:08:15,  2.76s/it]                                                    {'loss': 1.4041, 'learning_rate': 0.00037265528346600913, 'epoch': 0.19}
 19%|█▉        | 664/3449 [31:27<2:08:15,  2.76s/it] 19%|█▉        | 665/3449 [31:30<2:09:52,  2.80s/it]                                                    {'loss': 1.1651, 'learning_rate': 0.0003725605129431953, 'epoch': 0.19}
 19%|█▉        | 665/3449 [31:30<2:09:52,  2.80s/it] 19%|█▉        | 666/3449 [31:32<2:08:46,  2.78s/it]                                                    {'loss': 1.3479, 'learning_rate': 0.0003724655905717643, 'epoch': 0.19}
 19%|█▉        | 666/3449 [31:32<2:08:46,  2.78s/it] 19%|█▉        | 667/3449 [31:36<2:17:41,  2.97s/it]                                                    {'loss': 1.2762, 'learning_rate': 0.0003723705164352451, 'epoch': 0.19}
 19%|█▉        | 667/3449 [31:36<2:17:41,  2.97s/it] 19%|█▉        | 668/3449 [31:40<2:36:22,  3.37s/it]                                                    {'loss': 1.2119, 'learning_rate': 0.00037227529061730055, 'epoch': 0.19}
 19%|█▉        | 668/3449 [31:40<2:36:22,  3.37s/it] 19%|█▉        | 669/3449 [31:43<2:31:12,  3.26s/it]                                                    {'loss': 1.3735, 'learning_rate': 0.00037217991320172674, 'epoch': 0.19}
 19%|█▉        | 669/3449 [31:43<2:31:12,  3.26s/it] 19%|█▉        | 670/3449 [31:46<2:25:53,  3.15s/it]                                                    {'loss': 1.288, 'learning_rate': 0.0003720843842724532, 'epoch': 0.19}
 19%|█▉        | 670/3449 [31:46<2:25:53,  3.15s/it] 19%|█▉        | 671/3449 [31:49<2:22:50,  3.09s/it]                                                    {'loss': 1.3138, 'learning_rate': 0.0003719887039135429, 'epoch': 0.19}
 19%|█▉        | 671/3449 [31:49<2:22:50,  3.09s/it] 19%|█▉        | 672/3449 [31:51<2:13:15,  2.88s/it]                                                    {'loss': 1.3225, 'learning_rate': 0.000371892872209192, 'epoch': 0.19}
 19%|█▉        | 672/3449 [31:51<2:13:15,  2.88s/it] 20%|█▉        | 673/3449 [31:54<2:04:34,  2.69s/it]                                                    {'loss': 1.2151, 'learning_rate': 0.0003717968892437297, 'epoch': 0.2}
 20%|█▉        | 673/3449 [31:54<2:04:34,  2.69s/it] 20%|█▉        | 674/3449 [31:56<2:05:31,  2.71s/it]                                                    {'loss': 1.3943, 'learning_rate': 0.00037170075510161853, 'epoch': 0.2}
 20%|█▉        | 674/3449 [31:56<2:05:31,  2.71s/it] 20%|█▉        | 675/3449 [31:59<2:07:07,  2.75s/it]                                                    {'loss': 1.3298, 'learning_rate': 0.0003716044698674539, 'epoch': 0.2}
 20%|█▉        | 675/3449 [31:59<2:07:07,  2.75s/it] 20%|█▉        | 676/3449 [32:02<2:09:45,  2.81s/it]                                                    {'loss': 1.2433, 'learning_rate': 0.0003715080336259643, 'epoch': 0.2}
 20%|█▉        | 676/3449 [32:02<2:09:45,  2.81s/it] 20%|█▉        | 677/3449 [32:05<2:07:02,  2.75s/it]                                                    {'loss': 1.2967, 'learning_rate': 0.000371411446462011, 'epoch': 0.2}
 20%|█▉        | 677/3449 [32:05<2:07:02,  2.75s/it] 20%|█▉        | 678/3449 [32:08<2:07:44,  2.77s/it]                                                    {'loss': 1.3173, 'learning_rate': 0.0003713147084605881, 'epoch': 0.2}
 20%|█▉        | 678/3449 [32:08<2:07:44,  2.77s/it] 20%|█▉        | 679/3449 [32:10<2:05:01,  2.71s/it]                                                    {'loss': 1.3028, 'learning_rate': 0.0003712178197068224, 'epoch': 0.2}
 20%|█▉        | 679/3449 [32:10<2:05:01,  2.71s/it] 20%|█▉        | 680/3449 [32:14<2:14:31,  2.91s/it]                                                    {'loss': 1.2044, 'learning_rate': 0.00037112078028597343, 'epoch': 0.2}
 20%|█▉        | 680/3449 [32:14<2:14:31,  2.91s/it] 20%|█▉        | 681/3449 [32:17<2:22:57,  3.10s/it]                                                    {'loss': 1.1363, 'learning_rate': 0.00037102359028343335, 'epoch': 0.2}
 20%|█▉        | 681/3449 [32:17<2:22:57,  3.10s/it] 20%|█▉        | 682/3449 [32:20<2:16:23,  2.96s/it]                                                    {'loss': 1.4618, 'learning_rate': 0.0003709262497847267, 'epoch': 0.2}
 20%|█▉        | 682/3449 [32:20<2:16:23,  2.96s/it] 20%|█▉        | 683/3449 [32:23<2:13:46,  2.90s/it]                                                    {'loss': 1.3237, 'learning_rate': 0.00037082875887551047, 'epoch': 0.2}
 20%|█▉        | 683/3449 [32:23<2:13:46,  2.90s/it] 20%|█▉        | 684/3449 [32:25<2:08:19,  2.78s/it]                                                    {'loss': 1.2146, 'learning_rate': 0.0003707311176415741, 'epoch': 0.2}
 20%|█▉        | 684/3449 [32:25<2:08:19,  2.78s/it] 20%|█▉        | 685/3449 [32:28<2:08:59,  2.80s/it]                                                    {'loss': 1.2813, 'learning_rate': 0.0003706333261688392, 'epoch': 0.2}
 20%|█▉        | 685/3449 [32:28<2:08:59,  2.80s/it] 20%|█▉        | 686/3449 [32:32<2:32:18,  3.31s/it]                                                    {'loss': 1.1922, 'learning_rate': 0.0003705353845433597, 'epoch': 0.2}
 20%|█▉        | 686/3449 [32:32<2:32:18,  3.31s/it] 20%|█▉        | 687/3449 [32:35<2:22:30,  3.10s/it]                                                    {'loss': 1.2796, 'learning_rate': 0.0003704372928513215, 'epoch': 0.2}
 20%|█▉        | 687/3449 [32:35<2:22:30,  3.10s/it] 20%|█▉        | 688/3449 [32:38<2:18:26,  3.01s/it]                                                    {'loss': 1.277, 'learning_rate': 0.0003703390511790428, 'epoch': 0.2}
 20%|█▉        | 688/3449 [32:38<2:18:26,  3.01s/it] 20%|█▉        | 689/3449 [32:40<2:14:45,  2.93s/it]                                                    {'loss': 1.4421, 'learning_rate': 0.0003702406596129735, 'epoch': 0.2}
 20%|█▉        | 689/3449 [32:41<2:14:45,  2.93s/it] 20%|██        | 690/3449 [32:44<2:18:13,  3.01s/it]                                                    {'loss': 1.4526, 'learning_rate': 0.0003701421182396956, 'epoch': 0.2}
 20%|██        | 690/3449 [32:44<2:18:13,  3.01s/it] 20%|██        | 691/3449 [32:46<2:08:23,  2.79s/it]                                                    {'loss': 1.1334, 'learning_rate': 0.0003700434271459229, 'epoch': 0.2}
 20%|██        | 691/3449 [32:46<2:08:23,  2.79s/it] 20%|██        | 692/3449 [32:49<2:05:52,  2.74s/it]                                                    {'loss': 1.3087, 'learning_rate': 0.00036994458641850076, 'epoch': 0.2}
 20%|██        | 692/3449 [32:49<2:05:52,  2.74s/it] 20%|██        | 693/3449 [32:52<2:08:25,  2.80s/it]                                                    {'loss': 1.2478, 'learning_rate': 0.0003698455961444065, 'epoch': 0.2}
 20%|██        | 693/3449 [32:52<2:08:25,  2.80s/it] 20%|██        | 694/3449 [32:54<2:09:15,  2.82s/it]                                                    {'loss': 1.1383, 'learning_rate': 0.0003697464564107489, 'epoch': 0.2}
 20%|██        | 694/3449 [32:54<2:09:15,  2.82s/it] 20%|██        | 695/3449 [32:58<2:16:39,  2.98s/it]                                                    {'loss': 1.4408, 'learning_rate': 0.00036964716730476826, 'epoch': 0.2}
 20%|██        | 695/3449 [32:58<2:16:39,  2.98s/it] 20%|██        | 696/3449 [33:01<2:17:07,  2.99s/it]                                                    {'loss': 1.3716, 'learning_rate': 0.00036954772891383626, 'epoch': 0.2}
 20%|██        | 696/3449 [33:01<2:17:07,  2.99s/it] 20%|██        | 697/3449 [33:04<2:14:16,  2.93s/it]                                                    {'loss': 1.2962, 'learning_rate': 0.0003694481413254561, 'epoch': 0.2}
 20%|██        | 697/3449 [33:04<2:14:16,  2.93s/it] 20%|██        | 698/3449 [33:06<2:07:13,  2.77s/it]                                                    {'loss': 1.3133, 'learning_rate': 0.00036934840462726206, 'epoch': 0.2}
 20%|██        | 698/3449 [33:06<2:07:13,  2.77s/it] 20%|██        | 699/3449 [33:11<2:35:12,  3.39s/it]                                                    {'loss': 1.1496, 'learning_rate': 0.0003692485189070199, 'epoch': 0.2}
 20%|██        | 699/3449 [33:11<2:35:12,  3.39s/it] 20%|██        | 700/3449 [33:14<2:31:07,  3.30s/it]                                                    {'loss': 1.3681, 'learning_rate': 0.00036914848425262625, 'epoch': 0.2}
 20%|██        | 700/3449 [33:14<2:31:07,  3.30s/it] 20%|██        | 701/3449 [33:21<3:18:43,  4.34s/it]                                                    {'loss': 1.4004, 'learning_rate': 0.000369048300752109, 'epoch': 0.2}
 20%|██        | 701/3449 [33:21<3:18:43,  4.34s/it] 20%|██        | 702/3449 [33:23<2:53:05,  3.78s/it]                                                    {'loss': 1.2389, 'learning_rate': 0.000368947968493627, 'epoch': 0.2}
 20%|██        | 702/3449 [33:23<2:53:05,  3.78s/it] 20%|██        | 703/3449 [33:26<2:42:32,  3.55s/it]                                                    {'loss': 1.3265, 'learning_rate': 0.00036884748756546977, 'epoch': 0.2}
 20%|██        | 703/3449 [33:26<2:42:32,  3.55s/it] 20%|██        | 704/3449 [33:29<2:31:20,  3.31s/it]                                                    {'loss': 1.2333, 'learning_rate': 0.00036874685805605794, 'epoch': 0.2}
 20%|██        | 704/3449 [33:29<2:31:20,  3.31s/it] 20%|██        | 705/3449 [33:32<2:24:35,  3.16s/it]                                                    {'loss': 1.2833, 'learning_rate': 0.00036864608005394273, 'epoch': 0.2}
 20%|██        | 705/3449 [33:32<2:24:35,  3.16s/it] 20%|██        | 706/3449 [33:35<2:20:54,  3.08s/it]                                                    {'loss': 1.2394, 'learning_rate': 0.0003685451536478061, 'epoch': 0.2}
 20%|██        | 706/3449 [33:35<2:20:54,  3.08s/it] 20%|██        | 707/3449 [33:37<2:12:19,  2.90s/it]                                                    {'loss': 1.2999, 'learning_rate': 0.0003684440789264606, 'epoch': 0.2}
 20%|██        | 707/3449 [33:37<2:12:19,  2.90s/it] 21%|██        | 708/3449 [33:40<2:16:33,  2.99s/it]                                                    {'loss': 1.289, 'learning_rate': 0.00036834285597884923, 'epoch': 0.21}
 21%|██        | 708/3449 [33:40<2:16:33,  2.99s/it] 21%|██        | 709/3449 [33:43<2:08:25,  2.81s/it]                                                    {'loss': 1.2782, 'learning_rate': 0.0003682414848940455, 'epoch': 0.21}
 21%|██        | 709/3449 [33:43<2:08:25,  2.81s/it] 21%|██        | 710/3449 [33:45<2:04:10,  2.72s/it]                                                    {'loss': 1.1605, 'learning_rate': 0.00036813996576125316, 'epoch': 0.21}
 21%|██        | 710/3449 [33:45<2:04:10,  2.72s/it] 21%|██        | 711/3449 [33:50<2:28:33,  3.26s/it]                                                    {'loss': 1.285, 'learning_rate': 0.00036803829866980645, 'epoch': 0.21}
 21%|██        | 711/3449 [33:50<2:28:33,  3.26s/it] 21%|██        | 712/3449 [33:52<2:22:08,  3.12s/it]                                                    {'loss': 1.3159, 'learning_rate': 0.0003679364837091696, 'epoch': 0.21}
 21%|██        | 712/3449 [33:52<2:22:08,  3.12s/it] 21%|██        | 713/3449 [33:55<2:13:02,  2.92s/it]                                                    {'loss': 1.5144, 'learning_rate': 0.00036783452096893703, 'epoch': 0.21}
 21%|██        | 713/3449 [33:55<2:13:02,  2.92s/it] 21%|██        | 714/3449 [33:58<2:11:04,  2.88s/it]                                                    {'loss': 1.3787, 'learning_rate': 0.00036773241053883324, 'epoch': 0.21}
 21%|██        | 714/3449 [33:58<2:11:04,  2.88s/it] 21%|██        | 715/3449 [34:01<2:11:39,  2.89s/it]                                                    {'loss': 1.2825, 'learning_rate': 0.00036763015250871266, 'epoch': 0.21}
 21%|██        | 715/3449 [34:01<2:11:39,  2.89s/it] 21%|██        | 716/3449 [34:03<2:02:34,  2.69s/it]                                                    {'loss': 1.3308, 'learning_rate': 0.0003675277469685597, 'epoch': 0.21}
 21%|██        | 716/3449 [34:03<2:02:34,  2.69s/it] 21%|██        | 717/3449 [34:06<2:04:29,  2.73s/it]                                                    {'loss': 1.3313, 'learning_rate': 0.0003674251940084883, 'epoch': 0.21}
 21%|██        | 717/3449 [34:06<2:04:29,  2.73s/it] 21%|██        | 718/3449 [34:08<1:59:42,  2.63s/it]                                                    {'loss': 1.2538, 'learning_rate': 0.00036732249371874243, 'epoch': 0.21}
 21%|██        | 718/3449 [34:08<1:59:42,  2.63s/it] 21%|██        | 719/3449 [34:11<2:05:10,  2.75s/it]                                                    {'loss': 1.2696, 'learning_rate': 0.0003672196461896956, 'epoch': 0.21}
 21%|██        | 719/3449 [34:11<2:05:10,  2.75s/it] 21%|██        | 720/3449 [34:14<2:05:55,  2.77s/it]                                                    {'loss': 1.2787, 'learning_rate': 0.00036711665151185083, 'epoch': 0.21}
 21%|██        | 720/3449 [34:14<2:05:55,  2.77s/it] 21%|██        | 721/3449 [34:17<2:11:05,  2.88s/it]                                                    {'loss': 1.3181, 'learning_rate': 0.0003670135097758407, 'epoch': 0.21}
 21%|██        | 721/3449 [34:17<2:11:05,  2.88s/it] 21%|██        | 722/3449 [34:20<2:06:01,  2.77s/it]                                                    {'loss': 1.406, 'learning_rate': 0.0003669102210724271, 'epoch': 0.21}
 21%|██        | 722/3449 [34:20<2:06:01,  2.77s/it] 21%|██        | 723/3449 [34:22<2:02:00,  2.69s/it]                                                    {'loss': 1.3445, 'learning_rate': 0.0003668067854925014, 'epoch': 0.21}
 21%|██        | 723/3449 [34:22<2:02:00,  2.69s/it] 21%|██        | 724/3449 [34:25<2:06:34,  2.79s/it]                                                    {'loss': 1.3145, 'learning_rate': 0.0003667032031270841, 'epoch': 0.21}
 21%|██        | 724/3449 [34:25<2:06:34,  2.79s/it] 21%|██        | 725/3449 [34:28<2:09:15,  2.85s/it]                                                    {'loss': 1.2812, 'learning_rate': 0.00036659947406732484, 'epoch': 0.21}
 21%|██        | 725/3449 [34:28<2:09:15,  2.85s/it] 21%|██        | 726/3449 [34:31<2:09:50,  2.86s/it]                                                    {'loss': 1.3694, 'learning_rate': 0.00036649559840450254, 'epoch': 0.21}
 21%|██        | 726/3449 [34:31<2:09:50,  2.86s/it] 21%|██        | 727/3449 [34:33<2:02:47,  2.71s/it]                                                    {'loss': 1.3665, 'learning_rate': 0.0003663915762300249, 'epoch': 0.21}
 21%|██        | 727/3449 [34:33<2:02:47,  2.71s/it] 21%|██        | 728/3449 [34:36<2:08:01,  2.82s/it]                                                    {'loss': 1.3879, 'learning_rate': 0.00036628740763542864, 'epoch': 0.21}
 21%|██        | 728/3449 [34:36<2:08:01,  2.82s/it] 21%|██        | 729/3449 [34:39<2:01:55,  2.69s/it]                                                    {'loss': 1.261, 'learning_rate': 0.0003661830927123793, 'epoch': 0.21}
 21%|██        | 729/3449 [34:39<2:01:55,  2.69s/it] 21%|██        | 730/3449 [34:42<2:13:23,  2.94s/it]                                                    {'loss': 1.2177, 'learning_rate': 0.0003660786315526713, 'epoch': 0.21}
 21%|██        | 730/3449 [34:42<2:13:23,  2.94s/it] 21%|██        | 731/3449 [34:45<2:09:22,  2.86s/it]                                                    {'loss': 1.1199, 'learning_rate': 0.00036597402424822764, 'epoch': 0.21}
 21%|██        | 731/3449 [34:45<2:09:22,  2.86s/it] 21%|██        | 732/3449 [34:48<2:08:28,  2.84s/it]                                                    {'loss': 1.2116, 'learning_rate': 0.00036586927089109987, 'epoch': 0.21}
 21%|██        | 732/3449 [34:48<2:08:28,  2.84s/it] 21%|██▏       | 733/3449 [34:50<2:06:12,  2.79s/it]                                                    {'loss': 1.38, 'learning_rate': 0.0003657643715734682, 'epoch': 0.21}
 21%|██▏       | 733/3449 [34:50<2:06:12,  2.79s/it] 21%|██▏       | 734/3449 [34:53<2:03:06,  2.72s/it]                                                    {'loss': 1.3854, 'learning_rate': 0.00036565932638764115, 'epoch': 0.21}
 21%|██▏       | 734/3449 [34:53<2:03:06,  2.72s/it] 21%|██▏       | 735/3449 [34:56<2:12:14,  2.92s/it]                                                    {'loss': 1.2881, 'learning_rate': 0.00036555413542605576, 'epoch': 0.21}
 21%|██▏       | 735/3449 [34:56<2:12:14,  2.92s/it] 21%|██▏       | 736/3449 [35:01<2:29:52,  3.31s/it]                                                    {'loss': 1.3507, 'learning_rate': 0.0003654487987812771, 'epoch': 0.21}
 21%|██▏       | 736/3449 [35:01<2:29:52,  3.31s/it] 21%|██▏       | 737/3449 [35:04<2:26:15,  3.24s/it]                                                    {'loss': 1.3011, 'learning_rate': 0.0003653433165459987, 'epoch': 0.21}
 21%|██▏       | 737/3449 [35:04<2:26:15,  3.24s/it] 21%|██▏       | 738/3449 [35:06<2:19:22,  3.08s/it]                                                    {'loss': 1.1903, 'learning_rate': 0.0003652376888130421, 'epoch': 0.21}
 21%|██▏       | 738/3449 [35:06<2:19:22,  3.08s/it] 21%|██▏       | 739/3449 [35:09<2:17:14,  3.04s/it]                                                    {'loss': 1.5096, 'learning_rate': 0.00036513191567535687, 'epoch': 0.21}
 21%|██▏       | 739/3449 [35:09<2:17:14,  3.04s/it] 21%|██▏       | 740/3449 [35:12<2:07:57,  2.83s/it]                                                    {'loss': 1.3719, 'learning_rate': 0.0003650259972260204, 'epoch': 0.21}
 21%|██▏       | 740/3449 [35:12<2:07:57,  2.83s/it] 21%|██▏       | 741/3449 [35:14<1:58:29,  2.63s/it]                                                    {'loss': 1.3139, 'learning_rate': 0.0003649199335582382, 'epoch': 0.21}
 21%|██▏       | 741/3449 [35:14<1:58:29,  2.63s/it] 22%|██▏       | 742/3449 [35:16<1:56:56,  2.59s/it]                                                    {'loss': 1.3557, 'learning_rate': 0.00036481372476534346, 'epoch': 0.22}
 22%|██▏       | 742/3449 [35:16<1:56:56,  2.59s/it] 22%|██▏       | 743/3449 [35:19<2:03:27,  2.74s/it]                                                    {'loss': 1.2022, 'learning_rate': 0.000364707370940797, 'epoch': 0.22}
 22%|██▏       | 743/3449 [35:19<2:03:27,  2.74s/it] 22%|██▏       | 744/3449 [35:22<2:03:40,  2.74s/it]                                                    {'loss': 1.415, 'learning_rate': 0.0003646008721781874, 'epoch': 0.22}
 22%|██▏       | 744/3449 [35:22<2:03:40,  2.74s/it] 22%|██▏       | 745/3449 [35:25<2:09:21,  2.87s/it]                                                    {'loss': 1.4802, 'learning_rate': 0.00036449422857123067, 'epoch': 0.22}
 22%|██▏       | 745/3449 [35:25<2:09:21,  2.87s/it] 22%|██▏       | 746/3449 [35:28<2:06:23,  2.81s/it]                                                    {'loss': 1.4193, 'learning_rate': 0.0003643874402137703, 'epoch': 0.22}
 22%|██▏       | 746/3449 [35:28<2:06:23,  2.81s/it] 22%|██▏       | 747/3449 [35:31<2:13:14,  2.96s/it]                                                    {'loss': 1.2783, 'learning_rate': 0.0003642805071997772, 'epoch': 0.22}
 22%|██▏       | 747/3449 [35:31<2:13:14,  2.96s/it] 22%|██▏       | 748/3449 [35:34<2:06:17,  2.81s/it]                                                    {'loss': 1.4414, 'learning_rate': 0.00036417342962334956, 'epoch': 0.22}
 22%|██▏       | 748/3449 [35:34<2:06:17,  2.81s/it] 22%|██▏       | 749/3449 [35:36<2:02:35,  2.72s/it]                                                    {'loss': 1.2048, 'learning_rate': 0.00036406620757871276, 'epoch': 0.22}
 22%|██▏       | 749/3449 [35:36<2:02:35,  2.72s/it] 22%|██▏       | 750/3449 [35:39<1:57:09,  2.60s/it]                                                    {'loss': 1.4374, 'learning_rate': 0.00036395884116021933, 'epoch': 0.22}
 22%|██▏       | 750/3449 [35:39<1:57:09,  2.60s/it] 22%|██▏       | 751/3449 [35:41<1:59:47,  2.66s/it]                                                    {'loss': 1.2123, 'learning_rate': 0.0003638513304623488, 'epoch': 0.22}
 22%|██▏       | 751/3449 [35:41<1:59:47,  2.66s/it] 22%|██▏       | 752/3449 [35:45<2:11:27,  2.92s/it]                                                    {'loss': 1.2275, 'learning_rate': 0.00036374367557970777, 'epoch': 0.22}
 22%|██▏       | 752/3449 [35:45<2:11:27,  2.92s/it] 22%|██▏       | 753/3449 [35:48<2:11:20,  2.92s/it]                                                    {'loss': 1.2117, 'learning_rate': 0.0003636358766070296, 'epoch': 0.22}
 22%|██▏       | 753/3449 [35:48<2:11:20,  2.92s/it] 22%|██▏       | 754/3449 [35:51<2:13:47,  2.98s/it]                                                    {'loss': 1.1179, 'learning_rate': 0.0003635279336391745, 'epoch': 0.22}
 22%|██▏       | 754/3449 [35:51<2:13:47,  2.98s/it] 22%|██▏       | 755/3449 [35:54<2:12:30,  2.95s/it]                                                    {'loss': 1.3382, 'learning_rate': 0.00036341984677112937, 'epoch': 0.22}
 22%|██▏       | 755/3449 [35:54<2:12:30,  2.95s/it] 22%|██▏       | 756/3449 [35:57<2:15:17,  3.01s/it]                                                    {'loss': 1.3122, 'learning_rate': 0.0003633116160980077, 'epoch': 0.22}
 22%|██▏       | 756/3449 [35:57<2:15:17,  3.01s/it] 22%|██▏       | 757/3449 [36:00<2:16:34,  3.04s/it]                                                    {'loss': 1.2746, 'learning_rate': 0.0003632032417150496, 'epoch': 0.22}
 22%|██▏       | 757/3449 [36:00<2:16:34,  3.04s/it] 22%|██▏       | 758/3449 [36:03<2:13:39,  2.98s/it]                                                    {'loss': 1.1844, 'learning_rate': 0.00036309472371762175, 'epoch': 0.22}
 22%|██▏       | 758/3449 [36:03<2:13:39,  2.98s/it] 22%|██▏       | 759/3449 [36:05<2:06:05,  2.81s/it]                                                    {'loss': 1.4231, 'learning_rate': 0.0003629860622012169, 'epoch': 0.22}
 22%|██▏       | 759/3449 [36:05<2:06:05,  2.81s/it] 22%|██▏       | 760/3449 [36:08<2:02:32,  2.73s/it]                                                    {'loss': 1.4839, 'learning_rate': 0.0003628772572614544, 'epoch': 0.22}
 22%|██▏       | 760/3449 [36:08<2:02:32,  2.73s/it] 22%|██▏       | 761/3449 [36:10<1:57:06,  2.61s/it]                                                    {'loss': 1.4891, 'learning_rate': 0.0003627683089940796, 'epoch': 0.22}
 22%|██▏       | 761/3449 [36:10<1:57:06,  2.61s/it] 22%|██▏       | 762/3449 [36:13<1:54:36,  2.56s/it]                                                    {'loss': 1.3534, 'learning_rate': 0.000362659217494964, 'epoch': 0.22}
 22%|██▏       | 762/3449 [36:13<1:54:36,  2.56s/it] 22%|██▏       | 763/3449 [36:16<2:02:01,  2.73s/it]                                                    {'loss': 1.3463, 'learning_rate': 0.00036254998286010536, 'epoch': 0.22}
 22%|██▏       | 763/3449 [36:16<2:02:01,  2.73s/it] 22%|██▏       | 764/3449 [36:18<1:57:35,  2.63s/it]                                                    {'loss': 1.3156, 'learning_rate': 0.000362440605185627, 'epoch': 0.22}
 22%|██▏       | 764/3449 [36:18<1:57:35,  2.63s/it] 22%|██▏       | 765/3449 [36:21<2:03:10,  2.75s/it]                                                    {'loss': 1.3955, 'learning_rate': 0.0003623310845677785, 'epoch': 0.22}
 22%|██▏       | 765/3449 [36:21<2:03:10,  2.75s/it] 22%|██▏       | 766/3449 [36:25<2:09:47,  2.90s/it]                                                    {'loss': 1.3864, 'learning_rate': 0.00036222142110293505, 'epoch': 0.22}
 22%|██▏       | 766/3449 [36:25<2:09:47,  2.90s/it] 22%|██▏       | 767/3449 [36:27<2:07:41,  2.86s/it]                                                    {'loss': 1.3406, 'learning_rate': 0.00036211161488759747, 'epoch': 0.22}
 22%|██▏       | 767/3449 [36:27<2:07:41,  2.86s/it] 22%|██▏       | 768/3449 [36:30<2:08:53,  2.88s/it]                                                    {'loss': 1.3364, 'learning_rate': 0.0003620016660183923, 'epoch': 0.22}
 22%|██▏       | 768/3449 [36:30<2:08:53,  2.88s/it] 22%|██▏       | 769/3449 [36:34<2:23:44,  3.22s/it]                                                    {'loss': 1.1346, 'learning_rate': 0.00036189157459207166, 'epoch': 0.22}
 22%|██▏       | 769/3449 [36:34<2:23:44,  3.22s/it] 22%|██▏       | 770/3449 [36:37<2:11:44,  2.95s/it]                                                    {'loss': 1.3928, 'learning_rate': 0.00036178134070551305, 'epoch': 0.22}
 22%|██▏       | 770/3449 [36:37<2:11:44,  2.95s/it] 22%|██▏       | 771/3449 [36:40<2:13:47,  3.00s/it]                                                    {'loss': 1.2873, 'learning_rate': 0.0003616709644557193, 'epoch': 0.22}
 22%|██▏       | 771/3449 [36:40<2:13:47,  3.00s/it] 22%|██▏       | 772/3449 [36:44<2:25:50,  3.27s/it]                                                    {'loss': 1.289, 'learning_rate': 0.00036156044593981847, 'epoch': 0.22}
 22%|██▏       | 772/3449 [36:44<2:25:50,  3.27s/it] 22%|██▏       | 773/3449 [36:46<2:19:31,  3.13s/it]                                                    {'loss': 1.3108, 'learning_rate': 0.000361449785255064, 'epoch': 0.22}
 22%|██▏       | 773/3449 [36:46<2:19:31,  3.13s/it] 22%|██▏       | 774/3449 [36:49<2:12:08,  2.96s/it]                                                    {'loss': 1.4273, 'learning_rate': 0.00036133898249883425, 'epoch': 0.22}
 22%|██▏       | 774/3449 [36:49<2:12:08,  2.96s/it] 22%|██▏       | 775/3449 [36:52<2:09:04,  2.90s/it]                                                    {'loss': 1.1892, 'learning_rate': 0.0003612280377686327, 'epoch': 0.22}
 22%|██▏       | 775/3449 [36:52<2:09:04,  2.90s/it] 22%|██▏       | 776/3449 [36:54<2:01:44,  2.73s/it]                                                    {'loss': 1.3329, 'learning_rate': 0.00036111695116208765, 'epoch': 0.22}
 22%|██▏       | 776/3449 [36:54<2:01:44,  2.73s/it] 23%|██▎       | 777/3449 [36:56<1:56:15,  2.61s/it]                                                    {'loss': 1.4551, 'learning_rate': 0.00036100572277695256, 'epoch': 0.23}
 23%|██▎       | 777/3449 [36:56<1:56:15,  2.61s/it] 23%|██▎       | 778/3449 [36:59<1:51:59,  2.52s/it]                                                    {'loss': 1.4236, 'learning_rate': 0.00036089435271110517, 'epoch': 0.23}
 23%|██▎       | 778/3449 [36:59<1:51:59,  2.52s/it] 23%|██▎       | 779/3449 [37:01<1:54:55,  2.58s/it]                                                    {'loss': 1.283, 'learning_rate': 0.00036078284106254825, 'epoch': 0.23}
 23%|██▎       | 779/3449 [37:01<1:54:55,  2.58s/it] 23%|██▎       | 780/3449 [37:04<1:56:55,  2.63s/it]                                                    {'loss': 1.268, 'learning_rate': 0.0003606711879294091, 'epoch': 0.23}
 23%|██▎       | 780/3449 [37:04<1:56:55,  2.63s/it] 23%|██▎       | 781/3449 [37:09<2:31:27,  3.41s/it]                                                    {'loss': 1.1755, 'learning_rate': 0.0003605593934099393, 'epoch': 0.23}
 23%|██▎       | 781/3449 [37:09<2:31:27,  3.41s/it] 23%|██▎       | 782/3449 [37:12<2:16:57,  3.08s/it]                                                    {'loss': 1.3168, 'learning_rate': 0.0003604474576025153, 'epoch': 0.23}
 23%|██▎       | 782/3449 [37:12<2:16:57,  3.08s/it] 23%|██▎       | 783/3449 [37:15<2:14:19,  3.02s/it]                                                    {'loss': 1.3726, 'learning_rate': 0.00036033538060563743, 'epoch': 0.23}
 23%|██▎       | 783/3449 [37:15<2:14:19,  3.02s/it] 23%|██▎       | 784/3449 [37:17<2:08:18,  2.89s/it]                                                    {'loss': 1.1281, 'learning_rate': 0.00036022316251793044, 'epoch': 0.23}
 23%|██▎       | 784/3449 [37:17<2:08:18,  2.89s/it] 23%|██▎       | 785/3449 [37:19<1:58:41,  2.67s/it]                                                    {'loss': 1.3585, 'learning_rate': 0.00036011080343814324, 'epoch': 0.23}
 23%|██▎       | 785/3449 [37:19<1:58:41,  2.67s/it] 23%|██▎       | 786/3449 [37:22<2:00:01,  2.70s/it]                                                    {'loss': 1.3135, 'learning_rate': 0.0003599983034651489, 'epoch': 0.23}
 23%|██▎       | 786/3449 [37:22<2:00:01,  2.70s/it] 23%|██▎       | 787/3449 [37:25<2:04:12,  2.80s/it]                                                    {'loss': 1.37, 'learning_rate': 0.0003598856626979442, 'epoch': 0.23}
 23%|██▎       | 787/3449 [37:25<2:04:12,  2.80s/it] 23%|██▎       | 788/3449 [37:29<2:14:30,  3.03s/it]                                                    {'loss': 1.1796, 'learning_rate': 0.00035977288123565016, 'epoch': 0.23}
 23%|██▎       | 788/3449 [37:29<2:14:30,  3.03s/it] 23%|██▎       | 789/3449 [37:32<2:21:53,  3.20s/it]                                                    {'loss': 1.1075, 'learning_rate': 0.0003596599591775113, 'epoch': 0.23}
 23%|██▎       | 789/3449 [37:32<2:21:53,  3.20s/it] 23%|██▎       | 790/3449 [37:35<2:22:10,  3.21s/it]                                                    {'loss': 1.335, 'learning_rate': 0.00035954689662289613, 'epoch': 0.23}
 23%|██▎       | 790/3449 [37:35<2:22:10,  3.21s/it] 23%|██▎       | 791/3449 [37:39<2:22:21,  3.21s/it]                                                    {'loss': 1.2655, 'learning_rate': 0.0003594336936712966, 'epoch': 0.23}
 23%|██▎       | 791/3449 [37:39<2:22:21,  3.21s/it] 23%|██▎       | 792/3449 [37:42<2:18:14,  3.12s/it]                                                    {'loss': 1.385, 'learning_rate': 0.0003593203504223282, 'epoch': 0.23}
 23%|██▎       | 792/3449 [37:42<2:18:14,  3.12s/it] 23%|██▎       | 793/3449 [37:45<2:19:54,  3.16s/it]                                                    {'loss': 1.101, 'learning_rate': 0.0003592068669757301, 'epoch': 0.23}
 23%|██▎       | 793/3449 [37:45<2:19:54,  3.16s/it] 23%|██▎       | 794/3449 [37:47<2:06:59,  2.87s/it]                                                    {'loss': 1.326, 'learning_rate': 0.00035909324343136453, 'epoch': 0.23}
 23%|██▎       | 794/3449 [37:47<2:06:59,  2.87s/it] 23%|██▎       | 795/3449 [37:50<2:08:40,  2.91s/it]                                                    {'loss': 1.3805, 'learning_rate': 0.0003589794798892172, 'epoch': 0.23}
 23%|██▎       | 795/3449 [37:50<2:08:40,  2.91s/it] 23%|██▎       | 796/3449 [37:53<2:06:12,  2.85s/it]                                                    {'loss': 1.3828, 'learning_rate': 0.00035886557644939705, 'epoch': 0.23}
 23%|██▎       | 796/3449 [37:53<2:06:12,  2.85s/it] 23%|██▎       | 797/3449 [37:56<2:08:34,  2.91s/it]                                                    {'loss': 1.1955, 'learning_rate': 0.000358751533212136, 'epoch': 0.23}
 23%|██▎       | 797/3449 [37:56<2:08:34,  2.91s/it] 23%|██▎       | 798/3449 [37:58<2:02:15,  2.77s/it]                                                    {'loss': 1.29, 'learning_rate': 0.00035863735027778895, 'epoch': 0.23}
 23%|██▎       | 798/3449 [37:58<2:02:15,  2.77s/it] 23%|██▎       | 799/3449 [38:01<2:02:19,  2.77s/it]                                                    {'loss': 1.316, 'learning_rate': 0.00035852302774683393, 'epoch': 0.23}
 23%|██▎       | 799/3449 [38:01<2:02:19,  2.77s/it] 23%|██▎       | 800/3449 [38:07<2:39:33,  3.61s/it]                                                    {'loss': 1.3937, 'learning_rate': 0.00035840856571987167, 'epoch': 0.23}
 23%|██▎       | 800/3449 [38:07<2:39:33,  3.61s/it] 23%|██▎       | 801/3449 [38:09<2:24:26,  3.27s/it]                                                    {'loss': 1.3658, 'learning_rate': 0.00035829396429762567, 'epoch': 0.23}
 23%|██▎       | 801/3449 [38:09<2:24:26,  3.27s/it] 23%|██▎       | 802/3449 [38:12<2:21:26,  3.21s/it]                                                    {'loss': 1.3005, 'learning_rate': 0.0003581792235809421, 'epoch': 0.23}
 23%|██▎       | 802/3449 [38:12<2:21:26,  3.21s/it] 23%|██▎       | 803/3449 [38:15<2:13:10,  3.02s/it]                                                    {'loss': 1.235, 'learning_rate': 0.0003580643436707898, 'epoch': 0.23}
 23%|██▎       | 803/3449 [38:15<2:13:10,  3.02s/it] 23%|██▎       | 804/3449 [38:17<2:04:57,  2.83s/it]                                                    {'loss': 1.2511, 'learning_rate': 0.0003579493246682598, 'epoch': 0.23}
 23%|██▎       | 804/3449 [38:17<2:04:57,  2.83s/it] 23%|██▎       | 805/3449 [38:20<2:06:59,  2.88s/it]                                                    {'loss': 1.2629, 'learning_rate': 0.00035783416667456593, 'epoch': 0.23}
 23%|██▎       | 805/3449 [38:20<2:06:59,  2.88s/it] 23%|██▎       | 806/3449 [38:24<2:14:50,  3.06s/it]                                                    {'loss': 1.2455, 'learning_rate': 0.000357718869791044, 'epoch': 0.23}
 23%|██▎       | 806/3449 [38:24<2:14:50,  3.06s/it] 23%|██▎       | 807/3449 [38:26<2:05:31,  2.85s/it]                                                    {'loss': 1.3293, 'learning_rate': 0.00035760343411915226, 'epoch': 0.23}
 23%|██▎       | 807/3449 [38:26<2:05:31,  2.85s/it] 23%|██▎       | 808/3449 [38:28<1:57:45,  2.68s/it]                                                    {'loss': 1.4308, 'learning_rate': 0.000357487859760471, 'epoch': 0.23}
 23%|██▎       | 808/3449 [38:28<1:57:45,  2.68s/it] 23%|██▎       | 809/3449 [38:31<1:57:37,  2.67s/it]                                                    {'loss': 1.2123, 'learning_rate': 0.0003573721468167024, 'epoch': 0.23}
 23%|██▎       | 809/3449 [38:31<1:57:37,  2.67s/it] 23%|██▎       | 810/3449 [38:33<1:55:21,  2.62s/it]                                                    {'loss': 1.4557, 'learning_rate': 0.00035725629538967097, 'epoch': 0.23}
 23%|██▎       | 810/3449 [38:33<1:55:21,  2.62s/it] 24%|██▎       | 811/3449 [38:36<1:57:18,  2.67s/it]                                                    {'loss': 1.2088, 'learning_rate': 0.0003571403055813227, 'epoch': 0.24}
 24%|██▎       | 811/3449 [38:36<1:57:18,  2.67s/it] 24%|██▎       | 812/3449 [38:39<2:00:31,  2.74s/it]                                                    {'loss': 1.3433, 'learning_rate': 0.0003570241774937256, 'epoch': 0.24}
 24%|██▎       | 812/3449 [38:39<2:00:31,  2.74s/it] 24%|██▎       | 813/3449 [38:42<1:57:00,  2.66s/it]                                                    {'loss': 1.3293, 'learning_rate': 0.0003569079112290692, 'epoch': 0.24}
 24%|██▎       | 813/3449 [38:42<1:57:00,  2.66s/it] 24%|██▎       | 814/3449 [38:45<2:03:52,  2.82s/it]                                                    {'loss': 1.3839, 'learning_rate': 0.00035679150688966476, 'epoch': 0.24}
 24%|██▎       | 814/3449 [38:45<2:03:52,  2.82s/it] 24%|██▎       | 815/3449 [38:47<2:02:44,  2.80s/it]                                                    {'loss': 1.4165, 'learning_rate': 0.00035667496457794483, 'epoch': 0.24}
 24%|██▎       | 815/3449 [38:48<2:02:44,  2.80s/it] 24%|██▎       | 816/3449 [38:50<1:58:23,  2.70s/it]                                                    {'loss': 1.2507, 'learning_rate': 0.00035655828439646366, 'epoch': 0.24}
 24%|██▎       | 816/3449 [38:50<1:58:23,  2.70s/it] 24%|██▎       | 817/3449 [38:52<1:55:05,  2.62s/it]                                                    {'loss': 1.3885, 'learning_rate': 0.0003564414664478966, 'epoch': 0.24}
 24%|██▎       | 817/3449 [38:52<1:55:05,  2.62s/it] 24%|██▎       | 818/3449 [38:55<1:55:25,  2.63s/it]                                                    {'loss': 1.1639, 'learning_rate': 0.0003563245108350404, 'epoch': 0.24}
 24%|██▎       | 818/3449 [38:55<1:55:25,  2.63s/it] 24%|██▎       | 819/3449 [38:58<1:56:25,  2.66s/it]                                                    {'loss': 1.3476, 'learning_rate': 0.0003562074176608127, 'epoch': 0.24}
 24%|██▎       | 819/3449 [38:58<1:56:25,  2.66s/it] 24%|██▍       | 820/3449 [39:01<1:57:54,  2.69s/it]                                                    {'loss': 1.3051, 'learning_rate': 0.00035609018702825257, 'epoch': 0.24}
 24%|██▍       | 820/3449 [39:01<1:57:54,  2.69s/it] 24%|██▍       | 821/3449 [39:04<2:09:14,  2.95s/it]                                                    {'loss': 1.2524, 'learning_rate': 0.00035597281904051957, 'epoch': 0.24}
 24%|██▍       | 821/3449 [39:04<2:09:14,  2.95s/it] 24%|██▍       | 822/3449 [39:08<2:15:41,  3.10s/it]                                                    {'loss': 1.1534, 'learning_rate': 0.0003558553138008946, 'epoch': 0.24}
 24%|██▍       | 822/3449 [39:08<2:15:41,  3.10s/it] 24%|██▍       | 823/3449 [39:10<2:08:18,  2.93s/it]                                                    {'loss': 1.2203, 'learning_rate': 0.00035573767141277885, 'epoch': 0.24}
 24%|██▍       | 823/3449 [39:10<2:08:18,  2.93s/it] 24%|██▍       | 824/3449 [39:13<2:02:47,  2.81s/it]                                                    {'loss': 1.2969, 'learning_rate': 0.00035561989197969475, 'epoch': 0.24}
 24%|██▍       | 824/3449 [39:13<2:02:47,  2.81s/it] 24%|██▍       | 825/3449 [39:15<1:55:22,  2.64s/it]                                                    {'loss': 1.4392, 'learning_rate': 0.00035550197560528486, 'epoch': 0.24}
 24%|██▍       | 825/3449 [39:15<1:55:22,  2.64s/it] 24%|██▍       | 826/3449 [39:20<2:21:46,  3.24s/it]                                                    {'loss': 1.3154, 'learning_rate': 0.0003553839223933126, 'epoch': 0.24}
 24%|██▍       | 826/3449 [39:20<2:21:46,  3.24s/it] 24%|██▍       | 827/3449 [39:22<2:16:00,  3.11s/it]                                                    {'loss': 1.2765, 'learning_rate': 0.00035526573244766134, 'epoch': 0.24}
 24%|██▍       | 827/3449 [39:22<2:16:00,  3.11s/it] 24%|██▍       | 828/3449 [39:25<2:09:36,  2.97s/it]                                                    {'loss': 1.18, 'learning_rate': 0.00035514740587233525, 'epoch': 0.24}
 24%|██▍       | 828/3449 [39:25<2:09:36,  2.97s/it] 24%|██▍       | 829/3449 [39:28<2:13:41,  3.06s/it]                                                    {'loss': 1.2128, 'learning_rate': 0.0003550289427714586, 'epoch': 0.24}
 24%|██▍       | 829/3449 [39:28<2:13:41,  3.06s/it] 24%|██▍       | 830/3449 [39:32<2:17:49,  3.16s/it]                                                    {'loss': 1.2001, 'learning_rate': 0.0003549103432492755, 'epoch': 0.24}
 24%|██▍       | 830/3449 [39:32<2:17:49,  3.16s/it] 24%|██▍       | 831/3449 [39:35<2:18:30,  3.17s/it]                                                    {'loss': 1.2746, 'learning_rate': 0.00035479160741015063, 'epoch': 0.24}
 24%|██▍       | 831/3449 [39:35<2:18:30,  3.17s/it] 24%|██▍       | 832/3449 [39:38<2:12:29,  3.04s/it]                                                    {'loss': 1.2801, 'learning_rate': 0.00035467273535856814, 'epoch': 0.24}
 24%|██▍       | 832/3449 [39:38<2:12:29,  3.04s/it] 24%|██▍       | 833/3449 [39:40<2:04:13,  2.85s/it]                                                    {'loss': 1.347, 'learning_rate': 0.0003545537271991323, 'epoch': 0.24}
 24%|██▍       | 833/3449 [39:40<2:04:13,  2.85s/it] 24%|██▍       | 834/3449 [39:43<2:04:46,  2.86s/it]                                                    {'loss': 1.3524, 'learning_rate': 0.0003544345830365671, 'epoch': 0.24}
 24%|██▍       | 834/3449 [39:43<2:04:46,  2.86s/it] 24%|██▍       | 835/3449 [39:45<2:01:21,  2.79s/it]                                                    {'loss': 1.23, 'learning_rate': 0.0003543153029757162, 'epoch': 0.24}
 24%|██▍       | 835/3449 [39:45<2:01:21,  2.79s/it] 24%|██▍       | 836/3449 [39:49<2:07:23,  2.93s/it]                                                    {'loss': 1.3264, 'learning_rate': 0.00035419588712154286, 'epoch': 0.24}
 24%|██▍       | 836/3449 [39:49<2:07:23,  2.93s/it] 24%|██▍       | 837/3449 [39:51<2:01:10,  2.78s/it]                                                    {'loss': 1.4038, 'learning_rate': 0.0003540763355791298, 'epoch': 0.24}
 24%|██▍       | 837/3449 [39:51<2:01:10,  2.78s/it] 24%|██▍       | 838/3449 [39:53<1:54:53,  2.64s/it]                                                    {'loss': 1.3156, 'learning_rate': 0.0003539566484536792, 'epoch': 0.24}
 24%|██▍       | 838/3449 [39:53<1:54:53,  2.64s/it] 24%|██▍       | 839/3449 [39:57<2:02:37,  2.82s/it]                                                    {'loss': 1.1655, 'learning_rate': 0.0003538368258505125, 'epoch': 0.24}
 24%|██▍       | 839/3449 [39:57<2:02:37,  2.82s/it] 24%|██▍       | 840/3449 [40:00<2:14:52,  3.10s/it]                                                    {'loss': 1.2485, 'learning_rate': 0.0003537168678750704, 'epoch': 0.24}
 24%|██▍       | 840/3449 [40:00<2:14:52,  3.10s/it] 24%|██▍       | 841/3449 [40:04<2:14:11,  3.09s/it]                                                    {'loss': 1.3553, 'learning_rate': 0.00035359677463291263, 'epoch': 0.24}
 24%|██▍       | 841/3449 [40:04<2:14:11,  3.09s/it] 24%|██▍       | 842/3449 [40:06<2:09:42,  2.99s/it]                                                    {'loss': 1.3247, 'learning_rate': 0.000353476546229718, 'epoch': 0.24}
 24%|██▍       | 842/3449 [40:06<2:09:42,  2.99s/it] 24%|██▍       | 843/3449 [40:09<2:03:46,  2.85s/it]                                                    {'loss': 1.2529, 'learning_rate': 0.0003533561827712844, 'epoch': 0.24}
 24%|██▍       | 843/3449 [40:09<2:03:46,  2.85s/it] 24%|██▍       | 844/3449 [40:11<2:00:28,  2.77s/it]                                                    {'loss': 1.3355, 'learning_rate': 0.0003532356843635284, 'epoch': 0.24}
 24%|██▍       | 844/3449 [40:11<2:00:28,  2.77s/it] 24%|██▍       | 845/3449 [40:14<1:54:10,  2.63s/it]                                                    {'loss': 1.2757, 'learning_rate': 0.00035311505111248527, 'epoch': 0.24}
 24%|██▍       | 845/3449 [40:14<1:54:10,  2.63s/it] 25%|██▍       | 846/3449 [40:16<1:54:45,  2.65s/it]                                                    {'loss': 1.4812, 'learning_rate': 0.00035299428312430913, 'epoch': 0.25}
 25%|██▍       | 846/3449 [40:16<1:54:45,  2.65s/it] 25%|██▍       | 847/3449 [40:19<1:54:00,  2.63s/it]                                                    {'loss': 1.335, 'learning_rate': 0.0003528733805052725, 'epoch': 0.25}
 25%|██▍       | 847/3449 [40:19<1:54:00,  2.63s/it] 25%|██▍       | 848/3449 [40:22<1:54:05,  2.63s/it]                                                    {'loss': 1.4521, 'learning_rate': 0.0003527523433617665, 'epoch': 0.25}
 25%|██▍       | 848/3449 [40:22<1:54:05,  2.63s/it] 25%|██▍       | 849/3449 [40:25<1:58:32,  2.74s/it]                                                    {'loss': 1.2322, 'learning_rate': 0.00035263117180030055, 'epoch': 0.25}
 25%|██▍       | 849/3449 [40:25<1:58:32,  2.74s/it] 25%|██▍       | 850/3449 [40:27<1:56:37,  2.69s/it]                                                    {'loss': 1.3555, 'learning_rate': 0.0003525098659275024, 'epoch': 0.25}
 25%|██▍       | 850/3449 [40:27<1:56:37,  2.69s/it] 25%|██▍       | 851/3449 [40:30<1:58:14,  2.73s/it]                                                    {'loss': 1.3167, 'learning_rate': 0.00035238842585011784, 'epoch': 0.25}
 25%|██▍       | 851/3449 [40:30<1:58:14,  2.73s/it] 25%|██▍       | 852/3449 [40:33<2:07:56,  2.96s/it]                                                    {'loss': 1.2408, 'learning_rate': 0.000352266851675011, 'epoch': 0.25}
 25%|██▍       | 852/3449 [40:33<2:07:56,  2.96s/it] 25%|██▍       | 853/3449 [40:36<2:03:49,  2.86s/it]                                                    {'loss': 1.2397, 'learning_rate': 0.0003521451435091638, 'epoch': 0.25}
 25%|██▍       | 853/3449 [40:36<2:03:49,  2.86s/it] 25%|██▍       | 854/3449 [40:39<2:00:24,  2.78s/it]                                                    {'loss': 1.4012, 'learning_rate': 0.0003520233014596762, 'epoch': 0.25}
 25%|██▍       | 854/3449 [40:39<2:00:24,  2.78s/it] 25%|██▍       | 855/3449 [40:42<2:00:50,  2.80s/it]                                                    {'loss': 1.2655, 'learning_rate': 0.000351901325633766, 'epoch': 0.25}
 25%|██▍       | 855/3449 [40:42<2:00:50,  2.80s/it] 25%|██▍       | 856/3449 [40:44<2:00:07,  2.78s/it]                                                    {'loss': 1.2994, 'learning_rate': 0.0003517792161387685, 'epoch': 0.25}
 25%|██▍       | 856/3449 [40:44<2:00:07,  2.78s/it] 25%|██▍       | 857/3449 [40:47<1:58:42,  2.75s/it]                                                    {'loss': 1.3843, 'learning_rate': 0.0003516569730821369, 'epoch': 0.25}
 25%|██▍       | 857/3449 [40:47<1:58:42,  2.75s/it] 25%|██▍       | 858/3449 [40:50<1:57:10,  2.71s/it]                                                    {'loss': 1.2291, 'learning_rate': 0.0003515345965714418, 'epoch': 0.25}
 25%|██▍       | 858/3449 [40:50<1:57:10,  2.71s/it] 25%|██▍       | 859/3449 [40:53<2:08:20,  2.97s/it]                                                    {'loss': 1.2817, 'learning_rate': 0.0003514120867143712, 'epoch': 0.25}
 25%|██▍       | 859/3449 [40:53<2:08:20,  2.97s/it] 25%|██▍       | 860/3449 [40:56<2:09:29,  3.00s/it]                                                    {'loss': 1.228, 'learning_rate': 0.0003512894436187304, 'epoch': 0.25}
 25%|██▍       | 860/3449 [40:56<2:09:29,  3.00s/it] 25%|██▍       | 861/3449 [40:59<2:07:00,  2.94s/it]                                                    {'loss': 1.312, 'learning_rate': 0.00035116666739244223, 'epoch': 0.25}
 25%|██▍       | 861/3449 [40:59<2:07:00,  2.94s/it] 25%|██▍       | 862/3449 [41:02<2:07:04,  2.95s/it]                                                    {'loss': 1.2025, 'learning_rate': 0.0003510437581435463, 'epoch': 0.25}
 25%|██▍       | 862/3449 [41:02<2:07:04,  2.95s/it] 25%|██▌       | 863/3449 [41:05<2:07:03,  2.95s/it]                                                    {'loss': 1.2523, 'learning_rate': 0.00035092071598019956, 'epoch': 0.25}
 25%|██▌       | 863/3449 [41:05<2:07:03,  2.95s/it] 25%|██▌       | 864/3449 [41:08<2:03:25,  2.86s/it]                                                    {'loss': 1.3244, 'learning_rate': 0.0003507975410106758, 'epoch': 0.25}
 25%|██▌       | 864/3449 [41:08<2:03:25,  2.86s/it] 25%|██▌       | 865/3449 [41:11<2:05:12,  2.91s/it]                                                    {'loss': 1.3762, 'learning_rate': 0.0003506742333433656, 'epoch': 0.25}
 25%|██▌       | 865/3449 [41:11<2:05:12,  2.91s/it] 25%|██▌       | 866/3449 [41:13<2:00:03,  2.79s/it]                                                    {'loss': 1.2588, 'learning_rate': 0.0003505507930867764, 'epoch': 0.25}
 25%|██▌       | 866/3449 [41:13<2:00:03,  2.79s/it] 25%|██▌       | 867/3449 [41:16<2:00:53,  2.81s/it]                                                    {'loss': 1.2548, 'learning_rate': 0.0003504272203495324, 'epoch': 0.25}
 25%|██▌       | 867/3449 [41:16<2:00:53,  2.81s/it] 25%|██▌       | 868/3449 [41:19<2:02:11,  2.84s/it]                                                    {'loss': 1.1942, 'learning_rate': 0.0003503035152403743, 'epoch': 0.25}
 25%|██▌       | 868/3449 [41:19<2:02:11,  2.84s/it] 25%|██▌       | 869/3449 [41:22<2:02:00,  2.84s/it]                                                    {'loss': 1.2061, 'learning_rate': 0.00035017967786815917, 'epoch': 0.25}
 25%|██▌       | 869/3449 [41:22<2:02:00,  2.84s/it] 25%|██▌       | 870/3449 [41:25<2:03:33,  2.87s/it]                                                    {'loss': 1.3105, 'learning_rate': 0.0003500557083418606, 'epoch': 0.25}
 25%|██▌       | 870/3449 [41:25<2:03:33,  2.87s/it] 25%|██▌       | 871/3449 [41:28<2:06:45,  2.95s/it]                                                    {'loss': 1.2977, 'learning_rate': 0.0003499316067705685, 'epoch': 0.25}
 25%|██▌       | 871/3449 [41:28<2:06:45,  2.95s/it] 25%|██▌       | 872/3449 [41:30<2:02:45,  2.86s/it]                                                    {'loss': 1.2818, 'learning_rate': 0.00034980737326348885, 'epoch': 0.25}
 25%|██▌       | 872/3449 [41:30<2:02:45,  2.86s/it] 25%|██▌       | 873/3449 [41:34<2:05:35,  2.93s/it]                                                    {'loss': 1.3441, 'learning_rate': 0.00034968300792994386, 'epoch': 0.25}
 25%|██▌       | 873/3449 [41:34<2:05:35,  2.93s/it] 25%|██▌       | 874/3449 [41:37<2:13:45,  3.12s/it]                                                    {'loss': 1.3399, 'learning_rate': 0.0003495585108793717, 'epoch': 0.25}
 25%|██▌       | 874/3449 [41:37<2:13:45,  3.12s/it] 25%|██▌       | 875/3449 [41:40<2:05:18,  2.92s/it]                                                    {'loss': 1.2834, 'learning_rate': 0.0003494338822213264, 'epoch': 0.25}
 25%|██▌       | 875/3449 [41:40<2:05:18,  2.92s/it] 25%|██▌       | 876/3449 [41:42<1:55:19,  2.69s/it]                                                    {'loss': 1.1703, 'learning_rate': 0.0003493091220654777, 'epoch': 0.25}
 25%|██▌       | 876/3449 [41:42<1:55:19,  2.69s/it] 25%|██▌       | 877/3449 [41:45<1:57:22,  2.74s/it]                                                    {'loss': 1.3597, 'learning_rate': 0.0003491842305216114, 'epoch': 0.25}
 25%|██▌       | 877/3449 [41:45<1:57:22,  2.74s/it] 25%|██▌       | 878/3449 [41:47<1:58:57,  2.78s/it]                                                    {'loss': 1.2565, 'learning_rate': 0.00034905920769962863, 'epoch': 0.25}
 25%|██▌       | 878/3449 [41:47<1:58:57,  2.78s/it] 25%|██▌       | 879/3449 [41:51<2:03:59,  2.89s/it]                                                    {'loss': 1.2479, 'learning_rate': 0.00034893405370954605, 'epoch': 0.25}
 25%|██▌       | 879/3449 [41:51<2:03:59,  2.89s/it] 26%|██▌       | 880/3449 [41:56<2:35:48,  3.64s/it]                                                    {'loss': 1.3164, 'learning_rate': 0.0003488087686614959, 'epoch': 0.26}
 26%|██▌       | 880/3449 [41:56<2:35:48,  3.64s/it] 26%|██▌       | 881/3449 [41:59<2:22:34,  3.33s/it]                                                    {'loss': 1.2071, 'learning_rate': 0.0003486833526657256, 'epoch': 0.26}
 26%|██▌       | 881/3449 [41:59<2:22:34,  3.33s/it] 26%|██▌       | 882/3449 [42:02<2:28:25,  3.47s/it]                                                    {'loss': 1.2601, 'learning_rate': 0.00034855780583259785, 'epoch': 0.26}
 26%|██▌       | 882/3449 [42:02<2:28:25,  3.47s/it] 26%|██▌       | 883/3449 [42:05<2:18:15,  3.23s/it]                                                    {'loss': 1.3907, 'learning_rate': 0.00034843212827259055, 'epoch': 0.26}
 26%|██▌       | 883/3449 [42:05<2:18:15,  3.23s/it] 26%|██▌       | 884/3449 [42:08<2:14:59,  3.16s/it]                                                    {'loss': 1.3849, 'learning_rate': 0.0003483063200962966, 'epoch': 0.26}
 26%|██▌       | 884/3449 [42:08<2:14:59,  3.16s/it] 26%|██▌       | 885/3449 [42:11<2:06:03,  2.95s/it]                                                    {'loss': 1.3005, 'learning_rate': 0.00034818038141442366, 'epoch': 0.26}
 26%|██▌       | 885/3449 [42:11<2:06:03,  2.95s/it] 26%|██▌       | 886/3449 [42:13<2:05:57,  2.95s/it]                                                    {'loss': 1.3962, 'learning_rate': 0.00034805431233779456, 'epoch': 0.26}
 26%|██▌       | 886/3449 [42:13<2:05:57,  2.95s/it] 26%|██▌       | 887/3449 [42:16<1:59:00,  2.79s/it]                                                    {'loss': 1.3415, 'learning_rate': 0.00034792811297734656, 'epoch': 0.26}
 26%|██▌       | 887/3449 [42:16<1:59:00,  2.79s/it] 26%|██▌       | 888/3449 [42:18<1:54:59,  2.69s/it]                                                    {'loss': 1.2538, 'learning_rate': 0.00034780178344413185, 'epoch': 0.26}
 26%|██▌       | 888/3449 [42:18<1:54:59,  2.69s/it] 26%|██▌       | 889/3449 [42:21<1:53:52,  2.67s/it]                                                    {'loss': 1.2713, 'learning_rate': 0.0003476753238493169, 'epoch': 0.26}
 26%|██▌       | 889/3449 [42:21<1:53:52,  2.67s/it] 26%|██▌       | 890/3449 [42:24<1:53:37,  2.66s/it]                                                    {'loss': 1.2862, 'learning_rate': 0.0003475487343041829, 'epoch': 0.26}
 26%|██▌       | 890/3449 [42:24<1:53:37,  2.66s/it] 26%|██▌       | 891/3449 [42:27<2:00:32,  2.83s/it]                                                    {'loss': 1.1766, 'learning_rate': 0.00034742201492012504, 'epoch': 0.26}
 26%|██▌       | 891/3449 [42:27<2:00:32,  2.83s/it] 26%|██▌       | 892/3449 [42:30<2:05:09,  2.94s/it]                                                    {'loss': 1.3389, 'learning_rate': 0.0003472951658086532, 'epoch': 0.26}
 26%|██▌       | 892/3449 [42:30<2:05:09,  2.94s/it] 26%|██▌       | 893/3449 [42:33<2:02:47,  2.88s/it]                                                    {'loss': 1.2903, 'learning_rate': 0.0003471681870813911, 'epoch': 0.26}
 26%|██▌       | 893/3449 [42:33<2:02:47,  2.88s/it] 26%|██▌       | 894/3449 [42:36<2:02:45,  2.88s/it]                                                    {'loss': 1.3663, 'learning_rate': 0.00034704107885007656, 'epoch': 0.26}
 26%|██▌       | 894/3449 [42:36<2:02:45,  2.88s/it] 26%|██▌       | 895/3449 [42:39<2:10:21,  3.06s/it]                                                    {'loss': 1.2847, 'learning_rate': 0.0003469138412265614, 'epoch': 0.26}
 26%|██▌       | 895/3449 [42:39<2:10:21,  3.06s/it] 26%|██▌       | 896/3449 [42:42<2:02:41,  2.88s/it]                                                    {'loss': 1.2622, 'learning_rate': 0.00034678647432281147, 'epoch': 0.26}
 26%|██▌       | 896/3449 [42:42<2:02:41,  2.88s/it] 26%|██▌       | 897/3449 [42:45<2:10:02,  3.06s/it]                                                    {'loss': 1.3262, 'learning_rate': 0.000346658978250906, 'epoch': 0.26}
 26%|██▌       | 897/3449 [42:45<2:10:02,  3.06s/it] 26%|██▌       | 898/3449 [42:48<2:06:23,  2.97s/it]                                                    {'loss': 1.558, 'learning_rate': 0.0003465313531230383, 'epoch': 0.26}
 26%|██▌       | 898/3449 [42:48<2:06:23,  2.97s/it] 26%|██▌       | 899/3449 [42:50<2:02:14,  2.88s/it]                                                    {'loss': 1.3492, 'learning_rate': 0.000346403599051515, 'epoch': 0.26}
 26%|██▌       | 899/3449 [42:51<2:02:14,  2.88s/it] 26%|██▌       | 900/3449 [42:53<1:59:32,  2.81s/it]                                                    {'loss': 1.574, 'learning_rate': 0.0003462757161487562, 'epoch': 0.26}
 26%|██▌       | 900/3449 [42:53<1:59:32,  2.81s/it] 26%|██▌       | 901/3449 [42:55<1:52:36,  2.65s/it]                                                    {'loss': 1.2393, 'learning_rate': 0.00034614770452729544, 'epoch': 0.26}
 26%|██▌       | 901/3449 [42:55<1:52:36,  2.65s/it] 26%|██▌       | 902/3449 [42:58<1:47:49,  2.54s/it]                                                    {'loss': 1.3901, 'learning_rate': 0.0003460195642997795, 'epoch': 0.26}
 26%|██▌       | 902/3449 [42:58<1:47:49,  2.54s/it] 26%|██▌       | 903/3449 [43:00<1:45:54,  2.50s/it]                                                    {'loss': 1.1878, 'learning_rate': 0.00034589129557896845, 'epoch': 0.26}
 26%|██▌       | 903/3449 [43:00<1:45:54,  2.50s/it] 26%|██▌       | 904/3449 [43:03<1:46:51,  2.52s/it]                                                    {'loss': 1.2544, 'learning_rate': 0.00034576289847773514, 'epoch': 0.26}
 26%|██▌       | 904/3449 [43:03<1:46:51,  2.52s/it] 26%|██▌       | 905/3449 [43:05<1:48:50,  2.57s/it]                                                    {'loss': 1.301, 'learning_rate': 0.0003456343731090657, 'epoch': 0.26}
 26%|██▌       | 905/3449 [43:05<1:48:50,  2.57s/it] 26%|██▋       | 906/3449 [43:08<1:54:49,  2.71s/it]                                                    {'loss': 1.125, 'learning_rate': 0.000345505719586059, 'epoch': 0.26}
 26%|██▋       | 906/3449 [43:08<1:54:49,  2.71s/it] 26%|██▋       | 907/3449 [43:11<1:48:58,  2.57s/it]                                                    {'loss': 1.4236, 'learning_rate': 0.0003453769380219266, 'epoch': 0.26}
 26%|██▋       | 907/3449 [43:11<1:48:58,  2.57s/it] 26%|██▋       | 908/3449 [43:14<2:03:23,  2.91s/it]                                                    {'loss': 1.3812, 'learning_rate': 0.0003452480285299929, 'epoch': 0.26}
 26%|██▋       | 908/3449 [43:14<2:03:23,  2.91s/it] 26%|██▋       | 909/3449 [43:17<2:02:29,  2.89s/it]                                                    {'loss': 1.2932, 'learning_rate': 0.00034511899122369476, 'epoch': 0.26}
 26%|██▋       | 909/3449 [43:17<2:02:29,  2.89s/it] 26%|██▋       | 910/3449 [43:20<1:57:48,  2.78s/it]                                                    {'loss': 1.3466, 'learning_rate': 0.00034498982621658156, 'epoch': 0.26}
 26%|██▋       | 910/3449 [43:20<1:57:48,  2.78s/it] 26%|██▋       | 911/3449 [43:22<1:56:40,  2.76s/it]                                                    {'loss': 1.331, 'learning_rate': 0.00034486053362231496, 'epoch': 0.26}
 26%|██▋       | 911/3449 [43:22<1:56:40,  2.76s/it] 26%|██▋       | 912/3449 [43:25<1:53:22,  2.68s/it]                                                    {'loss': 1.2288, 'learning_rate': 0.00034473111355466906, 'epoch': 0.26}
 26%|██▋       | 912/3449 [43:25<1:53:22,  2.68s/it] 26%|██▋       | 913/3449 [43:28<2:01:38,  2.88s/it]                                                    {'loss': 1.3641, 'learning_rate': 0.00034460156612753004, 'epoch': 0.26}
 26%|██▋       | 913/3449 [43:28<2:01:38,  2.88s/it] 27%|██▋       | 914/3449 [43:31<2:01:49,  2.88s/it]                                                    {'loss': 1.1936, 'learning_rate': 0.0003444718914548961, 'epoch': 0.26}
 27%|██▋       | 914/3449 [43:31<2:01:49,  2.88s/it] 27%|██▋       | 915/3449 [43:34<2:02:03,  2.89s/it]                                                    {'loss': 1.1695, 'learning_rate': 0.0003443420896508775, 'epoch': 0.27}
 27%|██▋       | 915/3449 [43:34<2:02:03,  2.89s/it] 27%|██▋       | 916/3449 [43:37<1:57:23,  2.78s/it]                                                    {'loss': 1.3313, 'learning_rate': 0.0003442121608296964, 'epoch': 0.27}
 27%|██▋       | 916/3449 [43:37<1:57:23,  2.78s/it] 27%|██▋       | 917/3449 [43:40<1:59:01,  2.82s/it]                                                    {'loss': 1.2438, 'learning_rate': 0.0003440821051056866, 'epoch': 0.27}
 27%|██▋       | 917/3449 [43:40<1:59:01,  2.82s/it] 27%|██▋       | 918/3449 [43:42<2:00:44,  2.86s/it]                                                    {'loss': 1.0805, 'learning_rate': 0.00034395192259329365, 'epoch': 0.27}
 27%|██▋       | 918/3449 [43:42<2:00:44,  2.86s/it] 27%|██▋       | 919/3449 [43:45<1:57:58,  2.80s/it]                                                    {'loss': 1.2497, 'learning_rate': 0.00034382161340707466, 'epoch': 0.27}
 27%|██▋       | 919/3449 [43:45<1:57:58,  2.80s/it] 27%|██▋       | 920/3449 [43:48<1:59:47,  2.84s/it]                                                    {'loss': 1.2729, 'learning_rate': 0.0003436911776616982, 'epoch': 0.27}
 27%|██▋       | 920/3449 [43:48<1:59:47,  2.84s/it] 27%|██▋       | 921/3449 [43:50<1:50:22,  2.62s/it]                                                    {'loss': 1.599, 'learning_rate': 0.00034356061547194427, 'epoch': 0.27}
 27%|██▋       | 921/3449 [43:50<1:50:22,  2.62s/it] 27%|██▋       | 922/3449 [43:53<1:51:42,  2.65s/it]                                                    {'loss': 1.3383, 'learning_rate': 0.0003434299269527041, 'epoch': 0.27}
 27%|██▋       | 922/3449 [43:53<1:51:42,  2.65s/it] 27%|██▋       | 923/3449 [43:56<1:54:49,  2.73s/it]                                                    {'loss': 1.301, 'learning_rate': 0.0003432991122189801, 'epoch': 0.27}
 27%|██▋       | 923/3449 [43:56<1:54:49,  2.73s/it] 27%|██▋       | 924/3449 [43:59<1:56:03,  2.76s/it]                                                    {'loss': 1.289, 'learning_rate': 0.0003431681713858856, 'epoch': 0.27}
 27%|██▋       | 924/3449 [43:59<1:56:03,  2.76s/it] 27%|██▋       | 925/3449 [44:02<2:08:06,  3.05s/it]                                                    {'loss': 1.2264, 'learning_rate': 0.00034303710456864506, 'epoch': 0.27}
 27%|██▋       | 925/3449 [44:02<2:08:06,  3.05s/it] 27%|██▋       | 926/3449 [44:05<2:08:35,  3.06s/it]                                                    {'loss': 1.2434, 'learning_rate': 0.00034290591188259386, 'epoch': 0.27}
 27%|██▋       | 926/3449 [44:05<2:08:35,  3.06s/it] 27%|██▋       | 927/3449 [44:08<2:02:30,  2.91s/it]                                                    {'loss': 1.5302, 'learning_rate': 0.000342774593443178, 'epoch': 0.27}
 27%|██▋       | 927/3449 [44:08<2:02:30,  2.91s/it] 27%|██▋       | 928/3449 [44:10<1:54:05,  2.72s/it]                                                    {'loss': 1.2321, 'learning_rate': 0.00034264314936595407, 'epoch': 0.27}
 27%|██▋       | 928/3449 [44:10<1:54:05,  2.72s/it] 27%|██▋       | 929/3449 [44:13<1:57:02,  2.79s/it]                                                    {'loss': 1.2389, 'learning_rate': 0.00034251157976658943, 'epoch': 0.27}
 27%|██▋       | 929/3449 [44:13<1:57:02,  2.79s/it] 27%|██▋       | 930/3449 [44:16<1:51:51,  2.66s/it]                                                    {'loss': 1.2864, 'learning_rate': 0.00034237988476086177, 'epoch': 0.27}
 27%|██▋       | 930/3449 [44:16<1:51:51,  2.66s/it] 27%|██▋       | 931/3449 [44:18<1:46:25,  2.54s/it]                                                    {'loss': 1.3782, 'learning_rate': 0.00034224806446465927, 'epoch': 0.27}
 27%|██▋       | 931/3449 [44:18<1:46:25,  2.54s/it] 27%|██▋       | 932/3449 [44:20<1:42:26,  2.44s/it]                                                    {'loss': 1.3262, 'learning_rate': 0.00034211611899398, 'epoch': 0.27}
 27%|██▋       | 932/3449 [44:20<1:42:26,  2.44s/it] 27%|██▋       | 933/3449 [44:22<1:41:51,  2.43s/it]                                                    {'loss': 1.4719, 'learning_rate': 0.0003419840484649326, 'epoch': 0.27}
 27%|██▋       | 933/3449 [44:22<1:41:51,  2.43s/it] 27%|██▋       | 934/3449 [44:25<1:46:07,  2.53s/it]                                                    {'loss': 1.1969, 'learning_rate': 0.0003418518529937356, 'epoch': 0.27}
 27%|██▋       | 934/3449 [44:25<1:46:07,  2.53s/it] 27%|██▋       | 935/3449 [44:28<1:46:49,  2.55s/it]                                                    {'loss': 1.3223, 'learning_rate': 0.00034171953269671745, 'epoch': 0.27}
 27%|██▋       | 935/3449 [44:28<1:46:49,  2.55s/it] 27%|██▋       | 936/3449 [44:30<1:45:36,  2.52s/it]                                                    {'loss': 1.1886, 'learning_rate': 0.0003415870876903164, 'epoch': 0.27}
 27%|██▋       | 936/3449 [44:30<1:45:36,  2.52s/it] 27%|██▋       | 937/3449 [44:33<1:45:16,  2.51s/it]                                                    {'loss': 1.3605, 'learning_rate': 0.0003414545180910805, 'epoch': 0.27}
 27%|██▋       | 937/3449 [44:33<1:45:16,  2.51s/it] 27%|██▋       | 938/3449 [44:36<1:48:10,  2.58s/it]                                                    {'loss': 1.4476, 'learning_rate': 0.0003413218240156675, 'epoch': 0.27}
 27%|██▋       | 938/3449 [44:36<1:48:10,  2.58s/it] 27%|██▋       | 939/3449 [44:38<1:44:32,  2.50s/it]                                                    {'loss': 1.3892, 'learning_rate': 0.00034118900558084464, 'epoch': 0.27}
 27%|██▋       | 939/3449 [44:38<1:44:32,  2.50s/it] 27%|██▋       | 940/3449 [44:41<1:50:27,  2.64s/it]                                                    {'loss': 1.399, 'learning_rate': 0.0003410560629034884, 'epoch': 0.27}
 27%|██▋       | 940/3449 [44:41<1:50:27,  2.64s/it] 27%|██▋       | 941/3449 [44:43<1:46:54,  2.56s/it]                                                    {'loss': 1.2616, 'learning_rate': 0.00034092299610058506, 'epoch': 0.27}
 27%|██▋       | 941/3449 [44:43<1:46:54,  2.56s/it] 27%|██▋       | 942/3449 [44:46<1:55:13,  2.76s/it]                                                    {'loss': 1.2666, 'learning_rate': 0.00034078980528922954, 'epoch': 0.27}
 27%|██▋       | 942/3449 [44:46<1:55:13,  2.76s/it] 27%|██▋       | 943/3449 [44:49<1:54:21,  2.74s/it]                                                    {'loss': 1.2589, 'learning_rate': 0.0003406564905866264, 'epoch': 0.27}
 27%|██▋       | 943/3449 [44:49<1:54:21,  2.74s/it] 27%|██▋       | 944/3449 [44:52<1:56:24,  2.79s/it]                                                    {'loss': 1.3343, 'learning_rate': 0.00034052305211008883, 'epoch': 0.27}
 27%|██▋       | 944/3449 [44:52<1:56:24,  2.79s/it] 27%|██▋       | 945/3449 [44:55<1:58:14,  2.83s/it]                                                    {'loss': 1.2685, 'learning_rate': 0.00034038948997703916, 'epoch': 0.27}
 27%|██▋       | 945/3449 [44:55<1:58:14,  2.83s/it] 27%|██▋       | 946/3449 [44:57<1:53:04,  2.71s/it]                                                    {'loss': 1.3386, 'learning_rate': 0.00034025580430500864, 'epoch': 0.27}
 27%|██▋       | 946/3449 [44:57<1:53:04,  2.71s/it] 27%|██▋       | 947/3449 [45:00<1:50:27,  2.65s/it]                                                    {'loss': 1.2239, 'learning_rate': 0.00034012199521163677, 'epoch': 0.27}
 27%|██▋       | 947/3449 [45:00<1:50:27,  2.65s/it] 27%|██▋       | 948/3449 [45:03<1:55:43,  2.78s/it]                                                    {'loss': 1.188, 'learning_rate': 0.0003399880628146722, 'epoch': 0.27}
 27%|██▋       | 948/3449 [45:03<1:55:43,  2.78s/it] 28%|██▊       | 949/3449 [45:06<1:53:45,  2.73s/it]                                                    {'loss': 1.2265, 'learning_rate': 0.0003398540072319717, 'epoch': 0.28}
 28%|██▊       | 949/3449 [45:06<1:53:45,  2.73s/it] 28%|██▊       | 950/3449 [45:08<1:54:25,  2.75s/it]                                                    {'loss': 1.4477, 'learning_rate': 0.0003397198285815007, 'epoch': 0.28}
 28%|██▊       | 950/3449 [45:08<1:54:25,  2.75s/it] 28%|██▊       | 951/3449 [45:11<1:49:24,  2.63s/it]                                                    {'loss': 1.3151, 'learning_rate': 0.00033958552698133275, 'epoch': 0.28}
 28%|██▊       | 951/3449 [45:11<1:49:24,  2.63s/it] 28%|██▊       | 952/3449 [45:13<1:47:33,  2.58s/it]                                                    {'loss': 1.3016, 'learning_rate': 0.00033945110254964965, 'epoch': 0.28}
 28%|██▊       | 952/3449 [45:13<1:47:33,  2.58s/it] 28%|██▊       | 953/3449 [45:16<1:48:15,  2.60s/it]                                                    {'loss': 1.3619, 'learning_rate': 0.00033931655540474134, 'epoch': 0.28}
 28%|██▊       | 953/3449 [45:16<1:48:15,  2.60s/it] 28%|██▊       | 954/3449 [45:18<1:43:31,  2.49s/it]                                                    {'loss': 1.4516, 'learning_rate': 0.00033918188566500556, 'epoch': 0.28}
 28%|██▊       | 954/3449 [45:18<1:43:31,  2.49s/it] 28%|██▊       | 955/3449 [45:21<1:46:07,  2.55s/it]                                                    {'loss': 1.2323, 'learning_rate': 0.0003390470934489482, 'epoch': 0.28}
 28%|██▊       | 955/3449 [45:21<1:46:07,  2.55s/it] 28%|██▊       | 956/3449 [45:24<1:57:09,  2.82s/it]                                                    {'loss': 1.3176, 'learning_rate': 0.00033891217887518276, 'epoch': 0.28}
 28%|██▊       | 956/3449 [45:24<1:57:09,  2.82s/it] 28%|██▊       | 957/3449 [45:27<1:51:52,  2.69s/it]                                                    {'loss': 1.3262, 'learning_rate': 0.0003387771420624304, 'epoch': 0.28}
 28%|██▊       | 957/3449 [45:27<1:51:52,  2.69s/it] 28%|██▊       | 958/3449 [45:29<1:51:51,  2.69s/it]                                                    {'loss': 1.1469, 'learning_rate': 0.0003386419831295199, 'epoch': 0.28}
 28%|██▊       | 958/3449 [45:29<1:51:51,  2.69s/it] 28%|██▊       | 959/3449 [45:32<1:49:38,  2.64s/it]                                                    {'loss': 1.2472, 'learning_rate': 0.0003385067021953875, 'epoch': 0.28}
 28%|██▊       | 959/3449 [45:32<1:49:38,  2.64s/it] 28%|██▊       | 960/3449 [45:35<1:53:58,  2.75s/it]                                                    {'loss': 1.4968, 'learning_rate': 0.00033837129937907683, 'epoch': 0.28}
 28%|██▊       | 960/3449 [45:35<1:53:58,  2.75s/it] 28%|██▊       | 961/3449 [45:38<2:02:45,  2.96s/it]                                                    {'loss': 1.1333, 'learning_rate': 0.0003382357747997387, 'epoch': 0.28}
 28%|██▊       | 961/3449 [45:38<2:02:45,  2.96s/it] 28%|██▊       | 962/3449 [45:42<2:08:55,  3.11s/it]                                                    {'loss': 1.2604, 'learning_rate': 0.00033810012857663104, 'epoch': 0.28}
 28%|██▊       | 962/3449 [45:42<2:08:55,  3.11s/it] 28%|██▊       | 963/3449 [45:46<2:27:42,  3.56s/it]                                                    {'loss': 1.3023, 'learning_rate': 0.000337964360829119, 'epoch': 0.28}
 28%|██▊       | 963/3449 [45:46<2:27:42,  3.56s/it] 28%|██▊       | 964/3449 [45:49<2:14:40,  3.25s/it]                                                    {'loss': 1.5207, 'learning_rate': 0.0003378284716766745, 'epoch': 0.28}
 28%|██▊       | 964/3449 [45:49<2:14:40,  3.25s/it] 28%|██▊       | 965/3449 [45:51<2:06:43,  3.06s/it]                                                    {'loss': 1.2229, 'learning_rate': 0.00033769246123887625, 'epoch': 0.28}
 28%|██▊       | 965/3449 [45:51<2:06:43,  3.06s/it] 28%|██▊       | 966/3449 [45:54<2:01:41,  2.94s/it]                                                    {'loss': 1.3655, 'learning_rate': 0.00033755632963540993, 'epoch': 0.28}
 28%|██▊       | 966/3449 [45:54<2:01:41,  2.94s/it] 28%|██▊       | 967/3449 [45:57<1:56:06,  2.81s/it]                                                    {'loss': 1.1568, 'learning_rate': 0.00033742007698606765, 'epoch': 0.28}
 28%|██▊       | 967/3449 [45:57<1:56:06,  2.81s/it] 28%|██▊       | 968/3449 [46:01<2:13:30,  3.23s/it]                                                    {'loss': 1.1576, 'learning_rate': 0.000337283703410748, 'epoch': 0.28}
 28%|██▊       | 968/3449 [46:01<2:13:30,  3.23s/it] 28%|██▊       | 969/3449 [46:04<2:08:56,  3.12s/it]                                                    {'loss': 1.1474, 'learning_rate': 0.0003371472090294562, 'epoch': 0.28}
 28%|██▊       | 969/3449 [46:04<2:08:56,  3.12s/it] 28%|██▊       | 970/3449 [46:06<2:04:01,  3.00s/it]                                                    {'loss': 1.3913, 'learning_rate': 0.0003370105939623035, 'epoch': 0.28}
 28%|██▊       | 970/3449 [46:06<2:04:01,  3.00s/it] 28%|██▊       | 971/3449 [46:09<2:01:04,  2.93s/it]                                                    {'loss': 1.3809, 'learning_rate': 0.0003368738583295077, 'epoch': 0.28}
 28%|██▊       | 971/3449 [46:09<2:01:04,  2.93s/it] 28%|██▊       | 972/3449 [46:13<2:09:45,  3.14s/it]                                                    {'loss': 1.3749, 'learning_rate': 0.00033673700225139225, 'epoch': 0.28}
 28%|██▊       | 972/3449 [46:13<2:09:45,  3.14s/it] 28%|██▊       | 973/3449 [46:15<2:01:38,  2.95s/it]                                                    {'loss': 1.3265, 'learning_rate': 0.0003366000258483869, 'epoch': 0.28}
 28%|██▊       | 973/3449 [46:15<2:01:38,  2.95s/it] 28%|██▊       | 974/3449 [46:18<1:54:44,  2.78s/it]                                                    {'loss': 1.3178, 'learning_rate': 0.00033646292924102727, 'epoch': 0.28}
 28%|██▊       | 974/3449 [46:18<1:54:44,  2.78s/it] 28%|██▊       | 975/3449 [46:20<1:52:34,  2.73s/it]                                                    {'loss': 1.3419, 'learning_rate': 0.0003363257125499546, 'epoch': 0.28}
 28%|██▊       | 975/3449 [46:20<1:52:34,  2.73s/it] 28%|██▊       | 976/3449 [46:24<2:00:38,  2.93s/it]                                                    {'loss': 1.3618, 'learning_rate': 0.0003361883758959159, 'epoch': 0.28}
 28%|██▊       | 976/3449 [46:24<2:00:38,  2.93s/it] 28%|██▊       | 977/3449 [46:26<1:55:38,  2.81s/it]                                                    {'loss': 1.412, 'learning_rate': 0.0003360509193997639, 'epoch': 0.28}
 28%|██▊       | 977/3449 [46:26<1:55:38,  2.81s/it] 28%|██▊       | 978/3449 [46:29<1:54:29,  2.78s/it]                                                    {'loss': 1.0222, 'learning_rate': 0.0003359133431824565, 'epoch': 0.28}
 28%|██▊       | 978/3449 [46:29<1:54:29,  2.78s/it] 28%|██▊       | 979/3449 [46:31<1:50:59,  2.70s/it]                                                    {'loss': 1.4098, 'learning_rate': 0.000335775647365057, 'epoch': 0.28}
 28%|██▊       | 979/3449 [46:31<1:50:59,  2.70s/it] 28%|██▊       | 980/3449 [46:34<1:47:31,  2.61s/it]                                                    {'loss': 1.254, 'learning_rate': 0.00033563783206873413, 'epoch': 0.28}
 28%|██▊       | 980/3449 [46:34<1:47:31,  2.61s/it] 28%|██▊       | 981/3449 [46:37<1:58:58,  2.89s/it]                                                    {'loss': 1.2008, 'learning_rate': 0.0003354998974147616, 'epoch': 0.28}
 28%|██▊       | 981/3449 [46:37<1:58:58,  2.89s/it] 28%|██▊       | 982/3449 [46:41<2:02:20,  2.98s/it]                                                    {'loss': 1.2168, 'learning_rate': 0.0003353618435245183, 'epoch': 0.28}
 28%|██▊       | 982/3449 [46:41<2:02:20,  2.98s/it] 29%|██▊       | 983/3449 [46:43<1:57:59,  2.87s/it]                                                    {'loss': 1.3808, 'learning_rate': 0.0003352236705194878, 'epoch': 0.28}
 29%|██▊       | 983/3449 [46:43<1:57:59,  2.87s/it] 29%|██▊       | 984/3449 [46:46<1:50:51,  2.70s/it]                                                    {'loss': 1.2343, 'learning_rate': 0.00033508537852125877, 'epoch': 0.29}
 29%|██▊       | 984/3449 [46:46<1:50:51,  2.70s/it] 29%|██▊       | 985/3449 [46:49<1:59:18,  2.91s/it]                                                    {'loss': 1.2673, 'learning_rate': 0.00033494696765152426, 'epoch': 0.29}
 29%|██▊       | 985/3449 [46:49<1:59:18,  2.91s/it] 29%|██▊       | 986/3449 [46:51<1:53:22,  2.76s/it]                                                    {'loss': 1.3375, 'learning_rate': 0.00033480843803208236, 'epoch': 0.29}
 29%|██▊       | 986/3449 [46:51<1:53:22,  2.76s/it] 29%|██▊       | 987/3449 [46:54<1:50:52,  2.70s/it]                                                    {'loss': 1.2231, 'learning_rate': 0.0003346697897848352, 'epoch': 0.29}
 29%|██▊       | 987/3449 [46:54<1:50:52,  2.70s/it] 29%|██▊       | 988/3449 [46:58<2:04:45,  3.04s/it]                                                    {'loss': 1.2481, 'learning_rate': 0.0003345310230317897, 'epoch': 0.29}
 29%|██▊       | 988/3449 [46:58<2:04:45,  3.04s/it] 29%|██▊       | 989/3449 [47:00<2:00:51,  2.95s/it]                                                    {'loss': 1.2603, 'learning_rate': 0.0003343921378950568, 'epoch': 0.29}
 29%|██▊       | 989/3449 [47:00<2:00:51,  2.95s/it] 29%|██▊       | 990/3449 [47:03<1:58:02,  2.88s/it]                                                    {'loss': 1.3673, 'learning_rate': 0.0003342531344968516, 'epoch': 0.29}
 29%|██▊       | 990/3449 [47:03<1:58:02,  2.88s/it] 29%|██▊       | 991/3449 [47:07<2:04:07,  3.03s/it]                                                    {'loss': 1.1984, 'learning_rate': 0.0003341140129594935, 'epoch': 0.29}
 29%|██▊       | 991/3449 [47:07<2:04:07,  3.03s/it] 29%|██▉       | 992/3449 [47:09<1:59:58,  2.93s/it]                                                    {'loss': 1.2851, 'learning_rate': 0.0003339747734054057, 'epoch': 0.29}
 29%|██▉       | 992/3449 [47:09<1:59:58,  2.93s/it] 29%|██▉       | 993/3449 [47:12<1:52:45,  2.75s/it]                                                    {'loss': 1.2433, 'learning_rate': 0.00033383541595711515, 'epoch': 0.29}
 29%|██▉       | 993/3449 [47:12<1:52:45,  2.75s/it] 29%|██▉       | 994/3449 [47:14<1:50:09,  2.69s/it]                                                    {'loss': 1.3085, 'learning_rate': 0.0003336959407372527, 'epoch': 0.29}
 29%|██▉       | 994/3449 [47:14<1:50:09,  2.69s/it] 29%|██▉       | 995/3449 [47:16<1:45:18,  2.57s/it]                                                    {'loss': 1.316, 'learning_rate': 0.0003335563478685529, 'epoch': 0.29}
 29%|██▉       | 995/3449 [47:16<1:45:18,  2.57s/it] 29%|██▉       | 996/3449 [47:19<1:47:37,  2.63s/it]                                                    {'loss': 1.3461, 'learning_rate': 0.00033341663747385366, 'epoch': 0.29}
 29%|██▉       | 996/3449 [47:19<1:47:37,  2.63s/it] 29%|██▉       | 997/3449 [47:22<1:52:51,  2.76s/it]                                                    {'loss': 1.1993, 'learning_rate': 0.0003332768096760964, 'epoch': 0.29}
 29%|██▉       | 997/3449 [47:22<1:52:51,  2.76s/it] 29%|██▉       | 998/3449 [47:25<1:50:31,  2.71s/it]                                                    {'loss': 1.2851, 'learning_rate': 0.0003331368645983257, 'epoch': 0.29}
 29%|██▉       | 998/3449 [47:25<1:50:31,  2.71s/it] 29%|██▉       | 999/3449 [47:28<1:54:05,  2.79s/it]                                                    {'loss': 1.4083, 'learning_rate': 0.0003329968023636896, 'epoch': 0.29}
 29%|██▉       | 999/3449 [47:28<1:54:05,  2.79s/it] 29%|██▉       | 1000/3449 [47:30<1:51:55,  2.74s/it]                                                     {'loss': 1.2496, 'learning_rate': 0.00033285662309543915, 'epoch': 0.29}
 29%|██▉       | 1000/3449 [47:30<1:51:55,  2.74s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
  warnings.warn(
 29%|██▉       | 1001/3449 [47:33<1:54:38,  2.81s/it]                                                     {'loss': 1.2417, 'learning_rate': 0.0003327163269169282, 'epoch': 0.29}
 29%|██▉       | 1001/3449 [47:33<1:54:38,  2.81s/it] 29%|██▉       | 1002/3449 [47:37<1:58:34,  2.91s/it]                                                     {'loss': 1.1427, 'learning_rate': 0.0003325759139516137, 'epoch': 0.29}
 29%|██▉       | 1002/3449 [47:37<1:58:34,  2.91s/it] 29%|██▉       | 1003/3449 [47:39<1:55:23,  2.83s/it]                                                     {'loss': 1.3431, 'learning_rate': 0.0003324353843230553, 'epoch': 0.29}
 29%|██▉       | 1003/3449 [47:39<1:55:23,  2.83s/it] 29%|██▉       | 1004/3449 [47:41<1:46:39,  2.62s/it]                                                     {'loss': 1.432, 'learning_rate': 0.00033229473815491535, 'epoch': 0.29}
 29%|██▉       | 1004/3449 [47:41<1:46:39,  2.62s/it] 29%|██▉       | 1005/3449 [47:44<1:46:49,  2.62s/it]                                                     {'loss': 1.3202, 'learning_rate': 0.0003321539755709585, 'epoch': 0.29}
 29%|██▉       | 1005/3449 [47:44<1:46:49,  2.62s/it] 29%|██▉       | 1006/3449 [47:47<1:46:35,  2.62s/it]                                                     {'loss': 1.3503, 'learning_rate': 0.00033201309669505223, 'epoch': 0.29}
 29%|██▉       | 1006/3449 [47:47<1:46:35,  2.62s/it] 29%|██▉       | 1007/3449 [47:49<1:47:33,  2.64s/it]                                                     {'loss': 1.2937, 'learning_rate': 0.0003318721016511661, 'epoch': 0.29}
 29%|██▉       | 1007/3449 [47:49<1:47:33,  2.64s/it] 29%|██▉       | 1008/3449 [47:52<1:49:32,  2.69s/it]                                                     {'loss': 1.3295, 'learning_rate': 0.0003317309905633719, 'epoch': 0.29}
 29%|██▉       | 1008/3449 [47:52<1:49:32,  2.69s/it] 29%|██▉       | 1009/3449 [47:55<1:50:38,  2.72s/it]                                                     {'loss': 1.2516, 'learning_rate': 0.00033158976355584374, 'epoch': 0.29}
 29%|██▉       | 1009/3449 [47:55<1:50:38,  2.72s/it] 29%|██▉       | 1010/3449 [47:58<1:53:01,  2.78s/it]                                                     {'loss': 1.2637, 'learning_rate': 0.0003314484207528575, 'epoch': 0.29}
 29%|██▉       | 1010/3449 [47:58<1:53:01,  2.78s/it] 29%|██▉       | 1011/3449 [48:00<1:51:19,  2.74s/it]                                                     {'loss': 1.2511, 'learning_rate': 0.0003313069622787911, 'epoch': 0.29}
 29%|██▉       | 1011/3449 [48:00<1:51:19,  2.74s/it] 29%|██▉       | 1012/3449 [48:04<1:57:15,  2.89s/it]                                                     {'loss': 1.2837, 'learning_rate': 0.00033116538825812413, 'epoch': 0.29}
 29%|██▉       | 1012/3449 [48:04<1:57:15,  2.89s/it] 29%|██▉       | 1013/3449 [48:06<1:52:25,  2.77s/it]                                                     {'loss': 1.2124, 'learning_rate': 0.000331023698815438, 'epoch': 0.29}
 29%|██▉       | 1013/3449 [48:06<1:52:25,  2.77s/it] 29%|██▉       | 1014/3449 [48:09<1:50:25,  2.72s/it]                                                     {'loss': 1.3627, 'learning_rate': 0.0003308818940754156, 'epoch': 0.29}
 29%|██▉       | 1014/3449 [48:09<1:50:25,  2.72s/it] 29%|██▉       | 1015/3449 [48:11<1:46:08,  2.62s/it]                                                     {'loss': 1.3624, 'learning_rate': 0.00033073997416284125, 'epoch': 0.29}
 29%|██▉       | 1015/3449 [48:11<1:46:08,  2.62s/it] 29%|██▉       | 1016/3449 [48:14<1:44:45,  2.58s/it]                                                     {'loss': 1.2367, 'learning_rate': 0.00033059793920260064, 'epoch': 0.29}
 29%|██▉       | 1016/3449 [48:14<1:44:45,  2.58s/it] 29%|██▉       | 1017/3449 [48:17<1:53:39,  2.80s/it]                                                     {'loss': 1.3101, 'learning_rate': 0.0003304557893196808, 'epoch': 0.29}
 29%|██▉       | 1017/3449 [48:17<1:53:39,  2.80s/it] 30%|██▉       | 1018/3449 [48:19<1:49:00,  2.69s/it]                                                     {'loss': 1.3609, 'learning_rate': 0.0003303135246391698, 'epoch': 0.3}
 30%|██▉       | 1018/3449 [48:19<1:49:00,  2.69s/it] 30%|██▉       | 1019/3449 [48:27<2:54:20,  4.30s/it]                                                     {'loss': 1.1903, 'learning_rate': 0.0003301711452862567, 'epoch': 0.3}
 30%|██▉       | 1019/3449 [48:27<2:54:20,  4.30s/it] 30%|██▉       | 1020/3449 [48:30<2:31:48,  3.75s/it]                                                     {'loss': 1.2604, 'learning_rate': 0.00033002865138623147, 'epoch': 0.3}
 30%|██▉       | 1020/3449 [48:30<2:31:48,  3.75s/it] 30%|██▉       | 1021/3449 [48:33<2:18:35,  3.43s/it]                                                     {'loss': 1.2647, 'learning_rate': 0.000329886043064485, 'epoch': 0.3}
 30%|██▉       | 1021/3449 [48:33<2:18:35,  3.43s/it] 30%|██▉       | 1022/3449 [48:35<2:10:46,  3.23s/it]                                                     {'loss': 1.218, 'learning_rate': 0.0003297433204465088, 'epoch': 0.3}
 30%|██▉       | 1022/3449 [48:35<2:10:46,  3.23s/it] 30%|██▉       | 1023/3449 [48:38<2:00:12,  2.97s/it]                                                     {'loss': 1.2481, 'learning_rate': 0.00032960048365789486, 'epoch': 0.3}
 30%|██▉       | 1023/3449 [48:38<2:00:12,  2.97s/it] 30%|██▉       | 1024/3449 [48:41<2:02:50,  3.04s/it]                                                     {'loss': 1.3108, 'learning_rate': 0.0003294575328243357, 'epoch': 0.3}
 30%|██▉       | 1024/3449 [48:41<2:02:50,  3.04s/it] 30%|██▉       | 1025/3449 [48:43<1:52:35,  2.79s/it]                                                     {'loss': 1.219, 'learning_rate': 0.00032931446807162436, 'epoch': 0.3}
 30%|██▉       | 1025/3449 [48:43<1:52:35,  2.79s/it] 30%|██▉       | 1026/3449 [48:46<1:48:11,  2.68s/it]                                                     {'loss': 1.4056, 'learning_rate': 0.0003291712895256538, 'epoch': 0.3}
 30%|██▉       | 1026/3449 [48:46<1:48:11,  2.68s/it] 30%|██▉       | 1027/3449 [48:48<1:47:34,  2.66s/it]                                                     {'loss': 1.3875, 'learning_rate': 0.0003290279973124174, 'epoch': 0.3}
 30%|██▉       | 1027/3449 [48:48<1:47:34,  2.66s/it] 30%|██▉       | 1028/3449 [48:51<1:43:50,  2.57s/it]                                                     {'loss': 1.237, 'learning_rate': 0.00032888459155800846, 'epoch': 0.3}
 30%|██▉       | 1028/3449 [48:51<1:43:50,  2.57s/it] 30%|██▉       | 1029/3449 [48:53<1:42:56,  2.55s/it]                                                     {'loss': 1.381, 'learning_rate': 0.0003287410723886201, 'epoch': 0.3}
 30%|██▉       | 1029/3449 [48:53<1:42:56,  2.55s/it] 30%|██▉       | 1030/3449 [48:56<1:43:07,  2.56s/it]                                                     {'loss': 1.3096, 'learning_rate': 0.0003285974399305455, 'epoch': 0.3}
 30%|██▉       | 1030/3449 [48:56<1:43:07,  2.56s/it] 30%|██▉       | 1031/3449 [48:58<1:44:47,  2.60s/it]                                                     {'loss': 1.3856, 'learning_rate': 0.0003284536943101772, 'epoch': 0.3}
 30%|██▉       | 1031/3449 [48:58<1:44:47,  2.60s/it] 30%|██▉       | 1032/3449 [49:01<1:44:17,  2.59s/it]                                                     {'loss': 1.3452, 'learning_rate': 0.0003283098356540077, 'epoch': 0.3}
 30%|██▉       | 1032/3449 [49:01<1:44:17,  2.59s/it] 30%|██▉       | 1033/3449 [49:04<1:56:21,  2.89s/it]                                                     {'loss': 1.2547, 'learning_rate': 0.0003281658640886285, 'epoch': 0.3}
 30%|██▉       | 1033/3449 [49:04<1:56:21,  2.89s/it] 30%|██▉       | 1034/3449 [49:08<2:04:42,  3.10s/it]                                                     {'loss': 1.1737, 'learning_rate': 0.00032802177974073076, 'epoch': 0.3}
 30%|██▉       | 1034/3449 [49:08<2:04:42,  3.10s/it] 30%|███       | 1035/3449 [49:11<2:04:12,  3.09s/it]                                                     {'loss': 1.3169, 'learning_rate': 0.00032787758273710495, 'epoch': 0.3}
 30%|███       | 1035/3449 [49:11<2:04:12,  3.09s/it] 30%|███       | 1036/3449 [49:14<2:07:07,  3.16s/it]                                                     {'loss': 1.1254, 'learning_rate': 0.0003277332732046405, 'epoch': 0.3}
 30%|███       | 1036/3449 [49:14<2:07:07,  3.16s/it] 30%|███       | 1037/3449 [49:17<1:59:59,  2.98s/it]                                                     {'loss': 1.2771, 'learning_rate': 0.00032758885127032606, 'epoch': 0.3}
 30%|███       | 1037/3449 [49:17<1:59:59,  2.98s/it] 30%|███       | 1038/3449 [49:20<1:54:34,  2.85s/it]                                                     {'loss': 1.5731, 'learning_rate': 0.00032744431706124876, 'epoch': 0.3}
 30%|███       | 1038/3449 [49:20<1:54:34,  2.85s/it] 30%|███       | 1039/3449 [49:22<1:48:30,  2.70s/it]                                                     {'loss': 1.3528, 'learning_rate': 0.0003272996707045951, 'epoch': 0.3}
 30%|███       | 1039/3449 [49:22<1:48:30,  2.70s/it] 30%|███       | 1040/3449 [49:24<1:45:47,  2.63s/it]                                                     {'loss': 1.3671, 'learning_rate': 0.0003271549123276498, 'epoch': 0.3}
 30%|███       | 1040/3449 [49:24<1:45:47,  2.63s/it] 30%|███       | 1041/3449 [49:27<1:43:58,  2.59s/it]                                                     {'loss': 1.375, 'learning_rate': 0.0003270100420577965, 'epoch': 0.3}
 30%|███       | 1041/3449 [49:27<1:43:58,  2.59s/it] 30%|███       | 1042/3449 [49:30<1:45:00,  2.62s/it]                                                     {'loss': 1.3423, 'learning_rate': 0.00032686506002251704, 'epoch': 0.3}
 30%|███       | 1042/3449 [49:30<1:45:00,  2.62s/it] 30%|███       | 1043/3449 [49:32<1:48:13,  2.70s/it]                                                     {'loss': 1.3171, 'learning_rate': 0.00032671996634939173, 'epoch': 0.3}
 30%|███       | 1043/3449 [49:32<1:48:13,  2.70s/it] 30%|███       | 1044/3449 [49:35<1:45:34,  2.63s/it]                                                     {'loss': 1.1313, 'learning_rate': 0.0003265747611660991, 'epoch': 0.3}
 30%|███       | 1044/3449 [49:35<1:45:34,  2.63s/it] 30%|███       | 1045/3449 [49:38<1:46:55,  2.67s/it]                                                     {'loss': 1.6061, 'learning_rate': 0.0003264294446004159, 'epoch': 0.3}
 30%|███       | 1045/3449 [49:38<1:46:55,  2.67s/it] 30%|███       | 1046/3449 [49:41<1:53:12,  2.83s/it]                                                     {'loss': 1.283, 'learning_rate': 0.0003262840167802167, 'epoch': 0.3}
 30%|███       | 1046/3449 [49:41<1:53:12,  2.83s/it] 30%|███       | 1047/3449 [49:44<1:59:43,  2.99s/it]                                                     {'loss': 1.1906, 'learning_rate': 0.00032613847783347414, 'epoch': 0.3}
 30%|███       | 1047/3449 [49:44<1:59:43,  2.99s/it] 30%|███       | 1048/3449 [49:47<1:56:57,  2.92s/it]                                                     {'loss': 1.3627, 'learning_rate': 0.00032599282788825854, 'epoch': 0.3}
 30%|███       | 1048/3449 [49:47<1:56:57,  2.92s/it] 30%|███       | 1049/3449 [49:50<1:56:59,  2.92s/it]                                                     {'loss': 1.3425, 'learning_rate': 0.000325847067072738, 'epoch': 0.3}
 30%|███       | 1049/3449 [49:50<1:56:59,  2.92s/it] 30%|███       | 1050/3449 [49:52<1:50:58,  2.78s/it]                                                     {'loss': 1.404, 'learning_rate': 0.000325701195515178, 'epoch': 0.3}
 30%|███       | 1050/3449 [49:52<1:50:58,  2.78s/it] 30%|███       | 1051/3449 [49:55<1:49:33,  2.74s/it]                                                     {'loss': 1.132, 'learning_rate': 0.00032555521334394174, 'epoch': 0.3}
 30%|███       | 1051/3449 [49:55<1:49:33,  2.74s/it] 31%|███       | 1052/3449 [49:58<1:48:31,  2.72s/it]                                                     {'loss': 1.3062, 'learning_rate': 0.0003254091206874895, 'epoch': 0.3}
 31%|███       | 1052/3449 [49:58<1:48:31,  2.72s/it] 31%|███       | 1053/3449 [50:01<1:54:15,  2.86s/it]                                                     {'loss': 1.1618, 'learning_rate': 0.000325262917674379, 'epoch': 0.31}
 31%|███       | 1053/3449 [50:01<1:54:15,  2.86s/it] 31%|███       | 1054/3449 [50:04<2:01:02,  3.03s/it]                                                     {'loss': 1.2118, 'learning_rate': 0.00032511660443326485, 'epoch': 0.31}
 31%|███       | 1054/3449 [50:04<2:01:02,  3.03s/it] 31%|███       | 1055/3449 [50:07<1:58:47,  2.98s/it]                                                     {'loss': 1.343, 'learning_rate': 0.00032497018109289887, 'epoch': 0.31}
 31%|███       | 1055/3449 [50:07<1:58:47,  2.98s/it] 31%|███       | 1056/3449 [50:10<1:51:26,  2.79s/it]                                                     {'loss': 1.4845, 'learning_rate': 0.00032482364778212966, 'epoch': 0.31}
 31%|███       | 1056/3449 [50:10<1:51:26,  2.79s/it] 31%|███       | 1057/3449 [50:13<1:58:04,  2.96s/it]                                                     {'loss': 1.1748, 'learning_rate': 0.0003246770046299025, 'epoch': 0.31}
 31%|███       | 1057/3449 [50:13<1:58:04,  2.96s/it] 31%|███       | 1058/3449 [50:15<1:51:53,  2.81s/it]                                                     {'loss': 1.3668, 'learning_rate': 0.0003245302517652596, 'epoch': 0.31}
 31%|███       | 1058/3449 [50:15<1:51:53,  2.81s/it] 31%|███       | 1059/3449 [50:18<1:53:32,  2.85s/it]                                                     {'loss': 1.0851, 'learning_rate': 0.0003243833893173393, 'epoch': 0.31}
 31%|███       | 1059/3449 [50:18<1:53:32,  2.85s/it] 31%|███       | 1060/3449 [50:21<1:48:16,  2.72s/it]                                                     {'loss': 1.3395, 'learning_rate': 0.00032423641741537683, 'epoch': 0.31}
 31%|███       | 1060/3449 [50:21<1:48:16,  2.72s/it] 31%|███       | 1061/3449 [50:23<1:45:13,  2.64s/it]                                                     {'loss': 1.3099, 'learning_rate': 0.0003240893361887034, 'epoch': 0.31}
 31%|███       | 1061/3449 [50:23<1:45:13,  2.64s/it] 31%|███       | 1062/3449 [50:27<1:53:10,  2.84s/it]                                                     {'loss': 1.4818, 'learning_rate': 0.00032394214576674657, 'epoch': 0.31}
 31%|███       | 1062/3449 [50:27<1:53:10,  2.84s/it] 31%|███       | 1063/3449 [50:29<1:45:13,  2.65s/it]                                                     {'loss': 1.3774, 'learning_rate': 0.00032379484627902995, 'epoch': 0.31}
 31%|███       | 1063/3449 [50:29<1:45:13,  2.65s/it] 31%|███       | 1064/3449 [50:31<1:46:33,  2.68s/it]                                                     {'loss': 1.348, 'learning_rate': 0.00032364743785517317, 'epoch': 0.31}
 31%|███       | 1064/3449 [50:31<1:46:33,  2.68s/it] 31%|███       | 1065/3449 [50:34<1:50:01,  2.77s/it]                                                     {'loss': 1.293, 'learning_rate': 0.00032349992062489163, 'epoch': 0.31}
 31%|███       | 1065/3449 [50:34<1:50:01,  2.77s/it] 31%|███       | 1066/3449 [50:37<1:48:18,  2.73s/it]                                                     {'loss': 1.1384, 'learning_rate': 0.00032335229471799654, 'epoch': 0.31}
 31%|███       | 1066/3449 [50:37<1:48:18,  2.73s/it] 31%|███       | 1067/3449 [50:40<1:47:17,  2.70s/it]                                                     {'loss': 1.3489, 'learning_rate': 0.0003232045602643948, 'epoch': 0.31}
 31%|███       | 1067/3449 [50:40<1:47:17,  2.70s/it] 31%|███       | 1068/3449 [50:42<1:45:58,  2.67s/it]                                                     {'loss': 1.0874, 'learning_rate': 0.00032305671739408864, 'epoch': 0.31}
 31%|███       | 1068/3449 [50:42<1:45:58,  2.67s/it] 31%|███       | 1069/3449 [50:45<1:44:46,  2.64s/it]                                                     {'loss': 1.1842, 'learning_rate': 0.000322908766237176, 'epoch': 0.31}
 31%|███       | 1069/3449 [50:45<1:44:46,  2.64s/it] 31%|███       | 1070/3449 [50:48<1:45:43,  2.67s/it]                                                     {'loss': 1.2471, 'learning_rate': 0.00032276070692384965, 'epoch': 0.31}
 31%|███       | 1070/3449 [50:48<1:45:43,  2.67s/it] 31%|███       | 1071/3449 [50:50<1:42:45,  2.59s/it]                                                     {'loss': 1.4924, 'learning_rate': 0.0003226125395843981, 'epoch': 0.31}
 31%|███       | 1071/3449 [50:50<1:42:45,  2.59s/it] 31%|███       | 1072/3449 [50:53<1:49:02,  2.75s/it]                                                     {'loss': 1.2523, 'learning_rate': 0.0003224642643492045, 'epoch': 0.31}
 31%|███       | 1072/3449 [50:53<1:49:02,  2.75s/it] 31%|███       | 1073/3449 [50:56<1:47:44,  2.72s/it]                                                     {'loss': 1.2867, 'learning_rate': 0.000322315881348747, 'epoch': 0.31}
 31%|███       | 1073/3449 [50:56<1:47:44,  2.72s/it] 31%|███       | 1074/3449 [50:58<1:43:14,  2.61s/it]                                                     {'loss': 1.463, 'learning_rate': 0.0003221673907135988, 'epoch': 0.31}
 31%|███       | 1074/3449 [50:58<1:43:14,  2.61s/it] 31%|███       | 1075/3449 [51:01<1:42:47,  2.60s/it]                                                     {'loss': 1.2859, 'learning_rate': 0.0003220187925744275, 'epoch': 0.31}
 31%|███       | 1075/3449 [51:01<1:42:47,  2.60s/it] 31%|███       | 1076/3449 [51:03<1:40:12,  2.53s/it]                                                     {'loss': 1.072, 'learning_rate': 0.00032187008706199567, 'epoch': 0.31}
 31%|███       | 1076/3449 [51:03<1:40:12,  2.53s/it] 31%|███       | 1077/3449 [51:05<1:36:24,  2.44s/it]                                                     {'loss': 1.3431, 'learning_rate': 0.00032172127430716007, 'epoch': 0.31}
 31%|███       | 1077/3449 [51:05<1:36:24,  2.44s/it] 31%|███▏      | 1078/3449 [51:08<1:41:01,  2.56s/it]                                                     {'loss': 1.3594, 'learning_rate': 0.0003215723544408719, 'epoch': 0.31}
 31%|███▏      | 1078/3449 [51:08<1:41:01,  2.56s/it] 31%|███▏      | 1079/3449 [51:10<1:37:10,  2.46s/it]                                                     {'loss': 1.3436, 'learning_rate': 0.00032142332759417665, 'epoch': 0.31}
 31%|███▏      | 1079/3449 [51:10<1:37:10,  2.46s/it] 31%|███▏      | 1080/3449 [51:13<1:39:43,  2.53s/it]                                                     {'loss': 1.3454, 'learning_rate': 0.00032127419389821403, 'epoch': 0.31}
 31%|███▏      | 1080/3449 [51:13<1:39:43,  2.53s/it] 31%|███▏      | 1081/3449 [51:16<1:42:07,  2.59s/it]                                                     {'loss': 1.3333, 'learning_rate': 0.0003211249534842176, 'epoch': 0.31}
 31%|███▏      | 1081/3449 [51:16<1:42:07,  2.59s/it] 31%|███▏      | 1082/3449 [51:18<1:37:56,  2.48s/it]                                                     {'loss': 1.3765, 'learning_rate': 0.0003209756064835149, 'epoch': 0.31}
 31%|███▏      | 1082/3449 [51:18<1:37:56,  2.48s/it] 31%|███▏      | 1083/3449 [51:20<1:35:47,  2.43s/it]                                                     {'loss': 1.4229, 'learning_rate': 0.0003208261530275274, 'epoch': 0.31}
 31%|███▏      | 1083/3449 [51:20<1:35:47,  2.43s/it] 31%|███▏      | 1084/3449 [51:23<1:39:11,  2.52s/it]                                                     {'loss': 1.045, 'learning_rate': 0.00032067659324776996, 'epoch': 0.31}
 31%|███▏      | 1084/3449 [51:23<1:39:11,  2.52s/it] 31%|███▏      | 1085/3449 [51:26<1:39:00,  2.51s/it]                                                     {'loss': 1.3477, 'learning_rate': 0.00032052692727585133, 'epoch': 0.31}
 31%|███▏      | 1085/3449 [51:26<1:39:00,  2.51s/it] 31%|███▏      | 1086/3449 [51:28<1:40:16,  2.55s/it]                                                     {'loss': 1.2725, 'learning_rate': 0.0003203771552434734, 'epoch': 0.31}
 31%|███▏      | 1086/3449 [51:28<1:40:16,  2.55s/it] 32%|███▏      | 1087/3449 [51:31<1:39:30,  2.53s/it]                                                     {'loss': 1.3644, 'learning_rate': 0.00032022727728243163, 'epoch': 0.32}
 32%|███▏      | 1087/3449 [51:31<1:39:30,  2.53s/it] 32%|███▏      | 1088/3449 [51:34<1:43:22,  2.63s/it]                                                     {'loss': 1.3548, 'learning_rate': 0.0003200772935246146, 'epoch': 0.32}
 32%|███▏      | 1088/3449 [51:34<1:43:22,  2.63s/it] 32%|███▏      | 1089/3449 [51:36<1:39:36,  2.53s/it]                                                     {'loss': 1.3695, 'learning_rate': 0.000319927204102004, 'epoch': 0.32}
 32%|███▏      | 1089/3449 [51:36<1:39:36,  2.53s/it] 32%|███▏      | 1090/3449 [51:39<1:50:29,  2.81s/it]                                                     {'loss': 1.2361, 'learning_rate': 0.0003197770091466744, 'epoch': 0.32}
 32%|███▏      | 1090/3449 [51:39<1:50:29,  2.81s/it] 32%|███▏      | 1091/3449 [51:42<1:47:19,  2.73s/it]                                                     {'loss': 1.2436, 'learning_rate': 0.0003196267087907934, 'epoch': 0.32}
 32%|███▏      | 1091/3449 [51:42<1:47:19,  2.73s/it] 32%|███▏      | 1092/3449 [51:45<1:54:41,  2.92s/it]                                                     {'loss': 1.4142, 'learning_rate': 0.00031947630316662127, 'epoch': 0.32}
 32%|███▏      | 1092/3449 [51:45<1:54:41,  2.92s/it] 32%|███▏      | 1093/3449 [51:48<1:50:07,  2.80s/it]                                                     {'loss': 1.1265, 'learning_rate': 0.00031932579240651093, 'epoch': 0.32}
 32%|███▏      | 1093/3449 [51:48<1:50:07,  2.80s/it] 32%|███▏      | 1094/3449 [51:51<1:50:57,  2.83s/it]                                                     {'loss': 1.2766, 'learning_rate': 0.00031917517664290776, 'epoch': 0.32}
 32%|███▏      | 1094/3449 [51:51<1:50:57,  2.83s/it] 32%|███▏      | 1095/3449 [51:53<1:51:33,  2.84s/it]                                                     {'loss': 1.3594, 'learning_rate': 0.0003190244560083496, 'epoch': 0.32}
 32%|███▏      | 1095/3449 [51:53<1:51:33,  2.84s/it] 32%|███▏      | 1096/3449 [51:56<1:50:16,  2.81s/it]                                                     {'loss': 1.2358, 'learning_rate': 0.00031887363063546665, 'epoch': 0.32}
 32%|███▏      | 1096/3449 [51:56<1:50:16,  2.81s/it] 32%|███▏      | 1097/3449 [51:59<1:48:17,  2.76s/it]                                                     {'loss': 1.2309, 'learning_rate': 0.0003187227006569812, 'epoch': 0.32}
 32%|███▏      | 1097/3449 [51:59<1:48:17,  2.76s/it] 32%|███▏      | 1098/3449 [52:01<1:46:25,  2.72s/it]                                                     {'loss': 1.3444, 'learning_rate': 0.0003185716662057073, 'epoch': 0.32}
 32%|███▏      | 1098/3449 [52:01<1:46:25,  2.72s/it] 32%|███▏      | 1099/3449 [52:04<1:49:03,  2.78s/it]                                                     {'loss': 1.3418, 'learning_rate': 0.00031842052741455146, 'epoch': 0.32}
 32%|███▏      | 1099/3449 [52:04<1:49:03,  2.78s/it] 32%|███▏      | 1100/3449 [52:07<1:45:24,  2.69s/it]                                                     {'loss': 1.3559, 'learning_rate': 0.00031826928441651176, 'epoch': 0.32}
 32%|███▏      | 1100/3449 [52:07<1:45:24,  2.69s/it] 32%|███▏      | 1101/3449 [52:10<1:44:52,  2.68s/it]                                                     {'loss': 1.276, 'learning_rate': 0.00031811793734467787, 'epoch': 0.32}
 32%|███▏      | 1101/3449 [52:10<1:44:52,  2.68s/it] 32%|███▏      | 1102/3449 [52:12<1:41:35,  2.60s/it]                                                     {'loss': 1.2734, 'learning_rate': 0.00031796648633223125, 'epoch': 0.32}
 32%|███▏      | 1102/3449 [52:12<1:41:35,  2.60s/it] 32%|███▏      | 1103/3449 [52:15<1:42:55,  2.63s/it]                                                     {'loss': 1.2315, 'learning_rate': 0.00031781493151244463, 'epoch': 0.32}
 32%|███▏      | 1103/3449 [52:15<1:42:55,  2.63s/it] 32%|███▏      | 1104/3449 [52:18<1:52:27,  2.88s/it]                                                     {'loss': 1.3014, 'learning_rate': 0.0003176632730186822, 'epoch': 0.32}
 32%|███▏      | 1104/3449 [52:18<1:52:27,  2.88s/it] 32%|███▏      | 1105/3449 [52:21<1:46:52,  2.74s/it]                                                     {'loss': 1.3195, 'learning_rate': 0.00031751151098439946, 'epoch': 0.32}
 32%|███▏      | 1105/3449 [52:21<1:46:52,  2.74s/it] 32%|███▏      | 1106/3449 [52:23<1:44:51,  2.69s/it]                                                     {'loss': 1.119, 'learning_rate': 0.0003173596455431428, 'epoch': 0.32}
 32%|███▏      | 1106/3449 [52:23<1:44:51,  2.69s/it] 32%|███▏      | 1107/3449 [52:25<1:40:53,  2.58s/it]                                                     {'loss': 1.3873, 'learning_rate': 0.0003172076768285497, 'epoch': 0.32}
 32%|███▏      | 1107/3449 [52:25<1:40:53,  2.58s/it] 32%|███▏      | 1108/3449 [52:28<1:39:34,  2.55s/it]                                                     {'loss': 1.4302, 'learning_rate': 0.00031705560497434883, 'epoch': 0.32}
 32%|███▏      | 1108/3449 [52:28<1:39:34,  2.55s/it] 32%|███▏      | 1109/3449 [52:31<1:42:54,  2.64s/it]                                                     {'loss': 1.2712, 'learning_rate': 0.00031690343011435895, 'epoch': 0.32}
 32%|███▏      | 1109/3449 [52:31<1:42:54,  2.64s/it] 32%|███▏      | 1110/3449 [52:34<1:45:02,  2.69s/it]                                                     {'loss': 1.2812, 'learning_rate': 0.00031675115238249013, 'epoch': 0.32}
 32%|███▏      | 1110/3449 [52:34<1:45:02,  2.69s/it] 32%|███▏      | 1111/3449 [52:36<1:47:03,  2.75s/it]                                                     {'loss': 1.2545, 'learning_rate': 0.00031659877191274257, 'epoch': 0.32}
 32%|███▏      | 1111/3449 [52:36<1:47:03,  2.75s/it] 32%|███▏      | 1112/3449 [52:40<1:51:09,  2.85s/it]                                                     {'loss': 1.2387, 'learning_rate': 0.00031644628883920696, 'epoch': 0.32}
 32%|███▏      | 1112/3449 [52:40<1:51:09,  2.85s/it] 32%|███▏      | 1113/3449 [52:42<1:51:59,  2.88s/it]                                                     {'loss': 1.2183, 'learning_rate': 0.0003162937032960644, 'epoch': 0.32}
 32%|███▏      | 1113/3449 [52:42<1:51:59,  2.88s/it] 32%|███▏      | 1114/3449 [52:46<1:57:05,  3.01s/it]                                                     {'loss': 1.2704, 'learning_rate': 0.0003161410154175861, 'epoch': 0.32}
 32%|███▏      | 1114/3449 [52:46<1:57:05,  3.01s/it] 32%|███▏      | 1115/3449 [52:49<1:56:33,  3.00s/it]                                                     {'loss': 1.308, 'learning_rate': 0.00031598822533813315, 'epoch': 0.32}
 32%|███▏      | 1115/3449 [52:49<1:56:33,  3.00s/it] 32%|███▏      | 1116/3449 [52:51<1:49:42,  2.82s/it]                                                     {'loss': 1.3652, 'learning_rate': 0.0003158353331921568, 'epoch': 0.32}
 32%|███▏      | 1116/3449 [52:51<1:49:42,  2.82s/it] 32%|███▏      | 1117/3449 [52:56<2:11:23,  3.38s/it]                                                     {'loss': 1.2184, 'learning_rate': 0.00031568233911419795, 'epoch': 0.32}
 32%|███▏      | 1117/3449 [52:56<2:11:23,  3.38s/it] 32%|███▏      | 1118/3449 [53:00<2:20:15,  3.61s/it]                                                     {'loss': 1.2892, 'learning_rate': 0.0003155292432388874, 'epoch': 0.32}
 32%|███▏      | 1118/3449 [53:00<2:20:15,  3.61s/it] 32%|███▏      | 1119/3449 [53:02<2:06:08,  3.25s/it]                                                     {'loss': 1.3794, 'learning_rate': 0.00031537604570094544, 'epoch': 0.32}
 32%|███▏      | 1119/3449 [53:02<2:06:08,  3.25s/it] 32%|███▏      | 1120/3449 [53:05<2:00:01,  3.09s/it]                                                     {'loss': 1.3267, 'learning_rate': 0.00031522274663518167, 'epoch': 0.32}
 32%|███▏      | 1120/3449 [53:05<2:00:01,  3.09s/it] 33%|███▎      | 1121/3449 [53:08<1:56:18,  3.00s/it]                                                     {'loss': 1.3899, 'learning_rate': 0.0003150693461764952, 'epoch': 0.32}
 33%|███▎      | 1121/3449 [53:08<1:56:18,  3.00s/it] 33%|███▎      | 1122/3449 [53:11<1:52:03,  2.89s/it]                                                     {'loss': 1.1889, 'learning_rate': 0.0003149158444598743, 'epoch': 0.33}
 33%|███▎      | 1122/3449 [53:11<1:52:03,  2.89s/it] 33%|███▎      | 1123/3449 [53:14<2:00:01,  3.10s/it]                                                     {'loss': 1.2387, 'learning_rate': 0.00031476224162039633, 'epoch': 0.33}
 33%|███▎      | 1123/3449 [53:14<2:00:01,  3.10s/it] 33%|███▎      | 1124/3449 [53:18<2:05:46,  3.25s/it]                                                     {'loss': 1.3521, 'learning_rate': 0.0003146085377932277, 'epoch': 0.33}
 33%|███▎      | 1124/3449 [53:18<2:05:46,  3.25s/it] 33%|███▎      | 1125/3449 [53:20<1:59:15,  3.08s/it]                                                     {'loss': 1.4573, 'learning_rate': 0.0003144547331136237, 'epoch': 0.33}
 33%|███▎      | 1125/3449 [53:20<1:59:15,  3.08s/it] 33%|███▎      | 1126/3449 [53:23<1:52:08,  2.90s/it]                                                     {'loss': 1.2822, 'learning_rate': 0.0003143008277169282, 'epoch': 0.33}
 33%|███▎      | 1126/3449 [53:23<1:52:08,  2.90s/it] 33%|███▎      | 1127/3449 [53:25<1:47:22,  2.77s/it]                                                     {'loss': 1.4768, 'learning_rate': 0.00031414682173857395, 'epoch': 0.33}
 33%|███▎      | 1127/3449 [53:25<1:47:22,  2.77s/it] 33%|███▎      | 1128/3449 [53:28<1:43:33,  2.68s/it]                                                     {'loss': 1.4126, 'learning_rate': 0.0003139927153140819, 'epoch': 0.33}
 33%|███▎      | 1128/3449 [53:28<1:43:33,  2.68s/it] 33%|███▎      | 1129/3449 [53:31<1:49:19,  2.83s/it]                                                     {'loss': 1.2651, 'learning_rate': 0.00031383850857906177, 'epoch': 0.33}
 33%|███▎      | 1129/3449 [53:31<1:49:19,  2.83s/it] 33%|███▎      | 1130/3449 [53:34<1:53:08,  2.93s/it]                                                     {'loss': 1.2556, 'learning_rate': 0.0003136842016692112, 'epoch': 0.33}
 33%|███▎      | 1130/3449 [53:34<1:53:08,  2.93s/it] 33%|███▎      | 1131/3449 [53:37<1:47:10,  2.77s/it]                                                     {'loss': 1.4173, 'learning_rate': 0.0003135297947203162, 'epoch': 0.33}
 33%|███▎      | 1131/3449 [53:37<1:47:10,  2.77s/it] 33%|███▎      | 1132/3449 [53:39<1:46:25,  2.76s/it]                                                     {'loss': 1.2882, 'learning_rate': 0.00031337528786825074, 'epoch': 0.33}
 33%|███▎      | 1132/3449 [53:39<1:46:25,  2.76s/it] 33%|███▎      | 1133/3449 [53:42<1:51:14,  2.88s/it]                                                     {'loss': 1.2622, 'learning_rate': 0.0003132206812489766, 'epoch': 0.33}
 33%|███▎      | 1133/3449 [53:42<1:51:14,  2.88s/it] 33%|███▎      | 1134/3449 [53:47<2:06:53,  3.29s/it]                                                     {'loss': 1.3657, 'learning_rate': 0.00031306597499854356, 'epoch': 0.33}
 33%|███▎      | 1134/3449 [53:47<2:06:53,  3.29s/it] 33%|███▎      | 1135/3449 [53:49<1:57:26,  3.05s/it]                                                     {'loss': 1.2806, 'learning_rate': 0.00031291116925308895, 'epoch': 0.33}
 33%|███▎      | 1135/3449 [53:49<1:57:26,  3.05s/it] 33%|███▎      | 1136/3449 [53:52<1:57:21,  3.04s/it]                                                     {'loss': 1.1607, 'learning_rate': 0.00031275626414883765, 'epoch': 0.33}
 33%|███▎      | 1136/3449 [53:52<1:57:21,  3.04s/it] 33%|███▎      | 1137/3449 [53:55<1:58:37,  3.08s/it]                                                     {'loss': 1.4189, 'learning_rate': 0.00031260125982210195, 'epoch': 0.33}
 33%|███▎      | 1137/3449 [53:55<1:58:37,  3.08s/it] 33%|███▎      | 1138/3449 [53:58<1:51:06,  2.88s/it]                                                     {'loss': 1.3719, 'learning_rate': 0.00031244615640928155, 'epoch': 0.33}
 33%|███▎      | 1138/3449 [53:58<1:51:06,  2.88s/it] 33%|███▎      | 1139/3449 [54:00<1:47:58,  2.80s/it]                                                     {'loss': 1.3134, 'learning_rate': 0.00031229095404686333, 'epoch': 0.33}
 33%|███▎      | 1139/3449 [54:00<1:47:58,  2.80s/it] 33%|███▎      | 1140/3449 [54:03<1:44:59,  2.73s/it]                                                     {'loss': 1.2751, 'learning_rate': 0.0003121356528714211, 'epoch': 0.33}
 33%|███▎      | 1140/3449 [54:03<1:44:59,  2.73s/it] 33%|███▎      | 1141/3449 [54:06<1:44:12,  2.71s/it]                                                     {'loss': 1.4261, 'learning_rate': 0.0003119802530196158, 'epoch': 0.33}
 33%|███▎      | 1141/3449 [54:06<1:44:12,  2.71s/it] 33%|███▎      | 1142/3449 [54:11<2:13:11,  3.46s/it]                                                     {'loss': 1.0773, 'learning_rate': 0.000311824754628195, 'epoch': 0.33}
 33%|███▎      | 1142/3449 [54:11<2:13:11,  3.46s/it] 33%|███▎      | 1143/3449 [54:14<2:05:56,  3.28s/it]                                                     {'loss': 1.2708, 'learning_rate': 0.0003116691578339933, 'epoch': 0.33}
 33%|███▎      | 1143/3449 [54:14<2:05:56,  3.28s/it] 33%|███▎      | 1144/3449 [54:17<2:00:19,  3.13s/it]                                                     {'loss': 1.1252, 'learning_rate': 0.00031151346277393156, 'epoch': 0.33}
 33%|███▎      | 1144/3449 [54:17<2:00:19,  3.13s/it] 33%|███▎      | 1145/3449 [54:20<1:58:47,  3.09s/it]                                                     {'loss': 1.2471, 'learning_rate': 0.00031135766958501727, 'epoch': 0.33}
 33%|███▎      | 1145/3449 [54:20<1:58:47,  3.09s/it] 33%|███▎      | 1146/3449 [54:22<1:55:08,  3.00s/it]                                                     {'loss': 1.1925, 'learning_rate': 0.00031120177840434434, 'epoch': 0.33}
 33%|███▎      | 1146/3449 [54:22<1:55:08,  3.00s/it] 33%|███▎      | 1147/3449 [54:25<1:54:55,  3.00s/it]                                                     {'loss': 1.3149, 'learning_rate': 0.0003110457893690928, 'epoch': 0.33}
 33%|███▎      | 1147/3449 [54:25<1:54:55,  3.00s/it] 33%|███▎      | 1148/3449 [54:28<1:47:24,  2.80s/it]                                                     {'loss': 1.2653, 'learning_rate': 0.00031088970261652866, 'epoch': 0.33}
 33%|███▎      | 1148/3449 [54:28<1:47:24,  2.80s/it] 33%|███▎      | 1149/3449 [54:31<1:51:36,  2.91s/it]                                                     {'loss': 1.2462, 'learning_rate': 0.00031073351828400425, 'epoch': 0.33}
 33%|███▎      | 1149/3449 [54:31<1:51:36,  2.91s/it] 33%|███▎      | 1150/3449 [54:33<1:46:52,  2.79s/it]                                                     {'loss': 1.3278, 'learning_rate': 0.0003105772365089575, 'epoch': 0.33}
 33%|███▎      | 1150/3449 [54:33<1:46:52,  2.79s/it] 33%|███▎      | 1151/3449 [54:36<1:42:50,  2.69s/it]                                                     {'loss': 1.4563, 'learning_rate': 0.0003104208574289122, 'epoch': 0.33}
 33%|███▎      | 1151/3449 [54:36<1:42:50,  2.69s/it] 33%|███▎      | 1152/3449 [54:38<1:42:33,  2.68s/it]                                                     {'loss': 1.3731, 'learning_rate': 0.0003102643811814778, 'epoch': 0.33}
 33%|███▎      | 1152/3449 [54:38<1:42:33,  2.68s/it] 33%|███▎      | 1153/3449 [54:42<1:49:28,  2.86s/it]                                                     {'loss': 1.1842, 'learning_rate': 0.00031010780790434906, 'epoch': 0.33}
 33%|███▎      | 1153/3449 [54:42<1:49:28,  2.86s/it] 33%|███▎      | 1154/3449 [54:44<1:46:47,  2.79s/it]                                                     {'loss': 1.2848, 'learning_rate': 0.00030995113773530633, 'epoch': 0.33}
 33%|███▎      | 1154/3449 [54:44<1:46:47,  2.79s/it] 33%|███▎      | 1155/3449 [54:48<1:57:36,  3.08s/it]                                                     {'loss': 1.2751, 'learning_rate': 0.0003097943708122152, 'epoch': 0.33}
 33%|███▎      | 1155/3449 [54:48<1:57:36,  3.08s/it] 34%|███▎      | 1156/3449 [54:51<1:55:46,  3.03s/it]                                                     {'loss': 1.3703, 'learning_rate': 0.0003096375072730262, 'epoch': 0.34}
 34%|███▎      | 1156/3449 [54:51<1:55:46,  3.03s/it] 34%|███▎      | 1157/3449 [54:53<1:48:56,  2.85s/it]                                                     {'loss': 1.4415, 'learning_rate': 0.00030948054725577525, 'epoch': 0.34}
 34%|███▎      | 1157/3449 [54:53<1:48:56,  2.85s/it] 34%|███▎      | 1158/3449 [54:56<1:48:06,  2.83s/it]                                                     {'loss': 1.2485, 'learning_rate': 0.0003093234908985828, 'epoch': 0.34}
 34%|███▎      | 1158/3449 [54:56<1:48:06,  2.83s/it] 34%|███▎      | 1159/3449 [54:59<1:47:30,  2.82s/it]                                                     {'loss': 1.3278, 'learning_rate': 0.0003091663383396543, 'epoch': 0.34}
 34%|███▎      | 1159/3449 [54:59<1:47:30,  2.82s/it] 34%|███▎      | 1160/3449 [55:02<1:47:38,  2.82s/it]                                                     {'loss': 1.4458, 'learning_rate': 0.0003090090897172797, 'epoch': 0.34}
 34%|███▎      | 1160/3449 [55:02<1:47:38,  2.82s/it] 34%|███▎      | 1161/3449 [55:04<1:44:27,  2.74s/it]                                                     {'loss': 1.41, 'learning_rate': 0.0003088517451698336, 'epoch': 0.34}
 34%|███▎      | 1161/3449 [55:04<1:44:27,  2.74s/it] 34%|███▎      | 1162/3449 [55:07<1:47:17,  2.81s/it]                                                     {'loss': 1.3387, 'learning_rate': 0.00030869430483577504, 'epoch': 0.34}
 34%|███▎      | 1162/3449 [55:07<1:47:17,  2.81s/it] 34%|███▎      | 1163/3449 [55:10<1:47:48,  2.83s/it]                                                     {'loss': 1.2245, 'learning_rate': 0.00030853676885364724, 'epoch': 0.34}
 34%|███▎      | 1163/3449 [55:10<1:47:48,  2.83s/it] 34%|███▎      | 1164/3449 [55:13<1:46:14,  2.79s/it]                                                     {'loss': 1.2714, 'learning_rate': 0.00030837913736207756, 'epoch': 0.34}
 34%|███▎      | 1164/3449 [55:13<1:46:14,  2.79s/it] 34%|███▍      | 1165/3449 [55:16<1:43:57,  2.73s/it]                                                     {'loss': 1.1188, 'learning_rate': 0.0003082214104997776, 'epoch': 0.34}
 34%|███▍      | 1165/3449 [55:16<1:43:57,  2.73s/it] 34%|███▍      | 1166/3449 [55:18<1:45:57,  2.78s/it]                                                     {'loss': 1.3079, 'learning_rate': 0.00030806358840554263, 'epoch': 0.34}
 34%|███▍      | 1166/3449 [55:18<1:45:57,  2.78s/it] 34%|███▍      | 1167/3449 [55:21<1:42:36,  2.70s/it]                                                     {'loss': 1.3317, 'learning_rate': 0.000307905671218252, 'epoch': 0.34}
 34%|███▍      | 1167/3449 [55:21<1:42:36,  2.70s/it] 34%|███▍      | 1168/3449 [55:24<1:44:47,  2.76s/it]                                                     {'loss': 1.1684, 'learning_rate': 0.0003077476590768686, 'epoch': 0.34}
 34%|███▍      | 1168/3449 [55:24<1:44:47,  2.76s/it] 34%|███▍      | 1169/3449 [55:26<1:42:02,  2.69s/it]                                                     {'loss': 1.4122, 'learning_rate': 0.00030758955212043865, 'epoch': 0.34}
 34%|███▍      | 1169/3449 [55:26<1:42:02,  2.69s/it] 34%|███▍      | 1170/3449 [55:29<1:40:38,  2.65s/it]                                                     {'loss': 1.4393, 'learning_rate': 0.00030743135048809226, 'epoch': 0.34}
 34%|███▍      | 1170/3449 [55:29<1:40:38,  2.65s/it] 34%|███▍      | 1171/3449 [55:31<1:39:18,  2.62s/it]                                                     {'loss': 1.4578, 'learning_rate': 0.0003072730543190424, 'epoch': 0.34}
 34%|███▍      | 1171/3449 [55:31<1:39:18,  2.62s/it] 34%|███▍      | 1172/3449 [55:34<1:36:19,  2.54s/it]                                                     {'loss': 1.2782, 'learning_rate': 0.00030711466375258576, 'epoch': 0.34}
 34%|███▍      | 1172/3449 [55:34<1:36:19,  2.54s/it] 34%|███▍      | 1173/3449 [55:36<1:35:55,  2.53s/it]                                                     {'loss': 1.2647, 'learning_rate': 0.0003069561789281015, 'epoch': 0.34}
 34%|███▍      | 1173/3449 [55:36<1:35:55,  2.53s/it] 34%|███▍      | 1174/3449 [55:39<1:35:05,  2.51s/it]                                                     {'loss': 1.3026, 'learning_rate': 0.00030679759998505213, 'epoch': 0.34}
 34%|███▍      | 1174/3449 [55:39<1:35:05,  2.51s/it] 34%|███▍      | 1175/3449 [55:42<1:37:50,  2.58s/it]                                                     {'loss': 1.1644, 'learning_rate': 0.0003066389270629829, 'epoch': 0.34}
 34%|███▍      | 1175/3449 [55:42<1:37:50,  2.58s/it] 34%|███▍      | 1176/3449 [55:46<1:58:41,  3.13s/it]                                                     {'loss': 1.2328, 'learning_rate': 0.0003064801603015216, 'epoch': 0.34}
 34%|███▍      | 1176/3449 [55:46<1:58:41,  3.13s/it] 34%|███▍      | 1177/3449 [55:49<1:56:50,  3.09s/it]                                                     {'loss': 1.4035, 'learning_rate': 0.0003063212998403789, 'epoch': 0.34}
 34%|███▍      | 1177/3449 [55:49<1:56:50,  3.09s/it] 34%|███▍      | 1178/3449 [55:51<1:49:38,  2.90s/it]                                                     {'loss': 1.3095, 'learning_rate': 0.00030616234581934746, 'epoch': 0.34}
 34%|███▍      | 1178/3449 [55:51<1:49:38,  2.90s/it] 34%|███▍      | 1179/3449 [55:54<1:48:00,  2.85s/it]                                                     {'loss': 1.169, 'learning_rate': 0.00030600329837830276, 'epoch': 0.34}
 34%|███▍      | 1179/3449 [55:54<1:48:00,  2.85s/it] 34%|███▍      | 1180/3449 [55:57<1:43:24,  2.73s/it]                                                     {'loss': 1.318, 'learning_rate': 0.0003058441576572023, 'epoch': 0.34}
 34%|███▍      | 1180/3449 [55:57<1:43:24,  2.73s/it] 34%|███▍      | 1181/3449 [55:59<1:44:24,  2.76s/it]                                                     {'loss': 1.3981, 'learning_rate': 0.00030568492379608544, 'epoch': 0.34}
 34%|███▍      | 1181/3449 [55:59<1:44:24,  2.76s/it] 34%|███▍      | 1182/3449 [56:02<1:44:07,  2.76s/it]                                                     {'loss': 1.274, 'learning_rate': 0.0003055255969350739, 'epoch': 0.34}
 34%|███▍      | 1182/3449 [56:02<1:44:07,  2.76s/it] 34%|███▍      | 1183/3449 [56:05<1:49:33,  2.90s/it]                                                     {'loss': 1.1882, 'learning_rate': 0.000305366177214371, 'epoch': 0.34}
 34%|███▍      | 1183/3449 [56:05<1:49:33,  2.90s/it] 34%|███▍      | 1184/3449 [56:08<1:48:22,  2.87s/it]                                                     {'loss': 1.2955, 'learning_rate': 0.00030520666477426177, 'epoch': 0.34}
 34%|███▍      | 1184/3449 [56:08<1:48:22,  2.87s/it] 34%|███▍      | 1185/3449 [56:11<1:49:29,  2.90s/it]                                                     {'loss': 1.272, 'learning_rate': 0.0003050470597551128, 'epoch': 0.34}
 34%|███▍      | 1185/3449 [56:11<1:49:29,  2.90s/it] 34%|███▍      | 1186/3449 [56:13<1:42:17,  2.71s/it]                                                     {'loss': 1.2953, 'learning_rate': 0.0003048873622973725, 'epoch': 0.34}
 34%|███▍      | 1186/3449 [56:13<1:42:17,  2.71s/it] 34%|███▍      | 1187/3449 [56:16<1:44:23,  2.77s/it]                                                     {'loss': 1.2946, 'learning_rate': 0.00030472757254157, 'epoch': 0.34}
 34%|███▍      | 1187/3449 [56:16<1:44:23,  2.77s/it] 34%|███▍      | 1188/3449 [56:19<1:41:40,  2.70s/it]                                                     {'loss': 1.3895, 'learning_rate': 0.0003045676906283162, 'epoch': 0.34}
 34%|███▍      | 1188/3449 [56:19<1:41:40,  2.70s/it] 34%|███▍      | 1189/3449 [56:21<1:38:22,  2.61s/it]                                                     {'loss': 1.341, 'learning_rate': 0.0003044077166983028, 'epoch': 0.34}
 34%|███▍      | 1189/3449 [56:21<1:38:22,  2.61s/it] 35%|███▍      | 1190/3449 [56:24<1:41:47,  2.70s/it]                                                     {'loss': 1.1957, 'learning_rate': 0.0003042476508923025, 'epoch': 0.34}
 35%|███▍      | 1190/3449 [56:24<1:41:47,  2.70s/it] 35%|███▍      | 1191/3449 [56:27<1:39:15,  2.64s/it]                                                     {'loss': 1.3568, 'learning_rate': 0.0003040874933511692, 'epoch': 0.35}
 35%|███▍      | 1191/3449 [56:27<1:39:15,  2.64s/it] 35%|███▍      | 1192/3449 [56:29<1:37:26,  2.59s/it]                                                     {'loss': 1.1424, 'learning_rate': 0.0003039272442158369, 'epoch': 0.35}
 35%|███▍      | 1192/3449 [56:29<1:37:26,  2.59s/it] 35%|███▍      | 1193/3449 [56:32<1:40:07,  2.66s/it]                                                     {'loss': 1.3181, 'learning_rate': 0.0003037669036273207, 'epoch': 0.35}
 35%|███▍      | 1193/3449 [56:32<1:40:07,  2.66s/it] 35%|███▍      | 1194/3449 [56:34<1:36:45,  2.57s/it]                                                     {'loss': 1.2626, 'learning_rate': 0.0003036064717267161, 'epoch': 0.35}
 35%|███▍      | 1194/3449 [56:34<1:36:45,  2.57s/it] 35%|███▍      | 1195/3449 [56:37<1:36:28,  2.57s/it]                                                     {'loss': 1.1842, 'learning_rate': 0.0003034459486551986, 'epoch': 0.35}
 35%|███▍      | 1195/3449 [56:37<1:36:28,  2.57s/it] 35%|███▍      | 1196/3449 [56:39<1:35:57,  2.56s/it]                                                     {'loss': 1.286, 'learning_rate': 0.0003032853345540244, 'epoch': 0.35}
 35%|███▍      | 1196/3449 [56:39<1:35:57,  2.56s/it] 35%|███▍      | 1197/3449 [56:42<1:35:12,  2.54s/it]                                                     {'loss': 1.277, 'learning_rate': 0.0003031246295645296, 'epoch': 0.35}
 35%|███▍      | 1197/3449 [56:42<1:35:12,  2.54s/it] 35%|███▍      | 1198/3449 [56:45<1:37:38,  2.60s/it]                                                     {'loss': 1.2859, 'learning_rate': 0.0003029638338281302, 'epoch': 0.35}
 35%|███▍      | 1198/3449 [56:45<1:37:38,  2.60s/it] 35%|███▍      | 1199/3449 [56:48<1:42:26,  2.73s/it]                                                     {'loss': 1.2462, 'learning_rate': 0.0003028029474863221, 'epoch': 0.35}
 35%|███▍      | 1199/3449 [56:48<1:42:26,  2.73s/it] 35%|███▍      | 1200/3449 [56:51<1:45:04,  2.80s/it]                                                     {'loss': 1.3812, 'learning_rate': 0.00030264197068068105, 'epoch': 0.35}
 35%|███▍      | 1200/3449 [56:51<1:45:04,  2.80s/it] 35%|███▍      | 1201/3449 [56:54<1:45:54,  2.83s/it]                                                     {'loss': 1.1455, 'learning_rate': 0.00030248090355286224, 'epoch': 0.35}
 35%|███▍      | 1201/3449 [56:54<1:45:54,  2.83s/it] 35%|███▍      | 1202/3449 [56:57<1:49:18,  2.92s/it]                                                     {'loss': 1.2305, 'learning_rate': 0.0003023197462446005, 'epoch': 0.35}
 35%|███▍      | 1202/3449 [56:57<1:49:18,  2.92s/it] 35%|███▍      | 1203/3449 [56:59<1:44:33,  2.79s/it]                                                     {'loss': 1.3159, 'learning_rate': 0.00030215849889770973, 'epoch': 0.35}
 35%|███▍      | 1203/3449 [56:59<1:44:33,  2.79s/it] 35%|███▍      | 1204/3449 [57:01<1:38:29,  2.63s/it]                                                     {'loss': 1.2649, 'learning_rate': 0.00030199716165408365, 'epoch': 0.35}
 35%|███▍      | 1204/3449 [57:01<1:38:29,  2.63s/it] 35%|███▍      | 1205/3449 [57:04<1:38:07,  2.62s/it]                                                     {'loss': 1.2146, 'learning_rate': 0.0003018357346556943, 'epoch': 0.35}
 35%|███▍      | 1205/3449 [57:04<1:38:07,  2.62s/it] 35%|███▍      | 1206/3449 [57:07<1:36:41,  2.59s/it]                                                     {'loss': 1.2537, 'learning_rate': 0.00030167421804459327, 'epoch': 0.35}
 35%|███▍      | 1206/3449 [57:07<1:36:41,  2.59s/it] 35%|███▍      | 1207/3449 [57:10<1:42:05,  2.73s/it]                                                     {'loss': 1.2755, 'learning_rate': 0.00030151261196291094, 'epoch': 0.35}
 35%|███▍      | 1207/3449 [57:10<1:42:05,  2.73s/it] 35%|███▌      | 1208/3449 [57:12<1:37:40,  2.62s/it]                                                     {'loss': 1.2214, 'learning_rate': 0.00030135091655285616, 'epoch': 0.35}
 35%|███▌      | 1208/3449 [57:12<1:37:40,  2.62s/it] 35%|███▌      | 1209/3449 [57:15<1:42:19,  2.74s/it]                                                     {'loss': 1.2191, 'learning_rate': 0.0003011891319567167, 'epoch': 0.35}
 35%|███▌      | 1209/3449 [57:15<1:42:19,  2.74s/it] 35%|███▌      | 1210/3449 [57:17<1:36:49,  2.59s/it]                                                     {'loss': 1.3751, 'learning_rate': 0.00030102725831685845, 'epoch': 0.35}
 35%|███▌      | 1210/3449 [57:17<1:36:49,  2.59s/it] 35%|███▌      | 1211/3449 [57:20<1:36:03,  2.58s/it]                                                     {'loss': 1.2667, 'learning_rate': 0.0003008652957757261, 'epoch': 0.35}
 35%|███▌      | 1211/3449 [57:20<1:36:03,  2.58s/it] 35%|███▌      | 1212/3449 [57:23<1:38:40,  2.65s/it]                                                     {'loss': 1.2965, 'learning_rate': 0.0003007032444758421, 'epoch': 0.35}
 35%|███▌      | 1212/3449 [57:23<1:38:40,  2.65s/it] 35%|███▌      | 1213/3449 [57:25<1:39:54,  2.68s/it]                                                     {'loss': 1.3041, 'learning_rate': 0.00030054110455980746, 'epoch': 0.35}
 35%|███▌      | 1213/3449 [57:25<1:39:54,  2.68s/it] 35%|███▌      | 1214/3449 [57:28<1:36:02,  2.58s/it]                                                     {'loss': 1.3534, 'learning_rate': 0.0003003788761703008, 'epoch': 0.35}
 35%|███▌      | 1214/3449 [57:28<1:36:02,  2.58s/it] 35%|███▌      | 1215/3449 [57:31<1:42:50,  2.76s/it]                                                     {'loss': 1.2117, 'learning_rate': 0.0003002165594500789, 'epoch': 0.35}
 35%|███▌      | 1215/3449 [57:31<1:42:50,  2.76s/it] 35%|███▌      | 1216/3449 [57:34<1:48:42,  2.92s/it]                                                     {'loss': 1.1901, 'learning_rate': 0.00030005415454197596, 'epoch': 0.35}
 35%|███▌      | 1216/3449 [57:34<1:48:42,  2.92s/it] 35%|███▌      | 1217/3449 [57:37<1:47:54,  2.90s/it]                                                     {'loss': 1.1561, 'learning_rate': 0.000299891661588904, 'epoch': 0.35}
 35%|███▌      | 1217/3449 [57:37<1:47:54,  2.90s/it] 35%|███▌      | 1218/3449 [57:39<1:41:10,  2.72s/it]                                                     {'loss': 1.2261, 'learning_rate': 0.0002997290807338524, 'epoch': 0.35}
 35%|███▌      | 1218/3449 [57:39<1:41:10,  2.72s/it] 35%|███▌      | 1219/3449 [57:42<1:43:53,  2.80s/it]                                                     {'loss': 1.3413, 'learning_rate': 0.0002995664121198881, 'epoch': 0.35}
 35%|███▌      | 1219/3449 [57:42<1:43:53,  2.80s/it] 35%|███▌      | 1220/3449 [57:45<1:41:40,  2.74s/it]                                                     {'loss': 1.3146, 'learning_rate': 0.00029940365589015497, 'epoch': 0.35}
 35%|███▌      | 1220/3449 [57:45<1:41:40,  2.74s/it] 35%|███▌      | 1221/3449 [57:48<1:40:33,  2.71s/it]                                                     {'loss': 1.1425, 'learning_rate': 0.0002992408121878742, 'epoch': 0.35}
 35%|███▌      | 1221/3449 [57:48<1:40:33,  2.71s/it] 35%|███▌      | 1222/3449 [57:50<1:39:02,  2.67s/it]                                                     {'loss': 1.2512, 'learning_rate': 0.00029907788115634377, 'epoch': 0.35}
 35%|███▌      | 1222/3449 [57:50<1:39:02,  2.67s/it] 35%|███▌      | 1223/3449 [57:53<1:43:39,  2.79s/it]                                                     {'loss': 1.3225, 'learning_rate': 0.00029891486293893874, 'epoch': 0.35}
 35%|███▌      | 1223/3449 [57:53<1:43:39,  2.79s/it] 35%|███▌      | 1224/3449 [57:56<1:40:35,  2.71s/it]                                                     {'loss': 1.1951, 'learning_rate': 0.0002987517576791107, 'epoch': 0.35}
 35%|███▌      | 1224/3449 [57:56<1:40:35,  2.71s/it] 36%|███▌      | 1225/3449 [57:58<1:37:54,  2.64s/it]                                                     {'loss': 1.2961, 'learning_rate': 0.00029858856552038776, 'epoch': 0.36}
 36%|███▌      | 1225/3449 [57:58<1:37:54,  2.64s/it] 36%|███▌      | 1226/3449 [58:01<1:40:09,  2.70s/it]                                                     {'loss': 1.4236, 'learning_rate': 0.0002984252866063749, 'epoch': 0.36}
 36%|███▌      | 1226/3449 [58:01<1:40:09,  2.70s/it] 36%|███▌      | 1227/3449 [58:04<1:40:57,  2.73s/it]                                                     {'loss': 1.2997, 'learning_rate': 0.0002982619210807531, 'epoch': 0.36}
 36%|███▌      | 1227/3449 [58:04<1:40:57,  2.73s/it] 36%|███▌      | 1228/3449 [58:07<1:41:39,  2.75s/it]                                                     {'loss': 1.3658, 'learning_rate': 0.0002980984690872795, 'epoch': 0.36}
 36%|███▌      | 1228/3449 [58:07<1:41:39,  2.75s/it] 36%|███▌      | 1229/3449 [58:09<1:40:31,  2.72s/it]                                                     {'loss': 1.232, 'learning_rate': 0.0002979349307697876, 'epoch': 0.36}
 36%|███▌      | 1229/3449 [58:09<1:40:31,  2.72s/it] 36%|███▌      | 1230/3449 [58:12<1:43:01,  2.79s/it]                                                     {'loss': 1.3018, 'learning_rate': 0.00029777130627218665, 'epoch': 0.36}
 36%|███▌      | 1230/3449 [58:12<1:43:01,  2.79s/it] 36%|███▌      | 1231/3449 [58:15<1:47:38,  2.91s/it]                                                     {'loss': 1.1708, 'learning_rate': 0.00029760759573846195, 'epoch': 0.36}
 36%|███▌      | 1231/3449 [58:15<1:47:38,  2.91s/it] 36%|███▌      | 1232/3449 [58:19<1:58:06,  3.20s/it]                                                     {'loss': 1.2785, 'learning_rate': 0.00029744379931267415, 'epoch': 0.36}
 36%|███▌      | 1232/3449 [58:19<1:58:06,  3.20s/it] 36%|███▌      | 1233/3449 [58:22<1:50:26,  2.99s/it]                                                     {'loss': 1.3665, 'learning_rate': 0.0002972799171389599, 'epoch': 0.36}
 36%|███▌      | 1233/3449 [58:22<1:50:26,  2.99s/it] 36%|███▌      | 1234/3449 [58:25<1:49:18,  2.96s/it]                                                     {'loss': 1.2077, 'learning_rate': 0.00029711594936153104, 'epoch': 0.36}
 36%|███▌      | 1234/3449 [58:25<1:49:18,  2.96s/it] 36%|███▌      | 1235/3449 [58:27<1:44:50,  2.84s/it]                                                     {'loss': 1.2757, 'learning_rate': 0.00029695189612467473, 'epoch': 0.36}
 36%|███▌      | 1235/3449 [58:27<1:44:50,  2.84s/it] 36%|███▌      | 1236/3449 [58:30<1:40:00,  2.71s/it]                                                     {'loss': 1.581, 'learning_rate': 0.0002967877575727536, 'epoch': 0.36}
 36%|███▌      | 1236/3449 [58:30<1:40:00,  2.71s/it] 36%|███▌      | 1237/3449 [58:32<1:36:33,  2.62s/it]                                                     {'loss': 1.2972, 'learning_rate': 0.000296623533850205, 'epoch': 0.36}
 36%|███▌      | 1237/3449 [58:32<1:36:33,  2.62s/it] 36%|███▌      | 1238/3449 [58:35<1:44:59,  2.85s/it]                                                     {'loss': 1.097, 'learning_rate': 0.00029645922510154147, 'epoch': 0.36}
 36%|███▌      | 1238/3449 [58:35<1:44:59,  2.85s/it] 36%|███▌      | 1239/3449 [58:38<1:41:28,  2.75s/it]                                                     {'loss': 1.1225, 'learning_rate': 0.0002962948314713503, 'epoch': 0.36}
 36%|███▌      | 1239/3449 [58:38<1:41:28,  2.75s/it] 36%|███▌      | 1240/3449 [58:41<1:39:33,  2.70s/it]                                                     {'loss': 1.3598, 'learning_rate': 0.00029613035310429344, 'epoch': 0.36}
 36%|███▌      | 1240/3449 [58:41<1:39:33,  2.70s/it] 36%|███▌      | 1241/3449 [58:43<1:40:05,  2.72s/it]                                                     {'loss': 1.4496, 'learning_rate': 0.00029596579014510747, 'epoch': 0.36}
 36%|███▌      | 1241/3449 [58:43<1:40:05,  2.72s/it] 36%|███▌      | 1242/3449 [58:46<1:42:28,  2.79s/it]                                                     {'loss': 1.1856, 'learning_rate': 0.0002958011427386033, 'epoch': 0.36}
 36%|███▌      | 1242/3449 [58:46<1:42:28,  2.79s/it] 36%|███▌      | 1243/3449 [58:49<1:40:30,  2.73s/it]                                                     {'loss': 1.1327, 'learning_rate': 0.0002956364110296663, 'epoch': 0.36}
 36%|███▌      | 1243/3449 [58:49<1:40:30,  2.73s/it] 36%|███▌      | 1244/3449 [58:52<1:41:25,  2.76s/it]                                                     {'loss': 1.2706, 'learning_rate': 0.000295471595163256, 'epoch': 0.36}
 36%|███▌      | 1244/3449 [58:52<1:41:25,  2.76s/it] 36%|███▌      | 1245/3449 [58:55<1:42:24,  2.79s/it]                                                     {'loss': 1.0502, 'learning_rate': 0.0002953066952844058, 'epoch': 0.36}
 36%|███▌      | 1245/3449 [58:55<1:42:24,  2.79s/it] 36%|███▌      | 1246/3449 [58:57<1:42:18,  2.79s/it]                                                     {'loss': 1.3791, 'learning_rate': 0.0002951417115382232, 'epoch': 0.36}
 36%|███▌      | 1246/3449 [58:57<1:42:18,  2.79s/it] 36%|███▌      | 1247/3449 [59:00<1:39:14,  2.70s/it]                                                     {'loss': 1.2774, 'learning_rate': 0.00029497664406988956, 'epoch': 0.36}
 36%|███▌      | 1247/3449 [59:00<1:39:14,  2.70s/it] 36%|███▌      | 1248/3449 [59:02<1:35:13,  2.60s/it]                                                     {'loss': 1.3849, 'learning_rate': 0.00029481149302465975, 'epoch': 0.36}
 36%|███▌      | 1248/3449 [59:02<1:35:13,  2.60s/it] 36%|███▌      | 1249/3449 [59:05<1:38:17,  2.68s/it]                                                     {'loss': 1.2147, 'learning_rate': 0.00029464625854786224, 'epoch': 0.36}
 36%|███▌      | 1249/3449 [59:05<1:38:17,  2.68s/it] 36%|███▌      | 1250/3449 [59:08<1:42:55,  2.81s/it]                                                     {'loss': 1.2812, 'learning_rate': 0.00029448094078489894, 'epoch': 0.36}
 36%|███▌      | 1250/3449 [59:08<1:42:55,  2.81s/it] 36%|███▋      | 1251/3449 [59:11<1:43:37,  2.83s/it]                                                     {'loss': 1.2631, 'learning_rate': 0.0002943155398812451, 'epoch': 0.36}
 36%|███▋      | 1251/3449 [59:11<1:43:37,  2.83s/it] 36%|███▋      | 1252/3449 [59:13<1:38:36,  2.69s/it]                                                     {'loss': 1.4973, 'learning_rate': 0.00029415005598244895, 'epoch': 0.36}
 36%|███▋      | 1252/3449 [59:13<1:38:36,  2.69s/it] 36%|███▋      | 1253/3449 [59:17<1:44:09,  2.85s/it]                                                     {'loss': 1.3568, 'learning_rate': 0.000293984489234132, 'epoch': 0.36}
 36%|███▋      | 1253/3449 [59:17<1:44:09,  2.85s/it] 36%|███▋      | 1254/3449 [59:19<1:38:36,  2.70s/it]                                                     {'loss': 1.4428, 'learning_rate': 0.0002938188397819885, 'epoch': 0.36}
 36%|███▋      | 1254/3449 [59:19<1:38:36,  2.70s/it] 36%|███▋      | 1255/3449 [59:21<1:34:42,  2.59s/it]                                                     {'loss': 1.4517, 'learning_rate': 0.0002936531077717855, 'epoch': 0.36}
 36%|███▋      | 1255/3449 [59:21<1:34:42,  2.59s/it] 36%|███▋      | 1256/3449 [59:25<1:48:11,  2.96s/it]                                                     {'loss': 1.1518, 'learning_rate': 0.0002934872933493628, 'epoch': 0.36}
 36%|███▋      | 1256/3449 [59:25<1:48:11,  2.96s/it] 36%|███▋      | 1257/3449 [59:29<1:59:18,  3.27s/it]                                                     {'loss': 1.2996, 'learning_rate': 0.0002933213966606325, 'epoch': 0.36}
 36%|███▋      | 1257/3449 [59:29<1:59:18,  3.27s/it] 36%|███▋      | 1258/3449 [59:32<1:51:10,  3.04s/it]                                                     {'loss': 1.1926, 'learning_rate': 0.00029315541785157937, 'epoch': 0.36}
 36%|███▋      | 1258/3449 [59:32<1:51:10,  3.04s/it] 37%|███▋      | 1259/3449 [59:35<1:55:02,  3.15s/it]                                                     {'loss': 1.3596, 'learning_rate': 0.00029298935706826017, 'epoch': 0.36}
 37%|███▋      | 1259/3449 [59:35<1:55:02,  3.15s/it] 37%|███▋      | 1260/3449 [59:39<2:01:16,  3.32s/it]                                                     {'loss': 1.3128, 'learning_rate': 0.000292823214456804, 'epoch': 0.37}
 37%|███▋      | 1260/3449 [59:39<2:01:16,  3.32s/it] 37%|███▋      | 1261/3449 [59:41<1:49:31,  3.00s/it]                                                     {'loss': 1.1898, 'learning_rate': 0.0002926569901634119, 'epoch': 0.37}
 37%|███▋      | 1261/3449 [59:41<1:49:31,  3.00s/it] 37%|███▋      | 1262/3449 [59:43<1:43:12,  2.83s/it]                                                     {'loss': 1.2303, 'learning_rate': 0.00029249068433435683, 'epoch': 0.37}
 37%|███▋      | 1262/3449 [59:43<1:43:12,  2.83s/it] 37%|███▋      | 1263/3449 [59:46<1:41:48,  2.79s/it]                                                     {'loss': 1.1898, 'learning_rate': 0.00029232429711598335, 'epoch': 0.37}
 37%|███▋      | 1263/3449 [59:46<1:41:48,  2.79s/it] 37%|███▋      | 1264/3449 [59:49<1:37:28,  2.68s/it]                                                     {'loss': 1.2474, 'learning_rate': 0.0002921578286547078, 'epoch': 0.37}
 37%|███▋      | 1264/3449 [59:49<1:37:28,  2.68s/it] 37%|███▋      | 1265/3449 [59:51<1:37:35,  2.68s/it]                                                     {'loss': 1.2588, 'learning_rate': 0.00029199127909701803, 'epoch': 0.37}
 37%|███▋      | 1265/3449 [59:51<1:37:35,  2.68s/it] 37%|███▋      | 1266/3449 [59:54<1:36:22,  2.65s/it]                                                     {'loss': 1.3361, 'learning_rate': 0.000291824648589473, 'epoch': 0.37}
 37%|███▋      | 1266/3449 [59:54<1:36:22,  2.65s/it] 37%|███▋      | 1267/3449 [59:57<1:43:49,  2.86s/it]                                                     {'loss': 1.2607, 'learning_rate': 0.00029165793727870323, 'epoch': 0.37}
 37%|███▋      | 1267/3449 [59:57<1:43:49,  2.86s/it] 37%|███▋      | 1268/3449 [1:00:00<1:39:45,  2.74s/it]                                                       {'loss': 1.3589, 'learning_rate': 0.0002914911453114101, 'epoch': 0.37}
 37%|███▋      | 1268/3449 [1:00:00<1:39:45,  2.74s/it] 37%|███▋      | 1269/3449 [1:00:02<1:35:25,  2.63s/it]                                                       {'loss': 1.2802, 'learning_rate': 0.00029132427283436613, 'epoch': 0.37}
 37%|███▋      | 1269/3449 [1:00:02<1:35:25,  2.63s/it] 37%|███▋      | 1270/3449 [1:00:05<1:37:24,  2.68s/it]                                                       {'loss': 1.298, 'learning_rate': 0.0002911573199944147, 'epoch': 0.37}
 37%|███▋      | 1270/3449 [1:00:05<1:37:24,  2.68s/it] 37%|███▋      | 1271/3449 [1:00:08<1:41:46,  2.80s/it]                                                       {'loss': 1.3343, 'learning_rate': 0.00029099028693846954, 'epoch': 0.37}
 37%|███▋      | 1271/3449 [1:00:08<1:41:46,  2.80s/it] 37%|███▋      | 1272/3449 [1:00:11<1:47:20,  2.96s/it]                                                       {'loss': 1.2028, 'learning_rate': 0.00029082317381351556, 'epoch': 0.37}
 37%|███▋      | 1272/3449 [1:00:11<1:47:20,  2.96s/it] 37%|███▋      | 1273/3449 [1:00:15<1:53:23,  3.13s/it]                                                       {'loss': 1.299, 'learning_rate': 0.0002906559807666077, 'epoch': 0.37}
 37%|███▋      | 1273/3449 [1:00:15<1:53:23,  3.13s/it] 37%|███▋      | 1274/3449 [1:00:18<1:56:36,  3.22s/it]                                                       {'loss': 1.2366, 'learning_rate': 0.00029048870794487133, 'epoch': 0.37}
 37%|███▋      | 1274/3449 [1:00:18<1:56:36,  3.22s/it] 37%|███▋      | 1275/3449 [1:00:21<1:50:18,  3.04s/it]                                                       {'loss': 1.2781, 'learning_rate': 0.00029032135549550203, 'epoch': 0.37}
 37%|███▋      | 1275/3449 [1:00:21<1:50:18,  3.04s/it] 37%|███▋      | 1276/3449 [1:00:23<1:42:34,  2.83s/it]                                                       {'loss': 1.2501, 'learning_rate': 0.00029015392356576556, 'epoch': 0.37}
 37%|███▋      | 1276/3449 [1:00:23<1:42:34,  2.83s/it] 37%|███▋      | 1277/3449 [1:00:26<1:41:10,  2.79s/it]                                                       {'loss': 1.2104, 'learning_rate': 0.0002899864123029974, 'epoch': 0.37}
 37%|███▋      | 1277/3449 [1:00:26<1:41:10,  2.79s/it] 37%|███▋      | 1278/3449 [1:00:28<1:37:04,  2.68s/it]                                                       {'loss': 1.402, 'learning_rate': 0.00028981882185460304, 'epoch': 0.37}
 37%|███▋      | 1278/3449 [1:00:28<1:37:04,  2.68s/it] 37%|███▋      | 1279/3449 [1:00:31<1:40:02,  2.77s/it]                                                       {'loss': 1.2098, 'learning_rate': 0.0002896511523680575, 'epoch': 0.37}
 37%|███▋      | 1279/3449 [1:00:31<1:40:02,  2.77s/it] 37%|███▋      | 1280/3449 [1:00:34<1:36:58,  2.68s/it]                                                       {'loss': 1.2936, 'learning_rate': 0.0002894834039909055, 'epoch': 0.37}
 37%|███▋      | 1280/3449 [1:00:34<1:36:58,  2.68s/it] 37%|███▋      | 1281/3449 [1:00:37<1:39:16,  2.75s/it]                                                       {'loss': 1.2416, 'learning_rate': 0.0002893155768707612, 'epoch': 0.37}
 37%|███▋      | 1281/3449 [1:00:37<1:39:16,  2.75s/it] 37%|███▋      | 1282/3449 [1:00:39<1:37:07,  2.69s/it]                                                       {'loss': 1.1811, 'learning_rate': 0.0002891476711553077, 'epoch': 0.37}
 37%|███▋      | 1282/3449 [1:00:39<1:37:07,  2.69s/it] 37%|███▋      | 1283/3449 [1:00:42<1:34:19,  2.61s/it]                                                       {'loss': 1.217, 'learning_rate': 0.0002889796869922977, 'epoch': 0.37}
 37%|███▋      | 1283/3449 [1:00:42<1:34:19,  2.61s/it] 37%|███▋      | 1284/3449 [1:00:45<1:43:16,  2.86s/it]                                                       {'loss': 1.2277, 'learning_rate': 0.0002888116245295527, 'epoch': 0.37}
 37%|███▋      | 1284/3449 [1:00:45<1:43:16,  2.86s/it] 37%|███▋      | 1285/3449 [1:00:48<1:44:10,  2.89s/it]                                                       {'loss': 1.3703, 'learning_rate': 0.0002886434839149632, 'epoch': 0.37}
 37%|███▋      | 1285/3449 [1:00:48<1:44:10,  2.89s/it] 37%|███▋      | 1286/3449 [1:00:50<1:38:19,  2.73s/it]                                                       {'loss': 1.4413, 'learning_rate': 0.00028847526529648834, 'epoch': 0.37}
 37%|███▋      | 1286/3449 [1:00:50<1:38:19,  2.73s/it] 37%|███▋      | 1287/3449 [1:00:53<1:41:49,  2.83s/it]                                                       {'loss': 1.3558, 'learning_rate': 0.0002883069688221561, 'epoch': 0.37}
 37%|███▋      | 1287/3449 [1:00:53<1:41:49,  2.83s/it] 37%|███▋      | 1288/3449 [1:00:56<1:40:10,  2.78s/it]                                                       {'loss': 1.2862, 'learning_rate': 0.0002881385946400628, 'epoch': 0.37}
 37%|███▋      | 1288/3449 [1:00:56<1:40:10,  2.78s/it] 37%|███▋      | 1289/3449 [1:00:58<1:35:10,  2.64s/it]                                                       {'loss': 1.1239, 'learning_rate': 0.0002879701428983731, 'epoch': 0.37}
 37%|███▋      | 1289/3449 [1:00:58<1:35:10,  2.64s/it] 37%|███▋      | 1290/3449 [1:01:01<1:37:29,  2.71s/it]                                                       {'loss': 1.2821, 'learning_rate': 0.00028780161374532026, 'epoch': 0.37}
 37%|███▋      | 1290/3449 [1:01:01<1:37:29,  2.71s/it] 37%|███▋      | 1291/3449 [1:01:04<1:37:06,  2.70s/it]                                                       {'loss': 1.4575, 'learning_rate': 0.0002876330073292052, 'epoch': 0.37}
 37%|███▋      | 1291/3449 [1:01:04<1:37:06,  2.70s/it] 37%|███▋      | 1292/3449 [1:01:06<1:30:48,  2.53s/it]                                                       {'loss': 1.256, 'learning_rate': 0.00028746432379839703, 'epoch': 0.37}
 37%|███▋      | 1292/3449 [1:01:06<1:30:48,  2.53s/it] 37%|███▋      | 1293/3449 [1:01:09<1:31:07,  2.54s/it]                                                       {'loss': 1.1911, 'learning_rate': 0.00028729556330133284, 'epoch': 0.37}
 37%|███▋      | 1293/3449 [1:01:09<1:31:07,  2.54s/it] 38%|███▊      | 1294/3449 [1:01:12<1:42:13,  2.85s/it]                                                       {'loss': 1.0427, 'learning_rate': 0.0002871267259865173, 'epoch': 0.38}
 38%|███▊      | 1294/3449 [1:01:12<1:42:13,  2.85s/it] 38%|███▊      | 1295/3449 [1:01:15<1:45:01,  2.93s/it]                                                       {'loss': 1.3246, 'learning_rate': 0.0002869578120025227, 'epoch': 0.38}
 38%|███▊      | 1295/3449 [1:01:15<1:45:01,  2.93s/it] 38%|███▊      | 1296/3449 [1:01:18<1:39:48,  2.78s/it]                                                       {'loss': 1.3458, 'learning_rate': 0.0002867888214979888, 'epoch': 0.38}
 38%|███▊      | 1296/3449 [1:01:18<1:39:48,  2.78s/it] 38%|███▊      | 1297/3449 [1:01:20<1:34:33,  2.64s/it]                                                       {'loss': 1.3394, 'learning_rate': 0.0002866197546216226, 'epoch': 0.38}
 38%|███▊      | 1297/3449 [1:01:20<1:34:33,  2.64s/it] 38%|███▊      | 1298/3449 [1:01:24<1:44:57,  2.93s/it]                                                       {'loss': 1.1475, 'learning_rate': 0.00028645061152219865, 'epoch': 0.38}
 38%|███▊      | 1298/3449 [1:01:24<1:44:57,  2.93s/it] 38%|███▊      | 1299/3449 [1:01:26<1:40:44,  2.81s/it]                                                       {'loss': 1.3651, 'learning_rate': 0.00028628139234855815, 'epoch': 0.38}
 38%|███▊      | 1299/3449 [1:01:26<1:40:44,  2.81s/it] 38%|███▊      | 1300/3449 [1:01:29<1:42:54,  2.87s/it]                                                       {'loss': 1.4035, 'learning_rate': 0.00028611209724960956, 'epoch': 0.38}
 38%|███▊      | 1300/3449 [1:01:29<1:42:54,  2.87s/it] 38%|███▊      | 1301/3449 [1:01:32<1:46:36,  2.98s/it]                                                       {'loss': 1.2352, 'learning_rate': 0.0002859427263743279, 'epoch': 0.38}
 38%|███▊      | 1301/3449 [1:01:32<1:46:36,  2.98s/it] 38%|███▊      | 1302/3449 [1:01:35<1:45:40,  2.95s/it]                                                       {'loss': 1.3415, 'learning_rate': 0.000285773279871755, 'epoch': 0.38}
 38%|███▊      | 1302/3449 [1:01:35<1:45:40,  2.95s/it] 38%|███▊      | 1303/3449 [1:01:38<1:38:44,  2.76s/it]                                                       {'loss': 1.3337, 'learning_rate': 0.00028560375789099936, 'epoch': 0.38}
 38%|███▊      | 1303/3449 [1:01:38<1:38:44,  2.76s/it] 38%|███▊      | 1304/3449 [1:01:41<1:41:29,  2.84s/it]                                                       {'loss': 1.2691, 'learning_rate': 0.0002854341605812357, 'epoch': 0.38}
 38%|███▊      | 1304/3449 [1:01:41<1:41:29,  2.84s/it] 38%|███▊      | 1305/3449 [1:01:45<1:58:17,  3.31s/it]                                                       {'loss': 1.2242, 'learning_rate': 0.000285264488091705, 'epoch': 0.38}
 38%|███▊      | 1305/3449 [1:01:45<1:58:17,  3.31s/it] 38%|███▊      | 1306/3449 [1:01:48<1:49:30,  3.07s/it]                                                       {'loss': 1.267, 'learning_rate': 0.0002850947405717146, 'epoch': 0.38}
 38%|███▊      | 1306/3449 [1:01:48<1:49:30,  3.07s/it] 38%|███▊      | 1307/3449 [1:01:50<1:47:06,  3.00s/it]                                                       {'loss': 1.2977, 'learning_rate': 0.00028492491817063765, 'epoch': 0.38}
 38%|███▊      | 1307/3449 [1:01:50<1:47:06,  3.00s/it] 38%|███▊      | 1308/3449 [1:01:54<1:55:05,  3.23s/it]                                                       {'loss': 1.065, 'learning_rate': 0.0002847550210379135, 'epoch': 0.38}
 38%|███▊      | 1308/3449 [1:01:54<1:55:05,  3.23s/it] 38%|███▊      | 1309/3449 [1:01:56<1:44:16,  2.92s/it]                                                       {'loss': 1.1993, 'learning_rate': 0.0002845850493230469, 'epoch': 0.38}
 38%|███▊      | 1309/3449 [1:01:56<1:44:16,  2.92s/it] 38%|███▊      | 1310/3449 [1:01:59<1:38:05,  2.75s/it]                                                       {'loss': 1.198, 'learning_rate': 0.0002844150031756085, 'epoch': 0.38}
 38%|███▊      | 1310/3449 [1:01:59<1:38:05,  2.75s/it] 38%|███▊      | 1311/3449 [1:02:01<1:33:50,  2.63s/it]                                                       {'loss': 1.1242, 'learning_rate': 0.0002842448827452342, 'epoch': 0.38}
 38%|███▊      | 1311/3449 [1:02:01<1:33:50,  2.63s/it] 38%|███▊      | 1312/3449 [1:02:04<1:36:52,  2.72s/it]                                                       {'loss': 1.1063, 'learning_rate': 0.0002840746881816256, 'epoch': 0.38}
 38%|███▊      | 1312/3449 [1:02:04<1:36:52,  2.72s/it] 38%|███▊      | 1313/3449 [1:02:08<1:52:44,  3.17s/it]                                                       {'loss': 1.2793, 'learning_rate': 0.0002839044196345492, 'epoch': 0.38}
 38%|███▊      | 1313/3449 [1:02:08<1:52:44,  3.17s/it] 38%|███▊      | 1314/3449 [1:02:11<1:45:06,  2.95s/it]                                                       {'loss': 1.3933, 'learning_rate': 0.0002837340772538368, 'epoch': 0.38}
 38%|███▊      | 1314/3449 [1:02:11<1:45:06,  2.95s/it] 38%|███▊      | 1315/3449 [1:02:14<1:45:10,  2.96s/it]                                                       {'loss': 1.2991, 'learning_rate': 0.00028356366118938506, 'epoch': 0.38}
 38%|███▊      | 1315/3449 [1:02:14<1:45:10,  2.96s/it] 38%|███▊      | 1316/3449 [1:02:17<1:44:35,  2.94s/it]                                                       {'loss': 1.3674, 'learning_rate': 0.0002833931715911556, 'epoch': 0.38}
 38%|███▊      | 1316/3449 [1:02:17<1:44:35,  2.94s/it] 38%|███▊      | 1317/3449 [1:02:20<1:44:25,  2.94s/it]                                                       {'loss': 1.181, 'learning_rate': 0.00028322260860917474, 'epoch': 0.38}
 38%|███▊      | 1317/3449 [1:02:20<1:44:25,  2.94s/it] 38%|███▊      | 1318/3449 [1:02:22<1:40:17,  2.82s/it]                                                       {'loss': 1.2209, 'learning_rate': 0.0002830519723935332, 'epoch': 0.38}
 38%|███▊      | 1318/3449 [1:02:22<1:40:17,  2.82s/it] 38%|███▊      | 1319/3449 [1:02:25<1:37:06,  2.74s/it]                                                       {'loss': 1.3288, 'learning_rate': 0.0002828812630943864, 'epoch': 0.38}
 38%|███▊      | 1319/3449 [1:02:25<1:37:06,  2.74s/it] 38%|███▊      | 1320/3449 [1:02:27<1:35:26,  2.69s/it]                                                       {'loss': 1.294, 'learning_rate': 0.00028271048086195386, 'epoch': 0.38}
 38%|███▊      | 1320/3449 [1:02:27<1:35:26,  2.69s/it] 38%|███▊      | 1321/3449 [1:02:29<1:28:39,  2.50s/it]                                                       {'loss': 1.3559, 'learning_rate': 0.0002825396258465193, 'epoch': 0.38}
 38%|███▊      | 1321/3449 [1:02:29<1:28:39,  2.50s/it] 38%|███▊      | 1322/3449 [1:02:33<1:40:50,  2.84s/it]                                                       {'loss': 1.1715, 'learning_rate': 0.0002823686981984307, 'epoch': 0.38}
 38%|███▊      | 1322/3449 [1:02:33<1:40:50,  2.84s/it] 38%|███▊      | 1323/3449 [1:02:36<1:43:08,  2.91s/it]                                                       {'loss': 1.2196, 'learning_rate': 0.0002821976980680996, 'epoch': 0.38}
 38%|███▊      | 1323/3449 [1:02:36<1:43:08,  2.91s/it] 38%|███▊      | 1324/3449 [1:02:39<1:42:01,  2.88s/it]                                                       {'loss': 1.271, 'learning_rate': 0.0002820266256060018, 'epoch': 0.38}
 38%|███▊      | 1324/3449 [1:02:39<1:42:01,  2.88s/it] 38%|███▊      | 1325/3449 [1:02:42<1:42:21,  2.89s/it]                                                       {'loss': 1.5067, 'learning_rate': 0.00028185548096267617, 'epoch': 0.38}
 38%|███▊      | 1325/3449 [1:02:42<1:42:21,  2.89s/it] 38%|███▊      | 1326/3449 [1:02:44<1:38:22,  2.78s/it]                                                       {'loss': 1.3284, 'learning_rate': 0.00028168426428872554, 'epoch': 0.38}
 38%|███▊      | 1326/3449 [1:02:44<1:38:22,  2.78s/it] 38%|███▊      | 1327/3449 [1:02:47<1:34:38,  2.68s/it]                                                       {'loss': 1.2798, 'learning_rate': 0.0002815129757348161, 'epoch': 0.38}
 38%|███▊      | 1327/3449 [1:02:47<1:34:38,  2.68s/it] 39%|███▊      | 1328/3449 [1:02:49<1:32:23,  2.61s/it]                                                       {'loss': 1.3363, 'learning_rate': 0.00028134161545167693, 'epoch': 0.38}
 39%|███▊      | 1328/3449 [1:02:49<1:32:23,  2.61s/it] 39%|███▊      | 1329/3449 [1:02:52<1:32:29,  2.62s/it]                                                       {'loss': 1.2926, 'learning_rate': 0.0002811701835901007, 'epoch': 0.39}
 39%|███▊      | 1329/3449 [1:02:52<1:32:29,  2.62s/it] 39%|███▊      | 1330/3449 [1:02:55<1:34:29,  2.68s/it]                                                       {'loss': 1.1234, 'learning_rate': 0.0002809986803009427, 'epoch': 0.39}
 39%|███▊      | 1330/3449 [1:02:55<1:34:29,  2.68s/it] 39%|███▊      | 1331/3449 [1:02:58<1:40:35,  2.85s/it]                                                       {'loss': 1.2989, 'learning_rate': 0.00028082710573512133, 'epoch': 0.39}
 39%|███▊      | 1331/3449 [1:02:58<1:40:35,  2.85s/it] 39%|███▊      | 1332/3449 [1:03:01<1:39:08,  2.81s/it]                                                       {'loss': 1.3239, 'learning_rate': 0.0002806554600436175, 'epoch': 0.39}
 39%|███▊      | 1332/3449 [1:03:01<1:39:08,  2.81s/it] 39%|███▊      | 1333/3449 [1:03:05<1:53:07,  3.21s/it]                                                       {'loss': 1.46, 'learning_rate': 0.0002804837433774748, 'epoch': 0.39}
 39%|███▊      | 1333/3449 [1:03:05<1:53:07,  3.21s/it] 39%|███▊      | 1334/3449 [1:03:07<1:47:55,  3.06s/it]                                                       {'loss': 1.3381, 'learning_rate': 0.00028031195588779946, 'epoch': 0.39}
 39%|███▊      | 1334/3449 [1:03:07<1:47:55,  3.06s/it] 39%|███▊      | 1335/3449 [1:03:10<1:44:28,  2.97s/it]                                                       {'loss': 1.3373, 'learning_rate': 0.0002801400977257596, 'epoch': 0.39}
 39%|███▊      | 1335/3449 [1:03:10<1:44:28,  2.97s/it] 39%|███▊      | 1336/3449 [1:03:13<1:43:27,  2.94s/it]                                                       {'loss': 1.2269, 'learning_rate': 0.00027996816904258604, 'epoch': 0.39}
 39%|███▊      | 1336/3449 [1:03:13<1:43:27,  2.94s/it] 39%|███▉      | 1337/3449 [1:03:16<1:47:26,  3.05s/it]                                                       {'loss': 1.3315, 'learning_rate': 0.0002797961699895712, 'epoch': 0.39}
 39%|███▉      | 1337/3449 [1:03:16<1:47:26,  3.05s/it] 39%|███▉      | 1338/3449 [1:03:19<1:40:43,  2.86s/it]                                                       {'loss': 1.2946, 'learning_rate': 0.0002796241007180697, 'epoch': 0.39}
 39%|███▉      | 1338/3449 [1:03:19<1:40:43,  2.86s/it] 39%|███▉      | 1339/3449 [1:03:22<1:41:54,  2.90s/it]                                                       {'loss': 1.2438, 'learning_rate': 0.000279451961379498, 'epoch': 0.39}
 39%|███▉      | 1339/3449 [1:03:22<1:41:54,  2.90s/it] 39%|███▉      | 1340/3449 [1:03:25<1:41:29,  2.89s/it]                                                       {'loss': 1.3579, 'learning_rate': 0.00027927975212533386, 'epoch': 0.39}
 39%|███▉      | 1340/3449 [1:03:25<1:41:29,  2.89s/it] 39%|███▉      | 1341/3449 [1:03:27<1:37:41,  2.78s/it]                                                       {'loss': 1.1844, 'learning_rate': 0.000279107473107117, 'epoch': 0.39}
 39%|███▉      | 1341/3449 [1:03:27<1:37:41,  2.78s/it] 39%|███▉      | 1342/3449 [1:03:30<1:36:23,  2.74s/it]                                                       {'loss': 1.2203, 'learning_rate': 0.00027893512447644826, 'epoch': 0.39}
 39%|███▉      | 1342/3449 [1:03:30<1:36:23,  2.74s/it] 39%|███▉      | 1343/3449 [1:03:33<1:39:36,  2.84s/it]                                                       {'loss': 1.1703, 'learning_rate': 0.0002787627063849898, 'epoch': 0.39}
 39%|███▉      | 1343/3449 [1:03:33<1:39:36,  2.84s/it] 39%|███▉      | 1344/3449 [1:03:36<1:47:58,  3.08s/it]                                                       {'loss': 1.3602, 'learning_rate': 0.0002785902189844649, 'epoch': 0.39}
 39%|███▉      | 1344/3449 [1:03:36<1:47:58,  3.08s/it] 39%|███▉      | 1345/3449 [1:03:39<1:44:25,  2.98s/it]                                                       {'loss': 1.2242, 'learning_rate': 0.0002784176624266578, 'epoch': 0.39}
 39%|███▉      | 1345/3449 [1:03:39<1:44:25,  2.98s/it] 39%|███▉      | 1346/3449 [1:03:42<1:40:47,  2.88s/it]                                                       {'loss': 1.2376, 'learning_rate': 0.00027824503686341373, 'epoch': 0.39}
 39%|███▉      | 1346/3449 [1:03:42<1:40:47,  2.88s/it] 39%|███▉      | 1347/3449 [1:03:45<1:41:28,  2.90s/it]                                                       {'loss': 1.2791, 'learning_rate': 0.00027807234244663846, 'epoch': 0.39}
 39%|███▉      | 1347/3449 [1:03:45<1:41:28,  2.90s/it] 39%|███▉      | 1348/3449 [1:03:48<1:45:49,  3.02s/it]                                                       {'loss': 1.4444, 'learning_rate': 0.0002778995793282985, 'epoch': 0.39}
 39%|███▉      | 1348/3449 [1:03:48<1:45:49,  3.02s/it] 39%|███▉      | 1349/3449 [1:03:51<1:49:19,  3.12s/it]                                                       {'loss': 1.1773, 'learning_rate': 0.0002777267476604208, 'epoch': 0.39}
 39%|███▉      | 1349/3449 [1:03:51<1:49:19,  3.12s/it] 39%|███▉      | 1350/3449 [1:03:54<1:41:51,  2.91s/it]                                                       {'loss': 1.3084, 'learning_rate': 0.0002775538475950925, 'epoch': 0.39}
 39%|███▉      | 1350/3449 [1:03:54<1:41:51,  2.91s/it] 39%|███▉      | 1351/3449 [1:03:56<1:36:36,  2.76s/it]                                                       {'loss': 1.3622, 'learning_rate': 0.00027738087928446103, 'epoch': 0.39}
 39%|███▉      | 1351/3449 [1:03:56<1:36:36,  2.76s/it] 39%|███▉      | 1352/3449 [1:03:59<1:34:10,  2.69s/it]                                                       {'loss': 1.3555, 'learning_rate': 0.00027720784288073387, 'epoch': 0.39}
 39%|███▉      | 1352/3449 [1:03:59<1:34:10,  2.69s/it] 39%|███▉      | 1353/3449 [1:04:01<1:33:12,  2.67s/it]                                                       {'loss': 1.2227, 'learning_rate': 0.00027703473853617834, 'epoch': 0.39}
 39%|███▉      | 1353/3449 [1:04:01<1:33:12,  2.67s/it] 39%|███▉      | 1354/3449 [1:04:04<1:33:25,  2.68s/it]                                                       {'loss': 1.304, 'learning_rate': 0.00027686156640312177, 'epoch': 0.39}
 39%|███▉      | 1354/3449 [1:04:04<1:33:25,  2.68s/it] 39%|███▉      | 1355/3449 [1:04:07<1:34:16,  2.70s/it]                                                       {'loss': 1.3173, 'learning_rate': 0.0002766883266339509, 'epoch': 0.39}
 39%|███▉      | 1355/3449 [1:04:07<1:34:16,  2.70s/it] 39%|███▉      | 1356/3449 [1:04:09<1:31:15,  2.62s/it]                                                       {'loss': 1.2876, 'learning_rate': 0.0002765150193811121, 'epoch': 0.39}
 39%|███▉      | 1356/3449 [1:04:09<1:31:15,  2.62s/it] 39%|███▉      | 1357/3449 [1:04:12<1:34:11,  2.70s/it]                                                       {'loss': 1.2845, 'learning_rate': 0.000276341644797111, 'epoch': 0.39}
 39%|███▉      | 1357/3449 [1:04:12<1:34:11,  2.70s/it] 39%|███▉      | 1358/3449 [1:04:15<1:31:16,  2.62s/it]                                                       {'loss': 1.3135, 'learning_rate': 0.0002761682030345126, 'epoch': 0.39}
 39%|███▉      | 1358/3449 [1:04:15<1:31:16,  2.62s/it] 39%|███▉      | 1359/3449 [1:04:17<1:29:46,  2.58s/it]                                                       {'loss': 1.3552, 'learning_rate': 0.00027599469424594117, 'epoch': 0.39}
 39%|███▉      | 1359/3449 [1:04:17<1:29:46,  2.58s/it] 39%|███▉      | 1360/3449 [1:04:20<1:32:41,  2.66s/it]                                                       {'loss': 1.1442, 'learning_rate': 0.0002758211185840796, 'epoch': 0.39}
 39%|███▉      | 1360/3449 [1:04:20<1:32:41,  2.66s/it] 39%|███▉      | 1361/3449 [1:04:23<1:31:34,  2.63s/it]                                                       {'loss': 1.2293, 'learning_rate': 0.00027564747620166985, 'epoch': 0.39}
 39%|███▉      | 1361/3449 [1:04:23<1:31:34,  2.63s/it] 39%|███▉      | 1362/3449 [1:04:25<1:31:54,  2.64s/it]                                                       {'loss': 1.3055, 'learning_rate': 0.0002754737672515126, 'epoch': 0.39}
 39%|███▉      | 1362/3449 [1:04:25<1:31:54,  2.64s/it] 40%|███▉      | 1363/3449 [1:04:29<1:40:08,  2.88s/it]                                                       {'loss': 1.1836, 'learning_rate': 0.00027529999188646707, 'epoch': 0.4}
 40%|███▉      | 1363/3449 [1:04:29<1:40:08,  2.88s/it] 40%|███▉      | 1364/3449 [1:04:31<1:36:58,  2.79s/it]                                                       {'loss': 1.2333, 'learning_rate': 0.00027512615025945076, 'epoch': 0.4}
 40%|███▉      | 1364/3449 [1:04:31<1:36:58,  2.79s/it] 40%|███▉      | 1365/3449 [1:04:34<1:36:01,  2.76s/it]                                                       {'loss': 1.3836, 'learning_rate': 0.0002749522425234398, 'epoch': 0.4}
 40%|███▉      | 1365/3449 [1:04:34<1:36:01,  2.76s/it] 40%|███▉      | 1366/3449 [1:04:37<1:37:48,  2.82s/it]                                                       {'loss': 1.3763, 'learning_rate': 0.00027477826883146836, 'epoch': 0.4}
 40%|███▉      | 1366/3449 [1:04:37<1:37:48,  2.82s/it] 40%|███▉      | 1367/3449 [1:04:40<1:37:06,  2.80s/it]                                                       {'loss': 1.148, 'learning_rate': 0.0002746042293366284, 'epoch': 0.4}
 40%|███▉      | 1367/3449 [1:04:40<1:37:06,  2.80s/it] 40%|███▉      | 1368/3449 [1:04:42<1:37:04,  2.80s/it]                                                       {'loss': 1.2524, 'learning_rate': 0.00027443012419207024, 'epoch': 0.4}
 40%|███▉      | 1368/3449 [1:04:42<1:37:04,  2.80s/it] 40%|███▉      | 1369/3449 [1:04:46<1:43:14,  2.98s/it]                                                       {'loss': 1.1413, 'learning_rate': 0.0002742559535510016, 'epoch': 0.4}
 40%|███▉      | 1369/3449 [1:04:46<1:43:14,  2.98s/it] 40%|███▉      | 1370/3449 [1:04:48<1:39:16,  2.87s/it]                                                       {'loss': 1.2911, 'learning_rate': 0.000274081717566688, 'epoch': 0.4}
 40%|███▉      | 1370/3449 [1:04:48<1:39:16,  2.87s/it] 40%|███▉      | 1371/3449 [1:04:51<1:34:13,  2.72s/it]                                                       {'loss': 1.3519, 'learning_rate': 0.0002739074163924524, 'epoch': 0.4}
 40%|███▉      | 1371/3449 [1:04:51<1:34:13,  2.72s/it] 40%|███▉      | 1372/3449 [1:04:54<1:40:04,  2.89s/it]                                                       {'loss': 1.3324, 'learning_rate': 0.0002737330501816752, 'epoch': 0.4}
 40%|███▉      | 1372/3449 [1:04:54<1:40:04,  2.89s/it] 40%|███▉      | 1373/3449 [1:04:57<1:37:15,  2.81s/it]                                                       {'loss': 1.2163, 'learning_rate': 0.00027355861908779397, 'epoch': 0.4}
 40%|███▉      | 1373/3449 [1:04:57<1:37:15,  2.81s/it] 40%|███▉      | 1374/3449 [1:04:59<1:35:05,  2.75s/it]                                                       {'loss': 1.2817, 'learning_rate': 0.0002733841232643033, 'epoch': 0.4}
 40%|███▉      | 1374/3449 [1:04:59<1:35:05,  2.75s/it] 40%|███▉      | 1375/3449 [1:05:03<1:43:41,  3.00s/it]                                                       {'loss': 1.1298, 'learning_rate': 0.0002732095628647549, 'epoch': 0.4}
 40%|███▉      | 1375/3449 [1:05:03<1:43:41,  3.00s/it] 40%|███▉      | 1376/3449 [1:05:05<1:37:54,  2.83s/it]                                                       {'loss': 1.3882, 'learning_rate': 0.00027303493804275736, 'epoch': 0.4}
 40%|███▉      | 1376/3449 [1:05:05<1:37:54,  2.83s/it] 40%|███▉      | 1377/3449 [1:05:08<1:32:21,  2.67s/it]                                                       {'loss': 1.2812, 'learning_rate': 0.0002728602489519756, 'epoch': 0.4}
 40%|███▉      | 1377/3449 [1:05:08<1:32:21,  2.67s/it] 40%|███▉      | 1378/3449 [1:05:10<1:30:05,  2.61s/it]                                                       {'loss': 1.2963, 'learning_rate': 0.00027268549574613153, 'epoch': 0.4}
 40%|███▉      | 1378/3449 [1:05:10<1:30:05,  2.61s/it] 40%|███▉      | 1379/3449 [1:05:13<1:28:36,  2.57s/it]                                                       {'loss': 1.4427, 'learning_rate': 0.00027251067857900305, 'epoch': 0.4}
 40%|███▉      | 1379/3449 [1:05:13<1:28:36,  2.57s/it] 40%|████      | 1380/3449 [1:05:15<1:27:53,  2.55s/it]                                                       {'loss': 1.2234, 'learning_rate': 0.00027233579760442485, 'epoch': 0.4}
 40%|████      | 1380/3449 [1:05:15<1:27:53,  2.55s/it] 40%|████      | 1381/3449 [1:05:20<1:49:01,  3.16s/it]                                                       {'loss': 1.4004, 'learning_rate': 0.0002721608529762873, 'epoch': 0.4}
 40%|████      | 1381/3449 [1:05:20<1:49:01,  3.16s/it] 40%|████      | 1382/3449 [1:05:22<1:42:33,  2.98s/it]                                                       {'loss': 1.2462, 'learning_rate': 0.00027198584484853703, 'epoch': 0.4}
 40%|████      | 1382/3449 [1:05:22<1:42:33,  2.98s/it] 40%|████      | 1383/3449 [1:05:25<1:37:34,  2.83s/it]                                                       {'loss': 1.3864, 'learning_rate': 0.00027181077337517644, 'epoch': 0.4}
 40%|████      | 1383/3449 [1:05:25<1:37:34,  2.83s/it] 40%|████      | 1384/3449 [1:05:28<1:44:53,  3.05s/it]                                                       {'loss': 1.2195, 'learning_rate': 0.00027163563871026377, 'epoch': 0.4}
 40%|████      | 1384/3449 [1:05:28<1:44:53,  3.05s/it] 40%|████      | 1385/3449 [1:05:32<1:49:06,  3.17s/it]                                                       {'loss': 1.4295, 'learning_rate': 0.00027146044100791287, 'epoch': 0.4}
 40%|████      | 1385/3449 [1:05:32<1:49:06,  3.17s/it] 40%|████      | 1386/3449 [1:05:35<1:52:07,  3.26s/it]                                                       {'loss': 1.4245, 'learning_rate': 0.000271285180422293, 'epoch': 0.4}
 40%|████      | 1386/3449 [1:05:35<1:52:07,  3.26s/it] 40%|████      | 1387/3449 [1:05:38<1:46:19,  3.09s/it]                                                       {'loss': 1.3367, 'learning_rate': 0.00027110985710762864, 'epoch': 0.4}
 40%|████      | 1387/3449 [1:05:38<1:46:19,  3.09s/it] 40%|████      | 1388/3449 [1:05:41<1:41:58,  2.97s/it]                                                       {'loss': 1.1771, 'learning_rate': 0.00027093447121819984, 'epoch': 0.4}
 40%|████      | 1388/3449 [1:05:41<1:41:58,  2.97s/it] 40%|████      | 1389/3449 [1:05:43<1:38:12,  2.86s/it]                                                       {'loss': 1.3098, 'learning_rate': 0.0002707590229083412, 'epoch': 0.4}
 40%|████      | 1389/3449 [1:05:43<1:38:12,  2.86s/it] 40%|████      | 1390/3449 [1:05:45<1:31:52,  2.68s/it]                                                       {'loss': 1.2718, 'learning_rate': 0.00027058351233244266, 'epoch': 0.4}
 40%|████      | 1390/3449 [1:05:45<1:31:52,  2.68s/it] 40%|████      | 1391/3449 [1:05:48<1:29:07,  2.60s/it]                                                       {'loss': 1.3501, 'learning_rate': 0.00027040793964494883, 'epoch': 0.4}
 40%|████      | 1391/3449 [1:05:48<1:29:07,  2.60s/it] 40%|████      | 1392/3449 [1:05:50<1:27:19,  2.55s/it]                                                       {'loss': 1.2444, 'learning_rate': 0.000270232305000359, 'epoch': 0.4}
 40%|████      | 1392/3449 [1:05:50<1:27:19,  2.55s/it] 40%|████      | 1393/3449 [1:05:53<1:31:07,  2.66s/it]                                                       {'loss': 1.4745, 'learning_rate': 0.00027005660855322676, 'epoch': 0.4}
 40%|████      | 1393/3449 [1:05:53<1:31:07,  2.66s/it] 40%|████      | 1394/3449 [1:05:56<1:31:04,  2.66s/it]                                                       {'loss': 1.2654, 'learning_rate': 0.00026988085045816045, 'epoch': 0.4}
 40%|████      | 1394/3449 [1:05:56<1:31:04,  2.66s/it] 40%|████      | 1395/3449 [1:05:58<1:30:12,  2.64s/it]                                                       {'loss': 1.2273, 'learning_rate': 0.0002697050308698224, 'epoch': 0.4}
 40%|████      | 1395/3449 [1:05:58<1:30:12,  2.64s/it] 40%|████      | 1396/3449 [1:06:02<1:35:16,  2.78s/it]                                                       {'loss': 1.1599, 'learning_rate': 0.0002695291499429291, 'epoch': 0.4}
 40%|████      | 1396/3449 [1:06:02<1:35:16,  2.78s/it] 41%|████      | 1397/3449 [1:06:04<1:36:41,  2.83s/it]                                                       {'loss': 1.228, 'learning_rate': 0.0002693532078322511, 'epoch': 0.4}
 41%|████      | 1397/3449 [1:06:05<1:36:41,  2.83s/it] 41%|████      | 1398/3449 [1:06:07<1:36:02,  2.81s/it]                                                       {'loss': 1.2249, 'learning_rate': 0.00026917720469261263, 'epoch': 0.41}
 41%|████      | 1398/3449 [1:06:07<1:36:02,  2.81s/it] 41%|████      | 1399/3449 [1:06:10<1:31:00,  2.66s/it]                                                       {'loss': 1.1718, 'learning_rate': 0.0002690011406788918, 'epoch': 0.41}
 41%|████      | 1399/3449 [1:06:10<1:31:00,  2.66s/it] 41%|████      | 1400/3449 [1:06:12<1:32:10,  2.70s/it]                                                       {'loss': 1.2489, 'learning_rate': 0.0002688250159460203, 'epoch': 0.41}
 41%|████      | 1400/3449 [1:06:12<1:32:10,  2.70s/it] 41%|████      | 1401/3449 [1:06:15<1:32:36,  2.71s/it]                                                       {'loss': 1.1626, 'learning_rate': 0.00026864883064898305, 'epoch': 0.41}
 41%|████      | 1401/3449 [1:06:15<1:32:36,  2.71s/it] 41%|████      | 1402/3449 [1:06:19<1:43:35,  3.04s/it]                                                       {'loss': 1.1026, 'learning_rate': 0.00026847258494281837, 'epoch': 0.41}
 41%|████      | 1402/3449 [1:06:19<1:43:35,  3.04s/it] 41%|████      | 1403/3449 [1:06:21<1:38:40,  2.89s/it]                                                       {'loss': 1.3496, 'learning_rate': 0.0002682962789826179, 'epoch': 0.41}
 41%|████      | 1403/3449 [1:06:21<1:38:40,  2.89s/it] 41%|████      | 1404/3449 [1:06:25<1:47:20,  3.15s/it]                                                       {'loss': 1.2368, 'learning_rate': 0.0002681199129235259, 'epoch': 0.41}
 41%|████      | 1404/3449 [1:06:25<1:47:20,  3.15s/it] 41%|████      | 1405/3449 [1:06:28<1:47:19,  3.15s/it]                                                       {'loss': 1.2877, 'learning_rate': 0.0002679434869207399, 'epoch': 0.41}
 41%|████      | 1405/3449 [1:06:28<1:47:19,  3.15s/it] 41%|████      | 1406/3449 [1:06:31<1:42:39,  3.02s/it]                                                       {'loss': 1.345, 'learning_rate': 0.0002677670011295101, 'epoch': 0.41}
 41%|████      | 1406/3449 [1:06:31<1:42:39,  3.02s/it] 41%|████      | 1407/3449 [1:06:34<1:37:18,  2.86s/it]                                                       {'loss': 1.3206, 'learning_rate': 0.0002675904557051392, 'epoch': 0.41}
 41%|████      | 1407/3449 [1:06:34<1:37:18,  2.86s/it] 41%|████      | 1408/3449 [1:06:36<1:37:41,  2.87s/it]                                                       {'loss': 1.3423, 'learning_rate': 0.0002674138508029824, 'epoch': 0.41}
 41%|████      | 1408/3449 [1:06:36<1:37:41,  2.87s/it] 41%|████      | 1409/3449 [1:06:39<1:33:11,  2.74s/it]                                                       {'loss': 1.321, 'learning_rate': 0.0002672371865784474, 'epoch': 0.41}
 41%|████      | 1409/3449 [1:06:39<1:33:11,  2.74s/it] 41%|████      | 1410/3449 [1:06:42<1:41:04,  2.97s/it]                                                       {'loss': 1.3775, 'learning_rate': 0.0002670604631869938, 'epoch': 0.41}
 41%|████      | 1410/3449 [1:06:42<1:41:04,  2.97s/it] 41%|████      | 1411/3449 [1:06:45<1:36:27,  2.84s/it]                                                       {'loss': 1.3151, 'learning_rate': 0.00026688368078413353, 'epoch': 0.41}
 41%|████      | 1411/3449 [1:06:45<1:36:27,  2.84s/it] 41%|████      | 1412/3449 [1:06:48<1:35:17,  2.81s/it]                                                       {'loss': 1.4244, 'learning_rate': 0.00026670683952543037, 'epoch': 0.41}
 41%|████      | 1412/3449 [1:06:48<1:35:17,  2.81s/it] 41%|████      | 1413/3449 [1:06:50<1:33:04,  2.74s/it]                                                       {'loss': 1.1129, 'learning_rate': 0.0002665299395664998, 'epoch': 0.41}
 41%|████      | 1413/3449 [1:06:50<1:33:04,  2.74s/it] 41%|████      | 1414/3449 [1:06:53<1:34:23,  2.78s/it]                                                       {'loss': 1.2802, 'learning_rate': 0.0002663529810630091, 'epoch': 0.41}
 41%|████      | 1414/3449 [1:06:53<1:34:23,  2.78s/it] 41%|████      | 1415/3449 [1:06:56<1:31:02,  2.69s/it]                                                       {'loss': 1.2053, 'learning_rate': 0.00026617596417067706, 'epoch': 0.41}
 41%|████      | 1415/3449 [1:06:56<1:31:02,  2.69s/it] 41%|████      | 1416/3449 [1:06:58<1:29:24,  2.64s/it]                                                       {'loss': 1.3049, 'learning_rate': 0.00026599888904527364, 'epoch': 0.41}
 41%|████      | 1416/3449 [1:06:58<1:29:24,  2.64s/it] 41%|████      | 1417/3449 [1:07:01<1:32:11,  2.72s/it]                                                       {'loss': 1.3669, 'learning_rate': 0.00026582175584262033, 'epoch': 0.41}
 41%|████      | 1417/3449 [1:07:01<1:32:11,  2.72s/it] 41%|████      | 1418/3449 [1:07:04<1:31:48,  2.71s/it]                                                       {'loss': 1.2236, 'learning_rate': 0.0002656445647185895, 'epoch': 0.41}
 41%|████      | 1418/3449 [1:07:04<1:31:48,  2.71s/it] 41%|████      | 1419/3449 [1:07:06<1:31:48,  2.71s/it]                                                       {'loss': 1.28, 'learning_rate': 0.0002654673158291046, 'epoch': 0.41}
 41%|████      | 1419/3449 [1:07:06<1:31:48,  2.71s/it] 41%|████      | 1420/3449 [1:07:09<1:27:17,  2.58s/it]                                                       {'loss': 1.3546, 'learning_rate': 0.00026529000933013996, 'epoch': 0.41}
 41%|████      | 1420/3449 [1:07:09<1:27:17,  2.58s/it] 41%|████      | 1421/3449 [1:07:11<1:27:14,  2.58s/it]                                                       {'loss': 1.229, 'learning_rate': 0.00026511264537772047, 'epoch': 0.41}
 41%|████      | 1421/3449 [1:07:11<1:27:14,  2.58s/it] 41%|████      | 1422/3449 [1:07:14<1:24:05,  2.49s/it]                                                       {'loss': 1.2918, 'learning_rate': 0.0002649352241279216, 'epoch': 0.41}
 41%|████      | 1422/3449 [1:07:14<1:24:05,  2.49s/it] 41%|████▏     | 1423/3449 [1:07:16<1:25:14,  2.52s/it]                                                       {'loss': 1.1362, 'learning_rate': 0.0002647577457368694, 'epoch': 0.41}
 41%|████▏     | 1423/3449 [1:07:16<1:25:14,  2.52s/it] 41%|████▏     | 1424/3449 [1:07:19<1:28:43,  2.63s/it]                                                       {'loss': 1.2805, 'learning_rate': 0.00026458021036074005, 'epoch': 0.41}
 41%|████▏     | 1424/3449 [1:07:19<1:28:43,  2.63s/it] 41%|████▏     | 1425/3449 [1:07:21<1:25:53,  2.55s/it]                                                       {'loss': 1.3399, 'learning_rate': 0.0002644026181557599, 'epoch': 0.41}
 41%|████▏     | 1425/3449 [1:07:21<1:25:53,  2.55s/it] 41%|████▏     | 1426/3449 [1:07:24<1:26:16,  2.56s/it]                                                       {'loss': 1.3102, 'learning_rate': 0.00026422496927820525, 'epoch': 0.41}
 41%|████▏     | 1426/3449 [1:07:24<1:26:16,  2.56s/it] 41%|████▏     | 1427/3449 [1:07:26<1:22:52,  2.46s/it]                                                       {'loss': 1.4234, 'learning_rate': 0.0002640472638844025, 'epoch': 0.41}
 41%|████▏     | 1427/3449 [1:07:26<1:22:52,  2.46s/it] 41%|████▏     | 1428/3449 [1:07:29<1:28:03,  2.61s/it]                                                       {'loss': 1.1533, 'learning_rate': 0.0002638695021307275, 'epoch': 0.41}
 41%|████▏     | 1428/3449 [1:07:29<1:28:03,  2.61s/it] 41%|████▏     | 1429/3449 [1:07:32<1:25:53,  2.55s/it]                                                       {'loss': 1.3985, 'learning_rate': 0.0002636916841736058, 'epoch': 0.41}
 41%|████▏     | 1429/3449 [1:07:32<1:25:53,  2.55s/it] 41%|████▏     | 1430/3449 [1:07:34<1:23:40,  2.49s/it]                                                       {'loss': 1.2707, 'learning_rate': 0.00026351381016951253, 'epoch': 0.41}
 41%|████▏     | 1430/3449 [1:07:34<1:23:40,  2.49s/it] 41%|████▏     | 1431/3449 [1:07:37<1:27:33,  2.60s/it]                                                       {'loss': 1.2683, 'learning_rate': 0.00026333588027497196, 'epoch': 0.41}
 41%|████▏     | 1431/3449 [1:07:37<1:27:33,  2.60s/it] 42%|████▏     | 1432/3449 [1:07:39<1:25:31,  2.54s/it]                                                       {'loss': 1.2254, 'learning_rate': 0.0002631578946465577, 'epoch': 0.42}
 42%|████▏     | 1432/3449 [1:07:39<1:25:31,  2.54s/it] 42%|████▏     | 1433/3449 [1:07:43<1:41:08,  3.01s/it]                                                       {'loss': 1.3023, 'learning_rate': 0.00026297985344089217, 'epoch': 0.42}
 42%|████▏     | 1433/3449 [1:07:43<1:41:08,  3.01s/it] 42%|████▏     | 1434/3449 [1:07:46<1:36:22,  2.87s/it]                                                       {'loss': 1.4252, 'learning_rate': 0.0002628017568146471, 'epoch': 0.42}
 42%|████▏     | 1434/3449 [1:07:46<1:36:22,  2.87s/it] 42%|████▏     | 1435/3449 [1:07:49<1:34:20,  2.81s/it]                                                       {'loss': 1.392, 'learning_rate': 0.0002626236049245425, 'epoch': 0.42}
 42%|████▏     | 1435/3449 [1:07:49<1:34:20,  2.81s/it] 42%|████▏     | 1436/3449 [1:07:51<1:32:39,  2.76s/it]                                                       {'loss': 1.2346, 'learning_rate': 0.0002624453979273473, 'epoch': 0.42}
 42%|████▏     | 1436/3449 [1:07:51<1:32:39,  2.76s/it] 42%|████▏     | 1437/3449 [1:07:54<1:33:36,  2.79s/it]                                                       {'loss': 1.4382, 'learning_rate': 0.00026226713597987894, 'epoch': 0.42}
 42%|████▏     | 1437/3449 [1:07:54<1:33:36,  2.79s/it] 42%|████▏     | 1438/3449 [1:07:58<1:41:21,  3.02s/it]                                                       {'loss': 1.2343, 'learning_rate': 0.0002620888192390031, 'epoch': 0.42}
 42%|████▏     | 1438/3449 [1:07:58<1:41:21,  3.02s/it] 42%|████▏     | 1439/3449 [1:08:00<1:38:12,  2.93s/it]                                                       {'loss': 1.469, 'learning_rate': 0.0002619104478616338, 'epoch': 0.42}
 42%|████▏     | 1439/3449 [1:08:00<1:38:12,  2.93s/it] 42%|████▏     | 1440/3449 [1:08:03<1:37:40,  2.92s/it]                                                       {'loss': 1.4174, 'learning_rate': 0.0002617320220047329, 'epoch': 0.42}
 42%|████▏     | 1440/3449 [1:08:03<1:37:40,  2.92s/it] 42%|████▏     | 1441/3449 [1:08:06<1:31:34,  2.74s/it]                                                       {'loss': 1.1898, 'learning_rate': 0.00026155354182531056, 'epoch': 0.42}
 42%|████▏     | 1441/3449 [1:08:06<1:31:34,  2.74s/it] 42%|████▏     | 1442/3449 [1:08:09<1:35:46,  2.86s/it]                                                       {'loss': 1.3007, 'learning_rate': 0.0002613750074804244, 'epoch': 0.42}
 42%|████▏     | 1442/3449 [1:08:09<1:35:46,  2.86s/it] 42%|████▏     | 1443/3449 [1:08:11<1:29:33,  2.68s/it]                                                       {'loss': 1.2316, 'learning_rate': 0.00026119641912717995, 'epoch': 0.42}
 42%|████▏     | 1443/3449 [1:08:11<1:29:33,  2.68s/it] 42%|████▏     | 1444/3449 [1:08:13<1:28:09,  2.64s/it]                                                       {'loss': 1.1826, 'learning_rate': 0.00026101777692273003, 'epoch': 0.42}
 42%|████▏     | 1444/3449 [1:08:13<1:28:09,  2.64s/it] 42%|████▏     | 1445/3449 [1:08:16<1:29:27,  2.68s/it]                                                       {'loss': 1.2212, 'learning_rate': 0.00026083908102427514, 'epoch': 0.42}
 42%|████▏     | 1445/3449 [1:08:16<1:29:27,  2.68s/it] 42%|████▏     | 1446/3449 [1:08:19<1:31:31,  2.74s/it]                                                       {'loss': 1.0836, 'learning_rate': 0.00026066033158906275, 'epoch': 0.42}
 42%|████▏     | 1446/3449 [1:08:19<1:31:31,  2.74s/it] 42%|████▏     | 1447/3449 [1:08:22<1:29:08,  2.67s/it]                                                       {'loss': 1.1287, 'learning_rate': 0.0002604815287743876, 'epoch': 0.42}
 42%|████▏     | 1447/3449 [1:08:22<1:29:08,  2.67s/it] 42%|████▏     | 1448/3449 [1:08:24<1:27:54,  2.64s/it]                                                       {'loss': 1.2268, 'learning_rate': 0.00026030267273759134, 'epoch': 0.42}
 42%|████▏     | 1448/3449 [1:08:24<1:27:54,  2.64s/it] 42%|████▏     | 1449/3449 [1:08:27<1:26:28,  2.59s/it]                                                       {'loss': 1.2117, 'learning_rate': 0.0002601237636360626, 'epoch': 0.42}
 42%|████▏     | 1449/3449 [1:08:27<1:26:28,  2.59s/it] 42%|████▏     | 1450/3449 [1:08:29<1:27:50,  2.64s/it]                                                       {'loss': 1.2665, 'learning_rate': 0.00025994480162723645, 'epoch': 0.42}
 42%|████▏     | 1450/3449 [1:08:29<1:27:50,  2.64s/it] 42%|████▏     | 1451/3449 [1:08:32<1:26:52,  2.61s/it]                                                       {'loss': 1.405, 'learning_rate': 0.00025976578686859466, 'epoch': 0.42}
 42%|████▏     | 1451/3449 [1:08:32<1:26:52,  2.61s/it] 42%|████▏     | 1452/3449 [1:08:35<1:30:50,  2.73s/it]                                                       {'loss': 1.2319, 'learning_rate': 0.0002595867195176655, 'epoch': 0.42}
 42%|████▏     | 1452/3449 [1:08:35<1:30:50,  2.73s/it] 42%|████▏     | 1453/3449 [1:08:38<1:28:48,  2.67s/it]                                                       {'loss': 1.2847, 'learning_rate': 0.0002594075997320234, 'epoch': 0.42}
 42%|████▏     | 1453/3449 [1:08:38<1:28:48,  2.67s/it] 42%|████▏     | 1454/3449 [1:08:40<1:28:09,  2.65s/it]                                                       {'loss': 1.4436, 'learning_rate': 0.0002592284276692889, 'epoch': 0.42}
 42%|████▏     | 1454/3449 [1:08:40<1:28:09,  2.65s/it] 42%|████▏     | 1455/3449 [1:08:43<1:35:08,  2.86s/it]                                                       {'loss': 1.2914, 'learning_rate': 0.00025904920348712864, 'epoch': 0.42}
 42%|████▏     | 1455/3449 [1:08:43<1:35:08,  2.86s/it] 42%|████▏     | 1456/3449 [1:08:49<1:57:01,  3.52s/it]                                                       {'loss': 1.0885, 'learning_rate': 0.0002588699273432551, 'epoch': 0.42}
 42%|████▏     | 1456/3449 [1:08:49<1:57:01,  3.52s/it] 42%|████▏     | 1457/3449 [1:08:51<1:50:55,  3.34s/it]                                                       {'loss': 1.3028, 'learning_rate': 0.00025869059939542647, 'epoch': 0.42}
 42%|████▏     | 1457/3449 [1:08:51<1:50:55,  3.34s/it] 42%|████▏     | 1458/3449 [1:08:54<1:40:46,  3.04s/it]                                                       {'loss': 1.2751, 'learning_rate': 0.00025851121980144647, 'epoch': 0.42}
 42%|████▏     | 1458/3449 [1:08:54<1:40:46,  3.04s/it] 42%|████▏     | 1459/3449 [1:08:57<1:38:53,  2.98s/it]                                                       {'loss': 1.1309, 'learning_rate': 0.00025833178871916446, 'epoch': 0.42}
 42%|████▏     | 1459/3449 [1:08:57<1:38:53,  2.98s/it] 42%|████▏     | 1460/3449 [1:08:59<1:31:54,  2.77s/it]                                                       {'loss': 1.4444, 'learning_rate': 0.0002581523063064748, 'epoch': 0.42}
 42%|████▏     | 1460/3449 [1:08:59<1:31:54,  2.77s/it] 42%|████▏     | 1461/3449 [1:09:02<1:30:06,  2.72s/it]                                                       {'loss': 1.1246, 'learning_rate': 0.00025797277272131736, 'epoch': 0.42}
 42%|████▏     | 1461/3449 [1:09:02<1:30:06,  2.72s/it] 42%|████▏     | 1462/3449 [1:09:05<1:33:56,  2.84s/it]                                                       {'loss': 1.4859, 'learning_rate': 0.00025779318812167674, 'epoch': 0.42}
 42%|████▏     | 1462/3449 [1:09:05<1:33:56,  2.84s/it] 42%|████▏     | 1463/3449 [1:09:07<1:31:45,  2.77s/it]                                                       {'loss': 1.2375, 'learning_rate': 0.00025761355266558264, 'epoch': 0.42}
 42%|████▏     | 1463/3449 [1:09:07<1:31:45,  2.77s/it] 42%|████▏     | 1464/3449 [1:09:10<1:34:39,  2.86s/it]                                                       {'loss': 1.3053, 'learning_rate': 0.00025743386651110945, 'epoch': 0.42}
 42%|████▏     | 1464/3449 [1:09:10<1:34:39,  2.86s/it] 42%|████▏     | 1465/3449 [1:09:13<1:29:36,  2.71s/it]                                                       {'loss': 1.3145, 'learning_rate': 0.0002572541298163761, 'epoch': 0.42}
 42%|████▏     | 1465/3449 [1:09:13<1:29:36,  2.71s/it] 43%|████▎     | 1466/3449 [1:09:15<1:28:59,  2.69s/it]                                                       {'loss': 1.4664, 'learning_rate': 0.0002570743427395461, 'epoch': 0.42}
 43%|████▎     | 1466/3449 [1:09:15<1:28:59,  2.69s/it] 43%|████▎     | 1467/3449 [1:09:18<1:31:53,  2.78s/it]                                                       {'loss': 1.2516, 'learning_rate': 0.0002568945054388272, 'epoch': 0.43}
 43%|████▎     | 1467/3449 [1:09:18<1:31:53,  2.78s/it] 43%|████▎     | 1468/3449 [1:09:21<1:32:07,  2.79s/it]                                                       {'loss': 1.2222, 'learning_rate': 0.0002567146180724714, 'epoch': 0.43}
 43%|████▎     | 1468/3449 [1:09:21<1:32:07,  2.79s/it] 43%|████▎     | 1469/3449 [1:09:24<1:29:53,  2.72s/it]                                                       {'loss': 1.1783, 'learning_rate': 0.0002565346807987748, 'epoch': 0.43}
 43%|████▎     | 1469/3449 [1:09:24<1:29:53,  2.72s/it] 43%|████▎     | 1470/3449 [1:09:27<1:36:14,  2.92s/it]                                                       {'loss': 1.1859, 'learning_rate': 0.00025635469377607736, 'epoch': 0.43}
 43%|████▎     | 1470/3449 [1:09:27<1:36:14,  2.92s/it] 43%|████▎     | 1471/3449 [1:09:30<1:36:06,  2.92s/it]                                                       {'loss': 1.3463, 'learning_rate': 0.0002561746571627629, 'epoch': 0.43}
 43%|████▎     | 1471/3449 [1:09:30<1:36:06,  2.92s/it] 43%|████▎     | 1472/3449 [1:09:33<1:37:42,  2.97s/it]                                                       {'loss': 1.2379, 'learning_rate': 0.0002559945711172587, 'epoch': 0.43}
 43%|████▎     | 1472/3449 [1:09:33<1:37:42,  2.97s/it] 43%|████▎     | 1473/3449 [1:09:37<1:45:08,  3.19s/it]                                                       {'loss': 1.3192, 'learning_rate': 0.0002558144357980355, 'epoch': 0.43}
 43%|████▎     | 1473/3449 [1:09:37<1:45:08,  3.19s/it] 43%|████▎     | 1474/3449 [1:09:39<1:36:49,  2.94s/it]                                                       {'loss': 1.2627, 'learning_rate': 0.00025563425136360785, 'epoch': 0.43}
 43%|████▎     | 1474/3449 [1:09:39<1:36:49,  2.94s/it] 43%|████▎     | 1475/3449 [1:09:42<1:31:38,  2.79s/it]                                                       {'loss': 1.5463, 'learning_rate': 0.00025545401797253303, 'epoch': 0.43}
 43%|████▎     | 1475/3449 [1:09:42<1:31:38,  2.79s/it] 43%|████▎     | 1476/3449 [1:09:45<1:33:39,  2.85s/it]                                                       {'loss': 1.0699, 'learning_rate': 0.0002552737357834116, 'epoch': 0.43}
 43%|████▎     | 1476/3449 [1:09:45<1:33:39,  2.85s/it] 43%|████▎     | 1477/3449 [1:09:47<1:33:15,  2.84s/it]                                                       {'loss': 1.4229, 'learning_rate': 0.0002550934049548871, 'epoch': 0.43}
 43%|████▎     | 1477/3449 [1:09:47<1:33:15,  2.84s/it] 43%|████▎     | 1478/3449 [1:09:50<1:30:24,  2.75s/it]                                                       {'loss': 1.2421, 'learning_rate': 0.00025491302564564577, 'epoch': 0.43}
 43%|████▎     | 1478/3449 [1:09:50<1:30:24,  2.75s/it] 43%|████▎     | 1479/3449 [1:09:52<1:27:15,  2.66s/it]                                                       {'loss': 1.3587, 'learning_rate': 0.0002547325980144166, 'epoch': 0.43}
 43%|████▎     | 1479/3449 [1:09:52<1:27:15,  2.66s/it] 43%|████▎     | 1480/3449 [1:09:55<1:27:04,  2.65s/it]                                                       {'loss': 1.3002, 'learning_rate': 0.00025455212221997097, 'epoch': 0.43}
 43%|████▎     | 1480/3449 [1:09:55<1:27:04,  2.65s/it] 43%|████▎     | 1481/3449 [1:09:58<1:25:34,  2.61s/it]                                                       {'loss': 1.3108, 'learning_rate': 0.00025437159842112286, 'epoch': 0.43}
 43%|████▎     | 1481/3449 [1:09:58<1:25:34,  2.61s/it] 43%|████▎     | 1482/3449 [1:10:00<1:24:37,  2.58s/it]                                                       {'loss': 1.3039, 'learning_rate': 0.00025419102677672826, 'epoch': 0.43}
 43%|████▎     | 1482/3449 [1:10:00<1:24:37,  2.58s/it] 43%|████▎     | 1483/3449 [1:10:03<1:25:05,  2.60s/it]                                                       {'loss': 1.2134, 'learning_rate': 0.00025401040744568547, 'epoch': 0.43}
 43%|████▎     | 1483/3449 [1:10:03<1:25:05,  2.60s/it] 43%|████▎     | 1484/3449 [1:10:05<1:26:26,  2.64s/it]                                                       {'loss': 1.2693, 'learning_rate': 0.00025382974058693456, 'epoch': 0.43}
 43%|████▎     | 1484/3449 [1:10:05<1:26:26,  2.64s/it] 43%|████▎     | 1485/3449 [1:10:08<1:28:33,  2.71s/it]                                                       {'loss': 1.136, 'learning_rate': 0.0002536490263594575, 'epoch': 0.43}
 43%|████▎     | 1485/3449 [1:10:08<1:28:33,  2.71s/it] 43%|████▎     | 1486/3449 [1:10:11<1:25:52,  2.63s/it]                                                       {'loss': 1.3232, 'learning_rate': 0.0002534682649222781, 'epoch': 0.43}
 43%|████▎     | 1486/3449 [1:10:11<1:25:52,  2.63s/it] 43%|████▎     | 1487/3449 [1:10:13<1:25:54,  2.63s/it]                                                       {'loss': 1.3243, 'learning_rate': 0.0002532874564344613, 'epoch': 0.43}
 43%|████▎     | 1487/3449 [1:10:13<1:25:54,  2.63s/it] 43%|████▎     | 1488/3449 [1:10:16<1:25:37,  2.62s/it]                                                       {'loss': 1.3572, 'learning_rate': 0.000253106601055114, 'epoch': 0.43}
 43%|████▎     | 1488/3449 [1:10:16<1:25:37,  2.62s/it] 43%|████▎     | 1489/3449 [1:10:19<1:32:19,  2.83s/it]                                                       {'loss': 1.3136, 'learning_rate': 0.0002529256989433839, 'epoch': 0.43}
 43%|████▎     | 1489/3449 [1:10:19<1:32:19,  2.83s/it] 43%|████▎     | 1490/3449 [1:10:22<1:27:26,  2.68s/it]                                                       {'loss': 1.2716, 'learning_rate': 0.0002527447502584601, 'epoch': 0.43}
 43%|████▎     | 1490/3449 [1:10:22<1:27:26,  2.68s/it] 43%|████▎     | 1491/3449 [1:10:25<1:32:13,  2.83s/it]                                                       {'loss': 1.3324, 'learning_rate': 0.0002525637551595726, 'epoch': 0.43}
 43%|████▎     | 1491/3449 [1:10:25<1:32:13,  2.83s/it] 43%|████▎     | 1492/3449 [1:10:27<1:28:21,  2.71s/it]                                                       {'loss': 1.358, 'learning_rate': 0.00025238271380599207, 'epoch': 0.43}
 43%|████▎     | 1492/3449 [1:10:27<1:28:21,  2.71s/it] 43%|████▎     | 1493/3449 [1:10:30<1:27:32,  2.69s/it]                                                       {'loss': 1.2872, 'learning_rate': 0.00025220162635703023, 'epoch': 0.43}
 43%|████▎     | 1493/3449 [1:10:30<1:27:32,  2.69s/it] 43%|████▎     | 1494/3449 [1:10:33<1:30:37,  2.78s/it]                                                       {'loss': 1.2299, 'learning_rate': 0.000252020492972039, 'epoch': 0.43}
 43%|████▎     | 1494/3449 [1:10:33<1:30:37,  2.78s/it] 43%|████▎     | 1495/3449 [1:10:35<1:25:01,  2.61s/it]                                                       {'loss': 1.3384, 'learning_rate': 0.000251839313810411, 'epoch': 0.43}
 43%|████▎     | 1495/3449 [1:10:35<1:25:01,  2.61s/it] 43%|████▎     | 1496/3449 [1:10:37<1:19:35,  2.45s/it]                                                       {'loss': 1.4771, 'learning_rate': 0.000251658089031579, 'epoch': 0.43}
 43%|████▎     | 1496/3449 [1:10:37<1:19:35,  2.45s/it] 43%|████▎     | 1497/3449 [1:10:40<1:24:06,  2.59s/it]                                                       {'loss': 1.3173, 'learning_rate': 0.000251476818795016, 'epoch': 0.43}
 43%|████▎     | 1497/3449 [1:10:40<1:24:06,  2.59s/it] 43%|████▎     | 1498/3449 [1:10:43<1:29:42,  2.76s/it]                                                       {'loss': 1.2148, 'learning_rate': 0.0002512955032602348, 'epoch': 0.43}
 43%|████▎     | 1498/3449 [1:10:43<1:29:42,  2.76s/it] 43%|████▎     | 1499/3449 [1:10:46<1:25:47,  2.64s/it]                                                       {'loss': 1.2605, 'learning_rate': 0.00025111414258678833, 'epoch': 0.43}
 43%|████▎     | 1499/3449 [1:10:46<1:25:47,  2.64s/it] 43%|████▎     | 1500/3449 [1:10:49<1:29:21,  2.75s/it]                                                       {'loss': 1.1375, 'learning_rate': 0.0002509327369342691, 'epoch': 0.43}
 43%|████▎     | 1500/3449 [1:10:49<1:29:21,  2.75s/it] 44%|████▎     | 1501/3449 [1:10:51<1:26:05,  2.65s/it]                                                       {'loss': 1.1814, 'learning_rate': 0.00025075128646230907, 'epoch': 0.44}
 44%|████▎     | 1501/3449 [1:10:51<1:26:05,  2.65s/it] 44%|████▎     | 1502/3449 [1:10:54<1:27:06,  2.68s/it]                                                       {'loss': 1.2528, 'learning_rate': 0.0002505697913305799, 'epoch': 0.44}
 44%|████▎     | 1502/3449 [1:10:54<1:27:06,  2.68s/it] 44%|████▎     | 1503/3449 [1:10:57<1:36:36,  2.98s/it]                                                       {'loss': 1.2179, 'learning_rate': 0.00025038825169879255, 'epoch': 0.44}
 44%|████▎     | 1503/3449 [1:10:57<1:36:36,  2.98s/it] 44%|████▎     | 1504/3449 [1:11:00<1:34:23,  2.91s/it]                                                       {'loss': 1.2665, 'learning_rate': 0.0002502066677266968, 'epoch': 0.44}
 44%|████▎     | 1504/3449 [1:11:00<1:34:23,  2.91s/it] 44%|████▎     | 1505/3449 [1:11:03<1:30:16,  2.79s/it]                                                       {'loss': 1.2886, 'learning_rate': 0.00025002503957408177, 'epoch': 0.44}
 44%|████▎     | 1505/3449 [1:11:03<1:30:16,  2.79s/it] 44%|████▎     | 1506/3449 [1:11:05<1:26:01,  2.66s/it]                                                       {'loss': 1.186, 'learning_rate': 0.0002498433674007753, 'epoch': 0.44}
 44%|████▎     | 1506/3449 [1:11:05<1:26:01,  2.66s/it] 44%|████▎     | 1507/3449 [1:11:08<1:31:19,  2.82s/it]                                                       {'loss': 1.2297, 'learning_rate': 0.00024966165136664414, 'epoch': 0.44}
 44%|████▎     | 1507/3449 [1:11:08<1:31:19,  2.82s/it] 44%|████▎     | 1508/3449 [1:11:11<1:27:30,  2.71s/it]                                                       {'loss': 1.4288, 'learning_rate': 0.00024947989163159347, 'epoch': 0.44}
 44%|████▎     | 1508/3449 [1:11:11<1:27:30,  2.71s/it] 44%|████▍     | 1509/3449 [1:11:13<1:25:47,  2.65s/it]                                                       {'loss': 1.3706, 'learning_rate': 0.0002492980883555669, 'epoch': 0.44}
 44%|████▍     | 1509/3449 [1:11:13<1:25:47,  2.65s/it] 44%|████▍     | 1510/3449 [1:11:16<1:28:09,  2.73s/it]                                                       {'loss': 1.396, 'learning_rate': 0.0002491162416985465, 'epoch': 0.44}
 44%|████▍     | 1510/3449 [1:11:16<1:28:09,  2.73s/it] 44%|████▍     | 1511/3449 [1:11:19<1:28:43,  2.75s/it]                                                       {'loss': 1.255, 'learning_rate': 0.0002489343518205525, 'epoch': 0.44}
 44%|████▍     | 1511/3449 [1:11:19<1:28:43,  2.75s/it] 44%|████▍     | 1512/3449 [1:11:21<1:26:17,  2.67s/it]                                                       {'loss': 1.498, 'learning_rate': 0.0002487524188816429, 'epoch': 0.44}
 44%|████▍     | 1512/3449 [1:11:21<1:26:17,  2.67s/it] 44%|████▍     | 1513/3449 [1:11:24<1:23:34,  2.59s/it]                                                       {'loss': 1.4793, 'learning_rate': 0.00024857044304191407, 'epoch': 0.44}
 44%|████▍     | 1513/3449 [1:11:24<1:23:34,  2.59s/it] 44%|████▍     | 1514/3449 [1:11:27<1:26:14,  2.67s/it]                                                       {'loss': 1.3647, 'learning_rate': 0.00024838842446149963, 'epoch': 0.44}
 44%|████▍     | 1514/3449 [1:11:27<1:26:14,  2.67s/it] 44%|████▍     | 1515/3449 [1:11:30<1:30:46,  2.82s/it]                                                       {'loss': 1.0928, 'learning_rate': 0.0002482063633005712, 'epoch': 0.44}
 44%|████▍     | 1515/3449 [1:11:30<1:30:46,  2.82s/it] 44%|████▍     | 1516/3449 [1:11:32<1:26:32,  2.69s/it]                                                       {'loss': 1.2955, 'learning_rate': 0.0002480242597193376, 'epoch': 0.44}
 44%|████▍     | 1516/3449 [1:11:32<1:26:32,  2.69s/it] 44%|████▍     | 1517/3449 [1:11:35<1:28:56,  2.76s/it]                                                       {'loss': 1.225, 'learning_rate': 0.00024784211387804525, 'epoch': 0.44}
 44%|████▍     | 1517/3449 [1:11:35<1:28:56,  2.76s/it] 44%|████▍     | 1518/3449 [1:11:38<1:28:49,  2.76s/it]                                                       {'loss': 1.2221, 'learning_rate': 0.0002476599259369775, 'epoch': 0.44}
 44%|████▍     | 1518/3449 [1:11:38<1:28:49,  2.76s/it] 44%|████▍     | 1519/3449 [1:11:41<1:34:01,  2.92s/it]                                                       {'loss': 1.2738, 'learning_rate': 0.00024747769605645473, 'epoch': 0.44}
 44%|████▍     | 1519/3449 [1:11:41<1:34:01,  2.92s/it] 44%|████▍     | 1520/3449 [1:11:44<1:28:57,  2.77s/it]                                                       {'loss': 1.3595, 'learning_rate': 0.00024729542439683454, 'epoch': 0.44}
 44%|████▍     | 1520/3449 [1:11:44<1:28:57,  2.77s/it] 44%|████▍     | 1521/3449 [1:11:48<1:49:33,  3.41s/it]                                                       {'loss': 1.3011, 'learning_rate': 0.00024711311111851096, 'epoch': 0.44}
 44%|████▍     | 1521/3449 [1:11:48<1:49:33,  3.41s/it] 44%|████▍     | 1522/3449 [1:11:52<1:55:29,  3.60s/it]                                                       {'loss': 1.156, 'learning_rate': 0.00024693075638191486, 'epoch': 0.44}
 44%|████▍     | 1522/3449 [1:11:52<1:55:29,  3.60s/it] 44%|████▍     | 1523/3449 [1:11:56<1:50:33,  3.44s/it]                                                       {'loss': 1.3377, 'learning_rate': 0.0002467483603475135, 'epoch': 0.44}
 44%|████▍     | 1523/3449 [1:11:56<1:50:33,  3.44s/it] 44%|████▍     | 1524/3449 [1:11:58<1:38:30,  3.07s/it]                                                       {'loss': 1.1649, 'learning_rate': 0.0002465659231758104, 'epoch': 0.44}
 44%|████▍     | 1524/3449 [1:11:58<1:38:30,  3.07s/it] 44%|████▍     | 1525/3449 [1:12:01<1:38:41,  3.08s/it]                                                       {'loss': 1.2601, 'learning_rate': 0.0002463834450273455, 'epoch': 0.44}
 44%|████▍     | 1525/3449 [1:12:01<1:38:41,  3.08s/it] 44%|████▍     | 1526/3449 [1:12:03<1:31:48,  2.86s/it]                                                       {'loss': 1.2853, 'learning_rate': 0.00024620092606269465, 'epoch': 0.44}
 44%|████▍     | 1526/3449 [1:12:03<1:31:48,  2.86s/it] 44%|████▍     | 1527/3449 [1:12:06<1:30:20,  2.82s/it]                                                       {'loss': 1.1838, 'learning_rate': 0.0002460183664424695, 'epoch': 0.44}
 44%|████▍     | 1527/3449 [1:12:06<1:30:20,  2.82s/it] 44%|████▍     | 1528/3449 [1:12:11<1:52:28,  3.51s/it]                                                       {'loss': 1.039, 'learning_rate': 0.00024583576632731776, 'epoch': 0.44}
 44%|████▍     | 1528/3449 [1:12:11<1:52:28,  3.51s/it] 44%|████▍     | 1529/3449 [1:12:14<1:43:07,  3.22s/it]                                                       {'loss': 1.2585, 'learning_rate': 0.0002456531258779226, 'epoch': 0.44}
 44%|████▍     | 1529/3449 [1:12:14<1:43:07,  3.22s/it] 44%|████▍     | 1530/3449 [1:12:17<1:43:26,  3.23s/it]                                                       {'loss': 1.373, 'learning_rate': 0.00024547044525500265, 'epoch': 0.44}
 44%|████▍     | 1530/3449 [1:12:17<1:43:26,  3.23s/it] 44%|████▍     | 1531/3449 [1:12:19<1:36:07,  3.01s/it]                                                       {'loss': 1.3463, 'learning_rate': 0.000245287724619312, 'epoch': 0.44}
 44%|████▍     | 1531/3449 [1:12:19<1:36:07,  3.01s/it] 44%|████▍     | 1532/3449 [1:12:22<1:30:23,  2.83s/it]                                                       {'loss': 1.4139, 'learning_rate': 0.0002451049641316399, 'epoch': 0.44}
 44%|████▍     | 1532/3449 [1:12:22<1:30:23,  2.83s/it] 44%|████▍     | 1533/3449 [1:12:25<1:34:44,  2.97s/it]                                                       {'loss': 1.3381, 'learning_rate': 0.00024492216395281076, 'epoch': 0.44}
 44%|████▍     | 1533/3449 [1:12:25<1:34:44,  2.97s/it] 44%|████▍     | 1534/3449 [1:12:28<1:34:00,  2.95s/it]                                                       {'loss': 1.3236, 'learning_rate': 0.0002447393242436836, 'epoch': 0.44}
 44%|████▍     | 1534/3449 [1:12:28<1:34:00,  2.95s/it] 45%|████▍     | 1535/3449 [1:12:30<1:29:21,  2.80s/it]                                                       {'loss': 1.2707, 'learning_rate': 0.00024455644516515273, 'epoch': 0.44}
 45%|████▍     | 1535/3449 [1:12:30<1:29:21,  2.80s/it] 45%|████▍     | 1536/3449 [1:12:33<1:25:09,  2.67s/it]                                                       {'loss': 1.3322, 'learning_rate': 0.00024437352687814657, 'epoch': 0.45}
 45%|████▍     | 1536/3449 [1:12:33<1:25:09,  2.67s/it] 45%|████▍     | 1537/3449 [1:12:35<1:25:07,  2.67s/it]                                                       {'loss': 1.2577, 'learning_rate': 0.00024419056954362844, 'epoch': 0.45}
 45%|████▍     | 1537/3449 [1:12:35<1:25:07,  2.67s/it] 45%|████▍     | 1538/3449 [1:12:39<1:30:09,  2.83s/it]                                                       {'loss': 1.2023, 'learning_rate': 0.00024400757332259586, 'epoch': 0.45}
 45%|████▍     | 1538/3449 [1:12:39<1:30:09,  2.83s/it] 45%|████▍     | 1539/3449 [1:12:42<1:38:10,  3.08s/it]                                                       {'loss': 1.2588, 'learning_rate': 0.0002438245383760806, 'epoch': 0.45}
 45%|████▍     | 1539/3449 [1:12:42<1:38:10,  3.08s/it] 45%|████▍     | 1540/3449 [1:12:45<1:31:10,  2.87s/it]                                                       {'loss': 1.2778, 'learning_rate': 0.00024364146486514853, 'epoch': 0.45}
 45%|████▍     | 1540/3449 [1:12:45<1:31:10,  2.87s/it] 45%|████▍     | 1541/3449 [1:12:48<1:36:31,  3.04s/it]                                                       {'loss': 1.38, 'learning_rate': 0.00024345835295089927, 'epoch': 0.45}
 45%|████▍     | 1541/3449 [1:12:48<1:36:31,  3.04s/it] 45%|████▍     | 1542/3449 [1:12:51<1:35:21,  3.00s/it]                                                       {'loss': 1.2384, 'learning_rate': 0.0002432752027944666, 'epoch': 0.45}
 45%|████▍     | 1542/3449 [1:12:51<1:35:21,  3.00s/it] 45%|████▍     | 1543/3449 [1:12:54<1:30:48,  2.86s/it]                                                       {'loss': 1.1527, 'learning_rate': 0.0002430920145570176, 'epoch': 0.45}
 45%|████▍     | 1543/3449 [1:12:54<1:30:48,  2.86s/it] 45%|████▍     | 1544/3449 [1:12:56<1:26:26,  2.72s/it]                                                       {'loss': 1.2395, 'learning_rate': 0.00024290878839975305, 'epoch': 0.45}
 45%|████▍     | 1544/3449 [1:12:56<1:26:26,  2.72s/it] 45%|████▍     | 1545/3449 [1:13:00<1:35:20,  3.00s/it]                                                       {'loss': 1.4901, 'learning_rate': 0.00024272552448390697, 'epoch': 0.45}
 45%|████▍     | 1545/3449 [1:13:00<1:35:20,  3.00s/it] 45%|████▍     | 1546/3449 [1:13:03<1:35:34,  3.01s/it]                                                       {'loss': 1.1814, 'learning_rate': 0.0002425422229707468, 'epoch': 0.45}
 45%|████▍     | 1546/3449 [1:13:03<1:35:34,  3.01s/it] 45%|████▍     | 1547/3449 [1:13:06<1:35:43,  3.02s/it]                                                       {'loss': 1.2667, 'learning_rate': 0.00024235888402157293, 'epoch': 0.45}
 45%|████▍     | 1547/3449 [1:13:06<1:35:43,  3.02s/it] 45%|████▍     | 1548/3449 [1:13:09<1:39:35,  3.14s/it]                                                       {'loss': 1.3515, 'learning_rate': 0.00024217550779771858, 'epoch': 0.45}
 45%|████▍     | 1548/3449 [1:13:09<1:39:35,  3.14s/it] 45%|████▍     | 1549/3449 [1:13:12<1:34:59,  3.00s/it]                                                       {'loss': 1.3413, 'learning_rate': 0.00024199209446055004, 'epoch': 0.45}
 45%|████▍     | 1549/3449 [1:13:12<1:34:59,  3.00s/it] 45%|████▍     | 1550/3449 [1:13:14<1:29:46,  2.84s/it]                                                       {'loss': 1.4546, 'learning_rate': 0.00024180864417146613, 'epoch': 0.45}
 45%|████▍     | 1550/3449 [1:13:14<1:29:46,  2.84s/it] 45%|████▍     | 1551/3449 [1:13:17<1:31:29,  2.89s/it]                                                       {'loss': 1.2312, 'learning_rate': 0.00024162515709189812, 'epoch': 0.45}
 45%|████▍     | 1551/3449 [1:13:17<1:31:29,  2.89s/it] 45%|████▍     | 1552/3449 [1:13:20<1:31:37,  2.90s/it]                                                       {'loss': 1.0816, 'learning_rate': 0.00024144163338330965, 'epoch': 0.45}
 45%|████▍     | 1552/3449 [1:13:20<1:31:37,  2.90s/it] 45%|████▌     | 1553/3449 [1:13:23<1:27:37,  2.77s/it]                                                       {'loss': 1.3829, 'learning_rate': 0.0002412580732071968, 'epoch': 0.45}
 45%|████▌     | 1553/3449 [1:13:23<1:27:37,  2.77s/it] 45%|████▌     | 1554/3449 [1:13:25<1:25:30,  2.71s/it]                                                       {'loss': 1.1685, 'learning_rate': 0.00024107447672508747, 'epoch': 0.45}
 45%|████▌     | 1554/3449 [1:13:25<1:25:30,  2.71s/it] 45%|████▌     | 1555/3449 [1:13:28<1:25:48,  2.72s/it]                                                       {'loss': 1.2811, 'learning_rate': 0.00024089084409854175, 'epoch': 0.45}
 45%|████▌     | 1555/3449 [1:13:28<1:25:48,  2.72s/it] 45%|████▌     | 1556/3449 [1:13:30<1:20:20,  2.55s/it]                                                       {'loss': 1.2654, 'learning_rate': 0.00024070717548915126, 'epoch': 0.45}
 45%|████▌     | 1556/3449 [1:13:30<1:20:20,  2.55s/it] 45%|████▌     | 1557/3449 [1:13:33<1:27:29,  2.77s/it]                                                       {'loss': 1.3404, 'learning_rate': 0.00024052347105853962, 'epoch': 0.45}
 45%|████▌     | 1557/3449 [1:13:33<1:27:29,  2.77s/it] 45%|████▌     | 1558/3449 [1:13:36<1:27:48,  2.79s/it]                                                       {'loss': 1.3266, 'learning_rate': 0.00024033973096836166, 'epoch': 0.45}
 45%|████▌     | 1558/3449 [1:13:36<1:27:48,  2.79s/it] 45%|████▌     | 1559/3449 [1:13:39<1:28:07,  2.80s/it]                                                       {'loss': 1.2525, 'learning_rate': 0.00024015595538030385, 'epoch': 0.45}
 45%|████▌     | 1559/3449 [1:13:39<1:28:07,  2.80s/it] 45%|████▌     | 1560/3449 [1:13:42<1:25:44,  2.72s/it]                                                       {'loss': 1.2767, 'learning_rate': 0.00023997214445608362, 'epoch': 0.45}
 45%|████▌     | 1560/3449 [1:13:42<1:25:44,  2.72s/it] 45%|████▌     | 1561/3449 [1:13:44<1:24:39,  2.69s/it]                                                       {'loss': 1.2979, 'learning_rate': 0.00023978829835744975, 'epoch': 0.45}
 45%|████▌     | 1561/3449 [1:13:44<1:24:39,  2.69s/it] 45%|████▌     | 1562/3449 [1:13:47<1:23:34,  2.66s/it]                                                       {'loss': 1.2431, 'learning_rate': 0.00023960441724618195, 'epoch': 0.45}
 45%|████▌     | 1562/3449 [1:13:47<1:23:34,  2.66s/it] 45%|████▌     | 1563/3449 [1:13:49<1:20:15,  2.55s/it]                                                       {'loss': 1.2869, 'learning_rate': 0.0002394205012840904, 'epoch': 0.45}
 45%|████▌     | 1563/3449 [1:13:49<1:20:15,  2.55s/it] 45%|████▌     | 1564/3449 [1:13:52<1:21:19,  2.59s/it]                                                       {'loss': 1.199, 'learning_rate': 0.0002392365506330165, 'epoch': 0.45}
 45%|████▌     | 1564/3449 [1:13:52<1:21:19,  2.59s/it] 45%|████▌     | 1565/3449 [1:13:54<1:21:03,  2.58s/it]                                                       {'loss': 1.3731, 'learning_rate': 0.00023905256545483168, 'epoch': 0.45}
 45%|████▌     | 1565/3449 [1:13:54<1:21:03,  2.58s/it] 45%|████▌     | 1566/3449 [1:13:57<1:22:35,  2.63s/it]                                                       {'loss': 1.2633, 'learning_rate': 0.00023886854591143798, 'epoch': 0.45}
 45%|████▌     | 1566/3449 [1:13:57<1:22:35,  2.63s/it] 45%|████▌     | 1567/3449 [1:14:01<1:34:35,  3.02s/it]                                                       {'loss': 1.2219, 'learning_rate': 0.00023868449216476778, 'epoch': 0.45}
 45%|████▌     | 1567/3449 [1:14:01<1:34:35,  3.02s/it] 45%|████▌     | 1568/3449 [1:14:04<1:34:47,  3.02s/it]                                                       {'loss': 1.2433, 'learning_rate': 0.00023850040437678333, 'epoch': 0.45}
 45%|████▌     | 1568/3449 [1:14:04<1:34:47,  3.02s/it] 45%|████▌     | 1569/3449 [1:14:07<1:32:13,  2.94s/it]                                                       {'loss': 1.2935, 'learning_rate': 0.000238316282709477, 'epoch': 0.45}
 45%|████▌     | 1569/3449 [1:14:07<1:32:13,  2.94s/it] 46%|████▌     | 1570/3449 [1:14:10<1:30:33,  2.89s/it]                                                       {'loss': 1.2649, 'learning_rate': 0.0002381321273248708, 'epoch': 0.46}
 46%|████▌     | 1570/3449 [1:14:10<1:30:33,  2.89s/it] 46%|████▌     | 1571/3449 [1:14:12<1:25:06,  2.72s/it]                                                       {'loss': 1.3732, 'learning_rate': 0.00023794793838501663, 'epoch': 0.46}
 46%|████▌     | 1571/3449 [1:14:12<1:25:06,  2.72s/it] 46%|████▌     | 1572/3449 [1:14:15<1:24:18,  2.70s/it]                                                       {'loss': 1.2717, 'learning_rate': 0.00023776371605199582, 'epoch': 0.46}
 46%|████▌     | 1572/3449 [1:14:15<1:24:18,  2.70s/it] 46%|████▌     | 1573/3449 [1:14:17<1:21:05,  2.59s/it]                                                       {'loss': 1.3932, 'learning_rate': 0.00023757946048791903, 'epoch': 0.46}
 46%|████▌     | 1573/3449 [1:14:17<1:21:05,  2.59s/it] 46%|████▌     | 1574/3449 [1:14:19<1:19:02,  2.53s/it]                                                       {'loss': 1.3593, 'learning_rate': 0.00023739517185492618, 'epoch': 0.46}
 46%|████▌     | 1574/3449 [1:14:19<1:19:02,  2.53s/it] 46%|████▌     | 1575/3449 [1:14:22<1:18:55,  2.53s/it]                                                       {'loss': 1.2325, 'learning_rate': 0.00023721085031518636, 'epoch': 0.46}
 46%|████▌     | 1575/3449 [1:14:22<1:18:55,  2.53s/it] 46%|████▌     | 1576/3449 [1:14:25<1:21:05,  2.60s/it]                                                       {'loss': 1.3133, 'learning_rate': 0.00023702649603089758, 'epoch': 0.46}
 46%|████▌     | 1576/3449 [1:14:25<1:21:05,  2.60s/it] 46%|████▌     | 1577/3449 [1:14:27<1:21:12,  2.60s/it]                                                       {'loss': 1.3409, 'learning_rate': 0.00023684210916428665, 'epoch': 0.46}
 46%|████▌     | 1577/3449 [1:14:27<1:21:12,  2.60s/it] 46%|████▌     | 1578/3449 [1:14:30<1:20:28,  2.58s/it]                                                       {'loss': 1.4334, 'learning_rate': 0.00023665768987760904, 'epoch': 0.46}
 46%|████▌     | 1578/3449 [1:14:30<1:20:28,  2.58s/it] 46%|████▌     | 1579/3449 [1:14:32<1:22:02,  2.63s/it]                                                       {'loss': 1.1466, 'learning_rate': 0.0002364732383331488, 'epoch': 0.46}
 46%|████▌     | 1579/3449 [1:14:32<1:22:02,  2.63s/it] 46%|████▌     | 1580/3449 [1:14:36<1:31:52,  2.95s/it]                                                       {'loss': 1.2477, 'learning_rate': 0.00023628875469321834, 'epoch': 0.46}
 46%|████▌     | 1580/3449 [1:14:36<1:31:52,  2.95s/it] 46%|████▌     | 1581/3449 [1:14:39<1:27:33,  2.81s/it]                                                       {'loss': 1.3581, 'learning_rate': 0.00023610423912015827, 'epoch': 0.46}
 46%|████▌     | 1581/3449 [1:14:39<1:27:33,  2.81s/it] 46%|████▌     | 1582/3449 [1:14:41<1:24:41,  2.72s/it]                                                       {'loss': 1.2247, 'learning_rate': 0.00023591969177633737, 'epoch': 0.46}
 46%|████▌     | 1582/3449 [1:14:41<1:24:41,  2.72s/it] 46%|████▌     | 1583/3449 [1:14:44<1:29:02,  2.86s/it]                                                       {'loss': 1.1193, 'learning_rate': 0.00023573511282415227, 'epoch': 0.46}
 46%|████▌     | 1583/3449 [1:14:44<1:29:02,  2.86s/it] 46%|████▌     | 1584/3449 [1:14:47<1:30:11,  2.90s/it]                                                       {'loss': 1.4805, 'learning_rate': 0.00023555050242602765, 'epoch': 0.46}
 46%|████▌     | 1584/3449 [1:14:47<1:30:11,  2.90s/it] 46%|████▌     | 1585/3449 [1:14:50<1:28:39,  2.85s/it]                                                       {'loss': 1.2427, 'learning_rate': 0.00023536586074441557, 'epoch': 0.46}
 46%|████▌     | 1585/3449 [1:14:50<1:28:39,  2.85s/it] 46%|████▌     | 1586/3449 [1:14:53<1:25:32,  2.76s/it]                                                       {'loss': 1.2371, 'learning_rate': 0.00023518118794179586, 'epoch': 0.46}
 46%|████▌     | 1586/3449 [1:14:53<1:25:32,  2.76s/it] 46%|████▌     | 1587/3449 [1:14:55<1:24:02,  2.71s/it]                                                       {'loss': 1.3099, 'learning_rate': 0.0002349964841806755, 'epoch': 0.46}
 46%|████▌     | 1587/3449 [1:14:55<1:24:02,  2.71s/it] 46%|████▌     | 1588/3449 [1:14:58<1:25:24,  2.75s/it]                                                       {'loss': 1.1764, 'learning_rate': 0.00023481174962358884, 'epoch': 0.46}
 46%|████▌     | 1588/3449 [1:14:58<1:25:24,  2.75s/it] 46%|████▌     | 1589/3449 [1:15:01<1:25:42,  2.76s/it]                                                       {'loss': 1.3289, 'learning_rate': 0.0002346269844330975, 'epoch': 0.46}
 46%|████▌     | 1589/3449 [1:15:01<1:25:42,  2.76s/it] 46%|████▌     | 1590/3449 [1:15:04<1:25:25,  2.76s/it]                                                       {'loss': 1.1783, 'learning_rate': 0.00023444218877178972, 'epoch': 0.46}
 46%|████▌     | 1590/3449 [1:15:04<1:25:25,  2.76s/it] 46%|████▌     | 1591/3449 [1:15:06<1:20:48,  2.61s/it]                                                       {'loss': 1.2568, 'learning_rate': 0.00023425736280228073, 'epoch': 0.46}
 46%|████▌     | 1591/3449 [1:15:06<1:20:48,  2.61s/it] 46%|████▌     | 1592/3449 [1:15:09<1:22:28,  2.66s/it]                                                       {'loss': 1.1521, 'learning_rate': 0.00023407250668721252, 'epoch': 0.46}
 46%|████▌     | 1592/3449 [1:15:09<1:22:28,  2.66s/it] 46%|████▌     | 1593/3449 [1:15:11<1:19:38,  2.57s/it]                                                       {'loss': 1.2124, 'learning_rate': 0.0002338876205892534, 'epoch': 0.46}
 46%|████▌     | 1593/3449 [1:15:11<1:19:38,  2.57s/it] 46%|████▌     | 1594/3449 [1:15:14<1:20:55,  2.62s/it]                                                       {'loss': 1.1642, 'learning_rate': 0.00023370270467109835, 'epoch': 0.46}
 46%|████▌     | 1594/3449 [1:15:14<1:20:55,  2.62s/it] 46%|████▌     | 1595/3449 [1:15:16<1:19:37,  2.58s/it]                                                       {'loss': 1.2952, 'learning_rate': 0.0002335177590954681, 'epoch': 0.46}
 46%|████▌     | 1595/3449 [1:15:16<1:19:37,  2.58s/it] 46%|████▋     | 1596/3449 [1:15:19<1:18:49,  2.55s/it]                                                       {'loss': 1.3528, 'learning_rate': 0.00023333278402511013, 'epoch': 0.46}
 46%|████▋     | 1596/3449 [1:15:19<1:18:49,  2.55s/it] 46%|████▋     | 1597/3449 [1:15:21<1:19:05,  2.56s/it]                                                       {'loss': 1.2231, 'learning_rate': 0.0002331477796227973, 'epoch': 0.46}
 46%|████▋     | 1597/3449 [1:15:21<1:19:05,  2.56s/it] 46%|████▋     | 1598/3449 [1:15:24<1:20:42,  2.62s/it]                                                       {'loss': 1.2521, 'learning_rate': 0.00023296274605132862, 'epoch': 0.46}
 46%|████▋     | 1598/3449 [1:15:24<1:20:42,  2.62s/it] 46%|████▋     | 1599/3449 [1:15:27<1:20:26,  2.61s/it]                                                       {'loss': 1.2415, 'learning_rate': 0.0002327776834735286, 'epoch': 0.46}
 46%|████▋     | 1599/3449 [1:15:27<1:20:26,  2.61s/it] 46%|████▋     | 1600/3449 [1:15:29<1:17:55,  2.53s/it]                                                       {'loss': 1.4175, 'learning_rate': 0.00023259259205224737, 'epoch': 0.46}
 46%|████▋     | 1600/3449 [1:15:29<1:17:55,  2.53s/it] 46%|████▋     | 1601/3449 [1:15:32<1:18:37,  2.55s/it]                                                       {'loss': 1.4344, 'learning_rate': 0.00023240747195036048, 'epoch': 0.46}
 46%|████▋     | 1601/3449 [1:15:32<1:18:37,  2.55s/it] 46%|████▋     | 1602/3449 [1:15:36<1:31:24,  2.97s/it]                                                       {'loss': 1.0662, 'learning_rate': 0.0002322223233307685, 'epoch': 0.46}
 46%|████▋     | 1602/3449 [1:15:36<1:31:24,  2.97s/it] 46%|████▋     | 1603/3449 [1:15:38<1:29:06,  2.90s/it]                                                       {'loss': 1.2483, 'learning_rate': 0.00023203714635639742, 'epoch': 0.46}
 46%|████▋     | 1603/3449 [1:15:38<1:29:06,  2.90s/it] 47%|████▋     | 1604/3449 [1:15:41<1:28:30,  2.88s/it]                                                       {'loss': 1.2279, 'learning_rate': 0.00023185194119019787, 'epoch': 0.46}
 47%|████▋     | 1604/3449 [1:15:41<1:28:30,  2.88s/it] 47%|████▋     | 1605/3449 [1:15:44<1:28:12,  2.87s/it]                                                       {'loss': 1.3382, 'learning_rate': 0.00023166670799514542, 'epoch': 0.47}
 47%|████▋     | 1605/3449 [1:15:44<1:28:12,  2.87s/it] 47%|████▋     | 1606/3449 [1:15:47<1:26:30,  2.82s/it]                                                       {'loss': 1.2369, 'learning_rate': 0.0002314814469342404, 'epoch': 0.47}
 47%|████▋     | 1606/3449 [1:15:47<1:26:30,  2.82s/it] 47%|████▋     | 1607/3449 [1:15:49<1:24:56,  2.77s/it]                                                       {'loss': 1.3321, 'learning_rate': 0.00023129615817050748, 'epoch': 0.47}
 47%|████▋     | 1607/3449 [1:15:49<1:24:56,  2.77s/it] 47%|████▋     | 1608/3449 [1:15:52<1:25:32,  2.79s/it]                                                       {'loss': 1.19, 'learning_rate': 0.00023111084186699582, 'epoch': 0.47}
 47%|████▋     | 1608/3449 [1:15:52<1:25:32,  2.79s/it] 47%|████▋     | 1609/3449 [1:15:54<1:20:33,  2.63s/it]                                                       {'loss': 1.3365, 'learning_rate': 0.0002309254981867789, 'epoch': 0.47}
 47%|████▋     | 1609/3449 [1:15:54<1:20:33,  2.63s/it] 47%|████▋     | 1610/3449 [1:15:57<1:22:36,  2.70s/it]                                                       {'loss': 1.3058, 'learning_rate': 0.000230740127292954, 'epoch': 0.47}
 47%|████▋     | 1610/3449 [1:15:57<1:22:36,  2.70s/it] 47%|████▋     | 1611/3449 [1:16:00<1:19:17,  2.59s/it]                                                       {'loss': 1.2124, 'learning_rate': 0.00023055472934864265, 'epoch': 0.47}
 47%|████▋     | 1611/3449 [1:16:00<1:19:17,  2.59s/it] 47%|████▋     | 1612/3449 [1:16:02<1:17:03,  2.52s/it]                                                       {'loss': 1.1486, 'learning_rate': 0.00023036930451699004, 'epoch': 0.47}
 47%|████▋     | 1612/3449 [1:16:02<1:17:03,  2.52s/it] 47%|████▋     | 1613/3449 [1:16:05<1:21:00,  2.65s/it]                                                       {'loss': 1.2061, 'learning_rate': 0.00023018385296116498, 'epoch': 0.47}
 47%|████▋     | 1613/3449 [1:16:05<1:21:00,  2.65s/it] 47%|████▋     | 1614/3449 [1:16:08<1:28:47,  2.90s/it]                                                       {'loss': 1.3723, 'learning_rate': 0.00022999837484435993, 'epoch': 0.47}
 47%|████▋     | 1614/3449 [1:16:08<1:28:47,  2.90s/it] 47%|████▋     | 1615/3449 [1:16:11<1:23:43,  2.74s/it]                                                       {'loss': 1.4198, 'learning_rate': 0.00022981287032979063, 'epoch': 0.47}
 47%|████▋     | 1615/3449 [1:16:11<1:23:43,  2.74s/it] 47%|████▋     | 1616/3449 [1:16:13<1:21:15,  2.66s/it]                                                       {'loss': 1.2578, 'learning_rate': 0.00022962733958069613, 'epoch': 0.47}
 47%|████▋     | 1616/3449 [1:16:13<1:21:15,  2.66s/it] 47%|████▋     | 1617/3449 [1:16:16<1:19:33,  2.61s/it]                                                       {'loss': 1.2816, 'learning_rate': 0.00022944178276033833, 'epoch': 0.47}
 47%|████▋     | 1617/3449 [1:16:16<1:19:33,  2.61s/it] 47%|████▋     | 1618/3449 [1:16:18<1:18:18,  2.57s/it]                                                       {'loss': 1.4694, 'learning_rate': 0.00022925620003200247, 'epoch': 0.47}
 47%|████▋     | 1618/3449 [1:16:18<1:18:18,  2.57s/it] 47%|████▋     | 1619/3449 [1:16:21<1:21:01,  2.66s/it]                                                       {'loss': 1.3997, 'learning_rate': 0.0002290705915589962, 'epoch': 0.47}
 47%|████▋     | 1619/3449 [1:16:21<1:21:01,  2.66s/it] 47%|████▋     | 1620/3449 [1:16:24<1:25:23,  2.80s/it]                                                       {'loss': 1.3305, 'learning_rate': 0.00022888495750465006, 'epoch': 0.47}
 47%|████▋     | 1620/3449 [1:16:24<1:25:23,  2.80s/it] 47%|████▋     | 1621/3449 [1:16:27<1:21:30,  2.68s/it]                                                       {'loss': 1.2784, 'learning_rate': 0.00022869929803231705, 'epoch': 0.47}
 47%|████▋     | 1621/3449 [1:16:27<1:21:30,  2.68s/it] 47%|████▋     | 1622/3449 [1:16:29<1:19:18,  2.60s/it]                                                       {'loss': 1.2551, 'learning_rate': 0.0002285136133053725, 'epoch': 0.47}
 47%|████▋     | 1622/3449 [1:16:29<1:19:18,  2.60s/it] 47%|████▋     | 1623/3449 [1:16:32<1:19:37,  2.62s/it]                                                       {'loss': 1.2356, 'learning_rate': 0.000228327903487214, 'epoch': 0.47}
 47%|████▋     | 1623/3449 [1:16:32<1:19:37,  2.62s/it] 47%|████▋     | 1624/3449 [1:16:35<1:25:31,  2.81s/it]                                                       {'loss': 1.0749, 'learning_rate': 0.00022814216874126114, 'epoch': 0.47}
 47%|████▋     | 1624/3449 [1:16:35<1:25:31,  2.81s/it] 47%|████▋     | 1625/3449 [1:16:37<1:22:58,  2.73s/it]                                                       {'loss': 1.2624, 'learning_rate': 0.00022795640923095554, 'epoch': 0.47}
 47%|████▋     | 1625/3449 [1:16:37<1:22:58,  2.73s/it] 47%|████▋     | 1626/3449 [1:16:40<1:21:49,  2.69s/it]                                                       {'loss': 1.3135, 'learning_rate': 0.00022777062511976067, 'epoch': 0.47}
 47%|████▋     | 1626/3449 [1:16:40<1:21:49,  2.69s/it] 47%|████▋     | 1627/3449 [1:16:43<1:20:10,  2.64s/it]                                                       {'loss': 1.3176, 'learning_rate': 0.00022758481657116143, 'epoch': 0.47}
 47%|████▋     | 1627/3449 [1:16:43<1:20:10,  2.64s/it] 47%|████▋     | 1628/3449 [1:16:45<1:22:35,  2.72s/it]                                                       {'loss': 1.1743, 'learning_rate': 0.00022739898374866436, 'epoch': 0.47}
 47%|████▋     | 1628/3449 [1:16:45<1:22:35,  2.72s/it] 47%|████▋     | 1629/3449 [1:16:48<1:21:47,  2.70s/it]                                                       {'loss': 1.237, 'learning_rate': 0.00022721312681579745, 'epoch': 0.47}
 47%|████▋     | 1629/3449 [1:16:48<1:21:47,  2.70s/it] 47%|████▋     | 1630/3449 [1:16:51<1:19:35,  2.63s/it]                                                       {'loss': 1.3762, 'learning_rate': 0.0002270272459361097, 'epoch': 0.47}
 47%|████▋     | 1630/3449 [1:16:51<1:19:35,  2.63s/it] 47%|████▋     | 1631/3449 [1:16:53<1:18:20,  2.59s/it]                                                       {'loss': 1.3103, 'learning_rate': 0.0002268413412731714, 'epoch': 0.47}
 47%|████▋     | 1631/3449 [1:16:53<1:18:20,  2.59s/it] 47%|████▋     | 1632/3449 [1:16:56<1:20:06,  2.65s/it]                                                       {'loss': 1.2611, 'learning_rate': 0.00022665541299057363, 'epoch': 0.47}
 47%|████▋     | 1632/3449 [1:16:56<1:20:06,  2.65s/it] 47%|████▋     | 1633/3449 [1:16:58<1:17:49,  2.57s/it]                                                       {'loss': 1.4042, 'learning_rate': 0.00022646946125192826, 'epoch': 0.47}
 47%|████▋     | 1633/3449 [1:16:58<1:17:49,  2.57s/it] 47%|████▋     | 1634/3449 [1:17:01<1:17:56,  2.58s/it]                                                       {'loss': 1.2531, 'learning_rate': 0.00022628348622086782, 'epoch': 0.47}
 47%|████▋     | 1634/3449 [1:17:01<1:17:56,  2.58s/it] 47%|████▋     | 1635/3449 [1:17:03<1:17:44,  2.57s/it]                                                       {'loss': 1.1799, 'learning_rate': 0.00022609748806104533, 'epoch': 0.47}
 47%|████▋     | 1635/3449 [1:17:03<1:17:44,  2.57s/it] 47%|████▋     | 1636/3449 [1:17:06<1:20:43,  2.67s/it]                                                       {'loss': 1.0764, 'learning_rate': 0.00022591146693613418, 'epoch': 0.47}
 47%|████▋     | 1636/3449 [1:17:06<1:20:43,  2.67s/it] 47%|████▋     | 1637/3449 [1:17:10<1:26:32,  2.87s/it]                                                       {'loss': 1.2878, 'learning_rate': 0.000225725423009828, 'epoch': 0.47}
 47%|████▋     | 1637/3449 [1:17:10<1:26:32,  2.87s/it] 47%|████▋     | 1638/3449 [1:17:12<1:25:19,  2.83s/it]                                                       {'loss': 1.3434, 'learning_rate': 0.00022553935644584048, 'epoch': 0.47}
 47%|████▋     | 1638/3449 [1:17:12<1:25:19,  2.83s/it] 48%|████▊     | 1639/3449 [1:17:15<1:21:53,  2.71s/it]                                                       {'loss': 1.3413, 'learning_rate': 0.0002253532674079051, 'epoch': 0.48}
 48%|████▊     | 1639/3449 [1:17:15<1:21:53,  2.71s/it] 48%|████▊     | 1640/3449 [1:17:18<1:24:24,  2.80s/it]                                                       {'loss': 1.2488, 'learning_rate': 0.0002251671560597753, 'epoch': 0.48}
 48%|████▊     | 1640/3449 [1:17:18<1:24:24,  2.80s/it] 48%|████▊     | 1641/3449 [1:17:21<1:26:51,  2.88s/it]                                                       {'loss': 1.2143, 'learning_rate': 0.00022498102256522407, 'epoch': 0.48}
 48%|████▊     | 1641/3449 [1:17:21<1:26:51,  2.88s/it] 48%|████▊     | 1642/3449 [1:17:24<1:24:36,  2.81s/it]                                                       {'loss': 1.2988, 'learning_rate': 0.00022479486708804376, 'epoch': 0.48}
 48%|████▊     | 1642/3449 [1:17:24<1:24:36,  2.81s/it] 48%|████▊     | 1643/3449 [1:17:26<1:23:13,  2.77s/it]                                                       {'loss': 1.4368, 'learning_rate': 0.00022460868979204635, 'epoch': 0.48}
 48%|████▊     | 1643/3449 [1:17:26<1:23:13,  2.77s/it] 48%|████▊     | 1644/3449 [1:17:29<1:23:39,  2.78s/it]                                                       {'loss': 1.1675, 'learning_rate': 0.00022442249084106278, 'epoch': 0.48}
 48%|████▊     | 1644/3449 [1:17:29<1:23:39,  2.78s/it] 48%|████▊     | 1645/3449 [1:17:32<1:25:22,  2.84s/it]                                                       {'loss': 1.1322, 'learning_rate': 0.00022423627039894317, 'epoch': 0.48}
 48%|████▊     | 1645/3449 [1:17:32<1:25:22,  2.84s/it] 48%|████▊     | 1646/3449 [1:17:34<1:22:01,  2.73s/it]                                                       {'loss': 1.2587, 'learning_rate': 0.0002240500286295564, 'epoch': 0.48}
 48%|████▊     | 1646/3449 [1:17:34<1:22:01,  2.73s/it] 48%|████▊     | 1647/3449 [1:17:37<1:20:45,  2.69s/it]                                                       {'loss': 1.2603, 'learning_rate': 0.00022386376569679035, 'epoch': 0.48}
 48%|████▊     | 1647/3449 [1:17:37<1:20:45,  2.69s/it] 48%|████▊     | 1648/3449 [1:17:39<1:17:11,  2.57s/it]                                                       {'loss': 1.3065, 'learning_rate': 0.0002236774817645514, 'epoch': 0.48}
 48%|████▊     | 1648/3449 [1:17:39<1:17:11,  2.57s/it] 48%|████▊     | 1649/3449 [1:17:42<1:14:59,  2.50s/it]                                                       {'loss': 1.2715, 'learning_rate': 0.00022349117699676426, 'epoch': 0.48}
 48%|████▊     | 1649/3449 [1:17:42<1:14:59,  2.50s/it] 48%|████▊     | 1650/3449 [1:17:44<1:14:22,  2.48s/it]                                                       {'loss': 1.3207, 'learning_rate': 0.00022330485155737232, 'epoch': 0.48}
 48%|████▊     | 1650/3449 [1:17:44<1:14:22,  2.48s/it] 48%|████▊     | 1651/3449 [1:17:48<1:25:58,  2.87s/it]                                                       {'loss': 1.1798, 'learning_rate': 0.00022311850561033682, 'epoch': 0.48}
 48%|████▊     | 1651/3449 [1:17:48<1:25:58,  2.87s/it] 48%|████▊     | 1652/3449 [1:17:51<1:24:47,  2.83s/it]                                                       {'loss': 1.2045, 'learning_rate': 0.00022293213931963725, 'epoch': 0.48}
 48%|████▊     | 1652/3449 [1:17:51<1:24:47,  2.83s/it] 48%|████▊     | 1653/3449 [1:17:54<1:25:30,  2.86s/it]                                                       {'loss': 1.1409, 'learning_rate': 0.0002227457528492709, 'epoch': 0.48}
 48%|████▊     | 1653/3449 [1:17:54<1:25:30,  2.86s/it] 48%|████▊     | 1654/3449 [1:17:57<1:30:13,  3.02s/it]                                                       {'loss': 1.2178, 'learning_rate': 0.00022255934636325288, 'epoch': 0.48}
 48%|████▊     | 1654/3449 [1:17:57<1:30:13,  3.02s/it] 48%|████▊     | 1655/3449 [1:18:01<1:35:35,  3.20s/it]                                                       {'loss': 1.2155, 'learning_rate': 0.00022237292002561597, 'epoch': 0.48}
 48%|████▊     | 1655/3449 [1:18:01<1:35:35,  3.20s/it] 48%|████▊     | 1656/3449 [1:18:03<1:27:11,  2.92s/it]                                                       {'loss': 1.2181, 'learning_rate': 0.00022218647400041016, 'epoch': 0.48}
 48%|████▊     | 1656/3449 [1:18:03<1:27:11,  2.92s/it] 48%|████▊     | 1657/3449 [1:18:06<1:29:17,  2.99s/it]                                                       {'loss': 1.1984, 'learning_rate': 0.00022200000845170315, 'epoch': 0.48}
 48%|████▊     | 1657/3449 [1:18:06<1:29:17,  2.99s/it] 48%|████▊     | 1658/3449 [1:18:09<1:34:00,  3.15s/it]                                                       {'loss': 1.2853, 'learning_rate': 0.00022181352354357946, 'epoch': 0.48}
 48%|████▊     | 1658/3449 [1:18:09<1:34:00,  3.15s/it] 48%|████▊     | 1659/3449 [1:18:13<1:33:06,  3.12s/it]                                                       {'loss': 1.2788, 'learning_rate': 0.00022162701944014086, 'epoch': 0.48}
 48%|████▊     | 1659/3449 [1:18:13<1:33:06,  3.12s/it] 48%|████▊     | 1660/3449 [1:18:15<1:29:59,  3.02s/it]                                                       {'loss': 1.2327, 'learning_rate': 0.000221440496305506, 'epoch': 0.48}
 48%|████▊     | 1660/3449 [1:18:15<1:29:59,  3.02s/it] 48%|████▊     | 1661/3449 [1:18:18<1:24:15,  2.83s/it]                                                       {'loss': 1.2452, 'learning_rate': 0.00022125395430381013, 'epoch': 0.48}
 48%|████▊     | 1661/3449 [1:18:18<1:24:15,  2.83s/it] 48%|████▊     | 1662/3449 [1:18:20<1:23:46,  2.81s/it]                                                       {'loss': 1.0371, 'learning_rate': 0.0002210673935992053, 'epoch': 0.48}
 48%|████▊     | 1662/3449 [1:18:20<1:23:46,  2.81s/it] 48%|████▊     | 1663/3449 [1:18:24<1:28:18,  2.97s/it]                                                       {'loss': 1.1435, 'learning_rate': 0.00022088081435585978, 'epoch': 0.48}
 48%|████▊     | 1663/3449 [1:18:24<1:28:18,  2.97s/it] 48%|████▊     | 1664/3449 [1:18:26<1:25:00,  2.86s/it]                                                       {'loss': 1.2373, 'learning_rate': 0.00022069421673795843, 'epoch': 0.48}
 48%|████▊     | 1664/3449 [1:18:26<1:25:00,  2.86s/it] 48%|████▊     | 1665/3449 [1:18:30<1:31:35,  3.08s/it]                                                       {'loss': 1.257, 'learning_rate': 0.00022050760090970215, 'epoch': 0.48}
 48%|████▊     | 1665/3449 [1:18:30<1:31:35,  3.08s/it] 48%|████▊     | 1666/3449 [1:18:33<1:27:44,  2.95s/it]                                                       {'loss': 1.2781, 'learning_rate': 0.0002203209670353078, 'epoch': 0.48}
 48%|████▊     | 1666/3449 [1:18:33<1:27:44,  2.95s/it] 48%|████▊     | 1667/3449 [1:18:36<1:27:23,  2.94s/it]                                                       {'loss': 1.1342, 'learning_rate': 0.00022013431527900812, 'epoch': 0.48}
 48%|████▊     | 1667/3449 [1:18:36<1:27:23,  2.94s/it] 48%|████▊     | 1668/3449 [1:18:38<1:25:37,  2.88s/it]                                                       {'loss': 1.2176, 'learning_rate': 0.0002199476458050517, 'epoch': 0.48}
 48%|████▊     | 1668/3449 [1:18:38<1:25:37,  2.88s/it] 48%|████▊     | 1669/3449 [1:18:41<1:25:13,  2.87s/it]                                                       {'loss': 1.2025, 'learning_rate': 0.0002197609587777027, 'epoch': 0.48}
 48%|████▊     | 1669/3449 [1:18:41<1:25:13,  2.87s/it] 48%|████▊     | 1670/3449 [1:18:44<1:26:56,  2.93s/it]                                                       {'loss': 1.2804, 'learning_rate': 0.00021957425436124072, 'epoch': 0.48}
 48%|████▊     | 1670/3449 [1:18:44<1:26:56,  2.93s/it] 48%|████▊     | 1671/3449 [1:18:48<1:33:17,  3.15s/it]                                                       {'loss': 1.0952, 'learning_rate': 0.00021938753271996046, 'epoch': 0.48}
 48%|████▊     | 1671/3449 [1:18:48<1:33:17,  3.15s/it] 48%|████▊     | 1672/3449 [1:18:51<1:31:17,  3.08s/it]                                                       {'loss': 1.2449, 'learning_rate': 0.00021920079401817216, 'epoch': 0.48}
 48%|████▊     | 1672/3449 [1:18:51<1:31:17,  3.08s/it] 49%|████▊     | 1673/3449 [1:18:53<1:25:13,  2.88s/it]                                                       {'loss': 1.2866, 'learning_rate': 0.0002190140384202007, 'epoch': 0.48}
 49%|████▊     | 1673/3449 [1:18:53<1:25:13,  2.88s/it] 49%|████▊     | 1674/3449 [1:18:55<1:19:00,  2.67s/it]                                                       {'loss': 1.2772, 'learning_rate': 0.0002188272660903861, 'epoch': 0.49}
 49%|████▊     | 1674/3449 [1:18:55<1:19:00,  2.67s/it] 49%|████▊     | 1675/3449 [1:18:58<1:20:19,  2.72s/it]                                                       {'loss': 1.3276, 'learning_rate': 0.0002186404771930829, 'epoch': 0.49}
 49%|████▊     | 1675/3449 [1:18:58<1:20:19,  2.72s/it] 49%|████▊     | 1676/3449 [1:19:01<1:20:12,  2.71s/it]                                                       {'loss': 1.2041, 'learning_rate': 0.00021845367189266042, 'epoch': 0.49}
 49%|████▊     | 1676/3449 [1:19:01<1:20:12,  2.71s/it] 49%|████▊     | 1677/3449 [1:19:05<1:30:33,  3.07s/it]                                                       {'loss': 1.2675, 'learning_rate': 0.00021826685035350227, 'epoch': 0.49}
 49%|████▊     | 1677/3449 [1:19:05<1:30:33,  3.07s/it] 49%|████▊     | 1678/3449 [1:19:08<1:29:15,  3.02s/it]                                                       {'loss': 1.244, 'learning_rate': 0.00021808001274000626, 'epoch': 0.49}
 49%|████▊     | 1678/3449 [1:19:08<1:29:15,  3.02s/it] 49%|████▊     | 1679/3449 [1:19:10<1:22:39,  2.80s/it]                                                       {'loss': 1.3775, 'learning_rate': 0.0002178931592165847, 'epoch': 0.49}
 49%|████▊     | 1679/3449 [1:19:10<1:22:39,  2.80s/it] 49%|████▊     | 1680/3449 [1:19:13<1:23:54,  2.85s/it]                                                       {'loss': 1.2603, 'learning_rate': 0.0002177062899476635, 'epoch': 0.49}
 49%|████▊     | 1680/3449 [1:19:13<1:23:54,  2.85s/it] 49%|████▊     | 1681/3449 [1:19:16<1:24:21,  2.86s/it]                                                       {'loss': 1.2707, 'learning_rate': 0.0002175194050976826, 'epoch': 0.49}
 49%|████▊     | 1681/3449 [1:19:16<1:24:21,  2.86s/it] 49%|████▉     | 1682/3449 [1:19:18<1:20:52,  2.75s/it]                                                       {'loss': 1.3891, 'learning_rate': 0.00021733250483109578, 'epoch': 0.49}
 49%|████▉     | 1682/3449 [1:19:18<1:20:52,  2.75s/it] 49%|████▉     | 1683/3449 [1:19:21<1:22:28,  2.80s/it]                                                       {'loss': 1.1821, 'learning_rate': 0.00021714558931237017, 'epoch': 0.49}
 49%|████▉     | 1683/3449 [1:19:21<1:22:28,  2.80s/it] 49%|████▉     | 1684/3449 [1:19:24<1:20:50,  2.75s/it]                                                       {'loss': 1.3482, 'learning_rate': 0.00021695865870598638, 'epoch': 0.49}
 49%|████▉     | 1684/3449 [1:19:24<1:20:50,  2.75s/it] 49%|████▉     | 1685/3449 [1:19:27<1:27:52,  2.99s/it]                                                       {'loss': 1.208, 'learning_rate': 0.00021677171317643836, 'epoch': 0.49}
 49%|████▉     | 1685/3449 [1:19:27<1:27:52,  2.99s/it] 49%|████▉     | 1686/3449 [1:19:31<1:35:58,  3.27s/it]                                                       {'loss': 1.2911, 'learning_rate': 0.00021658475288823317, 'epoch': 0.49}
 49%|████▉     | 1686/3449 [1:19:31<1:35:58,  3.27s/it] 49%|████▉     | 1687/3449 [1:19:34<1:30:40,  3.09s/it]                                                       {'loss': 1.4132, 'learning_rate': 0.00021639777800589084, 'epoch': 0.49}
 49%|████▉     | 1687/3449 [1:19:34<1:30:40,  3.09s/it] 49%|████▉     | 1688/3449 [1:19:37<1:29:03,  3.03s/it]                                                       {'loss': 1.2284, 'learning_rate': 0.0002162107886939442, 'epoch': 0.49}
 49%|████▉     | 1688/3449 [1:19:37<1:29:03,  3.03s/it] 49%|████▉     | 1689/3449 [1:19:39<1:23:22,  2.84s/it]                                                       {'loss': 1.2242, 'learning_rate': 0.00021602378511693888, 'epoch': 0.49}
 49%|████▉     | 1689/3449 [1:19:39<1:23:22,  2.84s/it] 49%|████▉     | 1690/3449 [1:19:43<1:29:39,  3.06s/it]                                                       {'loss': 0.9711, 'learning_rate': 0.00021583676743943295, 'epoch': 0.49}
 49%|████▉     | 1690/3449 [1:19:43<1:29:39,  3.06s/it] 49%|████▉     | 1691/3449 [1:19:46<1:28:03,  3.01s/it]                                                       {'loss': 1.2089, 'learning_rate': 0.00021564973582599697, 'epoch': 0.49}
 49%|████▉     | 1691/3449 [1:19:46<1:28:03,  3.01s/it] 49%|████▉     | 1692/3449 [1:19:49<1:30:37,  3.09s/it]                                                       {'loss': 1.3476, 'learning_rate': 0.00021546269044121376, 'epoch': 0.49}
 49%|████▉     | 1692/3449 [1:19:49<1:30:37,  3.09s/it] 49%|████▉     | 1693/3449 [1:19:52<1:26:41,  2.96s/it]                                                       {'loss': 1.3041, 'learning_rate': 0.0002152756314496782, 'epoch': 0.49}
 49%|████▉     | 1693/3449 [1:19:52<1:26:41,  2.96s/it] 49%|████▉     | 1694/3449 [1:19:54<1:24:09,  2.88s/it]                                                       {'loss': 1.3109, 'learning_rate': 0.00021508855901599723, 'epoch': 0.49}
 49%|████▉     | 1694/3449 [1:19:54<1:24:09,  2.88s/it] 49%|████▉     | 1695/3449 [1:19:58<1:30:03,  3.08s/it]                                                       {'loss': 1.1583, 'learning_rate': 0.00021490147330478952, 'epoch': 0.49}
 49%|████▉     | 1695/3449 [1:19:58<1:30:03,  3.08s/it] 49%|████▉     | 1696/3449 [1:20:01<1:25:16,  2.92s/it]                                                       {'loss': 1.2687, 'learning_rate': 0.00021471437448068547, 'epoch': 0.49}
 49%|████▉     | 1696/3449 [1:20:01<1:25:16,  2.92s/it] 49%|████▉     | 1697/3449 [1:20:03<1:21:44,  2.80s/it]                                                       {'loss': 1.2888, 'learning_rate': 0.00021452726270832702, 'epoch': 0.49}
 49%|████▉     | 1697/3449 [1:20:03<1:21:44,  2.80s/it] 49%|████▉     | 1698/3449 [1:20:06<1:26:17,  2.96s/it]                                                       {'loss': 1.3057, 'learning_rate': 0.00021434013815236754, 'epoch': 0.49}
 49%|████▉     | 1698/3449 [1:20:06<1:26:17,  2.96s/it] 49%|████▉     | 1699/3449 [1:20:09<1:20:57,  2.78s/it]                                                       {'loss': 1.3882, 'learning_rate': 0.00021415300097747157, 'epoch': 0.49}
 49%|████▉     | 1699/3449 [1:20:09<1:20:57,  2.78s/it] 49%|████▉     | 1700/3449 [1:20:11<1:20:02,  2.75s/it]                                                       {'loss': 1.3033, 'learning_rate': 0.00021396585134831483, 'epoch': 0.49}
 49%|████▉     | 1700/3449 [1:20:11<1:20:02,  2.75s/it] 49%|████▉     | 1701/3449 [1:20:14<1:18:29,  2.69s/it]                                                       {'loss': 1.1855, 'learning_rate': 0.00021377868942958398, 'epoch': 0.49}
 49%|████▉     | 1701/3449 [1:20:14<1:18:29,  2.69s/it] 49%|████▉     | 1702/3449 [1:20:17<1:21:38,  2.80s/it]                                                       {'loss': 1.3596, 'learning_rate': 0.00021359151538597647, 'epoch': 0.49}
 49%|████▉     | 1702/3449 [1:20:17<1:21:38,  2.80s/it] 49%|████▉     | 1703/3449 [1:20:20<1:19:38,  2.74s/it]                                                       {'loss': 1.3835, 'learning_rate': 0.00021340432938220038, 'epoch': 0.49}
 49%|████▉     | 1703/3449 [1:20:20<1:19:38,  2.74s/it] 49%|████▉     | 1704/3449 [1:20:22<1:17:51,  2.68s/it]                                                       {'loss': 1.2502, 'learning_rate': 0.00021321713158297447, 'epoch': 0.49}
 49%|████▉     | 1704/3449 [1:20:22<1:17:51,  2.68s/it] 49%|████▉     | 1705/3449 [1:20:27<1:36:44,  3.33s/it]                                                       {'loss': 1.3437, 'learning_rate': 0.00021302992215302768, 'epoch': 0.49}
 49%|████▉     | 1705/3449 [1:20:27<1:36:44,  3.33s/it] 49%|████▉     | 1706/3449 [1:20:29<1:27:53,  3.03s/it]                                                       {'loss': 1.3033, 'learning_rate': 0.0002128427012570993, 'epoch': 0.49}
 49%|████▉     | 1706/3449 [1:20:29<1:27:53,  3.03s/it] 49%|████▉     | 1707/3449 [1:20:32<1:21:37,  2.81s/it]                                                       {'loss': 1.0176, 'learning_rate': 0.00021265546905993872, 'epoch': 0.49}
 49%|████▉     | 1707/3449 [1:20:32<1:21:37,  2.81s/it] 50%|████▉     | 1708/3449 [1:20:34<1:21:41,  2.82s/it]                                                       {'loss': 1.2505, 'learning_rate': 0.00021246822572630521, 'epoch': 0.5}
 50%|████▉     | 1708/3449 [1:20:34<1:21:41,  2.82s/it] 50%|████▉     | 1709/3449 [1:20:38<1:27:49,  3.03s/it]                                                       {'loss': 1.2274, 'learning_rate': 0.00021228097142096802, 'epoch': 0.5}
 50%|████▉     | 1709/3449 [1:20:38<1:27:49,  3.03s/it] 50%|████▉     | 1710/3449 [1:20:41<1:23:19,  2.87s/it]                                                       {'loss': 1.1612, 'learning_rate': 0.00021209370630870562, 'epoch': 0.5}
 50%|████▉     | 1710/3449 [1:20:41<1:23:19,  2.87s/it] 50%|████▉     | 1711/3449 [1:20:43<1:20:16,  2.77s/it]                                                       {'loss': 1.2879, 'learning_rate': 0.00021190643055430655, 'epoch': 0.5}
 50%|████▉     | 1711/3449 [1:20:43<1:20:16,  2.77s/it] 50%|████▉     | 1712/3449 [1:20:46<1:25:02,  2.94s/it]                                                       {'loss': 1.2691, 'learning_rate': 0.0002117191443225683, 'epoch': 0.5}
 50%|████▉     | 1712/3449 [1:20:46<1:25:02,  2.94s/it] 50%|████▉     | 1713/3449 [1:20:49<1:24:36,  2.92s/it]                                                       {'loss': 1.2698, 'learning_rate': 0.0002115318477782978, 'epoch': 0.5}
 50%|████▉     | 1713/3449 [1:20:49<1:24:36,  2.92s/it] 50%|████▉     | 1714/3449 [1:20:52<1:23:44,  2.90s/it]                                                       {'loss': 1.1628, 'learning_rate': 0.0002113445410863109, 'epoch': 0.5}
 50%|████▉     | 1714/3449 [1:20:52<1:23:44,  2.90s/it] 50%|████▉     | 1715/3449 [1:20:55<1:26:16,  2.99s/it]                                                       {'loss': 1.2225, 'learning_rate': 0.0002111572244114325, 'epoch': 0.5}
 50%|████▉     | 1715/3449 [1:20:55<1:26:16,  2.99s/it] 50%|████▉     | 1716/3449 [1:20:58<1:22:54,  2.87s/it]                                                       {'loss': 1.4484, 'learning_rate': 0.00021096989791849632, 'epoch': 0.5}
 50%|████▉     | 1716/3449 [1:20:58<1:22:54,  2.87s/it] 50%|████▉     | 1717/3449 [1:21:01<1:23:25,  2.89s/it]                                                       {'loss': 1.2193, 'learning_rate': 0.0002107825617723445, 'epoch': 0.5}
 50%|████▉     | 1717/3449 [1:21:01<1:23:25,  2.89s/it] 50%|████▉     | 1718/3449 [1:21:03<1:19:28,  2.75s/it]                                                       {'loss': 1.2302, 'learning_rate': 0.0002105952161378279, 'epoch': 0.5}
 50%|████▉     | 1718/3449 [1:21:03<1:19:28,  2.75s/it] 50%|████▉     | 1719/3449 [1:21:06<1:17:51,  2.70s/it]                                                       {'loss': 1.1346, 'learning_rate': 0.0002104078611798057, 'epoch': 0.5}
 50%|████▉     | 1719/3449 [1:21:06<1:17:51,  2.70s/it] 50%|████▉     | 1720/3449 [1:21:09<1:19:07,  2.75s/it]                                                       {'loss': 1.3832, 'learning_rate': 0.0002102204970631451, 'epoch': 0.5}
 50%|████▉     | 1720/3449 [1:21:09<1:19:07,  2.75s/it] 50%|████▉     | 1721/3449 [1:21:13<1:34:54,  3.30s/it]                                                       {'loss': 1.0992, 'learning_rate': 0.00021003312395272155, 'epoch': 0.5}
 50%|████▉     | 1721/3449 [1:21:13<1:34:54,  3.30s/it] 50%|████▉     | 1722/3449 [1:21:17<1:36:14,  3.34s/it]                                                       {'loss': 1.1517, 'learning_rate': 0.00020984574201341838, 'epoch': 0.5}
 50%|████▉     | 1722/3449 [1:21:17<1:36:14,  3.34s/it] 50%|████▉     | 1723/3449 [1:21:19<1:30:08,  3.13s/it]                                                       {'loss': 1.1362, 'learning_rate': 0.00020965835141012668, 'epoch': 0.5}
 50%|████▉     | 1723/3449 [1:21:19<1:30:08,  3.13s/it] 50%|████▉     | 1724/3449 [1:21:22<1:26:29,  3.01s/it]                                                       {'loss': 1.3007, 'learning_rate': 0.00020947095230774512, 'epoch': 0.5}
 50%|████▉     | 1724/3449 [1:21:22<1:26:29,  3.01s/it] 50%|█████     | 1725/3449 [1:21:25<1:24:07,  2.93s/it]                                                       {'loss': 1.3205, 'learning_rate': 0.0002092835448711798, 'epoch': 0.5}
 50%|█████     | 1725/3449 [1:21:25<1:24:07,  2.93s/it] 50%|█████     | 1726/3449 [1:21:28<1:24:16,  2.93s/it]                                                       {'loss': 1.2617, 'learning_rate': 0.0002090961292653444, 'epoch': 0.5}
 50%|█████     | 1726/3449 [1:21:28<1:24:16,  2.93s/it] 50%|█████     | 1727/3449 [1:21:31<1:24:05,  2.93s/it]                                                       {'loss': 1.1763, 'learning_rate': 0.00020890870565515944, 'epoch': 0.5}
 50%|█████     | 1727/3449 [1:21:31<1:24:05,  2.93s/it] 50%|█████     | 1728/3449 [1:21:33<1:18:43,  2.74s/it]                                                       {'loss': 1.326, 'learning_rate': 0.00020872127420555278, 'epoch': 0.5}
 50%|█████     | 1728/3449 [1:21:33<1:18:43,  2.74s/it] 50%|█████     | 1729/3449 [1:21:36<1:22:47,  2.89s/it]                                                       {'loss': 1.3401, 'learning_rate': 0.00020853383508145904, 'epoch': 0.5}
 50%|█████     | 1729/3449 [1:21:36<1:22:47,  2.89s/it] 50%|█████     | 1730/3449 [1:21:39<1:18:55,  2.75s/it]                                                       {'loss': 1.35, 'learning_rate': 0.00020834638844781958, 'epoch': 0.5}
 50%|█████     | 1730/3449 [1:21:39<1:18:55,  2.75s/it] 50%|█████     | 1731/3449 [1:21:41<1:16:20,  2.67s/it]                                                       {'loss': 1.3658, 'learning_rate': 0.0002081589344695825, 'epoch': 0.5}
 50%|█████     | 1731/3449 [1:21:41<1:16:20,  2.67s/it] 50%|█████     | 1732/3449 [1:21:44<1:18:26,  2.74s/it]                                                       {'loss': 1.1912, 'learning_rate': 0.0002079714733117021, 'epoch': 0.5}
 50%|█████     | 1732/3449 [1:21:44<1:18:26,  2.74s/it] 50%|█████     | 1733/3449 [1:21:47<1:20:58,  2.83s/it]                                                       {'loss': 1.2274, 'learning_rate': 0.00020778400513913936, 'epoch': 0.5}
 50%|█████     | 1733/3449 [1:21:47<1:20:58,  2.83s/it] 50%|█████     | 1734/3449 [1:21:50<1:18:16,  2.74s/it]                                                       {'loss': 1.3335, 'learning_rate': 0.00020759653011686108, 'epoch': 0.5}
 50%|█████     | 1734/3449 [1:21:50<1:18:16,  2.74s/it] 50%|█████     | 1735/3449 [1:21:52<1:16:24,  2.67s/it]                                                       {'loss': 1.448, 'learning_rate': 0.00020740904840984024, 'epoch': 0.5}
 50%|█████     | 1735/3449 [1:21:52<1:16:24,  2.67s/it] 50%|█████     | 1736/3449 [1:21:55<1:17:16,  2.71s/it]                                                       {'loss': 1.2446, 'learning_rate': 0.00020722156018305587, 'epoch': 0.5}
 50%|█████     | 1736/3449 [1:21:55<1:17:16,  2.71s/it] 50%|█████     | 1737/3449 [1:21:58<1:19:58,  2.80s/it]                                                       {'loss': 1.2779, 'learning_rate': 0.00020703406560149246, 'epoch': 0.5}
 50%|█████     | 1737/3449 [1:21:58<1:19:58,  2.80s/it] 50%|█████     | 1738/3449 [1:22:01<1:18:57,  2.77s/it]                                                       {'loss': 1.2144, 'learning_rate': 0.0002068465648301402, 'epoch': 0.5}
 50%|█████     | 1738/3449 [1:22:01<1:18:57,  2.77s/it] 50%|█████     | 1739/3449 [1:22:03<1:16:03,  2.67s/it]                                                       {'loss': 1.2173, 'learning_rate': 0.00020665905803399475, 'epoch': 0.5}
 50%|█████     | 1739/3449 [1:22:03<1:16:03,  2.67s/it] 50%|█████     | 1740/3449 [1:22:05<1:12:32,  2.55s/it]                                                       {'loss': 1.2191, 'learning_rate': 0.00020647154537805707, 'epoch': 0.5}
 50%|█████     | 1740/3449 [1:22:05<1:12:32,  2.55s/it] 50%|█████     | 1741/3449 [1:22:09<1:18:01,  2.74s/it]                                                       {'loss': 1.3689, 'learning_rate': 0.00020628402702733333, 'epoch': 0.5}
 50%|█████     | 1741/3449 [1:22:09<1:18:01,  2.74s/it] 51%|█████     | 1742/3449 [1:22:11<1:17:55,  2.74s/it]                                                       {'loss': 1.2727, 'learning_rate': 0.00020609650314683443, 'epoch': 0.51}
 51%|█████     | 1742/3449 [1:22:11<1:17:55,  2.74s/it] 51%|█████     | 1743/3449 [1:22:14<1:21:02,  2.85s/it]                                                       {'loss': 1.204, 'learning_rate': 0.00020590897390157658, 'epoch': 0.51}
 51%|█████     | 1743/3449 [1:22:14<1:21:02,  2.85s/it] 51%|█████     | 1744/3449 [1:22:18<1:26:47,  3.05s/it]                                                       {'loss': 1.0915, 'learning_rate': 0.00020572143945658033, 'epoch': 0.51}
 51%|█████     | 1744/3449 [1:22:18<1:26:47,  3.05s/it] 51%|█████     | 1745/3449 [1:22:21<1:24:58,  2.99s/it]                                                       {'loss': 1.1278, 'learning_rate': 0.000205533899976871, 'epoch': 0.51}
 51%|█████     | 1745/3449 [1:22:21<1:24:58,  2.99s/it] 51%|█████     | 1746/3449 [1:22:23<1:21:50,  2.88s/it]                                                       {'loss': 1.296, 'learning_rate': 0.00020534635562747836, 'epoch': 0.51}
 51%|█████     | 1746/3449 [1:22:23<1:21:50,  2.88s/it] 51%|█████     | 1747/3449 [1:22:27<1:24:20,  2.97s/it]                                                       {'loss': 1.2309, 'learning_rate': 0.00020515880657343626, 'epoch': 0.51}
 51%|█████     | 1747/3449 [1:22:27<1:24:20,  2.97s/it] 51%|█████     | 1748/3449 [1:22:29<1:20:32,  2.84s/it]                                                       {'loss': 1.2488, 'learning_rate': 0.00020497125297978306, 'epoch': 0.51}
 51%|█████     | 1748/3449 [1:22:29<1:20:32,  2.84s/it] 51%|█████     | 1749/3449 [1:22:33<1:26:32,  3.05s/it]                                                       {'loss': 1.3245, 'learning_rate': 0.0002047836950115606, 'epoch': 0.51}
 51%|█████     | 1749/3449 [1:22:33<1:26:32,  3.05s/it] 51%|█████     | 1750/3449 [1:22:35<1:24:24,  2.98s/it]                                                       {'loss': 1.2342, 'learning_rate': 0.00020459613283381508, 'epoch': 0.51}
 51%|█████     | 1750/3449 [1:22:35<1:24:24,  2.98s/it] 51%|█████     | 1751/3449 [1:22:38<1:19:59,  2.83s/it]                                                       {'loss': 1.3295, 'learning_rate': 0.00020440856661159607, 'epoch': 0.51}
 51%|█████     | 1751/3449 [1:22:38<1:19:59,  2.83s/it] 51%|█████     | 1752/3449 [1:22:41<1:21:25,  2.88s/it]                                                       {'loss': 1.2263, 'learning_rate': 0.00020422099650995682, 'epoch': 0.51}
 51%|█████     | 1752/3449 [1:22:41<1:21:25,  2.88s/it] 51%|█████     | 1753/3449 [1:22:44<1:18:50,  2.79s/it]                                                       {'loss': 1.2933, 'learning_rate': 0.00020403342269395398, 'epoch': 0.51}
 51%|█████     | 1753/3449 [1:22:44<1:18:50,  2.79s/it] 51%|█████     | 1754/3449 [1:22:46<1:16:44,  2.72s/it]                                                       {'loss': 1.2176, 'learning_rate': 0.00020384584532864755, 'epoch': 0.51}
 51%|█████     | 1754/3449 [1:22:46<1:16:44,  2.72s/it] 51%|█████     | 1755/3449 [1:22:49<1:19:21,  2.81s/it]                                                       {'loss': 1.1661, 'learning_rate': 0.0002036582645791005, 'epoch': 0.51}
 51%|█████     | 1755/3449 [1:22:49<1:19:21,  2.81s/it] 51%|█████     | 1756/3449 [1:22:52<1:24:10,  2.98s/it]                                                       {'loss': 1.1245, 'learning_rate': 0.00020347068061037882, 'epoch': 0.51}
 51%|█████     | 1756/3449 [1:22:52<1:24:10,  2.98s/it] 51%|█████     | 1757/3449 [1:22:56<1:24:44,  3.00s/it]                                                       {'loss': 1.0989, 'learning_rate': 0.00020328309358755138, 'epoch': 0.51}
 51%|█████     | 1757/3449 [1:22:56<1:24:44,  3.00s/it] 51%|█████     | 1758/3449 [1:22:58<1:23:16,  2.95s/it]                                                       {'loss': 1.3625, 'learning_rate': 0.00020309550367568987, 'epoch': 0.51}
 51%|█████     | 1758/3449 [1:22:58<1:23:16,  2.95s/it] 51%|█████     | 1759/3449 [1:23:02<1:28:01,  3.13s/it]                                                       {'loss': 1.2103, 'learning_rate': 0.00020290791103986817, 'epoch': 0.51}
 51%|█████     | 1759/3449 [1:23:02<1:28:01,  3.13s/it] 51%|█████     | 1760/3449 [1:23:05<1:25:19,  3.03s/it]                                                       {'loss': 1.2691, 'learning_rate': 0.00020272031584516283, 'epoch': 0.51}
 51%|█████     | 1760/3449 [1:23:05<1:25:19,  3.03s/it] 51%|█████     | 1761/3449 [1:23:07<1:19:44,  2.83s/it]                                                       {'loss': 1.1926, 'learning_rate': 0.00020253271825665262, 'epoch': 0.51}
 51%|█████     | 1761/3449 [1:23:07<1:19:44,  2.83s/it] 51%|█████     | 1762/3449 [1:23:10<1:21:07,  2.89s/it]                                                       {'loss': 1.2589, 'learning_rate': 0.00020234511843941842, 'epoch': 0.51}
 51%|█████     | 1762/3449 [1:23:10<1:21:07,  2.89s/it] 51%|█████     | 1763/3449 [1:23:13<1:17:57,  2.77s/it]                                                       {'loss': 1.2766, 'learning_rate': 0.00020215751655854294, 'epoch': 0.51}
 51%|█████     | 1763/3449 [1:23:13<1:17:57,  2.77s/it] 51%|█████     | 1764/3449 [1:23:15<1:14:25,  2.65s/it]                                                       {'loss': 1.3038, 'learning_rate': 0.00020196991277911076, 'epoch': 0.51}
 51%|█████     | 1764/3449 [1:23:15<1:14:25,  2.65s/it] 51%|█████     | 1765/3449 [1:23:18<1:14:39,  2.66s/it]                                                       {'loss': 1.4479, 'learning_rate': 0.00020178230726620834, 'epoch': 0.51}
 51%|█████     | 1765/3449 [1:23:18<1:14:39,  2.66s/it] 51%|█████     | 1766/3449 [1:23:21<1:17:13,  2.75s/it]                                                       {'loss': 1.2686, 'learning_rate': 0.00020159470018492334, 'epoch': 0.51}
 51%|█████     | 1766/3449 [1:23:21<1:17:13,  2.75s/it] 51%|█████     | 1767/3449 [1:23:23<1:17:04,  2.75s/it]                                                       {'loss': 1.2697, 'learning_rate': 0.000201407091700345, 'epoch': 0.51}
 51%|█████     | 1767/3449 [1:23:23<1:17:04,  2.75s/it] 51%|█████▏    | 1768/3449 [1:23:26<1:17:03,  2.75s/it]                                                       {'loss': 1.2278, 'learning_rate': 0.00020121948197756378, 'epoch': 0.51}
 51%|█████▏    | 1768/3449 [1:23:26<1:17:03,  2.75s/it] 51%|█████▏    | 1769/3449 [1:23:29<1:18:13,  2.79s/it]                                                       {'loss': 1.3453, 'learning_rate': 0.00020103187118167113, 'epoch': 0.51}
 51%|█████▏    | 1769/3449 [1:23:29<1:18:13,  2.79s/it] 51%|█████▏    | 1770/3449 [1:23:32<1:16:36,  2.74s/it]                                                       {'loss': 1.3718, 'learning_rate': 0.00020084425947775964, 'epoch': 0.51}
 51%|█████▏    | 1770/3449 [1:23:32<1:16:36,  2.74s/it] 51%|█████▏    | 1771/3449 [1:23:34<1:15:14,  2.69s/it]                                                       {'loss': 1.2697, 'learning_rate': 0.00020065664703092234, 'epoch': 0.51}
 51%|█████▏    | 1771/3449 [1:23:34<1:15:14,  2.69s/it] 51%|█████▏    | 1772/3449 [1:23:37<1:13:01,  2.61s/it]                                                       {'loss': 1.3464, 'learning_rate': 0.00020046903400625337, 'epoch': 0.51}
 51%|█████▏    | 1772/3449 [1:23:37<1:13:01,  2.61s/it] 51%|█████▏    | 1773/3449 [1:23:39<1:12:52,  2.61s/it]                                                       {'loss': 1.1875, 'learning_rate': 0.00020028142056884707, 'epoch': 0.51}
 51%|█████▏    | 1773/3449 [1:23:39<1:12:52,  2.61s/it] 51%|█████▏    | 1774/3449 [1:23:43<1:23:58,  3.01s/it]                                                       {'loss': 1.1808, 'learning_rate': 0.00020009380688379823, 'epoch': 0.51}
 51%|█████▏    | 1774/3449 [1:23:43<1:23:58,  3.01s/it] 51%|█████▏    | 1775/3449 [1:23:46<1:24:10,  3.02s/it]                                                       {'loss': 1.4971, 'learning_rate': 0.00019990619311620187, 'epoch': 0.51}
 51%|█████▏    | 1775/3449 [1:23:46<1:24:10,  3.02s/it] 51%|█████▏    | 1776/3449 [1:23:48<1:18:08,  2.80s/it]                                                       {'loss': 1.3897, 'learning_rate': 0.00019971857943115298, 'epoch': 0.51}
 51%|█████▏    | 1776/3449 [1:23:48<1:18:08,  2.80s/it] 52%|█████▏    | 1777/3449 [1:23:51<1:16:15,  2.74s/it]                                                       {'loss': 1.1833, 'learning_rate': 0.00019953096599374665, 'epoch': 0.52}
 52%|█████▏    | 1777/3449 [1:23:51<1:16:15,  2.74s/it] 52%|█████▏    | 1778/3449 [1:23:54<1:15:27,  2.71s/it]                                                       {'loss': 1.2285, 'learning_rate': 0.0001993433529690777, 'epoch': 0.52}
 52%|█████▏    | 1778/3449 [1:23:54<1:15:27,  2.71s/it] 52%|█████▏    | 1779/3449 [1:23:58<1:27:33,  3.15s/it]                                                       {'loss': 1.1576, 'learning_rate': 0.0001991557405222404, 'epoch': 0.52}
 52%|█████▏    | 1779/3449 [1:23:58<1:27:33,  3.15s/it] 52%|█████▏    | 1780/3449 [1:24:00<1:20:03,  2.88s/it]                                                       {'loss': 1.3432, 'learning_rate': 0.00019896812881832886, 'epoch': 0.52}
 52%|█████▏    | 1780/3449 [1:24:00<1:20:03,  2.88s/it] 52%|█████▏    | 1781/3449 [1:24:03<1:17:33,  2.79s/it]                                                       {'loss': 1.2711, 'learning_rate': 0.00019878051802243627, 'epoch': 0.52}
 52%|█████▏    | 1781/3449 [1:24:03<1:17:33,  2.79s/it] 52%|█████▏    | 1782/3449 [1:24:06<1:18:44,  2.83s/it]                                                       {'loss': 1.2324, 'learning_rate': 0.000198592908299655, 'epoch': 0.52}
 52%|█████▏    | 1782/3449 [1:24:06<1:18:44,  2.83s/it] 52%|█████▏    | 1783/3449 [1:24:08<1:14:57,  2.70s/it]                                                       {'loss': 1.1896, 'learning_rate': 0.00019840529981507673, 'epoch': 0.52}
 52%|█████▏    | 1783/3449 [1:24:08<1:14:57,  2.70s/it] 52%|█████▏    | 1784/3449 [1:24:10<1:12:01,  2.60s/it]                                                       {'loss': 1.3337, 'learning_rate': 0.0001982176927337917, 'epoch': 0.52}
 52%|█████▏    | 1784/3449 [1:24:10<1:12:01,  2.60s/it] 52%|█████▏    | 1785/3449 [1:24:14<1:17:27,  2.79s/it]                                                       {'loss': 1.1819, 'learning_rate': 0.00019803008722088923, 'epoch': 0.52}
 52%|█████▏    | 1785/3449 [1:24:14<1:17:27,  2.79s/it] 52%|█████▏    | 1786/3449 [1:24:17<1:20:15,  2.90s/it]                                                       {'loss': 1.1241, 'learning_rate': 0.00019784248344145713, 'epoch': 0.52}
 52%|█████▏    | 1786/3449 [1:24:17<1:20:15,  2.90s/it] 52%|█████▏    | 1787/3449 [1:24:19<1:15:28,  2.72s/it]                                                       {'loss': 1.1671, 'learning_rate': 0.00019765488156058163, 'epoch': 0.52}
 52%|█████▏    | 1787/3449 [1:24:19<1:15:28,  2.72s/it] 52%|█████▏    | 1788/3449 [1:24:22<1:14:47,  2.70s/it]                                                       {'loss': 1.4065, 'learning_rate': 0.00019746728174334735, 'epoch': 0.52}
 52%|█████▏    | 1788/3449 [1:24:22<1:14:47,  2.70s/it] 52%|█████▏    | 1789/3449 [1:24:24<1:14:30,  2.69s/it]                                                       {'loss': 1.1221, 'learning_rate': 0.00019727968415483719, 'epoch': 0.52}
 52%|█████▏    | 1789/3449 [1:24:24<1:14:30,  2.69s/it] 52%|█████▏    | 1790/3449 [1:24:27<1:10:44,  2.56s/it]                                                       {'loss': 1.4375, 'learning_rate': 0.00019709208896013188, 'epoch': 0.52}
 52%|█████▏    | 1790/3449 [1:24:27<1:10:44,  2.56s/it] 52%|█████▏    | 1791/3449 [1:24:30<1:13:47,  2.67s/it]                                                       {'loss': 1.1551, 'learning_rate': 0.00019690449632431015, 'epoch': 0.52}
 52%|█████▏    | 1791/3449 [1:24:30<1:13:47,  2.67s/it] 52%|█████▏    | 1792/3449 [1:24:32<1:13:28,  2.66s/it]                                                       {'loss': 1.2459, 'learning_rate': 0.00019671690641244867, 'epoch': 0.52}
 52%|█████▏    | 1792/3449 [1:24:32<1:13:28,  2.66s/it] 52%|█████▏    | 1793/3449 [1:24:35<1:17:22,  2.80s/it]                                                       {'loss': 1.1629, 'learning_rate': 0.00019652931938962122, 'epoch': 0.52}
 52%|█████▏    | 1793/3449 [1:24:35<1:17:22,  2.80s/it] 52%|█████▏    | 1794/3449 [1:24:38<1:16:46,  2.78s/it]                                                       {'loss': 1.3189, 'learning_rate': 0.0001963417354208996, 'epoch': 0.52}
 52%|█████▏    | 1794/3449 [1:24:38<1:16:46,  2.78s/it] 52%|█████▏    | 1795/3449 [1:24:41<1:16:47,  2.79s/it]                                                       {'loss': 1.2855, 'learning_rate': 0.00019615415467135253, 'epoch': 0.52}
 52%|█████▏    | 1795/3449 [1:24:41<1:16:47,  2.79s/it] 52%|█████▏    | 1796/3449 [1:24:45<1:23:28,  3.03s/it]                                                       {'loss': 1.1692, 'learning_rate': 0.00019596657730604599, 'epoch': 0.52}
 52%|█████▏    | 1796/3449 [1:24:45<1:23:28,  3.03s/it] 52%|█████▏    | 1797/3449 [1:24:47<1:19:10,  2.88s/it]                                                       {'loss': 1.2151, 'learning_rate': 0.00019577900349004328, 'epoch': 0.52}
 52%|█████▏    | 1797/3449 [1:24:47<1:19:10,  2.88s/it] 52%|█████▏    | 1798/3449 [1:24:51<1:30:41,  3.30s/it]                                                       {'loss': 1.1155, 'learning_rate': 0.000195591433388404, 'epoch': 0.52}
 52%|█████▏    | 1798/3449 [1:24:51<1:30:41,  3.30s/it] 52%|█████▏    | 1799/3449 [1:24:54<1:22:34,  3.00s/it]                                                       {'loss': 1.1559, 'learning_rate': 0.00019540386716618497, 'epoch': 0.52}
 52%|█████▏    | 1799/3449 [1:24:54<1:22:34,  3.00s/it] 52%|█████▏    | 1800/3449 [1:24:56<1:14:42,  2.72s/it]                                                       {'loss': 1.265, 'learning_rate': 0.00019521630498843946, 'epoch': 0.52}
 52%|█████▏    | 1800/3449 [1:24:56<1:14:42,  2.72s/it] 52%|█████▏    | 1801/3449 [1:24:58<1:12:50,  2.65s/it]                                                       {'loss': 1.3046, 'learning_rate': 0.000195028747020217, 'epoch': 0.52}
 52%|█████▏    | 1801/3449 [1:24:58<1:12:50,  2.65s/it] 52%|█████▏    | 1802/3449 [1:25:01<1:11:38,  2.61s/it]                                                       {'loss': 1.1584, 'learning_rate': 0.0001948411934265637, 'epoch': 0.52}
 52%|█████▏    | 1802/3449 [1:25:01<1:11:38,  2.61s/it] 52%|█████▏    | 1803/3449 [1:25:04<1:18:29,  2.86s/it]                                                       {'loss': 1.2032, 'learning_rate': 0.0001946536443725217, 'epoch': 0.52}
 52%|█████▏    | 1803/3449 [1:25:04<1:18:29,  2.86s/it] 52%|█████▏    | 1804/3449 [1:25:07<1:14:55,  2.73s/it]                                                       {'loss': 1.2944, 'learning_rate': 0.00019446610002312904, 'epoch': 0.52}
 52%|█████▏    | 1804/3449 [1:25:07<1:14:55,  2.73s/it] 52%|█████▏    | 1805/3449 [1:25:09<1:10:47,  2.58s/it]                                                       {'loss': 1.204, 'learning_rate': 0.00019427856054341977, 'epoch': 0.52}
 52%|█████▏    | 1805/3449 [1:25:09<1:10:47,  2.58s/it] 52%|█████▏    | 1806/3449 [1:25:12<1:16:33,  2.80s/it]                                                       {'loss': 1.1544, 'learning_rate': 0.0001940910260984235, 'epoch': 0.52}
 52%|█████▏    | 1806/3449 [1:25:12<1:16:33,  2.80s/it] 52%|█████▏    | 1807/3449 [1:25:15<1:15:49,  2.77s/it]                                                       {'loss': 1.2579, 'learning_rate': 0.0001939034968531656, 'epoch': 0.52}
 52%|█████▏    | 1807/3449 [1:25:15<1:15:49,  2.77s/it] 52%|█████▏    | 1808/3449 [1:25:17<1:13:51,  2.70s/it]                                                       {'loss': 1.0909, 'learning_rate': 0.0001937159729726668, 'epoch': 0.52}
 52%|█████▏    | 1808/3449 [1:25:17<1:13:51,  2.70s/it] 52%|█████▏    | 1809/3449 [1:25:20<1:11:43,  2.62s/it]                                                       {'loss': 1.3664, 'learning_rate': 0.00019352845462194298, 'epoch': 0.52}
 52%|█████▏    | 1809/3449 [1:25:20<1:11:43,  2.62s/it] 52%|█████▏    | 1810/3449 [1:25:23<1:12:35,  2.66s/it]                                                       {'loss': 1.1503, 'learning_rate': 0.00019334094196600524, 'epoch': 0.52}
 52%|█████▏    | 1810/3449 [1:25:23<1:12:35,  2.66s/it] 53%|█████▎    | 1811/3449 [1:25:26<1:15:52,  2.78s/it]                                                       {'loss': 1.34, 'learning_rate': 0.00019315343516985984, 'epoch': 0.53}
 53%|█████▎    | 1811/3449 [1:25:26<1:15:52,  2.78s/it] 53%|█████▎    | 1812/3449 [1:25:29<1:17:32,  2.84s/it]                                                       {'loss': 1.2586, 'learning_rate': 0.0001929659343985076, 'epoch': 0.53}
 53%|█████▎    | 1812/3449 [1:25:29<1:17:32,  2.84s/it] 53%|█████▎    | 1813/3449 [1:25:31<1:15:06,  2.75s/it]                                                       {'loss': 1.3166, 'learning_rate': 0.00019277843981694413, 'epoch': 0.53}
 53%|█████▎    | 1813/3449 [1:25:31<1:15:06,  2.75s/it] 53%|█████▎    | 1814/3449 [1:25:34<1:15:00,  2.75s/it]                                                       {'loss': 1.2709, 'learning_rate': 0.0001925909515901598, 'epoch': 0.53}
 53%|█████▎    | 1814/3449 [1:25:34<1:15:00,  2.75s/it] 53%|█████▎    | 1815/3449 [1:25:36<1:12:06,  2.65s/it]                                                       {'loss': 1.3008, 'learning_rate': 0.00019240346988313897, 'epoch': 0.53}
 53%|█████▎    | 1815/3449 [1:25:36<1:12:06,  2.65s/it] 53%|█████▎    | 1816/3449 [1:25:40<1:19:43,  2.93s/it]                                                       {'loss': 1.1732, 'learning_rate': 0.00019221599486086071, 'epoch': 0.53}
 53%|█████▎    | 1816/3449 [1:25:40<1:19:43,  2.93s/it] 53%|█████▎    | 1817/3449 [1:25:42<1:16:48,  2.82s/it]                                                       {'loss': 1.1985, 'learning_rate': 0.00019202852668829797, 'epoch': 0.53}
 53%|█████▎    | 1817/3449 [1:25:42<1:16:48,  2.82s/it] 53%|█████▎    | 1818/3449 [1:25:45<1:17:27,  2.85s/it]                                                       {'loss': 1.2671, 'learning_rate': 0.00019184106553041754, 'epoch': 0.53}
 53%|█████▎    | 1818/3449 [1:25:45<1:17:27,  2.85s/it] 53%|█████▎    | 1819/3449 [1:25:48<1:18:33,  2.89s/it]                                                       {'loss': 1.4103, 'learning_rate': 0.00019165361155218044, 'epoch': 0.53}
 53%|█████▎    | 1819/3449 [1:25:48<1:18:33,  2.89s/it] 53%|█████▎    | 1820/3449 [1:25:51<1:16:39,  2.82s/it]                                                       {'loss': 1.1864, 'learning_rate': 0.000191466164918541, 'epoch': 0.53}
 53%|█████▎    | 1820/3449 [1:25:51<1:16:39,  2.82s/it] 53%|█████▎    | 1821/3449 [1:25:54<1:16:09,  2.81s/it]                                                       {'loss': 1.215, 'learning_rate': 0.00019127872579444727, 'epoch': 0.53}
 53%|█████▎    | 1821/3449 [1:25:54<1:16:09,  2.81s/it] 53%|█████▎    | 1822/3449 [1:25:57<1:21:52,  3.02s/it]                                                       {'loss': 1.0866, 'learning_rate': 0.00019109129434484063, 'epoch': 0.53}
 53%|█████▎    | 1822/3449 [1:25:57<1:21:52,  3.02s/it] 53%|█████▎    | 1823/3449 [1:26:00<1:17:31,  2.86s/it]                                                       {'loss': 1.1126, 'learning_rate': 0.00019090387073465565, 'epoch': 0.53}
 53%|█████▎    | 1823/3449 [1:26:00<1:17:31,  2.86s/it] 53%|█████▎    | 1824/3449 [1:26:02<1:13:38,  2.72s/it]                                                       {'loss': 1.2809, 'learning_rate': 0.00019071645512882022, 'epoch': 0.53}
 53%|█████▎    | 1824/3449 [1:26:02<1:13:38,  2.72s/it] 53%|█████▎    | 1825/3449 [1:26:05<1:11:13,  2.63s/it]                                                       {'loss': 1.1704, 'learning_rate': 0.00019052904769225498, 'epoch': 0.53}
 53%|█████▎    | 1825/3449 [1:26:05<1:11:13,  2.63s/it] 53%|█████▎    | 1826/3449 [1:26:07<1:08:03,  2.52s/it]                                                       {'loss': 1.2752, 'learning_rate': 0.0001903416485898734, 'epoch': 0.53}
 53%|█████▎    | 1826/3449 [1:26:07<1:08:03,  2.52s/it] 53%|█████▎    | 1827/3449 [1:26:09<1:08:59,  2.55s/it]                                                       {'loss': 1.2683, 'learning_rate': 0.00019015425798658158, 'epoch': 0.53}
 53%|█████▎    | 1827/3449 [1:26:09<1:08:59,  2.55s/it] 53%|█████▎    | 1828/3449 [1:26:13<1:16:00,  2.81s/it]                                                       {'loss': 1.1622, 'learning_rate': 0.00018996687604727847, 'epoch': 0.53}
 53%|█████▎    | 1828/3449 [1:26:13<1:16:00,  2.81s/it] 53%|█████▎    | 1829/3449 [1:26:16<1:15:48,  2.81s/it]                                                       {'loss': 1.3076, 'learning_rate': 0.00018977950293685492, 'epoch': 0.53}
 53%|█████▎    | 1829/3449 [1:26:16<1:15:48,  2.81s/it] 53%|█████▎    | 1830/3449 [1:26:18<1:11:49,  2.66s/it]                                                       {'loss': 1.3259, 'learning_rate': 0.0001895921388201944, 'epoch': 0.53}
 53%|█████▎    | 1830/3449 [1:26:18<1:11:49,  2.66s/it] 53%|█████▎    | 1831/3449 [1:26:21<1:10:23,  2.61s/it]                                                       {'loss': 1.2067, 'learning_rate': 0.00018940478386217214, 'epoch': 0.53}
 53%|█████▎    | 1831/3449 [1:26:21<1:10:23,  2.61s/it] 53%|█████▎    | 1832/3449 [1:26:23<1:09:36,  2.58s/it]                                                       {'loss': 1.231, 'learning_rate': 0.00018921743822765549, 'epoch': 0.53}
 53%|█████▎    | 1832/3449 [1:26:23<1:09:36,  2.58s/it] 53%|█████▎    | 1833/3449 [1:26:26<1:15:03,  2.79s/it]                                                       {'loss': 1.1243, 'learning_rate': 0.00018903010208150376, 'epoch': 0.53}
 53%|█████▎    | 1833/3449 [1:26:26<1:15:03,  2.79s/it] 53%|█████▎    | 1834/3449 [1:26:29<1:12:06,  2.68s/it]                                                       {'loss': 1.2191, 'learning_rate': 0.0001888427755885675, 'epoch': 0.53}
 53%|█████▎    | 1834/3449 [1:26:29<1:12:06,  2.68s/it] 53%|█████▎    | 1835/3449 [1:26:31<1:10:04,  2.60s/it]                                                       {'loss': 1.2055, 'learning_rate': 0.0001886554589136891, 'epoch': 0.53}
 53%|█████▎    | 1835/3449 [1:26:31<1:10:04,  2.60s/it] 53%|█████▎    | 1836/3449 [1:26:33<1:07:35,  2.51s/it]                                                       {'loss': 1.2521, 'learning_rate': 0.00018846815222170227, 'epoch': 0.53}
 53%|█████▎    | 1836/3449 [1:26:33<1:07:35,  2.51s/it] 53%|█████▎    | 1837/3449 [1:26:36<1:05:58,  2.46s/it]                                                       {'loss': 1.3047, 'learning_rate': 0.00018828085567743172, 'epoch': 0.53}
 53%|█████▎    | 1837/3449 [1:26:36<1:05:58,  2.46s/it] 53%|█████▎    | 1838/3449 [1:26:38<1:06:18,  2.47s/it]                                                       {'loss': 1.3104, 'learning_rate': 0.00018809356944569347, 'epoch': 0.53}
 53%|█████▎    | 1838/3449 [1:26:38<1:06:18,  2.47s/it] 53%|█████▎    | 1839/3449 [1:26:42<1:12:51,  2.72s/it]                                                       {'loss': 1.3183, 'learning_rate': 0.00018790629369129443, 'epoch': 0.53}
 53%|█████▎    | 1839/3449 [1:26:42<1:12:51,  2.72s/it] 53%|█████▎    | 1840/3449 [1:26:44<1:12:49,  2.72s/it]                                                       {'loss': 1.319, 'learning_rate': 0.00018771902857903205, 'epoch': 0.53}
 53%|█████▎    | 1840/3449 [1:26:44<1:12:49,  2.72s/it] 53%|█████▎    | 1841/3449 [1:26:47<1:13:52,  2.76s/it]                                                       {'loss': 1.2781, 'learning_rate': 0.0001875317742736948, 'epoch': 0.53}
 53%|█████▎    | 1841/3449 [1:26:47<1:13:52,  2.76s/it] 53%|█████▎    | 1842/3449 [1:26:50<1:14:09,  2.77s/it]                                                       {'loss': 1.2302, 'learning_rate': 0.0001873445309400613, 'epoch': 0.53}
 53%|█████▎    | 1842/3449 [1:26:50<1:14:09,  2.77s/it] 53%|█████▎    | 1843/3449 [1:26:53<1:16:27,  2.86s/it]                                                       {'loss': 1.2587, 'learning_rate': 0.00018715729874290072, 'epoch': 0.53}
 53%|█████▎    | 1843/3449 [1:26:53<1:16:27,  2.86s/it] 53%|█████▎    | 1844/3449 [1:26:55<1:12:56,  2.73s/it]                                                       {'loss': 1.2196, 'learning_rate': 0.0001869700778469724, 'epoch': 0.53}
 53%|█████▎    | 1844/3449 [1:26:55<1:12:56,  2.73s/it] 53%|█████▎    | 1845/3449 [1:26:58<1:11:46,  2.69s/it]                                                       {'loss': 1.1679, 'learning_rate': 0.00018678286841702557, 'epoch': 0.53}
 53%|█████▎    | 1845/3449 [1:26:58<1:11:46,  2.69s/it] 54%|█████▎    | 1846/3449 [1:27:01<1:14:38,  2.79s/it]                                                       {'loss': 1.2004, 'learning_rate': 0.0001865956706177996, 'epoch': 0.54}
 54%|█████▎    | 1846/3449 [1:27:01<1:14:38,  2.79s/it] 54%|█████▎    | 1847/3449 [1:27:04<1:14:36,  2.79s/it]                                                       {'loss': 1.1903, 'learning_rate': 0.00018640848461402357, 'epoch': 0.54}
 54%|█████▎    | 1847/3449 [1:27:04<1:14:36,  2.79s/it] 54%|█████▎    | 1848/3449 [1:27:07<1:13:32,  2.76s/it]                                                       {'loss': 1.2346, 'learning_rate': 0.00018622131057041604, 'epoch': 0.54}
 54%|█████▎    | 1848/3449 [1:27:07<1:13:32,  2.76s/it] 54%|█████▎    | 1849/3449 [1:27:09<1:13:29,  2.76s/it]                                                       {'loss': 1.1841, 'learning_rate': 0.00018603414865168513, 'epoch': 0.54}
 54%|█████▎    | 1849/3449 [1:27:09<1:13:29,  2.76s/it] 54%|█████▎    | 1850/3449 [1:27:12<1:11:25,  2.68s/it]                                                       {'loss': 1.285, 'learning_rate': 0.00018584699902252848, 'epoch': 0.54}
 54%|█████▎    | 1850/3449 [1:27:12<1:11:25,  2.68s/it] 54%|█████▎    | 1851/3449 [1:27:14<1:08:41,  2.58s/it]                                                       {'loss': 1.129, 'learning_rate': 0.0001856598618476325, 'epoch': 0.54}
 54%|█████▎    | 1851/3449 [1:27:14<1:08:41,  2.58s/it] 54%|█████▎    | 1852/3449 [1:27:17<1:13:48,  2.77s/it]                                                       {'loss': 1.3469, 'learning_rate': 0.00018547273729167295, 'epoch': 0.54}
 54%|█████▎    | 1852/3449 [1:27:17<1:13:48,  2.77s/it] 54%|█████▎    | 1853/3449 [1:27:20<1:12:33,  2.73s/it]                                                       {'loss': 1.1996, 'learning_rate': 0.00018528562551931455, 'epoch': 0.54}
 54%|█████▎    | 1853/3449 [1:27:20<1:12:33,  2.73s/it] 54%|█████▍    | 1854/3449 [1:27:22<1:10:34,  2.65s/it]                                                       {'loss': 1.2382, 'learning_rate': 0.00018509852669521053, 'epoch': 0.54}
 54%|█████▍    | 1854/3449 [1:27:22<1:10:34,  2.65s/it] 54%|█████▍    | 1855/3449 [1:27:25<1:12:39,  2.73s/it]                                                       {'loss': 1.1282, 'learning_rate': 0.00018491144098400285, 'epoch': 0.54}
 54%|█████▍    | 1855/3449 [1:27:25<1:12:39,  2.73s/it] 54%|█████▍    | 1856/3449 [1:27:28<1:13:18,  2.76s/it]                                                       {'loss': 1.2367, 'learning_rate': 0.00018472436855032184, 'epoch': 0.54}
 54%|█████▍    | 1856/3449 [1:27:28<1:13:18,  2.76s/it] 54%|█████▍    | 1857/3449 [1:27:32<1:17:50,  2.93s/it]                                                       {'loss': 1.313, 'learning_rate': 0.00018453730955878626, 'epoch': 0.54}
 54%|█████▍    | 1857/3449 [1:27:32<1:17:50,  2.93s/it] 54%|█████▍    | 1858/3449 [1:27:34<1:13:26,  2.77s/it]                                                       {'loss': 1.1984, 'learning_rate': 0.00018435026417400308, 'epoch': 0.54}
 54%|█████▍    | 1858/3449 [1:27:34<1:13:26,  2.77s/it] 54%|█████▍    | 1859/3449 [1:27:37<1:12:47,  2.75s/it]                                                       {'loss': 1.2781, 'learning_rate': 0.0001841632325605671, 'epoch': 0.54}
 54%|█████▍    | 1859/3449 [1:27:37<1:12:47,  2.75s/it] 54%|█████▍    | 1860/3449 [1:27:40<1:19:22,  3.00s/it]                                                       {'loss': 1.3216, 'learning_rate': 0.0001839762148830612, 'epoch': 0.54}
 54%|█████▍    | 1860/3449 [1:27:40<1:19:22,  3.00s/it] 54%|█████▍    | 1861/3449 [1:27:42<1:13:03,  2.76s/it]                                                       {'loss': 1.3867, 'learning_rate': 0.0001837892113060559, 'epoch': 0.54}
 54%|█████▍    | 1861/3449 [1:27:42<1:13:03,  2.76s/it] 54%|█████▍    | 1862/3449 [1:27:45<1:12:21,  2.74s/it]                                                       {'loss': 1.271, 'learning_rate': 0.00018360222199410918, 'epoch': 0.54}
 54%|█████▍    | 1862/3449 [1:27:45<1:12:21,  2.74s/it] 54%|█████▍    | 1863/3449 [1:27:48<1:10:37,  2.67s/it]                                                       {'loss': 1.2565, 'learning_rate': 0.00018341524711176684, 'epoch': 0.54}
 54%|█████▍    | 1863/3449 [1:27:48<1:10:37,  2.67s/it] 54%|█████▍    | 1864/3449 [1:27:50<1:09:30,  2.63s/it]                                                       {'loss': 1.1966, 'learning_rate': 0.0001832282868235617, 'epoch': 0.54}
 54%|█████▍    | 1864/3449 [1:27:50<1:09:30,  2.63s/it] 54%|█████▍    | 1865/3449 [1:27:53<1:12:45,  2.76s/it]                                                       {'loss': 1.1986, 'learning_rate': 0.00018304134129401366, 'epoch': 0.54}
 54%|█████▍    | 1865/3449 [1:27:53<1:12:45,  2.76s/it] 54%|█████▍    | 1866/3449 [1:27:55<1:08:40,  2.60s/it]                                                       {'loss': 1.395, 'learning_rate': 0.00018285441068762993, 'epoch': 0.54}
 54%|█████▍    | 1866/3449 [1:27:55<1:08:40,  2.60s/it] 54%|█████▍    | 1867/3449 [1:27:58<1:09:01,  2.62s/it]                                                       {'loss': 1.2065, 'learning_rate': 0.00018266749516890424, 'epoch': 0.54}
 54%|█████▍    | 1867/3449 [1:27:58<1:09:01,  2.62s/it] 54%|█████▍    | 1868/3449 [1:28:01<1:07:29,  2.56s/it]                                                       {'loss': 1.1612, 'learning_rate': 0.0001824805949023174, 'epoch': 0.54}
 54%|█████▍    | 1868/3449 [1:28:01<1:07:29,  2.56s/it] 54%|█████▍    | 1869/3449 [1:28:04<1:15:26,  2.87s/it]                                                       {'loss': 1.2618, 'learning_rate': 0.0001822937100523366, 'epoch': 0.54}
 54%|█████▍    | 1869/3449 [1:28:04<1:15:26,  2.87s/it] 54%|█████▍    | 1870/3449 [1:28:07<1:14:49,  2.84s/it]                                                       {'loss': 1.1181, 'learning_rate': 0.00018210684078341535, 'epoch': 0.54}
 54%|█████▍    | 1870/3449 [1:28:07<1:14:49,  2.84s/it] 54%|█████▍    | 1871/3449 [1:28:10<1:16:47,  2.92s/it]                                                       {'loss': 1.2668, 'learning_rate': 0.00018191998725999373, 'epoch': 0.54}
 54%|█████▍    | 1871/3449 [1:28:10<1:16:47,  2.92s/it] 54%|█████▍    | 1872/3449 [1:28:13<1:16:03,  2.89s/it]                                                       {'loss': 1.2307, 'learning_rate': 0.00018173314964649783, 'epoch': 0.54}
 54%|█████▍    | 1872/3449 [1:28:13<1:16:03,  2.89s/it] 54%|█████▍    | 1873/3449 [1:28:15<1:12:27,  2.76s/it]                                                       {'loss': 1.3796, 'learning_rate': 0.00018154632810733962, 'epoch': 0.54}
 54%|█████▍    | 1873/3449 [1:28:15<1:12:27,  2.76s/it] 54%|█████▍    | 1874/3449 [1:28:18<1:11:46,  2.73s/it]                                                       {'loss': 1.2441, 'learning_rate': 0.00018135952280691708, 'epoch': 0.54}
 54%|█████▍    | 1874/3449 [1:28:18<1:11:46,  2.73s/it] 54%|█████▍    | 1875/3449 [1:28:20<1:08:22,  2.61s/it]                                                       {'loss': 1.3401, 'learning_rate': 0.00018117273390961397, 'epoch': 0.54}
 54%|█████▍    | 1875/3449 [1:28:20<1:08:22,  2.61s/it] 54%|█████▍    | 1876/3449 [1:28:23<1:06:46,  2.55s/it]                                                       {'loss': 1.1781, 'learning_rate': 0.00018098596157979934, 'epoch': 0.54}
 54%|█████▍    | 1876/3449 [1:28:23<1:06:46,  2.55s/it] 54%|█████▍    | 1877/3449 [1:28:25<1:07:54,  2.59s/it]                                                       {'loss': 1.2586, 'learning_rate': 0.00018079920598182794, 'epoch': 0.54}
 54%|█████▍    | 1877/3449 [1:28:25<1:07:54,  2.59s/it] 54%|█████▍    | 1878/3449 [1:28:29<1:18:33,  3.00s/it]                                                       {'loss': 1.2424, 'learning_rate': 0.00018061246728003958, 'epoch': 0.54}
 54%|█████▍    | 1878/3449 [1:28:29<1:18:33,  3.00s/it] 54%|█████▍    | 1879/3449 [1:28:32<1:18:00,  2.98s/it]                                                       {'loss': 1.2856, 'learning_rate': 0.00018042574563875935, 'epoch': 0.54}
 54%|█████▍    | 1879/3449 [1:28:32<1:18:00,  2.98s/it] 55%|█████▍    | 1880/3449 [1:28:35<1:20:14,  3.07s/it]                                                       {'loss': 1.2349, 'learning_rate': 0.00018023904122229734, 'epoch': 0.55}
 55%|█████▍    | 1880/3449 [1:28:35<1:20:14,  3.07s/it] 55%|█████▍    | 1881/3449 [1:28:38<1:13:42,  2.82s/it]                                                       {'loss': 1.2043, 'learning_rate': 0.00018005235419494832, 'epoch': 0.55}
 55%|█████▍    | 1881/3449 [1:28:38<1:13:42,  2.82s/it] 55%|█████▍    | 1882/3449 [1:28:40<1:11:40,  2.74s/it]                                                       {'loss': 1.3362, 'learning_rate': 0.00017986568472099196, 'epoch': 0.55}
 55%|█████▍    | 1882/3449 [1:28:40<1:11:40,  2.74s/it] 55%|█████▍    | 1883/3449 [1:28:43<1:11:33,  2.74s/it]                                                       {'loss': 1.2164, 'learning_rate': 0.00017967903296469234, 'epoch': 0.55}
 55%|█████▍    | 1883/3449 [1:28:43<1:11:33,  2.74s/it] 55%|█████▍    | 1884/3449 [1:28:46<1:11:50,  2.75s/it]                                                       {'loss': 1.1486, 'learning_rate': 0.0001794923990902979, 'epoch': 0.55}
 55%|█████▍    | 1884/3449 [1:28:46<1:11:50,  2.75s/it] 55%|█████▍    | 1885/3449 [1:28:50<1:25:14,  3.27s/it]                                                       {'loss': 1.3329, 'learning_rate': 0.00017930578326204156, 'epoch': 0.55}
 55%|█████▍    | 1885/3449 [1:28:50<1:25:14,  3.27s/it] 55%|█████▍    | 1886/3449 [1:28:53<1:22:26,  3.17s/it]                                                       {'loss': 1.0274, 'learning_rate': 0.00017911918564414027, 'epoch': 0.55}
 55%|█████▍    | 1886/3449 [1:28:53<1:22:26,  3.17s/it] 55%|█████▍    | 1887/3449 [1:28:56<1:20:07,  3.08s/it]                                                       {'loss': 1.3219, 'learning_rate': 0.00017893260640079473, 'epoch': 0.55}
 55%|█████▍    | 1887/3449 [1:28:56<1:20:07,  3.08s/it] 55%|█████▍    | 1888/3449 [1:28:59<1:15:58,  2.92s/it]                                                       {'loss': 1.2519, 'learning_rate': 0.0001787460456961899, 'epoch': 0.55}
 55%|█████▍    | 1888/3449 [1:28:59<1:15:58,  2.92s/it] 55%|█████▍    | 1889/3449 [1:29:02<1:16:22,  2.94s/it]                                                       {'loss': 1.2589, 'learning_rate': 0.00017855950369449408, 'epoch': 0.55}
 55%|█████▍    | 1889/3449 [1:29:02<1:16:22,  2.94s/it] 55%|█████▍    | 1890/3449 [1:29:05<1:20:17,  3.09s/it]                                                       {'loss': 1.3642, 'learning_rate': 0.00017837298055985916, 'epoch': 0.55}
 55%|█████▍    | 1890/3449 [1:29:05<1:20:17,  3.09s/it] 55%|█████▍    | 1891/3449 [1:29:08<1:21:21,  3.13s/it]                                                       {'loss': 0.9672, 'learning_rate': 0.00017818647645642061, 'epoch': 0.55}
 55%|█████▍    | 1891/3449 [1:29:08<1:21:21,  3.13s/it] 55%|█████▍    | 1892/3449 [1:29:11<1:19:49,  3.08s/it]                                                       {'loss': 1.2383, 'learning_rate': 0.0001779999915482969, 'epoch': 0.55}
 55%|█████▍    | 1892/3449 [1:29:11<1:19:49,  3.08s/it] 55%|█████▍    | 1893/3449 [1:29:14<1:16:29,  2.95s/it]                                                       {'loss': 1.3419, 'learning_rate': 0.00017781352599958983, 'epoch': 0.55}
 55%|█████▍    | 1893/3449 [1:29:14<1:16:29,  2.95s/it] 55%|█████▍    | 1894/3449 [1:29:17<1:19:54,  3.08s/it]                                                       {'loss': 1.2397, 'learning_rate': 0.00017762707997438413, 'epoch': 0.55}
 55%|█████▍    | 1894/3449 [1:29:17<1:19:54,  3.08s/it] 55%|█████▍    | 1895/3449 [1:29:20<1:18:56,  3.05s/it]                                                       {'loss': 1.221, 'learning_rate': 0.00017744065363674717, 'epoch': 0.55}
 55%|█████▍    | 1895/3449 [1:29:20<1:18:56,  3.05s/it] 55%|█████▍    | 1896/3449 [1:29:23<1:16:21,  2.95s/it]                                                       {'loss': 1.3259, 'learning_rate': 0.0001772542471507291, 'epoch': 0.55}
 55%|█████▍    | 1896/3449 [1:29:23<1:16:21,  2.95s/it] 55%|█████▌    | 1897/3449 [1:29:26<1:17:27,  2.99s/it]                                                       {'loss': 1.3263, 'learning_rate': 0.0001770678606803628, 'epoch': 0.55}
 55%|█████▌    | 1897/3449 [1:29:26<1:17:27,  2.99s/it] 55%|█████▌    | 1898/3449 [1:29:29<1:13:23,  2.84s/it]                                                       {'loss': 1.2401, 'learning_rate': 0.0001768814943896632, 'epoch': 0.55}
 55%|█████▌    | 1898/3449 [1:29:29<1:13:23,  2.84s/it] 55%|█████▌    | 1899/3449 [1:29:31<1:11:09,  2.75s/it]                                                       {'loss': 1.176, 'learning_rate': 0.0001766951484426277, 'epoch': 0.55}
 55%|█████▌    | 1899/3449 [1:29:31<1:11:09,  2.75s/it] 55%|█████▌    | 1900/3449 [1:29:34<1:13:34,  2.85s/it]                                                       {'loss': 1.2862, 'learning_rate': 0.00017650882300323576, 'epoch': 0.55}
 55%|█████▌    | 1900/3449 [1:29:34<1:13:34,  2.85s/it] 55%|█████▌    | 1901/3449 [1:29:37<1:13:24,  2.85s/it]                                                       {'loss': 1.2146, 'learning_rate': 0.00017632251823544866, 'epoch': 0.55}
 55%|█████▌    | 1901/3449 [1:29:37<1:13:24,  2.85s/it] 55%|█████▌    | 1902/3449 [1:29:44<1:47:14,  4.16s/it]                                                       {'loss': 1.2925, 'learning_rate': 0.0001761362343032097, 'epoch': 0.55}
 55%|█████▌    | 1902/3449 [1:29:44<1:47:14,  4.16s/it] 55%|█████▌    | 1903/3449 [1:29:48<1:40:41,  3.91s/it]                                                       {'loss': 1.281, 'learning_rate': 0.00017594997137044364, 'epoch': 0.55}
 55%|█████▌    | 1903/3449 [1:29:48<1:40:41,  3.91s/it] 55%|█████▌    | 1904/3449 [1:29:50<1:28:56,  3.45s/it]                                                       {'loss': 1.0849, 'learning_rate': 0.00017576372960105687, 'epoch': 0.55}
 55%|█████▌    | 1904/3449 [1:29:50<1:28:56,  3.45s/it] 55%|█████▌    | 1905/3449 [1:29:53<1:23:40,  3.25s/it]                                                       {'loss': 1.3125, 'learning_rate': 0.00017557750915893732, 'epoch': 0.55}
 55%|█████▌    | 1905/3449 [1:29:53<1:23:40,  3.25s/it] 55%|█████▌    | 1906/3449 [1:29:56<1:22:28,  3.21s/it]                                                       {'loss': 1.1598, 'learning_rate': 0.00017539131020795367, 'epoch': 0.55}
 55%|█████▌    | 1906/3449 [1:29:56<1:22:28,  3.21s/it] 55%|█████▌    | 1907/3449 [1:29:59<1:22:50,  3.22s/it]                                                       {'loss': 1.204, 'learning_rate': 0.00017520513291195626, 'epoch': 0.55}
 55%|█████▌    | 1907/3449 [1:29:59<1:22:50,  3.22s/it] 55%|█████▌    | 1908/3449 [1:30:02<1:17:36,  3.02s/it]                                                       {'loss': 1.2307, 'learning_rate': 0.00017501897743477603, 'epoch': 0.55}
 55%|█████▌    | 1908/3449 [1:30:02<1:17:36,  3.02s/it] 55%|█████▌    | 1909/3449 [1:30:05<1:20:14,  3.13s/it]                                                       {'loss': 1.2054, 'learning_rate': 0.0001748328439402247, 'epoch': 0.55}
 55%|█████▌    | 1909/3449 [1:30:05<1:20:14,  3.13s/it] 55%|█████▌    | 1910/3449 [1:30:08<1:15:48,  2.96s/it]                                                       {'loss': 1.2374, 'learning_rate': 0.0001746467325920949, 'epoch': 0.55}
 55%|█████▌    | 1910/3449 [1:30:08<1:15:48,  2.96s/it] 55%|█████▌    | 1911/3449 [1:30:10<1:12:40,  2.84s/it]                                                       {'loss': 1.3456, 'learning_rate': 0.00017446064355415957, 'epoch': 0.55}
 55%|█████▌    | 1911/3449 [1:30:10<1:12:40,  2.84s/it] 55%|█████▌    | 1912/3449 [1:30:13<1:13:52,  2.88s/it]                                                       {'loss': 1.2549, 'learning_rate': 0.000174274576990172, 'epoch': 0.55}
 55%|█████▌    | 1912/3449 [1:30:13<1:13:52,  2.88s/it] 55%|█████▌    | 1913/3449 [1:30:16<1:12:16,  2.82s/it]                                                       {'loss': 1.3875, 'learning_rate': 0.00017408853306386579, 'epoch': 0.55}
 55%|█████▌    | 1913/3449 [1:30:16<1:12:16,  2.82s/it] 55%|█████▌    | 1914/3449 [1:30:18<1:09:01,  2.70s/it]                                                       {'loss': 1.413, 'learning_rate': 0.00017390251193895472, 'epoch': 0.55}
 55%|█████▌    | 1914/3449 [1:30:18<1:09:01,  2.70s/it] 56%|█████▌    | 1915/3449 [1:30:21<1:09:34,  2.72s/it]                                                       {'loss': 1.2291, 'learning_rate': 0.00017371651377913225, 'epoch': 0.56}
 56%|█████▌    | 1915/3449 [1:30:21<1:09:34,  2.72s/it] 56%|█████▌    | 1916/3449 [1:30:24<1:09:27,  2.72s/it]                                                       {'loss': 1.2189, 'learning_rate': 0.00017353053874807182, 'epoch': 0.56}
 56%|█████▌    | 1916/3449 [1:30:24<1:09:27,  2.72s/it] 56%|█████▌    | 1917/3449 [1:30:26<1:08:08,  2.67s/it]                                                       {'loss': 1.1537, 'learning_rate': 0.00017334458700942644, 'epoch': 0.56}
 56%|█████▌    | 1917/3449 [1:30:26<1:08:08,  2.67s/it] 56%|█████▌    | 1918/3449 [1:30:29<1:05:44,  2.58s/it]                                                       {'loss': 1.3019, 'learning_rate': 0.00017315865872682856, 'epoch': 0.56}
 56%|█████▌    | 1918/3449 [1:30:29<1:05:44,  2.58s/it] 56%|█████▌    | 1919/3449 [1:30:31<1:03:54,  2.51s/it]                                                       {'loss': 1.2471, 'learning_rate': 0.00017297275406389032, 'epoch': 0.56}
 56%|█████▌    | 1919/3449 [1:30:31<1:03:54,  2.51s/it] 56%|█████▌    | 1920/3449 [1:30:33<1:02:11,  2.44s/it]                                                       {'loss': 1.3551, 'learning_rate': 0.00017278687318420262, 'epoch': 0.56}
 56%|█████▌    | 1920/3449 [1:30:33<1:02:11,  2.44s/it] 56%|█████▌    | 1921/3449 [1:30:36<1:02:15,  2.44s/it]                                                       {'loss': 1.2943, 'learning_rate': 0.00017260101625133563, 'epoch': 0.56}
 56%|█████▌    | 1921/3449 [1:30:36<1:02:15,  2.44s/it] 56%|█████▌    | 1922/3449 [1:30:38<1:04:33,  2.54s/it]                                                       {'loss': 1.3282, 'learning_rate': 0.0001724151834288387, 'epoch': 0.56}
 56%|█████▌    | 1922/3449 [1:30:38<1:04:33,  2.54s/it] 56%|█████▌    | 1923/3449 [1:30:41<1:03:06,  2.48s/it]                                                       {'loss': 1.5019, 'learning_rate': 0.0001722293748802394, 'epoch': 0.56}
 56%|█████▌    | 1923/3449 [1:30:41<1:03:06,  2.48s/it] 56%|█████▌    | 1924/3449 [1:30:44<1:07:59,  2.68s/it]                                                       {'loss': 1.2648, 'learning_rate': 0.00017204359076904445, 'epoch': 0.56}
 56%|█████▌    | 1924/3449 [1:30:44<1:07:59,  2.68s/it] 56%|█████▌    | 1925/3449 [1:30:47<1:10:19,  2.77s/it]                                                       {'loss': 1.1127, 'learning_rate': 0.00017185783125873893, 'epoch': 0.56}
 56%|█████▌    | 1925/3449 [1:30:47<1:10:19,  2.77s/it] 56%|█████▌    | 1926/3449 [1:30:49<1:08:09,  2.69s/it]                                                       {'loss': 1.272, 'learning_rate': 0.00017167209651278604, 'epoch': 0.56}
 56%|█████▌    | 1926/3449 [1:30:49<1:08:09,  2.69s/it] 56%|█████▌    | 1927/3449 [1:30:52<1:10:45,  2.79s/it]                                                       {'loss': 1.1037, 'learning_rate': 0.0001714863866946276, 'epoch': 0.56}
 56%|█████▌    | 1927/3449 [1:30:52<1:10:45,  2.79s/it] 56%|█████▌    | 1928/3449 [1:30:55<1:08:39,  2.71s/it]                                                       {'loss': 1.2949, 'learning_rate': 0.00017130070196768297, 'epoch': 0.56}
 56%|█████▌    | 1928/3449 [1:30:55<1:08:39,  2.71s/it] 56%|█████▌    | 1929/3449 [1:30:58<1:14:11,  2.93s/it]                                                       {'loss': 1.2811, 'learning_rate': 0.00017111504249534996, 'epoch': 0.56}
 56%|█████▌    | 1929/3449 [1:30:58<1:14:11,  2.93s/it] 56%|█████▌    | 1930/3449 [1:31:02<1:18:53,  3.12s/it]                                                       {'loss': 1.1952, 'learning_rate': 0.00017092940844100387, 'epoch': 0.56}
 56%|█████▌    | 1930/3449 [1:31:02<1:18:53,  3.12s/it] 56%|█████▌    | 1931/3449 [1:31:05<1:14:39,  2.95s/it]                                                       {'loss': 1.2638, 'learning_rate': 0.00017074379996799758, 'epoch': 0.56}
 56%|█████▌    | 1931/3449 [1:31:05<1:14:39,  2.95s/it] 56%|█████▌    | 1932/3449 [1:31:07<1:14:09,  2.93s/it]                                                       {'loss': 1.1908, 'learning_rate': 0.0001705582172396617, 'epoch': 0.56}
 56%|█████▌    | 1932/3449 [1:31:07<1:14:09,  2.93s/it] 56%|█████▌    | 1933/3449 [1:31:10<1:13:13,  2.90s/it]                                                       {'loss': 1.2415, 'learning_rate': 0.00017037266041930398, 'epoch': 0.56}
 56%|█████▌    | 1933/3449 [1:31:10<1:13:13,  2.90s/it] 56%|█████▌    | 1934/3449 [1:31:13<1:12:31,  2.87s/it]                                                       {'loss': 1.3337, 'learning_rate': 0.00017018712967020941, 'epoch': 0.56}
 56%|█████▌    | 1934/3449 [1:31:13<1:12:31,  2.87s/it] 56%|█████▌    | 1935/3449 [1:31:16<1:10:46,  2.80s/it]                                                       {'loss': 1.2085, 'learning_rate': 0.00017000162515564007, 'epoch': 0.56}
 56%|█████▌    | 1935/3449 [1:31:16<1:10:46,  2.80s/it] 56%|█████▌    | 1936/3449 [1:31:19<1:11:51,  2.85s/it]                                                       {'loss': 1.2212, 'learning_rate': 0.00016981614703883506, 'epoch': 0.56}
 56%|█████▌    | 1936/3449 [1:31:19<1:11:51,  2.85s/it] 56%|█████▌    | 1937/3449 [1:31:22<1:14:14,  2.95s/it]                                                       {'loss': 1.1379, 'learning_rate': 0.00016963069548301004, 'epoch': 0.56}
 56%|█████▌    | 1937/3449 [1:31:22<1:14:14,  2.95s/it] 56%|█████▌    | 1938/3449 [1:31:25<1:13:22,  2.91s/it]                                                       {'loss': 1.2124, 'learning_rate': 0.00016944527065135742, 'epoch': 0.56}
 56%|█████▌    | 1938/3449 [1:31:25<1:13:22,  2.91s/it] 56%|█████▌    | 1939/3449 [1:31:28<1:14:32,  2.96s/it]                                                       {'loss': 1.1204, 'learning_rate': 0.00016925987270704606, 'epoch': 0.56}
 56%|█████▌    | 1939/3449 [1:31:28<1:14:32,  2.96s/it] 56%|█████▌    | 1940/3449 [1:31:30<1:09:58,  2.78s/it]                                                       {'loss': 1.2249, 'learning_rate': 0.00016907450181322115, 'epoch': 0.56}
 56%|█████▌    | 1940/3449 [1:31:30<1:09:58,  2.78s/it] 56%|█████▋    | 1941/3449 [1:31:33<1:10:04,  2.79s/it]                                                       {'loss': 1.2513, 'learning_rate': 0.0001688891581330042, 'epoch': 0.56}
 56%|█████▋    | 1941/3449 [1:31:33<1:10:04,  2.79s/it] 56%|█████▋    | 1942/3449 [1:31:36<1:09:31,  2.77s/it]                                                       {'loss': 1.3299, 'learning_rate': 0.00016870384182949256, 'epoch': 0.56}
 56%|█████▋    | 1942/3449 [1:31:36<1:09:31,  2.77s/it] 56%|█████▋    | 1943/3449 [1:31:39<1:11:49,  2.86s/it]                                                       {'loss': 1.3036, 'learning_rate': 0.00016851855306575963, 'epoch': 0.56}
 56%|█████▋    | 1943/3449 [1:31:39<1:11:49,  2.86s/it] 56%|█████▋    | 1944/3449 [1:31:41<1:08:00,  2.71s/it]                                                       {'loss': 1.2294, 'learning_rate': 0.00016833329200485465, 'epoch': 0.56}
 56%|█████▋    | 1944/3449 [1:31:41<1:08:00,  2.71s/it] 56%|█████▋    | 1945/3449 [1:31:44<1:08:02,  2.71s/it]                                                       {'loss': 1.2135, 'learning_rate': 0.0001681480588098022, 'epoch': 0.56}
 56%|█████▋    | 1945/3449 [1:31:44<1:08:02,  2.71s/it] 56%|█████▋    | 1946/3449 [1:31:46<1:07:43,  2.70s/it]                                                       {'loss': 1.1569, 'learning_rate': 0.00016796285364360263, 'epoch': 0.56}
 56%|█████▋    | 1946/3449 [1:31:46<1:07:43,  2.70s/it] 56%|█████▋    | 1947/3449 [1:31:49<1:08:10,  2.72s/it]                                                       {'loss': 1.1965, 'learning_rate': 0.00016777767666923156, 'epoch': 0.56}
 56%|█████▋    | 1947/3449 [1:31:49<1:08:10,  2.72s/it] 56%|█████▋    | 1948/3449 [1:31:52<1:08:59,  2.76s/it]                                                       {'loss': 1.1513, 'learning_rate': 0.00016759252804963954, 'epoch': 0.56}
 56%|█████▋    | 1948/3449 [1:31:52<1:08:59,  2.76s/it] 57%|█████▋    | 1949/3449 [1:31:55<1:12:39,  2.91s/it]                                                       {'loss': 1.1926, 'learning_rate': 0.0001674074079477526, 'epoch': 0.57}
 57%|█████▋    | 1949/3449 [1:31:55<1:12:39,  2.91s/it] 57%|█████▋    | 1950/3449 [1:31:58<1:11:47,  2.87s/it]                                                       {'loss': 1.189, 'learning_rate': 0.00016722231652647145, 'epoch': 0.57}
 57%|█████▋    | 1950/3449 [1:31:58<1:11:47,  2.87s/it] 57%|█████▋    | 1951/3449 [1:32:01<1:14:30,  2.98s/it]                                                       {'loss': 1.114, 'learning_rate': 0.00016703725394867145, 'epoch': 0.57}
 57%|█████▋    | 1951/3449 [1:32:01<1:14:30,  2.98s/it] 57%|█████▋    | 1952/3449 [1:32:04<1:14:46,  3.00s/it]                                                       {'loss': 1.3933, 'learning_rate': 0.00016685222037720278, 'epoch': 0.57}
 57%|█████▋    | 1952/3449 [1:32:04<1:14:46,  3.00s/it] 57%|█████▋    | 1953/3449 [1:32:07<1:13:45,  2.96s/it]                                                       {'loss': 1.1315, 'learning_rate': 0.00016666721597488992, 'epoch': 0.57}
 57%|█████▋    | 1953/3449 [1:32:07<1:13:45,  2.96s/it] 57%|█████▋    | 1954/3449 [1:32:11<1:20:56,  3.25s/it]                                                       {'loss': 1.2984, 'learning_rate': 0.00016648224090453186, 'epoch': 0.57}
 57%|█████▋    | 1954/3449 [1:32:11<1:20:56,  3.25s/it] 57%|█████▋    | 1955/3449 [1:32:14<1:16:25,  3.07s/it]                                                       {'loss': 1.4407, 'learning_rate': 0.00016629729532890175, 'epoch': 0.57}
 57%|█████▋    | 1955/3449 [1:32:14<1:16:25,  3.07s/it] 57%|█████▋    | 1956/3449 [1:32:17<1:13:52,  2.97s/it]                                                       {'loss': 1.1905, 'learning_rate': 0.0001661123794107466, 'epoch': 0.57}
 57%|█████▋    | 1956/3449 [1:32:17<1:13:52,  2.97s/it] 57%|█████▋    | 1957/3449 [1:32:19<1:08:58,  2.77s/it]                                                       {'loss': 1.1534, 'learning_rate': 0.00016592749331278747, 'epoch': 0.57}
 57%|█████▋    | 1957/3449 [1:32:19<1:08:58,  2.77s/it] 57%|█████▋    | 1958/3449 [1:32:21<1:06:02,  2.66s/it]                                                       {'loss': 1.2697, 'learning_rate': 0.00016574263719771928, 'epoch': 0.57}
 57%|█████▋    | 1958/3449 [1:32:21<1:06:02,  2.66s/it] 57%|█████▋    | 1959/3449 [1:32:24<1:05:38,  2.64s/it]                                                       {'loss': 1.3054, 'learning_rate': 0.00016555781122821035, 'epoch': 0.57}
 57%|█████▋    | 1959/3449 [1:32:24<1:05:38,  2.64s/it] 57%|█████▋    | 1960/3449 [1:32:26<1:05:02,  2.62s/it]                                                       {'loss': 1.2623, 'learning_rate': 0.00016537301556690252, 'epoch': 0.57}
 57%|█████▋    | 1960/3449 [1:32:26<1:05:02,  2.62s/it] 57%|█████▋    | 1961/3449 [1:32:29<1:08:03,  2.74s/it]                                                       {'loss': 1.2823, 'learning_rate': 0.0001651882503764112, 'epoch': 0.57}
 57%|█████▋    | 1961/3449 [1:32:29<1:08:03,  2.74s/it] 57%|█████▋    | 1962/3449 [1:32:32<1:05:09,  2.63s/it]                                                       {'loss': 1.2938, 'learning_rate': 0.00016500351581932456, 'epoch': 0.57}
 57%|█████▋    | 1962/3449 [1:32:32<1:05:09,  2.63s/it] 57%|█████▋    | 1963/3449 [1:32:35<1:07:03,  2.71s/it]                                                       {'loss': 1.279, 'learning_rate': 0.00016481881205820424, 'epoch': 0.57}
 57%|█████▋    | 1963/3449 [1:32:35<1:07:03,  2.71s/it] 57%|█████▋    | 1964/3449 [1:32:37<1:06:41,  2.69s/it]                                                       {'loss': 1.1894, 'learning_rate': 0.00016463413925558445, 'epoch': 0.57}
 57%|█████▋    | 1964/3449 [1:32:37<1:06:41,  2.69s/it] 57%|█████▋    | 1965/3449 [1:32:40<1:04:13,  2.60s/it]                                                       {'loss': 1.1466, 'learning_rate': 0.00016444949757397234, 'epoch': 0.57}
 57%|█████▋    | 1965/3449 [1:32:40<1:04:13,  2.60s/it] 57%|█████▋    | 1966/3449 [1:32:42<1:03:16,  2.56s/it]                                                       {'loss': 1.3923, 'learning_rate': 0.00016426488717584777, 'epoch': 0.57}
 57%|█████▋    | 1966/3449 [1:32:42<1:03:16,  2.56s/it] 57%|█████▋    | 1967/3449 [1:32:45<1:04:35,  2.61s/it]                                                       {'loss': 1.2416, 'learning_rate': 0.0001640803082236627, 'epoch': 0.57}
 57%|█████▋    | 1967/3449 [1:32:45<1:04:35,  2.61s/it] 57%|█████▋    | 1968/3449 [1:32:47<1:03:37,  2.58s/it]                                                       {'loss': 1.2472, 'learning_rate': 0.00016389576087984177, 'epoch': 0.57}
 57%|█████▋    | 1968/3449 [1:32:47<1:03:37,  2.58s/it] 57%|█████▋    | 1969/3449 [1:32:51<1:10:41,  2.87s/it]                                                       {'loss': 1.0552, 'learning_rate': 0.00016371124530678176, 'epoch': 0.57}
 57%|█████▋    | 1969/3449 [1:32:51<1:10:41,  2.87s/it] 57%|█████▋    | 1970/3449 [1:32:53<1:07:44,  2.75s/it]                                                       {'loss': 1.4276, 'learning_rate': 0.00016352676166685122, 'epoch': 0.57}
 57%|█████▋    | 1970/3449 [1:32:53<1:07:44,  2.75s/it] 57%|█████▋    | 1971/3449 [1:32:56<1:07:19,  2.73s/it]                                                       {'loss': 1.3438, 'learning_rate': 0.00016334231012239098, 'epoch': 0.57}
 57%|█████▋    | 1971/3449 [1:32:56<1:07:19,  2.73s/it] 57%|█████▋    | 1972/3449 [1:32:59<1:08:19,  2.78s/it]                                                       {'loss': 1.3187, 'learning_rate': 0.00016315789083571342, 'epoch': 0.57}
 57%|█████▋    | 1972/3449 [1:32:59<1:08:19,  2.78s/it] 57%|█████▋    | 1973/3449 [1:33:02<1:12:02,  2.93s/it]                                                       {'loss': 1.1763, 'learning_rate': 0.00016297350396910247, 'epoch': 0.57}
 57%|█████▋    | 1973/3449 [1:33:02<1:12:02,  2.93s/it] 57%|█████▋    | 1974/3449 [1:33:05<1:10:52,  2.88s/it]                                                       {'loss': 1.2755, 'learning_rate': 0.00016278914968481374, 'epoch': 0.57}
 57%|█████▋    | 1974/3449 [1:33:05<1:10:52,  2.88s/it] 57%|█████▋    | 1975/3449 [1:33:08<1:09:28,  2.83s/it]                                                       {'loss': 1.247, 'learning_rate': 0.00016260482814507387, 'epoch': 0.57}
 57%|█████▋    | 1975/3449 [1:33:08<1:09:28,  2.83s/it] 57%|█████▋    | 1976/3449 [1:33:10<1:06:41,  2.72s/it]                                                       {'loss': 1.2318, 'learning_rate': 0.00016242053951208104, 'epoch': 0.57}
 57%|█████▋    | 1976/3449 [1:33:10<1:06:41,  2.72s/it] 57%|█████▋    | 1977/3449 [1:33:13<1:07:09,  2.74s/it]                                                       {'loss': 1.215, 'learning_rate': 0.00016223628394800425, 'epoch': 0.57}
 57%|█████▋    | 1977/3449 [1:33:13<1:07:09,  2.74s/it] 57%|█████▋    | 1978/3449 [1:33:16<1:04:55,  2.65s/it]                                                       {'loss': 1.0413, 'learning_rate': 0.00016205206161498342, 'epoch': 0.57}
 57%|█████▋    | 1978/3449 [1:33:16<1:04:55,  2.65s/it] 57%|█████▋    | 1979/3449 [1:33:18<1:03:44,  2.60s/it]                                                       {'loss': 1.4229, 'learning_rate': 0.00016186787267512918, 'epoch': 0.57}
 57%|█████▋    | 1979/3449 [1:33:18<1:03:44,  2.60s/it] 57%|█████▋    | 1980/3449 [1:33:21<1:03:15,  2.58s/it]                                                       {'loss': 1.2017, 'learning_rate': 0.00016168371729052307, 'epoch': 0.57}
 57%|█████▋    | 1980/3449 [1:33:21<1:03:15,  2.58s/it] 57%|█████▋    | 1981/3449 [1:33:23<1:05:51,  2.69s/it]                                                       {'loss': 1.2663, 'learning_rate': 0.00016149959562321672, 'epoch': 0.57}
 57%|█████▋    | 1981/3449 [1:33:23<1:05:51,  2.69s/it] 57%|█████▋    | 1982/3449 [1:33:26<1:05:46,  2.69s/it]                                                       {'loss': 1.1215, 'learning_rate': 0.0001613155078352322, 'epoch': 0.57}
 57%|█████▋    | 1982/3449 [1:33:26<1:05:46,  2.69s/it] 57%|█████▋    | 1983/3449 [1:33:29<1:09:06,  2.83s/it]                                                       {'loss': 1.1153, 'learning_rate': 0.00016113145408856207, 'epoch': 0.57}
 57%|█████▋    | 1983/3449 [1:33:29<1:09:06,  2.83s/it] 58%|█████▊    | 1984/3449 [1:33:33<1:14:15,  3.04s/it]                                                       {'loss': 1.1303, 'learning_rate': 0.0001609474345451684, 'epoch': 0.58}
 58%|█████▊    | 1984/3449 [1:33:33<1:14:15,  3.04s/it] 58%|█████▊    | 1985/3449 [1:33:36<1:17:39,  3.18s/it]                                                       {'loss': 1.1184, 'learning_rate': 0.00016076344936698356, 'epoch': 0.58}
 58%|█████▊    | 1985/3449 [1:33:36<1:17:39,  3.18s/it] 58%|█████▊    | 1986/3449 [1:33:39<1:15:55,  3.11s/it]                                                       {'loss': 1.2001, 'learning_rate': 0.00016057949871590963, 'epoch': 0.58}
 58%|█████▊    | 1986/3449 [1:33:39<1:15:55,  3.11s/it] 58%|█████▊    | 1987/3449 [1:33:43<1:19:43,  3.27s/it]                                                       {'loss': 1.2126, 'learning_rate': 0.00016039558275381813, 'epoch': 0.58}
 58%|█████▊    | 1987/3449 [1:33:43<1:19:43,  3.27s/it] 58%|█████▊    | 1988/3449 [1:33:45<1:12:09,  2.96s/it]                                                       {'loss': 1.2566, 'learning_rate': 0.00016021170164255027, 'epoch': 0.58}
 58%|█████▊    | 1988/3449 [1:33:45<1:12:09,  2.96s/it] 58%|█████▊    | 1989/3449 [1:33:48<1:09:10,  2.84s/it]                                                       {'loss': 1.2464, 'learning_rate': 0.00016002785554391642, 'epoch': 0.58}
 58%|█████▊    | 1989/3449 [1:33:48<1:09:10,  2.84s/it] 58%|█████▊    | 1990/3449 [1:33:50<1:05:22,  2.69s/it]                                                       {'loss': 1.3024, 'learning_rate': 0.00015984404461969623, 'epoch': 0.58}
 58%|█████▊    | 1990/3449 [1:33:50<1:05:22,  2.69s/it] 58%|█████▊    | 1991/3449 [1:33:53<1:03:47,  2.63s/it]                                                       {'loss': 1.2382, 'learning_rate': 0.0001596602690316384, 'epoch': 0.58}
 58%|█████▊    | 1991/3449 [1:33:53<1:03:47,  2.63s/it] 58%|█████▊    | 1992/3449 [1:33:56<1:08:27,  2.82s/it]                                                       {'loss': 1.2314, 'learning_rate': 0.0001594765289414604, 'epoch': 0.58}
 58%|█████▊    | 1992/3449 [1:33:56<1:08:27,  2.82s/it] 58%|█████▊    | 1993/3449 [1:33:59<1:08:38,  2.83s/it]                                                       {'loss': 1.2229, 'learning_rate': 0.00015929282451084876, 'epoch': 0.58}
 58%|█████▊    | 1993/3449 [1:33:59<1:08:38,  2.83s/it] 58%|█████▊    | 1994/3449 [1:34:02<1:10:03,  2.89s/it]                                                       {'loss': 1.3042, 'learning_rate': 0.00015910915590145835, 'epoch': 0.58}
 58%|█████▊    | 1994/3449 [1:34:02<1:10:03,  2.89s/it] 58%|█████▊    | 1995/3449 [1:34:04<1:08:08,  2.81s/it]                                                       {'loss': 1.3198, 'learning_rate': 0.0001589255232749126, 'epoch': 0.58}
 58%|█████▊    | 1995/3449 [1:34:04<1:08:08,  2.81s/it] 58%|█████▊    | 1996/3449 [1:34:07<1:04:59,  2.68s/it]                                                       {'loss': 1.4086, 'learning_rate': 0.00015874192679280323, 'epoch': 0.58}
 58%|█████▊    | 1996/3449 [1:34:07<1:04:59,  2.68s/it] 58%|█████▊    | 1997/3449 [1:34:10<1:08:54,  2.85s/it]                                                       {'loss': 1.1759, 'learning_rate': 0.0001585583666166904, 'epoch': 0.58}
 58%|█████▊    | 1997/3449 [1:34:10<1:08:54,  2.85s/it] 58%|█████▊    | 1998/3449 [1:34:12<1:05:59,  2.73s/it]                                                       {'loss': 1.2343, 'learning_rate': 0.00015837484290810196, 'epoch': 0.58}
 58%|█████▊    | 1998/3449 [1:34:12<1:05:59,  2.73s/it] 58%|█████▊    | 1999/3449 [1:34:15<1:06:34,  2.75s/it]                                                       {'loss': 1.2502, 'learning_rate': 0.00015819135582853395, 'epoch': 0.58}
 58%|█████▊    | 1999/3449 [1:34:15<1:06:34,  2.75s/it] 58%|█████▊    | 2000/3449 [1:34:19<1:11:52,  2.98s/it]                                                       {'loss': 1.2231, 'learning_rate': 0.00015800790553945003, 'epoch': 0.58}
 58%|█████▊    | 2000/3449 [1:34:19<1:11:52,  2.98s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
  warnings.warn(
 58%|█████▊    | 2001/3449 [1:34:22<1:10:38,  2.93s/it]                                                       {'loss': 1.18, 'learning_rate': 0.00015782449220228144, 'epoch': 0.58}
 58%|█████▊    | 2001/3449 [1:34:22<1:10:38,  2.93s/it] 58%|█████▊    | 2002/3449 [1:34:24<1:08:48,  2.85s/it]                                                       {'loss': 1.2754, 'learning_rate': 0.00015764111597842717, 'epoch': 0.58}
 58%|█████▊    | 2002/3449 [1:34:24<1:08:48,  2.85s/it] 58%|█████▊    | 2003/3449 [1:34:26<1:04:15,  2.67s/it]                                                       {'loss': 1.3271, 'learning_rate': 0.00015745777702925326, 'epoch': 0.58}
 58%|█████▊    | 2003/3449 [1:34:26<1:04:15,  2.67s/it] 58%|█████▊    | 2004/3449 [1:34:29<1:05:26,  2.72s/it]                                                       {'loss': 1.1925, 'learning_rate': 0.00015727447551609303, 'epoch': 0.58}
 58%|█████▊    | 2004/3449 [1:34:29<1:05:26,  2.72s/it] 58%|█████▊    | 2005/3449 [1:34:32<1:05:08,  2.71s/it]                                                       {'loss': 1.2643, 'learning_rate': 0.00015709121160024703, 'epoch': 0.58}
 58%|█████▊    | 2005/3449 [1:34:32<1:05:08,  2.71s/it] 58%|█████▊    | 2006/3449 [1:34:35<1:06:30,  2.77s/it]                                                       {'loss': 1.1895, 'learning_rate': 0.00015690798544298247, 'epoch': 0.58}
 58%|█████▊    | 2006/3449 [1:34:35<1:06:30,  2.77s/it] 58%|█████▊    | 2007/3449 [1:34:37<1:02:54,  2.62s/it]                                                       {'loss': 1.2227, 'learning_rate': 0.00015672479720553342, 'epoch': 0.58}
 58%|█████▊    | 2007/3449 [1:34:37<1:02:54,  2.62s/it] 58%|█████▊    | 2008/3449 [1:34:40<1:03:47,  2.66s/it]                                                       {'loss': 1.2444, 'learning_rate': 0.00015654164704910077, 'epoch': 0.58}
 58%|█████▊    | 2008/3449 [1:34:40<1:03:47,  2.66s/it] 58%|█████▊    | 2009/3449 [1:34:43<1:06:12,  2.76s/it]                                                       {'loss': 1.2285, 'learning_rate': 0.00015635853513485152, 'epoch': 0.58}
 58%|█████▊    | 2009/3449 [1:34:43<1:06:12,  2.76s/it] 58%|█████▊    | 2010/3449 [1:34:46<1:05:47,  2.74s/it]                                                       {'loss': 1.2886, 'learning_rate': 0.00015617546162391944, 'epoch': 0.58}
 58%|█████▊    | 2010/3449 [1:34:46<1:05:47,  2.74s/it] 58%|█████▊    | 2011/3449 [1:34:48<1:03:11,  2.64s/it]                                                       {'loss': 1.2606, 'learning_rate': 0.00015599242667740416, 'epoch': 0.58}
 58%|█████▊    | 2011/3449 [1:34:48<1:03:11,  2.64s/it] 58%|█████▊    | 2012/3449 [1:34:51<1:03:56,  2.67s/it]                                                       {'loss': 1.3832, 'learning_rate': 0.0001558094304563716, 'epoch': 0.58}
 58%|█████▊    | 2012/3449 [1:34:51<1:03:56,  2.67s/it] 58%|█████▊    | 2013/3449 [1:34:54<1:08:51,  2.88s/it]                                                       {'loss': 1.2479, 'learning_rate': 0.00015562647312185353, 'epoch': 0.58}
 58%|█████▊    | 2013/3449 [1:34:54<1:08:51,  2.88s/it] 58%|█████▊    | 2014/3449 [1:34:58<1:13:49,  3.09s/it]                                                       {'loss': 0.9849, 'learning_rate': 0.00015544355483484737, 'epoch': 0.58}
 58%|█████▊    | 2014/3449 [1:34:58<1:13:49,  3.09s/it] 58%|█████▊    | 2015/3449 [1:35:00<1:09:52,  2.92s/it]                                                       {'loss': 1.2859, 'learning_rate': 0.0001552606757563164, 'epoch': 0.58}
 58%|█████▊    | 2015/3449 [1:35:00<1:09:52,  2.92s/it] 58%|█████▊    | 2016/3449 [1:35:03<1:08:46,  2.88s/it]                                                       {'loss': 1.1702, 'learning_rate': 0.00015507783604718932, 'epoch': 0.58}
 58%|█████▊    | 2016/3449 [1:35:03<1:08:46,  2.88s/it] 58%|█████▊    | 2017/3449 [1:35:06<1:10:49,  2.97s/it]                                                       {'loss': 1.1684, 'learning_rate': 0.0001548950358683601, 'epoch': 0.58}
 58%|█████▊    | 2017/3449 [1:35:06<1:10:49,  2.97s/it] 59%|█████▊    | 2018/3449 [1:35:09<1:09:08,  2.90s/it]                                                       {'loss': 1.2288, 'learning_rate': 0.00015471227538068797, 'epoch': 0.59}
 59%|█████▊    | 2018/3449 [1:35:09<1:09:08,  2.90s/it] 59%|█████▊    | 2019/3449 [1:35:12<1:12:29,  3.04s/it]                                                       {'loss': 1.2113, 'learning_rate': 0.00015452955474499737, 'epoch': 0.59}
 59%|█████▊    | 2019/3449 [1:35:12<1:12:29,  3.04s/it] 59%|█████▊    | 2020/3449 [1:35:15<1:10:49,  2.97s/it]                                                       {'loss': 1.1303, 'learning_rate': 0.00015434687412207746, 'epoch': 0.59}
 59%|█████▊    | 2020/3449 [1:35:15<1:10:49,  2.97s/it] 59%|█████▊    | 2021/3449 [1:35:18<1:09:30,  2.92s/it]                                                       {'loss': 1.3073, 'learning_rate': 0.00015416423367268223, 'epoch': 0.59}
 59%|█████▊    | 2021/3449 [1:35:18<1:09:30,  2.92s/it] 59%|█████▊    | 2022/3449 [1:35:21<1:10:48,  2.98s/it]                                                       {'loss': 1.2214, 'learning_rate': 0.00015398163355753052, 'epoch': 0.59}
 59%|█████▊    | 2022/3449 [1:35:21<1:10:48,  2.98s/it] 59%|█████▊    | 2023/3449 [1:35:24<1:08:17,  2.87s/it]                                                       {'loss': 1.2013, 'learning_rate': 0.00015379907393730542, 'epoch': 0.59}
 59%|█████▊    | 2023/3449 [1:35:24<1:08:17,  2.87s/it] 59%|█████▊    | 2024/3449 [1:35:28<1:16:34,  3.22s/it]                                                       {'loss': 1.0688, 'learning_rate': 0.00015361655497265456, 'epoch': 0.59}
 59%|█████▊    | 2024/3449 [1:35:28<1:16:34,  3.22s/it] 59%|█████▊    | 2025/3449 [1:35:30<1:13:22,  3.09s/it]                                                       {'loss': 1.1376, 'learning_rate': 0.00015343407682418962, 'epoch': 0.59}
 59%|█████▊    | 2025/3449 [1:35:30<1:13:22,  3.09s/it] 59%|█████▊    | 2026/3449 [1:35:34<1:15:37,  3.19s/it]                                                       {'loss': 1.2122, 'learning_rate': 0.00015325163965248652, 'epoch': 0.59}
 59%|█████▊    | 2026/3449 [1:35:34<1:15:37,  3.19s/it] 59%|█████▉    | 2027/3449 [1:35:37<1:12:06,  3.04s/it]                                                       {'loss': 1.236, 'learning_rate': 0.00015306924361808516, 'epoch': 0.59}
 59%|█████▉    | 2027/3449 [1:35:37<1:12:06,  3.04s/it] 59%|█████▉    | 2028/3449 [1:35:39<1:10:17,  2.97s/it]                                                       {'loss': 1.0954, 'learning_rate': 0.00015288688888148906, 'epoch': 0.59}
 59%|█████▉    | 2028/3449 [1:35:39<1:10:17,  2.97s/it] 59%|█████▉    | 2029/3449 [1:35:42<1:07:20,  2.85s/it]                                                       {'loss': 1.2584, 'learning_rate': 0.00015270457560316548, 'epoch': 0.59}
 59%|█████▉    | 2029/3449 [1:35:42<1:07:20,  2.85s/it] 59%|█████▉    | 2030/3449 [1:35:45<1:05:38,  2.78s/it]                                                       {'loss': 1.3267, 'learning_rate': 0.00015252230394354531, 'epoch': 0.59}
 59%|█████▉    | 2030/3449 [1:35:45<1:05:38,  2.78s/it] 59%|█████▉    | 2031/3449 [1:35:48<1:07:12,  2.84s/it]                                                       {'loss': 1.3077, 'learning_rate': 0.00015234007406302258, 'epoch': 0.59}
 59%|█████▉    | 2031/3449 [1:35:48<1:07:12,  2.84s/it] 59%|█████▉    | 2032/3449 [1:35:51<1:09:31,  2.94s/it]                                                       {'loss': 1.092, 'learning_rate': 0.00015215788612195477, 'epoch': 0.59}
 59%|█████▉    | 2032/3449 [1:35:51<1:09:31,  2.94s/it] 59%|█████▉    | 2033/3449 [1:35:54<1:09:02,  2.93s/it]                                                       {'loss': 1.2471, 'learning_rate': 0.0001519757402806624, 'epoch': 0.59}
 59%|█████▉    | 2033/3449 [1:35:54<1:09:02,  2.93s/it] 59%|█████▉    | 2034/3449 [1:35:56<1:07:02,  2.84s/it]                                                       {'loss': 1.1059, 'learning_rate': 0.00015179363669942886, 'epoch': 0.59}
 59%|█████▉    | 2034/3449 [1:35:56<1:07:02,  2.84s/it] 59%|█████▉    | 2035/3449 [1:35:59<1:05:38,  2.79s/it]                                                       {'loss': 1.1881, 'learning_rate': 0.00015161157553850044, 'epoch': 0.59}
 59%|█████▉    | 2035/3449 [1:35:59<1:05:38,  2.79s/it] 59%|█████▉    | 2036/3449 [1:36:02<1:04:39,  2.75s/it]                                                       {'loss': 1.3145, 'learning_rate': 0.000151429556958086, 'epoch': 0.59}
 59%|█████▉    | 2036/3449 [1:36:02<1:04:39,  2.75s/it] 59%|█████▉    | 2037/3449 [1:36:04<1:03:05,  2.68s/it]                                                       {'loss': 1.2441, 'learning_rate': 0.00015124758111835713, 'epoch': 0.59}
 59%|█████▉    | 2037/3449 [1:36:04<1:03:05,  2.68s/it] 59%|█████▉    | 2038/3449 [1:36:07<1:04:52,  2.76s/it]                                                       {'loss': 1.1415, 'learning_rate': 0.00015106564817944765, 'epoch': 0.59}
 59%|█████▉    | 2038/3449 [1:36:07<1:04:52,  2.76s/it] 59%|█████▉    | 2039/3449 [1:36:10<1:06:57,  2.85s/it]                                                       {'loss': 1.2954, 'learning_rate': 0.00015088375830145352, 'epoch': 0.59}
 59%|█████▉    | 2039/3449 [1:36:10<1:06:57,  2.85s/it] 59%|█████▉    | 2040/3449 [1:36:13<1:07:22,  2.87s/it]                                                       {'loss': 1.2318, 'learning_rate': 0.0001507019116444331, 'epoch': 0.59}
 59%|█████▉    | 2040/3449 [1:36:13<1:07:22,  2.87s/it] 59%|█████▉    | 2041/3449 [1:36:16<1:08:32,  2.92s/it]                                                       {'loss': 1.3016, 'learning_rate': 0.00015052010836840663, 'epoch': 0.59}
 59%|█████▉    | 2041/3449 [1:36:16<1:08:32,  2.92s/it] 59%|█████▉    | 2042/3449 [1:36:20<1:13:47,  3.15s/it]                                                       {'loss': 1.008, 'learning_rate': 0.0001503383486333559, 'epoch': 0.59}
 59%|█████▉    | 2042/3449 [1:36:20<1:13:47,  3.15s/it] 59%|█████▉    | 2043/3449 [1:36:23<1:11:46,  3.06s/it]                                                       {'loss': 1.3718, 'learning_rate': 0.0001501566325992247, 'epoch': 0.59}
 59%|█████▉    | 2043/3449 [1:36:23<1:11:46,  3.06s/it] 59%|█████▉    | 2044/3449 [1:36:26<1:11:16,  3.04s/it]                                                       {'loss': 1.0637, 'learning_rate': 0.00014997496042591828, 'epoch': 0.59}
 59%|█████▉    | 2044/3449 [1:36:26<1:11:16,  3.04s/it] 59%|█████▉    | 2045/3449 [1:36:28<1:07:23,  2.88s/it]                                                       {'loss': 1.3526, 'learning_rate': 0.00014979333227330325, 'epoch': 0.59}
 59%|█████▉    | 2045/3449 [1:36:28<1:07:23,  2.88s/it] 59%|█████▉    | 2046/3449 [1:36:31<1:06:00,  2.82s/it]                                                       {'loss': 1.2784, 'learning_rate': 0.00014961174830120755, 'epoch': 0.59}
 59%|█████▉    | 2046/3449 [1:36:31<1:06:00,  2.82s/it] 59%|█████▉    | 2047/3449 [1:36:34<1:07:50,  2.90s/it]                                                       {'loss': 1.2029, 'learning_rate': 0.0001494302086694201, 'epoch': 0.59}
 59%|█████▉    | 2047/3449 [1:36:34<1:07:50,  2.90s/it] 59%|█████▉    | 2048/3449 [1:36:37<1:08:40,  2.94s/it]                                                       {'loss': 1.294, 'learning_rate': 0.00014924871353769095, 'epoch': 0.59}
 59%|█████▉    | 2048/3449 [1:36:37<1:08:40,  2.94s/it] 59%|█████▉    | 2049/3449 [1:36:39<1:05:43,  2.82s/it]                                                       {'loss': 1.2422, 'learning_rate': 0.000149067263065731, 'epoch': 0.59}
 59%|█████▉    | 2049/3449 [1:36:39<1:05:43,  2.82s/it] 59%|█████▉    | 2050/3449 [1:36:43<1:09:55,  3.00s/it]                                                       {'loss': 1.2523, 'learning_rate': 0.00014888585741321171, 'epoch': 0.59}
 59%|█████▉    | 2050/3449 [1:36:43<1:09:55,  3.00s/it] 59%|█████▉    | 2051/3449 [1:36:46<1:08:39,  2.95s/it]                                                       {'loss': 1.0893, 'learning_rate': 0.0001487044967397652, 'epoch': 0.59}
 59%|█████▉    | 2051/3449 [1:36:46<1:08:39,  2.95s/it] 59%|█████▉    | 2052/3449 [1:36:48<1:05:32,  2.81s/it]                                                       {'loss': 1.1165, 'learning_rate': 0.00014852318120498408, 'epoch': 0.59}
 59%|█████▉    | 2052/3449 [1:36:48<1:05:32,  2.81s/it] 60%|█████▉    | 2053/3449 [1:36:51<1:02:47,  2.70s/it]                                                       {'loss': 1.3823, 'learning_rate': 0.000148341910968421, 'epoch': 0.6}
 60%|█████▉    | 2053/3449 [1:36:51<1:02:47,  2.70s/it] 60%|█████▉    | 2054/3449 [1:36:53<1:04:03,  2.75s/it]                                                       {'loss': 1.3302, 'learning_rate': 0.000148160686189589, 'epoch': 0.6}
 60%|█████▉    | 2054/3449 [1:36:53<1:04:03,  2.75s/it] 60%|█████▉    | 2055/3449 [1:36:56<1:03:33,  2.74s/it]                                                       {'loss': 1.2007, 'learning_rate': 0.00014797950702796105, 'epoch': 0.6}
 60%|█████▉    | 2055/3449 [1:36:56<1:03:33,  2.74s/it] 60%|█████▉    | 2056/3449 [1:36:59<1:04:29,  2.78s/it]                                                       {'loss': 1.3385, 'learning_rate': 0.00014779837364296982, 'epoch': 0.6}
 60%|█████▉    | 2056/3449 [1:36:59<1:04:29,  2.78s/it] 60%|█████▉    | 2057/3449 [1:37:02<1:02:28,  2.69s/it]                                                       {'loss': 1.4514, 'learning_rate': 0.00014761728619400792, 'epoch': 0.6}
 60%|█████▉    | 2057/3449 [1:37:02<1:02:28,  2.69s/it] 60%|█████▉    | 2058/3449 [1:37:04<1:00:02,  2.59s/it]                                                       {'loss': 1.2857, 'learning_rate': 0.00014743624484042748, 'epoch': 0.6}
 60%|█████▉    | 2058/3449 [1:37:04<1:00:02,  2.59s/it] 60%|█████▉    | 2059/3449 [1:37:07<1:01:28,  2.65s/it]                                                       {'loss': 1.1721, 'learning_rate': 0.0001472552497415399, 'epoch': 0.6}
 60%|█████▉    | 2059/3449 [1:37:07<1:01:28,  2.65s/it] 60%|█████▉    | 2060/3449 [1:37:10<1:02:24,  2.70s/it]                                                       {'loss': 1.2303, 'learning_rate': 0.00014707430105661615, 'epoch': 0.6}
 60%|█████▉    | 2060/3449 [1:37:10<1:02:24,  2.70s/it] 60%|█████▉    | 2061/3449 [1:37:13<1:10:59,  3.07s/it]                                                       {'loss': 1.2111, 'learning_rate': 0.00014689339894488604, 'epoch': 0.6}
 60%|█████▉    | 2061/3449 [1:37:13<1:10:59,  3.07s/it] 60%|█████▉    | 2062/3449 [1:37:16<1:10:14,  3.04s/it]                                                       {'loss': 1.2486, 'learning_rate': 0.00014671254356553873, 'epoch': 0.6}
 60%|█████▉    | 2062/3449 [1:37:16<1:10:14,  3.04s/it] 60%|█████▉    | 2063/3449 [1:37:20<1:10:51,  3.07s/it]                                                       {'loss': 1.2024, 'learning_rate': 0.00014653173507772204, 'epoch': 0.6}
 60%|█████▉    | 2063/3449 [1:37:20<1:10:51,  3.07s/it] 60%|█████▉    | 2064/3449 [1:37:23<1:11:44,  3.11s/it]                                                       {'loss': 1.201, 'learning_rate': 0.00014635097364054255, 'epoch': 0.6}
 60%|█████▉    | 2064/3449 [1:37:23<1:11:44,  3.11s/it] 60%|█████▉    | 2065/3449 [1:37:27<1:16:35,  3.32s/it]                                                       {'loss': 1.3314, 'learning_rate': 0.00014617025941306548, 'epoch': 0.6}
 60%|█████▉    | 2065/3449 [1:37:27<1:16:35,  3.32s/it] 60%|█████▉    | 2066/3449 [1:37:29<1:11:35,  3.11s/it]                                                       {'loss': 1.2066, 'learning_rate': 0.0001459895925543146, 'epoch': 0.6}
 60%|█████▉    | 2066/3449 [1:37:29<1:11:35,  3.11s/it] 60%|█████▉    | 2067/3449 [1:37:32<1:08:39,  2.98s/it]                                                       {'loss': 1.2759, 'learning_rate': 0.00014580897322327173, 'epoch': 0.6}
 60%|█████▉    | 2067/3449 [1:37:32<1:08:39,  2.98s/it] 60%|█████▉    | 2068/3449 [1:37:34<1:03:54,  2.78s/it]                                                       {'loss': 1.2617, 'learning_rate': 0.0001456284015788771, 'epoch': 0.6}
 60%|█████▉    | 2068/3449 [1:37:34<1:03:54,  2.78s/it] 60%|█████▉    | 2069/3449 [1:37:37<1:02:05,  2.70s/it]                                                       {'loss': 1.2517, 'learning_rate': 0.00014544787778002907, 'epoch': 0.6}
 60%|█████▉    | 2069/3449 [1:37:37<1:02:05,  2.70s/it] 60%|██████    | 2070/3449 [1:37:40<1:08:47,  2.99s/it]                                                       {'loss': 1.2717, 'learning_rate': 0.00014526740198558344, 'epoch': 0.6}
 60%|██████    | 2070/3449 [1:37:40<1:08:47,  2.99s/it] 60%|██████    | 2071/3449 [1:37:43<1:07:38,  2.95s/it]                                                       {'loss': 1.2911, 'learning_rate': 0.00014508697435435428, 'epoch': 0.6}
 60%|██████    | 2071/3449 [1:37:43<1:07:38,  2.95s/it] 60%|██████    | 2072/3449 [1:37:46<1:04:04,  2.79s/it]                                                       {'loss': 1.2805, 'learning_rate': 0.00014490659504511294, 'epoch': 0.6}
 60%|██████    | 2072/3449 [1:37:46<1:04:04,  2.79s/it] 60%|██████    | 2073/3449 [1:37:48<1:02:08,  2.71s/it]                                                       {'loss': 1.2601, 'learning_rate': 0.00014472626421658838, 'epoch': 0.6}
 60%|██████    | 2073/3449 [1:37:48<1:02:08,  2.71s/it] 60%|██████    | 2074/3449 [1:37:51<1:01:17,  2.67s/it]                                                       {'loss': 1.2782, 'learning_rate': 0.00014454598202746704, 'epoch': 0.6}
 60%|██████    | 2074/3449 [1:37:51<1:01:17,  2.67s/it] 60%|██████    | 2075/3449 [1:37:54<1:06:56,  2.92s/it]                                                       {'loss': 1.1545, 'learning_rate': 0.0001443657486363922, 'epoch': 0.6}
 60%|██████    | 2075/3449 [1:37:54<1:06:56,  2.92s/it] 60%|██████    | 2076/3449 [1:37:58<1:12:48,  3.18s/it]                                                       {'loss': 1.2676, 'learning_rate': 0.0001441855642019645, 'epoch': 0.6}
 60%|██████    | 2076/3449 [1:37:58<1:12:48,  3.18s/it] 60%|██████    | 2077/3449 [1:38:00<1:05:50,  2.88s/it]                                                       {'loss': 1.1638, 'learning_rate': 0.00014400542888274144, 'epoch': 0.6}
 60%|██████    | 2077/3449 [1:38:00<1:05:50,  2.88s/it] 60%|██████    | 2078/3449 [1:38:03<1:02:35,  2.74s/it]                                                       {'loss': 1.2776, 'learning_rate': 0.00014382534283723716, 'epoch': 0.6}
 60%|██████    | 2078/3449 [1:38:03<1:02:35,  2.74s/it] 60%|██████    | 2079/3449 [1:38:06<1:04:22,  2.82s/it]                                                       {'loss': 1.1626, 'learning_rate': 0.0001436453062239226, 'epoch': 0.6}
 60%|██████    | 2079/3449 [1:38:06<1:04:22,  2.82s/it] 60%|██████    | 2080/3449 [1:38:08<1:02:37,  2.74s/it]                                                       {'loss': 1.3532, 'learning_rate': 0.00014346531920122522, 'epoch': 0.6}
 60%|██████    | 2080/3449 [1:38:08<1:02:37,  2.74s/it] 60%|██████    | 2081/3449 [1:38:11<1:05:28,  2.87s/it]                                                       {'loss': 1.2753, 'learning_rate': 0.00014328538192752863, 'epoch': 0.6}
 60%|██████    | 2081/3449 [1:38:11<1:05:28,  2.87s/it] 60%|██████    | 2082/3449 [1:38:14<1:02:38,  2.75s/it]                                                       {'loss': 1.3102, 'learning_rate': 0.0001431054945611729, 'epoch': 0.6}
 60%|██████    | 2082/3449 [1:38:14<1:02:38,  2.75s/it] 60%|██████    | 2083/3449 [1:38:17<1:03:39,  2.80s/it]                                                       {'loss': 1.1213, 'learning_rate': 0.00014292565726045398, 'epoch': 0.6}
 60%|██████    | 2083/3449 [1:38:17<1:03:39,  2.80s/it] 60%|██████    | 2084/3449 [1:38:19<1:03:12,  2.78s/it]                                                       {'loss': 1.389, 'learning_rate': 0.00014274587018362395, 'epoch': 0.6}
 60%|██████    | 2084/3449 [1:38:19<1:03:12,  2.78s/it] 60%|██████    | 2085/3449 [1:38:22<1:03:51,  2.81s/it]                                                       {'loss': 1.2941, 'learning_rate': 0.00014256613348889063, 'epoch': 0.6}
 60%|██████    | 2085/3449 [1:38:22<1:03:51,  2.81s/it] 60%|██████    | 2086/3449 [1:38:26<1:08:04,  3.00s/it]                                                       {'loss': 1.2732, 'learning_rate': 0.0001423864473344174, 'epoch': 0.6}
 60%|██████    | 2086/3449 [1:38:26<1:08:04,  3.00s/it] 61%|██████    | 2087/3449 [1:38:29<1:09:17,  3.05s/it]                                                       {'loss': 1.0998, 'learning_rate': 0.00014220681187832328, 'epoch': 0.61}
 61%|██████    | 2087/3449 [1:38:29<1:09:17,  3.05s/it] 61%|██████    | 2088/3449 [1:38:31<1:04:57,  2.86s/it]                                                       {'loss': 1.2991, 'learning_rate': 0.00014202722727868272, 'epoch': 0.61}
 61%|██████    | 2088/3449 [1:38:31<1:04:57,  2.86s/it] 61%|██████    | 2089/3449 [1:38:34<1:03:48,  2.81s/it]                                                       {'loss': 1.2619, 'learning_rate': 0.00014184769369352524, 'epoch': 0.61}
 61%|██████    | 2089/3449 [1:38:34<1:03:48,  2.81s/it] 61%|██████    | 2090/3449 [1:38:37<1:02:08,  2.74s/it]                                                       {'loss': 1.2346, 'learning_rate': 0.00014166821128083559, 'epoch': 0.61}
 61%|██████    | 2090/3449 [1:38:37<1:02:08,  2.74s/it] 61%|██████    | 2091/3449 [1:38:40<1:08:32,  3.03s/it]                                                       {'loss': 1.3648, 'learning_rate': 0.0001414887801985536, 'epoch': 0.61}
 61%|██████    | 2091/3449 [1:38:40<1:08:32,  3.03s/it] 61%|██████    | 2092/3449 [1:38:43<1:08:00,  3.01s/it]                                                       {'loss': 1.2671, 'learning_rate': 0.00014130940060457357, 'epoch': 0.61}
 61%|██████    | 2092/3449 [1:38:43<1:08:00,  3.01s/it] 61%|██████    | 2093/3449 [1:38:46<1:05:10,  2.88s/it]                                                       {'loss': 1.3379, 'learning_rate': 0.00014113007265674493, 'epoch': 0.61}
 61%|██████    | 2093/3449 [1:38:46<1:05:10,  2.88s/it] 61%|██████    | 2094/3449 [1:38:49<1:03:59,  2.83s/it]                                                       {'loss': 1.2545, 'learning_rate': 0.00014095079651287143, 'epoch': 0.61}
 61%|██████    | 2094/3449 [1:38:49<1:03:59,  2.83s/it] 61%|██████    | 2095/3449 [1:38:51<1:02:01,  2.75s/it]                                                       {'loss': 1.15, 'learning_rate': 0.00014077157233071113, 'epoch': 0.61}
 61%|██████    | 2095/3449 [1:38:51<1:02:01,  2.75s/it] 61%|██████    | 2096/3449 [1:38:53<59:00,  2.62s/it]                                                       {'loss': 1.2344, 'learning_rate': 0.00014059240026797673, 'epoch': 0.61}
 61%|██████    | 2096/3449 [1:38:53<59:00,  2.62s/it] 61%|██████    | 2097/3449 [1:38:57<1:03:30,  2.82s/it]                                                       {'loss': 1.0268, 'learning_rate': 0.00014041328048233453, 'epoch': 0.61}
 61%|██████    | 2097/3449 [1:38:57<1:03:30,  2.82s/it] 61%|██████    | 2098/3449 [1:38:59<1:01:39,  2.74s/it]                                                       {'loss': 1.273, 'learning_rate': 0.00014023421313140533, 'epoch': 0.61}
 61%|██████    | 2098/3449 [1:38:59<1:01:39,  2.74s/it] 61%|██████    | 2099/3449 [1:39:03<1:04:48,  2.88s/it]                                                       {'loss': 1.138, 'learning_rate': 0.00014005519837276365, 'epoch': 0.61}
 61%|██████    | 2099/3449 [1:39:03<1:04:48,  2.88s/it] 61%|██████    | 2100/3449 [1:39:05<1:05:14,  2.90s/it]                                                       {'loss': 1.1893, 'learning_rate': 0.00013987623636393744, 'epoch': 0.61}
 61%|██████    | 2100/3449 [1:39:05<1:05:14,  2.90s/it] 61%|██████    | 2101/3449 [1:39:08<1:03:37,  2.83s/it]                                                       {'loss': 1.2332, 'learning_rate': 0.00013969732726240865, 'epoch': 0.61}
 61%|██████    | 2101/3449 [1:39:08<1:03:37,  2.83s/it] 61%|██████    | 2102/3449 [1:39:10<59:34,  2.65s/it]                                                       {'loss': 1.4209, 'learning_rate': 0.00013951847122561247, 'epoch': 0.61}
 61%|██████    | 2102/3449 [1:39:10<59:34,  2.65s/it] 61%|██████    | 2103/3449 [1:39:13<58:44,  2.62s/it]                                                     {'loss': 1.1975, 'learning_rate': 0.00013933966841093732, 'epoch': 0.61}
 61%|██████    | 2103/3449 [1:39:13<58:44,  2.62s/it] 61%|██████    | 2104/3449 [1:39:15<58:00,  2.59s/it]                                                     {'loss': 1.2464, 'learning_rate': 0.0001391609189757249, 'epoch': 0.61}
 61%|██████    | 2104/3449 [1:39:15<58:00,  2.59s/it] 61%|██████    | 2105/3449 [1:39:18<57:57,  2.59s/it]                                                     {'loss': 1.1881, 'learning_rate': 0.00013898222307727, 'epoch': 0.61}
 61%|██████    | 2105/3449 [1:39:18<57:57,  2.59s/it] 61%|██████    | 2106/3449 [1:39:21<58:51,  2.63s/it]                                                     {'loss': 1.2199, 'learning_rate': 0.0001388035808728201, 'epoch': 0.61}
 61%|██████    | 2106/3449 [1:39:21<58:51,  2.63s/it] 61%|██████    | 2107/3449 [1:39:23<57:14,  2.56s/it]                                                     {'loss': 1.3859, 'learning_rate': 0.00013862499251957565, 'epoch': 0.61}
 61%|██████    | 2107/3449 [1:39:23<57:14,  2.56s/it] 61%|██████    | 2108/3449 [1:39:26<57:58,  2.59s/it]                                                     {'loss': 1.3175, 'learning_rate': 0.00013844645817468948, 'epoch': 0.61}
 61%|██████    | 2108/3449 [1:39:26<57:58,  2.59s/it] 61%|██████    | 2109/3449 [1:39:28<58:09,  2.60s/it]                                                     {'loss': 1.261, 'learning_rate': 0.00013826797799526704, 'epoch': 0.61}
 61%|██████    | 2109/3449 [1:39:28<58:09,  2.60s/it] 61%|██████    | 2110/3449 [1:39:31<1:01:01,  2.73s/it]                                                       {'loss': 1.2278, 'learning_rate': 0.00013808955213836626, 'epoch': 0.61}
 61%|██████    | 2110/3449 [1:39:31<1:01:01,  2.73s/it] 61%|██████    | 2111/3449 [1:39:34<58:09,  2.61s/it]                                                       {'loss': 1.1112, 'learning_rate': 0.0001379111807609969, 'epoch': 0.61}
 61%|██████    | 2111/3449 [1:39:34<58:09,  2.61s/it] 61%|██████    | 2112/3449 [1:39:36<57:26,  2.58s/it]                                                     {'loss': 1.2584, 'learning_rate': 0.00013773286402012105, 'epoch': 0.61}
 61%|██████    | 2112/3449 [1:39:36<57:26,  2.58s/it] 61%|██████▏   | 2113/3449 [1:39:40<1:01:32,  2.76s/it]                                                       {'loss': 1.2184, 'learning_rate': 0.00013755460207265277, 'epoch': 0.61}
 61%|██████▏   | 2113/3449 [1:39:40<1:01:32,  2.76s/it] 61%|██████▏   | 2114/3449 [1:39:42<59:56,  2.69s/it]                                                       {'loss': 1.4343, 'learning_rate': 0.00013737639507545757, 'epoch': 0.61}
 61%|██████▏   | 2114/3449 [1:39:42<59:56,  2.69s/it] 61%|██████▏   | 2115/3449 [1:39:45<1:01:35,  2.77s/it]                                                       {'loss': 1.2246, 'learning_rate': 0.00013719824318535296, 'epoch': 0.61}
 61%|██████▏   | 2115/3449 [1:39:45<1:01:35,  2.77s/it] 61%|██████▏   | 2116/3449 [1:39:47<59:44,  2.69s/it]                                                       {'loss': 1.2981, 'learning_rate': 0.00013702014655910785, 'epoch': 0.61}
 61%|██████▏   | 2116/3449 [1:39:47<59:44,  2.69s/it] 61%|██████▏   | 2117/3449 [1:39:50<59:35,  2.68s/it]                                                     {'loss': 1.3576, 'learning_rate': 0.00013684210535344233, 'epoch': 0.61}
 61%|██████▏   | 2117/3449 [1:39:50<59:35,  2.68s/it] 61%|██████▏   | 2118/3449 [1:39:54<1:04:35,  2.91s/it]                                                       {'loss': 1.1252, 'learning_rate': 0.0001366641197250281, 'epoch': 0.61}
 61%|██████▏   | 2118/3449 [1:39:54<1:04:35,  2.91s/it] 61%|██████▏   | 2119/3449 [1:39:57<1:05:16,  2.94s/it]                                                       {'loss': 1.1529, 'learning_rate': 0.00013648618983048755, 'epoch': 0.61}
 61%|██████▏   | 2119/3449 [1:39:57<1:05:16,  2.94s/it] 61%|██████▏   | 2120/3449 [1:39:59<1:01:59,  2.80s/it]                                                       {'loss': 1.1699, 'learning_rate': 0.00013630831582639425, 'epoch': 0.61}
 61%|██████▏   | 2120/3449 [1:39:59<1:01:59,  2.80s/it] 61%|██████▏   | 2121/3449 [1:40:02<1:05:38,  2.97s/it]                                                       {'loss': 1.2738, 'learning_rate': 0.00013613049786927262, 'epoch': 0.61}
 61%|██████▏   | 2121/3449 [1:40:02<1:05:38,  2.97s/it] 62%|██████▏   | 2122/3449 [1:40:06<1:07:59,  3.07s/it]                                                       {'loss': 1.1718, 'learning_rate': 0.00013595273611559757, 'epoch': 0.62}
 62%|██████▏   | 2122/3449 [1:40:06<1:07:59,  3.07s/it] 62%|██████▏   | 2123/3449 [1:40:08<1:03:48,  2.89s/it]                                                       {'loss': 1.1923, 'learning_rate': 0.00013577503072179477, 'epoch': 0.62}
 62%|██████▏   | 2123/3449 [1:40:08<1:03:48,  2.89s/it] 62%|██████▏   | 2124/3449 [1:40:11<1:02:40,  2.84s/it]                                                       {'loss': 1.0469, 'learning_rate': 0.0001355973818442402, 'epoch': 0.62}
 62%|██████▏   | 2124/3449 [1:40:11<1:02:40,  2.84s/it] 62%|██████▏   | 2125/3449 [1:40:14<1:01:37,  2.79s/it]                                                       {'loss': 1.2991, 'learning_rate': 0.00013541978963926002, 'epoch': 0.62}
 62%|██████▏   | 2125/3449 [1:40:14<1:01:37,  2.79s/it] 62%|██████▏   | 2126/3449 [1:40:16<59:47,  2.71s/it]                                                       {'loss': 1.2704, 'learning_rate': 0.0001352422542631306, 'epoch': 0.62}
 62%|██████▏   | 2126/3449 [1:40:16<59:47,  2.71s/it] 62%|██████▏   | 2127/3449 [1:40:19<1:00:36,  2.75s/it]                                                       {'loss': 1.2079, 'learning_rate': 0.00013506477587207845, 'epoch': 0.62}
 62%|██████▏   | 2127/3449 [1:40:19<1:00:36,  2.75s/it] 62%|██████▏   | 2128/3449 [1:40:22<1:00:41,  2.76s/it]                                                       {'loss': 1.2624, 'learning_rate': 0.0001348873546222796, 'epoch': 0.62}
 62%|██████▏   | 2128/3449 [1:40:22<1:00:41,  2.76s/it] 62%|██████▏   | 2129/3449 [1:40:24<59:15,  2.69s/it]                                                       {'loss': 1.2516, 'learning_rate': 0.00013470999066986006, 'epoch': 0.62}
 62%|██████▏   | 2129/3449 [1:40:24<59:15,  2.69s/it] 62%|██████▏   | 2130/3449 [1:40:28<1:02:31,  2.84s/it]                                                       {'loss': 1.1464, 'learning_rate': 0.00013453268417089545, 'epoch': 0.62}
 62%|██████▏   | 2130/3449 [1:40:28<1:02:31,  2.84s/it] 62%|██████▏   | 2131/3449 [1:40:30<1:02:03,  2.82s/it]                                                       {'loss': 1.3755, 'learning_rate': 0.00013435543528141054, 'epoch': 0.62}
 62%|██████▏   | 2131/3449 [1:40:30<1:02:03,  2.82s/it] 62%|██████▏   | 2132/3449 [1:40:33<58:52,  2.68s/it]                                                       {'loss': 1.4696, 'learning_rate': 0.00013417824415737974, 'epoch': 0.62}
 62%|██████▏   | 2132/3449 [1:40:33<58:52,  2.68s/it] 62%|██████▏   | 2133/3449 [1:40:35<58:39,  2.67s/it]                                                     {'loss': 1.0735, 'learning_rate': 0.0001340011109547264, 'epoch': 0.62}
 62%|██████▏   | 2133/3449 [1:40:35<58:39,  2.67s/it] 62%|██████▏   | 2134/3449 [1:40:38<57:49,  2.64s/it]                                                     {'loss': 1.3988, 'learning_rate': 0.00013382403582932296, 'epoch': 0.62}
 62%|██████▏   | 2134/3449 [1:40:38<57:49,  2.64s/it] 62%|██████▏   | 2135/3449 [1:40:40<56:04,  2.56s/it]                                                     {'loss': 1.2196, 'learning_rate': 0.00013364701893699092, 'epoch': 0.62}
 62%|██████▏   | 2135/3449 [1:40:40<56:04,  2.56s/it] 62%|██████▏   | 2136/3449 [1:40:43<54:53,  2.51s/it]                                                     {'loss': 1.2899, 'learning_rate': 0.00013347006043350023, 'epoch': 0.62}
 62%|██████▏   | 2136/3449 [1:40:43<54:53,  2.51s/it] 62%|██████▏   | 2137/3449 [1:40:45<56:51,  2.60s/it]                                                     {'loss': 1.2111, 'learning_rate': 0.0001332931604745697, 'epoch': 0.62}
 62%|██████▏   | 2137/3449 [1:40:45<56:51,  2.60s/it] 62%|██████▏   | 2138/3449 [1:40:48<57:18,  2.62s/it]                                                     {'loss': 1.2604, 'learning_rate': 0.00013311631921586657, 'epoch': 0.62}
 62%|██████▏   | 2138/3449 [1:40:48<57:18,  2.62s/it] 62%|██████▏   | 2139/3449 [1:40:51<57:17,  2.62s/it]                                                     {'loss': 1.1808, 'learning_rate': 0.00013293953681300623, 'epoch': 0.62}
 62%|██████▏   | 2139/3449 [1:40:51<57:17,  2.62s/it] 62%|██████▏   | 2140/3449 [1:40:55<1:10:26,  3.23s/it]                                                       {'loss': 1.155, 'learning_rate': 0.00013276281342155266, 'epoch': 0.62}
 62%|██████▏   | 2140/3449 [1:40:55<1:10:26,  3.23s/it] 62%|██████▏   | 2141/3449 [1:40:59<1:13:14,  3.36s/it]                                                       {'loss': 1.3056, 'learning_rate': 0.0001325861491970176, 'epoch': 0.62}
 62%|██████▏   | 2141/3449 [1:40:59<1:13:14,  3.36s/it] 62%|██████▏   | 2142/3449 [1:41:02<1:08:01,  3.12s/it]                                                       {'loss': 1.3833, 'learning_rate': 0.00013240954429486084, 'epoch': 0.62}
 62%|██████▏   | 2142/3449 [1:41:02<1:08:01,  3.12s/it] 62%|██████▏   | 2143/3449 [1:41:04<1:05:21,  3.00s/it]                                                       {'loss': 1.141, 'learning_rate': 0.00013223299887048996, 'epoch': 0.62}
 62%|██████▏   | 2143/3449 [1:41:04<1:05:21,  3.00s/it] 62%|██████▏   | 2144/3449 [1:41:07<1:03:07,  2.90s/it]                                                       {'loss': 1.0972, 'learning_rate': 0.00013205651307926012, 'epoch': 0.62}
 62%|██████▏   | 2144/3449 [1:41:07<1:03:07,  2.90s/it] 62%|██████▏   | 2145/3449 [1:41:10<1:00:53,  2.80s/it]                                                       {'loss': 1.2575, 'learning_rate': 0.00013188008707647417, 'epoch': 0.62}
 62%|██████▏   | 2145/3449 [1:41:10<1:00:53,  2.80s/it] 62%|██████▏   | 2146/3449 [1:41:13<1:05:48,  3.03s/it]                                                       {'loss': 1.2367, 'learning_rate': 0.00013170372101738224, 'epoch': 0.62}
 62%|██████▏   | 2146/3449 [1:41:13<1:05:48,  3.03s/it] 62%|██████▏   | 2147/3449 [1:41:15<1:01:07,  2.82s/it]                                                       {'loss': 1.1576, 'learning_rate': 0.0001315274150571817, 'epoch': 0.62}
 62%|██████▏   | 2147/3449 [1:41:15<1:01:07,  2.82s/it] 62%|██████▏   | 2148/3449 [1:41:18<1:01:53,  2.85s/it]                                                       {'loss': 1.217, 'learning_rate': 0.000131351169351017, 'epoch': 0.62}
 62%|██████▏   | 2148/3449 [1:41:18<1:01:53,  2.85s/it] 62%|██████▏   | 2149/3449 [1:41:21<1:01:41,  2.85s/it]                                                       {'loss': 1.255, 'learning_rate': 0.00013117498405397976, 'epoch': 0.62}
 62%|██████▏   | 2149/3449 [1:41:21<1:01:41,  2.85s/it] 62%|██████▏   | 2150/3449 [1:41:24<1:02:36,  2.89s/it]                                                       {'loss': 1.1437, 'learning_rate': 0.0001309988593211082, 'epoch': 0.62}
 62%|██████▏   | 2150/3449 [1:41:24<1:02:36,  2.89s/it] 62%|██████▏   | 2151/3449 [1:41:27<59:25,  2.75s/it]                                                       {'loss': 1.2551, 'learning_rate': 0.00013082279530738736, 'epoch': 0.62}
 62%|██████▏   | 2151/3449 [1:41:27<59:25,  2.75s/it] 62%|██████▏   | 2152/3449 [1:41:29<59:38,  2.76s/it]                                                     {'loss': 1.2998, 'learning_rate': 0.000130646792167749, 'epoch': 0.62}
 62%|██████▏   | 2152/3449 [1:41:29<59:38,  2.76s/it] 62%|██████▏   | 2153/3449 [1:41:32<56:45,  2.63s/it]                                                     {'loss': 1.3105, 'learning_rate': 0.00013047085005707095, 'epoch': 0.62}
 62%|██████▏   | 2153/3449 [1:41:32<56:45,  2.63s/it] 62%|██████▏   | 2154/3449 [1:41:35<1:00:38,  2.81s/it]                                                       {'loss': 1.2707, 'learning_rate': 0.0001302949691301777, 'epoch': 0.62}
 62%|██████▏   | 2154/3449 [1:41:35<1:00:38,  2.81s/it] 62%|██████▏   | 2155/3449 [1:41:38<58:50,  2.73s/it]                                                       {'loss': 1.1905, 'learning_rate': 0.00013011914954183962, 'epoch': 0.62}
 62%|██████▏   | 2155/3449 [1:41:38<58:50,  2.73s/it] 63%|██████▎   | 2156/3449 [1:41:40<58:24,  2.71s/it]                                                     {'loss': 1.1772, 'learning_rate': 0.00012994339144677323, 'epoch': 0.63}
 63%|██████▎   | 2156/3449 [1:41:40<58:24,  2.71s/it] 63%|██████▎   | 2157/3449 [1:41:44<1:04:20,  2.99s/it]                                                       {'loss': 1.1051, 'learning_rate': 0.00012976769499964107, 'epoch': 0.63}
 63%|██████▎   | 2157/3449 [1:41:44<1:04:20,  2.99s/it] 63%|██████▎   | 2158/3449 [1:41:47<1:04:18,  2.99s/it]                                                       {'loss': 1.1949, 'learning_rate': 0.00012959206035505119, 'epoch': 0.63}
 63%|██████▎   | 2158/3449 [1:41:47<1:04:18,  2.99s/it] 63%|██████▎   | 2159/3449 [1:41:49<1:02:09,  2.89s/it]                                                       {'loss': 1.0963, 'learning_rate': 0.00012941648766755733, 'epoch': 0.63}
 63%|██████▎   | 2159/3449 [1:41:49<1:02:09,  2.89s/it] 63%|██████▎   | 2160/3449 [1:41:52<59:27,  2.77s/it]                                                       {'loss': 1.2266, 'learning_rate': 0.0001292409770916589, 'epoch': 0.63}
 63%|██████▎   | 2160/3449 [1:41:52<59:27,  2.77s/it] 63%|██████▎   | 2161/3449 [1:41:54<56:33,  2.63s/it]                                                     {'loss': 1.2433, 'learning_rate': 0.00012906552878180023, 'epoch': 0.63}
 63%|██████▎   | 2161/3449 [1:41:54<56:33,  2.63s/it] 63%|██████▎   | 2162/3449 [1:41:57<54:57,  2.56s/it]                                                     {'loss': 1.3368, 'learning_rate': 0.00012889014289237132, 'epoch': 0.63}
 63%|██████▎   | 2162/3449 [1:41:57<54:57,  2.56s/it] 63%|██████▎   | 2163/3449 [1:41:59<54:33,  2.55s/it]                                                     {'loss': 1.2912, 'learning_rate': 0.00012871481957770707, 'epoch': 0.63}
 63%|██████▎   | 2163/3449 [1:41:59<54:33,  2.55s/it] 63%|██████▎   | 2164/3449 [1:42:02<54:31,  2.55s/it]                                                     {'loss': 1.1492, 'learning_rate': 0.00012853955899208715, 'epoch': 0.63}
 63%|██████▎   | 2164/3449 [1:42:02<54:31,  2.55s/it] 63%|██████▎   | 2165/3449 [1:42:04<55:45,  2.61s/it]                                                     {'loss': 1.2807, 'learning_rate': 0.0001283643612897362, 'epoch': 0.63}
 63%|██████▎   | 2165/3449 [1:42:04<55:45,  2.61s/it] 63%|██████▎   | 2166/3449 [1:42:07<57:33,  2.69s/it]                                                     {'loss': 1.1981, 'learning_rate': 0.0001281892266248236, 'epoch': 0.63}
 63%|██████▎   | 2166/3449 [1:42:07<57:33,  2.69s/it] 63%|██████▎   | 2167/3449 [1:42:10<56:32,  2.65s/it]                                                     {'loss': 1.2993, 'learning_rate': 0.00012801415515146305, 'epoch': 0.63}
 63%|██████▎   | 2167/3449 [1:42:10<56:32,  2.65s/it] 63%|██████▎   | 2168/3449 [1:42:12<55:58,  2.62s/it]                                                     {'loss': 1.3053, 'learning_rate': 0.0001278391470237128, 'epoch': 0.63}
 63%|██████▎   | 2168/3449 [1:42:12<55:58,  2.62s/it] 63%|██████▎   | 2169/3449 [1:42:15<55:30,  2.60s/it]                                                     {'loss': 1.0965, 'learning_rate': 0.0001276642023955752, 'epoch': 0.63}
 63%|██████▎   | 2169/3449 [1:42:15<55:30,  2.60s/it] 63%|██████▎   | 2170/3449 [1:42:18<58:02,  2.72s/it]                                                     {'loss': 1.2454, 'learning_rate': 0.00012748932142099694, 'epoch': 0.63}
 63%|██████▎   | 2170/3449 [1:42:18<58:02,  2.72s/it] 63%|██████▎   | 2171/3449 [1:42:21<56:45,  2.66s/it]                                                     {'loss': 1.3215, 'learning_rate': 0.00012731450425386857, 'epoch': 0.63}
 63%|██████▎   | 2171/3449 [1:42:21<56:45,  2.66s/it] 63%|██████▎   | 2172/3449 [1:42:23<57:48,  2.72s/it]                                                     {'loss': 1.1328, 'learning_rate': 0.00012713975104802443, 'epoch': 0.63}
 63%|██████▎   | 2172/3449 [1:42:23<57:48,  2.72s/it] 63%|██████▎   | 2173/3449 [1:42:26<56:25,  2.65s/it]                                                     {'loss': 1.3808, 'learning_rate': 0.00012696506195724268, 'epoch': 0.63}
 63%|██████▎   | 2173/3449 [1:42:26<56:25,  2.65s/it] 63%|██████▎   | 2174/3449 [1:42:28<55:30,  2.61s/it]                                                     {'loss': 1.3095, 'learning_rate': 0.00012679043713524507, 'epoch': 0.63}
 63%|██████▎   | 2174/3449 [1:42:28<55:30,  2.61s/it] 63%|██████▎   | 2175/3449 [1:42:31<54:29,  2.57s/it]                                                     {'loss': 1.1357, 'learning_rate': 0.00012661587673569672, 'epoch': 0.63}
 63%|██████▎   | 2175/3449 [1:42:31<54:29,  2.57s/it] 63%|██████▎   | 2176/3449 [1:42:33<54:31,  2.57s/it]                                                     {'loss': 1.1835, 'learning_rate': 0.0001264413809122061, 'epoch': 0.63}
 63%|██████▎   | 2176/3449 [1:42:33<54:31,  2.57s/it] 63%|██████▎   | 2177/3449 [1:42:36<54:45,  2.58s/it]                                                     {'loss': 1.2901, 'learning_rate': 0.00012626694981832486, 'epoch': 0.63}
 63%|██████▎   | 2177/3449 [1:42:36<54:45,  2.58s/it] 63%|██████▎   | 2178/3449 [1:42:39<57:15,  2.70s/it]                                                     {'loss': 1.1328, 'learning_rate': 0.0001260925836075476, 'epoch': 0.63}
 63%|██████▎   | 2178/3449 [1:42:39<57:15,  2.70s/it] 63%|██████▎   | 2179/3449 [1:42:41<55:33,  2.62s/it]                                                     {'loss': 1.2281, 'learning_rate': 0.00012591828243331204, 'epoch': 0.63}
 63%|██████▎   | 2179/3449 [1:42:41<55:33,  2.62s/it] 63%|██████▎   | 2180/3449 [1:42:44<53:57,  2.55s/it]                                                     {'loss': 1.3836, 'learning_rate': 0.00012574404644899844, 'epoch': 0.63}
 63%|██████▎   | 2180/3449 [1:42:44<53:57,  2.55s/it] 63%|██████▎   | 2181/3449 [1:42:46<53:20,  2.52s/it]                                                     {'loss': 1.2133, 'learning_rate': 0.00012556987580792978, 'epoch': 0.63}
 63%|██████▎   | 2181/3449 [1:42:46<53:20,  2.52s/it] 63%|██████▎   | 2182/3449 [1:42:49<54:19,  2.57s/it]                                                     {'loss': 1.3686, 'learning_rate': 0.00012539577066337162, 'epoch': 0.63}
 63%|██████▎   | 2182/3449 [1:42:49<54:19,  2.57s/it] 63%|██████▎   | 2183/3449 [1:42:52<56:44,  2.69s/it]                                                     {'loss': 1.2729, 'learning_rate': 0.0001252217311685317, 'epoch': 0.63}
 63%|██████▎   | 2183/3449 [1:42:52<56:44,  2.69s/it] 63%|██████▎   | 2184/3449 [1:42:55<58:29,  2.77s/it]                                                     {'loss': 1.2958, 'learning_rate': 0.0001250477574765602, 'epoch': 0.63}
 63%|██████▎   | 2184/3449 [1:42:55<58:29,  2.77s/it] 63%|██████▎   | 2185/3449 [1:42:58<57:39,  2.74s/it]                                                     {'loss': 1.1489, 'learning_rate': 0.00012487384974054928, 'epoch': 0.63}
 63%|██████▎   | 2185/3449 [1:42:58<57:39,  2.74s/it] 63%|██████▎   | 2186/3449 [1:43:00<54:27,  2.59s/it]                                                     {'loss': 1.2523, 'learning_rate': 0.000124700008113533, 'epoch': 0.63}
 63%|██████▎   | 2186/3449 [1:43:00<54:27,  2.59s/it] 63%|██████▎   | 2187/3449 [1:43:02<54:23,  2.59s/it]                                                     {'loss': 1.2193, 'learning_rate': 0.00012452623274848741, 'epoch': 0.63}
 63%|██████▎   | 2187/3449 [1:43:02<54:23,  2.59s/it] 63%|██████▎   | 2188/3449 [1:43:05<55:47,  2.65s/it]                                                     {'loss': 1.2257, 'learning_rate': 0.0001243525237983302, 'epoch': 0.63}
 63%|██████▎   | 2188/3449 [1:43:05<55:47,  2.65s/it] 63%|██████▎   | 2189/3449 [1:43:08<57:03,  2.72s/it]                                                     {'loss': 1.209, 'learning_rate': 0.00012417888141592044, 'epoch': 0.63}
 63%|██████▎   | 2189/3449 [1:43:08<57:03,  2.72s/it] 63%|██████▎   | 2190/3449 [1:43:11<58:31,  2.79s/it]                                                     {'loss': 1.2551, 'learning_rate': 0.00012400530575405885, 'epoch': 0.63}
 63%|██████▎   | 2190/3449 [1:43:11<58:31,  2.79s/it] 64%|██████▎   | 2191/3449 [1:43:15<1:04:01,  3.05s/it]                                                       {'loss': 1.1165, 'learning_rate': 0.00012383179696548737, 'epoch': 0.64}
 64%|██████▎   | 2191/3449 [1:43:15<1:04:01,  3.05s/it] 64%|██████▎   | 2192/3449 [1:43:18<1:04:16,  3.07s/it]                                                       {'loss': 1.1356, 'learning_rate': 0.00012365835520288906, 'epoch': 0.64}
 64%|██████▎   | 2192/3449 [1:43:18<1:04:16,  3.07s/it] 64%|██████▎   | 2193/3449 [1:43:20<1:00:27,  2.89s/it]                                                       {'loss': 1.2639, 'learning_rate': 0.000123484980618888, 'epoch': 0.64}
 64%|██████▎   | 2193/3449 [1:43:20<1:00:27,  2.89s/it] 64%|██████▎   | 2194/3449 [1:43:23<59:01,  2.82s/it]                                                       {'loss': 1.1757, 'learning_rate': 0.00012331167336604914, 'epoch': 0.64}
 64%|██████▎   | 2194/3449 [1:43:23<59:01,  2.82s/it] 64%|██████▎   | 2195/3449 [1:43:26<59:02,  2.83s/it]                                                     {'loss': 1.3384, 'learning_rate': 0.0001231384335968782, 'epoch': 0.64}
 64%|██████▎   | 2195/3449 [1:43:26<59:02,  2.83s/it] 64%|██████▎   | 2196/3449 [1:43:29<1:00:12,  2.88s/it]                                                       {'loss': 1.2641, 'learning_rate': 0.00012296526146382165, 'epoch': 0.64}
 64%|██████▎   | 2196/3449 [1:43:29<1:00:12,  2.88s/it] 64%|██████▎   | 2197/3449 [1:43:32<1:00:45,  2.91s/it]                                                       {'loss': 1.3647, 'learning_rate': 0.0001227921571192662, 'epoch': 0.64}
 64%|██████▎   | 2197/3449 [1:43:32<1:00:45,  2.91s/it] 64%|██████▎   | 2198/3449 [1:43:35<1:03:02,  3.02s/it]                                                       {'loss': 1.0959, 'learning_rate': 0.00012261912071553902, 'epoch': 0.64}
 64%|██████▎   | 2198/3449 [1:43:35<1:03:02,  3.02s/it] 64%|██████▍   | 2199/3449 [1:43:38<1:00:13,  2.89s/it]                                                       {'loss': 1.1954, 'learning_rate': 0.0001224461524049076, 'epoch': 0.64}
 64%|██████▍   | 2199/3449 [1:43:38<1:00:13,  2.89s/it] 64%|██████▍   | 2200/3449 [1:43:41<1:00:54,  2.93s/it]                                                       {'loss': 1.1165, 'learning_rate': 0.00012227325233957922, 'epoch': 0.64}
 64%|██████▍   | 2200/3449 [1:43:41<1:00:54,  2.93s/it] 64%|██████▍   | 2201/3449 [1:43:43<57:28,  2.76s/it]                                                       {'loss': 1.445, 'learning_rate': 0.00012210042067170148, 'epoch': 0.64}
 64%|██████▍   | 2201/3449 [1:43:43<57:28,  2.76s/it] 64%|██████▍   | 2202/3449 [1:43:45<55:19,  2.66s/it]                                                     {'loss': 1.2479, 'learning_rate': 0.00012192765755336157, 'epoch': 0.64}
 64%|██████▍   | 2202/3449 [1:43:45<55:19,  2.66s/it] 64%|██████▍   | 2203/3449 [1:43:49<58:26,  2.81s/it]                                                     {'loss': 1.2332, 'learning_rate': 0.00012175496313658631, 'epoch': 0.64}
 64%|██████▍   | 2203/3449 [1:43:49<58:26,  2.81s/it] 64%|██████▍   | 2204/3449 [1:43:51<55:23,  2.67s/it]                                                     {'loss': 1.2851, 'learning_rate': 0.0001215823375733423, 'epoch': 0.64}
 64%|██████▍   | 2204/3449 [1:43:51<55:23,  2.67s/it] 64%|██████▍   | 2205/3449 [1:43:53<53:48,  2.59s/it]                                                     {'loss': 1.2553, 'learning_rate': 0.00012140978101553519, 'epoch': 0.64}
 64%|██████▍   | 2205/3449 [1:43:53<53:48,  2.59s/it] 64%|██████▍   | 2206/3449 [1:43:57<57:33,  2.78s/it]                                                     {'loss': 1.245, 'learning_rate': 0.00012123729361501027, 'epoch': 0.64}
 64%|██████▍   | 2206/3449 [1:43:57<57:33,  2.78s/it] 64%|██████▍   | 2207/3449 [1:43:59<56:55,  2.75s/it]                                                     {'loss': 1.3118, 'learning_rate': 0.00012106487552355182, 'epoch': 0.64}
 64%|██████▍   | 2207/3449 [1:43:59<56:55,  2.75s/it] 64%|██████▍   | 2208/3449 [1:44:02<58:02,  2.81s/it]                                                     {'loss': 1.2208, 'learning_rate': 0.00012089252689288302, 'epoch': 0.64}
 64%|██████▍   | 2208/3449 [1:44:02<58:02,  2.81s/it] 64%|██████▍   | 2209/3449 [1:44:05<58:14,  2.82s/it]                                                     {'loss': 1.2214, 'learning_rate': 0.00012072024787466611, 'epoch': 0.64}
 64%|██████▍   | 2209/3449 [1:44:05<58:14,  2.82s/it] 64%|██████▍   | 2210/3449 [1:44:08<57:53,  2.80s/it]                                                     {'loss': 1.1603, 'learning_rate': 0.00012054803862050206, 'epoch': 0.64}
 64%|██████▍   | 2210/3449 [1:44:08<57:53,  2.80s/it] 64%|██████▍   | 2211/3449 [1:44:10<55:14,  2.68s/it]                                                     {'loss': 1.253, 'learning_rate': 0.00012037589928193029, 'epoch': 0.64}
 64%|██████▍   | 2211/3449 [1:44:10<55:14,  2.68s/it] 64%|██████▍   | 2212/3449 [1:44:13<58:50,  2.85s/it]                                                     {'loss': 1.2408, 'learning_rate': 0.00012020383001042878, 'epoch': 0.64}
 64%|██████▍   | 2212/3449 [1:44:13<58:50,  2.85s/it] 64%|██████▍   | 2213/3449 [1:44:16<58:01,  2.82s/it]                                                     {'loss': 1.1736, 'learning_rate': 0.00012003183095741402, 'epoch': 0.64}
 64%|██████▍   | 2213/3449 [1:44:16<58:01,  2.82s/it] 64%|██████▍   | 2214/3449 [1:44:19<58:08,  2.82s/it]                                                     {'loss': 1.2686, 'learning_rate': 0.00011985990227424038, 'epoch': 0.64}
 64%|██████▍   | 2214/3449 [1:44:19<58:08,  2.82s/it] 64%|██████▍   | 2215/3449 [1:44:22<55:49,  2.71s/it]                                                     {'loss': 1.3178, 'learning_rate': 0.00011968804411220062, 'epoch': 0.64}
 64%|██████▍   | 2215/3449 [1:44:22<55:49,  2.71s/it] 64%|██████▍   | 2216/3449 [1:44:24<57:06,  2.78s/it]                                                     {'loss': 1.2621, 'learning_rate': 0.00011951625662252522, 'epoch': 0.64}
 64%|██████▍   | 2216/3449 [1:44:24<57:06,  2.78s/it] 64%|██████▍   | 2217/3449 [1:44:27<55:22,  2.70s/it]                                                     {'loss': 1.172, 'learning_rate': 0.00011934453995638253, 'epoch': 0.64}
 64%|██████▍   | 2217/3449 [1:44:27<55:22,  2.70s/it] 64%|██████▍   | 2218/3449 [1:44:29<52:41,  2.57s/it]                                                     {'loss': 1.2305, 'learning_rate': 0.00011917289426487874, 'epoch': 0.64}
 64%|██████▍   | 2218/3449 [1:44:29<52:41,  2.57s/it] 64%|██████▍   | 2219/3449 [1:44:33<58:18,  2.84s/it]                                                     {'loss': 1.3168, 'learning_rate': 0.00011900131969905733, 'epoch': 0.64}
 64%|██████▍   | 2219/3449 [1:44:33<58:18,  2.84s/it] 64%|██████▍   | 2220/3449 [1:44:37<1:07:23,  3.29s/it]                                                       {'loss': 1.1863, 'learning_rate': 0.0001188298164098993, 'epoch': 0.64}
 64%|██████▍   | 2220/3449 [1:44:37<1:07:23,  3.29s/it] 64%|██████▍   | 2221/3449 [1:44:40<1:05:53,  3.22s/it]                                                       {'loss': 1.2165, 'learning_rate': 0.00011865838454832312, 'epoch': 0.64}
 64%|██████▍   | 2221/3449 [1:44:40<1:05:53,  3.22s/it] 64%|██████▍   | 2222/3449 [1:44:43<1:02:16,  3.05s/it]                                                       {'loss': 1.3095, 'learning_rate': 0.00011848702426518397, 'epoch': 0.64}
 64%|██████▍   | 2222/3449 [1:44:43<1:02:16,  3.05s/it] 64%|██████▍   | 2223/3449 [1:44:45<1:00:03,  2.94s/it]                                                       {'loss': 1.2449, 'learning_rate': 0.00011831573571127444, 'epoch': 0.64}
 64%|██████▍   | 2223/3449 [1:44:45<1:00:03,  2.94s/it] 64%|██████▍   | 2224/3449 [1:44:49<1:01:29,  3.01s/it]                                                       {'loss': 1.2041, 'learning_rate': 0.0001181445190373239, 'epoch': 0.64}
 64%|██████▍   | 2224/3449 [1:44:49<1:01:29,  3.01s/it] 65%|██████▍   | 2225/3449 [1:44:51<59:54,  2.94s/it]                                                       {'loss': 1.2038, 'learning_rate': 0.00011797337439399827, 'epoch': 0.65}
 65%|██████▍   | 2225/3449 [1:44:51<59:54,  2.94s/it] 65%|██████▍   | 2226/3449 [1:44:54<1:00:02,  2.95s/it]                                                       {'loss': 1.2348, 'learning_rate': 0.00011780230193190039, 'epoch': 0.65}
 65%|██████▍   | 2226/3449 [1:44:54<1:00:02,  2.95s/it] 65%|██████▍   | 2227/3449 [1:44:58<1:02:36,  3.07s/it]                                                       {'loss': 1.2937, 'learning_rate': 0.00011763130180156938, 'epoch': 0.65}
 65%|██████▍   | 2227/3449 [1:44:58<1:02:36,  3.07s/it] 65%|██████▍   | 2228/3449 [1:45:00<1:00:41,  2.98s/it]                                                       {'loss': 1.2567, 'learning_rate': 0.00011746037415348072, 'epoch': 0.65}
 65%|██████▍   | 2228/3449 [1:45:00<1:00:41,  2.98s/it] 65%|██████▍   | 2229/3449 [1:45:03<57:35,  2.83s/it]                                                       {'loss': 1.2267, 'learning_rate': 0.00011728951913804624, 'epoch': 0.65}
 65%|██████▍   | 2229/3449 [1:45:03<57:35,  2.83s/it] 65%|██████▍   | 2230/3449 [1:45:05<55:34,  2.74s/it]                                                     {'loss': 1.3135, 'learning_rate': 0.00011711873690561364, 'epoch': 0.65}
 65%|██████▍   | 2230/3449 [1:45:05<55:34,  2.74s/it] 65%|██████▍   | 2231/3449 [1:45:08<53:57,  2.66s/it]                                                     {'loss': 1.4209, 'learning_rate': 0.00011694802760646679, 'epoch': 0.65}
 65%|██████▍   | 2231/3449 [1:45:08<53:57,  2.66s/it] 65%|██████▍   | 2232/3449 [1:45:10<52:34,  2.59s/it]                                                     {'loss': 1.1507, 'learning_rate': 0.00011677739139082533, 'epoch': 0.65}
 65%|██████▍   | 2232/3449 [1:45:10<52:34,  2.59s/it] 65%|██████▍   | 2233/3449 [1:45:13<55:01,  2.71s/it]                                                     {'loss': 1.3116, 'learning_rate': 0.00011660682840884443, 'epoch': 0.65}
 65%|██████▍   | 2233/3449 [1:45:13<55:01,  2.71s/it] 65%|██████▍   | 2234/3449 [1:45:16<53:25,  2.64s/it]                                                     {'loss': 1.0828, 'learning_rate': 0.00011643633881061497, 'epoch': 0.65}
 65%|██████▍   | 2234/3449 [1:45:16<53:25,  2.64s/it] 65%|██████▍   | 2235/3449 [1:45:19<56:02,  2.77s/it]                                                     {'loss': 1.3367, 'learning_rate': 0.00011626592274616328, 'epoch': 0.65}
 65%|██████▍   | 2235/3449 [1:45:19<56:02,  2.77s/it] 65%|██████▍   | 2236/3449 [1:45:21<54:47,  2.71s/it]                                                     {'loss': 1.0433, 'learning_rate': 0.00011609558036545088, 'epoch': 0.65}
 65%|██████▍   | 2236/3449 [1:45:21<54:47,  2.71s/it] 65%|██████▍   | 2237/3449 [1:45:24<52:43,  2.61s/it]                                                     {'loss': 1.3345, 'learning_rate': 0.00011592531181837445, 'epoch': 0.65}
 65%|██████▍   | 2237/3449 [1:45:24<52:43,  2.61s/it] 65%|██████▍   | 2238/3449 [1:45:26<52:05,  2.58s/it]                                                     {'loss': 1.2029, 'learning_rate': 0.00011575511725476577, 'epoch': 0.65}
 65%|██████▍   | 2238/3449 [1:45:26<52:05,  2.58s/it] 65%|██████▍   | 2239/3449 [1:45:29<53:26,  2.65s/it]                                                     {'loss': 1.2542, 'learning_rate': 0.00011558499682439153, 'epoch': 0.65}
 65%|██████▍   | 2239/3449 [1:45:29<53:26,  2.65s/it] 65%|██████▍   | 2240/3449 [1:45:33<58:22,  2.90s/it]                                                     {'loss': 1.1651, 'learning_rate': 0.00011541495067695317, 'epoch': 0.65}
 65%|██████▍   | 2240/3449 [1:45:33<58:22,  2.90s/it] 65%|██████▍   | 2241/3449 [1:45:35<57:21,  2.85s/it]                                                     {'loss': 1.2251, 'learning_rate': 0.00011524497896208651, 'epoch': 0.65}
 65%|██████▍   | 2241/3449 [1:45:35<57:21,  2.85s/it] 65%|██████▌   | 2242/3449 [1:45:42<1:17:24,  3.85s/it]                                                       {'loss': 1.1942, 'learning_rate': 0.0001150750818293623, 'epoch': 0.65}
 65%|██████▌   | 2242/3449 [1:45:42<1:17:24,  3.85s/it] 65%|██████▌   | 2243/3449 [1:45:45<1:17:47,  3.87s/it]                                                       {'loss': 1.1434, 'learning_rate': 0.00011490525942828552, 'epoch': 0.65}
 65%|██████▌   | 2243/3449 [1:45:45<1:17:47,  3.87s/it] 65%|██████▌   | 2244/3449 [1:45:48<1:07:54,  3.38s/it]                                                       {'loss': 1.265, 'learning_rate': 0.00011473551190829512, 'epoch': 0.65}
 65%|██████▌   | 2244/3449 [1:45:48<1:07:54,  3.38s/it] 65%|██████▌   | 2245/3449 [1:45:50<1:03:19,  3.16s/it]                                                       {'loss': 1.256, 'learning_rate': 0.00011456583941876435, 'epoch': 0.65}
 65%|██████▌   | 2245/3449 [1:45:50<1:03:19,  3.16s/it] 65%|██████▌   | 2246/3449 [1:45:53<1:01:21,  3.06s/it]                                                       {'loss': 1.3565, 'learning_rate': 0.0001143962421090007, 'epoch': 0.65}
 65%|██████▌   | 2246/3449 [1:45:53<1:01:21,  3.06s/it] 65%|██████▌   | 2247/3449 [1:45:56<58:02,  2.90s/it]                                                       {'loss': 1.2367, 'learning_rate': 0.00011422672012824503, 'epoch': 0.65}
 65%|██████▌   | 2247/3449 [1:45:56<58:02,  2.90s/it] 65%|██████▌   | 2248/3449 [1:45:58<56:34,  2.83s/it]                                                     {'loss': 1.2555, 'learning_rate': 0.00011405727362567207, 'epoch': 0.65}
 65%|██████▌   | 2248/3449 [1:45:58<56:34,  2.83s/it] 65%|██████▌   | 2249/3449 [1:46:01<56:10,  2.81s/it]                                                     {'loss': 1.2527, 'learning_rate': 0.0001138879027503905, 'epoch': 0.65}
 65%|██████▌   | 2249/3449 [1:46:01<56:10,  2.81s/it] 65%|██████▌   | 2250/3449 [1:46:04<56:40,  2.84s/it]                                                     {'loss': 1.1735, 'learning_rate': 0.00011371860765144187, 'epoch': 0.65}
 65%|██████▌   | 2250/3449 [1:46:04<56:40,  2.84s/it] 65%|██████▌   | 2251/3449 [1:46:07<55:48,  2.79s/it]                                                     {'loss': 1.3869, 'learning_rate': 0.0001135493884778014, 'epoch': 0.65}
 65%|██████▌   | 2251/3449 [1:46:07<55:48,  2.79s/it] 65%|██████▌   | 2252/3449 [1:46:09<53:53,  2.70s/it]                                                     {'loss': 1.1006, 'learning_rate': 0.0001133802453783774, 'epoch': 0.65}
 65%|██████▌   | 2252/3449 [1:46:09<53:53,  2.70s/it] 65%|██████▌   | 2253/3449 [1:46:12<53:24,  2.68s/it]                                                     {'loss': 1.4399, 'learning_rate': 0.0001132111785020113, 'epoch': 0.65}
 65%|██████▌   | 2253/3449 [1:46:12<53:24,  2.68s/it] 65%|██████▌   | 2254/3449 [1:46:15<55:28,  2.79s/it]                                                     {'loss': 1.2728, 'learning_rate': 0.00011304218799747746, 'epoch': 0.65}
 65%|██████▌   | 2254/3449 [1:46:15<55:28,  2.79s/it] 65%|██████▌   | 2255/3449 [1:46:18<55:52,  2.81s/it]                                                     {'loss': 1.4393, 'learning_rate': 0.00011287327401348275, 'epoch': 0.65}
 65%|██████▌   | 2255/3449 [1:46:18<55:52,  2.81s/it] 65%|██████▌   | 2256/3449 [1:46:21<58:09,  2.92s/it]                                                     {'loss': 1.1145, 'learning_rate': 0.00011270443669866717, 'epoch': 0.65}
 65%|██████▌   | 2256/3449 [1:46:21<58:09,  2.92s/it] 65%|██████▌   | 2257/3449 [1:46:24<1:00:42,  3.06s/it]                                                       {'loss': 1.151, 'learning_rate': 0.00011253567620160303, 'epoch': 0.65}
 65%|██████▌   | 2257/3449 [1:46:24<1:00:42,  3.06s/it] 65%|██████▌   | 2258/3449 [1:46:27<57:34,  2.90s/it]                                                       {'loss': 1.191, 'learning_rate': 0.00011236699267079482, 'epoch': 0.65}
 65%|██████▌   | 2258/3449 [1:46:27<57:34,  2.90s/it] 65%|██████▌   | 2259/3449 [1:46:30<58:07,  2.93s/it]                                                     {'loss': 1.1734, 'learning_rate': 0.00011219838625467973, 'epoch': 0.65}
 65%|██████▌   | 2259/3449 [1:46:30<58:07,  2.93s/it] 66%|██████▌   | 2260/3449 [1:46:33<59:52,  3.02s/it]                                                     {'loss': 1.0149, 'learning_rate': 0.0001120298571016269, 'epoch': 0.66}
 66%|██████▌   | 2260/3449 [1:46:33<59:52,  3.02s/it] 66%|██████▌   | 2261/3449 [1:46:36<56:35,  2.86s/it]                                                     {'loss': 0.986, 'learning_rate': 0.00011186140535993727, 'epoch': 0.66}
 66%|██████▌   | 2261/3449 [1:46:36<56:35,  2.86s/it] 66%|██████▌   | 2262/3449 [1:46:39<59:16,  3.00s/it]                                                     {'loss': 1.1796, 'learning_rate': 0.00011169303117784387, 'epoch': 0.66}
 66%|██████▌   | 2262/3449 [1:46:39<59:16,  3.00s/it] 66%|██████▌   | 2263/3449 [1:46:41<56:32,  2.86s/it]                                                     {'loss': 1.2283, 'learning_rate': 0.00011152473470351168, 'epoch': 0.66}
 66%|██████▌   | 2263/3449 [1:46:41<56:32,  2.86s/it] 66%|██████▌   | 2264/3449 [1:46:44<54:36,  2.77s/it]                                                     {'loss': 1.3514, 'learning_rate': 0.00011135651608503686, 'epoch': 0.66}
 66%|██████▌   | 2264/3449 [1:46:44<54:36,  2.77s/it] 66%|██████▌   | 2265/3449 [1:46:47<54:35,  2.77s/it]                                                     {'loss': 1.3703, 'learning_rate': 0.00011118837547044734, 'epoch': 0.66}
 66%|██████▌   | 2265/3449 [1:46:47<54:35,  2.77s/it] 66%|██████▌   | 2266/3449 [1:46:49<54:05,  2.74s/it]                                                     {'loss': 1.1785, 'learning_rate': 0.00011102031300770238, 'epoch': 0.66}
 66%|██████▌   | 2266/3449 [1:46:49<54:05,  2.74s/it] 66%|██████▌   | 2267/3449 [1:46:52<51:27,  2.61s/it]                                                     {'loss': 1.3799, 'learning_rate': 0.00011085232884469236, 'epoch': 0.66}
 66%|██████▌   | 2267/3449 [1:46:52<51:27,  2.61s/it] 66%|██████▌   | 2268/3449 [1:46:55<52:58,  2.69s/it]                                                     {'loss': 1.0595, 'learning_rate': 0.0001106844231292389, 'epoch': 0.66}
 66%|██████▌   | 2268/3449 [1:46:55<52:58,  2.69s/it] 66%|██████▌   | 2269/3449 [1:46:57<51:33,  2.62s/it]                                                     {'loss': 1.2747, 'learning_rate': 0.00011051659600909449, 'epoch': 0.66}
 66%|██████▌   | 2269/3449 [1:46:57<51:33,  2.62s/it] 66%|██████▌   | 2270/3449 [1:47:00<50:44,  2.58s/it]                                                     {'loss': 1.2391, 'learning_rate': 0.00011034884763194251, 'epoch': 0.66}
 66%|██████▌   | 2270/3449 [1:47:00<50:44,  2.58s/it] 66%|██████▌   | 2271/3449 [1:47:03<58:06,  2.96s/it]                                                     {'loss': 1.2266, 'learning_rate': 0.00011018117814539708, 'epoch': 0.66}
 66%|██████▌   | 2271/3449 [1:47:03<58:06,  2.96s/it] 66%|██████▌   | 2272/3449 [1:47:07<59:13,  3.02s/it]                                                     {'loss': 1.2139, 'learning_rate': 0.00011001358769700263, 'epoch': 0.66}
 66%|██████▌   | 2272/3449 [1:47:07<59:13,  3.02s/it] 66%|██████▌   | 2273/3449 [1:47:10<1:02:09,  3.17s/it]                                                       {'loss': 1.1457, 'learning_rate': 0.00010984607643423448, 'epoch': 0.66}
 66%|██████▌   | 2273/3449 [1:47:10<1:02:09,  3.17s/it] 66%|██████▌   | 2274/3449 [1:47:13<1:00:56,  3.11s/it]                                                       {'loss': 1.1878, 'learning_rate': 0.00010967864450449803, 'epoch': 0.66}
 66%|██████▌   | 2274/3449 [1:47:13<1:00:56,  3.11s/it] 66%|██████▌   | 2275/3449 [1:47:16<59:31,  3.04s/it]                                                       {'loss': 1.2272, 'learning_rate': 0.00010951129205512867, 'epoch': 0.66}
 66%|██████▌   | 2275/3449 [1:47:16<59:31,  3.04s/it] 66%|██████▌   | 2276/3449 [1:47:19<59:48,  3.06s/it]                                                     {'loss': 1.1709, 'learning_rate': 0.00010934401923339237, 'epoch': 0.66}
 66%|██████▌   | 2276/3449 [1:47:19<59:48,  3.06s/it] 66%|██████▌   | 2277/3449 [1:47:23<1:04:56,  3.32s/it]                                                       {'loss': 1.3575, 'learning_rate': 0.00010917682618648449, 'epoch': 0.66}
 66%|██████▌   | 2277/3449 [1:47:23<1:04:56,  3.32s/it] 66%|██████▌   | 2278/3449 [1:47:26<1:02:25,  3.20s/it]                                                       {'loss': 1.1904, 'learning_rate': 0.00010900971306153048, 'epoch': 0.66}
 66%|██████▌   | 2278/3449 [1:47:26<1:02:25,  3.20s/it] 66%|██████▌   | 2279/3449 [1:47:28<55:51,  2.86s/it]                                                       {'loss': 1.2383, 'learning_rate': 0.0001088426800055854, 'epoch': 0.66}
 66%|██████▌   | 2279/3449 [1:47:28<55:51,  2.86s/it] 66%|██████▌   | 2280/3449 [1:47:31<55:17,  2.84s/it]                                                     {'loss': 1.3335, 'learning_rate': 0.00010867572716563387, 'epoch': 0.66}
 66%|██████▌   | 2280/3449 [1:47:31<55:17,  2.84s/it] 66%|██████▌   | 2281/3449 [1:47:33<54:12,  2.78s/it]                                                     {'loss': 1.1964, 'learning_rate': 0.0001085088546885899, 'epoch': 0.66}
 66%|██████▌   | 2281/3449 [1:47:33<54:12,  2.78s/it] 66%|██████▌   | 2282/3449 [1:47:36<55:42,  2.86s/it]                                                     {'loss': 1.2041, 'learning_rate': 0.00010834206272129681, 'epoch': 0.66}
 66%|██████▌   | 2282/3449 [1:47:36<55:42,  2.86s/it] 66%|██████▌   | 2283/3449 [1:47:39<54:01,  2.78s/it]                                                     {'loss': 1.1807, 'learning_rate': 0.00010817535141052703, 'epoch': 0.66}
 66%|██████▌   | 2283/3449 [1:47:39<54:01,  2.78s/it] 66%|██████▌   | 2284/3449 [1:47:42<56:03,  2.89s/it]                                                     {'loss': 1.162, 'learning_rate': 0.00010800872090298204, 'epoch': 0.66}
 66%|██████▌   | 2284/3449 [1:47:42<56:03,  2.89s/it] 66%|██████▋   | 2285/3449 [1:47:46<1:00:02,  3.10s/it]                                                       {'loss': 1.1702, 'learning_rate': 0.00010784217134529218, 'epoch': 0.66}
 66%|██████▋   | 2285/3449 [1:47:46<1:00:02,  3.10s/it] 66%|██████▋   | 2286/3449 [1:47:49<1:01:12,  3.16s/it]                                                       {'loss': 1.1473, 'learning_rate': 0.00010767570288401664, 'epoch': 0.66}
 66%|██████▋   | 2286/3449 [1:47:49<1:01:12,  3.16s/it] 66%|██████▋   | 2287/3449 [1:47:52<59:20,  3.06s/it]                                                       {'loss': 1.29, 'learning_rate': 0.00010750931566564326, 'epoch': 0.66}
 66%|██████▋   | 2287/3449 [1:47:52<59:20,  3.06s/it] 66%|██████▋   | 2288/3449 [1:47:54<56:14,  2.91s/it]                                                     {'loss': 1.2558, 'learning_rate': 0.00010734300983658816, 'epoch': 0.66}
 66%|██████▋   | 2288/3449 [1:47:54<56:14,  2.91s/it] 66%|██████▋   | 2289/3449 [1:47:57<54:35,  2.82s/it]                                                     {'loss': 1.2469, 'learning_rate': 0.000107176785543196, 'epoch': 0.66}
 66%|██████▋   | 2289/3449 [1:47:57<54:35,  2.82s/it] 66%|██████▋   | 2290/3449 [1:48:01<58:21,  3.02s/it]                                                     {'loss': 1.1275, 'learning_rate': 0.00010701064293173992, 'epoch': 0.66}
 66%|██████▋   | 2290/3449 [1:48:01<58:21,  3.02s/it] 66%|██████▋   | 2291/3449 [1:48:04<58:02,  3.01s/it]                                                     {'loss': 1.0945, 'learning_rate': 0.00010684458214842075, 'epoch': 0.66}
 66%|██████▋   | 2291/3449 [1:48:04<58:02,  3.01s/it] 66%|██████▋   | 2292/3449 [1:48:06<54:34,  2.83s/it]                                                     {'loss': 1.0956, 'learning_rate': 0.00010667860333936748, 'epoch': 0.66}
 66%|██████▋   | 2292/3449 [1:48:06<54:34,  2.83s/it] 66%|██████▋   | 2293/3449 [1:48:08<51:55,  2.69s/it]                                                     {'loss': 1.1957, 'learning_rate': 0.00010651270665063728, 'epoch': 0.66}
 66%|██████▋   | 2293/3449 [1:48:08<51:55,  2.69s/it] 67%|██████▋   | 2294/3449 [1:48:12<58:46,  3.05s/it]                                                     {'loss': 1.0935, 'learning_rate': 0.00010634689222821453, 'epoch': 0.67}
 67%|██████▋   | 2294/3449 [1:48:12<58:46,  3.05s/it] 67%|██████▋   | 2295/3449 [1:48:15<54:26,  2.83s/it]                                                     {'loss': 1.1952, 'learning_rate': 0.00010618116021801152, 'epoch': 0.67}
 67%|██████▋   | 2295/3449 [1:48:15<54:26,  2.83s/it] 67%|██████▋   | 2296/3449 [1:48:17<52:44,  2.74s/it]                                                     {'loss': 1.1743, 'learning_rate': 0.00010601551076586802, 'epoch': 0.67}
 67%|██████▋   | 2296/3449 [1:48:17<52:44,  2.74s/it] 67%|██████▋   | 2297/3449 [1:48:19<50:34,  2.63s/it]                                                     {'loss': 1.2835, 'learning_rate': 0.00010584994401755106, 'epoch': 0.67}
 67%|██████▋   | 2297/3449 [1:48:19<50:34,  2.63s/it] 67%|██████▋   | 2298/3449 [1:48:22<51:14,  2.67s/it]                                                     {'loss': 1.2585, 'learning_rate': 0.00010568446011875497, 'epoch': 0.67}
 67%|██████▋   | 2298/3449 [1:48:22<51:14,  2.67s/it] 67%|██████▋   | 2299/3449 [1:48:25<54:21,  2.84s/it]                                                     {'loss': 1.1861, 'learning_rate': 0.0001055190592151011, 'epoch': 0.67}
 67%|██████▋   | 2299/3449 [1:48:25<54:21,  2.84s/it] 67%|██████▋   | 2300/3449 [1:48:28<52:03,  2.72s/it]                                                     {'loss': 1.2135, 'learning_rate': 0.00010535374145213781, 'epoch': 0.67}
 67%|██████▋   | 2300/3449 [1:48:28<52:03,  2.72s/it] 67%|██████▋   | 2301/3449 [1:48:31<54:17,  2.84s/it]                                                     {'loss': 1.293, 'learning_rate': 0.00010518850697534035, 'epoch': 0.67}
 67%|██████▋   | 2301/3449 [1:48:31<54:17,  2.84s/it] 67%|██████▋   | 2302/3449 [1:48:33<52:08,  2.73s/it]                                                     {'loss': 1.2859, 'learning_rate': 0.00010502335593011046, 'epoch': 0.67}
 67%|██████▋   | 2302/3449 [1:48:33<52:08,  2.73s/it] 67%|██████▋   | 2303/3449 [1:48:37<54:38,  2.86s/it]                                                     {'loss': 1.3, 'learning_rate': 0.00010485828846177677, 'epoch': 0.67}
 67%|██████▋   | 2303/3449 [1:48:37<54:38,  2.86s/it] 67%|██████▋   | 2304/3449 [1:48:40<56:52,  2.98s/it]                                                     {'loss': 1.2575, 'learning_rate': 0.00010469330471559429, 'epoch': 0.67}
 67%|██████▋   | 2304/3449 [1:48:40<56:52,  2.98s/it] 67%|██████▋   | 2305/3449 [1:48:42<53:32,  2.81s/it]                                                     {'loss': 1.3082, 'learning_rate': 0.00010452840483674408, 'epoch': 0.67}
 67%|██████▋   | 2305/3449 [1:48:42<53:32,  2.81s/it] 67%|██████▋   | 2306/3449 [1:48:45<52:41,  2.77s/it]                                                     {'loss': 1.2841, 'learning_rate': 0.00010436358897033365, 'epoch': 0.67}
 67%|██████▋   | 2306/3449 [1:48:45<52:41,  2.77s/it] 67%|██████▋   | 2307/3449 [1:48:47<51:17,  2.69s/it]                                                     {'loss': 1.2101, 'learning_rate': 0.00010419885726139674, 'epoch': 0.67}
 67%|██████▋   | 2307/3449 [1:48:47<51:17,  2.69s/it] 67%|██████▋   | 2308/3449 [1:48:50<51:01,  2.68s/it]                                                     {'loss': 1.1553, 'learning_rate': 0.00010403420985489258, 'epoch': 0.67}
 67%|██████▋   | 2308/3449 [1:48:50<51:01,  2.68s/it] 67%|██████▋   | 2309/3449 [1:48:53<52:52,  2.78s/it]                                                     {'loss': 1.2629, 'learning_rate': 0.00010386964689570654, 'epoch': 0.67}
 67%|██████▋   | 2309/3449 [1:48:53<52:52,  2.78s/it] 67%|██████▋   | 2310/3449 [1:48:56<53:07,  2.80s/it]                                                     {'loss': 1.1462, 'learning_rate': 0.00010370516852864973, 'epoch': 0.67}
 67%|██████▋   | 2310/3449 [1:48:56<53:07,  2.80s/it] 67%|██████▋   | 2311/3449 [1:48:59<53:30,  2.82s/it]                                                     {'loss': 1.2581, 'learning_rate': 0.00010354077489845855, 'epoch': 0.67}
 67%|██████▋   | 2311/3449 [1:48:59<53:30,  2.82s/it] 67%|██████▋   | 2312/3449 [1:49:02<53:56,  2.85s/it]                                                     {'loss': 1.1233, 'learning_rate': 0.00010337646614979501, 'epoch': 0.67}
 67%|██████▋   | 2312/3449 [1:49:02<53:56,  2.85s/it] 67%|██████▋   | 2313/3449 [1:49:04<51:10,  2.70s/it]                                                     {'loss': 1.2789, 'learning_rate': 0.00010321224242724644, 'epoch': 0.67}
 67%|██████▋   | 2313/3449 [1:49:04<51:10,  2.70s/it] 67%|██████▋   | 2314/3449 [1:49:07<54:22,  2.87s/it]                                                     {'loss': 1.2543, 'learning_rate': 0.00010304810387532526, 'epoch': 0.67}
 67%|██████▋   | 2314/3449 [1:49:07<54:22,  2.87s/it] 67%|██████▋   | 2315/3449 [1:49:12<1:02:04,  3.28s/it]                                                       {'loss': 1.0854, 'learning_rate': 0.000102884050638469, 'epoch': 0.67}
 67%|██████▋   | 2315/3449 [1:49:12<1:02:04,  3.28s/it] 67%|██████▋   | 2316/3449 [1:49:14<59:28,  3.15s/it]                                                       {'loss': 1.4065, 'learning_rate': 0.00010272008286104014, 'epoch': 0.67}
 67%|██████▋   | 2316/3449 [1:49:14<59:28,  3.15s/it] 67%|██████▋   | 2317/3449 [1:49:17<56:30,  2.99s/it]                                                     {'loss': 1.0557, 'learning_rate': 0.00010255620068732583, 'epoch': 0.67}
 67%|██████▋   | 2317/3449 [1:49:17<56:30,  2.99s/it] 67%|██████▋   | 2318/3449 [1:49:19<52:44,  2.80s/it]                                                     {'loss': 1.2463, 'learning_rate': 0.00010239240426153818, 'epoch': 0.67}
 67%|██████▋   | 2318/3449 [1:49:19<52:44,  2.80s/it] 67%|██████▋   | 2319/3449 [1:49:22<52:54,  2.81s/it]                                                     {'loss': 1.1513, 'learning_rate': 0.00010222869372781332, 'epoch': 0.67}
 67%|██████▋   | 2319/3449 [1:49:22<52:54,  2.81s/it] 67%|██████▋   | 2320/3449 [1:49:25<51:16,  2.72s/it]                                                     {'loss': 1.1196, 'learning_rate': 0.00010206506923021239, 'epoch': 0.67}
 67%|██████▋   | 2320/3449 [1:49:25<51:16,  2.72s/it] 67%|██████▋   | 2321/3449 [1:49:28<53:49,  2.86s/it]                                                     {'loss': 1.2797, 'learning_rate': 0.00010190153091272056, 'epoch': 0.67}
 67%|██████▋   | 2321/3449 [1:49:28<53:49,  2.86s/it] 67%|██████▋   | 2322/3449 [1:49:31<53:47,  2.86s/it]                                                     {'loss': 1.1026, 'learning_rate': 0.000101738078919247, 'epoch': 0.67}
 67%|██████▋   | 2322/3449 [1:49:31<53:47,  2.86s/it] 67%|██████▋   | 2323/3449 [1:49:34<52:58,  2.82s/it]                                                     {'loss': 1.1835, 'learning_rate': 0.00010157471339362514, 'epoch': 0.67}
 67%|██████▋   | 2323/3449 [1:49:34<52:58,  2.82s/it] 67%|██████▋   | 2324/3449 [1:49:36<51:18,  2.74s/it]                                                     {'loss': 1.1071, 'learning_rate': 0.00010141143447961225, 'epoch': 0.67}
 67%|██████▋   | 2324/3449 [1:49:36<51:18,  2.74s/it] 67%|██████▋   | 2325/3449 [1:49:39<49:54,  2.66s/it]                                                     {'loss': 1.388, 'learning_rate': 0.00010124824232088943, 'epoch': 0.67}
 67%|██████▋   | 2325/3449 [1:49:39<49:54,  2.66s/it] 67%|██████▋   | 2326/3449 [1:49:41<47:49,  2.56s/it]                                                     {'loss': 1.3106, 'learning_rate': 0.00010108513706106135, 'epoch': 0.67}
 67%|██████▋   | 2326/3449 [1:49:41<47:49,  2.56s/it] 67%|██████▋   | 2327/3449 [1:49:44<48:02,  2.57s/it]                                                     {'loss': 1.3247, 'learning_rate': 0.0001009221188436563, 'epoch': 0.67}
 67%|██████▋   | 2327/3449 [1:49:44<48:02,  2.57s/it] 67%|██████▋   | 2328/3449 [1:49:46<48:18,  2.59s/it]                                                     {'loss': 1.2067, 'learning_rate': 0.00010075918781212588, 'epoch': 0.67}
 67%|██████▋   | 2328/3449 [1:49:46<48:18,  2.59s/it] 68%|██████▊   | 2329/3449 [1:49:49<49:36,  2.66s/it]                                                     {'loss': 1.1488, 'learning_rate': 0.00010059634410984507, 'epoch': 0.68}
 68%|██████▊   | 2329/3449 [1:49:49<49:36,  2.66s/it] 68%|██████▊   | 2330/3449 [1:49:52<50:55,  2.73s/it]                                                     {'loss': 1.175, 'learning_rate': 0.00010043358788011192, 'epoch': 0.68}
 68%|██████▊   | 2330/3449 [1:49:52<50:55,  2.73s/it] 68%|██████▊   | 2331/3449 [1:49:54<49:53,  2.68s/it]                                                     {'loss': 1.2491, 'learning_rate': 0.00010027091926614755, 'epoch': 0.68}
 68%|██████▊   | 2331/3449 [1:49:54<49:53,  2.68s/it] 68%|██████▊   | 2332/3449 [1:49:57<47:43,  2.56s/it]                                                     {'loss': 1.0739, 'learning_rate': 0.00010010833841109603, 'epoch': 0.68}
 68%|██████▊   | 2332/3449 [1:49:57<47:43,  2.56s/it] 68%|██████▊   | 2333/3449 [1:49:59<48:16,  2.60s/it]                                                     {'loss': 1.1974, 'learning_rate': 9.994584545802406e-05, 'epoch': 0.68}
 68%|██████▊   | 2333/3449 [1:49:59<48:16,  2.60s/it] 68%|██████▊   | 2334/3449 [1:50:03<53:07,  2.86s/it]                                                     {'loss': 1.1043, 'learning_rate': 9.978344054992113e-05, 'epoch': 0.68}
 68%|██████▊   | 2334/3449 [1:50:03<53:07,  2.86s/it] 68%|██████▊   | 2335/3449 [1:50:06<52:58,  2.85s/it]                                                     {'loss': 1.2279, 'learning_rate': 9.962112382969923e-05, 'epoch': 0.68}
 68%|██████▊   | 2335/3449 [1:50:06<52:58,  2.85s/it] 68%|██████▊   | 2336/3449 [1:50:08<50:00,  2.70s/it]                                                     {'loss': 1.4065, 'learning_rate': 9.945889544019253e-05, 'epoch': 0.68}
 68%|██████▊   | 2336/3449 [1:50:08<50:00,  2.70s/it] 68%|██████▊   | 2337/3449 [1:50:11<51:30,  2.78s/it]                                                     {'loss': 1.1381, 'learning_rate': 9.929675552415793e-05, 'epoch': 0.68}
 68%|██████▊   | 2337/3449 [1:50:11<51:30,  2.78s/it] 68%|██████▊   | 2338/3449 [1:50:14<52:16,  2.82s/it]                                                     {'loss': 1.1192, 'learning_rate': 9.913470422427402e-05, 'epoch': 0.68}
 68%|██████▊   | 2338/3449 [1:50:14<52:16,  2.82s/it] 68%|██████▊   | 2339/3449 [1:50:16<50:10,  2.71s/it]                                                     {'loss': 1.2122, 'learning_rate': 9.897274168314161e-05, 'epoch': 0.68}
 68%|██████▊   | 2339/3449 [1:50:16<50:10,  2.71s/it] 68%|██████▊   | 2340/3449 [1:50:19<47:57,  2.59s/it]                                                     {'loss': 1.3919, 'learning_rate': 9.881086804328341e-05, 'epoch': 0.68}
 68%|██████▊   | 2340/3449 [1:50:19<47:57,  2.59s/it] 68%|██████▊   | 2341/3449 [1:50:22<50:08,  2.72s/it]                                                     {'loss': 1.2206, 'learning_rate': 9.864908344714387e-05, 'epoch': 0.68}
 68%|██████▊   | 2341/3449 [1:50:22<50:08,  2.72s/it] 68%|██████▊   | 2342/3449 [1:50:25<51:56,  2.82s/it]                                                     {'loss': 1.2636, 'learning_rate': 9.84873880370891e-05, 'epoch': 0.68}
 68%|██████▊   | 2342/3449 [1:50:25<51:56,  2.82s/it] 68%|██████▊   | 2343/3449 [1:50:27<50:23,  2.73s/it]                                                     {'loss': 1.1593, 'learning_rate': 9.832578195540673e-05, 'epoch': 0.68}
 68%|██████▊   | 2343/3449 [1:50:27<50:23,  2.73s/it] 68%|██████▊   | 2344/3449 [1:50:30<49:29,  2.69s/it]                                                     {'loss': 1.269, 'learning_rate': 9.816426534430574e-05, 'epoch': 0.68}
 68%|██████▊   | 2344/3449 [1:50:30<49:29,  2.69s/it] 68%|██████▊   | 2345/3449 [1:50:32<47:19,  2.57s/it]                                                     {'loss': 1.3085, 'learning_rate': 9.800283834591644e-05, 'epoch': 0.68}
 68%|██████▊   | 2345/3449 [1:50:32<47:19,  2.57s/it] 68%|██████▊   | 2346/3449 [1:50:35<47:51,  2.60s/it]                                                     {'loss': 1.2979, 'learning_rate': 9.784150110229022e-05, 'epoch': 0.68}
 68%|██████▊   | 2346/3449 [1:50:35<47:51,  2.60s/it] 68%|██████▊   | 2347/3449 [1:50:37<46:40,  2.54s/it]                                                     {'loss': 1.1448, 'learning_rate': 9.768025375539957e-05, 'epoch': 0.68}
 68%|██████▊   | 2347/3449 [1:50:37<46:40,  2.54s/it] 68%|██████▊   | 2348/3449 [1:50:40<47:54,  2.61s/it]                                                     {'loss': 1.2501, 'learning_rate': 9.751909644713786e-05, 'epoch': 0.68}
 68%|██████▊   | 2348/3449 [1:50:40<47:54,  2.61s/it] 68%|██████▊   | 2349/3449 [1:50:43<49:07,  2.68s/it]                                                     {'loss': 1.3517, 'learning_rate': 9.735802931931898e-05, 'epoch': 0.68}
 68%|██████▊   | 2349/3449 [1:50:43<49:07,  2.68s/it] 68%|██████▊   | 2350/3449 [1:50:46<49:34,  2.71s/it]                                                     {'loss': 1.4302, 'learning_rate': 9.719705251367789e-05, 'epoch': 0.68}
 68%|██████▊   | 2350/3449 [1:50:46<49:34,  2.71s/it] 68%|██████▊   | 2351/3449 [1:50:49<52:38,  2.88s/it]                                                     {'loss': 1.1275, 'learning_rate': 9.703616617186991e-05, 'epoch': 0.68}
 68%|██████▊   | 2351/3449 [1:50:49<52:38,  2.88s/it] 68%|██████▊   | 2352/3449 [1:50:52<51:49,  2.83s/it]                                                     {'loss': 1.1095, 'learning_rate': 9.687537043547046e-05, 'epoch': 0.68}
 68%|██████▊   | 2352/3449 [1:50:52<51:49,  2.83s/it] 68%|██████▊   | 2353/3449 [1:50:54<51:30,  2.82s/it]                                                     {'loss': 1.2268, 'learning_rate': 9.671466544597554e-05, 'epoch': 0.68}
 68%|██████▊   | 2353/3449 [1:50:54<51:30,  2.82s/it] 68%|██████▊   | 2354/3449 [1:50:58<52:45,  2.89s/it]                                                     {'loss': 1.2058, 'learning_rate': 9.655405134480144e-05, 'epoch': 0.68}
 68%|██████▊   | 2354/3449 [1:50:58<52:45,  2.89s/it] 68%|██████▊   | 2355/3449 [1:51:00<49:53,  2.74s/it]                                                     {'loss': 1.2006, 'learning_rate': 9.6393528273284e-05, 'epoch': 0.68}
 68%|██████▊   | 2355/3449 [1:51:00<49:53,  2.74s/it] 68%|██████▊   | 2356/3449 [1:51:03<49:21,  2.71s/it]                                                     {'loss': 1.1272, 'learning_rate': 9.623309637267933e-05, 'epoch': 0.68}
 68%|██████▊   | 2356/3449 [1:51:03<49:21,  2.71s/it] 68%|██████▊   | 2357/3449 [1:51:05<50:27,  2.77s/it]                                                     {'loss': 1.107, 'learning_rate': 9.607275578416313e-05, 'epoch': 0.68}
 68%|██████▊   | 2357/3449 [1:51:05<50:27,  2.77s/it] 68%|██████▊   | 2358/3449 [1:51:09<56:05,  3.08s/it]                                                     {'loss': 1.2807, 'learning_rate': 9.59125066488309e-05, 'epoch': 0.68}
 68%|██████▊   | 2358/3449 [1:51:09<56:05,  3.08s/it] 68%|██████▊   | 2359/3449 [1:51:12<53:37,  2.95s/it]                                                     {'loss': 1.3061, 'learning_rate': 9.575234910769748e-05, 'epoch': 0.68}
 68%|██████▊   | 2359/3449 [1:51:12<53:37,  2.95s/it] 68%|██████▊   | 2360/3449 [1:51:15<52:58,  2.92s/it]                                                     {'loss': 1.3413, 'learning_rate': 9.559228330169728e-05, 'epoch': 0.68}
 68%|██████▊   | 2360/3449 [1:51:15<52:58,  2.92s/it] 68%|██████▊   | 2361/3449 [1:51:18<54:13,  2.99s/it]                                                     {'loss': 1.1409, 'learning_rate': 9.543230937168389e-05, 'epoch': 0.68}
 68%|██████▊   | 2361/3449 [1:51:18<54:13,  2.99s/it] 68%|██████▊   | 2362/3449 [1:51:21<56:33,  3.12s/it]                                                     {'loss': 1.2984, 'learning_rate': 9.527242745843012e-05, 'epoch': 0.68}
 68%|██████▊   | 2362/3449 [1:51:21<56:33,  3.12s/it] 69%|██████▊   | 2363/3449 [1:51:24<55:49,  3.08s/it]                                                     {'loss': 1.2671, 'learning_rate': 9.511263770262757e-05, 'epoch': 0.69}
 69%|██████▊   | 2363/3449 [1:51:24<55:49,  3.08s/it] 69%|██████▊   | 2364/3449 [1:51:28<57:25,  3.18s/it]                                                     {'loss': 1.2418, 'learning_rate': 9.495294024488715e-05, 'epoch': 0.69}
 69%|██████▊   | 2364/3449 [1:51:28<57:25,  3.18s/it] 69%|██████▊   | 2365/3449 [1:51:31<55:47,  3.09s/it]                                                     {'loss': 1.1932, 'learning_rate': 9.47933352257383e-05, 'epoch': 0.69}
 69%|██████▊   | 2365/3449 [1:51:31<55:47,  3.09s/it] 69%|██████▊   | 2366/3449 [1:51:33<53:43,  2.98s/it]                                                     {'loss': 1.0938, 'learning_rate': 9.463382278562898e-05, 'epoch': 0.69}
 69%|██████▊   | 2366/3449 [1:51:33<53:43,  2.98s/it] 69%|██████▊   | 2367/3449 [1:51:36<52:59,  2.94s/it]                                                     {'loss': 1.1557, 'learning_rate': 9.447440306492606e-05, 'epoch': 0.69}
 69%|██████▊   | 2367/3449 [1:51:36<52:59,  2.94s/it] 69%|██████▊   | 2368/3449 [1:51:39<51:01,  2.83s/it]                                                     {'loss': 1.3049, 'learning_rate': 9.431507620391458e-05, 'epoch': 0.69}
 69%|██████▊   | 2368/3449 [1:51:39<51:01,  2.83s/it] 69%|██████▊   | 2369/3449 [1:51:42<55:02,  3.06s/it]                                                     {'loss': 1.1689, 'learning_rate': 9.415584234279779e-05, 'epoch': 0.69}
 69%|██████▊   | 2369/3449 [1:51:42<55:02,  3.06s/it] 69%|██████▊   | 2370/3449 [1:51:45<54:33,  3.03s/it]                                                     {'loss': 1.3074, 'learning_rate': 9.399670162169721e-05, 'epoch': 0.69}
 69%|██████▊   | 2370/3449 [1:51:45<54:33,  3.03s/it] 69%|██████▊   | 2371/3449 [1:51:48<51:50,  2.89s/it]                                                     {'loss': 1.1486, 'learning_rate': 9.383765418065258e-05, 'epoch': 0.69}
 69%|██████▊   | 2371/3449 [1:51:48<51:50,  2.89s/it] 69%|██████▉   | 2372/3449 [1:51:51<51:04,  2.85s/it]                                                     {'loss': 1.2664, 'learning_rate': 9.367870015962122e-05, 'epoch': 0.69}
 69%|██████▉   | 2372/3449 [1:51:51<51:04,  2.85s/it] 69%|██████▉   | 2373/3449 [1:51:53<49:18,  2.75s/it]                                                     {'loss': 1.3247, 'learning_rate': 9.351983969847842e-05, 'epoch': 0.69}
 69%|██████▉   | 2373/3449 [1:51:53<49:18,  2.75s/it] 69%|██████▉   | 2374/3449 [1:51:55<47:12,  2.63s/it]                                                     {'loss': 1.3563, 'learning_rate': 9.336107293701712e-05, 'epoch': 0.69}
 69%|██████▉   | 2374/3449 [1:51:56<47:12,  2.63s/it] 69%|██████▉   | 2375/3449 [1:51:59<49:18,  2.76s/it]                                                     {'loss': 1.0535, 'learning_rate': 9.320240001494786e-05, 'epoch': 0.69}
 69%|██████▉   | 2375/3449 [1:51:59<49:18,  2.76s/it] 69%|██████▉   | 2376/3449 [1:52:01<48:31,  2.71s/it]                                                     {'loss': 1.2199, 'learning_rate': 9.304382107189848e-05, 'epoch': 0.69}
 69%|██████▉   | 2376/3449 [1:52:01<48:31,  2.71s/it] 69%|██████▉   | 2377/3449 [1:52:04<48:13,  2.70s/it]                                                     {'loss': 1.2204, 'learning_rate': 9.288533624741427e-05, 'epoch': 0.69}
 69%|██████▉   | 2377/3449 [1:52:04<48:13,  2.70s/it] 69%|██████▉   | 2378/3449 [1:52:06<47:04,  2.64s/it]                                                     {'loss': 1.1616, 'learning_rate': 9.272694568095754e-05, 'epoch': 0.69}
 69%|██████▉   | 2378/3449 [1:52:06<47:04,  2.64s/it] 69%|██████▉   | 2379/3449 [1:52:09<46:36,  2.61s/it]                                                     {'loss': 1.13, 'learning_rate': 9.256864951190787e-05, 'epoch': 0.69}
 69%|██████▉   | 2379/3449 [1:52:09<46:36,  2.61s/it] 69%|██████▉   | 2380/3449 [1:52:11<44:58,  2.52s/it]                                                     {'loss': 1.2643, 'learning_rate': 9.241044787956136e-05, 'epoch': 0.69}
 69%|██████▉   | 2380/3449 [1:52:11<44:58,  2.52s/it] 69%|██████▉   | 2381/3449 [1:52:14<45:14,  2.54s/it]                                                     {'loss': 1.0943, 'learning_rate': 9.225234092313149e-05, 'epoch': 0.69}
 69%|██████▉   | 2381/3449 [1:52:14<45:14,  2.54s/it] 69%|██████▉   | 2382/3449 [1:52:17<47:17,  2.66s/it]                                                     {'loss': 1.2442, 'learning_rate': 9.209432878174806e-05, 'epoch': 0.69}
 69%|██████▉   | 2382/3449 [1:52:17<47:17,  2.66s/it] 69%|██████▉   | 2383/3449 [1:52:19<47:59,  2.70s/it]                                                     {'loss': 1.2225, 'learning_rate': 9.193641159445734e-05, 'epoch': 0.69}
 69%|██████▉   | 2383/3449 [1:52:19<47:59,  2.70s/it] 69%|██████▉   | 2384/3449 [1:52:22<46:56,  2.64s/it]                                                     {'loss': 1.3315, 'learning_rate': 9.17785895002225e-05, 'epoch': 0.69}
 69%|██████▉   | 2384/3449 [1:52:22<46:56,  2.64s/it] 69%|██████▉   | 2385/3449 [1:52:25<46:06,  2.60s/it]                                                     {'loss': 1.1612, 'learning_rate': 9.162086263792251e-05, 'epoch': 0.69}
 69%|██████▉   | 2385/3449 [1:52:25<46:06,  2.60s/it] 69%|██████▉   | 2386/3449 [1:52:28<48:37,  2.74s/it]                                                     {'loss': 1.2682, 'learning_rate': 9.146323114635285e-05, 'epoch': 0.69}
 69%|██████▉   | 2386/3449 [1:52:28<48:37,  2.74s/it] 69%|██████▉   | 2387/3449 [1:52:30<45:46,  2.59s/it]                                                     {'loss': 1.3965, 'learning_rate': 9.1305695164225e-05, 'epoch': 0.69}
 69%|██████▉   | 2387/3449 [1:52:30<45:46,  2.59s/it] 69%|██████▉   | 2388/3449 [1:52:32<43:33,  2.46s/it]                                                     {'loss': 1.1536, 'learning_rate': 9.11482548301664e-05, 'epoch': 0.69}
 69%|██████▉   | 2388/3449 [1:52:32<43:33,  2.46s/it] 69%|██████▉   | 2389/3449 [1:52:36<50:59,  2.89s/it]                                                     {'loss': 1.1272, 'learning_rate': 9.099091028272033e-05, 'epoch': 0.69}
 69%|██████▉   | 2389/3449 [1:52:36<50:59,  2.89s/it] 69%|██████▉   | 2390/3449 [1:52:38<48:10,  2.73s/it]                                                     {'loss': 1.2068, 'learning_rate': 9.083366166034575e-05, 'epoch': 0.69}
 69%|██████▉   | 2390/3449 [1:52:38<48:10,  2.73s/it] 69%|██████▉   | 2391/3449 [1:52:41<47:06,  2.67s/it]                                                     {'loss': 1.1237, 'learning_rate': 9.06765091014172e-05, 'epoch': 0.69}
 69%|██████▉   | 2391/3449 [1:52:41<47:06,  2.67s/it] 69%|██████▉   | 2392/3449 [1:52:44<47:37,  2.70s/it]                                                     {'loss': 1.2622, 'learning_rate': 9.051945274422475e-05, 'epoch': 0.69}
 69%|██████▉   | 2392/3449 [1:52:44<47:37,  2.70s/it] 69%|██████▉   | 2393/3449 [1:52:47<53:34,  3.04s/it]                                                     {'loss': 1.1716, 'learning_rate': 9.036249272697376e-05, 'epoch': 0.69}
 69%|██████▉   | 2393/3449 [1:52:47<53:34,  3.04s/it] 69%|██████▉   | 2394/3449 [1:52:51<54:47,  3.12s/it]                                                     {'loss': 1.2298, 'learning_rate': 9.020562918778483e-05, 'epoch': 0.69}
 69%|██████▉   | 2394/3449 [1:52:51<54:47,  3.12s/it] 69%|██████▉   | 2395/3449 [1:52:53<53:08,  3.03s/it]                                                     {'loss': 1.1787, 'learning_rate': 9.004886226469376e-05, 'epoch': 0.69}
 69%|██████▉   | 2395/3449 [1:52:53<53:08,  3.03s/it] 69%|██████▉   | 2396/3449 [1:52:56<51:06,  2.91s/it]                                                     {'loss': 1.347, 'learning_rate': 8.989219209565103e-05, 'epoch': 0.69}
 69%|██████▉   | 2396/3449 [1:52:56<51:06,  2.91s/it] 69%|██████▉   | 2397/3449 [1:52:59<48:34,  2.77s/it]                                                     {'loss': 1.2915, 'learning_rate': 8.973561881852224e-05, 'epoch': 0.69}
 69%|██████▉   | 2397/3449 [1:52:59<48:34,  2.77s/it] 70%|██████▉   | 2398/3449 [1:53:02<50:27,  2.88s/it]                                                     {'loss': 1.2449, 'learning_rate': 8.957914257108783e-05, 'epoch': 0.7}
 70%|██████▉   | 2398/3449 [1:53:02<50:27,  2.88s/it] 70%|██████▉   | 2399/3449 [1:53:04<49:21,  2.82s/it]                                                     {'loss': 1.1349, 'learning_rate': 8.942276349104255e-05, 'epoch': 0.7}
 70%|██████▉   | 2399/3449 [1:53:04<49:21,  2.82s/it] 70%|██████▉   | 2400/3449 [1:53:07<50:11,  2.87s/it]                                                     {'loss': 1.0761, 'learning_rate': 8.926648171599571e-05, 'epoch': 0.7}
 70%|██████▉   | 2400/3449 [1:53:07<50:11,  2.87s/it] 70%|██████▉   | 2401/3449 [1:53:10<49:55,  2.86s/it]                                                     {'loss': 1.2725, 'learning_rate': 8.911029738347137e-05, 'epoch': 0.7}
 70%|██████▉   | 2401/3449 [1:53:10<49:55,  2.86s/it] 70%|██████▉   | 2402/3449 [1:53:13<50:30,  2.89s/it]                                                     {'loss': 1.0853, 'learning_rate': 8.895421063090728e-05, 'epoch': 0.7}
 70%|██████▉   | 2402/3449 [1:53:13<50:30,  2.89s/it] 70%|██████▉   | 2403/3449 [1:53:16<49:43,  2.85s/it]                                                     {'loss': 1.2879, 'learning_rate': 8.879822159565567e-05, 'epoch': 0.7}
 70%|██████▉   | 2403/3449 [1:53:16<49:43,  2.85s/it] 70%|██████▉   | 2404/3449 [1:53:19<48:23,  2.78s/it]                                                     {'loss': 1.1095, 'learning_rate': 8.864233041498274e-05, 'epoch': 0.7}
 70%|██████▉   | 2404/3449 [1:53:19<48:23,  2.78s/it] 70%|██████▉   | 2405/3449 [1:53:21<47:46,  2.75s/it]                                                     {'loss': 1.1175, 'learning_rate': 8.848653722606847e-05, 'epoch': 0.7}
 70%|██████▉   | 2405/3449 [1:53:21<47:46,  2.75s/it] 70%|██████▉   | 2406/3449 [1:53:25<55:03,  3.17s/it]                                                     {'loss': 1.1192, 'learning_rate': 8.833084216600676e-05, 'epoch': 0.7}
 70%|██████▉   | 2406/3449 [1:53:25<55:03,  3.17s/it] 70%|██████▉   | 2407/3449 [1:53:29<59:54,  3.45s/it]                                                     {'loss': 1.1486, 'learning_rate': 8.817524537180502e-05, 'epoch': 0.7}
 70%|██████▉   | 2407/3449 [1:53:29<59:54,  3.45s/it] 70%|██████▉   | 2408/3449 [1:53:32<53:19,  3.07s/it]                                                     {'loss': 1.307, 'learning_rate': 8.801974698038427e-05, 'epoch': 0.7}
 70%|██████▉   | 2408/3449 [1:53:32<53:19,  3.07s/it] 70%|██████▉   | 2409/3449 [1:53:34<50:28,  2.91s/it]                                                     {'loss': 1.3176, 'learning_rate': 8.786434712857901e-05, 'epoch': 0.7}
 70%|██████▉   | 2409/3449 [1:53:34<50:28,  2.91s/it] 70%|██████▉   | 2410/3449 [1:53:38<54:32,  3.15s/it]                                                     {'loss': 1.375, 'learning_rate': 8.770904595313672e-05, 'epoch': 0.7}
 70%|██████▉   | 2410/3449 [1:53:38<54:32,  3.15s/it] 70%|██████▉   | 2411/3449 [1:53:42<59:41,  3.45s/it]                                                     {'loss': 1.0766, 'learning_rate': 8.755384359071843e-05, 'epoch': 0.7}
 70%|██████▉   | 2411/3449 [1:53:42<59:41,  3.45s/it] 70%|██████▉   | 2412/3449 [1:53:45<55:02,  3.19s/it]                                                     {'loss': 1.304, 'learning_rate': 8.739874017789813e-05, 'epoch': 0.7}
 70%|██████▉   | 2412/3449 [1:53:45<55:02,  3.19s/it] 70%|██████▉   | 2413/3449 [1:53:48<55:28,  3.21s/it]                                                     {'loss': 1.1828, 'learning_rate': 8.724373585116244e-05, 'epoch': 0.7}
 70%|██████▉   | 2413/3449 [1:53:48<55:28,  3.21s/it] 70%|██████▉   | 2414/3449 [1:53:52<59:11,  3.43s/it]                                                     {'loss': 1.0628, 'learning_rate': 8.708883074691106e-05, 'epoch': 0.7}
 70%|██████▉   | 2414/3449 [1:53:52<59:11,  3.43s/it] 70%|███████   | 2415/3449 [1:53:54<53:34,  3.11s/it]                                                     {'loss': 1.2798, 'learning_rate': 8.693402500145649e-05, 'epoch': 0.7}
 70%|███████   | 2415/3449 [1:53:54<53:34,  3.11s/it] 70%|███████   | 2416/3449 [1:53:58<56:44,  3.30s/it]                                                     {'loss': 1.2763, 'learning_rate': 8.677931875102345e-05, 'epoch': 0.7}
 70%|███████   | 2416/3449 [1:53:58<56:44,  3.30s/it] 70%|███████   | 2417/3449 [1:54:01<55:33,  3.23s/it]                                                     {'loss': 1.2146, 'learning_rate': 8.662471213174927e-05, 'epoch': 0.7}
 70%|███████   | 2417/3449 [1:54:01<55:33,  3.23s/it] 70%|███████   | 2418/3449 [1:54:04<52:03,  3.03s/it]                                                     {'loss': 1.3176, 'learning_rate': 8.647020527968384e-05, 'epoch': 0.7}
 70%|███████   | 2418/3449 [1:54:04<52:03,  3.03s/it] 70%|███████   | 2419/3449 [1:54:06<49:22,  2.88s/it]                                                     {'loss': 1.1753, 'learning_rate': 8.631579833078882e-05, 'epoch': 0.7}
 70%|███████   | 2419/3449 [1:54:06<49:22,  2.88s/it] 70%|███████   | 2420/3449 [1:54:08<46:43,  2.72s/it]                                                     {'loss': 1.2678, 'learning_rate': 8.616149142093826e-05, 'epoch': 0.7}
 70%|███████   | 2420/3449 [1:54:08<46:43,  2.72s/it] 70%|███████   | 2421/3449 [1:54:11<45:13,  2.64s/it]                                                     {'loss': 1.1716, 'learning_rate': 8.60072846859181e-05, 'epoch': 0.7}
 70%|███████   | 2421/3449 [1:54:11<45:13,  2.64s/it] 70%|███████   | 2422/3449 [1:54:13<44:32,  2.60s/it]                                                     {'loss': 1.3176, 'learning_rate': 8.585317826142612e-05, 'epoch': 0.7}
 70%|███████   | 2422/3449 [1:54:13<44:32,  2.60s/it] 70%|███████   | 2423/3449 [1:54:16<42:50,  2.51s/it]                                                     {'loss': 1.2788, 'learning_rate': 8.569917228307189e-05, 'epoch': 0.7}
 70%|███████   | 2423/3449 [1:54:16<42:50,  2.51s/it] 70%|███████   | 2424/3449 [1:54:19<45:23,  2.66s/it]                                                     {'loss': 1.2742, 'learning_rate': 8.554526688637634e-05, 'epoch': 0.7}
 70%|███████   | 2424/3449 [1:54:19<45:23,  2.66s/it] 70%|███████   | 2425/3449 [1:54:21<43:18,  2.54s/it]                                                     {'loss': 1.3066, 'learning_rate': 8.53914622067723e-05, 'epoch': 0.7}
 70%|███████   | 2425/3449 [1:54:21<43:18,  2.54s/it] 70%|███████   | 2426/3449 [1:54:24<44:04,  2.59s/it]                                                     {'loss': 1.1575, 'learning_rate': 8.523775837960377e-05, 'epoch': 0.7}
 70%|███████   | 2426/3449 [1:54:24<44:04,  2.59s/it] 70%|███████   | 2427/3449 [1:54:27<46:58,  2.76s/it]                                                     {'loss': 1.4212, 'learning_rate': 8.508415554012574e-05, 'epoch': 0.7}
 70%|███████   | 2427/3449 [1:54:27<46:58,  2.76s/it] 70%|███████   | 2428/3449 [1:54:29<45:10,  2.65s/it]                                                     {'loss': 1.2802, 'learning_rate': 8.493065382350482e-05, 'epoch': 0.7}
 70%|███████   | 2428/3449 [1:54:29<45:10,  2.65s/it] 70%|███████   | 2429/3449 [1:54:32<45:28,  2.67s/it]                                                     {'loss': 1.2059, 'learning_rate': 8.477725336481839e-05, 'epoch': 0.7}
 70%|███████   | 2429/3449 [1:54:32<45:28,  2.67s/it] 70%|███████   | 2430/3449 [1:54:35<47:11,  2.78s/it]                                                     {'loss': 1.4083, 'learning_rate': 8.46239542990546e-05, 'epoch': 0.7}
 70%|███████   | 2430/3449 [1:54:35<47:11,  2.78s/it] 70%|███████   | 2431/3449 [1:54:38<47:02,  2.77s/it]                                                     {'loss': 1.1746, 'learning_rate': 8.447075676111251e-05, 'epoch': 0.7}
 70%|███████   | 2431/3449 [1:54:38<47:02,  2.77s/it] 71%|███████   | 2432/3449 [1:54:40<46:19,  2.73s/it]                                                     {'loss': 1.2967, 'learning_rate': 8.431766088580206e-05, 'epoch': 0.71}
 71%|███████   | 2432/3449 [1:54:40<46:19,  2.73s/it] 71%|███████   | 2433/3449 [1:54:43<43:52,  2.59s/it]                                                     {'loss': 1.2349, 'learning_rate': 8.416466680784328e-05, 'epoch': 0.71}
 71%|███████   | 2433/3449 [1:54:43<43:52,  2.59s/it] 71%|███████   | 2434/3449 [1:54:45<42:49,  2.53s/it]                                                     {'loss': 1.5313, 'learning_rate': 8.401177466186691e-05, 'epoch': 0.71}
 71%|███████   | 2434/3449 [1:54:45<42:49,  2.53s/it] 71%|███████   | 2435/3449 [1:54:48<44:00,  2.60s/it]                                                     {'loss': 1.1231, 'learning_rate': 8.385898458241397e-05, 'epoch': 0.71}
 71%|███████   | 2435/3449 [1:54:48<44:00,  2.60s/it] 71%|███████   | 2436/3449 [1:54:51<44:38,  2.64s/it]                                                     {'loss': 1.1836, 'learning_rate': 8.370629670393562e-05, 'epoch': 0.71}
 71%|███████   | 2436/3449 [1:54:51<44:38,  2.64s/it] 71%|███████   | 2437/3449 [1:54:53<46:12,  2.74s/it]                                                     {'loss': 1.1464, 'learning_rate': 8.355371116079305e-05, 'epoch': 0.71}
 71%|███████   | 2437/3449 [1:54:53<46:12,  2.74s/it] 71%|███████   | 2438/3449 [1:54:56<45:16,  2.69s/it]                                                     {'loss': 1.2764, 'learning_rate': 8.340122808725748e-05, 'epoch': 0.71}
 71%|███████   | 2438/3449 [1:54:56<45:16,  2.69s/it] 71%|███████   | 2439/3449 [1:54:59<47:05,  2.80s/it]                                                     {'loss': 1.2865, 'learning_rate': 8.324884761750991e-05, 'epoch': 0.71}
 71%|███████   | 2439/3449 [1:54:59<47:05,  2.80s/it] 71%|███████   | 2440/3449 [1:55:01<44:22,  2.64s/it]                                                     {'loss': 1.1614, 'learning_rate': 8.309656988564112e-05, 'epoch': 0.71}
 71%|███████   | 2440/3449 [1:55:01<44:22,  2.64s/it] 71%|███████   | 2441/3449 [1:55:04<46:22,  2.76s/it]                                                     {'loss': 1.1444, 'learning_rate': 8.294439502565124e-05, 'epoch': 0.71}
 71%|███████   | 2441/3449 [1:55:04<46:22,  2.76s/it] 71%|███████   | 2442/3449 [1:55:07<46:15,  2.76s/it]                                                     {'loss': 1.1024, 'learning_rate': 8.279232317145024e-05, 'epoch': 0.71}
 71%|███████   | 2442/3449 [1:55:07<46:15,  2.76s/it] 71%|███████   | 2443/3449 [1:55:10<48:17,  2.88s/it]                                                     {'loss': 1.2073, 'learning_rate': 8.264035445685729e-05, 'epoch': 0.71}
 71%|███████   | 2443/3449 [1:55:10<48:17,  2.88s/it] 71%|███████   | 2444/3449 [1:55:13<48:27,  2.89s/it]                                                     {'loss': 1.2616, 'learning_rate': 8.248848901560058e-05, 'epoch': 0.71}
 71%|███████   | 2444/3449 [1:55:13<48:27,  2.89s/it] 71%|███████   | 2445/3449 [1:55:17<51:40,  3.09s/it]                                                     {'loss': 1.2576, 'learning_rate': 8.233672698131784e-05, 'epoch': 0.71}
 71%|███████   | 2445/3449 [1:55:17<51:40,  3.09s/it] 71%|███████   | 2446/3449 [1:55:21<55:57,  3.35s/it]                                                     {'loss': 1.2171, 'learning_rate': 8.218506848755544e-05, 'epoch': 0.71}
 71%|███████   | 2446/3449 [1:55:21<55:57,  3.35s/it] 71%|███████   | 2447/3449 [1:55:23<52:43,  3.16s/it]                                                     {'loss': 1.1996, 'learning_rate': 8.203351366776883e-05, 'epoch': 0.71}
 71%|███████   | 2447/3449 [1:55:23<52:43,  3.16s/it] 71%|███████   | 2448/3449 [1:55:26<50:19,  3.02s/it]                                                     {'loss': 1.3589, 'learning_rate': 8.188206265532217e-05, 'epoch': 0.71}
 71%|███████   | 2448/3449 [1:55:26<50:19,  3.02s/it] 71%|███████   | 2449/3449 [1:55:29<49:27,  2.97s/it]                                                     {'loss': 1.1057, 'learning_rate': 8.17307155834883e-05, 'epoch': 0.71}
 71%|███████   | 2449/3449 [1:55:29<49:27,  2.97s/it] 71%|███████   | 2450/3449 [1:55:32<47:27,  2.85s/it]                                                     {'loss': 1.1668, 'learning_rate': 8.157947258544856e-05, 'epoch': 0.71}
 71%|███████   | 2450/3449 [1:55:32<47:27,  2.85s/it] 71%|███████   | 2451/3449 [1:55:34<44:09,  2.65s/it]                                                     {'loss': 1.2307, 'learning_rate': 8.142833379429274e-05, 'epoch': 0.71}
 71%|███████   | 2451/3449 [1:55:34<44:09,  2.65s/it] 71%|███████   | 2452/3449 [1:55:37<45:03,  2.71s/it]                                                     {'loss': 1.3219, 'learning_rate': 8.12772993430189e-05, 'epoch': 0.71}
 71%|███████   | 2452/3449 [1:55:37<45:03,  2.71s/it] 71%|███████   | 2453/3449 [1:55:39<43:43,  2.63s/it]                                                     {'loss': 1.2526, 'learning_rate': 8.112636936453335e-05, 'epoch': 0.71}
 71%|███████   | 2453/3449 [1:55:39<43:43,  2.63s/it] 71%|███████   | 2454/3449 [1:55:42<42:38,  2.57s/it]                                                     {'loss': 1.1376, 'learning_rate': 8.097554399165035e-05, 'epoch': 0.71}
 71%|███████   | 2454/3449 [1:55:42<42:38,  2.57s/it] 71%|███████   | 2455/3449 [1:55:44<44:06,  2.66s/it]                                                     {'loss': 1.2453, 'learning_rate': 8.082482335709223e-05, 'epoch': 0.71}
 71%|███████   | 2455/3449 [1:55:44<44:06,  2.66s/it] 71%|███████   | 2456/3449 [1:55:47<43:19,  2.62s/it]                                                     {'loss': 1.4924, 'learning_rate': 8.067420759348916e-05, 'epoch': 0.71}
 71%|███████   | 2456/3449 [1:55:47<43:19,  2.62s/it] 71%|███████   | 2457/3449 [1:55:49<42:34,  2.57s/it]                                                     {'loss': 1.1736, 'learning_rate': 8.052369683337879e-05, 'epoch': 0.71}
 71%|███████   | 2457/3449 [1:55:49<42:34,  2.57s/it] 71%|███████▏  | 2458/3449 [1:55:52<40:55,  2.48s/it]                                                     {'loss': 1.2084, 'learning_rate': 8.037329120920661e-05, 'epoch': 0.71}
 71%|███████▏  | 2458/3449 [1:55:52<40:55,  2.48s/it] 71%|███████▏  | 2459/3449 [1:55:54<42:13,  2.56s/it]                                                     {'loss': 1.1513, 'learning_rate': 8.022299085332568e-05, 'epoch': 0.71}
 71%|███████▏  | 2459/3449 [1:55:54<42:13,  2.56s/it] 71%|███████▏  | 2460/3449 [1:55:57<42:36,  2.59s/it]                                                     {'loss': 1.0565, 'learning_rate': 8.007279589799608e-05, 'epoch': 0.71}
 71%|███████▏  | 2460/3449 [1:55:57<42:36,  2.59s/it] 71%|███████▏  | 2461/3449 [1:56:00<42:32,  2.58s/it]                                                     {'loss': 1.3023, 'learning_rate': 7.992270647538538e-05, 'epoch': 0.71}
 71%|███████▏  | 2461/3449 [1:56:00<42:32,  2.58s/it] 71%|███████▏  | 2462/3449 [1:56:03<47:43,  2.90s/it]                                                     {'loss': 1.1536, 'learning_rate': 7.977272271756842e-05, 'epoch': 0.71}
 71%|███████▏  | 2462/3449 [1:56:03<47:43,  2.90s/it] 71%|███████▏  | 2463/3449 [1:56:07<51:07,  3.11s/it]                                                     {'loss': 1.1433, 'learning_rate': 7.962284475652664e-05, 'epoch': 0.71}
 71%|███████▏  | 2463/3449 [1:56:07<51:07,  3.11s/it] 71%|███████▏  | 2464/3449 [1:56:09<48:24,  2.95s/it]                                                     {'loss': 1.1582, 'learning_rate': 7.947307272414874e-05, 'epoch': 0.71}
 71%|███████▏  | 2464/3449 [1:56:09<48:24,  2.95s/it] 71%|███████▏  | 2465/3449 [1:56:12<45:02,  2.75s/it]                                                     {'loss': 1.2312, 'learning_rate': 7.932340675223007e-05, 'epoch': 0.71}
 71%|███████▏  | 2465/3449 [1:56:12<45:02,  2.75s/it] 71%|███████▏  | 2466/3449 [1:56:15<48:10,  2.94s/it]                                                     {'loss': 1.1697, 'learning_rate': 7.917384697247268e-05, 'epoch': 0.71}
 71%|███████▏  | 2466/3449 [1:56:15<48:10,  2.94s/it] 72%|███████▏  | 2467/3449 [1:56:18<47:49,  2.92s/it]                                                     {'loss': 1.197, 'learning_rate': 7.902439351648511e-05, 'epoch': 0.72}
 72%|███████▏  | 2467/3449 [1:56:18<47:49,  2.92s/it] 72%|███████▏  | 2468/3449 [1:56:21<47:27,  2.90s/it]                                                     {'loss': 1.1604, 'learning_rate': 7.887504651578243e-05, 'epoch': 0.72}
 72%|███████▏  | 2468/3449 [1:56:21<47:27,  2.90s/it] 72%|███████▏  | 2469/3449 [1:56:24<47:17,  2.90s/it]                                                     {'loss': 1.1777, 'learning_rate': 7.872580610178599e-05, 'epoch': 0.72}
 72%|███████▏  | 2469/3449 [1:56:24<47:17,  2.90s/it] 72%|███████▏  | 2470/3449 [1:56:26<44:00,  2.70s/it]                                                     {'loss': 1.1089, 'learning_rate': 7.85766724058234e-05, 'epoch': 0.72}
 72%|███████▏  | 2470/3449 [1:56:26<44:00,  2.70s/it] 72%|███████▏  | 2471/3449 [1:56:29<46:07,  2.83s/it]                                                     {'loss': 1.1457, 'learning_rate': 7.842764555912811e-05, 'epoch': 0.72}
 72%|███████▏  | 2471/3449 [1:56:29<46:07,  2.83s/it] 72%|███████▏  | 2472/3449 [1:56:32<44:27,  2.73s/it]                                                     {'loss': 1.1753, 'learning_rate': 7.827872569283994e-05, 'epoch': 0.72}
 72%|███████▏  | 2472/3449 [1:56:32<44:27,  2.73s/it] 72%|███████▏  | 2473/3449 [1:56:35<47:12,  2.90s/it]                                                     {'loss': 1.0934, 'learning_rate': 7.812991293800438e-05, 'epoch': 0.72}
 72%|███████▏  | 2473/3449 [1:56:35<47:12,  2.90s/it] 72%|███████▏  | 2474/3449 [1:56:38<45:59,  2.83s/it]                                                     {'loss': 1.2527, 'learning_rate': 7.798120742557254e-05, 'epoch': 0.72}
 72%|███████▏  | 2474/3449 [1:56:38<45:59,  2.83s/it] 72%|███████▏  | 2475/3449 [1:56:41<48:22,  2.98s/it]                                                     {'loss': 1.0998, 'learning_rate': 7.783260928640121e-05, 'epoch': 0.72}
 72%|███████▏  | 2475/3449 [1:56:41<48:22,  2.98s/it] 72%|███████▏  | 2476/3449 [1:56:43<46:35,  2.87s/it]                                                     {'loss': 1.2243, 'learning_rate': 7.768411865125307e-05, 'epoch': 0.72}
 72%|███████▏  | 2476/3449 [1:56:43<46:35,  2.87s/it] 72%|███████▏  | 2477/3449 [1:56:47<47:50,  2.95s/it]                                                     {'loss': 1.1815, 'learning_rate': 7.753573565079559e-05, 'epoch': 0.72}
 72%|███████▏  | 2477/3449 [1:56:47<47:50,  2.95s/it] 72%|███████▏  | 2478/3449 [1:56:49<45:23,  2.80s/it]                                                     {'loss': 1.1545, 'learning_rate': 7.738746041560188e-05, 'epoch': 0.72}
 72%|███████▏  | 2478/3449 [1:56:49<45:23,  2.80s/it] 72%|███████▏  | 2479/3449 [1:56:52<43:37,  2.70s/it]                                                     {'loss': 1.3268, 'learning_rate': 7.723929307615037e-05, 'epoch': 0.72}
 72%|███████▏  | 2479/3449 [1:56:52<43:37,  2.70s/it] 72%|███████▏  | 2480/3449 [1:56:54<44:46,  2.77s/it]                                                     {'loss': 1.0984, 'learning_rate': 7.70912337628241e-05, 'epoch': 0.72}
 72%|███████▏  | 2480/3449 [1:56:54<44:46,  2.77s/it] 72%|███████▏  | 2481/3449 [1:56:57<44:47,  2.78s/it]                                                     {'loss': 1.1015, 'learning_rate': 7.694328260591137e-05, 'epoch': 0.72}
 72%|███████▏  | 2481/3449 [1:56:57<44:47,  2.78s/it] 72%|███████▏  | 2482/3449 [1:57:00<44:17,  2.75s/it]                                                     {'loss': 1.343, 'learning_rate': 7.679543973560525e-05, 'epoch': 0.72}
 72%|███████▏  | 2482/3449 [1:57:00<44:17,  2.75s/it] 72%|███████▏  | 2483/3449 [1:57:03<46:33,  2.89s/it]                                                     {'loss': 1.2127, 'learning_rate': 7.664770528200347e-05, 'epoch': 0.72}
 72%|███████▏  | 2483/3449 [1:57:03<46:33,  2.89s/it] 72%|███████▏  | 2484/3449 [1:57:06<44:50,  2.79s/it]                                                     {'loss': 1.3454, 'learning_rate': 7.650007937510839e-05, 'epoch': 0.72}
 72%|███████▏  | 2484/3449 [1:57:06<44:50,  2.79s/it] 72%|███████▏  | 2485/3449 [1:57:08<43:08,  2.68s/it]                                                     {'loss': 1.2991, 'learning_rate': 7.635256214482687e-05, 'epoch': 0.72}
 72%|███████▏  | 2485/3449 [1:57:08<43:08,  2.68s/it] 72%|███████▏  | 2486/3449 [1:57:11<41:35,  2.59s/it]                                                     {'loss': 1.1915, 'learning_rate': 7.620515372097006e-05, 'epoch': 0.72}
 72%|███████▏  | 2486/3449 [1:57:11<41:35,  2.59s/it] 72%|███████▏  | 2487/3449 [1:57:14<45:16,  2.82s/it]                                                     {'loss': 1.09, 'learning_rate': 7.605785423325352e-05, 'epoch': 0.72}
 72%|███████▏  | 2487/3449 [1:57:14<45:16,  2.82s/it] 72%|███████▏  | 2488/3449 [1:57:17<44:26,  2.78s/it]                                                     {'loss': 1.2273, 'learning_rate': 7.591066381129662e-05, 'epoch': 0.72}
 72%|███████▏  | 2488/3449 [1:57:17<44:26,  2.78s/it] 72%|███████▏  | 2489/3449 [1:57:19<43:08,  2.70s/it]                                                     {'loss': 1.2695, 'learning_rate': 7.576358258462318e-05, 'epoch': 0.72}
 72%|███████▏  | 2489/3449 [1:57:19<43:08,  2.70s/it] 72%|███████▏  | 2490/3449 [1:57:22<44:15,  2.77s/it]                                                     {'loss': 1.2727, 'learning_rate': 7.561661068266075e-05, 'epoch': 0.72}
 72%|███████▏  | 2490/3449 [1:57:22<44:15,  2.77s/it] 72%|███████▏  | 2491/3449 [1:57:25<44:20,  2.78s/it]                                                     {'loss': 1.1853, 'learning_rate': 7.546974823474049e-05, 'epoch': 0.72}
 72%|███████▏  | 2491/3449 [1:57:25<44:20,  2.78s/it] 72%|███████▏  | 2492/3449 [1:57:28<46:26,  2.91s/it]                                                     {'loss': 1.1506, 'learning_rate': 7.532299537009752e-05, 'epoch': 0.72}
 72%|███████▏  | 2492/3449 [1:57:28<46:26,  2.91s/it] 72%|███████▏  | 2493/3449 [1:57:31<45:45,  2.87s/it]                                                     {'loss': 1.2298, 'learning_rate': 7.517635221787039e-05, 'epoch': 0.72}
 72%|███████▏  | 2493/3449 [1:57:31<45:45,  2.87s/it] 72%|███████▏  | 2494/3449 [1:57:33<44:34,  2.80s/it]                                                     {'loss': 1.3003, 'learning_rate': 7.502981890710115e-05, 'epoch': 0.72}
 72%|███████▏  | 2494/3449 [1:57:33<44:34,  2.80s/it] 72%|███████▏  | 2495/3449 [1:57:36<42:44,  2.69s/it]                                                     {'loss': 1.1465, 'learning_rate': 7.488339556673516e-05, 'epoch': 0.72}
 72%|███████▏  | 2495/3449 [1:57:36<42:44,  2.69s/it] 72%|███████▏  | 2496/3449 [1:57:39<43:13,  2.72s/it]                                                     {'loss': 1.2031, 'learning_rate': 7.473708232562104e-05, 'epoch': 0.72}
 72%|███████▏  | 2496/3449 [1:57:39<43:13,  2.72s/it] 72%|███████▏  | 2497/3449 [1:57:41<41:39,  2.63s/it]                                                     {'loss': 1.2372, 'learning_rate': 7.459087931251052e-05, 'epoch': 0.72}
 72%|███████▏  | 2497/3449 [1:57:41<41:39,  2.63s/it] 72%|███████▏  | 2498/3449 [1:57:43<39:51,  2.51s/it]                                                     {'loss': 1.2309, 'learning_rate': 7.444478665605832e-05, 'epoch': 0.72}
 72%|███████▏  | 2498/3449 [1:57:43<39:51,  2.51s/it] 72%|███████▏  | 2499/3449 [1:57:46<41:58,  2.65s/it]                                                     {'loss': 1.2479, 'learning_rate': 7.429880448482205e-05, 'epoch': 0.72}
 72%|███████▏  | 2499/3449 [1:57:46<41:58,  2.65s/it] 72%|███████▏  | 2500/3449 [1:57:49<41:57,  2.65s/it]                                                     {'loss': 1.1663, 'learning_rate': 7.415293292726209e-05, 'epoch': 0.72}
 72%|███████▏  | 2500/3449 [1:57:49<41:57,  2.65s/it] 73%|███████▎  | 2501/3449 [1:57:52<43:51,  2.78s/it]                                                     {'loss': 1.0804, 'learning_rate': 7.400717211174151e-05, 'epoch': 0.73}
 73%|███████▎  | 2501/3449 [1:57:52<43:51,  2.78s/it] 73%|███████▎  | 2502/3449 [1:57:55<44:10,  2.80s/it]                                                     {'loss': 1.2802, 'learning_rate': 7.386152216652591e-05, 'epoch': 0.73}
 73%|███████▎  | 2502/3449 [1:57:55<44:10,  2.80s/it] 73%|███████▎  | 2503/3449 [1:57:58<43:20,  2.75s/it]                                                     {'loss': 1.2192, 'learning_rate': 7.371598321978335e-05, 'epoch': 0.73}
 73%|███████▎  | 2503/3449 [1:57:58<43:20,  2.75s/it] 73%|███████▎  | 2504/3449 [1:58:00<43:46,  2.78s/it]                                                     {'loss': 1.2294, 'learning_rate': 7.357055539958422e-05, 'epoch': 0.73}
 73%|███████▎  | 2504/3449 [1:58:00<43:46,  2.78s/it] 73%|███████▎  | 2505/3449 [1:58:05<50:39,  3.22s/it]                                                     {'loss': 1.09, 'learning_rate': 7.34252388339009e-05, 'epoch': 0.73}
 73%|███████▎  | 2505/3449 [1:58:05<50:39,  3.22s/it] 73%|███████▎  | 2506/3449 [1:58:08<50:45,  3.23s/it]                                                     {'loss': 1.1552, 'learning_rate': 7.328003365060836e-05, 'epoch': 0.73}
 73%|███████▎  | 2506/3449 [1:58:08<50:45,  3.23s/it] 73%|███████▎  | 2507/3449 [1:58:10<45:46,  2.92s/it]                                                     {'loss': 1.1229, 'learning_rate': 7.313493997748307e-05, 'epoch': 0.73}
 73%|███████▎  | 2507/3449 [1:58:10<45:46,  2.92s/it] 73%|███████▎  | 2508/3449 [1:58:12<43:29,  2.77s/it]                                                     {'loss': 1.3035, 'learning_rate': 7.298995794220358e-05, 'epoch': 0.73}
 73%|███████▎  | 2508/3449 [1:58:12<43:29,  2.77s/it] 73%|███████▎  | 2509/3449 [1:58:16<47:40,  3.04s/it]                                                     {'loss': 1.0221, 'learning_rate': 7.284508767235023e-05, 'epoch': 0.73}
 73%|███████▎  | 2509/3449 [1:58:16<47:40,  3.04s/it] 73%|███████▎  | 2510/3449 [1:58:19<45:05,  2.88s/it]                                                     {'loss': 1.2861, 'learning_rate': 7.270032929540498e-05, 'epoch': 0.73}
 73%|███████▎  | 2510/3449 [1:58:19<45:05,  2.88s/it] 73%|███████▎  | 2511/3449 [1:58:21<43:08,  2.76s/it]                                                     {'loss': 1.3879, 'learning_rate': 7.255568293875126e-05, 'epoch': 0.73}
 73%|███████▎  | 2511/3449 [1:58:21<43:08,  2.76s/it] 73%|███████▎  | 2512/3449 [1:58:24<43:25,  2.78s/it]                                                     {'loss': 1.1798, 'learning_rate': 7.241114872967403e-05, 'epoch': 0.73}
 73%|███████▎  | 2512/3449 [1:58:24<43:25,  2.78s/it] 73%|███████▎  | 2513/3449 [1:58:26<41:57,  2.69s/it]                                                     {'loss': 1.0513, 'learning_rate': 7.226672679535948e-05, 'epoch': 0.73}
 73%|███████▎  | 2513/3449 [1:58:26<41:57,  2.69s/it] 73%|███████▎  | 2514/3449 [1:58:31<51:18,  3.29s/it]                                                     {'loss': 1.2296, 'learning_rate': 7.212241726289506e-05, 'epoch': 0.73}
 73%|███████▎  | 2514/3449 [1:58:31<51:18,  3.29s/it] 73%|███████▎  | 2515/3449 [1:58:34<47:23,  3.04s/it]                                                     {'loss': 1.3357, 'learning_rate': 7.197822025926926e-05, 'epoch': 0.73}
 73%|███████▎  | 2515/3449 [1:58:34<47:23,  3.04s/it] 73%|███████▎  | 2516/3449 [1:58:38<53:45,  3.46s/it]                                                     {'loss': 1.1214, 'learning_rate': 7.183413591137158e-05, 'epoch': 0.73}
 73%|███████▎  | 2516/3449 [1:58:38<53:45,  3.46s/it] 73%|███████▎  | 2517/3449 [1:58:40<48:26,  3.12s/it]                                                     {'loss': 1.2456, 'learning_rate': 7.169016434599245e-05, 'epoch': 0.73}
 73%|███████▎  | 2517/3449 [1:58:40<48:26,  3.12s/it] 73%|███████▎  | 2518/3449 [1:58:45<54:28,  3.51s/it]                                                     {'loss': 1.1377, 'learning_rate': 7.154630568982276e-05, 'epoch': 0.73}
 73%|███████▎  | 2518/3449 [1:58:45<54:28,  3.51s/it] 73%|███████▎  | 2519/3449 [1:58:49<56:07,  3.62s/it]                                                     {'loss': 1.2149, 'learning_rate': 7.14025600694545e-05, 'epoch': 0.73}
 73%|███████▎  | 2519/3449 [1:58:49<56:07,  3.62s/it] 73%|███████▎  | 2520/3449 [1:58:52<54:19,  3.51s/it]                                                     {'loss': 1.1556, 'learning_rate': 7.125892761137993e-05, 'epoch': 0.73}
 73%|███████▎  | 2520/3449 [1:58:52<54:19,  3.51s/it] 73%|███████▎  | 2521/3449 [1:58:55<51:59,  3.36s/it]                                                     {'loss': 1.0743, 'learning_rate': 7.111540844199163e-05, 'epoch': 0.73}
 73%|███████▎  | 2521/3449 [1:58:55<51:59,  3.36s/it] 73%|███████▎  | 2522/3449 [1:58:58<49:18,  3.19s/it]                                                     {'loss': 1.2003, 'learning_rate': 7.097200268758259e-05, 'epoch': 0.73}
 73%|███████▎  | 2522/3449 [1:58:58<49:18,  3.19s/it] 73%|███████▎  | 2523/3449 [1:59:01<47:40,  3.09s/it]                                                     {'loss': 1.2176, 'learning_rate': 7.082871047434627e-05, 'epoch': 0.73}
 73%|███████▎  | 2523/3449 [1:59:01<47:40,  3.09s/it] 73%|███████▎  | 2524/3449 [1:59:03<46:50,  3.04s/it]                                                     {'loss': 1.1846, 'learning_rate': 7.068553192837573e-05, 'epoch': 0.73}
 73%|███████▎  | 2524/3449 [1:59:03<46:50,  3.04s/it] 73%|███████▎  | 2525/3449 [1:59:07<47:22,  3.08s/it]                                                     {'loss': 1.3373, 'learning_rate': 7.054246717566433e-05, 'epoch': 0.73}
 73%|███████▎  | 2525/3449 [1:59:07<47:22,  3.08s/it] 73%|███████▎  | 2526/3449 [1:59:09<44:10,  2.87s/it]                                                     {'loss': 1.306, 'learning_rate': 7.03995163421052e-05, 'epoch': 0.73}
 73%|███████▎  | 2526/3449 [1:59:09<44:10,  2.87s/it] 73%|███████▎  | 2527/3449 [1:59:11<41:47,  2.72s/it]                                                     {'loss': 1.2451, 'learning_rate': 7.025667955349125e-05, 'epoch': 0.73}
 73%|███████▎  | 2527/3449 [1:59:11<41:47,  2.72s/it] 73%|███████▎  | 2528/3449 [1:59:14<41:24,  2.70s/it]                                                     {'loss': 1.1258, 'learning_rate': 7.011395693551501e-05, 'epoch': 0.73}
 73%|███████▎  | 2528/3449 [1:59:14<41:24,  2.70s/it] 73%|███████▎  | 2529/3449 [1:59:17<43:03,  2.81s/it]                                                     {'loss': 1.2308, 'learning_rate': 6.997134861376855e-05, 'epoch': 0.73}
 73%|███████▎  | 2529/3449 [1:59:17<43:03,  2.81s/it] 73%|███████▎  | 2530/3449 [1:59:20<42:57,  2.80s/it]                                                     {'loss': 1.2356, 'learning_rate': 6.982885471374334e-05, 'epoch': 0.73}
 73%|███████▎  | 2530/3449 [1:59:20<42:57,  2.80s/it] 73%|███████▎  | 2531/3449 [1:59:23<42:03,  2.75s/it]                                                     {'loss': 1.1594, 'learning_rate': 6.968647536083031e-05, 'epoch': 0.73}
 73%|███████▎  | 2531/3449 [1:59:23<42:03,  2.75s/it] 73%|███████▎  | 2532/3449 [1:59:26<46:17,  3.03s/it]                                                     {'loss': 1.1595, 'learning_rate': 6.954421068031922e-05, 'epoch': 0.73}
 73%|███████▎  | 2532/3449 [1:59:26<46:17,  3.03s/it] 73%|███████▎  | 2533/3449 [1:59:29<44:38,  2.92s/it]                                                     {'loss': 1.1268, 'learning_rate': 6.940206079739937e-05, 'epoch': 0.73}
 73%|███████▎  | 2533/3449 [1:59:29<44:38,  2.92s/it] 73%|███████▎  | 2534/3449 [1:59:31<42:15,  2.77s/it]                                                     {'loss': 1.1834, 'learning_rate': 6.926002583715887e-05, 'epoch': 0.73}
 73%|███████▎  | 2534/3449 [1:59:31<42:15,  2.77s/it] 73%|███████▎  | 2535/3449 [1:59:34<40:51,  2.68s/it]                                                     {'loss': 1.1548, 'learning_rate': 6.911810592458444e-05, 'epoch': 0.73}
 73%|███████▎  | 2535/3449 [1:59:34<40:51,  2.68s/it] 74%|███████▎  | 2536/3449 [1:59:36<40:45,  2.68s/it]                                                     {'loss': 1.2813, 'learning_rate': 6.8976301184562e-05, 'epoch': 0.74}
 74%|███████▎  | 2536/3449 [1:59:36<40:45,  2.68s/it] 74%|███████▎  | 2537/3449 [1:59:39<39:26,  2.60s/it]                                                     {'loss': 1.3438, 'learning_rate': 6.88346117418759e-05, 'epoch': 0.74}
 74%|███████▎  | 2537/3449 [1:59:39<39:26,  2.60s/it] 74%|███████▎  | 2538/3449 [1:59:41<39:27,  2.60s/it]                                                     {'loss': 1.1653, 'learning_rate': 6.869303772120897e-05, 'epoch': 0.74}
 74%|███████▎  | 2538/3449 [1:59:41<39:27,  2.60s/it] 74%|███████▎  | 2539/3449 [1:59:44<38:26,  2.53s/it]                                                     {'loss': 1.3029, 'learning_rate': 6.855157924714247e-05, 'epoch': 0.74}
 74%|███████▎  | 2539/3449 [1:59:44<38:26,  2.53s/it] 74%|███████▎  | 2540/3449 [1:59:47<39:35,  2.61s/it]                                                     {'loss': 1.2785, 'learning_rate': 6.841023644415629e-05, 'epoch': 0.74}
 74%|███████▎  | 2540/3449 [1:59:47<39:35,  2.61s/it] 74%|███████▎  | 2541/3449 [1:59:50<40:40,  2.69s/it]                                                     {'loss': 1.1061, 'learning_rate': 6.826900943662813e-05, 'epoch': 0.74}
 74%|███████▎  | 2541/3449 [1:59:50<40:40,  2.69s/it] 74%|███████▎  | 2542/3449 [1:59:53<43:37,  2.89s/it]                                                     {'loss': 1.1774, 'learning_rate': 6.812789834883397e-05, 'epoch': 0.74}
 74%|███████▎  | 2542/3449 [1:59:53<43:37,  2.89s/it] 74%|███████▎  | 2543/3449 [1:59:56<42:30,  2.82s/it]                                                     {'loss': 1.0082, 'learning_rate': 6.798690330494783e-05, 'epoch': 0.74}
 74%|███████▎  | 2543/3449 [1:59:56<42:30,  2.82s/it] 74%|███████▍  | 2544/3449 [1:59:59<43:29,  2.88s/it]                                                     {'loss': 1.1979, 'learning_rate': 6.784602442904153e-05, 'epoch': 0.74}
 74%|███████▍  | 2544/3449 [1:59:59<43:29,  2.88s/it] 74%|███████▍  | 2545/3449 [2:00:01<43:37,  2.90s/it]                                                     {'loss': 1.2065, 'learning_rate': 6.770526184508472e-05, 'epoch': 0.74}
 74%|███████▍  | 2545/3449 [2:00:01<43:37,  2.90s/it] 74%|███████▍  | 2546/3449 [2:00:04<42:35,  2.83s/it]                                                     {'loss': 1.2147, 'learning_rate': 6.756461567694468e-05, 'epoch': 0.74}
 74%|███████▍  | 2546/3449 [2:00:04<42:35,  2.83s/it] 74%|███████▍  | 2547/3449 [2:00:07<41:24,  2.75s/it]                                                     {'loss': 1.2156, 'learning_rate': 6.742408604838625e-05, 'epoch': 0.74}
 74%|███████▍  | 2547/3449 [2:00:07<41:24,  2.75s/it] 74%|███████▍  | 2548/3449 [2:00:10<42:05,  2.80s/it]                                                     {'loss': 1.2502, 'learning_rate': 6.728367308307184e-05, 'epoch': 0.74}
 74%|███████▍  | 2548/3449 [2:00:10<42:05,  2.80s/it] 74%|███████▍  | 2549/3449 [2:00:12<41:57,  2.80s/it]                                                     {'loss': 1.3731, 'learning_rate': 6.714337690456086e-05, 'epoch': 0.74}
 74%|███████▍  | 2549/3449 [2:00:12<41:57,  2.80s/it] 74%|███████▍  | 2550/3449 [2:00:15<42:15,  2.82s/it]                                                     {'loss': 1.249, 'learning_rate': 6.700319763631036e-05, 'epoch': 0.74}
 74%|███████▍  | 2550/3449 [2:00:15<42:15,  2.82s/it] 74%|███████▍  | 2551/3449 [2:00:18<41:32,  2.78s/it]                                                     {'loss': 1.2717, 'learning_rate': 6.686313540167434e-05, 'epoch': 0.74}
 74%|███████▍  | 2551/3449 [2:00:18<41:32,  2.78s/it] 74%|███████▍  | 2552/3449 [2:00:20<39:30,  2.64s/it]                                                     {'loss': 1.2589, 'learning_rate': 6.672319032390364e-05, 'epoch': 0.74}
 74%|███████▍  | 2552/3449 [2:00:20<39:30,  2.64s/it] 74%|███████▍  | 2553/3449 [2:00:23<39:51,  2.67s/it]                                                     {'loss': 1.0935, 'learning_rate': 6.658336252614639e-05, 'epoch': 0.74}
 74%|███████▍  | 2553/3449 [2:00:23<39:51,  2.67s/it] 74%|███████▍  | 2554/3449 [2:00:26<41:42,  2.80s/it]                                                     {'loss': 1.2404, 'learning_rate': 6.644365213144714e-05, 'epoch': 0.74}
 74%|███████▍  | 2554/3449 [2:00:26<41:42,  2.80s/it] 74%|███████▍  | 2555/3449 [2:00:29<42:08,  2.83s/it]                                                     {'loss': 1.207, 'learning_rate': 6.630405926274732e-05, 'epoch': 0.74}
 74%|███████▍  | 2555/3449 [2:00:29<42:08,  2.83s/it] 74%|███████▍  | 2556/3449 [2:00:31<39:40,  2.67s/it]                                                     {'loss': 1.2981, 'learning_rate': 6.616458404288491e-05, 'epoch': 0.74}
 74%|███████▍  | 2556/3449 [2:00:31<39:40,  2.67s/it] 74%|███████▍  | 2557/3449 [2:00:34<39:11,  2.64s/it]                                                     {'loss': 1.2384, 'learning_rate': 6.602522659459438e-05, 'epoch': 0.74}
 74%|███████▍  | 2557/3449 [2:00:34<39:11,  2.64s/it] 74%|███████▍  | 2558/3449 [2:00:36<38:54,  2.62s/it]                                                     {'loss': 1.1147, 'learning_rate': 6.588598704050651e-05, 'epoch': 0.74}
 74%|███████▍  | 2558/3449 [2:00:36<38:54,  2.62s/it] 74%|███████▍  | 2559/3449 [2:00:39<38:17,  2.58s/it]                                                     {'loss': 1.2037, 'learning_rate': 6.574686550314839e-05, 'epoch': 0.74}
 74%|███████▍  | 2559/3449 [2:00:39<38:17,  2.58s/it] 74%|███████▍  | 2560/3449 [2:00:42<39:18,  2.65s/it]                                                     {'loss': 1.2788, 'learning_rate': 6.560786210494323e-05, 'epoch': 0.74}
 74%|███████▍  | 2560/3449 [2:00:42<39:18,  2.65s/it] 74%|███████▍  | 2561/3449 [2:00:44<38:25,  2.60s/it]                                                     {'loss': 1.2496, 'learning_rate': 6.54689769682103e-05, 'epoch': 0.74}
 74%|███████▍  | 2561/3449 [2:00:44<38:25,  2.60s/it] 74%|███████▍  | 2562/3449 [2:00:47<39:03,  2.64s/it]                                                     {'loss': 1.083, 'learning_rate': 6.533021021516476e-05, 'epoch': 0.74}
 74%|███████▍  | 2562/3449 [2:00:47<39:03,  2.64s/it] 74%|███████▍  | 2563/3449 [2:00:50<39:38,  2.68s/it]                                                     {'loss': 1.1779, 'learning_rate': 6.519156196791767e-05, 'epoch': 0.74}
 74%|███████▍  | 2563/3449 [2:00:50<39:38,  2.68s/it] 74%|███████▍  | 2564/3449 [2:00:52<38:54,  2.64s/it]                                                     {'loss': 1.2004, 'learning_rate': 6.50530323484758e-05, 'epoch': 0.74}
 74%|███████▍  | 2564/3449 [2:00:52<38:54,  2.64s/it] 74%|███████▍  | 2565/3449 [2:00:55<38:28,  2.61s/it]                                                     {'loss': 1.2038, 'learning_rate': 6.491462147874136e-05, 'epoch': 0.74}
 74%|███████▍  | 2565/3449 [2:00:55<38:28,  2.61s/it] 74%|███████▍  | 2566/3449 [2:00:58<41:53,  2.85s/it]                                                     {'loss': 1.1545, 'learning_rate': 6.47763294805122e-05, 'epoch': 0.74}
 74%|███████▍  | 2566/3449 [2:00:58<41:53,  2.85s/it] 74%|███████▍  | 2567/3449 [2:01:01<40:17,  2.74s/it]                                                     {'loss': 1.3229, 'learning_rate': 6.46381564754818e-05, 'epoch': 0.74}
 74%|███████▍  | 2567/3449 [2:01:01<40:17,  2.74s/it] 74%|███████▍  | 2568/3449 [2:01:04<40:29,  2.76s/it]                                                     {'loss': 1.3154, 'learning_rate': 6.450010258523844e-05, 'epoch': 0.74}
 74%|███████▍  | 2568/3449 [2:01:04<40:29,  2.76s/it] 74%|███████▍  | 2569/3449 [2:01:06<39:37,  2.70s/it]                                                     {'loss': 1.2928, 'learning_rate': 6.436216793126586e-05, 'epoch': 0.74}
 74%|███████▍  | 2569/3449 [2:01:06<39:37,  2.70s/it] 75%|███████▍  | 2570/3449 [2:01:09<39:02,  2.67s/it]                                                     {'loss': 1.2972, 'learning_rate': 6.422435263494307e-05, 'epoch': 0.75}
 75%|███████▍  | 2570/3449 [2:01:09<39:02,  2.67s/it] 75%|███████▍  | 2571/3449 [2:01:12<39:51,  2.72s/it]                                                     {'loss': 1.2683, 'learning_rate': 6.408665681754357e-05, 'epoch': 0.75}
 75%|███████▍  | 2571/3449 [2:01:12<39:51,  2.72s/it] 75%|███████▍  | 2572/3449 [2:01:14<38:14,  2.62s/it]                                                     {'loss': 1.4114, 'learning_rate': 6.394908060023613e-05, 'epoch': 0.75}
 75%|███████▍  | 2572/3449 [2:01:14<38:14,  2.62s/it] 75%|███████▍  | 2573/3449 [2:01:17<40:36,  2.78s/it]                                                     {'loss': 1.1641, 'learning_rate': 6.381162410408408e-05, 'epoch': 0.75}
 75%|███████▍  | 2573/3449 [2:01:17<40:36,  2.78s/it] 75%|███████▍  | 2574/3449 [2:01:20<40:34,  2.78s/it]                                                     {'loss': 1.1843, 'learning_rate': 6.367428745004544e-05, 'epoch': 0.75}
 75%|███████▍  | 2574/3449 [2:01:20<40:34,  2.78s/it] 75%|███████▍  | 2575/3449 [2:01:23<40:37,  2.79s/it]                                                     {'loss': 1.1882, 'learning_rate': 6.353707075897279e-05, 'epoch': 0.75}
 75%|███████▍  | 2575/3449 [2:01:23<40:37,  2.79s/it] 75%|███████▍  | 2576/3449 [2:01:25<39:29,  2.71s/it]                                                     {'loss': 1.2566, 'learning_rate': 6.339997415161314e-05, 'epoch': 0.75}
 75%|███████▍  | 2576/3449 [2:01:25<39:29,  2.71s/it] 75%|███████▍  | 2577/3449 [2:01:28<38:12,  2.63s/it]                                                     {'loss': 1.1655, 'learning_rate': 6.32629977486078e-05, 'epoch': 0.75}
 75%|███████▍  | 2577/3449 [2:01:28<38:12,  2.63s/it] 75%|███████▍  | 2578/3449 [2:01:30<37:43,  2.60s/it]                                                     {'loss': 1.2649, 'learning_rate': 6.312614167049243e-05, 'epoch': 0.75}
 75%|███████▍  | 2578/3449 [2:01:30<37:43,  2.60s/it] 75%|███████▍  | 2579/3449 [2:01:32<36:28,  2.52s/it]                                                     {'loss': 1.3644, 'learning_rate': 6.298940603769646e-05, 'epoch': 0.75}
 75%|███████▍  | 2579/3449 [2:01:33<36:28,  2.52s/it] 75%|███████▍  | 2580/3449 [2:01:36<39:39,  2.74s/it]                                                     {'loss': 1.1969, 'learning_rate': 6.28527909705438e-05, 'epoch': 0.75}
 75%|███████▍  | 2580/3449 [2:01:36<39:39,  2.74s/it] 75%|███████▍  | 2581/3449 [2:01:38<38:13,  2.64s/it]                                                     {'loss': 1.1902, 'learning_rate': 6.271629658925205e-05, 'epoch': 0.75}
 75%|███████▍  | 2581/3449 [2:01:38<38:13,  2.64s/it] 75%|███████▍  | 2582/3449 [2:01:42<42:36,  2.95s/it]                                                     {'loss': 1.3376, 'learning_rate': 6.257992301393243e-05, 'epoch': 0.75}
 75%|███████▍  | 2582/3449 [2:01:42<42:36,  2.95s/it] 75%|███████▍  | 2583/3449 [2:01:45<42:03,  2.91s/it]                                                     {'loss': 1.1419, 'learning_rate': 6.244367036459006e-05, 'epoch': 0.75}
 75%|███████▍  | 2583/3449 [2:01:45<42:03,  2.91s/it] 75%|███████▍  | 2584/3449 [2:01:48<41:45,  2.90s/it]                                                     {'loss': 1.3543, 'learning_rate': 6.23075387611238e-05, 'epoch': 0.75}
 75%|███████▍  | 2584/3449 [2:01:48<41:45,  2.90s/it] 75%|███████▍  | 2585/3449 [2:01:51<42:10,  2.93s/it]                                                     {'loss': 1.2241, 'learning_rate': 6.21715283233256e-05, 'epoch': 0.75}
 75%|███████▍  | 2585/3449 [2:01:51<42:10,  2.93s/it] 75%|███████▍  | 2586/3449 [2:01:54<42:28,  2.95s/it]                                                     {'loss': 1.1916, 'learning_rate': 6.2035639170881e-05, 'epoch': 0.75}
 75%|███████▍  | 2586/3449 [2:01:54<42:28,  2.95s/it] 75%|███████▌  | 2587/3449 [2:01:56<39:54,  2.78s/it]                                                     {'loss': 1.1958, 'learning_rate': 6.1899871423369e-05, 'epoch': 0.75}
 75%|███████▌  | 2587/3449 [2:01:56<39:54,  2.78s/it] 75%|███████▌  | 2588/3449 [2:01:59<39:29,  2.75s/it]                                                     {'loss': 1.442, 'learning_rate': 6.176422520026137e-05, 'epoch': 0.75}
 75%|███████▌  | 2588/3449 [2:01:59<39:29,  2.75s/it] 75%|███████▌  | 2589/3449 [2:02:01<39:02,  2.72s/it]                                                     {'loss': 1.0043, 'learning_rate': 6.162870062092323e-05, 'epoch': 0.75}
 75%|███████▌  | 2589/3449 [2:02:01<39:02,  2.72s/it] 75%|███████▌  | 2590/3449 [2:02:04<37:56,  2.65s/it]                                                     {'loss': 1.2011, 'learning_rate': 6.149329780461253e-05, 'epoch': 0.75}
 75%|███████▌  | 2590/3449 [2:02:04<37:56,  2.65s/it] 75%|███████▌  | 2591/3449 [2:02:07<38:52,  2.72s/it]                                                     {'loss': 1.2696, 'learning_rate': 6.135801687048016e-05, 'epoch': 0.75}
 75%|███████▌  | 2591/3449 [2:02:07<38:52,  2.72s/it] 75%|███████▌  | 2592/3449 [2:02:09<39:00,  2.73s/it]                                                     {'loss': 1.278, 'learning_rate': 6.122285793756972e-05, 'epoch': 0.75}
 75%|███████▌  | 2592/3449 [2:02:09<39:00,  2.73s/it] 75%|███████▌  | 2593/3449 [2:02:12<39:49,  2.79s/it]                                                     {'loss': 1.0575, 'learning_rate': 6.10878211248173e-05, 'epoch': 0.75}
 75%|███████▌  | 2593/3449 [2:02:12<39:49,  2.79s/it] 75%|███████▌  | 2594/3449 [2:02:15<39:31,  2.77s/it]                                                     {'loss': 1.2218, 'learning_rate': 6.095290655105181e-05, 'epoch': 0.75}
 75%|███████▌  | 2594/3449 [2:02:15<39:31,  2.77s/it] 75%|███████▌  | 2595/3449 [2:02:17<37:45,  2.65s/it]                                                     {'loss': 1.2548, 'learning_rate': 6.0818114334994515e-05, 'epoch': 0.75}
 75%|███████▌  | 2595/3449 [2:02:17<37:45,  2.65s/it] 75%|███████▌  | 2596/3449 [2:02:20<36:50,  2.59s/it]                                                     {'loss': 1.2603, 'learning_rate': 6.06834445952587e-05, 'epoch': 0.75}
 75%|███████▌  | 2596/3449 [2:02:20<36:50,  2.59s/it] 75%|███████▌  | 2597/3449 [2:02:23<38:10,  2.69s/it]                                                     {'loss': 1.1826, 'learning_rate': 6.054889745035035e-05, 'epoch': 0.75}
 75%|███████▌  | 2597/3449 [2:02:23<38:10,  2.69s/it] 75%|███████▌  | 2598/3449 [2:02:25<37:04,  2.61s/it]                                                     {'loss': 1.2524, 'learning_rate': 6.0414473018667293e-05, 'epoch': 0.75}
 75%|███████▌  | 2598/3449 [2:02:25<37:04,  2.61s/it] 75%|███████▌  | 2599/3449 [2:02:28<37:21,  2.64s/it]                                                     {'loss': 1.2308, 'learning_rate': 6.0280171418499335e-05, 'epoch': 0.75}
 75%|███████▌  | 2599/3449 [2:02:28<37:21,  2.64s/it] 75%|███████▌  | 2600/3449 [2:02:31<38:11,  2.70s/it]                                                     {'loss': 1.1688, 'learning_rate': 6.014599276802832e-05, 'epoch': 0.75}
 75%|███████▌  | 2600/3449 [2:02:31<38:11,  2.70s/it] 75%|███████▌  | 2601/3449 [2:02:34<39:19,  2.78s/it]                                                     {'loss': 1.1485, 'learning_rate': 6.001193718532785e-05, 'epoch': 0.75}
 75%|███████▌  | 2601/3449 [2:02:34<39:19,  2.78s/it] 75%|███████▌  | 2602/3449 [2:02:36<37:38,  2.67s/it]                                                     {'loss': 1.3991, 'learning_rate': 5.9878004788363274e-05, 'epoch': 0.75}
 75%|███████▌  | 2602/3449 [2:02:36<37:38,  2.67s/it] 75%|███████▌  | 2603/3449 [2:02:39<37:18,  2.65s/it]                                                     {'loss': 1.245, 'learning_rate': 5.974419569499146e-05, 'epoch': 0.75}
 75%|███████▌  | 2603/3449 [2:02:39<37:18,  2.65s/it] 76%|███████▌  | 2604/3449 [2:02:41<37:19,  2.65s/it]                                                     {'loss': 1.2605, 'learning_rate': 5.961051002296083e-05, 'epoch': 0.75}
 76%|███████▌  | 2604/3449 [2:02:41<37:19,  2.65s/it] 76%|███████▌  | 2605/3449 [2:02:44<38:05,  2.71s/it]                                                     {'loss': 1.0603, 'learning_rate': 5.947694788991121e-05, 'epoch': 0.76}
 76%|███████▌  | 2605/3449 [2:02:44<38:05,  2.71s/it] 76%|███████▌  | 2606/3449 [2:02:47<38:35,  2.75s/it]                                                     {'loss': 1.1784, 'learning_rate': 5.934350941337366e-05, 'epoch': 0.76}
 76%|███████▌  | 2606/3449 [2:02:47<38:35,  2.75s/it] 76%|███████▌  | 2607/3449 [2:02:50<38:39,  2.75s/it]                                                     {'loss': 1.2631, 'learning_rate': 5.9210194710770453e-05, 'epoch': 0.76}
 76%|███████▌  | 2607/3449 [2:02:50<38:39,  2.75s/it] 76%|███████▌  | 2608/3449 [2:02:52<37:15,  2.66s/it]                                                     {'loss': 1.2996, 'learning_rate': 5.9077003899414974e-05, 'epoch': 0.76}
 76%|███████▌  | 2608/3449 [2:02:52<37:15,  2.66s/it] 76%|███████▌  | 2609/3449 [2:02:55<39:09,  2.80s/it]                                                     {'loss': 1.1501, 'learning_rate': 5.894393709651162e-05, 'epoch': 0.76}
 76%|███████▌  | 2609/3449 [2:02:55<39:09,  2.80s/it] 76%|███████▌  | 2610/3449 [2:02:58<37:37,  2.69s/it]                                                     {'loss': 1.0041, 'learning_rate': 5.8810994419155406e-05, 'epoch': 0.76}
 76%|███████▌  | 2610/3449 [2:02:58<37:37,  2.69s/it] 76%|███████▌  | 2611/3449 [2:03:00<35:40,  2.55s/it]                                                     {'loss': 1.2601, 'learning_rate': 5.86781759843325e-05, 'epoch': 0.76}
 76%|███████▌  | 2611/3449 [2:03:00<35:40,  2.55s/it] 76%|███████▌  | 2612/3449 [2:03:03<37:26,  2.68s/it]                                                     {'loss': 1.1029, 'learning_rate': 5.854548190891955e-05, 'epoch': 0.76}
 76%|███████▌  | 2612/3449 [2:03:03<37:26,  2.68s/it] 76%|███████▌  | 2613/3449 [2:03:05<36:01,  2.59s/it]                                                     {'loss': 1.1472, 'learning_rate': 5.841291230968362e-05, 'epoch': 0.76}
 76%|███████▌  | 2613/3449 [2:03:05<36:01,  2.59s/it] 76%|███████▌  | 2614/3449 [2:03:08<36:11,  2.60s/it]                                                     {'loss': 1.1802, 'learning_rate': 5.828046730328263e-05, 'epoch': 0.76}
 76%|███████▌  | 2614/3449 [2:03:08<36:11,  2.60s/it] 76%|███████▌  | 2615/3449 [2:03:11<36:47,  2.65s/it]                                                     {'loss': 1.142, 'learning_rate': 5.8148147006264434e-05, 'epoch': 0.76}
 76%|███████▌  | 2615/3449 [2:03:11<36:47,  2.65s/it] 76%|███████▌  | 2616/3449 [2:03:14<38:33,  2.78s/it]                                                     {'loss': 1.2136, 'learning_rate': 5.801595153506743e-05, 'epoch': 0.76}
 76%|███████▌  | 2616/3449 [2:03:14<38:33,  2.78s/it] 76%|███████▌  | 2617/3449 [2:03:17<39:18,  2.83s/it]                                                     {'loss': 1.2713, 'learning_rate': 5.7883881006020044e-05, 'epoch': 0.76}
 76%|███████▌  | 2617/3449 [2:03:17<39:18,  2.83s/it] 76%|███████▌  | 2618/3449 [2:03:19<38:21,  2.77s/it]                                                     {'loss': 1.1968, 'learning_rate': 5.7751935535340816e-05, 'epoch': 0.76}
 76%|███████▌  | 2618/3449 [2:03:19<38:21,  2.77s/it] 76%|███████▌  | 2619/3449 [2:03:22<37:22,  2.70s/it]                                                     {'loss': 1.2695, 'learning_rate': 5.762011523913822e-05, 'epoch': 0.76}
 76%|███████▌  | 2619/3449 [2:03:22<37:22,  2.70s/it] 76%|███████▌  | 2620/3449 [2:03:25<36:57,  2.68s/it]                                                     {'loss': 1.2302, 'learning_rate': 5.748842023341059e-05, 'epoch': 0.76}
 76%|███████▌  | 2620/3449 [2:03:25<36:57,  2.68s/it] 76%|███████▌  | 2621/3449 [2:03:27<36:10,  2.62s/it]                                                     {'loss': 1.117, 'learning_rate': 5.7356850634045946e-05, 'epoch': 0.76}
 76%|███████▌  | 2621/3449 [2:03:27<36:10,  2.62s/it] 76%|███████▌  | 2622/3449 [2:03:30<36:43,  2.66s/it]                                                     {'loss': 1.2457, 'learning_rate': 5.722540655682205e-05, 'epoch': 0.76}
 76%|███████▌  | 2622/3449 [2:03:30<36:43,  2.66s/it] 76%|███████▌  | 2623/3449 [2:03:33<36:46,  2.67s/it]                                                     {'loss': 1.1785, 'learning_rate': 5.709408811740615e-05, 'epoch': 0.76}
 76%|███████▌  | 2623/3449 [2:03:33<36:46,  2.67s/it] 76%|███████▌  | 2624/3449 [2:03:35<37:05,  2.70s/it]                                                     {'loss': 1.2114, 'learning_rate': 5.696289543135493e-05, 'epoch': 0.76}
 76%|███████▌  | 2624/3449 [2:03:35<37:05,  2.70s/it] 76%|███████▌  | 2625/3449 [2:03:38<37:49,  2.75s/it]                                                     {'loss': 0.9919, 'learning_rate': 5.683182861411449e-05, 'epoch': 0.76}
 76%|███████▌  | 2625/3449 [2:03:38<37:49,  2.75s/it] 76%|███████▌  | 2626/3449 [2:03:41<37:20,  2.72s/it]                                                     {'loss': 1.2647, 'learning_rate': 5.6700887781020006e-05, 'epoch': 0.76}
 76%|███████▌  | 2626/3449 [2:03:41<37:20,  2.72s/it] 76%|███████▌  | 2627/3449 [2:03:44<36:57,  2.70s/it]                                                     {'loss': 0.9784, 'learning_rate': 5.657007304729589e-05, 'epoch': 0.76}
 76%|███████▌  | 2627/3449 [2:03:44<36:57,  2.70s/it] 76%|███████▌  | 2628/3449 [2:03:46<35:50,  2.62s/it]                                                     {'loss': 1.1214, 'learning_rate': 5.643938452805577e-05, 'epoch': 0.76}
 76%|███████▌  | 2628/3449 [2:03:46<35:50,  2.62s/it] 76%|███████▌  | 2629/3449 [2:03:49<36:40,  2.68s/it]                                                     {'loss': 1.1689, 'learning_rate': 5.630882233830186e-05, 'epoch': 0.76}
 76%|███████▌  | 2629/3449 [2:03:49<36:40,  2.68s/it] 76%|███████▋  | 2630/3449 [2:03:52<37:06,  2.72s/it]                                                     {'loss': 1.2165, 'learning_rate': 5.617838659292538e-05, 'epoch': 0.76}
 76%|███████▋  | 2630/3449 [2:03:52<37:06,  2.72s/it] 76%|███████▋  | 2631/3449 [2:03:55<38:58,  2.86s/it]                                                     {'loss': 1.3139, 'learning_rate': 5.6048077406706454e-05, 'epoch': 0.76}
 76%|███████▋  | 2631/3449 [2:03:55<38:58,  2.86s/it] 76%|███████▋  | 2632/3449 [2:03:58<39:03,  2.87s/it]                                                     {'loss': 1.2579, 'learning_rate': 5.591789489431349e-05, 'epoch': 0.76}
 76%|███████▋  | 2632/3449 [2:03:58<39:03,  2.87s/it] 76%|███████▋  | 2633/3449 [2:04:00<36:51,  2.71s/it]                                                     {'loss': 1.3661, 'learning_rate': 5.578783917030366e-05, 'epoch': 0.76}
 76%|███████▋  | 2633/3449 [2:04:00<36:51,  2.71s/it] 76%|███████▋  | 2634/3449 [2:04:02<35:51,  2.64s/it]                                                     {'loss': 1.2784, 'learning_rate': 5.5657910349122514e-05, 'epoch': 0.76}
 76%|███████▋  | 2634/3449 [2:04:02<35:51,  2.64s/it] 76%|███████▋  | 2635/3449 [2:04:05<34:43,  2.56s/it]                                                     {'loss': 1.2515, 'learning_rate': 5.552810854510393e-05, 'epoch': 0.76}
 76%|███████▋  | 2635/3449 [2:04:05<34:43,  2.56s/it] 76%|███████▋  | 2636/3449 [2:04:08<36:21,  2.68s/it]                                                     {'loss': 1.2787, 'learning_rate': 5.539843387246999e-05, 'epoch': 0.76}
 76%|███████▋  | 2636/3449 [2:04:08<36:21,  2.68s/it] 76%|███████▋  | 2637/3449 [2:04:11<36:38,  2.71s/it]                                                     {'loss': 1.2194, 'learning_rate': 5.526888644533095e-05, 'epoch': 0.76}
 76%|███████▋  | 2637/3449 [2:04:11<36:38,  2.71s/it] 76%|███████▋  | 2638/3449 [2:04:13<36:05,  2.67s/it]                                                     {'loss': 1.1129, 'learning_rate': 5.5139466377685056e-05, 'epoch': 0.76}
 76%|███████▋  | 2638/3449 [2:04:13<36:05,  2.67s/it] 77%|███████▋  | 2639/3449 [2:04:17<38:52,  2.88s/it]                                                     {'loss': 0.9603, 'learning_rate': 5.5010173783418554e-05, 'epoch': 0.77}
 77%|███████▋  | 2639/3449 [2:04:17<38:52,  2.88s/it] 77%|███████▋  | 2640/3449 [2:04:19<37:17,  2.77s/it]                                                     {'loss': 1.2793, 'learning_rate': 5.488100877630526e-05, 'epoch': 0.77}
 77%|███████▋  | 2640/3449 [2:04:19<37:17,  2.77s/it] 77%|███████▋  | 2641/3449 [2:04:22<38:06,  2.83s/it]                                                     {'loss': 1.2195, 'learning_rate': 5.4751971470007104e-05, 'epoch': 0.77}
 77%|███████▋  | 2641/3449 [2:04:22<38:06,  2.83s/it] 77%|███████▋  | 2642/3449 [2:04:25<37:02,  2.75s/it]                                                     {'loss': 1.274, 'learning_rate': 5.462306197807345e-05, 'epoch': 0.77}
 77%|███████▋  | 2642/3449 [2:04:25<37:02,  2.75s/it] 77%|███████▋  | 2643/3449 [2:04:27<35:02,  2.61s/it]                                                     {'loss': 1.1376, 'learning_rate': 5.449428041394107e-05, 'epoch': 0.77}
 77%|███████▋  | 2643/3449 [2:04:27<35:02,  2.61s/it] 77%|███████▋  | 2644/3449 [2:04:29<34:27,  2.57s/it]                                                     {'loss': 1.1399, 'learning_rate': 5.4365626890934276e-05, 'epoch': 0.77}
 77%|███████▋  | 2644/3449 [2:04:29<34:27,  2.57s/it] 77%|███████▋  | 2645/3449 [2:04:32<34:29,  2.57s/it]                                                     {'loss': 1.1648, 'learning_rate': 5.423710152226489e-05, 'epoch': 0.77}
 77%|███████▋  | 2645/3449 [2:04:32<34:29,  2.57s/it] 77%|███████▋  | 2646/3449 [2:04:35<36:07,  2.70s/it]                                                     {'loss': 1.2644, 'learning_rate': 5.410870442103162e-05, 'epoch': 0.77}
 77%|███████▋  | 2646/3449 [2:04:35<36:07,  2.70s/it] 77%|███████▋  | 2647/3449 [2:04:38<36:11,  2.71s/it]                                                     {'loss': 1.2653, 'learning_rate': 5.3980435700220445e-05, 'epoch': 0.77}
 77%|███████▋  | 2647/3449 [2:04:38<36:11,  2.71s/it] 77%|███████▋  | 2648/3449 [2:04:41<37:25,  2.80s/it]                                                     {'loss': 1.148, 'learning_rate': 5.3852295472704604e-05, 'epoch': 0.77}
 77%|███████▋  | 2648/3449 [2:04:41<37:25,  2.80s/it] 77%|███████▋  | 2649/3449 [2:04:43<37:01,  2.78s/it]                                                     {'loss': 1.1867, 'learning_rate': 5.372428385124386e-05, 'epoch': 0.77}
 77%|███████▋  | 2649/3449 [2:04:43<37:01,  2.78s/it] 77%|███████▋  | 2650/3449 [2:04:46<37:17,  2.80s/it]                                                     {'loss': 1.1829, 'learning_rate': 5.359640094848506e-05, 'epoch': 0.77}
 77%|███████▋  | 2650/3449 [2:04:46<37:17,  2.80s/it] 77%|███████▋  | 2651/3449 [2:04:49<37:22,  2.81s/it]                                                     {'loss': 1.2276, 'learning_rate': 5.3468646876961715e-05, 'epoch': 0.77}
 77%|███████▋  | 2651/3449 [2:04:49<37:22,  2.81s/it] 77%|███████▋  | 2652/3449 [2:04:54<47:35,  3.58s/it]                                                     {'loss': 1.2475, 'learning_rate': 5.334102174909401e-05, 'epoch': 0.77}
 77%|███████▋  | 2652/3449 [2:04:54<47:35,  3.58s/it] 77%|███████▋  | 2653/3449 [2:04:57<44:33,  3.36s/it]                                                     {'loss': 1.2415, 'learning_rate': 5.321352567718858e-05, 'epoch': 0.77}
 77%|███████▋  | 2653/3449 [2:04:57<44:33,  3.36s/it] 77%|███████▋  | 2654/3449 [2:05:00<40:57,  3.09s/it]                                                     {'loss': 1.1837, 'learning_rate': 5.308615877343859e-05, 'epoch': 0.77}
 77%|███████▋  | 2654/3449 [2:05:00<40:57,  3.09s/it] 77%|███████▋  | 2655/3449 [2:05:02<39:22,  2.98s/it]                                                     {'loss': 1.1706, 'learning_rate': 5.295892114992349e-05, 'epoch': 0.77}
 77%|███████▋  | 2655/3449 [2:05:02<39:22,  2.98s/it] 77%|███████▋  | 2656/3449 [2:05:06<39:58,  3.02s/it]                                                     {'loss': 1.165, 'learning_rate': 5.283181291860899e-05, 'epoch': 0.77}
 77%|███████▋  | 2656/3449 [2:05:06<39:58,  3.02s/it] 77%|███████▋  | 2657/3449 [2:05:08<38:04,  2.88s/it]                                                     {'loss': 1.3109, 'learning_rate': 5.27048341913468e-05, 'epoch': 0.77}
 77%|███████▋  | 2657/3449 [2:05:08<38:04,  2.88s/it] 77%|███████▋  | 2658/3449 [2:05:11<36:17,  2.75s/it]                                                     {'loss': 1.258, 'learning_rate': 5.2577985079874925e-05, 'epoch': 0.77}
 77%|███████▋  | 2658/3449 [2:05:11<36:17,  2.75s/it] 77%|███████▋  | 2659/3449 [2:05:13<35:30,  2.70s/it]                                                     {'loss': 1.114, 'learning_rate': 5.24512656958172e-05, 'epoch': 0.77}
 77%|███████▋  | 2659/3449 [2:05:13<35:30,  2.70s/it] 77%|███████▋  | 2660/3449 [2:05:16<34:57,  2.66s/it]                                                     {'loss': 1.1739, 'learning_rate': 5.232467615068313e-05, 'epoch': 0.77}
 77%|███████▋  | 2660/3449 [2:05:16<34:57,  2.66s/it] 77%|███████▋  | 2661/3449 [2:05:19<35:20,  2.69s/it]                                                     {'loss': 1.3554, 'learning_rate': 5.2198216555868206e-05, 'epoch': 0.77}
 77%|███████▋  | 2661/3449 [2:05:19<35:20,  2.69s/it] 77%|███████▋  | 2662/3449 [2:05:23<42:46,  3.26s/it]                                                     {'loss': 1.2852, 'learning_rate': 5.2071887022653466e-05, 'epoch': 0.77}
 77%|███████▋  | 2662/3449 [2:05:23<42:46,  3.26s/it] 77%|███████▋  | 2663/3449 [2:05:27<43:25,  3.31s/it]                                                     {'loss': 1.0173, 'learning_rate': 5.194568766220551e-05, 'epoch': 0.77}
 77%|███████▋  | 2663/3449 [2:05:27<43:25,  3.31s/it] 77%|███████▋  | 2664/3449 [2:05:29<40:11,  3.07s/it]                                                     {'loss': 1.2515, 'learning_rate': 5.181961858557638e-05, 'epoch': 0.77}
 77%|███████▋  | 2664/3449 [2:05:29<40:11,  3.07s/it] 77%|███████▋  | 2665/3449 [2:05:32<38:08,  2.92s/it]                                                     {'loss': 1.2136, 'learning_rate': 5.169367990370348e-05, 'epoch': 0.77}
 77%|███████▋  | 2665/3449 [2:05:32<38:08,  2.92s/it] 77%|███████▋  | 2666/3449 [2:05:35<38:26,  2.95s/it]                                                     {'loss': 1.0939, 'learning_rate': 5.1567871727409464e-05, 'epoch': 0.77}
 77%|███████▋  | 2666/3449 [2:05:35<38:26,  2.95s/it] 77%|███████▋  | 2667/3449 [2:05:37<35:54,  2.75s/it]                                                     {'loss': 1.3204, 'learning_rate': 5.144219416740217e-05, 'epoch': 0.77}
 77%|███████▋  | 2667/3449 [2:05:37<35:54,  2.75s/it] 77%|███████▋  | 2668/3449 [2:05:39<33:34,  2.58s/it]                                                     {'loss': 1.1852, 'learning_rate': 5.1316647334274435e-05, 'epoch': 0.77}
 77%|███████▋  | 2668/3449 [2:05:39<33:34,  2.58s/it] 77%|███████▋  | 2669/3449 [2:05:42<33:39,  2.59s/it]                                                     {'loss': 1.2533, 'learning_rate': 5.119123133850412e-05, 'epoch': 0.77}
 77%|███████▋  | 2669/3449 [2:05:42<33:39,  2.59s/it] 77%|███████▋  | 2670/3449 [2:05:45<36:01,  2.77s/it]                                                     {'loss': 1.2027, 'learning_rate': 5.106594629045396e-05, 'epoch': 0.77}
 77%|███████▋  | 2670/3449 [2:05:45<36:01,  2.77s/it] 77%|███████▋  | 2671/3449 [2:05:48<35:49,  2.76s/it]                                                     {'loss': 1.1299, 'learning_rate': 5.0940792300371385e-05, 'epoch': 0.77}
 77%|███████▋  | 2671/3449 [2:05:48<35:49,  2.76s/it] 77%|███████▋  | 2672/3449 [2:05:50<34:19,  2.65s/it]                                                     {'loss': 1.2643, 'learning_rate': 5.081576947838866e-05, 'epoch': 0.77}
 77%|███████▋  | 2672/3449 [2:05:50<34:19,  2.65s/it] 78%|███████▊  | 2673/3449 [2:05:53<33:45,  2.61s/it]                                                     {'loss': 1.2406, 'learning_rate': 5.069087793452234e-05, 'epoch': 0.77}
 78%|███████▊  | 2673/3449 [2:05:53<33:45,  2.61s/it] 78%|███████▊  | 2674/3449 [2:05:55<33:38,  2.60s/it]                                                     {'loss': 1.2365, 'learning_rate': 5.056611777867366e-05, 'epoch': 0.78}
 78%|███████▊  | 2674/3449 [2:05:55<33:38,  2.60s/it] 78%|███████▊  | 2675/3449 [2:05:58<32:40,  2.53s/it]                                                     {'loss': 1.3931, 'learning_rate': 5.044148912062836e-05, 'epoch': 0.78}
 78%|███████▊  | 2675/3449 [2:05:58<32:40,  2.53s/it] 78%|███████▊  | 2676/3449 [2:06:00<33:27,  2.60s/it]                                                     {'loss': 1.3334, 'learning_rate': 5.0316992070056155e-05, 'epoch': 0.78}
 78%|███████▊  | 2676/3449 [2:06:00<33:27,  2.60s/it] 78%|███████▊  | 2677/3449 [2:06:03<34:49,  2.71s/it]                                                     {'loss': 1.2041, 'learning_rate': 5.019262673651117e-05, 'epoch': 0.78}
 78%|███████▊  | 2677/3449 [2:06:03<34:49,  2.71s/it] 78%|███████▊  | 2678/3449 [2:06:06<35:24,  2.76s/it]                                                     {'loss': 1.1617, 'learning_rate': 5.0068393229431556e-05, 'epoch': 0.78}
 78%|███████▊  | 2678/3449 [2:06:06<35:24,  2.76s/it] 78%|███████▊  | 2679/3449 [2:06:09<34:08,  2.66s/it]                                                     {'loss': 1.1459, 'learning_rate': 4.994429165813943e-05, 'epoch': 0.78}
 78%|███████▊  | 2679/3449 [2:06:09<34:08,  2.66s/it] 78%|███████▊  | 2680/3449 [2:06:11<34:11,  2.67s/it]                                                     {'loss': 1.2761, 'learning_rate': 4.982032213184089e-05, 'epoch': 0.78}
 78%|███████▊  | 2680/3449 [2:06:11<34:11,  2.67s/it] 78%|███████▊  | 2681/3449 [2:06:14<33:27,  2.61s/it]                                                     {'loss': 1.5341, 'learning_rate': 4.969648475962576e-05, 'epoch': 0.78}
 78%|███████▊  | 2681/3449 [2:06:14<33:27,  2.61s/it] 78%|███████▊  | 2682/3449 [2:06:17<36:00,  2.82s/it]                                                     {'loss': 1.2354, 'learning_rate': 4.9572779650467605e-05, 'epoch': 0.78}
 78%|███████▊  | 2682/3449 [2:06:17<36:00,  2.82s/it] 78%|███████▊  | 2683/3449 [2:06:20<36:21,  2.85s/it]                                                     {'loss': 1.2131, 'learning_rate': 4.944920691322361e-05, 'epoch': 0.78}
 78%|███████▊  | 2683/3449 [2:06:20<36:21,  2.85s/it] 78%|███████▊  | 2684/3449 [2:06:23<37:11,  2.92s/it]                                                     {'loss': 1.1723, 'learning_rate': 4.9325766656634444e-05, 'epoch': 0.78}
 78%|███████▊  | 2684/3449 [2:06:23<37:11,  2.92s/it] 78%|███████▊  | 2685/3449 [2:06:26<37:21,  2.93s/it]                                                     {'loss': 1.3538, 'learning_rate': 4.920245898932425e-05, 'epoch': 0.78}
 78%|███████▊  | 2685/3449 [2:06:26<37:21,  2.93s/it] 78%|███████▊  | 2686/3449 [2:06:31<44:05,  3.47s/it]                                                     {'loss': 1.2029, 'learning_rate': 4.9079284019800506e-05, 'epoch': 0.78}
 78%|███████▊  | 2686/3449 [2:06:31<44:05,  3.47s/it] 78%|███████▊  | 2687/3449 [2:06:33<40:32,  3.19s/it]                                                     {'loss': 1.2235, 'learning_rate': 4.895624185645369e-05, 'epoch': 0.78}
 78%|███████▊  | 2687/3449 [2:06:33<40:32,  3.19s/it] 78%|███████▊  | 2688/3449 [2:06:36<37:10,  2.93s/it]                                                     {'loss': 1.321, 'learning_rate': 4.883333260755778e-05, 'epoch': 0.78}
 78%|███████▊  | 2688/3449 [2:06:36<37:10,  2.93s/it] 78%|███████▊  | 2689/3449 [2:06:39<38:03,  3.00s/it]                                                     {'loss': 1.1358, 'learning_rate': 4.871055638126964e-05, 'epoch': 0.78}
 78%|███████▊  | 2689/3449 [2:06:39<38:03,  3.00s/it] 78%|███████▊  | 2690/3449 [2:06:41<36:06,  2.85s/it]                                                     {'loss': 1.3047, 'learning_rate': 4.858791328562891e-05, 'epoch': 0.78}
 78%|███████▊  | 2690/3449 [2:06:41<36:06,  2.85s/it] 78%|███████▊  | 2691/3449 [2:06:44<36:12,  2.87s/it]                                                     {'loss': 1.2765, 'learning_rate': 4.846540342855823e-05, 'epoch': 0.78}
 78%|███████▊  | 2691/3449 [2:06:44<36:12,  2.87s/it] 78%|███████▊  | 2692/3449 [2:06:47<34:29,  2.73s/it]                                                     {'loss': 1.2646, 'learning_rate': 4.834302691786314e-05, 'epoch': 0.78}
 78%|███████▊  | 2692/3449 [2:06:47<34:29,  2.73s/it] 78%|███████▊  | 2693/3449 [2:06:50<38:18,  3.04s/it]                                                     {'loss': 1.2108, 'learning_rate': 4.822078386123154e-05, 'epoch': 0.78}
 78%|███████▊  | 2693/3449 [2:06:50<38:18,  3.04s/it] 78%|███████▊  | 2694/3449 [2:06:53<37:21,  2.97s/it]                                                     {'loss': 1.2252, 'learning_rate': 4.809867436623408e-05, 'epoch': 0.78}
 78%|███████▊  | 2694/3449 [2:06:53<37:21,  2.97s/it] 78%|███████▊  | 2695/3449 [2:06:56<37:08,  2.96s/it]                                                     {'loss': 1.2898, 'learning_rate': 4.797669854032383e-05, 'epoch': 0.78}
 78%|███████▊  | 2695/3449 [2:06:56<37:08,  2.96s/it] 78%|███████▊  | 2696/3449 [2:06:59<35:21,  2.82s/it]                                                     {'loss': 1.0925, 'learning_rate': 4.7854856490836255e-05, 'epoch': 0.78}
 78%|███████▊  | 2696/3449 [2:06:59<35:21,  2.82s/it] 78%|███████▊  | 2697/3449 [2:07:01<35:28,  2.83s/it]                                                     {'loss': 1.2303, 'learning_rate': 4.7733148324989076e-05, 'epoch': 0.78}
 78%|███████▊  | 2697/3449 [2:07:01<35:28,  2.83s/it] 78%|███████▊  | 2698/3449 [2:07:04<35:25,  2.83s/it]                                                     {'loss': 1.2648, 'learning_rate': 4.76115741498822e-05, 'epoch': 0.78}
 78%|███████▊  | 2698/3449 [2:07:04<35:25,  2.83s/it] 78%|███████▊  | 2699/3449 [2:07:07<33:59,  2.72s/it]                                                     {'loss': 1.3039, 'learning_rate': 4.749013407249767e-05, 'epoch': 0.78}
 78%|███████▊  | 2699/3449 [2:07:07<33:59,  2.72s/it] 78%|███████▊  | 2700/3449 [2:07:10<36:06,  2.89s/it]                                                     {'loss': 1.0974, 'learning_rate': 4.736882819969952e-05, 'epoch': 0.78}
 78%|███████▊  | 2700/3449 [2:07:10<36:06,  2.89s/it] 78%|███████▊  | 2701/3449 [2:07:12<34:32,  2.77s/it]                                                     {'loss': 1.174, 'learning_rate': 4.7247656638233496e-05, 'epoch': 0.78}
 78%|███████▊  | 2701/3449 [2:07:12<34:32,  2.77s/it] 78%|███████▊  | 2702/3449 [2:07:15<34:38,  2.78s/it]                                                     {'loss': 1.3118, 'learning_rate': 4.71266194947275e-05, 'epoch': 0.78}
 78%|███████▊  | 2702/3449 [2:07:15<34:38,  2.78s/it] 78%|███████▊  | 2703/3449 [2:07:18<35:42,  2.87s/it]                                                     {'loss': 1.1198, 'learning_rate': 4.700571687569095e-05, 'epoch': 0.78}
 78%|███████▊  | 2703/3449 [2:07:18<35:42,  2.87s/it] 78%|███████▊  | 2704/3449 [2:07:21<36:24,  2.93s/it]                                                     {'loss': 1.0746, 'learning_rate': 4.688494888751473e-05, 'epoch': 0.78}
 78%|███████▊  | 2704/3449 [2:07:21<36:24,  2.93s/it] 78%|███████▊  | 2705/3449 [2:07:24<34:12,  2.76s/it]                                                     {'loss': 1.1661, 'learning_rate': 4.676431563647163e-05, 'epoch': 0.78}
 78%|███████▊  | 2705/3449 [2:07:24<34:12,  2.76s/it] 78%|███████▊  | 2706/3449 [2:07:27<34:50,  2.81s/it]                                                     {'loss': 1.0777, 'learning_rate': 4.664381722871565e-05, 'epoch': 0.78}
 78%|███████▊  | 2706/3449 [2:07:27<34:50,  2.81s/it] 78%|███████▊  | 2707/3449 [2:07:30<37:23,  3.02s/it]                                                     {'loss': 1.2018, 'learning_rate': 4.6523453770282046e-05, 'epoch': 0.78}
 78%|███████▊  | 2707/3449 [2:07:30<37:23,  3.02s/it] 79%|███████▊  | 2708/3449 [2:07:33<35:56,  2.91s/it]                                                     {'loss': 1.2959, 'learning_rate': 4.640322536708741e-05, 'epoch': 0.79}
 79%|███████▊  | 2708/3449 [2:07:33<35:56,  2.91s/it] 79%|███████▊  | 2709/3449 [2:07:35<34:05,  2.76s/it]                                                     {'loss': 1.1067, 'learning_rate': 4.6283132124929694e-05, 'epoch': 0.79}
 79%|███████▊  | 2709/3449 [2:07:35<34:05,  2.76s/it] 79%|███████▊  | 2710/3449 [2:07:38<32:19,  2.63s/it]                                                     {'loss': 1.3934, 'learning_rate': 4.616317414948754e-05, 'epoch': 0.79}
 79%|███████▊  | 2710/3449 [2:07:38<32:19,  2.63s/it] 79%|███████▊  | 2711/3449 [2:07:40<32:45,  2.66s/it]                                                     {'loss': 1.224, 'learning_rate': 4.604335154632085e-05, 'epoch': 0.79}
 79%|███████▊  | 2711/3449 [2:07:40<32:45,  2.66s/it] 79%|███████▊  | 2712/3449 [2:07:43<34:04,  2.77s/it]                                                     {'loss': 1.1476, 'learning_rate': 4.592366442087022e-05, 'epoch': 0.79}
 79%|███████▊  | 2712/3449 [2:07:43<34:04,  2.77s/it] 79%|███████▊  | 2713/3449 [2:07:47<36:20,  2.96s/it]                                                     {'loss': 1.1146, 'learning_rate': 4.580411287845718e-05, 'epoch': 0.79}
 79%|███████▊  | 2713/3449 [2:07:47<36:20,  2.96s/it] 79%|███████▊  | 2714/3449 [2:07:49<34:46,  2.84s/it]                                                     {'loss': 1.0812, 'learning_rate': 4.5684697024283816e-05, 'epoch': 0.79}
 79%|███████▊  | 2714/3449 [2:07:49<34:46,  2.84s/it] 79%|███████▊  | 2715/3449 [2:07:52<35:30,  2.90s/it]                                                     {'loss': 1.1077, 'learning_rate': 4.5565416963432926e-05, 'epoch': 0.79}
 79%|███████▊  | 2715/3449 [2:07:52<35:30,  2.90s/it] 79%|███████▊  | 2716/3449 [2:07:55<34:48,  2.85s/it]                                                     {'loss': 1.2791, 'learning_rate': 4.544627280086773e-05, 'epoch': 0.79}
 79%|███████▊  | 2716/3449 [2:07:55<34:48,  2.85s/it] 79%|███████▉  | 2717/3449 [2:07:57<32:03,  2.63s/it]                                                     {'loss': 1.3538, 'learning_rate': 4.532726464143195e-05, 'epoch': 0.79}
 79%|███████▉  | 2717/3449 [2:07:57<32:03,  2.63s/it] 79%|███████▉  | 2718/3449 [2:08:03<42:27,  3.48s/it]                                                     {'loss': 1.0854, 'learning_rate': 4.520839258984939e-05, 'epoch': 0.79}
 79%|███████▉  | 2718/3449 [2:08:03<42:27,  3.48s/it] 79%|███████▉  | 2719/3449 [2:08:06<40:06,  3.30s/it]                                                     {'loss': 1.272, 'learning_rate': 4.508965675072448e-05, 'epoch': 0.79}
 79%|███████▉  | 2719/3449 [2:08:06<40:06,  3.30s/it] 79%|███████▉  | 2720/3449 [2:08:08<37:30,  3.09s/it]                                                     {'loss': 1.1717, 'learning_rate': 4.497105722854151e-05, 'epoch': 0.79}
 79%|███████▉  | 2720/3449 [2:08:08<37:30,  3.09s/it] 79%|███████▉  | 2721/3449 [2:08:11<36:11,  2.98s/it]                                                     {'loss': 1.1579, 'learning_rate': 4.485259412766474e-05, 'epoch': 0.79}
 79%|███████▉  | 2721/3449 [2:08:11<36:11,  2.98s/it] 79%|███████▉  | 2722/3449 [2:08:14<36:09,  2.98s/it]                                                     {'loss': 1.2702, 'learning_rate': 4.473426755233872e-05, 'epoch': 0.79}
 79%|███████▉  | 2722/3449 [2:08:14<36:09,  2.98s/it] 79%|███████▉  | 2723/3449 [2:08:17<36:01,  2.98s/it]                                                     {'loss': 1.139, 'learning_rate': 4.461607760668751e-05, 'epoch': 0.79}
 79%|███████▉  | 2723/3449 [2:08:17<36:01,  2.98s/it] 79%|███████▉  | 2724/3449 [2:08:19<34:28,  2.85s/it]                                                     {'loss': 1.2868, 'learning_rate': 4.449802439471516e-05, 'epoch': 0.79}
 79%|███████▉  | 2724/3449 [2:08:19<34:28,  2.85s/it] 79%|███████▉  | 2725/3449 [2:08:23<36:16,  3.01s/it]                                                     {'loss': 1.2033, 'learning_rate': 4.438010802030528e-05, 'epoch': 0.79}
 79%|███████▉  | 2725/3449 [2:08:23<36:16,  3.01s/it] 79%|███████▉  | 2726/3449 [2:08:26<36:34,  3.03s/it]                                                     {'loss': 1.18, 'learning_rate': 4.4262328587221144e-05, 'epoch': 0.79}
 79%|███████▉  | 2726/3449 [2:08:26<36:34,  3.03s/it] 79%|███████▉  | 2727/3449 [2:08:29<36:12,  3.01s/it]                                                     {'loss': 1.1423, 'learning_rate': 4.41446861991055e-05, 'epoch': 0.79}
 79%|███████▉  | 2727/3449 [2:08:29<36:12,  3.01s/it] 79%|███████▉  | 2728/3449 [2:08:32<35:01,  2.92s/it]                                                     {'loss': 1.2292, 'learning_rate': 4.4027180959480463e-05, 'epoch': 0.79}
 79%|███████▉  | 2728/3449 [2:08:32<35:01,  2.92s/it] 79%|███████▉  | 2729/3449 [2:08:34<34:29,  2.87s/it]                                                     {'loss': 1.0945, 'learning_rate': 4.39098129717475e-05, 'epoch': 0.79}
 79%|███████▉  | 2729/3449 [2:08:34<34:29,  2.87s/it] 79%|███████▉  | 2730/3449 [2:08:37<35:01,  2.92s/it]                                                     {'loss': 1.2777, 'learning_rate': 4.3792582339187285e-05, 'epoch': 0.79}
 79%|███████▉  | 2730/3449 [2:08:37<35:01,  2.92s/it] 79%|███████▉  | 2731/3449 [2:08:40<33:27,  2.80s/it]                                                     {'loss': 1.3225, 'learning_rate': 4.367548916495963e-05, 'epoch': 0.79}
 79%|███████▉  | 2731/3449 [2:08:40<33:27,  2.80s/it] 79%|███████▉  | 2732/3449 [2:08:42<31:36,  2.64s/it]                                                     {'loss': 1.3052, 'learning_rate': 4.3558533552103376e-05, 'epoch': 0.79}
 79%|███████▉  | 2732/3449 [2:08:42<31:36,  2.64s/it] 79%|███████▉  | 2733/3449 [2:08:45<31:14,  2.62s/it]                                                     {'loss': 1.091, 'learning_rate': 4.34417156035364e-05, 'epoch': 0.79}
 79%|███████▉  | 2733/3449 [2:08:45<31:14,  2.62s/it] 79%|███████▉  | 2734/3449 [2:08:47<30:22,  2.55s/it]                                                     {'loss': 1.3228, 'learning_rate': 4.332503542205522e-05, 'epoch': 0.79}
 79%|███████▉  | 2734/3449 [2:08:47<30:22,  2.55s/it] 79%|███████▉  | 2735/3449 [2:08:50<30:30,  2.56s/it]                                                     {'loss': 1.2451, 'learning_rate': 4.3208493110335276e-05, 'epoch': 0.79}
 79%|███████▉  | 2735/3449 [2:08:50<30:30,  2.56s/it] 79%|███████▉  | 2736/3449 [2:08:53<31:57,  2.69s/it]                                                     {'loss': 1.2073, 'learning_rate': 4.309208877093085e-05, 'epoch': 0.79}
 79%|███████▉  | 2736/3449 [2:08:53<31:57,  2.69s/it] 79%|███████▉  | 2737/3449 [2:08:55<31:19,  2.64s/it]                                                     {'loss': 1.2054, 'learning_rate': 4.2975822506274435e-05, 'epoch': 0.79}
 79%|███████▉  | 2737/3449 [2:08:55<31:19,  2.64s/it] 79%|███████▉  | 2738/3449 [2:08:58<30:48,  2.60s/it]                                                     {'loss': 1.2593, 'learning_rate': 4.2859694418677255e-05, 'epoch': 0.79}
 79%|███████▉  | 2738/3449 [2:08:58<30:48,  2.60s/it] 79%|███████▉  | 2739/3449 [2:09:01<31:51,  2.69s/it]                                                     {'loss': 1.1792, 'learning_rate': 4.274370461032906e-05, 'epoch': 0.79}
 79%|███████▉  | 2739/3449 [2:09:01<31:51,  2.69s/it] 79%|███████▉  | 2740/3449 [2:09:04<33:15,  2.81s/it]                                                     {'loss': 1.3281, 'learning_rate': 4.262785318329758e-05, 'epoch': 0.79}
 79%|███████▉  | 2740/3449 [2:09:04<33:15,  2.81s/it] 79%|███████▉  | 2741/3449 [2:09:07<35:17,  2.99s/it]                                                     {'loss': 1.2143, 'learning_rate': 4.251214023952908e-05, 'epoch': 0.79}
 79%|███████▉  | 2741/3449 [2:09:07<35:17,  2.99s/it] 80%|███████▉  | 2742/3449 [2:09:10<33:55,  2.88s/it]                                                     {'loss': 1.3326, 'learning_rate': 4.2396565880847774e-05, 'epoch': 0.79}
 80%|███████▉  | 2742/3449 [2:09:10<33:55,  2.88s/it] 80%|███████▉  | 2743/3449 [2:09:13<34:42,  2.95s/it]                                                     {'loss': 1.072, 'learning_rate': 4.228113020895601e-05, 'epoch': 0.8}
 80%|███████▉  | 2743/3449 [2:09:13<34:42,  2.95s/it] 80%|███████▉  | 2744/3449 [2:09:15<33:37,  2.86s/it]                                                     {'loss': 1.1603, 'learning_rate': 4.216583332543411e-05, 'epoch': 0.8}
 80%|███████▉  | 2744/3449 [2:09:15<33:37,  2.86s/it] 80%|███████▉  | 2745/3449 [2:09:19<35:05,  2.99s/it]                                                     {'loss': 1.1859, 'learning_rate': 4.205067533174021e-05, 'epoch': 0.8}
 80%|███████▉  | 2745/3449 [2:09:19<35:05,  2.99s/it] 80%|███████▉  | 2746/3449 [2:09:22<37:14,  3.18s/it]                                                     {'loss': 1.1029, 'learning_rate': 4.193565632921026e-05, 'epoch': 0.8}
 80%|███████▉  | 2746/3449 [2:09:22<37:14,  3.18s/it] 80%|███████▉  | 2747/3449 [2:09:25<36:08,  3.09s/it]                                                     {'loss': 1.3172, 'learning_rate': 4.182077641905793e-05, 'epoch': 0.8}
 80%|███████▉  | 2747/3449 [2:09:25<36:08,  3.09s/it] 80%|███████▉  | 2748/3449 [2:09:28<35:14,  3.02s/it]                                                     {'loss': 1.2057, 'learning_rate': 4.170603570237432e-05, 'epoch': 0.8}
 80%|███████▉  | 2748/3449 [2:09:28<35:14,  3.02s/it] 80%|███████▉  | 2749/3449 [2:09:32<39:48,  3.41s/it]                                                     {'loss': 1.2616, 'learning_rate': 4.1591434280128327e-05, 'epoch': 0.8}
 80%|███████▉  | 2749/3449 [2:09:32<39:48,  3.41s/it] 80%|███████▉  | 2750/3449 [2:09:35<37:49,  3.25s/it]                                                     {'loss': 1.1938, 'learning_rate': 4.147697225316611e-05, 'epoch': 0.8}
 80%|███████▉  | 2750/3449 [2:09:35<37:49,  3.25s/it] 80%|███████▉  | 2751/3449 [2:09:38<36:37,  3.15s/it]                                                     {'loss': 1.0622, 'learning_rate': 4.136264972221111e-05, 'epoch': 0.8}
 80%|███████▉  | 2751/3449 [2:09:38<36:37,  3.15s/it] 80%|███████▉  | 2752/3449 [2:09:42<37:52,  3.26s/it]                                                     {'loss': 1.1518, 'learning_rate': 4.124846678786405e-05, 'epoch': 0.8}
 80%|███████▉  | 2752/3449 [2:09:42<37:52,  3.26s/it] 80%|███████▉  | 2753/3449 [2:09:45<36:03,  3.11s/it]                                                     {'loss': 1.2, 'learning_rate': 4.113442355060302e-05, 'epoch': 0.8}
 80%|███████▉  | 2753/3449 [2:09:45<36:03,  3.11s/it] 80%|███████▉  | 2754/3449 [2:09:47<34:11,  2.95s/it]                                                     {'loss': 1.1909, 'learning_rate': 4.1020520110782835e-05, 'epoch': 0.8}
 80%|███████▉  | 2754/3449 [2:09:47<34:11,  2.95s/it] 80%|███████▉  | 2755/3449 [2:09:50<32:31,  2.81s/it]                                                     {'loss': 1.3392, 'learning_rate': 4.09067565686355e-05, 'epoch': 0.8}
 80%|███████▉  | 2755/3449 [2:09:50<32:31,  2.81s/it] 80%|███████▉  | 2756/3449 [2:09:53<33:52,  2.93s/it]                                                     {'loss': 1.1112, 'learning_rate': 4.09067565686355e-05, 'epoch': 0.8}
 80%|███████▉  | 2756/3449 [2:09:53<33:52,  2.93s/it] 80%|███████▉  | 2757/3449 [2:09:56<33:38,  2.92s/it]                                                     {'loss': 1.1768, 'learning_rate': 4.079313302426999e-05, 'epoch': 0.8}
 80%|███████▉  | 2757/3449 [2:09:56<33:38,  2.92s/it] 80%|███████▉  | 2758/3449 [2:09:58<31:45,  2.76s/it]                                                     {'loss': 1.1361, 'learning_rate': 4.067964957767183e-05, 'epoch': 0.8}
 80%|███████▉  | 2758/3449 [2:09:58<31:45,  2.76s/it] 80%|███████▉  | 2759/3449 [2:10:02<35:53,  3.12s/it]                                                     {'loss': 1.2663, 'learning_rate': 4.056630632870346e-05, 'epoch': 0.8}
 80%|███████▉  | 2759/3449 [2:10:02<35:53,  3.12s/it] 80%|████████  | 2760/3449 [2:10:05<35:58,  3.13s/it]                                                     {'loss': 1.0972, 'learning_rate': 4.045310337710391e-05, 'epoch': 0.8}
 80%|████████  | 2760/3449 [2:10:05<35:58,  3.13s/it] 80%|████████  | 2761/3449 [2:10:08<33:48,  2.95s/it]                                                     {'loss': 1.092, 'learning_rate': 4.03400408224887e-05, 'epoch': 0.8}
 80%|████████  | 2761/3449 [2:10:08<33:48,  2.95s/it] 80%|████████  | 2762/3449 [2:10:12<38:16,  3.34s/it]                                                     {'loss': 1.1777, 'learning_rate': 4.022711876434992e-05, 'epoch': 0.8}
 80%|████████  | 2762/3449 [2:10:12<38:16,  3.34s/it] 80%|████████  | 2763/3449 [2:10:16<38:55,  3.40s/it]                                                     {'loss': 1.1703, 'learning_rate': 4.01143373020558e-05, 'epoch': 0.8}
 80%|████████  | 2763/3449 [2:10:16<38:55,  3.40s/it] 80%|████████  | 2764/3449 [2:10:18<35:33,  3.11s/it]                                                     {'loss': 1.0524, 'learning_rate': 4.000169653485115e-05, 'epoch': 0.8}
 80%|████████  | 2764/3449 [2:10:18<35:33,  3.11s/it] 80%|████████  | 2765/3449 [2:10:21<35:00,  3.07s/it]                                                     {'loss': 1.0712, 'learning_rate': 3.9889196561856815e-05, 'epoch': 0.8}
 80%|████████  | 2765/3449 [2:10:21<35:00,  3.07s/it] 80%|████████  | 2766/3449 [2:10:24<33:15,  2.92s/it]                                                     {'loss': 1.1809, 'learning_rate': 3.9776837482069574e-05, 'epoch': 0.8}
 80%|████████  | 2766/3449 [2:10:24<33:15,  2.92s/it] 80%|████████  | 2767/3449 [2:10:27<34:59,  3.08s/it]                                                     {'loss': 1.0081, 'learning_rate': 3.966461939436259e-05, 'epoch': 0.8}
 80%|████████  | 2767/3449 [2:10:27<34:59,  3.08s/it] 80%|████████  | 2768/3449 [2:10:30<34:18,  3.02s/it]                                                     {'loss': 1.385, 'learning_rate': 3.955254239748474e-05, 'epoch': 0.8}
 80%|████████  | 2768/3449 [2:10:30<34:18,  3.02s/it] 80%|████████  | 2769/3449 [2:10:33<33:54,  2.99s/it]                                                     {'loss': 1.1951, 'learning_rate': 3.94406065900607e-05, 'epoch': 0.8}
 80%|████████  | 2769/3449 [2:10:33<33:54,  2.99s/it] 80%|████████  | 2770/3449 [2:10:35<31:57,  2.82s/it]                                                     {'loss': 1.3553, 'learning_rate': 3.932881207059098e-05, 'epoch': 0.8}
 80%|████████  | 2770/3449 [2:10:35<31:57,  2.82s/it] 80%|████████  | 2771/3449 [2:10:38<32:43,  2.90s/it]                                                     {'loss': 1.2853, 'learning_rate': 3.921715893745179e-05, 'epoch': 0.8}
 80%|████████  | 2771/3449 [2:10:38<32:43,  2.90s/it] 80%|████████  | 2772/3449 [2:10:41<31:20,  2.78s/it]                                                     {'loss': 1.2334, 'learning_rate': 3.9105647288894873e-05, 'epoch': 0.8}
 80%|████████  | 2772/3449 [2:10:41<31:20,  2.78s/it] 80%|████████  | 2773/3449 [2:10:43<31:06,  2.76s/it]                                                     {'loss': 1.2859, 'learning_rate': 3.8994277223047496e-05, 'epoch': 0.8}
 80%|████████  | 2773/3449 [2:10:43<31:06,  2.76s/it] 80%|████████  | 2774/3449 [2:10:46<29:40,  2.64s/it]                                                     {'loss': 1.2355, 'learning_rate': 3.888304883791232e-05, 'epoch': 0.8}
 80%|████████  | 2774/3449 [2:10:46<29:40,  2.64s/it] 80%|████████  | 2775/3449 [2:10:49<31:43,  2.82s/it]                                                     {'loss': 1.2977, 'learning_rate': 3.8771962231367344e-05, 'epoch': 0.8}
 80%|████████  | 2775/3449 [2:10:49<31:43,  2.82s/it] 80%|████████  | 2776/3449 [2:10:52<31:08,  2.78s/it]                                                     {'loss': 1.2628, 'learning_rate': 3.8661017501165794e-05, 'epoch': 0.8}
 80%|████████  | 2776/3449 [2:10:52<31:08,  2.78s/it] 81%|████████  | 2777/3449 [2:10:55<31:17,  2.79s/it]                                                     {'loss': 1.2573, 'learning_rate': 3.855021474493603e-05, 'epoch': 0.81}
 81%|████████  | 2777/3449 [2:10:55<31:17,  2.79s/it] 81%|████████  | 2778/3449 [2:10:57<29:46,  2.66s/it]                                                     {'loss': 1.3241, 'learning_rate': 3.843955406018154e-05, 'epoch': 0.81}
 81%|████████  | 2778/3449 [2:10:57<29:46,  2.66s/it] 81%|████████  | 2779/3449 [2:10:59<28:20,  2.54s/it]                                                     {'loss': 1.11, 'learning_rate': 3.832903554428078e-05, 'epoch': 0.81}
 81%|████████  | 2779/3449 [2:10:59<28:20,  2.54s/it] 81%|████████  | 2780/3449 [2:11:02<28:29,  2.56s/it]                                                     {'loss': 1.2721, 'learning_rate': 3.821865929448694e-05, 'epoch': 0.81}
 81%|████████  | 2780/3449 [2:11:02<28:29,  2.56s/it] 81%|████████  | 2781/3449 [2:11:04<28:48,  2.59s/it]                                                     {'loss': 1.3148, 'learning_rate': 3.8108425407928293e-05, 'epoch': 0.81}
 81%|████████  | 2781/3449 [2:11:04<28:48,  2.59s/it] 81%|████████  | 2782/3449 [2:11:07<28:40,  2.58s/it]                                                     {'loss': 1.3119, 'learning_rate': 3.799833398160773e-05, 'epoch': 0.81}
 81%|████████  | 2782/3449 [2:11:07<28:40,  2.58s/it] 81%|████████  | 2783/3449 [2:11:10<29:41,  2.67s/it]                                                     {'loss': 1.196, 'learning_rate': 3.788838511240253e-05, 'epoch': 0.81}
 81%|████████  | 2783/3449 [2:11:10<29:41,  2.67s/it] 81%|████████  | 2784/3449 [2:11:13<29:23,  2.65s/it]                                                     {'loss': 1.324, 'learning_rate': 3.777857889706502e-05, 'epoch': 0.81}
 81%|████████  | 2784/3449 [2:11:13<29:23,  2.65s/it] 81%|████████  | 2785/3449 [2:11:15<28:17,  2.56s/it]                                                     {'loss': 1.1858, 'learning_rate': 3.7668915432221555e-05, 'epoch': 0.81}
 81%|████████  | 2785/3449 [2:11:15<28:17,  2.56s/it] 81%|████████  | 2786/3449 [2:11:17<27:57,  2.53s/it]                                                     {'loss': 1.3296, 'learning_rate': 3.755939481437305e-05, 'epoch': 0.81}
 81%|████████  | 2786/3449 [2:11:17<27:57,  2.53s/it] 81%|████████  | 2787/3449 [2:11:20<28:00,  2.54s/it]                                                     {'loss': 1.1258, 'learning_rate': 3.745001713989473e-05, 'epoch': 0.81}
 81%|████████  | 2787/3449 [2:11:20<28:00,  2.54s/it] 81%|████████  | 2788/3449 [2:11:22<28:05,  2.55s/it]                                                     {'loss': 1.1186, 'learning_rate': 3.734078250503603e-05, 'epoch': 0.81}
 81%|████████  | 2788/3449 [2:11:22<28:05,  2.55s/it] 81%|████████  | 2789/3449 [2:11:26<29:54,  2.72s/it]                                                     {'loss': 1.2242, 'learning_rate': 3.7231691005920455e-05, 'epoch': 0.81}
 81%|████████  | 2789/3449 [2:11:26<29:54,  2.72s/it] 81%|████████  | 2790/3449 [2:11:28<30:08,  2.74s/it]                                                     {'loss': 1.0277, 'learning_rate': 3.7122742738545636e-05, 'epoch': 0.81}
 81%|████████  | 2790/3449 [2:11:28<30:08,  2.74s/it] 81%|████████  | 2791/3449 [2:11:31<30:14,  2.76s/it]                                                     {'loss': 1.2528, 'learning_rate': 3.701393779878311e-05, 'epoch': 0.81}
 81%|████████  | 2791/3449 [2:11:31<30:14,  2.76s/it] 81%|████████  | 2792/3449 [2:11:34<29:26,  2.69s/it]                                                     {'loss': 1.2181, 'learning_rate': 3.6905276282378275e-05, 'epoch': 0.81}
 81%|████████  | 2792/3449 [2:11:34<29:26,  2.69s/it] 81%|████████  | 2793/3449 [2:11:36<28:53,  2.64s/it]                                                     {'loss': 1.1956, 'learning_rate': 3.679675828495039e-05, 'epoch': 0.81}
 81%|████████  | 2793/3449 [2:11:36<28:53,  2.64s/it] 81%|████████  | 2794/3449 [2:11:39<29:04,  2.66s/it]                                                     {'loss': 0.9589, 'learning_rate': 3.668838390199234e-05, 'epoch': 0.81}
 81%|████████  | 2794/3449 [2:11:39<29:04,  2.66s/it] 81%|████████  | 2795/3449 [2:11:42<30:16,  2.78s/it]                                                     {'loss': 1.2165, 'learning_rate': 3.658015322887076e-05, 'epoch': 0.81}
 81%|████████  | 2795/3449 [2:11:42<30:16,  2.78s/it] 81%|████████  | 2796/3449 [2:11:46<33:55,  3.12s/it]                                                     {'loss': 1.0799, 'learning_rate': 3.6472066360825586e-05, 'epoch': 0.81}
 81%|████████  | 2796/3449 [2:11:46<33:55,  3.12s/it] 81%|████████  | 2797/3449 [2:11:50<38:16,  3.52s/it]                                                     {'loss': 1.0796, 'learning_rate': 3.6364123392970415e-05, 'epoch': 0.81}
 81%|████████  | 2797/3449 [2:11:50<38:16,  3.52s/it] 81%|████████  | 2798/3449 [2:11:53<35:38,  3.28s/it]                                                     {'loss': 1.2056, 'learning_rate': 3.625632442029227e-05, 'epoch': 0.81}
 81%|████████  | 2798/3449 [2:11:53<35:38,  3.28s/it] 81%|████████  | 2799/3449 [2:11:56<34:29,  3.18s/it]                                                     {'loss': 1.0231, 'learning_rate': 3.614866953765121e-05, 'epoch': 0.81}
 81%|████████  | 2799/3449 [2:11:56<34:29,  3.18s/it] 81%|████████  | 2800/3449 [2:11:59<33:45,  3.12s/it]                                                     {'loss': 1.2884, 'learning_rate': 3.604115883978065e-05, 'epoch': 0.81}
 81%|████████  | 2800/3449 [2:11:59<33:45,  3.12s/it] 81%|████████  | 2801/3449 [2:12:01<31:32,  2.92s/it]                                                     {'loss': 1.3292, 'learning_rate': 3.593379242128727e-05, 'epoch': 0.81}
 81%|████████  | 2801/3449 [2:12:01<31:32,  2.92s/it] 81%|████████  | 2802/3449 [2:12:04<30:49,  2.86s/it]                                                     {'loss': 1.1785, 'learning_rate': 3.582657037665047e-05, 'epoch': 0.81}
 81%|████████  | 2802/3449 [2:12:04<30:49,  2.86s/it] 81%|████████▏ | 2803/3449 [2:12:08<35:17,  3.28s/it]                                                     {'loss': 1.1822, 'learning_rate': 3.5719492800222844e-05, 'epoch': 0.81}
 81%|████████▏ | 2803/3449 [2:12:08<35:17,  3.28s/it] 81%|████████▏ | 2804/3449 [2:12:12<36:14,  3.37s/it]                                                     {'loss': 1.0801, 'learning_rate': 3.561255978622975e-05, 'epoch': 0.81}
 81%|████████▏ | 2804/3449 [2:12:12<36:14,  3.37s/it] 81%|████████▏ | 2805/3449 [2:12:15<35:04,  3.27s/it]                                                     {'loss': 1.2395, 'learning_rate': 3.550577142876939e-05, 'epoch': 0.81}
 81%|████████▏ | 2805/3449 [2:12:15<35:04,  3.27s/it] 81%|████████▏ | 2806/3449 [2:12:18<32:47,  3.06s/it]                                                     {'loss': 1.1524, 'learning_rate': 3.539912782181263e-05, 'epoch': 0.81}
 81%|████████▏ | 2806/3449 [2:12:18<32:47,  3.06s/it] 81%|████████▏ | 2807/3449 [2:12:25<45:56,  4.29s/it]                                                     {'loss': 1.2306, 'learning_rate': 3.529262905920301e-05, 'epoch': 0.81}
 81%|████████▏ | 2807/3449 [2:12:25<45:56,  4.29s/it] 81%|████████▏ | 2808/3449 [2:12:28<41:50,  3.92s/it]                                                     {'loss': 1.2292, 'learning_rate': 3.5186275234656563e-05, 'epoch': 0.81}
 81%|████████▏ | 2808/3449 [2:12:28<41:50,  3.92s/it] 81%|████████▏ | 2809/3449 [2:12:30<37:48,  3.55s/it]                                                     {'loss': 1.2175, 'learning_rate': 3.508006644176187e-05, 'epoch': 0.81}
 81%|████████▏ | 2809/3449 [2:12:30<37:48,  3.55s/it] 81%|████████▏ | 2810/3449 [2:12:33<35:35,  3.34s/it]                                                     {'loss': 1.1998, 'learning_rate': 3.497400277397964e-05, 'epoch': 0.81}
 81%|████████▏ | 2810/3449 [2:12:33<35:35,  3.34s/it] 82%|████████▏ | 2811/3449 [2:12:36<33:30,  3.15s/it]                                                     {'loss': 1.2619, 'learning_rate': 3.4868084324643194e-05, 'epoch': 0.81}
 82%|████████▏ | 2811/3449 [2:12:36<33:30,  3.15s/it] 82%|████████▏ | 2812/3449 [2:12:39<34:10,  3.22s/it]                                                     {'loss': 1.0674, 'learning_rate': 3.476231118695796e-05, 'epoch': 0.82}
 82%|████████▏ | 2812/3449 [2:12:39<34:10,  3.22s/it] 82%|████████▏ | 2813/3449 [2:12:43<35:31,  3.35s/it]                                                     {'loss': 1.0799, 'learning_rate': 3.465668345400133e-05, 'epoch': 0.82}
 82%|████████▏ | 2813/3449 [2:12:43<35:31,  3.35s/it] 82%|████████▏ | 2814/3449 [2:12:46<33:16,  3.14s/it]                                                     {'loss': 1.2217, 'learning_rate': 3.4551201218722885e-05, 'epoch': 0.82}
 82%|████████▏ | 2814/3449 [2:12:46<33:16,  3.14s/it] 82%|████████▏ | 2815/3449 [2:12:48<30:42,  2.91s/it]                                                     {'loss': 1.1028, 'learning_rate': 3.444586457394432e-05, 'epoch': 0.82}
 82%|████████▏ | 2815/3449 [2:12:48<30:42,  2.91s/it] 82%|████████▏ | 2816/3449 [2:12:51<30:12,  2.86s/it]                                                     {'loss': 1.3304, 'learning_rate': 3.4340673612358865e-05, 'epoch': 0.82}
 82%|████████▏ | 2816/3449 [2:12:51<30:12,  2.86s/it] 82%|████████▏ | 2817/3449 [2:12:54<29:54,  2.84s/it]                                                     {'loss': 1.2241, 'learning_rate': 3.423562842653179e-05, 'epoch': 0.82}
 82%|████████▏ | 2817/3449 [2:12:54<29:54,  2.84s/it] 82%|████████▏ | 2818/3449 [2:12:56<28:52,  2.75s/it]                                                     {'loss': 1.2089, 'learning_rate': 3.413072910890014e-05, 'epoch': 0.82}
 82%|████████▏ | 2818/3449 [2:12:56<28:52,  2.75s/it] 82%|████████▏ | 2819/3449 [2:12:59<29:25,  2.80s/it]                                                     {'loss': 1.3106, 'learning_rate': 3.402597575177238e-05, 'epoch': 0.82}
 82%|████████▏ | 2819/3449 [2:12:59<29:25,  2.80s/it] 82%|████████▏ | 2820/3449 [2:13:01<27:10,  2.59s/it]                                                     {'loss': 1.3274, 'learning_rate': 3.392136844732867e-05, 'epoch': 0.82}
 82%|████████▏ | 2820/3449 [2:13:01<27:10,  2.59s/it] 82%|████████▏ | 2821/3449 [2:13:04<26:21,  2.52s/it]                                                     {'loss': 1.3043, 'learning_rate': 3.381690728762068e-05, 'epoch': 0.82}
 82%|████████▏ | 2821/3449 [2:13:04<26:21,  2.52s/it] 82%|████████▏ | 2822/3449 [2:13:06<27:10,  2.60s/it]                                                     {'loss': 1.1884, 'learning_rate': 3.371259236457138e-05, 'epoch': 0.82}
 82%|████████▏ | 2822/3449 [2:13:06<27:10,  2.60s/it] 82%|████████▏ | 2823/3449 [2:13:09<27:38,  2.65s/it]                                                     {'loss': 1.1564, 'learning_rate': 3.3608423769975126e-05, 'epoch': 0.82}
 82%|████████▏ | 2823/3449 [2:13:09<27:38,  2.65s/it] 82%|████████▏ | 2824/3449 [2:13:12<28:13,  2.71s/it]                                                     {'loss': 1.1783, 'learning_rate': 3.350440159549748e-05, 'epoch': 0.82}
 82%|████████▏ | 2824/3449 [2:13:12<28:13,  2.71s/it] 82%|████████▏ | 2825/3449 [2:13:15<28:02,  2.70s/it]                                                     {'loss': 1.2655, 'learning_rate': 3.3400525932675156e-05, 'epoch': 0.82}
 82%|████████▏ | 2825/3449 [2:13:15<28:02,  2.70s/it] 82%|████████▏ | 2826/3449 [2:13:17<27:10,  2.62s/it]                                                     {'loss': 1.3103, 'learning_rate': 3.329679687291598e-05, 'epoch': 0.82}
 82%|████████▏ | 2826/3449 [2:13:17<27:10,  2.62s/it] 82%|████████▏ | 2827/3449 [2:13:20<26:44,  2.58s/it]                                                     {'loss': 1.252, 'learning_rate': 3.3193214507498616e-05, 'epoch': 0.82}
 82%|████████▏ | 2827/3449 [2:13:20<26:44,  2.58s/it] 82%|████████▏ | 2828/3449 [2:13:23<30:13,  2.92s/it]                                                     {'loss': 1.234, 'learning_rate': 3.30897789275729e-05, 'epoch': 0.82}
 82%|████████▏ | 2828/3449 [2:13:23<30:13,  2.92s/it] 82%|████████▏ | 2829/3449 [2:13:26<30:26,  2.95s/it]                                                     {'loss': 1.1224, 'learning_rate': 3.298649022415938e-05, 'epoch': 0.82}
 82%|████████▏ | 2829/3449 [2:13:26<30:26,  2.95s/it] 82%|████████▏ | 2830/3449 [2:13:29<29:36,  2.87s/it]                                                     {'loss': 1.1704, 'learning_rate': 3.288334848814922e-05, 'epoch': 0.82}
 82%|████████▏ | 2830/3449 [2:13:29<29:36,  2.87s/it] 82%|████████▏ | 2831/3449 [2:13:32<29:02,  2.82s/it]                                                     {'loss': 1.192, 'learning_rate': 3.278035381030444e-05, 'epoch': 0.82}
 82%|████████▏ | 2831/3449 [2:13:32<29:02,  2.82s/it] 82%|████████▏ | 2832/3449 [2:13:34<28:44,  2.80s/it]                                                     {'loss': 1.1391, 'learning_rate': 3.2677506281257585e-05, 'epoch': 0.82}
 82%|████████▏ | 2832/3449 [2:13:34<28:44,  2.80s/it] 82%|████████▏ | 2833/3449 [2:13:37<27:32,  2.68s/it]                                                     {'loss': 1.2119, 'learning_rate': 3.257480599151173e-05, 'epoch': 0.82}
 82%|████████▏ | 2833/3449 [2:13:37<27:32,  2.68s/it] 82%|████████▏ | 2834/3449 [2:13:40<28:17,  2.76s/it]                                                     {'loss': 1.1486, 'learning_rate': 3.247225303144037e-05, 'epoch': 0.82}
 82%|████████▏ | 2834/3449 [2:13:40<28:17,  2.76s/it] 82%|████████▏ | 2835/3449 [2:13:43<29:04,  2.84s/it]                                                     {'loss': 1.0492, 'learning_rate': 3.2369847491287334e-05, 'epoch': 0.82}
 82%|████████▏ | 2835/3449 [2:13:43<29:04,  2.84s/it] 82%|████████▏ | 2836/3449 [2:13:46<29:56,  2.93s/it]                                                     {'loss': 1.1898, 'learning_rate': 3.226758946116677e-05, 'epoch': 0.82}
 82%|████████▏ | 2836/3449 [2:13:46<29:56,  2.93s/it] 82%|████████▏ | 2837/3449 [2:13:48<28:19,  2.78s/it]                                                     {'loss': 1.1674, 'learning_rate': 3.2165479031062993e-05, 'epoch': 0.82}
 82%|████████▏ | 2837/3449 [2:13:48<28:19,  2.78s/it] 82%|████████▏ | 2838/3449 [2:13:51<28:29,  2.80s/it]                                                     {'loss': 1.1875, 'learning_rate': 3.206351629083044e-05, 'epoch': 0.82}
 82%|████████▏ | 2838/3449 [2:13:51<28:29,  2.80s/it] 82%|████████▏ | 2839/3449 [2:13:54<27:46,  2.73s/it]                                                     {'loss': 1.0544, 'learning_rate': 3.196170133019358e-05, 'epoch': 0.82}
 82%|████████▏ | 2839/3449 [2:13:54<27:46,  2.73s/it] 82%|████████▏ | 2840/3449 [2:13:56<27:01,  2.66s/it]                                                     {'loss': 1.2524, 'learning_rate': 3.186003423874686e-05, 'epoch': 0.82}
 82%|████████▏ | 2840/3449 [2:13:56<27:01,  2.66s/it] 82%|████████▏ | 2841/3449 [2:13:59<25:39,  2.53s/it]                                                     {'loss': 1.1278, 'learning_rate': 3.175851510595456e-05, 'epoch': 0.82}
 82%|████████▏ | 2841/3449 [2:13:59<25:39,  2.53s/it] 82%|████████▏ | 2842/3449 [2:14:02<27:03,  2.68s/it]                                                     {'loss': 1.0962, 'learning_rate': 3.165714402115085e-05, 'epoch': 0.82}
 82%|████████▏ | 2842/3449 [2:14:02<27:03,  2.68s/it] 82%|████████▏ | 2843/3449 [2:14:04<26:12,  2.60s/it]                                                     {'loss': 1.5185, 'learning_rate': 3.1555921073539487e-05, 'epoch': 0.82}
 82%|████████▏ | 2843/3449 [2:14:04<26:12,  2.60s/it] 82%|████████▏ | 2844/3449 [2:14:07<28:29,  2.83s/it]                                                     {'loss': 1.2144, 'learning_rate': 3.145484635219391e-05, 'epoch': 0.82}
 82%|████████▏ | 2844/3449 [2:14:07<28:29,  2.83s/it] 82%|████████▏ | 2845/3449 [2:14:10<29:11,  2.90s/it]                                                     {'loss': 1.2703, 'learning_rate': 3.135391994605734e-05, 'epoch': 0.82}
 82%|████████▏ | 2845/3449 [2:14:10<29:11,  2.90s/it] 83%|████████▎ | 2846/3449 [2:14:13<28:02,  2.79s/it]                                                     {'loss': 1.421, 'learning_rate': 3.1253141943942135e-05, 'epoch': 0.83}
 83%|████████▎ | 2846/3449 [2:14:13<28:02,  2.79s/it] 83%|████████▎ | 2847/3449 [2:14:15<27:09,  2.71s/it]                                                     {'loss': 1.2929, 'learning_rate': 3.1152512434530304e-05, 'epoch': 0.83}
 83%|████████▎ | 2847/3449 [2:14:15<27:09,  2.71s/it] 83%|████████▎ | 2848/3449 [2:14:18<27:04,  2.70s/it]                                                     {'loss': 1.1702, 'learning_rate': 3.105203150637308e-05, 'epoch': 0.83}
 83%|████████▎ | 2848/3449 [2:14:18<27:04,  2.70s/it] 83%|████████▎ | 2849/3449 [2:14:21<26:25,  2.64s/it]                                                     {'loss': 1.312, 'learning_rate': 3.095169924789101e-05, 'epoch': 0.83}
 83%|████████▎ | 2849/3449 [2:14:21<26:25,  2.64s/it] 83%|████████▎ | 2850/3449 [2:14:24<29:55,  3.00s/it]                                                     {'loss': 1.1444, 'learning_rate': 3.085151574737375e-05, 'epoch': 0.83}
 83%|████████▎ | 2850/3449 [2:14:24<29:55,  3.00s/it] 83%|████████▎ | 2851/3449 [2:14:27<28:52,  2.90s/it]                                                     {'loss': 1.1569, 'learning_rate': 3.075148109298014e-05, 'epoch': 0.83}
 83%|████████▎ | 2851/3449 [2:14:27<28:52,  2.90s/it] 83%|████████▎ | 2852/3449 [2:14:30<28:40,  2.88s/it]                                                     {'loss': 1.3808, 'learning_rate': 3.065159537273796e-05, 'epoch': 0.83}
 83%|████████▎ | 2852/3449 [2:14:30<28:40,  2.88s/it] 83%|████████▎ | 2853/3449 [2:14:33<28:32,  2.87s/it]                                                     {'loss': 1.288, 'learning_rate': 3.055185867454396e-05, 'epoch': 0.83}
 83%|████████▎ | 2853/3449 [2:14:33<28:32,  2.87s/it] 83%|████████▎ | 2854/3449 [2:14:35<26:42,  2.69s/it]                                                     {'loss': 1.2729, 'learning_rate': 3.0452271086163753e-05, 'epoch': 0.83}
 83%|████████▎ | 2854/3449 [2:14:35<26:42,  2.69s/it] 83%|████████▎ | 2855/3449 [2:14:38<27:45,  2.80s/it]                                                     {'loss': 1.1704, 'learning_rate': 3.035283269523177e-05, 'epoch': 0.83}
 83%|████████▎ | 2855/3449 [2:14:38<27:45,  2.80s/it] 83%|████████▎ | 2856/3449 [2:14:41<28:36,  2.89s/it]                                                     {'loss': 1.2109, 'learning_rate': 3.0253543589251143e-05, 'epoch': 0.83}
 83%|████████▎ | 2856/3449 [2:14:41<28:36,  2.89s/it] 83%|████████▎ | 2857/3449 [2:14:44<28:05,  2.85s/it]                                                     {'loss': 1.3268, 'learning_rate': 3.0154403855593495e-05, 'epoch': 0.83}
 83%|████████▎ | 2857/3449 [2:14:44<28:05,  2.85s/it] 83%|████████▎ | 2858/3449 [2:14:46<26:55,  2.73s/it]                                                     {'loss': 1.3496, 'learning_rate': 3.0055413581499237e-05, 'epoch': 0.83}
 83%|████████▎ | 2858/3449 [2:14:46<26:55,  2.73s/it] 83%|████████▎ | 2859/3449 [2:14:49<27:38,  2.81s/it]                                                     {'loss': 1.3418, 'learning_rate': 2.9956572854077202e-05, 'epoch': 0.83}
 83%|████████▎ | 2859/3449 [2:14:49<27:38,  2.81s/it] 83%|████████▎ | 2860/3449 [2:14:52<26:21,  2.69s/it]                                                     {'loss': 1.1103, 'learning_rate': 2.9857881760304463e-05, 'epoch': 0.83}
 83%|████████▎ | 2860/3449 [2:14:52<26:21,  2.69s/it] 83%|████████▎ | 2861/3449 [2:14:55<26:41,  2.72s/it]                                                     {'loss': 1.1129, 'learning_rate': 2.9759340387026502e-05, 'epoch': 0.83}
 83%|████████▎ | 2861/3449 [2:14:55<26:41,  2.72s/it] 83%|████████▎ | 2862/3449 [2:14:57<25:50,  2.64s/it]                                                     {'loss': 1.1725, 'learning_rate': 2.9660948820957245e-05, 'epoch': 0.83}
 83%|████████▎ | 2862/3449 [2:14:57<25:50,  2.64s/it] 83%|████████▎ | 2863/3449 [2:15:00<25:34,  2.62s/it]                                                     {'loss': 1.196, 'learning_rate': 2.9562707148678504e-05, 'epoch': 0.83}
 83%|████████▎ | 2863/3449 [2:15:00<25:34,  2.62s/it] 83%|████████▎ | 2864/3449 [2:15:03<27:47,  2.85s/it]                                                     {'loss': 1.2122, 'learning_rate': 2.94646154566403e-05, 'epoch': 0.83}
 83%|████████▎ | 2864/3449 [2:15:03<27:47,  2.85s/it] 83%|████████▎ | 2865/3449 [2:15:06<28:02,  2.88s/it]                                                     {'loss': 1.0989, 'learning_rate': 2.9366673831160828e-05, 'epoch': 0.83}
 83%|████████▎ | 2865/3449 [2:15:06<28:02,  2.88s/it] 83%|████████▎ | 2866/3449 [2:15:09<26:54,  2.77s/it]                                                     {'loss': 1.151, 'learning_rate': 2.926888235842593e-05, 'epoch': 0.83}
 83%|████████▎ | 2866/3449 [2:15:09<26:54,  2.77s/it] 83%|████████▎ | 2867/3449 [2:15:11<26:41,  2.75s/it]                                                     {'loss': 1.1977, 'learning_rate': 2.9171241124489545e-05, 'epoch': 0.83}
 83%|████████▎ | 2867/3449 [2:15:11<26:41,  2.75s/it] 83%|████████▎ | 2868/3449 [2:15:14<26:28,  2.73s/it]                                                     {'loss': 1.1271, 'learning_rate': 2.907375021527332e-05, 'epoch': 0.83}
 83%|████████▎ | 2868/3449 [2:15:14<26:28,  2.73s/it] 83%|████████▎ | 2869/3449 [2:15:17<27:55,  2.89s/it]                                                     {'loss': 1.0396, 'learning_rate': 2.8976409716566655e-05, 'epoch': 0.83}
 83%|████████▎ | 2869/3449 [2:15:17<27:55,  2.89s/it] 83%|████████▎ | 2870/3449 [2:15:20<28:17,  2.93s/it]                                                     {'loss': 1.1453, 'learning_rate': 2.8879219714026608e-05, 'epoch': 0.83}
 83%|████████▎ | 2870/3449 [2:15:20<28:17,  2.93s/it] 83%|████████▎ | 2871/3449 [2:15:22<26:14,  2.72s/it]                                                     {'loss': 1.3017, 'learning_rate': 2.878218029317763e-05, 'epoch': 0.83}
 83%|████████▎ | 2871/3449 [2:15:22<26:14,  2.72s/it] 83%|████████▎ | 2872/3449 [2:15:25<25:59,  2.70s/it]                                                     {'loss': 1.2412, 'learning_rate': 2.8685291539411953e-05, 'epoch': 0.83}
 83%|████████▎ | 2872/3449 [2:15:25<25:59,  2.70s/it] 83%|████████▎ | 2873/3449 [2:15:28<26:44,  2.79s/it]                                                     {'loss': 1.1622, 'learning_rate': 2.858855353798908e-05, 'epoch': 0.83}
 83%|████████▎ | 2873/3449 [2:15:28<26:44,  2.79s/it] 83%|████████▎ | 2874/3449 [2:15:30<25:14,  2.63s/it]                                                     {'loss': 1.1639, 'learning_rate': 2.8491966374035707e-05, 'epoch': 0.83}
 83%|████████▎ | 2874/3449 [2:15:30<25:14,  2.63s/it] 83%|████████▎ | 2875/3449 [2:15:33<25:59,  2.72s/it]                                                     {'loss': 1.0995, 'learning_rate': 2.83955301325461e-05, 'epoch': 0.83}
 83%|████████▎ | 2875/3449 [2:15:33<25:59,  2.72s/it] 83%|████████▎ | 2876/3449 [2:15:35<24:12,  2.53s/it]                                                     {'loss': 1.1613, 'learning_rate': 2.8299244898381537e-05, 'epoch': 0.83}
 83%|████████▎ | 2876/3449 [2:15:35<24:12,  2.53s/it] 83%|████████▎ | 2877/3449 [2:15:38<24:55,  2.62s/it]                                                     {'loss': 1.1399, 'learning_rate': 2.8203110756270357e-05, 'epoch': 0.83}
 83%|████████▎ | 2877/3449 [2:15:38<24:55,  2.62s/it] 83%|████████▎ | 2878/3449 [2:15:41<24:46,  2.60s/it]                                                     {'loss': 1.378, 'learning_rate': 2.8107127790808064e-05, 'epoch': 0.83}
 83%|████████▎ | 2878/3449 [2:15:41<24:46,  2.60s/it] 83%|████████▎ | 2879/3449 [2:15:44<25:11,  2.65s/it]                                                     {'loss': 1.2254, 'learning_rate': 2.8011296086457117e-05, 'epoch': 0.83}
 83%|████████▎ | 2879/3449 [2:15:44<25:11,  2.65s/it] 84%|████████▎ | 2880/3449 [2:15:46<24:36,  2.60s/it]                                                     {'loss': 1.137, 'learning_rate': 2.7915615727546795e-05, 'epoch': 0.83}
 84%|████████▎ | 2880/3449 [2:15:46<24:36,  2.60s/it] 84%|████████▎ | 2881/3449 [2:15:49<25:26,  2.69s/it]                                                     {'loss': 1.1082, 'learning_rate': 2.7820086798273302e-05, 'epoch': 0.84}
 84%|████████▎ | 2881/3449 [2:15:49<25:26,  2.69s/it] 84%|████████▎ | 2882/3449 [2:15:53<28:12,  2.98s/it]                                                     {'loss': 1.181, 'learning_rate': 2.7724709382699464e-05, 'epoch': 0.84}
 84%|████████▎ | 2882/3449 [2:15:53<28:12,  2.98s/it] 84%|████████▎ | 2883/3449 [2:15:55<26:41,  2.83s/it]                                                     {'loss': 1.215, 'learning_rate': 2.7629483564754922e-05, 'epoch': 0.84}
 84%|████████▎ | 2883/3449 [2:15:55<26:41,  2.83s/it] 84%|████████▎ | 2884/3449 [2:15:58<27:13,  2.89s/it]                                                     {'loss': 1.1838, 'learning_rate': 2.753440942823575e-05, 'epoch': 0.84}
 84%|████████▎ | 2884/3449 [2:15:58<27:13,  2.89s/it] 84%|████████▎ | 2885/3449 [2:16:01<26:02,  2.77s/it]                                                     {'loss': 1.2522, 'learning_rate': 2.7439487056804725e-05, 'epoch': 0.84}
 84%|████████▎ | 2885/3449 [2:16:01<26:02,  2.77s/it] 84%|████████▎ | 2886/3449 [2:16:03<25:07,  2.68s/it]                                                     {'loss': 1.3614, 'learning_rate': 2.734471653399091e-05, 'epoch': 0.84}
 84%|████████▎ | 2886/3449 [2:16:03<25:07,  2.68s/it] 84%|████████▎ | 2887/3449 [2:16:06<25:01,  2.67s/it]                                                     {'loss': 1.1609, 'learning_rate': 2.7250097943189913e-05, 'epoch': 0.84}
 84%|████████▎ | 2887/3449 [2:16:06<25:01,  2.67s/it] 84%|████████▎ | 2888/3449 [2:16:08<25:04,  2.68s/it]                                                     {'loss': 1.2361, 'learning_rate': 2.7155631367663415e-05, 'epoch': 0.84}
 84%|████████▎ | 2888/3449 [2:16:08<25:04,  2.68s/it] 84%|████████▍ | 2889/3449 [2:16:11<24:20,  2.61s/it]                                                     {'loss': 1.1738, 'learning_rate': 2.7061316890539566e-05, 'epoch': 0.84}
 84%|████████▍ | 2889/3449 [2:16:11<24:20,  2.61s/it] 84%|████████▍ | 2890/3449 [2:16:14<24:38,  2.65s/it]                                                     {'loss': 1.1513, 'learning_rate': 2.6967154594812606e-05, 'epoch': 0.84}
 84%|████████▍ | 2890/3449 [2:16:14<24:38,  2.65s/it] 84%|████████▍ | 2891/3449 [2:16:16<23:51,  2.57s/it]                                                     {'loss': 1.3083, 'learning_rate': 2.6873144563342666e-05, 'epoch': 0.84}
 84%|████████▍ | 2891/3449 [2:16:16<23:51,  2.57s/it] 84%|████████▍ | 2892/3449 [2:16:19<25:08,  2.71s/it]                                                     {'loss': 1.1767, 'learning_rate': 2.6779286878856247e-05, 'epoch': 0.84}
 84%|████████▍ | 2892/3449 [2:16:19<25:08,  2.71s/it] 84%|████████▍ | 2893/3449 [2:16:22<24:42,  2.67s/it]                                                     {'loss': 1.2804, 'learning_rate': 2.6685581623945454e-05, 'epoch': 0.84}
 84%|████████▍ | 2893/3449 [2:16:22<24:42,  2.67s/it] 84%|████████▍ | 2894/3449 [2:16:24<24:23,  2.64s/it]                                                     {'loss': 1.2806, 'learning_rate': 2.6592028881068444e-05, 'epoch': 0.84}
 84%|████████▍ | 2894/3449 [2:16:24<24:23,  2.64s/it] 84%|████████▍ | 2895/3449 [2:16:27<24:40,  2.67s/it]                                                     {'loss': 1.3262, 'learning_rate': 2.6498628732549093e-05, 'epoch': 0.84}
 84%|████████▍ | 2895/3449 [2:16:27<24:40,  2.67s/it] 84%|████████▍ | 2896/3449 [2:16:30<26:06,  2.83s/it]                                                     {'loss': 1.0808, 'learning_rate': 2.6405381260577056e-05, 'epoch': 0.84}
 84%|████████▍ | 2896/3449 [2:16:30<26:06,  2.83s/it] 84%|████████▍ | 2897/3449 [2:16:32<24:40,  2.68s/it]                                                     {'loss': 1.191, 'learning_rate': 2.6312286547207588e-05, 'epoch': 0.84}
 84%|████████▍ | 2897/3449 [2:16:32<24:40,  2.68s/it] 84%|████████▍ | 2898/3449 [2:16:35<24:19,  2.65s/it]                                                     {'loss': 1.1015, 'learning_rate': 2.6219344674361536e-05, 'epoch': 0.84}
 84%|████████▍ | 2898/3449 [2:16:35<24:19,  2.65s/it] 84%|████████▍ | 2899/3449 [2:16:38<24:51,  2.71s/it]                                                     {'loss': 1.1276, 'learning_rate': 2.6126555723825275e-05, 'epoch': 0.84}
 84%|████████▍ | 2899/3449 [2:16:38<24:51,  2.71s/it] 84%|████████▍ | 2900/3449 [2:16:41<24:57,  2.73s/it]                                                     {'loss': 1.0806, 'learning_rate': 2.6033919777250538e-05, 'epoch': 0.84}
 84%|████████▍ | 2900/3449 [2:16:41<24:57,  2.73s/it] 84%|████████▍ | 2901/3449 [2:16:43<24:26,  2.68s/it]                                                     {'loss': 1.1841, 'learning_rate': 2.5941436916154516e-05, 'epoch': 0.84}
 84%|████████▍ | 2901/3449 [2:16:43<24:26,  2.68s/it] 84%|████████▍ | 2902/3449 [2:16:46<24:51,  2.73s/it]                                                     {'loss': 1.0018, 'learning_rate': 2.5849107221919643e-05, 'epoch': 0.84}
 84%|████████▍ | 2902/3449 [2:16:46<24:51,  2.73s/it] 84%|████████▍ | 2903/3449 [2:16:48<23:43,  2.61s/it]                                                     {'loss': 1.2052, 'learning_rate': 2.5756930775793576e-05, 'epoch': 0.84}
 84%|████████▍ | 2903/3449 [2:16:48<23:43,  2.61s/it] 84%|████████▍ | 2904/3449 [2:16:51<24:33,  2.70s/it]                                                     {'loss': 1.2706, 'learning_rate': 2.566490765888907e-05, 'epoch': 0.84}
 84%|████████▍ | 2904/3449 [2:16:51<24:33,  2.70s/it] 84%|████████▍ | 2905/3449 [2:16:54<24:31,  2.71s/it]                                                     {'loss': 1.2838, 'learning_rate': 2.5573037952183955e-05, 'epoch': 0.84}
 84%|████████▍ | 2905/3449 [2:16:54<24:31,  2.71s/it] 84%|████████▍ | 2906/3449 [2:16:57<25:23,  2.81s/it]                                                     {'loss': 1.2283, 'learning_rate': 2.5481321736521267e-05, 'epoch': 0.84}
 84%|████████▍ | 2906/3449 [2:16:57<25:23,  2.81s/it] 84%|████████▍ | 2907/3449 [2:17:00<24:33,  2.72s/it]                                                     {'loss': 1.2007, 'learning_rate': 2.5389759092608677e-05, 'epoch': 0.84}
 84%|████████▍ | 2907/3449 [2:17:00<24:33,  2.72s/it] 84%|████████▍ | 2908/3449 [2:17:02<24:05,  2.67s/it]                                                     {'loss': 1.1274, 'learning_rate': 2.529835010101884e-05, 'epoch': 0.84}
 84%|████████▍ | 2908/3449 [2:17:02<24:05,  2.67s/it] 84%|████████▍ | 2909/3449 [2:17:05<23:59,  2.67s/it]                                                     {'loss': 1.1852, 'learning_rate': 2.520709484218935e-05, 'epoch': 0.84}
 84%|████████▍ | 2909/3449 [2:17:05<23:59,  2.67s/it] 84%|████████▍ | 2910/3449 [2:17:08<24:37,  2.74s/it]                                                     {'loss': 1.2359, 'learning_rate': 2.5115993396422277e-05, 'epoch': 0.84}
 84%|████████▍ | 2910/3449 [2:17:08<24:37,  2.74s/it] 84%|████████▍ | 2911/3449 [2:17:11<25:04,  2.80s/it]                                                     {'loss': 1.2102, 'learning_rate': 2.5025045843884453e-05, 'epoch': 0.84}
 84%|████████▍ | 2911/3449 [2:17:11<25:04,  2.80s/it] 84%|████████▍ | 2912/3449 [2:17:13<24:40,  2.76s/it]                                                     {'loss': 1.098, 'learning_rate': 2.4934252264607284e-05, 'epoch': 0.84}
 84%|████████▍ | 2912/3449 [2:17:13<24:40,  2.76s/it] 84%|████████▍ | 2913/3449 [2:17:16<24:41,  2.76s/it]                                                     {'loss': 1.1687, 'learning_rate': 2.4843612738486722e-05, 'epoch': 0.84}
 84%|████████▍ | 2913/3449 [2:17:16<24:41,  2.76s/it] 84%|████████▍ | 2914/3449 [2:17:19<25:24,  2.85s/it]                                                     {'loss': 1.1222, 'learning_rate': 2.4753127345283124e-05, 'epoch': 0.84}
 84%|████████▍ | 2914/3449 [2:17:19<25:24,  2.85s/it] 85%|████████▍ | 2915/3449 [2:17:22<24:51,  2.79s/it]                                                     {'loss': 1.215, 'learning_rate': 2.466279616462106e-05, 'epoch': 0.85}
 85%|████████▍ | 2915/3449 [2:17:22<24:51,  2.79s/it] 85%|████████▍ | 2916/3449 [2:17:24<24:15,  2.73s/it]                                                     {'loss': 1.1678, 'learning_rate': 2.457261927598973e-05, 'epoch': 0.85}
 85%|████████▍ | 2916/3449 [2:17:24<24:15,  2.73s/it] 85%|████████▍ | 2917/3449 [2:17:27<24:12,  2.73s/it]                                                     {'loss': 1.2958, 'learning_rate': 2.4482596758742337e-05, 'epoch': 0.85}
 85%|████████▍ | 2917/3449 [2:17:27<24:12,  2.73s/it] 85%|████████▍ | 2918/3449 [2:17:29<22:56,  2.59s/it]                                                     {'loss': 1.2455, 'learning_rate': 2.4392728692096145e-05, 'epoch': 0.85}
 85%|████████▍ | 2918/3449 [2:17:29<22:56,  2.59s/it] 85%|████████▍ | 2919/3449 [2:17:32<22:04,  2.50s/it]                                                     {'loss': 1.3264, 'learning_rate': 2.430301515513278e-05, 'epoch': 0.85}
 85%|████████▍ | 2919/3449 [2:17:32<22:04,  2.50s/it] 85%|████████▍ | 2920/3449 [2:17:34<22:12,  2.52s/it]                                                     {'loss': 1.2685, 'learning_rate': 2.4213456226797738e-05, 'epoch': 0.85}
 85%|████████▍ | 2920/3449 [2:17:34<22:12,  2.52s/it] 85%|████████▍ | 2921/3449 [2:17:38<26:49,  3.05s/it]                                                     {'loss': 1.0275, 'learning_rate': 2.4124051985900375e-05, 'epoch': 0.85}
 85%|████████▍ | 2921/3449 [2:17:38<26:49,  3.05s/it] 85%|████████▍ | 2922/3449 [2:17:42<28:21,  3.23s/it]                                                     {'loss': 1.2143, 'learning_rate': 2.4034802511114074e-05, 'epoch': 0.85}
 85%|████████▍ | 2922/3449 [2:17:42<28:21,  3.23s/it] 85%|████████▍ | 2923/3449 [2:17:46<29:06,  3.32s/it]                                                     {'loss': 1.2529, 'learning_rate': 2.394570788097603e-05, 'epoch': 0.85}
 85%|████████▍ | 2923/3449 [2:17:46<29:06,  3.32s/it] 85%|████████▍ | 2924/3449 [2:17:49<27:53,  3.19s/it]                                                     {'loss': 1.1313, 'learning_rate': 2.3856768173887066e-05, 'epoch': 0.85}
 85%|████████▍ | 2924/3449 [2:17:49<27:53,  3.19s/it] 85%|████████▍ | 2925/3449 [2:17:51<26:10,  3.00s/it]                                                     {'loss': 1.0385, 'learning_rate': 2.3767983468111688e-05, 'epoch': 0.85}
 85%|████████▍ | 2925/3449 [2:17:51<26:10,  3.00s/it] 85%|████████▍ | 2926/3449 [2:17:54<25:46,  2.96s/it]                                                     {'loss': 1.063, 'learning_rate': 2.3679353841778196e-05, 'epoch': 0.85}
 85%|████████▍ | 2926/3449 [2:17:54<25:46,  2.96s/it] 85%|████████▍ | 2927/3449 [2:17:56<24:07,  2.77s/it]                                                     {'loss': 1.228, 'learning_rate': 2.3590879372878138e-05, 'epoch': 0.85}
 85%|████████▍ | 2927/3449 [2:17:56<24:07,  2.77s/it] 85%|████████▍ | 2928/3449 [2:17:59<24:03,  2.77s/it]                                                     {'loss': 1.2192, 'learning_rate': 2.350256013926675e-05, 'epoch': 0.85}
 85%|████████▍ | 2928/3449 [2:17:59<24:03,  2.77s/it] 85%|████████▍ | 2929/3449 [2:18:02<24:06,  2.78s/it]                                                     {'loss': 1.2744, 'learning_rate': 2.3414396218662548e-05, 'epoch': 0.85}
 85%|████████▍ | 2929/3449 [2:18:02<24:06,  2.78s/it] 85%|████████▍ | 2930/3449 [2:18:05<25:13,  2.92s/it]                                                     {'loss': 1.1646, 'learning_rate': 2.3326387688647454e-05, 'epoch': 0.85}
 85%|████████▍ | 2930/3449 [2:18:05<25:13,  2.92s/it] 85%|████████▍ | 2931/3449 [2:18:09<27:16,  3.16s/it]                                                     {'loss': 1.1595, 'learning_rate': 2.3238534626666563e-05, 'epoch': 0.85}
 85%|████████▍ | 2931/3449 [2:18:09<27:16,  3.16s/it] 85%|████████▌ | 2932/3449 [2:18:11<25:08,  2.92s/it]                                                     {'loss': 1.1429, 'learning_rate': 2.3150837110028255e-05, 'epoch': 0.85}
 85%|████████▌ | 2932/3449 [2:18:11<25:08,  2.92s/it] 85%|████████▌ | 2933/3449 [2:18:15<26:45,  3.11s/it]                                                     {'loss': 1.1092, 'learning_rate': 2.3063295215903958e-05, 'epoch': 0.85}
 85%|████████▌ | 2933/3449 [2:18:15<26:45,  3.11s/it] 85%|████████▌ | 2934/3449 [2:18:18<27:56,  3.26s/it]                                                     {'loss': 1.1344, 'learning_rate': 2.2975909021328245e-05, 'epoch': 0.85}
 85%|████████▌ | 2934/3449 [2:18:18<27:56,  3.26s/it] 85%|████████▌ | 2935/3449 [2:18:22<27:45,  3.24s/it]                                                     {'loss': 1.2912, 'learning_rate': 2.2888678603198477e-05, 'epoch': 0.85}
 85%|████████▌ | 2935/3449 [2:18:22<27:45,  3.24s/it] 85%|████████▌ | 2936/3449 [2:18:24<26:26,  3.09s/it]                                                     {'loss': 1.2614, 'learning_rate': 2.2801604038275226e-05, 'epoch': 0.85}
 85%|████████▌ | 2936/3449 [2:18:24<26:26,  3.09s/it] 85%|████████▌ | 2937/3449 [2:18:27<26:32,  3.11s/it]                                                     {'loss': 1.0789, 'learning_rate': 2.2714685403181778e-05, 'epoch': 0.85}
 85%|████████▌ | 2937/3449 [2:18:27<26:32,  3.11s/it] 85%|████████▌ | 2938/3449 [2:18:31<27:10,  3.19s/it]                                                     {'loss': 1.1922, 'learning_rate': 2.2627922774404088e-05, 'epoch': 0.85}
 85%|████████▌ | 2938/3449 [2:18:31<27:10,  3.19s/it] 85%|████████▌ | 2939/3449 [2:18:33<25:50,  3.04s/it]                                                     {'loss': 1.0937, 'learning_rate': 2.2541316228290986e-05, 'epoch': 0.85}
 85%|████████▌ | 2939/3449 [2:18:33<25:50,  3.04s/it] 85%|████████▌ | 2940/3449 [2:18:36<24:25,  2.88s/it]                                                     {'loss': 1.163, 'learning_rate': 2.245486584105394e-05, 'epoch': 0.85}
 85%|████████▌ | 2940/3449 [2:18:36<24:25,  2.88s/it] 85%|████████▌ | 2941/3449 [2:18:39<24:35,  2.90s/it]                                                     {'loss': 1.3687, 'learning_rate': 2.2368571688766917e-05, 'epoch': 0.85}
 85%|████████▌ | 2941/3449 [2:18:39<24:35,  2.90s/it] 85%|████████▌ | 2942/3449 [2:18:42<23:50,  2.82s/it]                                                     {'loss': 1.2141, 'learning_rate': 2.228243384736648e-05, 'epoch': 0.85}
 85%|████████▌ | 2942/3449 [2:18:42<23:50,  2.82s/it] 85%|████████▌ | 2943/3449 [2:18:44<23:55,  2.84s/it]                                                     {'loss': 1.1063, 'learning_rate': 2.2196452392651622e-05, 'epoch': 0.85}
 85%|████████▌ | 2943/3449 [2:18:44<23:55,  2.84s/it] 85%|████████▌ | 2944/3449 [2:18:47<23:20,  2.77s/it]                                                     {'loss': 1.1442, 'learning_rate': 2.2110627400283714e-05, 'epoch': 0.85}
 85%|████████▌ | 2944/3449 [2:18:47<23:20,  2.77s/it] 85%|████████▌ | 2945/3449 [2:18:50<24:37,  2.93s/it]                                                     {'loss': 1.1305, 'learning_rate': 2.2024958945786423e-05, 'epoch': 0.85}
 85%|████████▌ | 2945/3449 [2:18:50<24:37,  2.93s/it] 85%|████████▌ | 2946/3449 [2:18:54<25:57,  3.10s/it]                                                     {'loss': 1.0128, 'learning_rate': 2.193944710454572e-05, 'epoch': 0.85}
 85%|████████▌ | 2946/3449 [2:18:54<25:57,  3.10s/it] 85%|████████▌ | 2947/3449 [2:18:56<24:08,  2.89s/it]                                                     {'loss': 1.1878, 'learning_rate': 2.1854091951809696e-05, 'epoch': 0.85}
 85%|████████▌ | 2947/3449 [2:18:56<24:08,  2.89s/it] 85%|████████▌ | 2948/3449 [2:18:59<23:13,  2.78s/it]                                                     {'loss': 1.1406, 'learning_rate': 2.1768893562688607e-05, 'epoch': 0.85}
 85%|████████▌ | 2948/3449 [2:18:59<23:13,  2.78s/it] 86%|████████▌ | 2949/3449 [2:19:01<22:00,  2.64s/it]                                                     {'loss': 1.2693, 'learning_rate': 2.168385201215477e-05, 'epoch': 0.85}
 86%|████████▌ | 2949/3449 [2:19:01<22:00,  2.64s/it] 86%|████████▌ | 2950/3449 [2:19:03<21:18,  2.56s/it]                                                     {'loss': 1.2784, 'learning_rate': 2.1598967375042432e-05, 'epoch': 0.86}
 86%|████████▌ | 2950/3449 [2:19:03<21:18,  2.56s/it] 86%|████████▌ | 2951/3449 [2:19:06<21:41,  2.61s/it]                                                     {'loss': 1.1601, 'learning_rate': 2.1514239726047848e-05, 'epoch': 0.86}
 86%|████████▌ | 2951/3449 [2:19:06<21:41,  2.61s/it] 86%|████████▌ | 2952/3449 [2:19:09<21:05,  2.55s/it]                                                     {'loss': 1.3428, 'learning_rate': 2.1429669139728948e-05, 'epoch': 0.86}
 86%|████████▌ | 2952/3449 [2:19:09<21:05,  2.55s/it] 86%|████████▌ | 2953/3449 [2:19:12<22:35,  2.73s/it]                                                     {'loss': 1.0477, 'learning_rate': 2.1345255690505762e-05, 'epoch': 0.86}
 86%|████████▌ | 2953/3449 [2:19:12<22:35,  2.73s/it] 86%|████████▌ | 2954/3449 [2:19:15<23:47,  2.88s/it]                                                     {'loss': 1.0705, 'learning_rate': 2.126099945265969e-05, 'epoch': 0.86}
 86%|████████▌ | 2954/3449 [2:19:15<23:47,  2.88s/it] 86%|████████▌ | 2955/3449 [2:19:18<23:25,  2.84s/it]                                                     {'loss': 1.1354, 'learning_rate': 2.117690050033405e-05, 'epoch': 0.86}
 86%|████████▌ | 2955/3449 [2:19:18<23:25,  2.84s/it] 86%|████████▌ | 2956/3449 [2:19:21<23:28,  2.86s/it]                                                     {'loss': 1.329, 'learning_rate': 2.1092958907533622e-05, 'epoch': 0.86}
 86%|████████▌ | 2956/3449 [2:19:21<23:28,  2.86s/it] 86%|████████▌ | 2957/3449 [2:19:24<23:59,  2.93s/it]                                                     {'loss': 1.1565, 'learning_rate': 2.1009174748124782e-05, 'epoch': 0.86}
 86%|████████▌ | 2957/3449 [2:19:24<23:59,  2.93s/it] 86%|████████▌ | 2958/3449 [2:19:27<24:04,  2.94s/it]                                                     {'loss': 1.2324, 'learning_rate': 2.0925548095835313e-05, 'epoch': 0.86}
 86%|████████▌ | 2958/3449 [2:19:27<24:04,  2.94s/it] 86%|████████▌ | 2959/3449 [2:19:30<24:15,  2.97s/it]                                                     {'loss': 1.1674, 'learning_rate': 2.0842079024254457e-05, 'epoch': 0.86}
 86%|████████▌ | 2959/3449 [2:19:30<24:15,  2.97s/it] 86%|████████▌ | 2960/3449 [2:19:33<23:49,  2.92s/it]                                                     {'loss': 1.1181, 'learning_rate': 2.0758767606832728e-05, 'epoch': 0.86}
 86%|████████▌ | 2960/3449 [2:19:33<23:49,  2.92s/it] 86%|████████▌ | 2961/3449 [2:19:35<23:06,  2.84s/it]                                                     {'loss': 1.2307, 'learning_rate': 2.067561391688193e-05, 'epoch': 0.86}
 86%|████████▌ | 2961/3449 [2:19:35<23:06,  2.84s/it] 86%|████████▌ | 2962/3449 [2:19:39<24:45,  3.05s/it]                                                     {'loss': 0.94, 'learning_rate': 2.0592618027575106e-05, 'epoch': 0.86}
 86%|████████▌ | 2962/3449 [2:19:39<24:45,  3.05s/it] 86%|████████▌ | 2963/3449 [2:19:41<23:05,  2.85s/it]                                                     {'loss': 1.0498, 'learning_rate': 2.050978001194641e-05, 'epoch': 0.86}
 86%|████████▌ | 2963/3449 [2:19:41<23:05,  2.85s/it] 86%|████████▌ | 2964/3449 [2:19:44<24:17,  3.00s/it]                                                     {'loss': 1.287, 'learning_rate': 2.042709994289107e-05, 'epoch': 0.86}
 86%|████████▌ | 2964/3449 [2:19:45<24:17,  3.00s/it] 86%|████████▌ | 2965/3449 [2:19:47<22:40,  2.81s/it]                                                     {'loss': 1.2926, 'learning_rate': 2.034457789316524e-05, 'epoch': 0.86}
 86%|████████▌ | 2965/3449 [2:19:47<22:40,  2.81s/it] 86%|████████▌ | 2966/3449 [2:19:51<26:31,  3.30s/it]                                                     {'loss': 1.1133, 'learning_rate': 2.0262213935386232e-05, 'epoch': 0.86}
 86%|████████▌ | 2966/3449 [2:19:51<26:31,  3.30s/it] 86%|████████▌ | 2967/3449 [2:19:54<24:45,  3.08s/it]                                                     {'loss': 1.3774, 'learning_rate': 2.0180008142032092e-05, 'epoch': 0.86}
 86%|████████▌ | 2967/3449 [2:19:54<24:45,  3.08s/it] 86%|████████▌ | 2968/3449 [2:19:57<25:02,  3.12s/it]                                                     {'loss': 1.1204, 'learning_rate': 2.0097960585441645e-05, 'epoch': 0.86}
 86%|████████▌ | 2968/3449 [2:19:57<25:02,  3.12s/it] 86%|████████▌ | 2969/3449 [2:20:00<24:16,  3.04s/it]                                                     {'loss': 1.1569, 'learning_rate': 2.0016071337814558e-05, 'epoch': 0.86}
 86%|████████▌ | 2969/3449 [2:20:00<24:16,  3.04s/it] 86%|████████▌ | 2970/3449 [2:20:03<23:25,  2.93s/it]                                                     {'loss': 1.1471, 'learning_rate': 1.993434047121123e-05, 'epoch': 0.86}
 86%|████████▌ | 2970/3449 [2:20:03<23:25,  2.93s/it] 86%|████████▌ | 2971/3449 [2:20:06<23:51,  2.99s/it]                                                     {'loss': 1.081, 'learning_rate': 1.9852768057552585e-05, 'epoch': 0.86}
 86%|████████▌ | 2971/3449 [2:20:06<23:51,  2.99s/it] 86%|████████▌ | 2972/3449 [2:20:09<23:24,  2.94s/it]                                                     {'loss': 1.2108, 'learning_rate': 1.9771354168620125e-05, 'epoch': 0.86}
 86%|████████▌ | 2972/3449 [2:20:09<23:24,  2.94s/it] 86%|████████▌ | 2973/3449 [2:20:11<23:17,  2.94s/it]                                                     {'loss': 1.2698, 'learning_rate': 1.9690098876055953e-05, 'epoch': 0.86}
 86%|████████▌ | 2973/3449 [2:20:12<23:17,  2.94s/it] 86%|████████▌ | 2974/3449 [2:20:14<22:06,  2.79s/it]                                                     {'loss': 1.1888, 'learning_rate': 1.9609002251362486e-05, 'epoch': 0.86}
 86%|████████▌ | 2974/3449 [2:20:14<22:06,  2.79s/it] 86%|████████▋ | 2975/3449 [2:20:17<21:33,  2.73s/it]                                                     {'loss': 1.1195, 'learning_rate': 1.95280643659026e-05, 'epoch': 0.86}
 86%|████████▋ | 2975/3449 [2:20:17<21:33,  2.73s/it] 86%|████████▋ | 2976/3449 [2:20:20<22:11,  2.81s/it]                                                     {'loss': 1.2994, 'learning_rate': 1.9447285290899474e-05, 'epoch': 0.86}
 86%|████████▋ | 2976/3449 [2:20:20<22:11,  2.81s/it] 86%|████████▋ | 2977/3449 [2:20:23<22:46,  2.90s/it]                                                     {'loss': 1.2338, 'learning_rate': 1.9366665097436497e-05, 'epoch': 0.86}
 86%|████████▋ | 2977/3449 [2:20:23<22:46,  2.90s/it] 86%|████████▋ | 2978/3449 [2:20:25<21:12,  2.70s/it]                                                     {'loss': 1.177, 'learning_rate': 1.928620385645734e-05, 'epoch': 0.86}
 86%|████████▋ | 2978/3449 [2:20:25<21:12,  2.70s/it] 86%|████████▋ | 2979/3449 [2:20:27<20:56,  2.67s/it]                                                     {'loss': 1.2411, 'learning_rate': 1.9205901638765612e-05, 'epoch': 0.86}
 86%|████████▋ | 2979/3449 [2:20:27<20:56,  2.67s/it] 86%|████████▋ | 2980/3449 [2:20:30<20:08,  2.58s/it]                                                     {'loss': 1.1876, 'learning_rate': 1.9125758515025205e-05, 'epoch': 0.86}
 86%|████████▋ | 2980/3449 [2:20:30<20:08,  2.58s/it] 86%|████████▋ | 2981/3449 [2:20:32<19:05,  2.45s/it]                                                     {'loss': 1.2754, 'learning_rate': 1.904577455575991e-05, 'epoch': 0.86}
 86%|████████▋ | 2981/3449 [2:20:32<19:05,  2.45s/it] 86%|████████▋ | 2982/3449 [2:20:35<21:25,  2.75s/it]                                                     {'loss': 1.1749, 'learning_rate': 1.8965949831353403e-05, 'epoch': 0.86}
 86%|████████▋ | 2982/3449 [2:20:35<21:25,  2.75s/it] 86%|████████▋ | 2983/3449 [2:20:38<21:32,  2.77s/it]                                                     {'loss': 1.1482, 'learning_rate': 1.8886284412049337e-05, 'epoch': 0.86}
 86%|████████▋ | 2983/3449 [2:20:38<21:32,  2.77s/it] 87%|████████▋ | 2984/3449 [2:20:41<20:47,  2.68s/it]                                                     {'loss': 1.1196, 'learning_rate': 1.8806778367951218e-05, 'epoch': 0.87}
 87%|████████▋ | 2984/3449 [2:20:41<20:47,  2.68s/it] 87%|████████▋ | 2985/3449 [2:20:44<21:23,  2.77s/it]                                                     {'loss': 1.3412, 'learning_rate': 1.8727431769022098e-05, 'epoch': 0.87}
 87%|████████▋ | 2985/3449 [2:20:44<21:23,  2.77s/it] 87%|████████▋ | 2986/3449 [2:20:46<20:42,  2.68s/it]                                                     {'loss': 1.2215, 'learning_rate': 1.8648244685084858e-05, 'epoch': 0.87}
 87%|████████▋ | 2986/3449 [2:20:46<20:42,  2.68s/it] 87%|████████▋ | 2987/3449 [2:20:49<20:56,  2.72s/it]                                                     {'loss': 1.1714, 'learning_rate': 1.8569217185822164e-05, 'epoch': 0.87}
 87%|████████▋ | 2987/3449 [2:20:49<20:56,  2.72s/it] 87%|████████▋ | 2988/3449 [2:20:51<20:09,  2.62s/it]                                                     {'loss': 1.2181, 'learning_rate': 1.8490349340775916e-05, 'epoch': 0.87}
 87%|████████▋ | 2988/3449 [2:20:51<20:09,  2.62s/it] 87%|████████▋ | 2989/3449 [2:20:54<20:08,  2.63s/it]                                                     {'loss': 1.1393, 'learning_rate': 1.8411641219347775e-05, 'epoch': 0.87}
 87%|████████▋ | 2989/3449 [2:20:54<20:08,  2.63s/it] 87%|████████▋ | 2990/3449 [2:20:56<19:34,  2.56s/it]                                                     {'loss': 1.3228, 'learning_rate': 1.8333092890798788e-05, 'epoch': 0.87}
 87%|████████▋ | 2990/3449 [2:20:56<19:34,  2.56s/it] 87%|████████▋ | 2991/3449 [2:21:02<27:01,  3.54s/it]                                                     {'loss': 1.1247, 'learning_rate': 1.8254704424249324e-05, 'epoch': 0.87}
 87%|████████▋ | 2991/3449 [2:21:02<27:01,  3.54s/it] 87%|████████▋ | 2992/3449 [2:21:05<24:49,  3.26s/it]                                                     {'loss': 1.3653, 'learning_rate': 1.817647588867919e-05, 'epoch': 0.87}
 87%|████████▋ | 2992/3449 [2:21:05<24:49,  3.26s/it] 87%|████████▋ | 2993/3449 [2:21:08<23:59,  3.16s/it]                                                     {'loss': 1.2809, 'learning_rate': 1.809840735292736e-05, 'epoch': 0.87}
 87%|████████▋ | 2993/3449 [2:21:08<23:59,  3.16s/it] 87%|████████▋ | 2994/3449 [2:21:11<23:21,  3.08s/it]                                                     {'loss': 1.0852, 'learning_rate': 1.802049888569204e-05, 'epoch': 0.87}
 87%|████████▋ | 2994/3449 [2:21:11<23:21,  3.08s/it] 87%|████████▋ | 2995/3449 [2:21:14<22:45,  3.01s/it]                                                     {'loss': 1.1379, 'learning_rate': 1.794275055553065e-05, 'epoch': 0.87}
 87%|████████▋ | 2995/3449 [2:21:14<22:45,  3.01s/it] 87%|████████▋ | 2996/3449 [2:21:17<24:36,  3.26s/it]                                                     {'loss': 1.2159, 'learning_rate': 1.7865162430859496e-05, 'epoch': 0.87}
 87%|████████▋ | 2996/3449 [2:21:17<24:36,  3.26s/it] 87%|████████▋ | 2997/3449 [2:21:21<24:18,  3.23s/it]                                                     {'loss': 1.0354, 'learning_rate': 1.7787734579954195e-05, 'epoch': 0.87}
 87%|████████▋ | 2997/3449 [2:21:21<24:18,  3.23s/it] 87%|████████▋ | 2998/3449 [2:21:23<23:08,  3.08s/it]                                                     {'loss': 1.3856, 'learning_rate': 1.7710467070949142e-05, 'epoch': 0.87}
 87%|████████▋ | 2998/3449 [2:21:23<23:08,  3.08s/it] 87%|████████▋ | 2999/3449 [2:21:26<22:19,  2.98s/it]                                                     {'loss': 1.1133, 'learning_rate': 1.763335997183757e-05, 'epoch': 0.87}
 87%|████████▋ | 2999/3449 [2:21:26<22:19,  2.98s/it] 87%|████████▋ | 3000/3449 [2:21:29<21:15,  2.84s/it]                                                     {'loss': 1.2981, 'learning_rate': 1.75564133504718e-05, 'epoch': 0.87}
 87%|████████▋ | 3000/3449 [2:21:29<21:15,  2.84s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
  warnings.warn(
 87%|████████▋ | 3001/3449 [2:21:32<21:32,  2.89s/it]                                                     {'loss': 1.2427, 'learning_rate': 1.7479627274562672e-05, 'epoch': 0.87}
 87%|████████▋ | 3001/3449 [2:21:32<21:32,  2.89s/it] 87%|████████▋ | 3002/3449 [2:21:34<21:31,  2.89s/it]                                                     {'loss': 1.1127, 'learning_rate': 1.7403001811679932e-05, 'epoch': 0.87}
 87%|████████▋ | 3002/3449 [2:21:34<21:31,  2.89s/it] 87%|████████▋ | 3003/3449 [2:21:38<22:47,  3.07s/it]                                                     {'loss': 1.2479, 'learning_rate': 1.7326537029251933e-05, 'epoch': 0.87}
 87%|████████▋ | 3003/3449 [2:21:38<22:47,  3.07s/it] 87%|████████▋ | 3004/3449 [2:21:41<22:32,  3.04s/it]                                                     {'loss': 1.1347, 'learning_rate': 1.7250232994565606e-05, 'epoch': 0.87}
 87%|████████▋ | 3004/3449 [2:21:41<22:32,  3.04s/it] 87%|████████▋ | 3005/3449 [2:21:43<20:35,  2.78s/it]                                                     {'loss': 1.218, 'learning_rate': 1.7174089774766443e-05, 'epoch': 0.87}
 87%|████████▋ | 3005/3449 [2:21:43<20:35,  2.78s/it] 87%|████████▋ | 3006/3449 [2:21:46<20:40,  2.80s/it]                                                     {'loss': 1.1078, 'learning_rate': 1.709810743685847e-05, 'epoch': 0.87}
 87%|████████▋ | 3006/3449 [2:21:46<20:40,  2.80s/it] 87%|████████▋ | 3007/3449 [2:21:48<19:25,  2.64s/it]                                                     {'loss': 1.3854, 'learning_rate': 1.7022286047704082e-05, 'epoch': 0.87}
 87%|████████▋ | 3007/3449 [2:21:48<19:25,  2.64s/it] 87%|████████▋ | 3008/3449 [2:21:51<19:55,  2.71s/it]                                                     {'loss': 1.243, 'learning_rate': 1.6946625674024052e-05, 'epoch': 0.87}
 87%|████████▋ | 3008/3449 [2:21:51<19:55,  2.71s/it] 87%|████████▋ | 3009/3449 [2:21:54<20:09,  2.75s/it]                                                     {'loss': 1.1764, 'learning_rate': 1.6871126382397516e-05, 'epoch': 0.87}
 87%|████████▋ | 3009/3449 [2:21:54<20:09,  2.75s/it] 87%|████████▋ | 3010/3449 [2:21:56<19:28,  2.66s/it]                                                     {'loss': 1.1269, 'learning_rate': 1.679578823926178e-05, 'epoch': 0.87}
 87%|████████▋ | 3010/3449 [2:21:56<19:28,  2.66s/it] 87%|████████▋ | 3011/3449 [2:21:59<19:33,  2.68s/it]                                                     {'loss': 1.2676, 'learning_rate': 1.672061131091245e-05, 'epoch': 0.87}
 87%|████████▋ | 3011/3449 [2:21:59<19:33,  2.68s/it] 87%|████████▋ | 3012/3449 [2:22:02<19:49,  2.72s/it]                                                     {'loss': 1.1869, 'learning_rate': 1.6645595663503122e-05, 'epoch': 0.87}
 87%|████████▋ | 3012/3449 [2:22:02<19:49,  2.72s/it] 87%|████████▋ | 3013/3449 [2:22:05<21:18,  2.93s/it]                                                     {'loss': 1.0474, 'learning_rate': 1.657074136304555e-05, 'epoch': 0.87}
 87%|████████▋ | 3013/3449 [2:22:05<21:18,  2.93s/it] 87%|████████▋ | 3014/3449 [2:22:08<20:34,  2.84s/it]                                                     {'loss': 1.1431, 'learning_rate': 1.6496048475409643e-05, 'epoch': 0.87}
 87%|████████▋ | 3014/3449 [2:22:08<20:34,  2.84s/it] 87%|████████▋ | 3015/3449 [2:22:11<21:20,  2.95s/it]                                                     {'loss': 1.0896, 'learning_rate': 1.6421517066322976e-05, 'epoch': 0.87}
 87%|████████▋ | 3015/3449 [2:22:11<21:20,  2.95s/it] 87%|████████▋ | 3016/3449 [2:22:14<21:39,  3.00s/it]                                                     {'loss': 1.1337, 'learning_rate': 1.6347147201371228e-05, 'epoch': 0.87}
 87%|████████▋ | 3016/3449 [2:22:14<21:39,  3.00s/it] 87%|████████▋ | 3017/3449 [2:22:17<20:17,  2.82s/it]                                                     {'loss': 1.1946, 'learning_rate': 1.627293894599797e-05, 'epoch': 0.87}
 87%|████████▋ | 3017/3449 [2:22:17<20:17,  2.82s/it] 88%|████████▊ | 3018/3449 [2:22:19<19:06,  2.66s/it]                                                     {'loss': 1.1951, 'learning_rate': 1.6198892365504403e-05, 'epoch': 0.87}
 88%|████████▊ | 3018/3449 [2:22:19<19:06,  2.66s/it] 88%|████████▊ | 3019/3449 [2:22:22<19:38,  2.74s/it]                                                     {'loss': 1.2758, 'learning_rate': 1.6125007525049508e-05, 'epoch': 0.88}
 88%|████████▊ | 3019/3449 [2:22:22<19:38,  2.74s/it] 88%|████████▊ | 3020/3449 [2:22:25<19:59,  2.80s/it]                                                     {'loss': 1.1122, 'learning_rate': 1.605128448965001e-05, 'epoch': 0.88}
 88%|████████▊ | 3020/3449 [2:22:25<19:59,  2.80s/it] 88%|████████▊ | 3021/3449 [2:22:30<25:06,  3.52s/it]                                                     {'loss': 1.2284, 'learning_rate': 1.597772332418017e-05, 'epoch': 0.88}
 88%|████████▊ | 3021/3449 [2:22:30<25:06,  3.52s/it] 88%|████████▊ | 3022/3449 [2:22:32<22:31,  3.17s/it]                                                     {'loss': 1.232, 'learning_rate': 1.590432409337186e-05, 'epoch': 0.88}
 88%|████████▊ | 3022/3449 [2:22:32<22:31,  3.17s/it] 88%|████████▊ | 3023/3449 [2:22:35<21:02,  2.96s/it]                                                     {'loss': 1.2455, 'learning_rate': 1.5831086861814404e-05, 'epoch': 0.88}
 88%|████████▊ | 3023/3449 [2:22:35<21:02,  2.96s/it] 88%|████████▊ | 3024/3449 [2:22:38<21:04,  2.98s/it]                                                     {'loss': 1.2027, 'learning_rate': 1.575801169395461e-05, 'epoch': 0.88}
 88%|████████▊ | 3024/3449 [2:22:38<21:04,  2.98s/it] 88%|████████▊ | 3025/3449 [2:22:41<20:54,  2.96s/it]                                                     {'loss': 1.3046, 'learning_rate': 1.568509865409673e-05, 'epoch': 0.88}
 88%|████████▊ | 3025/3449 [2:22:41<20:54,  2.96s/it] 88%|████████▊ | 3026/3449 [2:22:44<20:52,  2.96s/it]                                                     {'loss': 1.1795, 'learning_rate': 1.5612347806402127e-05, 'epoch': 0.88}
 88%|████████▊ | 3026/3449 [2:22:44<20:52,  2.96s/it] 88%|████████▊ | 3027/3449 [2:22:46<19:35,  2.78s/it]                                                     {'loss': 1.3274, 'learning_rate': 1.5539759214889725e-05, 'epoch': 0.88}
 88%|████████▊ | 3027/3449 [2:22:46<19:35,  2.78s/it] 88%|████████▊ | 3028/3449 [2:22:49<19:38,  2.80s/it]                                                     {'loss': 1.1827, 'learning_rate': 1.5467332943435543e-05, 'epoch': 0.88}
 88%|████████▊ | 3028/3449 [2:22:49<19:38,  2.80s/it] 88%|████████▊ | 3029/3449 [2:22:52<19:50,  2.84s/it]                                                     {'loss': 1.1546, 'learning_rate': 1.539506905577266e-05, 'epoch': 0.88}
 88%|████████▊ | 3029/3449 [2:22:52<19:50,  2.84s/it] 88%|████████▊ | 3030/3449 [2:22:54<18:37,  2.67s/it]                                                     {'loss': 1.2797, 'learning_rate': 1.5322967615491367e-05, 'epoch': 0.88}
 88%|████████▊ | 3030/3449 [2:22:54<18:37,  2.67s/it] 88%|████████▊ | 3031/3449 [2:22:57<20:02,  2.88s/it]                                                     {'loss': 1.1132, 'learning_rate': 1.5251028686039115e-05, 'epoch': 0.88}
 88%|████████▊ | 3031/3449 [2:22:57<20:02,  2.88s/it] 88%|████████▊ | 3032/3449 [2:23:00<19:16,  2.77s/it]                                                     {'loss': 1.2323, 'learning_rate': 1.5179252330720107e-05, 'epoch': 0.88}
 88%|████████▊ | 3032/3449 [2:23:00<19:16,  2.77s/it] 88%|████████▊ | 3033/3449 [2:23:03<20:16,  2.93s/it]                                                     {'loss': 1.1206, 'learning_rate': 1.5107638612695619e-05, 'epoch': 0.88}
 88%|████████▊ | 3033/3449 [2:23:03<20:16,  2.93s/it] 88%|████████▊ | 3034/3449 [2:23:06<20:21,  2.94s/it]                                                     {'loss': 1.2563, 'learning_rate': 1.5036187594983885e-05, 'epoch': 0.88}
 88%|████████▊ | 3034/3449 [2:23:06<20:21,  2.94s/it] 88%|████████▊ | 3035/3449 [2:23:09<20:17,  2.94s/it]                                                     {'loss': 1.3114, 'learning_rate': 1.4964899340459793e-05, 'epoch': 0.88}
 88%|████████▊ | 3035/3449 [2:23:09<20:17,  2.94s/it] 88%|████████▊ | 3036/3449 [2:23:12<19:41,  2.86s/it]                                                     {'loss': 1.1985, 'learning_rate': 1.4893773911855136e-05, 'epoch': 0.88}
 88%|████████▊ | 3036/3449 [2:23:12<19:41,  2.86s/it] 88%|████████▊ | 3037/3449 [2:23:14<18:56,  2.76s/it]                                                     {'loss': 1.305, 'learning_rate': 1.4822811371758361e-05, 'epoch': 0.88}
 88%|████████▊ | 3037/3449 [2:23:14<18:56,  2.76s/it] 88%|████████▊ | 3038/3449 [2:23:17<17:51,  2.61s/it]                                                     {'loss': 1.3361, 'learning_rate': 1.4752011782614605e-05, 'epoch': 0.88}
 88%|████████▊ | 3038/3449 [2:23:17<17:51,  2.61s/it] 88%|████████▊ | 3039/3449 [2:23:20<18:23,  2.69s/it]                                                     {'loss': 1.3119, 'learning_rate': 1.4681375206725656e-05, 'epoch': 0.88}
 88%|████████▊ | 3039/3449 [2:23:20<18:23,  2.69s/it] 88%|████████▊ | 3040/3449 [2:23:23<19:21,  2.84s/it]                                                     {'loss': 1.2258, 'learning_rate': 1.461090170624968e-05, 'epoch': 0.88}
 88%|████████▊ | 3040/3449 [2:23:23<19:21,  2.84s/it] 88%|████████▊ | 3041/3449 [2:23:26<19:23,  2.85s/it]                                                     {'loss': 1.2066, 'learning_rate': 1.4540591343201582e-05, 'epoch': 0.88}
 88%|████████▊ | 3041/3449 [2:23:26<19:23,  2.85s/it] 88%|████████▊ | 3042/3449 [2:23:28<18:21,  2.71s/it]                                                     {'loss': 1.3402, 'learning_rate': 1.4470444179452558e-05, 'epoch': 0.88}
 88%|████████▊ | 3042/3449 [2:23:28<18:21,  2.71s/it] 88%|████████▊ | 3043/3449 [2:23:31<18:04,  2.67s/it]                                                     {'loss': 1.2561, 'learning_rate': 1.4400460276730188e-05, 'epoch': 0.88}
 88%|████████▊ | 3043/3449 [2:23:31<18:04,  2.67s/it] 88%|████████▊ | 3044/3449 [2:23:33<17:49,  2.64s/it]                                                     {'loss': 1.161, 'learning_rate': 1.4330639696618476e-05, 'epoch': 0.88}
 88%|████████▊ | 3044/3449 [2:23:33<17:49,  2.64s/it] 88%|████████▊ | 3045/3449 [2:23:36<17:33,  2.61s/it]                                                     {'loss': 1.2317, 'learning_rate': 1.4260982500557673e-05, 'epoch': 0.88}
 88%|████████▊ | 3045/3449 [2:23:36<17:33,  2.61s/it] 88%|████████▊ | 3046/3449 [2:23:38<17:38,  2.63s/it]                                                     {'loss': 1.0806, 'learning_rate': 1.4191488749844174e-05, 'epoch': 0.88}
 88%|████████▊ | 3046/3449 [2:23:38<17:38,  2.63s/it] 88%|████████▊ | 3047/3449 [2:23:42<18:48,  2.81s/it]                                                     {'loss': 1.1892, 'learning_rate': 1.4122158505630656e-05, 'epoch': 0.88}
 88%|████████▊ | 3047/3449 [2:23:42<18:48,  2.81s/it] 88%|████████▊ | 3048/3449 [2:23:44<17:52,  2.67s/it]                                                     {'loss': 1.3365, 'learning_rate': 1.4052991828925876e-05, 'epoch': 0.88}
 88%|████████▊ | 3048/3449 [2:23:44<17:52,  2.67s/it] 88%|████████▊ | 3049/3449 [2:23:47<18:17,  2.74s/it]                                                     {'loss': 1.1823, 'learning_rate': 1.3983988780594614e-05, 'epoch': 0.88}
 88%|████████▊ | 3049/3449 [2:23:47<18:17,  2.74s/it] 88%|████████▊ | 3050/3449 [2:23:50<18:38,  2.80s/it]                                                     {'loss': 1.1818, 'learning_rate': 1.3915149421357743e-05, 'epoch': 0.88}
 88%|████████▊ | 3050/3449 [2:23:50<18:38,  2.80s/it] 88%|████████▊ | 3051/3449 [2:23:53<19:52,  3.00s/it]                                                     {'loss': 0.9662, 'learning_rate': 1.3846473811792048e-05, 'epoch': 0.88}
 88%|████████▊ | 3051/3449 [2:23:53<19:52,  3.00s/it] 88%|████████▊ | 3052/3449 [2:23:56<19:09,  2.89s/it]                                                     {'loss': 1.1567, 'learning_rate': 1.3777962012330193e-05, 'epoch': 0.88}
 88%|████████▊ | 3052/3449 [2:23:56<19:09,  2.89s/it] 89%|████████▊ | 3053/3449 [2:23:59<19:22,  2.94s/it]                                                     {'loss': 1.0814, 'learning_rate': 1.3709614083260725e-05, 'epoch': 0.89}
 89%|████████▊ | 3053/3449 [2:23:59<19:22,  2.94s/it] 89%|████████▊ | 3054/3449 [2:24:03<20:40,  3.14s/it]                                                     {'loss': 1.2333, 'learning_rate': 1.3641430084728003e-05, 'epoch': 0.89}
 89%|████████▊ | 3054/3449 [2:24:03<20:40,  3.14s/it] 89%|████████▊ | 3055/3449 [2:24:05<20:06,  3.06s/it]                                                     {'loss': 1.1542, 'learning_rate': 1.3573410076732119e-05, 'epoch': 0.89}
 89%|████████▊ | 3055/3449 [2:24:05<20:06,  3.06s/it] 89%|████████▊ | 3056/3449 [2:24:08<19:42,  3.01s/it]                                                     {'loss': 1.055, 'learning_rate': 1.350555411912886e-05, 'epoch': 0.89}
 89%|████████▊ | 3056/3449 [2:24:08<19:42,  3.01s/it] 89%|████████▊ | 3057/3449 [2:24:10<18:01,  2.76s/it]                                                     {'loss': 1.3008, 'learning_rate': 1.3437862271629575e-05, 'epoch': 0.89}
 89%|████████▊ | 3057/3449 [2:24:10<18:01,  2.76s/it] 89%|████████▊ | 3058/3449 [2:24:14<18:46,  2.88s/it]                                                     {'loss': 1.2059, 'learning_rate': 1.337033459380137e-05, 'epoch': 0.89}
 89%|████████▊ | 3058/3449 [2:24:14<18:46,  2.88s/it] 89%|████████▊ | 3059/3449 [2:24:16<17:59,  2.77s/it]                                                     {'loss': 1.3335, 'learning_rate': 1.3302971145066756e-05, 'epoch': 0.89}
 89%|████████▊ | 3059/3449 [2:24:16<17:59,  2.77s/it] 89%|████████▊ | 3060/3449 [2:24:18<16:39,  2.57s/it]                                                     {'loss': 1.3936, 'learning_rate': 1.3235771984703693e-05, 'epoch': 0.89}
 89%|████████▊ | 3060/3449 [2:24:18<16:39,  2.57s/it] 89%|████████▉ | 3061/3449 [2:24:21<16:38,  2.57s/it]                                                     {'loss': 1.2971, 'learning_rate': 1.3168737171845747e-05, 'epoch': 0.89}
 89%|████████▉ | 3061/3449 [2:24:21<16:38,  2.57s/it] 89%|████████▉ | 3062/3449 [2:24:24<17:33,  2.72s/it]                                                     {'loss': 1.2968, 'learning_rate': 1.3101866765481663e-05, 'epoch': 0.89}
 89%|████████▉ | 3062/3449 [2:24:24<17:33,  2.72s/it] 89%|████████▉ | 3063/3449 [2:24:27<18:14,  2.84s/it]                                                     {'loss': 1.3111, 'learning_rate': 1.3035160824455661e-05, 'epoch': 0.89}
 89%|████████▉ | 3063/3449 [2:24:27<18:14,  2.84s/it] 89%|████████▉ | 3064/3449 [2:24:30<18:40,  2.91s/it]                                                     {'loss': 1.3049, 'learning_rate': 1.296861940746712e-05, 'epoch': 0.89}
 89%|████████▉ | 3064/3449 [2:24:30<18:40,  2.91s/it] 89%|████████▉ | 3065/3449 [2:24:33<17:48,  2.78s/it]                                                     {'loss': 1.2237, 'learning_rate': 1.2902242573070755e-05, 'epoch': 0.89}
 89%|████████▉ | 3065/3449 [2:24:33<17:48,  2.78s/it] 89%|████████▉ | 3066/3449 [2:24:36<18:45,  2.94s/it]                                                     {'loss': 1.0949, 'learning_rate': 1.2836030379676378e-05, 'epoch': 0.89}
 89%|████████▉ | 3066/3449 [2:24:36<18:45,  2.94s/it] 89%|████████▉ | 3067/3449 [2:24:39<18:44,  2.94s/it]                                                     {'loss': 1.2077, 'learning_rate': 1.2769982885548937e-05, 'epoch': 0.89}
 89%|████████▉ | 3067/3449 [2:24:39<18:44,  2.94s/it] 89%|████████▉ | 3068/3449 [2:24:42<18:16,  2.88s/it]                                                     {'loss': 1.1737, 'learning_rate': 1.2704100148808452e-05, 'epoch': 0.89}
 89%|████████▉ | 3068/3449 [2:24:42<18:16,  2.88s/it] 89%|████████▉ | 3069/3449 [2:24:44<18:13,  2.88s/it]                                                     {'loss': 1.3608, 'learning_rate': 1.2638382227429967e-05, 'epoch': 0.89}
 89%|████████▉ | 3069/3449 [2:24:44<18:13,  2.88s/it] 89%|████████▉ | 3070/3449 [2:24:47<18:07,  2.87s/it]                                                     {'loss': 1.2672, 'learning_rate': 1.2572829179243495e-05, 'epoch': 0.89}
 89%|████████▉ | 3070/3449 [2:24:47<18:07,  2.87s/it] 89%|████████▉ | 3071/3449 [2:24:51<19:02,  3.02s/it]                                                     {'loss': 1.318, 'learning_rate': 1.2507441061933933e-05, 'epoch': 0.89}
 89%|████████▉ | 3071/3449 [2:24:51<19:02,  3.02s/it] 89%|████████▉ | 3072/3449 [2:24:54<19:23,  3.09s/it]                                                     {'loss': 1.0944, 'learning_rate': 1.2442217933041122e-05, 'epoch': 0.89}
 89%|████████▉ | 3072/3449 [2:24:54<19:23,  3.09s/it] 89%|████████▉ | 3073/3449 [2:24:56<18:23,  2.93s/it]                                                     {'loss': 1.2341, 'learning_rate': 1.2377159849959597e-05, 'epoch': 0.89}
 89%|████████▉ | 3073/3449 [2:24:56<18:23,  2.93s/it] 89%|████████▉ | 3074/3449 [2:24:59<17:53,  2.86s/it]                                                     {'loss': 1.251, 'learning_rate': 1.2312266869938738e-05, 'epoch': 0.89}
 89%|████████▉ | 3074/3449 [2:24:59<17:53,  2.86s/it] 89%|████████▉ | 3075/3449 [2:25:02<17:34,  2.82s/it]                                                     {'loss': 1.1715, 'learning_rate': 1.224753905008269e-05, 'epoch': 0.89}
 89%|████████▉ | 3075/3449 [2:25:02<17:34,  2.82s/it] 89%|████████▉ | 3076/3449 [2:25:04<16:27,  2.65s/it]                                                     {'loss': 1.2116, 'learning_rate': 1.2182976447350113e-05, 'epoch': 0.89}
 89%|████████▉ | 3076/3449 [2:25:04<16:27,  2.65s/it] 89%|████████▉ | 3077/3449 [2:25:06<15:50,  2.55s/it]                                                     {'loss': 1.2775, 'learning_rate': 1.2118579118554362e-05, 'epoch': 0.89}
 89%|████████▉ | 3077/3449 [2:25:06<15:50,  2.55s/it] 89%|████████▉ | 3078/3449 [2:25:10<17:18,  2.80s/it]                                                     {'loss': 1.192, 'learning_rate': 1.2054347120363462e-05, 'epoch': 0.89}
 89%|████████▉ | 3078/3449 [2:25:10<17:18,  2.80s/it] 89%|████████▉ | 3079/3449 [2:25:12<16:49,  2.73s/it]                                                     {'loss': 1.2659, 'learning_rate': 1.1990280509299755e-05, 'epoch': 0.89}
 89%|████████▉ | 3079/3449 [2:25:12<16:49,  2.73s/it] 89%|████████▉ | 3080/3449 [2:25:15<17:07,  2.78s/it]                                                     {'loss': 1.2264, 'learning_rate': 1.1926379341740146e-05, 'epoch': 0.89}
 89%|████████▉ | 3080/3449 [2:25:15<17:07,  2.78s/it] 89%|████████▉ | 3081/3449 [2:25:18<16:48,  2.74s/it]                                                     {'loss': 1.1748, 'learning_rate': 1.1862643673915964e-05, 'epoch': 0.89}
 89%|████████▉ | 3081/3449 [2:25:18<16:48,  2.74s/it] 89%|████████▉ | 3082/3449 [2:25:21<17:03,  2.79s/it]                                                     {'loss': 1.1746, 'learning_rate': 1.1799073561912877e-05, 'epoch': 0.89}
 89%|████████▉ | 3082/3449 [2:25:21<17:03,  2.79s/it] 89%|████████▉ | 3083/3449 [2:25:23<16:39,  2.73s/it]                                                     {'loss': 1.1777, 'learning_rate': 1.1735669061670873e-05, 'epoch': 0.89}
 89%|████████▉ | 3083/3449 [2:25:23<16:39,  2.73s/it] 89%|████████▉ | 3084/3449 [2:25:26<16:40,  2.74s/it]                                                     {'loss': 1.3516, 'learning_rate': 1.1672430228984233e-05, 'epoch': 0.89}
 89%|████████▉ | 3084/3449 [2:25:26<16:40,  2.74s/it] 89%|████████▉ | 3085/3449 [2:25:29<16:33,  2.73s/it]                                                     {'loss': 1.3742, 'learning_rate': 1.1609357119501419e-05, 'epoch': 0.89}
 89%|████████▉ | 3085/3449 [2:25:29<16:33,  2.73s/it] 89%|████████▉ | 3086/3449 [2:25:32<17:41,  2.92s/it]                                                     {'loss': 1.1458, 'learning_rate': 1.15464497887251e-05, 'epoch': 0.89}
 89%|████████▉ | 3086/3449 [2:25:32<17:41,  2.92s/it] 90%|████████▉ | 3087/3449 [2:25:35<17:10,  2.85s/it]                                                     {'loss': 1.1822, 'learning_rate': 1.148370829201193e-05, 'epoch': 0.89}
 90%|████████▉ | 3087/3449 [2:25:35<17:10,  2.85s/it] 90%|████████▉ | 3088/3449 [2:25:37<15:56,  2.65s/it]                                                     {'loss': 1.3675, 'learning_rate': 1.1421132684572855e-05, 'epoch': 0.9}
 90%|████████▉ | 3088/3449 [2:25:37<15:56,  2.65s/it] 90%|████████▉ | 3089/3449 [2:25:40<16:10,  2.70s/it]                                                     {'loss': 1.2201, 'learning_rate': 1.1358723021472739e-05, 'epoch': 0.9}
 90%|████████▉ | 3089/3449 [2:25:40<16:10,  2.70s/it] 90%|████████▉ | 3090/3449 [2:25:43<16:03,  2.68s/it]                                                     {'loss': 1.344, 'learning_rate': 1.129647935763032e-05, 'epoch': 0.9}
 90%|████████▉ | 3090/3449 [2:25:43<16:03,  2.68s/it] 90%|████████▉ | 3091/3449 [2:25:45<16:15,  2.72s/it]                                                     {'loss': 1.2957, 'learning_rate': 1.1234401747818357e-05, 'epoch': 0.9}
 90%|████████▉ | 3091/3449 [2:25:45<16:15,  2.72s/it] 90%|████████▉ | 3092/3449 [2:25:48<16:10,  2.72s/it]                                                     {'loss': 1.1958, 'learning_rate': 1.117249024666358e-05, 'epoch': 0.9}
 90%|████████▉ | 3092/3449 [2:25:48<16:10,  2.72s/it] 90%|████████▉ | 3093/3449 [2:25:51<15:46,  2.66s/it]                                                     {'loss': 1.2087, 'learning_rate': 1.1110744908646365e-05, 'epoch': 0.9}
 90%|████████▉ | 3093/3449 [2:25:51<15:46,  2.66s/it] 90%|████████▉ | 3094/3449 [2:25:54<16:13,  2.74s/it]                                                     {'loss': 1.1215, 'learning_rate': 1.1049165788100935e-05, 'epoch': 0.9}
 90%|████████▉ | 3094/3449 [2:25:54<16:13,  2.74s/it] 90%|████████▉ | 3095/3449 [2:25:57<16:57,  2.88s/it]                                                     {'loss': 1.2768, 'learning_rate': 1.0987752939215345e-05, 'epoch': 0.9}
 90%|████████▉ | 3095/3449 [2:25:57<16:57,  2.88s/it] 90%|████████▉ | 3096/3449 [2:25:59<15:51,  2.70s/it]                                                     {'loss': 1.1981, 'learning_rate': 1.092650641603119e-05, 'epoch': 0.9}
 90%|████████▉ | 3096/3449 [2:25:59<15:51,  2.70s/it] 90%|████████▉ | 3097/3449 [2:26:01<15:05,  2.57s/it]                                                     {'loss': 1.3904, 'learning_rate': 1.0865426272443779e-05, 'epoch': 0.9}
 90%|████████▉ | 3097/3449 [2:26:01<15:05,  2.57s/it] 90%|████████▉ | 3098/3449 [2:26:04<15:56,  2.73s/it]                                                     {'loss': 1.1571, 'learning_rate': 1.0804512562202007e-05, 'epoch': 0.9}
 90%|████████▉ | 3098/3449 [2:26:04<15:56,  2.73s/it] 90%|████████▉ | 3099/3449 [2:26:08<16:47,  2.88s/it]                                                     {'loss': 1.0951, 'learning_rate': 1.0743765338908285e-05, 'epoch': 0.9}
 90%|████████▉ | 3099/3449 [2:26:08<16:47,  2.88s/it] 90%|████████▉ | 3100/3449 [2:26:10<16:04,  2.76s/it]                                                     {'loss': 1.2688, 'learning_rate': 1.0683184656018563e-05, 'epoch': 0.9}
 90%|████████▉ | 3100/3449 [2:26:10<16:04,  2.76s/it] 90%|████████▉ | 3101/3449 [2:26:13<15:33,  2.68s/it]                                                     {'loss': 1.3051, 'learning_rate': 1.0622770566842177e-05, 'epoch': 0.9}
 90%|████████▉ | 3101/3449 [2:26:13<15:33,  2.68s/it] 90%|████████▉ | 3102/3449 [2:26:15<15:04,  2.61s/it]                                                     {'loss': 1.1458, 'learning_rate': 1.0562523124541957e-05, 'epoch': 0.9}
 90%|████████▉ | 3102/3449 [2:26:15<15:04,  2.61s/it] 90%|████████▉ | 3103/3449 [2:26:18<15:14,  2.64s/it]                                                     {'loss': 1.3478, 'learning_rate': 1.0502442382134026e-05, 'epoch': 0.9}
 90%|████████▉ | 3103/3449 [2:26:18<15:14,  2.64s/it] 90%|████████▉ | 3104/3449 [2:26:21<16:12,  2.82s/it]                                                     {'loss': 1.1978, 'learning_rate': 1.0442528392487738e-05, 'epoch': 0.9}
 90%|████████▉ | 3104/3449 [2:26:21<16:12,  2.82s/it] 90%|█████████ | 3105/3449 [2:26:24<15:34,  2.72s/it]                                                     {'loss': 1.2791, 'learning_rate': 1.0382781208325876e-05, 'epoch': 0.9}
 90%|█████████ | 3105/3449 [2:26:24<15:34,  2.72s/it] 90%|█████████ | 3106/3449 [2:26:27<16:17,  2.85s/it]                                                     {'loss': 1.1638, 'learning_rate': 1.0323200882224383e-05, 'epoch': 0.9}
 90%|█████████ | 3106/3449 [2:26:27<16:17,  2.85s/it] 90%|█████████ | 3107/3449 [2:26:29<15:41,  2.75s/it]                                                     {'loss': 1.2273, 'learning_rate': 1.0263787466612274e-05, 'epoch': 0.9}
 90%|█████████ | 3107/3449 [2:26:29<15:41,  2.75s/it] 90%|█████████ | 3108/3449 [2:26:32<15:30,  2.73s/it]                                                     {'loss': 1.2811, 'learning_rate': 1.0204541013771796e-05, 'epoch': 0.9}
 90%|█████████ | 3108/3449 [2:26:32<15:30,  2.73s/it] 90%|█████████ | 3109/3449 [2:26:35<16:07,  2.85s/it]                                                     {'loss': 1.0986, 'learning_rate': 1.0145461575838222e-05, 'epoch': 0.9}
 90%|█████████ | 3109/3449 [2:26:35<16:07,  2.85s/it] 90%|█████████ | 3110/3449 [2:26:38<16:24,  2.90s/it]                                                     {'loss': 1.2381, 'learning_rate': 1.0086549204799878e-05, 'epoch': 0.9}
 90%|█████████ | 3110/3449 [2:26:38<16:24,  2.90s/it] 90%|█████████ | 3111/3449 [2:26:40<15:20,  2.72s/it]                                                     {'loss': 1.1377, 'learning_rate': 1.0027803952498072e-05, 'epoch': 0.9}
 90%|█████████ | 3111/3449 [2:26:40<15:20,  2.72s/it] 90%|█████████ | 3112/3449 [2:26:43<14:57,  2.66s/it]                                                     {'loss': 1.159, 'learning_rate': 9.96922587062703e-06, 'epoch': 0.9}
 90%|█████████ | 3112/3449 [2:26:43<14:57,  2.66s/it] 90%|█████████ | 3113/3449 [2:26:45<14:27,  2.58s/it]                                                     {'loss': 1.3297, 'learning_rate': 9.910815010733921e-06, 'epoch': 0.9}
 90%|█████████ | 3113/3449 [2:26:45<14:27,  2.58s/it] 90%|█████████ | 3114/3449 [2:26:48<14:35,  2.61s/it]                                                     {'loss': 1.2827, 'learning_rate': 9.852571424218715e-06, 'epoch': 0.9}
 90%|█████████ | 3114/3449 [2:26:48<14:35,  2.61s/it] 90%|█████████ | 3115/3449 [2:26:51<14:40,  2.64s/it]                                                     {'loss': 1.1529, 'learning_rate': 9.794495162334216e-06, 'epoch': 0.9}
 90%|█████████ | 3115/3449 [2:26:51<14:40,  2.64s/it] 90%|█████████ | 3116/3449 [2:26:53<14:08,  2.55s/it]                                                     {'loss': 1.3389, 'learning_rate': 9.736586276185944e-06, 'epoch': 0.9}
 90%|█████████ | 3116/3449 [2:26:53<14:08,  2.55s/it] 90%|█████████ | 3117/3449 [2:26:56<15:21,  2.77s/it]                                                     {'loss': 1.2185, 'learning_rate': 9.678844816732202e-06, 'epoch': 0.9}
 90%|█████████ | 3117/3449 [2:26:56<15:21,  2.77s/it] 90%|█████████ | 3118/3449 [2:26:59<15:14,  2.76s/it]                                                     {'loss': 1.178, 'learning_rate': 9.621270834783902e-06, 'epoch': 0.9}
 90%|█████████ | 3118/3449 [2:26:59<15:14,  2.76s/it] 90%|█████████ | 3119/3449 [2:27:01<14:29,  2.63s/it]                                                     {'loss': 1.3087, 'learning_rate': 9.56386438100465e-06, 'epoch': 0.9}
 90%|█████████ | 3119/3449 [2:27:01<14:29,  2.63s/it] 90%|█████████ | 3120/3449 [2:27:04<14:00,  2.55s/it]                                                     {'loss': 1.1299, 'learning_rate': 9.506625505910504e-06, 'epoch': 0.9}
 90%|█████████ | 3120/3449 [2:27:04<14:00,  2.55s/it] 90%|█████████ | 3121/3449 [2:27:06<14:04,  2.58s/it]                                                     {'loss': 1.2325, 'learning_rate': 9.449554259870131e-06, 'epoch': 0.9}
 90%|█████████ | 3121/3449 [2:27:06<14:04,  2.58s/it] 91%|█████████ | 3122/3449 [2:27:09<14:36,  2.68s/it]                                                     {'loss': 1.3617, 'learning_rate': 9.392650693104798e-06, 'epoch': 0.91}
 91%|█████████ | 3122/3449 [2:27:09<14:36,  2.68s/it] 91%|█████████ | 3123/3449 [2:27:12<14:22,  2.65s/it]                                                     {'loss': 1.22, 'learning_rate': 9.335914855688055e-06, 'epoch': 0.91}
 91%|█████████ | 3123/3449 [2:27:12<14:22,  2.65s/it] 91%|█████████ | 3124/3449 [2:27:14<13:23,  2.47s/it]                                                     {'loss': 1.2734, 'learning_rate': 9.279346797545874e-06, 'epoch': 0.91}
 91%|█████████ | 3124/3449 [2:27:14<13:23,  2.47s/it] 91%|█████████ | 3125/3449 [2:27:16<13:20,  2.47s/it]                                                     {'loss': 1.3496, 'learning_rate': 9.222946568456703e-06, 'epoch': 0.91}
 91%|█████████ | 3125/3449 [2:27:16<13:20,  2.47s/it] 91%|█████████ | 3126/3449 [2:27:19<14:00,  2.60s/it]                                                     {'loss': 1.2275, 'learning_rate': 9.166714218051176e-06, 'epoch': 0.91}
 91%|█████████ | 3126/3449 [2:27:19<14:00,  2.60s/it] 91%|█████████ | 3127/3449 [2:27:22<14:51,  2.77s/it]                                                     {'loss': 1.2275, 'learning_rate': 9.110649795812265e-06, 'epoch': 0.91}
 91%|█████████ | 3127/3449 [2:27:22<14:51,  2.77s/it] 91%|█████████ | 3128/3449 [2:27:25<14:38,  2.74s/it]                                                     {'loss': 1.2006, 'learning_rate': 9.054753351075173e-06, 'epoch': 0.91}
 91%|█████████ | 3128/3449 [2:27:25<14:38,  2.74s/it] 91%|█████████ | 3129/3449 [2:27:28<14:45,  2.77s/it]                                                     {'loss': 1.3199, 'learning_rate': 8.999024933027266e-06, 'epoch': 0.91}
 91%|█████████ | 3129/3449 [2:27:28<14:45,  2.77s/it] 91%|█████████ | 3130/3449 [2:27:32<16:56,  3.19s/it]                                                     {'loss': 1.2153, 'learning_rate': 8.943464590708028e-06, 'epoch': 0.91}
 91%|█████████ | 3130/3449 [2:27:32<16:56,  3.19s/it] 91%|█████████ | 3131/3449 [2:27:35<15:46,  2.97s/it]                                                     {'loss': 1.2473, 'learning_rate': 8.888072373009104e-06, 'epoch': 0.91}
 91%|█████████ | 3131/3449 [2:27:35<15:46,  2.97s/it] 91%|█████████ | 3132/3449 [2:27:37<14:46,  2.80s/it]                                                     {'loss': 1.1512, 'learning_rate': 8.832848328674126e-06, 'epoch': 0.91}
 91%|█████████ | 3132/3449 [2:27:37<14:46,  2.80s/it] 91%|█████████ | 3133/3449 [2:27:40<14:41,  2.79s/it]                                                     {'loss': 1.1928, 'learning_rate': 8.77779250629882e-06, 'epoch': 0.91}
 91%|█████████ | 3133/3449 [2:27:40<14:41,  2.79s/it] 91%|█████████ | 3134/3449 [2:27:43<15:37,  2.97s/it]                                                     {'loss': 1.2042, 'learning_rate': 8.722904954330746e-06, 'epoch': 0.91}
 91%|█████████ | 3134/3449 [2:27:43<15:37,  2.97s/it] 91%|█████████ | 3135/3449 [2:27:46<15:56,  3.04s/it]                                                     {'loss': 1.2002, 'learning_rate': 8.668185721069555e-06, 'epoch': 0.91}
 91%|█████████ | 3135/3449 [2:27:46<15:56,  3.04s/it] 91%|█████████ | 3136/3449 [2:27:49<15:43,  3.01s/it]                                                     {'loss': 1.028, 'learning_rate': 8.613634854666686e-06, 'epoch': 0.91}
 91%|█████████ | 3136/3449 [2:27:49<15:43,  3.01s/it] 91%|█████████ | 3137/3449 [2:27:52<15:11,  2.92s/it]                                                     {'loss': 1.2156, 'learning_rate': 8.559252403125406e-06, 'epoch': 0.91}
 91%|█████████ | 3137/3449 [2:27:52<15:11,  2.92s/it] 91%|█████████ | 3138/3449 [2:27:54<14:08,  2.73s/it]                                                     {'loss': 1.3159, 'learning_rate': 8.505038414300814e-06, 'epoch': 0.91}
 91%|█████████ | 3138/3449 [2:27:54<14:08,  2.73s/it] 91%|█████████ | 3139/3449 [2:27:57<14:41,  2.84s/it]                                                     {'loss': 1.0625, 'learning_rate': 8.450992935899814e-06, 'epoch': 0.91}
 91%|█████████ | 3139/3449 [2:27:57<14:41,  2.84s/it] 91%|█████████ | 3140/3449 [2:28:00<14:40,  2.85s/it]                                                     {'loss': 1.1526, 'learning_rate': 8.397116015480921e-06, 'epoch': 0.91}
 91%|█████████ | 3140/3449 [2:28:00<14:40,  2.85s/it] 91%|█████████ | 3141/3449 [2:28:03<14:32,  2.83s/it]                                                     {'loss': 1.2536, 'learning_rate': 8.343407700454409e-06, 'epoch': 0.91}
 91%|█████████ | 3141/3449 [2:28:03<14:32,  2.83s/it] 91%|█████████ | 3142/3449 [2:28:06<14:27,  2.83s/it]                                                     {'loss': 1.124, 'learning_rate': 8.289868038082138e-06, 'epoch': 0.91}
 91%|█████████ | 3142/3449 [2:28:06<14:27,  2.83s/it] 91%|█████████ | 3143/3449 [2:28:08<13:19,  2.61s/it]                                                     {'loss': 1.3162, 'learning_rate': 8.236497075477578e-06, 'epoch': 0.91}
 91%|█████████ | 3143/3449 [2:28:08<13:19,  2.61s/it] 91%|█████████ | 3144/3449 [2:28:10<13:09,  2.59s/it]                                                     {'loss': 1.042, 'learning_rate': 8.183294859605739e-06, 'epoch': 0.91}
 91%|█████████ | 3144/3449 [2:28:10<13:09,  2.59s/it] 91%|█████████ | 3145/3449 [2:28:13<12:34,  2.48s/it]                                                     {'loss': 1.2048, 'learning_rate': 8.130261437283148e-06, 'epoch': 0.91}
 91%|█████████ | 3145/3449 [2:28:13<12:34,  2.48s/it] 91%|█████████ | 3146/3449 [2:28:15<12:54,  2.56s/it]                                                     {'loss': 1.132, 'learning_rate': 8.077396855177788e-06, 'epoch': 0.91}
 91%|█████████ | 3146/3449 [2:28:15<12:54,  2.56s/it] 91%|█████████ | 3147/3449 [2:28:18<13:27,  2.67s/it]                                                     {'loss': 1.1471, 'learning_rate': 8.024701159809112e-06, 'epoch': 0.91}
 91%|█████████ | 3147/3449 [2:28:18<13:27,  2.67s/it] 91%|█████████▏| 3148/3449 [2:28:21<13:10,  2.63s/it]                                                     {'loss': 1.1985, 'learning_rate': 7.972174397547828e-06, 'epoch': 0.91}
 91%|█████████▏| 3148/3449 [2:28:21<13:10,  2.63s/it] 91%|█████████▏| 3149/3449 [2:28:24<13:17,  2.66s/it]                                                     {'loss': 1.2558, 'learning_rate': 7.919816614616138e-06, 'epoch': 0.91}
 91%|█████████▏| 3149/3449 [2:28:24<13:17,  2.66s/it] 91%|█████████▏| 3150/3449 [2:28:26<13:24,  2.69s/it]                                                     {'loss': 1.2368, 'learning_rate': 7.8676278570875e-06, 'epoch': 0.91}
 91%|█████████▏| 3150/3449 [2:28:26<13:24,  2.69s/it] 91%|█████████▏| 3151/3449 [2:28:29<13:10,  2.65s/it]                                                     {'loss': 1.1606, 'learning_rate': 7.815608170886556e-06, 'epoch': 0.91}
 91%|█████████▏| 3151/3449 [2:28:29<13:10,  2.65s/it] 91%|█████████▏| 3152/3449 [2:28:32<13:02,  2.64s/it]                                                     {'loss': 1.2797, 'learning_rate': 7.76375760178929e-06, 'epoch': 0.91}
 91%|█████████▏| 3152/3449 [2:28:32<13:02,  2.64s/it] 91%|█████████▏| 3153/3449 [2:28:34<12:49,  2.60s/it]                                                     {'loss': 1.305, 'learning_rate': 7.712076195422801e-06, 'epoch': 0.91}
 91%|█████████▏| 3153/3449 [2:28:34<12:49,  2.60s/it] 91%|█████████▏| 3154/3449 [2:28:37<13:22,  2.72s/it]                                                     {'loss': 1.1394, 'learning_rate': 7.660563997265312e-06, 'epoch': 0.91}
 91%|█████████▏| 3154/3449 [2:28:37<13:22,  2.72s/it] 91%|█████████▏| 3155/3449 [2:28:40<13:49,  2.82s/it]                                                     {'loss': 1.0492, 'learning_rate': 7.6092210526462095e-06, 'epoch': 0.91}
 91%|█████████▏| 3155/3449 [2:28:40<13:49,  2.82s/it] 92%|█████████▏| 3156/3449 [2:28:43<14:11,  2.91s/it]                                                     {'loss': 0.9976, 'learning_rate': 7.5580474067458605e-06, 'epoch': 0.91}
 92%|█████████▏| 3156/3449 [2:28:43<14:11,  2.91s/it] 92%|█████████▏| 3157/3449 [2:28:46<13:41,  2.81s/it]                                                     {'loss': 1.1516, 'learning_rate': 7.507043104595734e-06, 'epoch': 0.92}
 92%|█████████▏| 3157/3449 [2:28:46<13:41,  2.81s/it] 92%|█████████▏| 3158/3449 [2:28:49<13:28,  2.78s/it]                                                     {'loss': 1.1723, 'learning_rate': 7.45620819107824e-06, 'epoch': 0.92}
 92%|█████████▏| 3158/3449 [2:28:49<13:28,  2.78s/it] 92%|█████████▏| 3159/3449 [2:28:51<13:36,  2.82s/it]                                                     {'loss': 1.1959, 'learning_rate': 7.4055427109267275e-06, 'epoch': 0.92}
 92%|█████████▏| 3159/3449 [2:28:51<13:36,  2.82s/it] 92%|█████████▏| 3160/3449 [2:28:55<13:55,  2.89s/it]                                                     {'loss': 1.242, 'learning_rate': 7.355046708725466e-06, 'epoch': 0.92}
 92%|█████████▏| 3160/3449 [2:28:55<13:55,  2.89s/it] 92%|█████████▏| 3161/3449 [2:28:57<13:34,  2.83s/it]                                                     {'loss': 1.1331, 'learning_rate': 7.3047202289096005e-06, 'epoch': 0.92}
 92%|█████████▏| 3161/3449 [2:28:57<13:34,  2.83s/it] 92%|█████████▏| 3162/3449 [2:29:00<12:57,  2.71s/it]                                                     {'loss': 1.3647, 'learning_rate': 7.254563315765039e-06, 'epoch': 0.92}
 92%|█████████▏| 3162/3449 [2:29:00<12:57,  2.71s/it] 92%|█████████▏| 3163/3449 [2:29:02<13:04,  2.74s/it]                                                     {'loss': 1.0765, 'learning_rate': 7.204576013428543e-06, 'epoch': 0.92}
 92%|█████████▏| 3163/3449 [2:29:02<13:04,  2.74s/it] 92%|█████████▏| 3164/3449 [2:29:05<12:26,  2.62s/it]                                                     {'loss': 1.1275, 'learning_rate': 7.154758365887637e-06, 'epoch': 0.92}
 92%|█████████▏| 3164/3449 [2:29:05<12:26,  2.62s/it] 92%|█████████▏| 3165/3449 [2:29:07<12:31,  2.65s/it]                                                     {'loss': 1.3596, 'learning_rate': 7.10511041698041e-06, 'epoch': 0.92}
 92%|█████████▏| 3165/3449 [2:29:07<12:31,  2.65s/it] 92%|█████████▏| 3166/3449 [2:29:11<13:58,  2.96s/it]                                                     {'loss': 1.3559, 'learning_rate': 7.055632210395802e-06, 'epoch': 0.92}
 92%|█████████▏| 3166/3449 [2:29:11<13:58,  2.96s/it] 92%|█████████▏| 3167/3449 [2:29:14<14:11,  3.02s/it]                                                     {'loss': 1.1625, 'learning_rate': 7.006323789673319e-06, 'epoch': 0.92}
 92%|█████████▏| 3167/3449 [2:29:14<14:11,  3.02s/it] 92%|█████████▏| 3168/3449 [2:29:18<14:43,  3.14s/it]                                                     {'loss': 1.1852, 'learning_rate': 6.957185198202964e-06, 'epoch': 0.92}
 92%|█████████▏| 3168/3449 [2:29:18<14:43,  3.14s/it] 92%|█████████▏| 3169/3449 [2:29:20<13:20,  2.86s/it]                                                     {'loss': 1.3788, 'learning_rate': 6.908216479225482e-06, 'epoch': 0.92}
 92%|█████████▏| 3169/3449 [2:29:20<13:20,  2.86s/it] 92%|█████████▏| 3170/3449 [2:29:23<13:47,  2.97s/it]                                                     {'loss': 1.2028, 'learning_rate': 6.859417675831936e-06, 'epoch': 0.92}
 92%|█████████▏| 3170/3449 [2:29:23<13:47,  2.97s/it] 92%|█████████▏| 3171/3449 [2:29:26<13:15,  2.86s/it]                                                     {'loss': 1.3424, 'learning_rate': 6.810788830964021e-06, 'epoch': 0.92}
 92%|█████████▏| 3171/3449 [2:29:26<13:15,  2.86s/it] 92%|█████████▏| 3172/3449 [2:29:29<13:28,  2.92s/it]                                                     {'loss': 1.243, 'learning_rate': 6.762329987413796e-06, 'epoch': 0.92}
 92%|█████████▏| 3172/3449 [2:29:29<13:28,  2.92s/it] 92%|█████████▏| 3173/3449 [2:29:31<12:49,  2.79s/it]                                                     {'loss': 1.1732, 'learning_rate': 6.71404118782375e-06, 'epoch': 0.92}
 92%|█████████▏| 3173/3449 [2:29:31<12:49,  2.79s/it] 92%|█████████▏| 3174/3449 [2:29:34<12:35,  2.75s/it]                                                     {'loss': 1.1897, 'learning_rate': 6.665922474686714e-06, 'epoch': 0.92}
 92%|█████████▏| 3174/3449 [2:29:34<12:35,  2.75s/it] 92%|█████████▏| 3175/3449 [2:29:37<12:23,  2.71s/it]                                                     {'loss': 1.1626, 'learning_rate': 6.617973890345886e-06, 'epoch': 0.92}
 92%|█████████▏| 3175/3449 [2:29:37<12:23,  2.71s/it] 92%|█████████▏| 3176/3449 [2:29:39<11:58,  2.63s/it]                                                     {'loss': 1.238, 'learning_rate': 6.570195476994712e-06, 'epoch': 0.92}
 92%|█████████▏| 3176/3449 [2:29:39<11:58,  2.63s/it] 92%|█████████▏| 3177/3449 [2:29:42<12:34,  2.77s/it]                                                     {'loss': 1.149, 'learning_rate': 6.522587276676917e-06, 'epoch': 0.92}
 92%|█████████▏| 3177/3449 [2:29:42<12:34,  2.77s/it] 92%|█████████▏| 3178/3449 [2:29:45<12:28,  2.76s/it]                                                     {'loss': 1.1685, 'learning_rate': 6.475149331286457e-06, 'epoch': 0.92}
 92%|█████████▏| 3178/3449 [2:29:45<12:28,  2.76s/it] 92%|█████████▏| 3179/3449 [2:29:48<13:28,  3.00s/it]                                                     {'loss': 1.1058, 'learning_rate': 6.427881682567427e-06, 'epoch': 0.92}
 92%|█████████▏| 3179/3449 [2:29:48<13:28,  3.00s/it] 92%|█████████▏| 3180/3449 [2:29:51<12:50,  2.86s/it]                                                     {'loss': 1.1978, 'learning_rate': 6.380784372114113e-06, 'epoch': 0.92}
 92%|█████████▏| 3180/3449 [2:29:51<12:50,  2.86s/it] 92%|█████████▏| 3181/3449 [2:29:55<14:01,  3.14s/it]                                                     {'loss': 1.2377, 'learning_rate': 6.333857441370849e-06, 'epoch': 0.92}
 92%|█████████▏| 3181/3449 [2:29:55<14:01,  3.14s/it] 92%|█████████▏| 3182/3449 [2:29:58<13:39,  3.07s/it]                                                     {'loss': 1.1284, 'learning_rate': 6.2871009316320725e-06, 'epoch': 0.92}
 92%|█████████▏| 3182/3449 [2:29:58<13:39,  3.07s/it] 92%|█████████▏| 3183/3449 [2:30:00<13:06,  2.96s/it]                                                     {'loss': 1.2511, 'learning_rate': 6.240514884042336e-06, 'epoch': 0.92}
 92%|█████████▏| 3183/3449 [2:30:00<13:06,  2.96s/it] 92%|█████████▏| 3184/3449 [2:30:03<12:55,  2.93s/it]                                                     {'loss': 1.1935, 'learning_rate': 6.1940993395960045e-06, 'epoch': 0.92}
 92%|█████████▏| 3184/3449 [2:30:03<12:55,  2.93s/it] 92%|█████████▏| 3185/3449 [2:30:07<13:24,  3.05s/it]                                                     {'loss': 1.2523, 'learning_rate': 6.1478543391375375e-06, 'epoch': 0.92}
 92%|█████████▏| 3185/3449 [2:30:07<13:24,  3.05s/it] 92%|█████████▏| 3186/3449 [2:30:10<13:39,  3.12s/it]                                                     {'loss': 1.231, 'learning_rate': 6.101779923361362e-06, 'epoch': 0.92}
 92%|█████████▏| 3186/3449 [2:30:10<13:39,  3.12s/it] 92%|█████████▏| 3187/3449 [2:30:13<13:09,  3.01s/it]                                                     {'loss': 1.3012, 'learning_rate': 6.055876132811666e-06, 'epoch': 0.92}
 92%|█████████▏| 3187/3449 [2:30:13<13:09,  3.01s/it] 92%|█████████▏| 3188/3449 [2:30:15<12:29,  2.87s/it]                                                     {'loss': 1.2187, 'learning_rate': 6.010143007882541e-06, 'epoch': 0.92}
 92%|█████████▏| 3188/3449 [2:30:15<12:29,  2.87s/it] 92%|█████████▏| 3189/3449 [2:30:18<12:26,  2.87s/it]                                                     {'loss': 1.1301, 'learning_rate': 5.9645805888179475e-06, 'epoch': 0.92}
 92%|█████████▏| 3189/3449 [2:30:18<12:26,  2.87s/it] 92%|█████████▏| 3190/3449 [2:30:21<12:46,  2.96s/it]                                                     {'loss': 1.1984, 'learning_rate': 5.919188915711571e-06, 'epoch': 0.92}
 92%|█████████▏| 3190/3449 [2:30:21<12:46,  2.96s/it] 93%|█████████▎| 3191/3449 [2:30:24<12:16,  2.86s/it]                                                     {'loss': 1.1454, 'learning_rate': 5.873968028506882e-06, 'epoch': 0.93}
 93%|█████████▎| 3191/3449 [2:30:24<12:16,  2.86s/it] 93%|█████████▎| 3192/3449 [2:30:26<11:42,  2.74s/it]                                                     {'loss': 1.2934, 'learning_rate': 5.828917966997005e-06, 'epoch': 0.93}
 93%|█████████▎| 3192/3449 [2:30:26<11:42,  2.74s/it] 93%|█████████▎| 3193/3449 [2:30:29<11:48,  2.77s/it]                                                     {'loss': 1.2821, 'learning_rate': 5.784038770824829e-06, 'epoch': 0.93}
 93%|█████████▎| 3193/3449 [2:30:29<11:48,  2.77s/it] 93%|█████████▎| 3194/3449 [2:30:32<11:26,  2.69s/it]                                                     {'loss': 1.2755, 'learning_rate': 5.7393304794828295e-06, 'epoch': 0.93}
 93%|█████████▎| 3194/3449 [2:30:32<11:26,  2.69s/it] 93%|█████████▎| 3195/3449 [2:30:34<11:05,  2.62s/it]                                                     {'loss': 1.2596, 'learning_rate': 5.6947931323130695e-06, 'epoch': 0.93}
 93%|█████████▎| 3195/3449 [2:30:34<11:05,  2.62s/it] 93%|█████████▎| 3196/3449 [2:30:37<11:12,  2.66s/it]                                                     {'loss': 1.0912, 'learning_rate': 5.650426768507267e-06, 'epoch': 0.93}
 93%|█████████▎| 3196/3449 [2:30:37<11:12,  2.66s/it] 93%|█████████▎| 3197/3449 [2:30:40<11:44,  2.80s/it]                                                     {'loss': 1.0998, 'learning_rate': 5.606231427106634e-06, 'epoch': 0.93}
 93%|█████████▎| 3197/3449 [2:30:40<11:44,  2.80s/it] 93%|█████████▎| 3198/3449 [2:30:43<12:11,  2.91s/it]                                                     {'loss': 1.2298, 'learning_rate': 5.562207147001841e-06, 'epoch': 0.93}
 93%|█████████▎| 3198/3449 [2:30:43<12:11,  2.91s/it] 93%|█████████▎| 3199/3449 [2:30:46<11:48,  2.83s/it]                                                     {'loss': 1.1658, 'learning_rate': 5.518353966933054e-06, 'epoch': 0.93}
 93%|█████████▎| 3199/3449 [2:30:46<11:48,  2.83s/it] 93%|█████████▎| 3200/3449 [2:30:49<11:37,  2.80s/it]                                                     {'loss': 1.23, 'learning_rate': 5.474671925489982e-06, 'epoch': 0.93}
 93%|█████████▎| 3200/3449 [2:30:49<11:37,  2.80s/it] 93%|█████████▎| 3201/3449 [2:30:51<11:35,  2.80s/it]                                                     {'loss': 1.3275, 'learning_rate': 5.43116106111159e-06, 'epoch': 0.93}
 93%|█████████▎| 3201/3449 [2:30:51<11:35,  2.80s/it] 93%|█████████▎| 3202/3449 [2:30:54<11:42,  2.85s/it]                                                     {'loss': 1.1537, 'learning_rate': 5.387821412086247e-06, 'epoch': 0.93}
 93%|█████████▎| 3202/3449 [2:30:54<11:42,  2.85s/it] 93%|█████████▎| 3203/3449 [2:30:57<11:13,  2.74s/it]                                                     {'loss': 1.1757, 'learning_rate': 5.3446530165517374e-06, 'epoch': 0.93}
 93%|█████████▎| 3203/3449 [2:30:57<11:13,  2.74s/it] 93%|█████████▎| 3204/3449 [2:30:59<11:05,  2.71s/it]                                                     {'loss': 1.1398, 'learning_rate': 5.3016559124950735e-06, 'epoch': 0.93}
 93%|█████████▎| 3204/3449 [2:30:59<11:05,  2.71s/it] 93%|█████████▎| 3205/3449 [2:31:02<11:12,  2.75s/it]                                                     {'loss': 1.4401, 'learning_rate': 5.258830137752524e-06, 'epoch': 0.93}
 93%|█████████▎| 3205/3449 [2:31:02<11:12,  2.75s/it] 93%|█████████▎| 3206/3449 [2:31:05<11:04,  2.73s/it]                                                     {'loss': 1.2684, 'learning_rate': 5.216175730009632e-06, 'epoch': 0.93}
 93%|█████████▎| 3206/3449 [2:31:05<11:04,  2.73s/it] 93%|█████████▎| 3207/3449 [2:31:07<10:39,  2.64s/it]                                                     {'loss': 1.2422, 'learning_rate': 5.173692726801149e-06, 'epoch': 0.93}
 93%|█████████▎| 3207/3449 [2:31:07<10:39,  2.64s/it] 93%|█████████▎| 3208/3449 [2:31:10<10:17,  2.56s/it]                                                     {'loss': 1.3431, 'learning_rate': 5.131381165510973e-06, 'epoch': 0.93}
 93%|█████████▎| 3208/3449 [2:31:10<10:17,  2.56s/it] 93%|█████████▎| 3209/3449 [2:31:12<09:52,  2.47s/it]                                                     {'loss': 1.3251, 'learning_rate': 5.089241083372121e-06, 'epoch': 0.93}
 93%|█████████▎| 3209/3449 [2:31:12<09:52,  2.47s/it] 93%|█████████▎| 3210/3449 [2:31:14<09:52,  2.48s/it]                                                     {'loss': 1.2335, 'learning_rate': 5.04727251746675e-06, 'epoch': 0.93}
 93%|█████████▎| 3210/3449 [2:31:15<09:52,  2.48s/it] 93%|█████████▎| 3211/3449 [2:31:17<09:59,  2.52s/it]                                                     {'loss': 1.4785, 'learning_rate': 5.005475504726076e-06, 'epoch': 0.93}
 93%|█████████▎| 3211/3449 [2:31:17<09:59,  2.52s/it] 93%|█████████▎| 3212/3449 [2:31:20<09:56,  2.52s/it]                                                     {'loss': 1.2744, 'learning_rate': 4.963850081930321e-06, 'epoch': 0.93}
 93%|█████████▎| 3212/3449 [2:31:20<09:56,  2.52s/it] 93%|█████████▎| 3213/3449 [2:31:23<10:30,  2.67s/it]                                                     {'loss': 1.1397, 'learning_rate': 4.922396285708764e-06, 'epoch': 0.93}
 93%|█████████▎| 3213/3449 [2:31:23<10:30,  2.67s/it] 93%|█████████▎| 3214/3449 [2:31:25<10:32,  2.69s/it]                                                     {'loss': 1.254, 'learning_rate': 4.881114152539645e-06, 'epoch': 0.93}
 93%|█████████▎| 3214/3449 [2:31:25<10:32,  2.69s/it] 93%|█████████▎| 3215/3449 [2:31:28<10:26,  2.68s/it]                                                     {'loss': 1.2745, 'learning_rate': 4.840003718750108e-06, 'epoch': 0.93}
 93%|█████████▎| 3215/3449 [2:31:28<10:26,  2.68s/it] 93%|█████████▎| 3216/3449 [2:31:31<10:15,  2.64s/it]                                                     {'loss': 1.104, 'learning_rate': 4.799065020516213e-06, 'epoch': 0.93}
 93%|█████████▎| 3216/3449 [2:31:31<10:15,  2.64s/it] 93%|█████████▎| 3217/3449 [2:31:33<10:30,  2.72s/it]                                                     {'loss': 1.1424, 'learning_rate': 4.758298093862945e-06, 'epoch': 0.93}
 93%|█████████▎| 3217/3449 [2:31:33<10:30,  2.72s/it] 93%|█████████▎| 3218/3449 [2:31:36<10:11,  2.65s/it]                                                     {'loss': 1.2155, 'learning_rate': 4.717702974664118e-06, 'epoch': 0.93}
 93%|█████████▎| 3218/3449 [2:31:36<10:11,  2.65s/it] 93%|█████████▎| 3219/3449 [2:31:39<10:32,  2.75s/it]                                                     {'loss': 1.2463, 'learning_rate': 4.677279698642312e-06, 'epoch': 0.93}
 93%|█████████▎| 3219/3449 [2:31:39<10:32,  2.75s/it] 93%|█████████▎| 3220/3449 [2:31:41<10:05,  2.65s/it]                                                     {'loss': 1.2806, 'learning_rate': 4.6370283013689395e-06, 'epoch': 0.93}
 93%|█████████▎| 3220/3449 [2:31:41<10:05,  2.65s/it] 93%|█████████▎| 3221/3449 [2:31:44<10:19,  2.72s/it]                                                     {'loss': 1.2478, 'learning_rate': 4.596948818264157e-06, 'epoch': 0.93}
 93%|█████████▎| 3221/3449 [2:31:44<10:19,  2.72s/it] 93%|█████████▎| 3222/3449 [2:31:47<10:24,  2.75s/it]                                                     {'loss': 1.1412, 'learning_rate': 4.557041284596819e-06, 'epoch': 0.93}
 93%|█████████▎| 3222/3449 [2:31:47<10:24,  2.75s/it] 93%|█████████▎| 3223/3449 [2:31:50<10:25,  2.77s/it]                                                     {'loss': 1.1437, 'learning_rate': 4.517305735484478e-06, 'epoch': 0.93}
 93%|█████████▎| 3223/3449 [2:31:50<10:25,  2.77s/it] 93%|█████████▎| 3224/3449 [2:31:52<09:52,  2.64s/it]                                                     {'loss': 1.4224, 'learning_rate': 4.477742205893365e-06, 'epoch': 0.93}
 93%|█████████▎| 3224/3449 [2:31:52<09:52,  2.64s/it] 94%|█████████▎| 3225/3449 [2:31:56<10:51,  2.91s/it]                                                     {'loss': 1.3566, 'learning_rate': 4.438350730638363e-06, 'epoch': 0.93}
 94%|█████████▎| 3225/3449 [2:31:56<10:51,  2.91s/it] 94%|█████████▎| 3226/3449 [2:31:59<11:13,  3.02s/it]                                                     {'loss': 1.2134, 'learning_rate': 4.399131344382812e-06, 'epoch': 0.94}
 94%|█████████▎| 3226/3449 [2:31:59<11:13,  3.02s/it] 94%|█████████▎| 3227/3449 [2:32:02<10:42,  2.89s/it]                                                     {'loss': 1.2744, 'learning_rate': 4.3600840816387934e-06, 'epoch': 0.94}
 94%|█████████▎| 3227/3449 [2:32:02<10:42,  2.89s/it] 94%|█████████▎| 3228/3449 [2:32:04<10:22,  2.81s/it]                                                     {'loss': 1.4036, 'learning_rate': 4.321208976766844e-06, 'epoch': 0.94}
 94%|█████████▎| 3228/3449 [2:32:04<10:22,  2.81s/it] 94%|█████████▎| 3229/3449 [2:32:07<10:16,  2.80s/it]                                                     {'loss': 1.3132, 'learning_rate': 4.282506063975977e-06, 'epoch': 0.94}
 94%|█████████▎| 3229/3449 [2:32:07<10:16,  2.80s/it] 94%|█████████▎| 3230/3449 [2:32:10<10:04,  2.76s/it]                                                     {'loss': 1.2421, 'learning_rate': 4.243975377323772e-06, 'epoch': 0.94}
 94%|█████████▎| 3230/3449 [2:32:10<10:04,  2.76s/it] 94%|█████████▎| 3231/3449 [2:32:12<09:50,  2.71s/it]                                                     {'loss': 1.2272, 'learning_rate': 4.205616950716151e-06, 'epoch': 0.94}
 94%|█████████▎| 3231/3449 [2:32:12<09:50,  2.71s/it] 94%|█████████▎| 3232/3449 [2:32:15<09:36,  2.66s/it]                                                     {'loss': 1.2077, 'learning_rate': 4.167430817907514e-06, 'epoch': 0.94}
 94%|█████████▎| 3232/3449 [2:32:15<09:36,  2.66s/it] 94%|█████████▎| 3233/3449 [2:32:18<09:49,  2.73s/it]                                                     {'loss': 1.3216, 'learning_rate': 4.129417012500647e-06, 'epoch': 0.94}
 94%|█████████▎| 3233/3449 [2:32:18<09:49,  2.73s/it] 94%|█████████▍| 3234/3449 [2:32:21<10:36,  2.96s/it]                                                     {'loss': 1.0948, 'learning_rate': 4.091575567946637e-06, 'epoch': 0.94}
 94%|█████████▍| 3234/3449 [2:32:21<10:36,  2.96s/it] 94%|█████████▍| 3235/3449 [2:32:24<10:18,  2.89s/it]                                                     {'loss': 1.2121, 'learning_rate': 4.053906517544981e-06, 'epoch': 0.94}
 94%|█████████▍| 3235/3449 [2:32:24<10:18,  2.89s/it] 94%|█████████▍| 3236/3449 [2:32:26<09:52,  2.78s/it]                                                     {'loss': 1.2324, 'learning_rate': 4.016409894443429e-06, 'epoch': 0.94}
 94%|█████████▍| 3236/3449 [2:32:26<09:52,  2.78s/it] 94%|█████████▍| 3237/3449 [2:32:29<09:46,  2.77s/it]                                                     {'loss': 1.1991, 'learning_rate': 3.979085731637966e-06, 'epoch': 0.94}
 94%|█████████▍| 3237/3449 [2:32:29<09:46,  2.77s/it] 94%|█████████▍| 3238/3449 [2:32:32<09:44,  2.77s/it]                                                     {'loss': 1.2435, 'learning_rate': 3.941934061972896e-06, 'epoch': 0.94}
 94%|█████████▍| 3238/3449 [2:32:32<09:44,  2.77s/it] 94%|█████████▍| 3239/3449 [2:32:35<09:25,  2.69s/it]                                                     {'loss': 1.3828, 'learning_rate': 3.9049549181406465e-06, 'epoch': 0.94}
 94%|█████████▍| 3239/3449 [2:32:35<09:25,  2.69s/it] 94%|█████████▍| 3240/3449 [2:32:38<09:51,  2.83s/it]                                                     {'loss': 1.1514, 'learning_rate': 3.86814833268192e-06, 'epoch': 0.94}
 94%|█████████▍| 3240/3449 [2:32:38<09:51,  2.83s/it] 94%|█████████▍| 3241/3449 [2:32:40<09:21,  2.70s/it]                                                     {'loss': 1.1994, 'learning_rate': 3.831514337985498e-06, 'epoch': 0.94}
 94%|█████████▍| 3241/3449 [2:32:40<09:21,  2.70s/it] 94%|█████████▍| 3242/3449 [2:32:43<09:44,  2.82s/it]                                                     {'loss': 1.234, 'learning_rate': 3.795052966288326e-06, 'epoch': 0.94}
 94%|█████████▍| 3242/3449 [2:32:43<09:44,  2.82s/it] 94%|█████████▍| 3243/3449 [2:32:46<09:50,  2.87s/it]                                                     {'loss': 1.2488, 'learning_rate': 3.7587642496753615e-06, 'epoch': 0.94}
 94%|█████████▍| 3243/3449 [2:32:46<09:50,  2.87s/it] 94%|█████████▍| 3244/3449 [2:32:48<09:10,  2.68s/it]                                                     {'loss': 1.29, 'learning_rate': 3.722648220079816e-06, 'epoch': 0.94}
 94%|█████████▍| 3244/3449 [2:32:48<09:10,  2.68s/it] 94%|█████████▍| 3245/3449 [2:32:51<09:25,  2.77s/it]                                                     {'loss': 1.3062, 'learning_rate': 3.6867049092827567e-06, 'epoch': 0.94}
 94%|█████████▍| 3245/3449 [2:32:51<09:25,  2.77s/it] 94%|█████████▍| 3246/3449 [2:32:55<09:48,  2.90s/it]                                                     {'loss': 1.2509, 'learning_rate': 3.650934348913304e-06, 'epoch': 0.94}
 94%|█████████▍| 3246/3449 [2:32:55<09:48,  2.90s/it] 94%|█████████▍| 3247/3449 [2:32:58<10:04,  2.99s/it]                                                     {'loss': 1.1473, 'learning_rate': 3.6153365704486795e-06, 'epoch': 0.94}
 94%|█████████▍| 3247/3449 [2:32:58<10:04,  2.99s/it] 94%|█████████▍| 3248/3449 [2:33:01<10:00,  2.99s/it]                                                     {'loss': 1.1365, 'learning_rate': 3.5799116052139147e-06, 'epoch': 0.94}
 94%|█████████▍| 3248/3449 [2:33:01<10:00,  2.99s/it] 94%|█████████▍| 3249/3449 [2:33:04<09:51,  2.96s/it]                                                     {'loss': 1.2775, 'learning_rate': 3.544659484382029e-06, 'epoch': 0.94}
 94%|█████████▍| 3249/3449 [2:33:04<09:51,  2.96s/it] 94%|█████████▍| 3250/3449 [2:33:07<10:38,  3.21s/it]                                                     {'loss': 1.215, 'learning_rate': 3.5095802389739417e-06, 'epoch': 0.94}
 94%|█████████▍| 3250/3449 [2:33:07<10:38,  3.21s/it] 94%|█████████▍| 3251/3449 [2:33:10<10:22,  3.14s/it]                                                     {'loss': 1.2543, 'learning_rate': 3.4746738998584495e-06, 'epoch': 0.94}
 94%|█████████▍| 3251/3449 [2:33:10<10:22,  3.14s/it] 94%|█████████▍| 3252/3449 [2:33:15<11:33,  3.52s/it]                                                     {'loss': 1.1457, 'learning_rate': 3.439940497752203e-06, 'epoch': 0.94}
 94%|█████████▍| 3252/3449 [2:33:15<11:33,  3.52s/it] 94%|█████████▍| 3253/3449 [2:33:18<10:50,  3.32s/it]                                                     {'loss': 1.2061, 'learning_rate': 3.405380063219643e-06, 'epoch': 0.94}
 94%|█████████▍| 3253/3449 [2:33:18<10:50,  3.32s/it] 94%|█████████▍| 3254/3449 [2:33:21<10:31,  3.24s/it]                                                     {'loss': 1.0544, 'learning_rate': 3.370992626673064e-06, 'epoch': 0.94}
 94%|█████████▍| 3254/3449 [2:33:21<10:31,  3.24s/it] 94%|█████████▍| 3255/3449 [2:33:23<09:43,  3.01s/it]                                                     {'loss': 1.3049, 'learning_rate': 3.3367782183724607e-06, 'epoch': 0.94}
 94%|█████████▍| 3255/3449 [2:33:23<09:43,  3.01s/it] 94%|█████████▍| 3256/3449 [2:33:26<09:26,  2.94s/it]                                                     {'loss': 1.1857, 'learning_rate': 3.302736868425549e-06, 'epoch': 0.94}
 94%|█████████▍| 3256/3449 [2:33:26<09:26,  2.94s/it] 94%|█████████▍| 3257/3449 [2:33:29<09:24,  2.94s/it]                                                     {'loss': 1.1727, 'learning_rate': 3.2688686067878783e-06, 'epoch': 0.94}
 94%|█████████▍| 3257/3449 [2:33:29<09:24,  2.94s/it] 94%|█████████▍| 3258/3449 [2:33:31<08:56,  2.81s/it]                                                     {'loss': 1.1813, 'learning_rate': 3.2351734632626085e-06, 'epoch': 0.94}
 94%|█████████▍| 3258/3449 [2:33:31<08:56,  2.81s/it] 94%|█████████▍| 3259/3449 [2:33:34<08:34,  2.71s/it]                                                     {'loss': 1.0283, 'learning_rate': 3.2016514675004885e-06, 'epoch': 0.94}
 94%|█████████▍| 3259/3449 [2:33:34<08:34,  2.71s/it] 95%|█████████▍| 3260/3449 [2:33:36<08:17,  2.63s/it]                                                     {'loss': 1.1251, 'learning_rate': 3.16830264900001e-06, 'epoch': 0.95}
 95%|█████████▍| 3260/3449 [2:33:36<08:17,  2.63s/it] 95%|█████████▍| 3261/3449 [2:33:39<08:11,  2.61s/it]                                                     {'loss': 1.24, 'learning_rate': 3.135127037107277e-06, 'epoch': 0.95}
 95%|█████████▍| 3261/3449 [2:33:39<08:11,  2.61s/it] 95%|█████████▍| 3262/3449 [2:33:42<08:09,  2.62s/it]                                                     {'loss': 1.2876, 'learning_rate': 3.1021246610158928e-06, 'epoch': 0.95}
 95%|█████████▍| 3262/3449 [2:33:42<08:09,  2.62s/it] 95%|█████████▍| 3263/3449 [2:33:44<07:59,  2.58s/it]                                                     {'loss': 1.2515, 'learning_rate': 3.0692955497670707e-06, 'epoch': 0.95}
 95%|█████████▍| 3263/3449 [2:33:44<07:59,  2.58s/it] 95%|█████████▍| 3264/3449 [2:33:47<08:15,  2.68s/it]                                                     {'loss': 1.314, 'learning_rate': 3.036639732249569e-06, 'epoch': 0.95}
 95%|█████████▍| 3264/3449 [2:33:47<08:15,  2.68s/it] 95%|█████████▍| 3265/3449 [2:33:50<08:30,  2.77s/it]                                                     {'loss': 1.0788, 'learning_rate': 3.0041572371995785e-06, 'epoch': 0.95}
 95%|█████████▍| 3265/3449 [2:33:50<08:30,  2.77s/it] 95%|█████████▍| 3266/3449 [2:33:53<08:20,  2.74s/it]                                                     {'loss': 0.9953, 'learning_rate': 2.9718480932008797e-06, 'epoch': 0.95}
 95%|█████████▍| 3266/3449 [2:33:53<08:20,  2.74s/it] 95%|█████████▍| 3267/3449 [2:33:55<08:25,  2.78s/it]                                                     {'loss': 1.0646, 'learning_rate': 2.9397123286846184e-06, 'epoch': 0.95}
 95%|█████████▍| 3267/3449 [2:33:55<08:25,  2.78s/it] 95%|█████████▍| 3268/3449 [2:33:58<08:22,  2.78s/it]                                                     {'loss': 1.2062, 'learning_rate': 2.9077499719293966e-06, 'epoch': 0.95}
 95%|█████████▍| 3268/3449 [2:33:58<08:22,  2.78s/it] 95%|█████████▍| 3269/3449 [2:34:02<08:58,  2.99s/it]                                                     {'loss': 1.3076, 'learning_rate': 2.8759610510612713e-06, 'epoch': 0.95}
 95%|█████████▍| 3269/3449 [2:34:02<08:58,  2.99s/it] 95%|█████████▍| 3270/3449 [2:34:05<08:58,  3.01s/it]                                                     {'loss': 1.1198, 'learning_rate': 2.844345594053599e-06, 'epoch': 0.95}
 95%|█████████▍| 3270/3449 [2:34:05<08:58,  3.01s/it] 95%|█████████▍| 3271/3449 [2:34:07<08:29,  2.86s/it]                                                     {'loss': 1.1939, 'learning_rate': 2.8129036287271484e-06, 'epoch': 0.95}
 95%|█████████▍| 3271/3449 [2:34:07<08:29,  2.86s/it] 95%|█████████▍| 3272/3449 [2:34:10<08:22,  2.84s/it]                                                     {'loss': 1.2261, 'learning_rate': 2.781635182750031e-06, 'epoch': 0.95}
 95%|█████████▍| 3272/3449 [2:34:10<08:22,  2.84s/it] 95%|█████████▍| 3273/3449 [2:34:13<08:12,  2.80s/it]                                                     {'loss': 1.1657, 'learning_rate': 2.7505402836375705e-06, 'epoch': 0.95}
 95%|█████████▍| 3273/3449 [2:34:13<08:12,  2.80s/it] 95%|█████████▍| 3274/3449 [2:34:15<07:58,  2.73s/it]                                                     {'loss': 1.3085, 'learning_rate': 2.7196189587525012e-06, 'epoch': 0.95}
 95%|█████████▍| 3274/3449 [2:34:15<07:58,  2.73s/it] 95%|█████████▍| 3275/3449 [2:34:18<07:36,  2.62s/it]                                                     {'loss': 1.1467, 'learning_rate': 2.6888712353047685e-06, 'epoch': 0.95}
 95%|█████████▍| 3275/3449 [2:34:18<07:36,  2.62s/it] 95%|█████████▍| 3276/3449 [2:34:20<07:34,  2.63s/it]                                                     {'loss': 1.2264, 'learning_rate': 2.6582971403515066e-06, 'epoch': 0.95}
 95%|█████████▍| 3276/3449 [2:34:20<07:34,  2.63s/it] 95%|█████████▌| 3277/3449 [2:34:23<07:35,  2.65s/it]                                                     {'loss': 1.4061, 'learning_rate': 2.6278967007970836e-06, 'epoch': 0.95}
 95%|█████████▌| 3277/3449 [2:34:23<07:35,  2.65s/it] 95%|█████████▌| 3278/3449 [2:34:26<07:35,  2.66s/it]                                                     {'loss': 1.2256, 'learning_rate': 2.5976699433931216e-06, 'epoch': 0.95}
 95%|█████████▌| 3278/3449 [2:34:26<07:35,  2.66s/it] 95%|█████████▌| 3279/3449 [2:34:29<08:02,  2.84s/it]                                                     {'loss': 1.0869, 'learning_rate': 2.567616894738323e-06, 'epoch': 0.95}
 95%|█████████▌| 3279/3449 [2:34:29<08:02,  2.84s/it] 95%|█████████▌| 3280/3449 [2:34:32<07:46,  2.76s/it]                                                     {'loss': 1.0455, 'learning_rate': 2.537737581278554e-06, 'epoch': 0.95}
 95%|█████████▌| 3280/3449 [2:34:32<07:46,  2.76s/it] 95%|█████████▌| 3281/3449 [2:34:34<07:14,  2.59s/it]                                                     {'loss': 1.1895, 'learning_rate': 2.5080320293068284e-06, 'epoch': 0.95}
 95%|█████████▌| 3281/3449 [2:34:34<07:14,  2.59s/it] 95%|█████████▌| 3282/3449 [2:34:36<07:17,  2.62s/it]                                                     {'loss': 1.1476, 'learning_rate': 2.478500264963235e-06, 'epoch': 0.95}
 95%|█████████▌| 3282/3449 [2:34:36<07:17,  2.62s/it] 95%|█████████▌| 3283/3449 [2:34:40<07:36,  2.75s/it]                                                     {'loss': 1.3279, 'learning_rate': 2.4491423142349203e-06, 'epoch': 0.95}
 95%|█████████▌| 3283/3449 [2:34:40<07:36,  2.75s/it] 95%|█████████▌| 3284/3449 [2:34:44<09:04,  3.30s/it]                                                     {'loss': 1.169, 'learning_rate': 2.4199582029561074e-06, 'epoch': 0.95}
 95%|█████████▌| 3284/3449 [2:34:44<09:04,  3.30s/it] 95%|█████████▌| 3285/3449 [2:34:47<08:55,  3.26s/it]                                                     {'loss': 1.2782, 'learning_rate': 2.390947956808032e-06, 'epoch': 0.95}
 95%|█████████▌| 3285/3449 [2:34:47<08:55,  3.26s/it] 95%|█████████▌| 3286/3449 [2:34:50<08:21,  3.08s/it]                                                     {'loss': 1.3633, 'learning_rate': 2.362111601318917e-06, 'epoch': 0.95}
 95%|█████████▌| 3286/3449 [2:34:50<08:21,  3.08s/it] 95%|█████████▌| 3287/3449 [2:34:53<08:16,  3.07s/it]                                                     {'loss': 1.0626, 'learning_rate': 2.3334491618639765e-06, 'epoch': 0.95}
 95%|█████████▌| 3287/3449 [2:34:53<08:16,  3.07s/it] 95%|█████████▌| 3288/3449 [2:34:55<07:47,  2.90s/it]                                                     {'loss': 1.2501, 'learning_rate': 2.304960663665412e-06, 'epoch': 0.95}
 95%|█████████▌| 3288/3449 [2:34:55<07:47,  2.90s/it] 95%|█████████▌| 3289/3449 [2:34:59<07:53,  2.96s/it]                                                     {'loss': 1.1671, 'learning_rate': 2.276646131792326e-06, 'epoch': 0.95}
 95%|█████████▌| 3289/3449 [2:34:59<07:53,  2.96s/it] 95%|█████████▌| 3290/3449 [2:35:02<08:09,  3.08s/it]                                                     {'loss': 1.1082, 'learning_rate': 2.248505591160699e-06, 'epoch': 0.95}
 95%|█████████▌| 3290/3449 [2:35:02<08:09,  3.08s/it] 95%|█████████▌| 3291/3449 [2:35:04<07:40,  2.92s/it]                                                     {'loss': 1.1324, 'learning_rate': 2.2205390665335446e-06, 'epoch': 0.95}
 95%|█████████▌| 3291/3449 [2:35:04<07:40,  2.92s/it] 95%|█████████▌| 3292/3449 [2:35:10<09:21,  3.58s/it]                                                     {'loss': 1.1941, 'learning_rate': 2.192746582520577e-06, 'epoch': 0.95}
 95%|█████████▌| 3292/3449 [2:35:10<09:21,  3.58s/it] 95%|█████████▌| 3293/3449 [2:35:13<09:01,  3.47s/it]                                                     {'loss': 1.3152, 'learning_rate': 2.165128163578478e-06, 'epoch': 0.95}
 95%|█████████▌| 3293/3449 [2:35:13<09:01,  3.47s/it] 96%|█████████▌| 3294/3449 [2:35:17<09:40,  3.74s/it]                                                     {'loss': 1.0571, 'learning_rate': 2.1376838340106954e-06, 'epoch': 0.95}
 96%|█████████▌| 3294/3449 [2:35:17<09:40,  3.74s/it] 96%|█████████▌| 3295/3449 [2:35:20<08:45,  3.41s/it]                                                     {'loss': 1.2351, 'learning_rate': 2.110413617967488e-06, 'epoch': 0.96}
 96%|█████████▌| 3295/3449 [2:35:20<08:45,  3.41s/it] 96%|█████████▌| 3296/3449 [2:35:22<07:56,  3.11s/it]                                                     {'loss': 1.1415, 'learning_rate': 2.0833175394459504e-06, 'epoch': 0.96}
 96%|█████████▌| 3296/3449 [2:35:22<07:56,  3.11s/it] 96%|█████████▌| 3297/3449 [2:35:25<07:54,  3.12s/it]                                                     {'loss': 1.1629, 'learning_rate': 2.056395622289875e-06, 'epoch': 0.96}
 96%|█████████▌| 3297/3449 [2:35:25<07:54,  3.12s/it] 96%|█████████▌| 3298/3449 [2:35:28<07:21,  2.92s/it]                                                     {'loss': 1.2267, 'learning_rate': 2.029647890189823e-06, 'epoch': 0.96}
 96%|█████████▌| 3298/3449 [2:35:28<07:21,  2.92s/it] 96%|█████████▌| 3299/3449 [2:35:31<07:23,  2.96s/it]                                                     {'loss': 1.1571, 'learning_rate': 2.003074366683122e-06, 'epoch': 0.96}
 96%|█████████▌| 3299/3449 [2:35:31<07:23,  2.96s/it] 96%|█████████▌| 3300/3449 [2:35:34<07:13,  2.91s/it]                                                     {'loss': 1.2497, 'learning_rate': 1.976675075153711e-06, 'epoch': 0.96}
 96%|█████████▌| 3300/3449 [2:35:34<07:13,  2.91s/it] 96%|█████████▌| 3301/3449 [2:35:36<06:58,  2.83s/it]                                                     {'loss': 1.0942, 'learning_rate': 1.9504500388322743e-06, 'epoch': 0.96}
 96%|█████████▌| 3301/3449 [2:35:36<06:58,  2.83s/it] 96%|█████████▌| 3302/3449 [2:35:39<06:26,  2.63s/it]                                                     {'loss': 1.3633, 'learning_rate': 1.9243992807961518e-06, 'epoch': 0.96}
 96%|█████████▌| 3302/3449 [2:35:39<06:26,  2.63s/it] 96%|█████████▌| 3303/3449 [2:35:41<06:09,  2.53s/it]                                                     {'loss': 1.1527, 'learning_rate': 1.8985228239692954e-06, 'epoch': 0.96}
 96%|█████████▌| 3303/3449 [2:35:41<06:09,  2.53s/it] 96%|█████████▌| 3304/3449 [2:35:43<06:05,  2.52s/it]                                                     {'loss': 1.3531, 'learning_rate': 1.87282069112229e-06, 'epoch': 0.96}
 96%|█████████▌| 3304/3449 [2:35:43<06:05,  2.52s/it] 96%|█████████▌| 3305/3449 [2:35:46<06:00,  2.50s/it]                                                     {'loss': 1.1284, 'learning_rate': 1.8472929048723554e-06, 'epoch': 0.96}
 96%|█████████▌| 3305/3449 [2:35:46<06:00,  2.50s/it] 96%|█████████▌| 3306/3449 [2:35:48<05:58,  2.51s/it]                                                     {'loss': 1.1329, 'learning_rate': 1.8219394876832107e-06, 'epoch': 0.96}
 96%|█████████▌| 3306/3449 [2:35:48<05:58,  2.51s/it] 96%|█████████▌| 3307/3449 [2:35:51<05:58,  2.52s/it]                                                     {'loss': 1.2588, 'learning_rate': 1.79676046186521e-06, 'epoch': 0.96}
 96%|█████████▌| 3307/3449 [2:35:51<05:58,  2.52s/it] 96%|█████████▌| 3308/3449 [2:35:54<06:24,  2.73s/it]                                                     {'loss': 1.1435, 'learning_rate': 1.7717558495752073e-06, 'epoch': 0.96}
 96%|█████████▌| 3308/3449 [2:35:54<06:24,  2.73s/it] 96%|█████████▌| 3309/3449 [2:35:57<06:37,  2.84s/it]                                                     {'loss': 1.1806, 'learning_rate': 1.7469256728166017e-06, 'epoch': 0.96}
 96%|█████████▌| 3309/3449 [2:35:57<06:37,  2.84s/it] 96%|█████████▌| 3310/3449 [2:36:00<06:14,  2.70s/it]                                                     {'loss': 1.2845, 'learning_rate': 1.7222699534392929e-06, 'epoch': 0.96}
 96%|█████████▌| 3310/3449 [2:36:00<06:14,  2.70s/it] 96%|█████████▌| 3311/3449 [2:36:02<06:07,  2.67s/it]                                                     {'loss': 1.1206, 'learning_rate': 1.6977887131396142e-06, 'epoch': 0.96}
 96%|█████████▌| 3311/3449 [2:36:02<06:07,  2.67s/it] 96%|█████████▌| 3312/3449 [2:36:04<05:48,  2.55s/it]                                                     {'loss': 1.2301, 'learning_rate': 1.6734819734604224e-06, 'epoch': 0.96}
 96%|█████████▌| 3312/3449 [2:36:04<05:48,  2.55s/it] 96%|█████████▌| 3313/3449 [2:36:07<05:52,  2.59s/it]                                                     {'loss': 1.1669, 'learning_rate': 1.6493497557910076e-06, 'epoch': 0.96}
 96%|█████████▌| 3313/3449 [2:36:07<05:52,  2.59s/it] 96%|█████████▌| 3314/3449 [2:36:09<05:40,  2.52s/it]                                                     {'loss': 1.069, 'learning_rate': 1.6253920813670498e-06, 'epoch': 0.96}
 96%|█████████▌| 3314/3449 [2:36:09<05:40,  2.52s/it] 96%|█████████▌| 3315/3449 [2:36:12<05:39,  2.53s/it]                                                     {'loss': 1.1809, 'learning_rate': 1.6016089712706627e-06, 'epoch': 0.96}
 96%|█████████▌| 3315/3449 [2:36:12<05:39,  2.53s/it] 96%|█████████▌| 3316/3449 [2:36:15<05:54,  2.67s/it]                                                     {'loss': 1.0832, 'learning_rate': 1.5780004464303723e-06, 'epoch': 0.96}
 96%|█████████▌| 3316/3449 [2:36:15<05:54,  2.67s/it] 96%|█████████▌| 3317/3449 [2:36:19<06:38,  3.02s/it]                                                     {'loss': 1.1052, 'learning_rate': 1.5545665276210042e-06, 'epoch': 0.96}
 96%|█████████▌| 3317/3449 [2:36:19<06:38,  3.02s/it] 96%|█████████▌| 3318/3449 [2:36:21<06:19,  2.90s/it]                                                     {'loss': 1.3326, 'learning_rate': 1.5313072354637969e-06, 'epoch': 0.96}
 96%|█████████▌| 3318/3449 [2:36:21<06:19,  2.90s/it] 96%|█████████▌| 3319/3449 [2:36:25<06:25,  2.96s/it]                                                     {'loss': 1.2614, 'learning_rate': 1.5082225904263337e-06, 'epoch': 0.96}
 96%|█████████▌| 3319/3449 [2:36:25<06:25,  2.96s/it] 96%|█████████▋| 3320/3449 [2:36:28<06:29,  3.02s/it]                                                     {'loss': 1.1756, 'learning_rate': 1.4853126128224093e-06, 'epoch': 0.96}
 96%|█████████▋| 3320/3449 [2:36:28<06:29,  3.02s/it] 96%|█████████▋| 3321/3449 [2:36:30<06:18,  2.95s/it]                                                     {'loss': 1.3067, 'learning_rate': 1.462577322812253e-06, 'epoch': 0.96}
 96%|█████████▋| 3321/3449 [2:36:30<06:18,  2.95s/it] 96%|█████████▋| 3322/3449 [2:36:35<07:14,  3.42s/it]                                                     {'loss': 1.0289, 'learning_rate': 1.4400167404023056e-06, 'epoch': 0.96}
 96%|█████████▋| 3322/3449 [2:36:35<07:14,  3.42s/it] 96%|█████████▋| 3323/3449 [2:36:38<06:42,  3.20s/it]                                                     {'loss': 1.145, 'learning_rate': 1.4176308854452426e-06, 'epoch': 0.96}
 96%|█████████▋| 3323/3449 [2:36:38<06:42,  3.20s/it] 96%|█████████▋| 3324/3449 [2:36:41<06:44,  3.24s/it]                                                     {'loss': 1.2697, 'learning_rate': 1.3954197776400391e-06, 'epoch': 0.96}
 96%|█████████▋| 3324/3449 [2:36:41<06:44,  3.24s/it] 96%|█████████▋| 3325/3449 [2:36:44<06:15,  3.03s/it]                                                     {'loss': 1.1362, 'learning_rate': 1.3733834365318388e-06, 'epoch': 0.96}
 96%|█████████▋| 3325/3449 [2:36:44<06:15,  3.03s/it] 96%|█████████▋| 3326/3449 [2:36:48<06:56,  3.39s/it]                                                     {'loss': 1.1574, 'learning_rate': 1.3515218815120856e-06, 'epoch': 0.96}
 96%|█████████▋| 3326/3449 [2:36:48<06:56,  3.39s/it] 96%|█████████▋| 3327/3449 [2:36:50<06:17,  3.09s/it]                                                     {'loss': 1.3698, 'learning_rate': 1.3298351318183245e-06, 'epoch': 0.96}
 96%|█████████▋| 3327/3449 [2:36:50<06:17,  3.09s/it] 96%|█████████▋| 3328/3449 [2:36:53<05:53,  2.92s/it]                                                     {'loss': 1.2194, 'learning_rate': 1.30832320653429e-06, 'epoch': 0.96}
 96%|█████████▋| 3328/3449 [2:36:53<05:53,  2.92s/it] 97%|█████████▋| 3329/3449 [2:36:55<05:32,  2.77s/it]                                                     {'loss': 1.2358, 'learning_rate': 1.2869861245899506e-06, 'epoch': 0.97}
 97%|█████████▋| 3329/3449 [2:36:55<05:32,  2.77s/it] 97%|█████████▋| 3330/3449 [2:36:58<05:31,  2.79s/it]                                                     {'loss': 1.3792, 'learning_rate': 1.265823904761354e-06, 'epoch': 0.97}
 97%|█████████▋| 3330/3449 [2:36:58<05:31,  2.79s/it] 97%|█████████▋| 3331/3449 [2:37:01<05:51,  2.98s/it]                                                     {'loss': 1.2482, 'learning_rate': 1.2448365656706484e-06, 'epoch': 0.97}
 97%|█████████▋| 3331/3449 [2:37:01<05:51,  2.98s/it] 97%|█████████▋| 3332/3449 [2:37:04<05:40,  2.91s/it]                                                     {'loss': 1.2511, 'learning_rate': 1.2240241257861717e-06, 'epoch': 0.97}
 97%|█████████▋| 3332/3449 [2:37:04<05:40,  2.91s/it] 97%|█████████▋| 3333/3449 [2:37:07<05:34,  2.89s/it]                                                     {'loss': 1.1986, 'learning_rate': 1.2033866034222963e-06, 'epoch': 0.97}
 97%|█████████▋| 3333/3449 [2:37:07<05:34,  2.89s/it] 97%|█████████▋| 3334/3449 [2:37:09<05:11,  2.71s/it]                                                     {'loss': 1.4239, 'learning_rate': 1.182924016739473e-06, 'epoch': 0.97}
 97%|█████████▋| 3334/3449 [2:37:09<05:11,  2.71s/it] 97%|█████████▋| 3335/3449 [2:37:13<05:52,  3.10s/it]                                                     {'loss': 1.0938, 'learning_rate': 1.1626363837442534e-06, 'epoch': 0.97}
 97%|█████████▋| 3335/3449 [2:37:13<05:52,  3.10s/it] 97%|█████████▋| 3336/3449 [2:37:16<05:27,  2.90s/it]                                                     {'loss': 1.1789, 'learning_rate': 1.1425237222892016e-06, 'epoch': 0.97}
 97%|█████████▋| 3336/3449 [2:37:16<05:27,  2.90s/it] 97%|█████████▋| 3337/3449 [2:37:19<05:42,  3.06s/it]                                                     {'loss': 1.0964, 'learning_rate': 1.1225860500728936e-06, 'epoch': 0.97}
 97%|█████████▋| 3337/3449 [2:37:19<05:42,  3.06s/it] 97%|█████████▋| 3338/3449 [2:37:23<06:03,  3.28s/it]                                                     {'loss': 1.174, 'learning_rate': 1.1028233846399838e-06, 'epoch': 0.97}
 97%|█████████▋| 3338/3449 [2:37:23<06:03,  3.28s/it] 97%|█████████▋| 3339/3449 [2:37:25<05:35,  3.05s/it]                                                     {'loss': 1.0421, 'learning_rate': 1.0832357433810503e-06, 'epoch': 0.97}
 97%|█████████▋| 3339/3449 [2:37:25<05:35,  3.05s/it] 97%|█████████▋| 3340/3449 [2:37:28<05:27,  3.01s/it]                                                     {'loss': 1.1878, 'learning_rate': 1.0638231435327273e-06, 'epoch': 0.97}
 97%|█████████▋| 3340/3449 [2:37:28<05:27,  3.01s/it] 97%|█████████▋| 3341/3449 [2:37:32<05:34,  3.09s/it]                                                     {'loss': 1.1816, 'learning_rate': 1.0445856021775724e-06, 'epoch': 0.97}
 97%|█████████▋| 3341/3449 [2:37:32<05:34,  3.09s/it] 97%|█████████▋| 3342/3449 [2:37:34<05:12,  2.92s/it]                                                     {'loss': 1.1723, 'learning_rate': 1.0255231362440887e-06, 'epoch': 0.97}
 97%|█████████▋| 3342/3449 [2:37:34<05:12,  2.92s/it] 97%|█████████▋| 3343/3449 [2:37:37<04:58,  2.82s/it]                                                     {'loss': 1.1055, 'learning_rate': 1.006635762506747e-06, 'epoch': 0.97}
 97%|█████████▋| 3343/3449 [2:37:37<04:58,  2.82s/it] 97%|█████████▋| 3344/3449 [2:37:40<04:57,  2.84s/it]                                                     {'loss': 1.264, 'learning_rate': 9.879234975859186e-07, 'epoch': 0.97}
 97%|█████████▋| 3344/3449 [2:37:40<04:57,  2.84s/it] 97%|█████████▋| 3345/3449 [2:37:43<05:13,  3.02s/it]                                                     {'loss': 1.2097, 'learning_rate': 9.693863579479213e-07, 'epoch': 0.97}
 97%|█████████▋| 3345/3449 [2:37:43<05:13,  3.02s/it] 97%|█████████▋| 3346/3449 [2:37:46<05:23,  3.14s/it]                                                     {'loss': 1.2211, 'learning_rate': 9.510243599049062e-07, 'epoch': 0.97}
 97%|█████████▋| 3346/3449 [2:37:46<05:23,  3.14s/it] 97%|█████████▋| 3347/3449 [2:37:50<05:27,  3.21s/it]                                                     {'loss': 1.2683, 'learning_rate': 9.328375196149486e-07, 'epoch': 0.97}
 97%|█████████▋| 3347/3449 [2:37:50<05:27,  3.21s/it] 97%|█████████▋| 3348/3449 [2:37:53<05:10,  3.07s/it]                                                     {'loss': 1.2113, 'learning_rate': 9.14825853082002e-07, 'epoch': 0.97}
 97%|█████████▋| 3348/3449 [2:37:53<05:10,  3.07s/it] 97%|█████████▋| 3349/3449 [2:37:55<04:57,  2.98s/it]                                                     {'loss': 1.1495, 'learning_rate': 8.969893761558323e-07, 'epoch': 0.97}
 97%|█████████▋| 3349/3449 [2:37:55<04:57,  2.98s/it] 97%|█████████▋| 3350/3449 [2:37:58<04:40,  2.83s/it]                                                     {'loss': 1.226, 'learning_rate': 8.793281045320401e-07, 'epoch': 0.97}
 97%|█████████▋| 3350/3449 [2:37:58<04:40,  2.83s/it] 97%|█████████▋| 3351/3449 [2:38:00<04:27,  2.73s/it]                                                     {'loss': 1.2508, 'learning_rate': 8.618420537520822e-07, 'epoch': 0.97}
 97%|█████████▋| 3351/3449 [2:38:00<04:27,  2.73s/it] 97%|█████████▋| 3352/3449 [2:38:03<04:22,  2.70s/it]                                                     {'loss': 1.2417, 'learning_rate': 8.445312392032501e-07, 'epoch': 0.97}
 97%|█████████▋| 3352/3449 [2:38:03<04:22,  2.70s/it] 97%|█████████▋| 3353/3449 [2:38:05<04:04,  2.55s/it]                                                     {'loss': 1.112, 'learning_rate': 8.273956761185364e-07, 'epoch': 0.97}
 97%|█████████▋| 3353/3449 [2:38:05<04:04,  2.55s/it] 97%|█████████▋| 3354/3449 [2:38:07<03:53,  2.46s/it]                                                     {'loss': 1.334, 'learning_rate': 8.104353795768127e-07, 'epoch': 0.97}
 97%|█████████▋| 3354/3449 [2:38:07<03:53,  2.46s/it] 97%|█████████▋| 3355/3449 [2:38:11<04:19,  2.76s/it]                                                     {'loss': 1.1859, 'learning_rate': 7.93650364502696e-07, 'epoch': 0.97}
 97%|█████████▋| 3355/3449 [2:38:11<04:19,  2.76s/it] 97%|█████████▋| 3356/3449 [2:38:13<04:11,  2.71s/it]                                                     {'loss': 1.2407, 'learning_rate': 7.770406456665269e-07, 'epoch': 0.97}
 97%|█████████▋| 3356/3449 [2:38:13<04:11,  2.71s/it] 97%|█████████▋| 3357/3449 [2:38:16<03:57,  2.58s/it]                                                     {'loss': 1.2286, 'learning_rate': 7.606062376843914e-07, 'epoch': 0.97}
 97%|█████████▋| 3357/3449 [2:38:16<03:57,  2.58s/it] 97%|█████████▋| 3358/3449 [2:38:19<04:07,  2.72s/it]                                                     {'loss': 1.1912, 'learning_rate': 7.44347155018188e-07, 'epoch': 0.97}
 97%|█████████▋| 3358/3449 [2:38:19<04:07,  2.72s/it] 97%|█████████▋| 3359/3449 [2:38:22<04:12,  2.80s/it]                                                     {'loss': 1.1241, 'learning_rate': 7.28263411975405e-07, 'epoch': 0.97}
 97%|█████████▋| 3359/3449 [2:38:22<04:12,  2.80s/it] 97%|█████████▋| 3360/3449 [2:38:25<04:07,  2.78s/it]                                                     {'loss': 1.2046, 'learning_rate': 7.123550227093656e-07, 'epoch': 0.97}
 97%|█████████▋| 3360/3449 [2:38:25<04:07,  2.78s/it] 97%|█████████▋| 3361/3449 [2:38:27<03:59,  2.72s/it]                                                     {'loss': 1.2934, 'learning_rate': 6.966220012189606e-07, 'epoch': 0.97}
 97%|█████████▋| 3361/3449 [2:38:27<03:59,  2.72s/it] 97%|█████████▋| 3362/3449 [2:38:30<03:56,  2.71s/it]                                                     {'loss': 1.2203, 'learning_rate': 6.81064361348871e-07, 'epoch': 0.97}
 97%|█████████▋| 3362/3449 [2:38:30<03:56,  2.71s/it] 98%|█████████▊| 3363/3449 [2:38:32<03:52,  2.71s/it]                                                     {'loss': 1.115, 'learning_rate': 6.656821167894123e-07, 'epoch': 0.97}
 98%|█████████▊| 3363/3449 [2:38:32<03:52,  2.71s/it] 98%|█████████▊| 3364/3449 [2:38:36<04:03,  2.87s/it]                                                     {'loss': 1.1818, 'learning_rate': 6.504752810765125e-07, 'epoch': 0.98}
 98%|█████████▊| 3364/3449 [2:38:36<04:03,  2.87s/it] 98%|█████████▊| 3365/3449 [2:38:38<03:54,  2.79s/it]                                                     {'loss': 1.1659, 'learning_rate': 6.354438675917784e-07, 'epoch': 0.98}
 98%|█████████▊| 3365/3449 [2:38:38<03:54,  2.79s/it] 98%|█████████▊| 3366/3449 [2:38:42<04:08,  2.99s/it]                                                     {'loss': 1.1993, 'learning_rate': 6.205878895624961e-07, 'epoch': 0.98}
 98%|█████████▊| 3366/3449 [2:38:42<04:08,  2.99s/it] 98%|█████████▊| 3367/3449 [2:38:46<04:25,  3.23s/it]                                                     {'loss': 1.1604, 'learning_rate': 6.059073600614751e-07, 'epoch': 0.98}
 98%|█████████▊| 3367/3449 [2:38:46<04:25,  3.23s/it] 98%|█████████▊| 3368/3449 [2:38:48<04:00,  2.97s/it]                                                     {'loss': 1.1034, 'learning_rate': 5.914022920072037e-07, 'epoch': 0.98}
 98%|█████████▊| 3368/3449 [2:38:48<04:00,  2.97s/it] 98%|█████████▊| 3369/3449 [2:38:50<03:45,  2.82s/it]                                                     {'loss': 1.1038, 'learning_rate': 5.770726981637608e-07, 'epoch': 0.98}
 98%|█████████▊| 3369/3449 [2:38:50<03:45,  2.82s/it] 98%|█████████▊| 3370/3449 [2:38:55<04:13,  3.20s/it]                                                     {'loss': 1.1347, 'learning_rate': 5.629185911408152e-07, 'epoch': 0.98}
 98%|█████████▊| 3370/3449 [2:38:55<04:13,  3.20s/it] 98%|█████████▊| 3371/3449 [2:38:57<03:52,  2.98s/it]                                                     {'loss': 1.347, 'learning_rate': 5.489399833935594e-07, 'epoch': 0.98}
 98%|█████████▊| 3371/3449 [2:38:57<03:52,  2.98s/it] 98%|█████████▊| 3372/3449 [2:39:00<03:40,  2.86s/it]                                                     {'loss': 1.1211, 'learning_rate': 5.351368872228423e-07, 'epoch': 0.98}
 98%|█████████▊| 3372/3449 [2:39:00<03:40,  2.86s/it] 98%|█████████▊| 3373/3449 [2:39:02<03:28,  2.75s/it]                                                     {'loss': 1.1831, 'learning_rate': 5.215093147749706e-07, 'epoch': 0.98}
 98%|█████████▊| 3373/3449 [2:39:02<03:28,  2.75s/it] 98%|█████████▊| 3374/3449 [2:39:05<03:33,  2.84s/it]                                                     {'loss': 1.1404, 'learning_rate': 5.080572780418846e-07, 'epoch': 0.98}
 98%|█████████▊| 3374/3449 [2:39:05<03:33,  2.84s/it] 98%|█████████▊| 3375/3449 [2:39:07<03:20,  2.70s/it]                                                     {'loss': 1.2085, 'learning_rate': 4.947807888609823e-07, 'epoch': 0.98}
 98%|█████████▊| 3375/3449 [2:39:07<03:20,  2.70s/it] 98%|█████████▊| 3376/3449 [2:39:10<03:14,  2.67s/it]                                                     {'loss': 1.2696, 'learning_rate': 4.816798589152516e-07, 'epoch': 0.98}
 98%|█████████▊| 3376/3449 [2:39:10<03:14,  2.67s/it] 98%|█████████▊| 3377/3449 [2:39:13<03:08,  2.62s/it]                                                     {'loss': 1.2747, 'learning_rate': 4.687544997331372e-07, 'epoch': 0.98}
 98%|█████████▊| 3377/3449 [2:39:13<03:08,  2.62s/it] 98%|█████████▊| 3378/3449 [2:39:16<03:20,  2.83s/it]                                                     {'loss': 1.2318, 'learning_rate': 4.560047226885855e-07, 'epoch': 0.98}
 98%|█████████▊| 3378/3449 [2:39:16<03:20,  2.83s/it] 98%|█████████▊| 3379/3449 [2:39:19<03:14,  2.78s/it]                                                     {'loss': 1.2567, 'learning_rate': 4.4343053900108843e-07, 'epoch': 0.98}
 98%|█████████▊| 3379/3449 [2:39:19<03:14,  2.78s/it] 98%|█████████▊| 3380/3449 [2:39:22<03:28,  3.02s/it]                                                     {'loss': 1.3969, 'learning_rate': 4.3103195973561717e-07, 'epoch': 0.98}
 98%|█████████▊| 3380/3449 [2:39:22<03:28,  3.02s/it] 98%|█████████▊| 3381/3449 [2:39:26<03:50,  3.38s/it]                                                     {'loss': 1.2472, 'learning_rate': 4.1880899580251097e-07, 'epoch': 0.98}
 98%|█████████▊| 3381/3449 [2:39:26<03:50,  3.38s/it] 98%|█████████▊| 3382/3449 [2:39:29<03:36,  3.23s/it]                                                     {'loss': 1.1409, 'learning_rate': 4.0676165795772157e-07, 'epoch': 0.98}
 98%|█████████▊| 3382/3449 [2:39:29<03:36,  3.23s/it] 98%|█████████▊| 3383/3449 [2:39:32<03:20,  3.04s/it]                                                     {'loss': 1.1164, 'learning_rate': 3.948899568025466e-07, 'epoch': 0.98}
 98%|█████████▊| 3383/3449 [2:39:32<03:20,  3.04s/it] 98%|█████████▊| 3384/3449 [2:39:35<03:15,  3.00s/it]                                                     {'loss': 1.2228, 'learning_rate': 3.83193902783785e-07, 'epoch': 0.98}
 98%|█████████▊| 3384/3449 [2:39:35<03:15,  3.00s/it] 98%|█████████▊| 3385/3449 [2:39:38<03:10,  2.98s/it]                                                     {'loss': 1.1153, 'learning_rate': 3.7167350619362607e-07, 'epoch': 0.98}
 98%|█████████▊| 3385/3449 [2:39:38<03:10,  2.98s/it] 98%|█████████▊| 3386/3449 [2:39:40<02:59,  2.86s/it]                                                     {'loss': 1.1032, 'learning_rate': 3.6032877716971614e-07, 'epoch': 0.98}
 98%|█████████▊| 3386/3449 [2:39:40<02:59,  2.86s/it] 98%|█████████▊| 3387/3449 [2:39:44<03:21,  3.25s/it]                                                     {'loss': 1.1952, 'learning_rate': 3.491597256951362e-07, 'epoch': 0.98}
 98%|█████████▊| 3387/3449 [2:39:44<03:21,  3.25s/it] 98%|█████████▊| 3388/3449 [2:39:47<02:59,  2.95s/it]                                                     {'loss': 1.2024, 'learning_rate': 3.3816636159831326e-07, 'epoch': 0.98}
 98%|█████████▊| 3388/3449 [2:39:47<02:59,  2.95s/it] 98%|█████████▊| 3389/3449 [2:39:49<02:50,  2.84s/it]                                                     {'loss': 1.173, 'learning_rate': 3.273486945531312e-07, 'epoch': 0.98}
 98%|█████████▊| 3389/3449 [2:39:49<02:50,  2.84s/it] 98%|█████████▊| 3390/3449 [2:39:54<03:24,  3.46s/it]                                                     {'loss': 1.1444, 'learning_rate': 3.167067340788643e-07, 'epoch': 0.98}
 98%|█████████▊| 3390/3449 [2:39:54<03:24,  3.46s/it] 98%|█████████▊| 3391/3449 [2:39:57<03:17,  3.41s/it]                                                     {'loss': 1.2798, 'learning_rate': 3.0624048954013274e-07, 'epoch': 0.98}
 98%|█████████▊| 3391/3449 [2:39:57<03:17,  3.41s/it] 98%|█████████▊| 3392/3449 [2:40:00<03:06,  3.27s/it]                                                     {'loss': 1.055, 'learning_rate': 2.9594997014694703e-07, 'epoch': 0.98}
 98%|█████████▊| 3392/3449 [2:40:00<03:06,  3.27s/it] 98%|█████████▊| 3393/3449 [2:40:03<02:51,  3.06s/it]                                                     {'loss': 1.237, 'learning_rate': 2.858351849546859e-07, 'epoch': 0.98}
 98%|█████████▊| 3393/3449 [2:40:03<02:51,  3.06s/it] 98%|█████████▊| 3394/3449 [2:40:07<03:06,  3.40s/it]                                                     {'loss': 0.9781, 'learning_rate': 2.7589614286411825e-07, 'epoch': 0.98}
 98%|█████████▊| 3394/3449 [2:40:07<03:06,  3.40s/it] 98%|█████████▊| 3395/3449 [2:40:10<02:46,  3.09s/it]                                                     {'loss': 1.156, 'learning_rate': 2.661328526212925e-07, 'epoch': 0.98}
 98%|█████████▊| 3395/3449 [2:40:10<02:46,  3.09s/it] 98%|█████████▊| 3396/3449 [2:40:13<02:48,  3.18s/it]                                                     {'loss': 1.2347, 'learning_rate': 2.565453228176695e-07, 'epoch': 0.98}
 98%|█████████▊| 3396/3449 [2:40:13<02:48,  3.18s/it] 98%|█████████▊| 3397/3449 [2:40:15<02:32,  2.94s/it]                                                     {'loss': 1.1425, 'learning_rate': 2.471335618900117e-07, 'epoch': 0.98}
 98%|█████████▊| 3397/3449 [2:40:15<02:32,  2.94s/it] 99%|█████████▊| 3398/3449 [2:40:20<02:51,  3.37s/it]                                                     {'loss': 1.2051, 'learning_rate': 2.3789757812040513e-07, 'epoch': 0.99}
 99%|█████████▊| 3398/3449 [2:40:20<02:51,  3.37s/it] 99%|█████████▊| 3399/3449 [2:40:22<02:32,  3.06s/it]                                                     {'loss': 1.1476, 'learning_rate': 2.2883737963630414e-07, 'epoch': 0.99}
 99%|█████████▊| 3399/3449 [2:40:22<02:32,  3.06s/it] 99%|█████████▊| 3400/3449 [2:40:24<02:20,  2.86s/it]                                                     {'loss': 1.2424, 'learning_rate': 2.1995297441039786e-07, 'epoch': 0.99}
 99%|█████████▊| 3400/3449 [2:40:24<02:20,  2.86s/it] 99%|█████████▊| 3401/3449 [2:40:27<02:13,  2.78s/it]                                                     {'loss': 1.2632, 'learning_rate': 2.112443702607214e-07, 'epoch': 0.99}
 99%|█████████▊| 3401/3449 [2:40:27<02:13,  2.78s/it] 99%|█████████▊| 3402/3449 [2:40:29<02:05,  2.67s/it]                                                     {'loss': 1.2146, 'learning_rate': 2.0271157485065585e-07, 'epoch': 0.99}
 99%|█████████▊| 3402/3449 [2:40:29<02:05,  2.67s/it] 99%|█████████▊| 3403/3449 [2:40:32<01:58,  2.58s/it]                                                     {'loss': 1.1104, 'learning_rate': 1.943545956887949e-07, 'epoch': 0.99}
 99%|█████████▊| 3403/3449 [2:40:32<01:58,  2.58s/it] 99%|█████████▊| 3404/3449 [2:40:34<01:50,  2.46s/it]                                                     {'loss': 1.341, 'learning_rate': 1.8617344012907823e-07, 'epoch': 0.99}
 99%|█████████▊| 3404/3449 [2:40:34<01:50,  2.46s/it] 99%|█████████▊| 3405/3449 [2:40:36<01:49,  2.48s/it]                                                     {'loss': 1.1078, 'learning_rate': 1.7816811537068044e-07, 'epoch': 0.99}
 99%|█████████▊| 3405/3449 [2:40:36<01:49,  2.48s/it] 99%|█████████▉| 3406/3449 [2:40:39<01:51,  2.59s/it]                                                     {'loss': 1.1237, 'learning_rate': 1.703386284580777e-07, 'epoch': 0.99}
 99%|█████████▉| 3406/3449 [2:40:39<01:51,  2.59s/it] 99%|█████████▉| 3407/3449 [2:40:42<01:46,  2.53s/it]                                                     {'loss': 1.2166, 'learning_rate': 1.6268498628102534e-07, 'epoch': 0.99}
 99%|█████████▉| 3407/3449 [2:40:42<01:46,  2.53s/it] 99%|█████████▉| 3408/3449 [2:40:44<01:39,  2.43s/it]                                                     {'loss': 1.4478, 'learning_rate': 1.552071955745138e-07, 'epoch': 0.99}
 99%|█████████▉| 3408/3449 [2:40:44<01:39,  2.43s/it] 99%|█████████▉| 3409/3449 [2:40:47<01:42,  2.56s/it]                                                     {'loss': 1.1489, 'learning_rate': 1.4790526291879048e-07, 'epoch': 0.99}
 99%|█████████▉| 3409/3449 [2:40:47<01:42,  2.56s/it] 99%|█████████▉| 3410/3449 [2:40:49<01:41,  2.60s/it]                                                     {'loss': 1.2994, 'learning_rate': 1.4077919473938216e-07, 'epoch': 0.99}
 99%|█████████▉| 3410/3449 [2:40:49<01:41,  2.60s/it] 99%|█████████▉| 3411/3449 [2:40:53<01:44,  2.74s/it]                                                     {'loss': 1.1922, 'learning_rate': 1.3382899730700615e-07, 'epoch': 0.99}
 99%|█████████▉| 3411/3449 [2:40:53<01:44,  2.74s/it] 99%|█████████▉| 3412/3449 [2:40:55<01:38,  2.66s/it]                                                     {'loss': 1.2921, 'learning_rate': 1.2705467673768124e-07, 'epoch': 0.99}
 99%|█████████▉| 3412/3449 [2:40:55<01:38,  2.66s/it] 99%|█████████▉| 3413/3449 [2:40:58<01:38,  2.75s/it]                                                     {'loss': 1.041, 'learning_rate': 1.204562389925945e-07, 'epoch': 0.99}
 99%|█████████▉| 3413/3449 [2:40:58<01:38,  2.75s/it] 99%|█████████▉| 3414/3449 [2:41:01<01:34,  2.70s/it]                                                     {'loss': 1.0588, 'learning_rate': 1.1403368987821239e-07, 'epoch': 0.99}
 99%|█████████▉| 3414/3449 [2:41:01<01:34,  2.70s/it] 99%|█████████▉| 3415/3449 [2:41:04<01:37,  2.86s/it]                                                     {'loss': 1.283, 'learning_rate': 1.0778703504621402e-07, 'epoch': 0.99}
 99%|█████████▉| 3415/3449 [2:41:04<01:37,  2.86s/it] 99%|█████████▉| 3416/3449 [2:41:08<01:43,  3.13s/it]                                                     {'loss': 1.257, 'learning_rate': 1.01716279993469e-07, 'epoch': 0.99}
 99%|█████████▉| 3416/3449 [2:41:08<01:43,  3.13s/it] 99%|█████████▉| 3417/3449 [2:41:10<01:36,  3.01s/it]                                                     {'loss': 1.1417, 'learning_rate': 9.582143006210409e-08, 'epoch': 0.99}
 99%|█████████▉| 3417/3449 [2:41:10<01:36,  3.01s/it] 99%|█████████▉| 3418/3449 [2:41:13<01:29,  2.90s/it]                                                     {'loss': 1.4062, 'learning_rate': 9.010249043939212e-08, 'epoch': 0.99}
 99%|█████████▉| 3418/3449 [2:41:13<01:29,  2.90s/it] 99%|█████████▉| 3419/3449 [2:41:16<01:25,  2.87s/it]                                                     {'loss': 1.1749, 'learning_rate': 8.455946615786303e-08, 'epoch': 0.99}
 99%|█████████▉| 3419/3449 [2:41:16<01:25,  2.87s/it] 99%|█████████▉| 3420/3449 [2:41:18<01:19,  2.75s/it]                                                     {'loss': 1.2266, 'learning_rate': 7.919236209525948e-08, 'epoch': 0.99}
 99%|█████████▉| 3420/3449 [2:41:18<01:19,  2.75s/it] 99%|█████████▉| 3421/3449 [2:41:21<01:14,  2.66s/it]                                                     {'loss': 1.12, 'learning_rate': 7.400118297444802e-08, 'epoch': 0.99}
 99%|█████████▉| 3421/3449 [2:41:21<01:14,  2.66s/it] 99%|█████████▉| 3422/3449 [2:41:25<01:23,  3.09s/it]                                                     {'loss': 1.1859, 'learning_rate': 6.898593336353009e-08, 'epoch': 0.99}
 99%|█████████▉| 3422/3449 [2:41:25<01:23,  3.09s/it] 99%|█████████▉| 3423/3449 [2:41:27<01:15,  2.89s/it]                                                     {'loss': 1.2297, 'learning_rate': 6.414661767581986e-08, 'epoch': 0.99}
 99%|█████████▉| 3423/3449 [2:41:27<01:15,  2.89s/it] 99%|█████████▉| 3424/3449 [2:41:30<01:12,  2.88s/it]                                                     {'loss': 1.1846, 'learning_rate': 5.948324016975537e-08, 'epoch': 0.99}
 99%|█████████▉| 3424/3449 [2:41:30<01:12,  2.88s/it] 99%|█████████▉| 3425/3449 [2:41:33<01:08,  2.85s/it]                                                     {'loss': 1.2135, 'learning_rate': 5.4995804949009575e-08, 'epoch': 0.99}
 99%|█████████▉| 3425/3449 [2:41:33<01:08,  2.85s/it] 99%|█████████▉| 3426/3449 [2:41:36<01:05,  2.84s/it]                                                     {'loss': 1.1891, 'learning_rate': 5.0684315962379323e-08, 'epoch': 0.99}
 99%|█████████▉| 3426/3449 [2:41:36<01:05,  2.84s/it] 99%|█████████▉| 3427/3449 [2:41:39<01:07,  3.06s/it]                                                     {'loss': 1.1345, 'learning_rate': 4.6548777003874164e-08, 'epoch': 0.99}
 99%|█████████▉| 3427/3449 [2:41:39<01:07,  3.06s/it] 99%|█████████▉| 3428/3449 [2:41:42<01:03,  3.02s/it]                                                     {'loss': 1.1735, 'learning_rate': 4.2589191712649744e-08, 'epoch': 0.99}
 99%|█████████▉| 3428/3449 [2:41:42<01:03,  3.02s/it] 99%|█████████▉| 3429/3449 [2:41:45<00:59,  3.00s/it]                                                     {'loss': 1.2177, 'learning_rate': 3.8805563573030004e-08, 'epoch': 0.99}
 99%|█████████▉| 3429/3449 [2:41:45<00:59,  3.00s/it] 99%|█████████▉| 3430/3449 [2:41:47<00:53,  2.82s/it]                                                     {'loss': 1.2009, 'learning_rate': 3.5197895914529375e-08, 'epoch': 0.99}
 99%|█████████▉| 3430/3449 [2:41:47<00:53,  2.82s/it] 99%|█████████▉| 3431/3449 [2:41:50<00:49,  2.76s/it]                                                     {'loss': 1.1034, 'learning_rate': 3.17661919117862e-08, 'epoch': 0.99}
 99%|█████████▉| 3431/3449 [2:41:50<00:49,  2.76s/it]100%|█████████▉| 3432/3449 [2:41:52<00:44,  2.64s/it]                                                     {'loss': 1.3379, 'learning_rate': 2.8510454584607106e-08, 'epoch': 0.99}
100%|█████████▉| 3432/3449 [2:41:52<00:44,  2.64s/it]100%|█████████▉| 3433/3449 [2:41:56<00:44,  2.81s/it]                                                     {'loss': 1.1251, 'learning_rate': 2.5430686797944804e-08, 'epoch': 1.0}
100%|█████████▉| 3433/3449 [2:41:56<00:44,  2.81s/it]100%|█████████▉| 3434/3449 [2:41:59<00:44,  2.98s/it]                                                     {'loss': 1.1056, 'learning_rate': 2.2526891261920314e-08, 'epoch': 1.0}
100%|█████████▉| 3434/3449 [2:41:59<00:44,  2.98s/it]100%|█████████▉| 3435/3449 [2:42:01<00:39,  2.82s/it]                                                     {'loss': 1.2147, 'learning_rate': 1.9799070531800745e-08, 'epoch': 1.0}
100%|█████████▉| 3435/3449 [2:42:01<00:39,  2.82s/it]100%|█████████▉| 3436/3449 [2:42:04<00:35,  2.73s/it]                                                     {'loss': 1.2243, 'learning_rate': 1.7247227007977097e-08, 'epoch': 1.0}
100%|█████████▉| 3436/3449 [2:42:04<00:35,  2.73s/it]100%|█████████▉| 3437/3449 [2:42:07<00:34,  2.83s/it]                                                     {'loss': 1.0798, 'learning_rate': 1.4871362936030864e-08, 'epoch': 1.0}
100%|█████████▉| 3437/3449 [2:42:07<00:34,  2.83s/it]100%|█████████▉| 3438/3449 [2:42:10<00:29,  2.72s/it]                                                     {'loss': 1.1548, 'learning_rate': 1.2671480406623026e-08, 'epoch': 1.0}
100%|█████████▉| 3438/3449 [2:42:10<00:29,  2.72s/it]100%|█████████▉| 3439/3449 [2:42:13<00:30,  3.08s/it]                                                     {'loss': 1.121, 'learning_rate': 1.0647581355627267e-08, 'epoch': 1.0}
100%|█████████▉| 3439/3449 [2:42:13<00:30,  3.08s/it]100%|█████████▉| 3440/3449 [2:42:16<00:25,  2.83s/it]                                                     {'loss': 1.2443, 'learning_rate': 8.79966756399675e-09, 'epoch': 1.0}
100%|█████████▉| 3440/3449 [2:42:16<00:25,  2.83s/it]100%|█████████▉| 3441/3449 [2:42:18<00:21,  2.72s/it]                                                     {'loss': 1.2439, 'learning_rate': 7.127740657875137e-09, 'epoch': 1.0}
100%|█████████▉| 3441/3449 [2:42:18<00:21,  2.72s/it]100%|█████████▉| 3442/3449 [2:42:21<00:18,  2.68s/it]                                                     {'loss': 1.163, 'learning_rate': 5.631802108463369e-09, 'epoch': 1.0}
100%|█████████▉| 3442/3449 [2:42:21<00:18,  2.68s/it]100%|█████████▉| 3443/3449 [2:42:24<00:16,  2.77s/it]                                                     {'loss': 1.246, 'learning_rate': 4.3118532321972935e-09, 'epoch': 1.0}
100%|█████████▉| 3443/3449 [2:42:24<00:16,  2.77s/it]100%|█████████▉| 3444/3449 [2:42:26<00:13,  2.69s/it]                                                     {'loss': 1.2131, 'learning_rate': 3.1678951905478314e-09, 'epoch': 1.0}
100%|█████████▉| 3444/3449 [2:42:26<00:13,  2.69s/it]100%|█████████▉| 3445/3449 [2:42:29<00:10,  2.72s/it]                                                     {'loss': 1.2344, 'learning_rate': 2.199928990220812e-09, 'epoch': 1.0}
100%|█████████▉| 3445/3449 [2:42:29<00:10,  2.72s/it]100%|█████████▉| 3446/3449 [2:42:32<00:08,  2.84s/it]                                                     {'loss': 1.1577, 'learning_rate': 1.407955482957135e-09, 'epoch': 1.0}
100%|█████████▉| 3446/3449 [2:42:32<00:08,  2.84s/it]100%|█████████▉| 3447/3449 [2:42:35<00:05,  2.77s/it]                                                     {'loss': 1.2886, 'learning_rate': 7.919753657104067e-10, 'epoch': 1.0}
100%|█████████▉| 3447/3449 [2:42:35<00:05,  2.77s/it]100%|█████████▉| 3448/3449 [2:42:37<00:02,  2.72s/it]                                                     {'loss': 1.2695, 'learning_rate': 3.5198918049150763e-10, 'epoch': 1.0}
100%|█████████▉| 3448/3449 [2:42:37<00:02,  2.72s/it]100%|██████████| 3449/3449 [2:42:40<00:00,  2.68s/it]                                                     {'loss': 1.0618, 'learning_rate': 8.799731447961534e-11, 'epoch': 1.0}
100%|██████████| 3449/3449 [2:42:40<00:00,  2.68s/it]                                                     {'train_runtime': 9769.0231, 'train_samples_per_second': 11.299, 'train_steps_per_second': 0.353, 'train_loss': 1.2677869534416453, 'epoch': 1.0}
100%|██████████| 3449/3449 [2:42:40<00:00,  2.68s/it]100%|██████████| 3449/3449 [2:42:40<00:00,  2.83s/it]
wandb: 
wandb: Run history:
wandb:                    train/epoch ▁▁▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███
wandb:              train/global_step ▁▁▁▂▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███
wandb:            train/learning_rate ▃███████▇▇▇▇▇▆▆▆▆▅▅▅▅▄▄▄▃▃▃▃▂▂▂▂▂▁▁▁▁▁▁▁
wandb:                     train/loss █▆▅▆▅▇▄▆▄▆▄██▆▆▂▆▄▄▄▄▄▆▃▄▃▄▅▃▂▄▃▅▃▅▂▁▄▄▃
wandb:               train/total_flos ▁
wandb:               train/train_loss ▁
wandb:            train/train_runtime ▁
wandb: train/train_samples_per_second ▁
wandb:   train/train_steps_per_second ▁
wandb: 
wandb: Run summary:
wandb:                    train/epoch 1.0
wandb:              train/global_step 3449
wandb:            train/learning_rate 0.0
wandb:                     train/loss 1.0618
wandb:               train/total_flos 1.0345695487385928e+18
wandb:               train/train_loss 1.26779
wandb:            train/train_runtime 9769.0231
wandb: train/train_samples_per_second 11.299
wandb:   train/train_steps_per_second 0.353
wandb: 
wandb: 🚀 View run belle_dolphine-p13 at: https://wandb.ai/nus_keyu/lora-moe/runs/rpu8pnl2
wandb: Synced 6 W&B file(s), 0 media file(s), 0 artifact file(s) and 0 other file(s)
wandb: Find logs at: ./wandb/run-20231229_120011-rpu8pnl2/logs